CN115976118B - 一种生物合成诺卡酮的方法及载体 - Google Patents

一种生物合成诺卡酮的方法及载体 Download PDF

Info

Publication number
CN115976118B
CN115976118B CN202210671358.1A CN202210671358A CN115976118B CN 115976118 B CN115976118 B CN 115976118B CN 202210671358 A CN202210671358 A CN 202210671358A CN 115976118 B CN115976118 B CN 115976118B
Authority
CN
China
Prior art keywords
leu
ala
cytochrome
glu
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210671358.1A
Other languages
English (en)
Other versions
CN115976118A (zh
Inventor
叶紫玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Hesheng Technology Co ltd
Original Assignee
Wuhan Hesheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Hesheng Technology Co ltd filed Critical Wuhan Hesheng Technology Co ltd
Priority to CN202210671358.1A priority Critical patent/CN115976118B/zh
Publication of CN115976118A publication Critical patent/CN115976118A/zh
Priority to PCT/CN2023/090352 priority patent/WO2023241224A1/zh
Application granted granted Critical
Publication of CN115976118B publication Critical patent/CN115976118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申请公开了一种生物合成诺卡酮的方法,其包括采用能够表达瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶的重组菌合成诺卡酮;其中,所述瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶来自益智。本申请鉴定出由法尼基焦磷酸合成诺卡酮的全套酶及其编码基因,并提供了利用所述酶生物合成诺卡酮的方法,采用本申请的酶及生物合成方法,有利于获得诺卡酮高产菌株,提高生物合成诺卡酮的产量。

Description

一种生物合成诺卡酮的方法及载体
技术领域
本申请属于诺卡酮生物合成领域,具体涉及一种生物合成诺卡酮的方法及载体。
背景技术
诺卡酮被发现存在于阿拉斯加黄柏、葡萄柚等植物中,其是一种天然的倍半萜酮,具有宜人的葡萄柚香味,因此诺卡酮可以用于制备香料或作为葡萄柚味的调味剂使用。此外人们还发现诺卡酮具有趋避蚊虫的作用,2020年8月美国环境保护署批准了诺卡酮作为驱虫剂或杀虫剂使用,因此诺卡酮也可以制成作驱蚊水和蜱虫趋避剂使用,目前也有相关的研究表明诺卡酮可以刺激人体交感神经分泌相关激素,起到燃脂减肥的作用。以上表明了诺卡酮具有很高的应用价值。
诺卡酮可以从植物中提取获得,但由于植物中诺卡酮含量低,限制了其应用。诺卡酮还可以由瓦伦烯化学合成获得,但反应过程涉及毒性重金属,也影响了此方式的应用。使用微生物细胞工厂全合成诺卡酮是一条具有潜力的方式。
发明内容
本申请的目的在于提供一种生物合成诺卡酮的方法及载体。
本申请为解决上述技术问题,提出了如下技术方案:
本申请第一方面提供了一种生物合成诺卡酮的方法,其包括采用能够表达瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶的重组菌合成诺卡酮;其中,所述瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶来自益智。
本申请第二方面提供了一种用于诺卡酮合成的酶,其具有与SEQ ID NO.1、SEQ IDNO.2、SEQ ID NO.3、SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6所示的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
本申请第三方面提供了一种多核苷酸分子,其包含编码本申请第二方面所提供的酶的核苷酸序列或其互补序列的至少一种。
本申请第四方面提供了一种核酸构建体,其包含权本申请第三方面所提供的多核苷酸分子的至少一种。
本申请第五方面提供了一种重组菌,其包含本申请第三方面的多核苷酸分子,或本申请第四方面的核酸构建体;所述重组菌通过将所述多核苷酸分子或所述核酸构建体导入宿主细胞中获得;优选地,所述宿主细胞为真核细胞;更优选为酿酒酵母。
本申请第六方面提供了采用本申请第二方面的酶、本申请第三方面的多核苷酸分子、本申请第四方面的核酸构建体或本申请第五方面的重组菌生产瓦伦烯、诺卡醇和/或诺卡酮的用途。
本申请鉴定出由法尼基焦磷酸合成诺卡酮的全套酶及其编码基因,并提供了利用所述酶生物合成诺卡酮的方法,采用本申请的酶及生物合成方法,有利于获得诺卡酮高产菌株,提高生物合成诺卡酮的产量。
附图说明
图1为质粒pZY900构建示意图;
图2为质粒pDXYZ3构建示意图;
图3为质粒pDXVS1、pDXVS2构建示意图;
图4为质粒pDXNL1、pDXNL2、pDXNL3、pCK构建示意图;
图5为质粒pDXNT1构建示意图;
图6为JDXYZ3菌株发酵产物中瓦伦烯和瓦伦烯标准品的提取离子流色谱图;
图7为CK菌株、JDXNL1菌株(图中标记为CYP6),JDXNL2菌株(图中标记为CYP9)和JDXNL3菌株(图中标记为AoKo)摇瓶发酵产物,以及诺卡醇标准品提取离子流色谱图;
图8为JDXNT1菌株(图中标记为CYP6)、JDXNT2菌株(图中标记为CYP9)和JDXNT3菌株(图中标记为AoKo)摇瓶发酵产物,以及诺卡酮标准品提取离子流色谱图。
具体实施方式
本文使用的术语和说明仅仅是为了描述特定的实施方案,而不意在限制本申请。除非另有定义,本文所用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同含义。此外,除非上下文另有要求,否则单数术语应包括复数,并且复数术语应包括单数。
定义
如本文所用,术语“一个”和“一种”以及“所述”和类似的指代物指示单数和复数,除非本文另外指明或上下文明显矛盾。
如本文所用,术语“约”和“类似于”是指在本领域普通技术人员所确定的特定值的可接受误差范围内,所述误差范围可部分取决于该值的测量或确定方式,或取决于测量系统的局限性。
术语“核酸”或“多核苷酸”是指脱氧核糖核酸(DNA)或核糖核酸(RNA)及其呈单链或双链形式的聚合物。除非明确地限制,否则术语“核酸”或“多核苷酸”还包括含有已知的天然核苷酸的类似物的核酸,其具有与参照核酸相似的结合性质,并且以与天然存在的核苷酸相似的方式被代谢(参见,属于Kariko等人的美国专利No.8278036,其公开了尿苷被假尿苷替代的mRNA分子,合成所述mRNA分子的方法以及用于在体内递送治疗性蛋白的方法)。除非另有所指,否则特定核酸序列还隐含地包括其保守修饰的变体(例如,简并密码子取代)、等位基因、直系同源物、单核苷酸多态性(SNP)和互补序列以及明确指出的序列。
“构建体”是指任何重组多核苷酸分子(例如质粒、粘粒、病毒、自主复制多核苷酸分子、噬菌体、线性或环状单链或双链DNA或RNA多核苷酸分子),其可衍生自任何来源,能够与基因组整合或自主复制,其可以以可操作的方式连接一个或多个多核苷酸分子。本申请中,构建体通常包含本申请的多核苷酸分子,其可操作地连接至转录起始调节序列,这些序列会导引本申请的多核苷酸分子在宿主细胞中的转录。可使用异源启动子或内源启动子导引本申请的核酸的表达。
“载体”是指任何重组核酸构建体,该构建体可用于转化的目的(即将异源DNA引入到宿主细胞中)。载体可以包含用于在细菌中生长的细菌抗性基因和用于在生物体中表达目的蛋白质的启动子。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有在宿主细胞中起作用的复制起点的载体)。其他载体可以引入宿主细胞后整合到宿主细胞的基因组中,并因此与宿主基因组一起复制。此外,某些优选的载体能够指导与它们连接的外源基因的表达。一种类型的载体是“质粒”,其通常是指可以连接入另外的DNA区段(外源基因)的环状双链DNA环,也可以包括线性双链分子,诸如从通过聚合酶链式反应(PCR)的扩增或用限制酶处理环状质粒得到线性双链分子。
质粒载体包括载体骨架(即空载体)与表达框架。
术语“表达框架”是指具有编码蛋白质潜能的序列。
术语"宿主细胞"指的是能够将目的基因导入,并为目的基因克隆和/或表达提供条件的细胞,诸如微生物。
术语“重组菌”指的经过基因工程改造的菌(如细菌、酵母菌、放线菌等),这意味着它们的菌体中引入了外源基因片段,其中,改造的一种方式包括菌体基因组被引入新的DNA片段后发生了改变,另一种方式包括菌体中引入了经过人工构建或改造过的质粒,从而使菌体获得表达目的基因的能力。
本申请第一方面提供了一种生物合成诺卡酮的方法,其包括采用能够表达瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶的重组菌合成诺卡酮;其中,所述瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶来自益智。
益智(拉丁学名:Alpinia oxyphylla Miq.),别名:益智仁、益智子。姜科,山姜属多年生草本植物。发明人通过对益智的深入研究,从益智中鉴定出参与诺卡酮合成的全套酶和编码基因,并基于此提供了一种生物合成诺卡酮的方法。其中,实施瓦伦烯合酶能够以法尼基焦磷酸为底物,合成瓦伦烯;瓦伦烯在细胞色素P450氧化酶和细胞色素P450氧化还原酶的共同作用下生成诺卡醇,再在醇脱氢酶的作用下得到诺卡酮。
在一些实施方式中,所述瓦伦烯合成酶具有与SEQ ID NO.1所示的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;
所述细胞色素P450氧化酶选自细胞色素P450氧化酶CYP6、细胞色素P450氧化酶CYP9和细胞色素P450氧化酶AoKo的至少一种;其中,细胞色素P450氧化酶CYP6具有与SEQID NO.2所示的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;细胞色素P450氧化酶CYP9具有与SEQ ID NO.3所示的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;细胞色素P450氧化酶AoKo具有与SEQ ID NO.4所示的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;
所述细胞色素P450氧化还原酶具有与SEQ ID NO.5所示的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;
所述醇脱氢酶具有与SEQ ID NO.6所示的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施方式中,所述瓦伦烯合成酶YZT3的氨基酸序列如下所示(氨基末端至羧基末端):
MEKQSVTLVRDDQGIVRKSTKYHPSVWGDYFIRNSPLNLSEESTQRMIERVEELKVQVKSMFKGTSDVLQIMNLIDSIQLLRLEYHFENEIDGALRLIYEVDDKNYGLYETSLRFRLLRQHGYNVSADTFNKFKDENGSFISILNGDAKGLLSLYNASYLATHGETILDEANNYTKSQLVSLLSELEQPLATQVSLFLEAPLCRRMKSILARKYIPIYEKEAMRSDDILELAKLDFNLLQSLHQEELKKASIWWNDLALAKSLSFTRDRIVEGYYWILSMCYEPQYSRARVMCAKAFCLLSIMDDIYDNYSILEERRLLTEAIKRWNHEAVDSLPEYIKDFYLKLLKAFEEFEAELEFNEKYRVQYLQNEFKAIAISYFEESKWCVERYVPSLDEHLRVSMITSGCSMVVCSMYLGMGEVATKEIFDWCSSFPKAMEASGVIARLLNDIRSHETEQGRDHAASTVESYMKEHGVDVKVARKKLQEIVEKAWKDLNKELLNPTPVARPIIERILNLTMSMEDIYRYIDEYTSPDNKTNGDVSLVLVESIPI*(SEQ ID NO.1)
在一些实施方式中,所述细胞色素P450氧化酶CYP6的氨基酸序列如下所示(氨基末端至羧基末端):
MAEVQLTPLLLIFLLLFLFLFLFLIGTERKLFSNSRGARLPPGPSKLPVIGNLHQLCGGLPHRVLRDLAGIHGPLMLLRLGQVDLAVVSSRNAVLQVTKIHDLNFAHRPQLLAPSKICYGCSDVAFSSYGDYWRQMRRICATDLFTAKRIKSFSAIRAEEVAKLLRDAEAAAAAGQPMNLNYKLTAISNSIVTRASFGFKFDNQHAFIETMKGAILLASGFCAADLFPSLKFVASICGLTSKLKMLHCKVDEILDATIKKHQSSKSEGDEENLLDVLLRLKDDGTLESPITFDNIKAVILDVFTGGTETSSTIVEWTMSELIRNPSAMAKAQGEVREAMMRRQSRDFDEEVIGELHYLKLVIKESLRLHPPLPLLVPRVAKEACQVLDYEVPAGTRVVINAWALGRDPLYWGADAERFRPERFEDGEVDYKGGHLEFIPFGAGRRICPGMRFGMATVELVLAQLLFHFDWELPGGGEGNTAAEELDMAEAFGATVVRKEELRLVPVLRYPLPPAA*(SEQ IDNO.2)
在一些实施方式中,所述细胞色素P450氧化酶CYP9的氨基酸序列如下所示(氨基末端至羧基末端):
MEAFTLKLIILFFAPLLLFLLFLRRSHGRRRGHGKPLPPGPFNLPVIGSLHHLLGPLLHQTLASMSQRYGPAILLKFGHVTTLVISSVEAAAEIMKTHDVSFATRPVIHSAKMIAYGGDGIVFAPYGTSWRELRKMSMVELLSAKRVQYFRYIREDEVLKFMRSITLAPQSVNLSSSFKVLANDIAARAIIGSKCQYQQEFLRLIMKGLQEAGGFNLADLYPSSPLLGLLSRLLSSKMQQLHLEVDAILDGIIKEHRQRSKTFAEQSAEEDMVDTLLKVQAEGSLPFPLTDLSIKAMIFDLFAAASETTSTTMEWAMSELMKNPVAMKQAQEEVRRVVGSKGKVTEDHVGEMSYLKQAVRESLRLHPPLPLLLPRECQEAMEVMGYWIPAKTRVLVNAWALARDPRYWDDATEFKPERFAAGGRSCGVDMKGTNLELIPFGAGRRMCPGSTFGMASVELVLACLLYYFDWEMPVPGDGGAAKKPTELDMEEQFILACHKKTQLRLRAIPRI*(SEQ ID NO.3)
在一些实施方式中,所述细胞色素P450氧化酶AoKo的氨基酸序列如下所示(氨基末端至羧基末端):
MISTAFASVAAAIFTVFILIRFRRRSRVSNLPPAVPGLPLIGNLLQLKDKKPHQTFTKWAQIYGPIYTIKTGASTMVVLNSTEVAKEAMVAKYSSISNRKLSKALTLLTSNKRMVAMSDYGEFHKMVKRYILTSLLGANAQKQNYGIRETLINNVVKFLYSDLSDNPNDAVNLRKSFQPELFRLAMKQALNLEPESIYVEELGRELSKEEIFNVLVVDPMMGAIEVDWRDFFPYLRWVPNRSFENKLKRMLMRRAAVMQVLITKRKNSKQSKEEISCYLDFLLSQGTLTDEEIISLVWEAVIESSDTTLVTTEWAMFELSKNPNKQERLYQEIQQVCGSENVTDEHLSRMPYLNCVFHETLRRHSPVPIVPLRYAHEDTQIGGFNILAGSEIAINLYGCNMDKMQWDEPNEWKPERFIDSKYEQMDSYKTMAFGAGKRICAGSLQASSIACTAIGRLVQEFEWRLKEGEEANVVTVQLTNLKLEPLLAYIKPRSTNDACL*(SEQ ID NO.4)
在一些实施方式中,所述细胞色素P450氧化还原酶AoCPR的氨基酸序列如下所示(氨基末端至羧基末端):
MQTDSGKASPLDLLSAVVASLSGGDGLDLGAGNPSVEYRRLIAVLSTVVAVLVGCAAIFFFRRSSGKKPAEPPKPLAVKTQLDAEEDQGKKKVTVFFGTQTGTAEGFAKALAEEAKARYPNAIFKVVDIDEYATEDDEYEENLKKESLVLFFLATYGDGEPTDNAARFYKWFTEGKERVTWLENLQFSVFGLGNRQYEHFNKVAKVVDELLQEQGAKRIVQVGLGDDDQCIEDDFSAWRELLWPELDKLLQDENETGASTPYTAAVPEYRVVFVKPEEVPYLDKSLSFANGHAIHDIQHPCRANVAVRRELHTSASDRSCIHLEFDIDGTGLVYGTGDHVGVFADNCSEIVEEAAKLLGYSPDTYFSIHTDKEDGTPLGGSLSPPFPSPCTLKTALTRYSDVLNSPKKSALLALAAHATDLSDAERLKFLASPIGKDEYSQWIVANQRSLLEVMAEFPSAKPPLGVFFAAIAPRLQPRYYSISSSPRMAPSRIHVTCALVYEKTPTGRIHKGVCSTWMKNSISLEENQECSWAPIFVRQSNFKLPVDPSVPVIMIGPGTGLAPFRGFLQERLALKKEGLELGHSILFFGCRNRKMDFIYEDELNNFVETGVLSEFIVAFSREGPTKQYVQHKMTEKASELWNIISQGGYVYVCGDAKGMARDVHRVLHTIVQEQGGMDSSKTESFVKSLQMEGRYSRDVW*(SEQ ID NO.5)
在一些实施方式中,所述醇脱氢酶AoADH的氨基酸序列如下所示(氨基末端至羧基末端):
MASSFVLSSVAKRLEGKVTLITGGASGLGECTAKLFARLGARVVVADIQDDKGRALCDSLGPDTASYVHCDVTKEPDVASAVDAAVARHGKLDVMFSNAGVGEVLQKSLPDCEVADFQRLMSVNVTGVFLATKHAARVMTPARRGSIVITGSTTSTIGGLGPHAYTCSKHAVVGLMRSAAVELGRHGVRVNCVSPHGMATPMTMAAFDLDKEGVEAMFERSANLKGVRLEAEDVAEAVAYLAGDESRYVSGVNLLVDGGFTIAKGLA*(SEQ ID NO.6)
在一些实施方式中,所述重组菌能够合成法尼基焦磷酸。
在一些实施方式中,所述重组菌能够表达乙酰乙酰辅酶A硫解酶、羟甲基戊二酰辅酶A合酶、羟甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、甲羟戊酸-5-磷酸激酶、甲羟戊酸焦磷酸脱羧酶、异戊二烯焦磷酸异构酶、法尼基焦磷酸合酶的至少一种。
在一些实施方式中,所述羟甲基戊二酰辅酶A还原酶为截短的羟甲基戊二酰辅酶A还原酶,其截去了内质网定位序列,增强了酶在细胞质中的稳定性。
发明人发现,乙酰乙酰辅酶A硫解酶、羟甲基戊二酰辅酶A合酶、羟甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、甲羟戊酸-5-磷酸激酶、甲羟戊酸焦磷酸脱羧酶、异戊二烯焦磷酸异构酶属于甲羟戊酸途径中的酶,甲羟戊酸途径可以合成异戊烯基二磷酸(IPP)和二甲基烯丙基二磷酸(DMAPP),二者可以作为前体,在法尼基焦磷酸合酶的催化下合成法尼基焦磷酸(FPP),而FPP是生物合成诺卡酮的底物,因此,当所述重组菌能够表达甲羟戊酸途径中的酶和法尼基焦磷酸合酶的至少一种时,有利于FPP的合成,进而有利于诺卡酮的生物合成。
本申请第二方面提供了一种用于诺卡酮合成的酶,其具有与SEQ ID NO.1、SEQ IDNO.2、SEQ ID NO.3、SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6所示的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
本申请第三方面提供了一种多核苷酸分子,其包含编码本申请第二方面的酶的核苷酸序列或其互补序列的至少一种。
在一些实施方式中,所述多核苷酸分子包含与SEQ ID NO.7、SEQ ID NO.8、SEQ IDNO.9、SEQ ID NO.10、SEQ ID NO.11、SEQ ID NO.12或SEQ ID NO.13所示的核苷酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列。
在一些实施方式中,编码瓦伦烯合成酶YZT3(野生型)的核苷酸序列如下所示(5’末端至3’末端):
atggagaaacaatcagtaactctcgtgcgtgatgaccaagggatagttcgtaagtcgacaaaatatcatccaagcgtttggggtgattatttcatccgaaactcgcctctcaatctatcagaggagtccactcaaaggatgatagagagagtagaagaattaaaggtgcaagtaaagagcatgttcaagggcaccagtgacgtattgcagattatgaacttgattgattcaattcaacttctaagactagaatatcattttgagaatgaaatagatggtgcactaagattgatctatgaggtcgacgacaagaactatggactttatgaaacttctcttagatttcgattgcttaggcaacatggatataatgtttctgcagatacctttaacaagttcaaagatgagaatggaagctttatatctatcttgaatggagatgcaaagggattactaagcttatataatgcatcttaccttgcaacgcatggagagactatacttgatgaagccaataattatacaaagtctcagctagtatccttattgagtgaacttgaacaacctttagcgacacaagtatcacttttccttgaagcgcccctatgtcgaagaatgaaaagtatcttggcaagaaaatatatacctatttatgaaaaggaagcaatgcgaagtgatgacatattagaacttgcaaaattggatttcaatctactgcaatctcttcatcaagaggagttgaagaaagcttcgatatggtggaatgatttagcccttgctaaatctctaagttttactcgtgatcgaatcgtggaaggttattattggattcttagtatgtgttatgagcctcaatattctcgtgcacgagtgatgtgcgccaaagcattttgtcttctatcaattatggatgatatttatgacaactatagcatattggaagagcgcagattattaactgaggcaataaagaggtggaatcatgaagctgttgattctttaccagaatatataaaagatttttatctgaagctattaaaggcttttgaagaatttgaagcggaattggaatttaatgagaagtatcgtgtgcaataccttcaaaatgaatttaaagctatagccatatcatattttgaagaatccaagtggtgtgtggaaagatatgtgccgtcactcgacgaacacttgcgtgtttctatgatcacctctggatgttctatggtcgtttgttctatgtatcttggtatgggagaagtggcaacaaaagagattttcgattggtgttctagttttcccaaggcaatggaagcaagcggtgtaattgctagactcctcaatgatataagatcacacgagactgagcaagggagagaccatgctgcctctacagtggaaagttacatgaaagagcacggcgtagatgtaaaagttgcacgcaagaagctacaagagatagtggagaaagcgtggaaggatctaaataaggaacttctcaaccccacaccagtagctcgacctataattgaaagaatactcaaccttacaatgtcaatggaagacatatataggtacattgacgagtacaccagtcctgataataagacgaacggtgatgtctccttggtgttggttgaatctattcctatatga(SEQ IDNO.7)
在一些实施方式中,通过对野生型瓦伦烯合成酶YZT3的核苷酸序列按照酿酒酵母密码子偏好性优化后,得到瓦伦烯合酶的编码基因AoVS的核苷酸序列如下所示(5’末端至3’末端):
atggaaaagcaatctgttacattggttagagatgatcaaggtattgttagaaaatctacaaagtaccatccatctgtttggggtgattattttattagaaactctccattgaacctgtctgaagaatctactcaaagaatgattgaaagagttgaagaattgaaggttcaagttaaatctatgttcaagggtacatctgatgttttgcaaattatgaatctgatcgattctatccaattgttaagattagagtaccatttcgaaaacgaaattgatggtgctttaagattaatctacgaagttgatgataagaactacggtttgtatgaaacatctttaagattcagactgttgagacaacatggttataatgtttctgctgatacttttaacaagttcaaagatgaaaacggttcttttatctctatcttaaacggtgatgctaaaggtttgttatctttatataacgcttcctatctggctacacatggtgaaacaattttagatgaagctaataactacaccaagtctcaattagtttctttgttgtctgaattggaacaaccattagctactcaagtttctttatttttggaggctccattatgtagaagaatgaaatctattctggctagaaaatacatcccaatttatgaaaaggaggctatgagatctgatgatattttggaattggctaaattggatttcaacttattgcaatctctgcatcaagaagaattaaaaaaggcttctatctggtggaatgatttggctttagctaaatctttgtcttttacaagagacagaatcgttgaaggttattattggattttgtctatgtgttacgagccacaatattctagagctagagttatgtgtgctaaagctttttgtttattgtctatcatggacgatatctatgataattactctatcttggaggaaagaagattgttaacagaagctattaagagatggaatcatgaagctgttgattctttgccagaatatattaaagacttctacttgaagctgttgaaagcttttgaagaatttgaagctgaattggaattcaatgaaaagtatagagtccaatacttgcaaaatgaattcaaagctatcgctatttcttactttgaagaatctaagtggtgtgttgaaagatatgttccatctttggatgaacatttgagagtttctatgattacttctggttgttctatggttgtttgttctatgtatttgggtatgggtgaagttgctacaaaagaaatttttgattggtgttcttccttcccaaaagctatggaagcttctggtgttattgctagattattaaatgacatcaggtcacatgaaacagaacaaggtagagatcatgctgcttctacagttgaatcttatatgaaagaacacggtgttgatgttaaagttgctagaaaaaaactgcaagaaatcgttgaaaaggcttggaaagatttgaataaagaattgttgaaccccacaccagttgctagaccaattattgaaagaattttgaacctgactatgtctatggaagatatttatagatacatcgacgaatacacatctccagataataaaacaaacggtgatgtttctttggttttggttgaatctatcccaatttaa(SEQ IDNO.13)
在一些实施方式中,编码细胞色素P450氧化酶CYP6(野生型)的核苷酸序列如下所示(5’末端至3’末端):
atggcggaggtccaactcactcccctcctcttaatcttcctcctcctcttcctgttcctcttcctcttcctcatcggcacagagaggaagcttttctccaactccagaggagctcgcctcccgcccggtccgtcgaagctacccgtcattggcaacctgcaccaactttgcggcggcctaccccaccgtgtcctgcgcgacctcgccggcatccacggccccctcatgctcctccgccttggccaggtcgacctcgccgtcgtatcctcccgaaatgccgtcctgcaggtcaccaagatccacgacctcaacttcgcccatcgcccccagctcctggccccttccaaaatctgctacggctgctccgacgtcgccttctcttcctacggagactactggcgccagatgcgcaggatctgcgcaaccgatctcttcaccgccaagcgcatcaagtcattctctgccatccgcgcagaagaggtcgccaagctcctccgcgacgccgaggcggcagcggctgccggccagccgatgaacttgaactacaagctcacggcgatctcgaacagcatcgtgacccgcgcctctttcggtttcaaattcgataaccagcacgcgttcatcgagaccatgaagggggcgatactgctcgcgtcggggttttgcgccgcggatctgttcccgtctttgaagttcgtggcctcgatctgcggcctcacctccaagctgaagatgcttcactgcaaagtggatgaaattctcgacgcgaccatcaaaaagcaccaatcgagcaagagcgaaggggacgaagagaatctcctcgacgttctacttcgtctaaaagacgacggaaccctggaatccccaatcacattcgacaacatcaaagctgtgattttggacgtcttcacgggagggacggagacctcgtcgacgattgtagaatggacgatgtcggagctcatcaggaaccctagcgcgatggcgaaggcacaaggggaagtgcgagaagcgatgatgcgaaggcaaagcagggatttcgacgaggaagtcatcggcgagctccattacctgaagctagtgatcaaggagagtctgaggctacacccgccgctaccactgttggtgccgagggtggcgaaggaggcgtgccaggtgctggactacgaggtgccggcgggcacgagggtggtgatcaacgcctgggccctagggagggacccgctctactggggcgccgacgccgagcggttccggcccgagaggttcgaggacggtgaggtggactacaaggggggccacctggagttcattccattcggcgccgggaggaggatatgccccgggatgagattcgggatggcgacggtggaactcgtattggcgcagctgctgttccacttcgactgggagctaccaggaggaggagaagggaatacggcggcggaggaactggacatggcggaggcattcggggcgaccgtggtgaggaaggaggagctccgcctggttccggtgcttcgatatcccctgccgcccgctgcttag(SEQ ID NO.8)
在一些实施方式中,编码细胞色素P450氧化酶CYP9(野生型)的核苷酸序列如下所示(5’末端至3’末端):
atggaagcttttaccttgaagcttatcattctcttcttcgcccccctcctcctcttcctcctcttcctcaggcgcagccatggccgacggcggggccacggcaagcctctccctcctggcccattcaacctccccgtcatcggcagcctgcaccacctcctcggcccgttgctgcaccagacgctcgcgtctatgtcccagcgatacggccccgccatcctcctcaagttcggccatgtcaccaccctcgtcatctcctccgttgaggccgccgcagagatcatgaagacccatgacgtcagcttcgccacgcgtcccgtcatccattcagccaagatgatcgcctacggcggcgacggtattgtcttcgcgccatacggcaccagctggcgcgagctccgcaaaatgagcatggtggagctcctcagtgccaagcgcgtccagtacttccgctatatccgcgaggatgaggtgcttaaatttatgcgctccattacgttggcaccccaaagcgtgaatcttagtagcagttttaaggtgctcgcgaacgacatcgcggcgagggccatcattgggagcaagtgccagtatcagcaggagttcctgcggctgataatgaaggggctccaagaagcggggggattcaacttggccgacttgtacccgtcgtcgccgctcctcgggttgctcagccgcttgttgtcttccaagatgcagcagctgcacctcgaggtggatgccatcttggatggcatcatcaaggagcacagacagaggagtaaaacgttcgcagagcagagtgcagaggaggacatggtggataccctgctcaaggttcaagcggaaggcagccttccgttccccctcacggacttgtccatcaaagctatgatttttgatctttttgcagcggcgagcgagaccacctctacgaccatggaatgggcgatgtcggagctgatgaagaatccggtggcgatgaagcaggcgcaggaggaagtgaggcgggtggtgggaagcaaggggaaagtcaccgaagatcacgtcggcgagatgagttacctcaagcaggcggtaagggagtcgctgaggcttcaccctcccctgcctctgttgctgccgcgggagtgccaggaagcgatggaggtgatgggctactggattccggcgaagacgagggtgctggtgaacgcgtgggcgctggcgagagacccaaggtattgggacgacgccacggagttcaagccagagaggttcgccgctggtgggaggagctgcggggtggacatgaaaggcaccaacttggagctcataccgttcggggcgggtagaaggatgtgccctggtagcacgttcggaatggcgagcgtggagctggtgcttgcttgccttctctattactttgactgggagatgccggtcccgggcgacggaggagcggcgaagaaaccgacggagttggacatggaagaacagttcatactggcgtgtcataagaagacgcagcttcgcttgcgcgcgatccctcgtatatag(SEQ ID NO.9)
在一些实施方式中,编码细胞色素P450氧化酶AoKo(野生型)的核苷酸序列如下所示(5’末端至3’末端):
atgatttccacggccttcgcaagtgtcgctgccgccatcttcacggttttcatcctcatcaggttccgacgccgcagtcgcgtttccaatcttccgccggctgtccccgggcttcccttgattgggaatttgctccagctgaaggacaagaaacctcaccagacattcacgaaatgggcgcagatatatggcccgatttataccatcaagacgggcgcttccactatggtagtcctgaattctactgaggttgccaaagaggcaatggtggctaagtattcatccatctcaaatcggaaattgtcaaaggcattgacattgctcacttcaaataaacgtatggttgctatgagtgactatggagagttccacaaaatggtgaaacggtacatattgactagtttgttaggtgcaaatgctcagaagcaaaactatggtatcagggagacgttgattaataatgtcgtcaaatttctatattcggatttaagcgataaccctaatgatgcagtaaacctcagaaagtcatttcaacctgagttattccgattagccatgaagcaagctttgaacctggaacctgaatccatttatgtagaggaacttgggagggaactttcaaaggaagaaatattcaatgtgttggtggtagaccctatgatgggcgccattgaggtggactggagggactttttcccttacttgagatgggtccctaatcgaagctttgaaaataagctaaagagaatgctcatgcgcagggcggcagtgatgcaggttctgattacaaaaagaaagaacagtaaacaatccaaagaggagataagctgctatttggactttctgctatcccagggcactttgactgacgaagagataatatcgttagtatgggaagcggtaattgagtcatcggatacaactttagtcacaacagaatgggctatgtttgagctatctaagaatccaaataaacaggaacgtctttaccaagaaattcaacaagtatgtggatctgaaaacgtcaccgatgagcatttgtcacggatgccctacttgaactgtgtgttccatgagaccctaagacgtcattcccctgttcctatagtacctctcaggtatgcccatgaagatacccagatcggaggattcaacatccttgcggggtctgagattgccatcaatctttatggatgcaatatggacaagatgcagtgggatgaacctaatgaatggaagcctgagagattcatagacagcaaatatgagcaaatggactcgtataagactatggcctttggagctggaaagaggatttgtgccggatctctgcaggcatcgtcgattgcatgcactgccatcgggcgtttagtgcaagagttcgagtggaggctgaaggaaggagaagaggctaatgtcgtcactgttcagctcacaaaccttaagcttgaacctctgcttgcatacataaagcccagaagcaccaacgatgcatgcctttga(SEQ IDNO.10)
在一些实施方式中,编码细胞色素P450氧化还原酶AoCPR(野生型)的核苷酸序列如下所示(5’末端至3’末端):
atgcagacggattccgggaaggcttcgccgctcgatctcttgtcggctgtcgtcgcctcgctatccggtggagatgggctcgatttaggcgccgggaatccctcggtggagtaccggcggctgatcgccgtcctgagtactgtcgtcgccgtgctagttggctgcgcggcgatattcttcttccggagatcgagcggaaagaagccggccgagccgccgaagccgctggcggttaagactcagctggatgcggaggaggaccaagggaagaagaaggtcaccgtcttcttcggcacgcagaccgggacggccgaggggtttgcgaaggcgctggctgaggaggccaaggcacggtaccctaatgccatatttaaagtcgtggatatcgacgaatatgctactgaggacgatgagtacgaggagaacctgaaaaaggagagcttggttttgttcttcttggctacgtatggagatggcgagcctactgataatgctgcccggttctacaaatggtttacagaggggaaagagagagtaacctggttggaaaatcttcaattttctgtgtttggtttgggcaatcggcaatatgaacattttaataaggttgctaaggtagttgatgaactgcttcaagagcaaggtgccaaacgcattgtccaagtgggattgggagatgatgatcagtgtattgaggatgacttctctgcatggagggaacttctttggccggagttggataagttgcttcaggacgaaaatgagacaggtgcatctactccttatacagctgctgttcctgaataccgggttgtatttgtcaagccagaagaagttccatatctggataaaagtttgagttttgcaaatggccatgctattcatgacatacaacatccatgcagggctaatgtggctgtgagacgagagcttcatacttcagcttcagaccgatcctgcatccacttggagtttgacatagatggcactggccttgtgtacggaacaggagaccatgttggtgtattcgcggacaactgttctgagattgtagaggaggctgcaaagttgttaggttattcacctgacacatatttctctattcatactgacaaggaggatggcacgccacttggaggctctttgtcacctcctttcccatctccatgcactctcaaaaccgctcttactcgatactctgatgttctaaattcacctaaaaagagtgcattacttgcccttgccgcacacgcaacagatcttagtgatgctgagcgacttaaatttttggcttctcctattggaaaggatgaatattctcaatggattgttgctaatcagaggagtcttcttgaagtcatggccgaatttccctctgcaaagcctcctctaggagtcttctttgccgcaatagccccacgtttgcagccaagatattattcaatttcctcttctccgaggatggcacctagtagaattcatgtgacttgtgcattagtttatgaaaagacaccaactggcaggattcataaaggggtttgttccacctggatgaagaattccatttcgctcgaagagaaccaagaatgcagctgggctcctatttttgtgaggcagtctaactttaaactccctgttgatccttcggtacctgtcatcatgattggaccgggcacagggttggcacctttcaggggcttcttacaggaaaggttggcattgaaaaaggaagggttggaacttggtcattctattctcttcttcggatgcagaaaccgcaaaatggacttcatctacgaggatgagttgaacaactttgtcgaaacaggcgtgctttccgagtttattgtggccttctcccgtgagggtccaactaaacaatatgtgcaacacaaaatgaccgagaaagcatcagaactttggaatatcatctcccaaggtggatatgtatacgtgtgtggagatgctaagggcatggctagagatgttcacagagttcttcatactattgttcaagagcagggaggtatggatagctccaaaacagaaagcttcgtcaagagcttgcaaatggaagggagatattcaagggatgtatggtga(SEQ ID NO.11)
在一些实施方式中,编码醇脱氢酶AoADH(野生型)的核苷酸序列如下所示(5’末端至3’末端):
atggcaagctcctttgttctctcctctgtagcaaaaaggctcgaagggaaggtgacattgatcaccggcggggcgagcgggctcggcgagtgcaccgccaagctgttcgcccgcctcggcgcccgagtagtcgtcgcagacatccaagacgacaaaggccgcgccctgtgcgactcactcggccccgacaccgcctcctacgtccactgcgacgtcaccaaggagcccgacgtggcaagcgccgtcgacgccgccgtcgcccgacacgggaagctcgacgtcatgttcagcaacgccggagtcggggaagtgttgcagaagtcgttgcccgactgcgaggtggctgacttccagcgattgatgtcggtgaacgtgacgggggtgttcctggccaccaagcacgcggcgcgggtgatgacgccggcgaggcgggggagcatcgtgatcacggggagcaccacgtcgactattgggggactagggccgcacgcatacacgtgctcaaagcacgcggtggtggggctaatgaggagcgcggcggtcgagctgggcaggcacggtgttcgggtcaactgcgtgtcgccgcacgggatggcaacgccgatgacgatggcagcgtttgacttagacaaggagggggttgaggccatgtttgagaggtcggccaacctgaaaggtgtgaggctcgaagcggaggacgtggcggaggcagtggcgtacctcgccggcgacgagtccaggtatgtgagcggcgtcaatctgctggtggacggaggcttcaccattgccaagggattggcgtag(SEQ ID NO.12)
本申请第四方面提供了一种核酸构建体,其包含本申请第三方面的多核苷酸分子的至少一种。本申请中,将连接入所述核酸构建体的多核苷酸分子称为目的基因,将所述多核苷酸分子编码的酶称为目标蛋白。
在一些实施方式中,所述核酸构建体中还包含调控编码目的基因表达的调控元件,例如启动子、终止子等,示例性的,所述启动子可以为组成型启动子如PTEF1、PTDH3、PGPM1、PTPI1等,诱导型启动子如PHXT1(高浓度葡萄糖诱导)、PCUP1(铜离子诱导)、PGAL1、PGAL2、PGAL7、PGAL10(半乳糖诱导)等,本领域技术人员可根据需要选择,本申请在此不做限定。
在一些实施方式中,所述核酸构建体中还包含用于筛选包含目的基因或目标蛋白的重组菌的标记基因,例如亮氨酸筛选标记、组氨酸筛选标记、色氨酸筛选标记、尿嘧啶筛选标记等,本领域技术人员可根据需要具体选择,本申请在此不做限定。
在一些实施方式中,所述核苷酸序列位于两个插入元件之间,所述插入元件用于将所述核苷酸序列整合入宿主细胞的基因组中。
在一些实施方式中,两端连接有插入元件的核苷酸序列连接于核酸构建体,例如质粒载体的质粒骨架中,所述核酸构建体用于向宿主细胞导入目的基因时,可以通过限制性内切酶等工具,将所述核酸构建体酶切,从而获得两端连接有插入元件的线性化的目的基因片段,通过将所述线性化的目的基因片段导入宿主细胞中,使其通过两端的插入元件插入宿主细胞基因组的相应位置,从而获得本申请的重组菌。
本领域技术人员可采用常规的方法将线性化的目的基因片段导入宿主细胞中,例如对于酵母菌,可采用醋酸锂法,对于大肠杆菌,可采用钙转法等,此为本领域的常规操作,本申请在此不做限定。
在一些实施方式中,所述两个插入元件成对出现,例如可以是leu2的左右同源臂、Ura3的左右同源臂、YPRCdelta15左右同源臂等,不同基因的同源臂可以将目的基因整合入宿主细胞基因组的不同位置,本领域技术人员可根据希望整合入宿主细胞基因组的位置具体选择同源臂的种类,本申请在此不做限定。
在一些实施方式中,所述两个插入元件之间还包括用于调控目的基因表达的启动子、终止子等调控元件。本申请对所述启动子和终止子的种类不做限定。
在一些实施方式中,所述核酸构建体还包含编码乙酰乙酰辅酶A硫解酶(ERG10)、羟甲基戊二酰辅酶A合酶(ERG13)、羟甲基戊二酰辅酶A还原酶(HMG1)、截短的羟甲基戊二酰辅酶A还原酶(tHMG1)、甲羟戊酸激酶(ERG12)、甲羟戊酸-5-磷酸激酶(ERG8)、甲羟戊酸焦磷酸脱羧酶(MVD1)、异戊二烯焦磷酸异构酶(IDI1)、法尼基焦磷酸合酶(ERG20)的核苷酸序列的至少一种;其中括号中显示了编码这些酶的基因名称。
编码以上酶的基因的示例性而非限制性的公开如下:
ERG10(Accession/GENE ID:856079)、ERG13(Accession/GENE ID:854913)、tHMG1(Accession/GENE ID:854900,截去4-1659bp)、ERG12(Accession/GENE ID:NM_001182715.1)、ERG8(Accession/GENE ID:CP046093.1,689693..691048)、MVD1(Accession/GENE ID:NM_001183220.1)、IDI1(Accession/GENE ID:NM_001183931.1)、ERG20(Accession/GENE ID:853272)。
在一些实施方式中,所述核酸构建体为质粒载体;优选地,所述质粒载体为真核表达载体。
在一些实施方式中,所述的核酸构建体包括pRS426质粒骨架。发明人发现,pRS426质粒骨架中包含适用于大肠杆菌的AmpR筛选标记,适用于酿酒酵母的URA3筛选标记,以及适用于大肠杆菌的复制子和酿酒酵母的多拷贝复制子,采用所述pRS426质粒骨架有利于含有目的基因的质粒在导入酿酒酵母中后维持质粒的高拷贝。
在一些实施方式中,所述pRS426质粒骨架中存在的突变,所述突变消除了pRS426质粒骨架中的酶切位点BsaI,从而可以在使用Goldengate方法构建载体时,以BsaI作为限制性内切酶。
在一些实施方式中,所述的核酸构建体包括pESC-TRP质粒骨架。发明人发现,pESC-TRP质粒骨架中包含适用于大肠杆菌的AmpR筛选标记,适用于酿酒酵母的TRP1筛选标记,以及适用于大肠杆菌的复制子和酿酒酵母的多拷贝复制子,采用所述pESC-TRP质粒骨架有利于含有目的基因的质粒在导入酿酒酵母中后维持质粒的高拷贝。
在一些实施方式中,所述质粒载体为pDXYZ3、pDXVS1、pDXVS2、pDXNL1、pDXNL2、pDXNL3、pDXNT1的至少一种,所述质粒载体的构建示意图如图2、图3、图4或图5所示;其中,质粒pDXYZ3的构建示意图如图2所示,质粒pDXVS1、pDXVS2的构建示意图如图3所示,质粒pDXNL1、pDXNL2、pDXNL3的构建示意图如图4所示,质粒pDXNT1的构建示意图如图5所示。
在一些实施方式中,可以将所述质粒载体直接导入宿主细胞中,也可以通过酶切所述质粒载体,获得包含插入元件的目的基因片段,进一步将所述基因片段整合入所述宿主细胞的基因组中。
本申请第五方面提供了一种重组菌,其包含本申请第三方面的多核苷酸分子,或本申请第四方面的核酸构建体;所述重组菌通过将所述多核苷酸分子或所述核酸构建体导入宿主细胞中获得;优选地,所述宿主细胞为真核细胞;更优选为酿酒酵母。
在一些实施方式中,所述重组菌中可以直接包含所述核酸构建体,例如,所述核酸构建体以质粒的形式单独存在于宿主细胞中,表达合成诺卡酮所需的酶。
在另一些实施方式中,所述多核苷酸分子整合入所述宿主细胞的基因组中。所述多核苷酸分子整合入所述宿主细胞的基因组中,有利于所述目的基因的长期稳定表达,从而获得能够稳定遗传的重组菌。
本领域技术人员可采用常规的方法将多核苷酸分子整合入所述宿主细胞的基因组中,本申请在此不做限定,例如可以将目的基因连接于两个插入元件之间,通过插入元件将所述目的基因插入宿主细胞的基因组中,示例性的,所述插入元件可以为leu2的左右同源臂、Ura3的左右同源臂、YPRCdelta15左右同源臂,不同基因的同源臂用于将目的基因插入宿主细胞基因组的不同位置,发明人发现,将目的基因插入不干扰宿主细胞正常生理代谢的位点,均能够获得本申请的重组菌。
在一些实施方式中,所述多核苷酸分子在所述重组菌的基因组中的拷贝数至少1个,优选至少2个,更优选至少3个。增加所述多核苷酸分子的拷贝数,有利于其编码的酶的高表达。
在一些实施方式中,所述重组菌能够表达乙酰乙酰辅酶A硫解酶、羟甲基戊二酰辅酶A合酶、羟甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、甲羟戊酸-5-磷酸激酶、甲羟戊酸焦磷酸脱羧酶、异戊二烯焦磷酸异构酶、法尼基焦磷酸合酶的至少一种。
发明人发现,酿酒酵母可以内源合成FPP,因此在一些优选地实施方式中,采用酿酒酵母作为宿主细胞,有利于获得高效合成诺卡酮的重组菌。
本申请第六方面提供了本申请第二方面的酶、本申请第三方面的多核苷酸分子、本申请第四方面的核酸构建体或本申请第五方面的重组菌生产瓦伦烯、诺卡醇和/或诺卡酮的用途。
下面通过具体实施例来说明本申请的生物合成诺卡酮的方法及载体。下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。以下实施例中所涉及的质粒均为本领域技术人员公知质粒。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1表达载体和菌株构建
1.1酵母表达通用载体的构建
质粒pZY900具体构建过程:以酿酒酵母S288c基因组(提取方法见:李晓伟.工程乙酰辅酶A通路构建酿酒酵母高效合成平台[D].武汉大学,2015.2.3.6酵母基因组DNA提取方法)为模板,用引物900-1F/1R、900-2F/2R、900-6F/6R、900-7F/7R分别扩增获得片段9001(Leu2的左同源臂)、9002(终止子tTDH2)、9006(基因ERG20与终止子tERG20)、9007(Leu2右同源臂);以酿酒酵母CEN.PK2-1D的基因组(提取方法见:李晓伟.工程乙酰辅酶A通路构建酿酒酵母高效合成平台[D].武汉大学,2015.2.3.6酵母基因组DNA提取方法)为模板,用引物900-3F/3R、900-5F/5R分别扩增获得片段9003(终止子tCYC1)和9005(启动子pGAL1和pGAL10);用引物900-4F/4R以pCAS(见文献Zhang,Yueping et al.“A gRNA-tRNA arrayfor CRISPR-Cas9 based rapid multiplexed genome editing in Saccharomycescerevisiae.”Nature communications vol.10,1 1053.5Mar.2019,doi:10.1038/s41467-019-09005-3)为模板扩增获得片段9004(无义基因lacZ,用于目的基因的替换);以pRS426为模板,用引物900-8F/8R、900-9F/9R、900-10F/10R扩增获得质粒骨架(引入MssI酶切位点,筛选标记(AmpR、URA3等))。通过DNA assemble(又称酵母组装,李晓伟.工程乙酰辅酶A通路构建酿酒酵母高效合成平台[D].武汉大学,2015.)的方法将以上片段在酿酒酵母体内重组构建pZY900,然后在大肠杆菌内扩增,酶切验证以及测序正确后,得到pZY900。质粒pZY900构建示意图见图1,其中,片段9001(HA)、9002(T)、9003(T)、9004、9005、9006、9007(HA)从左至右依次连接,其余部分来自pRS426的质粒骨架。
构建质粒pZY900所用引物的序列见下表1。
表1
引物 序列(5’-3’)
900-1F actaaagggaacaaaagctggagctctagtagtttaaacataacgagaacacacagggg(SEQ ID NO.14)
900-1R cattaaagtaacttaaggagttaaatttaagcaaggattttcttaacttcttc(SEQ ID NO.15)
900-2F gaagttaagaaaatccttgcttaaatttaactccttaagttactttaatgatttag(SEQ ID NO.16)
900-2R tcgaaggctttaatttgcgcgaaaagccaattagtgtgata(SEQ ID NO.17)
900-3F tagtatcacactaattggcttttcgcgcaaattaaagccttcgagc(SEQ ID NO.18)
900-3R gggacgcgccctgtagcggctgaggtctcaacaggccccttttcctttg(SEQ ID NO.19)
900-4F catgatatcgacaaaggaaaaggggcctgttgagacctcagccgctacagggcgc(SEQ ID NO.20)
900-4R gaatttttgaaaattcaatataaatgtgagaccaccatgattacgccaagcg(SEQ ID NO.21)
900-5F taatcatggtggtctcacatttatattgaattttcaaaaattcttactttttttttg(SEQ ID NO.22)
900-5R atctctctctcctaatttctttttctgaagccattatagttttttctccttgacgttaaagt(SEQ ID NO.23)
900-6F ttaacgtcaaggagaaaaaactataatggcttcagaaaaagaaattagga(SEQ ID NO.24)
900-6R atgtacaaatatcataaaaaaagagaatctttttaaaaaaaatccttggactagtcacg(SEQ ID NO.25)
900-7F actagtccaaggattttttttaaaaagattctctttttttatgatatttgtacataaac(SEQ ID NO.26)
900-7R gcgccattcgccattcaggctgcgcaactgttgtttaaacgacaacgaccaagctcaca(SEQ ID NO.27)
900-8F gatgtgagcttggtcgttgtcgtttaaacaacagttgcgcagcctgaatg(SEQ ID NO.28)
900-8R tcaacagtatagaaccgtggatgatgtggtttctacaggatctgacattattattgttg(SEQ ID NO.29)
900-9F atagtcctcttccaacaataataatgtcagatcctgtagaaaccacatcatccacggtt(SEQ ID NO.30)
900-9R agggcttaccatctggccccagtgctgcaatgataccgcgcgacccacgctcaccggct(SEQ ID NO.31)
900-10F tgataaatctggagccggtgagcgtgggtcgcgcggtatcattgcagcactggggccag(SEQ ID NO.32)
900-10R cgatagcgcccctgtgtgttctcgttatgtttaaactactagagctccagcttttgttc(SEQ ID NO.33)
1.2不同基因表达载体构建
以益智果的cDNA(采用TIANGEN公司RNAprep Pure Plant Plus Kit试剂盒(货号DP441)提取益智果实组织RNA,使用Vazyme的HiScript II 1st Strand cDNA SynthesisKit(+gDNA wiper)试剂盒(货号R212)对RNA进行反转录获得cDNA)为模板,以引物对P5/P6为引物,利用Takara公司的Prime STAR高保真酶通过PCR扩增益智的cDNA获得基因片段命名为YZT3,经天根胶回收试剂盒胶回收后,通过翊圣公司同源重组试剂盒,采用同源重组的方法连接到BsaI切后的酵母表达通用载体pZY900中,经过测序确认无误后,获得含有YZT3基因的酵母表达载体,命名为pDXYZ3,其质粒构建示意图见图2,其中,以YZT3基因替代了pZY900中的lacZ基因。
引物对P5/P6序列如下表2所示:
表2
使用引物对P7/P8,以合成的AoVS基因(核苷酸序列如SEQ ID NO.13所示)为模板扩增得到AoVS基因片段。采用翊圣公司同源重组试剂盒,将扩增得到的AoVS基因片段连接到BsaI切后的pZY900中,经过测序确认无误后,获得含有AoVS基因的酵母表达载体,命名为pDXVS1,其质粒构建示意图见图3中的pDXVS1,其中,以AoVS基因替代了pZY900中的lacZ基因。
引物对P7/P8序列如下表3所示:
表3
使用引物对P9/P10,以合成的AoVS基因(核苷酸序列如SEQ ID NO.13所示)为模板扩增得到AoVS基因片段。使用引物P11/P12,以质粒pHM001(pHM001的构建见文献Deng etal.“Systematic identification of Ocimum sanctum sesquiterpenoid synthases and(-)-eremophilene overproduction in engineered yeast”.Metabolic Engineering,2022,69:122-133)为模板,扩增包含PKG1终止子(T)、URA同源臂(HA)、载体骨架、HIS3标签、CYC1终止子(T)、tHMG1与pGAL1-pGAL10启动子(PGAL10和PGAL1)的载体片段。采用翊圣公司同源重组试剂盒,通过同源重组的方式将AoVS基因片段和载体片段进行连接,得到质粒pDXVS2,其质粒构建示意图见图3中的pDXVS2。
引物序列如下表4所示:
表4
使用引物对P13/P14,利用Prime STAR高保真酶从益智果cDNA模板中克隆得到CYP6基因;使用引物对P15/P16,利用Prime STAR高保真酶从益智果cDNA模板中克隆得到AoCPR基因;使用引物对P17/P18,利用Prime STAR高保真酶从pESC-TRP质粒中克隆得到pGAL1-pGAL10启动子片段;使用SacI/XhoI双酶切pESC-TRP质粒得到载体骨架。采用翊圣公司同源重组试剂盒,将上述四个片段连接,获得质粒pDXNL1,其质粒构建示意图见图4中的pDXNL1。
引物序列如下表5所示:
表5
使用引物对P19/P20,利用Prime STAR高保真酶从益智果cDNA模板中克隆得到CYP9基因;使用引物对P15/P16利用Prime STAR高保真酶从益智果cDNA模板中克隆得到AoCPR基因;使用引物对P17/P18利用Prime STAR高保真酶从pESC-TRP质粒中克隆得到pGAL1-pGAL10启动子片段;使用SacI/XhoI双酶切pESC-TRP质粒得到载体骨架。采用翊圣公司同源重组试剂盒,将上述四个片段连接,获得质粒pDXNL2,其质粒构建示意图见图4中的pDXNL2。
引物序列如下表6所示:
表6
使用引物对P21/P22,利用Prime STAR高保真酶从益智果cDNA模板中克隆得到AoKo基因(核苷酸序列如SEQ ID NO.10所示);使用引物对P15/P16,利用Prime STAR高保真酶从益智果cDNA模板中克隆得到AoCPR基因;使用引物对P17/P18,利用Prime STAR高保真酶从pESC-TRP质粒中克隆得到pGAL1-pGAL10启动子片段;使用SacI/XhoI双酶切pESC-TRP质粒得到载体骨架。采用翊圣公司同源重组试剂盒,将上述四个片段连接,获得质粒pDXNL3,其质粒构建示意图见图4中的pDXNL3。
引物序列如下表7所示:
表7
使用引物对P23/P24,从益智果cDNA模板中克隆得到AoADH基因片段,通过BamHI/XhoI双酶切获得切后片段,随后与BamHI/XhoI双酶切后的pESC-URA质粒载体利用T4 DNA连接酶进行连接,获得的质粒命名为pDXNT1,其质粒构建示意图见图5。
引物序列如下表8所示:
表8
将使用引物对P15/P16克隆得到的AoCPR基因片段与经EcoRI/SacI双酶切pESC-TRP质粒回收的载体片段进行同源重组,得到pCK质粒,其质粒构建示意图见图4中的pCK。
1.3菌株构建
通过醋酸锂转化法方法将pDXYZ3质粒转化至酵母YZL141菌株中(YZL141菌株的构建见Bian,G.,Hou,A.,Yuan,Y.,Hu,B.,Cheng,S.,Ye,Z.,Di,Y.,Deng,Z.,&Liu,T.(2018).Metabolic Engineering-Based Rapid Characterization of a SesquiterpeneCyclase and the Skeletons of Fusariumdiene and Fusagramineol from Fusariumgraminearum.Organic letters,20(6),1626–1629.https://doi.org/10.1021/acs.orglett.8b00366),涂布于SD-URA筛选平板上,挑取单克隆获得突变菌株命名为JDXYZ3。
利用MssI内切酶酶切pDXVS1质粒,回收含有AoVS的基因片段,通过醋酸锂方法将该片段导入酵母菌株JCR27中(JCR27的构建见Siemon,T.,Wang,Z.,Bian,G.,Seitz,T.,Ye,Z.,Lu,Y.,Cheng,S.,Ding,Y.,Huang,Y.,Deng,Z.,Liu,T.,&Christmann,M.(2020).Semisynthesis of Plant-Derived Englerin A Enabled by Microbe Engineering ofGuaia-6,10(14)-diene as Building Block.Journal of the American ChemicalSociety,142(6),2760–2765.https://doi.org/10.1021/jacs.9b12940),进行酵母菌落PCR验证后,将阳性菌命名为JDXVS1。进一步的,利用PmeI内切酶酶切pDXVS2质粒,回收含有AoVS的基因片段,通过醋酸锂方法将该片段导入JDXVS1中,进行酵母菌落PCR验证后,将阳性菌命名为JDXVS2。
利用醋酸锂方法分别将pCK,pDXNL1,pDXNL2和pDXNL3质粒转化JDXVS2中,获得CK对照菌株,JDXNL1,JDXNL2和JDXNL3突变体菌株。将pDXNT1质粒分别与pDXNL1,pDXNL2和pDXNL3质粒共转化入JDXVS2中,分别获得JDXNT1,JDXNT2和JDXNT3突变体菌株。
实施例2基因功能鉴定
2.1瓦伦烯合成基因功能鉴定
将JDXYZ3菌株接种于Sc-Ura液体培养基,30℃,200rpm摇床培养过夜;次日按照初始OD600=0.1转接至45毫升YPDHG液体培养基(20g/L蛋白胨,10g/L酵母粉,10g/L葡萄糖,10g/L半乳糖)中,加入5毫升肉豆蔻酸异丙酯,30℃,200rpm摇床培养72小时,收集油层,使用正己烷稀释至合适的浓度,使用GC-MS检测产物,检测条件如下:
Thermo Fisher Scientific配备AS 3000自动进样,分流/不分流进样器的TRACEGC ULTRA气相色谱,以及配备三重四极杆检测器的TSQ QUANTUM XLS MS。
色谱柱为TR-5MS column(30m×0.25mm×0.25um)。载气为高纯氦气,流速1mL/min。丙酮作为洗针液。进样量1uL,分流比50。进样口温度240℃,离子传输管温度270℃。
检测程序:起始柱温为50℃,保持1min;按15℃/min升温至280℃,保持1min;按20℃/min升温至300℃,保持2min。
JDXYZ3发酵产物(图中标记为YZT3)和瓦伦烯标准品(Valencene,Sigma(#75056,CAS:4630-07-3))提取离子流色谱图如图6所示,通过和瓦伦烯标准品进行色谱图保留时间比对,可以确定菌株JDXYZ3可以合成瓦伦烯。此结果表明YZT3基因所编码的蛋白为瓦伦烯合成酶。
2.2细胞色素P450氧化酶、细胞色素P450氧化还原酶功能鉴定
将仅转入含AoCPR基因载体的菌株CK,以及同时包含细胞色素P450氧化酶和细胞色素P450氧化还原酶基因载体的菌株JDXNL1、JDXNL2和JDXNL3分别接种于Sc-Trp液体培养基,30℃,200rpm摇床培养过夜;次日按照初始OD600=0.1转接至50毫升含10g/L葡萄糖和10g/L半乳糖的Sc-Trp液体培养基中,30℃,200rpm摇床培养72小时,收集菌体,加入10mL正己烷萃取菌体。萃取液经GC-MS检测产物,检测仪器与2.1相同,检测程序如下:起始柱温为80℃,保持1min;按8℃/min升温至280℃,保持5min;按20℃/min升温至300℃,保持2min。
CK菌株、JDXNL1菌株(图中标记为CYP6),JDXNL2菌株(图中标记为CYP9)和JDXNL3菌株(图中标记为AoKo)摇瓶发酵产物,以及诺卡醇标准品(Nootkatol使用源叶的诺卡酮由氢化铝锂还原后获得)提取离子流色谱图如图7所示。通过和诺卡醇标准品进行色谱图保留时间比对可以看出,对照菌株CK不能合成获得诺卡醇,菌株JDXNL1,JDXNL2和JDXNL3可以合成诺卡醇。此结果表明了在细胞色素P450氧化还原酶AoCPR和细胞色素P450氧化酶CYP6、CYP9和AoKO的至少一种同时存在时,能够氧化瓦伦烯生成诺卡醇。
2.3醇脱氢酶功能鉴定
将JDXNT1、JDXNT2和JDXNT3菌株分别接种于Sc-Ura-Trp液体培养基,30℃,200rpm摇床培养过夜;次日按照初始OD600=0.1转接至50毫升Sc-Ura-Trp液体培养基(含10g/L葡萄糖,10g/L半乳糖)中,30℃,200rpm摇床培养72小时,收集菌体,加入10mL正己烷萃取菌体。萃取液经GC-MS检测产物,检测条件与2.2相同。
JDXNT1菌株(图中标记为CYP6)、JDXNT2菌株(图中标记为CYP9)和JDXNT3菌株(图中标记为AoKo)摇瓶发酵产物,以及诺卡酮标准品(Nootkatone,源叶B20925)提取离子流色谱图如图8所示,通过和诺卡酮标准品进行色谱图保留时间比对,可以确定菌株JDXNT1,JDXNT2和JDXNT3可以合成诺卡酮。此结果表明了AoADH编码的醇脱氢酶能够将诺卡醇进一步氧化生成终产物诺卡酮。
实施例3发酵罐发酵合成诺卡酮
参照文献(SIEMON T,WANG Z,BIAN G,et al.2020.Semisynthesis of Plant-Derived Englerin A Enabled by Microbe Engineering of Guaia-6,10(14)-diene asBuilding Block.Journal of the American Chemical Society[J],142:2760-2765.)中所记载的发酵罐培养基和发酵方法,对所构建的菌株JDXNT1、JDXNT2、JDXNT3进行分批补料发酵,在发酵过程中添加覆盖剂以实现原位萃取,覆盖剂为肉豆蔻酸异丙酯。发酵过程控制溶氧在20%以上,pH为5,葡萄糖浓度为1-2g/L,乙醇浓度为5g/L以下。最终在7L发酵罐上,菌株JDXNT1中瓦伦烯、诺卡醇、诺卡酮的产量分别达到了500mg/L、30mg/L、1.2g/L;菌株JDXNT2中瓦伦烯、诺卡醇、诺卡酮的产量分别达到了350mg/L、25mg/L、1.5g/L;菌株JDXNT3中瓦伦烯、诺卡醇、诺卡酮的产量分别达到了500mg/L、60mg/L、1.9g/L。
序列表
<110> 武汉合生科技有限公司
<120> 一种生物合成诺卡酮的方法及载体
<130> MTI220210
<160> 53
<170> SIPOSequenceListing 1.0
<210> 1
<211> 550
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetical protein
<400> 1
Met Glu Lys Gln Ser Val Thr Leu Val Arg Asp Asp Gln Gly Ile Val
1 5 10 15
Arg Lys Ser Thr Lys Tyr His Pro Ser Val Trp Gly Asp Tyr Phe Ile
20 25 30
Arg Asn Ser Pro Leu Asn Leu Ser Glu Glu Ser Thr Gln Arg Met Ile
35 40 45
Glu Arg Val Glu Glu Leu Lys Val Gln Val Lys Ser Met Phe Lys Gly
50 55 60
Thr Ser Asp Val Leu Gln Ile Met Asn Leu Ile Asp Ser Ile Gln Leu
65 70 75 80
Leu Arg Leu Glu Tyr His Phe Glu Asn Glu Ile Asp Gly Ala Leu Arg
85 90 95
Leu Ile Tyr Glu Val Asp Asp Lys Asn Tyr Gly Leu Tyr Glu Thr Ser
100 105 110
Leu Arg Phe Arg Leu Leu Arg Gln His Gly Tyr Asn Val Ser Ala Asp
115 120 125
Thr Phe Asn Lys Phe Lys Asp Glu Asn Gly Ser Phe Ile Ser Ile Leu
130 135 140
Asn Gly Asp Ala Lys Gly Leu Leu Ser Leu Tyr Asn Ala Ser Tyr Leu
145 150 155 160
Ala Thr His Gly Glu Thr Ile Leu Asp Glu Ala Asn Asn Tyr Thr Lys
165 170 175
Ser Gln Leu Val Ser Leu Leu Ser Glu Leu Glu Gln Pro Leu Ala Thr
180 185 190
Gln Val Ser Leu Phe Leu Glu Ala Pro Leu Cys Arg Arg Met Lys Ser
195 200 205
Ile Leu Ala Arg Lys Tyr Ile Pro Ile Tyr Glu Lys Glu Ala Met Arg
210 215 220
Ser Asp Asp Ile Leu Glu Leu Ala Lys Leu Asp Phe Asn Leu Leu Gln
225 230 235 240
Ser Leu His Gln Glu Glu Leu Lys Lys Ala Ser Ile Trp Trp Asn Asp
245 250 255
Leu Ala Leu Ala Lys Ser Leu Ser Phe Thr Arg Asp Arg Ile Val Glu
260 265 270
Gly Tyr Tyr Trp Ile Leu Ser Met Cys Tyr Glu Pro Gln Tyr Ser Arg
275 280 285
Ala Arg Val Met Cys Ala Lys Ala Phe Cys Leu Leu Ser Ile Met Asp
290 295 300
Asp Ile Tyr Asp Asn Tyr Ser Ile Leu Glu Glu Arg Arg Leu Leu Thr
305 310 315 320
Glu Ala Ile Lys Arg Trp Asn His Glu Ala Val Asp Ser Leu Pro Glu
325 330 335
Tyr Ile Lys Asp Phe Tyr Leu Lys Leu Leu Lys Ala Phe Glu Glu Phe
340 345 350
Glu Ala Glu Leu Glu Phe Asn Glu Lys Tyr Arg Val Gln Tyr Leu Gln
355 360 365
Asn Glu Phe Lys Ala Ile Ala Ile Ser Tyr Phe Glu Glu Ser Lys Trp
370 375 380
Cys Val Glu Arg Tyr Val Pro Ser Leu Asp Glu His Leu Arg Val Ser
385 390 395 400
Met Ile Thr Ser Gly Cys Ser Met Val Val Cys Ser Met Tyr Leu Gly
405 410 415
Met Gly Glu Val Ala Thr Lys Glu Ile Phe Asp Trp Cys Ser Ser Phe
420 425 430
Pro Lys Ala Met Glu Ala Ser Gly Val Ile Ala Arg Leu Leu Asn Asp
435 440 445
Ile Arg Ser His Glu Thr Glu Gln Gly Arg Asp His Ala Ala Ser Thr
450 455 460
Val Glu Ser Tyr Met Lys Glu His Gly Val Asp Val Lys Val Ala Arg
465 470 475 480
Lys Lys Leu Gln Glu Ile Val Glu Lys Ala Trp Lys Asp Leu Asn Lys
485 490 495
Glu Leu Leu Asn Pro Thr Pro Val Ala Arg Pro Ile Ile Glu Arg Ile
500 505 510
Leu Asn Leu Thr Met Ser Met Glu Asp Ile Tyr Arg Tyr Ile Asp Glu
515 520 525
Tyr Thr Ser Pro Asp Asn Lys Thr Asn Gly Asp Val Ser Leu Val Leu
530 535 540
Val Glu Ser Ile Pro Ile
545 550
<210> 2
<211> 515
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetical protein
<400> 2
Met Ala Glu Val Gln Leu Thr Pro Leu Leu Leu Ile Phe Leu Leu Leu
1 5 10 15
Phe Leu Phe Leu Phe Leu Phe Leu Ile Gly Thr Glu Arg Lys Leu Phe
20 25 30
Ser Asn Ser Arg Gly Ala Arg Leu Pro Pro Gly Pro Ser Lys Leu Pro
35 40 45
Val Ile Gly Asn Leu His Gln Leu Cys Gly Gly Leu Pro His Arg Val
50 55 60
Leu Arg Asp Leu Ala Gly Ile His Gly Pro Leu Met Leu Leu Arg Leu
65 70 75 80
Gly Gln Val Asp Leu Ala Val Val Ser Ser Arg Asn Ala Val Leu Gln
85 90 95
Val Thr Lys Ile His Asp Leu Asn Phe Ala His Arg Pro Gln Leu Leu
100 105 110
Ala Pro Ser Lys Ile Cys Tyr Gly Cys Ser Asp Val Ala Phe Ser Ser
115 120 125
Tyr Gly Asp Tyr Trp Arg Gln Met Arg Arg Ile Cys Ala Thr Asp Leu
130 135 140
Phe Thr Ala Lys Arg Ile Lys Ser Phe Ser Ala Ile Arg Ala Glu Glu
145 150 155 160
Val Ala Lys Leu Leu Arg Asp Ala Glu Ala Ala Ala Ala Ala Gly Gln
165 170 175
Pro Met Asn Leu Asn Tyr Lys Leu Thr Ala Ile Ser Asn Ser Ile Val
180 185 190
Thr Arg Ala Ser Phe Gly Phe Lys Phe Asp Asn Gln His Ala Phe Ile
195 200 205
Glu Thr Met Lys Gly Ala Ile Leu Leu Ala Ser Gly Phe Cys Ala Ala
210 215 220
Asp Leu Phe Pro Ser Leu Lys Phe Val Ala Ser Ile Cys Gly Leu Thr
225 230 235 240
Ser Lys Leu Lys Met Leu His Cys Lys Val Asp Glu Ile Leu Asp Ala
245 250 255
Thr Ile Lys Lys His Gln Ser Ser Lys Ser Glu Gly Asp Glu Glu Asn
260 265 270
Leu Leu Asp Val Leu Leu Arg Leu Lys Asp Asp Gly Thr Leu Glu Ser
275 280 285
Pro Ile Thr Phe Asp Asn Ile Lys Ala Val Ile Leu Asp Val Phe Thr
290 295 300
Gly Gly Thr Glu Thr Ser Ser Thr Ile Val Glu Trp Thr Met Ser Glu
305 310 315 320
Leu Ile Arg Asn Pro Ser Ala Met Ala Lys Ala Gln Gly Glu Val Arg
325 330 335
Glu Ala Met Met Arg Arg Gln Ser Arg Asp Phe Asp Glu Glu Val Ile
340 345 350
Gly Glu Leu His Tyr Leu Lys Leu Val Ile Lys Glu Ser Leu Arg Leu
355 360 365
His Pro Pro Leu Pro Leu Leu Val Pro Arg Val Ala Lys Glu Ala Cys
370 375 380
Gln Val Leu Asp Tyr Glu Val Pro Ala Gly Thr Arg Val Val Ile Asn
385 390 395 400
Ala Trp Ala Leu Gly Arg Asp Pro Leu Tyr Trp Gly Ala Asp Ala Glu
405 410 415
Arg Phe Arg Pro Glu Arg Phe Glu Asp Gly Glu Val Asp Tyr Lys Gly
420 425 430
Gly His Leu Glu Phe Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Pro
435 440 445
Gly Met Arg Phe Gly Met Ala Thr Val Glu Leu Val Leu Ala Gln Leu
450 455 460
Leu Phe His Phe Asp Trp Glu Leu Pro Gly Gly Gly Glu Gly Asn Thr
465 470 475 480
Ala Ala Glu Glu Leu Asp Met Ala Glu Ala Phe Gly Ala Thr Val Val
485 490 495
Arg Lys Glu Glu Leu Arg Leu Val Pro Val Leu Arg Tyr Pro Leu Pro
500 505 510
Pro Ala Ala
515
<210> 3
<211> 511
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetical protein
<400> 3
Met Glu Ala Phe Thr Leu Lys Leu Ile Ile Leu Phe Phe Ala Pro Leu
1 5 10 15
Leu Leu Phe Leu Leu Phe Leu Arg Arg Ser His Gly Arg Arg Arg Gly
20 25 30
His Gly Lys Pro Leu Pro Pro Gly Pro Phe Asn Leu Pro Val Ile Gly
35 40 45
Ser Leu His His Leu Leu Gly Pro Leu Leu His Gln Thr Leu Ala Ser
50 55 60
Met Ser Gln Arg Tyr Gly Pro Ala Ile Leu Leu Lys Phe Gly His Val
65 70 75 80
Thr Thr Leu Val Ile Ser Ser Val Glu Ala Ala Ala Glu Ile Met Lys
85 90 95
Thr His Asp Val Ser Phe Ala Thr Arg Pro Val Ile His Ser Ala Lys
100 105 110
Met Ile Ala Tyr Gly Gly Asp Gly Ile Val Phe Ala Pro Tyr Gly Thr
115 120 125
Ser Trp Arg Glu Leu Arg Lys Met Ser Met Val Glu Leu Leu Ser Ala
130 135 140
Lys Arg Val Gln Tyr Phe Arg Tyr Ile Arg Glu Asp Glu Val Leu Lys
145 150 155 160
Phe Met Arg Ser Ile Thr Leu Ala Pro Gln Ser Val Asn Leu Ser Ser
165 170 175
Ser Phe Lys Val Leu Ala Asn Asp Ile Ala Ala Arg Ala Ile Ile Gly
180 185 190
Ser Lys Cys Gln Tyr Gln Gln Glu Phe Leu Arg Leu Ile Met Lys Gly
195 200 205
Leu Gln Glu Ala Gly Gly Phe Asn Leu Ala Asp Leu Tyr Pro Ser Ser
210 215 220
Pro Leu Leu Gly Leu Leu Ser Arg Leu Leu Ser Ser Lys Met Gln Gln
225 230 235 240
Leu His Leu Glu Val Asp Ala Ile Leu Asp Gly Ile Ile Lys Glu His
245 250 255
Arg Gln Arg Ser Lys Thr Phe Ala Glu Gln Ser Ala Glu Glu Asp Met
260 265 270
Val Asp Thr Leu Leu Lys Val Gln Ala Glu Gly Ser Leu Pro Phe Pro
275 280 285
Leu Thr Asp Leu Ser Ile Lys Ala Met Ile Phe Asp Leu Phe Ala Ala
290 295 300
Ala Ser Glu Thr Thr Ser Thr Thr Met Glu Trp Ala Met Ser Glu Leu
305 310 315 320
Met Lys Asn Pro Val Ala Met Lys Gln Ala Gln Glu Glu Val Arg Arg
325 330 335
Val Val Gly Ser Lys Gly Lys Val Thr Glu Asp His Val Gly Glu Met
340 345 350
Ser Tyr Leu Lys Gln Ala Val Arg Glu Ser Leu Arg Leu His Pro Pro
355 360 365
Leu Pro Leu Leu Leu Pro Arg Glu Cys Gln Glu Ala Met Glu Val Met
370 375 380
Gly Tyr Trp Ile Pro Ala Lys Thr Arg Val Leu Val Asn Ala Trp Ala
385 390 395 400
Leu Ala Arg Asp Pro Arg Tyr Trp Asp Asp Ala Thr Glu Phe Lys Pro
405 410 415
Glu Arg Phe Ala Ala Gly Gly Arg Ser Cys Gly Val Asp Met Lys Gly
420 425 430
Thr Asn Leu Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Met Cys Pro
435 440 445
Gly Ser Thr Phe Gly Met Ala Ser Val Glu Leu Val Leu Ala Cys Leu
450 455 460
Leu Tyr Tyr Phe Asp Trp Glu Met Pro Val Pro Gly Asp Gly Gly Ala
465 470 475 480
Ala Lys Lys Pro Thr Glu Leu Asp Met Glu Glu Gln Phe Ile Leu Ala
485 490 495
Cys His Lys Lys Thr Gln Leu Arg Leu Arg Ala Ile Pro Arg Ile
500 505 510
<210> 4
<211> 500
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetical protein
<400> 4
Met Ile Ser Thr Ala Phe Ala Ser Val Ala Ala Ala Ile Phe Thr Val
1 5 10 15
Phe Ile Leu Ile Arg Phe Arg Arg Arg Ser Arg Val Ser Asn Leu Pro
20 25 30
Pro Ala Val Pro Gly Leu Pro Leu Ile Gly Asn Leu Leu Gln Leu Lys
35 40 45
Asp Lys Lys Pro His Gln Thr Phe Thr Lys Trp Ala Gln Ile Tyr Gly
50 55 60
Pro Ile Tyr Thr Ile Lys Thr Gly Ala Ser Thr Met Val Val Leu Asn
65 70 75 80
Ser Thr Glu Val Ala Lys Glu Ala Met Val Ala Lys Tyr Ser Ser Ile
85 90 95
Ser Asn Arg Lys Leu Ser Lys Ala Leu Thr Leu Leu Thr Ser Asn Lys
100 105 110
Arg Met Val Ala Met Ser Asp Tyr Gly Glu Phe His Lys Met Val Lys
115 120 125
Arg Tyr Ile Leu Thr Ser Leu Leu Gly Ala Asn Ala Gln Lys Gln Asn
130 135 140
Tyr Gly Ile Arg Glu Thr Leu Ile Asn Asn Val Val Lys Phe Leu Tyr
145 150 155 160
Ser Asp Leu Ser Asp Asn Pro Asn Asp Ala Val Asn Leu Arg Lys Ser
165 170 175
Phe Gln Pro Glu Leu Phe Arg Leu Ala Met Lys Gln Ala Leu Asn Leu
180 185 190
Glu Pro Glu Ser Ile Tyr Val Glu Glu Leu Gly Arg Glu Leu Ser Lys
195 200 205
Glu Glu Ile Phe Asn Val Leu Val Val Asp Pro Met Met Gly Ala Ile
210 215 220
Glu Val Asp Trp Arg Asp Phe Phe Pro Tyr Leu Arg Trp Val Pro Asn
225 230 235 240
Arg Ser Phe Glu Asn Lys Leu Lys Arg Met Leu Met Arg Arg Ala Ala
245 250 255
Val Met Gln Val Leu Ile Thr Lys Arg Lys Asn Ser Lys Gln Ser Lys
260 265 270
Glu Glu Ile Ser Cys Tyr Leu Asp Phe Leu Leu Ser Gln Gly Thr Leu
275 280 285
Thr Asp Glu Glu Ile Ile Ser Leu Val Trp Glu Ala Val Ile Glu Ser
290 295 300
Ser Asp Thr Thr Leu Val Thr Thr Glu Trp Ala Met Phe Glu Leu Ser
305 310 315 320
Lys Asn Pro Asn Lys Gln Glu Arg Leu Tyr Gln Glu Ile Gln Gln Val
325 330 335
Cys Gly Ser Glu Asn Val Thr Asp Glu His Leu Ser Arg Met Pro Tyr
340 345 350
Leu Asn Cys Val Phe His Glu Thr Leu Arg Arg His Ser Pro Val Pro
355 360 365
Ile Val Pro Leu Arg Tyr Ala His Glu Asp Thr Gln Ile Gly Gly Phe
370 375 380
Asn Ile Leu Ala Gly Ser Glu Ile Ala Ile Asn Leu Tyr Gly Cys Asn
385 390 395 400
Met Asp Lys Met Gln Trp Asp Glu Pro Asn Glu Trp Lys Pro Glu Arg
405 410 415
Phe Ile Asp Ser Lys Tyr Glu Gln Met Asp Ser Tyr Lys Thr Met Ala
420 425 430
Phe Gly Ala Gly Lys Arg Ile Cys Ala Gly Ser Leu Gln Ala Ser Ser
435 440 445
Ile Ala Cys Thr Ala Ile Gly Arg Leu Val Gln Glu Phe Glu Trp Arg
450 455 460
Leu Lys Glu Gly Glu Glu Ala Asn Val Val Thr Val Gln Leu Thr Asn
465 470 475 480
Leu Lys Leu Glu Pro Leu Leu Ala Tyr Ile Lys Pro Arg Ser Thr Asn
485 490 495
Asp Ala Cys Leu
500
<210> 5
<211> 700
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetical protein
<400> 5
Met Gln Thr Asp Ser Gly Lys Ala Ser Pro Leu Asp Leu Leu Ser Ala
1 5 10 15
Val Val Ala Ser Leu Ser Gly Gly Asp Gly Leu Asp Leu Gly Ala Gly
20 25 30
Asn Pro Ser Val Glu Tyr Arg Arg Leu Ile Ala Val Leu Ser Thr Val
35 40 45
Val Ala Val Leu Val Gly Cys Ala Ala Ile Phe Phe Phe Arg Arg Ser
50 55 60
Ser Gly Lys Lys Pro Ala Glu Pro Pro Lys Pro Leu Ala Val Lys Thr
65 70 75 80
Gln Leu Asp Ala Glu Glu Asp Gln Gly Lys Lys Lys Val Thr Val Phe
85 90 95
Phe Gly Thr Gln Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Ala
100 105 110
Glu Glu Ala Lys Ala Arg Tyr Pro Asn Ala Ile Phe Lys Val Val Asp
115 120 125
Ile Asp Glu Tyr Ala Thr Glu Asp Asp Glu Tyr Glu Glu Asn Leu Lys
130 135 140
Lys Glu Ser Leu Val Leu Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu
145 150 155 160
Pro Thr Asp Asn Ala Ala Arg Phe Tyr Lys Trp Phe Thr Glu Gly Lys
165 170 175
Glu Arg Val Thr Trp Leu Glu Asn Leu Gln Phe Ser Val Phe Gly Leu
180 185 190
Gly Asn Arg Gln Tyr Glu His Phe Asn Lys Val Ala Lys Val Val Asp
195 200 205
Glu Leu Leu Gln Glu Gln Gly Ala Lys Arg Ile Val Gln Val Gly Leu
210 215 220
Gly Asp Asp Asp Gln Cys Ile Glu Asp Asp Phe Ser Ala Trp Arg Glu
225 230 235 240
Leu Leu Trp Pro Glu Leu Asp Lys Leu Leu Gln Asp Glu Asn Glu Thr
245 250 255
Gly Ala Ser Thr Pro Tyr Thr Ala Ala Val Pro Glu Tyr Arg Val Val
260 265 270
Phe Val Lys Pro Glu Glu Val Pro Tyr Leu Asp Lys Ser Leu Ser Phe
275 280 285
Ala Asn Gly His Ala Ile His Asp Ile Gln His Pro Cys Arg Ala Asn
290 295 300
Val Ala Val Arg Arg Glu Leu His Thr Ser Ala Ser Asp Arg Ser Cys
305 310 315 320
Ile His Leu Glu Phe Asp Ile Asp Gly Thr Gly Leu Val Tyr Gly Thr
325 330 335
Gly Asp His Val Gly Val Phe Ala Asp Asn Cys Ser Glu Ile Val Glu
340 345 350
Glu Ala Ala Lys Leu Leu Gly Tyr Ser Pro Asp Thr Tyr Phe Ser Ile
355 360 365
His Thr Asp Lys Glu Asp Gly Thr Pro Leu Gly Gly Ser Leu Ser Pro
370 375 380
Pro Phe Pro Ser Pro Cys Thr Leu Lys Thr Ala Leu Thr Arg Tyr Ser
385 390 395 400
Asp Val Leu Asn Ser Pro Lys Lys Ser Ala Leu Leu Ala Leu Ala Ala
405 410 415
His Ala Thr Asp Leu Ser Asp Ala Glu Arg Leu Lys Phe Leu Ala Ser
420 425 430
Pro Ile Gly Lys Asp Glu Tyr Ser Gln Trp Ile Val Ala Asn Gln Arg
435 440 445
Ser Leu Leu Glu Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu
450 455 460
Gly Val Phe Phe Ala Ala Ile Ala Pro Arg Leu Gln Pro Arg Tyr Tyr
465 470 475 480
Ser Ile Ser Ser Ser Pro Arg Met Ala Pro Ser Arg Ile His Val Thr
485 490 495
Cys Ala Leu Val Tyr Glu Lys Thr Pro Thr Gly Arg Ile His Lys Gly
500 505 510
Val Cys Ser Thr Trp Met Lys Asn Ser Ile Ser Leu Glu Glu Asn Gln
515 520 525
Glu Cys Ser Trp Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu
530 535 540
Pro Val Asp Pro Ser Val Pro Val Ile Met Ile Gly Pro Gly Thr Gly
545 550 555 560
Leu Ala Pro Phe Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Lys Lys
565 570 575
Glu Gly Leu Glu Leu Gly His Ser Ile Leu Phe Phe Gly Cys Arg Asn
580 585 590
Arg Lys Met Asp Phe Ile Tyr Glu Asp Glu Leu Asn Asn Phe Val Glu
595 600 605
Thr Gly Val Leu Ser Glu Phe Ile Val Ala Phe Ser Arg Glu Gly Pro
610 615 620
Thr Lys Gln Tyr Val Gln His Lys Met Thr Glu Lys Ala Ser Glu Leu
625 630 635 640
Trp Asn Ile Ile Ser Gln Gly Gly Tyr Val Tyr Val Cys Gly Asp Ala
645 650 655
Lys Gly Met Ala Arg Asp Val His Arg Val Leu His Thr Ile Val Gln
660 665 670
Glu Gln Gly Gly Met Asp Ser Ser Lys Thr Glu Ser Phe Val Lys Ser
675 680 685
Leu Gln Met Glu Gly Arg Tyr Ser Arg Asp Val Trp
690 695 700
<210> 6
<211> 267
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetical protein
<400> 6
Met Ala Ser Ser Phe Val Leu Ser Ser Val Ala Lys Arg Leu Glu Gly
1 5 10 15
Lys Val Thr Leu Ile Thr Gly Gly Ala Ser Gly Leu Gly Glu Cys Thr
20 25 30
Ala Lys Leu Phe Ala Arg Leu Gly Ala Arg Val Val Val Ala Asp Ile
35 40 45
Gln Asp Asp Lys Gly Arg Ala Leu Cys Asp Ser Leu Gly Pro Asp Thr
50 55 60
Ala Ser Tyr Val His Cys Asp Val Thr Lys Glu Pro Asp Val Ala Ser
65 70 75 80
Ala Val Asp Ala Ala Val Ala Arg His Gly Lys Leu Asp Val Met Phe
85 90 95
Ser Asn Ala Gly Val Gly Glu Val Leu Gln Lys Ser Leu Pro Asp Cys
100 105 110
Glu Val Ala Asp Phe Gln Arg Leu Met Ser Val Asn Val Thr Gly Val
115 120 125
Phe Leu Ala Thr Lys His Ala Ala Arg Val Met Thr Pro Ala Arg Arg
130 135 140
Gly Ser Ile Val Ile Thr Gly Ser Thr Thr Ser Thr Ile Gly Gly Leu
145 150 155 160
Gly Pro His Ala Tyr Thr Cys Ser Lys His Ala Val Val Gly Leu Met
165 170 175
Arg Ser Ala Ala Val Glu Leu Gly Arg His Gly Val Arg Val Asn Cys
180 185 190
Val Ser Pro His Gly Met Ala Thr Pro Met Thr Met Ala Ala Phe Asp
195 200 205
Leu Asp Lys Glu Gly Val Glu Ala Met Phe Glu Arg Ser Ala Asn Leu
210 215 220
Lys Gly Val Arg Leu Glu Ala Glu Asp Val Ala Glu Ala Val Ala Tyr
225 230 235 240
Leu Ala Gly Asp Glu Ser Arg Tyr Val Ser Gly Val Asn Leu Leu Val
245 250 255
Asp Gly Gly Phe Thr Ile Ala Lys Gly Leu Ala
260 265
<210> 7
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 7
atggagaaac aatcagtaac tctcgtgcgt gatgaccaag ggatagttcg taagtcgaca 60
aaatatcatc caagcgtttg gggtgattat ttcatccgaa actcgcctct caatctatca 120
gaggagtcca ctcaaaggat gatagagaga gtagaagaat taaaggtgca agtaaagagc 180
atgttcaagg gcaccagtga cgtattgcag attatgaact tgattgattc aattcaactt 240
ctaagactag aatatcattt tgagaatgaa atagatggtg cactaagatt gatctatgag 300
gtcgacgaca agaactatgg actttatgaa acttctctta gatttcgatt gcttaggcaa 360
catggatata atgtttctgc agataccttt aacaagttca aagatgagaa tggaagcttt 420
atatctatct tgaatggaga tgcaaaggga ttactaagct tatataatgc atcttacctt 480
gcaacgcatg gagagactat acttgatgaa gccaataatt atacaaagtc tcagctagta 540
tccttattga gtgaacttga acaaccttta gcgacacaag tatcactttt ccttgaagcg 600
cccctatgtc gaagaatgaa aagtatcttg gcaagaaaat atatacctat ttatgaaaag 660
gaagcaatgc gaagtgatga catattagaa cttgcaaaat tggatttcaa tctactgcaa 720
tctcttcatc aagaggagtt gaagaaagct tcgatatggt ggaatgattt agcccttgct 780
aaatctctaa gttttactcg tgatcgaatc gtggaaggtt attattggat tcttagtatg 840
tgttatgagc ctcaatattc tcgtgcacga gtgatgtgcg ccaaagcatt ttgtcttcta 900
tcaattatgg atgatattta tgacaactat agcatattgg aagagcgcag attattaact 960
gaggcaataa agaggtggaa tcatgaagct gttgattctt taccagaata tataaaagat 1020
ttttatctga agctattaaa ggcttttgaa gaatttgaag cggaattgga atttaatgag 1080
aagtatcgtg tgcaatacct tcaaaatgaa tttaaagcta tagccatatc atattttgaa 1140
gaatccaagt ggtgtgtgga aagatatgtg ccgtcactcg acgaacactt gcgtgtttct 1200
atgatcacct ctggatgttc tatggtcgtt tgttctatgt atcttggtat gggagaagtg 1260
gcaacaaaag agattttcga ttggtgttct agttttccca aggcaatgga agcaagcggt 1320
gtaattgcta gactcctcaa tgatataaga tcacacgaga ctgagcaagg gagagaccat 1380
gctgcctcta cagtggaaag ttacatgaaa gagcacggcg tagatgtaaa agttgcacgc 1440
aagaagctac aagagatagt ggagaaagcg tggaaggatc taaataagga acttctcaac 1500
cccacaccag tagctcgacc tataattgaa agaatactca accttacaat gtcaatggaa 1560
gacatatata ggtacattga cgagtacacc agtcctgata ataagacgaa cggtgatgtc 1620
tccttggtgt tggttgaatc tattcctata tga 1653
<210> 8
<211> 1548
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 8
atggcggagg tccaactcac tcccctcctc ttaatcttcc tcctcctctt cctgttcctc 60
ttcctcttcc tcatcggcac agagaggaag cttttctcca actccagagg agctcgcctc 120
ccgcccggtc cgtcgaagct acccgtcatt ggcaacctgc accaactttg cggcggccta 180
ccccaccgtg tcctgcgcga cctcgccggc atccacggcc ccctcatgct cctccgcctt 240
ggccaggtcg acctcgccgt cgtatcctcc cgaaatgccg tcctgcaggt caccaagatc 300
cacgacctca acttcgccca tcgcccccag ctcctggccc cttccaaaat ctgctacggc 360
tgctccgacg tcgccttctc ttcctacgga gactactggc gccagatgcg caggatctgc 420
gcaaccgatc tcttcaccgc caagcgcatc aagtcattct ctgccatccg cgcagaagag 480
gtcgccaagc tcctccgcga cgccgaggcg gcagcggctg ccggccagcc gatgaacttg 540
aactacaagc tcacggcgat ctcgaacagc atcgtgaccc gcgcctcttt cggtttcaaa 600
ttcgataacc agcacgcgtt catcgagacc atgaaggggg cgatactgct cgcgtcgggg 660
ttttgcgccg cggatctgtt cccgtctttg aagttcgtgg cctcgatctg cggcctcacc 720
tccaagctga agatgcttca ctgcaaagtg gatgaaattc tcgacgcgac catcaaaaag 780
caccaatcga gcaagagcga aggggacgaa gagaatctcc tcgacgttct acttcgtcta 840
aaagacgacg gaaccctgga atccccaatc acattcgaca acatcaaagc tgtgattttg 900
gacgtcttca cgggagggac ggagacctcg tcgacgattg tagaatggac gatgtcggag 960
ctcatcagga accctagcgc gatggcgaag gcacaagggg aagtgcgaga agcgatgatg 1020
cgaaggcaaa gcagggattt cgacgaggaa gtcatcggcg agctccatta cctgaagcta 1080
gtgatcaagg agagtctgag gctacacccg ccgctaccac tgttggtgcc gagggtggcg 1140
aaggaggcgt gccaggtgct ggactacgag gtgccggcgg gcacgagggt ggtgatcaac 1200
gcctgggccc tagggaggga cccgctctac tggggcgccg acgccgagcg gttccggccc 1260
gagaggttcg aggacggtga ggtggactac aaggggggcc acctggagtt cattccattc 1320
ggcgccggga ggaggatatg ccccgggatg agattcggga tggcgacggt ggaactcgta 1380
ttggcgcagc tgctgttcca cttcgactgg gagctaccag gaggaggaga agggaatacg 1440
gcggcggagg aactggacat ggcggaggca ttcggggcga ccgtggtgag gaaggaggag 1500
ctccgcctgg ttccggtgct tcgatatccc ctgccgcccg ctgcttag 1548
<210> 9
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 9
atggaagctt ttaccttgaa gcttatcatt ctcttcttcg cccccctcct cctcttcctc 60
ctcttcctca ggcgcagcca tggccgacgg cggggccacg gcaagcctct ccctcctggc 120
ccattcaacc tccccgtcat cggcagcctg caccacctcc tcggcccgtt gctgcaccag 180
acgctcgcgt ctatgtccca gcgatacggc cccgccatcc tcctcaagtt cggccatgtc 240
accaccctcg tcatctcctc cgttgaggcc gccgcagaga tcatgaagac ccatgacgtc 300
agcttcgcca cgcgtcccgt catccattca gccaagatga tcgcctacgg cggcgacggt 360
attgtcttcg cgccatacgg caccagctgg cgcgagctcc gcaaaatgag catggtggag 420
ctcctcagtg ccaagcgcgt ccagtacttc cgctatatcc gcgaggatga ggtgcttaaa 480
tttatgcgct ccattacgtt ggcaccccaa agcgtgaatc ttagtagcag ttttaaggtg 540
ctcgcgaacg acatcgcggc gagggccatc attgggagca agtgccagta tcagcaggag 600
ttcctgcggc tgataatgaa ggggctccaa gaagcggggg gattcaactt ggccgacttg 660
tacccgtcgt cgccgctcct cgggttgctc agccgcttgt tgtcttccaa gatgcagcag 720
ctgcacctcg aggtggatgc catcttggat ggcatcatca aggagcacag acagaggagt 780
aaaacgttcg cagagcagag tgcagaggag gacatggtgg ataccctgct caaggttcaa 840
gcggaaggca gccttccgtt ccccctcacg gacttgtcca tcaaagctat gatttttgat 900
ctttttgcag cggcgagcga gaccacctct acgaccatgg aatgggcgat gtcggagctg 960
atgaagaatc cggtggcgat gaagcaggcg caggaggaag tgaggcgggt ggtgggaagc 1020
aaggggaaag tcaccgaaga tcacgtcggc gagatgagtt acctcaagca ggcggtaagg 1080
gagtcgctga ggcttcaccc tcccctgcct ctgttgctgc cgcgggagtg ccaggaagcg 1140
atggaggtga tgggctactg gattccggcg aagacgaggg tgctggtgaa cgcgtgggcg 1200
ctggcgagag acccaaggta ttgggacgac gccacggagt tcaagccaga gaggttcgcc 1260
gctggtggga ggagctgcgg ggtggacatg aaaggcacca acttggagct cataccgttc 1320
ggggcgggta gaaggatgtg ccctggtagc acgttcggaa tggcgagcgt ggagctggtg 1380
cttgcttgcc ttctctatta ctttgactgg gagatgccgg tcccgggcga cggaggagcg 1440
gcgaagaaac cgacggagtt ggacatggaa gaacagttca tactggcgtg tcataagaag 1500
acgcagcttc gcttgcgcgc gatccctcgt atatag 1536
<210> 10
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 10
atgatttcca cggccttcgc aagtgtcgct gccgccatct tcacggtttt catcctcatc 60
aggttccgac gccgcagtcg cgtttccaat cttccgccgg ctgtccccgg gcttcccttg 120
attgggaatt tgctccagct gaaggacaag aaacctcacc agacattcac gaaatgggcg 180
cagatatatg gcccgattta taccatcaag acgggcgctt ccactatggt agtcctgaat 240
tctactgagg ttgccaaaga ggcaatggtg gctaagtatt catccatctc aaatcggaaa 300
ttgtcaaagg cattgacatt gctcacttca aataaacgta tggttgctat gagtgactat 360
ggagagttcc acaaaatggt gaaacggtac atattgacta gtttgttagg tgcaaatgct 420
cagaagcaaa actatggtat cagggagacg ttgattaata atgtcgtcaa atttctatat 480
tcggatttaa gcgataaccc taatgatgca gtaaacctca gaaagtcatt tcaacctgag 540
ttattccgat tagccatgaa gcaagctttg aacctggaac ctgaatccat ttatgtagag 600
gaacttggga gggaactttc aaaggaagaa atattcaatg tgttggtggt agaccctatg 660
atgggcgcca ttgaggtgga ctggagggac tttttccctt acttgagatg ggtccctaat 720
cgaagctttg aaaataagct aaagagaatg ctcatgcgca gggcggcagt gatgcaggtt 780
ctgattacaa aaagaaagaa cagtaaacaa tccaaagagg agataagctg ctatttggac 840
tttctgctat cccagggcac tttgactgac gaagagataa tatcgttagt atgggaagcg 900
gtaattgagt catcggatac aactttagtc acaacagaat gggctatgtt tgagctatct 960
aagaatccaa ataaacagga acgtctttac caagaaattc aacaagtatg tggatctgaa 1020
aacgtcaccg atgagcattt gtcacggatg ccctacttga actgtgtgtt ccatgagacc 1080
ctaagacgtc attcccctgt tcctatagta cctctcaggt atgcccatga agatacccag 1140
atcggaggat tcaacatcct tgcggggtct gagattgcca tcaatcttta tggatgcaat 1200
atggacaaga tgcagtggga tgaacctaat gaatggaagc ctgagagatt catagacagc 1260
aaatatgagc aaatggactc gtataagact atggcctttg gagctggaaa gaggatttgt 1320
gccggatctc tgcaggcatc gtcgattgca tgcactgcca tcgggcgttt agtgcaagag 1380
ttcgagtgga ggctgaagga aggagaagag gctaatgtcg tcactgttca gctcacaaac 1440
cttaagcttg aacctctgct tgcatacata aagcccagaa gcaccaacga tgcatgcctt 1500
tga 1503
<210> 11
<211> 2103
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 11
atgcagacgg attccgggaa ggcttcgccg ctcgatctct tgtcggctgt cgtcgcctcg 60
ctatccggtg gagatgggct cgatttaggc gccgggaatc cctcggtgga gtaccggcgg 120
ctgatcgccg tcctgagtac tgtcgtcgcc gtgctagttg gctgcgcggc gatattcttc 180
ttccggagat cgagcggaaa gaagccggcc gagccgccga agccgctggc ggttaagact 240
cagctggatg cggaggagga ccaagggaag aagaaggtca ccgtcttctt cggcacgcag 300
accgggacgg ccgaggggtt tgcgaaggcg ctggctgagg aggccaaggc acggtaccct 360
aatgccatat ttaaagtcgt ggatatcgac gaatatgcta ctgaggacga tgagtacgag 420
gagaacctga aaaaggagag cttggttttg ttcttcttgg ctacgtatgg agatggcgag 480
cctactgata atgctgcccg gttctacaaa tggtttacag aggggaaaga gagagtaacc 540
tggttggaaa atcttcaatt ttctgtgttt ggtttgggca atcggcaata tgaacatttt 600
aataaggttg ctaaggtagt tgatgaactg cttcaagagc aaggtgccaa acgcattgtc 660
caagtgggat tgggagatga tgatcagtgt attgaggatg acttctctgc atggagggaa 720
cttctttggc cggagttgga taagttgctt caggacgaaa atgagacagg tgcatctact 780
ccttatacag ctgctgttcc tgaataccgg gttgtatttg tcaagccaga agaagttcca 840
tatctggata aaagtttgag ttttgcaaat ggccatgcta ttcatgacat acaacatcca 900
tgcagggcta atgtggctgt gagacgagag cttcatactt cagcttcaga ccgatcctgc 960
atccacttgg agtttgacat agatggcact ggccttgtgt acggaacagg agaccatgtt 1020
ggtgtattcg cggacaactg ttctgagatt gtagaggagg ctgcaaagtt gttaggttat 1080
tcacctgaca catatttctc tattcatact gacaaggagg atggcacgcc acttggaggc 1140
tctttgtcac ctcctttccc atctccatgc actctcaaaa ccgctcttac tcgatactct 1200
gatgttctaa attcacctaa aaagagtgca ttacttgccc ttgccgcaca cgcaacagat 1260
cttagtgatg ctgagcgact taaatttttg gcttctccta ttggaaagga tgaatattct 1320
caatggattg ttgctaatca gaggagtctt cttgaagtca tggccgaatt tccctctgca 1380
aagcctcctc taggagtctt ctttgccgca atagccccac gtttgcagcc aagatattat 1440
tcaatttcct cttctccgag gatggcacct agtagaattc atgtgacttg tgcattagtt 1500
tatgaaaaga caccaactgg caggattcat aaaggggttt gttccacctg gatgaagaat 1560
tccatttcgc tcgaagagaa ccaagaatgc agctgggctc ctatttttgt gaggcagtct 1620
aactttaaac tccctgttga tccttcggta cctgtcatca tgattggacc gggcacaggg 1680
ttggcacctt tcaggggctt cttacaggaa aggttggcat tgaaaaagga agggttggaa 1740
cttggtcatt ctattctctt cttcggatgc agaaaccgca aaatggactt catctacgag 1800
gatgagttga acaactttgt cgaaacaggc gtgctttccg agtttattgt ggccttctcc 1860
cgtgagggtc caactaaaca atatgtgcaa cacaaaatga ccgagaaagc atcagaactt 1920
tggaatatca tctcccaagg tggatatgta tacgtgtgtg gagatgctaa gggcatggct 1980
agagatgttc acagagttct tcatactatt gttcaagagc agggaggtat ggatagctcc 2040
aaaacagaaa gcttcgtcaa gagcttgcaa atggaaggga gatattcaag ggatgtatgg 2100
tga 2103
<210> 12
<211> 804
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 12
atggcaagct cctttgttct ctcctctgta gcaaaaaggc tcgaagggaa ggtgacattg 60
atcaccggcg gggcgagcgg gctcggcgag tgcaccgcca agctgttcgc ccgcctcggc 120
gcccgagtag tcgtcgcaga catccaagac gacaaaggcc gcgccctgtg cgactcactc 180
ggccccgaca ccgcctccta cgtccactgc gacgtcacca aggagcccga cgtggcaagc 240
gccgtcgacg ccgccgtcgc ccgacacggg aagctcgacg tcatgttcag caacgccgga 300
gtcggggaag tgttgcagaa gtcgttgccc gactgcgagg tggctgactt ccagcgattg 360
atgtcggtga acgtgacggg ggtgttcctg gccaccaagc acgcggcgcg ggtgatgacg 420
ccggcgaggc gggggagcat cgtgatcacg gggagcacca cgtcgactat tgggggacta 480
gggccgcacg catacacgtg ctcaaagcac gcggtggtgg ggctaatgag gagcgcggcg 540
gtcgagctgg gcaggcacgg tgttcgggtc aactgcgtgt cgccgcacgg gatggcaacg 600
ccgatgacga tggcagcgtt tgacttagac aaggaggggg ttgaggccat gtttgagagg 660
tcggccaacc tgaaaggtgt gaggctcgaa gcggaggacg tggcggaggc agtggcgtac 720
ctcgccggcg acgagtccag gtatgtgagc ggcgtcaatc tgctggtgga cggaggcttc 780
accattgcca agggattggc gtag 804
<210> 13
<211> 1653
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 13
atggaaaagc aatctgttac attggttaga gatgatcaag gtattgttag aaaatctaca 60
aagtaccatc catctgtttg gggtgattat tttattagaa actctccatt gaacctgtct 120
gaagaatcta ctcaaagaat gattgaaaga gttgaagaat tgaaggttca agttaaatct 180
atgttcaagg gtacatctga tgttttgcaa attatgaatc tgatcgattc tatccaattg 240
ttaagattag agtaccattt cgaaaacgaa attgatggtg ctttaagatt aatctacgaa 300
gttgatgata agaactacgg tttgtatgaa acatctttaa gattcagact gttgagacaa 360
catggttata atgtttctgc tgatactttt aacaagttca aagatgaaaa cggttctttt 420
atctctatct taaacggtga tgctaaaggt ttgttatctt tatataacgc ttcctatctg 480
gctacacatg gtgaaacaat tttagatgaa gctaataact acaccaagtc tcaattagtt 540
tctttgttgt ctgaattgga acaaccatta gctactcaag tttctttatt tttggaggct 600
ccattatgta gaagaatgaa atctattctg gctagaaaat acatcccaat ttatgaaaag 660
gaggctatga gatctgatga tattttggaa ttggctaaat tggatttcaa cttattgcaa 720
tctctgcatc aagaagaatt aaaaaaggct tctatctggt ggaatgattt ggctttagct 780
aaatctttgt cttttacaag agacagaatc gttgaaggtt attattggat tttgtctatg 840
tgttacgagc cacaatattc tagagctaga gttatgtgtg ctaaagcttt ttgtttattg 900
tctatcatgg acgatatcta tgataattac tctatcttgg aggaaagaag attgttaaca 960
gaagctatta agagatggaa tcatgaagct gttgattctt tgccagaata tattaaagac 1020
ttctacttga agctgttgaa agcttttgaa gaatttgaag ctgaattgga attcaatgaa 1080
aagtatagag tccaatactt gcaaaatgaa ttcaaagcta tcgctatttc ttactttgaa 1140
gaatctaagt ggtgtgttga aagatatgtt ccatctttgg atgaacattt gagagtttct 1200
atgattactt ctggttgttc tatggttgtt tgttctatgt atttgggtat gggtgaagtt 1260
gctacaaaag aaatttttga ttggtgttct tccttcccaa aagctatgga agcttctggt 1320
gttattgcta gattattaaa tgacatcagg tcacatgaaa cagaacaagg tagagatcat 1380
gctgcttcta cagttgaatc ttatatgaaa gaacacggtg ttgatgttaa agttgctaga 1440
aaaaaactgc aagaaatcgt tgaaaaggct tggaaagatt tgaataaaga attgttgaac 1500
cccacaccag ttgctagacc aattattgaa agaattttga acctgactat gtctatggaa 1560
gatatttata gatacatcga cgaatacaca tctccagata ataaaacaaa cggtgatgtt 1620
tctttggttt tggttgaatc tatcccaatt taa 1653
<210> 14
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 14
actaaaggga acaaaagctg gagctctagt agtttaaaca taacgagaac acacagggg 59
<210> 15
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 15
cattaaagta acttaaggag ttaaatttaa gcaaggattt tcttaacttc ttc 53
<210> 16
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 16
gaagttaaga aaatccttgc ttaaatttaa ctccttaagt tactttaatg atttag 56
<210> 17
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 17
tcgaaggctt taatttgcgc gaaaagccaa ttagtgtgat a 41
<210> 18
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 18
tagtatcaca ctaattggct tttcgcgcaa attaaagcct tcgagc 46
<210> 19
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 19
gggacgcgcc ctgtagcggc tgaggtctca acaggcccct tttcctttg 49
<210> 20
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 20
catgatatcg acaaaggaaa aggggcctgt tgagacctca gccgctacag ggcgc 55
<210> 21
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 21
gaatttttga aaattcaata taaatgtgag accaccatga ttacgccaag cg 52
<210> 22
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 22
taatcatggt ggtctcacat ttatattgaa ttttcaaaaa ttcttacttt ttttttg 57
<210> 23
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 23
atctctctct cctaatttct ttttctgaag ccattatagt tttttctcct tgacgttaaa 60
gt 62
<210> 24
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 24
ttaacgtcaa ggagaaaaaa ctataatggc ttcagaaaaa gaaattagga 50
<210> 25
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 25
atgtacaaat atcataaaaa aagagaatct ttttaaaaaa aatccttgga ctagtcacg 59
<210> 26
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 26
actagtccaa ggattttttt taaaaagatt ctcttttttt atgatatttg tacataaac 59
<210> 27
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 27
gcgccattcg ccattcaggc tgcgcaactg ttgtttaaac gacaacgacc aagctcaca 59
<210> 28
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 28
gatgtgagct tggtcgttgt cgtttaaaca acagttgcgc agcctgaatg 50
<210> 29
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 29
tcaacagtat agaaccgtgg atgatgtggt ttctacagga tctgacatta ttattgttg 59
<210> 30
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 30
atagtcctct tccaacaata ataatgtcag atcctgtaga aaccacatca tccacggtt 59
<210> 31
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 31
agggcttacc atctggcccc agtgctgcaa tgataccgcg cgacccacgc tcaccggct 59
<210> 32
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 32
tgataaatct ggagccggtg agcgtgggtc gcgcggtatc attgcagcac tggggccag 59
<210> 33
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 33
cgatagcgcc cctgtgtgtt ctcgttatgt ttaaactact agagctccag cttttgttc 59
<210> 34
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 34
gtccatccaa aaaaaaagta agaatttttg aaaattcaat ataaatggag aaacaatcag 60
taactct 67
<210> 35
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 35
atcgacaaag gaaaaggggc ctgttcatat aggaatagat tcaaccaa 48
<210> 36
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 36
gtccatccaa aaaaaaagta agaatttttg aaaattcaat ataaatggaa aagcaatctg 60
ttacatt 67
<210> 37
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 37
atcgacaaag gaaaaggggc ctgtttaaat tgggatagat tcaaccaaa 49
<210> 38
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 38
actttaacgt caaggagaaa aaactataat ggaaaagcaa tctgttacat tg 52
<210> 39
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 39
gatctatcga tttcaattca attcaattta aattgggata gattcaacca aaac 54
<210> 40
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 40
tttggttgaa tctatcccaa tttaaattga attgaattga aatcgataga tc 52
<210> 41
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 41
aatgtaacag attgcttttc cattatagtt ttttctcctt gacgttaaag t 51
<210> 42
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 42
gagaaaaaac cccggatcca tggcggaggt ccaactcac 39
<210> 43
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 43
ggtaccaagc ttactcgagc taagcagcgg gcggcagggg 40
<210> 44
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 44
aattgttaat taagagctct caccatacat cccttgaata tc 42
<210> 45
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 45
atttttgaaa attcgaattc atgcagacgg attccgggaa 40
<210> 46
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 46
gaattcgaat tttcaaaaat tc 22
<210> 47
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 47
ggatccgggg ttttttctcc 20
<210> 48
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 48
gagaaaaaac cccggatcca tggaagcttt taccttgaag ctt 43
<210> 49
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 49
ggtaccaagc ttactcgagc tatatacgag ggatcgcgcg 40
<210> 50
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 50
gagaaaaaac cccggatcca tgatttccac ggccttc 37
<210> 51
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 51
ggtaccaagc ttactcgagt caaaggcatg catcgttgg 39
<210> 52
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 52
cgggatccat ggcaagctcc tttgttct 28
<210> 53
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetical nucleic acid
<400> 53
cgctcgagct acgccaatcc cttggcaa 28

Claims (16)

1.一种生物合成诺卡酮的方法,其包括采用能够表达瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶的重组菌合成诺卡酮;其中,所述瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶来自益智;
所述瓦伦烯合成酶的氨基酸序列为SEQ ID NO. 1所示的氨基酸序列;
所述细胞色素P450氧化酶选自细胞色素P450氧化酶CYP6、细胞色素P450氧化酶CYP9和细胞色素P450氧化酶AoKo的至少一种;其中,细胞色素P450氧化酶CYP6的氨基酸序列为SEQID NO. 2所示的氨基酸序列;细胞色素P450氧化酶CYP9的氨基酸序列为SEQ ID NO. 3所示的氨基酸序列;细胞色素P450氧化酶AoKo的氨基酸序列为SEQ ID NO. 4所示的氨基酸序列;
所述细胞色素P450氧化还原酶的氨基酸序列为SEQ ID NO. 5所示的氨基酸序列;
所述醇脱氢酶的氨基酸序列为SEQ ID NO. 6所示的氨基酸序列。
2.根据权利要求1所述的方法,其中,所述重组菌能够合成法尼基焦磷酸。
3.根据权利要求2所述的方法,其中,所述重组菌能够表达乙酰乙酰辅酶A硫解酶、羟甲基戊二酰辅酶A合酶、羟甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、甲羟戊酸-5-磷酸激酶、甲羟戊酸焦磷酸脱羧酶、异戊二烯焦磷酸异构酶、法尼基焦磷酸合酶的至少一种。
4.一种用于诺卡酮合成的酶组合物,其包括:瓦伦烯合成酶、细胞色素P450氧化酶、细胞色素P450氧化还原酶和醇脱氢酶;
所述瓦伦烯合成酶的氨基酸序列为SEQ ID NO. 1所示的氨基酸序列;
所述细胞色素P450氧化酶选自细胞色素P450氧化酶CYP6、细胞色素P450氧化酶CYP9和细胞色素P450氧化酶AoKo的至少一种;其中,细胞色素P450氧化酶CYP6的氨基酸序列为SEQID NO. 2所示的氨基酸序列;细胞色素P450氧化酶CYP9的氨基酸序列为SEQ ID NO. 3所示的氨基酸序列;细胞色素P450氧化酶AoKo的氨基酸序列为SEQ ID NO. 4所示的氨基酸序列;
所述细胞色素P450氧化还原酶的氨基酸序列为SEQ ID NO. 5所示的氨基酸序列;
所述醇脱氢酶的氨基酸序列为SEQ ID NO. 6所示的氨基酸序列。
5.一种编码权利要求4中所述的酶组合物的多核苷酸分子。
6.根据权利要求5所述的多核苷酸分子,其包含:
(1)SEQ ID NO.7所示的核苷酸序列或SEQ ID NO.13所示的核苷酸序列、
(2)选自SEQ ID NO.8所示的核苷酸序列、SEQ ID NO.9所示的核苷酸序列、SEQ IDNO.10所示的核苷酸序列中的一种、
(3)SEQ ID NO.11所示的核苷酸序列、以及
(4)SEQ ID NO.12所示的核苷酸序列。
7.一种核酸构建体,其包含权利要求5或6所述的多核苷酸分子。
8.根据权利要求7所述的核酸构建体,其还包含编码乙酰乙酰辅酶A硫解酶、羟甲基戊二酰辅酶A合酶、羟甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、甲羟戊酸-5-磷酸激酶、甲羟戊酸焦磷酸脱羧酶、异戊二烯焦磷酸异构酶、法尼基焦磷酸合酶的核苷酸序列的至少一种。
9.根据权利要求7或8所述的核酸构建体,其为质粒载体;所述质粒载体为真核表达载体。
10.根据权利要求9所述的核酸构建体,其中,所述质粒载体为pDXYZ3、pDXVS1、pDXVS2、pDXNL1、pDXNL2、pDXNL3、pDXNT1的至少一种。
11.一种重组菌,其包含根据权利要求5或6所述的多核苷酸分子,或权利要求7-9中任一项所述的核酸构建体;所述重组菌通过将所述多核苷酸分子或所述核酸构建体导入宿主细胞中获得;所述宿主细胞为真核细胞。
12.根据权利要求11所述的重组菌,其中,所述宿主细胞为酿酒酵母。
13.根据权利要求11或12所述的重组菌,其中,所述多核苷酸分子整合入所述宿主细胞的基因组中。
14.根据权利要求13所述的重组菌,其中,所述多核苷酸分子在所述重组菌的基因组中的拷贝数至少1个。
15.根据权利要求11或12所述的重组菌,其能够表达乙酰乙酰辅酶A硫解酶、羟甲基戊二酰辅酶A合酶、羟甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、甲羟戊酸-5-磷酸激酶、甲羟戊酸焦磷酸脱羧酶、异戊二烯焦磷酸异构酶、法尼基焦磷酸合酶的至少一种。
16.采用权利要求4所述的酶、权利要求5或6所述的多核苷酸分子、权利要求7-9中任一项所述的核酸构建体或权利要求11-15中任一项所述的重组菌生产瓦伦烯、诺卡醇和/或诺卡酮的用途。
CN202210671358.1A 2022-06-14 2022-06-14 一种生物合成诺卡酮的方法及载体 Active CN115976118B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210671358.1A CN115976118B (zh) 2022-06-14 2022-06-14 一种生物合成诺卡酮的方法及载体
PCT/CN2023/090352 WO2023241224A1 (zh) 2022-06-14 2023-04-24 一种生物合成诺卡酮的方法及载体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210671358.1A CN115976118B (zh) 2022-06-14 2022-06-14 一种生物合成诺卡酮的方法及载体

Publications (2)

Publication Number Publication Date
CN115976118A CN115976118A (zh) 2023-04-18
CN115976118B true CN115976118B (zh) 2024-01-23

Family

ID=85958954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210671358.1A Active CN115976118B (zh) 2022-06-14 2022-06-14 一种生物合成诺卡酮的方法及载体

Country Status (2)

Country Link
CN (1) CN115976118B (zh)
WO (1) WO2023241224A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115976118B (zh) * 2022-06-14 2024-01-23 武汉合生科技有限公司 一种生物合成诺卡酮的方法及载体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105853859A (zh) * 2016-04-08 2016-08-17 刘嫱 益智仁提取物在制备治疗炎症性肠病的药物的应用
CN107723252A (zh) * 2017-09-22 2018-02-23 天津大学 生产巴伦西亚橘烯和诺卡酮的重组解脂耶氏酵母菌及构建方法
CN108085262A (zh) * 2016-11-23 2018-05-29 中国科学院天津工业生物技术研究所 对萜类或含萜精油耐受性提高或萜类产量提高的重组宿主细胞、其产生方法及其用途
CN110585385A (zh) * 2019-10-17 2019-12-20 郑州大学第一附属医院 一种益智仁倍半萜类化合物的提取方法和定性分析方法
CN114107078A (zh) * 2021-10-29 2022-03-01 湖北冠众通科技有限公司 一种高产瓦伦烯基因工程菌及其构建方法与应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103289923B (zh) * 2013-05-22 2014-06-11 黑龙江大学 一株产香柏酮的解藻朊类芽孢杆菌
CN115927488A (zh) * 2021-12-13 2023-04-07 华南理工大学 氧化还原酶及其突变体在生物合成圆柚酮中的应用
CN115976118B (zh) * 2022-06-14 2024-01-23 武汉合生科技有限公司 一种生物合成诺卡酮的方法及载体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105853859A (zh) * 2016-04-08 2016-08-17 刘嫱 益智仁提取物在制备治疗炎症性肠病的药物的应用
CN108085262A (zh) * 2016-11-23 2018-05-29 中国科学院天津工业生物技术研究所 对萜类或含萜精油耐受性提高或萜类产量提高的重组宿主细胞、其产生方法及其用途
CN107723252A (zh) * 2017-09-22 2018-02-23 天津大学 生产巴伦西亚橘烯和诺卡酮的重组解脂耶氏酵母菌及构建方法
CN110585385A (zh) * 2019-10-17 2019-12-20 郑州大学第一附属医院 一种益智仁倍半萜类化合物的提取方法和定性分析方法
CN114107078A (zh) * 2021-10-29 2022-03-01 湖北冠众通科技有限公司 一种高产瓦伦烯基因工程菌及其构建方法与应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Optimization of a cytochrome P450 oxidation system for enhancing protopanaxadiol production in Saccharomyces cerevisiae;Fanglong Zhao et al.;Biotechnology and Bioengineering;第113卷(第8期);1787-1795 *
Valencene oxidase CYP706M1 from Alaska cedar (Callitropsis nootkatensis);Katarina Cankar et al.;FEBS Letters;第588卷(第6期);1001-1007 *

Also Published As

Publication number Publication date
CN115976118A (zh) 2023-04-18
WO2023241224A1 (zh) 2023-12-21

Similar Documents

Publication Publication Date Title
KR101815063B1 (ko) 사프란 화합물의 재조합 생성을 위한 방법 및 물질
KR100626511B1 (ko) 이소프레노이드의 향상된 생산 방법
CN104017794B (zh) 用于生产(+)-客烯的方法
CN112779242B (zh) 梅片树单萜合酶CbTPS1及其相关生物材料与应用
CN111205993B (zh) 生产熊果酸和齐墩果酸的重组酵母菌及其构建方法和应用
CN106906201B (zh) 一种生产橙花叔醇的萜类合酶及其应用
CN113774079B (zh) 重组酿酒酵母及其构建方法和应用
CN115976118B (zh) 一种生物合成诺卡酮的方法及载体
EP3255151A2 (en) Method of producing (-)-rotundone
CN106459949A (zh) 补身醇合酶及生产补身醇的方法
CN110691850A (zh) 生产折叶苔醇和/或补身醇的方法
CN110117582B (zh) 融合蛋白、其编码基因及在生物合成上的应用
CN110100003B (zh) 迈诺醇的生产
WO2002053745A1 (en) Process for producing prenyl alcohol
CN106987578B (zh) 一种生产koraiol的萜类合酶及其应用
CN115873836B (zh) 一种橙花叔醇合成酶及应用
CN111518739B (zh) 角鲨烯工程菌株、角鲨烯合成质粒、细胞膜空间扩展质粒及制备方法
WO2021036901A1 (zh) 支链α-酮酸脱氢酶复合体在制备丙二酸单酰辅酶A中的应用
WO2015139599A1 (zh) 新的贝壳烯酸-13α-羟化酶、其编码基因及其应用
CN110305856B (zh) 一种细胞色素p450酶的应用
CN105255921B (zh) 异源合成广霍香醇的方法和微生物
CN113621633B (zh) 一种杧果萜烯合成酶基因tps1及其应用
CN111548946B (zh) 一种生产次丹参酮二烯的重组酵母工程菌
CN108410905B (zh) 调节棉花的棉酚性状的基因以及调节方法
CN117187225A (zh) 一种橙花叔醇合成酶及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant