CN113308482A

CN113308482A - 云南腾冲来源四氢嘧啶合成基因簇及其应用

Info

Publication number: CN113308482A
Application number: CN202110589640.0A
Authority: CN
Inventors: 董亮; 张山; 张岩峰; 魏焘; 马骁; 王飞飞; 苏温柔
Original assignee: Shenzhen Upfo Biotech Co ltd
Current assignee: Shenzhen Upfo Biotech Co ltd; Yunnan Beitani Biotechnology Group Co ltd; Yunnan Yunke Characteristic Plant Extraction Laboratory Co ltd
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2021-08-27
Anticipated expiration: 2041-05-28
Also published as: CN113308482B

Abstract

本发明公开了云南腾冲来源四氢嘧啶合成基因簇及其应用。本发明具体地公开了包含编码氨基丁酸乙酰基转移酶(EctA)、二氨基丁酸氨基转移酶(EctB)和四氢嘧啶合成酶(EctC)的新的四氢嘧啶生物合成基因簇，并以大肠杆菌为底盘细胞，将三个基因整合到pBAD/HisA载体中，构建出了高产四氢嘧啶的基因工程菌，通过优化发酵条件、诱导剂浓度等增强基因表达量，从原料天冬氨酸钠出发进行生物转化，增加四氢嘧啶的生物合成，本发明的高产四氢嘧啶的基因工程菌发酵罐培养72h的产量可达10.02g/L，该产量已达到国际先进水平。

Description

云南腾冲来源四氢嘧啶合成基因簇及其应用

技术领域

本发明属于基因工程技术领域，涉及云南腾冲来源四氢嘧啶合成基因簇及其应用，具体涉及云南腾冲来源的类芽孢杆菌四氢嘧啶合成基因簇、重组表达载体、高产四氢嘧啶的大肠杆菌工程菌及其应用。

背景技术

四氢嘧啶又名四氢甲基嘧啶羧酸(Ectoine，C₆H₁₀N₂O₂)，是一种广泛存在于嗜盐菌中参与渗透压调节的杂环氨基酸衍生物。作为一种相容性小分子，四氢嘧啶在极端环境中扮演着保护者的角色，对生物体内的蛋白质活性、核酸构象、微环境稳态的维持均有着积极的作用。四氢嘧啶作为一种功能强大的保护剂，通过稳定和保护细胞而减少外界因素对细胞的破坏性影响，这种保护机制能够保护皮肤免受各种消极因素，包括干燥，空气污染，紫外线和可见光辐射的影响，从而实现抗衰老的功效。此外，四氢嘧啶对正常细胞也有积极作用，当使用四氢嘧啶时，细胞的功能也会得到增强。研究表明，四氢嘧啶可恢复和稳定角质层屏障功能，从而依据其科学的防护和抗炎功效而增加皮肤含水量。四氢嘧啶还表现出全方位和多层次的抗污染功效，能够抑制和减少各种空气污染成分：包括PAHs，重金属，二氧化氮以及大多数颗粒物质对皮肤和皮肤细胞的伤害。四氢嘧啶已被批准用于慢性阻塞性肺病的治疗和预防使用，用于治疗和预防COPD和哮喘等。近年来发现，四氢嘧啶对变态反应性疾病有一定缓解作用。另外，四氢嘧啶还可以抑制类淀粉蛋白的形成，能够降低类淀粉蛋白形成的起始和伸长阶段，具有潜在的预防老年痴呆症的功能。总之，四氢嘧啶是多功能、安全的活性成分，其功效已经通过临床验证，因此被广泛应用在医疗健康、生物制剂、化妆美容、制药等领域中，具有重要的开发和应用价值。

由于四氢嘧啶分子中具有一个手性碳原子，因此很难用化学方法合成，目前四氢嘧啶的主要生产方式为微生物催化法和生物合成方法。微生物催化法即传统的微生物发酵方式，如采用延长盐单胞菌(Halomonas elongate)菌株发酵，在发酵过程中通过改变盐浓度来刺激菌体积累更多的产物，或者利用“细菌挤奶”原理实现四氢嘧啶的合成和分泌。但这些传统方法生产四氢嘧啶，受限于菌株本身合成能力，产量有限，同时生产所需要的高盐环境对生产设备腐蚀伤害极大，生产成本极高，不适合大规模的工业化生产。采用生物合成法生产四氢嘧啶是近年来的发展趋势，通过基因工程技术选育高产优良菌株，开发一种高效的四氢嘧啶生产方法，提高四氢嘧啶的产量，从而降低其生产成本，具有重要的经济价值和社会意义。

发明内容

本发明所要解决的技术问题是提供一种新颖的四氢嘧啶生物合成基因和基因簇，以及利用该基因簇构建的高产四氢嘧啶的菌株。

为解决上述技术问题，本发明首先提供了核酸分子，名称为NEctABC，所述核酸分子编码名称分别为EctA、EctB和EctC的三种蛋白质；

所述EctA为下述任一种蛋白质：

A1)氨基酸序列是SEQ ID No.1的蛋白质；

A2)将SEQ ID No.1的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质；

A3)在A1)或A2)的N端和/或C端连接标签得到的融合蛋白质；

A4)在A1)或A2)的N端和/或C端和/或氨基酸侧链基团上进行修饰得到的具有相同功能的蛋白质衍生物；

所述EctB为下述任一种蛋白质：

B1)氨基酸序列是SEQ ID No.2的蛋白质；

B2)将SEQ ID No.2的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质；

B3)在B1)或B2)的N端和/或C端连接标签得到的融合蛋白质；

B4)在B1)或B2)的N端和/或C端和/或氨基酸侧链基团上进行修饰得到的具有相同功能的蛋白质衍生物；

所述EctC为下述任一种蛋白质：

C1)氨基酸序列是SEQ ID No.3的蛋白质；

C2)将SEQ ID No.3的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与C1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质；

C3)在C1)或C2)的N端和/或C端连接标签得到的融合蛋白质；

C4)在C1)或C2)的N端和/或C端和/或氨基酸侧链基团上进行修饰得到的具有相同功能的蛋白质衍生物。

所述核酸分子可以是DNA，如cDNA、基因组DNA或重组DNA；所述核酸分子也可以是RNA，如mRNA或hnRNA等。

进一步地，所述核酸分子可为DNA分子。

进一步地，所述DNA分子可为四氢嘧啶生物合成基因簇。

所述基因簇包含SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子。

所述氨基酸序列是SEQ ID No.1的蛋白质为氨基丁酸乙酰基转移酶(EctA)；

所述氨基酸序列是SEQ ID No.2的蛋白质为二氨基丁酸氨基转移酶(EctB)；

所述氨基酸序列是SEQ ID No.3的蛋白质为四氢嘧啶合成酶(EctC)。

A3)、B3)、C3)所述标签如表1所示：

表1：标签的序列

标签	残基	序列
			Poly-Arg	5-6(通常为5个)	RRRRR
Poly-His	2-10(通常为6个)	HHHHHH
			FLAG	8	DYKDDDDK
Strep-tag II	8	WSHPQFEK
			c-myc	10	EQKLISEEDL

A4)、B4)、C4)所述修饰可为氨基化、酰胺化、羟基化、羧基化、羰基化、烷基化、乙酰化、磷酸化、酯化、糖基化、环化、生物素化、荧光基团修饰、聚乙二醇PEG修饰或固定化修饰。

上述A2)、B2)、C2)中蛋白质可分别为与SEQ ID No.1、SEQ ID No.2、SEQ ID No.3所示蛋白质的氨基酸序列具有75％或75％以上同一性且具有相同功能的蛋白质。所述具有75％或75％以上同一性为具有75％、具有80％、具有85％、具有90％、具有95％、具有96％、具有97％、具有98％或具有99％的同一性。

上述A2)、B2)、C2)中的蛋白质的编码核苷酸可分别通过将SEQ ID No.4、SEQ IDNo.5、SEQ ID No.6所示的DNA序列中缺失一个或几个氨基酸残基的密码子，和/或进行一个或几个碱基对的错义突变，和/或在其5′端和/或3′端连上表1所示的标签的编码序列得到。

上述核酸分子中，所述核酸分子NEctABC可由SEQ ID No.4所示的DNA、SEQ IDNo.5所示的DNA和SEQ ID No.6所示的DNA连接而成的DNA分子。

上述核酸分子中：

SEQ ID No.4所示的DNA分子编码SEQ ID No.1所示的EctA蛋白质；

SEQ ID No.5所示的DNA分子编码SEQ ID No.2所示的EctB蛋白质；

SEQ ID No.6所示的DNA分子编码SEQ ID No.3所示的EctC蛋白质。

本领域普通技术人员可以很容易地采用已知的方法，例如定向进化或点突变的方法，对本发明的编码EctA、EctB或EctC蛋白质的核苷酸序列进行突变。那些经过人工修饰的，具有与本发明分离得到的EctA、EctB或EctC蛋白质的核苷酸序列75％或者更高同一性的核苷酸，只要编码EctA、EctB或EctC蛋白质且分别具有EctA、EctB或EctC蛋白质的功能，均是衍生于本发明的核苷酸序列并且等同于本发明的序列。

上述75％或75％以上同一性，可为80％、85％、90％或95％以上的同一性。

本文中，同一性是指氨基酸序列或核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62作为Matrix，将Gap existence cost，Per residue gap cost和Lambda ratio分别设置为11，1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。

本文中，所述80％以上的同一性可为至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。

上述核酸分子中，

所述核酸分子可为下述任一种DNA分子：

D1)核苷酸序列是SEQ ID No.7的DNA分子。

D2)核苷酸序列是SEQ ID No.7的第319-2649位DNA分子。

本发明还提供了重组微生物，所述重组微生物含有所述核酸分子NEctABC和/或表达所述EctA、EctB和EctC的三种蛋白质。

所述重组微生物含有所述四氢嘧啶生物合成基因簇。

本发明还提供了用于制备四氢嘧啶的蛋白质组合物，所述蛋白质组合物由所述EctA、EctB和EctC三种蛋白质组成。

本发明还提供了构建所述重组微生物的方法，所述方法包括将所述核酸分子NEctABC导入受体微生物得到所述重组微生物。

进一步地，所述重组微生物可为高产四氢嘧啶的重组微生物。

在本发明的一个实施方案中，构建所述重组微生物的方法为：用氯化钙化学转化法将重组载体pBAD-EctABC转化至大肠杆菌K-12系列表达菌株BW25113中，用含有氨苄青霉素的LB培养基进行筛选培养，获得重组表达菌株BW-pBAD-EctABC(重组大肠杆菌BW-pBAD-EctABC)。

用于在各种不同的受体微生物中克隆和表达蛋白质的方法是众所周知的。合适的受体微生物可以是大肠杆菌、枯草杆菌、酵母、昆虫细胞、杆状病毒、培养的哺乳类动物细胞或整体动植物等。可选择或构建含有合适调节序列的合适载体，所述调节序列包括启动子序列、终止子序列、多腺苷酸化信号、增强子序列、标记基因和适当时的其它序列。

使用本领域公知的技术，包括但不限于，接合，电穿孔，化学转化，转导，转染，和超声波转化，可以将所述重组载体导入所述受体微生物中。

本发明还提供了一种制备四氢嘧啶的方法，所述方法包括利用所述重组微生物生产四氢嘧啶。

进一步地，所述制备四氢嘧啶的方法可为发酵法制备四氢嘧啶。

进一步地，所述制备四氢嘧啶的方法包括在合适的培养基中培养所述重组微生物，以及从所述培养基回收四氢嘧啶的步骤，所述培养基包含含有葡萄糖的可发酵碳源。

进一步地，所述制备四氢嘧啶的方法还包括在发酵体系中加入L-阿拉伯糖的诱导培养过程。

进一步地，所述制备四氢嘧啶的方法包括如下步骤：

(1)制备种子液：挑取所述重组大肠杆菌单菌落接于20ml含有氨苄青霉素(100μg/ml)的LB培养基中，于37℃、200rpm培养12小时；然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)的种子培养基中，37℃、200rpm振荡培养12小时，即得种子液；

(2)菌体培养：将300mL步骤(1)所述重组大肠杆菌的种子液接种于2.7L含氨苄青霉素(100μg/ml)的发酵培养基中，搅拌培养至葡萄糖消耗完时流加补料培养基，补料培养基的流加速度为50mL/h，流加至菌体密度OD600达到20，菌体流加培养过程结束；

(3)诱导培养：将步骤(2)流加培养后的发酵液的温度降至30℃，加入L-阿拉伯糖，使得L-阿拉伯糖终浓度为1g/L，进行诱导培养,同时加入天冬氨酸钠终浓度为20g/L，甘油终浓度为体积占比5％；诱导培养过程中一直流加补料培养基，补料培养基的流加速度调至20mL/h；流加至菌体密度OD600达到60，诱导培养及转化过程结束；

(4)通过HPLC检测发酵液中的四氢嘧啶的浓度。

进一步地，上述方法中，所述菌体培养的条件为：培养温度为37℃，控制菌体培养体系的溶氧在20％以上，和维持pH至7.0；

具体的，通过调整搅拌速度和通气量控制菌体培养体系的溶氧在20％以上，所述搅拌速度为500－800转/分钟，通气量为3L/min；具体的，通过2.7M氨水和1M磷酸维持pH至7.0；

进一步地，所述诱导培养的条件为：培养温度为30℃，控制诱导培养体系的溶氧在20％以上，和维持pH至7.0；

具体的，通过调整搅拌速度和通气量控制诱导培养体系的溶氧在20％以上，所述搅拌速度为500－800转/分钟，通气量为3L/min；具体的，通过2.7M氨水和1M磷酸维持pH至7.0；

每1L发酵培养基的配制：葡萄糖10g,(NH₄)₂HPO₄ 8g,KH₂PO₄ 13.3g,MgSO₄·7H₂O1.2g,柠檬酸1.7g，微量盐溶液10mL,用水定溶至1L，5M NaOH调至pH7.0；

每1L补料培养基的配制：葡萄糖400g,MgSO₄·7H₂O 10g,微量盐溶液20mL,用水定容至1L；

每1L微量盐溶液的配制：FeSO₄·7H₂O 10g,ZnSO₄·7H₂O 2.25g,CuSO₄·5H₂O 1g,MnSO₄·5H₂O 0.5g,Na₂B₄O₇·10H₂O 0.23g,CaCl₂·2H₂O 2g,(NH₄)₆Mo₇O₂₄ 0.1g，用5M盐酸水溶液定容，定容至1L。

所述种子培养基的配制：蛋白胨15g,酵母膏10g,氯化钠5g,用水定容至1L，pH7.0。

上述方法中，所述重组大肠杆菌具体可为重组大肠杆菌BW-pBAD-EctABC。本发明还提供了与所述核酸分子NEctABC相关的生物材料，所述生物材料为下述E1)-E10)中的任一种：

E1)所述EctA、EctB或EctC；

E2)编码所述EctA的核酸分子；

E3)编码所述EctB的核酸分子；

E4)编码所述EctC的核酸分子；

E5)含有所述核酸分子NEctABC的表达盒；

E6)含有所述核酸分子NEctABC的重组载体、或含有E5)所述表达盒的重组载体；

E7)含有所述核酸分子NEctABC的重组微生物、或含有E5)所述表达盒的重组微生物、或含有E6)所述重组载体的重组微生物；

E8)含有所述核酸分子NEctABC的转基因植物细胞系、或含有E5)所述表达盒的转基因植物细胞系；

E9)含有所述核酸分子NEctABC的转基因植物组织、或含有E5)所述表达盒的转基因植物组织；

E10)含有所述核酸分子NEctABC的转基因植物器官、或含有E5)所述表达盒的转基因植物器官。

上述生物材料中，所述重组载体可含有所述四氢嘧啶生物合成基因簇；进一步地，所述重组载体可含有SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子；在本发明的一个实施例中，所述重组载体为核苷酸序列是SEQ ID No.7的DNA分子。

上述生物材料中，所述微生物可为酵母、细菌、藻或真菌。其中，细菌可来自埃希氏菌属(Escherichia),欧文氏菌(Erwinia),根癌农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium),产碱菌属(Alcaligenes),假单胞菌属(Pseudomonas),芽胞杆菌属(Bacillus)等。所述细菌具体可为大肠杆菌。进一步地，所述大肠杆菌为BW25113。

上述生物材料中，E6)中所述重组载体为下述任一种：

D1)含有SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子；

D2)核苷酸序列是SEQ ID No.7的DNA分子；

D3)含有所述四氢嘧啶生物合成基因簇。

所述核苷酸序列是SEQ ID No.7的重组载体名称为pBAD-EctABC。

进一步地，所述重组载体可为重组表达载体，所述重组表达载体为将SEQ IDNo.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子与目的载体连接，得到含有SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示DNA分子的重组表达载。

所述目的载体可为质粒、黏粒、噬菌体或病毒载体。所述质粒具体可为pBAD/HisA，也可为将pBAD/HisA改造后得到的载体。虽然本发明的一个实施例中的目的载体使用了pBAD/HisA载体，但本发明不限于该特定载体。本领域技术人员可采用其它合适的载体，实现本发明所述的技术方案，这些替代载体未脱离本发明的范围，本发明应包括这些替代载体。

进一步地，本发明的一个实施方案是通过无缝克隆(Seamless Cloning)技术将SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子与线性化后的载体pBAD/HisA连接，构建重组表达载体。本领域技术人员能够使用广泛已知的方法来构建本发明所述重组表达载体，如可以利用传统的克隆技术，将目的基因通过酶切连接后定向克隆到目的载体上。本发明的重组表达载体具体可为核苷酸序列是SEQ ID No.7的重组表达载体pBAD-EctABC。

本发明还提供了所述核酸分子NEctABC和/或所述重组微生物和/或所述蛋白质组合物和/或所述生物材料在合成四氢嘧啶中的应用。

目前报道可使用的四氢嘧啶基因合成簇较少，而根据四氢嘧啶特殊的“保护者”身份，含有四氢嘧啶合成簇的微生物多存在于盐碱滩涂、深海高压低温、高温热泉等极端环境中，恶劣的生态环境更需要微生物利用四氢嘧啶等物质保持自身渗透压平衡，维持细胞内的环境的相对稳态。我国云南省腾冲县具有丰富的热泉资源，绮丽绚烂的火山伴泉、热泉造就了独特的嗜热微生物资源宝库。前期实验室从云南腾冲蛤蟆嘴热泉底泥取样，成功构建了宏基因组文库，对该热泉底泥文库进行四氢嘧啶基因合成簇筛选后，成功鉴定到多条四氢嘧啶基因合成簇。其中一条被注释为来自类芽孢杆菌的四氢嘧啶基因簇成功实现了在大肠杆菌中的异源表达。后续转化实验证明该菌株能够高效的进行四氢嘧啶合成。

本发明挖掘了新的四氢嘧啶生物合成基因簇，并以大肠杆菌为底盘细胞，将三个基因整合到pBAD/HisA载体中，转化入大肠杆菌BW25113菌株，实现了四氢嘧啶在大肠杆菌中高效的分泌合成，从而构建出了高产四氢嘧啶的基因工程菌，通过优化发酵条件、诱导剂浓度等增强基因表达量，从原料天冬氨酸钠出发进行生物转化，增加四氢嘧啶的生物合成，对比于野生菌株BW25113，能够高效的合成四氢嘧啶，为四氢嘧啶的产业化奠定基础。

实验表明，本发明中的四氢嘧啶合成菌株，单位菌体的四氢嘧啶合成效率显著高于对照菌株，发酵罐培养72h的产量可达10.02g/L，该产量已达到国际先进水平。同时，四氢嘧啶绝大部分产物分泌至胞外，便于产物的下游纯化分离。本发明丰富了四氢嘧啶合成簇，为提供更多的候选基因便于后续开发四氢嘧啶高产菌株提供了新思路，对四氢嘧啶的工业化生产和产业化发展具有重大意义。

附图说明

图1为HPLC分析转化48h四氢嘧啶在重组大肠杆菌中的合成情况。上图为标准品，中图为大肠杆菌BW25113转化48h的结果，下图为重组大肠杆菌BW-pBAD-EctABC转化48h的结果。

图2为2株大肠杆菌摇瓶转化不同时间四氢嘧啶的合成量。图中，野生型为大肠杆菌BW25113，1号菌株为重组大肠杆菌BW-pBAD-EctABC。

图3为2株大肠杆菌发酵罐生产四氢嘧啶的产量。图中，野生型为大肠杆菌BW25113，1号菌株为重组大肠杆菌BW-pBAD-EctABC。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

实施例中所使用引物序列均在北京生工生物工程股份有限公司直接合成获得；

pBAD/HisA购自invitrogen，产品目录号为V430-01。

大肠杆菌BW25113菌株为Thermo产品，Cat#OEC5042。

实施例1、大肠杆菌四氢嘧啶高产菌株的构建

1、PCR扩增四氢嘧啶合成相关基因的编码序列

以保存的宏基因组文库DNA为模板，用引物F1、R1进行PCR扩增，得到PCR扩增产物EctA基因，即片段1。该EctA基因含有编码序列是SEQ ID No.4的DNA分子。SEQ ID No.4所示的DNA分子编码SEQ ID No.1所示的EctA蛋白质。

以保存的宏基因组文库DNA为模板，用引物F2、R2进行PCR扩增，得到PCR扩增产物EctB基因，即片段2。该EctB基因含有编码序列是SEQ ID No.5的DNA分子。SEQ ID No.5所示的DNA分子编码SEQ ID No.2所示的EctB蛋白质。

以保存的宏基因组文库DNA为模板，用引物F3、R3进行PCR扩增，得到PCR扩增产物EctC基因，即片段3。该EctC基因含有编码序列是SEQ ID No.6的DNA分子。SEQ ID No.6所示的DNA分子编码SEQ ID No.3所示的EctC蛋白质。

以pBAD/HisA为模板，用引物F4,R4进行反向PCR扩增，得到PCR扩增产物pBAD/HisA载体线性片段。

引物序列如表1所示：

表1 PCR扩增四氢嘧啶合成相关基因的引物序列

2、无缝拼接

使用南京诺维赞公司生产的无缝拼接试剂盒，按照载体线性片段：片段1(EctA基因)：片段2(EctB基因)：片段3(EctC基因)摩尔比1：5：5：5比例混合，按照试剂盒要求加入酶和buffer，反应37℃，30min后放置于冰上，得到拼接产物。

3、转化、筛选以及序列验证

用氯化钙化学转化法将步骤2中的拼接产物转化至大肠杆菌DH5α，用含有氨苄青霉素(100μg/ml)的LB培养基进行筛选培养，挑取单菌落，并进行扩大培养和提取质粒，进行测序验证。结果表明提取的质粒含有核苷酸序列是SEQ ID No.7的DNA分子。SEQ ID No.7中，第1-318位为pBAD/HisA载体序列，120-318为阿拉伯糖启动子和rbs，1-119为载体连接无功能区域，第319-837位为EctA的编码序列(编码氨基酸序列是SEQ ID No.1所示的EctA蛋白质)，第838-861位为T7rbs序列(此为大肠杆菌中进行基因表达常用的rbs序列，提供核糖体结合位点，提高蛋白表达量)，第862-2238位为EctB的编码序列(编码氨基酸序列是SEQID No.2所示的EctB蛋白质)，第2239-2262位为T7rbs序列(此为大肠杆菌中进行基因表达常用的rbs序列，提供核糖体结合位点，提高蛋白表达量)，第2263-2649位为EctC的编码序列(编码氨基酸序列是SEQ ID No3所示的EctC蛋白质)，第2650-6287位为pBAD/HisA载体序列(2650-2857为MCS多克隆位点；2858-2944为终止子序列；2945-4204为氨苄抗性基因序列；4205-5382为复制起始位点ORI；5383-6287为araC蛋白，阿拉伯糖阻遏蛋白)。将该质粒命名为重组表达载体pBAD-EctABC。重组表达载体pBAD-EctABC为将片段1、片段2、片段3和pBAD/HisA载体线性片段进行无缝拼接得到的重组表达载。pBAD-EctABC含有核苷酸序列是SEQ ID No.7的DNA分子，可在大肠杆菌BW25113中表达氨基酸序列是SEQ ID No.1所示的EctA蛋白质、氨基酸序列是SEQ ID No.2所示的EctB蛋白质和氨基酸序列是SEQ ID No3所示的EctC蛋白质这三种蛋白质。

4、重组表达菌株的构建

用氯化钙化学转化法将重组表达载体pBAD-EctABC转化至大肠杆菌K-12系列表达菌株BW25113(基因型是rrnB3ΔlacZ4787 hsdR514Δ(araBAD)567Δ(rhaBAD)568rph-1)中，用LB+100μg/m L Amp液体培养基(LB+100μg/m L Amp液体培养基是向LB液体培养基中加入氨苄青霉素得到的液体培养基，LB+100μg/m L Amp液体培养基中氨苄青霉素的含量为100μg/m L)进行筛选培养，挑取单菌落，获得导入重组表达载体pBAD-EctABC的重组表达菌株记作重组大肠杆菌BW-pBAD-EctABC。

实施例2大肠杆菌四氢嘧啶的生物转化

1、摇瓶培养

实验重复三次，每次重复如下：

挑取实施例1的重组大肠杆菌BW-pBAD-EctABC单菌落接入LB+100μg/m L Amp液体培养基中，于37℃过夜培养。将过夜培养物接种于500ml的LB+100μg/m L Amp液体培养基，37℃剧烈振荡(200rpm)培养，至发酵液的OD_600nm值达到0.6-0.8左右，再向发酵体系中加入L-阿拉伯糖(终浓度0.1％)，30℃条件下继续培养10-12小时。5000rpm离心15分钟，收集菌体。

离心后菌体加入转化液重悬菌体至OD_600nm值达到10，取25ml重悬菌液于250ml三角瓶中，30℃振荡(100rpm)反应分别在0小时、24小时、48小时、72小时和96小时，收集发酵液。

转化液成分：溶质及其浓度如下：10g/L葡萄糖,6g/L Na₂HPO₄,0.5g/L NaCl,3g/LKH₂PO₄,1g/L NH₄Cl,246.5mg/L MgSO₄·7H₂O,14.7mg/L CaCl₂·2H₂O,27.8mg/L FeSO₄·7H₂O,2g/L酵母提取物；1％甘油；5g/L天冬氨酸钠；溶剂为水。

按照上述方法，以大肠杆菌BW25113(野生型)作为对照进行上述平行实验。

2、发酵罐发酵培养

实验重复三次，每次重复如下：

1)制备种子液：

挑取实施例1的重组大肠杆菌BW-pBAD-EctABC单菌落接入20mlLB+100μg/mL Amp液体培养基中，于37℃、200rpm培养12小时；然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)的种子培养基(向种子培养基中加入氨苄青霉素至氨苄青霉素的含量为100μg/ml得到的液体培养基)中，37℃、200rpm振荡培养12小时，即得种子液；

2)菌体培养：

将300mL种子液接种于2.7L含氨苄青霉素(100μg/ml)的发酵培养基(向发酵培养基中加入氨苄青霉素至氨苄青霉素的含量为100μg/ml得到的液体培养基)的NBS Bioflo3000 6L发酵罐中，搅拌培养至葡萄糖消耗完时流加补料培养基，补料培养基的流加速度为50mL/h，流加至菌体密度OD_600nm达到20，菌体培养过程结束，进入诱导培养阶段。该菌体培养的条件为：培养温度为37℃，控制菌体培养体系的溶氧在20％以上，和维持pH至7.0。具体的，通过调整搅拌速度和通气量控制菌体培养体系的溶氧在20％以上，所述搅拌速度为500－800转/分钟，通气量为3L/min；具体的，通过2.7M氨水和1M磷酸维持pH至7.0。

3)诱导培养过程：

将上述菌体培养后的发酵液的温度降至30℃，加入L-阿拉伯糖，使得L-阿拉伯糖终浓度为1g/L，进行诱导培养,同时加入天冬氨酸钠终浓度为20g/L，甘油终浓度为体积占比5％；诱导培养过程中要一直流加补料培养基，补料培养基的流加速度调至20mL/h；流加至菌体密度OD_600nm达到60，诱导培养及转化过程结束。该诱导培养的条件为：培养温度为30℃，控制诱导培养体系的溶氧在20％以上，和维持pH至7.0；具体的，通过调整搅拌速度和通气量控制诱导培养体系的溶氧在20％以上，所述搅拌速度为500－800转/分钟，通气量为3L/min；具体的，通过2.7M氨水和1M磷酸维持pH至7.0。诱导培养时间分别是0小时、24小时、48小时、72小时和96小时，收集发酵液。

每1L发酵培养基的配制：葡萄糖10g,(NH₄)₂HPO₄ 8g,KH₂PO₄ 13.3g,MgSO₄·7H₂O1.2g,柠檬酸1.7g,微量盐溶液10mL,用水定溶至1L，5M NaOH调至pH7.0；

3、HPLC检测发酵液中的四氢嘧啶的浓度

将摇瓶培养和发酵罐培养后的发酵液5000rpm离心15min吸取上清液，按照上清液(如需要稀释10-50倍)：水：乙腈体积比1：2：7制成待检测样品，0.22um有机型滤器过滤除去不溶物后HPLC检测四氢嘧啶浓度。HPLC检测仪为Agilent 1260 Infinity LC,检测柱为Agilent ZOBAX-NH2氨基柱。四氢嘧啶的紫外检测波长为215nm，流动相70％(V/V)乙腈水溶液,流速为1.0mL/min,进样量为10uL，采用外标法按峰面积定量。SIGMA生产四氢嘧啶作为定量标准品。实验重复三次。

上述实验结果表明：

本发明成功构建了四氢嘧啶合成基因的大肠杆菌表达载体pBAD-EctABC，及表达菌株BW-pBAD-EctABC。诱导表达后的菌体以天冬氨酸钠为前体通过生物转化的方法实现了四氢嘧啶的高效分泌型合成。图1为四氢嘧啶的HPLC检测结果，对照菌株(野生型)大肠杆菌BW25113并没有四氢嘧啶分泌到胞外，而重组大肠杆菌可以催化产生四氢嘧啶到大肠杆菌胞外。重组大肠杆菌BW-pBAD-EctABC在摇瓶中72h催化最终产生四氢嘧啶0.92g/L达到最高水平(图2)。重组大肠杆菌BW-pBAD-EctABC做上罐发酵，最终发酵72h四氢嘧啶的产量达到10.02g/L(图3)。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

SEQUENCE LISTING

<110> 深圳中科欣扬生物科技有限公司

<120> 云南腾冲来源四氢嘧啶合成基因簇及其应用

<160> 7

<170> PatentIn version 3.5

<210> 1

<211> 172

<212> PRT

<213> 人工序列（Artificial sequence）

<400> 1

Met Leu Pro Asn Asp Ser Ile Glu Gln Ile Arg Phe Thr Thr Pro Glu

1 5 10 15

Val Arg His Gly Ser Ser Met Trp Lys Leu Val Ser Glu Ser Pro Ile

20 25 30

Leu Asp Asn Asn Ser Glu Tyr Cys Tyr Leu Met Leu Cys Lys Tyr Phe

35 40 45

Ala Asp Thr Cys Val Met Ala Glu Ile Gln Gly Glu Ile Val Gly Phe

50 55 60

Val Ser Ala Phe His Ala Pro Ala Glu Pro Glu Cys Leu Phe Ile Trp

65 70 75 80

Gln Ile Val Val Thr Pro Glu Leu His Gly Arg Gly Ile Gly Thr Glu

85 90 95

Leu Val Gln Glu Leu Leu Ser Arg Val Lys Gly Lys Asp Ile Arg Phe

100 105 110

Leu Glu Thr Thr Ile Ser Pro Gly Asn Val Ser Ser Glu Arg Leu Phe

115 120 125

Gln Lys Ile Ala Lys Glu Leu Ala Ala Ser Cys Thr Val Ser Glu Gly

130 135 140

Phe Leu Ser His Leu Phe Ser Asp Thr Glu His Glu Ala Glu Leu Leu

145 150 155 160

Tyr Arg Ile Gly Pro Phe Ser Leu Pro Gly Asn Ser

165 170

<210> 2

<211> 458

<212> PRT

<213> 人工序列（Artificial sequence）

<400> 2

Met Val Ile Thr Lys Glu Asp Leu Thr Glu Lys Gln Ala Ser Asn Ser

1 5 10 15

Met Gln Thr Leu Glu Ser Leu Gln Ser Leu Gln Thr Phe Glu Gln Met

20 25 30

Glu Ser Glu Val Arg Ser Tyr Cys Arg Ser Phe Pro Ala Leu Phe Thr

35 40 45

Lys Gly Ser Gly His Thr Leu Trp Asp Ala Ser Gly Asn Ser Tyr Ile

50 55 60

Asp Phe Phe Ala Gly Ala Gly Ala Leu Asn Tyr Gly His Asn Asn Pro

65 70 75 80

Ala Met Lys Lys Lys Leu Ile Glu Tyr Val Gln Asn Asp Gly Val Thr

85 90 95

His Ser Leu Asp Met Ala Thr Glu Ala Lys Glu Gln Phe Leu Arg Arg

100 105 110

Phe Asn Glu Val Ile Leu Gln Pro Arg Lys Leu Lys Tyr Lys Ile Met

115 120 125

Phe Pro Gly Pro Thr Gly Thr Asn Ala Val Glu Ser Ala Leu Lys Leu

130 135 140

Ala Arg Lys Val Thr Gly Arg Ser Thr Val Val Gly Phe Thr Asn Ala

145 150 155 160

Phe His Gly Met Thr Leu Gly Ser Leu Ala Val Thr Gly Asn Lys Phe

165 170 175

Lys Arg Asn Gly Ala Gly Val Pro Leu His His Ala Leu Ser Met Pro

180 185 190

Tyr Asp Gly Tyr Phe Gly Pro Gly Val Asp Thr Leu Glu Tyr Leu Ser

195 200 205

Asn Tyr Leu Ser Asp Ser Gly Ser Gly Ile Ser Leu Pro Ala Ala Val

210 215 220

Ile Val Glu Thr Leu Gln Gly Glu Gly Gly Ile Tyr Glu Ala Ser Ile

225 230 235 240

Pro Trp Leu Gln Gly Leu Glu Gln Ile Cys Lys Ser Lys Gly Ile Leu

245 250 255

Leu Ile Val Asp Asp Val Gln Met Gly Cys Gly Arg Thr Gly Thr Phe

260 265 270

Phe Ser Phe Glu Glu Ala Gly Ile Glu Pro Asp Ile Val Cys Leu Ser

275 280 285

Lys Ser Ile Ser Gly Phe Gly Thr Pro Met Ala Leu Thr Leu Phe Arg

290 295 300

Pro Glu Leu Asp Val Trp Glu Pro Gly Glu His Asn Gly Thr Phe Arg

305 310 315 320

Gly His Asn Leu Ala Phe Ile Thr Ala Thr Glu Ala Leu Glu Tyr Trp

325 330 335

Lys Thr Ser Ala Phe Ser Thr Glu Ile Arg Arg Lys Gly Thr Ile Val

340 345 350

His Glu Phe Leu Gln Glu Val Val Arg Asp Phe Pro Glu Leu Gln Gly

355 360 365

Glu Val Arg Gly Lys Gly Leu Met Gln Gly Ile Ala Ile Gly Val Asp

370 375 380

Gly Leu Ala Ser Glu Ile Ser Lys Ala Ala Phe Asn Asn Gly Leu Ile

385 390 395 400

Met Glu Thr Ser Gly Thr Asp Ser Glu Val Ile Lys Ile Met Pro Pro

405 410 415

Leu Thr Ile Asp Asp Ala Gly Leu Leu Gln Gly Leu Gln Leu Phe Lys

420 425 430

Asn Ser Ile Gln Ala Thr Val Thr Lys Leu Ser Ser Lys Lys Gln His

435 440 445

Lys Glu Asp Gly Ala Ala His Asp Arg Thr

450 455

<210> 3

<211> 128

<212> PRT

<213> 人工序列（Artificial sequence）

<400> 3

Met Ile Val Arg Asn Leu Ser Asp Ile Ala Gly Thr Glu Gln Asp Val

1 5 10 15

Gly Ala Glu Thr Trp Asn Ser Arg Arg Leu Leu Leu Ser Lys Asp Gly

20 25 30

Val Gly Phe Ser Leu His Asp Thr Val Ile Lys Ala Asn Thr Glu Thr

35 40 45

Glu Met Trp Tyr Lys His His Ile Glu Ala Val Tyr Cys Ile Gln Gly

50 55 60

Asn Gly Gln Ile Arg Thr Leu Glu Asp Gly Lys Val Tyr Pro Ile Gln

65 70 75 80

Pro Gly Thr Leu Tyr Val Leu Asn Lys His Glu Lys His Ile Leu Gln

85 90 95

Cys Lys Asp Glu Leu Arg Leu Ile Cys Val Phe Asn Pro Pro Cys Thr

100 105 110

Gly Asn Glu Val His Ala Glu Asp Gly Ser Tyr Pro Leu Ile Thr Glu

115 120 125

<210> 4

<211> 519

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 4

atgttaccaa atgactctat tgaacaaata cgatttacca cccctgaggt acggcacgga 60

tcaagcatgt ggaagctcgt ctctgagagt ccgatcctgg ataataactc cgaatattgc 120

taccttatgc tgtgcaaata ttttgctgac acctgtgtca tggcggaaat tcagggggaa 180

atagtaggat ttgtgtccgc ctttcatgct cccgccgagc ccgagtgcct gtttatatgg 240

caaatcgtag ttaccccaga gctgcacggc agaggaatcg gaaccgaatt ggtgcaagaa 300

cttctctcaa gagtaaaggg caaggacatt cgtttcctgg agacaactat ttcccctggc 360

aatgtttctt cagagcggtt attccaaaag atcgccaaag agcttgctgc ctcatgcaca 420

gtttcagaag gatttttgag ccatctgttt tcagatacag agcatgaagc cgaattgctg 480

tatcgaatcg gacccttctc attacctggt aattcttga 519

<210> 5

<211> 1377

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 5

atggttataa ctaaagaaga tctgacagaa aaacaggcgt caaactccat gcaaacgctg 60

gaatcactcc agtcgttgca aacctttgag caaatggaat ctgaggttcg cagctactgc 120

cgttctttcc cggccctgtt cacaaaggga agcgggcaca cattgtggga cgcctccggc 180

aattcgtata tcgatttttt tgcaggtgct ggagcattga attacggtca caataatcca 240

gccatgaaaa aaaagctgat cgaatatgta caaaatgacg gggtgaccca cagtctggat 300

atggccacag aagcgaaaga gcaattcctc cgccgattta atgaagtcat tctacagccc 360

cggaagctga agtataagat catgtttcca ggacctaccg gcacaaatgc agtggaaagt 420

gctttaaagc ttgcccgcaa ggtaacagga cgctccaccg tcgttggttt tacgaatgct 480

tttcatggca tgacattagg ctccttggcc gtaacgggaa ataaatttaa acgcaatgga 540

gcaggcgtac cgcttcatca tgccctatcc atgccatatg acggttactt tggtccaggc 600

gtggacacgc tcgaatactt gagcaactac ttatccgata gcgggagcgg catttcactg 660

cctgcggctg taatcgtaga aacgctgcaa ggagaaggcg gtatttatga agcaagcatc 720

ccttggctgc aagggttgga gcaaatctgc aaaagcaaag ggatcctatt gattgtcgac 780

gatgtgcaga tgggctgcgg ccgaacaggg acgtttttca gctttgagga ggctggcata 840

gagcctgata ttgtctgctt atccaagtcg atcagcggat ttggcactcc tatggctcta 900

accttgttcc gcccagagct ggacgtctgg gagcctgggg agcataatgg cacattccgc 960

ggacataacc tggccttcat cacggccacc gaggcgctcg agtattggaa aacctctgct 1020

tttagcacag aaatacgcag gaaagggaca attgtccacg aattcctgca agaggttgtt 1080

cgcgatttcc ctgagctgca aggtgaagtg agaggcaaag ggcttatgca gggcattgct 1140

atcggtgttg atggcctggc ttcagaaata agcaaagccg cctttaacaa tggcttgatc 1200

atggaaacct cgggaaccga cagtgaggtt attaaaataa tgccgccttt aacgattgac 1260

gatgccggcc ttcttcaagg cttgcaatta ttcaagaaca gcattcaagc cactgtaacc 1320

aagctgagtt caaaaaaaca acataaggaa gacggtgcag cacatgatcg tacgtaa 1377

<210> 6

<211> 387

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 6

atgatcgtac gtaatttatc agatatcgca ggtacagagc aggacgtagg tgcagagacc 60

tggaacagca gaagattgct gcttagcaaa gatggagttg gcttttccct gcatgatacc 120

gtaataaaag caaatacaga aacagaaatg tggtacaaac atcatattga ggcggtctac 180

tgcatccagg gaaatggtca gatccgaacg ttagaagacg gcaaggtgta cccgattcaa 240

cccggaacgc tgtatgtgct taataaacac gaaaagcata ttttgcaatg caaggatgag 300

ctcagactga tttgtgtctt caatcccccc tgtacgggaa atgaagtgca tgcagaagac 360

ggaagctacc cgctaattac tgaataa 387

<210> 7

<211> 6287

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 7

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat gttaccaaat gactctattg aacaaatacg atttaccacc 360

cctgaggtac ggcacggatc aagcatgtgg aagctcgtct ctgagagtcc gatcctggat 420

aataactccg aatattgcta ccttatgctg tgcaaatatt ttgctgacac ctgtgtcatg 480

gcggaaattc agggggaaat agtaggattt gtgtccgcct ttcatgctcc cgccgagccc 540

gagtgcctgt ttatatggca aatcgtagtt accccagagc tgcacggcag aggaatcgga 600

accgaattgg tgcaagaact tctctcaaga gtaaagggca aggacattcg tttcctggag 660

acaactattt cccctggcaa tgtttcttca gagcggttat tccaaaagat cgccaaagag 720

cttgctgcct catgcacagt ttcagaagga tttttgagcc atctgttttc agatacagag 780

catgaagccg aattgctgta tcgaatcgga cccttctcat tacctggtaa ttcttgattt 840

aactttaaga aggagatata catggttata actaaagaag atctgacaga aaaacaggcg 900

tcaaactcca tgcaaacgct ggaatcactc cagtcgttgc aaacctttga gcaaatggaa 960

tctgaggttc gcagctactg ccgttctttc ccggccctgt tcacaaaggg aagcgggcac 1020

acattgtggg acgcctccgg caattcgtat atcgattttt ttgcaggtgc tggagcattg 1080

aattacggtc acaataatcc agccatgaaa aaaaagctga tcgaatatgt acaaaatgac 1140

ggggtgaccc acagtctgga tatggccaca gaagcgaaag agcaattcct ccgccgattt 1200

aatgaagtca ttctacagcc ccggaagctg aagtataaga tcatgtttcc aggacctacc 1260

ggcacaaatg cagtggaaag tgctttaaag cttgcccgca aggtaacagg acgctccacc 1320

gtcgttggtt ttacgaatgc ttttcatggc atgacattag gctccttggc cgtaacggga 1380

aataaattta aacgcaatgg agcaggcgta ccgcttcatc atgccctatc catgccatat 1440

gacggttact ttggtccagg cgtggacacg ctcgaatact tgagcaacta cttatccgat 1500

agcgggagcg gcatttcact gcctgcggct gtaatcgtag aaacgctgca aggagaaggc 1560

ggtatttatg aagcaagcat cccttggctg caagggttgg agcaaatctg caaaagcaaa 1620

gggatcctat tgattgtcga cgatgtgcag atgggctgcg gccgaacagg gacgtttttc 1680

agctttgagg aggctggcat agagcctgat attgtctgct tatccaagtc gatcagcgga 1740

tttggcactc ctatggctct aaccttgttc cgcccagagc tggacgtctg ggagcctggg 1800

gagcataatg gcacattccg cggacataac ctggccttca tcacggccac cgaggcgctc 1860

gagtattgga aaacctctgc ttttagcaca gaaatacgca ggaaagggac aattgtccac 1920

gaattcctgc aagaggttgt tcgcgatttc cctgagctgc aaggtgaagt gagaggcaaa 1980

gggcttatgc agggcattgc tatcggtgtt gatggcctgg cttcagaaat aagcaaagcc 2040

gcctttaaca atggcttgat catggaaacc tcgggaaccg acagtgaggt tattaaaata 2100

atgccgcctt taacgattga cgatgccggc cttcttcaag gcttgcaatt attcaagaac 2160

agcattcaag ccactgtaac caagctgagt tcaaaaaaac aacataagga agacggtgca 2220

gcacatgatc gtacgtaatt taactttaag aaggagatat acatgatcgt acgtaattta 2280

tcagatatcg caggtacaga gcaggacgta ggtgcagaga cctggaacag cagaagattg 2340

ctgcttagca aagatggagt tggcttttcc ctgcatgata ccgtaataaa agcaaataca 2400

gaaacagaaa tgtggtacaa acatcatatt gaggcggtct actgcatcca gggaaatggt 2460

cagatccgaa cgttagaaga cggcaaggtg tacccgattc aacccggaac gctgtatgtg 2520

cttaataaac acgaaaagca tattttgcaa tgcaaggatg agctcagact gatttgtgtc 2580

ttcaatcccc cctgtacggg aaatgaagtg catgcagaag acggaagcta cccgctaatt 2640

actgaataaa agcttggctg ttttggcgga tgagagaaga ttttcagcct gatacagatt 2700

aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag tagcgcggtg 2760

gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg 2820

gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa aggctcagtc 2880

gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac 2940

aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg 3000

acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga cggatggcct 3060

ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat atgtatccgc 3120

tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 3180

ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 3240

ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 3300

gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 3360

gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtgttg 3420

acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 3480

actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 3540

ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 3600

cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 3660

gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 3720

caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 3780

aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 3840

ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 3900

tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 3960

ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 4020

ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 4080

ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 4140

tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 4200

cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 4260

taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 4320

gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 4380

acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 4440

ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 4500

ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 4560

cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 4620

aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 4680

gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 4740

gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 4800

gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 4860

ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 4920

ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 4980

tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc 5040

tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc tatcgctacg 5100

tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 5160

ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 5220

tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt cgcgcgcgaa 5280

ggcgaagcgg catgcataat gtgcctgtca aatggacgaa gcagggattc tgcaaaccct 5340

atgctactcc gtcaagccgt caattgtctg attcgttacc aattatgaca acttgacggc 5400

tacatcattc actttttctt cacaaccggc acggaactcg ctcgggctgg ccccggtgca 5460

ttttttaaat acccgcgaga aatagagttg atcgtcaaaa ccaacattgc gaccgacggt 5520

ggcgataggc atccgggtgg tgctcaaaag cagcttcgcc tggctgatac gttggtcctc 5580

gcgccagctt aagacgctaa tccctaactg ctggcggaaa agatgtgaca gacgcgacgg 5640

cgacaagcaa acatgctgtg cgacgctggc gatatcaaaa ttgctgtctg ccaggtgatc 5700

gctgatgtac tgacaagcct cgcgtacccg attatccatc ggtggatgga gcgactcgtt 5760

aatcgcttcc atgcgccgca gtaacaattg ctcaagcaga tttatcgcca gcagctccga 5820

atagcgccct tccccttgcc cggcgttaat gatttgccca aacaggtcgc tgaaatgcgg 5880

ctggtgcgct tcatccgggc gaaagaaccc cgtattggca aatattgacg gccagttaag 5940

ccattcatgc cagtaggcgc gcggacgaaa gtaaacccac tggtgatacc attcgcgagc 6000

ctccggatga cgaccgtagt gatgaatctc tcctggcggg aacagcaaaa tatcacccgg 6060

tcggcaaaca aattctcgtc cctgattttt caccaccccc tgaccgcgaa tggtgagatt 6120

gagaatataa cctttcattc ccagcggtcg gtcgataaaa aaatcgagat aaccgttggc 6180

ctcaatcggc gttaaacccg ccaccagatg ggcattaaac gagtatcccg gcagcagggg 6240

atcattttgc gcttcagcca tacttttcat actcccgcca ttcagag 6287

Claims

1.核酸分子，其特征在于：所述核酸分子编码名称分别为EctA、EctB和EctC的三种蛋白质；

所述EctA为下述任一种蛋白质：

A1)氨基酸序列是SEQ ID No.1的蛋白质；

A3)在A1)或A2)的N端和/或C端连接标签得到的融合蛋白质；

所述EctB为下述任一种蛋白质：

B1)氨基酸序列是SEQ ID No.2的蛋白质；

B3)在B1)或B2)的N端和/或C端连接标签得到的融合蛋白质；

所述EctC为下述任一种蛋白质：

C1)氨基酸序列是SEQ ID No.3的蛋白质；

C3)在C1)或C2)的N端和/或C端连接标签得到的融合蛋白质；

2.根据权利要求1所述的核酸分子，其特征在于，所述核酸分子为DNA分子。

3.根据权利要求1或2所述的核酸分子，其特征在于，所述核酸分子是由SEQ ID No.4所示的DNA、SEQ ID No.5所示的DNA和SEQ ID No.6所示的DNA连接而成的DNA分子。

4.根据权利要求1、2或3所述的核酸分子，其特征在于，所述核酸分子是下述任一种DNA分子：

D1)核苷酸序列是SEQ ID No.7的DNA分子。

D2)核苷酸序列是SEQ ID No.7的第319-2649位DNA分子。

5.重组微生物，其特征在于，所述重组微生物含有权利要求1-4中任一所述的核酸分子和/或表达权利要求1中所述EctA、EctB和EctC的三种蛋白质。

6.用于制备四氢嘧啶的蛋白质组合物，其特征在于，所述蛋白质组合物由权利要求1中所述EctA、EctB和EctC的三种蛋白质组成。

7.构建权利要求5所述重组微生物的方法，其特征在于，所述方法包括将权利要求1所述的核酸分子导入受体微生物得到所述重组微生物。

8.一种制备四氢嘧啶的方法，其特征在于，所述方法包括利用权利要求5所述的重组微生物生产四氢嘧啶。

9.与权利要求1-4中任一所述核酸分子相关的生物材料，其特征在于，所述生物材料为下述E1)-E10)中的任一种：

E1)权利要求1中所述EctA、EctB或EctC；

E2)编码权利要求1中所述EctA的核酸分子；

E3)编码权利要求1中所述EctB的核酸分子；

E4)编码权利要求1中所述EctC的核酸分子；

E5)含有权利要求1-4中任一所述核酸分子的表达盒；

E6)含有权利要求1-4中任一所述核酸分子的重组载体、或含有E5)所述表达盒的重组载体；

E7)含有权利要求1-4中任一所述核酸分子的重组微生物、或含有E5)所述表达盒的重组微生物、或含有E6)所述重组载体的重组微生物；

E8)含有权利要求1-4中任一所述核酸分子的转基因植物细胞系、或含有E5)所述表达盒的转基因植物细胞系；

E9)含有权利要求1-4中任一所述核酸分子的转基因植物组织、或含有E5)所述表达盒的转基因植物组织；

E10)含有权利要求1-4中任一所述核酸分子的转基因植物器官、或含有E5)所述表达盒的转基因植物器官。

10.权利要求1-4任一所述的核酸分子和/或权利要求5所述的重组微生物和/或权利要求6所述的蛋白质组合物和/或权利要求9所述的生物材料在合成四氢嘧啶中的应用。