发明内容
本发明所要解决的技术问题是提供一种新颖的四氢嘧啶生物合成基因和基因簇,以及利用该基因簇构建的高产四氢嘧啶的菌株。
为解决上述技术问题,本发明首先提供了核酸分子,名称为NEctABC,所述核酸分子编码名称分别为EctA、EctB和EctC的三种蛋白质;
所述EctA为下述任一种蛋白质:
A1)氨基酸序列是SEQ ID No.1的蛋白质;
A2)将SEQ ID No.1的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
A3)在A1)或A2)的N端和/或C端连接标签得到的融合蛋白质;
A4)在A1)或A2)的N端和/或C端和/或氨基酸侧链基团上进行修饰得到的具有相同功能的蛋白质衍生物;
所述EctB为下述任一种蛋白质:
B1)氨基酸序列是SEQ ID No.2的蛋白质;
B2)将SEQ ID No.2的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
B3)在B1)或B2)的N端和/或C端连接标签得到的融合蛋白质;
B4)在B1)或B2)的N端和/或C端和/或氨基酸侧链基团上进行修饰得到的具有相同功能的蛋白质衍生物;
所述EctC为下述任一种蛋白质:
C1)氨基酸序列是SEQ ID No.3的蛋白质;
C2)将SEQ ID No.3的氨基酸序列经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与C1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
C3)在C1)或C2)的N端和/或C端连接标签得到的融合蛋白质;
C4)在C1)或C2)的N端和/或C端和/或氨基酸侧链基团上进行修饰得到的具有相同功能的蛋白质衍生物。
所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如mRNA或hnRNA等。
进一步地,所述核酸分子可为DNA分子。
进一步地,所述DNA分子可为四氢嘧啶生物合成基因簇。
所述基因簇包含SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子。
所述氨基酸序列是SEQ ID No.1的蛋白质为氨基丁酸乙酰基转移酶(EctA);
所述氨基酸序列是SEQ ID No.2的蛋白质为二氨基丁酸氨基转移酶(EctB);
所述氨基酸序列是SEQ ID No.3的蛋白质为四氢嘧啶合成酶(EctC)。
A3)、B3)、C3)所述标签如表1所示:
表1:标签的序列
标签 |
残基 |
序列 |
Poly-Arg |
5-6(通常为5个) |
RRRRR |
Poly-His |
2-10(通常为6个) |
HHHHHH |
FLAG |
8 |
DYKDDDDK |
Strep-tag II |
8 |
WSHPQFEK |
c-myc |
10 |
EQKLISEEDL |
A4)、B4)、C4)所述修饰可为氨基化、酰胺化、羟基化、羧基化、羰基化、烷基化、乙酰化、磷酸化、酯化、糖基化、环化、生物素化、荧光基团修饰、聚乙二醇PEG修饰或固定化修饰。
上述A2)、B2)、C2)中蛋白质可分别为与SEQ ID No.1、SEQ ID No.2、SEQ ID No.3所示蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。
上述A2)、B2)、C2)中的蛋白质的编码核苷酸可分别通过将SEQ ID No.4、SEQ IDNo.5、SEQ ID No.6所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连上表1所示的标签的编码序列得到。
上述核酸分子中,所述核酸分子NEctABC可由SEQ ID No.4所示的DNA、SEQ IDNo.5所示的DNA和SEQ ID No.6所示的DNA连接而成的DNA分子。
上述核酸分子中:
SEQ ID No.4所示的DNA分子编码SEQ ID No.1所示的EctA蛋白质;
SEQ ID No.5所示的DNA分子编码SEQ ID No.2所示的EctB蛋白质;
SEQ ID No.6所示的DNA分子编码SEQ ID No.3所示的EctC蛋白质。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化或点突变的方法,对本发明的编码EctA、EctB或EctC蛋白质的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明分离得到的EctA、EctB或EctC蛋白质的核苷酸序列75%或者更高同一性的核苷酸,只要编码EctA、EctB或EctC蛋白质且分别具有EctA、EctB或EctC蛋白质的功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。
本文中,同一性是指氨基酸序列或核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
本文中,所述80%以上的同一性可为至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
上述核酸分子中,
所述核酸分子可为下述任一种DNA分子:
D1)核苷酸序列是SEQ ID No.7的DNA分子。
D2)核苷酸序列是SEQ ID No.7的第319-2649位DNA分子。
本发明还提供了重组微生物,所述重组微生物含有所述核酸分子NEctABC和/或表达所述EctA、EctB和EctC的三种蛋白质。
所述重组微生物含有所述四氢嘧啶生物合成基因簇。
本发明还提供了用于制备四氢嘧啶的蛋白质组合物,所述蛋白质组合物由所述EctA、EctB和EctC三种蛋白质组成。
本发明还提供了构建所述重组微生物的方法,所述方法包括将所述核酸分子NEctABC导入受体微生物得到所述重组微生物。
进一步地,所述重组微生物可为高产四氢嘧啶的重组微生物。
在本发明的一个实施方案中,构建所述重组微生物的方法为:用氯化钙化学转化法将重组载体pBAD-EctABC转化至大肠杆菌K-12系列表达菌株BW25113中,用含有氨苄青霉素的LB培养基进行筛选培养,获得重组表达菌株BW-pBAD-EctABC(重组大肠杆菌BW-pBAD-EctABC)。
用于在各种不同的受体微生物中克隆和表达蛋白质的方法是众所周知的。合适的受体微生物可以是大肠杆菌、枯草杆菌、酵母、昆虫细胞、杆状病毒、培养的哺乳类动物细胞或整体动植物等。可选择或构建含有合适调节序列的合适载体,所述调节序列包括启动子序列、终止子序列、多腺苷酸化信号、增强子序列、标记基因和适当时的其它序列。
使用本领域公知的技术,包括但不限于,接合,电穿孔,化学转化,转导,转染,和超声波转化,可以将所述重组载体导入所述受体微生物中。
本发明还提供了一种制备四氢嘧啶的方法,所述方法包括利用所述重组微生物生产四氢嘧啶。
进一步地,所述制备四氢嘧啶的方法可为发酵法制备四氢嘧啶。
进一步地,所述制备四氢嘧啶的方法包括在合适的培养基中培养所述重组微生物,以及从所述培养基回收四氢嘧啶的步骤,所述培养基包含含有葡萄糖的可发酵碳源。
进一步地,所述制备四氢嘧啶的方法还包括在发酵体系中加入L-阿拉伯糖的诱导培养过程。
进一步地,所述制备四氢嘧啶的方法包括如下步骤:
(1)制备种子液:挑取所述重组大肠杆菌单菌落接于20ml含有氨苄青霉素(100μg/ml)的LB培养基中,于37℃、200rpm培养12小时;然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)的种子培养基中,37℃、200rpm振荡培养12小时,即得种子液;
(2)菌体培养:将300mL步骤(1)所述重组大肠杆菌的种子液接种于2.7L含氨苄青霉素(100μg/ml)的发酵培养基中,搅拌培养至葡萄糖消耗完时流加补料培养基,补料培养基的流加速度为50mL/h,流加至菌体密度OD600达到20,菌体流加培养过程结束;
(3)诱导培养:将步骤(2)流加培养后的发酵液的温度降至30℃,加入L-阿拉伯糖,使得L-阿拉伯糖终浓度为1g/L,进行诱导培养,同时加入天冬氨酸钠终浓度为20g/L,甘油终浓度为体积占比5%;诱导培养过程中一直流加补料培养基,补料培养基的流加速度调至20mL/h;流加至菌体密度OD600达到60,诱导培养及转化过程结束;
(4)通过HPLC检测发酵液中的四氢嘧啶的浓度。
进一步地,上述方法中,所述菌体培养的条件为:培养温度为37℃,控制菌体培养体系的溶氧在20%以上,和维持pH至7.0;
具体的,通过调整搅拌速度和通气量控制菌体培养体系的溶氧在20%以上,所述搅拌速度为500-800转/分钟,通气量为3L/min;具体的,通过2.7M氨水和1M磷酸维持pH至7.0;
进一步地,所述诱导培养的条件为:培养温度为30℃,控制诱导培养体系的溶氧在20%以上,和维持pH至7.0;
具体的,通过调整搅拌速度和通气量控制诱导培养体系的溶氧在20%以上,所述搅拌速度为500-800转/分钟,通气量为3L/min;具体的,通过2.7M氨水和1M磷酸维持pH至7.0;
每1L发酵培养基的配制:葡萄糖10g,(NH4)2HPO4 8g,KH2PO4 13.3g,MgSO4·7H2O1.2g,柠檬酸1.7g,微量盐溶液10mL,用水定溶至1L,5M NaOH调至pH7.0;
每1L补料培养基的配制:葡萄糖400g,MgSO4·7H2O 10g,微量盐溶液20mL,用水定容至1L;
每1L微量盐溶液的配制:FeSO4·7H2O 10g,ZnSO4·7H2O 2.25g,CuSO4·5H2O 1g,MnSO4·5H2O 0.5g,Na2B4O7·10H2O 0.23g,CaCl2·2H2O 2g,(NH4)6Mo7O24 0.1g,用5M盐酸水溶液定容,定容至1L。
所述种子培养基的配制:蛋白胨15g,酵母膏10g,氯化钠5g,用水定容至1L,pH7.0。
上述方法中,所述重组大肠杆菌具体可为重组大肠杆菌BW-pBAD-EctABC。本发明还提供了与所述核酸分子NEctABC相关的生物材料,所述生物材料为下述E1)-E10)中的任一种:
E1)所述EctA、EctB或EctC;
E2)编码所述EctA的核酸分子;
E3)编码所述EctB的核酸分子;
E4)编码所述EctC的核酸分子;
E5)含有所述核酸分子NEctABC的表达盒;
E6)含有所述核酸分子NEctABC的重组载体、或含有E5)所述表达盒的重组载体;
E7)含有所述核酸分子NEctABC的重组微生物、或含有E5)所述表达盒的重组微生物、或含有E6)所述重组载体的重组微生物;
E8)含有所述核酸分子NEctABC的转基因植物细胞系、或含有E5)所述表达盒的转基因植物细胞系;
E9)含有所述核酸分子NEctABC的转基因植物组织、或含有E5)所述表达盒的转基因植物组织;
E10)含有所述核酸分子NEctABC的转基因植物器官、或含有E5)所述表达盒的转基因植物器官。
上述生物材料中,所述重组载体可含有所述四氢嘧啶生物合成基因簇;进一步地,所述重组载体可含有SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子;在本发明的一个实施例中,所述重组载体为核苷酸序列是SEQ ID No.7的DNA分子。
上述生物材料中,所述微生物可为酵母、细菌、藻或真菌。其中,细菌可来自埃希氏菌属(Escherichia),欧文氏菌(Erwinia),根癌农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium),产碱菌属(Alcaligenes),假单胞菌属(Pseudomonas),芽胞杆菌属(Bacillus)等。所述细菌具体可为大肠杆菌。进一步地,所述大肠杆菌为BW25113。
上述生物材料中,E6)中所述重组载体为下述任一种:
D1)含有SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子;
D2)核苷酸序列是SEQ ID No.7的DNA分子;
D3)含有所述四氢嘧啶生物合成基因簇。
所述核苷酸序列是SEQ ID No.7的重组载体名称为pBAD-EctABC。
进一步地,所述重组载体可为重组表达载体,所述重组表达载体为将SEQ IDNo.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子与目的载体连接,得到含有SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示DNA分子的重组表达载。
所述目的载体可为质粒、黏粒、噬菌体或病毒载体。所述质粒具体可为pBAD/HisA,也可为将pBAD/HisA改造后得到的载体。虽然本发明的一个实施例中的目的载体使用了pBAD/HisA载体,但本发明不限于该特定载体。本领域技术人员可采用其它合适的载体,实现本发明所述的技术方案,这些替代载体未脱离本发明的范围,本发明应包括这些替代载体。
进一步地,本发明的一个实施方案是通过无缝克隆(Seamless Cloning)技术将SEQ ID No.4、SEQ ID No.5和SEQ ID No.6所示的DNA分子与线性化后的载体pBAD/HisA连接,构建重组表达载体。本领域技术人员能够使用广泛已知的方法来构建本发明所述重组表达载体,如可以利用传统的克隆技术,将目的基因通过酶切连接后定向克隆到目的载体上。本发明的重组表达载体具体可为核苷酸序列是SEQ ID No.7的重组表达载体pBAD-EctABC。
本发明还提供了所述核酸分子NEctABC和/或所述重组微生物和/或所述蛋白质组合物和/或所述生物材料在合成四氢嘧啶中的应用。
目前报道可使用的四氢嘧啶基因合成簇较少,而根据四氢嘧啶特殊的“保护者”身份,含有四氢嘧啶合成簇的微生物多存在于盐碱滩涂、深海高压低温、高温热泉等极端环境中,恶劣的生态环境更需要微生物利用四氢嘧啶等物质保持自身渗透压平衡,维持细胞内的环境的相对稳态。我国云南省腾冲县具有丰富的热泉资源,绮丽绚烂的火山伴泉、热泉造就了独特的嗜热微生物资源宝库。前期实验室从云南腾冲蛤蟆嘴热泉底泥取样,成功构建了宏基因组文库,对该热泉底泥文库进行四氢嘧啶基因合成簇筛选后,成功鉴定到多条四氢嘧啶基因合成簇。其中一条被注释为来自类芽孢杆菌的四氢嘧啶基因簇成功实现了在大肠杆菌中的异源表达。后续转化实验证明该菌株能够高效的进行四氢嘧啶合成。
本发明挖掘了新的四氢嘧啶生物合成基因簇,并以大肠杆菌为底盘细胞,将三个基因整合到pBAD/HisA载体中,转化入大肠杆菌BW25113菌株,实现了四氢嘧啶在大肠杆菌中高效的分泌合成,从而构建出了高产四氢嘧啶的基因工程菌,通过优化发酵条件、诱导剂浓度等增强基因表达量,从原料天冬氨酸钠出发进行生物转化,增加四氢嘧啶的生物合成,对比于野生菌株BW25113,能够高效的合成四氢嘧啶,为四氢嘧啶的产业化奠定基础。
实验表明,本发明中的四氢嘧啶合成菌株,单位菌体的四氢嘧啶合成效率显著高于对照菌株,发酵罐培养72h的产量可达10.02g/L,该产量已达到国际先进水平。同时,四氢嘧啶绝大部分产物分泌至胞外,便于产物的下游纯化分离。本发明丰富了四氢嘧啶合成簇,为提供更多的候选基因便于后续开发四氢嘧啶高产菌株提供了新思路,对四氢嘧啶的工业化生产和产业化发展具有重大意义。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例中所使用引物序列均在北京生工生物工程股份有限公司直接合成获得;
pBAD/HisA购自invitrogen,产品目录号为V430-01。
大肠杆菌BW25113菌株为Thermo产品,Cat#OEC5042。
实施例1、大肠杆菌四氢嘧啶高产菌株的构建
1、PCR扩增四氢嘧啶合成相关基因的编码序列
以保存的宏基因组文库DNA为模板,用引物F1、R1进行PCR扩增,得到PCR扩增产物EctA基因,即片段1。该EctA基因含有编码序列是SEQ ID No.4的DNA分子。SEQ ID No.4所示的DNA分子编码SEQ ID No.1所示的EctA蛋白质。
以保存的宏基因组文库DNA为模板,用引物F2、R2进行PCR扩增,得到PCR扩增产物EctB基因,即片段2。该EctB基因含有编码序列是SEQ ID No.5的DNA分子。SEQ ID No.5所示的DNA分子编码SEQ ID No.2所示的EctB蛋白质。
以保存的宏基因组文库DNA为模板,用引物F3、R3进行PCR扩增,得到PCR扩增产物EctC基因,即片段3。该EctC基因含有编码序列是SEQ ID No.6的DNA分子。SEQ ID No.6所示的DNA分子编码SEQ ID No.3所示的EctC蛋白质。
以pBAD/HisA为模板,用引物F4,R4进行反向PCR扩增,得到PCR扩增产物pBAD/HisA载体线性片段。
引物序列如表1所示:
表1 PCR扩增四氢嘧啶合成相关基因的引物序列
2、无缝拼接
使用南京诺维赞公司生产的无缝拼接试剂盒,按照载体线性片段:片段1(EctA基因):片段2(EctB基因):片段3(EctC基因)摩尔比1:5:5:5比例混合,按照试剂盒要求加入酶和buffer,反应37℃,30min后放置于冰上,得到拼接产物。
3、转化、筛选以及序列验证
用氯化钙化学转化法将步骤2中的拼接产物转化至大肠杆菌DH5α,用含有氨苄青霉素(100μg/ml)的LB培养基进行筛选培养,挑取单菌落,并进行扩大培养和提取质粒,进行测序验证。结果表明提取的质粒含有核苷酸序列是SEQ ID No.7的DNA分子。SEQ ID No.7中,第1-318位为pBAD/HisA载体序列,120-318为阿拉伯糖启动子和rbs,1-119为载体连接无功能区域,第319-837位为EctA的编码序列(编码氨基酸序列是SEQ ID No.1所示的EctA蛋白质),第838-861位为T7rbs序列(此为大肠杆菌中进行基因表达常用的rbs序列,提供核糖体结合位点,提高蛋白表达量),第862-2238位为EctB的编码序列(编码氨基酸序列是SEQID No.2所示的EctB蛋白质),第2239-2262位为T7rbs序列(此为大肠杆菌中进行基因表达常用的rbs序列,提供核糖体结合位点,提高蛋白表达量),第2263-2649位为EctC的编码序列(编码氨基酸序列是SEQ ID No3所示的EctC蛋白质),第2650-6287位为pBAD/HisA载体序列(2650-2857为MCS多克隆位点;2858-2944为终止子序列;2945-4204为氨苄抗性基因序列;4205-5382为复制起始位点ORI;5383-6287为araC蛋白,阿拉伯糖阻遏蛋白)。将该质粒命名为重组表达载体pBAD-EctABC。重组表达载体pBAD-EctABC为将片段1、片段2、片段3和pBAD/HisA载体线性片段进行无缝拼接得到的重组表达载。pBAD-EctABC含有核苷酸序列是SEQ ID No.7的DNA分子,可在大肠杆菌BW25113中表达氨基酸序列是SEQ ID No.1所示的EctA蛋白质、氨基酸序列是SEQ ID No.2所示的EctB蛋白质和氨基酸序列是SEQ ID No3所示的EctC蛋白质这三种蛋白质。
4、重组表达菌株的构建
用氯化钙化学转化法将重组表达载体pBAD-EctABC转化至大肠杆菌K-12系列表达菌株BW25113(基因型是rrnB3ΔlacZ4787 hsdR514Δ(araBAD)567Δ(rhaBAD)568rph-1)中,用LB+100μg/m L Amp液体培养基(LB+100μg/m L Amp液体培养基是向LB液体培养基中加入氨苄青霉素得到的液体培养基,LB+100μg/m L Amp液体培养基中氨苄青霉素的含量为100μg/m L)进行筛选培养,挑取单菌落,获得导入重组表达载体pBAD-EctABC的重组表达菌株记作重组大肠杆菌BW-pBAD-EctABC。
实施例2大肠杆菌四氢嘧啶的生物转化
1、摇瓶培养
实验重复三次,每次重复如下:
挑取实施例1的重组大肠杆菌BW-pBAD-EctABC单菌落接入LB+100μg/m L Amp液体培养基中,于37℃过夜培养。将过夜培养物接种于500ml的LB+100μg/m L Amp液体培养基,37℃剧烈振荡(200rpm)培养,至发酵液的OD600nm值达到0.6-0.8左右,再向发酵体系中加入L-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。5000rpm离心15分钟,收集菌体。
离心后菌体加入转化液重悬菌体至OD600nm值达到10,取25ml重悬菌液于250ml三角瓶中,30℃振荡(100rpm)反应分别在0小时、24小时、48小时、72小时和96小时,收集发酵液。
转化液成分:溶质及其浓度如下:10g/L葡萄糖,6g/L Na2HPO4,0.5g/L NaCl,3g/LKH2PO4,1g/L NH4Cl,246.5mg/L MgSO4·7H2O,14.7mg/L CaCl2·2H2O,27.8mg/L FeSO4·7H2O,2g/L酵母提取物;1%甘油;5g/L天冬氨酸钠;溶剂为水。
按照上述方法,以大肠杆菌BW25113(野生型)作为对照进行上述平行实验。
2、发酵罐发酵培养
实验重复三次,每次重复如下:
1)制备种子液:
挑取实施例1的重组大肠杆菌BW-pBAD-EctABC单菌落接入20mlLB+100μg/mL Amp液体培养基中,于37℃、200rpm培养12小时;然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)的种子培养基(向种子培养基中加入氨苄青霉素至氨苄青霉素的含量为100μg/ml得到的液体培养基)中,37℃、200rpm振荡培养12小时,即得种子液;
所述种子培养基的配制:蛋白胨15g,酵母膏10g,氯化钠5g,用水定容至1L,pH7.0。
2)菌体培养:
将300mL种子液接种于2.7L含氨苄青霉素(100μg/ml)的发酵培养基(向发酵培养基中加入氨苄青霉素至氨苄青霉素的含量为100μg/ml得到的液体培养基)的NBS Bioflo3000 6L发酵罐中,搅拌培养至葡萄糖消耗完时流加补料培养基,补料培养基的流加速度为50mL/h,流加至菌体密度OD600nm达到20,菌体培养过程结束,进入诱导培养阶段。该菌体培养的条件为:培养温度为37℃,控制菌体培养体系的溶氧在20%以上,和维持pH至7.0。具体的,通过调整搅拌速度和通气量控制菌体培养体系的溶氧在20%以上,所述搅拌速度为500-800转/分钟,通气量为3L/min;具体的,通过2.7M氨水和1M磷酸维持pH至7.0。
3)诱导培养过程:
将上述菌体培养后的发酵液的温度降至30℃,加入L-阿拉伯糖,使得L-阿拉伯糖终浓度为1g/L,进行诱导培养,同时加入天冬氨酸钠终浓度为20g/L,甘油终浓度为体积占比5%;诱导培养过程中要一直流加补料培养基,补料培养基的流加速度调至20mL/h;流加至菌体密度OD600nm达到60,诱导培养及转化过程结束。该诱导培养的条件为:培养温度为30℃,控制诱导培养体系的溶氧在20%以上,和维持pH至7.0;具体的,通过调整搅拌速度和通气量控制诱导培养体系的溶氧在20%以上,所述搅拌速度为500-800转/分钟,通气量为3L/min;具体的,通过2.7M氨水和1M磷酸维持pH至7.0。诱导培养时间分别是0小时、24小时、48小时、72小时和96小时,收集发酵液。
按照上述方法,以大肠杆菌BW25113(野生型)作为对照进行上述平行实验。
每1L发酵培养基的配制:葡萄糖10g,(NH4)2HPO4 8g,KH2PO4 13.3g,MgSO4·7H2O1.2g,柠檬酸1.7g,微量盐溶液10mL,用水定溶至1L,5M NaOH调至pH7.0;
每1L补料培养基的配制:葡萄糖400g,MgSO4·7H2O 10g,微量盐溶液20mL,用水定容至1L;
每1L微量盐溶液的配制:FeSO4·7H2O 10g,ZnSO4·7H2O 2.25g,CuSO4·5H2O 1g,MnSO4·5H2O 0.5g,Na2B4O7·10H2O 0.23g,CaCl2·2H2O 2g,(NH4)6Mo7O24 0.1g,用5M盐酸水溶液定容,定容至1L。
3、HPLC检测发酵液中的四氢嘧啶的浓度
将摇瓶培养和发酵罐培养后的发酵液5000rpm离心15min吸取上清液,按照上清液(如需要稀释10-50倍):水:乙腈体积比1:2:7制成待检测样品,0.22um有机型滤器过滤除去不溶物后HPLC检测四氢嘧啶浓度。HPLC检测仪为Agilent 1260 Infinity LC,检测柱为Agilent ZOBAX-NH2氨基柱。四氢嘧啶的紫外检测波长为215nm,流动相70%(V/V)乙腈水溶液,流速为1.0mL/min,进样量为10uL,采用外标法按峰面积定量。SIGMA生产四氢嘧啶作为定量标准品。实验重复三次。
上述实验结果表明:
本发明成功构建了四氢嘧啶合成基因的大肠杆菌表达载体pBAD-EctABC,及表达菌株BW-pBAD-EctABC。诱导表达后的菌体以天冬氨酸钠为前体通过生物转化的方法实现了四氢嘧啶的高效分泌型合成。图1为四氢嘧啶的HPLC检测结果,对照菌株(野生型)大肠杆菌BW25113并没有四氢嘧啶分泌到胞外,而重组大肠杆菌可以催化产生四氢嘧啶到大肠杆菌胞外。重组大肠杆菌BW-pBAD-EctABC在摇瓶中72h催化最终产生四氢嘧啶0.92g/L达到最高水平(图2)。重组大肠杆菌BW-pBAD-EctABC做上罐发酵,最终发酵72h四氢嘧啶的产量达到10.02g/L(图3)。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
SEQUENCE LISTING
<110> 深圳中科欣扬生物科技有限公司
<120> 云南腾冲来源四氢嘧啶合成基因簇及其应用
<160> 7
<170> PatentIn version 3.5
<210> 1
<211> 172
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 1
Met Leu Pro Asn Asp Ser Ile Glu Gln Ile Arg Phe Thr Thr Pro Glu
1 5 10 15
Val Arg His Gly Ser Ser Met Trp Lys Leu Val Ser Glu Ser Pro Ile
20 25 30
Leu Asp Asn Asn Ser Glu Tyr Cys Tyr Leu Met Leu Cys Lys Tyr Phe
35 40 45
Ala Asp Thr Cys Val Met Ala Glu Ile Gln Gly Glu Ile Val Gly Phe
50 55 60
Val Ser Ala Phe His Ala Pro Ala Glu Pro Glu Cys Leu Phe Ile Trp
65 70 75 80
Gln Ile Val Val Thr Pro Glu Leu His Gly Arg Gly Ile Gly Thr Glu
85 90 95
Leu Val Gln Glu Leu Leu Ser Arg Val Lys Gly Lys Asp Ile Arg Phe
100 105 110
Leu Glu Thr Thr Ile Ser Pro Gly Asn Val Ser Ser Glu Arg Leu Phe
115 120 125
Gln Lys Ile Ala Lys Glu Leu Ala Ala Ser Cys Thr Val Ser Glu Gly
130 135 140
Phe Leu Ser His Leu Phe Ser Asp Thr Glu His Glu Ala Glu Leu Leu
145 150 155 160
Tyr Arg Ile Gly Pro Phe Ser Leu Pro Gly Asn Ser
165 170
<210> 2
<211> 458
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 2
Met Val Ile Thr Lys Glu Asp Leu Thr Glu Lys Gln Ala Ser Asn Ser
1 5 10 15
Met Gln Thr Leu Glu Ser Leu Gln Ser Leu Gln Thr Phe Glu Gln Met
20 25 30
Glu Ser Glu Val Arg Ser Tyr Cys Arg Ser Phe Pro Ala Leu Phe Thr
35 40 45
Lys Gly Ser Gly His Thr Leu Trp Asp Ala Ser Gly Asn Ser Tyr Ile
50 55 60
Asp Phe Phe Ala Gly Ala Gly Ala Leu Asn Tyr Gly His Asn Asn Pro
65 70 75 80
Ala Met Lys Lys Lys Leu Ile Glu Tyr Val Gln Asn Asp Gly Val Thr
85 90 95
His Ser Leu Asp Met Ala Thr Glu Ala Lys Glu Gln Phe Leu Arg Arg
100 105 110
Phe Asn Glu Val Ile Leu Gln Pro Arg Lys Leu Lys Tyr Lys Ile Met
115 120 125
Phe Pro Gly Pro Thr Gly Thr Asn Ala Val Glu Ser Ala Leu Lys Leu
130 135 140
Ala Arg Lys Val Thr Gly Arg Ser Thr Val Val Gly Phe Thr Asn Ala
145 150 155 160
Phe His Gly Met Thr Leu Gly Ser Leu Ala Val Thr Gly Asn Lys Phe
165 170 175
Lys Arg Asn Gly Ala Gly Val Pro Leu His His Ala Leu Ser Met Pro
180 185 190
Tyr Asp Gly Tyr Phe Gly Pro Gly Val Asp Thr Leu Glu Tyr Leu Ser
195 200 205
Asn Tyr Leu Ser Asp Ser Gly Ser Gly Ile Ser Leu Pro Ala Ala Val
210 215 220
Ile Val Glu Thr Leu Gln Gly Glu Gly Gly Ile Tyr Glu Ala Ser Ile
225 230 235 240
Pro Trp Leu Gln Gly Leu Glu Gln Ile Cys Lys Ser Lys Gly Ile Leu
245 250 255
Leu Ile Val Asp Asp Val Gln Met Gly Cys Gly Arg Thr Gly Thr Phe
260 265 270
Phe Ser Phe Glu Glu Ala Gly Ile Glu Pro Asp Ile Val Cys Leu Ser
275 280 285
Lys Ser Ile Ser Gly Phe Gly Thr Pro Met Ala Leu Thr Leu Phe Arg
290 295 300
Pro Glu Leu Asp Val Trp Glu Pro Gly Glu His Asn Gly Thr Phe Arg
305 310 315 320
Gly His Asn Leu Ala Phe Ile Thr Ala Thr Glu Ala Leu Glu Tyr Trp
325 330 335
Lys Thr Ser Ala Phe Ser Thr Glu Ile Arg Arg Lys Gly Thr Ile Val
340 345 350
His Glu Phe Leu Gln Glu Val Val Arg Asp Phe Pro Glu Leu Gln Gly
355 360 365
Glu Val Arg Gly Lys Gly Leu Met Gln Gly Ile Ala Ile Gly Val Asp
370 375 380
Gly Leu Ala Ser Glu Ile Ser Lys Ala Ala Phe Asn Asn Gly Leu Ile
385 390 395 400
Met Glu Thr Ser Gly Thr Asp Ser Glu Val Ile Lys Ile Met Pro Pro
405 410 415
Leu Thr Ile Asp Asp Ala Gly Leu Leu Gln Gly Leu Gln Leu Phe Lys
420 425 430
Asn Ser Ile Gln Ala Thr Val Thr Lys Leu Ser Ser Lys Lys Gln His
435 440 445
Lys Glu Asp Gly Ala Ala His Asp Arg Thr
450 455
<210> 3
<211> 128
<212> PRT
<213> 人工序列(Artificial sequence)
<400> 3
Met Ile Val Arg Asn Leu Ser Asp Ile Ala Gly Thr Glu Gln Asp Val
1 5 10 15
Gly Ala Glu Thr Trp Asn Ser Arg Arg Leu Leu Leu Ser Lys Asp Gly
20 25 30
Val Gly Phe Ser Leu His Asp Thr Val Ile Lys Ala Asn Thr Glu Thr
35 40 45
Glu Met Trp Tyr Lys His His Ile Glu Ala Val Tyr Cys Ile Gln Gly
50 55 60
Asn Gly Gln Ile Arg Thr Leu Glu Asp Gly Lys Val Tyr Pro Ile Gln
65 70 75 80
Pro Gly Thr Leu Tyr Val Leu Asn Lys His Glu Lys His Ile Leu Gln
85 90 95
Cys Lys Asp Glu Leu Arg Leu Ile Cys Val Phe Asn Pro Pro Cys Thr
100 105 110
Gly Asn Glu Val His Ala Glu Asp Gly Ser Tyr Pro Leu Ile Thr Glu
115 120 125
<210> 4
<211> 519
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
atgttaccaa atgactctat tgaacaaata cgatttacca cccctgaggt acggcacgga 60
tcaagcatgt ggaagctcgt ctctgagagt ccgatcctgg ataataactc cgaatattgc 120
taccttatgc tgtgcaaata ttttgctgac acctgtgtca tggcggaaat tcagggggaa 180
atagtaggat ttgtgtccgc ctttcatgct cccgccgagc ccgagtgcct gtttatatgg 240
caaatcgtag ttaccccaga gctgcacggc agaggaatcg gaaccgaatt ggtgcaagaa 300
cttctctcaa gagtaaaggg caaggacatt cgtttcctgg agacaactat ttcccctggc 360
aatgtttctt cagagcggtt attccaaaag atcgccaaag agcttgctgc ctcatgcaca 420
gtttcagaag gatttttgag ccatctgttt tcagatacag agcatgaagc cgaattgctg 480
tatcgaatcg gacccttctc attacctggt aattcttga 519
<210> 5
<211> 1377
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 5
atggttataa ctaaagaaga tctgacagaa aaacaggcgt caaactccat gcaaacgctg 60
gaatcactcc agtcgttgca aacctttgag caaatggaat ctgaggttcg cagctactgc 120
cgttctttcc cggccctgtt cacaaaggga agcgggcaca cattgtggga cgcctccggc 180
aattcgtata tcgatttttt tgcaggtgct ggagcattga attacggtca caataatcca 240
gccatgaaaa aaaagctgat cgaatatgta caaaatgacg gggtgaccca cagtctggat 300
atggccacag aagcgaaaga gcaattcctc cgccgattta atgaagtcat tctacagccc 360
cggaagctga agtataagat catgtttcca ggacctaccg gcacaaatgc agtggaaagt 420
gctttaaagc ttgcccgcaa ggtaacagga cgctccaccg tcgttggttt tacgaatgct 480
tttcatggca tgacattagg ctccttggcc gtaacgggaa ataaatttaa acgcaatgga 540
gcaggcgtac cgcttcatca tgccctatcc atgccatatg acggttactt tggtccaggc 600
gtggacacgc tcgaatactt gagcaactac ttatccgata gcgggagcgg catttcactg 660
cctgcggctg taatcgtaga aacgctgcaa ggagaaggcg gtatttatga agcaagcatc 720
ccttggctgc aagggttgga gcaaatctgc aaaagcaaag ggatcctatt gattgtcgac 780
gatgtgcaga tgggctgcgg ccgaacaggg acgtttttca gctttgagga ggctggcata 840
gagcctgata ttgtctgctt atccaagtcg atcagcggat ttggcactcc tatggctcta 900
accttgttcc gcccagagct ggacgtctgg gagcctgggg agcataatgg cacattccgc 960
ggacataacc tggccttcat cacggccacc gaggcgctcg agtattggaa aacctctgct 1020
tttagcacag aaatacgcag gaaagggaca attgtccacg aattcctgca agaggttgtt 1080
cgcgatttcc ctgagctgca aggtgaagtg agaggcaaag ggcttatgca gggcattgct 1140
atcggtgttg atggcctggc ttcagaaata agcaaagccg cctttaacaa tggcttgatc 1200
atggaaacct cgggaaccga cagtgaggtt attaaaataa tgccgccttt aacgattgac 1260
gatgccggcc ttcttcaagg cttgcaatta ttcaagaaca gcattcaagc cactgtaacc 1320
aagctgagtt caaaaaaaca acataaggaa gacggtgcag cacatgatcg tacgtaa 1377
<210> 6
<211> 387
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 6
atgatcgtac gtaatttatc agatatcgca ggtacagagc aggacgtagg tgcagagacc 60
tggaacagca gaagattgct gcttagcaaa gatggagttg gcttttccct gcatgatacc 120
gtaataaaag caaatacaga aacagaaatg tggtacaaac atcatattga ggcggtctac 180
tgcatccagg gaaatggtca gatccgaacg ttagaagacg gcaaggtgta cccgattcaa 240
cccggaacgc tgtatgtgct taataaacac gaaaagcata ttttgcaatg caaggatgag 300
ctcagactga tttgtgtctt caatcccccc tgtacgggaa atgaagtgca tgcagaagac 360
ggaagctacc cgctaattac tgaataa 387
<210> 7
<211> 6287
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 7
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat gttaccaaat gactctattg aacaaatacg atttaccacc 360
cctgaggtac ggcacggatc aagcatgtgg aagctcgtct ctgagagtcc gatcctggat 420
aataactccg aatattgcta ccttatgctg tgcaaatatt ttgctgacac ctgtgtcatg 480
gcggaaattc agggggaaat agtaggattt gtgtccgcct ttcatgctcc cgccgagccc 540
gagtgcctgt ttatatggca aatcgtagtt accccagagc tgcacggcag aggaatcgga 600
accgaattgg tgcaagaact tctctcaaga gtaaagggca aggacattcg tttcctggag 660
acaactattt cccctggcaa tgtttcttca gagcggttat tccaaaagat cgccaaagag 720
cttgctgcct catgcacagt ttcagaagga tttttgagcc atctgttttc agatacagag 780
catgaagccg aattgctgta tcgaatcgga cccttctcat tacctggtaa ttcttgattt 840
aactttaaga aggagatata catggttata actaaagaag atctgacaga aaaacaggcg 900
tcaaactcca tgcaaacgct ggaatcactc cagtcgttgc aaacctttga gcaaatggaa 960
tctgaggttc gcagctactg ccgttctttc ccggccctgt tcacaaaggg aagcgggcac 1020
acattgtggg acgcctccgg caattcgtat atcgattttt ttgcaggtgc tggagcattg 1080
aattacggtc acaataatcc agccatgaaa aaaaagctga tcgaatatgt acaaaatgac 1140
ggggtgaccc acagtctgga tatggccaca gaagcgaaag agcaattcct ccgccgattt 1200
aatgaagtca ttctacagcc ccggaagctg aagtataaga tcatgtttcc aggacctacc 1260
ggcacaaatg cagtggaaag tgctttaaag cttgcccgca aggtaacagg acgctccacc 1320
gtcgttggtt ttacgaatgc ttttcatggc atgacattag gctccttggc cgtaacggga 1380
aataaattta aacgcaatgg agcaggcgta ccgcttcatc atgccctatc catgccatat 1440
gacggttact ttggtccagg cgtggacacg ctcgaatact tgagcaacta cttatccgat 1500
agcgggagcg gcatttcact gcctgcggct gtaatcgtag aaacgctgca aggagaaggc 1560
ggtatttatg aagcaagcat cccttggctg caagggttgg agcaaatctg caaaagcaaa 1620
gggatcctat tgattgtcga cgatgtgcag atgggctgcg gccgaacagg gacgtttttc 1680
agctttgagg aggctggcat agagcctgat attgtctgct tatccaagtc gatcagcgga 1740
tttggcactc ctatggctct aaccttgttc cgcccagagc tggacgtctg ggagcctggg 1800
gagcataatg gcacattccg cggacataac ctggccttca tcacggccac cgaggcgctc 1860
gagtattgga aaacctctgc ttttagcaca gaaatacgca ggaaagggac aattgtccac 1920
gaattcctgc aagaggttgt tcgcgatttc cctgagctgc aaggtgaagt gagaggcaaa 1980
gggcttatgc agggcattgc tatcggtgtt gatggcctgg cttcagaaat aagcaaagcc 2040
gcctttaaca atggcttgat catggaaacc tcgggaaccg acagtgaggt tattaaaata 2100
atgccgcctt taacgattga cgatgccggc cttcttcaag gcttgcaatt attcaagaac 2160
agcattcaag ccactgtaac caagctgagt tcaaaaaaac aacataagga agacggtgca 2220
gcacatgatc gtacgtaatt taactttaag aaggagatat acatgatcgt acgtaattta 2280
tcagatatcg caggtacaga gcaggacgta ggtgcagaga cctggaacag cagaagattg 2340
ctgcttagca aagatggagt tggcttttcc ctgcatgata ccgtaataaa agcaaataca 2400
gaaacagaaa tgtggtacaa acatcatatt gaggcggtct actgcatcca gggaaatggt 2460
cagatccgaa cgttagaaga cggcaaggtg tacccgattc aacccggaac gctgtatgtg 2520
cttaataaac acgaaaagca tattttgcaa tgcaaggatg agctcagact gatttgtgtc 2580
ttcaatcccc cctgtacggg aaatgaagtg catgcagaag acggaagcta cccgctaatt 2640
actgaataaa agcttggctg ttttggcgga tgagagaaga ttttcagcct gatacagatt 2700
aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag tagcgcggtg 2760
gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg 2820
gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa aggctcagtc 2880
gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac 2940
aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg 3000
acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga cggatggcct 3060
ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat atgtatccgc 3120
tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 3180
ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 3240
ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 3300
gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 3360
gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtgttg 3420
acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 3480
actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 3540
ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 3600
cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 3660
gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 3720
caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 3780
aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 3840
ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 3900
tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 3960
ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 4020
ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 4080
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 4140
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 4200
cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 4260
taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 4320
gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 4380
acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 4440
ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 4500
ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 4560
cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 4620
aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 4680
gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 4740
gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 4800
gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 4860
ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 4920
ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 4980
tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc 5040
tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc tatcgctacg 5100
tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 5160
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 5220
tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt cgcgcgcgaa 5280
ggcgaagcgg catgcataat gtgcctgtca aatggacgaa gcagggattc tgcaaaccct 5340
atgctactcc gtcaagccgt caattgtctg attcgttacc aattatgaca acttgacggc 5400
tacatcattc actttttctt cacaaccggc acggaactcg ctcgggctgg ccccggtgca 5460
ttttttaaat acccgcgaga aatagagttg atcgtcaaaa ccaacattgc gaccgacggt 5520
ggcgataggc atccgggtgg tgctcaaaag cagcttcgcc tggctgatac gttggtcctc 5580
gcgccagctt aagacgctaa tccctaactg ctggcggaaa agatgtgaca gacgcgacgg 5640
cgacaagcaa acatgctgtg cgacgctggc gatatcaaaa ttgctgtctg ccaggtgatc 5700
gctgatgtac tgacaagcct cgcgtacccg attatccatc ggtggatgga gcgactcgtt 5760
aatcgcttcc atgcgccgca gtaacaattg ctcaagcaga tttatcgcca gcagctccga 5820
atagcgccct tccccttgcc cggcgttaat gatttgccca aacaggtcgc tgaaatgcgg 5880
ctggtgcgct tcatccgggc gaaagaaccc cgtattggca aatattgacg gccagttaag 5940
ccattcatgc cagtaggcgc gcggacgaaa gtaaacccac tggtgatacc attcgcgagc 6000
ctccggatga cgaccgtagt gatgaatctc tcctggcggg aacagcaaaa tatcacccgg 6060
tcggcaaaca aattctcgtc cctgattttt caccaccccc tgaccgcgaa tggtgagatt 6120
gagaatataa cctttcattc ccagcggtcg gtcgataaaa aaatcgagat aaccgttggc 6180
ctcaatcggc gttaaacccg ccaccagatg ggcattaaac gagtatcccg gcagcagggg 6240
atcattttgc gcttcagcca tacttttcat actcccgcca ttcagag 6287