CN115074302A

CN115074302A - 一种产(-)-α-红没药醇的重组基因工程菌及其制备方法和用途

Info

Publication number: CN115074302A
Application number: CN202210535851.0A
Authority: CN
Inventors: 毛巧利; 厉晓波; 童丽珍; 赵华
Original assignee: Shanghai Ruikang Biotechnology R & D Co ltd
Current assignee: Shanghai Ruikang Biotechnology R & D Co ltd
Priority date: 2022-05-17
Filing date: 2022-05-17
Publication date: 2022-09-20

Abstract

本发明涉及一种产(‑)‑α‑红没药醇的重组基因工程菌，它是包含(‑)‑α‑红没药醇合成酶MrBBS基因、法尼基二磷酸合酶ispA基因、MVA途径基因的重组大肠杆菌；所述(‑)‑α‑红没药醇合成酶MrBBS基因与法尼基二磷酸合酶ispA基因之间通过SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列连接。本发明通过将特定的基因重组入大肠杆菌，同时在重组大肠杆菌中将MrBBS基因、ispA基因之间通过短肽编码序列连接，并过表达相关基因，使之在生产过程的摇瓶阶段产量就高达6.8g/L，适宜实际推广应用。

Description

一种产(-)-α-红没药醇的重组基因工程菌及其制备方法和用途

技术领域

本发明属于基因重组发酵技术领域，具体涉及一种产(-)-α-红没药醇的重组基因工程菌及其制备方法和用途。

背景技术

红没药醇是一种有机化合物，分子式为C₁₅H₂₆O，是一种存在天然精油中无毒的倍半萜烯醇；在自然界中以两种结构形式存在：β和α。β-红没药醇是从玉米和棉花中收获的，主要用作调味剂。(-)-α-红没药醇主要存在于春黄菊精油中，含量达17％，其右旋体存在于胶杨精油以及某些苦槛蓝属和鼠尾草属的精油中，具有消炎、灭菌、愈合溃疡、溶解胆石等药效，故在医药行业中的用途较广。

(-)-α-红没药醇能够保护和治愈皮肤，使其免受日常张力的影响，能够加速皮肤的治愈过程，尤其适用于作为敏感皮肤和身体，被广泛应用于个人护肤(皮肤和身体的护理液、须后水和晒后护理产品)的配方中，加上其抗炎、天然、安全特性，使其成为一种用于皮肤护理的常用活性成分。国际上仅个人护理产品上的应用年需求量达到400t以上，逐渐成为个人护肤品原料新宠；此外，(-)-α-红没药醇香气清淡愉快，也是一种稳定性较好的定香剂，在香料香精中的应用也日益受到重视；然而，(-)-α-红没药醇作为次级代谢产物，纯天然从植物提取的量俨然无法满足市场的需求，因其受制于生物生长周期，环境等各种因素，扩大生产规模会导致生态环境的破坏甚至物种灭绝；若采用化学合成方法，α-红没药醇复杂手性化学结构，使得直接化学合成难度高，生物活性低以及纯度低等弊端。因此，利用合成生物学构建工程菌实现以廉价的碳源和培养基生产具有高附加值的(-)-α-红没药醇是一条最具有潜力的途径。

目前文献报道中，利用基因工程菌生产(-)-α-红没药醇，发酵罐取得一定成果，但摇瓶产量并不理想；2016年Gui Hwan Han等人以大肠杆菌为宿主细胞，通过质粒过表达德国洋甘菊来源的(-)-α-红没药醇合成酶MrBBS、大肠杆菌来源的ispA以及外源性MVA途径，从而获得最终产(-)-α-红没药醇基因工程菌，发酵48h后产量仅为0.08g/L；CN110016458A公开了一种利用基因工程菌生产(-)-α-红没药醇的方法，其虽然摇瓶产量达到4.15g/L，但还有进一步提高的空间，使发酵罐放大生产后的产量呈倍数级提高。

发明内容

为解决上述问题，本发明提供了一种产(-)-α-红没药醇的重组基因工程菌，它是包含(-)-α-红没药醇合成酶MrBBS基因、法尼基二磷酸合酶ispA基因、MVA途径基因的重组大肠杆菌；所述(-)-α-红没药醇合成酶MrBBS基因与法尼基二磷酸合酶ispA基因通过SEQID NO.7、SEQ ID NO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列连接。

进一步地，所述(-)-α-红没药醇合成酶MrBBS基因中的终止密码子TAA被SEQ IDNO.7、SEQ ID NO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列代替，并与无起始密码子ATG的法尼基二磷酸合酶ispA基因连接。

进一步地，所述(-)-α-红没药醇合成酶MrBBS基因5’端带有核苷酸序列SEQ IDNO.1。

更进一步地，所述(-)-α-红没药醇合成酶MrBBS基因来自春黄菊花；所述法尼基二磷酸合酶ispA基因来自大肠杆菌。

更进一步地，所述(-)-α-红没药醇合成酶MrBBS基因的核苷酸序列如SEQ IDNO.12所示；所述法尼基二磷酸合酶ispA基因的核苷酸序列如SEQ ID NO.13所示。

更进一步地，所述(-)-α-红没药醇合成酶MrBBS基因与法尼基二磷酸合酶ispA基因连接后的核苷酸序列如SEQ ID NO.52、SEQ ID NO.53、SEQ ID NO.54、SEQ ID NO.55或SEQ ID NO.56所示。

进一步地，所述MVA途径基因包括甲羟戊酸激酶mvaKmm基因、甲羟戊酸5-焦磷酸脱羧酶mvaD基因、磷酸甲羟戊酸激酶mvaK2基因、异戊烯基二磷酸δ-异构酶idi基因、3-羟基-3-甲基戊二酰CoA合酶mvaS基因、乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因和/或甲羟戊酸激酶mvaK1基因。

更进一步地，所述甲羟戊酸激酶mvaKmm基因来自甲烷八叠球古菌Methanosarcinamazei；

所述甲羟戊酸5-焦磷酸脱羧酶mvaD基因、磷酸甲羟戊酸激酶mvaK2基因和甲羟戊酸激酶mvaK1基因来自肺炎链球菌Streptococcus pneumoniae；

所述异戊烯二磷酸δ异构酶idi基因来自大肠杆菌Escherichia coli；

所述3-羟基-3-甲基戊二酰CoA合酶mvaS基因和乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因来自粪肠球菌Enterococcus faecalis。

更进一步地，所述甲羟戊酸激酶mvaKmm基因的核苷酸序列如SEQ ID NO.14所示，甲羟戊酸5-焦磷酸脱羧酶mvaD基因的核苷酸序列如SEQ ID NO.15所示，磷酸甲羟戊酸激酶mvaK2基因的核苷酸序列如SEQ ID NO.16所示，异戊烯二磷酸δ异构酶idi基因的核苷酸序列如SEQ ID NO.17所示，3-羟基-3-甲基戊二酰CoA合酶mvaS基因的核苷酸序列如SEQ IDNO.18所示，乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因的核苷酸序列如SEQ ID NO.19所示，甲羟戊酸激酶mvaK1基因的核苷酸序列如SEQ ID NO.20所示。

更进一步地，所述异戊烯基二磷酸δ-异构酶idi基因5’端带有核苷酸序列SEQ IDNO.3，乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因5’端带有核苷酸序列SEQ ID NO.4，3-羟基-3-甲基戊二酰CoA合酶mvaS基因5’端带有核苷酸序列SEQ ID NO.5，甲羟戊酸激酶mvaKmm基因5’端带有核苷酸序列SEQ ID NO.6。

更进一步地，所述MVA途径基因与(-)-α-红没药醇合成酶MrBBS基因和法尼基二磷酸合酶ispA基因连接在两个质粒上，其中一个质粒连接的核苷酸序列包括SEQ ID NO.52、SEQ ID NO.53、SEQ ID NO.54、SEQ ID NO.55或SEQ ID NO.56，以及SEQ ID NO.50，另一个质粒连接的核苷酸序列包括SEQ ID NO.51。

更进一步地，所述质粒优选为质粒pSTV28和质粒pTrc99A。

进一步地，所述重组大肠杆菌为重组大肠杆菌E.coli DH5α或E.coli W3110。

本发明还提供了一种前述重组基因工程菌的制备方法，它包括如下步骤：

1)取(-)-α-红没药醇合成酶MrBBS基因和法尼基二磷酸合酶ispA基因融合，融合产物与线性化表达载体连接，再导入大肠杆菌，提取重组表达载体；

所述(-)-α-红没药醇合成酶MrBBS基因中的终止密码子TAA被如SEQ ID NO.7、SEQID NO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列代替；

所述法尼基二磷酸合酶ispA基因中的起始密码子ATG被如SEQ ID NO.7、SEQ IDNO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列代替；

2)取MVA途径基因融合，融合产物与酶切后的步骤1)所得重组表达载体连接，再导入大肠杆菌，提取重组表达载体；

3)取甲羟戊酸激酶mvaK1基因，与包含甲羟戊酸5-焦磷酸脱羧酶mvaD基因、磷酸甲羟戊酸激酶mvaK2基因和异戊烯基二磷酸δ-异构酶idi基因的基因片段融合，融合产物与线性化表达载体连接，再导入大肠杆菌，提取重组表达载体；

4)将步骤2)所得重组表达载体和步骤3)所得重组表达载体，导入大肠杆菌中，即得重组基因工程菌。

进一步地，步骤1)所述表达载体为质粒pSTV28。

进一步地，步骤2)所述取MVA途径基因融合是取包含甲羟戊酸激酶mvaKmm基因、甲羟戊酸5-焦磷酸脱羧酶mvaD基因、磷酸甲羟戊酸激酶mvaK2基因和异戊烯基二磷酸δ-异构酶idi基因的基因片段，与包含3-羟基-3-甲基戊二酰CoA合酶mvaS基因和乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因的基因片段融合。

进一步地，步骤3)所述表达载体为质粒pTrc99A。

本发明还提供了一种前述的重组基因工程菌在制备(-)-α-红没药醇及其制剂中的用途。

本发明最后提供了一种产(-)-α-红没药醇的方法，它包括如下步骤：

取前述的重组基因工程菌，接种于种子培养基，培养8～10h，取种子液，接种于发酵培养基，加正十二烷，发酵培养30～60h，分离纯化即得；

所述种子培养基的配方为：胰蛋白胨5～15g/L、酵母粉2～8g/L、氯化钠5～15g/L、氨苄青霉素终浓度50～150mg/L和氯霉素终浓度30～40mg/L；

所述发酵培养基的配方为:葡萄糖或甘油5～15g/L、磷酸二氢钾2～3g/L、磷酸氢二钾2.5～3.0g/L、酵母粉20～28g/L、酵母蛋白胨10～20g/L、IPTG0.1～0.2mM、氨苄青霉素终浓度50～150mg/L和氯霉素终浓度为30～38mg/L。

进一步地，所述种子液、发酵培养基、正十二烷的体积比为2：25：5；所述培养为振荡培养，温度30℃，转速200rpm；所述发酵培养到3h添加培养容器容量4～8×10^-4的0.25MIPTG。

进一步地，所述种子培养基的配方为：胰蛋白胨10g/L、酵母粉5g/L、氯化钠10g/L、氨苄青霉素终浓度100mg/L和氯霉素终浓度34mg/L；

所述发酵培养基的配方为葡萄糖或甘油10g/L、磷酸二氢钾2.2g/L、磷酸氢二钾2.9g/L、酵母粉24g/L、酵母蛋白胨12g/L、IPTG 0.1mM、氨苄青霉素终浓度100mg/L和氯霉素终浓度为34mg/L。

本发明一种产(-)-α-红没药醇的基因工程菌，通过将特定的基因如mvaKmm等MVA途径基因重组入大肠杆菌，同时在重组大肠杆菌中将MrBBS基因、ispA基因之间通过短肽编码序列连接，并过表达mvaK2、mvaD、idi等基因，使之在生产过程的摇瓶阶段产量就高达6.8g/L，再经发酵罐放大后的产量相对目前公开报道的产量进一步突破新高，适宜实际推广应用。

显然，根据本发明的上述内容，按照本领域的普通技术知识和惯用手段，在不脱离本发明上述基本技术思想前提下，还可以做出其它多种形式的修改、替换或变更。

以下通过实施例形式的具体实施方式，对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。

附图说明

图1pSTV28-2质粒图谱

图2pTrc99A-1质粒图谱

图3pSTV28-24质粒图谱

图4 E.coli中(-)-α-红没药醇合成代谢图

图5实施的大肠杆菌工程菌株合成(-)-α-红没药醇的GC-MS分析(A,GC-MS图，B,产量柱状图)

图6重组大肠杆菌在摇瓶上培养50h后(-)-α-红没药醇积累量

图7不同连接短肽对(-)-α-红没药醇合成量的影响

具体实施方式

本发明涉及的核苷酸序列信息

(一)RBS序列：

MrBBS基因5’端的RBS(SEQ ID NO.1)：GGTTAAACC

ispA基因5’端的RBS(SEQ ID NO.2)：aaggaggttacggaaa

idi基因5’端的RBS(SEQ ID NO.3)：aggagagaaatt

mvaE基因5’端的RBS(SEQ ID NO.4)：AGGAGCATTTAG

mvaS基因5’端的RBS(SEQ ID NO.5)：AGGAGAAACCTT

(二)启动子序列

mvaKmm基因5’端带有的pLac(SEQ ID NO.6)：

TAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCGGGGATCC

(三)连接短肽序列

分别表达(-)-α-红没药醇合成酶和法尼基二磷酸合酶融合酶连接肽的核苷酸序列：SEQ ID NO.7:CCAACGACGACGACGCCA

SEQ ID NO.8:GGAGGAGGAGGATCATCATCA

SEQ ID NO.9:GGAGGAGGAATC

SEQ ID NO.10:GGAAGCGGAGGA

SEQ ID NO.11:GGAGGAATCGGA

(四)功能基因序列

(-)-α-红没药醇合成酶MrBBS基因的核苷酸序列(SEQ ID NO.12)：

atgagcacactgagcgtcagcaccccgagctttagcagcagccctctgtcgagcgtgaataagaacagcaccaagcagcatgtcactcgtaacagcgtgatctttcacgactcgatttggggggaccagttcctggaatacaaagagaaattcaacgttgcaaccgagaaacagcttatagaagagctgaaagaagaagtgcgtaacgaactgatgattcgtgcatgtaatgaagcgagccggtatatcaaactgatccagctgatcgatgttgttgaacgtctggggctggcctatcattttgaaaaagagattgaggaaagcctccagcatatatatgtgacgtatggtcataaatggacgaattacaacaatattgagagcctgagtctgtggttccgcctgcttcgtcaaaatggctttaatgttagctcggatatatttgaaaatcacattgatgagaaaggaaattttcaggagagcctgtgcaatgatccgcaggggatgctggcgctgtatgaagcggcatatatgcgtgttgaaggagagatcattctggacaaagcactcgaatttaccaagctgcatctggggatcattagcaatgatcctagctgtgatagcagcctacgtacggaaatcaagcaggcactgaaacagccactgcgccggcggctgccaaggctggaagccgttcgttacattgccatttatcagcagaaggcgagccatagcgaggttctgctgaagctggccaaactggacttcaacgttctgcaggaaatgcacaaagacgaattgagccaaatatgcaaatggtggaaagatctggatatacgtaacaaactgccctatgttcgtgatcgtctgattgaaggctatttttggattctgggtatttatttcgaaccgcaacactcccgtacccgtatgttcctgatgaaaacctgtatgtggctgatcgtgctggacgatacgtttgataattacggcacctatgaagagttagagatctttacccaagcagtcgaacgttggagcattacctgtctggatgaactgccagagtatatgaagctgatatatcacgagcaatttcgcgtgcatcaggaaatggaggaaagcctggaaaaggagggtaaggcctaccagattcattatatcaaagaaatggccaaagaaggtactcgttcgctgctgctggaagcgaaatggctgaaggaaggctatatgcctaccctggatgagtacctgagcaacagcctggtcacctgcggctatgcactgatgaccgcacgcagctacgttgcccgtgacgacggcattgttaccgaagatgcattcaaatgggttgcaacgcacccgccgattgttaaagcagcatgcaaaattctgcgcctgatggacgacattgcaacccataaagaggaacaggagcggggacacattgcaagtagcattgagtgttacaggaaggaaaccggagctagcgaagaggaggcttgcatggactttctgaagcaggttgaagatggttggaaagttattaatcaagaaagcctgatgccgaccgatgttccgttccctctgctgattccggcaattaacctggcacgtgtgagcgacaccctgtacaaagacaacgatggttataatcatgccgataaagaggttataggttatattaaaagcctgtttgtacatccgatgatagtctaa

法尼基二磷酸合酶ispA基因的核苷酸序列(SEQ ID NO.13)：

atggactttccgcagcaactcgaagcctgcgttaagcaggccaaccaggcgctgagccgttttatcgccccactgccctttcagaacactcccgtggtcgaaaccatgcagtatggcgcattattaggtggtaagcgcctgcgacctttcctggtttatgccaccggtcatatgttcggcgttagcacaaacacgctggacgcacccgctgccgccgttgagtgtatccacgcttactcattaattcatgatgatttaccggcaatggatgatgacgatctgcgtcgcggtttgccaacctgccatgtgaagtttggcgaagcaaacgcgattctcgctggcgacgctttacaaacgctggcgttctcgattttaagcgatgccgatatgccggaagtgtcggaccgcgacagaatttcgatgatttctgaactggcgagcgccagtggtattgccggaatgtgcggtggtcaggcattagatttagacgcggaaggcaaacacgtacctctggacgcgcttgagcgtattcatcgtcataaaaccggcgcattgattcgcgccgccgttcgccttggtgcattaagcgccggagataaaggacgtcgtgctctgccggtactcgacaagtatgcagagagcatcggccttgccttccaggttcaggatgacatcctggatgtggtgggagatactgcaacgttgggaaaacgccagggtgccgaccagcaacttggtaaaagtacctaccctgcacttctgggtcttgagcaagcccggaagaaagcccgggatctgatcgacgatgcccgtcagtcgctgaaacaactggctgaacagtcactcgatacctcggcactggaagcgctagcggactacatcatccagcgtaataaataa

甲羟戊酸激酶mvaKmm基因的核苷酸序列(SEQ ID NO.14)：

atggtgagctgcagcgcgccgggcaaaatttatctgtttggcgaacatgcggtggtgtatggcgaaaccgcgattgcgtgcgcggtggaactgcgcacccgcgtgcgcgcggaactgaacgatagcattaccattcagagccagattggccgcaccggcctggattttgaaaaacatccgtatgtgagcgcggtgattgaaaaaatgcgcaaaagcattccgattaacggcgtgtttctgaccgtggatagcgatattccggtgggcagcggcctgggcagcagcgcggcggtgaccattgcgagcattggcgcgctgaacgaactgtttggctttggcctgagcctgcaggaaattgcgaaactgggccatgaaattgaaattaaagtgcagggcgcggcgagcccgaccgatacctatgtgagcacctttggcggcgtggtgaccattccggaacgccgcaaactgaaaaccccggattgcggcattgtgattggcgataccggcgtgtttagcagcaccaaagaactggtggcgaacgtgcgccagctgcgcgaaagctatccggatctgattgaaccgctgatgaccagcattggcaaaattagccgcattggcgaacagctggtgctgagcggcgattatgcgagcattggccgcctgatgaacgtgaaccagggcctgctggatgcgctgggcgtgaacattctggaactgagccagctgatttatagcgcgcgcgcggcgggcgcgtttggcgcgaaaattaccggcgcgggcggcggcggctgcatggtggcgctgaccgcgccggaaaaatgcaaccaggtggcggaagcggtggcgggcgcgggcggcaaagtgaccattaccaaaccgaccgaacagggcctgaaagtggattaa

甲羟戊酸5-焦磷酸脱羧酶mvaD基因的核苷酸序列(SEQ ID NO.15)：

atggatagagagcctgtaacagtacgttcctacgcaaatattgctattatcaaatattggggaaagaaaaaagaaaaagagatggtgcctgctactagcagtatttctctaactttggaaaatatgtatacagagacgaccttgtcgcctttaccagccaatgtaacagctgacgaattttacatcaatggtcagctacaaaatgaggtcgagcatgccaagatgagtaagattattgaccgttatcgtccagctggtgagggctttgtccgtatcgatactcaaaacaatatgcctactgcagcgggcctgtcctcaagttctagtggtttgtccgccctggtcaaggcttgtaatgcttatttcaagcttggattggatagaagtcagttggcacaggaagccaaatttgcctcaggctcttcttctcggagtttttatggaccactaggagcctgggataaggatagtggagaaatttaccctgtagagacagacttgaaactagctatgattatgttggtgctagaggacaagaaaaaaccaatctctagccgtgacgggatgaaactttgtgtggaaacctcgacgacttttgacgactgggttcgtcagtctgagaaggactatcaggatatgctgatttatctcaaggaaaatgattttgccaagattggagaattaacggagaaaaatgccctggctatgcatgctacgacaaagactgctagtccagccttttcttatctgacggatgcctcttatgaggctatggactttgttcgccagcttcgtgagaaaggagaggcctgctactttaccatggatgctggtcccaatgttaaggtcttctgtcaggagaaagacttggagcatttatcagaaattttcggtcatcgttatcgcttgattgtgtcaaaaacaaaggatttgagtcaagatgattgctgttaa

磷酸甲羟戊酸激酶mvaK2基因的核苷酸序列(SEQ ID NO.16)：

atgattgctgttaaaacttgcggaaaactctattgggcaggtgaatatgctattttagagccagggcagttagctttgataaaggatattcccatctatatgagggctgagattgctttttctgacagctaccgtatctattcagatatgtttgatttcgcagtggacttaaggcctaatcctgactacagcttgattcaagaaacgattgctttgatgggagacttcctcgctgttcgtggtcagaatttaagacctttttctctagaaatctgtggcaaaatggaacgagaagggaaaaagtttggtctaggttctagtggcagcgtcgttgtcttggttgtcaaggctttactggctctgtatgatgtttctgttgatcaggagctcttgttcaagctgactagcgctgtcttgctcaagcgaggagacaatggttccatgggcgaccttgcctgtattgtggcagaggatttggttctctaccagtcatttgatcgccagaaggtggctgcttggttagaagaagaaaacttggcgacagttctggagcgtgattggggcttttcaatttcacaagtgaaaccaactttagaatgtgatttcttagtgggatggaccaaggaagtggctgtatcgagtcacatggtccagcaaatcaagcaaaatatcaatcaaaattttttaagttcctcaaaagaaacggtggtttctttggtcgaagccttggaacaggggaaatcagaaaagattatcgagcaagtagaagtagccagcaagcttttagaaggcttgagtacagatatttacacgcctttgcttagacagttgaaagaagccagtcaagatttgcaggccgttgccaagagtagtggtgctggtggtggtgactgtggcatcgccctgagttttgatgcgcaatcaaccaaaaccttaaaaaatcgttgggccgatctggggattgagctcttatatcaagaaaggataggacatgacgacaaatcgtaa

异戊烯基二磷酸δ-异构酶idi基因的核苷酸序列(SEQ ID NO.17)：

atgcaaacggaacacgtcattttattgaatgcacagggagttcccacgggtacgctggaaaagtatgccgcacacacggcagacacccgcttacatctcgcgttctccagttggctgtttaatgccaaaggacaattattagttacccgccgcgcactgagcaaaaaagcatggcctggcgtgtggactaactcggtttgtgggcacccacaactgggagaaagcaacgaagacgcagtgatccgccgttgccgttatgagcttggcgtggaaattacgcctcctgaatctatctatcctgactttcgctaccgcgccaccgatccgagtggcattgtggaaaatgaagtgtgtccggtatttgccgcacgcaccactagtgcgttacagatcaatgatgatgaagtgatggattatcaatggtgtgatttagcagatgtattacacggtattgatgccacgccgtgggcgttcagtccgtggatggtgatgcaggcgacaaatcgcgaagccagaaaacgattatctgcatttacccagcttaaataa

3-羟基-3-甲基戊二酰CoA合酶mvaS基因的核苷酸序列(SEQ ID NO.18)：

atgacaattgggattgataaaattagtttttttgtgcccccttattatattgatatgacggcactggctgaagccagaaatgtagaccctggaaaatttcatattggtattgggcaagaccaaatggcggtgaacccaatcagccaagatattgtgacatttgcagccaatgccgcagaagcgatcttgaccaaagaagataaagaggccattgatatggtgattgtcgggactgagtccagtatcgatgagtcaaaagcggccgcagttgtcttacatcgtttaatggggattcaacctttcgctcgctctttcgaaatcaaggaagcttgttacggagcaactgcaggcttacagttagctaagaatcacgtagccttacatccagataaaaaagtcttggtcgtagcagcagatattgcaaaatatggcttaaattctggcggtgagcctacacaaggagctggggcggttgcaatgttagttgctagtgaaccgcgcattttggctttaaaagaggataatgtgatgctgacgcaagatatctatgacttttggcgtccaacaggccatccatatcctatggtcgatggtcctttgtcaaacgaaacctacatccaatcttttgcccaagtctgggatgaacataaaaaacgaaccggtcttgattttgcagattatgatgctttagcgttccatattccttacacaaaaatgggcaaaaaagccttattagcaaaaatctccgaccaaactgaagcagaacaggaacgaattttagcccgttatgaagaaagcatcatctatagtcgtcgcgtaggaaacttgtatacgggttcactttatctgggactcatttcccttttagaaaatgcaacgactttaaccgcaggcaatcaaattgggttattcagttatggttctggtgctgtcgctgaatttttcactggtgaattagtagctggttatcaaaatcatttacaaaaagaaactcatttagcactgctggataatcggacagaactttctatcgctgaatatgaagccatgtttgcagaaactttagacacagacattgatcaaacgttaaaagatgaattaaaatatagtatttctgctattaataataccgttcgttcttatcgaaactaa

乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因的核苷酸序列(SEQ ID NO.19)：

atgaaaacagtagttattattgatgcattacgaacaccaattggaaaatataaaggcagcttaagtcaagtaagtgccgtagacttaggaacacatgttacaacacaacttttaaaaagacattccactatttctgaagaaattgatcaagtaatctttggaaatgttttacaagctggaaatggccaaaatcccgcacgacaaatagcaataaacagcggtttatctcatgaaattcccgcaatgacagttaatgaggtctgcggatcaggaatgaaggccgttattttggcgaaacaattgattcaattaggagaagcggaagttttaattgctggcgggattgagaatatgtcccaagcacctaaattacaacgatttaattacgaaacagaaagctatgatgcgcctttttctagtatgatgtacgatgggttaacggatgcctttagtggtcaagcaatgggcttaactgctgaaaatgtggccgaaaagtatcatgtaactagagaagagcaagatcaattttctgtacattcacaattaaaagcagctcaagcacaagcagaagggatattcgctgacgaaatagccccattagaagtatcaggaacgcttgtggagaaagatgaagggattcgccctaattcgagcgttgagaagctaggaacgcttaaaacagtttttaaagaagacggtactgtaacagcagggaatgcatcaaccattaatgatggggcttctgctttgattattgcttcacaagaatatgccgaagcacacggtcttccttatttagctattattcgagacagtgtggaagtcggtattgatccagcctatatgggaatttcgccgattaaagccattcaaaaactgttagcgcgcaatcaacttactacggaagaaattgatctgtatgaaatcaacgaagcatttgcagcaacttcaatcgtggtccaaagagaactggctttaccagaggaaaaggtcaacatttatggtggcggtatttcattaggtcatgcgattggtgccacaggtgctcgtttattaacgagtttaagttatcaattaaatcaaaaagaaaagaaatatggagtggcttctttatgtatcggcggtggcttaggactcgctatgctactagagagacctcagcaaaaaaaaaacagccgattttatcaaatgagtcctgaggaacgcctggcttctcttcttaatgaaggccagatttctgctgatacaaaaaaagaatttgaaaatacggctttatcttcgcagattgccaatcatatgattgaaaatcaaatcagtgaaacagaagtgccgatgggcgttggcttacatttaacagtggacgaaactgattatttggtaccaatggcgacagaagagccctcagtgattgcggctttgagtaatggtgcaaaaatagcacaaggatttaaaacagtgaatcaacaacgtttaatgcgtggacaaatcgttttttacgatgttgcagacgccgagtcattgattgatgaactacaagtaagagaaacggaaatttttcaacaagcagagttaagttatccatctatcgttaaacgcggcggcggcttaagagatttgcaatatcgtgcttttgatgaatcatttgtatctgtcgactttttagtagatgttaaggatgcaatgggggcaaatatcgttaacgctatgttggaaggtgtggccgagttgttccgtgaatggtttgcggagcaaaagattttattcagtattttaagtaattatgccacggagtcggttgttacgatgaaaacggctattccagtttcacgtttaagtaaggggagcaatggccgggaaattgctgaaaaaattgttttagcttcacgctatgcttcattagatccttatcgggcagtcacgcataacaaagggatcatgaatggcattgaagctgtcgttttagctacaggaaatgatacacgcgctgttagcgcttcttgtcatgcttttgcggtgaaggaaggtcgctaccaaggtttgactagttggacgctggatggcgaacaactaattggtgaaatttcagttccgcttgcgttagccacggttggcggtgccacaaaagtcttacctaaatctcaagcagctgctgatttgttagcagtgacggatgcaaaagaactaagtcgagtagtagcggctgttggtttggcacaaaatttagcggcgttacgggccttagtctctgaaggaattcaaaaaggacacatggctctacaagcacgttctttagcgatgacggtcggagctactggtaaagaagttgaggcagtcgctcaacaattaaaacgtcaaaaaacgatgaaccaagaccgagccttggctattttaaatgatttaagaaaacaataa

甲戊酸激酶mvaK1基因的核苷酸序列(SEQ ID NO.20)：

ATGACAAAAAAAGTTGGTGTCGGTCAGGCACATAGTAAGATAATTTTAATAGGGGAACATGCGGTCGTTTACGGTTATCCTGCCATTTCCCTGCCTCTTTTGGAGGTGGAGGTGACCTGTAAGGTAGTTCCTGCAGAGAGTCCTTGGCGCCTTTATGAGGAGGATACCTTGTCCATGGCGGTTTATGCCTCACTGGAGTATTTGGATATCACAGAAGCCTGCATTCGTTGTGAGATTGACTCGGCTATCCCTGAGAAACGGGGGATGGGTTCGTCAGCGGCTATCAGCATAGCGGCCATTCGTGCGGTATTTGACTACTATCAGGCTGATCTGCCTCATGATGTACTAGAAATCTTGGTCAATCGAGCTGAAATGATTGCCCATATGAATCCTAGTGGTTTGGATGCTAAGACCTGTCTCAGTGACCAACCTATTCGCTTTATCAAGAACGTAGGATTTACAGAACTTGAGATGGATTTATCCGCCTATTTGGTGATTGCCGATACGGGTGTTTATGGTCATACTCGTGAAGCCATCCAAGTGGTTCAAAATAAGGGCAAGGATGCCCTACCGTTTTTGCATGCCTTGGGAGAATTAACCCAGCAAGCAGAAGTTGCGATTTCACAAAAAGATGCTGAAGGACTGGGACAAATCCTCAGTCAAGCGCATTTACATTTAAAAGAAATTGGAGTCAGTAGCCCTGAGGCAGACTTTTTGGTTGAAACGACTCTTAGCCATGGTGCTCTGGGTGCCAAGATGAGCGGTGGTGGGCTAGGAGGTTGTATCATAGCCTTGGTAACCAATTTGACACACGCACAAGAACTAGCAGAAAGATTAGAAGAGAAAGGAGCTGTTCAGACATGGATAGAGAGCCTGTAA

五、涉及到的引物信息

表1引物的核苷酸序列

名称	引物	SEQ ID NO
			MrBBs-F	ATTTCACACAGGAAACAGCTGGTTAAACCATGAGCACACTGAGCGTCAG	21
MrBBs-R	AGTTGCTGCGGAAAGTCCATTTTCCGTAACCTCCTTGGATCCTTAGACTATCATCGGATGTA	22
			ispA-F	TACATCCGATGATAGTCTAAGGATCCAAGGAGGTTACGGAAAATGGACTTTCCGCAGCAACT	23
ispA-R	AACTCACATTACAGGTCGACTTATTTATTACGCTGGATGA	24
			pSTV28-F	ACTGGCCGTCGTTTTACAAC	25
pSTV28-R	AGCTGTTTCCTGTGTGAAAT	26
			mvaKmm-F	TCATCCAGCGTAATAAATAAGTCGACCTGTAATGTGAGTT	27
idi-R	ATAATAACTACTGTTTTCATCTAAATGCTCCTTTATTTAAGCTGGGTAAATG	28
			mvaES-F	CATTTACCCAGCTTAAATAAAGGAGCATTTAGATGAAAACAGTAGTTATTAT	29
mvaES-R	GTTGTAAAACGACGGCCAGTTTAGTTTCGATAAGAACGAA	30
			pSTV28-1--F	ACTGGCCGTCGTTTTACAAC	31
pSTV28-1-R	TTATTTAAGCTGGGTAAATG	32
			mvaK1-F	TTTCACACAGGAAACAGACCATGACAAAAAAAGTTGGTGT	33
mvaK1-R	ATTTGCGTAGGAACGTACTGTTACAGGCTCTCTATCCATG	34
			mvaDK2-idi-F	CATGGATAGAGAGCCTGTAACAGTACGTTCCTACGCAAAT	35
mvaDK2-idi-R	AAAACAGCCAAGCTTGCATGTTATTTAAGCTGGGTAAATG	36
			pTrc99A-F	CATGCAAGCTTGGCTGTTTT	37
pTrc99A-R	GGTCTGTTTCCTGTGTGAAA	38
			MrBBS-R1	TGGCGTCGTCGTCGTTGGGACTATCATCGGATGTACAA	39
MrBBS-R2	TGATGATGATCCTCCTCCTCCGACTATCATCGGATGTACAA	40
			MrBBS-R3	GGAAAGTCGATTCCTCCTCCGACTATCATCGGATGTACAA	41
MrBBS-R4	GGAAAGTCTCCTCCGATTCCGACTATCATCGGATGTACAA	42
			MrBBS-R5	GGAAAGTCTCCGATTCCTCCGACTATCATCGGATGTACAA	43
ispA-F1	CCAACGACGACGACGCCAGACTTTCCGCAGCAACTCGA	44
			ispA-F2	GGAGGAGGAGGATCATCATCAGACTTTCCGCAGCAACTCGA	45
ispA-F3	TGATAGTCGGAGGAGGAATCGACTTTCCGCAGCAACTCGA	46
			ispA-F4	TGATAGTCGGAAGCGGAGGAGACTTTCCGCAGCAACTCGA	47
ispA-F5	TGATAGTCGGAGGAATCGGAGACTTTCCGCAGCAACTCGA	48

六、PCR融合产物

MrBBS基因和ispA基因融合产物的核苷酸序列(SEQ ID NO.49)：

注：大写加粗部分为MrBBS基因5’端RBS序列(SEQ ID NO.1)；小写正体部分为MrBBS基因序列(SEQ ID NO.12)；小写加粗部分为ispA基因5’端RBS序列(SEQ ID NO.2)；小写划线部分ispA基因序列(SEQ ID NO.13)。

mvaKmm基因、mvaD基因、mvaK2基因、idi基因、mvaS基因、mvaE基因融合产物的核苷酸序列(SEQ ID NO.50)：

注：大写正体部分为mvaKmm基因5’端pLac序列(SEQ ID NO.6)；小写正体部分为mvaKmm基因序列(SEQ ID NO.14)；小写斜体划线部分为mvaD基因序列(SEQ ID NO.15)；小写斜体部分为mvaK2基因序列(SEQ ID NO.16)；小写加粗部分为idi基因5’端RBS序列(SEQID NO.3)，大写正体划线部分为idi基因序列(SEQ ID NO.17)；大写正体加粗部分为mvaE基因5’端RBS序列(SEQ ID NO.4)，大写正体加粗划线部分为mvaE基因序列(SEQ ID NO.19)；大写斜体部分为mvaS基因5’端RBS序列(SEQ ID NO.5)，大写斜体划线部分为mvaS基因序列(SEQ ID NO.18)。

mvaK1基因、mvaD基因、mvaK2基因和idi基因融合产物的核苷酸序列(SEQ IDNO.51)：

注：大写正体部分为mvaK1基因序列(SEQ ID NO.20)；小写正体部分为mvaD基因序列(SEQ ID NO.15)；小写划线部分为mvaK2基因序列(SEQ ID NO.16)；小写加粗斜体部分为idi基因5’端RBS序列(SEQ ID NO.3)，小写斜体部分为idi基因序列(SEQ ID NO.17)。

连接有短肽序列的MrBBS基因和ispA基因融合产物的核苷酸序列：SEQ ID NO.52：

注：大写正体部分为MrBBS基因5’端RBS序列(SEQ ID NO.1)；小写正体部分为MrBBS基因序列(SEQ ID NO.12)；大写加粗部分为连接短肽序列(SEQ ID NO.7)；小写斜体部分为ispA基因序列(SEQ ID NO.13)。

SEQ ID NO.53：

注：大写正体部分为MrBBS基因5’端RBS序列(SEQ ID NO.1)；小写正体部分为MrBBS基因序列(SEQ ID NO.12)；大写加粗部分为连接短肽序列(SEQ ID NO.8)；小写斜体部分为ispA基因序列(SEQ ID NO.13)。

SEQ ID NO.54：

注：大写正体部分为MrBBS基因5’端RBS序列(SEQ ID NO.1)；小写正体部分为MrBBS基因序列(SEQ ID NO.12)；大写加粗部分为连接短肽序列(SEQ ID NO.9)；小写斜体部分为ispA基因序列(SEQ ID NO.13)。

SEQ ID NO.55

注：大写正体部分为MrBBS基因5’端RBS序列(SEQ ID NO.1)；小写正体部分为MrBBS基因序列(SEQ ID NO.12)；大写加粗部分为连接短肽序列(SEQ ID NO.10)；小写斜体部分为ispA基因序列(SEQ ID NO.13)。

SEQ ID NO.56

注：大写正体部分为MrBBS基因5’端RBS序列(SEQ ID NO.1)；小写正体部分为MrBBS基因序列(SEQ ID NO.12)；大写加粗部分为连接短肽序列(SEQ ID NO.11)；小写斜体部分为ispA基因序列(SEQ ID NO.13)。

实施例1本发明产(-)-α-红没药醇的重组基因工程菌的构建

(1)化合合成(苏州金唯智生物科技有限公司)编码春黄菊花来源的(-)-α-红没药醇合成酶基因MrBBS；分别以MrBBS-F/MrBBS-R1、MrBBS-F/MrBBS-R2、MrBBS-F/MrBBS-R3、MrBBS-F/MrBBS-R4、MrBBS-F/MrBBS-R5为引物，对(-)-α-红没药醇合成酶基因MrBBS进行PCR扩增，PCR产物是5’端端带有9bp RBS、末尾去除终止密码子TAA后，连接有不同长度短肽编码序列的(-)-α-红没药醇合成酶基因MrBBS(RBS的核苷酸序列如SEQ ID NO.1所示，短肽编码序列如SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示)，对PCR产物用1.0％琼脂糖凝胶电泳检测并用clean-up试剂盒纯化片段；

以E.coli DH5α/W3110基因组为模板，通过PCR分别使用引物ispA-F1/ispA-R、ispA-F2/ispA-R、ispA-F3/ispA-R、ispA-F4/ispA-R以及ispA-F5/ispA-R扩增出无起始密码子ATG，同时带有不同长度短肽编码序列的ispA片段(短肽编码序列如SEQ ID NO.7、SEQID NO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示)，并用clean-up试剂盒纯化片段；

将回收的两个DNA片段分别使用引物ispA-F1/MrBBS-R1、ispA-F2/MrBBS-R2、ispA-F3/MrBBS-R3、ispA-F4/MrBBS-R4、ispA-F5/MrBBS-R5进行融合PCR，PCR产物用1.0％琼脂糖凝胶电泳检测并切胶回收纯化该片段；然后采用诺唯赞的一步克隆试剂盒将纯化好的融合PCR产物(核苷酸序列如SEQ ID NO.52～56所示)与线性化质粒pSTV28进行连接(37℃30min)，质粒线性化获得使用引物pSTV28-F和pSTV28-R；将连接产物转化到E.coli DH5α，得到转化产物；将转化产物涂布在LB固体培养基(含终浓度34mg/L氯霉素)上，于37℃、220rpm的条件下摇瓶培养8～12h后提取质粒进行测序验证，验证正确即获得重组质粒pSTV28-11/12/13/14/15；

(2)化合合成(苏州金唯智生物科技有限公司)pUC57/mvaKmmDK2-idi质粒为模板，该合成质粒包含编码甲烷八叠球古菌来源的甲羟戊酸激酶基因mvaKmm、肺炎链球菌来源的甲羟戊酸5-焦磷酸脱羧酶mvaD、磷酸甲羟戊酸激酶基因mvaK2以及带有12bp RBS的大肠杆菌来源的异戊烯二磷酸δ异构酶基因idi(RBS核苷酸序列如SEQ ID NO.3所示)；以mvaKmm-F、idi-R为引物，对mvaKmmDK2-idi基因进行PCR扩增，扩增得到带有pLac的mvaK1DK2-idi片段(pLac核苷酸序列如SEQ ID NO.6所示，插入mvaKmm基因5’端)，PCR产物用1.0％琼脂糖凝胶电泳检测并用clean-up试剂盒纯化片段；

以化合合成(苏州金唯智生物科技有限公司)的pUC57/mvaES质粒为模板，该合成质粒包含粪肠杆菌来源的3-羟基-3-甲基戊二酰CoA合酶基因mvaS以及乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶基因mvaE；(mvaE基因5’端带有RBS，RBS核苷酸序列如SEQ ID NO.4所示；mvaS基因5’端带有RBS，RBS核苷酸序列如SEQ ID NO.5所示)通过PCR使用引物mvaES-F、mvaES-R进行扩增，PCR产物用clean-up试剂盒纯化片段；

将回收的两个DNA片段使用mvaKmm-F和mvaES-R进行融合PCR，PCR产物用1.0％琼脂糖凝胶电泳检测并切胶回收纯化该片段；然后采用诺唯赞的一步克隆试剂盒将纯化好的融合PCR产物(核苷酸序列如SEQ ID NO.50所示)与线性化质粒pSTV28-11/12/13/14/15进行连接(37℃30min)，质粒线性化获得使用引物pSTV28-1-F和pSTV28-1-R；将连接产物转化到E.coli DH5α，得到转化产物；将转化产物涂布在LB固体培养基(含终浓度34mg/L氯霉素)上，于37℃、220rpm的条件下摇瓶培养8～12h后提取质粒进行测序验证，验证正确即获得重组质粒pSTV28-21/22/23/24/25；

(3)化合合成(苏州金唯智生物科技有限公司)pUC57/mvaK1质粒为模板；以mvaK1-F、mvaK1-R为引物，对肺炎链球菌来源甲羟戊酸激酶mvaK1基因进行PCR扩增，扩增得到mvaK1片段，PCR产物用1.0％琼脂糖凝胶电泳检测并用clean-up试剂盒纯化该片段；

以pUC57/mvaKmmDK2-idi质粒为模板，使用引物mvaDK2-idi-F和mvaDK2-idi-R进行PCR扩增，扩增得到包含肺炎链球菌来源的甲羟戊酸5-焦磷酸脱羧酶mvaD基因、磷酸甲羟戊酸激酶mvaK2基因和异戊烯基二磷酸δ-异构酶idi基因的基因片段，即mvaDK2-idi片段(该片段的idi基因5’端带有12bp RBS，核苷酸序列如SEQ ID NO.3所示)，将PCR产物用1.0％琼脂糖凝胶电泳检测并用clean-up试剂盒纯化该片段；

将回收的两个DNA片段使用引物mvaK1-F和mvaDK2-idi-R进行融合PCR，PCR产物用1.0％琼脂糖凝胶电泳检测并切胶回收纯化该片段mvaK1DK2-idi；然后采用诺唯赞的一步克隆试剂盒将纯化好的PCR产物(核苷酸序列如SEQ ID NO.51所示)与线性化质粒pTrc99A进行连接(37℃30min)，质粒线性化获得使用引物pTrc99A-F和pTrc99A-R；将连接产物转化到E.coli DH5α，得到转化产物；将转化产物涂布在LB固体培养基(含终浓度100mg/L氨苄)上，于37℃、220rpm的条件下试管培养8～12h后提取质粒进行测序验证，验证正确即获得重组质粒pTrc99A-1；

(4)将上述构建的质粒-21/22/23/24/25和pTrc99A-1一起转化到大肠杆菌DH5α，得到转化产物；将转化产物涂布于LB固体培养基(含有终浓度为100mg/L氨苄以及34mg/L氯霉素抗性)上，于37℃恒温培养箱中倒置培养12h左右，得到转化子，此转化子即为重组大肠杆菌工程菌株E.coli DH5αpSTV28-21/22/23/24/25&pTrc99A-1。

实施例2(-)-α-红没药醇的制备

1)取实施例1构建的大肠杆菌工程菌株E.coli DH5αpSTV28-21/22/23/24/25&pTrc99A-1，接种于种子培养基，30℃、200rpm摇床振荡培养8～10h，取种子液，按照8％(v/v)接种到发酵培养基，再覆盖20％(v/v)正十二烷，30℃200rpm摇床振荡培养3h，添加10μL0.25M IPTG母液，再30℃200rpm摇床振荡培养47h，即得；

其中，种子培养基的配方为：胰蛋白胨10g/L、酵母粉5g/L、氯化钠10g/L、氨苄青霉素终浓度100mg/L和氯霉素终浓度34mg/L；

发酵培养基的配方为甘油10g/L、磷酸二氢钾2.2g/L、磷酸氢二钾2.9g/L、酵母粉24g/L、酵母蛋白胨12g/L、IPTG 0.1mM、氨苄青霉素终浓度100mg/L和氯霉素终浓度为34mg/L。

实施例3(-)-α-红没药醇的制备

发酵培养基的配方为葡萄糖10g/L、磷酸二氢钾2.2g/L、磷酸氢二钾2.9g/L、酵母粉24g/L、酵母蛋白胨12g/L、IPTG 0.1mM、氨苄青霉素终浓度100mg/L和氯霉素终浓度为34mg/L。

对比例1产(-)-α-红没药醇的重组基因工程菌的构建

(1)化合合成(苏州金唯智生物科技有限公司)编码春黄菊花来源的(-)-α-红没药醇合成酶基因MrBBS；以MrBBS-F、MrBBS-R为引物，对(-)-α-红没药醇合成酶基因MrBBS进行PCR扩增，PCR产物是带有9bp RBS的(-)-α-红没药醇合成酶基因MrBBS(RBS的核苷酸序列如SEQ ID NO.1所示)，对PCR产物用1.0％琼脂糖凝胶电泳检测并用clean-up试剂盒纯化片段；

以E.coli DH5α/W3110基因组为模板，通过PCR使用引物ispA-F、ispA-R扩增出带有16bp RBS的ispA片段(RBS的核苷酸序列如SEQ ID NO.2所示)，并用clean-up试剂盒纯化片段；

将回收的两个DNA片段使用引物MrBBS-F和ispA-R进行融合PCR，PCR产物用1.0％琼脂糖凝胶电泳检测并切胶回收纯化该片段；然后采用诺唯赞的一步克隆试剂盒将纯化好的融合PCR产物(核苷酸序列如SEQ ID NO.49所示)与线性化质粒pSTV28进行连接(37℃30min)，质粒线性化获得使用引物pSTV28-F和pSTV28-R；将连接产物转化到E.coli DH5α，得到转化产物；将转化产物涂布在LB固体培养基(含终浓度34mg/L氯霉素)上，于37℃、220rpm的条件下摇瓶培养8～12h后提取质粒进行测序验证，验证正确即获得重组质粒pSTV28-1；

(2)化合合成(苏州金唯智生物科技有限公司)pUC57/mvaKmmDK2-idi质粒，该合成质粒包含编码甲烷八叠球古菌来源的甲羟戊酸激酶基因mvaKmm、肺炎链球菌来源的甲羟戊酸5-焦磷酸脱羧酶mvaD、磷酸甲羟戊酸激酶基因mvaK2以及带有12bp RBS的大肠杆菌来源的异戊烯二磷酸δ异构酶基因idi(RBS核苷酸序列如SEQ ID NO.3所示)；以mvaKmm-F、idi-R为引物，对mvaKmmDK2-idi基因进行PCR扩增，扩增得到带有pLac的mvaK1DK2-idi片段(pLac核苷酸序列如SEQ ID NO.6所示，插入mvaKmm基因5’端)，PCR产物用1.0％琼脂糖凝胶电泳检测并用clean-up试剂盒纯化片段；

化合合成(苏州金唯智生物科技有限公司)的pUC57/mvaES质粒，该合成质粒包含粪肠杆菌来源的3-羟基-3-甲基戊二酰CoA合酶基因mvaS以及乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶基因mvaE；(mvaE基因5’端带有RBS，RBS核苷酸序列如SEQ ID NO.4所示；mvaS基因5’端带有RBS，RBS核苷酸序列如SEQ ID NO.5所示)通过PCR使用引物mvaES-F、mvaES-R进行扩增，PCR产物用clean-up试剂盒纯化片段；

将回收的两个DNA片段使用mvaKmm-F和mvaES-R进行融合PCR，PCR产物用1.0％琼脂糖凝胶电泳检测并切胶回收纯化该片段；然后采用诺唯赞的一步克隆试剂盒将纯化好的融合PCR产物(核苷酸序列如SEQ ID NO.50所示)与线性化质粒pSTV28-1进行连接(37℃30min)，质粒线性化获得使用引物pSTV28-1-F和pSTV28-1-R；将连接产物转化到E.coliDH5α，得到转化产物；将转化产物涂布在LB固体培养基(含终浓度34mg/L氯霉素)上，于37℃、220rpm的条件下摇瓶培养8～12h后提取质粒进行测序验证，验证正确即获得重组质粒pSTV28-2(图1)；

(3)化合合成(苏州金唯智生物科技有限公司)pUC57/mvaK1质粒；以mvaK1-F、mvaK1-R为引物，对肺炎链球菌来源甲羟戊酸激酶mvaK1基因进行PCR扩增，扩增得到mvaK1片段，PCR产物用1.0％琼脂糖凝胶电泳检测并用clean-up试剂盒纯化该片段；

将回收的两个DNA片段使用引物mvaK1-F和mvaDK2-idi-R进行融合PCR，PCR产物用1.0％琼脂糖凝胶电泳检测并切胶回收纯化该片段mvaK1DK2-idi；然后采用诺唯赞的一步克隆试剂盒将纯化好的PCR产物(核苷酸序列如SEQ ID NO.51所示)与线性化质粒pTrc99A进行连接(37℃30min)，质粒线性化获得使用引物pTrc99A-F和pTrc99A-R；将连接产物转化到E.coli DH5α，得到转化产物；将转化产物涂布在LB固体培养基(含终浓度100mg/L氨苄)上，于37℃、220rpm的条件下试管培养8～12h后提取质粒进行测序验证，验证正确即获得重组质粒pTrc99A-1(图2)；

(4)将上述构建的质粒pSTV28-2和pTrc99A-1一起转化到大肠杆菌DH5α/W3110，得到转化产物；将转化产物涂布于LB固体培养基(含有终浓度为100mg/L氨苄以及34mg/L氯霉素抗性)上，于37℃恒温培养箱中倒置培养12h左右，得到转化子，此转化子即为重组大肠杆菌工程菌株DH5α/W3110 pSTV28-2&pTrc99A-1。

对比例2(-)-α-红没药醇的制备

1)取对比例1构建的大肠杆菌工程菌株DH5α/W3110 pSTV28-2&pTrc99A-1，接种于种子培养基，30℃、200rpm摇床振荡培养8～10h，取种子液，按照8％(v/v)接种到发酵培养基，再覆盖20％(v/v)正十二烷，30℃200rpm摇床振荡培养3h，添加10μL 0.25M IPTG母液，再30℃200rpm摇床振荡培养47h，即得；

对比例3(-)-α-红没药醇的制备

以下通过试验例进一步说明本发明的有益效果：

试验例1重组大肠杆菌在合成(-)-α-红没药醇中的应用

1、培养基配制

LB培养基组成：蛋白胨10g/L、酵母粉5g/L、氯化钠10g/L，溶剂为去离子水，pH值自然。LB平板是在LB液体培养基中添加终浓度2g/L琼脂。

种子培养基：胰蛋白胨10g/L、酵母粉5g/L、氯化钠10g/L、氨苄青霉素终浓度100mg/L和氯霉素终浓度34mg/L；

发酵培养基：葡萄糖/甘油10g/L、磷酸二氢钾2.2g/L、磷酸氢二钾2.9g/L、酵母粉24g/L、酵母蛋白胨12g/L、IPTG 0.1mM、氨苄青霉素终浓度100mg/L和氯霉素终浓度为34mg/L。

(2)(-)-α-红没药醇生产

挑取对比例1构建的大肠杆菌工程菌株DH5α/W3110 pSTV28-2&pTrc99A-1在摇瓶进行发酵实验测试(发酵过程中(-)-α-红没药醇合成代谢过程见图4)，具体摇瓶发酵实验步骤如下：

挑取在LB固体培养基划线培养过夜的单菌落接种种子培养基，在30℃、200rpm摇床振荡培养8～10h。将培养好的种子按照8％(v/v)接种到发酵培养基，再添加20％(v/v)正十二烷，在30℃200rpm摇床振荡培养至50h，其中发酵3h后添加10μL 0.25M IPTG母液，发酵结束后发酵液取上清即得到(-)-α-红没药醇。

(3)(-)-α-红没药醇含量的测定：

标样准备：配置9g/L(-)-α-红没药醇标样，分别稀释成浓度为10、30、50、70、90mg/L的标样，1mL过膜待测；

样品准备：取1mL发酵液在转速12000rpm下离心5min，两相分离；分离得到的有机相过膜待测；

GC-MS检测方法:柱温控温程序为50℃保持3min；以20℃/min升温到280℃保持5min；进样口温度为200℃；进样模式分流比为10：1；分流流量为10mL/min；色谱柱为安捷伦HP-5MS UI(30m*250um*0.25um)；柱流量为：1mL/min；

检测重组E.coli DH5α/W3110 pSTV28-2&pTrc99A-1发酵获得的发酵液中(-)-α-红没药醇的含量、检测结果以及GC-MS图谱图5。由图5可知，将E.coli DH5α/W3110 pSTV28-2&pTrc99A-1分别接种至以葡萄糖为碳源的发酵培养基中发酵50h，可使E.coli DH5αpSTV28-2&pTrc99A-1发酵液中的(-)-α-红没药醇的产量达到5g/L；而E.coli W3110pSTV28-2&pTrc99A-1产量为3.9g/L。

发酵培养基中分别以甘油或葡萄糖为唯一碳源，考察重组E.coli DH5αpSTV28-2&pTrc99A-1在不同碳源下合成(-)-α-红没药醇的能力。(-)-α-红没药醇在摇瓶培养条件下合成产量如图6所示。当甘油为唯一碳源时，摇瓶发酵50h时，菌株E.coli DH5αpSTV28-2&pTrc99A-1合成(-)-α-红没药醇产量达到2.8g/L，比以葡萄糖为唯一碳源产量低，表明以葡萄糖为唯一碳源更有利于合成(-)-α-红没药醇。

试验例2：不同连接短肽对(-)-α-红没药醇产量的影响

挑取实施例1构建的5株分别表达由不同连接多肽连接的α-红没药醇合成酶MrBBS和法尼基二磷酸合酶ispA融合酶的大肠杆菌工程菌株E.coli DH5αpSTV28-21/22/23/24/25&pTrc99A-1在摇瓶进行发酵实验测试。发酵培养基中以葡萄糖为唯一碳源，按试验例1方法发酵生产。(-)-α-红没药醇在摇瓶培养条件下合成产量如图7所示。当摇瓶发酵50h时，菌株E.coli DH5αpSTV28-24&pTrc99A-1合成(-)-α-红没药醇产量达到6.8g/L,其中pSTV28-24质粒图谱见图3。

从图7发酵结果可见：α-红没药醇合成酶MrBBS和法尼基二磷酸合酶IspA之间的连接短肽对红没药醇产量具有较大的影响。其中SEQ ID NO.10编码的连接短肽(氨基酸序列相应为Gly-Ser-Gly-Gly)对红没药醇产量提升有较大促进作用，原因可能为将MrBBS和IspA通过连接短肽融合表达，使两种酶在空间结构上更加接近，便于法尼基二磷酸合酶ispA催化产物法尼基焦磷酸作为红没药醇合成酶MrBBS底物迅速被MrBBS获取进行反应，从而提高(-)-α-红没药醇的最终产量。

综上，本发明通过将特定的基因如mvaKmm等MVA途径基因重组入大肠杆菌，同时在重组大肠杆菌中将MrBBS基因、ispA基因之间通过短肽编码序列连接，并过表达mvaK2、mvaD、idi等基因，使之在生产过程的摇瓶阶段产量就高达6.8g/L，再经发酵罐放大后的产量相对目前公开报道的产量能突破新高，适宜实际推广应用。

SEQUENCE LISTING

<110> 上海锐康生物技术研发有限公司

<120> 一种产(-)-α-红没药醇的重组基因工程菌及其制备方法和用途

<130> GY218-2022P0115014CCR3

<160> 56

<170> PatentIn version 3.5

<210> 1

<211> 9

<212> DNA

<213> 人工序列

<400> 1

ggttaaacc 9

<210> 2

<211> 16

<212> DNA

<213> 人工序列

<400> 2

aaggaggtta cggaaa 16

<210> 3

<211> 12

<212> DNA

<213> 人工序列

<400> 3

aggagagaaa tt 12

<210> 4

<211> 12

<212> DNA

<213> 人工序列

<400> 4

aggagcattt ag 12

<210> 5

<211> 12

<212> DNA

<213> 人工序列

<400> 5

aggagaaacc tt 12

<210> 6

<211> 151

<212> DNA

<213> 人工序列

<400> 6

taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 60

tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 120

ttacgaattc gagctcggta cccggggatc c 151

<210> 7

<211> 18

<212> DNA

<213> 人工序列

<400> 7

ccaacgacga cgacgcca 18

<210> 8

<211> 21

<212> DNA

<213> 人工序列

<400> 8

ggaggaggag gatcatcatc a 21

<210> 9

<211> 12

<212> DNA

<213> 人工序列

<400> 9

ggaggaggaa tc 12

<210> 10

<211> 12

<212> DNA

<213> 人工序列

<400> 10

ggaagcggag ga 12

<210> 11

<211> 12

<212> DNA

<213> 人工序列

<400> 11

ggaggaatcg ga 12

<210> 12

<211> 1719

<212> DNA

<213> 人工序列

<400> 12

atgagcacac tgagcgtcag caccccgagc tttagcagca gccctctgtc gagcgtgaat 60

aagaacagca ccaagcagca tgtcactcgt aacagcgtga tctttcacga ctcgatttgg 120

ggggaccagt tcctggaata caaagagaaa ttcaacgttg caaccgagaa acagcttata 180

gaagagctga aagaagaagt gcgtaacgaa ctgatgattc gtgcatgtaa tgaagcgagc 240

cggtatatca aactgatcca gctgatcgat gttgttgaac gtctggggct ggcctatcat 300

tttgaaaaag agattgagga aagcctccag catatatatg tgacgtatgg tcataaatgg 360

acgaattaca acaatattga gagcctgagt ctgtggttcc gcctgcttcg tcaaaatggc 420

tttaatgtta gctcggatat atttgaaaat cacattgatg agaaaggaaa ttttcaggag 480

agcctgtgca atgatccgca ggggatgctg gcgctgtatg aagcggcata tatgcgtgtt 540

gaaggagaga tcattctgga caaagcactc gaatttacca agctgcatct ggggatcatt 600

agcaatgatc ctagctgtga tagcagccta cgtacggaaa tcaagcaggc actgaaacag 660

ccactgcgcc ggcggctgcc aaggctggaa gccgttcgtt acattgccat ttatcagcag 720

aaggcgagcc atagcgaggt tctgctgaag ctggccaaac tggacttcaa cgttctgcag 780

gaaatgcaca aagacgaatt gagccaaata tgcaaatggt ggaaagatct ggatatacgt 840

aacaaactgc cctatgttcg tgatcgtctg attgaaggct atttttggat tctgggtatt 900

tatttcgaac cgcaacactc ccgtacccgt atgttcctga tgaaaacctg tatgtggctg 960

atcgtgctgg acgatacgtt tgataattac ggcacctatg aagagttaga gatctttacc 1020

caagcagtcg aacgttggag cattacctgt ctggatgaac tgccagagta tatgaagctg 1080

atatatcacg agcaatttcg cgtgcatcag gaaatggagg aaagcctgga aaaggagggt 1140

aaggcctacc agattcatta tatcaaagaa atggccaaag aaggtactcg ttcgctgctg 1200

ctggaagcga aatggctgaa ggaaggctat atgcctaccc tggatgagta cctgagcaac 1260

agcctggtca cctgcggcta tgcactgatg accgcacgca gctacgttgc ccgtgacgac 1320

ggcattgtta ccgaagatgc attcaaatgg gttgcaacgc acccgccgat tgttaaagca 1380

gcatgcaaaa ttctgcgcct gatggacgac attgcaaccc ataaagagga acaggagcgg 1440

ggacacattg caagtagcat tgagtgttac aggaaggaaa ccggagctag cgaagaggag 1500

gcttgcatgg actttctgaa gcaggttgaa gatggttgga aagttattaa tcaagaaagc 1560

ctgatgccga ccgatgttcc gttccctctg ctgattccgg caattaacct ggcacgtgtg 1620

agcgacaccc tgtacaaaga caacgatggt tataatcatg ccgataaaga ggttataggt 1680

tatattaaaa gcctgtttgt acatccgatg atagtctaa 1719

<210> 13

<211> 900

<212> DNA

<213> 人工序列

<400> 13

atggactttc cgcagcaact cgaagcctgc gttaagcagg ccaaccaggc gctgagccgt 60

tttatcgccc cactgccctt tcagaacact cccgtggtcg aaaccatgca gtatggcgca 120

ttattaggtg gtaagcgcct gcgacctttc ctggtttatg ccaccggtca tatgttcggc 180

gttagcacaa acacgctgga cgcacccgct gccgccgttg agtgtatcca cgcttactca 240

ttaattcatg atgatttacc ggcaatggat gatgacgatc tgcgtcgcgg tttgccaacc 300

tgccatgtga agtttggcga agcaaacgcg attctcgctg gcgacgcttt acaaacgctg 360

gcgttctcga ttttaagcga tgccgatatg ccggaagtgt cggaccgcga cagaatttcg 420

atgatttctg aactggcgag cgccagtggt attgccggaa tgtgcggtgg tcaggcatta 480

gatttagacg cggaaggcaa acacgtacct ctggacgcgc ttgagcgtat tcatcgtcat 540

aaaaccggcg cattgattcg cgccgccgtt cgccttggtg cattaagcgc cggagataaa 600

ggacgtcgtg ctctgccggt actcgacaag tatgcagaga gcatcggcct tgccttccag 660

gttcaggatg acatcctgga tgtggtggga gatactgcaa cgttgggaaa acgccagggt 720

gccgaccagc aacttggtaa aagtacctac cctgcacttc tgggtcttga gcaagcccgg 780

aagaaagccc gggatctgat cgacgatgcc cgtcagtcgc tgaaacaact ggctgaacag 840

tcactcgata cctcggcact ggaagcgcta gcggactaca tcatccagcg taataaataa 900

<210> 14

<211> 906

<212> DNA

<213> 人工序列

<400> 14

atggtgagct gcagcgcgcc gggcaaaatt tatctgtttg gcgaacatgc ggtggtgtat 60

ggcgaaaccg cgattgcgtg cgcggtggaa ctgcgcaccc gcgtgcgcgc ggaactgaac 120

gatagcatta ccattcagag ccagattggc cgcaccggcc tggattttga aaaacatccg 180

tatgtgagcg cggtgattga aaaaatgcgc aaaagcattc cgattaacgg cgtgtttctg 240

accgtggata gcgatattcc ggtgggcagc ggcctgggca gcagcgcggc ggtgaccatt 300

gcgagcattg gcgcgctgaa cgaactgttt ggctttggcc tgagcctgca ggaaattgcg 360

aaactgggcc atgaaattga aattaaagtg cagggcgcgg cgagcccgac cgatacctat 420

gtgagcacct ttggcggcgt ggtgaccatt ccggaacgcc gcaaactgaa aaccccggat 480

tgcggcattg tgattggcga taccggcgtg tttagcagca ccaaagaact ggtggcgaac 540

gtgcgccagc tgcgcgaaag ctatccggat ctgattgaac cgctgatgac cagcattggc 600

aaaattagcc gcattggcga acagctggtg ctgagcggcg attatgcgag cattggccgc 660

ctgatgaacg tgaaccaggg cctgctggat gcgctgggcg tgaacattct ggaactgagc 720

cagctgattt atagcgcgcg cgcggcgggc gcgtttggcg cgaaaattac cggcgcgggc 780

ggcggcggct gcatggtggc gctgaccgcg ccggaaaaat gcaaccaggt ggcggaagcg 840

gtggcgggcg cgggcggcaa agtgaccatt accaaaccga ccgaacaggg cctgaaagtg 900

gattaa 906

<210> 15

<211> 954

<212> DNA

<213> 人工序列

<400> 15

atggatagag agcctgtaac agtacgttcc tacgcaaata ttgctattat caaatattgg 60

ggaaagaaaa aagaaaaaga gatggtgcct gctactagca gtatttctct aactttggaa 120

aatatgtata cagagacgac cttgtcgcct ttaccagcca atgtaacagc tgacgaattt 180

tacatcaatg gtcagctaca aaatgaggtc gagcatgcca agatgagtaa gattattgac 240

cgttatcgtc cagctggtga gggctttgtc cgtatcgata ctcaaaacaa tatgcctact 300

gcagcgggcc tgtcctcaag ttctagtggt ttgtccgccc tggtcaaggc ttgtaatgct 360

tatttcaagc ttggattgga tagaagtcag ttggcacagg aagccaaatt tgcctcaggc 420

tcttcttctc ggagttttta tggaccacta ggagcctggg ataaggatag tggagaaatt 480

taccctgtag agacagactt gaaactagct atgattatgt tggtgctaga ggacaagaaa 540

aaaccaatct ctagccgtga cgggatgaaa ctttgtgtgg aaacctcgac gacttttgac 600

gactgggttc gtcagtctga gaaggactat caggatatgc tgatttatct caaggaaaat 660

gattttgcca agattggaga attaacggag aaaaatgccc tggctatgca tgctacgaca 720

aagactgcta gtccagcctt ttcttatctg acggatgcct cttatgaggc tatggacttt 780

gttcgccagc ttcgtgagaa aggagaggcc tgctacttta ccatggatgc tggtcccaat 840

gttaaggtct tctgtcagga gaaagacttg gagcatttat cagaaatttt cggtcatcgt 900

tatcgcttga ttgtgtcaaa aacaaaggat ttgagtcaag atgattgctg ttaa 954

<210> 16

<211> 1008

<212> DNA

<213> 人工序列

<400> 16

atgattgctg ttaaaacttg cggaaaactc tattgggcag gtgaatatgc tattttagag 60

ccagggcagt tagctttgat aaaggatatt cccatctata tgagggctga gattgctttt 120

tctgacagct accgtatcta ttcagatatg tttgatttcg cagtggactt aaggcctaat 180

cctgactaca gcttgattca agaaacgatt gctttgatgg gagacttcct cgctgttcgt 240

ggtcagaatt taagaccttt ttctctagaa atctgtggca aaatggaacg agaagggaaa 300

aagtttggtc taggttctag tggcagcgtc gttgtcttgg ttgtcaaggc tttactggct 360

ctgtatgatg tttctgttga tcaggagctc ttgttcaagc tgactagcgc tgtcttgctc 420

aagcgaggag acaatggttc catgggcgac cttgcctgta ttgtggcaga ggatttggtt 480

ctctaccagt catttgatcg ccagaaggtg gctgcttggt tagaagaaga aaacttggcg 540

acagttctgg agcgtgattg gggcttttca atttcacaag tgaaaccaac tttagaatgt 600

gatttcttag tgggatggac caaggaagtg gctgtatcga gtcacatggt ccagcaaatc 660

aagcaaaata tcaatcaaaa ttttttaagt tcctcaaaag aaacggtggt ttctttggtc 720

gaagccttgg aacaggggaa atcagaaaag attatcgagc aagtagaagt agccagcaag 780

cttttagaag gcttgagtac agatatttac acgcctttgc ttagacagtt gaaagaagcc 840

agtcaagatt tgcaggccgt tgccaagagt agtggtgctg gtggtggtga ctgtggcatc 900

gccctgagtt ttgatgcgca atcaaccaaa accttaaaaa atcgttgggc cgatctgggg 960

attgagctct tatatcaaga aaggatagga catgacgaca aatcgtaa 1008

<210> 17

<211> 549

<212> DNA

<213> 人工序列

<400> 17

atgcaaacgg aacacgtcat tttattgaat gcacagggag ttcccacggg tacgctggaa 60

aagtatgccg cacacacggc agacacccgc ttacatctcg cgttctccag ttggctgttt 120

aatgccaaag gacaattatt agttacccgc cgcgcactga gcaaaaaagc atggcctggc 180

gtgtggacta actcggtttg tgggcaccca caactgggag aaagcaacga agacgcagtg 240

atccgccgtt gccgttatga gcttggcgtg gaaattacgc ctcctgaatc tatctatcct 300

gactttcgct accgcgccac cgatccgagt ggcattgtgg aaaatgaagt gtgtccggta 360

tttgccgcac gcaccactag tgcgttacag atcaatgatg atgaagtgat ggattatcaa 420

tggtgtgatt tagcagatgt attacacggt attgatgcca cgccgtgggc gttcagtccg 480

tggatggtga tgcaggcgac aaatcgcgaa gccagaaaac gattatctgc atttacccag 540

cttaaataa 549

<210> 18

<211> 1152

<212> DNA

<213> 人工序列

<400> 18

atgacaattg ggattgataa aattagtttt tttgtgcccc cttattatat tgatatgacg 60

gcactggctg aagccagaaa tgtagaccct ggaaaatttc atattggtat tgggcaagac 120

caaatggcgg tgaacccaat cagccaagat attgtgacat ttgcagccaa tgccgcagaa 180

gcgatcttga ccaaagaaga taaagaggcc attgatatgg tgattgtcgg gactgagtcc 240

agtatcgatg agtcaaaagc ggccgcagtt gtcttacatc gtttaatggg gattcaacct 300

ttcgctcgct ctttcgaaat caaggaagct tgttacggag caactgcagg cttacagtta 360

gctaagaatc acgtagcctt acatccagat aaaaaagtct tggtcgtagc agcagatatt 420

gcaaaatatg gcttaaattc tggcggtgag cctacacaag gagctggggc ggttgcaatg 480

ttagttgcta gtgaaccgcg cattttggct ttaaaagagg ataatgtgat gctgacgcaa 540

gatatctatg acttttggcg tccaacaggc catccatatc ctatggtcga tggtcctttg 600

tcaaacgaaa cctacatcca atcttttgcc caagtctggg atgaacataa aaaacgaacc 660

ggtcttgatt ttgcagatta tgatgcttta gcgttccata ttccttacac aaaaatgggc 720

aaaaaagcct tattagcaaa aatctccgac caaactgaag cagaacagga acgaatttta 780

gcccgttatg aagaaagcat catctatagt cgtcgcgtag gaaacttgta tacgggttca 840

ctttatctgg gactcatttc ccttttagaa aatgcaacga ctttaaccgc aggcaatcaa 900

attgggttat tcagttatgg ttctggtgct gtcgctgaat ttttcactgg tgaattagta 960

gctggttatc aaaatcattt acaaaaagaa actcatttag cactgctgga taatcggaca 1020

gaactttcta tcgctgaata tgaagccatg tttgcagaaa ctttagacac agacattgat 1080

caaacgttaa aagatgaatt aaaatatagt atttctgcta ttaataatac cgttcgttct 1140

tatcgaaact aa 1152

<210> 19

<211> 2412

<212> DNA

<213> 人工序列

<400> 19

atgaaaacag tagttattat tgatgcatta cgaacaccaa ttggaaaata taaaggcagc 60

ttaagtcaag taagtgccgt agacttagga acacatgtta caacacaact tttaaaaaga 120

cattccacta tttctgaaga aattgatcaa gtaatctttg gaaatgtttt acaagctgga 180

aatggccaaa atcccgcacg acaaatagca ataaacagcg gtttatctca tgaaattccc 240

gcaatgacag ttaatgaggt ctgcggatca ggaatgaagg ccgttatttt ggcgaaacaa 300

ttgattcaat taggagaagc ggaagtttta attgctggcg ggattgagaa tatgtcccaa 360

gcacctaaat tacaacgatt taattacgaa acagaaagct atgatgcgcc tttttctagt 420

atgatgtacg atgggttaac ggatgccttt agtggtcaag caatgggctt aactgctgaa 480

aatgtggccg aaaagtatca tgtaactaga gaagagcaag atcaattttc tgtacattca 540

caattaaaag cagctcaagc acaagcagaa gggatattcg ctgacgaaat agccccatta 600

gaagtatcag gaacgcttgt ggagaaagat gaagggattc gccctaattc gagcgttgag 660

aagctaggaa cgcttaaaac agtttttaaa gaagacggta ctgtaacagc agggaatgca 720

tcaaccatta atgatggggc ttctgctttg attattgctt cacaagaata tgccgaagca 780

cacggtcttc cttatttagc tattattcga gacagtgtgg aagtcggtat tgatccagcc 840

tatatgggaa tttcgccgat taaagccatt caaaaactgt tagcgcgcaa tcaacttact 900

acggaagaaa ttgatctgta tgaaatcaac gaagcatttg cagcaacttc aatcgtggtc 960

caaagagaac tggctttacc agaggaaaag gtcaacattt atggtggcgg tatttcatta 1020

ggtcatgcga ttggtgccac aggtgctcgt ttattaacga gtttaagtta tcaattaaat 1080

caaaaagaaa agaaatatgg agtggcttct ttatgtatcg gcggtggctt aggactcgct 1140

atgctactag agagacctca gcaaaaaaaa aacagccgat tttatcaaat gagtcctgag 1200

gaacgcctgg cttctcttct taatgaaggc cagatttctg ctgatacaaa aaaagaattt 1260

gaaaatacgg ctttatcttc gcagattgcc aatcatatga ttgaaaatca aatcagtgaa 1320

acagaagtgc cgatgggcgt tggcttacat ttaacagtgg acgaaactga ttatttggta 1380

ccaatggcga cagaagagcc ctcagtgatt gcggctttga gtaatggtgc aaaaatagca 1440

caaggattta aaacagtgaa tcaacaacgt ttaatgcgtg gacaaatcgt tttttacgat 1500

gttgcagacg ccgagtcatt gattgatgaa ctacaagtaa gagaaacgga aatttttcaa 1560

caagcagagt taagttatcc atctatcgtt aaacgcggcg gcggcttaag agatttgcaa 1620

tatcgtgctt ttgatgaatc atttgtatct gtcgactttt tagtagatgt taaggatgca 1680

atgggggcaa atatcgttaa cgctatgttg gaaggtgtgg ccgagttgtt ccgtgaatgg 1740

tttgcggagc aaaagatttt attcagtatt ttaagtaatt atgccacgga gtcggttgtt 1800

acgatgaaaa cggctattcc agtttcacgt ttaagtaagg ggagcaatgg ccgggaaatt 1860

gctgaaaaaa ttgttttagc ttcacgctat gcttcattag atccttatcg ggcagtcacg 1920

cataacaaag ggatcatgaa tggcattgaa gctgtcgttt tagctacagg aaatgataca 1980

cgcgctgtta gcgcttcttg tcatgctttt gcggtgaagg aaggtcgcta ccaaggtttg 2040

actagttgga cgctggatgg cgaacaacta attggtgaaa tttcagttcc gcttgcgtta 2100

gccacggttg gcggtgccac aaaagtctta cctaaatctc aagcagctgc tgatttgtta 2160

gcagtgacgg atgcaaaaga actaagtcga gtagtagcgg ctgttggttt ggcacaaaat 2220

ttagcggcgt tacgggcctt agtctctgaa ggaattcaaa aaggacacat ggctctacaa 2280

gcacgttctt tagcgatgac ggtcggagct actggtaaag aagttgaggc agtcgctcaa 2340

caattaaaac gtcaaaaaac gatgaaccaa gaccgagcct tggctatttt aaatgattta 2400

agaaaacaat aa 2412

<210> 20

<211> 879

<212> DNA

<213> 人工序列

<400> 20

atgacaaaaa aagttggtgt cggtcaggca catagtaaga taattttaat aggggaacat 60

gcggtcgttt acggttatcc tgccatttcc ctgcctcttt tggaggtgga ggtgacctgt 120

aaggtagttc ctgcagagag tccttggcgc ctttatgagg aggatacctt gtccatggcg 180

gtttatgcct cactggagta tttggatatc acagaagcct gcattcgttg tgagattgac 240

tcggctatcc ctgagaaacg ggggatgggt tcgtcagcgg ctatcagcat agcggccatt 300

cgtgcggtat ttgactacta tcaggctgat ctgcctcatg atgtactaga aatcttggtc 360

aatcgagctg aaatgattgc ccatatgaat cctagtggtt tggatgctaa gacctgtctc 420

agtgaccaac ctattcgctt tatcaagaac gtaggattta cagaacttga gatggattta 480

tccgcctatt tggtgattgc cgatacgggt gtttatggtc atactcgtga agccatccaa 540

gtggttcaaa ataagggcaa ggatgcccta ccgtttttgc atgccttggg agaattaacc 600

cagcaagcag aagttgcgat ttcacaaaaa gatgctgaag gactgggaca aatcctcagt 660

caagcgcatt tacatttaaa agaaattgga gtcagtagcc ctgaggcaga ctttttggtt 720

gaaacgactc ttagccatgg tgctctgggt gccaagatga gcggtggtgg gctaggaggt 780

tgtatcatag ccttggtaac caatttgaca cacgcacaag aactagcaga aagattagaa 840

gagaaaggag ctgttcagac atggatagag agcctgtaa 879

<210> 21

<211> 49

<212> DNA

<213> 人工序列

<400> 21

atttcacaca ggaaacagct ggttaaacca tgagcacact gagcgtcag 49

<210> 22

<211> 62

<212> DNA

<213> 人工序列

<400> 22

agttgctgcg gaaagtccat tttccgtaac ctccttggat ccttagacta tcatcggatg 60

ta 62

<210> 23

<211> 62

<212> DNA

<213> 人工序列

<400> 23

tacatccgat gatagtctaa ggatccaagg aggttacgga aaatggactt tccgcagcaa 60

ct 62

<210> 24

<211> 40

<212> DNA

<213> 人工序列

<400> 24

aactcacatt acaggtcgac ttatttatta cgctggatga 40

<210> 25

<211> 20

<212> DNA

<213> 人工序列

<400> 25

actggccgtc gttttacaac 20

<210> 26

<211> 20

<212> DNA

<213> 人工序列

<400> 26

agctgtttcc tgtgtgaaat 20

<210> 27

<211> 40

<212> DNA

<213> 人工序列

<400> 27

tcatccagcg taataaataa gtcgacctgt aatgtgagtt 40

<210> 28

<211> 52

<212> DNA

<213> 人工序列

<400> 28

ataataacta ctgttttcat ctaaatgctc ctttatttaa gctgggtaaa tg 52

<210> 29

<211> 52

<212> DNA

<213> 人工序列

<400> 29

catttaccca gcttaaataa aggagcattt agatgaaaac agtagttatt at 52

<210> 30

<211> 40

<212> DNA

<213> 人工序列

<400> 30

gttgtaaaac gacggccagt ttagtttcga taagaacgaa 40

<210> 31

<211> 20

<212> DNA

<213> 人工序列

<400> 31

actggccgtc gttttacaac 20

<210> 32

<211> 20

<212> DNA

<213> 人工序列

<400> 32

ttatttaagc tgggtaaatg 20

<210> 33

<211> 40

<212> DNA

<213> 人工序列

<400> 33

tttcacacag gaaacagacc atgacaaaaa aagttggtgt 40

<210> 34

<211> 40

<212> DNA

<213> 人工序列

<400> 34

atttgcgtag gaacgtactg ttacaggctc tctatccatg 40

<210> 35

<211> 40

<212> DNA

<213> 人工序列

<400> 35

catggataga gagcctgtaa cagtacgttc ctacgcaaat 40

<210> 36

<211> 40

<212> DNA

<213> 人工序列

<400> 36

aaaacagcca agcttgcatg ttatttaagc tgggtaaatg 40

<210> 37

<211> 20

<212> DNA

<213> 人工序列

<400> 37

catgcaagct tggctgtttt 20

<210> 38

<211> 20

<212> DNA

<213> 人工序列

<400> 38

ggtctgtttc ctgtgtgaaa 20

<210> 39

<211> 38

<212> DNA

<213> 人工序列

<400> 39

tggcgtcgtc gtcgttggga ctatcatcgg atgtacaa 38

<210> 40

<211> 41

<212> DNA

<213> 人工序列

<400> 40

tgatgatgat cctcctcctc cgactatcat cggatgtaca a 41

<210> 41

<211> 40

<212> DNA

<213> 人工序列

<400> 41

ggaaagtcga ttcctcctcc gactatcatc ggatgtacaa 40

<210> 42

<211> 40

<212> DNA

<213> 人工序列

<400> 42

ggaaagtctc ctccgattcc gactatcatc ggatgtacaa 40

<210> 43

<211> 40

<212> DNA

<213> 人工序列

<400> 43

ggaaagtctc cgattcctcc gactatcatc ggatgtacaa 40

<210> 44

<211> 38

<212> DNA

<213> 人工序列

<400> 44

ccaacgacga cgacgccaga ctttccgcag caactcga 38

<210> 45

<211> 41

<212> DNA

<213> 人工序列

<400> 45

ggaggaggag gatcatcatc agactttccg cagcaactcg a 41

<210> 46

<211> 40

<212> DNA

<213> 人工序列

<400> 46

tgatagtcgg aggaggaatc gactttccgc agcaactcga 40

<210> 47

<211> 40

<212> DNA

<213> 人工序列

<400> 47

tgatagtcgg aagcggagga gactttccgc agcaactcga 40

<210> 48

<211> 40

<212> DNA

<213> 人工序列

<400> 48

tgatagtcgg aggaatcgga gactttccgc agcaactcga 40

<210> 49

<211> 2644

<212> DNA

<213> 人工序列

<400> 49

ggttaaacca tgagcacact gagcgtcagc accccgagct ttagcagcag ccctctgtcg 60

agcgtgaata agaacagcac caagcagcat gtcactcgta acagcgtgat ctttcacgac 120

tcgatttggg gggaccagtt cctggaatac aaagagaaat tcaacgttgc aaccgagaaa 180

cagcttatag aagagctgaa agaagaagtg cgtaacgaac tgatgattcg tgcatgtaat 240

gaagcgagcc ggtatatcaa actgatccag ctgatcgatg ttgttgaacg tctggggctg 300

gcctatcatt ttgaaaaaga gattgaggaa agcctccagc atatatatgt gacgtatggt 360

cataaatgga cgaattacaa caatattgag agcctgagtc tgtggttccg cctgcttcgt 420

caaaatggct ttaatgttag ctcggatata tttgaaaatc acattgatga gaaaggaaat 480

tttcaggaga gcctgtgcaa tgatccgcag gggatgctgg cgctgtatga agcggcatat 540

atgcgtgttg aaggagagat cattctggac aaagcactcg aatttaccaa gctgcatctg 600

gggatcatta gcaatgatcc tagctgtgat agcagcctac gtacggaaat caagcaggca 660

ctgaaacagc cactgcgccg gcggctgcca aggctggaag ccgttcgtta cattgccatt 720

tatcagcaga aggcgagcca tagcgaggtt ctgctgaagc tggccaaact ggacttcaac 780

gttctgcagg aaatgcacaa agacgaattg agccaaatat gcaaatggtg gaaagatctg 840

gatatacgta acaaactgcc ctatgttcgt gatcgtctga ttgaaggcta tttttggatt 900

ctgggtattt atttcgaacc gcaacactcc cgtacccgta tgttcctgat gaaaacctgt 960

atgtggctga tcgtgctgga cgatacgttt gataattacg gcacctatga agagttagag 1020

atctttaccc aagcagtcga acgttggagc attacctgtc tggatgaact gccagagtat 1080

atgaagctga tatatcacga gcaatttcgc gtgcatcagg aaatggagga aagcctggaa 1140

aaggagggta aggcctacca gattcattat atcaaagaaa tggccaaaga aggtactcgt 1200

tcgctgctgc tggaagcgaa atggctgaag gaaggctata tgcctaccct ggatgagtac 1260

ctgagcaaca gcctggtcac ctgcggctat gcactgatga ccgcacgcag ctacgttgcc 1320

cgtgacgacg gcattgttac cgaagatgca ttcaaatggg ttgcaacgca cccgccgatt 1380

gttaaagcag catgcaaaat tctgcgcctg atggacgaca ttgcaaccca taaagaggaa 1440

caggagcggg gacacattgc aagtagcatt gagtgttaca ggaaggaaac cggagctagc 1500

gaagaggagg cttgcatgga ctttctgaag caggttgaag atggttggaa agttattaat 1560

caagaaagcc tgatgccgac cgatgttccg ttccctctgc tgattccggc aattaacctg 1620

gcacgtgtga gcgacaccct gtacaaagac aacgatggtt ataatcatgc cgataaagag 1680

gttataggtt atattaaaag cctgtttgta catccgatga tagtctaaaa ggaggttacg 1740

gaaaatggac tttccgcagc aactcgaagc ctgcgttaag caggccaacc aggcgctgag 1800

ccgttttatc gccccactgc cctttcagaa cactcccgtg gtcgaaacca tgcagtatgg 1860

cgcattatta ggtggtaagc gcctgcgacc tttcctggtt tatgccaccg gtcatatgtt 1920

cggcgttagc acaaacacgc tggacgcacc cgctgccgcc gttgagtgta tccacgctta 1980

ctcattaatt catgatgatt taccggcaat ggatgatgac gatctgcgtc gcggtttgcc 2040

aacctgccat gtgaagtttg gcgaagcaaa cgcgattctc gctggcgacg ctttacaaac 2100

gctggcgttc tcgattttaa gcgatgccga tatgccggaa gtgtcggacc gcgacagaat 2160

ttcgatgatt tctgaactgg cgagcgccag tggtattgcc ggaatgtgcg gtggtcaggc 2220

attagattta gacgcggaag gcaaacacgt acctctggac gcgcttgagc gtattcatcg 2280

tcataaaacc ggcgcattga ttcgcgccgc cgttcgcctt ggtgcattaa gcgccggaga 2340

taaaggacgt cgtgctctgc cggtactcga caagtatgca gagagcatcg gccttgcctt 2400

ccaggttcag gatgacatcc tggatgtggt gggagatact gcaacgttgg gaaaacgcca 2460

gggtgccgac cagcaacttg gtaaaagtac ctaccctgca cttctgggtc ttgagcaagc 2520

ccggaagaaa gcccgggatc tgatcgacga tgcccgtcag tcgctgaaac aactggctga 2580

acagtcactc gatacctcgg cactggaagc gctagcggac tacatcatcc agcgtaataa 2640

ataa 2644

<210> 50

<211> 7168

<212> DNA

<213> 人工序列

<400> 50

taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 60

tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 120

ttacgaattc gagctcggta cccggggatc catggtgagc tgcagcgcgc cgggcaaaat 180

ttatctgttt ggcgaacatg cggtggtgta tggcgaaacc gcgattgcgt gcgcggtgga 240

actgcgcacc cgcgtgcgcg cggaactgaa cgatagcatt accattcaga gccagattgg 300

ccgcaccggc ctggattttg aaaaacatcc gtatgtgagc gcggtgattg aaaaaatgcg 360

caaaagcatt ccgattaacg gcgtgtttct gaccgtggat agcgatattc cggtgggcag 420

cggcctgggc agcagcgcgg cggtgaccat tgcgagcatt ggcgcgctga acgaactgtt 480

tggctttggc ctgagcctgc aggaaattgc gaaactgggc catgaaattg aaattaaagt 540

gcagggcgcg gcgagcccga ccgataccta tgtgagcacc tttggcggcg tggtgaccat 600

tccggaacgc cgcaaactga aaaccccgga ttgcggcatt gtgattggcg ataccggcgt 660

gtttagcagc accaaagaac tggtggcgaa cgtgcgccag ctgcgcgaaa gctatccgga 720

tctgattgaa ccgctgatga ccagcattgg caaaattagc cgcattggcg aacagctggt 780

gctgagcggc gattatgcga gcattggccg cctgatgaac gtgaaccagg gcctgctgga 840

tgcgctgggc gtgaacattc tggaactgag ccagctgatt tatagcgcgc gcgcggcggg 900

cgcgtttggc gcgaaaatta ccggcgcggg cggcggcggc tgcatggtgg cgctgaccgc 960

gccggaaaaa tgcaaccagg tggcggaagc ggtggcgggc gcgggcggca aagtgaccat 1020

taccaaaccg accgaacagg gcctgaaagt ggattaaatg gatagagagc ctgtaacagt 1080

acgttcctac gcaaatattg ctattatcaa atattgggga aagaaaaaag aaaaagagat 1140

ggtgcctgct actagcagta tttctctaac tttggaaaat atgtatacag agacgacctt 1200

gtcgccttta ccagccaatg taacagctga cgaattttac atcaatggtc agctacaaaa 1260

tgaggtcgag catgccaaga tgagtaagat tattgaccgt tatcgtccag ctggtgaggg 1320

ctttgtccgt atcgatactc aaaacaatat gcctactgca gcgggcctgt cctcaagttc 1380

tagtggtttg tccgccctgg tcaaggcttg taatgcttat ttcaagcttg gattggatag 1440

aagtcagttg gcacaggaag ccaaatttgc ctcaggctct tcttctcgga gtttttatgg 1500

accactagga gcctgggata aggatagtgg agaaatttac cctgtagaga cagacttgaa 1560

actagctatg attatgttgg tgctagagga caagaaaaaa ccaatctcta gccgtgacgg 1620

gatgaaactt tgtgtggaaa cctcgacgac ttttgacgac tgggttcgtc agtctgagaa 1680

ggactatcag gatatgctga tttatctcaa ggaaaatgat tttgccaaga ttggagaatt 1740

aacggagaaa aatgccctgg ctatgcatgc tacgacaaag actgctagtc cagccttttc 1800

ttatctgacg gatgcctctt atgaggctat ggactttgtt cgccagcttc gtgagaaagg 1860

agaggcctgc tactttacca tggatgctgg tcccaatgtt aaggtcttct gtcaggagaa 1920

agacttggag catttatcag aaattttcgg tcatcgttat cgcttgattg tgtcaaaaac 1980

aaaggatttg agtcaagatg attgctgtta aatgattgct gttaaaactt gcggaaaact 2040

ctattgggca ggtgaatatg ctattttaga gccagggcag ttagctttga taaaggatat 2100

tcccatctat atgagggctg agattgcttt ttctgacagc taccgtatct attcagatat 2160

gtttgatttc gcagtggact taaggcctaa tcctgactac agcttgattc aagaaacgat 2220

tgctttgatg ggagacttcc tcgctgttcg tggtcagaat ttaagacctt tttctctaga 2280

aatctgtggc aaaatggaac gagaagggaa aaagtttggt ctaggttcta gtggcagcgt 2340

cgttgtcttg gttgtcaagg ctttactggc tctgtatgat gtttctgttg atcaggagct 2400

cttgttcaag ctgactagcg ctgtcttgct caagcgagga gacaatggtt ccatgggcga 2460

ccttgcctgt attgtggcag aggatttggt tctctaccag tcatttgatc gccagaaggt 2520

ggctgcttgg ttagaagaag aaaacttggc gacagttctg gagcgtgatt ggggcttttc 2580

aatttcacaa gtgaaaccaa ctttagaatg tgatttctta gtgggatgga ccaaggaagt 2640

ggctgtatcg agtcacatgg tccagcaaat caagcaaaat atcaatcaaa attttttaag 2700

ttcctcaaaa gaaacggtgg tttctttggt cgaagccttg gaacagggga aatcagaaaa 2760

gattatcgag caagtagaag tagccagcaa gcttttagaa ggcttgagta cagatattta 2820

cacgcctttg cttagacagt tgaaagaagc cagtcaagat ttgcaggccg ttgccaagag 2880

tagtggtgct ggtggtggtg actgtggcat cgccctgagt tttgatgcgc aatcaaccaa 2940

aaccttaaaa aatcgttggg ccgatctggg gattgagctc ttatatcaag aaaggatagg 3000

acatgacgac aaatcgtaaa ggagagaaat tatgcaaacg gaacacgtca ttttattgaa 3060

tgcacaggga gttcccacgg gtacgctgga aaagtatgcc gcacacacgg cagacacccg 3120

cttacatctc gcgttctcca gttggctgtt taatgccaaa ggacaattat tagttacccg 3180

ccgcgcactg agcaaaaaag catggcctgg cgtgtggact aactcggttt gtgggcaccc 3240

acaactggga gaaagcaacg aagacgcagt gatccgccgt tgccgttatg agcttggcgt 3300

ggaaattacg cctcctgaat ctatctatcc tgactttcgc taccgcgcca ccgatccgag 3360

tggcattgtg gaaaatgaag tgtgtccggt atttgccgca cgcaccacta gtgcgttaca 3420

gatcaatgat gatgaagtga tggattatca atggtgtgat ttagcagatg tattacacgg 3480

tattgatgcc acgccgtggg cgttcagtcc gtggatggtg atgcaggcga caaatcgcga 3540

agccagaaaa cgattatctg catttaccca gcttaaataa aggagcattt agatgaaaac 3600

agtagttatt attgatgcat tacgaacacc aattggaaaa tataaaggca gcttaagtca 3660

agtaagtgcc gtagacttag gaacacatgt tacaacacaa cttttaaaaa gacattccac 3720

tatttctgaa gaaattgatc aagtaatctt tggaaatgtt ttacaagctg gaaatggcca 3780

aaatcccgca cgacaaatag caataaacag cggtttatct catgaaattc ccgcaatgac 3840

agttaatgag gtctgcggat caggaatgaa ggccgttatt ttggcgaaac aattgattca 3900

attaggagaa gcggaagttt taattgctgg cgggattgag aatatgtccc aagcacctaa 3960

attacaacga tttaattacg aaacagaaag ctatgatgcg cctttttcta gtatgatgta 4020

cgatgggtta acggatgcct ttagtggtca agcaatgggc ttaactgctg aaaatgtggc 4080

cgaaaagtat catgtaacta gagaagagca agatcaattt tctgtacatt cacaattaaa 4140

agcagctcaa gcacaagcag aagggatatt cgctgacgaa atagccccat tagaagtatc 4200

aggaacgctt gtggagaaag atgaagggat tcgccctaat tcgagcgttg agaagctagg 4260

aacgcttaaa acagttttta aagaagacgg tactgtaaca gcagggaatg catcaaccat 4320

taatgatggg gcttctgctt tgattattgc ttcacaagaa tatgccgaag cacacggtct 4380

tccttattta gctattattc gagacagtgt ggaagtcggt attgatccag cctatatggg 4440

aatttcgccg attaaagcca ttcaaaaact gttagcgcgc aatcaactta ctacggaaga 4500

aattgatctg tatgaaatca acgaagcatt tgcagcaact tcaatcgtgg tccaaagaga 4560

actggcttta ccagaggaaa aggtcaacat ttatggtggc ggtatttcat taggtcatgc 4620

gattggtgcc acaggtgctc gtttattaac gagtttaagt tatcaattaa atcaaaaaga 4680

aaagaaatat ggagtggctt ctttatgtat cggcggtggc ttaggactcg ctatgctact 4740

agagagacct cagcaaaaaa aaaacagccg attttatcaa atgagtcctg aggaacgcct 4800

ggcttctctt cttaatgaag gccagatttc tgctgataca aaaaaagaat ttgaaaatac 4860

ggctttatct tcgcagattg ccaatcatat gattgaaaat caaatcagtg aaacagaagt 4920

gccgatgggc gttggcttac atttaacagt ggacgaaact gattatttgg taccaatggc 4980

gacagaagag ccctcagtga ttgcggcttt gagtaatggt gcaaaaatag cacaaggatt 5040

taaaacagtg aatcaacaac gtttaatgcg tggacaaatc gttttttacg atgttgcaga 5100

cgccgagtca ttgattgatg aactacaagt aagagaaacg gaaatttttc aacaagcaga 5160

gttaagttat ccatctatcg ttaaacgcgg cggcggctta agagatttgc aatatcgtgc 5220

ttttgatgaa tcatttgtat ctgtcgactt tttagtagat gttaaggatg caatgggggc 5280

aaatatcgtt aacgctatgt tggaaggtgt ggccgagttg ttccgtgaat ggtttgcgga 5340

gcaaaagatt ttattcagta ttttaagtaa ttatgccacg gagtcggttg ttacgatgaa 5400

aacggctatt ccagtttcac gtttaagtaa ggggagcaat ggccgggaaa ttgctgaaaa 5460

aattgtttta gcttcacgct atgcttcatt agatccttat cgggcagtca cgcataacaa 5520

agggatcatg aatggcattg aagctgtcgt tttagctaca ggaaatgata cacgcgctgt 5580

tagcgcttct tgtcatgctt ttgcggtgaa ggaaggtcgc taccaaggtt tgactagttg 5640

gacgctggat ggcgaacaac taattggtga aatttcagtt ccgcttgcgt tagccacggt 5700

tggcggtgcc acaaaagtct tacctaaatc tcaagcagct gctgatttgt tagcagtgac 5760

ggatgcaaaa gaactaagtc gagtagtagc ggctgttggt ttggcacaaa atttagcggc 5820

gttacgggcc ttagtctctg aaggaattca aaaaggacac atggctctac aagcacgttc 5880

tttagcgatg acggtcggag ctactggtaa agaagttgag gcagtcgctc aacaattaaa 5940

acgtcaaaaa acgatgaacc aagaccgagc cttggctatt ttaaatgatt taagaaaaca 6000

ataaaggaga aaccttatga caattgggat tgataaaatt agtttttttg tgccccctta 6060

ttatattgat atgacggcac tggctgaagc cagaaatgta gaccctggaa aatttcatat 6120

tggtattggg caagaccaaa tggcggtgaa cccaatcagc caagatattg tgacatttgc 6180

agccaatgcc gcagaagcga tcttgaccaa agaagataaa gaggccattg atatggtgat 6240

tgtcgggact gagtccagta tcgatgagtc aaaagcggcc gcagttgtct tacatcgttt 6300

aatggggatt caacctttcg ctcgctcttt cgaaatcaag gaagcttgtt acggagcaac 6360

tgcaggctta cagttagcta agaatcacgt agccttacat ccagataaaa aagtcttggt 6420

cgtagcagca gatattgcaa aatatggctt aaattctggc ggtgagccta cacaaggagc 6480

tggggcggtt gcaatgttag ttgctagtga accgcgcatt ttggctttaa aagaggataa 6540

tgtgatgctg acgcaagata tctatgactt ttggcgtcca acaggccatc catatcctat 6600

ggtcgatggt cctttgtcaa acgaaaccta catccaatct tttgcccaag tctgggatga 6660

acataaaaaa cgaaccggtc ttgattttgc agattatgat gctttagcgt tccatattcc 6720

ttacacaaaa atgggcaaaa aagccttatt agcaaaaatc tccgaccaaa ctgaagcaga 6780

acaggaacga attttagccc gttatgaaga aagcatcatc tatagtcgtc gcgtaggaaa 6840

cttgtatacg ggttcacttt atctgggact catttccctt ttagaaaatg caacgacttt 6900

aaccgcaggc aatcaaattg ggttattcag ttatggttct ggtgctgtcg ctgaattttt 6960

cactggtgaa ttagtagctg gttatcaaaa tcatttacaa aaagaaactc atttagcact 7020

gctggataat cggacagaac tttctatcgc tgaatatgaa gccatgtttg cagaaacttt 7080

agacacagac attgatcaaa cgttaaaaga tgaattaaaa tatagtattt ctgctattaa 7140

taataccgtt cgttcttatc gaaactaa 7168

<210> 51

<211> 3402

<212> DNA

<213> 人工序列

<400> 51

atgacaaaaa aagttggtgt cggtcaggca catagtaaga taattttaat aggggaacat 60

gcggtcgttt acggttatcc tgccatttcc ctgcctcttt tggaggtgga ggtgacctgt 120

aaggtagttc ctgcagagag tccttggcgc ctttatgagg aggatacctt gtccatggcg 180

gtttatgcct cactggagta tttggatatc acagaagcct gcattcgttg tgagattgac 240

tcggctatcc ctgagaaacg ggggatgggt tcgtcagcgg ctatcagcat agcggccatt 300

cgtgcggtat ttgactacta tcaggctgat ctgcctcatg atgtactaga aatcttggtc 360

aatcgagctg aaatgattgc ccatatgaat cctagtggtt tggatgctaa gacctgtctc 420

agtgaccaac ctattcgctt tatcaagaac gtaggattta cagaacttga gatggattta 480

tccgcctatt tggtgattgc cgatacgggt gtttatggtc atactcgtga agccatccaa 540

gtggttcaaa ataagggcaa ggatgcccta ccgtttttgc atgccttggg agaattaacc 600

cagcaagcag aagttgcgat ttcacaaaaa gatgctgaag gactgggaca aatcctcagt 660

caagcgcatt tacatttaaa agaaattgga gtcagtagcc ctgaggcaga ctttttggtt 720

gaaacgactc ttagccatgg tgctctgggt gccaagatga gcggtggtgg gctaggaggt 780

tgtatcatag ccttggtaac caatttgaca cacgcacaag aactagcaga aagattagaa 840

gagaaaggag ctgttcagac atggatagag agcctgtaaa tggatagaga gcctgtaaca 900

gtacgttcct acgcaaatat tgctattatc aaatattggg gaaagaaaaa agaaaaagag 960

atggtgcctg ctactagcag tatttctcta actttggaaa atatgtatac agagacgacc 1020

ttgtcgcctt taccagccaa tgtaacagct gacgaatttt acatcaatgg tcagctacaa 1080

aatgaggtcg agcatgccaa gatgagtaag attattgacc gttatcgtcc agctggtgag 1140

ggctttgtcc gtatcgatac tcaaaacaat atgcctactg cagcgggcct gtcctcaagt 1200

tctagtggtt tgtccgccct ggtcaaggct tgtaatgctt atttcaagct tggattggat 1260

agaagtcagt tggcacagga agccaaattt gcctcaggct cttcttctcg gagtttttat 1320

ggaccactag gagcctggga taaggatagt ggagaaattt accctgtaga gacagacttg 1380

aaactagcta tgattatgtt ggtgctagag gacaagaaaa aaccaatctc tagccgtgac 1440

gggatgaaac tttgtgtgga aacctcgacg acttttgacg actgggttcg tcagtctgag 1500

aaggactatc aggatatgct gatttatctc aaggaaaatg attttgccaa gattggagaa 1560

ttaacggaga aaaatgccct ggctatgcat gctacgacaa agactgctag tccagccttt 1620

tcttatctga cggatgcctc ttatgaggct atggactttg ttcgccagct tcgtgagaaa 1680

ggagaggcct gctactttac catggatgct ggtcccaatg ttaaggtctt ctgtcaggag 1740

aaagacttgg agcatttatc agaaattttc ggtcatcgtt atcgcttgat tgtgtcaaaa 1800

acaaaggatt tgagtcaaga tgattgctgt taaatgattg ctgttaaaac ttgcggaaaa 1860

ctctattggg caggtgaata tgctatttta gagccagggc agttagcttt gataaaggat 1920

attcccatct atatgagggc tgagattgct ttttctgaca gctaccgtat ctattcagat 1980

atgtttgatt tcgcagtgga cttaaggcct aatcctgact acagcttgat tcaagaaacg 2040

attgctttga tgggagactt cctcgctgtt cgtggtcaga atttaagacc tttttctcta 2100

gaaatctgtg gcaaaatgga acgagaaggg aaaaagtttg gtctaggttc tagtggcagc 2160

gtcgttgtct tggttgtcaa ggctttactg gctctgtatg atgtttctgt tgatcaggag 2220

ctcttgttca agctgactag cgctgtcttg ctcaagcgag gagacaatgg ttccatgggc 2280

gaccttgcct gtattgtggc agaggatttg gttctctacc agtcatttga tcgccagaag 2340

gtggctgctt ggttagaaga agaaaacttg gcgacagttc tggagcgtga ttggggcttt 2400

tcaatttcac aagtgaaacc aactttagaa tgtgatttct tagtgggatg gaccaaggaa 2460

gtggctgtat cgagtcacat ggtccagcaa atcaagcaaa atatcaatca aaatttttta 2520

agttcctcaa aagaaacggt ggtttctttg gtcgaagcct tggaacaggg gaaatcagaa 2580

aagattatcg agcaagtaga agtagccagc aagcttttag aaggcttgag tacagatatt 2640

tacacgcctt tgcttagaca gttgaaagaa gccagtcaag atttgcaggc cgttgccaag 2700

agtagtggtg ctggtggtgg tgactgtggc atcgccctga gttttgatgc gcaatcaacc 2760

aaaaccttaa aaaatcgttg ggccgatctg gggattgagc tcttatatca agaaaggata 2820

ggacatgacg acaaatcgta aaggagagaa attatgcaaa cggaacacgt cattttattg 2880

aatgcacagg gagttcccac gggtacgctg gaaaagtatg ccgcacacac ggcagacacc 2940

cgcttacatc tcgcgttctc cagttggctg tttaatgcca aaggacaatt attagttacc 3000

cgccgcgcac tgagcaaaaa agcatggcct ggcgtgtgga ctaactcggt ttgtgggcac 3060

ccacaactgg gagaaagcaa cgaagacgca gtgatccgcc gttgccgtta tgagcttggc 3120

gtggaaatta cgcctcctga atctatctat cctgactttc gctaccgcgc caccgatccg 3180

agtggcattg tggaaaatga agtgtgtccg gtatttgccg cacgcaccac tagtgcgtta 3240

cagatcaatg atgatgaagt gatggattat caatggtgtg atttagcaga tgtattacac 3300

ggtattgatg ccacgccgtg ggcgttcagt ccgtggatgg tgatgcaggc gacaaatcgc 3360

gaagccagaa aacgattatc tgcatttacc cagcttaaat aa 3402

<210> 52

<211> 2640

<212> DNA

<213> 人工序列

<400> 52

ggttaaacca tgagcacact gagcgtcagc accccgagct ttagcagcag ccctctgtcg 60

agcgtgaata agaacagcac caagcagcat gtcactcgta acagcgtgat ctttcacgac 120

tcgatttggg gggaccagtt cctggaatac aaagagaaat tcaacgttgc aaccgagaaa 180

cagcttatag aagagctgaa agaagaagtg cgtaacgaac tgatgattcg tgcatgtaat 240

gaagcgagcc ggtatatcaa actgatccag ctgatcgatg ttgttgaacg tctggggctg 300

gcctatcatt ttgaaaaaga gattgaggaa agcctccagc atatatatgt gacgtatggt 360

cataaatgga cgaattacaa caatattgag agcctgagtc tgtggttccg cctgcttcgt 420

caaaatggct ttaatgttag ctcggatata tttgaaaatc acattgatga gaaaggaaat 480

tttcaggaga gcctgtgcaa tgatccgcag gggatgctgg cgctgtatga agcggcatat 540

atgcgtgttg aaggagagat cattctggac aaagcactcg aatttaccaa gctgcatctg 600

gggatcatta gcaatgatcc tagctgtgat agcagcctac gtacggaaat caagcaggca 660

ctgaaacagc cactgcgccg gcggctgcca aggctggaag ccgttcgtta cattgccatt 720

tatcagcaga aggcgagcca tagcgaggtt ctgctgaagc tggccaaact ggacttcaac 780

gttctgcagg aaatgcacaa agacgaattg agccaaatat gcaaatggtg gaaagatctg 840

gatatacgta acaaactgcc ctatgttcgt gatcgtctga ttgaaggcta tttttggatt 900

ctgggtattt atttcgaacc gcaacactcc cgtacccgta tgttcctgat gaaaacctgt 960

atgtggctga tcgtgctgga cgatacgttt gataattacg gcacctatga agagttagag 1020

atctttaccc aagcagtcga acgttggagc attacctgtc tggatgaact gccagagtat 1080

atgaagctga tatatcacga gcaatttcgc gtgcatcagg aaatggagga aagcctggaa 1140

aaggagggta aggcctacca gattcattat atcaaagaaa tggccaaaga aggtactcgt 1200

tcgctgctgc tggaagcgaa atggctgaag gaaggctata tgcctaccct ggatgagtac 1260

ctgagcaaca gcctggtcac ctgcggctat gcactgatga ccgcacgcag ctacgttgcc 1320

cgtgacgacg gcattgttac cgaagatgca ttcaaatggg ttgcaacgca cccgccgatt 1380

gttaaagcag catgcaaaat tctgcgcctg atggacgaca ttgcaaccca taaagaggaa 1440

caggagcggg gacacattgc aagtagcatt gagtgttaca ggaaggaaac cggagctagc 1500

gaagaggagg cttgcatgga ctttctgaag caggttgaag atggttggaa agttattaat 1560

caagaaagcc tgatgccgac cgatgttccg ttccctctgc tgattccggc aattaacctg 1620

gcacgtgtga gcgacaccct gtacaaagac aacgatggtt ataatcatgc cgataaagag 1680

gttataggtt atattaaaag cctgtttgta catccgatga tagtcccaac gacgacgacg 1740

ccagactttc cgcagcaact cgaagcctgc gttaagcagg ccaaccaggc gctgagccgt 1800

tttatcgccc cactgccctt tcagaacact cccgtggtcg aaaccatgca gtatggcgca 1860

ttattaggtg gtaagcgcct gcgacctttc ctggtttatg ccaccggtca tatgttcggc 1920

gttagcacaa acacgctgga cgcacccgct gccgccgttg agtgtatcca cgcttactca 1980

ttaattcatg atgatttacc ggcaatggat gatgacgatc tgcgtcgcgg tttgccaacc 2040

tgccatgtga agtttggcga agcaaacgcg attctcgctg gcgacgcttt acaaacgctg 2100

gcgttctcga ttttaagcga tgccgatatg ccggaagtgt cggaccgcga cagaatttcg 2160

atgatttctg aactggcgag cgccagtggt attgccggaa tgtgcggtgg tcaggcatta 2220

gatttagacg cggaaggcaa acacgtacct ctggacgcgc ttgagcgtat tcatcgtcat 2280

aaaaccggcg cattgattcg cgccgccgtt cgccttggtg cattaagcgc cggagataaa 2340

ggacgtcgtg ctctgccggt actcgacaag tatgcagaga gcatcggcct tgccttccag 2400

gttcaggatg acatcctgga tgtggtggga gatactgcaa cgttgggaaa acgccagggt 2460

gccgaccagc aacttggtaa aagtacctac cctgcacttc tgggtcttga gcaagcccgg 2520

aagaaagccc gggatctgat cgacgatgcc cgtcagtcgc tgaaacaact ggctgaacag 2580

tcactcgata cctcggcact ggaagcgcta gcggactaca tcatccagcg taataaataa 2640

<210> 53

<211> 2643

<212> DNA

<213> 人工序列

<400> 53

ggttaaacca tgagcacact gagcgtcagc accccgagct ttagcagcag ccctctgtcg 60

agcgtgaata agaacagcac caagcagcat gtcactcgta acagcgtgat ctttcacgac 120

tcgatttggg gggaccagtt cctggaatac aaagagaaat tcaacgttgc aaccgagaaa 180

cagcttatag aagagctgaa agaagaagtg cgtaacgaac tgatgattcg tgcatgtaat 240

gaagcgagcc ggtatatcaa actgatccag ctgatcgatg ttgttgaacg tctggggctg 300

gcctatcatt ttgaaaaaga gattgaggaa agcctccagc atatatatgt gacgtatggt 360

cataaatgga cgaattacaa caatattgag agcctgagtc tgtggttccg cctgcttcgt 420

caaaatggct ttaatgttag ctcggatata tttgaaaatc acattgatga gaaaggaaat 480

tttcaggaga gcctgtgcaa tgatccgcag gggatgctgg cgctgtatga agcggcatat 540

atgcgtgttg aaggagagat cattctggac aaagcactcg aatttaccaa gctgcatctg 600

gggatcatta gcaatgatcc tagctgtgat agcagcctac gtacggaaat caagcaggca 660

ctgaaacagc cactgcgccg gcggctgcca aggctggaag ccgttcgtta cattgccatt 720

tatcagcaga aggcgagcca tagcgaggtt ctgctgaagc tggccaaact ggacttcaac 780

gttctgcagg aaatgcacaa agacgaattg agccaaatat gcaaatggtg gaaagatctg 840

gatatacgta acaaactgcc ctatgttcgt gatcgtctga ttgaaggcta tttttggatt 900

ctgggtattt atttcgaacc gcaacactcc cgtacccgta tgttcctgat gaaaacctgt 960

atgtggctga tcgtgctgga cgatacgttt gataattacg gcacctatga agagttagag 1020

atctttaccc aagcagtcga acgttggagc attacctgtc tggatgaact gccagagtat 1080

atgaagctga tatatcacga gcaatttcgc gtgcatcagg aaatggagga aagcctggaa 1140

aaggagggta aggcctacca gattcattat atcaaagaaa tggccaaaga aggtactcgt 1200

tcgctgctgc tggaagcgaa atggctgaag gaaggctata tgcctaccct ggatgagtac 1260

ctgagcaaca gcctggtcac ctgcggctat gcactgatga ccgcacgcag ctacgttgcc 1320

cgtgacgacg gcattgttac cgaagatgca ttcaaatggg ttgcaacgca cccgccgatt 1380

gttaaagcag catgcaaaat tctgcgcctg atggacgaca ttgcaaccca taaagaggaa 1440

caggagcggg gacacattgc aagtagcatt gagtgttaca ggaaggaaac cggagctagc 1500

gaagaggagg cttgcatgga ctttctgaag caggttgaag atggttggaa agttattaat 1560

caagaaagcc tgatgccgac cgatgttccg ttccctctgc tgattccggc aattaacctg 1620

gcacgtgtga gcgacaccct gtacaaagac aacgatggtt ataatcatgc cgataaagag 1680

gttataggtt atattaaaag cctgtttgta catccgatga tagtcggagg aggaggatca 1740

tcatcagact ttccgcagca actcgaagcc tgcgttaagc aggccaacca ggcgctgagc 1800

cgttttatcg ccccactgcc ctttcagaac actcccgtgg tcgaaaccat gcagtatggc 1860

gcattattag gtggtaagcg cctgcgacct ttcctggttt atgccaccgg tcatatgttc 1920

ggcgttagca caaacacgct ggacgcaccc gctgccgccg ttgagtgtat ccacgcttac 1980

tcattaattc atgatgattt accggcaatg gatgatgacg atctgcgtcg cggtttgcca 2040

acctgccatg tgaagtttgg cgaagcaaac gcgattctcg ctggcgacgc tttacaaacg 2100

ctggcgttct cgattttaag cgatgccgat atgccggaag tgtcggaccg cgacagaatt 2160

tcgatgattt ctgaactggc gagcgccagt ggtattgccg gaatgtgcgg tggtcaggca 2220

ttagatttag acgcggaagg caaacacgta cctctggacg cgcttgagcg tattcatcgt 2280

cataaaaccg gcgcattgat tcgcgccgcc gttcgccttg gtgcattaag cgccggagat 2340

aaaggacgtc gtgctctgcc ggtactcgac aagtatgcag agagcatcgg ccttgccttc 2400

caggttcagg atgacatcct ggatgtggtg ggagatactg caacgttggg aaaacgccag 2460

ggtgccgacc agcaacttgg taaaagtacc taccctgcac ttctgggtct tgagcaagcc 2520

cggaagaaag cccgggatct gatcgacgat gcccgtcagt cgctgaaaca actggctgaa 2580

cagtcactcg atacctcggc actggaagcg ctagcggact acatcatcca gcgtaataaa 2640

taa 2643

<210> 54

<211> 2634

<212> DNA

<213> 人工序列

<400> 54

ggttaaacca tgagcacact gagcgtcagc accccgagct ttagcagcag ccctctgtcg 60

agcgtgaata agaacagcac caagcagcat gtcactcgta acagcgtgat ctttcacgac 120

tcgatttggg gggaccagtt cctggaatac aaagagaaat tcaacgttgc aaccgagaaa 180

cagcttatag aagagctgaa agaagaagtg cgtaacgaac tgatgattcg tgcatgtaat 240

gaagcgagcc ggtatatcaa actgatccag ctgatcgatg ttgttgaacg tctggggctg 300

gcctatcatt ttgaaaaaga gattgaggaa agcctccagc atatatatgt gacgtatggt 360

cataaatgga cgaattacaa caatattgag agcctgagtc tgtggttccg cctgcttcgt 420

caaaatggct ttaatgttag ctcggatata tttgaaaatc acattgatga gaaaggaaat 480

tttcaggaga gcctgtgcaa tgatccgcag gggatgctgg cgctgtatga agcggcatat 540

atgcgtgttg aaggagagat cattctggac aaagcactcg aatttaccaa gctgcatctg 600

gggatcatta gcaatgatcc tagctgtgat agcagcctac gtacggaaat caagcaggca 660

ctgaaacagc cactgcgccg gcggctgcca aggctggaag ccgttcgtta cattgccatt 720

tatcagcaga aggcgagcca tagcgaggtt ctgctgaagc tggccaaact ggacttcaac 780

gttctgcagg aaatgcacaa agacgaattg agccaaatat gcaaatggtg gaaagatctg 840

gatatacgta acaaactgcc ctatgttcgt gatcgtctga ttgaaggcta tttttggatt 900

ctgggtattt atttcgaacc gcaacactcc cgtacccgta tgttcctgat gaaaacctgt 960

atgtggctga tcgtgctgga cgatacgttt gataattacg gcacctatga agagttagag 1020

atctttaccc aagcagtcga acgttggagc attacctgtc tggatgaact gccagagtat 1080

atgaagctga tatatcacga gcaatttcgc gtgcatcagg aaatggagga aagcctggaa 1140

aaggagggta aggcctacca gattcattat atcaaagaaa tggccaaaga aggtactcgt 1200

tcgctgctgc tggaagcgaa atggctgaag gaaggctata tgcctaccct ggatgagtac 1260

ctgagcaaca gcctggtcac ctgcggctat gcactgatga ccgcacgcag ctacgttgcc 1320

cgtgacgacg gcattgttac cgaagatgca ttcaaatggg ttgcaacgca cccgccgatt 1380

gttaaagcag catgcaaaat tctgcgcctg atggacgaca ttgcaaccca taaagaggaa 1440

caggagcggg gacacattgc aagtagcatt gagtgttaca ggaaggaaac cggagctagc 1500

gaagaggagg cttgcatgga ctttctgaag caggttgaag atggttggaa agttattaat 1560

caagaaagcc tgatgccgac cgatgttccg ttccctctgc tgattccggc aattaacctg 1620

gcacgtgtga gcgacaccct gtacaaagac aacgatggtt ataatcatgc cgataaagag 1680

gttataggtt atattaaaag cctgtttgta catccgatga tagtcggagg aggaatcgac 1740

tttccgcagc aactcgaagc ctgcgttaag caggccaacc aggcgctgag ccgttttatc 1800

gccccactgc cctttcagaa cactcccgtg gtcgaaacca tgcagtatgg cgcattatta 1860

ggtggtaagc gcctgcgacc tttcctggtt tatgccaccg gtcatatgtt cggcgttagc 1920

acaaacacgc tggacgcacc cgctgccgcc gttgagtgta tccacgctta ctcattaatt 1980

catgatgatt taccggcaat ggatgatgac gatctgcgtc gcggtttgcc aacctgccat 2040

gtgaagtttg gcgaagcaaa cgcgattctc gctggcgacg ctttacaaac gctggcgttc 2100

tcgattttaa gcgatgccga tatgccggaa gtgtcggacc gcgacagaat ttcgatgatt 2160

tctgaactgg cgagcgccag tggtattgcc ggaatgtgcg gtggtcaggc attagattta 2220

gacgcggaag gcaaacacgt acctctggac gcgcttgagc gtattcatcg tcataaaacc 2280

ggcgcattga ttcgcgccgc cgttcgcctt ggtgcattaa gcgccggaga taaaggacgt 2340

cgtgctctgc cggtactcga caagtatgca gagagcatcg gccttgcctt ccaggttcag 2400

gatgacatcc tggatgtggt gggagatact gcaacgttgg gaaaacgcca gggtgccgac 2460

cagcaacttg gtaaaagtac ctaccctgca cttctgggtc ttgagcaagc ccggaagaaa 2520

gcccgggatc tgatcgacga tgcccgtcag tcgctgaaac aactggctga acagtcactc 2580

gatacctcgg cactggaagc gctagcggac tacatcatcc agcgtaataa ataa 2634

<210> 55

<211> 2634

<212> DNA

<213> 人工序列

<400> 55

ggttaaacca tgagcacact gagcgtcagc accccgagct ttagcagcag ccctctgtcg 60

agcgtgaata agaacagcac caagcagcat gtcactcgta acagcgtgat ctttcacgac 120

tcgatttggg gggaccagtt cctggaatac aaagagaaat tcaacgttgc aaccgagaaa 180

cagcttatag aagagctgaa agaagaagtg cgtaacgaac tgatgattcg tgcatgtaat 240

gaagcgagcc ggtatatcaa actgatccag ctgatcgatg ttgttgaacg tctggggctg 300

gcctatcatt ttgaaaaaga gattgaggaa agcctccagc atatatatgt gacgtatggt 360

cataaatgga cgaattacaa caatattgag agcctgagtc tgtggttccg cctgcttcgt 420

caaaatggct ttaatgttag ctcggatata tttgaaaatc acattgatga gaaaggaaat 480

tttcaggaga gcctgtgcaa tgatccgcag gggatgctgg cgctgtatga agcggcatat 540

atgcgtgttg aaggagagat cattctggac aaagcactcg aatttaccaa gctgcatctg 600

gggatcatta gcaatgatcc tagctgtgat agcagcctac gtacggaaat caagcaggca 660

ctgaaacagc cactgcgccg gcggctgcca aggctggaag ccgttcgtta cattgccatt 720

tatcagcaga aggcgagcca tagcgaggtt ctgctgaagc tggccaaact ggacttcaac 780

gttctgcagg aaatgcacaa agacgaattg agccaaatat gcaaatggtg gaaagatctg 840

gatatacgta acaaactgcc ctatgttcgt gatcgtctga ttgaaggcta tttttggatt 900

ctgggtattt atttcgaacc gcaacactcc cgtacccgta tgttcctgat gaaaacctgt 960

atgtggctga tcgtgctgga cgatacgttt gataattacg gcacctatga agagttagag 1020

atctttaccc aagcagtcga acgttggagc attacctgtc tggatgaact gccagagtat 1080

atgaagctga tatatcacga gcaatttcgc gtgcatcagg aaatggagga aagcctggaa 1140

aaggagggta aggcctacca gattcattat atcaaagaaa tggccaaaga aggtactcgt 1200

tcgctgctgc tggaagcgaa atggctgaag gaaggctata tgcctaccct ggatgagtac 1260

ctgagcaaca gcctggtcac ctgcggctat gcactgatga ccgcacgcag ctacgttgcc 1320

cgtgacgacg gcattgttac cgaagatgca ttcaaatggg ttgcaacgca cccgccgatt 1380

gttaaagcag catgcaaaat tctgcgcctg atggacgaca ttgcaaccca taaagaggaa 1440

caggagcggg gacacattgc aagtagcatt gagtgttaca ggaaggaaac cggagctagc 1500

gaagaggagg cttgcatgga ctttctgaag caggttgaag atggttggaa agttattaat 1560

caagaaagcc tgatgccgac cgatgttccg ttccctctgc tgattccggc aattaacctg 1620

gcacgtgtga gcgacaccct gtacaaagac aacgatggtt ataatcatgc cgataaagag 1680

gttataggtt atattaaaag cctgtttgta catccgatga tagtcggaag cggaggagac 1740

tttccgcagc aactcgaagc ctgcgttaag caggccaacc aggcgctgag ccgttttatc 1800

gccccactgc cctttcagaa cactcccgtg gtcgaaacca tgcagtatgg cgcattatta 1860

ggtggtaagc gcctgcgacc tttcctggtt tatgccaccg gtcatatgtt cggcgttagc 1920

acaaacacgc tggacgcacc cgctgccgcc gttgagtgta tccacgctta ctcattaatt 1980

catgatgatt taccggcaat ggatgatgac gatctgcgtc gcggtttgcc aacctgccat 2040

gtgaagtttg gcgaagcaaa cgcgattctc gctggcgacg ctttacaaac gctggcgttc 2100

tcgattttaa gcgatgccga tatgccggaa gtgtcggacc gcgacagaat ttcgatgatt 2160

tctgaactgg cgagcgccag tggtattgcc ggaatgtgcg gtggtcaggc attagattta 2220

gacgcggaag gcaaacacgt acctctggac gcgcttgagc gtattcatcg tcataaaacc 2280

ggcgcattga ttcgcgccgc cgttcgcctt ggtgcattaa gcgccggaga taaaggacgt 2340

cgtgctctgc cggtactcga caagtatgca gagagcatcg gccttgcctt ccaggttcag 2400

gatgacatcc tggatgtggt gggagatact gcaacgttgg gaaaacgcca gggtgccgac 2460

cagcaacttg gtaaaagtac ctaccctgca cttctgggtc ttgagcaagc ccggaagaaa 2520

gcccgggatc tgatcgacga tgcccgtcag tcgctgaaac aactggctga acagtcactc 2580

gatacctcgg cactggaagc gctagcggac tacatcatcc agcgtaataa ataa 2634

<210> 56

<211> 2634

<212> DNA

<213> 人工序列

<400> 56

ggttaaacca tgagcacact gagcgtcagc accccgagct ttagcagcag ccctctgtcg 60

agcgtgaata agaacagcac caagcagcat gtcactcgta acagcgtgat ctttcacgac 120

tcgatttggg gggaccagtt cctggaatac aaagagaaat tcaacgttgc aaccgagaaa 180

cagcttatag aagagctgaa agaagaagtg cgtaacgaac tgatgattcg tgcatgtaat 240

gaagcgagcc ggtatatcaa actgatccag ctgatcgatg ttgttgaacg tctggggctg 300

gcctatcatt ttgaaaaaga gattgaggaa agcctccagc atatatatgt gacgtatggt 360

cataaatgga cgaattacaa caatattgag agcctgagtc tgtggttccg cctgcttcgt 420

caaaatggct ttaatgttag ctcggatata tttgaaaatc acattgatga gaaaggaaat 480

tttcaggaga gcctgtgcaa tgatccgcag gggatgctgg cgctgtatga agcggcatat 540

atgcgtgttg aaggagagat cattctggac aaagcactcg aatttaccaa gctgcatctg 600

gggatcatta gcaatgatcc tagctgtgat agcagcctac gtacggaaat caagcaggca 660

ctgaaacagc cactgcgccg gcggctgcca aggctggaag ccgttcgtta cattgccatt 720

tatcagcaga aggcgagcca tagcgaggtt ctgctgaagc tggccaaact ggacttcaac 780

gttctgcagg aaatgcacaa agacgaattg agccaaatat gcaaatggtg gaaagatctg 840

gatatacgta acaaactgcc ctatgttcgt gatcgtctga ttgaaggcta tttttggatt 900

ctgggtattt atttcgaacc gcaacactcc cgtacccgta tgttcctgat gaaaacctgt 960

atgtggctga tcgtgctgga cgatacgttt gataattacg gcacctatga agagttagag 1020

atctttaccc aagcagtcga acgttggagc attacctgtc tggatgaact gccagagtat 1080

atgaagctga tatatcacga gcaatttcgc gtgcatcagg aaatggagga aagcctggaa 1140

aaggagggta aggcctacca gattcattat atcaaagaaa tggccaaaga aggtactcgt 1200

tcgctgctgc tggaagcgaa atggctgaag gaaggctata tgcctaccct ggatgagtac 1260

ctgagcaaca gcctggtcac ctgcggctat gcactgatga ccgcacgcag ctacgttgcc 1320

cgtgacgacg gcattgttac cgaagatgca ttcaaatggg ttgcaacgca cccgccgatt 1380

gttaaagcag catgcaaaat tctgcgcctg atggacgaca ttgcaaccca taaagaggaa 1440

caggagcggg gacacattgc aagtagcatt gagtgttaca ggaaggaaac cggagctagc 1500

gaagaggagg cttgcatgga ctttctgaag caggttgaag atggttggaa agttattaat 1560

caagaaagcc tgatgccgac cgatgttccg ttccctctgc tgattccggc aattaacctg 1620

gcacgtgtga gcgacaccct gtacaaagac aacgatggtt ataatcatgc cgataaagag 1680

gttataggtt atattaaaag cctgtttgta catccgatga tagtcggagg aatcggagac 1740

tttccgcagc aactcgaagc ctgcgttaag caggccaacc aggcgctgag ccgttttatc 1800

gccccactgc cctttcagaa cactcccgtg gtcgaaacca tgcagtatgg cgcattatta 1860

ggtggtaagc gcctgcgacc tttcctggtt tatgccaccg gtcatatgtt cggcgttagc 1920

acaaacacgc tggacgcacc cgctgccgcc gttgagtgta tccacgctta ctcattaatt 1980

catgatgatt taccggcaat ggatgatgac gatctgcgtc gcggtttgcc aacctgccat 2040

gtgaagtttg gcgaagcaaa cgcgattctc gctggcgacg ctttacaaac gctggcgttc 2100

tcgattttaa gcgatgccga tatgccggaa gtgtcggacc gcgacagaat ttcgatgatt 2160

tctgaactgg cgagcgccag tggtattgcc ggaatgtgcg gtggtcaggc attagattta 2220

gacgcggaag gcaaacacgt acctctggac gcgcttgagc gtattcatcg tcataaaacc 2280

ggcgcattga ttcgcgccgc cgttcgcctt ggtgcattaa gcgccggaga taaaggacgt 2340

cgtgctctgc cggtactcga caagtatgca gagagcatcg gccttgcctt ccaggttcag 2400

gatgacatcc tggatgtggt gggagatact gcaacgttgg gaaaacgcca gggtgccgac 2460

cagcaacttg gtaaaagtac ctaccctgca cttctgggtc ttgagcaagc ccggaagaaa 2520

gcccgggatc tgatcgacga tgcccgtcag tcgctgaaac aactggctga acagtcactc 2580

gatacctcgg cactggaagc gctagcggac tacatcatcc agcgtaataa ataa 2634

Claims

1.一种产(-)-α-红没药醇的重组基因工程菌，其特征在于：它是包含(-)-α-红没药醇合成酶MrBBS基因、法尼基二磷酸合酶ispA基因、MVA途径基因的重组大肠杆菌；所述(-)-α-红没药醇合成酶MrBBS基因与法尼基二磷酸合酶ispA基因之间通过SEQ ID NO.7、SEQ IDNO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列连接。

2.根据权利要求1所述的重组基因工程菌，其特征在于：所述(-)-α-红没药醇合成酶MrBBS基因中的终止密码子TAA被SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列代替，并与无起始密码子ATG的法尼基二磷酸合酶ispA基因连接。

3.根据权利要求1所述的重组基因工程菌，其特征在于：所述(-)-α-红没药醇合成酶MrBBS基因5’端带有SEQ ID NO.1所示核苷酸序列。

4.根据权利要求1所述的重组基因工程菌，其特征在于：所述(-)-α-红没药醇合成酶MrBBS基因来自春黄菊花；所述法尼基二磷酸合酶ispA基因来自大肠杆菌。

5.根据权利要求4所述的重组基因工程菌，其特征在于：所述(-)-α-红没药醇合成酶MrBBS基因的核苷酸序列如SEQ ID NO.12所示；所述法尼基二磷酸合酶ispA基因的核苷酸序列如SEQ ID NO.13所示。

6.根据权利要求5所述的重组基因工程菌，其特征在于：所述(-)-α-红没药醇合成酶MrBBS基因与法尼基二磷酸合酶ispA基因连接后的核苷酸序列如SEQ ID NO.52、SEQ IDNO.53、SEQ ID NO.54、SEQ ID NO.55或SEQ ID NO.56所示。

7.根据权利要求1所述的重组基因工程菌，其特征在于：所述MVA途径基因包括甲羟戊酸激酶mvaKmm基因、甲羟戊酸5-焦磷酸脱羧酶mvaD基因、磷酸甲羟戊酸激酶mvaK2基因、异戊烯基二磷酸δ-异构酶idi基因、3-羟基-3-甲基戊二酰CoA合酶mvaS基因、乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因和/或甲羟戊酸激酶mvaK1基因。

8.根据权利要求7所述的重组基因工程菌，其特征在于：所述甲羟戊酸激酶mvaKmm基因来自甲烷八叠球古菌Methanosarcina mazei；

9.根据权利要求8所述的重组基因工程菌，其特征在于：所述甲羟戊酸激酶mvaKmm基因的核苷酸序列如SEQ ID NO.14所示，甲羟戊酸5-焦磷酸脱羧酶mvaD基因的核苷酸序列如SEQ ID NO.15所示，磷酸甲羟戊酸激酶mvaK2基因的核苷酸序列如SEQ ID NO.16所示，异戊烯二磷酸δ异构酶idi基因的核苷酸序列如SEQ ID NO.17所示，3-羟基-3-甲基戊二酰CoA合酶mvaS基因的核苷酸序列如SEQ ID NO.18所示，乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因的核苷酸序列如SEQ ID NO.19所示，甲羟戊酸激酶mvaK1基因的核苷酸序列如SEQ ID NO.20所示。

10.根据权利要求9所述的重组基因工程菌：其特征在于：所述异戊烯基二磷酸δ-异构酶idi基因5’端带有核苷酸序列SEQ ID NO.3，乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因5’端带有核苷酸序列SEQ ID NO.4，3-羟基-3-甲基戊二酰CoA合酶mvaS基因5’端带有核苷酸序列SEQ ID NO.5，甲羟戊酸激酶mvaKmm基因5’端带有核苷酸序列SEQID NO.6。

11.根据权利要求7所述的重组基因工程菌：其特征在于：所述MVA途径基因与(-)-α-红没药醇合成酶MrBBS基因和法尼基二磷酸合酶ispA基因连接在两个质粒上，其中一个质粒连接的核苷酸序列包括SEQ ID NO.52、SEQ ID NO.53、SEQ ID NO.54、SEQ ID NO.55或SEQID NO.56，以及SEQ ID NO.50，另一个质粒连接的核苷酸序列包括SEQ ID NO.51；

所述质粒优选为质粒pSTV28和质粒pTrc99A。

12.根据权利要求1～11任一所述的重组基因工程菌，其特征在于：所述重组大肠杆菌为重组大肠杆菌E.coliDH5α或E.coli W3110。

13.一种权利要求1～12任一项所述重组基因工程菌的制备方法，其特征在于：它包括如下步骤：

所述(-)-α-红没药醇合成酶MrBBS基因中的终止密码子TAA被如SEQ ID NO.7、SEQ IDNO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列代替；

所述法尼基二磷酸合酶ispA基因中的起始密码子ATG被如SEQ ID NO.7、SEQ ID NO.8、SEQ ID NO.9、SEQ ID NO.10或SEQ ID NO.11所示的核苷酸序列代替；

14.根据权利要求13所述的制备方法：其特征在于：步骤2)所述取MVA途径基因融合是取包含甲羟戊酸激酶mvaKmm基因、甲羟戊酸5-焦磷酸脱羧酶mvaD基因、磷酸甲羟戊酸激酶mvaK2基因和异戊烯基二磷酸δ-异构酶idi基因的基因片段，与包含3-羟基-3-甲基戊二酰CoA合酶mvaS基因和乙酰乙酰CoA硫解酶/3-羟基-3-甲基戊二酰CoA还原酶mvaE基因的基因片段融合。

15.根据权利要求14所述的制备方法：其特征在于：步骤1)所述表达载体为质粒pSTV28，和/或，步骤3)所述表达载体为质粒pTrc99A。

16.权利要求1-12任一所述的重组基因工程菌在制备(-)-α-红没药醇及其制剂中的用途。

17.一种产(-)-α-红没药醇的方法，其特征在于：它包括如下步骤：

取权利要求1～12任一所述的重组基因工程菌，接种于种子培养基，培养8～10h，取种子液，接种于发酵培养基，加正十二烷，发酵培养30～60h；

所述发酵培养基的配方为：葡萄糖或甘油5～15g/L、磷酸二氢钾2～3g/L、磷酸氢二钾2.5～3.0g/L、酵母粉20～28g/L、酵母蛋白胨10～20g/L、IPTG 0.1～0.2mM、氨苄青霉素终浓度50～150mg/L和氯霉素终浓度为30～38mg/L。

18.根据权利要求17所述的方法：其特征在于：所述种子液、发酵培养基、正十二烷的体积比为2：25：5；所述培养为振荡培养，温度30℃，转速200rpm；所述发酵培养到3h添加培养容器容量4～8×10^-4的0.25M IPTG。

19.根据权利要求18所述的方法：其特征在于：所述种子培养基的配方为：胰蛋白胨10g/L、酵母粉5g/L、氯化钠10g/L、氨苄青霉素终浓度100mg/L和氯霉素终浓度34mg/L；