CN111349596A

CN111349596A - 产褪黑素的重组大肠杆菌及其构建方法和应用

Info

Publication number: CN111349596A
Application number: CN202010185591.XA
Authority: CN
Inventors: 董志扬; 张岩峰; 张山; 何永志; 张楠
Original assignee: Institute of Microbiology of CAS
Current assignee: Institute of Microbiology of CAS
Priority date: 2020-03-17
Filing date: 2020-03-17
Publication date: 2020-06-30
Anticipated expiration: 2040-03-17
Also published as: CN111349596B

Abstract

本发明公开了产褪黑素的重组大肠杆菌及其构建方法和应用。本发明首先公开了重组大肠杆菌，与受体大肠杆菌相比，其褪黑素生物合成相关蛋白的基因的表达量增加和/或所述褪黑素生物合成相关蛋白的含量增加和/或所述褪黑素生物合成相关蛋白的活性增加；所述褪黑素选自如下至少一种：苯丙氨酸羟化酶、二氢单磷酸还原酶、4a‑羟基四氢生物蝶呤脱水酶、天冬氨酸转氨酶家族蛋白、N‑乙酰转移酶和咖啡酸‑O‑甲基转移酶。进一步公开了重组大肠杆菌的构建方法及应用。本发明产褪黑素的重组大肠杆菌菌株，褪黑素合成效率显著高于其它现有菌株，对褪黑素的工业化生产和大规模应用具有重大意义。

Description

产褪黑素的重组大肠杆菌及其构建方法和应用

技术领域

本发明涉及基因工程技术领域，具体涉及产褪黑素的重组大肠杆菌及其构建方法和应用。

背景技术

褪黑素(N-乙酰基-5-甲氧基色胺,melatonin,C₁₃N₂H₁₆O₂)属于色氨酸衍生物，是生物体内一种重要的抗氧化剂。褪黑素最早发现于牛松果体中，被认为是一种重要的神经激素，后研究发现褪黑素在人体内各个器官均有分布并发挥着不同的重要功能，如今已广泛应用于医药保健领域，用于治疗失眠、抑郁等症状，2019年褪黑素全球市场需求达10亿美金。褪黑素合成途径广泛存在于自然界生物中，细胞内经典的合成途径为：色氨酸→5-羟色氨酸→5-羟色胺→N-乙酰-5-羟色胺→褪黑素。

目前为止，褪黑素的生产还是以化学合成为主，而褪黑素的化学合成存在步骤繁琐、得率较低、手性不唯一等问题，同时化学合成还存在高能耗和高污染的问题。相比化学合成，生物合成具有对环境友好，能耗低，绿色环保等优点。随着合成生物学的发展，越来越多的化合物实现了生物绿色生产，通过解析化合物的生物合成途径，揭示参与该化合物合成途径中相关的酶基因。在此基础上，在生产菌株中重构目标化合物合成途径，从而实现以廉价的原料如葡萄糖催化生产高附加值的目标产物。虽然，褪黑素生物的合成途径解析的非常清楚，但其中涉及的蛋白本身比活较低，多数难以在现有的成熟表达系统中表达，基本形成包涵体或表达量极低，因此目前为止还有没有高产褪黑素的工程菌。

发明内容

本发明所要解决的技术问题为提供褪黑素高产菌株，以实现发酵法高效大规模工业化生产褪黑素。

为解决上述技术问题，本发明首先提供了一种重组大肠杆菌。

本发明所述重组大肠杆菌与受体大肠杆菌相比，所述重组大肠杆菌中褪黑素生物合成相关蛋白的基因的表达量增加和/或所述褪黑素生物合成相关蛋白的含量增加和/或所述褪黑素生物合成相关蛋白的活性增加；

所述褪黑素生物合成相关蛋白选自如下至少一种：

P1)苯丙氨酸羟化酶；

P2)二氢单磷酸还原酶(folM)；

P3)4a-羟基四氢生物蝶呤脱水酶(phhB)；

P4)天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein)；

P5)N-乙酰转移酶(N-acetyltransferase)；

P6)咖啡酸-O-甲基转移酶(COMT)。

上述重组大肠杆菌中，所述苯丙氨酸羟化酶(记为X)来自野油菜黄单胞菌(Xanthomonas campestris pv.campestris str.ATCC 33913)、4a-羟基四氢生物蝶呤脱水酶(phhB，记为P)来自铜绿假单胞菌(Pseudomonas aeruginosa PAO1)、二氢单磷酸还原酶(folM，记为B)来自大肠杆菌(Escherichia coli str.K-12substr.MG1655)、天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein，NCBI Reference Sequence:WP_103377132.1，记为H)和N-乙酰转移酶(N-acetyltransferase，NCBI ReferenceSequenc WP_020929557.1，记为F)来自小白链霉菌(Streptomyces albulus)、咖啡酸-O-甲基转移酶(COMT，记为C)来自水稻。

上述重组大肠杆菌中，所述受体大肠杆菌可为大肠杆菌K12；具体为大肠杆菌K12菌株BW25113。

在本发明具体的实施方式中，所述苯丙氨酸羟化酶可为如下A1)或A2)所示的蛋白质：

A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质；

A2)将A1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述二氢单磷酸还原酶可为如下A3)或A4)所示的蛋白质：

A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质；

A4)将A3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A3)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述4a-羟基四氢生物蝶呤脱水酶可为如下A5)或A6)所示的蛋白质：

A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质；

A6)将A5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A5)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述天冬氨酸转氨酶家族蛋白可为如下A7)或A8)所示的蛋白质：

A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质；

A8)将A7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A7)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述N-乙酰转移酶可为如下A9)或A10)所示的蛋白质：

A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质；

A10)将A9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A9)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述咖啡酸-O-甲基转移酶可为如下A11)或A12)所示的蛋白质：

A11)SEQ ID NO.1第4429-5535位所示的DNA分子编码的蛋白质；

A12)将A11)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A11)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质。

其中，SEQ ID No.1第319-1209位由891个核苷酸组成，第319-1209位为编码序列，编码SEQ ID No.6所示的苯丙氨酸羟化酶。

SEQ ID No.1第1615-2337位由723个核苷酸组成，第1615-2337位为编码序列，编码SEQ ID No.7所示的二氢单磷酸还原酶。

SEQ ID No.1第1234-1590位由357个核苷酸组成，第1234-1590位为编码序列，编码SEQ ID No.8所示的4a-羟基四氢生物蝶呤脱水酶。

SEQ ID No.1第2362-3831位由1470个核苷酸组成，第2362-3831位为编码序列，编码SEQ ID No.9所示的天冬氨酸转氨酶家族蛋白。

SEQ ID No.1第3856-4404位由549个核苷酸组成，第3856-4404位为编码序列，编码SEQ ID No.10所示的N-乙酰转移酶。

SEQ ID NO.1第4429-5535位由1107个核苷酸组成，第4429-5535位为编码序列，编码SEQ ID No.11所示的咖啡酸-O-甲基转移酶。

上述重组大肠杆菌中，同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62作为Matrix，将Gap existence cost，Per residue gap cost和Lambda ratio分别设置为11，1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。

上述重组大肠杆菌中，所述90％以上的同一性可为至少91％、92％、95％、96％、98％、99％或100％的同一性。

上述重组大肠杆菌中，所述苯丙氨酸羟化酶基因可为如下B1)或B2)所示：

B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子；

B2)将SEQ ID No.1第319-1209位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第319-1209位所示的DNA分子具有相同功能的DNA分子；

所述二氢单磷酸还原酶基因可为如下B3)或B4)所示：

B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子；

B4)将SEQ ID No.1第1615-2337位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1615-2337位所示的DNA分子具有相同功能的DNA分子；

所述4a-羟基四氢生物蝶呤脱水酶基因可为如下B5)或B6)所示：

B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子；

B6)将SEQ ID No.1第1234-1590位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1234-1590位所示的DNA分子具有相同功能的DNA分子；

所述天冬氨酸转氨酶家族蛋白基因可为如下B7)或B8)所示：

B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子；

B8)将SEQ ID No.1第2362-3831位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第2362-3831位所示的DNA分子具有相同功能的DNA分子；

所述N-乙酰转移酶基因可为如下B9)或B10)所示：

B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子；

B10)将SEQ ID No.1第3856-4404位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第3856-4404位所示的DNA分子具有相同功能的DNA分子；

所述咖啡酸-O-甲基转移酶基因可为如下B11)或B12)所示：

B11)编码序列为SEQ ID NO.1第4429-5535位所示的DNA分子；

B12)将SEQ ID NO.1第4429-5535位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID NO.1第4429-5535位所示的DNA分子具有相同功能的DNA分子。

本发明进一步提供了重组大肠杆菌的构建方法。

本发明重组大肠杆菌的构建方法，包括如下步骤：将褪黑素生物合成相关蛋白基因的导入受体大肠杆菌，得到重组大肠杆菌；

所述褪黑素生物合成相关蛋白基因选自如下至少一种：

P1)苯丙氨酸羟化酶基因；

P2)二氢单磷酸还原酶(folM)基因；

P3)4a-羟基四氢生物蝶呤脱水酶(phhB)基因；

P4)天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein)基因；

P5)N-乙酰转移酶(N-acetyltransferase)基因；

P6)咖啡酸-O-甲基转移酶(COMT)基因。

所述苯丙氨酸羟化酶(记为X)来自野油菜黄单胞菌(Xanthomonas campestrispv.campestris str.ATCC 33913)、二氢单磷酸还原酶(folM，记为B)来自大肠杆菌(Escherichia coli str.K-12substr.MG1655)、4a-羟基四氢生物蝶呤脱水酶(phhB，记为P)来自铜绿假单胞菌(Pseudomonas aeruginosa PAO1)、天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein，NCBI Reference Sequence:WP_103377132.1，记为H)和N-乙酰转移酶(N-acetyltransferase，NCBI Reference SequencWP_020929557.1，记为F)来自小白链霉菌(Streptomyces albulus)、咖啡酸-O-甲基转移酶(COMT，记为C)来自水稻。

上述构建方法中，所述褪黑素生物合成相关蛋白的基因的导入受体大肠杆菌是对所述受体大肠杆菌基因组进行下述M1)-M6)全部、任五种、任四种、任三种、任两种或任一种的改造得到的：

M1)过表达苯丙氨酸羟化酶基因；

M2)过表达二氢单磷酸还原酶(folM)基因；

M3)过表达4a-羟基四氢生物蝶呤脱水酶(phhB)基因；

M4)过表达天冬氨酸转氨酶家族蛋白(aspartate aminotransferase familyprotein)基因；

M5)过表达N-乙酰转移酶(N-acetyltransferase)基因；

M6)过表达咖啡酸-O-甲基转移酶(COMT)基因。

在本发明具体的实施方式中，所述褪黑素生物合成相关蛋白的基因通过方式甲或方式乙或方式丙导入所述受体大肠杆菌中；

所述方式甲为所述苯丙氨酸羟化酶基因(记为X)和咖啡酸-O-甲基转移酶基因(记为C)构建在一个表达载体上，所述天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)的基因构建在另一个表达载体上，所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)的基因依次连接(即天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶基因的上游、N-乙酰转移酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶基因位于二氢单磷酸还原酶基因的上游)，然后均导入到受体大肠杆菌中；

所述方式乙为所述苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)构建在一个表达载体上，所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游)；所述天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的基因构建在同一个表达载体上，所述表达载体中三个基因的位置关系为天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的基因依次连接(即天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶基因的上游、N-乙酰转移酶基因位于咖啡酸-O-甲基转移酶基因的上游)，然后均导入到受体大肠杆菌中；

所述方式丙为所述苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为B)、天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)构建在一个表达载体上，所述表达载体中六个基因的位置关系为苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为B)、天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的基因依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游，4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游，二氢单磷酸还原酶基因位于的上游，天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶基因的上游，N-乙酰转移酶基因位于咖啡酸-O-甲基转移酶基因的上游)，然后导入到受体大肠杆菌中。

在本发明具体的实施方式中，所述方式甲为利用无缝拼接方法将苯丙氨酸羟化酶的基因基因(记为X)和咖啡酸-O-甲基转移酶基因(记为C)构建到载体pBAD中得到重组载体pBAD-XC(SEQ ID NO.4所示)，利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)的连接顺序构建到载体pZH中得到重组载体pZH-HFPB(SEQ ID NO.5所示)，然后将pBAD-XC和pZH-HFPB导入到受体大肠杆菌中；

所述方式乙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)的基因的连接顺序构建到载体pBAD中得到重组载体pBAD-XPB(SEQ ID NO.2所示)，利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因N-乙酰转移酶基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的连接顺序构建到载体pZH中得到重组载体pZH-HFC(SEQ ID NO.3所示)，然后将重组载体pBAD-XPB和pZH-HFC导入到受体大肠杆菌中；

所述方式丙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为B)、天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的连接顺序构建到载体pBAD中得到重组载体pBAD-XPBHFC(SEQ ID NO.1所示)，然后将重组载体pBAD-XPBHFC导入到受体大肠杆菌中。

上述构建方法中，所述受体大肠杆菌可为大肠杆菌K12；具体为大肠杆菌K12菌株BW25113。

上述构建方法中，所述苯丙氨酸羟化酶可为如下A1)或A2)所示的蛋白质：

A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质；

所述二氢单磷酸还原酶可为如下A3)或A4)所示的蛋白质：

A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质；

A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质；

A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质；

所述N-乙酰转移酶可为如下A9)或A10)所示的蛋白质：

A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质；

所述咖啡酸-O-甲基转移酶可为如下A11)或A12)所示的蛋白质：

A11)SEQ ID NO.1第4429-5535位所示的DNA分子编码的蛋白质；

上述方法中，同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62作为Matrix，将Gap existence cost，Per residue gap cost和Lambda ratio分别设置为11，1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。

上述方法中，所述90％以上的同一性可为至少91％、92％、95％、96％、98％、99％或100％的同一性。

上述方法中，所述苯丙氨酸羟化酶基因可为如下B1)或B2)所示：

B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子；

所述二氢单磷酸还原酶基因可为如下B3)或B4)所示：

B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子；

所述4a-羟基四氢生物蝶呤脱水酶基因可为如下B5)或B6)所示：

B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子；

所述天冬氨酸转氨酶家族蛋白基因可为如下B7)或B8)所示：

B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子；

所述N-乙酰转移酶基因可为如下B9)或B10)所示：

B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子；

所述咖啡酸-O-甲基转移酶基因可为如下B11)或B12)所示：

B11)编码序列为SEQ ID NO.1第4429-5535位所示的DNA分子；

上述构建方法得到的重组大肠杆菌及其在制备褪黑素的应用也在本发明的保护范围之内。

本发明进一步公开了一种制备褪黑素的方法。

本发明制备褪黑素的方法，包括：利用上述重组大肠杆菌催化色氨酸和甲硫氨酸反应得到褪黑素。

具体的，所述重组大肠杆菌经阿拉伯糖诱导培养后催化色氨酸和甲硫氨酸反应得到褪黑素。

上述方法中，所述阿拉伯糖为L-阿拉伯糖。

本发明通过在大肠杆菌中过表达褪黑素生物合成相关蛋白的基因，构建了能高效合成褪黑素的重组大肠杆菌，开发了一套高效合成褪黑素的方法。本发明的产褪黑素的重组大肠杆菌菌株，单位菌体的褪黑素合成效率显著高于其它现有菌株，且绝大部分产物分泌至胞外，便于产物的下游纯化分离。因此本发明对褪黑素的工业化生产和大规模应用具有重大意义。

附图说明

图1为SDS-PAGE分析褪黑素生物合成相关蛋白的基因在大肠杆菌中的表达；其中，A为BW-Mel3菌株的蛋白表达情况；B为BW-Mel1菌株的蛋白表达情况；C为BW-Mel2菌株的蛋白表达情况。

图2为三株重组大肠杆菌摇瓶试验中褪黑素合成水平的分析。

图3为一株重组大肠杆菌发酵罐试验中褪黑素合成水平的分析。

具体实施方式

以下的实施例便于更好地理解本发明，但并不限定本发明。下述实施例中所使用的实验方法如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

下述实施例中用到的材料来源如下：

pBAD/HisA购自invitrogen，产品目录号为V430-01；

pZH是在pBAD/HisA基础上改变复制起始位点和抗性为氯霉素得到。

实施例1褪黑素高产的重组大肠杆菌菌株的构建

1、PCR扩增褪黑素生物合成相关基因的编码序列

以合成的野油菜黄单胞菌的苯丙氨酸羟化酶基因(SEQ ID NO.1第319-1209位所示)为模板，用引物F1和R1进行PCR扩增，得到包含苯丙氨酸羟化酶基因的PCR扩增产物X(SEQ ID NO.1第299-1232位所示)。

以合成的来源于铜绿假单胞菌的4a-羟基四氢生物蝶呤脱水酶(phhB)基因(SEQID NO.1第1234-1590位所示)为模板用引物F3和R3进行PCR扩增，得到包含基因phhB的PCR扩增产物P(SEQ ID NO.1第1210-1614位所示)。

以合成的来源于大肠杆菌的二氢单磷酸还原酶(folM)基因(SEQ ID NO.1第1615-2337位所示)为模板，用引物F2和R2进行PCR扩增，得到包含二氢单磷酸还原酶基因的PCR扩增产物B(SEQ ID NO.1第1592-2337位所示)。

以合成的来源于小白链霉菌的天冬氨酸转氨酶家族蛋白(aspartateaminotransferase family protein)基因(SEQ ID NO.1第2362-3831位所示)为模板用引物F4和R4进行PCR扩增，得到包含天冬氨酸转氨酶家族蛋白aspartate aminotransferasefamily protein基因的PCR扩增产物H(SEQ ID NO.1第2362-3831位所示)。

以合成的来源于小白链霉菌的N-乙酰转移酶(N-acetyltransferase)基因(SEQID NO.1第3856-4404位所示)为模板，用引物F5和R5进行PCR扩增，得到包含N-乙酰转移酶(N-acetyltransferase)基因的PCR扩增产物F(SEQ ID NO.1第3814-4404位所示)。

以合成的水稻咖啡酸-O-甲基转移酶(COMT)基因(SEQ ID NO.1第4429-5535位所示)为模板，用引物F6和R6进行PCR扩增，得到包含水稻COMT基因的PCR扩增产物C(SEQ IDNO.1第4405-5535位所示)。

具体引物序列如下：

F1：gctaacaggaggaattaaccATGAACACAGCGCCGCGCCGC

R1：TATATCTCCTTCTTAAAGTTAAATTACACGTCGCCGTCGCGGCTC

F2：TTAACTTTAAGAAGGAGATATACatgggtaaaacccagccctt

R2：ttaacgcagatgacgaccgc

F3：TTTAAGAAGGAGATATACatgaccgcactcacccaagc

R3：GTATATCTCCTTCTTAAAGTTAAATTatttgcgcccctcggcgg

F4：Atgaagcccgctgacgcg

R4：ctactcgggcagcgcatcagc

F5：gatgcgctgcccgagtagTTTAACTTTAAGAAGGAGATATAcatgaacaccttccggacc

R5：tcagtcgcagtggtcatggatcg

F6：TTTAACTTTAAGAAGGAGATATACATGGGTTCTACGGCGGC

R6：TTACTTGGTGAATTCAATAGCCCACGC

2、无缝拼接

以pBAD/HisA为载体，利用无缝拼接方法按照X、P、B、H、F、C的连接顺序构建了载体pBAD-XPBHFC(SEQ ID NO.1所示)，并命名为Mel1；

以pBAD为载体，利用无缝拼接方法按照X、P、B的连接顺序构建重组载体pBAD-XPB(SEQ ID NO.2所示)，以pZH为载体，利用无缝拼接方法按照H、F、C的连接顺序构建重组载体pZH-HFC(SEQ ID NO.3所示)，并将pBAD-XPB和pZH-HFC命名为Mel2；

以pBAD为载体，利用无缝拼接方法构建载体pBAD-XC(SEQ ID NO.4所示)，以pZH为载体，利用无缝拼接方法按照H、F、P、B的连接顺序构建重组载体pZH-HFPB(SEQ ID NO.5所示)，并将pBAD-XC和pZH-HFPB命名为Mel3。

3、转化、筛选以及序列验证

用氯化钙化学转化法将重组载体pBAD-XPBHFC、pBAD-XPB、pZH-HFC、pBAD-XC和pZH-HFPB分别转化至大肠杆菌DH5α，用含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基进行筛选培养，挑取单菌落，并进行扩大培养和提取质粒，进行测序验证，结果获得的序列如SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4和SEQ ID NO.5所示，证明构建的重组质粒及重组菌正确。将阳性克隆的重组菌记作DH5α-pBAD-XPBHFC，DH5α-pBAD-XPB，DH5α-pZH-HFC，DH5α-pBAD-XC，DH5α-pZH-HFPB，阳性质粒记作pBAD-XPBHFC，pBAD-XPB，pZH-HFC，pBAD-XC，pZH-HFPB。

4、重组表达菌株的构建

用氯化钙化学转化法将重组质粒pBAD-XPBHFC、pBAD-XPB和pZH-HFC、pBAD-XC和pZH-HFPB转化至大肠杆菌K-12系列表达菌株BW25113(购买自北京江晨文轩生物科技有限责任公司货号：G6058，rrnB3ΔlacZ4787 hsdR514Δ(araBAD)567Δ(rhaBAD)568rph-1)，用含有氨苄青霉素(100μg/ml)和或含氯霉素(34ug/ml)的LB培养基进行筛选培养，挑取单菌落，获得重组大肠杆菌菌株记作BW-pBAD-XPBHFC(命名为BW-Mel1)；BW-pBAD-XPB/pZH-HFC(命名为BW-Mel2)；BW-pBAD-XC和pZH-HFPB(命名为BW-Mel3)。

5、蛋白表达

以BW-Mel3为例：

挑取BW-Mel3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中，于37℃过夜培养。将过夜培养物接种于100ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基，37℃剧烈振荡(200rpm)培养，至发酵液的OD₆₀₀值达到0.6-0.8左右，向发酵体系中加入L-阿拉伯糖(终浓度0.1％)，30℃条件下继续培养10-12小时。

发酵完毕后，5000rpm离心15分钟，收集菌体；用pH7.0的PBS缓冲液重悬菌体，超声波破碎后12,000rpm离心15min。收集上清液，即为含有目的蛋白的粗酶液，SDS-PAGE检测蛋白表达情况。结果如图1所示，表明BW-Mel3菌株中6种蛋白均获得了可溶性表达。

利用上述方法，分别对BW-Mel1和BW-Mel2进行实验，SDS-PAGE检测蛋白表达情况，BW-Mel1菌株中咖啡酸-O-甲基转移酶和二氢单磷酸还原酶没有观察到明显条带，其余4个蛋白均获得表达，BW-Mel2菌株中6种蛋白均有可溶性表达。

6、大肠杆菌褪黑素的生物转化摇瓶试验

以BW-Mel3为例进行摇瓶试验：

挑取BW-Mel3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中，于37℃过夜培养。将过夜培养物接种于500ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基，37℃剧烈振荡(200rpm)培养，至发酵液的OD₆₀₀值达到0.6-0.8左右，再向发酵体系中加入L-阿拉伯糖(终浓度0.1％)，30℃条件下继续培养10-12小时。5000rpm离心15分钟，收集菌体。

离心后菌体加入转化液重悬菌体至OD₆₀₀值达到10，取25ml重悬菌液于250ml三角瓶中，30℃振荡(100rpm)反应96小时，分别检测24h、48h、72h和96h的褪黑素的产量。

其中，转化液成分：10g/L葡萄糖，6g/L Na₂HPO₄，0.5g/L NaCl，3g/L KH₂PO₄，1g/LNH₄Cl，246.5mg/L MgSO₄·7H₂O，14.7mg/L CaCl₂·2H₂O，27.8mg/L FeSO₄·7H₂O，2g/Lyeast extract(酵母提取物)；1％甘油；1g/L tryptophan(色氨酸)；1g/L Methionine(甲硫氨酸)。

利用上述方法，分别对BW-Mel1和BW-Mel2进行实验，分别检测24h、48h、72h和96h的褪黑素的产量。

结果如图2所示，结果显示三株重组大肠杆菌菌株褪黑素的产量具有显著的差异，其中，BW-Mel3(即BW-pBAD-XC/pZH-HFPB，图中以“菌株3”表示)的产量最高，96h时褪黑素的产量达到了最高为117mg/L；BW-Mel2(即BW-pBAD-XPB/pZH-HFC，图中以“菌株2”表示)的产量次之，BW-Mel1(即BW-pBAD-XPBHFC，图中以“菌株1”表示)几乎没有褪黑素的产生。

7、褪黑素的生物转化发酵罐试验

以摇瓶试验褪黑素产量最高的BW-Mel3菌株做上罐发酵：

1)种子液制备：挑取所述重组大肠杆菌BW-Mel3单菌落接入20ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中，于37℃、200rpm培养12小时；然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的种子培养基中，37℃、200rpm振荡培养12小时，即得种子液；

其中，所述种子培养基的配制：蛋白胨16g，酵母膏10g，氯化钠5g，用水定容至1L，pH7.0。

2)菌体培养过程：以10％的接种量将种子液接种到1L含氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的发酵罐培养基当中，发酵采用2.5L的发酵罐，培养过程中控制温度为37℃，通过搅拌速度(500－800转/分钟)和通气量(3L/min)控制菌体培养体系的溶氧在20％以上，通过流加1M磷酸和3M氨水维持pH值稳定在6.8-7.2。搅拌培养至葡萄糖消耗完时流加补料培养基，补料培养基的流加速度为50mL/h，流加至菌体密度OD600达到20，菌体培养过程结束，得到菌体培养后的发酵液，进入诱导培养阶段；

每1L发酵培养基的配制：葡萄糖10g，(NH₄)₂HPO₄ 8g，KH₂PO₄ 13.3g，MgSO₄·7H₂O1.2g，柠檬酸1.7g，微量盐溶液10mL，用水定溶至1L，5M NaOH调至pH7.0；

每1L补料培养基的配制：葡萄糖400g，MgSO₄·7H₂O 10g，微量盐溶液20mL，用水定容至1L；

每1L微量盐溶液的配制：FeSO₄·7H₂O 10g，ZnSO₄·7H₂O 2.25g，CuSO₄·5H₂O 1g，MnSO₄·5H₂O 0.5g，Na₂B₄O₇·10H₂O 0.23g，CaCl₂·2H₂O 2g，(NH₄)₆Mo₇O₂₄ 0.1g，用5M盐酸水溶液定容，定容至1L。

3)诱导培养：将上述菌体培养后的发酵液的温度降至30℃，加入L-阿拉伯糖，使得L-阿拉伯糖终浓度为1g/L，进行诱导培养，同时加入色氨酸终浓度为4g/L，甲硫氨酸终浓度为4g/L，甘油终浓度为体积占比5％；诱导培养过程中要一直流加补料培养基，补料培养基的流加速度调至20mL/h；流加至菌体密度OD600达到40，诱导培养过程结束；

所述诱导培养的条件为：培养温度为30℃，通过调整搅拌速度(500－800转/分钟)和通气量(3L/min)控制诱导培养体系的溶氧在20％以上，通过3M氨水和1M磷酸维持pH至7.0。

4)HPLC检测：上述转化液5000rpm离心15min吸取上清液，按照上清液：水：甲醇体积比1：7.5：1.5制成待检测样品，0.22um有机型滤器过滤除去不溶物后HPLC检测褪黑素浓度。HPLC检测仪为Agilent 1260Infinity LC，检测柱为Agilent ZOBAX C18柱。褪黑素的紫外检测波长为230nm，流动相为40％(V/V)甲醇，流速为1.0mL/min，进样量为10uL，采用外标法按峰面积定量。上海阿拉丁生化科技股份有限公司生产褪黑素标准品作为定量标准。

结果如图3所示，结果显示：采用摇瓶实验最优的BW-Mel3菌株(图中以“菌株3”)上罐后60h时褪黑素的产量达到最高为336mg/L。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

SEQUENCE LISTING

<110> 中国科学院微生物研究所

<120> 产褪黑素的重组大肠杆菌及其构建方法和应用

<130> GNCFY200074

<160> 11

<170> PatentIn version 3.5

<210> 1

<211> 9173

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360

aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420

gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480

cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540

ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600

gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660

gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720

catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780

gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840

acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900

atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960

gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020

agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080

ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140

gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200

gacgtgtaat ttaactttaa gaaggagata tacatgaccg cactcaccca agcccattgc 1260

gaagcctgcc gcgcagacgc cccgcacgtc agcgacgaag aactgcccgt gctgctgcgg 1320

caaatcccgg attggaacat cgaagtccgc gacggcatca tgcagctaga gaaggtctac 1380

ctgttcaaga acttcaagca tgccctggcc ttcaccaatg ccgtcggcga gatatccgag 1440

gccgaaggcc accatccggg cctgctgacc gagtggggca aagtcaccgt gacctggtgg 1500

agccactcga tcaagggcct gcaccgcaac gatttcatca tggcggcgcg caccgatgag 1560

gtagcgaaaa ccgccgaggg gcgcaaataa tttaacttta agaaggagat atacatgggt 1620

aaaacccagc ccttgccaat attaattact ggcggaggtc gtcgcatcgg cctcgccctc 1680

gcatggcatt tcattaatca aaagcaaccg gtgattgtca gctatcggac acactatcca 1740

gccattgatg gactgattaa tgcaggtgcg cagtgtattc aggctgattt ttcgaccaac 1800

gacggtgtga tggcgtttgc cgatgaagta ctaaaaagca cccatggtct gcgtgctatt 1860

ttgcataacg ccagtgcgtg gatggcggaa aaaccgggtg cgccactggc cgacgtactg 1920

gcttgcatga tgcagatcca cgttaatacc ccatacctgc tcaaccatgc gctggaaaga 1980

ttactgcgtg ggcacggaca cgccgccagc gatatcattc actttaccga ttatgtggtg 2040

gagcgcggta gcgacaaaca tattgcgtat gctgcaagca aagcggcact ggataatatg 2100

acccgctcgt ttgcccgcaa gctggcaccg gaagtgaaag tgaattctat tgcgccatcg 2160

ctgatcctgt ttaatgaaca tgatgatgcc gaatatcgac aacaggcgct gaataaatca 2220

ctgatgaaaa ccgcgcctgg cgagaaagaa gtgatcgacc tggtcgatta cttacttacc 2280

agttgctttg tcaccggacg cagtttccca cttgatggcg gtcgtcatct gcgttaattt 2340

aactttaaga aggagatata catgaagccc gctgacgcga aaccgcccca catggaccac 2400

gacaccttcc gctccctggg ccatcaggcc atcgactgga tcgccgacta ctggcagcgt 2460

ttggcggagc gacccgtcgc tccccccgtc gaacccggca gcatccgcgc ccagttaccg 2520

acggccccac ccgagtgcgg cgaggacttt cccgtactgc tgtccgacct cgaacggatc 2580

gtgctgccgg gcctgctgca ctggcagcac ccccgtttct tcggttactt ccccgcgaac 2640

gcttccggcc ccgccgtcct ggccgagctg ttgtccgcgg gcctgggcat ccaggggatg 2700

aactggaaca ccagcccggc ctgcaccgag atcgaacagc agatgctgga ctggttcgtg 2760

cacctgctcg gcctacccga gcacctccgc ggtgggggag tcatccagga caccgcctcc 2820

agcgccctcc tggtggcact gctcaccgcc ctgcaccagg ccagtgcggg ccgcacccgc 2880

gaccacggca ccggcgagtg cggctaccgg gtgtacctga ccgccgagac gcactcggcg 2940

gcccgcaagg ccgccgtcat caccggactg ggcctgcggg ccatgtgcga ggtggccacc 3000

gacgccgacg gcgccatgga cgcagtcgat ctggaaagac acctccgggc cgaccgggcc 3060

gcaggtctga ccccgctgat ggtcgtggcc acccgaggca ccacctccca tctctccttc 3120

gaccccctgg aggacatcgg ccccgtgtgt cgtcggcacg gcgtgtggct ccacgtcgac 3180

gccgcatacg ccggagtggc cgcggtctgc gacgaactgc gctgggtcaa cgacggcgtg 3240

cgctacgcgg actcctactg caccaacccg cacaagtggc tgctgaccaa cttcgactgc 3300

gacctgctgt gggtggccca ccccgaagtc ctcgtcagcg ccctgagcgt gctccccgaa 3360

tacctgcgca actcggcctc cgaatcgggc cgggtgaccg actaccggca ctggcaggtc 3420

ccactgggcc ggcgcttccg cgcactgaaa ctgtggtccg tcctccactg gtacggcgcc 3480

gaggggctgc gcgcccacat ccgcaccggc gttcggcatg cccagctctt cgcggacctg 3540

gtcggcgccg acgaccgctt caccctggtc acccctcccg ccctcggcct ggtgacgttc 3600

cgtcagaccg gaacggacga ggagaaccgg aacctcctgc aagccatcaa caccgaggga 3660

accaccttcc tcacccactc cgagaagaac ggcaccttct tcctgcgctt cgccgccggc 3720

ggcaccctca ccgaggacca ccacgtacgc gaagcatggc gcgccgtcca gaacgcgatc 3780

cctcgcgcac aacacctcgc cggcggctcg gctgatgcgc tgcccgagta gtttaacttt 3840

aagaaggaga tatacatgaa caccttccgg accgcgacgg cacgcgatct ccccgatgtc 3900

gccgccacct tgaccgaggc gttcgccgcc gacccgccga cccaatgggt cttcccggac 3960

ggtgccgctg cggtctcccg tttcttcttc ggtgtcgccg accgtgcccg cgaggccggc 4020

gggatcgtcg aactactccc cggcaccgcc gcgatgatcg ccctaccccc gcacgtacga 4080

ctacccgacg ccccagcctg cggccgacag gccgagatgc agcgcaggct gggcgaacgc 4140

cgcccccgca ctccgcacta ctacctcctc ttctacggcg tgcgcaccgc ccatcagagc 4200

tccggcctgg ggggacggat gctctccgac ctcatctccc tggccgaccg cgaccgcgtg 4260

ggcacctaca ccgaggccag cacctggcgc ggcgcccgcc tgatgttgcg tcacggcttc 4320

cacaccgcac agccgctgcg gcttccccac gggccaccca tgttccccct ctggagagac 4380

ccgatccatg accactgcga ctgatttaac tttaagaagg agatatacat gggttctacg 4440

gcggcggaca tggcggcagc agcggacgaa gaagcatgca tgtatgcgct gcagctggcg 4500

tcttcctcta tcctgccgat gacgctgaaa aacgctattg aactgggtct gctcgaaacc 4560

ctgcagagcg cggcagttgc aggtggtggc ggcaaagcgg cgctgctgac tccggccgaa 4620

gtggctgata aactgccgtc taaagcgaac ccggccgcgg cagatatggt ggatcgcatg 4680

ctgcgtctgc tggccagcta taacgtggtt cgttgcgaaa tggaggaagg cgccgatggc 4740

aagctgagcc gccgctacgc tgctgcgcct gtgtgtaagt ggctgacccc gaacgaggat 4800

ggcgtgagca tggcagcact cgctctcatg aaccaggaca aagttctgat ggagtcgtgg 4860

tattatctga aggacgcggt tctggatggt ggtatcccgt tcaacaaggc ctatggtatg 4920

accgctttcg aatatcacgg cactgatgcg cgcttcaacc gtgtcttcaa cgagggtatg 4980

aaaaaccatt ctgtgatcat caccaaaaaa ctgctggatc tgtataccgg cttcgacgcg 5040

gcttccacgg tagttgacgt tggtggtggt gttggcgcaa cggttgctgc tgtagtaagc 5100

cgccacccac acattcgcgg tatcaactat gatctgccac acgttatcag cgaagcgccg 5160

ccgttcccgg gcgtagaaca cgtcggtggc gacatgttcg ctagcgtgcc gcgcggtggt 5220

gacgcaatcc tgatgaagtg gattctgcac gattggagcg acgagcactg cgctcgtctg 5280

ctgaaaaact gctatgatgc actgcctgaa cacggcaaag ttgtagttgt tgaatgtgtt 5340

ctgccagaat cctcggacgc cactgcacgc gaacagggtg tatttcacgt ggacatgatt 5400

atgctggcgc acaacccggg tggcaaagaa cgttatgaac gtgaatttcg tgagctggcg 5460

cgtgcggcgg gtttcacggg ctttaaagct acctatatct acgcgaacgc gtgggctatt 5520

gaattcacca agtaaaagct tggctgtttt ggcggatgag agaagatttt cagcctgata 5580

cagattaaat cagaacgcag aagcggtctg ataaaacaga atttgcctgg cggcagtagc 5640

gcggtggtcc cacctgaccc catgccgaac tcagaagtga aacgccgtag cgccgatggt 5700

agtgtggggt ctccccatgc gagagtaggg aactgccagg catcaaataa aacgaaaggc 5760

tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctcctgag 5820

taggacaaat ccgccgggag cggatttgaa cgttgcgaag caacggcccg gagggtggcg 5880

ggcaggacgc ccgccataaa ctgccaggca tcaaattaag cagaaggcca tcctgacgga 5940

tggccttttt gcgtttctac aaactctttt gtttattttt ctaaatacat tcaaatatgt 6000

atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 6060

tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 6120

tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 6180

gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 6240

aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 6300

gtgttgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 6360

ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 6420

gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 6480

gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 6540

atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 6600

ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 6660

cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 6720

cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 6780

gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 6840

cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 6900

cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt 6960

taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga 7020

ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca 7080

aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 7140

caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 7200

taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 7260

gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 7320

cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 7380

taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 7440

agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 7500

ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 7560

gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 7620

acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 7680

acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 7740

tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 7800

ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 7860

agcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt 7920

gcactctcag tacaatctgc tctgatgccg catagttaag ccagtataca ctccgctatc 7980

gctacgtgac tgggtcatgg ctgcgccccg acacccgcca acacccgctg acgcgccctg 8040

acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg 8100

catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg aggcagcaga tcaattcgcg 8160

cgcgaaggcg aagcggcatg cataatgtgc ctgtcaaatg gacgaagcag ggattctgca 8220

aaccctatgc tactccgtca agccgtcaat tgtctgattc gttaccaatt atgacaactt 8280

gacggctaca tcattcactt tttcttcaca accggcacgg aactcgctcg ggctggcccc 8340

ggtgcatttt ttaaataccc gcgagaaata gagttgatcg tcaaaaccaa cattgcgacc 8400

gacggtggcg ataggcatcc gggtggtgct caaaagcagc ttcgcctggc tgatacgttg 8460

gtcctcgcgc cagcttaaga cgctaatccc taactgctgg cggaaaagat gtgacagacg 8520

cgacggcgac aagcaaacat gctgtgcgac gctggcgata tcaaaattgc tgtctgccag 8580

gtgatcgctg atgtactgac aagcctcgcg tacccgatta tccatcggtg gatggagcga 8640

ctcgttaatc gcttccatgc gccgcagtaa caattgctca agcagattta tcgccagcag 8700

ctccgaatag cgcccttccc cttgcccggc gttaatgatt tgcccaaaca ggtcgctgaa 8760

atgcggctgg tgcgcttcat ccgggcgaaa gaaccccgta ttggcaaata ttgacggcca 8820

gttaagccat tcatgccagt aggcgcgcgg acgaaagtaa acccactggt gataccattc 8880

gcgagcctcc ggatgacgac cgtagtgatg aatctctcct ggcgggaaca gcaaaatatc 8940

acccggtcgg caaacaaatt ctcgtccctg atttttcacc accccctgac cgcgaatggt 9000

gagattgaga atataacctt tcattcccag cggtcggtcg ataaaaaaat cgagataacc 9060

gttggcctca atcggcgtta aacccgccac cagatgggca ttaaacgagt atcccggcag 9120

caggggatca ttttgcgctt cagccatact tttcatactc ccgccattca gag 9173

<210> 2

<211> 5975

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360

aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420

gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480

cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540

ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600

gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660

gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720

catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780

gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840

acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900

atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960

gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020

agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080

ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140

gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200

gacgtgtaat ttaactttaa gaaggagata tacatgaccg cactcaccca agcccattgc 1260

gaagcctgcc gcgcagacgc cccgcacgtc agcgacgaag aactgcccgt gctgctgcgg 1320

caaatcccgg attggaacat cgaagtccgc gacggcatca tgcagctaga gaaggtctac 1380

ctgttcaaga acttcaagca tgccctggcc ttcaccaatg ccgtcggcga gatatccgag 1440

gccgaaggcc accatccggg cctgctgacc gagtggggca aagtcaccgt gacctggtgg 1500

agccactcga tcaagggcct gcaccgcaac gatttcatca tggcggcgcg caccgatgag 1560

gtagcgaaaa ccgccgaggg gcgcaaataa tttaacttta agaaggagat atacatgggt 1620

aaaacccagc ccttgccaat attaattact ggcggaggtc gtcgcatcgg cctcgccctc 1680

gcatggcatt tcattaatca aaagcaaccg gtgattgtca gctatcggac acactatcca 1740

gccattgatg gactgattaa tgcaggtgcg cagtgtattc aggctgattt ttcgaccaac 1800

gacggtgtga tggcgtttgc cgatgaagta ctaaaaagca cccatggtct gcgtgctatt 1860

ttgcataacg ccagtgcgtg gatggcggaa aaaccgggtg cgccactggc cgacgtactg 1920

gcttgcatga tgcagatcca cgttaatacc ccatacctgc tcaaccatgc gctggaaaga 1980

ttactgcgtg ggcacggaca cgccgccagc gatatcattc actttaccga ttatgtggtg 2040

gagcgcggta gcgacaaaca tattgcgtat gctgcaagca aagcggcact ggataatatg 2100

acccgctcgt ttgcccgcaa gctggcaccg gaagtgaaag tgaattctat tgcgccatcg 2160

ctgatcctgt ttaatgaaca tgatgatgcc gaatatcgac aacaggcgct gaataaatca 2220

ctgatgaaaa ccgcgcctgg cgagaaagaa gtgatcgacc tggtcgatta cttacttacc 2280

agttgctttg tcaccggacg cagtttccca cttgatggcg gtcgtcatct gcgttaaaag 2340

cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa atcagaacgc 2400

agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt cccacctgac 2460

cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat 2520

gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 2580

ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccggg 2640

agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac gcccgccata 2700

aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct 2760

acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 2820

aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 2880

gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 2940

cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 3000

tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 3060

tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac gccgggcaag 3120

agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 3180

cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 3240

tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 3300

ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 3360

tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 3420

cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 3480

actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 3540

ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 3600

tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 3660

ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 3720

aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 3780

ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 3840

agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 3900

ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 3960

tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 4020

cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 4080

ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 4140

gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 4200

ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 4260

aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg 4320

cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 4380

ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 4440

gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 4500

ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 4560

ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 4620

gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt 4680

ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 4740

gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat 4800

ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 4860

ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 4920

accgtcatca ccgaaacgcg cgaggcagca gatcaattcg cgcgcgaagg cgaagcggca 4980

tgcataatgt gcctgtcaaa tggacgaagc agggattctg caaaccctat gctactccgt 5040

caagccgtca attgtctgat tcgttaccaa ttatgacaac ttgacggcta catcattcac 5100

tttttcttca caaccggcac ggaactcgct cgggctggcc ccggtgcatt ttttaaatac 5160

ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga ccgacggtgg cgataggcat 5220

ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt tggtcctcgc gccagcttaa 5280

gacgctaatc cctaactgct ggcggaaaag atgtgacaga cgcgacggcg acaagcaaac 5340

atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc aggtgatcgc tgatgtactg 5400

acaagcctcg cgtacccgat tatccatcgg tggatggagc gactcgttaa tcgcttccat 5460

gcgccgcagt aacaattgct caagcagatt tatcgccagc agctccgaat agcgcccttc 5520

cccttgcccg gcgttaatga tttgcccaaa caggtcgctg aaatgcggct ggtgcgcttc 5580

atccgggcga aagaaccccg tattggcaaa tattgacggc cagttaagcc attcatgcca 5640

gtaggcgcgc ggacgaaagt aaacccactg gtgataccat tcgcgagcct ccggatgacg 5700

accgtagtga tgaatctctc ctggcgggaa cagcaaaata tcacccggtc ggcaaacaaa 5760

ttctcgtccc tgatttttca ccaccccctg accgcgaatg gtgagattga gaatataacc 5820

tttcattccc agcggtcggt cgataaaaaa atcgagataa ccgttggcct caatcggcgt 5880

taaacccgcc accagatggg cattaaacga gtatcccggc agcaggggat cattttgcgc 5940

ttcagccata cttttcatac tcccgccatt cagag 5975

<210> 3

<211> 7273

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 60

tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 120

agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 180

gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta 240

tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc 300

tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 360

tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagca gatcaattcg 420

cgcgcgaagg cgaagcggca tgcataatgt gcctgtcaaa tggacgaagc agggattctg 480

caaaccctat gctactccgt caagccgtca attgtctgat tcgttaccaa ttatgacaac 540

ttgacggcta catcattcac tttttcttca caaccggcac ggaactcgct cgggctggcc 600

ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga 660

ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt 720

tggtcctcgc gccagcttaa gacgctaatc cctaactgct ggcggaaaag atgtgacaga 780

cgcgacggcg acaagcaaac atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc 840

aggtgatcgc tgatgtactg acaagcctcg cgtacccgat tatccatcgg tggatggagc 900

gactcgttaa tcgcttccat gcgccgcagt aacaattgct caagcagatt tatcgccagc 960

agctccgaat agcgcccttc cccttgcccg gcgttaatga tttgcccaaa caggtcgctg 1020

aaatgcggct ggtgcgcttc atccgggcga aagaaccccg tattggcaaa tattgacggc 1080

cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt aaacccactg gtgataccat 1140

tcgcgagcct ccggatgacg accgtagtga tgaatctctc ctggcgggaa cagcaaaata 1200

tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca ccaccccctg accgcgaatg 1260

gtgagattga gaatataacc tttcattccc agcggtcggt cgataaaaaa atcgagataa 1320

ccgttggcct caatcggcgt taaacccgcc accagatggg cattaaacga gtatcccggc 1380

agcaggggat cattttgcgc ttcagccata cttttcatac tcccgccatt cagagaagaa 1440

accaattgtc catattgcat cagacattgc cgtcactgcg tcttttactg gctcttctcg 1500

ctaaccaaac cggtaacccc gcttattaaa agcattctgt aacaaagcgg gaccaaagcc 1560

atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca gaaaagtcca cattgattat 1620

ttgcacggcg tcacactttg ctatgccata gcatttttat ccataagatt agcggatcct 1680

acctgacgct ttttatcgca actctctact gtttctccat acccgttttt tgggctaaca 1740

ggaggaatta accatgaagc ccgctgacgc gaaaccgccc cacatggacc acgacacctt 1800

ccgctccctg ggccatcagg ccatcgactg gatcgccgac tactggcagc gtttggcgga 1860

gcgacccgtc gctccccccg tcgaacccgg cagcatccgc gcccagttac cgacggcccc 1920

acccgagtgc ggcgaggact ttcccgtact gctgtccgac ctcgaacgga tcgtgctgcc 1980

gggcctgctg cactggcagc acccccgttt cttcggttac ttccccgcga acgcttccgg 2040

ccccgccgtc ctggccgagc tgttgtccgc gggcctgggc atccagggga tgaactggaa 2100

caccagcccg gcctgcaccg agatcgaaca gcagatgctg gactggttcg tgcacctgct 2160

cggcctaccc gagcacctcc gcggtggggg agtcatccag gacaccgcct ccagcgccct 2220

cctggtggca ctgctcaccg ccctgcacca ggccagtgcg ggccgcaccc gcgaccacgg 2280

caccggcgag tgcggctacc gggtgtacct gaccgccgag acgcactcgg cggcccgcaa 2340

ggccgccgtc atcaccggac tgggcctgcg ggccatgtgc gaggtggcca ccgacgccga 2400

cggcgccatg gacgcagtcg atctggaaag acacctccgg gccgaccggg ccgcaggtct 2460

gaccccgctg atggtcgtgg ccacccgagg caccacctcc catctctcct tcgaccccct 2520

ggaggacatc ggccccgtgt gtcgtcggca cggcgtgtgg ctccacgtcg acgccgcata 2580

cgccggagtg gccgcggtct gcgacgaact gcgctgggtc aacgacggcg tgcgctacgc 2640

ggactcctac tgcaccaacc cgcacaagtg gctgctgacc aacttcgact gcgacctgct 2700

gtgggtggcc caccccgaag tcctcgtcag cgccctgagc gtgctccccg aatacctgcg 2760

caactcggcc tccgaatcgg gccgggtgac cgactaccgg cactggcagg tcccactggg 2820

ccggcgcttc cgcgcactga aactgtggtc cgtcctccac tggtacggcg ccgaggggct 2880

gcgcgcccac atccgcaccg gcgttcggca tgcccagctc ttcgcggacc tggtcggcgc 2940

cgacgaccgc ttcaccctgg tcacccctcc cgccctcggc ctggtgacgt tccgtcagac 3000

cggaacggac gaggagaacc ggaacctcct gcaagccatc aacaccgagg gaaccacctt 3060

cctcacccac tccgagaaga acggcacctt cttcctgcgc ttcgccgccg gcggcaccct 3120

caccgaggac caccacgtac gcgaagcatg gcgcgccgtc cagaacgcga tccctcgcgc 3180

acaacacctc gccggcggct cggctgatgc gctgcccgag tagtttaact ttaagaagga 3240

gatatacatg aacaccttcc ggaccgcgac ggcacgcgat ctccccgatg tcgccgccac 3300

cttgaccgag gcgttcgccg ccgacccgcc gacccaatgg gtcttcccgg acggtgccgc 3360

tgcggtctcc cgtttcttct tcggtgtcgc cgaccgtgcc cgcgaggccg gcgggatcgt 3420

cgaactactc cccggcaccg ccgcgatgat cgccctaccc ccgcacgtac gactacccga 3480

cgccccagcc tgcggccgac aggccgagat gcagcgcagg ctgggcgaac gccgcccccg 3540

cactccgcac tactacctcc tcttctacgg cgtgcgcacc gcccatcaga gctccggcct 3600

ggggggacgg atgctctccg acctcatctc cctggccgac cgcgaccgcg tgggcaccta 3660

caccgaggcc agcacctggc gcggcgcccg cctgatgttg cgtcacggct tccacaccgc 3720

acagccgctg cggcttcccc acgggccacc catgttcccc ctctggagag acccgatcca 3780

tgaccactgc gactgattta actttaagaa ggagatatac atgggttcta cggcggcgga 3840

catggcggca gcagcggacg aagaagcatg catgtatgcg ctgcagctgg cgtcttcctc 3900

tatcctgccg atgacgctga aaaacgctat tgaactgggt ctgctcgaaa ccctgcagag 3960

cgcggcagtt gcaggtggtg gcggcaaagc ggcgctgctg actccggccg aagtggctga 4020

taaactgccg tctaaagcga acccggccgc ggcagatatg gtggatcgca tgctgcgtct 4080

gctggccagc tataacgtgg ttcgttgcga aatggaggaa ggcgccgatg gcaagctgag 4140

ccgccgctac gctgctgcgc ctgtgtgtaa gtggctgacc ccgaacgagg atggcgtgag 4200

catggcagca ctcgctctca tgaaccagga caaagttctg atggagtcgt ggtattatct 4260

gaaggacgcg gttctggatg gtggtatccc gttcaacaag gcctatggta tgaccgcttt 4320

cgaatatcac ggcactgatg cgcgcttcaa ccgtgtcttc aacgagggta tgaaaaacca 4380

ttctgtgatc atcaccaaaa aactgctgga tctgtatacc ggcttcgacg cggcttccac 4440

ggtagttgac gttggtggtg gtgttggcgc aacggttgct gctgtagtaa gccgccaccc 4500

acacattcgc ggtatcaact atgatctgcc acacgttatc agcgaagcgc cgccgttccc 4560

gggcgtagaa cacgtcggtg gcgacatgtt cgctagcgtg ccgcgcggtg gtgacgcaat 4620

cctgatgaag tggattctgc acgattggag cgacgagcac tgcgctcgtc tgctgaaaaa 4680

ctgctatgat gcactgcctg aacacggcaa agttgtagtt gttgaatgtg ttctgccaga 4740

atcctcggac gccactgcac gcgaacaggg tgtatttcac gtggacatga ttatgctggc 4800

gcacaacccg ggtggcaaag aacgttatga acgtgaattt cgtgagctgg cgcgtgcggc 4860

gggtttcacg ggctttaaag ctacctatat ctacgcgaac gcgtgggcta ttgaattcac 4920

caagtaaaag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa 4980

atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt 5040

cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg 5100

gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga 5160

aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa 5220

atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac 5280

gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggcctta 5340

caacttatat cgtatggggc tgacttcagg tgctacattt gaagagataa attgcactga 5400

aatctagaaa tattttatct gattaataag atgatcttct tgagatcgtt ttggtctgcg 5460

cgtaatctct tgctctgaaa acgaaaaaac cgccttgcag ggcggttttt cgaaggttct 5520

ctgagctacc aactctttga accgaggtaa ctggcttgga ggagcgcagt caccaaaact 5580

tgtcctttca gtttagcctt aaccggcgca tgacttcaag actaactcct ctaaatcaat 5640

taccagtggc tgctgccagt ggtgcttttg catgtctttc cgggttggac tcaagacgat 5700

agttaccgga taaggcgcag cggtcggact gaacgggggg ttcgtgcata cagtccagct 5760

tggagcgaac tgcctacccg gaactgagtg tcaggcgtgg aatgagacaa acgcggccat 5820

aacagcggaa tgacaccggt aaaccgaaag gcaggaacag gagagcgcac gagggagccg 5880

ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacca ctgatttgag 5940

cgtcagattt cgtgatgctt gtcagggggg cggagcctat ggaaaaacgg ctttgccgcg 6000

gccctctcac ttccctgtta agtatcttcc tggcatcttc caggaaatct ccgccccgtt 6060

cgtaagccat ttccgctcgc cgcagtcgaa cgaccgagcg tagcgagtca gtgagcgagg 6120

aagcggaata tatcctgtat cacatattct gctgacgcac cggtgcagcc ttttttctcc 6180

tgccacatga agcacttcac tgacaccctc atcagtgcca acatagtaag ccagtataca 6240

ctccgctagc gctgatgtcc ggcggtgctt ttgccgttac gcaccacccc gtcagtagct 6300

gaacaggagg gacagctgat agaaacagaa gccactggag cacctcaaaa acaccatcat 6360

acactaaatc agtaagttgg cagcatcacc cgacgcactt tgcgccgaat aaatacctgt 6420

gacggaagat cacttcgcag aataaataaa tcctggtgtc cctgttgata ccgggaagcc 6480

ctgggccaac ttttggcgaa aatgagacgt tgatcggcac gtaagaggtt ccaactttca 6540

ccataatgaa ataagatcac taccgggcgt attttttgag ttatcgagat tttcaggagc 6600

taaggaagct aaaatggaga aaaaaatcac tggatatacc accgttgata tatcccaatg 6660

gcatcgtaaa gaacattttg aggcatttca gtcagttgct caatgtacct ataaccagac 6720

cgttcagctg gatattacgg cctttttaaa gaccgtaaag aaaaataagc acaagtttta 6780

tccggccttt attcacattc ttgcccgcct gatgaatgct catccggaat tccgtatggc 6840

aatgaaagac ggtgagctgg tgatatggga tagtgttcac ccttgttaca ccgttttcca 6900

tgagcaaact gaaacgtttt catcgctctg gagtgaatac cacgacgatt tccggcagtt 6960

tctacacata tattcgcaag atgtggcgtg ttacggtgaa aacctggcct atttccctaa 7020

agggtttatt gagaatatgt ttttcgtctc agccaatccc tgggtgagtt tcaccagttt 7080

tgatttaaac gtggccaata tggacaactt cttcgccccc gttttcacca tgggcaaata 7140

ttatacgcaa ggcgacaagg tgctgatgcc gctggcgatt caggttcatc atgccgtctg 7200

tgatggcttc catgtcggca gaatgcttaa tgaattacaa cagtactgcg atgagtggca 7260

gggcggggcg taa 7273

<210> 4

<211> 5978

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360

aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420

gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480

cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540

ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600

gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660

gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720

catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780

gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840

acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900

atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960

gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020

agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080

ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140

gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200

gacgtgtaat ttaactttaa gaaggagata tacatgggtt ctacggcggc ggacatggcg 1260

gcagcagcgg acgaagaagc atgcatgtat gcgctgcagc tggcgtcttc ctctatcctg 1320

ccgatgacgc tgaaaaacgc tattgaactg ggtctgctcg aaaccctgca gagcgcggca 1380

gttgcaggtg gtggcggcaa agcggcgctg ctgactccgg ccgaagtggc tgataaactg 1440

ccgtctaaag cgaacccggc cgcggcagat atggtggatc gcatgctgcg tctgctggcc 1500

agctataacg tggttcgttg cgaaatggag gaaggcgccg atggcaagct gagccgccgc 1560

tacgctgctg cgcctgtgtg taagtggctg accccgaacg aggatggcgt gagcatggca 1620

gcactcgctc tcatgaacca ggacaaagtt ctgatggagt cgtggtatta tctgaaggac 1680

gcggttctgg atggtggtat cccgttcaac aaggcctatg gtatgaccgc tttcgaatat 1740

cacggcactg atgcgcgctt caaccgtgtc ttcaacgagg gtatgaaaaa ccattctgtg 1800

atcatcacca aaaaactgct ggatctgtat accggcttcg acgcggcttc cacggtagtt 1860

gacgttggtg gtggtgttgg cgcaacggtt gctgctgtag taagccgcca cccacacatt 1920

cgcggtatca actatgatct gccacacgtt atcagcgaag cgccgccgtt cccgggcgta 1980

gaacacgtcg gtggcgacat gttcgctagc gtgccgcgcg gtggtgacgc aatcctgatg 2040

aagtggattc tgcacgattg gagcgacgag cactgcgctc gtctgctgaa aaactgctat 2100

gatgcactgc ctgaacacgg caaagttgta gttgttgaat gtgttctgcc agaatcctcg 2160

gacgccactg cacgcgaaca gggtgtattt cacgtggaca tgattatgct ggcgcacaac 2220

ccgggtggca aagaacgtta tgaacgtgaa tttcgtgagc tggcgcgtgc ggcgggtttc 2280

acgggcttta aagctaccta tatctacgcg aacgcgtggg ctattgaatt caccaagtaa 2340

aagcttggct gttttggcgg atgagagaag attttcagcc tgatacagat taaatcagaa 2400

cgcagaagcg gtctgataaa acagaatttg cctggcggca gtagcgcggt ggtcccacct 2460

gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc 2520

catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt cgaaagactg 2580

ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc 2640

gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc 2700

ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc tttttgcgtt 2760

tctacaaact cttttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac 2820

aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt 2880

tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag 2940

aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg 3000

aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa 3060

tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc 3120

aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag 3180

tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa 3240

ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc 3300

taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg 3360

agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa 3420

caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg caacaattaa 3480

tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg 3540

gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag 3600

cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg 3660

caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt 3720

ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt 3780

aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac 3840

gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 3900

atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 3960

tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 4020

gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 4080

actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 4140

gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 4200

agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 4260

ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 4320

aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 4380

cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 4440

gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 4500

cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 4560

cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 4620

gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 4680

attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 4740

tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 4800

catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 4860

cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 4920

ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 4980

gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 5040

cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 5100

cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 5160

tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 5220

catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 5280

taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 5340

aacatgctgt gcgacgctgg cgatatcaaa attgctgtct gccaggtgat cgctgatgta 5400

ctgacaagcc tcgcgtaccc gattatccat cggtggatgg agcgactcgt taatcgcttc 5460

catgcgccgc agtaacaatt gctcaagcag atttatcgcc agcagctccg aatagcgccc 5520

ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc 5580

ttcatccggg cgaaagaacc ccgtattggc aaatattgac ggccagttaa gccattcatg 5640

ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac cattcgcgag cctccggatg 5700

acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac 5760

aaattctcgt ccctgatttt tcaccacccc ctgaccgcga atggtgagat tgagaatata 5820

acctttcatt cccagcggtc ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg 5880

cgttaaaccc gccaccagat gggcattaaa cgagtatccc ggcagcaggg gatcattttg 5940

cgcttcagcc atacttttca tactcccgcc attcagag 5978

<210> 5

<211> 7270

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 60

tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 120

agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 180

gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta 240

tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc 300

tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 360

tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagca gatcaattcg 420

cgcgcgaagg cgaagcggca tgcataatgt gcctgtcaaa tggacgaagc agggattctg 480

caaaccctat gctactccgt caagccgtca attgtctgat tcgttaccaa ttatgacaac 540

ttgacggcta catcattcac tttttcttca caaccggcac ggaactcgct cgggctggcc 600

ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga 660

ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt 720

tggtcctcgc gccagcttaa gacgctaatc cctaactgct ggcggaaaag atgtgacaga 780

cgcgacggcg acaagcaaac atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc 840

aggtgatcgc tgatgtactg acaagcctcg cgtacccgat tatccatcgg tggatggagc 900

gactcgttaa tcgcttccat gcgccgcagt aacaattgct caagcagatt tatcgccagc 960

agctccgaat agcgcccttc cccttgcccg gcgttaatga tttgcccaaa caggtcgctg 1020

aaatgcggct ggtgcgcttc atccgggcga aagaaccccg tattggcaaa tattgacggc 1080

cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt aaacccactg gtgataccat 1140

tcgcgagcct ccggatgacg accgtagtga tgaatctctc ctggcgggaa cagcaaaata 1200

tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca ccaccccctg accgcgaatg 1260

gtgagattga gaatataacc tttcattccc agcggtcggt cgataaaaaa atcgagataa 1320

ccgttggcct caatcggcgt taaacccgcc accagatggg cattaaacga gtatcccggc 1380

agcaggggat cattttgcgc ttcagccata cttttcatac tcccgccatt cagagaagaa 1440

accaattgtc catattgcat cagacattgc cgtcactgcg tcttttactg gctcttctcg 1500

ctaaccaaac cggtaacccc gcttattaaa agcattctgt aacaaagcgg gaccaaagcc 1560

atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca gaaaagtcca cattgattat 1620

ttgcacggcg tcacactttg ctatgccata gcatttttat ccataagatt agcggatcct 1680

acctgacgct ttttatcgca actctctact gtttctccat acccgttttt tgggctaaca 1740

ggaggaatta accatgaagc ccgctgacgc gaaaccgccc cacatggacc acgacacctt 1800

ccgctccctg ggccatcagg ccatcgactg gatcgccgac tactggcagc gtttggcgga 1860

gcgacccgtc gctccccccg tcgaacccgg cagcatccgc gcccagttac cgacggcccc 1920

acccgagtgc ggcgaggact ttcccgtact gctgtccgac ctcgaacgga tcgtgctgcc 1980

gggcctgctg cactggcagc acccccgttt cttcggttac ttccccgcga acgcttccgg 2040

ccccgccgtc ctggccgagc tgttgtccgc gggcctgggc atccagggga tgaactggaa 2100

caccagcccg gcctgcaccg agatcgaaca gcagatgctg gactggttcg tgcacctgct 2160

cggcctaccc gagcacctcc gcggtggggg agtcatccag gacaccgcct ccagcgccct 2220

cctggtggca ctgctcaccg ccctgcacca ggccagtgcg ggccgcaccc gcgaccacgg 2280

caccggcgag tgcggctacc gggtgtacct gaccgccgag acgcactcgg cggcccgcaa 2340

ggccgccgtc atcaccggac tgggcctgcg ggccatgtgc gaggtggcca ccgacgccga 2400

cggcgccatg gacgcagtcg atctggaaag acacctccgg gccgaccggg ccgcaggtct 2460

gaccccgctg atggtcgtgg ccacccgagg caccacctcc catctctcct tcgaccccct 2520

ggaggacatc ggccccgtgt gtcgtcggca cggcgtgtgg ctccacgtcg acgccgcata 2580

cgccggagtg gccgcggtct gcgacgaact gcgctgggtc aacgacggcg tgcgctacgc 2640

ggactcctac tgcaccaacc cgcacaagtg gctgctgacc aacttcgact gcgacctgct 2700

gtgggtggcc caccccgaag tcctcgtcag cgccctgagc gtgctccccg aatacctgcg 2760

caactcggcc tccgaatcgg gccgggtgac cgactaccgg cactggcagg tcccactggg 2820

ccggcgcttc cgcgcactga aactgtggtc cgtcctccac tggtacggcg ccgaggggct 2880

gcgcgcccac atccgcaccg gcgttcggca tgcccagctc ttcgcggacc tggtcggcgc 2940

cgacgaccgc ttcaccctgg tcacccctcc cgccctcggc ctggtgacgt tccgtcagac 3000

cggaacggac gaggagaacc ggaacctcct gcaagccatc aacaccgagg gaaccacctt 3060

cctcacccac tccgagaaga acggcacctt cttcctgcgc ttcgccgccg gcggcaccct 3120

caccgaggac caccacgtac gcgaagcatg gcgcgccgtc cagaacgcga tccctcgcgc 3180

acaacacctc gccggcggct cggctgatgc gctgcccgag tagtttaact ttaagaagga 3240

gatatacatg aacaccttcc ggaccgcgac ggcacgcgat ctccccgatg tcgccgccac 3300

cttgaccgag gcgttcgccg ccgacccgcc gacccaatgg gtcttcccgg acggtgccgc 3360

tgcggtctcc cgtttcttct tcggtgtcgc cgaccgtgcc cgcgaggccg gcgggatcgt 3420

cgaactactc cccggcaccg ccgcgatgat cgccctaccc ccgcacgtac gactacccga 3480

cgccccagcc tgcggccgac aggccgagat gcagcgcagg ctgggcgaac gccgcccccg 3540

cactccgcac tactacctcc tcttctacgg cgtgcgcacc gcccatcaga gctccggcct 3600

ggggggacgg atgctctccg acctcatctc cctggccgac cgcgaccgcg tgggcaccta 3660

caccgaggcc agcacctggc gcggcgcccg cctgatgttg cgtcacggct tccacaccgc 3720

acagccgctg cggcttcccc acgggccacc catgttcccc ctctggagag acccgatcca 3780

tgaccactgc gactgattta actttaagaa ggagatatac atgaccgcac tcacccaagc 3840

ccattgcgaa gcctgccgcg cagacgcccc gcacgtcagc gacgaagaac tgcccgtgct 3900

gctgcggcaa atcccggatt ggaacatcga agtccgcgac ggcatcatgc agctagagaa 3960

ggtctacctg ttcaagaact tcaagcatgc cctggccttc accaatgccg tcggcgagat 4020

atccgaggcc gaaggccacc atccgggcct gctgaccgag tggggcaaag tcaccgtgac 4080

ctggtggagc cactcgatca agggcctgca ccgcaacgat ttcatcatgg cggcgcgcac 4140

cgatgaggta gcgaaaaccg ccgaggggcg caaataattt aactttaaga aggagatata 4200

catgggtaaa acccagccct tgccaatatt aattactggc ggaggtcgtc gcatcggcct 4260

cgccctcgca tggcatttca ttaatcaaaa gcaaccggtg attgtcagct atcggacaca 4320

ctatccagcc attgatggac tgattaatgc aggtgcgcag tgtattcagg ctgatttttc 4380

gaccaacgac ggtgtgatgg cgtttgccga tgaagtacta aaaagcaccc atggtctgcg 4440

tgctattttg cataacgcca gtgcgtggat ggcggaaaaa ccgggtgcgc cactggccga 4500

cgtactggct tgcatgatgc agatccacgt taatacccca tacctgctca accatgcgct 4560

ggaaagatta ctgcgtgggc acggacacgc cgccagcgat atcattcact ttaccgatta 4620

tgtggtggag cgcggtagcg acaaacatat tgcgtatgct gcaagcaaag cggcactgga 4680

taatatgacc cgctcgtttg cccgcaagct ggcaccggaa gtgaaagtga attctattgc 4740

gccatcgctg atcctgttta atgaacatga tgatgccgaa tatcgacaac aggcgctgaa 4800

taaatcactg atgaaaaccg cgcctggcga gaaagaagtg atcgacctgg tcgattactt 4860

acttaccagt tgctttgtca ccggacgcag tttcccactt gatggcggtc gtcatctgcg 4920

ttaaaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 4980

agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 5040

acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 5100

tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 5160

actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 5220

cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 5280

cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggccttacaa 5340

cttatatcgt atggggctga cttcaggtgc tacatttgaa gagataaatt gcactgaaat 5400

ctagaaatat tttatctgat taataagatg atcttcttga gatcgttttg gtctgcgcgt 5460

aatctcttgc tctgaaaacg aaaaaaccgc cttgcagggc ggtttttcga aggttctctg 5520

agctaccaac tctttgaacc gaggtaactg gcttggagga gcgcagtcac caaaacttgt 5580

cctttcagtt tagccttaac cggcgcatga cttcaagact aactcctcta aatcaattac 5640

cagtggctgc tgccagtggt gcttttgcat gtctttccgg gttggactca agacgatagt 5700

taccggataa ggcgcagcgg tcggactgaa cggggggttc gtgcatacag tccagcttgg 5760

agcgaactgc ctacccggaa ctgagtgtca ggcgtggaat gagacaaacg cggccataac 5820

agcggaatga caccggtaaa ccgaaaggca ggaacaggag agcgcacgag ggagccgcca 5880

gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccaccactg atttgagcgt 5940

cagatttcgt gatgcttgtc aggggggcgg agcctatgga aaaacggctt tgccgcggcc 6000

ctctcacttc cctgttaagt atcttcctgg catcttccag gaaatctccg ccccgttcgt 6060

aagccatttc cgctcgccgc agtcgaacga ccgagcgtag cgagtcagtg agcgaggaag 6120

cggaatatat cctgtatcac atattctgct gacgcaccgg tgcagccttt tttctcctgc 6180

cacatgaagc acttcactga caccctcatc agtgccaaca tagtaagcca gtatacactc 6240

cgctagcgct gatgtccggc ggtgcttttg ccgttacgca ccaccccgtc agtagctgaa 6300

caggagggac agctgataga aacagaagcc actggagcac ctcaaaaaca ccatcataca 6360

ctaaatcagt aagttggcag catcacccga cgcactttgc gccgaataaa tacctgtgac 6420

ggaagatcac ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg 6480

ggccaacttt tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca 6540

taatgaaata agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa 6600

ggaagctaaa atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca 6660

tcgtaaagaa cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt 6720

tcagctggat attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc 6780

ggcctttatt cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat 6840

gaaagacggt gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga 6900

gcaaactgaa acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct 6960

acacatatat tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg 7020

gtttattgag aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga 7080

tttaaacgtg gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta 7140

tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtctgtga 7200

tggcttccat gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg 7260

cggggcgtaa 7270

<210> 6

<211> 296

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 6

Met Asn Thr Ala Pro Arg Arg Val Glu Asn Gln Leu Thr Asp Lys Gly

1 5 10 15

Tyr Val Pro Val Tyr Thr Thr Ala Val Val Glu Gln Pro Trp Asp Gly

20 25 30

Tyr Ser Ala Asp Asp His Ala Thr Trp Gly Thr Leu Tyr Arg Arg Gln

35 40 45

Arg Ala Leu Leu Val Gly Arg Ala Cys Asp Glu Phe Leu Gln Ala Gln

50 55 60

Asp Ala Met Gly Met Asp Asp Thr Gln Ile Pro Arg Phe Asp Ala Leu

65 70 75 80

Asn Ala Val Leu Gln Ala Thr Thr Gly Trp Thr Leu Val Gly Val Glu

85 90 95

Gly Leu Leu Pro Glu Leu Asp Phe Phe Asp His Leu Ala Asn Arg Arg

100 105 110

Phe Pro Val Thr Trp Trp Ile Arg Arg Pro Asp Gln Ile Asp Tyr Ile

115 120 125

Ala Glu Pro Asp Leu Phe His Asp Leu Phe Gly His Val Pro Leu Leu

130 135 140

Met Asn Pro Leu Phe Ala Asp Phe Met Gln Ala Tyr Gly Arg Gly Gly

145 150 155 160

Val Lys Ala His Gly Ile Gly Pro Asp Ala Leu Gln Asn Leu Thr Arg

165 170 175

Leu Tyr Phe Tyr Thr Val Glu Phe Gly Leu Ile Ala Thr Pro Gln Gly

180 185 190

Leu Arg Ile Tyr Gly Ala Gly Ile Val Ser Ser Lys Gly Glu Ser Leu

195 200 205

His Ser Leu Glu Ser Ala Ala Pro Asn Arg Val Gly Phe Asp Leu Gln

210 215 220

Arg Val Met Arg Thr Arg Tyr Arg Ile Asp Ser Phe Gln Lys Thr Tyr

225 230 235 240

Phe Val Ile Asp Ser Phe Thr Gln Leu Met Asp Ala Thr Ala Pro Asp

245 250 255

Phe Thr Pro Ile Tyr Ala Ala Leu Ala Gln Gln Pro Gln Val Pro Ala

260 265 270

Gly Glu Val Leu Ala Thr Asp His Val Leu Gln Arg Gly Ser Gly Glu

275 280 285

Gly Trp Ser Arg Asp Gly Asp Val

290 295

<210> 7

<211> 240

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Met Gly Lys Thr Gln Pro Leu Pro Ile Leu Ile Thr Gly Gly Gly Arg

1 5 10 15

Arg Ile Gly Leu Ala Leu Ala Trp His Phe Ile Asn Gln Lys Gln Pro

20 25 30

Val Ile Val Ser Tyr Arg Thr His Tyr Pro Ala Ile Asp Gly Leu Ile

35 40 45

Asn Ala Gly Ala Gln Cys Ile Gln Ala Asp Phe Ser Thr Asn Asp Gly

50 55 60

Val Met Ala Phe Ala Asp Glu Val Leu Lys Ser Thr His Gly Leu Arg

65 70 75 80

Ala Ile Leu His Asn Ala Ser Ala Trp Met Ala Glu Lys Pro Gly Ala

85 90 95

Pro Leu Ala Asp Val Leu Ala Cys Met Met Gln Ile His Val Asn Thr

100 105 110

Pro Tyr Leu Leu Asn His Ala Leu Glu Arg Leu Leu Arg Gly His Gly

115 120 125

His Ala Ala Ser Asp Ile Ile His Phe Thr Asp Tyr Val Val Glu Arg

130 135 140

Gly Ser Asp Lys His Ile Ala Tyr Ala Ala Ser Lys Ala Ala Leu Asp

145 150 155 160

Asn Met Thr Arg Ser Phe Ala Arg Lys Leu Ala Pro Glu Val Lys Val

165 170 175

Asn Ser Ile Ala Pro Ser Leu Ile Leu Phe Asn Glu His Asp Asp Ala

180 185 190

Glu Tyr Arg Gln Gln Ala Leu Asn Lys Ser Leu Met Lys Thr Ala Pro

195 200 205

Gly Glu Lys Glu Val Ile Asp Leu Val Asp Tyr Leu Leu Thr Ser Cys

210 215 220

Phe Val Thr Gly Arg Ser Phe Pro Leu Asp Gly Gly Arg His Leu Arg

225 230 235 240

<210> 8

<211> 118

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 8

Met Thr Ala Leu Thr Gln Ala His Cys Glu Ala Cys Arg Ala Asp Ala

1 5 10 15

Pro His Val Ser Asp Glu Glu Leu Pro Val Leu Leu Arg Gln Ile Pro

20 25 30

Asp Trp Asn Ile Glu Val Arg Asp Gly Ile Met Gln Leu Glu Lys Val

35 40 45

Tyr Leu Phe Lys Asn Phe Lys His Ala Leu Ala Phe Thr Asn Ala Val

50 55 60

Gly Glu Ile Ser Glu Ala Glu Gly His His Pro Gly Leu Leu Thr Glu

65 70 75 80

Trp Gly Lys Val Thr Val Thr Trp Trp Ser His Ser Ile Lys Gly Leu

85 90 95

His Arg Asn Asp Phe Ile Met Ala Ala Arg Thr Asp Glu Val Ala Lys

100 105 110

Thr Ala Glu Gly Arg Lys

115

<210> 9

<211> 492

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 9

Met Arg Arg Arg Lys Pro Ala Asp Ala Lys Pro Pro His Met Asp His

1 5 10 15

Asp Thr Phe Arg Ser Leu Gly His Gln Ala Ile Asp Trp Ile Ala Asp

20 25 30

Tyr Trp Gln Arg Leu Ala Glu Arg Pro Val Ala Pro Pro Val Glu Pro

35 40 45

Gly Ser Ile Arg Ala Gln Leu Pro Thr Ala Pro Pro Glu Cys Gly Glu

50 55 60

Asp Phe Pro Val Leu Leu Ser Asp Leu Glu Arg Ile Val Leu Pro Gly

65 70 75 80

Leu Leu His Trp Gln His Pro Arg Phe Phe Gly Tyr Phe Pro Ala Asn

85 90 95

Ala Ser Gly Pro Ala Val Leu Ala Glu Leu Leu Ser Ala Gly Leu Gly

100 105 110

Ile Gln Gly Met Asn Trp Asn Thr Ser Pro Ala Cys Thr Glu Ile Glu

115 120 125

Gln Gln Met Leu Asp Trp Phe Val His Leu Leu Gly Leu Pro Glu His

130 135 140

Leu Arg Gly Gly Gly Val Ile Gln Asp Thr Ala Ser Ser Ala Leu Leu

145 150 155 160

Val Ala Leu Leu Thr Ala Leu His Gln Ala Ser Ala Gly Arg Thr Arg

165 170 175

Asp His Gly Thr Gly Glu Cys Gly Tyr Arg Val Tyr Leu Thr Ala Glu

180 185 190

Thr His Ser Ala Ala Arg Lys Ala Ala Val Ile Thr Gly Leu Gly Leu

195 200 205

Arg Ala Met Cys Glu Val Ala Thr Asp Ala Asp Gly Ala Met Asp Ala

210 215 220

Val Asp Leu Glu Arg His Leu Arg Ala Asp Arg Ala Ala Gly Leu Thr

225 230 235 240

Pro Leu Met Val Val Ala Thr Arg Gly Thr Thr Ser His Leu Ser Phe

245 250 255

Asp Pro Leu Glu Asp Ile Gly Pro Val Cys Arg Arg His Gly Val Trp

260 265 270

Leu His Val Asp Ala Ala Tyr Ala Gly Val Ala Ala Val Cys Asp Glu

275 280 285

Leu Arg Trp Val Asn Asp Gly Val Arg Tyr Ala Asp Ser Tyr Cys Thr

290 295 300

Asn Pro His Lys Trp Leu Leu Thr Asn Phe Asp Cys Asp Leu Leu Trp

305 310 315 320

Val Ala His Pro Glu Val Leu Val Ser Ala Leu Ser Val Leu Pro Glu

325 330 335

Tyr Leu Arg Asn Ser Ala Ser Glu Ser Gly Arg Val Thr Asp Tyr Arg

340 345 350

His Trp Gln Val Pro Leu Gly Arg Arg Phe Arg Ala Leu Lys Leu Trp

355 360 365

Ser Val Leu His Trp Tyr Gly Ala Glu Gly Leu Arg Ala His Ile Arg

370 375 380

Thr Gly Val Arg His Ala Gln Leu Phe Ala Asp Leu Val Gly Ala Asp

385 390 395 400

Asp Arg Phe Thr Leu Val Thr Pro Pro Ala Leu Gly Leu Val Thr Phe

405 410 415

Arg Gln Thr Gly Thr Asp Glu Glu Asn Arg Asn Leu Leu Gln Ala Ile

420 425 430

Asn Thr Glu Gly Thr Thr Phe Leu Thr His Ser Glu Lys Asn Gly Thr

435 440 445

Phe Phe Leu Arg Phe Ala Ala Gly Gly Thr Leu Thr Glu Asp His His

450 455 460

Val Arg Glu Ala Trp Arg Ala Val Gln Asn Ala Ile Pro Arg Ala Gln

465 470 475 480

His Leu Ala Gly Gly Ser Ala Asp Ala Leu Pro Glu

485 490

<210> 10

<211> 182

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 10

Met Asn Thr Phe Arg Thr Ala Thr Ala Arg Asp Leu Pro Asp Val Ala

1 5 10 15

Ala Thr Leu Thr Glu Ala Phe Ala Ala Asp Pro Pro Thr Gln Trp Val

20 25 30

Phe Pro Asp Gly Ala Ala Ala Val Ser Arg Phe Phe Phe Gly Val Ala

35 40 45

Asp Arg Ala Arg Glu Ala Gly Gly Ile Val Glu Leu Leu Pro Gly Thr

50 55 60

Ala Ala Met Ile Ala Leu Pro Pro His Val Arg Leu Pro Asp Ala Pro

65 70 75 80

Ala Cys Gly Arg Gln Ala Glu Met Gln Arg Arg Leu Gly Glu Arg Arg

85 90 95

Pro Arg Thr Pro His Tyr Tyr Leu Leu Phe Tyr Gly Val Arg Thr Ala

100 105 110

His Gln Ser Ser Gly Leu Gly Gly Arg Met Leu Ser Asp Leu Ile Ser

115 120 125

Leu Ala Asp Arg Asp Arg Val Gly Thr Tyr Thr Glu Ala Ser Thr Trp

130 135 140

Arg Gly Ala Arg Leu Met Leu Arg His Gly Phe His Thr Ala Gln Pro

145 150 155 160

Leu Arg Leu Pro His Gly Pro Pro Met Phe Pro Leu Trp Arg Asp Pro

165 170 175

Ile His Asp His Cys Asp

180

<210> 11

<211> 368

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 11

Met Gly Ser Thr Ala Ala Asp Met Ala Ala Ala Ala Asp Glu Glu Ala

1 5 10 15

Cys Met Tyr Ala Leu Gln Leu Ala Ser Ser Ser Ile Leu Pro Met Thr

20 25 30

Leu Lys Asn Ala Ile Glu Leu Gly Leu Leu Glu Thr Leu Gln Ser Ala

35 40 45

Ala Val Ala Gly Gly Gly Gly Lys Ala Ala Leu Leu Thr Pro Ala Glu

50 55 60

Val Ala Asp Lys Leu Pro Ser Lys Ala Asn Pro Ala Ala Ala Asp Met

65 70 75 80

Val Asp Arg Met Leu Arg Leu Leu Ala Ser Tyr Asn Val Val Arg Cys

85 90 95

Glu Met Glu Glu Gly Ala Asp Gly Lys Leu Ser Arg Arg Tyr Ala Ala

100 105 110

Ala Pro Val Cys Lys Trp Leu Thr Pro Asn Glu Asp Gly Val Ser Met

115 120 125

Ala Ala Leu Ala Leu Met Asn Gln Asp Lys Val Leu Met Glu Ser Trp

130 135 140

Tyr Tyr Leu Lys Asp Ala Val Leu Asp Gly Gly Ile Pro Phe Asn Lys

145 150 155 160

Ala Tyr Gly Met Thr Ala Phe Glu Tyr His Gly Thr Asp Ala Arg Phe

165 170 175

Asn Arg Val Phe Asn Glu Gly Met Lys Asn His Ala Val Ile Ile Thr

180 185 190

Lys Lys Leu Leu Asp Leu Tyr Thr Gly Phe Asp Ala Ala Ser Thr Val

195 200 205

Val Asp Val Ala Gly Gly Val Gly Ala Thr Val Ala Ala Val Val Ser

210 215 220

Arg His Pro His Ile Arg Gly Ile Asn Tyr Asp Leu Pro His Val Ile

225 230 235 240

Ser Glu Ala Pro Pro Phe Pro Gly Val Glu His Val Gly Gly Asp Met

245 250 255

Phe Ala Ser Val Pro Arg Gly Gly Asp Ala Ile Leu Met Lys Trp Ile

260 265 270

Leu His Asp Trp Ser Asp Glu His Cys Ala Arg Leu Leu Lys Asn Cys

275 280 285

Tyr Asp Ala Leu Pro Glu His Gly Lys Val Val Val Val Glu Cys Val

290 295 300

Leu Pro Glu Ser Ser Asp Ala Thr Ala Arg Glu Gln Gly Val Phe His

305 310 315 320

Val Asp Met Ile Met Leu Ala His Asn Pro Gly Gly Lys Glu Arg Tyr

325 330 335

Glu Arg Glu Phe Arg Glu Leu Ala Arg Ala Ala Gly Phe Thr Gly Phe

340 345 350

Lys Ala Thr Tyr Ile Tyr Ala Asn Ala Trp Ala Ile Glu Phe Thr Lys

355 360 365

Claims

1.一种重组大肠杆菌，其特征在于：所述重组大肠杆菌与受体大肠杆菌相比，所述重组大肠杆菌中褪黑素生物合成相关蛋白的基因的表达量增加和/或所述褪黑素生物合成相关蛋白的含量增加和/或所述褪黑素生物合成相关蛋白的活性增加；

所述褪黑素生物合成相关蛋白选自如下至少一种：

P1)苯丙氨酸羟化酶；

P2)二氢单磷酸还原酶；

P3)4a-羟基四氢生物蝶呤脱水酶；

P4)天冬氨酸转氨酶家族蛋白；

P5)N-乙酰转移酶；

P6)咖啡酸-O-甲基转移酶。

2.一种重组大肠杆菌的构建方法，其特征在于：所述构建方法包括如下步骤：将褪黑素生物合成相关蛋白的基因导入受体大肠杆菌，得到重组大肠杆菌；

所述褪黑素生物合成相关蛋白的基因选自如下至少一种：

P1)苯丙氨酸羟化酶基因；

P2)二氢单磷酸还原酶基因；

P3)4a-羟基四氢生物蝶呤脱水酶基因；

P4)天冬氨酸转氨酶家族蛋白基因；

P5)N-乙酰转移酶基因；

P6)咖啡酸-O-甲基转移酶基因。

3.根据权利要求2所述的构建方法，其特征在于：所述褪黑素生物合成相关蛋白的基因导入受体大肠杆菌是对所述受体大肠杆菌基因组进行下述M1)-M6)全部、任五种、任四种、任三种、任两种或任一种的改造得到的：

M1)过表达苯丙氨酸羟化酶基因；

M2)过表达二氢单磷酸还原酶基因；

M3)过表达4a-羟基四氢生物蝶呤脱水酶基因；

M4)过表达天冬氨酸转氨酶家族蛋白基因；

M5)过表达N-乙酰转移酶基因；

M6)过表达咖啡酸-O-甲基转移酶基因。

4.根据权利要求2或3所述的构建方法，其特征在于：所述褪黑素生物合成相关蛋白的基因通过方式甲或方式乙或方式丙导入所述受体大肠杆菌中；

所述方式甲为所述苯丙氨酸羟化酶基因和咖啡酸-O-甲基转移酶基因构建在一个表达载体上，所述天冬氨酸转氨酶家族蛋白基因、N-乙酰转移酶基因、4a-羟基四氢生物蝶呤脱水酶基因和二氢单磷酸还原酶基因构建在另一个表达载体上，所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白基因、N-乙酰转移酶基因、4a-羟基四氢生物蝶呤脱水酶基因和二氢单磷酸还原酶基因依次连接，然后均导入到受体大肠杆菌中；

所述方式乙为所述苯丙氨酸羟化酶基因、4a-羟基四氢生物蝶呤脱水酶基因和二氢单磷酸还原酶基因构建在一个表达载体上，所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶基因、4a-羟基四氢生物蝶呤脱水酶基因和二氢单磷酸还原酶基因依次连接；所述天冬氨酸转氨酶家族蛋白基因和N-乙酰转移酶基因构建在同一个表达载体上，然后均导入到受体大肠杆菌中；

所述方式丙为所述苯丙氨酸羟化酶基因、4a-羟基四氢生物蝶呤脱水酶基因、二氢单磷酸还原酶基因、天冬氨酸转氨酶家族蛋白基因、N-乙酰转移酶基因和咖啡酸-O-甲基转移酶基因构建在一个表达载体上，所述表达载体中六个基因的位置关系为苯丙氨酸羟化酶基因、4a-羟基四氢生物蝶呤脱水酶基因、二氢单磷酸还原酶基因、天冬氨酸转氨酶家族蛋白基因、N-乙酰转移酶基因和咖啡酸-O-甲基转移酶基因依次连接，然后导入到受体大肠杆菌中。

5.根据权利要求所述的重组大肠杆菌，或权利要求2-4任一所述的构建方法，其特征在于：所述苯丙氨酸羟化酶来自野油菜黄单胞菌，二氢单磷酸还原酶来自大肠杆菌，4a-羟基四氢生物蝶呤脱水酶来自铜绿假单胞菌，N-乙酰转移酶和天冬氨酸转氨酶家族蛋白来自小白链霉菌，所述咖啡酸-O-甲基转移酶来自水稻。

6.根据权利要求1所述的重组大肠杆菌，或权利要求2-4所述的构建方法，其特征在于：所述苯丙氨酸羟化酶为如下A1)或A2)所示的蛋白质：

A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质；

所述二氢单磷酸还原酶为如下A3)或A4)所示的蛋白质：

A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质；

所述4a-羟基四氢生物蝶呤脱水酶为如下A5)或A6)所示的蛋白质：

A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质；

所述天冬氨酸转氨酶家族蛋白为如下A7)或A8)所示的蛋白质：

A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质；

所述N-乙酰转移酶为如下A9)或A10)所示的蛋白质：

A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质；

所述咖啡酸-O-甲基转移酶为如下A11)或A12)所示的蛋白质：

A11)SEQ ID NO.1第4429-5535位所示的DNA分子编码的蛋白质；

7.根据权利要求1所述的重组大肠杆菌，或权利要求2-4所述的构建方法，其特征在于：

所述苯丙氨酸羟化酶基因为如下B1)或B2)所示：

B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子；

所述二氢单磷酸还原酶基因为如下B3)或B4)所示：

B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子；

所述4a-羟基四氢生物蝶呤脱水酶基因为如下B5)或B6)所示：

B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子；

所述天冬氨酸转氨酶家族蛋白基因为如下B7)或B8)所示：

B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子；

所述N-乙酰转移酶为如下B9)或B10)所示：

B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子；

所述咖啡酸-O-甲基转移酶基因为如下B11)或B12)所示：

B11)编码序列为SEQ ID NO.1第4429-5535位所示的DNA分子；

8.由权利要求2-7任一所述的构建方法构建得到的重组大肠杆菌。

9.权利要求1或8所述的重组大肠杆菌在制备褪黑素中的应用。

10.制备褪黑素的方法，其特征在于：包括利用权利要求1或8所述的重组大肠杆菌催化色氨酸和甲硫氨酸反应得到褪黑素。