CN111304141B

CN111304141B - 产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用

Info

Publication number: CN111304141B
Application number: CN202010185474.3A
Authority: CN
Inventors: 董志扬; 张岩峰; 张山; 何永志; 张楠
Original assignee: Institute of Microbiology of CAS
Current assignee: Institute of Microbiology of CAS
Priority date: 2020-03-17
Filing date: 2020-03-17
Publication date: 2022-05-17
Anticipated expiration: 2040-03-17
Also published as: CN111304141A

Abstract

本发明公开了产N‑乙酰‑5‑羟色胺的重组大肠杆菌及其构建方法和应用。本发明首先公开了重组大肠杆菌，与受体大肠杆菌相比，其色氨酸衍生物合成相关蛋白的基因的表达量增加和/或所述色氨酸衍生物合成相关蛋白的含量增加和/或所述色氨酸衍生物合成相关蛋白的活性增加；所述色氨酸衍生物合成相关蛋白选自如下至少一种：苯丙氨酸羟化酶、二氢单磷酸还原酶、4a‑羟基四氢生物蝶呤脱水酶、天冬氨酸转氨酶家族蛋白和N‑乙酰转移酶。进一步公开了重组大肠杆菌的构建方法及应用。本发明产N‑乙酰‑5‑羟色胺的重组大肠杆菌N‑乙酰‑5‑羟色胺合成效率显著高于其它现有菌株，对N‑乙酰‑5‑羟色胺的工业化生产和大规模应用具有重大意义。

Description

产N-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用

技术领域

本发明涉及基因工程领域，具体涉及一种产N-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用。

背景技术

N-乙酰-5-羟色胺(N-Acetyl-serotonin,C₁₂H₁₄N₂O₂)属于色氨酸的衍生物，是褪黑素合成的前体，其合成途径广泛存在于自然界生物中，细胞内经典的合成途径为：色氨酸—5-羟色氨酸—5-羟色胺—N-乙酰-5-羟色胺。N-乙酰-5-羟色胺在生物体内发挥着许多重要作用，作为褪黑素前体，N-乙酰-5-羟色胺也具有良好的抗氧化能力，如可以有效地防护紫外光可能引起的光致癌及DNA损伤，同时N-乙酰-5-羟色胺对脑损伤/中风/神经损伤恢复中发挥重要作用，具有神经保护剂的功能。

目前为止，N-乙酰-5-羟色胺生产是由化学合成完成的，其合成步骤繁琐、得率较低、手性不唯一，不可避免地产生原料浪费和化学污染。随着合成生物学的发展，越来越多的化合物实现了生物绿色生产，通过推测化合物在原宿主中的可能合成路线，鉴定出涉及的基因，解析出目标化合物的合成途径，在生产菌株中通过分子生物学技术引入相关基因重现合成途径，从廉价的原料如葡萄糖催化出高附加值的目标产物。虽然，色氨酸衍生物的合成途径解析的非常清楚，但其中涉及的蛋白本身比活较低，多数难以在现有的成熟表达系统中表达，基本形成包涵体或表达量极低，因此,目前为止还有没有高产N-乙酰-5-羟色胺的工程菌株。

发明内容

本发明所要解决的技术问题为提供N-乙酰-5-羟色胺高产菌株，以实现发酵法高效大规模工业化生产N-乙酰-5-羟色胺。

为解决上述技术问题，本发明首先提供了一种重组大肠杆菌。

本发明所述重组大肠杆菌与受体大肠杆菌相比，所述重组大肠杆菌中色氨酸衍生物合成相关蛋白的基因的表达量增加和/或所述色氨酸衍生物合成相关蛋白的含量增加和/或所述色氨酸衍生物合成相关蛋白的活性增加；

所述色氨酸衍生物合成相关蛋白选自如下至少一种：

P1)苯丙氨酸羟化酶；

P2)二氢单磷酸还原酶(folM)；

P3)4a-羟基四氢生物蝶呤脱水酶(phhB)；

P4)天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein)；

P5)N-乙酰转移酶(N-acetyltransferase)。

上述重组大肠杆菌中，所述苯丙氨酸羟化酶(记为X)来自野油菜黄单胞菌(Xanthomonas campestris pv.campestris str.ATCC 33913)、二氢单磷酸还原酶(folM，记为M)来自大肠杆菌(Escherichia coli str.K-12substr.MG1655)、4a-羟基四氢生物蝶呤脱水酶(phhB，记为P)来自铜绿假单胞菌(Pseudomonas aeruginosa PAO1)、天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein，NCBI ReferenceSequence:WP_103377132.1，记为H)和N-乙酰转移酶(N-acetyltransferase，NCBIReference Sequenc WP_020929557.1，记为F)来自小白链霉菌(Streptomyces albulus)。

上述重组大肠杆菌中，所述受体大肠杆菌可为大肠杆菌K12；具体为大肠杆菌K12菌株BW25113。

在本发明具体的实施方式中，所述苯丙氨酸羟化酶可为如下A1)或A2)所示的蛋白质：

A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质；

A2)将A1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述二氢单磷酸还原酶可为如下A3)或A4)所示的蛋白质：

A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质；

A4)将A3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A3)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述4a-羟基四氢生物蝶呤脱水酶可为如下A5)或A6)所示的蛋白质：

A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质；

A6)将A5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A5)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述天冬氨酸转氨酶家族蛋白可为如下A7)或A8)所示的蛋白质：

A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质；

A8)将A7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A7)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质；

所述N-乙酰转移酶可为如下A9)或A10)所示的蛋白质：

A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质；

A10)将A9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A9)所示的蛋白质具有90％以上的同一性且功能相同的蛋白质。

其中，SEQ ID No.1第319-1209位由891个核苷酸组成，第319-1209位为编码序列，编码SEQ ID No.6所示的苯丙氨酸羟化酶。

SEQ ID No.1第1615-2337位由723个核苷酸组成，第1615-2337位为编码序列，编码SEQ ID No.7所示的二氢单磷酸还原酶。

SEQ ID No.1第1234-1590位由357个核苷酸组成，第1234-1590位为编码序列，编码SEQ ID No.8所示的4a-羟基四氢生物蝶呤脱水酶。

SEQ ID No.1第2362-3831位由1470个核苷酸组成，第2362-3831位为编码序列，编码SEQ ID No.9所示的天冬氨酸转氨酶家族蛋白。

SEQ ID No.1第3856-4404位由549个核苷酸组成，第3856-4404位为编码序列，编码SEQ ID No.10所示的N-乙酰转移酶。

上述重组大肠杆菌中，同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62作为Matrix，将Gap existence cost，Per residue gap cost和Lambda ratio分别设置为11，1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。

上述重组大肠杆菌中，所述90％以上的同一性可为至少91％、92％、95％、96％、98％、99％或100％的同一性。

上述重组大肠杆菌中，所述苯丙氨酸羟化酶的基因可为如下B1)或B2)所示：

B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子；

B2)将SEQ ID No.1第319-1209位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第319-1209位所示的DNA分子具有相同功能的DNA分子；

所述二氢单磷酸还原酶的基因可为如下B3)或B4)所示：

B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子；

B4)将SEQ ID No.1第1615-2337位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1615-2337位所示的DNA分子具有相同功能的DNA分子；

所述4a-羟基四氢生物蝶呤脱水酶的基因可为如下B5)或B6)所示：

B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子；

B6)将SEQ ID No.1第1234-1590位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1234-1590位所示的DNA分子具有相同功能的DNA分子；

所述天冬氨酸转氨酶家族蛋白的基因可为如下B7)或B8)所示：

B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子；

B8)将SEQ ID No.1第2362-3831位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第2362-3831位所示的DNA分子具有相同功能的DNA分子；

所述N-乙酰转移酶的基因可为如下B9)或B10)所示：

B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子；

B10)将SEQ ID No.1第3856-4404位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第3856-4404位所示的DNA分子具有相同功能的DNA分子。

本发明进一步提供了重组大肠杆菌的构建方法。

本发明重组大肠杆菌的构建方法，包括如下步骤：将色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌，得到重组大肠杆菌；

所述色氨酸衍生物合成相关蛋白的基因选自如下至少一种：

P1)苯丙氨酸羟化酶基因；

P2)二氢单磷酸还原酶(folM)基因；

P3)4a-羟基四氢生物蝶呤脱水酶(phhB)基因；

P4)天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein)基因；

P5)N-乙酰转移酶(N-acetyltransferase)基因。

上述重组大肠杆菌中，所述苯丙氨酸羟化酶(记为X)来自野油菜黄单胞菌(Xanthomonascampestris pv.campestris str.ATCC 33913)、二氢单磷酸还原酶(folM，记为M)来自大肠杆菌(Escherichia coli str.K-12substr.MG1655)、4a-羟基四氢生物蝶呤脱水酶(phhB，记为P)来自铜绿假单胞菌(Pseudomonas aeruginosa PAO1)、天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein，NCBI Reference Sequence:WP_103377132.1，记为H)和N-乙酰转移酶(N-acetyltransferase，NCBI ReferenceSequenc WP_020929557.1，记为F)来自小白链霉菌(Streptomyces albulus)。

上述构建方法中，所述色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌是对所述受体大肠杆菌基因组进行下述M1)-M5)全部、任四种、任三种、任两种或任一种的改造得到的：

M1)过表达苯丙氨酸羟化酶基因；

M2)过表达二氢单磷酸还原酶(folM)基因；

M3)过表达4a-羟基四氢生物蝶呤脱水酶(phhB)基因；

M4)过表达天冬氨酸转氨酶家族蛋白(aspartate aminotransferase familyprotein)基因；

M5)过表达N-乙酰转移酶(N-acetyltransferase)基因。

在本发明具体的实施方式中，所述色氨酸衍生物合成相关蛋白的基因通过方式甲或方式乙或方式丙导入所述受体大肠杆菌中；

所述方式甲为所述苯丙氨酸羟化酶(记为X)的基因构建在一个表达载体上，所述天冬氨酸转氨酶家族蛋白(记为H)、N-乙酰转移酶(记为F)、4a-羟基四氢生物蝶呤脱水酶(记为P)和二氢单磷酸还原酶(记为M)的基因构建在另一个表达载体上，所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白(记为H)、N-乙酰转移酶(记为F)、4a-羟基四氢生物蝶呤脱水酶(记为P)和二氢单磷酸还原酶(记为M)的基因依次连接(即天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶基因的上游、N-乙酰转移酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游)，然后均导入到受体大肠杆菌中；

所述方式乙为所述苯丙氨酸羟化酶(记为X)、4a-羟基四氢生物蝶呤脱水酶(记为P)和二氢单磷酸还原酶(记为M)的基因构建在一个表达载体上，所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为M)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶基因位于二氢单磷酸还原酶基因的上游)；所述天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)构建在同一个表达载体上，然后均导入到受体大肠杆菌中；

所述方式丙为所述苯丙氨酸羟化酶(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为M)、天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)构建在一个表达载体上，所述表达载体中苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为M)、天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游，4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游，二氢单磷酸还原酶基因位于天冬氨酸转氨酶家族蛋白基因的上游，天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶的上游)，然后导入到受体大肠杆菌中。

在本发明具体的实施方式中，所述方式甲为利用无缝拼接方法将苯丙氨酸羟化酶的基因(记为X)构建到载体pBAD中得到重组载体pBAD-X(SEQ ID NO.4所示)，利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为M)的连接顺序构建到载体pZH中得到重组载体pZH-HFPM(SEQ ID NO.5所示)，然后将pBAD-X和pZH-HFPM导入到受体大肠杆菌中；

所述方式乙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为M)的连接顺序构建到载体pBAD中得到重组载体pBAD-XPM(SEQ ID NO.2所示)，利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)的基因的连接顺序构建到载体pZH中得到重组载体pZH-HF(SEQ ID NO.3所示)，然后将重组载体pBAD-XPM和pZH-HF导入到受体大肠杆菌中；

所述方式丙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为M)、天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)的连接顺序构建重组载体pBAD-XPMHF(SEQ IDNO.1所示)，然后将重组载体pBAD-XPMHF导入到受体大肠杆菌中。

上述构建方法中，所述受体大肠杆菌可为大肠杆菌K12；具体为大肠杆菌K12菌株BW25113。

上述构建方法中，所述苯丙氨酸羟化酶可为如下A1)或A2)所示的蛋白质：

A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质；

所述二氢单磷酸还原酶可为如下A3)或A4)所示的蛋白质：

A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质；

A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质；

A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质；

所述N-乙酰转移酶可为如下A9)或A10)所示的蛋白质：

A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质；

上述方法中，同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62作为Matrix，将Gap existence cost，Per residue gap cost和Lambda ratio分别设置为11，1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。

上述方法中，所述90％以上的同一性可为至少91％、92％、95％、96％、98％、99％或100％的同一性。

上述方法中，所述苯丙氨酸羟化酶的基因可为如下B1)或B2)所示：

B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子；

所述二氢单磷酸还原酶的基因可为如下B3)或B4)所示：

B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子；

B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子；

所述天冬氨酸转氨酶家族蛋白的基因可为如下B7)或B8)所示：

B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子；

所述N-乙酰转移酶的基因可为如下B9)或B10)所示：

B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子；

上述构建方法得到的重组大肠杆菌及其在制备N-乙酰-5-羟色胺的应用也在本发明的保护范围之内。

本发明进一步公开了一种制备N-乙酰-5-羟色胺的方法。

本发明制备N-乙酰-5-羟色胺的方法，包括：利用上述重组大肠杆菌催化色氨酸反应得到N-乙酰-5-羟色胺。

具体的，所述重组大肠杆菌经阿拉伯糖诱导培养后催化色氨酸反应得到N-乙酰-5-羟色胺。

上述方法中，所述阿拉伯糖为L-阿拉伯糖。

本发明通过在大肠杆菌中过表达色氨酸衍生物合成相关蛋白的基因，构建了能高效合成N-乙酰-5-羟色胺的重组大肠杆菌，开发了一套高效合成N-乙酰-5-羟色胺的方法。本发明的产N-乙酰-5-羟色胺的重组大肠杆菌菌株，单位菌体的N-乙酰-5-羟色胺合成效率显著高于其它现有菌株，且绝大部分产物分泌至胞外，便于产物的下游纯化分离。因此本发明对N-乙酰-5-羟色胺的工业化生产和大规模应用具有重大意义。

附图说明

图1为SDS-PAGE分析色氨酸衍生物合成相关蛋白的基因在大肠杆菌中的表达。

图2为三株重组大肠杆菌摇瓶试验中N-乙酰-5-羟色胺合成水平的分析。

图3为两株重组大肠杆菌发酵罐试验中N-乙酰-5-羟色胺合成水平的分析。

具体实施方式

以下的实施例便于更好地理解本发明，但并不限定本发明。下述实施例中所使用的实验方法如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

下述实施例中用到的材料来源如下：

pBAD/HisA购自invitrogen，产品目录号为V430-01；

pZH是在pBAD/HisA基础上改变复制起始位点和抗性为氯霉素得到。

实施例1、N-乙酰-5-羟色胺高产的重组大肠杆菌菌株的构建

1、PCR扩增色氨酸衍生物合成相关蛋白的编码序列

以合成的来源于野油菜黄单胞菌的苯丙氨酸羟化酶基因(SEQ ID NO.1第319-1209位所示)为模板，用引物F1和R1进行PCR扩增，得到包含苯丙氨酸羟化酶基因的PCR扩增产物X(SEQ ID NO.1第299-1232位所示)。

以合成的来源于铜绿假单胞菌的4a-羟基四氢生物蝶呤脱水酶基因phhB(SEQ IDNO.1第1234-1590位所示)为模板用引物F3和R3进行PCR扩增，得到包含4a-羟基四氢生物蝶呤脱水酶基因phhB的PCR扩增产物P(SEQ ID NO.1第1210-1614位所示)。

以合成的来源于大肠杆菌的二氢单磷酸还原酶(folM)基因(SEQ ID NO.1第1615-2337位所示)为模板，用引物F2和R2进行PCR扩增，得到包含二氢单磷酸还原酶(folM)基因的PCR扩增产物M(SEQ ID NO.1第1592-2337位所示)。

以合成的来源于小白链霉菌的天冬氨酸转氨酶家族蛋白(aspartateaminotransferase family protein)基因(SEQ ID NO.1第2362-3831位所示)为模板用引物F4和R4进行PCR扩增，得到包含天冬氨酸转氨酶家族蛋白(aspartate aminotransferasefamily protein)的PCR扩增产物H(SEQ ID NO.1第2362-3831位所示)。

以合成的来源于小白链霉菌的N-乙酰转移酶(N-acetyltransferase)基因(SEQID NO.1第3856-4404位所示)为模板用引物F5和R5进行PCR扩增，得到包含N-乙酰转移酶(N-acetyltransferase)基因的PCR扩增产物F(SEQ ID NO.1第3814-4404位所示)。

具体引物序列如下：

F1：gctaacaggaggaattaaccATGAACACAGCGCCGCGCCGC

R1：TATATCTCCTTCTTAAAGTTAAATTACACGTCGCCGTCGCGGCTC

F2：TTAACTTTAAGAAGGAGATATACatgggtaaaacccagccctt

R2：ttaacgcagatgacgaccgc

F3：TTTAAGAAGGAGATATACatgaccgcactcacccaagc

R3：GTATATCTCCTTCTTAAAGTTAAATTatttgcgcccctcggcgg

F4：Atgaagcccgctgacgcg

R4：ctactcgggcagcgcatcagc

F5：gatgcgctgcccgagtagTTTAACTTTAAGAAGGAGATATAcatgaacaccttccggacc

R5：tcagtcgcagtggtcatggatcg

2、无缝拼接

以pBAD/HisA为载体，利用无缝拼接方法按照X、P、M、H、F的连接顺序构建重组载体pBAD-XPMHF(SEQ ID NO.1所示)，并命名为NAS-1；

以pBAD为载体，利用无缝拼接方法按照X、P、M的连接顺序构建重组载体pBAD-XPM(SEQ ID NO.2所示)，以pZH为载体，利用无缝拼接方法按照H、F的连接顺序构建重组载体pZH-HF(SEQ ID NO.3所示)，并将pBAD-XPM和pZH-HF命名为NAS-2；

以pBAD为载体，利用无缝拼接方法构建载体pBAD-X(SEQ ID NO.4所示)，以pZH为载体，利用无缝拼接方法按照H、F、P、M的连接顺序构建重组载体pZH-HFPM(SEQ ID NO.5所示)，并将pBAD-X和pZH-HFPM命名为NAS-3。

3、转化、筛选以及序列验证

用氯化钙化学转化法将重组载体pBAD-XPMHF、pBAD-XPM、pZH-HF、pBAD-X、pZH-HFPM分别转化至大肠杆菌DH5α，用含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基进行筛选培养，挑取单菌落，并进行扩大培养，获得重组菌并提取质粒，进行测序验证，结果获得的序列如SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4和SEQ ID NO.5所示，证明构建的重组质粒及重组菌正确。将阳性克隆的重组菌记作DH5α-pBAD-XPMHF，DH5α-pBAD-XPM，DH5α-pZH-HF，DH5α-pBAD-X，DH5α-pZH-HFPM，阳性质粒记作pBAD-XPMHF，pBAD-XPM，pZH-HF，pBAD-X，pZH-HFPM。

4、重组表达菌株的构建

用氯化钙化学转化法将重组质粒pBAD-XPMHF、pBAD-XPM和pZH-HF、pBAD-XC和pZH-HFPM分别转化至大肠杆菌K-12系列表达菌株BW25113(购买自北京江晨文轩生物科技有限责任公司，货号：G6058，rrnB3ΔlacZ4787 hsdR514Δ(araBAD)567Δ(rhaBAD)568rph-1)，用含有氨苄青霉素(100μg/ml)和或含氯霉素(34ug/ml)的LB培养基进行筛选培养，挑取单菌落，获得重组大肠杆菌菌株BW-pBAD-XPMHF(命名为BW-pBAD-NAS1)、BW-pBAD-XPM/pZH-HF(命名为BW-pBAD-NAS2)、BW-pBAD-X/pZH-HFPM(命名为BW-pBAD-NAS3)。

5、蛋白表达

以BW-pBAD-NAS3为例：

挑取BW-pBAD-NAS3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中，于37℃过夜培养，得到过夜培养物；将过夜培养物接种于100ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基，37℃剧烈振荡(200rpm)培养，至发酵液的OD₆₀₀值达到0.6-0.8左右，向发酵体系中加入L-阿拉伯糖(终浓度0.1％)，30℃条件下继续培养10-12小时。

发酵完毕后，5000rpm离心15分钟，收集菌体；用pH7.0的PBS缓冲液重悬菌体，超声波破碎后12,000rpm离心15min。收集上清液，即为含有目的蛋白的粗酶液，SDS-PAGE检测蛋白表达情况，结果如图1中A所示，表明BW-pBAD-NAS3中5种蛋白在大肠杆菌生产菌株内得到良好表达。

利用上述方法，分别对BW-pBAD-NAS1和BW-pBAD-NAS2进行实验，SDS-PAGE检测蛋白表达情况，如图1中B所示BW-pBAD-NAS1中N-乙酰转移酶没有表达，图1中C所示BW-pBAD-NAS2中5种蛋白均获得表达，对比BW-pBAD-NAS3其二氢单磷酸还原酶和4a-羟基四氢生物蝶呤脱水酶表达量较高，天冬氨酸转氨酶家族蛋白和N-乙酰转移酶表达量较低。

6、N-乙酰-5-羟色胺的生物转化摇瓶试验

以BW-pBAD-NAS3为例进行摇瓶试验：

挑取BW-pBAD-NAS3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中，于37℃过夜培养，得到过夜培养物；将过夜培养物接种于500ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基，37℃剧烈振荡(200rpm)培养，至发酵液的OD₆₀₀值达到0.6-0.8左右，再向发酵体系中加入L-阿拉伯糖(终浓度0.1％)，30℃条件下继续培养10-12小时。5000rpm离心15分钟，收集菌体。

离心后菌体加入转化液重悬菌体至OD₆₀₀值达到10，取25ml重悬菌液于250ml三角瓶中，30℃振荡(100rpm)反应96小时，分别检测24h、48h、72h和96h的N-乙酰-5-羟色胺的产量。

其中，转化液的成分：10g/L葡萄糖，6g/L Na₂HPO₄，0.5g/L NaCl，3g/L KH₂PO₄，1g/L NH₄Cl，246.5mg/L MgSO₄·7H₂O，14.7mg/L CaCl₂·2H₂O，27.8mg/L FeSO₄·7H₂O，2g/Lyeast extract(酵母提取物)；1％甘油；1g/L tryptophan(色氨酸)。

利用上述方法，分别对BW-pBAD-NAS1和BW-pBAD-NAS2进行实验，分别检测24h、48h、72h和96h的N-乙酰-5-羟色胺的产量。

结果如图2所示，结果显示三株重组大肠杆菌菌株N-乙酰-5-羟色胺的产量具有显著的差异，其中，BW-pBAD-NAS3(即BW-pBAD-X/pZH-HFPM，图中以“菌株3”表示)的产量最高，在72h便将底物1.0g/L色氨酸全部消耗殆尽，产生了519mg/L的N-乙酰5-羟色胺，BW-pBAD-NAS2(即BW-pBAD-XPM/pZH-HF，图中以“菌株2”表示)次之，BW-pBAD-NAS1(即BW-pBAD-XHFPM，图中以“菌株1”表示)产量最低。

7、N-乙酰-5-羟色胺的生物转化发酵罐试验

以摇瓶试验N-乙酰-5-羟色胺产量最高的BW-pBAD-NAS3菌株和较高的BW-pBAD-NAS2做上罐发酵：

以BW-pBAD-NAS3为例进行发酵罐试验：

1)种子液制备：挑取所述重组大肠杆菌BW-pBAD-NAS3单菌落接入20ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中，于37℃、200rpm培养12小时；然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的种子培养基中，37℃、200rpm振荡培养12小时，即得种子液；

其中，所述种子培养基的配制：蛋白胨16g，酵母膏10g，氯化钠5g，用水定容至1L，pH7.0。

2)菌体培养：以10％的接种量将种子液接种到1L含氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的发酵罐的发酵培养基中，发酵采用2.5L的发酵罐，培养过程中控制温度为37℃，通过搅拌速度(500－800转/分钟)和通气量(3L/min)控制菌体培养体系的溶氧在20％以上，通过流加1M磷酸和3M氨水维持pH值稳定在6.8-7.2，培养至葡萄糖消耗完时流加补料培养基，补料培养基的流加速度为50mL/h，流加至菌体密度OD600达到20，菌体培养过程结束，得到菌体培养后的发酵液，进入诱导培养阶段；

其中，每1L发酵培养基的配制：葡萄糖10g，(NH₄)₂HPO₄ 8g，KH₂PO₄ 13.3g，MgSO₄·7H₂O 1.2g，柠檬酸1.7g，微量盐溶液10mL，用水定溶至1L，5M NaOH调至pH7.0；

每1L补料培养基的配制：葡萄糖400g，MgSO₄·7H₂O 10g，微量盐溶液20mL，用水定容至1L；

每1L微量盐溶液的配制：FeSO₄·7H₂O 10g，ZnSO₄·7H₂O 2.25g，CuSO₄·5H₂O 1g，MnSO₄·5H₂O0.5g，Na₂B₄O₇·10H₂O 0.23g，CaCl₂·2H₂O 2g，(NH₄)₆Mo₇O₂₄ 0.1g，用5M盐酸水溶液定容，定容至1L。

3)诱导培养：将上述菌体培养后的发酵液的温度降至30℃，加入L-阿拉伯糖，使得L-阿拉伯糖终浓度为1g/L，进行诱导培养，同时加入色氨酸终浓度为4g/L，甘油终浓度为体积占比5％；诱导培养过程中要一直流加补料培养基，补料培养基的流加速度调至20mL/h；流加至菌体密度OD600达到40，诱导培养过程结束，得到转化液；

所述诱导培养的条件为：培养温度为30℃，控制诱导培养体系的溶氧在20％以上和维持pH至7.0。

4)HPLC检测：上述转化液5000rpm离心15min吸取上清液，按照上清液：水：甲醇体积比1：7.5：1.5制成待检测样品，0.22um有机型滤器过滤除去不溶物后每隔5-8小时HPLC检测N-乙酰-5-羟色胺浓度。HPLC检测仪为Agilent 1260Infinity LC，检测柱为AgilentZOBAX C18柱。N-乙酰-5-羟色胺的紫外检测波长为275nm，流动相15％(V/V)甲醇，流速为1.0mL/min，进样量为10uL，采用外标法按峰面积定量。SIGMA生产N-乙酰-5-羟色胺标准品作为定量标准。

利用上述方法，对BW-pBAD-NAS2进行实验，每隔5-8小时HPLC检测N-乙酰-5-羟色胺浓度。

结果如图3所示，结果显示：结果显示两株重组大肠杆菌菌株发酵罐中N-乙酰-5-羟色胺的浓度具有显著的差异，其中，BW-pBAD-NAS3(即BW-pBAD-X/pZH-HFPM，图中以“菌株3”表示)的产量明显高于BW-pBAD-NAS2(即BW-pBAD-XPM/pZH-HF，图中以“菌株2”表示)，BW-pBAD-NAS3最终发酵64h N-乙酰5-羟色胺的产量达到2.7g/L。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

SEQUENCE LISTING

<110> 中国科学院微生物研究所

<120> 产N-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用

<130> GNCFY200075

<160> 10

<170> PatentIn version 3.5

<210> 1

<211> 8042

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360

aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420

gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480

cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540

ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600

gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660

gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720

catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780

gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840

acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900

atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960

gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020

agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080

ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140

gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200

gacgtgtaat ttaactttaa gaaggagata tacatgaccg cactcaccca agcccattgc 1260

gaagcctgcc gcgcagacgc cccgcacgtc agcgacgaag aactgcccgt gctgctgcgg 1320

caaatcccgg attggaacat cgaagtccgc gacggcatca tgcagctaga gaaggtctac 1380

ctgttcaaga acttcaagca tgccctggcc ttcaccaatg ccgtcggcga gatatccgag 1440

gccgaaggcc accatccggg cctgctgacc gagtggggca aagtcaccgt gacctggtgg 1500

agccactcga tcaagggcct gcaccgcaac gatttcatca tggcggcgcg caccgatgag 1560

gtagcgaaaa ccgccgaggg gcgcaaataa tttaacttta agaaggagat atacatgggt 1620

aaaacccagc ccttgccaat attaattact ggcggaggtc gtcgcatcgg cctcgccctc 1680

gcatggcatt tcattaatca aaagcaaccg gtgattgtca gctatcggac acactatcca 1740

gccattgatg gactgattaa tgcaggtgcg cagtgtattc aggctgattt ttcgaccaac 1800

gacggtgtga tggcgtttgc cgatgaagta ctaaaaagca cccatggtct gcgtgctatt 1860

ttgcataacg ccagtgcgtg gatggcggaa aaaccgggtg cgccactggc cgacgtactg 1920

gcttgcatga tgcagatcca cgttaatacc ccatacctgc tcaaccatgc gctggaaaga 1980

ttactgcgtg ggcacggaca cgccgccagc gatatcattc actttaccga ttatgtggtg 2040

gagcgcggta gcgacaaaca tattgcgtat gctgcaagca aagcggcact ggataatatg 2100

acccgctcgt ttgcccgcaa gctggcaccg gaagtgaaag tgaattctat tgcgccatcg 2160

ctgatcctgt ttaatgaaca tgatgatgcc gaatatcgac aacaggcgct gaataaatca 2220

ctgatgaaaa ccgcgcctgg cgagaaagaa gtgatcgacc tggtcgatta cttacttacc 2280

agttgctttg tcaccggacg cagtttccca cttgatggcg gtcgtcatct gcgttaattt 2340

aactttaaga aggagatata catgaagccc gctgacgcga aaccgcccca catggaccac 2400

gacaccttcc gctccctggg ccatcaggcc atcgactgga tcgccgacta ctggcagcgt 2460

ttggcggagc gacccgtcgc tccccccgtc gaacccggca gcatccgcgc ccagttaccg 2520

acggccccac ccgagtgcgg cgaggacttt cccgtactgc tgtccgacct cgaacggatc 2580

gtgctgccgg gcctgctgca ctggcagcac ccccgtttct tcggttactt ccccgcgaac 2640

gcttccggcc ccgccgtcct ggccgagctg ttgtccgcgg gcctgggcat ccaggggatg 2700

aactggaaca ccagcccggc ctgcaccgag atcgaacagc agatgctgga ctggttcgtg 2760

cacctgctcg gcctacccga gcacctccgc ggtgggggag tcatccagga caccgcctcc 2820

agcgccctcc tggtggcact gctcaccgcc ctgcaccagg ccagtgcggg ccgcacccgc 2880

gaccacggca ccggcgagtg cggctaccgg gtgtacctga ccgccgagac gcactcggcg 2940

gcccgcaagg ccgccgtcat caccggactg ggcctgcggg ccatgtgcga ggtggccacc 3000

gacgccgacg gcgccatgga cgcagtcgat ctggaaagac acctccgggc cgaccgggcc 3060

gcaggtctga ccccgctgat ggtcgtggcc acccgaggca ccacctccca tctctccttc 3120

gaccccctgg aggacatcgg ccccgtgtgt cgtcggcacg gcgtgtggct ccacgtcgac 3180

gccgcatacg ccggagtggc cgcggtctgc gacgaactgc gctgggtcaa cgacggcgtg 3240

cgctacgcgg actcctactg caccaacccg cacaagtggc tgctgaccaa cttcgactgc 3300

gacctgctgt gggtggccca ccccgaagtc ctcgtcagcg ccctgagcgt gctccccgaa 3360

tacctgcgca actcggcctc cgaatcgggc cgggtgaccg actaccggca ctggcaggtc 3420

ccactgggcc ggcgcttccg cgcactgaaa ctgtggtccg tcctccactg gtacggcgcc 3480

gaggggctgc gcgcccacat ccgcaccggc gttcggcatg cccagctctt cgcggacctg 3540

gtcggcgccg acgaccgctt caccctggtc acccctcccg ccctcggcct ggtgacgttc 3600

cgtcagaccg gaacggacga ggagaaccgg aacctcctgc aagccatcaa caccgaggga 3660

accaccttcc tcacccactc cgagaagaac ggcaccttct tcctgcgctt cgccgccggc 3720

ggcaccctca ccgaggacca ccacgtacgc gaagcatggc gcgccgtcca gaacgcgatc 3780

cctcgcgcac aacacctcgc cggcggctcg gctgatgcgc tgcccgagta gtttaacttt 3840

aagaaggaga tatacatgaa caccttccgg accgcgacgg cacgcgatct ccccgatgtc 3900

gccgccacct tgaccgaggc gttcgccgcc gacccgccga cccaatgggt cttcccggac 3960

ggtgccgctg cggtctcccg tttcttcttc ggtgtcgccg accgtgcccg cgaggccggc 4020

gggatcgtcg aactactccc cggcaccgcc gcgatgatcg ccctaccccc gcacgtacga 4080

ctacccgacg ccccagcctg cggccgacag gccgagatgc agcgcaggct gggcgaacgc 4140

cgcccccgca ctccgcacta ctacctcctc ttctacggcg tgcgcaccgc ccatcagagc 4200

tccggcctgg ggggacggat gctctccgac ctcatctccc tggccgaccg cgaccgcgtg 4260

ggcacctaca ccgaggccag cacctggcgc ggcgcccgcc tgatgttgcg tcacggcttc 4320

cacaccgcac agccgctgcg gcttccccac gggccaccca tgttccccct ctggagagac 4380

ccgatccatg accactgcga ctgaaagctt ggctgttttg gcggatgaga gaagattttc 4440

agcctgatac agattaaatc agaacgcaga agcggtctga taaaacagaa tttgcctggc 4500

ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa acgccgtagc 4560

gccgatggta gtgtggggtc tccccatgcg agagtaggga actgccaggc atcaaataaa 4620

acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc 4680

tctcctgagt aggacaaatc cgccgggagc ggatttgaac gttgcgaagc aacggcccgg 4740

agggtggcgg gcaggacgcc cgccataaac tgccaggcat caaattaagc agaaggccat 4800

cctgacggat ggcctttttg cgtttctaca aactcttttg tttatttttc taaatacatt 4860

caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 4920

ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 4980

gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 5040

tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 5100

ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 5160

tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 5220

atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 5280

gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 5340

caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 5400

ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 5460

ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 5520

ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 5580

ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 5640

gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 5700

ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 5760

taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 5820

agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 5880

atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 5940

aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 6000

caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 6060

ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 6120

cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 6180

tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 6240

gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 6300

ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 6360

gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 6420

caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 6480

ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 6540

tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 6600

ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 6660

agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 6720

aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc 6780

gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc cagtatacac 6840

tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa cacccgctga 6900

cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 6960

cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga ggcagcagat 7020

caattcgcgc gcgaaggcga agcggcatgc ataatgtgcc tgtcaaatgg acgaagcagg 7080

gattctgcaa accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta 7140

tgacaacttg acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg 7200

gctggccccg gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac 7260

attgcgaccg acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct 7320

gatacgttgg tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg 7380

tgacagacgc gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct 7440

gtctgccagg tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg 7500

atggagcgac tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat 7560

cgccagcagc tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag 7620

gtcgctgaaa tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat 7680

tgacggccag ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg 7740

ataccattcg cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag 7800

caaaatatca cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc 7860

gcgaatggtg agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc 7920

gagataaccg ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta 7980

tcccggcagc aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag 8040

ag 8042

<210> 2

<211> 5975

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360

aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420

gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480

cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540

ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600

gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660

gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720

catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780

gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840

acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900

atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960

gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020

agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080

ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140

gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200

gacgtgtaat ttaactttaa gaaggagata tacatgaccg cactcaccca agcccattgc 1260

gaagcctgcc gcgcagacgc cccgcacgtc agcgacgaag aactgcccgt gctgctgcgg 1320

caaatcccgg attggaacat cgaagtccgc gacggcatca tgcagctaga gaaggtctac 1380

ctgttcaaga acttcaagca tgccctggcc ttcaccaatg ccgtcggcga gatatccgag 1440

gccgaaggcc accatccggg cctgctgacc gagtggggca aagtcaccgt gacctggtgg 1500

agccactcga tcaagggcct gcaccgcaac gatttcatca tggcggcgcg caccgatgag 1560

gtagcgaaaa ccgccgaggg gcgcaaataa tttaacttta agaaggagat atacatgggt 1620

aaaacccagc ccttgccaat attaattact ggcggaggtc gtcgcatcgg cctcgccctc 1680

gcatggcatt tcattaatca aaagcaaccg gtgattgtca gctatcggac acactatcca 1740

gccattgatg gactgattaa tgcaggtgcg cagtgtattc aggctgattt ttcgaccaac 1800

gacggtgtga tggcgtttgc cgatgaagta ctaaaaagca cccatggtct gcgtgctatt 1860

ttgcataacg ccagtgcgtg gatggcggaa aaaccgggtg cgccactggc cgacgtactg 1920

gcttgcatga tgcagatcca cgttaatacc ccatacctgc tcaaccatgc gctggaaaga 1980

ttactgcgtg ggcacggaca cgccgccagc gatatcattc actttaccga ttatgtggtg 2040

gagcgcggta gcgacaaaca tattgcgtat gctgcaagca aagcggcact ggataatatg 2100

acccgctcgt ttgcccgcaa gctggcaccg gaagtgaaag tgaattctat tgcgccatcg 2160

ctgatcctgt ttaatgaaca tgatgatgcc gaatatcgac aacaggcgct gaataaatca 2220

ctgatgaaaa ccgcgcctgg cgagaaagaa gtgatcgacc tggtcgatta cttacttacc 2280

agttgctttg tcaccggacg cagtttccca cttgatggcg gtcgtcatct gcgttaaaag 2340

cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa atcagaacgc 2400

agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt cccacctgac 2460

cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat 2520

gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 2580

ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccggg 2640

agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac gcccgccata 2700

aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct 2760

acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 2820

aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 2880

gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 2940

cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 3000

tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 3060

tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac gccgggcaag 3120

agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 3180

cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 3240

tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 3300

ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 3360

tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 3420

cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 3480

actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 3540

ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 3600

tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 3660

ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 3720

aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 3780

ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 3840

agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 3900

ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 3960

tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 4020

cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 4080

ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 4140

gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 4200

ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 4260

aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg 4320

cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 4380

ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 4440

gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 4500

ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 4560

ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 4620

gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt 4680

ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 4740

gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat 4800

ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 4860

ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 4920

accgtcatca ccgaaacgcg cgaggcagca gatcaattcg cgcgcgaagg cgaagcggca 4980

tgcataatgt gcctgtcaaa tggacgaagc agggattctg caaaccctat gctactccgt 5040

caagccgtca attgtctgat tcgttaccaa ttatgacaac ttgacggcta catcattcac 5100

tttttcttca caaccggcac ggaactcgct cgggctggcc ccggtgcatt ttttaaatac 5160

ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga ccgacggtgg cgataggcat 5220

ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt tggtcctcgc gccagcttaa 5280

gacgctaatc cctaactgct ggcggaaaag atgtgacaga cgcgacggcg acaagcaaac 5340

atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc aggtgatcgc tgatgtactg 5400

acaagcctcg cgtacccgat tatccatcgg tggatggagc gactcgttaa tcgcttccat 5460

gcgccgcagt aacaattgct caagcagatt tatcgccagc agctccgaat agcgcccttc 5520

cccttgcccg gcgttaatga tttgcccaaa caggtcgctg aaatgcggct ggtgcgcttc 5580

atccgggcga aagaaccccg tattggcaaa tattgacggc cagttaagcc attcatgcca 5640

gtaggcgcgc ggacgaaagt aaacccactg gtgataccat tcgcgagcct ccggatgacg 5700

accgtagtga tgaatctctc ctggcgggaa cagcaaaata tcacccggtc ggcaaacaaa 5760

ttctcgtccc tgatttttca ccaccccctg accgcgaatg gtgagattga gaatataacc 5820

tttcattccc agcggtcggt cgataaaaaa atcgagataa ccgttggcct caatcggcgt 5880

taaacccgcc accagatggg cattaaacga gtatcccggc agcaggggat cattttgcgc 5940

ttcagccata cttttcatac tcccgccatt cagag 5975

<210> 3

<211> 6142

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 60

tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 120

agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 180

gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta 240

tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc 300

tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 360

tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagca gatcaattcg 420

cgcgcgaagg cgaagcggca tgcataatgt gcctgtcaaa tggacgaagc agggattctg 480

caaaccctat gctactccgt caagccgtca attgtctgat tcgttaccaa ttatgacaac 540

ttgacggcta catcattcac tttttcttca caaccggcac ggaactcgct cgggctggcc 600

ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga 660

ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt 720

tggtcctcgc gccagcttaa gacgctaatc cctaactgct ggcggaaaag atgtgacaga 780

cgcgacggcg acaagcaaac atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc 840

aggtgatcgc tgatgtactg acaagcctcg cgtacccgat tatccatcgg tggatggagc 900

gactcgttaa tcgcttccat gcgccgcagt aacaattgct caagcagatt tatcgccagc 960

agctccgaat agcgcccttc cccttgcccg gcgttaatga tttgcccaaa caggtcgctg 1020

aaatgcggct ggtgcgcttc atccgggcga aagaaccccg tattggcaaa tattgacggc 1080

cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt aaacccactg gtgataccat 1140

tcgcgagcct ccggatgacg accgtagtga tgaatctctc ctggcgggaa cagcaaaata 1200

tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca ccaccccctg accgcgaatg 1260

gtgagattga gaatataacc tttcattccc agcggtcggt cgataaaaaa atcgagataa 1320

ccgttggcct caatcggcgt taaacccgcc accagatggg cattaaacga gtatcccggc 1380

agcaggggat cattttgcgc ttcagccata cttttcatac tcccgccatt cagagaagaa 1440

accaattgtc catattgcat cagacattgc cgtcactgcg tcttttactg gctcttctcg 1500

ctaaccaaac cggtaacccc gcttattaaa agcattctgt aacaaagcgg gaccaaagcc 1560

atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca gaaaagtcca cattgattat 1620

ttgcacggcg tcacactttg ctatgccata gcatttttat ccataagatt agcggatcct 1680

acctgacgct ttttatcgca actctctact gtttctccat acccgttttt tgggctaaca 1740

ggaggaatta accatgaagc ccgctgacgc gaaaccgccc cacatggacc acgacacctt 1800

ccgctccctg ggccatcagg ccatcgactg gatcgccgac tactggcagc gtttggcgga 1860

gcgacccgtc gctccccccg tcgaacccgg cagcatccgc gcccagttac cgacggcccc 1920

acccgagtgc ggcgaggact ttcccgtact gctgtccgac ctcgaacgga tcgtgctgcc 1980

gggcctgctg cactggcagc acccccgttt cttcggttac ttccccgcga acgcttccgg 2040

ccccgccgtc ctggccgagc tgttgtccgc gggcctgggc atccagggga tgaactggaa 2100

caccagcccg gcctgcaccg agatcgaaca gcagatgctg gactggttcg tgcacctgct 2160

cggcctaccc gagcacctcc gcggtggggg agtcatccag gacaccgcct ccagcgccct 2220

cctggtggca ctgctcaccg ccctgcacca ggccagtgcg ggccgcaccc gcgaccacgg 2280

caccggcgag tgcggctacc gggtgtacct gaccgccgag acgcactcgg cggcccgcaa 2340

ggccgccgtc atcaccggac tgggcctgcg ggccatgtgc gaggtggcca ccgacgccga 2400

cggcgccatg gacgcagtcg atctggaaag acacctccgg gccgaccggg ccgcaggtct 2460

gaccccgctg atggtcgtgg ccacccgagg caccacctcc catctctcct tcgaccccct 2520

ggaggacatc ggccccgtgt gtcgtcggca cggcgtgtgg ctccacgtcg acgccgcata 2580

cgccggagtg gccgcggtct gcgacgaact gcgctgggtc aacgacggcg tgcgctacgc 2640

ggactcctac tgcaccaacc cgcacaagtg gctgctgacc aacttcgact gcgacctgct 2700

gtgggtggcc caccccgaag tcctcgtcag cgccctgagc gtgctccccg aatacctgcg 2760

caactcggcc tccgaatcgg gccgggtgac cgactaccgg cactggcagg tcccactggg 2820

ccggcgcttc cgcgcactga aactgtggtc cgtcctccac tggtacggcg ccgaggggct 2880

gcgcgcccac atccgcaccg gcgttcggca tgcccagctc ttcgcggacc tggtcggcgc 2940

cgacgaccgc ttcaccctgg tcacccctcc cgccctcggc ctggtgacgt tccgtcagac 3000

cggaacggac gaggagaacc ggaacctcct gcaagccatc aacaccgagg gaaccacctt 3060

cctcacccac tccgagaaga acggcacctt cttcctgcgc ttcgccgccg gcggcaccct 3120

caccgaggac caccacgtac gcgaagcatg gcgcgccgtc cagaacgcga tccctcgcgc 3180

acaacacctc gccggcggct cggctgatgc gctgcccgag tagtttaact ttaagaagga 3240

gatatacatg aacaccttcc ggaccgcgac ggcacgcgat ctccccgatg tcgccgccac 3300

cttgaccgag gcgttcgccg ccgacccgcc gacccaatgg gtcttcccgg acggtgccgc 3360

tgcggtctcc cgtttcttct tcggtgtcgc cgaccgtgcc cgcgaggccg gcgggatcgt 3420

cgaactactc cccggcaccg ccgcgatgat cgccctaccc ccgcacgtac gactacccga 3480

cgccccagcc tgcggccgac aggccgagat gcagcgcagg ctgggcgaac gccgcccccg 3540

cactccgcac tactacctcc tcttctacgg cgtgcgcacc gcccatcaga gctccggcct 3600

ggggggacgg atgctctccg acctcatctc cctggccgac cgcgaccgcg tgggcaccta 3660

caccgaggcc agcacctggc gcggcgcccg cctgatgttg cgtcacggct tccacaccgc 3720

acagccgctg cggcttcccc acgggccacc catgttcccc ctctggagag acccgatcca 3780

tgaccactgc gactgaaagc ttggctgttt tggcggatga gagaagattt tcagcctgat 3840

acagattaaa tcagaacgca gaagcggtct gataaaacag aatttgcctg gcggcagtag 3900

cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg 3960

tagtgtgggg tctccccatg cgagagtagg gaactgccag gcatcaaata aaacgaaagg 4020

ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga 4080

gtaggacaaa tccgccggga gcggatttga acgttgcgaa gcaacggccc ggagggtggc 4140

gggcaggacg cccgccataa actgccaggc atcaaattaa gcagaaggcc atcctgacgg 4200

atggccttac aacttatatc gtatggggct gacttcaggt gctacatttg aagagataaa 4260

ttgcactgaa atctagaaat attttatctg attaataaga tgatcttctt gagatcgttt 4320

tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc gccttgcagg gcggtttttc 4380

gaaggttctc tgagctacca actctttgaa ccgaggtaac tggcttggag gagcgcagtc 4440

accaaaactt gtcctttcag tttagcctta accggcgcat gacttcaaga ctaactcctc 4500

taaatcaatt accagtggct gctgccagtg gtgcttttgc atgtctttcc gggttggact 4560

caagacgata gttaccggat aaggcgcagc ggtcggactg aacggggggt tcgtgcatac 4620

agtccagctt ggagcgaact gcctacccgg aactgagtgt caggcgtgga atgagacaaa 4680

cgcggccata acagcggaat gacaccggta aaccgaaagg caggaacagg agagcgcacg 4740

agggagccgc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccaccac 4800

tgatttgagc gtcagatttc gtgatgcttg tcaggggggc ggagcctatg gaaaaacggc 4860

tttgccgcgg ccctctcact tccctgttaa gtatcttcct ggcatcttcc aggaaatctc 4920

cgccccgttc gtaagccatt tccgctcgcc gcagtcgaac gaccgagcgt agcgagtcag 4980

tgagcgagga agcggaatat atcctgtatc acatattctg ctgacgcacc ggtgcagcct 5040

tttttctcct gccacatgaa gcacttcact gacaccctca tcagtgccaa catagtaagc 5100

cagtatacac tccgctagcg ctgatgtccg gcggtgcttt tgccgttacg caccaccccg 5160

tcagtagctg aacaggaggg acagctgata gaaacagaag ccactggagc acctcaaaaa 5220

caccatcata cactaaatca gtaagttggc agcatcaccc gacgcacttt gcgccgaata 5280

aatacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc ctgttgatac 5340

cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg taagaggttc 5400

caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt tatcgagatt 5460

ttcaggagct aaggaagcta aaatggagaa aaaaatcact ggatatacca ccgttgatat 5520

atcccaatgg catcgtaaag aacattttga ggcatttcag tcagttgctc aatgtaccta 5580

taaccagacc gttcagctgg atattacggc ctttttaaag accgtaaaga aaaataagca 5640

caagttttat ccggccttta ttcacattct tgcccgcctg atgaatgctc atccggaatt 5700

ccgtatggca atgaaagacg gtgagctggt gatatgggat agtgttcacc cttgttacac 5760

cgttttccat gagcaaactg aaacgttttc atcgctctgg agtgaatacc acgacgattt 5820

ccggcagttt ctacacatat attcgcaaga tgtggcgtgt tacggtgaaa acctggccta 5880

tttccctaaa gggtttattg agaatatgtt tttcgtctca gccaatccct gggtgagttt 5940

caccagtttt gatttaaacg tggccaatat ggacaacttc ttcgcccccg ttttcaccat 6000

gggcaaatat tatacgcaag gcgacaaggt gctgatgccg ctggcgattc aggttcatca 6060

tgccgtctgt gatggcttcc atgtcggcag aatgcttaat gaattacaac agtactgcga 6120

tgagtggcag ggcggggcgt aa 6142

<210> 4

<211> 4847

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60

tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120

aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180

attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240

atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300

taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360

aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420

gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480

cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540

ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600

gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660

gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720

catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780

gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840

acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900

atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960

gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020

agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080

ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140

gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200

gacgtgtaaa agcttggctg ttttggcgga tgagagaaga ttttcagcct gatacagatt 1260

aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag tagcgcggtg 1320

gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg 1380

gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa aggctcagtc 1440

gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac 1500

aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg 1560

acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga cggatggcct 1620

ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat atgtatccgc 1680

tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 1740

ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 1800

ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 1860

gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 1920

gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtgttg 1980

acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 2040

actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 2100

ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 2160

cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 2220

gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 2280

caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 2340

aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 2400

ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 2460

tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 2520

ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 2580

ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 2640

ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 2700

tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 2760

cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 2820

taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 2880

gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 2940

acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 3000

ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 3060

ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 3120

cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 3180

aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 3240

gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 3300

gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 3360

gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 3420

ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 3480

ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 3540

tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc 3600

tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc tatcgctacg 3660

tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 3720

ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 3780

tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt cgcgcgcgaa 3840

ggcgaagcgg catgcataat gtgcctgtca aatggacgaa gcagggattc tgcaaaccct 3900

atgctactcc gtcaagccgt caattgtctg attcgttacc aattatgaca acttgacggc 3960

tacatcattc actttttctt cacaaccggc acggaactcg ctcgggctgg ccccggtgca 4020

ttttttaaat acccgcgaga aatagagttg atcgtcaaaa ccaacattgc gaccgacggt 4080

ggcgataggc atccgggtgg tgctcaaaag cagcttcgcc tggctgatac gttggtcctc 4140

gcgccagctt aagacgctaa tccctaactg ctggcggaaa agatgtgaca gacgcgacgg 4200

cgacaagcaa acatgctgtg cgacgctggc gatatcaaaa ttgctgtctg ccaggtgatc 4260

gctgatgtac tgacaagcct cgcgtacccg attatccatc ggtggatgga gcgactcgtt 4320

aatcgcttcc atgcgccgca gtaacaattg ctcaagcaga tttatcgcca gcagctccga 4380

atagcgccct tccccttgcc cggcgttaat gatttgccca aacaggtcgc tgaaatgcgg 4440

ctggtgcgct tcatccgggc gaaagaaccc cgtattggca aatattgacg gccagttaag 4500

ccattcatgc cagtaggcgc gcggacgaaa gtaaacccac tggtgatacc attcgcgagc 4560

ctccggatga cgaccgtagt gatgaatctc tcctggcggg aacagcaaaa tatcacccgg 4620

tcggcaaaca aattctcgtc cctgattttt caccaccccc tgaccgcgaa tggtgagatt 4680

gagaatataa cctttcattc ccagcggtcg gtcgataaaa aaatcgagat aaccgttggc 4740

ctcaatcggc gttaaacccg ccaccagatg ggcattaaac gagtatcccg gcagcagggg 4800

atcattttgc gcttcagcca tacttttcat actcccgcca ttcagag 4847

<210> 5

<211> 7270

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 60

tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 120

agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 180

gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta 240

tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc 300

tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 360

tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagca gatcaattcg 420

cgcgcgaagg cgaagcggca tgcataatgt gcctgtcaaa tggacgaagc agggattctg 480

caaaccctat gctactccgt caagccgtca attgtctgat tcgttaccaa ttatgacaac 540

ttgacggcta catcattcac tttttcttca caaccggcac ggaactcgct cgggctggcc 600

ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga 660

ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt 720

tggtcctcgc gccagcttaa gacgctaatc cctaactgct ggcggaaaag atgtgacaga 780

cgcgacggcg acaagcaaac atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc 840

aggtgatcgc tgatgtactg acaagcctcg cgtacccgat tatccatcgg tggatggagc 900

gactcgttaa tcgcttccat gcgccgcagt aacaattgct caagcagatt tatcgccagc 960

agctccgaat agcgcccttc cccttgcccg gcgttaatga tttgcccaaa caggtcgctg 1020

aaatgcggct ggtgcgcttc atccgggcga aagaaccccg tattggcaaa tattgacggc 1080

cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt aaacccactg gtgataccat 1140

tcgcgagcct ccggatgacg accgtagtga tgaatctctc ctggcgggaa cagcaaaata 1200

tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca ccaccccctg accgcgaatg 1260

gtgagattga gaatataacc tttcattccc agcggtcggt cgataaaaaa atcgagataa 1320

ccgttggcct caatcggcgt taaacccgcc accagatggg cattaaacga gtatcccggc 1380

agcaggggat cattttgcgc ttcagccata cttttcatac tcccgccatt cagagaagaa 1440

accaattgtc catattgcat cagacattgc cgtcactgcg tcttttactg gctcttctcg 1500

ctaaccaaac cggtaacccc gcttattaaa agcattctgt aacaaagcgg gaccaaagcc 1560

atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca gaaaagtcca cattgattat 1620

ttgcacggcg tcacactttg ctatgccata gcatttttat ccataagatt agcggatcct 1680

acctgacgct ttttatcgca actctctact gtttctccat acccgttttt tgggctaaca 1740

ggaggaatta accatgaagc ccgctgacgc gaaaccgccc cacatggacc acgacacctt 1800

ccgctccctg ggccatcagg ccatcgactg gatcgccgac tactggcagc gtttggcgga 1860

gcgacccgtc gctccccccg tcgaacccgg cagcatccgc gcccagttac cgacggcccc 1920

acccgagtgc ggcgaggact ttcccgtact gctgtccgac ctcgaacgga tcgtgctgcc 1980

gggcctgctg cactggcagc acccccgttt cttcggttac ttccccgcga acgcttccgg 2040

ccccgccgtc ctggccgagc tgttgtccgc gggcctgggc atccagggga tgaactggaa 2100

caccagcccg gcctgcaccg agatcgaaca gcagatgctg gactggttcg tgcacctgct 2160

cggcctaccc gagcacctcc gcggtggggg agtcatccag gacaccgcct ccagcgccct 2220

cctggtggca ctgctcaccg ccctgcacca ggccagtgcg ggccgcaccc gcgaccacgg 2280

caccggcgag tgcggctacc gggtgtacct gaccgccgag acgcactcgg cggcccgcaa 2340

ggccgccgtc atcaccggac tgggcctgcg ggccatgtgc gaggtggcca ccgacgccga 2400

cggcgccatg gacgcagtcg atctggaaag acacctccgg gccgaccggg ccgcaggtct 2460

gaccccgctg atggtcgtgg ccacccgagg caccacctcc catctctcct tcgaccccct 2520

ggaggacatc ggccccgtgt gtcgtcggca cggcgtgtgg ctccacgtcg acgccgcata 2580

cgccggagtg gccgcggtct gcgacgaact gcgctgggtc aacgacggcg tgcgctacgc 2640

ggactcctac tgcaccaacc cgcacaagtg gctgctgacc aacttcgact gcgacctgct 2700

gtgggtggcc caccccgaag tcctcgtcag cgccctgagc gtgctccccg aatacctgcg 2760

caactcggcc tccgaatcgg gccgggtgac cgactaccgg cactggcagg tcccactggg 2820

ccggcgcttc cgcgcactga aactgtggtc cgtcctccac tggtacggcg ccgaggggct 2880

gcgcgcccac atccgcaccg gcgttcggca tgcccagctc ttcgcggacc tggtcggcgc 2940

cgacgaccgc ttcaccctgg tcacccctcc cgccctcggc ctggtgacgt tccgtcagac 3000

cggaacggac gaggagaacc ggaacctcct gcaagccatc aacaccgagg gaaccacctt 3060

cctcacccac tccgagaaga acggcacctt cttcctgcgc ttcgccgccg gcggcaccct 3120

caccgaggac caccacgtac gcgaagcatg gcgcgccgtc cagaacgcga tccctcgcgc 3180

acaacacctc gccggcggct cggctgatgc gctgcccgag tagtttaact ttaagaagga 3240

gatatacatg aacaccttcc ggaccgcgac ggcacgcgat ctccccgatg tcgccgccac 3300

cttgaccgag gcgttcgccg ccgacccgcc gacccaatgg gtcttcccgg acggtgccgc 3360

tgcggtctcc cgtttcttct tcggtgtcgc cgaccgtgcc cgcgaggccg gcgggatcgt 3420

cgaactactc cccggcaccg ccgcgatgat cgccctaccc ccgcacgtac gactacccga 3480

cgccccagcc tgcggccgac aggccgagat gcagcgcagg ctgggcgaac gccgcccccg 3540

cactccgcac tactacctcc tcttctacgg cgtgcgcacc gcccatcaga gctccggcct 3600

ggggggacgg atgctctccg acctcatctc cctggccgac cgcgaccgcg tgggcaccta 3660

caccgaggcc agcacctggc gcggcgcccg cctgatgttg cgtcacggct tccacaccgc 3720

acagccgctg cggcttcccc acgggccacc catgttcccc ctctggagag acccgatcca 3780

tgaccactgc gactgattta actttaagaa ggagatatac atgaccgcac tcacccaagc 3840

ccattgcgaa gcctgccgcg cagacgcccc gcacgtcagc gacgaagaac tgcccgtgct 3900

gctgcggcaa atcccggatt ggaacatcga agtccgcgac ggcatcatgc agctagagaa 3960

ggtctacctg ttcaagaact tcaagcatgc cctggccttc accaatgccg tcggcgagat 4020

atccgaggcc gaaggccacc atccgggcct gctgaccgag tggggcaaag tcaccgtgac 4080

ctggtggagc cactcgatca agggcctgca ccgcaacgat ttcatcatgg cggcgcgcac 4140

cgatgaggta gcgaaaaccg ccgaggggcg caaataattt aactttaaga aggagatata 4200

catgggtaaa acccagccct tgccaatatt aattactggc ggaggtcgtc gcatcggcct 4260

cgccctcgca tggcatttca ttaatcaaaa gcaaccggtg attgtcagct atcggacaca 4320

ctatccagcc attgatggac tgattaatgc aggtgcgcag tgtattcagg ctgatttttc 4380

gaccaacgac ggtgtgatgg cgtttgccga tgaagtacta aaaagcaccc atggtctgcg 4440

tgctattttg cataacgcca gtgcgtggat ggcggaaaaa ccgggtgcgc cactggccga 4500

cgtactggct tgcatgatgc agatccacgt taatacccca tacctgctca accatgcgct 4560

ggaaagatta ctgcgtgggc acggacacgc cgccagcgat atcattcact ttaccgatta 4620

tgtggtggag cgcggtagcg acaaacatat tgcgtatgct gcaagcaaag cggcactgga 4680

taatatgacc cgctcgtttg cccgcaagct ggcaccggaa gtgaaagtga attctattgc 4740

gccatcgctg atcctgttta atgaacatga tgatgccgaa tatcgacaac aggcgctgaa 4800

taaatcactg atgaaaaccg cgcctggcga gaaagaagtg atcgacctgg tcgattactt 4860

acttaccagt tgctttgtca ccggacgcag tttcccactt gatggcggtc gtcatctgcg 4920

ttaaaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 4980

agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 5040

acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 5100

tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 5160

actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 5220

cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 5280

cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggccttacaa 5340

cttatatcgt atggggctga cttcaggtgc tacatttgaa gagataaatt gcactgaaat 5400

ctagaaatat tttatctgat taataagatg atcttcttga gatcgttttg gtctgcgcgt 5460

aatctcttgc tctgaaaacg aaaaaaccgc cttgcagggc ggtttttcga aggttctctg 5520

agctaccaac tctttgaacc gaggtaactg gcttggagga gcgcagtcac caaaacttgt 5580

cctttcagtt tagccttaac cggcgcatga cttcaagact aactcctcta aatcaattac 5640

cagtggctgc tgccagtggt gcttttgcat gtctttccgg gttggactca agacgatagt 5700

taccggataa ggcgcagcgg tcggactgaa cggggggttc gtgcatacag tccagcttgg 5760

agcgaactgc ctacccggaa ctgagtgtca ggcgtggaat gagacaaacg cggccataac 5820

agcggaatga caccggtaaa ccgaaaggca ggaacaggag agcgcacgag ggagccgcca 5880

gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccaccactg atttgagcgt 5940

cagatttcgt gatgcttgtc aggggggcgg agcctatgga aaaacggctt tgccgcggcc 6000

ctctcacttc cctgttaagt atcttcctgg catcttccag gaaatctccg ccccgttcgt 6060

aagccatttc cgctcgccgc agtcgaacga ccgagcgtag cgagtcagtg agcgaggaag 6120

cggaatatat cctgtatcac atattctgct gacgcaccgg tgcagccttt tttctcctgc 6180

cacatgaagc acttcactga caccctcatc agtgccaaca tagtaagcca gtatacactc 6240

cgctagcgct gatgtccggc ggtgcttttg ccgttacgca ccaccccgtc agtagctgaa 6300

caggagggac agctgataga aacagaagcc actggagcac ctcaaaaaca ccatcataca 6360

ctaaatcagt aagttggcag catcacccga cgcactttgc gccgaataaa tacctgtgac 6420

ggaagatcac ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg 6480

ggccaacttt tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca 6540

taatgaaata agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa 6600

ggaagctaaa atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca 6660

tcgtaaagaa cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt 6720

tcagctggat attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc 6780

ggcctttatt cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat 6840

gaaagacggt gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga 6900

gcaaactgaa acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct 6960

acacatatat tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg 7020

gtttattgag aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga 7080

tttaaacgtg gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta 7140

tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtctgtga 7200

tggcttccat gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg 7260

cggggcgtaa 7270

<210> 6

<211> 296

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 6

Met Asn Thr Ala Pro Arg Arg Val Glu Asn Gln Leu Thr Asp Lys Gly

1 5 10 15

Tyr Val Pro Val Tyr Thr Thr Ala Val Val Glu Gln Pro Trp Asp Gly

20 25 30

Tyr Ser Ala Asp Asp His Ala Thr Trp Gly Thr Leu Tyr Arg Arg Gln

35 40 45

Arg Ala Leu Leu Val Gly Arg Ala Cys Asp Glu Phe Leu Gln Ala Gln

50 55 60

Asp Ala Met Gly Met Asp Asp Thr Gln Ile Pro Arg Phe Asp Ala Leu

65 70 75 80

Asn Ala Val Leu Gln Ala Thr Thr Gly Trp Thr Leu Val Gly Val Glu

85 90 95

Gly Leu Leu Pro Glu Leu Asp Phe Phe Asp His Leu Ala Asn Arg Arg

100 105 110

Phe Pro Val Thr Trp Trp Ile Arg Arg Pro Asp Gln Ile Asp Tyr Ile

115 120 125

Ala Glu Pro Asp Leu Phe His Asp Leu Phe Gly His Val Pro Leu Leu

130 135 140

Met Asn Pro Leu Phe Ala Asp Phe Met Gln Ala Tyr Gly Arg Gly Gly

145 150 155 160

Val Lys Ala His Gly Ile Gly Pro Asp Ala Leu Gln Asn Leu Thr Arg

165 170 175

Leu Tyr Phe Tyr Thr Val Glu Phe Gly Leu Ile Ala Thr Pro Gln Gly

180 185 190

Leu Arg Ile Tyr Gly Ala Gly Ile Val Ser Ser Lys Gly Glu Ser Leu

195 200 205

His Ser Leu Glu Ser Ala Ala Pro Asn Arg Val Gly Phe Asp Leu Gln

210 215 220

Arg Val Met Arg Thr Arg Tyr Arg Ile Asp Ser Phe Gln Lys Thr Tyr

225 230 235 240

Phe Val Ile Asp Ser Phe Thr Gln Leu Met Asp Ala Thr Ala Pro Asp

245 250 255

Phe Thr Pro Ile Tyr Ala Ala Leu Ala Gln Gln Pro Gln Val Pro Ala

260 265 270

Gly Glu Val Leu Ala Thr Asp His Val Leu Gln Arg Gly Ser Gly Glu

275 280 285

Gly Trp Ser Arg Asp Gly Asp Val

290 295

<210> 7

<211> 240

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Met Gly Lys Thr Gln Pro Leu Pro Ile Leu Ile Thr Gly Gly Gly Arg

1 5 10 15

Arg Ile Gly Leu Ala Leu Ala Trp His Phe Ile Asn Gln Lys Gln Pro

20 25 30

Val Ile Val Ser Tyr Arg Thr His Tyr Pro Ala Ile Asp Gly Leu Ile

35 40 45

Asn Ala Gly Ala Gln Cys Ile Gln Ala Asp Phe Ser Thr Asn Asp Gly

50 55 60

Val Met Ala Phe Ala Asp Glu Val Leu Lys Ser Thr His Gly Leu Arg

65 70 75 80

Ala Ile Leu His Asn Ala Ser Ala Trp Met Ala Glu Lys Pro Gly Ala

85 90 95

Pro Leu Ala Asp Val Leu Ala Cys Met Met Gln Ile His Val Asn Thr

100 105 110

Pro Tyr Leu Leu Asn His Ala Leu Glu Arg Leu Leu Arg Gly His Gly

115 120 125

His Ala Ala Ser Asp Ile Ile His Phe Thr Asp Tyr Val Val Glu Arg

130 135 140

Gly Ser Asp Lys His Ile Ala Tyr Ala Ala Ser Lys Ala Ala Leu Asp

145 150 155 160

Asn Met Thr Arg Ser Phe Ala Arg Lys Leu Ala Pro Glu Val Lys Val

165 170 175

Asn Ser Ile Ala Pro Ser Leu Ile Leu Phe Asn Glu His Asp Asp Ala

180 185 190

Glu Tyr Arg Gln Gln Ala Leu Asn Lys Ser Leu Met Lys Thr Ala Pro

195 200 205

Gly Glu Lys Glu Val Ile Asp Leu Val Asp Tyr Leu Leu Thr Ser Cys

210 215 220

Phe Val Thr Gly Arg Ser Phe Pro Leu Asp Gly Gly Arg His Leu Arg

225 230 235 240

<210> 8

<211> 118

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 8

Met Thr Ala Leu Thr Gln Ala His Cys Glu Ala Cys Arg Ala Asp Ala

1 5 10 15

Pro His Val Ser Asp Glu Glu Leu Pro Val Leu Leu Arg Gln Ile Pro

20 25 30

Asp Trp Asn Ile Glu Val Arg Asp Gly Ile Met Gln Leu Glu Lys Val

35 40 45

Tyr Leu Phe Lys Asn Phe Lys His Ala Leu Ala Phe Thr Asn Ala Val

50 55 60

Gly Glu Ile Ser Glu Ala Glu Gly His His Pro Gly Leu Leu Thr Glu

65 70 75 80

Trp Gly Lys Val Thr Val Thr Trp Trp Ser His Ser Ile Lys Gly Leu

85 90 95

His Arg Asn Asp Phe Ile Met Ala Ala Arg Thr Asp Glu Val Ala Lys

100 105 110

Thr Ala Glu Gly Arg Lys

115

<210> 9

<211> 492

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 9

Met Arg Arg Arg Lys Pro Ala Asp Ala Lys Pro Pro His Met Asp His

1 5 10 15

Asp Thr Phe Arg Ser Leu Gly His Gln Ala Ile Asp Trp Ile Ala Asp

20 25 30

Tyr Trp Gln Arg Leu Ala Glu Arg Pro Val Ala Pro Pro Val Glu Pro

35 40 45

Gly Ser Ile Arg Ala Gln Leu Pro Thr Ala Pro Pro Glu Cys Gly Glu

50 55 60

Asp Phe Pro Val Leu Leu Ser Asp Leu Glu Arg Ile Val Leu Pro Gly

65 70 75 80

Leu Leu His Trp Gln His Pro Arg Phe Phe Gly Tyr Phe Pro Ala Asn

85 90 95

Ala Ser Gly Pro Ala Val Leu Ala Glu Leu Leu Ser Ala Gly Leu Gly

100 105 110

Ile Gln Gly Met Asn Trp Asn Thr Ser Pro Ala Cys Thr Glu Ile Glu

115 120 125

Gln Gln Met Leu Asp Trp Phe Val His Leu Leu Gly Leu Pro Glu His

130 135 140

Leu Arg Gly Gly Gly Val Ile Gln Asp Thr Ala Ser Ser Ala Leu Leu

145 150 155 160

Val Ala Leu Leu Thr Ala Leu His Gln Ala Ser Ala Gly Arg Thr Arg

165 170 175

Asp His Gly Thr Gly Glu Cys Gly Tyr Arg Val Tyr Leu Thr Ala Glu

180 185 190

Thr His Ser Ala Ala Arg Lys Ala Ala Val Ile Thr Gly Leu Gly Leu

195 200 205

Arg Ala Met Cys Glu Val Ala Thr Asp Ala Asp Gly Ala Met Asp Ala

210 215 220

Val Asp Leu Glu Arg His Leu Arg Ala Asp Arg Ala Ala Gly Leu Thr

225 230 235 240

Pro Leu Met Val Val Ala Thr Arg Gly Thr Thr Ser His Leu Ser Phe

245 250 255

Asp Pro Leu Glu Asp Ile Gly Pro Val Cys Arg Arg His Gly Val Trp

260 265 270

Leu His Val Asp Ala Ala Tyr Ala Gly Val Ala Ala Val Cys Asp Glu

275 280 285

Leu Arg Trp Val Asn Asp Gly Val Arg Tyr Ala Asp Ser Tyr Cys Thr

290 295 300

Asn Pro His Lys Trp Leu Leu Thr Asn Phe Asp Cys Asp Leu Leu Trp

305 310 315 320

Val Ala His Pro Glu Val Leu Val Ser Ala Leu Ser Val Leu Pro Glu

325 330 335

Tyr Leu Arg Asn Ser Ala Ser Glu Ser Gly Arg Val Thr Asp Tyr Arg

340 345 350

His Trp Gln Val Pro Leu Gly Arg Arg Phe Arg Ala Leu Lys Leu Trp

355 360 365

Ser Val Leu His Trp Tyr Gly Ala Glu Gly Leu Arg Ala His Ile Arg

370 375 380

Thr Gly Val Arg His Ala Gln Leu Phe Ala Asp Leu Val Gly Ala Asp

385 390 395 400

Asp Arg Phe Thr Leu Val Thr Pro Pro Ala Leu Gly Leu Val Thr Phe

405 410 415

Arg Gln Thr Gly Thr Asp Glu Glu Asn Arg Asn Leu Leu Gln Ala Ile

420 425 430

Asn Thr Glu Gly Thr Thr Phe Leu Thr His Ser Glu Lys Asn Gly Thr

435 440 445

Phe Phe Leu Arg Phe Ala Ala Gly Gly Thr Leu Thr Glu Asp His His

450 455 460

Val Arg Glu Ala Trp Arg Ala Val Gln Asn Ala Ile Pro Arg Ala Gln

465 470 475 480

His Leu Ala Gly Gly Ser Ala Asp Ala Leu Pro Glu

485 490

<210> 10

<211> 182

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 10

Met Asn Thr Phe Arg Thr Ala Thr Ala Arg Asp Leu Pro Asp Val Ala

1 5 10 15

Ala Thr Leu Thr Glu Ala Phe Ala Ala Asp Pro Pro Thr Gln Trp Val

20 25 30

Phe Pro Asp Gly Ala Ala Ala Val Ser Arg Phe Phe Phe Gly Val Ala

35 40 45

Asp Arg Ala Arg Glu Ala Gly Gly Ile Val Glu Leu Leu Pro Gly Thr

50 55 60

Ala Ala Met Ile Ala Leu Pro Pro His Val Arg Leu Pro Asp Ala Pro

65 70 75 80

Ala Cys Gly Arg Gln Ala Glu Met Gln Arg Arg Leu Gly Glu Arg Arg

85 90 95

Pro Arg Thr Pro His Tyr Tyr Leu Leu Phe Tyr Gly Val Arg Thr Ala

100 105 110

His Gln Ser Ser Gly Leu Gly Gly Arg Met Leu Ser Asp Leu Ile Ser

115 120 125

Leu Ala Asp Arg Asp Arg Val Gly Thr Tyr Thr Glu Ala Ser Thr Trp

130 135 140

Arg Gly Ala Arg Leu Met Leu Arg His Gly Phe His Thr Ala Gln Pro

145 150 155 160

Leu Arg Leu Pro His Gly Pro Pro Met Phe Pro Leu Trp Arg Asp Pro

165 170 175

Ile His Asp His Cys Asp

180

Claims

1.一种重组大肠杆菌，其特征在于：所述重组大肠杆菌与受体大肠杆菌相比，所述重组大肠杆菌中色氨酸衍生物合成相关蛋白的基因的表达量增加和/或所述色氨酸衍生物合成相关蛋白的含量增加；

所述色氨酸衍生物合成相关蛋白为：

P1)苯丙氨酸羟化酶；

P2)二氢单磷酸还原酶；

P3)4a-羟基四氢生物蝶呤脱水酶；

P4)天冬氨酸转氨酶家族蛋白；

P5)N-乙酰转移酶；

所述苯丙氨酸羟化酶为SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质；

所述二氢单磷酸还原酶为SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质；

所述4a-羟基四氢生物蝶呤脱水酶为SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质；

所述天冬氨酸转氨酶家族蛋白为SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质；

所述N-乙酰转移酶为SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质。

2.一种重组大肠杆菌的构建方法，其特征在于：所述构建方法包括如下步骤：将色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌，得到重组大肠杆菌；

所述色氨酸衍生物合成相关蛋白的基因为：

P1)苯丙氨酸羟化酶基因；

P2)二氢单磷酸还原酶基因；

P3)4a-羟基四氢生物蝶呤脱水酶基因；

P4)天冬氨酸转氨酶家族蛋白基因；

P5)N-乙酰转移酶基因；

所述色氨酸衍生物合成相关蛋白的基因通过方式甲或方式乙导入所述受体大肠杆菌中；

所述方式甲为所述苯丙氨酸羟化酶的基因构建在一个表达载体上，所述N-乙酰转移酶、天冬氨酸转氨酶家族蛋白、4a-羟基四氢生物蝶呤脱水酶和二氢单磷酸还原酶的基因构建在另一个表达载体上，所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白、N-乙酰转移酶、4a-羟基四氢生物蝶呤脱水酶和二氢单磷酸还原酶的基因依次连接，然后均导入到受体大肠杆菌中；

所述方式乙为所述苯丙氨酸羟化酶、4a-羟基四氢生物蝶呤脱水酶和二氢单磷酸还原酶的基因构建在一个表达载体上，所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶、4a-羟基四氢生物蝶呤脱水酶和二氢单磷酸还原酶的基因依次连接；所述天冬氨酸转氨酶家族蛋白和N-乙酰转移酶的基因构建在同一个表达载体上，然后均导入到受体大肠杆菌中；

3.根据权利要求2所述的构建方法，其特征在于：

所述苯丙氨酸羟化酶的基因为SEQ ID No.1第319-1209位所示的DNA分子；

所述二氢单磷酸还原酶的基因为SEQ ID No.1第1615-2337位所示的DNA分子；

所述4a-羟基四氢生物蝶呤脱水酶的基因为SEQ ID No.1第1234-1590位所示的DNA分子；

所述天冬氨酸转氨酶家族蛋白的基因为SEQ ID No.1第2362-3831位所示的DNA分子；

所述N-乙酰转移酶的基因为SEQ ID No.1第3856-4404位所示的DNA分子。

4.由权利要求2或3所述的构建方法构建得到的重组大肠杆菌。

5.权利要求1或4所述的重组大肠杆菌在制备N-乙酰-5-羟色胺中的应用。

6.制备N-乙酰-5-羟色胺的方法，其特征在于：包括利用权利要求1或4所述的重组大肠杆菌催化色氨酸反应得到N-乙酰-5-羟色胺。