CN111304141B - 产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用 - Google Patents
产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用 Download PDFInfo
- Publication number
- CN111304141B CN111304141B CN202010185474.3A CN202010185474A CN111304141B CN 111304141 B CN111304141 B CN 111304141B CN 202010185474 A CN202010185474 A CN 202010185474A CN 111304141 B CN111304141 B CN 111304141B
- Authority
- CN
- China
- Prior art keywords
- seq
- gene
- escherichia coli
- protein
- ala
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/10—Nitrogen as only ring hetero atom
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
- C12Y206/01001—Aspartate transaminase (2.6.1.1), i.e. aspartate-aminotransferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/01096—4a-Hydroxytetrahydrobiopterin dehydratase (4.2.1.96)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明公开了产N‑乙酰‑5‑羟色胺的重组大肠杆菌及其构建方法和应用。本发明首先公开了重组大肠杆菌,与受体大肠杆菌相比,其色氨酸衍生物合成相关蛋白的基因的表达量增加和/或所述色氨酸衍生物合成相关蛋白的含量增加和/或所述色氨酸衍生物合成相关蛋白的活性增加;所述色氨酸衍生物合成相关蛋白选自如下至少一种:苯丙氨酸羟化酶、二氢单磷酸还原酶、4a‑羟基四氢生物蝶呤脱水酶、天冬氨酸转氨酶家族蛋白和N‑乙酰转移酶。进一步公开了重组大肠杆菌的构建方法及应用。本发明产N‑乙酰‑5‑羟色胺的重组大肠杆菌N‑乙酰‑5‑羟色胺合成效率显著高于其它现有菌株,对N‑乙酰‑5‑羟色胺的工业化生产和大规模应用具有重大意义。
Description
技术领域
本发明涉及基因工程领域,具体涉及一种产N-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用。
背景技术
N-乙酰-5-羟色胺(N-Acetyl-serotonin,C12H14N2O2)属于色氨酸的衍生物,是褪黑素合成的前体,其合成途径广泛存在于自然界生物中,细胞内经典的合成途径为:色氨酸—5-羟色氨酸—5-羟色胺—N-乙酰-5-羟色胺。N-乙酰-5-羟色胺在生物体内发挥着许多重要作用,作为褪黑素前体,N-乙酰-5-羟色胺也具有良好的抗氧化能力,如可以有效地防护紫外光可能引起的光致癌及DNA损伤,同时N-乙酰-5-羟色胺对脑损伤/中风/神经损伤恢复中发挥重要作用,具有神经保护剂的功能。
目前为止,N-乙酰-5-羟色胺生产是由化学合成完成的,其合成步骤繁琐、得率较低、手性不唯一,不可避免地产生原料浪费和化学污染。随着合成生物学的发展,越来越多的化合物实现了生物绿色生产,通过推测化合物在原宿主中的可能合成路线,鉴定出涉及的基因,解析出目标化合物的合成途径,在生产菌株中通过分子生物学技术引入相关基因重现合成途径,从廉价的原料如葡萄糖催化出高附加值的目标产物。虽然,色氨酸衍生物的合成途径解析的非常清楚,但其中涉及的蛋白本身比活较低,多数难以在现有的成熟表达系统中表达,基本形成包涵体或表达量极低,因此,目前为止还有没有高产N-乙酰-5-羟色胺的工程菌株。
发明内容
本发明所要解决的技术问题为提供N-乙酰-5-羟色胺高产菌株,以实现发酵法高效大规模工业化生产N-乙酰-5-羟色胺。
为解决上述技术问题,本发明首先提供了一种重组大肠杆菌。
本发明所述重组大肠杆菌与受体大肠杆菌相比,所述重组大肠杆菌中色氨酸衍生物合成相关蛋白的基因的表达量增加和/或所述色氨酸衍生物合成相关蛋白的含量增加和/或所述色氨酸衍生物合成相关蛋白的活性增加;
所述色氨酸衍生物合成相关蛋白选自如下至少一种:
P1)苯丙氨酸羟化酶;
P2)二氢单磷酸还原酶(folM);
P3)4a-羟基四氢生物蝶呤脱水酶(phhB);
P4)天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein);
P5)N-乙酰转移酶(N-acetyltransferase)。
上述重组大肠杆菌中,所述苯丙氨酸羟化酶(记为X)来自野油菜黄单胞菌(Xanthomonas campestris pv.campestris str.ATCC 33913)、二氢单磷酸还原酶(folM,记为M)来自大肠杆菌(Escherichia coli str.K-12substr.MG1655)、4a-羟基四氢生物蝶呤脱水酶(phhB,记为P)来自铜绿假单胞菌(Pseudomonas aeruginosa PAO1)、天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein,NCBI ReferenceSequence:WP_103377132.1,记为H)和N-乙酰转移酶(N-acetyltransferase,NCBIReference Sequenc WP_020929557.1,记为F)来自小白链霉菌(Streptomyces albulus)。
上述重组大肠杆菌中,所述受体大肠杆菌可为大肠杆菌K12;具体为大肠杆菌K12菌株BW25113。
在本发明具体的实施方式中,所述苯丙氨酸羟化酶可为如下A1)或A2)所示的蛋白质:
A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质;
A2)将A1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述二氢单磷酸还原酶可为如下A3)或A4)所示的蛋白质:
A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质;
A4)将A3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶可为如下A5)或A6)所示的蛋白质:
A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质;
A6)将A5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述天冬氨酸转氨酶家族蛋白可为如下A7)或A8)所示的蛋白质:
A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质;
A8)将A7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述N-乙酰转移酶可为如下A9)或A10)所示的蛋白质:
A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质;
A10)将A9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。
其中,SEQ ID No.1第319-1209位由891个核苷酸组成,第319-1209位为编码序列,编码SEQ ID No.6所示的苯丙氨酸羟化酶。
SEQ ID No.1第1615-2337位由723个核苷酸组成,第1615-2337位为编码序列,编码SEQ ID No.7所示的二氢单磷酸还原酶。
SEQ ID No.1第1234-1590位由357个核苷酸组成,第1234-1590位为编码序列,编码SEQ ID No.8所示的4a-羟基四氢生物蝶呤脱水酶。
SEQ ID No.1第2362-3831位由1470个核苷酸组成,第2362-3831位为编码序列,编码SEQ ID No.9所示的天冬氨酸转氨酶家族蛋白。
SEQ ID No.1第3856-4404位由549个核苷酸组成,第3856-4404位为编码序列,编码SEQ ID No.10所示的N-乙酰转移酶。
上述重组大肠杆菌中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述重组大肠杆菌中,所述90%以上的同一性可为至少91%、92%、95%、96%、98%、99%或100%的同一性。
上述重组大肠杆菌中,所述苯丙氨酸羟化酶的基因可为如下B1)或B2)所示:
B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子;
B2)将SEQ ID No.1第319-1209位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第319-1209位所示的DNA分子具有相同功能的DNA分子;
所述二氢单磷酸还原酶的基因可为如下B3)或B4)所示:
B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子;
B4)将SEQ ID No.1第1615-2337位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1615-2337位所示的DNA分子具有相同功能的DNA分子;
所述4a-羟基四氢生物蝶呤脱水酶的基因可为如下B5)或B6)所示:
B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子;
B6)将SEQ ID No.1第1234-1590位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1234-1590位所示的DNA分子具有相同功能的DNA分子;
所述天冬氨酸转氨酶家族蛋白的基因可为如下B7)或B8)所示:
B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子;
B8)将SEQ ID No.1第2362-3831位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第2362-3831位所示的DNA分子具有相同功能的DNA分子;
所述N-乙酰转移酶的基因可为如下B9)或B10)所示:
B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子;
B10)将SEQ ID No.1第3856-4404位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第3856-4404位所示的DNA分子具有相同功能的DNA分子。
本发明进一步提供了重组大肠杆菌的构建方法。
本发明重组大肠杆菌的构建方法,包括如下步骤:将色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌,得到重组大肠杆菌;
所述色氨酸衍生物合成相关蛋白的基因选自如下至少一种:
P1)苯丙氨酸羟化酶基因;
P2)二氢单磷酸还原酶(folM)基因;
P3)4a-羟基四氢生物蝶呤脱水酶(phhB)基因;
P4)天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein)基因;
P5)N-乙酰转移酶(N-acetyltransferase)基因。
上述重组大肠杆菌中,所述苯丙氨酸羟化酶(记为X)来自野油菜黄单胞菌(Xanthomonascampestris pv.campestris str.ATCC 33913)、二氢单磷酸还原酶(folM,记为M)来自大肠杆菌(Escherichia coli str.K-12substr.MG1655)、4a-羟基四氢生物蝶呤脱水酶(phhB,记为P)来自铜绿假单胞菌(Pseudomonas aeruginosa PAO1)、天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein,NCBI Reference Sequence:WP_103377132.1,记为H)和N-乙酰转移酶(N-acetyltransferase,NCBI ReferenceSequenc WP_020929557.1,记为F)来自小白链霉菌(Streptomyces albulus)。
上述构建方法中,所述色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌是对所述受体大肠杆菌基因组进行下述M1)-M5)全部、任四种、任三种、任两种或任一种的改造得到的:
M1)过表达苯丙氨酸羟化酶基因;
M2)过表达二氢单磷酸还原酶(folM)基因;
M3)过表达4a-羟基四氢生物蝶呤脱水酶(phhB)基因;
M4)过表达天冬氨酸转氨酶家族蛋白(aspartate aminotransferase familyprotein)基因;
M5)过表达N-乙酰转移酶(N-acetyltransferase)基因。
在本发明具体的实施方式中,所述色氨酸衍生物合成相关蛋白的基因通过方式甲或方式乙或方式丙导入所述受体大肠杆菌中;
所述方式甲为所述苯丙氨酸羟化酶(记为X)的基因构建在一个表达载体上,所述天冬氨酸转氨酶家族蛋白(记为H)、N-乙酰转移酶(记为F)、4a-羟基四氢生物蝶呤脱水酶(记为P)和二氢单磷酸还原酶(记为M)的基因构建在另一个表达载体上,所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白(记为H)、N-乙酰转移酶(记为F)、4a-羟基四氢生物蝶呤脱水酶(记为P)和二氢单磷酸还原酶(记为M)的基因依次连接(即天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶基因的上游、N-乙酰转移酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游),然后均导入到受体大肠杆菌中;
所述方式乙为所述苯丙氨酸羟化酶(记为X)、4a-羟基四氢生物蝶呤脱水酶(记为P)和二氢单磷酸还原酶(记为M)的基因构建在一个表达载体上,所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为M)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶基因位于二氢单磷酸还原酶基因的上游);所述天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)构建在同一个表达载体上,然后均导入到受体大肠杆菌中;
所述方式丙为所述苯丙氨酸羟化酶(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为M)、天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)构建在一个表达载体上,所述表达载体中苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为M)、天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游,4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游,二氢单磷酸还原酶基因位于天冬氨酸转氨酶家族蛋白基因的上游,天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶的上游),然后导入到受体大肠杆菌中。
在本发明具体的实施方式中,所述方式甲为利用无缝拼接方法将苯丙氨酸羟化酶的基因(记为X)构建到载体pBAD中得到重组载体pBAD-X(SEQ ID NO.4所示),利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为M)的连接顺序构建到载体pZH中得到重组载体pZH-HFPM(SEQ ID NO.5所示),然后将pBAD-X和pZH-HFPM导入到受体大肠杆菌中;
所述方式乙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为M)的连接顺序构建到载体pBAD中得到重组载体pBAD-XPM(SEQ ID NO.2所示),利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)的基因的连接顺序构建到载体pZH中得到重组载体pZH-HF(SEQ ID NO.3所示),然后将重组载体pBAD-XPM和pZH-HF导入到受体大肠杆菌中;
所述方式丙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为M)、天冬氨酸转氨酶家族蛋白基因(记为H)和N-乙酰转移酶基因(记为F)的连接顺序构建重组载体pBAD-XPMHF(SEQ IDNO.1所示),然后将重组载体pBAD-XPMHF导入到受体大肠杆菌中。
上述构建方法中,所述受体大肠杆菌可为大肠杆菌K12;具体为大肠杆菌K12菌株BW25113。
上述构建方法中,所述苯丙氨酸羟化酶可为如下A1)或A2)所示的蛋白质:
A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质;
A2)将A1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述二氢单磷酸还原酶可为如下A3)或A4)所示的蛋白质:
A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质;
A4)将A3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶可为如下A5)或A6)所示的蛋白质:
A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质;
A6)将A5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述天冬氨酸转氨酶家族蛋白可为如下A7)或A8)所示的蛋白质:
A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质;
A8)将A7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述N-乙酰转移酶可为如下A9)或A10)所示的蛋白质:
A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质;
A10)将A9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。
其中,SEQ ID No.1第319-1209位由891个核苷酸组成,第319-1209位为编码序列,编码SEQ ID No.6所示的苯丙氨酸羟化酶。
SEQ ID No.1第1615-2337位由723个核苷酸组成,第1615-2337位为编码序列,编码SEQ ID No.7所示的二氢单磷酸还原酶。
SEQ ID No.1第1234-1590位由357个核苷酸组成,第1234-1590位为编码序列,编码SEQ ID No.8所示的4a-羟基四氢生物蝶呤脱水酶。
SEQ ID No.1第2362-3831位由1470个核苷酸组成,第2362-3831位为编码序列,编码SEQ ID No.9所示的天冬氨酸转氨酶家族蛋白。
SEQ ID No.1第3856-4404位由549个核苷酸组成,第3856-4404位为编码序列,编码SEQ ID No.10所示的N-乙酰转移酶。
上述方法中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述方法中,所述90%以上的同一性可为至少91%、92%、95%、96%、98%、99%或100%的同一性。
上述方法中,所述苯丙氨酸羟化酶的基因可为如下B1)或B2)所示:
B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子;
B2)将SEQ ID No.1第319-1209位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第319-1209位所示的DNA分子具有相同功能的DNA分子;
所述二氢单磷酸还原酶的基因可为如下B3)或B4)所示:
B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子;
B4)将SEQ ID No.1第1615-2337位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1615-2337位所示的DNA分子具有相同功能的DNA分子;
所述4a-羟基四氢生物蝶呤脱水酶的基因可为如下B5)或B6)所示:
B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子;
B6)将SEQ ID No.1第1234-1590位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1234-1590位所示的DNA分子具有相同功能的DNA分子;
所述天冬氨酸转氨酶家族蛋白的基因可为如下B7)或B8)所示:
B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子;
B8)将SEQ ID No.1第2362-3831位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第2362-3831位所示的DNA分子具有相同功能的DNA分子;
所述N-乙酰转移酶的基因可为如下B9)或B10)所示:
B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子;
B10)将SEQ ID No.1第3856-4404位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第3856-4404位所示的DNA分子具有相同功能的DNA分子。
上述构建方法得到的重组大肠杆菌及其在制备N-乙酰-5-羟色胺的应用也在本发明的保护范围之内。
本发明进一步公开了一种制备N-乙酰-5-羟色胺的方法。
本发明制备N-乙酰-5-羟色胺的方法,包括:利用上述重组大肠杆菌催化色氨酸反应得到N-乙酰-5-羟色胺。
具体的,所述重组大肠杆菌经阿拉伯糖诱导培养后催化色氨酸反应得到N-乙酰-5-羟色胺。
上述方法中,所述阿拉伯糖为L-阿拉伯糖。
本发明通过在大肠杆菌中过表达色氨酸衍生物合成相关蛋白的基因,构建了能高效合成N-乙酰-5-羟色胺的重组大肠杆菌,开发了一套高效合成N-乙酰-5-羟色胺的方法。本发明的产N-乙酰-5-羟色胺的重组大肠杆菌菌株,单位菌体的N-乙酰-5-羟色胺合成效率显著高于其它现有菌株,且绝大部分产物分泌至胞外,便于产物的下游纯化分离。因此本发明对N-乙酰-5-羟色胺的工业化生产和大规模应用具有重大意义。
附图说明
图1为SDS-PAGE分析色氨酸衍生物合成相关蛋白的基因在大肠杆菌中的表达。
图2为三株重组大肠杆菌摇瓶试验中N-乙酰-5-羟色胺合成水平的分析。
图3为两株重组大肠杆菌发酵罐试验中N-乙酰-5-羟色胺合成水平的分析。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中用到的材料来源如下:
pBAD/HisA购自invitrogen,产品目录号为V430-01;
pZH是在pBAD/HisA基础上改变复制起始位点和抗性为氯霉素得到。
实施例1、N-乙酰-5-羟色胺高产的重组大肠杆菌菌株的构建
1、PCR扩增色氨酸衍生物合成相关蛋白的编码序列
以合成的来源于野油菜黄单胞菌的苯丙氨酸羟化酶基因(SEQ ID NO.1第319-1209位所示)为模板,用引物F1和R1进行PCR扩增,得到包含苯丙氨酸羟化酶基因的PCR扩增产物X(SEQ ID NO.1第299-1232位所示)。
以合成的来源于铜绿假单胞菌的4a-羟基四氢生物蝶呤脱水酶基因phhB(SEQ IDNO.1第1234-1590位所示)为模板用引物F3和R3进行PCR扩增,得到包含4a-羟基四氢生物蝶呤脱水酶基因phhB的PCR扩增产物P(SEQ ID NO.1第1210-1614位所示)。
以合成的来源于大肠杆菌的二氢单磷酸还原酶(folM)基因(SEQ ID NO.1第1615-2337位所示)为模板,用引物F2和R2进行PCR扩增,得到包含二氢单磷酸还原酶(folM)基因的PCR扩增产物M(SEQ ID NO.1第1592-2337位所示)。
以合成的来源于小白链霉菌的天冬氨酸转氨酶家族蛋白(aspartateaminotransferase family protein)基因(SEQ ID NO.1第2362-3831位所示)为模板用引物F4和R4进行PCR扩增,得到包含天冬氨酸转氨酶家族蛋白(aspartate aminotransferasefamily protein)的PCR扩增产物H(SEQ ID NO.1第2362-3831位所示)。
以合成的来源于小白链霉菌的N-乙酰转移酶(N-acetyltransferase)基因(SEQID NO.1第3856-4404位所示)为模板用引物F5和R5进行PCR扩增,得到包含N-乙酰转移酶(N-acetyltransferase)基因的PCR扩增产物F(SEQ ID NO.1第3814-4404位所示)。
具体引物序列如下:
F1:gctaacaggaggaattaaccATGAACACAGCGCCGCGCCGC
R1:TATATCTCCTTCTTAAAGTTAAATTACACGTCGCCGTCGCGGCTC
F2:TTAACTTTAAGAAGGAGATATACatgggtaaaacccagccctt
R2:ttaacgcagatgacgaccgc
F3:TTTAAGAAGGAGATATACatgaccgcactcacccaagc
R3:GTATATCTCCTTCTTAAAGTTAAATTatttgcgcccctcggcgg
F4:Atgaagcccgctgacgcg
R4:ctactcgggcagcgcatcagc
F5:gatgcgctgcccgagtagTTTAACTTTAAGAAGGAGATATAcatgaacaccttccggacc
R5:tcagtcgcagtggtcatggatcg
2、无缝拼接
以pBAD/HisA为载体,利用无缝拼接方法按照X、P、M、H、F的连接顺序构建重组载体pBAD-XPMHF(SEQ ID NO.1所示),并命名为NAS-1;
以pBAD为载体,利用无缝拼接方法按照X、P、M的连接顺序构建重组载体pBAD-XPM(SEQ ID NO.2所示),以pZH为载体,利用无缝拼接方法按照H、F的连接顺序构建重组载体pZH-HF(SEQ ID NO.3所示),并将pBAD-XPM和pZH-HF命名为NAS-2;
以pBAD为载体,利用无缝拼接方法构建载体pBAD-X(SEQ ID NO.4所示),以pZH为载体,利用无缝拼接方法按照H、F、P、M的连接顺序构建重组载体pZH-HFPM(SEQ ID NO.5所示),并将pBAD-X和pZH-HFPM命名为NAS-3。
3、转化、筛选以及序列验证
用氯化钙化学转化法将重组载体pBAD-XPMHF、pBAD-XPM、pZH-HF、pBAD-X、pZH-HFPM分别转化至大肠杆菌DH5α,用含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基进行筛选培养,挑取单菌落,并进行扩大培养,获得重组菌并提取质粒,进行测序验证,结果获得的序列如SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4和SEQ ID NO.5所示,证明构建的重组质粒及重组菌正确。将阳性克隆的重组菌记作DH5α-pBAD-XPMHF,DH5α-pBAD-XPM,DH5α-pZH-HF,DH5α-pBAD-X,DH5α-pZH-HFPM,阳性质粒记作pBAD-XPMHF,pBAD-XPM,pZH-HF,pBAD-X,pZH-HFPM。
4、重组表达菌株的构建
用氯化钙化学转化法将重组质粒pBAD-XPMHF、pBAD-XPM和pZH-HF、pBAD-XC和pZH-HFPM分别转化至大肠杆菌K-12系列表达菌株BW25113(购买自北京江晨文轩生物科技有限责任公司,货号:G6058,rrnB3ΔlacZ4787 hsdR514Δ(araBAD)567Δ(rhaBAD)568rph-1),用含有氨苄青霉素(100μg/ml)和或含氯霉素(34ug/ml)的LB培养基进行筛选培养,挑取单菌落,获得重组大肠杆菌菌株BW-pBAD-XPMHF(命名为BW-pBAD-NAS1)、BW-pBAD-XPM/pZH-HF(命名为BW-pBAD-NAS2)、BW-pBAD-X/pZH-HFPM(命名为BW-pBAD-NAS3)。
5、蛋白表达
以BW-pBAD-NAS3为例:
挑取BW-pBAD-NAS3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中,于37℃过夜培养,得到过夜培养物;将过夜培养物接种于100ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基,37℃剧烈振荡(200rpm)培养,至发酵液的OD600值达到0.6-0.8左右,向发酵体系中加入L-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。
发酵完毕后,5000rpm离心15分钟,收集菌体;用pH7.0的PBS缓冲液重悬菌体,超声波破碎后12,000rpm离心15min。收集上清液,即为含有目的蛋白的粗酶液,SDS-PAGE检测蛋白表达情况,结果如图1中A所示,表明BW-pBAD-NAS3中5种蛋白在大肠杆菌生产菌株内得到良好表达。
利用上述方法,分别对BW-pBAD-NAS1和BW-pBAD-NAS2进行实验,SDS-PAGE检测蛋白表达情况,如图1中B所示BW-pBAD-NAS1中N-乙酰转移酶没有表达,图1中C所示BW-pBAD-NAS2中5种蛋白均获得表达,对比BW-pBAD-NAS3其二氢单磷酸还原酶和4a-羟基四氢生物蝶呤脱水酶表达量较高,天冬氨酸转氨酶家族蛋白和N-乙酰转移酶表达量较低。
6、N-乙酰-5-羟色胺的生物转化摇瓶试验
以BW-pBAD-NAS3为例进行摇瓶试验:
挑取BW-pBAD-NAS3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中,于37℃过夜培养,得到过夜培养物;将过夜培养物接种于500ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基,37℃剧烈振荡(200rpm)培养,至发酵液的OD600值达到0.6-0.8左右,再向发酵体系中加入L-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。5000rpm离心15分钟,收集菌体。
离心后菌体加入转化液重悬菌体至OD600值达到10,取25ml重悬菌液于250ml三角瓶中,30℃振荡(100rpm)反应96小时,分别检测24h、48h、72h和96h的N-乙酰-5-羟色胺的产量。
其中,转化液的成分:10g/L葡萄糖,6g/L Na2HPO4,0.5g/L NaCl,3g/L KH2PO4,1g/L NH4Cl,246.5mg/L MgSO4·7H2O,14.7mg/L CaCl2·2H2O,27.8mg/L FeSO4·7H2O,2g/Lyeast extract(酵母提取物);1%甘油;1g/L tryptophan(色氨酸)。
利用上述方法,分别对BW-pBAD-NAS1和BW-pBAD-NAS2进行实验,分别检测24h、48h、72h和96h的N-乙酰-5-羟色胺的产量。
结果如图2所示,结果显示三株重组大肠杆菌菌株N-乙酰-5-羟色胺的产量具有显著的差异,其中,BW-pBAD-NAS3(即BW-pBAD-X/pZH-HFPM,图中以“菌株3”表示)的产量最高,在72h便将底物1.0g/L色氨酸全部消耗殆尽,产生了519mg/L的N-乙酰5-羟色胺,BW-pBAD-NAS2(即BW-pBAD-XPM/pZH-HF,图中以“菌株2”表示)次之,BW-pBAD-NAS1(即BW-pBAD-XHFPM,图中以“菌株1”表示)产量最低。
7、N-乙酰-5-羟色胺的生物转化发酵罐试验
以摇瓶试验N-乙酰-5-羟色胺产量最高的BW-pBAD-NAS3菌株和较高的BW-pBAD-NAS2做上罐发酵:
以BW-pBAD-NAS3为例进行发酵罐试验:
1)种子液制备:挑取所述重组大肠杆菌BW-pBAD-NAS3单菌落接入20ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中,于37℃、200rpm培养12小时;然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的种子培养基中,37℃、200rpm振荡培养12小时,即得种子液;
其中,所述种子培养基的配制:蛋白胨16g,酵母膏10g,氯化钠5g,用水定容至1L,pH7.0。
2)菌体培养:以10%的接种量将种子液接种到1L含氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的发酵罐的发酵培养基中,发酵采用2.5L的发酵罐,培养过程中控制温度为37℃,通过搅拌速度(500-800转/分钟)和通气量(3L/min)控制菌体培养体系的溶氧在20%以上,通过流加1M磷酸和3M氨水维持pH值稳定在6.8-7.2,培养至葡萄糖消耗完时流加补料培养基,补料培养基的流加速度为50mL/h,流加至菌体密度OD600达到20,菌体培养过程结束,得到菌体培养后的发酵液,进入诱导培养阶段;
其中,每1L发酵培养基的配制:葡萄糖10g,(NH4)2HPO4 8g,KH2PO4 13.3g,MgSO4·7H2O 1.2g,柠檬酸1.7g,微量盐溶液10mL,用水定溶至1L,5M NaOH调至pH7.0;
每1L补料培养基的配制:葡萄糖400g,MgSO4·7H2O 10g,微量盐溶液20mL,用水定容至1L;
每1L微量盐溶液的配制:FeSO4·7H2O 10g,ZnSO4·7H2O 2.25g,CuSO4·5H2O 1g,MnSO4·5H2O0.5g,Na2B4O7·10H2O 0.23g,CaCl2·2H2O 2g,(NH4)6Mo7O24 0.1g,用5M盐酸水溶液定容,定容至1L。
3)诱导培养:将上述菌体培养后的发酵液的温度降至30℃,加入L-阿拉伯糖,使得L-阿拉伯糖终浓度为1g/L,进行诱导培养,同时加入色氨酸终浓度为4g/L,甘油终浓度为体积占比5%;诱导培养过程中要一直流加补料培养基,补料培养基的流加速度调至20mL/h;流加至菌体密度OD600达到40,诱导培养过程结束,得到转化液;
所述诱导培养的条件为:培养温度为30℃,控制诱导培养体系的溶氧在20%以上和维持pH至7.0。
4)HPLC检测:上述转化液5000rpm离心15min吸取上清液,按照上清液:水:甲醇体积比1:7.5:1.5制成待检测样品,0.22um有机型滤器过滤除去不溶物后每隔5-8小时HPLC检测N-乙酰-5-羟色胺浓度。HPLC检测仪为Agilent 1260Infinity LC,检测柱为AgilentZOBAX C18柱。N-乙酰-5-羟色胺的紫外检测波长为275nm,流动相15%(V/V)甲醇,流速为1.0mL/min,进样量为10uL,采用外标法按峰面积定量。SIGMA生产N-乙酰-5-羟色胺标准品作为定量标准。
利用上述方法,对BW-pBAD-NAS2进行实验,每隔5-8小时HPLC检测N-乙酰-5-羟色胺浓度。
结果如图3所示,结果显示:结果显示两株重组大肠杆菌菌株发酵罐中N-乙酰-5-羟色胺的浓度具有显著的差异,其中,BW-pBAD-NAS3(即BW-pBAD-X/pZH-HFPM,图中以“菌株3”表示)的产量明显高于BW-pBAD-NAS2(即BW-pBAD-XPM/pZH-HF,图中以“菌株2”表示),BW-pBAD-NAS3最终发酵64h N-乙酰5-羟色胺的产量达到2.7g/L。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
SEQUENCE LISTING
<110> 中国科学院微生物研究所
<120> 产N-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用
<130> GNCFY200075
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 8042
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360
aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420
gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480
cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540
ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600
gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660
gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720
catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780
gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840
acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900
atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960
gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020
agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080
ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140
gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200
gacgtgtaat ttaactttaa gaaggagata tacatgaccg cactcaccca agcccattgc 1260
gaagcctgcc gcgcagacgc cccgcacgtc agcgacgaag aactgcccgt gctgctgcgg 1320
caaatcccgg attggaacat cgaagtccgc gacggcatca tgcagctaga gaaggtctac 1380
ctgttcaaga acttcaagca tgccctggcc ttcaccaatg ccgtcggcga gatatccgag 1440
gccgaaggcc accatccggg cctgctgacc gagtggggca aagtcaccgt gacctggtgg 1500
agccactcga tcaagggcct gcaccgcaac gatttcatca tggcggcgcg caccgatgag 1560
gtagcgaaaa ccgccgaggg gcgcaaataa tttaacttta agaaggagat atacatgggt 1620
aaaacccagc ccttgccaat attaattact ggcggaggtc gtcgcatcgg cctcgccctc 1680
gcatggcatt tcattaatca aaagcaaccg gtgattgtca gctatcggac acactatcca 1740
gccattgatg gactgattaa tgcaggtgcg cagtgtattc aggctgattt ttcgaccaac 1800
gacggtgtga tggcgtttgc cgatgaagta ctaaaaagca cccatggtct gcgtgctatt 1860
ttgcataacg ccagtgcgtg gatggcggaa aaaccgggtg cgccactggc cgacgtactg 1920
gcttgcatga tgcagatcca cgttaatacc ccatacctgc tcaaccatgc gctggaaaga 1980
ttactgcgtg ggcacggaca cgccgccagc gatatcattc actttaccga ttatgtggtg 2040
gagcgcggta gcgacaaaca tattgcgtat gctgcaagca aagcggcact ggataatatg 2100
acccgctcgt ttgcccgcaa gctggcaccg gaagtgaaag tgaattctat tgcgccatcg 2160
ctgatcctgt ttaatgaaca tgatgatgcc gaatatcgac aacaggcgct gaataaatca 2220
ctgatgaaaa ccgcgcctgg cgagaaagaa gtgatcgacc tggtcgatta cttacttacc 2280
agttgctttg tcaccggacg cagtttccca cttgatggcg gtcgtcatct gcgttaattt 2340
aactttaaga aggagatata catgaagccc gctgacgcga aaccgcccca catggaccac 2400
gacaccttcc gctccctggg ccatcaggcc atcgactgga tcgccgacta ctggcagcgt 2460
ttggcggagc gacccgtcgc tccccccgtc gaacccggca gcatccgcgc ccagttaccg 2520
acggccccac ccgagtgcgg cgaggacttt cccgtactgc tgtccgacct cgaacggatc 2580
gtgctgccgg gcctgctgca ctggcagcac ccccgtttct tcggttactt ccccgcgaac 2640
gcttccggcc ccgccgtcct ggccgagctg ttgtccgcgg gcctgggcat ccaggggatg 2700
aactggaaca ccagcccggc ctgcaccgag atcgaacagc agatgctgga ctggttcgtg 2760
cacctgctcg gcctacccga gcacctccgc ggtgggggag tcatccagga caccgcctcc 2820
agcgccctcc tggtggcact gctcaccgcc ctgcaccagg ccagtgcggg ccgcacccgc 2880
gaccacggca ccggcgagtg cggctaccgg gtgtacctga ccgccgagac gcactcggcg 2940
gcccgcaagg ccgccgtcat caccggactg ggcctgcggg ccatgtgcga ggtggccacc 3000
gacgccgacg gcgccatgga cgcagtcgat ctggaaagac acctccgggc cgaccgggcc 3060
gcaggtctga ccccgctgat ggtcgtggcc acccgaggca ccacctccca tctctccttc 3120
gaccccctgg aggacatcgg ccccgtgtgt cgtcggcacg gcgtgtggct ccacgtcgac 3180
gccgcatacg ccggagtggc cgcggtctgc gacgaactgc gctgggtcaa cgacggcgtg 3240
cgctacgcgg actcctactg caccaacccg cacaagtggc tgctgaccaa cttcgactgc 3300
gacctgctgt gggtggccca ccccgaagtc ctcgtcagcg ccctgagcgt gctccccgaa 3360
tacctgcgca actcggcctc cgaatcgggc cgggtgaccg actaccggca ctggcaggtc 3420
ccactgggcc ggcgcttccg cgcactgaaa ctgtggtccg tcctccactg gtacggcgcc 3480
gaggggctgc gcgcccacat ccgcaccggc gttcggcatg cccagctctt cgcggacctg 3540
gtcggcgccg acgaccgctt caccctggtc acccctcccg ccctcggcct ggtgacgttc 3600
cgtcagaccg gaacggacga ggagaaccgg aacctcctgc aagccatcaa caccgaggga 3660
accaccttcc tcacccactc cgagaagaac ggcaccttct tcctgcgctt cgccgccggc 3720
ggcaccctca ccgaggacca ccacgtacgc gaagcatggc gcgccgtcca gaacgcgatc 3780
cctcgcgcac aacacctcgc cggcggctcg gctgatgcgc tgcccgagta gtttaacttt 3840
aagaaggaga tatacatgaa caccttccgg accgcgacgg cacgcgatct ccccgatgtc 3900
gccgccacct tgaccgaggc gttcgccgcc gacccgccga cccaatgggt cttcccggac 3960
ggtgccgctg cggtctcccg tttcttcttc ggtgtcgccg accgtgcccg cgaggccggc 4020
gggatcgtcg aactactccc cggcaccgcc gcgatgatcg ccctaccccc gcacgtacga 4080
ctacccgacg ccccagcctg cggccgacag gccgagatgc agcgcaggct gggcgaacgc 4140
cgcccccgca ctccgcacta ctacctcctc ttctacggcg tgcgcaccgc ccatcagagc 4200
tccggcctgg ggggacggat gctctccgac ctcatctccc tggccgaccg cgaccgcgtg 4260
ggcacctaca ccgaggccag cacctggcgc ggcgcccgcc tgatgttgcg tcacggcttc 4320
cacaccgcac agccgctgcg gcttccccac gggccaccca tgttccccct ctggagagac 4380
ccgatccatg accactgcga ctgaaagctt ggctgttttg gcggatgaga gaagattttc 4440
agcctgatac agattaaatc agaacgcaga agcggtctga taaaacagaa tttgcctggc 4500
ggcagtagcg cggtggtccc acctgacccc atgccgaact cagaagtgaa acgccgtagc 4560
gccgatggta gtgtggggtc tccccatgcg agagtaggga actgccaggc atcaaataaa 4620
acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc 4680
tctcctgagt aggacaaatc cgccgggagc ggatttgaac gttgcgaagc aacggcccgg 4740
agggtggcgg gcaggacgcc cgccataaac tgccaggcat caaattaagc agaaggccat 4800
cctgacggat ggcctttttg cgtttctaca aactcttttg tttatttttc taaatacatt 4860
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 4920
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 4980
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 5040
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 5100
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 5160
tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 5220
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 5280
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 5340
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 5400
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 5460
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 5520
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 5580
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 5640
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 5700
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 5760
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 5820
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 5880
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 5940
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 6000
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 6060
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 6120
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 6180
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 6240
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 6300
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 6360
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 6420
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 6480
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 6540
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 6600
ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 6660
agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 6720
aagcggaaga gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc 6780
gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc cagtatacac 6840
tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa cacccgctga 6900
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 6960
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga ggcagcagat 7020
caattcgcgc gcgaaggcga agcggcatgc ataatgtgcc tgtcaaatgg acgaagcagg 7080
gattctgcaa accctatgct actccgtcaa gccgtcaatt gtctgattcg ttaccaatta 7140
tgacaacttg acggctacat cattcacttt ttcttcacaa ccggcacgga actcgctcgg 7200
gctggccccg gtgcattttt taaatacccg cgagaaatag agttgatcgt caaaaccaac 7260
attgcgaccg acggtggcga taggcatccg ggtggtgctc aaaagcagct tcgcctggct 7320
gatacgttgg tcctcgcgcc agcttaagac gctaatccct aactgctggc ggaaaagatg 7380
tgacagacgc gacggcgaca agcaaacatg ctgtgcgacg ctggcgatat caaaattgct 7440
gtctgccagg tgatcgctga tgtactgaca agcctcgcgt acccgattat ccatcggtgg 7500
atggagcgac tcgttaatcg cttccatgcg ccgcagtaac aattgctcaa gcagatttat 7560
cgccagcagc tccgaatagc gcccttcccc ttgcccggcg ttaatgattt gcccaaacag 7620
gtcgctgaaa tgcggctggt gcgcttcatc cgggcgaaag aaccccgtat tggcaaatat 7680
tgacggccag ttaagccatt catgccagta ggcgcgcgga cgaaagtaaa cccactggtg 7740
ataccattcg cgagcctccg gatgacgacc gtagtgatga atctctcctg gcgggaacag 7800
caaaatatca cccggtcggc aaacaaattc tcgtccctga tttttcacca ccccctgacc 7860
gcgaatggtg agattgagaa tataaccttt cattcccagc ggtcggtcga taaaaaaatc 7920
gagataaccg ttggcctcaa tcggcgttaa acccgccacc agatgggcat taaacgagta 7980
tcccggcagc aggggatcat tttgcgcttc agccatactt ttcatactcc cgccattcag 8040
ag 8042
<210> 2
<211> 5975
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360
aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420
gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480
cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540
ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600
gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660
gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720
catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780
gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840
acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900
atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960
gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020
agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080
ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140
gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200
gacgtgtaat ttaactttaa gaaggagata tacatgaccg cactcaccca agcccattgc 1260
gaagcctgcc gcgcagacgc cccgcacgtc agcgacgaag aactgcccgt gctgctgcgg 1320
caaatcccgg attggaacat cgaagtccgc gacggcatca tgcagctaga gaaggtctac 1380
ctgttcaaga acttcaagca tgccctggcc ttcaccaatg ccgtcggcga gatatccgag 1440
gccgaaggcc accatccggg cctgctgacc gagtggggca aagtcaccgt gacctggtgg 1500
agccactcga tcaagggcct gcaccgcaac gatttcatca tggcggcgcg caccgatgag 1560
gtagcgaaaa ccgccgaggg gcgcaaataa tttaacttta agaaggagat atacatgggt 1620
aaaacccagc ccttgccaat attaattact ggcggaggtc gtcgcatcgg cctcgccctc 1680
gcatggcatt tcattaatca aaagcaaccg gtgattgtca gctatcggac acactatcca 1740
gccattgatg gactgattaa tgcaggtgcg cagtgtattc aggctgattt ttcgaccaac 1800
gacggtgtga tggcgtttgc cgatgaagta ctaaaaagca cccatggtct gcgtgctatt 1860
ttgcataacg ccagtgcgtg gatggcggaa aaaccgggtg cgccactggc cgacgtactg 1920
gcttgcatga tgcagatcca cgttaatacc ccatacctgc tcaaccatgc gctggaaaga 1980
ttactgcgtg ggcacggaca cgccgccagc gatatcattc actttaccga ttatgtggtg 2040
gagcgcggta gcgacaaaca tattgcgtat gctgcaagca aagcggcact ggataatatg 2100
acccgctcgt ttgcccgcaa gctggcaccg gaagtgaaag tgaattctat tgcgccatcg 2160
ctgatcctgt ttaatgaaca tgatgatgcc gaatatcgac aacaggcgct gaataaatca 2220
ctgatgaaaa ccgcgcctgg cgagaaagaa gtgatcgacc tggtcgatta cttacttacc 2280
agttgctttg tcaccggacg cagtttccca cttgatggcg gtcgtcatct gcgttaaaag 2340
cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa atcagaacgc 2400
agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt cccacctgac 2460
cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat 2520
gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 2580
ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccggg 2640
agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac gcccgccata 2700
aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct 2760
acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 2820
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 2880
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 2940
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 3000
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 3060
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac gccgggcaag 3120
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 3180
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 3240
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 3300
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 3360
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 3420
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 3480
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 3540
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 3600
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 3660
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 3720
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 3780
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 3840
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 3900
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 3960
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 4020
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 4080
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 4140
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 4200
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 4260
aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg 4320
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 4380
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 4440
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 4500
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 4560
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 4620
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt 4680
ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 4740
gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat 4800
ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 4860
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 4920
accgtcatca ccgaaacgcg cgaggcagca gatcaattcg cgcgcgaagg cgaagcggca 4980
tgcataatgt gcctgtcaaa tggacgaagc agggattctg caaaccctat gctactccgt 5040
caagccgtca attgtctgat tcgttaccaa ttatgacaac ttgacggcta catcattcac 5100
tttttcttca caaccggcac ggaactcgct cgggctggcc ccggtgcatt ttttaaatac 5160
ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga ccgacggtgg cgataggcat 5220
ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt tggtcctcgc gccagcttaa 5280
gacgctaatc cctaactgct ggcggaaaag atgtgacaga cgcgacggcg acaagcaaac 5340
atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc aggtgatcgc tgatgtactg 5400
acaagcctcg cgtacccgat tatccatcgg tggatggagc gactcgttaa tcgcttccat 5460
gcgccgcagt aacaattgct caagcagatt tatcgccagc agctccgaat agcgcccttc 5520
cccttgcccg gcgttaatga tttgcccaaa caggtcgctg aaatgcggct ggtgcgcttc 5580
atccgggcga aagaaccccg tattggcaaa tattgacggc cagttaagcc attcatgcca 5640
gtaggcgcgc ggacgaaagt aaacccactg gtgataccat tcgcgagcct ccggatgacg 5700
accgtagtga tgaatctctc ctggcgggaa cagcaaaata tcacccggtc ggcaaacaaa 5760
ttctcgtccc tgatttttca ccaccccctg accgcgaatg gtgagattga gaatataacc 5820
tttcattccc agcggtcggt cgataaaaaa atcgagataa ccgttggcct caatcggcgt 5880
taaacccgcc accagatggg cattaaacga gtatcccggc agcaggggat cattttgcgc 5940
ttcagccata cttttcatac tcccgccatt cagag 5975
<210> 3
<211> 6142
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 60
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 120
agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 180
gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta 240
tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc 300
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 360
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagca gatcaattcg 420
cgcgcgaagg cgaagcggca tgcataatgt gcctgtcaaa tggacgaagc agggattctg 480
caaaccctat gctactccgt caagccgtca attgtctgat tcgttaccaa ttatgacaac 540
ttgacggcta catcattcac tttttcttca caaccggcac ggaactcgct cgggctggcc 600
ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga 660
ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt 720
tggtcctcgc gccagcttaa gacgctaatc cctaactgct ggcggaaaag atgtgacaga 780
cgcgacggcg acaagcaaac atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc 840
aggtgatcgc tgatgtactg acaagcctcg cgtacccgat tatccatcgg tggatggagc 900
gactcgttaa tcgcttccat gcgccgcagt aacaattgct caagcagatt tatcgccagc 960
agctccgaat agcgcccttc cccttgcccg gcgttaatga tttgcccaaa caggtcgctg 1020
aaatgcggct ggtgcgcttc atccgggcga aagaaccccg tattggcaaa tattgacggc 1080
cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt aaacccactg gtgataccat 1140
tcgcgagcct ccggatgacg accgtagtga tgaatctctc ctggcgggaa cagcaaaata 1200
tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca ccaccccctg accgcgaatg 1260
gtgagattga gaatataacc tttcattccc agcggtcggt cgataaaaaa atcgagataa 1320
ccgttggcct caatcggcgt taaacccgcc accagatggg cattaaacga gtatcccggc 1380
agcaggggat cattttgcgc ttcagccata cttttcatac tcccgccatt cagagaagaa 1440
accaattgtc catattgcat cagacattgc cgtcactgcg tcttttactg gctcttctcg 1500
ctaaccaaac cggtaacccc gcttattaaa agcattctgt aacaaagcgg gaccaaagcc 1560
atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca gaaaagtcca cattgattat 1620
ttgcacggcg tcacactttg ctatgccata gcatttttat ccataagatt agcggatcct 1680
acctgacgct ttttatcgca actctctact gtttctccat acccgttttt tgggctaaca 1740
ggaggaatta accatgaagc ccgctgacgc gaaaccgccc cacatggacc acgacacctt 1800
ccgctccctg ggccatcagg ccatcgactg gatcgccgac tactggcagc gtttggcgga 1860
gcgacccgtc gctccccccg tcgaacccgg cagcatccgc gcccagttac cgacggcccc 1920
acccgagtgc ggcgaggact ttcccgtact gctgtccgac ctcgaacgga tcgtgctgcc 1980
gggcctgctg cactggcagc acccccgttt cttcggttac ttccccgcga acgcttccgg 2040
ccccgccgtc ctggccgagc tgttgtccgc gggcctgggc atccagggga tgaactggaa 2100
caccagcccg gcctgcaccg agatcgaaca gcagatgctg gactggttcg tgcacctgct 2160
cggcctaccc gagcacctcc gcggtggggg agtcatccag gacaccgcct ccagcgccct 2220
cctggtggca ctgctcaccg ccctgcacca ggccagtgcg ggccgcaccc gcgaccacgg 2280
caccggcgag tgcggctacc gggtgtacct gaccgccgag acgcactcgg cggcccgcaa 2340
ggccgccgtc atcaccggac tgggcctgcg ggccatgtgc gaggtggcca ccgacgccga 2400
cggcgccatg gacgcagtcg atctggaaag acacctccgg gccgaccggg ccgcaggtct 2460
gaccccgctg atggtcgtgg ccacccgagg caccacctcc catctctcct tcgaccccct 2520
ggaggacatc ggccccgtgt gtcgtcggca cggcgtgtgg ctccacgtcg acgccgcata 2580
cgccggagtg gccgcggtct gcgacgaact gcgctgggtc aacgacggcg tgcgctacgc 2640
ggactcctac tgcaccaacc cgcacaagtg gctgctgacc aacttcgact gcgacctgct 2700
gtgggtggcc caccccgaag tcctcgtcag cgccctgagc gtgctccccg aatacctgcg 2760
caactcggcc tccgaatcgg gccgggtgac cgactaccgg cactggcagg tcccactggg 2820
ccggcgcttc cgcgcactga aactgtggtc cgtcctccac tggtacggcg ccgaggggct 2880
gcgcgcccac atccgcaccg gcgttcggca tgcccagctc ttcgcggacc tggtcggcgc 2940
cgacgaccgc ttcaccctgg tcacccctcc cgccctcggc ctggtgacgt tccgtcagac 3000
cggaacggac gaggagaacc ggaacctcct gcaagccatc aacaccgagg gaaccacctt 3060
cctcacccac tccgagaaga acggcacctt cttcctgcgc ttcgccgccg gcggcaccct 3120
caccgaggac caccacgtac gcgaagcatg gcgcgccgtc cagaacgcga tccctcgcgc 3180
acaacacctc gccggcggct cggctgatgc gctgcccgag tagtttaact ttaagaagga 3240
gatatacatg aacaccttcc ggaccgcgac ggcacgcgat ctccccgatg tcgccgccac 3300
cttgaccgag gcgttcgccg ccgacccgcc gacccaatgg gtcttcccgg acggtgccgc 3360
tgcggtctcc cgtttcttct tcggtgtcgc cgaccgtgcc cgcgaggccg gcgggatcgt 3420
cgaactactc cccggcaccg ccgcgatgat cgccctaccc ccgcacgtac gactacccga 3480
cgccccagcc tgcggccgac aggccgagat gcagcgcagg ctgggcgaac gccgcccccg 3540
cactccgcac tactacctcc tcttctacgg cgtgcgcacc gcccatcaga gctccggcct 3600
ggggggacgg atgctctccg acctcatctc cctggccgac cgcgaccgcg tgggcaccta 3660
caccgaggcc agcacctggc gcggcgcccg cctgatgttg cgtcacggct tccacaccgc 3720
acagccgctg cggcttcccc acgggccacc catgttcccc ctctggagag acccgatcca 3780
tgaccactgc gactgaaagc ttggctgttt tggcggatga gagaagattt tcagcctgat 3840
acagattaaa tcagaacgca gaagcggtct gataaaacag aatttgcctg gcggcagtag 3900
cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg 3960
tagtgtgggg tctccccatg cgagagtagg gaactgccag gcatcaaata aaacgaaagg 4020
ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga 4080
gtaggacaaa tccgccggga gcggatttga acgttgcgaa gcaacggccc ggagggtggc 4140
gggcaggacg cccgccataa actgccaggc atcaaattaa gcagaaggcc atcctgacgg 4200
atggccttac aacttatatc gtatggggct gacttcaggt gctacatttg aagagataaa 4260
ttgcactgaa atctagaaat attttatctg attaataaga tgatcttctt gagatcgttt 4320
tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc gccttgcagg gcggtttttc 4380
gaaggttctc tgagctacca actctttgaa ccgaggtaac tggcttggag gagcgcagtc 4440
accaaaactt gtcctttcag tttagcctta accggcgcat gacttcaaga ctaactcctc 4500
taaatcaatt accagtggct gctgccagtg gtgcttttgc atgtctttcc gggttggact 4560
caagacgata gttaccggat aaggcgcagc ggtcggactg aacggggggt tcgtgcatac 4620
agtccagctt ggagcgaact gcctacccgg aactgagtgt caggcgtgga atgagacaaa 4680
cgcggccata acagcggaat gacaccggta aaccgaaagg caggaacagg agagcgcacg 4740
agggagccgc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccaccac 4800
tgatttgagc gtcagatttc gtgatgcttg tcaggggggc ggagcctatg gaaaaacggc 4860
tttgccgcgg ccctctcact tccctgttaa gtatcttcct ggcatcttcc aggaaatctc 4920
cgccccgttc gtaagccatt tccgctcgcc gcagtcgaac gaccgagcgt agcgagtcag 4980
tgagcgagga agcggaatat atcctgtatc acatattctg ctgacgcacc ggtgcagcct 5040
tttttctcct gccacatgaa gcacttcact gacaccctca tcagtgccaa catagtaagc 5100
cagtatacac tccgctagcg ctgatgtccg gcggtgcttt tgccgttacg caccaccccg 5160
tcagtagctg aacaggaggg acagctgata gaaacagaag ccactggagc acctcaaaaa 5220
caccatcata cactaaatca gtaagttggc agcatcaccc gacgcacttt gcgccgaata 5280
aatacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc ctgttgatac 5340
cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg taagaggttc 5400
caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt tatcgagatt 5460
ttcaggagct aaggaagcta aaatggagaa aaaaatcact ggatatacca ccgttgatat 5520
atcccaatgg catcgtaaag aacattttga ggcatttcag tcagttgctc aatgtaccta 5580
taaccagacc gttcagctgg atattacggc ctttttaaag accgtaaaga aaaataagca 5640
caagttttat ccggccttta ttcacattct tgcccgcctg atgaatgctc atccggaatt 5700
ccgtatggca atgaaagacg gtgagctggt gatatgggat agtgttcacc cttgttacac 5760
cgttttccat gagcaaactg aaacgttttc atcgctctgg agtgaatacc acgacgattt 5820
ccggcagttt ctacacatat attcgcaaga tgtggcgtgt tacggtgaaa acctggccta 5880
tttccctaaa gggtttattg agaatatgtt tttcgtctca gccaatccct gggtgagttt 5940
caccagtttt gatttaaacg tggccaatat ggacaacttc ttcgcccccg ttttcaccat 6000
gggcaaatat tatacgcaag gcgacaaggt gctgatgccg ctggcgattc aggttcatca 6060
tgccgtctgt gatggcttcc atgtcggcag aatgcttaat gaattacaac agtactgcga 6120
tgagtggcag ggcggggcgt aa 6142
<210> 4
<211> 4847
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360
aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420
gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480
cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540
ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600
gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660
gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720
catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780
gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840
acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900
atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960
gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020
agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080
ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140
gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200
gacgtgtaaa agcttggctg ttttggcgga tgagagaaga ttttcagcct gatacagatt 1260
aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag tagcgcggtg 1320
gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg 1380
gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa aggctcagtc 1440
gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac 1500
aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg 1560
acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga cggatggcct 1620
ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat atgtatccgc 1680
tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 1740
ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 1800
ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 1860
gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 1920
gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtgttg 1980
acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 2040
actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 2100
ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 2160
cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 2220
gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 2280
caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 2340
aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 2400
ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 2460
tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 2520
ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 2580
ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 2640
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 2700
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 2760
cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 2820
taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 2880
gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc 2940
acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 3000
ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 3060
ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 3120
cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 3180
aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 3240
gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 3300
gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 3360
gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 3420
ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 3480
ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 3540
tgatgcggta ttttctcctt acgcatctgt gcggtatttc acaccgcata tggtgcactc 3600
tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc tatcgctacg 3660
tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 3720
ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 3780
tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag cagatcaatt cgcgcgcgaa 3840
ggcgaagcgg catgcataat gtgcctgtca aatggacgaa gcagggattc tgcaaaccct 3900
atgctactcc gtcaagccgt caattgtctg attcgttacc aattatgaca acttgacggc 3960
tacatcattc actttttctt cacaaccggc acggaactcg ctcgggctgg ccccggtgca 4020
ttttttaaat acccgcgaga aatagagttg atcgtcaaaa ccaacattgc gaccgacggt 4080
ggcgataggc atccgggtgg tgctcaaaag cagcttcgcc tggctgatac gttggtcctc 4140
gcgccagctt aagacgctaa tccctaactg ctggcggaaa agatgtgaca gacgcgacgg 4200
cgacaagcaa acatgctgtg cgacgctggc gatatcaaaa ttgctgtctg ccaggtgatc 4260
gctgatgtac tgacaagcct cgcgtacccg attatccatc ggtggatgga gcgactcgtt 4320
aatcgcttcc atgcgccgca gtaacaattg ctcaagcaga tttatcgcca gcagctccga 4380
atagcgccct tccccttgcc cggcgttaat gatttgccca aacaggtcgc tgaaatgcgg 4440
ctggtgcgct tcatccgggc gaaagaaccc cgtattggca aatattgacg gccagttaag 4500
ccattcatgc cagtaggcgc gcggacgaaa gtaaacccac tggtgatacc attcgcgagc 4560
ctccggatga cgaccgtagt gatgaatctc tcctggcggg aacagcaaaa tatcacccgg 4620
tcggcaaaca aattctcgtc cctgattttt caccaccccc tgaccgcgaa tggtgagatt 4680
gagaatataa cctttcattc ccagcggtcg gtcgataaaa aaatcgagat aaccgttggc 4740
ctcaatcggc gttaaacccg ccaccagatg ggcattaaac gagtatcccg gcagcagggg 4800
atcattttgc gcttcagcca tacttttcat actcccgcca ttcagag 4847
<210> 5
<211> 7270
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 60
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 120
agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 180
gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta 240
tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc 300
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 360
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagca gatcaattcg 420
cgcgcgaagg cgaagcggca tgcataatgt gcctgtcaaa tggacgaagc agggattctg 480
caaaccctat gctactccgt caagccgtca attgtctgat tcgttaccaa ttatgacaac 540
ttgacggcta catcattcac tttttcttca caaccggcac ggaactcgct cgggctggcc 600
ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga 660
ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt 720
tggtcctcgc gccagcttaa gacgctaatc cctaactgct ggcggaaaag atgtgacaga 780
cgcgacggcg acaagcaaac atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc 840
aggtgatcgc tgatgtactg acaagcctcg cgtacccgat tatccatcgg tggatggagc 900
gactcgttaa tcgcttccat gcgccgcagt aacaattgct caagcagatt tatcgccagc 960
agctccgaat agcgcccttc cccttgcccg gcgttaatga tttgcccaaa caggtcgctg 1020
aaatgcggct ggtgcgcttc atccgggcga aagaaccccg tattggcaaa tattgacggc 1080
cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt aaacccactg gtgataccat 1140
tcgcgagcct ccggatgacg accgtagtga tgaatctctc ctggcgggaa cagcaaaata 1200
tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca ccaccccctg accgcgaatg 1260
gtgagattga gaatataacc tttcattccc agcggtcggt cgataaaaaa atcgagataa 1320
ccgttggcct caatcggcgt taaacccgcc accagatggg cattaaacga gtatcccggc 1380
agcaggggat cattttgcgc ttcagccata cttttcatac tcccgccatt cagagaagaa 1440
accaattgtc catattgcat cagacattgc cgtcactgcg tcttttactg gctcttctcg 1500
ctaaccaaac cggtaacccc gcttattaaa agcattctgt aacaaagcgg gaccaaagcc 1560
atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca gaaaagtcca cattgattat 1620
ttgcacggcg tcacactttg ctatgccata gcatttttat ccataagatt agcggatcct 1680
acctgacgct ttttatcgca actctctact gtttctccat acccgttttt tgggctaaca 1740
ggaggaatta accatgaagc ccgctgacgc gaaaccgccc cacatggacc acgacacctt 1800
ccgctccctg ggccatcagg ccatcgactg gatcgccgac tactggcagc gtttggcgga 1860
gcgacccgtc gctccccccg tcgaacccgg cagcatccgc gcccagttac cgacggcccc 1920
acccgagtgc ggcgaggact ttcccgtact gctgtccgac ctcgaacgga tcgtgctgcc 1980
gggcctgctg cactggcagc acccccgttt cttcggttac ttccccgcga acgcttccgg 2040
ccccgccgtc ctggccgagc tgttgtccgc gggcctgggc atccagggga tgaactggaa 2100
caccagcccg gcctgcaccg agatcgaaca gcagatgctg gactggttcg tgcacctgct 2160
cggcctaccc gagcacctcc gcggtggggg agtcatccag gacaccgcct ccagcgccct 2220
cctggtggca ctgctcaccg ccctgcacca ggccagtgcg ggccgcaccc gcgaccacgg 2280
caccggcgag tgcggctacc gggtgtacct gaccgccgag acgcactcgg cggcccgcaa 2340
ggccgccgtc atcaccggac tgggcctgcg ggccatgtgc gaggtggcca ccgacgccga 2400
cggcgccatg gacgcagtcg atctggaaag acacctccgg gccgaccggg ccgcaggtct 2460
gaccccgctg atggtcgtgg ccacccgagg caccacctcc catctctcct tcgaccccct 2520
ggaggacatc ggccccgtgt gtcgtcggca cggcgtgtgg ctccacgtcg acgccgcata 2580
cgccggagtg gccgcggtct gcgacgaact gcgctgggtc aacgacggcg tgcgctacgc 2640
ggactcctac tgcaccaacc cgcacaagtg gctgctgacc aacttcgact gcgacctgct 2700
gtgggtggcc caccccgaag tcctcgtcag cgccctgagc gtgctccccg aatacctgcg 2760
caactcggcc tccgaatcgg gccgggtgac cgactaccgg cactggcagg tcccactggg 2820
ccggcgcttc cgcgcactga aactgtggtc cgtcctccac tggtacggcg ccgaggggct 2880
gcgcgcccac atccgcaccg gcgttcggca tgcccagctc ttcgcggacc tggtcggcgc 2940
cgacgaccgc ttcaccctgg tcacccctcc cgccctcggc ctggtgacgt tccgtcagac 3000
cggaacggac gaggagaacc ggaacctcct gcaagccatc aacaccgagg gaaccacctt 3060
cctcacccac tccgagaaga acggcacctt cttcctgcgc ttcgccgccg gcggcaccct 3120
caccgaggac caccacgtac gcgaagcatg gcgcgccgtc cagaacgcga tccctcgcgc 3180
acaacacctc gccggcggct cggctgatgc gctgcccgag tagtttaact ttaagaagga 3240
gatatacatg aacaccttcc ggaccgcgac ggcacgcgat ctccccgatg tcgccgccac 3300
cttgaccgag gcgttcgccg ccgacccgcc gacccaatgg gtcttcccgg acggtgccgc 3360
tgcggtctcc cgtttcttct tcggtgtcgc cgaccgtgcc cgcgaggccg gcgggatcgt 3420
cgaactactc cccggcaccg ccgcgatgat cgccctaccc ccgcacgtac gactacccga 3480
cgccccagcc tgcggccgac aggccgagat gcagcgcagg ctgggcgaac gccgcccccg 3540
cactccgcac tactacctcc tcttctacgg cgtgcgcacc gcccatcaga gctccggcct 3600
ggggggacgg atgctctccg acctcatctc cctggccgac cgcgaccgcg tgggcaccta 3660
caccgaggcc agcacctggc gcggcgcccg cctgatgttg cgtcacggct tccacaccgc 3720
acagccgctg cggcttcccc acgggccacc catgttcccc ctctggagag acccgatcca 3780
tgaccactgc gactgattta actttaagaa ggagatatac atgaccgcac tcacccaagc 3840
ccattgcgaa gcctgccgcg cagacgcccc gcacgtcagc gacgaagaac tgcccgtgct 3900
gctgcggcaa atcccggatt ggaacatcga agtccgcgac ggcatcatgc agctagagaa 3960
ggtctacctg ttcaagaact tcaagcatgc cctggccttc accaatgccg tcggcgagat 4020
atccgaggcc gaaggccacc atccgggcct gctgaccgag tggggcaaag tcaccgtgac 4080
ctggtggagc cactcgatca agggcctgca ccgcaacgat ttcatcatgg cggcgcgcac 4140
cgatgaggta gcgaaaaccg ccgaggggcg caaataattt aactttaaga aggagatata 4200
catgggtaaa acccagccct tgccaatatt aattactggc ggaggtcgtc gcatcggcct 4260
cgccctcgca tggcatttca ttaatcaaaa gcaaccggtg attgtcagct atcggacaca 4320
ctatccagcc attgatggac tgattaatgc aggtgcgcag tgtattcagg ctgatttttc 4380
gaccaacgac ggtgtgatgg cgtttgccga tgaagtacta aaaagcaccc atggtctgcg 4440
tgctattttg cataacgcca gtgcgtggat ggcggaaaaa ccgggtgcgc cactggccga 4500
cgtactggct tgcatgatgc agatccacgt taatacccca tacctgctca accatgcgct 4560
ggaaagatta ctgcgtgggc acggacacgc cgccagcgat atcattcact ttaccgatta 4620
tgtggtggag cgcggtagcg acaaacatat tgcgtatgct gcaagcaaag cggcactgga 4680
taatatgacc cgctcgtttg cccgcaagct ggcaccggaa gtgaaagtga attctattgc 4740
gccatcgctg atcctgttta atgaacatga tgatgccgaa tatcgacaac aggcgctgaa 4800
taaatcactg atgaaaaccg cgcctggcga gaaagaagtg atcgacctgg tcgattactt 4860
acttaccagt tgctttgtca ccggacgcag tttcccactt gatggcggtc gtcatctgcg 4920
ttaaaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 4980
agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 5040
acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 5100
tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 5160
actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 5220
cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 5280
cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggccttacaa 5340
cttatatcgt atggggctga cttcaggtgc tacatttgaa gagataaatt gcactgaaat 5400
ctagaaatat tttatctgat taataagatg atcttcttga gatcgttttg gtctgcgcgt 5460
aatctcttgc tctgaaaacg aaaaaaccgc cttgcagggc ggtttttcga aggttctctg 5520
agctaccaac tctttgaacc gaggtaactg gcttggagga gcgcagtcac caaaacttgt 5580
cctttcagtt tagccttaac cggcgcatga cttcaagact aactcctcta aatcaattac 5640
cagtggctgc tgccagtggt gcttttgcat gtctttccgg gttggactca agacgatagt 5700
taccggataa ggcgcagcgg tcggactgaa cggggggttc gtgcatacag tccagcttgg 5760
agcgaactgc ctacccggaa ctgagtgtca ggcgtggaat gagacaaacg cggccataac 5820
agcggaatga caccggtaaa ccgaaaggca ggaacaggag agcgcacgag ggagccgcca 5880
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccaccactg atttgagcgt 5940
cagatttcgt gatgcttgtc aggggggcgg agcctatgga aaaacggctt tgccgcggcc 6000
ctctcacttc cctgttaagt atcttcctgg catcttccag gaaatctccg ccccgttcgt 6060
aagccatttc cgctcgccgc agtcgaacga ccgagcgtag cgagtcagtg agcgaggaag 6120
cggaatatat cctgtatcac atattctgct gacgcaccgg tgcagccttt tttctcctgc 6180
cacatgaagc acttcactga caccctcatc agtgccaaca tagtaagcca gtatacactc 6240
cgctagcgct gatgtccggc ggtgcttttg ccgttacgca ccaccccgtc agtagctgaa 6300
caggagggac agctgataga aacagaagcc actggagcac ctcaaaaaca ccatcataca 6360
ctaaatcagt aagttggcag catcacccga cgcactttgc gccgaataaa tacctgtgac 6420
ggaagatcac ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg 6480
ggccaacttt tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca 6540
taatgaaata agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa 6600
ggaagctaaa atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca 6660
tcgtaaagaa cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt 6720
tcagctggat attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc 6780
ggcctttatt cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat 6840
gaaagacggt gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga 6900
gcaaactgaa acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct 6960
acacatatat tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg 7020
gtttattgag aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga 7080
tttaaacgtg gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta 7140
tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtctgtga 7200
tggcttccat gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg 7260
cggggcgtaa 7270
<210> 6
<211> 296
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met Asn Thr Ala Pro Arg Arg Val Glu Asn Gln Leu Thr Asp Lys Gly
1 5 10 15
Tyr Val Pro Val Tyr Thr Thr Ala Val Val Glu Gln Pro Trp Asp Gly
20 25 30
Tyr Ser Ala Asp Asp His Ala Thr Trp Gly Thr Leu Tyr Arg Arg Gln
35 40 45
Arg Ala Leu Leu Val Gly Arg Ala Cys Asp Glu Phe Leu Gln Ala Gln
50 55 60
Asp Ala Met Gly Met Asp Asp Thr Gln Ile Pro Arg Phe Asp Ala Leu
65 70 75 80
Asn Ala Val Leu Gln Ala Thr Thr Gly Trp Thr Leu Val Gly Val Glu
85 90 95
Gly Leu Leu Pro Glu Leu Asp Phe Phe Asp His Leu Ala Asn Arg Arg
100 105 110
Phe Pro Val Thr Trp Trp Ile Arg Arg Pro Asp Gln Ile Asp Tyr Ile
115 120 125
Ala Glu Pro Asp Leu Phe His Asp Leu Phe Gly His Val Pro Leu Leu
130 135 140
Met Asn Pro Leu Phe Ala Asp Phe Met Gln Ala Tyr Gly Arg Gly Gly
145 150 155 160
Val Lys Ala His Gly Ile Gly Pro Asp Ala Leu Gln Asn Leu Thr Arg
165 170 175
Leu Tyr Phe Tyr Thr Val Glu Phe Gly Leu Ile Ala Thr Pro Gln Gly
180 185 190
Leu Arg Ile Tyr Gly Ala Gly Ile Val Ser Ser Lys Gly Glu Ser Leu
195 200 205
His Ser Leu Glu Ser Ala Ala Pro Asn Arg Val Gly Phe Asp Leu Gln
210 215 220
Arg Val Met Arg Thr Arg Tyr Arg Ile Asp Ser Phe Gln Lys Thr Tyr
225 230 235 240
Phe Val Ile Asp Ser Phe Thr Gln Leu Met Asp Ala Thr Ala Pro Asp
245 250 255
Phe Thr Pro Ile Tyr Ala Ala Leu Ala Gln Gln Pro Gln Val Pro Ala
260 265 270
Gly Glu Val Leu Ala Thr Asp His Val Leu Gln Arg Gly Ser Gly Glu
275 280 285
Gly Trp Ser Arg Asp Gly Asp Val
290 295
<210> 7
<211> 240
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Met Gly Lys Thr Gln Pro Leu Pro Ile Leu Ile Thr Gly Gly Gly Arg
1 5 10 15
Arg Ile Gly Leu Ala Leu Ala Trp His Phe Ile Asn Gln Lys Gln Pro
20 25 30
Val Ile Val Ser Tyr Arg Thr His Tyr Pro Ala Ile Asp Gly Leu Ile
35 40 45
Asn Ala Gly Ala Gln Cys Ile Gln Ala Asp Phe Ser Thr Asn Asp Gly
50 55 60
Val Met Ala Phe Ala Asp Glu Val Leu Lys Ser Thr His Gly Leu Arg
65 70 75 80
Ala Ile Leu His Asn Ala Ser Ala Trp Met Ala Glu Lys Pro Gly Ala
85 90 95
Pro Leu Ala Asp Val Leu Ala Cys Met Met Gln Ile His Val Asn Thr
100 105 110
Pro Tyr Leu Leu Asn His Ala Leu Glu Arg Leu Leu Arg Gly His Gly
115 120 125
His Ala Ala Ser Asp Ile Ile His Phe Thr Asp Tyr Val Val Glu Arg
130 135 140
Gly Ser Asp Lys His Ile Ala Tyr Ala Ala Ser Lys Ala Ala Leu Asp
145 150 155 160
Asn Met Thr Arg Ser Phe Ala Arg Lys Leu Ala Pro Glu Val Lys Val
165 170 175
Asn Ser Ile Ala Pro Ser Leu Ile Leu Phe Asn Glu His Asp Asp Ala
180 185 190
Glu Tyr Arg Gln Gln Ala Leu Asn Lys Ser Leu Met Lys Thr Ala Pro
195 200 205
Gly Glu Lys Glu Val Ile Asp Leu Val Asp Tyr Leu Leu Thr Ser Cys
210 215 220
Phe Val Thr Gly Arg Ser Phe Pro Leu Asp Gly Gly Arg His Leu Arg
225 230 235 240
<210> 8
<211> 118
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Thr Ala Leu Thr Gln Ala His Cys Glu Ala Cys Arg Ala Asp Ala
1 5 10 15
Pro His Val Ser Asp Glu Glu Leu Pro Val Leu Leu Arg Gln Ile Pro
20 25 30
Asp Trp Asn Ile Glu Val Arg Asp Gly Ile Met Gln Leu Glu Lys Val
35 40 45
Tyr Leu Phe Lys Asn Phe Lys His Ala Leu Ala Phe Thr Asn Ala Val
50 55 60
Gly Glu Ile Ser Glu Ala Glu Gly His His Pro Gly Leu Leu Thr Glu
65 70 75 80
Trp Gly Lys Val Thr Val Thr Trp Trp Ser His Ser Ile Lys Gly Leu
85 90 95
His Arg Asn Asp Phe Ile Met Ala Ala Arg Thr Asp Glu Val Ala Lys
100 105 110
Thr Ala Glu Gly Arg Lys
115
<210> 9
<211> 492
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Met Arg Arg Arg Lys Pro Ala Asp Ala Lys Pro Pro His Met Asp His
1 5 10 15
Asp Thr Phe Arg Ser Leu Gly His Gln Ala Ile Asp Trp Ile Ala Asp
20 25 30
Tyr Trp Gln Arg Leu Ala Glu Arg Pro Val Ala Pro Pro Val Glu Pro
35 40 45
Gly Ser Ile Arg Ala Gln Leu Pro Thr Ala Pro Pro Glu Cys Gly Glu
50 55 60
Asp Phe Pro Val Leu Leu Ser Asp Leu Glu Arg Ile Val Leu Pro Gly
65 70 75 80
Leu Leu His Trp Gln His Pro Arg Phe Phe Gly Tyr Phe Pro Ala Asn
85 90 95
Ala Ser Gly Pro Ala Val Leu Ala Glu Leu Leu Ser Ala Gly Leu Gly
100 105 110
Ile Gln Gly Met Asn Trp Asn Thr Ser Pro Ala Cys Thr Glu Ile Glu
115 120 125
Gln Gln Met Leu Asp Trp Phe Val His Leu Leu Gly Leu Pro Glu His
130 135 140
Leu Arg Gly Gly Gly Val Ile Gln Asp Thr Ala Ser Ser Ala Leu Leu
145 150 155 160
Val Ala Leu Leu Thr Ala Leu His Gln Ala Ser Ala Gly Arg Thr Arg
165 170 175
Asp His Gly Thr Gly Glu Cys Gly Tyr Arg Val Tyr Leu Thr Ala Glu
180 185 190
Thr His Ser Ala Ala Arg Lys Ala Ala Val Ile Thr Gly Leu Gly Leu
195 200 205
Arg Ala Met Cys Glu Val Ala Thr Asp Ala Asp Gly Ala Met Asp Ala
210 215 220
Val Asp Leu Glu Arg His Leu Arg Ala Asp Arg Ala Ala Gly Leu Thr
225 230 235 240
Pro Leu Met Val Val Ala Thr Arg Gly Thr Thr Ser His Leu Ser Phe
245 250 255
Asp Pro Leu Glu Asp Ile Gly Pro Val Cys Arg Arg His Gly Val Trp
260 265 270
Leu His Val Asp Ala Ala Tyr Ala Gly Val Ala Ala Val Cys Asp Glu
275 280 285
Leu Arg Trp Val Asn Asp Gly Val Arg Tyr Ala Asp Ser Tyr Cys Thr
290 295 300
Asn Pro His Lys Trp Leu Leu Thr Asn Phe Asp Cys Asp Leu Leu Trp
305 310 315 320
Val Ala His Pro Glu Val Leu Val Ser Ala Leu Ser Val Leu Pro Glu
325 330 335
Tyr Leu Arg Asn Ser Ala Ser Glu Ser Gly Arg Val Thr Asp Tyr Arg
340 345 350
His Trp Gln Val Pro Leu Gly Arg Arg Phe Arg Ala Leu Lys Leu Trp
355 360 365
Ser Val Leu His Trp Tyr Gly Ala Glu Gly Leu Arg Ala His Ile Arg
370 375 380
Thr Gly Val Arg His Ala Gln Leu Phe Ala Asp Leu Val Gly Ala Asp
385 390 395 400
Asp Arg Phe Thr Leu Val Thr Pro Pro Ala Leu Gly Leu Val Thr Phe
405 410 415
Arg Gln Thr Gly Thr Asp Glu Glu Asn Arg Asn Leu Leu Gln Ala Ile
420 425 430
Asn Thr Glu Gly Thr Thr Phe Leu Thr His Ser Glu Lys Asn Gly Thr
435 440 445
Phe Phe Leu Arg Phe Ala Ala Gly Gly Thr Leu Thr Glu Asp His His
450 455 460
Val Arg Glu Ala Trp Arg Ala Val Gln Asn Ala Ile Pro Arg Ala Gln
465 470 475 480
His Leu Ala Gly Gly Ser Ala Asp Ala Leu Pro Glu
485 490
<210> 10
<211> 182
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Met Asn Thr Phe Arg Thr Ala Thr Ala Arg Asp Leu Pro Asp Val Ala
1 5 10 15
Ala Thr Leu Thr Glu Ala Phe Ala Ala Asp Pro Pro Thr Gln Trp Val
20 25 30
Phe Pro Asp Gly Ala Ala Ala Val Ser Arg Phe Phe Phe Gly Val Ala
35 40 45
Asp Arg Ala Arg Glu Ala Gly Gly Ile Val Glu Leu Leu Pro Gly Thr
50 55 60
Ala Ala Met Ile Ala Leu Pro Pro His Val Arg Leu Pro Asp Ala Pro
65 70 75 80
Ala Cys Gly Arg Gln Ala Glu Met Gln Arg Arg Leu Gly Glu Arg Arg
85 90 95
Pro Arg Thr Pro His Tyr Tyr Leu Leu Phe Tyr Gly Val Arg Thr Ala
100 105 110
His Gln Ser Ser Gly Leu Gly Gly Arg Met Leu Ser Asp Leu Ile Ser
115 120 125
Leu Ala Asp Arg Asp Arg Val Gly Thr Tyr Thr Glu Ala Ser Thr Trp
130 135 140
Arg Gly Ala Arg Leu Met Leu Arg His Gly Phe His Thr Ala Gln Pro
145 150 155 160
Leu Arg Leu Pro His Gly Pro Pro Met Phe Pro Leu Trp Arg Asp Pro
165 170 175
Ile His Asp His Cys Asp
180
Claims (6)
1.一种重组大肠杆菌,其特征在于:所述重组大肠杆菌与受体大肠杆菌相比,所述重组大肠杆菌中色氨酸衍生物合成相关蛋白的基因的表达量增加和/或所述色氨酸衍生物合成相关蛋白的含量增加;
所述色氨酸衍生物合成相关蛋白为:
P1)苯丙氨酸羟化酶;
P2)二氢单磷酸还原酶;
P3)4a-羟基四氢生物蝶呤脱水酶;
P4)天冬氨酸转氨酶家族蛋白;
P5)N-乙酰转移酶;
所述苯丙氨酸羟化酶为SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质;
所述二氢单磷酸还原酶为SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶为SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质;
所述天冬氨酸转氨酶家族蛋白为SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质;
所述N-乙酰转移酶为SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质。
2.一种重组大肠杆菌的构建方法,其特征在于:所述构建方法包括如下步骤:将色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌,得到重组大肠杆菌;
所述色氨酸衍生物合成相关蛋白的基因为:
P1)苯丙氨酸羟化酶基因;
P2)二氢单磷酸还原酶基因;
P3)4a-羟基四氢生物蝶呤脱水酶基因;
P4)天冬氨酸转氨酶家族蛋白基因;
P5)N-乙酰转移酶基因;
所述色氨酸衍生物合成相关蛋白的基因通过方式甲或方式乙导入所述受体大肠杆菌中;
所述方式甲为所述苯丙氨酸羟化酶的基因构建在一个表达载体上,所述N-乙酰转移酶、天冬氨酸转氨酶家族蛋白、4a-羟基四氢生物蝶呤脱水酶和二氢单磷酸还原酶的基因构建在另一个表达载体上,所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白、N-乙酰转移酶、4a-羟基四氢生物蝶呤脱水酶和二氢单磷酸还原酶的基因依次连接,然后均导入到受体大肠杆菌中;
所述方式乙为所述苯丙氨酸羟化酶、4a-羟基四氢生物蝶呤脱水酶和二氢单磷酸还原酶的基因构建在一个表达载体上,所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶、4a-羟基四氢生物蝶呤脱水酶和二氢单磷酸还原酶的基因依次连接;所述天冬氨酸转氨酶家族蛋白和N-乙酰转移酶的基因构建在同一个表达载体上,然后均导入到受体大肠杆菌中;
所述苯丙氨酸羟化酶为SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质;
所述二氢单磷酸还原酶为SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶为SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质;
所述天冬氨酸转氨酶家族蛋白为SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质;
所述N-乙酰转移酶为SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质。
3.根据权利要求2所述的构建方法,其特征在于:
所述苯丙氨酸羟化酶的基因为SEQ ID No.1第319-1209位所示的DNA分子;
所述二氢单磷酸还原酶的基因为SEQ ID No.1第1615-2337位所示的DNA分子;
所述4a-羟基四氢生物蝶呤脱水酶的基因为SEQ ID No.1第1234-1590位所示的DNA分子;
所述天冬氨酸转氨酶家族蛋白的基因为SEQ ID No.1第2362-3831位所示的DNA分子;
所述N-乙酰转移酶的基因为SEQ ID No.1第3856-4404位所示的DNA分子。
4.由权利要求2或3所述的构建方法构建得到的重组大肠杆菌。
5.权利要求1或4所述的重组大肠杆菌在制备N-乙酰-5-羟色胺中的应用。
6.制备N-乙酰-5-羟色胺的方法,其特征在于:包括利用权利要求1或4所述的重组大肠杆菌催化色氨酸反应得到N-乙酰-5-羟色胺。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010185474.3A CN111304141B (zh) | 2020-03-17 | 2020-03-17 | 产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010185474.3A CN111304141B (zh) | 2020-03-17 | 2020-03-17 | 产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111304141A CN111304141A (zh) | 2020-06-19 |
CN111304141B true CN111304141B (zh) | 2022-05-17 |
Family
ID=71149832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010185474.3A Active CN111304141B (zh) | 2020-03-17 | 2020-03-17 | 产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111304141B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114685629B (zh) * | 2020-12-28 | 2024-06-04 | 湖南引航生物科技有限公司 | 一种提高5-羟基色氨酸微生物转化浓度的方法 |
CN115725621A (zh) * | 2022-10-09 | 2023-03-03 | 上海市农业科学院 | 一种多基因串联法构建生物合成褪黑素大肠杆菌工程菌的方法及应用 |
CN118406626A (zh) * | 2024-02-21 | 2024-07-30 | 滨州医学院 | 一种小白链霉菌基因工程菌及其应用 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3143153A4 (en) * | 2014-05-16 | 2018-01-03 | The University Of Georgia Research Foundation, Inc. | Microbial approach for the production of 5-hydroxytryptophan |
-
2020
- 2020-03-17 CN CN202010185474.3A patent/CN111304141B/zh active Active
Non-Patent Citations (1)
Title |
---|
Engineering Bacterial Phenylalanine 4‑Hydroxylase for Microbial Synthesis of Human Neurotransmitter Precursor 5‑Hydroxytryptophan;Lin et al.;《ACS Synthetic Biology》;20140617;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111304141A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111304141B (zh) | 产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用 | |
AU2018235957B2 (en) | Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins | |
KR20170109538A (ko) | B-세포 성숙화 항원을 표적화하는 키메라 항원 수용체 및 그의 용도 | |
CN107580503B (zh) | 用于治疗细菌感染的杀菌剂与亲溶酶体碱化剂的组合 | |
DK2768848T3 (en) | METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS | |
CN102414314A (zh) | 用于生产丙酮的细胞和方法 | |
CN113980991B (zh) | 大肠杆菌-芽孢杆菌穿梭质粒载体及其构建方法和应用 | |
KR102679920B1 (ko) | 모노머형 스트렙타비딘을 발현하는 균주 및 비오틴화된 화합물을 포함하는 암 세포 표적용 조성물 | |
CN106591344A (zh) | 一种融合分子伴侣标签的大肠杆菌热诱导可溶性蛋白表达载体及其应用 | |
US20040028695A1 (en) | Recombinant immunogenic compositions and methods for protecting against lethal infections from Bacillus anthracis | |
CN112342231A (zh) | 一种不耐热ung融合蛋白的重组载体及表达纯化方法 | |
CN112725344B (zh) | 密码子优化的smn1基因、腺相关病毒表达质粒及基因药物 | |
KR102194740B1 (ko) | 7-adca 제조를 위한 데아세트옥시세팔로스포린 c의 고농도 생산 재조합 아크레모니움 크리소제눔 균주의 제조방법 및 이 방법으로 제조된 균주 | |
CN106636198A (zh) | 猪乳腺特异高表达乳铁蛋白基因的定点敲入质粒载体及其应用 | |
KR20220142502A (ko) | 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도 | |
CN111041038B (zh) | 高效生物合成虾青素的集胞藻6803基因工程菌及构建方法及应用 | |
KR102679923B1 (ko) | 모노머형 스트렙타비딘을 발현하기 위한 컨스트럭트 | |
CN107988259B (zh) | SmartBac杆状病毒表达系统及其应用 | |
CN114292867B (zh) | 芽孢杆菌表达载体及其构建方法和应用 | |
CN111500629B (zh) | 一种高表达层粘连蛋白-511变体的方法及其应用 | |
CN108118047A (zh) | 一种双功能酶的制备方法及其在海藻糖生产中的应用 | |
CN114891776B (zh) | 双酶分层级联纳米晶体的构建及其作用pet塑料降解的方法 | |
CN109929031A (zh) | 细菌双杂交纳米抗体筛选系统及其构建方法和应用 | |
KR102712198B1 (ko) | 재조합 발생이 최소화된 유전자치료 벡터, 상기 벡터를 포함하는 재조합 레트로바이러스 및 상기 재조합 레트로바이러스를 포함하는 암의 예방 또는 치료용 약학 조성물 | |
KR102527339B1 (ko) | 일산화탄소 탈수소효소 및 포름산 탈수소효소를 이용한 개미산의 제조 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |