CN111349596A - 产褪黑素的重组大肠杆菌及其构建方法和应用 - Google Patents

产褪黑素的重组大肠杆菌及其构建方法和应用 Download PDF

Info

Publication number
CN111349596A
CN111349596A CN202010185591.XA CN202010185591A CN111349596A CN 111349596 A CN111349596 A CN 111349596A CN 202010185591 A CN202010185591 A CN 202010185591A CN 111349596 A CN111349596 A CN 111349596A
Authority
CN
China
Prior art keywords
gene
protein
seq
dna molecule
escherichia coli
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010185591.XA
Other languages
English (en)
Other versions
CN111349596B (zh
Inventor
董志扬
张岩峰
张山
何永志
张楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Microbiology of CAS
Original Assignee
Institute of Microbiology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Microbiology of CAS filed Critical Institute of Microbiology of CAS
Priority to CN202010185591.XA priority Critical patent/CN111349596B/zh
Publication of CN111349596A publication Critical patent/CN111349596A/zh
Application granted granted Critical
Publication of CN111349596B publication Critical patent/CN111349596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01001Aspartate transaminase (2.6.1.1), i.e. aspartate-aminotransferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/010964a-Hydroxytetrahydrobiopterin dehydratase (4.2.1.96)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明公开了产褪黑素的重组大肠杆菌及其构建方法和应用。本发明首先公开了重组大肠杆菌,与受体大肠杆菌相比,其褪黑素生物合成相关蛋白的基因的表达量增加和/或所述褪黑素生物合成相关蛋白的含量增加和/或所述褪黑素生物合成相关蛋白的活性增加;所述褪黑素选自如下至少一种:苯丙氨酸羟化酶、二氢单磷酸还原酶、4a‑羟基四氢生物蝶呤脱水酶、天冬氨酸转氨酶家族蛋白、N‑乙酰转移酶和咖啡酸‑O‑甲基转移酶。进一步公开了重组大肠杆菌的构建方法及应用。本发明产褪黑素的重组大肠杆菌菌株,褪黑素合成效率显著高于其它现有菌株,对褪黑素的工业化生产和大规模应用具有重大意义。

Description

产褪黑素的重组大肠杆菌及其构建方法和应用
技术领域
本发明涉及基因工程技术领域,具体涉及产褪黑素的重组大肠杆菌及其构建方法和应用。
背景技术
褪黑素(N-乙酰基-5-甲氧基色胺,melatonin,C13N2H16O2)属于色氨酸衍生物,是生物体内一种重要的抗氧化剂。褪黑素最早发现于牛松果体中,被认为是一种重要的神经激素,后研究发现褪黑素在人体内各个器官均有分布并发挥着不同的重要功能,如今已广泛应用于医药保健领域,用于治疗失眠、抑郁等症状,2019年褪黑素全球市场需求达10亿美金。褪黑素合成途径广泛存在于自然界生物中,细胞内经典的合成途径为:色氨酸→5-羟色氨酸→5-羟色胺→N-乙酰-5-羟色胺→褪黑素。
目前为止,褪黑素的生产还是以化学合成为主,而褪黑素的化学合成存在步骤繁琐、得率较低、手性不唯一等问题,同时化学合成还存在高能耗和高污染的问题。相比化学合成,生物合成具有对环境友好,能耗低,绿色环保等优点。随着合成生物学的发展,越来越多的化合物实现了生物绿色生产,通过解析化合物的生物合成途径,揭示参与该化合物合成途径中相关的酶基因。在此基础上,在生产菌株中重构目标化合物合成途径,从而实现以廉价的原料如葡萄糖催化生产高附加值的目标产物。虽然,褪黑素生物的合成途径解析的非常清楚,但其中涉及的蛋白本身比活较低,多数难以在现有的成熟表达系统中表达,基本形成包涵体或表达量极低,因此目前为止还有没有高产褪黑素的工程菌。
发明内容
本发明所要解决的技术问题为提供褪黑素高产菌株,以实现发酵法高效大规模工业化生产褪黑素。
为解决上述技术问题,本发明首先提供了一种重组大肠杆菌。
本发明所述重组大肠杆菌与受体大肠杆菌相比,所述重组大肠杆菌中褪黑素生物合成相关蛋白的基因的表达量增加和/或所述褪黑素生物合成相关蛋白的含量增加和/或所述褪黑素生物合成相关蛋白的活性增加;
所述褪黑素生物合成相关蛋白选自如下至少一种:
P1)苯丙氨酸羟化酶;
P2)二氢单磷酸还原酶(folM);
P3)4a-羟基四氢生物蝶呤脱水酶(phhB);
P4)天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein);
P5)N-乙酰转移酶(N-acetyltransferase);
P6)咖啡酸-O-甲基转移酶(COMT)。
上述重组大肠杆菌中,所述苯丙氨酸羟化酶(记为X)来自野油菜黄单胞菌(Xanthomonas campestris pv.campestris str.ATCC 33913)、4a-羟基四氢生物蝶呤脱水酶(phhB,记为P)来自铜绿假单胞菌(Pseudomonas aeruginosa PAO1)、二氢单磷酸还原酶(folM,记为B)来自大肠杆菌(Escherichia coli str.K-12substr.MG1655)、天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein,NCBI Reference Sequence:WP_103377132.1,记为H)和N-乙酰转移酶(N-acetyltransferase,NCBI ReferenceSequenc WP_020929557.1,记为F)来自小白链霉菌(Streptomyces albulus)、咖啡酸-O-甲基转移酶(COMT,记为C)来自水稻。
上述重组大肠杆菌中,所述受体大肠杆菌可为大肠杆菌K12;具体为大肠杆菌K12菌株BW25113。
在本发明具体的实施方式中,所述苯丙氨酸羟化酶可为如下A1)或A2)所示的蛋白质:
A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质;
A2)将A1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述二氢单磷酸还原酶可为如下A3)或A4)所示的蛋白质:
A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质;
A4)将A3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶可为如下A5)或A6)所示的蛋白质:
A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质;
A6)将A5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述天冬氨酸转氨酶家族蛋白可为如下A7)或A8)所示的蛋白质:
A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质;
A8)将A7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述N-乙酰转移酶可为如下A9)或A10)所示的蛋白质:
A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质;
A10)将A9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述咖啡酸-O-甲基转移酶可为如下A11)或A12)所示的蛋白质:
A11)SEQ ID NO.1第4429-5535位所示的DNA分子编码的蛋白质;
A12)将A11)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A11)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。
其中,SEQ ID No.1第319-1209位由891个核苷酸组成,第319-1209位为编码序列,编码SEQ ID No.6所示的苯丙氨酸羟化酶。
SEQ ID No.1第1615-2337位由723个核苷酸组成,第1615-2337位为编码序列,编码SEQ ID No.7所示的二氢单磷酸还原酶。
SEQ ID No.1第1234-1590位由357个核苷酸组成,第1234-1590位为编码序列,编码SEQ ID No.8所示的4a-羟基四氢生物蝶呤脱水酶。
SEQ ID No.1第2362-3831位由1470个核苷酸组成,第2362-3831位为编码序列,编码SEQ ID No.9所示的天冬氨酸转氨酶家族蛋白。
SEQ ID No.1第3856-4404位由549个核苷酸组成,第3856-4404位为编码序列,编码SEQ ID No.10所示的N-乙酰转移酶。
SEQ ID NO.1第4429-5535位由1107个核苷酸组成,第4429-5535位为编码序列,编码SEQ ID No.11所示的咖啡酸-O-甲基转移酶。
上述重组大肠杆菌中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述重组大肠杆菌中,所述90%以上的同一性可为至少91%、92%、95%、96%、98%、99%或100%的同一性。
上述重组大肠杆菌中,所述苯丙氨酸羟化酶基因可为如下B1)或B2)所示:
B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子;
B2)将SEQ ID No.1第319-1209位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第319-1209位所示的DNA分子具有相同功能的DNA分子;
所述二氢单磷酸还原酶基因可为如下B3)或B4)所示:
B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子;
B4)将SEQ ID No.1第1615-2337位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1615-2337位所示的DNA分子具有相同功能的DNA分子;
所述4a-羟基四氢生物蝶呤脱水酶基因可为如下B5)或B6)所示:
B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子;
B6)将SEQ ID No.1第1234-1590位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1234-1590位所示的DNA分子具有相同功能的DNA分子;
所述天冬氨酸转氨酶家族蛋白基因可为如下B7)或B8)所示:
B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子;
B8)将SEQ ID No.1第2362-3831位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第2362-3831位所示的DNA分子具有相同功能的DNA分子;
所述N-乙酰转移酶基因可为如下B9)或B10)所示:
B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子;
B10)将SEQ ID No.1第3856-4404位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第3856-4404位所示的DNA分子具有相同功能的DNA分子;
所述咖啡酸-O-甲基转移酶基因可为如下B11)或B12)所示:
B11)编码序列为SEQ ID NO.1第4429-5535位所示的DNA分子;
B12)将SEQ ID NO.1第4429-5535位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID NO.1第4429-5535位所示的DNA分子具有相同功能的DNA分子。
本发明进一步提供了重组大肠杆菌的构建方法。
本发明重组大肠杆菌的构建方法,包括如下步骤:将褪黑素生物合成相关蛋白基因的导入受体大肠杆菌,得到重组大肠杆菌;
所述褪黑素生物合成相关蛋白基因选自如下至少一种:
P1)苯丙氨酸羟化酶基因;
P2)二氢单磷酸还原酶(folM)基因;
P3)4a-羟基四氢生物蝶呤脱水酶(phhB)基因;
P4)天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein)基因;
P5)N-乙酰转移酶(N-acetyltransferase)基因;
P6)咖啡酸-O-甲基转移酶(COMT)基因。
所述苯丙氨酸羟化酶(记为X)来自野油菜黄单胞菌(Xanthomonas campestrispv.campestris str.ATCC 33913)、二氢单磷酸还原酶(folM,记为B)来自大肠杆菌(Escherichia coli str.K-12substr.MG1655)、4a-羟基四氢生物蝶呤脱水酶(phhB,记为P)来自铜绿假单胞菌(Pseudomonas aeruginosa PAO1)、天冬氨酸转氨酶家族蛋白(aspartate aminotransferase family protein,NCBI Reference Sequence:WP_103377132.1,记为H)和N-乙酰转移酶(N-acetyltransferase,NCBI Reference SequencWP_020929557.1,记为F)来自小白链霉菌(Streptomyces albulus)、咖啡酸-O-甲基转移酶(COMT,记为C)来自水稻。
上述构建方法中,所述褪黑素生物合成相关蛋白的基因的导入受体大肠杆菌是对所述受体大肠杆菌基因组进行下述M1)-M6)全部、任五种、任四种、任三种、任两种或任一种的改造得到的:
M1)过表达苯丙氨酸羟化酶基因;
M2)过表达二氢单磷酸还原酶(folM)基因;
M3)过表达4a-羟基四氢生物蝶呤脱水酶(phhB)基因;
M4)过表达天冬氨酸转氨酶家族蛋白(aspartate aminotransferase familyprotein)基因;
M5)过表达N-乙酰转移酶(N-acetyltransferase)基因;
M6)过表达咖啡酸-O-甲基转移酶(COMT)基因。
在本发明具体的实施方式中,所述褪黑素生物合成相关蛋白的基因通过方式甲或方式乙或方式丙导入所述受体大肠杆菌中;
所述方式甲为所述苯丙氨酸羟化酶基因(记为X)和咖啡酸-O-甲基转移酶基因(记为C)构建在一个表达载体上,所述天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)的基因构建在另一个表达载体上,所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)的基因依次连接(即天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶基因的上游、N-乙酰转移酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶基因位于二氢单磷酸还原酶基因的上游),然后均导入到受体大肠杆菌中;
所述方式乙为所述苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)构建在一个表达载体上,所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游);所述天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的基因构建在同一个表达载体上,所述表达载体中三个基因的位置关系为天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的基因依次连接(即天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶基因的上游、N-乙酰转移酶基因位于咖啡酸-O-甲基转移酶基因的上游),然后均导入到受体大肠杆菌中;
所述方式丙为所述苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为B)、天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)构建在一个表达载体上,所述表达载体中六个基因的位置关系为苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为B)、天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的基因依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游,4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游,二氢单磷酸还原酶基因位于的上游,天冬氨酸转氨酶家族蛋白基因位于N-乙酰转移酶基因的上游,N-乙酰转移酶基因位于咖啡酸-O-甲基转移酶基因的上游),然后导入到受体大肠杆菌中。
在本发明具体的实施方式中,所述方式甲为利用无缝拼接方法将苯丙氨酸羟化酶的基因基因(记为X)和咖啡酸-O-甲基转移酶基因(记为C)构建到载体pBAD中得到重组载体pBAD-XC(SEQ ID NO.4所示),利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)的连接顺序构建到载体pZH中得到重组载体pZH-HFPB(SEQ ID NO.5所示),然后将pBAD-XC和pZH-HFPB导入到受体大肠杆菌中;
所述方式乙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)和二氢单磷酸还原酶基因(记为B)的基因的连接顺序构建到载体pBAD中得到重组载体pBAD-XPB(SEQ ID NO.2所示),利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因N-乙酰转移酶基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的连接顺序构建到载体pZH中得到重组载体pZH-HFC(SEQ ID NO.3所示),然后将重组载体pBAD-XPB和pZH-HFC导入到受体大肠杆菌中;
所述方式丙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为X)、4a-羟基四氢生物蝶呤脱水酶基因(记为P)、二氢单磷酸还原酶基因(记为B)、天冬氨酸转氨酶家族蛋白基因(记为H)、N-乙酰转移酶基因(记为F)和咖啡酸-O-甲基转移酶基因(记为C)的连接顺序构建到载体pBAD中得到重组载体pBAD-XPBHFC(SEQ ID NO.1所示),然后将重组载体pBAD-XPBHFC导入到受体大肠杆菌中。
上述构建方法中,所述受体大肠杆菌可为大肠杆菌K12;具体为大肠杆菌K12菌株BW25113。
上述构建方法中,所述苯丙氨酸羟化酶可为如下A1)或A2)所示的蛋白质:
A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质;
A2)将A1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述二氢单磷酸还原酶可为如下A3)或A4)所示的蛋白质:
A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质;
A4)将A3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶可为如下A5)或A6)所示的蛋白质:
A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质;
A6)将A5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述天冬氨酸转氨酶家族蛋白可为如下A7)或A8)所示的蛋白质:
A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质;
A8)将A7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述N-乙酰转移酶可为如下A9)或A10)所示的蛋白质:
A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质;
A10)将A9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述咖啡酸-O-甲基转移酶可为如下A11)或A12)所示的蛋白质:
A11)SEQ ID NO.1第4429-5535位所示的DNA分子编码的蛋白质;
A12)将A11)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A11)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。
其中,SEQ ID No.1第319-1209位由891个核苷酸组成,第319-1209位为编码序列,编码SEQ ID No.6所示的苯丙氨酸羟化酶。
SEQ ID No.1第1615-2337位由723个核苷酸组成,第1615-2337位为编码序列,编码SEQ ID No.7所示的二氢单磷酸还原酶。
SEQ ID No.1第1234-1590位由357个核苷酸组成,第1234-1590位为编码序列,编码SEQ ID No.8所示的4a-羟基四氢生物蝶呤脱水酶。
SEQ ID No.1第2362-3831位由1470个核苷酸组成,第2362-3831位为编码序列,编码SEQ ID No.9所示的天冬氨酸转氨酶家族蛋白。
SEQ ID No.1第3856-4404位由549个核苷酸组成,第3856-4404位为编码序列,编码SEQ ID No.10所示的N-乙酰转移酶。
SEQ ID NO.1第4429-5535位由1107个核苷酸组成,第4429-5535位为编码序列,编码SEQ ID No.11所示的咖啡酸-O-甲基转移酶。
上述方法中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述方法中,所述90%以上的同一性可为至少91%、92%、95%、96%、98%、99%或100%的同一性。
上述方法中,所述苯丙氨酸羟化酶基因可为如下B1)或B2)所示:
B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子;
B2)将SEQ ID No.1第319-1209位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第319-1209位所示的DNA分子具有相同功能的DNA分子;
所述二氢单磷酸还原酶基因可为如下B3)或B4)所示:
B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子;
B4)将SEQ ID No.1第1615-2337位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1615-2337位所示的DNA分子具有相同功能的DNA分子;
所述4a-羟基四氢生物蝶呤脱水酶基因可为如下B5)或B6)所示:
B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子;
B6)将SEQ ID No.1第1234-1590位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1234-1590位所示的DNA分子具有相同功能的DNA分子;
所述天冬氨酸转氨酶家族蛋白基因可为如下B7)或B8)所示:
B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子;
B8)将SEQ ID No.1第2362-3831位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第2362-3831位所示的DNA分子具有相同功能的DNA分子;
所述N-乙酰转移酶基因可为如下B9)或B10)所示:
B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子;
B10)将SEQ ID No.1第3856-4404位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第3856-4404位所示的DNA分子具有相同功能的DNA分子;
所述咖啡酸-O-甲基转移酶基因可为如下B11)或B12)所示:
B11)编码序列为SEQ ID NO.1第4429-5535位所示的DNA分子;
B12)将SEQ ID NO.1第4429-5535位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID NO.1第4429-5535位所示的DNA分子具有相同功能的DNA分子。
上述构建方法得到的重组大肠杆菌及其在制备褪黑素的应用也在本发明的保护范围之内。
本发明进一步公开了一种制备褪黑素的方法。
本发明制备褪黑素的方法,包括:利用上述重组大肠杆菌催化色氨酸和甲硫氨酸反应得到褪黑素。
具体的,所述重组大肠杆菌经阿拉伯糖诱导培养后催化色氨酸和甲硫氨酸反应得到褪黑素。
上述方法中,所述阿拉伯糖为L-阿拉伯糖。
本发明通过在大肠杆菌中过表达褪黑素生物合成相关蛋白的基因,构建了能高效合成褪黑素的重组大肠杆菌,开发了一套高效合成褪黑素的方法。本发明的产褪黑素的重组大肠杆菌菌株,单位菌体的褪黑素合成效率显著高于其它现有菌株,且绝大部分产物分泌至胞外,便于产物的下游纯化分离。因此本发明对褪黑素的工业化生产和大规模应用具有重大意义。
附图说明
图1为SDS-PAGE分析褪黑素生物合成相关蛋白的基因在大肠杆菌中的表达;其中,A为BW-Mel3菌株的蛋白表达情况;B为BW-Mel1菌株的蛋白表达情况;C为BW-Mel2菌株的蛋白表达情况。
图2为三株重组大肠杆菌摇瓶试验中褪黑素合成水平的分析。
图3为一株重组大肠杆菌发酵罐试验中褪黑素合成水平的分析。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中用到的材料来源如下:
pBAD/HisA购自invitrogen,产品目录号为V430-01;
pZH是在pBAD/HisA基础上改变复制起始位点和抗性为氯霉素得到。
实施例1褪黑素高产的重组大肠杆菌菌株的构建
1、PCR扩增褪黑素生物合成相关基因的编码序列
以合成的野油菜黄单胞菌的苯丙氨酸羟化酶基因(SEQ ID NO.1第319-1209位所示)为模板,用引物F1和R1进行PCR扩增,得到包含苯丙氨酸羟化酶基因的PCR扩增产物X(SEQ ID NO.1第299-1232位所示)。
以合成的来源于铜绿假单胞菌的4a-羟基四氢生物蝶呤脱水酶(phhB)基因(SEQID NO.1第1234-1590位所示)为模板用引物F3和R3进行PCR扩增,得到包含基因phhB的PCR扩增产物P(SEQ ID NO.1第1210-1614位所示)。
以合成的来源于大肠杆菌的二氢单磷酸还原酶(folM)基因(SEQ ID NO.1第1615-2337位所示)为模板,用引物F2和R2进行PCR扩增,得到包含二氢单磷酸还原酶基因的PCR扩增产物B(SEQ ID NO.1第1592-2337位所示)。
以合成的来源于小白链霉菌的天冬氨酸转氨酶家族蛋白(aspartateaminotransferase family protein)基因(SEQ ID NO.1第2362-3831位所示)为模板用引物F4和R4进行PCR扩增,得到包含天冬氨酸转氨酶家族蛋白aspartate aminotransferasefamily protein基因的PCR扩增产物H(SEQ ID NO.1第2362-3831位所示)。
以合成的来源于小白链霉菌的N-乙酰转移酶(N-acetyltransferase)基因(SEQID NO.1第3856-4404位所示)为模板,用引物F5和R5进行PCR扩增,得到包含N-乙酰转移酶(N-acetyltransferase)基因的PCR扩增产物F(SEQ ID NO.1第3814-4404位所示)。
以合成的水稻咖啡酸-O-甲基转移酶(COMT)基因(SEQ ID NO.1第4429-5535位所示)为模板,用引物F6和R6进行PCR扩增,得到包含水稻COMT基因的PCR扩增产物C(SEQ IDNO.1第4405-5535位所示)。
具体引物序列如下:
F1:gctaacaggaggaattaaccATGAACACAGCGCCGCGCCGC
R1:TATATCTCCTTCTTAAAGTTAAATTACACGTCGCCGTCGCGGCTC
F2:TTAACTTTAAGAAGGAGATATACatgggtaaaacccagccctt
R2:ttaacgcagatgacgaccgc
F3:TTTAAGAAGGAGATATACatgaccgcactcacccaagc
R3:GTATATCTCCTTCTTAAAGTTAAATTatttgcgcccctcggcgg
F4:Atgaagcccgctgacgcg
R4:ctactcgggcagcgcatcagc
F5:gatgcgctgcccgagtagTTTAACTTTAAGAAGGAGATATAcatgaacaccttccggacc
R5:tcagtcgcagtggtcatggatcg
F6:TTTAACTTTAAGAAGGAGATATACATGGGTTCTACGGCGGC
R6:TTACTTGGTGAATTCAATAGCCCACGC
2、无缝拼接
以pBAD/HisA为载体,利用无缝拼接方法按照X、P、B、H、F、C的连接顺序构建了载体pBAD-XPBHFC(SEQ ID NO.1所示),并命名为Mel1;
以pBAD为载体,利用无缝拼接方法按照X、P、B的连接顺序构建重组载体pBAD-XPB(SEQ ID NO.2所示),以pZH为载体,利用无缝拼接方法按照H、F、C的连接顺序构建重组载体pZH-HFC(SEQ ID NO.3所示),并将pBAD-XPB和pZH-HFC命名为Mel2;
以pBAD为载体,利用无缝拼接方法构建载体pBAD-XC(SEQ ID NO.4所示),以pZH为载体,利用无缝拼接方法按照H、F、P、B的连接顺序构建重组载体pZH-HFPB(SEQ ID NO.5所示),并将pBAD-XC和pZH-HFPB命名为Mel3。
3、转化、筛选以及序列验证
用氯化钙化学转化法将重组载体pBAD-XPBHFC、pBAD-XPB、pZH-HFC、pBAD-XC和pZH-HFPB分别转化至大肠杆菌DH5α,用含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基进行筛选培养,挑取单菌落,并进行扩大培养和提取质粒,进行测序验证,结果获得的序列如SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ ID NO.4和SEQ ID NO.5所示,证明构建的重组质粒及重组菌正确。将阳性克隆的重组菌记作DH5α-pBAD-XPBHFC,DH5α-pBAD-XPB,DH5α-pZH-HFC,DH5α-pBAD-XC,DH5α-pZH-HFPB,阳性质粒记作pBAD-XPBHFC,pBAD-XPB,pZH-HFC,pBAD-XC,pZH-HFPB。
4、重组表达菌株的构建
用氯化钙化学转化法将重组质粒pBAD-XPBHFC、pBAD-XPB和pZH-HFC、pBAD-XC和pZH-HFPB转化至大肠杆菌K-12系列表达菌株BW25113(购买自北京江晨文轩生物科技有限责任公司货号:G6058,rrnB3ΔlacZ4787 hsdR514Δ(araBAD)567Δ(rhaBAD)568rph-1),用含有氨苄青霉素(100μg/ml)和或含氯霉素(34ug/ml)的LB培养基进行筛选培养,挑取单菌落,获得重组大肠杆菌菌株记作BW-pBAD-XPBHFC(命名为BW-Mel1);BW-pBAD-XPB/pZH-HFC(命名为BW-Mel2);BW-pBAD-XC和pZH-HFPB(命名为BW-Mel3)。
5、蛋白表达
以BW-Mel3为例:
挑取BW-Mel3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中,于37℃过夜培养。将过夜培养物接种于100ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基,37℃剧烈振荡(200rpm)培养,至发酵液的OD600值达到0.6-0.8左右,向发酵体系中加入L-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。
发酵完毕后,5000rpm离心15分钟,收集菌体;用pH7.0的PBS缓冲液重悬菌体,超声波破碎后12,000rpm离心15min。收集上清液,即为含有目的蛋白的粗酶液,SDS-PAGE检测蛋白表达情况。结果如图1所示,表明BW-Mel3菌株中6种蛋白均获得了可溶性表达。
利用上述方法,分别对BW-Mel1和BW-Mel2进行实验,SDS-PAGE检测蛋白表达情况,BW-Mel1菌株中咖啡酸-O-甲基转移酶和二氢单磷酸还原酶没有观察到明显条带,其余4个蛋白均获得表达,BW-Mel2菌株中6种蛋白均有可溶性表达。
6、大肠杆菌褪黑素的生物转化摇瓶试验
以BW-Mel3为例进行摇瓶试验:
挑取BW-Mel3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中,于37℃过夜培养。将过夜培养物接种于500ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基,37℃剧烈振荡(200rpm)培养,至发酵液的OD600值达到0.6-0.8左右,再向发酵体系中加入L-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。5000rpm离心15分钟,收集菌体。
离心后菌体加入转化液重悬菌体至OD600值达到10,取25ml重悬菌液于250ml三角瓶中,30℃振荡(100rpm)反应96小时,分别检测24h、48h、72h和96h的褪黑素的产量。
其中,转化液成分:10g/L葡萄糖,6g/L Na2HPO4,0.5g/L NaCl,3g/L KH2PO4,1g/LNH4Cl,246.5mg/L MgSO4·7H2O,14.7mg/L CaCl2·2H2O,27.8mg/L FeSO4·7H2O,2g/Lyeast extract(酵母提取物);1%甘油;1g/L tryptophan(色氨酸);1g/L Methionine(甲硫氨酸)。
利用上述方法,分别对BW-Mel1和BW-Mel2进行实验,分别检测24h、48h、72h和96h的褪黑素的产量。
结果如图2所示,结果显示三株重组大肠杆菌菌株褪黑素的产量具有显著的差异,其中,BW-Mel3(即BW-pBAD-XC/pZH-HFPB,图中以“菌株3”表示)的产量最高,96h时褪黑素的产量达到了最高为117mg/L;BW-Mel2(即BW-pBAD-XPB/pZH-HFC,图中以“菌株2”表示)的产量次之,BW-Mel1(即BW-pBAD-XPBHFC,图中以“菌株1”表示)几乎没有褪黑素的产生。
7、褪黑素的生物转化发酵罐试验
以摇瓶试验褪黑素产量最高的BW-Mel3菌株做上罐发酵:
1)种子液制备:挑取所述重组大肠杆菌BW-Mel3单菌落接入20ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的LB培养基中,于37℃、200rpm培养12小时;然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的种子培养基中,37℃、200rpm振荡培养12小时,即得种子液;
其中,所述种子培养基的配制:蛋白胨16g,酵母膏10g,氯化钠5g,用水定容至1L,pH7.0。
2)菌体培养过程:以10%的接种量将种子液接种到1L含氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的发酵罐培养基当中,发酵采用2.5L的发酵罐,培养过程中控制温度为37℃,通过搅拌速度(500-800转/分钟)和通气量(3L/min)控制菌体培养体系的溶氧在20%以上,通过流加1M磷酸和3M氨水维持pH值稳定在6.8-7.2。搅拌培养至葡萄糖消耗完时流加补料培养基,补料培养基的流加速度为50mL/h,流加至菌体密度OD600达到20,菌体培养过程结束,得到菌体培养后的发酵液,进入诱导培养阶段;
每1L发酵培养基的配制:葡萄糖10g,(NH4)2HPO4 8g,KH2PO4 13.3g,MgSO4·7H2O1.2g,柠檬酸1.7g,微量盐溶液10mL,用水定溶至1L,5M NaOH调至pH7.0;
每1L补料培养基的配制:葡萄糖400g,MgSO4·7H2O 10g,微量盐溶液20mL,用水定容至1L;
每1L微量盐溶液的配制:FeSO4·7H2O 10g,ZnSO4·7H2O 2.25g,CuSO4·5H2O 1g,MnSO4·5H2O 0.5g,Na2B4O7·10H2O 0.23g,CaCl2·2H2O 2g,(NH4)6Mo7O24 0.1g,用5M盐酸水溶液定容,定容至1L。
3)诱导培养:将上述菌体培养后的发酵液的温度降至30℃,加入L-阿拉伯糖,使得L-阿拉伯糖终浓度为1g/L,进行诱导培养,同时加入色氨酸终浓度为4g/L,甲硫氨酸终浓度为4g/L,甘油终浓度为体积占比5%;诱导培养过程中要一直流加补料培养基,补料培养基的流加速度调至20mL/h;流加至菌体密度OD600达到40,诱导培养过程结束;
所述诱导培养的条件为:培养温度为30℃,通过调整搅拌速度(500-800转/分钟)和通气量(3L/min)控制诱导培养体系的溶氧在20%以上,通过3M氨水和1M磷酸维持pH至7.0。
4)HPLC检测:上述转化液5000rpm离心15min吸取上清液,按照上清液:水:甲醇体积比1:7.5:1.5制成待检测样品,0.22um有机型滤器过滤除去不溶物后HPLC检测褪黑素浓度。HPLC检测仪为Agilent 1260Infinity LC,检测柱为Agilent ZOBAX C18柱。褪黑素的紫外检测波长为230nm,流动相为40%(V/V)甲醇,流速为1.0mL/min,进样量为10uL,采用外标法按峰面积定量。上海阿拉丁生化科技股份有限公司生产褪黑素标准品作为定量标准。
结果如图3所示,结果显示:采用摇瓶实验最优的BW-Mel3菌株(图中以“菌株3”)上罐后60h时褪黑素的产量达到最高为336mg/L。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
SEQUENCE LISTING
<110> 中国科学院微生物研究所
<120> 产褪黑素的重组大肠杆菌及其构建方法和应用
<130> GNCFY200074
<160> 11
<170> PatentIn version 3.5
<210> 1
<211> 9173
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360
aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420
gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480
cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540
ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600
gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660
gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720
catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780
gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840
acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900
atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960
gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020
agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080
ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140
gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200
gacgtgtaat ttaactttaa gaaggagata tacatgaccg cactcaccca agcccattgc 1260
gaagcctgcc gcgcagacgc cccgcacgtc agcgacgaag aactgcccgt gctgctgcgg 1320
caaatcccgg attggaacat cgaagtccgc gacggcatca tgcagctaga gaaggtctac 1380
ctgttcaaga acttcaagca tgccctggcc ttcaccaatg ccgtcggcga gatatccgag 1440
gccgaaggcc accatccggg cctgctgacc gagtggggca aagtcaccgt gacctggtgg 1500
agccactcga tcaagggcct gcaccgcaac gatttcatca tggcggcgcg caccgatgag 1560
gtagcgaaaa ccgccgaggg gcgcaaataa tttaacttta agaaggagat atacatgggt 1620
aaaacccagc ccttgccaat attaattact ggcggaggtc gtcgcatcgg cctcgccctc 1680
gcatggcatt tcattaatca aaagcaaccg gtgattgtca gctatcggac acactatcca 1740
gccattgatg gactgattaa tgcaggtgcg cagtgtattc aggctgattt ttcgaccaac 1800
gacggtgtga tggcgtttgc cgatgaagta ctaaaaagca cccatggtct gcgtgctatt 1860
ttgcataacg ccagtgcgtg gatggcggaa aaaccgggtg cgccactggc cgacgtactg 1920
gcttgcatga tgcagatcca cgttaatacc ccatacctgc tcaaccatgc gctggaaaga 1980
ttactgcgtg ggcacggaca cgccgccagc gatatcattc actttaccga ttatgtggtg 2040
gagcgcggta gcgacaaaca tattgcgtat gctgcaagca aagcggcact ggataatatg 2100
acccgctcgt ttgcccgcaa gctggcaccg gaagtgaaag tgaattctat tgcgccatcg 2160
ctgatcctgt ttaatgaaca tgatgatgcc gaatatcgac aacaggcgct gaataaatca 2220
ctgatgaaaa ccgcgcctgg cgagaaagaa gtgatcgacc tggtcgatta cttacttacc 2280
agttgctttg tcaccggacg cagtttccca cttgatggcg gtcgtcatct gcgttaattt 2340
aactttaaga aggagatata catgaagccc gctgacgcga aaccgcccca catggaccac 2400
gacaccttcc gctccctggg ccatcaggcc atcgactgga tcgccgacta ctggcagcgt 2460
ttggcggagc gacccgtcgc tccccccgtc gaacccggca gcatccgcgc ccagttaccg 2520
acggccccac ccgagtgcgg cgaggacttt cccgtactgc tgtccgacct cgaacggatc 2580
gtgctgccgg gcctgctgca ctggcagcac ccccgtttct tcggttactt ccccgcgaac 2640
gcttccggcc ccgccgtcct ggccgagctg ttgtccgcgg gcctgggcat ccaggggatg 2700
aactggaaca ccagcccggc ctgcaccgag atcgaacagc agatgctgga ctggttcgtg 2760
cacctgctcg gcctacccga gcacctccgc ggtgggggag tcatccagga caccgcctcc 2820
agcgccctcc tggtggcact gctcaccgcc ctgcaccagg ccagtgcggg ccgcacccgc 2880
gaccacggca ccggcgagtg cggctaccgg gtgtacctga ccgccgagac gcactcggcg 2940
gcccgcaagg ccgccgtcat caccggactg ggcctgcggg ccatgtgcga ggtggccacc 3000
gacgccgacg gcgccatgga cgcagtcgat ctggaaagac acctccgggc cgaccgggcc 3060
gcaggtctga ccccgctgat ggtcgtggcc acccgaggca ccacctccca tctctccttc 3120
gaccccctgg aggacatcgg ccccgtgtgt cgtcggcacg gcgtgtggct ccacgtcgac 3180
gccgcatacg ccggagtggc cgcggtctgc gacgaactgc gctgggtcaa cgacggcgtg 3240
cgctacgcgg actcctactg caccaacccg cacaagtggc tgctgaccaa cttcgactgc 3300
gacctgctgt gggtggccca ccccgaagtc ctcgtcagcg ccctgagcgt gctccccgaa 3360
tacctgcgca actcggcctc cgaatcgggc cgggtgaccg actaccggca ctggcaggtc 3420
ccactgggcc ggcgcttccg cgcactgaaa ctgtggtccg tcctccactg gtacggcgcc 3480
gaggggctgc gcgcccacat ccgcaccggc gttcggcatg cccagctctt cgcggacctg 3540
gtcggcgccg acgaccgctt caccctggtc acccctcccg ccctcggcct ggtgacgttc 3600
cgtcagaccg gaacggacga ggagaaccgg aacctcctgc aagccatcaa caccgaggga 3660
accaccttcc tcacccactc cgagaagaac ggcaccttct tcctgcgctt cgccgccggc 3720
ggcaccctca ccgaggacca ccacgtacgc gaagcatggc gcgccgtcca gaacgcgatc 3780
cctcgcgcac aacacctcgc cggcggctcg gctgatgcgc tgcccgagta gtttaacttt 3840
aagaaggaga tatacatgaa caccttccgg accgcgacgg cacgcgatct ccccgatgtc 3900
gccgccacct tgaccgaggc gttcgccgcc gacccgccga cccaatgggt cttcccggac 3960
ggtgccgctg cggtctcccg tttcttcttc ggtgtcgccg accgtgcccg cgaggccggc 4020
gggatcgtcg aactactccc cggcaccgcc gcgatgatcg ccctaccccc gcacgtacga 4080
ctacccgacg ccccagcctg cggccgacag gccgagatgc agcgcaggct gggcgaacgc 4140
cgcccccgca ctccgcacta ctacctcctc ttctacggcg tgcgcaccgc ccatcagagc 4200
tccggcctgg ggggacggat gctctccgac ctcatctccc tggccgaccg cgaccgcgtg 4260
ggcacctaca ccgaggccag cacctggcgc ggcgcccgcc tgatgttgcg tcacggcttc 4320
cacaccgcac agccgctgcg gcttccccac gggccaccca tgttccccct ctggagagac 4380
ccgatccatg accactgcga ctgatttaac tttaagaagg agatatacat gggttctacg 4440
gcggcggaca tggcggcagc agcggacgaa gaagcatgca tgtatgcgct gcagctggcg 4500
tcttcctcta tcctgccgat gacgctgaaa aacgctattg aactgggtct gctcgaaacc 4560
ctgcagagcg cggcagttgc aggtggtggc ggcaaagcgg cgctgctgac tccggccgaa 4620
gtggctgata aactgccgtc taaagcgaac ccggccgcgg cagatatggt ggatcgcatg 4680
ctgcgtctgc tggccagcta taacgtggtt cgttgcgaaa tggaggaagg cgccgatggc 4740
aagctgagcc gccgctacgc tgctgcgcct gtgtgtaagt ggctgacccc gaacgaggat 4800
ggcgtgagca tggcagcact cgctctcatg aaccaggaca aagttctgat ggagtcgtgg 4860
tattatctga aggacgcggt tctggatggt ggtatcccgt tcaacaaggc ctatggtatg 4920
accgctttcg aatatcacgg cactgatgcg cgcttcaacc gtgtcttcaa cgagggtatg 4980
aaaaaccatt ctgtgatcat caccaaaaaa ctgctggatc tgtataccgg cttcgacgcg 5040
gcttccacgg tagttgacgt tggtggtggt gttggcgcaa cggttgctgc tgtagtaagc 5100
cgccacccac acattcgcgg tatcaactat gatctgccac acgttatcag cgaagcgccg 5160
ccgttcccgg gcgtagaaca cgtcggtggc gacatgttcg ctagcgtgcc gcgcggtggt 5220
gacgcaatcc tgatgaagtg gattctgcac gattggagcg acgagcactg cgctcgtctg 5280
ctgaaaaact gctatgatgc actgcctgaa cacggcaaag ttgtagttgt tgaatgtgtt 5340
ctgccagaat cctcggacgc cactgcacgc gaacagggtg tatttcacgt ggacatgatt 5400
atgctggcgc acaacccggg tggcaaagaa cgttatgaac gtgaatttcg tgagctggcg 5460
cgtgcggcgg gtttcacggg ctttaaagct acctatatct acgcgaacgc gtgggctatt 5520
gaattcacca agtaaaagct tggctgtttt ggcggatgag agaagatttt cagcctgata 5580
cagattaaat cagaacgcag aagcggtctg ataaaacaga atttgcctgg cggcagtagc 5640
gcggtggtcc cacctgaccc catgccgaac tcagaagtga aacgccgtag cgccgatggt 5700
agtgtggggt ctccccatgc gagagtaggg aactgccagg catcaaataa aacgaaaggc 5760
tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctcctgag 5820
taggacaaat ccgccgggag cggatttgaa cgttgcgaag caacggcccg gagggtggcg 5880
ggcaggacgc ccgccataaa ctgccaggca tcaaattaag cagaaggcca tcctgacgga 5940
tggccttttt gcgtttctac aaactctttt gtttattttt ctaaatacat tcaaatatgt 6000
atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta 6060
tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg 6120
tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac 6180
gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg 6240
aagaacgttt tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc 6300
gtgttgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg 6360
ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat 6420
gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg 6480
gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg 6540
atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc 6600
ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt 6660
cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct 6720
cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc 6780
gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca 6840
cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct 6900
cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt 6960
taaaacttca tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga 7020
ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca 7080
aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 7140
caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 7200
taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 7260
gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 7320
cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 7380
taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 7440
agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 7500
ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 7560
gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 7620
acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 7680
acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 7740
tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 7800
ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 7860
agcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt 7920
gcactctcag tacaatctgc tctgatgccg catagttaag ccagtataca ctccgctatc 7980
gctacgtgac tgggtcatgg ctgcgccccg acacccgcca acacccgctg acgcgccctg 8040
acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg 8100
catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg aggcagcaga tcaattcgcg 8160
cgcgaaggcg aagcggcatg cataatgtgc ctgtcaaatg gacgaagcag ggattctgca 8220
aaccctatgc tactccgtca agccgtcaat tgtctgattc gttaccaatt atgacaactt 8280
gacggctaca tcattcactt tttcttcaca accggcacgg aactcgctcg ggctggcccc 8340
ggtgcatttt ttaaataccc gcgagaaata gagttgatcg tcaaaaccaa cattgcgacc 8400
gacggtggcg ataggcatcc gggtggtgct caaaagcagc ttcgcctggc tgatacgttg 8460
gtcctcgcgc cagcttaaga cgctaatccc taactgctgg cggaaaagat gtgacagacg 8520
cgacggcgac aagcaaacat gctgtgcgac gctggcgata tcaaaattgc tgtctgccag 8580
gtgatcgctg atgtactgac aagcctcgcg tacccgatta tccatcggtg gatggagcga 8640
ctcgttaatc gcttccatgc gccgcagtaa caattgctca agcagattta tcgccagcag 8700
ctccgaatag cgcccttccc cttgcccggc gttaatgatt tgcccaaaca ggtcgctgaa 8760
atgcggctgg tgcgcttcat ccgggcgaaa gaaccccgta ttggcaaata ttgacggcca 8820
gttaagccat tcatgccagt aggcgcgcgg acgaaagtaa acccactggt gataccattc 8880
gcgagcctcc ggatgacgac cgtagtgatg aatctctcct ggcgggaaca gcaaaatatc 8940
acccggtcgg caaacaaatt ctcgtccctg atttttcacc accccctgac cgcgaatggt 9000
gagattgaga atataacctt tcattcccag cggtcggtcg ataaaaaaat cgagataacc 9060
gttggcctca atcggcgtta aacccgccac cagatgggca ttaaacgagt atcccggcag 9120
caggggatca ttttgcgctt cagccatact tttcatactc ccgccattca gag 9173
<210> 2
<211> 5975
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360
aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420
gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480
cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540
ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600
gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660
gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720
catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780
gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840
acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900
atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960
gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020
agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080
ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140
gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200
gacgtgtaat ttaactttaa gaaggagata tacatgaccg cactcaccca agcccattgc 1260
gaagcctgcc gcgcagacgc cccgcacgtc agcgacgaag aactgcccgt gctgctgcgg 1320
caaatcccgg attggaacat cgaagtccgc gacggcatca tgcagctaga gaaggtctac 1380
ctgttcaaga acttcaagca tgccctggcc ttcaccaatg ccgtcggcga gatatccgag 1440
gccgaaggcc accatccggg cctgctgacc gagtggggca aagtcaccgt gacctggtgg 1500
agccactcga tcaagggcct gcaccgcaac gatttcatca tggcggcgcg caccgatgag 1560
gtagcgaaaa ccgccgaggg gcgcaaataa tttaacttta agaaggagat atacatgggt 1620
aaaacccagc ccttgccaat attaattact ggcggaggtc gtcgcatcgg cctcgccctc 1680
gcatggcatt tcattaatca aaagcaaccg gtgattgtca gctatcggac acactatcca 1740
gccattgatg gactgattaa tgcaggtgcg cagtgtattc aggctgattt ttcgaccaac 1800
gacggtgtga tggcgtttgc cgatgaagta ctaaaaagca cccatggtct gcgtgctatt 1860
ttgcataacg ccagtgcgtg gatggcggaa aaaccgggtg cgccactggc cgacgtactg 1920
gcttgcatga tgcagatcca cgttaatacc ccatacctgc tcaaccatgc gctggaaaga 1980
ttactgcgtg ggcacggaca cgccgccagc gatatcattc actttaccga ttatgtggtg 2040
gagcgcggta gcgacaaaca tattgcgtat gctgcaagca aagcggcact ggataatatg 2100
acccgctcgt ttgcccgcaa gctggcaccg gaagtgaaag tgaattctat tgcgccatcg 2160
ctgatcctgt ttaatgaaca tgatgatgcc gaatatcgac aacaggcgct gaataaatca 2220
ctgatgaaaa ccgcgcctgg cgagaaagaa gtgatcgacc tggtcgatta cttacttacc 2280
agttgctttg tcaccggacg cagtttccca cttgatggcg gtcgtcatct gcgttaaaag 2340
cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa atcagaacgc 2400
agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt cccacctgac 2460
cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat 2520
gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 2580
ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccggg 2640
agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac gcccgccata 2700
aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct 2760
acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 2820
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 2880
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 2940
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 3000
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 3060
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac gccgggcaag 3120
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 3180
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 3240
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 3300
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 3360
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 3420
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 3480
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 3540
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 3600
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 3660
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 3720
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 3780
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 3840
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 3900
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 3960
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 4020
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 4080
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 4140
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 4200
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 4260
aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg 4320
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 4380
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 4440
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 4500
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 4560
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 4620
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt 4680
ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 4740
gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg actgggtcat 4800
ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc 4860
ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc 4920
accgtcatca ccgaaacgcg cgaggcagca gatcaattcg cgcgcgaagg cgaagcggca 4980
tgcataatgt gcctgtcaaa tggacgaagc agggattctg caaaccctat gctactccgt 5040
caagccgtca attgtctgat tcgttaccaa ttatgacaac ttgacggcta catcattcac 5100
tttttcttca caaccggcac ggaactcgct cgggctggcc ccggtgcatt ttttaaatac 5160
ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga ccgacggtgg cgataggcat 5220
ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt tggtcctcgc gccagcttaa 5280
gacgctaatc cctaactgct ggcggaaaag atgtgacaga cgcgacggcg acaagcaaac 5340
atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc aggtgatcgc tgatgtactg 5400
acaagcctcg cgtacccgat tatccatcgg tggatggagc gactcgttaa tcgcttccat 5460
gcgccgcagt aacaattgct caagcagatt tatcgccagc agctccgaat agcgcccttc 5520
cccttgcccg gcgttaatga tttgcccaaa caggtcgctg aaatgcggct ggtgcgcttc 5580
atccgggcga aagaaccccg tattggcaaa tattgacggc cagttaagcc attcatgcca 5640
gtaggcgcgc ggacgaaagt aaacccactg gtgataccat tcgcgagcct ccggatgacg 5700
accgtagtga tgaatctctc ctggcgggaa cagcaaaata tcacccggtc ggcaaacaaa 5760
ttctcgtccc tgatttttca ccaccccctg accgcgaatg gtgagattga gaatataacc 5820
tttcattccc agcggtcggt cgataaaaaa atcgagataa ccgttggcct caatcggcgt 5880
taaacccgcc accagatggg cattaaacga gtatcccggc agcaggggat cattttgcgc 5940
ttcagccata cttttcatac tcccgccatt cagag 5975
<210> 3
<211> 7273
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 60
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 120
agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 180
gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta 240
tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc 300
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 360
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagca gatcaattcg 420
cgcgcgaagg cgaagcggca tgcataatgt gcctgtcaaa tggacgaagc agggattctg 480
caaaccctat gctactccgt caagccgtca attgtctgat tcgttaccaa ttatgacaac 540
ttgacggcta catcattcac tttttcttca caaccggcac ggaactcgct cgggctggcc 600
ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga 660
ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt 720
tggtcctcgc gccagcttaa gacgctaatc cctaactgct ggcggaaaag atgtgacaga 780
cgcgacggcg acaagcaaac atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc 840
aggtgatcgc tgatgtactg acaagcctcg cgtacccgat tatccatcgg tggatggagc 900
gactcgttaa tcgcttccat gcgccgcagt aacaattgct caagcagatt tatcgccagc 960
agctccgaat agcgcccttc cccttgcccg gcgttaatga tttgcccaaa caggtcgctg 1020
aaatgcggct ggtgcgcttc atccgggcga aagaaccccg tattggcaaa tattgacggc 1080
cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt aaacccactg gtgataccat 1140
tcgcgagcct ccggatgacg accgtagtga tgaatctctc ctggcgggaa cagcaaaata 1200
tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca ccaccccctg accgcgaatg 1260
gtgagattga gaatataacc tttcattccc agcggtcggt cgataaaaaa atcgagataa 1320
ccgttggcct caatcggcgt taaacccgcc accagatggg cattaaacga gtatcccggc 1380
agcaggggat cattttgcgc ttcagccata cttttcatac tcccgccatt cagagaagaa 1440
accaattgtc catattgcat cagacattgc cgtcactgcg tcttttactg gctcttctcg 1500
ctaaccaaac cggtaacccc gcttattaaa agcattctgt aacaaagcgg gaccaaagcc 1560
atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca gaaaagtcca cattgattat 1620
ttgcacggcg tcacactttg ctatgccata gcatttttat ccataagatt agcggatcct 1680
acctgacgct ttttatcgca actctctact gtttctccat acccgttttt tgggctaaca 1740
ggaggaatta accatgaagc ccgctgacgc gaaaccgccc cacatggacc acgacacctt 1800
ccgctccctg ggccatcagg ccatcgactg gatcgccgac tactggcagc gtttggcgga 1860
gcgacccgtc gctccccccg tcgaacccgg cagcatccgc gcccagttac cgacggcccc 1920
acccgagtgc ggcgaggact ttcccgtact gctgtccgac ctcgaacgga tcgtgctgcc 1980
gggcctgctg cactggcagc acccccgttt cttcggttac ttccccgcga acgcttccgg 2040
ccccgccgtc ctggccgagc tgttgtccgc gggcctgggc atccagggga tgaactggaa 2100
caccagcccg gcctgcaccg agatcgaaca gcagatgctg gactggttcg tgcacctgct 2160
cggcctaccc gagcacctcc gcggtggggg agtcatccag gacaccgcct ccagcgccct 2220
cctggtggca ctgctcaccg ccctgcacca ggccagtgcg ggccgcaccc gcgaccacgg 2280
caccggcgag tgcggctacc gggtgtacct gaccgccgag acgcactcgg cggcccgcaa 2340
ggccgccgtc atcaccggac tgggcctgcg ggccatgtgc gaggtggcca ccgacgccga 2400
cggcgccatg gacgcagtcg atctggaaag acacctccgg gccgaccggg ccgcaggtct 2460
gaccccgctg atggtcgtgg ccacccgagg caccacctcc catctctcct tcgaccccct 2520
ggaggacatc ggccccgtgt gtcgtcggca cggcgtgtgg ctccacgtcg acgccgcata 2580
cgccggagtg gccgcggtct gcgacgaact gcgctgggtc aacgacggcg tgcgctacgc 2640
ggactcctac tgcaccaacc cgcacaagtg gctgctgacc aacttcgact gcgacctgct 2700
gtgggtggcc caccccgaag tcctcgtcag cgccctgagc gtgctccccg aatacctgcg 2760
caactcggcc tccgaatcgg gccgggtgac cgactaccgg cactggcagg tcccactggg 2820
ccggcgcttc cgcgcactga aactgtggtc cgtcctccac tggtacggcg ccgaggggct 2880
gcgcgcccac atccgcaccg gcgttcggca tgcccagctc ttcgcggacc tggtcggcgc 2940
cgacgaccgc ttcaccctgg tcacccctcc cgccctcggc ctggtgacgt tccgtcagac 3000
cggaacggac gaggagaacc ggaacctcct gcaagccatc aacaccgagg gaaccacctt 3060
cctcacccac tccgagaaga acggcacctt cttcctgcgc ttcgccgccg gcggcaccct 3120
caccgaggac caccacgtac gcgaagcatg gcgcgccgtc cagaacgcga tccctcgcgc 3180
acaacacctc gccggcggct cggctgatgc gctgcccgag tagtttaact ttaagaagga 3240
gatatacatg aacaccttcc ggaccgcgac ggcacgcgat ctccccgatg tcgccgccac 3300
cttgaccgag gcgttcgccg ccgacccgcc gacccaatgg gtcttcccgg acggtgccgc 3360
tgcggtctcc cgtttcttct tcggtgtcgc cgaccgtgcc cgcgaggccg gcgggatcgt 3420
cgaactactc cccggcaccg ccgcgatgat cgccctaccc ccgcacgtac gactacccga 3480
cgccccagcc tgcggccgac aggccgagat gcagcgcagg ctgggcgaac gccgcccccg 3540
cactccgcac tactacctcc tcttctacgg cgtgcgcacc gcccatcaga gctccggcct 3600
ggggggacgg atgctctccg acctcatctc cctggccgac cgcgaccgcg tgggcaccta 3660
caccgaggcc agcacctggc gcggcgcccg cctgatgttg cgtcacggct tccacaccgc 3720
acagccgctg cggcttcccc acgggccacc catgttcccc ctctggagag acccgatcca 3780
tgaccactgc gactgattta actttaagaa ggagatatac atgggttcta cggcggcgga 3840
catggcggca gcagcggacg aagaagcatg catgtatgcg ctgcagctgg cgtcttcctc 3900
tatcctgccg atgacgctga aaaacgctat tgaactgggt ctgctcgaaa ccctgcagag 3960
cgcggcagtt gcaggtggtg gcggcaaagc ggcgctgctg actccggccg aagtggctga 4020
taaactgccg tctaaagcga acccggccgc ggcagatatg gtggatcgca tgctgcgtct 4080
gctggccagc tataacgtgg ttcgttgcga aatggaggaa ggcgccgatg gcaagctgag 4140
ccgccgctac gctgctgcgc ctgtgtgtaa gtggctgacc ccgaacgagg atggcgtgag 4200
catggcagca ctcgctctca tgaaccagga caaagttctg atggagtcgt ggtattatct 4260
gaaggacgcg gttctggatg gtggtatccc gttcaacaag gcctatggta tgaccgcttt 4320
cgaatatcac ggcactgatg cgcgcttcaa ccgtgtcttc aacgagggta tgaaaaacca 4380
ttctgtgatc atcaccaaaa aactgctgga tctgtatacc ggcttcgacg cggcttccac 4440
ggtagttgac gttggtggtg gtgttggcgc aacggttgct gctgtagtaa gccgccaccc 4500
acacattcgc ggtatcaact atgatctgcc acacgttatc agcgaagcgc cgccgttccc 4560
gggcgtagaa cacgtcggtg gcgacatgtt cgctagcgtg ccgcgcggtg gtgacgcaat 4620
cctgatgaag tggattctgc acgattggag cgacgagcac tgcgctcgtc tgctgaaaaa 4680
ctgctatgat gcactgcctg aacacggcaa agttgtagtt gttgaatgtg ttctgccaga 4740
atcctcggac gccactgcac gcgaacaggg tgtatttcac gtggacatga ttatgctggc 4800
gcacaacccg ggtggcaaag aacgttatga acgtgaattt cgtgagctgg cgcgtgcggc 4860
gggtttcacg ggctttaaag ctacctatat ctacgcgaac gcgtgggcta ttgaattcac 4920
caagtaaaag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa 4980
atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt 5040
cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg 5100
gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga 5160
aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa 5220
atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac 5280
gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggcctta 5340
caacttatat cgtatggggc tgacttcagg tgctacattt gaagagataa attgcactga 5400
aatctagaaa tattttatct gattaataag atgatcttct tgagatcgtt ttggtctgcg 5460
cgtaatctct tgctctgaaa acgaaaaaac cgccttgcag ggcggttttt cgaaggttct 5520
ctgagctacc aactctttga accgaggtaa ctggcttgga ggagcgcagt caccaaaact 5580
tgtcctttca gtttagcctt aaccggcgca tgacttcaag actaactcct ctaaatcaat 5640
taccagtggc tgctgccagt ggtgcttttg catgtctttc cgggttggac tcaagacgat 5700
agttaccgga taaggcgcag cggtcggact gaacgggggg ttcgtgcata cagtccagct 5760
tggagcgaac tgcctacccg gaactgagtg tcaggcgtgg aatgagacaa acgcggccat 5820
aacagcggaa tgacaccggt aaaccgaaag gcaggaacag gagagcgcac gagggagccg 5880
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacca ctgatttgag 5940
cgtcagattt cgtgatgctt gtcagggggg cggagcctat ggaaaaacgg ctttgccgcg 6000
gccctctcac ttccctgtta agtatcttcc tggcatcttc caggaaatct ccgccccgtt 6060
cgtaagccat ttccgctcgc cgcagtcgaa cgaccgagcg tagcgagtca gtgagcgagg 6120
aagcggaata tatcctgtat cacatattct gctgacgcac cggtgcagcc ttttttctcc 6180
tgccacatga agcacttcac tgacaccctc atcagtgcca acatagtaag ccagtataca 6240
ctccgctagc gctgatgtcc ggcggtgctt ttgccgttac gcaccacccc gtcagtagct 6300
gaacaggagg gacagctgat agaaacagaa gccactggag cacctcaaaa acaccatcat 6360
acactaaatc agtaagttgg cagcatcacc cgacgcactt tgcgccgaat aaatacctgt 6420
gacggaagat cacttcgcag aataaataaa tcctggtgtc cctgttgata ccgggaagcc 6480
ctgggccaac ttttggcgaa aatgagacgt tgatcggcac gtaagaggtt ccaactttca 6540
ccataatgaa ataagatcac taccgggcgt attttttgag ttatcgagat tttcaggagc 6600
taaggaagct aaaatggaga aaaaaatcac tggatatacc accgttgata tatcccaatg 6660
gcatcgtaaa gaacattttg aggcatttca gtcagttgct caatgtacct ataaccagac 6720
cgttcagctg gatattacgg cctttttaaa gaccgtaaag aaaaataagc acaagtttta 6780
tccggccttt attcacattc ttgcccgcct gatgaatgct catccggaat tccgtatggc 6840
aatgaaagac ggtgagctgg tgatatggga tagtgttcac ccttgttaca ccgttttcca 6900
tgagcaaact gaaacgtttt catcgctctg gagtgaatac cacgacgatt tccggcagtt 6960
tctacacata tattcgcaag atgtggcgtg ttacggtgaa aacctggcct atttccctaa 7020
agggtttatt gagaatatgt ttttcgtctc agccaatccc tgggtgagtt tcaccagttt 7080
tgatttaaac gtggccaata tggacaactt cttcgccccc gttttcacca tgggcaaata 7140
ttatacgcaa ggcgacaagg tgctgatgcc gctggcgatt caggttcatc atgccgtctg 7200
tgatggcttc catgtcggca gaatgcttaa tgaattacaa cagtactgcg atgagtggca 7260
gggcggggcg taa 7273
<210> 4
<211> 5978
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg ttttttgggc 300
taacaggagg aattaaccat gaacacagcg ccgcgccgcg tcgagaacca gctcaccgac 360
aagggctatg tgccggtcta caccaccgcg gtggtggagc agccgtggga tggttacagc 420
gccgacgacc atgccacctg gggcacgctg taccggcggc agcgcgcgct gctggtcggg 480
cgggcctgcg atgagttcct gcaggcgcag gacgcaatgg gcatggacga cacccagatt 540
ccgcgcttcg acgcgctcaa cgcggtgctg caggcgacca ccggctggac gctggtcggt 600
gtggaagggc tgctgccgga gctggatttc ttcgatcatc tggccaaccg gcgcttcccg 660
gtgacctggt ggatccgccg cccggaccag atcgactaca tcgccgaacc ggacctgttc 720
catgatctgt tcgggcacgt gccgctgctg atgaatccgc tgtttgccga cttcatgcag 780
gcctatgggc gcggtggcgt caaggcgcac ggaattggcc cggacgcgtt gcaaaatctc 840
acccggctgt acttctacac ggtggaattc ggcctgattg ccacgccgca ggggttgcgc 900
atctacggtg cgggcatcgt ctcgtccaag ggcgaatcgc tgcattcgct ggaatcggcg 960
gcgccgaacc gggtgggctt cgatctgcag cgggtgatgc gcacgcgcta ccgcatcgac 1020
agtttccaaa agacctactt cgtcatcgac agctttacgc agctgatgga cgccaccgcc 1080
ccggatttca ccccgatcta tgccgcgctg gcgcaacagc cgcaggtgcc ggccggcgag 1140
gtgctggcaa ccgaccacgt cctgcagcgc ggcagcggcg aaggctggag ccgcgacggc 1200
gacgtgtaat ttaactttaa gaaggagata tacatgggtt ctacggcggc ggacatggcg 1260
gcagcagcgg acgaagaagc atgcatgtat gcgctgcagc tggcgtcttc ctctatcctg 1320
ccgatgacgc tgaaaaacgc tattgaactg ggtctgctcg aaaccctgca gagcgcggca 1380
gttgcaggtg gtggcggcaa agcggcgctg ctgactccgg ccgaagtggc tgataaactg 1440
ccgtctaaag cgaacccggc cgcggcagat atggtggatc gcatgctgcg tctgctggcc 1500
agctataacg tggttcgttg cgaaatggag gaaggcgccg atggcaagct gagccgccgc 1560
tacgctgctg cgcctgtgtg taagtggctg accccgaacg aggatggcgt gagcatggca 1620
gcactcgctc tcatgaacca ggacaaagtt ctgatggagt cgtggtatta tctgaaggac 1680
gcggttctgg atggtggtat cccgttcaac aaggcctatg gtatgaccgc tttcgaatat 1740
cacggcactg atgcgcgctt caaccgtgtc ttcaacgagg gtatgaaaaa ccattctgtg 1800
atcatcacca aaaaactgct ggatctgtat accggcttcg acgcggcttc cacggtagtt 1860
gacgttggtg gtggtgttgg cgcaacggtt gctgctgtag taagccgcca cccacacatt 1920
cgcggtatca actatgatct gccacacgtt atcagcgaag cgccgccgtt cccgggcgta 1980
gaacacgtcg gtggcgacat gttcgctagc gtgccgcgcg gtggtgacgc aatcctgatg 2040
aagtggattc tgcacgattg gagcgacgag cactgcgctc gtctgctgaa aaactgctat 2100
gatgcactgc ctgaacacgg caaagttgta gttgttgaat gtgttctgcc agaatcctcg 2160
gacgccactg cacgcgaaca gggtgtattt cacgtggaca tgattatgct ggcgcacaac 2220
ccgggtggca aagaacgtta tgaacgtgaa tttcgtgagc tggcgcgtgc ggcgggtttc 2280
acgggcttta aagctaccta tatctacgcg aacgcgtggg ctattgaatt caccaagtaa 2340
aagcttggct gttttggcgg atgagagaag attttcagcc tgatacagat taaatcagaa 2400
cgcagaagcg gtctgataaa acagaatttg cctggcggca gtagcgcggt ggtcccacct 2460
gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc 2520
catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt cgaaagactg 2580
ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc 2640
gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc 2700
ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc tttttgcgtt 2760
tctacaaact cttttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac 2820
aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt 2880
tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag 2940
aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg 3000
aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa 3060
tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc 3120
aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag 3180
tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa 3240
ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc 3300
taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg 3360
agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa 3420
caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg caacaattaa 3480
tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg 3540
gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag 3600
cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg 3660
caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt 3720
ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt 3780
aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac 3840
gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 3900
atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 3960
tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 4020
gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 4080
actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 4140
gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 4200
agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 4260
ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 4320
aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 4380
cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 4440
gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 4500
cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 4560
cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 4620
gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt 4680
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 4740
tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 4800
catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 4860
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 4920
ttcaccgtca tcaccgaaac gcgcgaggca gcagatcaat tcgcgcgcga aggcgaagcg 4980
gcatgcataa tgtgcctgtc aaatggacga agcagggatt ctgcaaaccc tatgctactc 5040
cgtcaagccg tcaattgtct gattcgttac caattatgac aacttgacgg ctacatcatt 5100
cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc attttttaaa 5160
tacccgcgag aaatagagtt gatcgtcaaa accaacattg cgaccgacgg tggcgatagg 5220
catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct cgcgccagct 5280
taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg gcgacaagca 5340
aacatgctgt gcgacgctgg cgatatcaaa attgctgtct gccaggtgat cgctgatgta 5400
ctgacaagcc tcgcgtaccc gattatccat cggtggatgg agcgactcgt taatcgcttc 5460
catgcgccgc agtaacaatt gctcaagcag atttatcgcc agcagctccg aatagcgccc 5520
ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg ctgaaatgcg gctggtgcgc 5580
ttcatccggg cgaaagaacc ccgtattggc aaatattgac ggccagttaa gccattcatg 5640
ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac cattcgcgag cctccggatg 5700
acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa atatcacccg gtcggcaaac 5760
aaattctcgt ccctgatttt tcaccacccc ctgaccgcga atggtgagat tgagaatata 5820
acctttcatt cccagcggtc ggtcgataaa aaaatcgaga taaccgttgg cctcaatcgg 5880
cgttaaaccc gccaccagat gggcattaaa cgagtatccc ggcagcaggg gatcattttg 5940
cgcttcagcc atacttttca tactcccgcc attcagag 5978
<210> 5
<211> 7270
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 60
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 120
agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 180
gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta 240
tcgctacgtg actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc 300
tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 360
tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgaggcagca gatcaattcg 420
cgcgcgaagg cgaagcggca tgcataatgt gcctgtcaaa tggacgaagc agggattctg 480
caaaccctat gctactccgt caagccgtca attgtctgat tcgttaccaa ttatgacaac 540
ttgacggcta catcattcac tttttcttca caaccggcac ggaactcgct cgggctggcc 600
ccggtgcatt ttttaaatac ccgcgagaaa tagagttgat cgtcaaaacc aacattgcga 660
ccgacggtgg cgataggcat ccgggtggtg ctcaaaagca gcttcgcctg gctgatacgt 720
tggtcctcgc gccagcttaa gacgctaatc cctaactgct ggcggaaaag atgtgacaga 780
cgcgacggcg acaagcaaac atgctgtgcg acgctggcga tatcaaaatt gctgtctgcc 840
aggtgatcgc tgatgtactg acaagcctcg cgtacccgat tatccatcgg tggatggagc 900
gactcgttaa tcgcttccat gcgccgcagt aacaattgct caagcagatt tatcgccagc 960
agctccgaat agcgcccttc cccttgcccg gcgttaatga tttgcccaaa caggtcgctg 1020
aaatgcggct ggtgcgcttc atccgggcga aagaaccccg tattggcaaa tattgacggc 1080
cagttaagcc attcatgcca gtaggcgcgc ggacgaaagt aaacccactg gtgataccat 1140
tcgcgagcct ccggatgacg accgtagtga tgaatctctc ctggcgggaa cagcaaaata 1200
tcacccggtc ggcaaacaaa ttctcgtccc tgatttttca ccaccccctg accgcgaatg 1260
gtgagattga gaatataacc tttcattccc agcggtcggt cgataaaaaa atcgagataa 1320
ccgttggcct caatcggcgt taaacccgcc accagatggg cattaaacga gtatcccggc 1380
agcaggggat cattttgcgc ttcagccata cttttcatac tcccgccatt cagagaagaa 1440
accaattgtc catattgcat cagacattgc cgtcactgcg tcttttactg gctcttctcg 1500
ctaaccaaac cggtaacccc gcttattaaa agcattctgt aacaaagcgg gaccaaagcc 1560
atgacaaaaa cgcgtaacaa aagtgtctat aatcacggca gaaaagtcca cattgattat 1620
ttgcacggcg tcacactttg ctatgccata gcatttttat ccataagatt agcggatcct 1680
acctgacgct ttttatcgca actctctact gtttctccat acccgttttt tgggctaaca 1740
ggaggaatta accatgaagc ccgctgacgc gaaaccgccc cacatggacc acgacacctt 1800
ccgctccctg ggccatcagg ccatcgactg gatcgccgac tactggcagc gtttggcgga 1860
gcgacccgtc gctccccccg tcgaacccgg cagcatccgc gcccagttac cgacggcccc 1920
acccgagtgc ggcgaggact ttcccgtact gctgtccgac ctcgaacgga tcgtgctgcc 1980
gggcctgctg cactggcagc acccccgttt cttcggttac ttccccgcga acgcttccgg 2040
ccccgccgtc ctggccgagc tgttgtccgc gggcctgggc atccagggga tgaactggaa 2100
caccagcccg gcctgcaccg agatcgaaca gcagatgctg gactggttcg tgcacctgct 2160
cggcctaccc gagcacctcc gcggtggggg agtcatccag gacaccgcct ccagcgccct 2220
cctggtggca ctgctcaccg ccctgcacca ggccagtgcg ggccgcaccc gcgaccacgg 2280
caccggcgag tgcggctacc gggtgtacct gaccgccgag acgcactcgg cggcccgcaa 2340
ggccgccgtc atcaccggac tgggcctgcg ggccatgtgc gaggtggcca ccgacgccga 2400
cggcgccatg gacgcagtcg atctggaaag acacctccgg gccgaccggg ccgcaggtct 2460
gaccccgctg atggtcgtgg ccacccgagg caccacctcc catctctcct tcgaccccct 2520
ggaggacatc ggccccgtgt gtcgtcggca cggcgtgtgg ctccacgtcg acgccgcata 2580
cgccggagtg gccgcggtct gcgacgaact gcgctgggtc aacgacggcg tgcgctacgc 2640
ggactcctac tgcaccaacc cgcacaagtg gctgctgacc aacttcgact gcgacctgct 2700
gtgggtggcc caccccgaag tcctcgtcag cgccctgagc gtgctccccg aatacctgcg 2760
caactcggcc tccgaatcgg gccgggtgac cgactaccgg cactggcagg tcccactggg 2820
ccggcgcttc cgcgcactga aactgtggtc cgtcctccac tggtacggcg ccgaggggct 2880
gcgcgcccac atccgcaccg gcgttcggca tgcccagctc ttcgcggacc tggtcggcgc 2940
cgacgaccgc ttcaccctgg tcacccctcc cgccctcggc ctggtgacgt tccgtcagac 3000
cggaacggac gaggagaacc ggaacctcct gcaagccatc aacaccgagg gaaccacctt 3060
cctcacccac tccgagaaga acggcacctt cttcctgcgc ttcgccgccg gcggcaccct 3120
caccgaggac caccacgtac gcgaagcatg gcgcgccgtc cagaacgcga tccctcgcgc 3180
acaacacctc gccggcggct cggctgatgc gctgcccgag tagtttaact ttaagaagga 3240
gatatacatg aacaccttcc ggaccgcgac ggcacgcgat ctccccgatg tcgccgccac 3300
cttgaccgag gcgttcgccg ccgacccgcc gacccaatgg gtcttcccgg acggtgccgc 3360
tgcggtctcc cgtttcttct tcggtgtcgc cgaccgtgcc cgcgaggccg gcgggatcgt 3420
cgaactactc cccggcaccg ccgcgatgat cgccctaccc ccgcacgtac gactacccga 3480
cgccccagcc tgcggccgac aggccgagat gcagcgcagg ctgggcgaac gccgcccccg 3540
cactccgcac tactacctcc tcttctacgg cgtgcgcacc gcccatcaga gctccggcct 3600
ggggggacgg atgctctccg acctcatctc cctggccgac cgcgaccgcg tgggcaccta 3660
caccgaggcc agcacctggc gcggcgcccg cctgatgttg cgtcacggct tccacaccgc 3720
acagccgctg cggcttcccc acgggccacc catgttcccc ctctggagag acccgatcca 3780
tgaccactgc gactgattta actttaagaa ggagatatac atgaccgcac tcacccaagc 3840
ccattgcgaa gcctgccgcg cagacgcccc gcacgtcagc gacgaagaac tgcccgtgct 3900
gctgcggcaa atcccggatt ggaacatcga agtccgcgac ggcatcatgc agctagagaa 3960
ggtctacctg ttcaagaact tcaagcatgc cctggccttc accaatgccg tcggcgagat 4020
atccgaggcc gaaggccacc atccgggcct gctgaccgag tggggcaaag tcaccgtgac 4080
ctggtggagc cactcgatca agggcctgca ccgcaacgat ttcatcatgg cggcgcgcac 4140
cgatgaggta gcgaaaaccg ccgaggggcg caaataattt aactttaaga aggagatata 4200
catgggtaaa acccagccct tgccaatatt aattactggc ggaggtcgtc gcatcggcct 4260
cgccctcgca tggcatttca ttaatcaaaa gcaaccggtg attgtcagct atcggacaca 4320
ctatccagcc attgatggac tgattaatgc aggtgcgcag tgtattcagg ctgatttttc 4380
gaccaacgac ggtgtgatgg cgtttgccga tgaagtacta aaaagcaccc atggtctgcg 4440
tgctattttg cataacgcca gtgcgtggat ggcggaaaaa ccgggtgcgc cactggccga 4500
cgtactggct tgcatgatgc agatccacgt taatacccca tacctgctca accatgcgct 4560
ggaaagatta ctgcgtgggc acggacacgc cgccagcgat atcattcact ttaccgatta 4620
tgtggtggag cgcggtagcg acaaacatat tgcgtatgct gcaagcaaag cggcactgga 4680
taatatgacc cgctcgtttg cccgcaagct ggcaccggaa gtgaaagtga attctattgc 4740
gccatcgctg atcctgttta atgaacatga tgatgccgaa tatcgacaac aggcgctgaa 4800
taaatcactg atgaaaaccg cgcctggcga gaaagaagtg atcgacctgg tcgattactt 4860
acttaccagt tgctttgtca ccggacgcag tttcccactt gatggcggtc gtcatctgcg 4920
ttaaaagctt ggctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc 4980
agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc 5040
acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc 5100
tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag 5160
actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc 5220
cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc 5280
cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat ggccttacaa 5340
cttatatcgt atggggctga cttcaggtgc tacatttgaa gagataaatt gcactgaaat 5400
ctagaaatat tttatctgat taataagatg atcttcttga gatcgttttg gtctgcgcgt 5460
aatctcttgc tctgaaaacg aaaaaaccgc cttgcagggc ggtttttcga aggttctctg 5520
agctaccaac tctttgaacc gaggtaactg gcttggagga gcgcagtcac caaaacttgt 5580
cctttcagtt tagccttaac cggcgcatga cttcaagact aactcctcta aatcaattac 5640
cagtggctgc tgccagtggt gcttttgcat gtctttccgg gttggactca agacgatagt 5700
taccggataa ggcgcagcgg tcggactgaa cggggggttc gtgcatacag tccagcttgg 5760
agcgaactgc ctacccggaa ctgagtgtca ggcgtggaat gagacaaacg cggccataac 5820
agcggaatga caccggtaaa ccgaaaggca ggaacaggag agcgcacgag ggagccgcca 5880
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccaccactg atttgagcgt 5940
cagatttcgt gatgcttgtc aggggggcgg agcctatgga aaaacggctt tgccgcggcc 6000
ctctcacttc cctgttaagt atcttcctgg catcttccag gaaatctccg ccccgttcgt 6060
aagccatttc cgctcgccgc agtcgaacga ccgagcgtag cgagtcagtg agcgaggaag 6120
cggaatatat cctgtatcac atattctgct gacgcaccgg tgcagccttt tttctcctgc 6180
cacatgaagc acttcactga caccctcatc agtgccaaca tagtaagcca gtatacactc 6240
cgctagcgct gatgtccggc ggtgcttttg ccgttacgca ccaccccgtc agtagctgaa 6300
caggagggac agctgataga aacagaagcc actggagcac ctcaaaaaca ccatcataca 6360
ctaaatcagt aagttggcag catcacccga cgcactttgc gccgaataaa tacctgtgac 6420
ggaagatcac ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg 6480
ggccaacttt tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca 6540
taatgaaata agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa 6600
ggaagctaaa atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca 6660
tcgtaaagaa cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt 6720
tcagctggat attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc 6780
ggcctttatt cacattcttg cccgcctgat gaatgctcat ccggaattcc gtatggcaat 6840
gaaagacggt gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga 6900
gcaaactgaa acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct 6960
acacatatat tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg 7020
gtttattgag aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga 7080
tttaaacgtg gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta 7140
tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtctgtga 7200
tggcttccat gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg 7260
cggggcgtaa 7270
<210> 6
<211> 296
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met Asn Thr Ala Pro Arg Arg Val Glu Asn Gln Leu Thr Asp Lys Gly
1 5 10 15
Tyr Val Pro Val Tyr Thr Thr Ala Val Val Glu Gln Pro Trp Asp Gly
20 25 30
Tyr Ser Ala Asp Asp His Ala Thr Trp Gly Thr Leu Tyr Arg Arg Gln
35 40 45
Arg Ala Leu Leu Val Gly Arg Ala Cys Asp Glu Phe Leu Gln Ala Gln
50 55 60
Asp Ala Met Gly Met Asp Asp Thr Gln Ile Pro Arg Phe Asp Ala Leu
65 70 75 80
Asn Ala Val Leu Gln Ala Thr Thr Gly Trp Thr Leu Val Gly Val Glu
85 90 95
Gly Leu Leu Pro Glu Leu Asp Phe Phe Asp His Leu Ala Asn Arg Arg
100 105 110
Phe Pro Val Thr Trp Trp Ile Arg Arg Pro Asp Gln Ile Asp Tyr Ile
115 120 125
Ala Glu Pro Asp Leu Phe His Asp Leu Phe Gly His Val Pro Leu Leu
130 135 140
Met Asn Pro Leu Phe Ala Asp Phe Met Gln Ala Tyr Gly Arg Gly Gly
145 150 155 160
Val Lys Ala His Gly Ile Gly Pro Asp Ala Leu Gln Asn Leu Thr Arg
165 170 175
Leu Tyr Phe Tyr Thr Val Glu Phe Gly Leu Ile Ala Thr Pro Gln Gly
180 185 190
Leu Arg Ile Tyr Gly Ala Gly Ile Val Ser Ser Lys Gly Glu Ser Leu
195 200 205
His Ser Leu Glu Ser Ala Ala Pro Asn Arg Val Gly Phe Asp Leu Gln
210 215 220
Arg Val Met Arg Thr Arg Tyr Arg Ile Asp Ser Phe Gln Lys Thr Tyr
225 230 235 240
Phe Val Ile Asp Ser Phe Thr Gln Leu Met Asp Ala Thr Ala Pro Asp
245 250 255
Phe Thr Pro Ile Tyr Ala Ala Leu Ala Gln Gln Pro Gln Val Pro Ala
260 265 270
Gly Glu Val Leu Ala Thr Asp His Val Leu Gln Arg Gly Ser Gly Glu
275 280 285
Gly Trp Ser Arg Asp Gly Asp Val
290 295
<210> 7
<211> 240
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Met Gly Lys Thr Gln Pro Leu Pro Ile Leu Ile Thr Gly Gly Gly Arg
1 5 10 15
Arg Ile Gly Leu Ala Leu Ala Trp His Phe Ile Asn Gln Lys Gln Pro
20 25 30
Val Ile Val Ser Tyr Arg Thr His Tyr Pro Ala Ile Asp Gly Leu Ile
35 40 45
Asn Ala Gly Ala Gln Cys Ile Gln Ala Asp Phe Ser Thr Asn Asp Gly
50 55 60
Val Met Ala Phe Ala Asp Glu Val Leu Lys Ser Thr His Gly Leu Arg
65 70 75 80
Ala Ile Leu His Asn Ala Ser Ala Trp Met Ala Glu Lys Pro Gly Ala
85 90 95
Pro Leu Ala Asp Val Leu Ala Cys Met Met Gln Ile His Val Asn Thr
100 105 110
Pro Tyr Leu Leu Asn His Ala Leu Glu Arg Leu Leu Arg Gly His Gly
115 120 125
His Ala Ala Ser Asp Ile Ile His Phe Thr Asp Tyr Val Val Glu Arg
130 135 140
Gly Ser Asp Lys His Ile Ala Tyr Ala Ala Ser Lys Ala Ala Leu Asp
145 150 155 160
Asn Met Thr Arg Ser Phe Ala Arg Lys Leu Ala Pro Glu Val Lys Val
165 170 175
Asn Ser Ile Ala Pro Ser Leu Ile Leu Phe Asn Glu His Asp Asp Ala
180 185 190
Glu Tyr Arg Gln Gln Ala Leu Asn Lys Ser Leu Met Lys Thr Ala Pro
195 200 205
Gly Glu Lys Glu Val Ile Asp Leu Val Asp Tyr Leu Leu Thr Ser Cys
210 215 220
Phe Val Thr Gly Arg Ser Phe Pro Leu Asp Gly Gly Arg His Leu Arg
225 230 235 240
<210> 8
<211> 118
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Thr Ala Leu Thr Gln Ala His Cys Glu Ala Cys Arg Ala Asp Ala
1 5 10 15
Pro His Val Ser Asp Glu Glu Leu Pro Val Leu Leu Arg Gln Ile Pro
20 25 30
Asp Trp Asn Ile Glu Val Arg Asp Gly Ile Met Gln Leu Glu Lys Val
35 40 45
Tyr Leu Phe Lys Asn Phe Lys His Ala Leu Ala Phe Thr Asn Ala Val
50 55 60
Gly Glu Ile Ser Glu Ala Glu Gly His His Pro Gly Leu Leu Thr Glu
65 70 75 80
Trp Gly Lys Val Thr Val Thr Trp Trp Ser His Ser Ile Lys Gly Leu
85 90 95
His Arg Asn Asp Phe Ile Met Ala Ala Arg Thr Asp Glu Val Ala Lys
100 105 110
Thr Ala Glu Gly Arg Lys
115
<210> 9
<211> 492
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Met Arg Arg Arg Lys Pro Ala Asp Ala Lys Pro Pro His Met Asp His
1 5 10 15
Asp Thr Phe Arg Ser Leu Gly His Gln Ala Ile Asp Trp Ile Ala Asp
20 25 30
Tyr Trp Gln Arg Leu Ala Glu Arg Pro Val Ala Pro Pro Val Glu Pro
35 40 45
Gly Ser Ile Arg Ala Gln Leu Pro Thr Ala Pro Pro Glu Cys Gly Glu
50 55 60
Asp Phe Pro Val Leu Leu Ser Asp Leu Glu Arg Ile Val Leu Pro Gly
65 70 75 80
Leu Leu His Trp Gln His Pro Arg Phe Phe Gly Tyr Phe Pro Ala Asn
85 90 95
Ala Ser Gly Pro Ala Val Leu Ala Glu Leu Leu Ser Ala Gly Leu Gly
100 105 110
Ile Gln Gly Met Asn Trp Asn Thr Ser Pro Ala Cys Thr Glu Ile Glu
115 120 125
Gln Gln Met Leu Asp Trp Phe Val His Leu Leu Gly Leu Pro Glu His
130 135 140
Leu Arg Gly Gly Gly Val Ile Gln Asp Thr Ala Ser Ser Ala Leu Leu
145 150 155 160
Val Ala Leu Leu Thr Ala Leu His Gln Ala Ser Ala Gly Arg Thr Arg
165 170 175
Asp His Gly Thr Gly Glu Cys Gly Tyr Arg Val Tyr Leu Thr Ala Glu
180 185 190
Thr His Ser Ala Ala Arg Lys Ala Ala Val Ile Thr Gly Leu Gly Leu
195 200 205
Arg Ala Met Cys Glu Val Ala Thr Asp Ala Asp Gly Ala Met Asp Ala
210 215 220
Val Asp Leu Glu Arg His Leu Arg Ala Asp Arg Ala Ala Gly Leu Thr
225 230 235 240
Pro Leu Met Val Val Ala Thr Arg Gly Thr Thr Ser His Leu Ser Phe
245 250 255
Asp Pro Leu Glu Asp Ile Gly Pro Val Cys Arg Arg His Gly Val Trp
260 265 270
Leu His Val Asp Ala Ala Tyr Ala Gly Val Ala Ala Val Cys Asp Glu
275 280 285
Leu Arg Trp Val Asn Asp Gly Val Arg Tyr Ala Asp Ser Tyr Cys Thr
290 295 300
Asn Pro His Lys Trp Leu Leu Thr Asn Phe Asp Cys Asp Leu Leu Trp
305 310 315 320
Val Ala His Pro Glu Val Leu Val Ser Ala Leu Ser Val Leu Pro Glu
325 330 335
Tyr Leu Arg Asn Ser Ala Ser Glu Ser Gly Arg Val Thr Asp Tyr Arg
340 345 350
His Trp Gln Val Pro Leu Gly Arg Arg Phe Arg Ala Leu Lys Leu Trp
355 360 365
Ser Val Leu His Trp Tyr Gly Ala Glu Gly Leu Arg Ala His Ile Arg
370 375 380
Thr Gly Val Arg His Ala Gln Leu Phe Ala Asp Leu Val Gly Ala Asp
385 390 395 400
Asp Arg Phe Thr Leu Val Thr Pro Pro Ala Leu Gly Leu Val Thr Phe
405 410 415
Arg Gln Thr Gly Thr Asp Glu Glu Asn Arg Asn Leu Leu Gln Ala Ile
420 425 430
Asn Thr Glu Gly Thr Thr Phe Leu Thr His Ser Glu Lys Asn Gly Thr
435 440 445
Phe Phe Leu Arg Phe Ala Ala Gly Gly Thr Leu Thr Glu Asp His His
450 455 460
Val Arg Glu Ala Trp Arg Ala Val Gln Asn Ala Ile Pro Arg Ala Gln
465 470 475 480
His Leu Ala Gly Gly Ser Ala Asp Ala Leu Pro Glu
485 490
<210> 10
<211> 182
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Met Asn Thr Phe Arg Thr Ala Thr Ala Arg Asp Leu Pro Asp Val Ala
1 5 10 15
Ala Thr Leu Thr Glu Ala Phe Ala Ala Asp Pro Pro Thr Gln Trp Val
20 25 30
Phe Pro Asp Gly Ala Ala Ala Val Ser Arg Phe Phe Phe Gly Val Ala
35 40 45
Asp Arg Ala Arg Glu Ala Gly Gly Ile Val Glu Leu Leu Pro Gly Thr
50 55 60
Ala Ala Met Ile Ala Leu Pro Pro His Val Arg Leu Pro Asp Ala Pro
65 70 75 80
Ala Cys Gly Arg Gln Ala Glu Met Gln Arg Arg Leu Gly Glu Arg Arg
85 90 95
Pro Arg Thr Pro His Tyr Tyr Leu Leu Phe Tyr Gly Val Arg Thr Ala
100 105 110
His Gln Ser Ser Gly Leu Gly Gly Arg Met Leu Ser Asp Leu Ile Ser
115 120 125
Leu Ala Asp Arg Asp Arg Val Gly Thr Tyr Thr Glu Ala Ser Thr Trp
130 135 140
Arg Gly Ala Arg Leu Met Leu Arg His Gly Phe His Thr Ala Gln Pro
145 150 155 160
Leu Arg Leu Pro His Gly Pro Pro Met Phe Pro Leu Trp Arg Asp Pro
165 170 175
Ile His Asp His Cys Asp
180
<210> 11
<211> 368
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 11
Met Gly Ser Thr Ala Ala Asp Met Ala Ala Ala Ala Asp Glu Glu Ala
1 5 10 15
Cys Met Tyr Ala Leu Gln Leu Ala Ser Ser Ser Ile Leu Pro Met Thr
20 25 30
Leu Lys Asn Ala Ile Glu Leu Gly Leu Leu Glu Thr Leu Gln Ser Ala
35 40 45
Ala Val Ala Gly Gly Gly Gly Lys Ala Ala Leu Leu Thr Pro Ala Glu
50 55 60
Val Ala Asp Lys Leu Pro Ser Lys Ala Asn Pro Ala Ala Ala Asp Met
65 70 75 80
Val Asp Arg Met Leu Arg Leu Leu Ala Ser Tyr Asn Val Val Arg Cys
85 90 95
Glu Met Glu Glu Gly Ala Asp Gly Lys Leu Ser Arg Arg Tyr Ala Ala
100 105 110
Ala Pro Val Cys Lys Trp Leu Thr Pro Asn Glu Asp Gly Val Ser Met
115 120 125
Ala Ala Leu Ala Leu Met Asn Gln Asp Lys Val Leu Met Glu Ser Trp
130 135 140
Tyr Tyr Leu Lys Asp Ala Val Leu Asp Gly Gly Ile Pro Phe Asn Lys
145 150 155 160
Ala Tyr Gly Met Thr Ala Phe Glu Tyr His Gly Thr Asp Ala Arg Phe
165 170 175
Asn Arg Val Phe Asn Glu Gly Met Lys Asn His Ala Val Ile Ile Thr
180 185 190
Lys Lys Leu Leu Asp Leu Tyr Thr Gly Phe Asp Ala Ala Ser Thr Val
195 200 205
Val Asp Val Ala Gly Gly Val Gly Ala Thr Val Ala Ala Val Val Ser
210 215 220
Arg His Pro His Ile Arg Gly Ile Asn Tyr Asp Leu Pro His Val Ile
225 230 235 240
Ser Glu Ala Pro Pro Phe Pro Gly Val Glu His Val Gly Gly Asp Met
245 250 255
Phe Ala Ser Val Pro Arg Gly Gly Asp Ala Ile Leu Met Lys Trp Ile
260 265 270
Leu His Asp Trp Ser Asp Glu His Cys Ala Arg Leu Leu Lys Asn Cys
275 280 285
Tyr Asp Ala Leu Pro Glu His Gly Lys Val Val Val Val Glu Cys Val
290 295 300
Leu Pro Glu Ser Ser Asp Ala Thr Ala Arg Glu Gln Gly Val Phe His
305 310 315 320
Val Asp Met Ile Met Leu Ala His Asn Pro Gly Gly Lys Glu Arg Tyr
325 330 335
Glu Arg Glu Phe Arg Glu Leu Ala Arg Ala Ala Gly Phe Thr Gly Phe
340 345 350
Lys Ala Thr Tyr Ile Tyr Ala Asn Ala Trp Ala Ile Glu Phe Thr Lys
355 360 365

Claims (10)

1.一种重组大肠杆菌,其特征在于:所述重组大肠杆菌与受体大肠杆菌相比,所述重组大肠杆菌中褪黑素生物合成相关蛋白的基因的表达量增加和/或所述褪黑素生物合成相关蛋白的含量增加和/或所述褪黑素生物合成相关蛋白的活性增加;
所述褪黑素生物合成相关蛋白选自如下至少一种:
P1)苯丙氨酸羟化酶;
P2)二氢单磷酸还原酶;
P3)4a-羟基四氢生物蝶呤脱水酶;
P4)天冬氨酸转氨酶家族蛋白;
P5)N-乙酰转移酶;
P6)咖啡酸-O-甲基转移酶。
2.一种重组大肠杆菌的构建方法,其特征在于:所述构建方法包括如下步骤:将褪黑素生物合成相关蛋白的基因导入受体大肠杆菌,得到重组大肠杆菌;
所述褪黑素生物合成相关蛋白的基因选自如下至少一种:
P1)苯丙氨酸羟化酶基因;
P2)二氢单磷酸还原酶基因;
P3)4a-羟基四氢生物蝶呤脱水酶基因;
P4)天冬氨酸转氨酶家族蛋白基因;
P5)N-乙酰转移酶基因;
P6)咖啡酸-O-甲基转移酶基因。
3.根据权利要求2所述的构建方法,其特征在于:所述褪黑素生物合成相关蛋白的基因导入受体大肠杆菌是对所述受体大肠杆菌基因组进行下述M1)-M6)全部、任五种、任四种、任三种、任两种或任一种的改造得到的:
M1)过表达苯丙氨酸羟化酶基因;
M2)过表达二氢单磷酸还原酶基因;
M3)过表达4a-羟基四氢生物蝶呤脱水酶基因;
M4)过表达天冬氨酸转氨酶家族蛋白基因;
M5)过表达N-乙酰转移酶基因;
M6)过表达咖啡酸-O-甲基转移酶基因。
4.根据权利要求2或3所述的构建方法,其特征在于:所述褪黑素生物合成相关蛋白的基因通过方式甲或方式乙或方式丙导入所述受体大肠杆菌中;
所述方式甲为所述苯丙氨酸羟化酶基因和咖啡酸-O-甲基转移酶基因构建在一个表达载体上,所述天冬氨酸转氨酶家族蛋白基因、N-乙酰转移酶基因、4a-羟基四氢生物蝶呤脱水酶基因和二氢单磷酸还原酶基因构建在另一个表达载体上,所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白基因、N-乙酰转移酶基因、4a-羟基四氢生物蝶呤脱水酶基因和二氢单磷酸还原酶基因依次连接,然后均导入到受体大肠杆菌中;
所述方式乙为所述苯丙氨酸羟化酶基因、4a-羟基四氢生物蝶呤脱水酶基因和二氢单磷酸还原酶基因构建在一个表达载体上,所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶基因、4a-羟基四氢生物蝶呤脱水酶基因和二氢单磷酸还原酶基因依次连接;所述天冬氨酸转氨酶家族蛋白基因和N-乙酰转移酶基因构建在同一个表达载体上,然后均导入到受体大肠杆菌中;
所述方式丙为所述苯丙氨酸羟化酶基因、4a-羟基四氢生物蝶呤脱水酶基因、二氢单磷酸还原酶基因、天冬氨酸转氨酶家族蛋白基因、N-乙酰转移酶基因和咖啡酸-O-甲基转移酶基因构建在一个表达载体上,所述表达载体中六个基因的位置关系为苯丙氨酸羟化酶基因、4a-羟基四氢生物蝶呤脱水酶基因、二氢单磷酸还原酶基因、天冬氨酸转氨酶家族蛋白基因、N-乙酰转移酶基因和咖啡酸-O-甲基转移酶基因依次连接,然后导入到受体大肠杆菌中。
5.根据权利要求所述的重组大肠杆菌,或权利要求2-4任一所述的构建方法,其特征在于:所述苯丙氨酸羟化酶来自野油菜黄单胞菌,二氢单磷酸还原酶来自大肠杆菌,4a-羟基四氢生物蝶呤脱水酶来自铜绿假单胞菌,N-乙酰转移酶和天冬氨酸转氨酶家族蛋白来自小白链霉菌,所述咖啡酸-O-甲基转移酶来自水稻。
6.根据权利要求1所述的重组大肠杆菌,或权利要求2-4所述的构建方法,其特征在于:所述苯丙氨酸羟化酶为如下A1)或A2)所示的蛋白质:
A1)SEQ ID No.1第319-1209位所示的DNA分子编码的蛋白质;
A2)将A1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述二氢单磷酸还原酶为如下A3)或A4)所示的蛋白质:
A3)SEQ ID No.1第1615-2337位所示的DNA分子编码的蛋白质;
A4)将A3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶为如下A5)或A6)所示的蛋白质:
A5)SEQ ID No.1第1234-1590位所示的DNA分子编码的蛋白质;
A6)将A5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述天冬氨酸转氨酶家族蛋白为如下A7)或A8)所示的蛋白质:
A7)SEQ ID No.1第2362-3831位所示的DNA分子编码的蛋白质;
A8)将A7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述N-乙酰转移酶为如下A9)或A10)所示的蛋白质:
A9)SEQ ID No.1第3856-4404位所示的DNA分子编码的蛋白质;
A10)将A9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述咖啡酸-O-甲基转移酶为如下A11)或A12)所示的蛋白质:
A11)SEQ ID NO.1第4429-5535位所示的DNA分子编码的蛋白质;
A12)将A11)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与A11)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。
7.根据权利要求1所述的重组大肠杆菌,或权利要求2-4所述的构建方法,其特征在于:
所述苯丙氨酸羟化酶基因为如下B1)或B2)所示:
B1)编码序列为SEQ ID No.1第319-1209位所示的DNA分子;
B2)将SEQ ID No.1第319-1209位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第319-1209位所示的DNA分子具有相同功能的DNA分子;
所述二氢单磷酸还原酶基因为如下B3)或B4)所示:
B3)编码序列为SEQ ID No.1第1615-2337位所示的DNA分子;
B4)将SEQ ID No.1第1615-2337位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1615-2337位所示的DNA分子具有相同功能的DNA分子;
所述4a-羟基四氢生物蝶呤脱水酶基因为如下B5)或B6)所示:
B5)编码序列为SEQ ID No.1第1234-1590位所示的DNA分子;
B6)将SEQ ID No.1第1234-1590位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第1234-1590位所示的DNA分子具有相同功能的DNA分子;
所述天冬氨酸转氨酶家族蛋白基因为如下B7)或B8)所示:
B7)编码序列为SEQ ID No.1第2362-3831位所示的DNA分子;
B8)将SEQ ID No.1第2362-3831位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第2362-3831位所示的DNA分子具有相同功能的DNA分子;
所述N-乙酰转移酶为如下B9)或B10)所示:
B9)编码序列为SEQ ID No.1第3856-4404位所示的DNA分子;
B10)将SEQ ID No.1第3856-4404位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID No.1第3856-4404位所示的DNA分子具有相同功能的DNA分子;
所述咖啡酸-O-甲基转移酶基因为如下B11)或B12)所示:
B11)编码序列为SEQ ID NO.1第4429-5535位所示的DNA分子;
B12)将SEQ ID NO.1第4429-5535位所示的DNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与SEQ ID NO.1第4429-5535位所示的DNA分子具有相同功能的DNA分子。
8.由权利要求2-7任一所述的构建方法构建得到的重组大肠杆菌。
9.权利要求1或8所述的重组大肠杆菌在制备褪黑素中的应用。
10.制备褪黑素的方法,其特征在于:包括利用权利要求1或8所述的重组大肠杆菌催化色氨酸和甲硫氨酸反应得到褪黑素。
CN202010185591.XA 2020-03-17 2020-03-17 产褪黑素的重组大肠杆菌及其构建方法和应用 Active CN111349596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010185591.XA CN111349596B (zh) 2020-03-17 2020-03-17 产褪黑素的重组大肠杆菌及其构建方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010185591.XA CN111349596B (zh) 2020-03-17 2020-03-17 产褪黑素的重组大肠杆菌及其构建方法和应用

Publications (2)

Publication Number Publication Date
CN111349596A true CN111349596A (zh) 2020-06-30
CN111349596B CN111349596B (zh) 2022-03-01

Family

ID=71191450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010185591.XA Active CN111349596B (zh) 2020-03-17 2020-03-17 产褪黑素的重组大肠杆菌及其构建方法和应用

Country Status (1)

Country Link
CN (1) CN111349596B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113528411A (zh) * 2021-06-29 2021-10-22 河北维达康生物科技有限公司 生产n-乙酰基-5-甲氧基色胺的基因工程菌、构建方法及应用
CN113980141A (zh) * 2021-10-27 2022-01-28 湖北大学 基于大肠杆菌素e家族dna酶的蛋白质复合物及其在人工蛋白支架中的应用
CN114672525A (zh) * 2021-06-29 2022-06-28 河北维达康生物科技有限公司 N-乙酰基-5-甲氧基色胺的生物合成方法及其应用
CN114736843A (zh) * 2022-06-13 2022-07-12 北京质肽生物医药科技有限公司 一种大肠杆菌重组菌株、其制备方法和应用
CN117683794A (zh) * 2024-02-04 2024-03-12 湖南工程学院 一种促进人参中褪黑素和人参皂苷合成的PgCOMT2基因及其应用
CN117736960A (zh) * 2024-02-21 2024-03-22 滨州医学院 一种小白链霉菌基因工程菌及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960034423A (ko) * 1995-03-17 1996-10-22 이우용 방선균과 대장균에서 유용한 다기능 플라스미드 벡터
CN109999027A (zh) * 2019-05-15 2019-07-12 扬州大学 褪黑素的新用途

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960034423A (ko) * 1995-03-17 1996-10-22 이우용 방선균과 대장균에서 유용한 다기능 플라스미드 벡터
CN109999027A (zh) * 2019-05-15 2019-07-12 扬州大学 褪黑素的新用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HONGSONG LUO等: "Heterologous expression of ZjOMT from Zoysia japonica in Escherichia coli confers aluminum resistance through melatonin production", 《PLOS ONE》 *
YEONG BYEON等: "Melatonin production in Escherichia coli by dual expression of serotonin N-acetyltransferase and caffeic acid O-methyltransferase", 《APPL MICROBIOL BIOTECHNOL》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113528411A (zh) * 2021-06-29 2021-10-22 河北维达康生物科技有限公司 生产n-乙酰基-5-甲氧基色胺的基因工程菌、构建方法及应用
CN114672525A (zh) * 2021-06-29 2022-06-28 河北维达康生物科技有限公司 N-乙酰基-5-甲氧基色胺的生物合成方法及其应用
CN113980141A (zh) * 2021-10-27 2022-01-28 湖北大学 基于大肠杆菌素e家族dna酶的蛋白质复合物及其在人工蛋白支架中的应用
CN113980141B (zh) * 2021-10-27 2022-11-29 湖北大学 基于大肠杆菌素e家族dna酶的蛋白质复合物及其在人工蛋白支架中的应用
CN114736843A (zh) * 2022-06-13 2022-07-12 北京质肽生物医药科技有限公司 一种大肠杆菌重组菌株、其制备方法和应用
CN114736843B (zh) * 2022-06-13 2022-08-09 北京质肽生物医药科技有限公司 一种大肠杆菌重组菌株、其制备方法和应用
CN117683794A (zh) * 2024-02-04 2024-03-12 湖南工程学院 一种促进人参中褪黑素和人参皂苷合成的PgCOMT2基因及其应用
CN117683794B (zh) * 2024-02-04 2024-04-26 湖南工程学院 一种促进人参中褪黑素和人参皂苷合成的PgCOMT2基因及其应用
CN117736960A (zh) * 2024-02-21 2024-03-22 滨州医学院 一种小白链霉菌基因工程菌及其应用
CN117736960B (zh) * 2024-02-21 2024-05-07 滨州医学院 一种小白链霉菌基因工程菌及其应用

Also Published As

Publication number Publication date
CN111349596B (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN111349596B (zh) 产褪黑素的重组大肠杆菌及其构建方法和应用
AU2020289750B2 (en) Engineered meganucleases with recognition sequences found in the human T cell receptor alpha constant region gene
KR20110076868A (ko) 분리 조건 및/또는 안전한 작업 범위 하에서의 c5 탄화수소가 없는 이소프렌의 제조 방법 및 조성물
DK2443163T3 (en) POLYMERIZATION OF ISOPREN FROM RENEWABLE RESOURCES
AU2021200863A1 (en) Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene
CN101835898B (zh) 用于生物活性肽表达和纯化的可溶性标记
US11875298B2 (en) Sensor for NADP (H) and development of alcohol dehydrogenases
KR20150014953A (ko) 케톨-산 리덕토아이소머라아제 효소 및 사용 방법
KR20100118973A (ko) 이소프렌을 생성하기 위한 조성물 및 방법
KR20110122672A (ko) 이소프렌 및 공-산물을 제조하는 방법
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
HUE035866T2 (en) Valencene synthase polypeptides, coding nucleic acid molecules and their use
KR20120047908A (ko) 이소프렌 유도체들을 포함하는 연료 조성물들
TW201217532A (en) Nucleic acid construct, recombinant vector and method for producing a target protein
CN107429222B (zh) 在体外培养分节丝状菌的方法
KR20190133660A (ko) 변형된 피코르나바이러스 3c 프로테아제 및 그의 방법
CN111566217A (zh) 宿主细胞中风味化合物的产生
CN114836459B (zh) 一种胞嘧啶碱基编辑系统及其应用
TW589379B (en) Novel promoters and gene expression method by using the promoters
CN113025641B (zh) 一种将dna片段随机插入枯草芽孢杆菌染色体的方法及其应用
CN115605589A (zh) 改进的用于生产类异戊二烯的方法
CN117098848A (zh) 新型耻垢分枝杆菌重组菌株及其应用
CN111388658B (zh) 基于重组减毒李斯特菌的kras高表达癌症疫苗及其制备方法及其应用方法
Rosado Rivera IDENTIFICATION OF U6 PROMOTERS FOR CRISPR-CAS9 GENOME ENGINEERING IN AEDES AEGYPTI
CN117321194A (zh) 核酸测序文库的制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant