CN107058323B - 基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用 - Google Patents

基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用 Download PDF

Info

Publication number
CN107058323B
CN107058323B CN201710388810.2A CN201710388810A CN107058323B CN 107058323 B CN107058323 B CN 107058323B CN 201710388810 A CN201710388810 A CN 201710388810A CN 107058323 B CN107058323 B CN 107058323B
Authority
CN
China
Prior art keywords
leu
ala
gly
val
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710388810.2A
Other languages
English (en)
Other versions
CN107058323A (zh
Inventor
温廷益
刘树文
肖海涵
孙建建
张芸
商秀玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Microbiology of CAS
Original Assignee
Institute of Microbiology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Microbiology of CAS filed Critical Institute of Microbiology of CAS
Priority to CN201710388810.2A priority Critical patent/CN107058323B/zh
Publication of CN107058323A publication Critical patent/CN107058323A/zh
Priority to PCT/CN2017/107453 priority patent/WO2018077159A1/zh
Priority to EP17864640.2A priority patent/EP3533872A4/en
Priority to US16/345,669 priority patent/US11492616B2/en
Priority to CN201780003425.XA priority patent/CN108473990A/zh
Application granted granted Critical
Publication of CN107058323B publication Critical patent/CN107058323B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/06Alanine; Leucine; Isoleucine; Serine; Homoserine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用。本发明提供了ilv衰减子突变体,为将ilv衰减子的第1至n4位核苷酸去除得到的DNA分子;128≤n4≤147。本发明还保护将ilvLXGMEDA操纵子基因中从ilv衰减子第1位开始计数的第1至n4位去除得到的解除反馈阻遏的ilvLXGMEDA操纵子基因。本发明还保护一种解除微生物中ilvLXGMEDA操纵子反馈阻遏的方法,包括如下步骤:删除从ilv衰减子第1位开始计数的第1至n4位。采用本发明提供的方案,可以显著提高异亮氨酸及其衍生物产量,对于异亮氨酸及其衍生物的生产领域具有极其重大的应用推广价值。

Description

基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用
技术领域
本发明属于生物技术领域,具体涉及一种基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用。
背景技术
L-异亮氨酸是人体必需的8种氨基酸之一,与亮氨酸、缬氨酸统称为分支链氨基酸。由于它特殊的结构和功能,L-异亮氨酸在人和动物生命代谢中具有重要作用,参与合成激素、酶类等。目前,L-异亮氨酸主要用于饲料以及功能性饮料的添加剂。此外,L-异亮氨酸还被广泛应用于生物医药、食品工业、化妆品等领域,且新的用途被不断发现,大大增加了市场需求量。目前国内外工业化生产L-异亮氨酸的主要方法是微生物发酵法。然而,微生物中L-异亮氨酸的合成途径及调控方式较复杂,是高效发酵生产L-异亮氨酸及其衍生物的关键限制因素。
微生物合成氨基酸(如L-组氨酸、L-苏氨酸、L-苯丙氨酸、L-亮氨酸、L-异亮氨酸和L-色氨酸等)的操纵子基因的转录表达存在衰减调节机制。当胞内特定氨基酸浓度较高时,氨基酸操纵子的转录提前终止。相反地,当胞内特定氨基酸缺乏时,RNA聚合酶转录氨基酸操纵子。
微生物发酵生产L-异亮氨酸或其衍生物的过程中,胞内L-异亮氨酸逐步积累,通过上述衰减调控机制反馈阻遏ilvLXGMEDA操纵子的表达,从而反馈抑制L-异亮氨酸或其衍生物的生物合成。为了构建高效生产异亮氨酸或其衍生物的工程菌,亟需开发ilv衰减子改造的方法,以提高ilvLXGMEDA操纵子表达水平和异亮氨酸产量。
发明内容
本发明的目的是提供一种基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用。
本发明首先提供了DNA分子甲(ilv衰减子突变体),为如下(a1)、(a2)或(a3):
(a1)将ilv衰减子的第1至n4位核苷酸去除得到的DNA分子;n4为128以上147以下的自然数(n4优选为136);
(a2)在(a1)的末端连接标签序列得到的DNA分子;
(a3)在(a1)的末端连接连接序列得到的DNA分子。
所述DNA分子甲具体可如序列表的序列19第n1至n2位核苷酸所示。所述DNA分子甲具体可如序列表的序列19第n1至155位核苷酸所示(ilv衰减子截短体)。所述DNA分子甲具体可如序列表的序列19第n1至n3位核苷酸所示(ilv衰减子变体)。n1为129以上148以下的自然数(n1优选为137)。n2为155以上215以下的自然数(n2具体可为155以上185以下的自然数或186以上215以下的自然数,更具体可为155、185或215)。n3为156以上215以下的自然数(n3具体可为156以上185以下的自然数或186以上215以下的自然数,更具体可为185或215)。
本发明还保护所述DNA分子甲在促进下游目的基因表达中的应用。所述应用中,所述DNA分子甲作为调控元件。所述应用中,所述DNA分子甲位于所述目的基因的启动子和所述目的基因的起始密码子之间。所述应用中,所述启动子具体可为序列表的序列21所示的启动子Pthr-trc。所述应用中,所述目的基因具体可为序列表的序列22所示的gfp基因。
本发明还保护DNA分子乙,自上游至下游依次包括:所述DNA分子甲和目的基因。所述目的基因具体可为序列表的序列22所示的gfp基因。
本发明还保护DNA分子丙,自上游至下游依次包括:启动子、所述DNA分子甲、目的基因和终止子。所述启动子具体可为序列表的序列21所示的启动子Pthr-trc。所述目的基因具体可为序列表的序列22所示的gfp基因。所述终止子具体可为CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG。
所述DNA分子乙自上游至下游依次由如下元件组成:序列表的序列19第137至215位核苷酸,连接序列“GGTTCTGGTTCTGGTTCT”,序列表的序列22所示的gfp基因。
所述DNA片段丙自上游至下游依次由如下元件组成:序列表的序列21所示的启动子Pthr-trc,限制性内切酶Hind III的酶切识别序列,序列表的序列19第137至215位核苷酸,连接序列“GGTTCTGGTTCTGGTTCT”,序列表的序列22所示的gfp基因,终止子序列CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG。
本发明还保护DNA分子丁(解除反馈阻遏的ilvLXGMEDA操纵子基因,又称ilvLXGMEDA操纵子基因突变体),是将ilvLXGMEDA操纵子基因中从ilv衰减子第1位开始计数的第1至n4位核苷酸去除得到的DNA分子;n4为128以上147以下的自然数(n4优选为136)。
所述DNA分子丁具体可为序列表的序列19第137至6556位核苷酸所示的双链DNA分子。
本发明还保护DNA分子戊,包括所述DNA分子丁。DNA分子戊中,不具有序列表的序列19第1至n4位核苷酸;n4为128以上147以下的自然数(n4优选为136)。DNA分子戊自上游至下游依次由如下元件组成:序列表的序列20第1至987位核苷酸所示的DNA分子、序列表的序列19第137至6556位核苷酸所示的DNA分子。
含有所述DNA分子丁或所述DNA分子戊的重组载体也属于本发明的保护范围。
含有所述DNA分子丁或所述DNA分子戊的重组菌也属于本发明的保护范围。所述重组菌的基因组中不具有序列表的序列19第1至n4位核苷酸;n4为128以上147以下的自然数(n4优选为136)。所述重组菌中,具有编码苏氨酸操纵子的基因。所述重组菌中,具有编码IlvA*蛋白的基因。所述重组菌中,具有编码IlvC蛋白的基因。所述重组菌中,具有编码IlvG蛋白的基因。所述重组菌中,不具有编码MetA蛋白的基因。所述重组菌中,不具有编码LysA蛋白的基因。所述重组菌中,不具有编码Tdh蛋白的基因。所述重组菌中,不具有编码TDCC蛋白的基因。所述重组菌中,不具有编码SstT蛋白的基因。
本发明还保护一种构建重组菌的方法,包括如下步骤:通过同源重组的方式,使出发菌的基因组中具有所述DNA分子丁或所述DNA分子戊,得到重组菌。
所述出发菌具体可为重组菌EC711。
重组菌EC711为以大肠杆菌K12W3110为初始菌,敲除编码高丝氨酸琥珀酰转移酶(MetA蛋白)的基因、编码二氨基庚二酸脱羧酶(LysA蛋白)的基因、编码苏氨酸脱水酶(Tdh蛋白)的基因、编码苏氨酸吸收转运蛋白(TDCC蛋白)的基因和编码苏氨酸吸收转运蛋白(SstT蛋白)的基因,并且导入编码苏氨酸操纵子的基因,得到的重组菌。
重组菌EC711为以大肠杆菌K12W3110为初始菌,敲除编码高丝氨酸琥珀酰转移酶(MetA蛋白)的基因、编码二氨基庚二酸脱羧酶(LysA蛋白)的基因、编码苏氨酸脱水酶(Tdh蛋白)的基因、编码苏氨酸吸收转运蛋白(TDCC蛋白)的基因和编码苏氨酸吸收转运蛋白(SstT蛋白)的基因,并且导入编码苏氨酸操纵子的基因和编码苏氨酸脱氨酶(IlvA蛋白或IlvA*蛋白,优选为IlvA*蛋白;IlvA蛋白为野生型蛋白,IlvA*蛋白为在IlvA蛋白基础上进行突变得到的解除反馈抑制的蛋白)的基因,得到的重组菌。
重组菌EC711为以大肠杆菌K12W3110为初始菌,敲除编码高丝氨酸琥珀酰转移酶(MetA蛋白)的基因、编码二氨基庚二酸脱羧酶(LysA蛋白)的基因、编码苏氨酸脱水酶(Tdh蛋白)的基因、编码苏氨酸吸收转运蛋白(TDCC蛋白)的基因和编码苏氨酸吸收转运蛋白(SstT蛋白)的基因,并且导入编码苏氨酸操纵子的基因和编码苏氨酸脱氨酶(IlvA蛋白或IlvA*蛋白,优选为IlvA*蛋白)的基因和编码乙酰羟酸异构还原酶(IlvC蛋白)的基因,得到的重组菌。
由于IlvA蛋白受异亮氨酸反馈抑制,是异亮氨酸合成的限速步骤。因此本发明使用解除反馈抑制的IlvA*蛋白。MetA蛋白和LysA蛋白均为竞争代谢途径的蛋白,Tdh蛋白为苏氨酸降解途径的蛋白,TDCC蛋白和SstT蛋白为苏氨酸内排转运蛋白。为了更好的实现异亮氨酸合成,还需使其前体代谢物苏氨酸高效积累。作为苏氨酸高效生物合成的代谢工程改造方法,需要过表达苏氨酸操纵子基因。作为过表达的方法,可以使用表达强度增强的表达元件,如启动子和RBS等;也可以在染色体上增加所需表达基因的拷贝数;还可以在工程菌种导入携带所需过表达基因的质粒。
所述“编码苏氨酸操纵子的基因”为编码天冬氨酸激酶I-高丝氨酸脱氢酶复合体的基因、编码高丝氨酸脱氢酶的基因和编码苏氨酸合成酶的基因。
所述天冬氨酸激酶I-高丝氨酸脱氢酶复合体为ThrA蛋白(野生蛋白)或ThrA*蛋白(突变蛋白)。所述高丝氨酸脱氢酶为ThrB蛋白。所述苏氨酸合成酶为ThrC蛋白。编码ThrA蛋白的基因为thrA基因。编码ThrA*蛋白的基因为thrA*基因。编码ThrB蛋白的基因为thrB基因。编码ThrC蛋白的基因为thrC基因。
所述ThrA*蛋白为如下(b1)或(b2):
(b1)由序列表中序列10所示的氨基酸序列组成的蛋白质;
(b2)将序列10的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有天冬氨酸激酶I-高丝氨酸脱氢酶复合体功能的由序列10衍生的蛋白质。
所述thrA*基因为编码区如序列表中序列9第337-2799位核苷酸所示的DNA分子。
所述ThrB蛋白为如下(c1)或(c2):
(c1)由序列表中序列11所示的氨基酸序列组成的蛋白质;
(c2)将序列11的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有高丝氨酸脱氢酶功能的由序列11衍生的蛋白质。
所述thrB基因为编码区如序列表中序列9第2801-3733位核苷酸所示的DNA分子。
所述ThrC蛋白为如下(d1)或(d2):
(d1)由序列表中序列12所示的氨基酸序列组成的蛋白质;
(d2)将序列12的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有苏氨酸合成酶功能的由序列12衍生的蛋白质。
所述thrC基因为编码区如序列表中序列9第3734-5020位核苷酸所示的DNA分子。
所述“编码苏氨酸操纵子的基因”为序列表的序列9第172-5132位核苷酸所示的DNA分子。
所述IlvA*蛋白为如下(e1)或(e2):
(e1)由序列表中序列15所示的氨基酸序列组成的蛋白质;
(e2)将序列15的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有苏氨酸脱氨酶功能的由序列15衍生的蛋白质。
编码IlvA*蛋白的基因为开放阅读框如序列表的序列14第1至1545位核苷酸所示的DNA分子或为如序列表的序列14第1至1630位所示的DNA分子。
所述IlvC蛋白为如下(f1)或(f2):
(f1)由序列表中序列16所示的氨基酸序列组成的蛋白质;
(f2)将序列16的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有乙酰羟酸异构还原酶功能的由序列16衍生的蛋白质。
编码IlvC蛋白的基因为开放阅读框如序列表的序列14第1717至3192位核苷酸所示的DNA分子或为如序列表的序列14第1631至3275位所示的DNA分子。
所述重组菌EC711中,编码苏氨酸操纵子的基因整合于基因组的lysA基因位点(lysA基因位点即编码LysA蛋白的基因的位点)。
所述重组菌EC711中,编码苏氨酸脱氨酶的基因整合于基因组的sstT基因位点(sstT基因位点即编码SstT蛋白的基因的位点)。
所述重组菌EC711中,编码苏氨酸脱氨酶的基因和编码乙酰羟酸异构还原酶的基因整合于基因组的sstT基因位点(sstT基因位点即编码SstT蛋白的基因的位点)。
所述MetA蛋白为如下(g1)或(g2):
(g1)由序列表中序列2所示的氨基酸序列组成的蛋白质;
(g2)将序列2的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列2衍生的蛋白质。
所述metA基因为编码区如序列表中序列1第752-1681位核苷酸所示的DNA分子或为序列表中序列1所示的DNA分子。
所述LysA蛋白为如下(i1)或(i2):
(i1)由序列表中序列4所示的氨基酸序列组成的蛋白质;
(i2)将序列4的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列4衍生的蛋白质。
所述lysA基因为编码区如序列表中序列3第639-1901位核苷酸所示的DNA分子或为序列表中序列3所示的DNA分子。
所述Tdh蛋白为如下(j1)或(j2):
(j1)由序列表中序列6所示的氨基酸序列组成的蛋白质;
(j2)将序列6的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列6衍生的蛋白质。
所述tdh基因为编码区如序列表中序列5第753-1778位核苷酸所示的DNA分子或为序列表中序列5所示的DNA分子。
所述TDCC蛋白为如下(k1)或(k2):
(k1)由序列表中序列8所示的氨基酸序列组成的蛋白质;
(k2)将序列8的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列8衍生的蛋白质。
所述tdcC基因编码区如序列表中序列7第701-2032位核苷酸所示的DNA分子或为序列表中序列7所示的DNA分子。
所述SstT蛋白为如下(m1)或(m2):
(m1)由序列表中序列18所示的氨基酸序列组成的蛋白质;
(m2)将序列18的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列18衍生的蛋白质。
所述sstT基因为编码区如序列表中序列17第701-1945位核苷酸所示的DNA分子或为序列表中序列17所示的DNA分子。
所述出发菌可为埃希氏菌属细菌或棒杆菌属细菌。所述埃希氏菌属细菌具体可为大肠杆菌。所述棒杆菌属细菌具体可为谷氨酸棒杆菌。
本发明还保护以上任一所述重组菌在制备异亮氨酸中的应用。
应用所述重组菌生产异亮氨酸时,采用葡萄糖作为碳源。
应用所述重组菌生产异亮氨酸时,采用发酵培养基培养所述重组菌。
所述发酵培养基可以是丰富培养基,也可以是无机盐培养基。培养基包含碳源、氮源、无机离子、抗生素和其它的营养因子。作为碳源,可以使用葡萄糖、乳糖、半乳糖等糖类;也可以是甘油、甘露醇等醇类;也可以使用葡萄糖酸、柠檬酸、丁二酸等有机酸类。作为氮源,可以使用氨水、硫酸铵、磷酸铵、氯化铵等无机氮源;也可以使用玉米浆、豆粕水解液、毛发粉、酵母提取物、蛋白胨等有机氮源。无机离子包含铁、钙、镁、锰、钼、钴、铜、钾等离子中的一种或多种。其它营养因子还包括生物素、维生素B1、吡哆醛等维生素。
所述发酵培养基中的碳源为葡萄糖。
所述发酵培养基具体可为:葡萄糖20.0g/L、硫酸铵15.0g/L、磷酸二氢钾2.0g/L、七水硫酸镁2.0g/L、酵母粉2.0g/L、蛋氨酸0.6g/L、L-赖氨酸盐酸盐1.2g/L、碳酸钙15.0g/L、微量元素混合液5mL/L,余量为水。
微量元素混合液:FeSO4·7H2O 10g/L、CaCl2 1.35g/L、ZnSO4·7H2O 2.25g/L、MnSO4·4H2O0.5g/L、CuSO4·5H2O 1g/L、(NH4)6Mo7O24·4H2O 0.106g/L、Na2B4O7·10H2O0.23g/L、CoCl2·6H2O0.48g/L、35%HCl10mL/L,余量为水。
所述培养的条件具体可为:37℃、220rpm震荡培养36h。
所述培养的条件具体可为:将种子液以3%的接种量接种至发酵培养基中,37℃、220rpm震荡培养36h。种子液的制备方法如下:将重组菌接种至液体LB培养基中,37℃、220rpm振荡培养12h,得到种子液。所述种子液的OD600nm值具体可为5.0。
所述培养的过程中进行如下过程控制:培养过程中,用氨水调节反应体系的pH值使其维持在6.8-7.0;培养过程中,每隔3-4h取样一次,检测葡萄糖含量,当体系中的葡萄糖含量低于5g/L时,补加葡萄糖并使体系中的葡萄糖浓度达到10g/L。
本发明还保护一种提高微生物生产异亮氨酸的能力的方法,包括如下步骤:删除微生物的ilvLXGMEDA操纵子基因中从ilv衰减子第1位开始计数的第1至n4位核苷酸;n4为128以上147以下的自然数(n4优选为136)。所述微生物为具有ilvLXGMEDA操纵子的微生物。所述微生物具体可为埃希氏菌属微生物。所述埃希氏菌属微生物具体可为大肠杆菌。
本发明还保护一种解除微生物中ilvLXGMEDA操纵子反馈阻遏的方法,包括如下步骤:删除微生物的ilvLXGMEDA操纵子基因中从ilv衰减子第1位开始计数的第1至n4位核苷酸;n4为128以上147以下的自然数(n4优选为136)。所述微生物为具有ilvLXGMEDA操纵子的微生物。所述微生物具体可为埃希氏菌属微生物。所述埃希氏菌属微生物具体可为大肠杆菌,更具体可为大肠杆菌K-12或其衍生菌株。
以上任一所述ilvLXGMEDA操纵子可为来源于埃希氏菌属微生物的ilvLXGMEDA操纵子,具体可为来源于大肠杆菌的ilvLXGMEDA操纵子。埃希氏菌属微生物并不特别限定用哪一种微生物,若野生型株用作含有ilvLXGMEDA操纵子的DNA供体株,可以得到含有野生型ilvLXGMEDA操纵子的DNA。然而,大肠杆菌K-12株不表达活性的乙酰羟基酸合成酶同工酶Ⅱ。因此,本发明的ilvG基因来源于大肠杆菌BL21株的染色体DNA供体。
以上任一所述ilvLXGMEDA操纵子基因包括ilv衰减子、编码IlvX蛋白的基因,编码IlvG蛋白(乙酰乳酸合酶)的基因、编码IlvM蛋白(乙酰乳酸合酶)的基因、编码IlvE蛋白(支链氨基酸转氨酶)的基因、编码IlvD蛋白(二羟酸脱水酶)的基因和编码IlvA蛋白(苏氨酸脱氨酶)的基因。
所述IlvX蛋白可为如下(p1)或(p2):
(p1)由序列表中序列24所示的氨基酸序列组成的蛋白质;
(p2)将序列的氨基酸序列24经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的由序列24衍生的蛋白质。
IlvG蛋白可为如下(q1)或(q2):
(q1)由序列表中序列25所示的氨基酸序列组成的蛋白质;
(q2)将序列的氨基酸序列25经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有乙酰乳酸合酶功能的由序列25衍生的蛋白质。
IlvM蛋白可为如下(r1)或(r2):
(r1)由序列表中序列26所示的氨基酸序列组成的蛋白质;
(r2)将序列的氨基酸序列26经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有乙酰乳酸合酶功能的由序列26衍生的蛋白质。
IlvE蛋白可为如下(s1)或(s2):
(s1)由序列表中序列27所示的氨基酸序列组成的蛋白质;
(s2)将序列的氨基酸序列27经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有支链氨基酸转氨酶功能的由序列27衍生的蛋白质。
IlvD蛋白可为如下(t1)或(t2):
(t1)由序列表中序列28所示的氨基酸序列组成的蛋白质;
(t2)将序列的氨基酸序列28经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有二羟酸脱水酶功能的由序列28衍生的蛋白质。
IlvA蛋白可为如下(w1)或(w2):
(w1)由序列表中序列29所示的氨基酸序列组成的蛋白质;
(w2)将序列的氨基酸序列29经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有二羟酸脱水酶功能的由序列29衍生的蛋白质。
编码IlvX蛋白的基因具体可如序列表的序列19第186-236位核苷酸所示。
编码IlvG蛋白的基因具体可如序列表的序列19第239-1885位核苷酸所示。
编码IlvM蛋白的基因具体可如序列表的序列19第1882-2145位核苷酸所示。
编码IlvE蛋白的基因具体可如序列表的序列19第2165-3094位核苷酸所示。
编码IlvD蛋白的基因具体可如序列表的序列19第3159-5009位核苷酸所示。
编码IlvA蛋白的基因具体可如序列表的序列19第5012-6556位核苷酸所示。
ilv衰减子如序列表的序列19第1至155位核苷酸所示。
ilvLXGMEDA操纵子具体可如序列表的序列19所示。
以上任一所述异亮氨酸具体可为L-异亮氨酸。
本发明通过去除ilv衰减子的特定序列,意外的获得了可以显著提高基因表达水平的ilv衰减子突变体。本发明通过删除衰减子中编码前导肽的基因ilvL和终止子茎环结构中前段反向互补回文序列,可以显著提高后续基因的表达水平。显而易见,根据本专利的试验结果,本领域技术人员可轻易推论得到,在本发明保护的ilv衰减子突变体上同时保留上述衰减子终止子茎环结构中前段反向互补回文序列的部分序列,但尚未形成稳定的茎环结构,同样可能得到相似性能的ilv衰减子突变体。因此,这种类似的改造ilv衰减子的方法也在本专利的保护范围之中。显而易见,在改造菌株染色体上的ilv衰减子同时删除ilvL开放阅读框上游若干碱基对,也在本发明的保护范围内。显而易见,本发明解除大肠杆菌的ilv衰减子的方法,同样可应用于其它菌属的ilv衰减子。ilvLXGMEDA操纵子基因编码从苏氨酸合成异亮氨酸的5步反应的酶,因此,通过改造ilv衰减子,可以高效解除ilvLXGMEDA操纵子的衰减调控,提高ilvLXGMEDA操纵子的表达水平。本发明可以用于生产异亮氨酸,因此,显而易见,本发明还可用于异亮氨酸代谢途径下游化合物的生物合成以及异亮氨酸衍生物的合成。
采用本发明提供的方案,可以显著提高异亮氨酸及其衍生物产量,对于异亮氨酸及其衍生物的生产领域具有极其重大的应用推广价值。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中如未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段和市售的常用仪器、试剂,可参见《分子克隆实验指南(第3版)》(科学出版社)、《微生物学实验(第4版)》(高等教育出版社)以及相应仪器和试剂的厂商说明书等参考。ATCC:https://www.atcc.org/
大肠杆菌K12W3110(又称E.coli K12W3110):日本技术评价研究所生物资源中心(NITE Biological Resource Center,NBRC)。大肠杆菌K12 MG1655:ATCC编号为700926。pKOV质粒:Addgene公司,产品目录号为25769。pACYC184质粒:NEB公司,产品目录号E4152S。pGFPuv载体:Clontech Laboratories,Inc.,Catalog No.632312。大肠杆菌EC135:记载于如下文献:Zhang et al,Plos Genetics,2012,8(9):e1002987。
实施例1、E.coli K-12W3110△metA△lysA△tdh△tdcC的构建
以大肠杆菌K12W3110为出发菌株,依次敲除metA基因(编码高丝氨酸琥珀酰转移酶的基因)、lysA基因(编码二氨基庚二酸脱羧酶的基因)、tdh基因(编码苏氨酸脱水酶的基因)和tdcC基因(编码苏氨酸吸收转运蛋白的基因),获得底盘工程菌,将其命名为E.coliK-12W3110△metA△lysA△tdh△tdcC。
1、敲除metA基因
(1)以大肠杆菌K12W3110的基因组DNA为模板,采用WY569和WY570组成的引物对进行PCR扩增,得到DNA片段Ⅰ-甲(metA基因上游区域)。
(2)以大肠杆菌K12W3110的基因组DNA为模板,采用WY571和WY572组成的引物对进行PCR扩增,得到DNA片段Ⅰ-乙(metA基因下游区域)。
(3)将DNA片段Ⅰ-甲和DNA片段Ⅰ-乙混合后作为模板,采用WY569和WY572组成的引物对进行PCR扩增,得到DNA片段Ⅰ-丙。
(4)取pKOV质粒,用限制性内切酶Sal I和Not I进行双酶切,回收载体骨架(约5.6kb)。
(5)取DNA片段Ⅰ-丙,用限制性内切酶Sal I和Not I进行双酶切,回收酶切产物。
(6)将步骤(4)得到的载体骨架和步骤(5)得到的酶切产物连接,得到重组质粒Ⅰ。根据测序结果,对重组质粒Ⅰ进行结构描述如下:在pKOV质粒的Sal I和Not I酶切位点之间插入了如下特异DNA分子:自上游至下游依次由序列表的序列1第245-751位核苷酸所示的上游区段和序列表的序列1第1682-2154位核苷酸所示的下游区段组成。metA基因如序列表的序列1所示,第752-1681位核苷酸为开放阅读框(编码序列表的序列2所示的metA蛋白)。
(7)将重组质粒Ⅰ导入大肠杆菌K12W3110,得到metA基因敲除的重组菌,命名为E.coli K12W3110△metA。
metA基因敲除的重组菌的鉴定方法:采用WY583和WY584组成的引物对进行PCR扩增,如果得到1375bp扩增产物,初步判断为候选的目标菌;进一步通过测序验证菌株染色体上的metA基因的开放阅读框被敲除。
2、敲除lysA基因
(1)以大肠杆菌K12W3110的基因组DNA为模板,采用WY573和WY574组成的引物对进行PCR扩增,得到DNA片段Ⅲ-甲(lysA基因上游区域)。
(2)以大肠杆菌K12W3110的基因组DNA为模板,采用WY575和WY576组成的引物对进行PCR扩增,得到DNA片段Ⅲ-乙(lysA基因下游区域)。
(3)将DNA片段Ⅲ-甲和DNA片段Ⅲ-乙混合后作为模板,采用WY573和WY576组成的引物对进行PCR扩增,得到DNA片段Ⅲ-丙。
(4)取pKOV质粒,用限制性内切酶Bam HI和Not I进行双酶切,回收载体骨架(约5.6kb)。
(5)取DNA片段Ⅲ-丙,用限制性内切酶Bam HI和Not I进行双酶切,回收酶切产物。
(6)将步骤(4)得到的载体骨架和步骤(5)得到的酶切产物连接,得到重组质粒Ⅲ。根据测序结果,对重组质粒Ⅲ进行结构描述如下:在pKOV质粒的Bam HI和Not I酶切位点之间插入了如下特异DNA分子:自上游至下游依次由序列表的序列3第132-638位核苷酸所示的上游区段和序列表的序列3第1902-2445位核苷酸所示的下游区段组成。lysA基因如序列表的序列3所示,第639-1901位核苷酸为开放阅读框(编码序列表的序列4所示的lysA蛋白)。
(7)将重组质粒Ⅲ导入E.coli K12W3110△metA,得到lysA基因敲除的重组菌,命名为E.coli K-12W3110△metA△lysA。
lysA基因敲除的重组菌的鉴定方法:采用WY585和WY586组成的引物对进行PCR扩增,如果得到1302bp扩增产物,初步判断为候选的目标菌;进一步通过测序验证菌株染色体上的lysA基因的开放阅读框被敲除。
3、敲除tdh基因
(1)以大肠杆菌K12W3110的基因组DNA为模板,采用WY598和WY599组成的引物对进行PCR扩增,得到DNA片段Ⅳ-甲(tdh基因上游区域)。
(2)以大肠杆菌K12W3110的基因组DNA为模板,采用WY600和WY601组成的引物对进行PCR扩增,得到DNA片段Ⅳ-乙(tdh基因下游区域)。
(3)将DNA片段Ⅳ-甲和DNA片段Ⅳ-乙混合后作为模板,采用WY598和WY601组成的引物对进行PCR扩增,得到DNA片段Ⅳ-丙。
(4)取pKOV质粒,用限制性内切酶Bam HI和Not I进行双酶切,回收载体骨架(约5.6kb)。
(5)取DNA片段Ⅳ-丙,用限制性内切酶Bam HI和Not I进行双酶切,回收酶切产物。
(6)将步骤(4)得到的载体骨架和步骤(5)得到的酶切产物连接,得到重组质粒Ⅳ。根据测序结果,对重组质粒Ⅳ进行结构描述如下:在pKOV质粒的Bam HI和Not I酶切位点之间插入了如下特异DNA分子:自上游至下游依次由序列表的序列5第227-752位核苷酸所示的上游区段和序列表的序列5第1779-2271位核苷酸所示的下游区段组成。tdh基因如序列表的序列5所示,第753-1778位核苷酸为开放阅读框(编码序列表的序列6所示的tdh蛋白)。
(7)将重组质粒Ⅳ导入E.coli K-12W3110△metA△lysA,得到tdh基因敲除的重组菌,命名为E.coli K-12W3110△metA△lysA△tdh。
tdh基因敲除的重组菌的鉴定方法:采用WY602和WY603组成的引物对进行PCR扩增,如果得到1434bp扩增产物,初步判断为候选的目标菌;进一步通过测序验证菌株染色体上的tdh基因的开放阅读框被敲除。
4、敲除tdcC基因
(1)以大肠杆菌K12W3110的基因组DNA为模板,采用WY476和WY477组成的引物对进行PCR扩增,得到DNA片段Ⅴ-甲(tdcC基因上游区域)。
(2)以大肠杆菌K12W3110的基因组DNA为模板,采用WY478和WY479组成的引物对进行PCR扩增,得到DNA片段Ⅴ-乙(tdcC基因下游区域)。
(3)将DNA片段Ⅴ-甲和DNA片段Ⅴ-乙混合后作为模板,采用WY476和WY479组成的引物对进行PCR扩增,得到DNA片段Ⅴ-丙)。
(4)取pKOV质粒,用限制性内切酶Bam HI和Not I进行双酶切,回收载体骨架(约5.6kb)。
(5)取DNA片段Ⅴ-丙,用限制性内切酶Bam HI和Not I进行双酶切,回收酶切产物。
(6)将步骤(4)得到的载体骨架和步骤(5)得到的酶切产物连接,得到重组质粒Ⅴ。根据测序结果,对重组质粒Ⅴ进行结构描述如下:在pKOV质粒的Bam HI和Not I酶切位点之间插入了如下特异DNA分子:自上游至下游依次由序列表的序列7第176-700位核苷酸所示的上游区段和序列表的序列7第1853-2388位核苷酸所示的下游区段组成。tdcC基因如序列表的序列7所示,第701-2032位核苷酸为开放阅读框(编码序列表的序列8所示的tdcC蛋白)。
(7)将重组质粒Ⅴ导入E.coli K-12W3110△metA△lysA△tdh,得到tdcC基因敲除的重组菌,命名为E.coli K-12W3110△metA△lysA△tdh△tdcC。
tdcC基因敲除的重组菌的鉴定方法:采用WY497和WY498组成的引物对进行PCR扩增,如果得到1453bp扩增产物,初步判断为候选的目标菌;进一步通过测序验证菌株染色体上的tdcC基因的如下区段被敲除:序列7中第701-1852位核苷酸。
实施例中所用的各个引物序列如下(5’→3’):
WY569:GCGTCGACATAGAACCCAACCGCCTGCTCA;
WY570:AACGATCGACTATCACAGAAGAAACCTGATTACCTCACTACATA;
WY571:TATGTAGTGAGGTAATCAGGTTTCTTCTGTGATAGTCGATCGTT;
WY572:ATTGCGGCCGCCCGAAATAAAATCAGGCAACGT;
WY583:CGTTAATGAAATATCGCCAG;
WY584:TCGAAATCGGCCATAAAGAC。
WY573:CGCGGATCCGGCACGATATTTAAGCTGAC;
WY574:CAACCAGCGACTAACCGCAGAACAAACTCCAGATAAGTGC;
WY575:GCACTTATCTGGAGTTTGTTCTGCGGTTAGTCGCTGGTTG;
WY576:ATTGCGGCCGCGCTGGCAACGCGTCATTTAA;
WY585:GTAACACACACACTTCATCT;
WY586:GATCCCGGATGCTGATTTAG。
WY598:CGCGGATCCATACTGCGATGTGATGGGCC;
WY599:AATACCAGCCCTTGTTCGTGCTCACATCCTCAGGCGATAA;
WY600:TTATCGCCTGAGGATGTGAGCACGAACAAGGGCTGGTATT;
WY601:ATTGCGGCCGCCGTTGCCACTTCAATCCCAC;
WY602:GCTATGCCAACAACGATATG;
WY603:GGTTAATACGCCGGTTGAGC。
WY476:CGCGGATCCGGAACGATTGGTCTGGAAAT;
WY477:GGCTTCAATCAGGTCAAGGATATCCTATCCTCAACGAATTA;
WY478:TAATTCGTTGAGGATAGGATATCCTTGACCTGATTGAAGCC;
WY479:ATTGCGGCCGCCGCGACGGATATTATCAATGAC;
WY497:GCGCCAAAATCCAAAGTAGC;
WY498:ATGTGCGCGCTGGGAAACAT。
实施例2、制备异亮氨酸
一、制备具有thrA突变基因的苏氨酸操纵子
1、以大肠杆菌K12W3110的基因组为模板,采用WY914和WY926组成的引物对进行PCR扩增,得到PCR扩增产物。
WY914:CCCAAGCTTACAGAGTACACAACATCCATG;
2、以大肠杆菌K12W3110的基因组为模板,采用WY925和WY832组成的引物对进行PCR扩增,得到PCR扩增产物。
WY832:CCCGATATCGCATTTATTGAGAATTTCTCC。
3、将步骤1得到的PCR扩增产物和步骤2得到的PCR扩增产物混合后作为模板,采用WY914和WY832组成的引物对进行PCR扩增,得到PCR扩增产物。
经测序,步骤3得到的PCR扩增产物的Hind Ⅲ和EcoR V酶切识别位点之间的核苷酸如序列表的序列9第172至5132所示。序列表的序列9中,第337-2799位核苷酸编码ThrA*蛋白,第2801-3733位核苷酸编码ThrB蛋白,第3734-5020位核苷酸编码ThrC蛋白。ThrA*蛋白(突变蛋白)如序列表的序列10所示,与ThrA蛋白(野生蛋白)相比,突变蛋白只存在一个氨基酸残基的差异,即第253位氨基酸残基由谷氨酸突变为了组氨酸。ThrB蛋白如序列表的序列11所示。ThrC蛋白如序列表的序列12所示。
二、构建重组质粒pACYC184-PPL
1、合成序列表的序列13所示的双链DNA分子(启动子PPL)。
2、以步骤1制备的双链DNA分子为模板,采用WY843和WY842组成的引物对进行PCR扩增,得到PCR扩增产物。
WY843:TGCTCTAGACAATTCCGACGTCTAAGAAA;
WY842:CCCAAGCTTGGTCAGTGCGTCCTGCTGAT。
3、取步骤2得到的PCR扩增产物,用限制性内切酶Xba I和Hind III进行双酶切,回收酶切产物。
4、取pACYC184质粒,用限制性内切酶Xba I和Hind III进行双酶切,回收载体骨架(约4.1kb)。
5、将步骤3的酶切产物和步骤4的载体骨架连接,得到重组质粒pACYC184-PPL
三、构建具有thrA突变基因的苏氨酸操纵子的重组质粒
1、取重组质粒pACYC184-PPL,用限制性内切酶Hind Ⅲ和EcoR V双酶切,回收载体骨架(约4.2kb)。
2、取步骤一的3得到的PCR扩增产物,用限制性内切酶Hind Ⅲ和EcoR V双酶切,回收酶切产物。
3、将步骤1的载体骨架和步骤2的酶切产物连接,得到重组质粒pACYC184-PPL-thrLA*BC914。根据测序结果,对重组质粒pACYC184-PPL-thrLA*BC914进行结构描述如下:在质粒pACYC184的Xba I和EcoR V酶切位点之间插入了特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列13所示的启动子PPL,限制性内切酶Hind Ⅲ的酶切识别序列,序列表的序列9第172-5132位核苷酸所示的DNA分子。
四、lysA位点苏氨酸操纵子整合质粒的构建
1、以大肠杆菌K12W3110的基因组为模板,采用WY970和WY971组成的引物对进行PCR扩增,得到PCR扩增产物(lysA位点整合的上游同源臂)。
WY970:AACTGCAGGGCACGATATTTAAGCTGAC;
WY971:GAAGATCTAACAAACTCCAGATAAGTGC。
2、取步骤1得到的PCR扩增产物,用限制性内切酶Pst I和Bgl II进行双酶切,回收酶切产物。
3、取pKOV质粒,用限制性内切酶Pst I和Bgl II进行双酶切,回收载体骨架。
4、将步骤2的酶切产物与步骤3的载体骨架连接,得到重组质粒pKOV-UplysA
5、以大肠杆菌K12W3110的基因组为模板,采用WY974和WY975组成的引物对进行PCR扩增,得到PCR扩增产物(lysA基因位点整合的下游同源臂)。
WY974:CGCGGATCCCTGCGGTTAGTCGCTGGTTG;
WY975:CTAGTCTAGAGCTGGCAACGCGTCATTTAA。
6、取步骤5得到的PCR扩增产物,用限制性内切酶BamH I和Xba I进行双酶切,回收酶切产物。
7、取重组质粒pKOV-UplysA,用限制性内切酶BamH I和Xba I进行双酶切,回收载体骨架。
8、将步骤6的酶切产物和步骤7的载体骨架连接,得到重组质粒pKOV-UPlysA-DownlysA
9、以重组质粒pACYC184-PPL-thrLA*BC914为模板,采用WY978和WY979组成的引物对进行PCR扩增,得到PCR扩增产物(PPL-thrA*BC片段)。
WY978:GAAGATCTCAATTCCGACGTCTAAGAAA;
WY979:CGCGGATCCGCATTTATTGAGAATTTCTCC。
10、取步骤9的PCR扩增产物,用限制性内切酶Bgl II和BamH I进行双酶切,回收酶切产物。
11、取重组质粒pKOV-UPlysA-DownlysA,用限制性内切酶Bgl II和BamH I进行双酶切,回收载体骨架。
12、将步骤10的酶切产物和步骤11的载体骨架连接,得到重组质粒pKOV-UPlysA-PPL-thrA*BC-DownlysA
根据测序结果,对重组质粒pKOV-UPlysA-PPL-thrA*BC-DownlysA进行结构描述如下:在pKOV质粒的Pst I和Xba I酶切位点之间插入了特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列3第132-638位核苷酸所示的lysA基因位点整合的上游同源臂、限制性内切酶Bgl II的酶切识别序列、序列表的序列13所示的启动子PPL,限制性内切酶Hind Ⅲ的酶切识别序列,序列表的序列9第172-5132位核苷酸所示的DNA分子、限制性内切酶BamH I的酶切识别序列、序列表的序列3第1902-2445位核苷酸所示的lysA基因位点整合的下游同源臂。
五、整合苏氨酸操纵子工程菌的构建
将重组质粒pKOV-UPlysA-PPL-thrA*BC-DownlysA导入E.coli K-12W3110△metA△lysA△tdh△tdcC,得到lysA基因位点整合了步骤三的3中所述的特异DNA分子的重组菌,命名为重组菌E.coli W3110△metA△tdh△tdcC△lysA::PPL-thrA*BC,简称重组菌EC272。
lysA基因位点整合了步骤三的3中所述的特异DNA分子的重组菌的鉴定方法:采用引物WY585和WY586进行PCR鉴定,如果得到6443bp的扩增产物初步判断为候选的目标菌;进一步通过测序验证。
六、EC272sstT::ilvA*-ilvC的构建
1、ilvA基因定点突变
以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY4027和WY4028组成的引物对进行PCR扩增,得到PCR扩增产物A1;以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY4029和WY4030组成的引物对进行PCR扩增,得到PCR扩增产物A2;将PCR扩增产物A1和PCR扩增产物A2混合后作为模板,采用WY4027和WY4030组成的引物对进行PCR扩增,得到PCR扩增产物A3。
WY4028:CAGCGTGTTGGCGAAGCGCAGAAACGCGC;
WY4029:GCGCGTTTCTGCGCTTCGCCAACACGCTG;
WY4030:CTATATGACAGGAAATTTATTGCGGGCATTCTGGAAGATTTTGC。
引物中,方框标注RBS,波浪下划线标注启动子Ptrc部分区段。引物WY4028和引物WY4029引入了4个点突变,ilvA基因的开放阅读框的第1339位核苷酸由C突变为T,且第1341位核苷酸由G突变为T,且第1351位碱基由C突变为G,且第1352位碱基由T突变为C。ilvA基因发生上述4个点突变后命名为ilvA*基因。
2、以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY4025和WY4026组成的引物对进行PCR扩增,得到PCR扩增产物B1;
WY4025:CGCGGATCCgtgctgacctcaaacctgt;
WY4026:CTCGGTTACATTATACGAGCCGGATGATTAATTGTCAACGATCCTTTCATTGTGTTGTC。
3、将步骤1得到的PCR扩增产物A3和步骤2得到的PCR扩增产物B1混合后作为模板,采用WY4025和WY4030组成的引物对进行PCR扩增,得到PCR扩增产物C1。
4、以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY4031和WY4032组成的引物对进行PCR扩增,得到PCR扩增产物B2。
WY4031:GCAAAATCTTCCAGAATGCCCCGCAATAAATTTCCTGTCATATAG;
WY4032:ACCGAACATATTACAGGCCAGCAAGGCCTTCTCCAGGAGAA。
5、以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY4033和WY4034组成的引物对进行PCR扩增,得到PCR扩增产物B3。
WY4033:TTCTCCTGGAGAAGGCCTTGctggcctgtaatatgttcggt;
WY4034:5-ATTGCGGCCGCCTCGCGAAGTTCCATCATCCT。
6、将步骤4得到的PCR扩增产物B2和步骤5得到的PCR扩增产物B3混合后作为模板,采用WY4031和WY4034组成的引物对进行PCR扩增,得到PCR扩增产物C2。
7、将步骤3得到的PCR扩增产物C1和步骤6得到的PCR扩增产物C2混合后作为模板,采用WY4025和WY4034组成的引物对进行重叠PCR,得到PCR扩增产物D。
8、取步骤7得到的PCR扩增产物D,用限制性内切酶Bam HI和Not I进行双酶切,回收酶切产物。
9、取pKOV质粒,用限制性内切酶Bam HI和Not I进行双酶切,回收载体骨架。
10、将步骤8的酶切产物和步骤9的载体骨架连接,得到重组质粒pKOV-ilvA*-ilvC。根据测序结果,对重组质粒pKOV-ilvA*-ilvC进行结构描述如下:在pKOV质粒的BamHI和Not I酶切位点之间插入了特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列17第45-696位核苷酸所示的上游臂、启动子Ptrc“ttgacaattaatcatccggctcgtataatgt”、RBS序列“AACCGAGGAGCAGACA”、序列表的序列14所示的DNA分子(序列14中,第1至1630位为ilvA*基因,第1631至3275位为ilvC基因)、序列表的序列17第1760-2240位核苷酸所示的下游臂。ilvA*基因的开放阅读框如序列表的序列14第1至1545位核苷酸所示,编码序列表的序列15所示的IlvA*蛋白(突变蛋白)。ilvC基因的开放阅读框如序列表的序列14第1717至3192位核苷酸所示,编码序列表的序列16所示的IlvC蛋白。sstT基因如序列表的序列17所示,其开放阅读框为第701-1945位核苷酸,编码序列表的序列18所示的SstT蛋白。
11、将重组质粒pKOV-ilvA*-ilvC导入重组菌EC272,得到sstT基因被部分敲除(sstT基因的如下区段被敲除:序列17中第697-1759位核苷酸)且sstT基因位点整合了启动子Ptrc“ttgacaattaatcatccggctcgtataatgt”、RBS序列“AACCGAGGAGCAGACA”和序列表的序列14所示的DNA分子组成的DNA分子的重组菌,将已进行测序验证的重组菌命名为重组菌E.coli W3110△metA△tdh△tdcC△lysA::PPL-thrA*BC△sstT::ilvA*-ilvC,简称重组菌EC711。
七、构建工程菌EC711ilvG+ΔilvL
1、以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY4037和WY4038组成的引物对进行PCR扩增。
WY4037:CGCGGATCC GGCTGTAAGCTGTTCTGAG;
WY4038:CAAAAAAAACCCCCGGACCT GCATCTTGTTCGAAGGAATG。
2、以大肠杆菌BL21(DE3)的基因组DNA为模板,采用WY4039和WY4040组成的引物对进行PCR扩增。
WY4039:CATTCCTTCGAACAAGATGC AGGTCCGGGGGTTTTTTTTG;
WY4040:ATTGCGGCCGCCCAGACGTTC TCAAGTTCGT。
3、将步骤1得到PCR扩增产物和步骤2得到的PCR扩增产物混合后作为模板,采用WY4037和WY4040组成的引物对进行PCR扩增,得到PCR扩增产物。
4、取步骤3得到的PCR扩增产物,采用限制性内切酶Bam HI和Not I进行双酶切,回收酶切产物。
5、取pKOV质粒,采用限制性内切酶Bam HI和Not I进行双酶切,回收载体骨架。
6、将步骤4得到的酶切产物和步骤5得到的载体骨架连接,得到重组质粒pKOV-ilvL*-ilvG。根据测序结果,对重组质粒进行结构描述如下:在pKOV质粒的Bam HI和Not I酶切位点之间插入了特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列20第355至987位核苷酸所示的上游臂、序列表的序列19第137至1831位核苷酸所示的DNA分子。
7、将重组质粒pKOV-ilvL*-ilvG导入重组菌EC711,得到发生同源重组的重组菌,将其命名为工程菌EC711ilvG+ΔilvL。经测序验证,工程菌EC711ilvG+ΔilvL的基因组中具有特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列20第1至987位核苷酸所示的DNA分子、序列表的序列19第137至6556位核苷酸所示的DNA分子。与重组菌EC711相比,工程菌EC711ilvG+ΔilvL的差异为:敲除了重组菌EC711基因组中AAGAAAAGACAAA(位于上游)和序列表的序列19第1至136位核苷酸(位于下游)连接组成的DNA分子,并且用编码活性IlvG蛋白的基因取代了重组菌EC711中编码失活IlvG蛋白的基因。大肠杆菌BL21(DE3)中的ilvLXGMEDA操纵子中具有编码IlvG蛋白的基因(如序列表的序列19第239-1885位核苷酸所示),而大肠杆菌K12W3110中的ilvLXGMEDA操纵子中的相应基因发生了突变(突变后的相应基因如序列表的序列23所示),因此,大肠杆菌BL21(DE3)中的ilvLXGMEDA操纵子不能形成活性IlvG蛋白。
八、构建工程菌EC711ilvG+
1、以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY4037和WY4043组成的引物对进行PCR扩增,得到PCR扩增产物。
WY4043:ATTGCGGCCGCCAACTCTTCCAGCGACTGCA。
2、取步骤1得到的PCR扩增产物,用限制性内切酶Bam HI和Not I进行双酶切,回收酶切产物。
3、取pKOV质粒,用限制性内切酶Bam HI和Not I进行双酶切,回收载体骨架。
4、将步骤2的酶切产物和步骤3的载体骨架连接,得到重组质粒pKOV-ilvL质粒。
5、将重组质粒pKOV-ilvL质粒导入工程菌EC711ilvG+ΔilvL,得到发生同源重组的重组菌,将其命名为工程菌EC711ilvG+。经测序验证,工程菌EC711ilvG+ΔilvL的基因组中具有特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列20所示的DNA分子、序列表的序列19所示的DNA分子。
九、异亮氨酸工程菌的摇瓶发酵试验
试验菌株为:工程菌EC711ilvG+ΔilvL或工程菌EC711ilvG+
1、取试验菌株,划线接种于固体LB培养基平板,37℃静置培养12小时。
2、挑取平板上的菌苔,接种至液体LB培养基中,37℃、220rpm振荡培养12h,得到种子液(OD600nm值=5.0)。
3、完成步骤2后,将种子液按照3%的接种量接种发酵培养基中,37℃、220rpm震荡培养。
发酵培养基:葡萄糖20.0g/L、硫酸铵15.0g/L、磷酸二氢钾2.0g/L、七水硫酸镁2.0g/L、酵母粉2.0g/L、蛋氨酸0.6g/L、L-赖氨酸盐酸盐1.2g/L、碳酸钙15.0g/L、微量元素混合液5mL/L,余量为水。
微量元素混合液:FeSO4·7H2O 10g/L、CaCl2 1.35g/L、ZnSO4·7H2O 2.25g/L、MnSO4·4H2O 0.5g/L、CuSO4·5H2O 1g/L、(NH4)6Mo7O24·4H2O 0.106g/L、Na2B4O7·10H2O0.23g/L、CoCl2·6H2O 0.48g/L、35%HCl10mL/L,余量为水。
培养过程中,用氨水调节反应体系的pH值使其维持在6.8-7.0。
培养过程中,每隔3-4h取样一次,使用生物传感分析仪SBA-40D检测葡萄糖含量,当体系中的葡萄糖含量低于5g/L时,补加葡萄糖并使体系中的葡萄糖浓度达到10g/L。
培养36h后取样,12000g离心2分钟,取上清液,检测L-异亮浓度。
结果见表1(三次重复试验的平均值±标准差)。与工程菌EC711ilvG+相比,工程菌EC711ilvG+ΔilvL的发酵上清中L-异亮氨酸的浓度显著提高。
表1
发酵上清中的L-异亮氨酸含量(g/L)
工程菌EC711ilvG<sup>+</sup> 1.02±0.17
工程菌EC711ilvG<sup>+</sup>ΔilvL 2.55±0.35
L-异亮氨酸浓度的检测方法:高效液相法,在参考文献(氨基酸和生物资源,2000,22,59-60)中氨基酸检测方法的基础上进行优化,具体方法如下(2,4-二硝基氟苯(FDBN)柱前衍生高效液相法):
取10μL上清液于2mL离心管中,加入200μL 0.5M NaHCO3水溶液和100μL 1%(体积比)FDBN-乙腈溶液,于60℃水浴中暗处恒温加热60min,然后冷却至室温,然后加入700μL0.04mol/L KH2PO4水溶液(pH=7.2±0.05,用40g/L KOH水溶液调整pH)并摇匀,静置15min,然后过滤并收集滤液。滤液用于上样,进样量为15μL。
色谱柱为C18柱(ZORBAX Eclipse XDB-C18,4.6*150mm,Agilent,USA);柱温:40℃;紫外检测波长:360nm;流动相A为0.04mol/L KH2PO4水溶液(pH=7.2±0.05,用40g/100mL KOH水溶液调整pH),流动相B为55%(体积比)乙腈水溶液,流动相总流量为1mL/min。
洗脱过程:洗脱起始时刻(0min)流动相A占流动相总流量的体积份数为86%、流动相B占流动相总流量的体积份数为14%;洗脱过程分为4个阶段,每个阶段中流动相A和流动相B占流动相总流量的体积份数均为线性变化;第1阶段(从起始时刻开始共进行2min)结束时流动相A占流动相总流量的体积份数为88%、流动相B占流动相总流量的体积份数为12%,第2阶段(从第1阶段结束时刻开始共进行2min)结束时流动相A占流动相总流量的体积份数为86%、流动相B占流动相总流量的体积份数为14%,第3阶段(从第2阶段结束时刻开始共进行6min)结束时流动相A占流动相总流量的体积份数为70%、流动相B占流动相总流量的体积份数为30%,第4阶段(从第3阶段结束时刻开始共进行10min)结束时流动相A占流动相总流量的体积份数为30%、流动相B占流动相总流量的体积份数为70%。
以市售L-异亮氨酸为标准品制作标准曲线,计算样品的异亮氨酸浓度。
实施例3、衰减子突变体调控gfp基因的表达
一、构建重组质粒pACYC184-Pthr-trc
1、合成序列表的序列21所示的双链DNA分子(启动子Pthr-trc)。
2、以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY1947和WY1948组成的引物对进行PCR扩增,得到PCR扩增产物。
WY1947:CTAGTCTAGAGCTTTTCATTCTGACTGCAAC;
WY1948:CCCAAGCTT ACATTATACGAGCCGGATGATTAATTGTCAACTGTCTGTGCGCTATGCCT。
3、取步骤2得到的PCR扩增产物,用限制性内切酶Xba I和Hind III进行双酶切,回收酶切产物。
4、取pACYC184质粒,用限制性内切酶Xba I和Hind III进行双酶切,回收载体骨架(约4.1kb)。
5、将步骤3的酶切产物和步骤4的载体骨架连接,得到重组质粒pACYC184-Pthr-trc
二、构建各个重组质粒以及相应的重组菌
1、构建重组菌GFP3227
(1)以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY3227和WY3254组成的引物对进行PCR扩增,得到PCR扩增产物A1;以pGFPuv载体为模板,采用WY3105和WY1859组成的引物对进行PCR扩增,得到PCR扩增产物A2;将PCR扩增产物A1和PCR扩增产物A2混合后作为模板,采用WY3227和WY1859组成的引物对进行PCR扩增,得到PCR扩增产物A3。
WY3227:CCCAAGCTTAAGATGCAAGAAAAGACAAAatgACAG;
WY3254:AGTTCTTCTCCTTTACTCATAGAACCAGAACCAGAACCTGAGAAACAGAATTTTGTGCT;
WY3105:GGTTCTGGTTCTGGTTCTATGAGTAAAGGAGAAGAACTTTTCA;
引物中,下划线标注的为酶切识别序列,方框标注的为终止子序列。
(2)取步骤(1)得到的PCR扩增产物A3,用限制性内切酶Hind III和Sph I双酶切,回收酶切产物。
(3)取重组质粒pACYC184-Pthr-trc,用限制性内切酶Hind III和Sph I双酶切,回收载体骨架。
(4)将步骤(2)的酶切产物和步骤(3)的载体骨架连接,然后化转至大肠杆菌EC135,并从转化子中提取质粒,得到重组质粒pACYC184-Pthr-trc-ilvLX-gfp3227。根据测序结果,对重组质粒pACYC184-Pthr-trc-ilvLX-gfp3227进行结构描述如下:在质粒pACYC184的Xba I和Sph I酶切位点之间插入了特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列21所示的启动子Pthr-trc,限制性内切酶Hind III的酶切识别序列,ilvL基因的RBS序列“AAGATGCAAGAAAAGACAAA”,序列表的序列19第1至215位核苷酸(包含完整的ilv衰减子序列和ilvX基因开放阅读框中编码前10个氨基酸残基的核苷酸序列),连接序列“GGTTCTGGTTCTGGTTCT”,序列表的序列22所示的gfp基因,终止子序列CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG。
含有重组质粒pACYC184-Pthr-trc-ilvLX-gfp3227的大肠杆菌EC135命名为重组菌GFP3227。
2、构建重组菌GFP3228
(1)以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY3228和WY3254组成的引物对进行PCR扩增,得到PCR扩增产物A1;以pGFPuv载体为模板,采用WY3105和WY1859组成的引物对进行PCR扩增,得到PCR扩增产物A2;将PCR扩增产物A1和PCR扩增产物A2混合后作为模板,采用WY3228和WY1859组成的引物对进行PCR扩增,得到PCR扩增产物A3。
WY3228:CCCAAGCTTAGGTCCGGGGGTTTTTTTTGAC。
(2)取步骤(1)得到的PCR扩增产物A3,用限制性内切酶Hind III和Sph I双酶切,回收酶切产物。
(3)取重组质粒pACYC184-Pthr-trc,用限制性内切酶Hind III和Sph I双酶切,回收载体骨架。
(4)将步骤(2)的酶切产物和步骤(3)的载体骨架连接,然后化转至大肠杆菌EC135,并从转化子中提取质粒,得到重组质粒pACYC184-Pthr-trc-ilvLX-gfp3228。根据测序结果,对重组质粒pACYC184-Pthr-trc-ilvLX-gfp3228进行结构描述如下:在质粒pACYC184的Xba I和Sph I酶切位点之间插入了特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列21所示的启动子Pthr-trc,限制性内切酶Hind III的酶切识别序列,序列表的序列19第137至215位核苷酸(包含进行截短改造后的ilv衰减子序列和ilvX基因开放阅读框中编码前10个氨基酸残基的核苷酸序列),连接序列“GGTTCTGGTTCTGGTTCT”,序列表的序列22所示的gfp基因,终止子序列CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG。
含有重组质粒pACYC184-Pthr-trc-ilvLX-gfp3228的大肠杆菌EC135命名为重组菌GFP3228。
3、构建重组菌GFP3229
(1)以大肠杆菌K12 MG1655的基因组DNA为模板,采用WY3229和WY3254组成的引物对进行PCR扩增,得到PCR扩增产物A1;以pGFPuv载体为模板,采用WY3105和WY1859组成的引物对进行PCR扩增,得到PCR扩增产物A2;将PCR扩增产物A1和PCR扩增产物A2混合后作为模板,采用WY3229和WY1859组成的引物对进行PCR扩增,得到PCR扩增产物A3。
WY3229:CCCAAGCTTACATAACCGAGGAGCAGACA。
(2)取步骤(1)得到的PCR扩增产物A3,用限制性内切酶Hind III和Sph I双酶切,回收酶切产物。
(3)取重组质粒pACYC184-Pthr-trc,用限制性内切酶Hind III和Sph I双酶切,回收载体骨架。
(4)将步骤(2)的酶切产物和步骤(3)的载体骨架连接,然后化转至大肠杆菌EC135,并从转化子中提取质粒,得到重组质粒pACYC184-Pthr-trc-ilvLX-gfp3229。根据测序结果,对重组质粒pACYC184-Pthr-trc-ilvLX-gfp3229进行结构描述如下:在质粒pACYC184的Xba I和Sph I酶切位点之间插入了特异DNA分子;特异DNA分子自上游至下游依次由如下元件组成:序列表的序列21所示的启动子Pthr-trc,限制性内切酶Hind III的酶切识别序列,序列表的序列19第166至215位核苷酸(完全删除ilv衰减子,包含ilvX基因开放阅读框中编码前10个氨基酸残基的核苷酸序列),连接序列“GGTTCTGGTTCTGGTTCT”,序列表的序列22所示的gfp基因,终止子序列CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG。
含有重组质粒pACYC184-Pthr-trc-ilvLX-gfp3229的大肠杆菌EC135命名为重组菌GFP3229。
4、构建GFP对照
将重组质粒pACYC184-Pthr-trc导入大肠杆菌EC135,得到的重组菌命名为GFP对照。
三、GFP荧光强度分析
试验菌株为:重组菌GFP3227、重组菌GFP3228或重组菌GFP3229。
设置GFP对照作为对照菌株。
1、将试验菌株或对照菌株接种至含34mg/L氯霉素的液体LB培养基中,37℃、220rpm振荡培养过夜。
2、取步骤1得到的菌液,按照1%接种量接种于含34mg/L氯霉素的液体LB培养基中,37℃、220rpm振荡培养12小时。
3、取150μL步骤2得到的菌液,加入黑边透底的96孔板中,使用高通量多功能酶标仪(INFINITE 200 PRO型,瑞士TECAN)同时检测细胞密度和GFP荧光信号。检测细胞密度的相关参数设置见表2。检测GFP荧光信号的相关参数设置见表3。
表2
吸光度(Absorbance)
波长(Wavelength) 600nm
带宽(Bandwidth) 9nm
闪光次数(Number of Flashes) 25
建立时间(Settle Time) 0ms
表3
荧光顶读(Fluorescence Top Reading)
激发波长(Excitation Wavelength) 400nm
发射波长(Emission Wavelength) 510nm
激发带宽(Excitation Bandwidth) 9nm
发射带宽(Emission Bandwidth) 20nm
收集(Gain) 100(Manual,手动)
闪光次数(Number of Flashes) 15
积分时间(Integration Time) 20μs
滞后时间(LagTime) 0μs
建立时间(Settle Time) 0ms
Z位置(Z-Position) 20000μm(Manual,手动)
各个试验菌株的荧光强度值=实测荧光值÷细胞密度-对照菌株的实测荧光值÷对照菌株的细胞密度。设置三次重复试验,相应的平均值和标准差结果见表4。
与重组菌GFP3227(携带完整ilv衰减子)相比,重组菌GFP3228(携带ilv衰减子截短体)的荧光强度值提高了149.0%。与重组菌GFP3229(不携带ilv衰减子)相比,重组菌GFP3228的荧光强度值提高了34.1%。结果表明,位于启动子和目的基因之间的ilv衰减子截短体可以作为调控元件,促进目的基因的表达。
ilv衰减子突变体如序列表的序列19第n1至n2位核苷酸所示;n1为129以上148以下的自然数(n1优选为137),n2为155以上215以下的自然数(n2具体可为155以上185以下的自然数或186以上215以下的自然数,更具体可为155、185或215)。ilv衰减子突变体包括ilv衰减子截短体和ilv衰减子变体(全称为在ilv衰减子截短体下游连接其他核苷酸的变体)。ilv衰减子截短体如序列表的序列19第n1至155位核苷酸所示。ilv衰减子变体如序列表的序列19第n1至n3位核苷酸所示,n3为156以上215以下的自然数(n3具体可为156以上185以下的自然数或185以上215以下的自然数,更具体可为185或215)。
表4
荧光强度
重组菌GFP3227 1465.4±165.5
重组菌GFP3228 3649.3±413.2
重组菌GFP3229 2721.1±138.4
最后应说明的是:显然,上述实施例仅仅是为清楚地说明本发明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围之中。
SEQUENCE LISTING
<110> 中国科学院微生物研究所
<120> 基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用
<130> GNCYX171069
<160> 29
<170> PatentIn version 3.5
<210> 1
<211> 2305
<212> DNA
<213> 大肠杆菌
<400> 1
cgttaatgaa atatcgccag ttccacatcc atgcgcaatc agcggtactc agtgatagtg 60
cggtcatggc aatgcttaag cagaaataat cgtgtcacca ttggtgggta ctaaacctga 120
agttcagccc accgggatga gaaaaaatcg cctacgcccc cacatacgcc agattcagca 180
acggatacgg tttccccaaa tcgtccacct cagagcgtcc cgtaacctta aaacccacct 240
tcttatagaa cccaaccgcc tgctcatttt gctcattaac gttggttgtc agttccggtg 300
ccatcgagag cgcatgctcc accagcaccc gacctacgcc gcagccgcgc acatcaggat 360
cgataaacag cgcatccata tgctgcccac ttagcaacat aaatccaacc ggctgatccc 420
gctcattaac cgcgacccac aacggcgctt ccggcaggaa ggaacgaact aggtcctcca 480
gctcggtccg atactctgct gatagaaaat cgtgagtggc atcgacagaa cgacaccaaa 540
tcgcaacgag ttcctcccct tcctcatgcc gtgagcggcg aatactaata accattttct 600
ctccttttag tcattcttat attctaacgt agtcttttcc ttgaaacttt ctcaccttca 660
acatgcaggc tcgacattgg caaattttct ggttatcttc agctatctgg atgtctaaac 720
gtataagcgt atgtagtgag gtaatcaggt tatgccgatt cgtgtgccgg acgagctacc 780
cgccgtcaat ttcttgcgtg aagaaaacgt ctttgtgatg acaacttctc gtgcgtctgg 840
tcaggaaatt cgtccactta aggttctgat ccttaacctg atgccgaaga agattgaaac 900
tgaaaatcag tttctgcgcc tgctttcaaa ctcacctttg caggtcgata ttcagctgtt 960
gcgcatcgat tcccgtgaat cgcgcaacac gcccgcagag catctgaaca acttctactg 1020
taactttgaa gatattcagg atcagaactt tgacggtttg attgtaactg gtgcgccgct 1080
gggcctggtg gagtttaatg atgtcgctta ctggccgcag atcaaacagg tgctggagtg 1140
gtcgaaagat cacgtcacct cgacgctgtt tgtctgctgg gcggtacagg ccgcgctcaa 1200
tatcctctac ggcattccta agcaaactcg caccgaaaaa ctctctggcg tttacgagca 1260
tcatattctc catcctcatg cgcttctgac gcgtggcttt gatgattcat tcctggcacc 1320
gcattcgcgc tatgctgact ttccggcagc gttgattcgt gattacaccg atctggaaat 1380
tctggcagag acggaagaag gggatgcata tctgtttgcc agtaaagata agcgcattgc 1440
ctttgtgacg ggccatcccg aatatgatgc gcaaacgctg gcgcaggaat ttttccgcga 1500
tgtggaagcc ggactagacc cggatgtacc gtataactat ttcccgcaca atgatccgca 1560
aaatacaccg cgagcgagct ggcgtagtca cggtaattta ctgtttacca actggctcaa 1620
ctattacgtc taccagatca cgccatacga tctacggcac atgaatccaa cgctggatta 1680
atcttctgtg atagtcgatc gttaagcgat tcagcacctt acctcaggca ccttcgggtg 1740
ccttttttat ttccgaaacg tacctcagca ggtgaataaa ttttattcat attgttatca 1800
acaagttatc aagtattttt aattaaaatg gaaattgttt ttgattttgc attttaaatg 1860
agtagtctta gttgtgctga acgaaaagag cacaacgatc cttcgttcac agtggggaag 1920
ttttcggatc catgacgagg agctgcacga tgactgaaca ggcaacaaca accgatgaac 1980
tggctttcac aaggccgtat ggcgagcagg agaagcaaat tcttactgcc gaagcggtag 2040
aatttctgac tgagctggtg acgcatttta cgccacaacg caataaactt ctggcagcgc 2100
gcattcagca gcagcaagat attgataacg gaacgttgcc tgattttatt tcggaaacag 2160
cttccattcg cgatgctgat tggaaaattc gcgggattcc tgcggactta gaagaccgcc 2220
gcgtagagat aactggcccg gtagagcgca agatggtgat caacgcgctc aacgccaatg 2280
tgaaagtctt tatggccgat ttcga 2305
<210> 2
<211> 309
<212> PRT
<213> 大肠杆菌
<400> 2
Met Pro Ile Arg Val Pro Asp Glu Leu Pro Ala Val Asn Phe Leu Arg
1 5 10 15
Glu Glu Asn Val Phe Val Met Thr Thr Ser Arg Ala Ser Gly Gln Glu
20 25 30
Ile Arg Pro Leu Lys Val Leu Ile Leu Asn Leu Met Pro Lys Lys Ile
35 40 45
Glu Thr Glu Asn Gln Phe Leu Arg Leu Leu Ser Asn Ser Pro Leu Gln
50 55 60
Val Asp Ile Gln Leu Leu Arg Ile Asp Ser Arg Glu Ser Arg Asn Thr
65 70 75 80
Pro Ala Glu His Leu Asn Asn Phe Tyr Cys Asn Phe Glu Asp Ile Gln
85 90 95
Asp Gln Asn Phe Asp Gly Leu Ile Val Thr Gly Ala Pro Leu Gly Leu
100 105 110
Val Glu Phe Asn Asp Val Ala Tyr Trp Pro Gln Ile Lys Gln Val Leu
115 120 125
Glu Trp Ser Lys Asp His Val Thr Ser Thr Leu Phe Val Cys Trp Ala
130 135 140
Val Gln Ala Ala Leu Asn Ile Leu Tyr Gly Ile Pro Lys Gln Thr Arg
145 150 155 160
Thr Glu Lys Leu Ser Gly Val Tyr Glu His His Ile Leu His Pro His
165 170 175
Ala Leu Leu Thr Arg Gly Phe Asp Asp Ser Phe Leu Ala Pro His Ser
180 185 190
Arg Tyr Ala Asp Phe Pro Ala Ala Leu Ile Arg Asp Tyr Thr Asp Leu
195 200 205
Glu Ile Leu Ala Glu Thr Glu Glu Gly Asp Ala Tyr Leu Phe Ala Ser
210 215 220
Lys Asp Lys Arg Ile Ala Phe Val Thr Gly His Pro Glu Tyr Asp Ala
225 230 235 240
Gln Thr Leu Ala Gln Glu Phe Phe Arg Asp Val Glu Ala Gly Leu Asp
245 250 255
Pro Asp Val Pro Tyr Asn Tyr Phe Pro His Asn Asp Pro Gln Asn Thr
260 265 270
Pro Arg Ala Ser Trp Arg Ser His Gly Asn Leu Leu Phe Thr Asn Trp
275 280 285
Leu Asn Tyr Tyr Val Tyr Gln Ile Thr Pro Tyr Asp Leu Arg His Met
290 295 300
Asn Pro Thr Leu Asp
305
<210> 3
<211> 2565
<212> DNA
<213> 大肠杆菌
<400> 3
gtaacacaca cacttcatct aaagagagta attcggtacg ttctgttccc gcaggcgtat 60
ggagcgtttc agtgagtcct aaatcatgac gctgggccga gagccactct tcaagtagcg 120
gtgattcctg gggcacgata tttaagctga catcgggata acgtgccaga aagggttgca 180
ggagctgcgg taaaaaagat tgcgaaaaga ccggcaggca ggcaatagac agttctccct 240
ggcgaaactc gcgcagactt tctgcggcgc tgacaatgcg atccagtccg taccaggatc 300
gttgcacttc ttcaaacaga cgcagtcctt gcacggtagg atgtaatcgc ccacgtacgc 360
gctcaaacaa tttcagcccg atcaccttct caaagcgcgc aagttcgcgg ctgacggttg 420
gctgtgaggt gtgtagcagg tgtgccgcct cagtcaggct tccggcggtc attaccgcat 480
gaaaaatttc aatatgacgt aagttaacgg cggccattag cgctctctcg caatccggta 540
atccatatca tttttgcata gactcgacat aaatcgatat tttttattct ttttatgatg 600
tggcgtaatc ataaaaaagc acttatctgg agtttgttat gccacattca ctgttcagca 660
ccgataccga tctcaccgcc gaaaatctgc tgcgtttgcc cgctgaattt ggctgcccgg 720
tgtgggtcta cgatgcgcaa attattcgtc ggcagattgc agcgctgaaa cagtttgatg 780
tggtgcgctt tgcacagaaa gcctgttcca atattcatat tttgcgctta atgcgtgagc 840
agggcgtgaa agtggattcc gtctcgttag gcgaaataga gcgtgcgttg gcggcgggtt 900
acaatccgca aacgcacccc gatgatattg tttttacggc agatgttatc gatcaggcga 960
cgcttgaacg cgtcagtgaa ttgcaaattc cggtgaatgc gggttctgtt gatatgctcg 1020
accaactggg ccaggtttcg ccagggcatc gggtatggct gcgcgttaat ccggggtttg 1080
gtcacggaca tagccaaaaa accaataccg gtggcgaaaa cagcaagcac ggtatctggt 1140
acaccgatct gcccgccgca ctggacgtga tacaacgtca tcatctgcag ctggtcggca 1200
ttcacatgca cattggttct ggcgttgatt atgcccatct ggaacaggtg tgtggtgcta 1260
tggtgcgtca ggtcatcgaa ttcggtcagg atttacaggc tatttctgcg ggcggtgggc 1320
tttctgttcc ttatcaacag ggtgaagagg cggttgatac cgaacattat tatggtctgt 1380
ggaatgccgc gcgtgagcaa atcgcccgcc atttgggcca ccctgtgaaa ctggaaattg 1440
aaccgggtcg cttcctggta gcgcagtctg gcgtattaat tactcaggtg cggagcgtca 1500
aacaaatggg gagccgccac tttgtgctgg ttgatgccgg gttcaacgat ctgatgcgcc 1560
cggcaatgta cggtagttac caccatatca gtgccctggc agctgatggt cgttctctgg 1620
aacacgcgcc aacggtggaa accgtcgtcg ccggaccgtt atgtgaatcg ggcgatgtct 1680
ttacccagca ggaaggggga aatgttgaaa cccgcgcctt gccggaagtg aaggcaggtg 1740
attatctggt actgcatgat acaggggcat atggcgcatc aatgtcatcc aactacaata 1800
gccgtccgct gttaccagaa gttctgtttg ataatggtca ggcgcggttg attcgccgtc 1860
gccagaccat cgaagaatta ctggcgctgg aattgcttta actgcggtta gtcgctggtt 1920
gcatgatgac ttgcctccag cgacggagtt gacactgaat gacgacgtac cagcgtcgga 1980
ctaaagacat tagtgatttc cgggagaggg cgattatccg ccagcgccaa agccagttcg 2040
gcagcctggg tcgccatcgt cacgattggg taacgcacgg tggtcaggcg cggacgcaca 2100
tagcgtgaca ccagcacatc atcaaagcca attaacgaaa tctcacccgg tacatcaata 2160
ccattatcat tgagaacgcc catcgcaccc gccgccattg aatcgttata acaggctacc 2220
gcagtgaaat ttcttcctcg tcccaaaagc tcggtcattg cctgttcgcc gccgctttcg 2280
tctggttcgc caaatgtcac cagccggtca ttggccgcaa taccactttc agcaagggca 2340
tcgtaatacc cttgcagacg atcttcggcg tcagaaatag agtggttaga gcacagataa 2400
ccaatgcggg tatgaccttg ctgaattaaa tgacgcgttg ccagccaggc accgtaacga 2460
tcgtccagag caatacaacg gttttcaaag ccaggcagga tacggttgat cagcaccata 2520
ccgggcattt gtttcattaa tgaggctaaa tcagcatccg ggatc 2565
<210> 4
<211> 420
<212> PRT
<213> 大肠杆菌
<400> 4
Met Pro His Ser Leu Phe Ser Thr Asp Thr Asp Leu Thr Ala Glu Asn
1 5 10 15
Leu Leu Arg Leu Pro Ala Glu Phe Gly Cys Pro Val Trp Val Tyr Asp
20 25 30
Ala Gln Ile Ile Arg Arg Gln Ile Ala Ala Leu Lys Gln Phe Asp Val
35 40 45
Val Arg Phe Ala Gln Lys Ala Cys Ser Asn Ile His Ile Leu Arg Leu
50 55 60
Met Arg Glu Gln Gly Val Lys Val Asp Ser Val Ser Leu Gly Glu Ile
65 70 75 80
Glu Arg Ala Leu Ala Ala Gly Tyr Asn Pro Gln Thr His Pro Asp Asp
85 90 95
Ile Val Phe Thr Ala Asp Val Ile Asp Gln Ala Thr Leu Glu Arg Val
100 105 110
Ser Glu Leu Gln Ile Pro Val Asn Ala Gly Ser Val Asp Met Leu Asp
115 120 125
Gln Leu Gly Gln Val Ser Pro Gly His Arg Val Trp Leu Arg Val Asn
130 135 140
Pro Gly Phe Gly His Gly His Ser Gln Lys Thr Asn Thr Gly Gly Glu
145 150 155 160
Asn Ser Lys His Gly Ile Trp Tyr Thr Asp Leu Pro Ala Ala Leu Asp
165 170 175
Val Ile Gln Arg His His Leu Gln Leu Val Gly Ile His Met His Ile
180 185 190
Gly Ser Gly Val Asp Tyr Ala His Leu Glu Gln Val Cys Gly Ala Met
195 200 205
Val Arg Gln Val Ile Glu Phe Gly Gln Asp Leu Gln Ala Ile Ser Ala
210 215 220
Gly Gly Gly Leu Ser Val Pro Tyr Gln Gln Gly Glu Glu Ala Val Asp
225 230 235 240
Thr Glu His Tyr Tyr Gly Leu Trp Asn Ala Ala Arg Glu Gln Ile Ala
245 250 255
Arg His Leu Gly His Pro Val Lys Leu Glu Ile Glu Pro Gly Arg Phe
260 265 270
Leu Val Ala Gln Ser Gly Val Leu Ile Thr Gln Val Arg Ser Val Lys
275 280 285
Gln Met Gly Ser Arg His Phe Val Leu Val Asp Ala Gly Phe Asn Asp
290 295 300
Leu Met Arg Pro Ala Met Tyr Gly Ser Tyr His His Ile Ser Ala Leu
305 310 315 320
Ala Ala Asp Gly Arg Ser Leu Glu His Ala Pro Thr Val Glu Thr Val
325 330 335
Val Ala Gly Pro Leu Cys Glu Ser Gly Asp Val Phe Thr Gln Gln Glu
340 345 350
Gly Gly Asn Val Glu Thr Arg Ala Leu Pro Glu Val Lys Ala Gly Asp
355 360 365
Tyr Leu Val Leu His Asp Thr Gly Ala Tyr Gly Ala Ser Met Ser Ser
370 375 380
Asn Tyr Asn Ser Arg Pro Leu Leu Pro Glu Val Leu Phe Asp Asn Gly
385 390 395 400
Gln Ala Arg Leu Ile Arg Arg Arg Gln Thr Ile Glu Glu Leu Leu Ala
405 410 415
Leu Glu Leu Leu
420
<210> 5
<211> 2460
<212> DNA
<213> 大肠杆菌
<400> 5
gctatgccaa caacgatatg caggagctgg aagcacgtct gaaagaagcg cgtgaagccg 60
gtgcgcgtca tgtgctgatc gccaccgatg gtgtgttctc aatggacggc gtgattgcca 120
acctgaaggg cgtttgcgat ctggcagata aatatgatgc cctggtgatg gtagacgact 180
cccacgcggt cggttttgtc ggtgaaaatg gtcgtggttc ccatgaatac tgcgatgtga 240
tgggccgggt cgatattatc accggtacgc ttggtaaagc gctgggcggg gcttctggtg 300
gttataccgc ggcgcgcaaa gaagtggttg agtggctgcg ccagcgttct cgtccgtacc 360
tgttctccaa ctcgctggca ccggccattg ttgccgcgtc catcaaagta ctggagatgg 420
tcgaagcggg cagcgaactg cgtgaccgtc tgtgggcgaa cgcgcgtcag ttccgtgagc 480
aaatgtcggc ggcgggcttt accctggcgg gagccgatca cgccattatt ccggtcatgc 540
ttggtgatgc ggtagtggcg cagaaatttg cccgtgagct gcaaaaagag ggcatttacg 600
ttaccggttt cttctatccg gtcgttccga aaggtcaggc gcgtattcgt acccagatgt 660
ctgcggcgca tacccctgag caaattacgc gtgcagtaga agcatttacg cgtattggta 720
aacaactggg cgttatcgcc tgaggatgtg agatgaaagc gttatccaaa ctgaaagcgg 780
aagagggcat ctggatgacc gacgttcctg taccggaact cgggcataac gatctgctga 840
ttaaaatccg taaaacagcc atctgcggga ctgacgttca catctataac tgggatgagt 900
ggtcgcaaaa aaccatcccg gtgccgatgg tcgtgggcca tgaatatgtc ggtgaagtgg 960
taggtattgg tcaggaagtg aaaggcttca agatcggcga tcgcgtttct ggcgaaggcc 1020
atatcacctg tggtcattgc cgcaactgtc gtggtggtcg tacccatttg tgccgcaaca 1080
cgataggcgt tggtgttaat cgcccgggct gctttgccga atatctggtg atcccggcat 1140
tcaacgcctt caaaatcccc gacaatattt ccgatgactt agccgcaatt tttgatccct 1200
tcggtaacgc cgtgcatacc gcgctgtcgt ttgatctggt gggcgaagat gtgctggttt 1260
ctggtgcagg cccgattggt attatggcag cggcggtggc gaaacacgtt ggtgcacgca 1320
atgtggtgat cactgatgtt aacgaatacc gccttgagct ggcgcgtaaa atgggtatca 1380
cccgtgcggt taacgtcgcc aaagaaaatc tcaatgacgt gatggcggag ttaggcatga 1440
ccgaaggttt tgatgtcggt ctggaaatgt ccggtgcgcc gccagcgttt cgtaccatgc 1500
ttgacaccat gaatcacggc ggccgtattg cgatgctggg tattccgccg tctgatatgt 1560
ctatcgactg gaccaaagtg atctttaaag gcttgttcat taaaggtatt tacggtcgtg 1620
agatgtttga aacctggtac aagatggcgg cgctgattca gtctggcctc gatctttcgc 1680
cgatcattac ccatcgtttc tctatcgatg atttccagaa gggctttgac gctatgcgtt 1740
cgggccagtc cgggaaagtt attctgagct gggattaaca cgaacaaggg ctggtattcc 1800
agccctttta tctgaggata atctgttaaa tatgtaaaat cctgtcagtg taataaagag 1860
ttcgtaattg tgctgatctc ttatatagct gctctcatta tctctctacc ctgaagtgac 1920
tctctcacct gtaaaaataa tatctcacag gcttaatagt ttcttaatac aaagcctgta 1980
aaacgtcagg ataacttcag aggtcgtcgg taatttatga tgaacagcac caataaactt 2040
agtgttatta ttccgttata taatgcgggc gatgatttcc gcacttgtat ggaatcttta 2100
attacgcaaa cctggactgc tctggaaatc attattatta acgatggttc aacggataat 2160
tctgttgaaa tagcaaagta ttacgcagaa aactatccgc acgttcgttt gttgcatcag 2220
gcgaatgctg gcgcatcggt ggcgcgtaat cgtgggattg aagtggcaac gggcaaatat 2280
gtcgcttttg tcgatgctga cgatgaagtc tatcccacca tgtacgaaac gctgatgacc 2340
atggcgttag aggacgacct cgacgtggcg cagtgcaacg ctgactggtg ttttcgtgaa 2400
acgggagaaa cctggcaatc catccccacc gatcgccttc gctcaaccgg cgtattaacc 2460
<210> 6
<211> 341
<212> PRT
<213> 大肠杆菌
<400> 6
Met Lys Ala Leu Ser Lys Leu Lys Ala Glu Glu Gly Ile Trp Met Thr
1 5 10 15
Asp Val Pro Val Pro Glu Leu Gly His Asn Asp Leu Leu Ile Lys Ile
20 25 30
Arg Lys Thr Ala Ile Cys Gly Thr Asp Val His Ile Tyr Asn Trp Asp
35 40 45
Glu Trp Ser Gln Lys Thr Ile Pro Val Pro Met Val Val Gly His Glu
50 55 60
Tyr Val Gly Glu Val Val Gly Ile Gly Gln Glu Val Lys Gly Phe Lys
65 70 75 80
Ile Gly Asp Arg Val Ser Gly Glu Gly His Ile Thr Cys Gly His Cys
85 90 95
Arg Asn Cys Arg Gly Gly Arg Thr His Leu Cys Arg Asn Thr Ile Gly
100 105 110
Val Gly Val Asn Arg Pro Gly Cys Phe Ala Glu Tyr Leu Val Ile Pro
115 120 125
Ala Phe Asn Ala Phe Lys Ile Pro Asp Asn Ile Ser Asp Asp Leu Ala
130 135 140
Ala Ile Phe Asp Pro Phe Gly Asn Ala Val His Thr Ala Leu Ser Phe
145 150 155 160
Asp Leu Val Gly Glu Asp Val Leu Val Ser Gly Ala Gly Pro Ile Gly
165 170 175
Ile Met Ala Ala Ala Val Ala Lys His Val Gly Ala Arg Asn Val Val
180 185 190
Ile Thr Asp Val Asn Glu Tyr Arg Leu Glu Leu Ala Arg Lys Met Gly
195 200 205
Ile Thr Arg Ala Val Asn Val Ala Lys Glu Asn Leu Asn Asp Val Met
210 215 220
Ala Glu Leu Gly Met Thr Glu Gly Phe Asp Val Gly Leu Glu Met Ser
225 230 235 240
Gly Ala Pro Pro Ala Phe Arg Thr Met Leu Asp Thr Met Asn His Gly
245 250 255
Gly Arg Ile Ala Met Leu Gly Ile Pro Pro Ser Asp Met Ser Ile Asp
260 265 270
Trp Thr Lys Val Ile Phe Lys Gly Leu Phe Ile Lys Gly Ile Tyr Gly
275 280 285
Arg Glu Met Phe Glu Thr Trp Tyr Lys Met Ala Ala Leu Ile Gln Ser
290 295 300
Gly Leu Asp Leu Ser Pro Ile Ile Thr His Arg Phe Ser Ile Asp Asp
305 310 315 320
Phe Gln Lys Gly Phe Asp Ala Met Arg Ser Gly Gln Ser Gly Lys Val
325 330 335
Ile Leu Ser Trp Asp
340
<210> 7
<211> 2732
<212> DNA
<213> 大肠杆菌
<400> 7
gatgccaaaa ggtgcgccaa aatccaaagt agcggcaacg tgcgactact ccgcagaagt 60
cgttctgcat ggtgataact tcaacgacac tatcgctaaa gtgagcgaaa ttgtcgaaat 120
ggaaggccgt atttttatcc caccttacga tgatccgaaa gtgattgctg gccagggaac 180
gattggtctg gaaattatgg aagatctcta tgatgtcgat aacgtgattg tgccaattgg 240
tggtggcggt ttaattgctg gtattgcggt ggcaattaaa tctattaacc cgaccattcg 300
tgttattggc gtacagtctg aaaacgttca cggcatggcg gcttctttcc actccggaga 360
aataaccacg caccgaacta ccggcaccct ggcggatggt tgtgatgtct cccgcccggg 420
taatttaact tacgaaatcg ttcgtgaatt agtcgatgac atcgtgctgg tcagcgaaga 480
cgaaatcaga aacagtatga ttgccttaat tcagcgcaat aaagtcgtca ccgaaggcgc 540
aggcgctctg gcatgtgctg cattattaag cggtaaatta gaccaatata ttcaaaacag 600
aaaaaccgtc agtattattt ccggcggcaa tatcgatctt tctcgcgtct ctcaaatcac 660
cggtttcgtt gacgcttaat taattcgttg aggataggat atgagtactt cagatagcat 720
tgtatccagc cagacaaaac aatcgtcctg gcgtaaatca gataccacat ggacgttagg 780
cttgtttggt acggcaatcg gcgccggggt gctgttcttc cctatccgcg caggttttgg 840
cggactgatc ccgattcttc tgatgttggt attggcatac cccatcgcgt tttattgcca 900
ccgggcgctg gcgcgtctgt gtctttctgg ctctaaccct tccggcaaca ttacggaaac 960
ggtggaagag cattttggta aaactggcgg cgtggttatc acgttcctgt acttcttcgc 1020
gatttgccca ctgctgtgga tttatggcgt tactattacc aataccttta tgacgttctg 1080
ggaaaaccag ctcggctttg caccgctgaa tcgcggcttt gtggcgctgt tcctgttgct 1140
gctgatggct ttcgtcatct ggtttggtaa ggatctgatg gttaaagtga tgagctacct 1200
ggtatggccg tttatcgcca gcctggtgct gatttctttg tcgctgatcc cttactggaa 1260
ctctgcagtt atcgaccagg ttgacctcgg ttcgctgtcg ttaaccggtc atgacggtat 1320
cctgatcact gtctggctgg ggatttccat catggttttc tcctttaact tctcgccaat 1380
cgtctcttcc ttcgtggttt ctaagcgtga agagtatgag aaagacttcg gtcgcgactt 1440
caccgaacgt aaatgttccc aaatcatttc tcgtgccagc atgctgatgg ttgcagtggt 1500
gatgttcttt gcctttagct gcctgtttac tctgtctccg gccaacatgg cggaagccaa 1560
agcgcagaat attccagtgc tttcttatct ggctaaccac tttgcgtcca tgaccggtac 1620
caaaacaacg ttcgcgatta cactggaata tgcggcttcc atcatcgcac tcgtggctat 1680
cttcaaatct ttcttcggtc actatctggg aacgctggaa ggtctgaatg gcctggtcct 1740
gaagtttggt tataaaggcg acaaaactaa agtgtcgctg ggtaaactga acactatcag 1800
catgatcttc atcatgggct ccacctgggt tgttgcctac gccaacccga acatccttga 1860
cctgattgaa gccatgggcg caccgattat cgcatccctg ctgtgcctgt tgccgatgta 1920
tgccatccgt aaagcgccgt ctctggcgaa ataccgtggt cgtctggata acgtgtttgt 1980
taccgtgatt ggtctgctga ccatcctgaa catcgtatac aaactgtttt aatccgtaac 2040
tcaggatgag aaaagagatg aatgaatttc cggttgtttt ggttattaac tgtggttcgt 2100
cttcgattaa gttttccgtg ctcgatgcca gcgactgtga agtattaatg tcaggtattg 2160
ccgacggtat taactcggaa aatgcattct tatccgtaaa tgggggagag ccagcaccgc 2220
tggctcacca cagctacgaa ggtgcattga aggcaattgc atttgaactg gaaaaacgga 2280
atttaaatga cagtgtggcc ttaattggcc accgcatcgc tcacggcggc agtattttta 2340
ccgagtccgc cattattacc gatgaagtca ttgataatat ccgtcgcgtt tctccactgg 2400
cacccctgca taattacgcc aatttaagtg gtattgaatc ggcgcagcaa ttatttccgg 2460
gcgtaactca ggtggcggta tttgatacca gtttccacca gacgatggct ccggaagctt 2520
atttatacgg cctgccgtgg aaatattatg aagagttagg tgtacgccgt tatggtttcc 2580
acggcacgtc gcaccgctat gtttcccagc gcgcacattc gctgctgaat ctggcggaag 2640
atgactccgg cctggttgtg gcgcatcttg gcaatggcgc gtcaatctgc gcggttcgca 2700
acggtcagag tgttgatacc tcaatgggaa tg 2732
<210> 8
<211> 443
<212> PRT
<213> 大肠杆菌
<400> 8
Met Ser Thr Ser Asp Ser Ile Val Ser Ser Gln Thr Lys Gln Ser Ser
1 5 10 15
Trp Arg Lys Ser Asp Thr Thr Trp Thr Leu Gly Leu Phe Gly Thr Ala
20 25 30
Ile Gly Ala Gly Val Leu Phe Phe Pro Ile Arg Ala Gly Phe Gly Gly
35 40 45
Leu Ile Pro Ile Leu Leu Met Leu Val Leu Ala Tyr Pro Ile Ala Phe
50 55 60
Tyr Cys His Arg Ala Leu Ala Arg Leu Cys Leu Ser Gly Ser Asn Pro
65 70 75 80
Ser Gly Asn Ile Thr Glu Thr Val Glu Glu His Phe Gly Lys Thr Gly
85 90 95
Gly Val Val Ile Thr Phe Leu Tyr Phe Phe Ala Ile Cys Pro Leu Leu
100 105 110
Trp Ile Tyr Gly Val Thr Ile Thr Asn Thr Phe Met Thr Phe Trp Glu
115 120 125
Asn Gln Leu Gly Phe Ala Pro Leu Asn Arg Gly Phe Val Ala Leu Phe
130 135 140
Leu Leu Leu Leu Met Ala Phe Val Ile Trp Phe Gly Lys Asp Leu Met
145 150 155 160
Val Lys Val Met Ser Tyr Leu Val Trp Pro Phe Ile Ala Ser Leu Val
165 170 175
Leu Ile Ser Leu Ser Leu Ile Pro Tyr Trp Asn Ser Ala Val Ile Asp
180 185 190
Gln Val Asp Leu Gly Ser Leu Ser Leu Thr Gly His Asp Gly Ile Leu
195 200 205
Ile Thr Val Trp Leu Gly Ile Ser Ile Met Val Phe Ser Phe Asn Phe
210 215 220
Ser Pro Ile Val Ser Ser Phe Val Val Ser Lys Arg Glu Glu Tyr Glu
225 230 235 240
Lys Asp Phe Gly Arg Asp Phe Thr Glu Arg Lys Cys Ser Gln Ile Ile
245 250 255
Ser Arg Ala Ser Met Leu Met Val Ala Val Val Met Phe Phe Ala Phe
260 265 270
Ser Cys Leu Phe Thr Leu Ser Pro Ala Asn Met Ala Glu Ala Lys Ala
275 280 285
Gln Asn Ile Pro Val Leu Ser Tyr Leu Ala Asn His Phe Ala Ser Met
290 295 300
Thr Gly Thr Lys Thr Thr Phe Ala Ile Thr Leu Glu Tyr Ala Ala Ser
305 310 315 320
Ile Ile Ala Leu Val Ala Ile Phe Lys Ser Phe Phe Gly His Tyr Leu
325 330 335
Gly Thr Leu Glu Gly Leu Asn Gly Leu Val Leu Lys Phe Gly Tyr Lys
340 345 350
Gly Asp Lys Thr Lys Val Ser Leu Gly Lys Leu Asn Thr Ile Ser Met
355 360 365
Ile Phe Ile Met Gly Ser Thr Trp Val Val Ala Tyr Ala Asn Pro Asn
370 375 380
Ile Leu Asp Leu Ile Glu Ala Met Gly Ala Pro Ile Ile Ala Ser Leu
385 390 395 400
Leu Cys Leu Leu Pro Met Tyr Ala Ile Arg Lys Ala Pro Ser Leu Ala
405 410 415
Lys Tyr Arg Gly Arg Leu Asp Asn Val Phe Val Thr Val Ile Gly Leu
420 425 430
Leu Thr Ile Leu Asn Ile Val Tyr Lys Leu Phe
435 440
<210> 序列9
<211> 5132
<212> DNA
<213> 人工序列
<400> 9
agcttttcat tctgactgca acgggcaata tgtctctgtg tggattaaaa aaagagtgtc 60
tgatagcagc ttctgaactg gttacctgcc gtgagtaaat taaaatttta ttgacttagg 120
tcactaaata ctttaaccaa tataggcata gcgcacagac agataaaaat tacagagtac 180
acaacatcca tgaaacgcat tagcaccacc attaccacca ccatcaccat taccacaggt 240
aacggtgcgg gctgacgcgt acaggaaaca cagaaaaaag cccgcacctg acagtgcggg 300
cttttttttt cgaccaaagg taacgaggta acaaccatgc gagtgttgaa gttcggcggt 360
acatcagtgg caaatgcaga acgttttctg cgtgttgccg atattctgga aagcaatgcc 420
aggcaggggc aggtggccac cgtcctctct gcccccgcca aaatcaccaa ccacctggtg 480
gcgatgattg aaaaaaccat tagcggccag gatgctttac ccaatatcag cgatgccgaa 540
cgtatttttg ccgaactttt gacgggactc gccgccgccc agccggggtt cccgctggcg 600
caattgaaaa ctttcgtcga tcaggaattt gcccaaataa aacatgtcct gcatggcatt 660
agtttgttgg ggcagtgccc ggatagcatc aacgctgcgc tgatttgccg tggcgagaaa 720
atgtcgatcg ccattatggc cggcgtatta gaagcgcgcg gtcacaacgt tactgttatc 780
gatccggtcg aaaaactgct ggcagtgggg cattacctcg aatctaccgt cgatattgct 840
gagtccaccc gccgtattgc ggcaagccgc attccggctg atcacatggt gctgatggca 900
ggtttcaccg ccggtaatga aaaaggcgaa ctggtggtgc ttggacgcaa cggttccgac 960
tactctgctg cggtgctggc tgcctgttta cgcgccgatt gttgcgagat ttggacggac 1020
gttgacgggg tctatacctg cgacccgcgt caggtgcccg atgcgaggtt gttgaagtcg 1080
atgtcctacc agcatgcgat ggagctttcc tacttcggcg ctaaagttct tcacccccgc 1140
accattaccc ccatcgccca gttccagatc ccttgcctga ttaaaaatac cggaaatcct 1200
caagcaccag gtacgctcat tggtgccagc cgtgatgaag acgaattacc ggtcaagggc 1260
atttccaatc tgaataacat ggcaatgttc agcgtttctg gtccggggat gaaagggatg 1320
gtcggcatgg cggcgcgcgt ctttgcagcg atgtcacgcg cccgtatttc cgtggtgctg 1380
attacgcaat catcttccga atacagcatc agtttctgcg ttccacaaag cgactgtgtg 1440
cgagctgaac gggcaatgca ggaagagttc tacctggaac tgaaagaagg cttactggag 1500
ccgctggcag tgacggaacg gctggccatt atctcggtgg taggtgatgg tatgcgcacc 1560
ttgcgtggga tctcggcgaa attctttgcc gcactggccc gcgccaatat caacattgtc 1620
gccattgctc agggatcttc tgaacgctca atctctgtcg tggtaaataa cgatgatgcg 1680
accactggcg tgcgcgttac tcatcagatg ctgttcaata ccgatcaggt tatcgaagtg 1740
tttgtgattg gcgtcggtgg cgttggcggt gcgctgctgg agcaactgaa gcgtcagcaa 1800
agctggctga agaataaaca tatcgactta cgtgtctgcg gtgttgccaa ctcgaaggct 1860
ctgctcacca atgtacatgg ccttaatctg gaaaactggc aggaagaact ggcgcaagcc 1920
aaagagccgt ttaatctcgg gcgcttaatt cgcctcgtga aagaatatca tctgctgaac 1980
ccggtcattg ttgactgcac ttccagccag gcagtggcgg atcaatatgc cgacttcctg 2040
cgcgaaggtt tccacgttgt cacgccgaac aaaaaggcca acacctcgtc gatggattac 2100
taccatcagt tgcgttatgc ggcggaaaaa tcgcggcgta aattcctcta tgacaccaac 2160
gttggggctg gattaccggt tattgagaac ctgcaaaatc tgctcaatgc aggtgatgaa 2220
ttgatgaagt tctccggcat tctttctggt tcgctttctt atatcttcgg caagttagac 2280
gaaggcatga gtttctccga ggcgaccacg ctggcgcggg aaatgggtta taccgaaccg 2340
gacccgcgag atgatctttc tggtatggat gtggcgcgta aactattgat tctcgctcgt 2400
gaaacgggac gtgaactgga gctggcggat attgaaattg aacctgtgct gcccgcagag 2460
tttaacgccg agggtgatgt tgccgctttt atggcgaatc tgtcacaact cgacgatctc 2520
tttgccgcgc gcgtggcgaa ggcccgtgat gaaggaaaag ttttgcgcta tgttggcaat 2580
attgatgaag atggcgtctg ccgcgtgaag attgccgaag tggatggtaa tgatccgctg 2640
ttcaaagtga aaaatggcga aaacgccctg gccttctata gccactatta tcagccgctg 2700
ccgttggtac tgcgcggata tggtgcgggc aatgacgtta cagctgccgg tgtctttgct 2760
gatctgctac gtaccctctc atggaagtta ggagtctgac atggttaaag tttatgcccc 2820
ggcttccagt gccaatatga gcgtcgggtt tgatgtgctc ggggcggcgg tgacacctgt 2880
tgatggtgca ttgctcggag atgtagtcac ggttgaggcg gcagagacat tcagtctcaa 2940
caacctcgga cgctttgccg ataagctgcc gtcagaacca cgggaaaata tcgtttatca 3000
gtgctgggag cgtttttgcc aggaactggg taagcaaatt ccagtggcga tgaccctgga 3060
aaagaatatg ccgatcggtt cgggcttagg ctccagtgcc tgttcggtgg tcgcggcgct 3120
gatggcgatg aatgaacact gcggcaagcc gcttaatgac actcgtttgc tggctttgat 3180
gggcgagctg gaaggccgta tctccggcag cattcattac gacaacgtgg caccgtgttt 3240
tctcggtggt atgcagttga tgatcgaaga aaacgacatc atcagccagc aagtgccagg 3300
gtttgatgag tggctgtggg tgctggcgta tccggggatt aaagtctcga cggcagaagc 3360
cagggctatt ttaccggcgc agtatcgccg ccaggattgc attgcgcacg ggcgacatct 3420
ggcaggcttc attcacgcct gctattcccg tcagcctgag cttgccgcga agctgatgaa 3480
agatgttatc gctgaaccct accgtgaacg gttactgcca ggcttccggc aggcgcggca 3540
ggcggtcgcg gaaatcggcg cggtagcgag cggtatctcc ggctccggcc cgaccttgtt 3600
cgctctgtgt gacaagccgg aaaccgccca gcgcgttgcc gactggttgg gtaagaacta 3660
cctgcaaaat caggaaggtt ttgttcatat ttgccggctg gatacggcgg gcgcacgagt 3720
actggaaaac taaatgaaac tctacaatct gaaagatcac aacgagcagg tcagctttgc 3780
gcaagccgta acccaggggt tgggcaaaaa tcaggggctg ttttttccgc acgacctgcc 3840
ggaattcagc ctgactgaaa ttgatgagat gctgaagctg gattttgtca cccgcagtgc 3900
gaagatcctc tcggcgttta ttggtgatga aatcccacag gaaatcctgg aagagcgcgt 3960
gcgcgcggcg tttgccttcc cggctccggt cgccaatgtt gaaagcgatg tcggttgtct 4020
ggaattgttc cacgggccaa cgctggcatt taaagatttc ggcggtcgct ttatggcaca 4080
aatgctgacc catattgcgg gtgataagcc agtgaccatt ctgaccgcga cctccggtga 4140
taccggagcg gcagtggctc atgctttcta cggtttaccg aatgtgaaag tggttatcct 4200
ctatccacga ggcaaaatca gtccactgca agaaaaactg ttctgtacat tgggcggcaa 4260
tatcgaaact gttgccatcg acggcgattt cgatgcctgt caggcgctgg tgaagcaggc 4320
gtttgatgat gaagaactga aagtggcgct agggttaaac tcggctaact cgattaacat 4380
cagccgtttg ctggcgcaga tttgctacta ctttgaagct gttgcgcagc tgccgcagga 4440
gacgcgcaac cagctggttg tctcggtgcc aagcggaaac ttcggcgatt tgacggcggg 4500
tctgctggcg aagtcactcg gtctgccggt gaaacgtttt attgctgcga ccaacgtgaa 4560
cgataccgtg ccacgtttcc tgcacgacgg tcagtggtca cccaaagcga ctcaggcgac 4620
gttatccaac gcgatggacg tgagtcagcc gaacaactgg ccgcgtgtgg aagagttgtt 4680
ccgccgcaaa atctggcaac tgaaagagct gggttatgca gccgtggatg atgaaaccac 4740
gcaacagaca atgcgtgagt taaaagaact gggctacact tcggagccgc acgctgccgt 4800
agcttatcgt gcgctgcgtg atcagttgaa tccaggcgaa tatggcttgt tcctcggcac 4860
cgcgcatccg gcgaaattta aagagagcgt ggaagcgatt ctcggtgaaa cgttggatct 4920
gccaaaagag ctggcagaac gtgctgattt acccttgctt tcacataatc tgcccgccga 4980
ttttgctgcg ttgcgtaaat tgatgatgaa tcatcagtaa aatctattca ttatctcaat 5040
caggccgggt ttgcttttat gcagcccggc ttttttatga agaaattatg gagaaaaatg 5100
acagggaaaa aggagaaatt ctcaataaat gc 5132
<210> 序列10
<211> 820
<212> PRT
<213> 人工序列
<400> 10
Met Arg Val Leu Lys Phe Gly Gly Thr Ser Val Ala Asn Ala Glu Arg
1 5 10 15
Phe Leu Arg Val Ala Asp Ile Leu Glu Ser Asn Ala Arg Gln Gly Gln
20 25 30
Val Ala Thr Val Leu Ser Ala Pro Ala Lys Ile Thr Asn His Leu Val
35 40 45
Ala Met Ile Glu Lys Thr Ile Ser Gly Gln Asp Ala Leu Pro Asn Ile
50 55 60
Ser Asp Ala Glu Arg Ile Phe Ala Glu Leu Leu Thr Gly Leu Ala Ala
65 70 75 80
Ala Gln Pro Gly Phe Pro Leu Ala Gln Leu Lys Thr Phe Val Asp Gln
85 90 95
Glu Phe Ala Gln Ile Lys His Val Leu His Gly Ile Ser Leu Leu Gly
100 105 110
Gln Cys Pro Asp Ser Ile Asn Ala Ala Leu Ile Cys Arg Gly Glu Lys
115 120 125
Met Ser Ile Ala Ile Met Ala Gly Val Leu Glu Ala Arg Gly His Asn
130 135 140
Val Thr Val Ile Asp Pro Val Glu Lys Leu Leu Ala Val Gly His Tyr
145 150 155 160
Leu Glu Ser Thr Val Asp Ile Ala Glu Ser Thr Arg Arg Ile Ala Ala
165 170 175
Ser Arg Ile Pro Ala Asp His Met Val Leu Met Ala Gly Phe Thr Ala
180 185 190
Gly Asn Glu Lys Gly Glu Leu Val Val Leu Gly Arg Asn Gly Ser Asp
195 200 205
Tyr Ser Ala Ala Val Leu Ala Ala Cys Leu Arg Ala Asp Cys Cys Glu
210 215 220
Ile Trp Thr Asp Val Asp Gly Val Tyr Thr Cys Asp Pro Arg Gln Val
225 230 235 240
Pro Asp Ala Arg Leu Leu Lys Ser Met Ser Tyr Gln His Ala Met Glu
245 250 255
Leu Ser Tyr Phe Gly Ala Lys Val Leu His Pro Arg Thr Ile Thr Pro
260 265 270
Ile Ala Gln Phe Gln Ile Pro Cys Leu Ile Lys Asn Thr Gly Asn Pro
275 280 285
Gln Ala Pro Gly Thr Leu Ile Gly Ala Ser Arg Asp Glu Asp Glu Leu
290 295 300
Pro Val Lys Gly Ile Ser Asn Leu Asn Asn Met Ala Met Phe Ser Val
305 310 315 320
Ser Gly Pro Gly Met Lys Gly Met Val Gly Met Ala Ala Arg Val Phe
325 330 335
Ala Ala Met Ser Arg Ala Arg Ile Ser Val Val Leu Ile Thr Gln Ser
340 345 350
Ser Ser Glu Tyr Ser Ile Ser Phe Cys Val Pro Gln Ser Asp Cys Val
355 360 365
Arg Ala Glu Arg Ala Met Gln Glu Glu Phe Tyr Leu Glu Leu Lys Glu
370 375 380
Gly Leu Leu Glu Pro Leu Ala Val Thr Glu Arg Leu Ala Ile Ile Ser
385 390 395 400
Val Val Gly Asp Gly Met Arg Thr Leu Arg Gly Ile Ser Ala Lys Phe
405 410 415
Phe Ala Ala Leu Ala Arg Ala Asn Ile Asn Ile Val Ala Ile Ala Gln
420 425 430
Gly Ser Ser Glu Arg Ser Ile Ser Val Val Val Asn Asn Asp Asp Ala
435 440 445
Thr Thr Gly Val Arg Val Thr His Gln Met Leu Phe Asn Thr Asp Gln
450 455 460
Val Ile Glu Val Phe Val Ile Gly Val Gly Gly Val Gly Gly Ala Leu
465 470 475 480
Leu Glu Gln Leu Lys Arg Gln Gln Ser Trp Leu Lys Asn Lys His Ile
485 490 495
Asp Leu Arg Val Cys Gly Val Ala Asn Ser Lys Ala Leu Leu Thr Asn
500 505 510
Val His Gly Leu Asn Leu Glu Asn Trp Gln Glu Glu Leu Ala Gln Ala
515 520 525
Lys Glu Pro Phe Asn Leu Gly Arg Leu Ile Arg Leu Val Lys Glu Tyr
530 535 540
His Leu Leu Asn Pro Val Ile Val Asp Cys Thr Ser Ser Gln Ala Val
545 550 555 560
Ala Asp Gln Tyr Ala Asp Phe Leu Arg Glu Gly Phe His Val Val Thr
565 570 575
Pro Asn Lys Lys Ala Asn Thr Ser Ser Met Asp Tyr Tyr His Gln Leu
580 585 590
Arg Tyr Ala Ala Glu Lys Ser Arg Arg Lys Phe Leu Tyr Asp Thr Asn
595 600 605
Val Gly Ala Gly Leu Pro Val Ile Glu Asn Leu Gln Asn Leu Leu Asn
610 615 620
Ala Gly Asp Glu Leu Met Lys Phe Ser Gly Ile Leu Ser Gly Ser Leu
625 630 635 640
Ser Tyr Ile Phe Gly Lys Leu Asp Glu Gly Met Ser Phe Ser Glu Ala
645 650 655
Thr Thr Leu Ala Arg Glu Met Gly Tyr Thr Glu Pro Asp Pro Arg Asp
660 665 670
Asp Leu Ser Gly Met Asp Val Ala Arg Lys Leu Leu Ile Leu Ala Arg
675 680 685
Glu Thr Gly Arg Glu Leu Glu Leu Ala Asp Ile Glu Ile Glu Pro Val
690 695 700
Leu Pro Ala Glu Phe Asn Ala Glu Gly Asp Val Ala Ala Phe Met Ala
705 710 715 720
Asn Leu Ser Gln Leu Asp Asp Leu Phe Ala Ala Arg Val Ala Lys Ala
725 730 735
Arg Asp Glu Gly Lys Val Leu Arg Tyr Val Gly Asn Ile Asp Glu Asp
740 745 750
Gly Val Cys Arg Val Lys Ile Ala Glu Val Asp Gly Asn Asp Pro Leu
755 760 765
Phe Lys Val Lys Asn Gly Glu Asn Ala Leu Ala Phe Tyr Ser His Tyr
770 775 780
Tyr Gln Pro Leu Pro Leu Val Leu Arg Gly Tyr Gly Ala Gly Asn Asp
785 790 795 800
Val Thr Ala Ala Gly Val Phe Ala Asp Leu Leu Arg Thr Leu Ser Trp
805 810 815
Lys Leu Gly Val
820
<210> 序列11
<211> 310
<212> PRT
<213> 人工序列
<400> 11
Met Val Lys Val Tyr Ala Pro Ala Ser Ser Ala Asn Met Ser Val Gly
1 5 10 15
Phe Asp Val Leu Gly Ala Ala Val Thr Pro Val Asp Gly Ala Leu Leu
20 25 30
Gly Asp Val Val Thr Val Glu Ala Ala Glu Thr Phe Ser Leu Asn Asn
35 40 45
Leu Gly Arg Phe Ala Asp Lys Leu Pro Ser Glu Pro Arg Glu Asn Ile
50 55 60
Val Tyr Gln Cys Trp Glu Arg Phe Cys Gln Glu Leu Gly Lys Gln Ile
65 70 75 80
Pro Val Ala Met Thr Leu Glu Lys Asn Met Pro Ile Gly Ser Gly Leu
85 90 95
Gly Ser Ser Ala Cys Ser Val Val Ala Ala Leu Met Ala Met Asn Glu
100 105 110
His Cys Gly Lys Pro Leu Asn Asp Thr Arg Leu Leu Ala Leu Met Gly
115 120 125
Glu Leu Glu Gly Arg Ile Ser Gly Ser Ile His Tyr Asp Asn Val Ala
130 135 140
Pro Cys Phe Leu Gly Gly Met Gln Leu Met Ile Glu Glu Asn Asp Ile
145 150 155 160
Ile Ser Gln Gln Val Pro Gly Phe Asp Glu Trp Leu Trp Val Leu Ala
165 170 175
Tyr Pro Gly Ile Lys Val Ser Thr Ala Glu Ala Arg Ala Ile Leu Pro
180 185 190
Ala Gln Tyr Arg Arg Gln Asp Cys Ile Ala His Gly Arg His Leu Ala
195 200 205
Gly Phe Ile His Ala Cys Tyr Ser Arg Gln Pro Glu Leu Ala Ala Lys
210 215 220
Leu Met Lys Asp Val Ile Ala Glu Pro Tyr Arg Glu Arg Leu Leu Pro
225 230 235 240
Gly Phe Arg Gln Ala Arg Gln Ala Val Ala Glu Ile Gly Ala Val Ala
245 250 255
Ser Gly Ile Ser Gly Ser Gly Pro Thr Leu Phe Ala Leu Cys Asp Lys
260 265 270
Pro Glu Thr Ala Gln Arg Val Ala Asp Trp Leu Gly Lys Asn Tyr Leu
275 280 285
Gln Asn Gln Glu Gly Phe Val His Ile Cys Arg Leu Asp Thr Ala Gly
290 295 300
Ala Arg Val Leu Glu Asn
305 310
<210> 序列12
<211> 428
<212> PRT
<213> 人工序列
<400> 12
Met Lys Leu Tyr Asn Leu Lys Asp His Asn Glu Gln Val Ser Phe Ala
1 5 10 15
Gln Ala Val Thr Gln Gly Leu Gly Lys Asn Gln Gly Leu Phe Phe Pro
20 25 30
His Asp Leu Pro Glu Phe Ser Leu Thr Glu Ile Asp Glu Met Leu Lys
35 40 45
Leu Asp Phe Val Thr Arg Ser Ala Lys Ile Leu Ser Ala Phe Ile Gly
50 55 60
Asp Glu Ile Pro Gln Glu Ile Leu Glu Glu Arg Val Arg Ala Ala Phe
65 70 75 80
Ala Phe Pro Ala Pro Val Ala Asn Val Glu Ser Asp Val Gly Cys Leu
85 90 95
Glu Leu Phe His Gly Pro Thr Leu Ala Phe Lys Asp Phe Gly Gly Arg
100 105 110
Phe Met Ala Gln Met Leu Thr His Ile Ala Gly Asp Lys Pro Val Thr
115 120 125
Ile Leu Thr Ala Thr Ser Gly Asp Thr Gly Ala Ala Val Ala His Ala
130 135 140
Phe Tyr Gly Leu Pro Asn Val Lys Val Val Ile Leu Tyr Pro Arg Gly
145 150 155 160
Lys Ile Ser Pro Leu Gln Glu Lys Leu Phe Cys Thr Leu Gly Gly Asn
165 170 175
Ile Glu Thr Val Ala Ile Asp Gly Asp Phe Asp Ala Cys Gln Ala Leu
180 185 190
Val Lys Gln Ala Phe Asp Asp Glu Glu Leu Lys Val Ala Leu Gly Leu
195 200 205
Asn Ser Ala Asn Ser Ile Asn Ile Ser Arg Leu Leu Ala Gln Ile Cys
210 215 220
Tyr Tyr Phe Glu Ala Val Ala Gln Leu Pro Gln Glu Thr Arg Asn Gln
225 230 235 240
Leu Val Val Ser Val Pro Ser Gly Asn Phe Gly Asp Leu Thr Ala Gly
245 250 255
Leu Leu Ala Lys Ser Leu Gly Leu Pro Val Lys Arg Phe Ile Ala Ala
260 265 270
Thr Asn Val Asn Asp Thr Val Pro Arg Phe Leu His Asp Gly Gln Trp
275 280 285
Ser Pro Lys Ala Thr Gln Ala Thr Leu Ser Asn Ala Met Asp Val Ser
290 295 300
Gln Pro Asn Asn Trp Pro Arg Val Glu Glu Leu Phe Arg Arg Lys Ile
305 310 315 320
Trp Gln Leu Lys Glu Leu Gly Tyr Ala Ala Val Asp Asp Glu Thr Thr
325 330 335
Gln Gln Thr Met Arg Glu Leu Lys Glu Leu Gly Tyr Thr Ser Glu Pro
340 345 350
His Ala Ala Val Ala Tyr Arg Ala Leu Arg Asp Gln Leu Asn Pro Gly
355 360 365
Glu Tyr Gly Leu Phe Leu Gly Thr Ala His Pro Ala Lys Phe Lys Glu
370 375 380
Ser Val Glu Ala Ile Leu Gly Glu Thr Leu Asp Leu Pro Lys Glu Leu
385 390 395 400
Ala Glu Arg Ala Asp Leu Pro Leu Leu Ser His Asn Leu Pro Ala Asp
405 410 415
Phe Ala Ala Leu Arg Lys Leu Met Met Asn His Gln
420 425
<210> 13
<211> 162
<212> DNA
<213> 人工序列
<400> 13
caattccgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 60
cacgaggccc tttcgtcttc acctcgagtc cctatcagtg atagagattg acatccctat 120
cagtgataga gatactgagc acatcagcag gacgcactga cc 162
<210> 14
<211> 3275
<212> DNA
<213> 人工序列
<400> 14
atggctgact cgcaacccct gtccggtgct ccggaaggtg ccgaatattt aagagcagtg 60
ctgcgcgcgc cggtttacga ggcggcgcag gttacgccgc tacaaaaaat ggaaaaactg 120
tcgtcgcgtc ttgataacgt cattctggtg aagcgcgaag atcgccagcc agtgcacagc 180
tttaagctgc gcggcgcata cgccatgatg gcgggcctga cggaagaaca gaaagcgcac 240
ggcgtgatca ctgcttctgc gggtaaccac gcgcagggcg tcgcgttttc ttctgcgcgg 300
ttaggcgtga aggccctgat cgttatgcca accgccaccg ccgacatcaa agtcgacgcg 360
gtgcgcggct tcggcggcga agtgctgctc cacggcgcga actttgatga agcgaaagcc 420
aaagcgatcg aactgtcaca gcagcagggg ttcacctggg tgccgccgtt cgaccatccg 480
atggtgattg ccgggcaagg cacgctggcg ctggaactgc tccagcagga cgcccatctc 540
gaccgcgtat ttgtgccagt cggcggcggc ggtctggctg ctggcgtggc ggtgctgatc 600
aaacaactga tgccgcaaat caaagtgatc gccgtagaag cggaagactc cgcctgcctg 660
aaagcagcgc tggatgcggg tcatccggtt gatctgccgc gcgtagggct atttgctgaa 720
ggcgtagcgg taaaacgcat cggtgacgaa accttccgtt tatgccagga gtatctcgac 780
gacatcatca ccgtcgatag cgatgcgatc tgtgcggcga tgaaggattt attcgaagat 840
gtgcgcgcgg tggcggaacc ctctggcgcg ctggcgctgg cgggaatgaa aaaatatatc 900
gccctgcaca acattcgcgg cgaacggctg gcgcatattc tttccggtgc caacgtgaac 960
ttccacggcc tgcgctacgt ctcagaacgc tgcgaactgg gcgaacagcg tgaagcgttg 1020
ttggcggtga ccattccgga agaaaaaggc agcttcctca aattctgcca actgcttggc 1080
gggcgttcgg tcaccgagtt caactaccgt tttgccgatg ccaaaaacgc ctgcatcttt 1140
gtcggtgtgc gcctgagccg cggcctcgaa gagcgcaaag aaattttgca gatgctcaac 1200
gacggcggct acagcgtggt tgatctctcc gacgacgaaa tggcgaagct acacgtgcgc 1260
tatatggtcg gcggacgtcc atcgcatccg ttgcaggaac gcctctacag cttcgaattc 1320
ccggaatcac cgggcgcgtt tctgcgcttc gccaacacgc tgggtacgta ctggaacatt 1380
tctttgttcc actatcgcag ccatggcacc gactacgggc gcgtactggc ggcgttcgaa 1440
cttggcgacc atgaaccgga tttcgaaacc cggctgaatg agctgggcta cgattgccac 1500
gacgaaacca ataacccggc gttcaggttc tttttggcgg gttagggaaa aatgcctgat 1560
agcgcttcgc ttatcaggcc tacccgcgcg acaacgtcat ttgtggttcg gcaaaatctt 1620
ccagaatgcc ccgcaataaa tttcctgtca tatagtgaat tcaatctcgc aaacgcgaac 1680
cgaacaataa gaagcacaac atcacgagga atcaccatgg ctaactactt caatacactg 1740
aatctgcgcc agcagctggc acagctgggc aaatgtcgct ttatgggccg cgatgaattc 1800
gccgatggcg cgagctacct tcagggtaaa aaagtagtca tcgtcggctg tggcgcacag 1860
ggtctgaacc agggcctgaa catgcgtgat tctggtctcg atatctccta cgctctgcgt 1920
aaagaagcga ttgccgagaa gcgcgcgtcc tggcgtaaag cgaccgaaaa tggttttaaa 1980
gtgggtactt acgaagaact gatcccacag gcggatctgg tgattaacct gacgccggac 2040
aagcagcact ctgatgtagt gcgcaccgta cagccactga tgaaagacgg cgcggcgctg 2100
ggctactcgc acggtttcaa catcgtcgaa gtgggcgagc agatccgtaa agatatcacc 2160
gtagtgatgg ttgcgccgaa atgcccaggc accgaagtgc gtgaagagta caaacgtggg 2220
ttcggcgtac cgacgctgat tgccgttcac ccggaaaacg atccgaaagg cgaaggcatg 2280
gcgattgcca aagcctgggc ggctgcaacc ggtggtcacc gtgcgggtgt gctggaatcg 2340
tccttcgttg cggaagtgaa atctgacctg atgggcgagc aaaccatcct gtgcggtatg 2400
ttgcaggctg gctctctgct gtgcttcgac aagctggtgg aagaaggtac cgatccagca 2460
tacgcagaaa aactgattca gttcggttgg gaaaccatca ccgaagcact gaaacagggc 2520
ggcatcaccc tgatgatgga ccgtctctct aacccggcga aactgcgtgc ttatgcgctt 2580
tctgaacagc tgaaagagat catggcaccc ctgttccaga aacatatgga cgacatcatc 2640
tccggcgaat tctcttccgg tatgatggcg gactgggcca acgatgataa gaaactgctg 2700
acctggcgtg aagagaccgg caaaaccgcg tttgaaaccg cgccgcagta tgaaggcaaa 2760
atcggcgagc aggagtactt cgataaaggc gtactgatga ttgcgatggt gaaagcgggc 2820
gttgaactgg cgttcgaaac catggtcgat tccggcatca ttgaagagtc tgcatattat 2880
gaatcactgc acgagctgcc gctgattgcc aacaccatcg cccgtaagcg tctgtacgaa 2940
atgaacgtgg ttatctctga taccgctgag tacggtaact atctgttctc ttacgcttgt 3000
gtgccgttgc tgaaaccgtt tatggcagag ctgcaaccgg gcgacctggg taaagctatt 3060
ccggaaggcg cggtagataa cgggcaactg cgtgatgtga acgaagcgat tcgcagccat 3120
gcgattgagc aggtaggtaa gaaactgcgc ggctatatga cagatatgaa acgtattgct 3180
gttgcgggtt aagtgcgcgc tgatgccctc accccgaccc tctcccacag ggagagggag 3240
aaaacactca aggccttctc ctggagaagg ccttg 3275
<210> 15
<211> 514
<212> PRT
<213> 大肠杆菌
<400> 15
Met Ala Asp Ser Gln Pro Leu Ser Gly Ala Pro Glu Gly Ala Glu Tyr
1 5 10 15
Leu Arg Ala Val Leu Arg Ala Pro Val Tyr Glu Ala Ala Gln Val Thr
20 25 30
Pro Leu Gln Lys Met Glu Lys Leu Ser Ser Arg Leu Asp Asn Val Ile
35 40 45
Leu Val Lys Arg Glu Asp Arg Gln Pro Val His Ser Phe Lys Leu Arg
50 55 60
Gly Ala Tyr Ala Met Met Ala Gly Leu Thr Glu Glu Gln Lys Ala His
65 70 75 80
Gly Val Ile Thr Ala Ser Ala Gly Asn His Ala Gln Gly Val Ala Phe
85 90 95
Ser Ser Ala Arg Leu Gly Val Lys Ala Leu Ile Val Met Pro Thr Ala
100 105 110
Thr Ala Asp Ile Lys Val Asp Ala Val Arg Gly Phe Gly Gly Glu Val
115 120 125
Leu Leu His Gly Ala Asn Phe Asp Glu Ala Lys Ala Lys Ala Ile Glu
130 135 140
Leu Ser Gln Gln Gln Gly Phe Thr Trp Val Pro Pro Phe Asp His Pro
145 150 155 160
Met Val Ile Ala Gly Gln Gly Thr Leu Ala Leu Glu Leu Leu Gln Gln
165 170 175
Asp Ala His Leu Asp Arg Val Phe Val Pro Val Gly Gly Gly Gly Leu
180 185 190
Ala Ala Gly Val Ala Val Leu Ile Lys Gln Leu Met Pro Gln Ile Lys
195 200 205
Val Ile Ala Val Glu Ala Glu Asp Ser Ala Cys Leu Lys Ala Ala Leu
210 215 220
Asp Ala Gly His Pro Val Asp Leu Pro Arg Val Gly Leu Phe Ala Glu
225 230 235 240
Gly Val Ala Val Lys Arg Ile Gly Asp Glu Thr Phe Arg Leu Cys Gln
245 250 255
Glu Tyr Leu Asp Asp Ile Ile Thr Val Asp Ser Asp Ala Ile Cys Ala
260 265 270
Ala Met Lys Asp Leu Phe Glu Asp Val Arg Ala Val Ala Glu Pro Ser
275 280 285
Gly Ala Leu Ala Leu Ala Gly Met Lys Lys Tyr Ile Ala Leu His Asn
290 295 300
Ile Arg Gly Glu Arg Leu Ala His Ile Leu Ser Gly Ala Asn Val Asn
305 310 315 320
Phe His Gly Leu Arg Tyr Val Ser Glu Arg Cys Glu Leu Gly Glu Gln
325 330 335
Arg Glu Ala Leu Leu Ala Val Thr Ile Pro Glu Glu Lys Gly Ser Phe
340 345 350
Leu Lys Phe Cys Gln Leu Leu Gly Gly Arg Ser Val Thr Glu Phe Asn
355 360 365
Tyr Arg Phe Ala Asp Ala Lys Asn Ala Cys Ile Phe Val Gly Val Arg
370 375 380
Leu Ser Arg Gly Leu Glu Glu Arg Lys Glu Ile Leu Gln Met Leu Asn
385 390 395 400
Asp Gly Gly Tyr Ser Val Val Asp Leu Ser Asp Asp Glu Met Ala Lys
405 410 415
Leu His Val Arg Tyr Met Val Gly Gly Arg Pro Ser His Pro Leu Gln
420 425 430
Glu Arg Leu Tyr Ser Phe Glu Phe Pro Glu Ser Pro Gly Ala Leu Leu
435 440 445
Arg Phe Leu Asn Thr Leu Gly Thr Tyr Trp Asn Ile Ser Leu Phe His
450 455 460
Tyr Arg Ser His Gly Thr Asp Tyr Gly Arg Val Leu Ala Ala Phe Glu
465 470 475 480
Leu Gly Asp His Glu Pro Asp Phe Glu Thr Arg Leu Asn Glu Leu Gly
485 490 495
Tyr Asp Cys His Asp Glu Thr Asn Asn Pro Ala Phe Arg Phe Phe Leu
500 505 510
Ala Gly
<210> 16
<211> 491
<212> PRT
<213> 大肠杆菌
<400> 16
Met Ala Asn Tyr Phe Asn Thr Leu Asn Leu Arg Gln Gln Leu Ala Gln
1 5 10 15
Leu Gly Lys Cys Arg Phe Met Gly Arg Asp Glu Phe Ala Asp Gly Ala
20 25 30
Ser Tyr Leu Gln Gly Lys Lys Val Val Ile Val Gly Cys Gly Ala Gln
35 40 45
Gly Leu Asn Gln Gly Leu Asn Met Arg Asp Ser Gly Leu Asp Ile Ser
50 55 60
Tyr Ala Leu Arg Lys Glu Ala Ile Ala Glu Lys Arg Ala Ser Trp Arg
65 70 75 80
Lys Ala Thr Glu Asn Gly Phe Lys Val Gly Thr Tyr Glu Glu Leu Ile
85 90 95
Pro Gln Ala Asp Leu Val Ile Asn Leu Thr Pro Asp Lys Gln His Ser
100 105 110
Asp Val Val Arg Thr Val Gln Pro Leu Met Lys Asp Gly Ala Ala Leu
115 120 125
Gly Tyr Ser His Gly Phe Asn Ile Val Glu Val Gly Glu Gln Ile Arg
130 135 140
Lys Asp Ile Thr Val Val Met Val Ala Pro Lys Cys Pro Gly Thr Glu
145 150 155 160
Val Arg Glu Glu Tyr Lys Arg Gly Phe Gly Val Pro Thr Leu Ile Ala
165 170 175
Val His Pro Glu Asn Asp Pro Lys Gly Glu Gly Met Ala Ile Ala Lys
180 185 190
Ala Trp Ala Ala Ala Thr Gly Gly His Arg Ala Gly Val Leu Glu Ser
195 200 205
Ser Phe Val Ala Glu Val Lys Ser Asp Leu Met Gly Glu Gln Thr Ile
210 215 220
Leu Cys Gly Met Leu Gln Ala Gly Ser Leu Leu Cys Phe Asp Lys Leu
225 230 235 240
Val Glu Glu Gly Thr Asp Pro Ala Tyr Ala Glu Lys Leu Ile Gln Phe
245 250 255
Gly Trp Glu Thr Ile Thr Glu Ala Leu Lys Gln Gly Gly Ile Thr Leu
260 265 270
Met Met Asp Arg Leu Ser Asn Pro Ala Lys Leu Arg Ala Tyr Ala Leu
275 280 285
Ser Glu Gln Leu Lys Glu Ile Met Ala Pro Leu Phe Gln Lys His Met
290 295 300
Asp Asp Ile Ile Ser Gly Glu Phe Ser Ser Gly Met Met Ala Asp Trp
305 310 315 320
Ala Asn Asp Asp Lys Lys Leu Leu Thr Trp Arg Glu Glu Thr Gly Lys
325 330 335
Thr Ala Phe Glu Thr Ala Pro Gln Tyr Glu Gly Lys Ile Gly Glu Gln
340 345 350
Glu Tyr Phe Asp Lys Gly Val Leu Met Ile Ala Met Val Lys Ala Gly
355 360 365
Val Glu Leu Ala Phe Glu Thr Met Val Asp Ser Gly Ile Ile Glu Glu
370 375 380
Ser Ala Tyr Tyr Glu Ser Leu His Glu Leu Pro Leu Ile Ala Asn Thr
385 390 395 400
Ile Ala Arg Lys Arg Leu Tyr Glu Met Asn Val Val Ile Ser Asp Thr
405 410 415
Ala Glu Tyr Gly Asn Tyr Leu Phe Ser Tyr Ala Cys Val Pro Leu Leu
420 425 430
Lys Pro Phe Met Ala Glu Leu Gln Pro Gly Asp Leu Gly Lys Ala Ile
435 440 445
Pro Glu Gly Ala Val Asp Asn Gly Gln Leu Arg Asp Val Asn Glu Ala
450 455 460
Ile Arg Ser His Ala Ile Glu Gln Val Gly Lys Lys Leu Arg Gly Tyr
465 470 475 480
Met Thr Asp Met Lys Arg Ile Ala Val Ala Gly
485 490
<210> 17
<211> 2645
<212> DNA
<213> 大肠杆菌
<400> 17
atagcattcc ggctatcttc gccgtgacca ctgacccgtt cattgtgctg acctcaaacc 60
tgtttgcgat cctcggcctg cgtgcgatgt atttcctgct ggcgggcgta gcagagcgtt 120
tctcgatgct caaatatggc ctggcggtga ttctggtgtt tatcggtatc aagatgctga 180
ttgtcgactt ctaccatatt ccaatcgccg tctcgctggg cgtggtgttt ggcattctgg 240
tgatgacgtt tattatcaac gcctgggtga attatcggca tgataagcag cggggtggat 300
aatttttaat ctgcctaagc cgtgtaccct gtcattaaca tgagcaccgt tttctccctc 360
tcccttccag ggagagggtc ggggtgaggg taatttttcg caccgatgct ggcctgttcc 420
cctcacccta accctctccc caaacggggc gaggggactg accgagtcct tttttgatgt 480
tgtcatcagt ctggaagccg cacgttggct ttatttttat gtcaaagaaa tgtaaccatt 540
aagtttcaaa atatgacctc tctttaaaat ccagcatttt tcgcttcccg aagctgtaac 600
tttccttata ctcgaccttg caaacacttt gttacatcct gaaagatgcg tcgacagaac 660
gcaccaggga tgtgcgacaa cacaatgaaa ggatcgaaaa atgactacgc aacgttcacc 720
ggggctattc cggcgtctgg ctcatggcag cctggtaaaa caaatcctgg tcggccttgt 780
tctggggatt cttctggcat ggatctcaaa acccgcggcg gaagctgttg gtctgttagg 840
tactttgttc gtcggcgcac tgaaagccgt tgcccccatc ctggtgttga tgctggtgat 900
ggcatctatt gctaaccacc agcacgggca gaaaaccaat atccgcccta ttttgttcct 960
ctatctactg ggcaccttct ctgctgctct ggccgcagta gtcttcagct ttgccttccc 1020
ttctaccctg catttatcca gtagcgcggg tgatatttcg ccgccgtcag gcattgtcga 1080
agtgatgcgc gggctggtaa tgagcatggt ttccaacccc atcgacgcgc tgctgaaagg 1140
taactacatc gggattctgg tgtgggcgat cggcctcggc ttcgcactgc gtcacggtaa 1200
cgagaccacc aaaaacctgg ttaacgatat gtcgaatgcc gttaccttta tggtgaaact 1260
ggtcattcgc ttcgcaccga ttggtatttt tgggctggtt tcttctaccc tggcaaccac 1320
cggtttctcc acactgtggg gctacgcgca actgctggtc gtgctggttg gctgtatgtt 1380
actggtggcg ctggtggtta acccattgct ggtgtggtgg aaaattcgtc gtaacccgtt 1440
cccgctggtg ctgctgtgcc tgcgcgaaag cggtgtgtat gccttcttca cccgcagctc 1500
tgcagcgaac attccggtga atatggcgct gtgtgaaaag ctgaatctgg atcgcgatac 1560
ctattccgtt tctattccgc tgggagccac catcaatatg gcgggcgcag caatcactat 1620
taccgtgttg acgctggctg cggttaatac gctgggtatt ccggtcgatc tgcccacggc 1680
gctgctgttg agcgtggtgg cttctctgtg tgcctgtggc gcatccggcg tggcgggggg 1740
gtctctgctg ctgatcccac tggcctgtaa tatgttcggt atttcgaacg atatcgccat 1800
gcaggtggtt gccgtcggct ttatcatcgg cgtattgcag gactcttgcg aaaccgcgct 1860
gaactcttca actgacgtgc tgttcactgc ggcagcttgc caggcagaag acgatcgtct 1920
ggcaaatagc gccctgcgta attaattgtt taaccccttt cgtctacggc ggaaggggtt 1980
ttctcaactt taaacggatc aattcccctt ttctgcatcc gccagaaacg aatgatattc 2040
aggccattca taagcagaaa actaccctca atcatcgtgc cgcctatcga ccccgcccag 2100
aagttgtgaa tcacccagca acacgttgaa aaccacatta cgcagcgcat ggtcagccct 2160
ttacagcaga atagcgccca ggtactgaca atcgtgccga taaccggcaa tagttcgaca 2220
ggatgatgga acttcgcgag gccaattccg ccagtcagca caataaaaat cgccattacc 2280
cataagctgc gcgtgcgtaa ggtaatcaat gtacgaatgg cattaaggat ggcactggca 2340
ccagcgggat aggtgcccag aagaaaaaaa tgtacgccaa taacggcgct atagaccgaa 2400
agctgctttt tgaagcgacg ttcgtcacga ttgaaaaatg ttgtgatacc aatcagaaag 2460
gcgatgacac ccacgccctg ggccagccaa tacgcggtca tgataaatcc ttagcaggta 2520
tggaaaagca aacggcgctt cacattatga aacgccgttt tttattaaca actcatttcg 2580
actttatagc gttacgccgc ttttgaagat cgccagttcg cggaagtcgt tacgctcgtt 2640
acagg 2645
<210> 18
<211> 414
<212> PRT
<213> 大肠杆菌
<400> 18
Met Thr Thr Gln Arg Ser Pro Gly Leu Phe Arg Arg Leu Ala His Gly
1 5 10 15
Ser Leu Val Lys Gln Ile Leu Val Gly Leu Val Leu Gly Ile Leu Leu
20 25 30
Ala Trp Ile Ser Lys Pro Ala Ala Glu Ala Val Gly Leu Leu Gly Thr
35 40 45
Leu Phe Val Gly Ala Leu Lys Ala Val Ala Pro Ile Leu Val Leu Met
50 55 60
Leu Val Met Ala Ser Ile Ala Asn His Gln His Gly Gln Lys Thr Asn
65 70 75 80
Ile Arg Pro Ile Leu Phe Leu Tyr Leu Leu Gly Thr Phe Ser Ala Ala
85 90 95
Leu Ala Ala Val Val Phe Ser Phe Ala Phe Pro Ser Thr Leu His Leu
100 105 110
Ser Ser Ser Ala Gly Asp Ile Ser Pro Pro Ser Gly Ile Val Glu Val
115 120 125
Met Arg Gly Leu Val Met Ser Met Val Ser Asn Pro Ile Asp Ala Leu
130 135 140
Leu Lys Gly Asn Tyr Ile Gly Ile Leu Val Trp Ala Ile Gly Leu Gly
145 150 155 160
Phe Ala Leu Arg His Gly Asn Glu Thr Thr Lys Asn Leu Val Asn Asp
165 170 175
Met Ser Asn Ala Val Thr Phe Met Val Lys Leu Val Ile Arg Phe Ala
180 185 190
Pro Ile Gly Ile Phe Gly Leu Val Ser Ser Thr Leu Ala Thr Thr Gly
195 200 205
Phe Ser Thr Leu Trp Gly Tyr Ala Gln Leu Leu Val Val Leu Val Gly
210 215 220
Cys Met Leu Leu Val Ala Leu Val Val Asn Pro Leu Leu Val Trp Trp
225 230 235 240
Lys Ile Arg Arg Asn Pro Phe Pro Leu Val Leu Leu Cys Leu Arg Glu
245 250 255
Ser Gly Val Tyr Ala Phe Phe Thr Arg Ser Ser Ala Ala Asn Ile Pro
260 265 270
Val Asn Met Ala Leu Cys Glu Lys Leu Asn Leu Asp Arg Asp Thr Tyr
275 280 285
Ser Val Ser Ile Pro Leu Gly Ala Thr Ile Asn Met Ala Gly Ala Ala
290 295 300
Ile Thr Ile Thr Val Leu Thr Leu Ala Ala Val Asn Thr Leu Gly Ile
305 310 315 320
Pro Val Asp Leu Pro Thr Ala Leu Leu Leu Ser Val Val Ala Ser Leu
325 330 335
Cys Ala Cys Gly Ala Ser Gly Val Ala Gly Gly Ser Leu Leu Leu Ile
340 345 350
Pro Leu Ala Cys Asn Met Phe Gly Ile Ser Asn Asp Ile Ala Met Gln
355 360 365
Val Val Ala Val Gly Phe Ile Ile Gly Val Leu Gln Asp Ser Cys Glu
370 375 380
Thr Ala Leu Asn Ser Ser Thr Asp Val Leu Phe Thr Ala Ala Ala Cys
385 390 395 400
Gln Ala Glu Asp Asp Arg Leu Ala Asn Ser Ala Leu Arg Asn
405 410
<210> 19
<211> 6556
<212> DNA
<213> 人工序列
<400> 19
atgacagccc ttctacgagt gattagcctg gtcgtgatta gcgtggtggt gattattatc 60
ccaccgtgcg gggctgcact tggacgagga aaggcttaga gatcaagcct taacgaacta 120
agacccccgc accgaaaggt ccgggggttt tttttgacct taaaaacata accgaggagc 180
agacaatgaa taacagcaca aaattctgtt tctcaagatt caggacgggg aactaactat 240
gaatggcgca cagtgggtgg tacatgcgtt gcgggcacag ggtgtgaaca ccgttttcgg 300
ttatccgggt ggcgcaatta tgccggttta cgatgcattg tatgacggcg gcgtggagca 360
cttgctatgc cgacatgagc agggtgcggc aatggcggct atcggttatg ctcgtgctac 420
cggcaaaact ggcgtatgta tcgccacgtc tggtccgggc gcaaccaacc tgataaccgg 480
gcttgcggac gcactgttag attccatccc tgttgttgcc atcaccggtc aagtgtccgc 540
accgtttatc ggcactgacg catttcagga agtggatgtc ctgggattgt cgttagcctg 600
taccaagcac agctttctgg tgcagtcgct ggaagagttg ccgcgcatca tggctgaagc 660
attcgacgtt gcctgctcag gtcgtcctgg tccggttctg gtcgatatcc caaaagatat 720
ccagttagcc agcggtgacc tggaaccgtg gttcaccacc gttgaaaacg aagtgacttt 780
cccacatgcc gaagttgagc aagcgcgcca gatgctggca aaagcgcaaa aaccgatgct 840
gtacgttggc ggtggcgtgg gtatggcgca ggcagttccg gctttgcgtg aatttctcgc 900
tgccacaaaa atgcctgcca cctgtacgct gaaagggctg ggcgcagtag aagcagatta 960
tccgtactat ctgggcatgc tgggaatgca tggcaccaaa gcggcgaact tcgcggtgca 1020
ggagtgcgac ttgctgatcg ccgtgggtgc acgttttgat gaccgggtga ccggcaaact 1080
gaacaccttc gcaccacacg ccagtgttat ccatatggat atcgacccgg cagaaatgaa 1140
caagctgcgt caggcacatg tggcattaca aggtgattta aatgctctgt taccagcatt 1200
acagcagccg ttaaatatca atgactggca gctacactgc gcgcagctgc gtgatgaaca 1260
tgcctggcgt tacgaccatc ccggtgacgc tatctacgcg ccgttgttgt taaaacaact 1320
gtcagatcgt aaacctgcgg attgcgtcgt gaccacagat gtggggcagc accagatgtg 1380
ggctgcgcag cacatcgccc acactcgccc ggaaaatttc atcacctcca gcggcttagg 1440
caccatgggt tttggtttac cggcggcggt tggcgcgcaa gtcgcgcgac caaacgatac 1500
cgtcgtctgt atctccggtg acggctcttt catgatgaat gtgcaagagc tgggcaccgt 1560
aaaacgcaag cagttaccgt tgaaaatcgt cttactcgat aaccaacggt tagggatggt 1620
tcgacaatgg cagcaactgt ttttccagga acgatatagc gaaaccaccc ttaccgataa 1680
ccccgatttc ctcatgttag ccagcgcctt cggcatccct ggccaacaca tcacccgtaa 1740
agaccaggtt gaagcggcac tcgacaccat gctgaacagt gatgggccat acctgcttca 1800
tgtctcaatc gacgaacttg agaacgtctg gccgctggtg ccgcctggtg ccagtaattc 1860
agaaatgttg gagaaattat catgatgcaa catcaggtca atgtatcggc tcgcttcaat 1920
ccagaaacct tagaacgtgt tttacgcgtg gtgcgtcatc gtggtttcca cgtctgctca 1980
atgaatatgg ccgccgccag cgatgcacaa aatataaata tcgaattgac cgttgccagc 2040
ccacggtcgg tcgacttact gtttagtcag ttaaataaac tggtggacgt cgcacacgtt 2100
gccatctgcc agagcacaac cacatcacaa caaatccgcg cctgagcgca aaaggaatat 2160
aaaaatgacc acgaagaaag ctgattacat ttggttcaat ggggagatgg ttcgctggga 2220
agacgcgaag gtgcatgtga tgtcgcacgc gctgcactat ggcacttcgg tttttgaagg 2280
catccgttgc tacgactcgc acaaaggacc ggttgtattc cgccatcgtg agcatatgca 2340
gcgtctgcat gactccgcca aaatctatcg cttcccggtt tcgcagagca ttgatgagct 2400
gatggaagct tgtcgtgacg tgatccgcaa aaacaatctc accagcgcct atatccgtcc 2460
gctgatcttc gtcggtgatg ttggcatggg agtaaacccg ccagcgggat actcaaccga 2520
cgtgattatc gctgctttcc cgtggggagc gtatctgggc gcagaagcgc tggagcaggg 2580
gatcgatgcg atggtttcct cctggaaccg cgcagcacca aacaccatcc cgacggcggc 2640
aaaagccggt ggtaactacc tctcttccct gctggtgggt agcgaagcgc gccgccacgg 2700
ttatcaggaa ggtatcgcgc tggatgtgaa cggttatatc tctgaaggcg caggcgaaaa 2760
cctgtttgaa gtgaaagatg gtgtgctgtt caccccaccg ttcacctcct ccgcgctgcc 2820
gggtattacc cgtgatgcca tcatcaaact ggcgaaagag ctgggaattg aagtacgtga 2880
gcaggtgctg tcgcgcgaat ccctgtacct ggcggatgaa gtgtttatgt ccggtacggc 2940
ggcagaaatc acgccagtgc gcagcgtaga cggtattcag gttggcgaag gccgttgtgg 3000
cccggttacc aaacgcattc agcaagcctt cttcggcctc ttcactggcg aaaccgaaga 3060
taaatggggc tggttagatc aagttaatca ataaatacaa aaaatgggac ggcacgcacc 3120
gtcccattta cgagacagac actgggagta aataaagtat gcctaagtac cgttccgcca 3180
ccaccactca tggtcgtaat atggcgggtg ctcgtgcgct gtggcgcgcc accggaatga 3240
ccgacgccga tttcggtaag ccgattatcg cggttgtgaa ctcgttcacc caatttgtac 3300
cgggtcacgt ccatctgcgc gatctcggta aactggtcgc cgaacaaatt gaagcggctg 3360
gcggcgttgc caaagagttc aacaccattg cggtggatga tgggattgcc atgggccacg 3420
gggggatgct ttattcactg ccatctcgcg aactgatcgc tgattccgtt gagtatatgg 3480
tcaacgccca ctgcgccgac gccatggtct gcatctctaa ctgcgacaaa atcaccccgg 3540
ggatgctgat ggcttccctg cgcctgaata ttccggtgat ctttgtttcc ggcggcccga 3600
tggaggccgg gaaaaccaaa ctttccgatc agatcatcaa gctcgatctg gttgatgcga 3660
tgatccaggg cgcagacccg aaagtatctg actcccagag cgatcaggtt gaacgttccg 3720
cgtgtccgac ctgcggttcc tgctccggga tgtttaccgc taactcaatg aactgcctga 3780
ccgaagcgct gggcctgtcg cagccgggca acggctcgct gctggcaacc cacgccgacc 3840
gtaagcagct gttccttaat gctggtaaac gcattgttga attgaccaaa cgttattacg 3900
agcaaaacga cgaaagtgca ctgccgcgta atatcgccag taaggcggcg tttgaaaacg 3960
ccatgacgct ggatatcgcg atgggtggat cgactaacac cgtacttcac ctgctggcgg 4020
cggcgcagga agcggaaatc gacttcacca tgagtgatat cgataagctt tcccgcaagg 4080
ttccacagct gtgtaaagtt gcgccgagca cccagaaata ccatatggaa gatgttcacc 4140
gtgctggtgg tgttatcggt attctcggcg aactggatcg cgcggggtta ctgaaccgtg 4200
atgtgaaaaa cgtacttggc ctgacgttgc cgcaaacgct ggaacaatac gacgttatgc 4260
tgacccagga tgacgcggta aaaaatatgt tccgcgcagg tcctgcaggc attcgtacca 4320
cacaggcatt ctcgcaagat tgccgttggg atacgctgga cgacgatcgc gccaatggct 4380
gtatccgctc gctggaacac gcctacagca aagacggcgg cctggcggtg ctctacggta 4440
actttgcgga aaacggctgc atcgtgaaaa cggcaggcgt cgatgacagc atcctcaaat 4500
tcaccggccc ggcgaaagtg tacgaaagcc aggacgatgc ggtagaagcg attctcggcg 4560
gtaaagttgt cgccggagat gtggtagtaa ttcgctatga aggcccgaaa ggcggtccgg 4620
ggatgcagga aatgctctac ccaaccagct tcctgaaatc aatgggtctc ggcaaagcct 4680
gtgcgctgat caccgacggt cgtttctctg gtggcacctc tggtctttcc atcggccacg 4740
tctcaccgga agcggcaagc ggcggcagca ttggcctgat tgaagatggt gacctgatcg 4800
ctatcgacat cccgaaccgt ggcattcagt tacaggtaag cgatgccgaa ctggcggcgc 4860
gtcgtgaagc gcaggacgct cgaggtgaca aagcctggac gccgaaaaat cgtgaacgtc 4920
aggtctcctt tgccctgcgt gcttatgcca gcctggcaac cagcgccgac aaaggcgcgg 4980
tgcgcgataa atcgaaactg gggggttaat aatggctgac tcgcaacccc tgtccggtgc 5040
tccggaaggt gccgaatatt taagagcagt gctgcgcgcg ccggtttacg aggcggcgca 5100
ggttacgccg ctacaaaaaa tggaaaaact gtcgtcgcgt cttgataacg tcattctggt 5160
gaagcgcgaa gatcgccagc cagtgcacag ctttaagctg cgcggcgcat acgccatgat 5220
ggcgggcctg acggaagaac agaaagcgca cggcgtgatc actgcttctg cgggtaacca 5280
cgcgcagggc gtcgcgtttt cttctgcgcg gttaggcgtg aaggccctga tcgttatgcc 5340
aaccgccacc gccgacatca aagtcgacgc ggtgcgcggc ttcggcggcg aagtgctgct 5400
ccacggcgcg aactttgatg aagcgaaagc caaagcgatc gaactgtcac agcagcaggg 5460
gttcacctgg gtgccgccgt tcgaccatcc gatggtgatt gccgggcaag gcacgctggc 5520
gctggaactg ctccagcagg acgcccatct cgaccgcgta tttgtgccag tcggcggcgg 5580
cggtctggct gctggcgtgg cggtgctgat caaacaactg atgccgcaaa tcaaagtgat 5640
cgccgtagaa gcggaagact ccgcctgcct gaaagcagcg ctggatgcgg gtcatccggt 5700
tgatctgccg cgcgtagggc tatttgctga aggcgtagcg gtaaaacgca tcggtgacga 5760
aaccttccgt ttatgccagg agtatctcga cgacatcatc accgtcgata gcgatgcgat 5820
ctgtgcggcg atgaaggatt tattcgaaga tgtgcgcgcg gtggcggaac cctctggcgc 5880
gctggcgctg gcgggaatga aaaaatatat cgccctgcac aacattcgcg gcgaacggct 5940
ggcgcatatt ctttccggtg ccaacgtgaa cttccacggc ctgcgctacg tctcagaacg 6000
ctgcgaactg ggcgaacagc gtgaagcgtt gttggcggtg accattccgg aagaaaaagg 6060
cagcttcctc aaattctgcc aactgcttgg cgggcgttcg gtcaccgagt tcaactaccg 6120
ttttgccgat gccaaaaacg cctgcatctt tgtcggtgtg cgcctgagcc gcggcctcga 6180
agagcgcaaa gaaattttgc agatgctcaa cgacggcggc tacagcgtgg ttgatctctc 6240
cgacgacgaa atggcgaagc tacacgtgcg ctatatggtc ggcggacgtc catcgcatcc 6300
gttgcaggaa cgcctctaca gcttcgaatt cccggaatca ccgggcgcgc tgctgcgctt 6360
cctcaacacg ctgggtacgt actggaacat ttctttgttc cactatcgca gccatggcac 6420
cgactacggg cgcgtactgg cggcgttcga acttggcgac catgaaccgg atttcgaaac 6480
ccggctgaat gagctgggct acgattgcca cgacgaaacc aataacccgg cgttcaggtt 6540
ctttttggcg ggttag 6556
<210> 20
<211> 1000
<212> DNA
<213> 大肠杆菌
<400> 20
aatcagtaaa aggttgtgcc cgccagcagc ggtaatttcc agtcctcgct ttccttgttc 60
ctgaccgata acatcactga gatcatgttg tagcgcccgg gatactgcat cagttggttt 120
cgggcgttcg agagcgtgct taccttccag aaacgcacag acagcttgca gatgatcggc 180
tatcaggcat ccttcaccgt taattagccc cacttcatct tcgttatctt tcgcgacgat 240
aatttttctg cccgacttaa tagcttcagt tgcactggag attgcgccgg gaacgccacg 300
cagagcgcct gtaagcgcca gttctccgac taattcatat tcatctaact tattggctgt 360
aagctgttct gaggccgcca gcaacgcaat ggcgataggt aaatcatatc gtcccccttc 420
ttttggcaga tcagctggag ccaggttgat ggtgattttt ttcgccggat attcatatcc 480
gctattgata atggcgctgc gcacgcgatc gcgagcttct tttaccgttg tttctggtaa 540
gcccaccatc gttaagccgg gtagaccttt actgatatgt acctcaacag tgatcggggg 600
cgcatttact cccagggctg cgcgggtatg aacaattgac agtgacataa gccctccttg 660
agtcaccatt atgtgcataa gatatcgctg ctgtagcccg ctaattcgtg aattttagtg 720
gctgattcct gtttatttgt gcaagtgaag ttgagttgtt ctggcggtgg aatgatgctc 780
gcaaaaatgc agcggacaaa ggatgaacta cgaggaaggg aacaacattc atactgaaat 840
tgaatttttt tcactcacta ttttattttt aaaaaacaac aatttatatt gaaattatta 900
aacgcatcat aaaaatcggc caaaaaatat cttgtactat ttacaaaacc tatggtaact 960
ctttaggcat tccttcgaac aagatgcaag aaaagacaaa 1000
<210> 21
<211> 192
<212> DNA
<213> 大肠杆菌
<400> 21
gcttttcatt ctgactgcaa cgggcaatat gtctctgtgt ggattaaaaa aagagtgtct 60
gatagcagct tctgaactgg ttacctgccg tgagtaaatt aaaattttat tgacttaggt 120
cactaaatac tttaaccaat ataggcatag cgcacagaca gttgacaatt aatcatccgg 180
ctcgtataat gt 192
<210> 22
<211> 717
<212> DNA
<213> 人工序列
<400> 22
atgagtaaag gagaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 60
gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacatacgga 120
aaacttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt 180
gtcactactt tctcttatgg tgttcaatgc ttttcccgtt atccggatca tatgaaacgg 240
catgactttt tcaagagtgc catgcccgaa ggttatgtac aggaacgcac tatatctttc 300
aaagatgacg ggaactacaa gacgcgtgct gaagtcaagt ttgaaggtga tacccttgtt 360
aatcgtatcg agttaaaagg tattgatttt aaagaagatg gaaacattct cggacacaaa 420
ctcgagtaca actataactc acacaatgta tacatcacgg cagacaaaca aaagaatgga 480
atcaaagcta acttcaaaat tcgccacaac attgaagatg gatccgttca actagcagac 540
cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac 600
ctgtcgacac aatctgccct ttcgaaagat cccaacgaaa agcgtgacca catggtcctt 660
cttgagtttg taactgctgc tgggattaca catggcatgg atgagctcta caaataa 717
<210> 23
<211> 1645
<212> DNA
<213> 大肠杆菌
<400> 23
atgaatggcg cacagtgggt ggtacatgcg ttgcgggcac agggtgtgaa caccgttttc 60
ggttatccgg gtggcgcaat tatgccggtt tacgatgcat tgtatgacgg cggcgtggag 120
cacttgctat gccgacatga gcagggtgcg gcaatggcgg ctatcggtta tgctcgtgct 180
accggcaaaa ctggcgtatg tatcgccacg tctggtccgg gcgcaaccaa cctgataacc 240
gggcttgcgg acgcactgtt agattccatc cctgttgttg ccatcaccgg tcaagtgtcc 300
gcaccgttta tcggcactga cgcatttcag gaagtggatg tcctgggatt gtcgttagcc 360
tgtaccaagc acagctttct ggtgcagtcg ctggaagagt tgccgcgcat catggctgaa 420
gcattcgacg ttgcctgctc aggtcgtcct ggtccggttc tggtcgatat cccaaaagat 480
atccagttag ccagcggtga cctggaaccg tggttcacca ccgttgaaaa cgaagtgact 540
ttcccacatg ccgaagttga gcaagcgcgc cagatgctgg caaaagcgca aaaaccgatg 600
ctgtacgttg gcggtggcgt gggtatggcg caggcagttc cggctttgcg tgaatttctc 660
gctgccacaa aaatgcctgc cacctgtacg ctgaaagggc tgggcgcagt agaagcagat 720
tatccgtact atctgggcat gctggggatg cacggcacca aagcggcaaa cttcgcggtg 780
caggagtgtg acctgctgat cgccgtgggc gcacgttttg atgaccgggt gaccggcaaa 840
ctgaacacct tcgcgccaca cgccagtgtt atccatatgg atatcgaccc ggcagaaatg 900
aacaagctgc gtcaggcaca tgtggcatta caaggtgatt taaatgctct gttaccagca 960
ttacagcagc cgttaaatca atgactggca gcaacactgc gcgcagctgc gtgatgaaca 1020
ttcctggcgt tacgaccatc ccggtgacgc tatctacgcg ccgttgttgt taaaacaact 1080
gtcggatcgt aaacctgcgg attgcgtcgt gaccacagat gtggggcagc accagatgtg 1140
ggctgcgcag cacatcgccc acactcgccc ggaaaatttc atcacctcca gcggtttagg 1200
taccatgggt tttggtttac cggcggcggt tggcgcacaa gtcgcgcgac cgaacgatac 1260
cgttgtctgt atctccggtg acggctcttt catgatgaat gtgcaagagc tgggcaccgt 1320
aaaacgcaag cagttaccgt tgaaaatcgt cttactcgat aaccaacggt tagggatggt 1380
tcgacaatgg cagcaactgt tttttcagga acgatacagc gaaaccaccc ttactgataa 1440
ccccgatttc ctcatgttag ccagcgcctt cggcatccat ggccaacaca tcacccggaa 1500
agaccaggtt gaagcggcac tcgacaccat gctgaacagt gatgggccat acctgcttca 1560
tgtctcaatc gacgaacttg agaacgtctg gccgctggtg ccgcctggcg ccagtaattc 1620
agaaatgttg gagaaattat catga 1645
<210> 24
<211> 16
<212> PRT
<213> 大肠杆菌
<400> 24
Met Asn Asn Ser Thr Lys Phe Cys Phe Ser Arg Phe Arg Thr Gly Asn
1 5 10 15
<210> 25
<211> 548
<212> PRT
<213> 大肠杆菌
<400> 25
Met Asn Gly Ala Gln Trp Val Val His Ala Leu Arg Ala Gln Gly Val
1 5 10 15
Asn Thr Val Phe Gly Tyr Pro Gly Gly Ala Ile Met Pro Val Tyr Asp
20 25 30
Ala Leu Tyr Asp Gly Gly Val Glu His Leu Leu Cys Arg His Glu Gln
35 40 45
Gly Ala Ala Met Ala Ala Ile Gly Tyr Ala Arg Ala Thr Gly Lys Thr
50 55 60
Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Ile Thr
65 70 75 80
Gly Leu Ala Asp Ala Leu Leu Asp Ser Ile Pro Val Val Ala Ile Thr
85 90 95
Gly Gln Val Ser Ala Pro Phe Ile Gly Thr Asp Ala Phe Gln Glu Val
100 105 110
Asp Val Leu Gly Leu Ser Leu Ala Cys Thr Lys His Ser Phe Leu Val
115 120 125
Gln Ser Leu Glu Glu Leu Pro Arg Ile Met Ala Glu Ala Phe Asp Val
130 135 140
Ala Cys Ser Gly Arg Pro Gly Pro Val Leu Val Asp Ile Pro Lys Asp
145 150 155 160
Ile Gln Leu Ala Ser Gly Asp Leu Glu Pro Trp Phe Thr Thr Val Glu
165 170 175
Asn Glu Val Thr Phe Pro His Ala Glu Val Glu Gln Ala Arg Gln Met
180 185 190
Leu Ala Lys Ala Gln Lys Pro Met Leu Tyr Val Gly Gly Gly Val Gly
195 200 205
Met Ala Gln Ala Val Pro Ala Leu Arg Glu Phe Leu Ala Ala Thr Lys
210 215 220
Met Pro Ala Thr Cys Thr Leu Lys Gly Leu Gly Ala Val Glu Ala Asp
225 230 235 240
Tyr Pro Tyr Tyr Leu Gly Met Leu Gly Met His Gly Thr Lys Ala Ala
245 250 255
Asn Phe Ala Val Gln Glu Cys Asp Leu Leu Ile Ala Val Gly Ala Arg
260 265 270
Phe Asp Asp Arg Val Thr Gly Lys Leu Asn Thr Phe Ala Pro His Ala
275 280 285
Ser Val Ile His Met Asp Ile Asp Pro Ala Glu Met Asn Lys Leu Arg
290 295 300
Gln Ala His Val Ala Leu Gln Gly Asp Leu Asn Ala Leu Leu Pro Ala
305 310 315 320
Leu Gln Gln Pro Leu Asn Ile Asn Asp Trp Gln Leu His Cys Ala Gln
325 330 335
Leu Arg Asp Glu His Ala Trp Arg Tyr Asp His Pro Gly Asp Ala Ile
340 345 350
Tyr Ala Pro Leu Leu Leu Lys Gln Leu Ser Asp Arg Lys Pro Ala Asp
355 360 365
Cys Val Val Thr Thr Asp Val Gly Gln His Gln Met Trp Ala Ala Gln
370 375 380
His Ile Ala His Thr Arg Pro Glu Asn Phe Ile Thr Ser Ser Gly Leu
385 390 395 400
Gly Thr Met Gly Phe Gly Leu Pro Ala Ala Val Gly Ala Gln Val Ala
405 410 415
Arg Pro Asn Asp Thr Val Val Cys Ile Ser Gly Asp Gly Ser Phe Met
420 425 430
Met Asn Val Gln Glu Leu Gly Thr Val Lys Arg Lys Gln Leu Pro Leu
435 440 445
Lys Ile Val Leu Leu Asp Asn Gln Arg Leu Gly Met Val Arg Gln Trp
450 455 460
Gln Gln Leu Phe Phe Gln Glu Arg Tyr Ser Glu Thr Thr Leu Thr Asp
465 470 475 480
Asn Pro Asp Phe Leu Met Leu Ala Ser Ala Phe Gly Ile Pro Gly Gln
485 490 495
His Ile Thr Arg Lys Asp Gln Val Glu Ala Ala Leu Asp Thr Met Leu
500 505 510
Asn Ser Asp Gly Pro Tyr Leu Leu His Val Ser Ile Asp Glu Leu Glu
515 520 525
Asn Val Trp Pro Leu Val Pro Pro Gly Ala Ser Asn Ser Glu Met Leu
530 535 540
Glu Lys Leu Ser
545
<210> 26
<211> 87
<212> PRT
<213> 大肠杆菌
<400> 26
Met Met Gln His Gln Val Asn Val Ser Ala Arg Phe Asn Pro Glu Thr
1 5 10 15
Leu Glu Arg Val Leu Arg Val Val Arg His Arg Gly Phe His Val Cys
20 25 30
Ser Met Asn Met Ala Ala Ala Ser Asp Ala Gln Asn Ile Asn Ile Glu
35 40 45
Leu Thr Val Ala Ser Pro Arg Ser Val Asp Leu Leu Phe Ser Gln Leu
50 55 60
Asn Lys Leu Val Asp Val Ala His Val Ala Ile Cys Gln Ser Thr Thr
65 70 75 80
Thr Ser Gln Gln Ile Arg Ala
85
<210> 27
<211> 309
<212> PRT
<213> 大肠杆菌
<400> 27
Met Thr Thr Lys Lys Ala Asp Tyr Ile Trp Phe Asn Gly Glu Met Val
1 5 10 15
Arg Trp Glu Asp Ala Lys Val His Val Met Ser His Ala Leu His Tyr
20 25 30
Gly Thr Ser Val Phe Glu Gly Ile Arg Cys Tyr Asp Ser His Lys Gly
35 40 45
Pro Val Val Phe Arg His Arg Glu His Met Gln Arg Leu His Asp Ser
50 55 60
Ala Lys Ile Tyr Arg Phe Pro Val Ser Gln Ser Ile Asp Glu Leu Met
65 70 75 80
Glu Ala Cys Arg Asp Val Ile Arg Lys Asn Asn Leu Thr Ser Ala Tyr
85 90 95
Ile Arg Pro Leu Ile Phe Val Gly Asp Val Gly Met Gly Val Asn Pro
100 105 110
Pro Ala Gly Tyr Ser Thr Asp Val Ile Ile Ala Ala Phe Pro Trp Gly
115 120 125
Ala Tyr Leu Gly Ala Glu Ala Leu Glu Gln Gly Ile Asp Ala Met Val
130 135 140
Ser Ser Trp Asn Arg Ala Ala Pro Asn Thr Ile Pro Thr Ala Ala Lys
145 150 155 160
Ala Gly Gly Asn Tyr Leu Ser Ser Leu Leu Val Gly Ser Glu Ala Arg
165 170 175
Arg His Gly Tyr Gln Glu Gly Ile Ala Leu Asp Val Asn Gly Tyr Ile
180 185 190
Ser Glu Gly Ala Gly Glu Asn Leu Phe Glu Val Lys Asp Gly Val Leu
195 200 205
Phe Thr Pro Pro Phe Thr Ser Ser Ala Leu Pro Gly Ile Thr Arg Asp
210 215 220
Ala Ile Ile Lys Leu Ala Lys Glu Leu Gly Ile Glu Val Arg Glu Gln
225 230 235 240
Val Leu Ser Arg Glu Ser Leu Tyr Leu Ala Asp Glu Val Phe Met Ser
245 250 255
Gly Thr Ala Ala Glu Ile Thr Pro Val Arg Ser Val Asp Gly Ile Gln
260 265 270
Val Gly Glu Gly Arg Cys Gly Pro Val Thr Lys Arg Ile Gln Gln Ala
275 280 285
Phe Phe Gly Leu Phe Thr Gly Glu Thr Glu Asp Lys Trp Gly Trp Leu
290 295 300
Asp Gln Val Asn Gln
305
<210> 28
<211> 616
<212> PRT
<213> 大肠杆菌
<400> 28
Met Pro Lys Tyr Arg Ser Ala Thr Thr Thr His Gly Arg Asn Met Ala
1 5 10 15
Gly Ala Arg Ala Leu Trp Arg Ala Thr Gly Met Thr Asp Ala Asp Phe
20 25 30
Gly Lys Pro Ile Ile Ala Val Val Asn Ser Phe Thr Gln Phe Val Pro
35 40 45
Gly His Val His Leu Arg Asp Leu Gly Lys Leu Val Ala Glu Gln Ile
50 55 60
Glu Ala Ala Gly Gly Val Ala Lys Glu Phe Asn Thr Ile Ala Val Asp
65 70 75 80
Asp Gly Ile Ala Met Gly His Gly Gly Met Leu Tyr Ser Leu Pro Ser
85 90 95
Arg Glu Leu Ile Ala Asp Ser Val Glu Tyr Met Val Asn Ala His Cys
100 105 110
Ala Asp Ala Met Val Cys Ile Ser Asn Cys Asp Lys Ile Thr Pro Gly
115 120 125
Met Leu Met Ala Ser Leu Arg Leu Asn Ile Pro Val Ile Phe Val Ser
130 135 140
Gly Gly Pro Met Glu Ala Gly Lys Thr Lys Leu Ser Asp Gln Ile Ile
145 150 155 160
Lys Leu Asp Leu Val Asp Ala Met Ile Gln Gly Ala Asp Pro Lys Val
165 170 175
Ser Asp Ser Gln Ser Asp Gln Val Glu Arg Ser Ala Cys Pro Thr Cys
180 185 190
Gly Ser Cys Ser Gly Met Phe Thr Ala Asn Ser Met Asn Cys Leu Thr
195 200 205
Glu Ala Leu Gly Leu Ser Gln Pro Gly Asn Gly Ser Leu Leu Ala Thr
210 215 220
His Ala Asp Arg Lys Gln Leu Phe Leu Asn Ala Gly Lys Arg Ile Val
225 230 235 240
Glu Leu Thr Lys Arg Tyr Tyr Glu Gln Asn Asp Glu Ser Ala Leu Pro
245 250 255
Arg Asn Ile Ala Ser Lys Ala Ala Phe Glu Asn Ala Met Thr Leu Asp
260 265 270
Ile Ala Met Gly Gly Ser Thr Asn Thr Val Leu His Leu Leu Ala Ala
275 280 285
Ala Gln Glu Ala Glu Ile Asp Phe Thr Met Ser Asp Ile Asp Lys Leu
290 295 300
Ser Arg Lys Val Pro Gln Leu Cys Lys Val Ala Pro Ser Thr Gln Lys
305 310 315 320
Tyr His Met Glu Asp Val His Arg Ala Gly Gly Val Ile Gly Ile Leu
325 330 335
Gly Glu Leu Asp Arg Ala Gly Leu Leu Asn Arg Asp Val Lys Asn Val
340 345 350
Leu Gly Leu Thr Leu Pro Gln Thr Leu Glu Gln Tyr Asp Val Met Leu
355 360 365
Thr Gln Asp Asp Ala Val Lys Asn Met Phe Arg Ala Gly Pro Ala Gly
370 375 380
Ile Arg Thr Thr Gln Ala Phe Ser Gln Asp Cys Arg Trp Asp Thr Leu
385 390 395 400
Asp Asp Asp Arg Ala Asn Gly Cys Ile Arg Ser Leu Glu His Ala Tyr
405 410 415
Ser Lys Asp Gly Gly Leu Ala Val Leu Tyr Gly Asn Phe Ala Glu Asn
420 425 430
Gly Cys Ile Val Lys Thr Ala Gly Val Asp Asp Ser Ile Leu Lys Phe
435 440 445
Thr Gly Pro Ala Lys Val Tyr Glu Ser Gln Asp Asp Ala Val Glu Ala
450 455 460
Ile Leu Gly Gly Lys Val Val Ala Gly Asp Val Val Val Ile Arg Tyr
465 470 475 480
Glu Gly Pro Lys Gly Gly Pro Gly Met Gln Glu Met Leu Tyr Pro Thr
485 490 495
Ser Phe Leu Lys Ser Met Gly Leu Gly Lys Ala Cys Ala Leu Ile Thr
500 505 510
Asp Gly Arg Phe Ser Gly Gly Thr Ser Gly Leu Ser Ile Gly His Val
515 520 525
Ser Pro Glu Ala Ala Ser Gly Gly Ser Ile Gly Leu Ile Glu Asp Gly
530 535 540
Asp Leu Ile Ala Ile Asp Ile Pro Asn Arg Gly Ile Gln Leu Gln Val
545 550 555 560
Ser Asp Ala Glu Leu Ala Ala Arg Arg Glu Ala Gln Asp Ala Arg Gly
565 570 575
Asp Lys Ala Trp Thr Pro Lys Asn Arg Glu Arg Gln Val Ser Phe Ala
580 585 590
Leu Arg Ala Tyr Ala Ser Leu Ala Thr Ser Ala Asp Lys Gly Ala Val
595 600 605
Arg Asp Lys Ser Lys Leu Gly Gly
610 615
<210> 29
<211> 514
<212> PRT
<213> 大肠杆菌
<400> 29
Met Ala Asp Ser Gln Pro Leu Ser Gly Ala Pro Glu Gly Ala Glu Tyr
1 5 10 15
Leu Arg Ala Val Leu Arg Ala Pro Val Tyr Glu Ala Ala Gln Val Thr
20 25 30
Pro Leu Gln Lys Met Glu Lys Leu Ser Ser Arg Leu Asp Asn Val Ile
35 40 45
Leu Val Lys Arg Glu Asp Arg Gln Pro Val His Ser Phe Lys Leu Arg
50 55 60
Gly Ala Tyr Ala Met Met Ala Gly Leu Thr Glu Glu Gln Lys Ala His
65 70 75 80
Gly Val Ile Thr Ala Ser Ala Gly Asn His Ala Gln Gly Val Ala Phe
85 90 95
Ser Ser Ala Arg Leu Gly Val Lys Ala Leu Ile Val Met Pro Thr Ala
100 105 110
Thr Ala Asp Ile Lys Val Asp Ala Val Arg Gly Phe Gly Gly Glu Val
115 120 125
Leu Leu His Gly Ala Asn Phe Asp Glu Ala Lys Ala Lys Ala Ile Glu
130 135 140
Leu Ser Gln Gln Gln Gly Phe Thr Trp Val Pro Pro Phe Asp His Pro
145 150 155 160
Met Val Ile Ala Gly Gln Gly Thr Leu Ala Leu Glu Leu Leu Gln Gln
165 170 175
Asp Ala His Leu Asp Arg Val Phe Val Pro Val Gly Gly Gly Gly Leu
180 185 190
Ala Ala Gly Val Ala Val Leu Ile Lys Gln Leu Met Pro Gln Ile Lys
195 200 205
Val Ile Ala Val Glu Ala Glu Asp Ser Ala Cys Leu Lys Ala Ala Leu
210 215 220
Asp Ala Gly His Pro Val Asp Leu Pro Arg Val Gly Leu Phe Ala Glu
225 230 235 240
Gly Val Ala Val Lys Arg Ile Gly Asp Glu Thr Phe Arg Leu Cys Gln
245 250 255
Glu Tyr Leu Asp Asp Ile Ile Thr Val Asp Ser Asp Ala Ile Cys Ala
260 265 270
Ala Met Lys Asp Leu Phe Glu Asp Val Arg Ala Val Ala Glu Pro Ser
275 280 285
Gly Ala Leu Ala Leu Ala Gly Met Lys Lys Tyr Ile Ala Leu His Asn
290 295 300
Ile Arg Gly Glu Arg Leu Ala His Ile Leu Ser Gly Ala Asn Val Asn
305 310 315 320
Phe His Gly Leu Arg Tyr Val Ser Glu Arg Cys Glu Leu Gly Glu Gln
325 330 335
Arg Glu Ala Leu Leu Ala Val Thr Ile Pro Glu Glu Lys Gly Ser Phe
340 345 350
Leu Lys Phe Cys Gln Leu Leu Gly Gly Arg Ser Val Thr Glu Phe Asn
355 360 365
Tyr Arg Phe Ala Asp Ala Lys Asn Ala Cys Ile Phe Val Gly Val Arg
370 375 380
Leu Ser Arg Gly Leu Glu Glu Arg Lys Glu Ile Leu Gln Met Leu Asn
385 390 395 400
Asp Gly Gly Tyr Ser Val Val Asp Leu Ser Asp Asp Glu Met Ala Lys
405 410 415
Leu His Val Arg Tyr Met Val Gly Gly Arg Pro Ser His Pro Leu Gln
420 425 430
Glu Arg Leu Tyr Ser Phe Glu Phe Pro Glu Ser Pro Gly Ala Leu Leu
435 440 445
Arg Phe Leu Asn Thr Leu Gly Thr Tyr Trp Asn Ile Ser Leu Phe His
450 455 460
Tyr Arg Ser His Gly Thr Asp Tyr Gly Arg Val Leu Ala Ala Phe Glu
465 470 475 480
Leu Gly Asp His Glu Pro Asp Phe Glu Thr Arg Leu Asn Glu Leu Gly
485 490 495
Tyr Asp Cys His Asp Glu Thr Asn Asn Pro Ala Phe Arg Phe Phe Leu
500 505 510
Ala Gly

Claims (10)

1.DNA分子甲,如序列表的序列19第137至215位核苷酸所示。
2.权利要求1所述DNA分子甲在促进下游目的基因表达中的应用。
3.DNA分子乙或DNA分子丙;
DNA分子乙自上游至下游依次包括:权利要求1所述DNA分子甲和目的基因;
DNA分子丙,自上游至下游依次包括:启动子、权利要求1所述DNA分子甲、目的基因和终止子。
4.DNA分子丁或DNA分子戊;
所述DNA分子丁是将ilvLXGMEDA操纵子基因中从ilv衰减子第1位开始计数的第1至136位核苷酸去除得到的DNA分子;ilvLXGMEDA操纵子基因如序列表的序列19所示;
所述DNA分子戊是含有所述DNA分子丁的DNA分子。
5.含有权利要求4所述的DNA分子丁或含有权利要求4所述的DNA分子戊的重组载体,或,含有权利要求4所述的DNA分子丁或含有权利要求4所述的DNA分子戊的重组菌。
6.一种构建重组菌的方法,包括如下步骤:通过同源重组的方式,使出发菌中具有权利要求4中所述的DNA分子丁或具有权利要求4中所述的DNA分子戊,得到重组菌。
7.权利要求6所述方法构建得到的重组菌。
8.权利要求5所述重组菌或权利要求7所述重组菌在制备异亮氨酸中的应用。
9.一种提高微生物生产异亮氨酸的能力的方法,包括如下步骤:删除微生物的ilvLXGMEDA操纵子基因中从ilv衰减子第1位开始计数的第1至136位核苷酸;ilvLXGMEDA操纵子基因如序列表的序列19所示。
10.一种解除微生物中ilvLXGMEDA操纵子反馈阻遏的方法,包括如下步骤:删除微生物的ilvLXGMEDA操纵子基因中从ilv衰减子第1位开始计数的第1至136位核苷酸;ilvLXGMEDA操纵子基因如序列表的序列19所示。
CN201710388810.2A 2016-10-27 2017-05-27 基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用 Active CN107058323B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201710388810.2A CN107058323B (zh) 2017-05-27 2017-05-27 基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用
PCT/CN2017/107453 WO2018077159A1 (zh) 2016-10-27 2017-10-24 氨基酸衰减子的改造方法及其在生产中的应用
EP17864640.2A EP3533872A4 (en) 2016-10-27 2017-10-24 PROCESS FOR MODIFYING AN AMINO ACID ATTENUATOR AND ITS USE IN PRODUCTION
US16/345,669 US11492616B2 (en) 2016-10-27 2017-10-24 Method for modifying amino acid attenuator and use of same in production
CN201780003425.XA CN108473990A (zh) 2016-10-27 2017-10-24 氨基酸衰减子的改造方法及其在生产中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710388810.2A CN107058323B (zh) 2017-05-27 2017-05-27 基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用

Publications (2)

Publication Number Publication Date
CN107058323A CN107058323A (zh) 2017-08-18
CN107058323B true CN107058323B (zh) 2019-10-25

Family

ID=59610759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710388810.2A Active CN107058323B (zh) 2016-10-27 2017-05-27 基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用

Country Status (1)

Country Link
CN (1) CN107058323B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3533872A4 (en) * 2016-10-27 2020-09-09 Institute Of Microbiology, Chinese Academy Of Sciences PROCESS FOR MODIFYING AN AMINO ACID ATTENUATOR AND ITS USE IN PRODUCTION
CN107287196B (zh) * 2017-05-27 2020-05-26 中国科学院微生物研究所 ilv衰减子的突变体、相关工程菌及其在生产缬氨酸中的应用
CN108424870B (zh) * 2018-04-04 2021-07-27 江南大学 一种生产n-乙酰氨基葡萄糖的谷氨酸棒杆菌及其应用
CN115109737B (zh) * 2022-06-02 2024-04-12 浙江工业大学 基于ilvC突变体高产D-泛酸的基因工程菌、构建方法及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105176907A (zh) * 2015-10-20 2015-12-23 上海工业生物技术研发中心 L-异亮氨酸基因工程生产菌
CN106480035A (zh) * 2016-10-27 2017-03-08 中国科学院微生物研究所 一种5’‑utr元件及其在生产中的应用
CN106520801A (zh) * 2016-10-27 2017-03-22 中国科学院微生物研究所 苏氨酸衰减子的突变体及其应用以及解除苏氨酸操纵子反馈阻遏的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105176907A (zh) * 2015-10-20 2015-12-23 上海工业生物技术研发中心 L-异亮氨酸基因工程生产菌
CN106480035A (zh) * 2016-10-27 2017-03-08 中国科学院微生物研究所 一种5’‑utr元件及其在生产中的应用
CN106520801A (zh) * 2016-10-27 2017-03-22 中国科学院微生物研究所 苏氨酸衰减子的突变体及其应用以及解除苏氨酸操纵子反馈阻遏的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《代谢工程改造大肠杆菌合成L-异亮氨酸的研究》;李燕军等;《发酵科技通讯》;20160831;第45卷(第3期);第133-139页 *

Also Published As

Publication number Publication date
CN107058323A (zh) 2017-08-18

Similar Documents

Publication Publication Date Title
CN107058323B (zh) 基于ilv衰减子的工程菌及其在生产异亮氨酸中的应用
CN103635578B (zh) 编码甘油醛3-磷酸脱氢酶的gap基因的启动子的变体
JP5486029B2 (ja) 遺伝子増幅によるリジン産生の増加
CN110869504A (zh) 来自谷氨酸棒状杆菌的启动子及其在调节辅助基因表达中的用途
KR101823710B1 (ko) 세포 내에 대사물질 감지용 센서
CN105492616A (zh) 使用含有可通过丙酸盐诱导的ilvbn操纵子的重组棒杆菌生产L-亮氨酸、L-缬氨酸、L-异亮氨酸、α-酮异戊酸、α-酮-β-甲基戊酸或α-酮异己酸的方法
JP6341907B2 (ja) フィードバック耐性アルファ−イソプロピルリンゴ酸合成酵素
JP2017523787A (ja) フィードバック抵抗性アセトヒドロキシ酸シンターゼ変異体及びそれを用いたl−バリンの生産方法
RU2683551C1 (ru) Микроорганизм, обладающий продуктивностью по L-лизину, и способ получения L-лизина с использованием этого микроорганизма
CN106520801B (zh) 苏氨酸衰减子的突变体及其应用以及解除苏氨酸操纵子反馈阻遏的方法
FI93657C (fi) Mikrobinen biotiinin tuotantosysteemi ja menetelmä biotiinituotannon lisäämiseksi
EP4342994A1 (en) Genetically engineered bacterium for realizing high yield of l-isoleucine and method for producing l-isoleucine by means of fermentation method
CN110741091A (zh) 增加nadph的生物合成途径的基因组工程化
WO2018077159A1 (zh) 氨基酸衰减子的改造方法及其在生产中的应用
CN107287197B (zh) 组氨酸衰减子突变体和解决反馈阻遏的组氨酸操纵子以及它们的应用
CN114277046A (zh) 一种合成四氢嘧啶的三基因串联表达载体及应用
EP2543728B1 (en) Method for producing useful substances by a recombinant actinomycete, Streptomyces species
CN107236738B (zh) 色氨酸衰减子突变体及其应用以及解除色氨酸衰减子反馈阻遏的方法
CN107287196B (zh) ilv衰减子的突变体、相关工程菌及其在生产缬氨酸中的应用
CN107287198B (zh) 苯丙氨酸衰减子突变体和解决反馈阻遏的苯丙氨酸操纵子以及它们的应用
KR101863239B1 (ko) 아세트산을 유일 탄소원으로 이용할 수 있는 미생물
Bubnov et al. Glutamyl-and Glutaminyl-tRNA synthetases are a promising target for the design of an L-Threonine–producing strain
KR20180097816A (ko) 메티오닌 생합성능이 향상된 변이세포
CN115873852A (zh) 重组核酸序列、基因工程菌及生产1,5-戊二胺的方法
CN116601300A (zh) 阿魏酸生物转化为香草醛

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant