CN101432434B - 4碳醇的发酵生产 - Google Patents

4碳醇的发酵生产 Download PDF

Info

Publication number
CN101432434B
CN101432434B CN200680035878.2A CN200680035878A CN101432434B CN 101432434 B CN101432434 B CN 101432434B CN 200680035878 A CN200680035878 A CN 200680035878A CN 101432434 B CN101432434 B CN 101432434B
Authority
CN
China
Prior art keywords
seq
coa
gene
butyl alcohol
ald
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200680035878.2A
Other languages
English (en)
Other versions
CN101432434A (zh
Inventor
G·K·唐纳森
L·L·黄
L·A·马吉奥-黑尔
V·纳加拉彦
C·E·纳卡穆拉
W·叔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Butamax Advanced Biofuels LLC
Original Assignee
Butamax Advanced Biofuels LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Butamax Advanced Biofuels LLC filed Critical Butamax Advanced Biofuels LLC
Priority claimed from PCT/US2006/038007 external-priority patent/WO2007041269A2/en
Publication of CN101432434A publication Critical patent/CN101432434A/zh
Application granted granted Critical
Publication of CN101432434B publication Critical patent/CN101432434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

提供了用于发酵生产4碳醇的方法。具体而言,丁醇,优选地1-丁醇通过表达1-丁醇生物合成途径的重组细菌的发酵生长来生产。

Description

4碳醇的发酵生产
                与相关申请的交叉参考
本申请根据35 U.S.C.§119要求于2005年9月29日提交的美国临时申请系列号60/721677,和2006年6月16日提交的美国临时申请系列号60/814470的优先权。
                    发明领域
本发明涉及工业微生物学和醇生产领域。更具体而言,1-丁醇经由重组微生物的工业发酵来生产。
                    发明背景
丁醇是重要的工业化学药品,用作燃料添加剂、塑料工业中的原料化学药品、以及食物和调味剂工业中的食物级提取剂。每年有100-120亿磅丁醇通过石油化学方法进行生产,并且关于这种日用化学药品的需要将很可能增加。
用于化学合成1-丁醇的方法是已知的,例如Oxo Process、ReppeProcess、和巴豆醛氢化(Ullmann′s Encyclopedia of Industrial Chemistry,第6版,2003,Wiley-VCHVerlag GmbH and Co.,Weinheim,德国,第5卷,第716-719页)。这些方法使用来源于石油化学的原材料并且一般是昂贵且不是环境友好的。来自植物衍生原材料的1-丁醇生产将使温室气体排放减到最小且将代表本领域的进展。
用于通过其他有机化学药品的生物转化生产1-丁醇的方法也是已知的。例如,Muramoto等人(JP63017695)描述了使用假单胞菌属(Pseudomonas)菌株用于从醛生产醇包括丁醇的方法。此外,Kuehnle等人(EP 1149918)描述了通过各种赤红球菌(Rhodococcus ruber)菌株氧化烃来制备1-丁醇和2-丁醇的方法。
通过发酵生产丁醇的方法也是已知的,其中最普遍的方法生产丙酮、1-丁醇和乙醇的混合物,且被称为ABE方法(Blaschek等人,美国专利号6,358,717)。通过丙酮丁醇梭菌(Clostridium acetobutylicum)的丙酮-丁醇-乙醇(ABE)发酵是认识最久的已知工业发酵之一,并且负责生产这些溶剂的途径和基因已得到报道((Girbal等人,Trends inBiotechnology 16:11-16(1998))。然而,实际发酵仍是相当复杂且难以控制的。自20世纪50年代以后ABE发酵已不断下降,且现在几乎所有丁醇都经由如上所述的石油化学途径生产。在一般的ABE发酵中,丁酸、丙酸、乳酸和乙酸首先通过丙酮丁醇梭菌生产,培养物pH降低且经历代谢“蝶形(butterfly)”移动,随后形成1-丁醇、丙酮、异丙醇和乙醇。在常规ABE发酵中,来自葡萄糖的1-丁醇产量低,一般为约15%且很少超过25%。因此,在常规ABE发酵中的1-丁醇浓度通常低于1.3%。
通过消除所有其他溶剂副产品使来自ABE方法的1-丁醇生产达到最大的尝试尚未完全成功,且因此该方法产生相当大量不能用作汽油添加剂的丙酮。用于发酵生产丁醇的其中1-丁醇是唯一产物的方法将代表本领域的进展。
因此需要用于生产1-丁醇作为单一产物、环境负责、有成本效益的方法。本发明通过发现表达1-丁醇生物合成途径的重组微生物生产宿主解决了这个需要。
                      发明概述
本发明提供了具有工程改造的1-丁醇生物合成途径的重组微生物。工程改造的微生物可以用于1-丁醇的商业生产。因此本发明提供了包含编码多肽的至少一种DNA分子的重组微生物宿主细胞,所述多肽催化选自下述的底物至产物转化:
a)乙酰辅酶A至乙酰乙酰辅酶A
b)乙酰乙酰辅酶A至3-羟丁酰辅酶A
c)3-羟丁酰辅酶A至巴豆酰辅酶A
d)巴豆酰辅酶A至丁酰辅酶A
e)丁酰辅酶A至丁醛和
f)丁醛至1-丁醇;
其中所述至少一种DNA分子对于所述微生物宿主细胞是异源的且其中所述微生物宿主细胞生产1-丁醇。
在另一个实施方案中,本发明提供了用于生产1-丁醇的方法,所述方法包括:
i)提供包含编码多肽的至少一种DNA分子的重组微生物宿主细胞,所述多肽催化选自下述的底物至产物转化:
a)乙酰辅酶A至乙酰乙酰辅酶A
b)乙酰乙酰辅酶A至3-羟丁酰辅酶A
c)3-羟丁酰辅酶A至巴豆酰辅酶A
d)巴豆酰辅酶A至丁酰辅酶A
e)丁酰辅酶A至丁醛和
f)丁醛至1-丁醇;
其中所述至少一种DNA分子对于所述微生物宿主细胞是异源的;和
ii)使(i)的所述宿主细胞在由此生产1-丁醇的条件下与可发酵的碳底物接触。
               附图简述和序列描述
根据形成本申请部分的下述详细描述、附图和伴随的序列描述可以更充分地理解本发明。
图1显示了1-丁醇生物合成途径。标记为“a”、“b”、“c”、“d”、“e”和“f”的步骤表示下文描述的底物至产物转化。
下述序列符合37C.F.R.1.821-1.825(″Requirements for PatentApplications Containing Nucleotide Sequences and/or Amino AcidSequence Disclosures-the Sequence Rules″),并且符合世界知识产权组织(WIPO)标准ST.25(1998)以及EPO和PCT的序列表要求(管理条令(Administrative Instructions)的规则5.2和49.5(a-bis),以及部分(section)208和附录C)。对于核苷酸和氨基酸序列使用的符号和格式遵守37C.F.R.§1.822中所述规则。
                         表1
               基因和蛋白质SEO ID NO.概括
  描述   SEQ ID NO核酸   SEQ ID NO肽
  来自丙酮丁醇梭菌ATCC 824的乙酰辅酶A乙酰转移酶thlA   1   2
  来自丙酮丁醇梭菌ATCC 824的乙酰辅酶A乙酰转移酶thlB   3   4
  来自大肠杆菌(Escherichia coli)的乙酰辅酶A乙酰转移酶   128   129
  来自枯草芽孢杆菌(Bacillussubtilis)的乙酰辅酶A乙酰转移酶   130   131
  来自啤酒糖酵母(Saccharomycescerevisiae)的乙酰辅酶A乙酰转移酶   132   133
  来自丙酮丁醇梭菌ATCC 824的3-羟丁酰辅酶A脱氢酶   5   6
  来自枯草芽孢杆菌的3-羟丁酰辅酶A脱氢酶   134   135
  来自富养罗尔斯通氏菌(Ralstoniaeutropha)的3-羟丁酰辅酶A脱氢酶   136   137
  来自真养产碱菌(Alcaligeneseutrophus)的3-羟丁酰辅酶A脱氢酶   138   139
  来自丙酮丁醇梭菌ATCC 824的巴豆酸酶   7   8
  来自大肠杆菌的巴豆酸酶   140   141
  来自枯草芽孢杆菌的巴豆酸酶   142   143
  来自豚鼠气单胞菌(Aeromonascaviae)的巴豆酸酶   144   145
  来自丙酮丁醇梭菌ATCC 824的推定的反式烯酰辅酶A还原酶   9   10
  来自小眼虫(Euglena gracilis)的丁酰辅酶A脱氢酶   146   147
  来自丘链霉菌(Streptomycescollinus)的丁酰辅酶A脱氢酶   148   149
  来自天蓝色链霉菌(Streptomycescoelocolor)的丁酰辅酶A脱氢酶   150   151
  来自拜氏梭菌(Clostridiumbeijerinckii)NRRL B594的丁醛脱氢酶   11   12
  来自丙酮丁醇梭菌的丁醛脱氢酶   152   153
  来自丙酮丁醇梭菌ATCC 824的丁醇脱氢酶bdhB   13   14
  来自丙酮丁醇梭菌ATCC 824的丁醇脱氢酶bdhA   15   16
  来自丙酮丁醇梭菌的丁醇脱氢酶   152   153
  来自大肠杆菌的丁醇脱氢酶   154   155
SEQ ID NOs:17-44是用于扩增1-丁醇生物合成途径基因的寡核苷酸引物的核苷酸序列。
SEQ ID NOs:45-72是用于测序的寡核苷酸引物的核苷酸序列。
SEQ ID NOs:73-75是用于构建实施例9中所述转化载体的寡核苷酸引物的核苷酸序列。
SEQ ID NO:76是在本文中称为CaTER的密码子最优化的CAC0462基因的核苷酸序列。
SEQ ID NO:77是在本文中称为EgTER(opt)的密码子最优化的EgTER基因的核苷酸序列。
SEQ ID NO:78是在本文中称为ald(opt)的密码子最优化的ald基因的核苷酸序列。
SEQ ID NO:79是质粒pFP988的核苷酸序列。
SEQ ID NO:′s 80-127、160-185、和190-207是用于克隆、测序或筛选本文所述的1-丁醇生物合成途径基因的克隆、测序或PCR筛选引物的核酸序列,且在表4和5中更充分地描述。
SEQ ID NO:156是cscBKA基因簇的核苷酸序列。
SEQ ID NO:157是蔗糖水解酶(CscA)的氨基酸序列。
SEQ ID NO:158是D-果糖激酶(CscK)的氨基酸序列。
SEQ ID NO:159是蔗糖透性酶(CscB)的氨基酸序列。
SEQ ID NO:186是实施例17中所述的密码子最优化的tery基因的核苷酸序列。
SEQ ID NO:187是由密码子最优化的tery基因(SEQ ID NO:186)编码的丁酰辅酶A脱氢酶(ter)的氨基酸序列。
SEQ ID NO:188是实施例17中所述的密码子最优化的aldy基因的核苷酸序列。
SEQ ID NO:189是由密码子最优化的aldy基因(SEQ ID NO:188)编码的丁酰脱氢酶(ald)的氨基酸序列。
SEQ ID NO:208是实施例14中使用的模板DNA的核苷酸序列。
                       发明详述
本发明涉及使用重组微生物生产1-丁醇的方法。本发明满足了许多商业和工业需要。丁醇是具有多种应用的重要工业日用化学药品,其中它作为燃料或燃料添加剂的潜力特别重要。尽管只是4碳醇,但丁醇具有的能含量类似于汽油的那种,且可以与任何化石燃料掺合。丁醇作为燃料或燃料添加剂是有利的,因为当在标准内燃机中燃烧时,它只产生CO2,且产生很少或没有SOx或NOx。此外丁醇的腐蚀性少于迄今为止最优选的燃料添加剂乙醇。
除了其作为生物燃料或燃料添加剂的效用,丁醇具有影响新兴的燃料电池工业中的氢分布问题的潜力。燃料电池现今受到与氢运输和分布有关的安全关心的困扰。丁醇可以容易地对于其氢含量进行改造,且可以通过现有加油站以燃料电池或车辆所需的纯度进行分配。
最后本发明从植物衍生的碳源生产丁醇,从而避免了与用于丁醇生产的标准石油化学方法相关的负面环境影响。
下述定义和缩写用于解释权利要求和说明书。
如本文使用的,术语“发明”或“本发明”是非限制性术语,且不预期指本发明的任何单个实施方案,而是包含如说明书和权利要求中所述的所有可能实施方案。
“ABE”是关于丙酮-丁醇-乙醇发酵方法的缩写。
术语“1-丁醇生物合成途径”意指从乙酰辅酶A(乙酰CoA)生产1-丁醇的酶途径。
术语“乙酰辅酶A乙酰转移酶”指催化2个乙酰辅酶A分子转化成乙酰乙酰辅酶A和辅酶A(CoA)的酶。优选的乙酰辅酶A乙酰转移酶是对短链酰基辅酶A和乙酰辅酶A具有底物优先的乙酰辅酶A乙酰转移酶(在正向中的反应),且分类为E.C.2.3.1.9[EnzymeNomenclature 1992,Academic Press,San Diego];尽管,具有更广泛底物范围的酶(E.C.2.3.1.16)也将起作用。乙酰辅酶A乙酰转移酶可从许多来源获得,例如大肠杆菌(GenBank Nos:NP_416728(SEQ IDNO:129),NC_000913(SEQ ID NO:128);NCBI(国家生物技术信息中心(National Center for Biotechnology Information))氨基酸序列,NCBI核苷酸序列),丙酮丁醇梭菌(GenBank Nos:NP_349476.1(SEQ ID NO:2),NC_003030(SEQ ID NO:1);NP_149242(SEQID NO:4),NC_001988(SEQ ID NO:3),枯草芽孢杆菌(GenBankNos:NP_390297(SEQ ID NO:131),NC_000964(SEQ ID NO:130)),和啤酒糖酵母(GenBank Nos:NP_015297(SEQ ID NO:133),NC_001148(SEQ ID NO:132))。
术语“3-羟丁酰辅酶A脱氢酶”指催化乙酰乙酰辅酶A转化成3-羟丁酰辅酶A的酶。3-羟丁酰辅酶A脱氢酶可以是还原型烟酰胺腺嘌呤二核苷酸(NADH)依赖性的,对(S)-3-羟丁酰辅酶A或(R)-3-羟丁酰辅酶A具有底物优先,且分别分类为E.C.1.1.1.35和E.C.1.1.1.30。此外,3-羟丁酰辅酶A脱氢酶可以是还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH)依赖性的,对(S)-3-羟丁酰辅酶A或(R)-3-羟丁酰辅酶A具有底物优先,且分别分类为E.C.1.1.1.157和E.C.1.1.1.36。3-羟丁酰辅酶A脱氢酶可从许多来源获得,例如,丙酮丁醇梭菌(GenBank NOs:NP_349314(SEQ ID NO:6),NC_003030(SEQID NO:5)),枯草芽孢杆菌(GenBank NOs:AAB09614(SEQ ID NO:135),U29084(SEQ ID NO:134)),富养罗尔斯通氏菌(GenBankNOs:YP_294481(SEQ ID NO:137),NC_007347(SEQ ID NO:136)),和真养产碱菌(GenBank NOs:AAA21973(SEQ ID NO:139),J04987(SEQ ID NO:138))。
术语“巴豆酸酶”指催化3-羟丁酰辅酶A转化成巴豆酰辅酶A和H2O的酶。巴豆酸酶可以对(S)-3-羟丁酰辅酶A或(R)-3-羟丁酰辅酶A具有底物优先,且分别分类为E.C.4.2.1.17和E.C.4.2.1.55。巴豆酸酶可从许多来源获得,例如大肠杆菌(GenBank NOs:NP_415911(SEQ ID NO:141),NC_000913(SEQ ID NO:140)),丙酮丁醇梭菌(GenBank NOs:NP_349318(SEQ ID NO:8),NC_003030(SEQID NO:6)),枯草芽孢杆菌(GenBank NOs:CAB13705(SEQ ID NO:143),Z99113(SEQ ID NO:142)),和豚鼠气单胞菌(GenBank NOs:BAA21816(SEQ ID NO:145),D88825(SEQ ID NO:144))。
术语“丁酰辅酶A脱氢酶”指催化巴豆酰辅酶A转化成丁酰辅酶A的酶。丁酰辅酶A脱氢酶可以是NADH依赖性或NADPH依赖性的,且分别分类为E.C.1.3.1.44和E.C.1.3.1.38。丁酰辅酶A脱氢酶可从许多来源获得,例如,丙酮丁醇梭菌(GenBank NOs:NP_347102(SEQID NO:10),NC_003030(SEQ ID NO:9))),小眼虫(GenBankNOs:Q5EU90 SEQ ID NO:147),AY741582 SEQ ID NO:146)),丘链霉菌(GenBank NOs:AAA92890(SEQ ID NO:149),U37135(SEQ ID NO:148)),和天蓝色链霉菌(Streptomyces coelicolor)(GenBank NOs:CAA22721(SEQ ID NO:151),AL939127(SEQ IDNO:150))。
术语“丁醛脱氢酶”指使用NADH或NADPH作为辅因子,催化丁酰辅酶A转化成丁醛的酶。对于NADH具有优先的丁醛脱氢酶被称为E.C.1.2.1.57,且可从下述来源获得:例如,拜氏梭菌(GenBank NOs:AAD31841(SEQ ID NO:12),AF157306(SEQ ID NO:11))和丙酮丁醇梭菌(GenBank NOs:NP_149325(SEQ ID NO:153),NC_001988(SEQ ID NO:152))。
术语“丁醇脱氢酶”指使用NADH或NADPH作为辅因子,催化丁醛转化成1-丁醇的酶。丁醇脱氢酶可从下述来源获得:例如,丙酮丁醇梭菌(GenBank NOs:NP_149325(SEQ ID NO:153),NC_001988SEQ ID NO:152;注:这种酶具有醛和醇脱氢酶活性);NP_349891(SEQ ID NO:14),NC_003030(SEQ ID NO:13);和NP_349892(SEQ ID NO:16),NC_003030(SEQ ID NO:15))和大肠杆菌(GenBankNOs:NP_417484(SEQ ID NO:155),NC_000913(SEQ ID NO:154))。
术语“兼性厌氧菌”指在需氧和厌氧环境中都能够生长的微生物。
术语“碳底物”或“可发酵的碳底物”指能够由本发明的宿主生物代谢的碳源,且特别是选自单糖、寡糖、多糖和一碳底物或其混合物的碳源。
术语“基因”指能够表达为特定蛋白质的核酸片段,任选包括在编码序列前(5′非编码序列)和后(3′非编码序列)的调节序列。“天然基因”指如在自然界中与其自身调节序列一起发现的基因。“嵌合基因”指不是天然基因的任何基因,包含在自然界中未在一起发现的调节和编码序列。因此,嵌合基因可以包含来源于不同来源的调节序列和编码序列,或调节序列和编码序列来源于相同来源,但排列方式不同于自然界中发现的那种。“内源基因”指在生物基因组中其天然位置中的天然基因。“外来”或“异源基因”指在宿主生物中通常未发现,但通过基因转移引入宿主生物内的基因。外来基因可以包含插入非天然生物内的天然基因,或嵌合基因。“转基因”是已通过转化程序引入基因组内的基因。
如本文使用的,术语“编码序列”指编码特定氨基酸序列的DNA序列。“合适的调节序列”指位于编码序列上游(5′非编码序列)、之内或下游(3′非编码序列),且影响转录、RNA加工或稳定性、或相关编码序列翻译的核苷酸序列。调节序列可以包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应物结合位点和茎环结构。
术语“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。一般而言,编码序列位于启动子序列的3′。启动子可以整体来源于天然基因,或由来源于自然界中发现的不同启动子的不同元件组成,或甚至包含包含合成的DNA区段。本领域技术人员理解,不同启动子可以指导基因在不同组织或细胞类型中,或在不同发育阶段,或响应不同环境或生理条件表达。引起基因在大多数细胞类型中在大多数时间表达的启动子通常被称为“组成型启动子”。进一步认识到因为在大多数情况下调节序列的确切边界尚未完全限定,所以不同长度的DNA片段可以具有相同的启动子活性。
术语“可操作地连接的”指单个核酸片段上的核酸序列的结合,从而使得一种的功能受另一种的影响。例如,当启动子能够影响编码序列表达时(即,编码序列在启动子的转录控制下),它与那种编码序列可操作地连接。编码序列可以与调节序列在有义或反义方向上可操作地连接。
如本文使用的,术语“表达”指来源于本发明核酸片段的有义(mRNA)或反义RNA的转录和稳定累积。表达可以指mRNA翻译成多肽。
如本文使用的,术语“转化”指核酸片段转移到宿主生物内,从而导致遗传学稳定的遗传。包含转化的核酸片段的宿主生物被称为“转基因”或“重组”或“转化”生物。
术语“质粒”、“载体”和“盒”指通常携带并非细胞中央代谢部分的基因的染色体外元件,且通常为环状双链DNA片段的形式。此类元件可以是来源于任何来源的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,线性或环状单或双链DNA或RNA,其中许多核苷酸序列已连接或重组到独特构建体内,所述独特构建体能够将关于所选基因产物的启动子片段和DNA序列连同合适的3′非翻译序列引入细胞内。“转化盒”指包含外来基因且具有除外来基因外的元件的特定载体,所述元件促进特定宿主细胞的转化。“表达盒”指包含外来基因且具有除外来基因外的元件的特定载体,所述元件允许那种基因在外来宿主中增强的表达。
如本文使用的,术语“密码子简并”指允许核苷酸序列变异而不影响编码的多肽的氨基酸序列遗传密码中的性质。技术人员将充分知道由特定宿主细胞在指定给定氨基酸的核苷酸密码子选择中显示的“密码子偏倚”。因此,当合成用于在宿主细胞中改善的表达的基因时,希望这样设计基因,从而使得其密码子选择频率接近宿主细胞的优选密码子选择频率。
当术语“密码子最优化的”指用于转化各种宿主的基因或核酸分子编码区时,它指基因或核酸分子编码区中的密码子改变,以反映宿主生物的一般密码子选择而不改变由DNA编码的多肽。
本文使用的标准重组DNA和分子克隆技术是本领域众所周知的,且由下述参考文献描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY(1989)(下文″Maniatis″);和Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments with GeneFusions,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY(1984);以及Ausubel,F.M.等人,Current Protocols in MolecularBiology,由Greene Publishing Assoc.and Wiley-lnterscience出版(1987)。
1-丁醇生物合成途径
利用碳水化合物的微生物使用Embden-Meyerhof-Parnas(EMP)途径、Entner-Doudoroff途径和戊糖磷酸循环作为中央代谢途径,以提供能量和细胞前体用于生长和维持。这些途径共有中间物甘油醛-3-磷酸,且最终直接或与EMP途径组合形成丙酮酸盐。随后,丙酮酸盐经由多种方法转化成乙酰辅酶A(乙酰-CoA),包括与丙酮酸脱氢酶复合体、丙酮酸-甲酸裂合酶、和丙酮酸-铁氧还蛋白氧化还原酶反应。乙酰辅酶A充当例如脂肪酸、氨基酸和次生代谢物产生中的关键中间物。糖转化成乙酰辅酶A的组合反应产生能量(例如,腺苷-5′-三磷酸,ATP)和还原当量(例如还原型烟酰胺腺嘌呤二核苷酸NADH,和还原型烟酰胺腺嘌呤二核苷酸磷酸NADPH)。NADH和NADPH必须再循环至其氧化形式(分别为NAD+和NADP+)。在无机电子受体(例如O2、NO3 -和SO4 2-)的存在下,还原当量可以用于增加能量库;可替代地,可以形成还原的碳副产品。起因于碳水化合物发酵的乙醇和1-丁醇产生是后者的例子。
通过提供如图1中所示从乙酰辅酶A到1-丁醇的完整1-丁醇生物合成途径,本发明使得能够用重组微生物从碳水化合物来源生产1-丁醇。由于不存在基因或缺乏合适的基因调节,一般在微生物群落中缺乏的这种生物合成途径,包括下述底物至产物的转化:
a)如例如由乙酰辅酶A乙酰转移酶催化的,乙酰辅酶A至乙酰乙酰辅酶A;
b)如例如通过3-羟丁酰辅酶A脱氢酶催化的,乙酰乙酰辅酶A至3-羟丁酰辅酶A;
c)如例如通过巴豆酸酶催化的,3-羟丁酰辅酶A至巴豆酰辅酶A;
d)如例如通过丁酰辅酶A脱氢酶催化的,巴豆酰辅酶A至丁酰辅酶A;
e)如例如通过丁醛脱氢酶催化的,丁酰辅酶A至丁醛;和
f)如例如通过丁醇脱氢酶催化的,丁醛至1-丁醇。
该途径不需要ATP且产生NAD+和/或NADP+,因此和产生乙酰辅酶A的中央代谢途径平衡。天然生物通过发酵产生1-丁醇的能力是罕见的且最显著地由拜氏梭菌和丙酮丁醇梭菌例示。关于丙酮丁醇梭菌的基因组织和基因调节已得到描述(L.Girbal和P.Soucaille,Trends inBiotechnology 216:11-16(1998))。然而,这些酶活性中的许多还与可替代途径相关,例如烃利用、脂肪酸氧化、和聚羟基链烷酸酯代谢。因此,在提供从乙酰辅酶A到1-丁醇的重组途径中,存在实现个别反应步骤的许多选择,且本领域技术人员将能够利用公众可用序列以构建相关途径。本领域已知和1-丁醇生物合成途径构建中有用的许多代表性基因列表在下文表2中列出。
                           表2
                    1-丁醇途径基因来源
 基因   GenBank引用
 乙酰辅酶A乙酰转移酶   NC_000913大肠杆菌K12,完全基因组gi|49175990|ref|NC_000913.2|[49175990]
  NC_001988丙酮丁醇梭菌ATCC 824质粒pSOL1,完全序列gi|15004705|ref|NC_001988.2|[15004705]
  NC_000964枯草芽孢杆菌枯草亚种str.168,完全基因组gi|50812173|ref|NC_000964.2|[50812173]
  NC_001148啤酒糖酵母染色体XVI,完全染色体序列gi|50593503|ref|NC_001148.3|[50593503]
  CP000017化脓链球菌(Streptococcus pyogenes)MGAS5005,完全基因组gi|71852596|gb|CP000017.1|[71852596]
  NC_005773丁香假单胞菌菜豆致病变种(Pseudomonassyrmgae pv.phaseolicola)1448A,完全基因组gi|71733195|ref|NC_0057733|[71733195]
  CR931997杰氏棒杆菌(Corynebacterium jeikeium)K411,完全基因组gi|68262661|emb|CR931997.1|[68262661]
  3-羟丁酰辅酶A脱氢酶   NC_003030丙酮丁醇梭菌ATCC 824,完全基因组gi|15893298|ref|NC_003030.1|[15893298]
  U29084枯草芽孢杆菌(mmgA)、(mmgB)、(mmgC)和柠檬酸合酶III(mmgD)基因、完全cds、和(mmgE)基因,部分cdsgi|881603|gb|U29084.1|BSU29084[881603]
  NC_007347富养罗尔斯通氏菌JMP134 Raeut01_1,完全基因组鸟枪序列gi|45517296|ref|NZ_AADY0100000.1|[45517296]
  J04987真氧产碱菌β酮硫解酶(phbA)和乙酰乙酰辅酶A还原酶(phbB)基因,完全cdsgi|141953|gb|J04987.1|AFAKTLAACA[141953]
  NC_004129荧光假单胞菌(Pseudomonas fluorescens)Pf-5,完全基因组gi|70728250|ref|NC_004129.6|[70728250]
  NC_000913大肠杆菌K12,完全基因组gi|49175990|ref|NC_000913.2|[49175990]
  NC_004557破伤风梭菌(Clostridium tetam)E88,完全基因组gi|28209834|ref|NC_004557.1|[28209834]
  NC_006350类鼻疽伯克霍尔德氏菌(Burkholderiapseudomallei)K96243染色体1,完全序列gi|53717639|ref|NC_006350.1|[53717639]
  NC_002947恶臭假单胞菌(Pseudomonasputida)KT2440,完全基因组gi|26986745|ref|NC_002947.3|[26986745]
  巴豆酸酶   NC_000913大肠杆菌K12,完全基因组gi|49175990|ref|NC_000913.2|[49175990]
  NC_003030丙酮丁醇梭菌ATCC 824,完全基因组gi|15893298|ref|NC_003030.1|[15893298]
  Z99113枯草芽孢杆菌完全基因组(21个区段中的10个):1807106-2014934gi|32468758|emb|Z99113.2|BSUB0010[32468758]
  D88825关于PHA合酶的豚鼠气单胞菌phaC基因,完全cdsgi|2335048|dbj|D88825.1|[2335048]
  NC_006274蜡状芽孢杆菌(Bacilluscereus)ZK,完全基因组gi|52140164|ref|NC_006274.1|[52140164]
  NC_004557破伤风梭菌E88,完全基因组gi|28209834|ref|NC_004557.1|[28209834]
 丁酰辅酶A脱氢酶   NC_003030丙酮丁醇梭菌ATCC 824,完全基因组gi|15893298|ref|NC_003030.1|[15893298]
  AY741582小眼虫反式-2-烯酰辅酶A还原酶mRNA,完全cdsgi|58201539|gb|AY741582.1|[58201539]
  U37135丘链霉菌巴豆酰辅酶A还原酶(ccr)基因,完全cdsgi|1046370|gb|U37135.1|SCU37135[1046370]
  AL939127天蓝色链霉菌A3(2)完全基因组;区段24/29gi|24429552|emb|AL939127.1|SC0939127[24429552]
  AP006716溶血葡萄球菌(Staphylococcus haemolyticus)JCSC1435,完全基因组gi|68445725|dbj|AP006716.1|[68445725]
  NC_006274蜡状芽孢杆菌ZK,完全基因组gi|52140164|ref|NC_006274.1|[52140164]
  NC_004557破伤风梭菌E88,完全基因组gi|28209834|ref|NC_004557.1|[28209834]
 丁醛脱氢酶   AF157306拜氏梭菌菌株NRRL B593假定蛋白质,辅酶A酰化醛脱氢酶(ald),乙酰乙酸:丁酸/乙酸辅酶A转移酶(ctfA),乙酰乙酸:丁酸/乙酸辅酶A转移酶(ctfB),和乙酰乙酸脱羧酶(adc)基因,完全cdsgi|47422980|gb|AF157306.1|[47422980]
  NC_001988丙酮丁醇梭菌ATCC 824 plasmid pSOL1,完全序列gi|15004705|ref|NC_001988.2|[15004705]
AY251646 Clostridium saccharoperbutylacetonicum sol操纵子,完全序列gi|31075382|gb|AY251646.1|[31075382]
  丁醇脱氢酶   NC_001988丙酮丁醇梭菌ATCC 824 plasmid pSOL1,完全序列gi|15004705|ref|NC_001988.2|[15004705]
  NC_003030丙酮丁醇梭菌ATCC 824,完全基因组gi|15893298|ref|NC_003030.1|[15893298]
  NC_000913大肠杆菌K12,完全基因组gi|49175990|ref|NC_000913.2|[49175990]
  NC_003198肠沙门氏菌肠亚种伤寒血清型(salmonella entericasubsp.enterica serovar Typhi)str.CT18,完全基因组gi|16758993|ref|NC_003198.1|[16758993]
  BX571966类鼻疽伯克霍尔德氏菌株K96243,染色体2,完全序列gi|52211453|emb|BX571966.1|[52211453
  Z99120枯草芽孢杆菌完全基因组(21个区段中的17个):3213330-3414388gi|32468813|emb|Z99120.2|BSUB0017[32468813
  NC_003366产气荚膜梭菌(Clostridium perfringens)str.13,完全基因组gi|18308982|ref|NC_003366.1|[18308982
  NC_004431大肠杆菌CFT073,完全基因组gi|26245917|ref|NC_004431.1|[26245917
用于1-丁醇生产的微生物宿主
用于1-丁醇生产的微生物宿主可以选自细菌、蓝细菌、丝状真菌和酵母。用于1-丁醇生产的微生物宿主优选对1-丁醇是耐受的,从而使得得率不受丁醇毒性限制。在1-丁醇高效价水平上有代谢活性的微生物不是本领域众所周知的。尽管丁醇耐受突变体已从产溶剂菌(solventogenic)梭菌(Clostridia)中分离,但关于其他潜在有用细菌菌株的丁醇耐受性的可用信息很少。关于细菌中的醇耐受性比较的大多数研究暗示丁醇比乙醇更有毒(de Cavalho等人,Microsc.Res.Tech.64:215-22(2004)和Kabelitz等人,FEMS Microbiol.Lett.220:223-227(2003))。Tomas等人(J.Bacteriol.186:2006-2018(2004))报道了丙酮丁醇梭菌发酵期间的丁醇得率可能受丁醇毒性限制。丁醇对丙酮丁醇梭菌的主要作用是膜功能的破坏(Hermann等人,Appl.Environ.Microbiol.50:1238-1243(1985))。
选择用于1-丁醇生产的微生物宿主优选对1-丁醇是耐受的,且能够将碳水化合物转化成1-丁醇。关于合适微生物宿主选择的标准包括下述:对1-丁醇的固有耐受性、高的葡萄糖利用率、用于基因操作的遗传工具的有效性、和产生稳定染色体改变的能力。
对于1-丁醇具有耐受性的合适宿主菌株可以通过基于菌株的固有耐受性的筛选来鉴定。微生物对1-丁醇的固有耐受性可通过下述测量:测定当在极限培养基中生长时负责50%生长速率抑制的1-丁醇浓度(IC50)。IC50值可以使用本领域已知的方法来测定。例如,目的微生物可以在各种量的1-丁醇的存在下生长,且通过测量600纳米处的光密度来监控生长速率。倍增时间可以由生长曲线的对数部分来计算,且用作生长速率的测量。产生50%生长抑制的1-丁醇浓度可以从百分比生长抑制对1-丁醇浓度的图来测定。优选地,宿主菌株对于1-丁醇应当具有大于约0.5%重量/体积的IC50。
用于1-丁醇生产的微生物宿主还应以高比率利用葡萄糖。大多数微生物能够利用碳水化合物。然而,某些环境微生物不能利用碳水化合物至高效率,且因此将不是合适的宿主。
基因修饰宿主的能力是任何重组微生物生产所必需的。基因转移技术的方式可以是电穿孔、接合、转导或天然转化。广泛范围的宿主接合质粒和药物抗性标记是可用的。基于可以在那种宿主中起作用的抗生素抗性标记的性质使克隆载体适合于宿主生物。
微生物宿主还必须通过缺失各种基因进行处理,以灭活关于碳流的竞争途径。这要求指导灭活的转座子或染色体整合载体的有效性。此外,生产宿主应当顺应化学诱变,从而使得可以获得改善固有1-丁醇耐受性的突变。
基于上述标准,用于生产1-丁醇的合适微生物宿主包括但不限于,梭菌属(Clostridium)、发酵单胞菌属(Zymomonas)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、肠球菌属(Enterococcus)、产碱菌属(Alcaligenes)、克雷伯氏菌属(Klebsiella)、类芽孢杆菌属(Paenibacillus)、节杆菌属(Arthrobacter)、棒杆菌属(Corynebacterium)、短杆菌属(Brevibacterium)、毕赤氏酵母属(Pichia)、假丝酵母属(Candida)、汉逊氏酵母属(Hansenula)和糖酵母属(Saccharomyces)的成员。优选宿主包括:大肠杆菌、真养产碱菌、地衣芽孢杆菌(Bacilluslicheniformis)、浸麻类芽孢杆菌(Paenibacillus macerans)、红串红球菌(Rhodococcus erythropolis)、恶臭假单胞菌、植物乳杆菌(Lactobacillus plantarum)、屎肠球菌(Enterococcus faecium)、鹑鸡肠球菌(Enterococcus gallinarium)、粪肠球菌(Enterococcus faecalis)、枯草芽孢杆菌和啤酒糖酵母。
生产宿主的构建
包含必需基因的重组生物可以使用本领域众所周知的技术进行构建,所述必需基因将编码使可发酵的碳底物转化成1-丁醇的酶促途径。在本发明中,编码1-丁醇生物合成途径酶的基因可以如上所述从各种来源分离,所述酶即乙酰辅酶A乙酰转移酶、3-羟丁酰辅酶A脱氢酶、巴豆酸酶、丁酰辅酶A脱氢酶、丁醛脱氢酶、和丁醇脱氢酶。
从细菌基因组获得所需基因的方法是分子生物学领域常见和众所周知的。例如,如果基因序列是已知的,那么合适的基因组文库可以通过限制性内切核酸酶消化来制备,且可以用与所需基因序列互补的探针来筛选。一旦序列分离,DNA就可以使用标准引物指导的扩增方法例如聚合酶链反应(Mullis,美国专利号4,683,202)进行扩增,以获得适合于使用合适载体转化的DNA量。对于在异源宿主中表达的密码子最优化的工具是容易获得的。用于密码子最优化的一些工具基于宿主生物的GC含量是可用的。某些示例性微生物宿主的GC含量在表3中给出。
                  表3
            微生物宿主的GC含量
  菌株   %GC
  地衣芽孢杆菌   46
  枯草芽孢杆菌   42
  丙酮丁醇梭菌   37
  大肠杆菌   50
  恶臭假单胞菌   61
  真养产碱菌   61
  浸麻类芽孢杆菌   51
  红串红球菌   62
  短芽孢杆菌(Brevibacillus)   50
  多粘类芽孢杆菌(Paenibacillus polymyxa)   50
一旦相关途径基因被鉴定和分离,它们就可以通过本领域众所周知的方法转化到合适的表达宿主内。对于多种宿主细胞转化有用的载体或盒是常见的,且从公司例如EPICENTRE(Madison,WI),Invitrogen Corp.(Carlsbad,CA),Stratagene(La JoIIa,CA),和New England Biolabs,Inc.(Beverly,MA)商购可得。一般地,载体或盒包含指导相关基因转录和翻译的序列、选择标记、和允许自主复制或染色体整合的序列。合适的载体包含具有转录起始控制的基因5′区域,和控制转录终止的DNA片段3′区域。2个控制区都可以来源于与转化的宿主细胞同源的基因,尽管应当理解此类控制区也可以来源于对于选择作为生产宿主的特定物种非天然的基因。
用于驱动相关途径编码区在所需宿主细胞中表达的起始控制区或启动子是众多的,且是本领域技术人员熟悉的。事实上能够驱动这些遗传元件的任何启动子都适合于本发明,包括但不限于,Cyc1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI、CUP1、FBA、GPD、和GPM(对于在糖酵母菌属中表达有用);AOX1(对于在毕赤氏酵母属中表达有用);和lac、ara、tet、trp、IPL、IPR、T7、tac,和trc(对于在大肠杆菌、产碱菌属和假单胞菌属中表达有用);amy、apr、npr启动子和对于在枯草芽孢杆菌、地衣芽孢杆菌和浸麻类芽孢杆菌中表达有用的各种噬菌体启动子;nisA(对于在革兰氏阳性细菌中表达有用,Eichenbaum等人Appl.Environ.Microbiol.64(8):2763-2769(1998));和合成P11启动子(对于在植物乳杆菌中表达有用,Rud等人,Microbiology 152:1011-1019(2006))。
终止控制区也可以来源于对优选宿主天然的各种基因。任选地,终止位点可能是不必要的,然而,如果包括,那么它是最优选的。
某些载体能够在广泛范围的宿主细菌中复制且可以通过接合进行转移。pRK404的完整和注解的序列以及3种相关载体-pRK437、pRK442和pRK442(H)是可用的。这些衍生物已被证明是用于在革兰氏阴性细菌中基因操作的有价值的工具(Scott等人,Plasmid 50(1):74-79(2003))。广宿主范围lnc P4质粒RSF1010的几种质粒衍生物与可以在一系列革兰氏阴性细菌中起作用的启动子也是可用的。质粒pAYC36和pAYC37具有活性启动子连同多克隆位点,以允许异源基因在革兰氏阴性细菌中表达。
染色体基因替代工具也是广泛可用的。例如,广宿主范围复制子pWV101的热敏变体已进行修饰以构建质粒pVE6002,所述质粒pVE6002可以用于在一系列革兰氏阳性细菌中产生基因替代(Maguin等人,J.Bacteriol.174(17):5633-5638(1992))。此外,体外transposomes可用于在来自商业来源例如EPICENTRE的多种基因组中产生随机突变。
1-丁醇生物合成途径在各种优选微生物宿主中的表达在下文更详细地描述。
1-丁醇生物合成途径在大肠杆菌中的表达
对于大肠杆菌转化有用的载体或盒是常见的且从上文列出的公司商购可得。例如,如实施例11中所示,1-丁醇生物合成途径的基因可以从各种梭菌菌株中分离、克隆到修饰的pUC19载体内,且转化到大肠杆菌NM522内。1-丁醇生物合成途径在几种其他大肠杆菌菌株中的表达在实施例13中描述。
1-丁醇生物合成途径在红串红球菌中的表达
一系列大肠杆菌-红球菌属穿梭载体可用于在红串红球菌中表达,包括但不限于pRhBR17和pDA71(Kostichka等人,Appl.Microbiol.Biotechnol 62:61-68(2003))。此外,一系列启动子可用于在红串红球菌中的异源基因表达(参见例如Nakashima等人,Appl.Envir.Microbiol.70:5557-5568(2004),和Tao等人,Appl.Microbiol.Biotechnol.2005,DOI 10.1007/s00253-005-0064)。红串红球菌中染色体基因的靶向的基因破坏可以使用由Tao等人,同上和Brans等人(Appl.Envir Microbiol.66:2029-2036(2000))描述的方法来制备。
如上所述1-丁醇生产所需的异源基因可以最初克隆到pDA71或pRhBR71中且转化到大肠杆菌内。载体随后可以如Kostichka等人,同上所述通过电穿孔转化到红串红球菌内。重组体可以在包含葡萄糖的合成培养基中生长,且1-丁醇的生产可以使用本领域已知方法来跟踪。
1-丁醇生物合成途径在枯草芽孢杆菌中的表达
关于在枯草芽孢杆菌中基因表达和生成突变的方法也是本领域众所周知的。例如,如实施例12中所述,1-丁醇生物合成途径的基因可以从各种梭菌菌株中分离、克隆到修饰的pUC19载体内,且转化到枯草芽孢杆菌BE1010内。此外,如实施例14中所述,1-生物合成途径的6种基因可以分成2个操纵子用于表达。将该途径的前3种基因(thl、hbd和crt)整合到枯草芽孢杆菌BE1010染色体内(Payne和Jackson,J.Bacteriol.173:2278-2282(1991))。将后3种基因(EgTER、ald和bdhB)克隆到表达质粒内,且转化到携带整合的1-丁醇基因的芽孢杆菌菌株内。
1-丁醇生物合成途径在地衣芽胞杆菌中的表达
在枯草芽孢杆菌中复制的大多数质粒和穿梭载体可以用于通过原生质体转化或电穿孔转化地衣芽孢杆菌。例如,1-丁醇生产所需的基因可以克隆到质粒pBE20或pBE60衍生物内(Nagarajan等人,Gene 114:121-126(1992))。转化地衣芽孢杆菌的方法是本领域已知的(例如参见Fleming等人Appl.Environ.Microbiol.,61(11):3775-3780(1995))。构建用于在枯草芽孢杆菌中表达的质粒也可以转化到地衣芽孢杆菌内,以产生生产1-丁醇的重组微生物宿主。
1-丁醇生物合成途径在浸麻类芽胞杆菌中的表达
质粒可以如上文关于在枯草芽孢杆菌中表达所述进行构建,且通过原生质体转化用于转化浸麻类芽孢杆菌,以产生生产生产1-丁醇的重组微生物宿主。
1-丁醇生物合成途径在真养产碱菌(富养罗尔斯通氏菌)中的表达
关于在富养罗尔斯通氏菌中基因表达和生成突变的方法是本领域已知的(参见例如,Taghavi等人,Appl.Environ.Microbiol.,60(10):3585-3591(1994))。关于1-丁醇生物合成途径的基因可以克隆到上文所述的任何广宿主范围载体中,且进行电穿孔以产生生产1-丁醇的重组体。罗尔斯通氏菌属(Ralstonia)中的多羟基丁酸盐途径已得到详细描述,且修饰富养罗尔斯通氏菌基因组的多种遗传技术是已知的,且那些工具可应用于工程改造1-丁醇生物合成途径。
1-丁醇生物合成途径在恶臭假单胞菌中的表达
关于在恶臭假单胞菌中基因表达的方法是本领域已知的(参见例如Ben-Bassat等人,美国专利号6,586,229,所述专利引入本文作为参考)。例如,丁醇途径基因可以插入到pPCU18内,且这种连接的DNA可以电穿孔到电转化感受态的恶臭假单胞菌DOT-T1 C5aAR1细胞内,以产生生产1-丁醇的重组体。
1-丁醇生物合成途径在啤酒糖酵母中的表达
关于在啤酒糖酵母中基因表达的方法是本领域已知的(参见例如Methods in Enzymology,第194卷,Guide to Yeast Genetics andMolecular and Cell Biology(Part A,2004,Christine Guthrie和Gerald R.Fink(Eds.),Elsevier Academic Press,San Diego,CA)。基因在酵母中的表达一般需要启动子、随后为目的基因、和转录终止子。许多酵母启动子可以用于构建关于编码1-丁醇生物合成途径的基因的表达盒,包括但不限于,组成型启动子FBA、GPD和GPM,以及诱导型启动子GAL1、GAL10和CUP1。合适的转录终止子包括但不限于,FBAt、GPDt、GPMt、ERG10t和GAL1t。如实施例17中所述,合适的启动子、转录终止子和1-丁醇生物合成途径的基因可以克隆到酵母2微米(2μ)质粒内。
1-丁醇生物合成途径在植物乳杆菌中的表达
乳杆菌属属于乳杆菌目(Lactobacillales)科,且在枯草芽孢杆菌和链球菌属(Streptococcus)转化中使用的许多质粒和载体可以用于乳杆菌属。合适载体的非限制性例子包括pAMβ1及其衍生物(Renault等人,Gene 183:175-182(1996);和O′Sullivan等人,Gene 137:227-231(1993));pMBB1和pMBB1的衍生物pHW800(Wyckoff等人Appl.Environ.Microbiol.62:1481-1486(1996));接合质粒pMG1(Tanimoto等人,J.Bacteriol.184:5800-5804(2002));pNZ9520(Kleerebezem等人,Appl.Environ.Microbiol.63:4581-4584(1997));pAM401(Fujimoto等人,Appl.Environ.Microbiol.67:1262-1267(2001));和pAT392(Arthur等人,Antimicrob.Agents Chemother.38:1899-1903(1994))。来自植物乳杆菌的几种质粒已得到报道(例如,vanKranenburg R,Golic N,Bongers R,Leer RJ,de Vos WM,Siezen RJ,Kleerebezem M.Appl.Environ.Microbiol.2005Mar;71(3):1223-1230)。例如,1-丁醇生物合成途径在植物乳杆菌中的表达在实施例18中描述。
1-丁醇生物合成途径在屎肠球菌、鹑鸡肠球菌和粪肠球菌中的表达
肠球菌属属于乳杆菌目科,且在乳杆菌属、枯草芽孢杆菌和链球菌属转化中使用的许多质粒和载体可以用于肠球菌属。合适载体的非限制性例子包括pAMβ1及其衍生物(Renault等人,Gene 183:175-182(1996);和O′Sullivan等人,Gene 137:227-231(1993));pMBB1和pMBB1的衍生物pHW800(Wyckoff等人Appl.Environ.Microbiol.62:1481-1486(1996));接合质粒pMG1(Tanimoto等人,J.Bacteriol.184:5800-5804(2002));pNZ9520(Kleerebezem等人,Appl.Environ.Microbiol.63:4581-4584(1997));pAM401(Fujimoto等人,Appl.Environ.Microbiol.67:1262-1267(2001));和pAT392(Arthur等人,Antimicrob.Agents Chemother.38:1899-1903(1994))。使用来自乳球菌属(Lactococcus)的nisA基因的粪肠球菌的表达载体也可以使用(Eichenbaum等人,Appl.Environ.Microbiol.64:2763-2769(1998)。此外,用于在屎肠球菌染色体中基因替代的载体可以使用(Nallaapareddy等人,Appl.Environ.Microbiol.72:334-345(2006))。例如,1-丁醇生物合成途径在粪肠球菌中的表达在实施例19中描述。
发酵培养基
本发明中的发酵培养基必须包含合适的碳底物。合适的底物可以包括但不限于,单糖例如葡萄糖和果糖、寡糖例如乳糖或蔗糖、多糖例如淀粉或纤维素或其混合物,和来自可再生原料的未纯化混合物,例如干酪乳清渗透物、玉米浆、蔗糖蜜、和大麦芽。此外碳底物也可以是已证实代谢转化为关键生物化学中间物的单碳底物,例如二氧化碳、或甲醇。除了单和二碳底物,也已知甲基营养生物利用许多其他含碳化合物,例如甲胺、葡萄胺和多种氨基酸用于代谢活性。例如,已知甲基营养酵母利用来自甲胺的碳以形成海藻糖或丙三醇(Bellion等人,Microb.Growth C1 Compd.,[Int.Symp.],7th(1993),415-32.Editor(s):Murrell,J.Collin;Kelly,Don P.Publisher:Intercept,Andover,UK)。类似地,各种假丝酵母属(Candida)物种将代谢丙氨酸或油酸(Sulter等人,Arch.Microbiol.153:485-489(1990))。因此预期本发明中利用的碳源可以包含广泛多样的含碳底物,且将只受宿主选择限制。
尽管预期所有上文提及的碳底物及其混合物都适合于本发明,但优选碳底物是葡萄糖、果糖和蔗糖。
除了合适的碳源,发酵培养基必须包含本领域技术人员已知的,适合于培养物生长和促进1-丁醇生产所需酶促途径的合适矿物质、盐、辅因子、缓冲液及其他组分。
培养条件
细胞一般在约25℃-约40℃温度下在合适培养基中生长。本发明中合适的生长培养基是常见的商业制备培养基,例如Luria Bertani(LB)液体培养基、沙氏葡萄糖(Sabouraud Dextrose)(SD)液体培养基或酵母培养基(YM)液体培养基。其他确定成分或合成生长培养基也可以使用,并且关于特定微生物生长的合适培养基将是微生物学或发酵科学领域技术人员已知的。已知直接或间接调节分解代谢物阻抑的试剂的使用,例如环状腺苷2′:3′-一磷酸也可以掺入发酵培养基内。
用于发酵的合适pH范围为pH 5.0-pH 9.0,其中pH 6.0-pH 8.0作为初始条件是优选的。
发酵可以在需氧或厌氧条件下进行,其中厌氧或微需氧条件是优选的。
在发酵培养基中生产的1-丁醇量可以使用本领域已知的许多方法来测定,例如,高效液相层析(HPLC)或气相层析(GC)。
工业分批和连续发酵
本方法使用分批发酵法。传统分批发酵是其中培养基组成在发酵开始时设定,且在发酵期间不实施人工改变的封闭系统。因此,在发酵开始时,用所需一种或多种生物接种培养基,且允许发酵发生而不向系统中添加任何东西。然而,一般地“分批”发酵是就碳源添加而言的分批,且通常在控制因素例如pH和氧浓度方面进行尝试。在分批系统中,系统的代谢物和生物量组成不断改变直至发酵停止时。在分批培养中,细胞适度(moderate)通过静态滞后期至高生长对数期,且最后至其中生长速率减小或停止的稳定期。如果未处理,那么稳定期的细胞将最终死亡。对数期的细胞一般负责终产物或中间物的大量生产。
关于标准分批系统的变化是补料分批系统(Fed-Batch system)。补料分批发酵方法也适合于本发明,且除了底物随发酵进展以增量添加之外,包含一般的分批系统。当分解代谢物阻抑倾向于抑制细胞代谢且希望在培养基中具有有限量的底物时,补料分批系统是有用的。补料分批系统中的实际底物浓度测量是困难的,且因此基于可测量因素例如pH、溶解氧和废气例如CO2的分压变化来估计。分批和补料分批发酵是本领域常见和众所周知的,并且例子可以在下述参考文献中找到:Thomas D.Brock in Biotechnology:A Textbook of IndustrialMicrobiology,第2版(1989)Sinauer Associates,Inc.,Sunderland,MA.,或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36:227,(1992),所述参考文献引入本文作为参考。
尽管本发明以分批模式来进行,但预期该方法将适应于连续发酵法。连续发酵是其中向生物反应器中连续添加确定成分发酵培养基,且同时取出等量条件培养基用于加工的开放系统。连续发酵一般使培养物维持在恒定高密度,其中细胞主要处于对数生长期。
连续发酵允许调节影响细胞生长或终产物浓度的一种因素或许多因素。例如,一种方法将使限制营养物例如碳源或氮水平维持在固定比率,且允许所有其他参数保持适度。在其他系统中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持恒定。连续系统努力维持稳定状态生长条件,且因此由于培养基排出的细胞丧失必须针对发酵中的细胞生长速率进行平衡。对于连续发酵方法调节营养物和生长因子的方法以及使产物发酵速率达到最大的技术是工业微生物学领域众所周知的,且各种方法由Brock同上详细描述。
预期本发明可以使用分批、补料分批或连续方法进行实践,且任何已知发酵模式都将是合适的。此外,预期细胞可以作为全细胞催化剂固定化在底物上,且实施用于1-丁醇生产的发酵条件。
从发酵培养基分离1-丁醇的方法
生物生产的1-丁醇可以使用本领域已知方法从发酵培养基进行分离。例如,固体可以通过离心、过滤、倾析等从发酵培养基中取出。随后,1-丁醇可以使用例如蒸馏、液液提取、或基于膜的分离的方法从发酵培养基分离,所述发酵培养基已如上所述进行处理以取出固体。因为1-丁醇与水形成低沸点、共沸混合物,所以蒸馏只能用于使混合物分离直至其共沸组成。蒸馏可以与另一种分离方法组合使用,以获得大约在共沸混合物的分离。可以与蒸馏组合使用以分离和纯化1-丁醇的方法包括但不限于,倾析、液液提取、吸附、和基于膜的技术。此外,1-丁醇可以使用共沸蒸馏使用共沸剂进行分离(参见例如Doherty和Malone,Conceptual Design of Distillation Systems,McGraw Hill,New York,2001)。
1-丁醇-水混合物形成不均态共沸混合物,从而使得蒸馏可以与倾析组合使用以分离和纯化1-丁醇。在这种方法中,将包含1-丁醇的发酵液体培养基蒸馏至接近共沸组成。随后,将共沸混合物浓缩,且通过倾析使1-丁醇与发酵培养基分开。倾析的水相可以作为回流送回第一个蒸馏柱。富含1-丁醇的倾析的有机相可以通过在第二个蒸馏柱中蒸馏进一步得到纯化。
1-丁醇还可以使用液液提取与蒸馏组合从发酵培养基中分离。在这种方法中,1-丁醇使用液液提取用合适的溶剂从发酵液体培养基中提取。含1-丁醇的有机相随后进行蒸馏以使1-丁醇与溶剂分开。
蒸馏与吸附组合也可以用于从发酵培养基分离1-丁醇。在这种方法中,将包含1-丁醇的发酵液体培养基蒸馏至接近共沸组成,且随后剩余的水通过使用吸附剂例如分子筛去除(Aden等人LignocellulosicBiomass to Ethanol Process Design and Economics Utilizing Co-CurrentDilute Acid Prehydrolysis and Enzymatic Hydrolysis for Corn Stover,Report NREL/TP-510-32438,National Renewable Energy Laboratory,June 2002)。
此外,蒸馏与全蒸发组合可以用于从发酵培养基分离和纯化1-丁醇。在这种方法中,将包含1-丁醇的发酵液体培养基蒸馏至接近共沸组成,且随后剩余的水经由全蒸发通过亲水膜去除(Guo等人,J.Membr.Sci.245,199-210(2004))。
                       实施例
本发明在下述实施例中进一步限定。应当理解这些实施例在指出本发明的优选实施方案的同时,仅作为举例说明而给出。由于上文讨论和这些实施例,本领域技术人员可以确定本发明的基本特征,并且在不背离其精神和范围的情况下,可以进行本发明的各种变化和修饰以使其适应各种用途和条件。
一般方法
实施例中使用的标准重组DNA和分子克隆技术是本领域众所周知的,且由下述参考文献描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual;Cold Spring HarborLaboratory Press:Cold Spring Harbor,(1989)(Maniatis),T.J.Silhavy,M.L.Bennan和L.W.Enquist,Experiments with Gene Fusions,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1984),和Ausubel,F.M.等人,Current Protocols in Molecular Biology,由GreenePublishing Assoc and Wiley-lnterscience出版(1987)。
适合于细菌培养物维持和生长的材料和方法是本领域众所周知的。适合于在下述实施例中使用的技术可以如下述参考文献中所述找到:Manual of Methods for General Bacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,NoelR.Krieg和G.Briggs Phillips,eds),American Society for Microbiology,Washington,DC.(1994))或Thomas D.Brock in Biotechnology:ATextbook of Industrial Microbiology,第2版,Sinauer Associates,Inc.,Sunderland,MA(1989)。除非另有说明,用于细菌细胞生长和维持的所有试剂、限制酶和材料都得自Aldrich Chemicals(Milwaukee,Wl)、BD Diagnostic Systems(Sparks,MD)、Life Technologies(Rockville,MD)、或Sigma Chemical Company(St.Louis,MO)。
在下述实施例中用于克隆的寡核苷酸引物在表4中给出。用于测序或筛选克隆的基因的引物在表5中给出。所有寡核苷酸引物都由Sigma-Genosys(Woodlands,TX)合成。
                      表4
                寡核苷酸克隆引物
  基因   引物名称   序列   SEQ IDNO:   描述
  crt   N3   CACCATGGAACTAAACAATGTCATCCTTG   17   crt正向
  crt   N4   CCTCCTATCTATTTTTGAAGCCTTC   18   crt反向
  hbd   N5   CACCATGAAAAAGGTATGTGTTATAGGT   19   hbd正向
  hbd   N6   CATTTGATAATGGGGATTCTTGT   20   hbd反向
  thlA   N7   CACCATGAAAGAAGTTGTAATAGCTAGTGC   21   thlA正向
  thlA   N8   CTAGCACTTTTCTAGCAATATTGCTG   22   thlA反向
  bdhA   N9   CACCATGCTAAGTTTTGATTATTCAATAC   23   bdhA正向
  bdhA   N10   TTAATAAGATTTTTTAAATATCTCA   24   bdhA反向
  bdhB   N11   CACCATGGTTGATTTCGAATATTCAATACC   25   bdhB正向
  bdhB   N12   TTACACAGATTTTTTGAATATTTGT   26   bdhB反向
  thlB   N15   CACCATGAGAGATGTAGTAATAGTAAGTGCTG   27   thlB正向
  thlB   N16   CCGCAATTGTATCCATATTGAACC   28   thlB反向
  CAC0462   N17   CACCATGATAGTAAAAGCAAAGTTTG   29   CAC0462正向
  CAC0462   N21   GCTTAAAGCTTAAAACCGCTTCTGGCG   30   CAC0462反向
  ald   N27F1   CACCATGAATAAAGACACACTAATACC   31   ald正向
  ald   N28R1   GCCAGACCATCTTTGAAAATGCGC   32   ald反向
  thlA   N44   CATGCATGCAAAGGAGGTTAGTAGAATGAAAGAAG   33   thlA正向
  thlA   N45   GTCCTGCAGGGCGCGCCCAATACTTTCTAGCACTTTTC   34   thlA反向
  hbd   N42   CATGTCGACAAAGGAGGTCTGTTTAATGAAAAAGGTATG   35   hbd正向
  hbd   N43   GTCGCATGCCTTGTAAACTTATTTTGAA   36   hbd反向
  CAC0462   N68   CATAGATCTGGATCCAAAGGAGGGTGAGGAAATGATAGTAAAAG   37   CAC0462正向
  CAC0462   N69   CATGTCGACGTGCAGCCTTTTTAAGGTTCT   38   CAC0462反向
  crt   N38   CATGAATTCACGCGTAAAGGAGGTATTAGTCATGGAAC   39   crt正向
  crt   N39   GTCGGATCCCTTACCTCCTATCTATTTTTG   40   crt反向
  ald   N58   CATGCCCGGGGGTCACCAAAGGAGGAATAGTTCATGAATAAA   41   ald正向
  ald   N59   CATGGTTAACAAGAAGTTAGCCGGCAAGTACA   42   ald反向
  bdhB   N64   CATGGTTAACAAAGGAGGGGTTAAAATGGTTGATTTCGAAT   43   bdhB正向
  bdhB   N65   CATGGCATGCGTTTAAACGTAGGTTTACACAGATTTT   44   bdhB反向
  --   BenF   ACTTTCTTTCGCCTGTTTCAC   73   --
  --   BenMAR   CATGAAGCTTGGCGCGCCGGGACGCGTTTTTGAAAATAATGAAAACT   74   --
  --   BenBPR   CATGAAGCTTGTTTAAACTCGGTGACCTTGAAAATAATGAAAACTTATATTGTTTTGAAAATAATGAAAACTTATATTG   75   --
  EgTER(opt)   N85   CATAGATCTGGATCCAAAGGAGGGTGAGGAAATGGCGATGTTTACG   80   Egter正向
  EgTER(opt)   N86   GTCGACTTACTGCTGGGCGG   81   Egter反向
  Ptrc-ald(opt)   T-Ptrc(BspEI)   TTCCGTACTTCCGGACGACTGCACGGTGCACCAATGCTTCTG   87   Ptrc正向
  Ptrc-ald(opt)   B-aldopt(Scal)   CGGATCTTAAGTACTTTAACCCGCCAGCACACAGCGGCGCTGG   88   ald反向
  ald   AFBamHI   CATTGGATCCATGAATAAAGACACACTAATACCTACAAC   93   ald正向
  ald   AR Aat2   CATGACGTCACTAGTGTTAACAAGAAGTTAGCCGGCAAG   94   ald反向
  EgTER   正向1(E)   CATGTTAACAAAGGAGGAAAGATCTATGGCGATGTTTACGACCACCGCAA   95   EgTERSOE正向
  EgTER   底部反向1(E)   CCCCTCCTTTGGCGCGCCTTACTGCTGGGCGGCGCTCGGCAGA   96   EgTER SOE反向
  bdh   顶部正向2(B)   GCCCAGCAGTAAGGCGCGCCAAAGGAGGGGTTAAAATGGTTGATTTCGAAT   97   bdh SOE正向
  bdh   反向2(B)   GTCGACGTCATACTAGTTTACACAGATTTTTTGAATATTTGT   98   bdh SOE反向
  ---   Pamy/lacO F   CATTGTACAGAATTCGAGCTCTCGAGGCCCCGCACATACGAAAAGAC   99   Pamy正向
  ---   Pamy/lacO R   CATTGTACAGTTTAAACATAGGTCACCCTCATTTTCGTAGGAATTGTTATCC   100   Pamy反向
  ---   Spac F   CATCTCGAGTAATTCTACACAGCCCAGTCC   101   Pspac正向
  ---   Spac R   CATGTTTAAACGGTGACCCAAGCTGGGGATCCGCGG   102   Pspac反向
  thl   Top TF   GATTGGTCACCATTCCCGGGCATGCAAAGGAGGTTAGTAGAATG   103   thl SOE正向
  thl   Bot TR   CCTTTACGCGACCGGTACTAGTCAAGTCGACAGGGCGCGCCCAATACTTTC   104   thl SOE反向
  crt   Top CF   CGCGCCCTGTCGACTTGACTAGTACCGGTCGCGTAAAGGAGGTATTAGTCATGGAAC   105   crt SOE正向
  crt   Bot CR   CATCGTTTAAACTTGGATCCAGATCCCTTACCTCCTAT   106   crt SOE反向
  ERG10-ERG10t   OT731   AAAGCTGGAGCTCCACCGCGGTGGCGGCCGCTCTAGAAGTTTTCAAAGCAGAGTTTCGTTTGAATATTTTACCA   164   ERG10-ERG10t正向
  ERG10-ERG10t   OT732   TTCAATATGCATGCCTCAGAACGTTTACATTGTATCGACTGCCAGAACCC   165   ERG10-ERG10t反向
  GAL1-GAL10   OT733   GCAGTCGATACAATGTAAACGTTCTGAGGCATGCATATTGAATTTTCAAAAATTCTTACTTTTTTTTTGGATGGACGCA   166   GAL1-GAL10正向
  GAL1-GAL10   OT734   ACCTGCACCTATAACACATACCTTTTCCATGGTAGTTTTTTCTCCTTGACGTTAAAGTATAGAGGTATATTA   167   GAL1-GAL10反向
  hbd   OT735   AAAAACTACCATGGAAAAGGTATGTGTTATAGGTGCAGGTACTATGGGTTCAGGAATTGC   168   hbd正向
  hbd   OT736   GTAAAAAAAAGAAGGCCGTATAGGCCTTATTTTGAATAATCGTAGAAACCTTTTCCTGATTTTCTTCCAAG   169   hbd反向
  GAL1t   OT737   ACGATTATTCAAAATAAGGCCTATACGGCCTTCTTTTTTTTACTTTGTTCAGAACAACTTCTCATTTTTTTCTACTCATAA   170   GAL1t正向
  GAL1t   OT738   GAATTGGGTACCGGGCCCCCCCTCGAGGTCGACCGATGCCTCATAAACTTCGGTAGTTATATTACTCTGAGAT   171   GAL1t反向
  thlA   OT797   AAAGTAAGAATTTTTGAAAATTCAATATGCATGCAAGAAGTTGTAATAGCTAGTGCAGTAAGAAC   172   thlA正向
  thlA   OT798   GAAAAAGATCATGAGAAAATCGCAGAACGTAAGGCGCGCCTCAGCACTTTTCTAGCAATATTGCTGTTCCTTG   173   thlA反向
  CUP1   OT806   CTCGAAAATAGGGCGCGCCCCCATTACCGACATTTGGGCGC   174   CUP1正向
  CUP1   OT807   ACTGCACTAGCTATTACAACTTCTTGCATGCGTGATGATTGATTGATTGATTGTA   175   CUP1反向
  GPD启动子   OT808   TCGGTAATGGGGGCGCGCCCTATTTTCGAGGACCTTGTCACCTTGA   176   GPD启动子正向
  GPD启动子   OT809   TTTCGAATAAACACACATAAACAAACACCCCATGGAAAAGGTATGTGTTATAGGTGCAGG   177   GPD启动子反向
  FBA1启动子   OT799   TACCGGGCCCCCCCTCGAGGTCGACGGCGCGCCACTGGTAGAGAGCGACTTTGTATGCCCCA   178   FBA1启动子正向
  FBA1启动子   OT761   CTTGGCCTTCACTAGCATGCTGAATATGTATTACTTGGTTATGGTTATATATGACAAAAG   179   FBA1启动子反向
  GPM1启动子   OT803   CCCTCACTAAAGGGAACAAAAGCTGGAGCTCGATATCGGCGCGCCCACATGCAGTGATGCACGCGCGA   180   GPM1启动子正向
  GPM1启动子   OT804   AAGGATGACATTGTTTAGTTCCATGGTTGTAATATGTGTGTTTGTTTGG   181   GPM1启动子反向
  crt   OT785   CACACATATTACAACCATGGAACTAAACAATGTCATCCTTGAAAAGGAAGG   182   Crt正向
  crt   OT786   ATCATTCATTGGCCATTCAGGCCTTATCTATTTTTGAAGCCTTCAATTTTTCTTTTCTCTATG   183   Crt反向
  GPM1t终止子   OT787   CAAAAATAGATAAGGCCTGAATGGCCAATGAATGATTTGATGATTTCTTTTTCCCTCCATTTTTC   184   GPM1t终止子正向
  GPM1t终止子   OT805   GAATTGGGTACCGGGCCCCCCCTCGAGGTCGACTTATAGTATTATATTTTCTGATTTGGTTATAGCAAGCAGCGTTT   185   GPM1t终止子反向
  GPD启动子   OT800   GGGAACAAAAGCTGGAGCTCCACCGCGGTGGGGCGC   190   GPD启动子
  GCCCTATTTTCGAGGACCTTGTCACCTTGAGCC   正向
  GPD启动子   OT758   TTAAGGTATCTTTATCCATGGTGTTTGTTTATGTGTGTTTATTCGAAACT   191   GPD启动子反向
  GPD终止子   OT754   TTGGGTACCGGGCCCCCCCTCGAGGTCGACTGGCCATTAATCTTTCCCATAT   192   GPD终止子正向
  GPD终止子   OT755   TGTGTCCTAGCAGGTTAGGGCCTGCAGGGCCGTGAATTTACTTTAAATCTTG   193   GPD终止子反向
  FBA1启动子   OT760   CGAAAATAGGGCGCGCCACTGGTAGAGAGCGACTTTGTATGCCCCAATTG   194   FBA1启动子正向
  FBA1启动子   OT792   CCCTTGACGAACTTGGCCTTCACTAGCATGCTGAATATGTATTACTTGGTTATGGTTATATATGACAAAAG   195   FBA1启动子反向
  FBA1终止子   OT791   CCCTTGACGAACTTGGCCTTCACTAGCATGCTGAATATGTATTACTTGGTTATGGTTATATATGACAAAAG   196   FBA1终止子正向
  FBA1终止子   OT765   GGAACAAAAGCTGGAGCTCCACCGCGGTGGTTTAACGTATAGACTTCTAATATATTTCTCCATACTTGGTATT   197   FBA1终止子反向
  ldhL   LDHEcoRVF   GACGTCATGACCACCCGCCGATCCCTTTT   198   ldhL正向
  ldhL   LDHAatllR   GATATCCAACACCAGCGACCGACGTATTAC   199   ldhL反向
  Cm   Cm F   ATTTAAATCTCGAGTAGAGGATCCCAACAAACGAAAATTGGATAAAG   200   Cm正向
  Cm   Cm R   ACGCGTTATTATAAAAGCCAGTCATTAGG   201   Cm反向
  P11   P11 F   TCGAGAGCGCTATAGTTGTTGACAGAATGGACATACTATGATATATTGTTGCTATAG   202   P11启动子正向
  CGCCC
  P11   P11 R   GGGCGCTATAGCAACAATATATCATAGTATGTCCATTCTGTCAACAACTATAGCGCTC   203   P11启动子反向
  PldhL   PldhL F   GAGCTCGTCGACAAACCAACATTATGACGTGTCTGGGC   204   ldhL启动子正向
  PldhL   PldhL R   GGATCCTACCATGTTTGTGCAAAATAAGTG   205   ldhL启动子反向
  PnlsA   F-PnisA(EcoRV)   TTCAGTGATATCGACATACTTGAATGACCTAGTC   206   PnisA正向
  PnlsA   R-PnisA(PmelBamHI)   TTGATTAGTTTAAACTGTAGGATCCTTTGAGTGCCTCCTTATAATTTA   207   PnisA反向
                            表5
                      测序和PCR筛选引物
  名称   序列   基因特异性   SEQ IDNO:
M13正向 GTAAAACGACGGCCAGT   topO载体   45
M13反向 AACAGCTATGACCATG   topO载体   46
  N7SeqF1   GCAGGAGATGCTGACGTAATAA   thlA   47
  N7SeqR1   CCAACCTGCTTTTTCAATAGCTGC   thlA   48
  N15SeqF1   CAGAGATGGGGTCAAAGAATG   thlB   49
  N16SeqR1   GTGGTTTTTATTCCGAGAGCG   thlB   50
  N5SeqF2   GGTCTATACTTAGAATCTCC   hbd   51
  N6SeqR2   CGGAACAGTTGACCTTAATATGGC   hbd   52
  N22SeqF1   GCCTCATCTGGGTTTGGTCTTG   CAC0426   53
  N22SeqF2   CGCCTAGGAGAAAGGACTATAAAACTGG   CAC0426   54
  N22SeqF3   CAGAGTTATAGGTGGTAGAGCC   CAC0426   55
  N23SeqR1   CCATCCCGCTGTTCCTATTCTTCT   CAC0426   56
  N23SeqR2   CCAATCCTCTCCACCCATTACC   CAC0426   57
  N23SeqR3   CGTCCATCCTTAATCTTCCC   CAC0426   58
  N31SeqF2   CCAACTATGGAATCCCTAGATGC   ald   59
  N31SeqF3   GCATAGTCTGCGAAGTAAATGC   ald   60
  N31SeqF4   GGATCTACTGGTGAAGGCATAACC   ald   61
  N32SeqR1   GTTAGCCGGCAAGTACACATC   ald   72
  N32SeqR2   GGCATCATGAGTTCTGTCATGAC   ald   62
  N32SeqR3   GCCTTCAATGATACTCTTACCAGCC   ald   63
  N32SeqR4   GCATTTCCAGCAGCTATCATGC   ald   64
  N32SeqR5   CCTTCCCATATGTGTTTCTTCC   ald   65
  N11SeqF1   GTTGAAGTAGTACTAGCTATAG   bdhB   66
  N11SeqF2   GACATAACACACGGCGTAGGGC   bdhB   67
  N12SeqR1   TAAGTGTACACTCCAATTAGTG   bdhB   68
  N12SeqR2   GCCATCTAACACAATATCCCATGG   bdhB   69
  N9SeqF1   GCGATACATGGGACATGGTTAAAG   bdhA   70
  N10SeqR1   TGCACTTAACTCGTGTTCCATA   bdhA   71
  T7Primer   TAATACGACTCACTATAGGG   pET23载体   82
  Trc99aF   TTGACAATTAATCATCCGGC   pTrc99a载体   83
  N5SeqF4   GGTCAACTGTTCCGGAAATTC   hbd   84
  T-ald(BamHI)   TGATCTGGATCCAAGAAGGAGCCCTTCACCATGAATAAAGACACAC   ald   85
  B-ald(EgTER)   CATCGCCATTTCCTCACCCTCCTTTTTAGCCGGCAAGTACACATCTTCTTTGTC   ald   86
  N3SeqF1   CCATCATACCATACTGACCC   crt   107
  N3SeqF2   GCTACTGGAGCATTGCTCAC   crt   108
  N3SeqF3   CCATTAACAGCTGCTATTACAGGC   crt   109
  N4SeqR3   GGTCTCGGAATAACACCTGG   crt   110
  N5SeqF3   CAAGCTTCATAACAGGAGCTGG   hbd   111
  N7SeqR2   ATCCCACAATCCGTCAGTGATC   thlA   112
  N31SeqF1   CTGAGATAAGAAAGGCCGCA   ald   113
  N62SeqF2   CAACCCTGGGCGTGTTTCTG   EgTER   114
  N62SeqF3   GTGGCGAAGATTGGGAACTG   EgTER   115
  N62SeqF4   GGGAAATGGCAGAAGATGTTCAGC   EgTER   116
  N63SeqR1   CGGTCTGATAACCTGCAAAATCGC   EgTER   117
  N63SeqR2   CACCAGCGCTTTGGCAACAAC   EgTER   118
  N63SeqR3   GAACGTGCATACAGACCTGCTTC   EgTER   119
  N63SeqR4   CGGCTGAATAACTTTTGCGG   EgTER   120
  Pamy SeqF2   GCGTTTGATGACTGATGATTTGGC   pFP988载体   121
  Pamy SeqF   TCTCCGGTAAACATTACGGCAAAC   pFP988载体   122
  Pamy SeqR   CGGTCAGATGCAATTCGACATGTG   pFP988载体   123
  SpacF Seq   GAAGTGGTCAAGACCTCACT   Pspac启动子   124
  sacB Up   CGGGTTTGTTACTGATAAAGCAGG   sacB   125
  sacB Dn   CGGTTAGCCATTTGCCTGCTTTTA   sacB   126
  HT R   ACAAAGATCTCCATGGACGCGT   pHT01载体   127
  Scr1   CCTTTCTTTGTGAATCGG   csc   160
  Scr2   AGAAACAGGGTGTGATCC   csc   161
  Scr3   AGTGATCATCACCTGTTGCC   csc   162
  Scr4   AGCACGGCGAGAGTCGACGG   csc   163
用于测定培养基中的1-丁醇浓度的方法
培养基中的1-丁醇浓度可以通过本领域已知的许多方法进行测定。例如,具体高效液相层析(HPLC)法使用购自Waters Corporation(Milford,MA)的Shodex SH-1011柱与Shodex SH-G保护柱,其具有折射率(RI)检测。层析分离使用流速为0.5mL/分钟的0.01M H2SO4作为流动相和50℃的柱温来完成。1-丁醇在使用的条件下具有52.8分钟的保留时间。可替代地,气相层析(GC)法是可用的。例如,具体GC法使用HP-INNOWax柱(30m×0.53mm id,1μm膜厚度,AgilentTechnologies,Wilmington,DE),其具有火焰离子化检测器(FID)。载气是流速为4.5mL/分钟的氦,使用恒定排出压力于150℃测量;注射器分流在200℃时为1∶25;烤箱温度为45℃ 1小时,以10℃/分钟45-220℃,和220℃ 5分钟;和于240℃使用FID检测,其具有26mL/分钟氦补充气体。1-丁醇的保留时间为5.4分钟。使用Varian CP-WAX58(FFAP)CB柱(25m×0.25mm id×0.2μm膜厚度,Varian,Inc.,Palo Alto,CA)的类似GC法也可以使用。
缩写含义如下:“s”表示秒,“min”表示分钟,“h”表示小时,“psi”表示磅/平方英寸,“nm”表示纳米,“d”表示天,“μL”表示微升,“mL”表示毫升,“L”表示升,“mm”表示毫米,“nm”表示纳米,“mM”表示毫摩尔浓度(millimolar),“M”表示摩尔浓度(molar),“mmol”表示毫摩尔,“μmole”表示微摩尔,“g”表示克,“μg”表示微克和“ng”表示纳克,“PCR”表示聚合酶链反应,“OD”表示光密度,“OD600”表示在600nm波长处测量的光密度,“OD550”表示在550nm波长处测量的光密度,“kDa”表示千道尔顿,“g”表示重力加速度,“rpm”表示每分钟转数,“bp”表示碱基对,“kbp”表示千碱基对,“%w/v”表示重量/体积百分比,“%v/v”表示体积/体积百分比,“HPLC”表示高效液相层析,且“GC”表示气相层析。
                         实施例1
              乙酰辅酶A乙酰转移酶的克隆和表达
这个实施例的目的是在大肠杆菌中表达乙酰辅酶A乙酰转移酶,在本文中也称为乙酰乙酰辅酶A硫解酶。乙酰乙酰辅酶A硫解酶基因thlA从丙酮丁醇梭菌(ATCC 824)克隆且在大肠杆菌中表达。thlA基因使用PCR从丙酮丁醇梭菌(ATCC 824)基因组DNA扩增,从而导致产生1.2kbp产物。
来自丙酮丁醇梭菌(ATCC 824)的基因组DNA购自美国典型培养物保藏中心(ATCC,Manassas,VA),或如下所述从丙酮丁醇梭菌(ATCC 824)培养物分离。
来自丙酮丁醇梭菌(ATCC 824)的基因组DNA由厌氧生长的培养物制备。梭菌属菌株在塞好和卷曲的100mL Bellco血清瓶(BellcoGlass Inc.,Vineland,NJ)的10mL梭菌生长培养基(Lopez-Contreras等人,Appl.Env.Microbiol.69(2),869-877(2003))中,在厌氧室中于30℃生长。接种物是来自2X YTG板(Kishii,等人,AntimicrobialAgents & Chemotherapy,47(1),77-81(2003))在2.5L MGCAnaeroPakTM(Mitsubishi Gas Chemical America Inc,New York,NY)中于37℃生长的单个菌落。
基因组DNA使用Gentra Puregene试剂盒(Gentra Systems,Inc.,Minneapolis,MN;目录号D-6000A),使用制造商说明书的修改(Wong等人,Current Microbiology,32,349-356(1996))进行制备。thlA基因通过PCR使用引物N7和N8(参见表4)从丙酮丁醇梭菌(ATCC824)基因组DNA进行扩增,所述引物N7和N8分别作为SEQ ID NO:21和22给出。其他PCR扩增试剂在制造商的试剂盒例如Kod HiFi DNAPolymerase(Novagen Inc.,Madison,WI;目录号71805-3)中提供,且根据制造商的规程使用。扩增在DNA Thermocycler GeneAmp 9700(PE Applied Biosystems,Foster city,CA)中进行。
对于表达研究,使用Gateway克隆技术(Invitrogen Corp.,Carlsbad,CA)。进入载体(entry vector)pENTR/SD/D-TOPO允许定向克隆且为目的基因提供SD序列。目的载体pDEST14使用T7启动子用于表达无标签的基因。正向引物掺入紧邻翻译起始密码子的4个碱基(CACC),以允许定向克隆到pENTR/SD/D-TOPO(Invitrogen)内,以产生质粒pENTRSDD-TOPOthlA。将pENTR构建体转化到大肠杆菌Top10(Invitrogen)细胞内,且根据制造商的建议进行铺平板。转化体生长过夜,且使用QIAprep Spin Miniprep试剂盒(Qiagen,Valencia,CA;目录号27106)根据制造商的建议制备质粒DNA。提交克隆用于由M13正向和反向引物(参见表5)测序,所述M13正向和反向引物分别作为SEQ ID NOs:45和46给出,以证实基因以正确方向插入且证实序列。需要另外的测序引物N7SeqF1和N7SeqR1(参见表5)以对PCR产物完全测序,所述N7SeqF1和N7SeqR1分别作为SEQ IDNOs:47和48给出。关于这种基因的可读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别作为SEQ ID NO:1和SEQ ID NO:2给出。
为了生成表达克隆,通过重组将thlA基因转移至pDEST 14载体以产生pDEST14thlA。将pDEST14thlA载体转化到BL21-AI细胞内。将转化体接种到补加了50μg/mL氨苄青霉素的LB培养基内且生长过夜。等分试样的过夜培养物用于接种补加了50μg/mL氨苄青霉素的50mLLB。培养物于37℃伴随振荡温育直至OD600达到0.6-0.8。将培养物分成2个25-mL培养物,且将阿拉伯糖加入瓶之一至0.2重量%的终浓度。阴性对照瓶不用阿拉伯糖诱导。瓶于37℃伴随振荡温育4小时。细胞通过离心进行收获,且将细胞沉淀重悬浮于50mM MOPS,pH 7.0缓冲液中。细胞通过超声处理或通过弗氏压碎器来破坏。将全细胞溶解产物离心,从而产生上清液或无细胞提取物和沉淀或不溶性级分。将等分试样的每种级分(全细胞溶解产物、无细胞提取物和不溶性级分)重悬浮于SDS(MES)加样缓冲液(Invitrogen)中,加热至85℃ 10分钟,且实施SDS-PAGE分析(NuPAGE 4-12% Bis-Tris Gel,目录号NP0322Box,Invitrogen)。如由核酸序列推导的预期分子量约41kDa的蛋白质,存在于诱导的培养物中但不存在于未诱导的对照中。
无细胞提取物中的乙酰乙酰辅酶A硫解酶活性通过监控303nm处吸光度中的减少作为Mg2+-乙酰乙酰辅酶A复合物降解来测量。标准测定条件为100mM Tris-HCl pH 8.0,1mM DTT(二硫苏糖醇)和10mMMgCl2。使混合物(cocktail)于37℃平衡5分钟;随后加入无细胞提取物。反应用添加0.05mM乙酰乙酰辅酶A加0.2mM辅酶A来起始。蛋白质浓度通过Bradford方法或通过Bicinchoninic Kit(Sigma,目录号BCA-1)来测量。牛血清清蛋白(Bio-Rad,Hercules,CA)在2种情况下用作标准。在一种一般测定中,与未诱导的培养物中的0.27μmolmg-1 min-1比较,诱导的培养物中的ThlA蛋白质比活性测定为16.0μmolmg-1 min-1
                    实施例2
         乙酰辅酶A乙酰转移酶的克隆和表达
这个实施例的目的是在大肠杆菌中表达乙酰辅酶A乙酰转移酶,在本文中也称为乙酰乙酰辅酶A硫解酶。乙酰乙酰辅酶A硫解酶基因thlB从丙酮丁醇梭菌(ATCC 824)克隆且在大肠杆菌中表达。thlB基因使用PCR从丙酮丁醇梭菌(ATCC 824)基因组DNA扩增。
thlB基因以与实施例1中所述的thlA基因相同的方式克隆和表达。丙酮丁醇梭菌(ATCC 824)基因组DNA通过PCR使用引物N15和N16(参见表4)来扩增,所述引物N15和N16分别作为SEQ ID NOs:27和28给出,从而产生1.2kbp产物。正向引物掺入紧邻翻译起始密码子的4个碱基(CACC),以允许定向克隆到pENTR/SD/D-TOPO(Invitrogen)内,以产生质粒pENTRSDD-TOPOthlB。提交克隆用于由M13正向和反向引物测序,所述M13正向和反向引物分别作为SEQID NOs:45和46给出,以证实基因以正确方向插入且证实序列。需要另外的测序引物N15SeqF1和N16SeqR1(参见表5)以对PCR产物完全测序,所述N15SeqF1和N16SeqR1分别作为SEQ ID NOs:49和50给出。关于这种基因的可读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别作为SEQ ID NO:3和SEQ ID NO:4给出。
为了生成表达克隆,通过重组将thlB基因转移至pDEST 14(Invitrogen)载体以产生pDEST14thlB。将pDEST14thlB载体转化到BL21-AI细胞内,且通过添加阿拉伯糖诱导来自T7启动子的表达。如由核酸序列推导的预期分子量约42kDa的蛋白质,存在于诱导的培养物中但不存在于未诱导的对照中。酶测定如实施例1中所述进行。在一种一般测定中,与未诱导的培养物中的0.28μmol mg-1 min-1比较,诱导的培养物中的ThlB蛋白质比活性测定为14.9μmol mg-1 min-1
                      实施例3
          3-羟丁酰辅酶A脱氢酶的克隆和表达
这个实施例的目的是从丙酮丁醇梭菌(ATCC 824)克隆hbd基因且在大肠杆菌中表达它。hbd基因使用PCR从丙酮丁醇梭菌(ATCC824)基因组DNA扩增。
hbd基因使用实施例1中所述方法进行克隆和表达。hbd基因通过PCR使用引物N5和N6(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物N5和N6分别作为SEQ ID NO:19和20给出,从而产生881bp产物。正向引物掺入紧邻翻译起始密码子的4个碱基(CACC),以允许定向克隆到pENTR/SD/D-TOPO(Invitrogen)内,以产生质粒pENTRSDD-TOPOhbd。提交克隆用于由M13正向和反向引物测序,所述M13正向和反向引物分别作为SEQ ID NOs:45和46给出,以证实基因以正确方向插入且证实序列。需要另外的测序引物N5SeqF2和N6SeqR2(参见表5)以对PCR产物完全测序,所述N5SeqF2和N6SeqR2分别作为SEQ ID NOs:51和52给出。关于这种基因的可读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别作为SEQ ID NO:5和SEQ ID NO:6给出。
为了生成表达克隆,通过重组将hbd基因转移至pDEST 14(Invitrogen)载体以产生pDEST14hbd。如实施例1中所述,将pDEST14hbd载体转化到BL21-AI细胞内,且通过添加阿拉伯糖诱导来自T7启动子的表达。如由核酸序列推导的预期分子量约31kDa的蛋白质,存在于诱导的培养物中但不存在于未诱导的对照中。
如通过340nm处吸光度中的减少测量的,通过测量NADH氧化率来测定羟丁酰辅酶A脱氢酶活性。标准测定混合物包含50mM MOPS,pH 7.0,1mM DTT和0.2mM NADH。使混合物于37℃平衡5分钟,且随后加入无细胞提取物。反应通过添加底物0.1mM乙酰乙酰辅酶A来起始。在一种一般测定法中,与未诱导的培养物中的0.885μmol mg-1min-1比较,诱导的培养物中的BHBD蛋白质比活性测定为57.4μmolmg-1 min-1
                  实施例4
           巴豆酸酶的克隆和表达
这个实施例的目的是从丙酮丁醇梭菌(ATCC 824)克隆crt基因且在大肠杆菌中表达它。crt基因使用PCR从丙酮丁醇梭菌(ATCC 824)基因组DNA扩增。
crt基因使用实施例1中所述方法进行克隆和表达。crt基因通过PCR使用引物N3和N4(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物N3和N4分别作为SEQ ID NO:17和18给出,从而产生794bp产物。正向引物掺入紧邻翻译起始密码子的4个碱基(CACC),以允许定向克隆到pENTR/SD/D-TOPO(Invitrogen)内,以产生质粒pENTRSDD-TOPOcrt。提交克隆用于由M 13正向和反向引物测序,所述M13正向和反向引物分别作为SEQ ID NOs:45和46给出,以证实基因以正确方向插入且证实序列。关于这种基因的可读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别作为SEQ IDNO:7和SEQ ID NO:8给出。
为了生成表达克隆,通过重组将crt基因转移至pDEST 14(Invitrogen)载体以产生pDEST14crt。如实施例1中所述,将pDEST14crt载体转化到BL21-AI细胞内,且通过添加阿拉伯糖诱导来自T7启动子的表达。如由核酸序列推导的预期分子量约28kDa的蛋白质,存在于诱导的培养物中的量比未诱导的对照中的多得多。
巴豆酸酶活性如Stern(Methods Enzymol.1,559-566,(1954))所述进行测定。在一种一般测定中,与未诱导的培养物中的47μmolmg-1 min-1比较,诱导的培养物中的巴豆酸酶蛋白质比活性测定为444μmol mg-1 min-1
                   实施例5
          丁酰辅酶A脱氢酶的克隆和表达
这个实施例的目的是在大肠杆菌中表达丁酰辅酶A脱氢酶,在本文中也称为反式-2-烯酰辅酶A还原酶。CAC0462基因,推定的反式-2-烯酰辅酶A还原酶同源物从丙酮丁醇梭菌(ATCC 824)克隆且在大肠杆菌中表达。CAC0462基因使用PCR从丙酮丁醇梭菌(ATCC 824)基因组DNA扩增。
CAC0462基因使用实施例1中所述方法进行克隆和表达。CAC0462基因通过PCR使用引物N17和N21(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物N17和N21分别作为SEQ ID NO:29和30给出,从而产生1.3kbp产物。正向引物掺入紧邻翻译起始密码子的4个碱基(CACC),以允许定向克隆到pENTR/SD/D-TOPO(Invitrogen)内,以产生质粒pENTRSDD-TOPOCAC0462。提交克隆用于由M13正向和反向引物测序,所述M13正向和反向引物分别作为SEQ ID NOs:45和46给出,以证实基因以正确方向插入且证实序列。需要另外的测序引物N22SeqF1(SEQ ID NO:53)、N22SeqF2(SEQ ID NO:54)、N22SeqF3(SEQ ID NO:55)、N23SeqR1(SEQ ID NO:56)、N23SeqR2(SEQID NO:57)、和N23SeqR3(SEQ ID NO:58)(参见表5)以对PCR产物完全测序。关于这种基因的可读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别作为SEQ ID NO:9和SEQ ID NO:10给出。
为了生成表达克隆,通过重组将CAC0462基因转移至pDEST 14(Invitrogen)载体以产生pDEST14CAC0462。如实施例1中所述,将pDEST14CAC0462载体转化到BL21-AI细胞内,且通过添加阿拉伯糖诱导来自T7启动子的表达。通过SDS-PAGE的分析显示在阴性对照或诱导的培养物中没有预期分子量的超表达的蛋白质。丙酮丁醇梭菌CAC0462基因使用许多罕见的大肠杆菌密码子。为了避免密码子选择问题,将pRARE质粒(Novagen)转化到具有pDEST14CAC0462载体的BL21-A1细胞内。用携带pRARE载体的培养物重复使用阿拉伯糖诱导的表达研究。预期分子量约46kDa的蛋白质存在于诱导的培养物中但不存在于未诱导的对照中。
反式-2-烯酰辅酶A还原酶活性如Hoffmeister等人(J.Biol.Chem.280,4329-4338(2005))所述进行测定。在一种一般测定中,与未诱导的培养物中的0.0128μmol mg-1 min-1比较,诱导的培养物中的TERCAC0462蛋白质比活性测定为0.694μmol mg-1 min-1
                     实施例6
         丁醛脱氢酶(乙酰化)的克隆和表达
这个实施例的目的是从拜氏梭菌(ATCC 35702)克隆ald基因且在大肠杆菌中表达它。ald基因使用PCR从拜氏梭菌(ATCC 35702)基因组DNA扩增。
ald基因使用实施例1中所述方法进行克隆和表达。ald基因通过PCR使用引物N27 F1和N28 R1(参见表4)从拜氏梭菌(ATCC 35702)基因组DNA(如实施例1中所述由厌氧生长的培养物制备)进行扩增,所述引物N27 F1和N28 R1分别作为SEQ ID NO:31和32给出,从而产生1.6kbp产物。正向引物掺入紧邻翻译起始密码子的4个碱基(CACC),以允许定向克隆到pENTR/SD/D-TOPO(Invitrogen)内,以产生质粒pENTRSDD-TOPOald。提交克隆用于由M 13正向和反向引物测序,所述M13正向和反向引物分别作为SEQ ID NOs:45和46给出,以证实基因以正确方向插入且证实序列。需要另外的测序引物N31SeqF2(SEQ ID NO:59)、N31SeqF3(SEQ ID NO:60)、N31SeqF4(SEQ ID NO:61)、N32SeqR1(SEQ ID NO:72)、N31SeqR2(SEQID NO:62)、N31SeqR3(SEQ ID NO:63)、N31SeqR4(SEQ ID NO:64)、和N31SeqR5(SEQ ID NO:65)(参见表5)以对PCR产物完全测序。关于这种基因的可读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别作为SEQ ID NO:11和SEQ ID NO:12给出。
为了生成表达克隆,通过重组将ald基因转移至pDEST 14(Invitrogen)载体以产生pDEST14ald。如实施例1中所述,将pDEST14ald载体转化到BL21-AI细胞内,且通过添加阿拉伯糖诱导来自T7启动子的表达。如由核酸序列推导的预期分子量约51kDa的蛋白质,存在于诱导的培养物中但不存在于未诱导的对照中。
如Husemann等人(Appl.Microbiol.Biotechnol.31:435-444(1989))所述,如通过340nm处吸光度中的增加测量的,通过监控NADH的形成来测定酰化醛脱氢酶活性。在一种一般测定中,与未诱导的培养物中的0.01μmol mg-1 min-1比较,诱导的培养物中的Ald蛋白质比活性测定为0.106μmol mg-1 min-1
                    实施例7
            丁醇脱氢酶的克隆和表达
这个实施例的目的是从丙酮丁醇梭菌(ATCC 824)克隆bdhB基因且在大肠杆菌中表达它。bdhB基因使用PCR从丙酮丁醇梭菌(ATCC824)基因组DNA扩增。
bdhB基因使用实施例1中所述方法进行克隆和表达。bdhB基因通过PCR使用引物N11和N12(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物N11和N12分别作为SEQ ID NO:25和26给出,从而产生1.2kbp产物。正向引物掺入紧邻翻译起始密码子的4个碱基(CACC),以允许定向克隆到pENTR/SD/D-TOPO(Invitrogen)内,以产生质粒pENTRSDD-TOPObdhB。翻译起始密码子也通过引物序列从“GTG”变成“ATG”。提交克隆用于由M13正向和反向引物测序,所述M13正向和反向引物分别作为SEQ ID NOs:45和46给出,以证实基因以正确方向插入且证实序列。需要另外的测序引物N11SeqF1(SEQ ID NO:66)、N11SeqF2(SEQ ID NO:67)、N12SeqR1(SEQ ID NO:68)、和N12SeqR2(SEQ ID NO:69)(参见表5)以对PCR产物完全测序。关于这种基因的可读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别作为SEQ ID NO:13和SEQID NO:14给出。
为了生成表达克隆,通过重组将bdhB基因转移至pDEST 14(Invitrogen)载体以产生pDEST14bdhB。如实施例1中所述,将pDEST14bdhB载体转化到BL21-AI细胞内,且通过添加阿拉伯糖诱导来自T7启动子的表达。如由核酸序列推导的预期分子量约43kDa的蛋白质,存在于诱导的培养物但不存在于未诱导的对照中。
如Husemann和Papoutsakis同上所述,如通过340nm处吸光度中的减少测量的,由NADH的氧化率来测定丁醇脱氢酶活性。在一种一般测定中,与未诱导的培养物中的0.022μmol mg-1 min-1比较,诱导的培养物中的BdhB蛋白质比活性测定为0.169μmol mg-1 min-1
                   实施例8
          丁醇脱氢酶的克隆和表达
这个实施例的目的是从丙酮丁醇梭菌824克隆bdhA基因且在大肠杆菌中表达它。bdhA基因使用PCR从丙酮丁醇梭菌824基因组DNA扩增。
bdhA基因使用实施例1中所述方法进行克隆和表达。bdhA基因通过PCR使用引物N9和N10(参见表4)从丙酮丁醇梭菌824基因组DNA进行扩增,所述引物N9和N10分别作为SEQ ID NO:23和24给出,从而产生1.2kbp产物。正向引物掺入紧邻翻译起始密码子的4个碱基(CACC),以允许定向克隆到pENTR/SD/D-TOPO(Invitrogen)内,以产生质粒pENTRSDD-TOPObdhA。克隆分别作为SEQ ID NOs:45和46给出,以证实基因以正确方向插入且证实序列。需要另外的测序引物N9SeqF1(SEQ ID NO:70)和N10SeqR1(SEQ ID NO:71)(参见表5)以对PCR产物完全测序。关于这种基因的可读框(ORF)的核苷酸序列以及酶的预测氨基酸序列分别作为SEQ ID NO:15和SEQ ID NO:16给出。
为了生成表达克隆,通过重组将bdhA基因转移至pDEST 14(Invitrogen)载体以产生pDEST14bdhA。如实施例1中所述,将pDEST14bdhA载体转化到BL21-AI细胞内,且通过添加阿拉伯糖诱导来自T7启动子的表达。如由核酸序列推导的预期分子量约43kDa的蛋白质,存在于诱导的培养物但不存在于未诱导的对照中。
如Husemann和Papoutsakis同上所述,如通过340nm处吸光度中的减少测量的,由NADH的氧化率来测定丁醇脱氢酶活性。在一种一般测定中,与未诱导的培养物中的0.028μmol mg-1 min-1比较,诱导的培养物中的BdhA蛋白质比活性测定为0.102μmol mg-1 min-1
                         实施例9
关于1-丁醇生物合成途径中的基因的转化载体构建-下游(lower)途
为了构建包含编码1-丁醇生物合成途径中6个步骤的基因的转化载体,将编码途径中6个步骤的基因分成2个操纵子。上游途径包含由乙酰辅酶A乙酰转移酶、3-羟丁酰辅酶A脱氢酶、巴豆酸酶和丁酰辅酶A脱氢酶催化的前4个步骤。下游途径包含由丁醛脱氢酶和丁醇脱氢酶催化的后2个步骤。
这个实施例的目的是构建下游途径操纵子。上游途径操纵子的构建在实施例10中描述。
个别基因通过PCR使用引物进行扩增,所述引物掺入限制位点以用于稍后克隆,且正向引物包含最优化的大肠杆菌核糖体结合位点(AAAGGAGG)。将PCR产物TOPO克隆到pCR 4Blunt-TOPO载体内且转化到大肠杆菌Top10细胞(Invitrogen)内。质粒DNA由TOPO克隆制备且验证基因序列。限制酶和T4DNA连接酶(New EnglandBiolabs,Beverlv,MA)根据制造商的建议使用。对于克隆实验,限制片段通过凝胶电泳使用QIAquick Gel Extraction试剂盒(Qiagen)进行纯化。
序列证实后,将基因亚克隆到作为克隆平台的修饰的pUC19载体内。pUC19载体通过HindIII/SapI消化进行修饰,从而产生pUC19dHS。消化去除邻近于MCS(多克隆位点)的lac启动子,从而防止操纵子在载体中转录。
ald基因通过PCR使用引物N58和N59(参见表4)从拜氏梭菌ATCC 35702基因组DNA进行扩增,所述引物N58和N59分别作为SEQ ID NO:41和42给出,从而产生1.5kbp产物。正向引物掺入限制位点AvaI和BstEII以及RBS(核糖体结合位点)。反向引物掺入HpaI限制位点。将PCR产物克隆到pCRBlunt II-TOPO内,从而产生pCRBluntII-ald。质粒DNA由TOPO克隆制备,且用下述引物验证基因序列:M13正向(SEQ ID NO:45)、M13反向(SEQ ID NO:46)、N31SeqF2(SEQ ID NO:59)、N31SeqF3(SEQ ID NO:60)、N31SeqF4(SEQ ID NO:61)、N32SeqR1(SEQ ID NO:72)、N31SeqR2(SEQID NO:62)、N31SeqR3SEQ ID NO:63)、N31SeqR4(SEQ ID NO:64)、和N31SeqR5(SEQ ID NO:65)(参见表5)。
bdhB基因通过PCR使用引物N64和N65(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物N64和N65分别作为SEQ ID NO:43和44给出,从而产生1.2kbp产物。正向引物掺入HpaI限制位点和RBS。反向引物掺入PmeI和SphI限制位点。将PCR产物克隆到pCRBlunt II-TOPO内,从而产生pCRBluntII-bdhB。质粒DNA由TOPO克隆制备,且用下述引物验证基因序列:M13正向(SEQ ID NO:45)、M13反向(SEQ ID NO:46)、N11SeqF1(SEQID NO:66)、N11SeqF2(SEQ ID NO:67)、N12SeqR1(SEQ ID NO:68)、和N12SeqR2(SEQ ID NO:69)(参见表5)。
为了构建下游途径操纵子,使来自pCRBluntII-bdhB的1.2kbp SphI和HpaI片段,来自pCRBluntII-ald的1.4kbp HpaI和SphI片段,以及来自AvaI和SphI消化的pUC19dHS的大片段连接在一起。三向连接产生pUC19dHS-ald-bdhB。
pUC19dHS-ald-bdhB载体用BstEII和PmeI进行消化,从而释放克隆到pBenBP内的2.6kbp片段,所述pBenBP是大肠杆菌-枯草芽孢杆菌穿梭载体。质粒pBenBP通过pBE93载体修饰产生,所述pBE93由Nagarajan,WO 93/24631(实施例4)描述。解淀粉芽孢杆菌(Bacillusamyloliquefaciens)中性蛋白酶启动子(NPR)、信号序列和phoA基因用NcoI/HindIII消化从pBE93中去除。NPR启动子通过引物BenF和BenBPR从pBE93进行PCR扩增,所述引物BenF和BenBPR分别由SEQ ID NO:73和75给出。引物BenBPR掺入启动子下游的BstEII、PmeI和HindIII位点。PCR产物用NcoI和HindIII进行消化,且将片段克隆到载体pBE93的相应位点内以产生pBenBP。将下游操纵子片段亚克隆到pBenBP中的BstEII和PmeI位点内,从而产生pBen-ald-bdhB。
使用上述方法对粗提取物来进行关于丁醛脱氢酶和丁醇脱氢酶活性的测定。2种酶活性均在超过包含空载体的对照菌株的水平上得到证实。
                实施例10(预示的)
关于1-丁醇生物合成途径中的基因的转化载体构建-上游途径
这个预示的实施例的目的是描述如何装配上游途径操纵子。一般方法与实施例9中所述的相同。
thlA基因通过PCR使用引物对N44和N45(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物对N44和N45分别作为SEQ ID NO:33和34给出,从而产生1.2kbp产物。正向引物掺入SphI限制位点和核糖体结合位点(RBS)。反向引物掺入AscI和PstI限制位点。将PCR产物克隆到pCR4Blunt-TOPO内,从而产生pCR4 Blunt-TOPO-thlA。质粒DNA由TOPO克隆制备,且用下述引物验证基因序列:M 13正向(SEQ ID NO:45)、M13反向(SEQ IDNO:46)、N7SeqF1(SEQ ID NO:47)、和N7SeqR1(SEQ ID NO:48)(参见表5)。
hbd基因通过PCR使用引物对N42和N43(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物对N42和N43分别作为SEQ ID NO:35和36给出,从而产生0.9kbp产物。正向引物掺入SalI限制位点和RBS。反向引物掺入SphI限制位点。将PCR产物克隆到pCR4 Blunt-TOPO内,从而产生pCR4 Blunt-TOPO-hbd。质粒DNA由TOPO克隆制备,且用下述引物验证基因序列:M 13正向(SEQ ID NO:45)、M13反向(SEQ ID NO:46)、N5SeqF2(SEQID NO:51)、和N6SeqR2(SEQ ID NO:52)(参见表5)。
CAC0462基因对于在作为第一宿主的大肠杆菌和作为第二宿主的枯草芽孢杆菌中的表达进行密码子最优化。作为SEQ ID NO:76给出的称为CaTER的新基因由Genscript Corp(Piscataway,NJ)合成。基因CaTER作为BamHI-SalI片段克隆到pUC57载体中且包括RBS,从而产生质粒pUC57-CaTER。
crt基因通过PCR使用引物对N38和N39(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物对N38和N39分别作为SEQ ID NO:39和40给出,从而产生834bp产物。正向引物掺入EcoRI和MluI限制位点和RBS。反向引物掺入BamHI限制位点。将PCR产物克隆到pCR4 Blunt-TOPO  内,从而产生pCR4Blunt-TOPO-crt。质粒DNA由TOPO克隆制备,且用引物M 13正向(SEQ ID NO:45)和M13反向(SEQ ID NO:46)(参见表5)验证基因序列。
序列证实后,将基因亚克隆到作为克隆平台的修饰的pUC19载体内。pUC19载体通过SphI/SapI消化进行修饰,从而产生pUC19dSS。消化去除邻近于MCS的lac启动子,从而防止操纵子在载体中转录。
为了构建上游途径操纵子,pCR4 Blunt-TOPO-crt用EcoRI和BamHI进行消化,从而释放0.8kbp crt片段。pUC19dSS载体也用EcoRI和BamHI进行消化,从而释放2.0kbp载体片段。crt片段和载体片段使用T4DNA连接酶(New England Biolabs)连接在一起,以形成pUC19dSS-crt。CaTER基因通过用BamHI和SalI消化pUC57-CaTER从而释放1.2kbp CaTER片段,插入pCU19dSS-crt内。pUC19dSS-crt用BamHI和SalI进行消化,且使大载体片段与CaTER片段连接,从而产生pUC19dSS-crt-CaTER。为了完成操纵子,连接来自pCR4Blunt-TOPO-hbd的884bp SalI和SphI片段,来自pCR4Blunt-TOPO-thlA的1.2kb SphI和PstI tblA片段,以及来自pUCl9dSS-crt-CaTER的SalI和PstI消化的大片段。三向连接产物是pUC19dSS-crt-CaTER-hbd-thlA。
pUC19dSS-crt-CaTER-hbd-thlA载体用MluI和AscI进行消化,从而释放克隆到pBE93衍生物(Caimi,WO2004/018645,第39-40页)内的4.1kbp片段,所述pBE93衍生物是大肠杆菌-枯草芽孢杆菌穿梭载体,称为pBenMA。质粒pBenMA通过pBE93载体修饰产生。解淀粉芽孢杆菌中性蛋白酶启动子(NPR)、信号序列和phoA基因用NcoI/HindIII消化从pBE93中去除。NPR启动子通过引物BenF和BenMAR从pBE93进行PCR扩增,所述引物BenF和BenMAR分别由SEQ ID NO:73和74给出。引物BenMAR掺入启动子下游的MluI、AscI和HindIII位点。PCR产物用NcoI和HindIII进行消化,且将片段克隆到载体pBE93的相应位点内,从而产生pBenMA。将上游操纵子片段亚克隆到pBenMA中的MluI和AscI位点内,从而产生pBen-crt-hbd-CaTER-thlA。
                  实施例11(预示的)
         1-丁醇生物合成途径在大肠杆菌中的表达
这个预示的实施例的目的是描述如何在大肠杆菌中表达1-丁醇生物合成途径。
将分别如实施例10和9中所述构建的质粒pBen-crt-hbd-CaTER-thlA和pBen-ald-bdhB转化到大肠杆菌NM522(ATCC 47000)内,且每个操纵子中的基因表达通过SDS-PAGE分析、酶测定和蛋白质印迹分析来监控。对于蛋白质印迹,抗体针对经由Sigma-Genosys(The Woodlands,TX)的合成肽产生。所有基因的表达证实后,用EcoRI和PmeI消化pBen-ald-bdhB,以释放NPR启动子-ald-bdhB片段。将EcoRI消化的片段使用DNA聚合酶的克列诺(Klenow)片段(New England Biolabs,目录号M0210S)平端化。质粒pBen-crt-hbd-CaTER-thlA用PvuII进行消化,以产生线性化平端载体片段。使载体与NPR-ald-bdhB片段连接,从而产生p1B1 O.1和p1B1O.2,包含其中NPR启动子-ald-bdhB片段为相反方向的完整1-丁醇生物合成途径。将质粒p1B1 O.1和p1B1 O.2转化到大肠杆菌NM522内,且如前所述监控基因表达。
将大肠杆菌菌株NM522/p1B1 O.1或NM522/p1B1 O.1接种到包含50mL培养基的250mL摇瓶内,且于250rpm和35℃振荡。培养基由下述组成:葡萄糖,5g/L;MOPS,0.05M;硫酸铵0.01M;一代磷酸钾,0.005M;S10金属混合物,1%(v/v);酵母提取物,0.1%(w/v);酪蛋白氨基酸,0.1%(w/v);硫胺素,0.1mg/L;脯氨酸,0.05mg/L;和生物素0.002mg/L,且用KOH滴定至pH 7.0。S10金属混合物包含:MgCl2,200mM;CaCl2,70mM;MnCl2,5mM;FeCl3,0.1mM;ZnCl2,0.1mM;盐酸硫胺素,0.2mM;CuSO4,172μM;CoCl2,253μM;和Na2MoO4,242μM。18-24小时后,如一般方法部分中所述,1-丁醇通过HPLC或GC分析来检测。
                 实施例12(预示的)
      1-丁醇生物合成途径在枯草芽孢杆菌中的表达
这个预示的实施例的目的是描述如何在枯草芽孢杆菌中表达1-丁醇生物合成途径。使用与实施例11中所述相同的方法。
使用分别如实施例10和9中所述构建的上游和下游操纵子。将质粒p1B1 O.1和p1B1 O.2转化到枯草芽孢杆菌BE1010(J.Bacteriol.173:2278-2282(1991))内,且如实施例11中所述监控每个操纵子中的基因表达。
将枯草芽孢杆菌菌株BE1010/p1B1 O.1或BE1010/p1B1 O.2接种到包含50mL培养基的250mL摇瓶内,且于250rpm和35℃振荡18小时。培养基由下述组成:葡萄糖,5g/L;MOPS,0.05M;谷氨酸,0.02M;硫酸铵0.01M;一代磷酸钾缓冲液,0.005M;S10金属混合物(如实施例11中所述),1%(v/v);酵母提取物,0.1%(w/v);酪蛋白氨基酸,0.1%(w/v);色氨酸,50mg/L;甲硫氨酸,50mg/L;和赖氨酸,50mg/L,且用KOH滴定至pH 7.0。18-24小时后,如一般方法部分中所述,1-丁醇通过HPLC或GC分析来检测。
                   实施例13
       使用重组大肠杆菌从葡萄糖生产1-丁醇
这个实施例描述了1-丁醇在大肠杆菌中的生产。编码1-丁醇生物合成途径6个步骤的基因的表达分成3个操纵子。上游途径包含在1个操纵子中由thlA、hbd、crt和EgTER编码的前4个步骤。由ald编码的下一个步骤由第2个操纵子提供。由yqhD编码的途径中的最后1个步骤在第3个操纵子中提供。1-丁醇生产在包含3个操纵子的大肠杆菌菌株中证实。
除非上下文另有说明,这个实施例中描述的克隆引物通过其SEQID NO:参考表4,且测序和PCR筛选引物通过其SEQ ID NO:参考表5。
乙酰辅酶A乙酰转移酶。thlA基因通过PCR使用引物对N44和N45(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物对N44和N45分别作为SEQ ID NO:33和34给出,从而产生1.2kbp产物。正向引物掺入SphI限制位点和核糖体结合位点(RBS)。反向引物掺入AscI和PstI限制位点。将PCR产物克隆到pCR4B1unt-TOPO(Invitrogen Corp.,Carlsbad,CA)内,从而产生pCR4Blunt-TOPO-thlA。质粒DNA由TOPO克隆制备,且基因序列用下述引物验证:M13正向(SEQ ID NO:45)、M13反向(SEQ ID NO:46)、N7SeqF1(SEQ ID NO:47)、和N7SeqR1(SEQ ID NO:48)(参见表5)。
3-羟丁酰辅酶A脱氢酶。hbd基因通过PCR使用引物对N42和N43(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物对N42和N43分别作为SEQ ID NO:35和36给出,从而产生0.9kbp产物。正向引物掺入SalI限制位点和RBS。反向引物掺入SphI限制位点。将PCR产物克隆到pCR4Blunt-TOPO内,从而产生pCR4Blunt-TOPO-hbd。质粒DNA由TOPO克隆制备,且基因序列用下述引物验证:M13正向(SEQ ID NO:45)、M13反向(SEQ ID NO:46)、N5SeqF2(SEQ ID NO:51)、和N6SeqR2(SEQ ID NO:52)(参见表5)。
巴豆酸酶。crt基因通过PCR使用引物对N38和N39(参见表4)从丙酮丁醇梭菌(ATCC 824)基因组DNA进行扩增,所述引物对N38和N39分别作为SEQ ID NO:39和40给出,从而产生834bp产物。正向引物掺入EcoRI和MluI限制位点和RBS。反向引物掺入BamHI限制位点。将PCR产物克隆到pCR4Blunt-TOPO内,从而产生pCR4Blunt-TOPO-crt。质粒DNA由TOPO克隆制备,且基因序列用引物M13正向(SEQ ID NO:45)和M13反向(SEQ ID NO:46)(参见表5)验证。
丁酰辅酶A脱氢酶(反式-2-烯酰辅酶A还原酶)。CAC0462基因针对作为第一宿主的大肠杆菌和作为第二宿主的枯草芽孢杆菌中的增强的密码子选择进行合成。合成新基因(CaTER,SEQ ID NO:76)且在pUC57载体中作为BamHI-SalI片段由Genscript Corporation(Piscataway,NJ)克隆,且包括RBS。
来自小眼虫(TER,GenBank No.Q5EU90)的关于丁酰辅酶A脱氢酶的备选基因针对大肠杆菌和枯草芽孢杆菌中的增强的密码子选择进行合成。基因由GenScript Corporation合成和克隆到pUC57内,从而产生pUC57::EgTER。引物N85和N86(分别为SEQ ID NO:80和81)连同作为模板DNA的pUC57::EgTER,提供包含来自pUC57::EgTER DNA的1224bp的PCR片段。1224bp序列作为SEQ IDNO:77给出,其中bp 1-1218是EgTER(opt)的编码序列(cds)。EgTER(opt)是密码子最优化的TER基因,从而缺乏正常的线粒体前序列,以便在大肠杆菌中起作用(Hoffmeister等人,J.Biol.Chem.280:4329(2005))。
将EgTER(opt)克隆到pCR4Blunt-TOPO内,并且其序列用引物M13正向(SEQ ID NO:45)和M13反向(SEQ ID NO:46)证实。需要另外的测序引物N62SeqF2(SEQ ID NO:114)、N62SeqF3(SEQID NO:115)、N62SeqF4(SEQ ID NO:116)、N63SeqR1(SEQ IDNO:117)、N63SeqR2(SEQ ID NO:118)、N63SeqR3(SEQ ID NO:119)和N63SeqR4(SEQ ID NO:120)以对PCR产物完全测序。1.2kbpEgTER(opt)序列随后用HincII和PmeI切割,并且克隆到用HincII线性化的pET23+(Novagen)内。EgTER(opt)基因对于启动子的方向通过用引物T7Primer和N63SeqR2(分别为SEQ ID NO:82和118)的菌落PCR筛选证实。将所得到的质粒pET23+::EgTER(opt)转化到BL21(DE3)(Novagen)内用于表达研究。
反式-2-烯酰辅酶A还原酶活性如Hoffmeister等人,J.Biol.Chem.280,4329(2005)所述进行测定。在一般测定中,与未诱导的培养物中的0.547μmol mg/-1 min-1比较,诱导的BL21(DE3)/pET23+::EgTER(opt)培养物中的EgTER(opt)蛋白质比活性测定为1.9μmol mg-1min-1
随后将EgTER(opt)基因克隆到在trc启动子控制下的pTrc99a载体内。EgTER(opt)基因作为1287-bp BamHI/SalI片段从pET23+::EgTER(opt)分离。4.2kbp载体pTrc99a用BamHI/SalI线性化。使载体与片段连接,从而产生5.4kbp pTrc99a-EgTER(opt)。阳性克隆通过用引物Trc99aF和N63SeqR3(分别为SEQ ID NO:83和119)的菌落PCR来证实,从而产生0.5kb产物。
包含编码乙酰辅酶A乙酰转移酶(thlA)、3-羟丁酰辅酶A脱氢 酶(hbd)、巴豆酸酶(crt)、和丁酰辅酶A脱氢酶(反式-2-烯酰辅 酶A还原酶,EgTER(opt))基因的质粒pTrc99a-E-C-H-T构建。为了起始包含上游途径(EgTER(opt)、crt、hbd和thlA)的4基因操纵子的构建,pCR4Blunt-TOPO-crt用EcoRI和BamHI进行消化,从而释放0.8kbp crt片段。pUC19dSS载体(在实施例10中描述)同样用EcoRI和BamHI进行消化,从而释放2.0kbp载体片段。crt片段和载体片段使用T4DNA连接酶(New England Biolabs)连接在一起,以形成pUC19dSS-crt。CaTER基因通过用BamHI和SalI消化pUC57-CaTER从而释放1.2kbp CaTER片段,插入pCU19dSS-crt内。pUC19dSS-crt用BamHI和SalI进行消化,且使大载体片段与CaTER片段连接,从而产生pUC19dSS-crt-CaTER。为了完成操纵子,连接来自pCR4Blunt-TOPO-hbd的884bp SalI和SphI片段,来自pCR4Blunt-TOPO-thlA的1.2kb SphI和PstI thlA片段,以及来自pUC19dSS-crt-CaTER的SalI和PstI消化的大片段。三向连接的产物是所谓的pUC19dSS-crt-CaTER-hbd-thlA或pUC19dss::Operonl。
从pTrc99a-EgTER(opt)获得的丁酰辅酶A脱氢酶活性比来自CaTER构建体的更高,因此,构建来源于pTrc99a-EgTER(opt)的操纵子。CaTER基因通过用BamHI/SalI消化,且将5327-bp载体片段凝胶纯化,从pUC19dss::Operonl中取出。载体用克列诺处理且重新连接,从而产生pUC19dss::Operon 1 ΔCaTer。2934-bp crt-hbd-thlA(C-H-T)片段随后作为EcoRI/PstI片段从pUC19dss:Operon 1 ΔCaTer分离。C-H-T片段用克列诺处理以使末端变为平头的。使平端化载体与平端化C-H-T片段连接,以产生pTrc99a-E-C-H-T。菌落PCR反应用引物N62SeqF4和N5SeqF4(分别为SEQ ID NO:116和84)进行,以证实插入片段的方向。
包含编码丁醛脱氢酶(ald和ald(opt))的基因的质粒pBHR T7-ald 和pBHR-Ptrc-ald(opt)的构建。将PT7-ald操纵子从pDEST14-ald(实施例6)亚克隆到广宿主范围质粒pBHR1(MoBitec,Goettingen,德国)内,以产生pBHR1 PT7-ald。pBHR1质粒与pUC19或pBR322质粒相容,因此pBHR1 PT7-ald可以与携带上游途径操纵子的pUC19或pBR322衍生物组合使用,以用于在大肠杆菌中的1-丁醇生产。pDEST14-ald质粒用Bgl II进行消化,且用DNA聚合酶的克列诺片段处理,以产生平端。质粒随后用EcoRI进行消化,且将2,245bp PT7-ald片段凝胶纯化。质粒pBHR1用ScaI和EcoRI进行消化,且将4,883bp片段凝胶纯化。使PT7-ald片段与pBHR1载体连接,从而产生pBHRT7-ald。使用引物T-ald(BamHI)和B-ald(EgTER)(分别为SEQ IDNO:85和86)的转化体的菌落PCR扩增证实预期的1.4kb PCR产物。pBHR T7-ald克隆使用EcoRI和DrdI的限制酶切作图证实预期的4,757和2,405bp片段。
对于丁醛脱氢酶活性测定,如实施例1中所述,将质粒pBHR T7-ald转化到BL21StarTM(DE3)细胞(Invitrogen)内,且通过添加L-阿拉伯糖诱导来自T7启动子的表达。如实施例6中所述,如通过340nm处吸光度中的增加测量的,通过监控NADH的形成来测定酰化醛脱氢酶活性。
关于来自拜氏梭菌ATCC 35702的ald基因的备选DNA序列由GenScript Corporation(Biscataway,NJ)合成(对于大肠杆菌和枯草芽孢杆菌中的密码子选择最优化)且克隆到pUC57内,从而产生质粒pUC57-ald(opt)。pUC57-ald(opt)用SacI和SalI进行消化,以释放包含密码子最优化基因、ald(opt)和已用于大肠杆菌的RBS的1498bp片段。1498bp片段的序列作为SEQ ID NO:78给出。
pTrc99a用SacI和SalI进行消化,从而产生4153bp载体片段,使所述载体片段与1498bp ald(opt)片段连接,以产生pTrc-ald(opt)。合成基因ald(opt)的表达在IPTG诱导型Ptrc启动子的控制下。
将Ptrc-ald(opt)操纵子亚克隆到广宿主范围质粒pBHR1(MoBitec)内,以与上述上游途径质粒相容。Ptrc-ald(opt)片段用在相应引物内掺入BspEI和ScaI限制位点的T-Ptrc(BspEI)和B-aldopt(ScaI)(分别为SEQ ID NO:87和88)从pTrc99A::ald(opt)进行PCR扩增。PCR产物用BspEI和ScaI进行消化。质粒pBHR1用ScaI和BspEI进行消化,且将4,883bp片段凝胶纯化。使Ptrc-ald(opt)片段与pBHR1载体连接,从而产生pBHR-PcatPtrc-ald(opt)。pBHR-PcatPtrc-ald(opt)克隆使用ScaI和BspEI的限制酶切作图证实预期的4,883和1,704bp片段。为了去除质粒携带的cat启动子(Pcat)区域,质粒pBHR-PcatPtrc-ald(opt)用BspEI和AatII进行消化,且将6,172bp片段凝胶纯化。T-BspEIAatII和B-BspEIAatII(分别为SEQ ID NOs:89和90)在包含50mM NaCl、10mM Tris-HCl和10mM MgCl2(pH7.9)的溶液中混合至100μM的终浓度,且通过于75℃温育5分钟并缓慢冷却至室温进行杂交。使杂交的寡核苷酸与6,172bp片段连接,从而产生pBHR-Ptrc-ald(opt)。
表达丁醇脱氢酶(yqhD)的大肠杆菌菌株的构建。大肠杆菌包含鉴定为1,3-丙二醇脱氢酶(美国专利号6,514,733)的天然基因(yqhD)。yqhD基因与梭菌属中的基因adhB具有40%的同一性,所述adhB基因是可能的NADH依赖性丁醇脱氢酶。yqhD基因在大肠杆菌菌株MG1655 1.6yqhD::Cm(WO 2004/033646)中使用λRed技术(Datsenko和Wanner,Proc.Natl.Acad.Sci.U.S.A.97:6640(2000)),置于葡糖异构酶启动子1.6GI(SEQ ID NO:91)变体的组成型表达控制下。类似地,天然启动子用1.5GI启动子(WO 2003/089621)(SEQ ID NO:92)替换,从而产生菌株MG1655 1.5GI-yqhD::Cm,因此用1.5GI启动子替换MG 1655 1.6yqhD::Cm的1.6GI启动子。
P1溶解产物由MG1655 1.5GI yqhD::Cm制备,且将盒移动至表达菌株MG1655(DE3)和BL21(DE3)(Invitrogen),从而分别产生MG1655(DE3)1.5GI-yqhD::Cm和BL21(DE3)1.5GI-yqhD::Cm,所述MG1655(DE3)由大肠杆菌菌株MG1655和λDE3溶原化试剂盒(Invitrogen)制备。
来自重组大肠杆菌的1-丁醇生产的证实。大肠杆菌菌株MG1655(DE3)1.5GI-yqhD::Cm用质粒pTrc99a-E-C-H-T和pBHR T7-ald转化,以产生菌株MG1655(DE3)1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHRT7-ald。2个独立分离物最初在包含50μg/mL卡那霉素和100μg/mL羧苄青霉素的LB培养基中生长。细胞用于接种包含15、50和150mL的TM3a/葡萄糖培养基(含合适的抗生素)的摇瓶(约175mL总体积),以分别代表高、中和低氧条件。TM3a/葡萄糖培养基包含(每升):10g葡萄糖、13.6g KH2PO4、2.0g柠檬酸一水化物、3.0g(NH4)2SO4、2.0g MgSO4·7H2O、0.2g CaCl2·2H2O、0.33g柠檬酸铁铵、1.0mg盐酸硫胺素、0.50g酵母提取物、和10mL痕量元素溶液,用NH4OH调节至pH 6.8。所述痕量元素溶液包含:柠檬酸·H2O(4.0g/L)、MnSO4·H2O(3.0g/L)、NaCl(1.0g/L)、FeSO4·7H2O(0.10g/L)、CoCl2·6H2O(0.10g/L)、ZnSO4·7H2O(0.10g/L)、CuSO4·5H2O(0.010g/L)、H3BO3(0.010g/L)、和Na2MoO4·2H2O(0.010g/L)。瓶以≤0.01单位的起始OD600接种,且于34℃伴随300rpm振荡温育。包含15和50mL培养基的瓶盖上通气盖;包含150mL的瓶盖上非通气盖,以使气体交换最小化。添加IPTG至0.04mM的终浓度;添加时瓶的OD600≥0.4单位。
诱导后约15小时,如一般方法部分中所述,等分试样的液体培养基通过具有折射率(RI)检测的HPLC(Shodex Sugar SH1011柱),和具有火焰离子化检测(FID)的GC(Varian CP-WAX 58(FFAP)CB柱,25m×0.25mm id×0.2μm膜厚度)分析1-丁醇含量。1-丁醇测定结果在表6中给出。
                    表6
通过大肠杆菌菌株MG1655(DE3)1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/ pBHR T7-ald的1-丁醇生产。
  菌株   O2水平   1-丁醇,mM   摩尔得率,%
  MG1655 a   高   0.11   0.2
MG1655 b 0.12 0.2
  MG1655 a   中   0.13   0.3
  MG1655 b   中   0.13   0.2
  MG1655 a   低   0.15   0.4
  MG1655 b   低   0.18   0.5
-值由HPLC分析测定。
-菌株后缀“a”和“b”指示独立分离物。
MG 1655(DE3)1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR T7-ald的2个独立分离物以相同方式测试1-丁醇生产,只是除了培养基包含5g/L酵母提取物。结果显示于表7中。
                        表7
通过大肠杆菌菌株MG1655(DE3)1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/ pBHR T7-ald的1-丁醇生产。
  菌株   O2水平   1-丁醇,mM   摩尔得率,%
  MG1655 a   高   -   -
  MG1655 b   高   -   -
  MG1655 a   中   0.08   0.1
  MG1655 b   中   0.06   0.1
  MG1655 a   低   0.14   0.3
  MG1655 b   低   0.14   0.3
-定量值由HPLC分析测定。
-“-”=未检测。
-菌株后缀“a”和“b”指示独立分离物。
大肠杆菌BL21(DE3)1.5GI-yqhD::Cm用质粒pTrc99a-E-C-H-T和pBHR T7-ald转化,以产生菌株BL21(DE3)1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR T7-ald。如上所述准确地测试2个独立分离物的1-丁醇生产。结果在表8和9中给出。
                     表8
           通过大肠杆菌菌株BL21(DE3)
1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR T7-ald的1-丁醇生产。
  菌株   O2水平   1-丁醇,mM   摩尔得率,%
  DE a   高   +   +
DE b - -
  DE a   中   0.80   1.4
  DE b   中   0.77   1.4
  DE a   低   0.06   0.2
  DE b   低   0.07   0.2
-定量值由HPLC分析测定。
-“-”指示未检测。
“+”指示通过GC的阳性、定性鉴定,所述GC具有比HPLC更低的检出限。
-菌株后缀“a”和“b”指示独立分离物。
                    表9
         通过大肠杆菌菌株BL21(DE3)
1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR T7-ald的1-丁醇生产。
  菌株   O2水平   1-丁醇,mM   摩尔得率,%
  DE a   高   +   +
DE b + +
  DE a   中   0.92   1.7
  DE b   中   1.03   1.9
  DE a   低   +   +
  DE b   低   +   +
-定量值由HPLC分析测定。
-“-”指示未检测。
“+”指示通过GC的阳性、定性鉴定,所述GC具有比HPLC更低的检出限。
-菌株后缀“a”和“b”指示独立分离物。
大肠杆菌菌株MG 1655 1.5GI-yqhD::Cm用质粒pTrc99a-E-C-H-T和pBHR-Ptrc-ald(opt)转化,以产生菌株MG1655 1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR-Ptrc-ald(opt)。2个分离物最初在包含50μg/mL卡那霉素和100μg/mL羧苄青霉素的LB培养基中生长。细胞用于接种包含50和150mL的TM3a/葡萄糖培养基(含合适的抗生素)的摇瓶(约175mL总体积)。瓶以≤0.04单位的起始OD550接种,且如上所述温育,含和不含诱导。添加IPTG至0.4mM的终浓度;添加时瓶的OD550为0.6-1.2单位。在这种情况下,诱导对于1-丁醇途径基因表达不是必要的,这是因为IPTG诱导型启动子的泄漏程度和1.5GI启动子的组成型性质;然而,诱导提供广泛范围的表达。
诱导后约15小时,如上所述,等分试样的液体培养基通过具有火焰离子化检测的GC分析1-丁醇含量。结果在表10中给出。对于重组大肠杆菌菌株,在所有情况下产生1-丁醇;在分开的实验中,野生型大肠杆菌菌株显示不产生可检测的1-丁醇(数据未显示)。
                      表10
      通过大肠杆菌菌株MG1655 1.5GI-yqhD::Cm/
pTrc99a-E-C-H-T/pBHR-Ptrc-ald(opt)的1-丁醇生产。
  菌株   O2水平   1-丁醇,mM   IPTG诱导
  MG1655 a   中   0.14   否
  MG1655 b   中   0.14   否
  MG1655 a   中   0.03   是
  MG1655 b   中   0.07   是
  MG1655 a   低   0.04   否
  MG1655 b   低   0.04   否
  MG1655 a   低   0.02   是
  MG1655 b   低   0.03   是
-菌株后缀“a”和“b”指示独立分离物。
                    实施例14
        使用重组枯草芽孢杆菌从葡萄糖生产1-丁醇
这个实施例描述了1-丁醇在枯草芽孢杆菌中的生产。编码6种酶活性的1-生物合成途径的6种基因分成2个操纵子用于表达。将该途径的前3种基因(thl、hbd和crt)整合到枯草芽孢杆菌BE1010染色体内(Payne和Jackson,J.Bacteriol.173:2278-2282(1991))。将后3种基因(EgTER、ald和bdhB)克隆到表达质粒内,且转化到携带整合的1-丁醇基因的芽孢杆菌属菌株内。
除非上下文另有说明,这个实施例中描述的克隆引物通过其SEQID NO:参考表4,且测序和PCR筛选引物通过其SEQ ID NO:参考表5。
整合质粒。质粒pFP988是芽孢杆菌属整合载体,它包含来自pBR322的大肠杆菌复制子、用于在大肠杆菌中进行选择的氨苄青霉素抗生素标记和与芽孢杆菌属染色体中sacB基因同源的2个部分,所述2个同源部分通过同源重组指导载体和间插序列整合。在sacB同源区之间是可以指导克隆的基因合成和分泌的Pamy启动子和信号序列,His-标签和作为用于芽孢杆菌属的选择标记的红霉素。Pamy启动子和信号序列来自解淀粉芽孢杆菌α淀粉酶。启动子区还包含lacO序列用于通过lacI阻抑蛋白调节表达。pFP988(6509bp)序列作为SEQ ID NO:79给出。
因为1-丁醇途径基因将在细胞质中表达,所以缺失淀粉酶信号序列。质粒pFP988使用引物Pamy/lacO F和Pamy/lacO R进行扩增,从而产生包含Pamy/lacO启动子的317bp(0.3kbp)产物。Pamy/lacO F引物的5′末端掺入BsrGI限制位点随后为EcoRI位点。Pamy/lacO R引物的5′末端掺入BsrGI限制位点随后为PmeI限制位点。将PCR产物TOPO克隆到pCR4Blunt-TOPO内,从而产生pCR4Blunt-TOPO-Pamy/lacO。质粒DNA由过夜培养物制备,且提交用于由M13正向和M13反向引物(分别为SEQ ID NOs:45和46)测序,以确保没有突变已引入启动子内。pCR4Blunt-TOPO-Pamy/lacO克隆用BsrGI进行消化,且将0.3kbp产物凝胶纯化。载体pFP988用BsrGI进行消化,从而导致产生来自5′sacB同源区的11bp缺失以及Pamy/lacO启动子和信号序列和His标签的去除。将6kbp BsrGI消化的载体凝胶纯化且与Pamy/lacO BsrGI插入片段连接。所得到的质粒用引物Pamy SeqF2和Pamy SeqR筛选,以确定启动子的方向。正确克隆使Pamy/lacO启动子恢复其原始方向且命名为pFP988Dss。
具有基因thl-crt的盒通过SOE(重叠延伸剪接)来构建。基因使用模板pUC19dss::Operonl进行扩增。thl引物是Top TF和Bot TR,从而扩增0.9kbp产物。crt引物是Top CF和Bot CR,从而扩增1.3kbp产物。2种基因通过SOE用使用引物Top TF和Bot CR的PCR扩增进行连接,从而产生2.1kbp产物,将所述2.1kbp产物TOPO克隆到pCR4Blunt-TOPO内,从而产生pCR4Blunt-TOPO-T-C。提交克隆用于测序以证实序列。质粒pCR4Blunt-TOPO-T-C用BstEII和PmeI进行消化,从而释放凝胶纯化的2.1kbp片段。插入片段用克列诺聚合酶处理,以使BstEII位点变成平头的。载体pFP988Dss用PmeI进行消化,且用牛小肠碱性磷酸酶(New England BioLabs)处理以防止自身连接。使2.1kbp thl-crt片段与消化的pFP988Dss连接,且转化到大肠杆菌Top10细胞内。转化体通过PCR扩增筛选0.7kbp产物,所述PCR扩增使用Pamy SeqF2和N7SeqR2,正确产物命名为pFP988Dss-T-C。
thl-crt盒的构建在2种基因之间产生独特的SalI和SpeI位点。为了向盒中添加hbd基因,从pCR4Blunt-TOPO-hbd亚克隆作为0.9kbpSalI/SpeI片段的hbd基因。载体pFP988Dss-T-C用SalI和SpeI进行消化,且将8kbp载体片段凝胶纯化。使载体与hbd插入片段连接,且转化到大肠杆菌Top10细胞内。转化体通过PCR扩增筛选3.0kbp片段,所述PCR扩增使用Pamy SeqF和N3SeqF3。所得到的质粒命名为pFP988Dss-T-H-C。
Pamy启动子随后替换为来自质粒pMUTIN4的Pspac启动子(Vagner等人,Microbiol.144:3097-3104(1998))。Pspac启动子从pMUTIN4使用引物Spac F和Spac R作为0.4kbp产物扩增,且TOPO克隆到pCR4Blunt-TOPO内。转化体通过PCR扩增筛选0.5kbp插入片段的存在,所述PCR扩增使用M13正向和M13反向引物。提交阳性克隆用于由相同引物测序。质粒pCR4Blunt-TOPO-Pspac用SmaI和XhoI进行消化,且将0.3kbp片段凝胶纯化。载体pFP988Dss-T-H-C用SmaI和XhoI进行消化,且9kbp载体通过凝胶纯化来分离。使消化的载体与Pspac插入片段连接,且转化到大肠杆菌Top10细胞内。转化体通过使用引物SpacF Seq和N7SeqR2的PCR扩增进行筛选。阳性克隆产生0.7kbp产物。质粒DNA由阳性克隆制备,且通过用引物SpacF Seq和N3SeqF2的PCR扩增进一步筛选。阳性克隆产生3kbpPCR产物,且命名为pFP988DssPspac-T-H-C。
整合到枯草芽孢杆菌BE1010内,以形成包含外源thl、hbd和crt 基因的枯草芽孢杆菌ΔsacB::T-H-C::erm#28。枯草芽孢杆菌BE1010的感受态细胞如Doyle等人,J.Bacteriol.144:957-966(1980)中所述进行制备。感受态细胞通过离心进行收获,且将细胞沉淀重悬浮于小体积的细胞上清液中。向1体积感受态细胞中加入2体积SPII-EGTA培养基(Methods for General and Molecular Bacteriology,P.Gerhardt等人,Eds,American Society for Microbiology,Washington,DC(1994))。将等分试样的0.3mL细胞分配到试管内,且将质粒pFP988DssPspac-T-H-C加入管中。细胞于37℃伴随振荡温育30分钟,这之后向每个管中加入0.1mL 10%酵母提取物,且将细胞再温育60分钟。转化体在LB红霉素板上进行铺平板用于选择,其中使用双重琼脂覆层法(Methods for General and Molecular Bacteriology,同上)。转化体通过使用引物Pamy SeqF和N5SeqF3的PCR扩增进行最初筛选。扩增预期2kbp PCR产物的阳性克隆通过PCR扩增进一步筛选。如果盒插入染色体内已经由双交换事件发生,那么引物组sacB Up和N7SeqR2以及引物组sacB Dn和N4SeqR3将分别扩增1.7kbp和a 2.7kbp产物。阳性克隆被鉴定且命名为枯草芽孢杆菌ΔsacB::T-H-C::erm#28。
EgTER、ald和bdhB基因的质粒表达。剩余的3种1-丁醇基因由质粒pHT01(MoBitec)表达。质粒pHT01是经由θ机制复制的芽孢杆菌属-大肠杆菌穿梭载体。克隆的蛋白质由与lacO序列融合的GroEL启动子表达。lacO下游是来自gstB基因的有效RBS,随后为MCS。ald基因通过PCR用引物AF BamHI和AR Aat2使用pUC19dHS-ald-bdhB(在实施例9中描述)作为模板进行扩增,从而产生1.4kbp产物。将产物TOPO克隆到pCR4-TOPO内且转化到大肠杆菌Top10细胞内。转化体用M13正向和M13反向引物进行筛选。阳性克隆扩增1.6kbp产物。提交克隆用于由下述引物测序:M13正向和M13反向、N31SeqF2、N31SeqF3、N32SeqR2、N32SeqR3和N32SeqR4。质粒命名为pCR4TOPO-B/A-ald。
载体pHT01和质粒pCR4TOPO-B/A-ald都用BamHI和AatII进行消化。使7.9kbp载体片段与1.4kbp ald片段连接在一起,以产生pHT01-ald。将连接物转化到大肠杆菌Top10细胞内,且转化体通过PCR扩增筛选1.3kbp产物,所述PCR扩增使用引物N31SeqF1和HT R。
为了给pHT01载体添加途径的最后2个步骤,设计2种克隆方案。对于2种方案,EgTER和bdhB通过SOE一起扩增。随后,将EgTER-bdh片段克隆到pHT01-ald内,从而产生pHT01-ald-EB,或克隆到pCR4-TOPO-B/A-ald内,从而产生pCR4-TOPO-ald-EB。随后将来自TOPO载体的ald-EgTer-bdhB片段克隆到pHT01内,从而产生pHT01-AEB。
EgTER-bdhB片段使用引物正向1(E)和反向2(B)进行PCR扩增,其中使用作为SEQ ID NO:208给出的模板DNA。将所得到的2.5kbp PCR产物TOPO克隆到pCR4Blunt-TOPO内,从而产生pCR4Blunt-TOPO-E-B。将TOPO反应物转化到大肠杆菌Top10细胞内。菌落用M13正向和M13反向引物通过PCR扩增进行筛选。阳性克隆产生2.6kbp产物。提交pCR4Blunt-TOPO-E-B的克隆用于由下述引物测序:M 13正向和反向,N62SeqF2、N62SeqF3、N62SeqF4、N63SeqR1、N63SeqR2、N63SeqR3、N11Seq F1和N11Seq F2、N12SeqR1和N12SeqR2。
质粒pCR4Blunt-TOPO-E-B用HpaI和AatII进行消化,以释放2.4kbp片段。E-B片段用克列诺聚合酶处理以使末端变成平头的,且随后进行凝胶纯化。质粒pHT01-ald用AatII进行消化,且用克列诺聚合酶处理,以使末端变成平头的。载体随后用牛小肠碱性磷酸酶处理且进行凝胶纯化。使E-B片段与线性化载体pHT01-ald连接,转化到大肠杆菌Top10细胞内,且在包含100μg/mL氨苄青霉素的LB板上选择。转化体通过使用引物N3SeqF1和N63SeqR1进行PCR扩增以产生2.4kbp产物来筛选。将所得到的质粒pHT01-ald-EB转化到JM103细胞recA+大肠杆菌菌株内。由recA+菌株制备的质粒形成比recA-菌株更多的多聚体。使用质粒多聚体而不是单体的枯草芽孢杆菌转化更有效(Methods for General and Molecular Bacteriology,同上)。质粒DNA由JM103制备且转化到感受态枯草芽孢杆菌ΔsacB::T-H-C::erm#28内,从而形成菌株枯草芽孢杆菌ΔsacB::T-H-C::erm #28/pHT01-ald-EB。感受态细胞如先前所述进行制备和转化。转化体在包含5μg/mL氯霉素的LB板上进行选择,且通过菌落PCR筛选1.3kbp产物,所述菌落PCR使用引物N31SeqF1和N63SeqR4。
在可替代的克隆策略中,pCR4Blunt-TOPO-E-B用HpaI和AatII进行消化,从而释放凝胶纯化的2.4kbp片段。质粒pCR4-TOPO-B/A-ald用HpaI和AatII进行消化,且将5.4kbp载体片段凝胶纯化。使来自pCR4-TOPO-B/A-ald的载体片段与HpaI-AatII E-B片段连接,从而产生pCR4-TOPO-ald-EB。将连接物转化到大肠杆菌Top10细胞内,且所得到的转化体通过PCR扩增筛选2.1kbp产物,所述PCR扩增使用引物N11SeqF2和N63SeqR4。质粒pCR4-TOPO-ald-EB用BamHI和AatII和SphI进行消化。BamHI/AatII消化释放凝胶纯化的3.9kbp ald-EB片段。SphI消化的目的是将剩余载体切割成较小片段,从而使得它不能在凝胶上与ald-EB插入片段共迁移。载体pHT01用BamHI和AatII进行消化,且将7.9kbp载体片段凝胶纯化。使载体与ald-EB插入片段连接,以形成质粒pHT01-AEB,且转化到大肠杆菌Top10细胞内。菌落通过PCR扩增筛选1.5kbp产物,所述PCR扩增使用引物N62SeqF4和HT R。制备质粒且转化到JM 103内。质粒DNA由JM 103制备且转化到感受态枯草芽孢杆菌ΔsacB::T-H-C::erm #28内,从而形成菌株枯草芽孢杆菌ΔsacB::T-H-C::erm #28/pHT01-AEB。感受态BE1010细胞如先前所述进行制备和转化。芽孢杆菌属转化体通过PCR扩增筛选1.3kbp产物,所述PCR扩增使用引物N31SeqF1和N63SeqR4。
来自重组枯草芽孢杆菌的1-丁醇生产的证实
每种菌株枯草芽孢杆菌ΔsacB::T-H-C::erm #28/pHT01-ald-EB和枯草芽孢杆菌ΔsacB::T-H-C::erm #28/pHT01-AEB的3个独立分离物接种到包含15mL培养基的摇瓶(约175mL总体积)内。也包括缺乏外源1-丁醇、6基因途径的枯草芽孢杆菌BE1010菌株作为阴性对照。培养基包含(每升):10mL 1M(NH4)2SO4;5mL 1M磷酸钾缓冲液,pH 7.0;100mL 1M MOPS/KOH缓冲液,pH 7.0;20mL 1M L-谷氨酸,钾盐;10g葡萄糖;各10mL 5g/L L-甲硫氨酸、L-色氨酸和L-赖氨酸;酵母提取物和酪蛋白氨基酸各0.1g;20mL金属混合物;以及合适的抗生素(5mg氯霉素和红霉素用于重组菌株)。金属混合物包含200mMMgCl2、70mM CaCl2、5mM MnCl2、0.1mM FeCl3、0.1mM ZnCl2、0.2mM盐酸硫胺素、172μM CuSO4、253μM CoCl2、和242μMNa2MoO4。瓶以≤0.1单位的起始OD600接种,用非通气盖密封,且于37℃伴随约200rpm振荡温育。
接种后约24小时,如一般方法部分中所述,等分试样的液体培养基通过具有折射率(RI)检测的HPLC(Shodex Sugar SH1011柱),和具有火焰离子化检测(FID)GC(Varian CP-WAX 58(FFAP)CB柱,0.25mm×0.2μm×25m)分析1-丁醇含量。1-丁醇测定结果在表11中给出。
                     表11
通过菌株枯草芽孢杆菌ΔsacB::T-H-C::erm #28/pHT01-ald-EB和枯草芽
   孢杆菌ΔsacB::T-H-C::erm #28/pHT01-AEB的1-丁醇生产。
  菌株   1-丁醇,HPLC RI峰面积   1-丁醇,mM*
  BE1010对照   未检出   未检出
  pHT01-ald-EB a   4629   0.19
  pHT01-ald-EB b   3969   未测定
  pHT01-ald-EB c   4306   未测定
  pHT01-AEB a   4929   0.16
  pHT01-AEB b   3984   未测定
  pHT01-AEB c   3970   未测定
*通过GC测定的浓度。
-菌株后缀“a”、“b”和“c”指示独立分离物。
                    实施例15
通过重组大肠杆菌从葡萄糖或蔗糖生产1-丁醇。
为了赋予大肠杆菌MG1655使用蔗糖作为碳源和能源用于1-丁醇生产的能力,将来自质粒pScrI(下文描述)的蔗糖利用基因簇(cscBKA)亚克隆到这种生物中的pBHR-Ptrc-ald(opt)(在实施例13中描述)内。蔗糖利用基因(cscA、cscK和cscB)编码作为SEQ ID NO:157给出的蔗糖水解酶(CscA),作为SEQ ID NO:158给出的D-果糖激酶(CscK),和作为SEQ ID NO:159给出的蔗糖透性酶(CscB)。为了允许来自其天然启动子的3种基因的组成型表达,调节该基因簇的蔗糖特异性阻抑基因cscR不存在于构建体中。
蔗糖利用基因簇cscBKA在质粒pBHR-Ptrc-ald(opt)中的克隆和 表达。作为SEQ ID NO:156给出的蔗糖利用基因簇cscBKA,从蔗糖利用大肠杆菌菌株基因组DNA中分离,所述蔗糖利用大肠杆菌菌株来源于大肠杆菌菌株ATCC 13281。基因组DNA用BamHI和EcoRI消化完全。从琼脂糖凝胶分离平均大小约4kbp的片段,与质粒pLitmus28(New England Biolabs,Beverly,MA)连接,随后用BamHI和EcoRI进行消化。将所得到的DNA转化到超感受态(ultracompetent)大肠杆菌TOP10F’(Invitrogen,Carlsbad,CA)内。转化体在包含1%蔗糖和100μg/mL氨苄青霉素的MacConkey琼脂板上进行铺平板,且筛选紫色菌落。从紫色转化体中分离质粒DNA,且使用下述引物测序:M13正向(SEQ ID NO:45)、M13反向(SEQ ID NO:46)、scr1(SEQID NO:160)、scr2(SEQ ID NO:161)、scr3(SEQ ID NO:162)和scr4(SEQ ID NO:163)。包含cscB、cscK和cscA(cscBKA)基因的质粒命名为pScr1。
质粒pScrI用XhoI进行消化,且用DNA聚合酶的克列诺片段处理,以产生平端。质粒随后用AgeI进行消化,且将4,179bp cscBKA基因簇片段凝胶纯化。质粒pBHR-Ptrc-ald(opt)如实施例13中所述制备,且用AgeI和NaeI进行消化。将所得到的6,003bp pBHR-Ptrc-ald(opt)片段凝胶纯化。使cscBKA片段与pBHR-Ptrc-ald(opt)连接,从而产生pBHR-Ptrc-ald(opt)-cscAKB。将质粒pBHR-Ptrc-ald(opt)-cscAKB转化到大肠杆菌NovaXG电转化感受态细胞(Novagen,Madison,WI)内,且蔗糖利用通过使转化体在包含2%蔗糖和25μg/mL卡那霉素的McConkey琼脂板上铺平板来证实。在pBHR-Ptrc-ald(opt)-cscAKB构建体中,蔗糖利用基因作为独立片段以cscA、cscK和cscB的顺序克隆到Ptrc-ald(opt)下游。
可替代地,将蔗糖利用基因以相反方向克隆到pBHR-Ptrc-ald(opt)中。质粒pBHR-Ptrc-ald(opt)用ScaI和AgeI进行消化,且将5,971bppBHR-Ptrc-ald(opt)片段凝胶纯化。使如上所述制备的4,179bp cscBKA片段与pBHR-Ptrc-ald(opt)片段连接,从而产生pBHR-Ptrc-ald(opt)-cscBKA。将质粒pBHR-Ptrc-ald(opt)-cscBKA转化到大肠杆菌NovaXG电转化感受态细胞(Novagen,Madison,WI)内,且蔗糖利用通过使转化体在包含2%蔗糖和25μg/mL卡那霉素的McConkey琼脂板上铺平板来证实。在pBHR-Ptrc-ald(opt)-cscBKA构建体中,蔗糖利用基因作为独立片段以cscB、cscK和cscA的顺序克隆到Ptrc-ald(opt)下游。
使用重组大肠杆菌从葡萄糖或蔗糖的1-丁醇生产的证实。大肠杆菌菌株MG1655 1.5GI-yqhD::Cm(在实施例13中描述)用质粒pTrc99a-E-C-H-T(如实施例13中所述制备)和pBHR-Ptrc-ald(opt)-cscAKB或pBHR-Ptrc-ald(opt)-cscBKA转化,以产生2种菌株,MG1655 1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR-Ptrc-ald(opt)-cscAKB#9和MG16551.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR-Ptrc-ald(opt)-cscBKA#1。2种菌株的起子培养物通过使细胞在包含25μg/mL卡那霉素和100μg/mL羧苄青霉素的LB培养基中培养细胞来制备。如实施例13中所述,这些细胞随后用于接种包含50、70和150mL的TM3a/葡萄糖培养基(含合适的抗生素)的摇瓶(约175mL总体积),以分别代表高、中和低氧条件。在包含100μg/mL羧苄青霉素的TM3a/葡萄糖培养基中生长的第3种菌株大肠杆菌MG 1655/pScr1,用作阴性对照。对于每种菌株,相同组的瓶用TM3a/蔗糖培养基(含合适的抗生素)制备。TM3a/蔗糖培养基等同于TM3a/葡萄糖培养基,只是除了蔗糖(10g/L)替换葡萄糖。瓶以≤0.03单位的起始OD550接种,且如实施例13中所述温育。除了阴性对照瓶,当培养物达到OD5500.2-1.8单位时,向瓶中加入IPTG(终浓度0.04mM)。当培养物OD550增加至少3倍时收获细胞。
接种后约24小时,如一般方法部分中所述,等分试样的液体培养基通过具有折射率(RI)检测的HPLC(Shodex Sugar SH1011柱),和具有火焰离子化检测(FID)的GC(HP-INNOWax柱,30m×0.53mm id,1μm膜厚度)分析1-丁醇含量。
在含葡萄糖和蔗糖的培养基中生长后培养物中的1-丁醇浓度分别在表12和表13中给出。包含1-丁醇生物合成途径的2种重组大肠杆菌菌株在所有氧条件下从葡萄糖和蔗糖产生1-丁醇,而阴性对照菌株不产生可检测的1-丁醇。
                      表12
          通过重组大肠杆菌菌株MG1655
1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR-Ptrc-ald(opt)-cscAKB #9和
    MG1655 1.5GI-yqhD::Cm/pTrc99a-E-C-H-T/pBHR-Ptrc-ald(opt)
              -cscBKA#1从葡萄糖的1-丁醇生产
  菌株   O2水平   1-丁醇,mM   摩尔得率,%
  cscBKA#1   高   0.01   0.03
  cscBKA#1   中   0.20   0.43
  cscBKA#1   低   0.07   0.21
cscAKB#9 0.01 0.02
  cscAKB#9   中   0.17   0.35
  cscAKB#9   低   0.04   0.12
  pScr1   高   未检出   来检出
  pScr1   中   未检出   未检出
  pScr1   低   未检出   未检出
                         表13
       通过重组大肠杆菌菌株从蔗糖的1-丁醇生产。
  菌株   O2水平   1-丁醇,mM   摩尔得率,%
  cscBKA#1   高   0.02   0.10
  cscBKA#1   中   0.02   0.11
  cscBKA#1   低   0.01   0.09
  cscAKB#9   高   0.03   0.11
  cscAKB#9   中   0.03   0.15
  cscAKB#9   低   0.02   0.10
pScr1 未检出 未检出
  pScr1   中   未检出   未检出
  pScr1   低   未检出   未检出
                    实施例16
        使用重组枯草芽孢杆菌从蔗糖生产1-丁醇。
这个实施例描述了使用重组枯草芽孢杆菌从蔗糖生产1-丁醇。基本上如实施例14中所述检查枯草芽孢杆菌菌株ΔsacB::T-H-C::erm#28/pHT01-ald-EB(实施例14)的2个独立分离物的1-丁醇生产。将菌株接种到包含20mL或100mL培养基的摇瓶(约175mL总体积)内,以分别模拟高和低氧条件。培养基A完全如实施例14中所述,只是除了葡萄糖替换为5g/L蔗糖。培养基B等同于实施例13中所述的TM3a/葡萄糖培养基,只是除了葡萄糖替换为10g/L蔗糖,且培养基补加了(每L)各10mL 5g/L L-甲硫氨酸、L-色氨酸和L-赖氨酸溶液。瓶以≤0.1单位的起始OD550接种,盖上通气盖,且于34℃伴随300rpm振荡温育。
接种后约24小时,如一般方法部分中所述,等分试样的液体培养基通过具有FID检测的GC(HP-INNOWax柱,30m×0.53mm id,1.0μm膜厚度)分析1-丁醇含量。1-丁醇测定结果在表14中给出。包含1-丁醇生物合成途径的重组芽孢杆菌属菌株在高和低氧条件下在2种培养基中都产生可检测水平的1-丁醇。
                        表14
通过枯草芽孢杆菌菌株ΔsacB::T-H-C::erm#28/pHT01-ald-EB从蔗糖生
                       产1-丁醇
  菌株   培养基   O2水平   1-BuOH,mM1,2
  无   A   不可用   未检出
pHT01-ald-EB a A +
  pHT01-ald-EB b   A   高   +
  pHT01-ald-EB a   A   低   0.01
  pHT01-ald-EB b   A   低   0.01
  无   不可用   未检出
  pHT01-ald-EB a   B   高   +
pHT01-ald-EB b B +
  pHT01-ald-EB a   B   低   0.04
  pHT01-ald-EB b   B   低   0.03
1通过GC测定的浓度。
2“+”指示1-丁醇的定性存在。
菌株后缀“a”和“b”指示独立分离物。
                    实施例17
使用重组啤酒糖酵母从葡萄糖和蔗糖生产1-丁醇
这个实施例描述了1-丁醇在啤酒糖酵母中的生产。在编码催化1-丁醇生物合成途径步骤的酶的6种基因中,将5种克隆到3种相容性酵母2微米(2μ)质粒内,且在啤酒糖酵母中共表达。“上游途径”定义为由乙酰辅酶A乙酰转移酶(thlA,硫解酶)、3-羟丁酰辅酶A脱氢酶(hbd)和巴豆酸酶(crt)催化的前3个酶促步骤。下游途径定义为该途径的第4个(丁酰辅酶A脱氢酶,ter)和第5个(丁醛脱氢酶,ald)酶促步骤。1-丁醇途径的最后1个酶促步骤由醇脱氢酶催化,所述醇脱氢酶可以由内源酵母基因例如adhI和adhII编码。
基因在酵母中的表达一般需要启动子,随后为目的基因,和转录终止子。许多组成型酵母启动子在构建用于编码1-丁醇生物合成途径的基因的表达盒中使用,包括FBA、GPD和GPM启动子。一些诱导型启动子例如GAL1、GAL10、CUP1也在中间质粒构建中使用,但不在最终显示菌株中使用。使用几种转录终止子,包括FBAt、GPDt、GPMt、ERG10t、和GAL1t。将编码1-丁醇生物合成途径的基因首先亚克隆到酵母质粒内,侧面为启动子和终止子,这产生关于每种基因的表达盒。如下文所述表达盒通过缺口修复克隆任选与单个载体组合。例如,将编码上游途径的3种基因盒亚克隆到酵母2μ质粒内。ter和ald基因各自在2μ质粒中个别表达。所有3种质粒在单个酵母菌株中的共转化导致功能性1-丁醇生物合成途径。可替代地,编码启动子、基因和终止子的几个DNA片段通过缺口修复克隆在单个载体中直接组合。
关于在啤酒糖酵母中构建质粒和菌株的方法。基本酵母分子生物学规程包括转化、细胞生长、基因表达、缺口修复重组等,在Methodsin Enzymology,第194卷,Guide to Yeast Genetics and Molecular andCell Biology(Part A,2004,Christine Guthrie和Gerald R.Fink(Eds.),Elsevier Academic Press,San Diego,CA)中描述。
这个实施例中使用的质粒是大肠杆菌-啤酒糖酵母穿梭载体pRS423、pRS424、pRS425、和pRS426(美国典型培养物保藏中心,Rockville,MD),所述穿梭载体包含大肠杆菌复制起点(例如,pMB1)、酵母2μ复制起点、和用于营养选择的标记。关于这4种载体的选择标记为His3(载体pRS423)、Trp1(载体pRS424)、Leu2(载体pRS425)和Ura3(载体pRS426)。这些载体允许在大肠杆菌和酵母菌株中的菌株繁殖。酵母单倍体菌株BY4741(MATa his3Δ1 leu2Δ0 metl5Δ0 ura3Δ0)(Research Genetics,Huntsville,AL,也可从ATCC 201388获得)和二倍体菌株By4743(MATa/alpha his3Δ1/his3Δ1 leu2Δ0/leu2Δ0lys2Δ0/LYS2 MET15/met15Δ0 ura3A0/ura3Δ0)(Research Genetics,Huntsville,AL,也可从ATCC 201390获得)用作基因克隆和表达的宿主。关于编码1-丁醇生物合成途径酶的基因的表达载体的构建通过在大肠杆菌中的标准分子克隆技术,或通过在酵母中的缺口修复重组法来进行。
缺口修复克隆方法利用酵母中的高效同源重组。一般地,酵母载体DNA进行消化(例如,在其多克隆位点中)以在其序列中产生“缺口”。产生在5′和3′末端包含≥21bp序列的许多目的插入DNA,所述插入DNA与彼此且与载体DNA的5′和3′末端连续重叠。例如,为了构建关于“基因X”的酵母表达载体,选择酵母启动子和酵母终止子用于表达盒。启动子和终止子从酵母基因组DNA扩增,且基因X从其来源生物进行PCR扩增,或从包含基因X序列的克隆载体获得。在线性化载体的5′末端和启动子序列之间、在启动子和基因X之间、在基因X和终止子序列之间、以及在终止子和线性化载体的3′末端之间存在至少21bp重叠序列。随后将“缺口的”载体和插入DNAs共转化到酵母菌株内,且在SD极限撤除成分培养基上铺平板,且选择菌落用于培养物生长和小量制备(mini preps)质粒DNAs。正确插入片段组合的存在可以通过PCR作图来证实。从酵母分离的质粒DNA(浓度通常低)随后可以转化到大肠杆菌菌株例如TOP10内,随后为小量制备和限制酶切作图,以进一步验证质粒构建体。最后构建体可以通过序列分析来验证。阳性质粒的酵母转化体在SD培养基中生长用于执行酶测定,以表征由目的基因表达的酶的活性。
酵母培养物在YPD复合培养基或包含葡萄糖(SD培养基)和合适的化合物混合物的合成极限撤除成分培养基中生长,所述化合物混合物允许质粒上的营养选择标记互补(Methods in Enzymology,第194卷,Guide to Yeast Genetics and Molecular and Cell Biology,2004,PartA,第13-15页)。SD撤除成分培养基中的糖组分为2%葡萄糖。对于1-丁醇生产,酵母培养物也在含2%蔗糖的合成极限撤除成分培养基(SS培养基)中生长。
对于酶活性分析,将每种菌株的单个菌落在包含SD极限撤除成分培养基的新鲜板上划线,且于30℃温育2天。这个板上的细胞用于接种125mL摇瓶中的20mL SD撤除成分培养基,且于30℃伴随250rpm振荡生长过夜。测量过夜培养物的光密度(OD600),且在1.0L摇瓶中的250mL相同培养基中将培养物稀释至OD600=0.1,且于30℃伴随250rpm振荡生长至OD6000.8-1.0。细胞随后通过在2000x g下离心10分钟进行收获,且重悬浮于20mL 50mM Tris-HCl缓冲液,pH 8.5中。酶测定如上所述进行。
用于thlA和hbd共表达的质粒pNY102的构建。构建许多双重表达载体用于共表达thlA和hbd基因。啤酒糖酵母ERG10基因是thlA基因的功能性直向同源物。最初,ERG10和hbd的双重载体使用酵母GAL1-GAL10反向双启动子、GAL1终止子(GAL1t)和ERG10终止子(ERG10t)来构建。ERG10基因-ERG10t DNA片段从啤酒糖酵母菌株BY4743基因组DNA进行PCR扩增,其中使用引物OT731(SEQ IDNO:164)和OT732(SEQ ID NO:165)。酵母GAL1-GAL10反向启动子也通过PCR从BY4743基因组DNA扩增,其中使用引物OT733(SEQ ID NO:166)和OT734(SEQ ID NO:167)。hbd基因从大肠杆菌质粒pTrc99a-E-C-H-T(在实施例13中描述)扩增,其中使用PCR引物OT735(SEQ ID NO:168)和OT736(SEQ ID NO:169)。GAL1t从BY4743基因组DNA扩增,其中使用引物OT737(SEQ ID NO:170)和OT738(SEQ ID NO:171)。因此获得的4种PCR片段erg10-ERG10t、GAL1-GAL10启动子、hbd和GAL1t,在每个相邻PCR片段之间具有约25bp重叠序列。GAL1t和ERG10-ERG10t片段各自包含与酵母载体pRS425的约25bp重叠序列。为了通过缺口修复重组装配这些序列,将DNA片段连同载体pRS425共转化到酵母菌株BY4741内,所述载体pRS425用BamHI和HindIII酶进行消化。菌落选自SD-Leu极限板,且具有插入片段的克隆通过PCR扩增鉴定。新质粒命名为pNY6(pRS425.ERG10t-erg10-GAL10-GAL1-hbd-GAL1t)。进一步的证实通过限制酶切作图来进行。
通过将质粒pNY6转化到啤酒糖酵母BY4741内制备的酵母菌株BY4741(pNY6)显示良好的Hbd活性,但无硫解酶活性。由于缺乏硫解酶活性,ERG10基因通过缺口修复重组替换为thlA基因。thlA基因通过PCR从大肠杆菌载体pTrc99a-E-C-H-T扩增,其中使用引物OT797(SEQ ID NO:172)和OT798(SEQ ID NO:173),所述引物OT797添加ShpI限制位点,所述引物OT798添加AscI限制位点。质粒pNY6用SphI和PstI限制酶进行消化,凝胶纯化,且连同thlA的PCR产物一起共转化到酵母BY4741内。由于thlA的PCR产物和消化的pNY6之间的30bp重叠序列,thlA基因重组到pNY6内的GAL10启动子和ERG10t终止子之间。这产生质粒pNY7(pRS425.ERG10t-th1A-GAL10-GAL1-hbd-GAL1t),所述质粒pNY7通过PCR和限制酶切作图来验证。
在基于缺口修复重组的后续克隆步骤中,pNY7中的GAL10启动子替换为CUP1启动子,且GAL1启动子替换为强GPD启动子。这种质粒pNY10(pRS425.ERG10t-thlA-CUP1-GPD-hbd-GAL1t)允许在铜诱导型启动子CUP1下表达thlA基因,和在GPD启动子下表达hbd基因。CUP1启动子序列从酵母BY4743基因组DNA进行PCR扩增,其中使用引物OT806(SEQ ID NO:174)和OT807(SEQ ID NO:175)。GPD启动子从BY4743基因组DNA扩增,其中使用引物OT808(SEQID NO:176)和OT809(SEQ ID NO:177)。CUP1和GPD启动子的PCR产物与用NcoI和SphI限制酶消化的pNY7质粒组合。从这个缺口修复克隆步骤构建质粒pNY10,所述质粒pNY10通过PCR和限制酶切作图来验证。包含pNY10的酵母BY4741菌株具有Hbd活性,但无ThlA活性。与GAL1启动子控制的Hbd活性相比较,在GPD启动子下的Hbd活性显著改善(1.8U/mg对0.40U/mg)。测序分析揭示pNY10中的thlA基因在3′末端附近具有1个碱基缺失,这导致截短的蛋白质。这解释了菌株中硫解酶活性的缺乏。
质粒pNY12用正确的thlA基因序列构建。thlA基因通过用SphI和AscI消化从载体pTrc99a-E-C-H-T中切割。FBA1启动子从BY4743基因组DNA进行PCR扩增,其中使用引物OT799(SEQ ID NO:178)和OT761(SEQ ID NO:179),且用SalI和SphI限制酶进行消化。将thlA基因片段和FBA1启动子片段连接到质粒pNY10内的AscI和SalI位点上,从而产生质粒pNY12(pRS425.ERG10t-thlA-FBA1),所述质粒pNY12通过限制酶切作图来验证。将pNY12转化到酵母菌株BY4741内,且所得到的转化体显示1.66U/mg的ThlA活性。
将来自pNY12的FBA1启动子-thlA基因片段重新亚克隆到pNY10内。pNY10载体用AscI限制酶切割,且与从质粒pNY12分离的AscI消化的FBA1启动子-thlA基因片段连接。这产生了具有2个可能的插入方向的新质粒。选择具有以相反方向彼此相邻定位的FBA1和GPD启动子的克隆,且这种质粒命名为pNY102。pNY102(pRS425.ERG10t-thlA-FBA1-GPD-hbd-GAL1t)通过限制酶切作图来验证。菌株DPD5206通过将pNY102转化到酵母菌株BY4741内来制备。DPD5206的ThlA活性为1.24U/mg,且Hbd活性为0.76U/mg。
用于crt表达的质粒pNY11的构建。crt基因表达盒通过在酵母在使用缺口修复重组,将GPM1启动子、crt基因、和GPM1t终止子组合到载体pRS426内来构建。GPM1启动子从酵母BY4743基因组DNA进行PCR扩增,其中使用引物OT803(SEQ ID NO:180)和OT804(SEQ ID NO:181)。crt基因从大肠杆菌质粒pTrc99a-E-C-H-T使用PCR引物OT785(SEQ ID NO:182)和OT786(SEQ ID NO:183)扩增。GPM1t终止子从酵母BY4743基因组DNA进行PCR扩增,其中使用OT787(SEQ ID NO:184)和OT805(SEQ ID NO:185)。酵母载体pRS426用BamHI和HindIII进行消化,且进行凝胶纯化。这种DNA与GPM1启动子、crt基因和GPM1终止子的PCR产物共转化到酵母BY4741感受态细胞内。具有正确插入片段的克隆通过PCR和限制酶切作图来验证,且所得到的酵母菌株BY4741(pNY11:pRS426-GPM1-crt-GPM1t)具有85U/mg的Crt活性。
用于thlA、hbd和crt共表达的质粒pNY103的构建。关于上游1-丁醇途径酶的共表达,将来自pNY11的crt基因盒亚克隆到质粒pNY102内,以产生hbd、thlA和crt表达载体。包含GPM1启动子、crt基因和GPM1终止子的2,347bp DNA片段用SacI和NotI限制酶从质粒pNY11中切割,且克隆到载体pNY102内,所述pNY102用NtoI进行消化且用SacI部分消化,从而产生表达载体pNY103(pRS425.ERG10t-thlA-FBA1-GPD-hbd-GAL1t-GPM1t-crt-GPM1)。通过用HindIII消化证实pNY103中存在所有3种盒后,将质粒转化到酵母BY4743细胞内,且转化的酵母菌株命名为DPD5200。当在标准条件下生长时,DPD5200显示分别为0.49U/mg、0.21U/mg和23.0U/mg的ThlA、Hbd和Crt酶活性。
用于ald表达的质粒pNY8的构建。编码Ter蛋白质(SEQ ID NO:187)、命名为tery的密码子最优化基因(SEQ ID NO:186),和编码Ald蛋白质(SEQ ID NO:189)、命名为aldy的密码子最优化基因(SEQ ID NO:188),使用啤酒糖酵母的优选密码子来合成。包含密码子最优化的ter基因的质粒pTERy和包含密码子最优化的ald基因的pALDy由DNA2.0(Palo Alto,CA)制备。
为了装配pNY8(pRS426.GPD-ald-GPDt),包括GPD启动子的PCR产物(由引物OT800(SEQ ID NO:190)和OT758(SEQ ID NO:191),以及BY4743基因组DNA合成),通过用NcoI和SfiI从pALDy中切割的aldy基因片段(SEQ ID NO:188),和GPD终止子的PCR产物(由引物OT754(SEQ ID NO:192)和OT755(SEQ ID NO:193),以及BY4743基因组DNA合成)的3种插入片段,经由缺口修复重组克隆与BamHI、HindIII消化的pRS426载体重组。酵母BY4741转化克隆通过PCR作图进行分析。因此构建的新质粒pNY8通过限制酶切作图进一步证实。分析包含pNY8的酵母BY4741转化体的Ald活性,且针对丁酰辅酶A的比活性为约0.07U/mg。
用于ter表达的质粒pNY9和pNY13的构建。通过缺口修复克隆将密码子最优化的tery基因克隆到在FBA1启动子控制下的载体pRS426内。FBA1启动子从酵母BY4743基因组DNA进行PCR扩增,其中使用引物OT760(SEQ ID NO:194)和OT792(SEQ ID NO:195)。tery基因通过SphI和NotI限制酶消化质粒pTERy来获得,这导致作为SEQ ID NO:186给出的片段。FBA1终止子的PCR片段通过PCR从酵母BY4743基因组DNA产生,其中使用引物OT791(SEQ ID NO:196)和OT765(SEQ ID NO:197)。3种DNA片段-FBA1启动子、ter基因和FBA1终止子,与BamHI、HindIII消化的pRS426载体组合,且通过缺口修复重组转化到酵母BY4741内。所得到的质粒pNY9(pRS426-FBA1-tery-FBA1t)通过PCR作图以及限制酶切消化来证实。pNY9的酵母BY4741转化体产生0.26U/mg的Ter活性。
为了制备最终的1-丁醇生物合成途径菌株,必需构建包含几种质粒的酵母表达菌株,所述质粒各自具有独特的营养选择标记。因为亲本载体pRS426包含Ura选择标记,所以将ter表达盒亚克隆到包含His3标记的载体pRS423内。包含FBA1-tery-FBA1t盒的3.2kb片段通过用SacI和XhoI限制酶消化从质粒pNY9分离,且连接到用这2种相同酶切割的载体pRS423内。新质粒pNY13(pRS423-FBA1-tery-FBAIt)通过限制酶切消化进行作图。将pNY13转化到BY4741菌株内,且在SD-His培养基中培养转化体,从而产生具有0.19U/mg Ter活性的菌株。
包含1-丁醇生物合成途径基因用于证实1-丁醇生产的酵母菌株的 构建。如上所述,酵母菌株DPD5200通过将质粒pNY103转化到啤酒糖酵母菌株BY4743内来构建,所述质粒pNY103允许thlA、hbd和crt基因共表达。DPD5200的酵母感受态细胞如上所述进行制备,且将质粒pNY8和pNY13共转化到DPD5200内,从而产生菌株DPD5213。DPD5213允许1-丁醇生物合成途径中的5种基因thlA、hbd、crt、ter和ald同时组成型表达。菌株DPD5212(用空质粒,pRS425和pRS426转化的啤酒糖酵母菌株BY4743)用作阴性对照。菌株DPD5213的4个独立分离物在SD-Ura,-Leu,-His撤除成分极限培养基中在2%葡萄糖或2%蔗糖的存在下生长,以允许所有3种质粒的生长互补。DPD5212的单个分离物在合适培养基中类似地生长。
为了证实通过需氧培养物的1-丁醇生产,将每种菌株的单个菌落在新鲜琼脂板上划线,所述新鲜琼脂板包含SD极限撤除成分生长培养基(包含2%葡萄糖)或SS极限撤除成分生长培养基(包含2%蔗糖),且于30℃温育2天。来自这些板的细胞用于接种125mL塑料摇瓶中的20mL极限撤除成分培养基(SD或SS),且于30℃伴随250rpm振荡生长过夜。测量过夜培养物的光密度(OD600),且在125mL摇瓶中的25mL相同培养基中将培养物稀释至OD6000.1,且于30℃伴随250rpm振荡生长。
如一般方法部分中所述,在24小时和48小时时取出等分试样的培养物用于1-丁醇生产的GC分析(HP-INNOWax柱,30m×0.53mmid,1μm膜厚度),其具有FID检测。GC分析结果在表15中给出。
                         表15
  通过啤酒糖酵母菌株DPD5213从葡萄糖和蔗糖的1-丁醇生产
  菌株1   糖   24小时时的1-丁醇,mg/L2   48小时时的1-丁醇,mg/L2
  DPD5212   葡萄糖   未检出   未检出
  DPD5213 a   葡萄糖   0.4   0.5
  DPD5213 b   葡萄糖   0.9   0.2
  DPD5213 c   葡萄糖   1.0   0.6
  DPD5213 d   葡萄糖   0.8   0.3
  DPD5212   蔗糖   未检出   未检出
  DPD5213 a   蔗糖   未检出   1.7
  DPD5213 b   蔗糖   未检出   1.3
  DPD5213 c   蔗糖   0.2   1.5
  DPD5213 d   蔗糖   0.6   0.9
1独立分离物由a-d指示。
2通过GC测定的浓度。
                    实施例18(预示的)
1-丁醇生物合成途径在植物乳杆菌中的表达
这个预示的实施例的目的是描述如何在植物乳杆菌中表达1-丁醇生物合成途径。将编码6种酶活性的1-丁醇途径的6种基因分成2个操纵子用于表达。使用由Hols等人(Appl.Environ.Microbiol.60:1401-1413(1994))描述的方法,通过同源重组将该途径的前3种基因(thl、hbd和crt,分别编码乙酰辅酶A乙酰转移酶、3-羟丁酰辅酶A脱氢酶和巴豆酸酶)整合到植物乳杆菌染色体内。将后3种基因(EgTER、ald和bdhB,分别编码丁酰辅酶A脱氢酶、丁醛脱氢酶和丁醇脱氢酶)克隆到表达质粒内,且转化到携带整合的上游途径1-丁醇基因的乳杆菌属菌株内。乳杆菌属在MRS培养基(DifcoLaboratories,Detroit,MI)中于37℃生长。如由Moreira等人(BMCMicrobiol.5:15(2005))所述,从植物乳杆菌分离染色体DNA。
整合。通过同源重组将在合成的P11启动子(Rud等人,Microbiology 152:1011-1019(2006))控制下的thl-hbd-crt盒整合到植物乳杆菌ATCC BAA-793(NCIMB 8826)染色体内的ldhL1基因座上。为了构建ldhL整合靶向载体,来自植物乳杆菌(GenbankNC_004567)与ldhL具有同源性的DNA片段进行PCR扩增,其中使用引物LDH EcoRV F(SEQ ID NO:198)和LDH AatIIR(SEQ ID NO:199)。将1986bp PCR片段克隆到pCR4Blunt-TOPO内且测序。pCR4Blunt-TOPO-ldhL1克隆用EcoRV和AatII进行消化,从而释放凝胶纯化的1982bp ldhL1片段。在实施例14中描述的整合载体pFP988用HindIII进行消化,且用克列诺DNA聚合酶处理,以使末端变成平头的。线性化质粒随后用AatII进行消化,且将2931bp载体片段凝胶纯化。使EcoRV/AatII ldhL1片段与pFP988载体片段连接,且转化到大肠杆菌Top10细胞内。转化体在包含氨苄青霉素(100μg/mL)的LB琼脂板上进行选择,且通过菌落PCR进行筛选,以证实pFP988-1dhL的构建。
为了给整合DNA添加选择标记,Cm基因与其启动子从pC194(Genbank NC_002013)进行PCR扩增,其中使用引物Cm F(SEQ IDNO:200)和Cm R(SEQ ID NO:201),从而扩增836bp PCR产物。将扩增子克隆到pCR4Blunt-TOPO内,且转化到大肠杆菌Top10细胞内,从而产生pCR4Blunt-TOPO-Cm。测序以证实通过PCR没有引入错误后,Cm盒作为828bp MluI/SwaI片段从pCR4Blunt-TOPO-Cm中消化,且进行凝胶纯化。包含ldhL同源性的整合载体pFP988-ldhL用MluI和SwaI进行消化,且将4740bp载体片段凝胶纯化。Cm盒片段与pFP988-ldhL载体连接,从而生成pFP988-DldhL::Cm。
最后来自实施例14中描述的pFP988Dss-T-H-C的thl-hbd-crt盒进行修饰,以用合成的P 11启动子替换淀粉酶启动子。随后,将整个操纵子移至pFP988-DldhL::Cm内。P11启动子通过与引物P11F(SEQ IDNO:202)和P11 R(SEQ ID NO:203)的寡核苷酸退火构建。退火的寡核苷酸在6%Ultra PAGE凝胶(Embi Tec,San Diego,CA)上进行凝胶纯化。质粒pFP988Dss-T-H-C用XhoI和SmaI进行消化,且将9kbp载体片段凝胶纯化。使分离的P11片段与消化的pFP988Dss-T-H-C连接,以产生pFP988-P11-T-H-C。质粒pFP988-P11-T-H-C用XhoI和BamHI进行消化,且将3034bp P11-T-H-C片段凝胶纯化。pFP988-DldhL::Cm用XhoI和BamHI进行消化,且分离5558bp载体片段。使上游途径操纵子与整合载体连接,以产生pFP988-DldhL-P11-THC::Cm。
将pFP988-DldhL-P11-THC::Cm整合到植物乳杆菌BAA-793内, 以形成包含外源thl、hbd和crt基因的植物乳杆菌ΔldhL1::T-H-C::Cm。植物乳杆菌的电转化感受态细胞如Aukrust,T.W.,等人(In:Electroporation Protocols for Microorganisms;Nickoloff,J.A.,Ed.;Methods in Molecular Biology,第47卷;Humana Press,Inc.,Totowa,NJ,1995,第201-208页)所述制备。如Aukrust等人同上所述,电穿孔后,细胞在MRSSM培养基(补加了0.5M蔗糖和0.1M MgCl2的MRS培养基)于37℃不伴随振荡过度生长(outgrow)2小时。为了选择将电穿孔的细胞在包含氯霉素(10μg/mL)的MRS板上进行铺平板且于37℃温育。转化体通过菌落PCR扩增进行最初筛选以证实整合,且最初的阳性克隆随后通过PCR扩增使用一组引物更严格地筛选。
EgTER、ald和bdhB基因的质粒表达。剩余3种1-丁醇基因在植物乳杆菌ldhL启动子(Ferain等人,J.Bacteriol.176:596-601(1994))控制下,由质粒pTRKH3(O′Sullivan DJ和Klaenhammer TR,Gene 137:227-231(1993))表达。ldhL启动子从植物乳杆菌ATCC BAA-793基因组进行PCR扩增,其中使用引物PldhL F(SEQ ID NO:204)和PldhL R(SEQ ID NO:205)。将369bp PCR产物克隆到pCR4Blunt-TOPO内且测序。所得到的质粒pCR4Blunt-TOPO-PldhL用SacI和BamHI进行消化,从而释放359bp PldhL片段。
实施例14中描述的pHT01-ald-EB用SacI和BamHI进行消化,且通过凝胶纯化回收10503bp载体片段。使PldhL片段和载体连接,从而产生pHT01-Pldhl-ald-EB。
为了亚克隆ldhL启动子-ald-EgTER-bdh盒,用MluI消化pHT01-Pldhl-ald-EB,且用克列诺DNA聚合酶处理末端。线性化的载体用SalI进行消化,且将包含PldhL-AEB片段的4270bp片段凝胶纯化。质粒pTRKH3用SalI和EcoRV进行消化,且使凝胶纯化的载体片段与PldhL-AEB片段连接。将连接混合物转化到大肠杆菌Top 10细胞内,且将转化体在包含红霉素(150mg/L)的脑心浸液(Brain HeartInfusion)(BHI,Difco Laboratories,Detroit,MI)板上进行铺平板。转化体通过PCR进行筛选,以证实pTRKH3-ald-E-B的构建。如上所述通过电穿孔将表达质粒pTRKH3-ald-E-B转化到植物乳杆菌ΔldhL1::T-H-C::Cm内。
将包含pTRKH3-ald-E-B的植物乳杆菌ΔldhL1::T-H-C::Cm接种到250mL摇瓶内,所述摇瓶包含50mL MRS培养基加红霉素(10μg/mL),且于37℃不伴随振荡生长18-24小时。18-24小时后,如一般方法部分中所述,通过HPLC或GC分析检测1-丁醇。
                 实施例19(预示的)
        1-丁醇生物合成途径在粪肠球菌中的表达
这个预示的实施例的目的是描述如何在粪肠球菌中表达1-丁醇生物合成途径。粪肠球菌菌株V583的全基因组序列已得到公开(Paulsen等人,Science 299:2071-2074(2003)),所述菌株V583在这个实施例中作为宿主菌株用于表达1-丁醇生物合成途径。质粒pTRKH3(O′Sullivan DJ和Klaenhammer TR,Gene 137:227-231(1993))-大肠杆菌/革兰氏阳性穿梭载体用于表达在1个操纵子中的1-丁醇途径的6种基因(thlA、hbd、crt、EgTER、ald、bdhB)。pTRKH3包含大肠杆菌质粒p15A复制起点和pAMβ1复制子,以及2种抗生素抗性选择标记-四环素抗性和红霉素抗性。四环素抗性只在大肠杆菌中表达,而红霉素抗性在大肠杆菌和革兰氏阳性细菌中均表达。质粒pAMβ1衍生物可以在粪肠球菌中复制(Poyart等人,FEMS Microbiol.Lett.156:193-198(1997))。已通过乳链菌肽在多种革兰氏阳性细菌包括粪肠球菌中用于有效控制基因表达的诱导型nisA启动子(PnisA)(Eichenbaum等人,Appl.Environ.Microbiol.64:2763-2769(1998)),用于控制编码1-丁醇生物合成途径酶的6种所需基因的表达。
包含nisA启动子(Chandrapati等人,Mol.Microbiol.46(2):467-477(2002))的线性DNA片段(215bp)从乳酸乳球菌(Lactococcus lactis)基因组DNA进行PCR扩增,其中使用引物F-PnisA(EcoRV)(SEQ IDNO:206)和R-PnisA(PmeI BamHI)(SEQ ID NO:207)。215bp PCR片段用EcoRV和BamHI进行消化,且将所得到的PnisA片段凝胶纯化。质粒pTRKH3用EcoRV和BamHI进行消化,且将载体片段凝胶纯化。使线性化的pTRKH3与PnisA片段连接。通过电穿孔将连接混合物转化到大肠杆菌Top10细胞内,且转化体于37℃在包含红霉素(25μg/mL)的LB琼脂板上过夜生长后进行选择。转化体随后通过菌落PCR使用引物F-PnisA(EcoRV)和R-PnisA(BamHI)进行筛选,以证实pTRKH3-PnisA的正确克隆。
质粒pTRKH3-PnisA用PmeI和BamHI进行消化,且将载体凝胶纯化。质粒pHTO1-ald-EgTER-bdhB如实施例14中所述进行构建并用SmaI和BamHI进行消化,且将2,973bp ald-EgTER-bdhB片段凝胶纯化。将2,973bp ald-EgTER-bdhB连接到pTRKH3-PnisA载体内的PmeI和BamHI位点上。通过电穿孔将连接混合物转化到大肠杆菌Top10细胞内,且转化体于37℃在包含红霉素(25μg/mL)的LB琼脂板上过夜温育后进行选择。转化体随后通过菌落PCR用引物ald正向引物N27F1(SEQ ID NO:31)和bdhB反向引物N65(SEQ ID NO:44)进行筛选。所得到的质粒命名为pTRKH3-PnisA-ald-EgTER-bdhB(=pTRKH3-A-E-B)。
质粒pTRKH3-A-E-B从转化体中进行纯化,且用于进一步将剩余基因(thlA、hbd、crt)克隆到位于bdhB基因下游的BamHI位点内。质粒pTRKH3-A-E-B用BamHI进行消化,且用DNA聚合酶的克列诺片段处理,以产生平端。质粒pFP988Dss-thlA-hbd-crt(=pFP988Dss-T-H-C)如实施例14中所述进行构建,且用SmaI和BamHI进行消化。所得到的2,973bp thlA-hbd-crt片段用DNA聚合酶的克列诺片段处理,以产生平端,且进行凝胶纯化。使2,973bpthlA-hbd-crt片段与线性化的pTRKH3-A-E-B连接。通过电穿孔将连接混合物转化到大肠杆菌Top10细胞内,且转化体于37℃在包含红霉素(25μg/mL)的LB琼脂板上过夜生长后进行选择。转化体随后通过菌落PCR用引物thlA正向引物N7(SEQ ID NO:21)和crt反向引物N4(SEQ ID NO:18)进行筛选。所得到的质粒命名为pTRKH3-PnisA-ald-EgTER-bdhB-thlA-hbd-crt(=pTRKH3-A-E-B-T-H-C)。质粒pTRKH3-A-E-B-T-H-C由大肠杆菌转化体制备,且使用本领域已知方法(Aukrust,T.W.,等人In:ElectroporationProtocols for Microorganisms;Nickoloff,J.A.,Ed.;Methods in MolecularBiology,第47卷;Humana Press,Inc.,Totowa,NJ.,1995,第217-226页),通过电穿孔转化到电转化感受态粪肠球菌V583细胞内,从而导致产生粪肠球菌V583/pTRKH3-A-E-B-T-H-C。
通过电穿孔将第2种质粒转化到粪肠球菌V583/pTRKH3-A-E-B-T-H-C内,所述第2种质粒包含nisA调节基因、nisR和nisK、add9壮观霉素抗性基因、以及pSH71复制起点。包含pSH71复制起点的质粒与pAMβ1衍生物在粪肠球菌中是相容的(Eichenbaum等人,同上)。双重药物抗性转化体在包含红霉素(25μg/mL)和壮观霉素(100μg/mL)的LB琼脂板上进行选择。
所得到的粪肠球菌菌株V583B具有2种质粒,即表达质粒(pTRKH3-A-E-B-T-H-C)和调节质粒(pSH71-nisRK),被接种到包含50mL Todd-Hewitt液体培养基的250mL摇瓶内,所述Todd-Hewitt液体培养基补加了酵母提取物(0.2%)(Fischetti等人,J.Exp.Med.161:1384-1401(1985))、乳链菌肽(20μg/mL)(Eichenbaum等人,同上)、红霉素(25μg/mL)、和壮观霉素(100μg/mL)。瓶于37℃不伴随振荡温育18-24小时,这之后,如一般方法部分中所述,通过HPLC或GC分析测量1-丁醇生产。
序列表
<110>E.I.du Pont de Nemours and Co.
<120>4碳醇的发酵生产
<130>CL3241 PCT
<160>208
<170>PatentIn version 3.3
<210>1
<211>1179
<212>DNA
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>1
atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct   60
cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa  120
gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt  180
ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca  240
gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa  300
attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga  360
gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt  420
gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca  480
gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt  540
gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt  600
cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga  660
tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca  720
gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt  780
gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca   840
gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt   900
gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca   960
gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat  1020
ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact  1080
cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt  1140
ggcggacaag gaacagcaat attgctagaa aagtgctag                         1179
<210>2
<211>392
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>2
Met Lys Glu Val Val Ile Ala Ser Ala Val Arg Thr Ala Ile Gly Ser
1               5                   10                  15
Tyr Gly Lys Ser Leu Lys Asp Val Pro Ala Val Asp Leu Gly Ala Thr
            20                  25                  30
Ala Ile Lys Glu Ala Val Lys Lys Ala Gly Ile Lys Pro Glu Asp Val
        35                  40                  45
Asn Glu Val Ile Leu Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn
    50                  55                  60
Pro Ala Arg Gln Ala Ser Phe Lys Ala Gly Leu Pro Val Glu Ile Pro
65                  70                  75                  80
Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Thr Val Ser
                85                  90                  95
Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Val Ile Ile Ala
            100                 105                 110
Gly Gly Met Glu Asn Met Ser Arg Ala Pro Tyr Leu Ala Asn Asn Ala
        115                 120                 125
Arg Trp Gly Tyr Arg Met Gly Asn Ala Lys Phe Val Asp Glu Met Ile
    130                 135                 140
Thr Asp Gly Leu Trp Asp Ala Phe Asn Asp Tyr His Met Gly Ile Thr
145                 150                 155                 160
Ala Glu Asn Ile Ala Glu Arg Trp Asn Ile Ser Arg Glu Glu Gln Asp
                165                 170                 175
Glu Phe Ala Leu Ala Ser Gln Lys Lys Ala Glu Glu Ala Ile Lys Ser
            180                 185                 190
Gly Gln Phe Lys Asp Glu Ile Val Pro Val Val Ile Lys Gly Arg Lys
        195                 200                 205
Gly Glu Thr Val Val Asp Thr Asp Glu His Pro Arg Phe Gly Ser Thr
    210                 215                 220
Ile Glu Gly Leu Ala Lys Leu Lys Pro Ala Phe Lys Lys Asp Gly Thr
225                 230                 235                 240
Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Cys Ala Ala Val Leu
                245                 250                 255
Val Ile Met Ser Ala Glu Lys Ala Lys Glu Leu Gly Val Lys Pro Leu
            260                 265                 270
Ala Lys Ile Val Ser Tyr Gly Ser Ala Gly Val Asp Pro Ala Ile Met
        275                 280                 285
Gly Tyr Gly Pro Phe Tyr Ala Thr Lys Ala Ala Ile Glu Lys Ala Gly
    290                 295                 300
Trp Thr Val Asp Glu Leu Asp Leu Ile Glu Ser Asn Glu Ala Phe Ala
305                 310                 315                 320
Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Asn Lys
                325                 330                 335
Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala
            340                 345                 350
Ser Gly Ala Arg Ile Leu Val Thr Leu Val His Ala Met Gln Lys Arg
        355                 360                 365
Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly
    370                 375                 380
Thr Ala Ile Leu Leu Glu Lys Cys
385                 390
<210>3
<211>1179
<212>DNA
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>3
atgagagatg tagtaatagt aagtgctgta agaactgcaa taggagcata tggaaaaaca     60
ttaaaggatg tacctgcaac agagttagga gctatagtaa taaaggaagc tgtaagaaga    120
gctaatataa atccaaatga gattaatgaa gttatttttg gaaatgtact tcaagctgga  180
ttaggccaaa acccagcaag acaagcagca gtaaaagcag gattaccttt agaaacacct  240
gcgtttacaa tcaataaggt ttgtggttca ggtttaagat ctataagttt agcagctcaa  300
attataaaag ctggagatgc tgataccatt gtagtaggtg gtatggaaaa tatgtctaga  360
tcaccatatt tgattaacaa tcagagatgg ggtcaaagaa tgggagatag tgaattagtt  420
gatgaaatga taaaggatgg tttgtgggat gcatttaatg gatatcatat gggagtaact  480
gcagaaaata ttgcagaaca atggaatata acaagagaag agcaagatga attttcactt  540
atgtcacaac aaaaagctga aaaagccatt aaaaatggag aatttaagga tgaaatagtt  600
cctgtattaa taaagactaa aaaaggtgaa atagtctttg atcaagatga atttcctaga  660
ttcggaaaca ctattgaagc attaagaaaa cttaaaccta ttttcaagga aaatggtact  720
gttacagcag gtaatgcatc cggattaaat gatggagctg cagcactagt aataatgagc  780
gctgataaag ctaacgctct cggaataaaa ccacttgcta agattacttc ttacggatca  840
tatggggtag atccatcaat aatgggatat ggagcttttt atgcaactaa agctgcctta  900
gataaaatta atttaaaacc tgaagactta gatttaattg aagctaacga ggcatatgct  960
tctcaaagta tagcagtaac tagagattta aatttagata tgagtaaagt taatgttaat 1020
ggtggagcta tagcacttgg acatccaata ggtgcatctg gtgcacgtat tttagtaaca 1080
ttactatacg ctatgcaaaa aagagattca aaaaaaggtc ttgctactct atgtattggt 1140
ggaggtcagg gaacagctct cgtagttgaa agagactaa                        1179
<210>4
<211>392
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>4
Met Arg Asp Val Val Ile Val Ser Ala Val Arg Thr Ala Ile Gly Ala
1               5                   10                  15
Tyr Gly Lys Thr Leu Lys Asp Val Pro Ala Thr Glu Leu Gly Ala Ile
            20                  25                  30
Val Ile Lys Glu Ala Val Arg Arg Ala Asn Ile Asn Pro Asn Glu Ile
        35                  40                  45
Asn Glu Val Ile Phe Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn
    50                  55                  60
Pro Ala Arg Gln Ala Ala Val Lys Ala Gly Leu Pro Leu Glu Thr Pro
65                  70                  75                  80
Ala Phe Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Ser Ile Ser
                85                  90                  95
Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Thr Ile Val Val
            100                 105                 110
Gly Gly Met Glu Asn Met Ser Arg Ser Pro Tyr Leu Ile Asn Asn Gln
        115                 120                 125
Arg Trp Gly Gln Arg Met Gly Asp Ser Glu Leu Val Asp Glu Met Ile
    130                 135                 140
Lys Asp Gly Leu Trp Asp Ala Phe Asn Gly Tyr His Met Gly Val Thr
145                 150                 155                 160
Ala Glu Asn Ile Ala Glu Gln Trp Asn Ile Thr Arg Glu Glu Gln Asp
                165                 170                 175
Glu Phe Ser Leu Met Ser Gln Gln Lys Ala Glu Lys Ala Ile Lys Asn
            180                 185                 190
Gly Glu Phe Lys Asp Glu Ile Val Pro Val Leu Ile Lys Thr Lys Lys
        195                 200                 205
Gly Glu Ile Val Phe Asp Gln Asp Glu Phe Pro Arg Phe Gly Asn Thr
    210                 215                 220
Ile Glu Ala Leu Arg Lys Leu Lys Pro Ile Phe Lys Glu Asn Gly Thr
225                 230                 235                 240
Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Gly Ala Ala Ala Leu
                245                 250                 255
Val Ile Met Ser Ala Asp Lys Ala Asn Ala Leu Gly Ile Lys Pro Leu
            260                 265                 270
Ala Lys Ile Thr Ser Tyr Gly Ser Tyr Gly Val Asp Pro Ser Ile Met
        275                 280                 285
Gly Tyr Gly Ala Phe Tyr Ala Thr Lys Ala Ala Leu Asp Lys Ile Asn
    290                 295                 300
Leu Lys Pro Glu Asp Leu Asp Leu Ile Glu Ala Asn Glu Ala Tyr Ala
305                 310                 315                 320
Ser Gln Ser Ile Ala Val Thr Arg Asp Leu Asn Leu Asp Met Ser Lys
                325                 330                 335
Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala
            340                 345                 350
Ser Gly Ala Arg Ile Leu Val Thr Leu Leu Tyr Ala Met Gln Lys Arg
        355                 360                 365
Asp Ser Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly
    370                 375                 380
Thr Ala Leu Val Val Glu Arg Asp
385                 390
<210>5
<211>849
<212>DNA
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>5
atgaaaaagg tatgtgttat aggtgcaggt actatgggtt caggaattgc tcaggcattt   60
gcagctaaag gatttgaagt agtattaaga gatattaaag atgaatttgt tgatagagga  120
ttagatttta tcaataaaaa tctttctaaa ttagttaaaa aaggaaagat agaagaagct  180
actaaagttg aaatcttaac tagaatttcc ggaacagttg accttaatat ggcagctgat  240
tgcgatttag ttatagaagc agctgttgaa agaatggata ttaaaaagca gatttttgct  300
gacttagaca atatatgcaa gccagaaaca attcttgcat caaatacatc atcactttca  360
ataacagaag tggcatcagc aactaaaaga cctgataagg ttataggtat gcatttcttt  420
aatccagctc ctgttatgaa gcttgtagag gtaataagag gaatagctac atcacaagaa  480
acttttgatg cagttaaaga gacatctata gcaataggaa aagatcctgt agaagtagca  540
gaagcaccag gatttgttgt aaatagaata ttaataccaa tgattaatga agcagttggt  600
atattagcag aaggaatagc ttcagtagaa gacatagata aagctatgaa acttggagct  660
aatcacccaa tgggaccatt agaattaggt gattttatag gtcttgatat atgtcttgct  720
ataatggatg ttttatactc agaaactgga gattctaagt atagaccaca tacattactt  780
aagaagtatg taagagcagg atggcttgga agaaaatcag gaaaaggttt ctacgattat 840
tcaaaataa                                                         849
<210>6
<211>282
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>6
Met Lys Lys Val Cys Val Ile Gly Ala Gly Thr Met Gly Ser Gly Ile
1               5                   10                  15
Ala Gln Ala Phe Ala Ala Lys Gly Phe Glu Val Val Leu Arg Asp Ile
            20                  25                  30
Lys Asp Glu Phe Val Asp Arg Gly Leu Asp Phe Ile Asn Lys Asn Leu
        35                  40                  45
Ser Lys Leu Val Lys Lys Gly Lys Ile Glu Glu Ala Thr Lys Val Glu
    50 5                 5                  60
Ile Leu Thr Arg Ile Ser Gly Thr Val Asp Leu Asn Met Ala Ala Asp
65                  70                  75                  80
Cys Asp Leu Val Ile Glu Ala Ala Val Glu Arg Met Asp Ile Lys Lys
                85                  90                  95
Gln Ile Phe Ala Asp Leu Asp Asn Ile Cys Lys Pro Glu Thr Ile Leu
            100                 105                 110
Ala Ser Asn Thr Ser Ser Leu Ser Ile Thr Glu Val Ala Ser Ala Thr
        115                 120                 125
Lys Arg Pro Asp Lys Val Ile Gly Met His Phe Phe Asn Pro Ala Pro
    130                 135                 140
Val Met Lys Leu Val Glu Val Ile Arg Gly Ile Ala Thr Ser Gln Glu
145                 150                 155                 160
Thr Phe Asp Ala Val Lys Glu Thr Ser Ile Ala Ile Gly Lys Asp Pro
                165                 170                 175
Val Glu Val Ala Glu Ala Pro Gly Phe Val Val Asn Arg Ile Leu Ile
            180                 185                 190
Pro Met Ile Asn Glu Ala Val Gly Ile Leu Ala Glu Gly Ile Ala Ser
        195                 200                 205
Val Glu Asp Ile Asp Lys Ala Met Lys Leu Gly Ala Asn His Pro Met
    210                 215                 220
Gly Pro Leu Glu Leu Gly Asp Phe Ile Gly Leu Asp Ile Cys Leu Ala
225                 230                 235                 240
Ile Met Asp Val Leu Tyr Ser Glu Thr Gly Asp Ser Lys Tyr Arg Pro
                245                 250                 255
His Thr Leu Leu Lys Lys Tyr Val Arg Ala Gly Trp Leu Gly Arg Lys
            260                 265                 270
Ser Gly Lys Gly Phe Tyr Asp Tyr Ser Lys
        275                 280
<210>7
<211>786
<212>DNA
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>7
atggaactaa acaatgtcat ccttgaaaag gaaggtaaag ttgctgtagt taccattaac   60
agacctaaag cattaaatgc gttaaatagt gatacactaa aagaaatgga ttatgttata  120
ggtgaaattg aaaatgatag cgaagtactt gcagtaattt taactggagc aggagaaaaa  180
tcatttgtag caggagcaga tatttctgag atgaaggaaa tgaataccat tgaaggtaga  240
aaattcggga tacttggaaa taaagtgttt agaagattag aacttcttga aaagcctgta  300
atagcagctg ttaatggttt tgctttagga ggcggatgcg aaatagctat gtcttgtgat  360
ataagaatag cttcaagcaa cgcaagattt ggtcaaccag aagtaggtct cggaataaca  420
cctggttttg gtggtacaca aagactttca agattagttg gaatgggcat ggcaaagcag  480
cttatattta ctgcacaaaa tataaaggca gatgaagcat taagaatcgg acttgtaaat  540
aaggtagtag aacctagtga attaatgaat acagcaaaag aaattgcaaa caaaattgtg  600
agcaatgctc cagtagctgt taagttaagc aaacaggcta ttaatagagg aatgcagtgt  660
gatattgata ctgctttagc atttgaatca gaagcatttg gagaatgctt ttcaacagag  720
gatcaaaagg atgcaatgac agctttcata gagaaaagaa aaattgaagg cttcaaaaat  780
agatag                                                             786
<210>8
<211>261
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>8
Met Glu Leu Asn Asn Val Ile Leu Glu Lys Glu Gly Lys Val Ala Val
1               5                   10                  15
Val Thr Ile Asn Arg Pro Lys Ala Leu Asn Ala Leu Asn Ser Asp Thr
            2                 0 25                  30
Leu Lys Glu Met Asp Tyr Val Ile Gly Glu Ile Glu Asn Asp Ser Glu
        35                  40                  45
Val Leu Ala Val Ile Leu Thr Gly Ala Gly Glu Lys Ser Phe Val Ala
    50                  55                  60
Gly Ala Asp Ile Ser Glu Met Lys Glu Met Asn Thr Ile Glu Gly Arg
65                  70                  75                  80
Lys Phe Gly Ile Leu Gly Asn Lys Val Phe Arg Arg Leu Glu Leu Leu
                85                  90                  95
Glu Lys Pro Val Ile Ala Ala Val Asn Gly Phe Ala Leu Gly Gly Gly
            100                 105                 110
Cys Glu Ile Ala Met Ser Cys Asp Ile Arg Ile Ala Ser Ser Asn Ala
        115                 120                 125
Arg Phe Gly Gln Pro Glu Val Gly Leu Gly Ile Thr Pro Gly Phe Gly
    130                 135                 140
Gly Thr Gln Arg Leu Ser Arg Leu Val Gly Met Gly Met Ala Lys Gln
145                 150                 155                 160
Leu Ile Phe Thr Ala Gln Asn Ile Lys Ala Asp Glu Ala Leu Arg Ile
                165                 170                 175
Gly Leu Val Asn Lys Val Val Glu Pro Ser Glu Leu Met Asn Thr Ala
            180                 185                 190
Lys Glu Ile Ala Asn Lys Ile Val Ser Asn Ala Pro Val Ala Val Lys
        195                 200                 205
Leu Ser Lys Gln Ala Ile Asn Arg Gly Met Gln Cys Asp Ile Asp Thr
    210                 215                 220
Ala Leu Ala Phe Glu Ser Glu Ala Phe Gly Glu Cys Phe Ser Thr Glu
225                 230                 235                 240
Asp Gln Lys Asp Ala Met Thr Ala Phe Ile Glu Lys Arg Lys Ile Glu
                245                 250                 255
Gly Phe Lys Asn Arg
            260
<210>9
<211>1197
<212>DNA
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>9
atgatagtaa aagcaaagtt tgtaaaagga tttatcagag atgtacatcc ttatggttgc    60
agaagggaag tactaaatca aatagattat tgtaagaagg ctattgggtt taggggacca   120
aagaaggttt taattgttgg agcctcatct gggtttggtc ttgctactag aatttcagtt   180
gcatttggag gtccagaagc tcacacaatt ggagtatcct atgaaacagg agctacagat   240
agaagaatag gaacagcggg atggtataat aacatatttt ttaaagaatt tgctaaaaaa   300
aaaggattag ttgcaaaaaa cttcattgag gatgcctttt ctaatgaaac caaagataaa   360
gttattaagt atataaagga tgaatttggt aaaatagatt tatttgttta tagtttagct   420
gcgcctagga gaaaggacta taaaactgga aatgtttata cttcaagaat aaaaacaatt   480
ttaggagatt ttgagggacc gactattgat gttgaaagag acgagattac tttaaaaaag   540
gttagtagtg ctagcattga agaaattgaa gaaactagaa aggtaatggg tggagaggat   600
tggcaagagt ggtgtgaaga gctgctttat gaagattgtt tttcggataa agcaactacc   660
atagcatact cgtatatagg atccccaaga acctacaaga tatatagaga aggtactata   720
ggaatagcta aaaaggatct tgaagataag gctaagctta taaatgaaaa acttaacaga   780
gttataggtg gtagagcctt tgtgtctgtg aataaagcat tagttacaaa agcaagtgca   840
tatattccaa cttttcctct ttatgcagct attttatata aggtcatgaa agaaaaaaat   900
attcatgaaa attgtattat gcaaattgag agaatgtttt ctgaaaaaat atattcaaat   960
gaaaaaatac aatttgatga caagggaaga ttaaggatgg acgatttaga gcttagaaaa  1020
gacgttcaag acgaagttga tagaatatgg agtaatatta ctcctgaaaa ttttaaggaa  1080
ttatctgatt ataagggata caaaaaagaa ttcatgaact taaacggttt tgatctagat  1140
ggggttgatt atagtaaaga cctggatata gaattattaa gaaaattaga accttaa     1197
<210>10
<211>398
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>10
Met Ile Val Lys Ala Lys Phe Val Lys Gly Phe Ile Arg Asp Val His
1               5                   10                  15
Pro Tyr Gly Cys Arg Arg Glu Val Leu Asn Gln Ile Asp Tyr Cys Lys
            20                  25                  30
Lys Ala Ile Gly Phe Arg Gly Pro Lys Lys Val Leu Ile Val Gly Ala
        35                  40                  45
Ser Ser Gly Phe Gly Leu Ala Thr Arg Ile Ser Val Ala Phe Gly Gly
    50                  55                  60
Pro Glu Ala His Thr Ile Gly Val Ser Tyr Glu Thr Gly Ala Thr Asp
65                  70                  75                  80
Arg Arg Ile Gly Thr Ala Gly Trp Tyr Asn Asn Ile Phe Phe Lys Glu
                85                  90                  95
Phe Ala Lys Lys Lys Gly Leu Val Ala Lys Asn Phe Ile Glu Asp Ala
            100                 105                 110
Phe Ser Asn Glu Thr Lys Asp Lys Val Ile Lys Tyr Ile Lys Asp Glu
        115                 120                 125
Phe Gly Lys Ile Asp Leu Phe Val Tyr Ser Leu Ala Ala Pro Arg Arg
    130                 135                 140
Lys Asp Tyr Lys Thr Gly Asn Val Tyr Thr Ser Arg Ile Lys Thr Ile
145                 150                 155                 160
Leu Gly Asp Phe Glu Gly Pro Thr Ile Asp Val Glu Arg Asp Glu Ile
                165                 170                 175
Thr Leu Lys Lys Val Ser Ser Ala Ser Ile Glu Glu Ile Glu Glu Thr
            180                 185                 190
Arg Lys Val Met Gly Gly Glu Asp Trp Gln Glu Trp Cys Glu Glu Leu
        195                 200                 205
Leu Tyr Glu Asp Cys Phe Ser Asp Lys Ala Thr Thr Ile Ala Tyr Ser
    210                 215                 220
Tyr Ile Gly Ser Pro Arg Thr Tyr Lys Ile Tyr Arg Glu Gly Thr Ile
225                 230                 235                 240
Gly Ile Ala Lys Lys Asp Leu Glu Asp Lys Ala Lys Leu Ile Asn Glu
                245                 250                 255
Lys Leu Asn Arg Val Ile Gly Gly Arg Ala Phe Val Ser Val Asn Lys
            260                 265                 270
Ala Leu Val Thr Lys Ala Ser Ala Tyr Ile Pro Thr Phe Pro Leu Tyr
        275                 280                 285
Ala Ala Ile Leu Tyr Lys Val Met Lys Glu Lys Asn Ile His Glu Asn
    290                 295                 300
Cys Ile Met Gln Ile Glu Arg Met Phe Ser Glu Lys Ile Tyr Ser Asn
305                 310                 315                 320
Glu Lys Ile Gln Phe Asp Asp Lys Gly Arg Leu Arg Met Asp Asp Leu
                325                 330                 335
Glu Leu Arg Lys Asp Val Gln Asp Glu Val Asp Arg Ile Trp Ser Asn
            340                 345                 350
Ile Thr Pro Glu Asn Phe Lys Glu Leu Ser Asp Tyr Lys Gly Tyr Lys
        355                 360                 365
Lys Glu Phe Met Asn Leu Asn Gly Phe Asp Leu Asp Gly Val Asp Tyr
    370                 375                 380
Ser Lys Asp Leu Asp Ile Glu Leu Leu Arg Lys Leu Glu Pro
385                 390                 395
<210>11
<211>1407
<212>DNA
<213>拜氏梭菌(Clostridium beijerinckii)
<400>11
atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa    60
aacattaatt taaagaacta caaggataat tcttcatgtt tcggagtatt cgaaaatgtt   120
gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa   180
gagcaaagag aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc   240
ttggctacaa tgattctaga agaaacacat atgggaagat atgaggataa aatattaaaa   300
catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcttggtca   360
ggtgataatg gtcttacagt tgtagaaatg tctccatatg gtgttatagg tgcaataact   420
ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat agctgctgga   480
aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa   540
atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctagtaac aactataaaa   600
aatccaacta tggagtctct agatgcaatt attaagcatc cttcaataaa acttctttgc   660
ggaactgggg gtccaggaat ggtaaaaacc ctcttaaatt ctggtaagaa agctataggt   720
gctggtgctg gaaatccacc agttattgta gatgatactg ctgatataga aaaggctggt   780
aggagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa   840
gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct   900
gtaattataa atgaagatca agtatcaaaa ttaatagatt tagtattaca aaaaaataat   960
gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattctta  1020
gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca  1080
aatcatccat ttgttatgac agaactcatg atgccaatat tgccaattgt aagagttaaa  1140
gatatagatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc  1200
tatatttatt ctaaaaatat agacaaccta aatagatttg aaagagaaat agatactact  1260
atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca  1320
actttcacta ttgctggatc tactggtgag ggaataacct ctgcaaggaa ttttacaaga  1380
caaagaagat gtgtacttgc cggctaa                                      1407
<210>12
<211>468
<212>PRT
<213>拜氏梭菌(Clostridium beijerinckii)
<400>12
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1               5                   10                  15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
            20                  25                  30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
        35                  40                  45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
    50                  55                  60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu GlnA sn Lys Glu Val
65                  70                  75                  80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
               85                  90                  95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
            100                 105                 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
        115                 120                 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
    130                 135                 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145                 150                 155                 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
                165                 170                 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
            180                 185                 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
       195                 200                 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
    210                 215                 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225                 230                 235                 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
                245                 250                 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
            260                 265                 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
        275                 280                 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
    290                 295                 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305                 310                 315                 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
                325                 330                 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
            340                 345                 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
        355                 360                 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
    370                 375                 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385                 390                 395                 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
                405                 410                 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
            420                 425                 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
        435                 440                 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
    450                 455                 460
Val Leu Ala Gly
465
<210>13
<211>1215
<212>DNA
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>13
atggttgatt tcgaatattc aataccaact agaatttttt tcggtaaaga taagataaat   60
gtacttggaa gagagcttaa aaaatatggt tctaaagtgc ttatagttta tggtggagga  120
agtataaaga gaaatggaat atatgataaa gctgtaagta tacttgaaaa aaacagtatt  180
aaattttatg aacttgcagg agtagagcca aatccaagag taactacagt tgaaaaagga  240
gttaaaatat gtagagaaaa tggagttgaa gtagtactag ctataggtgg aggaagtgca  300
atagattgcg caaaggttat agcagcagca tgtgaatatg atggaaatcc atgggatatt  360
gtgttagatg gctcaaaaat aaaaagggtg cttcctatag ctagtatatt aaccattgct  420
gcaacaggat cagaaatgga tacgtgggca gtaataaata atatggatac aaacgaaaaa  480
ctaattgcgg cacatccaga tatggctcct aagttttcta tattagatcc aacgtatacg  540
tataccgtac ctaccaatca aacagcagca ggaacagctg atattatgag tcatatattt  600
gaggtgtatt ttagtaatac aaaaacagca tatttgcagg atagaatggc agaagcgtta  660
ttaagaactt gtattaaata tggaggaata gctcttgaga agccggatga ttatgaggca  720
agagccaatc taatgtgggc ttcaagtctt gcgataaatg gacttttaac atatggtaaa  780
gacactaatt ggagtgtaca cttaatggaa catgaattaa gtgcttatta cgacataaca  840
cacggcgtag ggcttgcaat tttaacacct aattggatgg agtatatttt aaataatgat  900
acagtgtaca agtttgttga atatggtgta aatgtttggg gaatagacaa agaaaaaaat  960
cactatgaca tagcacatca agcaatacaa aaaacaagag attactttgt aaatgtacta 1020
ggtttaccat ctagactgag agatgttgga attgaagaag aaaaattgga cataatggca 1080
aaggaatcag taaagcttac aggaggaacc ataggaaacc taagaccagt aaacgcctcc  1140
gaagtcctac aaatattcaa aaaatctgtg taaaacgcct ccgaagtcct acaaatattc  1200
aaaaaatctg tgtaa                                                   1215
<210>14
<211>390
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>14
Met Val Asp Phe Glu Tyr Ser Ile Pro Thr Arg Ile Phe Phe Gly Lys
1               5                   10                  15
Asp Lys Ile Asn Val Leu Gly Arg Glu Leu Lys Lys Tyr Gly Ser Lys
            20                  25                  30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
        35                  40                  45
Asp Lys Ala Val Ser Ile Leu Glu Lys Asn Ser Ile Lys Phe Tyr Glu
    50                  55                  60
Leu Ala Gly Val Glu Pro Asn Pro Arg Val Thr Thr Val Glu Lys Gly
65                  70                  75                  80
Val Lys Ile Cys Arg Glu Asn Gly Val Glu Val Val Leu Ala Ile Gly
                85                 90                 95
Gly Gly Ser Ala Ile Asp Cys Ala Lys Val Ile Ala Ala Ala Cys Glu
            100                 105                 110
Tyr Asp Gly Asn Pro Trp Asp Ile Val Leu Asp Gly Ser Lys Ile Lys
        115                 120                 125
Arg Val Leu Pro Ile Ala Ser Ile Leu Thr Ile Ala Ala Thr Gly Ser
    130                 135                 140
Glu Met Asp Thr Trp Ala Val Ile Asn Asn Met Asp Thr Asn Glu Lys
145                 150                 155                 160
Leu Ile Ala Ala His Pro Asp Met Ala Pro Lys Phe Ser Ile Leu Asp
                165                 170                 175
Pro Thr Tyr Thr Tyr Thr Val Pro Thr Asn Gln Thr Ala Ala Gly Thr
            180                 185                 190
Ala Asp Ile Met Ser His Ile Phe Glu Val Tyr Phe Ser Asn Thr Lys
        195                 200                 205
Thr Ala Tyr Leu Gln Asp Arg Met Ala Glu Ala Leu Leu Arg Thr Cys
    210                 215                 220
Ile Lys Tyr Gly Gly Ile Ala Leu Glu Lys Pro Asp Asp Tyr Glu Ala
225                 230                 235                 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
                245                 250                 255
Thr Tyr Gly Lys Asp Thr Asn Trp Ser Val His Leu Met Glu His Glu
            260                 265                 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
        275                 280                 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asn Asp Thr Val Tyr Lys
    290                 295                 300
Phe Val Glu Tyr Gly Val Asn Val Trp Gly Ile Asp Lys Glu Lys Asn
305                 310                 315                 320
His Tyr Asp Ile Ala His Gln Ala Ile Gln Lys Thr Arg Asp Tyr Phe
                325                 330                 335
Val Asn Val Leu Gly Lcu Pro Ser Arg Leu Arg Asp Val Gly Ile Glu
            340                 345                 350
Glu Glu Lys Leu Asp Ile Met Ala Lys Glu Ser Val Lys Leu Thr Gly
        355                 360                 365
Gly Thr Ile Gly Asn Leu Arg Pro Val Asn Ala Ser Glu Val Leu Gln
    370                 375                 380
Ile Phe Lys Lys Ser Val
385                 390
<210>15
<211>1170
<212>DNA
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>15
atgctaagtt ttgattattc aataccaact aaagtttttt ttggaaaagg aaaaatagac     60
gtaattggag aagaaattaa gaaatatggc tcaagagtgc ttatagttta tggcggagga    120
agtataaaaa ggaacggtat atatgataga gcaacagcta tattaaaaga aaacaatata    180
gctttctatg aactttcagg agtagagcca aatcctagga taacaacagt aaaaaaaggc    240
atagaaatat gtagagaaaa taatgtggat ttagtattag caataggggg aggaagtgca    300
atagactgtt ctaaggtaat tgcagctgga gtttattatg atggcgatac atgggacatg    360
gttaaagatc catctaaaat aactaaagtt cttccaattg caagtatact tactctttca   420
gcaacagggt ctgaaatgga tcaaattgca gtaatttcaa atatggagac taatgaaaag   480
cttggagtag gacatgatga tatgagacct aaattttcag tgttagatcc tacatatact   540
tttacagtac ctaaaaatca aacagcagcg ggaacagctg acattatgag tcacaccttt   600
gaatcttact ttagtggtgt tgaaggtgct tatgtgcagg acggtatagc agaagcaatc   660
ttaagaacat gtataaagta tggaaaaata gcaatggaga agactgatga ttacgaggct   720
agagctaatt tgatgtgggc ttcaagttta gctataaatg gtctattatc acttggtaag   780
gatagaaaat ggagttgtca tcctatggaa cacgagttaa gtgcatatta tgatataaca   840
catggtgtag gacttgcaat tttaacacct aattggatgg aatatattct aaatgacgat   900
acacttcata aatttgtttc ttatggaata aatgtttggg gaatagacaa gaacaaagat   960
aactatgaaa tagcacgaga ggctattaaa aatacgagag aatactttaa ttcattgggt  1020
attccttcaa agcttagaga agttggaata ggaaaagata aactagaact aatggcaaag  1080
caagctgtta gaaattctgg aggaacaata ggaagtttaa gaccaataaa tgcagaggat  1140
gttcttgaga tatttaaaaa atcttattaa                                   1170
<210>16
<211>389
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>16
Met Leu Ser Phe Asp Tyr Ser Ile Pro Thr Lys Val Phe Phe Gly Lys
1               5                   10                  15
Gly Lys Ile Asp Val Ile Gly Glu Glu Ile Lys Lys Tyr Gly Ser Arg
            20                  25                  30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
        35                  40                  45
Asp Arg Ala Thr Ala Ile Leu Lys Glu Asn Asn Ile Ala Phe Tyr Glu
    50                  55                  60
Leu Ser Gly Val Glu Pro Asn Pro Arg Ile Thr Thr Val Lys Lys Gly
65                  70                  75                  80
Ile Glu Ile Cys Arg Glu Asn Asn Val Asp Leu Val Leu Ala Ile Gly
                85                  90                  95
Gly Gly Ser Ala Ile Asp Cys Ser Lys Val Ile Ala Ala Gly Val Tyr
            100                 105                 110
Tyr Asp Gly Asp Thr Trp Asp Met Val Lys Asp Pro Ser Lys Ile Thr
        115                 120                 125
Lys Val Leu Pro Ile Ala Ser Ile Leu Thr Leu Ser Ala Thr Gly Ser
    130                 135                 140
Glu Met Asp Gln Ile Ala Val Ile Ser Asn Met Glu Thr Asn Glu Lys
145                 150                 155                 160
Leu Gly Val Gly His Asp Asp Met Arg Pro Lys Phe Ser Val Leu Asp
                165                 170                 175
Pro Thr Tyr Thr Phe Thr Val Pro Lys Asn Gln Thr Ala Ala Gly Thr
            180                 185                 190
Ala Asp Ile Met Ser His Thr Phe Glu Ser Tyr Phe Ser Gly Val Glu
        195                 200                 205
Gly Ala Tyr Val Gln Asp Gly Ile Ala Glu Ala Ile Leu Arg Thr Cys
    210                 215                 220
Ile Lys Tyr Gly Lys Ile Ala Met Glu Lys Thr Asp Asp Tyr Glu Ala
225                 230                 235                 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
                245                 250                 255
Ser Leu Gly Lys Asp Arg Lys Trp Ser Cys His Pro Met Glu His Glu
            260                 265                 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
        275                 280                 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asp Asp Thr Leu His Lys
    290                 295                 300
Phe Val Ser Tyr Gly Ile Asn Val Trp Gly Ile Asp Lys Asn Lys Asp
305                 310                 315                 320
Asn Tyr Glu Ile Ala Arg Glu Ala Ile Lys Asn Thr Arg Glu Tyr Phe
                325                 330                 335
Asn Ser Leu Gly Ile Pro Ser Lys Leu Arg Glu Val Gly Ile Gly Lys
            340                 345                 350
Asp Lys Leu Glu Leu Met Ala Lys Gln Ala Val Arg Asn Ser Gly Gly
        355                 360                 365
Thr Ile Gly Ser Leu Arg Pro Ile Asn Ala Glu Asp Val Leu Glu Ile
    370                 375                 380
Phe Lys Lys Ser Tyr
385
<210>17
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>17
caccatggaa ctaaacaatg tcatccttg                     29
<210>18
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>18
cctcctatct atttttgaag ccttc                         25
<210>19
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>19
caccatgaaa aaggtatgtg ttataggt                      28
<210>20
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>20
catttgataa tggggattct tgt                     23
<210>21
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>21
caccatgaaa gaagttgtaa tagctagtgc              30
<210>22
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>22
ctagcacttt tctagcaata ttgctg                  26
<210>23
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>23
caccatgcta agttttgatt attcaatac               29
<210>24
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>24
ttaataagat tttttaaata tctca                     25
<210>25
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>25
caccatggtt gatttcgaat attcaatacc                30
<210>26
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>26
ttacacagat tttttgaata tttgt                     25
<210>27
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>27
cacca tgaga gatgtagtaa tagtaagtgc tg                     32
<210>28
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>28
ccgcaattgt atccatattg aacc                               24
<210>29
<21126
<212>DNA
<213>人工序列
<220>
<223>引物
<400>29
caccatgata gtaaaagcaa agtttg                             26
<210>30
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物
<400>30
gcttaaagct taaaaccgct tctggcg                            27
<210>31
<211>27
<212DNA
<213>人工序列
<220>
<223>引物
<400>31
cacca tgaat aaagacacac taatacc                     27
<210>32
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>32
gccagaccat ctttgaaaat gcgc                         24
<210>33
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>33
catgcatgca aaggaggtta gtagaatgaa agaag             35
<210>34
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>34
gtcctgcagg gcgcgcccaa tactttctag cacttttc          38
<210>35
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>35
catgtcgaca aaggaggtct gtttaatgaa aaaggtatg           39
<210>36
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>36
gtcgcatgcc ttgtaaactt attttgaa                       28
<210>37
<211>44
<212>DNA
<213>人工序列
<220>
<223>引物
<400>37
catagatctg gatccaaagg agggtgagga aatgatagta aaag     44
<210>38
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>38
catgtcgacg tgcagccttt ttaaggttct                     30
<210>39
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>39
catgaattca cgcgtaaagg aggtattagt catggaac            38
<210>40
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>40
gtcggatccc ttacctccta tctatttttg                     30
<210>41
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物
<400>41
catgcccggg ggtcaccaaa ggaggaatag ttcatgaata aa       42
<210>42
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>42
catggttaac aagaagttag ccggcaagta ca                     32
<210>43
<211>41
<212>DNA
<213>人工序列
<220>
<223>引物
<400>43
catggttaac aaaggagggg ttaaaatggt tgatttcgaa t           41
<210>44
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>44
catggcatgc gtttaaacgt aggtttacac agatttt                37
<210>45
<211>17
<212>DNA
<213>人工序列
<220>
<223>引物
<400>45
gtaaaacgac ggccagt                                      17
<210>46
<211>16
<212>DNA
<213>人工序列
<220>
<223>引物
<400>46
aacagctatg accatg                                      16
<210>47
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>47
gcaggagatg ctgacgtaat aa                               22
<210>48
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>48
ccaacctgct ttttcaatag ctgc                             24
<210>49
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
cagagatggg gtcaaagaat g                                      21
<210>50
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
gtggttttat tccgagagcg                                        20
<210>51
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>51
ggtctatact tagaatctcc                                        20
<210>52
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>52
cggaacagtt gaccttaata tggc                                   24
<210>53
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>53
gcctcatctg ggtttggtct tg                                      22
<210>54
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>54
cgcctaggag aaaggacta t aaaactgg                               28
<210>55
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>55
cagagttata ggtggtagag cc                                      22
<210>56
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>56
ccatcccgct gttcctattc ttct                                    24
<210>57
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>57
ccaatcctct ccacccatta cc                                      22
<210>58
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>58
cgtccatcct taatcttccc                                         20
<210>59
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>59
ccaactatgg aatccctaga tgc                                     23
<210>60
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>60
gcatagtctg cgaagtaaat gc                     22
<210>61
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>61
ggatctactg gtgaaggcat aacc                   24
<210>62
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>62
ggcatcatga gttctgtcat gac                    23
<210>63
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>63
gccttcaatg atactcttac cagcc                  25
<210>64
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>64
gcatttccag cagctatcat gc                      22
<210>65
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>65
ccttcccata tgtgtttctt cc                      22
<210>66
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>66
gttgaagtag tactagctat ag                      22
<210>67
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>67
gacataacac acggcgtagg gc                      22
<210>68
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>68
taagtgtaca ctccaattag tg                     22
<210>69
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>69
gccatctaac acaatatccc atgg                   24
<210>70
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>70
gcgatacatg ggacatggtt aaag                   24
<210>71
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>71
tgcacttaac tcgtgttccata                                      22
<210>72
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>72
gttagccggc aagtacacat c                                      21
<210>73
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>73
actttctttc gcctgtttca c                                      21
<210>74
<211>47
<212>DNA
<213>人工序列
<220>
<223>引物
<400>74
catgaagctt ggcgcgccgg gacgcgtttt tgaaaataat gaaaact          47
<210>75
<211>79
<212>DNA
<213>人工序列
<220>
<223>引物
<400>75
catgaagctt gtttaaactc ggtgaccttg aaaataatga aaacttatat tgttttgaaa    60
ataatgaaaa cttatattg                                                 79
<210>76
<211>1197
<212>DNA
<213>人工序列
<220>
<223>丙酮丁醇梭菌(Clostridium acetobutylicum)的密码子最优化的CAC0462基因
<400>76
atgattgtga aagcaaaatt cgtgaaagga ttcattcgcg atgtgcaccc ttatgggtgc    60
cgccgtgaag ttctgaatca gatcgactac tgcaaaaaag ccattggctt tcgcggccca   120
aagaaagtgc tgatcgttgg tgcttcctct ggcttcggtc tggctacccg catttccgtg   180
gcgttcggtg gcccagaagc ccacactatc ggcgtcagct atgaaaccgg tgcgaccgat   240
cgccgtattg gcacagcagg gtggtataac aatattttct ttaaagaatt tgccaaaaag   300
aaaggcctgg tggcaaaaaa ctttatcgaa gacgccttct cgaacgaaac caaggacaaa   360
gtcatcaaat atattaaaga cgaatttggc aaaatcgatc tgttcgttta ctcgctggca   420
gcaccgcgtc gtaaggatta taagactggg aacgtttata cctcacgtat taaaacgatc   480
ctgggtgatt ttgaagggcc gactatcgat gtggaacgtg atgaaattac actgaaaaag   540
gtctcatctg cgtcaatcga agagattgaa gaaacccgta aggtgatggg cggcgaagat   600
tggcaagagt ggtgtgaaga actgctgtac gaagattgtt tcagtgataa agccaccacc   660
atcgcctatt cctatatcgg ttctcctcgc acctacaaaa tctaccgcga aggcactatc   720
ggcattgcga aaaaggatct ggaagataag gcaaaactga tcaacgagaa gctgaatcgc    780
gtcattggcg ggcgcgcatt cgttagcgtg aataaagccc tggttactaa ggcgagcgca    840
tatattccga cctttcctct gtacgccgca attctgtata aagttatgaa agaaaagaat    900
attcacgaaa actgcattat gcaaattgaa cgcatgtttt ccgagaaaat ttattcaaat    960
gaaaagattc aatttgatga taaaggtcgt ctgcgtatgg atgacctgga gctgcgtaag   1020
gatgttcagg atgaagtaga ccgtatttgg agcaatatta caccggagaa ttttaaggaa   1080
ctgagcgact ataaaggcta caaaaaagaa tttatgaacc tgaatggatt tgatctggac   1140
ggcgtggatt attcaaagga tctggacatt gaactgctgc gcaaactgga accataa      1197
<210>77
<211>1224
<212>DNA
<213>人工序列
<220>
<223>密码子最优化的EgTER
<400>77
atggcgatgt ttacgaccac cgcaaaagtt attcagccga aaattcgtgg ttttatttgc     60
accaccaccc acccgattgg ttgcgaaaaa cgtgttcagg aagaaatcgc atacgcacgc    120
gcgcacccgc cgaccagccc gggtccgaaa cgtgtgctgg ttattggctg cagtacgggc    180
tatggcctga gcacccgtat caccgcggcc tttggttatc aggccgcaac cctgggcgtg    240
tttctggcag gcccgccgac caaaggccgt ccggccgcgg cgggttggta taatacggtt    300
gcgttcgaaa aagccgccct ggaagcaggt ctgtatgcac gttctctgaa tggtgatgcg    360
ttcgattcta ccacgaaagc ccgcaccgtg gaagcaatta aacgtgatct gggtaccgtt    420
gatctggtgg tgtatagcat tgcagcgccg aaacgtaccg atccggccac cggcgtgctg    480
cataaagcgt gcctgaaacc gattggtgca acctacacca atcgtacggt gaacaccgat    540
aaagcagaag ttaccgatgt gagtattgaa ccggccagtc cggaagaaat cgcagatacc   600
gtgaaagtta tgggtggcga agattgggaa ctgtggattc aggcactgag cgaagccggc   660
gtgctggccg aaggcgcaaa aaccgttgcg tattcttata ttggcccgga aatgacgtgg   720
ccggtgtatt ggagtggcac cattggcgaa gccaaaaaag atgttgaaaa agcggcgaaa   780
cgcatcaccc agcagtacgg ctgtccggcg tatccggttg ttgccaaagc gctggtgacc   840
caggccagta gcgccattcc ggtggtgccg ctgtatattt gcctgctgta tcgtgttatg   900
aaagaaaaag gcacccatga aggctgcatt gaacagatgg tgcgtctgct gacgacgaaa   960
ctgtatccgg aaaatggtgc gccgatcgtg gatgaagcgg gccgtgtgcg tgttgatgat  1020
tgggaaatgg cagaagatgt tcagcaggca gttaaagatc tgtggagcca ggtgagtacg  1080
gccaatctga aagatattag cgattttgca ggttatcaga ccgaatttct gcgtctgttt  1140
ggctttggta ttgatggtgt ggattacgat cagccggttg atgttgaagc ggatctgccg  1200
agcgccgccc agcagtaagt cgac                                         1224
<210>78
<211>1498
<212>DNA
<213>人工序列
<220>
<223>密码子最优化的ald基因
<400>78
cggtacctcg cgaatgcatc tagatccaat catgcccggg ggtcaccaaa ggaggaatag    60
ttcatgaata aagatacgct gattccgacc acgaaagatc tgaaagtgaa aaccaacggt   120
gaaaatatca acctgaaaaa ttataaagat aatagcagct gcttcggcgt gtttgaaaat   180
gttgaaaacg ccatttcttc tgccgttcac gcacagaaaa tcctgtctct gcactatacc   240
aaagaacagc gcgaaaaaat cattaccgaa attcgcaaag cggccctgca gaataaagaa   300
gttctggcga ccatgatcct ggaagaaacc catatgggtc gttacgaaga taaaatcctg    360
aaacatgaac tggtggcgaa atacacgccg ggtacggaag atctgaccac gaccgcatgg    420
agcggtgata acggtctgac cgtggtggaa atgtctccgt atggcgttat tggcgcaatt    480
acgccgagca cgaatccgac cgaaacggtt atttgtaaca gtattggcat gattgcagcc    540
ggtaatgcag tggttttcaa tggtcatccg tgcgccaaaa aatgtgtggc gtttgccgtt    600
gaaatgatta acaaagcgat tattagctgc ggtggcccgg aaaatctggt gacgacgatt    660
aaaaacccga ccatggaaag tctggatgcg attattaaac atccgtctat taaactgctg    720
tgtggtaccg gcggtccggg tatggtgaaa accctgctga attctggcaa aaaagcaatt    780
ggcgcgggtg cgggtaatcc gccggttatc gttgatgata ccgcggatat tgaaaaagca    840
ggccgcagta ttattgaagg ttgtagcttt gataataacc tgccgtgcat tgccgaaaaa    900
gaagtgtttg ttttcgaaaa tgtggcggat gatctgatca gcaacatgct gaaaaataac    960
gccgtgatta ttaacgaaga tcaggtgtct aaactgattg atctggttct gcagaaaaac   1020
aacgaaacgc aggaatattt cattaataaa aaatgggttg gtaaagatgc gaaactgttc   1080
ctggatgaaa tcgatgtgga aagtccgagc aacgtgaaat gtatcatctg cgaagtgaat   1140
gccaaccatc cgtttgttat gacggaactg atgatgccga ttctgccgat tgttcgtgtt   1200
aaagatattg atgaagccat caaatatgcg aaaattgcgg aacagaaccg caaacacagc   1260
gcatatattt acagtaaaaa catcgataac ctgaaccgtt tcgaacgtga aattgatacc   1320
accatctttg tgaaaaatgc caaaagtttt gcgggtgttg gctatgaagc cgaaggcttt   1380
accacgttca ccattgcagg ttctaccggc gaaggtatta ccagcgcgcg taattttacc   1440
cgccagcgcc gctgtgtgct ggcgggttaa gttaacccaa tatcggatcc cgggcccg     1498
<210>79
<211>6509
<212>DNA
<213>人工序列
<220>
<223>质粒pFP988
<400>79
tcgaggcccc gcacatacga aaagactggc tgaaaacatt gagcctttga tgactgatga   60
tttggctgaa gaagtggatc gattgtttga gaaaagaaga agaccataaa aataccttgt  120
ctgtcatcag acagggtatt ttttatgctg tccagactgt ccgctgtgta aaaaatagga  180
ataaaggggg gttgttatta ttttactgat atgtaaaata taatttgtat aaggaattgt  240
gagcggataa caattcctac gaaaatgaga gggagaggaa acatgattca aaaacgaaag  300
cggacagttt cgttcagact tgtgcttatg tgcacgctgt tatttgtcag tttgccgatt  360
acaaaaacat cagccggatc ccaccatcac catcaccatt aagaattcct agaaactcca  420
agctatcttt aaaaaatcta gtaaatgcac gagcaacatc ttttgttgct cagtgcattt  480
tttattttgt acactagata tttcttctcc gcttaaatca tcaaagaaat ctttatcact  540
tgtaaccagt ccgtccacat gtcgaattgc atctgaccga attttacgtt tccctgaata  600
attctcatca atcgtttcat caattttatc tttatacttt atattttgtg cgttaatcaa  660
atcataattt ttatatgttt cctcatgatt tatgtcttta ttattatagt ttttattctc  720
tctttgatta tgtctttgta tcccgtttgt attacttgat cctttaactc tggcaaccct  780
caaaattgaa tgagacatgc tacacctccg gataataaat atatataaac gtatatagat  840
ttcataaagt ctaacacact agacttattt acttcgtaat taagtcgtta aaccgtgtgc  900
tctacgacca aaactataaa acctttaaga actttctttt tttacaagaa aaaagaaatt  960
agataaatct ctcatatctt ttattcaata atcgcatccg attgcagtat aaatttaacg 1020
atcactcatc atgttcatat ttatcagagc tcgtgctata attatactaa ttttataagg 1080
aggaaaaaat atgggcattt ttagtatttt tgtaatcagc acagttcatt atcaaccaaa 1140
caaaaaataa gtggttataa tgaatcgtta ataagcaaaa ttcatataac caaattaaag    1200
agggttataa tgaacgagaa aaatataaaa cacagtcaaa actttattac ttcaaaacat    1260
aatatagata aaataatgac aaatataaga ttaaatgaac atgataatat ctttgaaatc    1320
ggctcaggaa aaggccattt tacccttgaa ttagtaaaga ggtgtaattt cgtaactgcc    1380
attgaaatag accataaatt atgcaaaact acagaaaata aacttgttga tcacgataat    1440
ttccaagttt taaacaagga tatattgcag tttaaatttc ctaaaaacca atcctataaa    1500
atatatggta atatacctta taacataagt acggatataa tacgcaaaat tgtttttgat    1560
agtatagcta atgagattta tttaatcgtg gaatacgggt ttgctaaaag attattaaat    1620
acaaaacgct cattggcatt acttttaatg gcagaagttg atatttctat attaagtatg    1680
gttccaagag aatattttca tcctaaacct aaagtgaata gctcacttat cagattaagt    1740
agaaaaaaat caagaatatc acacaaagat aaacaaaagt ataattattt cgttatgaaa    1800
tgggttaaca aagaatacaa gaaaatattt acaaaaaatc aatttaacaa ttccttaaaa    1860
catgcaggaa ttgacgattt aaacaatatt agctttgaac aattcttatc tcttttcaat    1920
agctataaat tatttaataa gtaagttaag ggatgcagtt catcgatgaa ggcaactaca    1980
gctcaggcga caaccatacg ctgagagatc ctcactacgt agaagataaa ggccacaaat    2040
acttagtatt tgaagcaaac actggaactg aagatggcta ccaaggcgaa gaatctttat    2100
ttaacaaagc atactatggc aaaagcacat cattcttccg tcaagaaagt caaaaacttc    2160
tgcaaagcga taaaaaacgc acggctgagt tagcaaacgg cgctctcggt atgattgagc    2220
taaacgatga ttacacactg aaaaaagtga tgaaaccgct gattgcatct aacacagtaa    2280
cagatgaaat tgaacgcgcg aacgtcttta aaatgaacgg caaatggtac ctgttcactg    2340
actcccgcgg atcaaaaatg acgattgacg gcattacgtc taacgatatt tacatgcttg    2400
gttatgtttc taattcttta actggcccat acaagccgct gaacaaaact ggccttgtgt    2460
taaaaatgga tcttgatcct aacgatgtaa cctttactta ctcacacttc gctgtacctc    2520
aagcgaaagg aaacaatgtc gtgattacaa gctatatgac aaacagagga ttctacgcag    2580
acaaacaatc aacgtttgcg ccaagcttgc atgcgagagt agggaactgc caggcatcaa    2640
ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg    2700
aacgctctcc tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg    2760
cccggagggt ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag    2820
gccatcctga cggatggcct ttttgcgttt ctacaaactc tttttgttta tttttctaaa    2880
tacattcaaa tatgtatccg ctcatgctcc ggatctgcat cgcaggatgc tgctggctac    2940
cctgtggaac acctacatct gtattaacga agcgctggca ttgaccctga gtgatttttc    3000
tctggtcccg ccgcatccat accgccagtt gtttaccctc acaacgttcc agtaaccggg    3060
catgttcatc atcagtaacc cgtatcgtga gcatcctctc tcgtttcatc ggtatcatta    3120
cccccatgaa cagaaattcc cccttacacg gaggcatcaa gtgaccaaac aggaaaaaac    3180
cgcccttaac atggcccgct ttatcagaag ccagacatta acgcttctgg agaaactcaa    3240
cgagctggac gcggatgaac aggcagacat ctgtgaatcg cttcacgacc acgctgatga    3300
gctttaccgc agctgcctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca    3360
gctcccggag acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca    3420
gggcgcgtca gcgggtgttg gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga    3480
tagcggagtg tatactggct taactatgcg gcatcagagc agattgtact gagagtgcac    3540
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct    3600
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca    3660
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac    3720
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt    3780
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg    3840
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc    3900
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc    3960
gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc    4020
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac    4080
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt    4140
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct    4200
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc    4260
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt    4320
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg    4380
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc    4440
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa    4500
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag    4560
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg    4620
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga    4680
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag    4740
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa    4800
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctgcaggc    4860
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca    4920
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg    4980
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat    5040
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc    5100
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg    5160
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg    5220
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt    5280
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca    5340
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata    5400
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac    5460
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa    5520
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt    5580
atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg    5640
cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt    5700
cagggcgcgt cagcgggtgt tcatgtgcgt aactaacttg ccatcttcaa acaggagggc    5760
tggaagaagc agaccgctaa cacagtacat aaaaaaggag acatgaacga tgaacatcaa    5820
aaagtttgca aaacaagcaa cagtattaac ctttactacc gcactgctgg caggaggcgc    5880
aactcaagcg tttgcgaaag aaacgaacca aaagccatat aaggaaacat acggcatttc    5940
ccatattaca cgccatgata tgctgcaaat ccctgaacag caaaaaaatg aaaaatatca    6000
agttcctgaa ttcgattcgt ccacaattaa aaatatctct tctgcaaaag gcctggacgt    6060
ttgggacagc tggccattac aaaacgctga cggcactgtc gcaaactatc acggctacca    6120
catcgtcttt gcattagccg gagatcctaa aaatgcggat gacacatcga tttacatgtt    6180
ctatcaaaaa gtcggcgaaa cttctattga cagctggaaa aacgctggcc gcgtctttaa    6240
agacagcgac aaattcgatg caaatgattc tatcctaaaa gaccaaacac aagaatggtc    6300
aggttcagcc acatttacat ctgacggaaa aatccgttta ttctacactg atttctccgg    6360
taaacattac ggcaaacaaa cactgacaac tgcacaagtt aacgtatcag catcagacag    6420
ctctttgaac atcaacggtg tagaggatta taaatcaatc tttgacggtg acggaaaaac  6480
gtatcaaaat gtacagcatg ccacgcgtc                                    6509
<210>80
<211>46
<212>DNA
<213>人工序列
<220>
<223>引物N85
<400>80
catagatctg gatccaaagg agggtgagga aatggcgatg tttacg                   46
<210>81
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物N86
<400>81
gtcgacttac tgctgggcgg                                                20
<210>82
<211>20
<212>DNA
<213>人工序列
<220>
<223>T7引物
<400>82
taatacgact cactataggg                                                20
<210>83
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物Trc99af
<400>83
ttgacaatta atcatccggc                                            20
<210>84
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物N5SeqF4
<400>84
ggtcaactgt tccggaaatt c                                         21
<210>85
<211>46
<212>DNA
<213>人工序列
<220>
<223>引物T-ald(BamHI)
<400>85
tgatctggat ccaagaagga gcccttcacc atgaataaag acacac              46
<210>86
<211>54
<212>DNA
<213>人工序列
<220>
<223>引物B-ald(ETGER)
<400>86
catcgccatt tcctcaccct cctttttagc cggcaagtac acatcttctt tgtc     54
<210>87
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物T-Ptrc(BspEI)
<400>87
ttccgtactt ccggacgact gcacggtgca ccaatgcttc tg         42
<210>88
<211>43
<212>DNA
<213>人工序列
<220>
<223>引物B-aldopt(BspEI)
<400>88
cggatcttaa gtactttaac ccgccagcac acagcggcgc tgg       43
<210>89
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物T-BspEIAatII
<400>89
ccggatcatg ataataatgg tttcttagac gt                   32
<210>90
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物B-BspEIAatII
<400>90
ctaagaaacc attattatca tgat                     24
<210>91
<211>42
<212>DNA
<213>人工序列
<220>
<223>1.6GI启动子
<400>91
gcccttgaca atgccacatc ctgagcaaat aattcaacca ct 42
<210>92
<211>42
<212>DNA
<213>人工序列
<220>
<223>1.5GI启动子
<400>92
gcccttgact atgccacatc ctgagcaaat aattcaacca ct 42
<210>93
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物AFBamHI
<400>93
cattggatcc atgaataaag acacactaat acctacaac    39
<210>94
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物ARAat2
<400>94
catgacgtca ctagtgttaa caagaagtta gccggcaag                39
<210>95
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物正向1(E)
<400>95
catgttaaca aaggaggaaa gatctatggc gatgtttacg accaccgcaa    50
<210>96
<211>43
<212>DNA
<213>人工序列
<220>
<223>引物底部反向1(E)
<400>96
cccctccttt ggcgcgcctt actgctgggc ggcgctcggc aga           43
<210>97
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物Top正向2(B)
<400>97
gcccagcagt aaggcgcgcc aaaggagggg ttaaaatggt tgatttcgaa t  51
<210>98
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物反向2(B)
<400>98
gtcgacgtca tactagttta cacagatttt ttgaatattt gt                42
<210>99
<211>47
<212>DNA
<213>人工序列
<220>
<223>引物Pamy/lacOF
<400>99
cattgtacag aattcgagct ctcgaggccc cgcacatacg aaaagac           47
<210>100
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物Pam/la cOR
<400>100
cattgtacag tttaaacata ggtcaccctc attttcgtag gaattgttat cc     52
<210>101
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物Spac F
<400>101
cattgtacag tttaaacata ggtcaccctc attttcgtag gaattgttat cc    52
<210>102
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物Spac R
<400>102
catgtttaaa cggtgaccca agctggggat ccgcgg                      36
<210>103
<211>44
<212>DNA
<213>人工序列
<220>
<223>引物Top TF
<400>103
cattggtcac cattcccggg catgcaaagg aggttagtag aatg             44
<210>104
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物Bot TR
<400>104
cctttacgcg accggtacta gtcaagtcga cagggcgcgc ccaatacttt c    51
<210>105
<211>57
<212>DNA
<213>人工序列
<220>
<223>引物Top CF
<400>105
cgcgccctgt cgacttgact agtaccggtc gcgtaaagga ggtattagtc atggaac    57
<210>106
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物Bot CR
<400>106
catcgtttaa acttggatcc agatccctta cctcctat                         38
<210>107
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物N3SeqF1
<400>107
ccatcatacc atactgaccc                                             20
<210>108
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物N3SeqF2
<400>108
gctactggag cattgctcac                                             20
<210>109
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物N3SeqF3
<400>109
ccattaacag ctgctattac aggc                     24
<210>110
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物N4SeqR3
<400>110
ggtctcggaa taacacctgg                          20
<210>111
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物N5SeqF3
<400>111
caagcttcat aacaggagct gg                       22
<210>112
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物N7SeqR2
<400>112
atcccacaat ccgtcagtga tc                     22
<210>113
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物N31SeqF1
<400>113
ctgagataag aaaggccgca                        20
<210>114
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物N62SeqF2
<400>114
caaccctggg cgtgtttctg                        20
<210>115
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物N62SeqF3
<400>115
gtggcgaaga ttgggaactg                        20
<210>116
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物N62SeqF4
<400>116
gggaaatggc agaagatgtt cagc    24
<210>117
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物N63SeqR1
<400>117
cggtctgata acctgcaaaa tcgc    24
<210>118
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物N63SeqR2
<400>118
caccagcgct ttggcaacaa c       21
<210>119
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物N63SeqR3
<400>119
gaacgtgcat acagacctgc ttc    23
<210>120
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物N63SeqR4
<400>120
cggctgaata acttttgcgg                          20
<210>121
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物Pamy SeqF2
<400>121
gcctttgatg actgatgatt tggc                     24
<210>122
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物Pamy SeqF
<400>122
tctccggtaa acattacggc aaac                     24
<210>123
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物Pamy seqR
<400>123
cggtcagatg caattcgaca tgtg                     24
<210>124
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物SpacF Seq
<400>124
gaagtggtca agacctcact                          20
<210>125
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物sacB Up
<400>125
cgggtttgtt actgataaag cagg                     24
<210>126
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物sacB Dn
<400>126
cggttagcca tttgcctgct ttta                     24
<210>127
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物HT R
<400>127
acaaagatct ccatggacgc gt                                            22
<210>128
<211>1185
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>128
atgaaaaatt gtgtcatcgt cagtgcggta cgtactgcta tcggtagttt taacggttca   60
ctcgcttcca ccagcgccat cgacctgggg gcgacagtaa ttaaagccgc cattgaacgt  120
gcaaaaatcg attcacaaca cgttgatgaa gtgattatgg gtaacgtgtt acaagccggg  180
ctggggcaaa atccggcgcg tcaggcactg ttaaaaagcg ggctggcaga aacggtgtgc  240
ggattcacgg tcaataaagt atgtggttcg ggtcttaaaa gtgtggcgct tgccgcccag  300
gccattcagg caggtcaggc gcagagcatt gtggcggggg gtatggaaaa tatgagttta  360
gccccctact tactcgatgc aaaagcacgc tctggttatc gtcttggaga cggacaggtt  420
tatgacgtaa tcctgcgcga tggcctgatg tgcgccaccc atggttatcatatggggatt   480
accgccgaaa acgtggctaa agagtacgga attacccgtg aaatgcagga tgaactggcg  540
ctacattcac agcgtaaagc ggcagccgca attgagtccg gtgcttttac agccgaaatc  600
gtcccggtaa atgttgtcac tcgaaagaaa accttcgtct tcagtcaaga cgaattcccg  660
aaagcgaatt caacggctga agcgttaggt gcattgcgcc cggccttcga taaagcagga  720
acagtcaccg ctgggaacgc gtctggtatt aacgacggtg ctgccgctct ggtgattatg  780
gaagaatctg cggcgctggc agcaggcctt acccccctgg ctcgcattaa aagttatgcc  840
agcggtggcg tgccccccgc attgatgggt atggggccag tacctgccac gcaaaaagcg  900
ttacaactgg cggggctgca actggcggat attgatctca ttgaggctaa tgaagcattt   960
gctgcacagt tccttgccgt tgggaaaaac ctgggctttg attctgagaa agtgaatgtc  1020
aacggcgggg ccatcgcgct cgggcatcct atcggtgcca gtggtgctcg tattctggtc  1080
acactattac atgccatgca ggcacgcgat aaaacgctgg ggctggcaac actgtgcatt  1140
ggcggcggtc agggaattgc gatggtgatt gaacggttga attaa                  1185
<210>129
<211>394
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>129
Met Lys Asn Cys Val Ile Val Ser Ala Val Arg Thr Ala Ile Gly Ser
1               5                  10                  15
Phe Asn Gly Ser Leu Ala Ser Thr Ser Ala Ile Asp Leu Gly Ala Thr
            20                  25                  30
Val Ile Lys Ala Ala Ile Glu Arg Ala Lys Ile Asp Ser Gln His Val
        35                  40                  45
Asp Glu Val Ile Met Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn
    50                  55                  60
Pro Ala Arg Gln Ala Leu Leu Lys Ser Gly Leu Ala Glu Thr Val Cys
65                  70                  75                  80
Gly Phe Thr Val Asn Lys Val Cys Gly Ser Gly Leu Lys Ser Val Ala
                85                  90                  95
Leu Ala Ala Gln Ala Ile Gln Ala Gly Gln Ala Gln Ser Ile Val Ala
            100                 105                 110
Gly Gly Met Glu Asn Met Ser Leu Ala Pro Tyr Leu Leu Asp Ala Lys
        115                 120                 125
Ala Arg Ser Gly Tyr Arg Leu Gly Asp Gly Gln Val Tyr Asp Val Ile
    130                 135                 140
Leu Arg Asp Gly Leu Met Cys Ala Thr His Gly Tyr His Met Gly Ile
145                 150                 155                 160
Thr Ala Glu Asn Val Ala Lys Glu Tyr Gly Ile Thr Arg Glu Met Gln
                165                 170                 175
Asp Glu Leu Ala Leu His Ser Gln Arg Lys Ala Ala Ala Ala Ile Glu
            180                 185                 190
Ser Gly Ala Phe Thr Ala Glu Ile Val Pro Val Asn Val Val Thr Arg
        195                 200                 205
Lys Lys Thr Phe Val Phe Ser Gln Asp Glu Phe Pro Lys Ala Asn Ser
    210                 215                 220
Thr Ala Glu Ala Leu Gly Ala Leu Arg Pro Ala Phe Asp Lys Ala Gly
225                 230                 235                 240
Thr Val Thr Ala Gly Asn Ala Ser Gly Ile Asn Asp Gly Ala Ala Ala
                245                 250                 255
Leu Val Ile Met Glu Glu Ser Ala Ala Leu Ala Ala Gly Leu Thr Pro
            260                 265                 270
Leu Ala Arg Ile Lys Ser Tyr Ala Ser Gly Gly Val Pro Pro Ala Leu
    275                 280                 285
Met Gly Met Gly Pro Val Pro Ala Thr Gln Lys Ala Leu Gln Leu Ala
290                 295                 300
Gly Leu Gln Leu Ala Asp Ile Asp Leu Ile Glu Ala Asn Glu Ala Phe
305                 310                 315                 320
Ala Ala Gln Phe Leu Ala Val Gly Lys Asn Leu Gly Phe Asp Ser Glu
                325                 330                 335
Lys Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly
            340                 345                 350
Ala Ser Gly Ala Arg Ile Leu Val Thr Leu Leu His Ala Met Gln Ala
        355                 360                 365
Arg Asp Lys Thr Leu Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln
    370                 375                 380
Gly Ile Ala Met Val Ile Glu Arg Leu Asn
385                 390
<210>130
<211>1182
<212>DNA
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>130
ttaatgaacc tgcactaaga cggcgtctcc ctgtgctgcc ccgctgcaaa tagcggcaac   60
gcccagaccc cctccccgtc gctttaattc ataaacaagc gtcatgagaa ttctcgcacc  120
gctcgcgccg atcgggtggc cgagcgcgat cgcaccgcca ttcacattta ctttttcaag  180
atcgaaacct acgatttttt cacatgtcaa aacaactgaa gcaaaagctt catttacttc  240
aaacaagtca atatcttgga cagttaaacc attctttttc aggagcttgt taatagcaaa   300
ccctggcgct gccgccagct cgtgcgctgg cattcccgta gttgaaaaac caagaattgt   360
agccagaggc cgtttgccaa gctcagcagc tttttcctca gacatcagca cgaacgcgcc   420
ggctccgtca ttgactccag gagcattgcc ggctgtgata gaaccgtcac ttgcataaat   480
cggagcaagt tttgcgagct gatccagact tgtgtcacgg cgaatcgctt catctttatc   540
aacaacgttt ggttttcctt ttcgaccgat ccagttgacg ggaacaattt catcctgaaa   600
cttcccttca tcggcggcct tagctgccct tgcatgactt ctcaacgccc attcgtcctg   660
ctctcttcgt gagattgcat attccttggc agctgtattt ccgtgaacag ccatgtgcac   720
ctcgtcaaat gcgcacgtta atccgtcata caccattaag tccctaagct cgccgtcccc   780
catccgtgct ccccagcgcc cggcgggaac ggcatacgga atattgctca tgctttccat   840
cccccccgca acaagtatgt ccgcatcctg cgcccgaatc atttgatcac ataaagtgac   900
agcgcgaagg ccggaagcac agactttatt cagtgtttct gacggcacac tccaaggcat   960
tcccgccaga cgggcagctt gacgggaagg tatctgccct gagccggcct ggacaaccat  1020
gcccatgacg tttccttcta catcatctcc agagactcca gcctgttgca gcgcctcctt  1080
catcacaatg cccccaagct cagcagcttt cacctctttc aaaactccgc cgaatttgcc  1140
aaatggagtt cttgcagcac ttacaatgac tgttttcctc at                     1182
<210>131
<211>393
<212>PRT
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>131
Met Arg Lys Thr Val Ile Val Ser Ala Ala Arg Thr Pro Phe Gly Lys
1               5                   10                  15
Phe Gly Gly Val Leu Lys Glu Val Lys Ala Ala Glu Leu Gly Gly Ile
            20                  25                  30
Val Met Lys Glu Ala Leu Gln Gln Ala Gly Val Ser Gly Asp Asp Val
        35                  40                  45
Glu Gly Asn Val Met Gly Met Val Val Gln Ala Gly Ser Gly Gln Ile
    50                  55                  60
Pro Ser Arg Gln Ala Ala Arg Leu Ala Gly Met Pro Trp Ser Val Pro
65                  70                  75                  80
Ser Glu Thr Leu Asn Lys Val Cys Ala Ser Gly Leu Arg Ala Val Thr
                85                  90                  95
Leu Cys Asp Gln Met Ile Arg Ala Gln Asp Ala Asp Ile Leu Val Ala
            100                 105                 110
Gly Gly Met Glu Ser Met Ser Asn Ile Pro Tyr Ala Val Pro Ala Gly
        115                 120                 125
Arg Trp Gly Ala Arg Met Gly Asp Gly Glu Leu Arg Asp Leu Met Val
    130                 135                 140
Tyr Asp Gly Leu Thr Cys Ala Phe Asp Glu Val His Met Ala Val His
145                 150                 155                 160
Gly Asn Thr Ala Ala Lys Glu Tyr Ala Ile Ser Arg Arg Glu Gln Asp
                165                 170                 175
Glu Trp Ala Leu Arg Ser His Ala Arg Ala Ala Lys Ala Ala Asp Glu
            180                 185                 190
Gly Lys Phe Gln Asp Glu Ile Val Pro Val Asn Trp Ile Gly Arg Lys
        195                 200                 205
Gly Lys Pro Asn Val Val Asp Lys Asp Glu Ala Ile Arg Arg Asp Thr
    210                 215                 220
Ser Leu Asp Gln Leu Ala Lys Leu Ala Pro Ile Tyr Ala Ser Asp Gly
225                 230                 235                 240
Ser Ile Thr Ala Gly Asn Ala Pro Gly Val Asn Asp Gly Ala Gly Ala
                245                 250                 255
Phe Val Leu Met Ser Glu Glu Lys Ala Ala Glu Leu Gly Lys Arg Pro
            260                 265                 270
Leu Ala Thr Ile Leu Gly Phe Ser Thr Thr Gly Met Pro Ala His Glu
        275                 280                 285
Leu Ala Ala Ala Pro Gly Phe Ala Ile Asn Lys Leu Leu Lys Lys Asn
    290                 295                 300
Gly Leu Thr Val Gln Asp Ile Asp Leu Phe Glu Val Asn Glu Ala Phe
305                 310                 315                 320
Ala Ser Val Val Leu Thr Cys Glu Lys Ile Val Gly Phe Asp Leu Glu
                325                 330                 335
Lys Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly
            340                 345                 350
Ala Ser Gly Ala Arg Ile Leu Met Thr Leu Val Tyr Glu Leu Lys Arg
        355                 360                 365
Arg Gly Gly Gly Leu Gly Val Ala Ala Ile Cys Ser Gly Ala Ala Gln
    370                 375                 380
Gly Asp Ala Val Leu Val Gln Val His
385                 390
<210>132
<211>1197
<212>DNA
<213>啤酒糖酵母(Saccharomyces cerevisiae)
<400>132
atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt   60
tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct  120
aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt  180
tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat  240
catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg  300
ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct  360
atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact  420
gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg  480
ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat  540
tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat  600
gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag  660
gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa  720
aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc  780
gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc  840
aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca  900
gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa   960
ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca  1020
tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt  1080
gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt  1140
gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga     1197
<210>133
<211>398
<212>PRT
<213>啤酒糖酵母(Saccharomyces cerevisiae)
<400>133
Met Ser Gln Asn Val Tyr Ile Val Ser Thr Ala Arg Thr Pro Ile Gly
1               5                   10                  15
Ser Phe Gln Gly Ser Leu Ser Ser Lys Thr Ala Val Glu Leu Gly Ala
            20                  25                  30
Val Ala Leu Lys Gly Ala Leu Ala Lys Val Pro Glu Leu Asp Ala Ser
        35                  40                  45
Lys Asp Phe Asp Glu Ile Ile Phe Gly Asn Val Leu Ser Ala Asn Leu
    50                  55                  60
Gly Gln Ala Pro Ala Arg Gln Val Ala Leu Ala Ala Gly Leu Ser Asn
65                  70 7                 5                  80
His Ile Val Ala Ser Thr Val Asn Lys Val Cys Ala Ser Ala Met Lys
                85                  90                  95
Ala Ile Ile Leu Gly Ala Gln Ser Ile Lys Cys Gly Asn Ala Asp Val
            100                 105                 110
Val Val Ala Gly Gly Cys Glu Ser Met Thr Asn Ala Pro Tyr Tyr Met
        115                 120                 125
Pro Ala Ala Arg Ala Gly Ala Lys Phe Gly Gln Thr Val Leu Val Asp
    130                 135                 140
Gly Val Glu Arg Asp Gly Leu Asn Asp Ala Tyr Asp Gly Leu Ala Met
145                 150                 155                 160
Gly Val His Ala Glu Lys Cys Ala Arg Asp Trp Asp Ile Thr Arg Glu
                165                 170                 175
Gln Gln Asp Asn Phe Ala Ile Glu Ser Tyr Gln Lys Ser Gln Lys Ser
            180                 185                 190
Gln Lys Glu Gly Lys Phe Asp Asn Glu Ile Val Pro Val Thr Ile Lys
        195                 200                 205
Gly Phe Arg Gly Lys Pro Asp Thr Gln Val Thr Lys Asp Glu Glu Pro
    210                 215                 220
Ala Arg Leu His Val Glu Lys Leu Arg Ser Ala Arg Thr Val Phe Gln
225                 230                 235                 240
Lys Glu Asn Gly Thr Val Thr Ala Ala Asn Ala Ser Pro Ile Asn Asp
                245                 250                 255
Gly Ala Ala Ala Val Ile Leu Val Ser Glu Lys Val Leu Lys Glu Lys
            260                 265                 270
Asn Leu Lys Pro Leu Ala Ile Ile Lys Gly Trp Gly Glu Ala Ala His
        275                 280                 285
Gln Pro Ala Asp Phe Thr Trp Ala Pro Ser Leu Ala Val Pro Lys Ala
    290                 295                 300
Leu Lys His Ala Gly Ile Glu Asp Ile Asn Ser Val Asp Tyr Phe Glu
305                 310                 315                 320
Phe Asn Glu Ala Phe Ser Val Val Gly Leu Val Asn Thr Lys Ile Leu
                325                 330                 335
Lys Leu Asp Pro Ser Lys Val Asn Val Tyr Gly Gly Ala Val Ala Leu
            340                 345                 350
Gly His Pro Leu Gly Cys Ser Gly Ala Arg Val Val Val Thr Leu Leu
        355                 360                 365
Ser Ile Leu Gln Gln Glu Gly Gly Lys Ile Gly Val Ala Ala Ile Cys
    370                 375                 380
Asn Gly Gly Gly Gly Ala Ser Ser Ile Val Ile Glu Lys Ile
385                 390                 395
<210>134
<211>864
<212>DNA
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>134
atggaaatca aacaaatcat ggtagctggc gcaggtcaga tggggagcgg aattgctcaa   60
acagccgccg acgcgggctt ttatgtgcgg atgtatgatg tgaatccaga ggccgcggag  120
gcaggattga aacggctgaa gaaacagctg gcccgtgatg ctgagaaagg aaaaaggacc  180
gagacggaag tgaagagcgt aatcaaccgc atttcgattt ctcaaacact tgaggaggca  240
gagcatgcgg acattgtgat tgaggctatc gcagaaaaca tggcggcaaa aactgagatg  300
tttaaaacac ttgatcgcat ttgcccgcct catacgattt tggccagcaa tacatcttcc  360
ttgcctatta cagaaatcgc tgctgtaaca aaccggcctc aacgggttat tggcatgcat  420
tttatgaatc ccgtccctgt aatgaagctg gtagaagtga ttcgaggctt ggctacatca  480
gaagaaacgg ccttagatgt tatggcatta gcggaaaaga tggggaaaac agcggtagaa  540
gtcaatgatt ttcctgggtt tgtttccaac cgtgtgcttc ttccaatgat taatgaagcc  600
atctattgcg tgtatgaggg agtggcgaag ccggaggcaa tagatgaagt gatgaagctg  660
ggcatgaatc atccgatggg tccgcttgca ttagcggatt ttatcggact ggatacgtgt  720
ttatcaatta tggaagtcct tcactcaggc cttggcgatt ccaaataccg tccttgcccg  780
ctgctccgca agtatgtcaa agcaggctgg cttggcaaaa agagcggacg cggtttttat  840
gactatgagg agaagacttc ctga                                         864
<210>135
<211>287
<212>PRT
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>135
Met Glu Ile Lys Gln Ile Met Val Ala Gly Ala Gly Gln Met Gly Ser
1               5                   10                  15
Gly Ile Ala Gln Thr Ala Ala Asp Ala Gly Phe Tyr Val Arg Met Tyr
            20                  25                  30
Asp Val Asn Pro Glu Ala Ala Glu Ala Gly Leu Lys Arg Leu Lys Lys
        35                  40                  45
Gln Leu Ala Arg Asp Ala Glu Lys Gly Lys Arg Thr Glu Thr Glu Val
    50                  55                  60
Lys Ser Val Ile Asn Arg Ile Ser Ile Ser Gln Thr Leu Glu Glu Ala
65                  70                  75                  80
Glu His Ala Asp Ile Val Ile Glu Ala Ile Ala Glu Asn Met Ala Ala
                85                  90                  95
Lys Thr Glu Met Phe Lys Thr Leu Asp Arg Ile Cys Pro Pro His Thr
            100                 105                 110
Ile Leu Ala Ser Asn Thr Ser Ser Leu Pro Ile Thr Glu Ile Ala Ala
        115                 120                 125
Val Thr Asn Arg Pro Gln Arg Val Ile Gly Met His Phe Met Asn Pro
    130                 135                 140
Val Pro Val Met Lys Leu Val Glu Val Ile Arg Gly Leu Ala Thr Ser
145                 150                 155                 160
Glu Glu Thr Ala Leu Asp Val Met Ala Leu Ala Glu Lys Met Gly Lys
                165                 170                 175
Thr Ala Val Glu Val Asn Asp Phe Pro Gly Phe Val Ser Asn Arg Val
            180                 185                 190
Leu Leu Pro Met Ile Asn Glu Ala Ile Tyr Cys Val Tyr Glu Gly Val
        195                 200                 205
Ala Lys Pro Glu Ala Ile Asp Glu Val Met Lys Leu Gly Met Asn His
    210                 215                 220
Pro Met Gly Pro Leu Ala Leu Ala Asp Phe Ile Gly Leu Asp Thr Cys
225                 230                 235                 240
Leu Ser Ile Met Glu Val Leu His Ser Gly Leu Gly Asp Ser Lys Tyr
                245                 250                 255
Arg Pro Cys Pro Leu Leu Arg Lys Tyr Val Lys Ala Gly Trp Leu Gly
            260                 265                 270
Lys Lys Ser Gly Arg Gly Phe Tyr Asp Tyr Glu Glu Lys Thr Ser
        275                 280                 285
<210>136
<211>855
<212>DNA
<213>富养罗尔斯通氏菌(Ralstonia eutropha)
<400>136
atggcaatca ggacagtggg catcgtgggt gccggcacca tgggcaacgg catcgcgcag   60
gcttgtgcgg tggtgggcct ggacgtggtg atggtggata tcagcgacgc agcggtgcag  120
aagggcatcg ccaccgtcgc cggcagcctg gaccgcctga tcaagaagga caagatcagc  180
gaagccgaca agatgactgc gctcgcgcgc atccacggca gcaccgcgta tgacgacctg  240
aagaaggccg atatcgtgat cgaggccgcc accgagaact ttgacctgaa ggtcaagatc  300
ctcaagcaga tcgacagcat cgtcggcgag aacgtcatca ttgcttcgaa cacgtcgtcg  360
atctcgatca ccaagctggc cgccgtgacg agtcgccccg agcgcttcat cggcatgcac  420
ttcttcaacc cggtgccggt gatggcgctg gtggaactga tccgcggcct gcagaccagc  480
gacgcggctc acgccgatgt cgaggcgctg gccaaggaac tgggcaagta cccgatcacc  540
gtcaagaaca gcccgggctt cgtcgtcaac cgcatcctgt gcccgatgat caacgaagcc  600
ttctgcgtgc tcggtgaagg cctggcctcg ccggaagaga tcgacgaagg catgaagctc  660
ggctgcaacc atccgatcgg ccccctggca ctggccgaca tgatcggcct ggacaccatg  720
ctggcagtga tggaagtgct gtacacagaa tttgccgacc cgaagtatcg tccggccatg  780
ctgatgcgcg agatggtggc tgcggggtat ctgggccgca agactggccg tggcgtgtac  840
gtctacagca agtaa                                                   855
<210>137
<211>284
<212>PRT
<213>富养罗尔斯通氏菌(Ralstonia eutropha)
<400>137
Met Ala Ile Arg Thr Val Gly Ile Val Gly Ala Gly Thr Met Gly Asn
1               5                   10                  15
Gly Ile Ala Gln Ala Cys Ala Val Val Gly Leu Asp Val Val Met Val
            20                  25                  30
Asp Ile Ser Asp Ala Ala Val Gln Lys Gly Ile Ala Thr Val Ala Gly
        35                  40                  45
Ser Leu Asp Arg Leu Ile Lys Lys Asp Lys Ile Ser Glu Ala Asp Lys
    50                  55                  60
Met Thr Ala Leu Ala Arg Ile His Gly Ser Thr Ala Tyr Asp Asp Leu
65                  70                  75                  80
Lys Lys Ala Asp Ile Val Ile Glu Ala Ala Thr Glu Asn Phe Asp Leu
                85                  90                  95
Lys Val Lys Ile Leu Lys Gln Ile Asp Ser Ile Val Gly Glu Asn Val
            100                 105                 110
Ile Ile Ala Ser Asn Thr Ser Ser Ile Ser Ile Thr Lys Leu Ala Ala
        115                 120                 125
Val Thr Ser Arg Pro Glu Arg Phe Ile Gly Met His Phe Phe Asn Pro
    130                 135                 140
Val Pro Val Met Ala Leu Val Glu Leu Ile Arg Gly Leu Gln Thr Ser
145                 150                 155                 160
Asp Ala Ala His Ala Asp Val Glu Ala Leu Ala Lys Glu Leu Gly Lys
                165                 170                 175
Tyr Pro Ile Thr Val Lys Asn Ser Pro Gly Phe Val Val Asn Arg Ile
            180                 185                 190
Leu Cys Pro Met Ile Asn Glu Ala Phe Cys Val Leu Gly Glu Gly Leu
        195                 200                 205
Ala Ser Pro Glu Glu Ile Asp Glu Gly Met Lys Leu Gly Cys Asn His
    210                 215                 220
Pro Ile Gly Pro Leu Ala Leu Ala Asp Met Ile Gly Leu Asp Thr Met
225                 230                 235                 240
Leu Ala Val Met Glu Val Leu Tyr Thr Glu Phe Ala Asp Pro Lys Tyr
                245                 250                 255
Arg Pro Ala Met Leu Met Arg Glu Met Val Ala Ala Gly Tyr Leu Gly
            260                 265                 270
Arg Lys Thr Gly Arg Gly Val Tyr Val Tyr Ser Lys
        275                 280
<210>138
<211>741
<212>DNA
<213>真养产碱菌(Alcaligenes eutrophis)
<400>138
atgactcagc gcattgcgta tgtgaccggc ggcatgggtg gtatcggaac cgccatttgc   60
cagcggctgg ccaaggatgg ctttcgtgtg gtggccggtt gcggccccaa ctcgccgcgc  120
cgcgaaaagt ggctggagca gcagaaggcc ctgggcttcg atttcattgc ctcggaaggc  180
aatgtggctg actgggactc gaccaagacc gcattcgaca aggtcaagtc cgaggtcggc  240
gaggttgatg tgctgatcaa caacgccggt atcacccgcg acgtggtgtt ccgcaagatg  300
acccgcgccg actgggatgc ggtgatcgac accaacctga cctcgctgtt caacgtcacc  360
aagcaggtga tcgacggcat ggccgaccgt ggctggggcc gcatcgtcaa catctcgtcg  420
gtgaacgggc agaagggcca gttcggccag accaactact ccaccgccaa ggccggcctg  480
catggcttca ccatggcact ggcgcaggaa gtggcgacca agggcgtgac cgtcaacacg  540
gtctctccgg gctatatcgc caccgacatg gtcaaggcga tccgccagga cgtgctcgac  600
aagatcgtcg cgacgatccc ggtcaagcgc ctgggcctgc cggaagagat cgcctcgatc  660
tgcgcctggt tgtcgtcgga ggagtccggt ttctcgaccg gcgccgactt ctcgctcaac  720
ggcggcctgc atatgggctg a                                            741
<210>139
<211>246
<212>PRT
<213>真养产碱菌(Alcaligenes eutrophus)
<400>139
Met Thr Gln Arg Ile Ala Tyr Val Thr Gly Gly Met Gly Gly Ile Gly
1               5                   10                  15
Thr Ala Ile Cys Gln Arg Leu Ala Lys Asp Gly Phe Arg Val Val Ala
            20                  25                  30
Gly Cys Gly Pro Asn Ser Pro Arg Arg Glu Lys Trp Leu Glu Gln Gln
        35                  40                  45
Lys Ala Leu Gly Phe Asp Phe Ile Ala Ser Glu Gly Asn Val Ala Asp
    50                  55                  60
Trp Asp Ser Thr Lys Thr Ala Phe Asp Lys Val Lys Ser Glu Val Gly
65                  70                  75                  80
Glu Val Asp Val Leu Ile Asn Asn Ala Gly Ile Thr Arg Asp Val Val
                85                  90                  95
Phe Arg Lys Met Thr Arg Ala Asp Trp Asp Ala Val Ile Asp Thr Asn
            100                 105                 110
Leu Thr Ser Leu Phe Asn Val Thr Lys Gln Val Ile Asp Gly Met Ala
        115                 120                 125
Asp Arg Gly Trp Gly Arg Ile Val Asn Ile Ser Ser Val Asn Gly Gln
    130                 135                 140
Lys Gly Gln Phe Gly Gln Thr Asn Tyr Ser Thr Ala Lys Ala Gly Leu
145                 150                 155                 160
His Gly Phe Thr Met Ala Leu Ala Gln Glu Val Ala Thr Lys Gly Val
                165                 170                 175
Thr Val Asn Thr Val Ser Pro Gly Tyr Ile Ala Thr Asp Met Val Lys
            180                 185                 190
Ala Ile Arg Gln Asp Val Leu Asp Lys Ile Val Ala Thr Ile Pro Val
        195                 200                 205
Lys Arg Leu Gly Leu Pro Glu Glu Ile Ala Ser Ile Cys Ala Trp Leu
    210                 215                 220
Ser Ser Glu Glu Ser Gly Phe Ser Thr Gly Ala Asp Phe Ser Leu Asn
225                 230                 235                 240
Gly Gly Leu His Met Gly
                245
<210>140
<211>768
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>140
atgagcgaac tgatcgtcag ccgtcagcaa cgagtattgt tgctgaccct taaccgtccc   60
gccgcacgta atgcgctaaa taatgccctg ctgatgcaac tggtaaatga actggaagct  120
gcggctaccg ataccagcat ttcggtctgt gtgattaccg gtaatgcacg cttttttgcc  180
gctggggccg atctcaacga aatggcagaa aaagatctcg cggccacctt aaacgataca  240
cgtccgcagc tatgggcgcg attgcaggcc tttaataaac cacttatcgc agccgtcaat  300
ggttacgcgc ttggggcggg ttgcgaactg gcattgttgt gcgatgtggt ggttgccgga  360
gagaacgcgc gttttgggtt gccggaaatc actctcggca tcatgcctgg cgcaggcgga  420
acgcaacgtt taatccgtag tgtcggtaaa tcgttagcca gcaaaatggt gctgagcgga  480
gaaagtatca ccgctcagca agcacagcag gccgggctgg ttagcgacgt cttccccagc  540
gatttaaccc tcgaatacgc cttacagctg gcatcgaaaa tggcacgtca ctcgccgctg  600
gccttacaag cggcaaagca agcgctgcgc cagtcgcagg aagtggcttt gcaagccgga  660
cttgcccagg agcgacagtt attcaccttg ctggcggcaa cagaagatcg tcatgaaggc  720
atctccgctt tcttacaaaa acgcacgccc gactttaaag gacgctaa          768
<210>141
<211>255
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>141
Met Ser Glu Leu Ile Val Ser Arg Gln Gln Arg Val Leu Leu Leu Thr
1               5                   10                  15
Leu Asn Arg Pro Ala Ala Arg Asn Ala Leu Asn Asn Ala Leu Leu Met
            20                  25                  30
Gln Leu Val Asn Glu Leu Glu Ala Ala Ala Thr Asp Thr Ser Ile Ser
        35                  40                  45
Val Cys Val Ile Thr Gly Asn Ala Arg Phe Phe Ala Ala Gly Ala Asp
    50                  55                  60
Leu Asn Glu Met Ala Glu Lys Asp Leu Ala Ala Thr Leu Asn Asp Thr
65                  70                  75                  80
Arg Pro Gln Leu Trp Ala Arg Leu Gln Ala Phe Asn Lys Pro Leu Ile
                85                  90                  95
Ala Ala Val Asn Gly Tyr Ala Leu Gly Ala Gly Cys Glu Leu Ala Leu
            100                 105                 110
Leu Cys Asp Val Val Val Ala Gly Glu Asn Ala Arg Phe Gly Leu Pro
        115                 120                 125
Glu Ile Thr Leu Gly Ile Met Pro Gly Ala Gly Gly Thr Gln Arg Leu
    130                 135                 140
Ile Arg Ser Val Gly Lys Ser Leu Ala Ser Lys Met Val Leu Ser Gly
145                 150                 155                 160
Glu Ser Ile Thr Ala Gln Gln Ala Gln Gln Ala Gly Leu Val Ser Asp
               165                 170                 175
Val Phe Pro Ser Asp Leu Thr Leu Glu Tyr Ala Leu Gln Leu Ala Ser
            180                 185                 190
Lys Met Ala Arg His Ser Pro Leu Ala Leu Gln Ala Ala Lys Gln Ala
        195                 200                 205
Leu Arg Gln Ser Gln Glu Val Ala Leu Gln Ala Gly Leu Ala Gln Glu
    210                 215                 220
Arg Gln Leu Phe Thr Leu Leu Ala Ala Thr Glu Asp Arg His Glu Gly
225                 230                 235                 240
Ile Ser Ala Phe Leu Gln Lys Arg Thr Pro Asp Phe Lys Gly Arg
                245                 250                 255
<210>142
<211>783
<212>DNA
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>142
atgggagatt ctattctttt tactgttaaa aatgaacata tggcgttgat caccttaaac   60
aggcctcagg cagcaaatgc tctttcagcg gaaatgctta gaaacctgca aatgattatc  120
caggaaattg aatttaactc aaacatccgt tgcgtcatcc tcacaggcac cggtgaaaaa  180
gcgttttgtg caggggcaga cctgaaggaa cggataaaac tgaaagaaga tcaggttctg  240
gaaagtgtat ctctcattca aagaacggcg gctttacttg atgccttgcc gcagccggtc  300
atagctgcga taaatggaag cgcattaggc ggcggactag aattggcatt ggcatgcgac  360
cttcgaatcg caactgaagc agctgtgctg ggacttccgg aaacagggtt agctattatc  420
ccgggcgctg gagggaccca aaggctgccc cggctgattg gcagaggaaa agcaaaagaa  480
ttcatttata caggcagacg cgtgaccgca cacgaagcaa aagaaatcgg ccttgtagag  540
catgtcacgg ctccttgtga ccttatgcca aaagcagagg aactggccgc agccatttct  600
gccaacggac cgatcgctgt ccgtcaggct aaatttgcaa tcaataaagg attggagaca  660
gatcttgcta caggccttgc gattgaacaa aaagcgtatg aacaaaccat cccgacaaaa  720
gacaggagag aagggcttca ggcctttcaa gaaaaaagac gggccgtata caagggaata  780
taa                                                                783
<210>143
<211>260
<212>PRT
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>143
Met Gly Asp Ser Ile Leu Phe Thr Val Lys Asn Glu His Met Ala Leu
1               5                   10                  15
Ile Thr Leu Asn Arg Pro Gln Ala Ala Asn Ala Leu Ser Ala Glu Met
            20                  25 3                 0
Leu Arg Asn Leu Gln Met Ile Ile Gln Glu Ile Glu Phe Asn Ser Asn
        35                  40                  45
Ile Arg Cys Val Ile Leu Thr Gly Thr Gly Glu Lys Ala Phe Cys Ala
    50                  55                  60
Gly Ala Asp Leu Lys Glu Arg Ile Lys Leu Lys Glu Asp Gln Val Leu
65                  70                  75                  80
Glu Ser Val Ser Leu Ile Gln Arg Thr Ala Ala Leu Leu Asp Ala Leu
                85                  90                  95
Pro Gln Pro Val Ile Ala Ala Ile Asn Gly Ser Ala Leu Gly Gly Gly
            100                 105                 110
Leu Glu Leu Ala Leu Ala Cys Asp Leu Arg Ile Ala Thr Glu Ala Ala
        115                 120                 125
Val Leu Gly Leu Pro Glu Thr Gly Leu Ala Ile Ile Pro Gly Ala Gly
    130                 135                 140
Gly Thr Gln Arg Leu Pro Arg Leu Ile Gly Arg Gly Lys Ala Lys Glu
145                 150                 155                 160
Phe Ile Tyr Thr Gly Arg Arg Val Thr Ala His Glu Ala Lys Glu Ile
                165                 170                 175
Gly Leu Val Glu His Val Thr Ala Pro Cys Asp Leu Met Pro Lys Ala
            180                 185                 190
Glu Glu Leu Ala Ala Ala Ile Ser Ala Asn Gly Pro Ile Ala Val Arg
        195                 200                 205
Gln Ala Lys Phe Ala Ile Asn Lys Gly Leu Glu Thr Asp Leu Ala Thr
    210                 215                 220
Gly Leu Ala Ile Glu Gln Lys Ala Tyr Glu Gln Thr Ile Pro Thr Lys
225                 230                 235                 240
Asp Arg Arg Glu Gly Leu Gln Ala Phe Gln Glu Lys Arg Arg Ala Val
                    245                 250                 255
Tyr Lys Gly Ile
            260
<210>144
<211>405
<212>DNA
<213>豚鼠气单胞菌(Aeromonas caviae)
<400>144
atgagcgcac aatccctgga agtaggccag aaggcccgtc tcagcaagcg gttcggggcg   60
gcggaggtag ccgccttcgc cgcgctctcg gaggacttca accccctgca cctggacccg  120
gccttcgccg ccaccacggc gttcgagcgg cccatagtcc acggcatgct gctcgccagc  180
ctcttctccg ggctgctggg ccagcagttg ccgggcaagg ggagcatcta tctgggtcaa  240
agcctcagct tcaagctgcc ggtctttgtc ggggacgagg tgacggccga ggtggaggtg  300
accgcccttc gcgaggacaa gcccatcgcc accctgacca cccgcatctt cacccaaggc  360
ggcgccctcg ccgtgacggg ggaagccgtg gtcaagctgc cttaa                  405
<210>145
<211>134
<212>PRT
<213>豚鼠气单胞菌(Aeromonas caviae)
<400>145
Met Ser Ala Gln Ser Leu Glu Val Gly Gln Lys Ala Arg Leu Ser Lys
1               5                   10                  15
Arg Phe Gly Ala Ala Glu Val Ala Ala Phe Ala Ala Leu Ser Glu Asp
            20                  25                  30
Phe Asn Pro Leu His Leu Asp Pro Ala Phe Ala Ala Thr Thr Ala Phe
        35                  40                  45
Glu Arg Pro Ile Val His Gly Met Leu Leu Ala Ser Leu Phe Ser Gly
    50                  55                  60
Leu Leu Gly Gln Gln Leu Pro Gly Lys Gly Ser Ile Tyr Leu Gly Gln
65                  70                  75                  80
Ser Leu Ser Phe Lys Leu Pro Val Phe Val Gly Asp Glu Val Thr Ala
                85                  90                  95
Glu Val Glu Val Thr Ala Leu Arg Glu Asp Lys Pro Ile Ala Thr Leu
            100                 105                 110
Thr Thr Arg Ile Phe Thr Gln Gly Gly Ala Leu Ala Val Thr Gly Glu
        115                 120                 125
Ala Val Val Lys Leu Pro
    130
<210>146
<211>1912
<212>DNA
<213>小眼虫(Euglena gracilis)
<400>146
ttttcgcccg tgcaccacga tgtcgtgccc cgcctcgccg tctgctgccg tggtgtctgc   60
cggcgccctc tgcctgtgcg tggcaacggt attgttggcg actggatcca accccaccgc  120
cctgtccact gcttccactc gctctccgac ctcactggtc cgtggggtgg acaggggctt  180
gatgaggcca accactgcag cggctctgac gacaatgaga gaggtgcccc agatggctga  240
gggattttca ggcgaagcca cgtctgcatg ggccgccgcg gggccgcagt gggcggcgcc  300
gctcgtggcc gcggcctcct ccgcactggc gctgtggtgg tgggccgccc ggcgcagcgt    360
gcggcggccg ctggcagcgc tggcggagct gcccaccgcg gtcacccacc tggccccccc    420
gatggcgatg ttcaccacca cagcgaaggt catccagccc aagattcgtg gcttcatctg    480
cacgaccacc cacccgatcg gctgtgagaa gcgggtccag gaggagatcg cgtacgcccg    540
tgcccacccg cccaccagcc ctggcccgaa gagggtgctg gtcatcggct gcagtaccgg    600
ctacgggctc tccacccgca tcaccgctgc cttcggctac caggccgcca cgctgggcgt    660
gttcctggcg ggccccccga cgaagggccg ccccgccgcg gcgggctggt acaacaccgt    720
ggcgttcgag aaggccgccc tggaggccgg gctgtacgcc cggagcctta atggcgacgc    780
cttcgactcc acaacgaagg cgcggacggt cgaggcgatc aagcgggacc tcggcacggt    840
ggacctcgtg gtgtacagca tcgccgcccc gaagcggacg gaccctgcca ccggcgtcct    900
ccacaaggcc tgcctgaagc ccatcggcgc cacgtacacc aaccgcactg tgaacaccga    960
caaggcggag gtgaccgacg tcagcattga gccggcctcc cccgaagaga tcgcggacac   1020
ggtgaaggtg atgggcgggg aggactggga gctctggatc caggcgctgt cggaggccgg   1080
cgtgctggcg gagggggcca agacggtggc gtactcctac atcggccccg agatgacgtg   1140
gcctgtctac tggtccggca ccatcgggga ggccaagaag gacgtggaga aggctgccaa   1200
gcgcatcacg cagcagtacg gctgcccggc gtacccggtg gtggccaagg ccttggtcac   1260
ccaggccagc tccgccatcc cggtggtgcc gctctacatc tgcctgctgt accgcgttat   1320
gaaggagaag ggcacccacg agggctgcat cgagcagatg gtgcggctgc tcaccacgaa   1380
gctgtacccc gagaacgggg cccccatcgt cgatgaggcc ggacgtgtgc gggtggatga   1440
ctgggagatg gcggaggatg tgcagcaggc tgttaaggac ctctggagcc aggtgagcac   1500
tgccaacctc aaggacatct ccgacttcgc tgggtatcaa actgagttcc tgcggctgtt   1560
cgggttcggc attgacggcg tggactacga ccagcccgtg gacgtggagg cggacctccc   1620
cagtgctgcc cagcagtagg tgctggacgc cgcctctctc cggggggtct gccaaaatgg  1680
tcgctccccc aacccaaccc cctgcccacc atcggggtcc cgcgggtgaa tgcggccccc  1740
acccaaaggc aaaggtcaag gccggggccc caccgccaaa gggtaacaca tatgtatccg  1800
tcgggggctg atccgcgtgc gacacgggcc ataattgtgc cccacgggat gtccatgcgc  1860
ctaagacaac tgccccggcc gacagtcgct accgccttga gttccccagg ca          1912
<210>147
<211>539
<212>PRT
<213>小眼虫(Euglena gracilis)
<400>147
Met Ser Cys Pro Ala Ser Pro Ser Ala Ala Val Val Ser Ala Gly Ala
1               5                   10                  15
Leu Cys Leu Cys Val Ala Thr Val Leu Leu Ala Thr Gly Ser Asn Pro
            20                  25                  30
Thr Ala Leu Ser Thr Ala Ser Thr Arg Ser Pro Thr Ser Leu Val Arg
        35                  40                  45
Gly Val Asp Arg Gly Leu Met Arg Pro Thr Thr Ala Ala Ala Leu Thr
    50                  55                  60
Thr Met Arg Glu Val Pro Gln Met Ala Glu Gly Phe Ser Gly Glu Ala
65                  70                  75                  80
Thr Ser Ala Trp Ala Ala Ala Gly Pro Gln Trp Ala Ala Pro Leu Val
                85                  90                  95
Ala Ala Ala Ser Ser Ala Leu Ala Leu Trp Trp Trp Ala Ala Arg Arg
            100                 105                 110
Ser Val Arg Arg Pro Leu Ala Ala Leu Ala Glu Leu Pro Thr Ala Val
        115                 120                 125
Thr His Leu Ala Pro Pro Met Ala Met Phe Thr Thr Thr Ala Lys Val
    130                 135                 140
Ile Gln Pro Lys Ile Arg Gly Phe Ile Cys Thr Thr Thr His Pro Ile
145                 150                 155                 160
Gly Cys Glu Lys Arg Val Gln Glu Glu Ile Ala Tyr Ala Arg Ala His
                165                 170                 175
Pro Pro Thr Ser Pro Gly Pro Lys Arg Val Leu Val Ile Gly Cys Ser
            180                 185                 190
Thr Gly Tyr Gly Leu Ser Thr Arg Ile Thr Ala Ala Phe Gly Tyr Gln
        195                 200                 205
Ala Ala Thr Leu Gly Val Phe Leu Ala Gly Pro Pro Thr Lys Gly Arg
    210                 215                 220
Pro Ala Ala Ala Gly Trp Tyr Asn Thr Val Ala Phe Glu Lys Ala Ala
225                 230                 235                 240
Leu Glu Ala Gly Leu Tyr Ala Arg Ser Leu Asn Gly Asp Ala Phe Asp
                245                 250                 255
Ser Thr Thr Lys Ala Arg Thr Val Glu Ala Ile Lys Arg Asp Leu Gly
            260                 265                 270
Thr Val Asp Leu Val Val Tyr Ser Ile Ala Ala Pro Lys Arg Thr Asp
        275                 280                 285
Pro Ala Thr Gly Val Leu His Lys Ala Cys Leu Lys Pro Ile Gly Ala
    290                 295                 300
Thr Tyr Thr Asn Arg Thr Val Asn Thr Asp Lys Ala Glu Val Thr Asp
305                 310                 315                 320
Val Ser Ile Glu Pro Ala Ser Pro Glu Glu Ile Ala Asp Thr Val Lys
                325                 330                 335
Val Met Gly Gly Glu Asp Trp Glu Leu Trp Ile Gln Ala Leu Ser Glu
            340                 345                 350
Ala Gly Val Leu Ala Glu Gly Ala Lys Thr Val Ala Tyr Ser Tyr Ile
        355                 360                 365
Gly Pro Glu Met Thr Trp Pro Val Tyr Trp Ser Gly Thr Ile Gly Glu
    370                 375                 380
Ala Lys Lys Asp Val Glu Lys Ala Ala Lys Arg Ile Thr Gln Gln Tyr
385                 390                 395                 400
Gly Cys Pro Ala Tyr Pro Val Val Ala Lys Ala Leu Val Thr Gln Ala
                405                 410                 415
Ser Ser Ala Ile Pro Val Val Pro Leu Tyr Ile Cys Leu Leu Tyr Arg
            420                 425                 430
Val Met Lys Glu Lys Gly Thr His Glu Gly Cys Ile Glu Gln Met Val
        435                 440                 445
Arg Leu Leu Thr Thr Lys Leu Tyr Pro Glu Asn Gly Ala Pro Ile Val
    450                 455                 460
Asp Glu Ala Gly Arg Val Arg Val Asp Asp Trp Glu Met Ala Glu Asp
465                 470                 475                 480
Val Gln Gln Ala Val Lys Asp Leu Trp Ser Gln Val Ser Thr Ala Asn
                485                 490                 495
Leu Lys Asp Ile Ser Asp Phe Ala Gly Tyr Gln Thr Glu Phe Leu Arg
            500                 505                 510
Leu Phe Gly Phe Gly Ile Asp Gly Val Asp Tyr Asp Gln Pro Val Asp
        515                 520                 525
Val Glu Ala Asp Leu Pro Ser Ala Ala Gln Gln
    530                 535
<210>148
<211>1344
<212>DNA
<213>丘链霉菌(Sreptomyces collinus)
<400>148
gtgaccgtga aggacatcct ggacgcgatc cagtcgaagg acgccacgtc cgccgacttc   60
gccgccctgc agctccccga gtcgtaccgt gcgatcaccg tgcacaagga cgagacggag  120
atgttcgcgg gtctggagac ccgcgacaag gacccgcgca agtcgatcca cctcgacgag  180
gtgcccgtgc ccgaactggg cccgggcgaa gccctggtgg ccgtcatggc ctcctcggtc  240
aactacaact cggtgtggac ctcgatcttc gagccggtgt cgacgttcgc cttcctggag  300
cgctacggca agctgtcgcc gctgaccaag cgccacgacc tgccgtacca catcatcggc  360
tccgacctcg cgggcgtcgt cctgcgcacc ggccccggcg tcaacgcctg gcagcccggt  420
gacgaggtcg tcgcgcactg cctgagcgtc gagctggagt cgcccgacgg ccacgacgac  480
accatgctcg accccgagca gcgcatctgg ggcttcgaga ccaacttcgg cggcctcgcg   540
gagatcgcgc tggtcaagac gaaccagctg atgccgaagc cgaagcacct cacctgggag   600
gaggccgcgg ccccgggcct ggtgaactcc accgcctacc gccagctggt ctcccgcaac   660
ggcgccgcca tgaagcaggg cgacaacgtc ctgatctggg gcgcgagcgg cgggctcggc   720
tcgtacgcca cgcagttcgc gctcgcgggc ggtgccaacc cgatctgtgt cgtctcctcg   780
ccccagaagg cggagatctg ccgctcgatg ggcgccgagg cgatcatcga ccgcaacgcc   840
gagggctaca agttctggaa ggacgagcac acccaggacc ccaaggagtg gaagcgcttc   900
ggcaagcgca tccgcgagct gaccggcggc gaggacatcg acatcgtctt cgagcacccc   960
ggccgcgaga ccttcggcgc ctccgtctac gtcacccgca agggcggcac catcaccacc  1020
tgcgcctcga cctcgggcta catgcacgag tacgacaacc ggtacctgtg gatgtccctg  1080
aagcggatca tcggctcgca cttcgccaac taccgcgagg cgtacgaggc caaccgcctg  1140
atcgccaagg gcaagatcca cccgacgctg tcgaagacgt actccctgga ggagaccggc  1200
caggcggcgt acgacgtcca ccgcaacctg caccagggca aggtcggcgt cctgtgcctc  1260
gcgccggagg aaggcctcgg cgtgcgcgac gcggagatgc gcgcccagca catcgacgcc  1320
atcaaccgct tccgcaacgt ctga                                         1344
<210>149
<211>447
<212>PRT
<213>丘链霉菌(Streptomyces collinus)
<400>149
Met Thr Val Lys Asp Ile Leu Asp Ala Ile Gln Ser Lys Asp Ala Thr
1               5                   10                  15
Ser Ala Asp Phe Ala Ala Leu Gln Leu Pro Glu Ser Tyr Arg Ala Ile
            20                  25                  30
Thr Val His Lys Asp Glu Thr Glu Met Phe Ala Gly Leu Glu Thr Arg
        35                   40                 45
Asp Lys Asp Pro Arg Lys Ser Ile His Leu Asp Glu Val Pro Val Pro
    50                  55                  60
Glu Leu Gly Pro Gly Glu Ala Leu Val Ala Val Met Ala Ser Ser Val
65                  70                  75                  80
Asn Tyr Asn Ser Val Trp Thr Ser Ile Phe Glu Pro Val Ser Thr Phe
                85                  90                  95
Ala Phe Leu Glu Arg Tyr Gly Lys Leu Ser Pro Leu Thr Lys Arg His
            100                 105                 110
Asp Leu Pro Tyr His Ile Ile Gly Ser Asp Leu Ala Gly Val Val Leu
        115                 120                 125
Arg Thr Gly Pro Gly Val Asn Ala Trp Gln Pro Gly Asp Glu Val Val
    130                 135                 140
Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp Gly His Asp Asp
145                 150                 155                 160
Thr Met Leu Asp Pro Glu Gln Arg Ile Trp Gly Phe Glu Thr Asn Phe
                165                 170                 175
Gly Gly Leu Ala Glu Ile Ala Leu Val Lys Thr Asn Gln Leu Met Pro
            180                 185                 190
Lys Pro Lys His Leu Thr Trp Glu Glu Ala Ala Ala Pro Gly Leu Val
        195                 200                 205
Asn Ser Thr Ala Tyr Arg Gln Leu Val Ser Arg Asn Gly Ala Ala Met
    210                 215                 220
Lys Gln Gly Asp Asn Val Leu Ile Trp Gly Ala Ser Gly Gly Leu Gly
225                 230                 235                 240
Ser Tyr Ala Thr Gln Phe Ala Leu Ala Gly Gly Ala Asn Pro Ile Cys
                245                250                 255
Val Val Ser Ser Pro Gln Lys Ala Glu Ile Cys Arg Ser Met Gly Ala
            260                 265                 270
Glu Ala Ile Ile Asp Arg Asn Ala Glu Gly Tyr Lys Phe Trp Lys Asp
        275                 280                 285
Glu His Thr Gln Asp Pro Lys Glu Trp Lys Arg Phe Gly Lys Arg Ile
    290                 295                 300
Arg Glu Leu Thr Gly Gly Glu Asp Ile Asp Ile Val Phe Glu His Pro
305                 310                 315                 320
Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr Arg Lys Gly Gly
                325                 330                 335
Thr Ile Thr Thr Cys Ala Ser Thr Ser Gly Tyr Met His Glu Tyr Asp
            340                 345                 350
Asn Arg Tyr Leu Trp Met Ser Leu Lys Arg Ile Ile Gly Ser His Phe
        355                 360                 365
Ala Asn Tyr Arg Glu Ala Tyr Glu Ala Asn Arg Leu Ile Ala Lys Gly
    370                 375                 380
Lys Ile His Pro Thr Leu Ser Lys Thr Tyr Ser Leu Glu Glu Thr Gly
385                 390                 395                 400
Gln Ala Ala Tyr Asp Val His Arg Asn Leu His Gln Gly Lys Val Gly
                405                 410                 415
Val Leu Cys Leu Ala Pro Glu Glu Gly Leu Gly Val Arg Asp Ala Glu
            420                 425                 430
Met Arg Ala Gln His Ile Asp Ala Ile Asn Arg Phe Arg Asn Val
        435                 440                 445
<210>150
<211>1344
<212>DNA
<213>天蓝色链霉菌(Streptomyces coelicolor)
<400>150
gtgaccgtga aggacatcct ggacgcgatc cagtcgcccg actccacgcc ggccgacatc   60
gccgcactgc cgctccccga gtcgtaccgc gcgatcaccg tgcacaagga cgagaccgag  120
atgttcgcgg gcctcgagac ccgcgacaag gacccccgca agtcgatcca cctggacgac  180
gtgccggtgc ccgagctggg ccccggcgag gccctggtgg ccgtcatggc ctcctcggtc  240
aactacaact cggtgtggac ctcgatcttc gagccgctgt ccaccttcgg gttcctggag  300
cgctacggcc gggtcagcga cctcgccaag cggcacgacc tgccgtacca cgtcatcggc  360
tccgacctcg ccggtgtcgt cctgcgcacc ggtccgggcg tcaacgcctg gcaggcgggc  420
gacgaggtcg tcgcgcactg cctctccgtc gagctggagt cctccgacgg ccacaacgac  480
acgatgctcg accccgagca gcgcatctgg ggcttcgaga ccaacttcgg cggcctcgcg  540
gagatcgcgc tggtcaagtc caaccagctg atgccgaagc cggaccacct gagctgggag  600
gaggccgccg ctcccggcct ggtcaactcc accgcgtacc gccagctcgt ctcccgcaac   660
ggcgccggca tgaagcaggg cgacaacgtg ctcatctggg gcgcgagcgg cggactcggc   720
tcgtacgcca cccagttcgc cctcgccggc ggcgccaacc cgatctgcgt cgtctcctcg   780
ccgcagaagg cggagatctg ccgcgcgatg ggcgccgagg cgatcatcga ccgcaacgcc   840
gagggctacc ggttctggaa ggacgagaac acccaggacc cgaaggagtg gaagcgcttc   900
ggcaagcgca tccgcgaact gaccggcggc gaggacatcg acatcgtctt cgagcacccc   960
ggccgcgaga ccttcggcgc ctccgtcttc gtcacccgca agggcggcac catcaccacc  1020
tgcgcctcga cctcgggcta catgcacgag tacgacaacc gctacctgtg gatgtccctg  1080
aagcgcatca tcggctcgca cttcgccaac taccgcgagg cctgggaggc caaccgcctc  1140
atcgccaagg gcaggatcca ccccacgctc tccaaggtgt actccctcga ggacaccggc  1200
caggccgcct acgacgtcca ccgcaacctc caccagggca aggtcggcgt gctgtgcctg  1260
gcgcccgagg agggcctggg cgtgcgcgac cgggagaagc gcgcgcagca cctcgacgcc  1320
atcaaccgct tccggaacat ctga                                         1344
<210>151
<211>447
<212>PRT
<213>天蓝色链霉菌(Streptomyces coelicolor)
<400>151
Met Thr Val Lys Asp Ile Leu Asp Ala Ile Gln Ser Pro Asp Ser Thr
1               5                   10                  15
Pro Ala Asp Ile Ala Ala Leu Pro Leu Pro Glu Ser Tyr Arg Ala Ile
            20                  25                  30
Thr Val His Lys Asp Glu Thr Glu Met Phe Ala Gly Leu Glu Thr Arg
        35                  40                  45
Asp Lys Asp Pro Arg Lys Ser Ile His Leu Asp Asp Val Pro Val Pro
    50                  55                  60
Glu Leu Gly Pro Gly Glu Ala Leu Val Ala Val Met Ala Ser Ser Val
65                  70                  75                  80
Asn Tyr Asn Ser Val Trp Thr Ser Ile Phe Glu Pro Leu Ser Thr Phe
                85                  90                  95
Gly Phe Leu Glu Arg Tyr Gly Arg Val Ser Asp Leu Ala Lys Arg His
            100                 105                 110
Asp Leu Pro Tyr His Val Ile Gly Ser Asp Leu Ala Gly Val Val Leu
        115                 120                 125
Arg Thr Gly Pro Gly Val Asn Ala Trp Gln Ala Gly Asp Glu Val Val
    130                 135                 140
Ala His Cys Leu Ser Val Glu Leu Glu Ser Ser Asp Gly His Asn Asp
145                 150                 155                 160
Thr Met Leu Asp Pro Glu Gln Arg Ile Trp Gly Phe Glu Thr Asn Phe
                165                 170                 175
Gly Gly Leu Ala Glu Ile Ala Leu Val Lys Ser Asn Gln Leu Met Pro
            180                 185                 190
Lys Pro Asp His Leu Ser Trp Glu Glu Ala Ala Ala Pro Gly Leu Val
        195                 200                 205
Asn Ser Thr Ala Tyr Arg Gln Leu Val Ser Arg Asn Gly Ala Gly Met
    210                 215                 220
Lys Gln Gly Asp Asn Val Leu Ile Trp Gly Ala Ser Gly Gly Leu Gly
225                 230                 235                 240
Ser Tyr Ala Thr Gln Phe Ala Leu Ala Gly Gly Ala Asn Pro Ile Cys
                245                 250                 255
Val Val Ser Ser Pro Gln Lys Ala Glu Ile Cys Arg Ala Met Gly Ala
            260                 265                 270
Glu Ala Ile Ile Asp Arg Asn Ala Glu Gly Tyr Arg Phe Trp Lys Asp
        275                 280                 285
Glu Asn Thr Gln Asp Pro Lys Glu Trp Lys Arg Phe Gly Lys Arg Ile
    290                 295                 300
Arg Glu Leu Thr Gly Gly Glu Asp Ile Asp Ile Val Phe Glu His Pro
305                 310                 315                 320
Gly Arg Glu Thr Phe Gly Ala Ser Val Phe Val Thr Arg Lys Gly Gly
                325                 330                 335
Thr Ile Thr Thr Cys Ala Ser Thr Ser Gly Tyr Met His Glu Tyr Asp
            340                 345                 350
Asn Arg Tyr Leu Trp Met Ser Leu Lys Arg Ile Ile Gly Ser His Phe
        355                 360                 365
Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu Ile Ala Lys Gly
    370                 375                 380
Arg Ile His Pro Thr Leu Ser Lys Val Tyr Ser Leu Glu Asp Thr Gly
385                 390                 395                 400
Gln Ala Ala Tyr Asp Val His Arg Asn Leu His Gln Gly Lys Val Gly
                405                 410                 415
Val Leu Cys Leu Ala Pro Glu Glu Gly Leu Gly Val Arg Asp Arg Glu
            420                 425                 430
Lys Arg Ala Gln His Leu Asp Ala Ile Asn Arg Phe Arg Asn Ile
        435                 440                 445
<210>152
<211>2589
<212>DNA
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>152
atgaaagtca caacagtaaa ggaattagat gaaaaactca aggtaattaa agaagctcaa   60
aaaaaattct cttgttactc gcaagaaatg gttgatgaaa tctttagaaa tgcagcaatg  120
gcagcaatcg acgcaaggat agagctagca aaagcagctg ttttggaaac cggtatgggc  180
ttagttgaag acaaggttat aaaaaatcat tttgcaggcg aatacatcta taacaaatat  240
aaggatgaaa aaacctgcgg tataattgaa cgaaatgaac cctacggaat tacaaaaata  300
gcagaaccta taggagttgt agctgctata atccctgtaa caaaccccac atcaacaaca  360
atatttaaat ccttaatatc ccttaaaact agaaatggaa ttttcttttc gcctcaccca  420
agggcaaaaa aatccacaat actagcagct aaaacaatac ttgatgcagc cgttaagagt  480
ggtgccccgg aaaatataat aggttggata gatgaacctt caattgaact aactcaatat  540
ttaatgcaaa aagcagatat aacccttgca actggtggtc cctcactagt taaatctgct  600
tattcttccg gaaaaccagc aataggtgtt ggtccgggta acaccccagt aataattgat  660
gaatctgctc atataaaaat ggcagtaagt tcaattatat tatccaaaac ctatgataat  720
ggtgttatat gtgcttctga acaatctgta atagtcttaa aatccatata taacaaggta     780
aaagatgagt tccaagaaag aggagcttat ataataaaga aaaacgaatt ggataaagtc     840
cgtgaagtga tttttaaaga tggatccgta aaccctaaaa tagtcggaca gtcagcttat     900
actatagcag ctatggctgg cataaaagta cctaaaacca caagaatatt aataggagaa     960
gttacctcct taggtgaaga agaacctttt gcccacgaaa aactatctcc tgttttggct    1020
atgtatgagg ctgacaattt tgatgatgct ttaaaaaaag cagtaactct aataaactta    1080
ggaggcctcg gccatacctc aggaatatat gcagatgaaa taaaagcacg agataaaata    1140
gatagattta gtagtgccat gaaaaccgta agaacctttg taaatatccc aacctcacaa    1200
ggtgcaagtg gagatctata taattttaga ataccacctt ctttcacgct tggctgcgga    1260
ttttggggag gaaattctgt ttccgagaat gttggtccaa aacatctttt gaatattaaa    1320
accgtagctg aaaggagaga aaacatgctt tggtttagag ttccacataa agtatatttt    1380
aagttcggtt gtcttcaatt tgctttaaaa gatttaaaag atctaaagaa aaaaagagcc    1440
tttatagtta ctgatagtga cccctataat ttaaactatg ttgattcaat aataaaaata    1500
cttgagcacc tagatattga ttttaaagta tttaataagg ttggaagaga agctgatctt    1560
aaaaccataa aaaaagcaac tgaagaaatg tcctccttta tgccagacac tataatagct    1620
ttaggtggta cccctgaaat gagctctgca aagctaatgt gggtactata tgaacatcca    1680
gaagtaaaat ttgaagatct tgcaataaaa tttatggaca taagaaagag aatatatact    1740
ttcccaaaac tcggtaaaaa ggctatgtta gttgcaatta caacttctgc tggttccggt    1800
tctgaggtta ctccttttgc tttagtaact gacaataaca ctggaaataa gtacatgtta    1860
gcagattatg aaatgacacc aaatatggca attgtagatg cagaacttat gatgaaaatg    1920
ccaaagggat taaccgctta ttcaggtata gatgcactag taaatagtat agaagcatac    1980
acatccgtat atgcttcaga atacacaaac ggactagcac tagaggcaat acgattaata    2040
tttaaatatt tgcctgaggc ttacaaaaac ggaagaacca atgaaaaagc aagagagaaa  2100
atggctcacg cttcaactat ggcaggtatg gcatccgcta atgcatttct aggtctatgt  2160
cattccatgg caataaaatt aagttcagaa cacaatattc ctagtggcat tgccaatgca  2220
ttactaatag aagaagtaat aaaatttaac gcagttgata atcctgtaaa acaagcccct  2280
tgcccacaat ataagtatcc aaacaccata tttagatatg ctcgaattgc agattatata  2340
aagcttggag gaaatactga tgaggaaaag gtagatctct taattaacaa aatacatgaa  2400
ctaaaaaaag ctttaaatat accaacttca ataaaggatg caggtgtttt ggaggaaaac  2460
ttctattcct cccttgatag aatatctgaa cttgcactag atgatcaatg cacaggcgct  2520
aatcctagat ttcctcttac aagtgagata aaagaaatgt atataaattg ttttaaaaaa  2580
caaccttaa                                                          2589
<210>153
<211>862
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>153
Met Lys Val Thr Thr Val Lys Glu Leu Asp Glu Lys Leu Lys Val Ile
1               5                   10                  15
Lys Glu Ala Gln Lys Lys Phe Ser Cys Tyr Ser Gln Glu Met Val Asp
            20                  25                  30
Glu Ile Phe Arg Asn Ala Ala Met Ala Ala Ile Asp Ala Arg Ile Glu
        35                  40                  45
Leu Ala Lys Ala Ala Val Leu Glu Thr Gly Met Gly Leu Val Glu Asp
    50                  55                  60
Lys Val Ile Lys Asn His Phe Ala Gly Glu Tyr Ile Tyr Asn Lys Tyr
65                  70                  75                  80
Lys Asp Glu Lys Thr Cys Gly Ile Ile Glu Arg Asn Glu Pro Tyr Gly
                85                  90                  95
Ile Thr Lys Ile Ala Glu Pro Ile Gly Val Val Ala Ala Ile Ile Pro
            100                 105                 110
Val Thr Asn Pro Thr Ser Thr Thr Ile Phe Lys Ser Leu Ile Ser Leu
        115                 120                 125
Lys Thr Arg Asn Gly Ile Phe Phe Ser Pro His Pro Arg Ala Lys Lys
    130                 135                 140
Ser Thr Ile Leu Ala Ala Lys Thr Ile Leu Asp Ala Ala Val Lys Ser
145                 150                 155                 160
Gly Ala Pro Glu Asn Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
                165                 170                 175
Leu Thr Gln Tyr Leu Met Gln Lys Ala Asp Ile Thr Leu Ala Thr Gly
            180                 185                 190
Gly Pro Ser Leu Val Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ala Ile
        195                 200                 205
Gly Val Gly Pro Gly Asn Thr Pro Val Ile Ile Asp Glu Ser Ala His
    210                 215                 220
Ile Lys Met Ala Val Ser Ser Ile Ile Leu Ser Lys Thr Tyr Asp Asn
225                 230                 235                 240
Gly Val Ile Cys Ala Ser Glu Gln Ser Val Ile Val Leu Lys Ser Ile
                245                 250                 255
Tyr Asn Lys Val Lys Asp Glu Phe Gln Glu Arg Gly Ala Tyr Ile Ile
            260                 265                 270
Lys Lys Asn Glu Leu Asp Lys Val Arg Glu Val Ile Phe Lys Asp Gly
        275                 280                 285
Ser Val Asn Pro Lys Ile Val Gly Gln Ser Ala Tyr Thr Ile Ala Ala
    290                 295                 300
Met Ala Gly Ile Lys Val Pro Lys Thr Thr Arg Ile Leu Ile Gly Glu
305                 310                 315                 320
Val Thr Ser Leu Gly Glu Glu Glu Pro Phe Ala His Glu Lys Leu Ser
                325                 330                 335
Pro Val Leu Ala Met Tyr Glu Ala Asp Asn Phe Asp Asp Ala Leu Lys
            340                 345                 350
Lys Ala Val Thr Leu Ile Asn Leu Gly Gly Leu Gly His Thr Ser Gly
        355                 360                 365
Ile Tyr Ala Asp Glu Ile Lys Ala Arg Asp Lys Ile Asp Arg Phe Ser
    370                 375                 380
Ser Ala Met Lys Thr Val Arg Thr Phe Val Asn Ile Pro Thr Ser Gln
385                 390                 395                 400
Gly Ala Ser Gly Asp Leu Tyr Asn Phe Arg Ile Pro Pro Ser Phe Thr
                405                 410                 415
Leu Gly Cys Gly Phe Trp Gly Gly Asn Ser Val Ser Glu Asn Val Gly
            420                 425                 430
Pro Lys His Leu Leu Asn Ile Lys Thr Val Ala Glu Arg Arg Glu Asn
        435                 440                 445
Met Leu Trp Phe Arg Val Pro His Lys Val Tyr Phe Lys Phe Gly Cys
    450                 455                 460
Leu Gln Phe Ala Leu Lys Asp Leu Lys Asp Leu Lys Lys Lys Arg Ala
465                 470                 475                 480
Phe Ile Val Thr Asp Ser Asp Pro Tyr Asn Leu Asn Tyr Val Asp Ser
                485                 490                 495
Ile Ile Lys Ile Leu Glu His Leu Asp Ile Asp Phe Lys Val Phe Asn
            500                 505                 510
Lys Val Gly Arg Glu Ala Asp Leu Lys Thr Ile Lys Lys Ala Thr Glu
        515                 520                 525
Glu Met Ser Ser Phe Met Pro Asp Thr Ile Ile Ala Leu Gly Gly Thr
    530                 535                 540
Pro Glu Met Ser Ser Ala Lys Leu Met Trp Val Leu Tyr Glu His Pro
545                 550                 555                 560
Glu Val Lys Phe Glu Asp Leu Ala Ile Lys Phe Met Asp Ile Arg Lys
                565                 570                 575
Arg Ile Tyr Thr Phe Pro Lys Leu Gly Lys Lys Ala Met Leu Val Ala
            580                 585                 590
Ile Thr Thr Ser Ala Gly Ser Gly Ser Glu Val Thr Pro Phe Ala Leu
        595                 600                 605
Val Thr Asp Asn Asn Thr Gly Asn Lys Tyr Met Leu Ala Asp Tyr Glu
    610                 615                 620
Met Thr Pro Asn Met Ala Ile Val Asp Ala Glu Leu Met Met Lys Met
625                 630                 635                 640
Pro Lys Gly Leu Thr Ala Tyr Ser Gly Ile Asp Ala Leu Val Asn Ser
                645                 650                 655
Ile Glu Ala Tyr Thr Ser Val Tyr Ala Ser Glu Tyr Thr Asn Gly Leu
            660                 665                 670
Ala Leu Glu Ala Ile Arg Leu Ile Phe Lys Tyr Leu Pro Glu Ala Tyr
        675                 680                 685
Lys Asn Gly Arg Thr Asn Glu Lys Ala Arg Glu Lys Met Ala His Ala
    690                 695                 700
Ser Thr Met Ala Gly Met Ala Ser Ala Asn Ala Phe Leu Gly Leu Cys
705                 710                 715                 720
His Ser Met Ala Ile Lys Leu Ser Ser Glu His Asn Ile Pro Ser Gly
                725                 730                 735
Ile Ala Asn Ala Leu Leu Ile Glu Glu Val Ile Lys Phe Asn Ala Val
            740                 745                 750
Asp Asn Pro Val Lys Gln Ala Pro Cys Pro Gln Tyr Lys Tyr Pro Asn
        755                 760                 765
Thr Ile Phe Arg Tyr Ala Arg Ile Ala Asp Tyr Ile Lys Leu Gly Gly
    770                 775                 780
Asn Thr Asp Glu Glu Lys Val Asp Leu Leu Ile Asn Lys Ile His Glu
785                 790                 795                 800
Leu Lys Lys Ala Leu Asn Ile Pro Thr Ser Ile Lys Asp Ala Gly Val
                805                 810                 815
Leu Glu Glu Asn Phe Tyr Ser Ser Leu Asp Arg Ile Ser Glu Leu Ala
            820                 825                 830
Leu Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Phe Pro Leu Thr Ser
        835                 840                 845
Glu Ile Lys Glu Met Tyr Ile Asn Cys Phe Lys Lys Gln Pro
    850                 855                 860
<210>154
<211>1164
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>154
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct   60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc  120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg  180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg  240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc  300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg  360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca  420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag   480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc   540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg   600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt   660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg   720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta   780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat   840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag   900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat   960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg  1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg  1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc  1140
cgtatatacg aagccgcccg ctaa                                         1164
<210>155
<211>387
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>155
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1               5                   10                  15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
            20                  25                  30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
        35                  40                  45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
    50                  55                  60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65                  70                  75                  80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
                85                  90                  95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
            100                 105                 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
        115                 120                 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
    130                 135                 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145                 150                 155                 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
                165                 170                 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
            180                 185                 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
        195                 200                 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
    210                 215                 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225                 230                 235                 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
                245                 250                 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
            260                 265                 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
        275                 280                 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
    290                 295                 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305                 310                 315                 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
                325                 330                 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
            340                 345                 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
        355                 360                 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
    370                 375                 380
Ala Ala Arg
385
<210>156
<211>3883
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>156
ctatattgct gaaggtacag gcgtttccat aactatttgc tcgcgttttt tactcaagaa    60
gaaaatgcca aatagcaaca tcaggcagac aatacccgaa attgcgaaga aaactgtctg   120
gtagcctgcg tggtcaaaga gtatcccagt cggcgttgaa agcagcacaa tcccaagcga   180
actggcaatt tgaaaaccaa tcagaaagat cgtcgacgac aggcgcttat caaagtttgc   240
cacgctgtat ttgaagacgg atatgacaca aagtggaacc tcaatggcat gtaacaactt   300
cactaatgaa ataatccagg ggttaacgaa cagcgcgcag gaaaggatac gcaacgccat   360
aatcacaact ccgataagta atgcattttt tggccctacc cgattcacaa agaaaggaat   420
aatcgccatg cacagcgctt cgagtaccac ctggaatgag ttgagataac catacaggcg   480
cgttcctaca tcgtgtgatt cgaataaacc tgaataaaag acaggaaaaa gttgttgatc   540
aaaaatgtta tagaaagacc acgtccccac aataaatatg acgaaaaccc agaagtttcg   600
atccttgaaa actgcgataa aatcctcttt ttttacccct cccgcatctg ccgctacgca   660
ctggtgatcc ttatctttaa aacgcatgtt gatcatcata aatacagcgc caaatagcga   720
gaccaaccag aagttgatat ggggactgat actaaaaaat atgccggcaa agaacgcgcc   780
aatagcatag ccaaaagatc cccaggcgcg cgctgttcca tattcgaaat gaaaatttcg   840
cgccattttt tcggtgaagc tatcaagcaa accgcatccc gccagatacc ccaagccaaa   900
aaatagcgcc cccagaatta gacctacaga aaaattgctt tgcagtaacg gttcataaac   960
gtaaatcata aacggtccgg tcaagaccag gatgaaactc atacaccaga tgagcggttt  1020
cttcagaccg agtttatcct gaacgatgcc gtagaacatc ataaatagaa tgctggtaaa  1080
ctggttgacc gaataaagtg tacctaattc cgtccctgtc aaccctagat gtcctttcag    1140
ccaaatagcg tataacgacc accacagcga ccaggaaata aaaaagagaa atgagtaact    1200
ggatgcaaaa cgatagtacg catttctgaa tggaatattc agtgccataa ttacctgcct    1260
gtcgttaaaa aattcacgtc ctatttagag ataagagcga cttcgccgtt tacttctcac    1320
tattccagtt cttgtcgaca tggcagcgct gtcattgccc ctttcgccgt tactgcaagc    1380
gctccgcaac gttgagcgag atcgataatt cgtcgcattt ctctctcatc tgtagataat    1440
cccgtagagg acagacctgt gagtaacccg gcaacgaacg catctcccgc ccccgtgcta    1500
tcgacacaat tcacagacat tccagcaaaa tggtgaactt gtcctcgata acagaccacc    1560
accccttctg cacctttagt caccaacagc atggcgatct catactcttt tgccagggcg    1620
catatatcct gatcgttctg tgtttttcca ctgataagtc gccattcttc ttccgagagc    1680
ttgacgacat ccgccagttg tagcgcctgc cgcaaacaca agcggagcaa atgctcgtct    1740
tgccatagat cttcacgaat attaggatcg aagctgacaa aacctccggc atgccggatc    1800
gccgtcatcg cagtaaatgc gctggtacgc gaaggctcgg cagacaacgc aattgaacag    1860
agatgtaacc attcgccatg tcgccagcag ggcaagtctg tcgtctctaa aaaaagatcg    1920
gcactggggc ggaccataaa cgtaaatgaa cgttcccctt gatcgttcag atcgacaagc    1980
accgtggatg tccggtgcca ttcatcttgc ttcagatacg tgatatcgac tccctcagtt    2040
agcagcgttc tttgcattaa cgcaccaaaa ggatcatccc ccacccgacc tataaaccca    2100
cttgttccgc ctaatctggc gattcccacc gcaacgttag ctggcgcgcc gccaggacaa    2160
ggcagtaggc gcccgtctga ttctggcaag agatctacga ccgcatcccc taaaacccat    2220
actttggctg acattttttt cccttaaatt catctgagtt acgcatagtg ataaacctct    2280
ttttcgcaaa atcgtcatgg atttactaaa acatgcatat tcgatcacaa aacgtcatag    2340
ttaacgttaa catttgtgat attcatcgca tttatgaaag taagggactt tatttttata    2400
aaagttaacg ttaacaattc accaaatttg cttaaccagg atgattaaaa tgacgcaatc    2460
tcgattgcat gcggcgcaaa acgccctagc aaaacttcat gagcaccggg gtaacacttt    2520
ctatccccat tttcacctcg cgcctcctgc cgggtggatg aacgatccaa acggcctgat    2580
ctggtttaac gatcgttatc acgcgtttta tcaacatcat ccgatgagcg aacactgggg    2640
gccaatgcac tggggacatg ccaccagcga cgatatgatc cactggcagc atgagcctat    2700
tgcgctagcg ccaggagacg ataatgacaa agacgggtgt ttttcaggta gtgctgtcga    2760
tgacaatggt gtcctctcac ttatctacac cggacacgtc tggctcgatg gtgcaggtaa    2820
tgacgatgca attcgcgaag tacaatgtct ggctaccagt cgggatggta ttcatttcga    2880
gaaacagggt gtgatcctca ctccaccaga aggaatcatg cacttccgcg atcctaaagt    2940
gtggcgtgaa gccgacacat ggtggatggt agtcggggcg aaagatccag gcaacacggg    3000
gcagatcctg ctttatcgcg gcagttcgtt gcgtgaatgg accttcgatc gcgtactggc    3060
ccacgctgat gcgggtgaaa gctatatgtg ggaatgtccg gactttttca gccttggcga    3120
tcagcattat ctgatgtttt ccccgcaggg aatgaatgcc gagggataca gttaccgaaa    3180
tcgctttcaa agtggcgtaa tacccggaat gtggtcgcca ggacgacttt ttgcacaatc    3240
cgggcatttt actgaacttg ataacgggca tgacttttat gcaccacaaa gctttttagc    3300
gaaggatggt cggcgtattg ttatcggctg gatggatatg tgggaatcgc caatgccctc    3360
aaaacgtgaa ggatgggcag gctgcatgac gctggcgcgc gagctatcag agagcaatgg    3420
caaacttcta caacgcccgg tacacgaagc tgagtcgtta cgccagcagc atcaatctgt    3480
ctctccccgc acaatcagca ataaatatgt tttgcaggaa aacgcgcaag cagttgagat    3540
tcagttgcag tgggcgctga agaacagtga tgccgaacat tacggattac agctcggcac    3600
tggaatgcgg ctgtatattg ataaccaatc tgagcgactt gttttgtggc ggtattaccc    3660
acacgagaat ttagacggct accgtagtat tcccctcccg cagcgtgaca cgctcgccct    3720
aaggatattt atcgatacat catccgtgga agtatttatt aacgacgggg aagcggtgat  3780
gagtagtcga atctatccgc agccagaaga acgggaactg tcgctttatg cctcccacgg  3840
agtggctgtg ctgcaacatg gagcactctg gctactgggt taa                    3883
<210>157
<211>477
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>157
Met Thr Gln Ser Arg Leu His Ala Ala Gln Asn Ala Leu Ala Lys Leu
1               5                   10                  15
His Glu His Arg Gly Asn Thr Phe Tyr Pro His Phe His Leu Ala Pro
            20                  25                  30
Pro Ala Gly Trp Met Asn Asp Pro Asn Gly Leu Ile Trp Phe Asn Asp
        35                  40                  45
Arg Tyr His Ala Phe Tyr Gln His His Pro Met Ser Glu His Trp Gly
    50                  55                  60
Pro Met His Trp Gly His Ala Thr Ser Asp Asp Met Ile His Trp Gln
65                  70                  75                  80
His Glu Pro Ile Ala Leu Ala Pro Gly Asp Asp Asn Asp Lys Asp Gly
                85                  90                  95
Cys Phe Ser Gly Ser Ala Val Asp Asp Asn Gly Val Leu Ser Leu Ile
            100                 105                 110
Tyr Thr Gly His Val Trp Leu Asp Gly Ala Gly Asn Asp Asp Ala Ile
        115                 120                 125
Arg Glu Val Gln Cys Leu Ala Thr Ser Arg Asp Gly Ile His Phe Glu
    130                 135                 140
Lys Gln Gly Val Ile Leu Thr Pro Pro Glu Gly Ile Met His Phe Arg
145                 150                 155                 160
Asp Pro Lys Val Trp Arg Glu Ala Asp Thr Trp Trp Met Val Val Gly
                165                 170                 175
Ala Lys Asp Pro Gly Asn Thr Gly Gln Ile Leu Leu Tyr Arg Gly Ser
            180                 185                 190
Ser Leu Arg Glu Trp Thr Phe Asp Arg Val Leu Ala His Ala Asp Ala
        195                 200                 205
Gly Glu Ser Tyr Met Trp Glu Cys Pro Asp Phe Phe Ser Leu Gly Asp
    210                 215                 220
Gln His Tyr Leu Met Phe Ser Pro Gln Gly Met Asn Ala Glu Gly Tyr
225                 230                 235                 240
Ser Tyr Arg Asn Arg Phe Gln Ser Gly Val Ile Pro Gly Met Trp Ser
                245                 250                 255
Pro Gly Arg Leu Phe Ala Gln Ser Gly His Phe Thr Glu Leu Asp Asn
            260                 265                 270
Gly His Asp Phe Tyr Ala Pro Gln Ser Phe Leu Ala Lys Asp Gly Arg
        275                 280                 285
Arg Ile Val Ile Gly Trp Met Asp Met Trp Glu Ser Pro Met Pro Ser
    290                 295                 300
Lys Arg Glu Gly Trp Ala Gly Cys Met Thr Leu Ala Arg Glu Leu Ser
305                 310                 315                 320
Glu Ser Asn Gly Lys Leu Leu Gln Arg Pro Val His Glu Ala Glu Ser
                325                 330                 335
Leu Arg Gln Gln His Gln Ser Val Ser Pro Arg Thr Ile Ser Asn Lys
            340                 345                 350
Tyr Val Leu Gln Glu Asn Ala Gln Ala Val Glu Ile Gln Leu Gln Trp
        355                 360                 365
Ala Leu Lys Asn Ser Asp Ala Glu His Tyr Gly Leu Gln Leu Gly Thr
    370                 375                 380
Gly Met Arg Leu Tyr Ile Asp Asn Gln Ser Glu Arg Leu Val Leu Trp
385                 390                 395                 400
Arg Tyr Tyr Pro His Glu Asn Leu Asp Gly Tyr Arg Ser Ile Pro Leu
                405                 410                 415
Pro Gln Arg Asp Thr Leu Ala Leu Arg Ile Phe Ile Asp Thr Ser Ser
            420                 425                 430
Val Glu Val Phe Ile Asn Asp Gly Glu Ala Val Met Ser Ser Arg Ile
        435                 440                 445
Tyr Pro Gln Pro Glu Glu Arg Glu Leu Ser Leu Tyr Ala Ser His Gly
    450                 455                 460
Val Ala Val Leu Gln His Gly Ala Leu Trp Leu Leu Gly
465                 470                 475
<210>158
<211>304
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>158
Met Ser Ala Lys Val Trp Val Leu Gly Asp Ala Val Val Asp Leu Leu
1               5                   10                  15
Pro Glu Ser Asp Gly Arg Leu Leu Pro Cys Pro Gly Gly Ala Pro Ala
            20                  25                  30
Asn Val Ala Val Gly Ile Ala Arg Leu Gly Gly Thr Ser Gly Phe Ile
        35                  40                  45
Gly Arg Val Gly Asp Asp Pro Phe Gly Ala Leu Met Gln Arg Thr Leu
    50                  55                  60
Leu Thr Glu Gly Val Asp Ile Thr Tyr Leu Lys Gln Asp Glu Trp His
65                  70                  75                  80
Arg Thr Ser Thr Val Leu Val Asp Leu Asn Asp Gln Gly Glu Arg Ser
                85                  90                  95
Phe Thr Phe Met Val Arg Pro Ser Ala Asp Leu Phe Leu Glu Thr Thr
            100                 105                 110
Asp Leu Pro Cys Trp Arg His Gly Glu Trp Leu His Leu Cys Ser Ile
        115                 120                 125
Ala Leu Ser Ala Glu Pro Ser Arg Thr Ser Ala Phe Thr Ala Met Thr
    130                 135                 140
Ala Ile Arg His Ala Gly Gly Phe Val Ser Phe Asp Pro Asn Ile Arg
145                 150                 155                 160
Glu Asp Leu Trp Gln Asp Glu His Leu Leu Arg Leu Cys Leu Arg Gln
                165                 170                 175
Ala Leu Gln Leu Ala Asp Val Val Lys Leu Ser Glu Glu Glu Trp Arg
            180                 185                 190
Leu Ile Ser Gly Lys Thr Gln Asn Asp Gln Asp Ile Cys Ala Leu Ala
        195                 200                 205
Lys Glu Tyr Glu Ile Ala Met Leu Leu Val Thr Lys Gly Ala Glu Gly
    210                 215                 220
Val Val Val Cys Tyr Arg Gly Gln Val His His Phe Ala Gly Met Ser
225                 230                 235                 240
Val Asn Cys Val Asp Ser Thr Gly Ala Gly Asp Ala Phe Val Ala Gly
                245                 250                 255
Leu Leu Thr Gly Leu Ser Ser Thr Gly Leu Ser Thr Asp Glu Arg Glu
            260                 265                 270
Met Arg Arg Ile Ile Asp Leu Ala Gln Arg Cys Gly Ala Leu Ala Val
        275                 280                 285
Thr Ala Lys Gly Ala Met Thr Ala Leu Pro Cys Arg Gln Glu Leu Glu
    290                 295                 300
<210>159
<211>415
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>159
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1               5                   10                  15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
            20                  25                  30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
        35                  40                  45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
    50                  55                  60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65                  70                  75                  80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
                85                  90                  95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
            100                 105                 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
        115                 120                 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
    130                 135                 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145                 150                 155                 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
                165                 170                 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
            180                 185                 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
        195                 200                 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
    210                 215                 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225                 230                 235                 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
                245                 250                 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
            260                 265                 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
        275                 280                 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
    290                 295                 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305                 310                 315                 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
                325                 330                 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
            340                 345                 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
        355                 360                 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
    370                 375                 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385                 390                 395                 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
                405                 410                 415
<210>160
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物Scr1
<400>160
cctttctttg tgaatcgg    18
<210>161
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物Scr2
<400>161
agaaacaggg tgtgatcc    18
<210>162
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物Scr3
<400>162
agtgatcatc acctgttgcc                                               20
<210>163
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物Scr4
<400>163
agcacggcga gagtcgacgg                                               20
<210>164
<211>74
<212>DNA
<213>人工序列
<220>
<223>引物OT731
<400>164
aaagctggag ctccaccgcg gtggcggccg ctctagaagt tttcaaagca gagtttcgtt    60
tgaatatttt acca                                                      74
<210>165
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物OT732
<400>165
ttcaatatgc atgcctcaga acgtttacat tgtatcgact gccagaaccc               50
<210>166
<211>79
<212>DNA
<213>人工序列
<220>
<223>引物OT733
<400>166
gcagtcgata caatgtaaac gttctgaggc atgcatattg aattttcaaa aattcttact    60
ttttttttgg atggacgca                                                 79
<210>167
<211>72
<212>DNA
<213>人工序列
<220>
<223>引物OT734
<400>167
acctgcacct ataacacata ccttttccat ggtagttttt tctccttgac gttaaagtat    60
agaggtatat ta                                                        72
<210>168
<211>60
<212>DNA
<213>人工序列
<220>
<223>引物OT735
<400>168
aaaaactacc atggaaaagg tatgtgttat aggtgcaggt actatgggtt caggaattgc    60
<210>169
<211>71
<212>DNA
<213>人工序列
<220>
<223>引物OT736
<400>169
gtaaaaaaaa gaaggccgta taggccttat tttgaataat cgtagaaacc ttttcctgat    60
tttcttccaa g                                                         71
<210>170
<211>81
<212>DNA
<213>人工序列
<220>
<223>引物OT737
<400>170
acgattattc aaaataaggc ctatacggcc ttcttttttt tactttgttc agaacaactt    60
ctcatttttt tctactcata a                                              81
<210>171
<211>73
<212>DNA
<213>人工序列
<220>
<223>引物OT738
<400>171
gaattgggta ccgggccccc cctcgaggtc gaccgatgcc tcataaactt cggtagttat    60
attactctga gat                                                       73
<210>172
<211>65
<212>DNA
<213>人工序列
<220>
<223>引物OT797
<400>172
aaagtaagaa tttttgaaaa ttcaatatgc atgcaagaag ttgtaatagc tagtgcagta    60
agaac                                                                65
<210>173
<211>73
<212>DNA
<213>人工序列
<220>
<223>引物OT798
<400>173
gaaaaagatc atgagaaaat cgcagaacgt aaggcgcgcc tcagcacttt tctagcaata    60
ttgctgttcc ttg                                                       73
<210>174
<211>41
<212>DNA
<213>人工序列
<220>
<223>引物OT806
<400>174
ctcgaaaata gggcgcgccc ccattaccga catttgggcg c                         41
<210>175
<211>55
<212>DNA
<213>人工序列
<220>
<223>引物OT807
<400>175
actgcactag ctattacaac ttcttgcatg cgtgatgatt gattgattga ttgta         55
<210>176
<211>55
<212>DNA
<213>人工序列
<220>
<223>引物OT808
<400>176
actgcactag ctattacaac ttcttgcatg cgtgatgatt gattgattga ttgta         55
<210>177
<211>60
<212>DNA
<213>人工序列
<220>
<223>引物OT809
<400>177
tttcgaataa acacacataa acaaacaccc catggaaaag gtatgtgtta taggtgcagg    60
<210>178
<211>62
<212>DNA
<213>人工序列
<220>
<223>引物OT799
<400>178
taccgggccc cccctcgagg tcgacggcgc gccactggta gagagcgact ttgtatgccc    60
ca                                                                   62
<210>179
<211>60
<212>DNA
<213>人工序列
<220>
<223>引物OT761
<400>179
cttggccttc actagcatgc tgaatatgta ttacttggtt atggttatat atgacaaaag    60
<210>180
<211>68
<212>DNA
<213>人工序列
<220>
<223>引物OT803
<400>180
ccctcactaa agggaacaaa agctggagct cgatatcggc gcgcccacat gcagtgatgc    60
acgcgcga                                                             68
<210>181
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物OT804
<400>181
aaggatgaca ttgtttagtt ccatggttgt aatatgtgtg tttgtttgg                49
<210>182
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物OT785
<400>182
cacacatatt acaaccatgg aactaaacaa tgtcatcctt gaaaaggaag g             51
<210>183
<211>63
<212>DNA
<213>人工序列
<220>
<223>引物OT786
<400>183
atcattcatt ggccattcag gccttatcta tttttgaagc cttcaatttt tcttttctct    60
atg                                                                  63
<210>184
<211>65
<212>DNA
<213>人工序列
<220>
<223>引物OT787
<400>184
caaaaataga taaggcctga atggccaatg aatgatttga tgatttcttt ttccctccat    60
ttttc                                                                65
<210>185
<211>77
<212>DNA
<213>人工序列
<220>
<223>引物PT805
<400>185
gaattgggta ccgggccccc cctcgaggtc gacttatagt attatatttt ctgatttggt    60
tatagcaagc agcgttt                                                   77
<210>186
<211>1269
<212>DNA
<213>人工序列
<220>
<223>密码子最优化的ter
<400>186
actagtacca taaccaagta atacatattc agcatgctag tgaaggccaa gttcgtcaag   60
ggctttatta gagatgttca tccgtatggg tgtaggagag aagtgttaaa ccagattgac  120
tactgcaaga aagcaattgg ctttaggggc cctaaaaagg ttcttattgt aggtgcttct  180
tcaggcttcg gactagctac tagaatatct gttgcattcg gagggcctga agcccataca  240
atcggtgttt catacgagac tggagctaca gacagaagga taggtacggc tgggtggtac  300
aataatatct tctttaaaga attcgctaag aagaaaggtt tggtggcaaa gaatttcata  360
gaagatgcat tttcgaatga aaccaaggat aaagtgataa agtatataaa ggacgaattt  420
ggtaaaattg atttattcgt atattcttta gctgctccta gaagaaagga ctacaaaacc  480
ggtaatgttt atacctcaag aattaaaaca attctaggtg actttgaagg gcctactatt  540
gacgtagaaa gagatgaaat aactttaaag aaggtatctt ctgctagtat cgaggaaatc  600
gaagaaacac gtaaagtaat gggcggagaa gactggcagg agtggtgtga ggagttatta  660
tacgaagatt gtttttctga taaagctaca accatcgctt attcctatat tggcagtcct  720
agaacttata aaatatatcg tgaaggaacc attgggattg ctaagaagga tttagaagac  780
aaagccaagt tgatcaacga aaagcttaat agagtcatag gaggtagggc atttgtgtct  840
gttaacaaag ctttagtaac caaggcatct gcttatattc caaccttccc tctatacgct   900
gccatattat ataaagtaat gaaagaaaag aacattcacg aaaattgtat tatgcaaatt   960
gagcgtatgt tctcagagaa aatatactcc aacgaaaaga ttcagttcga tgataagggc  1020
cgtcttagaa tggacgattt agaactaaga aaggatgttc aggatgaagt tgacagaatt  1080
tggtctaaca taacaccaga aaacttcaag gagcttagtg actacaaggg gtataagaaa  1140
gagtttatga atctaaatgg ttttgattta gatggagttg attattccaa ggatcttgat  1200
attgaattac ttagaaaact agagccttaa gcggccgcgt taattcaaat taattgatat  1260
agtactagt                                                          1269
<210>187
<211>398
<212>PRT
<213>人工序列
<220>
<223>修饰的Ter蛋白
<400>187
Met Leu Val Lys Ala Lys Phe Val Lys Gly Phe Ile Arg Asp Val His
1               5                   10                  15
Pro Tyr Gly Cys Arg Arg Glu Val Leu Asn Gln Ile Asp Tyr Cys Lys
            20                  25                  30
Lys Ala Ile Gly Phe Arg Gly Pro Lys Lys Val Leu Ile Val Gly Ala
        35                  40                  45
Ser Ser Gly Phe Gly Leu Ala Thr Arg Ile Ser Val Ala Phe Gly Gly
    50                  55                  60
Pro Glu Ala His Thr Ile Gly Val Ser Tyr Glu Thr Gly Ala Thr Asp
65                  70                  75                  80
Arg Arg Ile Gly Thr Ala Gly Trp Tyr Asn Asn Ile Phe Phe Lys Glu
                85                  90                  95
Phe Ala Lys Lys Lys Gly Leu Val Ala Lys Asn Phe Ile Glu Asp Ala
            100                 105                 110
Phe Ser Asn Glu Thr Lys Asp Lys Val Ile Lys Tyr Ile Lys Asp Glu
        115                 120                 125
Phe Gly Lys Ile Asp Leu Phe Val Tyr Ser Leu Ala Ala Pro Arg Arg
    130                 135                 140
Lys Asp Tyr Lys Thr Gly Asn Val Tyr Thr Ser Arg Ile Lys Thr Ile
145                 150                 155                 160
Leu Gly Asp Phe Glu Gly Pro Thr Ile Asp Val Glu Arg Asp Glu Ile
                165                 170                 175
Thr Leu Lys Lys Val Ser Ser Ala Ser Ile Glu Glu Ile Glu Glu Thr
            180                 185                 190
Arg Lys Val Met Gly Gly Glu Asp Trp Gln Glu Trp Cys Glu Glu Leu
        195                 200                 205
Leu Tyr Glu Asp Cys Phe Ser Asp Lys Ala Thr Thr Ile Ala Tyr Ser
    210                 215                 220
Tyr Ile Gly Ser Pro Arg Thr Tyr Lys Ile Tyr Arg Glu Gly Thr Ile
225                 230                 235                 240
Gly Ile Ala Lys Lys Asp Leu Glu Asp Lys Ala Lys Leu Ile Asn Glu
                245                 250                 255
Lys Leu Asn Arg Val Ile Gly Gly Arg Ala Phe Val Ser Val Asn Lys
            260                 265                 270
Ala Leu Val Thr Lys Ala Ser Ala Tyr Ile Pro Thr Phe Pro Leu Tyr
        275                 280                 285
Ala Ala Ile Leu Tyr Lys Val Met Lys Glu Lys Asn Ile His Glu Asn
    290                 295                 300
Cys Ile Met Gln Ile Glu Arg Met Phe Ser Glu Lys Ile Tyr Ser Asn
305                 310                 315                 320
Glu Lys Ile Gln Phe Asp Asp Lys Gly Arg Leu Arg Met Asp Asp Leu
                325                 330                 335
Glu Leu Arg Lys Asp Val Gln Asp Glu Val Asp Arg Ile Trp Ser Asn
            340                 345                 350
Ile Thr Pro Glu Asn Phe Lys Glu Leu Ser Asp Tyr Lys Gly Tyr Lys
        355                 360                 365
Lys Glu Phe Met Asn Leu Asn Gly Phe Asp Leu Asp Gly Val Asp Tyr
    370                 375                 380
Ser Lys Asp Leu Asp Ile Glu Leu Leu Arg Lys Leu Glu Pro
385                 390                 395
<210>188
<211>1484
<212>DNA
<213>人工序列
<220>
<223>密码子最优化的ald
<400>188
actagttcga ataaacacac ataaacaaac accatggata aagatacctt aatcccaacc   60
accaaagact tgaaagtgaa gactaatggt gaaaacatca acttaaagaa ttacaaagat  120
aactcttcat gttttggagt atttgaaaat gttgagaatg ccatttcttc tgcagtacat  180
gcacaaaaga ttctttccct acactacaca aaggaacaaa gagagaaaat aatcaccgaa  240
ataagaaaag ccgcattaca gaataaagag gtcttagcca caatgatcct ggaggaaacc  300
cacatgggaa ggtatgagga taaaatcttg aaacatgaat tagtggccaa gtatacccca  360
ggcactgaag atctgacaac aacagcatgg tccggcgata atggactaac agtggttgaa  420
atgagtccat acggagttat cggcgctata actccaagca cgaatccaac agaaaccgtt  480
atctgcaatt ctataggtat gatagctgcg gggaatgcag ttgtatttaa tggtcaccca  540
tgcgccaaaa agtgtgtcgc tttcgcagta gaaatgataa acaaagccat aattagctgt  600
ggtggacctg aaaaccttgt cactactata aagaacccaa ctatggaaag tttagacgct  660
attatcaaac atccatccat aaaattgttg tgcggtacgg gtggcccggg tatggtaaaa  720
acccttctta attctggtaa aaaggccatc ggagctggcg cgggtaatcc tccggttatt  780
gtagacgata cagcagatat cgagaaggcc ggcagaagca ttattgaagg ttgttcgttt  840
gacaacaatc ttccttgtat cgcggaaaaa gaagtgttcg tgtttgaaaa cgttgcagat  900
gatctgatct ctaacatgtt gaaaaacaac gccgtcatta tcaatgaaga ccaagtatcc  960
aagctgatag accttgttct tcaaaagaac aatgaaactc aagaatattt cattaataag 1020
aagtgggttg gtaaggacgc taaactgttt ttggatgaaa tagatgtaga gtcaccaagt 1080
aatgtaaagt gtattatttg tgaagtcaac gcaaaccatc cgttcgttat gacggagttg 1140
atgatgccaa ttttgcctat agttagagtg aaggacattg atgaagccat taaatacgcc 1200
aagatagctg agcagaatag aaaacattcc gcctacattt attctaagaa catcgataac  1260
cttaatagat tcgaacgtga aattgataca actatctttg ttaagaatgc aaagtcattt  1320
gcaggtgtcg gttatgaagc tgagggtttc acaaccttta caattgccgg atccacaggt  1380
gaaggaatca cgtcagctag aaactttacc aggcaaagac gttgtgtcct agcaggttag  1440
ggcctgcagg gccgtgaatt tactttaaat cttgcattac tagt                   1484
<210>189
<211>468
<212>PRT
<213>人工的
<220>
<223>修饰的Ald
<400>189
Met Asp Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1               5                   10                  15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
            20                  25                  30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
        35                  40                  45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
    50                  55                  60
Lys Ile IIe Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65                  70                  75                  80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
                85                  90                  95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
            100                 105                 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
        115                 120                 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130                 135                 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145                 150                 155                 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
                165                 170                 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
            180                 185                 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
        195                 200                 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
    210                 215                 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225                 230                 235                 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
                245                 250                 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
            260                 265                 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
        275                 280                 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
    290                 295                 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305                 310                 315                 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
                325                 330                 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
            340                 345                 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
        355                 360                 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
    370                 375                 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385                 390                 395                 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
                405                 410                 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
            420                 425                 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
        435                 440                 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
    450                 455                 460
Val Leu Ala Gly
465
<210>190
<211>69
<212>DNA
<213>人工序列
<220>
<223>引物PT800
<400>190
gggaacaaaa gctggagctc caccgcggtg gggcgcgccc tattttcgag gaccttgtca    60
ccttgagcc                                                            69
<210>191
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物OT758
<400>191
ttaaggtatc tttatccatg gtgtttgttt atgtgtgttt attcgaaact               50
<210>192
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物OT754
<400>192
ttgggtaccg ggccccccct cgaggtcgac tggccattaa tctttcccat at          52
<210>193
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物OT755
<400>193
tgtgtcctag caggttaggg cctgcagggc cgtgaattta ctttaaatct tg           52
<210>194
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物OT760
<400>194
cgaaaatagg gcgcgccact ggtagagagc gactttgtat gccccaattg               50
<210>195
<211>71
<212>DNA
<213>人工序列
<220>
<223>引物OT792
<400>195
cccttgacga acttggcctt cactagcatg ctgaatatgt attacttggt tatggttata    60
tatgacaaaa g                                                         71
<210>196
<211>71
<212>DNA
<213>人工序列
<220>
<223>引物OT791
<400>196
cccttgacga acttggcctt cactagcatg ctgaatatgt attacttggt tatggttata    60
tatgacaaaa g                                                         71
<210>197
<211>73
<212>DNA
<213>人工序列
<220>
<223>引物OT765
<400>197
ggaacaaaag ctggagctcc accgcggtgg tttaacgtat agacttctaa tatatttctc    60
catacttggt att                                                       73
<210>198
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物LDHEcoRV F
<400>198
gacgtcatga ccacccgccg atccctttt                                       29
<210>199
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物LDH AatlR
<400>199
gatatccaac accagcgacc gacgtattac                                   30
<210>200
<211>47
<212>DNA
<213>人工序列
<220>
<223>引物Cm F
<400>200
atttaaatct cgagtagagg atcccaacaa acgaaaattg gataaag                 47
<210>201
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物Cm R
<400>201
acgcgttatt ataaaagcca gtcattagg                                     29
<210>202
<211>62
<212>DNA
<213>人工序列
<220>
<223>引物P11 F
<400>202
tcgagagcgc tatagttgtt gacagaatgg acatactatg atatattgtt gctatagcgc    60
cc                                                                   62
<210>203
<211>58
<212>DNA
<213>人工序列
<220>
<223>引物P11R
<400>203
gggcgctata gcaacaatat atcatagtat gtccattctg tcaacaacta tagcgctc    58
<210>204
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物PldhL F
<400>204
gagctcgtcg acaaaccaac attatgacgt gtctgggc                          38
<210>205
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物PldhL R
<400>205
ggatcctacc atgtttgtgc aaaataagtg                                  30
<210>206
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物F-PnisA(EcoRV)
<400>206
ttcagtgata tcgacatact tgaatgacct agtc                                34
<210>207
<211>48
<212>DNA
<213>人工序列
<220>
<223>引物R-PnisA(PmeI BamHI)
<400>207
ttgattagtt taaactgtag gatcctttga gtgcctcctt ataattta                 48
<210>208
<211>2460
<212>DNA
<213>人工序列
<220>
<223>模板DNA
<400>208
tgatccaaag gagggtgagg aaatggcgat gtttacgacc accgcaaaag ttattcagcc    60
gaaaattcgt ggttttattt gcaccaccac ccacccgatt ggttgcgaaa aacgtgttca   120
ggaagaaatc gcatacgcac gcgcgcaccc gccgaccagc ccgggtccga aacgtgtgct   180
ggttattggc tgcagtacgg gctatggcct gagcacccgt atcaccgcgg cctttggtta   240
tcaggccgca accctgggcg tgtttctggc aggcccgccg accaaaggcc gtccggccgc   300
ggcgggttgg tataatacgg ttgcgttcga aaaagccgcc ctggaagcag gtctgtatgc   360
acgttctctg aatggtgatg cgttcgattc taccacgaaa gcccgcaccg tggaagcaat   420
taaacgtgat ctgggtaccg ttgatctggt ggtgtatagc attgcagcgc cgaaacgtac   480
cgatccggcc accggcgtgc tgcataaagc gtgcctgaaa ccgattggtg caacctacac   540
caatcgtacg gtgaacaccg ataaagcaga agttaccgat gtgagtattg aaccggccag   600
tccggaagaa atcgcagata ccgtgaaagt tatgggtggc gaagattggg aactgtggat     660
tcaggcactg agcgaagccg gcgtgctggc cgaaggcgca aaaaccgttg cgtattctta     720
tattggcccg gaaatgacgt ggccggtgta ttggagtggc accattggcg aagccaaaaa     780
agatgttgaa aaagcggcga aacgcatcac ccagcagtac ggctgtccgg cgtatccggt     840
tgttgccaaa gcgctggtga cccaggccag tagcgccatt ccggtggtgc cgctgtatat     900
ttgcctgctg tatcgtgtta tgaaagaaaa aggcacccat gaaggctgca ttgaacagat     960
ggtgcgtctg ctgacgacga aactgtatcc ggaaaatggt gcgccgatcg tggatgaagc    1020
gggccgtgtg cgtgttgatg attgggaaat ggcagaagat gttcagcagg cagttaaaga    1080
tctgtggagc caggtgagta cggccaatct gaaagatatt agcgattttg caggttatca    1140
gaccgaattt ctgcgtctgt ttggctttgg tattgatggt gtggattacg atcagccggt    1200
tgatgttgaa gcggatctgc cgagcgccgc ccagcagtaa gtcaacaaag gaggggttaa    1260
aatggttgat ttcgaatatt caataccaac tagaattttt ttcggtaaag ataagataaa    1320
tgtacttgga agagagctta aaaaatatgg ttctaaagtg cttatagttt atggtggagg    1380
aagtataaag agaaatggaa tatatgataa agctgtaagt atacttgaaa aaaacagtat    1440
taaattttat gaacttgcag gagtagagcc aaatccaaga gtaactacag ttgaaaaagg    1500
agttaaaata tgtagagaaa atggagttga agtagtacta gctataggtg gaggaagtgc    1560
aatagattgc gcaaaggtta tagcagcagc atgtgaatat gatggaaatc catgggatat    1620
tgtgttagat ggctcaaaaa taaaaagggt gcttcctata gctagtatat taaccattgc    1680
tgcaacagga tcagaaatgg atacgtgggc agtaataaat aatatggata caaacgaaaa    1740
actaattgcg gcacatccag atatggctcc taagttttct atattagatc caacgtatac    1800
gtataccgta cctaccaatc aaacagcagc aggaacagct gatattatga gtcatatatt    1860
tgaggtgtat tttagtaata caaaaacagc atatttgcag gatagaatgg cagaagcgtt    1920
attaagaact tgtattaaat atggaggaat agctcttgag aagccggatg attatgaggc    1980
aagagccaat ctaatgtggg cttcaagtct tgcgataaat ggacttttaa catatggtaa    2040
agacactaat tggagtgtac acttaatgga acatgaatta agtgcttatt acgacataac    2100
acacggcgta gggcttgcaa ttttaacacc taattggatg gagtatattt taaataatga    2160
tacagtgtac aagtttgttg aatatggtgt aaatgtttgg ggaatagaca aagaaaaaaa    2220
tcactatgac atagcacatc aagcaataca aaaaacaaga gattactttg taaatgtact    2280
aggtttacca tctagactga gagatgttgg aattgaagaa gaaaaattgg acataatggc    2340
aaaggaatca gtaaagctta caggaggaac cataggaaac ctaagaccag taaacgcctc    2400
cgaagtccta caaatattca aaaaatctgt gtaaacctac gtttaaactt acgcgtatga    2460

Claims (29)

1.一种重组微生物宿主细胞,其包含编码多肽的异源DNA分子,所述多肽催化下述底物至产物转化:
a)乙酰辅酶A至乙酰乙酰辅酶A
b)乙酰乙酰辅酶A至3-羟丁酰辅酶A
c)3-羟丁酰辅酶A至巴豆酰辅酶A
d)巴豆酰辅酶A至丁酰辅酶A;
e)丁酰辅酶A至丁醛;和
f)丁醛至1-丁醇,
其中催化乙酰辅酶A至乙酰乙酰辅酶A的底物至产物转化的所述多肽是乙酰辅酶A乙酰转移酶;
催化乙酰乙酰辅酶A至3-羟丁酰辅酶A的底物至产物转化的所述多肽是3-羟丁酰辅酶A脱氢酶;
催化3-羟丁酰辅酶A至巴豆酰辅酶A的底物至产物转化的所述多肽是巴豆酸酶;
催化巴豆酰辅酶A至丁酰辅酶A的底物至产物转化的所述多肽是丁酰辅酶A脱氢酶;
催化丁酰辅酶A至丁醛的底物至产物转化的所述多肽是丁醛脱氢酶;
催化丁醛至1-丁醇的底物至产物转化的所述多肽是丁醇脱氢酶;并且
其中所述微生物宿主细胞生产1-丁醇并且选自细菌和酵母。
2.根据权利要求1的宿主细胞,其中所述细胞是选自埃希氏菌属、芽孢杆菌属和糖酵母属的属的成员。
3.根据权利要求2的宿主细胞,其中所述细胞是大肠杆菌。
4.根据权利要求2的宿主细胞,其中所述细胞是枯草芽孢杆菌。
5.根据权利要求2的宿主细胞,其中所述细胞是啤酒糖酵母。
6.根据权利要求1的宿主细胞,其中所述乙酰辅酶A乙酰转移酶具有选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:129、SEQ IDNO:131、和SEQ ID NO:133的氨基酸序列。
7.根据权利要求1的宿主细胞,其中所述3-羟丁酰辅酶A脱氢酶具有选自SEQ ID NO:6、SEQ ID NO:135、SEQ ID NO:137、和SEQID NO:139的氨基酸序列。
8.根据权利要求1的宿主细胞,其中所述巴豆酸酶具有选自SEQID NO:8、SEQ ID NO:141、SEQ ID NO:143、和SEQ ID NO:145的氨基酸序列。
9.根据权利要求1的宿主细胞,其中所述丁酰辅酶A脱氢酶具有选自SEQ ID NO:10、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、和SEQ ID NO:187的氨基酸序列。
10.根据权利要求1的宿主细胞,其中所述丁醛脱氢酶具有选自SEQ ID NO:12、SEQ ID NO:153、和SEQ ID NO:189的氨基酸序列。
11.根据权利要求1的宿主细胞,其中所述丁醇脱氢酶具有选自SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:153、SEQ ID NO:155、和SEQ ID NO:157的氨基酸序列。
12.根据权利要求1的宿主细胞,其中所述宿主细胞是兼性厌氧菌。
13.一种用于生产1-丁醇的方法,其包括:
i)提供包含编码多肽的异源DNA分子的重组微生物宿主细胞,所述多肽催化下述底物至产物转化:
a)乙酰辅酶A至乙酰乙酰辅酶A
b)乙酰乙酰辅酶A至3-羟丁酰辅酶A
c)3-羟丁酰辅酶A至巴豆酰辅酶A
d)巴豆酰辅酶A至丁酰辅酶A;
e)丁酰辅酶A至丁醛;和
f)丁醛至1-丁醇;
其中催化乙酰辅酶A至乙酰乙酰辅酶A的底物至产物转化的所述多肽是乙酰辅酶A乙酰转移酶;
催化乙酰乙酰辅酶A至3-羟丁酰辅酶A的底物至产物转化的所述多肽是3-羟丁酰辅酶A脱氢酶;
催化3-羟丁酰辅酶A至巴豆酰辅酶A的底物至产物转化的所述多肽是巴豆酸酶;
催化巴豆酰辅酶A至丁酰辅酶A的底物至产物转化的所述多肽是丁酰辅酶A脱氢酶;
催化丁酰辅酶A至丁醛的底物至产物转化的所述多肽是丁醛脱氢酶;并且
催化丁醛至1-丁醇的底物至产物转化的所述多肽是丁醇脱氢酶;和
ii)使(i)的所述宿主细胞在由此生产1-丁醇的条件下与可发酵的碳底物接触,
其中所述宿主细胞选自细菌和酵母。
14.根据权利要求13的方法,其中所述可发酵的碳底物选自单糖、寡糖和多糖。
15.根据权利要求13的方法,其中所述碳底物选自葡萄糖、蔗糖和果糖。
16.根据权利要求13的方法,其中由此生产1-丁醇的所述条件是厌氧的。
17.根据权利要求13的方法,其中由此生产1-丁醇的所述条件是微需氧的。
18.根据权利要求13的方法,其中所述宿主细胞在极限培养基中与所述碳底物接触。
19.根据权利要求13的方法,其中所述宿主细胞是选自埃希氏菌属、芽孢杆菌属和糖酵母属的属的成员。
20.根据权利要求19的方法,其中所述宿主细胞是大肠杆菌。
21.根据权利要求19的方法,其中所述宿主细胞是枯草芽孢杆菌。
22.根据权利要求19的方法,其中所述细胞是啤酒糖酵母。
23.根据权利要求13的方法,其中所述乙酰辅酶A乙酰转移酶具有选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:129、SEQ ID NO:131、和SEQ ID NO:133的氨基酸序列。
24.根据权利要求13的方法,其中所述3-羟丁酰辅酶A脱氢酶具有选自SEQ ID NO:6、SEQ ID NO:135、SEQ ID NO:137、和SEQID NO:139的氨基酸序列。
25.根据权利要求13的方法,其中所述巴豆酸酶具有选自SEQ IDNO:8、SEQ ID NO:141、SEQ ID NO:143、和SEQ ID NO:145的氨基酸序列。
26.根据权利要求13的方法,其中所述丁酰辅酶A脱氢酶具有选自SEQ ID NO:10、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、和SEQ ID NO:187的氨基酸序列。
27.根据权利要求13的方法,其中所述丁醛脱氢酶具有选自SEQID NO:12、SEQ ID NO:153、和SEQ ID NO:189的氨基酸序列。
28.根据权利要求13的宿主细胞,其中所述丁醇脱氢酶具有选自SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:153、SEQ ID NO:155、和SEQ ID NO:157的氨基酸序列。
29.根据权利要求13的方法,其中所述宿主细胞是兼性厌氧菌。
CN200680035878.2A 2005-09-29 2006-09-28 4碳醇的发酵生产 Active CN101432434B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US72167705P 2005-09-29 2005-09-29
US60/721,677 2005-09-29
US81447006P 2006-06-16 2006-06-16
US60/814,470 2006-06-16
PCT/US2006/038007 WO2007041269A2 (en) 2005-09-29 2006-09-28 Fermentive production of four carbon alcohols

Publications (2)

Publication Number Publication Date
CN101432434A CN101432434A (zh) 2009-05-13
CN101432434B true CN101432434B (zh) 2015-03-11

Family

ID=40647049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680035878.2A Active CN101432434B (zh) 2005-09-29 2006-09-28 4碳醇的发酵生产

Country Status (2)

Country Link
CN (1) CN101432434B (zh)
ZA (1) ZA200802682B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013102084A2 (en) * 2011-12-30 2013-07-04 Butamax (Tm) Advanced Biofuels Llc Fermentative production of alcohols
BR112015015594B1 (pt) * 2012-12-27 2022-07-05 Rhodia Operations Célula de levedura, método de produção de uma célula de levedura, uso de uma célula de levedura e método de biossíntese heteróloga de um valinoide
MX2018004642A (es) * 2015-10-13 2019-04-15 Lanzatech New Zealand Ltd Bacteria diseñada por ingeniería genética que comprende una trayectoria de fermentación que genera energía.
CN113247946B (zh) * 2021-04-22 2022-07-05 哈尔滨工业大学 一种自组装纳米生物催化剂及其制备方法和在丁醇生产中的应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Richard Dickinson et.al.An investigation of the metabolism of valine to isobutyl alcohol in saccharomyces cerevisiae..《The journal of biological chemistry》.1998,25751-25756. *
Yoshimoto et al..Genetic and physiological analysis of branched-chain alcohols and isoamyl acetate production in sacharomyces cerevisiae..《Appl microbiol bitechnol》.2002,501-508. *

Also Published As

Publication number Publication date
CN101432434A (zh) 2009-05-13
ZA200802682B (en) 2009-09-30

Similar Documents

Publication Publication Date Title
DK1929025T3 (en) Fermentative production OF ALCOHOLS WITH FOUR CARBON ATOMS
EP2142656B1 (en) Method for the production of 1-butanol
KR20120083391A (ko) 조작된 미생물 및 n-프로판올, 프로필렌 및 폴리프로필렌의 통합 제조방법
CN109312296B (zh) 重组酵母细胞
AU2010300642B2 (en) Fermentive production of isobutanol using highly effective ketol-acid reductoisomerase enzymes
CA2796777C (en) Biocatalytic oxidation process with alkl gene product
US8273558B2 (en) Fermentive production of four carbon alcohols
US8518678B2 (en) Strain comprising increased expression of a CFA coding region for butanol production
US20140051133A1 (en) Ketol-acid reductoisomerase enzymes and methods of use
KR102303832B1 (ko) 내산성을 갖는 효모 세포, 상기 효모 세포를 제조하는 방법 및 이의 용도
CN101297042A (zh) 四碳醇的发酵生产
KR102227976B1 (ko) Nadh 데히드로게나제가 불활성화된 효모 세포 및 그를 이용한 락테이트를 생산하는 방법
CN101432434B (zh) 4碳醇的发酵生产
KR102349954B1 (ko) 산물 생산능이 향상된 효모 및 그를 이용한 산물을 생산하는 방법
KR20160135588A (ko) Nadph 생성이 증가된 유전적으로 조작된 효모 세포, 효모 세포 중 nadph 수준을 증가시키는 방법, 상기 효모 세포를 제조하는 방법 및 상기 효모 세포를 이용하여 락테이트를 생산하는 방법
KR101488110B1 (ko) 나노아케움 이퀴탄스 유래의 Neq HS DNA 중합효소의 돌연변이체 제조 및 이를 이용한 hot-start PCR 응용
MX2008004086A (en) Fermentive production of four carbon alcohols
Liu et al. Functional expression of the thiolase

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: BUT MAS ADVANCED BIO-FUEL CO., LTD.

Free format text: FORMER OWNER: NAMUR DUPONT COMPANY

Effective date: 20100613

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20100613

Address after: Delaware, USA

Applicant after: Butamax Advanced Biofuels LLC

Address before: Delaware, USA

Applicant before: E. I. du Pont de Nemours and Co.

C14 Grant of patent or utility model
GR01 Patent grant