CN114901814A - 具有氢化酶活性的单体多肽,特别是具有氢化酶活性的重组单体多肽 - Google Patents

具有氢化酶活性的单体多肽,特别是具有氢化酶活性的重组单体多肽 Download PDF

Info

Publication number
CN114901814A
CN114901814A CN202080089310.9A CN202080089310A CN114901814A CN 114901814 A CN114901814 A CN 114901814A CN 202080089310 A CN202080089310 A CN 202080089310A CN 114901814 A CN114901814 A CN 114901814A
Authority
CN
China
Prior art keywords
less
hydrogenase
seq
leu
host cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080089310.9A
Other languages
English (en)
Inventor
达米安·戈多
菲利普·洛奇
巴特·吉塞尔斯
娜塔莉·约伯
法布里斯·弗兰克
朱塞佩·卡尔达雷拉
皮埃尔·卡多尔
克莱尔·雷马克尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
H2win SA
Original Assignee
H2win SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from BE20195783A external-priority patent/BE1027221B1/fr
Application filed by H2win SA filed Critical H2win SA
Publication of CN114901814A publication Critical patent/CN114901814A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0067Oxidoreductases (1.) acting on hydrogen as donor (1.12)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P3/00Preparation of elements or inorganic compounds except carbon dioxide
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/30Hydrogen technology
    • Y02E60/50Fuel cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及一种包括一个单亚基的单体多肽,所述单亚基包含[NiFe]‑氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性。

Description

具有氢化酶活性的单体多肽,特别是具有氢化酶活性的重组 单体多肽
技术领域
本发明涉及一种具有氢化酶活性的单体多肽,特别是具有氢化酶活性的重组单体多肽,包括所述单体多肽的宿主细胞,以及包括编码所述单体多肽的多核苷酸的宿主细胞。本发明还涉及所述具有氢化酶活性的单体多肽的制备方法,特别是获得具有氢化酶活性的重组单体多肽的方法,以及这种单体多肽的应用,特别是这种重组单体多肽的应用。
背景技术
化石能源供应的减少以及对气候急剧变化的担忧导致了清洁和可再生技术的出现。氢气(H2)的能量含量高,并且在燃料电池中使用时不存在温室气体和纳米颗粒,因此被认为是促进可再生能源的载体。目前,通过化石碳氢化合物的化学提取、电解水或生物质热解来生产H2。然而,H2的主要限制是缺乏无污染和商业上可行的生产系统。使用生物技术生产氢气(也称为生物氢气)的方法可能是一种解决方案。在过去十年中,关于生物制氢气的研究数量显著增加。这包括主要通过细菌发酵和微藻光合作用过程的微生物生产,也包括通过“电酶学”酶促产生氢气。所有这些方法都依赖于称为氢化酶的特定酶。
氢化酶是催化化学反应的金属酶:
Figure BDA0003706684240000011
这种依赖于酶的产生氢气或消耗氢气反应被定义为氢化酶活性。该反应是可逆的,其方向取决于能够与酶相互作用的组分的氧化还原电位。在H2和电子受体存在的情况下,氢化酶消耗氢气。在低电位电子供体存在下,氢化酶利用质子作为电子受体并产生H2。许多微生物都使用氢气作为能量载体或来源,因此氢化酶在微生物中广泛存在。这些酶在细菌和古细菌领域有许多代表,也存在于一些单细胞真核生物中。尽管氢化酶在许多方面(宿主、大小、四级结构、电子供体或受体)存在多样性,但它们在系统发育上可分为三种不同的类别:[Fe]-氢化酶、[FeFe]-氢化酶和[NiFe]-氢化酶。每一类的特点是活性部位的独特的金属成分。生理学上,这些酶已被证明是电子过剩的阀门。
[Fe]-氢化酶的催化中心不含任何FeS或Ni中心,因此被命名为“无[FeS]中心的氢化酶”或[Fe]-氢化酶(Shima和Thauer,2007,Athirdtype ofhydrogenase catalyzing H2activation,Chem Rec 7:37-46)。[Fe]-氢化酶仅限于某些产甲烷的微生物(Pilak等人,2006,The crystal structure ofthe apoenzyme ofthe iron-sulphur cluster-freehydrogenase.J Mol Biol 358:798-809),其中它们对镍缺乏期间的生长至关重要(Thauer,1998,Biochemistry ofmethanogenesis:a tribute to MarjoryStephenson.1998Marjory Stephenson Prize Lecture.Microbiology144:2377-2406)。这些酶与特定的辅助因子有关,具有与其他类型氢化酶截然不同的催化特性。事实上,这些酶不催化可逆的H2生成反应(Vignais和Billoud,2007,Occurrence,classification,andbiological function ofhydrogenases:an overview.Chem Rev 107:4206-4272)。正因如此,同时由于其分布较少,这类氢化酶的研究很少。绝大多数已知的氢化酶属于其他两类。
[FeFe]-氢化酶是催化中心高度保守的单体酶。其是一个双核铁位点,其通过半胱氨酸桥与[4Fe-4S]中心结合。非蛋白质配体、氰化物(CN)和一氧化碳(CO)与双核中心的铁原子结合。铁原子还共享两个硫配体(Nicolet等人,2000,Anovel FeS cluster in Fe-only hydrogenases.Trends Biochem Sci 25:138-143;Nicolet等人,2002,Fe-onlyhydrogenases:structure,function and evolution J Inorg Biochem 91:1-8)。其他结构域具有多个FeS中心,并在外部电子源和嵌入这些单体蛋白质中的活性位点之间提供电子转移链。此外,疏水通道将表面连接到活性位点,并为质子提供通道,为H2分子提供出口。已知名为HydE、HydF和HydG的三种伴侣蛋白对于[FeFe]-氢化酶的正确装配是必需的(Vignais等人,2001,Classification andphylogeny ofhydrogenases.FEMS MicrobiolRev 25:455-501)。这些酶存在于厌氧原核生物(梭状芽孢杆菌属或脱硫弧菌属)中,也存在于一些低等真核生物中,如厌氧真菌或单细胞微藻(小球藻属或衣藻属)(Vignais和Billoud,2007,Occurrence,classification,andbiological function ofhydrogenases:an overview.Chem Rev 107:4206-4272)。[FeFe]-氢化酶在热力学上促进辅助因子(铁氧化还原蛋白或NADH)的再氧化,从而生成H2。因此,这些酶通常参与消除细胞中过量的还原当量,以避免例如停止发酵。它们还能够与一组受限的微藻的光合链相互作用,氧化光合链,从而在缺氧孵育后激活碳固定(Ghysels等人,2013,Function of the chloroplasthydrogenase in the microalga Chlamydomonas:the role of hydrogenase and statetransitions during photosynthetic activation in anaerobiosis.PLoS One8:e64161;Godaux等人,2015,Induction ofPhotosynthetic Carbon FixationinAnoxiaRelies on Hydrogenase Activity and Proton-Gradient Regulation-Like1-Mediated Cyclic Electron Flow in Chlamydomonas reinhardtii.PlantPhysiol 168:648-658)。
[NiFe]-氢化酶形成球状杂多聚体(Volbeda等人,1995,Crystal structureofthe nickel-iron hydrogenase from Desulfovibrio gigas.Nature 373:580-587)。双金属[NiFe]活性位点位于大亚基中,由四个半胱氨酸和三个非蛋白配体(一个CO分子和两个CN)与铁原子配位(Happe等人,1997,Biological activation ofhydrogen.Nature 385:126;Nature 385:126,Pierik等人,1999,Carbon monoxide and cyanide as intrinsicligands to iron in the active site of[NiFe]-hydrogenases.NiFe(CN)2CO,Biology's way to activate H2.JBiol Chem 274:3331-3337)。杂多聚体的其他亚基包含几个内侧和远端FeS中心,这些中心在活性位点和生理电子供体或受体之间传导电子。位于活性位点附近的[4Fe-4S]基团被认为是活性的关键(Albracht,1994,Nickel hydrogenases:insearch ofthe active site.Biochim BiophysActa 1188:167-204)。除了结构基因外,还有几个辅助基因参与了镍、铁、CO和CN的成熟和嵌入这些杂多聚体的活性位点。事实上,[NiFe]-氢化酶的成熟遵循一个复杂的途径,涉及至少七种辅助蛋白(HypA-F和一种内肽酶)(Vignais和Billoud,2007,Occurrence,classification,andbiological functionofhydrogenases:an overview.Chem Rev 107:4206-4272)。[NiFe]-氢化酶活性位点的另一个特征是对氢气的亲和力强。因此,即使某些[NiFe]-氢化酶具有良好的生产氢气能力,这些酶还是主要通过消耗宿主微生物中的H2来发挥作用。[NiFe]-氢化酶是原核生物中非常普遍的酶,例如,在细菌和古细菌中有许多代表。[NiFe]-氢化酶的分类基于不同亚基的氨基酸序列比对,[NiFe]-氢化酶分为四类。值得注意的是,这一分类与基于生理功能得出的分类非常一致(Vignais和Billoud,2007,Occurrence,classification,andbiologicalfunction ofhydrogenases:an overview.Chem Rev 107:4206-4272)。
当考虑这些酶用于在工业水平上制氢气时,氢化酶在体外和体内对氧的极端敏感性是一个问题。氧作为配体结合到活性位点,接受电子,并被还原为酶中捕获的活性氧(ROS)。当活性氧存活足够长的时间来攻击脆弱的催化中心时,可能导致永久性损伤。[FeFe]-氢化酶对O2有极端的敏感性,因为[FeFe]-氢化酶在暴露于低浓度O2后会受到不可逆转的损害(Ghirardi等人,1997,Oxygen sensitivity of algal H2-production.ApplBiochem Biotechnol63-65:141-151)。然而,[NiFe]-氢化酶比[FeFe]-氢化酶更能抵抗氧引起的损伤。此外,[NiFe]-氢化酶因O2引起的失活是可逆的。一些诸如青枯菌属的微生物甚至已经形成了一个耐氧活性位点,即使在有空气的情况下也能氧化氢(Van der Linden等人,2004,The soluble[NiFe]-hydrogenase from Ralstonia eutropha contains fourcyanides in its active site,one ofwhich is responsible for the insensitivitytowards oxygen.J Biol Inorg Chem 9:616-626)。这些不同的特性使得[NiFe]-氢化酶成为更适合应用于工业上可行技术的候选物。
HoxEFUYH是一种特性良好的[NiFe]-氢化酶,存在于蓝藻门集胞藻(Synechocystis sp)PCC 6803中。HoxEFUYH是一种五聚体细胞质[NiFe]-氢化酶。HoxY和HoxH构成“氢化酶”部分,而HoxE、HoxF和HoxU构成与氧化还原辅助因子接触的部分(Carrieri等人,2011,The role ofthe bidirectional hydrogenase incyanobacteria.Bioresour Technol 102:8368-8377)。HoxH是负责催化活性的亚基,即包含[NiFe]-氢化酶活性位点的亚基。HoxH含有镍和铁原子键合的保守残基。HoxY包含靠近镍铁催化中心的近端[4Fe-4S]基团。HoxF和HoxU是负责与底物(NADH、黄素氧化还原蛋白或还原铁氧化还原蛋白)在体内相互作用的铁硫蛋白。HoxFU包含向HoxYH传输电子的内侧和远端FeS中心。HoxE的功能尚不清楚,但它可能是一种膜锚定亚基。对成熟途径的突变分析确定了七种必需成熟因子,称为HypA、HypB、HypC、HypD、HypE、HypF和HoxW(Hoffmann等人,2006,Mutagenesis ofhydrogenase accessory genes ofSynechocystis sp.PCC6803.Additional homologs ofhypA and hypB are not active in hydrogenasematuration.FEBS J 273:4516-4527)。现有技术已经提出了HoxEFUYH的成熟模型(Carrieri等人,2011,The role ofthe bidirectional hydrogenase incyanobacteria.Bioresour Technol 102:8368-8377;Cassier Chauvat等人,2014,Advances in the function and regulation of hydrogenase in the cyanobacteriumSynechocystis PCC 6803.Int J Mol Sci15:19938-19951)。HoxH亚基被HoxW特异性蛋白酶处理,并且[镍-铁]位点通过HypABCDEF复合物添加到催化亚基上。已对集胞藻PCC 6803的全基因组进行了测序。与分散在集胞藻染色体中的hypABCDEF基因不同,HoxEFUYH基因被鉴定为聚集在八顺反子操纵子中。hoxEFUYH操纵子的启动子不是很活跃(Dutheil等人,2012,The AbrB2 autorepressor,expressed from an atypical promoter,repressesthe hydrogenase operon to regulate hydrogen production in Synechocystisstrain PCC 6803.J Bacteriol 194:5423-5433)。它受各种环境条件的调节,如氢、光、硝酸盐、镍、氧或硫的存在(Oliveira和Lindblad,2009,Transcriptional regulation ofthecyanobacterial bidirectional Hox-hydrogenase.Dalton Trans 9990-9996)。值得注意的是,hox基因在有氧条件下组成性表达(Kiss等人,2009,Transcriptional regulationof the bidirectional hydrogenase in the cyanobacterium Synechocystis 6803.JBiotechnol 142:31-37),这种对氧敏感的酶在有氧条件下不活跃。确切的生理功能仍存在争议,但HoxEFUYH将起到安全阀的作用,在不利的氧化还原条件下耗散多余的电子,因此,在发酵或光合作用过程中,维持细胞内适当的氧化/还原平衡(Carrieri等人,2011,Therole ofthe bidirectional hydrogenase in cyanobacteria.Bioresour Technol 102:8368-8377)。
有大量关于HoxEFUYH的研究。许多特性使该酶成为生物制氢气的良好候选酶。首先,这种[NiFe]-氢化酶对质子还原有偏向性(McIntosh等人,2011年,The[NiFe]-hydrogenase of the cyanobacterium Synechocystis sp.PCC 6803worksbidirectionally with a bias to H2production.JAm Chem Soc 133:11308-11319)。在有氧条件下,操纵子和酶在集胞藻PCC 6803中弱表达(Kiss等人,2009,Transcriptionalregulation ofthe bidirectional hydrogenase in the cyanobacteriumSynechocystis 6803.J Biotechnol 142:31-37)。在氧气存在的情况下,HoxEFUYH是完全失活的,并且几乎是瞬时失活。然而在氧化还原条件下(例如通过氢还原和/或通过消除氧气),可以快速重新激活HoxEFUYH(延迟大约一分钟)(Appel等人,2000,The bidirectionalhydrogenase of Synechocystis sp.PCC 6803works as an electron valve duringphotosynthesis.Arch Microbiol 173:333-338;Germer等人,2009,Overexpression,isolation,and spectroscopic characterization of the bidirectional[NiFe]hydrogenase from Synechocystis sp.PCC 6803.J Biol Chem 284:36462-36472;McIntosh等人,2011,The[NiFe]-hydrogenase of the cyanobacterium Synechocystissp.PCC 6803works bidirectionally with abias to H2 production.JAm Chem Soc133:11308-11319)。几种纯化方案(Schmitz等人,2002,HoxE--a subunit specific forthe petmeric bidirectional hydrogenase complex(HoxEFUYH)ofcyanobacteria.Biochim Biophys Acta 1554:66-74,Germer等人,2009,Overexpression,isolation,and spectroscopic characterization of the bidirectional[NiFe]hydrogenase from Synechocystis sp.PCC 6803.J Biol Chem 284:36462-36472)和电化学中的实施(McIntosh等人,2011,The[NiFe]-hydrogenase of the cyanobacteriumSynechocystis sp.PCC 6803works bidirectionally with abias to H2production.JAm Chem Soc 133:11308-11319)是可用的。由于能够有效催化氢气的生成,并且对氧的敏感性有限,因此可以确定HoxEFUYH是一个很好的候选物。
大量制备目标蛋白质的一种常见而有效的方法是在异源宿主内重组生产所述蛋白质。这一生物技术过程涉及将目标基因导入和表达到宿主生物的基因组中,以制备大量纯度极高的目标蛋白质。有几种重组生产系统。原核系统仍然为最快、最简单的制备目标蛋白质的系统,而真核系统则更慢、更复杂。每种生物体都有其自身的优缺点。目前还没有一个普遍适用的表达系统。很难预测哪种宿主对特定蛋白质或特定最终用途最佳。大肠杆菌(E.coli)是重组生产的参考生物。事实上,从基因和生理工程的角度来看,这种细菌是众所周知的,例如:优化的细胞(高生产力、密码子的使用、抑制内源性蛋白酶)、优化的培养基、短的倍增时间、低污染、许多商业载体的可用性、工业规模化、高产量。
与金属蛋白一样,重组氢化酶的生产和工程化也取得了有限的成功。文献提供了大肠杆菌中异源表达的[FeFe]-氢化酶的示例(King等人,2006,Functional studies of[FeFe]hydrogenase maturation in an Escherichia coli biosynthetic system.JBacteriol 188:2163-2172;Yacoby等人,2012,Optimized expression andpurificationfor high-activity preparations ofalgal[FeFe]-hydrogenase PLoS One 7:e35886;Kuchenreuther等人,2009,Tyrosine,cysteine,and S-adenosyl methionine stimulatein vitro[FeFe]hydrogenase activation.PLoS One 4:e7565)。[FeFe]-氢化酶是需要有限数量成熟因子的单体酶。
异源生产[NiFe]-氢化酶被认为是困难的(English等人,2009,Recombinant andin vitro expression systems for hydrogenases:new frontiers in basic andapplied studies for biological and synthetic H2 production.Dalton Trans 9970-9978)。
首先,困难源于[NiFe]活性位点装配过程的复杂性和特异性,理论上,功能装配至少需要七个成熟因子。
其次,需要正确折叠杂多聚体的每个亚基,这在异源生产过程中特别难以控制和保证。
第三,必需正确装配杂多聚体复合物中的每个亚基。错误折叠会导致聚集现象,从而导致活性酶数量减少(Singh等人,2015,Protein recovery from inclusionbodiesofEscherichia coli using mild solubilization process.Microb Cell Fact 14:41)。获得酶活性必须获得精确的序列,这在异源宿主中可能难以控制和保证。
所有这些都解释了为什么异源重组产生的[NiFe]-氢化酶并不是都具有活性。然而文献中有几例表明在大肠杆菌中产生了活性[NiFe]-氢化酶(Kim等人,2011,Productionof biohydrogen by heterologous expression of oxygen-tolerant Hydrogenovibriomarinus[NiFe]-hydrogenase in Escherichia coli J Biotechnol 155:312-319;Maier等人,2015,Identification,cloning and heterologous expression of active[NiFe]-hydrogenase 2from Citrobacter sp.SG in Escherichia coli.J Biotechnol 199:1-8;Schiffels等人,2013,An innovative cloning platform enables large-scaleproduction and maturation of an oxygen-tolerant[NiFe]-hydrogenase fromCupriavidus necator inEscherichia coli.PLoS One 8:e68812;Weyman等人,2011,Genetic analysis ofthe Alteromonas macleodii[NiFe]-hydrogenase.FEMS MicrobiolLett 322:180-187)。
特别地,Sun等人的工作(Sun等人,2010,Heterologous expression andmaturation ofan NADP-dependent[NiFe]-hydrogenase:a key enzyme in biofuelproduction.PLoS One 5:e10526)使嗜热古细菌的[NiFe]-氢化酶能够通过四个表达载体在大肠杆菌缺氧中表达,允许13个异源基因(四个结构基因和九个成熟因子)的共表达。更具体地说,Sun等人的工作能够获得一种四聚体重组[NiFe]-氢化酶类酶,该酶包含名为PF0891、PF0892、PF0893和PF0894的四个亚基。纯化后,发现该四聚体重组酶在功能上与从嗜热古细菌中纯化的天然酶相似。
由于HoxEFUYH是蓝藻门集胞藻属的原核蛋白,因此大肠杆菌系统适合其重组生产。其在大肠杆菌中的生产已经成功进行。从这个意义上说,Maeda等人表明,在缺氧条件下,表达蓝藻HoxEFUYH酶的大肠杆菌细胞体内产氢量增加(Maeda等人,2007,Inhibitionof hydrogen uptake in Escherichia coli by expressing the hydrogenase from thecyanobacterium Synechocystis sp.PCC 6803.BMC Biotechnol 7:25)。这种在HoxEFUYH存在下的产氢量增加是由于抑制了大肠杆菌中内源性耗氢氢化酶1和2的活性。
我们还应该提到Wells等人,他们在大肠杆菌中引入了HoxEFUYH基因和这些相关的成熟因子(Wells等人,2011,Engineering a non-native hydrogen productionpathway into Escherichia coli via a cyanobacterial[NiFe]hydrogenase.Metab Eng13:445-453)。这项工作证明了在缺氧条件下,内源性氢化酶在无效宿主中通过HoxEFUYH在体内和体外产生氢气。它们表明了与宿主电子转移系统(如发酵)的耦合,并显示了HoxEFUYH在代谢工程中提高产氢量的潜力。
在现有技术中,未公开一种单体多肽,所述单体多肽包括一个单亚基,所述单亚基包括[NiFe]-氢化酶类蛋白的活性位点,尤其是衍生自[NiFe]-氢化酶类复合物的分离单体的活性位点,具有其自身的氢化酶活性,尽管文件D2(Hornhardt等人,1986,Characterization ofa native subunit of the NAD-linked hydrogenase isolatedfrom a mutant ofAlcaligenes eutrophus H16.Biochimie,Masson,Paris,FR,vol.68(1),pages 15-24)和D3(Przybyla等人,1992,Structure-function relationships amongthe nickel-containing hydrogenases.FEMS Microbiol Rev8:109-135)似乎认为是这样的。
文件D2描述了真养产碱菌H16的[NiFe]-氢化酶天然亚基的特性。代表[NiFe]-氢化酶的催化亚基的肽对作为氧化还原介质的NAD完全无活性,但对亚甲基蓝、铁氰化物和细胞色素C具有非常低的残留活性。
文件D3表明存在具有氢化酶活性的[NiFe]-氢化酶类单体。文件D3引用文件D2作为示例,提及真养产碱菌的[NiFe]-氢化酶,以及大肠杆菌的[NiFe]-氢化酶-1。
然而,随后发表的研究,包括文件D1(Massanz等人,1998,Subforms and in vitroreconstitution of the NAD-reducing hydrogenase of Alcaligenes eutrophus.JBacteriol180:1023-1029)、D4(Senger等人,2017,Proteolytic cleavage orchestratescofactor insertion and protein assembly in[NiFe]-hydrogenase biosynthesis.JBiol Chem 292:11670-11681)和D5(Pinske等人,2011,Efficient electron transferfrom hydrogen to benzyl viologen by the[NiFe]-hydrogenases of Escherichiacoli is dependent on the coexpression of the iron-sulfur cluster-containingsmall subunit.ArchMicrobiol 193:893-903)中所述的研究,表明文件D2和D3的研究结论是错误的。
文件D1中所述的研究表明,单独含有真养产碱菌H16的[NiFe]-氢化酶亚基的活性位点对于几种氧化还原介质,尤其是苄基紫精,没有类氢化酶的活性。文件D1提到,真养产碱菌的[NiFe]-氢化酶的最小实体可能具有氢化酶活性,所述最小实体由包含[NiFe]中心的大亚基和具有最小FeS中心的小亚基组成。同样,文件D4和D5中的研究与文件D3的教学相矛盾,因为它们表明大肠杆菌的[NiFe]-氢化酶-1的单个催化亚基没有氢化酶活性。
关于这一主题开展的大部分工作,包括文件D1、D4和D5的研究,都认为位于小亚基的[4Fe-4S]中心对于[NiFe]-氢化酶大亚基的氢化酶活性是必不可少的(Albracht,1994,Nickel hydrogenases:in search ofthe active site.Biochim Biophys Acta 1188:167-204)。此外,对[NiFe]-氢化酶的结构分析在很大程度上表明,在含有活性位点的催化亚基中不存在FeS中心(Lubitz等人,2014,Hydrogenases.Chem Rev 114:4081-4148)。
因此,文献D2中描述的结果只能解释为小亚基污染催化亚基,这可以通过对允许测量低氢化酶活性的制剂中的FeS中心突出显示来证明。
综上所述,所有现有技术都认为,亚基数量的减少既不利于氢化酶的活性,也不利于氢化酶的稳定性,并且从镍铁类氢化酶的多聚体复合物中分离出来的含镍铁中心的亚基本身没有氢化酶活性。
然而,从上述现有技术中可以明显看出,其仍然存在一些缺陷,极大地阻碍了[NiFe]-氢化酶,尤其是HoxEFUYH,在商业上有利的生物制氢气中的应用。
因此,到目前为止,确实需要克服[NiFe]-氢化酶在制氢气中的困难,因为如上所述,[NiFe]-氢化酶无疑具有很高的制氢气潜力。
发明内容
为了解决上述问题,本发明提供了一种单体多肽,所述单体多肽包含一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有酶活性,尤其是氢化酶类酶活性,更具体地为催化活性,更具体地为一种类似氢化酶的催化活性。
优选的,根据本发明,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点。
优选的,根据本发明,所述单体多肽由一个单亚基组成,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点。
优选的,根据本发明,所述单体多肽由一个单亚基制成,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点。
换言之,优选的,本发明提供一种单体多肽,所述单体多肽包括一个单亚基,所述单亚基仅包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽本身具有酶活性,尤其是氢化酶类酶活性,更具体地为具有催化活性,更具体地为一种类似氢化酶的催化活性。
在本发明的上下文中,已经强调这种单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,并且所述单体多肽具有氢化酶活性,允许至少一部分阻碍[NiFe]-氢化酶制备氢气的物质的释放,以保证氢化酶活性至少为0.01μmol H2·min-1·mg-1酶,优选至少0.05μmol H2·min-1·mg-1酶。
事实上,由于根据本发明的单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,因此能够大大减少甚至消除[NiFe]-氢化酶为了确保每个相关亚基的充分折叠、以及为了确保每个亚基在杂多聚体复合物中的正确装配中遇到的困难,尤其是确保活性位点的装配。由于本发明的单体多肽只涉及一个亚基,因此能够提高获得[NiFe]-氢化酶的再现性。事实上,与二聚体、四聚体和五聚体酶相比,单个单体多肽的生产大大简化了复杂的折叠过程,二聚体、四聚体和五聚体酶的活性位点、每个亚基以及最终整个酶的正确装配尤其难以控制和保证,这阻碍了二聚体、四聚体和五聚体酶的使用。根据本发明,单亚基的正确折叠是必要的,不同亚基之间无需装配即可形成杂多聚体复合物。
此外,本发明单体多肽的制备方法完全可以在有氧条件下进行(在表达和纯化期间不需要预防氧),这避免了现有技术在缺氧条件下制备重组二聚体、四聚体和五聚体中遇到的问题。如上所述,即使生物量的积累是在氧气存在的情况下进行的,重组氢化酶的生产阶段本身是在缺氧条件下按照现有技术已知的方法进行的(Sun等人,2010,Heterologousexpression and maturation of an NADP-dependent[NiFe]-hydrogenase:a key enzymein biofuel production.PLoS One 5:e10526;Wells等人,2011,Engineering a non-native hydrogen production pathway into Escherichia coli via a cyanobacterial[NiFe]hydrogenase.Metab Eng 13:445-453)。纯化各个色谱步骤也需要缺氧(缺氧箱、缓冲液中的连二亚硫酸钠)。在这期间维持缺氧条件显然涉及重组生产成本的增加,本发明解决了这一问题。
有利的是,与杂多聚体相比,本发明的单体多肽明显更小,从而酶的质量活性增加(每1mg总蛋白催化活性实体的数量)。
本发明的单体多肽的也可实现酶催化剂的更好聚合和致密化,例如,在诸如燃料电池的电化学实施例中。
此外,本发明的单体多肽的三维结构易于建模,以确定暴露在蛋白质表面的残基,例如便于相对于界面(例如相对于碳电极)的定向和吸附。该特性能够有利的提高界面和酶催化剂之间连接的稳定性,同时也优化了界面和活性位点之间的直接电子转移。因此,在没有其它的氧化还原中继体的情况下,可以提高能效,从而限制了能量损失。
在本发明的上下文中,还证明了单体多肽确实具有活性,适合催化产H2(例如通过使用还原甲基紫精作为氧化还原介质进行的氢化酶标准体外产H2试验)以及催化消耗H2(例如,通过使用氧化苄基紫精作为氧化还原介质的氢化酶的标准体外H2消耗试验),小亚基中不存在被描述为必需的近端FeS中心,也不存在任何其它氧化还原中继体。这是非常令人惊讶的,因为,在现有技术中,如此简化的杂多聚体酶从未具有突出的氢化酶的活性。
更有利的是,虽然目前已知的重组[NiFe]-氢化酶只能获得有限的H2(Sun等人,2010年,Heterologous expression and maturation of an NADP-dependent[NiFe]-hydrogenase:a key enzyme inbiofuel production.PLoS One 5:e10526;Schiffels等人,2013年,An innovative cloning platform enables large-scale production andmaturation ofan oxygen-tolerant[NiFe]-hydrogenase from Cupriavidus necator inEscherichia coli.PLoS One 8:e68812;Maier等人,2015,Identification,cloning andheterologous expression of active[NiFe]-hydrogenase 2from Citrobacter sp.SGinEscherichia coli.J Biotechnol 199:1-8),表明本发明的单体多肽具有氢化酶活性,至少相当于或甚至大于使用已知(重组)[NiFe]-氢化酶获得的活性。
根据本发明的一个实施例,所述单体多肽分离自天然环境,尤其分离自天然[NiFe]-氢化酶类蛋白。
举例来说,本发明所述单体多肽可从原核生物衍生/分离。示例包括但不限于大肠杆菌属(例如大肠杆菌)、脱硫弧菌属(例如巨大脱硫弧菌)、嗜氢菌属(例如热淡黄嗜氢菌Hydrogenophilus thermoluteolus)、脱硫微杆菌属(例如嗜中性硫酸盐还原菌),集胞藻属(例如,集胞藻PCC 6803)、席藻属(例如,可疑席藻)或螺旋藻属(例如,钝顶螺旋藻)。例如,所述单体多肽可来自细胞或微生物,或可在体外或体内产生。
根据本发明的一个实施例,所述单体多肽为重组的或异源的。
优选的,根据本发明,所述单体多肽为纯化的。
优选的,根据本发明,所述单体多肽截短或非截短的氨基酸序列与SEQ ID NO:2的氨基酸序列和/或SEQ ID NO:4的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
更优选的,根据本发明,所述单体多肽截短或非截短的氨基酸序列与SEQ ID NO:2的氨基酸序列和/或SEQ ID NO:4的氨基酸序列具有不低于81%、不低于82%、不低于83%、不低于84%、不低于85%、不低于86%、不低于87%、不低于88%、不低于89%、不低于90%、不低于91%、不低于92%、不低于93%、不低于94%、不低于95%、不低于96%、不低于97%、不低于98%、不低于99%的同一性。
优选的,根据本发明,所述单体多肽的特征在于,所述包括[NiFe]-氢化酶类蛋白的活性位点的亚基为集胞藻CCP6803中/来自集胞藻CCP6803的HoxEFUYH[NiFe]-氢化酶类蛋白的HoxH亚基。
优选的,根据本发明,所述单体多肽的氢化酶活性不低于0.01μmol H2·min-1·mg-1酶,优选为不低于0.05μmol H2·min-1·mg-1酶,优选为不低于10μmol H2·min-1·mg-1酶。
本发明还涉及一种包括本发明的单体多肽的宿主细胞,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性。
优选的,本发明涉及一种包括本发明的单体多肽的宿主细胞,所述单体多肽的单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单亚基为集胞藻PCC 6803中HoxEFUYH[NiFe]-氢化酶类蛋白的HoxH亚基。
例如,根据本发明,宿主细胞,尤其是用于表达所述单体多肽的宿主细胞,可以为大肠杆菌属(例如大肠杆菌)、芽孢杆菌属(例如枯草芽孢杆菌)、链霉菌属(例如天蓝色链霉菌)、集胞藻属(例如集胞藻PCC 6803)、聚球藻属(例如聚球藻WH8102)或任何其他原核细胞,衣藻属(例如莱茵衣藻)、酵母菌属(例如酿酒酵母)、毕赤酵母型Pichia(例如甲醇酵母)或其他类型的真核细胞。
根据本发明,包含在所述宿主细胞中的所述单体多肽本身可以(但不一定)来自表达载体中的基因的表达,例如插入到所述宿主细胞质粒中的基因的表达。
优选的,根据本发明,包括在所述宿主细胞中的所述单体多肽截短或非截短的氨基酸序列与SEQ ID NO:2的氨基酸序列和/或SEQ ID NO:4的氨基酸序列具有不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
优选的,根据本发明,所述宿主细胞可包括所述[NiFe]-氢化酶类蛋白的至少一种成熟因子,所述包括[NiFe]-氢化酶类蛋白的至少一种成熟因子优选选自HypA、HypB、HypC、HypD、HypE、HypF和HoxW。
a)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW的氨基酸序列分别与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性;或者
b)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW由串联核苷酸序列共同编码,所述串联核苷酸序列与编码所有成熟因子的SEQ ID NO:19的核苷酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
根据本发明,所述至少一种成熟因子可为宿主细胞内源性成熟因子和/或宿主细胞外源性成熟因子。
优选的,本发明的宿主细胞包括表达载体,所述表达载体中的至少一个基因表达所述单体多肽和/或所述至少一种成熟因子。
本发明还涉及一种宿主细胞,所述宿主细胞包括编码本发明的单体多肽的多核苷酸,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性。
优选的,本发明涉及一种宿主细胞,所述宿主细胞包括编码单体多肽的多核苷酸,所述单体多肽的单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单亚基为集胞藻PCC6803中HoxEFUYH[NiFe]-氢化酶类蛋白的HoxH亚基。
优选的,根据本发明,所述编码单体多肽的多核苷酸的核苷酸序列与SEQ ID NO:1的核苷酸序列和/或SEQ ID NO:3的核苷酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
举例来说,根据本发明,包括编码本发明的单体多肽的多核苷酸,尤其用于表达所述单体多肽的宿主细胞可以为大肠杆菌属(例如大肠杆菌)、芽孢杆菌属(例如枯草芽孢杆菌)和链霉菌属(例如天蓝色链霉菌)的宿主细菌细胞,集胞藻属(例如集胞藻PCC 6803)或聚球藻属(例如聚球藻WH8102)的光合细菌细胞或任何其他原核细胞,衣藻属(例如莱茵衣藻)、酵母菌属(例如酿酒酵母)、毕赤酵母型Pichia(例如甲醇酵母)或其他类型的真核细胞。
根据本发明,包括在所述宿主细胞中的所述多核苷酸本身可以但不一定包括在插入所述宿主细胞的诸如质粒的表达载体中。
优选的,根据本发明,由所述宿主细胞中所述多核苷酸编码的所述单体多肽截短或非截短的氨基酸序列与SEQ ID NO:2的氨基酸序列和/或SEQ ID NO:4的氨基酸序列具有不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
优选的,根据本发明,包括编码单体多肽的多核苷酸的所述宿主细胞可包括所述[NiFe]-氢化酶类蛋白的至少一种成熟因子,所述[NiFe]-氢化酶类蛋白的所述至少一种成熟因子优选选自HypA、HypB、HypC、HypD、HypE、HypF和HoxW。
a)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW的氨基酸序列分别与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性;或者
b)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW由串联核苷酸序列共同编码,所述串联核苷酸序列与编码所有成熟因子的SEQ ID NO:19的核苷酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
根据本发明,所述至少一种成熟因子可为宿主细胞内源性成熟因子和/或宿主细胞外源性成熟因子。
优选的,本发明的宿主细胞包括表达载体,所述表达载体中的至少一个基因表达所述单体多肽和/或所述至少一种成熟因子。
本发明还涉及例如在宿主细胞(例如在大肠杆菌中)中制备具有氢化酶活性的单体多肽的方法,所述方法包括以下步骤:
·诸如质粒的表达载体的修饰,方法为在表达载体中转入外源多核苷酸,所述外源多核苷酸至少一部分编码所述单体多肽,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点;和
·根据孵育条件孵育所述修饰的表达载体,所述孵育的条件为能够维持所述外源多核苷酸的表达以产生所述单体多肽,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点。
根据本发明的方法能够实现包含[NiFe]-氢化酶类蛋白的活性位点的单亚基的生产。
当然,本领域技术人员能够调整所需的和适当的孵育条件。
根据本发明,在改造宿主细胞的步骤中,所述多核苷酸本身可以但不一定包括在诸如质粒的表达载体中。
优选的,根据本发明,修饰所述表达载体的步骤包括在所述表达载体中转入所述外源多核苷酸,所述外源多核苷酸至少一部分编码所述单体多肽,所述单体多肽截短或非截短的氨基酸序列与SEQ ID NO:2的氨基酸序列和/或SEQ ID NO:4的氨基酸序列具有不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
优选的,根据本发明,修饰所述表达载体的步骤可包括在所述表达载体中插入所述[NiFe]-氢化酶类蛋白的一个或多个成熟因子,优选包含所述[NiFe]-氢化酶类蛋白的一个或多个成熟因子,所述至少一种成熟因子优选选自HypA、HypB、HypC、HypD、HypE、HypF和HoxW。
a)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW的氨基酸序列分别与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性;或者b)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW由串联核苷酸序列共同编码,所述串联核苷酸序列与编码所有成熟因子的SEQ ID NO:19的核苷酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
根据本发明,在修饰所述表达载体的步骤中,编码所述[NiFe]-氢化酶类蛋白的一个或多个成熟因子的序列本身可以但不一定包括在诸如质粒的表达载体中。
优选的,本发明的方法包括分离和/或纯化所述单体多肽的后续步骤。
具体且优选的,本发明涉及制备本发明中具有氢化酶活性的单体多肽的方法,所述方法包括以下步骤:
·在体内或体外对包括遗传物质的诸如宿主细胞或表达载体的实体进行转基因的步骤,以获得诸如转基因宿主细胞或转基因表达载体的转基因实体;
·孵育所述诸如所述转基因宿主细胞或所述转基因表达载体的转基因实体,以获得包括一个单亚基的单体多肽的步骤,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性。
优选的,根据本发明,所述在体内或体外进行的所述转基因的步骤包括:
a)将外源多核苷酸通过转基因转入宿主细胞和/或表达载体,以获得转基因宿主细胞和/或转基因表达载体,孵育所述转基因宿主细胞和/或转基因表达载体,所述外源多核苷酸至少一部分编码所述单体多肽,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述孵育的条件为能够维持所述外源多核苷酸的表达以产生所述单体多肽;或者
b)诱导宿主细胞的遗传物质发生至少一种基因突变以获得转基因的宿主细胞,孵育所述转基因宿主细胞,所述孵育的条件为能够产生所述单体多肽。
当然,本领域技术人员能够调整所需的和适当的孵育条件。
例如,根据本发明,所述至少一种基因突变通过同源重组来诱导,使用本领域技术人员熟知的方法即可。
优选的,根据本发明,所述将外源多核苷酸通过转基因转入宿主细胞的步骤,包括将表达载体转入所述宿主细胞,尤其是包括所述外源多核苷酸的修饰的表达载体。
优选的,根据本发明,所述宿主细胞的转基因步骤,包括将所述外源多核苷酸转入所述宿主细胞,所述外源多核苷酸至少一部分编码所述单体多肽,所述单体多肽截短或非截短的氨基酸序列与SEQ ID NO:2的氨基酸序列和/或SEQ ID NO:4的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
优选的,根据本发明,所述宿主细胞的转基因步骤还包括将所述[NiFe]-氢化酶类蛋白的至少一种成熟因子转入所述宿主细胞,所述至少一种成熟因子对于宿主细胞为内源性的和/或外源性的,所述至少一种成熟因子优选选自HypA、HypB、HypC、HypD、HypE、HypF和HoxW,
a)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW的氨基酸序列分别与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性;或者
b)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW由串联核苷酸序列共同编码,所述串联核苷酸序列与编码所有成熟因子的SEQ ID NO:19的核苷酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
优选的,根据本发明,所述宿主细胞包括表达载体,所述表达载体中的至少一个基因表达所述至少一种成熟因子。
优选的,根据本发明具有氢化酶活性的单体多肽的制备方法使得单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单亚基为集胞藻PCC6803中HoxEFUYH[NiFe]-氢化酶类蛋白的HoxH亚基。
本发明还涉及根据本发明的单体多肽的应用,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性,根据孵育的条件,存在于或不存在于细胞中,通过孵育所述单体多肽产生或消耗氢,以确保氢的产生或消耗。
本发明还涉及根据本发明的单体多肽或根据本发明的方法制备的单体多肽的应用,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性,存在于或不存在于细胞中,用于涂覆表面,尤其是涂覆诸如阳极或阴极的导电体的表面。
附图说明
图1显示了质粒pET-26b(+)(5360bp)的图谱。
图2显示了NdeI和BlpI限制性内切酶消化表达载体pET26b(+)+HoxH的琼脂糖凝胶分析。
图3显示了质粒pACYCDuet-1(4008bp)的图谱。
图4显示了NcoI和HindIII限制性内切酶消化表达载体pACYCDuet-1+HypABCDEFHoxW的琼脂糖凝胶分析。
图5显示了NdeI和BlpI限制性内切酶消化来源于大肠杆菌菌落质粒DNA的表达载体pET26b(+)+HoxH的琼脂糖凝胶分析。
图6显示了NcoI和HindIII限制性内切酶消化源于大肠杆菌菌落质粒DNA的表达载体pACYCDuet-1+HypABCDEFHoxW的琼脂糖凝胶分析。
图7显示了纯化目标HoxH重组蛋白的方法。NA,未被Ni-NTA亲和柱吸附的样品。洗脱液:用含有10mM咪唑的洗脱缓冲液洗脱样品;50mM:以50mM浓度的咪唑洗脱样品;100mM:以100mM浓度的咪唑洗脱样品;150mM:以150mM浓度的咪唑洗脱样品;200mM:以200mM浓度的咪唑洗脱样品;250mM:以250mM浓度的咪唑洗脱样品。
图8显示了亲和层析期间收集的各种组分的蛋白质组成的SDS-PAGE分析。负载物(Load):从重组大肠杆菌细胞的裂解中提取的,应用于Ni-NTA亲和柱的上清液;NA,未被Ni-NTA亲和柱吸附的样品。洗脱液:用含有10mM咪唑的洗脱缓冲液洗脱样品。50mM:以50mM浓度的咪唑洗脱样品;100mM:以100mM浓度的咪唑洗脱样品;150mM:以150mM浓度的咪唑洗脱样品;200mM:以200mM浓度的咪唑洗脱样品;250mM:以250mM浓度的咪唑洗脱样品。
图9显示了亲和层析期间收集的各种组分中HoxH存在的蛋白免疫印迹(Westernblot)。M:分子量标记;负载物(Load):从重组大肠杆菌细胞的裂解中提取的,应用于Ni-NTA亲和柱的上清液;NA:未被Ni-NTA亲和柱吸附的样品;50mM:以50mM浓度的咪唑洗脱样品;200mM:以200mM浓度的咪唑洗脱样品。
图10为集胞藻PCC 6803中HoxEFUYH、[NiFe]-氢化酶的结构示意图。HoxE,19KDa和1个FeS中心;HoxF,57.5KDa,2个FeS中心和一个FMN中心;HoxU,26KDa和4个FeS中心;HoxY,20KDa和FeS中心;HoxH,53KDa和活性位点。
图11为集胞藻PCC 6803的HoxEFUYH、[NiFe]-氢化酶与NADPH和甲基紫精(MV)之间的电子转移和预期相互作用的示意图(阴影箭头)。
图12为一个示意图,其中问号提出了一个问题,即HoxH重组蛋白的活性位点是否可以直接接受来自MV的电子,从而在没有额外氧化还原中继体的情况下产生氢气。
图13显示了通过将HoxH重组蛋白添加到已经处于无氧条件下的由连二亚硫酸钠还原的含有甲基紫精的试剂中而产生的氢气,进而表示氢化酶活性。HoxH能够将之前还原的甲基紫精的电子与质子(存在于缓冲液中)结合,从而根据代表氢化酶催化反应的方程式
Figure BDA0003706684240000161
Figure BDA0003706684240000165
生成氢气。使用微型传感器(
Figure BDA0003706684240000162
丹麦)连续测量试剂中溶解的氢含量。箭头显示添加HoxH重组蛋白的时间,微传感器检测到所述时间引起溶解氢水平的增加。
图14显示了在H2存在的情况下,将HoxH重组蛋白添加到含有苄基紫精(BV)的试剂中,通过苄基紫精的还原量来表示氢化酶活性。HoxH能够从氢中获取电子,将其转移到氧化还原介质,例如苄基紫精,根据代表氢化酶催化反应的方程式
Figure BDA0003706684240000163
产生质子。消耗的氢含量相当于苄基紫精的还原量,所述含量可在578nm波长下通过分光光度法连续检测。
图15显示了通过将在没有大肠杆菌外源性HupABCDEFHoxW成熟因子的情况下产生的HoxH重组蛋白,添加到已经处于无氧条件下的由连二亚硫酸钠还原的含有甲基紫精的试剂中而产生的氢气,进而表示氢化酶活性。HoxH能够将之前还原的甲基紫精的电子与质子(存在于缓冲液中)结合,从而根据代表氢化酶催化反应的方程式
Figure BDA0003706684240000164
生成氢气。
具体实施方式
定义
在本发明中,术语“多肽”为由至少两个氨基酸组成的单链,所述氨基酸通过氨基酸的羧基和下一个氨基酸的胺基之间的肽键连接。术语“多肽”还包括含有多个多肽通过二硫键连接在一起的分子,或通过例如非共价或共价连接并形成多聚体(例如二聚体、三聚体、四聚体、五聚体)的多肽复合物。多肽还可以包含非蛋白质配体,例如无机铁(Fe)、镍(Ni)、铁硫中心(FeS)或其他有机配体,例如一氧化碳(CO)、氰化物(CN)或黄素。多肽的定义中包括肽、多肽、酶、亚基或蛋白质等术语,这些术语可以互换。“多肽”的定义不考虑所述多肽的长度,也不考虑所述多肽的产生方式。
在本发明中,术语“重组多肽”或“异源多肽”为在环境中非天然存在和/或在用于其生产的宿主细胞中非天然存在的多肽,特别是在宿主细胞中,并且其生产是通过重组技术进行的,例如,通过向宿主细胞添加遗传物质。
在本发明中,术语“单体多肽”为由至少两个氨基酸组成的单链,所述氨基酸通过氨基酸的羧基和下一个氨基酸的胺基之间的肽键连接。与术语“多肽”相反,术语“单体多肽”仅包括仅包含一个多肽的分子,即不与任何其他多肽相互作用的分子。例如,其绝不是多聚体(例如二聚体、三聚体、四聚体、五聚体等)。单体多肽还可以包含非蛋白质配体,例如无机铁(Fe)、镍(Ni)、铁硫中心(FeS),或其他有机配体,例如一氧化碳(CO)、氰化物(CN)或黄素。“单体多肽”的定义不考虑所述多肽的长度,也不考虑所述多肽的产生方式。
在本发明中,术语“重组单体多肽”或“异源单体多肽”为非天然存在于环境中(特别是宿主细胞中)并且通过重组技术(例如通过向宿主细胞添加遗传物质)进行生产的单体多肽。
在本发明中,术语“具有氢化酶活性的单体多肽”指所述单体多肽能够催化可逆反应
Figure BDA0003706684240000171
氢化酶活性的定义与实验条件无关,仅与通过氢化酶活性产生或消耗氢有关。
在本发明中,术语“活性位点”为当形成三级结构时负责所述多肽的诸如氢化酶活性的催化活性的多肽部分。所述多肽部分可包括例如氨基酸序列的若干部分和/或与一种或多种非蛋白质配体的结合。
在本发明中,术语“多核苷酸”为由例如通过共价键连接在一起的至少两个核苷酸组成的单链,所述核苷酸为核糖核苷酸或脱氧核苷酸。因此,这包括单链或双链RNA和DNA。“多核苷酸”的定义没有考虑到所述多核苷酸的长度、功能、形状以及产生所述多核苷酸的方式。例如,多核苷酸可以为质粒、质粒的一部分、基因或基因片段。
在本发明中,术语“外源性多核苷酸”为通常不存在于宿主细胞中的多核苷酸。例如,外源多核苷酸可以为编码宿主细胞或质粒中非天然存在的多肽的序列。
在本发明中,术语“串联”指为了仅形成一个序列的多个序列的延伸,例如多核苷酸序列或多肽序列的延伸。
在本发明中,术语“质粒”为不同于外源染色体DNA的双链DNA分子,由于其自身的复制来源,能够自主复制。质粒还可以包括目标序列,例如编码筛选因子(对抗生素的耐药性等)的基因、能够插入多核苷酸的多克隆位点和/或转录调节序列。术语“质粒”或“表达载体”可以互换。
在本发明中,术语“宿主细胞”指经过改造的细胞。例如,这种改造可以为例如通过质粒将外源多核苷酸转入细胞。
在本发明中,术语“成熟因子”为任何生物或非生物分子,其参与另一生物分子(例如蛋白质)结构的形成。
在本发明中,术语“内源性成熟因子”为任何生物或非生物分子,其参与另一生物分子(例如蛋白质)结构的形成,并且天然存在于宿主细胞中,也就是说没有对所述宿主细胞进行基因改造。
在本发明中,术语“外源性成熟因子”为任何生物或非生物分子,其参与另一生物分子(例如蛋白质)结构的形成,并且非天然存在于宿主细胞中,也就是说,需要对所述宿主细胞进行基因改造(例如通过转入表达载体)以向其转入所述外源成熟因子。
在本发明中,术语“分离”是指从其自然环境中取出任何分子,例如从天然[NiFe]-氢化酶中取出分子。
在本发明中,“纯化”一词是指通过生物化学技术分离任何分子。该定义未考虑分子的产生方式,例如天然或通过重组、化学或酶合成,也未考虑用于纯化的生化技术,如亲和层析或分子筛。例如,纯化多核苷酸、多肽或H2。优选的,当一种物质至少占与其相关联的其他组分的60%、优选为75%、优选为90%时,代表所述物质被纯化。
在本发明中,术语“显著均质”指纯化分子至少占与其相关联的其他组分的90%。
在本发明中,术语“同一性”指两个多核苷酸或两个多肽之间的结构相似性。结构相似性由两个序列之间的比对确定,比对优化了序列上相同核苷酸或相同氨基酸的数量。为了更好地比对,可以在一个或两个序列中出现空位,从而优化结构相似性。但核苷酸或氨基酸的序列必须保持不变。
在本发明中,术语“遗传物质”指实体的基因组,更准确地说,指所述实体的所有核酸,包括编码和非编码序列。
在本发明中,术语“基因突变”指实体的遗传物质(例如宿主细胞或表达载体)的偶然或引发的修饰。
在本发明中,术语“包含遗传物质的实体”指包含根据上述定义的遗传物质的实体,例如宿主细胞或诸如质粒的表达载体。
在本发明中,术语“转基因实体”指包含根据上述定义的遗传物质的实体,并且所述实体进行了遗传物质的修饰,例如基因突变或在细胞(诸如通过质粒)中转入外源多核苷酸。
在本发明中,术语“转基因宿主细胞”是指根据上述定义的宿主细胞,其进行了遗传物质的修饰,例如基因突变或在细胞(诸如通过质粒)中转入外源多核苷酸。
在本发明中,术语“转基因表达载体”是指根据上述定义的表达载体或质粒,进行了遗传物质的修饰,例如插入了目标序列,例如编码特定多肽的基因。
以下实施例(参考附图)旨在示出本发明的其他特征、细节和优点,而非限定本发明。
实施例
1、HoxH表达载体的构建
1.1 HoxH的“简单”序列
HoxH为集胞藻PCC 6803中包含HoxEFUYH[NiFe]-氢化酶活性位点的大亚基。该蛋白在Genbank中的登录号为BAA18091.1。HoxH的理论等电点为5.86,理论分子量为52996.53道尔顿。HoxH的核苷酸序列(1425bp)如下所示,在本发明的上下文中命名为SEQ ID NO:1:
atgtctaaaaccattgttatcgatcccgttacccggattgaaggccatgccaaaatctccattttcctcaacgaccagggcaacgtagatgatgttcgtttccatgtggtggagtatcggggttttgaaaaattttgcgaaggtcgtcccatgtgggaaatggctggtattaccgcccgtatttgcggcatttgtccggttagccatctgctctgtgcggctaaaaccggggataagttactggcggtgcaaatccctccagccggggaaaaactgcgccgtttaatgaatttagggcaaattacccaatcccacgccctaagttttttccatctcagcagtcctgattttctgcttggttgggacagtgatcccgctactcgcaatgtgtttggtttaattgctgctgaccccgatttagctagggcaggtattcggttacggcaatttggccaaacggtaattgaacttttgggagctaaaaaaatccactctgcttggtcagtgcccggtggagtccgatcgccgttgtcggaagaaggcagacaatggattgtggaccgtttaccagaagcaaaagaaaccgtttatttagccttaaatttgtttaaaaatatgttggaccgcttccaaacagaagtggcagaatttggcaaatttccctccctatttatgggcttagttgggaaaaataatgaatgggaacattatggcggctccctgcggtttaccgacagtgaaggcaatattgtcgcggacaatctcagtgaagataattacgctgattttattggtgaatcggtggaaaaatggtcctatttaaaatttccctactacaaatctctgggttatcccgatggcatttatcgggttggtccccttgcccgccttaatgtttgtcatcacattggcaccccggaagcagaccaagaattagaagaatatcggcaacgggctggaggtgtggccacgtcctctttcttttatcattacgcccgcttggtggaaattcttgcctgtttagaagccatcgaattgttaatggctgaccctgatattttgtccaaaaattgtcgagctaaggcagaaattaattgtaccgaagcggtgggagtgagcgaagcaccccggggtactttattccaccattacaagatagatgaagatggtctaattaagaaagtgaatttgatcattgccacgggcaacaataacttagccatgaataaaaccgtggcccaaattgccaaacactacattcgcaatcatgatgtgcaagaagggtttttaaaccgggtggaagcgggtattcgttgttatgatccctgccttagttgttctacccatgcagcgggacaaatgccattgatgatcgatttagttaaccctcagggggaactaattaagtccatccagcgggattaa
HoxH的氨基酸序列(474aa)如下所示,在本发明的上下文中命名为SEQ ID NO:2:
MSKTIVIDPVTRIEGHAKISIFLNDQGNVDDVRFHVVEYRGFEKFCEGRPMWEMAGITARICGICPVSHLLCAAKTGDKLLAVQIPPAGEKLRRLMNLGQITQSHALSFFHLSSPDFLLGWDSDPATRNVFGLIAADPDLARAGIRLRQFGQTVIELLGAKKIHSAWSVPGGVRSPLSEEGRQWIVDRLPEAKETVYLALNLFKNMLDRFQTEVAEFGKFPSLFMGLVGKNNEWEHYGGSLRFTDSEGNIVADNLSEDNYADFIGESVEKWSYLKFPYYKSLGYPDGIYRVGPLARLNVCHHIGTPEADQELEEYRQRAGGVATSSFFYHYARLVEILACLEAIELLMADPDILSKNCRAKAEINCTEAVGVSEAPRGTLFHHYKIDEDGLIKKVNLIIATGNNNLAMNKTVAQIAKHYIRNHDVQEGFLNRVEAGIRCYDPCLSCSTHAAGQMPLMIDLVNPQGELIKSIQRD
图1显示了质粒pET26b(+)的图谱,所述质粒通过将SEQ ID NO:3插入pET26b(+)来构建HoxH表达载体。pET26b(+)是一种5360bp的质粒,具有大肠杆菌的复制起点、卡那霉素抗性基因、包含许多限制性位点的多克隆位点(MCS)、T7启动子和T7转录终止子。其还包含编码转录抑制因子的lacI基因。这种转录抑制可以通过添加IPTG来解除。
1.2 HoxH的“优化”序列
任选地,根据本发明的实施例,序列SEQ ID NO:1和SEQ ID NO:2针对大肠杆菌中的密码子使用进行了优化。具体而言,在质粒pET26b(+)中克隆的核苷酸序列的起始和结束处分别添加NdeI(catatg)和BlpI(gctnagc)限制性位点,并且还添加了序列caccacaccatcac(下面加下划线部分)(编码靠近蛋白质N末端的多聚组氨酸标签的序列)。
所述优化的核苷酸序列(1453bp)如下所示,在本发明的上下文中命名为SEQ IDNO:3:
catatgagccaccaccaccaccatcacaaaaccatcgtcatcgacccagtcacccgcatcgaaggccacgccaaaattagcatttttctgaacgaccagggcaacgtcgacgacgtccgctttcacgttgttgaataccgtggcttcgaaaaattttgtgaaggtcgtccgatgtgggaaatggccggtatcacggcacgtatttgtggaatttgtccggtgagccatctgctgtgtgccgcaaaaaccggagataaactgctggcagtgcagattccgccggcaggtgaaaaactgcgtcgtctgatgaatctgggtcagattacacagtcgcatgcactgtctttctttcatctgagtagcccagattttctgctggggtgggatagcgacccggcaacacgtaatgtgtttggtctgattgcggctgatccggatctggcgcgtgccggtattcgtctgcgtcagtttggtcagacagttattgagctgctgggggcgaaaaagattcatagtgcatggtctgtgccgggtggtgttcgtagtccgctgagtgaagaaggtcgtcagtggattgttgatcgtctgccggaggcaaaagaaacggtctatctggcactgaatctgtttaaaaatatgctggatcgtttccagacagaagttgcagaatttggaaaatttccgtcactgtttatgggtctggttggtaaaaataatgaatgggaacactatggtggtagcctgcgtttcacggactctgaaggtaatattgttgcggataatctgagcgaagacaattatgcagattttatcggtgaaagtgtggaaaaatggagctatctgaaatttccgtattacaaaagcctgggctatccggatgggatctaccgtgttggaccgctggcacgtctgaacgtttgtcatcatattggtaccccggaagcagatcaggaactggaagaatatcgtcagcgtgcgggtggtgttgcgactagcagctttttttatcattatgcacgtctggttgaaattctggcctgtctggaggcaattgaactgctgatggcagatcctgatattctgtctaaaaattgtcgtgcaaaagcagaaattaactgtaccgaggcagttggtgttagtgaggcgccgcgtggtaccctgtttcatcactataaaattgacgaagatggtctgattaaaaaggttaatctgattatcgcaaccggtaacaataatctggcaatgaataaaaccgttgcacagattgcaaaacactacattcgcaaccacgatgttcaggaagggtttctgaatcgtgtagaagccggcattcgctgttatgatccgtgtctgagctgtagcacccatgcagcaggtcagatgcctctgatgattgacctggttaatccgcagggtgagctgattaaaagcattcagcgtgattaagctgagc
所述优化的氨基酸序列(480aa)如下所示,在本发明的上下文中命名为SEQ IDNO:4:
MSHHHHHHKTIVIDPVTRIEGHAKISIFLNDQGNVDDVRFHVVEYRGFEKFCEGRPMWEMAGITARICGICPVSHLLCAAKTGDKLLAVQIPPAGEKLRRLMNLGQITQSHALSFFHLSSPDFLLGWDSDPATRNVFGLIAADPDLARAGIRLRQFGQTVIELLGAKKIHSAWSVPGGVRSPLSEEGRQWIVDRLPEAKETVYLALNLFKNMLDRFQTEVAEFGKFPSLFMGLVGKNNEWEHYGGSLRFTDSEGNIVADNLSEDNYADFIGESVEKWSYLKFPYYKSLGYPDGIYRVGPLARLNVCHHIGTPEADQELEEYRQRAGGVATSSFFYHYARLVEILACLEAIELLMADPDILSKNCRAKAEINCTEAVGVSEAPRGTLFHHYKIDEDGLIKKVNLIIATGNNNLAMNKTVAQIAKHYIRNHDVQEGFLNRVEAGIRCYDPCLSCSTHAAGQMPLMIDLVNPQGELIKSIQRD
质粒pET26b(+)用于通过将SEQ ID NO:3插入pET26b(+)构建HoxH表达载体。
图2显示了NdeI和BlpI限制性内切酶对表达载体pET26b(+)+HoxH(SEQ ID NO:3)的消化分析。突出显示了约5300bp(线性化的pET26b(+))和约1500bp(从质粒pET26b(+)切除的HoxH序列)的两个DNA片段。这证实了表达载体pET26b(+)中存在目标HoxH序列。
2、至少一种成熟因子的表达载体的构建
在本发明的上下文中,至少考虑以下成熟因子:HypA、HypB、HypC、HypD、HypE、HypF和HoxW。
HypA为集胞藻PCC 6803中HoxEFUYH[NiFe]-氢化酶的表达/形成蛋白。所述蛋白在Genbank中的登录号为BAA18357.1。HypA的理论等电点为4.94,理论分子量为12773.47道尔顿。HypA的核苷酸序列(342bp)如下所示,在本发明的上下文中命名为SEQ ID NO:5:
atgcacgaagttagtctgatggagcaaactttggcgatcgccattgcccaggcggaagaccatggagccagccaaatccatcgtttaaccctgcgggtggggcaacagtctggggtggtggccgatgccctacggtttgcgtttgaagtggtgcgacaaaataccatggccgccgaggcgagattggaaattgaagaaattcccgttacctgtcgttgccaacactgccacgaaaattttcagccagaggattggatttaccgctgtccccactgcgaccagattagccaaacagtaatggatggcaaacagttggaactagcatccctagaactgagttga
HypA的氨基酸序列(113aa)如下所示,在本发明的上下文中命名为SEQ ID NO:6:
MHEVSLMEQTLAIAIAQAEDHGASQIHRLTLRVGQQSGVVADALRFAFEVVRQNTMAAEARLEIEEIPVTCRCQHCHENFQPEDWIYRCPHCDQISQTVMDGKQLELASLELS
HypB为集胞藻PCC 6803中HoxEFUYH[NiFe]-氢化酶的表达/形成蛋白。所述蛋白在Genbank中的登录号为BAA18312.1。HyB的理论等电点为5.75,理论分子量为31242.97道尔顿。HypB的核苷酸序列(858bp)如下所示,在本发明的上下文中命名为SEQ ID NO:7:
atgtgccaaaactgcggttgtagtgcggtgggaaccgttgcccatagccaccatcaccatggcgatggaaattttgcccacagccatgatgaccatgaccagcaagaacatcatcaccaccatggcaactacagcaaaagtccaagtcagcagactgtgaccattgaacccgatcgccagtccattgccattggccaaggcattctcagcaagaatgaccgcctagcggaaaggaatcggggctatttccaggctaagggcttactggtgatgaatttcctctcttctcccggagccggtaaaactgctctgatcgaaaaaatggtcggcgatcgacaaaaagaccatcccaccgccgtcattgtgggggatttagccaccgataacgatgcccaacgtctccgcagtgccggggcgatcgccattcaggtcaccacaggaaatatttgccatctggaagcggaaatggtggccaaggcggcccaaaagttagatttagacaatatcgatcaattgatcattgaaaatgttggtaatttggtttgccccaccacctatgatctaggggaagatttacgggtcgtattattttccgtcacagaaggggaggataaaccccttaaatatcccgccaccttcaaatcagcccaggttattttagtcaccaaacaggacattgccgccgcagtggattttgatgcagagctggcttggcaaaacctacggcaagtggccccccaagcccaaatttttgcagtgtctgcccgcacggggaaaggattgcagtcctggtatgagtatttggatcaatggcaactccaacactattcgccgttggttgatccagcattggcctaa
HypB的氨基酸序列(285aa)如下所示,在本发明的上下文中命名为SEQ ID NO:8:
MCQNCGCSAVGTVAHSHHHHGDGNFAHSHDDHDQQEHHHHHGNYSKSPSQQTVTIEPDRQSIAIGQGILSKNDRLAERNRGYFQAKGLLVMNFLSSPGAGKTALIEKMVGDRQKDHPTAVIVGDLATDNDAQRLRSAGAIAIQVTTGNICHLEAEMVAKAAQKLDLDNIDQLIIENVGNLVCPTTYDLGEDLRVVLFSVTEGEDKPLKYPATFKSAQVILVTKQDIAAAVDFDAELAWQNLRQVAPQAQIFAVSARTGKGLQSWYEYLDQWQLQHYSPLVDPALA
HypC为集胞藻PCC 6803中HoxEFUYH[NiFe]-氢化酶的表达/形成蛋白。所述蛋白在Genbank中的登录号为BAA18180.1。HypC的理论等电点为4.20,理论分子量为7987.42道尔顿。HypC的核苷酸序列(231bp)如下所示,在本发明的上下文中命名为SEQ ID NO:9:
Atgtgtctagccctacctggccaggttgtcagtttaatgcccaactccgatcccctgttactgacgggaaaggttagctttgggggcatcattaaaaccattagccttgcctacgtacccgaggttaaggtgggggattacgtgattgtccatgtgggctttgccattagcattgtggacgaagaggcggcccaggaaactttgatagacttggcagaaatgggagtttaa
HypC的氨基酸序列(76aa)如下所示,在本发明的上下文中命名为SEQ ID NO:10:
MCLALPGQVVSLMPNSDPLLLTGKVSFGGIIKTISLAYVPEVKVGDYVIVHVGFAISIVDEEAAQETLIDLAEMGV
HypD为集胞藻PCC 6803中HoxEFUYH[NiFe]-氢化酶的表达/形成蛋白。所述蛋白在Genbank中的登录号为BAA16622.1。HypD的理论等电点为6.31,理论分子量为40632.94道尔顿。HypD的核苷酸序列(1125bp)如下所示,在本发明的上下文中命名为SEQ ID NO:11:
atgaaatacgttgatgaatatcgggatgcccaggcggtggcccattaccgtcaggcgatcgccagggagataaccaaaccttggacgctgatggagatttgcggcggccagacccacagcattgtcaaatatggcttggatgctttgttgccgaagaatttgactctgatccatggtcccggctgtcctgtgtgcgtcactccgatggaattaattgaccaggctttgtggttagctaagcaaccggagatcattttttgttcctttggcgatatgttgcgggtgcccggcagtggggcggatttgctgagcattaaagcccagggcggcgatgtgcgcattgtctattctcctttggattgtttggcgatcgccagggagaatcctaatcgggaagtggtatttttcggagtaggttttgaaactacagcccctgccacggccatgactctccaccaagctagggcccagggaattagcaatttcagtttactttgcgcccatgtattggtgcccccggctatggaggctttattaggcaatcccaattccctcgtgcagggctttttggcggcagggcatgtctgtacggtgaccggggaaagggcctatcaacatatcgctgaaaaataccaagtacccattgtcatcactggctttgaacctgtggatattatgcagggcatctttgcctgtgtgcgccaactggagtcgggacaattcacctgcaacaatcaatatcggcgatcggtccaaccccagggcaatgcccatgctcagaaaattattgaccaagtgtttgagccagtcgatcgccattggcggggtttgggattaattccggccagcggtttgggtttaaggccagcatttgccccctgggatgccgcagttaaattcgccaatttattgcaaaccatggccccaacgatgggagaaacagtgtgtattagcggggaaattttacagggacaacggaagcccagcgattgtccagcctttggtactatctgcaccccagaacaacccttgggggctcccatggtttcctcggaaggagcctgtgccgcctattaccgttatcgccaacaattaccggaaccagtgggagcggccagagtttag
HypD的氨基酸序列(374aa)如下所示,在本发明的上下文中命名为SEQ ID NO:12:
MKYVDEYRDAQAVAHYRQAIAREITKPWTLMEICGGQTHSIVKYGLDALLPKNLTLIHGPGCPVCVTPMELIDQALWLAKQPEIIFCSFGDMLRVPGSGADLLSIKAQGGDVRIVYSPLDCLAIARENPNREVVFFGVGFETTAPATAMTLHQARAQGISNFSLLCAHVLVPPAMEALLGNPNSLVQGFLAAGHVCTVTGERAYQHIAEKYQVPIVITGFEPVDIMQGIFACVRQLESGQFTCNNQYRRSVQPQGNAHAQKIIDQVFEPVDRHWRGLGLIPASGLGLRPAFAPWDAAVKFANLLQTMAPTMGETVCISGEILQGQRKPSDCPAFGTICTPEQPLGAPMVSSEGACAAYYRYRQQLPEPVGAARV
HypE为集胞藻PCC 6803中HoxEFUYH[NiFe]-氢化酶的表达/形成蛋白。所述蛋白在Genbank中的登录号为BAA17478.1。HypE的理论等电点为4.93,理论分子量为36425.60道尔顿。HypE的核苷酸序列(1038bp)如下所示,在本发明的上下文中命名为SEQ ID NO:13:
gtgaacttagtctgtcccgttccccttgatcgttatccccaggtactgttagcccacggcggcggcggtaagttgagccaacaattacttaagcaaatttttttaccggcctttggcgcttctgaaacgggtagtcatgatgcggcggtttttactgccaaccaaagttctttagctttcaccaccgactcctatgtgatcaatcccctcttttttcctgggggcgatattggttctttggcagtccacggcaccgttaatgacctagccatggccggcgcaacccctcgctatatcagcgttggttttatcctcgaagaaggattgcccatggagaccctctggcgggtggcccaatccctagggcaagcggcccaaaactgtggggtggaaattcttaccggtgataccaaagtggtggaccggggtaagggagacggcattttcatcaacaccagcggcattggttccctcgaccatcaacaaactatccatcccaatcaggtacaggtaggcgatcgcctaattttgagcggtgatttgggacgtcatggcatggccattatggcagtgcgccaaggattagaatttgaaaccaccattgaaagtgattcggccccggttcacagagaagtgcaggcattattgtcggcagggatcccaatccattgtctgcgggatttaaccagggggggattagccagtgcggttaatgaaattgcccaaacttccggggtaaccatggctttacgagaaacgttaatcccggtggaggccgaagtacaagccgcctgtgaactgttgggttttgaccccctctatgtggccaatgagggaagattcctggccattgtgcccccggaagcagaacagaagaccgtggaaattttgcaaactttccatccccaagctacggcgatcggtacagtaacaggcaaaagtgcacaaaccttggggttagtcagtttggaaagttccattggtgccccccggttgctagacatgatcagtggggagcaattaccccgtatttgttag
HypE的氨基酸序列(345aa)如下所示,在本发明的上下文中命名为SEQ ID NO:14:
MNLVCPVPLDRYPQVLLAHGGGGKLSQQLLKQIFLPAFGASETGSHDAAVFTANQSSLAFTTDSYVINPLFFPGGDIGSLAVHGTVNDLAMAGATPRYISVGFILEEGLPMETLWRVAQSLGQAAQNCGVEILTGDTKVVDRGKGDGIFINTSGIGSLDHQQTIHPNQVQVGDRLILSGDLGRHGMAIMAVRQGLEFETTIESDSAPVHREVQALLSAGIPIHCLRDLTRGGLASAVNEIAQTSGVTMALRETLIPVEAEVQAACELLGFDPLYVANEGRFLAIVPPEAEQKTVEILQTFHPQATAIGTVTGKSAQTLGLVSLESSIGAPRLLDMISGEQLPRIC
HypF为集胞藻PCC 6803中HoxEFUYH[NiFe]-氢化酶的表达/形成蛋白。所述蛋白在Genbank中的登录号为BAA10154.1。HypF的理论等电点为8.19,理论分子量为85358.25道尔顿。HypF的核苷酸序列(2304bp)如下所示,在本发明的上下文中命名为SEQ ID NO:15:
atgttaaaaaccgttgccatacaggtccagggaagggtgcaaggagtgggttttcgtccctttgtttatacccttgcccaggaaatgggactgaatggttgggtgaataattccactcaaggagctaccgttgtcattaccgccgacgaaaaggcgatcgccgactttacggagagattaacgaagacattacctccccctggtttgattgaacaattagccgttgaacagttaccgctggaaagttttactaactttactatccgccccagtagtgatggccctaaaactgcgagtattttacccgatttatccacttgttccgcctgcttaacagaactatttgaccctagcgatcgccgttatctttacccctttattaactgtacccattgcggtccccgctacaccattattgaagccctaccttacgaccgttgtcgtaccaccatggctaggtttcgccaatgtaccgactgtgaaagggaatataagcaaccaggcgatagacgcttccatgcccaacctaatgcctgtcctcgctgtggcccccaactggctttttggaaccgacaaggccaagtaattgcagaagcaaatgaagctttaaactttgctgtagataatttaaaagtcggcaatattatcgctattaaaggcttaggtggcttccatttgtgttgtgatgccactgattttgaagctgtggaaaaattaagattaaggaaacatcgaccggataaacctttggcggtaatgtatggtaatcttggtcaaattgtggagcattaccaacctaataatctagaagttgaattgttacaaagtgccgccgcccctattgtgttattaaacaaaaaaaaacaattaattttggtggaaaatattgccccaggcaacccccgagtcggcgtaatgttagcctatactcctttgcatcacttattactaaaaaaattaaagaaacccatggtagctaccagtggtaacttagctggggagcaaatttgcattgataatattgacgctttaacccggttacaaaatattgctgacggttttctcgttcatgatcgcccgattgtttgtccagtggatgattccgttgtccaaatagtagctgggaagccattatttttgcgtcgagcccggggttacgctcctcaacccattactttaccaaagcctactcaaaaaaaactattggcgatgggaggtcattataaaaatacagtggcgatcgccaaacaaaatcaagcttacgtcagccaacatttgggcgatttgaattctgctcccacctaccaaaattttgaagaagccattgcccatttaagccagctatacgatttctctccccaggaaattgttgcagatttacaccctgattatttcagtcatcaatatgctgaaaaccaagctttgcctgtcacttttgtgcagcatcactatgctcatattttagcggttatggcggaacatggagttatggaggagtccgtgttaggtattgcttgggatggcactggctacggcatggacggtactatttgggggggagaatttttaaaaatcacccaaggtacttggcagagaattgctcatctacaaccatttcatttattaggtaatcaacaagccattaaatatccccatcggattgctttggcgttgttatggcccacttttggtgatgatttttctgctgattctttaggaaattggttgaatttcaataatgggtttaaaaacaagataaacagcaggttaaatcaggatctaaacaacaaaaatttacgtcaactttggcaacgagggcaagcaccgctcacttcgagtatgggaagattatttgacggtattgcgacactgataggattgattaacgaagtaacttttgaaggtcaggcggccatagctctggaagctcagattatgccaaatttaactgaggagtattatcctttgactctaaacaacaaggaaaaaaaattagctgttgattggcgccccttaattaaagctataaccacagaagatagaagcaaaactaacctaatagccactaaattccacaacagtttagtaaatttaattatcactattgcccaacagcagggaatcgaaaaagttgctctggggggaggttgctttcaaaattgttatttgcttgccagtaccattactgccctcaaaaaagctggtttttctcctttgtggcccagagaactaccgcccaacgacggtgccatttgcatgggtcaactgttagctaaaattcaggctcggcaatatatctgttaa
HypF的氨基酸序列(767aa)如下所示,在本发明的上下文中命名为SEQ ID NO:16:
mlktvaiqvqgrvqgvgfrpfvytlaqemglngwvnnstqgatvvitadekaiadfterltktlpppglieqlaveqlplesftnftirpssdgpktasilpdlstcsacltelfdpsdrrylypfincthcgprytiiealpydrcrttmarfrqctdcereykqpgdrrfhaqpnacprcgpqlafwnrqgqviaeanealnfavdnlkvgniiaikglggfhlccdatdfeaveklrlrkhrpdkplavmygnlgqivehyqpnnlevellqsaaapivllnkkkqlilveniapgnprvgvmlaytplhhlllkklkkpmvatsgnlageqicidnidaltrlqniadgflvhdrpivcpvddsvvqivagkplflrrargyapqpitlpkptqkkllamgghykntvaiakqnqayvsqhlgdlnsaptyqnfeeaiahlsqlydfspqeivadlhpdyfshqyaenqalpvtfvqhhyahilavmaehgvmeesvlgiawdgtgygmdgtiwggeflkitqgtwqriahlqpfhllgnqqaikyphrialallwptfgddfsadslgnwlnfnngfknkinsrlnqdlnnknlrqlwqrgqapltssmgrlfdgiatliglinevtfegqaaialeaqimpnlteeyypltlnnkekklavdwrplikaittedrsktnliatkfhnslvnliitiaqqqgiekvalgggcfqncyllastitalkkagfsplwprelppndgaicmgqllakiqarqyic
HoxW为集胞藻PCC 6803中的一种假设蛋白。所述蛋白在Genbank中的登录号为BAA17680.1。HoxW的理论等电点为4.93,理论分子量为17129.53道尔顿。HoxW的核苷酸序列(474bp)如下所示,在本发明的上下文中命名为SEQ ID NO:17:
atgccaggccaatccaccaagtccactttaatcatcggttacggcaataccctgcggggggacgacggcgtggggcgttacctagcggaagaaattgctcagcaaaactggccccattgtggagttatttccacccatcaactcaccccagaattggccgaggcgatcgccgctgtggaccgggtaattttcattgatgcccaactgcaggaatcagcaaacgaaccatcggtggaagttgtggccttaaaaaccctggaacccaacgaactgtcaggggatttggggcaccggggtaatcccagggaactcttgaccctggctaaaattctctacggcgttgaggtaaaggcttggtgggtgttgattccggccttcacctttgattatggagagaaattgtctcccctgaccgcccgggcccaagccgaagccttagcccagatccgccccttggtattgggggagagataa
HoxW的氨基酸序列(157aa)如下所示,在本发明的上下文中命名为SEQ ID NO:18:
MPGQSTKSTLIIGYGNTLRGDDGVGRYLAEEIAQQNWPHCGVISTHQLTPELAEAIAAVDRVIFIDAQLQESANEPSVEVVALKTLEPNELSGDLGHRGNPRELLTLAKILYGVEVKAWWVLIPAFTFDYGEKLSPLTARAQAEALAQIRPLVLGER
任选地,根据本发明的实施例,所有成熟因子HypA、HypB、HypC、HypD、HypE、HypF和HoxW以串联核苷酸序列(6515bp)的形式装配。所述核苷酸序列包括序列开始处的NcoI限制性位点(CCATGG)和序列结束处的AvrII限制性位点(CCTAGG),以在pACYCDuet-1质粒中进行克隆。所述串联核苷酸序列如下所示,在本发明的上下文中被命名为SEQ ID NO:19:
ccatggcccacgaagttagcctgatggaacagacgctggccattgccattgcgcaggcggaagaccacggggcgagccaaattcaccgtttaacgctgcgcgttgggcagcagtcgggtgttgttgcagatgcattacgctttgcatttgaagttgttcgccagaacacaatggctgcagaagcacgtctggaaatcgaggaaattccggttacctgtcgttgtcagcattgtcatgaaaattttcagccggaggattggatatatagatgtccccattgtgaccagattagtcaaaccgttatggacggcaaacagctggagttagcaagcctggaactgagctaagcatggaaaggaggtcgttattatgtgccagaactgtgggtgtagcgcggttgggaccgttgcgcatagccaccatcaccacggggatggcaactttgcgcatagccatgacgaccacgaccagcaggagcaccaccaccaccacggtaactattcaaaatcaccatcacagcagaccgtaaccatagaaccagacagacaaagcatagcaattggccaaggaattctgagcaaaaacgatcgtctggcagaacgcaaccgcggctacttccaggccaaaggtctgttagtaatgaatttcctgagcagcccgggagcaggcaaaaccgcactgatcgaaaaaatggttggtgatcgtcagaaagatcatccgaccgcagttattgttggtgatctggcaaccgataatgatgcacagcgtctgcgtagcgcaggtgcaattgcaattcaggttaccaccggtaatatttgtcatctggaagcagaaatggttgcaaaagcagcacagaaactggatctggataatattgatcagctgattattgaaaatgttggtaatctggtttgtccgaccacctatgatctgggtgaagatctgcgtgttgttctgtttagcgttaccgaaggtgaagataaaccgctgaaatatccggcaacctttaaaagcgcacaggttattctggttaccaaacaggatattgcagcagcagttgattttgatgcagaactggcatggcagaatctgcgtcaggttgcaccgcaggcacagatttttgcagttagcgcacgtaccggtaaaggtctgcagagctggtatgaatatctggatcagtggcagctgcagcattatagcccgctggttgatccggcactggcataagagttgaaaggaggtttcctccatgtgcctggcgttaccggggcaggttgtttcgttaatgccgaactcggatccgctgttattaaccgggaaagttagctttggtggtattattaaaaccattagcctggcgtatgttccggaagttaaagttggcgattatgttattgttcatgttggttttgctatcagtattgttgatgaagaagcagcacaggagacactgattgatctggccgagatgggcgtttaattcctaaaaggaggttttagccatgaagtacgttgacgaataccgcgacgcgcaggcagttgcccactaccgccaggccattgcccgtgaaattaccaaaccgtggacgctgatggaaatttgtgggggccagacccatagcatcgttaaatatggtctggatgcattattaccgaaaaacttaaccttaatccacggtccgggttgtccggtttgtgttacgccgatggaactgattgatcaggcattatggctggcaaaacagccggagattattttttgtagctttggtgatatgctgcgcgtgccgggtagtggtgcagatctgctgagcattaaagcacaggggggagacgttcgtatagtttattctccgttagattgtctggcgattgcgcgtgaaaatccgaatcgtgaagttgttttttttggtgtgggttttgaaactaccgccccggcaaccgcaatgacactgcatcaggcacgggcccagggtattagcaattttagcttattatgtgcacacgtgttagttccgccggcgatggaagctctgctgggtaacccgaatagcctggttcaagggtttttagcagcaggtcatgtttgtacggttaccggtgagcgggcgtatcagcatattgcagagaaatatcaggttccgatagttattaccggttttgaaccggttgatattatgcagggtatttttgcatgtgttcgtcagctggagagcgggcagtttacatgtaataatcagtaccggcggtcggttcagccgcagggtaacgcacatgcccagaaaattattgaccaggtttttgaaccggtggatcgtcattggcgtggattaggtcttattccggcctcaggtttaggtttacgtccggcatttgcaccgtgggacgcagcagttaaattcgcaaatctgttacagacaatggctccgacaatgggtgaaaccgtttgtatttctggcgaaattttacagggtcagcgcaaacctagtgattgtcctgcatttggtaccatctgcaccccggaacaaccgctgggcgcccctatggttagcagtgaaggcgcttgtgccgcctattatcgttatcgtcagcaattaccggaaccggttggtgccgcacgtgtttaattttgcaaaggaggtcctgccaatgaacctggtgtgtccggtgccgctggaccgctacccgcaggttttactggcacacggggggggggggaagctgagtcagcagctgttaaaacagatttttctgccggcgtttggtgcatcagaaaccggtagccatgatgcagcagtttttaccgcaaatcagagcagcttagcatttacaacagattcctatgttatcaatccgctgttttttcctggtggtgatattggtagtcttgcagttcatggaaccgttaatgatttagcaatggcaggtgcaacaccgcgttatattagcgttgggtttattctggaggagggtttaccgatggagacactttggcgtgttgcacaaagcctgggtcaggcagcacagaattgtggagttgaaatattaacaggtgataccaaagttgttgatcgtgggaagggagatggtatttttattaatacatcgggtatcggtagtttagatcaccagcaaaccattcatccgaatcaggttcaggttggtgatcgtctgattctgagtggggatttaggacggcatggtatggcaattatggcagttcgtcagggcctggaatttgaaacaaccattgaaagcgatagcgcaccggttcatcgtgaggttcaggctctgctgagcgcagggattccgattcactgtctgcgtgacttaacacgtggtggtctggcaagcgccgtgaacgaaattgcacaaacctcaggtgttacaatggctctgcgtgaaaccttaattccggttgaggcggaagttcaagccgcctgtgaactgctgggttttgatcctttatatgttgcgaacgaaggccgtttcctggccattgttccgccggaagccgaacagaaaaccgttgaaattctgcagacctttcacccgcaggcgaccgcaattggtaccgttaccggcaagagtgcacagaccttaggtctggttagcctggagagtagcataggtgccccacgtctgttagatatgattagcggagaacaactgccacgtatttgttaagactccaaaggaggctagattaatgctgaaaaccgttgccattcaggttcaggggcgcgttcagggggttggttttcggccgtttgtttacaccttagcccaggaaatgggtctgaatggctgggttaataactctacgcagggtgcaaccgttgttattaccgcagatgagaaagcaattgcagattttaccgaacgtctgaccaaaacactgccgccaccgggactgatcgaacaactggcagtggaacagctgccgctggaaagctttaccaactttaccattagaccgagtagcgatggtccgaaaaccgcaagcatcctgccagatctgagcacatgtagcgcctgtctgaccgaattatttgatcccagtgatcgtcgttatctgtacccttttattaattgtacccactgtggtcctcgctataccattattgaagcactgccttatgaccgttgtcgtaccacaatggctcgttttcgtcagtgtacggattgtgaacgtgaatataagcagccgggggaccgccgttttcatgcacagccaaacgcgtgtccgcgttgtggtccgcagctggcattctggaaccgtcagggtcaagttattgcagaagccaatgaagcactgaatttcgcagtagataatttaaaggtcggtaatattatcgcaatcaaaggtctgggtggttttcatttatgttgtgatgcaaccgattttgaagccgttgaaaaactgcgtttacgtaaacatcgcccggataagccgctggccgttatgtacggtaatctgggtcagattgttgagcattatcagccgaataatttagaagttgagctgctgcagagcgcagcagcacctattgttcttctgaataaaaagaaacagctgattctggttgaaaatattgcaccgggcaatccgcgtgtgggtgttatgctggcatataccccgttacatcacctgttacttaaaaagttaaagaagccgatggttgcaacctccggtaacttagcaggcgaacagatttgtattgacaatattgacgcactgacccgtttacaaaatattgccgacggctttctggttcacgatcgtccgattgtttgtccggttgacgatagtgttgttcagattgtggcaggtaaaccgttatttttaagaagagcccgcggttatgcaccgcagccgattacccttcctaaacccacccagaaaaagttattagcaatgggaggccattataaaaataccgttgcaattgcaaagcagaatcaggcatatgtaagccagcatttaggtgatttaaacagcgcaccaacctaccaaaatttcgaagaggcgatagcccatttatcacagctgtatgactttagtccccaggaaattgtcgcagatctgcatccggattactttagccatcagtacgcagaaaaccaagccctgccggtgacgtttgtacagcatcattatgcacatattctggcagttatggcagaacatggtgttatggaagaaagcgttttaggcattgcatgggatggcaccggttatggtatggatggtaccatttggggtggtgaatttctgaaaattacgcaggggacctggcaaagaattgcacatctgcagccgtttcatctgttagggaatcagcaggcaattaaatatccgcaccggattgcacttgctctgctgtggccgacattcggggacgattttagcgccgatagtctgggtaattggttaaattttaacaacggtttcaagaacaagatcaacagccgtttaaaccaagacttaaataataagaacctgagacaactgtggcagcgtgggcaggcaccgctgacctcgagcatgggcagattatttgatggtatcgcaacactgattggtctgatcaatgaagtaacctttgaaggccaggcagcaattgcattagaggcacaaattatgccgaatctgaccgaagaatactatccgcttaccctgaataacaaagaaaaaaaactggcagttgattggcgtccgctgattaaagcaattaccaccgaagatcgtagcaaaaccaatctgattgcaaccaaatttcataatagcctggttaatctgattattaccattgcacagcagcagggtattgaaaaagttgcactgggtggtggttgttttcagaattgttatctgctggcaagcaccattaccgcactgaaaaaagcaggttttagcccgctgtggccgcgtgaactgccgccgaatgatggtgcaatttgtatgggtcagctgctggcaaaaattcaggcacgtcagtatatttgttaactcaacaaaggaggagctggttatgccgggtcagagcaccaaaagcaccctgattatcgggtacgggaacaccttacgtggggacgatggggtggggcgctacctggcagaagaaatagcacagcagaactggccgcactgtggtgttattagcacacatcagctgaccccggaactggccgaagcaattgcagcagtggatagagtgatttttattgacgcccaactgcaggaaagtgcaaatgaaccgtcagttgaagttgttgccctgaaaaccttagaacccaatgaattaagtggagatctgggtcatcgtggtaatccgcgtgagctgctgaccttagccaaaatattatatggtgttgaagtcaaagcgtggtgggttctgattccggcctttacctttgattatggtgagaaattatcgcccttaacagcacgtgctcaggccgaagcactggcacagattcgtccgctggttctgggggaacgttaacctagg
图3显示了质粒pACYCDuet-1的图谱,所述质粒用于通过在pACYCDuet-1中插入SEQID NO:5和/或SEQ-ID NO:7和/或SEQ ID NO:9和/或SEQ ID NO:11和/或SEQ ID NO:13和/或SEQ ID NO:15和/或SEQ ID NO:17和/或SEQ ID NO:19来构建至少一种成熟因子HypA、HypB、HypC、HypD、HypE、HypE、HypF和HoxW的表达载体。pACYCDuet-1是一种4008bp质粒,具有大肠杆菌复制起点、氯霉素抗性基因、两个包含多个限制性位点的多克隆位点(MCS)、T7启动子和T7转录终止子。其还包含编码转录抑制因子的lacI基因。这种转录抑制可以通过添加IPTG来解除。
图4显示了NcoI和HindIII限制性内切酶消化表达载体pACYCDuet-1+HypABCDEFHoxW(串联序列SEQ ID NO:19)的分析。正如对表达载体pACYCDuet-1+HypABCDEFHoxW的酶消化所预期的那样,显示了在约6000bp和约4000bp处有两个DNA片段的条带。这证实了在表达载体pACYCDuet-1中存在序列HypABCDEFHoxW。
3、在大肠杆菌中转入表达载体pET26b(+)+HoxH和pACYCDuet-1+HypABCDEFHoxW
利用大肠杆菌的感受态细胞(DE3)BL21重组表达集胞藻PCC 6803的HoxEFUYH[NiFe]-氢化酶的HoxH亚基。所述细胞通常在T7启动子的控制下生产重组蛋白。
根据本领域技术人员熟知的传统热激法,通过共转化将两个表达载体“pET26b(+)+HoxH”和“pACYCDuet-1+HypABCDEFHoxW”转入这些细胞。将对卡那霉素(50μg/mL)和氯霉素(25μg/mL)具有双重抗性的转化子储存在4℃的琼脂培养基上。
4、验证大肠杆菌中是否存在目标DNA序列
一些菌落可能拥有两个质粒,能够对所使用的选择标记产生抗性,但没有目标DNA序列,即HoxH和HypABCDEFHoxW。因此,验证这些目标DNA序列的存在非常重要。本发明进行了本领域技术人员熟知的实验,所述实验包括从菌落中提取质粒DNA,然后通过在质粒中插入目标DNA序列期间使用的限制性内切酶对所述质粒DNA进行酶切。
因此,根据本领域技术人员熟知的方案,在对卡那霉素和氯霉素具有双重耐药性的菌落上提取质粒DNA。
然后根据本领域技术人员熟知的方案进行酶切。NdeI和BlpI限制性内切酶对表达载体pET26b(+)+HoxH的酶切产生两个DNA片段,分别为5300bp处的线性化质粒pET26b(+)和1500bp处的HoxH DNA片段(见图5)。NcoI和HindIII限制性内切酶对表达载体pACYCDuet-1+HypABCDEFHoxW的酶切产生两个DNA片段,分别为4000bp处的线性化质粒pACYCDuet-1和6500bp处的HypABCDEFHoxW DNA片段(见图6)。这证实了在表达载体pET26b(+)和PACYCDuet-1的菌落中分别存在HoxH和HypABCDEFHoxW序列。
5、大肠杆菌中HoxH的重组生产和亲和层析纯化
为了从集胞藻PCC 6803中获得HoxEFUYH[NiFe]-氢化酶的HoxH亚基的重组形式,用含有两个表达载体的大肠杆菌菌落接种4个体积为250mL的锥形烧瓶。所用的培养基为2XYT培养基(每升含16g胰蛋白胨、10g酵母提取物、5gNaCl),添加100μM FeAmCi、50μMNiSO4、50μM半胱氨酸、50μg/mL卡那霉素和25μg/mL氯霉素。在1.2的光密度(DO600nm)下,向培养物中添加0.2mM IPTG,以便在18℃和200rpm的搅拌(搅拌速度)下诱导HoxH亚基的重组生产。在18℃的生产时间为20h。然后通过离心(4500rpm下15min)收集细胞,然后开始纯化过程。
建立了一种纯化方法,以确认从集胞藻PCC 6803中生产HoxEFUYH[NiFe]-氢化酶的HoxH亚基重组形式。所述方法(见图7)在单个亲和色谱步骤中将HoxH纯化至显著均质。所述方法涉及固定化金属亲和色谱(IMAC)。螯合剂是次氮基三乙酸(NTA),使得固定相和金属离子结合。固定化金属为镍(Ni)。这种色谱法可以极其特异性地分离含有多聚组氨酸标签的蛋白质。在18℃下重组生产HoxH 20小时后,通过离心(4500rpm下15min)收集1L大肠杆菌培养物。将细胞重新悬浮在25mL的溶解缓冲液中(20mM磷酸钠缓冲液pH为7.5,300mM KCl+2μL内切核酸酶(benzonase)+50μL MgCl21M+1个由不含EDTA的蛋白酶抑制剂混合物组成的小球),然后用法压壶溶解。通过离心(15000rpm下15min)回收上清液(25mL),过滤(0.45μm),并将其应用于之前在洗脱缓冲液(20mM磷酸钠缓冲液,pH 7.5,300mM KCl+10mM咪唑)中平衡的Ni-NTA柱(1mL)。然后用35mL洗脱缓冲液(20mM磷酸钠缓冲液,pH 7.5,300mM KCl+10mM咪唑)清洗色谱柱,直到280nm处的吸光度(代表蛋白质浓度)降至零。然后,随着咪唑浓度的增加,通过5个浓度梯度进行洗脱,分别为50mM、100mM、150mM、200mM和250mM(见图7)。
色谱期间获得的各种组分的SDS-PAGE分析显示,在浓度为100mM、150mM、200mM和250mM咪唑的洗脱组分中,有一条接近54kDa的主要条带,这是HoxH亚基的预期大小(见图8)。由于在150mM、200mM和250mM咪唑浓度下洗脱的组分中看不到额外的条带,HoxH也显示出极好的纯度。可以得出结论,HoxH已通过单一的亲和层析步骤中纯化到显著均质。
为了确认其确实为包含集胞藻PCC 6803的HoxEFUYH[NiFe]-氢化酶活性位点的HoxH亚基的重组形式,本发明使用多聚组氨酸抗标签抗体进行了免疫检测(见图9)。添加含有多聚组氨酸标签蛋白的分子量标记物作为阳性对照。HoxH重组蛋白在负载物中能够良好地检测到,即从大肠杆菌细胞裂解获得,并应用于Ni-NTA亲和柱的上清液。HoxH重组蛋白也存在于未被Ni-NTA柱吸收的部分中。这表明超出了Ni-NTA柱的负载能力,部分HoxH重组蛋白无法与之结合。“50mM洗脱组分”中未出现信号。在这种咪唑低浓度下,HoxH重组蛋白仍然附着在Ni-NTA柱上。最后,通过免疫检测,在200mM部分以预期大小,即接近54kDa,证实了存在HoxH重组蛋白。这明确证实了单个亲和层析步骤纯化了HoxH重组蛋白。当部分HoxH重组蛋白再免疫检测中出现条带时,在分子量低于54kDa时也出现一些低强度的条带。可能是在C末端部分降解的HoxH重组蛋白。SDS-PAGE分析未显示降解HoxH重组蛋白条带的存在,可见降解HoxH重组蛋白的比例似乎最小。值得注意的是,免疫检测是一种非常灵敏的方法,可以检测出极少量的蛋白质。
6、HoxH重组蛋白中氢化酶活性检测
重组表达[NiFe]-氢化酶的能力为产生与天然酶性质显著不同的突变形式提供了广泛的可能性。图10显示了集胞藻PCC 6803中HoxEFUYH、[NiFe]-氢化酶的结构。NADPH是集胞藻PCC 6803内HoxEFUYH的辅助因子。在[NiFe]-氢化酶的标准体外活性试验中,用甲基紫精(MV)作为氧化还原介质。图11为HoxEFUYH和NADPH和/或MV之间电子转移和预期相互作用的示意图(阴影箭头)。
本领域技术人员通常知晓的是,MV可以通过避开FMN将电子直接传输到一个或多个FeS中心。然而,如图12所示,目前尚不清楚含有集胞藻PCC 6803的HoxEFUYH[NiFe]-氢化酶活性位点的单HoxH亚基是否可以直接接受MV的电子,从而在没有额外氧化还原中继体的情况下产生氢气。
在本发明的上下文中,为了测试这种可能性,在存在HoxH重组蛋白和已经由连二亚硫酸钠还原的MV情况下,进行了[NiFe]-氢化酶的标准体外活性试验(见图13)。HoxH能够从已经还原的甲基紫精中获取电子,将其与缓冲液中的质子结合,从而根据代表氢化酶催化的反应的方程式
Figure BDA0003706684240000291
产生氢气。根据本领域技术人员熟知的方案,所述[NiFe]-氢化酶的标准体外活性试验包括使用由气密和氮气脱气隔膜封闭的2mL烧瓶。将100mM连二亚硫酸钠和10mM MV溶解在pH 6.8的10mM磷酸盐缓冲液中,并进行氮气脱气得到反应混合物。使用注射器向烧瓶添加1mL所述反应混合物。再向反应混合物中添加200μgHoxH重组蛋白。添加HoxH重组蛋白后,开始生产氢气(图13中箭头所示的时间)。通过考马斯亮蓝法测定蛋白质的含量(Bradford,1976,A rapid and sensitive method for thequantitation ofmicrogram quantities ofprotein utilizing the principleofprotein-dye binding.Anal Biochem 72:248-254)。使用已经校准的氢气微型传感器(Unisense,奥尔胡斯,丹麦)连续监测氢气产量。
添加的HoxH重组蛋白的量(单位:mg·mL-1)以及添加特定量的重组蛋白的析氢速度(μmol H2·min-1)是已知的,因此,可以计算HoxH重组蛋白的活性。例如,具体的活性可为0.1μmol H2·min-1·mg-1酶。
出乎意料的是,含有集胞藻PCC 6803的HoxEFUYH[NiFe]-氢化酶活性位点的单一催化HoxH亚基可以催化质子的还原,接受氧化还原介质(例如甲基紫精)的电子,而无需额外的FeS中心作为氧化还原中继体,这已在本发明的上下文中强调。
在本发明的上下文中,还进行了在HoxH重组蛋白、苄基紫精和氢气存在下的[NiFe]-氢化酶的标准体外活性试验(见图14)。HoxH能够从氢气中获取电子,将其提供给苄基紫精,并根据代表氢化酶催化反应的方程式
Figure BDA0003706684240000292
产生质子。根据本领域技术人员熟知的方案,该[NiFe]-氢化酶的标准体外活性试验包括使用由气密且氢气饱和的隔膜封闭的2mL烧瓶。将40μmol苄基紫精溶解在pH 7.6的50mM Tris缓冲液中,并脱气获得反应混合物。使用注射器向烧瓶添加2mL所述反应混合物。试验在40℃下进行。再向反应混合物中添加340μgHoxH重组蛋白。添加HoxH重组蛋白后,开始消耗氢气和还原苄基紫精。通过考马斯亮蓝法测定蛋白质的含量(Bradford,1976,A rapid and sensitive method for thequantitation ofmicrogram quantities ofprotein utilizing the principleofprotein-dye binding.Anal Biochem 72:248-254)。在578nm波长下,通过分光光度法监测苄基紫精的还原。摩尔消光系数为8600M-1cm-1
添加的HoxH重组蛋白的量(单位:mg·mL-1)以及氢气消耗速度(μmol H2·min-1)是已知的,因此,可以计算HoxH重组蛋白的活性,即相当于于添加特定量的重组蛋白的苄基紫精还原速度。例如,所述活性可为μmol H2·min-1·mg-1酶。
出乎意料的是,含有集胞藻PCC 6803的HoxEFUYH[NiFe]-氢化酶活性位点的单一催化HoxH亚基可以催化氢气的氧化,产生质子并向氧化还原介质(例如苄基紫精)提供电子,而无需额外的FeS中心作为氧化还原中继体,这已在本发明的上下文中强调。
在没有表达HoxEFUYH五聚体的其他亚基的情况下,至少部分解决了现有技术中固有的问题:HoxH重组蛋白能够自身催化质子的还原,接受来自氧化还原介体(例如甲基紫精)的电子,而无需额外的FeS中心作为氧化还原中继体。HoxH蛋白本身也能够催化H2的氧化,减少氧化还原介质(例如苄基紫精),而无需额外的FeS中心作为氧化还原中继体。这一特殊特性证明了本发明的巨大优势,尤其是具有[NiFe]-氢化酶活性位点且具有催化活性的单亚基的重组生产。
7、在没有外源成熟因子的情况下,重组生产、亲和层析纯化及检测在大肠杆菌中重组生产的HoxH重组蛋白中氢化酶活性
以类似于上文实施例3的方式,通过根据本领域技术人员熟知的传统热激法将表达载体pET26b(+)+HoxH转入大肠杆菌(感受态细胞BL21(DE3)),并且这是在没有表达载体pACYCDUET-1+HypABCDEFHoxW的情况下进行的。转化子对卡那霉素(50μg/mL)具有抗性。
以类似于上述实施例4的方式,通过本领域技术人员熟知的一系列实验,即质粒DNA的提取和酶消化,验证了目标HoxHDNA序列的存在。
以类似于上述实施例5的方式,在缺乏编码外源成熟因子HupABCDEFHoxW的质粒pACYCDUET-1+HupABCDEFHoxW的情况下,在大肠杆菌中重组产生HoxH蛋白。然后以类似于上述实施例5的方式通过亲和层析纯化HoxH蛋白。
以类似于上述实施例6的方式,根据涉及MV的方案以及本领域技术人员熟知的方案,检测了在没有外源成熟因子的情况下,在大肠杆菌中重组产生的HoxH蛋白的氢化酶活性。
因此,在本发明的上下文中,在存在HoxH重组蛋白和已经由连二亚硫酸钠还原的MV的情况下,进行了[NiFe]-氢化酶的标准体外活性试验(见图15)。HoxH能够从已经还原的甲基紫精中获取电子,将其与缓冲液中的质子结合,从而根据代表氢化酶催化的反应的方程式
Figure BDA0003706684240000311
产生氢气。根据本领域技术人员熟知的方案,所述[NiFe]-氢化酶的标准体外活性试验包括使用由由气密和氮气脱气隔膜封闭的2mL烧瓶。将100mM连二亚硫酸钠和10mM MV溶解在pH 6.8的10mM磷酸盐缓冲液中,并进行氮气脱气得到反应混合物。使用注射器向烧瓶添加1mL所述反应混合物。再向反应混合物中添加750μg HoxH重组蛋白。添加HoxH重组蛋白后,开始生产氢气(图15中箭头所示的时间)。通过考马斯亮蓝法测定蛋白质的含量(Bradford,1976,A rapid and sensitive method for the quantitation ofmicrogram quantities of protein utilizing the principle of protein-dyebinding.Anal Biochem72:248-254)。使用已经校准的氢气微型传感器(Unisense,奥尔胡斯,丹麦)连续监测氢气产量。
添加的HoxH重组蛋白的量(单位:mg·mL-1)以及添加特定量的重组蛋白的析氢速度(μmol H2·min-1)是已知的,因此,可以计算HoxH重组蛋白的活性。例如,具体的活性可为0.1μmol H2·min-1·mg-1酶。
在本发明的上下文中,已经强调了一个事实,即含有集胞藻PCC 6803的HoxEFUYH[NiFe]-氢化酶活性位点的单个HoxH催化亚基可以催化质子的还原,接受来自氧化还原介质(例如甲基紫精)的电子,而无需大肠杆菌外源成熟因子HupABCDEFHoxW的干预。
已经结合具体实施例描述了本发明,这些实施例仅仅是说明性的,不应视为对本发明的限定。通常而言,本领域技术人员应清楚地知道,本发明不限于上面所示的和/或描述的示例。
动词“包含”、“包括”或任何其他变体的使用,以及其变位,不能以任何方式排除除上述元素以外的其他元素的存在。
使用不定冠词“一个”、“一种”或定冠词“所述”来引入一个元素且不排除存在多个这种元素。
序列表
<110> H2WIN股份公司
<120> 具有氢化酶活性的单体多肽,特别是具有氢化酶活性的重组单体多肽
<130> T888EPprio
<160> 19
<170> PatentIn version 3.5
<210> 1
<211> 1425
<212> DNA
<213> 集胞藻CCP6803
<400> 1
atgtctaaaa ccattgttat cgatcccgtt acccggattg aaggccatgc caaaatctcc 60
attttcctca acgaccaggg caacgtagat gatgttcgtt tccatgtggt ggagtatcgg 120
ggttttgaaa aattttgcga aggtcgtccc atgtgggaaa tggctggtat taccgcccgt 180
atttgcggca tttgtccggt tagccatctg ctctgtgcgg ctaaaaccgg ggataagtta 240
ctggcggtgc aaatccctcc agccggggaa aaactgcgcc gtttaatgaa tttagggcaa 300
attacccaat cccacgccct aagttttttc catctcagca gtcctgattt tctgcttggt 360
tgggacagtg atcccgctac tcgcaatgtg tttggtttaa ttgctgctga ccccgattta 420
gctagggcag gtattcggtt acggcaattt ggccaaacgg taattgaact tttgggagct 480
aaaaaaatcc actctgcttg gtcagtgccc ggtggagtcc gatcgccgtt gtcggaagaa 540
ggcagacaat ggattgtgga ccgtttacca gaagcaaaag aaaccgttta tttagcctta 600
aatttgttta aaaatatgtt ggaccgcttc caaacagaag tggcagaatt tggcaaattt 660
ccctccctat ttatgggctt agttgggaaa aataatgaat gggaacatta tggcggctcc 720
ctgcggttta ccgacagtga aggcaatatt gtcgcggaca atctcagtga agataattac 780
gctgatttta ttggtgaatc ggtggaaaaa tggtcctatt taaaatttcc ctactacaaa 840
tctctgggtt atcccgatgg catttatcgg gttggtcccc ttgcccgcct taatgtttgt 900
catcacattg gcaccccgga agcagaccaa gaattagaag aatatcggca acgggctgga 960
ggtgtggcca cgtcctcttt cttttatcat tacgcccgct tggtggaaat tcttgcctgt 1020
ttagaagcca tcgaattgtt aatggctgac cctgatattt tgtccaaaaa ttgtcgagct 1080
aaggcagaaa ttaattgtac cgaagcggtg ggagtgagcg aagcaccccg gggtacttta 1140
ttccaccatt acaagataga tgaagatggt ctaattaaga aagtgaattt gatcattgcc 1200
acgggcaaca ataacttagc catgaataaa accgtggccc aaattgccaa acactacatt 1260
cgcaatcatg atgtgcaaga agggttttta aaccgggtgg aagcgggtat tcgttgttat 1320
gatccctgcc ttagttgttc tacccatgca gcgggacaaa tgccattgat gatcgattta 1380
gttaaccctc agggggaact aattaagtcc atccagcggg attaa 1425
<210> 2
<211> 474
<212> PRT
<213> 集胞藻CCP6803
<400> 2
Met Ser Lys Thr Ile Val Ile Asp Pro Val Thr Arg Ile Glu Gly His
1 5 10 15
Ala Lys Ile Ser Ile Phe Leu Asn Asp Gln Gly Asn Val Asp Asp Val
20 25 30
Arg Phe His Val Val Glu Tyr Arg Gly Phe Glu Lys Phe Cys Glu Gly
35 40 45
Arg Pro Met Trp Glu Met Ala Gly Ile Thr Ala Arg Ile Cys Gly Ile
50 55 60
Cys Pro Val Ser His Leu Leu Cys Ala Ala Lys Thr Gly Asp Lys Leu
65 70 75 80
Leu Ala Val Gln Ile Pro Pro Ala Gly Glu Lys Leu Arg Arg Leu Met
85 90 95
Asn Leu Gly Gln Ile Thr Gln Ser His Ala Leu Ser Phe Phe His Leu
100 105 110
Ser Ser Pro Asp Phe Leu Leu Gly Trp Asp Ser Asp Pro Ala Thr Arg
115 120 125
Asn Val Phe Gly Leu Ile Ala Ala Asp Pro Asp Leu Ala Arg Ala Gly
130 135 140
Ile Arg Leu Arg Gln Phe Gly Gln Thr Val Ile Glu Leu Leu Gly Ala
145 150 155 160
Lys Lys Ile His Ser Ala Trp Ser Val Pro Gly Gly Val Arg Ser Pro
165 170 175
Leu Ser Glu Glu Gly Arg Gln Trp Ile Val Asp Arg Leu Pro Glu Ala
180 185 190
Lys Glu Thr Val Tyr Leu Ala Leu Asn Leu Phe Lys Asn Met Leu Asp
195 200 205
Arg Phe Gln Thr Glu Val Ala Glu Phe Gly Lys Phe Pro Ser Leu Phe
210 215 220
Met Gly Leu Val Gly Lys Asn Asn Glu Trp Glu His Tyr Gly Gly Ser
225 230 235 240
Leu Arg Phe Thr Asp Ser Glu Gly Asn Ile Val Ala Asp Asn Leu Ser
245 250 255
Glu Asp Asn Tyr Ala Asp Phe Ile Gly Glu Ser Val Glu Lys Trp Ser
260 265 270
Tyr Leu Lys Phe Pro Tyr Tyr Lys Ser Leu Gly Tyr Pro Asp Gly Ile
275 280 285
Tyr Arg Val Gly Pro Leu Ala Arg Leu Asn Val Cys His His Ile Gly
290 295 300
Thr Pro Glu Ala Asp Gln Glu Leu Glu Glu Tyr Arg Gln Arg Ala Gly
305 310 315 320
Gly Val Ala Thr Ser Ser Phe Phe Tyr His Tyr Ala Arg Leu Val Glu
325 330 335
Ile Leu Ala Cys Leu Glu Ala Ile Glu Leu Leu Met Ala Asp Pro Asp
340 345 350
Ile Leu Ser Lys Asn Cys Arg Ala Lys Ala Glu Ile Asn Cys Thr Glu
355 360 365
Ala Val Gly Val Ser Glu Ala Pro Arg Gly Thr Leu Phe His His Tyr
370 375 380
Lys Ile Asp Glu Asp Gly Leu Ile Lys Lys Val Asn Leu Ile Ile Ala
385 390 395 400
Thr Gly Asn Asn Asn Leu Ala Met Asn Lys Thr Val Ala Gln Ile Ala
405 410 415
Lys His Tyr Ile Arg Asn His Asp Val Gln Glu Gly Phe Leu Asn Arg
420 425 430
Val Glu Ala Gly Ile Arg Cys Tyr Asp Pro Cys Leu Ser Cys Ser Thr
435 440 445
His Ala Ala Gly Gln Met Pro Leu Met Ile Asp Leu Val Asn Pro Gln
450 455 460
Gly Glu Leu Ile Lys Ser Ile Gln Arg Asp
465 470
<210> 3
<211> 1453
<212> DNA
<213> 人工序列
<220>
<223> 优化的[NiFe]-氢化酶HoxEFUYH
<220>
<221> misc_feature
<222> (1)..(6)
<223> Ndel限制性位点
<220>
<221> misc_feature
<222> (10)..(27)
<223> 聚组氨酸标签
<220>
<221> misc_feature
<222> (1447)..(1453)
<223> Blpl限制性位点
<400> 3
catatgagcc accaccacca ccatcacaaa accatcgtca tcgacccagt cacccgcatc 60
gaaggccacg ccaaaattag catttttctg aacgaccagg gcaacgtcga cgacgtccgc 120
tttcacgttg ttgaataccg tggcttcgaa aaattttgtg aaggtcgtcc gatgtgggaa 180
atggccggta tcacggcacg tatttgtgga atttgtccgg tgagccatct gctgtgtgcc 240
gcaaaaaccg gagataaact gctggcagtg cagattccgc cggcaggtga aaaactgcgt 300
cgtctgatga atctgggtca gattacacag tcgcatgcac tgtctttctt tcatctgagt 360
agcccagatt ttctgctggg gtgggatagc gacccggcaa cacgtaatgt gtttggtctg 420
attgcggctg atccggatct ggcgcgtgcc ggtattcgtc tgcgtcagtt tggtcagaca 480
gttattgagc tgctgggggc gaaaaagatt catagtgcat ggtctgtgcc gggtggtgtt 540
cgtagtccgc tgagtgaaga aggtcgtcag tggattgttg atcgtctgcc ggaggcaaaa 600
gaaacggtct atctggcact gaatctgttt aaaaatatgc tggatcgttt ccagacagaa 660
gttgcagaat ttggaaaatt tccgtcactg tttatgggtc tggttggtaa aaataatgaa 720
tgggaacact atggtggtag cctgcgtttc acggactctg aaggtaatat tgttgcggat 780
aatctgagcg aagacaatta tgcagatttt atcggtgaaa gtgtggaaaa atggagctat 840
ctgaaatttc cgtattacaa aagcctgggc tatccggatg ggatctaccg tgttggaccg 900
ctggcacgtc tgaacgtttg tcatcatatt ggtaccccgg aagcagatca ggaactggaa 960
gaatatcgtc agcgtgcggg tggtgttgcg actagcagct ttttttatca ttatgcacgt 1020
ctggttgaaa ttctggcctg tctggaggca attgaactgc tgatggcaga tcctgatatt 1080
ctgtctaaaa attgtcgtgc aaaagcagaa attaactgta ccgaggcagt tggtgttagt 1140
gaggcgccgc gtggtaccct gtttcatcac tataaaattg acgaagatgg tctgattaaa 1200
aaggttaatc tgattatcgc aaccggtaac aataatctgg caatgaataa aaccgttgca 1260
cagattgcaa aacactacat tcgcaaccac gatgttcagg aagggtttct gaatcgtgta 1320
gaagccggca ttcgctgtta tgatccgtgt ctgagctgta gcacccatgc agcaggtcag 1380
atgcctctga tgattgacct ggttaatccg cagggtgagc tgattaaaag cattcagcgt 1440
gattaagctg agc 1453
<210> 4
<211> 462
<212> PRT
<213> 人工序列
<220>
<223> 480 aa
<400> 4
Met Ser His His His His His His Lys Thr Ile Val Ile Asp Pro Val
1 5 10 15
Thr Arg Ile Glu Gly His Ala Lys Ile Ser Ile Phe Leu Asn Asp Gln
20 25 30
Gly Asn Val Asp Asp Val Arg Phe His Val Val Glu Tyr Arg Gly Phe
35 40 45
Glu Lys Phe Cys Glu Gly Arg Pro Met Trp Glu Met Ala Gly Ile Thr
50 55 60
Ala Arg Ile Cys Gly Ile Cys Pro Val Ser His Leu Leu Cys Ala Ala
65 70 75 80
Lys Thr Gly Asp Lys Leu Leu Ala Val Gln Ile Pro Pro Ala Gly Glu
85 90 95
Lys Leu Arg Arg Leu Met Asn Leu Gly Gln Ile Thr Gln Ser His Ala
100 105 110
Leu Ser Phe Phe His Leu Ser Ser Pro Asp Phe Leu Leu Gly Trp Asp
115 120 125
Ser Asp Pro Ala Thr Arg Asn Val Phe Gly Leu Ile Ala Ala Asp Pro
130 135 140
Asp Leu Ala Arg Ala Gly Ile Arg Leu Arg Gln Phe Gly Gln Thr Val
145 150 155 160
Ile Glu Leu Leu Gly Ala Lys Lys Ile His Ser Ala Trp Ser Val Pro
165 170 175
Gly Gly Val Arg Ser Pro Leu Ser Glu Glu Gly Arg Gln Trp Ile Val
180 185 190
Asp Arg Leu Pro Glu Ala Lys Glu Thr Val Tyr Leu Ala Leu Asn Leu
195 200 205
Phe Lys Asn Met Leu Asp Arg Phe Gln Thr Glu Val Ala Glu Phe Gly
210 215 220
Lys Phe Pro Ser Leu Phe Met Gly Leu Val Gly Lys Asn Asn Glu Trp
225 230 235 240
Glu His Tyr Gly Gly Ser Leu Arg Phe Thr Asp Ser Glu Gly Asn Ile
245 250 255
Val Ala Asp Asn Leu Ser Glu Asp Asn Tyr Ala Asp Phe Ile Gly Glu
260 265 270
Ser Val Glu Lys Trp Ser Tyr Leu Lys Phe Pro Tyr Tyr Lys Ser Leu
275 280 285
Gly Tyr Pro Asp Gly Ile Tyr Arg Val Gly Pro Leu Ala Arg Leu Asn
290 295 300
Val Cys His His Ile Gly Thr Pro Glu Ala Asp Gln Glu Leu Glu Glu
305 310 315 320
Tyr Arg Gln Arg Ala Gly Gly Val Ala Thr Ser Ser Phe Phe Tyr His
325 330 335
Tyr Ala Arg Leu Val Glu Ile Leu Ala Cys Leu Glu Ala Ile Glu Leu
340 345 350
Leu Met Ala Asp Pro Asp Ile Leu Ser Lys Asn Cys Arg Ala Lys Ala
355 360 365
Glu Ile Asn Cys Thr Glu Ala Val Gly Val Ser Glu Ala Pro Arg Gly
370 375 380
Thr Leu Phe His His Tyr Lys Ile Asp Glu Asp Gly Leu Ile Lys Lys
385 390 395 400
Val Asn Leu Ile Ile Ala Thr Gly Asn Asn Asn Leu Ala Met Asn Lys
405 410 415
Thr Val Ala Gln Ile Ala Lys His Tyr Ile Arg Asn His Asp Val Gln
420 425 430
Glu Gly Phe Leu Asn Arg Val Glu Ala Gly Ile Arg Cys Tyr Asp Pro
435 440 445
Cys Leu Ser Cys Ser Thr His Ala Ala Gly Gln Met Pro Leu
450 455 460
<210> 5
<211> 342
<212> DNA
<213> 集胞藻PCC6803
<400> 5
atgcacgaag ttagtctgat ggagcaaact ttggcgatcg ccattgccca ggcggaagac 60
catggagcca gccaaatcca tcgtttaacc ctgcgggtgg ggcaacagtc tggggtggtg 120
gccgatgccc tacggtttgc gtttgaagtg gtgcgacaaa ataccatggc cgccgaggcg 180
agattggaaa ttgaagaaat tcccgttacc tgtcgttgcc aacactgcca cgaaaatttt 240
cagccagagg attggattta ccgctgtccc cactgcgacc agattagcca aacagtaatg 300
gatggcaaac agttggaact agcatcccta gaactgagtt ga 342
<210> 6
<211> 113
<212> PRT
<213> 集胞藻PCC6803
<400> 6
Met His Glu Val Ser Leu Met Glu Gln Thr Leu Ala Ile Ala Ile Ala
1 5 10 15
Gln Ala Glu Asp His Gly Ala Ser Gln Ile His Arg Leu Thr Leu Arg
20 25 30
Val Gly Gln Gln Ser Gly Val Val Ala Asp Ala Leu Arg Phe Ala Phe
35 40 45
Glu Val Val Arg Gln Asn Thr Met Ala Ala Glu Ala Arg Leu Glu Ile
50 55 60
Glu Glu Ile Pro Val Thr Cys Arg Cys Gln His Cys His Glu Asn Phe
65 70 75 80
Gln Pro Glu Asp Trp Ile Tyr Arg Cys Pro His Cys Asp Gln Ile Ser
85 90 95
Gln Thr Val Met Asp Gly Lys Gln Leu Glu Leu Ala Ser Leu Glu Leu
100 105 110
Ser
<210> 7
<211> 858
<212> DNA
<213> 集胞藻PCC6803
<400> 7
atgtgccaaa actgcggttg tagtgcggtg ggaaccgttg cccatagcca ccatcaccat 60
ggcgatggaa attttgccca cagccatgat gaccatgacc agcaagaaca tcatcaccac 120
catggcaact acagcaaaag tccaagtcag cagactgtga ccattgaacc cgatcgccag 180
tccattgcca ttggccaagg cattctcagc aagaatgacc gcctagcgga aaggaatcgg 240
ggctatttcc aggctaaggg cttactggtg atgaatttcc tctcttctcc cggagccggt 300
aaaactgctc tgatcgaaaa aatggtcggc gatcgacaaa aagaccatcc caccgccgtc 360
attgtggggg atttagccac cgataacgat gcccaacgtc tccgcagtgc cggggcgatc 420
gccattcagg tcaccacagg aaatatttgc catctggaag cggaaatggt ggccaaggcg 480
gcccaaaagt tagatttaga caatatcgat caattgatca ttgaaaatgt tggtaatttg 540
gtttgcccca ccacctatga tctaggggaa gatttacggg tcgtattatt ttccgtcaca 600
gaaggggagg ataaacccct taaatatccc gccaccttca aatcagccca ggttatttta 660
gtcaccaaac aggacattgc cgccgcagtg gattttgatg cagagctggc ttggcaaaac 720
ctacggcaag tggcccccca agcccaaatt tttgcagtgt ctgcccgcac ggggaaagga 780
ttgcagtcct ggtatgagta tttggatcaa tggcaactcc aacactattc gccgttggtt 840
gatccagcat tggcctaa 858
<210> 8
<211> 285
<212> PRT
<213> 集胞藻PCC6803
<400> 8
Met Cys Gln Asn Cys Gly Cys Ser Ala Val Gly Thr Val Ala His Ser
1 5 10 15
His His His His Gly Asp Gly Asn Phe Ala His Ser His Asp Asp His
20 25 30
Asp Gln Gln Glu His His His His His Gly Asn Tyr Ser Lys Ser Pro
35 40 45
Ser Gln Gln Thr Val Thr Ile Glu Pro Asp Arg Gln Ser Ile Ala Ile
50 55 60
Gly Gln Gly Ile Leu Ser Lys Asn Asp Arg Leu Ala Glu Arg Asn Arg
65 70 75 80
Gly Tyr Phe Gln Ala Lys Gly Leu Leu Val Met Asn Phe Leu Ser Ser
85 90 95
Pro Gly Ala Gly Lys Thr Ala Leu Ile Glu Lys Met Val Gly Asp Arg
100 105 110
Gln Lys Asp His Pro Thr Ala Val Ile Val Gly Asp Leu Ala Thr Asp
115 120 125
Asn Asp Ala Gln Arg Leu Arg Ser Ala Gly Ala Ile Ala Ile Gln Val
130 135 140
Thr Thr Gly Asn Ile Cys His Leu Glu Ala Glu Met Val Ala Lys Ala
145 150 155 160
Ala Gln Lys Leu Asp Leu Asp Asn Ile Asp Gln Leu Ile Ile Glu Asn
165 170 175
Val Gly Asn Leu Val Cys Pro Thr Thr Tyr Asp Leu Gly Glu Asp Leu
180 185 190
Arg Val Val Leu Phe Ser Val Thr Glu Gly Glu Asp Lys Pro Leu Lys
195 200 205
Tyr Pro Ala Thr Phe Lys Ser Ala Gln Val Ile Leu Val Thr Lys Gln
210 215 220
Asp Ile Ala Ala Ala Val Asp Phe Asp Ala Glu Leu Ala Trp Gln Asn
225 230 235 240
Leu Arg Gln Val Ala Pro Gln Ala Gln Ile Phe Ala Val Ser Ala Arg
245 250 255
Thr Gly Lys Gly Leu Gln Ser Trp Tyr Glu Tyr Leu Asp Gln Trp Gln
260 265 270
Leu Gln His Tyr Ser Pro Leu Val Asp Pro Ala Leu Ala
275 280 285
<210> 9
<211> 231
<212> DNA
<213> 集胞藻PCC6803
<400> 9
atgtgtctag ccctacctgg ccaggttgtc agtttaatgc ccaactccga tcccctgtta 60
ctgacgggaa aggttagctt tgggggcatc attaaaacca ttagccttgc ctacgtaccc 120
gaggttaagg tgggggatta cgtgattgtc catgtgggct ttgccattag cattgtggac 180
gaagaggcgg cccaggaaac tttgatagac ttggcagaaa tgggagttta a 231
<210> 10
<211> 76
<212> PRT
<213> 集胞藻PCC6803
<400> 10
Met Cys Leu Ala Leu Pro Gly Gln Val Val Ser Leu Met Pro Asn Ser
1 5 10 15
Asp Pro Leu Leu Leu Thr Gly Lys Val Ser Phe Gly Gly Ile Ile Lys
20 25 30
Thr Ile Ser Leu Ala Tyr Val Pro Glu Val Lys Val Gly Asp Tyr Val
35 40 45
Ile Val His Val Gly Phe Ala Ile Ser Ile Val Asp Glu Glu Ala Ala
50 55 60
Gln Glu Thr Leu Ile Asp Leu Ala Glu Met Gly Val
65 70 75
<210> 11
<211> 1125
<212> DNA
<213> 集胞藻PCC6803
<400> 11
atgaaatacg ttgatgaata tcgggatgcc caggcggtgg cccattaccg tcaggcgatc 60
gccagggaga taaccaaacc ttggacgctg atggagattt gcggcggcca gacccacagc 120
attgtcaaat atggcttgga tgctttgttg ccgaagaatt tgactctgat ccatggtccc 180
ggctgtcctg tgtgcgtcac tccgatggaa ttaattgacc aggctttgtg gttagctaag 240
caaccggaga tcattttttg ttcctttggc gatatgttgc gggtgcccgg cagtggggcg 300
gatttgctga gcattaaagc ccagggcggc gatgtgcgca ttgtctattc tcctttggat 360
tgtttggcga tcgccaggga gaatcctaat cgggaagtgg tatttttcgg agtaggtttt 420
gaaactacag cccctgccac ggccatgact ctccaccaag ctagggccca gggaattagc 480
aatttcagtt tactttgcgc ccatgtattg gtgcccccgg ctatggaggc tttattaggc 540
aatcccaatt ccctcgtgca gggctttttg gcggcagggc atgtctgtac ggtgaccggg 600
gaaagggcct atcaacatat cgctgaaaaa taccaagtac ccattgtcat cactggcttt 660
gaacctgtgg atattatgca gggcatcttt gcctgtgtgc gccaactgga gtcgggacaa 720
ttcacctgca acaatcaata tcggcgatcg gtccaacccc agggcaatgc ccatgctcag 780
aaaattattg accaagtgtt tgagccagtc gatcgccatt ggcggggttt gggattaatt 840
ccggccagcg gtttgggttt aaggccagca tttgccccct gggatgccgc agttaaattc 900
gccaatttat tgcaaaccat ggccccaacg atgggagaaa cagtgtgtat tagcggggaa 960
attttacagg gacaacggaa gcccagcgat tgtccagcct ttggtactat ctgcacccca 1020
gaacaaccct tgggggctcc catggtttcc tcggaaggag cctgtgccgc ctattaccgt 1080
tatcgccaac aattaccgga accagtggga gcggccagag tttag 1125
<210> 12
<211> 374
<212> PRT
<213> 集胞藻PCC6803
<400> 12
Met Lys Tyr Val Asp Glu Tyr Arg Asp Ala Gln Ala Val Ala His Tyr
1 5 10 15
Arg Gln Ala Ile Ala Arg Glu Ile Thr Lys Pro Trp Thr Leu Met Glu
20 25 30
Ile Cys Gly Gly Gln Thr His Ser Ile Val Lys Tyr Gly Leu Asp Ala
35 40 45
Leu Leu Pro Lys Asn Leu Thr Leu Ile His Gly Pro Gly Cys Pro Val
50 55 60
Cys Val Thr Pro Met Glu Leu Ile Asp Gln Ala Leu Trp Leu Ala Lys
65 70 75 80
Gln Pro Glu Ile Ile Phe Cys Ser Phe Gly Asp Met Leu Arg Val Pro
85 90 95
Gly Ser Gly Ala Asp Leu Leu Ser Ile Lys Ala Gln Gly Gly Asp Val
100 105 110
Arg Ile Val Tyr Ser Pro Leu Asp Cys Leu Ala Ile Ala Arg Glu Asn
115 120 125
Pro Asn Arg Glu Val Val Phe Phe Gly Val Gly Phe Glu Thr Thr Ala
130 135 140
Pro Ala Thr Ala Met Thr Leu His Gln Ala Arg Ala Gln Gly Ile Ser
145 150 155 160
Asn Phe Ser Leu Leu Cys Ala His Val Leu Val Pro Pro Ala Met Glu
165 170 175
Ala Leu Leu Gly Asn Pro Asn Ser Leu Val Gln Gly Phe Leu Ala Ala
180 185 190
Gly His Val Cys Thr Val Thr Gly Glu Arg Ala Tyr Gln His Ile Ala
195 200 205
Glu Lys Tyr Gln Val Pro Ile Val Ile Thr Gly Phe Glu Pro Val Asp
210 215 220
Ile Met Gln Gly Ile Phe Ala Cys Val Arg Gln Leu Glu Ser Gly Gln
225 230 235 240
Phe Thr Cys Asn Asn Gln Tyr Arg Arg Ser Val Gln Pro Gln Gly Asn
245 250 255
Ala His Ala Gln Lys Ile Ile Asp Gln Val Phe Glu Pro Val Asp Arg
260 265 270
His Trp Arg Gly Leu Gly Leu Ile Pro Ala Ser Gly Leu Gly Leu Arg
275 280 285
Pro Ala Phe Ala Pro Trp Asp Ala Ala Val Lys Phe Ala Asn Leu Leu
290 295 300
Gln Thr Met Ala Pro Thr Met Gly Glu Thr Val Cys Ile Ser Gly Glu
305 310 315 320
Ile Leu Gln Gly Gln Arg Lys Pro Ser Asp Cys Pro Ala Phe Gly Thr
325 330 335
Ile Cys Thr Pro Glu Gln Pro Leu Gly Ala Pro Met Val Ser Ser Glu
340 345 350
Gly Ala Cys Ala Ala Tyr Tyr Arg Tyr Arg Gln Gln Leu Pro Glu Pro
355 360 365
Val Gly Ala Ala Arg Val
370
<210> 13
<211> 1038
<212> DNA
<213> 集胞藻PCC6803
<400> 13
gtgaacttag tctgtcccgt tccccttgat cgttatcccc aggtactgtt agcccacggc 60
ggcggcggta agttgagcca acaattactt aagcaaattt ttttaccggc ctttggcgct 120
tctgaaacgg gtagtcatga tgcggcggtt tttactgcca accaaagttc tttagctttc 180
accaccgact cctatgtgat caatcccctc ttttttcctg ggggcgatat tggttctttg 240
gcagtccacg gcaccgttaa tgacctagcc atggccggcg caacccctcg ctatatcagc 300
gttggtttta tcctcgaaga aggattgccc atggagaccc tctggcgggt ggcccaatcc 360
ctagggcaag cggcccaaaa ctgtggggtg gaaattctta ccggtgatac caaagtggtg 420
gaccggggta agggagacgg cattttcatc aacaccagcg gcattggttc cctcgaccat 480
caacaaacta tccatcccaa tcaggtacag gtaggcgatc gcctaatttt gagcggtgat 540
ttgggacgtc atggcatggc cattatggca gtgcgccaag gattagaatt tgaaaccacc 600
attgaaagtg attcggcccc ggttcacaga gaagtgcagg cattattgtc ggcagggatc 660
ccaatccatt gtctgcggga tttaaccagg gggggattag ccagtgcggt taatgaaatt 720
gcccaaactt ccggggtaac catggcttta cgagaaacgt taatcccggt ggaggccgaa 780
gtacaagccg cctgtgaact gttgggtttt gaccccctct atgtggccaa tgagggaaga 840
ttcctggcca ttgtgccccc ggaagcagaa cagaagaccg tggaaatttt gcaaactttc 900
catccccaag ctacggcgat cggtacagta acaggcaaaa gtgcacaaac cttggggtta 960
gtcagtttgg aaagttccat tggtgccccc cggttgctag acatgatcag tggggagcaa 1020
ttaccccgta tttgttag 1038
<210> 14
<211> 345
<212> PRT
<213> 集胞藻PCC6803
<400> 14
Met Asn Leu Val Cys Pro Val Pro Leu Asp Arg Tyr Pro Gln Val Leu
1 5 10 15
Leu Ala His Gly Gly Gly Gly Lys Leu Ser Gln Gln Leu Leu Lys Gln
20 25 30
Ile Phe Leu Pro Ala Phe Gly Ala Ser Glu Thr Gly Ser His Asp Ala
35 40 45
Ala Val Phe Thr Ala Asn Gln Ser Ser Leu Ala Phe Thr Thr Asp Ser
50 55 60
Tyr Val Ile Asn Pro Leu Phe Phe Pro Gly Gly Asp Ile Gly Ser Leu
65 70 75 80
Ala Val His Gly Thr Val Asn Asp Leu Ala Met Ala Gly Ala Thr Pro
85 90 95
Arg Tyr Ile Ser Val Gly Phe Ile Leu Glu Glu Gly Leu Pro Met Glu
100 105 110
Thr Leu Trp Arg Val Ala Gln Ser Leu Gly Gln Ala Ala Gln Asn Cys
115 120 125
Gly Val Glu Ile Leu Thr Gly Asp Thr Lys Val Val Asp Arg Gly Lys
130 135 140
Gly Asp Gly Ile Phe Ile Asn Thr Ser Gly Ile Gly Ser Leu Asp His
145 150 155 160
Gln Gln Thr Ile His Pro Asn Gln Val Gln Val Gly Asp Arg Leu Ile
165 170 175
Leu Ser Gly Asp Leu Gly Arg His Gly Met Ala Ile Met Ala Val Arg
180 185 190
Gln Gly Leu Glu Phe Glu Thr Thr Ile Glu Ser Asp Ser Ala Pro Val
195 200 205
His Arg Glu Val Gln Ala Leu Leu Ser Ala Gly Ile Pro Ile His Cys
210 215 220
Leu Arg Asp Leu Thr Arg Gly Gly Leu Ala Ser Ala Val Asn Glu Ile
225 230 235 240
Ala Gln Thr Ser Gly Val Thr Met Ala Leu Arg Glu Thr Leu Ile Pro
245 250 255
Val Glu Ala Glu Val Gln Ala Ala Cys Glu Leu Leu Gly Phe Asp Pro
260 265 270
Leu Tyr Val Ala Asn Glu Gly Arg Phe Leu Ala Ile Val Pro Pro Glu
275 280 285
Ala Glu Gln Lys Thr Val Glu Ile Leu Gln Thr Phe His Pro Gln Ala
290 295 300
Thr Ala Ile Gly Thr Val Thr Gly Lys Ser Ala Gln Thr Leu Gly Leu
305 310 315 320
Val Ser Leu Glu Ser Ser Ile Gly Ala Pro Arg Leu Leu Asp Met Ile
325 330 335
Ser Gly Glu Gln Leu Pro Arg Ile Cys
340 345
<210> 15
<211> 2304
<212> DNA
<213> 集胞藻PCC6803
<400> 15
atgttaaaaa ccgttgccat acaggtccag ggaagggtgc aaggagtggg ttttcgtccc 60
tttgtttata cccttgccca ggaaatggga ctgaatggtt gggtgaataa ttccactcaa 120
ggagctaccg ttgtcattac cgccgacgaa aaggcgatcg ccgactttac ggagagatta 180
acgaagacat tacctccccc tggtttgatt gaacaattag ccgttgaaca gttaccgctg 240
gaaagtttta ctaactttac tatccgcccc agtagtgatg gccctaaaac tgcgagtatt 300
ttacccgatt tatccacttg ttccgcctgc ttaacagaac tatttgaccc tagcgatcgc 360
cgttatcttt acccctttat taactgtacc cattgcggtc cccgctacac cattattgaa 420
gccctacctt acgaccgttg tcgtaccacc atggctaggt ttcgccaatg taccgactgt 480
gaaagggaat ataagcaacc aggcgataga cgcttccatg cccaacctaa tgcctgtcct 540
cgctgtggcc cccaactggc tttttggaac cgacaaggcc aagtaattgc agaagcaaat 600
gaagctttaa actttgctgt agataattta aaagtcggca atattatcgc tattaaaggc 660
ttaggtggct tccatttgtg ttgtgatgcc actgattttg aagctgtgga aaaattaaga 720
ttaaggaaac atcgaccgga taaacctttg gcggtaatgt atggtaatct tggtcaaatt 780
gtggagcatt accaacctaa taatctagaa gttgaattgt tacaaagtgc cgccgcccct 840
attgtgttat taaacaaaaa aaaacaatta attttggtgg aaaatattgc cccaggcaac 900
ccccgagtcg gcgtaatgtt agcctatact cctttgcatc acttattact aaaaaaatta 960
aagaaaccca tggtagctac cagtggtaac ttagctgggg agcaaatttg cattgataat 1020
attgacgctt taacccggtt acaaaatatt gctgacggtt ttctcgttca tgatcgcccg 1080
attgtttgtc cagtggatga ttccgttgtc caaatagtag ctgggaagcc attatttttg 1140
cgtcgagccc ggggttacgc tcctcaaccc attactttac caaagcctac tcaaaaaaaa 1200
ctattggcga tgggaggtca ttataaaaat acagtggcga tcgccaaaca aaatcaagct 1260
tacgtcagcc aacatttggg cgatttgaat tctgctccca cctaccaaaa ttttgaagaa 1320
gccattgccc atttaagcca gctatacgat ttctctcccc aggaaattgt tgcagattta 1380
caccctgatt atttcagtca tcaatatgct gaaaaccaag ctttgcctgt cacttttgtg 1440
cagcatcact atgctcatat tttagcggtt atggcggaac atggagttat ggaggagtcc 1500
gtgttaggta ttgcttggga tggcactggc tacggcatgg acggtactat ttggggggga 1560
gaatttttaa aaatcaccca aggtacttgg cagagaattg ctcatctaca accatttcat 1620
ttattaggta atcaacaagc cattaaatat ccccatcgga ttgctttggc gttgttatgg 1680
cccacttttg gtgatgattt ttctgctgat tctttaggaa attggttgaa tttcaataat 1740
gggtttaaaa acaagataaa cagcaggtta aatcaggatc taaacaacaa aaatttacgt 1800
caactttggc aacgagggca agcaccgctc acttcgagta tgggaagatt atttgacggt 1860
attgcgacac tgataggatt gattaacgaa gtaacttttg aaggtcaggc ggccatagct 1920
ctggaagctc agattatgcc aaatttaact gaggagtatt atcctttgac tctaaacaac 1980
aaggaaaaaa aattagctgt tgattggcgc cccttaatta aagctataac cacagaagat 2040
agaagcaaaa ctaacctaat agccactaaa ttccacaaca gtttagtaaa tttaattatc 2100
actattgccc aacagcaggg aatcgaaaaa gttgctctgg ggggaggttg ctttcaaaat 2160
tgttatttgc ttgccagtac cattactgcc ctcaaaaaag ctggtttttc tcctttgtgg 2220
cccagagaac taccgcccaa cgacggtgcc atttgcatgg gtcaactgtt agctaaaatt 2280
caggctcggc aatatatctg ttaa 2304
<210> 16
<211> 767
<212> PRT
<213> 集胞藻PCC6803
<400> 16
Met Leu Lys Thr Val Ala Ile Gln Val Gln Gly Arg Val Gln Gly Val
1 5 10 15
Gly Phe Arg Pro Phe Val Tyr Thr Leu Ala Gln Glu Met Gly Leu Asn
20 25 30
Gly Trp Val Asn Asn Ser Thr Gln Gly Ala Thr Val Val Ile Thr Ala
35 40 45
Asp Glu Lys Ala Ile Ala Asp Phe Thr Glu Arg Leu Thr Lys Thr Leu
50 55 60
Pro Pro Pro Gly Leu Ile Glu Gln Leu Ala Val Glu Gln Leu Pro Leu
65 70 75 80
Glu Ser Phe Thr Asn Phe Thr Ile Arg Pro Ser Ser Asp Gly Pro Lys
85 90 95
Thr Ala Ser Ile Leu Pro Asp Leu Ser Thr Cys Ser Ala Cys Leu Thr
100 105 110
Glu Leu Phe Asp Pro Ser Asp Arg Arg Tyr Leu Tyr Pro Phe Ile Asn
115 120 125
Cys Thr His Cys Gly Pro Arg Tyr Thr Ile Ile Glu Ala Leu Pro Tyr
130 135 140
Asp Arg Cys Arg Thr Thr Met Ala Arg Phe Arg Gln Cys Thr Asp Cys
145 150 155 160
Glu Arg Glu Tyr Lys Gln Pro Gly Asp Arg Arg Phe His Ala Gln Pro
165 170 175
Asn Ala Cys Pro Arg Cys Gly Pro Gln Leu Ala Phe Trp Asn Arg Gln
180 185 190
Gly Gln Val Ile Ala Glu Ala Asn Glu Ala Leu Asn Phe Ala Val Asp
195 200 205
Asn Leu Lys Val Gly Asn Ile Ile Ala Ile Lys Gly Leu Gly Gly Phe
210 215 220
His Leu Cys Cys Asp Ala Thr Asp Phe Glu Ala Val Glu Lys Leu Arg
225 230 235 240
Leu Arg Lys His Arg Pro Asp Lys Pro Leu Ala Val Met Tyr Gly Asn
245 250 255
Leu Gly Gln Ile Val Glu His Tyr Gln Pro Asn Asn Leu Glu Val Glu
260 265 270
Leu Leu Gln Ser Ala Ala Ala Pro Ile Val Leu Leu Asn Lys Lys Lys
275 280 285
Gln Leu Ile Leu Val Glu Asn Ile Ala Pro Gly Asn Pro Arg Val Gly
290 295 300
Val Met Leu Ala Tyr Thr Pro Leu His His Leu Leu Leu Lys Lys Leu
305 310 315 320
Lys Lys Pro Met Val Ala Thr Ser Gly Asn Leu Ala Gly Glu Gln Ile
325 330 335
Cys Ile Asp Asn Ile Asp Ala Leu Thr Arg Leu Gln Asn Ile Ala Asp
340 345 350
Gly Phe Leu Val His Asp Arg Pro Ile Val Cys Pro Val Asp Asp Ser
355 360 365
Val Val Gln Ile Val Ala Gly Lys Pro Leu Phe Leu Arg Arg Ala Arg
370 375 380
Gly Tyr Ala Pro Gln Pro Ile Thr Leu Pro Lys Pro Thr Gln Lys Lys
385 390 395 400
Leu Leu Ala Met Gly Gly His Tyr Lys Asn Thr Val Ala Ile Ala Lys
405 410 415
Gln Asn Gln Ala Tyr Val Ser Gln His Leu Gly Asp Leu Asn Ser Ala
420 425 430
Pro Thr Tyr Gln Asn Phe Glu Glu Ala Ile Ala His Leu Ser Gln Leu
435 440 445
Tyr Asp Phe Ser Pro Gln Glu Ile Val Ala Asp Leu His Pro Asp Tyr
450 455 460
Phe Ser His Gln Tyr Ala Glu Asn Gln Ala Leu Pro Val Thr Phe Val
465 470 475 480
Gln His His Tyr Ala His Ile Leu Ala Val Met Ala Glu His Gly Val
485 490 495
Met Glu Glu Ser Val Leu Gly Ile Ala Trp Asp Gly Thr Gly Tyr Gly
500 505 510
Met Asp Gly Thr Ile Trp Gly Gly Glu Phe Leu Lys Ile Thr Gln Gly
515 520 525
Thr Trp Gln Arg Ile Ala His Leu Gln Pro Phe His Leu Leu Gly Asn
530 535 540
Gln Gln Ala Ile Lys Tyr Pro His Arg Ile Ala Leu Ala Leu Leu Trp
545 550 555 560
Pro Thr Phe Gly Asp Asp Phe Ser Ala Asp Ser Leu Gly Asn Trp Leu
565 570 575
Asn Phe Asn Asn Gly Phe Lys Asn Lys Ile Asn Ser Arg Leu Asn Gln
580 585 590
Asp Leu Asn Asn Lys Asn Leu Arg Gln Leu Trp Gln Arg Gly Gln Ala
595 600 605
Pro Leu Thr Ser Ser Met Gly Arg Leu Phe Asp Gly Ile Ala Thr Leu
610 615 620
Ile Gly Leu Ile Asn Glu Val Thr Phe Glu Gly Gln Ala Ala Ile Ala
625 630 635 640
Leu Glu Ala Gln Ile Met Pro Asn Leu Thr Glu Glu Tyr Tyr Pro Leu
645 650 655
Thr Leu Asn Asn Lys Glu Lys Lys Leu Ala Val Asp Trp Arg Pro Leu
660 665 670
Ile Lys Ala Ile Thr Thr Glu Asp Arg Ser Lys Thr Asn Leu Ile Ala
675 680 685
Thr Lys Phe His Asn Ser Leu Val Asn Leu Ile Ile Thr Ile Ala Gln
690 695 700
Gln Gln Gly Ile Glu Lys Val Ala Leu Gly Gly Gly Cys Phe Gln Asn
705 710 715 720
Cys Tyr Leu Leu Ala Ser Thr Ile Thr Ala Leu Lys Lys Ala Gly Phe
725 730 735
Ser Pro Leu Trp Pro Arg Glu Leu Pro Pro Asn Asp Gly Ala Ile Cys
740 745 750
Met Gly Gln Leu Leu Ala Lys Ile Gln Ala Arg Gln Tyr Ile Cys
755 760 765
<210> 17
<211> 474
<212> DNA
<213> 集胞藻PCC6803
<400> 17
atgccaggcc aatccaccaa gtccacttta atcatcggtt acggcaatac cctgcggggg 60
gacgacggcg tggggcgtta cctagcggaa gaaattgctc agcaaaactg gccccattgt 120
ggagttattt ccacccatca actcacccca gaattggccg aggcgatcgc cgctgtggac 180
cgggtaattt tcattgatgc ccaactgcag gaatcagcaa acgaaccatc ggtggaagtt 240
gtggccttaa aaaccctgga acccaacgaa ctgtcagggg atttggggca ccggggtaat 300
cccagggaac tcttgaccct ggctaaaatt ctctacggcg ttgaggtaaa ggcttggtgg 360
gtgttgattc cggccttcac ctttgattat ggagagaaat tgtctcccct gaccgcccgg 420
gcccaagccg aagccttagc ccagatccgc cccttggtat tgggggagag ataa 474
<210> 18
<211> 157
<212> PRT
<213> 集胞藻PCC6803
<400> 18
Met Pro Gly Gln Ser Thr Lys Ser Thr Leu Ile Ile Gly Tyr Gly Asn
1 5 10 15
Thr Leu Arg Gly Asp Asp Gly Val Gly Arg Tyr Leu Ala Glu Glu Ile
20 25 30
Ala Gln Gln Asn Trp Pro His Cys Gly Val Ile Ser Thr His Gln Leu
35 40 45
Thr Pro Glu Leu Ala Glu Ala Ile Ala Ala Val Asp Arg Val Ile Phe
50 55 60
Ile Asp Ala Gln Leu Gln Glu Ser Ala Asn Glu Pro Ser Val Glu Val
65 70 75 80
Val Ala Leu Lys Thr Leu Glu Pro Asn Glu Leu Ser Gly Asp Leu Gly
85 90 95
His Arg Gly Asn Pro Arg Glu Leu Leu Thr Leu Ala Lys Ile Leu Tyr
100 105 110
Gly Val Glu Val Lys Ala Trp Trp Val Leu Ile Pro Ala Phe Thr Phe
115 120 125
Asp Tyr Gly Glu Lys Leu Ser Pro Leu Thr Ala Arg Ala Gln Ala Glu
130 135 140
Ala Leu Ala Gln Ile Arg Pro Leu Val Leu Gly Glu Arg
145 150 155
<210> 19
<211> 6515
<212> DNA
<213> 人工序列
<220>
<223> 优化的表达序列
<220>
<221> misc_feature
<222> (1)..(6)
<223> NcoI限制性位点
<220>
<221> misc_feature
<222> (6510)..(6515)
<223> AvrII限制性位点
<400> 19
ccatggccca cgaagttagc ctgatggaac agacgctggc cattgccatt gcgcaggcgg 60
aagaccacgg ggcgagccaa attcaccgtt taacgctgcg cgttgggcag cagtcgggtg 120
ttgttgcaga tgcattacgc tttgcatttg aagttgttcg ccagaacaca atggctgcag 180
aagcacgtct ggaaatcgag gaaattccgg ttacctgtcg ttgtcagcat tgtcatgaaa 240
attttcagcc ggaggattgg atatatagat gtccccattg tgaccagatt agtcaaaccg 300
ttatggacgg caaacagctg gagttagcaa gcctggaact gagctaagca tggaaaggag 360
gtcgttatta tgtgccagaa ctgtgggtgt agcgcggttg ggaccgttgc gcatagccac 420
catcaccacg gggatggcaa ctttgcgcat agccatgacg accacgacca gcaggagcac 480
caccaccacc acggtaacta ttcaaaatca ccatcacagc agaccgtaac catagaacca 540
gacagacaaa gcatagcaat tggccaagga attctgagca aaaacgatcg tctggcagaa 600
cgcaaccgcg gctacttcca ggccaaaggt ctgttagtaa tgaatttcct gagcagcccg 660
ggagcaggca aaaccgcact gatcgaaaaa atggttggtg atcgtcagaa agatcatccg 720
accgcagtta ttgttggtga tctggcaacc gataatgatg cacagcgtct gcgtagcgca 780
ggtgcaattg caattcaggt taccaccggt aatatttgtc atctggaagc agaaatggtt 840
gcaaaagcag cacagaaact ggatctggat aatattgatc agctgattat tgaaaatgtt 900
ggtaatctgg tttgtccgac cacctatgat ctgggtgaag atctgcgtgt tgttctgttt 960
agcgttaccg aaggtgaaga taaaccgctg aaatatccgg caacctttaa aagcgcacag 1020
gttattctgg ttaccaaaca ggatattgca gcagcagttg attttgatgc agaactggca 1080
tggcagaatc tgcgtcaggt tgcaccgcag gcacagattt ttgcagttag cgcacgtacc 1140
ggtaaaggtc tgcagagctg gtatgaatat ctggatcagt ggcagctgca gcattatagc 1200
ccgctggttg atccggcact ggcataagag ttgaaaggag gtttcctcca tgtgcctggc 1260
gttaccgggg caggttgttt cgttaatgcc gaactcggat ccgctgttat taaccgggaa 1320
agttagcttt ggtggtatta ttaaaaccat tagcctggcg tatgttccgg aagttaaagt 1380
tggcgattat gttattgttc atgttggttt tgctatcagt attgttgatg aagaagcagc 1440
acaggagaca ctgattgatc tggccgagat gggcgtttaa ttcctaaaag gaggttttag 1500
ccatgaagta cgttgacgaa taccgcgacg cgcaggcagt tgcccactac cgccaggcca 1560
ttgcccgtga aattaccaaa ccgtggacgc tgatggaaat ttgtgggggc cagacccata 1620
gcatcgttaa atatggtctg gatgcattat taccgaaaaa cttaacctta atccacggtc 1680
cgggttgtcc ggtttgtgtt acgccgatgg aactgattga tcaggcatta tggctggcaa 1740
aacagccgga gattattttt tgtagctttg gtgatatgct gcgcgtgccg ggtagtggtg 1800
cagatctgct gagcattaaa gcacaggggg gagacgttcg tatagtttat tctccgttag 1860
attgtctggc gattgcgcgt gaaaatccga atcgtgaagt tgtttttttt ggtgtgggtt 1920
ttgaaactac cgccccggca accgcaatga cactgcatca ggcacgggcc cagggtatta 1980
gcaattttag cttattatgt gcacacgtgt tagttccgcc ggcgatggaa gctctgctgg 2040
gtaacccgaa tagcctggtt caagggtttt tagcagcagg tcatgtttgt acggttaccg 2100
gtgagcgggc gtatcagcat attgcagaga aatatcaggt tccgatagtt attaccggtt 2160
ttgaaccggt tgatattatg cagggtattt ttgcatgtgt tcgtcagctg gagagcgggc 2220
agtttacatg taataatcag taccggcggt cggttcagcc gcagggtaac gcacatgccc 2280
agaaaattat tgaccaggtt tttgaaccgg tggatcgtca ttggcgtgga ttaggtctta 2340
ttccggcctc aggtttaggt ttacgtccgg catttgcacc gtgggacgca gcagttaaat 2400
tcgcaaatct gttacagaca atggctccga caatgggtga aaccgtttgt atttctggcg 2460
aaattttaca gggtcagcgc aaacctagtg attgtcctgc atttggtacc atctgcaccc 2520
cggaacaacc gctgggcgcc cctatggtta gcagtgaagg cgcttgtgcc gcctattatc 2580
gttatcgtca gcaattaccg gaaccggttg gtgccgcacg tgtttaattt tgcaaaggag 2640
gtcctgccaa tgaacctggt gtgtccggtg ccgctggacc gctacccgca ggttttactg 2700
gcacacgggg ggggggggaa gctgagtcag cagctgttaa aacagatttt tctgccggcg 2760
tttggtgcat cagaaaccgg tagccatgat gcagcagttt ttaccgcaaa tcagagcagc 2820
ttagcattta caacagattc ctatgttatc aatccgctgt tttttcctgg tggtgatatt 2880
ggtagtcttg cagttcatgg aaccgttaat gatttagcaa tggcaggtgc aacaccgcgt 2940
tatattagcg ttgggtttat tctggaggag ggtttaccga tggagacact ttggcgtgtt 3000
gcacaaagcc tgggtcaggc agcacagaat tgtggagttg aaatattaac aggtgatacc 3060
aaagttgttg atcgtgggaa gggagatggt atttttatta atacatcggg tatcggtagt 3120
ttagatcacc agcaaaccat tcatccgaat caggttcagg ttggtgatcg tctgattctg 3180
agtggggatt taggacggca tggtatggca attatggcag ttcgtcaggg cctggaattt 3240
gaaacaacca ttgaaagcga tagcgcaccg gttcatcgtg aggttcaggc tctgctgagc 3300
gcagggattc cgattcactg tctgcgtgac ttaacacgtg gtggtctggc aagcgccgtg 3360
aacgaaattg cacaaacctc aggtgttaca atggctctgc gtgaaacctt aattccggtt 3420
gaggcggaag ttcaagccgc ctgtgaactg ctgggttttg atcctttata tgttgcgaac 3480
gaaggccgtt tcctggccat tgttccgccg gaagccgaac agaaaaccgt tgaaattctg 3540
cagacctttc acccgcaggc gaccgcaatt ggtaccgtta ccggcaagag tgcacagacc 3600
ttaggtctgg ttagcctgga gagtagcata ggtgccccac gtctgttaga tatgattagc 3660
ggagaacaac tgccacgtat ttgttaagac tccaaaggag gctagattaa tgctgaaaac 3720
cgttgccatt caggttcagg ggcgcgttca gggggttggt tttcggccgt ttgtttacac 3780
cttagcccag gaaatgggtc tgaatggctg ggttaataac tctacgcagg gtgcaaccgt 3840
tgttattacc gcagatgaga aagcaattgc agattttacc gaacgtctga ccaaaacact 3900
gccgccaccg ggactgatcg aacaactggc agtggaacag ctgccgctgg aaagctttac 3960
caactttacc attagaccga gtagcgatgg tccgaaaacc gcaagcatcc tgccagatct 4020
gagcacatgt agcgcctgtc tgaccgaatt atttgatccc agtgatcgtc gttatctgta 4080
cccttttatt aattgtaccc actgtggtcc tcgctatacc attattgaag cactgcctta 4140
tgaccgttgt cgtaccacaa tggctcgttt tcgtcagtgt acggattgtg aacgtgaata 4200
taagcagccg ggggaccgcc gttttcatgc acagccaaac gcgtgtccgc gttgtggtcc 4260
gcagctggca ttctggaacc gtcagggtca agttattgca gaagccaatg aagcactgaa 4320
tttcgcagta gataatttaa aggtcggtaa tattatcgca atcaaaggtc tgggtggttt 4380
tcatttatgt tgtgatgcaa ccgattttga agccgttgaa aaactgcgtt tacgtaaaca 4440
tcgcccggat aagccgctgg ccgttatgta cggtaatctg ggtcagattg ttgagcatta 4500
tcagccgaat aatttagaag ttgagctgct gcagagcgca gcagcaccta ttgttcttct 4560
gaataaaaag aaacagctga ttctggttga aaatattgca ccgggcaatc cgcgtgtggg 4620
tgttatgctg gcatataccc cgttacatca cctgttactt aaaaagttaa agaagccgat 4680
ggttgcaacc tccggtaact tagcaggcga acagatttgt attgacaata ttgacgcact 4740
gacccgttta caaaatattg ccgacggctt tctggttcac gatcgtccga ttgtttgtcc 4800
ggttgacgat agtgttgttc agattgtggc aggtaaaccg ttatttttaa gaagagcccg 4860
cggttatgca ccgcagccga ttacccttcc taaacccacc cagaaaaagt tattagcaat 4920
gggaggccat tataaaaata ccgttgcaat tgcaaagcag aatcaggcat atgtaagcca 4980
gcatttaggt gatttaaaca gcgcaccaac ctaccaaaat ttcgaagagg cgatagccca 5040
tttatcacag ctgtatgact ttagtcccca ggaaattgtc gcagatctgc atccggatta 5100
ctttagccat cagtacgcag aaaaccaagc cctgccggtg acgtttgtac agcatcatta 5160
tgcacatatt ctggcagtta tggcagaaca tggtgttatg gaagaaagcg ttttaggcat 5220
tgcatgggat ggcaccggtt atggtatgga tggtaccatt tggggtggtg aatttctgaa 5280
aattacgcag gggacctggc aaagaattgc acatctgcag ccgtttcatc tgttagggaa 5340
tcagcaggca attaaatatc cgcaccggat tgcacttgct ctgctgtggc cgacattcgg 5400
ggacgatttt agcgccgata gtctgggtaa ttggttaaat tttaacaacg gtttcaagaa 5460
caagatcaac agccgtttaa accaagactt aaataataag aacctgagac aactgtggca 5520
gcgtgggcag gcaccgctga cctcgagcat gggcagatta tttgatggta tcgcaacact 5580
gattggtctg atcaatgaag taacctttga aggccaggca gcaattgcat tagaggcaca 5640
aattatgccg aatctgaccg aagaatacta tccgcttacc ctgaataaca aagaaaaaaa 5700
actggcagtt gattggcgtc cgctgattaa agcaattacc accgaagatc gtagcaaaac 5760
caatctgatt gcaaccaaat ttcataatag cctggttaat ctgattatta ccattgcaca 5820
gcagcagggt attgaaaaag ttgcactggg tggtggttgt tttcagaatt gttatctgct 5880
ggcaagcacc attaccgcac tgaaaaaagc aggttttagc ccgctgtggc cgcgtgaact 5940
gccgccgaat gatggtgcaa tttgtatggg tcagctgctg gcaaaaattc aggcacgtca 6000
gtatatttgt taactcaaca aaggaggagc tggttatgcc gggtcagagc accaaaagca 6060
ccctgattat cgggtacggg aacaccttac gtggggacga tggggtgggg cgctacctgg 6120
cagaagaaat agcacagcag aactggccgc actgtggtgt tattagcaca catcagctga 6180
ccccggaact ggccgaagca attgcagcag tggatagagt gatttttatt gacgcccaac 6240
tgcaggaaag tgcaaatgaa ccgtcagttg aagttgttgc cctgaaaacc ttagaaccca 6300
atgaattaag tggagatctg ggtcatcgtg gtaatccgcg tgagctgctg accttagcca 6360
aaatattata tggtgttgaa gtcaaagcgt ggtgggttct gattccggcc tttacctttg 6420
attatggtga gaaattatcg cccttaacag cacgtgctca ggccgaagca ctggcacaga 6480
ttcgtccgct ggttctgggg gaacgttaac ctagg 6515

Claims (21)

1.一种单体多肽,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性。
2.根据权利要求1所述的单体多肽,其中所述单体多肽分离自天然环境,尤其分离自天然[NiFe]-氢化酶类蛋白。
3.根据权利要求1所述的单体多肽,其中所述单体多肽为重组的或异源的。
4.根据上述权利要求中任一项所述的单体多肽,其中所述单体多肽为纯化的。
5.根据上述权利要求中任一项所述的单体多肽,其中,所述单体多肽截短或非截短的氨基酸序列与SEQ ID NO:2的氨基酸序列和/或SEQ ID NO:4的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
6.根据上述权利要求中任一项所述的单体多肽,其中,所述包括[NiFe]-氢化酶类蛋白的活性位点的亚基为集胞藻CCP6803中/来自集胞藻CCP6803的HoxEFUYH[NiFe]-氢化酶类蛋白的HoxH亚基。
7.根据上述权利要求中任一项所述的单体多肽,其中,所述单体多肽的氢化酶活性不低于0.01μmol H2·min-1·mg-1酶,优选为不低于0.05μmol H2·min-1·mg-1酶,优选为不低于10μmol H2·min-1·mg-1酶。
8.一种包括权利要求1-7中任一项所述的单体多肽的宿主细胞。
9.根据权利要求8所述的宿主细胞,其中所述宿主细胞还包括所述[NiFe]-氢化酶类蛋白的至少一种成熟因子,所述至少一种成熟因子对于宿主细胞为内源性的和/或外源性的,所述[NiFe]-氢化酶类蛋白的至少一种成熟因子优选选自HypA、HypB、HypC、HypD、HypE、HypF和HoxW;
a)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW的氨基酸序列分别与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性;或者
b)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW由串联核苷酸序列共同编码,所述串联核苷酸序列与编码所有成熟因子的SEQ ID NO:19的核苷酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
10.根据权利要求8或9所述的宿主细胞,其中所述宿主细胞包括表达载体,所述表达载体中的至少一个基因表达所述单体多肽和/或所述至少一种成熟因子。
11.所述宿主细胞包括编码权利要求1-7中任一项所述的单体多肽的多核苷酸。
12.根据权利要求11所述的宿主细胞,其中所述宿主细胞还包括所述[NiFe]-氢化酶类蛋白的至少一种成熟因子,所述至少一种成熟因子对于宿主细胞为内源性的和/或外源性的,所述[NiFe]-氢化酶类蛋白的至少一种成熟因子优选选自HypA、HypB、HypC、HypD、HypE、HypF和HoxW;
a)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW的氨基酸序列分别与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性;或者
b)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW由串联核苷酸序列共同编码,所述串联核苷酸序列与编码所有成熟因子SEQ ID NO:19的核苷酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
13.根据权利要求11或12所述的宿主细胞,其中所述宿主细胞包括表达载体,所述表达载体中的至少一个基因表达所述单体多肽和/或所述至少一种成熟因子。
14.一种权利要求1-7任一项所述的具有氢化酶活性的单体多肽的制备方法,所述方法包括以下步骤:
·在体内或体外对包括遗传物质的诸如宿主细胞或表达载体的实体进行转基因的步骤,以获得诸如转基因宿主细胞或转基因表达载体的转基因实体;
·孵育所述诸如所述转基因宿主细胞或所述转基因表达载体的转基因实体,以获得包括一个单亚基的单体多肽的步骤,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性。
15.根据权利要求14所述的具有氢化酶活性的单体多肽的制备方法,其中在体内或体外进行的所述转基因的步骤包括:
a)将外源多核苷酸通过转基因转入宿主细胞和/或表达载体,以获得转基因宿主细胞和/或转基因表达载体,孵育所述转基因宿主细胞和/或转基因表达载体,所述外源多核苷酸至少一部分编码所述单体多肽,所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述孵育的条件为能够维持所述外源多核苷酸的表达以产生所述单体多肽;或者
b)诱导宿主细胞发生至少一种基因突变以获得转基因的宿主细胞,孵育所述转基因宿主细胞,所述孵育的条件为能够产生所述单体多肽。
16.根据权利要求15所述的具有氢化酶活性的单体多肽的制备方法,其中所述将外源多核苷酸通过转基因转入所述宿主细胞的步骤,包括将表达载体转入所述宿主细胞,尤其是包括所述外源多核苷酸的修饰的表达载体。
17.根据权利要求15或16所述的具有氢化酶活性的单体多肽的制备方法,其中所述宿主细胞的转基因步骤,包括将所述外源多核苷酸转入所述宿主细胞,所述外源多核苷酸至少一部分编码所述单体多肽,所述单体多肽截短或非截短的氨基酸序列与SEQ ID NO:2的氨基酸序列和/或SEQ ID NO:4的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
18.根据权利要求15-17所述的具有氢化酶活性的单体多肽的制备方法,其中所述宿主细胞的转基因步骤,包括将所述[NiFe]-氢化酶类蛋白的至少一种成熟因子转入所述宿主细胞,所述至少一种成熟因子对于宿主细胞为内源性的和/或外源性的,所述转入的[NiFe]-氢化酶类蛋白的至少一种成熟因子优选选自HypA、HypB、HypC、HypD、HypE、HypF和HoxW,
a)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW的氨基酸序列分别与SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18的氨基酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性;或者
b)所述HypA、HypB、HypC、HypD、HypE、HypF和HoxW由串联核苷酸序列共同编码,所述串联核苷酸序列与编码所有成熟因子的SEQ ID NO:19的核苷酸序列具有不低于15%的同一性,优选为不低于20%的同一性,更优选为不低于40%的同一性,更优选为不低于60%的同一性,更优选为不低于80%的同一性,更优选为不低于90%的同一性,更优选为不低于95%的同一性,更优选为不低于99%的同一性。
19.根据权利要求18所述的具有氢化酶活性的单体多肽的制备方法,其中所述宿主细胞包括表达载体,所述表达载体中的至少一个基因表达所述至少一种成熟因子。
20.根据权利要求14-20任一项所述的具有氢化酶活性的单体多肽的制备方法,其中所述制备方法包括分离和/或纯化所述单体多肽的后续步骤。
21.权利要求1-7中任一项所述单体多肽或权利要求14-20中任一项所述制备方法制得的单体多肽的应用,其中所述单体多肽包括一个单亚基,所述单亚基包含[NiFe]-氢化酶类蛋白的活性位点,所述单体多肽具有氢化酶活性,根据孵育的条件,存在于或不存在于细胞中,通过孵育所述单体多肽产生或消耗氢气,以确保氢气的产生或消耗,或涂覆表面,尤其是涂覆诸如阳极或阴极的导电体的表面。
CN202080089310.9A 2019-11-13 2020-11-12 具有氢化酶活性的单体多肽,特别是具有氢化酶活性的重组单体多肽 Pending CN114901814A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19208856 2019-11-13
BE20195783A BE1027221B1 (fr) 2019-11-13 2019-11-13 Polypeptide monomérique présentant une activité hydrogénase, en particulier polypeptide monomérique recombinant présentant une activité hydrogénase
BE2019/5783 2019-11-13
EP19208856.5 2019-11-13
PCT/EP2020/081931 WO2021094465A1 (fr) 2019-11-13 2020-11-12 Polypeptide monomérique présentant une activité hydrogénase, en particulier polypeptide monomérique recombinant présentant une activité hydrogénase

Publications (1)

Publication Number Publication Date
CN114901814A true CN114901814A (zh) 2022-08-12

Family

ID=73138861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080089310.9A Pending CN114901814A (zh) 2019-11-13 2020-11-12 具有氢化酶活性的单体多肽,特别是具有氢化酶活性的重组单体多肽

Country Status (6)

Country Link
US (1) US20230011570A1 (zh)
EP (1) EP4058567A1 (zh)
JP (1) JP2023502034A (zh)
CN (1) CN114901814A (zh)
CA (1) CA3160285A1 (zh)
WO (1) WO2021094465A1 (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107429272A (zh) * 2014-11-26 2017-12-01 英威达纺织(英国)有限公司 用于通过c9途径产生7‑碳化合物的方法和材料

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009075798A2 (en) * 2007-12-05 2009-06-18 University Of Georgia Research Foundation, Inc. Hydrogenase polypeptide and methods of use

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107429272A (zh) * 2014-11-26 2017-12-01 英威达纺织(英国)有限公司 用于通过c9途径产生7‑碳化合物的方法和材料

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A E PRZYBYLA等: "Structure-function relationships among the nickel-containing hydrogenases", 《FEMS MICROBIOL REV .》, vol. 8, no. 2, pages 109 - 135, XP023941530, DOI: 10.1111/j.1574-6968.1992.tb04960.x *
CHRISTIAN MASSANZ等: "Subforms and In Vitro Reconstitution of the NAD-Reducing Hydrogenase of Alcaligenes eutrophus", 《J BACTERIOL.》, vol. 180, no. 5, pages 1024 *
CONSTANZE PINSKE等: "Efficient electron transfer from hydrogen to benzyl viologen by the [NiFe]-hydrogenases of Escherichia coli is dependent on the coexpression of the iron-sulfur cluster-containing small subunit", 《ARCH MICROBIOL》, vol. 193, no. 12, pages 893 - 903 *
MORITZ SENGER等: "Proteolytic cleavage orchestrates cofactor insertion and protein assembly in [NiFe]-hydrogenase biosynthesis", 《JOURNAL OF BIOLOGICAL CHEMISTRY》, vol. 292, no. 28, pages 11670 - 11681, XP055686488, DOI: 10.1074/jbc.M117.788125 *
SABINE HORNHARDT等: "Characterization of a native subunit of the NAD-linked hydrogenase isolated from a mutant of Alcaligenes eutrophus H16", 《BIOCHIMIE》, vol. 68, no. 1, pages 15 - 24, XP026762918, DOI: 10.1016/S0300-9084(86)81063-X *

Also Published As

Publication number Publication date
JP2023502034A (ja) 2023-01-20
US20230011570A1 (en) 2023-01-12
CA3160285A1 (fr) 2021-05-20
WO2021094465A1 (fr) 2021-05-20
EP4058567A1 (fr) 2022-09-21

Similar Documents

Publication Publication Date Title
Happe et al. Differential regulation of the Fe‐hydrogenase during anaerobic adaptation in the green alga Chlamydomonas reinhardtii
Ferreira et al. Structure and function of ferrochelatase
CN108795916B (zh) 一种赖氨酸脱羧酶突变体、其编码基因及其表达和应用
Schwarze et al. Requirements for construction of a functional hybrid complex of photosystem I and [NiFe]-hydrogenase
US8663958B2 (en) Oxygen-resistant hydrogenases and methods for designing and making same
CN108251396B (zh) 5-氨基乙酰丙酸合成酶突变体及其宿主细胞和应用
CN108070581B (zh) 一种酶活提高的L-天冬氨酸β-脱羧酶突变体及其应用
CN113151230A (zh) 一种甲醛裂合酶的突变体蛋白及其应用
US9249440B2 (en) Hydrogenase polypeptide and methods of use
WO2009139365A1 (ja) シス-4-ヒドロキシ-l-プロリン製造方法
US8835153B2 (en) Process and genes for expression and overexpression of active [FeFe] hydrogenases
CN114032225B (zh) 5-氨基乙酰丙酸合成酶突变体及其宿主细胞和应用
WO2006074194A2 (en) Engineered phosphite dehydrogenase mutants for nicotinamide cofactor regeneration
CN114901814A (zh) 具有氢化酶活性的单体多肽,特别是具有氢化酶活性的重组单体多肽
CN110157691B (zh) 5-氨基乙酰丙酸合成酶突变体及其宿主细胞和应用
Kitamura et al. Cloning and expression of the gene encoding flavodoxin from Desulfovibrio vulgaris (Miyazaki F)
CN112011524B (zh) 5-氨基乙酰丙酸合成酶突变体及其宿主细胞和应用
King et al. Structural and functional investigations of biological catalysts for optimization of solar-driven H2 production systems
CN114525266B (zh) 一种来源于南极细菌的磷脂酶d突变体及其应用
BE1027221B1 (fr) Polypeptide monomérique présentant une activité hydrogénase, en particulier polypeptide monomérique recombinant présentant une activité hydrogénase
CN107531763B (zh) 一种用于生物合成异戊二烯和异戊烯的酶及其突变体
US20240043883A1 (en) Synthesis Of 3-Hydroxypropionic Acid Via Hydration Of Acetylenecarboxylic Acid
KR20200054761A (ko) 전자전달 체인으로 작동하는 Fe-S 융합단백질 및 이의 용도
MacLean Autotrophy in iron-oxidizing, acidophilic bacteria
Maróti Insights into the assembly of the NiFe hydrogenase enzymes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination