CN115667518A - 重组的微生物和方法 - Google Patents

重组的微生物和方法 Download PDF

Info

Publication number
CN115667518A
CN115667518A CN202180035594.8A CN202180035594A CN115667518A CN 115667518 A CN115667518 A CN 115667518A CN 202180035594 A CN202180035594 A CN 202180035594A CN 115667518 A CN115667518 A CN 115667518A
Authority
CN
China
Prior art keywords
microorganism
nucleic acid
cell
recombinant microorganism
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180035594.8A
Other languages
English (en)
Inventor
R·维鲁斯
L·布朗
N·库拉索
A·叶尔科维奇
K·彼得罗尔
J·约翰斯
S·金
A·埃德蒙兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Macquarie University
Original Assignee
Macquarie University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2020900990A external-priority patent/AU2020900990A0/en
Application filed by Macquarie University filed Critical Macquarie University
Publication of CN115667518A publication Critical patent/CN115667518A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/405Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from algae
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/79Transferrins, e.g. lactoferrins, ovotransferrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0067Oxidoreductases (1.) acting on hydrogen as donor (1.12)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0095Oxidoreductases (1.) acting on iron-sulfur proteins as donor (1.18)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P3/00Preparation of elements or inorganic compounds except carbon dioxide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y112/00Oxidoreductases acting on hydrogen as donor (1.12)
    • C12Y112/99Oxidoreductases acting on hydrogen as donor (1.12) with other acceptors (1.12.99)
    • C12Y112/99006Hydrogenase (acceptor) (1.12.99.6)
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M8/00Fuel cells; Manufacture thereof
    • H01M8/06Combination of fuel cells with means for production of reactants or for treatment of residues
    • H01M8/0606Combination of fuel cells with means for production of reactants or for treatment of residues with means for production of gaseous reactants
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M8/00Fuel cells; Manufacture thereof
    • H01M8/10Fuel cells with solid electrolytes
    • H01M8/1007Fuel cells with solid electrolytes with both reactants being gaseous or vaporised
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • C12P1/04Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y112/00Oxidoreductases acting on hydrogen as donor (1.12)
    • C12Y112/07Oxidoreductases acting on hydrogen as donor (1.12) with an iron-sulfur protein as acceptor (1.12.7)
    • C12Y112/07002Ferredoxin hydrogenase (1.12.7.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y118/00Oxidoreductases acting on iron-sulfur proteins as donors (1.18)
    • C12Y118/01Oxidoreductases acting on iron-sulfur proteins as donors (1.18) with NAD+ or NADP+ as acceptor (1.18.1)
    • C12Y118/01002Ferredoxin-NADP+ reductase (1.18.1.2)
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M8/00Fuel cells; Manufacture thereof
    • H01M8/16Biochemical fuel cells, i.e. cells in which microorganisms function as catalysts
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/30Hydrogen technology
    • Y02E60/50Fuel cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Electrochemistry (AREA)
  • Manufacturing & Machinery (AREA)
  • Sustainable Development (AREA)
  • Sustainable Energy (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Fuel Cell (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明涉及用于生产生物氢的重组的微生物。此外,本发明涉及核酸构建体和用于修饰微生物以使其能够产生氢气的方法。

Description

重组的微生物和方法
技术领域
本发明涉及生产氢气的方法、用于生产氢气的核酸构建体和重组的微生物。
背景技术
由于石油价格上涨、与产油国的外交紧张关系升级,以及大气中温室气体水平上升,人们对替代燃料的兴趣越来越大。氢气具有作为无污染燃料的巨大潜力,从而缓解与化石能源利用相关的环境和政治问题。因此,确定替代或补充化石燃料作为清洁能源的候选物的努力集中在分子氢的生产上。
氢经济的关键是找到一种高效、廉价和可再生的制氢方法的同时实现同样重要的目标即经济地将氢转化为可用的能源。
一种以商业规模来生产氢气的方法是利用真核生物的光生物制氢。例如,绿藻通过将氧化途径转换为发酵代谢来应对厌氧应激。
绿藻,如莱茵衣藻(Chlamydomonas reinhardtii),从水生产氢气的能力早已得到认可。所述反应由可逆氢化酶催化,这种酶在细胞暴露于短时间的厌氧环境后被诱导。因此,利用藻类生物反应器已经成为一种生产氢的方法。然而,当细胞受到光照时氢化酶的活性会迅速丧失,这是因为光合作用产生的氧气会立即使可逆氢化酶失活。
生产氢气的其他方法包括产生重组微生物,以及由这些微生物发酵碳水化合物原料。在一些实例中,在大肠杆菌中表达了来自细菌、古细菌和藻类的氢化酶,但是由于低表达率和蛋白质不稳定性,外源性酶在大肠杆菌中的表达变得复杂,即使进行了密码子优化。
已经提出了各种各样的氢化酶作为用于这种发酵方法的候选物。例如,来自紫色细菌异染色质葡萄球菌(Allochromatiiim vinosum)的[NiFe]氢化酶是一种非常活跃的电催化剂。尽管[NiFe]-氢化酶显现出前景,但使用这些和其他氢化酶仍然存在问题。氢化酶的稳定性是其在酶燃料电池中应用的主要缺点之一。此外,尽管这些酶显现出对一氧化碳(CO)中毒的敏感性低于铂,但在商业应用中,在对CO和O2的敏感性方面都需要进一步改善。此外,由于难以获得大量的氢化酶,限制了它们在酶燃料电池中的潜在应用。因此,大量生产具有所需催化性能的稳定氢化酶将极大地促进这种令人关注的生物电子催化剂在氢燃料中的应用。
由于在许多光捕获和氢捕获技术上存在障碍,藻类生物反应器扩大规模的成本很高。氢气生产速率也是一个重要考虑因素,因为难以在低体积和低浓度下维持和收集氢气。藻类系统以非常低的速率产生氢,并且开始生产需要营养限制。迄今为止,无论是通过工程化微藻还是通过碳水化合物原料发酵产生氢气,其生产速率和产量都太缓慢和太低,不具备商业可行性。
因此,需要改进生产氢气的方法。
说明书中对任何现有技术的引用并不意味着承认或暗示所述现有技术构成任何司法管辖区中的公知常识的一部分,也不表示所述现有技术可以合理地被本领域技术人员理解、视为相关的和/或与其他现有技术结合。
发明内容
本发明总体上涉及表达载体、微生物、方法和反应器系统,以生产用于能源和发电应用的氢和活性氢化酶。表达载体和微生物可用于培养方法以产生目的产物。氢气和活性氢化酶产物都可以加入到系统中,例如用于从氢气产生电力的燃料电池系统中。
在第一方面,本发明提供一种用于生产氢气的重组的微生物,其中所述微生物包括:
编码一种或多种蛋白质的外源性核酸序列,所述蛋白质能使微生物生产氢气,
-其中所述一种或多种蛋白质包括Fe-Fe-依赖性氢化酶和任选地至少一种用于使所述氢化酶成熟和活化的装配蛋白;
-其中所述核酸序列与一种或多种启动子可操作地连接,以使所述核酸序列能够在所述微生物中表达,和
-其中,外源性核酸序列经过密码子优化,以便在微生物中优化表达氢化酶。
优选地,Fe-Fe氢化酶是A1类Fe-Fe氢化酶的一个成员。
优选地,所述Fe-Fe-依赖性氢化酶是HydA(Hyd1)或与其功能等同的同系物或衍生物。
在优选的实施方式中,所述Fe-Fe依赖性氢化酶包含选自下组的HydA蛋白的氨基酸序列:莱茵衣藻(Chlamydomonas reinhardtii)、卡特氏团藻(Volvox carteri)、蓝氏贾第虫(Giardia lamblia)、诺氏内阿米巴(Entamoeba nuttalli)、嗜多变形泥杆菌(Ilyobacter polytrophus)、阴道毛滴虫(Trichomonas vaginalis)、小核桃形巨球形菌(Megasphaera micronuciformis)、小韦荣球菌(Veillonella parvula)、非典型韦荣球菌(Veillonella atypica)、双酶梭菌(Peptoclostridium bifermentans)、阿魏梭菌(Clostridium arbusti)、假毛癣菌(Pseudoflavonifractor capillosus)、香橼酸拉克氏梭菌(Lachnoclostridium citroniae)、梭形拉克氏梭菌(Lachnoclostridiumclostridioforme)、发酵粘土弯菌(Pelosinus fermentans)、冰岛热脱硫弧菌(Thermodesulfovibrio islandicus)、华德萨特氏菌(Sutterella wadsworthensis)、拜氏梭菌(Clostridium beijerinckii)、溃疡梭杆菌(Fusobacterium ulcerans)、酪丁酸梭菌(Clostridium tyrobutyricum)、产气荚膜梭菌(Clostridium perfringens)、索氏鲸杆菌(Cetobacterium somerae)、拜氏梭菌(Clostridium beijerinckii)、狗肠梭菌(Clostridium colicanis)、肠道梭状芽孢杆菌(Clostridium intestinale)、气肿疽梭菌(Clostridium chauvoei)、粪碱纤维单胞菌(Cellulomonas fimi)、热纤小孢霉(Ruminiclostridium thermocellum)、耐格里原虫(Naegleria gruberi)、小球藻(Chlorella variabilis)、结节性发热杆菌(Fervidobacterium nodosum)、石油热袍菌(Thermotoga petrophila)、莱丁卡热袍菌(Thermotoga lettingae)、嗜泥硫微螺菌(Thiomicrospira pelophila)、加利福尼亚钙细菌(Caldatribacterium californiense)、坏死梭杆菌(Fusobacterium necrophorum)、Omnitrophus fodinae、脂肪酸特异互养栖热菌(Syntrophothermus lipocalidus)、德氏氨螺菌(Ammonifex degensii)、热液口脱硫肠状菌(Desulfotomaculum hydrothermale)、死亡梭杆菌(Fusobacterium mortiferum)、库氏脱硫肠状菌(Desulfotomaculum kuznetsovii)和植物发酵拉克氏梭菌(Lachnoclostridium phytofermentans)或与其功能等同的同系物或衍生物。优选地,HydA蛋白选自:莱茵衣藻(Chlamydomonas reinhardtii)、卡特氏团藻(Volvox carteri)、蓝氏贾第虫(Giardia lamblia)、诺氏内阿米巴(Entamoeba nuttalli)、嗜多变形泥杆菌(Ilyobacter polytrophus)、阴道毛滴虫(Trichomonas vaginalis)、小核桃形巨球形菌(Megasphaera micronuciformis)、小韦荣球菌(Veillonella parvula)、非典型韦荣球菌(Veillonella atypica)和双酶梭菌(Peptoclostridium bifermentans),及与其功能等效的同系物。更优选地,HydA蛋白选自莱茵衣藻或与其功能等同的同系物或衍生物。
在某些实施方式中,在培养微生物的过程中,可以向微生物提供能够使氢化酶成熟和活化的一种或多种因子。优选地,所述一种或多种因子是小分子的形式。使氢化酶成熟和活化的因子的例子是含有氮杂二硫代酸桥的[2Fe]-亚位点模拟物。在例如Esselborn等人,(2013)Nat Chem Biol 9(10):607-609and Berggren等人,(2013)Nature,499:66-69中描述了此类因素,其内容通过引用并入文本。
优选地,所述外源性核酸序列编码至少一种能够使氢化酶成熟和活化的装配蛋白,其中所述至少一种蛋白选自:HydEF和/或HydG。更优选地,所述外源性核酸序列包括编码装配蛋白HydEF和HydG的序列。在一个特别优选的实施方式中,HydEF和HydG蛋白包括来自莱茵衣藻的HydEF和HydG蛋白或与其功能等同的同系物或衍生物的氨基酸序列。
因此,在一个优选的实施方式中,本发明提供了用于生产氢气的重组的微生物,其中所述微生物包括:
编码一种或多种能使微生物产生氢的蛋白质的外源性核酸序列,
-其中所述一种或多种蛋白质包括Fe-Fe-依赖性氢化酶HydA或其功能等同的同系物或衍生物,以及来自莱茵衣藻的装配蛋白HydEF和HydG或其功能等同的同系物或衍生物;
-其中所述核酸序列与一种或多种启动子可操作地连接,以使所述核酸序列能够在所述微生物中表达,和
-其中外源性核酸序列进行了密码子优化以提供氢化酶在微生物中的优化表达。
在任何实施方式中,所述微生物还包扩编码蛋白质铁氧还蛋白NADP还原酶(FNR)和铁氧还蛋白(由petF编码)或与其功能等同的同系物或衍生物的核酸序列。
优选地,FNR的来源为含有铁氧还蛋白还原酶的黄素,其利用NADPH作为还原剂来还原铁氧还蛋白。更优选地,铁氧还蛋白来自莱茵衣藻,FNR为能够还原莱茵衣藻铁氧还蛋白的任何FNR。在一个特别优选的实施方式中,FNR和铁氧还蛋白包含来自莱茵衣藻的氨基酸序列或与其功能等同的同系物或衍生物。
重组的微生物可以是适于表达重组蛋白的任何微生物。在某些实施方式中,重组微生物选自:大肠杆菌(Escherichia coli)、枯草芽孢杆菌(Bacillus subtilis)、乳杆菌属(Lactobacillus sp.)或链球菌属(Streptococcus sp.)。在优选的实施方式中,微生物是大肠杆菌(E coli)的菌株。
在某些实施方式中,重组的微生物被部分或完全灭活和/或无活力。
在任何实施方式中,外源性核酸序列以一种或多种多核苷酸构建体提供。在一个优选的实施方式中,编码HydEF、HydG、HydA和任选的铁氧还蛋白和FNR的外源性核酸序列在单个多核苷酸构建体中提供。在替代实施方式中,编码蛋白质的核酸序列在单独的多核苷酸构建体中提供。
在一个优选的实施方式中,本发明提供了一种大肠杆菌细胞,其包含编码使细胞能够产生氢的蛋白质簇的重组的构建体,其中所述蛋白质簇包含、由或基本上由来自莱茵衣藻的多肽HydEF、HydG、HydA、铁氧还蛋白和FNR组成。在一个优选的实施方式中,重组的构建体包含、由或基本上由SEQ ID NO:10中所示的序列组成。
在进一步的实施方式中,所述微生物包含一种或多种用于将碳利用重定向到戊糖磷酸途径中的基因修饰。所述修饰可能导致将碳导向糖酵解途径的蛋白质活性降低或抑制,从而将碳利用转向戊糖磷酸途径。
例如,所述微生物可以进一步被修饰以降低或抑制一种或多种选自下组的内源性蛋白的活性或水平:磷酸果糖激酶(phosphofructokinase)、丙酮酸激酶(pyruvatekinase)、甘油酸变位酶(glycerate mutase)、甘油醛-3-磷酸脱氢酶(glyceraldehyde-3-phosphate dehydrogenase)、6-磷酸葡糖酸脱水酶(6-phosphogluconoate dehydratase)和2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶(2-keto-3-deoxy-6-phosphogluconate aldolase)。这些蛋白分别由基因pfkA、pps、gpmA/gpmM、gapA、edd和eda编码。
优选地,所述微生物被基因地修饰以删除或减少分别编码磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、甘油醛-3-磷酸脱氢酶、6-磷酸葡糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶的一个或多个基因pfkA、pps、gpmA/gpmM、gapA、edd和eda的表达。所述修饰可以是部分或完全降低基因表达的任何修饰。当存在表达的部分减少时,与同一品系的野生型微生物中的表达相比,表达可以减少至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或更多。
可以使用CRISPR-Cas9系统或其他基因组修饰系统(如λred重组酶)进行基因修饰,以部分或完全抑制一个或多个基因的表达。所述基因修饰可导致在基因中引入完全或部分丧失功能的突变,优选完全丧失功能的突变。所述修饰可以是基因序列的完全或部分切除。
在某些实施方式中,pfkA、pps、gpmA/gpmM、gapA、edd和eda基因中只有一个被删除或敲除。优选pfkA或gpmA被删除或敲除。在进一步的实施方案中,所述微生物被基因修饰以删除或减少基因pfkA、pps、gpmA/gpmM、gapA、edd和eda中的两个、三个、四个、五个或所有基因的表达。在某些实施方式中,基因修饰导致基因表达缺失或减少:pfkA和gpmA;或edd和eda;或gpmM、edd和eda;或gpmA、edd和eda;或gpmM、edd、eda和pfkA;或gpmA、edd、eda和pfkA或pfkA、pps、gpmA/gpmM、edd和eda的全部。
在更进一步的实施方式中,所述微生物被基因修饰以增加戊糖磷酸途径的一种或多种蛋白质的水平或活性。
优选地,所述一种或多种蛋白质选自:磷酸葡萄糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡萄糖酸内酯酶、6-磷酸葡萄糖酸脱氢酶、转酮酶和转醛酶。这些蛋白分别由基因pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB编码。在特别优选的实施方式中,所述蛋白质是葡萄糖-6-磷酸脱氢酶。
在进一步的实施方式中,内源性NAD激酶(NADK,由yfjB编码)和/或可溶性吡啶核苷酸转氢酶(UdhA,由sthA编码)的水平或活性增加。
优选地,所述微生物蛋白质水平或活性的增加是通过增加编码戊糖磷酸途径的一种或多种蛋白质的核酸序列的表达来实现的,使得所述微生物产生的蛋白质水平相对于相同株系的野生型微生物而言增加。在替代的实施方式中,蛋白质水平或活性的增加是通过导致蛋白质活性增加的一个或多个点突变的引入来实现的。
在一个优选的实施方式中,过表达编码葡萄糖-6-磷酸脱氢酶zwf基因。在进一步的实施方案中,过表达编码6-磷酸葡萄糖酸脱氢酶的gnd基因。在其他实施方式中,过表达编码6-磷酸葡萄糖酸内酯酶的pgl基因。
磷酸葡糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡糖酸内酯酶、6-葡糖膦酸脱氢酶、转酮酶和转醛酶的过表达和水平或活性的增加可任选地通过修饰pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB中一种或多种的启动子序列来实现。在某些实施方式中,pgm、zwf、pgl、gnd、tktB或tktA以及、talA或talB中一种或多种的内源性启动子被外源性启动子取代,以增加基因的表达。在某些实施方式中,pgm、zwf、pgl、gnd、tktB或tktA,以及talA或talB中一种或多种的内源性启动子被调节微生物中不同基因表达的内源性启动子取代。在替代的实施方案中,pgm、zwf、pgl、gnd、tktB或tktA,以及talA或talB中一种或多种的内源性启动子被外源性启动子取代。外源性启动子可以调节同源的基因在非同源的微生物中的表达,或者可以调节非同源的蛋白质在非同源的微生物中的表达。
在特别优选的实施方案中,pgm、zwf、pgl、gnd、tktB或tktA,以及talA或talB中一种或多种的内源性启动子被选自以下的启动子取代:osmY启动子、gapA启动子、nirB启动子和nar启动子。
更进一步,可以用编码来自另一微生物物种的异源蛋白的重组构建体转化宿主细胞,例如为了增加戊糖磷酸途径的相关酶的水平或活性。
重组的构建体可使外源性基因的表达伴随内源的基因的表达。或者,可以将重组的构建体稳定地导入微生物基因组,使得内源性基因序列被外源性基因序列取代。
磷酸葡糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡糖酸内酯酶、6-葡糖膦酸脱氢酶、转酮酶和转醛酶的过表达和水平或活性的增加可以通过用编码同源的蛋白的外源性基因补充或替换编码所述蛋白的内源性基因来实现。在某些实施例中,内源性的zwf基因被来自运动发酵单胞菌(Zymomonas mobilis)的zwf基因取代。优选地,所述微生物是大肠杆菌,并且大肠杆菌zwf基因被来自运动发酵单胞菌(Zymomonas mobilis)的zwf基因取代。在另外的实施例中,gnd基因被来自谷氨酸棒杆菌(Corynebacterium glutamicum)的gnd基因取代。优选地,所述微生物是大肠杆菌,编码转酮酶和转醛酶的基因被来自酿酒酵母(Saccharomyces cerevisiae)的同源的基因补充或取代。优选地,所述微生物是大肠杆菌,并且大肠杆菌gnd基因被来自谷氨酸棒杆菌的gnd基因取代。此外,内源性的gapA基因(编码甘油醛-3-磷酸脱氢酶)被来自丙酮丁醇梭菌(Clostridium aceteobutylicum)的gapC基因取代。优选地,微生物是大肠杆菌,并且大肠杆菌gapA基因被来自丙酮丁醇梭菌(Clostridium aceteobutylicum)的gapC基因取代。
优选地,编码磷酸葡糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡糖酸内酯酶和6-葡糖膦酸脱氢酶的一个或多个基因的表达增加至少约1.5倍、至少约2倍、至少约3倍、至少约5倍或更多。
在进一步的实施方式中,重组的微生物被修饰以代谢蔗糖用于能量消耗。在微生物为大肠杆菌的实施方式中,优选地对微生物基因修饰以表达分别编码来自代谢蔗糖的大肠杆菌菌株的蔗糖水解酶和蔗糖渗透酶的cscA和cscB基因。此外,大肠杆菌微生物可以被基因修饰以增加内源性的大肠杆菌磷酸葡萄糖变位酶(pgm)或木糖异构酶(xylA)的水平或活性。所述基因修饰可以是增加内源性基因的表达(例如,通过修饰启动子区)或通过引入和表达编码该基因的外源性核酸。
在进一步的实施方式中,所述微生物被修饰以表达来自肠系膜明串珠菌(Leuconostoc mesenteroides)的蔗糖磷酸化酶。
在本文所述的任何需要表达外源性基因的实施方式中,所述基因可以进行密码子优化以在微生物中表达。
当所述微生物是重组大肠杆菌微生物时,所述微生物可以是能够表达外源性核酸序列的任何大肠杆菌菌株。在某些优选的实施方式中,大肠杆菌菌株选自任何K12衍生的或W衍生的菌株。在某些实施方式中,大肠杆菌菌株选自:DH5α(DH5alpha)。
在另一方面,本发明提供了一种生产氢气的方法,所述方法包括:
-提供包括一种或多种重组多核苷酸的宿主细胞,所述重组多核苷酸包括编码Fe-Fe-依赖性氢化酶的核酸序列,其中所述核酸序列与一种或多种启动子可操作地连接,以使所述核酸序列能够在所述微生物中表达,
-将宿主细胞与外源性因子接触以使氢化酶能够成熟和活化;
-在合适的条件下培养宿主细胞以使其能够产生氢气。
优选地,所述一种或多种因子是小分子的形式。使氢化酶成熟和活化的因子的例子为含有氮杂二硫代酸桥的[2Fe]-亚位点模拟物。此类因素在例如Esselborn等人,(2013)Nat Chem Biol 9(10):607-609and Berggren等人,(2013)Nature,499:66-69中有所描述,其内容通过引用并入本文。
此外,本发明提供了一种生产氢气的方法,所述方法包括:
-提供包含一种或多种重组的多核苷酸的宿主细胞,所述重组的多核苷酸包含编码Fe-Fe依赖性氢化酶的核酸序列和至少一种能够使所述氢化酶成熟和活化的装配蛋白;
o其中所述核酸序列与一种或多种启动子可操作地连接,以使所述核酸序列能够在所述微生物中表达,和
o其中外源性核酸序列进行了密码子优化以提供氢化酶在微生物中的优化表达。
另一方面,本发明提供了一种生产氢气的方法,所述方法包括:
-提供一种或多种多核苷酸,所述多核苷酸包含编码Fe-Fe-依赖性氢化酶的核酸序列和任选的至少一种用于使所述氢化酶能够成熟和活化的装配蛋白,其中所述核酸序列与启动子可操作地连接以使所述核酸序列能够表达,并且其中所述核酸序列进行了密码子优化以在异源宿主细胞中表达;
-提供异源宿主细胞;
-用多核苷酸转化或转染宿主细胞;
-提供细胞培养基;和
-在足以表达所述多核苷酸的条件下,在所述细胞培养基中培养所述转化或转染的宿主细胞。
在又一方面,本发明提供了一种最大化表达一种产氢的Fe-Fe氢化酶,优选地异源宿主细胞中的A1 Fe-Fe氢化酶的方法,所述方法包括:
-提供多核苷酸,所述多核苷酸包含编码Fe-Fe-依赖性氢化酶的核酸序列和用于使所述氢化酶能够成熟和活化的至少一种装配蛋白,其中所述核酸序列与启动子可操作地连接并且进行了密码子优化以使所述核酸序列能够在异源宿主细胞中表达;
-提供异源宿主细胞;
-用所述多核苷酸转化或转染所述宿主细胞;
-提供细胞培养基;和
-在足以表达所述多核苷酸的条件下,在所述细胞培养基中培养所述转化或转染的宿主细胞。
优选地,所述Fe-Fe-依赖性氢化酶是A1类Fe-Fe氢化酶。
优选地,所述Fe-Fe依赖性氢化酶是HydA(Hyd1)或与其功能等同的同系物或衍生物。
在优选的实施方式中,Fe-Fe-依赖性氢化酶包含选自下组的HydA蛋白的氨基酸序列:莱茵衣藻、卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌、双酶梭菌、阿魏梭菌、假毛癣菌、香橼酸拉克氏梭菌、梭形拉克氏梭菌、发酵粘土弯菌、冰岛热脱硫弧菌、华德萨特氏菌、拜氏梭菌、溃疡梭杆菌、酪丁酸梭菌、产气荚膜梭菌、索氏鲸杆菌、拜氏梭菌、狗肠梭菌、肠道梭状芽孢杆菌、气肿疽梭菌、粪碱纤维单胞菌、热纤小孢霉、耐格里原虫、小球藻、结节性发热杆菌、石油热袍菌、莱丁卡热袍菌、嗜泥硫微螺菌、加利福尼亚钙细菌、坏死梭杆菌、Omnitrophusfodinae、脂肪酸特异互养栖热菌、德氏氨螺菌、热液口脱硫肠状菌、死亡梭杆菌、库氏脱硫肠状菌、和植物发酵拉克氏菌或与其功能等同的同系物或衍生物。优选地,HydA蛋白选自的组包括:莱茵衣藻、卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌和双酶梭菌,及与其功能等效的同系物。更优选地,HydA蛋白选自莱茵衣藻或与其功能等同的同系物或衍生物。
优选地,所述至少一种装配蛋白包含选自以下的蛋白:HydEF和/或HydG。更优选地,外源性核酸序列包含编码装配蛋白HydEF和HydG的序列。在一个特别优选的实施方式中,HydEF和HydG蛋白包含来自莱茵衣藻的HydEF和HydG蛋白或其功能等同的同系物或衍生物的氨基酸序列。
因此,在优选的实施方式中,本发明提供了一种生产氢气的方法,该方法包括:
-提供包含一种或多种重组的多核苷酸的宿主细胞,所述重组的多核苷酸包含编码莱茵衣藻多肽HydEF、HydG和HydA的核酸序列,
o其中所述核酸序列与启动子可操作地连接以使所述核酸序列能够表达,
o其中所述核酸序列进行了密码子优化以在异源宿主中表达;和
-在合适的培养基中在影响多核苷酸表达的条件下培养所述宿主细胞。
另一方面,本发明提供了一种生产氢气的方法,所述方法包括:
-提供一种或多种多核苷酸,所述多核苷酸包含编码莱茵衣藻多肽HydEF、HydG和HydA的核酸序列,其中所述核酸序列与启动子可操作地连接以实现所述核酸序列的表达,并且其中所述核酸序列进行了密码子优化以在异源宿主细胞中表达;
-提供宿主细胞;
-用多核苷酸转化或转染宿主细胞;
-提供细胞培养基;和
-在足以表达所述多核苷酸的条件下,在所述细胞培养基中培养所述转化或转染的宿主细胞。
在另一个方面,本发明提供了一种在异源宿主细胞中最大化来自莱茵衣藻的产氢Fe-Fe氢化酶的表达的方法,所述方法包括:
-提供多核苷酸,所述多核苷酸包含编码莱茵衣藻多肽HydEF、HydG和HydA的核酸序列,其中所述核酸序列与启动子可操作地连接并且进行了密码子优化以使所述核酸序列能够在异源宿主细胞中表达;
-提供异源宿主细胞;
-用所述多核苷酸转化或转染所述宿主细胞;
-提供细胞培养基;和
-在足以表达所述多核苷酸的条件下,在所述细胞培养基中培养所述转化或转染的宿主细胞。
优选地,所述异源宿主细胞是大肠杆菌细胞,并且所述核酸序列进行了密码子优化以在大肠杆菌中表达。优选地,所述多核苷酸中的启动子用于在大肠杆菌中表达多核苷酸。
在上述任何方面的优选实施方式中,重组多核苷酸包含编码铁氧还蛋白NADP还原酶和铁氧还蛋白的核酸序列,或与其功能等同的同系物或衍生物。
优选地,FNR的来源是含有铁氧还蛋白还原酶的黄素,其利用NADPH作为还原剂来还原铁氧还蛋白。更优选地,铁氧还蛋白来自莱茵衣藻,FNR为能够还原莱茵衣藻铁氧还蛋白的任何FNR。在一个特别优选的实施方式中,FNR和铁氧还蛋白包含来自莱茵衣藻的氨基酸序列或与其功能等同的同系物或衍生物。
宿主细胞可以为适合用于表达重组的蛋白的任何微生物。在某些实施方式中,宿主细胞选自的组包括:大肠杆菌、枯草芽孢杆菌、乳杆菌属、或链球菌属。在优选的实施方式中,所述微生物是大肠杆菌(E coli)的菌株。
在某些实施方式中,宿主细胞部分或完全灭活和/或无活力。
如本文所用,编码HydEF、HydG、HydA、铁氧还蛋白NADP还原酶和铁氧还蛋白的核酸序列的组合也可称为产氢基因簇(HPGC)。
在任何实施方式中,上述方法可进一步包括利用基因修饰的宿主细胞,或修饰微生物或宿主细胞,或使微生物或宿主细胞与试剂接触以降低或抑制一种或多种内源性宿主细胞蛋白的活性或水平,所述内源性宿主细胞蛋白选自的组包括:磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、6-磷酸葡糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶。
用于降低或抑制磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、6-磷酸葡糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶中的一种或多种的活性或水平的试剂可选自:能够降低一种或多种蛋白质的活性或水平的小分子、肽、抗体、干扰RNA,例如反义RNA、microRNA、shRNA或siRNA。
在优选的实施方式中,所述方法包括使微生物或宿主细胞与一种对微生物或宿主细胞进行基因修饰的试剂接触或结合,使得pfkA、pps、gpmA/gpmM、gapA、edd和eda(分别编码磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、甘油醛-3-磷酸脱氢酶、6-磷酸葡糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶)中的一种或多种的水平或活性部分或完全降低。例如,所述试剂可以包含用于与CRISPR-Cas9或其它基因组编辑系统(例如λred重组酶)组合以缺失部分或全部基因的gRNA分子。
在进一步的实施方式中,所述方法还包括对所述微生物或宿主细胞进行基因修饰或已对其进行修饰以增加戊糖磷酸途径的一种或多种蛋白质的水平或活性。优选地,所述一种或多种蛋白质选自:磷酸葡萄糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡萄糖酸内酯酶、6-磷酸葡萄糖酸脱氢酶、转酮酶和转醛酶。这些基因分别由基因pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB编码。在特别优选的实施方案中,所述蛋白质是葡萄糖-6-磷酸脱氢酶。
在进一步的实施方式中,内源性NAD激酶(NADK,由yfjB编码)和/或可溶性吡啶核苷酸转氢酶(UdhA,由sthA编码)的水平或活性增加。
优选地,所述方法包括修饰所述微生物或宿主细胞以包含用于过表达编码戊糖磷酸途径的一种或多种蛋白质的基因的核酸序列,使得所述微生物产生的蛋白质的水平相对于相同菌株的野生型微生物增加。在替代的实施方式中,蛋白质水平或活性的增加是通过引入导致蛋白质活性增加的一个或多个点突变来实现的。
在一个优选的实施方式中,编码葡萄糖-6-磷酸脱氢酶的基因zwf被过表达。在进一步的实施方式中,编码6-磷酸葡萄糖酸脱氢酶的基因gnd被过表达。在其他实施方式中,编码6-磷酸葡萄糖酸内酯酶pgl的基因被过表达。在其它实施方案中,编码甘油醛-3-磷酸脱氢酶的基因gapA被过表达。过表达可选择性地通过修饰pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB中一种或多种的启动子序列来实现。
在某些实施方式中,pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB中一种或多种的内源性启动子被外源性启动子取代,以增加基因的表达。在某些实施方式中,pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB中一种或多种的内源性启动子被调节微生物中不同基因表达的内源性启动子取代。在替代实施方案中,pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB中一种或多种的内源性启动子被外源性启动子取代。外源性启动子可以调节同源的基因在非同源的微生物中的表达,或者可以调节非同源的蛋白质在非同源的微生物中的表达。
在特别优选的实施方式中,pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB中一种或多种的内源性启动子被选自以下的启动子取代:osmY启动子、gapA启动子、nirB启动子和nar启动子。
磷酸葡糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡糖酸内酯酶、6-葡糖膦酸脱氢酶、转酮酶和转醛酶的过表达和水平或活性的增加也可以通过用编码同源的蛋白的外源性基因替换编码所述蛋白的内源性基因来实现。
优选地,编码磷酸葡糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡糖酸内酯酶和6-葡糖膦酸脱氢酶的一个或多个基因的表达增加至少约1.5倍、至少约2倍、至少约3倍、至少约5倍或更多。
在更进一步实施方案中,修饰重组的微生物或宿主细胞以代谢蔗糖来消耗能量。在所述微生物是大肠杆菌的实施方式中,优选对微生物进行基因修饰以表达分别编码来自代谢蔗糖的大肠杆菌菌株的蔗糖水解酶和蔗糖渗透酶的cscA和cscB基因。此外,还可以对大肠杆菌微生物进行基因修饰,以增加内源性大肠杆菌磷酸葡萄糖变位酶(pgm)或木糖异构酶(xylA)的水平或活性。基因修饰可以是增加内源性基因的表达(例如,通过修饰启动子区)或通过引入和表达编码所述基因的外源性核酸。
在进一步的实施方式中,修饰微生物以表达来自肠系膜明串珠菌的蔗糖磷酸化酶。
在宿主细胞是大肠杆菌的实施方式中,大肠杆菌微生物可以是能够表达外源性核酸序列的任何大肠杆菌菌株。在某些优选的实施方式中,大肠杆菌菌株选自任何K12衍生的或W衍生的菌株。在某些实施方式中,大肠杆菌菌株选自:DH5α(DH5alpha)。
在进一步的实施方式中,本文所述的方法还包括在优化的条件下培养微生物或宿主细胞,以表达本文所述的产氢基因簇(HPGC),从而增加微生物的氢产量。在一个实施例中,所述方法包括在厌氧条件下培养宿主细胞。本领域技术人员将熟悉在厌氧条件下培养细胞的方法,包括通过添加中性气体作为还原剂。
此外,培养条件可以包括向培养基中添加三价铁(铁III)或亚铁(铁II)。在优选的实施方式中,将亚铁(铁II)以至少约20μM或更高,优选不超过约50μM的浓度加入到培养基中。
培养条件优选在不超过37℃,更优选低于约35℃,低于约32℃,最优选低于约30℃下进行。
本发明还提供了用于产生分子氢的系统中的各种核酸构建体或多核苷酸。
在一个实施方式中,本发明提供了一种核酸构建体或多核苷酸,其包含编码多肽HydEF、HydG和HydA的核苷酸序列,其中所述核酸序列与启动子可操作地连接以使所述核酸序列能够表达,并且其中所述核酸序列进行了密码子优化以在异源宿主中表达。优选地,核酸序列进行了密码子优化以在大肠杆菌中表达。优选地,HydEF和HydG多肽来自莱茵衣藻。
在优选的实施方案中,在本发明的核酸构建体中编码HydA蛋白的核酸编码来自生物体的HydA蛋白的氨基酸序列,所述HydA蛋白来自选自下组的生物体:莱茵衣藻、卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌、双酶梭菌、阿魏梭菌、假毛癣菌、香橼酸拉克氏梭菌、梭形拉克氏梭菌、发酵粘土弯菌、冰岛热脱硫弧菌、华德萨特氏菌、拜氏梭菌、溃疡梭杆菌、酪丁酸梭菌、产气荚膜梭菌、索氏鲸杆菌、拜氏梭菌、狗肠梭菌、肠道梭状芽孢杆菌、气肿疽梭菌、粪碱纤维单胞菌、热纤小孢霉、耐格里原虫、小球藻、结节性发热杆菌、石油热袍菌、莱丁卡热袍菌、嗜泥硫微螺菌、加利福尼亚钙细菌、坏死梭杆菌、Omnitrophus fodinae、脂肪酸特异互养栖热菌、德氏氨螺菌、热液口脱硫肠状菌、死亡梭杆菌、库氏脱硫肠状菌、和植物发酵拉克氏菌或与其功能等同的同系物或衍生物。优选地,HydA蛋白选自的组包括:莱茵衣藻、卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌和双酶梭菌,及与其功能等效的同系物。更优选地,HydA蛋白选自莱茵衣藻或与其功能等同的同系物或衍生物。
本发明还提供了包含编码产氢基因簇(HPGC)的核酸序列的多核苷酸,其中HPGC包含编码HydEF、HydG、HydA、铁氧还蛋白NADP还原酶和铁氧还蛋白的基因。优选地,所述核酸编码FNR,所述FNR为含有铁氧还蛋白的黄素还原酶,其利用NADPH作为还原剂来还原铁氧还蛋白。更优选地,所述核酸编码来自莱茵衣藻的铁氧还蛋白,并编码FNR,所述FNR为能够还原来自莱茵衣藻的铁氧还蛋白的任何FNR。在一个特别优选的实施方式中,所述多核苷酸包含编码来自莱茵衣藻的FNR和铁氧还蛋白或与其功能等同的同系物或衍生物的核酸。
在一个特别优选的实施方式中,包含HPGC的多核苷酸的序列包含、由或基本上由SEQ ID NO:10或30-40中所示的核苷酸序列组成。
本发明还提供了当使用时,或用于系统中以生产氢气的如本文所述的微生物。因此,本发明提供了一种生产氢气的系统,其中所述系统包括:
-如本文所述的重组的微生物的培养物或群体;
-重组的微生物使用的原料,用于诱导一种或多种蛋白质的表达,以使微生物能够产生氢气。
任选地,所述系统还包括用于储存或转移由重组的微生物产生的氢的装置。
优选地,原料是基于碳水化合物的原料,例如葡萄糖或蔗糖或任何其它碳水化合物源。
本发明还提供了一种用于生产氢气的生物反应器,其包括:容器,其包括本文所述的生产氢气的系统,所述系统包括本发明的产氢气微生物的悬浮液、用于提供供重组微生物使用的碳源的原料和用于从所述悬浮液中分离或提取氢气的装置。
本发明还提供了当使用时,或用于系统中以产生电的如本文所述的微生物。因此,本发明提供了一种用于从氢气产生电的系统或设备,其中所述系统或设备包括:
-如本文所述的重组的微生物的培养物或群体;
-供所述重组的微生物使用的原料,用于诱导一种或多种蛋白质的表达,以使所述微生物能够产生氢气;
-氢燃料电池;
-用于将重组的微生物产生的氢气转移到氢燃料电池的装置。
本发明还提供了一种产生电的方法,所述方法包括操作包含本文所述重组的微生物的系统或装置,或利用根据本文所述方法产生的氢气。
本发明还提供了如本文所述的重组的微生物在用于从氢气产生电的系统或装置中的用途。
如本文所用,除上下文另有要求外,术语“包括”和该术语的变体,例如“包含”,不旨在排除另外的添加剂、组分、整体或步骤。
根据下面通过示例并参考附图给出的描述,本发明的进一步的方面和在前面段落中描述的方面的进一步的实施例将从下面的描述中变得显而易见。
附图说明
图1为野生型和表达产氢基因簇(HPGC)的突变株的氢气产量。向50mL大肠杆菌培养液中加入20mM葡萄糖后的H2产气量。不含产氢基因簇(HPGC)的DH5α在这些条件下不产生氢气。4个株系带有质粒pHPGC的DH5α;带有质粒pHPGC的DH5αΔpfk;带有质粒pHPGC的DH5αΔgpmA;和含有质粒pH1-HEFG的DH5α(不含petF-FNR的pHPGC),在加入葡萄糖后迅速开始积累氢气。气相氢浓度采用气相色谱法测定。
图2为野生型和表达产氢基因簇的突变株中总有机酸发酵产物(琥珀酸+丙酮酸+乳酸)的积累。添加葡萄糖后的有机酸积累用于HPGC制氢。
图3为包含本发明微生物的示例性装置的示意图。
图4为相对于带有pHPGC的野生型大肠杆菌DH5α(对照)的各种带有pHPGC的重组的微生物的氢气生产速率。经过基因修饰,通过删除gpmM和gpmA来减少葡萄糖通过糖酵解途径下游的碳流的大肠杆菌产氢速率(L/h)。随着gpmA和gpmM的缺失,产氢速率增加。gnd和zwf表达的增加也提高了氢气生产速率。
图5为相对于带有pHPGC的野生型大肠杆菌DH5α(对照)的各种带有pHPGC的重组的微生物产生的氢气与二氧化碳的比率。增加zwf、Gp::zwf的表达或降低pfk活性,Δpfk,会增加氢气与CO2的比例,从而增加通过戊糖磷酸途径的流量。由于gnd编码的蛋白位于zwf编码蛋白的下游,因此与wt DH5相比,该突变体中gnd活性的增加,Gp::gnd,对H2与CO2比值没有显著影响。
图6为经修饰的DH5αcscAB利用蔗糖制造氢气。具有HPGC的菌株DH5αcscAB能够像具有HPGC的阳性对照W菌株一样利用蔗糖制造氢气。具有HPGC的野生型DH5α不能利用蔗糖,当蔗糖供应给该菌株时,检测不到氢气生成。
具体实施方式
应当理解在本说明书中公开和定义的本发明延伸到文本或附图中提到或明显的两个或多个单独的特征的所有可选组合。所有这些不同的组合构成了本发明的各种可选的方面。
现在将详细参考本发明的某些实施方式。虽然将结合实施方式描述本发明,但是应当理解其目的不是将本发明限制于这些实施方式。相反,本发明旨在覆盖所有替换、修改和等同物,其可以包括在由权利要求限定的本发明的范围内。
本领域技术人员将认识到许多与本文所述相似或等同的方法和材料可用于本发明的实践。本发明决不限于所描述的方法和材料。应当理解在本说明书中公开和定义的本发明延伸到文本或附图中提到或显而易见的两个或多个单独的特征的所有可选组合。所有这些不同的组合构成了本发明的各种可选的方面。
此处引用的所有专利和出版物都以引用整体的方式并入本文。
为了解释本说明书,以单数形式使用的术语也将包括复数形式,反之亦然。
微生物能够利用通常被认为氢化酶的酶类合成分子氢。为了利用这些酶产生氢气的能力,研究人员努力在异源表达系统中表达来自各种微生物和藻类的氢化酶。通常,该方法包括从藻类和“极端微生物”中筛选各种氢化酶。然而,由于这些氢化酶及其同源成熟蛋白,以及在异源生物体中表达时产生的Fe-Fe氢化酶复合物的不稳定性,使用这种类型方法产生足够量氢的努力受到了阻碍。
为了解决这些限制,本领域的其他人已经努力在异源生物体中表达氢化酶时共表达来自非同源的生物体的成熟蛋白。然而,这种方法通常不能克服在商业系统中获得足够水平的氢气的困难。
其他人试图关注表达的氢化酶的类型,例如,试图表达Ni-Fe氢化酶而不是Fe-Fe氢化酶。已证明此类系统在体外具有功能性且仅利用NADPH依赖性Ni-Fe氢化酶和来自戊糖磷酸途径酶的市售酶混合物即可有效产生氢气。然而,由于提供额外酶的成本,此类系统尚未证明具有商业可行性。此外,氢气生产速率对于商业生产来说太慢。
本发明人已经鉴定了一种从在异源宿主细胞中表达的藻类基因最大化产生分子氢的新方法。本发明人采用的方法允许从各种微生物稳定地生产Fe-Fe氢化酶复合物。此外,本发明人相信,他们的方法提供了随时间增加的氢气产生速率和增加的产率(每投入的产量)。本发明人的方法代表了相对于先前用于产生生物氢的非优化方法的重大进步。
产氢基因簇
本发明包括提供如本文所述的微生物,其具有编码在所述微生物中产生氢所需的分子机制的组分的各种核酸序列。此外,本发明提供了包含这些核酸序列的基因修饰的微生物。
特别地,本发明包括提供具有编码HydEF、HydG和HydA蛋白的核酸序列(包括重组的多核苷酸)的宿主细胞。在优选的实施方式中,宿主细胞还提供有编码铁氧还蛋白NADP还原酶(FNR)和铁氧还蛋白(petF)的核酸。应理解,氢气可由本文所述的微生物产生,其中所述微生物经修饰以表达编码HydA的核酸序列,且其中所述微生物包含内源性铁氧还蛋白。
此外,氢化酶的成熟可以使用小分子完成,例如含有氮杂二硫代酸桥的[2Fe]-亚位点模拟物。此类因子在例如在Esselborn等人,(2013)Nat Chem Biol 9(10):607-609,and Berggren等人,(2013)Nature,499:66-69中有所描述,其内容通过引用并入于此。
然而,在优选的实施方案中,微生物优选地被修饰以表达本文定义的HPGC的组分。
如本文所用,产氢基因簇(HPGC)优选包含编码HydA、HydEF、HydG、铁氧还蛋白NADP还原酶和铁氧还蛋白的核酸序列,其中HydA指Fe-Fe氢化酶(优选A1亚类),并且HydEF和HydG指形成活性Fe-氢化酶所需的蛋白质的成熟和装配复合体。
如本文所用,HydA指任何Fe-Fe-氢化酶蛋白HydA,也称为铁氢化酶或铁氢化酶HydA1或Hyd1。这种蛋白质由基因hyd1编码。
技术人员将熟悉不同氢化酶的分类方法,包括确定一个给定氢化酶是否是Fe-Fe氢化酶(包括A1类)的方法,以区分于Fe-氢化酶的Ni-Fe氢化酶。例如,在
Figure BDA0003944744060000171
等人,(2016)Scientific Reports,6:34212中描述了此类方法。
所述HydA蛋白可以是来自微生物的HydA蛋白,所述微生物选自由以下各项组成的组:莱茵衣藻、卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌、双酶梭菌、阿魏梭菌、假毛癣菌、香橼酸拉克氏梭菌、梭形拉克氏梭菌、发酵粘土弯菌、冰岛热脱硫弧菌、华德萨特氏菌、拜氏梭菌、溃疡梭杆菌、酪丁酸梭菌、产气荚膜梭菌、索氏鲸杆菌、拜氏梭菌、狗肠梭菌、肠道梭状芽孢杆菌、气肿疽梭菌、粪碱纤维单胞菌、热纤小孢霉、耐格里原虫、小球藻、结节性发热杆菌、石油热袍菌、莱丁卡热袍菌、嗜泥硫微螺菌、加利福尼亚钙细菌、坏死梭杆菌、Omnitrophusfodinae、脂肪酸特异互养栖热菌、德氏氨螺菌、热液口脱硫肠状菌、死亡梭杆菌、库氏脱硫肠状菌、和植物发酵拉克氏菌或与其功能等同的同系物或衍生物。
优选地,HydA蛋白选自由以下各项组成的组:莱茵衣藻、卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌和双酶梭菌,及与其功能等效的同系物。更优选地,HydA蛋白选自莱茵衣藻或与其功能等同的同系物或衍生物。
在UniProt登录号Q9FYU1下提供了莱茵衣藻HydA蛋白序列的示例性序列,在登录号AJ308413、CAC83731.1(EBI)和XP_001693376.1下可以找到编码所述蛋白的示例性核酸序列。
编码HydA的示例性核酸序列在SEQ ID NO:6中提供。用于使hydA表达的示例性启动子在SEQ ID NO:5中提供。
为来自卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌和双酶梭菌的HydA提供序列信息的示例性登陆号分别包括XP002956049、XP001709915、XP008860420、WP013388849(和XP002948483)、XP001330775、WP006942403、WP004697562、WP005375825和WP021432477。
编码来自卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌和双酶梭菌的HydA的示例性密码子优化核酸序列(包括限制性位点)在SEQ ID NO:18至27中提供。
如本文所用,HydEF优选指莱茵衣藻Fe-氢化酶装配蛋白HydEF,也称为铁氢化酶装配蛋白HydEF。所述蛋白由基因hydEF编码。莱茵衣藻HydEF蛋白序列的示例性序列在UniProt登陆号Q6PSL5下提供,编码所述蛋白的示例性核酸序列可在登陆号DS496119、EDP05198.1(EBI)和XP_001691465.1下找到。
编码HydEF的示例性核酸序列在SEQ ID NO:2中提供。用于使hydEF能够表达的示例性启动子在SEQ ID NO:1中提供。.
本文所用的HydG是指莱茵衣藻Fe-氢化酶装配蛋白HydG,也称铁氢化酶装配蛋白HydG。所述蛋白由基因hydG编码。莱茵衣藻HydG蛋白序列的示例性序列在UniProt登陆号Q6PSL4下提供,编码所述蛋白的示例性核酸序列可在登陆号DS496119、EDP05052.1(EBI)和XP_001691319.1下找到。
编码HydG的示例性核酸序列在SEQ ID NO:4中提供。用于使hydG能够表达的示例性启动子在SEQ ID NO:3中提供。
本文所用的铁氧还蛋白是指由petF基因编码的莱茵衣藻铁氧还蛋白。莱茵衣藻铁氧还蛋白的蛋白序列的示例性序列在UniProt登陆号A8IV40下提供,编码所述蛋白的示例性核酸序列可在登陆号DS496124、EDP03827.1(EBI)和XP_001692808.1下找到。
编码铁氧还蛋白的示例性核酸序列在SEQ ID NO:8中提供。用于使petF能够表达的示例性启动子在SEQ ID NO:7中提供。
本文所用莱茵衣藻铁氧还蛋白NADP还原酶(FNR)指EC:1.18.1.2。所述蛋白由基因petH或fnr1编码。莱茵衣藻FNR蛋白序列的示例性序列在UniProt登陆号A8J6Y8和P53991下提供,编码所述蛋白的示例性核酸序列可在登陆号DS496140、EDP00292.1(EBI)和XP_001697352.1下找到。
编码FNR的一个示例性核酸序列在SEQ ID NO:9中提供。
在优选的实施方式中,编码HydEF、HydG、HydA、铁氧还蛋白和FNR蛋白的核酸序列在单个多核苷酸构建体中提供。在一个实施例中,所述多核苷酸具有如SEQ ID NO:10中所述的核酸序列。葡萄糖氧化转向磷酸戊糖途径
本发明人已经发现,将磷酸戊糖途径与糖酵解途径分离可以使碳水化合物最佳地转化为氢气。因此,在优选的实施方式中,本发明的微生物被进一步修饰以减少或缺失编码磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、6-磷酸葡萄糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡萄糖酸醛缩酶的一种或多种内源性基因的表达。这些蛋白分别由基因pfkA、pps、gpmA、gpmM、gapA、edd和eda编码,
此外,本发明的方法包括使微生物与一种或多种用于抑制蛋白质磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、6-磷酸葡萄糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡萄糖酸醛缩酶中的一种或多种的活性或水平的试剂接触。
如本文所用,磷酸果糖激酶(E.C.2.7.1.11和E.C.2.7.1.105),也称为PFK,是一种在糖酵解中磷酸化果糖6-磷酸的激酶。磷酸果糖激酶催化果糖-6-磷酸磷酸化为果糖-1,6-二磷酸,这是糖酵解途径中的一个关键调节步骤。
如本文所用,由pps基因编码的丙酮酸激酶(E.C.2.7.1.40)是催化磷酸基团从磷酸烯醇式丙酮酸(PEP)向腺苷二磷酸(ADP)转移的酶,产生一分子丙酮酸和一分子ATP。
如本文所用,甘油酸变位酶可能是指2,3-二膦酸盐依赖性(dPGM,GpmA)或辅因子非依赖性(iPGM,GpmM)磷酸甘油酸变位酶。2,3-二磷酸甘油酸依赖性磷酸甘油酸变位酶由gpm基因编码并催化反应2-磷酸-d-甘油酯
Figure BDA0003944744060000191
3-磷酸-d-甘油酯。2,3-二磷酸甘油酸非依赖性磷酸甘油酸变位酶(也称为gpmC;pgmI;gpmI或yibO)由gpmM基因编码并催化相同的反应。iPGM酶的比活性明显较低。因此,根据本发明的方法,优选地以pgmA为目标进行删除或抑制。
如本文所用,6-磷酸葡糖酸脱水酶(E.C.4.2.1.12)是催化反应6-磷酸-d-葡糖酸盐
Figure BDA0003944744060000192
2-脱氢-3-脱氧-6-磷酸-d-葡糖酸盐+H2O的酶。常用的其他名称包括6-磷酸葡萄糖酸脱水酶(6-phosphogluconate dehydratase)、6-磷酸葡萄糖酸脱水酶(6-phosphogluconicdehydrase)、葡萄糖酸-6-磷酸(gluconate-6-phosphate)、葡萄糖酸6-磷酸脱水酶(gluconate6-phosphate dehydratase)、6-磷酸葡萄糖酸脱水酶(6-phosphogluconatedehydrase)和6-磷酸-D-葡萄糖酸水解酶(6-phospho-D-gluconate hydro-lyase)。
如本文所用,通常称为KDPG醛缩酶的2-酮-3-脱氧-6-磷酸葡萄糖酸盐醛缩酶(E.C.4.1.2.14)是催化反应2-脱氢-3-脱氧-d-葡萄糖酸盐6-磷酸
Figure BDA0003944744060000193
丙酮酸盐+D-甘油醛3-磷酸的酶。
应当理解,可以通过将本发明的微生物或宿主细胞与降低或抑制蛋白质水平或活性的任何试剂接触而抑制磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、6-磷酸葡糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶中的任何一种或多种。抑制可以是直接的,也可以是间接的。抑制可以是部分的或完全的。
抑制剂优选选自:小分子、肽、抗体、干扰RNA,例如反义RNA、microRNA、shRNA、siRNA,其可以降低一种或多种蛋白质的活性或水平。
在优选的实施方式中,对微生物或宿主细胞进行基因修饰,以完全删除或部分减少一种或多种基因pfkA、pps、gpmA、gpmM、gapA、edd和eda的表达。
技术人员将熟悉各种删除或修饰基因序列以部分或完全减少基因表达的技术。在某些实施方式中,通过使用CRISPR-Cas9系统进行基因修饰。可采用的其他基因组编辑技术包括λred重组酶系统、随机诱变和选择以及多重自动基因组工程(MAGE)。在一个实施例中,可使用CRISPR-Cas9和λred重组酶的组合,如Reisch CR and Prather KL,(2015)The no-SCAR(Scarless Cas9 Assisted Recombineering)system for genome editing inEscherichia coli,Sci Rep.14(5):15096中所概述。
pfkA、pps、gpmA、gpmM、gapA、edd和eda基因中任一种或多种的表达降低可以是表达降低至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%。
删除或表达减少的基因优选地为pfk或gpmA。在其他实施方式中,pfk和gpmA或pfk和gpmM均被删除。此外,edd和eda都可能被删除。在替代实施方式中,删除了gpmM和/或gpmA与edd和eda的组合。在更进一步的实施方式中,pfk、edd-eda和gpmA或gpmM被删除。
为了进一步将葡萄糖氧化导向戊糖磷酸途径,并且为了使氢气的产生速率和产量最大化,本发明还考虑了各种内源性基因的表达或活性的增加(或对它们编码的蛋白质的抑制)。
因此,在优选的实施方式中,进一步修饰本发明的微生物以增加编码磷酸葡糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡糖酸内酯酶、6-葡糖膦酸脱氢酶NAD激酶和可溶性吡啶核苷酸转氢酶的一种或多种基因的水平或活性。这些蛋白分别由基因pgm、zwf、pgl、gnd、yfjB和sthA编码。此外,本发明的方法包括增加一种或多种蛋白质磷酸葡萄糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡萄糖酸内酯酶和6-磷酸葡萄糖酸脱氢酶的表达。
如本文所用,磷酸葡萄糖变位酶(PGM)(E.C.5.3.1.9)也被称为葡萄糖-磷酸异构酶、磷酸葡萄糖异构酶/磷酸葡萄糖异构酶(PGI)或磷酸己糖异构酶(PHI),是一种具有糖酵解酶(葡萄糖-6-磷酸异构酶)功能的酶,可将葡萄糖-6-磷酸(G6P)和果糖-6-磷酸(F6P)相互转化。由于反应是可逆的,其方向由G6P和F6P浓度决定。
在某些实施方式中,通过增加内源性pgm基因的表达,例如,通过引入能够增加所述基因表达的启动子,来增加PGM的水平或活性。
在优选的实施方式中,大肠杆菌中pgm基因的启动子被来自大肠杆菌的gapA启动子取代。示例性的gapA启动子(gapAp)5'-3'在SEQ ID NO:13中列出。
如本文所用,葡萄糖-6-磷酸脱氢酶(E.C.1.1.1.49),也称为G6PD,是催化化学反应D-葡萄糖6-磷酸+NADP+
Figure BDA0003944744060000201
6-磷酸-D-葡糖酸-1,5-内酯+NADPH+H+的酶。G6PD为戊糖磷酸途径的限速酶,将G6P转化为6-磷酸葡糖酸-δ-内酯。因此,G6PD调控对戊糖磷酸途径其余部分的活性具有下游影响。葡萄糖-6-磷酸脱氢酶由其底物G6P刺激。在大肠杆菌中,zwf基因编码葡萄糖-6-磷酸1-脱氢酶。大肠杆菌G6PD蛋白的示例性氨基酸序列可在Uniprot登陆号POAC53下找到,并且示例性核酸序列可在登陆号M55005、NP_416366.1和NC_000913.3下找到。来自运动发酵单胞菌的同源的蛋白由zwf编码,其示例性核酸序列在本文的SEQ ID NO:16中提供。
在某些实施方式中,通过增加内源性zwf基因的表达,例如,通过引入能够增加所述基因表达的启动子,来增加G6PD水平或活性。在某些实施方式中,大肠杆菌zwf启动子被osmY启动子(osmYp)取代。示例性osmY启动子(osmYp)序列在SEQ ID NO:12中给出。在替代实施方式中,大肠杆菌zwf启动子被SEQ ID NO:13中给出的大肠杆菌gapA启动子取代。
在优选的实施方式中,通过用来自运动发酵单胞菌的zwf基因替换或补充大肠杆菌的zwf基因来增加G6PD水平或活性。在进一步的实施方式中,大肠杆菌的zwf基因被来自任何革兰氏阴性兼性细菌的zwf基因取代或补充。
如本文所用,6-磷酸葡糖酸内酯酶(E.C.3.1.1.31),也称为6PGL或PGLS,是一种在戊糖磷酸途径的氧化相中催化6-磷酸葡糖酸内酯水解为6-磷酸葡糖酸(或6-磷酸-D-葡糖酸盐+H+)的酶。6-磷酸葡糖酸内酯酶催化6-磷酸葡糖酸内酯转化为6-磷酸葡糖酸,两者都是戊糖磷酸途径氧化阶段的中间体,其中葡萄糖转化为核酮糖5-磷酸。戊糖磷酸途径的氧化阶段释放CO2并导致NADP+生成两当量的NADPH。最终产物5-磷酸核酮糖在戊糖磷酸途径的非氧化的阶段被生物体进一步加工以合成生物分子,包括核苷酸、ATP和辅酶A。在戊糖磷酸途径中位于6PGL之前的酶葡萄糖-6-磷酸脱氢酶仅形成6-磷酸葡萄糖酸内酯的δ-异构体。示例性大肠杆菌6PGL序列可在Uniprot登陆号P52697下找到,示例性核酸序列可在登陆号U27192、NP_415288.1和NC_000913.3下找到。
在某些实施方式中,通过增加内源性pgl基因的表达,例如,通过引入能够增加所述基因表达的启动子,来增加PGL水平或活性。
在优选的实施方式中,大肠杆菌中pgl基因的启动子被来自大肠杆菌的gapA启动子取代。示例性的gapA启动子(gapAp)5'-3'在SEQ ID NO:13中给出。
如本文所用,甘油醛-3-磷酸脱氢酶(E.C.1.2.1.12),也称为GAPDH,不太常见的名称为G3PDH,由大肠杆菌中的gapA基因编码。所述蛋白质利用辅因子NAD催化甘油醛3-磷酸(G3P)氧化磷酸化为1,3-二磷酸甘油酸(BPG)。第一个反应步骤涉及在G3P和半胱氨酸残基之间形成半缩醛中间体,然后所述半缩醛中间体被氧化成硫酯,伴随着NAD还原成NADH。然后被还原的NADH与第二个NAD交换,硫酯被亲核无机磷酸盐攻击产生BPG。大肠杆菌GapA蛋白的示例性氨基酸序列可在Uniprot登陆号POA9B2下找到,示例性核酸序列可在登陆号X02662、NP_416293.1和NC_000913.3下找到。来自丙酮丁醇梭菌(Clostridiumacetobutylicum)的同源的蛋白由gapC编码,其示例性核酸序列在本文的SEQ ID NO:15中提供。
在某些实施方式中,通过降低或消除内源性gapA基因的表达,通过删除所述基因或改变启动子以降低所述基因的表达来降低GAPDH的水平或活性。
在优选的实施方式中,大肠杆菌中的gapA基因被来自丙酮丁醇梭菌的gapC基因取代。
如本文所用,6-葡糖磷酸脱氢酶,也称为6-磷酸葡糖酸脱氢酶,脱羧(E.C.1.1.1.44),是一种催化6-磷酸葡糖酸氧化脱羧为核酮糖5-磷酸和CO2,同时将NADP还原为NADPH的酶。在大肠杆菌中,6-葡糖磷酸脱氢酶由gnd基因编码。大肠杆菌6-葡糖磷酸脱氢酶的示例性氨基酸序列可在UniProt登陆号P00350下找到,核酸序列可在登陆号K02072、NP_416533.1和NC_000913.3下找到。谷氨酸棒杆菌的同源的蛋白由gnd编码,其示例性核酸序列在本文的SEQ ID NO:14中提供。
在某些实施方式中,通过增加内源性的gnd基因的表达,例如通过引入能够增加所述基因表达的启动子,而增加6-葡糖膦酸盐脱氢酶的水平或活性。在某些实施方式中,其中微生物是大肠杆菌,大肠杆菌中gnd基因的启动子被来自大肠杆菌的gapA启动子取代。示例性的gapA启动子(gapAp)5'-3'在SEQ ID NO:13中给出。在替代实施方式中,大肠杆菌gnd启动子被osmY启动子(osmYp)取代。一个示例性osmY启动子(osmYp)序列如SEQ ID NO:12中给出。
在特别优选的实施方式中,pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB中一种或多种的内源性启动子被选自包括以下组的启动子取代:osmY启动子、gapA启动子、nirB启动子和nar启动子。
在优选的实施方式中,来自微生物(例如大肠杆菌)的gnd基因被来自谷氨酸棒杆菌的gnd基因取代。
在特别优选的实施方式中,pgm、zwf、pgl、gnd、tktB或tktA以及talA或talB中一种或多种的内源性启动子被选自包括以下组的启动子取代:osmY启动子、gapA启动子、nirB启动子和nar启动子。优选地,osmY、gapA、nirB和/或nar启动子是生物体的内源性启动子。更优选地,其中微生物是大肠杆菌,osmY、gapA、nirB和/或nar启动子来自大肠杆菌。
蔗糖代谢基因
由于大多数大肠杆菌菌株不能利用蔗糖作为碳源,本发明的微生物和方法还包括修饰宿主微生物以使蔗糖能够代谢。在某些实施方式中,这可以通过修饰微生物以表达基因簇cscRAKB来实现,所述基因簇已经在能够代谢蔗糖的大肠杆菌菌株中被鉴定。
因此,在优选的实施方式中,本发明的方法还包括向宿主微生物提供重组的多核苷酸,所述重组的多核苷酸能够表达编码蔗糖水解酶(由cscA基因编码)和蔗糖渗透酶(由cscB基因编码)的核酸序列。在进一步的实施方式中,所述方法还包括向微生物提供编码调节蛋白cscR和cscK(分别由基因CscR和CscK编码)的重组的多核苷酸。
如本文所用,蔗糖水解酶是指由cscA基因编码的酶蔗糖-6-磷酸水解酶,也称为蔗糖或转化酶(E.C.3.2.1.26)。蔗糖水解酶的示例性氨基酸序列在UniProt登陆号P40714下提供,并且示例性核苷酸序列在登陆号X81461下提供。
如本文所用,蔗糖渗透酶是指由cscB基因编码的蛋白质。蔗糖渗透酶也称为蔗糖转运蛋白,其示例性氨基酸序列可在Uniprot登陆号P3000下找到。编码蔗糖渗透酶的示例性核苷酸序列可在登记号X63740或X81461下找到。
此外,还可以对大肠杆菌微生物进行基因修饰,以增加内源性的大肠杆菌磷酸葡萄糖变位酶(pgm)或木糖异构酶(xylA)的水平或活性。基因修饰可以是增加内源性基因的表达(例如,通过启动子区的修饰)或通过引入和表达编码所述基因的外源性核酸。
在进一步的实施方式中,微生物被修饰以表达来自肠系膜明串珠菌的蔗糖磷酸化酶。
核酸
一个“分离的”核酸分子是从至少一种污染物核酸分子中鉴定和分离的核酸分子,所述污染物核酸分子通常在编码核酸的多肽的天然来源中与其相关联。分离的核酸分子不同于自然界中发现的形式或环境。因此,一个分离的核酸分子与天然细胞中存在的核酸分子是不同的。然而,一个分离的核酸分子包括包含在通常表达核酸的细胞中的核酸分子,例如,核酸分子位于不同于自然细胞中的染色体位置。
术语“核酸分子”和“多核苷酸”在本文中可互换使用,指任何长度的核苷酸的聚合形式,脱氧核糖核苷酸或核糖核苷酸,或其类似物。多核苷酸的非限制性实例包括基因、基因片段、信使RNA(mRNA)、cDNA、重组的多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。“编码”所选多肽的核酸序列是当置于适当调控序列的控制下时在体内被转录(在DNA的情况下)并翻译成多肽的核酸分子。编码序列的边界由5’(氨基)末端的起始密码子和3’(羧基)末端的翻译终止密码子确定。转录终止序列可以位于编码序列的3’端。
本发明的多核苷酸可以根据本领域熟知的方法合成,如Sambrook等人(1989,Molecular Cloning—a laboratory manual;Cold Spring Harbor Press)中描述的方法。
如本文所用,“密码子优化的”是指DNA序列的优化,以类似于宿主微生物中基因的密码子使用。在优选的实施方式中,序列中密码子的使用被优化以类似于高度表达的大肠杆菌基因。
本发明的多核苷酸分子可以以表达盒的形式提供,所述表达盒包括与插入序列可操作地连接的控制序列,因此允许多肽的表达。这些表达盒又通常在载体(例如质粒或重组的载体)中提供。合适的载体可以是能够携带足够量的遗传信息并允许表达本发明中的多肽的任何载体。
因此,本发明包括包含此类多核苷酸序列的表达载体。表达载体在分子生物学领域中是常规地构建的并且可以例如包括使用质粒DNA和合适的引发剂、启动子、增强子和可能是必需的并且定位在正确方向上的其它元件,以便允许表达期望的多肽。其他合适的载体对本领域技术人员来说是显而易见的。作为这方面地的例子我们参考了Sambrook等人。
因此,本发明的多肽可以通过将这样的载体递送至细胞并允许从载体进行转录来提供。本领域技术人员将熟悉用于将这种表达载体递送至细胞的标准技术,包括转化技术等。
载体可以是质粒。在某些实施方式中,质粒是高拷贝数质粒或低拷贝数质粒。载体是本领域公知的,可以包括克隆载体和表达载体等。克隆载体是重组的核酸构建体,其能够在宿主细胞中自主复制或整合到基因组中,并且其进一步的特征在于一个或多个内切酶限制位点,在所述限制性位点,所述载体可以以可确定的方式被切割,并且可以将期望的DNA序列连接到所述重组的核酸构建体中,使得新的重组的载体保持其在宿主细胞中复制的能力。在质粒的情况下,随着质粒在宿主细菌内拷贝数的增加,所需序列的复制可以发生多次,或者在宿主通过有丝分裂繁殖之前,每个宿主仅发生一次。就噬菌体而言,复制可能在裂解期主动发生,也可能在溶原期被动发生。表达载体是重组的核酸构建体,可通过限制和连接将所需DNA序列插入其中,使其与调控序列可操作地连接,并可表达为RNA转录物。载体还可含有一种或多种适用于鉴定已用或未用载体转化或转染的细胞的标记序列。标记物包括,例如,编码增加或降低对抗生素或其它化合物的抗性或敏感性的蛋白质的基因,编码其活性可通过本领域已知的标准测定法检测的多肽或酶的基因(例如,β-半乳糖苷酶、荧光素酶或碱性磷酸酶),和明显影响转化或转染的细胞、宿主、群落或斑块的表型的基因(例如,荧光蛋白质如绿色荧光蛋白质)。优选的载体是那些能够自主复制和表达存在于它们可操作连接的DNA片段中的结构基因产物的载体。
如本文所用,当编码序列和调节序列以将编码序列的表达或转录置于调节序列的影响或控制下的方式共价连接时,它们被称为“可操作地”连接或连接。如果需要将编码序列翻译成功能性蛋白质,如果在5’调节序列中诱导启动子导致编码序列的转录,并且如果两个DNA序列之间的连接性质不(1)导致引入移框突变,(2)干扰启动子区指导编码序列转录的能力,或(3)干扰相应RNA转录物翻译成蛋白质的能力,则两个DNA序列被称为可操作地连结(joined)或连接(linked)。因此,如果启动子区域能够影响所述DNA序列的转录,使得所得到的转录物能够被翻译成所需的蛋白质或多肽,则启动子区域将可操作地连结或连接到编码序列。
基因表达所需的调控序列的精确性质可能因物种或细胞类型而异,但一般应根据需要包括分别与转录和翻译起始有关的5’非转录和5’非翻译序列,如TATA盒、加帽序列、CAAT序列等。特别地,这样的5’非转录调节序列将包括启动子区,所述启动子区包括用于可操作地连接的基因的转录控制的启动子序列。
根据需要,调节序列也可以包括增强子序列或上游激活子序列。本发明的载体可以任选地包括5’前导或信号序列。适当载体的选择和设计在本领域普通技术人员的能力和判断范围内。
“启动子”是启动和调节编码多肽的多核苷酸的转录的核苷酸序列。启动子可以包括可诱导的启动子(其中与启动子可操作连接的多核苷酸序列的表达由分析物、辅因子、调节蛋白等诱导)、可抑制的启动子(其中与启动子可操作连接的多核苷酸序列的表达被分析物、辅因子和调节蛋白等抑制)和组成性的启动子。术语“启动子”或“控制元件”意指包括全长启动子区域和这些区域的功能性(例如,控制转录或翻译)片段。
如本文所述,本发明的核酸优选可操作地连接至启动子,使得当在能够产生氢气的合适条件下培养时所述酶在细胞中表达。启动子可能对单个细菌细胞物种具有特异性。启动子可以是异源启动子,其将基因的表达增加到细胞中观察到的典型表达水平以上。启动子可以是诱导型启动子。
本发明的多核苷酸、表达盒或载体可另外包含信号肽序列。信号肽序列通常以与启动子可操作地连接的方式插入,使得信号肽被表达并促进由也以与启动子可操作地连接的方式的编码序列编码的多肽的分泌。可以进一步理解,在任何实施方式中,可以进一步修饰本文所述的任何示例性表达盒、载体或序列以不包括信号肽序列。
任何合适的表达载体(如Pouwels等人Cloning Vectors:A Laboratory Manual(Elsevier,N.Y.:1985)中描述的)和相应的合适宿主均可用于生产重组的多肽。表达宿主包括但不限于埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)和宿主细胞系统等之内的细菌物种。本领域技术人员知道表达宿主的选择对产生的多肽类型有影响。
在一些实施方式中,对细胞进行工程改造或选择(例如,如本文所述)以产生或改变、可选地增加目的分子的产生。在一些实施方式中,所述细胞包含一个或多个基因(例如,本文所述的一个或多个调控或竞争代谢基因)的缺失或突变。在其它实施例中,被删除或突变的一个或多个基因处于竞争途径中。突变可以是单个或多个点突变、添加、部分内部删除、N-末端或C-末端删除(截短)或完全删除,所有这些都会影响编码基因的氨基酸序列。
删除或突变可以使用本领域的标准方法进行。突变可以是非随机的、部分随机的或随机的,或这些突变的组合。例如,对于部分随机的突变,突变可能局限于编码要发生突变的多肽的核酸分子的某一部分。
微生物的培养和修饰
在特别优选的实施方式中,如本文所述的微生物或宿主细胞的培养在需氧条件下进行,最初产生生物质,然后转移至厌氧条件以在表达HPGC期间诱导厌氧性。本领域技术人员将熟悉产生厌氧性的技术,包括添加中性气体(如N2)或还原剂。然而,还应理解,可通过在可氧化碳源存在的密封容器中培养微生物来简单地实现厌氧生活。
此外,微生物或宿主细胞的培养优选通过在培养基中包含三价铁(铁III)或二价铁(铁II)盐来进行。优选地,在介质中以至少约5M、至少约10M、至少约20M或至少约30M或更高的最终浓度提供三价铁(铁III)或二价铁(铁II)盐。优选地,培养基中提供的三价铁(铁III)或二价铁(铁II)盐的最终浓度等于或大于约20M。
本领域技术人员将理解,用于生产重组蛋白的重组宿主细胞的培养将在对生物体中蛋白的生长和表达最佳的温度下进行。例如,大肠杆菌和相关细菌生物体生长的最佳温度为约37℃,生产重组蛋白的酵母的生长温度为约30-32℃。然而,本发明人发现,当使用细菌表达系统如大肠杆菌时,当降低培养温度时,功能性氢化酶的表达可以进一步增强。因此,在优选的实施方式中,其中微生物或宿主细胞是大肠杆菌,培养温度不超过约30℃。温度可以在约10℃至约30℃之间,优选地至少约15℃。在某些实施方式中,温度为约20℃至约30℃。在特别优选的实施方式中,温度为约20℃(例如,18℃、19℃,20℃、21℃或22℃)。
“基因工程的”或“基因修饰的”指通过任何重组的DNA或RNA技术进行修饰的任何细胞。换句话说,细胞已被重组的多核苷酸分子转染、转化或转导,并由此被改变以使细胞改变所需蛋白的表达。用于基因工程化宿主细胞的方法和载体是本领域熟知的;例如,各种技术在Molecular Biology,Ausubel等人,编辑(Wiley&Sons,纽约,1988,季度更新)中有所说明。基因工程技术包括但不限于表达载体、靶向同源重组和基因激活(参见,例如,美国专利第5,272,071号)和通过工程转录因子的反式激活(参见,例如Segal等人,1999,ProcNatl Acad Sci USA 96(6):2758-63)。
在某些实施方式中,本文所述的基因修饰导致基因表达或功能的增加,并且可以称为基因的扩增、过度生产、过表达、活化、增强、添加或上调。更具体地,本文所讨论的增加酶或其它蛋白质的作用(或活性)的参考通常是指所讨论的微生物中导致酶或蛋白质的表达和/或功能性(生物活性)增加的任何基因修饰,并且包括酶的更高活性(例如,比活性或体内酶活性)、酶的抑制或降解减少以及酶的过表达。例如,可以增加基因拷贝数,通过使用给予比天然启动子更高表达水平的启动子来增加表达水平,或者可以通过基因工程或经典的诱变来改变基因以增加酶的生物活性。这些修改中的一些组合也是可能的。
如本文所用,术语“外源性多核苷酸”是指并非来源于给定的生物体中天然地存在的多核苷酸的多核苷酸。外源性多核苷酸可以来源于存在于不同生物体中的多核苷酸。根据本发明,大肠杆菌细胞可以用核酸构建体进行基因修饰,所述核酸构建体含有一种或多种外源性多核苷酸,编码一种或多种使细胞能够产生氢气的酶。
外源性多核苷酸可以是异源的或同源的。术语“异源的”是指来源于参考物种以外的来源的分子或活性,而“同源的”是指来源于宿主微生物有机体的分子或活性。因此,本发明核酸分子的外源性表达可以通过使用异源或同源的核酸分子中的一种或两种来实现。
外源性多核苷酸可以以一种或多种表达构建体(质粒载体)提供。
转化微生物的方法是本领域众所周知的,并且可以包括例如电穿孔、基于氯化钙或基于乙酸锂的方法的非限制性实例。
本领域技术人员将熟悉用于确认成功的转化相关构建体的方法,以及用于确定转化体是否具有由编码蛋白提供的相关酶活性的方法。例如,磷酸果糖激酶活性(从而推断编码蛋白的正确蛋白折叠)可使用市售酶测定试剂盒进行推断。
类似地,技术人员将熟悉确认相关蛋白的活性水平或相关基因的表达水平的抑制或删除的标准技术。使用标准测序技术可以确认成功的基因修饰、删除或替换。将细胞与抑制剂接触后,可通过评估相关蛋白的活性,例如使用市售酶测定试剂盒来评估对蛋白活性的成功抑制。
本领域技术人员还将熟悉诱导重组的微生物中多核苷酸表达所需的一般培养技术,从而在需要时诱导产生HPGC蛋白以产生氢气。在一些实施例中,重组微生物的液体培养物在补充有葡萄糖的厌氧条件下生长。
成功的转化也可以通过在待转化到细胞中的载体的质粒中包含选择标记基因来确定。如本文所用,术语“选择标记基因”是指编码在选择性培养基中生长的宿主细胞存活和/或生长所必需的蛋白质的遗传的物质。用于微生物的典型选择标记基因,包括大肠杆菌是本领域技术人员熟知的。
氢气产量的测量可以通过任何合适的方法进行,包括实施例中概述的方法。在一个简单的实施例中,可以通过观察培养物中气泡的产生来简单地测量氢气的产生。在其他实施例中,氢气产生量的产生和量化是通过对气泡进行采样,并通过气相色谱法分析气体成分,同时通过热导检测或质谱检测。在其它实施例中,可使用技术人员已知的克拉克型电极或用于检测氢气产生的任何其它合适的方法。
在本发明的任何实施方式中,微生物,优选地大肠杆菌微生物,可以在诱导产生氢气之前储存一段时间。例如,在某些实施方式中,本发明的微生物或本文所述的方法可以包括用所需的多核苷酸转化微生物,以产生能够产生氢气的重组的微生物。然后可以收获微生物并在适合于微生物储存的条件下储存(例如,在4℃、-20℃或-80℃,在合适的缓冲液中)直至氢气生产所需。还应当理解,微生物可以冻干直到需要进一步使用。此外,应当理解微生物可以在能够表达HPGC的条件下生长,然后收获,必要时储存,然后再悬浮在补充有葡萄糖的适当溶液中以启动细菌产生氢气。
在一些实施方式中,收获已经产生并且已经表达HPGC的培养的细菌,并且在等渗条件下向其供给葡萄糖以产生氢气。
在某些实施方式中,使用标准技术将细菌包封在例如藻酸钙珠中,并在等渗介质中向细菌供给葡萄糖以产生氢气。技术人员将熟悉生物封装的标准人工和机制技术及设备,包括使用Inotech Encapsulator IE-50R(EncapBioSystems公司)或Encapsulator B-390/B-395pro(Buchi)等设备或相关系统。其他方法有所描述,例如:Heidebach等人,(2012)Critical Reviews in Food Science and Nutrition,52:291-311;Martín等人,(2015)Innovative Food Science&Emerging Technologies 27:15-25,其全部内容通过引用并入本文。
在其它实施例中,重组的微生物不需要是活的(即,能够繁殖,“生长”或增加细胞数量)以便能够根据本发明产生氢气。例如,在任何实施方式中,所述方法包括提供或产生本文所述的重组地微生物,在足以诱导产生氢气所需的蛋白质(例如,由HPGC编码的蛋白质)的表达的条件和时间下培养所述微生物,然后灭活所述微生物。优选地,灭活的微生物保持完整,尽管可以理解这不是必需的要求。
然后本发明的灭活的重组的微生物可用于产生氢气,例如如本例中所述。
本领域技术人员将熟悉灭活微生物的方法,以使细胞保持完整,但仍可用于产生氢气(即,从已由细胞表达的HPGC蛋白和其它蛋白)。灭活可以通过伽马射线照射或用抗生素(如丝裂霉素或类似药物)处理。
在任何实施方式中,至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的微生物被灭活。
系统和设备
本发明还提供了包含本发明的微生物的系统和装置,或包括本文所述的用于生产氢气的方法的反应器系统。
在优选的实施方式中,本发明进一步包括用于收集微生物产生的氢气的氢气收集系统。反应器系统中可以包括氢气收集系统,使得产生的氢气被收集并任可选德储存以供使用。或者,产生的氢气可以被引导至使用点,例如氢燃料动力装置。
在一些实施方式中,氢气收集单元包括一个或多个氢气导管,用于将反应器系统中产生的氢气流引导至储存容器或直接引导至使用点。在其它实施方式中,氢气导管任选地连接到吹扫气源,其中使用吹扫气体收集氢气。示例性的吹扫气体是氮气。例如,当最初产生氢气时,可将吹扫气体引入氢气导管中,使其沿储存容器或氢气使用点的方向流动。在进一步的实施方式中,氢气收集系统可以包括用于收集来自反应器系统的氢气的容器。在其他的实施方式中,收集系统还可包括用于氢气通过的导管。导管和/或容器可以与为氢气从反应室流出而提供的通道气流连通。
燃料电池是将燃料的能量直接转化为电化学和热能的电化学装置。通常,燃料电池由通过电解质电连接的阳极和阴极组成。将燃料(例如氢气)供给阳极,在阳极借助电催化剂进行氧化。在阴极,发生氧化剂如氧气(或空气)的还原。发生在电极上的电化学反应产生电流,从而产生电能。一般来说,热能也可以被利用来提供额外的电力或用于其他目的。目前,燃料电池中最常见的电化学反应是氢和氧之间生成水的反应。分子氢本身可以供给阳极,在那里被氧化,产生的电子通过外部电路传递到阴极,在那里氧化剂被还原。通过中间电解质的离子流保持电荷中性。
本主题的燃料电池利用氢作为燃料,其中氢源来自本主题的重组的微生物。
通常,在燃料源中氢气的存在量为至少约2%体积,优选地至少约5%体积,更优选地至少约10%体积,例如约25%体积、50%体积、75%体积或90%体积。当使用惰性气体形成燃料气体的一部分时,惰性气体的存在量通常为至少约10%体积,例如至少约25%体积,50%体积或75%体积,最优选至少约80%体积。
通常,燃料源以气体或液体形式从燃料源的任选加压的容器供应。燃料源通过一个入口提供给电极,所述入口可选地包括一个阀。还提供了一个出口,其使得用过的或废弃的燃料源能够离开燃料电池。
氧化剂通常包括氧气,尽管可以使用任何其它合适的氧化剂。氧化剂源通常以包括氧化剂的气体形式向阴极提供氧化剂。在一些实施方式中,氧化剂可以以液体形式提供。通常,氧化剂源还包括惰性气体,尽管也可以使用纯形式的氧化剂。例如,可以使用氧气与一种或多种气体如氮气、氦气、氖气或氩气的混合物。氧化剂源可任选地包含其它组分,例如替代氧化剂或其它添加剂。合适的氧化剂源的一个例子是空气。
通常,在氧化剂源中氧气的存在量为至少约2%体积,优选至少约5%体积,更优选至少约10%体积。
通常,氧化剂源由气体或液体形式的氧化剂源.的可选地加压容器提供。氧化剂源通过入口提供给电极,所述入口可选地包括阀。还提供了出口,其使得用过的或废弃的氧化剂源能够离开燃料电池。
阳极可以由任何导电材料制成,例如不锈钢、黄铜或碳,可以是石墨。阳极表面可以至少部分地涂覆有促进催化剂吸附的不同材料。吸附催化剂的表面材料不会导致氢化酶变性。合适的表面材料包括石墨,例如抛光的石墨表面或具有高表面积的材料,例如碳布或碳海绵。通常优选的具有粗糙表面和/或高表面积的材料。
阴极可以由任何合适的导电材料制成,这将使氧化剂在其表面被还原。例如,可以使用用于形成常规燃料电池中的阴极的材料。如果需要,电催化剂可以存在于阴极。例如,这种电催化剂可以涂覆或吸附在阴极本身上,或者它可以存在于阴极周围的溶液中。合适的电催化剂包括常规燃料电池中使用的那些,例如铂。生物的催化剂也可用于此目的,特别是本文所述的酶和辅助蛋白的组合。
本发明主题的燃料电池通常地操作是在温度至少在约25℃,更优选地至少约3O℃。优选的燃料电池在约35℃至约65℃,例如约40℃至约50℃的温度下操作。更高的温度增加反应速率并导致更高的氧化电流。
如上所述,燃料电池可以在上述条件下操作,以在电路中产生电流。燃料电池通过向阳极供应氢和向阴极供应氧化剂来运行。本发明的燃料电池能够产生每cm2正电极表面积至少约0.5mA、通常地至少约0.8mA、1mA或1.5mA的电流密度。例如,本发明的燃料电池可以产生至少约2mA的电流,例如每cm2正电极表面积至少约3mA。
示例
实施例1
材料和方法
细菌菌株和质粒
野生型(DH5α)大肠杆菌NEB 5-α(CP017100.1,(Anton and Raleigh,2016)),DH5α的fhuA2直接衍生物和K-12的衍生物,购自新英格兰生物实验室(New England Biolabs),并保存在含有Luria-Bertani(LB)培养基和1.5%琼脂的平板上。根据需要包括抗生素氯霉素(Cam)30mg L-1和硫酸卡那霉素(Kan)50mg L-1。DH5α突变株采用CRISPR/Cas9方法构建(Reisch and Prather,2015)。使用标准Biobrick组装地方法、限制性消化和连接构建质粒pHPGC(CamR)。通过标准步骤将所得质粒转化到WT和突变株中。表2中列出了用于产生氢气的菌株和质粒。表1中给出了HPGC启动子和异源启动子的各种组分的序列以及基因序列。用于生产氢气的野生型和突变的菌株的基因组序列使用Nanopore测序技术确认。
发酵
将大肠杆菌DH5α、DH5α-HPGC、ΔpfkA-HPGC或ΔgpmA-HPGC(使用SEQ ID NO:10和30-40中指定的HPGC构建体)的单个菌落接种在100mL含Cam的SOC(Super Optimal brothwith Catabolite repression)培养基中的预培养物中。将预培养物在37℃下培养过夜至约OD600 2(1.6×109细胞),然后接种到2L的SOC培养基(pH 7)中,并加入无菌过滤(0.2μm)的20mM D-葡萄糖、1mM硫酸铁和Cam(30mg L-1)。
在发酵罐(Eppendorf,BioFlow 120and
Figure BDA0003944744060000311
115发酵罐/生物反应器)的辅助下,细胞在100rpm搅拌速度下,温度控制在37℃,pH通过滴定1M氢氧化钠保持在7,厌氧培养到OD600 0.6(4.8×108细胞)。当细胞生长达到OD600 0.6(4.8×108细胞)时,诱导前将培养温度降至18℃。用无菌过滤的异丙基-B-D-硫代半乳糖苷(IPTG,1mM)和1mM硫酸铁诱导细胞。然后,通过在18℃下离心(4650rcf 15分钟)收集细胞。将细胞沉淀在含1mM连二亚硫酸钠的pH 7.4(10mM)的1×磷酸盐缓冲液(PBS)或pH 8.0的1×PBS(约50mM)中洗涤三次,并储存在4℃。
生物氢反应器
将发酵获得的DH5α、DH5α-HGPC、ΔpfkA-HGPC或ΔgpmA-HGPC细胞沉淀在20OD600下重新悬浮于pH 7.4的1×PBS(10mM)或pH 8.0的1×PBS(约50mM)中,并可选地加入1mM连二亚硫酸盐(最终体积50mL),然后置于100mL侧臂锥形瓶中以测试和测量氢气产量。用橡胶塞密封烧瓶,将pH探针伸入悬浮细胞中。烧瓶的侧臂连接到一个为测量气体体积而定制的仪器上。将涂有特氟隆的磁性棒放在锥形瓶内,并将烧瓶放在磁力搅拌板上。在加入D-葡萄糖(最终浓度为20mM)之前,用三倍体积的100%氮气吹扫锥形瓶的顶部空间,以引起细菌氢气形成。实验在约22℃的室温下进行。
氢气、二氧化碳和pH测量
分别在开始时(紧接添加D-葡萄糖之后)和大约每15-20分钟(直到气体生产几乎停止)从生物氢反应器中采集并记录顶空气体样本(5μL)和pH测量值。使用Shimadzu NexisGC-2030色谱柱(Restek,ShinCarbon ST Micropacked GC Column,Cat.#19808)和GC法:SPL1温度100℃,柱流量6mL.min-1,DTCD温度180℃,烘箱温度40℃保持3分钟,然后以15℃.min-1升至170℃,在170℃下保持2分钟。载气为氩气。色谱柱规格,ShinCarbon ST,100/120mesh,2m,1/16in.OD,1.0mm)。
气体标准品(20%氢气、20%氮气、20%一氧化碳和20%二氧化碳[产品编号:PGS402470D];10%氢气、10%氮气、10%一氧化碳和10%二氧化碳,外加氩气平衡气体[产品编号:PGS402469D];和50%氧气与氩气的平衡气体[产品编号:PGS402471D2])来测定氢气和二氧化碳的%浓度。在实验过程中,还测量了氧气和氮气以监测空气泄漏到锥形侧臂烧瓶中的情况。气体标准品由BOC Australia提供。
核磁共振分析
对于每份样本,通过在20,018rcf下离心2分钟,沉淀出700μL细胞培养物。将上清液(600μL)采集到15-mL的Falcon管中,然后在-80℃下冷冻。然后将样本冷冻干燥并重新悬浮在氧化氘(800μL)中。将重悬液置于NMR管中(Norell Sample Vault系列,标准壁,封闭盖,参数700MHz频率,直径.×L 5mm×178mm,mfr no.Norell,SVCP-5-178-96PK)。所有NMR光谱在298K下记录在配备5mm BBFO智能探针的Bruker AVIIIHD 400MHz NMR光谱仪上。使用Topspin 3.5对光谱进行处理和分析。在64K数据点上记录1H光谱,谱宽为8013Hz(20.0ppm)。
结果
大肠杆菌的DH5α-HPGC、ΔpfkA-HPGC、ΔgpmA-HPGC或DH5α-H1-HEGF(即缺乏petF和FNR的HPGC)菌株在添加葡萄糖后2小时内会产生大量气体。生产氢气的停止与葡萄糖的完全消耗相关。ΔgpmA-HGPC(如,SEQ ID NO:10)每摩尔葡萄糖产生0.95摩尔的氢气;ΔpfkA-HGPC每摩尔葡萄糖产生0.85摩尔氢气;DH5α-HGPC每摩尔葡萄糖产生0.45摩尔氢气,DH5α-H1-HEFG每摩尔葡萄糖产生0.45摩尔氢气。
在22℃下,含HPGC菌株的最大氢气生成速率相似;每L细胞(200OD600)每小时产生3.6+/-0.06L氢气。缺乏HPGC的菌株的速率较低;在这些条件下DH5α没有可检测到的氢气,并且缺乏petF-FNR的DH5α-H1-HEFG每L细胞(200OD600)每小时产生约1.2L氢气。
如果缓冲不充分,则当pH值降至5以下时,氢气生产会停止。pH值下降是由于有机酸乳酸盐、琥珀酸盐、丙酮酸盐和乙酸盐的产生,ΔpfkA和ΔgpmA突变体减少了有机酸的产生(图2)。
实施例2通过靶向糖酵解途径的下游来产生氢气的速率
图4显示了葡萄糖通过糖酵解途径下游的碳流量减少的证据。基因gpmM或gpmA的删除可提高氢气产生速率。
增加gnd和zwf的表达也出乎意料地提高了氢气产生速率,如图4所示。
图5还提供了证据,表明增加葡萄糖通过戊糖磷酸途径(PPP)的碳通量会增加H2与CO2的比率。在厌氧条件下,如果葡萄糖中的所有碳都通过戊糖磷酸途径代谢为CO2,并且产生的还原剂被用于制造H2,则理论上的最大比率为2:1。如果葡萄糖通过糖酵解,那么在厌氧条件下比例为1:1。通过PPP增加通量将提高葡萄糖制备H2的总收率。
通过PPP增加代谢可通过增加zwf和/或gnd的活性和/或表达来实现。或者,也可以通过降低pfk的活性(对于Δpfk)来减少从具有6个碳的中间体的糖酵解部分到具有3个碳的中间体的糖酵解部分的流量。图5中的数据显示,增加zwf的表达或降低pfk活性会增加氢气与CO2的比率,从而增加通过戊糖磷酸途径的流量。由于gnd编码的酶相比zwf编码的酶位于代谢途径的下游,因此与wt DH5α相比,所述突变体中gnd活性的增加对H2与CO2的比值没有显著影响。
表1:序列信息
Figure BDA0003944744060000351
Figure BDA0003944744060000361
Figure BDA0003944744060000371
Figure BDA0003944744060000381
Figure BDA0003944744060000391
Figure BDA0003944744060000401
Figure BDA0003944744060000411
Figure BDA0003944744060000421
Figure BDA0003944744060000431
Figure BDA0003944744060000441
Figure BDA0003944744060000451
Figure BDA0003944744060000461
Figure BDA0003944744060000471
Figure BDA0003944744060000481
Figure BDA0003944744060000491
Figure BDA0003944744060000501
Figure BDA0003944744060000511
Figure BDA0003944744060000521
Figure BDA0003944744060000531
Figure BDA0003944744060000541
Figure BDA0003944744060000551
Figure BDA0003944744060000561
Figure BDA0003944744060000571
Figure BDA0003944744060000581
Figure BDA0003944744060000591
Figure BDA0003944744060000601
Figure BDA0003944744060000611
Figure BDA0003944744060000621
Figure BDA0003944744060000631
Figure BDA0003944744060000641
Figure BDA0003944744060000651
Figure BDA0003944744060000661
Figure BDA0003944744060000671
Figure BDA0003944744060000681
Figure BDA0003944744060000691
Figure BDA0003944744060000701
Figure BDA0003944744060000711
Figure BDA0003944744060000721
Figure BDA0003944744060000731
Figure BDA0003944744060000741
Figure BDA0003944744060000751
Figure BDA0003944744060000761
Figure BDA0003944744060000771
Figure BDA0003944744060000781
Figure BDA0003944744060000791
Figure BDA0003944744060000801
Figure BDA0003944744060000811
Figure BDA0003944744060000821
Figure BDA0003944744060000831
Figure BDA0003944744060000841
Figure BDA0003944744060000851
Figure BDA0003944744060000861
Figure BDA0003944744060000871
Figure BDA0003944744060000881
Figure BDA0003944744060000891
Figure BDA0003944744060000901
Figure BDA0003944744060000911
表2:菌株和质粒
Figure BDA0003944744060000912
Figure BDA0003944744060000921
表3:说明书中提到的核酸和相应的蛋白质,示例性序列
Figure BDA0003944744060000931
Figure BDA0003944744060000941
应当理解,本说明书中公开和定义的发明延伸到文本或附图中提到或显而易见的两个或多个单独特征的所有可选组合。所有这些不同的组合构成了本发明的各种可选方面。
SEQUENCE LISTING
<110> 麦考瑞大学
<120> 重组的微生物和方法
<130> P22116718WP
<150> 2020900990
<151> 2020-03-31
<160> 40
<170> PatentIn version 3.5
<210> 1
<211> 46
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 1
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46
<210> 2
<211> 3478
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 2
aagaaggaga tatacatatg gctcatagtt taagcgcaca ttcccgtcag gccggagatc 60
gcaaactggg cgcaggtgcg gcatctagcc gcccatcatg tccttctcgc cgcattgtcc 120
gcgtggcggc ccatgcttct gcgtccaagg cgactcccga tgtacctgtt gacgatcttc 180
ctcctgcgca tgcccgtgca gcagtagcgg ccgctaaccg tcgtgcgcgc gctatggcat 240
cagcggaggc cgcggcagag accctgggcg atttcctggg cttagggaag ggggggcttt 300
cgccgggcgc aaccgccaac cttgatcgtg agcaagtatt aggtgtgttg gaggcggtct 360
ggcgtcgtgg agaccttaat ctggagcgtg cgttgtacag ccatgccaat gcggtgacta 420
acaaatactg tggtgggggg gtctactatc gcggccttgt ggagttcagt aatatttgcc 480
aaaacgattg ctcatattgt gggattcgca acaatcaaaa agaagtttgg cgctatacta 540
tgccggttga agaggtggtc gaggtagcta agtgggcgct tgaaaacggc attcgcaaca 600
ttatgttgca agggggtgaa ttaaagacag agcaacgctt agcctacttg gaggcatgcg 660
tccgtgcgat tcgcgaggag acaacgcagt tagaccttga aatgcgcgca cgtgccgcga 720
gtacgacaac agcggaagcg gcagccagtg cacaggcaga cgccgaagct aaacgcggcg 780
agccagaatt gggtgtggtc gtatccttaa gcgtcggaga acttcctatg gaacagtatg 840
agcgtttgtt ccgcgccggc gcccgtcgct atctgatccg cattgaaacc tcgaatcccg 900
acctgtacgc ggcacttcac ccggagccga tgtcctggca cgcgcgtgta gaatgcctgc 960
gcaacctgaa gaaagctggg tatatgttgg gcacaggagt gatggtcggc ttgccgggac 1020
aaaccttaca cgacctggct ggggatgtca tgttctttcg cgacattaaa gcggacatga 1080
tcggtatggg ccccttcatt acgcagcctg ggacgcctgc aactgataag tggaccgcgc 1140
tgtatccgaa cgccaataag aacagccaca tgaaatctat gttcgatctg accactgcta 1200
tgaatgcact tgtacgtatt acgatgggga acgtaaatat cagtgctacg actgcattac 1260
aagcgattat ccccactgga cgtgaaattg cgcttgagcg cggcgcaaat gttgtcatgc 1320
ctattttaac gcctactcag tatcgcgagt cctatcagtt atatgagggt aagccctgca 1380
ttacggatac tgctgttcag tgtcgtcgtt gcctggacat gcgtttgcac tccgttggca 1440
aaacgtctgc ggccggagtt tggggcgatc ctgcttcgtt cttgcatccc atcgttggcg 1500
tcccagtccc gcacgacttg tcatcacctg ctttggccgc tgctgcaagt gcggattttc 1560
acgaggttgg cgcaggtccc tggaacccca tccgactaga gcgtctggtt gaagtgccgg 1620
accgttaccc tgaccccgat aaccacggac gcaaaaaggc aggagccggg aaaggaggca 1680
aggcgcatga ctctcacgac gatggcgatc acgacgacca ccaccaccac cacggagctg 1740
cccccgcggg tgcagcggct ggaaagggta ccggtgcagc tgcaattggt ggcggagcgg 1800
gggctagccg tcaacgcgta gcaggggctg ctgccgcctc tgctcgtctg tgtgcgggag 1860
ctcgccgcgc tggccgtgtt gtcgcgtcgc cattgcgccc agctgccgct tgccgtggtg 1920
tggccgtcaa ggccgcagct gctgctgcgg gtgaagacgc tggtgctggt acgtctggcg 1980
taggttcaaa tattgttacg tctcccggaa tcgctagcac tacggcacat ggtgttcctc 2040
gtatcaatat tggggtgttc ggcgtgatga atgcaggaaa gtctacactt gtgaatgctc 2100
tggcgcaaca ggaagcatgc attgttgact caacccccgg cacgaccgca gatgtaaaaa 2160
cagttttgct tgagcttcat gcccttggac cagccaagtt gctggacaca gccggattag 2220
acgaagtcgg tggacttggg gataaaaagc gccgtaaagc cctgaatacg ctgaaggagt 2280
gcgatgttgc tgtgctggtt gttgacactg atacggcagc cgccgcaatc aaatcgggac 2340
gccttgctga agccctggaa tgggaatcga aagtaatgga acaggcacac aagtataatg 2400
tcagtcctgt actgcttctg aatgtaaaat cacgcgggct gcctgaagcg caggcagcta 2460
gcatgcttga ggcggtcgct ggtatgcttg acccatccaa gcaaatccct cgtatgtcgc 2520
tggatttagc gtccaccccc ctgcacgagc gtagtacgat tacgtctgca ttcgtcaagg 2580
aaggagcagt gcgcagttca cgctatgggg ctcctctgcc ggggtgtttg ccccgttggt 2640
ctcttggacg caacgcccgc ttactgatgg taatcccgat ggatgccgaa accccaggtg 2700
gacgtcttct tcgtcctcaa gcgcaagtta tggaggaagc aatccgccat tgggctaccg 2760
tgctttccgt acgcctggat ttagacgccg cacgtggcaa attggggccc gaggcctgtg 2820
agatggagcg tcagcgtttc gacggggtaa ttgctatgat ggaacgtaat gacggaccca 2880
ccctggtggt gacagattct caagcgatcg atgttgtaca cccttggacc ctggaccgct 2940
catcaggacg tccgttggtt ccaattacta cctttagcat cgctatggcg taccaacaaa 3000
acggcggacg tttggacccg tttgtggaag gattggaagc attggagacg ttacaagatg 3060
gggatcgcgt tcttatttcg gaagcgtgta atcataaccg tatcacctcc gcttgcaacg 3120
acattggaat ggtgcagatc cctaacaagc tggaggcagc acttggcggg aaaaagttac 3180
aaatcgaaca tgcgtttggt cgcgagtttc ccgagcttga gagtgggggt atggatggat 3240
tgaagttagc gatccattgt ggagggtgta tgatcgacgc tcagaaaatg cagcagcgta 3300
tgaaagactt gcatgaggct ggggtgccgg tcactaatta tggggtgttt ttctcttggg 3360
cagcttggcc cgacgccctt cgtcgcgcat tggaaccgtg gggagtggag ccaccggtag 3420
gtactcctgc tacccccgca gccgcgcctg ctacggcagc gtccggggta taatacta 3478
<210> 3
<211> 46
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 3
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46
<210> 4
<211> 1850
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 4
aagaaggaga tatacatatg tcggtccccc tacagtgcaa tgcaggccgt cttttggcgg 60
gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg tgtatgtgtt ccagtgaccg 120
cacacggcaa agcatctgcc acgcgcgaat acgctggtga ctttcttcca gggaccacta 180
ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg ttatcgtaat ccggccgagt 240
ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc aaaggctgat gctcaggacg 300
caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa ggcttttgtt actgaacatg 360
cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg gcttaccttg gaggagtgcg 420
ccaccttaat taacgttgat tctaataatg tcgagttgat gaatgaaatc ttcgacactg 480
cgcttgctat caaagaacgt atctacggga accgcgtcgt gctgttcgcg cccttgtaca 540
ttgctaatca ttgtatgaac acttgcactt attgtgcgtt tcgctcagcc aataagggca 600
tggaacgctc tattctgaca gacgatgacc tgcgtgaaga agttgccgcc ttgcaacgtc 660
aaggtcatcg ccgcatttta gcccttactg gagaacatcc taaatacact ttcgacaatt 720
tcttgcatgc agtcaatgta atcgcttccg tgaagacaga gcctgaaggg tccattcgcc 780
gtatcaatgt cgaaatccca ccacttagtg tctcagacat gcgccgcctt aagaatacag 840
attcagttgg cacgttcgtt ctgtttcaag agacatatca ccgcgacaca ttcaaggtaa 900
tgcatccgtc aggtccaaag agcgactttg attttcgcgt cttgacccag gaccgcgcca 960
tgcgcgcagg cttggacgat gttggtattg gtgctttatt cgggttatat gattaccgtt 1020
atgaagtttg cgccatgtta atgcatagcg agcatttgga acgtgagtac aacgcaggac 1080
cacatactat ctctgttccc cgtatgcgcc ccgcggacgg aagcgagctt agtatcgcgc 1140
ctccttatcc tgttaatgat gctgatttta tgaaattagt tgcggtcctt cgtattgctg 1200
taccatacac aggtatgatc cttagcactc gtgaatcacc agaaatgcgc tcggcgcttc 1260
tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac tgatgtagga gcctatcaca 1320
aagatcacac gttaagtaca gaggcgaatt tgagtaagtt agctgggcag tttaccttgc 1380
aggatgaacg tccaactaat gagattgtta agtggctgat ggaggagggc tatgtcccgt 1440
cttggtgcac agcttgttac cgtcaaggtc gtacgggcga agacttcatg aacatctgta 1500
aggctggtga cattcacgat ttctgtcatc ccaatagtct gcttacgctt caagagtacc 1560
ttatggatta tgcagatcca gaccttcgta agaaaggcga gcaagtaatt gcccgtgaga 1620
tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg taagcgcctt gaacgcaaga 1680
tgaaacaagt attggagggg gagcacgatg tatatcttta accaggcatc aaataaaacg 1740
aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct 1800
ctactagagt cacactggct caccttcggg tgggcctttc tgcgtttata 1850
<210> 5
<211> 46
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 5
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46
<210> 6
<211> 1642
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 6
aagaaggaga tatacatatg tccgcattag tacttaagcc ctgtgcggca gtatccatcc 60
gtggctcctc gtgtcgcgca cgccaagtag ccccacgcgc tccgcttgca gctagcacgg 120
ttcgtgtcgc tcttgcaacc ctggaggcac cagcgcgtcg tttaggaaac gtcgcctgtg 180
ccgcagcggc accggccgca gaggcaccct tgtctcacgt ccagcaagca ctggccgaac 240
tggcaaagcc caaagatgac cccacgcgta agcacgtttg cgttcaagtc gctcccgcag 300
tgcgtgtcgc tattgctgaa accttagggc ttgcgccggg cgctacgaca ccgaaacaat 360
tagcagaagg cctgcgtcgc ttgggctttg acgaggtttt cgatacgctg ttcggggccg 420
acttgacgat catggaagag ggctcagaac ttttgcaccg tctgacggag cacttggaag 480
cacacccgca ctctgatgag ccgctgccta tgtttaccag ctgctgtcct ggttggatcg 540
cgatgctgga gaaatcatac ccagacctta tcccttatgt aagttcttgc aaatcccctc 600
aaatgatgct ggctgctatg gtcaaatcgt atctggcgga aaaaaagggg attgcaccta 660
aagatatggt tatggtaagc attatgccat gcacacgcaa gcagagtgag gcggatcgtg 720
attggttttg tgtcgacgcg gacccaacac ttcgccaatt ggaccatgtg atcacgaccg 780
tagagctggg gaatattttc aaagagcgtg ggatcaacct tgcggaatta cccgaggggg 840
agtgggacaa cccaatgggg gtaggctccg gtgctggagt actttttggc accactggag 900
gggtaatgga ggcggcgctg cgtactgcat acgaattatt tactggaacc cccttacccc 960
gcctttcgct ttcggaggtg cgcggcatgg atggcattaa agagactaac atcacgatgg 1020
taccggcccc tggcagcaag tttgaagaac tgttaaagca ccgcgcggca gcgcgtgccg 1080
aggctgctgc acacggaaca cctggtccct tggcctggga cggcggcgca gggttcacct 1140
cggaggacgg gcgtgggggt atcactcttc gtgtggcggt agctaatggc ttgggaaacg 1200
ccaaaaagtt gatcacaaag atgcaggcgg gagaggcgaa gtatgacttt gtagaaatca 1260
tggcgtgtcc agcgggatgc gttgggggcg gcgggcagcc acgttccacc gataaagcaa 1320
ttacccagaa gcgccaggct gcactttaca atctggacga gaagtcgact ctgcgccgct 1380
cccatgaaaa cccgtctatc cgtgagttat acgacactta tttgggtgag cccttagggc 1440
acaaagcaca cgaactttta catactcact atgtagctgg cggggtcgag gagaaggatg 1500
agaaaaagtg accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1560
ttttatctgt tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg 1620
tgggcctttc tgcgtttata ta 1642
<210> 7
<211> 46
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 7
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46
<210> 8
<211> 392
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 8
aagaaggaga tatacatatg gcgatgcgtt ccacatttgc tgcgcgtgtc ggtgccaaac 60
cggcagtgcg tggggcgcgt cccgcgtcgc gtatgtcttg catggcctat aaggttacac 120
tgaaaacgcc atcaggcgat aaaacaatcg aatgtccggc ggacacctat atcctggatg 180
ctgcggagga agccgggctg gaccttccct atagttgccg tgcgggcgcc tgttcatcct 240
gtgctggcaa agtggcagct ggaacggtag atcaatctga tcagtccttt ctggatgacg 300
ctcagatggg gaacggattc gtcctgacat gtgtcgcgta tcctacaagc gactgcacta 360
tccaaactca ccaagaggag gctttatatt aa 392
<210> 9
<211> 1189
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 9
aagaaggaga tatacatatg caaactgttc gcgctccagc agcttcaggt gttgccacac 60
gtgtcgcagg tcgtcgtatg tgtcgtccgg ttgcggcgac gaaggcttcc acggctgtta 120
ccacagacat gtcgaagcgc actgttccaa ccaagttaga ggaaggtgaa atgccgttga 180
acacgtacag taataaagct ccgttcaagg caaaggttcg ttccgtggaa aaaatcacag 240
gaccaaaagc cacaggtgag acgtgccaca tcattattga aaccgagggg aagatcccgt 300
tttgggaggg acaatcgtac ggtgtaattc cgccggggac caagatcaac tctaagggaa 360
aagaagtgcc tcatggtact cgtctttatt cgattgcttc tagtcgttac ggagatgact 420
tcgatggtca aacggcatcg ctgtgtgttc gccgcgcggt atacgtcgat ccagagactg 480
gaaaggagga ccccgcgaaa aaaggactgt gtagtaactt tttgtgtgat gccacaccag 540
gcacggaaat ttccatgaca gggcccacag gaaaagtatt gcttctgcca gcagacgcga 600
acgcgccatt aatctgtgtc gcaacgggga ctggaatcgc gccttttcgc tcattctggc 660
gccgttgctt catcgagaat gtcccaagtt ataagttcac tggccttttc tggttgttta 720
tgggtgtcgc taactctgat gctaaattgt acgatgagga actgcaagct atcgcaaaag 780
cgtatccggg acaattccgc ctggactatg ccttgtctcg tgaacaaaat aatcgcaagg 840
gcgggaaaat gtacatccaa gataaggttg aagagtatgc cgacgaaatt ttcgatttat 900
tggataatgg ggcgcacatg tacttctgcg ggttaaaggg gatgatgcca ggcatccaag 960
atatgttaga acgcgttgca aaagaaaagg ggctgaacta cgaagagtgg gtcgaggggt 1020
taaagcacaa gaatcaatgg catgttgaag tctactaacc aggcatcaaa taaaacgaaa 1080
ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta 1140
ctagagtcac actggctcac cttcgggtgg gcctttctgc gtttatata 1189
<210> 10
<211> 8735
<212> DNA
<213> Artificial Sequence
<220>
<223> 来自莱茵衣藻的HydA的示例性HPGC(产氢基因簇)
<400> 10
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gccctgtgcg gcagtatcca tccgtggctc 1740
ctcgtgtcgc gcacgccaag tagccccacg cgctccgctt gcagctagca cggttcgtgt 1800
cgctcttgca accctggagg caccagcgcg tcgtttagga aacgtcgcct gtgccgcagc 1860
ggcaccggcc gcagaggcac ccttgtctca cgtccagcaa gcactggccg aactggcaaa 1920
gcccaaagat gaccccacgc gtaagcacgt ttgcgttcaa gtcgctcccg cagtgcgtgt 1980
cgctattgct gaaaccttag ggcttgcgcc gggcgctacg acaccgaaac aattagcaga 2040
aggcctgcgt cgcttgggct ttgacgaggt tttcgatacg ctgttcgggg ccgacttgac 2100
gatcatggaa gagggctcag aacttttgca ccgtctgacg gagcacttgg aagcacaccc 2160
gcactctgat gagccgctgc ctatgtttac cagctgctgt cctggttgga tcgcgatgct 2220
ggagaaatca tacccagacc ttatccctta tgtaagttct tgcaaatccc ctcaaatgat 2280
gctggctgct atggtcaaat cgtatctggc ggaaaaaaag gggattgcac ctaaagatat 2340
ggttatggta agcattatgc catgcacacg caagcagagt gaggcggatc gtgattggtt 2400
ttgtgtcgac gcggacccaa cacttcgcca attggaccat gtgatcacga ccgtagagct 2460
ggggaatatt ttcaaagagc gtgggatcaa ccttgcggaa ttacccgagg gggagtggga 2520
caacccaatg ggggtaggct ccggtgctgg agtacttttt ggcaccactg gaggggtaat 2580
ggaggcggcg ctgcgtactg catacgaatt atttactgga acccccttac cccgcctttc 2640
gctttcggag gtgcgcggca tggatggcat taaagagact aacatcacga tggtaccggc 2700
ccctggcagc aagtttgaag aactgttaaa gcaccgcgcg gcagcgcgtg ccgaggctgc 2760
tgcacacgga acacctggtc ccttggcctg ggacggcggc gcagggttca cctcggagga 2820
cgggcgtggg ggtatcactc ttcgtgtggc ggtagctaat ggcttgggaa acgccaaaaa 2880
gttgatcaca aagatgcagg cgggagaggc gaagtatgac tttgtagaaa tcatggcgtg 2940
tccagcggga tgcgttgggg gcggcgggca gccacgttcc accgataaag caattaccca 3000
gaagcgccag gctgcacttt acaatctgga cgagaagtcg actctgcgcc gctcccatga 3060
aaacccgtct atccgtgagt tatacgacac ttatttgggt gagcccttag ggcacaaagc 3120
acacgaactt ttacatactc actatgtagc tggcggggtc gaggagaagg atgagaaaaa 3180
gtgaccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc 3240
tgttgtttgt cggtgaacgc tctctactag agtcacactg gctcaccttc gggtgggcct 3300
ttctgcgttt atatactaga gggctttaca ctttatgctt ccggctcgta tgttgtgtgg 3360
aaagaaggag atatacatat ggctcatagt ttaagcgcac attcccgtca ggccggagat 3420
cgcaaactgg gcgcaggtgc ggcatctagc cgcccatcat gtccttctcg ccgcattgtc 3480
cgcgtggcgg cccatgcttc tgcgtccaag gcgactcccg atgtacctgt tgacgatctt 3540
cctcctgcgc atgcccgtgc agcagtagcg gccgctaacc gtcgtgcgcg cgctatggca 3600
tcagcggagg ccgcggcaga gaccctgggc gatttcctgg gcttagggaa gggggggctt 3660
tcgccgggcg caaccgccaa ccttgatcgt gagcaagtat taggtgtgtt ggaggcggtc 3720
tggcgtcgtg gagaccttaa tctggagcgt gcgttgtaca gccatgccaa tgcggtgact 3780
aacaaatact gtggtggggg ggtctactat cgcggccttg tggagttcag taatatttgc 3840
caaaacgatt gctcatattg tgggattcgc aacaatcaaa aagaagtttg gcgctatact 3900
atgccggttg aagaggtggt cgaggtagct aagtgggcgc ttgaaaacgg cattcgcaac 3960
attatgttgc aagggggtga attaaagaca gagcaacgct tagcctactt ggaggcatgc 4020
gtccgtgcga ttcgcgagga gacaacgcag ttagaccttg aaatgcgcgc acgtgccgcg 4080
agtacgacaa cagcggaagc ggcagccagt gcacaggcag acgccgaagc taaacgcggc 4140
gagccagaat tgggtgtggt cgtatcctta agcgtcggag aacttcctat ggaacagtat 4200
gagcgtttgt tccgcgccgg cgcccgtcgc tatctgatcc gcattgaaac ctcgaatccc 4260
gacctgtacg cggcacttca cccggagccg atgtcctggc acgcgcgtgt agaatgcctg 4320
cgcaacctga agaaagctgg gtatatgttg ggcacaggag tgatggtcgg cttgccggga 4380
caaaccttac acgacctggc tggggatgtc atgttctttc gcgacattaa agcggacatg 4440
atcggtatgg gccccttcat tacgcagcct gggacgcctg caactgataa gtggaccgcg 4500
ctgtatccga acgccaataa gaacagccac atgaaatcta tgttcgatct gaccactgct 4560
atgaatgcac ttgtacgtat tacgatgggg aacgtaaata tcagtgctac gactgcatta 4620
caagcgatta tccccactgg acgtgaaatt gcgcttgagc gcggcgcaaa tgttgtcatg 4680
cctattttaa cgcctactca gtatcgcgag tcctatcagt tatatgaggg taagccctgc 4740
attacggata ctgctgttca gtgtcgtcgt tgcctggaca tgcgtttgca ctccgttggc 4800
aaaacgtctg cggccggagt ttggggcgat cctgcttcgt tcttgcatcc catcgttggc 4860
gtcccagtcc cgcacgactt gtcatcacct gctttggccg ctgctgcaag tgcggatttt 4920
cacgaggttg gcgcaggtcc ctggaacccc atccgactag agcgtctggt tgaagtgccg 4980
gaccgttacc ctgaccccga taaccacgga cgcaaaaagg caggagccgg gaaaggaggc 5040
aaggcgcatg actctcacga cgatggcgat cacgacgacc accaccacca ccacggagct 5100
gcccccgcgg gtgcagcggc tggaaagggt accggtgcag ctgcaattgg tggcggagcg 5160
ggggctagcc gtcaacgcgt agcaggggct gctgccgcct ctgctcgtct gtgtgcggga 5220
gctcgccgcg ctggccgtgt tgtcgcgtcg ccattgcgcc cagctgccgc ttgccgtggt 5280
gtggccgtca aggccgcagc tgctgctgcg ggtgaagacg ctggtgctgg tacgtctggc 5340
gtaggttcaa atattgttac gtctcccgga atcgctagca ctacggcaca tggtgttcct 5400
cgtatcaata ttggggtgtt cggcgtgatg aatgcaggaa agtctacact tgtgaatgct 5460
ctggcgcaac aggaagcatg cattgttgac tcaacccccg gcacgaccgc agatgtaaaa 5520
acagttttgc ttgagcttca tgcccttgga ccagccaagt tgctggacac agccggatta 5580
gacgaagtcg gtggacttgg ggataaaaag cgccgtaaag ccctgaatac gctgaaggag 5640
tgcgatgttg ctgtgctggt tgttgacact gatacggcag ccgccgcaat caaatcggga 5700
cgccttgctg aagccctgga atgggaatcg aaagtaatgg aacaggcaca caagtataat 5760
gtcagtcctg tactgcttct gaatgtaaaa tcacgcgggc tgcctgaagc gcaggcagct 5820
agcatgcttg aggcggtcgc tggtatgctt gacccatcca agcaaatccc tcgtatgtcg 5880
ctggatttag cgtccacccc cctgcacgag cgtagtacga ttacgtctgc attcgtcaag 5940
gaaggagcag tgcgcagttc acgctatggg gctcctctgc cggggtgttt gccccgttgg 6000
tctcttggac gcaacgcccg cttactgatg gtaatcccga tggatgccga aaccccaggt 6060
ggacgtcttc ttcgtcctca agcgcaagtt atggaggaag caatccgcca ttgggctacc 6120
gtgctttccg tacgcctgga tttagacgcc gcacgtggca aattggggcc cgaggcctgt 6180
gagatggagc gtcagcgttt cgacggggta attgctatga tggaacgtaa tgacggaccc 6240
accctggtgg tgacagattc tcaagcgatc gatgttgtac acccttggac cctggaccgc 6300
tcatcaggac gtccgttggt tccaattact acctttagca tcgctatggc gtaccaacaa 6360
aacggcggac gtttggaccc gtttgtggaa ggattggaag cattggagac gttacaagat 6420
ggggatcgcg ttcttatttc ggaagcgtgt aatcataacc gtatcacctc cgcttgcaac 6480
gacattggaa tggtgcagat ccctaacaag ctggaggcag cacttggcgg gaaaaagtta 6540
caaatcgaac atgcgtttgg tcgcgagttt cccgagcttg agagtggggg tatggatgga 6600
ttgaagttag cgatccattg tggagggtgt atgatcgacg ctcagaaaat gcagcagcgt 6660
atgaaagact tgcatgaggc tggggtgccg gtcactaatt atggggtgtt tttctcttgg 6720
gcagcttggc ccgacgccct tcgtcgcgca ttggaaccgt ggggagtgga gccaccggta 6780
ggtactcctg ctacccccgc agccgcgcct gctacggcag cgtccggggt ataatactac 6840
tagagggctt tacactttat gcttccggct cgtatgttgt gtggaaagaa ggagatatac 6900
atatgtcggt ccccctacag tgcaatgcag gccgtctttt ggcgggccag cgcccctgcg 6960
gcgtccgcgc gcgtctgaac cgccgtgtat gtgttccagt gaccgcacac ggcaaagcat 7020
ctgccacgcg cgaatacgct ggtgactttc ttccagggac cactattagt catgcgtggt 7080
ccgtggagcg tgaaactcat caccgttatc gtaatccggc cgagtggatt aacgaggctg 7140
ccatccacaa ggcgcttgaa acgtcaaagg ctgatgctca ggacgcagga cgcgtgcgtg 7200
agattttggc gaaggctaag gaaaaggctt ttgttactga acatgcgcct gtaaatgcgg 7260
aaagtaaatc cgaatttgta caagggctta ccttggagga gtgcgccacc ttaattaacg 7320
ttgattctaa taatgtcgag ttgatgaatg aaatcttcga cactgcgctt gctatcaaag 7380
aacgtatcta cgggaaccgc gtcgtgctgt tcgcgccctt gtacattgct aatcattgta 7440
tgaacacttg cacttattgt gcgtttcgct cagccaataa gggcatggaa cgctctattc 7500
tgacagacga tgacctgcgt gaagaagttg ccgccttgca acgtcaaggt catcgccgca 7560
ttttagccct tactggagaa catcctaaat acactttcga caatttcttg catgcagtca 7620
atgtaatcgc ttccgtgaag acagagcctg aagggtccat tcgccgtatc aatgtcgaaa 7680
tcccaccact tagtgtctca gacatgcgcc gccttaagaa tacagattca gttggcacgt 7740
tcgttctgtt tcaagagaca tatcaccgcg acacattcaa ggtaatgcat ccgtcaggtc 7800
caaagagcga ctttgatttt cgcgtcttga cccaggaccg cgccatgcgc gcaggcttgg 7860
acgatgttgg tattggtgct ttattcgggt tatatgatta ccgttatgaa gtttgcgcca 7920
tgttaatgca tagcgagcat ttggaacgtg agtacaacgc aggaccacat actatctctg 7980
ttccccgtat gcgccccgcg gacggaagcg agcttagtat cgcgcctcct tatcctgtta 8040
atgatgctga ttttatgaaa ttagttgcgg tccttcgtat tgctgtacca tacacaggta 8100
tgatccttag cactcgtgaa tcaccagaaa tgcgctcggc gcttctgaag tgtgggatga 8160
gtcaaatgag tgccggctcg cgcactgatg taggagccta tcacaaagat cacacgttaa 8220
gtacagaggc gaatttgagt aagttagctg ggcagtttac cttgcaggat gaacgtccaa 8280
ctaatgagat tgttaagtgg ctgatggagg agggctatgt cccgtcttgg tgcacagctt 8340
gttaccgtca aggtcgtacg ggcgaagact tcatgaacat ctgtaaggct ggtgacattc 8400
acgatttctg tcatcccaat agtctgctta cgcttcaaga gtaccttatg gattatgcag 8460
atccagacct tcgtaagaaa ggcgagcaag taattgcccg tgagatggga ccggacgcct 8520
ctgagccgtt atcggcgcaa agccgtaagc gccttgaacg caagatgaaa caagtattgg 8580
agggggagca cgatgtatat ctttaaccag gcatcaaata aaacgaaagg ctcagtcgaa 8640
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac 8700
tggctcacct tcgggtgggc ctttctgcgt ttata 8735
<210> 11
<211> 2070
<212> DNA
<213> Artificial Sequence
<220>
<223> pSB1C3 质粒
<400> 11
tactagtagc ggccgctgca gtccggcaaa aaagggcaag gtgtcaccac cctgcccttt 60
ttctttaaaa ccgaaaagat tacttcgcgt tatgcaggct tcctcgctca ctgactcgct 120
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 180
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 240
caggaaccgt aaaaaggccg cgttgctggc gtttttccac aggctccgcc cccctgacga 300
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 360
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 420
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 480
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 540
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 600
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 660
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 720
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 780
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 840
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 900
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 960
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 1020
ttggtctgac agctcgaggc ttggattctc accaataaaa aacgcccggc ggcaaccgag 1080
cgttctgaac aaatccagat ggagttctga ggtcattact ggatctatca acaggagtcc 1140
aagcgagctc gatatcaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt 1200
cattaagcat tctgccgaca tggaagccat cacaaacggc atgatgaacc tgaatcgcca 1260
gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catggtgaaa acgggggcga 1320
agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg 1380
ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt 1440
aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac 1500
tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac 1560
tatcccatat caccagctca ccgtctttca ttgccatacg aaattccgga tgagcattca 1620
tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg 1680
tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg 1740
actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc 1800
cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa 1860
atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgcccga 1920
tcaactcgag tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa 1980
aataggcgta tcacgaggca gaatttcaga taaaaaaaat ccttagcttt cgctaaggat 2040
gatttctgga attcgcggcc gcttctagag 2070
<210> 12
<211> 87
<212> DNA
<213> E. coli
<400> 12
ttgttaaata tagatcacaa ttttgaaacc gctcgggata tcagcgaaaa cataagcaaa 60
agtgaatgtt ttaagaacat tccgtaa 87
<210> 13
<211> 215
<212> DNA
<213> E. coli
<400> 13
atattccacc agctatttgt tagtgaataa aaggttgcct gtaaaattac aaaaacctta 60
cgcagcgtca agcggaatcg tgtcaatcat tgcgacaaat caatcctgtg cctaagcatt 120
acgcgactga ctcgcctcac tcttcctttg ggcttgagac cacatggggt cggcgccccg 180
aattttaaag ggcaattacg ataaaaatgt gattt 215
<210> 14
<211> 1452
<212> DNA
<213> Corynebacterium glutamicum
<400> 14
agcctctacc tcgctgcggt cgccagacca ctctgtatgg aacgaaccgt ctttgtcgat 60
gcgtttgtat gtgtgggcac caaaaaaatc gcgctgccct tggattaacg ctgctggaag 120
gcgctcggcg cgtaatgagt cgtaataact aagactacta gcaaagacgg gaatcggcaa 180
ccccagttgg gtggcggtca caatgacgcg gcgccagcta tcgattaagt ccccaagctc 240
ggatttaaag taaggatcta acagcaacga ctctaactct gcgttcgcgt catacgcttc 300
aacgatgcga tttaaaaatt tagcgcggat gatacaaccg ccgcgccaaa tagtcgctaa 360
atcacggggg tctacatccc agttgttctc atcagaaccg gctttaattt cgtcgaaacc 420
ttgtgcgtag gctaccaact tagatgcgta aagcgcacga cggacatcct cgacaaattg 480
agccttatct acgccaagcg cttcaaggtc tgtcagtacc ccagcgggaa gattgccctg 540
ggcggcagca cgttgtgaag ttgcaccgga cagggcacgg gcaaatacgg cctcgccaat 600
tccggtggtt gcaattccca aatccagagc cgcttttact gtccagcgtc ctgtaccttt 660
ttgccccgcc gcatccacga taacatcaat caacggcttg cctgtctctg cgtcgacctg 720
agataaaacc tcagccgtaa tttcgatcaa gtaggagtca agatcaccag cattccactc 780
cttaaatacc tcggcaattt cggccggctg cattccagcc gcatagcgca gcaggtgata 840
cgcttcccca attacttgca tatcggcgta ctcaatgccg ttatgtacca tcttgacgaa 900
gtgtcctgct ccgtctggcc cgatatgcgt aacacaaggg gtaccatcca cgttggcagc 960
aattgactca agcaaagggc ccaagctttc ataactcttc gcaggacctc ccggcataat 1020
agaaggtccg ttcaaggccc cttcttctcc gccggaaatg cccgcaccca caaagtgcag 1080
tccacgggca ctgatctctt tttcgcggcg gatggtatcc gtatacagag cgttgccacc 1140
atcgataatg atgtcgcctt cgtccattgc gtctgctaat tgattgatga cggcatctgt 1200
agcgttgccg gcctggacca tgatgatggc gcgacggggc ttctctaaac tcgctacaaa 1260
ctcctcgacc gttgcggagg gaataaaatt tccctcgctg ccatgatccg cgatcaactt 1320
atccgttttg tcggtactgc ggttatagac tgcaacggtg ttgccgttac gggcaaaatt 1380
gcgggcaagg tttgagccca taaccgcaag cccaacaacg ccaatttgag ccagattatc 1440
accgtttgtc at 1452
<210> 15
<211> 1005
<212> DNA
<213> Clostridium acetobutylicum
<400> 15
atggcgaaga ttgcaatcaa tggctttggg cgtattggcc gccttgcgct tcgtcgcatt 60
ctggaagtac cgggtctgga agttgtggcg attaatgatc tgaccgatgc aaagatgctg 120
gcacatttgt ttaaatacga ttcttcgcaa ggacgcttca acggggagat tgaggtgaaa 180
gaaggcgcgt ttgtcgtcaa cggcaaagaa gtcaaggtat tcgccgaggc cgatccagaa 240
aagttgccgt ggggagacct gggcattgat gtggtccttg agtgtacggg ctttttcact 300
aagaaagaga aggccgaggc acacgtccgt gcaggggcga agaaggtcgt gatctctgct 360
ccagctggga atgatcttaa aaccattgta ttcaacgtca acaatgaaga tctggacggg 420
acggaaacgg tcatctcggg tgccagctgc acgacgaatt gtctggctcc aatggcaaaa 480
gtcttaaatg acaagtttgg cattgagaaa ggattcatga caactattca tgcgtttacc 540
aacgaccaga atacgttaga tgggccgcac cgtaaaggag acctgcgtcg tgcacgtgcc 600
gcggccgttt ccatcatccc aaattcaaca ggtgccgcaa aagctatctc gcaagttatc 660
ccggatctgg ctggtaaatt agatggaaat gcacaacgtg taccggtgcc taccggttcc 720
atcactgagc tggtctcagt cctgaagaaa aaggtaacgg tagaagagat taatgcagcg 780
atgaaagaag cagccgatga gtcttttggg tacaccgaag atcccattgt atccgcggac 840
gtcgtgggaa ttaactacgg ttctttgttt gacgcaactc tgactaaaat tgtagacgtg 900
aatgggtctc aattggttaa gaccgctgca tggtatgata atgagatgag ttacacttct 960
cagctggtac gcacacttgc atatttcgcc aagattgcta aatag 1005
<210> 16
<211> 1455
<212> DNA
<213> Zymomonas mobilis
<400> 16
gtcataccag gtcactccgt cacgttctgc caatgcgata gcggtagacg gtccccaggt 60
tcccgatacg taagtcttag gtttcataga gttagctttc cacccctcac gaattccgtc 120
aatccagacc cactgggcct caacttcgtc acggcgtaca aacagagtgg cgtctccctc 180
aatcaggtca agcatcagac gctcataggc gatacggcgt ttgcggtcct taaaaacatc 240
agtcaacgac aagtccagcc acacctcgcg catgtgggct ccgttacggt ccaatccggg 300
ctctttcacc atcatcgaga tttgaatagt ctcgtccggt tgtaagacga tgcgtaactt 360
attaggttgc aagatgccgc cactcgaact gaagatagag tgcggtacag gtttgaactg 420
taccacgatt tcggagcgac gggccggcaa gcgtttaccc gtacggatgt aaaatggaac 480
accctgccaa cgccaattgt ccacatgggc tttaattgct acgaaagttt cagtatcact 540
tggttgccct aactcgtcga tgtatcctgc aacttccttt ccgccagaga cccccgcccc 600
gtactgcccg gttacggtgt gggtaaacac cgtatcattg ttgatagggc gcaaagcgcg 660
gaatacttta accttctcat cacgcacagc attggcctcc atgtgtgcgg ggggctccat 720
tgcgaccaac gctacaagct gaagaatatg actctgaacc atgtcacgca gggagccact 780
accgtcgaag taaccaatgc gcccttcaag tccgactgtt tccgcgaccg aaatctgtac 840
gtggtcaatc cccttgctat tccaaagggg ctcgaacaat gcgttcccaa aacgcaaggt 900
caaaagattc tgcaccgttt ctttgcccaa atagtggtcg atgcggtaaa cttgcttctc 960
tgagaatacc ttcagtacag catcgttaat atggtcgctg gaggcaaggt cttgtcccag 1020
gggtttttcc aatgccaaac gtgaggttgg ccccgctaat cccgcctgct ttaatccagc 1080
aatggcgcct tcaaaaagtg aaggcgccgt acttaagtaa attgcgatgc ctttttctac 1140
gggaccacac agatccgcta atttgccgaa ctgggtgggg tcggtgatgt ccacggtagc 1200
gtaaaaaagc ttatttaaaa acttcgcttt agcatcgtca ttcaaacggt cagaggccac 1260
gaaacggtcc agcgctttct ccgcaaagtc acggaatccg tcagtatcat actcggaacg 1320
cgaggtgcat acgatacgca agtcgtccgc cagtaagccg tctgcatcaa gcccataaag 1380
gctaggcagc aacatgcgtt ggcttaaatc cccggtgcta ccgaacagaa tcattgttga 1440
cacagtattg gtcat 1455
<210> 17
<211> 1506
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自莱茵衣藻的HydA的密码子优化的核酸序列,5' - 3'
(包括粗体显示的限制性位点)
<400> 17
cccgggatgt ccgcattagt tctgaagcca tgtgcggcgg tcagtatccg cggaagcagc 60
tgccgcgccc gtcaagtcgc gccgcgcgcg ccgttagcag cgtctacagt tcgtgttgca 120
ttagcaacac ttgaagctcc tgcgcgtcgc ctgggcaacg tcgcttgtgc agcagcggct 180
ccggcggcgg aggccccttt gagccacgtc caacaagcct tagctgaatt ggccaaaccg 240
aaagatgacc ccacacgcaa gcatgtttgt gtgcaagtcg ccccagcggt ccgcgtcgct 300
attgccgaaa cacttggact tgctcccggt gccacgaccc cgaagcaatt ggcggagggc 360
ttacgccgtc tgggtttcga cgaagtattc gacacgcttt tcggggcaga tttgacaatt 420
atggaagaag ggtcagagtt gttgcatcgt ttaacggaac atttggaggc tcaccctcac 480
tctgacgaac cgttgcccat gtttacctcg tgttgtccgg gttggattgc gatgcttgag 540
aaatcgtacc cggatttaat tccttatgtg tcctcgtgca aatctcctca aatgatgtta 600
gccgcgatgg tgaagtcata tcttgccgaa aagaagggca tcgcacctaa agacatggtg 660
atggtgtcaa tcatgccttg cacccgtaag cagtccgagg ccgatcgcga ctggttttgt 720
gtggatgctg accctacatt acgccagtta gatcatgtta ttacaaccgt agagttgggt 780
aacatcttta aggagcgtgg tatcaatttg gctgagttac cggaaggtga atgggacaac 840
ccgatggggg tgggttcggg agccggagta ttatttggga ccactggcgg cgtaatggag 900
gcagcattac gtacggccta cgaactgttc acaggtaccc cgctgcctcg cctgagtttg 960
agcgaggtgc gtggtatgga cggtattaag gaaacgaaca tcacaatggt tcctgctccc 1020
ggttcaaaat tcgaggaact gttgaagcat cgcgctgccg cacgtgcaga agcagccgca 1080
cacggtactc ctggtccact tgcctgggac ggcggggccg gatttacttc agaagacggt 1140
cgtggtggaa ttactttacg tgtcgctgtt gcgaatgggc tgggtaacgc taaaaagtta 1200
attacaaaaa tgcaggccgg agaggcaaaa tatgatttcg tagagattat ggcctgtccc 1260
gctggttgcg taggaggtgg gggccagccc cgttcaactg acaaagctat cacgcagaaa 1320
cgtcaagcgg cattatacaa tctggatgaa aaatcaacgc ttcgccgttc acatgagaat 1380
ccatcaatcc gtgaattgta cgatacttat ttaggtgagc ctctggggca taaggcacac 1440
gaacttctgc atactcatta cgtcgcgggt ggagttgagg agaaggatga aaagaagtag 1500
ggatcc 1506
<210> 18
<211> 1266
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自卡特氏团藻的HydA(Hyd1)的密码子优化的核酸序列,5' - 3'
(包括粗体显示的限制性位点)
<400> 18
cccgggatgt acgtttgcgt cgcacaagtt acgttacatg attgcttagc atgctcaggg 60
tgcatcacat ctgcggaaac ggttttgctt cagcaacagt ccggggatga gttcttatcc 120
cgcttggcag acccgcacac tactgtcgta gttaccgtct cgccccaatc gcgcacagct 180
ttggcggctt actatggatt atgcccgtct caggctcttg cccgccttgt gggctggttg 240
aagtggcttg gggttcgcgc cgtatgggat ctgacaacag cccgcgatct tgtattgttg 300
gaagaggcag ctgagttcat gaaccgttgg gtctgcatgt atgttagcgc cgggcctctt 360
ccggtcatgg gcagttcatg tcctggcaca ggctgggttt gttatgctga aaagacgcac 420
gggacgcgtg tattacccta tttgagcacc acccgttcac cccaaggagc aatgggtggc 480
ttggtaaagt ccctggtggc agcagcttgg ggcgttactc cagggtcttt gtaccacgtc 540
acaattatgc cgtgttatga caagaaattg gaagcatctc gcgatgaatt aaccacaacg 600
gcgacaacta ctaccgctgc ggggacagac gcggctggag caggtgccgc cgtaggcggg 660
cctctgcctg aagtgatggt ccgtcatgca accgcagcgc ctgatccgtt gcttccgggc 720
gtggtaccag ccgacgacca gctgtactcc cttccacatg gctccagctc gggtggatac 780
gcggacttcg ttttccgcac tgccgcgcgc gagttgtggg gggtagaagt tccgccagga 840
cctttaccat ggcgtactcg tcgtaacgcc gacttacagc ctcgtgttgg tgccccaggc 900
caatctctgg tcgttgcgcg tgtgtatgga ttccgcaata ttcagacact tttacagcag 960
cttaagcgtg gacgctgccc ttatcattat gtggaagtca tggcttgtcc tagcgggtgt 1020
ttgaacggag gaggacaaat caaaccgggg ccaggggtaa cgccgcaaca attaattgaa 1080
caattggagc ttttgtatga cgttgcggca cgttctccag cagacaaccc ggcggtagca 1140
gctttatatg gctcttggtt aggcggtcgt ccaggggcac cccccgctcg tcaactgtta 1200
catacgacat ttcgcgagcg cgaaaagact gtaactgccg caaccgtcac gaattggtag 1260
ggatcc 1266
<210> 19
<211> 1437
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自蓝氏贾第虫的HydA(Hyd1)的密码子优化的核酸序列, 5' -
3'(包括粗体显示的限制性位点)
<400> 19
cccgggatgc ctccaaaacc ccaacacgat gtaacaggcg tggactccaa taacgcgatc 60
atgattgatt acgcaaagtg cattggctgc aacatgtgca tcaaagcatg cgacgtgcaa 120
ggtattggtg tttacaagca gaacgaaaaa ccgaagtacc cgcctatcgt gaagctgagc 180
accctgttta atagcgattg tatcggctgc ggtcaatgtg caacgatttg tccggtggac 240
gcgattgctc caaagaacaa tctggaaatt tacaaaggcg aatctgcttc caaaaaagtt 300
cgtgtggcgt tgatcgcgcc aagcactcgc gtggcgtttg gagatgtctt cgggctgccg 360
atcggtacaa ataccattta ctccctgatt cgcatgctga agcaatatct gggtttcgat 420
tatgtgttcg acgtgaattt cggcgcagat gaaaccaccg tcatcgacac ccaagagctg 480
ttgcacttca aacacgaggg ccgtggtccg gtgttcacca gctgctgccc ggcgtgggtt 540
aacctctgtg aaatgaagta cccggagctg ctgccccagg ttagcaccgc taaatcttgt 600
gttgcaatgg tagcgaccct tgtaaaaaga cgttgggttc aagaacattt aatcccgaag 660
ggtattgtag acagcgttga cgatgtctac gtggctgata ttatgccgtg taccgcgaaa 720
aaggatgaaa gcatgcgtcc acaactgaac cgcgatgtgg acatctgcct gacggtgcgt 780
gaagttgcgg agcacctgta ttttctgcac ggcgcgcgct tgacgctgga ggaagtcgag 840
gcggatgcgt tggttttgcg tccgggccgt agcacgcaga aaaagtggga ctttgacgct 900
ccgtttaaca ccgtgtctgg tggctcccat atctttggta agaccggtgg cgttgccgag 960
acgtgtctcc gtttcatcag ctatatgaaa aagtcgccga tagaaaacgt taaggaggaa 1020
ttgctgaaag agttcaagac gccgggtcag ctggtgcaaa ccgttaagct ggtcagctgc 1080
gagatcgccg gtgagactta tcgtgccctg attgcgcatg gcggttcagc aatcaatgcc 1140
gccgcgcgta tggtgctcaa taaagaggtg gagtgcgacg ttgttgagca gatggcctgt 1200
ccgggtggct gccagaacgg tggaggcatg ccgaagatca agggtaaaaa agaggcagtt 1260
ttgacgcgtg cgtctacctt ggacatcctg gacggtaaag agcgctttgc gagcgcgggc 1320
gagaacaaaa ctctgtgggg tttcaacggc tgcttaaccg aacacgaagc gcacgagttg 1380
cttcacaccc attatcagca tcgcccggtg gaatcgctgc tgccgcagta gggatcc 1437
<210> 20
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自诺氏内阿米巴的HydA(Hyd1)的密码子优化的核酸序列,5' -
3'(包括粗体显示的限制性位点)
<400> 20
cccgggatgc ctccaaaacc ctcacacact gtaacaggcc acgaccacaa ccacagcatc 60
cagtttgact ggagcaagtg tatgggctgc ggtatgtgtg caaccaaatg caccttcggc 120
gtattggtta agcagccgcc gaagatcccg ccatttgtcc agccgaaccg tgaaaaactg 180
agccaagaga acaccgataa aacgcgtgtc ctgatcgatg aaagcgagtg caccggctgc 240
ggtcaatgct ctctggtgtg caactttgga tctatcaccc cgatcgacca cctcgttgac 300
accttcaaag caaaggaggc gggcaaaaaa ctcgtggcca tgattgcccc gagcactcgc 360
cttggtgtcg ctgaggctat gggtatgccg attggctcca ccgctatggc gcagctggtg 420
cattgtctgc gtctgattgg ttttgactac gtttttgacg tggacgcggg tgcggataag 480
acgaccatgg acgattacgc ggaagttatc gaaatgaaaa aggagggtaa gggtccggcg 540
atcaccagct gctgcccggc gtggattgag ctggtggaga aagaatatcc ggatttgatc 600
ccgaacgtgt ccactgcgcg tagcccgatc ggctgcttgg ccggttgcat caaacgtggt 660
tgggcaaaag atgttggcat cgcggtagag gatttgtaca ccgtgggtat catgccttgt 720
attgcgaaga agacggaatc ccaacgtcag caaattcatc aagattacga cgcaagctgt 780
acgtctaacg agattgcggc gtacttcaag aagcacctgc caccggaaga gtgcaaattc 840
acccaggagc gcgaggaagc tctggcaaag actgaggacg gccaatgtga tctgccgttc 900
cgtcgcatta gcggtggctc caacattttt ggtaagaccg gcggggtgtg tgaaaccgtg 960
ttgcgggtga ttgcgcgtaa tgcgggtgtt gactggaata cgtgcaccgt taacaaagag 1020
gaaacattca aacacgccgc tagcggttcg accatgacca atctgagtgt tgacatcggc 1080
ggaactataa tcaccggggc agtttgccat ggtggttatg caatccgtca tgcctgcgaa 1140
ctgattcgca aaggtgaact gaaagtcgac gttgttgaga tgatggcctg tgttggcggc 1200
tgcctgggcg gtgctggcca gcctaagatc ccgccggcga agaagctgga aatggataag 1260
cgcagagtga tgttagatat tctggaccag caaacggaca ttcgtgcagc gaatgaaaac 1320
accgacgtgc taggctggat tgataaacac ttcgaccacc agggtgcgca tcaacatctg 1380
cacacctatt tcaccccgcg ttatcagaat tagggatcc 1419
<210> 21
<211> 1413
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自嗜多变形泥杆菌的HydA (Hyd1)的密码子优化的核酸序列 , 5' -
3' (包括粗体显示的限制性位点)
<400> 21
cccgggatga agaacaaaac agtatcaaat gataaaatag acaataaact gaactgctcc 60
gaaaacctgg aaaaccgtac catcgacaaa agcttctaca ccttttcacg tgataccagc 120
aagtgcatta agtgctacaa gtgcgtgaaa gtttgcaagg acactcaggg catttccgtt 180
tttcaggttg aggaggacgg cacggtgggc atcaaagagg agaatatggc ggccaccttg 240
tgtatcagct gtggtcaatg tattaaagtg tgcaccgcag gtgcgctgaa ggagaaatcc 300
aacatctctc tgttgaagga gcagttaaat aacccgaata agcacgttgt cgcgcagctg 360
tctccaagct tcaaacacac cattggtgat ggcttcggca tcagctcggg taccgatact 420
tccccgaaaa tcatcagcgc tctgaaagaa attggtttct ctaaggtttt cagtaccggt 480
ttcgccagcg acgtgaatat cgttgagacc agcgcggatc tgaaaaaacg cctagatgaa 540
aacggtccgt tcccggtgtt cacctccacg tgcacgggtt ggattaacta tgcggaaaag 600
ttttgtccgg agttcctggg gctgctctct ccgtgcaaaa gcccgcaaca gatcctgggt 660
agcctgagca agtcctacta cgaagagagc attgacatca gcagagaaaa tatctttagc 720
gtggcgctga tgccttgcat cgccaaaaag gatgaagcta atcgttttga catgaaggac 780
gaatatggta acaaagatgt ggacctggtc ctgaccgtga atgaagttgc tagccttttg 840
aacaaaaagg gcattgattt aaacaattac tctaagttcg gtacttttga taagccgatg 900
aaatccgaca ctggttcttc gcgtattaag gcggttacgg gtggcctggc agaggctatc 960
ctgcgcaaca ccgcacacat gatcggtgaa gatccgtttt ctgtagacct gaagaagctg 1020
cgtggtatgg atggtattaa gctcacgagc gtggttctgg gcgggaaaaa attaaacatt 1080
gcggtcgtga acggcatcaa gaacgtgccg gttattctgg acatgattaa agatggcatt 1140
accgagttcc acttggtcga ggttatggcc tgtccgggtg gctgcgtcgg cggcggtggt 1200
atcccgttgt cagaagaccc ggacattatc caaaaacgcg cagagaaaat ctactcgtac 1260
gacgcgagca gcgaaattcg ttgtagctgg gaaaacccag atgttaaaac cctgtatagc 1320
gagtacctga aggagccgct gggagaggag tctcaacgtt tgtttcattt tcattataaa 1380
aaccgccgta ccaaacgtat cttctaggga tcc 1413
<210> 22
<211> 1506
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自卡特氏团藻的HydA (Hyd1)的密码子优化的核酸序列 , 5' - 3'
(包括粗体显示的限制性位点)
<400> 22
cccgggatga gtgctatgct atcttcatta acaaattctc gcttgggcgc ttacgtgccg 60
caagtggcgg taagccgtta tggttccaag ccggtctacg tcccgtgcgt gccgtttcgt 120
aagtgcacct cggcggtgcc agtgccggtt aagacggtgc aagaaggtaa ttcggtcaga 180
cttatgccag cggcggcggc tccggcgggt gcggcagcgg acccacattg gaaacaagca 240
tttgcagagc ttgataaacc gaaagccgaa cgtaaagtta tgatcgcaca ggttgctccg 300
gcggtgcgcg ttgccatctc cgagagcttt ggtctggcac cgggggctac cactccgggt 360
cagctggccg agtccctgcg ttgtctgggt tttgatatgg tgttcgacac cttgtacggc 420
gcggacctga ccattatgga agagggcact gagttgctgt cccgtctgca agcgcaattg 480
gaagcccacc cgcatagcga agaaccgctg ccgatgttta ccagctgctg tccgggctgg 540
atcgccctgt tggagaagag ctatccggaa ttaattccgt atgtgtctag ctgcaagtct 600
ccgcagatga tgttaggcgc tatggtgaag acctatctgg cagagaagaa aggcatctct 660
ccgagcgaca tctccatggt ttcgattatg ccgtgtgtga ggaagcaagg tgaagcggac 720
cgtgattggt tttgcagcgg cggcgccggc gttcgtgatg tggaccacgt tattaccacg 780
gcggagctag gcaacatcct gaaagaacgt aatatcaacc tccccgaact gccggaaggc 840
ggttgggatg agccgctggg ttcgggtagc ggtgcgggcg tcgttttcgg tacaaccggt 900
ggtgttatgg aagcggcgct gcgcaccgcg tacgagttgg ttacccagca accgctgcct 960
cgtttgaatc tgagtgaggt tcgcggtatg gacggcatta aagaaaccga aatcaagatg 1020
gttccgcctc cgggtagcaa attcgccgag cttgttgccg cacgtgcagc ggcgaaggct 1080
atggatgaag cggccgcgag cgcaggcgcg attaagtggg atggtggcag caacttcacc 1140
gcggacgacg gtgctaaggg catcaccctg cgcgtggccg tggctaatgg tctgggaaac 1200
gcgaaaaagc tgctgacgaa aatgcagacc ggtgagtgca aatacgactt cgtggaaatt 1260
atggcatgtc cgtctgggtg cgttggtggt ggtggtcagc cgcgcagcac cgataaacag 1320
gtggcggtca aacgtcagca ggcactgtac gaccttgacg agcgcgcaac gatccgtcgt 1380
agccacgaga acccggctgt ccaaaaagcg tacgaagatt tcctgggcga gccgaacagc 1440
cacaaagcgc acgatctgtt gcacacccat tatgttccgg gtggcgttga cacggagtag 1500
ggatcc 1506
<210> 23
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自阴道毛滴虫的HydA (Hyd1)的密码子优化的核酸序列, 5' - 3'
(包括粗体显示的限制性位点)
<400> 23
cccgggatgc tagcgtcaag tgcaacagct atgaaaggct tcgccaatag cctccgtatg 60
aaagattaca gcagcaccgg tattaacttc gacatgacta agtgcattaa ctgccaaagc 120
tgcgttcgcg cctgcacgaa catcgctggc caaaacgtct tgaagagctt gacggtgaac 180
ggcaagtccg ttgtgcagac cgttaccggt aaaccgctgg cggagaccaa ctgcatcagc 240
tgcggtcaat gtacccttgg ctgcccgaag ttcaccatct tcgaggcgga cgccatcaat 300
ccagttaaag aggtcttgac caagaaaaac ggtcgtattg ccgtgtgtca gattgctccg 360
gcgattcgta tcaacatggc tgaagctctg ggcgttccgg ctggtacgat ctccttgggt 420
aaggtggtga ccgcgctgaa acgtctgggt tttgactacg ttttcgatac caatttcgct 480
gccgatatga ccatcgtgga ggaagcgacc gaactggttc aacgtttgtc tgacaaaaac 540
gcagtgctgc ctatgtttac ttcatgctgt ccagcgtggg ttaattacgt agagaaatcc 600
gatccgagct tgatcccgca tctgagctct tgtcgtagcc cgatgagcat gctgagcagc 660
gttatcaaga acgtctttcc gaaaaagatt ggtacgaccg cagacaaaat ctacaatgtg 720
gcgatcatgc cgtgcaccgc gaagaaggac gaaattcagc gcagccaatt taccatgaag 780
gatggtaaac aagagacagg tgcggtgctg acttctcgtg aactcgcgaa aatgattaag 840
gaggcgaaga tcaacttcaa agagctgccg gatacgccgt gtgataactt ttattctgaa 900
gcatcgggcg gcggtgcgat cttttgtgca accggcggcg tgatggaagc cgcggtgcgc 960
agcgcgtata agttcctgac gaagaaagag ctggcaccga ttgacctgca agacgttcgc 1020
ggtgttgcga gcggcgttaa actggcggag gtggatattg ctggtaccaa agtaaaagtg 1080
gcggttgcgc acggcattaa gaacgccatg accctgatta agaagatcaa atcgggtgaa 1140
gagcagttta aagacgttaa gttcgtggaa gtgatggcat gtccgggtgg ctgcgtggtt 1200
ggtggtggca gcccgaaggc taagaccaag aaagctgtcc aggcacgatt gaatgcaacg 1260
tactccattg acaaaagctc caaacacaga acttctcagg acaacccgca gttgttacag 1320
ctgtataaag aatcgtttga aggtaaattc ggtggtcatg tcgcgcacca cctgctgcac 1380
acccattata agaatcgtaa agtaaatccg tagggatcc 1419
<210> 24
<211> 1470
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自小核桃形巨球形菌的HydA (Hyd1)的密码子优化的核酸序列, 5' -
3' (包括粗体显示的限制性位点)
<400> 24
cccgggatga aggctgtaga gggatttgaa tcaaaatata aattttacga caagcgcgtg 60
ccgattgcgg acgacaaccc agctgtgcac tttgacgaaa cgaaatgcaa aaattgtacc 120
ctttgccgtc gtgcgtgtga aactacgcaa accgtgctgg actattacag cctggaacgc 180
accggcgatg ttccggtttg tgttcactgc ggtcaatgtg caaatgcctg cccgtttggt 240
gccatgatgg aagttgatga tacgaactta gtcaaagctg cgatcgcgga cccggataag 300
gtggtggttt tccaaacggc accggcggta cgtgtggcca ttgcggaaga gttcggtgcg 360
gaggcgggta cattcgcaca gggtaaaatg atttcagcgt tgagagccct gggtggcgac 420
tacgtgttcg acaccaactt tggcgctgac atgaccatca tggaagaaac ttccgagctg 480
gtgcgtcgta ttaccactgg taacttcgca atgccgcagt ttaccagctg ctgcccggcg 540
tgggttgagt ttgctgagac cttctacgca gaatacatcc cgcatctgtc cagcgcgaag 600
agcccgattc tgatgcaaaa caccacggaa aaaatctggt ttgccgagaa ggcgggcatc 660
gatccgaaga agatggtgac ggtttgcgtt accccgtgta ccgctaaaaa agccgagatc 720
aagcgcaaag aattgaatgc tgcggctgag tactggcata ttgatggctt aaaggactcc 780
gacatttgca tcacgacccg tgaactggca cgttggctga aagcggagaa cattgacttc 840
aataccctgg atgatggtat ttttgatagc cacctgggcg aggcgagcgg tggtggcatc 900
atcttcggca gcaccggtgg tgtcatggag tccgcactgc gcagcgcgta ttacttctat 960
accggtaaac cgatgccagc ggagtatata ccgtatgaac cggtgcgtgg cttggacggc 1020
gttaaagagg cgaccatcga cttcagcggt atctctctgc atgtcgcagt cgtgagcggt 1080
ctcggcaatg cgcgtcgttt tctggataaa attatggcgg acggcacctt caaagattac 1140
acctttatcg agttcatggc gtgccagggt ggctgcatca acggtggtgg ccaaccgaag 1200
gttaagatgc ctctggttca gaaaaccaac caggctcgca tgaatagctt gtacaaacgt 1260
gattcggagg tttcgattaa ggccgcctgg gaaaaccccg aaatccagga actctacagc 1320
gacttctacg gccagccgct gtctgagcgc tctgagaagt atattcacac cttctttgag 1380
gataagtccg gcaacctggg tgaaggtggt gctgtgaccc cgcaaacgaa cccattgtct 1440
ccgaagtata agccgattga atagggatcc 1470
<210> 25
<211> 1482
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自小韦荣球菌的HydA (Hyd1)的密码子优化的核酸序列, 5' - 3'
(包括粗体显示的限制性位点)
<400> 25
cccgggatgt caaaatatca atttttagat agaagggtcc cgattgagga cggtaacatc 60
gctctggttc aggatttgac taagtgcaaa aattgtagcc tgtgtcgtaa agcttgcgcg 120
gtcgatatgg gcgtctttga ctactatgat ctgaccacga atggtgacca cccgatttgc 180
atccactgcg gtcaatgtgc gtccatctgc ccattcgatt ctattaatga acgcagcgag 240
atcgatgaag ttaaggcggc gattgcggac ccgaacaaaa tcgtcatctt ccagaccgca 300
ccggctgtgc gtgtgggtct tggcgaggag ttcggcttgg aggcgggtac ctttgtggaa 360
ggcaagatgg ttgcagccct gagaaagctg ggcggtgact acattctgga caccaacttt 420
ggtgcggaca tgaccatcat ggaagaggcg tccgagttgc tggaacgtgt tatcaactcg 480
gatgctgttc tgccgcaatt taccagctgt tgtccggcgt gggttaagtt cgcggagaca 540
ttctacccgg agttcctgcc taacctgagc accgcgaagt ccccgattgc catgcaggca 600
ccgacccaga aaacctattt cgccgaaaaa atgggtctgg acgcgaagca gattgtggcg 660
gtggccgtaa ctccgtgtac tgccaagaaa tttgagattc gccgtgacga aatgaacagc 720
agcgcagagt attggaatac cccagaaatg cgtgataccg attactgcat caccacgcgt 780
gagctggcaa agtggctgcg cgcagaagaa atcaactttg acgacctcga ggacagcgca 840
tttgatccgc tgatgggtga ggctagcggt ggcggtatta tttttggcaa caccggcggc 900
gttatggaag ctgccatgcg cgcggcgtat aaaatggcaa ccggtgaaga tgccccccaa 960
acccttatcc cattcgaggc catcagaggc atggatggtg cgcgcgaagc tgatgttgtg 1020
atcggtgaca agaccctgca cgttgcggcg gtgcatggta cgggcaattt acgtaaattc 1080
attgagcgca tgcgtgcgga gaacatccac tacgacttca tcgaggtgat ggcatgccgt 1140
ggtgggtgca tcggcggcgg tggccaaccg cgtgttaaat tgccgatggc cgacaaagcg 1200
cgcgaagctc gtatcgcgtc tctatacacc cgtgacgcag aagtgactgt aaaggccgcg 1260
tgcgataatc cggatattca gaaattatat gcagagtttt tcgacggcaa accgatgagc 1320
cataaagcac atcacatgct gcataccacg ttcgtgaatc gtagcgaaga tttgggtccg 1380
aacggtgcgt gcaccccggc gacgtgcccg accagtgttc cgaacctgaa aaaggctgct 1440
gaagcggcga aggcggcggc tgaagttaac tcttagggat cc 1482
<210> 26
<211> 1443
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自非典型韦荣球菌的HydA (Hyd1)的密码子优化的核酸序列, 5' -
3' (包括粗体显示的限制性位点)
<400> 26
cccgggatgt cacaatttga atttatagat aaaagggtcc ctattgcgct cgacaacccg 60
agcatctatc acgatatctc caaatgcaaa aactgcacct tatgccgtcg tgcgtgcgcc 120
gacgtgatga gcgttctgga ctactacgat ctggaagcga ccggtgacgt gccagtttgt 180
attcattgtg gacaatgtgc agcggcgtgc ccgtttgact cgatgcatgc aaaaagcgaa 240
ttggataagg tgaaggtggc tattgccgat ccggataaaa tcgtcgttat tcagaccgct 300
ccggctgtac gcgtgtcgat tggcgagggt ttcggctttg aaccgggtac gtttctcgag 360
ggcaaaatgg ttagcgcgct gcgtaaactg ggtgccgact acgtggtcga cacgaacttc 420
ggcgcggatc tgaccattat ggaggaggcg tctgaattgg ttgatcgtct gaagaacggt 480
ggcacgatcc cgcaattcac cagttgctgc ccggcttggg ttcgttttgc ggaaatctac 540
ttcccggagt tgatcccaaa tctgtctagc acccgtagct gcatcgcaat ggaggccgct 600
atgattaaaa cctatttcgc tgagaaaaag ggtattaacc cggcgaatat cgtgtccgtc 660
tccgttaatc cgtgtactgc gaagaaggct gagacaaagc gcgtggaaga aaatgctgcc 720
gcgcgttatt acgacgacga atcccttggc atggataccg acatcagcat taccaccaga 780
gaatttatcc gttggctgaa cgacgaaggc gtggacttcg agtccctgga ggacagccag 840
tttgatgatc ttatcggtat ggaaactggc gcgtctatca tttttggtaa taccggtggc 900
gttatggagg ctgctatgag aacggcgtac aaactgatta cggataagga gccgccaccg 960
tatgcactga cccacctgga ggatgtgcgc ggtatgaacg gtgtgaaaga ggcgacggtt 1020
cagctgggtg atgacgtgac tctgagcgtt gcggtggttc acggcggtaa gaacacccgt 1080
gattttttga atgcgctgaa ggagaacggc aagcactatg acttcatcga agtcatggca 1140
tgtccgggtg ggtgcattgg tggcggtggc caaccgcgta ccaaactgcc gcaggcggtt 1200
aagaccaaag aggcgcgtat cggcggtctg tacaaggcgg acgaagaata taagtacgtt 1260
gccagctatg aatcaccgga aatccaagag ttgtacaaga acttcttggg agaacctctg 1320
ggtcacaaag cacatgaatt gctgcatacc cacttcaccg atcgcagcgc acagttaggc 1380
gaccgcaaag atgttgtccc ggagacctgt ccgaccagcc cgaaatacaa gggttaggga 1440
tcc 1443
<210> 27
<211> 1413
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自双酶梭菌的HydA (Hyd1)的密码子优化的核酸序列, 5' - 3'
(包括粗体显示的限制性位点)
<400> 27
cccgggatga agcacctatt tacagaaaaa gtagttccga tcgagctgga taacccgtcc 60
attcagattg actttgataa gtgcatcaag tgcggtctgt gtaaacgcgt ttgtgaaaac 120
gagattggtg ttaatggtta tttcgacctg gagaagaccg gtgacatcgc catctgcatc 180
aactgcggcc aatgtgttca ggcatgtcca aaaaaggcga tcacccaggt tatcgatgtg 240
gatcgcgtga aggaagcgat caacgatccg gaaaagattg ttatcttcag cacagcgcca 300
gctgtgcgtg tcgcactggg cgaagaattt aacctggaag aaggcgcgta tgttgaggac 360
aaaatggtgg acgccctgcg taaactgggt ggagattacg tttttgacgt tacctttggc 420
gccgatatga ccatcatgga agaggcgaac gaacttgttt ctcgtatcaa aaacggcaaa 480
ggcaaaaccc cgcaatttac cagctgctgc ccgtcctggg ttaagttcgc ggaaacgttc 540
tatccggagt tgattccgaa tctgtctacc acgaaatctc cgattggcat tcagggtgct 600
gtcatcaaga cctatttcgc acagaaagca aatatcgacc cggagaaaat cgtgaacgta 660
accattactc cgtgcaccgc taagaagtac gaaattgacc gtccggagat gaatgcgagc 720
gcaaaataca acaaaagcga aaatatgaga gataatgaca tcatcctcac cactaaggag 780
ctggcgcagt ggctccgtga cgaagagatc gacttcaacg ctttggaggg ctcgaaattt 840
gacaacatct tgggcttggg tagcggtgcg ggcattatct tcggtaatag cggtggtgtg 900
atggaagccg cggtgcgcac ggtctacaat atcctcaccc atgagaaccc acataaagaa 960
ctgctgcact ttaatccggt tcgtggtctg gaagacgtga aggaggctac ccttaccatt 1020
ggcgatacca ccctgcgcct ggcagcggtg caaggcacgg cgaacgtgcg tacgttgatc 1080
gaaaagctga aatccggtga ggtggagtac gacttcatag aggtaatgac ttgcaaaggt 1140
ggttgtattg gtggcgctgg tcaaccgaag atgaaagcgc gtattagcaa tgagatgcgt 1200
ctcaagcgca ttgagggtct gtacgataag gacaagcaca ttgcggtcaa atgcagctat 1260
gaaaacccgg atgtcatcaa cgtgtacaag gagttcttca aacaaccgct gagccattta 1320
tcccacgagt tgctgcacac cacctttgaa agcaagcacg atatgttggg tctgaaggat 1380
gacaacaacg tttcggatat tggctaggga tcc 1413
<210> 28
<211> 83
<212> DNA
<213> E. coli
<400> 28
ggtaaatttg atgtacatca aatggatccc cttgctgaat cgttaaggta ggcggtaata 60
gaaaagaaat cgaggcaaaa atg 83
<210> 29
<211> 52
<212> DNA
<213> E. coli
<400> 29
ctcttgatcg ttatcaaatc ccaatactgt gttagagagt ataatgccct ta 52
<210> 30
<211> 8797
<212> DNA
<213> Artificial Sequence
<220>
<223> 示例性HPGC(产氢基因簇),其具有编码来自莱茵衣藻的HydA的选择性密码子
优化的核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 30
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg tccgcattag ttctgaagcc 1740
atgtgcggcg gtcagtatcc gcggaagcag ctgccgcgcc cgtcaagtcg cgccgcgcgc 1800
gccgttagca gcgtctacag ttcgtgttgc attagcaaca cttgaagctc ctgcgcgtcg 1860
cctgggcaac gtcgcttgtg cagcagcggc tccggcggcg gaggcccctt tgagccacgt 1920
ccaacaagcc ttagctgaat tggccaaacc gaaagatgac cccacacgca agcatgtttg 1980
tgtgcaagtc gccccagcgg tccgcgtcgc tattgccgaa acacttggac ttgctcccgg 2040
tgccacgacc ccgaagcaat tggcggaggg cttacgccgt ctgggtttcg acgaagtatt 2100
cgacacgctt ttcggggcag atttgacaat tatggaagaa gggtcagagt tgttgcatcg 2160
tttaacggaa catttggagg ctcaccctca ctctgacgaa ccgttgccca tgtttacctc 2220
gtgttgtccg ggttggattg cgatgcttga gaaatcgtac ccggatttaa ttccttatgt 2280
gtcctcgtgc aaatctcctc aaatgatgtt agccgcgatg gtgaagtcat atcttgccga 2340
aaagaagggc atcgcaccta aagacatggt gatggtgtca atcatgcctt gcacccgtaa 2400
gcagtccgag gccgatcgcg actggttttg tgtggatgct gaccctacat tacgccagtt 2460
agatcatgtt attacaaccg tagagttggg taacatcttt aaggagcgtg gtatcaattt 2520
ggctgagtta ccggaaggtg aatgggacaa cccgatgggg gtgggttcgg gagccggagt 2580
attatttggg accactggcg gcgtaatgga ggcagcatta cgtacggcct acgaactgtt 2640
cacaggtacc ccgctgcctc gcctgagttt gagcgaggtg cgtggtatgg acggtattaa 2700
ggaaacgaac atcacaatgg ttcctgctcc cggttcaaaa ttcgaggaac tgttgaagca 2760
tcgcgctgcc gcacgtgcag aagcagccgc acacggtact cctggtccac ttgcctggga 2820
cggcggggcc ggatttactt cagaagacgg tcgtggtgga attactttac gtgtcgctgt 2880
tgcgaatggg ctgggtaacg ctaaaaagtt aattacaaaa atgcaggccg gagaggcaaa 2940
atatgatttc gtagagatta tggcctgtcc cgctggttgc gtaggaggtg ggggccagcc 3000
ccgttcaact gacaaagcta tcacgcagaa acgtcaagcg gcattataca atctggatga 3060
aaaatcaacg cttcgccgtt cacatgagaa tccatcaatc cgtgaattgt acgatactta 3120
tttaggtgag cctctggggc ataaggcaca cgaacttctg catactcatt acgtcgcggg 3180
tggagttgag gagaaggatg aaaagaagta gggatccggg tcgaggagaa ggatgagaaa 3240
aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3300
tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3360
ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3420
ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3480
atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3540
tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3600
ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3660
catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3720
tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3780
tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3840
ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3900
gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3960
ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 4020
acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 4080
gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 4140
cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 4200
gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4260
atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4320
ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4380
tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4440
gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4500
tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4560
cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4620
ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4680
tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4740
tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4800
gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4860
gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4920
gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4980
ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 5040
cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 5100
gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 5160
ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 5220
cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5280
gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5340
gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5400
gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5460
ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5520
ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5580
aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5640
tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5700
agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5760
gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5820
atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5880
ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5940
cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 6000
aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 6060
ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 6120
gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 6180
ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6240
gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6300
ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6360
gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6420
aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6480
atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6540
acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6600
tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6660
gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6720
gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6780
gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6840
taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6900
actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6960
acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 7020
cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 7080
atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 7140
gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 7200
tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7260
tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7320
ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7380
cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7440
agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7500
tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7560
tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7620
cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7680
caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7740
aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7800
gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7860
tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7920
ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7980
catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 8040
tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 8100
taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 8160
tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 8220
gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8280
aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8340
aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8400
ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8460
tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8520
agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8580
ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8640
ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8700
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8760
actggctcac cttcgggtgg gcctttctgc gtttata 8797
<210> 31
<211> 8557
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自卡特氏团藻的HydA(Hyd1)的密码子优化的示例性HPGC(产氢基因簇)
核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 31
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg tacgtttgcg tcgcacaagt 1740
tacgttacat gattgcttag catgctcagg gtgcatcaca tctgcggaaa cggttttgct 1800
tcagcaacag tccggggatg agttcttatc ccgcttggca gacccgcaca ctactgtcgt 1860
agttaccgtc tcgccccaat cgcgcacagc tttggcggct tactatggat tatgcccgtc 1920
tcaggctctt gcccgccttg tgggctggtt gaagtggctt ggggttcgcg ccgtatggga 1980
tctgacaaca gcccgcgatc ttgtattgtt ggaagaggca gctgagttca tgaaccgttg 2040
ggtctgcatg tatgttagcg ccgggcctct tccggtcatg ggcagttcat gtcctggcac 2100
aggctgggtt tgttatgctg aaaagacgca cgggacgcgt gtattaccct atttgagcac 2160
cacccgttca ccccaaggag caatgggtgg cttggtaaag tccctggtgg cagcagcttg 2220
gggcgttact ccagggtctt tgtaccacgt cacaattatg ccgtgttatg acaagaaatt 2280
ggaagcatct cgcgatgaat taaccacaac ggcgacaact actaccgctg cggggacaga 2340
cgcggctgga gcaggtgccg ccgtaggcgg gcctctgcct gaagtgatgg tccgtcatgc 2400
aaccgcagcg cctgatccgt tgcttccggg cgtggtacca gccgacgacc agctgtactc 2460
ccttccacat ggctccagct cgggtggata cgcggacttc gttttccgca ctgccgcgcg 2520
cgagttgtgg ggggtagaag ttccgccagg acctttacca tggcgtactc gtcgtaacgc 2580
cgacttacag cctcgtgttg gtgccccagg ccaatctctg gtcgttgcgc gtgtgtatgg 2640
attccgcaat attcagacac ttttacagca gcttaagcgt ggacgctgcc cttatcatta 2700
tgtggaagtc atggcttgtc ctagcgggtg tttgaacgga ggaggacaaa tcaaaccggg 2760
gccaggggta acgccgcaac aattaattga acaattggag cttttgtatg acgttgcggc 2820
acgttctcca gcagacaacc cggcggtagc agctttatat ggctcttggt taggcggtcg 2880
tccaggggca ccccccgctc gtcaactgtt acatacgaca tttcgcgagc gcgaaaagac 2940
tgtaactgcc gcaaccgtca cgaattggta gggatccggg tcgaggagaa ggatgagaaa 3000
aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3060
tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3120
ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3180
ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3240
atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3300
tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3360
ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3420
catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3480
tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3540
tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3600
ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3660
gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3720
ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 3780
acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 3840
gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 3900
cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 3960
gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4020
atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4080
ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4140
tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4200
gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4260
tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4320
cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4380
ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4440
tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4500
tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4560
gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4620
gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4680
gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4740
ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 4800
cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 4860
gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 4920
ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 4980
cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5040
gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5100
gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5160
gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5220
ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5280
ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5340
aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5400
tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5460
agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5520
gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5580
atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5640
ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5700
cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 5760
aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 5820
ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 5880
gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 5940
ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6000
gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6060
ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6120
gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6180
aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6240
atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6300
acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6360
tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6420
gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6480
gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6540
gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6600
taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6660
actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6720
acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 6780
cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 6840
atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 6900
gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 6960
tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7020
tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7080
ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7140
cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7200
agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7260
tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7320
tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7380
cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7440
caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7500
aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7560
gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7620
tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7680
ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7740
catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 7800
tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 7860
taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 7920
tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 7980
gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8040
aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8100
aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8160
ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8220
tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8280
agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8340
ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8400
ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8460
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8520
actggctcac cttcgggtgg gcctttctgc gtttata 8557
<210> 32
<211> 8728
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自蓝氏贾第虫的HydA(Hyd1)的密码子优化的示例性HPGC(产氢基因簇)
核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 32
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg cctccaaaac cccaacacga 1740
tgtaacaggc gtggactcca ataacgcgat catgattgat tacgcaaagt gcattggctg 1800
caacatgtgc atcaaagcat gcgacgtgca aggtattggt gtttacaagc agaacgaaaa 1860
accgaagtac ccgcctatcg tgaagctgag caccctgttt aatagcgatt gtatcggctg 1920
cggtcaatgt gcaacgattt gtccggtgga cgcgattgct ccaaagaaca atctggaaat 1980
ttacaaaggc gaatctgctt ccaaaaaagt tcgtgtggcg ttgatcgcgc caagcactcg 2040
cgtggcgttt ggagatgtct tcgggctgcc gatcggtaca aataccattt actccctgat 2100
tcgcatgctg aagcaatatc tgggtttcga ttatgtgttc gacgtgaatt tcggcgcaga 2160
tgaaaccacc gtcatcgaca cccaagagct gttgcacttc aaacacgagg gccgtggtcc 2220
ggtgttcacc agctgctgcc cggcgtgggt taacctctgt gaaatgaagt acccggagct 2280
gctgccccag gttagcaccg ctaaatcttg tgttgcaatg gtagcgaccc ttgtaaaaag 2340
acgttgggtt caagaacatt taatcccgaa gggtattgta gacagcgttg acgatgtcta 2400
cgtggctgat attatgccgt gtaccgcgaa aaaggatgaa agcatgcgtc cacaactgaa 2460
ccgcgatgtg gacatctgcc tgacggtgcg tgaagttgcg gagcacctgt attttctgca 2520
cggcgcgcgc ttgacgctgg aggaagtcga ggcggatgcg ttggttttgc gtccgggccg 2580
tagcacgcag aaaaagtggg actttgacgc tccgtttaac accgtgtctg gtggctccca 2640
tatctttggt aagaccggtg gcgttgccga gacgtgtctc cgtttcatca gctatatgaa 2700
aaagtcgccg atagaaaacg ttaaggagga attgctgaaa gagttcaaga cgccgggtca 2760
gctggtgcaa accgttaagc tggtcagctg cgagatcgcc ggtgagactt atcgtgccct 2820
gattgcgcat ggcggttcag caatcaatgc cgccgcgcgt atggtgctca ataaagaggt 2880
ggagtgcgac gttgttgagc agatggcctg tccgggtggc tgccagaacg gtggaggcat 2940
gccgaagatc aagggtaaaa aagaggcagt tttgacgcgt gcgtctacct tggacatcct 3000
ggacggtaaa gagcgctttg cgagcgcggg cgagaacaaa actctgtggg gtttcaacgg 3060
ctgcttaacc gaacacgaag cgcacgagtt gcttcacacc cattatcagc atcgcccggt 3120
ggaatcgctg ctgccgcagt agggatccgg gtcgaggaga aggatgagaa aaagtgacca 3180
ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 3240
tgtcggtgaa cgctctctac tagagtcaca ctggctcacc ttcgggtggg cctttctgcg 3300
tttatatact agagggcttt acactttatg cttccggctc gtatgttgtg tggaaagaag 3360
gagatataca tatggctcat agtttaagcg cacattcccg tcaggccgga gatcgcaaac 3420
tgggcgcagg tgcggcatct agccgcccat catgtccttc tcgccgcatt gtccgcgtgg 3480
cggcccatgc ttctgcgtcc aaggcgactc ccgatgtacc tgttgacgat cttcctcctg 3540
cgcatgcccg tgcagcagta gcggccgcta accgtcgtgc gcgcgctatg gcatcagcgg 3600
aggccgcggc agagaccctg ggcgatttcc tgggcttagg gaaggggggg ctttcgccgg 3660
gcgcaaccgc caaccttgat cgtgagcaag tattaggtgt gttggaggcg gtctggcgtc 3720
gtggagacct taatctggag cgtgcgttgt acagccatgc caatgcggtg actaacaaat 3780
actgtggtgg gggggtctac tatcgcggcc ttgtggagtt cagtaatatt tgccaaaacg 3840
attgctcata ttgtgggatt cgcaacaatc aaaaagaagt ttggcgctat actatgccgg 3900
ttgaagaggt ggtcgaggta gctaagtggg cgcttgaaaa cggcattcgc aacattatgt 3960
tgcaaggggg tgaattaaag acagagcaac gcttagccta cttggaggca tgcgtccgtg 4020
cgattcgcga ggagacaacg cagttagacc ttgaaatgcg cgcacgtgcc gcgagtacga 4080
caacagcgga agcggcagcc agtgcacagg cagacgccga agctaaacgc ggcgagccag 4140
aattgggtgt ggtcgtatcc ttaagcgtcg gagaacttcc tatggaacag tatgagcgtt 4200
tgttccgcgc cggcgcccgt cgctatctga tccgcattga aacctcgaat cccgacctgt 4260
acgcggcact tcacccggag ccgatgtcct ggcacgcgcg tgtagaatgc ctgcgcaacc 4320
tgaagaaagc tgggtatatg ttgggcacag gagtgatggt cggcttgccg ggacaaacct 4380
tacacgacct ggctggggat gtcatgttct ttcgcgacat taaagcggac atgatcggta 4440
tgggcccctt cattacgcag cctgggacgc ctgcaactga taagtggacc gcgctgtatc 4500
cgaacgccaa taagaacagc cacatgaaat ctatgttcga tctgaccact gctatgaatg 4560
cacttgtacg tattacgatg gggaacgtaa atatcagtgc tacgactgca ttacaagcga 4620
ttatccccac tggacgtgaa attgcgcttg agcgcggcgc aaatgttgtc atgcctattt 4680
taacgcctac tcagtatcgc gagtcctatc agttatatga gggtaagccc tgcattacgg 4740
atactgctgt tcagtgtcgt cgttgcctgg acatgcgttt gcactccgtt ggcaaaacgt 4800
ctgcggccgg agtttggggc gatcctgctt cgttcttgca tcccatcgtt ggcgtcccag 4860
tcccgcacga cttgtcatca cctgctttgg ccgctgctgc aagtgcggat tttcacgagg 4920
ttggcgcagg tccctggaac cccatccgac tagagcgtct ggttgaagtg ccggaccgtt 4980
accctgaccc cgataaccac ggacgcaaaa aggcaggagc cgggaaagga ggcaaggcgc 5040
atgactctca cgacgatggc gatcacgacg accaccacca ccaccacgga gctgcccccg 5100
cgggtgcagc ggctggaaag ggtaccggtg cagctgcaat tggtggcgga gcgggggcta 5160
gccgtcaacg cgtagcaggg gctgctgccg cctctgctcg tctgtgtgcg ggagctcgcc 5220
gcgctggccg tgttgtcgcg tcgccattgc gcccagctgc cgcttgccgt ggtgtggccg 5280
tcaaggccgc agctgctgct gcgggtgaag acgctggtgc tggtacgtct ggcgtaggtt 5340
caaatattgt tacgtctccc ggaatcgcta gcactacggc acatggtgtt cctcgtatca 5400
atattggggt gttcggcgtg atgaatgcag gaaagtctac acttgtgaat gctctggcgc 5460
aacaggaagc atgcattgtt gactcaaccc ccggcacgac cgcagatgta aaaacagttt 5520
tgcttgagct tcatgccctt ggaccagcca agttgctgga cacagccgga ttagacgaag 5580
tcggtggact tggggataaa aagcgccgta aagccctgaa tacgctgaag gagtgcgatg 5640
ttgctgtgct ggttgttgac actgatacgg cagccgccgc aatcaaatcg ggacgccttg 5700
ctgaagccct ggaatgggaa tcgaaagtaa tggaacaggc acacaagtat aatgtcagtc 5760
ctgtactgct tctgaatgta aaatcacgcg ggctgcctga agcgcaggca gctagcatgc 5820
ttgaggcggt cgctggtatg cttgacccat ccaagcaaat ccctcgtatg tcgctggatt 5880
tagcgtccac ccccctgcac gagcgtagta cgattacgtc tgcattcgtc aaggaaggag 5940
cagtgcgcag ttcacgctat ggggctcctc tgccggggtg tttgccccgt tggtctcttg 6000
gacgcaacgc ccgcttactg atggtaatcc cgatggatgc cgaaacccca ggtggacgtc 6060
ttcttcgtcc tcaagcgcaa gttatggagg aagcaatccg ccattgggct accgtgcttt 6120
ccgtacgcct ggatttagac gccgcacgtg gcaaattggg gcccgaggcc tgtgagatgg 6180
agcgtcagcg tttcgacggg gtaattgcta tgatggaacg taatgacgga cccaccctgg 6240
tggtgacaga ttctcaagcg atcgatgttg tacacccttg gaccctggac cgctcatcag 6300
gacgtccgtt ggttccaatt actaccttta gcatcgctat ggcgtaccaa caaaacggcg 6360
gacgtttgga cccgtttgtg gaaggattgg aagcattgga gacgttacaa gatggggatc 6420
gcgttcttat ttcggaagcg tgtaatcata accgtatcac ctccgcttgc aacgacattg 6480
gaatggtgca gatccctaac aagctggagg cagcacttgg cgggaaaaag ttacaaatcg 6540
aacatgcgtt tggtcgcgag tttcccgagc ttgagagtgg gggtatggat ggattgaagt 6600
tagcgatcca ttgtggaggg tgtatgatcg acgctcagaa aatgcagcag cgtatgaaag 6660
acttgcatga ggctggggtg ccggtcacta attatggggt gtttttctct tgggcagctt 6720
ggcccgacgc ccttcgtcgc gcattggaac cgtggggagt ggagccaccg gtaggtactc 6780
ctgctacccc cgcagccgcg cctgctacgg cagcgtccgg ggtataatac tactagaggg 6840
ctttacactt tatgcttccg gctcgtatgt tgtgtggaaa gaaggagata tacatatgtc 6900
ggtcccccta cagtgcaatg caggccgtct tttggcgggc cagcgcccct gcggcgtccg 6960
cgcgcgtctg aaccgccgtg tatgtgttcc agtgaccgca cacggcaaag catctgccac 7020
gcgcgaatac gctggtgact ttcttccagg gaccactatt agtcatgcgt ggtccgtgga 7080
gcgtgaaact catcaccgtt atcgtaatcc ggccgagtgg attaacgagg ctgccatcca 7140
caaggcgctt gaaacgtcaa aggctgatgc tcaggacgca ggacgcgtgc gtgagatttt 7200
ggcgaaggct aaggaaaagg cttttgttac tgaacatgcg cctgtaaatg cggaaagtaa 7260
atccgaattt gtacaagggc ttaccttgga ggagtgcgcc accttaatta acgttgattc 7320
taataatgtc gagttgatga atgaaatctt cgacactgcg cttgctatca aagaacgtat 7380
ctacgggaac cgcgtcgtgc tgttcgcgcc cttgtacatt gctaatcatt gtatgaacac 7440
ttgcacttat tgtgcgtttc gctcagccaa taagggcatg gaacgctcta ttctgacaga 7500
cgatgacctg cgtgaagaag ttgccgcctt gcaacgtcaa ggtcatcgcc gcattttagc 7560
ccttactgga gaacatccta aatacacttt cgacaatttc ttgcatgcag tcaatgtaat 7620
cgcttccgtg aagacagagc ctgaagggtc cattcgccgt atcaatgtcg aaatcccacc 7680
acttagtgtc tcagacatgc gccgccttaa gaatacagat tcagttggca cgttcgttct 7740
gtttcaagag acatatcacc gcgacacatt caaggtaatg catccgtcag gtccaaagag 7800
cgactttgat tttcgcgtct tgacccagga ccgcgccatg cgcgcaggct tggacgatgt 7860
tggtattggt gctttattcg ggttatatga ttaccgttat gaagtttgcg ccatgttaat 7920
gcatagcgag catttggaac gtgagtacaa cgcaggacca catactatct ctgttccccg 7980
tatgcgcccc gcggacggaa gcgagcttag tatcgcgcct ccttatcctg ttaatgatgc 8040
tgattttatg aaattagttg cggtccttcg tattgctgta ccatacacag gtatgatcct 8100
tagcactcgt gaatcaccag aaatgcgctc ggcgcttctg aagtgtggga tgagtcaaat 8160
gagtgccggc tcgcgcactg atgtaggagc ctatcacaaa gatcacacgt taagtacaga 8220
ggcgaatttg agtaagttag ctgggcagtt taccttgcag gatgaacgtc caactaatga 8280
gattgttaag tggctgatgg aggagggcta tgtcccgtct tggtgcacag cttgttaccg 8340
tcaaggtcgt acgggcgaag acttcatgaa catctgtaag gctggtgaca ttcacgattt 8400
ctgtcatccc aatagtctgc ttacgcttca agagtacctt atggattatg cagatccaga 8460
ccttcgtaag aaaggcgagc aagtaattgc ccgtgagatg ggaccggacg cctctgagcc 8520
gttatcggcg caaagccgta agcgccttga acgcaagatg aaacaagtat tggaggggga 8580
gcacgatgta tatctttaac caggcatcaa ataaaacgaa aggctcagtc gaaagactgg 8640
gcctttcgtt ttatctgttg tttgtcggtg aacgctctct actagagtca cactggctca 8700
ccttcgggtg ggcctttctg cgtttata 8728
<210> 33
<211> 8710
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自诺氏内阿米巴的HydA(Hyd1)的密码子优化的示例性HPGC(产氢基因
簇)核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 33
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg cctccaaaac cctcacacac 1740
tgtaacaggc cacgaccaca accacagcat ccagtttgac tggagcaagt gtatgggctg 1800
cggtatgtgt gcaaccaaat gcaccttcgg cgtattggtt aagcagccgc cgaagatccc 1860
gccatttgtc cagccgaacc gtgaaaaact gagccaagag aacaccgata aaacgcgtgt 1920
cctgatcgat gaaagcgagt gcaccggctg cggtcaatgc tctctggtgt gcaactttgg 1980
atctatcacc ccgatcgacc acctcgttga caccttcaaa gcaaaggagg cgggcaaaaa 2040
actcgtggcc atgattgccc cgagcactcg ccttggtgtc gctgaggcta tgggtatgcc 2100
gattggctcc accgctatgg cgcagctggt gcattgtctg cgtctgattg gttttgacta 2160
cgtttttgac gtggacgcgg gtgcggataa gacgaccatg gacgattacg cggaagttat 2220
cgaaatgaaa aaggagggta agggtccggc gatcaccagc tgctgcccgg cgtggattga 2280
gctggtggag aaagaatatc cggatttgat cccgaacgtg tccactgcgc gtagcccgat 2340
cggctgcttg gccggttgca tcaaacgtgg ttgggcaaaa gatgttggca tcgcggtaga 2400
ggatttgtac accgtgggta tcatgccttg tattgcgaag aagacggaat cccaacgtca 2460
gcaaattcat caagattacg acgcaagctg tacgtctaac gagattgcgg cgtacttcaa 2520
gaagcacctg ccaccggaag agtgcaaatt cacccaggag cgcgaggaag ctctggcaaa 2580
gactgaggac ggccaatgtg atctgccgtt ccgtcgcatt agcggtggct ccaacatttt 2640
tggtaagacc ggcggggtgt gtgaaaccgt gttgcgggtg attgcgcgta atgcgggtgt 2700
tgactggaat acgtgcaccg ttaacaaaga ggaaacattc aaacacgccg ctagcggttc 2760
gaccatgacc aatctgagtg ttgacatcgg cggaactata atcaccgggg cagtttgcca 2820
tggtggttat gcaatccgtc atgcctgcga actgattcgc aaaggtgaac tgaaagtcga 2880
cgttgttgag atgatggcct gtgttggcgg ctgcctgggc ggtgctggcc agcctaagat 2940
cccgccggcg aagaagctgg aaatggataa gcgcagagtg atgttagata ttctggacca 3000
gcaaacggac attcgtgcag cgaatgaaaa caccgacgtg ctaggctgga ttgataaaca 3060
cttcgaccac cagggtgcgc atcaacatct gcacacctat ttcaccccgc gttatcagaa 3120
ttagggatcc gggtcgagga gaaggatgag aaaaagtgac caggcatcaa ataaaacgaa 3180
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctct 3240
actagagtca cactggctca ccttcgggtg ggcctttctg cgtttatata ctagagggct 3300
ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata catatggctc 3360
atagtttaag cgcacattcc cgtcaggccg gagatcgcaa actgggcgca ggtgcggcat 3420
ctagccgccc atcatgtcct tctcgccgca ttgtccgcgt ggcggcccat gcttctgcgt 3480
ccaaggcgac tcccgatgta cctgttgacg atcttcctcc tgcgcatgcc cgtgcagcag 3540
tagcggccgc taaccgtcgt gcgcgcgcta tggcatcagc ggaggccgcg gcagagaccc 3600
tgggcgattt cctgggctta gggaaggggg ggctttcgcc gggcgcaacc gccaaccttg 3660
atcgtgagca agtattaggt gtgttggagg cggtctggcg tcgtggagac cttaatctgg 3720
agcgtgcgtt gtacagccat gccaatgcgg tgactaacaa atactgtggt gggggggtct 3780
actatcgcgg ccttgtggag ttcagtaata tttgccaaaa cgattgctca tattgtggga 3840
ttcgcaacaa tcaaaaagaa gtttggcgct atactatgcc ggttgaagag gtggtcgagg 3900
tagctaagtg ggcgcttgaa aacggcattc gcaacattat gttgcaaggg ggtgaattaa 3960
agacagagca acgcttagcc tacttggagg catgcgtccg tgcgattcgc gaggagacaa 4020
cgcagttaga ccttgaaatg cgcgcacgtg ccgcgagtac gacaacagcg gaagcggcag 4080
ccagtgcaca ggcagacgcc gaagctaaac gcggcgagcc agaattgggt gtggtcgtat 4140
ccttaagcgt cggagaactt cctatggaac agtatgagcg tttgttccgc gccggcgccc 4200
gtcgctatct gatccgcatt gaaacctcga atcccgacct gtacgcggca cttcacccgg 4260
agccgatgtc ctggcacgcg cgtgtagaat gcctgcgcaa cctgaagaaa gctgggtata 4320
tgttgggcac aggagtgatg gtcggcttgc cgggacaaac cttacacgac ctggctgggg 4380
atgtcatgtt ctttcgcgac attaaagcgg acatgatcgg tatgggcccc ttcattacgc 4440
agcctgggac gcctgcaact gataagtgga ccgcgctgta tccgaacgcc aataagaaca 4500
gccacatgaa atctatgttc gatctgacca ctgctatgaa tgcacttgta cgtattacga 4560
tggggaacgt aaatatcagt gctacgactg cattacaagc gattatcccc actggacgtg 4620
aaattgcgct tgagcgcggc gcaaatgttg tcatgcctat tttaacgcct actcagtatc 4680
gcgagtccta tcagttatat gagggtaagc cctgcattac ggatactgct gttcagtgtc 4740
gtcgttgcct ggacatgcgt ttgcactccg ttggcaaaac gtctgcggcc ggagtttggg 4800
gcgatcctgc ttcgttcttg catcccatcg ttggcgtccc agtcccgcac gacttgtcat 4860
cacctgcttt ggccgctgct gcaagtgcgg attttcacga ggttggcgca ggtccctgga 4920
accccatccg actagagcgt ctggttgaag tgccggaccg ttaccctgac cccgataacc 4980
acggacgcaa aaaggcagga gccgggaaag gaggcaaggc gcatgactct cacgacgatg 5040
gcgatcacga cgaccaccac caccaccacg gagctgcccc cgcgggtgca gcggctggaa 5100
agggtaccgg tgcagctgca attggtggcg gagcgggggc tagccgtcaa cgcgtagcag 5160
gggctgctgc cgcctctgct cgtctgtgtg cgggagctcg ccgcgctggc cgtgttgtcg 5220
cgtcgccatt gcgcccagct gccgcttgcc gtggtgtggc cgtcaaggcc gcagctgctg 5280
ctgcgggtga agacgctggt gctggtacgt ctggcgtagg ttcaaatatt gttacgtctc 5340
ccggaatcgc tagcactacg gcacatggtg ttcctcgtat caatattggg gtgttcggcg 5400
tgatgaatgc aggaaagtct acacttgtga atgctctggc gcaacaggaa gcatgcattg 5460
ttgactcaac ccccggcacg accgcagatg taaaaacagt tttgcttgag cttcatgccc 5520
ttggaccagc caagttgctg gacacagccg gattagacga agtcggtgga cttggggata 5580
aaaagcgccg taaagccctg aatacgctga aggagtgcga tgttgctgtg ctggttgttg 5640
acactgatac ggcagccgcc gcaatcaaat cgggacgcct tgctgaagcc ctggaatggg 5700
aatcgaaagt aatggaacag gcacacaagt ataatgtcag tcctgtactg cttctgaatg 5760
taaaatcacg cgggctgcct gaagcgcagg cagctagcat gcttgaggcg gtcgctggta 5820
tgcttgaccc atccaagcaa atccctcgta tgtcgctgga tttagcgtcc acccccctgc 5880
acgagcgtag tacgattacg tctgcattcg tcaaggaagg agcagtgcgc agttcacgct 5940
atggggctcc tctgccgggg tgtttgcccc gttggtctct tggacgcaac gcccgcttac 6000
tgatggtaat cccgatggat gccgaaaccc caggtggacg tcttcttcgt cctcaagcgc 6060
aagttatgga ggaagcaatc cgccattggg ctaccgtgct ttccgtacgc ctggatttag 6120
acgccgcacg tggcaaattg gggcccgagg cctgtgagat ggagcgtcag cgtttcgacg 6180
gggtaattgc tatgatggaa cgtaatgacg gacccaccct ggtggtgaca gattctcaag 6240
cgatcgatgt tgtacaccct tggaccctgg accgctcatc aggacgtccg ttggttccaa 6300
ttactacctt tagcatcgct atggcgtacc aacaaaacgg cggacgtttg gacccgtttg 6360
tggaaggatt ggaagcattg gagacgttac aagatgggga tcgcgttctt atttcggaag 6420
cgtgtaatca taaccgtatc acctccgctt gcaacgacat tggaatggtg cagatcccta 6480
acaagctgga ggcagcactt ggcgggaaaa agttacaaat cgaacatgcg tttggtcgcg 6540
agtttcccga gcttgagagt gggggtatgg atggattgaa gttagcgatc cattgtggag 6600
ggtgtatgat cgacgctcag aaaatgcagc agcgtatgaa agacttgcat gaggctgggg 6660
tgccggtcac taattatggg gtgtttttct cttgggcagc ttggcccgac gcccttcgtc 6720
gcgcattgga accgtgggga gtggagccac cggtaggtac tcctgctacc cccgcagccg 6780
cgcctgctac ggcagcgtcc ggggtataat actactagag ggctttacac tttatgcttc 6840
cggctcgtat gttgtgtgga aagaaggaga tatacatatg tcggtccccc tacagtgcaa 6900
tgcaggccgt cttttggcgg gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg 6960
tgtatgtgtt ccagtgaccg cacacggcaa agcatctgcc acgcgcgaat acgctggtga 7020
ctttcttcca gggaccacta ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg 7080
ttatcgtaat ccggccgagt ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc 7140
aaaggctgat gctcaggacg caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa 7200
ggcttttgtt actgaacatg cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg 7260
gcttaccttg gaggagtgcg ccaccttaat taacgttgat tctaataatg tcgagttgat 7320
gaatgaaatc ttcgacactg cgcttgctat caaagaacgt atctacggga accgcgtcgt 7380
gctgttcgcg cccttgtaca ttgctaatca ttgtatgaac acttgcactt attgtgcgtt 7440
tcgctcagcc aataagggca tggaacgctc tattctgaca gacgatgacc tgcgtgaaga 7500
agttgccgcc ttgcaacgtc aaggtcatcg ccgcatttta gcccttactg gagaacatcc 7560
taaatacact ttcgacaatt tcttgcatgc agtcaatgta atcgcttccg tgaagacaga 7620
gcctgaaggg tccattcgcc gtatcaatgt cgaaatccca ccacttagtg tctcagacat 7680
gcgccgcctt aagaatacag attcagttgg cacgttcgtt ctgtttcaag agacatatca 7740
ccgcgacaca ttcaaggtaa tgcatccgtc aggtccaaag agcgactttg attttcgcgt 7800
cttgacccag gaccgcgcca tgcgcgcagg cttggacgat gttggtattg gtgctttatt 7860
cgggttatat gattaccgtt atgaagtttg cgccatgtta atgcatagcg agcatttgga 7920
acgtgagtac aacgcaggac cacatactat ctctgttccc cgtatgcgcc ccgcggacgg 7980
aagcgagctt agtatcgcgc ctccttatcc tgttaatgat gctgatttta tgaaattagt 8040
tgcggtcctt cgtattgctg taccatacac aggtatgatc cttagcactc gtgaatcacc 8100
agaaatgcgc tcggcgcttc tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac 8160
tgatgtagga gcctatcaca aagatcacac gttaagtaca gaggcgaatt tgagtaagtt 8220
agctgggcag tttaccttgc aggatgaacg tccaactaat gagattgtta agtggctgat 8280
ggaggagggc tatgtcccgt cttggtgcac agcttgttac cgtcaaggtc gtacgggcga 8340
agacttcatg aacatctgta aggctggtga cattcacgat ttctgtcatc ccaatagtct 8400
gcttacgctt caagagtacc ttatggatta tgcagatcca gaccttcgta agaaaggcga 8460
gcaagtaatt gcccgtgaga tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg 8520
taagcgcctt gaacgcaaga tgaaacaagt attggagggg gagcacgatg tatatcttta 8580
accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt 8640
tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg tgggcctttc 8700
tgcgtttata 8710
<210> 34
<211> 8704
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自嗜多变形泥杆菌的HydA(Hyd1)的具有密码子优化的示例性HPGC(产
氢基因簇)核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 34
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg aagaacaaaa cagtatcaaa 1740
tgataaaata gacaataaac tgaactgctc cgaaaacctg gaaaaccgta ccatcgacaa 1800
aagcttctac accttttcac gtgataccag caagtgcatt aagtgctaca agtgcgtgaa 1860
agtttgcaag gacactcagg gcatttccgt ttttcaggtt gaggaggacg gcacggtggg 1920
catcaaagag gagaatatgg cggccacctt gtgtatcagc tgtggtcaat gtattaaagt 1980
gtgcaccgca ggtgcgctga aggagaaatc caacatctct ctgttgaagg agcagttaaa 2040
taacccgaat aagcacgttg tcgcgcagct gtctccaagc ttcaaacaca ccattggtga 2100
tggcttcggc atcagctcgg gtaccgatac ttccccgaaa atcatcagcg ctctgaaaga 2160
aattggtttc tctaaggttt tcagtaccgg tttcgccagc gacgtgaata tcgttgagac 2220
cagcgcggat ctgaaaaaac gcctagatga aaacggtccg ttcccggtgt tcacctccac 2280
gtgcacgggt tggattaact atgcggaaaa gttttgtccg gagttcctgg ggctgctctc 2340
tccgtgcaaa agcccgcaac agatcctggg tagcctgagc aagtcctact acgaagagag 2400
cattgacatc agcagagaaa atatctttag cgtggcgctg atgccttgca tcgccaaaaa 2460
ggatgaagct aatcgttttg acatgaagga cgaatatggt aacaaagatg tggacctggt 2520
cctgaccgtg aatgaagttg ctagcctttt gaacaaaaag ggcattgatt taaacaatta 2580
ctctaagttc ggtacttttg ataagccgat gaaatccgac actggttctt cgcgtattaa 2640
ggcggttacg ggtggcctgg cagaggctat cctgcgcaac accgcacaca tgatcggtga 2700
agatccgttt tctgtagacc tgaagaagct gcgtggtatg gatggtatta agctcacgag 2760
cgtggttctg ggcgggaaaa aattaaacat tgcggtcgtg aacggcatca agaacgtgcc 2820
ggttattctg gacatgatta aagatggcat taccgagttc cacttggtcg aggttatggc 2880
ctgtccgggt ggctgcgtcg gcggcggtgg tatcccgttg tcagaagacc cggacattat 2940
ccaaaaacgc gcagagaaaa tctactcgta cgacgcgagc agcgaaattc gttgtagctg 3000
ggaaaaccca gatgttaaaa ccctgtatag cgagtacctg aaggagccgc tgggagagga 3060
gtctcaacgt ttgtttcatt ttcattataa aaaccgccgt accaaacgta tcttctaggg 3120
atccgggtcg aggagaagga tgagaaaaag tgaccaggca tcaaataaaa cgaaaggctc 3180
agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga 3240
gtcacactgg ctcaccttcg ggtgggcctt tctgcgttta tatactagag ggctttacac 3300
tttatgcttc cggctcgtat gttgtgtgga aagaaggaga tatacatatg gctcatagtt 3360
taagcgcaca ttcccgtcag gccggagatc gcaaactggg cgcaggtgcg gcatctagcc 3420
gcccatcatg tccttctcgc cgcattgtcc gcgtggcggc ccatgcttct gcgtccaagg 3480
cgactcccga tgtacctgtt gacgatcttc ctcctgcgca tgcccgtgca gcagtagcgg 3540
ccgctaaccg tcgtgcgcgc gctatggcat cagcggaggc cgcggcagag accctgggcg 3600
atttcctggg cttagggaag ggggggcttt cgccgggcgc aaccgccaac cttgatcgtg 3660
agcaagtatt aggtgtgttg gaggcggtct ggcgtcgtgg agaccttaat ctggagcgtg 3720
cgttgtacag ccatgccaat gcggtgacta acaaatactg tggtgggggg gtctactatc 3780
gcggccttgt ggagttcagt aatatttgcc aaaacgattg ctcatattgt gggattcgca 3840
acaatcaaaa agaagtttgg cgctatacta tgccggttga agaggtggtc gaggtagcta 3900
agtgggcgct tgaaaacggc attcgcaaca ttatgttgca agggggtgaa ttaaagacag 3960
agcaacgctt agcctacttg gaggcatgcg tccgtgcgat tcgcgaggag acaacgcagt 4020
tagaccttga aatgcgcgca cgtgccgcga gtacgacaac agcggaagcg gcagccagtg 4080
cacaggcaga cgccgaagct aaacgcggcg agccagaatt gggtgtggtc gtatccttaa 4140
gcgtcggaga acttcctatg gaacagtatg agcgtttgtt ccgcgccggc gcccgtcgct 4200
atctgatccg cattgaaacc tcgaatcccg acctgtacgc ggcacttcac ccggagccga 4260
tgtcctggca cgcgcgtgta gaatgcctgc gcaacctgaa gaaagctggg tatatgttgg 4320
gcacaggagt gatggtcggc ttgccgggac aaaccttaca cgacctggct ggggatgtca 4380
tgttctttcg cgacattaaa gcggacatga tcggtatggg ccccttcatt acgcagcctg 4440
ggacgcctgc aactgataag tggaccgcgc tgtatccgaa cgccaataag aacagccaca 4500
tgaaatctat gttcgatctg accactgcta tgaatgcact tgtacgtatt acgatgggga 4560
acgtaaatat cagtgctacg actgcattac aagcgattat ccccactgga cgtgaaattg 4620
cgcttgagcg cggcgcaaat gttgtcatgc ctattttaac gcctactcag tatcgcgagt 4680
cctatcagtt atatgagggt aagccctgca ttacggatac tgctgttcag tgtcgtcgtt 4740
gcctggacat gcgtttgcac tccgttggca aaacgtctgc ggccggagtt tggggcgatc 4800
ctgcttcgtt cttgcatccc atcgttggcg tcccagtccc gcacgacttg tcatcacctg 4860
ctttggccgc tgctgcaagt gcggattttc acgaggttgg cgcaggtccc tggaacccca 4920
tccgactaga gcgtctggtt gaagtgccgg accgttaccc tgaccccgat aaccacggac 4980
gcaaaaaggc aggagccggg aaaggaggca aggcgcatga ctctcacgac gatggcgatc 5040
acgacgacca ccaccaccac cacggagctg cccccgcggg tgcagcggct ggaaagggta 5100
ccggtgcagc tgcaattggt ggcggagcgg gggctagccg tcaacgcgta gcaggggctg 5160
ctgccgcctc tgctcgtctg tgtgcgggag ctcgccgcgc tggccgtgtt gtcgcgtcgc 5220
cattgcgccc agctgccgct tgccgtggtg tggccgtcaa ggccgcagct gctgctgcgg 5280
gtgaagacgc tggtgctggt acgtctggcg taggttcaaa tattgttacg tctcccggaa 5340
tcgctagcac tacggcacat ggtgttcctc gtatcaatat tggggtgttc ggcgtgatga 5400
atgcaggaaa gtctacactt gtgaatgctc tggcgcaaca ggaagcatgc attgttgact 5460
caacccccgg cacgaccgca gatgtaaaaa cagttttgct tgagcttcat gcccttggac 5520
cagccaagtt gctggacaca gccggattag acgaagtcgg tggacttggg gataaaaagc 5580
gccgtaaagc cctgaatacg ctgaaggagt gcgatgttgc tgtgctggtt gttgacactg 5640
atacggcagc cgccgcaatc aaatcgggac gccttgctga agccctggaa tgggaatcga 5700
aagtaatgga acaggcacac aagtataatg tcagtcctgt actgcttctg aatgtaaaat 5760
cacgcgggct gcctgaagcg caggcagcta gcatgcttga ggcggtcgct ggtatgcttg 5820
acccatccaa gcaaatccct cgtatgtcgc tggatttagc gtccaccccc ctgcacgagc 5880
gtagtacgat tacgtctgca ttcgtcaagg aaggagcagt gcgcagttca cgctatgggg 5940
ctcctctgcc ggggtgtttg ccccgttggt ctcttggacg caacgcccgc ttactgatgg 6000
taatcccgat ggatgccgaa accccaggtg gacgtcttct tcgtcctcaa gcgcaagtta 6060
tggaggaagc aatccgccat tgggctaccg tgctttccgt acgcctggat ttagacgccg 6120
cacgtggcaa attggggccc gaggcctgtg agatggagcg tcagcgtttc gacggggtaa 6180
ttgctatgat ggaacgtaat gacggaccca ccctggtggt gacagattct caagcgatcg 6240
atgttgtaca cccttggacc ctggaccgct catcaggacg tccgttggtt ccaattacta 6300
cctttagcat cgctatggcg taccaacaaa acggcggacg tttggacccg tttgtggaag 6360
gattggaagc attggagacg ttacaagatg gggatcgcgt tcttatttcg gaagcgtgta 6420
atcataaccg tatcacctcc gcttgcaacg acattggaat ggtgcagatc cctaacaagc 6480
tggaggcagc acttggcggg aaaaagttac aaatcgaaca tgcgtttggt cgcgagtttc 6540
ccgagcttga gagtgggggt atggatggat tgaagttagc gatccattgt ggagggtgta 6600
tgatcgacgc tcagaaaatg cagcagcgta tgaaagactt gcatgaggct ggggtgccgg 6660
tcactaatta tggggtgttt ttctcttggg cagcttggcc cgacgccctt cgtcgcgcat 6720
tggaaccgtg gggagtggag ccaccggtag gtactcctgc tacccccgca gccgcgcctg 6780
ctacggcagc gtccggggta taatactact agagggcttt acactttatg cttccggctc 6840
gtatgttgtg tggaaagaag gagatataca tatgtcggtc cccctacagt gcaatgcagg 6900
ccgtcttttg gcgggccagc gcccctgcgg cgtccgcgcg cgtctgaacc gccgtgtatg 6960
tgttccagtg accgcacacg gcaaagcatc tgccacgcgc gaatacgctg gtgactttct 7020
tccagggacc actattagtc atgcgtggtc cgtggagcgt gaaactcatc accgttatcg 7080
taatccggcc gagtggatta acgaggctgc catccacaag gcgcttgaaa cgtcaaaggc 7140
tgatgctcag gacgcaggac gcgtgcgtga gattttggcg aaggctaagg aaaaggcttt 7200
tgttactgaa catgcgcctg taaatgcgga aagtaaatcc gaatttgtac aagggcttac 7260
cttggaggag tgcgccacct taattaacgt tgattctaat aatgtcgagt tgatgaatga 7320
aatcttcgac actgcgcttg ctatcaaaga acgtatctac gggaaccgcg tcgtgctgtt 7380
cgcgcccttg tacattgcta atcattgtat gaacacttgc acttattgtg cgtttcgctc 7440
agccaataag ggcatggaac gctctattct gacagacgat gacctgcgtg aagaagttgc 7500
cgccttgcaa cgtcaaggtc atcgccgcat tttagccctt actggagaac atcctaaata 7560
cactttcgac aatttcttgc atgcagtcaa tgtaatcgct tccgtgaaga cagagcctga 7620
agggtccatt cgccgtatca atgtcgaaat cccaccactt agtgtctcag acatgcgccg 7680
ccttaagaat acagattcag ttggcacgtt cgttctgttt caagagacat atcaccgcga 7740
cacattcaag gtaatgcatc cgtcaggtcc aaagagcgac tttgattttc gcgtcttgac 7800
ccaggaccgc gccatgcgcg caggcttgga cgatgttggt attggtgctt tattcgggtt 7860
atatgattac cgttatgaag tttgcgccat gttaatgcat agcgagcatt tggaacgtga 7920
gtacaacgca ggaccacata ctatctctgt tccccgtatg cgccccgcgg acggaagcga 7980
gcttagtatc gcgcctcctt atcctgttaa tgatgctgat tttatgaaat tagttgcggt 8040
ccttcgtatt gctgtaccat acacaggtat gatccttagc actcgtgaat caccagaaat 8100
gcgctcggcg cttctgaagt gtgggatgag tcaaatgagt gccggctcgc gcactgatgt 8160
aggagcctat cacaaagatc acacgttaag tacagaggcg aatttgagta agttagctgg 8220
gcagtttacc ttgcaggatg aacgtccaac taatgagatt gttaagtggc tgatggagga 8280
gggctatgtc ccgtcttggt gcacagcttg ttaccgtcaa ggtcgtacgg gcgaagactt 8340
catgaacatc tgtaaggctg gtgacattca cgatttctgt catcccaata gtctgcttac 8400
gcttcaagag taccttatgg attatgcaga tccagacctt cgtaagaaag gcgagcaagt 8460
aattgcccgt gagatgggac cggacgcctc tgagccgtta tcggcgcaaa gccgtaagcg 8520
ccttgaacgc aagatgaaac aagtattgga gggggagcac gatgtatatc tttaaccagg 8580
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 8640
tcggtgaacg ctctctacta gagtcacact ggctcacctt cgggtgggcc tttctgcgtt 8700
tata 8704
<210> 35
<211> 8797
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自卡特氏团藻的HydA(Hyd1)的密码子优化的示例性HPGC(产氢基因簇)
核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 35
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg agtgctatgc tatcttcatt 1740
aacaaattct cgcttgggcg cttacgtgcc gcaagtggcg gtaagccgtt atggttccaa 1800
gccggtctac gtcccgtgcg tgccgtttcg taagtgcacc tcggcggtgc cagtgccggt 1860
taagacggtg caagaaggta attcggtcag acttatgcca gcggcggcgg ctccggcggg 1920
tgcggcagcg gacccacatt ggaaacaagc atttgcagag cttgataaac cgaaagccga 1980
acgtaaagtt atgatcgcac aggttgctcc ggcggtgcgc gttgccatct ccgagagctt 2040
tggtctggca ccgggggcta ccactccggg tcagctggcc gagtccctgc gttgtctggg 2100
ttttgatatg gtgttcgaca ccttgtacgg cgcggacctg accattatgg aagagggcac 2160
tgagttgctg tcccgtctgc aagcgcaatt ggaagcccac ccgcatagcg aagaaccgct 2220
gccgatgttt accagctgct gtccgggctg gatcgccctg ttggagaaga gctatccgga 2280
attaattccg tatgtgtcta gctgcaagtc tccgcagatg atgttaggcg ctatggtgaa 2340
gacctatctg gcagagaaga aaggcatctc tccgagcgac atctccatgg tttcgattat 2400
gccgtgtgtg aggaagcaag gtgaagcgga ccgtgattgg ttttgcagcg gcggcgccgg 2460
cgttcgtgat gtggaccacg ttattaccac ggcggagcta ggcaacatcc tgaaagaacg 2520
taatatcaac ctccccgaac tgccggaagg cggttgggat gagccgctgg gttcgggtag 2580
cggtgcgggc gtcgttttcg gtacaaccgg tggtgttatg gaagcggcgc tgcgcaccgc 2640
gtacgagttg gttacccagc aaccgctgcc tcgtttgaat ctgagtgagg ttcgcggtat 2700
ggacggcatt aaagaaaccg aaatcaagat ggttccgcct ccgggtagca aattcgccga 2760
gcttgttgcc gcacgtgcag cggcgaaggc tatggatgaa gcggccgcga gcgcaggcgc 2820
gattaagtgg gatggtggca gcaacttcac cgcggacgac ggtgctaagg gcatcaccct 2880
gcgcgtggcc gtggctaatg gtctgggaaa cgcgaaaaag ctgctgacga aaatgcagac 2940
cggtgagtgc aaatacgact tcgtggaaat tatggcatgt ccgtctgggt gcgttggtgg 3000
tggtggtcag ccgcgcagca ccgataaaca ggtggcggtc aaacgtcagc aggcactgta 3060
cgaccttgac gagcgcgcaa cgatccgtcg tagccacgag aacccggctg tccaaaaagc 3120
gtacgaagat ttcctgggcg agccgaacag ccacaaagcg cacgatctgt tgcacaccca 3180
ttatgttccg ggtggcgttg acacggagta gggatccggg tcgaggagaa ggatgagaaa 3240
aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3300
tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3360
ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3420
ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3480
atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3540
tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3600
ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3660
catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3720
tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3780
tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3840
ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3900
gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3960
ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 4020
acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 4080
gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 4140
cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 4200
gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4260
atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4320
ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4380
tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4440
gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4500
tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4560
cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4620
ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4680
tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4740
tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4800
gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4860
gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4920
gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4980
ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 5040
cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 5100
gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 5160
ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 5220
cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5280
gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5340
gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5400
gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5460
ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5520
ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5580
aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5640
tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5700
agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5760
gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5820
atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5880
ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5940
cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 6000
aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 6060
ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 6120
gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 6180
ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6240
gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6300
ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6360
gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6420
aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6480
atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6540
acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6600
tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6660
gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6720
gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6780
gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6840
taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6900
actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6960
acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 7020
cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 7080
atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 7140
gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 7200
tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7260
tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7320
ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7380
cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7440
agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7500
tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7560
tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7620
cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7680
caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7740
aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7800
gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7860
tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7920
ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7980
catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 8040
tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 8100
taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 8160
tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 8220
gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8280
aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8340
aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8400
ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8460
tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8520
agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8580
ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8640
ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8700
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8760
actggctcac cttcgggtgg gcctttctgc gtttata 8797
<210> 36
<211> 8710
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自阴道毛滴虫的HydA(Hyd1)的密码子优化的示例性HPGC(产氢基因簇)
核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 36
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg ctagcgtcaa gtgcaacagc 1740
tatgaaaggc ttcgccaata gcctccgtat gaaagattac agcagcaccg gtattaactt 1800
cgacatgact aagtgcatta actgccaaag ctgcgttcgc gcctgcacga acatcgctgg 1860
ccaaaacgtc ttgaagagct tgacggtgaa cggcaagtcc gttgtgcaga ccgttaccgg 1920
taaaccgctg gcggagacca actgcatcag ctgcggtcaa tgtacccttg gctgcccgaa 1980
gttcaccatc ttcgaggcgg acgccatcaa tccagttaaa gaggtcttga ccaagaaaaa 2040
cggtcgtatt gccgtgtgtc agattgctcc ggcgattcgt atcaacatgg ctgaagctct 2100
gggcgttccg gctggtacga tctccttggg taaggtggtg accgcgctga aacgtctggg 2160
ttttgactac gttttcgata ccaatttcgc tgccgatatg accatcgtgg aggaagcgac 2220
cgaactggtt caacgtttgt ctgacaaaaa cgcagtgctg cctatgttta cttcatgctg 2280
tccagcgtgg gttaattacg tagagaaatc cgatccgagc ttgatcccgc atctgagctc 2340
ttgtcgtagc ccgatgagca tgctgagcag cgttatcaag aacgtctttc cgaaaaagat 2400
tggtacgacc gcagacaaaa tctacaatgt ggcgatcatg ccgtgcaccg cgaagaagga 2460
cgaaattcag cgcagccaat ttaccatgaa ggatggtaaa caagagacag gtgcggtgct 2520
gacttctcgt gaactcgcga aaatgattaa ggaggcgaag atcaacttca aagagctgcc 2580
ggatacgccg tgtgataact tttattctga agcatcgggc ggcggtgcga tcttttgtgc 2640
aaccggcggc gtgatggaag ccgcggtgcg cagcgcgtat aagttcctga cgaagaaaga 2700
gctggcaccg attgacctgc aagacgttcg cggtgttgcg agcggcgtta aactggcgga 2760
ggtggatatt gctggtacca aagtaaaagt ggcggttgcg cacggcatta agaacgccat 2820
gaccctgatt aagaagatca aatcgggtga agagcagttt aaagacgtta agttcgtgga 2880
agtgatggca tgtccgggtg gctgcgtggt tggtggtggc agcccgaagg ctaagaccaa 2940
gaaagctgtc caggcacgat tgaatgcaac gtactccatt gacaaaagct ccaaacacag 3000
aacttctcag gacaacccgc agttgttaca gctgtataaa gaatcgtttg aaggtaaatt 3060
cggtggtcat gtcgcgcacc acctgctgca cacccattat aagaatcgta aagtaaatcc 3120
gtagggatcc gggtcgagga gaaggatgag aaaaagtgac caggcatcaa ataaaacgaa 3180
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctct 3240
actagagtca cactggctca ccttcgggtg ggcctttctg cgtttatata ctagagggct 3300
ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata catatggctc 3360
atagtttaag cgcacattcc cgtcaggccg gagatcgcaa actgggcgca ggtgcggcat 3420
ctagccgccc atcatgtcct tctcgccgca ttgtccgcgt ggcggcccat gcttctgcgt 3480
ccaaggcgac tcccgatgta cctgttgacg atcttcctcc tgcgcatgcc cgtgcagcag 3540
tagcggccgc taaccgtcgt gcgcgcgcta tggcatcagc ggaggccgcg gcagagaccc 3600
tgggcgattt cctgggctta gggaaggggg ggctttcgcc gggcgcaacc gccaaccttg 3660
atcgtgagca agtattaggt gtgttggagg cggtctggcg tcgtggagac cttaatctgg 3720
agcgtgcgtt gtacagccat gccaatgcgg tgactaacaa atactgtggt gggggggtct 3780
actatcgcgg ccttgtggag ttcagtaata tttgccaaaa cgattgctca tattgtggga 3840
ttcgcaacaa tcaaaaagaa gtttggcgct atactatgcc ggttgaagag gtggtcgagg 3900
tagctaagtg ggcgcttgaa aacggcattc gcaacattat gttgcaaggg ggtgaattaa 3960
agacagagca acgcttagcc tacttggagg catgcgtccg tgcgattcgc gaggagacaa 4020
cgcagttaga ccttgaaatg cgcgcacgtg ccgcgagtac gacaacagcg gaagcggcag 4080
ccagtgcaca ggcagacgcc gaagctaaac gcggcgagcc agaattgggt gtggtcgtat 4140
ccttaagcgt cggagaactt cctatggaac agtatgagcg tttgttccgc gccggcgccc 4200
gtcgctatct gatccgcatt gaaacctcga atcccgacct gtacgcggca cttcacccgg 4260
agccgatgtc ctggcacgcg cgtgtagaat gcctgcgcaa cctgaagaaa gctgggtata 4320
tgttgggcac aggagtgatg gtcggcttgc cgggacaaac cttacacgac ctggctgggg 4380
atgtcatgtt ctttcgcgac attaaagcgg acatgatcgg tatgggcccc ttcattacgc 4440
agcctgggac gcctgcaact gataagtgga ccgcgctgta tccgaacgcc aataagaaca 4500
gccacatgaa atctatgttc gatctgacca ctgctatgaa tgcacttgta cgtattacga 4560
tggggaacgt aaatatcagt gctacgactg cattacaagc gattatcccc actggacgtg 4620
aaattgcgct tgagcgcggc gcaaatgttg tcatgcctat tttaacgcct actcagtatc 4680
gcgagtccta tcagttatat gagggtaagc cctgcattac ggatactgct gttcagtgtc 4740
gtcgttgcct ggacatgcgt ttgcactccg ttggcaaaac gtctgcggcc ggagtttggg 4800
gcgatcctgc ttcgttcttg catcccatcg ttggcgtccc agtcccgcac gacttgtcat 4860
cacctgcttt ggccgctgct gcaagtgcgg attttcacga ggttggcgca ggtccctgga 4920
accccatccg actagagcgt ctggttgaag tgccggaccg ttaccctgac cccgataacc 4980
acggacgcaa aaaggcagga gccgggaaag gaggcaaggc gcatgactct cacgacgatg 5040
gcgatcacga cgaccaccac caccaccacg gagctgcccc cgcgggtgca gcggctggaa 5100
agggtaccgg tgcagctgca attggtggcg gagcgggggc tagccgtcaa cgcgtagcag 5160
gggctgctgc cgcctctgct cgtctgtgtg cgggagctcg ccgcgctggc cgtgttgtcg 5220
cgtcgccatt gcgcccagct gccgcttgcc gtggtgtggc cgtcaaggcc gcagctgctg 5280
ctgcgggtga agacgctggt gctggtacgt ctggcgtagg ttcaaatatt gttacgtctc 5340
ccggaatcgc tagcactacg gcacatggtg ttcctcgtat caatattggg gtgttcggcg 5400
tgatgaatgc aggaaagtct acacttgtga atgctctggc gcaacaggaa gcatgcattg 5460
ttgactcaac ccccggcacg accgcagatg taaaaacagt tttgcttgag cttcatgccc 5520
ttggaccagc caagttgctg gacacagccg gattagacga agtcggtgga cttggggata 5580
aaaagcgccg taaagccctg aatacgctga aggagtgcga tgttgctgtg ctggttgttg 5640
acactgatac ggcagccgcc gcaatcaaat cgggacgcct tgctgaagcc ctggaatggg 5700
aatcgaaagt aatggaacag gcacacaagt ataatgtcag tcctgtactg cttctgaatg 5760
taaaatcacg cgggctgcct gaagcgcagg cagctagcat gcttgaggcg gtcgctggta 5820
tgcttgaccc atccaagcaa atccctcgta tgtcgctgga tttagcgtcc acccccctgc 5880
acgagcgtag tacgattacg tctgcattcg tcaaggaagg agcagtgcgc agttcacgct 5940
atggggctcc tctgccgggg tgtttgcccc gttggtctct tggacgcaac gcccgcttac 6000
tgatggtaat cccgatggat gccgaaaccc caggtggacg tcttcttcgt cctcaagcgc 6060
aagttatgga ggaagcaatc cgccattggg ctaccgtgct ttccgtacgc ctggatttag 6120
acgccgcacg tggcaaattg gggcccgagg cctgtgagat ggagcgtcag cgtttcgacg 6180
gggtaattgc tatgatggaa cgtaatgacg gacccaccct ggtggtgaca gattctcaag 6240
cgatcgatgt tgtacaccct tggaccctgg accgctcatc aggacgtccg ttggttccaa 6300
ttactacctt tagcatcgct atggcgtacc aacaaaacgg cggacgtttg gacccgtttg 6360
tggaaggatt ggaagcattg gagacgttac aagatgggga tcgcgttctt atttcggaag 6420
cgtgtaatca taaccgtatc acctccgctt gcaacgacat tggaatggtg cagatcccta 6480
acaagctgga ggcagcactt ggcgggaaaa agttacaaat cgaacatgcg tttggtcgcg 6540
agtttcccga gcttgagagt gggggtatgg atggattgaa gttagcgatc cattgtggag 6600
ggtgtatgat cgacgctcag aaaatgcagc agcgtatgaa agacttgcat gaggctgggg 6660
tgccggtcac taattatggg gtgtttttct cttgggcagc ttggcccgac gcccttcgtc 6720
gcgcattgga accgtgggga gtggagccac cggtaggtac tcctgctacc cccgcagccg 6780
cgcctgctac ggcagcgtcc ggggtataat actactagag ggctttacac tttatgcttc 6840
cggctcgtat gttgtgtgga aagaaggaga tatacatatg tcggtccccc tacagtgcaa 6900
tgcaggccgt cttttggcgg gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg 6960
tgtatgtgtt ccagtgaccg cacacggcaa agcatctgcc acgcgcgaat acgctggtga 7020
ctttcttcca gggaccacta ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg 7080
ttatcgtaat ccggccgagt ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc 7140
aaaggctgat gctcaggacg caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa 7200
ggcttttgtt actgaacatg cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg 7260
gcttaccttg gaggagtgcg ccaccttaat taacgttgat tctaataatg tcgagttgat 7320
gaatgaaatc ttcgacactg cgcttgctat caaagaacgt atctacggga accgcgtcgt 7380
gctgttcgcg cccttgtaca ttgctaatca ttgtatgaac acttgcactt attgtgcgtt 7440
tcgctcagcc aataagggca tggaacgctc tattctgaca gacgatgacc tgcgtgaaga 7500
agttgccgcc ttgcaacgtc aaggtcatcg ccgcatttta gcccttactg gagaacatcc 7560
taaatacact ttcgacaatt tcttgcatgc agtcaatgta atcgcttccg tgaagacaga 7620
gcctgaaggg tccattcgcc gtatcaatgt cgaaatccca ccacttagtg tctcagacat 7680
gcgccgcctt aagaatacag attcagttgg cacgttcgtt ctgtttcaag agacatatca 7740
ccgcgacaca ttcaaggtaa tgcatccgtc aggtccaaag agcgactttg attttcgcgt 7800
cttgacccag gaccgcgcca tgcgcgcagg cttggacgat gttggtattg gtgctttatt 7860
cgggttatat gattaccgtt atgaagtttg cgccatgtta atgcatagcg agcatttgga 7920
acgtgagtac aacgcaggac cacatactat ctctgttccc cgtatgcgcc ccgcggacgg 7980
aagcgagctt agtatcgcgc ctccttatcc tgttaatgat gctgatttta tgaaattagt 8040
tgcggtcctt cgtattgctg taccatacac aggtatgatc cttagcactc gtgaatcacc 8100
agaaatgcgc tcggcgcttc tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac 8160
tgatgtagga gcctatcaca aagatcacac gttaagtaca gaggcgaatt tgagtaagtt 8220
agctgggcag tttaccttgc aggatgaacg tccaactaat gagattgtta agtggctgat 8280
ggaggagggc tatgtcccgt cttggtgcac agcttgttac cgtcaaggtc gtacgggcga 8340
agacttcatg aacatctgta aggctggtga cattcacgat ttctgtcatc ccaatagtct 8400
gcttacgctt caagagtacc ttatggatta tgcagatcca gaccttcgta agaaaggcga 8460
gcaagtaatt gcccgtgaga tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg 8520
taagcgcctt gaacgcaaga tgaaacaagt attggagggg gagcacgatg tatatcttta 8580
accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt 8640
tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg tgggcctttc 8700
tgcgtttata 8710
<210> 37
<211> 8761
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自小核桃形巨球形菌的HydA(Hyd1)的密码子优化的示例性HPGC(产氢
基因簇)核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 37
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg aaggctgtag agggatttga 1740
atcaaaatat aaattttacg acaagcgcgt gccgattgcg gacgacaacc cagctgtgca 1800
ctttgacgaa acgaaatgca aaaattgtac cctttgccgt cgtgcgtgtg aaactacgca 1860
aaccgtgctg gactattaca gcctggaacg caccggcgat gttccggttt gtgttcactg 1920
cggtcaatgt gcaaatgcct gcccgtttgg tgccatgatg gaagttgatg atacgaactt 1980
agtcaaagct gcgatcgcgg acccggataa ggtggtggtt ttccaaacgg caccggcggt 2040
acgtgtggcc attgcggaag agttcggtgc ggaggcgggt acattcgcac agggtaaaat 2100
gatttcagcg ttgagagccc tgggtggcga ctacgtgttc gacaccaact ttggcgctga 2160
catgaccatc atggaagaaa cttccgagct ggtgcgtcgt attaccactg gtaacttcgc 2220
aatgccgcag tttaccagct gctgcccggc gtgggttgag tttgctgaga ccttctacgc 2280
agaatacatc ccgcatctgt ccagcgcgaa gagcccgatt ctgatgcaaa acaccacgga 2340
aaaaatctgg tttgccgaga aggcgggcat cgatccgaag aagatggtga cggtttgcgt 2400
taccccgtgt accgctaaaa aagccgagat caagcgcaaa gaattgaatg ctgcggctga 2460
gtactggcat attgatggct taaaggactc cgacatttgc atcacgaccc gtgaactggc 2520
acgttggctg aaagcggaga acattgactt caataccctg gatgatggta tttttgatag 2580
ccacctgggc gaggcgagcg gtggtggcat catcttcggc agcaccggtg gtgtcatgga 2640
gtccgcactg cgcagcgcgt attacttcta taccggtaaa ccgatgccag cggagtatat 2700
accgtatgaa ccggtgcgtg gcttggacgg cgttaaagag gcgaccatcg acttcagcgg 2760
tatctctctg catgtcgcag tcgtgagcgg tctcggcaat gcgcgtcgtt ttctggataa 2820
aattatggcg gacggcacct tcaaagatta cacctttatc gagttcatgg cgtgccaggg 2880
tggctgcatc aacggtggtg gccaaccgaa ggttaagatg cctctggttc agaaaaccaa 2940
ccaggctcgc atgaatagct tgtacaaacg tgattcggag gtttcgatta aggccgcctg 3000
ggaaaacccc gaaatccagg aactctacag cgacttctac ggccagccgc tgtctgagcg 3060
ctctgagaag tatattcaca ccttctttga ggataagtcc ggcaacctgg gtgaaggtgg 3120
tgctgtgacc ccgcaaacga acccattgtc tccgaagtat aagccgattg aatagggatc 3180
cgggtcgagg agaaggatga gaaaaagtga ccaggcatca aataaaacga aaggctcagt 3240
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc tactagagtc 3300
acactggctc accttcgggt gggcctttct gcgtttatat actagagggc tttacacttt 3360
atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat acatatggct catagtttaa 3420
gcgcacattc ccgtcaggcc ggagatcgca aactgggcgc aggtgcggca tctagccgcc 3480
catcatgtcc ttctcgccgc attgtccgcg tggcggccca tgcttctgcg tccaaggcga 3540
ctcccgatgt acctgttgac gatcttcctc ctgcgcatgc ccgtgcagca gtagcggccg 3600
ctaaccgtcg tgcgcgcgct atggcatcag cggaggccgc ggcagagacc ctgggcgatt 3660
tcctgggctt agggaagggg gggctttcgc cgggcgcaac cgccaacctt gatcgtgagc 3720
aagtattagg tgtgttggag gcggtctggc gtcgtggaga ccttaatctg gagcgtgcgt 3780
tgtacagcca tgccaatgcg gtgactaaca aatactgtgg tgggggggtc tactatcgcg 3840
gccttgtgga gttcagtaat atttgccaaa acgattgctc atattgtggg attcgcaaca 3900
atcaaaaaga agtttggcgc tatactatgc cggttgaaga ggtggtcgag gtagctaagt 3960
gggcgcttga aaacggcatt cgcaacatta tgttgcaagg gggtgaatta aagacagagc 4020
aacgcttagc ctacttggag gcatgcgtcc gtgcgattcg cgaggagaca acgcagttag 4080
accttgaaat gcgcgcacgt gccgcgagta cgacaacagc ggaagcggca gccagtgcac 4140
aggcagacgc cgaagctaaa cgcggcgagc cagaattggg tgtggtcgta tccttaagcg 4200
tcggagaact tcctatggaa cagtatgagc gtttgttccg cgccggcgcc cgtcgctatc 4260
tgatccgcat tgaaacctcg aatcccgacc tgtacgcggc acttcacccg gagccgatgt 4320
cctggcacgc gcgtgtagaa tgcctgcgca acctgaagaa agctgggtat atgttgggca 4380
caggagtgat ggtcggcttg ccgggacaaa ccttacacga cctggctggg gatgtcatgt 4440
tctttcgcga cattaaagcg gacatgatcg gtatgggccc cttcattacg cagcctggga 4500
cgcctgcaac tgataagtgg accgcgctgt atccgaacgc caataagaac agccacatga 4560
aatctatgtt cgatctgacc actgctatga atgcacttgt acgtattacg atggggaacg 4620
taaatatcag tgctacgact gcattacaag cgattatccc cactggacgt gaaattgcgc 4680
ttgagcgcgg cgcaaatgtt gtcatgccta ttttaacgcc tactcagtat cgcgagtcct 4740
atcagttata tgagggtaag ccctgcatta cggatactgc tgttcagtgt cgtcgttgcc 4800
tggacatgcg tttgcactcc gttggcaaaa cgtctgcggc cggagtttgg ggcgatcctg 4860
cttcgttctt gcatcccatc gttggcgtcc cagtcccgca cgacttgtca tcacctgctt 4920
tggccgctgc tgcaagtgcg gattttcacg aggttggcgc aggtccctgg aaccccatcc 4980
gactagagcg tctggttgaa gtgccggacc gttaccctga ccccgataac cacggacgca 5040
aaaaggcagg agccgggaaa ggaggcaagg cgcatgactc tcacgacgat ggcgatcacg 5100
acgaccacca ccaccaccac ggagctgccc ccgcgggtgc agcggctgga aagggtaccg 5160
gtgcagctgc aattggtggc ggagcggggg ctagccgtca acgcgtagca ggggctgctg 5220
ccgcctctgc tcgtctgtgt gcgggagctc gccgcgctgg ccgtgttgtc gcgtcgccat 5280
tgcgcccagc tgccgcttgc cgtggtgtgg ccgtcaaggc cgcagctgct gctgcgggtg 5340
aagacgctgg tgctggtacg tctggcgtag gttcaaatat tgttacgtct cccggaatcg 5400
ctagcactac ggcacatggt gttcctcgta tcaatattgg ggtgttcggc gtgatgaatg 5460
caggaaagtc tacacttgtg aatgctctgg cgcaacagga agcatgcatt gttgactcaa 5520
cccccggcac gaccgcagat gtaaaaacag ttttgcttga gcttcatgcc cttggaccag 5580
ccaagttgct ggacacagcc ggattagacg aagtcggtgg acttggggat aaaaagcgcc 5640
gtaaagccct gaatacgctg aaggagtgcg atgttgctgt gctggttgtt gacactgata 5700
cggcagccgc cgcaatcaaa tcgggacgcc ttgctgaagc cctggaatgg gaatcgaaag 5760
taatggaaca ggcacacaag tataatgtca gtcctgtact gcttctgaat gtaaaatcac 5820
gcgggctgcc tgaagcgcag gcagctagca tgcttgaggc ggtcgctggt atgcttgacc 5880
catccaagca aatccctcgt atgtcgctgg atttagcgtc cacccccctg cacgagcgta 5940
gtacgattac gtctgcattc gtcaaggaag gagcagtgcg cagttcacgc tatggggctc 6000
ctctgccggg gtgtttgccc cgttggtctc ttggacgcaa cgcccgctta ctgatggtaa 6060
tcccgatgga tgccgaaacc ccaggtggac gtcttcttcg tcctcaagcg caagttatgg 6120
aggaagcaat ccgccattgg gctaccgtgc tttccgtacg cctggattta gacgccgcac 6180
gtggcaaatt ggggcccgag gcctgtgaga tggagcgtca gcgtttcgac ggggtaattg 6240
ctatgatgga acgtaatgac ggacccaccc tggtggtgac agattctcaa gcgatcgatg 6300
ttgtacaccc ttggaccctg gaccgctcat caggacgtcc gttggttcca attactacct 6360
ttagcatcgc tatggcgtac caacaaaacg gcggacgttt ggacccgttt gtggaaggat 6420
tggaagcatt ggagacgtta caagatgggg atcgcgttct tatttcggaa gcgtgtaatc 6480
ataaccgtat cacctccgct tgcaacgaca ttggaatggt gcagatccct aacaagctgg 6540
aggcagcact tggcgggaaa aagttacaaa tcgaacatgc gtttggtcgc gagtttcccg 6600
agcttgagag tgggggtatg gatggattga agttagcgat ccattgtgga gggtgtatga 6660
tcgacgctca gaaaatgcag cagcgtatga aagacttgca tgaggctggg gtgccggtca 6720
ctaattatgg ggtgtttttc tcttgggcag cttggcccga cgcccttcgt cgcgcattgg 6780
aaccgtgggg agtggagcca ccggtaggta ctcctgctac ccccgcagcc gcgcctgcta 6840
cggcagcgtc cggggtataa tactactaga gggctttaca ctttatgctt ccggctcgta 6900
tgttgtgtgg aaagaaggag atatacatat gtcggtcccc ctacagtgca atgcaggccg 6960
tcttttggcg ggccagcgcc cctgcggcgt ccgcgcgcgt ctgaaccgcc gtgtatgtgt 7020
tccagtgacc gcacacggca aagcatctgc cacgcgcgaa tacgctggtg actttcttcc 7080
agggaccact attagtcatg cgtggtccgt ggagcgtgaa actcatcacc gttatcgtaa 7140
tccggccgag tggattaacg aggctgccat ccacaaggcg cttgaaacgt caaaggctga 7200
tgctcaggac gcaggacgcg tgcgtgagat tttggcgaag gctaaggaaa aggcttttgt 7260
tactgaacat gcgcctgtaa atgcggaaag taaatccgaa tttgtacaag ggcttacctt 7320
ggaggagtgc gccaccttaa ttaacgttga ttctaataat gtcgagttga tgaatgaaat 7380
cttcgacact gcgcttgcta tcaaagaacg tatctacggg aaccgcgtcg tgctgttcgc 7440
gcccttgtac attgctaatc attgtatgaa cacttgcact tattgtgcgt ttcgctcagc 7500
caataagggc atggaacgct ctattctgac agacgatgac ctgcgtgaag aagttgccgc 7560
cttgcaacgt caaggtcatc gccgcatttt agcccttact ggagaacatc ctaaatacac 7620
tttcgacaat ttcttgcatg cagtcaatgt aatcgcttcc gtgaagacag agcctgaagg 7680
gtccattcgc cgtatcaatg tcgaaatccc accacttagt gtctcagaca tgcgccgcct 7740
taagaataca gattcagttg gcacgttcgt tctgtttcaa gagacatatc accgcgacac 7800
attcaaggta atgcatccgt caggtccaaa gagcgacttt gattttcgcg tcttgaccca 7860
ggaccgcgcc atgcgcgcag gcttggacga tgttggtatt ggtgctttat tcgggttata 7920
tgattaccgt tatgaagttt gcgccatgtt aatgcatagc gagcatttgg aacgtgagta 7980
caacgcagga ccacatacta tctctgttcc ccgtatgcgc cccgcggacg gaagcgagct 8040
tagtatcgcg cctccttatc ctgttaatga tgctgatttt atgaaattag ttgcggtcct 8100
tcgtattgct gtaccataca caggtatgat ccttagcact cgtgaatcac cagaaatgcg 8160
ctcggcgctt ctgaagtgtg ggatgagtca aatgagtgcc ggctcgcgca ctgatgtagg 8220
agcctatcac aaagatcaca cgttaagtac agaggcgaat ttgagtaagt tagctgggca 8280
gtttaccttg caggatgaac gtccaactaa tgagattgtt aagtggctga tggaggaggg 8340
ctatgtcccg tcttggtgca cagcttgtta ccgtcaaggt cgtacgggcg aagacttcat 8400
gaacatctgt aaggctggtg acattcacga tttctgtcat cccaatagtc tgcttacgct 8460
tcaagagtac cttatggatt atgcagatcc agaccttcgt aagaaaggcg agcaagtaat 8520
tgcccgtgag atgggaccgg acgcctctga gccgttatcg gcgcaaagcc gtaagcgcct 8580
tgaacgcaag atgaaacaag tattggaggg ggagcacgat gtatatcttt aaccaggcat 8640
caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 8700
gtgaacgctc tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat 8760
a 8761
<210> 38
<211> 8773
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自小韦荣球菌的HydA(Hyd1)的密码子优化的示例性HPGC(产氢基因簇)
核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 38
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg tcaaaatatc aatttttaga 1740
tagaagggtc ccgattgagg acggtaacat cgctctggtt caggatttga ctaagtgcaa 1800
aaattgtagc ctgtgtcgta aagcttgcgc ggtcgatatg ggcgtctttg actactatga 1860
tctgaccacg aatggtgacc acccgatttg catccactgc ggtcaatgtg cgtccatctg 1920
cccattcgat tctattaatg aacgcagcga gatcgatgaa gttaaggcgg cgattgcgga 1980
cccgaacaaa atcgtcatct tccagaccgc accggctgtg cgtgtgggtc ttggcgagga 2040
gttcggcttg gaggcgggta cctttgtgga aggcaagatg gttgcagccc tgagaaagct 2100
gggcggtgac tacattctgg acaccaactt tggtgcggac atgaccatca tggaagaggc 2160
gtccgagttg ctggaacgtg ttatcaactc ggatgctgtt ctgccgcaat ttaccagctg 2220
ttgtccggcg tgggttaagt tcgcggagac attctacccg gagttcctgc ctaacctgag 2280
caccgcgaag tccccgattg ccatgcaggc accgacccag aaaacctatt tcgccgaaaa 2340
aatgggtctg gacgcgaagc agattgtggc ggtggccgta actccgtgta ctgccaagaa 2400
atttgagatt cgccgtgacg aaatgaacag cagcgcagag tattggaata ccccagaaat 2460
gcgtgatacc gattactgca tcaccacgcg tgagctggca aagtggctgc gcgcagaaga 2520
aatcaacttt gacgacctcg aggacagcgc atttgatccg ctgatgggtg aggctagcgg 2580
tggcggtatt atttttggca acaccggcgg cgttatggaa gctgccatgc gcgcggcgta 2640
taaaatggca accggtgaag atgcccccca aacccttatc ccattcgagg ccatcagagg 2700
catggatggt gcgcgcgaag ctgatgttgt gatcggtgac aagaccctgc acgttgcggc 2760
ggtgcatggt acgggcaatt tacgtaaatt cattgagcgc atgcgtgcgg agaacatcca 2820
ctacgacttc atcgaggtga tggcatgccg tggtgggtgc atcggcggcg gtggccaacc 2880
gcgtgttaaa ttgccgatgg ccgacaaagc gcgcgaagct cgtatcgcgt ctctatacac 2940
ccgtgacgca gaagtgactg taaaggccgc gtgcgataat ccggatattc agaaattata 3000
tgcagagttt ttcgacggca aaccgatgag ccataaagca catcacatgc tgcataccac 3060
gttcgtgaat cgtagcgaag atttgggtcc gaacggtgcg tgcaccccgg cgacgtgccc 3120
gaccagtgtt ccgaacctga aaaaggctgc tgaagcggcg aaggcggcgg ctgaagttaa 3180
ctcttaggga tccgggtcga ggagaaggat gagaaaaagt gaccaggcat caaataaaac 3240
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 3300
tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat atactagagg 3360
gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa agaaggagat atacatatgg 3420
ctcatagttt aagcgcacat tcccgtcagg ccggagatcg caaactgggc gcaggtgcgg 3480
catctagccg cccatcatgt ccttctcgcc gcattgtccg cgtggcggcc catgcttctg 3540
cgtccaaggc gactcccgat gtacctgttg acgatcttcc tcctgcgcat gcccgtgcag 3600
cagtagcggc cgctaaccgt cgtgcgcgcg ctatggcatc agcggaggcc gcggcagaga 3660
ccctgggcga tttcctgggc ttagggaagg gggggctttc gccgggcgca accgccaacc 3720
ttgatcgtga gcaagtatta ggtgtgttgg aggcggtctg gcgtcgtgga gaccttaatc 3780
tggagcgtgc gttgtacagc catgccaatg cggtgactaa caaatactgt ggtggggggg 3840
tctactatcg cggccttgtg gagttcagta atatttgcca aaacgattgc tcatattgtg 3900
ggattcgcaa caatcaaaaa gaagtttggc gctatactat gccggttgaa gaggtggtcg 3960
aggtagctaa gtgggcgctt gaaaacggca ttcgcaacat tatgttgcaa gggggtgaat 4020
taaagacaga gcaacgctta gcctacttgg aggcatgcgt ccgtgcgatt cgcgaggaga 4080
caacgcagtt agaccttgaa atgcgcgcac gtgccgcgag tacgacaaca gcggaagcgg 4140
cagccagtgc acaggcagac gccgaagcta aacgcggcga gccagaattg ggtgtggtcg 4200
tatccttaag cgtcggagaa cttcctatgg aacagtatga gcgtttgttc cgcgccggcg 4260
cccgtcgcta tctgatccgc attgaaacct cgaatcccga cctgtacgcg gcacttcacc 4320
cggagccgat gtcctggcac gcgcgtgtag aatgcctgcg caacctgaag aaagctgggt 4380
atatgttggg cacaggagtg atggtcggct tgccgggaca aaccttacac gacctggctg 4440
gggatgtcat gttctttcgc gacattaaag cggacatgat cggtatgggc cccttcatta 4500
cgcagcctgg gacgcctgca actgataagt ggaccgcgct gtatccgaac gccaataaga 4560
acagccacat gaaatctatg ttcgatctga ccactgctat gaatgcactt gtacgtatta 4620
cgatggggaa cgtaaatatc agtgctacga ctgcattaca agcgattatc cccactggac 4680
gtgaaattgc gcttgagcgc ggcgcaaatg ttgtcatgcc tattttaacg cctactcagt 4740
atcgcgagtc ctatcagtta tatgagggta agccctgcat tacggatact gctgttcagt 4800
gtcgtcgttg cctggacatg cgtttgcact ccgttggcaa aacgtctgcg gccggagttt 4860
ggggcgatcc tgcttcgttc ttgcatccca tcgttggcgt cccagtcccg cacgacttgt 4920
catcacctgc tttggccgct gctgcaagtg cggattttca cgaggttggc gcaggtccct 4980
ggaaccccat ccgactagag cgtctggttg aagtgccgga ccgttaccct gaccccgata 5040
accacggacg caaaaaggca ggagccggga aaggaggcaa ggcgcatgac tctcacgacg 5100
atggcgatca cgacgaccac caccaccacc acggagctgc ccccgcgggt gcagcggctg 5160
gaaagggtac cggtgcagct gcaattggtg gcggagcggg ggctagccgt caacgcgtag 5220
caggggctgc tgccgcctct gctcgtctgt gtgcgggagc tcgccgcgct ggccgtgttg 5280
tcgcgtcgcc attgcgccca gctgccgctt gccgtggtgt ggccgtcaag gccgcagctg 5340
ctgctgcggg tgaagacgct ggtgctggta cgtctggcgt aggttcaaat attgttacgt 5400
ctcccggaat cgctagcact acggcacatg gtgttcctcg tatcaatatt ggggtgttcg 5460
gcgtgatgaa tgcaggaaag tctacacttg tgaatgctct ggcgcaacag gaagcatgca 5520
ttgttgactc aacccccggc acgaccgcag atgtaaaaac agttttgctt gagcttcatg 5580
cccttggacc agccaagttg ctggacacag ccggattaga cgaagtcggt ggacttgggg 5640
ataaaaagcg ccgtaaagcc ctgaatacgc tgaaggagtg cgatgttgct gtgctggttg 5700
ttgacactga tacggcagcc gccgcaatca aatcgggacg ccttgctgaa gccctggaat 5760
gggaatcgaa agtaatggaa caggcacaca agtataatgt cagtcctgta ctgcttctga 5820
atgtaaaatc acgcgggctg cctgaagcgc aggcagctag catgcttgag gcggtcgctg 5880
gtatgcttga cccatccaag caaatccctc gtatgtcgct ggatttagcg tccacccccc 5940
tgcacgagcg tagtacgatt acgtctgcat tcgtcaagga aggagcagtg cgcagttcac 6000
gctatggggc tcctctgccg gggtgtttgc cccgttggtc tcttggacgc aacgcccgct 6060
tactgatggt aatcccgatg gatgccgaaa ccccaggtgg acgtcttctt cgtcctcaag 6120
cgcaagttat ggaggaagca atccgccatt gggctaccgt gctttccgta cgcctggatt 6180
tagacgccgc acgtggcaaa ttggggcccg aggcctgtga gatggagcgt cagcgtttcg 6240
acggggtaat tgctatgatg gaacgtaatg acggacccac cctggtggtg acagattctc 6300
aagcgatcga tgttgtacac ccttggaccc tggaccgctc atcaggacgt ccgttggttc 6360
caattactac ctttagcatc gctatggcgt accaacaaaa cggcggacgt ttggacccgt 6420
ttgtggaagg attggaagca ttggagacgt tacaagatgg ggatcgcgtt cttatttcgg 6480
aagcgtgtaa tcataaccgt atcacctccg cttgcaacga cattggaatg gtgcagatcc 6540
ctaacaagct ggaggcagca cttggcggga aaaagttaca aatcgaacat gcgtttggtc 6600
gcgagtttcc cgagcttgag agtgggggta tggatggatt gaagttagcg atccattgtg 6660
gagggtgtat gatcgacgct cagaaaatgc agcagcgtat gaaagacttg catgaggctg 6720
gggtgccggt cactaattat ggggtgtttt tctcttgggc agcttggccc gacgcccttc 6780
gtcgcgcatt ggaaccgtgg ggagtggagc caccggtagg tactcctgct acccccgcag 6840
ccgcgcctgc tacggcagcg tccggggtat aatactacta gagggcttta cactttatgc 6900
ttccggctcg tatgttgtgt ggaaagaagg agatatacat atgtcggtcc ccctacagtg 6960
caatgcaggc cgtcttttgg cgggccagcg cccctgcggc gtccgcgcgc gtctgaaccg 7020
ccgtgtatgt gttccagtga ccgcacacgg caaagcatct gccacgcgcg aatacgctgg 7080
tgactttctt ccagggacca ctattagtca tgcgtggtcc gtggagcgtg aaactcatca 7140
ccgttatcgt aatccggccg agtggattaa cgaggctgcc atccacaagg cgcttgaaac 7200
gtcaaaggct gatgctcagg acgcaggacg cgtgcgtgag attttggcga aggctaagga 7260
aaaggctttt gttactgaac atgcgcctgt aaatgcggaa agtaaatccg aatttgtaca 7320
agggcttacc ttggaggagt gcgccacctt aattaacgtt gattctaata atgtcgagtt 7380
gatgaatgaa atcttcgaca ctgcgcttgc tatcaaagaa cgtatctacg ggaaccgcgt 7440
cgtgctgttc gcgcccttgt acattgctaa tcattgtatg aacacttgca cttattgtgc 7500
gtttcgctca gccaataagg gcatggaacg ctctattctg acagacgatg acctgcgtga 7560
agaagttgcc gccttgcaac gtcaaggtca tcgccgcatt ttagccctta ctggagaaca 7620
tcctaaatac actttcgaca atttcttgca tgcagtcaat gtaatcgctt ccgtgaagac 7680
agagcctgaa gggtccattc gccgtatcaa tgtcgaaatc ccaccactta gtgtctcaga 7740
catgcgccgc cttaagaata cagattcagt tggcacgttc gttctgtttc aagagacata 7800
tcaccgcgac acattcaagg taatgcatcc gtcaggtcca aagagcgact ttgattttcg 7860
cgtcttgacc caggaccgcg ccatgcgcgc aggcttggac gatgttggta ttggtgcttt 7920
attcgggtta tatgattacc gttatgaagt ttgcgccatg ttaatgcata gcgagcattt 7980
ggaacgtgag tacaacgcag gaccacatac tatctctgtt ccccgtatgc gccccgcgga 8040
cggaagcgag cttagtatcg cgcctcctta tcctgttaat gatgctgatt ttatgaaatt 8100
agttgcggtc cttcgtattg ctgtaccata cacaggtatg atccttagca ctcgtgaatc 8160
accagaaatg cgctcggcgc ttctgaagtg tgggatgagt caaatgagtg ccggctcgcg 8220
cactgatgta ggagcctatc acaaagatca cacgttaagt acagaggcga atttgagtaa 8280
gttagctggg cagtttacct tgcaggatga acgtccaact aatgagattg ttaagtggct 8340
gatggaggag ggctatgtcc cgtcttggtg cacagcttgt taccgtcaag gtcgtacggg 8400
cgaagacttc atgaacatct gtaaggctgg tgacattcac gatttctgtc atcccaatag 8460
tctgcttacg cttcaagagt accttatgga ttatgcagat ccagaccttc gtaagaaagg 8520
cgagcaagta attgcccgtg agatgggacc ggacgcctct gagccgttat cggcgcaaag 8580
ccgtaagcgc cttgaacgca agatgaaaca agtattggag ggggagcacg atgtatatct 8640
ttaaccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc 8700
tgttgtttgt cggtgaacgc tctctactag agtcacactg gctcaccttc gggtgggcct 8760
ttctgcgttt ata 8773
<210> 39
<211> 8734
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自非典型韦荣球菌的HydA(Hyd1)的密码子优化的示例性HPGC(产氢基
因簇)核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 39
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg tcacaatttg aatttataga 1740
taaaagggtc cctattgcgc tcgacaaccc gagcatctat cacgatatct ccaaatgcaa 1800
aaactgcacc ttatgccgtc gtgcgtgcgc cgacgtgatg agcgttctgg actactacga 1860
tctggaagcg accggtgacg tgccagtttg tattcattgt ggacaatgtg cagcggcgtg 1920
cccgtttgac tcgatgcatg caaaaagcga attggataag gtgaaggtgg ctattgccga 1980
tccggataaa atcgtcgtta ttcagaccgc tccggctgta cgcgtgtcga ttggcgaggg 2040
tttcggcttt gaaccgggta cgtttctcga gggcaaaatg gttagcgcgc tgcgtaaact 2100
gggtgccgac tacgtggtcg acacgaactt cggcgcggat ctgaccatta tggaggaggc 2160
gtctgaattg gttgatcgtc tgaagaacgg tggcacgatc ccgcaattca ccagttgctg 2220
cccggcttgg gttcgttttg cggaaatcta cttcccggag ttgatcccaa atctgtctag 2280
cacccgtagc tgcatcgcaa tggaggccgc tatgattaaa acctatttcg ctgagaaaaa 2340
gggtattaac ccggcgaata tcgtgtccgt ctccgttaat ccgtgtactg cgaagaaggc 2400
tgagacaaag cgcgtggaag aaaatgctgc cgcgcgttat tacgacgacg aatcccttgg 2460
catggatacc gacatcagca ttaccaccag agaatttatc cgttggctga acgacgaagg 2520
cgtggacttc gagtccctgg aggacagcca gtttgatgat cttatcggta tggaaactgg 2580
cgcgtctatc atttttggta ataccggtgg cgttatggag gctgctatga gaacggcgta 2640
caaactgatt acggataagg agccgccacc gtatgcactg acccacctgg aggatgtgcg 2700
cggtatgaac ggtgtgaaag aggcgacggt tcagctgggt gatgacgtga ctctgagcgt 2760
tgcggtggtt cacggcggta agaacacccg tgattttttg aatgcgctga aggagaacgg 2820
caagcactat gacttcatcg aagtcatggc atgtccgggt gggtgcattg gtggcggtgg 2880
ccaaccgcgt accaaactgc cgcaggcggt taagaccaaa gaggcgcgta tcggcggtct 2940
gtacaaggcg gacgaagaat ataagtacgt tgccagctat gaatcaccgg aaatccaaga 3000
gttgtacaag aacttcttgg gagaacctct gggtcacaaa gcacatgaat tgctgcatac 3060
ccacttcacc gatcgcagcg cacagttagg cgaccgcaaa gatgttgtcc cggagacctg 3120
tccgaccagc ccgaaataca agggttaggg atccgggtcg aggagaagga tgagaaaaag 3180
tgaccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct 3240
gttgtttgtc ggtgaacgct ctctactaga gtcacactgg ctcaccttcg ggtgggcctt 3300
tctgcgttta tatactagag ggctttacac tttatgcttc cggctcgtat gttgtgtgga 3360
aagaaggaga tatacatatg gctcatagtt taagcgcaca ttcccgtcag gccggagatc 3420
gcaaactggg cgcaggtgcg gcatctagcc gcccatcatg tccttctcgc cgcattgtcc 3480
gcgtggcggc ccatgcttct gcgtccaagg cgactcccga tgtacctgtt gacgatcttc 3540
ctcctgcgca tgcccgtgca gcagtagcgg ccgctaaccg tcgtgcgcgc gctatggcat 3600
cagcggaggc cgcggcagag accctgggcg atttcctggg cttagggaag ggggggcttt 3660
cgccgggcgc aaccgccaac cttgatcgtg agcaagtatt aggtgtgttg gaggcggtct 3720
ggcgtcgtgg agaccttaat ctggagcgtg cgttgtacag ccatgccaat gcggtgacta 3780
acaaatactg tggtgggggg gtctactatc gcggccttgt ggagttcagt aatatttgcc 3840
aaaacgattg ctcatattgt gggattcgca acaatcaaaa agaagtttgg cgctatacta 3900
tgccggttga agaggtggtc gaggtagcta agtgggcgct tgaaaacggc attcgcaaca 3960
ttatgttgca agggggtgaa ttaaagacag agcaacgctt agcctacttg gaggcatgcg 4020
tccgtgcgat tcgcgaggag acaacgcagt tagaccttga aatgcgcgca cgtgccgcga 4080
gtacgacaac agcggaagcg gcagccagtg cacaggcaga cgccgaagct aaacgcggcg 4140
agccagaatt gggtgtggtc gtatccttaa gcgtcggaga acttcctatg gaacagtatg 4200
agcgtttgtt ccgcgccggc gcccgtcgct atctgatccg cattgaaacc tcgaatcccg 4260
acctgtacgc ggcacttcac ccggagccga tgtcctggca cgcgcgtgta gaatgcctgc 4320
gcaacctgaa gaaagctggg tatatgttgg gcacaggagt gatggtcggc ttgccgggac 4380
aaaccttaca cgacctggct ggggatgtca tgttctttcg cgacattaaa gcggacatga 4440
tcggtatggg ccccttcatt acgcagcctg ggacgcctgc aactgataag tggaccgcgc 4500
tgtatccgaa cgccaataag aacagccaca tgaaatctat gttcgatctg accactgcta 4560
tgaatgcact tgtacgtatt acgatgggga acgtaaatat cagtgctacg actgcattac 4620
aagcgattat ccccactgga cgtgaaattg cgcttgagcg cggcgcaaat gttgtcatgc 4680
ctattttaac gcctactcag tatcgcgagt cctatcagtt atatgagggt aagccctgca 4740
ttacggatac tgctgttcag tgtcgtcgtt gcctggacat gcgtttgcac tccgttggca 4800
aaacgtctgc ggccggagtt tggggcgatc ctgcttcgtt cttgcatccc atcgttggcg 4860
tcccagtccc gcacgacttg tcatcacctg ctttggccgc tgctgcaagt gcggattttc 4920
acgaggttgg cgcaggtccc tggaacccca tccgactaga gcgtctggtt gaagtgccgg 4980
accgttaccc tgaccccgat aaccacggac gcaaaaaggc aggagccggg aaaggaggca 5040
aggcgcatga ctctcacgac gatggcgatc acgacgacca ccaccaccac cacggagctg 5100
cccccgcggg tgcagcggct ggaaagggta ccggtgcagc tgcaattggt ggcggagcgg 5160
gggctagccg tcaacgcgta gcaggggctg ctgccgcctc tgctcgtctg tgtgcgggag 5220
ctcgccgcgc tggccgtgtt gtcgcgtcgc cattgcgccc agctgccgct tgccgtggtg 5280
tggccgtcaa ggccgcagct gctgctgcgg gtgaagacgc tggtgctggt acgtctggcg 5340
taggttcaaa tattgttacg tctcccggaa tcgctagcac tacggcacat ggtgttcctc 5400
gtatcaatat tggggtgttc ggcgtgatga atgcaggaaa gtctacactt gtgaatgctc 5460
tggcgcaaca ggaagcatgc attgttgact caacccccgg cacgaccgca gatgtaaaaa 5520
cagttttgct tgagcttcat gcccttggac cagccaagtt gctggacaca gccggattag 5580
acgaagtcgg tggacttggg gataaaaagc gccgtaaagc cctgaatacg ctgaaggagt 5640
gcgatgttgc tgtgctggtt gttgacactg atacggcagc cgccgcaatc aaatcgggac 5700
gccttgctga agccctggaa tgggaatcga aagtaatgga acaggcacac aagtataatg 5760
tcagtcctgt actgcttctg aatgtaaaat cacgcgggct gcctgaagcg caggcagcta 5820
gcatgcttga ggcggtcgct ggtatgcttg acccatccaa gcaaatccct cgtatgtcgc 5880
tggatttagc gtccaccccc ctgcacgagc gtagtacgat tacgtctgca ttcgtcaagg 5940
aaggagcagt gcgcagttca cgctatgggg ctcctctgcc ggggtgtttg ccccgttggt 6000
ctcttggacg caacgcccgc ttactgatgg taatcccgat ggatgccgaa accccaggtg 6060
gacgtcttct tcgtcctcaa gcgcaagtta tggaggaagc aatccgccat tgggctaccg 6120
tgctttccgt acgcctggat ttagacgccg cacgtggcaa attggggccc gaggcctgtg 6180
agatggagcg tcagcgtttc gacggggtaa ttgctatgat ggaacgtaat gacggaccca 6240
ccctggtggt gacagattct caagcgatcg atgttgtaca cccttggacc ctggaccgct 6300
catcaggacg tccgttggtt ccaattacta cctttagcat cgctatggcg taccaacaaa 6360
acggcggacg tttggacccg tttgtggaag gattggaagc attggagacg ttacaagatg 6420
gggatcgcgt tcttatttcg gaagcgtgta atcataaccg tatcacctcc gcttgcaacg 6480
acattggaat ggtgcagatc cctaacaagc tggaggcagc acttggcggg aaaaagttac 6540
aaatcgaaca tgcgtttggt cgcgagtttc ccgagcttga gagtgggggt atggatggat 6600
tgaagttagc gatccattgt ggagggtgta tgatcgacgc tcagaaaatg cagcagcgta 6660
tgaaagactt gcatgaggct ggggtgccgg tcactaatta tggggtgttt ttctcttggg 6720
cagcttggcc cgacgccctt cgtcgcgcat tggaaccgtg gggagtggag ccaccggtag 6780
gtactcctgc tacccccgca gccgcgcctg ctacggcagc gtccggggta taatactact 6840
agagggcttt acactttatg cttccggctc gtatgttgtg tggaaagaag gagatataca 6900
tatgtcggtc cccctacagt gcaatgcagg ccgtcttttg gcgggccagc gcccctgcgg 6960
cgtccgcgcg cgtctgaacc gccgtgtatg tgttccagtg accgcacacg gcaaagcatc 7020
tgccacgcgc gaatacgctg gtgactttct tccagggacc actattagtc atgcgtggtc 7080
cgtggagcgt gaaactcatc accgttatcg taatccggcc gagtggatta acgaggctgc 7140
catccacaag gcgcttgaaa cgtcaaaggc tgatgctcag gacgcaggac gcgtgcgtga 7200
gattttggcg aaggctaagg aaaaggcttt tgttactgaa catgcgcctg taaatgcgga 7260
aagtaaatcc gaatttgtac aagggcttac cttggaggag tgcgccacct taattaacgt 7320
tgattctaat aatgtcgagt tgatgaatga aatcttcgac actgcgcttg ctatcaaaga 7380
acgtatctac gggaaccgcg tcgtgctgtt cgcgcccttg tacattgcta atcattgtat 7440
gaacacttgc acttattgtg cgtttcgctc agccaataag ggcatggaac gctctattct 7500
gacagacgat gacctgcgtg aagaagttgc cgccttgcaa cgtcaaggtc atcgccgcat 7560
tttagccctt actggagaac atcctaaata cactttcgac aatttcttgc atgcagtcaa 7620
tgtaatcgct tccgtgaaga cagagcctga agggtccatt cgccgtatca atgtcgaaat 7680
cccaccactt agtgtctcag acatgcgccg ccttaagaat acagattcag ttggcacgtt 7740
cgttctgttt caagagacat atcaccgcga cacattcaag gtaatgcatc cgtcaggtcc 7800
aaagagcgac tttgattttc gcgtcttgac ccaggaccgc gccatgcgcg caggcttgga 7860
cgatgttggt attggtgctt tattcgggtt atatgattac cgttatgaag tttgcgccat 7920
gttaatgcat agcgagcatt tggaacgtga gtacaacgca ggaccacata ctatctctgt 7980
tccccgtatg cgccccgcgg acggaagcga gcttagtatc gcgcctcctt atcctgttaa 8040
tgatgctgat tttatgaaat tagttgcggt ccttcgtatt gctgtaccat acacaggtat 8100
gatccttagc actcgtgaat caccagaaat gcgctcggcg cttctgaagt gtgggatgag 8160
tcaaatgagt gccggctcgc gcactgatgt aggagcctat cacaaagatc acacgttaag 8220
tacagaggcg aatttgagta agttagctgg gcagtttacc ttgcaggatg aacgtccaac 8280
taatgagatt gttaagtggc tgatggagga gggctatgtc ccgtcttggt gcacagcttg 8340
ttaccgtcaa ggtcgtacgg gcgaagactt catgaacatc tgtaaggctg gtgacattca 8400
cgatttctgt catcccaata gtctgcttac gcttcaagag taccttatgg attatgcaga 8460
tccagacctt cgtaagaaag gcgagcaagt aattgcccgt gagatgggac cggacgcctc 8520
tgagccgtta tcggcgcaaa gccgtaagcg ccttgaacgc aagatgaaac aagtattgga 8580
gggggagcac gatgtatatc tttaaccagg catcaaataa aacgaaaggc tcagtcgaaa 8640
gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact 8700
ggctcacctt cgggtgggcc tttctgcgtt tata 8734
<210> 40
<211> 8704
<212> DNA
<213> Artificial Sequence
<220>
<223> 编码来自双酶梭菌的HydA(Hyd1)的密码子优化的示例性HPGC(产氢基因簇)
核酸序列, 5' - 3' (包括粗体显示的限制性位点)
<400> 40
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg aagcacctat ttacagaaaa 1740
agtagttccg atcgagctgg ataacccgtc cattcagatt gactttgata agtgcatcaa 1800
gtgcggtctg tgtaaacgcg tttgtgaaaa cgagattggt gttaatggtt atttcgacct 1860
ggagaagacc ggtgacatcg ccatctgcat caactgcggc caatgtgttc aggcatgtcc 1920
aaaaaaggcg atcacccagg ttatcgatgt ggatcgcgtg aaggaagcga tcaacgatcc 1980
ggaaaagatt gttatcttca gcacagcgcc agctgtgcgt gtcgcactgg gcgaagaatt 2040
taacctggaa gaaggcgcgt atgttgagga caaaatggtg gacgccctgc gtaaactggg 2100
tggagattac gtttttgacg ttacctttgg cgccgatatg accatcatgg aagaggcgaa 2160
cgaacttgtt tctcgtatca aaaacggcaa aggcaaaacc ccgcaattta ccagctgctg 2220
cccgtcctgg gttaagttcg cggaaacgtt ctatccggag ttgattccga atctgtctac 2280
cacgaaatct ccgattggca ttcagggtgc tgtcatcaag acctatttcg cacagaaagc 2340
aaatatcgac ccggagaaaa tcgtgaacgt aaccattact ccgtgcaccg ctaagaagta 2400
cgaaattgac cgtccggaga tgaatgcgag cgcaaaatac aacaaaagcg aaaatatgag 2460
agataatgac atcatcctca ccactaagga gctggcgcag tggctccgtg acgaagagat 2520
cgacttcaac gctttggagg gctcgaaatt tgacaacatc ttgggcttgg gtagcggtgc 2580
gggcattatc ttcggtaata gcggtggtgt gatggaagcc gcggtgcgca cggtctacaa 2640
tatcctcacc catgagaacc cacataaaga actgctgcac tttaatccgg ttcgtggtct 2700
ggaagacgtg aaggaggcta cccttaccat tggcgatacc accctgcgcc tggcagcggt 2760
gcaaggcacg gcgaacgtgc gtacgttgat cgaaaagctg aaatccggtg aggtggagta 2820
cgacttcata gaggtaatga cttgcaaagg tggttgtatt ggtggcgctg gtcaaccgaa 2880
gatgaaagcg cgtattagca atgagatgcg tctcaagcgc attgagggtc tgtacgataa 2940
ggacaagcac attgcggtca aatgcagcta tgaaaacccg gatgtcatca acgtgtacaa 3000
ggagttcttc aaacaaccgc tgagccattt atcccacgag ttgctgcaca ccacctttga 3060
aagcaagcac gatatgttgg gtctgaagga tgacaacaac gtttcggata ttggctaggg 3120
atccgggtcg aggagaagga tgagaaaaag tgaccaggca tcaaataaaa cgaaaggctc 3180
agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga 3240
gtcacactgg ctcaccttcg ggtgggcctt tctgcgttta tatactagag ggctttacac 3300
tttatgcttc cggctcgtat gttgtgtgga aagaaggaga tatacatatg gctcatagtt 3360
taagcgcaca ttcccgtcag gccggagatc gcaaactggg cgcaggtgcg gcatctagcc 3420
gcccatcatg tccttctcgc cgcattgtcc gcgtggcggc ccatgcttct gcgtccaagg 3480
cgactcccga tgtacctgtt gacgatcttc ctcctgcgca tgcccgtgca gcagtagcgg 3540
ccgctaaccg tcgtgcgcgc gctatggcat cagcggaggc cgcggcagag accctgggcg 3600
atttcctggg cttagggaag ggggggcttt cgccgggcgc aaccgccaac cttgatcgtg 3660
agcaagtatt aggtgtgttg gaggcggtct ggcgtcgtgg agaccttaat ctggagcgtg 3720
cgttgtacag ccatgccaat gcggtgacta acaaatactg tggtgggggg gtctactatc 3780
gcggccttgt ggagttcagt aatatttgcc aaaacgattg ctcatattgt gggattcgca 3840
acaatcaaaa agaagtttgg cgctatacta tgccggttga agaggtggtc gaggtagcta 3900
agtgggcgct tgaaaacggc attcgcaaca ttatgttgca agggggtgaa ttaaagacag 3960
agcaacgctt agcctacttg gaggcatgcg tccgtgcgat tcgcgaggag acaacgcagt 4020
tagaccttga aatgcgcgca cgtgccgcga gtacgacaac agcggaagcg gcagccagtg 4080
cacaggcaga cgccgaagct aaacgcggcg agccagaatt gggtgtggtc gtatccttaa 4140
gcgtcggaga acttcctatg gaacagtatg agcgtttgtt ccgcgccggc gcccgtcgct 4200
atctgatccg cattgaaacc tcgaatcccg acctgtacgc ggcacttcac ccggagccga 4260
tgtcctggca cgcgcgtgta gaatgcctgc gcaacctgaa gaaagctggg tatatgttgg 4320
gcacaggagt gatggtcggc ttgccgggac aaaccttaca cgacctggct ggggatgtca 4380
tgttctttcg cgacattaaa gcggacatga tcggtatggg ccccttcatt acgcagcctg 4440
ggacgcctgc aactgataag tggaccgcgc tgtatccgaa cgccaataag aacagccaca 4500
tgaaatctat gttcgatctg accactgcta tgaatgcact tgtacgtatt acgatgggga 4560
acgtaaatat cagtgctacg actgcattac aagcgattat ccccactgga cgtgaaattg 4620
cgcttgagcg cggcgcaaat gttgtcatgc ctattttaac gcctactcag tatcgcgagt 4680
cctatcagtt atatgagggt aagccctgca ttacggatac tgctgttcag tgtcgtcgtt 4740
gcctggacat gcgtttgcac tccgttggca aaacgtctgc ggccggagtt tggggcgatc 4800
ctgcttcgtt cttgcatccc atcgttggcg tcccagtccc gcacgacttg tcatcacctg 4860
ctttggccgc tgctgcaagt gcggattttc acgaggttgg cgcaggtccc tggaacccca 4920
tccgactaga gcgtctggtt gaagtgccgg accgttaccc tgaccccgat aaccacggac 4980
gcaaaaaggc aggagccggg aaaggaggca aggcgcatga ctctcacgac gatggcgatc 5040
acgacgacca ccaccaccac cacggagctg cccccgcggg tgcagcggct ggaaagggta 5100
ccggtgcagc tgcaattggt ggcggagcgg gggctagccg tcaacgcgta gcaggggctg 5160
ctgccgcctc tgctcgtctg tgtgcgggag ctcgccgcgc tggccgtgtt gtcgcgtcgc 5220
cattgcgccc agctgccgct tgccgtggtg tggccgtcaa ggccgcagct gctgctgcgg 5280
gtgaagacgc tggtgctggt acgtctggcg taggttcaaa tattgttacg tctcccggaa 5340
tcgctagcac tacggcacat ggtgttcctc gtatcaatat tggggtgttc ggcgtgatga 5400
atgcaggaaa gtctacactt gtgaatgctc tggcgcaaca ggaagcatgc attgttgact 5460
caacccccgg cacgaccgca gatgtaaaaa cagttttgct tgagcttcat gcccttggac 5520
cagccaagtt gctggacaca gccggattag acgaagtcgg tggacttggg gataaaaagc 5580
gccgtaaagc cctgaatacg ctgaaggagt gcgatgttgc tgtgctggtt gttgacactg 5640
atacggcagc cgccgcaatc aaatcgggac gccttgctga agccctggaa tgggaatcga 5700
aagtaatgga acaggcacac aagtataatg tcagtcctgt actgcttctg aatgtaaaat 5760
cacgcgggct gcctgaagcg caggcagcta gcatgcttga ggcggtcgct ggtatgcttg 5820
acccatccaa gcaaatccct cgtatgtcgc tggatttagc gtccaccccc ctgcacgagc 5880
gtagtacgat tacgtctgca ttcgtcaagg aaggagcagt gcgcagttca cgctatgggg 5940
ctcctctgcc ggggtgtttg ccccgttggt ctcttggacg caacgcccgc ttactgatgg 6000
taatcccgat ggatgccgaa accccaggtg gacgtcttct tcgtcctcaa gcgcaagtta 6060
tggaggaagc aatccgccat tgggctaccg tgctttccgt acgcctggat ttagacgccg 6120
cacgtggcaa attggggccc gaggcctgtg agatggagcg tcagcgtttc gacggggtaa 6180
ttgctatgat ggaacgtaat gacggaccca ccctggtggt gacagattct caagcgatcg 6240
atgttgtaca cccttggacc ctggaccgct catcaggacg tccgttggtt ccaattacta 6300
cctttagcat cgctatggcg taccaacaaa acggcggacg tttggacccg tttgtggaag 6360
gattggaagc attggagacg ttacaagatg gggatcgcgt tcttatttcg gaagcgtgta 6420
atcataaccg tatcacctcc gcttgcaacg acattggaat ggtgcagatc cctaacaagc 6480
tggaggcagc acttggcggg aaaaagttac aaatcgaaca tgcgtttggt cgcgagtttc 6540
ccgagcttga gagtgggggt atggatggat tgaagttagc gatccattgt ggagggtgta 6600
tgatcgacgc tcagaaaatg cagcagcgta tgaaagactt gcatgaggct ggggtgccgg 6660
tcactaatta tggggtgttt ttctcttggg cagcttggcc cgacgccctt cgtcgcgcat 6720
tggaaccgtg gggagtggag ccaccggtag gtactcctgc tacccccgca gccgcgcctg 6780
ctacggcagc gtccggggta taatactact agagggcttt acactttatg cttccggctc 6840
gtatgttgtg tggaaagaag gagatataca tatgtcggtc cccctacagt gcaatgcagg 6900
ccgtcttttg gcgggccagc gcccctgcgg cgtccgcgcg cgtctgaacc gccgtgtatg 6960
tgttccagtg accgcacacg gcaaagcatc tgccacgcgc gaatacgctg gtgactttct 7020
tccagggacc actattagtc atgcgtggtc cgtggagcgt gaaactcatc accgttatcg 7080
taatccggcc gagtggatta acgaggctgc catccacaag gcgcttgaaa cgtcaaaggc 7140
tgatgctcag gacgcaggac gcgtgcgtga gattttggcg aaggctaagg aaaaggcttt 7200
tgttactgaa catgcgcctg taaatgcgga aagtaaatcc gaatttgtac aagggcttac 7260
cttggaggag tgcgccacct taattaacgt tgattctaat aatgtcgagt tgatgaatga 7320
aatcttcgac actgcgcttg ctatcaaaga acgtatctac gggaaccgcg tcgtgctgtt 7380
cgcgcccttg tacattgcta atcattgtat gaacacttgc acttattgtg cgtttcgctc 7440
agccaataag ggcatggaac gctctattct gacagacgat gacctgcgtg aagaagttgc 7500
cgccttgcaa cgtcaaggtc atcgccgcat tttagccctt actggagaac atcctaaata 7560
cactttcgac aatttcttgc atgcagtcaa tgtaatcgct tccgtgaaga cagagcctga 7620
agggtccatt cgccgtatca atgtcgaaat cccaccactt agtgtctcag acatgcgccg 7680
ccttaagaat acagattcag ttggcacgtt cgttctgttt caagagacat atcaccgcga 7740
cacattcaag gtaatgcatc cgtcaggtcc aaagagcgac tttgattttc gcgtcttgac 7800
ccaggaccgc gccatgcgcg caggcttgga cgatgttggt attggtgctt tattcgggtt 7860
atatgattac cgttatgaag tttgcgccat gttaatgcat agcgagcatt tggaacgtga 7920
gtacaacgca ggaccacata ctatctctgt tccccgtatg cgccccgcgg acggaagcga 7980
gcttagtatc gcgcctcctt atcctgttaa tgatgctgat tttatgaaat tagttgcggt 8040
ccttcgtatt gctgtaccat acacaggtat gatccttagc actcgtgaat caccagaaat 8100
gcgctcggcg cttctgaagt gtgggatgag tcaaatgagt gccggctcgc gcactgatgt 8160
aggagcctat cacaaagatc acacgttaag tacagaggcg aatttgagta agttagctgg 8220
gcagtttacc ttgcaggatg aacgtccaac taatgagatt gttaagtggc tgatggagga 8280
gggctatgtc ccgtcttggt gcacagcttg ttaccgtcaa ggtcgtacgg gcgaagactt 8340
catgaacatc tgtaaggctg gtgacattca cgatttctgt catcccaata gtctgcttac 8400
gcttcaagag taccttatgg attatgcaga tccagacctt cgtaagaaag gcgagcaagt 8460
aattgcccgt gagatgggac cggacgcctc tgagccgtta tcggcgcaaa gccgtaagcg 8520
ccttgaacgc aagatgaaac aagtattgga gggggagcac gatgtatatc tttaaccagg 8580
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 8640
tcggtgaacg ctctctacta gagtcacact ggctcacctt cgggtgggcc tttctgcgtt 8700
tata 8704

Claims (34)

1.一种用于产生氢气的重组的微生物,其中所述微生物包括:
-编码一种或多种蛋白质的外源性核酸序列,所述蛋白质能使微生物产生氢气,
-其中所述一种或多种蛋白质包含Fe-Fe依赖性氢化酶,优选为HydA,
-其中所述核酸序列与一种或多种启动子可操作地连接,以使所述核酸序列能够在所述微生物中表达,和
-其中所述微生物或细胞包含通过戊糖磷酸途径促进碳利用的基因修饰。
2.如权利要求1所述的重组的微生物,其中所述核酸序列编码的蛋白质为铁氧还蛋白-NADP+还原酶(FNR)和铁氧还蛋白。
3.如要求1或2所述的重组的微生物,其中所述核酸序列编码至少一种装配蛋白,所述装配蛋白能够使所述氢化酶成熟和活化。
4.如权利要求1-3中任一项所述的重组的微生物,其中,通过戊糖磷酸途径促进碳利用的基因修饰可降低或抑制所述微生物的一种或多种内源性蛋白质的活性或水平,所述内源性蛋白质选自:磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、6-磷酸葡糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶。
5.如权利要求1-4中任一项所述的重组的微生物,其中,所述基因修饰通过戊糖磷酸途径促进碳利用的基因修饰增加戊糖磷酸途径的一种或多种蛋白质和烟酰胺腺嘌呤二核苷酸磷酸(NADPH)来调节蛋白质的水平或活性,其中所述基因修饰是a)编码所述一种或多种蛋白质的基因的启动子区的修饰或b)用异源基因序列替换编码所述一种或多种蛋白质的内源性基因。
6.如权利要求2-5中任一项所述的重组的微生物,其中所述FNR和铁氧还蛋白来自莱茵衣藻(Chlamydomonas reinhardtii),或来自与莱茵衣藻的FNR和铁氧还蛋白功能等同的同系物或衍生物。
7.如权利要求3-6中任一项所述的重组的微生物,其中所述至少一种装配蛋白选自HydEF和HydG或其功能等同的同系物或衍生物。
8.如权利要求7所述的重组的微生物,其中所述核酸序列编码来自莱茵衣藻的HydEF和HydG或与来自莱茵衣藻的HydEF、HydG蛋白功能等同的同系物或衍生物。
9.如权利要求1-8中任何一种的重组的微生物,其中Fe-Fe依赖性氢化酶是HydA蛋白或其功能等同的同系物或衍生物,来自选自下组的微生物:莱茵衣藻、卡特氏团藻(Volvoxcarteri)、蓝氏贾第虫(Giardia lamblia)、诺氏内阿米巴(Entamoeba nuttalli)、嗜多变形泥杆菌(Ilyobacter polytrophus)、阴道毛滴虫(Trichomonas vaginalis)、小核桃形巨球形菌(Megasphaera micronuciformis)、小韦荣球菌(Veillonella parvula)、非典型韦荣球菌(Veillonella atypica)、和双酶梭菌(Peptoclostridium bifermentans)。
10.如权利要求9所述的重组的微生物,其中所述HydA蛋白或其功能等同的同系物或衍生物来自莱茵衣藻。
11.如权利要求1-10中任一项所述的重组的微生物,其中所述微生物是大肠杆菌的菌株。
12.如权利要求1-11中任一项所述的重组的微生物,其中所述外源性核酸序列在单个多核苷酸构建体中提供。
13.如权利要求1-12中任一项所述的重组的微生物,其中所述外源性核酸序列进行了密码子优化以提供在所述微生物中的优化表达。
14.一种大肠杆菌细胞,其包括编码使细胞能够产生氢气的蛋白质的外源性核酸,其中所述蛋白质包括、由或基本由多肽HydEF、HydG、HydA、铁氧还蛋白和FNR组成,
其中,所述HydEF、HydG、铁氧还蛋白和FNR来自莱茵衣藻,或为与莱茵衣藻的铁氧还蛋白和FNR功能等同的同系物或衍生物,和
其中a)所述细胞包含基因修饰,所述基因修饰降低或抑制选自下组的一种或多种内源性蛋白的活性或水平:磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、6-磷酸葡糖酸脱水酶和2-酮-3-脱氧-6-磷酸葡糖酸醛缩酶;和/或b)所述细胞包含增加戊糖磷酸途径的一种或多种蛋白质和NADPH调节蛋白质的水平或活性的基因修饰。
15.如权利要求14所述的细胞,其中所述HydA蛋白是HydA蛋白或其功能等同的同系物或衍生物,来自于选自以下组的微生物:莱茵衣藻、卡特氏团藻、蓝氏贾第虫、诺氏内阿米巴、嗜多变形泥杆菌、阴道毛滴虫、小核桃形巨球形菌、小韦荣球菌、非典型韦荣球菌、和双酶梭菌。
16.如前述任一项权利要求中所述的重组的微生物或细胞,其中所述微生物或细胞微生物包含一种基因修饰,所述基因修饰部分或完全删除了分别对应于编码磷酸果糖激酶、丙酮酸激酶、甘油酸变位酶、6-磷酸葡糖酸脱水酶和2-酮基-3-脱氧-6-磷酸葡糖酸醛缩酶的基因pfkA、pps、gpmA/gpmM、edd和eda中的一个或多个核酸序列。
17.如权利要求16所述的重组的微生物或细胞,其中所述基因修饰导致所述基因的部分功能丧失突变。
18.如权利要求16或17所述的重组的微生物或细胞,其中所述基因修饰降低或抑制磷酸果糖激酶和/或甘油酸变位酶的活性。
19.如权利要求5或14所述的重组的微生物或细胞,其中所述戊糖磷酸途径的一种或多种蛋白质和NADPH调节蛋白选自由以下组成的组:磷酸葡萄糖变位酶、葡萄糖-6-磷酸脱氢酶、6-磷酸葡萄糖酸内酯酶、甘油醛-3-磷酸脱氢酶6-磷酸葡萄糖酸脱氢酶、转酮酶、转醛酶、NAD激酶和可溶性吡啶核苷酸转氢酶。
20.如权利要求5所述的重组的微生物或细胞,其中编码所述一种或多种蛋白质的基因的启动子区域被gapA或osmYp启动子取代。
21.如权利要求20所述的重组的微生物或细胞,其中编码葡萄糖-6-磷酸脱氢酶的zwf基因的启动子被gapA或osmY启动子或厌氧诱导的nar或nirB启动子取代。
22.如权利要求20或21所述的重组的微生物或细胞,其中编码6-磷酸葡萄糖酸脱氢酶的gnd基因的启动子被gapA或osmY启动子取代。
23.如权利要求20-22中任一项所述的重组的微生物或细胞,其中编码磷酸葡萄糖变位酶的pgi基因的启动子被gapA或osmY启动子取代。
24.如权利要求20-23中任一项所述的重组的微生物或细胞,其中编码6-磷酸葡萄糖酸内酯酶的基因pgl的启动子被gapA或osmY启动子取代。
25.如权利要求19所述的重组的微生物或细胞,其中编码葡萄糖-6-磷酸脱氢酶的基因(zwf)被来自运动接合单胞菌(Zygomonas mobilis)的zwf基因取代。
26.如权利要求19所述的重组的微生物或细胞,其中,编码6-磷酸葡萄糖酸脱氢酶的基因(gnd)被来自谷氨酸棒杆菌(Corynebacterium glutamicum)的gnd基因取代。
27.如权利要求19的重组的微生物或细胞,其中编码甘油醛-3-磷酸脱氢酶的基因(gapA)被来自丙酮丁醇梭菌(Clostridium acetobutylicum)的gapC基因取代。
28.如权利要求1-27中任一项所述的重组的微生物或细胞,其中所述重组微生物包含编码一种或多种蛋白质的核酸构建体,以使所述微生物或细胞能够代谢蔗糖用于能量消耗;优选地,其中所述核酸构建体包含分别编码蔗糖水解酶、蔗糖渗透酶和蔗糖磷酸化酶的cscA、cscB和sp基因。
29.一种生产氢气的方法,其中,所述方法包括:
提供权利要求1-28中任一项的细胞,
在适当的培养基中和适当的条件下培养所述细胞以使所述细胞产生氢气。
30.如权利要求29所述的方法,其中所述细胞的培养在厌氧条件下进行。
31.如权利要求29或30所述的方法,其中所述培养包括使细胞与能够使所述氢化酶成熟的一种或多种因子接触。
32.如权利要求29-31中任一项所述的方法,其中所述培养包括用三价铁(铁III)或亚铁(铁II)补充培养基,优选以等于或大于约20μM的浓度。
33.如权利要求29-32中任一项所述的方法,其中所述培养在不高于约37℃,更优选在低于约35℃,低于约32℃,低于约30℃,低于约25℃,低于约20℃,优选不低于约10℃下进行。
34.一种用氢气产生电的装置,其包括权利要求1-28中任一项的微生物或细胞。
CN202180035594.8A 2020-03-31 2021-03-31 重组的微生物和方法 Pending CN115667518A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2020900990 2020-03-31
AU2020900990A AU2020900990A0 (en) 2020-03-31 Recombinant microorganisms and process
PCT/AU2021/050290 WO2021195705A1 (en) 2020-03-31 2021-03-31 Recombinant microorganisms and process

Publications (1)

Publication Number Publication Date
CN115667518A true CN115667518A (zh) 2023-01-31

Family

ID=77926819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180035594.8A Pending CN115667518A (zh) 2020-03-31 2021-03-31 重组的微生物和方法

Country Status (8)

Country Link
US (1) US20230304048A1 (zh)
EP (1) EP4127178A4 (zh)
JP (1) JP2023520238A (zh)
KR (1) KR20220160684A (zh)
CN (1) CN115667518A (zh)
AU (1) AU2021246542A1 (zh)
CA (1) CA3173184A1 (zh)
WO (1) WO2021195705A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114574418A (zh) * 2022-04-08 2022-06-03 成都理工大学 一种重组大肠杆菌及产氢应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024084049A2 (en) 2022-10-20 2024-04-25 Cysbio Aps Genetically modified host cells producing l-serine

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5120724B2 (ja) * 2006-04-19 2013-01-16 富士レビオ株式会社 オキシドレダクターゼおよびフェレドキシンの発現による遺伝子修飾された生物における水素ガスの改善された合成、および大腸菌iscオペロンの発現増強を伴う酸素の存在下での遺伝子修飾された生物における改善されたヒドロゲナーゼ活性および水素合成

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114574418A (zh) * 2022-04-08 2022-06-03 成都理工大学 一种重组大肠杆菌及产氢应用

Also Published As

Publication number Publication date
KR20220160684A (ko) 2022-12-06
CA3173184A1 (en) 2021-10-07
EP4127178A4 (en) 2024-05-29
EP4127178A1 (en) 2023-02-08
JP2023520238A (ja) 2023-05-16
AU2021246542A1 (en) 2022-10-20
WO2021195705A1 (en) 2021-10-07
US20230304048A1 (en) 2023-09-28

Similar Documents

Publication Publication Date Title
DK2561064T3 (en) Cell which is suitable for fermentation of a composition of mixed sugars
CN107690482B (zh) 用于2,4-二羟基丁酸的优化生产的经修饰的微生物
CN107429269B (zh) 通过在微生物中转化戊糖用于生产至少一种感兴趣的代谢物的方法
CN107771214B (zh) 用于具有增加的2,4-二羟基丁酸外排物的优化的2,4-二羟基丁酸产生的修饰的微生物
DK3027733T3 (en) Preparation of 3-Hydroxypropionic Acid in Recombinant Yeast Expressing an Insect Aspartate-1 Decarboxylase
CN110878261B (zh) 合成木糖醇的重组解脂耶氏酵母的构建方法及其菌株
US20020012979A1 (en) Vitamin c production in microorganisms and plants
KR20150127034A (ko) 대사 공학을 통한 에르고티오네인 생성
KR20120053088A (ko) 이소프레노이드의 생산 방법
CN115667518A (zh) 重组的微生物和方法
CN111936631A (zh) 用于生物产生乙二醇的微生物和方法
KR20220119026A (ko) 구아니디노아세트산의 발효 생산 방법
KR20220021465A (ko) 메탄올 활용
KR20130101030A (ko) 변형된 미생물을 사용한 개선된 글리콜산 발효 생산
KR20220139351A (ko) 엑토인의 개선된 생산을 위한 변형된 미생물 및 방법
KR20200134333A (ko) 발효에 의한 히스타민 생산을 위해 조작된 생합성 경로
CN109628476B (zh) 一种利用全细胞转化生产4-羟基异亮氨酸的方法
CN110607335A (zh) 一种烟酰胺腺嘌呤二核苷酸类化合物生物合成方法
KR20230112679A (ko) 아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균
KR20190052927A (ko) 포도당으로부터 1,3-프로판디올를 생산하는 신규한 크렙시엘라 뉴모니아 균주 및 이를 이용한 1,3 프로판디올의 생산방법
CN113122563A (zh) 构建r-3-氨基丁酸生产菌的方法
KR20220039887A (ko) 메탄 및 자일로스를 동시 대사하는 메탄자화균의 개발 및 이를 이용한 시노린 생산방법
FI129574B (en) Variants of bacterial strains and processes for the production of protein or biomass
CN115044525B (zh) 一种利用Sigma因子提高棒杆菌抗氧化性的方法
CN112941093B (zh) 一种制备异源四聚体α2β2型蓝藻PDHc E1方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination