KR20150013607A - 2,4-다이하이드록시부티르산의 제조 방법 - Google Patents

2,4-다이하이드록시부티르산의 제조 방법 Download PDF

Info

Publication number
KR20150013607A
KR20150013607A KR1020147033085A KR20147033085A KR20150013607A KR 20150013607 A KR20150013607 A KR 20150013607A KR 1020147033085 A KR1020147033085 A KR 1020147033085A KR 20147033085 A KR20147033085 A KR 20147033085A KR 20150013607 A KR20150013607 A KR 20150013607A
Authority
KR
South Korea
Prior art keywords
gly
ala
leu
thr
val
Prior art date
Application number
KR1020147033085A
Other languages
English (en)
Other versions
KR102024109B1 (ko
Inventor
토마스 발터
클레멘틴 드레세어
헬레네 코르디에
장-마리 프랑수아
Original Assignee
아디쎄오 프랑스 에스에이에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아디쎄오 프랑스 에스에이에스 filed Critical 아디쎄오 프랑스 에스에이에스
Publication of KR20150013607A publication Critical patent/KR20150013607A/ko
Application granted granted Critical
Publication of KR102024109B1 publication Critical patent/KR102024109B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/13Transferases (2.) transferring sulfur containing groups (2.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01002Alcohol dehydrogenase (NADP+) (1.1.1.2), i.e. aldehyde reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/010614-Hydroxybutyrate dehydrogenase (1.1.1.61)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/01075Malonyl CoA reductase (malonate semialdehyde-forming)(1.2.1.75)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/01076Succinate-semialdehyde dehydrogenase (acetylating) (1.2.1.76)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y208/00Transferases transferring sulfur-containing groups (2.8)
    • C12Y208/03CoA-transferases (2.8.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/03Oxo-acid-lyases (4.1.3)
    • C12Y401/03024Malyl-CoA lyase (4.1.3.24)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y602/00Ligases forming carbon-sulfur bonds (6.2)
    • C12Y602/01Acid-Thiol Ligases (6.2.1)
    • C12Y602/01009Malate--CoA ligase (6.2.1.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/52Propionic acid; Butyric acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/01Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
    • C12Y103/010282,3-Dihydro-2,3-dihydroxybenzoate dehydrogenase (1.3.1.28)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은, 말레이트, 숙시닐-CoA 및/또는 글리옥실레이트를 말릴-CoA로 변환하는 단계, 상기 말릴-CoA를 말레이트-4-세미알데하이드로 변환하는 단계, 및 상기 말레이트-4-세미알데하이드를 DHB 데하이드로게나제에 의해 2,4-DHB로 변환하는 단계로 구성된, 연속 단계를 포함하는, 2,4-다이하이드록시부티르산 (2,4-DHB)의 제조 방법에 관한 것이다.

Description

2,4-다이하이드록시부티르산의 제조 방법{A METHOD OF PRODUCTION OF 2,4-DIHYDROXYBUTYRIC ACID}
본 발명은, 말레이트 및/또는 글리옥실레이트 및/또는 숙시닐-CoA를 말릴-CoA로 변환시키고, 말릴-CoA를 말레이트-4-세미알데하이드로 변환시킨 다음, 상기 말레이트-4-세미알데하이드를 2,4-다이하이드록시부티르산 (2,4-DHB)으로 변환시키는 합성 경로의 구현에 의해, 말레이트 및/또는 글리옥실레이트 및/또는 숙시닐-CoA로부터 2,4-다이하이드록시부티르산을 제조하는 신규 방법에 관한 것이다.
본 출원에서 언급되는 카르복실산은 이의 염 (예를 들어, 2,4-다이하이드록시부티레이트) 또는 산 형태 (예를 들어, 2,4-다이하이드록시부티르산)로 동일하게 지칭된다.
2,4-다이하이드록시부티르산 (2,4-DHB 또는 DHB와 동일시됨)은 상당히 경제적으로 이로운 화합물이다. DHB는 pH를 적절히 조정함으로써, 수성 매질에서 α-하이드록시-γ-부티로락톤으로 쉽게 변환될 수 있다. α-하이드록시-γ-부티로락톤은 메티오닌의 대체물이며, 동물 영양에서 시장이 큰, 2-하이드록시-4-(메틸티오)-부티레이트 (HMTB)를 제조하기 위한 주요 전구체이다 (US 2009/318715). 현재, α-하이드록시-γ-부티로락톤은, γ-부티로락톤을 α 위치에서 할로겐화하고, 이어서 할로겐 원자를 알칼리 매질에서 하이드록실기로 치환시키는 것을 포함하는 다단계 공정에 의해, γ-부티로락톤으로부터 유도된다 (US 2009/318715).
유가 상승으로 인해, 재생가능한 자원으로부터 DHB를 제조할 필요성이 생기고 있다. 미생물은 바이오매스 유래의 원료, 예를 들어 당이나 유기산을 여러 가지 화학적 화합물로 변환시킬 수 있다 (Werpy & Petersen, 2004). 생화학적 및 게놈학적 정보의 증가로, 미생물이 천연적인 대사 중간산물을 고수율로 그리고 고 생산성으로 과다생성하도록, 미생물을 변형시킬 수 있다 (Bailey, 1991). 생성 미생물의 최적화에는, 때때로, 특히, 대상 대사물질의 생합성의 필수 효소의 과다발현, 및 생성물 피드백 저해의 경감을 보장하는, 대사성 네트워크의 합리적인 조작이 요구된다. 다른 가능성으로는, 대상 대사물질의 생성을 촉매하는 새로운 효소 시스템을 구현하는 것이다.
대사 공학적 방식과 효소적 촉매 방식은, 대상 대사물질을 생성하는 대사 경로의 조절과 생화학에 대해 상세한 지식을 필요로 한다. 2,4-DHB를 제조하는 경우, 이러한 정보는 이용가능하지 않다. 단지 소수의 연구에서, 숙신산 세미알데하이드 데하이드로게나제(dehydrogenase)가 결핍된 환자에서 2,4-DHB의 생성이 보고되어 있지만, DHB 생성과 관련한 효소 반응은 규명되어 있지 않다 (Shinka et al., 2002). 따라서, 발효에 의해 또는 효소에 의해 2,4-DHB를 제조하는 방법에는, (i) 이용가능한 전구체를 2,4-DHB로 변환하는, 열역학적으로 실현가능한 경로의 규명, (ii) 상기 경로에서 각각의 반응 단계를 촉매할 수 있는 효소의 동정 및 구축, (iii) 적절한 생산 유기체에서, 경로의 효소들의 기능적 발현이 요구된다.
Akita, O., Nishimori, C., Shimamoto, T., Fujii, T. & Iefuji, H. (2000). Transport of pyruvate in Saccharomyces cerevisiae and cloning of the gene encoded pyruvate permease. Biosci Biotechnol Biochem 64, 980-984. Alber, B., Olinger, M., Rieder, A., Kockelkorn, D., Jobst, B., Huegler, M. & Fuchs, G. (2006). Malonyl-coenzyme A reductase in the modified 3-hydroxypropionate cycle for autotrophic carbon fixation in archaeal Metallosphaera and Sulfolobus spp. J Bacteriol 188, 8551-8559. Arps, P. J., Fulton, G. F., Minnich, E. C. & Lidstrom, M. E. (1993). Genetics of serine pathway enzymes in Methylobacterium extorquens AM1: phosphoenolpyruvate carboxylase and malyl coenzyme A lyase. J Bacteriol 175, 3776-3783. Auriol, C., Bestel-Corre, G., Claude, J.-B., Soucaille, P. & Meynial-Salles, I. (2011). Stress-induced evolution of Escherichia coli points to original concepts in respiratory cofactor selectivity. Proc Natl Acad Sci U S A 108, 1278-1283. Baba, T., Ara, T., Hasegawa, M., Takai, Y., Okumura, Y., Baba, M., Datsenko, K. A., Tomita, M., Wanner, B. L. & Mori, H. (2006). Construction of Escherichia coli K-12 in-frame, single-gene knockout mutants: the Keio collection. Mol Syst Biol 2, 2006.0008. Bailey, J. E. (1991). Toward a science of metabolic engineering. Science 252, 1668-1675. Camarasa, C., Bidard, F., Bony, M., Barre, P. & Dequin, S. (2001). Characterization of Schizosaccharomyces pombe malate permease by expression in Saccharomyces cerevisiae. Appl Environ Microbiol 67, 4144-4151. Cherepanov, P. P. & Wackernagel, W. (1995). Gene disruption in Escherichia coli: TcR and KmR cassettes with the option of Flp-catalyzed excision of the antibiotic-resistance determinant. Gene 158, 9-14. Chistoserdova, L., Kalyuzhnaya, M. G. & Lidstrom, M. E. (2009). The expanding world of methylotrophic metabolism. Annu Rev Microbiol 63, 477-499. Datsenko, K. A. & Wanner, B. L. (2000). One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc Natl Acad Sci U S A 97, 6640-6645. Ford, G. & Ellis, E. M. (2002). Characterization of Ypr1p from Saccharomyces cerevisiae as a 2-methylbutyraldehyde reductase. Yeast Chichester Engl 19, 1087-1096. Friedmann, S., Steindorf, A., Alber, B. E. & Fuchs, G. (2006). Properties of succinyl-coenzyme A:L-malate coenzyme A transferase and its role in the autotrophic 3-hydroxypropionate cycle of Chloroflexus aurantiacus. J Bacteriol 188, 2646-2655. Grobler, J., Bauer, F., Subden, R. E. & Van Vuuren, H. J. (1995). The mae1 gene of Schizosaccharomyces pombe encodes a permease for malate and other C4 dicarboxylic acids. Yeast Chichester Engl 11, 1485-1491. Groeneveld, M., Weme, R. G. J. D. O., Duurkens, R. H. & Slotboom, D. J. (2010). Biochemical characterization of the C4-dicarboxylate transporter DctA from Bacillus subtilis. J Bacteriol 192, 2900-2907. Jantama, K., Zhang, X., Moore, J. C., Shanmugam, K. T., Svoronos, S. A. & Ingram, L. O. (2008a). Eliminating side products and increasing succinate yields in engineered strains of Escherichia coli C. Biotechnol Bioeng 101, 881-893. Jantama, K., Haupt, M. J., Svoronos, S. A., Zhang, X., Moore, J. C., Shanmugam, K. T. & Ingram, L. O. (2008b). Combining metabolic engineering and metabolic evolution to develop nonrecombinant strains of Escherichia coli C that produce succinate and malate. Biotechnol Bioeng 99, 1140-1153. Kawasaki, T., Koita, H., Nakatsubo, T., Hasegawa, K., Wakabayashi, K., Takahashi, H., Umemura, K., Umezawa, T. & Shimamoto, K. (2006). Cinnamoyl-CoA reductase, a key enzyme in lignin biosynthesis, is an effector of small GTPase Rac in defense signaling in rice. Proc Natl Acad Sci U S A 103, 230-235. Kockelkorn, D. & Fuchs, G. (2009). Malonic semialdehyde reductase, succinic semialdehyde reductase, and succinyl-coenzyme A reductase from Metallosphaera sedula: enzymes of the autotrophic 3-hydroxypropionate/4-hydroxybutyrate cycle in Sulfolobales. J Bacteriol 191, 6352-6362. Larkin, M. A., Blackshields, G., Brown, N. P., Chenna, R., McGettigan, P. A., McWilliam, H., Valentin, F., Wallace, I. M., Wilm, A. & other authors. (2007). Clustal W and Clustal X version 2.0. Bioinforma Oxf Engl 23, 2947-2948. Lin, H., Bennett, G. N. & San, K.-Y. (2005). Metabolic engineering of aerobic succinate production systems in Escherichia coli to improve process productivity and achieve the maximum theoretical succinate yield. Metab Eng 7, 116-127. Meister, M., Saum, S., Alber, B. E. & Fuchs, G. (2005). L-malyl-coenzyme A/beta-methylmalyl-coenzyme A lyase is involved in acetate assimilation of the isocitrate lyase-negative bacterium Rhodobacter capsulatus. J Bacteriol 187, 1415-1425. Millard, C. S., Chao, Y. P., Liao, J. C. & Donnelly, M. I. (1996). Enhanced production of succinic acid by overexpression of phosphoenolpyruvate carboxylase in Escherichia coli. Appl Environ Microbiol 62, 1808-1810. Miller, J. H. (1992). A Short Course in Bacterial Genetics: A Laboratory Manual andHandbook for Escherichica coli and Related Bacteria. Plainview (NY): Cold Spring Harbor Laboratory Press. Rognstad, R. & Katz, J. (1979). Effects of 2,4-dihydroxybutyrate on lipogenesis in rat hepatocytes. J Biol Chem 254, 11969-11972. Sambrook, J., Fritsch, E. F. & Maniatis, T. (1989). Molecular Cloning: A Laboratory Manual, 2nd edn. Cold Spring Harbor: Cold Spring Harbor Laboratory Press. Sanchez, A. M., Bennett, G. N. & San, K.-Y. (2005). Novel pathway engineering design of the anaerobic central metabolic pathway in Escherichia coli to increase succinate yield and productivity. Metab Eng 7, 229-239. Sauer, U. & Eikmanns, B. J. (2005). The PEP-pyruvate-oxaloacetate node as the switch point for carbon flux distribution in bacteria. Fems Microbiol Rev 29, 765-794. Seedorf, H., Fricke, W. F., Veith, B., Brueggemann, H., Liesegang, H., Strittmatter, A., Miethke, M., Buckel, W., Hinderberger, J. & other authors. (2008). The genome of Clostridium kluyveri, a strict anaerobe with unique metabolic features. Proc Natl Acad Sci U S A 105, 2128-2133. Shinka, T., Inoue, Y., Ohse, M., Ito, A., Ohfu, M., Hirose, S. & Kuhara, T. (2002). Rapid and sensitive detection of urinary 4-hydroxybutyric acid and its related compounds by gas chromatography-mass spectrometry in a patient with succinic semialdehyde dehydrogenase deficiency. J Chromatogr B Anal Technol Biomed Life Sci 776, 57-63. Smejkalovae, H., Erb, T. J. & Fuchs, G. (2010). Methanol assimilation in Methylobacterium extorquens AM1: demonstration of all enzymes and their regulation. Plos One 5. Soehling, B. & Gottschalk, G. (1993). Purification and characterization of a coenzyme-A-dependent succinate-semialdehyde dehydrogenase from Clostridium kluyveri. Eur J Biochem Febs 212, 121-127. Vuilleumier, S., Chistoserdova, L., Lee, M.-C., Bringel, F., Lajus, A., Zhou, Y., Gourion, B., Barbe, V., Chang, J. & other authors. (2009). Methylobacterium genome sequences: a reference blueprint to investigate microbial metabolism of C1 compounds from natural and industrial sources. Plos One 4, e5584. Wang, Q., Ou, M. S., Kim, Y., Ingram, L. O. & Shanmugam, K. T. (2010). Metabolic flux control at the pyruvate node in an anaerobic Escherichia coli strain with an active pyruvate dehydrogenase. Appl Environ Microbiol 76, 2107-2114. Werpy, T. & Petersen, G. (2004). Top value added chemicals from biomass. Results of screening for potential candidates from sugars and synthesis gas. Washington DC. Zarzycki, J., Brecht, V., Mueller, M. & Fuchs, G. (2009). Identifying the missing steps of the autotrophic 3-hydroxypropionate CO2 fixation cycle in Chloroflexus aurantiacus. Proc Natl Acad Sci U S A 106, 21317-21322. Zelle, R. M., de Hulster, E., van Winden, W. A., de Waard, P., Dijkema, C., Winkler, A. A., Geertman, J.-M. A., van Dijken, J. P., Pronk, J. T. & van Maris, A. J. A. (2008). Malic acid production by Saccharomyces cerevisiae: engineering of pyruvate carboxylation, oxaloacetate reduction, and malate export. Appl Environ Microbiol 74, 2766-2777. Zelle, R. M., de Hulster, E., Kloezen, W., Pronk, J. T. & van Maris, A. J. A. (2010). Key process conditions for production of C(4) dicarboxylic acids in bioreactor batch cultures of an engineered Saccharomyces cerevisiae strain. Appl Environ Microbiol 76, 744-750. Zhang, X., Jantama, K., Shanmugam, K. T. & Ingram, L. O. (2009). Reengineering Escherichia coli for Succinate Production in Mineral Salts Medium. Appl Environ Microbiol 75, 7807-7813. Zhang, X., Wang, X., Shanmugam, K. T. & Ingram, L. O. (2011). L-malate production by metabolically engineered Escherichia coli. Appl Environ Microbiol 77, 427-434.
본 발명은 이러한 필요성을 충족시키는 것을 목적으로 한다.
따라서, 본 발명의 일 목적은, 말레이트 및/또는 글리옥실레이트 및/또는 숙시닐-CoA를 말릴-CoA로 변환하는 제1 단계, 말릴-CoA를 말레이트-4-세미알데하이드로 변환하는 제2 단계, 및 말레이트-4-세미알데하이드를 2,4-DHB로 변환하는 제3 단계를 포함하는, 2,4-DHB의 제조 방법이다.
따라서, 본 발명의 일 목적은, 말레이트를, 말릴-CoA 신테타제(synthetase) 활성을 가진 효소의 작용에 의해 말릴-CoA로 변환하거나 [1.1], 및/또는 숙시닐-CoA를, 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 활성을 가진 효소의 작용에 의해 말릴-CoA로 변환하거나 [1.2], 및/또는 글리옥실레이트를, 말릴-CoA 리아제(리아제) 활성을 가진 효소의 작용에 의해 말릴-CoA로 변환하는 [1.3], 제1 반응을 포함하는, 2,4-DHB를 제조하는 방법이다 (도 1 참조). 제2 반응 [2]에서, 말릴-CoA는 말릴-CoA 리덕타제(reductase) 활성을 가진 효소의 작용에 의해 말레이트-4-세미알데하이드로 변환된다. 제3 반응 [3]에서, 말레이트-4-세미알데하이드는 DHB 데하이드로게나제 활성을 가진 효소의 작용에 의해 DHB로 변환된다. 더욱 정확하게는, 반응 [3]은 경로의 생합성 측면에서, 말레이트-4-세미알데하이드 리덕타제 활성을 가진 효소에 의해 촉매된다.
본 발명의 다른 측면에서, 2,4-DHB를 제조하는 방법에서 제1 단계는, 각각 말레이트, 숙시닐-CoA, 또는 글리옥실레이트를 말릴-CoA로 변환하는 말레이트-조효소 A 리가제 (ADP 형성), EC 6.2.1.9), 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 (EC 2.8.3.-), 또는 말릴-CoA 리아제 (EC 4.1.3.24) 활성을 가진 효소를 수반한다.
상기 효소는, 포름알데하이드를 고정하는데 세린 사이클을 이용하는 메틸영양성(methylotrophic) 박테리아 (Chistoserdova et al ., 2009; Smejkalova et al ., 2010; Vuilleumier et al ., 2009), 글리옥실레이트 사이클 및 이소시트레이트 리아제 활성과 독립적인 아세테이트 동화 경로에 의존하는 박테리아 (Meister et al., 2005), 및 자가영양 성장을 위해 3-하이드록시프로피오네이트 CO2-고정 사이클을 이용하는 박테리아 (Zarzycki et al ., 2009)에서, 규명된 바 있다.
기능성 변이체 또는 기능성 단편과 같이 상기 효소들과 상동성(homology)을 공유하는 단백질 또한, 본 발명의 또 다른 측면이기도 하다.
말릴-CoA 신테타제는 2가지 서브유닛인 MtkA 및 MtkB로 구성된다. 따라서, 본 발명에 따르면, 말릴-CoA 신테타제 활성을 포함하는 단백질은, M. 페트롤레이필룸(M. petroleiphilum)의 말릴-CoA 신테타제 서브유닛 MtkA 및 MtkB (YP 001022444 및 YP 001022445), 메틸로박터 엑스토?스(Methylobacter extorquens) (YP002962851 및 YP 002962852) 또는 M. 캡술라투스(M. capsulatus)의 2가지 서브유닛 SucC 및 SucD (YP 114179 및 YP 114180)의 단백질 서열과 30% 이상, 바람직하게는 50% 이상, 보다 바람직하게는 70%의 동일성(identity)을 가진 모든 폴리펩타이드를 지칭한다.
말릴-CoA 리아제는 호모헥사머로서, 아세테이트 동화를 위해 글리옥실레이트 사이클을 이용하지 않는 박테리아에서 확인된다 (Meister et al ., 2005). 따라서, 본 발명에 따르면, 말릴-CoA 리아제 활성을 포함하는 단백질은, 메틸로박터 엑스토?스, 로도박터 캡술라투스(Rhodobacter capsulatus), 또는 스트렙토마이세스 코엘리콜로(Streptomyces coelicolor)의 말릴-CoA 리아제, Mcl의 단백질 서열과 30% 이상, 바람직하게는 50% 이상, 보다 바람직하게는 70%의 동일성을 가진 모든 폴리펩타이드를 지칭한다.
본 발명의 추가적인 측면에서, 본 발명의 말릴-CoA 리아제는 서열 번호 1 또는 이의 변이체로 표시된다.
숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제는 2가지 서브유닛, SmtA 및 SmtB로 구성된다 (Zarzycki et al ., 2009)(Friedmann et al ., 2006). 따라서, 본 발명에 따르면, 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 활성을 가진 단백질은 클로로플렉수스 아우란티아쿠스(Chloroflexus aurantiacus)의 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 서브유닛 SmtA 및 SmtB의 단백질 서열 (서열 번호 191 및 서열 번호 193로 표시되거나 또는 서열 번호 192 및 서열 번호 194로 코딩됨)과 30% 이상, 바람직하게는 50% 이상, 보다 바람직하게는 70%의 동일성을 가진 모든 폴리펩타이드를 지칭한다.
보다 일반적으로, 본 발명의 의미에서, 2가지 단백질 서열들 간의 동일성은 당해 기술분야의 당업자에게 잘 공지된 방법에 의해 결정될 수 있다. 이러한 방법의 예는 CLUSTALW (Larkin et al ., 2007) 소프트웨어 (웹사이트에 표시된 디폴트 파라미터와 함께 http://www.ebi.ac.uk/Tools/msa/clustalw2/) 또는 BLAST 정렬 프로그램 (웹사이트에 표시된 디폴트 파라미터와 함께 http://blast.ncbi.nlm.nih.gov/Blast.cgi)의 사용이다.
기능성 변이체라는 용어는, 본 출원에 구체적으로 기술된 서열과 비교 시 실질적인 서열 변형을 제시할 수 있지만 본래의 효소 활성은 여전히 가지고 있는 효소를 포함한다.
기능성 단편이라는 용어는 본 발명에 따르면, 효소의 서열이 본래의 아미노산보다 적은 수의 아미노산을 포함할 수 있지만 본래의 효소 활성은 여전히 가지고 있는 것을 의미한다.
상기 효소의 개선은 1가지 이상의 돌연변이에 의해 수득될 수 있으며, 상기 돌연변이(들)는 말레이트, 숙시닐-CoA, 또는 글리옥실레이트 각각에 대한, 돌연변이 효소의 활성 및/또는 기질 친화성을 개선한다.
본 발명에서, "활성 및/또는 기질 친화성을 개선한다"라는 표현은, 돌연변이 전의 효소가:
- 기질을 사용할 수 없었거나, 및/또는
- 반응 산물을 적어도 3배 더 낮은 최대 비속도 (specific rate)로 합성하였거나, 및/또는
- 말레이트, 숙시닐-CoA, 또는 글리옥실레이트, 말릴-Co-A 또는 말레이트-4-세미알데하이드에 대한 친화성이 적어도 2배, 보다 바람직하게는 3배 더 낮았음을 의미한다.
말릴-CoA 신테타제 및 말릴-CoA 리아제 활성은 각각 (Smejkalova et al ., 2010) 또는 (Meister et al ., 2005)에 의해 기술된 효소 시험에 의해 측정될 수 있다. 숙시닐-CoA:(L)-말레이트 CoA 트랜스퍼라제 활성은 (Friedmann et al ., 2006)에 의해 기술된 바와 같이 측정될 수 있다.
보다 추가적인 측면에서, 본 발명에 따라 2,4-DHB를 제조하는 방법의 제2 단계는 말릴-CoA 리덕타제 활성을 가진 효소를 수반하며, 상기 효소는 말릴-CoA를 말레이트-4-세미알데하이드로 변환하는 것을 특징으로 한다.
상기 효소는 말로닐-CoA 리덕타제, 숙시닐-CoA 리덕타제 또는 보고된 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA) 리덕타제, 신나모일-CoA 리덕타제, 또는 아세트알데하이드 데하이드로게나제 활성을 가진 효소들 중에서 규명될 수 있거나, 또는 이들은 상기 효소들의 변형에 의해 수득될 수 있다.
말로닐-CoA 리덕타제 (EC 1.2.1.75) 및 숙시닐-CoA 리덕타제 (EC 1.2.1.76)는 이산화탄소 고정을 위해 변형된 3-하이드록시프로피오네이트 사이클을 가진 박테리아 (Alber et al ., 2006; Kockelkorn & Fuchs, 2009), 및 혐기성 숙시네이트 분해 경로를 이용하는 박테리아 (Seedorf et al ., 2008; Soehling & Gottschalk, 1993)에서 확인되었다. HMG-CoA 리덕타제 (EC 1.1.1.38, EC 1.1.1.88)는 진핵생물 및 일부 박테리아에서 이소프레노이드의 생합성 경로의 일부이다. 신나모일-CoA 리덕타제 (EC 1.2.1.44)는 리그닌 생합성에 관여하는 효소이다 (Kawasaki et al ., 2006). 아세트알데하이드 데하이드로게나제 (EC 1.2.1.10)는 매우 다양한 박테리아에서 확인되며, 에탄올 생성 경로 또는 아세트알데하이드 해독으로의 투입을 촉매한다.
본 발명의 추가적인 측면에서, 말릴-CoA 리덕타제는 서열 번호 7 또는 서열 번호 10, 또는 이의 기능성 변이체 또는 이의 기능성 단편으로 표시된다.
따라서, 본 발명에 따르면, 말로닐-CoA 리덕타제 활성을 가진 단백질은 술폴로부스 토코다이이(Sulfolobus tokodaii) 말로닐-CoA 리덕타제, Mcr의 단백질 서열 (서열 번호 7)과 30% 이상의 동일성을 가진 모든 폴리펩타이드를 지칭한다. 바람직하게는 이들은 50% 이상, 보다 바람직하게는 70%의 동일성을 가진다.
클로로플렉세우스 아우란티아쿠스(Chloroflexus auranthiacus)의 말로닐-CoA 리덕타제 (서열 번호 190으로 코딩되는 서열 번호 189)는 본 발명의 또 다른 측면을 구성한다. 클로로플렉세우스 아우란티아쿠스의 단백질 서열과 30% 이상의 동일성을 가진 폴리펩타이드 또한 본 발명의 일부이다. 바람직하게는 이들은 50% 이상, 보다 바람직하게는 70%의 동일성을 가진다.
따라서, 본 발명에 따르면, 숙시닐-CoA 리덕타제 활성을 가진 단백질은 포르피로모나스 깅기발리스(Porphyromonas gingivalis) 숙시닐-CoA 리덕타제, SucD (서열 번호 10), 또는 이관능성 술폴로부스 토코다이이(S. tokodaii) 말로닐-CoA 및 숙시닐-CoA 리덕타제, Mcr (서열 번호 7)의 단백질 서열과 30% 이상의 동일성을 가진 모든 폴리펩타이드를 지칭한다. 바람직하게는 이들은 50% 이상, 보다 바람직하게는 70%의 동일성을 가진다.
말릴-CoA 리덕타제 활성은 실시예 2에 기술된 효소 시험에 의해 측정될 수 있다 ("효소 분석법" 참조).
상기 효소 활성은 효소의 1가지 이상의 돌연변이에 의해 개선될 수 있으며, 상기 돌연변이(들)는 말릴-CoA에 대한 돌연변이 효소의 활성 및/또는 기질 친화성을 개선하거나 또는 천연 기질에 대한 이의 활성을 감소시키는 것을 포함한다.
본 발명은 또한, 개선된 활성을 가진 변형된 말릴-CoA 리덕타제를 포함한다.
본 발명에 따른 말릴-CoA 리덕타제는 특정한 측면에서, 야생형 효소와 비교 시 P111, L152, T154, L202, G203, D204, Y206, D207, K209, T210, T238,T239, D295, R318의 위치 중 하나 이상에, 하나 이상의 돌연변이를 포함하는 술폴로부스 토코다이이 말로닐-CoA 리덕타제에 상응하며, 상기 위치에서 천연 아미노산은, 다른 19개의 천연 단백질성 (proteinogenic) 아미노산인 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민산, 글루타민, 글리신, 히스티딘, 이소루신, 루신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린 중 하나로 치환된다.
다른 측면에서, 본 발명에 따라 2,4-DHB를 제조하는 방법에서 제3 단계는, 말레이트-4-세미알데하이드를 2,4-DHB로 변환하는 것을 특징으로 하는, DHB 데하이드로게나제를 포함하며, 상기 효소는 경로의 생합성 측면에서, 말레이트-4-세미알데하이드 리덕타제 활성을 가진다.
이미 잠재적으로는 DHB 데하이드로게나제 활성을 가진, 후보 (candidate) DHB 데하이드로게나제는, C3, C4, 또는 C5 화합물에 작용하는 베타-하이드록시산 데하이드로게나제 클래스에서 선택될 수 있다.
본 발명의 더욱 다른 측면에 따르면, 상기 DHB 데하이드로게나제 효소는 타르트로네이트(tartronate) 세미알데하이드 리덕타제, 숙시네이트 세미알데하이드 리덕타제, 4-하이드록시부티레이트 데하이드로게나제, 말로네이트 세미알데하이드 리덕타제, 메틸부티르알데하이드 리덕타제, 아연형 알코올 데하이드로게나제, L-트레오닌-3-데하이드로게나제, 신나밀 알코올 데하이드로게나제, 알코올 데하이드로게나제, 또는 호모세린 데하이드로게나제와 같은 β-하이드록시산 데하이드로게나제와 구조적으로 및 메카니즘적으로 관련되어 있을 수 있다.
본 발명은 또한, 2,4-DHB에서 말레이트-4-세미알데하이드를 변환하기 위한, 메틸부티르알데하이드 리덕타제 또는 숙신산 세미알데하이드 리덕타제 (4-하이드록시부티레이트 데하이드로게나제로서도 지칭됨), 또는 알코올 데하이드로게나제의 용도에 관한 것이다.
본 발명의 또 다른 구체적인 측면에서, DHB 데하이드로게나제는 사카로마이세스 세레비지애(S. cerevisiae)의 메틸부티르알데하이드 리덕타제 (Ypr1), 메탈로스패라 세둘라(M. sedula)의 숙신산 세미알데하이드 리덕타제, 포르피로모나스 깅기발리스(P. gingivalis)의 4-하이드록시부티레이트 데하이드로게나제 (4hbd), 또는 에스케리키아 콜라이(Escherichia coli )의 알코올 데하이드로게나제 (YqhD)에 상응한다.
구체적인 실시 양태에서, 상기 메틸부티르알데하이드 리덕타제는 서열 번호 14로 표시되고, 상기 숙신산 세미알데하이드 리덕타제는 서열 번호 16으로 표시되며, 상기 4-하이드록시부티레이트 데하이드로게나제는 서열 번호 187로 표시되고, 상기 알코올 데하이드로게나제는 서열 번호 185로 표시된다. DHB 데하이드로게나제 활성은 실시예 3에서 기술된 효소 테스트에 의해 측정될 수 있다 ("효소 분석" 참고).
말레이트-4-세미알데하이드에 대한, DHB 데하이드로게나제의 친화성은, 효소에 생긴 하나 이상의 돌연변이에 의해 증가할 수 있으며, 상기 돌연변이(들)는 말레이트-4-세미알데하이드에 대한, 돌연변이 효소의 활성 및/또는 기질 친화성을 증가시키며, 및/또는 이의 천연 기질에 대한, 활성이나 친화성을 적어도 2배 감소시킨다.
구체적인 측면에서, 본 발명에 따른 DHB 데하이드로게나제는, 야생형 효소와 비교해, S40, N43, H39, T49, F85, Q108, L281 및 N305의 위치 중 하나 이상에, 하나 이상의 돌연변이를 포함하는 메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제 (서열 번호 16)이며, 상기 위치(들)의 천연 아미노산이, 다른 19개의 천연 단백질 아미노산인 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민산, 글루타민, 글리신, 히스티딘, 이소루신, 루신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린 중 하나로 치환된다.
비-제한적인 실시예에서 입증된 바와 같이, (L)-말레이트-4-세미알데하이드에 대한, 메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제의 친화성은, 부위 특이적인 돌연변이유발에 의해 이중 돌연변이 H39R N43H (서열 번호 36으로 표시됨)를 도입함으로써 증가되었다. 단순 돌연변이체인 H39R (서열 번호 32) 및 N43H (서열 번호 34) 또한, 본 발명에 포함된다 (실시예 5).
DHB 데하이드로게나제는, 본 발명의 또 다른 측면을 구성하며, 말레이트-4-세미알데하이드를 2,4-DHB로 변환하는 데 사용될 수 있다.
유전자의 핵산 서열은 숙주 유기체의 코돈 사용에 맞게 조정하여, 이종적으로 발현되는 단백질의 생산을 증가시킬 수 있다. 이는, 본 발명의 다른 측면을 구성한다.
메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제 H39R N43H를 코딩하며, 이의 뉴클레오티드 서열이 에스케리키아 콜라이에서 상기 효소의 발현을 위해 최적화된, 서열 번호 38로 표시되는 합성 유전자의 합성은 본 발명의 다른 측면이다.
더욱 다른 측면에서, 본 발명은 또한, 핵산, 보다 구체적으로는 말릴-CoA 신테타제를 코딩하는 분리된 핵산 서열에 관한 것이다.
보다 추가적인 측면에서, 본 발명은 말릴-CoA 리아제를 코딩하며 보다 구체적으로는 서열 번호 2로 표시되는 분리된 핵산 서열에 관한 것이다.
보다 추가적인 측면에서, 본 발명은 말릴-CoA 리덕타제를 코딩하며 보다 구체적으로는 서열 번호 8, 서열 번호 11, 또는 서열 번호 190으로 표시되는 분리된 핵산 서열에 관한 것이다.
더욱 다른 측면에서, 본 발명은 또한, 전술한 DHB 데하이드로게나제를 코딩하는 분리된 핵산 서열에 관한 것이다.
다른 측면에서, 상기 핵산은 서열 번호 15 또는 서열 번호 17, 서열 번호 37, 서열 번호 186 또는 서열 번호 188로 표시된다.
본 발명에 따르면, "핵산 서열"은 단일 또는 이중 가닥 형태의 DNA 또는 RNA 분자, 바람직하게는 DNA 분자를 지칭한다. 본원에서 사용되는 바와 같이, "분리된 DNA"는, 천연적이지 않거나, 또는 더 이상 원래 존재하였던 천연 환경에 존재하지 않는 DNA를 지칭하며, 예를 들어, 키메라 유전자 형태로 또 다른 조절 요소와 조합된 DNA 코딩 서열, 다른 숙주 세포로 이동된 DNA, 또는 임의의 자연 발생 DNA 서열과 비교해 상이한 뉴클레오티드 서열을 가진 인공적이며, 합성으로 제조된 DNA 서열을 지칭한다.
본 발명은 또한, 숙주 유기체에서 기능하는 하나 이상의 프로모터, 본 발명에 따라 정의된 말릴-CoA 신테타제 또는 말릴-CoA 리아제, 말릴-CoA 리덕타제, 말로닐-CoA 리덕타제, 숙시닐-CoA 리덕타제, 또는 DHB 데하이드로게나제 활성 중 임의를 코딩하는 폴리뉴클레오티드, 및 동일한 숙주 유기체에서 기능하는 종결자 요소를 서로 기능적으로 연결하여 포함하는, 키메라 유전자에 관한 것이다. 키메라 유전자에 포함될 수 있는 다양한 요소로는, 첫째로는, 프로모터, 신호 펩티드나 트랜지트 (transit) 펩티드를 코딩하는 서열, 또는 폴리아데닐화 신호를 구성하는 종결자 요소와 같이, 전사, 번역 및 단백질의 성숙을 조절하는 요소이며, 둘째로는, 단백질을 코딩하는 폴리뉴클레오티드이다. "서로 기능적으로 연결된"이라는 표현은, 키메라 유전자의 상기 요소들 중 어느 하나의 기능이 또 다른 요소의 기능에 의해 영향을 받도록, 이들 요소들이 서로 연결되어 있다는 것을 의미한다. 예로, 프로모터는, 코딩 서열의 발현에 영향을 미칠 수 있는 경우, 상기 코딩 서열에 기능적으로 연결되어 있다. 본 발명에 따른 키메라 유전자의 제작, 및 이의 다양한 요소들의 어셈블리는, 당해 분야의 당업자에게 잘 공지된 기술로 수행될 수 있다. 키메라 유전자를 이루는 조절 요소의 선택은, 이들이 기능해야 하는 숙주 유기체에 따라 필수적으로 다르며, 당해 분야의 당업자는 소정의 숙주 유기체에서 기능하는 조절 요소를 선택할 수 있다. "기능성"이라는 용어는, 소정의 숙주 유기체에서 기능할 수 있음을 의미하는 것이다.
본 발명에 따른 키메라 유전자에 포함될 수 있는 프로모터는 구성적 프로모터 (constitutive promoter) 또는 유도성 프로모터 (inducible promoter)이다. 예로, 박테리아의 발현에 사용되는 프로모터는 후술하는 프로모터에서 선택될 수 있다. 에스케리키아 콜라이의 발현에 대해, lac, trp, lpp, phoA, recA, araBAD, prou, cst-l, tetA, cadA, nar, tac, trc, lpp-lac, Psyn, cspA, PL, PL-9G-50, PR-PL, T7, [람다]PL-PT7, T3-lac, T5-lac, T4 유전자 32, nprM-lac, VHb 및 단백질 A 프로모터, 또는 심지어 Ptrp 프로모터 (WO 99/64607)를 언급할 수 있다. 코리네박테리아나 스트렙토마이세스와 같은 그람-양성 박테리아에서의 발현에 대해, PtipA 또는 PS1 및 PS2 (FR91/09870) 프로모터나, 특허 출원 제EP0629699A2 호에 기술된 것들을 언급할 수 있다. 효모와 균류에서의 발현에 대해, 클루이베로마이세스 락티스 PLAC4 프로모터 또는 클루이베로마이세스 락티스 Ppgk 프로모터 (특허 출원 제FR 91/05294 호), 트리코데르마 (Trichoderma) tef1 또는 cbh1 프로모터 (WO 94/04673), 페니실리움 his, csl 또는 apf 프로모터 (WO 00/68401), 및 아스페르길루스 gla 프로모터를 언급할 수 있다.
본 발명에 따르면, 키메라 유전자는, 프로모터와 코딩 서열 사이에 위치하는, 전사 활성자 (인핸서)와 같은 다른 조절 서열도 포함할 수 있다.
이처럼, 본 발명의 키메라 유전자는 구체적인 실시 양태에서, 숙주 유기체에서 기능하는 하나 이상의 프로모터 조절 서열, 본 발명의 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제, 말릴-CoA 리덕타제 및 DHB 데하이드로게나제를 코딩하는 핵산 서열, 및 상기 숙주 유기체에서 기능하는 종결자 조절 서열을, 전사 방향으로 기능적으로 연결하여, 포함한다.
본 발명은 또한, 본 발명에 따른 키메라 유전자 또는 본 발명의 핵산 서열을 포함하는 클로닝 및/또는 발현 벡터에 관한 것이다. 본 발명에 따른 벡터는 숙주 유기체를 변환하고, 이 유기체에서 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제, 말릴-CoA 리덕타제 및/또는 DHB 데하이드로게나제 중 어느 하나를 발현하는데 사용된다. 이 벡터는 플라스미드, 코스미드, 박테리오파지 또는 바이러스일 수 있다. 바람직하게는, 본 발명에 따른 형질변환 벡터는 플라스미드이다. 일반적으로, 이 벡터의 주 특징은, 숙주 유기체 세포에서 스스로 유지하고, 특히 복제 기원이 존재해서 자가복제하며, 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제, 말릴-CoA 리덕타제 및/또는 DHB 데하이드로게나제 중 어느 하나를 세포 안에서 발현하는 능력이어야 한다. 숙주 유기체의 안정적인 형질변환을 위해서는, 벡터가 게놈에 삽입될 수도 있다. 이러한 벡터의 선택과, 본 발명에 따른 키메라 유전자를 상기 벡터에 삽입하는 기술은, 당해 분야의 당업자가 가지고 있는 일반적인 지식의 일부이다. 유리하게는, 본 발명에서 사용되는 벡터는, 본 발명에 따른 키메라 유전자 외에도, 선별 마커를 코딩하는 키메라 유전자도 포함한다. 상기 선별 마커는, 효과적으로 형질변환된 숙주 유기체, 즉, 벡터가 삽입된 유기체를 선별할 수 있게 한다. 본 발명의 특정 실시 양태에 따르면, 형질변환되는 숙주 유기체는 박테리아, 효모, 균류이다. 사용될 수 있는 선별 마커 중에서도, 예를 들어, 하이그로마이신 포스포트랜스퍼라아제 (hygromycin phosphotransferase) 유전자와 같은 항생제 내성 유전자를 포함하는 마커가 언급될 수 있다. 다른 마커로는, 영양요구를 보완하는 (complement) 유전자, 예컨대 pyrA, pyrB, pyrG, pyr4, arg4, argB 및 trpC 유전자, 몰리브도프테린 신타제(synthase) 유전자, 또는 아세타미다아제 (acetamidase) 유전자일 수 있다. GUS 효소와 같이 쉽게 동정될 수 있는 효소를 코딩하는 유전자나, 형질변환된 세포에서 안료를 코딩하는 유전자 또는 안료 생성을 조절하는 효소가 언급될 수도 있다. 이러한 선별 마커 유전자는 특히 특허 출원 제WO 91/02071 호, 제WO 95/06128 호, 제WO 96/38567 호, 및 제WO 97/04103 호에 기술되어 있다.
본 발명은 또한, 숙주 유기체의 게놈에 삽입되어 있거나, 염색체외 유전자 요소인 예를 들어, 플라스미드에 존재하는, 본 발명에 따른 키메라 유전자를 하나 이상 포함하는, 형질변환된 숙주 유기체에 관한 것이다. 본 발명의 더욱 구체적인 측면에서, 형질변환된 숙주 유기체는, 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제 활성을 가진 폴리펩타이드를 코딩하는 본 발명의 핵산, 또는 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 키메라 유전자, 또는 말릴-CoA 신테타제 및/또는 숙시닐-CoA:(L)-말레이트-CoA 트랜스퍼라제, 및/또는 말릴-CoA 리아제 활성을 코딩하는 핵산을 포함하는 발현 벡터, 및/또는 말릴-CoA 리덕타제 활성을 가진 폴리펩타이드를 코딩하는 핵산, 또는 말릴-CoA 리덕타제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 키메라 유전자, 또는 말릴-CoA 리덕타제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 발현 벡터, 및/또는 DHB 데하이드로게나제 활성을 가진 폴리펩타이드를 코딩하는 핵산, DHB 데하이드로게나제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 키메라 유전자, 또는 DHB 데하이드로게나제 활성을 가진 폴리펩타이드를 코딩하는 핵산을 포함하는 발현 벡터를 포함한다.
숙주 유기체에서 이종성으로 발현되는 효소의 활성은 종종 이들의 불량한 용해성 및 봉입체(inclusion body)의 형성에 의해 제한을 받는다. 따라서, 본 발명은 또한, 기능성 효소가 또 다른 단백질 또는 펩타이드와 물리적으로 융합되어 (융합 단백질로 지칭되기도 함), 숙주 유기체에서 발현 시 상기 효소의 활성을 증가시키는 점에서, 키메라 단백질에 관한 것이기도 하다. 이러한 융합 단백질은 당해 기술분야에 공지되어 있으며, 하기의 비-배제적인 예들 사이에서 보편적으로 선택된다: 말토스(maltose) 결합 단백질, Mbp, 티오레독신(thioredoxin), ThrX, 글루타티온-S-트랜스퍼라제, Gst, 전사 종결 인자, NusA.
"숙주 유기체"라는 용어는, 2,4-DHB를 제조하기 위해, 본 발명에 따른 키메라 유전자(들), 핵산(들) 또는 벡터(들)가 도입될 수 있는 임의의 저급 단세포 유기체를 의미하는 것이다. 바람직하게는, 숙주 유기체는 미생물, 특히 균류, 예를 들어, 페니실리움, 아스페르길루스, 더욱 특히 아스페르길루스 플라부스 (Aspergillus flavus), 크리소스포리움 (Chrysosporium) 또는 트리코데르마 속의 균류, 효모, 특히 사카로마이에타세애(Saccharomycetaceae), 피키아세애(Pichiaceae) 또는 스키조사카로마이세타세애(Schizosaccharomycetaceae), 가장 바람직하게는 사카로마이세스 세레비지애, 스키조사카로마이세스폼베(Schizosaccharomycespombe), 클루이베로마이세스락티스(Kluyveromyceslactis), 클루이베로마이세스 마륵시아누스(Kluyveromyces marxianus), 또는 피키아 야디니이(Pichia jadinii), 피키아 스티피티스(Pichia stipitis) 또는 피키아 파스토리스(Pichia pastoris), 박테리움, 바람직하게는 엔테로박터리아세애(Enterobacteriaceae), 클로스트리디아세애(Clostridiaceae), 바실라세애(Bacillaceae), 스트렙토마이세타세애, 스트렙토콕카세애(Streptococcaceae), 메틸로박터리아새(Methylobacteriacae), 및 코리네박테리아세애(Corynebacteriaceae), 가장 바람직하게는 에스케리키아 콜라이, 바실러스 서브틸리스(Bacillus subtilis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 메틸로박테리움 엑스토?스(Methylobacterium extorquens), 또는 락토콕커스 락티스(Lactococcus lactis)의 효모이다.
숙주 유기체는 포도당과 같은 당으로부터 말레이트 또는 숙시네이트를 천연적으로 과다생성하는 숙주 유기체, 또는 포도당과 같은 당으로부터 말레이트 또는 숙시네이트를 과다생성하도록 조작되었으며 말레이트, 피루베이트, 숙시네이트 및 푸마레이트와 같은 유기산의 유출(export)을 촉진하는 모든 잠재적인 막 수송체가 제거된 숙주 유기체일 수 있다. 숙주 유기체는, DHB를 과다생성하도록 조작되었으며 말레이트, 피루베이트, 숙시네이트 및 푸마레이트와 같은 유기산의 유출을 촉진하는 모든 잠재적인 막 수송체가 제거된 숙주 유기체일 수 있다. 말레이트 및 기타 유기산의 유출을 촉진하는 퍼미아제(permease)의 예는, 스키조사카로마이세스 폼베(Schizosaccharomyces pombe ) 유래의 Mae1 (Camarasa et al ., 2001)(Grobler et al., 1995), 바실러스 서브틸리스(Bacillus subtilis ) 유래의 DctA (Groeneveld et al ., 2010), coli 유래의 Dct 1-4, 사카로마이세스 세레비지애(S. cerevisiae) 유래의 Jen1 (Akita et al ., 2000)이다. 전문가들은, 서열 동일성을 토대로, 에스케리키아 콜라이(E. coli)에서 후보(candidate) 퍼미아제를 규명할 수 있을 것이다. 이들 구성은 세포 내부에서 말레이트 및 기타 유기산을 유지하여 DHB 생성에 이용될 수 있도록 작용할 것이다.
"형질변환된 숙주 유기체"라는 표현은, 숙주 유기체의 게놈으로, 또는 플라스미드와 같은 염색체외 유전자 요소에, 본 발명에 따른 키메라 유전자 하나 이상이 삽입되어, 결과적으로 세포 내부나 배양 배지에서 말릴-CoA 신테타제, 말릴-CoA 리아제, 말릴-CoA 리덕타제 및/또는 DHB 데하이드로게나제 중 어느 하나를 생산하는 숙주 유기체를 의미하는 것이다. 본 발명에 따른 숙주 유기체를 수득하기 위해, 당해 분야의 당업자는 여러 공지된 형질변환 방법 중 하나를 이용할 수 있다.
이들 방법 중 하나는, 형질변환될 숙주 유기체의 세포를 폴리에틸렌 글리콜 (PEG)과, 그리고 본 발명에 따른 벡터와 접촉시키는 것으로 이루어진다. 형질변환될 세포와 본 발명의 벡터를 전기장에 두는 것으로 이루어진, 전기천공이 또 다른 방법이다. 다른 방법은, 미세주입에 의해 벡터를 세포나 조직에 직접 삽입하는 것으로 이루어진다. "바이오리스틱 (biolistic)" 방법이 사용될 수 있다. 이 방법은, 본 발명의 벡터가 그 위에 흡착된 입자들을 사용해, 세포나 조직을 공격함으로써 이루어진다 (미국 특허 제4,945,050 호).
박테리아를 형질변환하는 여러 방법은, 에스케리키아 콜라이와 다른 그람-음성 박테리아에 대한 문헌에 기술되어 있다. 접합이 사용될 수도 있다. 그람-양성 박테리아에 대해서는 전기천공이 사용될 수 있으며, 특히 스트렙토마이세스 속의 박테리에 대해서는 원형질 형질변환이 또한 사용될 수 있다.
균류를 형질변환하는 여러 방법이 또한 문헌에 기술되어 있다. PEG를 이용한 원형질 형질변환이 제EP 0260762 호에서 아스페르길루스를 들어 기술되어 있으며, 이 방법을 페니실리움 푸니쿨로숨 종에 맞도록 조정한 것이 제WO 00/36120 호에 기술되어 있다. 제한효소를 매개로 한 삽입, 또는 REMI에 의한 형질변환도 공지되어 있으며, 이는 아그로박테리움 속 박테리아를 사용하는 원형질 형질변환이다. 효모를 형질변환하는 기술 역시 문헌에 설명되어 있다.
다른 측면에서, 본 발명은 본 발명의 형질변환된 미생물을 배양하는 단계를 포함하는, 2,4-DHB의 제조 방법에 관한 것이다.
DHB의 제조를 위해, 포도당, 과당, 자당, 당밀, 엿당, 블랙스트랩 당밀, 전분 가수분해물 (포도당, 올리고당), 젖당, 엿당, 전분 및 전분 가수분해물, 셀룰로오스, 셀룰로오스 가수분해물, 글리세롤, 아세테이트 및 소정의 탄화수소, 오일 및 지방 예컨대 대두유, 해바라기유, 땅콩유 및 코코넛유, 뿐만 아니라 지방산 예컨대 팔미트산, 스테아르산 및 리놀레산과 같은 다양한 탄수화물이, 각각 또는 혼합물로서 이용될 수 있다. 이들 성분들은 각각 또는 혼합물로서 사용될 수 있다.
기체성 또는 수성 암모니아와 같은 무기 화합물, 황산암모늄, 질산암모늄, 인산암모늄, 염화암모늄, 아세트산암모늄 및 탄산암모늄과 같은 무기 또는 유기산의 암모늄염을 비롯하여 다양한 질소원이, 상용화와 중간 시험 규모의 제조에, 각각 또는 혼합물로 이용될 수 있다. 대안적으로는, 대두-가수분해물, 콩 단백질 HCl-가수분해물 (총 질소량은 약 7%임), 콩가루, 콩깻묵 가수분해물, 옥수수 침지액, 카제인 가수분해물, 효모 추출물, 육류 추출물, 맥아 추출물, 요소, 펩톤 및 아미노산과 같은, 천연 질소 포함 유기 물질이 이용될 수도 있다.
제조 공정은 호기성, 혐기성 및 산소 제한 조건 하에 수행될 수 있다. 공정은 유가식 공정 또는 회분식 공정으로 수행될 수 있다.
증식이 잘 되게 하는 말레이트 (또는 피루베이트, 숙시네이트나 푸마레이트와 같은 다른 유기산)를 단독으로, 또는 다른 탄소원과 함께 첨가한 매질에서 숙주 유기체를 배양함으로써, 상기 2,4-DHB를 제조할 수 있다. 말레이트 (및 다른 유기산)는 직접 첨가될 수 있거나, 또는, 제1 공정 단계에서, 말레이트-과다생성 미생물에 의해 말레이트 (또는 다른 유기산)가 생성되고, 후속한 단계에서, 본 발명에 따른 숙주 유기체에 의해 2,4-DHB가 생성되는 2-단계 발효 공정을 설계하여, 첨가될 수 있다.
생성물 분리 및 정제는 총 공정 효율과 생성물 가격에 크게 영향을 미치는 매우 중요한 요소이다. 생성물 회수 방법은 보편적으로, 세포 분리, 뿐만 아니라 생성물 정제, 농축 및 건조 단계를 각각 포함한다.
세포 분리
발효 매질에서 세포를 분리하기 위해, 한외여과 및 원심분리가 사용될 수 있다. 발효 매질에서 세포를 분리하는 것은, 높은 매질 점성으로 인해 종종 복잡하다. 따라서, 본 발명자들은, 세포 분리를 최적화하기 위해, 무기산이나 알칼리염과 같은 첨가제를 첨가하거나, 배양 배지 (culture broth)를 열처리할 수 있다.
생성물 회수
바이오매스 제거 전이나 후에, 다양한 이온-교환 크로마토그래피 방법이 DHB 분리에 이용될 수 있다. 이 방법들은, 생성물을 이들의 등전점에 따라 분리하는 것을 용이하게 하는, 1차 양이온 교환 수지의 사용을 포함한다. 전형적으로, 상기 수지에는 용액이 채워져 있으며, 보유 생성물은 용리액에서 (예를 들어, 수산화암모늄의 첨가에 의한) pH 증가에 따라 개별적으로 용리된다. 다른 가능성으로는, 고정층 또는 모사 이동층 수지를 사용하는 이온-교환 크로마토그래피의 이용이다. 적합한 생성물 순도를 수득하기 위해서는, 여러 가지 크로마토그래피 단계가 조합되어야 한다. 이들 정제 방법은 고비용의 결정화 단계에 비해 더 경제적이며, 최종 산물의 형태와 관련해 부가적인 이점이라든지 유연성을 제공하기도 한다.
생성물 농축 및 건조
정제 공정은, 분무 과립 건조기, 분무 건조기, 드럼 건조기, 회전 건조기, 및 터널 건조기와 같은 임의의 적절한 건조 수단을 수반할 수 있는 건조 단계를 포함할 수도 있다. 농축된 DHB 용액은, 다목적 농축기나 박막 증발기를 사용하는 경우, 130℃에서 증기로, 감압 하에 발효조를 가열함으로써 수득될 수 있다.
효율적인 DHB 제조는, 숙주 유기체의 대사 네트워크에서 탄소 흐름의 재분배를 최적화하고, DHB 경로의 3 가지 효소에 NADPH와 ATP를 충분히 공급해줌으로써, 보장될 수 있다. 원하는 대사 경로로 탄소 흐름을 채널링하고, NAD(P)H 보조인자를 공급하는 것은 보편적으로, 경쟁적 천연 발효 경로를 생략하거나 감소시킴으로써 용이하게 된다. 비-제한적인 예로는,
- (피루베이트 탈카르복실화효소의 결손에 의해) 에탄올 형성을 방해함으로써, 사카로마이세스 세레비지애에서 말레이트 생성을 최적화하는 것 (Zelle et al., 2008)(Zelle et al., 2010),
- 락테이트 형성 (예를 들어, IdhA의 결손), 아세테이트 형성 (예를 들어, pta, ackA의 결손), 에탄올 형성 (예를 들어, adhE의 결손), 포르메이트 형성 (예를 들어, pflB, focA의 결손), 피루베이트 산화 (예를 들어, poxB의 결손), 말레이트 분해 (maeB 및 scfA의 결손), 숙시네이트 형성 (예를 들어, frdBC의 결손), 메틸글리옥살 형성 (mgsA의 결손)을 방해함으로써, 에스케리키아 콜라이에서 숙시네이트나 말레이트 생성을 최적화하는 것 (Jantama et al, 2008a)(Jantama et al., 2008b)(Lin et al., 2005)(Zhang et al., 2011)(Sanchez et al., 2005)
- 포스포글루코스 이소머라제, pgi를 제거하여, 펜토스 포스페이트 경로를 가로지르는 탄소 유동을 채널(channel)함으로써, 생합성 반응에 대한 NADPH의 이용가능성을 높이는 것 (Auriol et al ., 2011)이 있다.
유기산 제조를 위해 탄소 흐름과 ATP 공급을 증가시킬 수 있는 다른 방법은, 포스포에놀피루베이트 (PEP)/피루베이트/옥살로아세테이트 브랜치 노드 (branch node)를 조작하는 것이다 (Sauer & Eikmanns, 2005에서 리뷰됨). 포스포에놀피루베이트에서 옥살로아세테이트로의 탄소 흐름을 확실히 증가시키는 대사 공학 계획에 대한 비-제한적인 예로는,
- 피루베이트 키나아제의 작용을 방해하고, PEP 카르복시키나아제의 활성을 증가시킴으로써, 사카로마이세스 세레비지애에서 말레이트 생성을 최적화하는 것 (Zelle et al., 2010).
- 천연적으로 또는 이종적으로 발현되는 PEP 카르복실라아제, PEP 카르복시키나아제, 또는 피루베이트 카르복실라아제의 활성을 증가시킴으로써, 에스케리키아 콜라이에서 숙시네이트 생성을 최적화하는 것 (Millard et al., 1996)(Sanchez et al., 2005)(Zhang et al., 2011)이다.
포도당을 처음으로 인산화시키는 단계에 PEP-소모 포스포트랜스퍼라아제 시스템 (PTS)을 이용하는 에스케리키아 콜라이와 또 다른 박테리아에서, 유기산의 제조를 위해 탄소 흐름과 ATP 공급을 증가시키는 다른 방법은, PTS 시스템의 필수 성분들 (예를 들어, pts1 또는 ptsG)을 결손시키는 것이다 (Lin et al., 2005)(Zhang et al., 2009). PTS 시스템에 결손 돌연변이를 가진 돌연변이체에서 포도당 흡수를 더욱 확실히 하기 위해서는, 대체 포도당 흡수 시스템 (예를 들어 GalP)의 활성이 보장되어야 한다.
유기산을 제조하는 바람직한 반응경로로 향하는 탄소 흐름을 증가시킬 다른 방법은, 시트르산 및 글리옥실레이트 회로를 조작하는 것이다. 비-제한적인 예로는,
- 이소시트레이트 분해효소의 활성을 증가시킴으로써 (전사 억제자 iclR의 결손), 에스케리키아 콜라이에서 숙신산 생성을 최적화하는 것 (Lin et al., 2005)(Sanchez ef al., 2005a).
- 이소시트레이트 데하이드로게나제, 및/또는 숙시네이트 데하이드로게나제의 결손에 의해, 숙신산 생성을 최적화하는 것 (Lin et al., 2005)이다.
DHB-생성 경로로의 도입 반응의 기질인 말레이트, 글리옥실레이트 및 아세틸-CoA의 이용가능성을 높이는 또 다른 방법은 아스파테이트 트랜스아미나제 (aspC , tyrB), 푸마라제 (fumABC), 푸마레이트 리덕타제 (frdBC), 말레이트 신타제 (aceB) 및 글리옥실레이트 리덕타제 (ghrAB) 효소를 약화시키는 것이다.
또 다른 대사 설정에서, 크렙스 사이클(Krebs cycle) 및 글리옥실레이트 션트(shunt)를 통해 2,4-DHB 전구물질인 말레이트만 생성할 수 있다. 이러한 설정은 세포기질(cytosolic) 및 막 결합된 말레이트 데하이드로게나제인 mdhmqo를 각각 결손시킬 것을 요구한다. 상기 방법은 아스파테이트 및 이의 유도체로의 탄소 유동의 잠재적인 누출을 상당히 피한다.
2,4-DHB를 제조하는 바람직한 반응경로로 향하는 탄소 흐름을 증가시킬 다른 방법은, 생성 유기체에서 적절한 피루베이트 데하이드로게나제 및 시트레이트 신타제가 발현되는 것이다. 에스케리키아 콜라이의 천연 피루베이트 데하이드로게나제 및 시트레이트 신타제는, 혐기성 조건 하에 이들 효소의 활성을 감소시키는, 고농도의 세포내 NADH에 의해 저해된다. 에스케리키아 콜라이에서, NADH에 둔감한 피루베이트 데하이드로게나제 돌연변이체가 발현되면, 혐기성 조건 하에 아세틸-CoA가 과다생성되고, 발효 최종 산물 (아세테이트, 락테이트, 에탄올, 포르메이트, 및 피루베이트) 사이에 탄소 흐름 재분배가 변경된다 (Wang et al., 2010). NADH에 둔감한 바실러스 서브틸리스 시트레이트 신타제의 이종성 발현은, 조작된 에스케리키아 콜라이 균주에서 숙신산 생성을 증가시킨다 (Sanchez et al., 2005). 전술한 돌연변이와 더불어, 적절한 피루베이트 데하이드로게나제 및 시트레이트 신타제 (NADH 민감성 또는 둔감성)를 사용하면, 호기성 및 혐기성 조건 시, 글리옥실레이트 및 시트르산 회로 반응과 발효 경로 사이에 탄소 흐름 재분배를 조정할 수 있다.
DHB 경로를 통한 탄소 흐름을 증가시킬 다른 방법은, 반응경로 중간체인 말릴-CoA 또는 4-말레이트 세미알데하이드를 분해할 수 있는 효소 반응을 생략하는 것이다. 말레이트 세미알데하이드를 분해할 수 있는 후보 효소는 숙신산 세미알데하이드 데하이드로게나제 (sad, gabD)와, 말단 알데하이드기로 짧은 탄소 사슬 및 중간 탄소 사슬을 산화시킬 수 있는 다른 데하이드로게나제들이다. 더욱이, 말릴-CoA는 시트레이트 신타제에 의해 분해될 수 있는 것으로 알려져 있다.
숙주 유기체의 2,4-DHB 생산성을 증가시킬 다른 방법은, DHB를 분해하는 대사 반응을 생략하는 것이다. 2,4-DHB는 말산 효소의 경쟁적 저해자로서, 이 효소의 활성 부위에 대한 친화성이 상당히 높다 (Rognstad & Katz, 1979). 따라서, DHB는 다른 효소에 의해 인지되어 잠재적으로 분해될 수 있다. 이들 효소는 숙주 유기체에서 동정되고 결손될 수 있다.
2,4-DHB 생성이 말레이트 또는 다른 유기산의 첨가를 기본으로 할 경우, 2,4-DHB-생성 미생물은, 말레이트 (또는 피루베이트, 숙시네이트 등과 같은 다른 유기산)의 흡수를 용이하게 하는, 막 수송 단백질을 기능적으로 발현해야 한다.
본 발명의 형질변환된 숙주 유기체는 DHB를 합성하는 부가적인 경로를 추가로 포함할 수 있으며, 상기 숙주 유기체는 이들의 게놈에 병합되거나 또는 염색체외 유전적 구성원에 의해 옮겨지는, 1종 이상의 키메라 유전자, 예를 들어 말레이트 키나제를 코딩하는 플라스미드 또는 말레이트 키나제를 코딩하는 핵산을 포함하는 키메라 유전자 또는 말레이트 키나제를 코딩하는 핵산을 포함하는 발현 벡터, 및/또는 말레이트 세미알데하이드 데하이드로게나제를 코딩하는 핵산, 또는 말레이트 세미알데하이드 데하이드로게나제를 코딩하는 핵산을 포함하는 키메라 유전자 또는 말레이트 세미알데하이드 데하이드로게나제를 코딩하는 핵산을 포함하는 발현 벡터, 및/또는 DHB 데하이드로게나제를 코딩하는 핵산, DHB 데하이드로게나제를 코딩하는 핵산을 포함하는 키메라 유전자 또는 DHB 데하이드로게나제를 코딩하는 핵산을 포함하는 발현 벡터를 포함한다. 상기 효소는 국제 특허 출원 2012/056318에 개시되어 있다.
하기 실시예는 본 발명을 예시한다. 이들 실시예는 예시를 목적으로 할 뿐, 어떤 방식으로 본 발명의 범위를 한정하려는 것이 아니다.
도 1: (i) (L)-말레이트, 숙시닐-CoA, 또는 글리옥실레이트가 (L)-2,4-다이하이드록시부티레이트 (2,4-DHB)로 변환되는 것을 설명하는 반응 도식.
도 2: 도면은 말레이트 세미알데하이드에 대한 활성 (상부 그래프), 숙신산 세미알데하이드에 대한 활성 (중간 그래프), 말레이트 세미알데하이드 및 숙신산 세미알데하이드에 대한 야생형 활성의 비율에 대한, 말레이트 세미알데하이드 및 숙신산 세미알데하이드에 대한 돌연변이체의 활성의 비율의 로그함수로서 표현한, 야생형 효소와 비교 시 효소 특이성의 변화 (하부 그래프). (양의 값은 말레이트 세미알데하이드에 선호적인 특이성의 변화를 의미함).
도 3: 2 mM 아세틸-CoA, 2 mM 글리옥실레이트, 및 2 mM NADPH를 DHB 경로 효소의 서로 다른 조합과 함께 인큐베이션한 후 DHB의 존재를 보여주는 크로마토그램 (반응 1: 말릴-CoA 리아제 (150 ㎍/mL Me-Mcl), 말릴-CoA 리덕타제 (100 ㎍/mL St-Mcr), 및 말레이트 세미알데하이드 리덕타제 (100 ㎍/mL Ms-SSAred H39R N43H); 반응 2: 반응 1과 동일하지만, 100 ㎍/mL Pg-SucD를 말릴-CoA 리덕타제로서 사용함; 대조군 1: 반응 1과 동일하지만, 말릴-CoA 리덕타제를 포함하지 않음; 대조군 2: 반응 1과 동일하지만, 말레이트 세미알데하이드 리덕타제를 포함하지 않음)
실시예 1: 말릴- CoA 리아제 활성의 시험
말릴- CoA 리아제를 코딩하는 야생형 유전자를 포함하는 플라스미드의 제작: 메틸로박테리움 엑스토?스(M. extoquens ) (Arps et al ., 1993) 및 로도박터 캡술라투스(Rhodobacter capsulatus ) (Meister et al ., 2005)에서 말릴-CoA 리아제를 코딩하는 mcl 유전자의 DNA 서열을, GENEius 소프트웨어 (Eurofins)를 사용해 에스케리키아 콜라이에서 발현되도록 최적화하였다. 최적화된 서열은 NheI 및 EcoRI 제한효소 부위를 각각 mcl의 개시 코돈의 상류와 정지 코돈의 하류에 첨가함으로써 Eurofins MWG OPERON®에 의해 합성하였으며, 이로써 합성된 DNA 단편을 T4 DNA 리가제(ligase) (Biolabs)를 사용해 pET28a+ 벡터 (Novagen) 내로 직접 클로닝할 수 있었다. 연결 산물(ligation product)은 에스케리키아 콜라이 DH5α 세포에 형질변환시키고, 증폭시킨 다음, 플라스미드 pET28-Mex-mcl (메틸로박테리움 엑스토?스 유래의 말릴-CoA 리아제를 발현함) 및 pET28-Rca-mcl (로도박터 캡술라투스 유래의 말리-CoA 리아제를 발현함)을 표준 유전적 프로토콜을 이용해 분리하였다 (Sambrook et al ., 1989). 사용되는 mcl 단백질 서열에 대한 NCBI 및 통합 게놈(Integrated Genomics) 참조와, 상응하는 천연 DNA 서열 및 합성 DNA 서열에 대한 참조는 표 1에 열거되어 있다.
주석이 붙은(annotated) 말릴-CoA 리아제 활성을 가진 여러 가지 유기체 유래의 단백질에 대한 참조, 및 천연 DNA 서열과 최적화된 DNA 서열에 대한 참조.
유기체 단백질 NCBI/통합 게놈 입수 번호(Integrated Genomics accession number) 천연 DNA 서열 최적화된 DNA 서열
메틸로박테리움 엑스토?스
(M. extorquens )
Mcl
서열 번호 1
YP _002962854 서열 번호 2 서열 번호 3
효소 발현: 에스케리키아 콜라이 BL21 (D3) 세포를 표준 유전적 프로토콜을 이용해 적절한 플라스미드로 형질변환하였다 (Sambrook et al ., 1989). OD600 0.1에서 하룻밤 배양시킨 배양물을 접종하여 OD600 0.6으로 증식시킨 후, 1 mM 이소프로필 β-D-1-티오갈락토파리노시드 (IPTG)를 배양 배지에 첨가하여 단백질 발현을 유도하여, 250 mL LB 배양액에서, N-말단 헥사-His 태그가 붙은 효소를 발현시켰다. 단백질 발현 3 시간 후, 13000 g에서 10 분 동안 원심분리해서 세포를 회수하고, 상층액을 폐기한다. 세포 펠렛은 다음 분석까지 -20℃에 보관하였다. 증식 및 단백질 발현은 37℃에서 수행하였다. 배양 배지에는 50 ㎍/mL 카나마이신이 첨가되었다.
효소 정제: 발현 배양물 중 동결시킨 세포 펠렛을 0.5 mL의 분해 완충액 (50 mM Hepes, 300mM NaCl, pH 7.5)에 재현탁시키고, 전력 출력을 30%로 세팅한 소니케이션(sonication)을 4 회 연속으로 진행시켜, 분해하였다 (소니케이션 간격: 20초, 파워 출력: 30%, 소니케이터(sonicator): Bioblock Scientific사 제품, Vibracell™ 72437). 조 (crude) 추출물을 4℃, 13000 g에서 15 분 동안 원심분리하여 세포 잔해를 제거하고, 맑은 상층액을 수득하였다. 15 mg/mL 스트렙토마이신 (시그마 (Sigma) 사 제품)을 첨가하고, 샘플을 4℃, 13000 g에서 10 분 동안 원심분리하여, 상층액을 수득함으로써, RNA 및 DNA를 추출물에서 제거하였다. 맑은 단백질 추출물을, 베드 (bed) 부피가 0.3 (0.75 mL)인 Talon™ 코발트 친화성 수지 (Clontech사 제품)로 실온에서 20분 (4℃에서 1시간) 동안 인큐베이션하였다. 현탁액을 테이블 탑 원심분리기, 700 g에서 원심분리하고, 상층액을 제거하였다. 0.5 mL의 용리 완충액 (50 mM Hepes, 300 mM NaCl, 200 mM 이미다졸, pH 7.5)으로 단백질을 용리하기 전에, 10 베드 부피의 세정 완충액 (50 mM Hepes, 300 mM NaCl, 15 mM 이미다졸, pH 7.5)으로 수지를 세정하였다. 용리된 효소의 순도는 SDS-PAGE 분석으로 확인하였다. 단백질 농도는 브래드포드(Bradford) 방법으로 측정하였다.
효소 분석: 말릴-CoA 리아제 활성을 (Meister et al ., 2005)로부터 채택된 방법에 의해 분석하였다. 말릴-CoA 리아제에 의한 말릴-CoA 합성은 조효소 A의 시트레이트 신테타제-촉매된 방출과 커플링하였으며, DTNB와의 자발적인 반응에 의해 모니터링하였다.
반응 도식:
말릴-CoA 리아제:
아세틸-CoA + 글리옥실레이트 → (L)-말릴-CoA
시트레이트 신테타제:
(L)-말릴-CoA → (L)-말레이트 + 조효소 A
자발적 :
조효소 A + DTNB → CoA-DTNB 다이설파이드
분석법 1에 따른 반응 혼합물은 50 mM MOPS/KOH (pH 7.5), 0.25 mM DTNB, 5 mM MgCl2, 1 mM 아세틸-CoA, 20 U/mL 시트레이트 신테타제 (모두 Sigma사 제품), 및 적당량의 정제된 말릴-CoA 리아제 또는 세포 추출물을 포함하였다. 반응은 10 mM 글리옥실레이트를 첨가함으로써 개시하였다. 효소적 분석은 37℃에서 96-웰 평판 마이크로타이터 플레이트에 최종 부피 250 ㎕로 수행하였다. 반응은 마이크로플레이트 판독기 (BioRad 680XR)에서 412 nm (εDNTB + CoA = 13.6 mM-1 cm-1)에서 DNTB의 특징적인 흡광도를 분석하였다.
메틸로박테리움 엑스토?스 유래의 정제된 말릴-CoA 리아제는 Vmax가 36 μmol/(min mg prot), 글리옥실레이트에서의 Km이 0.5 mM이었다.
실시예 2: 말릴- CoA 리덕타제 활성의 실험
말로닐 - CoA 리덕타제 숙시닐 - CoA 리덕타제를 코딩하는 야생형 유전자를 포함하는 플라스미드의 제작: 술폴로부스 토코다이이( Sulfolobus tokodaii ) str 7 (Alber et al ., 2006)에서 말릴-CoA 리덕타제를 코딩하는 mcr 유전자의 DNA 서열을, GENEius 소프트웨어 (Eurofins)를 사용해 에스케리키아 콜라이에서 발현되도록 최적화하였다. 최적화된 mcr 서열, 및 포르피로모나스 깅기발리스(Porphyromonas gingivalis)에서 숙시닐-CoA 리덕타제를 코딩하는 sucL 유전자의 천연 DNA 서열을, NheIEcoRI 제한효소 부위를 각각 mcl의 개시 코돈의 상류와 정지 코돈의 하류에 첨가함으로써 Eurofins MWG OPERON®에 의해 합성하였으며, 이로써 합성된 DNA 단편을 T4 DNA 리가제 (Biolabs)를 사용해 pET28a+ 벡터 (Novagen) 내로 직접 클로닝할 수 있었다. 연결 산물은 에스케리키아 콜라이 DH5α 세포에 형질변환시키고, 증폭시킨 다음, 플라스미드 pET28-St-mcr (S. 코토다이이이(S. tokodaii) 유래의 말로닐-CoA 리덕타제를 발현함) 및 pET28-Pgi-sucD (포르피로모나스 깅기발리스(P. gingivalis) 유래의 숙시닐-CoA 리덕타제를 발현함)을 표준 유전적 프로토콜을 이용해 분리하였다 (Sambrook et al., 1989). 사용되는 mclsucD 단백질 서열에 대한 NCBI 및 통합 게놈 참조와, 상응하는 천연 DNA 서열 및 합성 DNA 서열에 대한 참조는 표 2에 열거되어 있다.
주석이 붙은 말릴-CoA 리덕타제 활성 또는 숙시닐-CoA 리덕타제 활성을 가진 여러 가지 유기체 유래의 단백질에 대한 참조, 및 천연 DNA 서열과 최적화된 DNA 서열에 대한 참조.
유기체 단백질 NCBI/통합 게놈 입수 번호 천연 DNA 서열 최적화된 DNA 서열
술폴로부스 토코다이이(S. tokodaii ) St-Mcr
서열 번호 7
NP _378167 서열 번호 8 서열 번호 9
포르피로모나스 깅기발리스
(P. gingivalis )
Pg-SucD
서열 번호 10
AAQ65862 서열 번호 11
Pg-SucD의 발현 및 정제는 플라스미드 pET28-Pgi-sucD를 사용해 실시예 1에서와 같이 수행하였다.
St-mcr 유전자는 프라이머 5'-TATAATGAGCTCGTTTAACTTTAAGAAGGAGATATACCATGATTCTGATGCGCCGT-3' (서열 번호 12) 및 5'-TATAATGGATCCCTCGAATTCTTACTTCTC-3' (서열 번호 13)를 사용해 플라스미드 pET28-St-mcr로부터 증폭시켰으며, 각각 개시 코돈의 상류 및 정지 코돈의 하류에 SacI 및 BamHI 제한효소 부위를 첨가하였다. PCR 단편을 SacI 및 BamHI 제한효소 부위를 사용해 pACT3 발현 벡터에 연결하였다. 생성된 플라스미드 pACT3-St-Mcr을 에스케리키아 콜라이 MG1655 균주에 형질변환시켰다. 생성된 발현 균주는 37℃에서 미네랄 배지에서 배양하였다. 1 리터 미네랄 배지는, 20 g 포도당, 18 g Na2HPO4 * 12 H2O, 3 g KH2PO4, 0.5 gNaCl, 2 g NH4Cl, 0.5 g MgSO4 * 7 H2O, 0.015 CaCl2 * 2 H2O, 100배 희석시킨 농축 HCl에서 제조한 0.06 mol/L FeCl3 스탁 용액 1 mL, 10 mM 티아민 HCl 스탁 용액 2 mL, MOPS 20 g, 카나마이신 설페이트 50 ㎍ (및 필요한 경우 25 ㎍ 클로람페니콜), 및 미량 원소 용액 1 mL (L 당: 0.04 g Na2EDTA * 2H2O, 0.18 g CoCl2 * 6 H2O, ZnSO4 * 7 H2O, 0.04 g Na2MoO4 * 2 H2O, 0.01 g H3BO3, 0.12 g MnSO4 * H2O, 0.12 g CuCl2 * H2O를 포함함)을 포함하였다. 중성 pH는 pH 7로 조정하였으며, 배지는 여과-살균하였다.
기하급수적으로 성장하는 배양물의 OD(600nm)가 0.6에 도달하였을 때, 1 mM IPTG를 첨가하고, 배양물을 20℃에서 14시간 동안 인큐베이션한 다음, 원심분리 (13000 x g, 10 min)에 의해 세포를 수집하였다. 상층액을 폐기한 후, 세포 펠렛을 -20℃에 보관하였다.
St-Mcr을 정제하기 위해, 발현 배양물의 동결된 세포 펠렛을 파쇄 완충액(breakage buffer) (50 mM Hepes, 300mM NaCl, pH 7.5) 0.5 mL에 재현탁시키고, 4회 연속한 소니케이션에 의해 파쇄하여 오픈되게 하였다 (소니케이션 간격: 20 sec, 파워 출력: 30 %, 소니케이터: Bioblock Scientific, VibraCellTM 72437). 세포 추출물을 4℃, 13000 x g에서 15분 동안 원심분리함으로써 세포 찌꺼기를 제거하고, 투명한 상층액을 유지시켰다. 에스케리키아 콜라이로부터 유래되는 본래의 단백질은 85℃에서의 30분 동안의 열 침전(heat precipitation)과 13000 x g에서의 원심분리에 의해 제거하였다. 단백질 조제물의 순도는 SDS-page 분석으로 분석하였으며, St-Mcr 단백질의 예상된 크기에 상응하는 밴드 하나만을 확인할 수 있었다.
효소적 분석: 말릴-CoA 리덕타제 활성은 각각 분석법 1 또는 분석법 2를 적용하는 반응의 환원 및 산화적 개념에서 분석하였다.
분석법 1 (반응 도식):
말릴-CoA 리아제:
글리옥실레이트 + 아세틸-CoA → 말릴-CoA + 아세테이트
말릴-CoA 리덕타제:
(L)-말릴-CoA + NADPH → (L)-말레이트 세미알데하이드 + 조효소 A + NADP
분석법 2 (반응 도식):
(L)-말레이트 세미알데하이드 + 조효소 A + NADP → (L)-말릴-CoA + NADPH
분석법 1에 따른 반응 혼합물은 50 mM MOPS/KOH (pH 7.5), 10 mM 글리옥실레이트, 4 mM 아세틸-CoA, 5 mM MgCl2, 0.25 mM NADPH (모두 Sigma사 제품), 5 U/mL 말릴-CoA 리아제, 및 적당량의 정제된 말릴-CoA 리덕타제 또는 세포 추출물을 포함하였다. 반응은 글리옥실레이트를 첨가함으로써 개시하였다. 효소적 분석은 37℃에서 96-웰 평판 마이크로타이터 플레이트에 최종 부피 250 ㎕로 수행하였다. 반응은 마이크로플레이트 판독기 (BioRad 680XR)에서 340 nm (εNADPH = 6.22 mM-1 cm-1)에서 NADPH의 특징적인 흡광도를 분석하였다.
분석법 2에 따른 반응 혼합물은 200 mM HEPES (pH 9), 5 mM MgCl2, 1 mM NADP, 0.5 mM 조효소 A (모두 Sigma사 제품), 및 적당량의 정제된 말릴-CoA 리덕타제를 포함하였다. 반응은 5 mM (L)-말레이트 세미알데하이드를 첨가함으로써 개시하였다. 효소적 분석은 37℃에서 96-웰 평판 마이크로타이터 플레이트에 최종 부피 250 ㎕로 수행하였다. 반응은 마이크로플레이트 판독기 (BioRad 680XR)에서 340 nm (εNADPH = 6.22 mM-1 cm-1)에서 NADPH의 특징적인 흡광도를 분석하였다. 불안정한 말레이트 세미알데하이드는 안정한 말레이트 세미알데하이드 유도체 2-[(4S)-2,2-다이메틸-5-옥소-1,3-다이옥솔란-4-일]아세트알데하이드(DMODA) (Activation®에 의해 제공됨)의 탈보호에 의해, 효소적 시험 전에 새로 제조하였다. 말레이트 세미알데하이드는, 2 M 염산에서 적당량의 DMODA를 용해시키고, 현탁액을 비점으로 단기간 가열한 다음, 가열된 현탁액을 실온에 15분간 방치함으로써 수득하였다. 방출된 아세톤은 회전 증발기(rotary evaporator)에서 35℃ 및 50 mbar에서 증발시켰다. 말레이트 세미알데하이드 용액의 pH는 소듐 바이카르보네이트를 사용해 pH 3.5로 고정시켰다.
표 3 및 4에 열거된 결과는, 술폴로부스 토코다이이(S. tokodaii)의 말로닐-CoA 리덕타제, Mcr, 및 포르피로모나스 깅기발리스(P. gingivalis)의 숙시닐-CoA 리덕타제, SucD에 대한 말릴-CoA 리덕타제 활성을 보여준다.
반응의 환원면에서 카이네틱 파라미터 (말로닐-CoA 리덕타제 및 숙시닐-CoA 리덕타제 활성은 기질인 말로닐-CoA 또는 숙시닐-CoA를 반응 혼합물에 직접 첨가함으로써 측정하였음).
기질 말로닐- CoA 숙시닐 - CoA 말릴- CoA
효소 Vmax
[μmol/(min mg)]
Km
[mM]
Vmax
[μmol/(min mg)]
Km
[mM]
Vmax
[μmol/(min mg)]
Km
[mM]
St - Mcr 0.67 ±0.15 nd 0.98 ±0.17 0.2 0.24 ±0.045 nd
Pg - SucD nd nd 1 1 0.025 nd
반응의 산화면에서 카이네틱 파라미터
기질 숙신산 세미알데하이드 말레이트 세미알데하이드
효소 Vmax
[μmol/(min mg)]
Km
[mM]
Vmax
[μmol/(min mg)]
Km
[mM]
St - Mcr 1.7 1.15 0.1 0.25
Pg - SucD 4 nd 0.007 nd
실시예 3: DHB 데하이드로게나제 활성에 대한 설명
적절한 2,4 DHB 데하이드로게나제를 규명하기 위해, 여러 가지 생물학적 소스 유래의 베타-하이드록시산 데하이드로게나제를, 말레이트 세미알데하이드를 환원시키는 능력에 대해 시험하였다. 시험된 효소들 중에는, 사카로마이세스 세레비지애 유래의 메틸부티르알데하이드 리덕타제, Ypr1 (Ford & Ellis, 2002)(서열 번호14), 포르피로모나스 깅기발리스(P. gingivalis)의 4-하이드록시부티레이트 데하이드로게나제, 4hbdh (서열 번호187), 에스케리키아 콜라이 유래의 알코올 데하이드로게나제, YqhD (서열 번호 185), 및 메탈로스패라 세둘라(Metallosphaera sedula) 유래의 숙신산 세미알데하이드 리덕타제, Ms-Ssr (Kockelkorn& Fuchs, 2009) (서열 번호 16)이 있었다. YPR1, 4hbdh, yqhD, 및 Ms-SSR 유전자를 표 5에 열거된 프라이머를 사용해 증폭시키고, 벡터 pET28 (제한부위 효소는 표 5를 참조)에 클로닝하여, 플라스미드 pET28-Sce-YPR1, pET28-Pgi-4hbdh, pET28-Eco-yqhd 및 pET28-Mse-SSR을 각각 수득하였다. 단백질은 실시예 1에서와 같이 발현시키고 정제하였다.
후보 베타-하이드록시산 데하이드로게나제를 클로닝하는 데 사용되는 프라이머 및 제한부위 효소
효소 입수 번호 프라이머 5'-3' 제한부위 효소
YPR1 GI:6320576 TATAATGCTAGCATGCCTGCTACGTTAAAGAA
(서열 번호 18)
TATAATGAGCTCTCATTGGAAAATTGGGAAGG
(서열 번호 18)
NheI

SacI
YqhD GI:16130909 TATAATGAATTCTTAGCGGGCGGCTTCGTATATACGGCGGCTGACA
(서열 번호 20)
TATCGTGCTAGCATGAACAACTTTAATCTGCACA
(서열 번호 21)
EcoRI

NheI
4hbdh GI:188994588 TATAATGGATCCTTAGTAGAGTCTTCTGTAG
(서열 번호 22)
TATAATCATATGCAACTTTTCAAACTC
(서열 번호 23)
BamHI

NdeI
Ms - SSR GI:146304190 TATAATGCTAGCATGAAAGCTGCAGTACTTCA
(서열 번호 24)
TATAATGAATTCTTACGGGATTATGAGACTTC
(서열 번호 25)
NheI

EcoRI
말레이트 세미알데하이드 리덕타제 활성에 대한 시험:
반응 도식:
(L)- 말레이트 세미알데하이드 + NAD (P)H → (L)-2,4- 다이하이드록시부티르산 + NAD (P)
분석법 혼합물은 200 mM Hepes (pH 7.5), 50 mM KCl, 5 mM MgCl2, 0,24 mM NADH 또는 NADPH, 및 적당량의 정제된 효소 또는 세포 추출물을 포함하였다. 반응은 10 mM (L)-말레이트 세미알데하이드를 첨가함으로써 개시하였다 (말레이트 세미알데하이드는 각 시험 시마다 새로 제조하였으며, 실시예 3을 참조함). 효소적 분석은 30℃에서 96-웰 평판 마이크로타이터 플레이트에 최종 부피 250 ㎕로 수행하였다. 반응은 마이크로플레이트 판독기 (BioRad 680XR)에서 340 nm (εNADPH = 6.22 mM-1 cm-1)에서 NAD(P)H의 특징적인 흡광도를 분석하였다. 그 결과는 표 6에 열거한다.
선별된 베타-하이드록시산 데하이드로게나제가 말레이트 세미알데하이드에 미치는 환원 활성 (결과는 2회 이상의 독립적인 실험의 평균을 나타냄).
효소 기원 보고된 기능 말레이트 세미알데하이드 에 대한 활성
(보조인자 NADH )
[μmol/( min * mg _ prot )]
말레이트 세미알데하이드 에 대한 활성
(보조인자 NADPH )
[μmol/( min * mg _ prot )]
Ms-SSR
(서열 번호 16)
메탈로스패라 세둘라(M. sedula ) 숙신산 세미알데하이드 리덕타제 4.9 4.9
YqhD (서열 번호 185) 에스케리키아 콜라이 알코올 데하이드로게나제 nd 1.2
4hbdh (서열 번호 187) 포르피로모나스 깅기발리스 (P. gingivali s) 4-하이드록시부티레이트 데하이드로게나제 33 nd
YPR1
(서열 번호 14)
사카로마이세스 세레비지애(S. cerevisiae) 메틸부티르알데하이드 리덕타제 nd 0.19
메탈로스패라 세둘라(M. sedula) 유래의 숙신산 세미알데하이드 데하이드로게나제 및 사카로마이세스 세레비지애(S. cerevisiae) 유래의 메틸부티르알데하이드 리덕타제는 말레이트 세미알데하이드 리덕타제 활성을 가진다. 말레이트 세미알데하이드에 대한 Ms-SSR의 Km은 4 mM이었다.
실시예 4: 개선된 말릴- CoA 리덕타제 효소의 합리적인 제작
표 7에 열거된 올리고뉴클레오티드 쌍과, 주형으로 pET28-Sto-mcr 플라스미드를 사용하여, 부위 특이적인 돌연변이유발을 수행하였다. 아미노산 서열을 바꾸기 위해, PCR (Phusion 1 U, HF 완충액 20% (v/v), dNTPs 2.5 mM, 정방향 및 역방향 프라이머 각각 1 μM, 주형 플라스미드 200 ng, 물)로 점 돌연변이를 도입하였다. PCR에 의한 플라스미드 제작이 가능한 경우, 제작된 플라스미드는 새로운 제한효소 부위 (침묵 돌연변이로 도입됨)외에도, 돌연변이된 클론의 동정을 용이하게 하는 기능성 돌연변이를 포함하였다. 주형 DNA를 제거하기 위해, PCR 산물을 37℃에서 2 x 2시간 동안 Dpnl로 분해시키고, NEB DH5-α 컴피턴트 에스케리키아 콜라이 세포 (NEB)에 형질변환시켰다. 돌연변이된 플라스미드를 제한효소 부위 분석으로 동정하고, 원하는 돌연변이가 생겼는지를 DNA 시퀀싱으로 확인하였다.
술폴로부스 토코다이이(S. tokodaii)의 mcr 유전자를 돌연변이시키는 데 사용되는 프라이머 쌍.
돌연변이 프라이머 5'-3'
Tyr206 정방향
CATTCTGCCTTTAGGGGACGGCNNKGACGCCAAAACG
(서열 번호 26)

역방향
CGTTTTGGCGTCMNNGCCGTCCCCTAAAGGCAGAATG
(서열 번호 27)
St-Mcr의 유전적 변형의 영향은 실시예 2에 기술된 분석법 3을 이용한 반응의 산화적 면에서 시험하였다. 도 3은, 천연 Tyr206을 다른 아미노산으로 대체한 경우, 천연 기질인 숙신산 세미알데하이드에 대한 활성을 감소시키며, 동시에 말레이트 세미알데하이드에 대한 활성을 증가시키거나 또는 적어도 지속시킴을 보여준다. 따라서, Tyr206을 적절한 아미노산 잔기로 대체하면, DHB 경로의 중간산물에 대한 Mcr의 특이성의 관점에서 선택적인 이점을 제공한다.
따라서, 306 위치에 바람직한 아미노산 잔기로는, 페닐알라닌, 히스티딘, 이소루신, 라이신, 메티오닌, 글리신, 아스파라긴, 프롤린, 아르기닌, 글루타민, 루신, 세린, 트립토판, 및 트레오닌이 있다.
티로신 306이 프롤린 잔기로 대체된 단백질은 서열 번호 202로 표시된다.
실시예 5: 개선된 DHB 데하이드로게나제의 합리적인 제작
표 6에 열거된 올리고뉴클레오티드 쌍과, 주형으로서 pET28-Mse-SSR 플라스미드를 사용하여, 부위 특이적인 돌연변이유발을 수행하였다. 아미노산 서열을 바꾸기 위해, PCR (Phusion 1 U, HF 완충액 20% (v/v), dNTPs 2.5 mM, 정방향 및 역방향 프라이머 각각 1 μM, 주형 플라스미드 200 ng, 물)로 점 돌연변이를 도입하였다. 가능한 경우, PCR로 제작된 플라스미드는 새로운 제한효소 부위 (침묵 돌연변이로 도입됨)외에도, 돌연변이된 클론의 동정을 용이하게 하는 기능성 돌연변이를 포함하였다. 주형 DNA를 제거하기 위해, PCR 산물을 37℃에서 2 x 2시간 동안 Dpnl로 분해시키고, NEB DH5-α 컴피턴트 에스케리키아 콜라이 세포 (NEB)에 형질변환하였다. 돌연변이된 플라스미드를 제한효소 부위 분석으로 동정하고, 원하는 돌연변이가 생겼는지를 DNA 시퀀싱으로 확인하였다. 표 8은 돌연변이체의 카이네틱 파라미터를 요약한 것이다. 결과에 따르면, 이중 돌연변이체 Ms-SSR H39R N43H (서열 번호 38)의, 말레이트 세미알데하이드에 대한 친화성이, 야생형 효소와 비교해 개선되었다.
메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제 (Ms-SSR)를 돌연변이시키는 데 사용되는 프라이머 쌍
돌연변이 프라이머 5'-3' 제한부위 효소
H39R gtcaaggcaaccggtctctgtcgctccgacgtcaatg
(서열 번호 28)
cattgacgtcggagcgacagagaccggttgccttgac
(서열 번호 29)
NheI
N43H ggctctgtcactccgacgtacatgtctttgaggggaaaac
(서열 번호 30)
gttttcccctcaaagacatgtacgtcggagtgacagagcc
(서열 번호 31)
NheI
메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제 (Ms-SSR) 돌연변이체의 카이네틱 파라미터에 대한 요약 (결과는 적어도 2회의 독립적인 실험의 평균을 나타냄)
돌연변이체 최대 활성
[μmol/( min * mg prot )]
Km
[ mmol /L]
야생형 (서열 번호 16) 4.9 4
H39R (서열 번호 32) 1.7 1
N43H (서열 번호 34) 4.3 5
H39R N43H (서열 번호 36) 4.7 1
상응하는 핵산 서열은 서열 번호 17, 서열 번호 33, 서열 번호 35 및 서열 번호 37로 표시된다.
돌연변이 H39R 및 N43H를 포함한 메탈로스패라 세둘라 숙신산 세미알데하이드 리덕타제의 코딩 서열이, 진옵티마이저® (GeneOptimizer®) 소프트웨어를 이용해, 에스케리키아 콜라이에서 최대로 발현되도록 최적화하였다. 진아트® 진 신세시스 (GeneArt® Gene Synthesis) (인비트로겐 라이프 테크놀로지 (Invitrogen Life Technologie) 사 제품)로, 합성 유전자를 제조하였다. NheI 및 EcoRI 제한효소 부위를 개시 코돈의 상류과, 정지 코돈의 하류 각각에 도입하여, pET28a+ (노바겐 사 제품)에 직접 클로닝하였다.
제조되는 pET28-Mse-DHB-Dh-H39R_N43H-opt 플라스미드를 분리하고, 올바른 서열 (서열 번호 38)을 가진 전장 메탈로스패라 세둘라 SSR H39R N43H 유전자를 포함하는지를 DNA 시퀀싱으로 확인하였다.
실시예 6: 합성 말릴- CoA 경로에 의해 DHB 의 시험관 내 제조에 대한 실험
효소 말릴-CoA 리아제 (Me-Mcl), 말릴-CoA 리덕타제 (St-Mcr 또는 Pg-SucD), 및 DHB 데하이드로게나제 (Ms-SSA-red H39N N43H)를 실시예 1, 2 및 3에 기술된 바와 같이 발현시키고 정제하였다.
말릴-CoA 리아제, 말릴-CoA 리덕타제, 및 DHB 데하이드로게나제를 포함하는 경로에 의한 DHB의 제조는 2 mM 글리옥실레이트를, 50 mM Hepes (pH 7.5), 2 mM 아세틸-CoA, 2 mM NADPH, 100 ㎍/mL DHB 데하이드로게나제, 150 ㎍/mL 말릴-CoA 리아제, 및 100 ㎍/mL 말릴-CoA 리덕타제 (St-Mcr (반응 1), 또는 Pg-SucD (반응 2)임)을 포함하는 반응 혼합물에 첨가함으로써 시험관 내에서 설명되었다.
대조군 반응물은 모든 성분들을 포함하였지만, DHB 데하이드로게나제 (대조군 1) 또는 말릴-CoA 리덕타제 (대조군 2)를 포함하지 않았다. 37℃에서 120분 동안 인큐베이션한 후, 반응 혼합물 내의 DHB 함량은 기체 크로마토그래피 [GCMS-QP2010 Ultra Shimadzu; FID 검출기 (FID-2010 Plus Shimadzu); 오토샘플러 AOC20s (Shimadzu) ; 스플릿리스 인젝터(splitless injector) AOC20i (Shimadzu) (230℃); 컬럼: Zebron ZB-FFAP, 30 m x 0.25 mm, df 0.25 ㎛; 및 라이너(liner): 테이퍼드 포커스 라이너(Tapered focus Liner) 5 x 95 x 3.4 mm (SGE)]로 분석하였다. 운반 기체는 총 유속이 25 mL/min인 수소였다. 공기-수소 혼합물을 이용해 불꽃 이온화 반응 (유속은 각각 300 mL/분 및 30 mL/분이었음)을 수행하였다. 검출기 온도는 240℃였다. 주입된 샘플 부피는 1 ㎕였다. 온도 프로그램은 하기 표 10에 나타낸다.
경로 효소를 모두 포함하는 반응물에 DHB가 존재한다는 것, 및 경로 효소 3가지 중 단지 2가지만 포함하는 샘플에 DHB가 존재하지 않는 것을 보여주는 크로마토그램은 도 2에 도시되어 있다.
반응 혼합물의 GC 분석을 위한 온도 프로그램
컬럼 온도
[℃]
고정기
[min]
구배
[℃/min]
진행시간
[min]
90 0 0 0
115 1.8 30 2.63
170 1 4 17.38
230 3 50 21.58
실시예 7: 최적화된 DHB 생성 균주의 제작
말릴- CoA 신타제 , 말릴- CoA 리덕타제 , 및 DHB - 데하이드로게나제의 동시 발현을 위한 플라스미드의 제작:
메틸로박테리움 엑스토?스 유래의 말릴-CoA 리아제, Me-mcl의 코딩 서열은, 하이 피델리티 폴리머라제 퓨전(high fidelity polymerase Phusion) (Fermentas), 및 개시 코돈의 SacI 상류에 대한 제한효소 부위 (밑줄 그어져 있음)를 포함하는 정방향 프라이머와 역방향 프라이머 5'-TCACACAGGAAACAGAATTCGAGCTCGGTAATGTCGTTTACCCTGATTCAGCAAGCGACT-3' (서열 번호 39) 및 5'-GGTATATCTCCTTCTTAAAGTTAAACTTATTTGCCGCCCATTGCATCCGCTTTCTG-3' (서열 번호 40)를 사용하여 플라스미드 pET28-Mex-mcl로부터 증폭시켰다. 술폴로부스 토코다이이(S. tokodaii) 유래의 말로닐-CoA 리덕타제, St-mcr의 코딩 서열은, 정지 코돈의 BamHI 하류에 대한 제한효소 부위를 포함하는 정방향 프라이머 및 역방향 프라이머 5'-GTTTAACTTTAAGAAGGAGATATACCATGATTCTGATGCGCCGTACCCTGAAAGCG-3' (서열 번호 41) 및 5'-GGTATATCTCCTTCTTAAAGTTAAACTTACTTCTCGATGTAGCCTTTCTCCACGAG-3' (서열 번호 42)를 사용하여 플라스미드 pET28-Sto-mcr로부터 증폭시켰다. 플라스미드 pET28-Mse-DHB-Dh-H39R_N43H-opt (실시예 5)를 주형으로 사용하여, 정지 코돈의 하류에 BamHI 제한효소 부위 (밑줄 그어져 있음)에 도입한 정방향 프라이머 및 역방향 프라이머 5'-GTTTAACTTTAAGAAGGAGATATACCATGAAAGCAGCAGTTCTGCATACCTATAAAGAACCGCTGAGCAT-3' (서열 번호 43) 및 5'-ATGCCTGCAGGTCGACTCTAGAGGATCCTTACGGAATAATCAGGCTACGAATTGCTTC-3' (서열 번호 44)를 사용하여, 메탈로스패라 세둘라(M. sedula) 유래의 숙신산 세미알데하이드 리덕타제 H39R N43H의 최적화된 코딩 서열을 증폭시켰다.
St-mcr 및 메탈로스패라 세둘라(M. sedula) 유래의 숙신산 세미알데하이드 리덕타제 H39R N43H에 대한 정방향 프라이머는 rbs 모티프를 포함하였다. 3개의 유전자를 In-Fusion 클로닝 키트 (Clontech)를 사용해 상동성 재조합에 의해 pACT3 발현 벡터에 동시에 클로닝하였다.
생성되는 pACT3-MCL-DHB (서열 번호 45) 플라스미드를 분리하고 DNA 시퀀싱에 의해 올바른 서열을 가지는 것으로 확인하였다.
말릴- CoA 신타제 , 말릴- CoA 리덕타제 , 및 DHB - 데하이드로게나제의 동시 발현을 위한 플라스미드의 제작:
메틸로박테리움 엑스토?스 유래의 말릴-CoA 신테타제의 2가지 단백질 서브유닛인 mtkA (YP_00296285) 및 mtkB (YP_002962852)를 코딩하는 DNA 서열은, GENEius 소프트웨어 (Eurofins)를 사용하여 에스케리키아 콜라이에서의 발현용으로 최적화하였다. 서브유닛의 최적화된 DNA 서열을 메틸로박테리움 엑스토?스 게놈에서 mtkA 및 mtkB 유전자 사이에서 자연적으로 존재하는 DNA 서열에 의해 물리적으로 연결하였다 (CGAACGGGGGAGGAATCACGCC, 서열 번호 46). 생성되는 DNA 단편인 'mtkA 유전자 - 링커 DNA - mtkB 유전자'는,Eurofins MWG OPERON®에 의해 합성한 다음, NheI 및 EcoRI 제한부위 효소를 사용하여 pET28b 발현 벡터에 서브클로닝하였다. 생성되는 DNA 플라스미드 pET28-Mex-mtkAB (서열 번호 47)를 사용하여, 메틸로박테리움 엑스토?스 유래의 말릴-CoA 신테타제를 코딩하는 2가지 코돈 최적화된 유전자인 Me - mtkA Me -mtkB 하이 피델리티 폴리머라제 퓨전 (Fermentas), 및 개시 코돈의 상류에 SacI용 제한효소 부위 (밑줄 그어져 있음)를 포함하는 정방향 프라이머와 역방향 프라이머 5'-CAGGAAACAGAATTCGAGCTCGGTAATGGATGTGCACGAATATCAGGCGAAAGAACTGCT-3' (서열 번호 48) 및 5'-TACGGCGCATCAGAATCATTACGCCGCACGTGCTAACACATCGGCAAC-3' (서열 번호 49)를 사용해 동시에 증폭시켰다. 술폴로부스 토코다이이(S. tokodaii) 유래의 말로닐-CoA 리덕타제, St - mcr의 코딩 서열은, 정지 코돈의 BamHI 하류에 대한 제한효소 부위를 포함하는 정방향 프라이머 및 역방향 프라이머 5'-GGCGTAATGATTCTGATGCGCCGTACCCTGAAAGCG-3' (서열 번호 50) 및 5'-CTGCTGCTTTCATTACTTCTCGATGTAGCCTTTCTCCACGAG-3' (서열 번호 51)를 사용하여 플라스미드 pET28-Sto-mcr로부터 증폭시켰다. 플라스미드 pET28-Mse-DHB-Dh-H39R_N43H-opt (실시예 5)를 주형으로 사용하여, 정지 코돈의 하류에 BamHI 제한효소 부위 (밑줄 그어져 있음)에 도입한 정방향 프라이머 및 역방향 프라이머 5'-TACATCGAGAAGTAATGAAAGCAGCAGTTCTGCATACCTATAAAGAAC-3' (서열 번호 52)  및 5'-CCTGCAGGTCGACTCTAGAGGATCCTTACGGAATAATCAGGCTACGAATTGCTTCAC-3' (서열 번호 53)를 사용하여, 메탈로스패라 세둘라(M. sedula) 유래의 숙신산 세미알데하이드 리덕타제 H39R N43H의 최적화된 코딩 서열을 증폭시켰다.
3개의 유전자를 In-Fusion 클로닝 키트 (Clontech)를 사용해 상동성 재조합에 의해 pEXT20 발현 벡터에 동시에 클로닝하였다.
생성되는 pEXT20-MCS-DHB (서열 번호 54) 플라스미드를 분리하고 DNA 시퀀싱에 의해 올바른 서열을 가지는 것으로 확인하였다.
포스포에놀피루베이트 ( PEP ) 카르복시키나제 , PEP 카르복실라제 , 피루베이트 키나제, 피루베이트 카르복실라제, 이소시트레이트 리아제 효소 및 갈락토스 심포터 퍼미아제의 과발현을 위한 플라스미드의 구축:
주형으로 에스케리키아 콜라이 MG1655 유래의 게놈 DNA와, 각각 정방향 및 역방향 프라이머인 5'TATAATCCCGGGATGCGCGTTAACAATGGTTTGACC3' (서열 번호 56 및 5'TATAATTCTAGATTACAGTTTCGGACCAGCCG3' (서열 번호 57)를 사용하여, pck 코딩 서열을 증폭시켜, 에스케리키아 콜라이의 PEP 카르복시키나아제 코딩 pck 유전자를 가지는 플라스미드 pACT3-pck를 제작하였다. DNA 단편은 XmaI 및 XbaI으로 절단하고, T4 DNA 리가제 (Biolabs)를 사용해 pACT3 발현 벡터 (Dykxhoorn et al ., 1996)의 상응하는 부위에 연결한 다음, 에스케리키아 콜라이 DH5α 세포에 형질변환하였다. 형질변환체는 클로람페니콜 (25 ㎍/mL)을 포함하는 고형 LB 배지 상에서 선별하였다. 생성되는 플라스미드를 분리하고, pck 유전자의 올바른 삽입은 시퀀싱으로 확인하였다. aceA, ppc, galP, 또는 pykA (모두 에스케리키아 콜라이 유래) 또는 락토콕커스 락티스(Lactococcus lactis ) 유래의 pck를 각각 포함하는 플라스미드 pACT3-aceA, pACT3-ppc, pACT3-galP, pACT3-pck 및 pACT3-pyc는 표 11에 열거된 프라이머를 사용해 유사하게 제작하였다.
유전자 과발현용 플라스미드의 구축에 사용되는 프라이머. pACT3로의 클로닝에 사용되는 제한효소 부위는 밑줄 그어져 있음.
유전자 프라이머 링커 서열
Ec _ pck Ec _ pck _ clon _ for XmaI tataatcccgggatgcgcgttaacaatggtttgacc
(서열 번호 57)
Ec _ pck _ clon _ rev XbaI tataattctagattacagtttcggaccagccg
(서열 번호 58)
Ec _ ppc Ec _ ppc _ clon _ for XmaI tataatcccgggatgaacgaacaatattcc
(서열 번호 59)
Ec _ ppc _ clon _ rev XbaI tataattctagattagccggtattacgcat
(서열 번호 60)
Ec _ pykA Ec _ pykA _ clon _ for XmaI tataatcccgggatgtccagaaggcttcgcagaaca
(서열 번호 61)
Ec _ pykA _ clon _ rev XbaI tataattctagattactctaccgttaaaatac
(서열 번호 62)
Ec _ aceA Ec _ aceA _ clon _ for XmaI tataatcccgggatgaaaacccgtacacaacaaatt
(서열 번호 63)
Ec _ aceA _ clon _ rev XbaI tataattctagattagaactgcgattcttcag
(서열 번호 64)
Ll _ pycA Ll _ pycA _ clon _ for XmaI tataatcccgggatgaaaaaactactcgtcgccaat
(서열 번호 65)
Ll _ pycA _ clon _ rev XbaI tataattctagattaattaatttcgattaaca
(서열 번호 66)
Ec _ galP Ec _ galP _ clon _ for XmaI tataatcccgggatgcctgacgctaaaaaacaggggcggt (서열 번호 67)
Ec _ galP _ clon _ rev XbaI tataattctagattaatcgtgagcgcctatttc
(서열 번호 68)
상기 플라스미드의 백본으로부터 lacI 유전자를 제거하고, 숙주 균주에서 lacI을 게놈 결손시키는 것은 상기 플라스미드 구축물로부터 단백질을 발현시킬 수 있는 것으로 이해된다.
탄소 흐름의 재분배가 최적화된, DHB 제조용 균주의 제작.
DHB 제조를 위한 탄소 흐름 재분배 및 보조인자 공급을 최적화하기 위해, 에스케리키아 콜라이 균주 MG1655에서 유전자 수종을 파괴하였다. Datsenko et al.(Datsenko & Wanner, 2000)에 따라, 람다 레드 리컴비나제(recombinase) 방법을 이용하거나 또는 Miller(Miller, 1992)로부터 채택된 파지 형질도입 방법을 이용해 유전자를 결손시켰다.
람다 레드 리컴비나제 방법을 이용한 유전자 결손의 도입 프로토콜: 하이 피델리티 폴리머라제(polymerase) Phusion™ (핀자임스 사 제품), 및 주형으로 플라스미드 pKD4의 FRT-플랭크된 카나마이신 내성 유전자 (kan)를 사용한 PCR에 의해, 결손 카세트를 제조하였다 (Datsenko & Wanner, 2000). 센스 프라이머는, 각 표적 유전자 (밑줄이 그어져 있음)의 5' 말단에 상응하는 서열과, 뒤이어, pKD4의 FRT-kan-FRT 카세트에 상응하는 20 bp를 포함하였다. 안티-센스 프라이머는, 각 표적 유전자 (밑줄이 그어져 있음)의 3' 말단 영역에 상응하는 서열과, 뒤이어 카세트에 상응하는 20 bp를 포함하였다. 하기 표 12에 프라이머를 기술하였다. 형질변환하기 전에, PCR 산물을 DpnI으로 분해하고, 정제하였다.
에스케리키아 콜라이 MG1655 균주는, 세포를 37℃의 LB 액상 매질에서 OD600 0.6으로 증식시키고, 상기 세포를 100-배 농축시킨 다음, 아이스콜드 10% 글리세롤로 2 회 세정함으로써, 일렉트로-컴피턴트 (electro-competent)로 만들었다. 전기천공 (2.5 kV, 200 Ω, 25 μF, 2 mm 갭 큐벳 (gap cuvettes)에서)에 의해, 세포를 플라스미드 pKD46 (Datsenko & Wanner, 2000)으로 형질변환하였다. 형질변환체를, 30℃에서, 앰피실린 (100 ㎍/mL)이 든 LB 고형 매질에서 선별하였다.
람다 레드 리컴비나제-발현 플라스미드 pKD46을 가진 일렉트로-컴피턴트 에스케리키아 콜라이 균주를 파괴 카세트로 형질변환하였다. 상기 세포를 앰피실린 (100 ㎍/mL)이 첨가된, 30℃, 액상 SOB 매질에서 증식시켰다. 배양물의 OD600이 0.1에 도달했을 때, 10 mM의 아라비노스를 첨가하여, 람다 레드 리컴비나제 시스템을 유도하였다. 원심분리로 세포를 회수하기 전에, 상기 세포를 0.6의 OD600으로 더 증식시키고, 아이스콜드 10% 글리세롤로 2회 세정하고, 전기천공에 의해 파괴 카세트로 형질변환하였다. 30℃, LB 액상 매질에서 밤새 표현형이 발현되도록 한 다음, 상기 세포를 25 ㎍/mL 카나마이신이 첨가된 고형 LB 매질에 평판 배양하였다. 30℃에서 배양한 후, 형질변환체를 선별하였다.
크림슨 택 폴리머라제 (Crimson Taq polymerase) (NEB 사 제품)를 사용한 콜로니 PCR에 의해, 유전자 치환을 확인하였다. 동시적인, 모 절편의 소실과 신규 돌연변이체 특이 절편의 생성을 확인하기 위해, 플랭킹 유전자 좌-특이 (flanking locus-specific) 프라이머 (표 12 참고)로 제1 반응을 수행하였다. FRT-카나마이신 내성 카세트 내에 정렬된 하나의 유전자 좌-특이 프라이머와, 상응하는 프라이머인 k1rev, 또는 k2for (표 12 참고) (센스 유전자 좌 프라이머/k1rev 및 k2for/역방향 유전자 좌 프라이머) 중 하나를 함께 사용해, 2회의 추가적인 반응을 수행하였다.
이어서, FLP 리컴비나제를 가지는 플라스미드 pCP20 (Cherepanov & Wackernagel, 1995)을 사용해 내성 유전자 (FRT-kan-FRT)를 염색체에서 절단하였고, 이로써, FRT 부위가 하나 포함된 스카 영역 (scar region)이 형성되었다. pCP20은 앰피실린 및 CmR 플라스미드로서, 열 유도성 FLP 리컴비나제 합성과 온도-민감성 복제를 나타낸다. 카나마이신 내성 돌연변이체를 pCP20으로 형질변환하고, 30℃에서 앰피실린-내성 형질변환체를 선별하였다. 다음, 형질변환체를 37℃, 고형 LB 매질에서 증식시키고, 항생제 내성이 모두 소실되었는지 테스트하였다. 크림슨 택 폴리머라제와 플랭킹 유전자 좌-특이 프라이머를 사용한 콜로니 PCR에 의해, FRT-카나마이신 카세트의 절단을 분석하였다 (표 12). 전술한 단계의 반복으로, 다중 결손이 이루어졌다.
표 12. 유전자 파괴에 사용되는 프라이머. 표적 유전자에 상동성인 서열은 밑줄그어져 있음.
Figure pct00001
Figure pct00002
Figure pct00003
표 13. 유전자 파괴의 확인에 사용되는 프라이머 쌍
Figure pct00004
Figure pct00005
파지 형질도입 방법을 이용하여 유전자 결손을 도입하기 위한 프로토콜: 바람직한 단일 결손을 포함하는 균주를 Keio collection (Baba et al ., 2006)에서 수득하였다. 단일 결손 돌연변이체의 파치 파쇄물은 50 ㎍/mL 카나마이신, 2 g/L 포도당, 및 5 mM CaCl2와 하룻밤 예비배양물 100 ㎕를 포함하는 LB 배지 10 mL을 접종함으로써 제조하였다. 37℃에서 1시간 동안 인큐베이션한 후, 야생형 MG1655 균주 유래의 파지 파쇄물 200 ㎕를 첨가하고, 배양물은 세포 파쇄가 완료될 때까지 2-3시간 더 인큐베이션하였다. 클로로포름 200 ㎕를 첨가한 후, 세포 조제물을 먼저 격렬히 보텍싱(vortexing)한 다음, 4500 x g에서 10분간 원심분리하였다. 깨끗한 파쇄물을 회수하고 4℃에 보관하였다.
수여체 균주(receptor strain)는 37℃, LB 배지에서 밤새 배양함으로써 파지 형질도입용으로 제조하였다. 예비배양물 1.5 mL을 1500 x g에서 10분간 원심분리하였다. 상층액을 폐기하고, 세포 펠렛을 10 mM MgSO4 및 5 mM CaCl2를 포함하는 용액 600 ㎕에 재현탁하였다. 형질도입은, 수여체 균주를 포함하는 용액 100 ㎕를 파쇄물 100 ㎕와 혼합한 다음, 이 혼합물을 30℃에서 30분간 인큐베이션함으로써 수행하였다. 이후, 1 M 소듐 시트레이트 용액 100 ㎕를 첨가한 다음, 격렬히 보텍싱하였다. LB 배지 1 mL을 첨가한 후, 세포 현탁액을 37℃에서 1시간 동안 인큐베이션한 다음, 50 ㎍/mL 카나마이신을 포함하는 LB 한천 접시에 세포를 살포하였다. 항생제의 존재 하에 생장할 수 있는 클론은 표 13에 열거된 프라이머를 사용하여 원하는 결손을 포함하는지 콜로니 PCR로 확인하였다. 각각의 유전자 결손의 도입 후, 항생제 마커는 전술한 바와 같이 그리고 (Cherepanov & Wackernagel, 1995)의 방법에 따라 제거하였다.
말릴-CoA 신테타제, 말릴-CoA 리덕타제, 및 DHB 데하이드로게나제를 공동-발현하는 플라스미드 (pEXT20-MCS-DHB 또는 pACT3-MCS-DHB); 또는 말릴-CoA 리아제, 말릴-CoA 리덕타제, 및 DHB 데하이드로게나제를 공동-발현하는 플라스미드 (pEXT20-MCL-DHB 또는 pACT3-MCL-DHB); 또는 빈 대조군 플라스미드 (pEXT20 또는 pACT3)는 단독으로, 또는 플라스미드 pACT3-aceA, pACT3-ppc, pACT3-galP, pACT3-pck 또는 pACT3-pyc 중 하나와 함께 최적화된 숙주 균주에 형질변환하였다. DHB-경로 효소를 발현하는 플라스미드, 및 보충 경로(anaplerotic) 효소를 발현하는 플라스미드를 둘 다 포함하는 형질변환체는 클로람페니콜 (25 ㎍/mL) 및 카나마이신 (50 ㎍/mL)을 포함하는 고형 LB 배지 상에서 선별하였다. 구축된 균주에 대한 비-배제적인 예는 표 13에 열거되어 있다.
DHB 제조를 위해 제작된 균주의 예
균주 관련된 유전형
MG1655 야생형
ECE50 pEXT20-MCS-DHB
ECE51 pACT3-MCS-DHB
ECE52 pEXT20-MCL-DHB
ECE53 pACT3-MCL-DHB
ECE54 △ldhA △adhE △pta-ack △pflB
pEXT20-MCS-DHB
ECE55 △ldhA △adhE △pta-ack △pflB
pACT3-MCS-DHB
ECE56 △ldhA △adhE △pta-ack △pflB
pACT3-MCS-DHB, pACT3-ppc
ECE57 △ldhA △adhE △pta-ack △pflB △poxB
pEXT20-MCS-DHB
ECE58 △ldhA △adhE △pta-ack △pflB △poxB
pACT3-MCS-DHB
ECE59 △ldhA △adhE △pta-ack △pflB △poxB
pEXT20-MCS-DHB, pACT3-ppc
ECE60 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA
pEXT20-MCS-DHB
ECE61 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA
pACT3-MCS-DHB
ECE62 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA
pEXT20-MCS-DHB, pACT3-ppc
ECE63 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △pts
pEXT20-MCS-DHB
ECE64 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA△pts
pACT3-MCS-DHB
ECE65 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA△pts
pEXT20-MCS-DHB, pACT3-ppc
ECE66 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △pts △frdBC
pEXT20-MCS-DHB
ECE67 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △pts △frdBC
pACT3-MCS-DHB
ECE68 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △pts △frdBC
pEXT20-MCS-DHB, pACT3-ppc
ECE69 △pta △iclR △aceB
pACT3-MCL-DHB
ECE70 △pta △iclR △aceB
ECE71 △pta △iclR △aceB △adhE
pACT3-MCL-DHB
ECE72 △pta △iclR △aceB △adhE
ECE73 △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB
pEXT20-MCS-DHB, pACT3- MCL-DHB
ECE74 △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB △pts
pEXT20-MCS-DHB, pACT3- MCL-DHB
ECE75 △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB △pts △pgi
pEXT20-MCS-DHB, pACT3- MCL-DHB
ECE76 △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB △pgi
pEXT20-MCS-DHB, pACT3- MCL-DHB
ECE77 △ldhA △adhE △pta-ack △poxB △maeB △sfcA △mdh △mqo △iclR △aceB △ghrAB
pEXT20-MCS-DHB, pACT3- MCL-DHB
ECE78
ECE79 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA aspC
pEXT20-MCS-DHB, pACT3-ppc
ECE80 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △aspC △iclR △aceB
pEXT20-MCS-DHB, pACT3-ppc
ECE81 △ldhA △adhE △pta-ack △pflB △poxB △maeB △sfcA △aspC △iclR △aceB △ghrAB
pEXT20-MCS-DHB, pACT3-ppc
실시예 8: 합성 말릴- CoA 경로에 의한 DHB 자이모틱 ( zymotic ) 제조에 대한 설명
균주 및 배양 조건: 서열 번호 203으로 표시되는 플라스미드 pACT3-MCL-DHB 유래의 DHB 경로를 발현하는 ECE29 균주 (본 실험에서 야생형 Mcr 효소는 Mcr Tyr206Pro 돌연변이체로 대체하였음)와, 빈 플라스미드 pACT3만을 포함하는 동종(isogenic) 대조군 균주 ECE70으로 실험을 수행하였다. 37℃, 170 rpm으로 운행되는 인포스(Infors) 회전 쉐이커에서 모든 배양을 수행하였다. 글리세롤 스탁 유래의 하룻밤 배양물 (테스트 튜브 내 3 mL 매질)을 접종하였으며, 이를 이용하여 500 mL 쉐이크 플라스크 내 100 mL 증식 배양물의 OD600을 0.05로 적정하였다. 배양 배지의 OD600이 1에 도달했을 때, IPTG를 1 mmol/L의 농도로 첨가하였다. 성장 미네랄 배지의 조성은 실시예 2에 제공되어 있다.
LC - MS / MS 분석에 의한 DHB 농도 측정: DHB는 LC-MS에 의해 정량화하였다: 액체 음이온 교환 크로마토그래피는 자동 용리액(automatic eluent) (KOH) 발생기 시스템 (RFIC, Dionex), 및 샘플을 4℃에 유지시키는 오토샘플러 (AS50, Dionex)를 구비한, Dionex (Sunnyvale, USA)의 ICS-3000 시스템에서 수행하였다. 분석물은 AG11 HC (50 x 2 mm, Dionex) 예비-컬럼에 의해 보호된 IonPac AS11 HC (250 x 2 mm, Dionex) 컬럼 상에서 분리하였다. 컬럼 온도는 25℃로 유지시켰으며, 유속은 0.25 mL/min로 유지시켰고, 분석물은 전술한 KOH 구배를 적용함으로써 용리하였다 (Groussac E, Ortiz M & Francois J (2000) Improved protocols for quantitative determination of metabolites from biological samples using high performance ionic-exchange chromatography with conductimetric and pulsed amperometric detection. 효소. Microb . Technol . 26, 715-723). 주입된 샘플 부피는 15 ㎕였다. 백그라운드를 배제하기 위해, ASRS ultra II (2 mm, 익스터널 워터 모드(external water mode), 75 mA) 음이온 서프레서(anion suppressor)를 사용하였다. 분석물은 ESI mode (스플릿(split)은 1/3였으며, 질소 압력은 90 psi였고, 모세관 전압(capillary voltage)은 3.5 kV였고, 프로브 온도는 450℃였음)에서 진행되는 질량-감수성 검출기(mass-sensitive detector)(MSQ Plus, Thermo)에서 정량화하였다.
결과: 24시간 배양한 후, ECE69 및 ECE70 균주의 상층액은 각각 0.05 mM DHB 및 0 mM DHB를 포함하였으며, 이는 합성 경로를 통해 DHB가 생성되었음을 의미한다.
SEQUENCE LISTING <110> ADISSEO FRANCE SAS <120> A method of production of 2,4-dihydroxybutyric acid <130> BR078701 <150> PCT/IB 2012/001123 <151> 2012-04-26 <160> 203 <170> PatentIn version 3.5 <210> 1 <211> 324 <212> PRT <213> Methylobacter extorquens <400> 1 Met Ser Phe Thr Leu Ile Gln Gln Ala Thr Pro Arg Leu His Arg Ser 1 5 10 15 Glu Leu Ala Val Pro Gly Ser Asn Pro Thr Phe Met Glu Lys Ser Ala 20 25 30 Ala Ser Lys Ala Asp Val Ile Phe Leu Asp Leu Glu Asp Ala Val Ala 35 40 45 Pro Asp Asp Lys Glu Gln Ala Arg Lys Asn Ile Ile Gln Ala Leu Asn 50 55 60 Asp Leu Asp Trp Gly Asn Lys Thr Met Met Ile Arg Ile Asn Gly Leu 65 70 75 80 Asp Thr His Tyr Met Tyr Arg Asp Val Val Asp Ile Val Glu Ala Cys 85 90 95 Pro Arg Leu Asp Met Ile Leu Ile Pro Lys Val Gly Val Pro Ala Asp 100 105 110 Val Tyr Ala Ile Asp Val Leu Thr Thr Gln Ile Glu Gln Ala Lys Lys 115 120 125 Arg Glu Lys Lys Ile Gly Phe Glu Val Leu Ile Glu Thr Ala Leu Gly 130 135 140 Met Ala Asn Val Glu Ala Ile Ala Thr Ser Ser Lys Arg Leu Glu Ala 145 150 155 160 Met Ser Phe Gly Val Ala Asp Tyr Ala Ala Ser Thr Arg Ala Arg Ser 165 170 175 Thr Val Ile Gly Gly Val Asn Ala Asp Tyr Ser Val Leu Thr Asp Lys 180 185 190 Asp Glu Ala Gly Asn Arg Gln Thr His Trp Gln Asp Pro Trp Leu Phe 195 200 205 Ala Gln Asn Arg Met Leu Val Ala Cys Arg Ala Tyr Gly Leu Arg Pro 210 215 220 Ile Asp Gly Pro Phe Gly Asp Phe Ser Asp Pro Asp Gly Tyr Thr Ser 225 230 235 240 Ala Ala Arg Arg Cys Ala Ala Leu Gly Phe Glu Gly Lys Trp Ala Ile 245 250 255 His Pro Ser Gln Ile Asp Leu Ala Asn Glu Val Phe Thr Pro Ser Glu 260 265 270 Ala Glu Val Thr Lys Ala Arg Arg Ile Leu Glu Ala Met Glu Glu Ala 275 280 285 Ala Lys Ala Gly Arg Gly Ala Val Ser Leu Asp Gly Arg Leu Ile Asp 290 295 300 Ile Ala Ser Ile Arg Met Ala Glu Ala Leu Ile Gln Lys Ala Asp Ala 305 310 315 320 Met Gly Gly Lys <210> 2 <211> 975 <212> DNA <213> Methylobacter extorquens <400> 2 atgagcttca ccctgatcca gcaggccacc ccgcgcctgc accgctcgga actcgcggtt 60 cccggctcca acccgacctt catggagaag tcggccgcct cgaaggccga cgtgatcttc 120 ctcgacctcg aggacgcggt tgcgcccgac gacaaggagc aggcccgcaa gaacatcatc 180 caggccctca acgacctgga ttggggcaac aagaccatga tgatccgcat caacggtctc 240 gacacccact acatgtaccg cgacgtggtg gacatcgtgg aggcctgccc gcgcctcgac 300 atgatcctga tccccaaggt cggcgtgccg gccgacgtct acgccatcga cgtgctgacg 360 acgcagatcg agcaggccaa gaagcgcgag aagaagatcg gcttcgaggt gctgatcgag 420 accgcgctcg gcatggccaa tgtcgaggcg atcgcgacct cgtctaagcg ccttgaggcg 480 atgtccttcg gtgtcgccga ctacgccgct tccacccgcg cccgctccac cgtgatcggc 540 ggcgtcaacg ccgattacag cgtgctcacc gacaaggacg aggccggcaa ccgccagacc 600 cactggcagg atccgtggct gttcgcccag aaccgcatgc tggtcgcctg ccgcgcctac 660 ggcctgcgcc cgatcgacgg tcccttcggc gacttctccg atccggacgg ctacacctcg 720 gccgctcgcc gctgcgccgc gctcggcttc gagggcaagt gggcgatcca cccctcgcag 780 atcgatctcg ccaacgaggt cttcaccccc tccgaggccg aggtcaccaa ggcccgccgc 840 atcctggaag ccatggaaga ggccgccaag gccggccgcg gcgccgtctc gctcgacggc 900 cgtctcatcg acatcgcctc gatccgcatg gccgaggcgc tgatccagaa ggccgacgcg 960 atgggcggaa agtaa 975 <210> 3 <211> 975 <212> DNA <213> Methylobacter extorquens <400> 3 atgtcgttta ccctgattca gcaagcgact ccgcgcttac atcgcagcga acttgcggtt 60 ccgggttcaa atccgacctt tatggagaaa tcagcagcca gcaaggccga tgtcatcttc 120 ttggatctgg aggatgccgt tgcacctgat gacaaagaac aggcgcgtaa gaacatcatt 180 caggcactga acgatctgga ctggggcaac aaaacgatga tgatccgcat taacggtctg 240 gacacccact acatgtatcg ggatgtggtc gacatcgtag aagcatgccc tcgcctggat 300 atgattctca ttcccaaagt cggagtacca gcagacgtgt atgcgattga tgtgctgacg 360 acgcaaatcg aacaggcgaa gaaacgggag aagaaaatcg gattcgaggt gctcattgaa 420 acggctttag gcatggccaa tgttgaagcc atcgccacat cttcgaaacg cttggaagcg 480 atgtcgtttg gtgtggccga ttatgcagca tccactcgtg cccgtagtac cgtgattggt 540 ggtgtgaatg cggattactc cgttctcact gacaaagatg aagcagggaa ccgtcaaacc 600 cattggcaag atccgtggct gtttgcgcag aatcgcatgc tggttgcttg ccgtgcttac 660 gggcttcgcc cgattgatgg gccatttggc gacttcagcg atcccgatgg ctataccagt 720 gctgcgcgtc gttgtgcggc gctgggcttt gaaggcaaat gggcgattca cccgagtcag 780 atcgacttag cgaacgaggt gttcacaccg tctgaagctg aagtcaccaa agcgcgccgc 840 attctggagg caatggaaga agcggccaaa gccggtcgtg gcgctgtaag cctggacggt 900 cgcttgattg acatcgccag cattcgcatg gctgaagccc tgatccagaa agcggatgca 960 atgggcggca aataa 975 <210> 4 <211> 348 <212> PRT <213> Rhodobacter capsulatus <400> 4 Met Leu Gln Ala Gln Lys Phe Leu Ala Arg Arg Ser Ala Thr Ile Tyr 1 5 10 15 Arg Lys Arg Asn Ala Ser Arg Asn Phe Ile Ala Glu Arg Gln Met Ser 20 25 30 Phe Arg Thr Gln Pro Pro Ala Pro Ala Arg Leu Asn Arg Cys Gln Leu 35 40 45 Phe Gly Pro Gly Ser Arg Pro Ala Ile Phe Glu Lys Met Ala Gln Ser 50 55 60 Ala Ala Asp Val Ile Asn Leu Asp Leu Glu Asp Ser Val Ala Pro Asp 65 70 75 80 Asp Lys Pro Gln Ala Arg Arg Asn Ile Ile Glu Ala Ser His Asn Ile 85 90 95 Asp Trp Gly Asn Lys Tyr Leu Ser Val Arg Ile Asn Gly Leu Asp Thr 100 105 110 Pro Phe Trp Tyr Arg Asp Val Val Glu Leu Leu Glu Asp Gly Ser Glu 115 120 125 Arg Ile Asp Gln Ile Met Ile Pro Lys Val Gly Cys Ala Ala Asp Val 130 135 140 Tyr Ala Val Asp Ala Leu Val Thr Ala Ile Glu Ala Ala Lys Gly Arg 145 150 155 160 Lys Lys Arg Ile Ser Leu Glu Val Ile Ile Glu Ser Ala Ala Gly Ile 165 170 175 Ala His Val Glu Glu Ile Ala Ala Ala Ser Pro Arg Leu Gln Ala Met 180 185 190 Ser Leu Gly Ala Ala Asp Phe Ala Ala Ser Met Gly Met Ala Thr Thr 195 200 205 Gly Ile Gly Gly Thr Gln Glu Asn Tyr Tyr Met Leu His Ala Gly Val 210 215 220 Lys His Trp Ser Asp Pro Trp His Trp Ala Gln Ala Ala Ile Val Ala 225 230 235 240 Ala Cys Arg Thr His Gly Ile Leu Pro Val Asp Gly Pro Phe Gly Asp 245 250 255 Phe Ser Asp Asp Glu Gly Phe Arg Ala Gln Ala Leu Arg Ser Ala Thr 260 265 270 Leu Gly Met Val Gly Lys Trp Ala Ile His Pro Lys Gln Val Ala Leu 275 280 285 Ala Asn Glu Val Phe Thr Pro Ser Asp Ala Ala Val Ala Glu Ala Arg 290 295 300 Glu Ile Leu Ala Ala Met Glu Lys Ala Lys Ala Glu Gly Ala Gly Ala 305 310 315 320 Thr Val Tyr Lys Gly Arg Leu Val Asp Ile Ala Ser Ile Arg Gln Ala 325 330 335 Glu Val Ile Val Arg Gln Ala Glu Met Ala Lys Val 340 345 <210> 5 <211> 1047 <212> DNA <213> Rhodobacter capsulatus <400> 5 atgctgcagg cgcagaaatt ccttgcacgc cgcagcgcaa caatatatcg caaacgcaac 60 gcatcccgta acttcattgc cgagagacag atgagcttcc gcacccagcc ccctgccccc 120 gcccgcctca accgctgcca gctgttcggg ccgggttcgc gtccggcgat ctttgaaaag 180 atggcgcaat cggcggccga tgtgatcaac ctcgacctgg aagactcggt ggcgcccgac 240 gacaagccgc aggcgcggcg caacatcatc gaggccagcc acaacatcga ctggggcaac 300 aaatatctgt cggtgcggat caacgggctg gatacgccgt tctggtatcg cgacgtggtc 360 gagctgctgg aagacgggtc cgagcgcatc gaccagatca tgatcccgaa agtgggctgc 420 gccgccgacg tttacgccgt cgatgcgctg gtcaccgcga tcgaggccgc caagggccgg 480 aagaaacgca tctcgctgga agtgatcatc gaatcggccg cgggcatcgc ccatgtcgag 540 gaaatcgcgg ccgcctcgcc gcggctgcag gcgatgagcc ttggcgcggc ggatttcgcg 600 gcctccatgg gcatggccac caccggtatc ggcggcacgc aggaaaacta ctacatgctg 660 catgcgggcg tgaaacattg gtcggacccc tggcactggg cgcaggccgc catcgtcgcc 720 gcctgccgca cccatggcat cctgccggtc gatggcccgt ttggcgattt ctccgatgac 780 gagggcttcc gggcccaggc cttgcggtcg gcgacgctcg gcatggtcgg caaatgggcg 840 atccacccga aacaggtcgc tttggcgaac gaggtcttca ccccctctga cgctgcggtt 900 gcagaggcgc gggaaattct ggcggcgatg gaaaaggcca aggccgaggg cgccggcgcc 960 accgtctaca aggggcggct ggtcgatatt gcctcgatcc ggcaggcgga agtgattgtc 1020 agacaggcgg aaatggctaa ggtctga 1047 <210> 6 <211> 1047 <212> DNA <213> Rhodobacter capsulatus <400> 6 atgcttcagg cgcagaaatt cctggcacgt cgttctgcga cgatttaccg caaacgtaat 60 gcctcccgga acttcattgc cgagcgccag atgtcgtttc gtacccaacc accggctcct 120 gcccgtctga atcgctgcca gctgtttggc ccaggttctc gtcctgcgat cttcgagaaa 180 atggctcaga gtgcagcgga tgtgatcaat ctggatctgg aggacagcgt cgctccggat 240 gataagcccc aagcccgccg caatatcatt gaagcgtcac acaacattga ctggggtaac 300 aagtatctga gcgttcgtat taacggctta gacacgccgt tctggtatcg ggatgtcgtg 360 gagttgctgg aagatggtag cgaacgtatc gaccagatta tgatcccgaa ggtaggttgc 420 gcagcggacg tatatgccgt ggatgcttta gttaccgcga tcgaagccgc taaaggtcgc 480 aagaaacgca tttccctgga agtgatcatc gaaagtgcag ctgggattgc ccatgtggaa 540 gaaatcgccg ctgcctctcc acgcttgcag gcgatgagct taggagcagc ggactttgcc 600 gcgtcgatgg gtatggccac aaccggcatt ggcgggactc aggagaacta ctatatgctg 660 catgcgggcg tgaaacactg gagtgatccc tggcattggg cacaggccgc aattgtggcg 720 gcatgtcgca cgcatgggat tctgccggtt gatggcccgt ttggcgattt ctccgatgac 780 gaaggctttc gtgcacaggc acttcgttcg gcgactctgg gtatggtggg caaatgggcc 840 attcacccga aacaagtggc tctcgcaaac gaggtattta ccccgtcaga tgcggcggtt 900 gcggaagcgc gcgaaatctt ggccgcaatg gagaaagcca aagcggaagg agcgggagct 960 accgtctaca aaggtcgcct cgtcgatatc gcgagcattc gccaagcaga agttattgtt 1020 cgccaagcgg aaatggccaa agtctaa 1047 <210> 7 <211> 359 <212> PRT <213> sulfolobus tokodaii <400> 7 Met Ile Leu Met Arg Arg Thr Leu Lys Ala Ala Ile Leu Gly Ala Thr 1 5 10 15 Gly Leu Val Gly Ile Glu Tyr Val Arg Met Leu Ser Asn His Pro Tyr 20 25 30 Ile Lys Pro Ala Tyr Leu Ala Gly Lys Gly Ser Val Gly Lys Pro Tyr 35 40 45 Gly Glu Val Val Arg Trp Gln Thr Val Gly Gln Val Pro Lys Glu Ile 50 55 60 Ala Asp Met Glu Ile Lys Pro Thr Asp Pro Lys Leu Met Asp Asp Val 65 70 75 80 Asp Ile Ile Phe Ser Pro Leu Pro Gln Gly Ala Ala Gly Pro Val Glu 85 90 95 Glu Gln Phe Ala Lys Glu Gly Phe Pro Val Ile Ser Asn Ser Pro Asp 100 105 110 His Arg Phe Asp Pro Asp Val Pro Leu Leu Val Pro Glu Leu Asn Pro 115 120 125 His Thr Ile Ser Leu Ile Asp Glu Gln Arg Lys Arg Arg Glu Trp Lys 130 135 140 Gly Phe Ile Val Thr Thr Pro Leu Cys Thr Ala Gln Gly Ala Ala Ile 145 150 155 160 Pro Leu Gly Ala Ile Phe Lys Asp Tyr Lys Met Asp Gly Ala Phe Ile 165 170 175 Thr Thr Ile Gln Ser Leu Ser Gly Ala Gly Tyr Pro Gly Ile Pro Ser 180 185 190 Leu Asp Val Val Asp Asn Ile Leu Pro Leu Gly Asp Gly Tyr Asp Ala 195 200 205 Lys Thr Ile Lys Glu Ile Phe Arg Ile Leu Ser Glu Val Lys Arg Asn 210 215 220 Val Asp Glu Pro Lys Leu Glu Asp Val Ser Leu Ala Ala Thr Thr His 225 230 235 240 Arg Ile Ala Thr Ile His Gly His Tyr Glu Val Leu Tyr Val Ser Phe 245 250 255 Lys Glu Glu Thr Ala Ala Glu Lys Val Lys Glu Thr Leu Glu Asn Phe 260 265 270 Arg Gly Glu Pro Gln Asp Leu Lys Leu Pro Thr Ala Pro Ser Lys Pro 275 280 285 Ile Ile Val Met Asn Glu Asp Thr Arg Pro Gln Val Tyr Phe Asp Arg 290 295 300 Trp Ala Gly Asp Ile Pro Gly Met Ser Val Val Val Gly Arg Leu Lys 305 310 315 320 Gln Val Asn Lys Arg Met Ile Arg Leu Val Ser Leu Ile His Asn Thr 325 330 335 Val Arg Gly Ala Ala Gly Gly Gly Ile Leu Ala Ala Glu Leu Leu Val 340 345 350 Glu Lys Gly Tyr Ile Glu Lys 355 <210> 8 <211> 1080 <212> DNA <213> sulfolobus tokodaii <400> 8 gtgatactca tgaggagaac attaaaagcc gcaatattag gtgctactgg tttagtagga 60 atcgaatacg taagaatgct atcaaatcat ccttatatta aaccagcata tttagctgga 120 aaaggttcag tgggtaaacc gtatggtgag gtagtaagat ggcaaacagt aggacaagtt 180 cctaaggaaa tagctgatat ggaaataaaa ccaactgatc ctaagttaat ggatgatgta 240 gacataatat tttctccatt acctcaaggt gctgctggcc cagtagaaga acaatttgca 300 aaagaaggat tccctgtgat tagtaattca ccagatcata gatttgatcc tgatgttccc 360 ttattggttc ctgaactaaa tcctcatact attagcttaa ttgatgagca aagaaaaaga 420 agagaatgga aaggatttat agtaactaca ccactatgca cagcccaggg tgcagcaata 480 ccattaggtg ctatatttaa agattataag atggatggag catttataac tactattcaa 540 tcgctatctg gtgccggtta tccaggaata ccatcattag atgtagtaga taatatcttg 600 cctttaggtg atggatacga tgccaagacg ataaaagaga tcttcagaat tttaagcgaa 660 gttaagagaa atgtagatga acctaaatta gaagatgtaa gcttagcagc aacaactcat 720 agaatagcta ctatacatgg tcattatgaa gtactatatg tatcgttcaa agaggaaact 780 gctgctgaaa aagttaagga gactttagaa aactttagag gggaaccaca agatctaaaa 840 ttaccaactg caccttcaaa gccaattatc gttatgaatg aggatacaag acctcaagtc 900 tattttgata gatgggctgg ggatattcca ggaatgagtg tagttgtagg tagattaaag 960 caagtgaata agagaatgat aaggttagta tcattaattc ataacacggt cagaggagcc 1020 gcaggaggag gtatattagc agctgaatta cttgtcgaaa aaggatatat tgaaaagtaa 1080 <210> 9 <211> 1080 <212> DNA <213> sulfolobus tokodaii <400> 9 atgattctga tgcgccgtac cctgaaagcg gcaatcttgg gtgccaccgg cttagtcggg 60 attgagtacg tacggatgct gagcaatcat ccgtacatca aacccgccta tctggctggg 120 aaagggtcag ttggcaaacc gtatggcgaa gtagtgcgct ggcagactgt gggccaagtt 180 cccaaagaaa ttgccgatat ggaaatcaag ccgactgatc cgaaactgat ggatgatgtt 240 gacatcatct ttagcccact gcctcaaggt gcggcaggac ccgttgagga acaatttgcg 300 aaagaaggat ttccggtcat ttccaattct ccggatcatc ggtttgatcc ggatgtccca 360 ctcctggtgc cagaactgaa tccgcacacc attagcctta ttgacgaaca gcgtaaacgc 420 cgtgaatgga aaggcttcat cgttacgacg ccgttatgca ccgcacaggg tgctgcgatc 480 ccattgggtg ccatcttcaa ggactacaaa atggatggcg cattcattac gaccattcag 540 tctcttagcg gtgcgggata tccgggtatt ccgtccctgg atgtggtgga taacattctg 600 cctttagggg acggttatga cgccaaaacg atcaaggaaa ttttccgcat cctgagtgaa 660 gtgaaacgca atgtggacga acctaaactg gaggacgttt cactggccgc cacaacccat 720 cgcattgcaa ccattcatgg ccactatgag gtgttgtacg tgtcgtttaa ggaagaaaca 780 gcagcggaga aggtcaaaga aacgctggaa aactttcgcg gtgaacctca ggatctcaaa 840 ctgccgacag cgccctcgaa accgatcatt gtgatgaacg aagatactcg cccacaggta 900 tatttcgatc gttgggcggg cgacattccg ggcatgagtg tcgttgttgg ccgtctgaaa 960 caggtcaaca aacgcatgat tcgtctggta tcgcttatcc acaacaccgt acgtggtgct 1020 gcgggcggtg ggattttagc tgcggagttg ctcgtggaga aaggctacat cgagaagtaa 1080 <210> 10 <211> 451 <212> PRT <213> Porphyromonas gingivalis <400> 10 Met Glu Ile Lys Glu Met Val Ser Leu Ala Arg Lys Ala Gln Lys Glu 1 5 10 15 Tyr Gln Ala Thr His Asn Gln Glu Ala Val Asp Asn Ile Cys Arg Ala 20 25 30 Ala Ala Lys Val Ile Tyr Glu Asn Ala Ala Ile Leu Ala Arg Glu Ala 35 40 45 Val Asp Glu Thr Gly Met Gly Val Tyr Glu His Lys Val Ala Lys Asn 50 55 60 Gln Gly Lys Ser Lys Gly Val Trp Tyr Asn Leu His Asn Lys Lys Ser 65 70 75 80 Ile Gly Ile Leu Asn Ile Asp Glu Arg Thr Gly Met Ile Glu Ile Ala 85 90 95 Lys Pro Ile Gly Val Val Gly Ala Val Thr Pro Thr Thr Asn Pro Ile 100 105 110 Val Thr Pro Met Ser Asn Ile Ile Phe Ala Leu Lys Thr Cys Asn Ala 115 120 125 Ile Ile Ile Ala Pro His Pro Arg Ser Lys Lys Cys Ser Ala His Ala 130 135 140 Val Arg Leu Ile Lys Glu Ala Ile Ala Pro Phe Asn Val Pro Glu Gly 145 150 155 160 Met Val Gln Ile Ile Glu Glu Pro Ser Ile Glu Lys Thr Gln Glu Leu 165 170 175 Met Gly Ala Val Asp Val Val Val Ala Thr Gly Gly Met Gly Met Val 180 185 190 Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ser Phe Gly Val Gly Ala Gly 195 200 205 Asn Val Gln Val Ile Val Asp Ser Asn Ile Asp Phe Glu Ala Ala Ala 210 215 220 Glu Lys Ile Ile Thr Gly Arg Ala Phe Asp Asn Gly Ile Ile Cys Ser 225 230 235 240 Gly Glu Gln Ser Ile Ile Tyr Asn Glu Ala Asp Lys Glu Ala Val Phe 245 250 255 Thr Ala Phe Arg Asn His Gly Ala Tyr Phe Cys Asp Glu Ala Glu Gly 260 265 270 Asp Arg Ala Arg Ala Ala Ile Phe Glu Asn Gly Ala Ile Ala Lys Asp 275 280 285 Val Val Gly Gln Ser Val Ala Phe Ile Ala Lys Lys Ala Asn Ile Asn 290 295 300 Ile Pro Glu Gly Thr Arg Ile Leu Val Val Glu Ala Arg Gly Val Gly 305 310 315 320 Ala Glu Asp Val Ile Cys Lys Glu Lys Met Cys Pro Val Met Cys Ala 325 330 335 Leu Ser Tyr Lys His Phe Glu Glu Gly Val Glu Ile Ala Arg Thr Asn 340 345 350 Leu Ala Asn Glu Gly Asn Gly His Thr Cys Ala Ile His Ser Asn Asn 355 360 365 Gln Ala His Ile Ile Leu Ala Gly Ser Glu Leu Thr Val Ser Arg Ile 370 375 380 Val Val Asn Ala Pro Ser Ala Thr Thr Ala Gly Gly His Ile Gln Asn 385 390 395 400 Gly Leu Ala Val Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn 405 410 415 Ser Ile Ser Glu Asn Phe Thr Tyr Lys His Leu Leu Asn Ile Ser Arg 420 425 430 Ile Ala Pro Leu Asn Ser Ser Ile His Ile Pro Asp Asp Lys Glu Ile 435 440 445 Trp Glu Leu 450 <210> 11 <211> 1356 <212> DNA <213> Porphyromonas gingivalis <400> 11 atggaaatca aagaaatggt gagccttgca cgcaaggctc agaaggagta tcaagctacc 60 cataaccaag aagcagttga caacatttgc cgagctgcag caaaagttat ttatgaaaat 120 gcagctattc tggctcgcga agcagtagac gaaaccggca tgggcgttta cgaacacaaa 180 gtggccaaga atcaaggcaa atccaaaggt gtttggtaca acctccacaa taaaaaatcg 240 attggtatcc tcaatataga cgagcgtacc ggtatgatcg agattgcaaa gcctatcgga 300 gttgtaggag ccgtaacgcc gacgaccaac ccgatcgtta ctccgatgag caatatcatc 360 tttgctctta agacctgcaa tgccatcatt attgcccccc accccagatc caaaaaatgc 420 tctgcacacg cagttcgtct gatcaaagaa gctatcgctc cgttcaacgt accggaaggt 480 atggttcaga tcatcgaaga acccagcatc gagaagacgc aggaactcat gggcgccgta 540 gacgtagtag ttgctacggg tggtatgggc atggtgaagt ctgcatattc ttcaggaaag 600 ccttctttcg gtgttggagc cggtaacgtt caggtgatcg tggatagcaa catcgatttc 660 gaagctgctg cagaaaaaat catcaccggt cgtgctttcg acaacggtat catctgctca 720 ggcgaacaga gcatcatcta caacgaggct gacaaggaag cagttttcac agcattccgc 780 aaccacggtg catatttctg tgacgaagcc gaaggagatc gggctcgtgc agctatcttc 840 gaaaatggag ccatcgcgaa agatgtagta ggtcagagcg ttgccttcat tgccaagaaa 900 gcaaacatca atatccccga gggtacccgt attctcgttg ttgaagctcg cggcgtagga 960 gcagaagacg ttatctgtaa ggaaaagatg tgtcccgtaa tgtgcgccct cagctacaag 1020 cacttcgaag aaggtgtaga aatcgcacgt acgaacctcg ccaacgaagg taacggccac 1080 acctgtgcta tccactccaa caatcaggca cacatcatcc tcgcaggatc agagctgacg 1140 gtatctcgta tcgtagtgaa tgctccgagt gccactacag caggcggtca catccaaaac 1200 ggtcttgccg taaccaatac gctcggatgc ggatcatggg gtaataactc tatctccgag 1260 aacttcactt acaagcacct cctcaacatt tcacgcatcg caccgttgaa ttcaagcatt 1320 cacatccccg atgacaaaga aatctgggaa ctctaa 1356 <210> 12 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 12 tataatgagc tcgtttaact ttaagaagga gatataccat gattctgatg cgccgt 56 <210> 13 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 13 tataatggat ccctcgaatt cttacttctc 30 <210> 14 <211> 312 <212> PRT <213> Saccharomyces cerevisiae <400> 14 Met Pro Ala Thr Leu Lys Asn Ser Ser Ala Thr Leu Lys Leu Asn Thr 1 5 10 15 Gly Ala Ser Ile Pro Val Leu Gly Phe Gly Thr Trp Arg Ser Val Asp 20 25 30 Asn Asn Gly Tyr His Ser Val Ile Ala Ala Leu Lys Ala Gly Tyr Arg 35 40 45 His Ile Asp Ala Ala Ala Ile Tyr Leu Asn Glu Glu Glu Val Gly Arg 50 55 60 Ala Ile Lys Asp Ser Gly Val Pro Arg Glu Glu Ile Phe Ile Thr Thr 65 70 75 80 Lys Leu Trp Gly Thr Glu Gln Arg Asp Pro Glu Ala Ala Leu Asn Lys 85 90 95 Ser Leu Lys Arg Leu Gly Leu Asp Tyr Val Asp Leu Tyr Leu Met His 100 105 110 Trp Pro Val Pro Leu Lys Thr Asp Arg Val Thr Asp Gly Asn Val Leu 115 120 125 Cys Ile Pro Thr Leu Glu Asp Gly Thr Val Asp Ile Asp Thr Lys Glu 130 135 140 Trp Asn Phe Ile Lys Thr Trp Glu Leu Met Gln Glu Leu Pro Lys Thr 145 150 155 160 Gly Lys Thr Lys Ala Val Gly Val Ser Asn Phe Ser Ile Asn Asn Ile 165 170 175 Lys Glu Leu Leu Glu Ser Pro Asn Asn Lys Val Val Pro Ala Thr Asn 180 185 190 Gln Ile Glu Ile His Pro Leu Leu Pro Gln Asp Glu Leu Ile Ala Phe 195 200 205 Cys Lys Glu Lys Gly Ile Val Val Glu Ala Tyr Ser Pro Phe Gly Ser 210 215 220 Ala Asn Ala Pro Leu Leu Lys Glu Gln Ala Ile Ile Asp Met Ala Lys 225 230 235 240 Lys His Gly Val Glu Pro Ala Gln Leu Ile Ile Ser Trp Ser Ile Gln 245 250 255 Arg Gly Tyr Val Val Leu Ala Lys Ser Val Asn Pro Glu Arg Ile Val 260 265 270 Ser Asn Phe Lys Ile Phe Thr Leu Pro Glu Asp Asp Phe Lys Thr Ile 275 280 285 Ser Asn Leu Ser Lys Val His Gly Thr Lys Arg Val Val Asp Met Lys 290 295 300 Trp Gly Ser Phe Pro Ile Phe Gln 305 310 <210> 15 <211> 939 <212> DNA <213> Saccharomyces cerevisiae <400> 15 atgcctgcta cgttaaagaa ttcttctgct acattaaaac taaatactgg tgcctccatt 60 ccagtgttgg gtttcggcac ttggcgttcc gttgacaata acggttacca ttctgtaatt 120 gcagctttga aagctggata cagacacatt gatgctgcgg ctatctattt gaatgaagaa 180 gaagttggca gggctattaa agattccgga gtccctcgtg aggaaatttt tattactact 240 aagctttggg gtacggaaca acgtgatccg gaagctgctc taaacaagtc tttgaaaaga 300 ctaggcttgg attatgttga cctatatctg atgcattggc cagtgccttt gaaaaccgac 360 agagttactg atggtaacgt tctgtgcatt ccaacattag aagatggcac tgttgacatc 420 gatactaagg aatggaattt tatcaagacg tgggagttga tgcaagagtt gccaaagacg 480 ggcaaaacta aagccgttgg tgtctctaat ttttctatta acaacattaa agaattatta 540 gaatctccaa ataacaaggt ggtaccagct actaatcaaa ttgaaattca tccattgcta 600 ccacaagacg aattgattgc cttttgtaag gaaaagggta ttgttgttga agcctactca 660 ccatttggga gtgctaatgc tcctttacta aaagagcaag caattattga tatggctaaa 720 aagcacggcg ttgagccagc acagcttatt atcagttgga gtattcaaag aggctacgtt 780 gttctggcca aatcggttaa tcctgaaaga attgtatcca attttaagat tttcactctg 840 cctgaggatg atttcaagac tattagtaac ctatccaaag tgcatggtac aaagagagtc 900 gttgatatga agtggggatc cttcccaatt ttccaatga 939 <210> 16 <211> 360 <212> PRT <213> Metallosphaera sedula <400> 16 Met Lys Ala Ala Val Leu His Thr Tyr Lys Glu Pro Leu Ser Ile Glu 1 5 10 15 Asp Val Asn Ile Ser Gln Pro Lys Ala Gly Glu Val Lys Ile Lys Val 20 25 30 Lys Ala Thr Gly Leu Cys His Ser Asp Val Asn Val Phe Glu Gly Lys 35 40 45 Thr Pro Val Pro Pro Pro Val Val Ala Gly His Glu Ile Ser Gly Ile 50 55 60 Val Glu Glu Val Gly Pro Gly Val Thr Arg Val Lys Pro Gly Asp Arg 65 70 75 80 Val Ile Ser Ala Phe Ile His Pro Cys Gly Lys Cys Gly Asn Cys Val 85 90 95 Ala Gly Lys Glu Asn Leu Cys Glu Thr Phe Ser Gln Val Arg Leu Lys 100 105 110 Gly Val Met Pro Asp Gly Thr Ser Arg Leu Ser Lys Asp Gly Lys Glu 115 120 125 Ile Arg Thr Phe Leu Gly Gly Gly Phe Ala Glu Tyr Ala Ile Val Gly 130 135 140 Glu Asn Ala Leu Thr Arg Val Pro Glu Asp Met Asp Leu Glu Lys Val 145 150 155 160 Ala Val Leu Gly Cys Ala Gly Leu Thr Gly Tyr Gly Ala Ile Ser Ser 165 170 175 Ser Lys Ile Glu Pro Gly Asp Thr Val Ala Val Ile Gly Val Gly Gly 180 185 190 Val Gly Leu Ser Thr Ile Gln Leu Leu Arg Ala Ser Gly Ala Gly Arg 195 200 205 Ile Ile Ala Val Gly Thr Lys Lys Trp Lys Leu Asp Arg Ala Met Glu 210 215 220 Leu Gly Ala Thr Asp Val Val Asn Ser Lys Glu Ile Asp Pro Val Lys 225 230 235 240 Ala Ile Lys Glu Ile Thr Gly Gly Gly Pro Gln Val Val Ile Glu Ala 245 250 255 Gly Gly Asn Glu Asp Thr Ile His Met Ala Leu Asp Ser Val Arg Ile 260 265 270 Gly Gly Lys Val Val Leu Val Gly Leu Pro Pro Ala Thr Ala Met Ile 275 280 285 Pro Ile Arg Val Ala Ser Ile Val Arg Gly Gly Ile Glu Val Val Gly 290 295 300 Asn Tyr Gly Gly Arg Pro Arg Val Asp Met Pro Lys Leu Leu Glu Leu 305 310 315 320 Val Arg Gln Gly Arg Tyr Asp Pro Ser Arg Leu Val Thr Gly Arg Phe 325 330 335 Arg Leu Glu Glu Ile Asn Glu Ala Val Lys Met Leu Glu Glu Gly Glu 340 345 350 Ala Ile Arg Ser Leu Ile Ile Pro 355 360 <210> 17 <211> 1083 <212> DNA <213> Metallosphaera sedula <400> 17 atgaaagctg cagtacttca tacgtataag gaaccgctgt ccattgagga cgtgaatatc 60 tcccaaccta aggctgggga agtcaagatc aaggtcaagg caaccgggct ctgtcactcc 120 gacgtcaatg tctttgaggg gaaaacccca gttcctcccc cagtggttgc tggacacgaa 180 atatcaggga ttgtggagga agtgggacct ggggtgacca gggttaaacc aggtgatagg 240 gtgatttcag cgtttattca cccctgtggt aaatgcggta actgcgttgc aggaaaggag 300 aatctgtgtg agaccttctc ccaggtcaga ctcaagggag taatgccaga tggaacgtca 360 aggctgtcaa aggacggaaa ggagataagg actttccttg gaggcggttt cgcggagtac 420 gccattgtgg gagagaacgc gctaaccagg gttccagagg acatggacct agagaaggta 480 gctgtcctag gttgtgctgg gttaacaggg tacggtgcca tatcatcatc caagattgag 540 cctggagaca ctgtggccgt gataggcgta ggaggagtgg gtttgtccac aatacaactc 600 ctaagggcct cgggtgccgg gaggataatc gccgtgggaa cgaaaaagtg gaaacttgac 660 agggccatgg agctaggtgc aactgacgtg gtaaactcga aggagataga tcccgtcaaa 720 gcaataaagg agatcacggg tggagggcca caggtggtga tagaggctgg aggaaatgag 780 gatacgattc atatggcgct ggattcagtt agaattggag gaaaggtggt tctggtaggg 840 ttacctccag caacggccat gatacccatc agggtagcgt caatagttag gggaggcata 900 gaggttgtgg ggaattacgg aggaagacct agggttgata tgcccaagct tctcgagcta 960 gtgaggcagg gaagatacga tccgtctagg cttgtgacgg gtagattcag gttggaggaa 1020 ataaatgagg cagtcaaaat gcttgaggaa ggagaggcca taagaagtct cataatcccg 1080 taa 1083 <210> 18 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 18 tataatgcta gcatgcctgc tacgttaaag aa 32 <210> 19 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 19 tataatgagc tctcattgga aaattgggaa gg 32 <210> 20 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 20 tataatgaat tcttagcggg cggcttcgta tatacggcgg ctgaca 46 <210> 21 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 21 tatcgtgcta gcatgaacaa ctttaatctg caca 34 <210> 22 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 22 tataatcata tgcaactttt caaactc 27 <210> 23 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 23 tataatggat ccttagtaga gtcttctgta g 31 <210> 24 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 24 tataatgcta gcatgaaagc tgcagtactt ca 32 <210> 25 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 25 tataatgaat tcttacggga ttatgagact tc 32 <210> 26 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <220> <221> misc_feature <222> (23)..(24) <223> n is a, c, g, or t <400> 26 cattctgcct ttaggggacg gcnnkgacgc caaaacg 37 <210> 27 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <220> <221> misc_feature <222> (14)..(15) <223> n is a, c, g, or t <400> 27 cgttttggcg tcmnngccgt cccctaaagg cagaatg 37 <210> 28 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 28 gtcaaggcaa ccggtctctg tcgctccgac gtcaatg 37 <210> 29 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 29 cattgacgtc ggagcgacag agaccggttg ccttgac 37 <210> 30 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 30 ggctctgtca ctccgacgta catgtctttg aggggaaaac 40 <210> 31 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 31 gttttcccct caaagacatg tacgtcggag tgacagagcc 40 <210> 32 <211> 360 <212> PRT <213> Metallosphaera sedula <400> 32 Met Lys Ala Ala Val Leu His Thr Tyr Lys Glu Pro Leu Ser Ile Glu 1 5 10 15 Asp Val Asn Ile Ser Gln Pro Lys Ala Gly Glu Val Lys Ile Lys Val 20 25 30 Lys Ala Thr Gly Leu Cys Arg Ser Asp Val Asn Val Phe Glu Gly Lys 35 40 45 Thr Pro Val Pro Pro Pro Val Val Ala Gly His Glu Ile Ser Gly Ile 50 55 60 Val Glu Glu Val Gly Pro Gly Val Thr Arg Val Lys Pro Gly Asp Arg 65 70 75 80 Val Ile Ser Ala Phe Ile His Pro Cys Gly Lys Cys Gly Asn Cys Val 85 90 95 Ala Gly Lys Glu Asn Leu Cys Glu Thr Phe Ser Gln Val Arg Leu Lys 100 105 110 Gly Val Met Pro Asp Gly Thr Ser Arg Leu Ser Lys Asp Gly Lys Glu 115 120 125 Ile Arg Thr Phe Leu Gly Gly Gly Phe Ala Glu Tyr Ala Ile Val Gly 130 135 140 Glu Asn Ala Leu Thr Arg Val Pro Glu Asp Met Asp Leu Glu Lys Val 145 150 155 160 Ala Val Leu Gly Cys Ala Gly Leu Thr Gly Tyr Gly Ala Ile Ser Ser 165 170 175 Ser Lys Ile Glu Pro Gly Asp Thr Val Ala Val Ile Gly Val Gly Gly 180 185 190 Val Gly Leu Ser Thr Ile Gln Leu Leu Arg Ala Ser Gly Ala Gly Arg 195 200 205 Ile Ile Ala Val Gly Thr Lys Lys Trp Lys Leu Asp Arg Ala Met Glu 210 215 220 Leu Gly Ala Thr Asp Val Val Asn Ser Lys Glu Ile Asp Pro Val Lys 225 230 235 240 Ala Ile Lys Glu Ile Thr Gly Gly Gly Pro Gln Val Val Ile Glu Ala 245 250 255 Gly Gly Asn Glu Asp Thr Ile His Met Ala Leu Asp Ser Val Arg Ile 260 265 270 Gly Gly Lys Val Val Leu Val Gly Leu Pro Pro Ala Thr Ala Met Ile 275 280 285 Pro Ile Arg Val Ala Ser Ile Val Arg Gly Gly Ile Glu Val Val Gly 290 295 300 Asn Tyr Gly Gly Arg Pro Arg Val Asp Met Pro Lys Leu Leu Glu Leu 305 310 315 320 Val Arg Gln Gly Arg Tyr Asp Pro Ser Arg Leu Val Thr Gly Arg Phe 325 330 335 Arg Leu Glu Glu Ile Asn Glu Ala Val Lys Met Leu Glu Glu Gly Glu 340 345 350 Ala Ile Arg Ser Leu Ile Ile Pro 355 360 <210> 33 <211> 1083 <212> DNA <213> Metallosphaera sedula <400> 33 atgaaagctg cagtacttca tacgtataag gaaccgctgt ccattgagga cgtgaatatc 60 tcccaaccta aggctgggga agtcaagatc aaggtcaagg caaccggtct ctgtcgctcc 120 gacgtcaatg tctttgaggg gaaaacccca gttcctcccc cagtggttgc tggacacgaa 180 atatcaggga ttgtggagga agtgggacct ggggtgacca gggttaaacc aggtgatagg 240 gtgatttcag cgtttattca cccctgtggt aaatgcggta actgcgttgc aggaaaggag 300 aatctgtgtg agaccttctc ccaggtcaga ctcaagggag taatgccaga tggaacgtca 360 aggctgtcaa aggacggaaa ggagataagg actttccttg gaggcggttt cgcggagtac 420 gccattgtgg gagagaacgc gctaaccagg gttccagagg acatggacct agagaaggta 480 gctgtcctag gttgtgctgg gttaacaggg tacggtgcca tatcatcatc caagattgag 540 cctggagaca ctgtggccgt gataggcgta ggaggagtgg gtttgtccac aatacaactc 600 ctaagggcct cgggtgccgg gaggataatc gccgtgggaa cgaaaaagtg gaaacttgac 660 agggccatgg agctaggtgc aactgacgtg gtaaactcga aggagataga tcccgtcaaa 720 gcaataaagg agatcacggg tggagggcca caggtggtga tagaggctgg aggaaatgag 780 gatacgattc atatggcgct ggattcagtt agaattggag gaaaggtggt tctggtaggg 840 ttacctccag caacggccat gatacccatc agggtagcgt caatagttag gggaggcata 900 gaggttgtgg ggaattacgg aggaagacct agggttgata tgcccaagct tctcgagcta 960 gtgaggcagg gaagatacga tccgtctagg cttgtgacgg gtagattcag gttggaggaa 1020 ataaatgagg cagtcaaaat gcttgaggaa ggagaggcca taagaagtct cataatcccg 1080 taa 1083 <210> 34 <211> 360 <212> PRT <213> Metallosphaera sedula <400> 34 Met Lys Ala Ala Val Leu His Thr Tyr Lys Glu Pro Leu Ser Ile Glu 1 5 10 15 Asp Val Asn Ile Ser Gln Pro Lys Ala Gly Glu Val Lys Ile Lys Val 20 25 30 Lys Ala Thr Gly Leu Cys His Ser Asp Val His Val Phe Glu Gly Lys 35 40 45 Thr Pro Val Pro Pro Pro Val Val Ala Gly His Glu Ile Ser Gly Ile 50 55 60 Val Glu Glu Val Gly Pro Gly Val Thr Arg Val Lys Pro Gly Asp Arg 65 70 75 80 Val Ile Ser Ala Phe Ile His Pro Cys Gly Lys Cys Gly Asn Cys Val 85 90 95 Ala Gly Lys Glu Asn Leu Cys Glu Thr Phe Ser Gln Val Arg Leu Lys 100 105 110 Gly Val Met Pro Asp Gly Thr Ser Arg Leu Ser Lys Asp Gly Lys Glu 115 120 125 Ile Arg Thr Phe Leu Gly Gly Gly Phe Ala Glu Tyr Ala Ile Val Gly 130 135 140 Glu Asn Ala Leu Thr Arg Val Pro Glu Asp Met Asp Leu Glu Lys Val 145 150 155 160 Ala Val Leu Gly Cys Ala Gly Leu Thr Gly Tyr Gly Ala Ile Ser Ser 165 170 175 Ser Lys Ile Glu Pro Gly Asp Thr Val Ala Val Ile Gly Val Gly Gly 180 185 190 Val Gly Leu Ser Thr Ile Gln Leu Leu Arg Ala Ser Gly Ala Gly Arg 195 200 205 Ile Ile Ala Val Gly Thr Lys Lys Trp Lys Leu Asp Arg Ala Met Glu 210 215 220 Leu Gly Ala Thr Asp Val Val Asn Ser Lys Glu Ile Asp Pro Val Lys 225 230 235 240 Ala Ile Lys Glu Ile Thr Gly Gly Gly Pro Gln Val Val Ile Glu Ala 245 250 255 Gly Gly Asn Glu Asp Thr Ile His Met Ala Leu Asp Ser Val Arg Ile 260 265 270 Gly Gly Lys Val Val Leu Val Gly Leu Pro Pro Ala Thr Ala Met Ile 275 280 285 Pro Ile Arg Val Ala Ser Ile Val Arg Gly Gly Ile Glu Val Val Gly 290 295 300 Asn Tyr Gly Gly Arg Pro Arg Val Asp Met Pro Lys Leu Leu Glu Leu 305 310 315 320 Val Arg Gln Gly Arg Tyr Asp Pro Ser Arg Leu Val Thr Gly Arg Phe 325 330 335 Arg Leu Glu Glu Ile Asn Glu Ala Val Lys Met Leu Glu Glu Gly Glu 340 345 350 Ala Ile Arg Ser Leu Ile Ile Pro 355 360 <210> 35 <211> 1083 <212> DNA <213> Metallosphaera sedula <400> 35 atgaaagctg cagtacttca tacgtataag gaaccgctgt ccattgagga cgtgaatatc 60 tcccaaccta aggctgggga agtcaagatc aaggtcaagg caaccgggct ctgtcactcc 120 gacgtacatg tctttgaggg gaaaacccca gttcctcccc cagtggttgc tggacacgaa 180 atatcaggga ttgtggagga agtgggacct ggggtgacca gggttaaacc aggtgatagg 240 gtgatttcag cgtttattca cccctgtggt aaatgcggta actgcgttgc aggaaaggag 300 aatctgtgtg agaccttctc ccaggtcaga ctcaagggag taatgccaga tggaacgtca 360 aggctgtcaa aggacggaaa ggagataagg actttccttg gaggcggttt cgcggagtac 420 gccattgtgg gagagaacgc gctaaccagg gttccagagg acatggacct agagaaggta 480 gctgtcctag gttgtgctgg gttaacaggg tacggtgcca tatcatcatc caagattgag 540 cctggagaca ctgtggccgt gataggcgta ggaggagtgg gtttgtccac aatacaactc 600 ctaagggcct cgggtgccgg gaggataatc gccgtgggaa cgaaaaagtg gaaacttgac 660 agggccatgg agctaggtgc aactgacgtg gtaaactcga aggagataga tcccgtcaaa 720 gcaataaagg agatcacggg tggagggcca caggtggtga tagaggctgg aggaaatgag 780 gatacgattc atatggcgct ggattcagtt agaattggag gaaaggtggt tctggtaggg 840 ttacctccag caacggccat gatacccatc agggtagcgt caatagttag gggaggcata 900 gaggttgtgg ggaattacgg aggaagacct agggttgata tgcccaagct tctcgagcta 960 gtgaggcagg gaagatacga tccgtctagg cttgtgacgg gtagattcag gttggaggaa 1020 ataaatgagg cagtcaaaat gcttgaggaa ggagaggcca taagaagtct cataatcccg 1080 taa 1083 <210> 36 <211> 360 <212> PRT <213> Metallosphaera sedula <400> 36 Met Lys Ala Ala Val Leu His Thr Tyr Lys Glu Pro Leu Ser Ile Glu 1 5 10 15 Asp Val Asn Ile Ser Gln Pro Lys Ala Gly Glu Val Lys Ile Lys Val 20 25 30 Lys Ala Thr Gly Leu Cys Arg Ser Asp Val His Val Phe Glu Gly Lys 35 40 45 Thr Pro Val Pro Pro Pro Val Val Ala Gly His Glu Ile Ser Gly Ile 50 55 60 Val Glu Glu Val Gly Pro Gly Val Thr Arg Val Lys Pro Gly Asp Arg 65 70 75 80 Val Ile Ser Ala Phe Ile His Pro Cys Gly Lys Cys Gly Asn Cys Val 85 90 95 Ala Gly Lys Glu Asn Leu Cys Glu Thr Phe Ser Gln Val Arg Leu Lys 100 105 110 Gly Val Met Pro Asp Gly Thr Ser Arg Leu Ser Lys Asp Gly Lys Glu 115 120 125 Ile Arg Thr Phe Leu Gly Gly Gly Phe Ala Glu Tyr Ala Ile Val Gly 130 135 140 Glu Asn Ala Leu Thr Arg Val Pro Glu Asp Met Asp Leu Glu Lys Val 145 150 155 160 Ala Val Leu Gly Cys Ala Gly Leu Thr Gly Tyr Gly Ala Ile Ser Ser 165 170 175 Ser Lys Ile Glu Pro Gly Asp Thr Val Ala Val Ile Gly Val Gly Gly 180 185 190 Val Gly Leu Ser Thr Ile Gln Leu Leu Arg Ala Ser Gly Ala Gly Arg 195 200 205 Ile Ile Ala Val Gly Thr Lys Lys Trp Lys Leu Asp Arg Ala Met Glu 210 215 220 Leu Gly Ala Thr Asp Val Val Asn Ser Lys Glu Ile Asp Pro Val Lys 225 230 235 240 Ala Ile Lys Glu Ile Thr Gly Gly Gly Pro Gln Val Val Ile Glu Ala 245 250 255 Gly Gly Asn Glu Asp Thr Ile His Met Ala Leu Asp Ser Val Arg Ile 260 265 270 Gly Gly Lys Val Val Leu Val Gly Leu Pro Pro Ala Thr Ala Met Ile 275 280 285 Pro Ile Arg Val Ala Ser Ile Val Arg Gly Gly Ile Glu Val Val Gly 290 295 300 Asn Tyr Gly Gly Arg Pro Arg Val Asp Met Pro Lys Leu Leu Glu Leu 305 310 315 320 Val Arg Gln Gly Arg Tyr Asp Pro Ser Arg Leu Val Thr Gly Arg Phe 325 330 335 Arg Leu Glu Glu Ile Asn Glu Ala Val Lys Met Leu Glu Glu Gly Glu 340 345 350 Ala Ile Arg Ser Leu Ile Ile Pro 355 360 <210> 37 <211> 1083 <212> DNA <213> Metallosphaera sedula <400> 37 atgaaagcag cagttctgca tacctataaa gaaccgctga gcattgaaga tgtgaatatt 60 tcacagccga aagccggtga agtgaaaatc aaagttaaag caaccggtct gtgtcgtagt 120 gatgttcatg tttttgaagg taaaacaccg gttccgcctc cggttgttgc aggtcatgaa 180 attagcggta ttgttgaaga ggttggtccg ggtgttaccc gtgttaaacc gggtgatcgt 240 gttattagcg catttattca tccgtgtggt aaatgcggta attgtgttgc cggtaaagaa 300 aatctgtgtg aaacctttag ccaggttcgt ctgaaaggtg ttatgccgga tggcaccagc 360 cgtctgagca aagatggcaa agaaattcgt acctttctgg gtggtggttt tgcagaatat 420 gcaattgttg gtgaaaatgc actgacccgt gttccggaag atatggatct ggaaaaagtt 480 gcagttctgg gttgtgccgg tctgaccggt tatggtgcaa ttagcagcag caaaattgaa 540 cctggtgata ccgttgcagt tattggtgtt ggtggtgtgg gtctgagcac cattcagctg 600 ctgcgtgcaa gcggtgcagg tcgtattatt gcagttggca ccaaaaaatg gaaactggat 660 cgtgcaatgg aactgggtgc aaccgatgtt gttaacagta aagaaattga tccggtgaaa 720 gccatcaaag aaatcaccgg tggtggtccg caggttgtta ttgaagccgg tggtaatgaa 780 gataccattc acatggcact ggatagcgtt cgtattggtg gtaaagttgt tctggttggt 840 ctgcctccgg caaccgcaat gattccgatt cgtgttgcaa gcattgttcg tggtggtatt 900 gaagttgttg gtaattatgg tggtcgtccg cgtgttgata tgccgaaact gctggaactg 960 gttcgtcagg gtcgttatga tccgagccgt ctggttaccg gtcgttttcg tctggaagaa 1020 attaatgaag ccgtcaaaat gctggaagaa ggtgaagcaa ttcgtagcct gattattccg 1080 taa 1083 <210> 38 <211> 1083 <212> DNA <213> Metallosphaera sedula <400> 38 atgaaagcag cagttctgca tacctataaa gaaccgctga gcattgaaga tgtgaatatt 60 tcacagccga aagccggtga agtgaaaatc aaagttaaag caaccggtct gtgtcgtagt 120 gatgttcatg tttttgaagg taaaacaccg gttccgcctc cggttgttgc aggtcatgaa 180 attagcggta ttgttgaaga ggttggtccg ggtgttaccc gtgttaaacc gggtgatcgt 240 gttattagcg catttattca tccgtgtggt aaatgcggta attgtgttgc cggtaaagaa 300 aatctgtgtg aaacctttag ccaggttcgt ctgaaaggtg ttatgccgga tggcaccagc 360 cgtctgagca aagatggcaa agaaattcgt acctttctgg gtggtggttt tgcagaatat 420 gcaattgttg gtgaaaatgc actgacccgt gttccggaag atatggatct ggaaaaagtt 480 gcagttctgg gttgtgccgg tctgaccggt tatggtgcaa ttagcagcag caaaattgaa 540 cctggtgata ccgttgcagt tattggtgtt ggtggtgtgg gtctgagcac cattcagctg 600 ctgcgtgcaa gcggtgcagg tcgtattatt gcagttggca ccaaaaaatg gaaactggat 660 cgtgcaatgg aactgggtgc aaccgatgtt gttaacagta aagaaattga tccggtgaaa 720 gccatcaaag aaatcaccgg tggtggtccg caggttgtta ttgaagccgg tggtaatgaa 780 gataccattc acatggcact ggatagcgtt cgtattggtg gtaaagttgt tctggttggt 840 ctgcctccgg caaccgcaat gattccgatt cgtgttgcaa gcattgttcg tggtggtatt 900 gaagttgttg gtaattatgg tggtcgtccg cgtgttgata tgccgaaact gctggaactg 960 gttcgtcagg gtcgttatga tccgagccgt ctggttaccg gtcgttttcg tctggaagaa 1020 attaatgaag ccgtcaaaat gctggaagaa ggtgaagcaa ttcgtagcct gattattccg 1080 taa 1083 <210> 39 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 39 tcacacagga aacagaattc gagctcggta atgtcgttta ccctgattca gcaagcgact 60 <210> 40 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 40 ggtatatctc cttcttaaag ttaaacttat ttgccgccca ttgcatccgc tttctg 56 <210> 41 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 41 gtttaacttt aagaaggaga tataccatga ttctgatgcg ccgtaccctg aaagcg 56 <210> 42 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 42 ggtatatctc cttcttaaag ttaaacttac ttctcgatgt agcctttctc cacgag 56 <210> 43 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 43 gtttaacttt aagaaggaga tataccatga aagcagcagt tctgcatacc tataaagaac 60 cgctgagcat 70 <210> 44 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 44 atgcctgcag gtcgactcta gaggatcctt acggaataat caggctacga attgcttc 58 <210> 45 <211> 8457 <212> DNA <213> Artificial Sequence <220> <223> pACT-MCL-DHB <400> 45 ttcgagctcg gtaatgtcgt ttaccctgat tcagcaagcg actccgcgct tacatcgcag 60 cgaacttgcg gttccgggtt caaatccgac ctttatggag aaatcagcag ccagcaaggc 120 cgatgtcatc ttcttggatc tggaggatgc cgttgcacct gatgacaaag aacaggcgcg 180 taagaacatc attcaggcac tgaacgatct ggactggggc aacaaaacga tgatgatccg 240 cattaacggt ctggacaccc actacatgta tcgggatgtg gtcgacatcg tagaagcatg 300 ccctcgcctg gatatgattc tcattcccaa agtcggagta ccagcagacg tgtatgcgat 360 tgatgtgctg acgacgcaaa tcgaacaggc gaagaaacgg gagaagaaaa tcggattcga 420 ggtgctcatt gaaacggctt taggcatggc caatgttgaa gccatcgcca catcttcgaa 480 acgcttggaa gcgatgtcgt ttggtgtggc cgattatgca gcatccactc gtgcccgtag 540 taccgtgatt ggtggtgtga atgcggatta ctccgttctc actgacaaag atgaagcagg 600 gaaccgtcaa acccattggc aagatccgtg gctgtttgcg cagaatcgca tgctggttgc 660 ttgccgtgct tacgggcttc gcccgattga tgggccattt ggcgacttca gcgatcccga 720 tggctatacc agtgctgcgc gtcgttgtgc ggcgctgggc tttgaaggca aatgggcgat 780 tcacccgagt cagatcgact tagcgaacga ggtgttcaca ccgtctgaag ctgaagtcac 840 caaagcgcgc cgcattctgg aggcaatgga agaagcggcc aaagccggtc gtggcgctgt 900 aagcctggac ggtcgcttga ttgacatcgc cagcattcgc atggctgaag ccctgatcca 960 gaaagcggat gcaatgggcg gcaaataagt ttaactttaa gaaggagata taccatgatt 1020 ctgatgcgcc gtaccctgaa agcggcaatc ttgggtgcca ccggcttagt cgggattgag 1080 tacgtacgga tgctgagcaa tcatccgtac atcaaacccg cctatctggc tgggaaaggg 1140 tcagttggca aaccgtatgg cgaagtagtg cgctggcaga ctgtgggcca agttcccaaa 1200 gaaattgccg atatggaaat caagccgact gatccgaaac tgatggatga tgttgacatc 1260 atctttagcc cactgcctca aggtgcggca ggacccgttg aggaacaatt tgcgaaagaa 1320 ggatttccgg tcatttccaa ttctccggat catcggtttg atccggatgt cccactcctg 1380 gtgccagaac tgaatccgca caccattagc cttattgacg aacagcgtaa acgccgtgaa 1440 tggaaaggct tcatcgttac gacgccgtta tgcaccgcac agggtgctgc gatcccattg 1500 ggtgccatct tcaaggacta caaaatggat ggcgcattca ttacgaccat tcagtctctt 1560 agcggtgcgg gatatccggg tattccgtcc ctggatgtgg tggataacat tctgccttta 1620 ggggacggtt atgacgccaa aacgatcaag gaaattttcc gcatcctgag tgaagtgaaa 1680 cgcaatgtgg acgaacctaa actggaggac gtttcactgg ccgccacaac ccatcgcatt 1740 gcaaccattc atggccacta tgaggtgttg tacgtgtcgt ttaaggaaga aacagcagcg 1800 gagaaggtca aagaaacgct ggaaaacttt cgcggtgaac ctcaggatct caaactgccg 1860 acagcgccct cgaaaccgat cattgtgatg aacgaagata ctcgcccaca ggtatatttc 1920 gatcgttggg cgggcgacat tccgggcatg agtgtcgttg ttggccgtct gaaacaggtc 1980 aacaaacgca tgattcgtct ggtatcgctt atccacaaca ccgtacgtgg tgctgcgggc 2040 ggtgggattt tagctgcgga gttgctcgtg gagaaaggct acatcgagaa gtaagtttaa 2100 ctttaagaag gagatatacc atgaaagcag cagttctgca tacctataaa gaaccgctga 2160 gcattgaaga tgtgaatatt tcacagccga aagccggtga agtgaaaatc aaagttaaag 2220 caaccggtct gtgtcgtagt gatgttcatg tttttgaagg taaaacaccg gttccgcctc 2280 cggttgttgc aggtcatgaa attagcggta ttgttgaaga ggttggtccg ggtgttaccc 2340 gtgttaaacc gggtgatcgt gttattagcg catttattca tccgtgtggt aaatgcggta 2400 attgtgttgc cggtaaagaa aatctgtgtg aaacctttag ccaggttcgt ctgaaaggtg 2460 ttatgccgga tggcaccagc cgtctgagca aagatggcaa agaaattcgt acctttctgg 2520 gtggtggttt tgcagaatat gcaattgttg gtgaaaatgc actgacccgt gttccggaag 2580 atatggatct ggaaaaagtt gcagttctgg gttgtgccgg tctgaccggt tatggtgcaa 2640 ttagcagcag caaaattgaa cctggtgata ccgttgcagt tattggtgtt ggtggtgtgg 2700 gtctgagcac cattcagctg ctgcgtgcaa gcggtgcagg tcgtattatt gcagttggca 2760 ccaaaaaatg gaaactggat cgtgcaatgg aactgggtgc aaccgatgtt gttaacagta 2820 aagaaattga tccggtgaaa gccatcaaag aaatcaccgg tggtggtccg caggttgtta 2880 ttgaagccgg tggtaatgaa gataccattc acatggcact ggatagcgtt cgtattggtg 2940 gtaaagttgt tctggttggt ctgcctccgg caaccgcaat gattccgatt cgtgttgcaa 3000 gcattgttcg tggtggtatt gaagttgttg gtaattatgg tggtcgtccg cgtgttgata 3060 tgccgaaact gctggaactg gttcgtcagg gtcgttatga tccgagccgt ctggttaccg 3120 gtcgttttcg tctggaagaa attaatgaag ccgtcaaaat gctggaagaa ggtgaagcaa 3180 ttcgtagcct gattattccg taagatcctc tagagtcgac ctgcaggcat gcaagcttct 3240 gttttggcgg atgagagaag aaattcgtcg cccgccataa actgccaggc atcaaattaa 3300 gcagaaggcc atcctgacgg atggcctttt tgcgtttcta caaactcttc ctgtctagca 3360 ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 3420 tcaaatatgt atccgctcat gctagaaata ttttatctga ttaataagat gatcttcttg 3480 agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac gaaaaaaccg ccttgcaggg 3540 cggtttttcg aaggttctct gagctaccaa ctctttgaac cgaggtaact ggcttggagg 3600 agcgcagtca ccaaaacttg tcctttcagt ttagccttaa ccggcgcatg acttcaagac 3660 taactcctct aaatcaatta ccagtggctg ctgccagtgg tgcttttgca tgtctttccg 3720 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcggactga acggggggtt 3780 cgtgcataca gtccagcttg gagcgaactg cctacccgga actgagtgtc aggcgtggaa 3840 tgagacaaac gcggccataa cagcggaatg acaccggtaa accgaaaggc aggaacagga 3900 gagcgcacga gggagccgcc aggggaaacg cctggtatct ttatagtcct gtcgggtttc 3960 gccaccactg atttgagcgt cagatttcgt gatgcttgtc aggggggcgg agcctatgga 4020 aaaacggctt tgccgcggcc ctctcacttc cctgttaagt atcttcctgg catcttccag 4080 gaaatctccg ccccgttcgt aagccatttc cgctcgccgc agtcgaacga ccgagcgtag 4140 cgagtcagtg agcgaggaag cggaatatat cctgtatcac atattctgct gacgcaccgg 4200 tgcagccttt tttctcctgc cacatgaagc acttcactga caccctcatc agtgccaaca 4260 tagtaagcca gtatacactc cgctagcgct gatgtccggc ggtgcttttg ccgttacgca 4320 ccaccccgtc agtagctgaa caggagggac agctgataga aacagaagcc actggagcac 4380 ctcaaaaaca ccatcataca ctaaatcagt aagttggcag catcacccga cgcactttgc 4440 gccgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc tggtgtccct 4500 gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga tcggcacgta 4560 agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt ttttgagtta 4620 tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg atataccacc 4680 gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc agttgctcaa 4740 tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac cgtaaagaaa 4800 aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat gaatgctcat 4860 ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag tgttcaccct 4920 tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag tgaataccac 4980 gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta cggtgaaaac 5040 ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc caatccctgg 5100 gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt cgcccccgtt 5160 ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag 5220 gttcatcatg ccgtctgtga tggcttccat gtcggcagaa tgcttaatga attacaacag 5280 tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg gtgcccttaa 5340 acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga aattcgaaag 5400 caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt atgtctattg 5460 ctggtttacc ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctg 5520 aggccagttt gctcaggctc tccccgtgga ggtaataatt gacgatatga tcatttattc 5580 tgcctcccag agcctgataa aaacggttag cgcttcgtta atacagatgt aggtgttcca 5640 cagggtagcc agcagcatcc tgcgatgcag atccggaaca taatggtgca gggcgcttgt 5700 ttcggcgtgg gtatggtggc aggccccgtg gccgggggac tgttgggcgc tgccggcacc 5760 tgtcctacga gttgcatgat aaagaagaca gtcataagtg cggcgacgat agtcatgccc 5820 cgcgcccacc ggaaggagct accggacagc ggtgcggact gttgtaactc agaataagaa 5880 atgaggccgc tcatggcgtt gactctcagt catagtatcg tggtatcacc ggttggttcc 5940 actctctgtt gcgggcaact tcagcagcac gtaggggact tccgcgtttc cagactttac 6000 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 6060 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 6120 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 6180 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 6240 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 6300 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 6360 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 6420 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 6480 gtccagtgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 6540 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 6600 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 6660 cgtagcccag cgcgtcggcc aattcgcgct aacttacatt aattgcgttg cgctcactgc 6720 ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 6780 ggagaggcgg tttgcgtatt gggcgccagg gtggtttttc ttttcaccag tgagacgggc 6840 aacagctgat tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg 6900 gtttgcccca gcaggcgaaa atcctgtttg atggtggttg acggcgggat ataacatgag 6960 ctgtcttcgg tatcgtcgta tcccactacc gagatatccg caccaacgcg cagcccggac 7020 tcggtaatgg cgcgcattgc gcccagcgcc atctgatcgt tggcaaccag catcgcagtg 7080 ggaacgatgc cctcattcag catttgcatg gtttgttgaa aaccggacat ggcactccag 7140 tcgccttccc gttccgctat cggctgaatt tgattgcgag tgagatattt atgccagcca 7200 gccagacgca gacgcgccga gacagaactt aatgggcccg ctaacagcgc gatttgctgg 7260 tgacccaatg cgaccagatg ctccacgccc agtcgcgtac cgtcttcatg ggagaaaata 7320 atactgttga tgggtgtctg gtcagagaca tcaagaaata acgccggaac attagtgcag 7380 gcagcttcca cagcaatggc atcctggtca tccagcggat agttaatgat cagcccactg 7440 acgcgttgcg cgagaagatt gtgcaccgcc gctttacagg cttcgacgcc gcttcgttct 7500 accatcgaca ccaccacgct ggcacccagt tgatcggcgc gagatttaat cgccgcgaca 7560 atttgcgacg gcgcgtgcag ggccagactg gaggtggcaa cgccaatcag caacgactgt 7620 ttgcccgcca gttgttgtgc cacgcggttg ggaatgtaat tcagctccgc catcgccgct 7680 tccacttttt cccgcgtttt cgcagaaacg tggctggcct ggttcaccac gcgggaaacg 7740 gtctgataag agacaccggc atactctgcg acatcgtata acgttactgg tttcacattc 7800 accaccctga attgactctc ttccgggcgc tatcatgcca taccgcgaaa ggttttgcac 7860 cattcgatgg tgtcaacgta aatgcatgcc gcttcgcctt cgcgcgcgaa ttggccgcca 7920 tgccggcgat aatggcctgc ttctcgccga aacgtttggt ggcgggacca gtgacgaagg 7980 cttgagcgag ggcgtgcaag attccgaata ccgcaagcga caggccgatc atcgtcgcgc 8040 tccagcgaaa gcggtcctcg ccgaaaatga cccagagcgc tgccggcacc tgtcctacga 8100 gttgcatgat aaagaagaca gtcataagtg cggcgacgat agtcatgccc cgcgcccacc 8160 ggaaggagct gactgggttg aaggctctca agggcatcgg cggagcttat cgactgcacg 8220 gtgcaccaat gcttctggcg tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc 8280 gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt 8340 gcgccgacat cataacggtt ctggcaaata ttctgaaatg agctgttgac aattaatcat 8400 cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga aacagaa 8457 <210> 46 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> linker mtka mtkb <400> 46 cgaacggggg aggaatcacg cc 22 <210> 47 <211> 7422 <212> DNA <213> Artificial Sequence <220> <223> pET28-MEX-MTKAB <400> 47 aattcgagct ccgtcgacaa gcttgcggcc gcactcgagc accaccacca ccaccactga 60 gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg ctgctgccac cgctgagcaa 120 taactagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt gctgaaagga 180 ggaactatat ccggattggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg 240 gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 300 tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 360 gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 420 attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 480 cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 540 ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 600 aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa 660 tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 720 tacattcaaa tatgtatccg ctcatgaatt aattcttaga aaaactcatc gagcatcaaa 780 tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 840 tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 900 tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 960 aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagt 1020 ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 1080 ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 1140 tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 1200 agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 1260 ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 1320 atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 1380 tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 1440 tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 1500 tataaatcag catccatgtt ggaatttaat cgcggcctag agcaagacgt ttcccgttga 1560 atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 1620 gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 1680 caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 1740 accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 1800 ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt 1860 aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 1920 accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 1980 gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 2040 ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 2100 gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 2160 gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 2220 ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 2280 aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 2340 gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 2400 tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 2460 agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatata 2520 tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tacactccgc 2580 tatcgctacg tgactgggtc atggctgcgc cccgacaccc gccaacaccc gctgacgcgc 2640 cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 2700 gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag ctgcggtaaa 2760 gctcatcagc gtggtcgtga agcgattcac agatgtctgc ctgttcatcc gcgtccagct 2820 cgttgagttt ctccagaagc gttaatgtct ggcttctgat aaagcgggcc atgttaaggg 2880 cggttttttc ctgtttggtc actgatgcct ccgtgtaagg gggatttctg ttcatggggg 2940 taatgatacc gatgaaacga gagaggatgc tcacgatacg ggttactgat gatgaacatg 3000 cccggttact ggaacgttgt gagggtaaac aactggcggt atggatgcgg cgggaccaga 3060 gaaaaatcac tcagggtcaa tgccagcgct tcgttaatac agatgtaggt gttccacagg 3120 gtagccagca gcatcctgcg atgcagatcc ggaacataat ggtgcagggc gctgacttcc 3180 gcgtttccag actttacgaa acacggaaac cgaagaccat tcatgttgtt gctcaggtcg 3240 cagacgtttt gcagcagcag tcgcttcacg ttcgctcgcg tatcggtgat tcattctgct 3300 aaccagtaag gcaaccccgc cagcctagcc gggtcctcaa cgacaggagc acgatcatgc 3360 gcacccgtgg ggccgccatg ccggcgataa tggcctgctt ctcgccgaaa cgtttggtgg 3420 cgggaccagt gacgaaggct tgagcgaggg cgtgcaagat tccgaatacc gcaagcgaca 3480 ggccgatcat cgtcgcgctc cagcgaaagc ggtcctcgcc gaaaatgacc cagagcgctg 3540 ccggcacctg tcctacgagt tgcatgataa agaagacagt cataagtgcg gcgacgatag 3600 tcatgccccg cgcccaccgg aaggagctga ctgggttgaa ggctctcaag ggcatcggtc 3660 gagatcccgg tgcctaatga gtgagctaac ttacattaat tgcgttgcgc tcactgcccg 3720 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 3780 gaggcggttt gcgtattggg cgccagggtg gtttttcttt tcaccagtga gacgggcaac 3840 agctgattgc ccttcaccgc ctggccctga gagagttgca gcaagcggtc cacgctggtt 3900 tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg gcgggatata acatgagctg 3960 tcttcggtat cgtcgtatcc cactaccgag atatccgcac caacgcgcag cccggactcg 4020 gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg caaccagcat cgcagtggga 4080 acgatgccct cattcagcat ttgcatggtt tgttgaaaac cggacatggc actccagtcg 4140 ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga gatatttatg ccagccagcc 4200 agacgcagac gcgccgagac agaacttaat gggcccgcta acagcgcgat ttgctggtga 4260 cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt cttcatggga gaaaataata 4320 ctgttgatgg gtgtctggtc agagacatca agaaataacg ccggaacatt agtgcaggca 4380 gcttccacag caatggcatc ctggtcatcc agcggatagt taatgatcag cccactgacg 4440 cgttgcgcga gaagattgtg caccgccgct ttacaggctt cgacgccgct tcgttctacc 4500 atcgacacca ccacgctggc acccagttga tcggcgcgag atttaatcgc cgcgacaatt 4560 tgcgacggcg cgtgcagggc cagactggag gtggcaacgc caatcagcaa cgactgtttg 4620 cccgccagtt gttgtgccac gcggttggga atgtaattca gctccgccat cgccgcttcc 4680 actttttccc gcgttttcgc agaaacgtgg ctggcctggt tcaccacgcg ggaaacggtc 4740 tgataagaga caccggcata ctctgcgaca tcgtataacg ttactggttt cacattcacc 4800 accctgaatt gactctcttc cgggcgctat catgccatac cgcgaaaggt tttgcgccat 4860 tcgatggtgt ccgggatctc gacgctctcc cttatgcgac tcctgcatta ggaagcagcc 4920 cagtagtagg ttgaggccgt tgagcaccgc cgccgcaagg aatggtgcat gcaaggagat 4980 ggcgcccaac agtcccccgg ccacggggcc tgccaccata cccacgccga aacaagcgct 5040 catgagcccg aagtggcgag cccgatcttc cccatcggtg atgtcggcga tataggcgcc 5100 agcaaccgca cctgtggcgc cggtgatgcc ggccacgatg cgtccggcgt agaggatcga 5160 gatctcgatc ccgcgaaatt aatacgactc actatagggg aattgtgagc ggataacaat 5220 tcccctctag aaataatttt gtttaacttt aagaaggaga tataccatgg gcagcagcca 5280 tcatcatcat catcacagca gcggcctggt gccgcgcggc agccatatgg ctagcatgga 5340 tgtgcacgaa tatcaggcga aagaactgct tgcgtcgttt ggagtcgccg tgcctaaggg 5400 cgccgtggcg ttttcaccgg atcaggcggt ctatgcagcc actgagttag gcggcagctt 5460 ttgggctgtc aaagcgcaga ttcatgccgg tgcacgcggc aaagcgggtg gtattaagtt 5520 gtgccgcacc tacaacgaag ttcgtgatgc tgcccgtgat ctcctgggta aacggctggt 5580 aaccttgcaa accggtccgg agggtaaacc agtccagcgg gtatatgtgg aaacggctga 5640 tccgttcgaa cgcgaactct acttaggcta tgtgctggat cgcaaagcgg aacgtgtgcg 5700 cgttattgcc tcccaacgtg gcggcatgga tatcgaagag attgcggcta aagaaccgga 5760 agcgcttatc caggtggtgg ttgaaccagc agtcggcttg cagcagttcc aagcccgcga 5820 gattgccttt cagctggggc tgaacatcaa acaggttagt gcagcggtta aaaccatcat 5880 gaacgcatat cgcgcattcc gcgattgtga cgggaccatg ctggagatta accccttagt 5940 agtgaccaaa gacgatcgcg tactggcact ggacgcgaaa atgagctttg acgacaatgc 6000 gctctttcgc cgtcgtaaca ttgcggatat gcatgacccg agtcaaggcg atccgcgtga 6060 agcgcaagct gccgagcaca acctgagcta cattggcctg gaaggcgaaa ttgggtgcat 6120 tgtgaatgga gctggtctgg caatggccac gatggacatg atcaaacatg cgggagggga 6180 accggccaat ttcctcgatg taggtggtgg tgcatctcct gatcgcgttg cgactgcctt 6240 ccgtctggtt ctgtccgatc gcaatgtgaa agctattctg gtcaacatct ttgcgggtat 6300 taatcgctgc gattgggtcg cagaaggggt ggtcaaagca gctcgtgagg tgaagatcga 6360 cgttcccctg atcgtacgtc ttgctggcac gaatgtggac gaaggcaaga aaattctggc 6420 cgaatcgggc ttagacttga tcacagccga tacgctgaca gaagcggccc gcaaagcggt 6480 tgaggcatgt catggagcga agcactaacg aacgggggag gaatcacgcc atgtcgatcc 6540 tgattgacga aaagacgcca attctggtgc aaggcattac cggcgataaa gggacgtttc 6600 acgctaagga aatgattgcc tatggcagca atgtggtggg tggagttacc ccaggaaaag 6660 gtgggaaaac tcattgcggc gttcccgtgt tcaacaccgt gaaagaagct gtggaagcga 6720 ctggcgcgac cacctccatt accttcgtag cgccgccttt tgcagcggat gccattatgg 6780 aagccgctga tgccggctta aaactggtct gctccatcac agacggcatt cctgcgcagg 6840 acatgatgcg cgtcaaacgc tacttgcgtc gttatccgaa ggaaaagcgc acgatggtgg 6900 taggcccgaa ttgtgcgggt atcatctcgc cgggcaaaag catgctgggt attatgccgg 6960 ggcacatcta ccttcccggc aaagtcggtg tcattagtcg ctcagggacc cttgggtacg 7020 aagcggctgc gcagatgaaa gaactgggga ttggcatctc gacatccgtc ggaatcggtg 7080 gcgatccgat taacggtagc agctttctgg atcatctggc cctgttcgag caagatccgg 7140 aaaccgaagc cgttctcatg attggcgaaa ttggtggtcc acaggaggca gaagcaagcg 7200 catggatcaa agagaacttc tcaaaaccgg ttatcggttt tgtagccgga ttgactgctc 7260 cgaaaggtcg tcgcatgggt catgcaggcg cgatcatcag tgcgacgggt gactctgccg 7320 ctgagaaagc ggagattatg cggtcttatg gcctcacagt tgcacctgat ccgggtagtt 7380 ttggctctac ggttgccgat gtgttagcac gtgcggcgta ag 7422 <210> 48 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 48 caggaaacag aattcgagct cggtaatgga tgtgcacgaa tatcaggcga aagaactgct 60 <210> 49 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 49 tacggcgcat cagaatcatt acgccgcacg tgctaacaca tcggcaac 48 <210> 50 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 50 ggcgtaatga ttctgatgcg ccgtaccctg aaagcg 36 <210> 51 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 51 ctgctgcttt cattacttct cgatgtagcc tttctccacg ag 42 <210> 52 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 52 tacatcgaga agtaatgaaa gcagcagttc tgcataccta taaagaac 48 <210> 53 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 53 cctgcaggtc gactctagag gatccttacg gaataatcag gctacgaatt gcttcac 57 <210> 54 <211> 9515 <212> DNA <213> Artificial Sequence <220> <223> pETT20-MCS-DHB <400> 54 ttcgagctcg gtaatggatg tgcacgaata tcaggcgaaa gaactgcttg cgtcgtttgg 60 agtcgccgtg cctaagggcg ccgtggcgtt ttcaccggat caggcggtct atgcagccac 120 tgagttaggc ggcagctttt gggctgtcaa agcgcagatt catgccggtg cacgcggcaa 180 agcgggtggt attaagttgt gccgcaccta caacgaagtt cgtgatgctg cccgtgatct 240 cctgggtaaa cggctggtaa ccttgcaaac cggtccggag ggtaaaccag tccagcgggt 300 atatgtggaa acggctgatc cgttcgaacg cgaactctac ttaggctatg tgctggatcg 360 caaagcggaa cgtgtgcgcg ttattgcctc ccaacgtggc ggcatggata tcgaagagat 420 tgcggctaaa gaaccggaag cgcttatcca ggtggtggtt gaaccagcag tcggcttgca 480 gcagttccaa gcccgcgaga ttgcctttca gctggggctg aacatcaaac aggttagtgc 540 agcggttaaa accatcatga acgcatatcg cgcattccgc gattgtgacg ggaccatgct 600 ggagattaac cccttagtag tgaccaaaga cgatcgcgta ctggcactgg acgcgaaaat 660 gagctttgac gacaatgcgc tctttcgccg tcgtaacatt gcggatatgc atgacccgag 720 tcaaggcgat ccgcgtgaag cgcaagctgc cgagcacaac ctgagctaca ttggcctgga 780 aggcgaaatt gggtgcattg tgaatggagc tggtctggca atggccacga tggacatgat 840 caaacatgcg ggaggggaac cggccaattt cctcgatgta ggtggtggtg catctcctga 900 tcgcgttgcg actgccttcc gtctggttct gtccgatcgc aatgtgaaag ctattctggt 960 caacatcttt gcgggtatta atcgctgcga ttgggtcgca gaaggggtgg tcaaagcagc 1020 tcgtgaggtg aagatcgacg ttcccctgat cgtacgtctt gctggcacga atgtggacga 1080 aggcaagaaa attctggccg aatcgggctt agacttgatc acagccgata cgctgacaga 1140 agcggcccgc aaagcggttg aggcatgtca tggagcgaag cactaacgaa cgggggagga 1200 atcacgccat gtcgatcctg attgacgaaa agacgccaat tctggtgcaa ggcattaccg 1260 gcgataaagg gacgtttcac gctaaggaaa tgattgccta tggcagcaat gtggtgggtg 1320 gagttacccc aggaaaaggt gggaaaactc attgcggcgt tcccgtgttc aacaccgtga 1380 aagaagctgt ggaagcgact ggcgcgacca cctccattac cttcgtagcg ccgccttttg 1440 cagcggatgc cattatggaa gccgctgatg ccggcttaaa actggtctgc tccatcacag 1500 acggcattcc tgcgcaggac atgatgcgcg tcaaacgcta cttgcgtcgt tatccgaagg 1560 aaaagcgcac gatggtggta ggcccgaatt gtgcgggtat catctcgccg ggcaaaagca 1620 tgctgggtat tatgccgggg cacatctacc ttcccggcaa agtcggtgtc attagtcgct 1680 cagggaccct tgggtacgaa gcggctgcgc agatgaaaga actggggatt ggcatctcga 1740 catccgtcgg aatcggtggc gatccgatta acggtagcag ctttctggat catctggccc 1800 tgttcgagca agatccggaa accgaagccg ttctcatgat tggcgaaatt ggtggtccac 1860 aggaggcaga agcaagcgca tggatcaaag agaacttctc aaaaccggtt atcggttttg 1920 tagccggatt gactgctccg aaaggtcgtc gcatgggtca tgcaggcgcg atcatcagtg 1980 cgacgggtga ctctgccgct gagaaagcgg agattatgcg gtcttatggc ctcacagttg 2040 cacctgatcc gggtagtttt ggctctacgg ttgccgatgt gttagcacgt gcggcgtaat 2100 gattctgatg cgccgtaccc tgaaagcggc aatcttgggt gccaccggct tagtcgggat 2160 tgagtacgta cggatgctga gcaatcatcc gtacatcaaa cccgcctatc tggctgggaa 2220 agggtcagtt ggcaaaccgt atggcgaagt agtgcgctgg cagactgtgg gccaagttcc 2280 caaagaaatt gccgatatgg aaatcaagcc gactgatccg aaactgatgg atgatgttga 2340 catcatcttt agcccactgc ctcaaggtgc ggcaggaccc gttgaggaac aatttgcgaa 2400 agaaggattt ccggtcattt ccaattctcc ggatcatcgg tttgatccgg atgtcccact 2460 cctggtgcca gaactgaatc cgcacaccat tagccttatt gacgaacagc gtaaacgccg 2520 tgaatggaaa ggcttcatcg ttacgacgcc gttatgcacc gcacagggtg ctgcgatccc 2580 attgggtgcc atcttcaagg actacaaaat ggatggcgca ttcattacga ccattcagtc 2640 tcttagcggt gcgggatatc cgggtattcc gtccctggat gtggtggata acattctgcc 2700 tttaggggac ggttatgacg ccaaaacgat caaggaaatt ttccgcatcc tgagtgaagt 2760 gaaacgcaat gtggacgaac ctaaactgga ggacgtttca ctggccgcca caacccatcg 2820 cattgcaacc attcatggcc actatgaggt gttgtacgtg tcgtttaagg aagaaacagc 2880 agcggagaag gtcaaagaaa cgctggaaaa ctttcgcggt gaacctcagg atctcaaact 2940 gccgacagcg ccctcgaaac cgatcattgt gatgaacgaa gatactcgcc cacaggtata 3000 tttcgatcgt tgggcgggcg acattccggg catgagtgtc gttgttggcc gtctgaaaca 3060 ggtcaacaaa cgcatgattc gtctggtatc gcttatccac aacaccgtac gtggtgctgc 3120 gggcggtggg attttagctg cggagttgct cgtggagaaa ggctacatcg agaagtaatg 3180 aaagcagcag ttctgcatac ctataaagaa ccgctgagca ttgaagatgt gaatatttca 3240 cagccgaaag ccggtgaagt gaaaatcaaa gttaaagcaa ccggtctgtg tcgtagtgat 3300 gttcatgttt ttgaaggtaa aacaccggtt ccgcctccgg ttgttgcagg tcatgaaatt 3360 agcggtattg ttgaagaggt tggtccgggt gttacccgtg ttaaaccggg tgatcgtgtt 3420 attagcgcat ttattcatcc gtgtggtaaa tgcggtaatt gtgttgccgg taaagaaaat 3480 ctgtgtgaaa cctttagcca ggttcgtctg aaaggtgtta tgccggatgg caccagccgt 3540 ctgagcaaag atggcaaaga aattcgtacc tttctgggtg gtggttttgc agaatatgca 3600 attgttggtg aaaatgcact gacccgtgtt ccggaagata tggatctgga aaaagttgca 3660 gttctgggtt gtgccggtct gaccggttat ggtgcaatta gcagcagcaa aattgaacct 3720 ggtgataccg ttgcagttat tggtgttggt ggtgtgggtc tgagcaccat tcagctgctg 3780 cgtgcaagcg gtgcaggtcg tattattgca gttggcacca aaaaatggaa actggatcgt 3840 gcaatggaac tgggtgcaac cgatgttgtt aacagtaaag aaattgatcc ggtgaaagcc 3900 atcaaagaaa tcaccggtgg tggtccgcag gttgttattg aagccggtgg taatgaagat 3960 accattcaca tggcactgga tagcgttcgt attggtggta aagttgttct ggttggtctg 4020 cctccggcaa ccgcaatgat tccgattcgt gttgcaagca ttgttcgtgg tggtattgaa 4080 gttgttggta attatggtgg tcgtccgcgt gttgatatgc cgaaactgct ggaactggtt 4140 cgtcagggtc gttatgatcc gagccgtctg gttaccggtc gttttcgtct ggaagaaatt 4200 aatgaagccg tcaaaatgct ggaagaaggt gaagcaattc gtagcctgat tattccgtaa 4260 ggatcctcta gagtcgacct gcaggcatgc aagcttctgt tttggcggat gagagaagaa 4320 attcgtcgcc cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat 4380 ggcctttttg cgtttctaca aactcttcct gtctagcagg tggcactttt cggggaaatg 4440 tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatgc 4500 tagaaatatt ttatctgatt aataagatga tcttcttgag atcgttttgg tctgcgcgta 4560 atctcttgct ctgaaaacga aaaaaccgcc ttgcagggcg gtttttcgaa ggttctctga 4620 gctaccaact ctttgaaccg aggtaactgg cttggaggag cgcagtcacc aaaacttgtc 4680 ctttcagttt agccttaacc ggcgcatgac ttcaagacta actcctctaa atcaattacc 4740 agtggctgct gccagtggtg cttttgcatg tctttccggg ttggactcaa gacgatagtt 4800 accggataag gcgcagcggt cggactgaac ggggggttcg tgcatacagt ccagcttgga 4860 gcgaactgcc tacccggaac tgagtgtcag gcgtggaatg agacaaacgc ggccataaca 4920 gcggaatgac accggtaaac cgaaaggcag gaacaggaga gcgcacgagg gagccgccag 4980 gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc caccactgat ttgagcgtca 5040 gatttcgtga tgcttgtcag gggggcggag cctatggaaa aacggctttg ccgcggccct 5100 ctcacttccc tgttaagtat cttcctggca tcttccagga aatctccgcc ccgttcgtaa 5160 gccatttccg ctcgccgcag tcgaacgacc gagcgtagcg agtcagtgag cgaggaagcg 5220 gaatatatcc tgtatcacat attctgctga cgcaccggtg cagccttttt tctcctgcca 5280 catgaagcac ttcactgaca ccctcatcag tgccaacata gtaagccagt atacactccg 5340 ctagcgctga tgtccggcgg tgcttttgcc gttacgcacc accccgtcag tagctgaaca 5400 ggagggacag ctgatagaaa cagaagccac tggagcacct caaaaacacc atcatacact 5460 aaatcagtaa gttggcagca tcacccgacg cactttgcgc cgaataaata cctgtgacgg 5520 aagatcactt cgcagaataa ataaatcctg gtgtccctgt tgataccggg aagccctggg 5580 ccaacttttg gcgaaaatga gacgttgatc ggcacgtaag aggttccaac tttcaccata 5640 atgaaataag atcactaccg ggcgtatttt ttgagttatc gagattttca ggagctaagg 5700 aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 5760 gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 5820 agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg 5880 cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt atggcaatga 5940 aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc 6000 aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac 6060 acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt 6120 ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt 6180 taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata 6240 cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtctgtgatg 6300 gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag tggcagggcg 6360 gggcgtaatt tttttaaggc agttattggt gcccttaaac gcctggtgct acgcctgaat 6420 aagtgataat aagcggatga atggcagaaa ttcgaaagca aattcgaccc ggtcgtcggt 6480 tcagggcagg gtcgttaaat agccgcttat gtctattgct ggtttaccgg tttattgact 6540 accggaagca gtgtgaccgt gtgcttctca aatgcctgag gccagtttgc tcaggctctc 6600 cccgtggagg taataattga cgatatgatc atttattctg cctcccagag cctgataaaa 6660 acggttagcg cttcgttaat acagatgtag gtgttccaca gggtagccag cagcatcctg 6720 cgatgcagat ccggaacata atggtgcagg gcgcttgttt cggcgtgggt atggtggcag 6780 gccccgtggc cgggggactg ttgggcgctg ccggcacctg tcctacgagt tgcatgataa 6840 agaagacagt cataagtgcg gcgacgatag tcatgccccg cgcccaccgg aaggagctac 6900 cggacagcgg tgcggactgt tgtaactcag aataagaaat gaggccgctc atggcgttga 6960 ctctcagtca tagtatcgtg gtatcaccgg ttggttccac tctctgttgc gggcaacttc 7020 agcagcacgt aggggacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca 7080 ttcatgttgt tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc 7140 gtatcggtga ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca 7200 acgacaggag cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gagatgcgcc 7260 gcgtgcggct gctggagatg gcggacgcga tggatatgtt ctgccaaggg ttggtttgcg 7320 cattcacagt tctccgcaag aattgattgg ctccaattct tggagtggtg aatccgttag 7380 cgaggtgccg ccggcttcca ttcaggtcga ggtggcccgg ctccatgcac cgcgacgcaa 7440 cgcggggagg cagacaaggt atagggcggc gcctacaatc catgccaacc cgttccatgt 7500 gctcgccgag gcggcataaa tcgccgtgac gatcagcggt ccagtgatcg aagttaggct 7560 ggtaagagcc gcgagcgatc cttgaagctg tccctgatgg tcgtcatcta cctgcctgga 7620 cagcatggcc tgcaacgcgg gcatcccgat gccgccggaa gcgagaagaa tcataatggg 7680 gaaggccatc cagcctcgcg tcgcgaacgc cagcaagacg tagcccagcg cgtcggccaa 7740 ttcgcgctaa cttacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 7800 gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 7860 gcgccagggt ggtttttctt ttcaccagtg agacgggcaa cagctgattg cccttcaccg 7920 cctggccctg agagagttgc agcaagcggt ccacgctggt ttgccccagc aggcgaaaat 7980 cctgtttgat ggtggttgac ggcgggatat aacatgagct gtcttcggta tcgtcgtatc 8040 ccactaccga gatatccgca ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc 8100 ccagcgccat ctgatcgttg gcaaccagca tcgcagtggg aacgatgccc tcattcagca 8160 tttgcatggt ttgttgaaaa ccggacatgg cactccagtc gccttcccgt tccgctatcg 8220 gctgaatttg attgcgagtg agatatttat gccagccagc cagacgcaga cgcgccgaga 8280 cagaacttaa tgggcccgct aacagcgcga tttgctggtg acccaatgcg accagatgct 8340 ccacgcccag tcgcgtaccg tcttcatggg agaaaataat actgttgatg ggtgtctggt 8400 cagagacatc aagaaataac gccggaacat tagtgcaggc agcttccaca gcaatggcat 8460 cctggtcatc cagcggatag ttaatgatca gcccactgac gcgttgcgcg agaagattgt 8520 gcaccgccgc tttacaggct tcgacgccgc ttcgttctac catcgacacc accacgctgg 8580 cacccagttg atcggcgcga gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg 8640 ccagactgga ggtggcaacg ccaatcagca acgactgttt gcccgccagt tgttgtgcca 8700 cgcggttggg aatgtaattc agctccgcca tcgccgcttc cactttttcc cgcgttttcg 8760 cagaaacgtg gctggcctgg ttcaccacgc gggaaacggt ctgataagag acaccggcat 8820 actctgcgac atcgtataac gttactggtt tcacattcac caccctgaat tgactctctt 8880 ccgggcgcta tcatgccata ccgcgaaagg ttttgcacca ttcgatggtg tcaacgtaaa 8940 tgcatgccgc ttcgccttcg cgcgcgaatt ggccgccatg ccggcgataa tggcctgctt 9000 ctcgccgaaa cgtttggtgg cgggaccagt gacgaaggct tgagcgaggg cgtgcaagat 9060 tccgaatacc gcaagcgaca ggccgatcat cgtcgcgctc cagcgaaagc ggtcctcgcc 9120 gaaaatgacc cagagcgctg ccggcacctg tcctacgagt tgcatgataa agaagacagt 9180 cataagtgcg gcgacgatag tcatgccccg cgcccaccgg aaggagctga ctgggttgaa 9240 ggctctcaag ggcatcggcg gagcttatcg actgcacggt gcaccaatgc ttctggcgtc 9300 aggcagccat cggaagctgt ggtatggctg tgcaggtcgt aaatcactgc ataattcgtg 9360 tcgctcaagg cgcactcccg ttctggataa tgttttttgc gccgacatca taacggttct 9420 ggcaaatatt ctgaaatgag ctgttgacaa ttaatcatcg gctcgtataa tgtgtggaat 9480 tgtgagcgga taacaatttc acacaggaaa cagaa 9515 <210> 55 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 55 tataatcccg ggatgcgcgt taacaatggt ttgacc 36 <210> 56 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 56 tataattcta gattacagtt tcggaccagc cg 32 <210> 57 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 57 tataatcccg ggatgcgcgt taacaatggt ttgacc 36 <210> 58 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 58 tataattcta gattacagtt tcggaccagc cg 32 <210> 59 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 59 tataatcccg ggatgaacga acaatattcc 30 <210> 60 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 60 tataattcta gattagccgg tattacgcat 30 <210> 61 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 61 tataatcccg ggatgtccag aaggcttcgc agaaca 36 <210> 62 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 62 tataattcta gattactcta ccgttaaaat ac 32 <210> 63 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 63 tataatcccg ggatgaaaac ccgtacacaa caaatt 36 <210> 64 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 64 tataattcta gattagaact gcgattcttc ag 32 <210> 65 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 65 tataatcccg ggatgaaaaa actactcgtc gccaat 36 <210> 66 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 66 tataattcta gattaattaa tttcgattaa ca 32 <210> 67 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 67 tataatcccg ggatgcctga cgctaaaaaa caggggcggt 40 <210> 68 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 68 tataattcta gattaatcgt gagcgcctat ttc 33 <210> 69 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 69 gaaggttgcg cctacactaa gcatagttgt tgatgagtgt aggctggagc tgcttc 56 <210> 70 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 70 ttaaaccagt tcgttcgggc aggtttcgcc tttttcatgg gaattagcca tggtcc 56 <210> 71 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 71 atggctgtta ctaatgtcgc tgaacttaac gcactcgtag agcgtgtgta ggctggagct 60 gcttc 65 <210> 72 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 72 ttaagcggat tttttcgctt ttttctcagc tttagccgga gcagccatat gaatatcctc 60 cttag 65 <210> 73 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 73 atgtcgagta agttagtact ggttctgaac tgcggtagtt cttcagtgta ggctggagct 60 gcttc 65 <210> 74 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 74 tcaggcagtc aggcggctcg cgtcttgcgc gataaccagt tcttccatat gaatatcctc 60 cttag 65 <210> 75 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 75 ttactccgta tttgcataaa aaccatgcga gttacgggcc tataagtgta ggctggagct 60 gcttc 65 <210> 76 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 76 atagattgag tgaaggtacg agtaataacg tcctgctgct gttctcatat gaatatcctc 60 cttag 65 <210> 77 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 77 gtgtcccgta ttattatgct gatccctacc ggaaccagcg tcggtgtgta ggctggagct 60 gcttc 65 <210> 78 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 78 ttactgctgc tgtgcagact gaatcgcagt cagcgcgatg gtgtacatat gaatatcctc 60 cttag 65 <210> 79 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 79 atgaaacaaa cggttgcagc ttatatcgcc aaaacactcg aatcggtgta ggctggagct 60 gcttc 65 <210> 80 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 80 ttaccttagc cagtttgttt tcgccagttc gatcacttca tcacccatat gaatatcctc 60 cttag 65 <210> 81 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 81 atgaccatta ctccggcaac tcatgcaatt tcgataaatc ctgccgtgta ggctggagct 60 gcttc 65 <210> 82 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 82 tcagatccgg tctttccaca ccgtctggat attacagaat tcgtgcatat gaatatcctc 60 cttag 65 <210> 83 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 83 atgaaactta acgacagtaa cttattccgc cagcaggcgt tgattgtgta ggctggagct 60 gcttc 65 <210> 84 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 84 ttaaagaccg atgcacatat atttgatttc taagtaatct tcgatcatat gaatatcctc 60 cttag 65 <210> 85 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 85 atggaccaga agctgttaac ggatttccgc tcagaactac tcgatgtgta ggctggagct 60 gcttc 65 <210> 86 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 86 tcaggtgtgt ttaaagctgt tctgctgggc aataccctgc agtttcatat gaatatcctc 60 cttag 65 <210> 87 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 87 atggataaga agcaagtaac ggatttaagg tcggaactac tcgatgtgta ggctggagct 60 gcttc 65 <210> 88 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 88 tcaggtatgt ttaaagctgt tctgttgggc aataccctgc agtttcatat gaatatcctc 60 cttag 65 <210> 89 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 89 atggctacat cagtacagac aggtaaagct aagcagctca cattagtgta ggctggagct 60 gcttc 65 <210> 90 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 90 ttagtgtttc ttgtcattca tcacaatata gtgtggtgaa cgtgccatat gaatatcctc 60 cttag 65 <210> 91 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 91 atggaaccaa aaacaaaaaa acagcgttcg ctttatatcc cttacgtgta ggctggagct 60 gcttc 65 <210> 92 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 92 ttagatggag gtacggcggt agtcgcggta ttcggcttgc cagaacatat gaatatcctc 60 cttag 65 <210> 93 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 93 atggatgacc agttaaaaca aagtgcactt gatttccatg aatttgtgta ggctggagct 60 gcttc 65 <210> 94 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 94 ttacagcggt tgggtttgcg cttctaccac ggccagcgcc accatcatat gaatatcctc 60 cttag 65 <210> 95 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 95 atgaacgaac aatattccgc attgcgtagt aatgtcagta tgctcgtgta ggctggagct 60 gcttc 65 <210> 96 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 96 ttagccggta ttacgcatac ctgccgcaat cccggcaata gtgaccatat gaatatcctc 60 cttag 65 <210> 97 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 97 atgtccagaa ggcttcgcag aacaaaaatc gttaccacgt taggcgtgta ggctggagct 60 gcttc 65 <210> 98 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 98 ttactctacc gttaaaatac gcgtggtatt agtagaaccc acggtcatat gaatatcctc 60 cttag 65 <210> 99 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 99 atgaaaaaga ccaaaattgt ttgcaccatc ggaccgaaaa ccgaagtgta ggctggagct 60 gcttc 65 <210> 100 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 100 ttacaggacg tgaacagatg cggtgttagt agtgccgctc ggtaccatat gaatatcctc 60 cttag 65 <210> 101 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 101 atggaactga cgactcgcac tttacctgcg cggaaacata ttgcggtgta ggctggagct 60 gcttc 65 <210> 102 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 102 ttacttcaga cggtccgcga gataacgctg ataatcgggg atcagcatat gaatatcctc 60 cttag 65 <210> 103 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 103 atggtcgcac ccattcccgc gaaacgcggc agaaaacccg ccgttgtgta ggctggagct 60 gcttc 65 <210> 104 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 104 tcagcgcatt ccaccgtacg ccagcgtcac ttccttcgcc gctttcatat gaatatcctc 60 cttag 65 <210> 105 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 105 atggaaagta aagtagttgt tccggcacaa ggcaagaaga tcaccgtgta ggctggagct 60 gcttc 65 <210> 106 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 106 ttacatgttt tcgatgatcg cgtcaccaaa ctctgaacat ttcagcatat gaatatcctc 60 cttag 65 <210> 107 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 107 atgcagaaca gcgctttgaa agcctggttg gactcttctt acctcgtgta ggctggagct 60 gcttc 65 <210> 108 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 108 ttattcgacg ttcagcgcgt cattaaccag atcttgttgc tgtttcatat gaatatcctc 60 cttag 65 <210> 109 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 109 atgagtagcg tagatattct ggtccctgac ctgcctgaat ccgtagtgta ggctggagct 60 gcttc 65 <210> 110 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 110 ctacacgtcc agcagcagac gcgtcggatc ttccagcaac tctttcatat gaatatcctc 60 cttag 65 <210> 111 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 111 gtgcaaacct ttcaagccga tcttgccatt gtaggcgccg gtggcgtgta ggctggagct 60 gcttc 65 <210> 112 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 112 tcagccattc gccttctcct tcttattggc tgcttccgcc ttatccatat gaatatcctc 60 cttag 65 <210> 113 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 113 atggctgaga tgaaaaacct gaaaattgag gtggtgcgct ataacgtgta ggctggagct 60 gcttc 65 <210> 114 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 114 ttagcgtggt ttcagggtcg cgataagaaa gtctttcgaa ctttccatat gaatatcctc 60 cttag 65 <210> 115 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 115 atgacgacta aacgtaaacc gtatgtacgg ccaatgacgt ccaccgtgta ggctggagct 60 gcttc 65 <210> 116 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 116 ttaccagtac agggcaacaa acaggattac gatggtggca accaccatat gaatatcctc 60 cttag 65 <210> 117 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 117 atgattaatc caaatccaaa gcgttctgac gaaccggtat tctgggtgta ggctggagct 60 gcttc 65 <210> 118 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 118 ttagattgta acgacaccaa tcagcgtgac aactgtcagg atagccatat gaatatcctc 60 cttag 65 <210> 119 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 119 atgatttcag gcattttagc atccccgggt atcgctttcg gtaaagtgta ggctggagct 60 gcttc 65 <210> 120 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 120 ttagcagatt gttttttctt caatgaactt gttaaccagc gtcatcatat gaatatcctc 60 cttag 65 <210> 121 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 121 atgtttaaga atgcatttgc taacctgcaa aaggtcggta aatcggtgta ggctggagct 60 gcttc 65 <210> 122 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 122 ttagtggtta cggatgtact catccatctc ggttttcagg ttatccatat gaatatcctc 60 cttag 65 <210> 123 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 123 gtgaaaccag taacgttata cgatgtcgca gagtatgccg gtgtcgtgta ggctggagct 60 gcttc 65 <210> 124 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 124 tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcatcatat gaatatcctc 60 cttag 65 <210> 125 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 125 atgattattt ccgcagccag cgattatcgc gccgcagcgc aacgcgtgta ggctggagct 60 gcttc 65 <210> 126 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 126 ctatgccgca ttccctttcg ccatgggagc cagtgccgca ggcaacatat gaatatcctc 60 cttag 65 <210> 127 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 127 atgaaaaaca tcaatccaac gcagaccgct gcctggcagg cactagtgta ggctggagct 60 gcttc 65 <210> 128 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 128 ttaaccgcgc cacgctttat agcggttaat cagaccattg gtcgacatat gaatatcctc 60 cttag 65 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 129 cggtgccctg aatgaactgc 20 <210> 130 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 130 cagtcatagc cgaatagcct 20 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 131 atacgtgtcc cgagcggtag 20 <210> 132 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 132 tacacatccc gccatcagca 20 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 133 gaagtaaacg ggaaaatcaa 20 <210> 134 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplificatio <400> 134 agaagtggca taagaaaacg 20 <210> 135 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 135 ccattggctg aaaattacgc 20 <210> 136 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 136 gttccattgc acggatcacg 20 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 137 atgccgtaga agccgccagt 20 <210> 138 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 138 tgttggtgcg cagctcgaag 20 <210> 139 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 139 gcaaatctgg tttcatcaac 20 <210> 140 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 140 tcccttgcac aaaacaaagt 20 <210> 141 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 141 ggatttggtt ctcgcataat 20 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 142 agcattaacg gtagggtcgt 20 <210> 143 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 143 gctgattctc gcgaataaac 20 <210> 144 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 144 aaaaacgttc ttgcgcgtct 20 <210> 145 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 145 tctgtttgtc accaccccgc 20 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 146 aagccagcac ctggaagcag 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 147 aagagctgcc gcaggaggat 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 148 gccgccctct taagtcaaat 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 149 ggattttagc aatattcgct 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 150 cctaatagca ggaagaagac 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 151 gctgaactgt tgctggaaga 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 152 ggcgtgcttt tacaactaca 20 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 153 tagtaaataa cccaaccggc 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 154 tcagtgagcg cagtgtttta 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 155 attaatggtg agagtttgga 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 156 tgcttttttt tattattcgc 20 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 157 gctttataaa agacgacgaa 20 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 158 gtaacgacaa ttccttaagg 20 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 159 tttatatgcc catggtttct 20 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 160 atctgttaga ggcggatgat 20 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 161 ctggaacgtt aaatctttga 20 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 162 ccagtttagt agctttcatt 20 <210> 163 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 163 gatttgttca acattaactc atcgg 25 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 164 tgcgattaac agacaccctt 20 <210> 165 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 165 tctcaggtgc tcacagaaca 20 <210> 166 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 166 tatggaagag gcgctactgc 20 <210> 167 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 167 cgacctgctg cataaacacc 20 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 168 tgaacgctaa ggtgattgca 20 <210> 169 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 169 acgtagacaa gagctcgcaa 20 <210> 170 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 170 catcacgtac gactgcgtcg 20 <210> 171 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 171 tgcaactttg tgctgagca 19 <210> 172 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 172 tatcgcttcc gggcattgtc 20 <210> 173 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 173 aaatcgatct cgtcaaattt cagac 25 <210> 174 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 174 aggaaccaca aatcgccata 20 <210> 175 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 175 gacgtgaaga ttactacgct 20 <210> 176 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 176 agttcaatgc tgaaccacac 20 <210> 177 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 177 tagccgcgac cacggtaaga aggag 25 <210> 178 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 178 cagcgcatca cccggaaaca 20 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 179 atcgtgatca ttaacctgat 20 <210> 180 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 180 ttaccctgat aaattaccgc 20 <210> 181 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 181 gaatctggtg tatatggcga 20 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 182 tcttcgctat tacgccagct 20 <210> 183 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 183 cgtcagcgga tgtatctggt 20 <210> 184 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 184 gcggaatttc tggttcgtaa 20 <210> 185 <211> 387 <212> PRT <213> Escherichia coli <400> 185 Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys 1 5 10 15 Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val 20 25 30 Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp 35 40 45 Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly 50 55 60 Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu 65 70 75 80 Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser 85 90 95 Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu 100 105 110 Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys 115 120 125 Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser 130 135 140 Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys 145 150 155 160 Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp 165 170 175 Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val 180 185 190 Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val 195 200 205 Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu 210 215 220 Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val 225 230 235 240 Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile 245 250 255 Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu 260 265 270 Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val 275 280 285 Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu 290 295 300 Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp 305 310 315 320 Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln 325 330 335 Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser 340 345 350 Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu 355 360 365 Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu 370 375 380 Ala Ala Arg 385 <210> 186 <211> 1164 <212> DNA <213> Escherichia coli <400> 186 atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60 ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120 gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180 gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240 gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300 accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360 caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420 gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480 caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540 tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600 gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660 ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720 cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780 ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840 cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900 cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960 gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020 acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080 gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140 cgtatatacg aagccgcccg ctaa 1164 <210> 187 <211> 371 <212> PRT <213> Porphyromonas gingivalis <400> 187 Met Gln Leu Phe Lys Leu Lys Ser Val Thr His His Phe Asp Thr Phe 1 5 10 15 Ala Glu Phe Ala Lys Glu Phe Cys Leu Gly Glu Arg Asp Leu Val Ile 20 25 30 Thr Asn Glu Phe Ile Tyr Glu Pro Tyr Met Lys Ala Cys Gln Leu Pro 35 40 45 Cys His Phe Val Met Gln Glu Lys Tyr Gly Gln Gly Glu Pro Ser Asp 50 55 60 Glu Met Met Asn Asn Ile Leu Ala Asp Ile Arg Asn Ile Gln Phe Asp 65 70 75 80 Arg Val Ile Gly Ile Gly Gly Gly Thr Val Ile Asp Ile Ser Lys Leu 85 90 95 Phe Val Leu Lys Gly Leu Asn Asp Val Leu Asp Ala Phe Asp Arg Lys 100 105 110 Ile Pro Leu Ile Lys Glu Lys Glu Leu Ile Ile Val Pro Thr Thr Cys 115 120 125 Gly Thr Gly Ser Glu Val Thr Asn Ile Ser Ile Ala Glu Ile Lys Ser 130 135 140 Arg His Thr Lys Met Gly Leu Ala Asp Asp Ala Ile Val Ala Asp His 145 150 155 160 Ala Ile Ile Ile Pro Glu Leu Leu Lys Ser Leu Pro Phe His Phe Tyr 165 170 175 Ala Cys Ser Ala Ile Asp Ala Leu Ile His Ala Ile Glu Ser Tyr Val 180 185 190 Ser Pro Lys Ala Ser Pro Tyr Ser Arg Leu Phe Ser Glu Ala Ala Trp 195 200 205 Asp Ile Ile Leu Glu Val Phe Lys Lys Ile Ala Glu His Gly Pro Glu 210 215 220 Tyr Arg Phe Glu Lys Leu Gly Glu Met Ile Met Ala Ser Asn Tyr Ala 225 230 235 240 Gly Ile Ala Phe Gly Asn Ala Gly Val Gly Ala Val His Ala Leu Ser 245 250 255 Tyr Pro Leu Gly Gly Asn Tyr His Val Pro His Gly Glu Ala Asn Tyr 260 265 270 Gln Phe Phe Thr Glu Val Phe Lys Val Tyr Gln Lys Lys Asn Pro Phe 275 280 285 Gly Tyr Ile Val Glu Leu Asn Trp Lys Leu Ser Lys Ile Leu Asn Cys 290 295 300 Gln Pro Glu Tyr Val Tyr Pro Lys Leu Asp Glu Leu Leu Gly Cys Leu 305 310 315 320 Leu Thr Lys Lys Pro Leu His Glu Tyr Gly Met Lys Asp Glu Glu Val 325 330 335 Arg Gly Phe Ala Glu Ser Val Leu Lys Thr Gln Gln Arg Leu Leu Ala 340 345 350 Asn Asn Tyr Val Glu Leu Thr Val Asp Glu Ile Glu Gly Ile Tyr Arg 355 360 365 Arg Leu Tyr 370 <210> 188 <211> 1116 <212> DNA <213> Porphyromonas gingivalis <400> 188 atgcaacttt tcaaactcaa gagtgtaaca catcactttg acacttttgc agaatttgcc 60 aaggaattct gtcttggaga acgcgacttg gtaattacca acgagttcat ctatgaaccg 120 tatatgaagg catgccagct cccctgccat tttgttatgc aggagaaata tgggcaaggc 180 gagccttctg acgaaatgat gaataacatc ttggcagaca tccgtaatat ccagttcgac 240 cgcgtaatcg gtatcggagg aggtacggtt attgacatct ctaaactttt cgttctgaaa 300 ggattaaatg atgtactcga tgcattcgac cgcaaaatac ctcttatcaa agagaaagaa 360 ctgatcattg tgcccacaac atgcggaacg ggtagcgagg tgacgaacat ttctatcgca 420 gaaatcaaaa gccgtcacac caaaatggga ttggctgacg atgccattgt tgcagaccat 480 gccatcatca tacctgaact tctgaagagc ttgcctttcc acttctacgc atgcagtgca 540 atcgatgctc ttatccatgc catcgagtca tacgtatctc ctaaagccag tccatattct 600 cgtctgttca gtgaggcggc ttgggacatt atcctggaag tattcaagaa aatcgccgaa 660 cacggccctg aataccgctt cgaaaagctg ggagaaatga tcatggccag caactatgcc 720 ggtatagcct tcggaaatgc aggagtagga gccgtccacg cactatccta cccgttggga 780 ggcaactatc acgtgccgca tggagaagca aactatcagt tcttcacaga ggtattcaaa 840 gtataccaaa agaagaatcc tttcggctat atagtcgaac tcaactggaa gctctccaag 900 atactgaact gccagcccga atacgtatat ccgaagctgg atgaacttct cggatgcctt 960 cttaccaaga aacctttgca cgaatacggc atgaaggacg aagaggtaag aggctttgcg 1020 gaatcagtgc ttaagacaca gcaaagattg ctcgccaaca actacgtaga gcttactgta 1080 gatgagatcg aaggtatcta cagaagactc tactaa 1116 <210> 189 <211> 1220 <212> PRT <213> Chloroflexus aurantiacus <400> 189 Met Ser Gly Thr Gly Arg Leu Ala Gly Lys Ile Ala Leu Ile Thr Gly 1 5 10 15 Gly Ala Gly Asn Ile Gly Ser Glu Leu Thr Arg Arg Phe Leu Ala Glu 20 25 30 Gly Ala Thr Val Ile Ile Ser Gly Arg Asn Arg Ala Lys Leu Thr Ala 35 40 45 Leu Ala Glu Arg Met Gln Ala Glu Ala Gly Val Pro Ala Lys Arg Ile 50 55 60 Asp Leu Glu Val Met Asp Gly Ser Asp Pro Val Ala Val Arg Ala Gly 65 70 75 80 Ile Glu Ala Ile Val Ala Arg His Gly Gln Ile Asp Ile Leu Val Asn 85 90 95 Asn Ala Gly Ser Ala Gly Ala Gln Arg Arg Leu Ala Glu Ile Pro Leu 100 105 110 Thr Glu Ala Glu Leu Gly Pro Gly Ala Glu Glu Thr Leu His Ala Ser 115 120 125 Ile Ala Asn Leu Leu Gly Met Gly Trp His Leu Met Arg Ile Ala Ala 130 135 140 Pro His Met Pro Val Gly Ser Ala Val Ile Asn Val Ser Thr Ile Phe 145 150 155 160 Ser Arg Ala Glu Tyr Tyr Gly Arg Ile Pro Tyr Val Thr Pro Lys Ala 165 170 175 Ala Leu Asn Ala Leu Ser Gln Leu Ala Ala Arg Glu Leu Gly Ala Arg 180 185 190 Gly Ile Arg Val Asn Thr Ile Phe Pro Gly Pro Ile Glu Ser Asp Arg 195 200 205 Ile Arg Thr Val Phe Gln Arg Met Asp Gln Leu Lys Gly Arg Pro Glu 210 215 220 Gly Asp Thr Ala His His Phe Leu Asn Thr Met Arg Leu Cys Arg Ala 225 230 235 240 Asn Asp Gln Gly Ala Leu Glu Arg Arg Phe Pro Ser Val Gly Asp Val 245 250 255 Ala Asp Ala Ala Val Phe Leu Ala Ser Ala Glu Ser Ala Ala Leu Ser 260 265 270 Gly Glu Thr Ile Glu Val Thr His Gly Met Glu Leu Pro Ala Cys Ser 275 280 285 Glu Thr Ser Leu Leu Ala Arg Thr Asp Leu Arg Thr Ile Asp Ala Ser 290 295 300 Gly Arg Thr Thr Leu Ile Cys Ala Gly Asp Gln Ile Glu Glu Val Met 305 310 315 320 Ala Leu Thr Gly Met Leu Arg Thr Cys Gly Ser Glu Val Ile Ile Gly 325 330 335 Phe Arg Ser Ala Ala Ala Leu Ala Gln Phe Glu Gln Ala Val Asn Glu 340 345 350 Ser Arg Arg Leu Ala Gly Ala Asp Phe Thr Pro Pro Ile Ala Leu Pro 355 360 365 Leu Asp Pro Arg Asp Pro Ala Thr Ile Asp Ala Val Phe Asp Trp Gly 370 375 380 Ala Gly Glu Asn Thr Gly Gly Ile His Ala Ala Val Ile Leu Pro Ala 385 390 395 400 Thr Ser His Glu Pro Ala Pro Cys Val Ile Glu Val Asp Asp Glu Arg 405 410 415 Val Leu Asn Phe Leu Ala Asp Glu Ile Thr Gly Thr Ile Val Ile Ala 420 425 430 Ser Arg Leu Ala Arg Tyr Trp Gln Ser Gln Arg Leu Thr Pro Gly Ala 435 440 445 Arg Ala Arg Gly Pro Arg Val Ile Phe Leu Ser Asn Gly Ala Asp Gln 450 455 460 Asn Gly Asn Val Tyr Gly Arg Ile Gln Ser Ala Ala Ile Gly Gln Leu 465 470 475 480 Ile Arg Val Trp Arg His Glu Ala Glu Leu Asp Tyr Gln Arg Ala Ser 485 490 495 Ala Ala Gly Asp His Val Leu Pro Pro Val Trp Ala Asn Gln Ile Val 500 505 510 Arg Phe Ala Asn Arg Ser Leu Glu Gly Leu Glu Phe Ala Cys Ala Trp 515 520 525 Thr Ala Gln Leu Leu His Ser Gln Arg His Ile Asn Glu Ile Thr Leu 530 535 540 Asn Ile Pro Ala Asn Ile Ser Ala Thr Thr Gly Ala Arg Ser Ala Ser 545 550 555 560 Val Gly Trp Ala Glu Ser Leu Ile Gly Leu His Leu Gly Lys Val Ala 565 570 575 Leu Ile Thr Gly Gly Ser Ala Gly Ile Gly Gly Gln Ile Gly Arg Leu 580 585 590 Leu Ala Leu Ser Gly Ala Arg Val Met Leu Ala Ala Arg Asp Arg His 595 600 605 Lys Leu Glu Gln Met Gln Ala Met Ile Gln Ser Glu Leu Ala Glu Val 610 615 620 Gly Tyr Thr Asp Val Glu Asp Arg Val His Ile Ala Pro Gly Cys Asp 625 630 635 640 Val Ser Ser Glu Ala Gln Leu Ala Asp Leu Val Glu Arg Thr Leu Ser 645 650 655 Ala Phe Gly Thr Val Asp Tyr Leu Ile Asn Asn Ala Gly Ile Ala Gly 660 665 670 Val Glu Glu Met Val Ile Asp Met Pro Val Glu Gly Trp Arg His Thr 675 680 685 Leu Phe Ala Asn Leu Ile Ser Asn Tyr Ser Leu Met Arg Lys Leu Ala 690 695 700 Pro Leu Met Lys Lys Gln Gly Ser Gly Tyr Ile Leu Asn Val Ser Ser 705 710 715 720 Tyr Phe Gly Gly Glu Lys Asp Ala Ala Ile Pro Tyr Pro Asn Arg Ala 725 730 735 Asp Tyr Ala Val Ser Lys Ala Gly Gln Arg Ala Met Ala Glu Val Phe 740 745 750 Ala Arg Phe Leu Gly Pro Glu Ile Gln Ile Asn Ala Ile Ala Pro Gly 755 760 765 Pro Val Glu Gly Asp Arg Leu Arg Gly Thr Gly Glu Arg Pro Gly Leu 770 775 780 Phe Ala Arg Arg Ala Arg Leu Ile Leu Glu Asn Lys Arg Leu Asn Glu 785 790 795 800 Leu His Ala Ala Leu Ile Ala Ala Ala Arg Thr Asp Glu Arg Ser Met 805 810 815 His Glu Leu Val Glu Leu Leu Leu Pro Asn Asp Val Ala Ala Leu Glu 820 825 830 Gln Asn Pro Ala Ala Pro Thr Ala Leu Arg Glu Leu Ala Arg Arg Phe 835 840 845 Arg Ser Glu Gly Asp Pro Ala Ala Ser Ser Ser Ser Ala Leu Leu Asn 850 855 860 Arg Ser Ile Ala Ala Lys Leu Leu Ala Arg Leu His Asn Gly Gly Tyr 865 870 875 880 Val Leu Pro Ala Asp Ile Phe Ala Asn Leu Pro Asn Pro Pro Asp Pro 885 890 895 Phe Phe Thr Arg Ala Gln Ile Asp Arg Glu Ala Arg Lys Val Arg Asp 900 905 910 Gly Ile Met Gly Met Leu Tyr Leu Gln Arg Met Pro Thr Glu Phe Asp 915 920 925 Val Ala Met Ala Thr Val Tyr Tyr Leu Ala Asp Arg Asn Val Ser Gly 930 935 940 Glu Thr Phe His Pro Ser Gly Gly Leu Arg Tyr Glu Arg Thr Pro Thr 945 950 955 960 Gly Gly Glu Leu Phe Gly Leu Pro Ser Pro Glu Arg Leu Ala Glu Leu 965 970 975 Val Gly Ser Thr Val Tyr Leu Ile Gly Glu His Leu Thr Glu His Leu 980 985 990 Asn Leu Leu Ala Arg Ala Tyr Leu Glu Arg Tyr Gly Ala Arg Gln Val 995 1000 1005 Val Met Ile Val Glu Thr Glu Thr Gly Ala Glu Thr Met Arg Arg 1010 1015 1020 Leu Leu His Asp His Val Glu Ala Gly Arg Leu Met Thr Ile Val 1025 1030 1035 Ala Gly Asp Gln Ile Glu Ala Ala Ile Asp Gln Ala Ile Thr Arg 1040 1045 1050 Tyr Gly Arg Pro Gly Pro Val Val Cys Thr Pro Phe Arg Pro Leu 1055 1060 1065 Pro Thr Val Pro Leu Val Gly Arg Lys Asp Ser Asp Trp Ser Thr 1070 1075 1080 Val Leu Ser Glu Ala Glu Phe Ala Glu Leu Cys Glu His Gln Leu 1085 1090 1095 Thr His His Phe Arg Val Ala Arg Lys Ile Ala Leu Ser Asp Gly 1100 1105 1110 Ala Ser Leu Ala Leu Val Thr Pro Glu Thr Thr Ala Thr Ser Thr 1115 1120 1125 Thr Glu Gln Phe Ala Leu Ala Asn Phe Ile Lys Thr Thr Leu His 1130 1135 1140 Ala Phe Thr Ala Thr Ile Gly Val Glu Ser Glu Arg Thr Ala Gln 1145 1150 1155 Arg Ile Leu Ile Asn Gln Val Asp Leu Thr Arg Arg Ala Arg Ala 1160 1165 1170 Glu Glu Pro Arg Asp Pro His Glu Arg Gln Gln Glu Leu Glu Arg 1175 1180 1185 Phe Ile Glu Ala Val Leu Leu Val Thr Ala Pro Leu Pro Pro Glu 1190 1195 1200 Ala Asp Thr Arg Tyr Ala Gly Arg Ile His Arg Gly Arg Ala Ile 1205 1210 1215 Thr Val 1220 <210> 190 <211> 3660 <212> DNA <213> Chloroflexus aurantiacus <400> 190 atgagcggaa caggacgact ggcaggaaag attgcgttaa ttaccggtgg cgccggcaat 60 atcggcagtg aattgacacg tcgctttctc gcagagggag cgacggtcat tattagtgga 120 cggaatcggg cgaagttgac cgcactggcc gaacggatgc aggcagaggc aggagtgccg 180 gcaaagcgca tcgatctcga agtcatggat gggagtgatc cggtcgcggt acgtgccggt 240 atcgaagcga ttgtggcccg tcacggccag atcgacattc tggtcaacaa tgcaggaagt 300 gccggtgccc agcgtcgtct ggccgagatt ccactcactg aagctgaatt aggccctggc 360 gccgaagaga cgcttcatgc cagcatcgcc aatttacttg gtatgggatg gcatctgatg 420 cgtattgcgg cacctcatat gccggtagga agtgcggtca tcaatgtctc gaccatcttt 480 tcacgggctg agtactacgg gcggattccg tatgtcaccc ctaaagctgc tcttaatgct 540 ctatctcaac ttgctgcgcg tgagttaggt gcacgtggca tccgcgttaa tacgatcttt 600 cccggcccga ttgaaagtga tcgcatccgt acagtgttcc agcgtatgga tcagctcaag 660 gggcggcccg aaggcgacac agcgcaccat tttttgaaca ccatgcgatt gtgtcgtgcc 720 aacgaccagg gcgcgcttga acgtcggttc ccctccgtcg gtgatgtggc agacgccgct 780 gtctttctgg ccagtgccga atccgccgct ctctccggtg agacgattga ggttacgcac 840 ggaatggagt tgccggcctg cagtgagacc agcctgctgg cccgtactga tctgcgcacg 900 attgatgcca gtggccgcac gacgctcatc tgcgccggcg accagattga agaggtgatg 960 gcgctcaccg gtatgttgcg tacctgtggg agtgaagtga tcatcggctt ccgttcggct 1020 gcggcgctgg cccagttcga gcaggcagtc aatgagagtc ggcggctggc cggcgcagac 1080 tttacgcctc ccattgcctt gccactcgat ccacgcgatc cggcaacaat tgacgctgtc 1140 ttcgattggg ccggcgagaa taccggcggg attcatgcag cggtgattct gcctgctacc 1200 agtcacgaac cggcaccgtg cgtgattgag gttgatgatg agcgggtgct gaattttctg 1260 gccgatgaaa tcaccgggac aattgtgatt gccagtcgcc tggcccgtta ctggcagtcg 1320 caacggctta cccccggcgc acgtgcgcgt gggccgcgtg tcatttttct ctcgaacggt 1380 gccgatcaaa atgggaatgt ttacggacgc attcaaagtg ccgctatcgg tcagctcatt 1440 cgtgtgtggc gtcacgaggc tgaacttgac tatcagcgtg ccagcgccgc cggtgatcat 1500 gtgctgccgc cggtatgggc caatcagatt gtgcgcttcg ctaaccgcag ccttgaaggg 1560 ttagaatttg cctgtgcctg gacagctcaa ttgctccata gtcaacgcca tatcaatgag 1620 attaccctca acatccctgc caacattagc gccaccaccg gcgcacgcag tgcatcggtc 1680 ggatgggcgg aaagcctgat cgggttgcat ttggggaaag ttgccttgat taccggtggc 1740 agcgccggta ttggtgggca gatcgggcgc ctcctggctt tgagtggcgc gcgcgtgatg 1800 ctggcagccc gtgatcggca taagctcgaa cagatgcagg cgatgatcca atctgagctg 1860 gctgaggtgg ggtataccga tgtcgaagat cgcgtccaca ttgcaccggg ctgcgatgtg 1920 agtagcgaag cgcagcttgc ggatcttgtt gaacgtaccc tgtcagcttt tggcaccgtc 1980 gattatctga tcaacaacgc cgggatcgcc ggtgtcgaag agatggttat cgatatgcca 2040 gttgagggat ggcgccatac cctcttcgcc aatctgatca gcaactactc gttgatgcgc 2100 aaactggcgc cgttgatgaa aaaacagggt agcggttaca tccttaacgt ctcatcatac 2160 tttggcggtg aaaaagatgc ggccattccc taccccaacc gtgccgatta cgccgtctcg 2220 aaggctggtc agcgggcaat ggccgaagtc tttgcgcgct tccttggccc ggagatacag 2280 atcaatgcca ttgcgccggg tccggtcgaa ggtgatcgct tgcgcggtac cggtgaacgt 2340 cccggcctct ttgcccgtcg ggcgcggctg attttggaga acaagcggct gaatgagctt 2400 cacgctgctc ttatcgcggc tgcgcgcacc gatgagcgat ctatgcacga actggttgaa 2460 ctgctcttac ccaatgatgt ggccgcacta gagcagaatc ccgcagcacc taccgcgttg 2520 cgtgaactgg cacgacgttt tcgcagcgaa ggcgatccgg cggcatcatc aagcagtgcg 2580 ctgctgaacc gttcaattgc cgctaaattg ctggctcgtt tgcataatgg tggctatgtg 2640 ttgcctgccg acatctttgc aaacctgcca aacccgcccg atcccttctt cacccgagcc 2700 cagattgatc gcgaggctcg caaggttcgt gacggcatca tggggatgct ctacctgcaa 2760 cggatgccga ctgagtttga tgtcgcaatg gccaccgtct attaccttgc cgaccgcaat 2820 gtcagtggtg agacattcca cccatcaggt ggtttgcgtt acgaacgcac ccctaccggt 2880 ggcgaactct tcggcttgcc ctcaccggaa cggctggcgg agctggtcgg aagcacggtc 2940 tatctgatag gtgaacatct gactgaacac cttaacctgc ttgcccgtgc gtacctcgaa 3000 cgttacgggg cacgtcaggt agtgatgatt gttgagacag aaaccggggc agagacaatg 3060 cgtcgcttgc tccacgatca cgtcgaggct ggtcggctga tgactattgt ggccggtgat 3120 cagatcgaag ccgctatcga ccaggctatc actcgctacg gtcgcccagg gccggtcgtc 3180 tgtaccccct tccggccact gccgacggta ccactggtcg ggcgtaaaga cagtgactgg 3240 agcacagtgt tgagtgaggc tgaatttgcc gagttgtgcg aacaccagct cacccaccat 3300 ttccgggtag cgcgcaagat tgccctgagt gatggtgcca gtctcgcgct ggtcactccc 3360 gaaactacgg ctacctcaac taccgagcaa tttgctctgg ctaacttcat caaaacgacc 3420 cttcacgctt ttacggctac gattggtgtc gagagcgaaa gaactgctca gcgcattctg 3480 atcaatcaag tcgatctgac ccggcgtgcg cgtgccgaag agccgcgtga tccgcacgag 3540 cgtcaacaag aactggaacg ttttatcgag gcagtcttgc tggtcactgc accactcccg 3600 cctgaagccg atacccgtta cgccgggcgg attcatcgcg gacgggcgat taccgtgtaa 3660 <210> 191 <211> 455 <212> PRT <213> Chloroflexus aurantiacus <400> 191 Met Ala Lys Ala Ser Arg Leu Thr Arg Ser Thr Gly Gln Pro Thr Glu 1 5 10 15 Val Ser Glu Gly Gln Val Thr Gly Thr Ser Glu Met Pro Pro Thr Gly 20 25 30 Glu Glu Pro Ser Gly His Ala Glu Ser Lys Pro Pro Ala Ser Asp Pro 35 40 45 Met Ser Thr Pro Gly Thr Gly Gln Glu Gln Leu Pro Leu Ser Gly Ile 50 55 60 Arg Val Ile Asp Val Gly Asn Phe Leu Ala Gly Pro Tyr Ala Ala Ser 65 70 75 80 Ile Leu Gly Glu Phe Gly Ala Glu Val Leu Lys Ile Glu His Pro Leu 85 90 95 Gly Gly Asp Pro Met Arg Arg Phe Gly Thr Ala Thr Ala Arg His Asp 100 105 110 Ala Thr Leu Ala Trp Leu Ser Glu Ala Arg Asn Arg Lys Ser Val Thr 115 120 125 Ile Asp Leu Arg Gln Gln Glu Gly Val Ala Leu Phe Leu Lys Leu Val 130 135 140 Ala Lys Ser Asp Ile Leu Ile Glu Asn Phe Arg Pro Gly Thr Met Glu 145 150 155 160 Glu Trp Gly Leu Ser Trp Pro Val Leu Gln Ala Thr Asn Pro Gly Leu 165 170 175 Ile Met Leu Arg Val Ser Gly Tyr Gly Gln Thr Gly Pro Tyr Arg Arg 180 185 190 Arg Ser Gly Phe Ala His Ile Ala His Ala Phe Ser Gly Leu Ser Tyr 195 200 205 Leu Ala Gly Phe Pro Gly Glu Thr Pro Val Leu Pro Gly Thr Ala Pro 210 215 220 Leu Gly Asp Tyr Ile Ala Ser Leu Phe Gly Ala Ile Gly Ile Leu Ile 225 230 235 240 Ala Leu Arg His Lys Glu Gln Thr Gly Arg Gly Gln Leu Ile Asp Val 245 250 255 Gly Ile Tyr Glu Ala Val Phe Arg Ile Leu Asp Glu Ile Ala Pro Ala 260 265 270 Tyr Gly Leu Phe Gly Lys Ile Arg Glu Arg Glu Gly Ala Gly Ser Phe 275 280 285 Ile Ala Val Pro His Gly His Phe Arg Ser Lys Asp Gly Lys Trp Val 290 295 300 Ala Ile Ala Cys Thr Thr Asp Lys Met Phe Glu Arg Leu Ala Glu Ala 305 310 315 320 Met Glu Arg Pro Glu Leu Ala Ser Pro Glu Leu Tyr Gly Asp Gln Arg 325 330 335 Lys Arg Leu Ala Ala Arg Asp Ile Val Asn Gln Ile Thr Ile Glu Trp 340 345 350 Val Gly Ser Leu Thr Arg Asp Glu Val Met Arg Arg Cys Leu Glu Lys 355 360 365 Glu Val Pro Val Gly Pro Leu Asn Ser Ile Ala Asp Met Phe Asn Asp 370 375 380 Glu His Phe Leu Ala Arg Gly Asn Phe Ala Cys Ile Glu Ala Glu Gly 385 390 395 400 Ile Gly Glu Val Val Val Pro Asn Val Ile Pro Arg Leu Ser Glu Thr 405 410 415 Pro Gly Arg Val Thr Asn Leu Gly Pro Pro Leu Gly Asn Ala Thr Tyr 420 425 430 Glu Val Leu Arg Glu Leu Leu Asp Ile Ser Ala Glu Glu Ile Lys Arg 435 440 445 Leu Arg Ser Arg Lys Ile Ile 450 455 <210> 192 <211> 1368 <212> PRT <213> Chloroflexus aurantiacus <400> 192 Ala Thr Gly Gly Cys Ala Ala Ala Ala Gly Cys Gly Thr Cys Ala Cys 1 5 10 15 Gly Cys Cys Thr Gly Ala Cys Cys Ala Gly Ala Thr Cys Ala Ala Cys 20 25 30 Cys Gly Gly Thr Cys Ala Gly Cys Cys Ala Ala Cys Gly Gly Ala Gly 35 40 45 Gly Thr Gly Thr Cys Ala Gly Ala Ala Gly Gly Ala Cys Ala Gly Gly 50 55 60 Thr Cys Ala Cys Cys Gly Gly Gly Ala Cys Ala Ala Gly Cys Gly Ala 65 70 75 80 Gly Ala Thr Gly Cys Cys Cys Cys Cys Cys Ala Cys Ala Gly Gly Ala 85 90 95 Gly Ala Ala Gly Ala Ala Cys Cys Ala Thr Cys Ala Gly Gly Ala Cys 100 105 110 Ala Cys Gly Cys Ala Gly Ala Ala Thr Cys Ala Ala Ala Gly Cys Cys 115 120 125 Gly Cys Cys Gly Gly Cys Cys Ala Gly Thr Gly Ala Thr Cys Cys Gly 130 135 140 Ala Thr Gly Ala Gly Cys Ala Cys Ala Cys Cys Gly Gly Gly Cys Ala 145 150 155 160 Cys Cys Gly Gly Thr Cys Ala Gly Gly Ala Gly Cys Ala Gly Thr Thr 165 170 175 Gly Cys Cys Gly Thr Thr Gly Ala Gly Thr Gly Gly Cys Ala Thr Thr 180 185 190 Cys Gly Gly Gly Thr Cys Ala Thr Thr Gly Ala Thr Gly Thr Ala Gly 195 200 205 Gly Thr Ala Ala Thr Thr Thr Thr Cys Thr Gly Gly Cys Cys Gly Gly 210 215 220 Cys Cys Cys Gly Thr Ala Thr Gly Cys Thr Gly Cys Thr Thr Cys Cys 225 230 235 240 Ala Thr Cys Cys Thr Gly Gly Gly Thr Gly Ala Ala Thr Thr Cys Gly 245 250 255 Gly Thr Gly Cys Cys Gly Ala Gly Gly Thr Gly Cys Thr Cys Ala Ala 260 265 270 Gly Ala Thr Cys Gly Ala Ala Cys Ala Cys Cys Cys Gly Cys Thr Gly 275 280 285 Gly Gly Thr Gly Gly Cys Gly Ala Thr Cys Cys Gly Ala Thr Gly Cys 290 295 300 Gly Thr Cys Gly Thr Thr Thr Cys Gly Gly Cys Ala Cys Thr Gly Cys 305 310 315 320 Ala Ala Cys Thr Gly Cys Gly Cys Gly Cys Cys Ala Cys Gly Ala Thr 325 330 335 Gly Cys Ala Ala Cys Ala Cys Thr Gly Gly Cys Cys Thr Gly Gly Cys 340 345 350 Thr Gly Ala Gly Cys Gly Ala Gly Gly Cys Cys Cys Gly Thr Ala Ala 355 360 365 Cys Cys Gly Thr Ala Ala Gly Thr Cys Gly Gly Thr Cys Ala Cys Gly 370 375 380 Ala Thr Thr Gly Ala Thr Cys Thr Gly Cys Gly Thr Cys Ala Gly Cys 385 390 395 400 Ala Ala Gly Ala Gly Gly Gly Cys Gly Thr Thr Gly Cys Gly Cys Thr 405 410 415 Cys Thr Thr Thr Cys Thr Gly Ala Ala Gly Cys Thr Gly Gly Thr Cys 420 425 430 Gly Cys Cys Ala Ala Ala Thr Cys Cys Gly Ala Cys Ala Thr Thr Cys 435 440 445 Thr Gly Ala Thr Thr Gly Ala Ala Ala Ala Cys Thr Thr Thr Cys Gly 450 455 460 Cys Cys Cys Cys Gly Gly Thr Ala Cys Gly Ala Thr Gly Gly Ala Ala 465 470 475 480 Gly Ala Ala Thr Gly Gly Gly Gly Cys Thr Thr Gly Ala Gly Cys Thr 485 490 495 Gly Gly Cys Cys Thr Gly Thr Thr Thr Thr Gly Cys Ala Gly Gly Cys 500 505 510 Gly Ala Cys Gly Ala Ala Thr Cys Cys Cys Gly Gly Ala Cys Thr Gly 515 520 525 Ala Thr Thr Ala Thr Gly Cys Thr Gly Cys Gly Gly Gly Thr Gly Thr 530 535 540 Cys Gly Gly Gly Cys Thr Ala Thr Gly Gly Thr Cys Ala Gly Ala Cys 545 550 555 560 Cys Gly Gly Gly Cys Cys Gly Thr Ala Cys Cys Gly Thr Cys Gly Gly 565 570 575 Cys Gly Thr Thr Cys Gly Gly Gly Gly Thr Thr Thr Gly Cys Cys Cys 580 585 590 Ala Thr Ala Thr Thr Gly Cys Cys Cys Ala Cys Gly Cys Thr Thr Thr 595 600 605 Cys Ala Gly Cys Gly Gly Cys Cys Thr Cys Thr Cys Gly Thr Ala Thr 610 615 620 Cys Thr Gly Gly Cys Cys Gly Gly Gly Thr Thr Cys Cys Cys Cys Gly 625 630 635 640 Gly Cys Gly Ala Ala Ala Cys Gly Cys Cys Ala Gly Thr Cys Thr Thr 645 650 655 Gly Cys Cys Gly Gly Gly Ala Ala Cys Gly Gly Cys Ala Cys Cys Gly 660 665 670 Cys Thr Cys Gly Gly Cys Gly Ala Cys Thr Ala Thr Ala Thr Cys Gly 675 680 685 Cys Cys Ala Gly Thr Cys Thr Gly Thr Thr Cys Gly Gly Gly Gly Cys 690 695 700 Gly Ala Thr Thr Gly Gly Gly Ala Thr Thr Thr Thr Gly Ala Thr Cys 705 710 715 720 Gly Cys Gly Cys Thr Gly Cys Gly Cys Cys Ala Cys Ala Ala Ala Gly 725 730 735 Ala Gly Cys Ala Gly Ala Cys Cys Gly Gly Ala Cys Gly Cys Gly Gly 740 745 750 Gly Cys Ala Gly Thr Thr Gly Ala Thr Cys Gly Ala Thr Gly Thr Cys 755 760 765 Gly Gly Gly Ala Thr Thr Thr Ala Cys Gly Ala Ala Gly Cys Gly Gly 770 775 780 Thr Cys Thr Thr Cys Cys Gly Gly Ala Thr Thr Cys Thr Gly Gly Ala 785 790 795 800 Thr Gly Ala Gly Ala Thr Thr Gly Cys Cys Cys Cys Gly Gly Cys Thr 805 810 815 Thr Ala Cys Gly Gly Thr Cys Thr Gly Thr Thr Cys Gly Gly Cys Ala 820 825 830 Ala Gly Ala Thr Thr Cys Gly Thr Gly Ala Ala Cys Gly Cys Gly Ala 835 840 845 Ala Gly Gly Gly Gly Cys Cys Gly Gly Gly Ala Gly Thr Thr Thr Thr 850 855 860 Ala Thr Thr Gly Cys Thr Gly Thr Thr Cys Cys Gly Cys Ala Thr Gly 865 870 875 880 Gly Cys Cys Ala Thr Thr Thr Cys Cys Gly Cys Thr Cys Gly Ala Ala 885 890 895 Gly Gly Ala Cys Gly Gly Cys Ala Ala Gly Thr Gly Gly Gly Thr Thr 900 905 910 Gly Cys Gly Ala Thr Thr Gly Cys Cys Thr Gly Thr Ala Cys Cys Ala 915 920 925 Cys Cys Gly Ala Cys Ala Ala Gly Ala Thr Gly Thr Thr Thr Gly Ala 930 935 940 Ala Cys Gly Gly Cys Thr Gly Gly Cys Cys Gly Ala Ala Gly Cys Ala 945 950 955 960 Ala Thr Gly Gly Ala Gly Cys Gly Cys Cys Cys Gly Gly Ala Ala Cys 965 970 975 Thr Gly Gly Cys Thr Thr Cys Gly Cys Cys Gly Gly Ala Ala Cys Thr 980 985 990 Gly Thr Ala Cys Gly Gly Cys Gly Ala Thr Cys Ala Ala Cys Gly Cys 995 1000 1005 Ala Ala Ala Cys Gly Gly Cys Thr Gly Gly Cys Ala Gly Cys Ala 1010 1015 1020 Cys Gly Cys Gly Ala Thr Ala Thr Thr Gly Thr Gly Ala Ala Cys 1025 1030 1035 Cys Ala Gly Ala Thr Cys Ala Cys Gly Ala Thr Thr Gly Ala Ala 1040 1045 1050 Thr Gly Gly Gly Thr Cys Gly Gly Thr Thr Cys Gly Thr Thr Gly 1055 1060 1065 Ala Cys Gly Cys Gly Cys Gly Ala Cys Gly Ala Gly Gly Thr Gly 1070 1075 1080 Ala Thr Gly Cys Gly Gly Cys Gly Thr Thr Gly Thr Cys Thr Gly 1085 1090 1095 Gly Ala Gly Ala Ala Gly Gly Ala Ala Gly Thr Thr Cys Cys Cys 1100 1105 1110 Gly Thr Thr Gly Gly Cys Cys Cys Ala Cys Thr Cys Ala Ala Cys 1115 1120 1125 Ala Gly Cys Ala Thr Cys Gly Cys Cys Gly Ala Thr Ala Thr Gly 1130 1135 1140 Thr Thr Cys Ala Ala Cys Gly Ala Cys Gly Ala Ala Cys Ala Thr 1145 1150 1155 Thr Thr Thr Cys Thr Gly Gly Cys Thr Cys Gly Cys Gly Gly Cys 1160 1165 1170 Ala Ala Cys Thr Thr Thr Gly Cys Cys Thr Gly Thr Ala Thr Cys 1175 1180 1185 Gly Ala Ala Gly Cys Cys Gly Ala Gly Gly Gly Thr Ala Thr Cys 1190 1195 1200 Gly Gly Cys Gly Ala Ala Gly Thr Gly Gly Thr Gly Gly Thr Thr 1205 1210 1215 Cys Cys Gly Ala Ala Cys Gly Thr Gly Ala Thr Cys Cys Cys Cys 1220 1225 1230 Ala Gly Ala Cys Thr Gly Thr Cys Ala Gly Ala Ala Ala Cys Ala 1235 1240 1245 Cys Cys Gly Gly Gly Ala Cys Gly Gly Gly Thr Gly Ala Cys Cys 1250 1255 1260 Ala Ala Cys Cys Thr Cys Gly Gly Cys Cys Cys Ala Cys Cys Gly 1265 1270 1275 Cys Thr Gly Gly Gly Gly Ala Ala Thr Gly Cys Cys Ala Cys Gly 1280 1285 1290 Thr Ala Thr Gly Ala Gly Gly Thr Gly Thr Thr Gly Cys Gly Cys 1295 1300 1305 Gly Ala Gly Cys Thr Gly Cys Thr Thr Gly Ala Thr Ala Thr Thr 1310 1315 1320 Thr Cys Thr Gly Cys Cys Gly Ala Ala Gly Ala Gly Ala Thr Cys 1325 1330 1335 Ala Ala Gly Cys Gly Thr Cys Thr Gly Cys Gly Cys Ala Gly Cys 1340 1345 1350 Cys Gly Cys Ala Ala Gly Ala Thr Thr Ala Thr Thr Thr Ala Gly 1355 1360 1365 <210> 193 <211> 405 <212> PRT <213> Chloroflexus aurantiacus <400> 193 Met Asp Gly Thr Thr Thr Thr Leu Pro Leu Ala Gly Ile Arg Val Ile 1 5 10 15 Asp Ala Ala Thr Val Ile Ala Ala Pro Phe Cys Ala Thr Leu Leu Gly 20 25 30 Glu Phe Gly Ala Asp Val Leu Lys Val Glu His Pro Ile Gly Gly Asp 35 40 45 Ala Leu Arg Arg Phe Gly Thr Pro Thr Ala Arg Gly Asp Thr Leu Thr 50 55 60 Trp Leu Ser Glu Ser Arg Asn Lys Arg Ser Val Thr Leu Asn Leu Gln 65 70 75 80 His Pro Glu Gly Ala Arg Val Phe Lys Glu Leu Ile Ala His Ser Asp 85 90 95 Val Leu Cys Glu Asn Phe Arg Pro Gly Thr Leu Glu Lys Trp Gly Leu 100 105 110 Gly Trp Asp Val Leu Ser Lys Ile Asn Pro Arg Leu Ile Met Leu Arg 115 120 125 Val Thr Gly Tyr Gly Gln Thr Gly Pro Tyr Arg Asp Arg Pro Gly Phe 130 135 140 Ala Arg Ile Ala His Ala Val Gly Gly Ile Ala Tyr Leu Ala Gly Met 145 150 155 160 Pro Lys Gly Thr Pro Val Thr Pro Gly Ser Thr Thr Leu Ala Asp Tyr 165 170 175 Met Thr Gly Leu Tyr Gly Cys Ile Gly Val Leu Leu Ala Leu Arg His 180 185 190 Arg Glu Gln Thr Gly Arg Gly Gln Tyr Ile Asp Ala Ala Leu Tyr Glu 195 200 205 Ser Val Phe Arg Cys Ser Asp Glu Leu Val Pro Ala Tyr Gly Met Tyr 210 215 220 Arg Lys Val Arg Glu Arg His Gly Ser His Tyr Asn Glu Phe Ala Cys 225 230 235 240 Pro His Gly His Phe Gln Thr Lys Asp Gly Lys Trp Val Ala Ile Ser 245 250 255 Cys Ala Thr Asp Lys Leu Phe Ala Arg Leu Ala Asn Ala Met Gly Arg 260 265 270 Pro Glu Leu Ala Ser Ser Ser Val Tyr Gly Asp Gln Lys Val Arg Leu 275 280 285 Ala His Ala Ser Asp Val Asn Glu Ile Val Arg Asp Trp Cys Ser Ser 290 295 300 Leu Thr Arg Ala Glu Val Leu Glu Arg Cys Tyr Ala Thr Ala Thr Pro 305 310 315 320 Ala Ala Pro Leu Asn Asp Ile Ala Asp Phe Phe Gly Asp Arg His Val 325 330 335 His Ala Arg Arg Asn Leu Val Ala Ile Asp Ala Glu Asp Leu Gly Glu 340 345 350 Thr Leu Ile Met Pro Asn Val Val Pro Lys Leu Ser Glu Thr Pro Gly 355 360 365 Ser Ile Arg Ser Leu Gly Pro Lys Leu Gly Glu His Thr Glu Glu Val 370 375 380 Leu Lys Glu Ile Leu Gly Met Cys Asp Glu Gln Ile Asn Asp Leu Arg 385 390 395 400 Ser Lys Arg Val Ile 405 <210> 194 <211> 1218 <212> DNA <213> Chloroflexus aurantiacus <400> 194 atggatggaa cgaccacaac gttgccgctg gccggaattc gcgttatcga tgccgcgacg 60 gtgattgctg cgcctttttg tgcgaccctg ttgggcgaat tcggcgctga cgtgttgaaa 120 gtagaacatc ctatcggcgg tgatgcgctg cgccgcttcg ggacgccgac cgcacgcggc 180 gatacgctga cctggctgag cgagtcgcgc aacaagcgtt cggttacgct caacctgcaa 240 catcccgaag gggcgcgtgt cttcaaagag ctgatcgccc actccgatgt gctgtgcgaa 300 aattttcgcc ccggtacgct ggaaaaatgg gggctgggtt gggatgtgtt gagcaagatc 360 aacccgcgcc tgattatgtt gcgggtcacc ggctatgggc agaccgggcc gtaccgtgat 420 cgaccggggt ttgcccggat tgcgcacgcc gtcggtggca tcgcgtatct ggccggtatg 480 ccgaaaggga caccggtgac gccggggtca acgacactcg ccgattacat gaccggtctc 540 tacggctgta ttggcgtgct gctggcgctg cgccaccgcg aacagaccgg acgcggccag 600 tacattgatg ccgctctgta cgaatcggtc ttccgctgta gcgatgagct ggtgccggcc 660 tacgggatgt atcgcaaggt gcgtgaacgc cacggttccc actacaacga gtttgcctgt 720 cctcacggcc acttccagac caaagacggg aaatgggtgg cgatctcgtg tgcgaccgat 780 aagctgtttg cccgactggc aaatgcgatg gggcgccccg aactggcgtc gtcgagtgtc 840 tacggcgacc agaaagtacg gctggcgcac gccagtgatg tgaacgagat tgtgcgtgac 900 tggtgtagct cgctgacccg cgccgaagtg cttgagcgct gttacgccac ggctaccccg 960 gcggcaccgc tgaacgacat tgccgacttc ttcggtgatc gccacgtcca cgctcgtcgg 1020 aatctggtcg cgattgatgc cgaagacctg ggggagacgt tgatcatgcc gaatgtggtg 1080 ccaaagctct cggagacacc gggcagcatt cgctcgctcg gcccgaaact cggcgagcat 1140 acggaagagg tcttgaaaga gattctcggc atgtgcgacg agcagatcaa cgatctgcgt 1200 tcaaagcggg tgatatag 1218 <210> 195 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 195 ttgtcaacga tggggtcatg 20 <210> 196 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 196 aaaaatgccg acataacgtc 20 <210> 197 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 197 ccatccgttg aatgagtttt 20 <210> 198 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 198 tggtgttaac tggcaaaatc 20 <210> 199 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 199 gtgacttcca acggcaaaag 20 <210> 200 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer for amplification <400> 200 ccgttggttt gatagcaata 20 <210> 201 <211> 1080 <212> DNA <213> sulfolobus tokodaii <400> 201 atgattctga tgcgccgtac cctgaaagcg gcaatcttgg gtgccaccgg cttagtcggg 60 attgagtacg tacggatgct gagcaatcat ccgtacatca aacccgccta tctggctggg 120 aaagggtcag ttggcaaacc gtatggcgaa gtagtgcgct ggcagactgt gggccaagtt 180 cccaaagaaa ttgccgatat ggaaatcaag ccgactgatc cgaaactgat ggatgatgtt 240 gacatcatct ttagcccact gcctcaaggt gcggcaggac ccgttgagga acaatttgcg 300 aaagaaggat ttccggtcat ttccaattct ccggatcatc ggtttgatcc ggatgtccca 360 ctcctggtgc cagaactgaa tccgcacacc attagcctta ttgacgaaca gcgtaaacgc 420 cgtgaatgga aaggcttcat cgttacgacg ccgttatgca ccgcacaggg tgctgcgatc 480 ccattgggtg ccatcttcaa ggactacaaa atggatggcg cattcattac gaccattcag 540 tctcttagcg gtgcgggata tccgggtatt ccgtccctgg atgtggtgga taacattctg 600 cctttagggg acggccctga cgccaaaacg atcaaggaaa ttttccgcat cctgagtgaa 660 gtgaaacgca atgtggacga acctaaactg gaggacgttt cactggccgc cacaacccat 720 cgcattgcaa ccattcatgg ccactatgag gtgttgtacg tgtcgtttaa ggaagaaaca 780 gcagcggaga aggtcaaaga aacgctggaa aactttcgcg gtgaacctca ggatctcaaa 840 ctgccgacag cgccctcgaa accgatcatt gtgatgaacg aagatactcg cccacaggta 900 tatttcgatc gttgggcggg cgacattccg ggcatgagtg tcgttgttgg ccgtctgaaa 960 caggtcaaca aacgcatgat tcgtctggta tcgcttatcc acaacaccgt acgtggtgct 1020 gcgggcggtg ggattttagc tgcggagttg ctcgtggaga aaggctacat cgagaagtaa 1080 <210> 202 <211> 359 <212> PRT <213> sulfolobus tokodaii <400> 202 Met Ile Leu Met Arg Arg Thr Leu Lys Ala Ala Ile Leu Gly Ala Thr 1 5 10 15 Gly Leu Val Gly Ile Glu Tyr Val Arg Met Leu Ser Asn His Pro Tyr 20 25 30 Ile Lys Pro Ala Tyr Leu Ala Gly Lys Gly Ser Val Gly Lys Pro Tyr 35 40 45 Gly Glu Val Val Arg Trp Gln Thr Val Gly Gln Val Pro Lys Glu Ile 50 55 60 Ala Asp Met Glu Ile Lys Pro Thr Asp Pro Lys Leu Met Asp Asp Val 65 70 75 80 Asp Ile Ile Phe Ser Pro Leu Pro Gln Gly Ala Ala Gly Pro Val Glu 85 90 95 Glu Gln Phe Ala Lys Glu Gly Phe Pro Val Ile Ser Asn Ser Pro Asp 100 105 110 His Arg Phe Asp Pro Asp Val Pro Leu Leu Val Pro Glu Leu Asn Pro 115 120 125 His Thr Ile Ser Leu Ile Asp Glu Gln Arg Lys Arg Arg Glu Trp Lys 130 135 140 Gly Phe Ile Val Thr Thr Pro Leu Cys Thr Ala Gln Gly Ala Ala Ile 145 150 155 160 Pro Leu Gly Ala Ile Phe Lys Asp Tyr Lys Met Asp Gly Ala Phe Ile 165 170 175 Thr Thr Ile Gln Ser Leu Ser Gly Ala Gly Tyr Pro Gly Ile Pro Ser 180 185 190 Leu Asp Val Val Asp Asn Ile Leu Pro Leu Gly Asp Gly Pro Asp Ala 195 200 205 Lys Thr Ile Lys Glu Ile Phe Arg Ile Leu Ser Glu Val Lys Arg Asn 210 215 220 Val Asp Glu Pro Lys Leu Glu Asp Val Ser Leu Ala Ala Thr Thr His 225 230 235 240 Arg Ile Ala Thr Ile His Gly His Tyr Glu Val Leu Tyr Val Ser Phe 245 250 255 Lys Glu Glu Thr Ala Ala Glu Lys Val Lys Glu Thr Leu Glu Asn Phe 260 265 270 Arg Gly Glu Pro Gln Asp Leu Lys Leu Pro Thr Ala Pro Ser Lys Pro 275 280 285 Ile Ile Val Met Asn Glu Asp Thr Arg Pro Gln Val Tyr Phe Asp Arg 290 295 300 Trp Ala Gly Asp Ile Pro Gly Met Ser Val Val Val Gly Arg Leu Lys 305 310 315 320 Gln Val Asn Lys Arg Met Ile Arg Leu Val Ser Leu Ile His Asn Thr 325 330 335 Val Arg Gly Ala Ala Gly Gly Gly Ile Leu Ala Ala Glu Leu Leu Val 340 345 350 Glu Lys Gly Tyr Ile Glu Lys 355 <210> 203 <211> 8457 <212> DNA <213> Artificial Sequence <220> <223> plasmid <400> 203 ttcgagctcg gtaatgtcgt ttaccctgat tcagcaagcg actccgcgct tacatcgcag 60 cgaacttgcg gttccgggtt caaatccgac ctttatggag aaatcagcag ccagcaaggc 120 cgatgtcatc ttcttggatc tggaggatgc cgttgcacct gatgacaaag aacaggcgcg 180 taagaacatc attcaggcac tgaacgatct ggactggggc aacaaaacga tgatgatccg 240 cattaacggt ctggacaccc actacatgta tcgggatgtg gtcgacatcg tagaagcatg 300 ccctcgcctg gatatgattc tcattcccaa agtcggagta ccagcagacg tgtatgcgat 360 tgatgtgctg acgacgcaaa tcgaacaggc gaagaaacgg gagaagaaaa tcggattcga 420 ggtgctcatt gaaacggctt taggcatggc caatgttgaa gccatcgcca catcttcgaa 480 acgcttggaa gcgatgtcgt ttggtgtggc cgattatgca gcatccactc gtgcccgtag 540 taccgtgatt ggtggtgtga atgcggatta ctccgttctc actgacaaag atgaagcagg 600 gaaccgtcaa acccattggc aagatccgtg gctgtttgcg cagaatcgca tgctggttgc 660 ttgccgtgct tacgggcttc gcccgattga tgggccattt ggcgacttca gcgatcccga 720 tggctatacc agtgctgcgc gtcgttgtgc ggcgctgggc tttgaaggca aatgggcgat 780 tcacccgagt cagatcgact tagcgaacga ggtgttcaca ccgtctgaag ctgaagtcac 840 caaagcgcgc cgcattctgg aggcaatgga agaagcggcc aaagccggtc gtggcgctgt 900 aagcctggac ggtcgcttga ttgacatcgc cagcattcgc atggctgaag ccctgatcca 960 gaaagcggat gcaatgggcg gcaaataagt ttaactttaa gaaggagata taccatgatt 1020 ctgatgcgcc gtaccctgaa agcggcaatc ttgggtgcca ccggcttagt cgggattgag 1080 tacgtacgga tgctgagcaa tcatccgtac atcaaacccg cctatctggc tgggaaaggg 1140 tcagttggca aaccgtatgg cgaagtagtg cgctggcaga ctgtgggcca agttcccaaa 1200 gaaattgccg atatggaaat caagccgact gatccgaaac tgatggatga tgttgacatc 1260 atctttagcc cactgcctca aggtgcggca ggacccgttg aggaacaatt tgcgaaagaa 1320 ggatttccgg tcatttccaa ttctccggat catcggtttg atccggatgt cccactcctg 1380 gtgccagaac tgaatccgca caccattagc cttattgacg aacagcgtaa acgccgtgaa 1440 tggaaaggct tcatcgttac gacgccgtta tgcaccgcac agggtgctgc gatcccattg 1500 ggtgccatct tcaaggacta caaaatggat ggcgcattca ttacgaccat tcagtctctt 1560 agcggtgcgg gatatccggg tattccgtcc ctggatgtgg tggataacat tctgccttta 1620 ggggacggcc ctgacgccaa aacgatcaag gaaattttcc gcatcctgag tgaagtgaaa 1680 cgcaatgtgg acgaacctaa actggaggac gtttcactgg ccgccacaac ccatcgcatt 1740 gcaaccattc atggccacta tgaggtgttg tacgtgtcgt ttaaggaaga aacagcagcg 1800 gagaaggtca aagaaacgct ggaaaacttt cgcggtgaac ctcaggatct caaactgccg 1860 acagcgccct cgaaaccgat cattgtgatg aacgaagata ctcgcccaca ggtatatttc 1920 gatcgttggg cgggcgacat tccgggcatg agtgtcgttg ttggccgtct gaaacaggtc 1980 aacaaacgca tgattcgtct ggtatcgctt atccacaaca ccgtacgtgg tgctgcgggc 2040 ggtgggattt tagctgcgga gttgctcgtg gagaaaggct acatcgagaa gtaagtttaa 2100 ctttaagaag gagatatacc atgaaagcag cagttctgca tacctataaa gaaccgctga 2160 gcattgaaga tgtgaatatt tcacagccga aagccggtga agtgaaaatc aaagttaaag 2220 caaccggtct gtgtcgtagt gatgttcatg tttttgaagg taaaacaccg gttccgcctc 2280 cggttgttgc aggtcatgaa attagcggta ttgttgaaga ggttggtccg ggtgttaccc 2340 gtgttaaacc gggtgatcgt gttattagcg catttattca tccgtgtggt aaatgcggta 2400 attgtgttgc cggtaaagaa aatctgtgtg aaacctttag ccaggttcgt ctgaaaggtg 2460 ttatgccgga tggcaccagc cgtctgagca aagatggcaa agaaattcgt acctttctgg 2520 gtggtggttt tgcagaatat gcaattgttg gtgaaaatgc actgacccgt gttccggaag 2580 atatggatct ggaaaaagtt gcagttctgg gttgtgccgg tctgaccggt tatggtgcaa 2640 ttagcagcag caaaattgaa cctggtgata ccgttgcagt tattggtgtt ggtggtgtgg 2700 gtctgagcac cattcagctg ctgcgtgcaa gcggtgcagg tcgtattatt gcagttggca 2760 ccaaaaaatg gaaactggat cgtgcaatgg aactgggtgc aaccgatgtt gttaacagta 2820 aagaaattga tccggtgaaa gccatcaaag aaatcaccgg tggtggtccg caggttgtta 2880 ttgaagccgg tggtaatgaa gataccattc acatggcact ggatagcgtt cgtattggtg 2940 gtaaagttgt tctggttggt ctgcctccgg caaccgcaat gattccgatt cgtgttgcaa 3000 gcattgttcg tggtggtatt gaagttgttg gtaattatgg tggtcgtccg cgtgttgata 3060 tgccgaaact gctggaactg gttcgtcagg gtcgttatga tccgagccgt ctggttaccg 3120 gtcgttttcg tctggaagaa attaatgaag ccgtcaaaat gctggaagaa ggtgaagcaa 3180 ttcgtagcct gattattccg taagatcctc tagagtcgac ctgcaggcat gcaagcttct 3240 gttttggcgg atgagagaag aaattcgtcg cccgccataa actgccaggc atcaaattaa 3300 gcagaaggcc atcctgacgg atggcctttt tgcgtttcta caaactcttc ctgtctagca 3360 ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt ctaaatacat 3420 tcaaatatgt atccgctcat gctagaaata ttttatctga ttaataagat gatcttcttg 3480 agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac gaaaaaaccg ccttgcaggg 3540 cggtttttcg aaggttctct gagctaccaa ctctttgaac cgaggtaact ggcttggagg 3600 agcgcagtca ccaaaacttg tcctttcagt ttagccttaa ccggcgcatg acttcaagac 3660 taactcctct aaatcaatta ccagtggctg ctgccagtgg tgcttttgca tgtctttccg 3720 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcggactga acggggggtt 3780 cgtgcataca gtccagcttg gagcgaactg cctacccgga actgagtgtc aggcgtggaa 3840 tgagacaaac gcggccataa cagcggaatg acaccggtaa accgaaaggc aggaacagga 3900 gagcgcacga gggagccgcc aggggaaacg cctggtatct ttatagtcct gtcgggtttc 3960 gccaccactg atttgagcgt cagatttcgt gatgcttgtc aggggggcgg agcctatgga 4020 aaaacggctt tgccgcggcc ctctcacttc cctgttaagt atcttcctgg catcttccag 4080 gaaatctccg ccccgttcgt aagccatttc cgctcgccgc agtcgaacga ccgagcgtag 4140 cgagtcagtg agcgaggaag cggaatatat cctgtatcac atattctgct gacgcaccgg 4200 tgcagccttt tttctcctgc cacatgaagc acttcactga caccctcatc agtgccaaca 4260 tagtaagcca gtatacactc cgctagcgct gatgtccggc ggtgcttttg ccgttacgca 4320 ccaccccgtc agtagctgaa caggagggac agctgataga aacagaagcc actggagcac 4380 ctcaaaaaca ccatcataca ctaaatcagt aagttggcag catcacccga cgcactttgc 4440 gccgaataaa tacctgtgac ggaagatcac ttcgcagaat aaataaatcc tggtgtccct 4500 gttgataccg ggaagccctg ggccaacttt tggcgaaaat gagacgttga tcggcacgta 4560 agaggttcca actttcacca taatgaaata agatcactac cgggcgtatt ttttgagtta 4620 tcgagatttt caggagctaa ggaagctaaa atggagaaaa aaatcactgg atataccacc 4680 gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc agttgctcaa 4740 tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac cgtaaagaaa 4800 aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat gaatgctcat 4860 ccggaattcc gtatggcaat gaaagacggt gagctggtga tatgggatag tgttcaccct 4920 tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag tgaataccac 4980 gacgatttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta cggtgaaaac 5040 ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc caatccctgg 5100 gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt cgcccccgtt 5160 ttcaccatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag 5220 gttcatcatg ccgtctgtga tggcttccat gtcggcagaa tgcttaatga attacaacag 5280 tactgcgatg agtggcaggg cggggcgtaa tttttttaag gcagttattg gtgcccttaa 5340 acgcctggtg ctacgcctga ataagtgata ataagcggat gaatggcaga aattcgaaag 5400 caaattcgac ccggtcgtcg gttcagggca gggtcgttaa atagccgctt atgtctattg 5460 ctggtttacc ggtttattga ctaccggaag cagtgtgacc gtgtgcttct caaatgcctg 5520 aggccagttt gctcaggctc tccccgtgga ggtaataatt gacgatatga tcatttattc 5580 tgcctcccag agcctgataa aaacggttag cgcttcgtta atacagatgt aggtgttcca 5640 cagggtagcc agcagcatcc tgcgatgcag atccggaaca taatggtgca gggcgcttgt 5700 ttcggcgtgg gtatggtggc aggccccgtg gccgggggac tgttgggcgc tgccggcacc 5760 tgtcctacga gttgcatgat aaagaagaca gtcataagtg cggcgacgat agtcatgccc 5820 cgcgcccacc ggaaggagct accggacagc ggtgcggact gttgtaactc agaataagaa 5880 atgaggccgc tcatggcgtt gactctcagt catagtatcg tggtatcacc ggttggttcc 5940 actctctgtt gcgggcaact tcagcagcac gtaggggact tccgcgtttc cagactttac 6000 gaaacacgga aaccgaagac cattcatgtt gttgctcagg tcgcagacgt tttgcagcag 6060 cagtcgcttc acgttcgctc gcgtatcggt gattcattct gctaaccagt aaggcaaccc 6120 cgccagccta gccgggtcct caacgacagg agcacgatca tgcgcacccg tggccaggac 6180 ccaacgctgc ccgagatgcg ccgcgtgcgg ctgctggaga tggcggacgc gatggatatg 6240 ttctgccaag ggttggtttg cgcattcaca gttctccgca agaattgatt ggctccaatt 6300 cttggagtgg tgaatccgtt agcgaggtgc cgccggcttc cattcaggtc gaggtggccc 6360 ggctccatgc accgcgacgc aacgcgggga ggcagacaag gtatagggcg gcgcctacaa 6420 tccatgccaa cccgttccat gtgctcgccg aggcggcata aatcgccgtg acgatcagcg 6480 gtccagtgat cgaagttagg ctggtaagag ccgcgagcga tccttgaagc tgtccctgat 6540 ggtcgtcatc tacctgcctg gacagcatgg cctgcaacgc gggcatcccg atgccgccgg 6600 aagcgagaag aatcataatg gggaaggcca tccagcctcg cgtcgcgaac gccagcaaga 6660 cgtagcccag cgcgtcggcc aattcgcgct aacttacatt aattgcgttg cgctcactgc 6720 ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 6780 ggagaggcgg tttgcgtatt gggcgccagg gtggtttttc ttttcaccag tgagacgggc 6840 aacagctgat tgcccttcac cgcctggccc tgagagagtt gcagcaagcg gtccacgctg 6900 gtttgcccca gcaggcgaaa atcctgtttg atggtggttg acggcgggat ataacatgag 6960 ctgtcttcgg tatcgtcgta tcccactacc gagatatccg caccaacgcg cagcccggac 7020 tcggtaatgg cgcgcattgc gcccagcgcc atctgatcgt tggcaaccag catcgcagtg 7080 ggaacgatgc cctcattcag catttgcatg gtttgttgaa aaccggacat ggcactccag 7140 tcgccttccc gttccgctat cggctgaatt tgattgcgag tgagatattt atgccagcca 7200 gccagacgca gacgcgccga gacagaactt aatgggcccg ctaacagcgc gatttgctgg 7260 tgacccaatg cgaccagatg ctccacgccc agtcgcgtac cgtcttcatg ggagaaaata 7320 atactgttga tgggtgtctg gtcagagaca tcaagaaata acgccggaac attagtgcag 7380 gcagcttcca cagcaatggc atcctggtca tccagcggat agttaatgat cagcccactg 7440 acgcgttgcg cgagaagatt gtgcaccgcc gctttacagg cttcgacgcc gcttcgttct 7500 accatcgaca ccaccacgct ggcacccagt tgatcggcgc gagatttaat cgccgcgaca 7560 atttgcgacg gcgcgtgcag ggccagactg gaggtggcaa cgccaatcag caacgactgt 7620 ttgcccgcca gttgttgtgc cacgcggttg ggaatgtaat tcagctccgc catcgccgct 7680 tccacttttt cccgcgtttt cgcagaaacg tggctggcct ggttcaccac gcgggaaacg 7740 gtctgataag agacaccggc atactctgcg acatcgtata acgttactgg tttcacattc 7800 accaccctga attgactctc ttccgggcgc tatcatgcca taccgcgaaa ggttttgcac 7860 cattcgatgg tgtcaacgta aatgcatgcc gcttcgcctt cgcgcgcgaa ttggccgcca 7920 tgccggcgat aatggcctgc ttctcgccga aacgtttggt ggcgggacca gtgacgaagg 7980 cttgagcgag ggcgtgcaag attccgaata ccgcaagcga caggccgatc atcgtcgcgc 8040 tccagcgaaa gcggtcctcg ccgaaaatga cccagagcgc tgccggcacc tgtcctacga 8100 gttgcatgat aaagaagaca gtcataagtg cggcgacgat agtcatgccc cgcgcccacc 8160 ggaaggagct gactgggttg aaggctctca agggcatcgg cggagcttat cgactgcacg 8220 gtgcaccaat gcttctggcg tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc 8280 gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt 8340 gcgccgacat cataacggtt ctggcaaata ttctgaaatg agctgttgac aattaatcat 8400 cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga aacagaa 8457

Claims (25)

  1. 2,4-다이하이드록시부티르산 (2,4-DHB)의 제조 방법으로서,
    a) 말레이트 및/또는 숙시닐-CoA 및/또는 글리옥실레이트를 말릴-CoA로 변환하는 제1 단계,
    b) 상기 말릴-CoA를 말레이트-4-세미알데하이드로 변환하는 제2 단계, 및
    c) 상기 말레이트-4-세미알데하이드를 DHB 데하이드로게나제(DHB dehydrogenase)에 의해 2,4-DHB로 변환하는 제3 단계로 구성된, 연속 단계를 포함하는, 제조 방법.
  2. 제1항에 있어서,
    상기 단계 a)는 각각 말릴-CoA 신테타제(synthetase), 숙시닐-CoA: (L)-말레이트-CoA 트랜스퍼라제(transferase) 및/또는 말릴-CoA 리아제(lyase) 활성을 가진 효소에 의해 촉매되는 것을 특징으로 하는, 방법.
  3. 제2항에 있어서,
    상기 효소가 서열 번호 1, 서열 번호 193 및 서열 번호 195 중 하나 또는 이의 변이체 또는 단편으로 표시되는 것을 특징으로 하는, 방법.
  4. 제2항 또는 제3항에 있어서,
    상기 효소가 서열 번호 2, 서열 번호 194 및 서열 번호 196에 규정된 핵산 서열 중 하나, 또는 이의 변이체 또는 단편에 의해 코딩되는 것을 특징으로 하는, 방법.
  5. 제1항 또는 제2항에 있어서,
    상기 단계 b)가 말릴-CoA 리덕타제(reductase) 활성을 가진 효소에 의해 촉매되는 것을 특징으로 하는, 방법.
  6. 제5항에 있어서,
    상기 말레이트 세미알데하이드 데하이드로게나제가 효소의 하나 이상의 돌연변이에 의해 수득가능하며,
    상기 돌연변이(들)는, 말릴-CoA에 대한, 돌연변이된 효소의 활성 및/또는 기질 친화성을 개선하는 것임을 특징으로 하는, 방법.
  7. 제6항에 있어서,
    상기 말릴-CoA 리덕타제가 야생형 효소와 비교해, P111, L152, T154, L202, G203, D204, Y206, D207, K209, T210, T238, T239, D295, R318 중 한 곳 이상의 위치에, 하나 이상의 돌연변이를 포함하며,
    상기 위치들에 존재하는 천연 아미노산이, 다른 19개의 천연 단백질 아미노산(proteinogenic amino acid)인 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민산, 글루타민, 글리신, 히스티딘, 이소루신, 루신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신, 또는 발린 중 하나로 치환되는 것을 특징으로 하는, 방법.
  8. 제7항에 있어서,
    상기 말릴-CoA 리덕타제가 서열 번호 202로 표시되는 것을 특징으로 하는, 방법.
  9. 제8항에 있어서,
    상기 효소가 서열 번호 201의 핵산에 의해 코딩되는 것을 특징으로 하는, 방법.
  10. 제5항에 있어서,
    상기 효소가 말로닐-CoA 리덕타제 또는 숙시닐-CoA 리덕타제인 것을 특징으로 하는, 방법.
  11. 제10항에 있어서,
    상기 효소가 말로닐-CoA 리덕타제 또는 숙시닐-CoA 리덕타제 활성을 가진 효소의 변형에 의해 수득되는 것을 특징으로 하는, 방법.
  12. 제10항 또는 제11항에 있어서,
    상기 효소가 서열 번호 7, 서열 번호 8, 또는 서열 번호 191 중 하나 또는 이의 변이체 또는 단편으로 표시되는 것을 특징으로 하는, 방법.
  13. 제12항에 있어서,
    상기 효소가 서열 번호 8, 서열 번호 10, 또는 서열 번호 192에 규정된 핵산 서열 중 하나, 또는 이의 변이체 또는 단편에 의해 코딩되는 것을 특징으로 하는, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서,
    상기 단계 c)가 DHB 데하이드로게나제 활성을 가진 효소에 의해 촉매되는 것을 특징으로 하는, 방법.
  15. 제14항에 있어서,
    상기 효소가, 메틸부티르알데하이드 리덕타제, 숙신산 세미알데하이드 리덕타제, 4-하이드록시부티레이트 데하이드로게나제, 또는 알코올 데하이드로게나제인 것을 특징으로 하는, 방법.
  16. 제15항에 있어서,
    상기 효소가 서열 번호 14, 서열 번호 16, 서열 번호 32, 서열 번호 34, 서열 번호 36, 서열 번호 187 또는 서열 번호 189, 또는 이들의 변이체로 표시되는 것을 특징으로 하는, 방법.
  17. 제16항에 있어서,
    상기 효소가 서열 번호 15, 서열 번호 17, 서열 번호 33, 서열 번호 35, 서열 번호 37, 서열 번호 188, 서열 번호 190에 규정된 핵산 서열 중 하나, 또는 이의 변이체 또는 단편에 의해 코딩되는 것을 특징으로 하는, 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서,
    단계 a), b) 및 c)가 상기 단계 a), b) 또는 c)에 기술된 효소적 활성을 수행하는 효소들 중 하나 이상을 이종적으로(heterogeously) 발현하는 변형된 미생물에 의해 수행되는 것을 특징으로 하는, 방법.
  19. 제1항 내지 제17항 중 어느 한 항에 있어서,
    상기 a), b) 및 c)가 동일한 미생물 내에서 수행되는 것을 특징으로 하는, 방법.
  20. 2,4-DHB의 개선된 제조를 위한 변형된 미생물로서,
    상기 미생물은 제1항 내지 제17항 중 어느 한 항에 정의된 단계 a), b) 및 c)의 촉매작용에 필요한 효소적 활성을 가진 효소를 코딩하는 유전자를 발현하는, 변형된 미생물.
  21. 제20항에 있어서,
    박테리아, 바람직하게는 엔테로박테리아세애(Enterobacteriaceae), 클로스트리디아세애(Clostridiaceae), 바실라세애(Bacillaceae), 스트렙토마이세타세애(Streptomycetaceae), 스트렙토콕카세애(Streptococcaceae), 메틸로박테리아세애(Methylobacteriacae), 및 코리네박테리아세애(Corynebacteriaceae), 가장 바람직하게는 에스케리키아 콜라이(Escherichia coli), 바실러스 서브틸리스(Bacillus subtilis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 메틸로박테리움 엑스토?스(Methylobacterium extorquens), 또는 락토콕커스 락티스(Lactococcus lactis)로 이루어진 군으로부터 선택되는 박테리아, 또는 효모, 바람직하게는 사카로마이세타세애(Saccharomycetaceae), 피키아세애(Pichiaceae), 및 스키조사카로마이세타세애(Schizosaccharomycetaceae), 가장 바람직하게는 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 막시아누스(Kluyveromyces marxianus), 피키아 야디니이(Pichia jadinii), 피키아 스티피티스(Pichia stipitis), 또는 피키아 파스토리스(Pichia pastoris)로 이루어진 군으로부터 선택되는 효모인 것을 특징으로 하는, 변형된 미생물.
  22. 제20항 또는 제21항에 있어서,
    포스포에놀피루베이트 카르복실라제, 포스포에놀피루베이트 카르복시키나제, 피루베이트 카르복실라제, 이소시트레이트 리아제, 피루베이트 카르복실라제, 및 헥소스 심포터 퍼미아제(hexose symporter permease)로 이루어진 군으로부터 선택되는 효소적 활성 중 하나 이상의 발현이 증가되거나, 및/또는
    락테이트 데하이드로게나제, 알코올 데하이드로게나제, 아세테이트 키나제, 포스페이트 아세틸트랜스퍼라제, 피루베이트 옥시다제, 이소시트레이트 리아제, 푸마레이트 리덕타제, 푸마라제(fumarase), 2-옥소글루타레이트 데하이드로게나제, 피루베이트 키나제, 말산 효소, 포스포글루코스 이소머라제, 포스포에놀피루베이트 카르복실라제, 포스포에놀피루베이트 카르복시키나제, 피루베이트-포르메이트 리아제, 숙신산 세미알데하이드 데하이드로게나제, 당-수송 포스포트랜스퍼라제, 아스파테이트 아미노트랜스퍼라제, 글리옥실레이트 리덕타제, 말레이트 신타제(synthase), 또는 메틸글리옥살 신타제로 이루어진 군으로부터 선택되는 효소적 활성 중 하나 이상이 감소되는 것을 특징으로 하는, 변형된 미생물.
  23. 제22항에 있어서,
    모두 에스케리키아 콜라이(E. coli)로부터 유래되는, ppc , pck , aceA , galP; 및 락토콕커스 락티스(L. lactis) 유래의 pycA로 이루어진 군으로부터 선택되는 유전자들 중 하나 이상을 과발현하거나, 및/또는 ldhA , adhE , ackA , pta , poxB , focA , pflB , sad , gabABC , sfcA , maeB , ppc , pykA , pykF , mgsA , frdABCD , sucAB , ptsI , ptsG , pgi , fumABC , aldA , lldD , iclR , aceB , aspC , ghrAB로 이루어진 군으로부터 선택되는 유전자들 중 하나 이상이 결손된 에스케리키아 콜라이인 것을 특징으로 하는, 변형된 미생물.
  24. 2,4-DHB의 제조 방법으로서,
    - 제15항 내지 제18항 중 어느 한 항에 따른 변형된 미생물을 적절한 배양 배지에서 배양하는 단계, 및
    - 상기 배양 배지로부터 2,4-DHB를 회수하는 단계를 포함하는, 방법.
  25. 제24항에 있어서,
    상기 2,4-DHB가 추가로 정제되는 것을 특징으로 하는, 방법.
KR1020147033085A 2012-04-26 2013-04-25 2,4-다이하이드록시부티르산의 제조 방법 KR102024109B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IB2012001123 2012-04-26
IBPCT/IB2012/001123 2012-04-26
PCT/IB2013/001071 WO2013160762A2 (en) 2012-04-26 2013-04-25 A method of production of 2,4-dihydroxybutyric acid

Publications (2)

Publication Number Publication Date
KR20150013607A true KR20150013607A (ko) 2015-02-05
KR102024109B1 KR102024109B1 (ko) 2019-09-23

Family

ID=48699857

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147033085A KR102024109B1 (ko) 2012-04-26 2013-04-25 2,4-다이하이드록시부티르산의 제조 방법

Country Status (10)

Country Link
US (1) US9890400B2 (ko)
EP (1) EP2841584B1 (ko)
JP (1) JP6342385B2 (ko)
KR (1) KR102024109B1 (ko)
CN (1) CN104254612B (ko)
BR (1) BR112014026149A2 (ko)
ES (1) ES2875010T3 (ko)
IN (1) IN2014DN09529A (ko)
MY (1) MY175391A (ko)
WO (1) WO2013160762A2 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6293746B2 (ja) * 2012-07-11 2018-03-14 アディセオ・フランセ・エス・アー・エス 2,4−ジヒドロキシ酪酸塩の調製のための方法
CN103642765B (zh) * 2013-12-25 2015-11-18 南京工业大学 醇脱氢酶突变体及其应用
US10570424B2 (en) * 2014-04-11 2020-02-25 String Bio Private Limited Recombinant methanotrophic bacterium and a method of production of succinic acid from methane or biogas thereof
ES2811337T3 (es) 2015-04-07 2021-03-11 Metabolic Explorer Sa Microorganismo modificado para la producción optimizada de 2,4-dihidroxibutirato con eflujo de 2,4- dihidroxibutirato aumentado
CN107690482B (zh) * 2015-04-07 2022-11-29 代谢探索者公司 用于2,4-二羟基丁酸的优化生产的经修饰的微生物
CA2989434C (en) 2015-06-25 2023-10-03 Dynamic Food Ingredients Corporation Method for the production of 2,4-dihydroxybutyric acid
CN105441372A (zh) * 2015-10-30 2016-03-30 清华大学 一种重组谷氨酸棒杆菌与应用
CN109803672A (zh) 2016-09-13 2019-05-24 阿勒根公司 稳定的非蛋白质梭菌毒素组合物
CN111778200B (zh) * 2019-04-04 2022-11-01 中国科学院微生物研究所 生产L-天冬氨酸的平台菌、基于该平台菌构建的生产β-丙氨酸的重组菌及其构建方法
CN110713962B (zh) * 2019-09-06 2022-06-21 南京农业大学 一株高产丙二酰辅酶a的基因工程菌及其构建方法和应用
DE102021101004B3 (de) 2021-01-19 2022-03-10 Technische Universität Dresden, Körperschaft des öffentlichen Rechts Verfahren zur Herstellung von 2,4-Dihydroxybutyrat oder L-Threonin unter Nutzung eines mikrobiellen Stoffwechselweges
CN115820616A (zh) * 2022-07-22 2023-03-21 昆明理工大学 一种带荧光标记的噬菌体裂解酶及其应用
CN115948482B (zh) * 2023-02-07 2024-02-09 中国科学院天津工业生物技术研究所 一种2,4-二羟基丁酸生物合成途径的构建方法及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1167534A2 (en) * 2000-06-28 2002-01-02 Daiso Co., Ltd. Process for the preparation of optically active 1,2-diols by cultivating microorganisms
WO2008046328A1 (fr) * 2006-10-19 2008-04-24 East China University Of Science And Technology Souche produisant une lactonohydrolase lévorotatoire et son utilisation pour la production d'oxyacide chiral

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
DE3788764T2 (de) 1986-09-16 1994-06-23 Gist Brocades Nv Penicilliumtransformanten und Verfahren zu ihrer Herstellung.
AU644097B2 (en) 1989-08-09 1993-12-02 Monsanto Technology, Llc Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5693781A (en) 1991-06-03 1997-12-02 Mitsubishi Chemical Corporation Promoter DNA fragment from coryneform bacteria
EP0656943A1 (en) 1992-08-19 1995-06-14 Alko Group Ltd. Fungal promoters active in the presence of glucose
FR2734842B1 (fr) 1995-06-02 1998-02-27 Rhone Poulenc Agrochimie Sequence adn d'un gene de l'hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant un gene de l'hydroxy-phenyl pyruvate dioxygenase, tolerantes a certains herbicides
FR2736926B1 (fr) 1995-07-19 1997-08-22 Rhone Poulenc Agrochimie 5-enol pyruvylshikimate-3-phosphate synthase mutee, gene codant pour cette proteine et plantes transformees contenant ce gene
FR2780416B1 (fr) 1998-06-10 2002-12-20 Rhone Poulenc Nutrition Animal Procede industriel de production de proteines heterologues chez e. coli et souches utiles pour le procede
FR2787121B1 (fr) 1998-12-11 2003-09-12 Aventis Cropscience Sa Nouvelle methode d'isolement et de selection de genes codant pour des enzymes, et milieu de culture approprie
AU777674B2 (en) 1999-05-06 2004-10-28 Adisseo France S.A.S. Recombinant Penicillium Funiculosum for homologous and heterologous protein production
DE102006025821A1 (de) * 2006-06-02 2007-12-06 Degussa Gmbh Ein Enzym zur Herstellung von Mehylmalonatsemialdehyd oder Malonatsemialdehyd
EP2054382A1 (de) 2006-08-24 2009-05-06 Evonik Degussa GmbH Verfahren zur herstellung von d,l-2-hydroxy-4-alkylthiobuttersäuren
WO2010141920A2 (en) * 2009-06-04 2010-12-09 Genomatica, Inc. Microorganisms for the production of 1,4-butanediol and related methods
EP2633038B1 (en) * 2010-10-28 2017-04-05 Adisseo France S.A.S. A method of production of 2,4-dihydrobutyric acid

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1167534A2 (en) * 2000-06-28 2002-01-02 Daiso Co., Ltd. Process for the preparation of optically active 1,2-diols by cultivating microorganisms
WO2008046328A1 (fr) * 2006-10-19 2008-04-24 East China University Of Science And Technology Souche produisant une lactonohydrolase lévorotatoire et son utilisation pour la production d'oxyacide chiral

Non-Patent Citations (41)

* Cited by examiner, † Cited by third party
Title
Akita, O., Nishimori, C., Shimamoto, T., Fujii, T. & Iefuji, H. (2000). Transport of pyruvate in Saccharomyces cerevisiae and cloning of the gene encoded pyruvate permease. Biosci Biotechnol Biochem 64, 980-984.
Alber, B., Olinger, M., Rieder, A., Kockelkorn, D., Jobst, B., Huegler, M. & Fuchs, G. (2006). Malonyl-coenzyme A reductase in the modified 3-hydroxypropionate cycle for autotrophic carbon fixation in archaeal Metallosphaera and Sulfolobus spp. J Bacteriol 188, 8551-8559.
Arps, P. J., Fulton, G. F., Minnich, E. C. & Lidstrom, M. E. (1993). Genetics of serine pathway enzymes in Methylobacterium extorquens AM1: phosphoenolpyruvate carboxylase and malyl coenzyme A lyase. J Bacteriol 175, 3776-3783.
Auriol, C., Bestel-Corre, G., Claude, J.-B., Soucaille, P. & Meynial-Salles, I. (2011). Stress-induced evolution of Escherichia coli points to original concepts in respiratory cofactor selectivity. Proc Natl Acad Sci U S A 108, 1278-1283.
Baba, T., Ara, T., Hasegawa, M., Takai, Y., Okumura, Y., Baba, M., Datsenko, K. A., Tomita, M., Wanner, B. L. & Mori, H. (2006). Construction of Escherichia coli K-12 in-frame, single-gene knockout mutants: the Keio collection. Mol Syst Biol 2, 2006.0008.
Bailey, J. E. (1991). Toward a science of metabolic engineering. Science 252, 1668-1675.
Camarasa, C., Bidard, F., Bony, M., Barre, P. & Dequin, S. (2001). Characterization of Schizosaccharomyces pombe malate permease by expression in Saccharomyces cerevisiae. Appl Environ Microbiol 67, 4144-4151.
Cherepanov, P. P. & Wackernagel, W. (1995). Gene disruption in Escherichia coli: TcR and KmR cassettes with the option of Flp-catalyzed excision of the antibiotic-resistance determinant. Gene 158, 9-14.
Chistoserdova, L., Kalyuzhnaya, M. G. & Lidstrom, M. E. (2009). The expanding world of methylotrophic metabolism. Annu Rev Microbiol 63, 477-499.
Datsenko, K. A. & Wanner, B. L. (2000). One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products. Proc Natl Acad Sci U S A 97, 6640-6645.
Ford, G. & Ellis, E. M. (2002). Characterization of Ypr1p from Saccharomyces cerevisiae as a 2-methylbutyraldehyde reductase. Yeast Chichester Engl 19, 1087-1096.
Friedmann, S., Steindorf, A., Alber, B. E. & Fuchs, G. (2006). Properties of succinyl-coenzyme A:L-malate coenzyme A transferase and its role in the autotrophic 3-hydroxypropionate cycle of Chloroflexus aurantiacus. J Bacteriol 188, 2646-2655.
Grobler, J., Bauer, F., Subden, R. E. & Van Vuuren, H. J. (1995). The mae1 gene of Schizosaccharomyces pombe encodes a permease for malate and other C4 dicarboxylic acids. Yeast Chichester Engl 11, 1485-1491.
Groeneveld, M., Weme, R. G. J. D. O., Duurkens, R. H. & Slotboom, D. J. (2010). Biochemical characterization of the C4-dicarboxylate transporter DctA from Bacillus subtilis. J Bacteriol 192, 2900-2907.
Jantama, K., Haupt, M. J., Svoronos, S. A., Zhang, X., Moore, J. C., Shanmugam, K. T. & Ingram, L. O. (2008b). Combining metabolic engineering and metabolic evolution to develop nonrecombinant strains of Escherichia coli C that produce succinate and malate. Biotechnol Bioeng 99, 1140-1153.
Jantama, K., Zhang, X., Moore, J. C., Shanmugam, K. T., Svoronos, S. A. & Ingram, L. O. (2008a). Eliminating side products and increasing succinate yields in engineered strains of Escherichia coli C. Biotechnol Bioeng 101, 881-893.
Journal of Bacteriology, Vol. 191, pp. 6352-6362 (2009.08.14.) *
Kawasaki, T., Koita, H., Nakatsubo, T., Hasegawa, K., Wakabayashi, K., Takahashi, H., Umemura, K., Umezawa, T. & Shimamoto, K. (2006). Cinnamoyl-CoA reductase, a key enzyme in lignin biosynthesis, is an effector of small GTPase Rac in defense signaling in rice. Proc Natl Acad Sci U S A 103, 230-235.
Kockelkorn, D. & Fuchs, G. (2009). Malonic semialdehyde reductase, succinic semialdehyde reductase, and succinyl-coenzyme A reductase from Metallosphaera sedula: enzymes of the autotrophic 3-hydroxypropionate/4-hydroxybutyrate cycle in Sulfolobales. J Bacteriol 191, 6352-6362.
Larkin, M. A., Blackshields, G., Brown, N. P., Chenna, R., McGettigan, P. A., McWilliam, H., Valentin, F., Wallace, I. M., Wilm, A. & other authors. (2007). Clustal W and Clustal X version 2.0. Bioinforma Oxf Engl 23, 2947-2948.
Lin, H., Bennett, G. N. & San, K.-Y. (2005). Metabolic engineering of aerobic succinate production systems in Escherichia coli to improve process productivity and achieve the maximum theoretical succinate yield. Metab Eng 7, 116-127.
Meister, M., Saum, S., Alber, B. E. & Fuchs, G. (2005). L-malyl-coenzyme A/beta-methylmalyl-coenzyme A lyase is involved in acetate assimilation of the isocitrate lyase-negative bacterium Rhodobacter capsulatus. J Bacteriol 187, 1415-1425.
Millard, C. S., Chao, Y. P., Liao, J. C. & Donnelly, M. I. (1996). Enhanced production of succinic acid by overexpression of phosphoenolpyruvate carboxylase in Escherichia coli. Appl Environ Microbiol 62, 1808-1810.
Miller, J. H. (1992). A Short Course in Bacterial Genetics: A Laboratory Manual andHandbook for Escherichica coli and Related Bacteria. Plainview (NY): Cold Spring Harbor Laboratory Press.
Rognstad, R. & Katz, J. (1979). Effects of 2,4-dihydroxybutyrate on lipogenesis in rat hepatocytes. J Biol Chem 254, 11969-11972.
Sambrook, J., Fritsch, E. F. & Maniatis, T. (1989). Molecular Cloning: A Laboratory Manual, 2nd edn. Cold Spring Harbor: Cold Spring Harbor Laboratory Press.
Sanchez, A. M., Bennett, G. N. & San, K.-Y. (2005). Novel pathway engineering design of the anaerobic central metabolic pathway in Escherichia coli to increase succinate yield and productivity. Metab Eng 7, 229-239.
Sauer, U. & Eikmanns, B. J. (2005). The PEP-pyruvate-oxaloacetate node as the switch point for carbon flux distribution in bacteria. Fems Microbiol Rev 29, 765-794.
Seedorf, H., Fricke, W. F., Veith, B., Brueggemann, H., Liesegang, H., Strittmatter, A., Miethke, M., Buckel, W., Hinderberger, J. & other authors. (2008). The genome of Clostridium kluyveri, a strict anaerobe with unique metabolic features. Proc Natl Acad Sci U S A 105, 2128-2133.
Shinka, T., Inoue, Y., Ohse, M., Ito, A., Ohfu, M., Hirose, S. & Kuhara, T. (2002). Rapid and sensitive detection of urinary 4-hydroxybutyric acid and its related compounds by gas chromatography-mass spectrometry in a patient with succinic semialdehyde dehydrogenase deficiency. J Chromatogr B Anal Technol Biomed Life Sci 776, 57-63.
Smejkalovae, H., Erb, T. J. & Fuchs, G. (2010). Methanol assimilation in Methylobacterium extorquens AM1: demonstration of all enzymes and their regulation. Plos One 5.
Soehling, B. & Gottschalk, G. (1993). Purification and characterization of a coenzyme-A-dependent succinate-semialdehyde dehydrogenase from Clostridium kluyveri. Eur J Biochem Febs 212, 121-127.
Vuilleumier, S., Chistoserdova, L., Lee, M.-C., Bringel, F., Lajus, A., Zhou, Y., Gourion, B., Barbe, V., Chang, J. & other authors. (2009). Methylobacterium genome sequences: a reference blueprint to investigate microbial metabolism of C1 compounds from natural and industrial sources. Plos One 4, e5584.
Wang, Q., Ou, M. S., Kim, Y., Ingram, L. O. & Shanmugam, K. T. (2010). Metabolic flux control at the pyruvate node in an anaerobic Escherichia coli strain with an active pyruvate dehydrogenase. Appl Environ Microbiol 76, 2107-2114.
Werpy, T. & Petersen, G. (2004). Top value added chemicals from biomass. Results of screening for potential candidates from sugars and synthesis gas. Washington DC.
YEAST, Vol. 19, pp. 1087-1096 (2002.09.15.) *
Zarzycki, J., Brecht, V., Mueller, M. & Fuchs, G. (2009). Identifying the missing steps of the autotrophic 3-hydroxypropionate CO2 fixation cycle in Chloroflexus aurantiacus. Proc Natl Acad Sci U S A 106, 21317-21322.
Zelle, R. M., de Hulster, E., Kloezen, W., Pronk, J. T. & van Maris, A. J. A. (2010). Key process conditions for production of C(4) dicarboxylic acids in bioreactor batch cultures of an engineered Saccharomyces cerevisiae strain. Appl Environ Microbiol 76, 744-750.
Zelle, R. M., de Hulster, E., van Winden, W. A., de Waard, P., Dijkema, C., Winkler, A. A., Geertman, J.-M. A., van Dijken, J. P., Pronk, J. T. & van Maris, A. J. A. (2008). Malic acid production by Saccharomyces cerevisiae: engineering of pyruvate carboxylation, oxaloacetate reduction, and malate export. Appl Environ Microbiol 74, 2766-2777.
Zhang, X., Jantama, K., Shanmugam, K. T. & Ingram, L. O. (2009). Reengineering Escherichia coli for Succinate Production in Mineral Salts Medium. Appl Environ Microbiol 75, 7807-7813.
Zhang, X., Wang, X., Shanmugam, K. T. & Ingram, L. O. (2011). L-malate production by metabolically engineered Escherichia coli. Appl Environ Microbiol 77, 427-434.

Also Published As

Publication number Publication date
US9890400B2 (en) 2018-02-13
IN2014DN09529A (ko) 2015-07-17
KR102024109B1 (ko) 2019-09-23
EP2841584A2 (en) 2015-03-04
JP6342385B2 (ja) 2018-06-13
CN104254612B (zh) 2018-06-01
BR112014026149A2 (pt) 2017-07-18
ES2875010T3 (es) 2021-11-08
EP2841584B1 (en) 2021-03-17
CN104254612A (zh) 2014-12-31
US20150159182A1 (en) 2015-06-11
WO2013160762A2 (en) 2013-10-31
WO2013160762A3 (en) 2014-01-23
MY175391A (en) 2020-06-23
JP2015514433A (ja) 2015-05-21

Similar Documents

Publication Publication Date Title
KR102024109B1 (ko) 2,4-다이하이드록시부티르산의 제조 방법
US11505811B2 (en) Method for the preparation of 2,4-dihydroxybutyrate
KR101990014B1 (ko) 2,4-디하이드록시부티르산의 제조 방법
JP2023507482A (ja) グアニジノ酢酸の発酵生産方法
US9611490B2 (en) Biological method for producing cis-5-hydroxy-L-pipecolic acid
BR112021011629A2 (pt) Via de coprodução de derivados de 3-hp e acetil-coa a partir de malonato semialdeído
JP7554183B2 (ja) コリネ型細菌におけるマロニルCoAの供給ならびにコリネ型細菌を用いたポリフェノールおよびポリケチドの産生方法
JP2017534268A (ja) 有用産物の生産のための改変微生物および方法
CN107109446B (zh) 顺式-5-羟基-l-哌可酸的制造方法
KR101505172B1 (ko) 3-히드록시프로피온산을 생산하는 재조합 미생물 및 이를 이용한 3-히드록시프로피온산의 생산방법
JPWO2016076159A6 (ja) シス−5−ヒドロキシ−l−ピペコリン酸の製造方法
US20140296571A1 (en) Microorganisms And Methods For Producing Propionic Acid
CN114058560A (zh) 甘氨酸的生产方法
JP6959978B2 (ja) アシル転移酵素の活性を有する微生物及びその用途
US20140107377A1 (en) Microorganisms And Methods For Producing Acrylate And Other Products From Propionyl-CoA
EP4431609A1 (en) Method for improving 2, 4 dihydroxybutyric acid production and yield
WO2006088110A1 (ja) 新規な炭酸固定促進タンパク質、及び該タンパク質を用いた炭酸固定方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant