KR20220012847A - 재생가능한 공급원으로부터 화학물질의 생산 - Google Patents

재생가능한 공급원으로부터 화학물질의 생산 Download PDF

Info

Publication number
KR20220012847A
KR20220012847A KR1020217036672A KR20217036672A KR20220012847A KR 20220012847 A KR20220012847 A KR 20220012847A KR 1020217036672 A KR1020217036672 A KR 1020217036672A KR 20217036672 A KR20217036672 A KR 20217036672A KR 20220012847 A KR20220012847 A KR 20220012847A
Authority
KR
South Korea
Prior art keywords
seq
salt
formula
compound
coa
Prior art date
Application number
KR1020217036672A
Other languages
English (en)
Inventor
하르샬 쵸카왈라
조나단 쿠헨로이터
호르헤-알론소 구티에레스
수 타이-이
Original Assignee
자이모켐 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 자이모켐 인코포레이티드 filed Critical 자이모켐 인코포레이티드
Publication of KR20220012847A publication Critical patent/KR20220012847A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • C12P7/625Polyesters of hydroxy carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P11/00Preparation of sulfur-containing organic compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/44Polycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/05Oxidoreductases acting on NADH or NADPH (1.6) with a quinone or similar compound as acceptor (1.6.5)
    • C12Y106/05005NADPH:quinone reductase (1.6.5.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01004Acetoacetate decarboxylase (4.1.1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/02Aldehyde-lyases (4.1.2)
    • C12Y401/020344-(2-carboxyphenyl)-2-oxobut-3-enoate aldolase (4.1.2.34)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/02Aldehyde-lyases (4.1.2)
    • C12Y401/02045Trans-o-hydroxybenzylidenepyruvate hydratase-aldolase (4.1.2.45)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/0103Glycerol dehydratase (4.2.1.30)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/01034(S)-2-Methylmalate dehydratase (4.2.1.34)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

특히, 본 개시는 다양한 화합물 예컨대 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 6-히드록시 헥산산, 및 2-케토 카르복실산을 제조하기 위한 생합성 폴리펩티드, 방법, 및 비-천연 발생 미생물 유기체를 제공한다.

Description

재생가능한 공급원으로부터 화학물질의 생산
관련 출원에 관한 교차-참조
본 출원은 2019년 4월 25일 출원된 미국 가출원 제62/838,793호, 및 2019년 6월 28일 출원된 미국 가출원 제62/868,824호에 대한 우선권을 청구하고, 이들 각각의 전문은 참조로 본 명세서에 편입된다.
기술 분야
본 개시는 일반적으로 산업적으로 유용한 화학물의 조성물 및 이의 제조 방법에 관한 것이다.
아디프산 (AA)은 2012년 그 수요가 230만 미터톤으로 추정되는 광범위하게 사용되는 화학물이다 (IHS Chemical, Process Economics Program Report: Bio-Based Adipic acid (Dec. 2012)). 헥사메틸렌디아민 (HMDA)과 함께, 나일론6,6, 폴리에스테르 수지, 가소제, 식품, 및 다른 재료의 생산에서 사용된다. 따라서, 재생가능한 자원을 사용하여 높은 수율로 아디프산을 제조하는 방법이 매우 바람직하다.
1,5-펜탄디올은 폴리우레탄 및 폴리에스테르 (PDL)의 주요 성분이다. 1,6-헥산디올 (HDO)은 말단 히드록실 기를 갖는 선형 디올이다. 이것은 산업용 코팅 응용분야의 폴리에스테르, 자동차 응용분야용 2-성분 폴리우레탄 코팅에서 사용된다. 또한 이것은 파케이 바닥마감 및 가죽 코팅을 위한 엘라스토머 및 폴리우레탄 분산물에서 사용되는 마크로디올 예를 들어, 아디페이트 에스테르 및 폴리카르보네이트 디올의 제조에서 사용된다.
6-히드록시 헥산산 (6HH)은 환화되어 ε-카프로락톤을 만들 수 있고 이어서 아미노화되어 ε-카프로락탐을 만들 수 있다. ε-카프로락탐은 많은 상이한 산업에서 광범위하게 사용되는 중합체인, 나일론6의 제조에서 사용된다. ε-카프로락톤은 중합되어서 폴리카프로락톤 (PCL)을 특수 폴리우레탄의 제조를 위한 응용분야에서 사용되는 생분해성 폴리에스테르로 만든다.
2-케토 카르복실산은 수많은 산업적으로 관련된 화학물 및 약학 약물의 제조를 위한 유용한 중간체이다. 그들은 산업적으로 유용한 α-히드록시 카르복실산을 비롯하여, 아미노산의 제조를 위한 전구체이다.
특히, 본 개시는 소정 생합성 펩티드, 예를 들어, 다양한 효소가 많은 구현예에서, 그들의 천연 및/또는 특징규명된 기질과 구조적으로 상이한 기질로부터, 다양한 화합물을 효율적으로 제조하는데 이용될 수 있다는 인식을 포괄한다. 일부 구현예에서, 본 개시는 하나 이상의 이러한 효소를 이용하여 다양한 화합물을 제조하기 위한 기술 (예를 들어, 효소, 핵산, 유기체, 배양물 등)을 제공한다.
예를 들어, 일부 구현예에서, 본 개시는 알돌-탈수 생성물 생합성 폴리펩티드, 예컨대 다양한 히드라타제-알돌라제가 그들의 전형적인 방향족 알데히드 기질 이외의 지방족 알데히드로부터 수많은 화합물을 제조하는데 효과적으로 이용될 수 있다는 것을 제공한다. 일부 구현예에서, 본 개시는
피루베이트 및 지방족 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
일부 구현예에서, 알데히드, 예를 들어, 지방족 알데히드는 하기의 화학식 A-1의 구조, 또는 이의 염을
Ra-L2-L1-C(O)H,
A-1
상기 화학식에서, 갖는다:
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 임의로 독립적으로 치환되고;
-Cy-는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R"은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R'은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택된 임의 치환된 기이거나, 또는 :
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, L1 은 임의 치환된 -CH2- 이다. 일부 구현예에서, L1 은 임의 단일치환된 -CH2- 이다. 일부 구현예에서, L1 은 -CH2- 이다.
일부 구현예에서, 알돌-탈수 생성물은 하기 화학식 P-2의 구조, 또는 이의 염을 갖는다:
Ra-L2-L1-CH=CH-C(O)-C(O)OH,
P-2
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에 기술된 바와 같다.
본 명세서에 기술된 바와 같이, 알돌-탈수 생성물, 예를 들어, 화학식 P-2의 화합물 또는 이의 염은 일부 구현예에서, 다양한 생성물, 예컨대 1,5-펜탄디올, HDO, 6HH, 아디프산 등 (예를 들어, 도 2-5 참조) 및 그로부터 만들어진 다양한 중합체 생성물을 포함한, 그로부터 만들어진 다양한 생성물을 제공하기 위한 하나 이상의 생합성 과정을 통해서, 더욱 처리될 수 있다.
일부 구현예에서, 본 명세서에 표시된 바와 같이, 알돌-탈수 생성물, 예를 들어, 화학식 P-2의 화합물 또는 이의 염은 또한 알돌 생성물, 예를 들어, 하기 화학식 P-1의 화합물, 또는 이의 염으로부터 제조될 수도 있다:
Ra-L2-L1-CH(OH)-CH2-C(O)-C(O)OH,
P-1
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 알돌-탈수 생성물은 알돌 생성물을 탈수 생성물 생합성 폴리펩티드와 접촉시켜서 제조된다.
일부 구현예에서, 알돌 생성물은 적합한 기질을 알돌 생성물 생합성 폴리펩티드와 접촉시켜 제조된다.
일부 구현예에서, 본 개시는 다양한 알켄 환원 생성물 생합성 폴리펩티드가 그들의 천연 또는 비-천연 기질로부터 다양한 화합물을 제조하는데 이용될 수 있다는 것을 입증한다. 일부 구현예에서, 본 개시는
알켄을 알켄 환원 생성물 생합성 폴리펩티드와 접촉시켜서 알켄 환원 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고;
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어 알켄 환원 생성물을 제공한다.
일부 구현예에서, 알켄은 알돌-탈수 생성물, 예를 들어, 화학식 P-2 중 하나 또는 이의 염이다. 일부 구현예에서, 알켄 환원 생성물은 하기 화학식 P-3의 구조, 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-C(O)-C(O)OH,
P-3
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
특히, 본 명세서는 재생가능한 자원을 사용하여 2-케토 카르복실산, 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 및 6-히드록시 헥산산을 제조하기 위한 효소, 방법, 및 재조합 미생물을 개시한다.
일 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법이 제공한다:
Figure pct00001
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 피루베이트 및
Figure pct00002
을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와, 하나 이상의 비-천연 발생 미생물을 포함하는 유기체 또는 배양물 중에서 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나 또는 그로 본질적으로 이루어지고; 여기서 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물에 의해 발현된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법이 제공된다:
Figure pct00003
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 피루베이트 및
Figure pct00004
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 둘 이상의 비-천연 발생 미생물을 포함하는 유기체 또는 배양물 중에서 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나 또는 그로 본질적으로 이루어지고; 여기서 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물에 의해 발현된다.
다른 양태에서, 본 명세서는 1,5-펜탄디올을 제조하기 위한 방법이 제공되고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00005
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계
를 포함하거나 또는 그로 본질적으로 이루어지고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,5-펜탄디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00006
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계
를 포함하거나 또는 그로 이루어지고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,6-헥산디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00007
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계
를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,6-헥산디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00008
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 6-히드록시-헥사노에이트를 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00009
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고;
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 6-히드록시-헥사노에이트를 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00010
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계
를 포함하고;
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 아디프산을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00011
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계
를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 아디프산을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00012
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계
를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45, EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에서 확인된 효소의 군으로부터 선택되는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45, EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에서 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인된 효소의 군에서 선택된 효소, 또는 알돌-탈수 생성물의 형성을 촉진하는 이의 일부분 (예를 들어, 도메인, 아미노산 잔기의 세트 (연속될 수 있거나 또는 이격될 수 있음) 등)과 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 표 1 및 5-8로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 표 1 및 5-8로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인된 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 하나 이상의 비-천연 발생 미생물에 의해 발현되는 하나 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다. 일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되는 하나 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다. 일부 구현예에서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 2-케토 카르복실산을 제조하기 위한 방법은 2-케토 카르복실산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 2-케토 카르복실산을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 2-케토-산-데카르복실라제는 EC 번호 4.1.1.1; EC 번호 4.1.1.2; EC 번호 4.1.1.3; EC 번호 4.1.1.4; EC 번호 4.1.1.5; EC 번호 4.1.1.6; EC 번호 4.1.1.7; EC 번호 4.1.1.11; EC 번호 4.1.1.12; EC 번호 4.1.1.15; EC 번호 4.1.1.16; EC 번호 4.1.1.17; EC 번호 4.1.1.18; EC 번호 4.1.1.19; EC 번호 4.1.1.20; EC 번호 4.1.1.34; EC 번호 4.1.1.35; EC 번호 4.1.1.40; EC 번호 4.1.1.54; EC 번호 4.1.1.56; EC 번호 4.1.1.71; EC 번호 4.1.1.72; EC 번호 4.1.1.73; EC 번호 4.1.1.74; EC 번호 4.1.1.75; 또는 EC 번호 4.1.1.77 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 1차 알콜 데히드로게나제는 EC 번호 1.1.1.61을 갖는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인되는 효소의 그룹으로부터 선택되는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 Uniprot ID No. A0A286PH18 하에 확인되는 효소이고; 퀴논 옥시도리덕타제는 Uniprot ID No. P28304 하에 확인되는 효소이고; 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4 하에 확인되는 효소이고; 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:8의 서열을 포함하는 효소이고; 퀴논 옥시도리덕타제는 SEQ ID NO:45의 서열을 포함하는 효소이고; 2-케토-산-데카르복실라제는 SEQ ID NO:83의 서열을 포함하는 효소이고; 1차 알콜 데히드로게나제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 히드라타제-알돌라제, 퀴논 옥시도리덕타제, 2-케토-산-데카르복실라제, 및 1차 알콜 데히드로게나제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 1,5-펜탄디올을 제조하기 위한 방법은 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 1,5-펜탄디올을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 EC 번호 1.2.99.6을 갖는 효소이고; 6-히드록시헥사날 1-리덕타제는 EC 번호 1.1.1을 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 하에 확인되는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소이고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소이고; 및 6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 및 6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID Nos D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소이고; 및 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 1,6-헥산디올을 제조하기 위한 방법은 1,6-헥산디올을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 1,6-헥산디올을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해서 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:5, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 6-히드록시-헥사노에이트를 제조하기 위한 방법은 6-히드록시-헥사노에이트를 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 6-히드록시-헥사노에이트를 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 EC 번호 1.1.1.258을 갖는 효소이고; 6-옥소-헥사노에이트 옥시다제는 EC 번호 1.2.1.63을 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC6409 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 Uniprot ID No. Q7WVD0 또는 Q84H78 하에 확인되는 효소이고; 6-옥소-헥사노에이트 옥시다제는 Uniprot ID No. Q9R2F4 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 데히드로게나제는 Uniprot ID No. Q7WVD0 또는 Q84H78 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-옥소-헥사노에이트 옥시다제는 Uniprot ID No. Q9R2F4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 확인된 효소이고; 6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 및 SEQ ID NO:72의 서열을 포함하는 확인된 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 아디프산을 제조하기 위한 방법은 아디프산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 아디프산을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다. 일부 구현예에서,
Figure pct00013
는 3-히드록시-프로파날이다. 일부 구현예에서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
다른 양태에서, 본 명세서는 알돌라제 히드라타제 효소를 코딩하는 제1 외생성 핵산을 포함하는 재조합 미생물 유기체를 제공하고, 여기서 재조합 미생물 유기체는 야생형 또는 미변형의 동일 미생물 유기체와 비교하여 퀴논 증가된 양의 옥시도리덕타제를 발현하도록 추가로 변형되고, 임의로 미생물 유기체는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 클로스트리듐 (clostridium) 종, 또는 이. 콜라이 (E. coli)이다. 일부 구현예에서, 유기체는 퀴논 옥시도리덕타제를 코딩하는 제2 외생성 핵산을 포함한다. 일부 구현예에서, 제1 및/또는 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동시키는 조절 엘리먼트를 더 포함한다. 대안적으로, 제1 및 제2 핵산은 동일 프로모터 조절 엘리먼트의 제어 하에 있다. 일부 구현예에서, 조절 엘리먼트는 프로모터 또는 인핸서로부터 선택된다. 일부 구현예에서, 알돌라제 히드라타제 효소는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는다. 일부 구현예에서, 알돌라제 히드라타제 효소는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 알돌라제 히드라타제 효소는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 벡터, 예를 들어, 플라스미드 또는 바이러스 벡터에 함유된다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 동일 벡터에 함유된다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 그들 자신의 별도 벡터에 함유된다. 일부 구현예에서, 벡터는 플라스미드이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다. 일부 구현예에서, 재조합 미생물 유기체는 하기 화학식의 2-케토 카르복실산을 생성시킬 수 있다:
Figure pct00014
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다. 일부 구현예에서, 재조합 미생물 유기체는 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 생성시킬 수 있다. 일부 구현예에서, 재조합 미생물 유기체는 탄소원으로부터 피루베이트의 생성을 개선시키도록 유전자 변형된다. 일부 구현예에서, 탄소원은 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택된다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 재조합 미생물 유기체를 포함하는 배양물을 제공한다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 바와 같은 재조합 미생물 유기체의 개체군을 제공한다. 일부 구현예에서, 개체군은 실질적으로 균질하다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 개체군을 포함하는 배양물을 제공한다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 바와 같은 외생성 핵산의 발현을 촉진하는 적합한 조건 하에서 본 명세서에 개시된 바와 같은 개체군 또는 재조합 미생물을 배양하는 단계를 포함하는, 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 제조하는 방법을 제공한다. 일 양태에서, 외생성 핵산은 야생형 또는 미변형 대응 미생물 유기체와 비교하여 과발현된다. 일부 구현예에서, 방법은 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 배양물 또는 미생물 유기체로부터 단리시키는 단계를 더 포함한다.
도 1 은 예로서 피루베이트 및 알데히드로부터 2-케토 카르복실산의 생성을 위한 2-효소 생합성 경로를 도시한다. 알돌-탈수 생성물 (예를 들어, 본 명세서에 기술될 알돌 축합 생성물)은 이론으로 국한하려는 의도없이, 도시된 바와 같은 단계 1 및 2를 통해서, 단일 효소 (예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드 예컨대 히드라타제-알돌라제 (일부 구현예에서, Ads-Hyd라고 함))에 의해 촉매되는 과정으로부터 생성될 수 있다. 당업자가 이해하게 되는 바와 같이, 예시된 알돌 축합 생성물 중 이중 결합은 E 또는 Z 로서 존재할 수 있다. 많은 구현예에서, 예시된 바와 같은 단계 3은 예를 들어 퀴논의 환원을 위해 NADH 및/또는 NADPH를 이용하는 EC 1.6.5 (예를 들어, EC 1.6.5.5)에 속하는 하나인, 옥시도리덕타제에 의해 촉매될 수 있다. 본 명세서에 기술된 바와 같이, 다양한 알데히드가 이용될 수 있다. 예를 들어, 예시된 알데히드에서, 일부 구현예에서, R은 H, CH3, CH2CH3, OH, CH2OH, 또는 CH2CH2OH이다.
도 2 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 1,5-펜탄디올의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 5HPeA는 5-히드록시 펜타날을 지칭한다. NADH는 예시된 목적을 위한 경로의 많은 환원 단계를 위한 보조인자로서 도시된다. NADPH 또는 NADH는 보조인자일 수 있다.
도 3 은 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 1,6-헥산디올의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭하고; 6HHA는 6-히드록시 헥사날을 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체 내에서 이러한 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 4 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 6-히드록시 헥사노에이트의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체 내에서 이 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 5 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 아디프산의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭하고; 6KHA는 6-옥소-헥사노에이트를 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체내에서 이러한 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 6 은 보조인자 NADH 및 NADPH를 사용하여 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 6-히드록시-2-케토-헥세노에이트로 환원을 위한 퀴논 옥시도리덕타제-1 (Qor-1)의 활성을 도시한다.
정의
본 명세서에서 사용되는, 일정 용어는 하기에 정의된 의미를 가질 수 있다. 본 명세서에서 사용되는, 단수형 "한", "하나" 및 "그"는 문맥에서 달리 명확하게 표시하지 않으면 단수 및 다수 참조를 포함한다.
본 명세서에서 사용되는, 용어 "포함하는"은 조성물 및 방법이 인용된 구성요소를 포함하지만, 다른 것들을 배제하지는 않는다는 것을 의미하고자 한다. 조성물 및 방법을 정의하는데 사용될 때 "본질적으로 이루어지는"은 조성물 또는 방법에 임의의 본질적으로 중요한 다른 구성요소를 배제한다는 것을 의미할 수 있다. "이루어지는"은 실질적 방법 단계 및 청구된 조성물에 대한 다른 성분의 미량 초과의 구성요소를 배제하는 것을 의미할 수 있다. 이들 전환 용어 각각에 의해 정의된 양태는 본 개시의 범주 내에 있다. 따라서, 방법 및 조성물은 추가 단계 및 성분을 포괄할 수 있거나 (포함하는) 또는 대안적으로 중요하지 않은 단계 및 조성물을 포괄할 수 있거나 (본질적으로 이루어지는) 또는 대안적으로, 오직 명시된 방법 단계 또는 조성물을 의도 (이루어지는)하고자 의도된다.
본 명세서에서 사용되는 용어 "알돌-탈수 생성물 생합성 폴리펩티드"는 본 명세서에 기술된 바와 같은 알돌-탈수 생성물의 합성에 관여되는 폴리펩티드를 지칭한다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알돌라제 폴리펩티드, 히드라타제, 히드라타제-알돌라제 폴리펩티드 (예를 들어, 히드라타제-알돌라제)일 수 있거나 또는 그를 포함할 수 있다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제 폴리펩티드 (예를 들어, 히드라타제-알돌라제)일 수 있거나 또는 그를 포함할 수 있다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 자연계, 예를 들어, 미생물 (예를 들어, 자연계에서 발견되는 기준 알돌-탈수 생합성 폴리펩티드)에서 발견되는 아미노산 서열을 갖는다. 대안적으로 또는 추가적으로, 일부 구현예에서, 알돌-탈수 생합성 폴리펩티드는 적절한 기준 알돌-탈수 생합성 폴리펩티드 (예를 들어, 자연계에서 발견되고/되거나 본 명세서 (예를 들어, 하나 이상의 관련 표 (예를 들어, 표 1 및 5-8))에서 표시되는 바와 같음) 또는 이의 일부분 (예를 들어, 관련 반응을 촉매하는 부분 (예를 들어, 도메인 (예를 들어, 관련 촉매 도메인) 및/또는 (연속될 수 있거나 또는 이격될 수 있는) 아미노산 잔기의 세트)과 특징적 서열 엘리먼트 및/또는 전체 동일성 백분율을 공유한다.
본 명세서에서 사용되는, "알돌-탈수 생성물"은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기에 접합된 이중 결합을 포함하는 화합물을 의미한다. 일부 구현예에서, 알돌-탈수 생성물은 화학식 P-2의 화합물 또는 이의 염이다.
본 명세서에서 사용되는, 용어 "알돌 생성물"은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착된 히드록실 기를 포함하는 화합물을 지칭한다. 일부 구현예에서, 알돌 생성물은 알돌 반응의 생성물이다. 일부 구현예에서, 알돌 생성물은 화학식 P-1의 구조 또는 이의 염을 갖는다.
본 명세서에서 사용되는, 용어 "알돌 생성물 생합성 폴리펩티드"는 본 명세서에 기술된 바와 같은 알돌 생성물의 합성에 관여하는 폴리펩티드를 지칭한다. 일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알돌라제 폴리펩티드, 히드라타제-알돌라제 폴리펩티드 (예를 들어, 히드라타제-알돌라제)일 수 있거나 또는 그를 포함할 수 있다. 일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알돌라제 폴리펩티드이거나 또는 그를 포함한다. 일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 자연계, 예를 들어 미생물 (예를 들어, 자연계에서 발견되는 기준 알돌 생합성 폴리펩티드)에서 발견되는 아미노산 서열을 갖는다. 대안적으로 또는 추가로 일부 구현예에서, 알돌 생합성 폴리펩티드는 적절한 기준 알돌 생합성 폴리펩티드 (예를 들어, 자연계에서 발견되고/되거나 본 명세서 (예를 들어, 하나 이상의 관련 표)에서 표시되는 바와 같음) 또는 이의 일부분 (예를 들어, 관련 반응을 촉매하는 부분 (예를 들어, 도메인 (예를 들어, 관련 촉매 도메인) 및/또는 (연속될 수 있거나 또는 이격될 수 있는) 아미노산 잔기의 세트)과 특징적 서열 엘리먼트 및/또는 전체 동일성 백분율을 공유한다.
본 명세서에서 사용되는, 용어 "알켄 환원 생성물 생합성 폴리펩티드"는 본 명세서에 기술된 바와 같이 이중 결합의 단일 결합으로의 전환 (및 알켄 환원 생성물의 형성)에 관여하는 폴리펩티드를 지칭한다. 일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 퀴논 옥시도리덕타제일 수 있거나 또는 그를 포함할 수 있다. 일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 자연계, 예를 들어, 미생물 (예를 들어, 자연계에서 발견되는 기준 알켄 환원 생합성 폴리펩티드)에서 발견되는 아미노산 서열을 갖는다. 대안적으로 또는 추가로, 일부 구현예에서, 알돌 생합성 폴리펩티드는 적절한 기준 알돌 생합성 폴리펩티드 (예를 들어, 자연계에서 발견되고/되거나 본 명세서 (예를 들어, 하나 이상의 관련 표)에서 표시되는 바와 같음) 또는 이의 일부분 (예를 들어, 관련 반응을 촉매하는 부분 (예를 들어, 도메인 (예를 들어, 관련 촉매 도메인) 및/또는 (연속될 수 있거나 또는 이격될 수 있는) 아미노산 잔기의 세트)과 특징적 서열 엘리먼트 및/또는 전체 동일성 백분율을 공유한다.
본 명세서에서 사용되는, 용어 "지방족"은 완전 포화되거나 또는 하나 이상의 불포화 단위를 함유하는 직쇄 (즉, 미분지) 또는 분지쇄, 치환 또는 미치환 탄화수소 사슬, 또는 완전 포화되거나 또는 하나 이상의 불포화 단위 (방향족이 아님)를 함유하는 치환 또는 미치환 단환식, 이환식, 또는 다환식 탄화수소 고리, 또는 이의 조합을 의미한다. 일부 구현예에서, 지방족 기는 1-50 지방족 탄소 원자를 함유한다. 일부 구현예에서, 지방족 기는 1-20 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-10 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-9 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-8 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-7 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-6 지방족 탄소 원자를 함유한다. 여전히 다른 구현예에서, 지방족 기는 1-5 지방족 탄소 원자를 함유하고, 또 다른 구현예에서, 지방족 기는 1, 2, 3, 또는 4 지방족 탄소 원자를 함유한다. 적합한 지방족 기는 선형 또는 분지형, 치환 또는 미치환된 알킬, 알케닐, 알키닐 기 및 이의 하이브리드 예컨대 (시클로알킬)알킬, (시클로알케닐)알킬 또는 (시클로알킬)알케닐을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는, 용어 "알킬"은 당분야에서의 이의 통상의 의미이고, 직쇄 알킬 기, 분지쇄 알킬 기, 시클로알킬 (지환족) 기, 알킬 치환된 시클로알킬 기, 및 시클로알킬 치환된 알킬 기를 포함하는, 포화 지방족 기를 포함할 수 있다. 일부 구현예에서, 알킬은 1-100 탄소 원자를 갖는다. 일정 구현예에서, 직쇄 또는 분지쇄 알킬은 이의 골격에 약 1-20 탄소 원자 (예를 들어, 직쇄 경우 C1-C20, 분지쇄 경우 C2-C20), 및 대안적으로, 약 1-10을 갖는다. 일부 구현예에서, 시클로알킬 고리는 그들 고리 구조에 약 3-10 탄소 원자를 가지고 이러한 고리는 단환식, 이환식, 또는 다환식이고, 대안적으로, 고리 구조에 약 5, 6 또는 7 탄소를 갖는다. 일부 구현예에서, 알킬 기는 저급 알킬 기일 수 있고, 저급 알킬 기는 1-4 탄소 원자를 포함한다 (예를 들어, 직쇄 저급 알킬 경우 C1-C4).
본 명세서에서 사용되는, "아르알킬", "아르알콕시", 또는 "아릴옥시알킬"에서 처럼 더 큰 모이어트의 일부로서 또는 단독으로 사용되는, 용어 "아릴"은 총 5원 내지 30원 고리 구성원을 갖는 단환식, 이환식 또는 다환식 고리계를 지칭하고, 고리계 중 적어도 하나의 고리는 방향족이다. 일부 구현예에서, 아릴 기는 총 5원 내지 14원 고리 구성원을 갖는 단환식, 이환식 또는 다환식 고리계이고, 고리계 중 적어도 하나의 고리는 방향족이고, 고리계 중 각각의 고리는 3원 내지 7원 고리 구성원을 함유한다. 일부 구현예에서, 아릴 기는 바이아릴 기이다. 용어 "아릴"은 용어 "아릴 고리"와 상호교환적으로 사용될 수 있다. 본 개시의 일정 구현예에서, "아릴"은 하나 이상의 치환기를 보유할 수 있는, 제한없이, 페닐, 바이페닐, 나프틸, 바이나프틸, 안트라실 등을 포함하는 방향족 고리계를 지칭한다. 본 명세서에서 사용되는 용어 "아릴"의 범주 내에는 또한 방향족 고리가 하나 이상의 비-방향족 고리, 예컨대 인다닐, 프탈이미딜, 나프티미딜, 펜안트리디닐, 또는 테트라히드로나프틸 등에 융합된 기가 포함된다.
본 명세서에서 사용되는, 용어 "시클로지방족", "카르보시클", "카르보시클릴", "카르보시클릭 라디칼", 및 "카르보시클릭 고리"는 상호교환적으로 사용되고, 달리 명시하지 않으면, 3원 내지 30원 고리 구성원을 갖는, 본 명세서에 기술된 바와 같은, 포화 또는 부분 불포화되나, 비-방향족, 환형 지방족 단환식, 이환식, 또는 다환식 고리계를 지칭한다. 시클로지방족 기는 제한없이, 시클로프로필, 시클로부틸, 시클로펜틸, 시클로펜테닐, 시클로헥실, 시클로헥세닐, 시클로헵틸, 시클로헵테닐, 시클로옥틸, 시클로옥테닐, 노르보르닐, 아다만틸, 및 시클로옥타디에닐을 포함한다. 일부 구현예에서, 시클로지방족 기는 3-6 탄소를 갖는다. 일부 구현예에서, 시클로지방족 기는 포화되고 시클로알킬이다. 용어 "시클로지방족"은 또한 하나 이상의 방향족 또는 비방향족 고리에 융합된 지방족 고리, 예컨대 데카히드로나프틸 또는 테트라히드로나프틸을 포함할 수 있다. 일부 구현예에서, 시클로지방족 기는 이환식이다. 일부 구현예에서, 시클로지방족 기는 삼환식이다. 일부 구현예에서, 시클로지방족 기는 다환식이다. 일부 구현예에서, "시클로지방족"은 완전 포화되거나 또는 하나 이상의 불포화 단위를 함유하지만, 방향족은 아니고, 분자의 나머지에 단일 부착점을 갖는 C3-C6 단환식 탄화수소, 또는 C8-C10 이환식 또는 다환식 탄화수소, 또는 완전 포화되거나 또는 하나 이상의 불포화 단위를 함유하지만, 방향족은 아니고, 분자의 나머지에 단일 부착점을 갖는, C9-C16 다환식 탄화수소를 지칭한다.
본 명세서에서 사용되는, 용어 "헤테로지방족"은 당분야에서 제공되는 이의 통상의 의미이고, 하나 이상의 탄소 원자가 하나 이상의 이종원자 (예를 들어, 산소, 질소, 황, 규소, 인 등)로 독립적으로 치환된 본 명세서에 기술된 바와 같은 지방족 기를 지칭한다. 일부 구현예에서, C, CH, CH2, 및 CH3 으로부터 선택되는 하나 이상의 단위는 하나 이상의 이종원자 (이의 산화 및/또는 치환된 형태 포함)로 독립적으로 치환된다. 일부 구현예에서, 헤테로지방족 기는 헤테로알킬이다. 일부 구현예에서, 헤테로지방족 기는 헤테로알케닐이다.
본 명세서에서 사용되는, 용어 "헤테로알킬"은 당분야에서 제공되는 이의 통상의 의미이고 하나 이상의 탄소 원자가 하나 이상의 이종원자 (예를 들어, 산소, 질소, 황, 규소, 인 등)로 독립적으로 치환된 본 명세서에 기술된 바와 같은 알킬 기를 지칭한다. 헤테로알킬 기의 예는 알콕시, 폴리(에틸렌 글리콜)-, 알킬-치환된 아미노, 테트라히드로퓨라닐, 피페리디닐, 모르폴리닐 등을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는, 더 큰 모이어티, 예를 들어, "헤테로아르알킬", 또는 "헤테로아르알콕시"의 일부로서 또는 단독으로 사용되는, 용어 "헤테로아릴" 및 "헤테로아르-"는 총 5원 내지 30원 고리 구성원을 갖는 단환식, 이환식 또는 다환화학식 고리계를 지칭하고, 고리계 중 적어도 하나의 고리는 방향족이고 적어도 하나의 방향족 고리 원자는 이종원자이다. 일부 구현예에서, 헤테로아릴 기는 5 내지 10 고리 원자 (즉, 단환식, 이환식 또는 다환식), 일부 구현예에서 5, 6, 9, 또는 10 고리 원자를 갖는 기이다. 일부 구현예에서, 헤테로아릴 기는 6, 10, 또는 14 π 전자를 환식 배열 중에 공유하고; 탄소 원자이외에도, 1 내지 5 이종원자를 갖는다. 헤테로아릴 기는 제한없이, 티에닐, 퓨라닐, 피롤릴, 이미다졸릴, 피라졸릴, 트리아졸릴, 테트라졸릴, 옥사졸릴, 이속사졸릴, 옥사디아졸릴, 티아졸릴, 이소티아졸릴, 티아디아졸릴, 피리딜, 피리다지닐, 피리미디닐, 피라지닐, 인돌리지닐, 푸리닐, 나프티리디닐, 및 프테리디닐을 포함한다. 일부 구현예에서, 헤테로아릴은 헤테로바이아릴 기, 예컨대 바이피리딜 등이다. 본 명세서에서 사용되는 용어 "헤테로아릴" 및 "헤테로아르-"는 또한 헤테로방향족 고리는 하나 이상의 아릴, 시클로지방족, 또는 헤테로시클릴 고리에 융합된 기를 포함하고, 라디칼 또는 부착점은 헤테로방향족 고리 상에 있다. 비제한적인 예는 인돌릴, 이소인돌릴, 벤조티에닐, 벤조퓨라닐, 디벤조퓨라닐, 인다졸릴, 벤즈이미다졸릴, 벤즈티아졸릴, 퀴놀릴, 이소퀴놀릴, 신놀리닐, 프탈라지닐, 퀴나졸리닐, 퀴녹살리닐, 4H-퀴놀리지닐, 카르바졸릴, 아크리디닐, 페나지닐, 페노티아지닐, 페녹사지닐, 테트라히드로퀴놀리닐, 테트라히드로이소퀴놀리닐, 및 피리도[2,3-b]-1,4-옥사진-3(4H)-온을 포함한다. 헤테로아릴 기는 단환식, 이환식 또는 다환식일 수 있다. 용어 "헤테로아릴"은 용어 "헤테로아릴 고리", "헤테로아릴 기", 또는 "헤테로방향족"과 상호교환적으로 사용될 수 있고, 임의의 이들 용어는 임의 치환되는 고리를 포함한다. 용어 "헤테로아르알킬"은 헤테로아릴 기에 의해 치환된 알킬 기를 지칭하고, 알킬 및 헤테로아릴 부분은 독립적으로 임의 치환된다.
본 명세서에서 사용되는, 용어 "이종원자"는 탄소 또는 수소가 아닌 원자를 지칭한다. 일부 구현예에서, 이종원자는 붕소, 산소, 황, 질소, 인, 또는 규소 (질소, 황, 인, 또는 규소의 산화된 형태; 질소 (예를 들어, 4차화된 형태, 이미늄 기 등에서와 같은 형태 등), 인, 황, 산소의 하전된 형태 등 포함)이다. 일부 구현예에서, 이종원자는 산소, 황 또는 질소이다.
본 명세서에서 사용되는, 용어 "헤테로시클", "헤테로시클릴", "헤테로시클릭 라디칼", 및 "헤테로시클릭 고리"는 본 명세서에서 상호교환적으로 사용되고, 포화 또는 부분 불포화되고 하나 이상의 이종원자 고리 원자를 갖는 단환식, 이환화학식 또는 다환식 고리 모이어티 (예를 들어, 3-30원)를 지칭한다. 일부 구현예에서, 헤테로시클릴 기는 포화 또는 부분 불포화되고, 탄소 원자 이외에, 하나 이상, 바람직하게 1 내지 4의, 상기 정의된 바와 같은, 이종원자를 갖는 안정한 5-원 내지 7-원 단환식 또는 7-원 내지 10-원 이환식 헤테로시클릭 모이어티이다. 헤테로시클의 고리 원자를 참조하여 사용될 때, 용어 "질소"는 치환된 질소를 포함한다. 예로서, 산소, 황 및 질소로부터 선택되는 0-3 이종원자를 갖는 포화 또는 부분 불포화 고리에서, 질소는 N (3,4-디히드로-2H-피롤릴에서 처럼), NH (피롤리디닐에서 처럼), 또는 +NR (N-치환된 피롤리디닐에서 처럼)일 수 있다. 헤테로시클릭 고리는 임의의 이종원자 또는 탄소 원자에서 이의 현수기에 부착되어서 안정한 구조를 생성시킬 수 있고 임의의 고리 원자는 임의 치환될 수 있다. 이러한 포화 또는 부분 불포화된 헤테로시클릭 라디칼의 예는 제한없이, 테트라히드로퓨라닐, 테트라히드로티에닐, 피롤리디닐, 피페리디닐, 피롤리닐, 테트라히드로퀴놀리닐, 테트라히드로이소퀴놀리닐, 데카히드로퀴놀리닐, 옥사졸리디닐, 피페라지닐, 디옥사닐, 디옥솔라닐, 디아제피닐, 옥사제피닐, 티아제피닐, 모르폴리닐, 및 퀴뉴클리디닐을 포함한다. 용어 "헤테로시클", "헤테로시클릴", "헤테로시클릴 고리", "헤테로시클릭 기", "헤테로시클릭 모이어티" 및 "헤테로시클릭 라디칼"은 본 명세서에서 상호교환적으로 사용되고, 또한 헤테로시클릴 고리가 하나 이상의 아릴, 헤테로아릴, 또는 시클로지방족 고리, 예컨대 인돌리닐, 3H-인돌릴, 크로마닐, 펜안트리디닐, 또는 테트라히드로퀴놀리닐에 융합된 기를 포함한다. 헤테로시클릴 기는 단환식, 이환식 또는 다환식일 수 있다. 용어 "헤테로시클릴알킬"은 헤테로시클릴에 의해 치환된 알킬 기를 지칭하고, 알킬 및 헤테로시클릴 부분은 독립적으로 임의 치환된다.
임의 치환된: 본 명세서에 기술된 바와 같이, 본 개시의 화학적 독립체, 예를 들어, 다양한 화합물은 임의 치환 및/또는 치환된 모이어티를 함유할 수 있다. 일반적으로, 용어 "치환된"은 지정된 모이어티의 하나 이상의 수소가 적합한 치환기로 치환된 것을 의미한다. 달리 표시하지 않으면, "임의 치환된" 기는 그 기의 각각의 치환가능한 위치에서 적합한 치환기를 가질 수 있고, 임의의 소정 구조 중 하나 초과의 위치가 명시된 기로부터 선택되는 하나 초과의 치환기로 치환될 수 있을 경우에, 치환기는 모든 위치에서 동일할 수 있거나 또는 상이할 수 있다. 일부 구현예에서, 임의 치환된 기는 치환된다. 일부 구현예에서, 임의 치환된 기는 미치환된다. 본 개시에서 고려되는 치환기의 조합은 바람직하게 적합하거나 또는 화학적으로 실현가능한 화합물의 형성을 발생시키는 것이다. 본 명세서에서 사용되는 용어 "안정한"은 본 명세서에 개시된 하나 이상의 목적을 위해 그들 생성, 검출, 및, 일정 구현예에서, 그들 회수, 정제, 및 사용을 가능하게 하는 조건을 가할 때 실질적으로 변경되지 않는 화합물을 의미한다.
치환가능한 원자, 예를 들어 적합한 탄소 원자 상의 적합한 1가 치환기는 독립적으로 할로겐; -(CH2)0-4R; -(CH2)0-4OR; -O(CH2)0-4R, -O-(CH2)0-4C(O)OR; -(CH2)0-4CH(OR)2; R로 치환될 수 있는, -(CH2)0-4Ph; R로 치환될 수 있는, -(CH2)0-4O(CH2)0-1Ph; R로 치환될 수 있는, -CH=CHPh; R로 치환될 수 있는, -(CH2)0-4O(CH2)0-1-피리딜; -NO2; -CN; -N3; -(CH2)0-4N(R)2; -(CH2)0-4N(R)C(O)R; -N(R)C(S)R; -(CH2)0-4N(R)C(O)NR 2; -N(R)C(S)NR 2; -(CH2)0-4N(R)C(O)OR; -N(R)N(R)C(O)R; -N(R)N(R)C(O)NR 2; -N(R)N(R)C(O)OR; -(CH2)0-4C(O)R; -C(S)R; -(CH2)0-4C(O)OR; -(CH2)0-4C(O)SR; -(CH2)0-4C(O)OSiR 3; -(CH2)0-4OC(O)R; -OC(O)(CH2)0-4SR, -SC(S)SR; -(CH2)0-4SC(O)R; -(CH2)0-4C(O)NR 2; -C(S)NR 2; -C(S)SR; -(CH2)0-4OC(O)NR 2; -C(O)N(OR)R; -C(O)C(O)R; -C(O)CH2C(O)R; -C(NOR)R; -(CH2)0-4SSR; -(CH2)0-4S(O)2R; -(CH2)0-4S(O)2OR; -(CH2)0-4OS(O)2R; -S(O)2NR 2; -(CH2)0-4S(O)R; -N(R)S(O)2NR 2; -N(R)S(O)2R; -N(OR)R; -C(NH)NR 2; -Si(R)3; -OSi(R)3; -B(R)2; -OB(R)2; -OB(OR)2; -P(R)2; -P(OR)2; -P(R)(OR); -OP(R)2; -OP(OR)2; -OP(R)(OR); -P(O)(R)2; -P(O)(OR)2; -OP(O)(R)2; -OP(O)(OR)2; -OP(O)(OR)(SR); -SP(O)(R)2; -SP(O)(OR)2; -N(R)P(O)(R)2; -N(R)P(O)(OR)2; -P(R)2[B(R)3]; -P(OR)2[B(R)3]; -OP(R)2[B(R)3]; -OP(OR)2[B(R)3]; -(C1-4 직쇄 또는 분지쇄 알킬렌)O-N(R)2; 또는 -(C1-4 직쇄 또는 분지쇄 알킬렌)C(O)O-N(R)2 이고, 상기 화학식에서, 각각의 R는 본 명세서에 정의된 바와 같이 치환될 수 있고 독립적으로 수소, C1-20 지방족, 질소, 산소, 황, 규소 및 인으로부터 독립적으로 선택되는 1-5 이종원자를 갖는 C1-20 헤테로지방족, -CH2-(C6-14 아릴), -O(CH2)0-1(C6-14 아릴), -CH2-(5-14원 헤테로아릴 고리), 질소, 산소, 황, 규소 및 인으로부터 독립적으로 선택되는 0-5 이종원자를 갖는, 5-20원, 단환식, 이환식, 또는 다환식, 포화, 부분 불포화 또는 아릴 고리이거나, 또는 상기 정의와 무관하게, R의 2개 독립 존재는 그들의 개재 원자(들)와 함께, 하기 정의된 바와 같이 치환될 수 있는, 질소, 산소, 황, 규소, 및 인으로부터 독립적으로 선택되는 0-5 이종원자를 갖는 5-20원, 단환식, 이환식, 또는 다환식, 포화, 부분 불포화 또는 아릴 고리를 형성한다.
R°(또는 그들의 개재 원자와 함께 R의 2개 독립 존재에 의해 형성되는 고리) 상의 적합한 1가 치환기는 독립적으로 할로겐, -(CH2)0-2R, -(할로R), -(CH2)0-2OH, -(CH2)0-2OR, -(CH2)0-2CH(OR)2; -O(haloR), -CN, -N3, -(CH2)0-2C(O)R, -(CH2)0-2C(O)OH, -(CH2)0-2C(O)OR, -(CH2)0-2SR, -(CH2)0-2SH, -(CH2)0-2NH2, -(CH2)0-2NHR, -(CH2)0-2NR 2, -NO2, -SiR 3, -OSiR 3, -C(O)SR , -(C1-4 직쇄 또는 분지쇄 알킬렌)C(O)ORl, 또는 -SSR 이고, 각각의 R 은 미치환되거나 또는 "할로"가 선행되는 경우에 하나 이상의 할로겐으로만 치환되고, C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 및 질소, 산소, 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 5-6원 포화, 부분 불포화, 또는 아릴 고리로부터 독립적으로 선택된다. R의 포화된 탄소 원자 상의 적합한 2가 치환기는 =O 및 =S를 포함한다.
예를 들어, 적합한 탄소 원자 상의 적합한 2가 치환기는 독립적으로 하기와 같다: =O, =S, =NNR* 2, =NNHC(O)R*, =NNHC(O)OR*, =NNHS(O)2R*, =NR*, =NOR*, -O(C(R* 2))2-3O-, 또는 -S(C(R* 2))2-3S-, 여기서 R* 의 각각의 독립 존재는 수소, 하기 정의된 바와 같이 치환될 수 있는, C1-6 지방족, 및 질소, 산소, 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 미치환된 5-6원 포화, 부분 불포화, 또는 아릴 고리로부터 선택된다. "임의 치환된" 기의 인접한 치환가능한 탄소에 결합되는 적합한 2가 치환기는 -O(CR* 2)2-3O-를 포함하고, 여기서 R* 의 각각의 독립 존재는 수소, 하기 정의된 바와 같이 치환될 수 있는 C1-6 지방족, 및 질소, 산소 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 미치환된 5-6원 포화, 부분 불포화, 및 아릴 고리로부터 선택된다.
R* 의 지방족 기 상의 적합한 치환기는 독립적으로 할로겐, -R, -(할로R), -OH, -OR, -O(할로R), -CN, -C(O)OH, -C(O)OR, -NH2, -NHR, -NR 2, 또는 -NO2 이고, 여기서 각각의 R 은 미치환되거나 또는 "할로"가 선행되는 경우에 하나 이상의 할로겐으로만 치환되고, 독립적으로 C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 또는 질소, 산소 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 5-6원 포화, 부분 불포화, 또는 아릴 고리이다.
일부 구현예에서, 치환가능한 질소 상에서 적합한 치환기는 독립적으로 -R, -NR 2, -C(O)R, -C(O)OR, -C(O)C(O)R, -C(O)CH2C(O)R, -S(O)2R, -S(O)2NR 2, -C(S)NR 2, -C(NH)NR 2, 또는 -N(R)S(O)2R;이고, 여기서 각각의 R 는 독립적으로 수소, 하기 정의된 바와 같이 치환될 수 있는 C1-6 지방족, 미치환된 -OPh, 또는 질소, 산소 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 미치환된 5-6원 포화, 부분 불포화, 또는 아릴 고리이거나, 또는 상기 정의와 무관하게, R의 2개 독립 존재는 그들의 개재 원자(들)와 함께 질소, 산소 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 미치환된 3-12원 포화, 부분 불포화, 또는 아릴 단환식 또는 이환식 고리를 형성한다.
R의 지방족 기 상의 적합한 치환기는 독립적으로 할로겐, -Rl, -(할로R), -OH, -OR, -O(할로R), -CN, -C(O)OH, -C(O)OR, -NH2, -NHR, -NR 2, 또는 -NO2 이고, 여기서 각각의 R 는 미치환되거나 또는 "할로"가 선행되는 경우에 하나 이상의 할로겐으로만 치환되고, 독립적으로 C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 또는 질소, 산소 및 황으로 독립적으로 선택되는 0-4 이종원자를 갖는 5-6원 포화, 부분 불포화, 또는 아릴 고리이다.
본 명세서에서 사용되는, 용어 "부분 불포화"는 적어도 하나의 이중 또는 삼중 결합을 포함하는 고리 모이어티를 지칭한다. 용어 "부분 불포화"는 다수의 불포화 부위를 갖는 고리를 포괄하고자 하지만, 본 명세서에 정의되는 바와 같이, 아릴 또는 헤테로아릴 모이어티를 포함하고자 의도하지 않는다.
"야생형"은 자연계에 존재하는 대로의 세포, 조성물, 조직, 또는 다른 생물학적 물질을 정의한다.
일부 구현예에서, 3-히드록시-프로파날 및 피루베이트는 하나 이상의 글리세롤, C5 당, C6 당, 포스포글리세레이트, 다른 탄소원, 해당 경로의 중간체, 및 이의 조합으로부터 제조된다. 일부 구현예에서, C5 당은 하나 이상의 자일로스, 자일룰로스, 리불로스, 아라비노스, 릭소스, 및 리보스를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어지고, C6 당은 알로스, 알트로스, 글루코스, 만노스, 굴로스, 이도스, 탈로스, 프룩토스, 사이코스, 솔보스, 및 타가토스를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다. 일부 구현예에서, 다른 탄소원은 미생물에 대한 탄소원으로서 적합한 공급원료이고, 여기서 공급원료는 하나 이상의 아미노산, 지질, 옥수수대, 억새, 도시 폐기물, 에너지 수수, 사탕수수, 바가스, 전분 스트림, 덱스트로스 스트림, 포르메이트, 메탄올, 및 이의 조합을 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
본 명세서에서 사용되는, 용어 "C5 당"은 5개 탄소를 함유하는 당 분자를 지칭한다.
본 명세서에서 사용되는, 용어 "C6 당"은 6개 탄소를 함유하는 당 분자를 지칭한다.
일부 구현예에서, 용어 "알돌 부가"는 피루베이트 분자가 CN+3 4-히드록시-2-케토-카르복실산 중간체를 생성시키기 위해 CN 알데히드의 알데히드 작용기와 반응하는 해당 에놀 또는 에놀레이트 이온 또는 시프 염기 또는 에나민을 형성하는 화학 반응을 지칭한다. 일부 구현예에서, CN 알데히드는 3-히드록시-프로파날이고 CN+3 4-히드록시-2-케토-카르복실산 중간체는 4,6-디히드록시-2-케토-헥산산이다.
일부 구현예에서, 용어 "알돌 축합"은 CN+3 3,4-데히드로-2-케토-카르복실산을 생성시키기 위해 CN 알데히드의 알데히드 작용기와 반응하는 해당 에놀 또는 에놀레이트 이온 또는 시프 염기 또는 에나민을 형성하는 화학 반응을 지칭한다. 일부 구현예에서, CN 알데히드는 3-히드록시-프로파날이고 CN+3 3,4-데히드로-2-케토-카르복실산은 6-히드록시-3,4-데히드로-2-케토-헥산산이다.
본 명세서에서 사용되는 용어 "용액"은 용매 및 용질, 예컨대 본 명세서에 기술된 방법에서 사용되는 출발 물질을 함유하는 액상 조성물을 지칭한다. 일부 구현예에서, 용매는 물이다. 일부 구현예에서, 용매는 유기 용매이다.
본 명세서에서 사용되는, 용어 "효소 단계" 또는 "효소 반응"은 바람직한 효소 반응을 촉진하도록 선택된 효소에 의해 촉매되는 분자 반응을 지칭한다. 효소는 대형 생물학적 분자 및 고도의 선택적 촉매이다. 대부분의 효소는 단백질이지만, 일부 촉매성 RNA 분자가 확인되었다.
본 출원 전반에서, 효소 단계는 "단계 1", "단계 2" 등으로서 표시될 수 있고 이들 단계를 특이적으로 촉매하는 효소는 각각 "1", "2" 등으로 표시된다. 이러한 효소는 또한 "반응 특이적 효소"라고도 지칭된다.
본 명세서에서 사용되는, 용어 "CoA" 또는 "조효소 A"는 그의 존재가 활성 효소 시스템을 형성하는 많은 효소의 활성에 요구되는 유기 보조인자 또는 보결분자단 (효소의 비단백질 부분)을 의미하고자 한다.
본 명세서에서 사용되는, 배양물 또는 성장 조건에 대해서 사용될 때 용어 "실질적으로 혐기성"은 산소의 양이 액상 배지 중 용존 산소에 대한 포화의 약 10% 미만인 것을 의미하고자 한다. 이 용어는 또한 약 1% 미만의 산소 대기가 유지되는 액체 또는 고체 배지의 밀봉 챔버를 포함하고자 한다.
본 명세서에서 사용되는, 본 개시의 미생물 유기체 또는 미생물에 대해서 사용될 때 용어 "비-천연 발생" 또는 "비-천연"은 미생물 유기체가 참조된 종의 야생형 균주를 포함하여, 참조된 종의 천연 발생 균주에서 정상적으로 발견되지 않는 적어도 하나의 유전자 변경을 갖는다는 것을 의미하고자 한다. 유전자 변경은 예를 들어, 폴리펩티드를 코딩하는 발현가능한 핵산을 도입시키는 변형, 다른 핵산 부가, 핵산 결실, 및/또는 미생물 유기체의 유전자 물질의 다른 기능적 파괴를 포함하지만, 이에 제한되지 않는다. 이러한 변형은 예를 들어, 참조된 종에 대한 이종성, 동종성 또는 이종성 및 동종성 폴리펩티드 둘 모두에 대한 코딩 영역 및 이의 기능적 단편을 포함하지만, 이에 제한되지 않는다. 추가 변형은 예를 들어, 변형이 유전자 또는 오페론의 발현을 변경시키지 않는 비-코딩 조절 영역을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "외생성"은 참조된 분자 또는 참조된 활성이 숙주 미생물 유기체로 도입되는 것을 의미하고자 한다. 분자는 예를 들어, 코딩 핵산을 숙주 유전자 물질에 도입시켜서, 예컨대 숙주 염색체 또는 비-염색체 유전자 물질 예컨대 플라스미드에 통합시켜서, 도입될 수 있다. 그러므로, 코딩 핵산의 발현에 대해서 사용되는 이 용어는 발현가능한 형태의 코딩 핵산의 미생물 유기체로의 도입을 지칭한다. 효소 활성에 대해서 사용될 때, 이 용어는 숙주 기준 유기체에 도입되는 활성을 지칭한다. 공급원은 예를 들어, 숙주 미생물 유기체로 도입 후 참조된 활성을 발현하는 동종성 또는 이종성 코딩 핵산일 수 있다. 그러므로, 용어 "내생성"은 야생형 숙주에서 본래 또는 자연적으로 존재하는 참조된 분자 또는 활성을 지칭한다. 유사하게, 코딩 핵산의 발현에 대해서 사용될 때 이 용어는 야생형 미생물 내에 함유되는 코딩 핵산의 발현을 지칭한다.
용어 "이종성"은 참조된 종 이외의 공급원으로부터 유래되는 분자 또는 활성을 의미하는 반면 본 문맥에서 사용될 때 "동종성"은 숙주 미생물 유기체로부터 유래된 분자 또는 활성을 지칭한다. 따라서, 코딩 핵산의 외생성 발현은 이종성 또는 동종성 코딩 핵산 중 어느 하나 또는 둘 모두를 이용할 수 있다.
하나 초과의 외생성 핵산이 유기체 미생물에 포함될 때, 하나 초과의 외생성 핵산은 상기 논의된 바와 같은, 참조된 코딩 핵산 또는 효소 활성을 지칭한다는 것을 이해한다. 하나 초과의 외생성 핵산은 별도 핵산 분자, 폴리시스트론 핵산 분자, 또는 이의 조합 상에서 숙주 미생물 유기체로 도입될 수 있고, 여전히 하나 초과의 외생성 핵산으로서 간주될 수 있다는 것을 본 명세서에 개시된 바와 같이, 더욱 이해한다. 예를 들어, 본 명세서에 개시된 바와 같이, 미생물 유기체는 바람직한 경로 효소 또는 단백질을 코딩하는 둘 이상의 외생성 핵산을 발현하도록 조작될 수 있다. 바람직한 활성을 코딩하는 2종의 외생성 핵산이 숙주 미생물 유기체로 도입되는 경우에, 2종의 외생성 핵산은 단일 핵산으로서 도입될 수 있고, 예를 들어, 단일 플라스미드 상에서, 별도 플라스미드 상에서, 단일 부위 또는 다수 부위에서 숙주 염색체에 통합될 수 있고, 여전히 2종의 외생성 핵산으로서 간주될 수 있다는 것을 이해한다. 유사하게, 둘 초과의 외생성 핵산은 숙주 유기체로 임의의 바람직한 조합으로 도입될 수 있고, 예를 들어, 단일 플라스미드 상에, 별도 플라스미드 상에서, 단일 부위 또는 다수 부위에서 숙주 염색체로 통합될 수 있으며, 여전히 둘 이상의 외생성 핵산으로서, 예를 들어, 3종의 외생성 핵산으로서 간주될 수 있다는 것을 이해한다. 따라서, 참조된 외생성 핵산 또는 효소 활성의 수는 코딩 핵산의 수 또는 효소 활성의 수를 지칭하나, 숙주 유기체로 도입된 별도 핵산의 수를 지칭하는 것은 아니다.
일부 구현예에서, 코딩 핵산의 외생성 발현이 적용된다. 외생성 발현은 숙주에 대해 발현 및/또는 조절 엘리먼트를 맞춤 제작하는 능력 및 사용자에 의해 제어되는 바람직한 발현 수준을 획득하기 위한 응용성을 부여한다. 그러나, 내생성 발현은 또한 다른 구현예에서, 예컨대 유도성 프로모터 또는 다른 조절 엘리먼트에 연결될 때 유전자 프로모터의 유도 또는 음성 조절 이펙터를 제거하여 이용될 수 있다. 따라서, 천연 발생 유도성 프로모터를 갖는 내생성 유전자는 적절한 유도제를 제공하여 상향-조절될 수 있거나, 또는 내생성 유전자의 조절 영역은 유도성 조절 엘리먼트를 유입시키도록 조작될 수 있어서, 바람직한 시간에 내생성 유전자의 증가된 발현의 조절을 허용한다. 유사하게, 유도성 프로모터는 비-천연 발생 미생물 유기체로 도입된 외생성 유전자에 대한 조절 엘리먼트로서 포함될 수 있다.
당업자는 유전자 변경이 적합한 숙주 유기체 예컨대 이. 콜라이 및 그들의 해당 물질대사 반응 또는 바람직한 유전자 물질 예컨대 바람직한 생합성 경로에 대한 유전자에 대한 적합한 공급원 유기체에 대해 기술된다는 것을 이해할 것이다. 그러나, 광범위하게 다양한 유기체의 완전한 게놈 시퀀싱 및 유전체학 분야의 높은 기술 수준을 고려하면, 당업자는 본 명세서에 제공된 교시 및 지침을 본질적으로 모든 다른 유기체에 쉽게 적용할 수 있을 것이다. 예를 들어, 본 명세서에 예시된 이. 콜라이 물질대사 변경은 참조된 종 이외의 종으로부터의 동일하거나 또는 유사한 코딩 핵산을 유입시켜서 다른 종에 쉽게 적용할 수 있다. 이러한 유전자 변경은 예를 들어, 종 상동성, 일반적으로, 특히, 오솔로그, 파라로그 또는 비-오솔로그 유전자 치환의 유전자 변경을 포함한다.
경로 효소를 코딩하는 핵산의 공급원은 예를 들어, 코딩된 유전자 생성물이 참조된 반응을 촉매할 수 있는 임의 종을 포함할 수 있다. 이러한 종은 제한없이, 고세균 및 진정세균을 포함하는 박테리아, 및 효모, 식물, 곤충, 동물, 및 인간을 포함한 포유동물을 포함한, 진핵생물을 포함하는, 원핵생물 및 진핵생물 유기체 둘 모두를 포함한다. 이러한 공급원의 예시적인 종은 예를 들어, 에스케리치아 콜라이 (Escherichia coli), 슈도모나스 크낙무씨이 (Pseudomonas knackmussii), 슈도모나스 푸티다 (Pseudomonas putida), 슈도모나스 플루오레센스 (Pseudomonas fluorescens), 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae), 세라티아 프로테아마쿨란스 (Serratia proteamaculans), 스트렙토마이세스 (Streptomyces) sp. 2065, 슈도모나스 애루지노사 (Pseudomonas aeruginosa), 랄스토니아 유트로파 (Ralstonia eutropha), 클로스트리듐 아세토부틸리쿰 (Clostridium acetobutylicum), 유글레나 그라실리스 (Euglena gracilis), 트레포네마 덴티콜라 (Treponema denticola), 클로스트리듐 클루이베리 (Clostridium kluyveri), 호모 사피엔스 (Homo sapiens), 라투스 노르베지쿠스 (Rattus norvegicus), 아시네토박터 (Acinetobacter) sp. ADP1, 스트렙토마이세스 코엘리콜로르 (Streptomyces coelicolor), 유박테리움 바르케리 (Eubacterium barkeri), 펩토스트렙토코쿠스 아사카롤리티쿠스 (Peptostreptococcus asaccharolyticus), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 티로부티리쿰 (Clostridium tyrobutyricum), 클로스트리듐 써모아세티쿰 (Clostridium thermoaceticum) (무렐라 써모아세티쿰 (Moorella thermoaceticum)), 아시네토박터 칼코아세티쿠스 (Acinetobacter calcoaceticus), 무스 무스쿨루스 (Mus musculus), 수스 스크로파 (Sus scrofa), 플라보박테리움 (Flavobacterium) sp, 아트로박터 아우레센스 (Arthrobacter aurescens), 페니실리움 크리소게눔 (Penicillium chrysogenum), 아스퍼질러스 니거 (Aspergillus niger), 아스퍼질러스 니둘란스 (Aspergillus nidulans), 바실러스 서브틸리스 (Bacillus subtilis), 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae), 자이모모나스 모빌리스 (Zymomonas mobilis), 만헤이미아 숙시니시프로두센스 (Mannheimia succiniciproducens), 클로스트리듐 융달리이 (Clostridium ljungdahlii), 클로스트리듐 카르복시디보란스 (Clostridium 카르복시divorans), 지오바실러스 스테아로써모필루스 (Geobacillus stearothermophilus), 아그로박테리움 투머파시엔스 (Agrobacterium tumefaciens), 아크로모박터 데니트리피칸스 (Achromobacter denitrificans), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 해모필루스 인플루엔자에 (Haemophilus influenzae), 악시다미노코쿠스 퍼멘탄스 (Acidaminococcus fermentans), 클로스트리듐 (Clostridium) sp. M62/1, 푸소박테리움 누클레아툼 (Fusobacterium nucleatum) 을 비롯하여, 본 명세서에 개시되거나 또는 해당 유전자에 대한 공급원 유기체로서 이용가능한 다른 예시적인 종을 포함한다 (실시예 참조). 그러나, 이제 400 초과의 미생물 게놈 및 다양한 효모, 진균, 식물, 및 포유동물 게놈에 대해 입수가능한 완전 게놈 서열을 사용하여, 예를 들어, 기지 유전자의 상동성, 오솔로그, 파라로그 및 비-오솔로그 유전자 치환, 및 유기체 간 유전자 변경의 상호교환을 포함한, 관련되거나 또는 먼 종에서 하나 이상의 유전자에 대한, 필수 경로 효소를 코딩하는 유전자의 확인은 통상적이고 당분야에 충분히 공지되어 있다.
오솔로그는 종 분화에 의해서 공통 조상 유전자로부터 진화된 상이한 종에서의 유전자를 지칭한다. 보통, 오솔로그는 진화 과정 동안 동일 기능을 보유한다. 오솔로그의 확인은 새롭게 시퀀싱된 게놈에서 유전자 기능의 신뢰할만한 예측에 결정적이다.
파라로그는 게놈 내 중복으로 관련된 유전자를 지칭한다. 오솔로그는 일반적으로 진화 과정에서 동일한 기능을 보유하지만, 파라로그는 이들이 본래의 것과 관련되더라도, 새로운 기능을 진화시킬 수 있다.
비오솔로그 유전자 치환은 상이한 종에서 참조된 유전자 기능을 대체할 수 있는 한 종으로부터의 비오솔로그 유전자이다. 치환은 예를 들어, 상이한 종에서 참조된 기능과 비교된 기원 종에서 실질적으로 동일하거나 또는 유사한 기능을 수행할 수 있는 것을 포함한다. 일반적으로, 비오솔로그 유전자 치환은 참조된 기능을 코딩하는 기지 유전자와 구조적으로 관련된 것으로 확인가능할 수 있지만, 구조적으로 덜 관련있지만 기능적으로 유사한 유전자 및 그들의 해당 유전자 생성물은 그럼에도 불구하고 여전히 본 명세서에서 사용되는 용어의 의미 내에 속하게 될 것이다. 기능적 유사성은 예를 들어, 대체하고자 하는 기능을 코딩하는 유전자와 비교하여 비오솔로그 유전자 생성물의 활성 부위 또는 결합 영역 내에 적어도 일부 구조적 유사성을 요구한다. 그러므로, 비오솔로그 유전자는 예를 들어 파라로그 또는 비관련 유전자를 포함한다.
본 명세서에서 사용되는, 용어 "미생물" 또는 "미생물 유기체" 또는 "미생물들"은 상호교환적으로 사용되고 외생성 또는 재조합 핵산, 예컨대 DNA 또는 RNA의 삽입을 통해서 형질전환 또는 형질감염될 수 있는 살아있는 생물학적 및 단리된 원핵생물 또는 진핵생물 세포를 지칭한다. 임의의 적합한 원핵생물 또는 진핵생물 미생물은 핵산의 서열로 형질전환된 이후에 여전히 살아있으면 본 개시에서 사용될 수 있다. 본 개시의 적합한 미생물은 방법에서 적어도 하나의 단계를 촉매할 수 있는 하나 이상의 재조합 단백질을 코딩하는 하나 이상의 핵산 구성체를 발현할 수 있다. 미생물은 박테리아, 효모, 진균, 곰팡이, 및 고세균의 군으로부터 선택될 수 있다. 이들은 상업적으로 입수가능하다.
본 명세서에서 사용되는, "진균"은 진균계 내에서 분류되는 임의의 진핵생물 유기체를 지칭한다. 진균계 내 문은 아스코마이코타 (Ascomycota), 바시디오마이코타 (Basidiomycota), 블라스토클라디오마이코타 (Blastocladiomycota), 카이트리디오마이코타 (Chytridiomycota), 글로머로마이코타 (Glomeromycota), 미크로스포리디아 (Microsporidia), 및 네오칼리마스티고마이코타 (Neocallimastigomycota)를 포함한다. 본 명세서에서 사용되는, "효모"는 (예를 들어, 출아에 의해) 단일-세포 형태로 성장하는 진균을 지칭하는데 반해서, "곰팡이"는 다세포 균사 또는 균사체로 만들어진 필라멘트로 성장하는 진균을 지칭한다 (McGinnis, M.R. and Tyring, S.K. "Introduction to Mycology." Medical Microbiology. 4th ed. Galveston: Univ. of TX Medical Branch at Galveston, 1996).
일부 구현예에서, 미생물은 효모 세포이다. 일부 구현예에서, 효모 세포는 칸디다 (Candida), 한세눌라 (Hansenula), 이사트첸키아 (Issatchenkia), 클루이베로마이세스 (Kluyveromyces), 피키아 (Pichia), 사카로마이세스 (Saccharomyces), 스키조사카로마이세스 (Schizosaccharomyces), 또는 야로위아 (Yarrowia) 종 유래이다.
일부 구현예에서, 미생물은 곰팡이 세포이다. 일부 구현예에서, 곰팡이 숙주 세포는 뉴로스포라 (Neurospora), 트리코더마 (Trichoderma), 아스퍼질러스 (Aspergillus), 푸사리움 (Fusarium), 또는 크리소스포리움 (Chrysosporium) 종 유래이다.
일부 구현예에서, 미생물은 고세균이다. 일부 구현예에서, 적합한 고세균은 아카에오글로부스 (Archaeoglobus), 아에로피룸 (Aeropyrum), 할로박테리움 (Halobacterium), 피로바쿨룸 (Pyrobaculum), 피로코쿠스 (Pyrococcus), 술폴로부스 (Sulfolobus), 메타노코쿠스 (Methanococcus), 메타노스파에라 (Methanosphaera), 메타노피루스 (Methanopyrus), 메타노브레비박터 (Methanobrevibacter), 메타노칼도코쿠스 (Methanocaldococcus), 또는 메타노사르시나 (Methanosarcina) 종 유래이다.
용어 "박테리아"는 원핵생물 유기체의 계 또는 영역 내 임의 미생물을 지칭한다. 박테리아계 또는 영역 내 문은 악시도박테리아 (Acidobacteria), 악티노박테리아 (Actinobacteria), 악티노바실러스 (Actinobacillus), 아그로박테리움 (Agrobacterium), 아나에로비오스피룰룸 (Anaerobiospirrulum), 아퀴피카에 (Aquificae), 아르마티모나데테스 (Armatimonadetes), 박테로이데테스 (Bacteroidetes), 버크홀데리아 (Burkholderia), 칼디세리카 (Caldiserica), 클라미디아에 (Chlamydiae), 클로로비 (Chlorobi), 클로렐라 (Chlorella), 클로로플렉시 (Chloroflexi), 크리시오게네테스 (Chrysiogenetes), 시트로박터 (Citrobacter), 클로스트리듐 (Clostridium), 시아노박테리아 (Cyanobacteria), 데페리박테레스 (Deferribacteres), 데이노코쿠스-써무스 (Deinococcus-thermus), 딕티오글로미 (Dictyoglomi), 엔테로박터 (Enterobacter), 엘루시미크로비아 (Elusimicrobia), 피브로박테레스 (Fibrobacteres), 피르미쿠테스 (Firmicutes), 푸소박테리아 (Fusobacteria), 지오바실러스 (Geobacillus), 겜마티모나데테스 (Gemmatimonadetes), 글루코노박터 (Gluconobacter), 할라나에로비움 (Halanaerobium), 클렙시엘라 (Klebsiella), 클루이베라 (Kluyvera), 락토바실러스 (Lactobacillus), 렌티스파에라에 (Lentisphaerae), 메틸로박테리움 (Methylobacterium), 니트로스피라 (Nitrospira), 파스퇴렐라세아에 (Pasteurellaceae), 파에니바실러스 (Paenibacillus), 플란크토마이세테스 (Planctomycetes), 프로피오니박테리움 (Propionibacterium), 슈도모나스 (Pseudomonas), 프로테오박테리아 (Proteobacteria), 랄스토니아 (Ralstonia), 스키조키트리움 (Schizochytrium), 스피로카에테스 (Spirochaetes), 스트렙토마이세스 (Streptomyces), 시네르기스테테스 (Synergistetes), 테네리쿠테스 (Tenericutes), 써모아나에로박테리움 (Thermoanaerobacterium), 써모데술포박테리아 (Thermodesulfobacteria), 써모토가에 (Thermotogae), 베루코미크로비아 (Verrucomicrobia), 조벨렐라 (Zobellella), 및 자이모모나스 (Zymomonas)를 포함한다. 일부 구현예에서, 박테리아 미생물은 이. 콜라이 세포이다. 일부 구현예에서, 박테리아 미생물은 바실러스 (Bacillus) sp. 세포이다. 바실러스 종의 예는 제한없이, 바실러스 서브틸리스 (Bacillus subtilis), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 세레우스 (Bacillus cereus), 바실러스 투린지엔시스 (Bacillus thuringiensis), 바실러스 미코이데스 (Bacillus mycoides), 및 바실러스 리케니포르미스 (Bacillus licheniformis)를 포함한다.
본 개시의 방법으로 제조된 카르복실산 화합물은 제한없이, 금속 이온, 예를 들어, 알칼리 금속 이온, 예컨대 소듐, 포타슘, 알칼리토 이온, 예컨대 칼슘, 마그네슘, 또는 알루미늄 이온을 포함한 반대 이온과 염을 형성할 수 있거나; 또는 유기 염기 예컨대 테트라알킬암모늄, 에탄올아민, 디에탄올아민, 트리에탄올아민, 트리메틸아민, N-메틸글루카민 등과 배위결합될 수 있다. 산은 반응 조건 하에 존재하는 반대 이온 또는 유기 염기와 염을 형성할 수 있거나 또는 무기 또는 유기 염기와 반영하여 염으로 전환될 수 있다.
본 명세서의 임의의 카르복실산 함유 화합물은 임의의 이의 염 형태를 포함하여, 임의의 이의 중성 또는 이온화 형태의 화합물을 지칭하기 위해 전반에서 상호교환적으로 사용된, 산 또는 염기를 지칭한다. 특이적 형태는 pH에 의존적일 것임을 당업자는 이해한다.
화합물의 용매화물은 결정 격자 내부에서 용매의 하나 미만, 하나 또는 하나 초과의 분자와 결정화되는 화합물의 고체-형태이다. 용매화물, 예컨대 약학적으로 허용가능한 용매화물을 생성시키는데 사용될 수 있는 용매의 소수 예는 제한없이, 물, C1-C6 알콜 (예컨대 메탄올, 에탄올, 이소프로판올, 부탄올, 및 임의 치환될 수 있는) 일반적으로, 테트라히드로퓨란, 아세톤, 에틸렌 글리콜, 프로필렌 글리콜, 아세트산, 포름산, 및 이의 용매 혼합물을 포함한다. 약학적으로 허용가능한 용매화물을 만드는 것을 보조할 수 있는 다른 이러한 생체적합성 용매는 당분야에 충분히 공지되어 있다. 추가로, 다양한 유기 및 무기 산 및 염기는 바람직한 용매화물을 생성시키기 위해 첨가될 수 있다. 이러한 산 및 염기는 당분야에 공지되어 있다. 용매가 물인 경우에, 용매화물은 수화물이라고 지칭될 수 있다. 일부 구현예에서, 화합물의 한 분자는 0.1 내지 5 분자의 용매, 예컨대 0.5 분자의 용매 (반용매화물, 예컨대 반수화물), 1 분자의 용매 (단일용매화물, 예컨대 단일수화물) 및 2 분자의 용매 (2용매화물, 예컨대 이수화물)와의 용매화물을 형성할 수 있다.
몇개의 이성질체 (예를 들어, 시스 및 트랜스 이성질체, RS 이성질체, 또는 이의 조합)가 존재하는 화합물을 언급할 때, 원론적으로 화합물은 본 개시의 방법에서 사용할 수 있는 그 화합물의 모든 가능한 거울상이성질체, 부분입체이성질체 및 시스/트랜스 이성질체를 포함한다.
각 종의 경우에, 그 종에 속하는 임의 세포는 본 개시의 적합한 미생물로 간주된다. 임의 종의 숙주 세포는 자연계로부터 단리된 대로 존재할 수 있거나, 또는 임의 수의 유전자 변형 (예를 들어, 유전자 돌연변이, 결실, 또는 재조합 폴리뉴클레오티드)을 함유할 수 있다.
용어 "재조합 핵산" 또는 "재조합 폴리뉴클레오티드"는 본 명세서에서 사용되는 하기 중 적어도 하나가 참인 핵산의 중합체를 지칭한다: (a) 핵산의 서열이 소정 미생물에 대해 외래인 경우 (즉, 자연적으로 발견되지 않음); (b) 서열이 소정 미생물에서 자연적으로 발견될 수 있지만, 비자연적인 (예를 들어, 기대 초과) 양으로 발견될 수 있는 경우; 또는 (c) 핵산의 서열이 자연계에서 서로에 대해 동일한 관계로 발견되지 않는 둘 이상의 하위서열을 함유하는 경우. 예를 들어, (c)의 예와 관련하여, 재조합 핵산 서열은 새로운 기능성 핵산을 만들도록 배열된 미관련 유전자로부터의 둘 이상의 서열을 가질 수 있다.
일부 구현예에서, 본 개시의 재조합 폴리펩티드 또는 단백질 또는 효소는 하나 이상의 발현 벡터의 일부로서 유전자 물질에 의해 코딩될 수 있다. 발현 벡터는 하나 이상의 폴리펩티드-코딩 핵산을 함유하고, 핵산(들)의 발현을 제어하는 임의의 바람직한 엘리먼트를 비롯하여, 소정 숙주 세포 내부에서 발현 벡터의 복제 및 유지를 가능하게 하는 임의의 엘리먼트를 더 함유할 수 있다. 모든 재조합 핵산은 단일 발현 벡터 상에 존재할 수 있거나, 또는 그들은 다수 발현 벡터에 의해 코딩될 수 있다.
발현 벡터 또는 벡터들은 숙주 유기체에서 기능하는 발현 제어 서열에 작동적으로 연결된 본 명세서에 예시된 바와 같은 하나 이상의 경로-코딩 핵산을 포함하도록 구축될 수 있다. 제공되는 미생물 숙주 유기체에서 사용을 위해 적용가능한 발현 벡터는 예를 들어, 벡터를 포함한, 플라스미드, 파지 벡터, 바이러스 벡터, 에피솜 및 인공 염색체, 및 숙주 염색체로 안정한 통합을 위해 작동가능한 선택 서열 또는 마커를 포함한다. 추가로, 발현 벡터는 하나 이상의 선별 마커 유전자 및 적절한 발현 제어 서열을 포함할 수 있다. 선별 마커 유전자는 또한 예를 들어, 항생제 또는 독소에 대한 내성, 상보성 영양요구성 결핍을 제공하거나, 또는 배양 배지에 없는 결정적 영양분을 공급하는 것이 포함될 수 있다. 발현 제어 서열은 당분야에 충분히 공지된 항상성 및 유도성 프로모터, 전사 인핸서, 전사 종결자 등을 포함할 수 있다. 둘 이상의 외생성 코딩 핵산을 공-발현시키려고 할 때, 양쪽 핵산은 예를 들어 단일 발현 벡터 또는 별도 발현 벡터에 삽입될 수 있다. 단일 벡터 발현을 위해서, 코딩 핵산은 하나의 공통 발현 제어 서열에 작동적으로 연결될 수 있거나 또는 상이한 발현 제어 서열, 예컨대 하나의 유도성 프로모터 및 하나의 항상성 프로모터에 연결된다. 폴리뉴클레오티드가 작동적으로 연결되는 클로닝 부위 및 프로모터 둘 모두를 함유하는 벡터는 당분야에 충분히 공지되어 있다. 이러한 벡터는 생체내 또는 시험관내에서 RNA를 전사시킬 수 있고, Stratagene (La Jolla, CA) 및 Promega Biotech (Madison, WI) 같은 공급처로부터 상업적으로 입수가능하다. 발현 및/또는 시험관내 전사를 최적화하기 위해서, 여분의, 잠재적으로 부적절한 선택적 번역 개시 코돈 또는 전사 또는 번역 수준에서 발현을 간섭할 수 있거나 또는 감소시킬 수 있는 다른 서열을 제거시키기 위해 클론의 5' 및/또는 3' 비번역 부분을 제거, 첨가, 또는 변경시키는 것이 필요할 수 있다. 대안적으로, 공통 리보솜 결합 부위는 발현을 증강시키기 위해 출발 코돈의 바로 5'에 삽입될 수 있다.
본 명세서에 기술된 바람직한 화합물의 합성을 위한 경로에 관여되는 외생성 핵산 서열은 제한없이, 접합, 전기영동, 화학적 형질전환, 형질도입, 형질감염, 및 초음파 형질전환을 포함한 당분야에 충분히 공지된 기술을 사용해 숙주 세포로 안정하게 또는 일시적으로 도입될 수 있다. 이. 콜라이 또는 다른 원핵생물 세포에서 외생성 발현을 위해서, 진핵생물 핵산의 유전자 또는 cDNA 중 일부 핵산 서열은 바람직하면, 원핵생물 숙주 세포로 형질전환 전에 제거될 수 있는, 표적화 신호 예컨대 N-말단 미토콘드리아 또는 다른 표적화 신호를 코딩할 수 있다. 예를 들어, 미토콘드리아 리더 서열의 제거는 이. 콜라이에서 증가된 발현을 초래하였다 (Hoffmeister et al., J. Biol. Chem. 280:4329-4338 (2005)). 효모 또는 다른 진핵생물 세포에서 외생성 발현을 위해서, 유전자는 리더 서열의 첨가없이 시토졸에서 발현될 수 있거나, 또는 적합한 표적화 서열 예컨대 숙주 세포에 적합한 미토콘드리아 표적화 또는 분비 신호의 첨가를 통해서, 분비를 위해 표적화되거나, 또는 미토콘드리아 또는 다른 세포소기관으로 표적화될 수 있다. 표적화 서열을 제거 또는 포함시키기 위한 핵산 서열에 대한 적절한 변형이 바람직한 성질을 부여하도록 외생성 핵산 서열에 유입될 수 있다는 것을 이해한다. 더 나아가서, 유전자는 단백질의 최적 발현을 획득하기 위해 당분야에 충분히 공지된 기술을 사용해 코돈 최적화될 수 있다.
범위를 포함하여, 모든 수치 표시, 예를 들어, pH, 온도, 시간, 농도, 및 분자량은 0.1의 증분만큼 (+) 또는 (-)로 다양한 근사치이다. 항상 명확하게 명시하지 않지만, 모든 수치 표시는 용어 "약"이 선행된다는 것을 이해해야 한다. 본 명세서에서 사용되는, "약"은 10%를 더하거나 또는 뺀것을 의미할 것이다. 항상 분명하게 명시하지 않지만, 본 명세서에 기술된 시약은 단지 예시이고 이의 균등물은 당분야에 공지되어 있다는 것을 이해해야 한다.
"작동적으로 연결된"은 엘리먼트가 그들을 기능하게 허용하는 배열로 존재하는 병렬을 지칭한다.
용어 "배양하는"은 다양한 종류의 배지 (배양물) 상에서 또는 그 안에서 세포 또는 유기체의 시험관내 전파를 의미한다. 배양물 중에서 성장된 세포의 후손은 부모 세포와 (즉, 형태학적으로, 유전적으로, 또는 표현형적으로) 완전히 동일하지 않을 수 있다는 것을 이해한다.
"유전자"는 전사되고 번역된 후에 특정 폴리펩티드 또는 단백질을 코딩할 수 있는 적어도 하나의 오픈 리딩 프레임 (ORF)을 함유하는 폴리뉴클레오티드를 지칭한다. 본 명세서에 기술된 임의의 폴리뉴클레오티드 서열은 그들이 회합된 유전자의 더 큰 단편 또는 전체-길이 코딩 서열을 확인하는데 사용될 수 있다. 더 큰 단편 서열을 단리하는 방법은 당업자에게 공지되어 있다.
용어 "발현하다"는 유전자 생성물의 생성을 의미한다. 용어 과발현은 정상 또는 대조군 세포의 것을 초과하여, 예를 들어, 대조군 샘플 또는 야생형 세포에서 검출되는 발현 수준에 비해 0.5배, 1.0배, 1.5배, 또는 대안적으로, 2배, 또는 대안적으로, 적어도 2.5배, 또는 대안적으로, 적어도 3.0배, 또는 대안적으로, 적어도 3.5배, 또는 대안적으로, 적어도 4.0배, 또는 대안적으로, 적어도 5배, 또는 대안적으로 10배 더 높게, 유전자로부터 전사되는 mRNA 또는 유전자에 의해 코딩되는 단백질 생성물의 생성을 지칭한다.
본 명세서에서 사용되는, "상동성"은 기준 서열 및 적어도 제2 서열의 단편 간 서열 유사성을 지칭한다. 상동성은 바람직하게, 기준 서열을 단일 제2 서열 또는 서열의 단편과 또는 서열의 데이터베이스와 비교하기 위한 BLAST 도구를 사용하여, 당분야에 공지된 임의 방법으로 확인할 수 있다. 하기에 기술된 바와 같이, BLAST는 동일성 및 유사성 백분율을 기반으로 서열을 비교할 것이다.
둘 이상의 핵산s 또는 폴리펩티드 서열의 문맥에서, 용어 "동일한" 또는 "동일성" 백분율은 동일한 둘 이상의 서열 또는 하위서열을 지칭한다. 2개 서열은 2개 서열이 하기 서열 비교 알고리즘 중 하나를 사용하거나 또는 수동 정렬 및 육안 검사를 통해서 측정되는 지정된 영역, 또는 비교창 상에서 최적 상응도로 비교 및 정렬되었을 때, 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 백분율 (즉, 명시된 영역 상에서, 또는 명시되지 않은 경우, 전체 서열 상에서, 29% 동일성, 임의로 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100% 동일성)을 가지면, "실질적으로 동일"하다. 임의로, 동일성은 적어도 약 50 뉴클레오티드 (또는 10 아미노산) 길이인 영역, 또는 보다 바람직하게 100 내지 500 또는 1000 이상의 뉴클레오티드 (또는 20, 50, 200 이상의 아미노산) 길이인 영역 상에서 존재한다.
비교를 위한 서열의 정렬 방법은 당분야에 충분히 공지되어 있다. 예를 들어, 임의의 2개 서열 간 서열 동일성 백분율의 결정은 수학 알고리즘을 사용해 수행될 수 있다. 이러한 수학 알고리즘의 비제한적인 예는 [Myers and Miller, CABIOS 4:11 17 (1988)]의 알고리즘; [Smith et al., Adv. Appl. Math. 2:482 (1981)]의 국소 상동성 알고리즘; [Needleman and Wunsch, J. Mol. Biol. 48:443 453 (1970)]의 상동성 정렬 알고리즘; [Pearson and Lipman, Proc. Natl. Acad. Sci. 85:2444 2448 (1988)]의 유사성 검색 방법; [Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873 5877 (1993)]의 알고리즘이다.
서열 비교를 위해서, 전형적으로 하나의 서열은 시험 서열이 비교되는 기준 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열은 컴퓨터에 입력되고, 필요하면, 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 매개변수를 지정한다. 디폴트 프로그램 매개변수를 사용할 수 있거나, 또는 대안적인 매개변수를 지정할 수 있다. 다음으로 서열 비교 알고리즘은 프로그램 매개변수를 기반으로, 기준 서열에 대해 시험 서열의 서열 동일성 백분율을 계산한다. 동일성에 대해 2개 서열을 비교할 때, 서열이 연속적일 필요는 없지만, 임의 갭은 전체 동일성 백분율을 감소시키는 패널티와 함께 수반될 것이다. blastn 경우에, 디폴트 매개변수는 갭 오프닝 패널티=5 및 갭 확장 패널티=2이다. blastp 경우에, 디폴트 매개변수는 Gap 오프닝 패널티=11 및 Gap 확장 패널티=1이다.
본 명세서에서 사용되는, "비교창"은 2개 서열이 최적으로 정렬된 후에 서열을 동일한 수의 인접된 위치의 기준 서열과 비교할 수 있는, 제한없이, 20 내지 600, 일반적으로, 약 50 내지 약 200, 보다 일반적으로 약 100 내지 약 150을 포함한 인접한 위치의 수의 어느 하나의 절편에 대한 기준을 포함한다. 비교를 위한 서열의 정렬 방법은 당분야에 충분히 공지되어 있다. 비교를 위한 서열의 최적 정렬은 예를 들어, [Smith and Waterman (1981)]의 국소 상동성 알고리즘, [Needleman and Wunsch, J Mol Biol 48(3):443-453 (1970)]의 상동성 정렬 알고리즘, [Pearson and Lipman, Proc Natl Acad Sci USA 85(8):2444-2448 (1988)]의 유사성 검색 방법을 통해서, 이들 알고리즘 ([Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI]의 GAP, BESTFIT, FASTA, 및 TFASTA)의 컴퓨터 구현에 의해서, 또는 수동 정렬 및 육안 검사 [참조; 예를 들어, Brent et al., (2003) Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (Ringbou Ed)]를 통해서 수행될 수 있다.
서열 동일성 및 서열 유사성 백분율을 결정하는데 적합한 알고리즘의 2개 예는 BLAST 및 BLAST 2.0 알고리즘으로서, 각각 [Altschul et al., Nucleic Acids Res 25(17):3389-3402 (1997)] 및 [Altschul et al., J. Mol Biol 215(3)-403-410 (1990)]에 기술되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물정보 센터를 통해 공공으로 입수가능하다. 이러한 알고리즘은 데이터베이스 서열 중 동일 길이의 단어와 정렬했을 때 일부 양의 값의 한계치 점수와 일치하거나 또는 그를 만족하는, 질의 서열 중 짧은 단어 길이 W를 확인하여 고점수 서열쌍 (HSP)을 먼저 확인하는 단계를 포함한다. T는 이웃 단어 점수 한계치로서 지칭된다 (Altschul et al., 상동). 이들 초기 이웃 단어 히트는 그들을 함유하는 더 긴 HSP를 찾기 위한 검색을 개시하기 위한 씨드로서 작용된다. 단어 히트는 누적 정렬 점수가 증가되는 한 각 서열을 따라서 양쪽 방향으로 연장된다. 누적 점수는 뉴클레오티드 서열의 경우에, 매개변수 M (일치 잔기쌍에 대한 보상 점수; 항상 > 0) 및 N (불일치 잔기에 대한 패널티 점수; 항상 < 0)을 사용해 계산된다. 아미노산 서열 경우에, 채점 매트릭스는 누적 점수를 계산하는데 사용된다. 각 방향으로 단어 히트의 연장은 누적 정렬 점수가 이의 최대 획득값으로부터 X 분량만큼 감소되는 경우; 하나 이상의 음의 채점 잔기 정렬의 축적으로 인해, 누적 점수가 0 또는 그 이하로 가는 경우; 또는 양쪽 서열의 말단에 도달하는 경우에 중지된다. BLAST 알고리즘 매개변수 W, T, 및 X는 알고리즘의 감도 및 속도를 결정한다. BLASTN 프로그램 (뉴클레오티드 서열 경우)은 디폴트로서 11의 단어길이 (W), 10의 기대치 (E), M=5, N=-4, 및 양쪽 가닥의 비교를 사용한다. 아미노산 서열 경우, BLASTP 프로그램은 디폴트로서 3의 단어길이, 10의 기대치 (E), 및 50의 BLOSUM62 채점 매트릭스 (참조: Henikoff and Henikoff, Proc Natl Acad Sci USA 89(22):10915-10919 (1992)) 정렬 (B), 10의 기대치 (E), M=5, N=-4, 및 양쪽 가닥의 비교를 사용한다.
BLAST 알고리즘은 2개 서열 간 유사성의 통계 분석을 또한 수행한다 (참조: 예를 들어, Karlin and Altschul, Proc Natl Acad Sci USA 90(12):5873-5877 (1993)). BLAST 알고리즘을 통해 제공되는 유사성의 한 척도는 2개 뉴클레오티드 또는 아미노산 서열 간 일치가 우연하게 발생되는 확률의 표시를 제공하는, 최소 총합 확률 (P(N))이다. 예를 들어, 핵산은 기준 핵산에 대한 시험 핵산의 비교에서 최소 총합 확률이 약 0.2 미만, 보다 바람직하게 약 0.01 미만, 및 가장 바람직하게 약 0.001 미만이면 기준 서열과 유사한 것으로 간주된다.
상기 언급된 서열 동일성의 백분율 이외에, 2개 핵산 서열 또는 폴리펩티드가 실질적으로 동일하다는 다른 표시는 제1 핵산에 의해 코딩되는 폴리펩티드가 제2 핵산에 의해 코딩되는 폴리펩티드에 대한 항체와 면역학적으로 교차-반응한다는 것이다. 따라서, 폴리펩티드는 전형적으로, 예를 들어, 2개 펩티드가 보존성 치환만이 상이한 제2 폴리펩티드와 실질적으로 동일하다. 2개 핵산 서열이 실질적으로 동일하다는 다른 표시는 2개 분자 또는 그들 상보체가 엄격 조건 하에서 서로 혼성화한다는 것이다. 2개 핵산 서열이 실질적으로 동일하다는 또 다른 표시는 동일한 프라이머가 서열을 증폭시키는데 사용될 수 있다는 것이다.
어구 "기능적으로 동등한 단백질"은 엄격 조건 하에서 예시된 폴리뉴클레오티드에 혼성화하고 예를 들어 표준 또는 대조군 생물학적 활성과 비교하여 120% 이상, 또는 대안적으로 110% 이상, 또는 대안적으로 100% 이상, 또는 대안적으로, 90% 이상 또는 대안적으로 85% 이상 또는 대안적으로 80% 이상으로 생체내에서 유사하거나 또는 증강된 생물학적 활성을 나타내는 단백질 또는 폴리뉴클레오티드를 지칭한다. 본 개시의 범주 내에서 추가 구현예는 80% 초과, 또는 대안적으로, 85% 초과, 또는 대안적으로, 90% 초과, 또는 대안적으로, 95% 초과, 또는 대안적으로 97% 초과, 또는 대안적으로, 98% 또는 99% 초과의 서열 상동성을 갖는 것으로 확인된다. 상동성 백분율은 적절한 조건 하에서 실행되는 BLAST 같은 서열 비교 프로그램을 통해서 결정될 수 있다. 일부 구현예에서, 프로그램은 디폴트 매개변수 하에서 실행된다. 일부 구현예에서, 일정 효소 또는 단백질에 대한 기준은 이의 기능적으로 동등한 효소 또는 단백질을 포함한다.
세포의 개체군은 표현형 및/또는 유전자형이 동일 (클론)하거나 또는 동일하지 않은 하나 초과의 세포의 컬렉션을 의도한다. 세포의 실질적으로 균질한 개체군은 사전-선택된 마커를 통해 측정되는 적어도 70%, 또는 대안적으로 적어도 75%, 또는 대안적으로 적어도 80%, 또는 대안적으로 적어도 85%, 또는 대안적으로 적어도 90%, 또는 대안적으로 적어도 95%, 또는 대안적으로 적어도 98% 동일한 표현형을 갖는 개체군이다.
효소가 효소 클래스 (EC)에 대해서 언급될 때, 효소 클래스는 효소가 분류되거나, 또는 국제 생화학 및 분자 생물학 연합의 명명 위원회가 제공하는 효소 명명법을 기반으로 분류될 수 있는 클래스이다. 특별한 클래스로 아직 분류되지 않았지만 그와 같이 분류될 수 있는 다른 적합한 효소가 또한 포함된다.
비-천연 발생 미생물 유기체
본 명세서에서 제공되는 비-천연 발생 미생물 유기체는 화합물 예컨대 2-케토 펜탄산, 2-케토 헥산산, 6-히드록시-2-케토-헥산산, 1,5-펜탄디올, 아디프산, 1, 6-헥산디올, 또는 6-히드록시 헥산산을 생성시키기에 충분한 양으로 본 명세서에 기술된 생합성 경로에서 사용되는 효소 또는 단백질을 코딩하는 적어도 하나의 핵산을 외생적으로 발현시키기 위해 본 명세서에서 예시된 바와 같은 당분야에 충분히 공지된 방법을 사용해 구축된다.
본 명세서에 기술된 바람직한 생성물을 생성할 수 있는 미생물 숙주의 성공적인 조작은 경로에서 다양한 단계를 촉매하기 위한 충분한 활성 및 특이성을 갖는 효소의 적절한 세트, 예를 들어 본 명세서의 실시예 및 문헌에 기술된 것들을 확인하는 단계를 포함한다. 외생성 DNA 서열로부터의 개별 효소 또는 단백질 활성은 또한 당분야에 충분히 공지된 방법을 사용해 어세이될 수 있다. 또한, 이들 효소는 바람직한 기질 특이성의 획득, 거울상 순수 또는 라세믹 생성물을 합성하도록 입체선택성의 제어, 반감기, 열안정성, 억제제/생성물 내성을 개선시키고 선택된 바람직한 미생물 생성 숙주에서 효소 발현 및 가용성의 개선을 통해서 거친 산업 과정 조건을 견디도록 효소의 안정화를 위해서, 현대 단백질 조작 접근법 (Protein Engineering Handbook; Lutz S., & Bornscheuer U.T. Wiley-VCH Verlag GmbH & Co. KGaA: 2008; Vol. 1 & 2) 예컨대 유도 진화, 합리적 돌연변이유발법, 컴퓨터 디자인 (Zanghellini, A et al, 2008) 또는 이의 조합을 사용해 조작될 수 있다. 경로의 각 단계를 촉매할 수 있는 바람직한 효소가 특징규명되면, 이들 효소를 코딩하는 유전자는 선택 미생물에 클로닝될 것이고, 발효배양 조건은 최적화될 것이고 생성물 형성은 발효배양 이후에 모니터링될 것이다. 효소가 확인된 후에, 하나 이상의 효소에 해당하는 유전자가 미생물 숙주로 클로닝된다. 일부 구현예에서, 본 명세서에 기술된 특정 경로의 각 효소를 코딩하는 유전자는 미생물 숙주에 클로닝된다.
이러한 목적에 적합한 미생물, 및 벡터로 재조합/외생성 핵산/단백질을 도입시키는 방법은 당분야에 충분히 공지되어 있다. 예를 들어, 다양한 기술이 [Current Protocols in Molecular Biology, Ausubel et al., eds. (Wiley & Sons, New York, 1988, and quarterly updates)]에 예시되어 있다. 미생물 숙주 세포로 발현 벡터를 전달하기 위한 방법은 당분야에 충분히 공지되어 있다. 특별한 방법 및 벡터는 바람직한 미생물 숙주의 종에 의존하여 상이할 수 있다. 예를 들어, 박테리아 숙주 세포는 열충격, 칼슘 클로라이드 처리, 전기영동, 리포솜, 또는 파지 감염을 통해 형질전환될 수 있다. 효모 숙주 세포는 리튬 아세테이트 처리 (캐리어 DNA 및 PEG 처리를 더 포함할 수 있음) 또는 전기 영동을 통해서 형질전환될 수 있다. 이들 방법은 예시적인 목적을 위해 포함되고 제한적이거나 또는 포괄적인 것을 의도하는 방식이 아니다. 당분야에 충분히 공지된 수단을 통한 통상의 실험을 사용하여 특정 발현 벡터 또는 형질전환 방법이 소정 미생물 숙주에 적합한지 여부를 결정할 수 있다. 더 나아가서, 많은 상이한 미생물 숙주에 적합한 시약 및 벡터가 상업적으로 입수가능하고 당분야에 충분히 공지되어 있다.
효소의 구축, 발현 또는 과발현 및 비-천연 발생 미생물 숙주에서 발현 수준의 시험을 위한 방법은 당분야에 충분히 공지되어 있다 (Protein Expression Technologies: Current Status and Future Trends, Baneyx F. eds. Horizon Bioscience, 2004, Norfolk, UK; and Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); and Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)).
미생물의 발효배양을 수행하는 방법은 당분야에 충분히 공지되어 있다. 예를 들어, 다양한 기술은 [Biochemical Engineering, Clark et al., eds. (CRC press, 1997, 2nd edition)]에 예시되어 있다. 발효배양을 위한 특별한 방법은 바람직한 미생물 숙주의 종에 의존하여 상이할 수 있다. 전형적으로, 미생물은 회분식 또는 연속 발효배양 방식으로 탄소원과 함께 적절한 배지에서 성장된다. 이화산물 억제 또는 효소 활성을 조절하는 것으로 공지된 작용제의 사용을 사용하여 아디프산 또는 글루타르산 생성을 증강시킬 수 있다. 발효배양에 적합한 pH는 3-10이다. 발효배양은 미생물의 요건을 기반으로 호기성, 혐기성, 또는 무산소 조건 하에서 수행될 수 있다. 발효배양은 회분식, 유가-배양식, 또는 연속식 방식으로 수행될 수 있다. 발효배양은 또한 바람직하면 2개 시기로 수행될 수 있다. 예를 들어, 제1 시기는 고성장 및 그러므로 고생산성을 허용하도록 호기성일 수 있고, 이후에 높은 카프로락톤 수율의 혐기성 시기가 후속될 수 있다.
탄소원은 예를 들어, 탄소 공급원을 비-천연 발생 미생물에게 공급할 수 있는 임의의 탄화수소 공급원을 포함할 수 있다. 이러한 공급원은 예를 들어, 당 예컨대 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스 및 전분을 포함한다. 탄화수소의 다른 공급원은 예를 들어 재생가능한 공급원료 및 생물량을 포함한다. 본 개시의 방법에서 공급원료로서 사용할 수 있는 생물량의 예시적인 유형은 셀루로식 생물량, 헤미셀룰로식 생물량 및 리그닌 공급원로 또는 공급원료의 일부분을 포함한다. 이러한 생물량 공급원료는 예를 들어 탄소원으로서 유용한 탄수화물 기질, 예컨대 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스 및 전분을 함유한다. 본 명세서에 제공된 교시 및 지침을 고려하면, 당업자는 또한 상기 예시된 것 이외의 재생가능한 공급원료 및 생물량이 바람직한 화합물의 생성을 위한 본 개시의 미생물 유기체를 배양하는데 사용될 수 있다는 것을 이해할 것이다.
본 명세서에 기술된 반응은 모니터링될 수 있고 발효배양 배지 중 출발 물질, 생성물 또는 중간체는 고압 액상 크로마토그래피 (HPLC) 분석, GC-MS (Gas Chromatography-Mass Spectroscopy) 및 LC-MS (Liquid Chromatography-Mass Spectroscopy) 또는 당분야에 충분히 공지된 통상의 절차를 사용한 다른 적합한 분석 방법을 사용해 배지를 분석하여 확인할 수 있다.
본 명세서에 기술된 임의의 비-천연 발생 미생물 유기체는 본 개시의 생성물을 생성 및/또는 분비하도록 배양될 수 있다.
본 명세서에 기술된 방법으로 제조된 화합물은 생합성 또는 발효배양으로 제조된 유기 화합물의 단리를 위해 당분야에 일반적으로 공지된 방법으로 단리될 수 있다. 예를 들어, 화합물은 결정화, 염 형성, 막증발, 반응성 추출, 추출 (액상-액상 및 2층), 흡착, 이온 교환, 투석, 증류, 가스 스트리핑, 및 막 기반 분류 (Roffler et al., Trends Biotechnolgy.2: 129-136 (1984))를 통해서 용액으로부터 단리될 수 있다. 1,5-펜탄디올은 증류, 추출 (액상-액상 및 2층), 막증발, 및 막 기반 분리 (Roffler et al., Trends Biotechnolgy.2: 129-136 (1984))를 사용해 용액으로부터 단리될 수 있다.
본 명세서에 기술된 바와 같이, 바람직한 생성물의 생합성을 획득하기 위한 하나의 예시적인 성장 조건은 혐기성 배양 또는 발효배양 조건을 포함한다. 일정 구현예에서, 본 개시의 비-천연 발생 미생물 유기체는 혐기성 또는 실질적으로 혐기성 조건 하에서 유지될 수 있거나, 배양될 수 있거나 또는 발효배양될 수 있다. 간략하게, 혐기성 조건은 산소가 없는 환경을 의미한다. 실질적으로 혐기성 조건은 예를 들어, 배지 중 용존 산소 농도가 포화의 0 내지 105로 남아있도록 하는 배양, 회분식 발효배양 또는 연속 발효배양을 포함한다. 실질적으로 혐기성 조건은 또한 1% 미만의 산소 대기를 유지하는 밀봉된 챔버 내부에서 액상 배지 또는 고체 한천 상에서 성장하거나 또는 휴지된 세포를 포함한다. 산소의 백분율은 예를 들어, N2/CO2 혼합물 또는 다른 적합한 비-산소 가스 또는 가스들로 배양물을 살포하여 유지될 수 있다.
본 명세서에 기술된 배양 조건은 생성물을 제조하기 위해 규모를 확장할 수 있고 연속적으로 성장될 수 있다. 예시적인 성장 절차는 예를 들어 유가-배양화학식 발효배양 및 회분식 분리; 유가-배양식 발효배양 및 연속 분리, 또는 연속 발효배양 및 연속 분리를 포함한다. 모든 이들 과정은 당분야에 충분히 공지되어 있다. 발효배양 절차는 상업적 분량으로 생합성 생성을 위해 특히 유용하다.
용어 "충분량으로 발현된 경로 효소"는 효소가 바람직한 경로 생성물의 검출을 허용하기에 충분한 양으로 발현된다는 것을 암시한다.
다른 양태에서, 본 명세서는 알돌라제 히드라타제 효소를 코딩하는 제1 외생성 핵산을 포함하는 재조합 미생물 유기체를 제공하고, 재조합 미생물 유기체는 변형되지 않은 동일 미생물 유기체 또는 야생형과 비교하여 퀴논 옥시도리덕타제의 증가된 양을 발현하도록 더욱 변형되고, 임의로 미생물 유기체는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 클로스트리듐 (clostridium) 종, 또는 이. 콜라이 (E. coli)이다.
일부 구현예에서, 유기체는 퀴논 옥시도리덕타제를 코딩하는 제2 외생성 핵산을 포함한다. 일부 구현예에서, 제1 외생성 핵산 및/또는 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 제1 외생성 핵산 또는 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 제1 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 조절 엘리먼트는 프로모터 또는 인핸서로부터 선택된다. 일부 구현예에서, 조절 엘리먼트는 프로모터이다. 일부 구현예에서, 조절 엘리먼트는 인핸서이다.
일부 구현예에서, 알돌라제 히드라타제 효소는 EC 번호 4.1.2.45, EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는다. 일부 구현예에서, 알돌라제 히드라타제 효소는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1, 또는 알돌-탈수 생성물의 형성을 촉진하는 이의 일부분 (예를 들어, 도메인, 아미노산 잔기의 세트 (연속될 수 있거나 또는 이격될 수 있음) 등) 하에 확인된 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 표 1, 5, 6, 7, 및 8로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 표 1, 5, 6, 7, 및 8로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각 벡터에 함유된다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각 동일 벡터에 함유된다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각 그들 자신의 별도 벡터에 함유된다. 일부 구현예에서, 벡터는 플라스미드이다. 일부 구현예에서, 벡터는 바이러스 벡터이다.
일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인된 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 재조합 미생물 유기체는 하기 화학식의 2-케토 카르복실산을 생성시킬 수 있다:
Figure pct00015
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
일부 구현예에서, 재조합 미생물 유기체는 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 생성시킬 수 있다.
일부 구현예에서, 재조합 미생물 유기체는 탄소원으로부터 피루베이트의 생성을 개선시키도록 유전자 변형된다. 일부 구현예에서, 탄소원은 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택된다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 재조합 미생물 유기체의 개체군을 제공한다. 일부 구현예에서, 개체군은 실질적으로 균질하다. 일부 구현예에서, 실질적으로 균질한은 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 균질한 것을 의미한다.
다른 양태에서, 본 명세서는 적합한 조건 하에서 본 명세서에 개시된 개체군을 배양하는 단계를 포함하는, 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 제조하는 방법을 제공한다. 일부 구현예에서, 방법은 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 배양물 또는 미생물 유기체로부터 단리시키는 단계를 더 포함한다.
일정 구현예의 상세한 설명
특히, 본 개시는 소정 폴리펩티드, 예를 들어, 히드라타제-알돌라제 폴리펩티드이거나 또는 그를 포함하는 다양한 알돌-탈수 생성물 생합성 폴리펩티드가 다양한 화합물을 효과적으로 생성시키는데 이용될 수 있다는 인식을 포괄한다. 일부 구현예에서, 본 개시는 다양한 알데히드, 예를 들어, 이러한 폴리펩티드의 천연 및/또는 기지 알데히드 기질과 구조적으로 상이한, 본 명세서에 기술된 다양한 지방족 알데히드가 본 명세서에 기술된 알돌-탈수 생성물 생합성 폴리펩티드를 사용하여 많은 생성물의 효과적 제조를 위해 이용될 수 있다는 것을 입증한다. 특히, 본 개시는 다양한 알돌-탈수 생성물의 생성이 단일 알돌-탈수 생성물 생합성 폴리펩티드 (예를 들어, 본 명세서에 기술된 바와 같은 다양한 히드라타제-알돌라제 폴리펩티드)에 의해 촉매될 수 있다는 것을 입증한다.
일부 구현예에서, 본 개시는 피루베이트 및 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
일부 구현예에서, 알데히드는 지방족 알데히드이다. 일부 구현예에서, 알데히드의 -CHO 기는 예를 들어, 이중 결합, 삼중 결합, 또는 방향족 기에 접합되지 않는다.
일부 구현예에서, 본 개시는 피루베이트 및 지방족 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제 폴리펩티드, 예를 들어, 본 명세서에 예시된 것들이거나 또는 그를 포함한다. 일부 구현예에서, 제공된 방법은 피루베이트 및 지방족 알데히드를 히드라타제-알돌라제와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함한다.
일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 알돌라제 폴리펩티드를 포함한다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제 폴리펩티드를 포함한다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제 폴리펩티드를 포함한다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제 폴리펩티드이다. 일부 구현예에서, 히드라타제-알돌라제 폴리펩티드는 히드라타제-알돌라제, 예를 들어, 본 명세서에 기술된 바와 같이, 예를 들어, EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34, 또는 EC 4.1.1.4를 갖는 효소이거나, 또는 그를 포함하거나, 또는 표 1 및 5-8로부터 선택된다.
일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 유기체, 예를 들어, 미생물 내에 있다. 일부 구현예에서, 유기체는 조작된 알돌-탈수 생성물 생합성 폴리펩티드를 발현한다. 일부 구현예에서, 유기체는 알돌-탈수 생성물 생합성 폴리펩티드의 증가된 수준 및/또는 활성을 발현한다. 일부 구현예에서, 유기체는 알돌-탈수 생성물을 생성시키기 위한 증가된 속도 및/또는 수율을 제공한다. 일부 구현예에서, 유기체는 알돌-탈수 생성물을 생성시키기 위한 증가된 기질 이용성을 제공한다.
일부 구현예에서, 피루베이트 및 지방족 알데히드의 알돌-탈수 생성물로의 전환은 알돌-탈수 생성물 생합성 폴리펩티드에 의해 촉매된다.
일부 구현예에서, 알돌-탈수 생성물은 대체 경로를 통해서 제공될 수 있다. 일부 구현예에서, 알돌-탈수 생성물은 알돌 생성물로부터 생성된다.
일부 구현예에서, 본 개시는 피루베이트 및 알데히드를 알돌 생성물 생합성 폴리펩티드와 접촉시켜서 알돌 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
일부 구현예에서, 알데히드는 지방족 알데히드이다. 일부 구현예에서, 알데히드의 -CHO 기는 이중 결합, 삼중 결합 또는 방향족 기에 접합되지 않는다.
일부 구현예에서, 본 개시는 피루베이트 및 지방족 알데히드를 알돌 생성물 생합성 폴리펩티드와 접촉시켜서 알돌 생성물을 생성시키는 단계를 포함하는 방법을 제공하고, 지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착된 히드록실 기를 포함하는 화합물이다.
본 개시의 다양한 방법은 생합성 폴리펩티드의 이용성을 포함한다. 일부 구현예에서, 특정 생성물, 예를 들어, 알돌 생성물 생합성 폴리펩티드, 환원 생성물 생합성 폴리펩티드 등과 함께 사용될 때, 생합성 폴리펩티드는 특정 생성물의 합성에 관여하는 폴리펩티드를 의미한다. 일부 구현예에서, 특정 생성물과 함께 사용될 때 생합성 폴리펩티드는 특정 생성물의 형성을 촉매하는 효소이거나 또는 그를 포함한다. 일부 구현예에서, 생합성 폴리펩티드는 자연계, 예를 들어, 미생물 (예를 들어, 자연계에서 발견되는 특정 생성물에 대한 기준 생합성 폴리펩티드)에서 발견되는 아미노산 서열을 갖는다. 대안적으로 또는 추가로, 일부 구현예에서, 생합성 폴리펩티드는 적절한 기준 생합성 폴리펩티드 (예를 들어, 자연계에서 발견되고/되거나 본 명세서 (예를 들어, 하나 이상의 관련 표)에 표시) 또는 이의 일부분 (예를 들어, 관련 반응을 촉진하는 일부분 (예를 들어, 도메인 (예를 들어, 관련 촉매 도메인) 및/또는 (연속될 수 있거나 또는 이격될 수 있는) 아미노산 잔기의 세트)과 특징적 서열 엘리먼트 및/또는 전체 동일성 백분율을 공유한다.
일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 알돌라제 폴리펩티드이거나 또는 그를 포함한다. 본 개시를 읽는 당업자는 다양한 알돌라제 폴리펩티드가 본 개시에 따라서 이용될 수 있다는 것을 이해한다. 일부 구현예에서, 알돌라제 폴리펩티드는 US20170044551에 기술된 알돌라제이거나 또는 그를 포함하고, 이의 알돌라제는 참조로 본 명세서에 편입된다.
일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알돌라제-히드라타제이거나 또는 그를 포함한다.
일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 유기체 예컨대 미생물 중에 있다. 일부 구현예에서, 유기체는 조작되거나 또는 외생성인 알돌 생성물 생합성 폴리펩티드를 종종 더 높은 단백질 수준 및/또는 활성 수준으로 발현하도록 조작된다. 일부 구현예에서, 피루베이트 및 지방족 알데히드의 알돌 생성물로의 전환은 알돌 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 방법은 배양물, 예를 들어, 박테리아 배양물에서 수행된다. 다른 생합성 폴리펩티드에 대한 것처럼, 알돌 생성물 생합성 폴리펩티드는 유기체 예컨대 박테리아일 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 알돌 생성물은 효소를 통해 촉매에 의해서, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서 알돌-탈수 생성물로 전환된다. 일부 구현예에서, 전환은 알돌 생성물을 탈수 생성물 생합성 폴리펩티드를 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함한다. 일부 구현예에서, 탈수 생성물 생합성 폴리펩티드는 히드라타제이거나 또는 그를 포함한다. 일부 구현예에서, 탈수 생성물 생합성 폴리펩티드는 데히드라타제이거나 또는 그를 포함한다. 일부 구현예에서, 히드라타제 또는 데히드라타제는 US20170044551에 기술되어 있고, 이의 히드라타제 및 데히드라타제는 참조로 본 명세서에 편입된다. 다른 생합성 폴리펩티드에 대한 것처럼, 탈수 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
당업자가 이해하는 바와 같이, 알돌-탈수 생성물은 광범위한 생성물, 예컨대 중합체, 수지, 코팅 생성물 등을 제조하는데 이용될 수 있는, 다양한 생성물, 예를 들어, 1,5-펜탄디올, 1,6-헥산디올, 6HH, 아디프산 등을 제조하는데 이용될 수 있다. 일부 구현예에서, 알돌-탈수 생성물의 이용성은 하나 이상의 화학적 전환을 포함하고, 이의 각각은 임의로 유기체 중에서, 폴리펩티드 (예를 들어, 본 명세서에 기술된 효소)에 의해 독립적으로 촉매될 수 있거나, 또는 효소 이용없이 전통적인 화학적 과정을 통해서 수행될 수 있다. 당업자가 이해하는 바와 같이, 하나 이상 또는 전체 단계는 하나 이상의 유기체에서 수행될 수 있고, 이들 각각은 독립적으로 하나 이상의 유형의 유기체 (이들 각각은 독립적으로 그 자체 내에서 또는 배양물 (예를 들어, 공급 화합물, 다른 유기체가 생성한 화합물 등)로부터 생성되는 기질(들)을 사용해 하나 이상의 반응을 수행할 수 있음)를 포함하는 하나 이상의 배양물, 및/또는 유기체의 외부로부터 또는 그 자체 내에서 생성되는 기질(들)을 사용해 하나 이상의 반응을 수행할 수 있다. 일부 구현예에서, 하나 이상 또는 모든 생합성 폴리펩티드는 독립적으로 하나의 유기체, 예를 들어 임의 조작된 박테리아 중에 있다. 일부 구현예에서, 생성물을 생성시키기 위한 생합성 폴리펩티드의 세트의 하나 이상은 하나의 유기체, 예를 들어 임의로 조작된 박테리아에서 발현되고, 세트 중 다른 생합성 폴리펩티드 중 하나 이상은 하나 이상의 다른 유기체, 예를 들어 임의 조작된 박테리아에서 발현된다. 일부 구현예에서, 유기체, 예를 들어, 박테리아는 생합성 폴리펩티드의 하나 이상 또는 전부를 코딩하는 하나 이상의 외생성 핵산을 함유하도록 조작된다. 일부 구현예에서, 제조 방법은 각각 독립적으로 하나 이상 또는 전부를 포함하고, 함께 모든, 필요한 생합성 폴리펩티드를 포함하는, 하나 이상의 박테리아를 포함하는 단일 배양물에서 수행되는 다수 단계의 반응을 포함한다. 일부 구현예에서, 생성물의 제조는 각각 독립적으로 하나 이상 또는 전부를 포함하고, 함께 모든 필요한 생합성 폴리펩티드를 포함하는, 하나 이상의 박테리아를 각각 독립적으로 포함하는 둘 이상의 배양물에서 수행되는 다수 단계의 반응을 포함한다.
예를 들어, 일부 구현예에서, 알돌-탈수 생성물 중 이중 결합은 단일 결합으로 전환된다.
일부 구현예에서, 본 개시는 알켄을 알켄 환원 생성물 생합성 폴리펩티드와 접촉시켜서 알켄 환원 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고,
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어서 알켄 환원 생성물을 제공한다.
일부 구현예에서, 알켄은 알돌-탈수 생성물이다.
일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 알돌-탈수 생성물, 예를 들어, 본 명세서에 기술된 바와 같은, 2-옥소-3-에노산의 환원을 촉매하는 효소이거나 또는 그를 포함한다. 일부 구현예에서, 이러한 효소는 본 명세서에 기술되니 바와 같은, 퀴논 옥시도리덕타제이다. 일부 구현예에서, 이러한 효소는 EC 1.6.5에 속한다. 일부 구현예에서, 이러한 효소는 EC 1.6.5.5에 속한다. 일부 구현예에서, 이러한 효소는 표 9로부터 선택된다.
일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 유기체, 예를 들어, 미생물 내에 존재한다. 일부 구현예에서, 유기체는 조작된 알켄 환원 생성물 생합성 폴리펩티드를 발현한다. 일부 구현예에서, 유기체는 알켄 환원 생성물 생합성 폴리펩티드의 증가된 수준 및/또는 활성을 발현한다. 일부 구현예에서, 유기체는 알켄 환원 생성물을 생성시키기 위한 증가된 속도 및/또는 수율을 제공한다. 일부 구현예에서, 유기체는 알켄 환원 생성물을 생성시키기 위해 증가된 기질 이용성을 제공한다.
일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 조작없이 내생적으로 유기체에 의해 코딩 및/또는 발현되는 효소이거나 또는 그를 포함한다.
본 개시를 읽은 당업자는 다양한 알데히드는 본 개시에 따라서 이용될 수 있다는 것을 이해한다. 일부 구현예에서, 알데히드는 히드라타제-알돌라제이거나 또는 그를 포함하는 생합성 폴리펩티드, 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드의 천연 또는 기지 기질이다. 일부 구현예에서, 알데히드는 천연 또는 기지 기질이 아니다. 예를 들어, 특히, 본 개시는 지방족 알데히드는 그의 천연 또는 기지 기질이 방향족이거나 또는 접합된 알데히드인 히드라타제-알돌라제를 사용한 생성물 제조에 이용될 수 있다는 것을 입증한다.
일부 구현예에서, 알데히드는 지방족 알데히드이다. 일부 구현예에서, 알데히드는 하나 또는 2개 알파-수소를 갖는다. 일부 구현예에서, 알데히드는 하기 화학식 A-1의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-C(O)H,
A-1
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, 알돌 생성물은 하기 화학식 P-1 또는 이의 염을 갖는다:
Ra-L2-L1-CH(OH)-CH2-C(O)-C(O)OH,
P-1
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, 알돌-탈수 생성물은 하기 화학식 P-2의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH=CH-C(O)-C(O)OH,
P-2
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C- , -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들 개재 원자와 함께 개재 원자 이외에, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, 화학식 P-2의 -CH=CH- 는 E 입체배열이다. 일부 구현예에서, 화학식 P-2의 -CH=CH- 는 Z 입체배열이다.
일부 구현예에서, 알켄 환원 생성물은 하기 화학식 P-3의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-C(O)-C(O)OH,
P-3
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, Ra 는 R"이다. 일부 구현예에서, Ra 는 -OR"이다.
일부 구현예에서, R"은 R'이다. 일부 구현예에서, R"은 --C(O)R'이다. 일부 구현예에서, R"은 --CO2R'이다. 일부 구현예에서, R"은 -SO2R'이다.
일부 구현예에서, R'은 수소이다. 일부 구현예에서, R'은 수소가 아니다.
일부 구현예에서, Ra 는 R'이다. 일부 구현예에서, Ra 는 -OR'이다. 일부 구현예에서, Ra 는 -H이다. 일부 구현예에서, Ra 는 -OH이다.
일부 구현예에서, L1 은 공유 결합이다. 일부 구현예에서, L1 은 공유 결합이 아니다.
일부 구현예에서, L1 은 임의 치환된 C1-6 알킬렌이다. 일부 구현예에서, L1 은 임의 치환된 선형 C1-6 알킬렌이다. 일부 구현예에서, L1 은 임의 치환된 -CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 미치환된다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 단일-치환된다. 일부 구현예에서, L1 은 치환된다. 일부 구현예에서, L1 은 미치환된다. 일부 구현예에서, L1 은 -CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2CH2CH2CH2CH2- 이다.
일부 구현예에서, L2 는 공유 결합이다. 일부 구현예에서, L2 는 공유 결합이 아니다.
일부 구현예에서, L2 는 임의 치환된 C1-6 알킬렌이다. 일부 구현예에서, L2 는 임의 치환된 선형 C1-6 알킬렌이다. 일부 구현예에서, L2 는 임의 치환된 -CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 미치환된다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 단일-치환된다. 일부 구현예에서, L2 는 치환된다. 일부 구현예에서, L2 는 미치환된다. 일부 구현예에서, L2 는 -CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2CH2CH2CH2CH2- 이다.
일부 구현예에서, L1 및 L2 중 적어도 하나는 공유 결합이 아니다.
일부 구현예에서, 알데히드는 CH3CHO 이다. 일부 구현예에서, 알데히드는 CH3CH2CHO 이다. 일부 구현예에서, 알데히드는 CH3CH2CH2CHO 이다. 일부 구현예에서, 알데히드는 CH2OHCHO 이다. 일부 구현예에서, 알데히드는 CH2OHCH2CHO 이다. 일부 구현예에서, 알데히드는 CH2OHCH2CH2CHO 이다.
일부 구현예에서, 알돌 생성물은 CH3CH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH3CH2CH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH3CH2CH2CH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH2OHCH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH2OHCH2CH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH2OHCH2CH2CH(OH)CH2C(O)COOH 이다.
일부 구현예에서, 알돌-탈수 생성물은 CH3CH=CHC(O)COOH 이다. 일부 구현예에서, 알돌-탈수 생성물은 CH3CH2CH=CHC(O)COOH 이다. 일부 구현예에서, 알돌-탈수 생성물은 CH3CH2CH2CH=CHC(O)COOH 이다. 일부 구현예에서, 알돌-탈수 생성물은 CH2OHCH=CHC(O)COOH 이다. 일부 구현예에서, 알돌-탈수 생성물은 CH2OHCH2CH=CHC(O)COOH. 일부 구현예에서, 알돌-탈수 생성물은 CH2OH CH2CH2CH=CHC(O)COOH.
일부 구현예에서, 알켄 환원 생성물은 CH3CH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH3CH2CH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH3CH2CH2CH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH2OHCH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH2OHCH2CH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH2OHCH2CH2CH2CH2C(O)COOH.
일부 구현예에서, 알켄 환원 생성물은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 카르보닐 환원 생성물로 전환된다. 일부 구현예에서, 알켄 환원 생성물은 카르보닐 기를 포함하고, 카르보닐 기는 -CH(OH)- 로 전환된다. 일부 구현예에서, 방법은 알켄 환원 생성물을 카르보닐 환원 생성물 생합성 폴리펩티드와 접촉시켜서 카르보닐 환원 생성물을 생성시키는 단계를 포함하고,
알켄 환원 생성물은 카르보닐 기를 포함하고;
알켄 환원 생성물의 카르보닐 기는 -CH(OH)- 로 전환된다.
일부 구현예에서, 카르보닐 환원 생성물 생합성 폴리펩티드는 리덕타제이거나 또는 그를 포함한다. 일부 구현예에서, 카르보닐 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 케토 리덕타제이거나 또는 그를 포함한다. 일부 구현예에서, 카르보닐 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 2-케토 산-2-리덕타제이거나 또는 그를 포함한다. 일부 구현예에서, 이러한 효소는 본 명세서에 기술된 바와 같은 6-히드록시-2-옥소헥사노에이트-2-리덕타제이다. 일부 구현예에서, 이러한 효소는 US20170044551에 기술되어 있고, 이의 효소는 참조로 본 명세서에 편입된다.
일부 구현예에서, 알켄 환원 생성물의 카르보닐 환원 생성물로의 전환은 카르보닐 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 카르보닐 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 잇고, 그들 생성물은 증가된 비율 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 카르보닐 환원 생성물은 하기 화학식 P-4의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)OH,
P-4
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 카르보닐 환원 생성물은 CH3CH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH3CH2CH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH3CH2CH2CH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH2OHCH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH2OHCH2CH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH2OHCH2CH2CH2CH2CH(OH)COOH 이다.
일부 구현예에서, 카르보닐 환원 생성물은 효소에 의해 촉매되거나, 생합성을 통하거나, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, CoA 전달 생성물로 전환된다. 일부 구현예에서, CoA 전달 생성물은 하기 화학식 P-5의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)-S-CoA,
P-5
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 CoA (CoA = 조효소 A) 전달 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, CoA 전달 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 CoA 트랜스퍼라제, 예를 들어, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제이거나 또는 그를 포함한다. 일부 구현예에서, CoA 트랜스퍼라제는 US20170044551에 기술된 것이고, 이의 CoA 트랜스퍼라제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 CoA 전달 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, CoA 전달 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2CH2CH(OH)C(O)S-COA 이다.
일부 구현예에서, CoA 전달 생성물은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 탈수 생성물로 전환된다. 일부 구현예에서, 탈수 생성물은 하기 화학식 P-6의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH=CH-C(O)-S-CoA
P-6
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 탈수 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 탈수 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 데히드라타제이거나 또는 그를 포함한다. 일부 구현예에서, 데히드라타제는 본 명세서에 기술된 바와 같은 2,6-디히드록시-헥사노일-CoA 2-데히드라타제이거나 또는 그를 포함한다. 일부 구현예에서, 데히드라타제는 US20170044551에 기술되어 있고, 이의 데히드라타제는 참조로 편입된다.
일부 구현예에서, 이러한 전환은 탈수 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 탈수 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 탈수 생성물은 CH3CH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH3CH2CH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH3CH2CH2CH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH2OHCH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH2OHCH2CH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH2OHCH2CH2CH2CH=CHC(O)S-COA 이다.
일부 구현예에서, 탈수 생성물, 예를 들어, 화학식 P-6의 화합물 또는 이의 염은 환원 생성물, 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서 환원 생성물로 전환된다. 일부 구현예에서, 환원 생성물은 하기 화학식 P-7의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-S-CoA
P-7
각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 환원 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 환원 생성물 생합성 폴리펩티드는 2,3-에노일-CoA 리덕타제, 2,3-데히드로-카르복실 CoA 2'3-리덕타제, 예를 들어, 본 명세서에 기술된 바와 같은 2,3-데히드로-헥사노일-CoA 2,3-리덕타제이거나 또는 그를 포함한다. 일부 구현예에서, 적합한 리덕타제는 US20170044551에 기술되어 있고, 이의 리덕타제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 환원 생성물은 CH3CH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH3CH2CH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH3CH2CH2CH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH2OHCH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH2OHCH2CH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH2OHCH2CH2CH2CH2CH2C(O)S-COA 이다.
일부 구현예에서, 환원 생성물, 예를 들어, 화학식 P-7의 화합물 또는 이의 염은 CoA 전달 생성물, 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, CoA 전달 생성물로 전환된다. 일부 구현예에서, CoA 전달 생성물은 하기 화학식 P-8의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-OH
P-8
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 CoA 전달 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, CoA 전달 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 CoA 트랜스퍼라제, 예를 들어, 본 명세서에 기술된 바와 같은 6-히드록시헥사노일-CoA 트랜스퍼라제이거나 또는 그를 포함한다. 일부 구현예에서, CoA 트랜스퍼라제는 US20170044551에 기술되어 있고, 이의 CoA 트랜스퍼라제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 CoA 전달 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, CoA 전달 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2CH2CH2C(O)OH 이다.
일부 구현예에서, CoA 전달 생성물, 예를 들어, Ra 는 -OH 인, 화학식 P-8의 화합물 또는 이의 염은 산화 생성물, 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 산화 생성물로 전환된다. 일부 구현예에서, 산화 생성물은 하기 화학식 P-9의 화합물, 또는 이의 염이다:
H-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-9
상기 화학식에서, L2' 은 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-19 지방족 또는 C1-19 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고, 각각의 다른 변수는 독립적으로 본 명세서에 기술된 바와 같다.
일부 구현예에서, L2' 은 공유 결합이다. 일부 구현예에서, L2' 은 공유 결합이 아니다. 일부 구현예에서, L1 및 L2' 중 적어도 하나는 공유 결합이 아니다.
일부 구현예에서, L2' 은 임의 치환된 C1-6 알킬렌이다. 일부 구현예에서, L2' 은 임의 치환된 선형 C1-6 알킬렌이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 미치환된다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 단일-치환된다. 일부 구현예에서, L2' 은 치환된다. 일부 구현예에서, L2' 은 미치환된다. 일부 구현예에서, L2' 은 -CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2CH2CH2CH2CH2- 이다.
일부 구현예에서, 이러한 전환은 산화 생성물 생합성 폴리펩티드에 의해 전환된다. 일부 구현예에서, 산화 생성물 생합성 폴리펩티드는 알콜 데히드로게나제, 예를 들어, 본 명세서에 기술된 바와 같은, 1차 알콜 데히드로게나제 예컨대 6-히드록시헥사노에이트 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 알콜 데히드로게나제는 US20170044551에 기술되어 있고, 이의 알콜 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 산화 생성물 생합성 폴리펩티드에 의해 전환된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 산화 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 산화 생성물은 HC(O)CH2CH2CH2C(O)OH 이다. 일부 구현예에서, 산화 생성물은 HC(O)CH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, 산화 생성물은 HC(O)CH2CH2CH2CH2CH2C(O)OH 이다.
일부 구현예에서, 산화 생성물, 예를 들어, 화학식 P-9의 화합물 또는 이의 염은효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 알데히드 산화 생성물로 전환된다. 일부 구현예에서, 산화 생성물은 하기 화학식 P-10의 화합물 또는 이의 염이다:
HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-10
상기 화학식에서, 각각의 다른 변수는 독립적으로 본 명세서에 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 알데히드 산화 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 알데히드 산화 생성물 생합성 폴리펩티드는 알데히드 데히드로게나제, 예를 들어, 본 명세서에 기술된 바와 같은, 6-히드록시헥사노에이트 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 알데히드 데히드로게나제는 US20170044551에 기술되고, 이의 알데히드 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 알데히드 산화 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 알데히드 산화 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 알데히드 산화 생성물은 HOC(O)CH2CH2CH2C(O)OH 이다. 일부 구현예에서, 산화 생성물은 HOC(O)CH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, 산화 생성물은 HOC(O)CH2CH2CH2CH2CH2C(O)OH 이다.
일부 구현예에서, CoA 전달 생성물, 예를 들어, 화학식 P-8의 화합물 또는 이의 염은 카르복실 환원 생성물, 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 카르복실 환원 생성물로 전환된다. 일부 구현예에서, 카르복실 환원 생성물은 하기 화학식 P-9'의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-H
P-9'
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 카르복실 환원 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 카르복실 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 카르복실산 리덕타제 또는 알데히드 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 카르복실 환원 생성물 생합성 폴리펩티드는 6-히드록시헥사노에이트 1-리덕타제를 포함하거나 또는 그를 포함한다. 일부 구현예에서, 카르복실 환원 생성물 생합성 폴리펩티드는 US20170044551에 기술된 카르복실산 리덕타제 또는 알데히드 데히드로게나제이거나 또는 그를 포함하고, 이의 카르복실산 리덕타제 또는 알데히드 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 카르복실 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 카르복실 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 카르복실 환원 생성물은 CH3CH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH3CH2CH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH3CH2CH2CH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH2OHCH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH2OHCH2CH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH2OHCH2CH2CH2CH2CH2C(O)H 이다.
일부 구현예에서, 카르복실 환원 생성물, 예를 들어, 화학식 P-9'의 화합물 또는 이의 염은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 알데히드 환원 생성물로 전환된다. 일부 구현예에서, 알데히드 환원 생성물은 하기 화학식 P-10'의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-CH2-OH
P-10'
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 알데히드 환원 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 알데히드 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알데히드 리덕타제 또는 알콜 (예를 들어, 1차 알콜) 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 알데히드 리덕타제 또는 알콜 (예를 들어, 1차 알콜) 데히드로게나제는 US20170044551에 기술되고, 이의 리덕타제 및 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 알데히드 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 알데히드 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2CH2CH2OH 이다.
일부 구현예에서, 알켄 환원 생성물, 예를 들어, 화학식 P-3의 화합물 또는 이의 염은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 탈카르복실화 생성물로 전환된다. 일부 구현예에서, 탈카르복실화 생성물은 하기 화학식 P-4'의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-C(O)-H
P-4'
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 탈카르복실화 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 탈카르복실화 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 데카르복실라제이거나 또는 그를 포함한다. 일부 구현예에서, 데카르복실라제는 본 명세서에 기술된 바와 같은 2-케토-산 데카르복실라제이다. 일부 구현예에서, 데카르복실라제는 US20170044551에 기술되고, 이의 데카르복실라제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 탈카르복실화 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 탈카르복실화 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 탈카르복실화 생성물은 CH3CH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH3CH2CH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH3CH2CH2CH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH2OHCH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH2OHCH2CH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH2OHCH2CH2CH2CH2CHO 이다.
일부 구현예에서, 탈카르복실화 생성물, 예를 들어, 화학식 P-4'의 화합물 또는 이의 염은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 알데히드 환원 생성물로 전환된다. 일부 구현예에서, 알데히드 환원 생성물은 하기 화학식 P-5'의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-OH
P-5'
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 알데히드 환원 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 알데히드 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 1차 알콜 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 1차 알콜 데히드로게나제는 US20170044551에 기술되고, 이의 1차 알콜 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 알데히드 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 알데히드 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2CH2OH 이다.
일부 구현예에서, 본 개시는 하나 이상의 생합성 폴리펩티드를 코딩하는 핵산을 제공한다. 일부 구현예에서, 이러한 핵산은 비천연 서열을 포함한다. 일부 구현예에서, 이러한 핵산은 생산 유기체, 예를 들어 박테리아에서 발현을 위해 최적화된다.
본 명세서에서 입증된 바와 같이, 다양한 기술은 생합성 활성을 위한 폴리펩티드의 활성을 평가하는데 이용가능하다. 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드 (예를 들어, 히드라타제-알돌라제) 또는 알켄 환원 생성물 생합성 폴리펩티드 (예를 들어, 알돌-탈수 생성물의 환원을 위한 효소)의 활성을 평가하기 위한 다양한 기술은 실시예에 기술된다.
일부 구현예에서, 다양한 생합성 폴리펩티드, 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드는 유기체, 많은 구현예에서, 미생물 예컨대 박테리아, 진균 등에 존재한다. 일부 구현예에서, 그들은 하나 이상의 재조합 핵산으로부터 발현된다. 일부 구현예에서, 다양한 형질전환이 생합성적으로, 예를 들어, 유기체, 예컨대 박테리아에서 수행된다. 일부 구현예에서, 유기체 (예를 들어, 미생물, 예컨대 박테리아)는 생합성 폴리펩티드, 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드 예컨대 히드라타제-알돌라제를 코딩하는 외생성 핵산을 함유하도록 조작된다.
일부 구현예에서, 유기체, 예를 들어, 알돌-탈수 생성물을 생성하도록 조작된 것들은 알돌-탈수 생성물 생합성 폴리펩티드 예컨대 히드라타제-알돌라제 폴리펩티드의 조절된 수준, 전형적으로 증가된 수준 및/또는 활성을 발현한다.
일부 구현예에서, 유기체는 조작된 핵산을 포함하고/하거나, 조작된 생합성 폴리펩티드, 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드 (예를 들어, 다양한 히드라타제-알돌라제)를 발현한다. 일부 구현예에서, 조작된 핵산은 기준 핵산과 비교하여 하나 이상의 서열 편차를 포함한다. 일부 구현예에서, 기준 핵산은 조작된 핵산이 도입되는 유기체 내에서의 해당 핵산이다. 일부 구현예에서, 기준 핵산은 천연 핵산이다. 일부 구현예에서, 조작된 핵산은 기준 핵산, 예를 들어, 천연 핵산과 동일한 폴리펩티드 또는 이의 특징적 엘리먼트를 코딩한다. 일부 구현예에서, 조작된 핵산은 기준 핵산에 의해 코딩되는 것과 상이한 폴리펩티드 또는 이의 특징적 엘리먼트를 코딩한다. 일부 구현예에서, 조작된 폴리펩티드는 (예를 들어, 자연계 등에서 발견되는, 기준 핵산에 의해 코딩되는) 기준 폴리펩티드와 비교하여 하나 이상의 편차를 포함한다. 일부 구현예에서, 조작된 폴리펩티드는 기준 폴리펩티드와 비교하여 하나 이상의 상이한 아미노산 잔기를 포함한다. 일부 구현예에서, 조작된 폴리펩티드는 도입되는 유기체에 부재하는 폴리펩티드이다. 일부 구현예에서, 조작된 폴리펩티드는 기준 폴리펩티드와 상동성이고, 예를 들어, 기준 폴리펩티드 또는 이의 특징적인 엘리먼트와 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 95%, 99% 이상의 상동성을 공유한다. 일부 구현예에서, 특징적인 엘리먼트는 관련 반응을 촉매하는 도메인이다. 일부 구현예에서, 특징적 엘리먼트는 아미노산 잔기의 세트이다. 일부 구현예에서, 특징적 엘리먼트는 기질, 생성물, 보조인자 등과 접촉하고/하거나, 관련 반응을 촉진하는 아미노산 잔기의 세트이다. 당업자가 이해하는 바와 같이, 아미노산 잔기의 세트 내 잔기는 서열 중에서 서로 옆에 있을 수 있거나, 또는 이격될 수 있다. 일부 구현예에서, 세트 중 둘 이상의 아미노산 잔기는 공간적으로 서로와 밀접할 수 있고, 예를 들어 촉매 포켓에 있을 수 있다.
일부 구현예에서, 생합성 생성을 위해서, 유기체는 하나 이상의 생합성 폴리펩티드의 높은 수준 및/또는 활성을 발현할 수 있다. 일부 구현예에서, 유기체는 바람직한 생성물을 생성시키기 위해 증가된 속도 및/또는 수율을 제공한다.
본 명세서에 기술된 바와 같이, 일부 구현예에서, 본 개시는 높은 생성물 수율을 제공한다. 일부 구현예에서, 예를 들어, 하나 이상의 생합성 폴리펩티드를 포함하는 하나 또는 다수의 단계 과정의 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 일부 구현예에서, 제공된 기술은 바람직한 생성물을 위해, 기질, 예를 들어, 피루베이트의 높은 이용성을 제공한다. 일부 구현예에서, 바람직한 생성물에 대한 이용성 백분율은 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 이다.
당업자는 본 개시의 다양한 화합물, 예를 들어, 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염은 다양한 화합물, 물질, 및 생성물의 생성을 위한 재료로서 유용하다는 것을 이해한다. 예를 들어, 아디프산이 나일론 6,6, 폴리에스테르 폴리올, 폴리에스테르 수지, 가소제, 식품 및 다른 물질을 생성시키는데 사용될 수 있다. 1,5-펜탄디올은 다양한 폴리우레탄, 폴리에스테르 폴리올, 및 폴리에스테르를 제조하는데 사용될 수 있다. 1,6-헥산디올 (HDO)은 다양한 폴리에스테르를 제조하는데 사용될 수 있고, 이의 일부는 산업적 코팅 응용분야에 유용하다. HDO는 또한 특히 자동차 응용분야용 코팅재로서 사용될 수 있는, 폴리우레탄을 생성시키는데 이용될 수 있다. 일부 구현예에서, HDO는 예를 들어, 엘라스토머 및 폴리우레탄 분산물 (예를 들어, 파케이 바닥마감 및 가죽 코팅용)에서 사용되는 마크로디올, 예를 들어, 아디페이트 에스테르 및 폴리카르보네이트 디올의 생성에 사용된다. 전통적인 화학 과정을 통하거나 또는 생합성 과정을 통하거나 또는 이의 조합을 통해서, 6-히드록시 헥산산은 환화되어서 ε-카프로락톤을 만들 수 있고 그 다음에 아미노화되어서 ε-카프로락탐을 만들 수 있다. 전통적인 화학 과정을 통해서 또는 생합성 과정을 통해서 또는 이의 조합을 통해서, 6-히드록시 헥산산은 아미노화되어 6-아미노 헥산산을 만들 수 있고 그 다음으로 환화되어서 ε-카프로락탐을 만들 수 있다. 특히, ε-카프로락탐은 많은 상이한 산업에서 광범위하게 사용되는 중합체인, 나일론6의 생성에 사용될 수 있다. ε-카프로락톤은 중합되어서 특수 폴리우레탄의 생성을 포함한 다양한 응용분야를 갖는 생분해성 폴리에스테르인, 폴리카프로락톤 (PCL)을 만들 수 있다. 다양한 2-케토카르복실산은 다양한 관련 화학물 및 약학물에 유용하다. 일부 구현예에서, 이러한 화학물 및 약학물, 또는 이의 중간체는 아미노산 또는 α-히드록시 카르복실산이다. 일부 구현예에서, 본 개시의 화합물은 폴리에스테르, 폴리에스테르 폴리올, 폴리우레탄, 나일론 (예를 들어, 아디프산으로부터), 폴리카르보네이트 디올 (예를 들어, HDO 또는 1,5-펜탄디올 등으로부터), 디아크릴레이트 에스테르 (예를 들어, HDO 또는 1,5-펜탄디올 등으로부터), 디글리시딜 에테르 (예를 들어, HDO 또는 1,5-펜탄디올 등으로부터) 등을 제조하는데 이용된다.
일부 구현예에서, 본 개시는 제공된 과정의 조제물, 예를 들어, 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염, 및 이러한 화합물로부터 제조된 다양한 화합물, 물질, 생성물 등의 조제물을 제공한다.
제공된 기술은 다수의 장점을 제공한다. 특히, 제공된 과정은 효율을 개선시킬 수 있고/있거나 오염을 감소시킬 수 있는, 재생가능한 자원으로부터의 하나 이상의 생합성 폴리펩티드 및/또는 물질을 이용한다. 일부 구현예에서, 본 개시 (예를 들어, 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염, 및 이러한 화합물로부터 제조된 다양한 화합물, 물질, 생성물 등)의 조제물은 화석 탄소원으로부터 제조된 것과 비교하여, 하나 이상의 동위원소, 예를 들어, 14C의 농축된 수준을 포함한다. 일부 구현예에서, 화석 탄소원을 사용한 조제물은 0 또는 실제로 0의 14C 수준을 갖는다. 화합물, 조성물, 조제물 생성물 등에서 다양한 원자의 동위원소 비율 및/또는 수준을 평가하기 위한 기술은 당업자에게 충분히 공지되어 있고 본 개시에 따라서 이용될 수 있다. 예를 들어, 일부 구현예에서, 동위원소 농축은 가속 질량 분광법 (AMS) 및/또는 안정한 동위원소 비율 질량 분광법 (SIRMS), 및/또는 핵자기 공명을 통한 부위-특이적 자연 동위원소 분획법 (SNIF-NMR) 같은 기술을 사용한 질량 분광법으로 쉽게 평가할 수 있다.
당업자가 이해하는 바와 같이, 제공된 방법은 하나 이상의 생합성 폴리펩티드를 포함하는 시스템에서 시험관내에서 수행될 수 있다. 많은 구현예에서, 제공된 기술은 하나 이상의 생합성 폴리펩티드를 발현하는, 유기체, 예를 들어, 미생물, 예컨대 박테리아를 사용해 수행된다. 일부 구현예에서, 본 개시는 본 명세서에 기술된 바와 같은 하나 이상의 생합성 폴리펩티드를 발현하는 유기체, 예를 들어, 박테리아를 제공한다. 일부 구현예에서, 이러한 유기체는 조작된다. 일부 구현예에서, 이러한 유기체는 하나 이상의 생합성 폴리펩티드의 단백질 및/또는 활성의 증가된 수준을 발현하도록 조작 및/또는 배양된다. 일부 구현예에서, 이러한 유기체는 보다 효율적으로 바람직한 생성물을 생성시키기 위해 탄소원을 이용하도록 조작 및/또는 배양된다.
일부 구현예에서, 본 개시는 지방족 알데히드의 알돌 생성물을 생성하는 유기체로서, 알돌 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하는 미생물을 제공한다. 일부 구현예에서, 유기체는 조작된다. 일부 구현예에서, 유기체는 박테리아이다.
일부 구현예에서, 본 개시는 알데히드의 알돌-탈수 생성물을 생성하는 유기체로서, 알돌 생성물 생합성 폴리펩티드, 알돌-탈수 생성물 생합성 폴리펩티드, 탈수 생성물 생합성 폴리펩티드, 및 이의 조합의 증가된 발현 또는 활성을 포함하는 미생물을 제공한다. 일부 구현예에서, 본 개시는 알데히드의 알돌-탈수 생성물을 생성하는 유기체를 제공하고, 미생물은 알돌-탈수 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함한다. 일부 구현예에서, 유기체는 조작된다. 일부 구현예에서, 유기체는 박테리아이다. 일부 구현예에서, 알데히드는 지방족 알데히드이다.
일부 구현예에서, 본 개시는 알켄 환원 생성물을 생성하는 유기체로서, 알켄 환원 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하는 미생물을 제공한다. 일부 구현예에서, 본 개시는 피루베이트 및 알데히드로부터 알켄 환원 생성물을 생성하는 유기체로서, 알켄 환원 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하는 미생물을 제공한다. 일부 구현예에서, 유기체는 조작된다. 일부 구현예에서, 유기체는 박테리아이다.
일부 구현예에서, 본 개시는 본 명세서에 기술된 바와 같은 유기체의 배양물을 제공한다. 일부 구현예에서, 본 개시는 박테리아의 배양물을 제공한다. 일부 구현예에서, 배양물은 하나 이상의 생합성 폴리펩티드의 하나 이상의 생성물, 예를 들어, 하나 이상의 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염을 포함한다.
당분자가 이해하는 바와 같이, 피루베이트는 피루브산 또는 이의 염으로서 제공할 수 있다.
일 양태에서, 본 명세서는 하기 화학식 I의 화합물 또는 이의 염, 또는 화합물 또는 염의 용매화물을 제조하기 위한 방법을 제공한다:
Figure pct00016
상기 화학식에서, R은 CH2OH, CH3 또는 H다.
방법은 효소적 단계를 포함한다.
일부 구현예에서, 방법은
Figure pct00017
의 CN 알데히드 (상기 화학식에서, R은 CH2OH, CH3 또는 H임), 및 피루베이트를, (a) EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 히드라타제-알돌라제 (본 명세서에서 Ads-Hyd로서 지칭)에 의해 촉매되는 알돌 축합 반응을 통해서 CN 알데히드 및 피루베이트를 CN+3 3,4-데히드로-2-케토-카르복실산 중간체로 전환시키고; 그 다음으로 (b) EC 번호 1.6.5. (예를 들어, EC 번호 1.6.5.5.)를 갖는 옥시도리덕타제를 사용하여, CN+3 3,4-데히드로-2-케토-카르복실산을 CN+3 2-케토-카르복실산 (즉, 화학식 I의 화합물), 또는 이의 염, 또는 와합물의 용매화물 또는 염으로 전환시키는, 조건 하에 용매 중에서 배합 또는 인큐베이션시키는 단계를 포함하거나, 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 방법은
Figure pct00018
의 CN 알데히드 (상기 화학식에서, R은 CH2OH, CH3 또는 H임), 및 피루베이트를, (a) EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 히드라타제-알돌라제 (본 명세서에서 Ads-Hyd로 지칭)에 의해 촉매되는 알돌 부가 반응을 통해서 CN 알데히드 및 피루베이트를 먼저 CN+3 4-히드록시-2-케토-카르복실산 중간체로 전환시키고; 다음으로 (b) 히드라타제-알돌라제를 사용하여 4-히드록시-2-케토-카르복실산을 CN+3 3,4-데히드로-2-케토-카르복실산으로 전환시키고; 그 다음으로 (c) EC 번호 1.6.5. (예를 들어, EC 번호 1.6.5.5.)를 갖는 옥시도리덕타제를 사용하여, CN+3 3,4-데히드로-2-케토-카르복실산을 CN+3 2-케토-카르복실산 (즉, 화학식 I의 화합물), 또는 이의 염, 또는 화합물 또는 염의 용매화물으로 전환시키는 조건 하에 용매 중에서, 배합 또는 인큐베이션시키는 단계를 포함하거나, 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
다른 양태에서, 본 명세서는 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 및 6-히드록시 헥산산으로부터 선택되는 화합물을 제조하기 위한 방법을 제공하고, 상기 방법은 a) EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 히드라타제-알돌라제, 및 EC 번호 1.6.5 (예를 들어, EC 번호 1.6.5.5)를 갖는 옥시도리덕타제의 조합을 사용하여 3-히드록시-프로파날 및 피루베이트를 6-히드록시-2-케토 카르복실산 중간체로 전환시키는 단계; 및 b) 효소적 단계를 통해서 6-히드록시-2-케토 카르복실산 중간체를 화합물로 전환시키는 단계를 포함하거나, 또는 대안적으로 그로 본질적으로 이루어지거나, 역시 또한 그로 이루어진다.
일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45를 갖는 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.34를 갖는 트랜스-2'-카르복시벤잘피루베이트 히드라타제-알돌라제이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.1.4를 갖는 아세토아세테이트 데카르복실라제이다.
일부 구현예에서, 미생물은 화학식 I의 화합물, 또는 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 및 6-히드록시 헥산산, 또는 이의 염, 또는 화합물 또는 염의 용매화물로부터 선택되는 화합물의 조제물을 위한 숙주로서 사용된다. 본 명세서에서 사용되는, "숙주"는 세포 또는 미생물의 내부 (예를 들어, 출발 물질(들)을 흡수하고, 임의로 생성물(들)을 분비시켜서) 또는 외부 (예를 들어, 효소를 분비시켜서)에서 반응을 촉매할 수 있는 하나 이상의 효소를 생성시킬 수 있는 세포 또는 미생물을 지칭한다.
일부 구현예에서, 방법은 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 및 6-히드록시 헥산산 또는 이의 염, 또는 화합물 또는 염의 용매화물로부터 선택되는 화합물을 용액, 배양물, 및/또는 숙주 세포로부터 단리시키는 단계를 더 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 본 명세서에 개시된 방법의 조건은 성분을 약 10 내지 약 200℃, 또는 대안적으로 적어도 (모든 온도는 섭씨도로 제공) 10, 15, 20, 25, 28, 29, 30, 31, 32, 33, 34, 35, 37, 37, 38, 39, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180 또는 190℃, 또는 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 또는 25℃ 미만 (10℃의 온도 하한치)의 온도에서 인큐베이션 또는 접촉시키는 단계를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 역시 또한 그로 이루어진다. 일부 구현예에서, 조건은 대안적으로 약 2 내지 약 12의 인큐베이션 용액의 pH로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다. 일부 구현예에서, pH는 적어도 2, 또는 3, 4, 5, 5.5, 6, 6.5, 7, 7.5, 8, 또는 9 내지 약 12이다. 일부 구현예에서, pH는 12, 11, 10, 9, 8, 7.5, 7, 6.5, 6, 5.5, 또는 4 미만이고 pH의 하한치는 2 초과이다.
일부 구현예에서, 조건은 약 0.1 μM 내지 약 5 M의 농도로 존재하는 피루베이트 및 CN 알데히드의 몰 농도를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또는 그로 이루어진다. 일부 구현예에서, 농도는 적어도 약 0.1, 0.5, 1, 10, 100, 500 μM 또는 1 M 이다. 일부 구현예에서, 농도는 약 4 M, 3 M, 2 M, 1 M, 500 μM, 200 μM, 100 μM, 또는 10 μM 미만이다. 피루베이트 및 CN 의 농도는 독립적으로 동일할 수 있거나 또는 상이할 수 있고 인큐베이션의 다른 조건에 따라 가변적일 것이다.
일부 구현예에서, 조건은 클래스 I/II 피루베이트 의존적 알돌라제, 히드라타제-알돌라제, 데히드라타제, 퀴논 옥시도리덕타제, 에노일-CoA 리덕타제, 1차 알콜 데히드로게나제, 케토-산 데카르복실라제, 조효소 A 트랜스퍼라제, 및 카르복실산 리덕타제로 이루어진 군으로부터 선택되는 하나 이상의 효소를 생성시키는 비-천연 미생물의 존재를 포함한다. 각각의 이들 효소는 반응 특이적 효소이다.
일부 구현예에서, 미생물 또는 숙주는 야생형 대응체를 초과하는 양으로 효소를 발현하거나 또는 효소를 과발현하도록 유전자 조작된다. 효소 또는 발현 생성물의 발현 수준을 결정하는 방법은 당분야에 공지되어 있고, 예를 들어, PCR에 의한다.
일부 구현예에서, CN 알데히드는 3-히드록시-프로파날이다.
일부 구현예에서, 방법은 3-히드록시-프로파날 및 피루베이트를 글리세롤, C5 당, C6 당, 포스포-글리세레이트, 다른 탄소원, 해당 경로의 중간체, 프로파노에이트 물질대사의 중간체, 또는 이의 조합으로 제조하는 단계를 더 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 3-히드록시-프로파날은 글리세롤의 탈수를 통해서 수득된다.
일부 구현예에서, C5 당은 하나 이상의 자일로스, 자일룰로스, 리불로스, 아라비노스, 릭소스, 및 리보스를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, C6 당은 하나 이상의 알로스, 알트로스, 글루코스, 만노스, 굴로스, 이도스, 탈로스, 갈락토스, 프룩토스, 사이코스, 솔보스, 및 타가토스를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 다른 탄소원은 미생물에 대한 탄소원으로서 적합한 공급원료이고, 여기서 공급원료는 아미노산, 지질, 옥수수대, 억새, 도시 폐기물, 에너지 수수, 사탕수수, 바가스, 전분 스트림, 덱스트로스 스트림, 메탄올, 포르메이트, 또는 이의 조합을 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 미생물은 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 또는 6-히드록시 헥산산의 제조를 위한 숙주로서 사용된다.
일부 구현예에서, 미생물은 C5 당, C6 당, 글리세롤, 다른 탄소원, 또는 이의 조합을 피루베이트로 전환시키는 능력을 갖는다.
일부 구현예에서, 미생물은 증강된 당 흡수, 예를 들어, C5 당 흡수, 동시 C6/C5 당 흡수, 동시 C6 당/글리세롤 흡수, 동시 C5 당/글리세롤 흡수, 또는 이의 조합을 위해 조작된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00019
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 피루베이트 및
Figure pct00020
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
다른 양태에서, 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00021
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및
Figure pct00022
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 하나 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00023
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및
Figure pct00024
를 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 하나 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00025
상기 식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및
Figure pct00026
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현되고; 피루베이트 및
Figure pct00027
는 히드라타제-알돌라제에 의해 단독으로 촉매되는 알돌 축합 반응을 겪어서 2-옥소-3-에노산을 생성하고, 2-옥소-3-에노산은 퀴논 옥시도리덕타제에 의해 단독으로 촉매되는 환원을 겪어서 2-케토 카르복실산을 생성시킨다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00028
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및
Figure pct00029
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 하나 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행되고; 피루베이트 및
Figure pct00030
은 히드라타제-알돌라제에 의해 단독으로 촉매되는 알돌 축합 반응을 겪어서 2-옥소-3-에노산을 생성시키고, 2-옥소-3-에노산은 퀴논 옥시도리덕타제에 의해 단독으로 촉매되는 환원을 겪어서 2-케토 카르복실산을 생성시킨다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00031
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및
Figure pct00032
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00033
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및
Figure pct00034
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제를 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 둘 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00035
상기 식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및
Figure pct00036
를 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 둘 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00037
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및
Figure pct00038
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되고; 피루베이트 및
Figure pct00039
는 히드라타제-알돌라제에 의해 단독으로 촉매되는 알돌 축합 반응을 겪어서 2-옥소-3-에노산을 생성시키고, 2-옥소-3-에노산은 퀴논 옥시도리덕타제에 의해 단독으로 촉매되는 환원을 겪어서 2-케토 카르복실산을 생성시킨다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
Figure pct00040
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 피루베이트 및
Figure pct00041
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 둘 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행되고, 피루베이트 및
Figure pct00042
는 히드라타제-알돌라제에 의해 단독으로 촉매되는 알돌 축합 반응을 겪어서 2-옥소-3-에노산을 생성시키고, 2-옥소-3-에노산은 퀴논 옥시도리덕타제에 의해 단독으로 촉매되는 환원을 겪어서 2-케토 카르복실산을 생성시킨다.
일부 구현예에서,
Figure pct00043
는 3-히드록시-프로파날이다. 일부 구현예에서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수를 통해 생성된다.
일부 구현예에서, 2-케토 카르복실산을 제조하기 위한 방법은 2-케토 카르복실산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
다른 양태에서, 본 명세서는 1,5-펜탄디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00044
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,5-펜탄디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00045
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,6-헥산디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00046
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,6-헥산디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00047
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 6-히드록시-헥사노에이트를 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00048
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 6-히드록시-헥사노에이트를 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00049
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 아디프산 (AA)을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00050
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 아디프산 (AA)을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00051
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45를 갖는 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.34를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.1.4를 갖는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 Genbank 또는 RefSeq 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 Genbank 또는 RefSeq 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 표 1, 5, 6, 7, 및 8로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 표 1, 5, 6, 7, 및 8로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 하나 이상의 비-천연 발생 미생물에 의해 발현되는 하나 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 둘 이상의 비-천연 발생 미생물에 의해 발현되는 하나 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 하나 이상의 비-천연 발생 미생물에 의해 발현되는 둘 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 둘 이상의 비-천연 발생 미생물에 의해 발현되는 둘 이상의 외생성 유전자에 의해 발현된다. 하나 이상의 외생성 유전자는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 이상의 외생성 유전자를 포함한다. 둘 이상의 외생성 유전자는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 이상의 외생성 유전자를 포함한다.
일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다. 일부 구현예에서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 2-케토-산-데카르복실라제는 EC 번호 4.1.1.1; EC 번호 4.1.1.2; EC 번호 4.1.1.3; EC 번호 4.1.1.4; EC 번호 4.1.1.5; EC 번호 4.1.1.6; EC 번호 4.1.1.7; EC 번호 4.1.1.11; EC 번호 4.1.1.12; EC 번호 4.1.1.15; EC 번호 4.1.1.16; EC 번호 4.1.1.17; EC 번호 4.1.1.18; EC 번호 4.1.1.19; EC 번호 4.1.1.20; EC 번호 4.1.1.34; EC 번호 4.1.1.35; EC 번호 4.1.1.40; EC 번호 4.1.1.54; EC 번호 4.1.1.56; EC 번호 4.1.1.71; EC 번호 4.1.1.72; EC 번호 4.1.1.73; EC 번호 4.1.1.74; EC 번호 4.1.1.75; 또는 EC 번호 4.1.1.77 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 2-케토-산-데카르복실라제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 1차 알콜 데히드로게나제는 EC 번호 1.1.1.61을 갖는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 1차 알콜 데히드로게나제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 히드라타제-알돌라제는 Uniprot ID No. A0A286PH18 하에 확인되는 효소이고; 퀴논 옥시도리덕타제는 Uniprot ID No. P28304 하에 확인되는 효소이고; 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4 하에 확인되는 효소이고; 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 Uniprot ID No. A0A286PH18 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 퀴논 옥시도리덕타제는 Uniprot ID No. P28304 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 EC 번호 1.2.99.6을 갖는 효소이고; 6-히드록시헥사날 1-리덕타제는 EC 번호 1.1.1을 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1 , BAL51292.1 , Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC6409 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 하에 확인되는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소이고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC6409 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 0A2X3BTQ9 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소이고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소이고; 6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 EC 번호 1.1.1.258을 갖는 효소이고; 6-옥소-헥사노에이트 옥시다제는 EC 번호 1.2.1.63을 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot ID No. Q5FTU6 하에 확인되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 Uniprot ID No. Q7WVD0 또는 Q84H78 하에 확인되는 효소이고; 6-옥소-헥사노에이트 옥시다제는 Uniprot ID No. Q9R2F4 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot ID No. Q5FTU6 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 데히드로게나제는 Uniprot ID No. Q7WVD0 또는 Q84H78 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-옥소-헥사노에이트 옥시다제는 Uniprot ID No. Q9R2F4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 것으로 확인된 효소이고; 6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 및 SEQ ID NO:72의 서열을 포함하는 것으로 확인된 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
일부 구현예에서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제에 의한 글리세롤의 탈수에 의해 생성된다.
하나 이상의 비-천연 발생 미생물 유기체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 이상의 비-천연 발생 미생물 유기체를 포함한다. 둘 이상의 비-천연 발생 미생물 유기체는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 이상의 비-천연 발생 미생물 유기체를 포함한다. 일부 구현예에서, 본 명세서에 개시된 방법은 하나의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다. 일부 구현예에서, 본 명세서에 개시된 방법은 2종의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다. 일부 구현예에서, 본 명세서에 개시된 방법은 3종의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다. 일부 구현예에서, 본 명세서에 개시된 방법은 4종의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다. 일부 구현예에서, 본 명세서에 개시된 방법은 5종의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
본 출원 전반에서 다양한 공개물이 참조되었다. 이들 공개물 중 GenBank 등록 번호(들) 또는 Uniprot ID 번호(들) 또는 RefSeq ID 번호를 포함하여, 그들 전체로 이들 공개물의 개시는 본 개시가 속하는 분야의 기술을 보다 완전하게 설명하기 위해서 본 출원에서 참조로 편입된다.
일부 구현예에서, 본 개시는 예로서 하기 구현예를 제공한다:
1. 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법:
Figure pct00052
(상기 화학식에서, R은 H, CH3, 또는 CH2OH임);
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 피루베이트 및
Figure pct00053
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
2. 구현예 1의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
3. 구현예 1의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
4. 구현예 1의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
5. 구현예 1의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
6. 구현예 1의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
7. 구현예 1-6 중 어느 하나의 방법에 있어서,
Figure pct00054
는 3-히드록시-프로파날이다.
8. 구현예 7의 방법에 있어서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수를 통해서 생성된다.
9. 구현예 1-8 중 어느 하나의 방법에 있어서, 2-케토 카르복실산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
10. 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법으로서,
Figure pct00055
(상기 화학식에서, R은 H, CH3, 또는 CH2OH임),
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 피루베이트 및
Figure pct00056
를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하고, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
11. 구현예 10의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
12. 구현예 10의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
13. 구현예 10의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
14. 구현예 10의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
15. 구현예 10의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
16. 구현예 10-15 중 어느 하나의 방법에 있어서,
Figure pct00057
는 3-히드록시-프로파날이다.
17. 구현예 16의 방법에 있어서, 3-히드록시-프로파날은 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
18. 구현예 10-17 중 어느 하나의 방법에 있어서, 2-케토 카르복실산을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
19. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다.
20. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
21. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
22. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
23. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
24. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
25. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 표 1, 5-8로부터 선택되는 효소이다.
26. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
27. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
28. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
29. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
30. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
31. 구현예 1-30 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
32. 구현예 31의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
33. 구현예 1-32 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
34. 구현예 1-11 중 어느 하나의 방법에 있어서, R은 CH2OH 이다.
35. 1,5-펜탄디올을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00058
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
36. 구현예 35의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
37. 구현예 35의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
38. 구현예 35의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
39. 구현예 35의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
40. 구현예 35의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
41. 구현예 35-40 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
42. 구현예 35-40 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
43. 구현예 35-40 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제 중 하나 이상은 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
44. 구현예 35-43 중 어느 하나의 방법에 있어서, 1,5-펜탄디올을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
45. 1,5-펜탄디올을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00059
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
46. 구현예 45의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
47. 구현예 45의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
48. 구현예 45의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
49. 구현예 45의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
50. 구현예 45의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
51. 구현예 45-50 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
52. 구현예 45-50 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
53. 구현예 45-50 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제 중 하나 이상은 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
54. 구현예 45-53 중 어느 하나의 방법에 있어서, 1,5-펜탄디올을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
55. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다.
56. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
57. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
58. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
59. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
60. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
61. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 표 1, 5-8로부터 선택되는 효소이다.
62. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
63. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
64. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
65. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
66. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
67. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 EC 번호 4.1.1.1; EC 번호 4.1.1.2; EC 번호 4.1.1.3; EC 번호 4.1.1.4; EC 번호 4.1.1.5; EC 번호 4.1.1.6; EC 번호 4.1.1.7; EC 번호 4.1.1.11; EC 번호 4.1.1.12; EC 번호 4.1.1.15; EC 번호 4.1.1.16; EC 번호 4.1.1.17; EC 번호 4.1.1.18; EC 번호 4.1.1.19; EC 번호 4.1.1.20; EC 번호 4.1.1.34; EC 번호 4.1.1.35; EC 번호 4.1.1.40; EC 번호 4.1.1.54; EC 번호 4.1.1.56; EC 번호 4.1.1.71; EC 번호 4.1.1.72; EC 번호 4.1.1.73; EC 번호 4.1.1.74; EC 번호 4.1.1.75; 또는 EC 번호 4.1.1.77을 갖는 효소이다.
68. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
69. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 50% 동일성을 갖는다.
70. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 70% 동일성을 갖는다.
71. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 90% 동일성을 갖는다.
72. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 EC 번호 1.1.1.61을 갖는 효소이다.
73. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인된 효소의 군으로부터 선택되는 효소이다.
74. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소이다.
75. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
76. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
77. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
78. 구현예 35-54 중 어느 하나의 방법에 있어서,
히드라타제-알돌라제는 SEQ ID NO:8의 서열을 포함하는 효소이고;
퀴논 옥시도리덕타제는 SEQ ID NO:45의 서열을 포함하는 효소이고;
2-케토-산-데카르복실라제는 SEQ ID NO:83의 서열을 포함하는 효소이고;
1차 알콜 데히드로게나제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
79. 구현예 35-78 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제, 퀴논 옥시도리덕타제, 2-케토-산-데카르복실라제, 및 1차 알콜 데히드로게나제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
80. 구현예 79의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
81. 구현예 35-80 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
82. 구현예 35-81 중 어느 하나의 방법에 있어서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
83. 1,6-헥산디올을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00060
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
84. 구현예 83의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
85. 구현예 83의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
86. 구현예 83의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
87. 구현예 83의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
88. 구현예 83의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
89. 구현예 83-88 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
90. 구현예 83-88 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
91. 구현예 83-88 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
92. 구현예 83-91 중 어느 하나의 방법에 있어서, 1,6-헥산디올을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
93. 1,6-헥산디올을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00061
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
94. 구현예 93의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
95. 구현예 93의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
96. 구현예 93의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
97. 구현예 93의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
98. 구현예 93의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
99. 구현예 93-98 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
100. 구현예 93-98 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
101. 구현예 93-98 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
102. 구현예 93-101 중 어느 하나의 방법에 있어서, 1,6-헥산디올을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
103. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다.
104. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
105. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
106. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
107. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
108. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
109. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 표 1 및 5-8로부터 선택되는 효소이다.
110. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
111. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
112. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
113. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
114. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
115. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6 , EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110을 갖는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
6-히드록시헥사노에이트 1-리덕타제는 EC 번호 1.2.99.6을 갖는 효소이고;
6-히드록시헥사날 1-리덕타제는 EC 번호 1.1.1을 갖는 효소이다.
116. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소이고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
117. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
118. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
119. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
120. 구현예 83-119 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
121. 구현예 120,의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
122. 구현예 83-121 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
123. 구현예 83-122 중 어느 하나의 방법에 있어서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
124. 6-히드록시-헥사노에이트를 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00062
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
125. 구현예 124의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
126. 구현예 124의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
127. 구현예 124의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
128. 구현예 124의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
129. 구현예 124의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
130. 구현예 124-129 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
131. 구현예 124-129 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
132. 구현예 124-129 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제 중 하나 이상은 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
133. 구현예 124-132 중 어느 하나의 방법에 있어서, 6-히드록시-헥사노에이트를 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
134. 6-히드록시-헥사노에이트를 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00063
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
135. 구현예 134의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
136. 구현예 134의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
137. 구현예 134의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
138. 구현예 134의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
139. 구현예 134의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
140. 구현예 134-139 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
141. 구현예 134-139 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
142. 구현예 134-139 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제 중 하나 이상은 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
143. 구현예 134-142 중어느 하나의 방법에 있어서, 6-히드록시-헥사노에이트를 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 포함한다.
115. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6 , EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110을 갖는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
6-히드록시헥사노에이트 1-리덕타제는 EC 번호 1.2.99.6을 갖는 효소이고;
6-히드록시헥사날 1-리덕타제는 EC 번호 1.1.1을 갖는 효소이다.
116. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소이고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
117. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
118. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
119. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
156. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6 , EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110을 갖는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이다.
157. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이다.
158. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
159. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
160. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
161. 구현예 124-160 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
162. 구현예 161의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
163. 구현예 124-162 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
164. 구현예 124-163 중 어느 하나의 방법에 있어서, 3-히드록시-프로파날은하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
165. 아디프산을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00064
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
166. 구현예 165의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
167. 구현예 165의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
168. 구현예 165의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
169. 구현예 165의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
170. 구현예 165의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
171. 구현예 165-170 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
172. 구현예 165-170 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
173. 구현예 165-170 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
174. 구현예 165-173 중 어느 하나의 방법에 있어서, 아디프산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
175. 아디프산을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
Figure pct00065
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
176. 구현예 175의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
177. 구현예 175의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
178. 구현예 175의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
179. 구현예 175의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
180. 구현예 175의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
181. 구현예 175-180 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
182. 구현예 175-180 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
183. 구현예 175-180 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
184. 구현예 175-183 중 어느 하나의 방법에 있어서, 아디프산을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
185. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다.
186. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
187. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
188. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
189. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
190. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
191. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 표 1 및 5-8로부터 선택되는 효소이다.
192. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
193. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
194. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
195. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
196. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
197. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6 , EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110을 갖는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
6-히드록시헥사노에이트 데히드로게나제는 EC 번호 1.1.1.258을 갖는 효소이고;
6-옥소-헥사노에이트 옥시다제는 EC 번호 1.2.1.63을 갖는 효소이다.
198. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 것으로 확인된 효소이고;
6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소이다.
199. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
200. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
201. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
202. 구현예 165-201 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
203. 구현예 202의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
204. 구현예 165-203 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
205. 구현예 165-204 중 어느 하나의 방법에 있어서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
206. 알돌라제 히드라타제 효소를 코딩하는 제1 외생성 핵산을 포함하는 재조합 미생물 유기체로서, 재조합 미생물 유기체는 변형되지 않은 동일 미생물 유기체 또는 야생형과 비교하여 퀴논 옥시도리덕타제의 증가된 양을 발현하도록 더 변형되고, 임의로 미생물 유기체는 코리네박테리움 글루타미쿰, 클로스트리듐 종, 또는 이. 콜라이이다.
207. 구현예 206의 재조합 미생물에 있어서, 유기체는 퀴논 옥시도리덕타제를 코딩하는 제2 외생성 핵산을 포함한다.
208. 구현예 207의 재조합 미생물에 있어서, 제1 및/또는 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다.
209. 구현예 208의 재조합 미생물에 있어서, 조절 엘리먼트는 프로모터 또는 인핸서로부터 선택된다.
210. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는다.
211. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 Genbank 또는 RefSeq 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인된 효소의 군으로부터 선택되는 효소이다.
212. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
213. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
214. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
215. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
216. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 표 1, 5-8로부터 선택되는 효소이다.
217. 구현예 206-216 중 어느 하나의 재조합 미생물 유기체에 있어서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 벡터에 함유된다.
218. 구현예 217의 재조합 미생물 유기체에 있어서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각 동일한 벡터에 함유된다.
219. 구현예 218의 재조합 미생물 유기체에 있어서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 그들 자신의 별도 벡터에 함유된다.
220. 구현예 217-219 중 어느 하나의 재조합 미생물 유기체에 있어서, 벡터는 플라스미드이다.
221. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
222. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
223. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
224. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
225. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
226. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 히드라타제-알돌라제 효소 및 퀴논 옥시도리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
227. 구현예 226의 재조합 미생물 유기체에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
228. 구현예 206-227 중 어느 하나의 재조합 미생물 유기체에 있어서, 재조합 미생물 유기체는 하기 화학식의 2-케토 카르복실산을 생성할 수 있다:
Figure pct00066
(상기 화학식에서, R은 H, CH3, 또는 CH2OH임).
229. 구현예 206-228 중 어느 하나의 재조합 미생물 유기체에 있어서, 재조합 미생물 유기체는 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 생성시킬 수 있다.
230. 구현예 206-229 중 어느 하나의 재조합 미생물 유기체에 있어서, 재조합 미생물 유기체는 탄소원으로부터 피루베이트의 생성을 개선시키도록 유전자 변형된다.
231. 구현예 230의 재조합 미생물 유기체에 있어서, 탄소원은 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택된다.
232. 구현예 206-231 중 어느 하나의 재조합 미생물 유기체의 개체군.
233. 구현예 232의 개체군에 있어서, 실질적으로 균질하다.
234. 적합한 조건 하에서 구현예 232 또는 구현예 233의 개체군을 배양하는 단계를 포함하는, 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 제조하는 방법.
235. 구현예 234의 방법에 있어서, 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 배양물 또는 미생물 유기체로부터 단리시키는 단계를 더 포함한다.
236. 구현예 206-231 중 어느 하나의 재조합 미생물 유기체를 포함하는 배양물.
237. 구현예 232 또는 구현예 233의 개체군을 포함하는 배양물.
238. 피루베이트 및 알데히드를 알돌 생성물 생합성 폴리펩티드와 접촉시켜서 알돌 생성물을 생성시키는 단계를 포함하는 방법으로서,
알돌 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착된 히드록실 기를 포함하는 화합물이다.
239. 구현예 238의 방법에 있어서, 알데히드의 -CHO 기는 이중 결합, 삼중 결합 또는 방향족 기에 접합되지 않는다.
240. 피루베이트 및 지방족 알데히드를 알돌 생성물 생합성 폴리펩티드와 접촉시켜서 알돌 생성물을 생성시키는 단계를 포함하는 방법으로서,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착되는 히드록실 기를 포함하는 화합물이다.
241. 구현예 238-240 중 어느 하나의 방법에 있어서, 알돌 생성물 생합성 폴리펩티드는 알돌라제이거나 또는 그를 포함한다.
242. 구현예 238-241 중 어느 하나의 방법에 있어서, 알돌 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
243. 구현예 242의 방법에 있어서, 미생물은 알돌 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
244. 구현예 242-243 중 어느 하나의 구현예의 방법에 있어서, 미생물은 알돌 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
245. 구현예 242-244 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 알돌 생성물 생합성 폴리펩티드를 발현한다.
246. 구현예 238-245 중 어느 하나의 방법에 있어서, 피루베이트 및 지방족 알데히드의 알돌 생성물로의 전환은 알돌 생성물 생합성 폴리펩티드에 의해 촉매된다.
247. 구현예 238-246 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
248. 구현예 238-247 중 어느 하나의 방법에 있어서, 알돌 생성물을 알돌-탈수 생성물로 전환시키는 단계를 포함하고, 알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
249. 구현예 248의 방법에 있어서, 전환은 알돌 생성물을 탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함한다.
250. 구현예 248-249 중 어느 하나의 방법에 있어서, 탈수 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
251. 구현예 250의 방법에 있어서, 미생물은 탈수 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
252. 구현예 250-251 중 어느 하나의 구현예의 방법에 있어서, 미생물은 탈수 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
253. 구현예 250-252 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 탈수 생성물 생합성 폴리펩티드를 발현한다.
254. 구현예 248-253 중 어느 하나의 방법에 있어서, 알돌 생성물의 알돌-탈수 생성물로의 전환은 탈수 생성물 생합성 폴리펩티드에 의해 촉매된다.
255. 구현예 248-254 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
256. 구현예 249의 방법에 있어서, 탈수 생성물 생합성 폴리펩티드는 데히드라타제이다.
257. 피루베이트 및 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법으로서,
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
258. 구현예 257의 방법에 있어서, 알데히드의 -CHO 기는 이중 결합, 삼중 결합 또는 방향족 기에 접합되지 않는다.
259. 피루베이트 및 지방족 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
260. 구현예 257-259 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제이거나 또는 그를 포함한다.
261. 구현예 260의 방법에 있어서, 피루베이트 및 지방족 알데히드를 히드라타제-알돌라제와 접촉시키는 단계는 알돌-탈수 생성물을 생성시킨다.
262. 구현예 257-259 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34, 또는 EC 4.1.1.4를 갖는 효소이거나 또는 그를 포함하거나, 또는 표 1 및 5-8로부터 선택된다.
263. 구현예 257-259 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 구현예 262의 효소와 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 95%, 99% 이상의 상동성을 공유하는 폴리펩티드이거나 또는 그를 포함한다.
264. 구현예 257-259 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 알돌라제이거나 또는 그를 포함한다.
265. 구현예 257-264 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
266. 구현예 265의 방법에 있어서, 미생물은 알돌-탈수 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
267. 구현예 265-266 중 어느 하나의 구현예의 방법에 있어서, 미생물은 알돌-탈수 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
268. 구현예 265-267 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 알돌-탈수 생성물 생합성 폴리펩티드를 발현한다.
269. 구현예 257-268 중 어느 하나의 방법에 있어서, 피루베이트 및 지방족 알데히드의 알돌-탈수 생성물로의 전환은 알돌-탈수 생성물 생합성 폴리펩티드에 의해 촉매된다.
270. 구현예 257-269 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
271. 알켄을 알켄 환원 생성물 생합성 폴리펩티드와 접촉시켜서 알켄 환원 생성물을 생성시키는 단계를 포함하는 방법으로서,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고,
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어서 알켄 환원 생성물을 제공한다.
272. 구현예 271의 방법에 있어서, 알켄은 구현예 257-270 중 어느 하나의 알돌-탈수 생성물이다.
273. 구현예 271-272 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 2-옥소-3-에노산 또는 이의 염의 환원을 촉매하는 효소이거나 또는 그를 포함한다.
274. 구현예 271-272 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 EC 1.6.5에 속하는 효소이거나 또는 그를 포함한다.
275. 구현예 271-272 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 EC 1.6.5.5에 속하는 효소이거나 또는 그를 포함하거나, 또는 표 9로부터 선택된다.
276. 구현예 271-272 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 구현예 274-275 중 어느 하나의 효소와 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 95%, 99% 이상의 상동성을 공유하는 폴리펩티드이거나 또는 그를 포함한다.
277. 구현예 271-276 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
278. 구현예 277의 방법에 있어서, 미생물은 알켄 환원 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
279. 구현예 277-278 중 어느 하나의 구현예의 방법에 있어서, 미생물은 알켄 환원 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
280. 구현예 277-279 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 알켄 환원 생성물 생합성 폴리펩티드를 발현한다.
281. 구현예 271-280 중 어느 하나의 방법에 있어서, 알켄의 알켄 환원 생성물로의 전환은 알켄 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
282. 구현예 271-281 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
283. 구현예 238-270 중 어느 하나의 방법에 있어서, 구현예 271-282 중 어느 하나의 방법을 포함한다.
284. 구현예 238-283 중 어느 하나의 방법에 있어서, 알데히드는 하기 화학식 A-1의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-C(O)H
A-1
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원가를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
285. 구현예 238-256 및 284 중 어느 하나의 방법에 있어서, 알돌 생성물은 화학식 P-1의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH(OH)-CH2-C(O)-C(O)OH,
P-1
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
286. 구현예 257-285 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물은 하기 화학식 P-2의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH=CH-C(O)-C(O)OH,
P-2
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
287. 구현예 286의 방법에 있어서, -CH=CH- 는 E 입체배열이다.
288. 구현예 286의 방법에 있어서, -CH=CH- 는 Z 입체배열이다.
289. 구현예 271-288 중 어느 하나의 방법에 있어서, 알켄 환원 생성물은 하기 화학식 P-3의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-C(O)-C(O)OH,
P-3
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
290. 구현예 238-284 중 어느 하나의 방법에 있어서, 알켄 환원 생성물을 하기 화학식 P-10의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-10
291. 구현예 238-284 중 어느 하나의 방법에 있어서, 알켄 환원 생성물을 하기 화학식 P-10'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-CH2-OH,
P-10'
292. 구현예 283-291 중 어느 하나의 방법에 있어서, 알켄 환원 생성물을 카르보닐 환원 생성물로 전환시키는 단계를 포함하고,
알켄 환원 생성물은 카르보닐 기를 포함하고;
알켄 환원 생성물의 카르보닐 기는 -CH(OH)- 로 전환된다.
293. 구현예 283-291 중 어느 하나의 방법에 있어서, 알켄 환원 생성물을 카르보닐 환원 생성물 생합성 폴리펩티드과 접촉시켜서 카르보닐 환원 생성물을 생성시키는 단계를 포함하고,
알켄 환원 생성물은 카르보닐 기를 포함하고;
알켄 환원 생성물의 카르보닐 기는 -CH(OH)- 로 전환된다.
294. 구현예 293의 방법에 있어서, 카르보닐 환원 생성물 생합성 폴리펩티드는 케토 리덕타제 또는 2-케토 산 -2-리덕타제이거나 또는 그를 포함한다.
295. 구현예 293-294 중 어느 하나의 방법에 있어서, 카르보닐 환원 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
296. 구현예 295의 방법에 있어서, 미생물은 카르보닐 환원 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
297. 구현예 295-296 중 어느 하나의 구현예의 방법에 있어서, 미생물은 카르보닐 환원 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
298. 구현예 295-297 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 카르보닐 환원 생성물 생합성 폴리펩티드를 발현한다.
299. 구현예 290-298 중 어느 하나의 방법에 있어서, 알켄 환원 생성물의 카르보닐 환원 생성물로의 전환은 카르보닐 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
300. 구현예 290-299 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
301. 구현예 290-300 중 어느 하나의 방법에 있어서, 카르보닐 환원 생성물은 하기 화학식 P-4의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)OH
P-4
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
302. 구현예 238-301 중 어느 하나의 방법에 있어서, 화학식 P-4의 화합물 또는 이의 염을 하기 화학식 P-5의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)-S-CoA
P-5
303. 구현예 302의 방법에 있어서, 전환은 화학식 P-4의 화합물 또는 이의 염을 CoA 전달 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
304. 구현예 238-303 중 어느 하나의 방법에 있어서, 화학식 P-5의 화합물 또는 이의 염을 하기 화학식 P-6의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH=CH-C(O)-S-CoA
P-6
305. 구현예 304의 방법에 있어서, 전환은 화학식 P-5의 화합물 또는 이의 염을 탈수 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
306. 구현예 238-305 중 어느 하나의 방법에 있어서, 화학식 P-6의 화합물 또는 이의 염을 하기 화학식 P-7의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-S-CoA
P-7
307. 구현예 306의 방법에 있어서, 전환은 화학식 P-6의 화합물 또는 이의 염을 2,3-에노일-CoA 리덕타제이거나 또는 그를 포함하는 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
308. 구현예 238-307 중 어느 하나의 방법에 있어서, 화학식 P-7의 화합물 또는 이의 염을 하기 화학식 P-8의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-OH
P-8
309. 구현예 308의 방법에 있어서, 전환은 화학식 P-7의 화합물 또는 이의 염을 CoA 전달 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
310. 구현예 238-309 중 어느 하나의 방법에 있어서, 화학식 P-8의 화합물 (식에서, L2 는 -CH2-L2'- 임), 또는 이의 염을 하기 화학식 P-9의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
H-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-9
상기 화학식에서,
L2' 은 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-19 지방족 또는 C1-19 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환된다.
311. 구현예 310의 방법에 있어서, 전환은 화학식 P-8의 화합물 또는 이의 염을 알콜 데히드로게나제이거나 또는 그를 포함하는 산화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
312. 구현예 238-311 중 어느 하나의 방법에 있어서, 화학식 P-9의 화합물 또는 이의 염을 하기 화학식 P-10의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-10
313. 구현예 312의 방법에 있어서, 전환은 화학식 P-9의 화합물 또는 이의 염을 알데히드 산화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
314. 구현예 238-312 중 어느 하나의 방법에 있어서, 화학식 P-8의 화합물 또는 이의 염을 하기 화학식 P-9'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-H
P-9'
315. 구현예 314의 방법에 있어서, 화학식 P-8의 화합물 또는 이의 염을 카르복실 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
316. 구현예 238-315 중 어느 하나의 방법에 있어서, 화학식 P-9'의 화합물 또는 이의 염을 화학식 P-10'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-CH2-OH
P-10'
317. 구현예 316의 방법에 있어서, 화학식 P-9'의 화합물 또는 이의 염을 알데히드 리덕타제 또는 1차 알콜 데히드로게나제이거나 또는 그를 포함하는 알데히드 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
318. 구현예 238-290 중 어느 하나의 방법에 있어서, 화학식 P-3의 화합물 또는 이의 염을 하기 화학식 P-5'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-OH
P-5'
319. 구현예 238-290 또는 318 중 어느 하나의 방법에 있어서, 화학식 P-3의 화합물 또는 이의 염을 화학식 P-4'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-C(O)-H
P-4'
320. 구현예 319의 방법에 있어서, 화학식 P-3의 화합물 또는 이의 염을 탈카르복실화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
321. 구현예 238-290 중 어느 하나의 방법에 있어서, 화학식 P-4'의 화합물 또는 이의 염을 화학식 P-5'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-OH
P-5'
322. 구현예 321의 방법에 있어서, 화학식 P-4'의 화합물 또는 이의 염을 알데히드 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
323. 구현예 301-322 중 어느 하나의 방법에 있어서, 하나 이상의 각각의 전환은 독립적으로 화합물을 적합한 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
324. 구현예 323의 방법에 있어서, 하나 이상 또는 모든 생합성 폴리펩티드는 독립적으로 미생물 중에 존재한다.
325. 구현예 324의 방법에 있어서, 미생물은 하나 이상 또는 모든 생합성 폴리펩티드를 코딩하는 하나 이상의 외생성 핵산을 함유하도록 조작된다.
326. 구현예 324-325 중 어느 하나의 구현예의 방법에 있어서, 미생물은 하나 이상 또는 모든 생합성 폴리펩티드의 조절된 수준을 발현한다.
327. 구현예 324-326 중 어느 하나의 구현예의 방법에 있어서, 하나 이상 또는 모든 생합성 폴리펩티드는 독립적으로 조작된다.
328. 구현예 324-326 중 어느 하나의 방법에 있어서, 적합한 생합성 폴리펩티드는 해당 전환을 촉매한다.
329. 구현예 285-328 중 어느 하나의 방법에 있어서, Ra 는 -H 이다.
330. 구현예 285-328 중 어느 하나의 방법에 있어서, Ra 는 -OH 이다.
331. 구현예 285-330 중 어느 하나의 방법에 있어서, L1 은 임의 치환된 C1-6 알킬렌이다.
332. 구현예 285-330 중 어느 하나의 방법에 있어서, L1 은 미치환된 C1-6 알킬렌이다.
333. 구현예 331-332 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2- 이다.
334. 구현예 331-332 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2CH2- 이다.
335. 구현예 331-332 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2CH2CH2- 이다.
336. 구현예 285-330 중 어느 하나의 방법에 있어서, L1 은 공유 결합이다.
337. 구현예 285-336 중 어느 하나의 방법에 있어서, L2 는 공유 결합이다.
338. 구현예 285-336 중 어느 하나의 방법에 있어서, L2 는 임의 치환된 C1-6 알킬렌이다.
339. 구현예 285-336 중 어느 하나의 방법에 있어서, L2 는 미치환된 C1-6 알킬렌이다.
340. 구현예 338-339 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2- 이다.
341. 구현예 338-339 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2CH2- 이다.
342. 구현예 338-339 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2CH2CH2- 이다.
343. 구현예 284의 방법에 있어서, 지방족 알데히드는 HO-CH2-CH2-CHO 이다.
344. 구현예 285 또는 343의 방법에 있어서, 알돌 생성물은 HO-CH2-CH2-CH(OH)-CH2-C(O)-COOH 또는 이의 염이다.
345. 구현예 286 및 343-344 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물은 HO-CH2-CH2-CH=CH-C(O)-COOH 또는 이의 염이다.
346. 구현예 289 및 343-345 중 어느 하나의 방법에 있어서, 알켄 환원 생성물은 HO-CH2-CH2-CH2-CH2-C(O)-COOH 또는 이의 염이다.
347. 구현예 301 및 343-346 중 어느 하나의 방법에 있어서, 카르보닐 환원 생성물은 HO-CH2-CH2-CH2-CH2-CH(OH)-COOH 또는 이의 염이다.
348. 구현예 302 및 343-347 중 어느 하나의 방법에 있어서, 화학식 P-5의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH(OH)-CO-S-CoA 또는 이의 염이다.
349. 구현예 303 및 343-348 중 어느 하나의 방법에 있어서, 화학식 P-6의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH=CH-CO-S-CoA 또는 이의 염이다.
350. 구현예 305 및 343-349 중 어느 하나의 방법에 있어서, 화학식 P-7의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CO-S-CoA 또는 이의 염이다.
351. 구현예 308 및 343-350 중 어느 하나의 방법에 있어서, 화학식 P-8의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염이다.
352. 구현예 310 및 343-351 중 어느 하나의 방법에 있어서, 화학식 P-9의 화합물 또는 이의 염은 H-C(O)-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염이다.
353. 구현예 312 및 343-352 중 어느 하나의 방법에 있어서, 화학식 P-10의 화합물 또는 이의 염은 HO-CO-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염이다.
354. 구현예 310 및 343-351 중 어느 하나의 방법에 있어서, 화학식 P-9'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-C(O)-H 또는 이의 염이다.
355. 구현예 312 및 343-351 및 354 중 어느 하나의 방법에 있어서, 화학식 P-10'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CH2-OH 또는 이의 염이다.
356. 구현예 317 및 343-346 중 어느 하나의 방법에 있어서, 화학식 P-4'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-C(O)-H 또는 이의 염이다.
357. 구현예 317 및 343-346 및 356 중 어느 하나의 방법에 있어서, 화학식 P-5'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-OH 또는 이의 염이다.
358. 구현예 238-357 중 어느 하나의 방법에 있어서, 미생물은 접촉 단계에서 둘 이상의 생합성 폴리펩티드를 포함한다.
359. 구현예 238-358 중 어느 하나의 방법에 있어서, 한 유형의 미생물 중에서 하나 이상의 접촉 및/또는 전환 단계, 및 다른 유형의 미생물 중에서 하나 이상의 다른 접촉 및/또는 전환 단계를 수행하는 단계를 포함한다.
360. 구현예 238-359 중 어느 하나의 방법에 있어서, 한 배양물 중에서 하나 이상의 접촉 및/또는 전환 단계, 및 다른 배양물 중에서 하나 이상의 다른 접촉 및/또는 전환 단계를 수행하는 단계를 포함한다.
361. 구현예 238-359 중 어느 하나의 방법에 있어서, 단일 배양물 중에서 접촉 및/또는 전환 단계를 수행하는 단계를 포함한다.
362. 구현예 238-361 중 어느 하나의 방법에 있어서, 미생물은 접촉 단계에서 언급된 모든 생합성 폴리펩티드를 포함한다.
363. 구현예 362의 방법에 있어서, 단일 배양물 중에서 접촉 및/또는 전환 단계를 수행하는 단계를 포함한다.
364. 전술한 구현예 중 어느 하나의 방법에 있어서, 생성물은 약 또는 적어도 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L의 배양물로 생성된다.
365. 전술한 구현예 중 어느 하나의 방법에 있어서, 바람직한 생성물에 대한 피루베이트 이용성은 약 또는 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 이다.
366. 전술한 구현예 중 어느 하나의 방법에 의해 제조되는 조제물.
367. 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염의 조제물, 또는 전술한 구현예 중 어느 하나의 방법으로 제조된 조제물로서, 조제물은 화합물의 기준 조제물에서 관찰된 것에 비해 14C 동위원소에 대해 농축되고, 기준 조제물은 화석 탄소원을 사용해 제조된다.
368. 폴리에스테르, 폴리에스테르 폴리올, 폴리우레탄, 나일론 6, 나일론 6,6, 폴리카르보네이트 디올, 디아크릴레이트 에스테르, 또는 디글리시딜 에테르의 조제물로서, 조제물은 전술한 구현예 중 어느 하나의 방법으로 제조된 조제물을 사용해 제조된다.
369. 구현예 368의 조제물에 있어서, 조제물은 화합물의 기준 조제물에서 관찰된 것에 비해서 14C 동위원소에 대해 농축되고, 기준 조제물은 화석 탄소원을 사용해 제조된다.
370. 전술한 구현예 중 어느 하나의 하나 이상의 생합성 폴리펩티드를 코딩하는 핵산.
371. 구현예 370의 핵산에 있어서, 핵산은 동일한 생합성 폴리펩티드를 코딩하는 천연 핵산과 상이하다.
372. 구현예 370 또는 371의 핵산에 있어서, 핵산은 미생물에서 발현을 위해 최적화된다.
373. 지방족 알데히드의 알돌 생성물을 생성시키는 조작된 미생물로서, 미생물은 알돌 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착된 히드록실 기를 포함하는 화합물이다.
374. 구현예 373의 미생물에 있어서, 지방족 알데히드는 구현예 238-363 중 어느 하나에 기술된다.
375. 구현예 373의 미생물에 있어서, 알돌 생성물은 구현예 238-363 중 어느 하나에 기술된다.
376. 지방족 알데히드의 알돌-탈수 생성물을 생성시키는 조작된 미생물로서, 미생물은 알돌 생성물 생합성 폴리펩티드, 알돌-탈수 생성물 생합성 폴리펩티드, 탈수 생성물 생합성 폴리펩티드, 또는 이의 임의 조합의 증가된 발현 또는 활성을 포함하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
377. 구현예 376의 미생물에 있어서, 지방족 알데히드는 구현예 238-363 중 어느 하나에 기술된다.
378. 구현예 376의 미생물에 있어서, 알돌-탈수 생성물은 구현예 238-363 중 어느 하나에 기술된다.
379. 알켄 환원 생성물을 생성시키는 조작된 미생물로서, 미생물은 알켄 환원 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하고,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고,
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어 알켄 환원 생성물을 제공한다.
380. 구현예 379의 미생물에 있어서, 알켄은 구현예 271-363 중 어느 하나에 기술된다.
381. 구현예 379의 미생물에 있어서, 알켄 환원 생성물은 구현예 238-363 중 어느 하나에 기술된다.
382. 구현예 373-381 중 어느 하나의 미생물에 있어서, 구현예 271-363 중 어느 하나의 생합성 폴리펩티드의 증가된 발현 또는 활성을 더 포함한다.
383. 구현예 238-382 중 어느 하나의 미생물, 및 독립적으로 식 P-1 내지 P-10, P-9', P-10', P-4' 또는 P-5'의 하나 이상의 화합물, 또는 이의 염을 포함하는 배양물.
384. 구현예 383의 배양물에 있어서, 하나 이상의 화합물은 독립적으로 생합성 폴리펩티드(들)의 증가된 발현 또는 활성이 없는 비슷한 미생물의 기준 배양물과 비교하여 더 높은 수준이다.
385. 구현예 383-384 중 어느 하나의 배양물에 있어서, 식 P-1 내지 P-10, P-9', P-10', P-4' 또는 P-5'의 화합물의 각각, 또는 이의 염은 독립적으로 구현예 238-363 중 어느 하나에 기술된 바와 같다.
386. 본 명세서에 기술된 바와 같은 방법, 조제물, 화합물, 유기체, 미생물, 배양물, 또는 생성물.
실시예
하기 실시예는 개시된 대상 주제에 따라 방법 및 결과를 예시하기 위해 하기에 기재된다. 이들 실시예는 본 명세서에 개시된 대상 주제의 모든 양태를 포괄하려는 의도는 아니지만, 그 보다는 소정 대표적인 방법 및 결과를 예시하려는 것이다. 이들 실시예는 당업자에게 자명한 본 명세서에 기술된 대상 주제의 균등물 및 변이를 배제하려는 의도가 아니다. 실시예 전반에서, 효소 또는 단백질의 서열은 그들의 Uniprot ID 또는 그들의 GenBank 등록 번호 (GenBank ID 또는 GenBank 등록 No.라고 지칭) 또는 그들의 RefSeq ID를 통해서 확인된다. Uniprot ID의 경우에, 서열은 최초 (인용가능) 등록 번호로 표시된다. RefSeq 단백질 기록은 NCBI 데이터베이스 내 비-중복 단백질 서열을 나타낸다. 비-중복 단백질 기록은 상이한 균주 또는 종에서 1회 또는 다수회 관찰된 하나의 정확한 서열을 나타낸다.
실시예 1: 지방족 알데히드를 사용하는 알돌-탈수 생성물 생합성을 촉매하는 효소.
본 명세서에서 누적하여 히드라타제-알돌라제 또는 Ads-Hyd로서 지칭되는, 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 (EC 4.1.2.45)1-5 또는 4-(2-카르복시페닐)-2-옥소부트-3-에노에이트 알돌라제 (E.C. 4.1.2.34; 트랜스-2'-카르복시벤잘피루베이트 히드라타제-알돌라제라고도 함)6 는 지방족 알데히드1-6, 특히 알데히드 기 옆에 임의의 불포화가 없는 것들5 에 대해 임의의 알돌 부가 또는 알돌 축합 활성을 보유한다는 것은 이전에 입증되지 않았다. 대신에, 이들 효소의 알돌 축합 활성은 이전에 기질에 제한적이었고, 여기서 새롭게 형성된 불포화는 알데히드 기질1-5 내에 존재하는 불포화에 대한 접합을 통해서 안정화될 수 있다. 이러한 알데히드 기질의 예는 방향족 접합된 알데히드 예컨대 벤즈알데히드 또는 알케날 (즉, C2 및 C3 사이에 이중 결합을 갖는 지방족 알데히드)을 포함한다. 이들 히드라타제-알돌라제는 수많은 지방족 알데히드, 예를 들어, 상이한 탄소 길이 및 상이한 기능성의 선형 알데히드를 기질로서 이용할 수 있고, 임의의 이론에 국한하고자 하는 의도없이, 해당 4-히드록시-2-케토-카르복실산 및 3,4-데히드로-2-케토-카르복실산을 각각 생성물로서 제공하기 위해 도너 (친핵성)로서 피루베이트와 알돌 부가 및 알돌 축합 반응 둘 모두의 수행을 통해, 알돌-탈수 생성물을 제공할 수 있다는 것을 예상치 않게 발견하였다. 대표적인 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 (예를 들어, 표 1에 등재된 Ads-Hyd 2 & 9) 및 트랜스-2'-카르복시벤잘피루베이트 히드라타제-알돌라제 (예를 들어, 표 1에 등재된 Ads-Hyd 3)에 대한 결과는 알돌-탈수 활성 (알돌 부가 및 알돌 축합)에 대해 표 1에 요약되어 있고, 피루베이트는 도너로서 사용되고 아세트알데히드, 프로피온알데히드, 및 3-히드록시-프로파날은 억셉터 알데히드로서 사용된다.
Figure pct00067
Figure pct00068
표 1의 효소의 서브세트에 의한 상이한 탄소 길이 및 기능성의 지방족 비접합 알데히드에 대한 알돌 부가 및 알돌 축합 활성은 표 2에 요약되고, 이러한 반응에 적합한 비접합 알데히드 기질의 다재다능성을 더욱 입증한다.
Figure pct00069
특히, 기술은 예를 들어, 기질, 예를 들어, 피루베이트의 생성물의 생성 속도, 수율, 및/또는 이용성의 관점에서, 높은 효율을 제공한다. 일부 구현예에서, 생합성 폴리펩티드는 관련 기준 생합성 폴리펩티드와 비교하여, 적합한 조건 하에서 비슷한 생성물의 생성으로 측정하여, 약 50%, 100%, 또는 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100배 이상 활성이 있다. 일부 구현예에서, 본 개시는 기질, 예를 들어, 피루베이트의 고도로 효율적인 이용성을 제공한다. 일부 구현예에서, 기질, 예를 들어, 피루베이트의 이용성은 약 또는 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 이다. 일부 구현예에서, 배양물 중 바람직한 생성물 농도는 생성 시간 (예를 들어, 90분)의 기간 이후에 약 또는 적어도 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 g/L 이다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 예를 들어, 표 3은 해당 반응을 촉매하는 것으로 이전에 알려진 알돌라제와 비교하여 제공된 기술의 효율을 극적으로 개선시켰다는 것을 입증한다: 표 3의 대표적인 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제는 시험된 기질에 대한 알돌 부가 활성의 관점에서 다른 알돌라제를 능가한다 (예를 들어, >5배 활성). 특히, 표 4는 Ads-Hyd 효소가 비교 알돌라제와 비교하여 기질 피루베이트의 고도의 효율적인 이용성을 비롯하여 개선된 생성물 수율을 제공할 수 있다는 것을 입증하였다. 이것은 피루베이트가 중심 대사산물이고 미생물 내에서 다른 반응에 의해 소모될 수 있므로 특히 주목할만하다. 본 명세서에서 입증된 바와 같이, 알돌-탈수 생성물 생합성 폴리펩티드를 포함하는 제공된 기술은 생체내에서 바람직한 생성물 수율을 개선시키는데 핵심적인, 비바람직한 반응에 의한 생체내 피루베이트 소모를 효율적으로 최소화시킬 수 있다.
Figure pct00070
Figure pct00071
Figure pct00072
소수의 히드라타제-알돌라제가 EC 4.1.2.45 또는 EC 4.1.2.34에 속하는 것으로 분류되었지만 (표 5 참조), 표 1에 보고된 대부분의 효소 서열 및 상동성 검색으로 확인된 서열 (BLAST 사용; 표 6-8 참조)은 EC 번호를 지정하지 않았다. 추가로, 이들 효소는 또한 문헌 또는 데이터베이스 (예를 들어, Uniprot)에서 이들 다른 클래스의 효소와 유사성에 기인하여 아세토아세테이트 데카르복실라제 또는 디히드로디피콜리네이트 신써타제 또는 단순히 알돌라제로서 주석이 달렸다. 예를 들어, Ads-Hyd 8 효소는 히드라타제-알돌라제로서 주석이 달리지 않고, 히드라타제-알돌라제로서 기능할 때 아세토아세테이트 데카르복실라제인 것으로 주석이 달린다 (이 서열에 대한 Uniprot 페이지 참조) (표 1 참조). 유사하게, Ads-Hyd 11-13 효소는 디히드로디피콜리네이트 신써타제로서 주석이 달렸었지만, 그들은 히드라타제-알돌라제로서 기능한다 (표 1 참조). 많은 히드라타제-알돌라제 효소 서열은 공공 데이터베이스에서 아세토아세테이트 데카르복실라제 또는 디히드로디피콜리네이트 신써타제 또는 알돌라제에 속하는 것으로 주석 달리거나 또는 추론되거나 또는 그렇게 될것이며 EC 4.1.2.45 또는 EC 4.1.2.34에 속하는 것으로 분류되지 않는다는 것이 예상된다. 따라서, 히드라타제-알돌라제 효소 서열을 확인하기 위해서, 히드라타제-알돌라제 서열에 대한 상동성-기반 검색이 수행되었고, 최종 효소는 본 명세서에 기술된 방법을 사용해 그들 활성에 관해 이후에 검증되었다. (a) EC 4.1.2.34에 속하는 하나의 서열 (Ads-Hyd 3; 표 8의 결과); (b) EC 4.1.2.34 및 EC 4.1.2.45에 속하는 효소와 극도로 낮은 상동성을 갖는 미지정된 효소에 속하는 하나의 서열 (Ads-Hyd 8; 표 6의 결과) 및 (c) EC 4.1.2.34 및 EC 4.1.2.45에 속하는 효소와 중간도 상동성을 보이는 미지정 효소에 속하는 하나의 서열 (Ads-Hyd 10; 표 7의 결과)을 사용하는 예시적인, 상동성-기반 검색은 >500 효소를 밝혀주었고, 이의 일부는 하기 표에 열거되어 있으며, 이들 중 많은 것들이 시험 시에 알돌 부가 및 축합에 대해 활성이 있는 것으로 확인되었다 (표 1의 데이터). 예를 들어, 표 6에서 확인된 13개 서열 (표 1의 서열에 대한 데이터와 표 6의 밑줄표시된 서열 참조), 및 표 7에서 확인된 11개 서열 (표 1의 서열에 대한 데이터와 표 7의 밑줄표시된 서열 참조)은 기능성 Ads-Hyd 효소로서 확인되었다. 특히, 본 개시는 E.C 4.1.1.4에 속하는 것으로 분류되고 아세테토아세테이트 데카르복실라제로서 주석이 달린, Ads-Hyd 112는 또한 수많은 상이한 알데히드에 의해 알돌 부가 및 알돌 축합 반응을 촉매하는 것으로 확인되었다는 것이 입증되었다 (표 2). 일부 구현예에서, 아세토아세테이트 데카르복실라제로서 주석달린 효소뿐만 아니라 E.C 4.1.1.4에 속하는 것들은 역시 알돌 축합 및 부가 반응을 촉매하는데 유용하다. EC 4.1.2.34에 속하는 Ads-Hyd 3, EC 4.1.2.45에 속하는 Ads-Hyd 2, 및 Ads-Hyd 8 효소에 대해서 각각 35% (표 1의 Ads-Hyd 68), 38% (표 1의 Ads-Hyd 3) 및 49% (표 1의 Ads-Hyd 93) 만큼 낮은 범위의 동일성을 갖는 효소들이 히드라타제-알돌라제 활성을 갖는 것으로 확인되었다.
Figure pct00073
Figure pct00074
Figure pct00075
Figure pct00076
Figure pct00077
Figure pct00078
Figure pct00079
Figure pct00080
Figure pct00081
Figure pct00082
Figure pct00083
Figure pct00084
Figure pct00085
Figure pct00086
Figure pct00087
Figure pct00088
Figure pct00089
Figure pct00090
Figure pct00091
Figure pct00092
Figure pct00093
Figure pct00094
Figure pct00095
Figure pct00096
Figure pct00097
Figure pct00098
Figure pct00099
클로닝, 및 발현: 이종성 알돌라제 히드라타제 효소를 코딩하는 DNA는 이. 콜라이에서 발현을 위해 코돈-최적화되었고 상업적 DNA 합성 회사가 합성하였다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 pB11 골격 플라스미드의 T7 RNA 중합효소 프로모터의 하류 및 T7 종결자 서열의 상류에 클로닝되었다. 추가로, 선택된 알데히드가 3-히드록시-프로피온알데히드인 실험 경우에, B12-의존적 효소 (하기와 같은 5종 유전자를 포함하는 락토코쿠스 류테리 (Lactococcus reuteri) 글리세롤 데히드라타제: pduC [Uniprot ID No. A5VMB2]; pduD [Uniprot ID No. A5VMB1]; pduE [Uniprot ID No. A5VMB0]; pduG [Uniprot ID No. A5VMA9]; 및 pduH [Uniprot ID No. A5VMA8])인 글리세롤 데히드라타제 효소는 또한 이 효소를 사용해 글리세롤로부터 3-히드록시-프로피온알데히드를 생성시킬 수 있도록 제2의 상용성 플라스미드에 클로닝되었다. 플라스미드는 이. 콜라이 BL21*(DE3)ΔldhA를 형질전환시켰다. 각 클론에 대한 출발 배양물을 1 g/L D-글루코스 및 적절한 항생제가 존재하는 5 mL 2xYT 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현을 위한 세포 배양물은 96웰 플레이트 중 2 mL 성장 배지에서 수행하였다. 복합 (2xYT) 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 100 mg/L 철 암모늄 시트레이트가 보충되었다. 유도-전 성장은 호기성 조건 하에 30℃에서 2시간 동안 수행하였다. 재조합 단백질 발현은 250 μM IPTG로 0.2-0.4의 OD600에서 유도시켰다. 유도-후 발현은 30-180분 동안 30℃에 호기성 조건 하에서 수행한 이후에 0-60분 동안 혐기성 조건 하에서 수행하였다.
효소 어세이: 발현 후에, 세포를 회수하였고 반응을 위한 기질과 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 0.4 mL의 신선한 배지 (OD600 ∼30)에 재현탁시켰다. 활성 결정을 위해서, 피루베이트 (10 - 20 g/L)는 5 - 40 g/L 알데히드 (예를 들어, 아세트알데히드, 프로피온알데히드, 부티르알데히드, 2-히드록시-아세트알데히드, 또는 4-히드록시-부티르알데히드)와 12시간 동안 호기적으로 인큐베이션시켰다. 3-히드록시-프로파날을 사용해 활성 결정을 위해, 발현 후 세포를 회수하였고 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)와 10-20 g/L 글루코스, 5-10 g/L 글리세롤, 및 10 g/L 피루베이트를 함유하는 0.4 mL의 신선한 배지 (OD600 ∼30)에 15시간 동안 혐기성 조건 하에 재현탁시켰다. 반응 믹스는 또한 10 μM 비타민 B12 및 1 g/L 글루타티온이 보충되었다. 실온에서 인큐베이션 후에, 세포를 원심분리하였고, 상청액을 여과하고 HPLC로 분석하였다.
생성물의 분석: 등용매 HPLC를 주로 사용하여 효소 생성물, 알돌 부가 생성물 (4-히드록시-2-케토-카르복실산), 알돌 축합 생성물 (3,4-데히드로-2-케토-카르복실산)의 생성을 검출하고 정량하였다. 한 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.05% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 이의 후자는 210 nm 및 260 nm에서 신호를 측정하는데 사용되었다. 추가로, 알돌 부가 및 알돌 축합 생성물은 HPLC를 통해 이전에 확인된 개별 피크의 질량을 측정하여, LC-MS를 통해서도 확인하였다 (본 명세서에 데이터 미포함).
실시예 2: 알돌-탈수 생성물의 환원을 촉매하는 효소.
본 명세서에서 입증되는 바와 같이, 활성화된 이중 결합, 즉, 카르보닐 또는 카르복실레이트 기 옆의 이중 결합의 환원은 효소에 의해 촉매될 수 있다. 알돌-탈수 생성물, 예를 들어, 2-옥소-3-에노산은 효소를 사용해 더 환원되어서 해당 2-옥소-카르복실산을 제공할 수 있다. 퀴논의 환원을 위해 NADH 및/또는 NADPH를 이용하는 EC 1.6.5 (예를 들어, EC 1.6.5.5)에 속하는 옥시도리덕타제는 이러한 반응을 촉매할 수 있다는 것을 예상치않게 발견하였다. 예를 들어, Ads-Hyd 효소 (실시예 1 참조)가 실시예 1에 기술된 바와 같이 2-케토-카르복실산의 생성을 위한 이. 콜라이 BL21 또는 이. 콜라이 MG1655 균주에서 재조합적으로 발현되었을 때, Ads-Hyd 효소 생성물 (즉, 2-옥소-3-에노산)의 일부분이 해당 2-케토-카르복실산으로 전환되었다는 것을 발견하였다. 이것은 이들 이. 콜라이 균주 내에서 일부 천연적으로 발현된 효소 또는 효소들이 2-옥소-3-에노산의 환원의 수행을 담당하였다는 가능성을 야기하였다. 이들 균주 내에서 활성화된 이중 결합의 환원을 생각한대로 수행할 수 있는 기지 옥시도리덕타제 (즉, EC 1.3.- 내지 EC 1.6.-)의 조사가 수행되었다. 17종의 이러한 유망한 효소가 각각 이. 콜라이 MG1655 및 이. 콜라이 BL21 내에서 확인되었다. 이들 숙주 둘 모두에서 이들 효소 각각에 대한 녹아웃 균주는 당분야에 공지된 방법을 사용해 제조되었다. 이후에 각각의 이러한 녹아웃 균주는 상기 기술된 방법을 사용하고 재조합적으로 발현된 Ads-Hyd 효소를 사용해 2-옥소-3-에노산 및 2-케토-카르복실산의 이의 생성물 둘 모두를 생성시키는 이의 능력에 대해 시험되었다. 이것은 qorA 유전자 또는 퀴논 옥시도리덕타제-1의 녹아웃이 2-옥소-3-에노산의 생성을 초래하였지만 2-케토-카르복실산은 그렇지 않았다는 확인을 이끌었다. 이것은 qorA에 의해 코딩되는 효소가 아마도 이 반응을 천연적으로 수행하는 것을 담당하였음을 확인하였다. 이후에, N-말단 His6 태그화 QorA 효소를 과발현시키고 정제하였으며, 실제로 바람직한 반응을 수행하는데 활성이 있었다는 것을 확인하였다 (도 6). 이것은 EC 1.6.5 (예를 들어, EC 1.6.5.5)에 속하는 이. 콜라이 유래의 퀴논 옥시도리덕타제 효소가 환형 구조인, 그들 천연 기질과 매우 상이한 기질에 대해 기능할 수 있다는 것을 분명하게 최초로 확인하였다. 더 나아가서, 이 효소는 생물생성 동안 호기성 및 혐기성 조건 하에 이러한 효소를 이용할 수 있으므로, 매우 유리한, 반응 동안 보조인자로서 NADH 및 NADPH 둘 모두를 이용할 수 있다는 것을 확인하였다 (도 6).
EC 1.6.5에 속하는 다양한 생합성 폴리펩티드는 본 개시에 따라서, 예를 들어, 알켄 환원 생성물 생합성 폴리펩티드로서 및/또는 알돌-탈수 생성물의 환원을 위해서, 이용될 수 있다. 예를 들어, EC 1.6.5.5의 다수의 퀴논 옥시도리덕타제는 이. 콜라이 Qor-1 효소와 그의 동일성이 37-90% 범위인 18종 효소 (표 9 참조)를 포함하여, 본 개시에 따라서 그들 활성에 대해 평가되었다. 선택된 모든 효소는 적어도 하나의 기질에 대해 활성인 것으로 확인되었고 (표 9), 이러한 반응을 수행하기 위해 이러한 클래스의 효소의 일반성을 더욱 확인하였다.
Figure pct00100
Figure pct00101
다른 환원 생성물 생합성 폴리펩티드, 예를 들어, EC 1.6.5의 다양한 하위클래스에 속하는 것들, 예컨대 EC 1.6.5.5에 속하는 다양한 퀴논 옥시도리덕타제 효소가 또한 이러한 반응을 수행할 수 있다.
클로닝 및 발현: 표 5에 표시된 이종성 알돌라제 히드라타제 (Ads-Hyd 1) 및 퀴논 옥시도리덕타제 효소를 코딩하는 DNA는 이. 콜라이에서의 발현을 위해 코돈-최적화되었고 상업적 DNA 합성 회사가 합성하였다. 시험관내 활성 측정을 위해서, N-말단 His6 태그가 Qor-1 효소에 부가되었다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 단일 pB11 골격 플라스미드의 T7 RNA 중합효소 프로모터의 하류 및 T7 종결자 서열의 상류에 클로닝되었다. 추가로, 선택된 알데히드가 3-히드록시-프로피온알데히드인 실험의 경우에, B12-의존적 효소인 글리세롤 데히드라타제 효소 (하기와 같은 5종 유전자를 포함하는 락토코쿠스 류테리 글리세롤 데히드라타제: pduC [Uniprot ID No. A5VMB2]; pduD [Uniprot ID No. A5VMB1]; pduE [Uniprot ID No. A5VMB0]; pduG [Uniprot ID No. A5VMA9]; 및 pduH [Uniprot ID No. A5VMA8])를 또한 이 효소를 사용해 글리세롤로부터 3-히드록시-프로피온알데히드를 생성시킬 수 있도로 제2의 상용성 플라스미드에 클로닝되었다. 플라스미드로 이. 콜라이 BL21*(DE3) ΔldhA ΔqorA를 형질전환시켰다. 재조합 단백질 발현은 실시예 1에서 상기 기술된 바와 같이 수행되었다. 시험관내 연구를 위해서, Qor-1 효소는 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도시켰다. 유도-후 발현은 180분 동안 30℃에 호기성 조건 하에서 수행하였다. 유도 후에, 효소는 당분야의 표준 방법을 사용하여 Ni-NTA 친화성 크로마토그래피를 사용하여 정제하였다.
효소 어세이: 상이한 퀴논 옥시도리덕타제의 생체내 활성 측정의 실시예 1과 동일하다. 도 6에 표시된 시험관내 활성 측정을 위해서, Qor-1 효소 (0.3 mg/mL)는 ∼10 mM의 6-히드록시-3,4-데히드로-2-옥소헥사노에이트 (자가 합성), 0.5 mM의 NADH 또는 NADPH와 100 mM pH 7 포스페이트 완충제 중에서 인큐베이션시켰다.
생성물의 분석: 실시예 1에 기술된 등용매 HPLC 방법을 사용하여 효소 생성물, 즉, 2-케토-카르복실산의 생성을 검출 및 정량하였다. 시험관내 활성 측정을 위해서, 340 nm에서의 흡광도 감소를 사용하여 NADH 또는 NADPH 보조인자의 고갈 및 그에 따른 Qor-1 활성을 측정하였다.
실시예 3: 피루베이트 및 지방족 알데히드로부터 2-케토-카르복실산의 생성을 위한 2-효소 시스템.
광범위한 2-케토 산의 생성을 위해 퀴논 옥시도리덕타제 효소와 조합한 알돌라제-히드라타제 효소(들)의 사용이 조사되었다. 이러한 조합은 수많은 산업적으로 바람직한 생성물 예컨대 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 카프로락탐, 카프로락톤, 6-히드록시 헥산산, 6-아미노 카프로산, 아미노산, 및 많은 상이한 지방 분자의 생성을 위한 전구체인 광범위 2-케토 산의 생성을 가능하게 한다. 알돌라제-히드라타제 효소 및 옥시도리덕타제의 수많은 상이한 조합이 상이한 2-케토 산의 생성에 활성인 것으로 확인되었다 (표 10). 본 명세서에서 입증된 바와 같이, 제공된 기술은 높은 생성물 농도, 예를 들어, 약 또는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 15, 17, 18, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1500, 2000, 2500, 3000 mM을 제공할 수 있다.
Figure pct00102
Figure pct00103
다양한 생합성 폴리펩티드, 특히 EC 1.6.5에 속하는 것들은 환원에 이용될 수 있다. 예를 들어, EC 1.6.5.5에 속하는 퀴논 옥시도리덕타제는 전자 캐리어 활성에 관여되는 것으로 보고되어 있고, 그들이 예를 들어 포유동물, 진균, 및 박테리아에 존재한다고 보고되어 있으므로 편재성 효소로 보고되어 있다 (Brenda.org에서 이러한 EC 클래스에 대한 등재 참조). 다양한 숙주 전반에서 이들 효소의 천연 발현 수준이 공지되어 있지 않지만, 효소의 이러한 클래스의 발현 수준이 천연적으로 미생물 숙주가 대면하게 되는 산화 스트레스에 의해 영향받을 수 있다는 것은 이전에 상정되었었다. 이. 콜라이 (MG1655 및 BL 21 균주) QorA 유전자 (Qor-1)는 특히 실시예 2에 기술된 조건 하에서, 천연적으로 발현되는 것으로 발견되었다. Ads-Hyd 효소 (예를 들어, Ads-Hyd 8)가 이. 콜라이에서 과발현될 때 이. 콜라이에서 Qor-1의 천연 효소 수준이더라도 2-케토산의 생성에 충분할 수 있다고 입증되었다. 예를 들어, Ads-Hyd 8이 이. 콜라이 BL 21*(DE3) ΔldhA에서 발현될 때, 그 결과로 ∼3 mM의 6-히드록시 2-케토 헥사노에이트가 생성되었다. 그러나, Ads-Hyd 8이외에도, 플라스미드로부터 Qor-1의 과발현은 ∼2x 개선된 생성 (∼5.8 mM 6-히드록시 2-케토 헥사노에이트)을 야기시켰다. 이 결과를 기반으로, 시험관내 동역학 데이터를 내부에서 수집하였고, 전형적인 효소 수준이 이. 콜라이에서 발견되었으며, 일부 구현예에서, 일부 구현예에서, 이들 조건 하에 발현되는 Qor-1 효소의 천연량은 <100 μM이고, 아마도 0.1-100 μM 범위일 것으로 추정된다.
알돌 부가, 탈수, 및 후속 환원이 3종의 별도 효소에 의해 수행되는, 3-효소 시스템과 비교하여, 2-효소 시스템을 사용하여 제공되는 기술은 중요한 개선을 제공하였는데, 예를 들어, (1) 3종 효소보다는 오직 2종 효소가 발현되는 것이 필요하고 - 따라서 반응이 생체 내에서 수행될 때 요구되는 촉매를 감소시키고, 단백질 생성을 위한 세포 자원을 감소시키며, (2) 알돌 부가 및 축합 반응 둘 모두를 단일 생합성 폴리펩티드가 수행하여서, 반응 평형이 과정을 통해서 실현가능한 전체 수율쪽으로 호의적일 수 있는, 바람직한 생성물의 생성 방향쪽으로 이동된다.
클로닝, 및 발현: 표 5에 표시된 이종성 알돌라제 히드라타제 및 퀴논 옥시도리덕타제 효소를 코딩하는 DNA는 이. 콜라이에서 발현을 위해 코돈 최적화되었고 상업적 DNA 합성 회사에서 합성하였다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 2종의 상용성 플라스미드 상에서 T7 RNA 중합효소 프로모터의 하류 및 T7 종결자 서열의 상류에 클로닝되었다. 추가로, 선택된 알데히드가 3-히드록시-프로피온알데히드인 실험에서, B12-의존적 효소인 글리세롤 데히드라타제 효소 (하기와 같은 5종 유전자를 포함하는 락토모쿠스 류테리 글리세롤 데히드라타제: pduC [Uniprot ID No. A5VMB2]; pduD [Uniprot ID No. A5VMB1]; pduE [Uniprot ID No. A5VMB0]; pduG [Uniprot ID No. A5VMA9]; 및 pduH [Uniprot ID No. A5VMA8])를 또한 이 효소를 사용해 글리세롤로부터 3-히드록시-프로피온알데히드를 생성시킬 수 있도록 제3 상용성 플라스미드에 클로닝하였다. 플라스미드로 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC ΔpoxB ΔpflB ΔackA-pta ΔyqhD, ΔadhP, ΔeutG, ΔgldA, ΔyiaY, ΔfucO를 형질전환시켰다. 재조합 단백질 발현은 실시예 1에서 상기 기술된 바와 같이 수행되었다.
효소 어세이: 실시예 1과 동일하다.
생성물의 분석: 실시예 1에 기술된 등용매 HPLC 방법을 사용하여 효소 생성물, 즉, 2-케토-카르복실산의 생성을 검출하고 정량하였다.
실시예 4: 1,5-펜탄디올의 생성을 위한 생합성 경로
이 실시예는 1,5-펜탄디올을 피루베이트 및 3-히드록시-프로피온알데히드로부터 생성하기 위한 생합성 경로를 기술한다. 도 2에 도시된 바와 같이, 피루베이트 및 3-히드록시-프로피온알데히드로부터의 생합성 경로는 5개 반응을 포함한다. 피루베이트 및 3-히드록시-프로피온알데히드를 6-히드록시-2-케토-헥사노에이트로 전환시키는 단계를 포함하는, 처음 3개 반응은 실시예 3에 기술되어 있다. 경로의 나머지 2개 단계로부터의 양쪽 기지의 효소는 하기에 기술된다. 특히, 효소는 생체내에서 완전한 경로를 입증하는 단계를 포함하는, 모든 5개 반응에 대해 검증되었다 (실시예 5 참조).
단계 1-3: 피루베이트 및 3-히드록시-프로피온알데히드의 6-히드록시-2-옥소-헥사노에이트로의 전환. 상세 사항은 실시예 3을 참조한다.
단계 4: 6-히드록시-2-옥소-헥사노에이트의 5-히드록시-펜타날로의 전환. 예시적인 효소는 표 11에 표시되어 있다. 2-케토-산 데카르복실라제 (EC 4.1.1.7)는 (Cn) 2-케토 산의 티아민 디포스페이트 (TPP) 의존적 탈카르복실화를 촉매하여 해당 (Cn-1) 알데히드를 제공한다. 피루베이트에 대한 활성이 최소이거나 또는 전혀없는 장쇄 2-옥소-산에 대한 고-활성을 보유하는 효소는 피루베이트와 교차-반응성이 이 경로의 수율에 극적으로 영향을 미칠 수 있으므로 바람직하다. 지. 모빌리스 (Z. mobilis) 피루베이트 데카르복실라제 (PDC)는 피루베이트에 대한 이의 활성에서 극적 감소 (>2000배)와 함께 장쇄 2-옥소-산에 대한 증가된 효율을 위해 이의 활성 부위를 유의하게 변형시키기 위해 돌연변이되었다 (I472A/I476F).7 지. 모빌리스 PDC 돌연변이체 I472A/I476F는 또한 바람직한 기질과 구조적으로 유사한 2-옥소-헥사노에이트에 대해 탁월한 동역학적 성질을 보인다. 이 단계를 촉매하기 위한 다른 유망한 효소 후보는 엘. 락티스 (L. lactis) 분지쇄 케토-산 데카르복실라제 KdcA (케토산 데카르복실라제), 및 피. 푸티다 (P. putida) 벤조일 포르메이트 데카르복실라제 (BFD) 돌연변이체 A460I이다.8-10 슈도모나스 푸티다 (pseudomonas putida) BFD 및 엘. 락티스 (l. lactis) KdcA는 탈카르복실화를 위한 피루베이트와 비교하여 장쇄 2-옥소-산에 대해 >50 내지 500배 선택성을 보인다. 특히, 엘. 락티스 KdcA는 2-옥소-헥산산에 대해 특이적 활성을 가지고 C3 및 C4 위치 상에서의 치환을 견딜 수 있다. 이러한 효소는 탈카르복실화 반응을 촉매하는데 활성인 것으로 확인되었다 (표 14).
Figure pct00104
다른 EC 번호를 갖는 데카르복실라제는 또한 이 반응을 수행하는데 적합하다. 대표적인 목록은 표 12에 표시된다.
Figure pct00105
Figure pct00106
단계 5: 5-히드록시-펜트알데히드의 1,5-펜탄디올로의 전환. 1차 알콜 데히드로게나제는 1차 알콜로 알데히드의 NAD(P)H-의존적 환원을 촉매한다.
많은 1차 알콜 데히드로게나제가 문헌에 공지되어 있고, 이 단계를 촉매하는 예시적인 후보는 하기에 기술되고 하기 표 13에 표시된다. AdhE, adhP, eutG, yiaY, yqhD, fucO, 및 yjgB를 포함하는, 다수의 이. 콜라이 알콜-알데히드 데히드로게나제가 공지되어 있다.11 최근에, 44종 알데히드 리덕타제가 이. 콜라이에서 확인되었다. 씨. 아세토부틸리쿰 (C. acetobutylicum) 유래의 부탄올 데히드로게나제12 는 이들 전환을 촉매하는데 흥미롭다. 다수의 에스. 세레비지아에 (S. cerevisiae) 알콜 데히드로게나제는 ADH2-6을 포함하여 광범위한 상이한 알데히드를 환원시키는 것으로 확인되었다. 특히 흥미로운 것은 장쇄 알칸-분해 균주 지오바실러스 써보데니트리피칸스 (Geobacillus thermodenitrificans) NG80-2로부터의 2종 알킬 알콜 데히드로게나제 (ADH) 유전자13로부터의 ADHI-ADHII이다. 다른 잡다한 ADH는 중간쇄 알콜 데히드로게나제를 코딩하는 AlrA를 포함한다.14 또한 흥미로운 것은 에이. 탈리아나 (A. thaliana)15, 이. 콜라이 (yihu)16, 및 역시 씨. 엘루이베리 (C. Eluyveri)에서 발견된 4-옥소 부티레이트의 환원을 촉매하는 4-히드록시 부티레이트 데히드로게나제 (EC 1.1.1.61)이다.17 에이. 탈리아나 효소를 비롯하여 에이. 테루스 (A. terrus) 효소 (표 13의 ATEG)는 글루타레이트 세미알데히드를 환원시킬 수 있다 (WO 2010/068953A2, WO 2010/068953A2). 수많은 알콜 데히드로게나제가 이 반응을 수행하는데 흥미롭지만, 5-히드록시 펜타날의 환원을 위한 이의 높은 활성 수준에 기인하여 특히 흥미로운 특이적 효소는 레이프소니아 (Leifsonia) sp. S749 (GenBank ID No. AB213459.1)로부터의 알콜 데히드로게나제이다. 이 효소 및 4종의 다른 알콜 데히드로게나제가 이 반응을 수행하는 것으로 검증되었다 (표 14).
Figure pct00107
Figure pct00108
클로닝, 및 발현: 하기 표 14에 표시된 이종성 2-케토 산 데카르복실라제 및 알콜 데히드로게나제 효소를 코딩하는 DNA는 이. 콜라이에서의 발현을 위해 코돈-최적화되었고 합성되었다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 단일 플라스미드 상에서 T7 RNA 중합효소 프로모터의 하류 및 T7 종결자 서열의 상류에 클로닝되었다. 플라스미드로 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC를 형질전환시켰다. 재조합 단백질 발현은 실시예 1에서 상기 기술된 바와 같이 수행되었다.
Figure pct00109
Figure pct00110
활성 어세이: 외부로부터 공급된 6-히드록시-2-케토-헥사노에이트로부터 1,5-펜탄디올의 생성의 관찰은 2-케토 산 데카르복실라제 및 알콜 데히드로게나제 효소의 성공적인 활성을 의미하였다. 따라서 발현 후, 세포를 회수하였고 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)와 6-히드록시-2-케토-헥사노에이트 (∼5 g/L) 및 10 g/L 글루코스를 함유하는 0.4 mL의 신선한 배지 (OD600 ∼30)에 15시간 동안 혐기성 조건 하에서 재현탁시켰다. 실온에서 인큐베이션 이후에, 세포를 원심분리하였고, 상청액을 여과하였으며 6-히드록시-2-케토-헥사노에이트로부터 1,5-펜탄디올의 형성에 대해 HPLC를 통해 분석하였다.
1,5-펜탄디올 생성의 HPLC 분석: 등용매 HPLC를 사용하여 1,5-펜탄디올을 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.05% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행되었고, 후자를 사용해 210 및 260 nm에서 신호를 측정하였다. HPLC 결과는 1,5-펜탄디올의 생성을 보여주었고; 소정 조제물의 결과는 표 14에 표시하였다.
실시예 5: 6-히드록시-2-케토-헥사노에이트 중간체를 통해 상이한 탄소원으로부터 1,5-펜탄디올의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 1,5-펜탄디올을 생성하기 위한 기술을 제공한다. 일부 구현예에서, 글리세롤이 탄소원으로서 이용된다. 일부 구현예에서, 하나 이상, 또는 모든, 생합성 단계가 하나의 유기체 (예를 들어, 박테리아) 및 배양물 중에서 수행된다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다.
도 2에 도시되고 또한 실시예 4에 기술된 물질대사 경로를 사용하여, 이들 탄소원으로부터 유래된 물질대사 전구체 피루베이트 및 3-히드록시-프로피온알데히드를 통해서 글리세롤 및/또는 글루코스같은 탄소원으로부터 1,5-펜탄디올의 생성을 조작하기 위한 예시적인 유기체로서 이. 콜라이를 사용하였다. 바람직한 탄소원 (예를 들어, 글리세롤 및/또는 글루코스)으로부터 이러한 경로를 통해서 1,5-펜탄디올을 제조할 수 있는 이. 콜라이를 생성시키기 위해서, 이 경로의 각각의 개별 효소 및 3-히드록시-프로피온알데히드 생성에 필요한 다른 효소를 코딩하는 핵산은 이. 콜라이에 대해 코돈-최적화되었고 상업적으로 합성하였거나 또는 이. 콜라이 게놈 DNA를 사용한 PCR 증폭을 통해 수득되었다. 유전자를 플라스미드로 클로닝하였고, 이로 이. 콜라이를 형질전환시켰다. 모든 경로 효소의 생체내 발현 결과로 1,5-펜탄디올이 생성되었다.
1,5-펜탄디올 경로 유전자의 클로닝: 1,5-펜탄디올 경로의 이종성 효소를 코딩하는 DNA는 이. 콜라이에서 발현을 위해 코돈-최적화되었고 상업적 DNA 합성 회사 (예를 들어, Twist Biosciences)가 합성하였다. 1,5-펜탄디올 경로의 천연 효소를 코딩하는 DNA는 PCR을 통해 이. 콜라이 게놈 DNA로부터 증폭시켰다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 T7 RNA 중합효소 프로모터의 하류 및 종결자 서열의 상류에 클로닝하였다. 유전자에 대한 발현 카세트를 보유하는 상용성 플라스미드는 마커 및 레플리콘의 하기 조합 중 하나를 함유하였다: (1) 클로람페니콜 마커 + P15A 레플리콘, (2) 암피실린 마커 + ColE1 레플리콘, 및 (3) 카나마이신 마커 + COLA 레플리콘. 사용된 유전자의 예는 다음을 포함한다: Ads-Hyd 8 (Uniprot ID No. A0A286PH18), Qor-1 (Uniprot ID No. P28304), 6-히드록시-2-옥소-헥사노에이트 데카르복실라제 (Uniprot ID No. Q6QBS4), 5-히드록시-펜타날 1-리덕타제라고도 하는 1차 알콜 데히드로게나제 (GenBank ID No. AB213459.1). 추가로, 비타민 B12-독립적인 글리세롤 데히드라타제 효소 (예를 들어, 하기 2개 서브유닛을 포함하는 클로스트리듐 부티리쿰 글리세롤 데히드라타제: DhaB1 [Uniprot ID No. Q8GEZ8]; DhaB2 [Uniprot ID No. Q8GEZ7]) 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소 (하기와 같은 5종 유전자를 포함하는 락토코쿠스 류테리 글리세롤 데히드라타제: pduC [Uniprot ID No. A5VMB2]; pduD [Uniprot ID No. A5VMB1]; pduE [Uniprot ID No. A5VMB0]; pduG [Uniprot ID No. A5VMA9]; 및 pduH [Uniprot ID No. A5VMA8])를 또한 이러한 효소를 사용해 글리세롤로부터 만들 수 있는 1,5-펜탄디올 경로 전구체인 3-히드록시-프로피온알데히드를 생성할 수 있도록 클로닝하였다. 락토코쿠스 류테리 글리세롤 데히드라타제를 코딩하는 모든 5종 유전자는 단일 유전자 오페론으로서 클로닝하였다.
1,5-펜탄디올의 생성을 위한 균주(들)의 구축: 이. 콜라이 균주 BL21* (DE3) ΔldhA 가 1,5-펜탄디올 경로 효소의 시험을 위한 배경 균주로서 사용되었다. 경로 효소를 코딩하는 유전자를 보유하는 플라스미드는 이. 콜라이의 형질전환과 연관된 표준 전기영동 방법을 사용해 형질전환시켰다.
1,5-펜탄디올의 생성: 하기 발현 균주는 이. 콜라이로 하기 플라스미드를 순차적으로 형질전환시킨 후에 수득되었다.
균주 PeDO1: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - DhaB1), 유전자 2 (글리세롤 데히드라타제 - DhaB2), 유전자 3 (Qor 1). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1 (6-히드록시-2-옥소-헥사노에이트 데카르복실라제), 유전자 2 (Ads-Hyd 8). 플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 1 (5-히드록시-펜타날 1-리덕타제).
균주 PeDO2: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - DhaB1), 유전자 2 (글리세롤 데히드라타제 - DhaB2), 유전자 3 (Qor 1). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1 (6-히드록시-2-옥소-헥사노에이트 데카르복실라제), 유전자 2 (Ads-Hyd 8).
균주 PeDO3: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - pduCDEGH). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1 (6-히드록시-2-옥소-헥사노에이트 데카르복실라제), 유전자 2 (Ads-Hyd 8), 유전자 3 (5-히드록시-펜타날 1-리덕타제). 플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 1 (Qor 1).
균주 PeDO4: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - pduCDEGH). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1 (6-히드록시-2-옥소-헥사노에이트 데카르복실라제), 유전자 2 (Ads-Hyd 8). 플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 1 (5-히드록시-펜타날 1-리덕타제).
균주 PeDO1 및 PeDO2의 배양: 출발 배양물은 5 mL 2xYT 배지와 1 g/L D-글루코스 및 적절한 항생제를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 1,5-펜탄디올 경로 효소를 위한 세포 배양은 40 mL 성장 배지 중에서 125 mL 배플드 플라스크를 사용하여 수행하였다. 복합 (2xYT) 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 100 mg/L 철 암모늄 시트레이트를 보충하였다. 유도-전 성장은 호기성 조건 하에 30℃에서 2시간 동안 수행하였다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었다. 유도-후 발현은 30분 동안 30℃에서 호기성 조건 하에 수행되었다. 다음으로 세포 배양물을 100 mL 유리병으로 옮겼고, L-시스테인-HCl-단일수화물을 성장 배지에 첨가하였고 (1 g/L 최농 농도), 병을 혐기성 글로브 박스 (Coy Laboratory) 내에서 밀봉하였다. 이어서 배양물은 유리병에서 2시간 동안 30℃에서 혐기성 조건 하에 성장시켰다. 이후에, 세포를 회수하였고 8 g/L 글루코스, 4 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 0.4 mL 신선한 배지 (OD600 ∼30)에 재현탁시켰다. 24시간 동안 실온에 혐기성 조건 하에서 인큐베이션 후에, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
균주 PeDO3 및 PeDO4의 배양: 생성 배지는 하기 조성을 함유한다: 1X MOPS 최소 배지, 5 g/L 효모 추출물, 10 g/L 글리세롤, 20 g/L 글루코스, 및 10 μM의 시아노코발라민 (pH7.2). 1X MOPS 최소 배지는 40 mM MOPS, 4 mM 트리신, 0.01 mM FeSO4, 9.5 mM NH4Cl, 0.276 mM K2SO4, 0.5 μM CaCl2, 0.525 mM MgCl2, 50 mM NaCl, 2.92E-7 mM (NH4)2MoO4, 4.0E-5 mM H3BO3, 3.02E-6 mM CoCl2, 9.62E-7 mM CuSO4, 8.08E-6 mM MnCl2, 9.74E-7 mM ZnSO4, 및 1.32 mM K2PO4 로 구성된다. 씨드 배양물은 10 mL 2xYT 배지 및 적절한 항생제를 함유하는 튜브에서 밤새 성장시켰다. 1,5-펜탄디올 생성을 위한 세포 배양물은 마개 존재의 125 mL 플라스크 중 적절한 항생제와 10 mL 생성 배지를 사용해 제조하였고, 1 mL의 씨드 배양물을 접종하여 세포가 유도 전 2시간 동안 37℃에서 성장될 수 있게 하였다. 2시간 후에, 세포 배양물은 0.1 mM IPTG로 유도시켰고 배양물이 생성을 시작하도록 26℃로 옮겼다. 12시간마다 호기적으로 샘플을 채취하였고 마지막 샘플은 72시간에 채취하였으며, 상청액을 여과하고 HPLC를 통해 분석하였다.
1,5-펜탄디올 생성의 HPLC 분석: 등용매 HPLC를 사용하여 1,5-펜탄디올을 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.05% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자를 사용하여 210 nm 및 260 nm에서 신호를 측정하였다. HPLC 결과는 800 mg/L (균주 PeDO1), 400 mg/L (PeDO2), 212 mg/L (PeDO3), 및 41 mg/L (PeDO4)의 최종 역가에서 분명한 1,5-펜탄디올 생성을 보였다.
1,5-펜탄디올 생성을 위한 추가 작업예:
상기 기술된 균주를 사용한 1,5-펜탄디올을생성의 성공을 기반으로, 1,5-펜탄디올의 생성에 대해 실시예 2 및 3에서 확인된 대체 퀴논 옥시도리덕타제의 사용을 평가하였다. 간략하게, 상기 기술된 실시예에서 균주 PeDO3의 플라스미드 조합이 사용되었고, 플라스미드 3은 상이한 Qor 효소 즉 Qor-1 (Uniprot ID No. P28304), Qor-2 (Uniprot ID No. P40783), 및 Qor-5 (Uniprot ID No. P43903)를 함유하였다. 균주 구축, 생성, 및 분석 방법은 상기 기술된 것과 동일하였다. 균주 PeDO5 (Qor-1 함유), 균주 PeDO6 (Qor-2 함유), 및 균주 PeDO6 (Qor-5 함유)는 상기 기술된 생성 조건 하에서 각각 ∼2 g/L, 2.2 g/L 및 2.4 g/L 1,5-펜탄디올의 생성을 이끌었다.
실시예 6: 6-히드록시-헥사노에이트 중간체로부터 1,6-헥산디올의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 6HH 및 HDO를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 6-히드록시-헥사노에이트 (6HH) 중간체로부터 1,6-헥산디올의 생성을 위한 생합성 경로는 도 3에 도시된다. 6HH로부터 1,6-헥산디올의 생성을 검증하기 위해 이러한 경로의 각 단계에 대한 상이한 효소의 사용을 도입시키는 실시예는 하기에 표시된다. 6HH 중간체로부터 1,6-헥산디올 생합성 경로의 각 단계를 수행하는데 사용된 그들이 유전자 및 그들이 코딩한 해당 효소의 예는 하기 표 15에 표시된다. 여기서의 각 효소는 동일한 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다.
Figure pct00111
유전자 1에 의해 코딩되는, 6-히드록시헥사노에이트 1-리덕타제라고 명명된 효소에 의해 촉매되는 반응: 6-히드록시-헥사노에이트 --> 6-히드록시-헥사날. 유전자 2에 의해 코딩되는 효소: 6-히드록시헥사노에이트 1-리덕타제 활성제. 유전자 3에 의해 코딩되는, 6-히드록시헥사날 1-리덕타제로 명명된 효소에 의해 촉매되는 반응: 6-히드록시-헥사날 --> 1,6-헥산디올
(i) HDO 생성을 위한 플라스미드의 제조:
HDO 생성 경로 유전자는 하기 표시된 2개 플라스미드에 클로닝하였다. 합성 유전자는 상업적 판매사로부터 수득하였고, 각 유전자는 이. 콜라이에서 발현을 위해 코돈 최적화되었다. 각 유전자는 표준 분자 생물학 방법을 사용하여 그 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이는 1,6-헥산디올 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 MG1655 (DE3) Δrne131, ΔldhA에서 모든 2개 플라스미드의 공-형질전환 이후에 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1. 플라스미드 2 (COLA 레플리콘, 카나마이신 마커): 유전자 2, 및 유전자 3
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 적절한 항생제가 존재하는 10 mL LB를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양물은 유리병을 사용하여 100 mL 부피로 수행하였다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행하였다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용하여 유도하였다. 유도-후 발현은 30℃에 호기성 조건하에서 60-90분 동안 이후에 혐기성 조건에서 2-3시간 동안 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, ∼10 g/L 글루코스, 6-히드록시-헥사노에이트 (∼5 g/L), 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 ∼40의 OD600에서 0.5 mL 부피 중에 재현탁시켰다. 실온에서 24시간 동안 인큐베이션 이후에, 세포를 원심분리하였고, 상청액을 여과하였으며 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출하였고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 표 15에서 모든 실시예의 경우에서 0.1 내지 2.5 g/L의 1,6-헥산디올의 생성을 보여주었다.
실시예 7: 6-히드록시-2-케토-헥사노에이트 중간체로부터 1,6-헥산디올의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 6HH 및 HDO를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 1,6-헥산디올의 생성을 위한 생합성 경로는 도 3에 도시된다. 이 경로를 통한 1,6-헥산디올의 생성을 검증하기 위해서 각 단계에 대한 상이한 효소의 사용을 도입시킨 실시예가 하기에 표시된다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 1,6-헥산디올 생합성 경로의 각 단계를 수행하기 위해 사용된 유전자 및 그들이 코딩하는 해당 효소의 예는 하기 표 16에 표시된다. 그에서의 각 효소는 동일한 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다. 추가로, 하기 실시예는 CoA-전달 반응 및 2,6-디히드록시-헥사노일-CoA 탈수 반응 둘 모두를 수행하기 위한 다수 효소의 확인을 강조한다.
(i) HDO 생성을 위한 플라스미드의 제조:
Figure pct00112
Figure pct00113
HDO 생성 경로 유전자는 하기 표시된 2개의 별도 상용성 플라스미드에 클로닝되었다. 각각의 플라스미드는 표시된 바와 같이, 상이한 복제 기원 및 항생제 마커를 가졌다. 합성 유전자는 상업적 판매처로부터 수득하였고, 각각의 유전자는 이. 콜라이에서 발현을 위해 코돈 최적화되었다. 각각의 유전자는 표준 분자 생물학 방법을 사용하여 이 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이는 1,6-헥산디올 생성을 조작하기 위한 표적 유기체로서 사용하였다. 발현 균주는 전기적격성 이. 콜라이 BL21*(DE3) Δldh, ΔadhE, ΔfrdA에 모든 3종 플라스미드를 공-형질전환시킨 후에 수득되었다.
플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 10, 유전자 9,
플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 유전자 2, 유전자 3, 및 유전자 4
플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 11.
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양물은 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지가 사용되었고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도하였다. 유도-후 발현은 30℃에서 호기성 조건 하에 60-90분 동안에 이어서 2-3시간 동안 혐기성 조건에서 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, ∼10 g/L 글루코스, 6-히드록시-2-케토-헥사노에이트 (∼5 g/L), 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 ∼40의 OD600에서 0.5 mL 부피에 재현탁하였다. 24시간 동안 실온에서 인큐베이션 후에, 세포를 원심분리하였고, 상청액을 여과하였고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 각각 표 16의 실시예 7A-7E의 경우에 700 mg/L, 1.2 g/L, 1.1 g/L, 1.1 g/L, 및 1 g/L의 1,6-헥산디올의 생성을 확인하였다.
실시예 8: 6-히드록시-2-케토-헥사노에이트 중간체를 통해 상이한 탄소원으로부터 1,6-헥산디올의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 6HH 및 HDO를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 탄소원으로서 글리세롤을 사용해 HDO를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각 독립적으로 하나 이상의 생합성 반응을 수행하는, 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 HDO 생성을 위한 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통해서 1,6-헥산디올의 생성을 위한 생합성 경로가 도 3에 도시된다. 이 경로를 통한 1,6-헥산디올의 생성을 위해 알돌라제-히드라타제 기반 2 효소 시스템의 사용을 도입시킨 실시예 (8a 및 8b)가 하기에 표시된다. 비타민 B12-독립적인 글리세롤 데히드라타제 효소 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소는 이 효소를 사용해 글리세롤로부터 만들어질 수 있는 3-히드록시-프로피온알데히드 - 1,6-헥산디올 경로 전구체를 생성할 수 있도록 클로닝될 수 있다. B12-의존적 글리세롤 데히드라타제가 본 명세서에서 사용되었다. 1,6-헥산디올 생합성 경로를 비롯하여 3-히드록시-프로피온알데히드의 생성의 각 단계를 수행하기 위해 사용된 유전자 및 그들이 코딩하는 해당 효소의 예는 표 17에 표시된다. 본 명세서의 각 효소는 동일한 E.C 클래스에 속하는 동종 효소로 대체될 수 있다는 것을 유의하는 것이 중요하다.
Figure pct00114
Figure pct00115
실시예 8a: 단일 이. 콜라이 균주에서 1,6-헥산디올 (HDO)의 생성
(i) HDO 생성을 위한 플라스미드의 제조:
HDO 생성 경로 유전자는 하기 표시된 3종의 별도 상용성 플라스미드에 클로닝되었다. 각각의 플라스미드는 표시된 대로 상이한 복제 기원 및 항생제 마커를 가졌다. 합성 유전자는 상업적 판매처로부터 수득하였고, 각 유전자는 이. 콜라이에서 발현을 위해 코돈 최적화되었다. 각 유전자는 표준 분자 생물학을 사용해 그 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이는1,6-헥산디올 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 BL21*(DE3) Δldh, ΔadhE, ΔfrdA에서 모든 3종 플라스미드를 공-형질전환 후 수득되었다.
플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 12, 유전자 13, 유전자 2, 유전자 10
플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 3, 유전자 4, 유전자 1, 및 유전자 9
플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 11.
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양은 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 60-90분 동안 그 이후에 2-3시간 동안 혐기성 조건에서 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 ∼40의 OD600에서 0.5 mL 부피로 재현탁되었다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 25-100 mg/L의 1,6-헥산디올의 생성을 보여주었다. 경로의 특별한 단계를 수행하기 위해 이전에 검증된 대체 효소가 이러한 방법론을 사용하여 HDO 생성에 사용될 수 있다는 것을 예시하기 위해서, 유전자 5-7가 각각 Uniport IDs A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9에 의해 코딩되는 것인 대체 HDO 생성 균주를 상기 방법을 사용해 구축하고 평가하였다. 이러한 생성 균주는 >10 mg/L의 1,6-헥산디올의 생성을 이끌었다.
실시예 8b: 2종 이. 콜라이 균주에서 1,6-헥산디올 (HDO)의 생성
(i) HDO 생성을 위한 플라스미드 및 균주의 제조
플라스미드로부터 발현된 HDO 생성 경로 유전자의 수를 최소화시키기 위해서, 이. 콜라이 발현 균주는 소정 경로 유전자가 게놈에 통합된 것으로 구축하였다. 특히, arsB 위치에 HDO 경로 유전자 (유전자 12, 유전자 13)를 함유하는 HDO 생성 균주 BL21*(DE3) Δldh, ΔadhE, ΔfrdA는 각 유전자의 발현이 그 자신의 T7 프로모터에 의해 제어된다. 나머지 HDO 생성 경로 유전자는 상기 실시예에 기술된 기술을 사용하여 하기 도시된 4종의 별도 플라스미드에 클로닝하였다. 유전자의 동일성은 실시예 8a에 기술되었다. 2종의 이. 콜라이 기반 발현 균주를 구축하였다. 발현 균주 1은 이. 콜라이에 플라스미드 1 및 플라스미드 2의 공-형질전환 후에 수득되었고, 발현 균주 2는 이. 콜라이에 플라스미드 3 및 플라스미드 4의 공-형질전환 후에 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 4, 유전자 3, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 2.
플라스미드 3 (RSF 레플리콘, 카나마이신 마커): 유전자 4, 및 유전자 11.
플라스미드 4 (ColE1 레플리콘, 암피실린 마커): 유전자 9 및 유전자 10.
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대한 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양은 별도로 각 발현 균주에 대한 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분을 보충하였다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 각 발현 균주에 대해 별도로 수행되었다. 이후에, 양쪽 발현 균주로부터의 세포는 동일한 양으로 혼합하였고, 이후에 그들을 회수하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 재현탁하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 100-550 mg/L의 1,6-헥산디올의 생성을 보여주었다.
실시예 9: 6-히드록시-2-케토-헥사노에이트 중간체로부터 6-히드록시헥사노에이트의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 6HH를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각이 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각 독립적으로 하나 이상의 생합성 반응을 수행하는, 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 6HH 생성을 위해 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L의 6HH이다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 6-히드록시헥사노에이트 (6HH)의 생성을 위한 생합성 경로는 도 4에 도시된다. 이러한 경로를 통해 6HH의 생성을 검증하기 위한 이 경로의 각 단계에 대한 상이한 효소의 사용을 도입시킨 실시예가 하기에 표시된다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 6HH 생합성 경로의 각 단계를 수행하는데 사용되는 유전자 및 그들이 코딩하는 해당 효소의 예가 표 18에 표시된다. 여기서 각각의 효소는 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다. 추가로, 하기 실시예는 CoA-전달 반응 및 2,6-디히드록시-헥사노일-CoA 탈수 반응 둘 모두를 수행하기 위한 다수 효소의 확인을 강조한다.
(i) 6HH 생성을 위한 플라스미드의 제조:
6HH 생성 경로 유전자는 하기 표시된 2종의 별도의 상용성 플라스미드에 클로닝되었다. 각각의 플라스미드는 표시된 바와 같은, 상이한 복제 기원 및 항생제 마커를 가졌다. 합성 유전자는 상업적 판매처로부터 수득하였고, 각 유전자는 이. 콜라이에서의 발현을 위해 코돈 최적화되었다. 각 유전자는 표준 분자 생물학 방법을 사용해 그 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이가 6HH 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 BL21*(DE3) Δldh, ΔadhE, ΔfrdA에서 모든 3종 플라스미드의 공-형질전환 후 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 유전자 2, 및 유전자 3 (오직 실시예 6 및 7)
플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 4, 유전자 5, 유전자 6, 및 유전자 7.
Figure pct00116
(ii) 세포 배양, 단백질 발현, 및 6HH 생성 분석:
출발 배양물은 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 6HH 생성을 위한 세포 배양은 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도하였다. 유도-후 발현은 30℃에 호기성 조건 하에서 60-90분 동안 그 이후에 2-3시간 동안 혐기성 조건에서 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 ∼10 g/L 글루코스, 6-히드록시-2-케토-헥사노에이트 (5-10 g/L), 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 재현탁되었다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 표 18의 실시예 9A-9G의 균주로부터 ∼0.4-5 g/L 의 6HH의 생성을 확인하였다.
실시예 10: 6-히드록시-2-케토-헥사노에이트 중간체를 통해 상이한 탄소원으로부터 6-히드록시헥산산 (6HH)의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 6HH를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 탄소원으로서 글리세롤을 사용해 6HH를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각이 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각 독립적으로 하나 이상의 생합성 반응을 수행하는, 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 6HH 생성을 위한 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통한 6HH의 생성을 위한 생합성 경로는 도 4에 도시된다. 이 경로를 통해 6HH의 생성을 위한 알돌라제-히드라타제 기반 2 효소 시스템의 사용을 도입한 실시예가 하기에 표시된다. 비타민 B12-독립적인 글리세롤 데히드라타제 효소 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소는 이 효소를 사용해 글리세롤로부터 만들 수 있는 3-히드록시-프로피온알데히드 - 6HH 경로 전구체를 생성시킬 수 있도록 클로닝될 수 있다. 양쪽 유형의 글리세롤 데히드라타제가 본 명세서에서 사용되었지만, 표 19에 표시된 등재물들은 B12-독립적 글리세롤 데히드라타제 효소를 사용하는 실시예에 집중한다. 여기서 각 효소는 6HH를 산출하기 위해 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있고, 표 19의 실시예 10B 및 10C는 CoA-전달 반응 및 2,6-디히드록시-헥사노일-CoA 탈수 반응 둘 모두를 촉매하는 효소가 동종 효소로 대체되었다는 이러한 점을 입증한다.
(i) 6HH 생성을 위한 플라스미드 및 균주의 제조:
플라스미드로부터 발현되는 6HH 생성 경로 유전자의 수를 최소화하기 위해서, 이. 콜라이 발현 균주는 소정 경로 유전자가 게놈에 통합된 것으로 구축하였다. 특히, 6HH 생성 균주 BL21*(DE3) Δldh, ΔadhE, ΔfrdA는 arsB 위치에 6HH 경로 유전자 (유전자 12, 유전자 13)를 함유하고 각 유전자의 발현은 그 자신이 T7 프로모터에 의해 제어된다. 나머지 6HH 생성 경로 유전자는 상기 실시예에 기술된 기술을 사용해 하기 표시된 2종 별도 플라스미드에 클로닝되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 4, 유전자 3, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 2.
(ii) 세포 배양, 단백질 발현, 및 6HH 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대해 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양은 별도로 각 발현 균주에 대한 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 별도로 각 발현 균주에 대해 수행되었다. 이후에, 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지에 재현탁시켰다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
Figure pct00117
Figure pct00118
(iii) 6HH 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 표 19의 실시예 10A-10C의 균주로부터 ∼50-800 mg/L의 6HH의 생성을 보여주었다. 대안적인 실시예는 B12-의존적인 글리세롤 데히드라타제 pduCDEGH (COLA 레플리콘, 카나마이신 마커를 갖는 제3 플라스미드 상의 단일 유전자 오페론으로서 코딩됨)가 B12-독립적 글리세롤 데히드라타제 대신에 사용되었고, 경로의 효소의 나머지는 실시예 10A와 동일하였다. 이러한 시스템은 또한 실시예 5에서 B12-의존적 효소를 함유하는 균주 PeDO3 및 PeDO4에 대해 기술된 배양 조건을 사용해 ∼350 mg/L의 6HH의 생성을 이끌었다.
실시예 11: 6-히드록시-헥사노에이트 (6HH) 중간체로부터 아디프산 (AA)의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 AA를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-헥사노에이트 중간체를 통해서 AA의 생성을 위한 생합성 경로는 도 5에 도시된다. 표 20은 6HH의 AA로의 전환을 가능하게 하는 효소의 예를 표시한다. 여기서 각 효소가 AA를 산출하기 위해 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다는 것을 유의하는 것이 중요하다.
Figure pct00119
(i) 6HH로부터 AA 생성을 위한 플라스미드 및 균주의 제조: AA 생성 경로 유전자는 이전 실시예에 기술된 기술을 사용해 하기 표시된 단일 플라스에 클로닝되었다. BL21*(DE3) Δldh, -ΔadhE, ΔfrdA가 생성 균주로서 사용되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 및 유전자 2.
(ii) 세포 배양, 단백질 발현, 및 AA 생성 분석: 출발 배양물은 별도로 각 발현 균주에 대한 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장되었다. 발현 및 AA 생성을 위한 세포 배양은 별도로 각 발현 균주에 대해 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 30-120분 동안에 이어서 2-3시간 동안 혐기성 조건에서 별도로 각 발현 균주에 대해 수행되었다. 이후에, 세포를 수확하였고, 농축하였으며,0.5 mL 부피로 ∼40의 OD600에서 5-10 g/L 글루코스, 5 g/L 6HH, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지에 재현탁되었다. 3시간 동안 실온에서 인큐베이션 후에, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) AA 생성의 HPLC 분석: 등용매 HPLC를 사용해 AA를 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 표 20의 실시예 11A 및 11B에 대해 500 - 1500 mg/L의 AA의 생성을 보여주었다.
실시예 12: 6-히드록시-2-케토-헥사노에이트 중간체로부터 아디프산 (AA)의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 6H2KH로부터 AA를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통한 AA의 생성을 위한 생합성 경로는 도 5에 도시된다. 이러한 경로를 통한 AA의 생성을 검증하기 위해 이 경로의 각 단계에 대한 상이한 효소의 사용을 도입한 실시예가 하기에 표시된다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 AA 생합성 경로의 각 단계를 수행하기 위해 사용되는 유전자 및 그들이 코딩하는 해당 효소의 예는 하기 표 21에 표시된다. 여기서 각각의 효소는 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다. 표 21의 실시예 12A 및 12B는 이 경로를 통한 AA의 성공적인 생성이 가능하도록 CoA-전달 반응 및 2,6-디히드록시-헥사노일-CoA 탈수 반응 둘 모두를 수행하기 위한 다수 효소의 확인을 강조한다.
(i) 6-히드록시-2-케토-헥사노에이트로부터 AA 생성을 위한 플라스미드 및 균주의 제조: AA 생성 경로 유전자는 하기 표시된 2종의 별도 상용성 플라스미드에 클로닝되었다. 각각의 플라스미드는 표시된 바와 같이, 상이한 복제 기원 및 항생제 마커를 가졌다. 합성 유전자는 상업적 판매처로부터 수득되었고, 각 유전자는 이. 콜라이에서 발현을 위해 코돈 최적화되었다. 각 유전자는 표준 분자 생물학 방법을 사용해 그 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이는 6HH 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC에서 양쪽 플라스미드의 공-형질전환 후에 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 3, 유전자 4, 유전자 9, 및 유전자 10
플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 및 유전자 8
(ii) 세포 배양, 단백질 발현, 및 AA 생성 분석: (실시예 11에서 사용된 6HH 대신) 10 g/L의 6-히드록시-2-케토-헥사노에이트를 기질로서 사용한 것을 제외하고 실시예 11과 동일하였다.
(iii) AA 생성의 HPLC 분석: 등용매 HPLC를 사용해 상기 기술된 대로 AA를 검출 및 정량하였다. 결과는 표 21의 실시예 12A-12C에 대해 100 - 800 mg/L의 AA의 생성을 보여주었다.
Figure pct00120
Figure pct00121
실시예 13: 6-히드록시-2-케토-헥사노에이트 중간체를 통해 상이한 탄소원으로부터 아디프산 (AA)의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 AA를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 3HPA 및 피루베이트를 사용해 AA를 생성하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 탄소원으로서 글리세롤을 사용해 AA를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각이 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각 독립적으로 하나 이상의 생합성 반응을 수행하는 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 AA 생성을 위해 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통해 AA의 생성을 위한 생합성 경로는 도 5에 도시된다. 이 경로를 통해 AA의 생성을 위한 알돌라제-히드라타제-기반 2-효소 시스템의 사용을 도입한 실시예가 하기에 표시된다. 비타민 B12-독립적인 글리세롤 데히드라타제 효소 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소는 이 효소를 사용해 글리세롤로부터 만들어질 수 있는 3-히드록시-프로피온알데히드 - 6HH 경로 전구체를 생성시킬 수 있도록 클로닝될 수 있다. B12-의존적 글리세롤 데히드라타제는 본 명세서에서 사용되었다. AA 생합성 경로를 비롯하여 3-히드록시-프로피온알데히드의 생성의 각 단계를 수행하는데 사용된 유전자 및 그들이 코딩하는 해당 효소의 예는 표 22에 표시된다. 여기서 각각의 효소는 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다.
Figure pct00122
Figure pct00123
(i) AA 생성을 위한 플라스미드 및 균주의 제조:
플라스미드로부터 발현되는 AA 생성 경로 유전자의 수를 최소화하기 위해서, 이. 콜라이 발현 균주는 소정 경로 유전자를 게놈에 통합시킨 것을 구축하였다. 특히, AA 생성 균주 BL21*(DE3) Δldh, ΔadhE, ΔfrdA는 arsB 위치에 경로 유전자 (유전자 12, 유전자 13)를 함유하였고 각 유전자의 발현은 이의 자체 T7 프로모터에 의해 제어된다. 2종의 이. 콜라이 기반 발현 균주를 구축하였다. 발현 균주 1은 이. 콜라이에 플라스미드 1 및 플라스미드 2의 공-형질전환 이후에 수득되었고, 발현 균주 2는 이. 콜라이에 플라스미드 3을 형질전환 후 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 4, 유전자 3, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 2.
플라스미드 3 (ColE1 레플리콘, 암피실린 마커): 유전자 9, 유전자 10, 및 유전자 3.
(ii) 세포 배양, 단백질 발현, 및 AA 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대한 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장되었다. 발현 및 AA 생성을 위한 세포 배양은 별도로 각 발현 균주에 대해 유리병을 사용해 100 mL 부피에서 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분을 보충하였다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에서 호기성 조건 하에 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 각 발현 균주에 대해 별도로 수행되었다. 이후에, 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 재현탁하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) AA 생성의 HPLC 분석: 등용매 HPLC를 사용해 AA를 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 20 - 350 mg/L의 AA의 생성을 보여주었다.
실시예 14: 6-히드록시헥사노에이트의 다수-균주 및 다수-포트 생성.
일부 구현예에서, 생성물 예를 들어, 6HH의 생성은 한 균주에서 수행된다. 일부 구현예에서, 생성은 둘 이상의 균주에서 수행된다. 일부 구현예에서, 둘 이상의 균주는 함께 생성에서 이용되는 모든 생합성 폴리펩티드를 발현한다. 일부 구현예에서, 한 균주에서 생합성 폴리펩티드의 생성물은 다른 균주의 생합성 폴리펩티드의 기질이다. 일부 구현예에서, 한 균주의 둘 이상의 생합성 폴리펩티드의 생성물은 독립적으로 하나 이상의 다른 균주에서 둘 이상의 생합성 폴리펩티드의 기질이다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L의 6-히드록시헥사노에이트이다.
상기 실시예 10은 단일 이. 콜라이 균주에서 6HH의 생성을 기술하고, 피루베이트 및 3-히드록시 프로파날의 전환 (및 글리세롤로부터 이의 생성)에 필요한 모든 생합성 경로 효소는 단일 이. 콜라이 균주 내에서 동시에 모두 발현된다. 일부 구현예에서, 전체 생합성 경로가 모듈이라고 불리는 더 작은 섹션으로 분할되고, 각각의 모듈은 그 자신의 고유한 이. 콜라이 균주에서 발현되는 생합성 경로의 일련의 순차적 효소를 포함하는 것인, 다수균주 접근법을 추구하는 것이 유리할 수 있다. 예를 들어, 전체 6HH 생합성 경로를 2개 모듈로 분할하는 것이 실현가능하였음을 입증하였다. 특히, 단일 이. 콜라이 균주에서 6-히드록시-2-케토-헥사노에이트 - 6HH 생합성 경로의 중간체의 생성을 허용하는, 제1 모듈의 구축은 상기 실시예 3에 기술되고, 피루베이트 및 3-히드록시 프로파날의 전환 (및 글리세롤로부터 이의 생성)에 필요한 모든 효소는 단일 이. 콜라이 균주 내에서 동시에 모두 발현되었다. 제2 (별도) 이. 콜라이 균주에서 6-히드록시-2-케토-헥사노에이트로부터 6HH의 생성을 허용하는, 제2 모듈의 구축은 상기 9에 기술되고, 6-히드록시-2-케토-헥사노에이트의 6HH로의 전환에 필요한 모든 효소는 이러한 단일 이. 콜라이 균주 내에서 동시에 모두 발현된다. 양쪽 모듈의 사용은 2종의 별도의 이. 콜라이 균주에서 6HH의 생성을 위한 완전한 생합성 경로를 유도한다. 이러한 다수균주 접근법은 다수의 이유로 유리할 수 있는데, 예컨대 제한없이, a) 이들같은 대규모 생합성 경로를 개발하기 위한 플라스미드의 구축 및 시험은 거대 라이브러리를 생성시킬 수 있고, 기능성 (또는 최고) 유전자 구성체를 스크리닝하는 통상의 무차별 방법은 비효율적이고 값비쌀 수 있고; b) 효소 발현는 경로에 걸쳐 단순화되고 균형잡힐 수 있어서 실질적으로 더 빠른 개발 사이클을 초래할 수 있고; c) 각각의 별도 모듈에 대한 이. 콜라이 균주의 유전 배경은 산화환원 반응을 적합화하도록 조율할 수 있고 다른 것들은 각 모듈에 대한 생성을 최대화하는 것을 필요로 한다 (단일 균주 최적화가 전체 경로에 효율적이지 않을 수 있기 때문). 하기 표 23에 요약된 결과는 동시에 (즉, 1-포트) 또는 순차적 생성 방법론을 통해서 6HH의 생성을 위한 이러한 다수-균주 접근법의 성공적인 사용을 입증한다.
Figure pct00124
(i) 6HH 생성을 위한 플라스미드 및 균주의 제조:
전체 6HH 생합성 경로는 상기 기술된 바와 같이 2종의 이. 콜라이 균주 (또는 모듈)로 분할되었다. 2종의 이. 콜라이 기반 발현 균주를 구축하였다. 발현 균주 1은 플라스미드 1, 및 플라스미드 2를 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC ΔpoxB ΔpflB ΔackA-pta ΔyqhD, ΔadhP, ΔeutG, ΔgldA, ΔyiaY, ΔfucO에 공-형질전환 후 수득되었고; 발현 균주 2는 플라스미드 3 및 4를 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC에 형질전환 후 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 유전자 2, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 9.
플라스미드 3 (ColE1 레플리콘, 암피실린 마커): 유전자 4.
플라스미드 4 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 3.
(ii) 세포 배양, 단백질 발현, 및 6HH 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대해 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 6HH 생성을 위한 세포 배양는 별도로 각 발현 균주에 대해 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 별도로 각 발현 균주에 대해 수행되었다. 이후에, 양쪽 발현 균주로부터의 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 재현탁시켰다. 실시예 14A 경우에, 양쪽 균주로부터 동일 수의 세포를 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 배지에 재현탁시켰다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다. 실시예 14B 경우에, 발현 균주 1로부터의 세포는 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 배지에 현탁시켰다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하였고 발현 균주 2로부터의 세포와 혼합하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) 6HH 생성의 HPLC 분석: 이것은 이전에 언급된 대로 수행되었다. 결과는 350 - 1100 mg/L의 6HH의 생성을 보여주었다.
실시예 15: 1,6-헥산디올의 다수-균주 및 다수-포트 생성.
일부 구현예에서, 본 개시는 HDO를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 3HPA 및 피루베이트로부터 HDO를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 탄소원으로서 글리세롤을 사용해 HDO를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각이 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각이 독립적으로 하나 이상의 생합성 반응을 수행하는, 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 HDO 생성을 위해 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 상기 실시예 8은 단일 또는 이중 이. 콜라이에서 HDO의 생성을 기술하고, 피루베이트 및 3-히드록시 프로파날의 전환 (및 글리세롤로부터 이의 생성)에 필요한 모든 생합성 경로 효소는 단일 이. 콜라이 균주 또는 2종의 별도 이. 콜라이 균주에서 동시에 모두 발현된다. 이러한 다수-균주 접근법은 실시예 14에 언급된 다수 이유로 유리할 수 있다. 표 24에 요약된 결과는 동시에 (즉, 1-포트) 또는 순차적 생성 방법론을 통해서 HDO의 생성을 위한 이러한 다수-균주 접근법의 다른 성공적 사용을 입증한다.
Figure pct00125
Figure pct00126
(i) HDO 생성을 위한 플라스미드 및 균주의 제조:
전체 HDO 생합성 경로는 상기 기술된 바와 같은 2종의 이. 콜라이 균주 (또는 모듈)로 분할되었다. 2종의 이. 콜라이 기반 발현 균주를 구축하였다. 발현 균주 1은 플라스미드 1, 및 플라스미드 2를 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC ΔpoxB ΔpflB ΔackA-pta ΔyqhD, ΔadhP, ΔeutG, ΔgldA, ΔyiaY, ΔfucO에 공-형질전환 후에 수득하였고; 발현 균주 2는 플라스미드 3 및 4를 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC에 형질전환 후 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 유전자 2, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 12.
플라스미드 3 (ColE1 레플리콘, 암피실린 마커): 유전자 3, 유전자 9, 유전자 4, 유전자 11, 및 유전자 10.
플라스미드 4 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 4.
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대해 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 6HH 생성을 위한 세포 배양은 별도로 각 발현 균주에 대해 유리병을 사용해 100 mL 부피로 수행하였다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분을 보충하였다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 별도로 각 발현 균주에 대해 수행되었다. 이후에, 양쪽 발현 균주로부터의 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 재현탁되었다. 실시예 15A의 경우, 양쪽 균주로부터의 동일 수의 세포를 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 배지에 재현탁하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다. 실시예 15B 경우에, 발현 균주 1로부터의 세포는 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 배지에 현탁하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하였고 발현 균주 2로부터의 세포와 혼합하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 이것은 이전에 언급된 바와 같이 수행되었다. 결과는 400 - 800 mg/L의 HDO의 생성을 보여주었다.
실시예 16: 글리세롤로부터 3-히드록시-프로파날의 합성
3-히드록시-프로파날은 글리세롤로부터 글리세롤 데히드라타제를 사용해 합성하였다. 글리세롤 데히드라타제는 재활성화 단백질의 존재 하에서 조효소 B12-의존적 또는 조효소 B12-독립적 방식으로 탈수를 촉매할 수 있다. 조효소 B12-의존적 데히드라타제는 3개 서브유닛: 대형 또는 "α" 서브유닛, 중간형 또는 "β" 서브유닛, 및 소형 또는 "γ" 서브유닛으로 구성된다. 이들 서브유닛은 α2β2γ2 구조로 조립되어 아포효소를 형성한다. 조효소 B12 (활성 보조인자 종)는 아포효소에 결합하여 촉매적으로 활성인 할로효소를 형성한다. 조효소 B12는 촉매반응이 일어나는 라디칼 기전에 관여되므로 촉매 활성에 필요하다. 생화학적으로, 조효소 B12-의존적 글리세롤 및 조효소 B12-의존적 디올 데히드라타제 둘 모두는 글리세롤 및 다른 기질에 의한 기전-기반 자살 불활성화를 겪는 것으로 공지되어 있다 (Daniel et al., FEMS Microbiology Reviews 22:553-566 (1999); Seifert, et al., Eur. J. Biochem. 268:2369-2378 (2001)). 불활성화는 데히드라타제 활성화를 복원하기 위해 데히드라타제 재활성화 인자에 의존하여 극복할 수 있다 (Toraya and Mori (J. Biol. Chem. 274:3372 (1999); 및 Tobimatsu et al. (J. Bacteria 181:4110 (1999)). 데히드라타제 재활성화 및 조효소 B12 재생 과정 둘 모두는 ATP를 요구한다. 글리세롤 데히드라타제, 디올 데히드라타제 및 재활성화 인자의 소수예가 하기에 표시된다. 당업자는 시트로박터 프룬디이 (Citrobacter freundii), 락토코쿠스 류테리 (Lactococcus reuteri), 클로스트리듐 파스퇴리아눔 (Clostridium pasteurianum), 클로스트리듐 부티리쿰 (Clostridium butyricum), 케이. 뉴모니아에 (K. pneumoniae) 또는 그들 균주의 글리세롤 데히드라타제; 살모넬라 티피뮤리움 (Salmonella typhimurium), 클렙시엘라 옥시토카 (Klebsiella oxytoca) 또는 케이. 뉴모니아에 (K. pneumoniae)의 디올 데히드라타제; 및 하기 표 25에 열거된 E.C. 군에 속하는 다른 데히드라타제 효소 또는 이들 서열의 동종 효소가 또한 이 단계를 수행하는데 사용될 수 있다는 것을 인식할 것이다. 이들 효소의 돌연변이체 (미국 특허 제8445659호 및 제7410754호)는 또한 과정의 효율을 증가시키기 위해 본 명세서에서 사용될 수 있다. 특히, 조효소 B12-독립적-데히드라타제 (Raynaud, C., et al., Proc. Natl. Acad. Sci. U.S.A. 100, 5010-5015 (2003))는 비타민-B12의 고비용으로 인해 산업적 과정에 호의적이다.
Figure pct00127
Figure pct00128
실시예 17: 피루베이트의 합성.
당의 피루베이트로의 전환.
해당과정을 통한 당의 피루베이트로의 전환은 매우 충분히 공지되어 있다. 해당과정에서, 글루코스의 각 몰은 2몰의 ATP, 2몰의 NAD(P)H 형태의 환원 균등물, 및 2몰의 피루베이트를 제공한다.
글리세롤의 피루베이트로의 전환.
글리세롤은 혐기적 및 미세-호기적으로 해당작용 중간체로 전환될 수 있다. 혐기적으로, 글리세롤은 디히드록시아세톤으로 탈수소화되고, (포스포에놀 피루베이트 또는 ATP를 사용한) 인산화 이후에, 디히드록시아세톤 포스페이트 해당작용 경로 중간체로 전환된다 (Dharmadi, et al., Biotechnol. Bioeng. 94:821-829 (2006)). 글리세롤 전환을 위한 호흡 경로는 (ATP에 의한) 글리세롤의 인산화 이후 산화 (전자 억셉터로서 퀴논)되어 해당작용을 통해 피루베이트로 전환될 수 있는 디히드록시아세톤 포스페이트를 제공하는 것을 포함한다 (Booth IR. Glycerol and methylglyoxal metabolism. Neidhardt FC, et al., editors. In: Escherichia coli and Salmonella: Cellular and molecular biology (web edition). 2005, Washington, DC, ASM Press; Durnin et al., Biotechnol Bioeng. 103(1):148-161 (2009)).
실시예 18: 6-히드록시-2-케토-헥사노에이트 중간체로부터 2,6-디히드록시-헥사노에이트의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 2,6-디히드록시-헥사노에이트를 6-히드록시-2-케토-헥사노에이트로부터 생성시키기 위한 기술을 제공한다. 소정 실시예를 하기에 기술한다.
2,6-디히드록시-헥사노에이트 (6H2HH)를 6-히드록시-2-케토-헥사노에이트 중간체로부터 생성시키기 위한 생합성 경로는 도 4에 도시된다. 6H2KH를 6H2HH로 환원을 위한 상이한 2-케토 리덕타제 효소 즉 6-히드록시-2-옥소헥사노에이트 2-리덕타제의 사용을 도입한 실시예가 하기에 표시된다. 이 단계에 사용된 유전자 및 그들이 코딩하는 해당 효소의 예는 표 26에 표시된다. 여기서 각 효소는 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다.
(i) 6H2HH 생성을 위한 플라스미드의 제조:
6-히드록시-2-옥소헥사노에이트 2-리덕타제를 코딩하는 유전자는 표준 분자 생물학 방법을 사용해 발현이 T7 프로모터에 의해 구동되는 플라스미드에 클로닝되었다. 에스케리치아 콜라이는 6H2HH 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 BL21*(DE3) Δldh에서 모든 3종 플라스미드를 공-형질전환 후 수득되었다.
Figure pct00129
Figure pct00130
(ii) 세포 배양, 단백질 발현, 및 6H2HH 생성 분석:
출발 배양물은 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 6H2HH 생성을 위한 세포 배양은 유리병을 사용해 100 mL 부피로 수행하였다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도하였다. 유도-후 발현은 30℃에 호기성 조건 하에서 60-90분 동안 그 이후에 2-3시간 동안 혐기성 조건에서 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 ∼10 g/L 글루코스, 6-히드록시-2-케토-헥사노에이트 (5-10 g/L), 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 재현탁시켰다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) 6H2HH 생성의 HPLC 분석: 등용매 HPLC를 사용하여 6H2HH를 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기)를 사용해 수행하였다. 결과는 표 26의 실시예 1-9의 모든 균주로부터 6H2HH의 생성을 확인하였다.
실시예 19: 6-히드록시-2-케토-헥사노에이트 중간체를 통한 상이한 탄소원으로부터 2,6-디히드록시-섹사노에이트의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 다양한 탄소원으로부터 2,6-디히드록시-헥사노에이트를 생성시키기 위한 기술을 제공한다. 소정 실시예가 하기에 기술된다. 일부 구현예에서, 본 개시는 피루베이트 및 3HPA로부터 2,6-디히드록시-헥사노에이트를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다.
피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통해서 6H2HH의 생성을 위한 생합성 경로는 도 4에 도시된다. 이러한 경로를 통해 6H2HH의 생성을 위한 알돌라제-히드라타제 기반 2 효소 시스템의 사용을 도입시킨 실시예가 하기에 표시된다. 비타민 B12-독립적인 글리세롤 데히드라타제 효소 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소는 이 효소를 사용해 글리세롤로부터 만들 수 있는 3-히드록시-프로피온알데히드 - 6H2HH 경로 전구체를 생성할 수 있도록 클로닝될 수 있다. 글리세롤 데히드라타제의 2가지 유형이 본 명세서에서 사용될 수 있지만, 하기 표시된 실시예는 12-의존적 글리세롤 데히드라타제 효소를 사용한다. 여기서 각각의 효소는 6H2HH를 산출하기 위해 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다.
(i) 6H2HH 생성을 위한 플라스미드 및 균주의 제조: MG1655(DE3) Δrne131, ΔldhA, Δ[frdB, frdC], ΔadhE, ΔpoxB, ΔpflB, Δ[ackA, pta] 가 하기 플라스미드 조합을 갖는 균주로서 사용되었다: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - pduCDEGH). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 2 (Ads-Hyd 8), 유전자 2 (Qor-1), 및 유전자 3 (6-히드록시-2-옥소헥사노에이트 2-리덕타제 - Q5FTU6).
(ii) 세포 배양, 단백질 발현, 및 6H2HH 생성 분석:
세포 배양 (적절한 항생제 존재), 및 단백질 발현은 3-히드록시 프로파날에 대해 실시예 1에 기술된 것과 유사하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) 6H2HH 생성의 HPLC 분석: 분석읜 실시예 18에 언급된 대로 수행되었다. 균주는 이들 조건 하에서 > 1 g/L의 6H2HH를 생성시킬 수 있었다.
균등물
달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시가 속하는 분야의 당업자가 통상으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 제공되는 모든 뉴클레오티드는 5'에서 3' 방향으로 표시된다.
본 명세서에서 예시적으로 기술되는 구현예는 본 명세서에 특별히 개시하지 않은 임의 구성요소 또는 구성요소들, 제한 또는 제한들의 부재 하에서 적합하게 실시될 수 있다. 따라서, 예를 들어, 용어 "포함하는", "포괄하는", "함유하는" 등은 제한없이 광범위하게 판독되어야 한다. 추가로, 본 명세서에서 적용되는 용어 및 표현은 제한이 아니라 설명의 관점에서 사용되었고, 이러한 용어 및 발현의 사용이 표시되고 기술된 특징의 임의 균등물 또는 이의 일부를 배제하려는 의도가 아니지만, 다양한 변형이 청구된 본 발명의 범주 내에서 가능하다는 것을 인식한다.
본 기술이 상기 양태와 함께 기술되었지만, 전술한 설명 및 실시예는 본 기술의 범주를 예시하려는 의도이고 제한하려는 것이 아님을 이해해야 한다. 본 기술의 범주 내에서 다른 양태, 장점, 및 변형은 본 기술이 속하는 분야의 당업자에게 자명할 것이다.
참조문헌
Figure pct00131
Figure pct00132
Figure pct00133
Figure pct00134
Figure pct00135
Figure pct00136
Figure pct00137
Figure pct00138
Figure pct00139
Figure pct00140
Figure pct00141
Figure pct00142
Figure pct00143
Figure pct00144
Figure pct00145
Figure pct00146
Figure pct00147
Figure pct00148
Figure pct00149
Figure pct00150
Figure pct00151
Figure pct00152
Figure pct00153
Figure pct00154
Figure pct00155
Figure pct00156
<110> ZYMOCHEM, INC. <120> PRODUCTION OF CHEMICALS FROM RENEWABLE SOURCES <130> 2013662-0014 <140> PCT/US2020/029981 <141> 2020-04-25 <150> 62/868,824 <151> 2019-06-28 <150> 62/838,793 <151> 2019-04-25 <160> 106 <170> PatentIn version 3.5 <210> 1 <211> 265 <212> PRT <213> Streptomyces bingchenggensis <400> 1 Met Lys Gly Tyr Thr Val Pro Leu Ser Pro Arg Gly Ile Ala Asn Leu 1 5 10 15 Ala Pro Ala Pro Pro Trp His Tyr Ala Gly Thr Val Val Gly Val Glu 20 25 30 Phe Phe Thr Asp Pro Ala Ala Ala Ala Ala Thr Leu Pro Glu Gly Leu 35 40 45 Thr Pro Asp Pro Asp Ser Ala Gly Arg Gly Val Ala Met Phe Ile Asp 50 55 60 Trp Gln Tyr Ser Ser Thr Gly Leu Glu Tyr Leu Asp Pro Ala Arg Ser 65 70 75 80 Gln Tyr Arg Glu Phe Leu Ile Thr Leu Asp Ala His Cys Asn Gly Ala 85 90 95 Pro Val Ala Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ala Ala Met 100 105 110 Ala Arg Gly Trp Val Gln Gly Phe Pro Lys Lys Leu Gly Ala Val His 115 120 125 Gln Thr Arg Ala Tyr Ser Val Gly Gly Pro Gly Thr Pro Val Leu Gly 130 135 140 Pro Gly Gly Gln Phe Gly Ala Thr Ala Ser Ser Ala Gly Gln Arg Ile 145 150 155 160 Ala Glu Ala Lys Ile Thr Leu Glu Gln Pro Val Pro Asp Pro Ala Ala 165 170 175 Leu Met Ser Arg Pro Val Ile Asn Leu Arg His Phe Pro Arg Leu Ala 180 185 190 Ala Gly Gln His Asp Gln Pro Ala Val His Glu Leu Val Met Ser Val 195 200 205 Leu Asp Asp Thr Ala Val Ser Asp Ala Trp Val Gly Thr Ala Asp Leu 210 215 220 Ala Phe Leu Pro Ala His Gly Glu Glu Leu Ala Asp Leu Pro Val Arg 225 230 235 240 Arg Thr Gly Lys Gly Phe His Phe Asp Leu Ala Tyr Thr Val Thr Asp 245 250 255 Leu Met Thr Leu Ala Asp His Ser Ala 260 265 <210> 2 <211> 334 <212> PRT <213> Pseudomonas putida <400> 2 Met Ser Asn Lys Ile Met Lys Thr Ser Arg Leu Thr Ala Glu Asp Ile 1 5 10 15 Asn Gly Ala Trp Thr Ile Met Pro Thr Pro Ser Thr Pro Asp Ala Ser 20 25 30 Asp Trp Arg Ser Thr Ala Thr Val Asp Leu Glu Glu Thr Ala Arg Ile 35 40 45 Val Glu Glu Leu Ile Ala Ala Gly Val Asn Gly Ile Leu Ser Met Gly 50 55 60 Thr Phe Gly Glu Cys Ala Thr Leu Thr Trp Asp Glu Lys Arg Asp Tyr 65 70 75 80 Val Ser Thr Ile Val Glu Thr Ile Arg Gly Arg Val Pro Tyr Phe Cys 85 90 95 Gly Thr Thr Ala Leu Asn Thr Arg Glu Val Ile Arg Gln Thr Arg Glu 100 105 110 Leu Ile Asp Ile Gly Ala Asn Gly Thr Met Leu Gly Val Pro Met Trp 115 120 125 Val Lys Met Asp Leu Pro Thr Ala Val Gln Phe Tyr Arg Asp Val Ala 130 135 140 Asp Ala Val Pro Glu Ala Ala Ile Ala Ile Tyr Ala Asn Pro Glu Ala 145 150 155 160 Phe Lys Phe Asp Phe Pro Arg Pro Phe Trp Ala Glu Met Ser Lys Ile 165 170 175 Pro Gln Val Val Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu 180 185 190 Asp Leu Arg Leu Ala Pro Asn Ile Arg Phe Leu Pro His Glu Asp Asp 195 200 205 Tyr Tyr Ala Ala Ala Arg Ile Asn Pro Glu Arg Ile Thr Ala Phe Trp 210 215 220 Ser Ser Gly Ala Met Cys Gly Pro Ala Thr Ala Ile Met Leu Arg Asp 225 230 235 240 Glu Val Val Arg Ala Lys Ser Thr Gly Asp Trp Ala Lys Ala Lys Ala 245 250 255 Ile Ser Asp Asp Met Arg Ala Ala Asp Ser Thr Leu Phe Pro Arg Gly 260 265 270 Asp Phe Ser Glu Phe Ser Lys Tyr Asn Ile Gly Leu Glu Lys Ala Arg 275 280 285 Met Asp Ala Ala Gly Trp Leu Lys Ala Gly Pro Cys Arg Pro Pro Tyr 290 295 300 Asn Leu Val Pro Glu Asp Tyr Leu Ala Gly Ala Gln Lys Ser Gly Lys 305 310 315 320 Ala Trp Ala Ala Leu His Ala Lys Tyr Ser Asn Glu Leu Lys 325 330 <210> 3 <211> 332 <212> PRT <213> Nocardioides sp. <400> 3 Met Thr Ser Pro Ala Val Thr Ser Ala Asp Ile Thr Gly Leu Val Gly 1 5 10 15 Ile Val Pro Thr Pro Ser Lys Pro Gly Ser Glu Ala Pro Asp Ala Val 20 25 30 Asp Thr Val Asp Leu Asp Glu Thr Ala Arg Met Val Glu Leu Ile Val 35 40 45 Ala Ser Gly Val Asp Val Leu Leu Thr Asn Gly Thr Phe Gly Glu Val 50 55 60 Ala Thr Leu Thr Tyr Glu Glu Leu Leu Ala Phe Asn Asp Thr Val Ile 65 70 75 80 Arg Thr Val Ala Asn Arg Ile Pro Val Phe Cys Gly Ala Ser Thr Leu 85 90 95 Asn Thr Arg Asp Thr Ile Ala Arg Ser Leu Ala Leu Met Gly Leu Gly 100 105 110 Ala Asn Gly Leu Phe Val Gly Arg Pro Met Trp Leu Pro Leu Asp Asp 115 120 125 Glu Gln Leu Val Ser Tyr Tyr Ala Ala Val Cys Asp Ala Val Pro Ala 130 135 140 Ala Ala Val Val Val Tyr Asp Asn Thr Gly Val Phe Lys Gly Lys Ile 145 150 155 160 Ser Ser Ala Ala Tyr Ala Ala Leu Ala Glu Ile Pro Gln Ile Val Ala 165 170 175 Ser Lys His Leu Gly Val Leu Ser Gly Ser Asp Ala Tyr Ala Ser Asp 180 185 190 Leu Ala Ala Val Lys Gly Arg Phe Pro Leu Leu Pro Thr Ala Asp Asn 195 200 205 Trp Leu Pro Ser Leu Glu Ala Phe Pro Gly Glu Val Pro Ala Ala Trp 210 215 220 Ser Gly Asp Val Ala Cys Gly Pro Glu Pro Val Met Ala Leu Arg Arg 225 230 235 240 Ala Ile Ala Glu Gly Leu Trp Asp Asp Ala Arg Ala Val His Glu Asp 245 250 255 Ile Ala Trp Ala Thr Glu Pro Leu Phe Pro Gly Gly Asp Ile Ser Lys 260 265 270 Phe Met Pro Tyr Ser Ile Gln Ile Asp Arg Ala Glu Phe Glu Ala Ala 275 280 285 Gly Tyr Ile Val Pro Gly Pro Ser Arg His Pro Tyr Gly Thr Ala Pro 290 295 300 Ala Ala Tyr Leu Glu Gly Gly Ala Glu Val Gly Arg Arg Trp Ala Gly 305 310 315 320 Ile Arg Gln Lys Tyr Val Ala Thr Leu Ala Glu Pro 325 330 <210> 4 <211> 259 <212> PRT <213> Micromonospora sp. <400> 4 Met Lys Gly Tyr Thr Tyr Pro Leu Ser Pro Arg Gly Val Ala Asn Leu 1 5 10 15 Ala Gly Lys Pro Pro Trp His Tyr Val Gly Asp Ala Val Gly Val Glu 20 25 30 Phe Trp Thr Ser Pro Glu Ala Ala Ala Ala Ser Leu Pro Thr Gly Leu 35 40 45 Asp Pro Asp Pro Ala Asn Pro Gly His Gly Tyr Ala Val Phe Ile Asp 50 55 60 Trp Gln Phe Asn Gly Ala Thr Asp Asp Tyr Leu Asp Pro Pro Phe Ser 65 70 75 80 Gln Tyr Ser Glu Phe Leu Val Leu Leu Asp Ala Gln Trp Gln Gly Thr 85 90 95 Pro Val Ala Trp Cys Pro Phe Ile Trp Val Asp Asn Asp Ala Ser Leu 100 105 110 Ala Arg Gly Trp Val Gln Gly Phe Pro Lys Lys Met Gly Ser Ile Arg 115 120 125 Gln Thr Arg Ala Phe Ala Ile Asp Ser Pro Ala Ala Pro Thr Val Gly 130 135 140 Lys Gly Gly Arg Phe Ala Ala Val Met Ser Ala Gly Gly Arg Arg Leu 145 150 155 160 Ala Glu Thr Thr Val Thr Leu Asp Arg Thr Thr Asp Arg Leu Pro Ala 165 170 175 Leu Thr Arg Pro Leu Val Asn Leu Arg His Phe Pro Arg Leu Ser Ala 180 185 190 Gly Gln His Asp Asn Pro Ala Val His Glu Leu Thr Met Ser Val Leu 195 200 205 Ala Asn Leu Lys Phe Ala Asn Thr Trp Ile Gly Thr Gly Glu Leu Arg 210 215 220 Phe Leu Pro Ala Pro Arg Glu Glu Leu Ala Asp Leu Thr Pro Arg Arg 225 230 235 240 Val Gly Val Gly Phe Arg Gly Ser Leu Ser Tyr Thr Val Asn Asp Leu 245 250 255 Arg Ile Leu <210> 5 <211> 265 <212> PRT <213> Unknown <220> <223> Description of Unknown: Actinobacteria bacterium sequence <400> 5 Met Lys Gly Tyr Thr Val Pro Leu Ser Pro Arg Gly Val Ala Asn Leu 1 5 10 15 Ala Pro Ala Pro Pro Trp His Tyr Ala Gly Thr Val Val Gly Val Glu 20 25 30 Phe Phe Thr Asp Pro Ala Ala Ala Ala Ala Ala Leu Pro Glu Gly Leu 35 40 45 Ser Ser Asp Pro Asp Ser Ala Gly Arg Gly Val Ala Met Phe Ile Asp 50 55 60 Trp Gln Tyr Ser Ser Thr Asp Leu Glu Tyr Leu Asp Pro Ala Arg Ser 65 70 75 80 Gln Tyr Arg Glu Phe Leu Val Thr Leu Asp Ala His Tyr Tyr Gly Ala 85 90 95 Pro Val Ala Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ser Ala Met 100 105 110 Ala Arg Gly Trp Val Gln Gly Phe Pro Lys Lys Leu Gly Ala Val His 115 120 125 Gln Thr Arg Ala Tyr Ser Val Gly Gly Gln Gly Thr Pro Val Leu Gly 130 135 140 Pro Gly Gly Gln Phe Gly Ala Thr Ala Ser Ala Ala Gly Gln Arg Ile 145 150 155 160 Ala Glu Ala Lys Ile Thr Leu Glu Gln Ala Val Pro Asp Pro Ala Ala 165 170 175 Leu Met Ser Arg Pro Val Val Asn Leu Arg His Phe Pro Arg Leu Thr 180 185 190 Ala Gly Gln His His Lys Pro Ala Val His Glu Leu Val Met Ser Val 195 200 205 Leu Asp Gly Ala Ala Val Ser Asp Ala Trp Ala Gly Thr Ala Asp Leu 210 215 220 Ala Phe Leu Pro Ala Arg Gly Glu Glu Leu Ala Asp Leu Pro Ile Gln 225 230 235 240 Arg Thr Gly Arg Gly Phe His Phe Asp Leu Ala Tyr Thr Val Thr Asp 245 250 255 Leu Lys Thr Leu Ile Asp His Ser Asn 260 265 <210> 6 <211> 262 <212> PRT <213> Streptomyces gancidicus <400> 6 Met Leu Lys Gly Tyr Thr Val Pro Leu Ser Pro Lys Gly Glu Ala Asn 1 5 10 15 Ile Ala Pro Thr Pro Pro Trp His Tyr Ala Gly Asp Ile Val Gly Val 20 25 30 Glu Phe Phe Thr Glu Pro Ala Ala Ala Glu Ala Thr Leu Pro Glu Gly 35 40 45 Leu Asp Pro Asp Pro Asp Thr Ser Gly Arg Val Val Ala Phe Phe Val 50 55 60 Asp Trp Gln Phe Asn Gly Glu Arg Asp Glu Tyr Leu Asp Pro Val Arg 65 70 75 80 Ser Gln Tyr Arg Glu Phe Phe Val Leu Val Asp Ala Arg His Gln Gly 85 90 95 Arg Pro Val Ser Trp Cys Pro Tyr Ile Tyr Val Asp Asn His His Ala 100 105 110 Leu Ala Arg Gly Trp Ile Gln Gly Phe Pro Lys Lys Ala Gly Asn Val 115 120 125 His Gln Thr Arg Val Phe Ala Ser Pro Gly Lys Ala Ser Pro Thr Leu 130 135 140 Ser Pro Gly Ala Arg Phe Gly Ala Ser Val Ser Ser Asp Glu Arg Thr 145 150 155 160 Leu Ala Glu Ala Arg Val Thr Leu Glu Ala Pro Met Glu Asp Pro Ser 165 170 175 Ala Leu Leu Ser Arg Asp Thr Ile Asn Leu Arg His Phe Pro Thr Leu 180 185 190 Glu Ala Gly Arg Tyr Asp Lys Pro Ala Val His Glu Leu Val Arg Met 195 200 205 Asp Tyr Ala Asp Gln Gln Val Ala Asp Val Trp Thr Gly Thr Ser Glu 210 215 220 Ile Thr Leu Phe Pro Ala Val Gly Glu Glu Leu Ala Asp Leu Ala Pro 225 230 235 240 Val Arg Ser Gly Met Gly Phe Arg Ala Ser Met Ser Tyr Asn Val Thr 245 250 255 Gln Val Glu Pro Leu Leu 260 <210> 7 <211> 264 <212> PRT <213> Kutzneria sp. <400> 7 Met Leu Gly Tyr Ser Leu Pro Leu Ser Ala Asn Gly Thr Ala Asn Val 1 5 10 15 Val Pro Ala Pro Pro Trp His Tyr Ala Gly Asp Val Val Gly Val Glu 20 25 30 Phe Trp Thr Thr Pro Ala Ala Ala Ala Ala Thr Leu Pro Ser Gly Leu 35 40 45 Thr Pro Asp Pro Thr Thr Ser Gly His Ala Tyr Ala Leu Phe Val Asp 50 55 60 Trp Gln Trp Ala Gly Ser His Gln Glu Tyr Leu Asp Pro Val Arg Ser 65 70 75 80 Gln Tyr Ser Glu Phe Leu Ile Leu Met Asp Ala Gln Phe Gln Gly Arg 85 90 95 Ala Val Ala Trp Cys Pro Tyr Ile Trp Val Asp Asn Asp Ala Ala Leu 100 105 110 Ala Arg Gly Trp Phe Gln Gly Phe Pro Lys Lys Leu Gly Ala Ile Arg 115 120 125 Gln Thr Arg Ala Phe Ser Val Pro Gly Gln Ala Ser Pro Val Val Gly 130 135 140 Pro Gly Gly Gln Phe Gly Ala Ser Leu Ser Ala Ala Gly Arg Arg Leu 145 150 155 160 Ala Glu Ala Gln Ile Thr Leu Gln Ala Pro Ser Ala Thr Leu Pro Ala 165 170 175 Leu Gly Arg Pro Ile Val Asn Leu Arg His Phe Pro Arg Leu Ile Ala 180 185 190 Gly Gln Tyr Asp Asn Pro Ser Val His Glu Leu Thr Gln Ser Val Leu 195 200 205 Asp Thr Pro Val Val Gly Asn Asn Trp Thr Gly Thr Ser Thr Leu Asn 210 215 220 Phe Phe Thr Ala Pro Gly Glu Glu Leu Ala Asp Leu Gln Pro Val Arg 225 230 235 240 Thr Gly Ser Gly Phe Arg Gly Ser Leu Ser Tyr Thr Val Thr Thr Leu 245 250 255 Lys Met Leu Ser Gly Pro Asp Ala 260 <210> 8 <211> 265 <212> PRT <213> Streptomyces olivochromogenes <400> 8 Met Lys Gly Tyr Thr Val Pro Leu Ser Pro Arg Gly Ile Ala Asn Leu 1 5 10 15 Ala Pro Ala Pro Pro Trp His Tyr Ala Gly Thr Val Val Gly Val Glu 20 25 30 Phe Phe Thr Asp Pro Ala Ala Ala Ala Ala Thr Leu Pro Glu Gly Leu 35 40 45 Thr Pro Asp Pro Asp Ser Ala Gly Arg Gly Val Ala Met Phe Ile Asp 50 55 60 Trp Gln Tyr Ser Ser Thr Gly Leu Glu Tyr Leu Asp Pro Ala Arg Ser 65 70 75 80 Gln Tyr Arg Glu Phe Leu Leu Thr Leu Asp Ala His Tyr Asn Gly Thr 85 90 95 Pro Val Ala Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ser Ala Met 100 105 110 Ala Arg Gly Trp Val Gln Gly Phe Pro Lys Lys Leu Gly Ala Val His 115 120 125 Gln Thr Arg Ala Tyr Ser Val Gly Gly Pro Gly Thr Pro Val Leu Gly 130 135 140 Pro Gly Gly Gln Phe Gly Ala Thr Ala Ser Ala Ala Gly Gln Arg Ile 145 150 155 160 Ala Glu Ala Lys Val Thr Leu Glu Gln Pro Val Pro Asp Pro Ala Ala 165 170 175 Leu Met Ser Arg Pro Val Val Asn Leu Arg His Phe Pro Arg Leu Ala 180 185 190 Ala Gly Gln His Asp Lys Pro Ala Val His Glu Leu Val Met Ser Val 195 200 205 Leu Asp Gly Val Ala Val Ser Asp Ala Trp Ala Gly Thr Ala Asp Leu 210 215 220 Ala Phe Leu Pro Ala His Gly Glu Glu Leu Ala Asp Leu Pro Val Gln 225 230 235 240 Arg Thr Gly Arg Gly Phe His Phe Asp Leu Ala Tyr Thr Val Thr Asp 245 250 255 Leu Lys Thr Leu Ile Asp Arg Ser Asn 260 265 <210> 9 <211> 328 <212> PRT <213> Sphingobium xenophagum <400> 9 Met Ala Arg Thr Leu Met Lys Pro Asp Asp Val Lys Gly Ala Trp Ala 1 5 10 15 Ile Ile Pro Thr Pro Ala Lys Asp Asp Ala Ser Asp Trp Arg Ala Thr 20 25 30 Lys Thr Val Asp Leu Asp Glu Thr Ala Arg Val Val Asn Gly Leu Ile 35 40 45 Asp Ala Gly Ile Asn Gly Ile Leu Ser Met Gly Thr Leu Gly Glu Ala 50 55 60 Ala Thr Met Thr His Asp Glu Lys Leu Asp Phe Ile Lys Ala Leu Val 65 70 75 80 Asp Ala Ala Ala Gly Arg Val Pro Ile Phe Val Gly Thr Thr Cys Leu 85 90 95 Asn Thr Arg Asp Thr Ile Ala Leu Thr Arg Gln Ala Leu Asp Ile Gly 100 105 110 Ala Asp Gly Thr Met Leu Gly Val Pro Met Trp Cys Ala Pro Ser Val 115 120 125 Asp Val Ala Val Gln Phe Tyr Lys Asp Leu Ala Glu Ala Val Pro Glu 130 135 140 Met Asn Ile Ala Ile Tyr Ala Asn Pro Glu Ala Phe Lys Phe Asp Phe 145 150 155 160 Pro Arg Ser Phe Trp Ala Gln Val Ala Glu Ile Pro Gln Val Val Thr 165 170 175 Ala Lys Tyr Ile Gly Val Ala His Leu Leu Pro Asp Leu Ala Ala Ile 180 185 190 Arg Gly Arg Ile Lys Leu Leu Pro Ile Asp Phe Asp Tyr Tyr Gly Ala 195 200 205 Ala Arg Met Asp Glu Ser Ile Asp Ala Phe Trp Ser Ser Gly Ala Val 210 215 220 Cys Asp Pro Leu Val Thr Thr Thr Leu Arg Asp Leu Val Ser Gln Ala 225 230 235 240 Arg Ala Thr Gly Asp Trp Ser Ala Ala Arg Ala Phe Met Gly Arg Leu 245 250 255 Gly Pro Thr Ala Ala Pro Leu Phe Pro Asn Gly Ser Phe Lys Glu Phe 260 265 270 Ser Thr Tyr Asn Ile Ala Leu Glu Lys Ala Arg Met Asn Ala Gly Gly 275 280 285 Trp Met Asn Ala Gly Pro Val Arg Pro Pro Tyr His Leu Cys Pro Glu 290 295 300 Pro Tyr Leu Glu Gly Ala Arg Leu Ser Gly Arg Met Trp Ala Glu Leu 305 310 315 320 Gly Lys Ala Leu Ala Ala Glu Lys 325 <210> 10 <211> 332 <212> PRT <213> Alcaligenes faecalis <400> 10 Met Ala Lys Ser Gly Leu Leu Asn Ala Ser Asp Ile His Gly Val Trp 1 5 10 15 Ser Ile Leu Pro Thr Pro Ser Lys Pro Asp Ala Ser Asp Trp Arg Ala 20 25 30 Thr Asn Thr Val Asp Leu Asp Glu Thr Ala Arg Ala Val Glu Gly Leu 35 40 45 Ile Ala Ala Gly Ala Asn Gly Ile Leu Ser Met Gly Thr Leu Gly Glu 50 55 60 Cys Glu Ser Leu Thr Trp Glu Glu Lys Lys Val Phe Met Gln Thr Ile 65 70 75 80 Val Glu Thr Ala Arg Gly Arg Val Pro Val Phe Val Gly Thr Thr Thr 85 90 95 Leu Asn Thr Arg Asp Thr Ile Glu Gln Thr Arg Tyr Ala His Ser Ile 100 105 110 Gly Ala Asp Gly Thr Met Leu Gly Ile Pro Met Trp Cys Asn Pro Cys 115 120 125 Val Asp Met Ala Val Gln Tyr Tyr Lys Asp Val Ala Glu Ala Val Pro 130 135 140 Glu Met Asn Ile Ala Ile Tyr Ala Asn Thr Glu Ala Phe Lys Phe Asp 145 150 155 160 Phe Pro Arg Ala Phe Trp Ala Arg Val Ser Glu Ile Arg Gln Val Val 165 170 175 Ala Ala Lys Tyr Ile Gly Ile Glu Phe Leu Leu Gln Asp Leu His Leu 180 185 190 Thr Lys His Arg Met Lys Leu Leu Pro Leu Asp Tyr Gln Tyr Tyr Ala 195 200 205 Ala Ala Arg Met Asp Asp Phe Val Asp Ala Phe Trp Ser Ser Gly Thr 210 215 220 Val Cys Gly Pro Leu Val Ser Thr Thr Leu Arg Asp Lys Val Ile Ala 225 230 235 240 Ala Arg Arg Thr Lys Asp Trp Thr Asp Ala His Ala Phe Gln Gly Arg 245 250 255 Leu Val Lys Thr Ala Ala Pro Phe Pro Glu Asp Ser Phe Lys Thr Phe 260 265 270 Ser Ile Tyr Asn Val Ala Leu Glu Lys Gly Arg Ile Asp Ala Ala Gly 275 280 285 Trp Met Asn Ala Gly Pro Val Arg Pro Pro Tyr Asn Asp Ile Cys Pro 290 295 300 Ala Ser Tyr Leu Asp Ser Trp Lys Ala Ser Gly Gln Arg Trp Ala Glu 305 310 315 320 Leu His Lys Gln Leu Glu Thr Glu Ser Ser Gly Lys 325 330 <210> 11 <211> 328 <212> PRT <213> Novosphingobium aromaticivorans <400> 11 Met Ala Arg Glu Leu Leu Thr Ala Ala Asp Val Lys Gly Ala Trp Ala 1 5 10 15 Ile Val Pro Thr Pro Ala Lys Glu Gly Ala Ser Asp Trp Arg Ala Ala 20 25 30 Asp Thr Val Asn Val Glu Glu Ala Ala Arg Met Ile Asp Gly Leu Ile 35 40 45 Glu Ala Gly Val Asp Gly Ile Leu Ser Met Gly Thr Leu Gly Glu Ala 50 55 60 Ala Thr Met Thr Leu Asp Glu Lys Leu Val Phe Met Lys Thr Ile Val 65 70 75 80 Asp Thr Ala Ala Gly Arg Val Pro Val Phe Val Gly Thr Thr Cys Ile 85 90 95 Asn Thr Arg Asp Thr Ile Ala Leu Thr Arg Lys Ala Val Asp Ile Gly 100 105 110 Ala Thr Gly Thr Met Leu Gly Val Pro Met Trp Cys Ala Pro Ser Val 115 120 125 Asp Val Ala Val Gln Phe Tyr Arg Asp Val Ala Glu Ala Val Pro Asp 130 135 140 Ile Asn Ile Ala Ile Tyr Ala Asn Pro Glu Ala Phe Lys Phe Asp Phe 145 150 155 160 Pro Arg Thr Phe Trp Gly Gln Val Ala Glu Ile Pro Gln Val Val Thr 165 170 175 Ala Lys Tyr Ile Gly Val Gly Thr Leu Leu Pro Asp Leu Ala Ala Ile 180 185 190 Lys Gly Arg Ile Lys Leu Leu Pro Ile Asp Phe Asp Tyr Tyr Gly Ala 195 200 205 Ala Arg Met Asp Asp Ser Ile Asp Ala Phe Trp Thr Ser Gly Ala Val 210 215 220 Cys His Pro Leu Val Ser Thr Thr Leu Arg Asp Val Val Ala Ala Ala 225 230 235 240 Arg Ala Ser Gly Asp Trp Ser Ala Ala Lys Ala Phe Met Gly Arg Leu 245 250 255 Ala Pro Thr Ala Ala Thr Leu Phe Pro Asn Gly Ser Phe Lys Glu Phe 260 265 270 Ser Thr Tyr Asn Ile Pro Leu Glu Lys Ala Arg Met Thr Ala Gly Gly 275 280 285 Trp Met Asn Ala Gly Pro Cys Arg Pro Pro Tyr His Leu Cys Pro Glu 290 295 300 Asn Tyr Leu Glu Gly Ala Arg Asn Ser Gly Arg Met Trp Ala Glu Leu 305 310 315 320 Gly Lys Ala Leu Glu Ala Glu Arg 325 <210> 12 <211> 331 <212> PRT <213> Polymorphum gilvum <400> 12 Met Thr Arg Lys Leu Leu Thr Val Asp Asp Val Asn Gly Cys Trp Ala 1 5 10 15 Ile Met Pro Thr Pro Ser Lys Pro Gly Ala Ser Asp Pro Asn Ala Val 20 25 30 Asp Thr Val Asp Leu Glu Glu Thr Ala Arg Ala Ala Glu Ala Leu Val 35 40 45 Ala Ala Gly Val Asp Gly Ile Leu Ser Leu Gly Thr Phe Gly Glu Ala 50 55 60 Ala Thr Thr Thr Trp Glu Glu Lys Gln Ala Phe Met Arg Thr Leu Val 65 70 75 80 Glu Thr Val Arg Gly Arg Val Pro Val Phe Gly Gly Thr Thr Ser Leu 85 90 95 Asn Thr Arg Asp Thr Ile Arg Met Thr Arg Ala Ala Arg Glu Ile Gly 100 105 110 Val Asp Gly Val Met Leu Gly Leu Pro Met Trp Val Gln Pro Asp Leu 115 120 125 Ala Thr Ala Val Gln Phe Phe Arg Asp Val Ala Ser Ala Cys Pro Asp 130 135 140 Val Ala Ile Cys Ala Tyr Ala Asn Pro Glu Ala Phe Lys Phe Glu Phe 145 150 155 160 Pro Arg Ala Phe Trp Ala Gln Ile Ala Asp Ile Pro Gln Ile Val Ser 165 170 175 Ala Lys Tyr Ile His Thr Ala Gly Leu Tyr Ala Asp Leu Asn Leu Thr 180 185 190 Lys Arg Arg Ile Arg Leu Met Pro Leu Asp Val Asp Tyr Tyr Ala Ala 195 200 205 Ala Arg Ile Asp Pro Asp Ala Cys Thr Ala Phe Trp Thr Ser Gly Ala 210 215 220 Val Cys Gly Pro Ala Pro Ala Ile Gln Leu Arg Asp Leu Val Ser Lys 225 230 235 240 Ala Lys Lys Thr Gly Asp Trp Thr Gly Ala Lys Lys Leu Thr Asp Arg 245 250 255 Ile Gly Gln Thr Tyr Arg Thr Leu Phe Pro Asn Gly Ser Phe Lys Asp 260 265 270 Phe Ser Val Tyr Asn Ile Gly Ile Glu Lys Ala Arg Met Asp Ala Ala 275 280 285 Gly Trp Met Lys Ala Gly Pro Cys Arg Ala Pro Tyr Ser Leu Val Pro 290 295 300 Glu Pro Tyr Leu Glu Gly Ala Arg Glu Ser Gly Arg Gln Trp Ala Lys 305 310 315 320 Leu Ala Ala Glu Leu Ala Thr Glu Arg Ala Glu 325 330 <210> 13 <211> 333 <212> PRT <213> Burkholderia sp. <400> 13 Met Ile His Pro Lys Leu Arg Ile Asp Ala Ser Gly Ile Asn Gly Leu 1 5 10 15 Trp Pro Ile Leu Pro Thr Pro Ala Lys Pro Asn Ala Ser Asp Trp Arg 20 25 30 Glu Arg Ser Thr Val Asp Leu Asp Glu Thr Ala Arg Ile Val Glu Ser 35 40 45 Leu Ile Asp Ala Gly Val Asp Gly Leu Leu Ser Leu Gly Thr Tyr Gly 50 55 60 Glu Ala His Ser Leu Leu Trp Glu Glu Lys Lys Ala Phe Val Gly Cys 65 70 75 80 Val Leu Glu Thr Ile Arg Gly Arg Ile Pro Phe Phe Thr Gly Thr Thr 85 90 95 Ala Leu Asn Thr Arg Glu Val Val Glu Gln Thr Arg Ala Met His Asp 100 105 110 Met Gly Val Ser Gly Thr Met Leu Gly Val Pro Met Trp Cys Lys Thr 115 120 125 Asp Leu Ala Thr Ala Val Gln Phe Phe Arg Asp Val Thr Glu Ala Cys 130 135 140 Pro Asp Thr Ala Leu Ala Ile Tyr Ala Asn Thr Glu Ala Phe Lys Phe 145 150 155 160 Glu Phe Pro Arg Pro Phe Trp Ala Glu Ile Gly Lys Met Pro Gln Ala 165 170 175 Val Ala Cys Lys Tyr Leu Gly Ile Gly Met Leu Ala Val Asp Leu Glu 180 185 190 Leu Ala Pro Asn Met Arg Phe Leu Pro Asn Glu Gln Asp Tyr Tyr Ala 195 200 205 Ala Ala Arg Ile Asp Pro Glu Arg Val Thr Ala Phe Trp Ser Ser Gly 210 215 220 Ala Leu Cys Gly Pro Leu Pro Ala Leu Thr Leu Arg Asp Arg Val Ala 225 230 235 240 Arg Ala Lys Ser Ser Asn Asp Trp Thr Ser Ala Lys Glu Ile Ala Asp 245 250 255 Arg Met Arg Ala Cys Asp Val Gly Phe Phe Pro Lys Gly Glu Phe Ser 260 265 270 Glu Phe Ser Lys Phe Asn Ala Pro Leu Glu Lys Ala Arg Met Asn Thr 275 280 285 Ala Gly Tyr Val Asn Ala Gly Pro Cys Arg Pro Pro Tyr His Val Ile 290 295 300 Pro Gln Glu Tyr Leu Ala Gly Ala Glu Arg Ser Gly Arg Ala His Ala 305 310 315 320 Ala Leu Asn Ala Glu Leu Lys Gln Ala Glu His Ser Ile 325 330 <210> 14 <211> 330 <212> PRT <213> Paraburkholderia sartisoli <400> 14 Met Ser Lys Gln Arg Lys Gln Arg Leu Gly Thr Glu Asp Val Asn Gly 1 5 10 15 Ala Trp Val Ile Met Pro Thr Pro Ala Lys Pro Glu Ala Ser Asp Trp 20 25 30 Arg Ala Thr Asp Thr Val Asp Leu Asp Glu Thr Ala Arg Ile Val Glu 35 40 45 Ala Leu Ile Asp Ser Gly Val Asn Gly Ile Leu Ser Leu Gly Thr Phe 50 55 60 Gly Glu Cys Ala Thr Leu Thr Trp Glu Glu Lys Gln Ala Phe Ile Gly 65 70 75 80 Ala Val Val Glu Thr Thr Arg Gly Arg Val Pro Phe Phe Cys Gly Thr 85 90 95 Thr Ala Leu Asn Thr Arg Glu Val Val Arg Gln Thr Arg Ala Ala Leu 100 105 110 Asp Ile Gly Val Asp Gly Thr Met Leu Gly Val Pro Met Trp Ser Arg 115 120 125 Met Glu Val Pro Ala Ala Val Gln Phe Tyr Arg Asp Val Ala Glu Ala 130 135 140 Cys Pro Glu Ala Ala Ile Ala Val Tyr Ala Asn Ala Asp Ala Phe Lys 145 150 155 160 Phe Glu Phe Pro Arg Ala Phe Trp Ala Gln Val Ala Gln Ile Pro Gln 165 170 175 Val Val Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu Asp Leu 180 185 190 Thr Leu Ala Pro Gly Ile Arg Phe Leu Pro His Glu Asp Asp Tyr Tyr 195 200 205 Ala Ala Ala Arg Val Ala Pro Glu Arg Val Thr Ala Phe Trp Ser Ser 210 215 220 Gly Ala Met Cys Gly Pro Ala Thr Ala Ile Arg Leu Arg Asp Glu Val 225 230 235 240 Ala Lys Ala Lys Gln Thr Gly Asp Trp Arg Leu Ala Lys Glu Leu Ser 245 250 255 Asp Ala Met Arg Arg Ala Asp Ala Thr Leu Phe Pro Arg Gly Asp Phe 260 265 270 Ala Glu Phe Ser Lys Tyr Asn Ile Ala Ile Glu Lys Glu Arg Met Asn 275 280 285 Ala Ala Gly Trp Leu Arg Ala Gly Pro Cys Arg Pro Pro Tyr His Ile 290 295 300 Ala Pro Glu Glu Tyr Leu Asp Gly Ala Arg Gln Ser Gly Arg Ala Trp 305 310 315 320 Ala Glu Leu His Gln Gln Tyr Ser Asp Leu 325 330 <210> 15 <211> 332 <212> PRT <213> Pseudomonas sp. <400> 15 Met Met Ser Asp Met Val Lys Pro Arg Met Thr Ala Asp Asp Val Asn 1 5 10 15 Gly Val Trp Val Ile Met Pro Thr Pro Ala Lys Pro Asp Ala Ser Asp 20 25 30 Trp Arg Val Glu Asn Thr Val Asp Leu Asp Glu Thr Val Arg Ile Val 35 40 45 Glu Asn Leu Leu Ala Ser Gly Val Asn Gly Ile Met Ser Asn Gly Thr 50 55 60 Phe Gly Glu Cys Ala Thr Leu Thr Trp Asp Glu Lys Arg Asp Phe Ile 65 70 75 80 Ala Thr Val Ala Glu Thr Ile Lys Gly Arg Val Pro Phe Phe Cys Gly 85 90 95 Thr Thr Ala Leu His Thr Arg Glu Val Ile Arg Gln Thr Arg Glu Val 100 105 110 Met Arg Leu Gly Ala Asp Gly Val Met Leu Gly Leu Pro Met Trp Cys 115 120 125 Lys Met Glu Thr Pro Ser Ala Ile Gln Phe Tyr Arg Asp Val Ala Glu 130 135 140 Ala Val Pro Asp Ala Ala Ile Ala Val Tyr Ala Asn Pro Glu Ala Phe 145 150 155 160 Lys Tyr Glu Phe Pro Arg Glu Phe Trp Ala Gln Val Ser Glu Ile Pro 165 170 175 Gln Val Val Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu Asp 180 185 190 Leu Arg Leu Ala Ser Ser Ile Arg Phe Leu Pro His Glu Asp Asp Tyr 195 200 205 Tyr Ala Ala Ala Arg Ile Asn Pro Glu Arg Met Thr Ala Phe Trp Ser 210 215 220 Ser Ala Ala Met Cys Gly Pro Ala Thr Pro Leu Lys Leu Arg Asp Ala 225 230 235 240 Val Ala Asp Ala Lys Val Thr Gly Lys Trp Ser Val Ala Lys Ala Ile 245 250 255 Ser Asp Glu Met Arg Lys Ala Asp Ser Met Leu Phe Pro Lys Gly Asp 260 265 270 Phe Ser Glu Phe Ser Lys Tyr Asn Ile Gly Leu Glu Lys Ala Arg Met 275 280 285 Asp Glu Ala Gly Trp Leu Lys Ala Gly Pro Cys Arg Pro Pro Tyr His 290 295 300 Val Ile Pro Glu Met Tyr Leu Glu Gly Ala Arg Lys Ser Gly Arg Ala 305 310 315 320 Trp Ala Glu Leu His Ala Lys Tyr Ser Ala Glu Gly 325 330 <210> 16 <211> 331 <212> PRT <213> Comamonas thiooxydans <400> 16 Met Ala Lys Gln Lys Lys Ser Arg Met Thr Ala Glu Asp Ile His Gly 1 5 10 15 Ala Trp Val Ile Met Pro Thr Pro Ala Thr Pro Asp Ala Ser Asp Trp 20 25 30 Arg Val Gln His Thr Val Asp Leu Glu Glu Thr Ala Arg Ile Val Glu 35 40 45 Ala Leu Ile Ala Ala Gly Val Asn Gly Ile Phe Ser Asn Gly Thr Phe 50 55 60 Gly Glu Cys Ala Thr Leu Thr Trp Glu Glu Lys Arg Asp Phe Ile Ala 65 70 75 80 Thr Val Val Glu Thr Ala Arg Gly Arg Val Pro Phe Phe Cys Gly Thr 85 90 95 Thr Ala Leu His Thr Arg Glu Val Ile Arg Gln Thr Arg Glu Ala Met 100 105 110 Asp Ile Gly Ala Ser Gly Thr Met Leu Gly Val Pro Met Trp Cys Lys 115 120 125 Met Glu Val Pro Thr Ala Val Gln Phe Tyr Arg Asp Val Ala Glu Ala 130 135 140 Val Pro Glu Ala Ala Ile Ala Ile Tyr Ala Asn Pro Glu Ala Phe Lys 145 150 155 160 Phe Asp Phe Pro Arg Ser Phe Trp Ala Gln Val Ser Asn Ile Pro Gln 165 170 175 Val Ile Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu Asp Leu 180 185 190 Arg Leu Ala Pro Ser Ile Arg Phe Leu Pro His Glu Asp Asp Tyr Tyr 195 200 205 Ala Ala Ala Arg Ile Asp Pro Glu Arg Met Thr Ala Phe Trp Ser Ser 210 215 220 Gly Ala Met Cys Gly Pro Ala Thr Ala Ile Arg Leu Arg Asp Thr Val 225 230 235 240 Gly Ala Ala Lys Arg Ser Gly Asp Trp Thr Asp Ala Lys Ala Ile Ser 245 250 255 Asp Ala Met Arg Gln Ala Asp Ser Thr Leu Phe Pro Arg Gly Asp Phe 260 265 270 Ser Glu Phe Ser Lys Phe Asn Ile Gly Leu Glu Lys Ala Arg Met Asp 275 280 285 Ala Ala Gly Trp Leu Lys Ala Gly Pro Cys Arg Pro Pro Tyr His Ile 290 295 300 Val Pro Glu Glu His Leu Ala Gly Ala Arg Lys Ser Gly Glu Ala Trp 305 310 315 320 Ala Ala Leu His Ala Arg Tyr Ala Thr Leu Asp 325 330 <210> 17 <211> 270 <212> PRT <213> Unknown <220> <223> Description of Unknown: Verrucomicrobia bacterium sequence <400> 17 Met Asn Thr Ala Lys Leu Ile Gly Phe Asn Tyr Pro Leu Thr Pro Lys 1 5 10 15 Gly Lys Ser Thr Leu Asn Pro Pro Pro Pro Trp Tyr Tyr Ser Ser Asp 20 25 30 Phe Leu Asp Val Glu Phe Trp Ala Gln Pro Ala Ala Val Ala Ser Leu 35 40 45 Leu Pro Asn Gly Leu Glu Pro Asp Pro Ala Ala Asn Gly His Cys Asn 50 55 60 Ala Leu Phe Tyr Asp Trp Gln Phe Ser Gly Asp Asn Glu Glu Tyr Leu 65 70 75 80 Asp Pro Ala Arg Tyr Gln Tyr Arg Glu Phe Phe Ile Leu Val Asp Ala 85 90 95 Leu Phe Glu Gly Arg Ser Val Ser Tyr Cys Pro Tyr Ile Phe Val Asp 100 105 110 Asn Asp Ala Ala Leu Ala Arg Gly Trp Thr Gln Gly Tyr Pro Lys Arg 115 120 125 Leu Gly Gln Val Phe Gln Thr Arg Tyr Tyr Ala Ala Thr Ser Lys Ala 130 135 140 Gly Pro Ala Leu Ala Pro Gly Ser Lys Phe Ala Gly Ser Leu Thr Ala 145 150 155 160 Ala Gly Gln Leu Ile Ala Glu Ala Val Val Thr Leu Arg Gln Ala Val 165 170 175 Thr Asp Pro Ser Leu Leu Lys Gln Lys Pro Val Ile Asn Leu Leu His 180 185 190 Val Pro Arg Leu Ala Ala Asp Lys His Asp Lys Pro Ala Ile His Glu 195 200 205 Leu Val Glu Asn Val Pro Ser Ser Val Lys Ile Glu Gln Ala Trp Ile 210 215 220 Gly Glu Gly Ser Leu Thr Leu Pro Val Cys Arg Gly Glu Glu Ile Ser 225 230 235 240 Asp Leu Ala Pro Leu Arg Cys Gly Lys Gly Ile Arg Ala Ser Met Ala 245 250 255 Tyr Val Val Asp Asp Leu Lys Thr Leu Lys Asp Leu Arg Asn 260 265 270 <210> 18 <211> 267 <212> PRT <213> Dyella psychrodurans <400> 18 Met Lys Ser Asn Phe Phe Val Pro Met Thr Pro Arg Gly Leu Ser Asn 1 5 10 15 Ile Ser Pro Pro Pro Pro Trp His Tyr Ala Gly Asp Phe Leu Ile Ile 20 25 30 Asp Phe Trp Ala Arg Pro Asp Ala Val Ala Ser Leu Leu Pro Ala Glu 35 40 45 Leu Gln Pro Asp Val Lys Ala Glu Gly His Ala Gln Ala Tyr Phe Ile 50 55 60 Asp Trp Gln Tyr Thr Ala Ala His Asp Glu Phe Leu Asp Pro Ala Arg 65 70 75 80 Tyr Gln Tyr Arg Glu Phe Phe Val Leu Val Asp Ala Leu Phe Gln Gly 85 90 95 Lys Pro Val Ala Phe Cys Pro Tyr Ile Phe Val Asp Asn Asp Ala Ala 100 105 110 Ile Ala Arg Gly Trp Ala Gln Gly Phe Pro Lys Arg Tyr Gly Thr Ile 115 120 125 Leu Gln Thr Arg Leu Phe Ala Ala Ser Gly Pro Ala Ser Pro Lys Leu 130 135 140 Ala Pro Gly Gly Arg Phe Gly Ala Ser Ala Ser Thr Ala Gly Gln Arg 145 150 155 160 Ile Ala Arg Gly Leu Val Thr Leu Glu Lys Ala Val Thr Asp Pro Ala 165 170 175 Ala Leu Gly Ser Arg Pro Thr Ile Asn Leu Arg His Phe Pro Arg Leu 180 185 190 Ala Ala Gly Gln Trp Glu Arg Pro Ala Val His Glu Leu Val Glu Ser 195 200 205 Val Met Asp Asn Phe Thr Val Ala Asp Ala Trp Met Gly Lys Gly Glu 210 215 220 Leu Thr Leu Pro Glu Cys Glu Asn Glu Glu Leu Ser Asp Leu Ala Pro 225 230 235 240 Val Arg Cys Gly Asn Gly Tyr Arg Met Ser Val Ser Tyr Ser Val Thr 245 250 255 Asp Leu Lys Thr Leu Val Asp His Ser Ala Lys 260 265 <210> 19 <211> 269 <212> PRT <213> Paraburkholderia oxyphila <400> 19 Met Leu Lys Gly Tyr Met Ala Pro Leu Ser Pro Leu Gly Lys Ala Ser 1 5 10 15 Ile Asn Pro Pro Pro Pro Trp His Tyr Ser Gly Asp Val Ile Gly Ala 20 25 30 Glu Phe Trp Ala Glu Pro Glu Ala Thr Ala Ala Thr Leu Pro Pro Gly 35 40 45 Leu Asp Pro Asp Pro Ser Thr Ala Gly His Gly Val Val Leu Phe Ile 50 55 60 Asp Trp Gln Phe Thr Ala Gln Asp Asp Glu Phe Leu Asp Pro Ala Arg 65 70 75 80 Tyr Gln Tyr Arg Glu Cys Leu Phe Leu Val Asp Ala Val His Lys Gly 85 90 95 Thr Pro Val Met Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ala Ala 100 105 110 Leu Ala Arg Gly Trp Ala Gln Gly Phe Pro Lys Lys Leu Ala Ser Val 115 120 125 Tyr Gln Thr Arg Thr Phe Ala Ala Pro Ser Ala Ala Ala Ala Pro Val 130 135 140 Ala Ser Gly Ser Arg Phe Gly Ala Ser Leu Ser Ala His Gly Glu Arg 145 150 155 160 Leu Ala Glu Ala Arg Ile Thr Leu Arg Gln Pro Val Ala Asp Pro Lys 165 170 175 Ser Leu Leu Ala Arg Pro Thr Val Asn Arg Arg Tyr Phe Ala Ser Leu 180 185 190 Val Ala Gly Leu His Asp Lys Pro Ala Val Asp Glu Leu Val Leu Ser 195 200 205 Val Thr Asp Asn Leu Ser Val Ala Asp Ala Trp Ala Gly Asp Ala Glu 210 215 220 Leu Leu Phe Pro Asp Ala Arg Gly Glu Glu Ile Cys Ala Phe Gly Pro 225 230 235 240 Val Lys Val Gly Gly Gly Phe Arg Phe Ser Leu Ala Tyr Ser Val Thr 245 250 255 Asp Leu Lys Leu Leu Glu Asp Leu Thr Arg Leu Gly Lys 260 265 <210> 20 <211> 331 <212> PRT <213> Polymorphum gilvum <400> 20 Met Lys Arg Asp Met Leu Thr Val Asp Asp Val Thr Gly Cys Trp Ala 1 5 10 15 Ile Met Pro Thr Pro Ser Lys Pro Asn Ala Ser Asp Pro Ser Ala Thr 20 25 30 Asp Thr Val Asp Leu Asp Glu Thr Ala Arg Val Ala Glu Ala Leu Val 35 40 45 Ala Ala Gly Val Asp Gly Ile Leu Ser Leu Gly Thr Leu Gly Glu Cys 50 55 60 Ala Thr Thr Thr Trp Asp Glu Lys Gln Ala Tyr Met Arg Thr Leu Val 65 70 75 80 Glu Thr Leu Arg Gly Arg Ile Pro Val Phe Gly Gly Thr Thr Gly Leu 85 90 95 Asn Thr Arg Asp Ser Ile Ala Met Thr Arg Ala Ala Arg Glu Ile Gly 100 105 110 Val Asp Gly Val Met Leu Gly Leu Pro Met Trp Val Gln Pro Asp Val 115 120 125 Pro Thr Ala Val Gln Phe Tyr Arg Asp Val Ala Ala Ala Cys Pro Asp 130 135 140 Val Ala Ile Cys Val Tyr Ala Asn Pro Glu Ala Phe Lys Phe Glu Phe 145 150 155 160 Pro Arg Ala Phe Trp Ala Gln Ile Ala Glu Ile Pro Gln Val Val Ser 165 170 175 Ala Lys Tyr Ile Asn Ile Ala Ala Leu Tyr Thr Asp Leu Asn Leu Thr 180 185 190 Arg Arg Arg Ile Arg Leu Met Pro Leu Asp Val Asp Tyr Tyr Ala Ala 195 200 205 Ala Arg Val Asp Pro Glu Ala Cys Ser Ala Phe Trp Thr Ser Gly Ala 210 215 220 Val Cys Gly Pro Ala Pro Ala Ile Gln Leu Arg Asp Leu Val Leu Glu 225 230 235 240 Ala Arg Gln Ser Gly Asp Trp Ser Lys Ala Lys Ala Leu Thr Asp Arg 245 250 255 Ile Gly Met Thr Tyr Arg Thr Leu Phe Pro Asn Gly Ser Phe Lys Glu 260 265 270 Phe Ser Val Tyr Asn Ile Gly Ile Glu Lys Ala Arg Met Asp Ala Ala 275 280 285 Gly Trp Met Thr Ala Gly Pro Val Arg Pro Pro Tyr His Ile Val Pro 290 295 300 Glu Ala Ile Leu Glu Gly Gly Arg Glu Ser Gly Arg Gln Trp Ala Lys 305 310 315 320 Leu Ala Ala Glu Leu Glu Arg Glu Ala Gly Arg 325 330 <210> 21 <211> 270 <212> PRT <213> Pseudomonas sp. <400> 21 Met Thr Gln Ser Tyr Thr Thr Pro Leu Thr Pro Arg Gly Leu Ser Ser 1 5 10 15 Ile Ala Pro Pro Pro Pro Trp His Tyr Ser Gly Asp Phe Leu Val Val 20 25 30 Glu Phe Trp Ala Asp Pro Ile Ala Val Ala Asn Thr Leu Pro Ala Gly 35 40 45 Leu Thr Val Asp Ser Ala Ser Pro Gly His Ala Ser Ala Val Phe Val 50 55 60 Asp Trp Gln Phe Thr Gly Glu Asn Asp Glu Leu Leu Asp Pro Ala Arg 65 70 75 80 Tyr Gln Tyr Arg Glu Phe Phe Ile Leu Leu Asp Ala Leu His Glu Gly 85 90 95 Gln Pro Val Ser Tyr Cys Pro Tyr Ile Phe Val Asp Asn Asp Ser Ala 100 105 110 Leu Met Arg Gly Leu Ile Gln Gly Phe Pro Lys Arg Leu Gly Ala Val 115 120 125 His Gln Thr Arg Thr Phe Ser Ala Pro Ser Arg Ala Ala Ala Gln Val 130 135 140 Glu Pro Gly Ala Arg Phe Ala Ala Thr Ala Ser Thr Ala Gly Gln Arg 145 150 155 160 Ile Ala Arg Gly Glu Val Gln Leu Gln His Lys Ile Asp Asp Val Ser 165 170 175 Lys Leu Gly Phe Gly Ala Arg Pro Leu Ile Asn Leu Arg His Phe Pro 180 185 190 Arg Leu Ala Thr Gly Gln His Asn Asp Pro Ala Val His Glu Leu Val 195 200 205 Val Ser Val Met Asp Asn Pro Asn Ile Val Asp Ala Trp Ala Gly Glu 210 215 220 Gly Asn Leu Val Phe Pro Gln Ala Glu Gly Glu Glu Val Ser Asp Leu 225 230 235 240 Ala Pro Thr Arg Val Gly Ala Gly Phe Arg Ala Ser Met Ser Tyr Thr 245 250 255 Val Thr Asp Leu Lys Ala Leu Pro Asn Ala Thr Ile Glu Arg 260 265 270 <210> 22 <211> 267 <212> PRT <213> Afipia sp. <400> 22 Met Leu Arg Gly Phe Thr Val Pro Lys Ser Pro Phe Gly Gln Ala Ala 1 5 10 15 Leu Thr Pro Pro Pro Pro Trp His Tyr Ala Gly Asp Val Val Gly Val 20 25 30 Glu Phe Trp Thr Asp Pro Glu Ala Thr Ala Ala Thr Leu Pro Asn Gly 35 40 45 Leu Ser Pro Asp Pro Asn Ser Asn Gly His Ala Val Met Met Phe Leu 50 55 60 Asp Trp Gln Phe Thr Ala Gln Asp Asp Glu Tyr Leu Glu Pro Ala Arg 65 70 75 80 Tyr Gln Tyr Arg Glu Ala Phe Ile Leu Val Asp Ala Met Tyr Arg Asp 85 90 95 Glu Pro Val Met Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ala Ala 100 105 110 Leu Ala Arg Gly Trp Thr Gln Gly Phe Pro Lys Lys Met Gly Ser Ile 115 120 125 Phe Gln Thr Arg Ser Phe Ala Ala Ser Gly Pro Ala Ala Ala Pro Val 130 135 140 Ala Ser Gly Ser Arg Phe Gly Ala Ser Leu Ser Ala His Gly Gln Arg 145 150 155 160 Leu Ala Glu Ala Cys Val Thr Leu His Arg Pro Val Glu Asn Gly Leu 165 170 175 Ser Leu Leu Ser Arg Pro Thr Val Leu Leu Arg Tyr Phe Pro Arg Leu 180 185 190 Ala Ala Gly Tyr Gln Asp Lys Pro Ala Val Asn Glu Leu Ala Met Ser 195 200 205 Ile Thr Asp Asn Leu Thr Val Ala Gly Ala Trp Ile Gly Lys Gly Glu 210 215 220 Leu Asn Phe Pro Glu Ala Ser Gly Glu Glu Leu Asn Ala Leu Ala Pro 225 230 235 240 Lys Arg Ile Glu Ser Gly Phe Arg Tyr Ser Leu Ser Tyr Ser Val Ser 245 250 255 Asp Leu Lys Ile Leu Glu Asp His Gly Ser Gln 260 265 <210> 23 <211> 331 <212> PRT <213> Pseudomonas kilonensis <400> 23 Met Ser Thr Lys Arg Thr Leu Met Thr Ala Asn Asp Val Gln Gly Ala 1 5 10 15 Trp Ala Ile Met Pro Thr Ser Ala Lys Asp Gly Ser Glu Ser Trp Arg 20 25 30 Met Thr Asp Ser Leu Asp Leu Asp Ala Thr Val Ala Ala Ile Asn Gly 35 40 45 Leu Ile Asp Ser Gly Val Asp Gly Ile Leu Thr Met Gly Thr Tyr Gly 50 55 60 Glu Ala Ala Thr Leu Thr Val Asp Glu Lys Lys Arg Phe Met Ala Cys 65 70 75 80 Leu Val Glu Thr Val Ala Gly Arg Val Pro Cys Phe Val Gly Thr Thr 85 90 95 Thr Leu Asn Thr Arg Asp Thr Ile Glu Leu Thr Arg Tyr Ala Ala Asp 100 105 110 Leu Gly Ala Asp Gly Thr Met Leu Gly Leu Pro Met Trp Cys Ala Pro 115 120 125 Thr Leu Pro Ala Ala Val Arg Phe Tyr Arg Asp Val Ala Glu Ala Cys 130 135 140 Pro Asp Met Ala Gln Cys Ile Tyr Ala Asn Pro Glu Ala Phe Arg Phe 145 150 155 160 Asp Phe Pro Pro Pro Phe Trp Ala Gln Val Ala Asp Ile Pro Gln Val 165 170 175 Val Ser Ala Lys Phe Thr Ser Val Gly His Leu Ile Gln Asn Leu Glu 180 185 190 Ile Thr Arg Gly Lys Val Arg Ala Leu Pro Ile Glu Leu Asp Tyr Tyr 195 200 205 Ala Ala Thr Arg Val Asp Asp Asp Val Cys Ala Phe Trp Ser Ser Gly 210 215 220 Ala Val Cys Gly Pro Thr Pro Thr Ile Ala Leu Arg Asp Glu Ile Thr 225 230 235 240 Arg Ala Lys Thr Ser Gly Asp Trp Thr Lys Ala Lys Glu Leu Thr Asp 245 250 255 Lys Met Trp Ala Ala Val Thr Pro Met Phe Pro Ala Gly Gly Phe Arg 260 265 270 Glu Phe Ser Met Tyr Asn Ile Ala Ile Asp Lys Met Arg Met Gln Thr 275 280 285 Ala Gly Trp Met Arg Val Gly Pro Thr Arg Pro Pro Tyr Asp Met Met 290 295 300 Pro Asp His Ile Arg Gly Gly Ala Val Glu Ala Gly Lys Leu Trp Ala 305 310 315 320 Glu Leu Ala Lys Ala Thr Val Leu Ala Gly Ala 325 330 <210> 24 <211> 270 <212> PRT <213> Paraburkholderia hospita <400> 24 Met Ser Lys Gln Tyr Ala Val Pro Leu Ser Pro Arg Gly Leu Ser Ser 1 5 10 15 Ile Ala Pro Pro Pro Pro Trp His Tyr Ser Gly Asp Phe Leu Ile Val 20 25 30 Glu Phe Trp Ala Asp Pro Ala Ala Val Ala Ala Thr Leu Pro Ala Gly 35 40 45 Leu Ser Val Asp Pro Ser Ser Pro Gly His Ala Thr Ala Leu Phe Val 50 55 60 Asp Trp Gln Phe Thr Gly Gln Asn Asp Glu Leu Leu Asp Pro Ala Arg 65 70 75 80 Tyr Gln Tyr Arg Glu Phe Phe Leu Leu Val Asp Ala Leu Tyr Glu Gly 85 90 95 Gln Pro Val Ala Tyr Cys Pro Tyr Ile Phe Val Asp Asn Asp Ser Ala 100 105 110 Met Met Arg Gly Leu Ile Gln Gly Phe Pro Lys Arg Leu Gly Ala Val 115 120 125 His Gln Thr Arg Thr Phe Ala Ala Pro Ser Leu Ala Ala Ala Gln Val 130 135 140 Ala Pro Gly Ala Arg Phe Ala Ala Thr Ala Ser Thr Ala Gly Gln Arg 145 150 155 160 Ile Ala Arg Ala Glu Val Lys Leu Thr Gly Lys Val Asp Asp Pro Ser 165 170 175 Thr Val Ser Leu Ala Gly Arg Pro Ile Val Asn Leu Arg His Phe Pro 180 185 190 Arg Leu Ala Ala Gly Gln His Glu Thr Pro Ala Val His Glu Leu Val 195 200 205 Met Ser Ile Met Asp Asp Pro Arg Met Ala Asp Val Trp Ala Gly Glu 210 215 220 Gly Gln Leu Ser Leu Pro Val Ala Glu Gly Glu Glu Ile Ser Asp Leu 225 230 235 240 Ala Pro Val Arg Val Gly Ala Gly Tyr Arg Leu Ser Met Ser Tyr Thr 245 250 255 Val Thr Asp Leu Lys Thr Leu Ser Asp Gly Thr Gln Ala Ala 260 265 270 <210> 25 <211> 331 <212> PRT <213> Celeribacter persicus <400> 25 Met Lys Lys Pro Leu Leu Thr Val Asp Asp Val Thr Gly Cys Trp Ala 1 5 10 15 Ile Met Pro Thr Pro Ser Lys Pro Asn Gly Ser Asp Ile Asn Ala Thr 20 25 30 Asp Thr Val Asp Leu Asp Glu Thr Ala Arg Ala Ala Glu Ala Leu Val 35 40 45 Ala Ser Gly Val Asn Gly Ile Leu Ser Gln Gly Thr Phe Gly Glu Ala 50 55 60 Ala Thr Thr Thr Trp Glu Glu Lys Gln Ala Phe Leu Arg Thr Leu Val 65 70 75 80 Glu Thr Val Asp Gly Arg Val Pro Val Phe Gly Gly Thr Thr Ser Leu 85 90 95 Asn Thr Arg Asp Thr Ile Arg Met Thr Lys Ala Val Arg Glu Ile Gly 100 105 110 Val Asp Gly Val Met Leu Gly Pro Pro Met Trp Cys Gln Pro Asp Val 115 120 125 Pro Thr Ala Val Gln Phe Phe Arg Asp Val Ala Glu Ala Cys Pro Asp 130 135 140 Thr Ala Ile Cys Ala Tyr Ala Asn Pro Glu Ala Phe Lys Phe Asp Phe 145 150 155 160 Pro Arg Ala Phe Trp Ala Gln Ile Ala Glu Ile Pro Gln Val Val Ser 165 170 175 Ala Lys Tyr Met Asn Ile Ala Ala Leu Tyr Met Asp Leu Asn Leu Thr 180 185 190 Gly Arg Lys Ile Arg Leu Met Pro Leu Asp Met Asp Tyr Tyr Ala Ala 195 200 205 Ala Arg Met Asp Pro Glu Ala Cys Thr Ala Phe Trp Thr Ser Gly Ala 210 215 220 Ile Cys Gly Pro Glu Pro Val Ile Gln Leu Arg Asp Leu Val Ala Glu 225 230 235 240 Ala His Lys Thr Gly Asp Trp Gly Lys Ala Lys Ala Leu Thr Asp Arg 245 250 255 Ile Ala Ala Thr Tyr Arg Thr Leu Phe Pro Asn Gly Ser Phe Lys Glu 260 265 270 Phe Ser Val Tyr Asn Ile Gly Ile Glu Lys Ala Arg Ile Asp Ala Ala 275 280 285 Gly Trp Met Thr Ala Gly Pro Cys Arg Pro Pro Tyr His Val Ile Pro 290 295 300 Glu Pro Ile Leu Asp Gly Ala Arg Glu Ala Gly Leu Gln Trp Ala Lys 305 310 315 320 Leu Val Ser Ala Leu Glu Ser Glu Lys Thr Ala 325 330 <210> 26 <211> 334 <212> PRT <213> Pseudomonas stutzeri <400> 26 Met Ser Asn Lys Thr Met Lys Pro Ala Arg Leu Thr Ala Glu Asp Ile 1 5 10 15 His Gly Val Trp Ala Ile Met Pro Thr Pro Ala Thr Pro Asp Ala Ser 20 25 30 Asn Trp Arg Ser Thr Asn Thr Val Asp Leu Asn Glu Thr Ala Arg Ile 35 40 45 Val Glu Glu Leu Ile Ala Ala Gly Val Asn Gly Ile Leu Ser Met Gly 50 55 60 Thr Phe Gly Glu Cys Ala Thr Leu Thr Trp Glu Glu Lys Arg Asp Tyr 65 70 75 80 Val Ser Thr Ile Val Glu Thr Ile Arg Gly Arg Val Pro Tyr Phe Cys 85 90 95 Gly Thr Thr Ala Leu Asn Thr Arg Glu Val Ile Arg Gln Thr Arg Glu 100 105 110 Phe Met Asp Met Gly Ala Ser Gly Thr Met Leu Gly Val Pro Met Trp 115 120 125 Val Lys Met Asp Leu Pro Thr Ala Val Gln Phe Tyr Arg Asp Val Ala 130 135 140 Glu Ala Val Pro Glu Ala Ala Ile Ala Ile Tyr Ala Asn Pro Glu Ala 145 150 155 160 Phe Lys Phe Asp Phe Pro Arg Pro Phe Trp Ala Glu Met Ser Lys Ile 165 170 175 Pro Gln Val Val Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu 180 185 190 Asp Leu Lys Leu Ala Pro Asn Ile Arg Phe Leu Pro His Glu Asp Asp 195 200 205 Tyr Tyr Ala Ala Ala Arg Ile Asn Pro Glu Arg Met Thr Ala Phe Trp 210 215 220 Ser Ser Gly Ser Met Cys Gly Pro Ala Thr Ala Ile Met Leu Arg Asp 225 230 235 240 Ala Val Asp Gln Ala Lys Ser Ser Gly Asp Trp Ile Lys Ala Lys Ala 245 250 255 Ile Ser Asp Asp Met Arg Ala Ala Asp Ser Thr Leu Phe Pro Arg Gly 260 265 270 Asp Phe Ser Glu Phe Ser Lys Tyr Asn Ile Gly Leu Glu Lys Ala Arg 275 280 285 Met Asp Ala Ala Gly Trp Leu Thr Ala Gly Pro Cys Arg Pro Pro Tyr 290 295 300 Asn Ile Val Pro Glu Asp Tyr Ile Ala Gly Ala Leu Lys Ser Gly Lys 305 310 315 320 Ala Trp Ala Ala Leu His Ala Lys Tyr Ser Lys Glu Leu Lys 325 330 <210> 27 <211> 272 <212> PRT <213> Unknown <220> <223> Description of Unknown: Candidatus Rokubacteria bacterium sequence <400> 27 Met Leu Lys Gly Phe Asn Tyr Pro Leu Thr Pro Lys Gly Lys Ser Thr 1 5 10 15 Leu Asn Pro Ser Pro Pro Trp His Tyr Ser Ala Asp Phe Leu Asp Ile 20 25 30 Glu Phe Trp Ser Glu Pro Ser Ala Val Thr Ala Val Leu Pro Ala Gly 35 40 45 Leu Asp Pro Asp Pro Ala Ala Asn Gly His Gly His Ala Leu Phe Tyr 50 55 60 Asp Trp Gln Phe Ala Gly Glu Asn Glu Glu Tyr Leu Asp Pro Ala Arg 65 70 75 80 Tyr Gln Tyr Arg Glu Phe Phe Leu Leu Val Asp Ala Leu Tyr Glu Gly 85 90 95 Gln Pro Ile Ser Tyr Cys Pro Tyr Ile Phe Val Asp Asn Asp Ala Ala 100 105 110 Ile Ala Arg Gly Trp Thr Gln Gly Tyr Pro Lys Arg Leu Gly Gln Val 115 120 125 Phe Gln Thr Arg Tyr Tyr Ala Ala Thr Gly Lys Ala Gly Pro Ala Leu 130 135 140 Ala Pro Gly Ser Lys Phe Ala Gly Ser Leu Thr Ala Gly Gly Gln Arg 145 150 155 160 Leu Ala Glu Ala Leu Val Thr Leu Lys Glu Pro Val Thr Asp Pro Ala 165 170 175 Leu Leu Lys Gln Arg Pro Ile Val Asn Leu Leu His Tyr Pro Gln Leu 180 185 190 Ala Ala Asp Lys Gln Asp Glu Pro Ala Ile His Gln Leu Val Glu Asn 195 200 205 Val Pro His Asp Leu Lys Ile Glu Gln Ala Trp Ile Gly Asp Gly Ser 210 215 220 Leu Thr Leu Pro Val Cys Arg Ser Glu Glu Leu Ser Asp Leu Ala Pro 225 230 235 240 Val Arg Cys Gly Lys Gly Ile Arg Ala Ser Met Ala Tyr Ile Val Asp 245 250 255 Asp Leu Lys Thr Leu Lys Asp Leu Thr Lys Gly Phe Ser Leu Leu Ala 260 265 270 <210> 28 <211> 262 <212> PRT <213> Streptomyces sp. <400> 28 Met Leu Lys Gly Tyr Thr Val Pro Leu Ser Pro Lys Gly Glu Ala Asn 1 5 10 15 Ile Ala Pro Thr Pro Pro Trp His Tyr Ala Gly Asp Ile Val Gly Val 20 25 30 Glu Phe Phe Thr Glu Pro Ser Ala Ala Glu Ala Thr Leu Pro Glu Gly 35 40 45 Leu Asp Pro Asp Pro Asp Thr Ser Gly Arg Val Val Ala Phe Phe Val 50 55 60 Asp Trp Gln Phe Asn Gly Glu Gln Asp Glu Tyr Leu Asp Pro Val Arg 65 70 75 80 Ser Gln Tyr Arg Glu Phe Phe Val Leu Val Asp Ala Arg His Gln Gly 85 90 95 Arg Pro Val Ser Trp Cys Pro Tyr Ile Tyr Val Asp Asn His His Ala 100 105 110 Leu Ala Arg Gly Trp Ile Gln Gly Phe Pro Lys Lys Ala Gly Asn Val 115 120 125 His Gln Thr Arg Val Phe Ala Ser Pro Gly Lys Ala Ser Pro Thr Leu 130 135 140 Ser Pro Gly Ala Arg Phe Gly Ala Thr Val Ser Ser Asp Glu Arg Thr 145 150 155 160 Leu Ala Glu Ala Arg Val Thr Leu Glu Ala Pro Met Glu Asp Pro Ser 165 170 175 Ala Leu Leu Ala Arg Asp Thr Ile Asn Leu Arg His Phe Pro Thr Leu 180 185 190 Glu Val Gly Lys Tyr Asp Lys Pro Ala Val His Glu Leu Val Arg Met 195 200 205 Asp Tyr Ala Asp Gln Gln Val Ala Asp Val Trp Thr Gly Thr Ser Glu 210 215 220 Ile Thr Leu Phe Pro Ala Val Gly Glu Glu Leu Ala Asp Leu Ala Pro 225 230 235 240 Val Arg Pro Gly Met Gly Phe Arg Ala Ser Met Ser Tyr Asn Val Thr 245 250 255 Gln Val Glu Pro Leu Gly 260 <210> 29 <211> 268 <212> PRT <213> Paraburkholderia oxyphila <400> 29 Met Asn Lys Pro Tyr Ala Val Pro Leu Ser Pro Arg Gly Leu Ser Ser 1 5 10 15 Ile Ala Pro Pro Pro Pro Trp His Tyr Ala Gly Asp Phe Ile Leu Val 20 25 30 Glu Phe Trp Ala Asp Pro Ala Ala Ala Ala Ala Val Leu Pro Lys Gly 35 40 45 Leu Ser Leu Asp Pro Ala Ser Pro Gly His Ala Thr Ala Leu Phe Ile 50 55 60 Asp Trp Gln Phe Thr Gly Ser Asn Asp Glu Met Leu Asp Pro Ala Arg 65 70 75 80 Tyr Gln Tyr Arg Glu Phe Phe Val Leu Val Asp Ala Leu His Glu Gly 85 90 95 Lys Pro Val Ser Phe Cys Pro Tyr Ile Phe Val Asp Asn Asp Ser Ala 100 105 110 Met Met Arg Gly Leu Ile Gln Gly Phe Pro Lys Arg Tyr Gly Gln Ile 115 120 125 His Gln Thr Arg Thr Phe Ala Ala Leu Ser Pro Ala Ala Ala Pro Val 130 135 140 Thr Ala Gly Thr Arg Phe Ala Ala Thr Ala Ser Ala Ala Gly Gln Arg 145 150 155 160 Leu Ala His Ala Glu Val Lys Leu Glu Ala Ala Val Gln Asp Val Ser 165 170 175 Lys Leu Gly Ile Ala Gly Arg Pro Val Val Asn Gln Arg Tyr Phe Pro 180 185 190 Arg Leu Ala Ala Gly Gln His Asp Thr Pro Ala Val Asn Glu Leu Val 195 200 205 Leu Ser Ile Met Asp Asn Ala Gln Ile Ala Asp Val Trp Ala Gly Glu 210 215 220 Gly Lys Leu Thr Phe Pro Phe Ala Gln Gly Glu Glu Ile Ala Asp Leu 225 230 235 240 Gln Pro Val Arg Val Gly Ala Gly Phe Arg Gly Ser Met Ala Tyr Ser 245 250 255 Val Thr Asp Leu Lys Thr Leu Val Asp His Thr Lys 260 265 <210> 30 <211> 266 <212> PRT <213> Agrobacterium rhizogenes <400> 30 Met Leu Lys Gly Phe Thr Leu Pro Lys Ser Pro Phe Gly Gln Ala Ala 1 5 10 15 Leu Thr Pro Pro Pro Pro Trp His Tyr Ser Gly Asp Val Ile Gly Val 20 25 30 Glu Phe Arg Thr Asp Pro Ser Ala Thr Ala Ala Thr Leu Pro Asn Gly 35 40 45 Leu Ser Pro Asp Pro Lys Ser Asn Gly His Ala Val Met Met Phe Val 50 55 60 Asp Trp Gln Phe Thr Ala Gln Asn Asp Glu Tyr Leu Asp Pro Ala Arg 65 70 75 80 Tyr Arg Tyr Arg Glu Ala Phe Val Leu Leu Asp Ala Val Tyr Arg Asn 85 90 95 Ala Pro Val Met Trp Cys Pro Tyr Val Phe Val Asp Asn Asp Ala Ala 100 105 110 Leu Ala Arg Gly Trp Thr Gln Gly Phe Pro Lys Lys Ile Gly Ser Ile 115 120 125 Phe Gln Thr Arg Thr Tyr Ala Ala Ala Ser Pro Ala Ala Ala Pro Val 130 135 140 Ala Pro Gly Gly Arg Phe Gly Ala Ser Leu Ser Ala His Gly Gln Arg 145 150 155 160 Leu Ala Glu Ala Arg Ile Thr Leu Gln Glu Pro Val Glu Asp Gly Leu 165 170 175 Ser Leu Leu Ser Arg Pro Thr Val Leu Leu Arg Tyr Phe Pro Arg Leu 180 185 190 Ala Ala Gly Tyr Gln Asp Lys Pro Ala Val Asn Glu Leu Thr Met Ala 195 200 205 Ile Thr Asp Asn Leu Thr Val Ala Asp Ala Trp Ile Gly Asp Gly Glu 210 215 220 Leu Asn Leu Pro Glu Val His Gly Glu Glu Leu His Gly Leu Ala Pro 225 230 235 240 Ile Ala Ile Glu Ser Gly Phe Arg Tyr Ser Leu Ser Tyr Ser Val Thr 245 250 255 Asp Leu Lys Ile Leu Glu Asp His Ala Ser 260 265 <210> 31 <211> 262 <212> PRT <213> Escherichia coli <400> 31 Met Glu Asn Ser Phe Lys Ala Ala Leu Lys Ala Gly Arg Pro Gln Ile 1 5 10 15 Gly Leu Trp Leu Gly Leu Ser Ser Ser Tyr Ser Ala Glu Leu Leu Ala 20 25 30 Gly Ala Gly Phe Asp Trp Leu Leu Ile Asp Gly Glu His Ala Pro Asn 35 40 45 Asn Val Gln Thr Val Leu Thr Gln Leu Gln Ala Ile Ala Pro Tyr Pro 50 55 60 Ser Gln Pro Val Val Arg Pro Ser Trp Asn Asp Pro Val Gln Ile Lys 65 70 75 80 Gln Leu Leu Asp Val Gly Thr Gln Thr Leu Leu Val Pro Met Val Gln 85 90 95 Asn Ala Asp Glu Ala Arg Glu Ala Val Arg Ala Thr Arg Tyr Pro Pro 100 105 110 Ala Gly Ile Arg Gly Val Gly Ser Ala Leu Ala Arg Ala Ser Arg Trp 115 120 125 Asn Arg Ile Pro Asp Tyr Leu Gln Lys Ala Asn Asp Gln Met Cys Val 130 135 140 Leu Val Gln Ile Glu Thr Arg Glu Ala Met Lys Asn Leu Pro Gln Ile 145 150 155 160 Leu Asp Val Glu Gly Val Asp Gly Val Phe Ile Gly Pro Ala Asp Leu 165 170 175 Ser Ala Asp Met Gly Tyr Ala Gly Asn Pro Gln His Pro Glu Val Gln 180 185 190 Ala Ala Ile Glu Gln Ala Ile Val Gln Ile Arg Glu Ser Gly Lys Ala 195 200 205 Pro Gly Ile Leu Ile Ala Asn Glu Gln Leu Ala Lys Arg Tyr Leu Glu 210 215 220 Leu Gly Ala Leu Phe Val Ala Val Gly Val Asp Thr Thr Leu Leu Ala 225 230 235 240 Arg Ala Ala Glu Ala Leu Ala Ala Arg Phe Gly Ala Gln Ala Thr Ala 245 250 255 Val Lys Pro Gly Val Tyr 260 <210> 32 <211> 302 <212> PRT <213> Escherichia coli <400> 32 Met Pro Gln Ser Ala Leu Phe Thr Gly Ile Ile Pro Pro Val Ser Thr 1 5 10 15 Ile Phe Thr Ala Asp Gly Gln Leu Asp Lys Pro Gly Thr Ala Ala Leu 20 25 30 Ile Asp Asp Leu Ile Lys Ala Gly Val Asp Gly Leu Phe Phe Leu Gly 35 40 45 Ser Gly Gly Glu Phe Ser Gln Leu Gly Ala Glu Glu Arg Lys Ala Ile 50 55 60 Ala Arg Phe Ala Ile Asp His Val Asp Arg Arg Val Pro Val Leu Ile 65 70 75 80 Gly Thr Gly Gly Thr Asn Ala Arg Glu Thr Ile Glu Leu Ser Gln His 85 90 95 Ala Gln Gln Ala Gly Ala Asp Gly Ile Val Val Ile Asn Pro Tyr Tyr 100 105 110 Trp Lys Val Ser Glu Ala Asn Leu Ile Arg Tyr Phe Glu Gln Val Ala 115 120 125 Asp Ser Val Thr Leu Pro Val Met Leu Tyr Asn Phe Pro Ala Leu Thr 130 135 140 Gly Gln Asp Leu Thr Pro Ala Leu Val Lys Thr Leu Ala Asp Ser Arg 145 150 155 160 Ser Asn Ile Ile Gly Ile Lys Asp Thr Ile Asp Ser Val Ala His Leu 165 170 175 Arg Ser Met Ile His Thr Val Lys Gly Ala His Pro His Phe Thr Val 180 185 190 Leu Cys Gly Tyr Asp Asp His Leu Phe Asn Thr Leu Leu Leu Gly Gly 195 200 205 Asp Gly Ala Ile Ser Ala Ser Gly Asn Phe Ala Pro Gln Val Ser Val 210 215 220 Asn Leu Leu Lys Ala Trp Arg Asp Gly Asp Val Ala Lys Ala Ala Gly 225 230 235 240 Tyr His Gln Thr Leu Leu Gln Ile Pro Gln Met Tyr Gln Leu Asp Thr 245 250 255 Pro Phe Val Asn Val Ile Lys Glu Ala Ile Val Leu Cys Gly Arg Pro 260 265 270 Val Ser Thr His Val Leu Pro Pro Ala Ser Pro Leu Asp Glu Pro Arg 275 280 285 Lys Ala Gln Leu Lys Thr Leu Leu Gln Gln Leu Lys Leu Cys 290 295 300 <210> 33 <211> 297 <212> PRT <213> Escherichia coli <400> 33 Met Ala Thr Asn Leu Arg Gly Val Met Ala Ala Leu Leu Thr Pro Phe 1 5 10 15 Asp Gln Gln Gln Ala Leu Asp Lys Ala Ser Leu Arg Arg Leu Val Gln 20 25 30 Phe Asn Ile Gln Gln Gly Ile Asp Gly Leu Tyr Val Gly Gly Ser Thr 35 40 45 Gly Glu Ala Phe Val Gln Ser Leu Ser Glu Arg Glu Gln Val Leu Glu 50 55 60 Ile Val Ala Glu Glu Ala Lys Gly Lys Ile Lys Leu Ile Ala His Val 65 70 75 80 Gly Cys Val Ser Thr Ala Glu Ser Gln Gln Leu Ala Ala Ser Ala Lys 85 90 95 Arg Tyr Gly Phe Asp Ala Val Ser Ala Val Thr Pro Phe Tyr Tyr Pro 100 105 110 Phe Ser Phe Glu Glu His Cys Asp His Tyr Arg Ala Ile Ile Asp Ser 115 120 125 Ala Asp Gly Leu Pro Met Val Val Tyr Asn Ile Pro Ala Leu Ser Gly 130 135 140 Val Lys Leu Thr Leu Asp Gln Ile Asn Thr Leu Val Thr Leu Pro Gly 145 150 155 160 Val Gly Ala Leu Lys Gln Thr Ser Gly Asp Leu Tyr Gln Met Glu Gln 165 170 175 Ile Arg Arg Glu His Pro Asp Leu Val Leu Tyr Asn Gly Tyr Asp Glu 180 185 190 Ile Phe Ala Ser Gly Leu Leu Ala Gly Ala Asp Gly Gly Ile Gly Ser 195 200 205 Thr Tyr Asn Ile Met Gly Trp Arg Tyr Gln Gly Ile Val Lys Ala Leu 210 215 220 Lys Glu Gly Asp Ile Gln Thr Ala Gln Lys Leu Gln Thr Glu Cys Asn 225 230 235 240 Lys Val Ile Asp Leu Leu Ile Lys Thr Gly Val Phe Arg Gly Leu Lys 245 250 255 Thr Val Leu His Tyr Met Asp Val Val Ser Val Pro Leu Cys Arg Lys 260 265 270 Pro Phe Gly Pro Val Asp Glu Lys Tyr Leu Pro Glu Leu Lys Ala Leu 275 280 285 Ala Gln Gln Leu Met Gln Glu Arg Gly 290 295 <210> 34 <211> 256 <212> PRT <213> Escherichia coli <400> 34 Met Asn Asn Asp Val Phe Pro Asn Lys Phe Lys Ala Ala Leu Ala Ala 1 5 10 15 Lys Gln Val Gln Ile Gly Cys Trp Ser Ala Leu Ser Asn Pro Ile Ser 20 25 30 Thr Glu Val Leu Gly Leu Ala Gly Phe Asp Trp Leu Val Leu Asp Gly 35 40 45 Glu His Ala Pro Asn Asp Ile Ser Thr Phe Ile Pro Gln Leu Met Ala 50 55 60 Leu Lys Gly Ser Ala Ser Ala Pro Val Val Arg Val Pro Thr Asn Glu 65 70 75 80 Pro Val Ile Ile Lys Arg Leu Leu Asp Ile Gly Phe Tyr Asn Phe Leu 85 90 95 Ile Pro Phe Val Glu Thr Lys Glu Glu Ala Glu Leu Ala Val Ala Ser 100 105 110 Thr Arg Tyr Pro Pro Glu Gly Ile Arg Gly Val Ser Val Ser His Arg 115 120 125 Ala Asn Met Phe Gly Thr Val Ala Asp Tyr Phe Ala Gln Ser Asn Lys 130 135 140 Asn Ile Thr Ile Leu Val Gln Ile Glu Ser Gln Gln Gly Val Asp Asn 145 150 155 160 Val Asp Ala Ile Ala Ala Thr Glu Gly Val Asp Gly Ile Phe Val Gly 165 170 175 Pro Ser Asp Leu Ala Ala Ala Leu Gly His Leu Gly Asn Ala Ser His 180 185 190 Pro Asp Val Gln Lys Ala Ile Gln His Ile Phe Asn Arg Ala Ser Ala 195 200 205 His Gly Lys Pro Ser Gly Ile Leu Ala Pro Val Glu Ala Asp Ala Arg 210 215 220 Arg Tyr Leu Glu Trp Gly Ala Thr Phe Val Ala Val Gly Ser Asp Leu 225 230 235 240 Gly Val Phe Arg Ser Ala Thr Gln Lys Leu Ala Asp Thr Phe Lys Lys 245 250 255 <210> 35 <211> 213 <212> PRT <213> Escherichia coli <400> 35 Met Lys Asn Trp Lys Thr Ser Ala Glu Ser Ile Leu Thr Thr Gly Pro 1 5 10 15 Val Val Pro Val Ile Val Val Lys Lys Leu Glu His Ala Val Pro Met 20 25 30 Ala Lys Ala Leu Val Ala Gly Gly Val Arg Val Leu Glu Val Thr Leu 35 40 45 Arg Thr Glu Cys Ala Val Asp Ala Ile Arg Ala Ile Ala Lys Glu Val 50 55 60 Pro Glu Ala Ile Val Gly Ala Gly Thr Val Leu Asn Pro Gln Gln Leu 65 70 75 80 Ala Glu Val Thr Glu Ala Gly Ala Gln Phe Ala Ile Ser Pro Gly Leu 85 90 95 Thr Glu Pro Leu Leu Lys Ala Ala Thr Glu Gly Thr Ile Pro Leu Ile 100 105 110 Pro Gly Ile Ser Thr Val Ser Glu Leu Met Leu Gly Met Asp Tyr Gly 115 120 125 Leu Lys Glu Phe Lys Phe Phe Pro Ala Glu Ala Asn Gly Gly Val Lys 130 135 140 Ala Leu Gln Ala Ile Ala Gly Pro Phe Ser Gln Val Arg Phe Cys Pro 145 150 155 160 Thr Gly Gly Ile Ser Pro Ala Asn Tyr Arg Asp Tyr Leu Ala Leu Lys 165 170 175 Ser Val Leu Cys Ile Gly Gly Ser Trp Leu Val Pro Ala Asp Ala Leu 180 185 190 Glu Ala Gly Asp Tyr Asp Arg Ile Thr Lys Leu Ala Arg Glu Ala Val 195 200 205 Glu Gly Ala Lys Leu 210 <210> 36 <211> 205 <212> PRT <213> Escherichia coli <400> 36 Met Gln Trp Gln Thr Lys Leu Pro Leu Ile Ala Ile Leu Arg Gly Ile 1 5 10 15 Thr Pro Asp Glu Ala Leu Ala His Val Gly Ala Val Ile Asp Ala Gly 20 25 30 Phe Asp Ala Val Glu Ile Pro Leu Asn Ser Pro Gln Trp Glu Gln Ser 35 40 45 Ile Pro Ala Ile Val Asp Ala Tyr Gly Asp Lys Ala Leu Ile Gly Ala 50 55 60 Gly Thr Val Leu Lys Pro Glu Gln Val Asp Ala Leu Ala Arg Met Gly 65 70 75 80 Cys Gln Leu Ile Val Thr Pro Asn Ile His Ser Glu Val Ile Arg Arg 85 90 95 Ala Val Gly Tyr Gly Met Thr Val Cys Pro Gly Cys Ala Thr Ala Thr 100 105 110 Glu Ala Phe Thr Ala Leu Glu Ala Gly Ala Gln Ala Leu Lys Ile Phe 115 120 125 Pro Ser Ser Ala Phe Gly Pro Gln Tyr Ile Lys Ala Leu Lys Ala Val 130 135 140 Leu Pro Ser Asp Ile Ala Val Phe Ala Val Gly Gly Val Thr Pro Glu 145 150 155 160 Asn Leu Ala Gln Trp Ile Asp Ala Gly Cys Ala Gly Ala Gly Leu Gly 165 170 175 Ser Asp Leu Tyr Arg Ala Gly Gln Ser Val Glu Arg Thr Ala Gln Gln 180 185 190 Ala Ala Ala Phe Val Lys Ala Tyr Arg Glu Ala Val Gln 195 200 205 <210> 37 <211> 301 <212> PRT <213> Azotobacter vinelandii <400> 37 Met Pro Ala Pro Val Leu Ala Ala Thr Ser Pro Gly Ala Gly Arg Ala 1 5 10 15 Ile His Leu Ile Asn Pro Ala Met Pro Ala Phe Arg Ala Ala Phe Glu 20 25 30 Glu Thr Leu Met Lys Met Pro His Asn Ala Phe Lys Ala Ala Leu Gln 35 40 45 Arg Pro Glu Thr Gln Tyr Gly Ile Trp Ala Gly Phe Ala Ser Gly Tyr 50 55 60 Ala Ala Glu Ile Val Ala Gly Thr Gly Tyr Asp Trp Met Leu Ile Asp 65 70 75 80 Gly Glu His Ala Pro Asn Ser Val Pro Thr Ile Leu Ala Gln Leu Gln 85 90 95 Ser Val Ala Pro Tyr Pro Thr Gln Pro Val Val Arg Pro Val Cys Gly 100 105 110 Asp Pro Val Leu Ile Lys Gln Leu Leu Asp Ile Gly Ala Gln Thr Leu 115 120 125 Met Val Pro Met Val Glu Ser Ala Glu Gln Ala Arg Ala Leu Val Arg 130 135 140 Ala Met Arg Tyr Pro Pro His Gly Ile Arg Gly Val Gly Gly Gly Leu 145 150 155 160 Ala Arg Ala Thr Arg Trp Asp Gly Val Pro Asp Tyr Leu Asn Thr Ala 165 170 175 His Glu Glu Leu Cys Leu Ile Val Gln Val Glu Ser Arg Ala Gly Val 180 185 190 Glu Asn Val Glu Ala Ile Ala Ala Val Glu Gly Val Asp Ala Val Phe 195 200 205 Ile Gly Pro Ala Asp Leu Ser Ile Gly Leu Gly His Pro Gly Asp Pro 210 215 220 Gly His Pro Gln Val Gln Glu Leu Ile His His Ala Ile Glu Ala Thr 225 230 235 240 Arg Ala Ala Gly Lys Ala Cys Gly Ile Leu Ala Pro His Glu Glu Asp 245 250 255 Ala Arg Arg Tyr Arg Glu Trp Gly Cys Arg Phe Ile Ala Val Ala Ile 260 265 270 Asp Ile Ser Leu Leu Arg Gln Gly Ala Leu Ala Gly Leu Ala Arg Phe 275 280 285 Arg Asp Thr Pro Ala Ser Asp Ala Pro Ser Arg Thr Tyr 290 295 300 <210> 38 <211> 312 <212> PRT <213> Corynebacterium glutamicum <400> 38 Met Ala Ser Ala Thr Phe Thr Gly Val Ile Pro Pro Val Met Thr Pro 1 5 10 15 Leu His Ala Asp Gly Ser Val Asp Val Glu Ser Leu Arg Lys Leu Val 20 25 30 Asp His Leu Ile Asn Gly Gly Val Asp Gly Leu Phe Ala Leu Gly Ser 35 40 45 Ser Gly Glu Ala Ala Phe Leu Thr Arg Ala Gln Arg Lys Leu Ala Leu 50 55 60 Thr Thr Ile Ile Glu His Thr Ala Gly Arg Val Pro Val Thr Ala Gly 65 70 75 80 Val Ile Glu Thr Thr Thr Ala Arg Val Ile Glu Leu Val Glu Asp Ala 85 90 95 Leu Glu Ala Gly Ala Glu Gly Leu Val Ala Thr Ala Pro Phe Tyr Thr 100 105 110 Arg Thr His Asp Val Glu Ile Glu Glu His Phe Arg Lys Ile His Ala 115 120 125 Ala Ala Pro Glu Leu Pro Leu Phe Ala Tyr Asn Ile Pro Val Ser Val 130 135 140 His Ser Asn Leu Asn Pro Val Met Leu Leu Thr Leu Ala Lys Asp Gly 145 150 155 160 Val Leu Ala Gly Thr Lys Asp Ser Ser Gly Asn Asp Gly Ala Ile Arg 165 170 175 Ser Leu Ile Glu Ala Arg Asp Asp Ala Gly Leu Thr Glu Gln Phe Lys 180 185 190 Ile Leu Thr Gly Ser Glu Thr Thr Val Asp Phe Ala Tyr Leu Ala Gly 195 200 205 Ala Asp Gly Val Val Pro Gly Leu Gly Asn Val Asp Pro Ala Ala Tyr 210 215 220 Ala Ala Leu Ala Lys Leu Cys Leu Asp Gly Lys Trp Ala Glu Ala Ala 225 230 235 240 Ala Leu Gln Lys Arg Ile Asn His Leu Phe His Ile Val Phe Val Gly 245 250 255 Asp Thr Ser His Met Ser Gly Ser Ser Ala Gly Leu Gly Gly Phe Lys 260 265 270 Thr Ala Leu Ala His Leu Gly Ile Ile Glu Ser Asn Ala Met Ala Val 275 280 285 Pro His Gln Ser Leu Ser Asp Glu Glu Thr Ala Arg Ile His Ala Ile 290 295 300 Val Asp Glu Phe Leu Tyr Thr Ala 305 310 <210> 39 <211> 298 <212> PRT <213> Campylobacter jejuni <400> 39 Met Asp Lys Asn Ile Ile Ile Gly Ala Met Thr Ala Leu Ile Thr Pro 1 5 10 15 Phe Lys Asn Gly Lys Val Asp Glu Gln Ser Tyr Ala Arg Leu Ile Lys 20 25 30 Arg Gln Ile Glu Asn Gly Ile Asp Ala Val Val Pro Val Gly Thr Thr 35 40 45 Gly Glu Ser Ala Thr Leu Thr His Glu Glu His Arg Thr Cys Ile Glu 50 55 60 Ile Ala Val Glu Thr Cys Lys Glu Thr Lys Val Lys Val Leu Ala Gly 65 70 75 80 Ala Gly Ser Asn Ala Thr His Glu Ala Val Gly Leu Ala Lys Phe Ala 85 90 95 Lys Glu His Gly Ala Asp Gly Ile Leu Ser Val Ala Pro Tyr Tyr Asn 100 105 110 Lys Pro Thr Gln Gln Gly Leu Tyr Glu His Tyr Lys Ala Ile Ala Gln 115 120 125 Ser Val Asp Ile Pro Val Leu Leu Tyr Asn Val Pro Gly Arg Thr Gly 130 135 140 Cys Glu Ile Ser Thr Asp Thr Ile Ile Lys Leu Phe Arg Asp Cys Glu 145 150 155 160 Asn Ile Tyr Gly Val Lys Glu Ala Ser Gly Asn Ile Asp Lys Cys Val 165 170 175 Asp Leu Leu Ala His Glu Pro Arg Met Met Leu Ile Ser Gly Glu Asp 180 185 190 Ala Ile Asn Tyr Pro Ile Leu Ser Asn Gly Gly Lys Gly Val Ile Ser 195 200 205 Val Thr Ser Asn Leu Leu Pro Asp Met Ile Ser Thr Leu Thr His Phe 210 215 220 Ala Leu Asp Glu Asn Tyr Lys Glu Ala Lys Lys Ile Asn Asp Glu Leu 225 230 235 240 Tyr Asn Ile Asn Lys Ile Leu Phe Cys Glu Ser Asn Pro Ile Pro Ile 245 250 255 Lys Thr Ala Met Tyr Ile Ala Gly Leu Ile Glu Ser Leu Glu Phe Arg 260 265 270 Leu Pro Leu Cys Pro Pro Ser Lys Glu Asn Phe Ala Lys Ile Glu Glu 275 280 285 Val Met Lys Lys Tyr Lys Ile Lys Gly Phe 290 295 <210> 40 <211> 297 <212> PRT <213> Caldanaerobacter subterraneus <400> 40 Met Pro Val Phe Lys Gly Ser Cys Val Ala Ile Val Thr Pro Phe Thr 1 5 10 15 Glu Asn Gly Val Asn Phe Asp Lys Leu Gly Glu Leu Ile Glu Trp His 20 25 30 Ile Lys Glu Gly Thr Asp Ala Ile Leu Ile Cys Gly Thr Thr Gly Glu 35 40 45 Ala Ser Thr Met Thr Asp Glu Glu Gln Lys Glu Ala Ile Lys Phe Thr 50 55 60 Val Glu Lys Val Ala Lys Arg Ile Pro Val Ile Ala Gly Thr Gly Ser 65 70 75 80 Asn Asn Thr Ala His Ala Ile Glu Leu Ser Glu Tyr Ala Gln Ser Val 85 90 95 Gly Ala Asp Ala Leu Leu Val Ile Thr Pro Tyr Tyr Asn Lys Thr Thr 100 105 110 Gln Lys Gly Leu Val Ala His Phe Thr Glu Ile Ala Arg His Val Asp 115 120 125 Ile Pro Ile Ile Ile Tyr Asn Val Pro Ser Arg Thr Ser Leu Asn Met 130 135 140 Leu Pro Glu Thr Tyr Leu Glu Val Lys Lys Lys Ala Glu Asn Val Val 145 150 155 160 Gly Val Lys Glu Ala Ser Gly Asp Ile Ser Gln Ile Ala Glu Ile Ala 165 170 175 Arg Ile Met Gly Lys Ser Phe Glu Ile Tyr Ser Gly Asn Asp Asp Gln 180 185 190 Val Ile Pro Ile Met Ser Leu Gly Gly Leu Gly Val Ile Ser Val Thr 195 200 205 Ala Asn Ile Ile Pro Ala Lys Ile His Glu Met Thr Thr Ala Tyr Leu 210 215 220 Asn Gly Asp Ile Glu Lys Ala Arg Asp Met Gln Leu Glu Leu Asn Pro 225 230 235 240 Leu Asn Lys Ala Leu Phe Ile Glu Thr Asn Pro Ile Pro Val Lys Thr 245 250 255 Ala Met Asn Leu Met Gly Phe Gly Val Gly Pro Leu Arg Leu Pro Leu 260 265 270 Val Glu Met Ser Glu Lys Asn Leu Glu Tyr Leu Lys Ser Val Leu Arg 275 280 285 Gln Tyr Gly Leu Leu Lys Glu Glu Asn 290 295 <210> 41 <211> 310 <212> PRT <213> Scheffersomyces stipitis <400> 41 Met Thr Ile Ser Ala Ala Leu Pro Lys Arg Gly Val Tyr Thr Pro Val 1 5 10 15 Pro Thr Phe Phe Lys Lys Asp Leu His Thr Ile Asp Tyr Asp Ser Gln 20 25 30 Ile Glu His Ala Lys Phe Leu Gln Gln Asn Gly Ile Thr Gly Leu Val 35 40 45 Leu Leu Gly Ser Thr Gly Glu Asn Ser His Leu Thr Arg Lys Glu Arg 50 55 60 Ile Glu Leu Val Ser Thr Ile His Glu Glu Leu Pro Asp Phe Pro Leu 65 70 75 80 Met Ala Gly Val Ala Gln Asn Ser Val Glu Asp Ala Ile Glu Glu Ile 85 90 95 Leu Gln Leu Lys Asn Ala Gly Ala Gln His Ala Leu Val Leu Pro Ser 100 105 110 Ser Tyr Phe Gly Ala Ser Ile Lys Gln Gln Gly Ile Ile Asp Trp Tyr 115 120 125 Thr Glu Val Ala Asp Asn Ala Ser Leu Pro Val Leu Ile Tyr Val Tyr 130 135 140 Pro Gly Val Ser Asn Asn Ile Ser Ile Asp Pro Arg Thr Ile Lys Lys 145 150 155 160 Leu Ser Ala His Pro Asn Ile Val Gly Ala Lys Ile Ser His Gly Asp 165 170 175 Val Ser His His Ala Ile Ile Gly Leu Asp Gln Glu Ile Ala Ala Asn 180 185 190 Gln Phe Ile Thr Leu Thr Gly Leu Gly Gln Ile Leu Leu Pro Val Leu 195 200 205 Val Val Gly Ile Gln Gly Thr Val Asp Ala Leu Cys Gly Ala Phe Pro 210 215 220 Lys Ile Tyr Val Lys Leu Leu Glu Asn Tyr Asp Lys Gly Asp Leu Arg 225 230 235 240 Ala Ala Ala Glu Leu Gln Leu Val Ile Ser Arg Ala Glu Glu Leu Val 245 250 255 Val Lys Phe Gly Val Val Gly Ile Lys Lys Ala Ile His Phe Ala Thr 260 265 270 Gly Ile Gly Glu Thr Tyr Leu Gly Arg Ala Pro Leu Thr Gln Asp Val 275 280 285 Asn Asp Ala Asp Trp Lys Ser Tyr Asn Asp Tyr Leu Leu Gly Ile Val 290 295 300 Ser Val Glu Ser Thr Leu 305 310 <210> 42 <211> 288 <212> PRT <213> Sulfolobus acidocaldarius <400> 42 Met Glu Ile Ile Ser Pro Ile Ile Thr Pro Phe Asp Lys Gln Gly Lys 1 5 10 15 Val Asn Val Asp Ala Leu Lys Thr His Ala Lys Asn Leu Leu Glu Lys 20 25 30 Gly Ile Asp Ala Ile Phe Val Asn Gly Thr Thr Gly Leu Gly Pro Ala 35 40 45 Leu Ser Lys Asp Glu Lys Arg Gln Asn Leu Asn Ala Leu Tyr Asp Val 50 55 60 Thr His Lys Leu Ile Phe Gln Val Gly Ser Leu Asn Leu Asn Asp Val 65 70 75 80 Met Glu Leu Val Lys Phe Ser Asn Glu Met Asp Ile Leu Gly Val Ser 85 90 95 Ser His Ser Pro Tyr Tyr Phe Pro Arg Leu Pro Glu Lys Phe Leu Ala 100 105 110 Lys Tyr Tyr Glu Glu Ile Ala Arg Ile Ser Ser His Ser Leu Tyr Ile 115 120 125 Tyr Asn Tyr Pro Ala Ala Thr Gly Tyr Asp Ile Pro Pro Ser Ile Leu 130 135 140 Lys Ser Leu Pro Val Lys Gly Ile Lys Asp Thr Asn Gln Asp Leu Ala 145 150 155 160 His Ser Leu Glu Tyr Lys Leu Asn Leu Pro Gly Val Lys Val Tyr Asn 165 170 175 Gly Ser Asn Thr Leu Ile Tyr Tyr Ser Leu Leu Ser Leu Asp Gly Val 180 185 190 Val Ala Ser Phe Thr Asn Phe Ile Pro Glu Val Ile Val Lys Gln Arg 195 200 205 Asp Leu Ile Lys Gln Gly Lys Leu Asp Asp Ala Leu Arg Leu Gln Glu 210 215 220 Leu Ile Asn Arg Leu Ala Asp Ile Leu Arg Lys Tyr Gly Ser Ile Ser 225 230 235 240 Ala Ile Tyr Val Leu Val Asn Glu Phe Gln Gly Tyr Asp Val Gly Tyr 245 250 255 Pro Arg Pro Pro Ile Phe Pro Leu Thr Asp Glu Glu Ala Leu Ser Leu 260 265 270 Lys Arg Glu Ile Glu Pro Leu Lys Arg Lys Ile Gln Glu Leu Val His 275 280 285 <210> 43 <211> 294 <212> PRT <213> Saccharolobus solfataricus <400> 43 Met Pro Glu Ile Ile Thr Pro Ile Ile Thr Pro Phe Thr Lys Asp Asn 1 5 10 15 Arg Ile Asp Lys Glu Lys Leu Lys Ile His Ala Glu Asn Leu Ile Arg 20 25 30 Lys Gly Ile Asp Lys Leu Phe Val Asn Gly Thr Thr Gly Leu Gly Pro 35 40 45 Ser Leu Ser Pro Glu Glu Lys Leu Glu Asn Leu Lys Ala Val Tyr Asp 50 55 60 Val Thr Asn Lys Ile Ile Phe Gln Val Gly Gly Leu Asn Leu Asp Asp 65 70 75 80 Ala Ile Arg Leu Ala Lys Leu Ser Lys Asp Phe Asp Ile Val Gly Ile 85 90 95 Ala Ser Tyr Ala Pro Tyr Tyr Tyr Pro Arg Met Ser Glu Lys His Leu 100 105 110 Val Lys Tyr Phe Lys Thr Leu Cys Glu Val Ser Pro His Pro Val Tyr 115 120 125 Leu Tyr Asn Tyr Pro Thr Ala Thr Gly Lys Asp Ile Asp Ala Lys Val 130 135 140 Ala Lys Glu Ile Gly Cys Phe Thr Gly Val Lys Asp Thr Ile Glu Asn 145 150 155 160 Ile Ile His Thr Leu Asp Tyr Lys Arg Leu Asn Pro Asn Met Leu Val 165 170 175 Tyr Ser Gly Ser Asp Met Leu Ile Ala Thr Val Ala Ser Thr Gly Leu 180 185 190 Asp Gly Asn Val Ala Ala Gly Ser Asn Tyr Leu Pro Glu Val Thr Val 195 200 205 Thr Ile Lys Lys Leu Ala Met Glu Arg Lys Ile Asp Glu Ala Leu Lys 210 215 220 Leu Gln Phe Leu His Asp Glu Val Ile Glu Ala Ser Arg Ile Phe Gly 225 230 235 240 Ser Leu Ser Ser Asn Tyr Val Leu Thr Lys Tyr Phe Gln Gly Tyr Asp 245 250 255 Leu Gly Tyr Pro Arg Pro Pro Ile Phe Pro Leu Asp Asp Glu Glu Glu 260 265 270 Arg Gln Leu Ile Lys Lys Val Glu Gly Ile Arg Ala Lys Leu Val Glu 275 280 285 Leu Lys Ile Leu Lys Glu 290 <210> 44 <211> 290 <212> PRT <213> Sulfurisphaera tokodaii <400> 44 Met Asp Ile Val Thr Pro Ile Leu Thr Pro Phe Thr Lys Glu Gly Lys 1 5 10 15 Ile Asp Val Glu Lys Leu Lys Ala His Ala Lys Phe Leu Ile Asp Asn 20 25 30 Gly Ile Asp Leu Leu Phe Val Asn Gly Thr Thr Gly Leu Gly Pro Ala 35 40 45 Leu Ser Lys Glu Glu Lys Leu Thr Thr Leu Lys Thr Ile Tyr Asp Val 50 55 60 Thr Asn Lys Val Ile Phe Gln Val Gly Ser Leu Asn Ile Asn Asp Val 65 70 75 80 Ile Asp Leu Val Lys Ala Ser Lys Asp Phe Asp Ile Val Gly Ile Ala 85 90 95 Ser Tyr Pro Pro Phe Tyr Phe Pro Arg Leu Pro Glu Lys Phe Leu Leu 100 105 110 Lys Tyr Phe Thr Thr Ile Ala Asn Tyr Ser Pro His Ser Leu Tyr Ile 115 120 125 Tyr Asn Tyr Pro Leu Ala Thr Gly Tyr Asp Ile Ser Ala Lys Ile Val 130 135 140 Tyr Gln Met Lys Asp Leu Ile Thr Gly Leu Lys Asp Thr Asn Gln Asp 145 150 155 160 Leu Ser His Ser Leu Glu Tyr Lys Ile Leu Met Pro Asn Leu Lys Val 165 170 175 Tyr Asn Gly Ser Asp Ser Leu Val Phe Tyr Ser Leu Thr Ser Leu Asp 180 185 190 Gly Ser Val Thr Ala Ala Ser Asn Tyr Leu Pro His Val Met Lys Lys 195 200 205 Met Lys Glu His Ile Thr Ser Gly Gln Val Ser Lys Ala Ile Glu Leu 210 215 220 Gln Lys Leu Ile Asn Lys Ala Leu Asp Ile Ser Arg Lys Tyr Gly Gln 225 230 235 240 Leu Ser Ala Ile Tyr Tyr Leu Val Lys Glu Phe Leu Gly Tyr Asp Val 245 250 255 Gly Tyr Pro Arg Gly Pro Ile Phe Pro Leu Glu Glu Asp Glu Val Lys 260 265 270 Ala Leu Leu Ser Glu Ile Gln Pro Val Lys Lys Glu Ile Glu Arg Ala 275 280 285 Val Ser 290 <210> 45 <211> 327 <212> PRT <213> Escherichia coli <400> 45 Met Ala Thr Arg Ile Glu Phe His Lys His Gly Gly Pro Glu Val Leu 1 5 10 15 Gln Ala Val Glu Phe Thr Pro Ala Asp Pro Ala Glu Asn Glu Ile Gln 20 25 30 Val Glu Asn Lys Ala Ile Gly Ile Asn Phe Ile Asp Thr Tyr Ile Arg 35 40 45 Ser Gly Leu Tyr Pro Pro Pro Ser Leu Pro Ser Gly Leu Gly Thr Glu 50 55 60 Ala Ala Gly Ile Val Ser Lys Val Gly Ser Gly Val Lys His Ile Lys 65 70 75 80 Ala Gly Asp Arg Val Val Tyr Ala Gln Ser Ala Leu Gly Ala Tyr Ser 85 90 95 Ser Val His Asn Ile Ile Ala Asp Lys Ala Ala Ile Leu Pro Ala Ala 100 105 110 Ile Ser Phe Glu Gln Ala Ala Ala Ser Phe Leu Lys Gly Leu Thr Val 115 120 125 Tyr Tyr Leu Leu Arg Lys Thr Tyr Glu Ile Lys Pro Asp Glu Gln Phe 130 135 140 Leu Phe His Ala Ala Ala Gly Gly Val Gly Leu Ile Ala Cys Gln Trp 145 150 155 160 Ala Lys Ala Leu Gly Ala Lys Leu Ile Gly Thr Val Gly Thr Ala Gln 165 170 175 Lys Ala Gln Ser Ala Leu Lys Ala Gly Ala Trp Gln Val Ile Asn Tyr 180 185 190 Arg Glu Glu Asp Leu Val Glu Arg Leu Lys Glu Ile Thr Gly Gly Lys 195 200 205 Lys Val Arg Val Val Tyr Asp Ser Val Gly Arg Asp Thr Trp Glu Arg 210 215 220 Ser Leu Asp Cys Leu Gln Arg Arg Gly Leu Met Val Ser Phe Gly Asn 225 230 235 240 Ser Ser Gly Ala Val Thr Gly Val Asn Leu Gly Ile Leu Asn Gln Lys 245 250 255 Gly Ser Leu Tyr Val Thr Arg Pro Ser Leu Gln Gly Tyr Ile Thr Thr 260 265 270 Arg Glu Glu Leu Thr Glu Ala Ser Asn Glu Leu Phe Ser Leu Ile Ala 275 280 285 Ser Gly Val Ile Lys Val Asp Val Ala Glu Gln Gln Lys Tyr Pro Leu 290 295 300 Lys Asp Ala Gln Arg Ala His Glu Ile Leu Glu Ser Arg Ala Thr Gln 305 310 315 320 Gly Ser Ser Leu Leu Ile Pro 325 <210> 46 <211> 327 <212> PRT <213> Salmonella enterica <400> 46 Met Ala Thr Arg Ile Glu Phe His Lys His Gly Gly Pro Glu Val Leu 1 5 10 15 Gln Thr Val Glu Phe Thr Pro Ala Glu Pro Ala Glu His Glu Ile Gln 20 25 30 Val Glu Asn Lys Ala Ile Gly Ile Asn Phe Ile Asp Thr Tyr Ile Arg 35 40 45 Ser Gly Leu Tyr Pro Pro Pro Ser Leu Pro Ala Gly Leu Gly Thr Glu 50 55 60 Ala Ala Gly Val Val Ser Lys Val Gly Asn Gly Val Glu His Ile Arg 65 70 75 80 Val Gly Asp Arg Val Val Tyr Ala Gln Ser Thr Leu Gly Ala Tyr Ser 85 90 95 Ser Val His Asn Val Thr Ala Asp Lys Ala Ala Ile Leu Pro Asp Ala 100 105 110 Ile Ser Phe Glu Gln Ala Ala Ala Ser Phe Leu Lys Gly Leu Thr Val 115 120 125 Phe Tyr Leu Leu Arg Lys Thr Tyr Glu Val Lys Pro Asp Glu Pro Phe 130 135 140 Leu Phe His Ala Ala Ala Gly Gly Val Gly Leu Ile Ala Cys Gln Trp 145 150 155 160 Ala Lys Ala Leu Gly Ala Lys Leu Ile Gly Thr Val Gly Ser Ala Gln 165 170 175 Lys Ala Gln Arg Ala Leu Asp Ala Gly Ala Trp Gln Val Ile Asn Tyr 180 185 190 Arg Glu Glu Ser Ile Val Glu Arg Val Lys Glu Ile Thr Gly Gly Lys 195 200 205 Lys Val Arg Val Val Tyr Asp Ser Val Gly Lys Asp Thr Trp Glu Ala 210 215 220 Ser Leu Asp Cys Leu Gln Arg Arg Gly Leu Met Val Ser Phe Gly Asn 225 230 235 240 Ala Ser Gly Pro Val Thr Gly Val Asn Leu Gly Ile Leu Asn Gln Lys 245 250 255 Gly Ser Leu Tyr Ala Thr Arg Pro Ser Leu Gln Gly Tyr Ile Thr Thr 260 265 270 Arg Glu Glu Leu Thr Glu Ala Ser Asn Glu Leu Phe Ser Leu Ile Ala 275 280 285 Ser Gly Val Ile Lys Val Asp Val Ala Glu Asn Gln Arg Tyr Ala Leu 290 295 300 Lys Asp Ala Arg Arg Ala His Glu Val Leu Glu Ser Arg Ala Thr Gln 305 310 315 320 Gly Ser Ser Leu Leu Ile Pro 325 <210> 47 <211> 354 <212> PRT <213> Cupriavidus necator <400> 47 Met Pro Arg His Gly Cys Leu Thr Ile Val Thr Val Ala Pro Met Ile 1 5 10 15 Ala Ala Arg Ala Gly His Asp Asn Gln Glu Thr Ala Leu Ala Lys Ala 20 25 30 Ile Arg Met Tyr Glu Thr Gly Gly Pro Glu Val Leu Arg Tyr Glu Asp 35 40 45 Ala Glu Val Gly Asp Pro Gly Pro Gly Glu Val Arg Ile Arg His Ala 50 55 60 Ala Val Gly Leu Asn Tyr Ala Asp Thr Tyr Phe Arg Asn Gly Thr Tyr 65 70 75 80 Pro Val Pro Leu Pro Gly Gly Met Gly Val Glu Ala Ala Gly Val Val 85 90 95 Gln Ala Val Gly Pro Gly Val Thr His Val Ala Glu Gly Asp Arg Val 100 105 110 Thr Tyr Thr Gly Phe Ile Asn Thr Leu Gly Ala Tyr Ser Thr Glu Arg 115 120 125 Leu Val Pro Ala Ala Pro Leu Ile Arg Leu Pro Glu Ala Ile Ser Phe 130 135 140 Glu Thr Ala Ala Ala Met Thr Met Arg Gly Leu Thr Ser Ala Tyr Leu 145 150 155 160 Met Arg Arg Ile Tyr Pro Phe Gln Gly Gly Glu Ala Ile Leu Leu His 165 170 175 Ala Ala Ala Gly Gly Val Gly Leu Ile Val Ser Gln Trp Ala Arg Leu 180 185 190 Leu Gly Leu Thr Val Ile Gly Thr Val Ser Thr Glu Ala Lys Ala Glu 195 200 205 Val Ala Arg Ala His Gly Cys Asp His Ile Ile Asn Tyr Ser His Glu 210 215 220 Asp Val Ala Lys Arg Val Arg Glu Leu Thr Asp Gly Ala Gly Val Ser 225 230 235 240 Val Val Phe Asp Ser Val Gly Lys Ser Thr Phe Met Ala Ser Leu Asp 245 250 255 Ser Leu Lys Arg Arg Gly Leu Met Val Cys Val Gly Thr Ala Ser Gly 260 265 270 Thr Ile Pro Pro Phe Asp Pro Gln Leu Leu Ala Arg Lys Gly Ser Val 275 280 285 Tyr Leu Thr Arg Pro Ala Leu Ala Asp Tyr Ile Ala Asp Pro Ala Glu 290 295 300 Lys Ala Glu Leu Ala Ala Glu Val Phe Gly His Val Ala Ala Gly Arg 305 310 315 320 Ile Arg Ile Glu Ile Asn Gln Arg Tyr Ala Leu Gln Asp Ala Val Gln 325 330 335 Ala His Arg Asp Leu Glu Ser Arg Lys Thr Thr Gly Ser Ser Ile Phe 340 345 350 Val Leu <210> 48 <211> 327 <212> PRT <213> Proteus mirabilis <400> 48 Met Ala Lys Arg Ile Gln Phe Ala Ala His Gly Asn Ala Asp Val Leu 1 5 10 15 Glu Leu Thr Ser Phe Thr Pro Ala Pro Leu Gly Asp Asn Glu Val Gln 20 25 30 Val Ala Asn Lys Ala Ile Gly Ile Asn Tyr Ile Asp Thr Tyr Val Arg 35 40 45 Ser Gly Leu Tyr Pro Val Glu His Phe Pro Ser Gly Leu Gly Thr Glu 50 55 60 Ala Ala Gly Val Val Ile Lys Thr Gly Ala His Val Thr Ser Leu Lys 65 70 75 80 Glu Gly Asp Arg Val Val Tyr Ala Gln Ser Pro Leu Gly Ala Tyr Ser 85 90 95 Asp Thr His Asn Val Pro Glu Asn Lys Val Ala Arg Leu Pro Asp Asn 100 105 110 Ile Ser Phe Glu Gln Ala Ala Ala Ser Phe Leu Lys Gly Leu Thr Val 115 120 125 Tyr Tyr Leu Phe Asn Glu Thr Tyr Lys Leu Arg Ala Gly Glu Thr Phe 130 135 140 Leu Phe His Ala Ala Ala Gly Gly Val Gly Leu Ile Ala Ser Gln Trp 145 150 155 160 Ala Lys Ala Ile Gly Ala Lys Met Ile Gly Thr Ala Gly Ser Asp Glu 165 170 175 Lys Val Ala Lys Ala Lys Ala Ala Gly Ala Trp Lys Val Ile Asn Tyr 180 185 190 Gln Thr Glu Ser Ile Val Glu Arg Val Leu Ala Leu Thr Asn Asn Gln 195 200 205 Lys Val Pro Val Val Tyr Asp Ser Val Gly Lys Ala Thr Trp Leu Asp 210 215 220 Ser Leu His Cys Leu Gln Arg Arg Gly Leu Met Val Ser Phe Gly Asn 225 230 235 240 Ala Ser Gly Ala Val Thr Gly Val Asp Leu Gly Ile Leu Asn Lys Leu 245 250 255 Gly Ser Leu Tyr Val Thr Arg Pro Ser Ile Ser Gly Tyr Ile Thr Thr 260 265 270 Arg Glu Glu Leu Asp Ala Ala Ser Glu Ala Leu Phe Thr Leu Ile Gly 275 280 285 Arg Gly Lys Ile Asp Val Ser Val Pro Asp Asn Gln Lys Phe Ala Leu 290 295 300 Ala Asp Ala Lys Ala Ala His Arg Tyr Leu Glu Ser Arg Gln Ser Gln 305 310 315 320 Gly Ser Ser Leu Leu Ile Pro 325 <210> 49 <211> 325 <212> PRT <213> Pseudomonas aeruginosa <400> 49 Met Ala Lys Arg Ile Gln Phe Ala Ala Tyr Gly Gly Pro Glu Val Leu 1 5 10 15 Glu Tyr Arg Asp Tyr Gln Pro Ala Glu Pro Gly Pro Arg Glu Val Arg 20 25 30 Val Arg Asn Arg Ala Ile Gly Leu Asn Phe Ile Asp Thr Tyr Tyr Arg 35 40 45 Ser Gly Leu Tyr Pro Ala Pro Gly Leu Pro Ser Gly Leu Gly Ser Glu 50 55 60 Gly Ala Gly Glu Val Glu Ala Val Gly Ser Glu Val Thr Arg Phe Lys 65 70 75 80 Val Gly Asp Arg Val Ala Tyr Ala Thr Gly Pro Leu Gly Ala Tyr Ser 85 90 95 Glu Leu His Val Leu Ala Glu Glu Lys Leu Val His Leu Pro Asp Gly 100 105 110 Ile Asp Phe Glu Gln Ala Ala Ala Val Met Leu Lys Gly Leu Thr Thr 115 120 125 Gln Tyr Leu Leu Arg Gln Thr Tyr Glu Leu Arg Gly Gly Glu Thr Ile 130 135 140 Leu Phe His Ala Ala Ala Gly Gly Val Gly Leu Phe Ala Cys Gln Trp 145 150 155 160 Ala Lys Ala Leu Gly Val Gln Leu Ile Gly Thr Val Ser Ser Pro Glu 165 170 175 Lys Ala Arg Leu Ala Arg Gln His Gly Ala Trp Glu Thr Ile Asp Tyr 180 185 190 Ser His Glu Asn Val Ala Arg Arg Val Leu Glu Leu Thr Asp Gly Lys 195 200 205 Lys Cys Pro Val Val Tyr Asp Ser Val Gly Lys Asp Thr Trp Glu Thr 210 215 220 Ser Leu Asp Cys Val Ala Pro Arg Gly Leu Leu Val Ser Phe Gly Asn 225 230 235 240 Ala Ser Gly Pro Val Thr Gly Val Asn Leu Gly Ile Leu Ser Gln Lys 245 250 255 Gly Ser Leu Tyr Val Thr Arg Pro Thr Leu Gly Ser Tyr Ala Asp Thr 260 265 270 Pro Glu Lys Leu Gln Ala Met Ala Asp Glu Leu Phe Gly Leu Ile Glu 275 280 285 Arg Gly Asp Ile Arg Ile Glu Ile Asn Gln Arg Phe Ala Leu Ala Glu 290 295 300 Ala Ala Arg Ala His Thr Glu Leu Ala Ala Arg Arg Thr Thr Gly Ser 305 310 315 320 Thr Val Leu Leu Pro 325 <210> 50 <211> 326 <212> PRT <213> Mycolicibacterium smegmatis <400> 50 Met His Ala Ile Glu Val Ala Glu Thr Gly Gly Pro Glu Val Leu Asn 1 5 10 15 Tyr Ile Glu Arg Pro Glu Pro Ser Pro Gly Pro Gly Glu Val Leu Ile 20 25 30 Lys Ala Asp Ala Ile Gly Val Asn Phe Ile Asp Thr Tyr Phe Arg Ser 35 40 45 Gly Leu Tyr Pro Arg Glu Leu Pro Phe Val Val Gly Thr Glu Val Cys 50 55 60 Gly Thr Val Ala Ala Ile Gly Asn Asp Val Ala Ala Leu Lys Val Gly 65 70 75 80 Asp Arg Val Val Thr Ala Asn Ala Val Gly Ala Tyr Ala Asp Tyr Cys 85 90 95 Val Ala Pro Ala Asp Phe Val Ala Tyr Val Pro Asp Gly Val Ala Pro 100 105 110 Glu Ala Val Ala Ser Ala Leu Leu Lys Gly Met Thr Ala His Tyr Leu 115 120 125 Leu Lys Ser Thr Tyr Pro Val Gln Pro Ser Asp Thr Val Leu Val His 130 135 140 Ala Gly Ala Gly Gly Val Gly Leu Ile Leu Thr Gln Trp Ala Thr Ser 145 150 155 160 Leu Gly Thr Arg Val Ile Thr Thr Ala Ser Thr Pro Glu Lys Ala Glu 165 170 175 Leu Ser Arg Gln Ala Gly Ala Val Glu Val Leu Asp Tyr Pro Asp Pro 180 185 190 Asp Asp Pro Gln Pro Phe Ala Ser Arg Val Arg Glu Leu Thr Gly Gly 195 200 205 Ala Gly Val Ala Ala Val Tyr Asp Gly Val Gly Ala Thr Thr Phe Asp 210 215 220 Ala Ser Leu Ala Ser Leu Ala Val Arg Gly Thr Leu Ala Leu Phe Gly 225 230 235 240 Ala Ser Ser Gly Pro Val Pro Pro Phe Asp Pro Gln Arg Leu Asn Ala 245 250 255 Ala Gly Ser Val Phe Leu Thr Arg Pro Thr Leu Ala His His Thr Arg 260 265 270 Thr Ala Asp Glu Phe Ser Trp Arg Ala Gly Glu Leu Ile Asn Ala Ile 275 280 285 Ala Asp Gly Ser Ile Lys Ile Thr Val Gly Gly Thr Tyr Pro Leu Ala 290 295 300 Glu Ala Ser Arg Ala His Thr Asp Leu Gln Gly Arg Lys Thr Val Gly 305 310 315 320 Ser Ile Val Leu Ile Pro 325 <210> 51 <211> 324 <212> PRT <213> Paraburkholderia xenovorans <400> 51 Met Val Lys Ala Ile Arg Phe Asp Lys Thr Gly Gly Pro Glu Val Met 1 5 10 15 Lys Trp Val Asp Val Glu Val Gly Glu Pro Gly Ala Gly Glu Ile Arg 20 25 30 Val Arg Gln Thr Ala Val Gly Leu Asn Tyr Ile Asp Val Tyr Phe Arg 35 40 45 Thr Gly Leu Tyr Pro Leu Pro Leu Pro Gly Gly Leu Gly Met Glu Ala 50 55 60 Ala Gly Glu Val Thr Ala Leu Gly Ser Gly Val Ser Gly Leu Lys Val 65 70 75 80 Gly Asp Arg Ile Ala Tyr Val Ala Arg Pro Pro Gly Ala Tyr Ala Gln 85 90 95 Glu Arg Val Leu Gln Ala Ala Gln Val Val Lys Val Pro Asp Ala Leu 100 105 110 Thr Asp Glu Gln Ala Ala Ser Val Met Leu Gln Gly Leu Thr Ala Gln 115 120 125 Tyr Leu Leu Arg Arg Thr Tyr Pro Val Lys Ala Gly Asp Thr Ile Leu 130 135 140 Ile Gln Ala Ala Ala Gly Gly Val Gly Leu Leu Val Cys Gln Trp Ala 145 150 155 160 Lys Ala Leu Gly Ala Thr Val Ile Gly Thr Val Gly Ser Asp Glu Lys 165 170 175 Ala Glu Ile Ala Thr Ala His Gly Cys Asp His Ala Ile Val Tyr Thr 180 185 190 Arg Glu Asn Phe Thr Arg Arg Val Arg Glu Ile Thr Asn Gly Ala Gly 195 200 205 Val Pro Val Val Tyr Asp Ser Ile Gly Lys Asp Thr Phe Thr Gly Ser 210 215 220 Leu Asp Cys Leu Ala Pro Leu Gly Met Phe Val Ser Phe Gly Asn Ala 225 230 235 240 Ser Gly Pro Leu Pro Pro Ile Asp Ser Ser Glu Phe Ala Gly Arg Gly 245 250 255 Ser Leu Phe Phe Thr Arg Pro Thr Leu Phe Thr Tyr Ile Ala Lys Arg 260 265 270 Ser Asp Tyr Glu Ala Met Ser Thr Glu Leu Phe Asp Val Leu Val Ser 275 280 285 Gly Lys Val Lys Thr Ser Ile Asn Gln Arg Tyr Ala Leu Ala Asp Val 290 295 300 Gly Arg Ala His Ala Asp Leu Glu Gly Arg Arg Thr Thr Gly Ser Thr 305 310 315 320 Val Leu Leu Pro <210> 52 <211> 324 <212> PRT <213> Burkholderia cepacia <400> 52 Met Pro Lys Ala Ile Arg Tyr Asp Gln Pro Gly Gly Pro Asp Val Met 1 5 10 15 Lys Trp Val Asp Val Glu Val Gly Glu Pro Lys Ala Gly Glu Val Arg 20 25 30 Ile Arg Gln His Ala Val Gly Leu Asn Tyr Ile Asp Val Tyr Phe Arg 35 40 45 Thr Gly Leu Tyr Ser Gln Pro Leu Pro Gly Gly Leu Gly Met Glu Ala 50 55 60 Ala Gly Glu Val Thr Ala Val Gly Glu Gly Val Thr Ala Leu Lys Ala 65 70 75 80 Gly Asp Arg Val Ala Tyr Val Gly Gln Pro Pro Gly Ala Tyr Ala Gln 85 90 95 Glu Arg Val Met Pro Ala Glu Arg Leu Val Lys Leu Pro Asp Gly Ile 100 105 110 Ser Tyr Asp Asp Ala Ala Ser Val Met Leu Gln Gly Leu Thr Ala His 115 120 125 Tyr Leu Leu Arg Arg Thr Tyr Pro Val Lys Ala Gly Asp Thr Ile Leu 130 135 140 Ile His Ala Ala Ala Gly Gly Val Gly Leu Leu Val Cys Gln Trp Ala 145 150 155 160 Lys Ala Leu Gly Ala Thr Val Ile Gly Thr Val Gly Ser Asp Glu Lys 165 170 175 Ala Ala Leu Ala Lys Ala His Gly Cys Asp His Pro Ile Val Tyr Thr 180 185 190 Arg Glu Asn Phe Thr Gln Arg Val Lys Glu Ile Thr Asn Gly Ala Gly 195 200 205 Val Pro Val Val Tyr Asp Ser Ile Gly Lys Asp Thr Tyr Ile Gly Ser 210 215 220 Leu Asp Cys Leu Ala Pro Leu Gly Tyr Phe Val Ser Phe Gly Asn Ala 225 230 235 240 Ser Gly Pro Leu Pro Ala Ile Asp Ser Lys Glu Phe Ser Ser Arg Gly 245 250 255 Ser Leu Phe Phe Thr Arg Pro Thr Leu Phe Ser Tyr Ile Ala Lys Arg 260 265 270 Ala Asp Leu Glu Ser Ala Ala Ala Glu Leu Phe Asp Val Ile Leu Ser 275 280 285 Gly Lys Val Lys Thr Ser Ile Asn Gln Arg Tyr Pro Leu Ala Glu Val 290 295 300 Gly Arg Ala His Ala Asp Leu Glu Ser Arg Asn Thr Thr Gly Ser Thr 305 310 315 320 Ile Leu Val Pro <210> 53 <211> 310 <212> PRT <213> Gluconobacter oxydans <400> 53 Met Ser Ser Lys Pro Asp Ile Leu Thr Ile Asp Pro Leu Val Pro Val 1 5 10 15 Met Lys Glu Arg Leu Glu Lys Ser Phe Thr Leu His Pro Tyr Thr Ser 20 25 30 Leu Glu Asn Leu Lys Asn Ile Ala Pro Ala Ile Arg Gly Ile Thr Thr 35 40 45 Gly Gly Gly Ser Gly Val Pro Ser Glu Ile Met Asp Ala Leu Pro Asn 50 55 60 Leu Glu Val Ile Ser Val Asn Gly Val Gly Thr Asp Arg Ile Asn Leu 65 70 75 80 Asp Glu Ala Arg Arg Arg Asn Ile Gly Val Ala Ile Thr Gln Asn Thr 85 90 95 Leu Thr Asp Asp Val Ala Asp Met Ala Val Ala Leu Met Met Ala Val 100 105 110 Met Arg Ser Ile Val Thr Asn Asp Ala Phe Val Arg Ala Gly Lys Trp 115 120 125 Pro Ser Ala Thr Ala Pro Leu Gly Arg Ser Leu Thr Arg Lys Lys Val 130 135 140 Gly Ile Ala Gly Phe Gly His Ile Gly Gln Ala Ile Ala Lys Arg Val 145 150 155 160 Ser Ala Phe Gly Met Glu Val Ala Tyr Phe Asn Ser His Ala Arg Pro 165 170 175 Glu Ser Thr Cys His Phe Glu Pro Asp Leu Lys Ala Leu Ala Thr Trp 180 185 190 Cys Asp Val Leu Ile Leu Ala Val Ser Gly Gly Pro Arg Ser Ala Asn 195 200 205 Met Ile Asp Arg Asp Thr Leu Asp Ala Leu Gly Lys Asp Gly Phe Leu 210 215 220 Val Asn Ile Ala Arg Gly Thr Val Val Asp Glu Ala Ala Leu Leu Ser 225 230 235 240 Ala Leu Gln Glu Lys Arg Ile Ala Gly Ala Gly Leu Asp Val Phe Gln 245 250 255 Asn Glu Pro Asn Ile Asn Pro Ala Phe Leu Ser Leu Pro Asn Thr Val 260 265 270 Leu Gln Ala His Gln Ala Ser Ala Thr Val Glu Thr Arg Thr Thr Met 275 280 285 Ala Asn Leu Val Val Asp Asn Leu Ile Ala Tyr Phe Thr Asp Lys Thr 290 295 300 Leu Leu Thr Pro Val Ile 305 310 <210> 54 <211> 331 <212> PRT <213> Clostridium sporogenes <400> 54 Met Lys Ile Leu Ala Tyr Cys Val Arg Pro Asp Glu Ile Asp Ser Phe 1 5 10 15 Lys Asn Phe Ser Glu Lys Tyr Gly His Thr Val Asp Leu Ile Pro Asp 20 25 30 Ser Phe Gly Pro Ser Val Ala His Leu Ala Lys Gly Tyr Asp Gly Ile 35 40 45 Ser Ile Leu Gly Asn Asp Thr Cys Asn Arg Glu Ala Leu Glu Lys Ile 50 55 60 Lys Asp Cys Gly Ile Lys Tyr Leu Ala Thr Arg Thr Ala Gly Val Asn 65 70 75 80 Asn Ile Asp Phe Asp Ala Ala Lys Glu Phe Gly Ile Asn Val Ala Asn 85 90 95 Val Pro Ala Tyr Ser Pro Asn Ser Val Ser Glu Phe Thr Val Gly Leu 100 105 110 Ala Leu Ser Leu Thr Arg Lys Ile Pro Phe Ala Leu Lys Arg Val Glu 115 120 125 Leu Asn Asn Phe Ala Leu Gly Gly Leu Ile Gly Val Glu Leu Arg Asn 130 135 140 Leu Thr Leu Gly Val Ile Gly Thr Gly Arg Ile Gly Leu Lys Val Ile 145 150 155 160 Glu Gly Phe Ser Gly Phe Gly Met Lys Lys Met Ile Gly Tyr Asp Ile 165 170 175 Phe Glu Asn Glu Lys Ala Lys Glu Tyr Ile Glu Tyr Lys Ser Leu Asp 180 185 190 Glu Val Tyr Lys Glu Ala Asp Ile Ile Thr Leu His Ala Pro Leu Thr 195 200 205 Asp Asp Asn Tyr His Met Ile Gly Lys Glu Ser Ile Ala Lys Met Lys 210 215 220 Asp Gly Val Phe Ile Ile Asn Ala Ala Arg Gly Ala Leu Ile Asp Ser 225 230 235 240 Glu Ala Leu Ile Glu Gly Leu Lys Ser Gly Lys Ile Ala Gly Ala Ala 245 250 255 Leu Asp Ser Tyr Glu Tyr Glu Gln Gly Val Phe His Asn Asn Lys Met 260 265 270 Asn Glu Ile Met Lys Asp Asp Thr Leu Ala Arg Leu Lys Ser Phe Pro 275 280 285 Asn Val Val Ile Thr Pro His Leu Gly Phe Tyr Thr Asp Glu Ala Val 290 295 300 Ser Asn Met Val Glu Ile Thr Leu Met Asn Leu Gln Glu Phe Glu Leu 305 310 315 320 Lys Gly Thr Cys Lys Asn Gln Arg Val Cys Lys 325 330 <210> 55 <211> 410 <212> PRT <213> Paraclostridium bifermentans <400> 55 Met Asp Asn Lys Ala Leu Leu Lys Gly Val Arg Val Val Glu Leu Ser 1 5 10 15 Ser Phe Val Ala Ala Pro Cys Cys Ala Lys Leu Leu Gly Asp Trp Gly 20 25 30 Ala Glu Val Ile Lys Ile Glu Pro Leu Gly Gly Asp Gly Ile Arg Val 35 40 45 Met Gly Gly Thr Phe Lys Ser Pro Cys Thr Asp Glu Glu Asn Pro Met 50 55 60 Phe Glu Leu Glu Asn Gly Asn Lys Lys Gly Ile Ser Val Asn Val Lys 65 70 75 80 Thr Lys Glu Gly Val Glu Ile Ile His Lys Leu Leu Ala Lys Ala Asp 85 90 95 Ile Phe Ile Thr Asn Val Arg Glu Gln Ala Leu Ser Lys Ile Gly Leu 100 105 110 Thr Tyr Asp Gln Leu Lys Asp Glu Phe Pro Ala Leu Ile His Ala His 115 120 125 Ile Leu Gly Tyr Gly Glu Asn Gly Pro Leu Lys Asp Lys Pro Gly Phe 130 135 140 Asp Tyr Thr Ala Tyr Phe Ala Arg Gly Gly Val Ser Gln Ser Leu Met 145 150 155 160 Glu Lys Gly Thr Ser Pro Cys Asn Thr Ala Ala Ala Phe Gly Asp His 165 170 175 Tyr Ala Gly Val Ser Leu Thr Ala Gly Ile Leu Ala Ala Leu Tyr Lys 180 185 190 Lys Gln Met Thr Gly Glu Gly Asp Arg Val Thr Val Ser Leu Tyr His 195 200 205 Thr Ala Leu Tyr Gly Met Gly Met Met Ile Thr Thr Ala Gln Tyr Gly 210 215 220 Asn Lys Met Pro Ile Ser Arg Ala Asn Pro Asn Ser Pro Leu Met Thr 225 230 235 240 Thr Tyr Lys Cys Lys Asp Gly Lys Trp Ile Gln Leu Ala Leu Ile Gln 245 250 255 Tyr Asn Lys Trp Leu Pro Lys Phe Cys Asn Val Ile Asn Arg Pro Glu 260 265 270 Ile Met Glu Asp Glu Arg Phe Asn Asp Ile Lys Val Met Pro Leu His 275 280 285 Val Asp Glu Met Val Glu Ile Val Gly Glu Ala Met Leu Glu Lys Thr 290 295 300 Leu Asp Glu Trp Ser Ala Leu Leu Glu Glu Ala Asp Leu Pro Phe Glu 305 310 315 320 Lys Val Gln Ser Cys Glu Asp Ile Leu Glu Asp Glu Gln Ala Trp Ala 325 330 335 Asn Asp Phe Leu Phe Lys Thr Lys Tyr Ala Asn Gly Asn Glu Gly Val 340 345 350 Leu Val Asn Gly Pro Val Lys Phe Lys Thr Met Gly Ile Lys Glu Tyr 355 360 365 Thr Pro Ala Pro Arg Val Gly Glu His Thr Glu Glu Val Leu Lys Glu 370 375 380 Leu Gly Tyr Thr Glu Glu Glu Ile Leu Asn Met Val Asn Ser Gln Ala 385 390 395 400 Val Lys Leu Asp Asp Ser Lys Glu Leu Val 405 410 <210> 56 <211> 410 <212> PRT <213> Paeniclostridium sordellii <400> 56 Met Asp Asn Arg Ala Leu Leu Lys Gly Val Arg Val Val Glu Leu Ser 1 5 10 15 Ser Phe Val Ala Ala Pro Cys Cys Ala Lys Leu Leu Ala Asp Trp Gly 20 25 30 Ala Glu Val Ile Lys Ile Glu Pro Leu Gly Gly Asp Gly Ile Arg Val 35 40 45 Met Gly Gly Thr Phe Lys Ser Pro Cys Thr Asp Asp Glu Asn Pro Met 50 55 60 Phe Glu Leu Glu Asn Gly Asn Lys Lys Gly Ile Ser Val Asn Val Lys 65 70 75 80 Thr Lys Glu Gly Val Glu Ile Leu His Lys Leu Leu Ser Lys Ser Asp 85 90 95 Ile Phe Val Thr Asn Val Arg Glu Lys Ala Leu Ala Lys Met Gly Leu 100 105 110 Thr Tyr Asp Gln Leu Lys Asp Asp Phe Pro Gly Leu Ile His Ala His 115 120 125 Ile Leu Gly Tyr Gly Glu Glu Gly Pro Leu Lys Asp Lys Pro Gly Phe 130 135 140 Asp Tyr Thr Ala Tyr Phe Ala Arg Gly Gly Val Ser Gln Ser Leu Met 145 150 155 160 Glu Lys Gly Thr Ser Pro Cys Asn Thr Ala Ala Gly Phe Gly Asp His 165 170 175 Tyr Ala Gly Ile Ser Leu Thr Ala Gly Ile Leu Ala Ala Leu Tyr Lys 180 185 190 Lys Gln Ile Thr Gly Glu Gly Asp Arg Val Thr Val Ser Leu Phe His 195 200 205 Thr Ala Leu Tyr Gly Met Gly Met Met Ile Thr Thr Ser Gln Tyr Gly 210 215 220 Asn Glu Met Pro Ile Ser Arg Thr Glu Pro Asn Ser Pro Leu Met Thr 225 230 235 240 Thr Tyr Lys Cys Lys Asp Gly Lys Trp Ile Gln Leu Ala Leu Ile Gln 245 250 255 Tyr Asn Lys Trp Leu Pro Lys Phe Cys Glu Val Ile Asn Arg Pro Glu 260 265 270 Ile Met Lys Asp Asp Arg Phe Asn Asp Ile Lys Val Met Pro Leu His 275 280 285 Val Asp Glu Met Val Lys Ile Val Glu Lys Ala Met Leu Glu Lys Thr 290 295 300 Leu Asp Glu Trp Ser Asp Leu Leu Glu Glu Ala Asp Leu Pro Phe Glu 305 310 315 320 Lys Val Gln Ser Cys Glu Asp Ile Ile Asn Asp Asp Gln Ala Trp Ala 325 330 335 Asn Asp Phe Leu Phe Lys Thr Thr Tyr Glu Asn Gly Asn Glu Gly Val 340 345 350 Leu Val Asn Gly Pro Val Lys Phe Lys Thr Met Gly Ile Lys Glu Tyr 355 360 365 Glu Pro Ala Pro Arg Leu Gly Gln His Thr Glu Glu Val Leu Lys Ser 370 375 380 Ile Gly Tyr Thr Glu Glu Glu Ile Leu Asp Met Val Asn Ser Gln Ala 385 390 395 400 Ile Lys Leu Asp Asp Ala Lys Glu Leu Val 405 410 <210> 57 <211> 404 <212> PRT <213> Clostridium botulinum <400> 57 Met Thr Lys Glu Gly Leu Ala Leu Glu Gly Val Lys Val Val Glu Leu 1 5 10 15 Ser Ser Phe Val Ala Ala Pro Ser Cys Ser Lys Leu Leu Ala Asp Trp 20 25 30 Gly Ala Asp Val Ile Lys Ile Glu Pro Ile Gln Gly Asp Asn Ile Arg 35 40 45 Val Val Gly Gly Val Tyr Asn Ser Pro Ala Arg Asp Asp Glu Asn Pro 50 55 60 Met Phe Glu Leu Glu Asn Gly Asn Lys Arg Gly Ile Ala Ile Asn Thr 65 70 75 80 Arg Ser Glu Lys Gly Lys Glu Val Leu Gly Lys Leu Leu Lys Asp Ala 85 90 95 Asp Val Phe Val Thr Asn Val Arg Glu Lys Ala Leu Gln Arg Ser Gly 100 105 110 Leu Ser Tyr Asp Gln Leu Lys Asp Lys Tyr Pro Ser Leu Ile His Ala 115 120 125 His Ile Leu Gly Tyr Gly Glu Lys Gly Pro Leu Lys Asp Lys Pro Gly 130 135 140 Phe Asp Tyr Thr Ala Tyr Phe Ala Arg Gly Ala Val Ser Thr Ser Leu 145 150 155 160 Met Glu Lys Gly Thr Ser Pro Ala Asn Thr Asn Ala Gly Phe Gly Asp 165 170 175 His Tyr Ala Gly Met Ser Leu Ala Ala Gly Ile Leu Ala Ala Leu His 180 185 190 Arg Lys Thr Leu Thr Gly Lys Gly Asp Arg Val Thr Val Ser Leu Tyr 195 200 205 His Thr Ala Ile Phe Gly Met Gly Leu Met Ile Thr Thr Ala Gln Tyr 210 215 220 Gly Asn Lys Met Pro Leu Ser Arg Arg Thr Pro Asn Asn Pro Leu Ala 225 230 235 240 Thr Thr Tyr Arg Cys Lys Asp Asp Arg Trp Ile Gln Leu Ala Leu Leu 245 250 255 Lys Tyr Asp Ala Trp Phe Pro Lys Phe Cys Lys Glu Val Ile Asn Arg 260 265 270 Pro Asp Leu Ile Glu Asp Leu Arg Phe Asn Lys Gln Ser Glu Val Val 275 280 285 Lys His Val Glu Thr Phe Val Gly Ile Leu Glu Glu Glu Phe Ile Lys 290 295 300 Lys Asp Leu Lys Glu Trp Ala Asp Leu Leu Asp Lys Ala Asp Leu Pro 305 310 315 320 Tyr Glu Lys Leu Gln Tyr Cys Glu Asp Ile Leu Glu Asp Glu Gln Ala 325 330 335 Trp Ala Asn Asp Tyr Leu Phe Lys Thr Thr Tyr Asp Ser Gly Asn Thr 340 345 350 Gly Val Leu Val Asn Ser Pro Val Lys Phe Ser Glu Ala Gly Met Arg 355 360 365 Thr Tyr Lys Ala Ala Pro Lys Ile Gly Glu Asp Thr Glu Val Val Leu 370 375 380 Thr Ser Leu Gly Tyr Ser Lys Glu Glu Ile Glu Glu Met Arg Lys Glu 385 390 395 400 Glu Ser Ile Lys <210> 58 <211> 404 <212> PRT <213> Clostridium sporogenes <400> 58 Met Thr Lys Glu Gly Leu Ala Leu Glu Gly Val Lys Val Val Glu Leu 1 5 10 15 Ser Ser Phe Val Ala Ala Pro Ser Cys Ser Lys Leu Leu Ala Asp Trp 20 25 30 Gly Ala Asp Val Ile Lys Ile Glu Pro Ile Gln Gly Asp Asn Ile Arg 35 40 45 Val Val Gly Gly Val Tyr Asn Ser Pro Ala Arg Asp Asp Glu Asn Pro 50 55 60 Met Phe Glu Leu Glu Asn Gly Asn Lys Arg Gly Val Ala Ile Asn Thr 65 70 75 80 Arg Ser Glu Lys Gly Lys Glu Val Leu Gly Lys Leu Leu Lys Asp Ala 85 90 95 Asp Val Phe Val Thr Asn Val Arg Glu Lys Ala Leu Gln Arg Ser Gly 100 105 110 Leu Ser Tyr Asp Gln Leu Lys Asp Lys Tyr Pro Ser Leu Ile His Ala 115 120 125 His Ile Leu Gly Tyr Gly Glu Lys Gly Pro Leu Lys Asp Lys Pro Gly 130 135 140 Phe Asp Tyr Thr Ala Tyr Phe Ala Arg Gly Ala Val Ser Thr Ser Leu 145 150 155 160 Met Glu Lys Gly Thr Ser Pro Ala Asn Thr Asn Ala Gly Phe Gly Asp 165 170 175 His Tyr Ala Gly Met Ser Leu Ala Ala Gly Ile Leu Ala Ala Leu His 180 185 190 Arg Lys Thr Leu Thr Gly Lys Gly Asp Arg Val Thr Val Ser Leu Tyr 195 200 205 His Thr Ala Ile Phe Gly Met Gly Leu Met Ile Thr Thr Ala Gln Tyr 210 215 220 Gly Asn Lys Met Pro Leu Ser Arg Arg Thr Pro Asn Asn Pro Leu Ala 225 230 235 240 Thr Thr Tyr Arg Cys Lys Asp Asp Arg Trp Ile Gln Leu Ala Leu Leu 245 250 255 Lys Tyr Asp Ala Trp Phe Pro Lys Phe Cys Lys Glu Val Ile Asn Arg 260 265 270 Pro Asp Leu Ile Glu Asp Ser Arg Phe Asn Lys Gln Ser Glu Val Val 275 280 285 Lys His Val Glu Thr Phe Val Gly Val Leu Glu Gly Glu Phe Ile Lys 290 295 300 Lys Asp Leu Lys Glu Trp Ala Asp Leu Leu Asp Lys Ala Asp Leu Pro 305 310 315 320 Tyr Glu Lys Leu Gln Tyr Cys Glu Asp Ile Leu Glu Asp Glu Gln Ala 325 330 335 Trp Ala Asn Asp Tyr Leu Phe Lys Thr Thr Tyr Asp Ser Gly Asn Thr 340 345 350 Gly Val Leu Val Asn Ser Pro Val Lys Phe Ser Glu Ala Gly Met Arg 355 360 365 Pro Tyr Lys Ala Ala Pro Lys Ile Gly Glu Asp Thr Glu Ala Ile Leu 370 375 380 Thr Ser Leu Gly Tyr Ser Lys Glu Glu Ile Glu Glu Met Arg Lys Glu 385 390 395 400 Asn Ala Ile Lys <210> 59 <211> 408 <212> PRT <213> Clostridioides difficile <400> 59 Met Ser Glu Lys Lys Glu Ala Arg Val Val Ile Asn Asp Leu Leu Ala 1 5 10 15 Glu Gln Tyr Ala Asn Ala Phe Lys Ala Lys Glu Glu Gly Arg Pro Val 20 25 30 Gly Trp Ser Thr Ser Val Phe Pro Gln Glu Leu Ala Glu Val Phe Asp 35 40 45 Leu Asn Val Leu Tyr Pro Glu Asn Gln Ala Ala Gly Val Ala Ala Lys 50 55 60 Lys Gly Ser Leu Glu Leu Cys Glu Ile Ala Glu Ser Lys Gly Tyr Ser 65 70 75 80 Ile Asp Leu Cys Ala Tyr Ala Arg Thr Asn Phe Gly Leu Leu Glu Asn 85 90 95 Gly Gly Cys Glu Ala Leu Asp Met Pro Ala Pro Asp Phe Leu Leu Cys 100 105 110 Cys Asn Asn Ile Cys Asn Gln Val Ile Lys Trp Tyr Glu Asn Ile Ser 115 120 125 Arg Glu Leu Asp Ile Pro Leu Ile Met Ile Asp Thr Thr Phe Asn Asn 130 135 140 Glu Asp Glu Val Thr Gln Ser Arg Ile Asp Tyr Ile Lys Ala Gln Phe 145 150 155 160 Glu Glu Ala Ile Lys Gln Leu Glu Ile Ile Ser Gly Lys Lys Phe Asp 165 170 175 Pro Lys Lys Phe Glu Glu Val Met Lys Ile Ser Ala Glu Asn Gly Arg 180 185 190 Leu Trp Lys Tyr Ser Met Ser Leu Pro Ala Asp Ser Ser Pro Ser Pro 195 200 205 Met Asn Gly Phe Asp Leu Phe Thr Tyr Met Ala Val Ile Val Cys Ala 210 215 220 Arg Gly Lys Lys Glu Thr Thr Glu Ala Phe Lys Leu Leu Ile Glu Glu 225 230 235 240 Leu Glu Asp Asn Met Lys Thr Gly Lys Ser Ser Phe Arg Gly Glu Glu 245 250 255 Lys Tyr Arg Ile Met Met Glu Gly Ile Pro Cys Trp Pro Tyr Ile Gly 260 265 270 Tyr Lys Met Lys Thr Leu Ala Lys Phe Gly Val Asn Met Thr Gly Ser 275 280 285 Val Tyr Pro His Ala Trp Ala Leu Gln Tyr Glu Val Asn Asp Leu Asp 290 295 300 Gly Met Ala Val Ala Tyr Ser Thr Met Phe Asn Asn Val Asn Leu Asp 305 310 315 320 Arg Met Thr Lys Tyr Arg Val Asp Ser Leu Val Glu Gly Lys Cys Asp 325 330 335 Gly Ala Phe Tyr His Met Asn Arg Ser Cys Lys Leu Met Ser Leu Ile 340 345 350 Gln Tyr Glu Met Gln Arg Arg Ala Ala Glu Glu Thr Gly Leu Pro Tyr 355 360 365 Ala Gly Phe Asp Gly Asp Gln Ala Asp Pro Arg Ala Phe Thr Asn Ala 370 375 380 Gln Phe Glu Thr Arg Ile Gln Gly Leu Val Glu Val Met Glu Glu Arg 385 390 395 400 Lys Lys Leu Asn Arg Gly Glu Ile 405 <210> 60 <211> 410 <212> PRT <213> Clostridium sporogenes <400> 60 Met Ala Asp Lys Lys Glu Val Lys Lys Asn Ala Ala Lys Met Ile Asn 1 5 10 15 Gly Ile Leu Ala Lys Ser Tyr Ala Asp Ala Trp Lys Ala Lys Glu Glu 20 25 30 Gly Lys Pro Val Gly Trp Ser Thr Ser Val Phe Pro Gln Glu Leu Val 35 40 45 Glu Thr Phe Gly Leu Asp Val Leu Tyr Pro Glu Asn Gln Ala Ala Gly 50 55 60 Val Ala Ala Lys Lys Glu Ser Leu Ser Leu Cys Glu Ala Ala Glu Ser 65 70 75 80 Ala Gly Tyr Ser Ile Asp Leu Cys Ala Tyr Ala Arg Thr Asn Phe Gly 85 90 95 Leu Leu Glu Lys Gly Gly Ser Glu Asn Leu Asn Met Pro Lys Pro Asp 100 105 110 Phe Ile Cys Cys Cys Asn Asn Ile Cys Asn Gln Val Ile Lys Trp Tyr 115 120 125 Glu Asn Ile Ala Lys Glu Leu Asp Ile Pro Leu Ile Met Ile Asp Thr 130 135 140 Thr Phe Asn Asn Glu Asp Glu Val Thr Glu Asn Arg Ile Lys Tyr Leu 145 150 155 160 Arg Ala Gln Phe Glu Glu Ala Ile Lys Gln Leu Glu Lys Ile Ser Gly 165 170 175 Lys Lys Phe Asp Pro Lys Lys Phe Glu Glu Val Met Lys Ile Ser Ala 180 185 190 Glu Asn Gly Lys Leu Trp Lys Tyr Ser Met Ser Leu Pro Ser Gly Ser 195 200 205 Phe Pro Ser Pro Met Asn Gly Phe Asp Leu Phe Thr Tyr Met Ala Val 210 215 220 Ile Val Cys Tyr Arg Gly Lys Lys Glu Thr Thr Glu Ala Phe Lys Leu 225 230 235 240 Leu Ile Ser Glu Leu Glu Asp Asn Ile Lys Asn Lys Ala Thr Ser Phe 245 250 255 Arg Gly Glu Glu Lys Tyr Arg Ile Met Met Glu Gly Ile Pro Cys Trp 260 265 270 Pro Tyr Ile Gly Tyr Lys Met Arg Thr Leu Ala Gly Tyr Gly Val Asn 275 280 285 Met Thr Gly Ser Val Tyr Pro His Ala Trp Ala Leu Gln Tyr Glu Val 290 295 300 Asn Asp Leu Asp Gly Met Ala Lys Ala Tyr Ser Thr Met Phe Asn Asn 305 310 315 320 Val Asn Leu Glu Thr Met Cys Lys Tyr Arg Ile Asp Ser Leu Ile Asp 325 330 335 Gly Asn Cys Asp Gly Ala Phe Tyr His Met Asn Arg Ser Cys Lys Leu 340 345 350 Met Ser Phe Ile Gln Tyr Glu Met Glu Arg Lys Val Phe Glu Glu Thr 355 360 365 Gly Ile Pro Tyr Ala Gly Phe Asp Gly Asp Gln Ala Asp Pro Arg Asn 370 375 380 Phe Ser Lys Ala Gln Phe Glu Thr Arg Leu Gln Gly Leu Val Glu Val 385 390 395 400 Met Glu Glu Arg Lys Lys Gly Gly Asn Lys 405 410 <210> 61 <211> 266 <212> PRT <213> Clostridioides difficile <400> 61 Met Tyr Thr Met Gly Leu Asp Ile Gly Ser Thr Ala Ser Lys Gly Val 1 5 10 15 Ile Leu Lys Asn Gly Glu Asp Ile Val Ala Ser Glu Thr Ile Ser Ser 20 25 30 Gly Thr Gly Thr Thr Gly Pro Ser Arg Val Leu Glu Lys Leu Tyr Gly 35 40 45 Lys Thr Gly Leu Ala Arg Glu Asp Ile Lys Lys Val Val Val Thr Gly 50 55 60 Tyr Gly Arg Met Asn Tyr Ser Asp Ala Asp Lys Gln Ile Ser Glu Leu 65 70 75 80 Ser Cys His Ala Arg Gly Val Asn Phe Ile Ile Pro Glu Thr Arg Thr 85 90 95 Ile Ile Asp Ile Gly Gly Gln Asp Ala Lys Val Leu Lys Leu Asp Asn 100 105 110 Asn Gly Arg Leu Leu Asn Phe Leu Met Asn Asp Lys Cys Ala Ala Gly 115 120 125 Thr Gly Arg Phe Leu Asp Val Met Ala Lys Ile Ile Glu Val Asp Val 130 135 140 Ser Glu Leu Gly Ser Ile Ser Met Asn Ser Gln Asn Glu Val Ser Ile 145 150 155 160 Ser Ser Thr Cys Thr Val Phe Ala Glu Ser Glu Val Ile Ser His Leu 165 170 175 Ser Glu Asn Ala Lys Ile Glu Asp Ile Val Ala Gly Ile His Thr Ser 180 185 190 Val Ala Lys Arg Val Ser Ser Leu Val Lys Arg Ile Gly Val Gln Arg 195 200 205 Asn Val Val Met Val Gly Gly Val Ala Arg Asn Ser Gly Ile Val Arg 210 215 220 Ala Met Ala Arg Glu Ile Asn Thr Glu Ile Ile Val Pro Asp Ile Pro 225 230 235 240 Gln Leu Thr Gly Ala Leu Gly Ala Ala Leu Tyr Ala Phe Asp Glu Ala 245 250 255 Lys Glu Ser Gln Lys Glu Val Lys Asn Ile 260 265 <210> 62 <211> 375 <212> PRT <213> Clostridium sporogenes <400> 62 Met Asp Asn Ile Lys Asn Ile Leu Ser Lys Leu Glu Gly Ile Val Lys 1 5 10 15 Asn Pro Lys Lys Val Val Ser Asp Tyr Lys Glu Arg Thr Gly Asn Lys 20 25 30 Val Ile Gly Cys Phe Pro Val Tyr Thr Pro Glu Glu Ile Val Tyr Ala 35 40 45 Ala Asp Met Leu Pro Ile Gly Ile Trp Gly Gly Asp Val Glu Ala Asn 50 55 60 Leu Ala Lys Gln Tyr Tyr Pro Ala Phe Cys Cys Ser Ile Met Gln Ser 65 70 75 80 Cys Met Glu Phe Gly Leu Lys Gly Ile Tyr Glu Gly Leu Ser Ala Val 85 90 95 Ile Ile Pro Gly Met Cys Asp Thr Leu Asn Cys Met Gly Gln Asn Trp 100 105 110 Lys Phe Ala Ile Lys Asp Ile Pro Tyr Ile Ala Leu Val His Pro Gln 115 120 125 Asn Arg Lys Leu Glu Ala Gly Val Glu Tyr Leu Val Glu Glu Tyr Lys 130 135 140 His Val Lys Ala Lys Ile Glu Glu Ile Arg Gly Lys Glu Ile Thr Glu 145 150 155 160 Glu Glu Met Gln Asn Ser Ile Asp Ile Tyr Asn Glu His Arg Lys Val 165 170 175 Met Arg Ser Phe Val Asp Glu Ala Ala Lys His Pro Asn Thr Ile Asn 180 185 190 Asn Tyr Gln Arg Asn Leu Val Ile Lys Ser Gly Phe Phe Met Arg Lys 195 200 205 Asp Glu His Thr Lys Ile Val Lys Glu Leu Asn Glu Leu Leu Ala Val 210 215 220 Leu Pro Glu Glu Lys Tyr Asp Gly Lys Lys Val Leu Val Thr Gly Ile 225 230 235 240 Leu Leu Asp Ser Lys Glu Met Leu Asp Val Phe Glu Glu Asn Lys Leu 245 250 255 Arg Ile Val Ala Asp Asp Leu Ala Gln Glu Ser Arg Gln Phe Arg Thr 260 265 270 Asp Val Pro Glu Gly Lys Asn Ala Leu Asp Arg Leu Ala Arg Gln Trp 275 280 285 Ser Asn Ile Glu Gly Cys Ser Leu Ala Tyr Asp Pro Lys Lys Ile Arg 290 295 300 Gly Ser Met Ile Ala Lys Glu Ala Lys Ala Lys Gly Ile Asp Gly Val 305 310 315 320 Val Phe Ala Met Met Lys Phe Cys Asp Pro Glu Glu Tyr Asp Tyr Pro 325 330 335 Ile Val Lys Lys Asp Ile Glu Lys Glu Asp Ile Pro Thr Thr Met Ile 340 345 350 Glu Val Asp Gln Gln Asn Lys Ser Val Glu Gln Ile Arg Thr Arg Ile 355 360 365 Gln Thr Phe Ser Glu Ile Leu 370 375 <210> 63 <211> 375 <212> PRT <213> Clostridioides difficile <400> 63 Met Glu Ala Ile Leu Ser Lys Met Lys Glu Val Val Glu Asn Pro Asn 1 5 10 15 Ala Ala Val Lys Lys Tyr Lys Ser Glu Thr Gly Lys Lys Ala Ile Gly 20 25 30 Cys Phe Pro Val Tyr Cys Pro Glu Glu Ile Ile His Ala Ala Gly Met 35 40 45 Leu Pro Val Gly Ile Trp Gly Gly Gln Thr Glu Leu Asp Leu Ala Lys 50 55 60 Gln Tyr Phe Pro Ala Phe Ala Cys Ser Ile Met Gln Ser Cys Leu Glu 65 70 75 80 Tyr Gly Leu Lys Gly Ala Tyr Asp Glu Leu Ser Gly Val Ile Ile Pro 85 90 95 Gly Met Cys Asp Thr Leu Ile Cys Leu Gly Gln Asn Trp Lys Ser Ala 100 105 110 Val Pro His Ile Lys Tyr Ile Ser Leu Val His Pro Gln Asn Arg Lys 115 120 125 Leu Glu Ala Gly Val Lys Tyr Leu Ile Ser Glu Tyr Lys Gly Val Lys 130 135 140 Arg Glu Leu Glu Glu Ile Cys Gly Tyr Glu Ile Glu Glu Ala Lys Ile 145 150 155 160 His Glu Ser Ile Glu Val Tyr Asn Glu His Arg Lys Thr Met Arg Asp 165 170 175 Phe Val Glu Val Ala Tyr Lys His Ser Asn Thr Ile Lys Pro Ser Ile 180 185 190 Arg Ser Leu Val Ile Lys Ser Gly Phe Phe Met Arg Lys Glu Glu His 195 200 205 Thr Glu Leu Val Lys Asp Leu Ile Ala Lys Leu Asn Ala Met Pro Glu 210 215 220 Glu Val Cys Ser Gly Lys Lys Val Leu Leu Thr Gly Ile Leu Ala Asp 225 230 235 240 Ser Lys Asp Ile Leu Asp Ile Leu Glu Asp Asn Asn Ile Ser Val Val 245 250 255 Ala Asp Asp Leu Ala Gln Glu Thr Arg Gln Phe Arg Thr Asp Val Pro 260 265 270 Ala Gly Asp Asp Ala Leu Glu Arg Leu Ala Arg Gln Trp Ser Asn Ile 275 280 285 Glu Gly Cys Ser Leu Ala Tyr Asp Pro Lys Lys Lys Arg Gly Ser Leu 290 295 300 Ile Val Asp Glu Val Lys Lys Lys Asp Ile Asp Gly Val Ile Phe Cys 305 310 315 320 Met Met Lys Phe Cys Asp Pro Glu Glu Tyr Asp Tyr Pro Leu Val Arg 325 330 335 Lys Asp Ile Glu Asp Ser Gly Ile Pro Thr Leu Tyr Val Glu Ile Asp 340 345 350 Gln Gln Thr Gln Asn Asn Glu Gln Ala Arg Thr Arg Ile Gln Thr Phe 355 360 365 Ala Glu Met Met Ser Leu Ala 370 375 <210> 64 <211> 257 <212> PRT <213> Clostridium sporogenes <400> 64 Met Tyr Thr Met Gly Leu Asp Ile Gly Ser Thr Thr Ser Lys Gly Val 1 5 10 15 Ile Ile Lys Asp Gly Glu Glu Ile Val Ala Ser Val Leu Val Pro Val 20 25 30 Gly Thr Gly Thr Ser Gly Pro Leu Lys Leu Ile Lys Glu Leu Lys Glu 35 40 45 Lys Ser Asn Leu Thr Glu Lys Asp Ile Glu Lys Thr Val Val Thr Gly 50 55 60 Tyr Gly Arg Ile Gln Tyr Lys Asp Ala Asp Lys Gln Ile Ser Glu Leu 65 70 75 80 Ser Cys His Ala Lys Gly Val Ala Phe Leu Ile Pro Gly Ala Arg Thr 85 90 95 Ile Ile Asp Ile Gly Gly Gln Asp Ala Lys Ala Met Lys Leu Asn Asp 100 105 110 Lys Gly Lys Leu Ile Asn Phe Ile Met Asn Asp Lys Cys Ala Ala Gly 115 120 125 Thr Gly Arg Phe Leu Asp Val Met Ala Gly Val Leu Glu Thr Asp Val 130 135 140 Ser Lys Leu Gly Glu Ile Ser Glu Lys Ser Thr Lys Glu Val Ser Ile 145 150 155 160 Ser Ser Thr Cys Thr Val Phe Ala Glu Ser Glu Val Ile Ser His Leu 165 170 175 Ser Ala Asn Ala Lys Lys Glu Asp Ile Val Ala Gly Ile His Thr Ser 180 185 190 Val Val Arg Arg Val Ser Thr Leu Ala Met Arg Val Gly Ile Glu Asp 195 200 205 Gln Val Val Met Val Gly Gly Val Ala Arg Asn Lys Gly Ile Val Lys 210 215 220 Ala Met Glu Lys Glu Leu Gly His Asp Ile Lys Val Pro Glu Leu Ala 225 230 235 240 Gln Leu Thr Gly Ala Leu Gly Ala Ala Ile Tyr Ala Phe Glu Glu Thr 245 250 255 Lys <210> 65 <211> 397 <212> PRT <213> Treponema denticola <400> 65 Met Ile Val Lys Pro Met Val Arg Asn Asn Ile Cys Leu Asn Ala His 1 5 10 15 Pro Gln Gly Cys Lys Lys Gly Val Glu Asp Gln Ile Glu Tyr Thr Lys 20 25 30 Lys Arg Ile Thr Ala Glu Val Lys Ala Gly Ala Lys Ala Pro Lys Asn 35 40 45 Val Leu Val Leu Gly Cys Ser Asn Gly Tyr Gly Leu Ala Ser Arg Ile 50 55 60 Thr Ala Ala Phe Gly Tyr Gly Ala Ala Thr Ile Gly Val Ser Phe Glu 65 70 75 80 Lys Ala Gly Ser Glu Thr Lys Tyr Gly Thr Pro Gly Trp Tyr Asn Asn 85 90 95 Leu Ala Phe Asp Glu Ala Ala Lys Arg Glu Gly Leu Tyr Ser Val Thr 100 105 110 Ile Asp Gly Asp Ala Phe Ser Asp Glu Ile Lys Ala Gln Val Ile Glu 115 120 125 Glu Ala Lys Lys Lys Gly Ile Lys Phe Asp Leu Ile Val Tyr Ser Leu 130 135 140 Ala Ser Pro Val Arg Thr Asp Pro Asp Thr Gly Ile Met His Lys Ser 145 150 155 160 Val Leu Lys Pro Phe Gly Lys Thr Phe Thr Gly Lys Thr Val Asp Pro 165 170 175 Phe Thr Gly Glu Leu Lys Glu Ile Ser Ala Glu Pro Ala Asn Asp Glu 180 185 190 Glu Ala Ala Ala Thr Val Lys Val Met Gly Gly Glu Asp Trp Glu Arg 195 200 205 Trp Ile Lys Gln Leu Ser Lys Glu Gly Leu Leu Glu Glu Gly Cys Ile 210 215 220 Thr Leu Ala Tyr Ser Tyr Ile Gly Pro Glu Ala Thr Gln Ala Leu Tyr 225 230 235 240 Arg Lys Gly Thr Ile Gly Lys Ala Lys Glu His Leu Glu Ala Thr Ala 245 250 255 His Arg Leu Asn Lys Glu Asn Pro Ser Ile Arg Ala Phe Val Ser Val 260 265 270 Asn Lys Gly Leu Val Thr Arg Ala Ser Ala Val Ile Pro Val Ile Pro 275 280 285 Leu Tyr Leu Ala Ser Leu Phe Lys Val Met Lys Glu Lys Gly Asn His 290 295 300 Glu Gly Cys Ile Glu Gln Ile Thr Arg Leu Tyr Ala Glu Arg Leu Tyr 305 310 315 320 Arg Lys Asp Gly Thr Ile Pro Val Asp Glu Glu Asn Arg Ile Arg Ile 325 330 335 Asp Asp Trp Glu Leu Glu Glu Asp Val Gln Lys Ala Val Ser Ala Leu 340 345 350 Met Glu Lys Val Thr Gly Glu Asn Ala Glu Ser Leu Thr Asp Leu Ala 355 360 365 Gly Tyr Arg His Asp Phe Leu Ala Ser Asn Gly Phe Asp Val Glu Gly 370 375 380 Ile Asn Tyr Glu Ala Glu Val Glu Arg Phe Asp Arg Ile 385 390 395 <210> 66 <211> 1173 <212> PRT <213> Mycolicibacterium smegmatis <400> 66 Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala 1 5 10 15 Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr 20 25 30 Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala 35 40 45 Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe 50 55 60 Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu 65 70 75 80 Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe 85 90 95 Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala 100 105 110 Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala 115 120 125 Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu 130 135 140 Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala 145 150 155 160 Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile 165 170 175 Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg 180 185 190 Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu 195 200 205 Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala 210 215 220 Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly 225 230 235 240 Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg 245 250 255 Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly 260 265 270 Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe 275 280 285 Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu 290 295 300 Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly 305 310 315 320 Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu 325 330 335 Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val 340 345 350 Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val 355 360 365 Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu 370 375 380 Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser 385 390 395 400 Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu 405 410 415 Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val 420 425 430 Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu 435 440 445 Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro 450 455 460 Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr 465 470 475 480 Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr 485 490 495 His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr 500 505 510 Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val 515 520 525 Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg 530 535 540 Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val 545 550 555 560 Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu 565 570 575 Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu 580 585 590 Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro 595 600 605 Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg 610 615 620 Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala 625 630 635 640 Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala 645 650 655 Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr 660 665 670 Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp 675 680 685 Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser 690 695 700 Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala 705 710 715 720 Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala 725 730 735 Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr 740 745 750 Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu 755 760 765 Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg 770 775 780 Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr 785 790 795 800 Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr 805 810 815 Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln 820 825 830 Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala 835 840 845 Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu 850 855 860 Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu 865 870 875 880 Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln 885 890 895 Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala 900 905 910 Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val 915 920 925 Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val 930 935 940 Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn 945 950 955 960 Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys 965 970 975 Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro 980 985 990 Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu 995 1000 1005 Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile Gly 1010 1015 1020 Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val Asp Phe 1025 1030 1035 1040 Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg Glu Gly Tyr 1045 1050 1055 Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly Ile Ser Leu Asp 1060 1065 1070 Val Phe Val Asp Trp Leu Ile Arg Ala Gly His Pro Ile Asp Arg Val 1075 1080 1085 Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe Glu Thr Ala Leu Thr Ala 1090 1095 1100 Leu Pro Glu Lys Arg Arg Ala Gln Thr Val Leu Pro Leu Leu His Ala 1105 1110 1115 1120 Phe Arg Ala Pro Gln Ala Pro Leu Arg Gly Ala Pro Glu Pro Thr Glu 1125 1130 1135 Val Phe His Ala Ala Val Arg Thr Ala Lys Val Gly Pro Gly Asp Ile 1140 1145 1150 Pro His Leu Asp Glu Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg 1155 1160 1165 Glu Phe Gly Leu Ile 1170 <210> 67 <211> 1168 <212> PRT <213> Mycolicibacterium smegmatis <400> 67 Met Thr Ile Glu Thr Arg Glu Asp Arg Phe Asn Arg Arg Ile Asp His 1 5 10 15 Leu Phe Glu Thr Asp Pro Gln Phe Ala Ala Ala Arg Pro Asp Glu Ala 20 25 30 Ile Ser Ala Ala Ala Ala Asp Pro Glu Leu Arg Leu Pro Ala Ala Val 35 40 45 Lys Gln Ile Leu Ala Gly Tyr Ala Asp Arg Pro Ala Leu Gly Lys Arg 50 55 60 Ala Val Glu Phe Val Thr Asp Glu Glu Gly Arg Thr Thr Ala Lys Leu 65 70 75 80 Leu Pro Arg Phe Asp Thr Ile Thr Tyr Arg Gln Leu Ala Gly Arg Ile 85 90 95 Gln Ala Val Thr Asn Ala Trp His Asn His Pro Val Asn Ala Gly Asp 100 105 110 Arg Val Ala Ile Leu Gly Phe Thr Ser Val Asp Tyr Thr Thr Ile Asp 115 120 125 Ile Ala Leu Leu Glu Leu Gly Ala Val Ser Val Pro Leu Gln Thr Ser 130 135 140 Ala Pro Val Ala Gln Leu Gln Pro Ile Val Ala Glu Thr Glu Pro Lys 145 150 155 160 Val Ile Ala Ser Ser Val Asp Phe Leu Ala Asp Ala Val Ala Leu Val 165 170 175 Glu Ser Gly Pro Ala Pro Ser Arg Leu Val Val Phe Asp Tyr Ser His 180 185 190 Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala Ala Lys Gly Lys Leu 195 200 205 Ala Gly Thr Gly Val Val Val Glu Thr Ile Thr Asp Ala Leu Asp Arg 210 215 220 Gly Arg Ser Leu Ala Asp Ala Pro Leu Tyr Val Pro Asp Glu Ala Asp 225 230 235 240 Pro Leu Thr Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys 245 250 255 Gly Ala Met Tyr Pro Glu Ser Lys Thr Ala Thr Met Trp Gln Ala Gly 260 265 270 Ser Lys Ala Arg Trp Asp Glu Thr Leu Gly Val Met Pro Ser Ile Thr 275 280 285 Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gly Ile Leu Cys 290 295 300 Ser Thr Leu Ala Ser Gly Gly Thr Ala Tyr Phe Ala Ala Arg Ser Asp 305 310 315 320 Leu Ser Thr Phe Leu Glu Asp Leu Ala Leu Val Arg Pro Thr Gln Leu 325 330 335 Asn Phe Val Pro Arg Ile Trp Asp Met Leu Phe Gln Glu Tyr Gln Ser 340 345 350 Arg Leu Asp Asn Arg Arg Ala Glu Gly Ser Glu Asp Arg Ala Glu Ala 355 360 365 Ala Val Leu Glu Glu Val Arg Thr Gln Leu Leu Gly Gly Arg Phe Val 370 375 380 Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Ala Glu Met Lys Ser Trp 385 390 395 400 Val Glu Asp Leu Leu Asp Met His Leu Leu Glu Gly Tyr Gly Ser Thr 405 410 415 Glu Ala Gly Ala Val Phe Ile Asp Gly Gln Ile Gln Arg Pro Pro Val 420 425 430 Ile Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe Ala Thr 435 440 445 Asp Arg Pro Tyr Pro Arg Gly Glu Leu Leu Val Lys Ser Glu Gln Met 450 455 460 Phe Pro Gly Tyr Tyr Lys Arg Pro Glu Ile Thr Ala Glu Met Phe Asp 465 470 475 480 Glu Asp Gly Tyr Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Gly Pro 485 490 495 Asp His Leu Glu Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ser 500 505 510 Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe Gly Asp 515 520 525 Ser Pro Leu Val Arg Gln Ile Tyr Val Tyr Gly Asn Ser Ala Arg Ser 530 535 540 Tyr Leu Leu Ala Val Val Val Pro Thr Glu Glu Ala Leu Ser Arg Trp 545 550 555 560 Asp Gly Asp Glu Leu Lys Ser Arg Ile Ser Asp Ser Leu Gln Asp Ala 565 570 575 Ala Arg Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp Phe Leu 580 585 590 Val Glu Thr Thr Pro Phe Thr Leu Glu Asn Gly Leu Leu Thr Gly Ile 595 600 605 Arg Lys Leu Ala Arg Pro Lys Leu Lys Ala His Tyr Gly Glu Arg Leu 610 615 620 Glu Gln Leu Tyr Thr Asp Leu Ala Glu Gly Gln Ala Asn Glu Leu Arg 625 630 635 640 Glu Leu Arg Arg Asn Gly Ala Asp Arg Pro Val Val Glu Thr Val Ser 645 650 655 Arg Ala Ala Val Ala Leu Leu Gly Ala Ser Val Thr Asp Leu Arg Ser 660 665 670 Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser 675 680 685 Phe Ser Asn Leu Leu His Glu Ile Phe Asp Val Asp Val Pro Val Gly 690 695 700 Val Ile Val Ser Pro Ala Thr Asp Leu Ala Gly Val Ala Ala Tyr Ile 705 710 715 720 Glu Gly Glu Leu Arg Gly Ser Lys Arg Pro Thr Tyr Ala Ser Val His 725 730 735 Gly Arg Asp Ala Thr Glu Val Arg Ala Arg Asp Leu Ala Leu Gly Lys 740 745 750 Phe Ile Asp Ala Lys Thr Leu Ser Ala Ala Pro Gly Leu Pro Arg Ser 755 760 765 Gly Thr Glu Ile Arg Thr Val Leu Leu Thr Gly Ala Thr Gly Phe Leu 770 775 780 Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu Arg Met Asp Leu Val Asp 785 790 795 800 Gly Lys Val Ile Cys Leu Val Arg Ala Arg Ser Asp Asp Glu Ala Arg 805 810 815 Ala Arg Leu Asp Ala Thr Phe Asp Thr Gly Asp Ala Thr Leu Leu Glu 820 825 830 His Tyr Arg Ala Leu Ala Ala Asp His Leu Glu Val Ile Ala Gly Asp 835 840 845 Lys Gly Glu Ala Asp Leu Gly Leu Asp His Asp Thr Trp Gln Arg Leu 850 855 860 Ala Asp Thr Val Asp Leu Ile Val Asp Pro Ala Ala Leu Val Asn His 865 870 875 880 Val Leu Pro Tyr Ser Gln Met Phe Gly Pro Asn Ala Leu Gly Thr Ala 885 890 895 Glu Leu Ile Arg Ile Ala Leu Thr Thr Thr Ile Lys Pro Tyr Val Tyr 900 905 910 Val Ser Thr Ile Gly Val Gly Gln Gly Ile Ser Pro Glu Ala Phe Val 915 920 925 Glu Asp Ala Asp Ile Arg Glu Ile Ser Ala Thr Arg Arg Val Asp Asp 930 935 940 Ser Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu 945 950 955 960 Leu Arg Glu Ala His Asp Trp Cys Gly Leu Pro Val Ser Val Phe Arg 965 970 975 Cys Asp Met Ile Leu Ala Asp Thr Thr Tyr Ser Gly Gln Leu Asn Leu 980 985 990 Pro Asp Met Phe Thr Arg Leu Met Leu Ser Leu Val Ala Thr Gly Ile 995 1000 1005 Ala Pro Gly Ser Phe Tyr Glu Leu Asp Ala Asp Gly Asn Arg Gln Arg 1010 1015 1020 Ala His Tyr Asp Gly Leu Pro Val Glu Phe Ile Ala Glu Ala Ile Ser 1025 1030 1035 1040 Thr Ile Gly Ser Gln Val Thr Asp Gly Phe Glu Thr Phe His Val Met 1045 1050 1055 Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp Glu Tyr Val Asp Trp Leu 1060 1065 1070 Ile Glu Ala Gly Tyr Pro Val His Arg Val Asp Asp Tyr Ala Thr Trp 1075 1080 1085 Leu Ser Arg Phe Glu Thr Ala Leu Arg Ala Leu Pro Glu Arg Gln Arg 1090 1095 1100 Gln Ala Ser Leu Leu Pro Leu Leu His Asn Tyr Gln Gln Pro Ser Pro 1105 1110 1115 1120 Pro Val Cys Gly Ala Met Ala Pro Thr Asp Arg Phe Arg Ala Ala Val 1125 1130 1135 Gln Asp Ala Lys Ile Gly Pro Asp Lys Asp Ile Pro His Val Thr Ala 1140 1145 1150 Asp Val Ile Val Lys Tyr Ile Ser Asn Leu Gln Met Leu Gly Leu Leu 1155 1160 1165 <210> 68 <211> 1186 <212> PRT <213> Segniliparus rotundus <400> 68 Met Thr Gln Ser His Thr Gln Gly Pro Gln Ala Ser Ala Ala His Ser 1 5 10 15 Arg Leu Ala Arg Arg Ala Ala Glu Leu Leu Ala Thr Asp Pro Gln Ala 20 25 30 Ala Ala Thr Leu Pro Asp Pro Glu Val Val Arg Gln Ala Thr Arg Pro 35 40 45 Gly Leu Arg Leu Ala Glu Arg Val Asp Ala Ile Leu Ser Gly Tyr Ala 50 55 60 Asp Arg Pro Ala Leu Gly Gln Arg Ser Phe Gln Thr Val Lys Asp Pro 65 70 75 80 Ile Thr Gly Arg Ser Ser Val Glu Leu Leu Pro Thr Phe Asp Thr Ile 85 90 95 Thr Tyr Arg Glu Leu Arg Glu Arg Ala Thr Ala Ile Ala Ser Asp Leu 100 105 110 Ala His His Pro Gln Ala Pro Ala Lys Pro Gly Asp Phe Leu Ala Ser 115 120 125 Ile Gly Phe Ile Ser Val Asp Tyr Val Ala Ile Asp Ile Ala Gly Val 130 135 140 Phe Ala Gly Leu Thr Ala Val Pro Leu Gln Thr Gly Ala Thr Leu Ala 145 150 155 160 Thr Leu Thr Ala Ile Thr Ala Glu Thr Ala Pro Thr Leu Phe Ala Ala 165 170 175 Ser Ile Glu His Leu Pro Thr Ala Val Asp Ala Val Leu Ala Thr Pro 180 185 190 Ser Val Arg Arg Leu Leu Val Phe Asp Tyr Arg Ala Gly Ser Asp Glu 195 200 205 Asp Arg Glu Ala Val Glu Ala Ala Lys Arg Lys Ile Ala Asp Ala Gly 210 215 220 Ser Ser Val Leu Val Asp Val Leu Asp Glu Val Ile Ala Arg Gly Lys 225 230 235 240 Ser Ala Pro Lys Ala Pro Leu Pro Pro Ala Thr Asp Ala Gly Asp Asp 245 250 255 Ser Leu Ser Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys 260 265 270 Gly Ala Met Tyr Pro Glu Arg Asn Val Ala His Phe Trp Gly Gly Val 275 280 285 Trp Ala Ala Ala Phe Asp Glu Asp Ala Ala Pro Pro Val Pro Ala Ile 290 295 300 Asn Ile Thr Phe Leu Pro Leu Ser His Val Ala Ser Arg Leu Ser Leu 305 310 315 320 Met Pro Thr Leu Ala Arg Gly Gly Leu Met His Phe Val Ala Lys Ser 325 330 335 Asp Leu Ser Thr Leu Phe Glu Asp Leu Lys Leu Ala Arg Pro Thr Asn 340 345 350 Leu Phe Leu Val Pro Arg Val Val Glu Met Leu Tyr Gln His Tyr Gln 355 360 365 Ser Glu Leu Asp Arg Arg Gly Val Gln Asp Gly Thr Arg Glu Ala Glu 370 375 380 Ala Val Lys Asp Asp Leu Arg Thr Gly Leu Leu Gly Gly Arg Ile Leu 385 390 395 400 Thr Ala Gly Phe Gly Ser Ala Pro Leu Ser Ala Glu Leu Ala Gly Phe 405 410 415 Ile Glu Ser Leu Leu Gln Ile His Leu Val Asp Gly Tyr Gly Ser Thr 420 425 430 Glu Ala Gly Pro Val Trp Arg Asp Gly Tyr Leu Val Lys Pro Pro Val 435 440 445 Thr Asp Tyr Lys Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr 450 455 460 Asp Ser Pro His Pro Arg Gly Glu Leu Ala Ile Lys Thr Gln Thr Ile 465 470 475 480 Leu Pro Gly Tyr Tyr Lys Arg Pro Glu Thr Thr Ala Glu Val Phe Asp 485 490 495 Glu Asp Gly Phe Tyr Leu Thr Gly Asp Val Val Ala Gln Ile Gly Pro 500 505 510 Glu Gln Phe Ala Tyr Val Asp Arg Arg Lys Asn Val Leu Lys Leu Ser 515 520 525 Gln Gly Glu Phe Val Thr Leu Ala Lys Leu Glu Ala Ala Tyr Ser Ser 530 535 540 Ser Pro Leu Val Arg Gln Leu Phe Val Tyr Gly Ser Ser Glu Arg Ser 545 550 555 560 Tyr Leu Leu Ala Val Ile Val Pro Thr Pro Asp Ala Leu Lys Lys Phe 565 570 575 Gly Val Gly Glu Ala Ala Lys Ala Ala Leu Gly Glu Ser Leu Gln Lys 580 585 590 Ile Ala Arg Asp Glu Gly Leu Gln Ser Tyr Glu Val Pro Arg Asp Phe 595 600 605 Ile Ile Glu Thr Asp Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Asp 610 615 620 Ala Arg Lys Ser Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg 625 630 635 640 Leu Glu Ala Met Tyr Lys Glu Leu Ala Asp Gly Gln Ala Asn Glu Leu 645 650 655 Arg Asp Ile Arg Arg Gly Val Gln Gln Arg Pro Thr Leu Glu Thr Val 660 665 670 Arg Arg Ala Ala Ala Ala Met Leu Gly Ala Ser Ala Ala Glu Ile Lys 675 680 685 Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu 690 695 700 Thr Phe Ser Asn Phe Leu His Asp Leu Phe Glu Val Asp Val Pro Val 705 710 715 720 Gly Val Ile Val Ser Ala Ala Asn Thr Leu Gly Ser Val Ala Glu His 725 730 735 Ile Asp Ala Gln Leu Ala Gly Gly Arg Ala Arg Pro Thr Phe Ala Thr 740 745 750 Val His Gly Lys Gly Ser Thr Thr Ile Lys Ala Ser Asp Leu Thr Leu 755 760 765 Asp Lys Phe Ile Asp Glu Gln Thr Leu Glu Ala Ala Lys His Leu Pro 770 775 780 Lys Pro Ala Asp Pro Pro Arg Thr Val Leu Leu Thr Gly Ala Asn Gly 785 790 795 800 Trp Leu Gly Arg Phe Leu Ala Leu Glu Trp Leu Glu Arg Leu Ala Pro 805 810 815 Ala Gly Gly Lys Leu Ile Thr Ile Val Arg Gly Lys Asp Ala Ala Gln 820 825 830 Ala Lys Ala Arg Leu Asp Ala Ala Tyr Glu Ser Gly Asp Pro Lys Leu 835 840 845 Ala Gly His Tyr Gln Asp Leu Ala Ala Thr Thr Leu Glu Val Leu Ala 850 855 860 Gly Asp Phe Ser Glu Pro Arg Leu Gly Leu Asp Glu Ala Thr Trp Asn 865 870 875 880 Arg Leu Ala Asp Glu Val Asp Phe Ile Ser His Pro Gly Ala Leu Val 885 890 895 Asn His Val Leu Pro Tyr Asn Gln Leu Phe Gly Pro Asn Val Ala Gly 900 905 910 Val Ala Glu Ile Ile Lys Leu Ala Ile Thr Thr Arg Ile Lys Pro Val 915 920 925 Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly Val Glu Pro Ser Ala 930 935 940 Leu Asp Glu Asp Gly Asp Ile Arg Thr Val Ser Ala Glu Arg Ser Val 945 950 955 960 Asp Glu Gly Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Gly Gly Glu 965 970 975 Val Leu Leu Arg Glu Ala His Asp Arg Thr Gly Leu Pro Val Arg Val 980 985 990 Phe Arg Ser Asp Met Ile Leu Ala His Gln Lys Tyr Thr Gly Gln Val 995 1000 1005 Asn Ala Thr Asp Gln Phe Thr Arg Leu Val Gln Ser Leu Leu Ala Thr 1010 1015 1020 Gly Leu Ala Pro Lys Ser Phe Tyr Glu Leu Asp Ala Gln Gly Asn Arg 1025 1030 1035 1040 Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp Phe Thr Ala Glu Ser 1045 1050 1055 Ile Thr Thr Leu Gly Gly Asp Gly Leu Glu Gly Tyr Arg Ser Tyr Asn 1060 1065 1070 Val Phe Asn Pro His Arg Asp Gly Val Gly Leu Asp Glu Phe Val Asp 1075 1080 1085 Trp Leu Ile Glu Ala Gly His Pro Ile Thr Arg Ile Asp Asp Tyr Asp 1090 1095 1100 Gln Trp Leu Ser Arg Phe Glu Thr Ser Leu Arg Gly Leu Pro Glu Ser 1105 1110 1115 1120 Lys Arg Gln Ala Ser Val Leu Pro Leu Leu His Ala Phe Ala Arg Pro 1125 1130 1135 Gly Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Thr Val Phe Arg Thr 1140 1145 1150 Asp Val Gln Lys Ala Lys Ile Gly Ala Glu His Asp Ile Pro His Leu 1155 1160 1165 Gly Lys Ala Leu Val Leu Lys Tyr Ala Asp Asp Ile Lys Gln Leu Gly 1170 1175 1180 Leu Leu 1185 <210> 69 <211> 224 <212> PRT <213> Bacillus subtilis <400> 69 Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu 1 5 10 15 Asn Glu Arg Phe Met Ser Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys 20 25 30 Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp 35 40 45 Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser 50 55 60 Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp 65 70 75 80 Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile 85 90 95 Cys Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys 100 105 110 Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr 115 120 125 Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr 130 135 140 His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly 145 150 155 160 Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly 165 170 175 Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys 180 185 190 Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His 195 200 205 Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu 210 215 220 <210> 70 <211> 251 <212> PRT <213> Leifsonia sp. <400> 70 Met Ala Gln Tyr Asp Val Ala Asp Arg Ser Ala Ile Val Thr Gly Gly 1 5 10 15 Gly Ser Gly Ile Gly Arg Ala Val Ala Leu Thr Leu Ala Ala Ser Gly 20 25 30 Ala Ala Val Leu Val Thr Asp Leu Asn Glu Glu His Ala Gln Ala Val 35 40 45 Val Ala Glu Ile Glu Ala Ala Gly Gly Lys Ala Ala Ala Leu Ala Gly 50 55 60 Asp Val Thr Asp Pro Ala Phe Gly Glu Ala Ser Val Ala Gly Ala Asn 65 70 75 80 Ala Leu Ala Pro Leu Lys Ile Ala Val Asn Asn Ala Gly Ile Gly Gly 85 90 95 Glu Ala Ala Thr Val Gly Asp Tyr Ser Leu Asp Ser Trp Arg Thr Val 100 105 110 Ile Glu Val Asn Leu Asn Ala Val Phe Tyr Gly Met Gln Pro Gln Leu 115 120 125 Lys Ala Met Ala Ala Asn Gly Gly Gly Ala Ile Val Asn Met Ala Ser 130 135 140 Ile Leu Gly Ser Val Gly Phe Ala Asn Ser Ser Ala Tyr Val Thr Ala 145 150 155 160 Lys His Ala Leu Leu Gly Leu Thr Gln Asn Ala Ala Leu Glu Tyr Ala 165 170 175 Ala Asp Lys Val Arg Val Val Ala Val Gly Pro Gly Phe Ile Arg Thr 180 185 190 Pro Leu Val Glu Ala Asn Leu Ser Ala Asp Ala Leu Ala Phe Leu Glu 195 200 205 Gly Lys His Ala Leu Gly Arg Leu Gly Glu Pro Glu Glu Val Ala Ser 210 215 220 Leu Val Ala Phe Leu Ala Ser Asp Ala Ala Ser Phe Ile Thr Gly Ser 225 230 235 240 Tyr His Leu Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 71 <211> 352 <212> PRT <213> Rhodococcus sp. <400> 71 Met Arg Val Phe Ala Val Gln Pro Glu Asp Thr Thr Ile His Asp Leu 1 5 10 15 Gln Val Pro Thr Pro Ser Pro Glu Gly Arg Glu Val Leu Leu Arg Val 20 25 30 Val Arg Ala Gly Val Cys His Thr Asp Thr His Leu Arg Ala Gly Gly 35 40 45 Tyr Asp Leu Gly Ser Arg Gly Met Met Ser Met Lys Glu Arg Gly Ile 50 55 60 Glu Tyr Pro Met Val Leu Gly His Glu Val Val Gly Val Val Glu Lys 65 70 75 80 Val Gly Asp Gly Val Glu Ser Val Gln Val Gly Asp Ile Arg Leu Ile 85 90 95 Tyr Pro Trp Ile Gly Cys Gly Glu Cys Arg Gln Cys Arg Ala Gly His 100 105 110 Asp Asn Arg Cys Ala Ala Gly Lys Asn Leu Gly Val Ala Arg His Gly 115 120 125 Gly Tyr Ala Glu Asn Ile Leu Val Pro Asp Glu Lys Tyr Leu Val Asp 130 135 140 Ile Asp Gly Leu Asp Pro Ser Trp Ala Ala Thr Leu Ala Cys Ser Gly 145 150 155 160 Leu Thr Ala Tyr Ser Ala Val Asp Lys Ala Leu Pro Leu Glu Pro Asp 165 170 175 Glu Pro Val Val Val Phe Gly Ala Gly Gly Leu Gly Leu Thr Ala Ile 180 185 190 Ala Ile Leu Arg Ser Arg Gly His Arg Asn Ile Cys Ala Val Asp Val 195 200 205 Ala Glu Arg Asn Leu Ala Leu Ala Arg Asp Met Gly Ala Ser Ser Thr 210 215 220 Val Leu Ser Gly Thr Gly Ser Gly Ala Asp Asp Ile Arg Gly Ala Ala 225 230 235 240 Gly Gly Pro Ala Gly Ala Val Ile Asp Phe Val Asn Asn Gly Ala Thr 245 250 255 Ala Thr Thr Ala Phe Glu Val Leu Ala Lys Ala Gly Ile Met Ile Gln 260 265 270 Val Gly Leu Phe Gly Gly Glu Val Thr Leu Pro Thr Ala Leu Leu Ala 275 280 285 Leu Arg Met Ile Arg Ile Glu Gly Ser Phe Val Gly Thr Leu Val Gln 290 295 300 Met Gln Asp Leu Val Arg Leu Ala Gln Arg Gly Glu Leu Pro His Ile 305 310 315 320 Pro Val Val Glu Arg Ser Leu Ser Ala Ala Ala Val Ser Gln Ala Leu 325 330 335 Asp Asp Leu Thr Ala Gly Gly Val Ala Gly Arg Ile Val Leu Thr Ala 340 345 350 <210> 72 <211> 352 <212> PRT <213> Acinetobacter sp. <400> 72 Met His Cys Tyr Cys Val Thr His His Gly Gln Pro Leu Glu Asp Val 1 5 10 15 Glu Lys Glu Ile Pro Gln Pro Lys Gly Thr Glu Val Leu Leu His Val 20 25 30 Lys Ala Ala Gly Leu Cys His Thr Asp Leu His Leu Trp Glu Gly Tyr 35 40 45 Tyr Asp Leu Gly Gly Gly Lys Arg Leu Ser Leu Ala Asp Arg Gly Leu 50 55 60 Lys Pro Pro Leu Thr Leu Ser His Glu Ile Thr Gly Gln Val Val Ala 65 70 75 80 Val Gly Pro Asp Ala Glu Ser Val Lys Val Gly Met Val Ser Leu Val 85 90 95 His Pro Trp Ile Gly Cys Gly Glu Cys Asn Tyr Cys Lys Arg Gly Glu 100 105 110 Glu Asn Leu Cys Ala Lys Pro Gln Gln Leu Gly Ile Ala Lys Pro Gly 115 120 125 Gly Phe Ala Glu Tyr Ile Ile Val Pro His Pro Arg Tyr Leu Val Asp 130 135 140 Ile Ala Gly Leu Asp Leu Ala Glu Ala Ala Pro Leu Ala Cys Ala Gly 145 150 155 160 Val Thr Thr Tyr Ser Ala Leu Lys Lys Phe Gly Asp Leu Ile Gln Ser 165 170 175 Glu Pro Val Val Ile Ile Gly Ala Gly Gly Leu Gly Leu Met Ala Leu 180 185 190 Glu Leu Leu Lys Ala Met Gln Ala Lys Gly Ala Ile Val Val Asp Ile 195 200 205 Asp Asp Ser Lys Leu Glu Ala Ala Arg Ala Ala Gly Ala Leu Ser Val 210 215 220 Ile Asn Ser Arg Ser Glu Asp Ala Ala Gln Gln Leu Ile Gln Ala Thr 225 230 235 240 Asp Gly Gly Ala Arg Leu Ile Leu Asp Leu Val Gly Ser Asn Pro Thr 245 250 255 Leu Ser Leu Ala Leu Ala Ser Ala Ala Arg Gly Gly His Ile Val Ile 260 265 270 Cys Gly Leu Met Gly Gly Glu Ile Lys Leu Ser Ile Pro Val Ile Pro 275 280 285 Met Arg Pro Leu Thr Ile Gln Gly Ser Tyr Val Gly Thr Val Glu Glu 290 295 300 Leu Arg Glu Leu Val Glu Leu Val Lys Glu Thr His Met Ser Ala Ile 305 310 315 320 Pro Val Lys Lys Leu Pro Ile Ser Gln Ile Asn Ser Ala Phe Gly Asp 325 330 335 Leu Lys Asp Gly Asn Val Ile Gly Arg Ile Val Leu Met His Glu Asn 340 345 350 <210> 73 <211> 391 <212> PRT <213> Clostridium ljungdahlii <400> 73 Met Glu Asn Phe Ile Phe Lys Asn Ala Thr Glu Ile Ile Phe Gly Lys 1 5 10 15 Asp Thr Glu Asn Leu Val Gly Ser Lys Val Lys Glu Tyr Ser Lys Ser 20 25 30 Asp Lys Ile Leu Phe Cys Tyr Gly Gly Gly Ser Ile Lys Arg Ser Gly 35 40 45 Leu Tyr Asp Arg Val Ile Lys Ser Leu Lys Glu Asn Gly Ile Glu Phe 50 55 60 Ile Glu Leu Pro Gly Ile Lys Pro Asn Pro Arg Leu Gly Pro Val Lys 65 70 75 80 Glu Gly Ile Arg Leu Cys Arg Glu Asn Asn Ile Lys Phe Val Leu Ser 85 90 95 Val Gly Gly Gly Ser Ser Ala Asp Thr Ala Lys Ala Ile Ala Val Gly 100 105 110 Val Pro Tyr Lys Gly Asp Val Trp Asp Phe Tyr Thr Gly Lys Ala Glu 115 120 125 Val Lys Glu Ala Leu Pro Val Gly Val Val Ile Thr Leu Pro Ala Thr 130 135 140 Gly Thr Glu Ser Ser Asn Ser Ser Val Ile Met Asn Glu Asp Gly Trp 145 150 155 160 Phe Lys Lys Gly Leu Asn Thr Val Leu Ile Arg Pro Ala Phe Ser Ile 165 170 175 Met Asn Pro Glu Leu Thr Phe Thr Leu Pro Glu Tyr Gln Thr Ala Cys 180 185 190 Gly Ala Cys Asp Ile Met Ala His Ile Met Glu Arg Tyr Phe Thr Asn 195 200 205 Val Lys His Val Asp Ile Thr Asp Arg Leu Cys Glu Ala Ala Leu Arg 210 215 220 Asn Val Ile Asn Asn Ala Pro Ile Val Leu Lys Asp Pro Lys Asn Tyr 225 230 235 240 Asp Ala Arg Ala Glu Ile Met Trp Thr Gly Thr Ile Ala His Asn Asp 245 250 255 Val Leu Ser Ala Gly Arg Ile Gly Asp Trp Ala Ser His Lys Ile Glu 260 265 270 His Glu Leu Ser Gly Glu Thr Asp Ile Ala His Gly Ala Gly Leu Ala 275 280 285 Ile Val Phe Pro Ala Trp Met Lys Tyr Val Tyr Lys His Asp Ile Asn 290 295 300 Arg Phe Val Gln Phe Ala Val Arg Val Trp Asp Val Asp Leu Ser Tyr 305 310 315 320 Ser Ser Cys Glu Asp Ile Val Leu Glu Gly Ile Arg Arg Met Thr Ala 325 330 335 Phe Phe Lys Ser Met Gly Leu Pro Val Thr Leu Lys Glu Gly Ser Ile 340 345 350 Gly Glu Asp Lys Ile Glu Glu Met Ala Asn Lys Cys Thr Asp Asn Gly 355 360 365 Thr Lys Thr Val Gly Gln Phe Val Lys Leu Asn Lys Asp Asp Ile Val 370 375 380 Lys Ile Leu Asn Leu Ala Lys 385 390 <210> 74 <211> 389 <212> PRT <213> Clostridium acetobutylicum <400> 74 Met Leu Ser Phe Asp Tyr Ser Ile Pro Thr Lys Val Phe Phe Gly Lys 1 5 10 15 Gly Lys Ile Asp Val Ile Gly Glu Glu Ile Lys Lys Tyr Gly Ser Arg 20 25 30 Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr 35 40 45 Asp Arg Ala Thr Ala Ile Leu Lys Glu Asn Asn Ile Ala Phe Tyr Glu 50 55 60 Leu Ser Gly Val Glu Pro Asn Pro Arg Ile Thr Thr Val Lys Lys Gly 65 70 75 80 Ile Glu Ile Cys Arg Glu Asn Asn Val Asp Leu Val Leu Ala Ile Gly 85 90 95 Gly Gly Ser Ala Ile Asp Cys Ser Lys Val Ile Ala Ala Gly Val Tyr 100 105 110 Tyr Asp Gly Asp Thr Trp Asp Met Val Lys Asp Pro Ser Lys Ile Thr 115 120 125 Lys Val Leu Pro Ile Ala Ser Ile Leu Thr Leu Ser Ala Thr Gly Ser 130 135 140 Glu Met Asp Gln Ile Ala Val Ile Ser Asn Met Glu Thr Asn Glu Lys 145 150 155 160 Leu Gly Val Gly His Asp Asp Met Arg Pro Lys Phe Ser Val Leu Asp 165 170 175 Pro Thr Tyr Thr Phe Thr Val Pro Lys Asn Gln Thr Ala Ala Gly Thr 180 185 190 Ala Asp Ile Met Ser His Thr Phe Glu Ser Tyr Phe Ser Gly Val Glu 195 200 205 Gly Ala Tyr Val Gln Asp Gly Ile Ala Glu Ala Ile Leu Arg Thr Cys 210 215 220 Ile Lys Tyr Gly Lys Ile Ala Met Glu Lys Thr Asp Asp Tyr Glu Ala 225 230 235 240 Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu 245 250 255 Ser Leu Gly Lys Asp Arg Lys Trp Ser Cys His Pro Met Glu His Glu 260 265 270 Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu 275 280 285 Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asp Asp Thr Leu His Lys 290 295 300 Phe Val Ser Tyr Gly Ile Asn Val Trp Gly Ile Asp Lys Asn Lys Asp 305 310 315 320 Asn Tyr Glu Ile Ala Arg Glu Ala Ile Lys Asn Thr Arg Glu Tyr Phe 325 330 335 Asn Ser Leu Gly Ile Pro Ser Lys Leu Arg Glu Val Gly Ile Gly Lys 340 345 350 Asp Lys Leu Glu Leu Met Ala Lys Gln Ala Val Arg Asn Ser Gly Gly 355 360 365 Thr Ile Gly Ser Leu Arg Pro Ile Asn Ala Glu Asp Val Leu Glu Ile 370 375 380 Phe Lys Lys Ser Tyr 385 <210> 75 <211> 477 <212> PRT <213> Acinetobacter sp. <400> 75 Met Asn Tyr Pro Asn Ile Pro Leu Tyr Ile Asn Gly Glu Phe Leu Asp 1 5 10 15 His Thr Asn Arg Asp Val Lys Glu Val Phe Asn Pro Val Asn His Glu 20 25 30 Cys Ile Gly Leu Met Ala Cys Ala Ser Gln Ala Asp Leu Asp Tyr Ala 35 40 45 Leu Glu Ser Ser Gln Gln Ala Phe Leu Arg Trp Lys Lys Thr Ser Pro 50 55 60 Ile Thr Arg Ser Glu Ile Leu Arg Thr Phe Ala Lys Leu Ala Arg Glu 65 70 75 80 Lys Ala Ala Glu Ile Gly Arg Asn Ile Thr Leu Asp Gln Gly Lys Pro 85 90 95 Leu Lys Glu Ala Ile Ala Glu Val Thr Val Cys Ala Glu His Ala Glu 100 105 110 Trp His Ala Glu Glu Cys Arg Arg Ile Tyr Gly Arg Val Ile Pro Pro 115 120 125 Arg Asn Pro Asn Val Gln Gln Leu Val Val Arg Glu Pro Leu Gly Val 130 135 140 Cys Leu Ala Phe Ser Pro Trp Asn Phe Pro Phe Asn Gln Ala Ile Arg 145 150 155 160 Lys Ile Ser Ala Ala Ile Ala Ala Gly Cys Thr Ile Ile Val Lys Gly 165 170 175 Ser Gly Asp Thr Pro Ser Ala Val Tyr Ala Ile Ala Gln Leu Phe His 180 185 190 Glu Ala Gly Leu Pro Asn Gly Val Leu Asn Val Ile Trp Gly Asp Ser 195 200 205 Asn Phe Ile Ser Asp Tyr Met Ile Lys Ser Pro Ile Ile Gln Lys Ile 210 215 220 Ser Phe Thr Gly Ser Thr Pro Val Gly Lys Lys Leu Ala Ser Gln Ala 225 230 235 240 Ser Leu Tyr Met Lys Pro Cys Thr Met Glu Leu Gly Gly His Ala Pro 245 250 255 Val Ile Val Cys Asp Asp Ala Asp Ile Asp Ala Ala Val Glu His Leu 260 265 270 Val Gly Tyr Lys Phe Arg Asn Ala Gly Gln Val Cys Val Ser Pro Thr 275 280 285 Arg Phe Tyr Val Gln Glu Gly Ile Tyr Lys Glu Phe Ser Glu Lys Val 290 295 300 Val Leu Arg Ala Lys Gln Ile Lys Val Gly Cys Gly Leu Asp Ala Ser 305 310 315 320 Ser Asp Met Gly Pro Leu Ala Gln Ala Arg Arg Met His Ala Met Gln 325 330 335 Gln Ile Val Glu Asp Ala Val His Lys Gly Ser Lys Leu Leu Leu Gly 340 345 350 Gly Asn Lys Ile Ser Asp Lys Gly Asn Phe Phe Glu Pro Thr Val Leu 355 360 365 Gly Asp Leu Cys Asn Asp Thr Gln Phe Met Asn Asp Glu Pro Phe Gly 370 375 380 Pro Ile Ile Gly Leu Ile Pro Phe Asp Thr Ile Asp His Val Leu Glu 385 390 395 400 Glu Ala Asn Arg Leu Pro Phe Gly Leu Ala Ser Tyr Ala Phe Thr Thr 405 410 415 Ser Ser Lys Asn Ala His Gln Ile Ser Tyr Gly Leu Glu Ala Gly Met 420 425 430 Val Ser Ile Asn His Met Gly Leu Ala Leu Ala Glu Thr Pro Phe Gly 435 440 445 Gly Ile Lys Asp Ser Gly Phe Gly Ser Glu Gly Gly Ile Glu Thr Phe 450 455 460 Asp Gly Tyr Leu Arg Thr Lys Phe Ile Thr Gln Leu Asn 465 470 475 <210> 76 <211> 787 <212> PRT <213> Clostridium butyricum <400> 76 Met Ile Ser Lys Gly Phe Ser Thr Gln Thr Glu Arg Ile Asn Ile Leu 1 5 10 15 Lys Ala Gln Ile Leu Asn Ala Lys Pro Cys Val Glu Ser Glu Arg Ala 20 25 30 Ile Leu Ile Thr Glu Ser Phe Lys Gln Thr Glu Gly Gln Pro Ala Ile 35 40 45 Leu Arg Arg Ala Leu Ala Leu Lys His Ile Leu Glu Asn Ile Pro Ile 50 55 60 Thr Ile Arg Asp Gln Glu Leu Ile Val Gly Ser Leu Thr Lys Glu Pro 65 70 75 80 Arg Ser Ser Gln Val Phe Pro Glu Phe Ser Asn Lys Trp Leu Gln Asp 85 90 95 Glu Leu Asp Arg Leu Asn Lys Arg Thr Gly Asp Ala Phe Gln Ile Ser 100 105 110 Glu Glu Ser Lys Glu Lys Leu Lys Asp Val Phe Glu Tyr Trp Asn Gly 115 120 125 Lys Thr Thr Ser Glu Leu Ala Thr Ser Tyr Met Thr Glu Glu Thr Arg 130 135 140 Glu Ala Val Asn Cys Asp Val Phe Thr Val Gly Asn Tyr Tyr Tyr Asn 145 150 155 160 Gly Val Gly His Val Ser Val Asp Tyr Gly Lys Val Leu Arg Val Gly 165 170 175 Phe Asn Gly Ile Ile Asn Glu Ala Lys Glu Gln Leu Glu Lys Asn Arg 180 185 190 Ser Ile Asp Pro Asp Phe Ile Lys Lys Glu Lys Phe Leu Asn Ser Val 195 200 205 Ile Ile Ser Cys Glu Ala Ala Ile Thr Tyr Val Asn Arg Tyr Ala Lys 210 215 220 Lys Ala Lys Glu Ile Ala Asp Asn Thr Ser Asp Ala Lys Arg Lys Ala 225 230 235 240 Glu Leu Asn Glu Ile Ala Lys Ile Cys Ser Lys Val Ser Gly Glu Gly 245 250 255 Ala Lys Ser Phe Tyr Glu Ala Cys Gln Leu Phe Trp Phe Ile His Ala 260 265 270 Ile Ile Asn Ile Glu Ser Asn Gly His Ser Ile Ser Pro Ala Arg Phe 275 280 285 Asp Gln Tyr Met Tyr Pro Tyr Tyr Glu Asn Asp Lys Asn Ile Thr Asp 290 295 300 Lys Phe Ala Gln Glu Leu Ile Asp Cys Ile Trp Ile Lys Leu Asn Asp 305 310 315 320 Ile Asn Lys Val Arg Asp Glu Ile Ser Thr Lys His Phe Gly Gly Tyr 325 330 335 Pro Met Tyr Gln Asn Leu Ile Val Gly Gly Gln Asn Ser Glu Gly Lys 340 345 350 Asp Ala Thr Asn Lys Val Ser Tyr Met Ala Leu Glu Ala Ala Val His 355 360 365 Val Lys Leu Pro Gln Pro Ser Leu Ser Val Arg Ile Trp Asn Lys Thr 370 375 380 Pro Asp Glu Phe Leu Leu Arg Ala Ala Glu Leu Thr Arg Glu Gly Leu 385 390 395 400 Gly Leu Pro Ala Tyr Tyr Asn Asp Glu Val Ile Ile Pro Ala Leu Val 405 410 415 Ser Arg Gly Leu Thr Leu Glu Asp Ala Arg Asp Tyr Gly Ile Ile Gly 420 425 430 Cys Val Glu Pro Gln Lys Pro Gly Lys Thr Glu Gly Trp His Asp Ser 435 440 445 Ala Phe Phe Asn Leu Ala Arg Ile Val Glu Leu Thr Ile Asn Ser Gly 450 455 460 Phe Asp Lys Asn Lys Gln Ile Gly Pro Lys Thr Gln Asn Phe Glu Glu 465 470 475 480 Met Lys Ser Phe Asp Glu Phe Met Lys Ala Tyr Lys Ala Gln Met Glu 485 490 495 Tyr Phe Val Lys His Met Cys Cys Ala Asp Asn Cys Ile Asp Ile Ala 500 505 510 His Ala Glu Arg Ala Pro Leu Pro Phe Leu Ser Ser Met Val Asp Asn 515 520 525 Cys Ile Gly Lys Gly Lys Ser Leu Gln Asp Gly Gly Ala Glu Tyr Asn 530 535 540 Phe Ser Gly Pro Gln Gly Val Gly Val Ala Asn Ile Gly Asp Ser Leu 545 550 555 560 Val Ala Val Lys Lys Ile Val Phe Asp Glu Asn Lys Ile Thr Pro Ser 565 570 575 Glu Leu Lys Lys Thr Leu Asn Asn Asp Phe Lys Asn Ser Glu Glu Ile 580 585 590 Gln Ala Leu Leu Lys Asn Ala Pro Lys Phe Gly Asn Asp Ile Asp Glu 595 600 605 Val Asp Asn Leu Ala Arg Glu Gly Ala Leu Val Tyr Cys Arg Glu Val 610 615 620 Asn Lys Tyr Thr Asn Pro Arg Gly Gly Asn Phe Gln Pro Gly Leu Tyr 625 630 635 640 Pro Ser Ser Ile Asn Val Tyr Phe Gly Ser Leu Thr Gly Ala Thr Pro 645 650 655 Asp Gly Arg Lys Ser Gly Gln Pro Leu Ala Asp Gly Val Ser Pro Ser 660 665 670 Arg Gly Cys Asp Val Ser Gly Pro Thr Ala Ala Cys Asn Ser Val Ser 675 680 685 Lys Leu Asp His Phe Ile Ala Ser Asn Gly Thr Leu Phe Asn Gln Lys 690 695 700 Phe His Pro Ser Ala Leu Lys Gly Asp Asn Gly Leu Met Asn Leu Ser 705 710 715 720 Ser Leu Ile Arg Ser Tyr Phe Asp Gln Lys Gly Phe His Val Gln Phe 725 730 735 Asn Val Ile Asp Lys Lys Ile Leu Leu Ala Ala Gln Lys Asn Pro Glu 740 745 750 Lys Tyr Gln Asp Leu Ile Val Arg Val Ala Gly Tyr Ser Ala Gln Phe 755 760 765 Ile Ser Leu Asp Lys Ser Ile Gln Asn Asp Ile Ile Ala Arg Thr Glu 770 775 780 His Val Met 785 <210> 77 <211> 304 <212> PRT <213> Clostridium butyricum <400> 77 Met Ser Lys Glu Ile Lys Gly Val Leu Phe Asn Ile Gln Lys Phe Ser 1 5 10 15 Leu His Asp Gly Pro Gly Ile Arg Thr Ile Val Phe Phe Lys Gly Cys 20 25 30 Ser Met Ser Cys Leu Trp Cys Ser Asn Pro Glu Ser Gln Asp Ile Lys 35 40 45 Pro Gln Val Met Phe Asn Lys Asn Leu Cys Thr Lys Cys Gly Arg Cys 50 55 60 Lys Ser Gln Cys Lys Ser Ala Ala Ile Asp Met Asn Ser Glu Tyr Arg 65 70 75 80 Ile Asp Lys Ser Lys Cys Thr Glu Cys Thr Lys Cys Val Asp Asn Cys 85 90 95 Leu Ser Gly Ala Leu Val Ile Glu Gly Arg Asn Tyr Ser Val Glu Asp 100 105 110 Val Ile Lys Glu Leu Lys Lys Asp Ser Val Gln Tyr Arg Arg Ser Asn 115 120 125 Gly Gly Ile Thr Leu Ser Gly Gly Glu Val Leu Leu Gln Pro Asp Phe 130 135 140 Ala Val Glu Leu Leu Lys Glu Cys Lys Ser Tyr Gly Trp His Thr Ala 145 150 155 160 Ile Glu Thr Ala Met Tyr Val Asn Ser Glu Ser Val Lys Lys Val Ile 165 170 175 Pro Tyr Ile Asp Leu Ala Met Ile Asp Ile Lys Ser Met Asn Asp Glu 180 185 190 Ile His Arg Lys Phe Thr Gly Val Ser Asn Glu Ile Ile Leu Gln Asn 195 200 205 Ile Lys Leu Ser Asp Glu Leu Ala Lys Glu Ile Ile Ile Arg Ile Pro 210 215 220 Val Ile Glu Gly Phe Asn Ala Asp Leu Gln Ser Ile Gly Ala Ile Ala 225 230 235 240 Gln Phe Ser Lys Ser Leu Thr Asn Leu Lys Arg Ile Asp Leu Leu Pro 245 250 255 Tyr His Asn Tyr Gly Glu Asn Lys Tyr Gln Ala Ile Gly Arg Glu Tyr 260 265 270 Ser Leu Lys Glu Leu Lys Ser Pro Ser Lys Asp Lys Met Glu Arg Leu 275 280 285 Lys Ala Leu Val Glu Ile Met Gly Ile Pro Cys Thr Ile Gly Ala Glu 290 295 300 <210> 78 <211> 558 <212> PRT <213> Lactobacillus reuteri <400> 78 Met Lys Arg Gln Lys Arg Phe Glu Glu Leu Glu Lys Arg Pro Ile His 1 5 10 15 Gln Asp Thr Phe Val Lys Glu Trp Pro Glu Glu Gly Phe Val Ala Met 20 25 30 Met Gly Pro Asn Asp Pro Lys Pro Ser Val Lys Val Glu Asn Gly Lys 35 40 45 Ile Val Glu Met Asp Gly Lys Lys Leu Glu Asp Phe Asp Leu Ile Asp 50 55 60 Leu Tyr Ile Ala Lys Tyr Gly Ile Asn Ile Asp Asn Val Glu Lys Val 65 70 75 80 Met Asn Met Asp Ser Thr Lys Ile Ala Arg Met Leu Val Asp Pro Asn 85 90 95 Val Ser Arg Asp Glu Ile Ile Glu Ile Thr Ser Ala Leu Thr Pro Ala 100 105 110 Lys Ala Glu Glu Ile Ile Ser Lys Leu Asp Phe Gly Glu Met Ile Met 115 120 125 Ala Val Lys Lys Met Arg Pro Arg Arg Lys Pro Asp Asn Gln Cys His 130 135 140 Val Thr Asn Thr Val Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala 145 150 155 160 Asp Ala Ala Leu Arg Gly Phe Pro Glu Gln Glu Thr Thr Thr Ala Val 165 170 175 Ala Arg Tyr Ala Pro Phe Asn Ala Ile Ser Ile Leu Ile Gly Ala Gln 180 185 190 Thr Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr 195 200 205 Glu Leu Gln Leu Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile 210 215 220 Ser Val Tyr Gly Thr Asp Arg Val Phe Thr Asp Gly Asp Asp Thr Pro 225 230 235 240 Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Gly Leu Lys 245 250 255 Met Arg Phe Thr Ser Gly Ala Gly Ser Glu Val Leu Met Gly Tyr Pro 260 265 270 Glu Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Leu Leu Thr 275 280 285 Lys Ala Ser Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile 290 295 300 Glu Ile Pro Gly Ala Val Pro Asn Gly Ile Arg Glu Val Leu Gly Glu 305 310 315 320 Asn Leu Leu Cys Met Met Cys Asp Ile Glu Cys Ala Ser Gly Cys Asp 325 330 335 Gln Ala Tyr Ser His Ser Asp Met Arg Arg Thr Glu Arg Phe Ile Gly 340 345 350 Gln Phe Ile Ala Gly Thr Asp Tyr Ile Asn Ser Gly Tyr Ser Ser Thr 355 360 365 Pro Asn Tyr Asp Asn Thr Phe Ala Gly Ser Asn Thr Asp Ala Met Asp 370 375 380 Tyr Asp Asp Met Tyr Val Met Glu Arg Asp Leu Gly Gln Tyr Tyr Gly 385 390 395 400 Ile His Pro Val Lys Glu Glu Thr Ile Ile Lys Ala Arg Asn Lys Ala 405 410 415 Ala Lys Ala Leu Gln Ala Val Phe Glu Asp Leu Gly Leu Pro Lys Ile 420 425 430 Thr Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala Asn Thr His Asp Asp 435 440 445 Met Pro Lys Arg Asp Met Val Ala Asp Met Lys Ala Ala Gln Asp Met 450 455 460 Met Asp Arg Gly Ile Thr Ala Ile Asp Ile Ile Lys Ala Leu Tyr Asn 465 470 475 480 His Gly Phe Lys Asp Val Ala Glu Ala Ile Leu Asn Leu Gln Lys Gln 485 490 495 Lys Val Val Gly Asp Tyr Leu Gln Thr Ser Ser Ile Phe Asp Lys Asp 500 505 510 Trp Asn Val Thr Ser Ala Val Asn Asp Gly Asn Asp Tyr Gln Gly Pro 515 520 525 Gly Thr Gly Tyr Arg Leu Tyr Glu Asp Lys Glu Glu Trp Asp Arg Ile 530 535 540 Lys Asp Leu Pro Phe Ala Leu Asp Pro Glu His Leu Glu Leu 545 550 555 <210> 79 <211> 236 <212> PRT <213> Lactobacillus reuteri <400> 79 Met Ala Asp Ile Asp Glu Asn Leu Leu Arg Lys Ile Val Lys Glu Val 1 5 10 15 Leu Ser Glu Thr Asn Gln Ile Asp Thr Lys Ile Asp Phe Asp Lys Ser 20 25 30 Asn Asp Ser Thr Ala Thr Ala Thr Gln Glu Val Gln Gln Pro Asn Ser 35 40 45 Lys Ala Val Pro Glu Lys Lys Leu Asp Trp Phe Gln Pro Val Gly Glu 50 55 60 Ala Lys Pro Gly Tyr Ser Lys Asp Glu Val Val Ile Ala Val Gly Pro 65 70 75 80 Ala Phe Ala Thr Val Leu Asp Lys Thr Glu Thr Gly Ile Pro His Lys 85 90 95 Glu Val Leu Arg Gln Val Ile Ala Gly Ile Glu Glu Glu Gly Leu Lys 100 105 110 Ala Arg Val Val Lys Val Tyr Arg Ser Ser Asp Val Ala Phe Cys Ala 115 120 125 Val Gln Gly Asp His Leu Ser Gly Ser Gly Ile Ala Ile Gly Ile Gln 130 135 140 Ser Lys Gly Thr Thr Val Ile His Gln Lys Asp Gln Asp Pro Leu Gly 145 150 155 160 Asn Leu Glu Leu Phe Pro Gln Ala Pro Val Leu Thr Pro Glu Thr Tyr 165 170 175 Arg Ala Ile Gly Lys Asn Ala Ala Met Tyr Ala Lys Gly Glu Ser Pro 180 185 190 Glu Pro Val Pro Ala Lys Asn Asp Gln Leu Ala Arg Ile His Tyr Gln 195 200 205 Ala Ile Ser Ala Ile Met His Ile Arg Glu Thr His Gln Val Val Val 210 215 220 Gly Lys Pro Glu Glu Glu Ile Lys Val Thr Phe Asp 225 230 235 <210> 80 <211> 172 <212> PRT <213> Lactobacillus reuteri <400> 80 Met Met Ser Glu Val Asp Asp Leu Val Ala Lys Ile Met Ala Gln Met 1 5 10 15 Gly Asn Ser Ser Ser Ala Asn Ser Ser Thr Gly Thr Ser Thr Ala Ser 20 25 30 Thr Ser Lys Glu Met Thr Ala Asp Asp Tyr Pro Leu Tyr Gln Lys His 35 40 45 Arg Asp Leu Val Lys Thr Pro Lys Gly His Asn Leu Asp Asp Ile Asn 50 55 60 Leu Gln Lys Val Val Asn Asn Gln Val Asp Pro Lys Glu Leu Arg Ile 65 70 75 80 Thr Pro Glu Ala Leu Lys Leu Gln Gly Glu Ile Ala Ala Asn Ala Gly 85 90 95 Arg Pro Ala Ile Gln Lys Asn Leu Gln Arg Ala Ala Glu Leu Thr Arg 100 105 110 Val Pro Asp Glu Arg Val Leu Glu Met Tyr Asp Ala Leu Arg Pro Phe 115 120 125 Arg Ser Thr Lys Gln Glu Leu Leu Asn Ile Ala Lys Glu Leu Arg Asp 130 135 140 Lys Tyr Asp Ala Asn Val Cys Ala Ala Trp Phe Glu Glu Ala Ala Asp 145 150 155 160 Tyr Tyr Glu Ser Arg Lys Lys Leu Lys Gly Asp Asn 165 170 <210> 81 <211> 616 <212> PRT <213> Lactobacillus reuteri <400> 81 Met Ala Thr Glu Lys Val Ile Gly Val Asp Ile Gly Asn Ser Ser Thr 1 5 10 15 Glu Val Ala Leu Ala Asp Val Ser Asp Ser Gly Gln Val His Phe Ile 20 25 30 Asn Ser Gly Ile Ala Pro Thr Thr Gly Ile Lys Gly Thr Lys Gln Asn 35 40 45 Leu Val Gly Ile Arg Asp Ser Ile Thr Gln Val Leu Asn Lys Ser Asn 50 55 60 Leu Thr Ile Asp Asp Ile Asp Leu Ile Arg Ile Asn Glu Ala Thr Pro 65 70 75 80 Val Ile Gly Asp Val Ala Met Glu Thr Ile Thr Glu Thr Val Val Thr 85 90 95 Glu Ser Thr Met Ile Gly His Asn Pro Asn Thr Pro Gly Gly Ile Gly 100 105 110 Thr Gly Ala Gly Ile Thr Val Arg Leu Leu Asp Leu Leu Lys Lys Thr 115 120 125 Asp Lys Ser Lys Asn Tyr Ile Val Val Val Pro Lys Asp Ile Asp Phe 130 135 140 Glu Asp Val Ala Lys Leu Ile Asn Ala Tyr Val Ala Ser Gly Tyr Lys 145 150 155 160 Ile Thr Ala Ala Ile Leu Arg Asn Asp Asp Gly Val Leu Val Asp Asn 165 170 175 Arg Leu Asn His Lys Ile Pro Ile Val Asp Glu Val Ala Met Ile Asp 180 185 190 Lys Val Pro Leu Asn Met Leu Ala Ala Val Glu Val Ala Gly Pro Gly 195 200 205 Gln Val Ile Ser Gln Leu Ser Asn Pro Tyr Gly Ile Ala Thr Leu Phe 210 215 220 Gly Leu Thr Pro Glu Glu Thr Lys Asn Ile Val Pro Val Ser Arg Ala 225 230 235 240 Leu Ile Gly Asn Arg Ser Ala Val Val Ile Lys Thr Pro Ala Gly Asp 245 250 255 Val Lys Ala Arg Val Ile Pro Ala Gly Lys Ile Ile Ile Asn Gly Asp 260 265 270 Thr Gly Lys Glu Glu Val Gly Val Ser Glu Gly Ala Asp Ala Ile Met 275 280 285 Lys Lys Val Ser Ser Phe Arg His Ile Asn Asn Ile Thr Gly Glu Ser 290 295 300 Gly Thr Asn Val Gly Gly Met Leu Glu Asn Val Arg Gln Thr Met Ala 305 310 315 320 Asp Leu Thr Gly Lys Lys Asn Asp Glu Ile Ala Ile Gln Asp Leu Leu 325 330 335 Ala Val Asp Thr Gln Val Pro Val Glu Val Arg Gly Gly Leu Ala Gly 340 345 350 Glu Phe Ser Asn Glu Ser Ala Val Gly Ile Ala Ala Met Val Lys Ser 355 360 365 Asp His Leu Gln Met Glu Val Ile Ala Lys Leu Ile Glu Lys Glu Phe 370 375 380 Asn Thr Lys Val Glu Ile Gly Gly Ala Glu Val Glu Ser Ala Ile Arg 385 390 395 400 Gly Ala Leu Thr Thr Pro Gly Thr Asp Lys Pro Ile Ala Ile Leu Asp 405 410 415 Leu Gly Ala Gly Ser Thr Asp Ala Ser Ile Ile Asn Lys Glu Asn Asn 420 425 430 Thr Val Ala Ile His Leu Ala Gly Ala Gly Asp Met Val Thr Met Ile 435 440 445 Ile Asn Ser Glu Leu Gly Leu Asn Asp Ile His Leu Ala Glu Asp Ile 450 455 460 Lys Arg Tyr Pro Leu Ala Lys Val Glu Asn Leu Phe Gln Ile Arg His 465 470 475 480 Glu Asp Gly Ser Val Gln Phe Phe Lys Asp Pro Leu Pro Ser Ser Leu 485 490 495 Phe Ala Lys Val Val Val Ile Lys Pro Asp Gly Tyr Glu Pro Val Thr 500 505 510 Gly Asn Pro Ser Ile Glu Lys Ile Lys Leu Val Arg Gln Ser Ala Lys 515 520 525 Lys Arg Val Phe Val Thr Asn Ala Leu Arg Ala Leu Lys Tyr Val Ser 530 535 540 Pro Thr Gly Asn Ile Arg Asp Ile Pro Phe Val Val Ile Val Gly Gly 545 550 555 560 Ser Ala Leu Asp Phe Glu Ile Pro Gln Leu Val Thr Asp Glu Leu Ala 565 570 575 His Phe Asn Leu Val Ala Gly Arg Gly Asn Val Arg Gly Val Glu Gly 580 585 590 Pro Arg Asn Ala Val Ala Thr Gly Leu Ile Leu Arg Tyr Gly Glu Glu 595 600 605 Arg Arg Lys Arg Tyr Glu Gln Arg 610 615 <210> 82 <211> 119 <212> PRT <213> Lactobacillus reuteri <400> 82 Met Asn Asn Asp Asp Ser Gln Arg Pro Ser Ile Val Val Gly Leu Glu 1 5 10 15 Asn Gly Ile Thr Ile Pro Asp Ser Val Lys Pro Leu Phe Tyr Gly Ile 20 25 30 Glu Glu Glu Gln Ile Pro Val Ser Val Arg Lys Ile Asn Ile Asn Asp 35 40 45 Thr Val Glu Arg Ala Tyr Gln Ser Ala Leu Ala Ser Arg Leu Ser Val 50 55 60 Gly Ile Ala Phe Glu Gly Asp His Phe Ile Val His Tyr Lys Asn Leu 65 70 75 80 Lys Glu Asn Gln Pro Leu Phe Asp Met Thr Ile Asn Asp Lys Lys Gln 85 90 95 Leu Arg Ile Leu Gly Ala Asn Ala Ala Arg Leu Val Lys Gly Ile Pro 100 105 110 Phe Lys Glu Met Ala Asn Arg 115 <210> 83 <211> 547 <212> PRT <213> Lactococcus lactis <400> 83 Met Tyr Thr Val Gly Asp Tyr Leu Leu Asp Arg Leu His Glu Leu Gly 1 5 10 15 Ile Glu Glu Ile Phe Gly Val Pro Gly Asp Tyr Asn Leu Gln Phe Leu 20 25 30 Asp Gln Ile Ile Ser Arg Glu Asp Met Lys Trp Ile Gly Asn Ala Asn 35 40 45 Glu Leu Asn Ala Ser Tyr Met Ala Asp Gly Tyr Ala Arg Thr Lys Lys 50 55 60 Ala Ala Ala Phe Leu Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Ile 65 70 75 80 Asn Gly Leu Ala Gly Ser Tyr Ala Glu Asn Leu Pro Val Val Glu Ile 85 90 95 Val Gly Ser Pro Thr Ser Lys Val Gln Asn Asp Gly Lys Phe Val His 100 105 110 His Thr Leu Ala Asp Gly Asp Phe Lys His Phe Met Lys Met His Glu 115 120 125 Pro Val Thr Ala Ala Arg Thr Leu Leu Thr Ala Glu Asn Ala Thr Tyr 130 135 140 Glu Ile Asp Arg Val Leu Ser Gln Leu Leu Lys Glu Arg Lys Pro Val 145 150 155 160 Tyr Ile Asn Leu Pro Val Asp Val Ala Ala Ala Lys Ala Glu Lys Pro 165 170 175 Ala Leu Ser Leu Glu Lys Glu Ser Ser Thr Thr Asn Thr Thr Glu Gln 180 185 190 Val Ile Leu Ser Lys Ile Glu Glu Ser Leu Lys Asn Ala Gln Lys Pro 195 200 205 Val Val Ile Ala Gly His Glu Val Ile Ser Phe Gly Leu Glu Lys Thr 210 215 220 Val Thr Gln Phe Val Ser Glu Thr Lys Leu Pro Ile Thr Thr Leu Asn 225 230 235 240 Phe Gly Lys Ser Ala Val Asp Glu Ser Leu Pro Ser Phe Leu Gly Ile 245 250 255 Tyr Asn Gly Lys Leu Ser Glu Ile Ser Leu Lys Asn Phe Val Glu Ser 260 265 270 Ala Asp Phe Ile Leu Met Leu Gly Val Lys Leu Thr Asp Ser Ser Thr 275 280 285 Gly Ala Phe Thr His His Leu Asp Glu Asn Lys Met Ile Ser Leu Asn 290 295 300 Ile Asp Glu Gly Ile Ile Phe Asn Lys Val Val Glu Asp Phe Asp Phe 305 310 315 320 Arg Ala Val Val Ser Ser Leu Ser Glu Leu Lys Gly Ile Glu Tyr Glu 325 330 335 Gly Gln Tyr Ile Asp Lys Gln Tyr Glu Glu Phe Ile Pro Ser Ser Ala 340 345 350 Pro Leu Ser Gln Asp Arg Leu Trp Gln Ala Val Glu Ser Leu Thr Gln 355 360 365 Ser Asn Glu Thr Ile Val Ala Glu Gln Gly Thr Ser Phe Phe Gly Ala 370 375 380 Ser Thr Ile Phe Leu Lys Ser Asn Ser Arg Phe Ile Gly Gln Pro Leu 385 390 395 400 Trp Gly Ser Ile Gly Tyr Thr Phe Pro Ala Ala Leu Gly Ser Gln Ile 405 410 415 Ala Asp Lys Glu Ser Arg His Leu Leu Phe Ile Gly Asp Gly Ser Leu 420 425 430 Gln Leu Thr Val Gln Glu Leu Gly Leu Ser Ile Arg Glu Lys Leu Asn 435 440 445 Pro Ile Cys Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg Glu 450 455 460 Ile His Gly Pro Thr Gln Ser Tyr Asn Asp Ile Pro Met Trp Asn Tyr 465 470 475 480 Ser Lys Leu Pro Glu Thr Phe Gly Ala Thr Glu Asp Arg Val Val Ser 485 490 495 Lys Ile Val Arg Thr Glu Asn Glu Phe Val Ser Val Met Lys Glu Ala 500 505 510 Gln Ala Asp Val Asn Arg Met Tyr Trp Ile Glu Leu Val Leu Glu Lys 515 520 525 Glu Asp Ala Pro Lys Leu Leu Lys Lys Met Gly Lys Leu Phe Ala Glu 530 535 540 Gln Asn Lys 545 <210> 84 <211> 331 <212> PRT <213> Puniceibacterium sp. <400> 84 Met Ser Ala Lys Arg Thr Leu Leu Thr Val Asp Asp Val Thr Gly Cys 1 5 10 15 Trp Ala Ile Met Pro Thr Pro Ala Lys Asp Asp Ala Ser Asp Trp Arg 20 25 30 Thr Glu Phe Ser Val Asp Leu Asp Glu Thr Ala Arg Val Ala Asn Ala 35 40 45 Leu Val Glu Ser Gly Val Asp Gly Ile Leu Ala Leu Gly Thr Phe Gly 50 55 60 Glu Gly Ala Thr Leu Thr Trp Glu Glu Lys Glu Ala Tyr Val Arg Thr 65 70 75 80 Val Val Asp Ala Val Ala Gly Arg Val Pro Phe Phe Ala Gly Thr Thr 85 90 95 Ser Leu Asn Thr Arg Glu Thr Ile Arg Gln Met Arg Ile Val Arg Asp 100 105 110 Ile Gly Val Asp Gly Val Met Leu Gly Ile Pro Met Trp Val Glu Ala 115 120 125 Asp Thr Ala Thr Ala Val Gln Phe Tyr Arg Asp Val Thr Glu Ala Cys 130 135 140 Pro Asp Val Ala Ile Cys Ala Tyr Ala Asn Pro Glu Ala Phe Lys Tyr 145 150 155 160 Glu Phe Gly Arg Ala Phe Trp Ala Gln Val Ser Asp Leu Pro Gln Ile 165 170 175 Val Ser Ala Lys Tyr Leu Asn Met Gly Gly Leu Tyr Pro Asp Leu Asn 180 185 190 Leu Ser Lys Arg Arg Ile Arg Leu Met Pro Leu Asp Val Asp Tyr Tyr 195 200 205 Ala Ala Ala Arg Ile Asp Pro Asp His Cys Thr Ala Phe Trp Thr Ser 210 215 220 Gly Ala Val Cys Gly Pro Glu Pro Ala Ile Leu Leu Arg Asp Leu Met 225 230 235 240 Glu Lys Ala Arg Lys Ser Gly Asp Trp Ala Glu Ala Lys Ala Leu Thr 245 250 255 Asp Arg Ile Gly Met Thr Tyr Lys Thr Leu Phe Pro Asn Gly Ser Phe 260 265 270 Lys Glu Phe Ser Arg Tyr Asn Ile Ser Ile Glu Lys Ile Arg Met Asp 275 280 285 Ala Ala Gly Trp Met Lys Ala Gly Pro Cys Arg Pro Pro Tyr His Val 290 295 300 Thr Pro Glu Pro Ile Leu Glu Gly Gly Arg Ile Ala Gly Gln Lys Trp 305 310 315 320 Ala Glu Leu Ala Glu Ser Leu Arg Ala Gly Asn 325 330 <210> 85 <211> 327 <212> PRT <213> Streptomyces sp. <400> 85 Met Ile Thr Ala Ala Glu Ile Asn Gly Met Tyr Gly Ile Ile Pro Thr 1 5 10 15 Pro Ala Leu Pro Gly Ala Glu Arg Leu Asp Ala Arg Asp Thr Val Asp 20 25 30 Val Asp Glu Thr Ala Arg Val Val Asp Arg Leu Ile Arg Asp Gly Val 35 40 45 Ser Gly Ile Ile Ala Leu Gly Thr Thr Gly Glu Cys Pro Ala Leu Ser 50 55 60 Glu Asp Asp Phe Asp Val Val Thr Asp Thr Val Val Glu Ala Val Ala 65 70 75 80 Gly Arg Val Pro Val Phe Val Gly Ala Thr Gly Ala Gly Gly His Gly 85 90 95 Thr Ala Arg Arg Leu Arg Lys Val Ala Ala Ser Gly Ala Thr Gly Ala 100 105 110 Leu Leu Gly Leu Pro Met Trp Gln Pro Leu Thr Thr Ala Met Ala Val 115 120 125 Glu Tyr Tyr Ala Gln Ala Ser Ala Ala Phe Pro Asp Leu Ala Leu Met 130 135 140 Val Tyr Ala Asn Ala Arg Ala Phe Arg Tyr Thr Phe Pro Val Glu Phe 145 150 155 160 Trp Gln Gly Val Ser Ser Gln Ala Pro Thr Val Thr Ser Ala Lys Val 165 170 175 Ser Arg Ala Pro Gln Leu Glu Arg Met Leu Glu Val Thr Gly Lys Lys 180 185 190 Val Asn Phe Ile Pro Ser Asp Met Val Val His Asp Phe Ala Ala Arg 195 200 205 Ala Pro Gln Thr Thr Thr Ala Cys Trp Ala Thr Ala Ala Gly Met Gly 210 215 220 Pro Glu Pro Ser Ile Ala Leu Met Asp Ala Leu Arg Arg Gly Asp Ser 225 230 235 240 Glu Ala Ala Gly Arg Ala Val Ala Gly Ile Ala Trp Ala Asn Glu Pro 245 250 255 Leu Ala His Leu Phe Ala Asp Gln Glu Ile Phe Ala Ser Tyr Asn Thr 260 265 270 Gln Ile Glu Lys Ser Arg Ile Ala Ala Ala Gly Tyr Cys Arg Pro Gly 275 280 285 Pro Val Arg Ser Pro Tyr His His Leu Pro Glu Glu Tyr Ala Ala Ala 290 295 300 Ser Ala Val Cys Gly Gln Arg Trp Arg Glu Leu Arg Glu Arg Ile Ala 305 310 315 320 Ala Gly Thr Asn Asp Gln Lys 325 <210> 86 <211> 261 <212> PRT <213> Clostridium magnum <400> 86 Met Ile Lys Gly Tyr Ser Leu Pro Leu Thr Pro Lys Gly Thr Ser Asn 1 5 10 15 Ile Val Pro Ala Pro Pro Trp His Tyr Val Gly Asn Val Leu Ala Ile 20 25 30 Glu Tyr Glu Ala Tyr Ala Glu Asn Ile Ala Ala Phe Leu Pro Glu Gly 35 40 45 Leu Glu Phe Ser Ser Asn Gln Cys Ala Ile Tyr Phe Ile Glu Trp Gln 50 55 60 Tyr Cys Ser Glu Phe Gly Glu Glu His Leu Asp Pro Val Asn Ser Gln 65 70 75 80 Tyr Lys Glu Thr Ile Val Leu Val Ser Ala Asn Tyr Lys Gly Thr Pro 85 90 95 Val Ser Tyr Cys Pro Phe Ile Trp Val Asp Gln Asp Leu Ser Leu Met 100 105 110 Arg Gly Leu Ile Gln Gly Trp Pro Lys Gln Leu Gly Glu Thr Tyr Ile 115 120 125 Thr Arg Pro Tyr Asn Leu Pro Ser Lys Ala Ala Ser Asn Leu Glu Lys 130 135 140 Gly Gly Lys Leu Gly Ala Thr Leu Ser Val Lys Gly Arg Arg Leu Val 145 150 155 160 Asp Ala Arg Ile Thr Val Asn Lys Lys Thr Glu Thr Leu Pro Asn Pro 165 170 175 Thr Phe Ala Gln Ala Ile Asn Leu Arg His Phe Pro Glu Leu Val Leu 180 185 190 Gly Arg His Asn Gln Pro Leu Ile His Glu Leu Val Gln Leu Lys Ser 195 200 205 Arg Asp Leu His Ile Ser Pro Ile Trp Lys Gly Asp Ala Ile Leu Asn 210 215 220 Phe Phe Asp His Pro Phe Ile Glu Leu Ser Asp Leu Lys Pro Thr Lys 225 230 235 240 Val Lys Asn Ser Tyr Tyr Phe Ser Ala Ala Leu Thr Val Asp Asp Leu 245 250 255 Ser Gln Leu Glu Val 260 <210> 87 <211> 323 <212> PRT <213> Allokutzneria albata <400> 87 Met Arg Ala Val Val Val Arg Ser His Gly Gly Pro Glu Val Leu Val 1 5 10 15 Ala Glu Glu Leu Asp Arg Pro Glu Pro Gly Pro Gly Ala Val Leu Val 20 25 30 Asp Val Ala Ala Ala Gly Val Asn Tyr Ile Asp Thr Tyr His Arg Glu 35 40 45 Gly Val Tyr Pro Ile Pro Thr Pro Phe Thr Leu Gly Leu Glu Gly Ala 50 55 60 Gly Thr Val Ala Ala Leu Gly Glu Gly Val Thr Glu Phe Ala Val Gly 65 70 75 80 Asp Arg Val Ala Trp Ala Ser Ala Ile Gly Ser Tyr Ala Gln Gln Val 85 90 95 Ala Ala Pro Ala Ala Gln Leu Val Pro Val Pro Ser Thr Val Asp Leu 100 105 110 Glu Ile Ala Ala Gly Ala Met Leu Gln Gly Met Thr Ala His Tyr Leu 115 120 125 Thr Ala Ser Thr His Pro Ile Ala Glu Gly Asp Val Ala Leu Val His 130 135 140 Ala Ala Ala Gly Gly Met Gly Leu Leu Leu Thr Gln Met Ile Lys Ala 145 150 155 160 Arg Gly Gly Arg Val Ile Gly Thr Val Ser Thr Ala Glu Lys Glu Lys 165 170 175 Leu Ala Arg Glu Ala Gly Ala Asp Glu Val Ile Arg Tyr Thr Glu Gln 180 185 190 Asp Val Ala Gln Arg Val Arg Glu Leu Thr Asp Gly Val Gly Val His 195 200 205 Val Val Tyr Asp Gly Val Gly Lys Asp Thr Phe Asp Ala Ser Leu Ala 210 215 220 Ser Leu Arg Pro Arg Gly Leu Leu Ala Leu Tyr Gly Ala Ala Ser Gly 225 230 235 240 Ala Val Pro Pro Phe Asp Ala Gln Arg Leu Asn Ala Gly Gly Ser Leu 245 250 255 Phe Leu Thr Arg Pro Ser Leu Gly His His Thr Ala Thr Arg Glu Glu 260 265 270 Leu Leu Trp Arg Ala Gly Glu Val Phe Asp Ala Ile Gln Ala Gly Glu 275 280 285 Leu Asp Ile Ala Ile Gly Gly Arg Tyr Ala Leu Asp Ser Ala Arg Gln 290 295 300 Ala His Glu Asp Leu Gln Gly Arg Arg Thr Thr Gly Lys Leu Leu Leu 305 310 315 320 Thr Thr Ser <210> 88 <211> 326 <212> PRT <213> Acidaminococcus intestini <400> 88 Met Lys Ala Ile Val Met Lys Glu Phe Gly Gly Pro Glu Val Leu Lys 1 5 10 15 Tyr Val Asp Val Pro Asp Pro Val Pro Glu Ala Asn Glu Val Leu Ile 20 25 30 Lys Leu Ala Phe Cys Gly Val Asn Pro Asn Glu Thr Tyr Val Arg Thr 35 40 45 Gly Thr Tyr Asn Phe Tyr Lys Pro Glu Leu Pro Tyr Thr Pro Gly Tyr 50 55 60 Asp Gly Ala Gly Val Ile Glu Lys Val Gly Ala Gly Val Thr His Val 65 70 75 80 Lys Val Gly Asp Arg Val Phe Val Ala Ala Leu Leu Ala Lys Arg Asn 85 90 95 Thr Gly Thr Tyr Ala Gln Lys Val Val Cys Asp Ala Asp Ser Val His 100 105 110 Lys Leu Pro Asp Phe Ile Ser Phe Glu Glu Gly Ala Ser Phe Gly Ile 115 120 125 Pro Ala Met Ala Ala Tyr Arg Ala Leu Phe His Arg Ala His Ile Lys 130 135 140 Ala Gly Glu Ile Val Met Ile His Gly Ala Glu Gly Gly Val Gly Ser 145 150 155 160 Leu Ala Val Gln Met Ala Lys Ala Val Gly Ala Ile Val Ile Gly Thr 165 170 175 Gly Thr Thr Pro Glu Gly Leu Asp Ile Val Arg Ser Phe Gly Ala Asp 180 185 190 Tyr Ala Ile Tyr His Leu Lys Ala Asp Asn Gln Asp Glu Leu Met Glu 195 200 205 Leu Thr Lys Gly Lys Gly Pro Asp Val Ile Ile Glu Phe Leu Ala Asn 210 215 220 Val Asn Leu Gln Thr Asp Leu Lys Val Ile Ala Lys Tyr Gly Arg Ile 225 230 235 240 Val Val Val Gly Asn Arg Gly Thr Ile Glu Ile Asn Pro Arg Leu Ala 245 250 255 Met Ala Asn Glu Ser Thr Ile Leu Gly Met Ala Leu Trp Asn Ala Pro 260 265 270 Ala Asn Glu Tyr Arg Glu Ser Leu Phe Ala Leu Arg Ala Phe Met Gln 275 280 285 Ser Gly Ala Val Arg Ala Lys Val Gly Lys Gln Leu Leu Leu Lys Asp 290 295 300 Ala Ala Gln Ala His Asn Glu Ile Ile Asn Gly Leu Ala Lys Gly Lys 305 310 315 320 Met Ile Leu Lys Ile Glu 325 <210> 89 <211> 325 <212> PRT <213> Mycobacteroides chelonae <400> 89 Met Arg Ala Ile Glu Val Pro Val Thr Gly Gly Pro Glu Val Leu Thr 1 5 10 15 Leu Val Glu Lys Thr Ala Pro Thr Pro Gly Pro Gly Glu Val Leu Ile 20 25 30 Asp Val Asp Ala Val Gly Val Asn Phe Arg Asp Ile Tyr Leu Arg Asn 35 40 45 Gly Ser Tyr Ala Ala Pro Leu Pro His Ile Pro Gly Ser Glu Val Thr 50 55 60 Gly Val Val Ser Ala Val Gly Glu Gly Val Glu Asn Leu Ala Pro Gly 65 70 75 80 Asp Arg Val Ala Ser Pro Val Ala Ala Trp Gly Tyr Ala Glu Ser Thr 85 90 95 Thr Ala Pro Ala Asp Tyr Thr Ala Lys Val Pro Ala Gly Leu Ser Ser 100 105 110 Glu Val Ala Ala Ser Ala Leu Leu Gln Gly Ile Thr Ala His Tyr Leu 115 120 125 Leu Thr Ser Val Tyr Pro Val Ala Ala Gly Asp Thr Val Leu Val His 130 135 140 Ala Gly Ala Gly Gly Met Gly Leu Leu Leu Thr Gln Trp Ala Ser His 145 150 155 160 Arg Gly Val Arg Val Ile Thr Thr Val Ser Ser Ala Ala Lys Glu Lys 165 170 175 Leu Ser Arg Glu Ala Gly Ala Ala Glu Val Leu Pro Tyr Pro Asp Pro 180 185 190 Thr Asp Pro Ala Glu Phe Ala Glu Lys Ile Leu Glu Leu Thr Ser Gly 195 200 205 Glu Gly Val Ala Val Ala Tyr Asp Gly Val Gly Lys Ser Thr Phe Glu 210 215 220 Ala Ser Leu Ala Ala Val Arg Val Arg Gly Leu Ile Ala Leu Tyr Gly 225 230 235 240 Ala Ala Ser Gly Gln Val Pro Pro Phe Asp Pro Gln Arg Leu Thr Ala 245 250 255 Lys Ser Ala Val Leu Thr Arg Pro Thr Met Gly His Phe Ile Arg Thr 260 265 270 Pro Ala Glu Phe Ala Trp Arg Ala Asp Asp Val Leu Asp Leu Val Ser 275 280 285 Arg Gly Thr Leu Lys Ile Thr Val Gly Ala Ser Tyr Pro Leu Glu Gln 290 295 300 Ala Ala Gln Ala His Ile Asp Leu Glu Ala Arg Lys Thr Thr Gly Ser 305 310 315 320 Val Val Leu Val Pro 325 <210> 90 <211> 321 <212> PRT <213> Nocardia brasiliensis <400> 90 Met Arg Ala Ile Gln Val Ser Glu His Gly Gly Pro Glu Val Leu His 1 5 10 15 His Val Glu Leu Pro Asp Pro Thr Ile Asp Ala Asp Gln Leu Leu Val 20 25 30 Asp Val Gln Ala Thr Gly Ile Asn Phe Ile Asp Thr Tyr Ile Arg Thr 35 40 45 Gly Arg Tyr Pro Gln Asp Val Pro Tyr Val Pro Gly Ser Glu Ala Thr 50 55 60 Gly Val Val Ala Glu Val Gly Ala Asn Val Thr Glu Phe Ala Val Gly 65 70 75 80 Asp Arg Val Ala Trp Ala Ser Ala Pro Gly Ser Tyr Ala Glu Arg Val 85 90 95 Ala Val Arg Ala Asp Val Ala Val Glu Val Pro Asp Gly Val Glu Pro 100 105 110 Pro Val Ala Ala Ser Ala Leu Leu Gln Gly Met Thr Ala His Tyr Leu 115 120 125 Leu Glu Ser Ile Tyr Thr Pro Glu Pro Gly Glu Thr Val Leu Val His 130 135 140 Ala Gly Ala Gly Gly Val Gly Leu Ile Leu Thr Gln Leu Ala Val Ala 145 150 155 160 Arg Gly Ala Arg Val Ile Thr Thr Val Ser Ser Asp Val Lys Glu Lys 165 170 175 Leu Ser Arg Glu Ala Gly Ala Thr Glu Val Leu Arg Tyr Gly Asp Asp 180 185 190 Leu Ala Asp Glu Val Arg Thr Leu Thr Asp Gly Val Gly Val Ala Ala 195 200 205 Val Tyr Asp Gly Val Gly Ala Ser Thr Phe Glu Ala Ser Leu Arg Ser 210 215 220 Leu Arg Val Arg Gly Met Leu Ala Leu Phe Gly Ala Ala Ser Gly Pro 225 230 235 240 Val Pro Pro Phe Asp Leu Gln Arg Leu Asn Gly Ala Gly Ser Leu Phe 245 250 255 Val Thr Arg Pro Ser Leu Ala Phe Tyr Thr Arg Asp Arg Ala Glu Leu 260 265 270 Leu Trp Arg Ala Thr Asp Ile Phe Thr Ala Ile Ala Glu Gly Thr Leu 275 280 285 Gln Ile Arg Ile Gly Ala Thr Tyr Pro Leu Ala Glu Ala Glu Gln Ala 290 295 300 His Arg Asp Leu Glu Ser Arg Lys Thr Thr Gly Ser Ile Val Leu Leu 305 310 315 320 Pro <210> 91 <211> 325 <212> PRT <213> Pseudomonas oleovorans <400> 91 Met Ala Lys Arg Ile Gln Phe Ser Gln His Gly Gly Ser Glu Val Leu 1 5 10 15 Glu Tyr Arg Asp Tyr Gln Pro Ala Ala Pro Gly Pro Arg Glu Val Arg 20 25 30 Val Ala Asn Lys Ala Ile Gly Leu Asn Phe Ile Asp Thr Tyr Phe Arg 35 40 45 Ser Gly Leu Tyr Gln Pro Pro Ala Leu Pro Ser Ser Leu Gly Thr Glu 50 55 60 Gly Ala Gly Val Val Glu Ala Ile Gly Ser Glu Val Glu Gly Leu Lys 65 70 75 80 Val Gly Asp Arg Val Ala Tyr Ala Thr Gly Pro Leu Gly Ala Tyr Ser 85 90 95 Glu Leu His Val Leu Pro Ala Asp Asn Leu Val His Leu Pro Asp Ser 100 105 110 Ile Ser Phe Glu Gln Ala Ala Ala Val Met Leu Lys Gly Leu Thr Val 115 120 125 Gln Tyr Leu Leu Arg Gln Thr Tyr Glu Leu Lys Gly Gly Glu Thr Ile 130 135 140 Leu Phe His Ala Ala Ala Gly Gly Val Gly Ser Phe Ala Cys Gln Trp 145 150 155 160 Ala Lys Ala Leu Gly Val Asn Leu Ile Gly Thr Val Ser Ser Ala Lys 165 170 175 Lys Ala Ala Leu Ala Lys Glu Leu Gly Ala Trp Glu Thr Ile Asp Tyr 180 185 190 Ser His Glu Asn Val Val Gln Arg Val Leu Glu Leu Thr Asp Gly Ala 195 200 205 Lys Cys Pro Val Val Tyr Asp Gly Val Gly Lys Asp Thr Trp Glu Thr 210 215 220 Ser Leu Asp Cys Val Ala Pro Arg Gly Leu Leu Val Ser Phe Gly Asn 225 230 235 240 Ala Ser Gly Ala Val Thr Gly Val Asn Leu Gly Ile Leu Ala Gln Lys 245 250 255 Gly Ser Leu Tyr Val Thr Arg Pro Thr Leu Ala Ser Tyr Ala Asn Thr 260 265 270 Pro Gln Asn Leu Gln Ala Met Ala Asp Glu Leu Phe Ala Met Ile Ser 275 280 285 Ser Gly Lys Leu Gln Val Asp Ile Ser Asn Arg Tyr Ala Leu Lys Asp 290 295 300 Ala Ala Ala Ala Gln Asp Ala Leu Ser Ser Arg Gln Thr Thr Gly Ser 305 310 315 320 Thr Ile Leu Leu Pro 325 <210> 92 <211> 321 <212> PRT <213> Caulobacter vibrioides <400> 92 Met Leu Ala Val Gln Ala Val Arg Thr Gly Gly Pro Glu Val Leu Glu 1 5 10 15 Val Val Asp Leu Pro Leu Pro Ser Pro Gly Pro Gly Gln Ile Leu Val 20 25 30 Arg His Gln Ala Val Gly Leu Asn Tyr Ile Asp Thr Tyr His Arg Ser 35 40 45 Gly Leu Tyr Pro Val Lys Thr Pro Leu Val Ile Gly Leu Glu Ala Ala 50 55 60 Gly Val Val Glu Ser Val Gly Glu Ala Val Thr Arg Phe Lys Val Gly 65 70 75 80 Asp Arg Val Ala Tyr Asn Gly Thr Met Gly Ala Tyr Ala Gln Ala Ala 85 90 95 Val Val Pro Ala Glu Arg Ala Val Leu Val Pro Asp Gly Val Ser Leu 100 105 110 Glu Val Ala Ala Ala Ala Leu Leu Lys Gly Met Thr Ala Glu Phe Leu 115 120 125 Val Arg Arg Cys Phe His Val Lys Gln Gly Asp Trp Val Leu Val His 130 135 140 Ala Ala Ala Gly Gly Val Gly Gln Ile Leu Val Gln Trp Cys Lys Ala 145 150 155 160 Leu Gly Ala Thr Val Val Ala Thr Val Gly Ser Thr Ala Lys Ala Thr 165 170 175 Ile Ala Arg Asp Leu Gly Ala Asp His Val Ile Asp Tyr Ser His Glu 180 185 190 Asp Val Ala Ala Arg Val Ala Glu Leu Thr Gly Gly Arg Gly Val Ala 195 200 205 Val Val Tyr Asp Gly Val Gly Lys Asp Thr Trp Glu Ala Ser Leu Ala 210 215 220 Ser Leu Ala Arg Arg Gly Met Leu Val Thr Phe Gly Asn Ala Ser Gly 225 230 235 240 Pro Ala Pro Ala Phe Pro Pro Leu Ala Leu Ala Pro Lys Ser Ala Phe 245 250 255 Val Thr Arg Pro Lys Leu Phe Asp Tyr Ile Val Thr Thr Glu Glu Leu 260 265 270 Asp Glu Ser Ala Gln Ala Leu Phe Ala Val Ile Ala Ser Gly Ala Ile 275 280 285 Lys Ile Asp Ile Gly Gln Thr Phe Pro Leu Ala Glu Ala Arg Ala Ala 290 295 300 His Glu Ala Leu Glu Gly Arg Arg Thr Thr Gly Ala Thr Leu Leu Leu 305 310 315 320 Pro <210> 93 <211> 322 <212> PRT <213> Saccharopolyspora flava <400> 93 Met Arg Ala Ile Arg Val Thr Ser His Gly Gly Pro Glu Ala Leu Glu 1 5 10 15 Val Ser Glu Val Glu Val Pro Glu Pro Gly Pro Gly Gln Leu Leu Val 20 25 30 Asp Val Ala Ala Ser Gly Val Asn Phe Ile Asp Thr Tyr Gln Arg Ser 35 40 45 Gly Val Tyr Ser Val Pro Leu Pro Phe Thr Pro Gly Ser Glu Gly Ala 50 55 60 Gly Glu Ile Val Ala Val Gly Pro Asp Val Asp Gly Phe Ala Val Gly 65 70 75 80 Glu Arg Val Ala Trp Ala Met Thr Pro Gly Ser Tyr Ala Glu Lys Ala 85 90 95 Leu Val Pro Ala Arg Ala Ala Val Lys Ile Pro Asp Gly Val Asp Thr 100 105 110 Arg Thr Ala Ala Ala Ala Thr Leu Gln Gly Met Thr Ala His Phe Leu 115 120 125 Val Thr Ser Thr His Glu Ile Lys Thr Gly Glu Thr Ala Leu Val His 130 135 140 Ala Ala Ala Gly Gly Met Gly Leu Leu Leu Thr Gln Leu Ile Lys Ser 145 150 155 160 Lys Gly Gly Asn Val Ile Gly Thr Val Ser Thr Asp Glu Lys Glu Arg 165 170 175 Leu Ala Arg Glu Ala Gly Ala Asp Glu Ile Ile Arg Tyr Thr Glu Ala 180 185 190 Asp Val Ala Ala Glu Val Lys Asp Leu Thr Asp Gly Arg Gly Val Asp 195 200 205 Val Val Tyr Asp Gly Val Gly Lys Ser Thr Phe Glu Ala Ser Leu Ala 210 215 220 Ser Leu Arg Pro Arg Gly Thr Leu Ala Leu Phe Gly Gly Ala Ser Gly 225 230 235 240 Gln Val Pro Pro Phe Asp Pro Gln Arg Leu Asn Gly Ala Gly Ser Leu 245 250 255 Phe Leu Thr Arg Pro Ser Leu Ala His His Val Leu Thr Arg Glu Glu 260 265 270 Leu Glu Trp Arg Ala Gly Glu Val Phe Gly Trp Ile Ser Ser Gly Ala 275 280 285 Leu His Ile Arg Val Ser Gly Thr Tyr Ser Leu Glu Asp Ala Ala Arg 290 295 300 Ala His Glu Asp Leu Glu Gly Arg Arg Thr Thr Gly Lys Leu Leu Ile 305 310 315 320 Leu Pro <210> 94 <211> 320 <212> PRT <213> Sciscionella marina <400> 94 Met Thr Asn Ala Ile Arg Val His Glu Thr Gly Gly Pro Glu Val Leu 1 5 10 15 Arg Leu Asp Glu Val Thr Arg Glu Ala Gly Ala Gly Gln Leu Leu Val 20 25 30 Arg Val Glu Ala Ala Gly Val Asn Phe Ile Asp Thr Tyr Gln Arg Ser 35 40 45 Gly Val Tyr Ser Val Glu Leu Pro His Ala Leu Gly Leu Glu Gly Ala 50 55 60 Gly Thr Val Glu Ala Val Gly Asp Glu Ala Ser Asp Phe Thr Pro Gly 65 70 75 80 Asp Arg Val Ala Trp Val Trp Ala Ala Gly Ser Tyr Ala Glu His Thr 85 90 95 Val Val Pro Val Glu Arg Ala Val Arg Ile Pro Asp Asp Val Asp Thr 100 105 110 Lys Thr Ala Gly Ala Leu Met Leu Gln Gly Leu Thr Ala His Tyr Leu 115 120 125 Leu Arg Ser Thr Tyr Arg Val Asp Glu Thr Asp Thr Val Leu Val His 130 135 140 Ala Ala Ala Gly Gly Val Gly Leu Leu Leu Val Gln Leu Ala Lys Ser 145 150 155 160 Leu Gly Ala Arg Val Ile Ala Thr Ala Ser Thr Ala Glu Lys Arg Ala 165 170 175 Leu Ala Thr Gly Ala Gly Ala Asp Glu Val Leu Gly Tyr Glu Gly Phe 180 185 190 Asp Thr Lys Leu Arg Glu Leu Thr Gly Gly Ile Gly Val Ser Val Val 195 200 205 Tyr Asp Gly Val Gly Lys Asp Thr Phe Asp Ala Ser Leu Ala Ser Ile 210 215 220 Arg Pro Arg Gly Tyr Leu Val Leu Phe Gly Gly Ser Ser Gly Gln Val 225 230 235 240 Pro Pro Phe Asp Leu Gln Arg Leu Asn Ala Ala Gly Ser Leu Phe Val 245 250 255 Thr Arg Pro Ser Leu Gly Pro Tyr Ile Ala Asp Arg Thr Glu Tyr Glu 260 265 270 Trp Arg Val Gly Glu Leu Phe Glu Ala Val Gly Asn Gly Ser Leu Asn 275 280 285 Val Arg Ile Gly Gly Ser Tyr Pro Leu Ala Glu Ala Ala Asn Ala His 290 295 300 Arg Asp Leu Glu Gly Arg Lys Thr Thr Gly Lys Leu Leu Leu Val Pro 305 310 315 320 <210> 95 <211> 332 <212> PRT <213> Zymomonas mobilis <400> 95 Met Ser Glu Ala Tyr Ala Ile Ile Ala Glu Lys Ala Gly Gly Pro Glu 1 5 10 15 Val Leu Val Lys Lys Pro Leu Asp Leu Gly Lys Met Lys Pro Glu Ala 20 25 30 Gly Gln Val Leu Leu Arg His Gln Ala Ile Gly Leu Asn Phe Ile Asp 35 40 45 Ile Tyr His Arg Ser Gly Leu Tyr Lys Gln Asp Phe Pro Ala Asn Leu 50 55 60 Gly Cys Glu Ala Ala Gly Val Ile Glu Val Val Gly Asp Lys Val Lys 65 70 75 80 Gly Phe Lys Ala Gly Asp Arg Val Ala Val Phe Thr Ser Lys Pro Gly 85 90 95 Ala Tyr Ala Thr His Arg Ile Val Asp Ala Ser Glu Leu Val Ala Leu 100 105 110 Pro Asp Asp Ile Ser Ala Glu Thr Ala Ala Ala Val Leu Leu Lys Gly 115 120 125 Met Thr Ser Trp Met Leu Ala Glu Lys Cys Leu Ala His Ala Ala Ile 130 135 140 Glu Gly Glu Ala Pro Lys Val Met Val Leu Ala Ala Ala Gly Gly Val 145 150 155 160 Gly Ser Leu Leu Ile Pro Trp Leu Lys Tyr Leu Gly Val Thr Val Phe 165 170 175 Ala His Thr Ser Thr Glu Glu Lys Ala Ala Lys Val Lys Ala Asn Gly 180 185 190 Ala Asp Tyr Val Thr Thr Leu Pro Tyr Ser Asp Leu Pro Asp Trp Val 195 200 205 Arg Lys Gln Asn His Gly Glu Gly Val His Ala Val Leu Asp Ser Val 210 215 220 Gly Ala Asp Ser Trp Lys Ser Ser Ile Ala Ser Leu Arg Lys Lys Gly 225 230 235 240 Leu Trp Val Val Tyr Gly Asn Ala Ser Gly Pro Val Pro Ala Leu Ser 245 250 255 Pro Leu Glu Leu Ser Lys Ala Gly Ser Ile Tyr Thr Ser Arg Pro Arg 260 265 270 Leu Ile Asp Tyr Val Asp Asn Ser Val Asp Leu Thr Thr Ala Ser Gln 275 280 285 Lys Leu Phe Ala Leu Leu Arg Lys Asn Ile Leu Lys Val Glu Ile Asn 290 295 300 Gln Arg Phe Pro Leu Thr Glu Val Ala Lys Ala His Gln Leu Leu Glu 305 310 315 320 Ser Arg Lys Thr Thr Gly Ser Thr Val Leu Ile Pro 325 330 <210> 96 <211> 324 <212> PRT <213> Methylobacterium sp. <400> 96 Met Pro Lys Ala Ile Arg Val His Glu Tyr Gly Gly Pro Glu Val Met 1 5 10 15 Arg Tyr Glu Glu Val Asp Leu Pro Ala Pro Gly Pro Gly Gln Ile Arg 20 25 30 Val Arg Gln Arg Ala Val Gly Val Asn Phe Ile Asp Ile Tyr Phe Arg 35 40 45 Ser Gly Leu Tyr Lys Ala Pro Gln Leu Pro Phe Thr Pro Gly Asn Glu 50 55 60 Gly Thr Gly Glu Val Val Ala Val Gly Glu Gly Val Ala Gly Leu Ala 65 70 75 80 Val Gly Asp Arg Val Ala Tyr Gly Ser Ala Ala Gln Thr Tyr Ala Gln 85 90 95 Glu Ala Val Ile Glu Ala Arg Met Ala Val Lys Val Pro Asp Gly Ile 100 105 110 Asp Asp Ala Thr Ala Ala Ala Met Met Leu Lys Gly Leu Thr Ala Gln 115 120 125 Tyr Leu Leu Arg Lys Thr Tyr Arg Val Gln Pro Gly Asp Thr Ile Leu 130 135 140 Phe His Ala Ala Ala Gly Gly Val Gly Leu Ile Ala Thr Gln Trp Ala 145 150 155 160 Lys His Leu Gly Ala Thr Val Ile Gly Thr Val Gly Ser Arg Asp Lys 165 170 175 Ala Glu Leu Ala Lys Gln His Gly Cys Asp His Val Ile Leu Tyr Arg 180 185 190 Asp Glu Asp Phe Ala Ala Arg Val Lys Glu Ile Thr Gly Gly Lys Gly 195 200 205 Cys Ala Val Val Tyr Asp Gly Val Gly Gln Ala Thr Tyr Pro Ala Ser 210 215 220 Leu Asp Cys Leu Arg Pro Phe Gly Met Phe Val Ser Phe Gly Asn Ala 225 230 235 240 Ser Gly Val Ile Glu Asn Phe Asn Ile Gly Leu Leu Gly Pro Lys Gly 245 250 255 Ser Leu Tyr Ala Thr Arg Pro Thr Leu Phe Thr His Val Ala Glu Arg 260 265 270 Ala Ser Leu Glu Ala Met Ala Asp Asp Leu Phe Gly Val Val Gly Ser 275 280 285 Gly Ala Val Arg Ile Pro Val His Ser Arg Val Pro Leu Ala Glu Ala 290 295 300 Ala Gln Val His Arg Asp Leu Ala Gly Arg Gln Thr Thr Gly Ala Thr 305 310 315 320 Val Leu Ile Pro <210> 97 <211> 324 <212> PRT <213> Trinickia sp. <400> 97 Met Ala Lys Ala Ile Arg Phe Glu Lys Thr Gly Gly Pro Glu Val Met 1 5 10 15 Gln Trp Val Asp Val Glu Val Gly Asp Pro Gly Ser Gly Glu Val Arg 20 25 30 Ile Lys Gln His Ala Val Gly Leu Asn Tyr Ile Asp Val Tyr Phe Arg 35 40 45 Thr Gly Leu Tyr Pro Met Pro Leu Pro Gly Gly Leu Gly Met Glu Ala 50 55 60 Ala Gly Glu Val Thr Ala Val Gly Pro Asp Val Glu Gly Leu Arg Val 65 70 75 80 Gly Asp Arg Val Ala Tyr Val Ala Arg Pro Pro Gly Ala Tyr Ala Gln 85 90 95 Glu Arg Val Leu Pro Ala Ala Ala Leu Val Lys Leu Pro Gly Ala Leu 100 105 110 Gly Tyr Asp Asp Ala Ala Ser Ala Met Leu Gln Gly Leu Thr Ala Gln 115 120 125 Tyr Leu Leu Arg Arg Thr Tyr Arg Val Lys Ala Gly Asp Thr Ile Leu 130 135 140 Ile Gln Ala Ala Ala Gly Gly Val Gly Leu Phe Val Cys Gln Trp Ala 145 150 155 160 Lys Ala Leu Gly Ala Thr Val Ile Gly Thr Val Ser Ser Asp Glu Lys 165 170 175 Ala Glu Leu Ala Lys Ala His Gly Cys Asp Tyr Pro Ile Val Tyr Thr 180 185 190 Arg Glu Ser Phe Thr Lys Arg Val Lys Glu Ile Thr Gly Gly Ala Gly 195 200 205 Val Pro Val Val Tyr Asp Ser Ile Gly Lys Asp Thr Phe Thr Gly Ser 210 215 220 Leu Asp Cys Leu Ala Pro Leu Gly Leu Phe Val Ser Phe Gly Asn Ala 225 230 235 240 Ser Gly Pro Leu Pro Pro Ile Asp Ser Ser Glu Phe Ala Gly Arg Gly 245 250 255 Ser Leu Phe Phe Thr Arg Pro Thr Leu Phe Thr His Ile Ala Lys Arg 260 265 270 Ser Asp Tyr Asp Ala Met Ala Ala Glu Leu Phe Asp Val Ile Val Ser 275 280 285 Gly Lys Val Lys Thr Met Ile Arg Gln Arg Phe Pro Leu Ala Glu Val 290 295 300 Gly Gln Ala His Ala Asp Leu Glu Ala Arg Arg Thr Thr Gly Ser Thr 305 310 315 320 Ile Leu Ile Pro <210> 98 <211> 332 <212> PRT <213> Clostridioides difficile <400> 98 Met Lys Ile Leu Val Phe Gly Ala Arg Asp Tyr Glu Glu Pro Val Ile 1 5 10 15 Lys Lys Trp Ser Glu Glu His Lys Asp Val Gln Val Asp Ile Tyr Pro 20 25 30 Glu Asn Met Thr Glu Glu Asn Val Val Lys Ala Lys Gly Tyr Asp Gly 35 40 45 Ile Ser Ile Gln Gln Thr Asn Tyr Ile Asp Asn Pro Tyr Ile Tyr Glu 50 55 60 Thr Leu Lys Asp Ala Gly Val Lys Val Ile Ala Ser Arg Thr Ala Gly 65 70 75 80 Val Asp Met Ile His Phe Asp Leu Val Asn Glu Asn Gly Leu Ile Val 85 90 95 Thr Asn Val Pro Ser Tyr Ser Pro Asn Ala Ile Ala Glu Leu Ala Val 100 105 110 Thr Gln Ala Met Asn Leu Leu Arg Lys Thr Pro Leu Val Lys Lys Lys 115 120 125 Val Cys Glu Gly Asp Tyr Arg Trp Ile Ala Glu Leu Leu Gly Thr Glu 130 135 140 Val Arg Ser Ile Thr Val Gly Val Ile Gly Thr Gly Lys Ile Gly Ala 145 150 155 160 Thr Ser Ala Lys Leu Phe Lys Gly Leu Gly Ala Asn Val Ile Ala Phe 165 170 175 Asp Gln Tyr Pro Asn Ser Asp Leu Asn Asp Ile Leu Thr Tyr Lys Asp 180 185 190 Ser Leu Glu Asp Leu Leu Lys Glu Ala Asp Leu Ile Thr Leu His Thr 195 200 205 Pro Leu Leu Glu Gly Thr Lys His Met Ile Asn Lys Asp Thr Leu Ala 210 215 220 Ile Met Lys Asp Gly Ala Tyr Ile Val Asn Thr Gly Arg Gly Gly Leu 225 230 235 240 Ile Asn Thr Gly Asp Leu Ile Glu Ala Leu Glu Ser Gly Lys Ile Arg 245 250 255 Ala Ala Ala Leu Asp Thr Phe Glu Thr Glu Gly Leu Phe Leu Asn Lys 260 265 270 Lys Met Asn Pro Gly Glu Leu Thr Asp Pro Glu Ile Asn Lys Leu Leu 275 280 285 Ser Met Glu Gln Val Ile Phe Thr His His Leu Gly Phe Phe Thr Ser 290 295 300 Thr Ala Ile Glu Asn Ile Val Tyr Ser Ser Leu Ser Ser Ala Val Glu 305 310 315 320 Val Ile Lys Thr Gly Thr Ala Thr Asn Arg Val Asn 325 330 <210> 99 <211> 312 <212> PRT <213> Lactococcus lactis <400> 99 Met Arg Ile Thr Ile Ala Gly Ala Gly Ala Met Gly Ser Arg Phe Gly 1 5 10 15 Leu Met Leu His Lys Gly Gly Asn Glu Val Thr Leu Ile Asp Gly Trp 20 25 30 Pro Glu His Val Lys Ala Ile Lys Asp His Gly Leu Arg Ala Asn Tyr 35 40 45 Asn Gly Glu Glu Leu Thr Ala His Leu Ser Val Glu Leu Gln Ser Glu 50 55 60 Ile Ser Ser Lys Glu Lys Thr Asp Leu Ile Ile Leu Phe Thr Lys Ala 65 70 75 80 Met Gln Leu Asp Lys Met Leu Gln Asp Ile Lys Pro Leu Ile Asp Glu 85 90 95 His Thr Lys Val Leu Cys Leu Leu Asn Gly Ile Gly His Glu Asp Thr 100 105 110 Ile Glu Lys Tyr Val Ser Lys Asn Asn Ile Phe Ile Gly Asn Thr Met 115 120 125 Trp Thr Ala Gly Leu Glu Gly Pro Gly Lys Ala Lys Leu Phe Gly Asp 130 135 140 Gly Ser Val Glu Leu Gln Asn Leu Ile Ser Gly Glu Glu Glu Thr Ala 145 150 155 160 Lys Lys Leu Ala Glu Ile Leu Ser Glu Ser Gly Leu Asn Ala Lys Tyr 165 170 175 Ser Asn Asn Ile His Tyr Ser Ile Tyr Arg Lys Ala Cys Val Asn Gly 180 185 190 Thr Met Asn Gly Leu Cys Thr Ile Leu Asp Thr Asn Met Ala Gly Leu 195 200 205 Gly Glu Thr Lys Pro Ala His Asp Met Val Val Thr Ile Val Asn Glu 210 215 220 Phe Ala Ala Val Ala Lys Phe Glu Asn Val Asn Leu Asp Ile Ala Glu 225 230 235 240 Val Val Gln His Val Glu Thr Cys Phe Asp Pro Ala Thr Ile Gly Leu 245 250 255 His Tyr Pro Ser Met Tyr Gln Asp Leu Ile Lys Asn Asn Arg Leu Thr 260 265 270 Glu Ile Asp Tyr Ile Asn Gly Ala Val Ser Arg Lys Gly Lys Lys Tyr 275 280 285 Asn Val Ala Thr Pro Tyr Cys Asp Phe Leu Thr Gln Leu Val His Ser 290 295 300 Lys Glu Glu Leu Leu Lys Ala Lys 305 310 <210> 100 <211> 334 <212> PRT <213> Clostridium sporogenes <400> 100 Met Lys Ile Leu Met Tyr Ser Val Arg Glu His Glu Lys Pro Ala Ile 1 5 10 15 Lys Lys Trp Leu Glu Ala Asn Pro Gly Val Gln Ile Asp Leu Ser Asp 20 25 30 Glu Ala Leu Ser Glu Asp Thr Val Cys Lys Val Lys Asp Tyr Asp Gly 35 40 45 Ile Ala Ile Gln Gln Thr Asn Ser Ile Gly Gly Glu Thr Val Tyr Ser 50 55 60 Thr Leu Lys Lys Tyr Gly Ile Arg Gln Ile Ala Ser Arg Thr Ala Gly 65 70 75 80 Val Asp Met Ile Asp Leu Lys Met Ala Ser Glu Asn Asn Ile Ile Val 85 90 95 Thr Asn Val Pro Ala Tyr Ser Pro Asn Ala Ile Ala Glu Leu Ala Val 100 105 110 Thr His Thr Met Asn Leu Leu Arg Asn Ile Lys Thr Val Asn Lys Arg 115 120 125 Ile Ala Phe Gly Asp Tyr Arg Trp Ser Ala Asp Leu Ile Ala Arg Glu 130 135 140 Val Arg Ser Ile Thr Val Gly Val Val Gly Thr Gly Lys Ile Gly Arg 145 150 155 160 Thr Ser Ala Lys Leu Phe Lys Gly Leu Gly Ala Asn Val Ile Gly Tyr 165 170 175 Asp Ala Tyr Pro Asp Lys Lys Leu Glu Glu Asn Asn Leu Leu Thr Tyr 180 185 190 Lys Asp Ser Leu Glu Asp Leu Leu Lys Glu Ala Asp Val Val Thr Leu 195 200 205 His Thr Pro Leu Leu Glu Ser Thr Lys His Met Ile Asn Lys Asn Asn 210 215 220 Leu Lys Tyr Met Lys Pro Asn Ala Phe Ile Val Asn Thr Gly Arg Gly 225 230 235 240 Gly Ile Ile Asn Thr Glu Asp Leu Ile Glu Ala Leu Glu Glu Asn Lys 245 250 255 Ile Ala Gly Ala Ala Leu Asp Thr Phe Glu Asn Glu Gly Leu Phe Leu 260 265 270 Asn Lys Val Ile Asp Pro Thr Lys Ile Pro Asp Pro Gln Leu Asp Lys 275 280 285 Leu Leu Lys Met Asp Gln Val Leu Ile Thr His His Val Gly Phe Phe 290 295 300 Thr Thr Thr Ala Val Gln Asn Met Val Asp Thr Ser Leu Asp Ser Val 305 310 315 320 Met Glu Val Leu Lys Thr Asn Asp Ser Val Asn Lys Ala Asn 325 330 <210> 101 <211> 333 <212> PRT <213> Lactobacillus delbrueckii <400> 101 Met Thr Lys Ile Ala Met Tyr Asn Val Ser Pro Ile Glu Val Pro Tyr 1 5 10 15 Ile Glu Asp Trp Ala Lys Lys Asn Asp Val Glu Ile Lys Thr Thr Asp 20 25 30 Gln Ala Leu Thr Ser Ala Thr Val Asp Leu Ala Glu Gly Cys Ser Ser 35 40 45 Val Ser Leu Lys Pro Leu Gly Pro Val Asp Glu Glu Val Val Tyr Gln 50 55 60 Lys Leu Ser Glu Tyr Gly Val Lys Cys Ile Gly Leu Arg Ile Val Gly 65 70 75 80 Phe Asn Thr Ile Asn Phe Asp Trp Thr Lys Lys Tyr Asn Leu Leu Val 85 90 95 Thr Asn Val Pro Val Tyr Ser Pro Arg Ala Ile Ala Glu Met Thr Val 100 105 110 Thr Gln Ala Met Tyr Leu Leu Arg Lys Ile Gly Glu Phe Arg Tyr Arg 115 120 125 Met Asp His Asp His Asp Phe Thr Trp Pro Ser Asn Leu Ile Ser Asn 130 135 140 Glu Ile Tyr Asn Leu Thr Val Gly Leu Ile Gly Val Gly His Ile Gly 145 150 155 160 Ser Ala Val Ala Glu Ile Phe Ser Ala Met Gly Ala Lys Val Ile Ala 165 170 175 Tyr Asp Val Ala Tyr Asn Pro Glu Phe Glu Pro Phe Leu Thr Tyr Thr 180 185 190 Asp Phe Asp Thr Val Leu Lys Glu Ala Asp Ile Val Ser Leu His Thr 195 200 205 Pro Leu Leu Pro Ser Thr Glu Asn Met Ile Gly Glu Lys Gln Leu Lys 210 215 220 Glu Met Lys Lys Ser Ala Tyr Leu Ile Asn Cys Ala Arg Gly Glu Leu 225 230 235 240 Val Asp Thr Gly Ala Leu Ile Lys Ala Leu Gln Asp Gly Glu Ile Ala 245 250 255 Gly Ala Gly Leu Asp Thr Leu Ala Gly Glu Ser Ser Tyr Phe Gly His 260 265 270 Thr Gly Leu Thr Asp Ser Glu Ile Pro Glu Asp Tyr Lys Thr Leu Ala 275 280 285 Lys Met Pro Asn Val Val Ile Thr Pro His Ser Ala Phe Tyr Thr Glu 290 295 300 Thr Ser Ile Arg Asn Met Val Gln Ile Cys Leu Thr Asp Gln Leu Thr 305 310 315 320 Ile Ala Lys Gly Gly Arg Pro Arg Ser Ile Val Asn Leu 325 330 <210> 102 <211> 330 <212> PRT <213> Lacticaseibacillus paracasei <400> 102 Met Thr Lys Ile Leu Met Tyr Thr Val Arg Pro Asp Glu Arg Ala Ala 1 5 10 15 Ile Asp Ala Trp Val Ala Ala Asn Asp Ile Gln Val Asp Thr Asn Thr 20 25 30 Val Glu Phe Gly Pro Asp Thr Val Asp Leu Ala Lys Gly Tyr Asp Gly 35 40 45 Val Val Ile Gln Gln His Gly Ala Ile Pro Glu Glu Met Val Tyr Gln 50 55 60 Lys Leu Lys Ala Phe Gly Ile Lys Gln Leu Thr Leu Arg Ile Thr Gly 65 70 75 80 Tyr Asp Ile Val Asn Leu Asp Ala Ala Thr Ala Asn Gly Leu Val Val 85 90 95 Thr Asn Val Pro Ala Tyr Ser Pro Arg Ser Val Ser Glu Leu Val Leu 100 105 110 Ala Gln Val Met Arg Leu Ile Arg His Leu Gly Glu Ala Ser Ala Arg 115 120 125 Glu Ala Lys Asp Asp Tyr Ser Trp Thr Gly Leu Glu Ala Pro Glu Ile 130 135 140 His Asn Leu Thr Val Gly Ile Ile Gly Ala Gly Lys Ile Gly Ser Ala 145 150 155 160 Val Ala Arg Ile Phe Arg Ala Leu Gly Ala Thr Val Ile Val Ser Asp 165 170 175 Pro Val Lys Arg Pro Glu Leu Ala Asp Thr Val Ser Tyr Val Asp Leu 180 185 190 Asn Thr Leu Leu Thr Thr Ser Asp Val Val Thr Val His Thr Pro Leu 195 200 205 Asp Gly Leu Thr Thr His Leu Ile Asp Ala Asp Ala Leu Arg Lys Met 210 215 220 Lys Ser Thr Ala Tyr Leu Ile Asn Ala Ala Arg Gly Pro Ile Val Asp 225 230 235 240 Thr Glu Ala Leu Ile Lys Ala Leu Asn Asp His Thr Ile Ala Gly Ala 245 250 255 Ala Leu Asp Thr Ile Glu Gly Glu Ala Gly Ile Phe Gly Glu Asp Arg 260 265 270 Ser Gln Thr Leu Val Asp Asn Gln Thr Leu Glu Thr Leu Lys Ala Met 275 280 285 Pro Asn Val Glu Ile Ser Pro His Ile Gly Phe Tyr Thr Asp Ala Ala 290 295 300 Val Lys Asn Met Ile Asp Ile Ser Leu Asp Asp Val Lys Thr Ile Leu 305 310 315 320 Glu Gly Gly Lys Ser Ala His Gln Val Asn 325 330 <210> 103 <211> 332 <212> PRT <213> Unknown <220> <223> Description of Unknown: Lactobacillaceae family sequence <400> 103 Met Lys Ile Ile Ala Tyr Ala Val Arg Asp Asp Glu Arg Pro Phe Phe 1 5 10 15 Asp Thr Trp Met Lys Glu Asn Pro Asp Val Glu Val Lys Leu Val Pro 20 25 30 Glu Leu Leu Thr Glu Asp Asn Val Asp Leu Ala Lys Gly Phe Asp Gly 35 40 45 Ala Asp Val Tyr Gln Gln Lys Asp Tyr Thr Ala Glu Val Leu Asn Lys 50 55 60 Leu Ala Asp Glu Gly Val Lys Asn Ile Ser Leu Arg Asn Val Gly Val 65 70 75 80 Asp Asn Leu Asp Val Pro Thr Val Lys Ala Arg Gly Leu Asn Ile Ser 85 90 95 Asn Val Pro Ala Tyr Ser Pro Asn Ala Ile Ala Glu Leu Ser Val Thr 100 105 110 Gln Leu Met Gln Leu Leu Arg Gln Thr Pro Leu Phe Asn Lys Lys Leu 115 120 125 Ala Lys Gln Asp Phe Arg Trp Ala Pro Asp Ile Ala Lys Glu Leu Asn 130 135 140 Thr Met Thr Val Gly Val Ile Gly Thr Gly Arg Ile Gly Arg Ala Ala 145 150 155 160 Ile Asp Ile Phe Lys Gly Phe Gly Ala Lys Val Ile Gly Tyr Asp Val 165 170 175 Tyr Arg Asn Ala Glu Leu Glu Lys Glu Gly Met Tyr Val Asp Thr Leu 180 185 190 Asp Glu Leu Tyr Ala Gln Ala Asp Val Ile Thr Leu His Val Pro Ala 195 200 205 Leu Lys Asp Asn Tyr His Met Leu Asn Ala Asp Ala Phe Ser Lys Met 210 215 220 Lys Asp Gly Ala Tyr Ile Leu Asn Phe Ala Arg Gly Thr Leu Ile Asp 225 230 235 240 Ser Glu Asp Leu Ile Lys Ala Leu Asp Ser Gly Lys Val Ala Gly Ala 245 250 255 Ala Leu Asp Thr Tyr Glu Tyr Glu Thr Lys Ile Phe Asn Lys Asp Leu 260 265 270 Glu Gly Gln Thr Ile Asp Asp Lys Val Phe Met Asn Leu Phe Asn Arg 275 280 285 Asp Asn Val Leu Ile Thr Pro His Thr Ala Phe Tyr Thr Glu Thr Ala 290 295 300 Val His Asn Met Val His Val Ser Met Asn Ser Asn Lys Gln Phe Ile 305 310 315 320 Glu Thr Gly Lys Ala Asp Thr Gln Val Lys Phe Asp 325 330 <210> 104 <211> 331 <212> PRT <213> Clostridium sporogenes <400> 104 Met Lys Ile Leu Ala Tyr Cys Val Arg Pro Asp Glu Ile Asp Ser Phe 1 5 10 15 Lys Asn Phe Ser Glu Lys Tyr Gly His Thr Val Asp Leu Ile Pro Asp 20 25 30 Ser Phe Gly Pro Ser Val Ala His Leu Ala Lys Gly Tyr Asp Gly Ile 35 40 45 Ser Ile Leu Gly Asn Asp Thr Cys Asn Arg Glu Ala Leu Glu Lys Ile 50 55 60 Lys Asp Cys Gly Ile Lys Tyr Leu Ala Thr Arg Thr Ala Gly Val Asn 65 70 75 80 Asn Ile Asp Phe Asp Ala Ala Lys Glu Phe Gly Ile Asn Val Ala Asn 85 90 95 Val Pro Ala Tyr Ser Pro Asn Ser Val Ser Glu Phe Thr Val Gly Leu 100 105 110 Ala Leu Ser Leu Thr Arg Lys Ile Pro Phe Ala Leu Lys Arg Val Glu 115 120 125 Leu Asn Asn Phe Ala Leu Gly Gly Leu Ile Gly Val Glu Leu Arg Asn 130 135 140 Leu Thr Leu Gly Val Ile Gly Thr Gly Arg Ile Gly Leu Lys Val Ile 145 150 155 160 Glu Gly Phe Ser Gly Phe Gly Met Lys Lys Met Ile Gly Tyr Asp Ile 165 170 175 Phe Glu Asn Glu Lys Ala Lys Glu Tyr Ile Glu Tyr Lys Ser Leu Asp 180 185 190 Glu Val Tyr Lys Glu Ala Asp Ile Ile Thr Leu His Ala Pro Leu Thr 195 200 205 Asp Asp Asn Tyr His Met Ile Gly Lys Glu Ser Ile Ala Lys Met Lys 210 215 220 Asp Gly Val Phe Ile Ile Asn Ala Ala Arg Gly Ala Leu Ile Asp Ser 225 230 235 240 Glu Ala Leu Ile Glu Gly Leu Lys Ser Gly Lys Ile Ala Gly Ala Ala 245 250 255 Leu Asp Ser Tyr Glu Tyr Glu Gln Gly Val Phe His Asn Asn Lys Met 260 265 270 Asn Glu Ile Met Lys Asp Asp Thr Leu Ala Arg Leu Lys Ser Phe Pro 275 280 285 Asn Val Val Ile Thr Pro His Leu Gly Phe Tyr Thr Asp Glu Ala Val 290 295 300 Ser Asn Met Val Glu Ile Thr Leu Met Asn Leu Gln Glu Phe Glu Leu 305 310 315 320 Lys Gly Thr Cys Lys Asn Gln Arg Val Cys Lys 325 330 <210> 105 <211> 334 <212> PRT <213> Clostridium sporogenes <400> 105 Met Lys Ile Leu Met Tyr Ser Val Arg Glu His Glu Lys Pro Ala Ile 1 5 10 15 Lys Lys Trp Leu Glu Ala Asn Pro Gly Val Gln Ile Asp Leu Ser Asp 20 25 30 Glu Ala Leu Ser Glu Asp Thr Val Cys Lys Val Lys Asp Tyr Asp Gly 35 40 45 Ile Ala Ile Gln Gln Thr Asn Ser Ile Gly Gly Glu Thr Val Tyr Ser 50 55 60 Thr Leu Lys Lys Tyr Gly Ile Arg Gln Ile Ala Ser Arg Thr Ala Gly 65 70 75 80 Val Asp Met Ile Asp Leu Lys Met Ala Ser Glu Asn Asn Ile Ile Val 85 90 95 Thr Asn Val Pro Ala Tyr Ser Pro Asn Ala Ile Ala Glu Leu Ala Val 100 105 110 Thr His Thr Met Asn Leu Leu Arg Asn Ile Lys Thr Val Asn Lys Arg 115 120 125 Ile Ala Phe Gly Asp Tyr Arg Trp Ser Ala Asp Leu Ile Ala Arg Glu 130 135 140 Val Arg Ser Ile Thr Val Gly Val Val Gly Thr Gly Lys Ile Gly Arg 145 150 155 160 Thr Ser Ala Lys Leu Phe Lys Gly Leu Gly Ala Asn Val Ile Gly Tyr 165 170 175 Asp Ala Tyr Pro Asp Lys Lys Leu Glu Glu Asn Asn Leu Leu Thr Tyr 180 185 190 Lys Asp Ser Leu Glu Asp Leu Leu Lys Glu Ala Asp Val Val Thr Leu 195 200 205 His Thr Pro Leu Leu Glu Ser Thr Lys His Met Ile Asn Lys Asn Asn 210 215 220 Leu Lys Tyr Met Lys Pro Asn Ala Phe Ile Val Asn Thr Gly Arg Gly 225 230 235 240 Gly Ile Ile Asn Thr Glu Asp Leu Ile Glu Ala Leu Glu Glu Asn Lys 245 250 255 Ile Ala Gly Ala Ala Leu Asp Thr Phe Glu Asn Glu Gly Leu Phe Leu 260 265 270 Asn Lys Val Ile Asp Pro Thr Lys Ile Pro Asp Pro Gln Leu Asp Lys 275 280 285 Leu Leu Lys Met Asp Gln Val Leu Ile Thr His His Val Gly Phe Phe 290 295 300 Thr Thr Thr Ala Val Gln Asn Met Val Asp Thr Ser Leu Asp Ser Val 305 310 315 320 Met Glu Val Leu Lys Thr Asn Asp Ser Val Asn Lys Ala Asn 325 330 <210> 106 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 106 His His His His His His 1 5

Claims (73)

  1. 피루베이트 및 지방족 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법으로서,
    지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
    알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물인, 방법.
  2. 제1항에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제이거나 또는 그를 포함하는 것인 방법.
  3. 제1항에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34, 또는 EC 4.1.1.4를 갖는 효소이거나 또는 그를 포함하거나, 또는 표 1 및 5-8로부터 선택되는 것인 방법.
  4. 제3항에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 미생물 중에 존재하는 것인 방법.
  5. 알켄을 알켄 환원 생성물 생합성 폴리펩티드와 접촉시켜서 알켄 환원 생성물을 생성시키는 단계를 포함하는 방법으로서,
    알켄은 카르보닐 기에 접합된 이중 결합을 포함하고;
    알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어 알켄 환원 생성물을 제공하는 것인, 방법.
  6. 제5항에 있어서, 알켄은 제1항의 알돌-탈수 생성물인 방법.
  7. 제6항에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 EC 1.6.5에 속하는 효소이거나 또는 그를 포함하거나, 또는 표 9로부터 선택되는 것인 방법.
  8. 제4항에 있어서, 지방족 알데히드는 하기 화학식 A-1의 구조 또는 이의 염을 갖는 것인 방법:
    Ra-L2-L1-C(O)H,
    A-1
    (상기 화학식에서,
    Ra 는 R" 또는 -OR"이고,
    L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
    -Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
    각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
    R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
    둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리임).
  9. 제8항에 있어서, 알돌-탈수 생성물은 하기 화학식 P-2의 구조 또는 이의 염을 갖는 것인 방법:
    Ra-L2-L1-CH=CH-C(O)-C(O)OH,
    P-2
    (상기 화학식에서,
    Ra 는 R" 또는 -OR"이고,
    L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
    -Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
    각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
    R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
    둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리임).
  10. 제9항에 있어서, -CH=CH- 는 E 입체배열인 방법.
  11. 제9항에 있어서, -CH=CH- 는 Z 입체배열인 방법.
  12. 제5항 내지 제11항 중 어느 하나의 항에 있어서, 알켄 환원 생성물은 하기 화학식 P-3의 구조 또는 이의 염을 갖는 것인 방법:
    Ra-L2-L1-CH2-CH2-C(O)-C(O)OH,
    P-3
    (상기 화학식에서,
    Ra 는 R" 또는 -OR"이고,
    L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
    -Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
    각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
    R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
    둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리임).
  13. 제5항에 있어서, 알켄 환원 생성물을 하기 화학식 P-10의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
    P-10
  14. 제5항에 있어서, 알켄 환원 생성물을 하기 화학식 P-10'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-CH2-CH2-OH
    P-10'
  15. 제12항에 있어서, 화학식 P-3의 화합물 또는 이의 염을 하기 화학식 P-4의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-CH(OH)-C(O)OH,
    P-4
    (상기 화학식에서,
    Ra 는 R" 또는 -OR"이고,
    L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
    -Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
    각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
    R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
    둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리임).
  16. 제15항에 있어서, 전환은 화학식 P-3의 화합물 또는 이의 염을 카르보닐 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  17. 제15항에 있어서, 화학식 P-4의 화합물 또는 이의 염을 하기 화학식 P-5의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-CH(OH)-C(O)-S-CoA
    P-5
  18. 제17항에 있어서, 전환은 화학식 P-4의 화합물 또는 이의 염을 CoA 전달 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  19. 제17항에 있어서, 화학식 P-5의 화합물 또는 이의 염을 하기 화학식 P-6의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH=CH-C(O)-S-CoA
    P-6
  20. 제19항에 있어서, 전환은 화학식 P-5의 화합물 또는 이의 염을 탈수 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  21. 제19항에 있어서, 화학식 P-6의 화합물 또는 이의 염을 하기 화학식 P-7의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-CH2-C(O)-S-CoA,
    P-7
  22. 제21항에 있어서, 전환은 화학식 P-6의 화합물 또는 이의 염을 2,3-에노일-CoA 리덕타제이거나 또는 그를 포함하는 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  23. 제21항에 있어서, 화학식 P-7의 화합물 또는 이의 염을 하기 화학식 P-8의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-CH2-C(O)-OH,
    P-8
  24. 제23항에 있어서, 전환은 화학식 P-7의 화합물 또는 이의 염을 CoA 전달 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  25. 제23항에 있어서, 화학식 P-8의 화합물 (식에서, L2 는 -CH2-L2'-임) 또는 이의 염을 하기 화학식 P-9의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    H-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH,
    P-9
    (상기 화학식에서,
    L2' 은 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-19 지방족 또는 C1-19 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환됨).
  26. 제25항에 있어서, 전환은 화학식 P-8의 화합물 또는 이의 염을 알콜 데히드로게나제이거나 또는 그를 포함하는 산화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  27. 제25항에 있어서, 화학식 P-9의 화합물 또는 이의 염을 하기 화학식 P-10의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH,
    P-10
  28. 제27항에 있어서, 전환은 화학식 P-9의 화합물 또는 이의 염을 알데히드 산화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  29. 제23항에 있어서, 화학식 P-8의 화합물 또는 이의 염을 하기 화학식 P-9'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-CH2-C(O)-H,
    P-9'
  30. 제29항에 있어서, 화학식 P-8의 화합물 또는 이의 염을 카르복실 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  31. 제29항에 있어서, 화학식 P-9'의 화합물 또는 이의 염을 하기 화학식 P-10'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-CH2-CH2-OH,
    P-10'
  32. 제31항에 있어서, 화학식 P-9'의 화합물 또는 이의 염을 알데히드 리덕타제 또는 1차 알콜 데히드로게나제이거나 또는 그를 포함하는 알데히드 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  33. 제12항에 있어서, 화학식 P-3의 화합물 또는 이의 염을 하기 화학식 P-4'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-C(O)-H
    P-4'
  34. 제33항에 있어서, 화학식 P-3의 화합물 또는 이의 염을 탈카르복실화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  35. 제33항에 있어서, 화학식 P-4'의 화합물 또는 이의 염을 하기 화학식 P-5'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
    Ra-L2-L1-CH2-CH2-CH2-OH,
    P-5'
  36. 제35항에 있어서, 화학식 P-4'의 화합물 또는 이의 염을 알데히드 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
  37. 제1항 내지 제36항 중 어느 하나의 항에 있어서, Ra 는 -H인 방법.
  38. 제1항 내지 제36항 중 어느 하나의 항에 있어서, Ra 는 -OH인 방법.
  39. 제1항 내지 제38항 중 어느 하나의 항에 있어서, L1 은 임의 치환된 C1-6 알킬렌인 방법.
  40. 제1항 내지 제38항 중 어느 하나의 항에 있어서, L1 은 미치환된 C1-6 알킬렌인 방법.
  41. 제39항 또는 제40항에 있어서, 알킬렌은 -CH2- 인 방법.
  42. 제39항 또는 제40항에 있어서, 알킬렌은 -CH2CH2- 인 방법.
  43. 제39항 또는 제40항에 있어서, 알킬렌은 -CH2CH2CH2- 인 방법.
  44. 제1항 내지 제38항 중 어느 하나의 항에 있어서, L1 은 공유 결합인 방법.
  45. 제1항 내지 제44항 중 어느 하나의 항에 있어서, L2 는 공유 결합인 방법.
  46. 제1항 내지 제44항 중 어느 하나의 항에 있어서, L2 는 임의 치환된 C1-6 알킬렌인 방법.
  47. 제1항 내지 제44항 중 어느 하나의 항에 있어서, L2 는 미치환된 C1-6 알킬렌인 방법.
  48. 제46항 또는 제47항에 있어서, 알킬렌은 -CH2- 인 방법.
  49. 제46항 또는 제47항에 있어서, 알킬렌은 -CH2CH2- 인 방법.
  50. 제46항 또는 제47항에 있어서, 알킬렌은 -CH2CH2CH2- 인 방법.
  51. 제8항에 있어서, 지방족 알데히드는 HO-CH2-CH2-CHO 인 방법.
  52. 제9항에 있어서, 알돌-탈수 생성물은 HO-CH2-CH2-CH=CH-C(O)-COOH 또는 이의 염인 방법.
  53. 제12항에 있어서, 알켄 환원 생성물은 HO-CH2-CH2-CH2-CH2-C(O)-COOH 또는 이의 염인 방법.
  54. 제15항에 있어서, 카르보닐 환원 생성물은 HO-CH2-CH2-CH2-CH2-CH(OH)-COOH 또는 이의 염인 방법.
  55. 제16항에 있어서, 화학식 P-5의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH(OH)-CO-S-CoA 또는 이의 염인 방법.
  56. 제18항에 있어서, 화학식 P-6의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH=CH-CO-S-CoA 또는 이의 염인 방법.
  57. 제20항에 있어서, 화학식 P-7의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CO-S-CoA 또는 이의 염인 방법.
  58. 제23항에 있어서, 화학식 P-8의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염인 방법.
  59. 제25항에 있어서, 화학식 P-9의 화합물 또는 이의 염은 H-C(O)-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염인 방법.
  60. 제27항에 있어서, 화학식 P-10의 화합물 또는 이의 염은 HO-CO-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염인 방법.
  61. 제25항에 있어서, 화학식 P-9'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-C(O)-H 또는 이의 염인 방법.
  62. 제27항에 있어서, 화학식 P-10'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CH2-OH 또는 이의 염인 방법.
  63. 제32항에 있어서, 화학식 P-4'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-C(O)-H 또는 이의 염인 방법.
  64. 제32항에 있어서, 화학식 P-5'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-OH 또는 이의 염인 방법.
  65. 제1항 내지 제64항 중 어느 하나의 항의 방법으로 제조된 조제물.
  66. 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염의 조제물, 또는 제1항 내지 64항 중 어느 하나의 항의 방법으로 제조된 조제물로서, 조제물은 화합물의 기준 조제물에서 관찰된 것에 비해 14C 동위원소에 대해 농축되고, 기준 조제물은 화석 탄소원을 사용해 제조된 것인 조제물.
  67. 폴리에스테르, 폴리에스테르 폴리올, 폴리우레탄, 나일론 6, 나일론 6,6, 폴리카르보네이트 디올, 디아크릴레이트 에스테르, 또는 디글리시딜 에테르의 조제물로서, 조제물은 제1항 내지 제64항 중 어느 하나의 항의 방법으로 제조된 조제물을 사용하여 제조된 것인 조제물.
  68. 제67항에 있어서, 조제물은 화합물의 기준 조제물에서 관찰된 것에 비해 14C 동위원소에 대해 농축되고, 기준 조제물은 화석 탄소원을 사용해 제조된 것인 조제물.
  69. 제1항 내지 제68항 중 어느 하나의 항의 생합성 폴리펩티드를 코딩하는 핵산.
  70. 지방족 알데히드의 알돌-탈수 생성물을 생성하는 조작된 미생물로서, 미생물은 알돌 생성물 생합성 폴리펩티드, 알돌-탈수 생성물 생합성 폴리펩티드, 탈수 생성물 생합성 폴리펩티드, 또는 이의 임의 조합의 증가된 발현 또는 활성을 포함하고,
    지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
    알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기에 접합된 이중 결합을 포함하는 화합물인, 조작된 미생물.
  71. 알켄 환원 생성물을 생성하는 조작된 미생물로서, 미생물은 알켄 환원 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하고,
    알켄은 카르보닐 기에 접합된 이중 결합을 포함하고;
    알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어 알켄 환원 생성물을 제공하는 것인, 조작된 미생물.
  72. 독립적으로 화학식 P-1 내지 P-10, P-9', P-10', P-4' 또는 P-5'의 하나 이상의 화합물, 또는 이의 염을 포함하는, 제70항 또는 제71항의 미생물을 포함하는, 배양물.
  73. 구현예 1-386 중 어느 하나의 방법, 조제물, 핵산, 미생물, 또는 배양물.
KR1020217036672A 2019-04-25 2020-04-25 재생가능한 공급원으로부터 화학물질의 생산 KR20220012847A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962838793P 2019-04-25 2019-04-25
US62/838,793 2019-04-25
US201962868824P 2019-06-28 2019-06-28
US62/868,824 2019-06-28
PCT/US2020/029981 WO2020220001A1 (en) 2019-04-25 2020-04-25 Production of chemicals from renewable sources

Publications (1)

Publication Number Publication Date
KR20220012847A true KR20220012847A (ko) 2022-02-04

Family

ID=72941776

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217036672A KR20220012847A (ko) 2019-04-25 2020-04-25 재생가능한 공급원으로부터 화학물질의 생산

Country Status (9)

Country Link
US (2) US20220372528A1 (ko)
EP (1) EP3959328A4 (ko)
JP (1) JP2022530467A (ko)
KR (1) KR20220012847A (ko)
CN (1) CN114026246A (ko)
AU (1) AU2020262490A1 (ko)
BR (1) BR112021021193A2 (ko)
CA (1) CA3134763A1 (ko)
WO (1) WO2020220001A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021021193A2 (pt) 2019-04-25 2022-01-04 Zymochem Inc Produção de produtos químicos a partir de fontes renováveis
CN113336336B (zh) * 2021-06-04 2022-03-29 中国科学院重庆绿色智能技术研究院 卓贝尔氏菌在高效除氨氮中的应用
WO2024020161A2 (en) * 2022-07-20 2024-01-25 Zymochem, Inc. Purification technologies
JP7480925B1 (ja) * 2022-07-22 2024-05-10 Dic株式会社 1,6-ヘキサンジオール組成物、ポリマー、硬化性樹脂組成物及び塗料

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7582455B2 (en) 2005-04-26 2009-09-01 Cargill, Incorporated Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors
EP2112227B1 (en) * 2006-03-07 2013-05-15 Cargill, Incorporated Aldolases, nucleic acids encoding them and methods for making and using them
NZ584162A (en) 2007-10-04 2012-05-25 Bio Architecture Lab Inc Biofuel production
US8986963B2 (en) 2008-02-23 2015-03-24 James Weifu Lee Designer calvin-cycle-channeled production of butanol and related higher alcohols
CN103555643B (zh) 2008-03-27 2016-08-10 基因组股份公司 用于产生己二酸和其他化合物的微生物
KR101930540B1 (ko) 2009-05-07 2019-03-15 게노마티카 인코포레이티드 아디페이트, 헥사메틸렌디아민 및 6-아미노카프로산의 생합성을 위한 미생물 및 방법
JP2013538060A (ja) * 2010-08-30 2013-10-10 アルゼダ コーポレーション レブリン酸、レブリン酸エステル、バレロラクトン、およびこれらの誘導体の産生のための発酵経路
BR112014014675A2 (pt) 2011-12-16 2017-06-13 Invista Tech Sarl método para biossintetizar um ou mais produtos e hospedeiro recombinante
ES2800341T3 (es) * 2012-07-11 2020-12-29 Adisseo France Sas Método para la preparación de 2,4-dihidroxibutirato
JP6680671B2 (ja) * 2013-09-17 2020-04-15 ズィモケム インコーポレイテッドZymochem Inc. 再生可能資源から化合物を生成するための高収量経路
BR112021021193A2 (pt) 2019-04-25 2022-01-04 Zymochem Inc Produção de produtos químicos a partir de fontes renováveis

Also Published As

Publication number Publication date
EP3959328A1 (en) 2022-03-02
US20230109883A1 (en) 2023-04-13
US20220372528A1 (en) 2022-11-24
EP3959328A4 (en) 2024-01-17
CN114026246A (zh) 2022-02-08
AU2020262490A1 (en) 2021-11-25
CA3134763A1 (en) 2020-10-29
WO2020220001A1 (en) 2020-10-29
BR112021021193A2 (pt) 2022-01-04
JP2022530467A (ja) 2022-06-29
US11692208B2 (en) 2023-07-04

Similar Documents

Publication Publication Date Title
US20220389433A1 (en) High yield route for the production of compounds from renewable sources
US10947569B2 (en) Recombinant microorganism for the production of useful metabolites
US11692208B2 (en) Production of chemicals from renewable sources
US10626423B2 (en) Methods and microorganisms for the production of 1,3-butanediol
US20100184173A1 (en) Microorganisms for the production of methyl ethyl ketone and 2-butanol
WO2010022763A1 (en) Method for the preparation of 2-hydroxy-isobutyrate
EP2909325A1 (en) Microorganisms and methods for enhancing the availability of reducing equivalents in the presence of methanol, and for producing succinate related thereto
EP3087174B1 (en) Methods and organisms with increased carbon flux efficiencies
US20170356016A1 (en) Modified microorganisms and methods for production of useful products
EP3303421A1 (en) Vinylisomerase-dehydratases, alkenol dehydratases, linalool dehydratases and/ crotyl alcohol dehydratases and methods for making and using them
WO2018203076A1 (en) Modified microorganisms and methods for production of branched c5 carbon compounds
US10184138B2 (en) Bacteria engineered for conversion of ethylene to ethanol
CN112513282A (zh) 从磷酸二羟丙酮和甘油醛-3-磷酸产生果糖-6-磷酸的方法
WO2023069957A1 (en) Aldehyde dehydrogenase variants and methods of use
WO2023069952A1 (en) Aldehyde dehydrogenase variants and methods of use
WO2017168161A1 (en) Modified enzyme