KR20220012847A - 재생가능한 공급원으로부터 화학물질의 생산 - Google Patents
재생가능한 공급원으로부터 화학물질의 생산 Download PDFInfo
- Publication number
- KR20220012847A KR20220012847A KR1020217036672A KR20217036672A KR20220012847A KR 20220012847 A KR20220012847 A KR 20220012847A KR 1020217036672 A KR1020217036672 A KR 1020217036672A KR 20217036672 A KR20217036672 A KR 20217036672A KR 20220012847 A KR20220012847 A KR 20220012847A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- salt
- formula
- compound
- coa
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
- C12P7/625—Polyesters of hydroxy carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P11/00—Preparation of sulfur-containing organic compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y106/00—Oxidoreductases acting on NADH or NADPH (1.6)
- C12Y106/05—Oxidoreductases acting on NADH or NADPH (1.6) with a quinone or similar compound as acceptor (1.6.5)
- C12Y106/05005—NADPH:quinone reductase (1.6.5.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01004—Acetoacetate decarboxylase (4.1.1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/02—Aldehyde-lyases (4.1.2)
- C12Y401/02034—4-(2-carboxyphenyl)-2-oxobut-3-enoate aldolase (4.1.2.34)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/02—Aldehyde-lyases (4.1.2)
- C12Y401/02045—Trans-o-hydroxybenzylidenepyruvate hydratase-aldolase (4.1.2.45)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/0103—Glycerol dehydratase (4.2.1.30)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/01034—(S)-2-Methylmalate dehydratase (4.2.1.34)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/101—Plasmid DNA for bacteria
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
특히, 본 개시는 다양한 화합물 예컨대 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 6-히드록시 헥산산, 및 2-케토 카르복실산을 제조하기 위한 생합성 폴리펩티드, 방법, 및 비-천연 발생 미생물 유기체를 제공한다.
Description
관련 출원에 관한 교차-참조
본 출원은 2019년 4월 25일 출원된 미국 가출원 제62/838,793호, 및 2019년 6월 28일 출원된 미국 가출원 제62/868,824호에 대한 우선권을 청구하고, 이들 각각의 전문은 참조로 본 명세서에 편입된다.
기술 분야
본 개시는 일반적으로 산업적으로 유용한 화학물의 조성물 및 이의 제조 방법에 관한 것이다.
아디프산 (AA)은 2012년 그 수요가 230만 미터톤으로 추정되는 광범위하게 사용되는 화학물이다 (IHS Chemical, Process Economics Program Report: Bio-Based Adipic acid (Dec. 2012)). 헥사메틸렌디아민 (HMDA)과 함께, 나일론6,6, 폴리에스테르 수지, 가소제, 식품, 및 다른 재료의 생산에서 사용된다. 따라서, 재생가능한 자원을 사용하여 높은 수율로 아디프산을 제조하는 방법이 매우 바람직하다.
1,5-펜탄디올은 폴리우레탄 및 폴리에스테르 (PDL)의 주요 성분이다. 1,6-헥산디올 (HDO)은 말단 히드록실 기를 갖는 선형 디올이다. 이것은 산업용 코팅 응용분야의 폴리에스테르, 자동차 응용분야용 2-성분 폴리우레탄 코팅에서 사용된다. 또한 이것은 파케이 바닥마감 및 가죽 코팅을 위한 엘라스토머 및 폴리우레탄 분산물에서 사용되는 마크로디올 예를 들어, 아디페이트 에스테르 및 폴리카르보네이트 디올의 제조에서 사용된다.
6-히드록시 헥산산 (6HH)은 환화되어 ε-카프로락톤을 만들 수 있고 이어서 아미노화되어 ε-카프로락탐을 만들 수 있다. ε-카프로락탐은 많은 상이한 산업에서 광범위하게 사용되는 중합체인, 나일론6의 제조에서 사용된다. ε-카프로락톤은 중합되어서 폴리카프로락톤 (PCL)을 특수 폴리우레탄의 제조를 위한 응용분야에서 사용되는 생분해성 폴리에스테르로 만든다.
2-케토 카르복실산은 수많은 산업적으로 관련된 화학물 및 약학 약물의 제조를 위한 유용한 중간체이다. 그들은 산업적으로 유용한 α-히드록시 카르복실산을 비롯하여, 아미노산의 제조를 위한 전구체이다.
특히, 본 개시는 소정 생합성 펩티드, 예를 들어, 다양한 효소가 많은 구현예에서, 그들의 천연 및/또는 특징규명된 기질과 구조적으로 상이한 기질로부터, 다양한 화합물을 효율적으로 제조하는데 이용될 수 있다는 인식을 포괄한다. 일부 구현예에서, 본 개시는 하나 이상의 이러한 효소를 이용하여 다양한 화합물을 제조하기 위한 기술 (예를 들어, 효소, 핵산, 유기체, 배양물 등)을 제공한다.
예를 들어, 일부 구현예에서, 본 개시는 알돌-탈수 생성물 생합성 폴리펩티드, 예컨대 다양한 히드라타제-알돌라제가 그들의 전형적인 방향족 알데히드 기질 이외의 지방족 알데히드로부터 수많은 화합물을 제조하는데 효과적으로 이용될 수 있다는 것을 제공한다. 일부 구현예에서, 본 개시는
피루베이트 및 지방족 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
일부 구현예에서, 알데히드, 예를 들어, 지방족 알데히드는 하기의 화학식 A-1의 구조, 또는 이의 염을
Ra-L2-L1-C(O)H,
A-1
상기 화학식에서, 갖는다:
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 임의로 독립적으로 치환되고;
-Cy-는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R"은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R'은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택된 임의 치환된 기이거나, 또는 :
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, L1 은 임의 치환된 -CH2- 이다. 일부 구현예에서, L1 은 임의 단일치환된 -CH2- 이다. 일부 구현예에서, L1 은 -CH2- 이다.
일부 구현예에서, 알돌-탈수 생성물은 하기 화학식 P-2의 구조, 또는 이의 염을 갖는다:
Ra-L2-L1-CH=CH-C(O)-C(O)OH,
P-2
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에 기술된 바와 같다.
본 명세서에 기술된 바와 같이, 알돌-탈수 생성물, 예를 들어, 화학식 P-2의 화합물 또는 이의 염은 일부 구현예에서, 다양한 생성물, 예컨대 1,5-펜탄디올, HDO, 6HH, 아디프산 등 (예를 들어, 도 2-5 참조) 및 그로부터 만들어진 다양한 중합체 생성물을 포함한, 그로부터 만들어진 다양한 생성물을 제공하기 위한 하나 이상의 생합성 과정을 통해서, 더욱 처리될 수 있다.
일부 구현예에서, 본 명세서에 표시된 바와 같이, 알돌-탈수 생성물, 예를 들어, 화학식 P-2의 화합물 또는 이의 염은 또한 알돌 생성물, 예를 들어, 하기 화학식 P-1의 화합물, 또는 이의 염으로부터 제조될 수도 있다:
Ra-L2-L1-CH(OH)-CH2-C(O)-C(O)OH,
P-1
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 알돌-탈수 생성물은 알돌 생성물을 탈수 생성물 생합성 폴리펩티드와 접촉시켜서 제조된다.
일부 구현예에서, 알돌 생성물은 적합한 기질을 알돌 생성물 생합성 폴리펩티드와 접촉시켜 제조된다.
일부 구현예에서, 본 개시는 다양한 알켄 환원 생성물 생합성 폴리펩티드가 그들의 천연 또는 비-천연 기질로부터 다양한 화합물을 제조하는데 이용될 수 있다는 것을 입증한다. 일부 구현예에서, 본 개시는
알켄을 알켄 환원 생성물 생합성 폴리펩티드와 접촉시켜서 알켄 환원 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고;
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어 알켄 환원 생성물을 제공한다.
일부 구현예에서, 알켄은 알돌-탈수 생성물, 예를 들어, 화학식 P-2 중 하나 또는 이의 염이다. 일부 구현예에서, 알켄 환원 생성물은 하기 화학식 P-3의 구조, 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-C(O)-C(O)OH,
P-3
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
특히, 본 명세서는 재생가능한 자원을 사용하여 2-케토 카르복실산, 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 및 6-히드록시 헥산산을 제조하기 위한 효소, 방법, 및 재조합 미생물을 개시한다.
일 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법이 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 피루베이트 및 을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와, 하나 이상의 비-천연 발생 미생물을 포함하는 유기체 또는 배양물 중에서 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나 또는 그로 본질적으로 이루어지고; 여기서 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물에 의해 발현된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법이 제공된다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 둘 이상의 비-천연 발생 미생물을 포함하는 유기체 또는 배양물 중에서 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나 또는 그로 본질적으로 이루어지고; 여기서 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물에 의해 발현된다.
다른 양태에서, 본 명세서는 1,5-펜탄디올을 제조하기 위한 방법이 제공되고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계
를 포함하거나 또는 그로 본질적으로 이루어지고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,5-펜탄디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계
를 포함하거나 또는 그로 이루어지고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,6-헥산디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계
를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,6-헥산디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 6-히드록시-헥사노에이트를 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고;
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 6-히드록시-헥사노에이트를 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계
를 포함하고;
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 아디프산을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계
를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 아디프산을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계
를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45, EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에서 확인된 효소의 군으로부터 선택되는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45, EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에서 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인된 효소의 군에서 선택된 효소, 또는 알돌-탈수 생성물의 형성을 촉진하는 이의 일부분 (예를 들어, 도메인, 아미노산 잔기의 세트 (연속될 수 있거나 또는 이격될 수 있음) 등)과 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 표 1 및 5-8로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 표 1 및 5-8로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인된 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 하나 이상의 비-천연 발생 미생물에 의해 발현되는 하나 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다. 일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되는 하나 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다. 일부 구현예에서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 2-케토 카르복실산을 제조하기 위한 방법은 2-케토 카르복실산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 2-케토 카르복실산을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 2-케토-산-데카르복실라제는 EC 번호 4.1.1.1; EC 번호 4.1.1.2; EC 번호 4.1.1.3; EC 번호 4.1.1.4; EC 번호 4.1.1.5; EC 번호 4.1.1.6; EC 번호 4.1.1.7; EC 번호 4.1.1.11; EC 번호 4.1.1.12; EC 번호 4.1.1.15; EC 번호 4.1.1.16; EC 번호 4.1.1.17; EC 번호 4.1.1.18; EC 번호 4.1.1.19; EC 번호 4.1.1.20; EC 번호 4.1.1.34; EC 번호 4.1.1.35; EC 번호 4.1.1.40; EC 번호 4.1.1.54; EC 번호 4.1.1.56; EC 번호 4.1.1.71; EC 번호 4.1.1.72; EC 번호 4.1.1.73; EC 번호 4.1.1.74; EC 번호 4.1.1.75; 또는 EC 번호 4.1.1.77 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 1차 알콜 데히드로게나제는 EC 번호 1.1.1.61을 갖는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인되는 효소의 그룹으로부터 선택되는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 Uniprot ID No. A0A286PH18 하에 확인되는 효소이고; 퀴논 옥시도리덕타제는 Uniprot ID No. P28304 하에 확인되는 효소이고; 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4 하에 확인되는 효소이고; 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:8의 서열을 포함하는 효소이고; 퀴논 옥시도리덕타제는 SEQ ID NO:45의 서열을 포함하는 효소이고; 2-케토-산-데카르복실라제는 SEQ ID NO:83의 서열을 포함하는 효소이고; 1차 알콜 데히드로게나제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 히드라타제-알돌라제, 퀴논 옥시도리덕타제, 2-케토-산-데카르복실라제, 및 1차 알콜 데히드로게나제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 1,5-펜탄디올을 제조하기 위한 방법은 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 1,5-펜탄디올을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 EC 번호 1.2.99.6을 갖는 효소이고; 6-히드록시헥사날 1-리덕타제는 EC 번호 1.1.1을 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 하에 확인되는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소이고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소이고; 및 6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 및 6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID Nos D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소이고; 및 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 1,6-헥산디올을 제조하기 위한 방법은 1,6-헥산디올을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 1,6-헥산디올을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해서 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:5, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 6-히드록시-헥사노에이트를 제조하기 위한 방법은 6-히드록시-헥사노에이트를 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 6-히드록시-헥사노에이트를 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 EC 번호 1.1.1.258을 갖는 효소이고; 6-옥소-헥사노에이트 옥시다제는 EC 번호 1.2.1.63을 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC6409 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 Uniprot ID No. Q7WVD0 또는 Q84H78 하에 확인되는 효소이고; 6-옥소-헥사노에이트 옥시다제는 Uniprot ID No. Q9R2F4 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 데히드로게나제는 Uniprot ID No. Q7WVD0 또는 Q84H78 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-옥소-헥사노에이트 옥시다제는 Uniprot ID No. Q9R2F4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 확인된 효소이고; 6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 및 SEQ ID NO:72의 서열을 포함하는 확인된 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 아디프산을 제조하기 위한 방법은 아디프산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다. 일부 구현예에서, 방법은 아디프산을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함하거나 또는 그로 본질적으로 이루어진다.
일부 구현예에서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다. 일부 구현예에서, 는 3-히드록시-프로파날이다. 일부 구현예에서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
다른 양태에서, 본 명세서는 알돌라제 히드라타제 효소를 코딩하는 제1 외생성 핵산을 포함하는 재조합 미생물 유기체를 제공하고, 여기서 재조합 미생물 유기체는 야생형 또는 미변형의 동일 미생물 유기체와 비교하여 퀴논 증가된 양의 옥시도리덕타제를 발현하도록 추가로 변형되고, 임의로 미생물 유기체는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 클로스트리듐 (clostridium) 종, 또는 이. 콜라이 (E. coli)이다. 일부 구현예에서, 유기체는 퀴논 옥시도리덕타제를 코딩하는 제2 외생성 핵산을 포함한다. 일부 구현예에서, 제1 및/또는 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동시키는 조절 엘리먼트를 더 포함한다. 대안적으로, 제1 및 제2 핵산은 동일 프로모터 조절 엘리먼트의 제어 하에 있다. 일부 구현예에서, 조절 엘리먼트는 프로모터 또는 인핸서로부터 선택된다. 일부 구현예에서, 알돌라제 히드라타제 효소는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는다. 일부 구현예에서, 알돌라제 히드라타제 효소는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 알돌라제 히드라타제 효소는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 벡터, 예를 들어, 플라스미드 또는 바이러스 벡터에 함유된다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 동일 벡터에 함유된다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 그들 자신의 별도 벡터에 함유된다. 일부 구현예에서, 벡터는 플라스미드이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다. 일부 구현예에서, 재조합 미생물 유기체는 하기 화학식의 2-케토 카르복실산을 생성시킬 수 있다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다. 일부 구현예에서, 재조합 미생물 유기체는 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 생성시킬 수 있다. 일부 구현예에서, 재조합 미생물 유기체는 탄소원으로부터 피루베이트의 생성을 개선시키도록 유전자 변형된다. 일부 구현예에서, 탄소원은 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택된다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 재조합 미생물 유기체를 포함하는 배양물을 제공한다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 바와 같은 재조합 미생물 유기체의 개체군을 제공한다. 일부 구현예에서, 개체군은 실질적으로 균질하다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 개체군을 포함하는 배양물을 제공한다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 바와 같은 외생성 핵산의 발현을 촉진하는 적합한 조건 하에서 본 명세서에 개시된 바와 같은 개체군 또는 재조합 미생물을 배양하는 단계를 포함하는, 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 제조하는 방법을 제공한다. 일 양태에서, 외생성 핵산은 야생형 또는 미변형 대응 미생물 유기체와 비교하여 과발현된다. 일부 구현예에서, 방법은 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 배양물 또는 미생물 유기체로부터 단리시키는 단계를 더 포함한다.
도 1 은 예로서 피루베이트 및 알데히드로부터 2-케토 카르복실산의 생성을 위한 2-효소 생합성 경로를 도시한다. 알돌-탈수 생성물 (예를 들어, 본 명세서에 기술될 알돌 축합 생성물)은 이론으로 국한하려는 의도없이, 도시된 바와 같은 단계 1 및 2를 통해서, 단일 효소 (예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드 예컨대 히드라타제-알돌라제 (일부 구현예에서, Ads-Hyd라고 함))에 의해 촉매되는 과정으로부터 생성될 수 있다. 당업자가 이해하게 되는 바와 같이, 예시된 알돌 축합 생성물 중 이중 결합은 E 또는 Z 로서 존재할 수 있다. 많은 구현예에서, 예시된 바와 같은 단계 3은 예를 들어 퀴논의 환원을 위해 NADH 및/또는 NADPH를 이용하는 EC 1.6.5 (예를 들어, EC 1.6.5.5)에 속하는 하나인, 옥시도리덕타제에 의해 촉매될 수 있다. 본 명세서에 기술된 바와 같이, 다양한 알데히드가 이용될 수 있다. 예를 들어, 예시된 알데히드에서, 일부 구현예에서, R은 H, CH3, CH2CH3, OH, CH2OH, 또는 CH2CH2OH이다.
도 2 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 1,5-펜탄디올의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 5HPeA는 5-히드록시 펜타날을 지칭한다. NADH는 예시된 목적을 위한 경로의 많은 환원 단계를 위한 보조인자로서 도시된다. NADPH 또는 NADH는 보조인자일 수 있다.
도 3 은 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 1,6-헥산디올의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭하고; 6HHA는 6-히드록시 헥사날을 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체 내에서 이러한 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 4 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 6-히드록시 헥사노에이트의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체 내에서 이 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 5 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 아디프산의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭하고; 6KHA는 6-옥소-헥사노에이트를 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체내에서 이러한 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 6 은 보조인자 NADH 및 NADPH를 사용하여 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 6-히드록시-2-케토-헥세노에이트로 환원을 위한 퀴논 옥시도리덕타제-1 (Qor-1)의 활성을 도시한다.
도 2 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 1,5-펜탄디올의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 5HPeA는 5-히드록시 펜타날을 지칭한다. NADH는 예시된 목적을 위한 경로의 많은 환원 단계를 위한 보조인자로서 도시된다. NADPH 또는 NADH는 보조인자일 수 있다.
도 3 은 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 1,6-헥산디올의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭하고; 6HHA는 6-히드록시 헥사날을 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체 내에서 이러한 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 4 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 6-히드록시 헥사노에이트의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체 내에서 이 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 5 는 6-히드록시-2-케토-헥사노에이트 (6H2KH) 중간체를 통한 아디프산의 생성을 위한 생합성 경로를 도시한다. 본 명세서에서 사용되는, 3HPA는 3-히드록시-프로파날을 지칭하고; 6H4H2KH는 4,6-디히드록시-2-케토-헥사노에이트를 지칭하고; 6H3(E)2KH는 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 지칭하고; 6H2HH는 2,6-디히드록시-헥사노에이트를 지칭하고; 6HH-CoA는 6-히드록시-헥사노일-CoA를 지칭하고; 6HH는 6-히드록시 헥사노에이트를 지칭하고; 6H2HH-CoA는 2,6-디히드록시-헥사노일-CoA를 지칭하고; 6KHA는 6-옥소-헥사노에이트를 지칭한다. NADPH 또는 NADH는 보조인자일 수 있다. 단계 5 및 8은 단일 CoA-트랜스퍼라제 효소에 의해 촉매된다. 6HH-CoA는 단계 5 반응을 위한 도너로서 그리고 6H2HH는 예시적인 목적을 위한 억셉터로서 도시된다. 다른 CoA-에스테르 또는 카르복실산은 생체내에서 이러한 효소에 대한 도너 및 억셉터로서 제공될 수 있다.
도 6 은 보조인자 NADH 및 NADPH를 사용하여 6-히드록시-3,4-데히드로-2-케토-헥세노에이트를 6-히드록시-2-케토-헥세노에이트로 환원을 위한 퀴논 옥시도리덕타제-1 (Qor-1)의 활성을 도시한다.
정의
본 명세서에서 사용되는, 일정 용어는 하기에 정의된 의미를 가질 수 있다. 본 명세서에서 사용되는, 단수형 "한", "하나" 및 "그"는 문맥에서 달리 명확하게 표시하지 않으면 단수 및 다수 참조를 포함한다.
본 명세서에서 사용되는, 용어 "포함하는"은 조성물 및 방법이 인용된 구성요소를 포함하지만, 다른 것들을 배제하지는 않는다는 것을 의미하고자 한다. 조성물 및 방법을 정의하는데 사용될 때 "본질적으로 이루어지는"은 조성물 또는 방법에 임의의 본질적으로 중요한 다른 구성요소를 배제한다는 것을 의미할 수 있다. "이루어지는"은 실질적 방법 단계 및 청구된 조성물에 대한 다른 성분의 미량 초과의 구성요소를 배제하는 것을 의미할 수 있다. 이들 전환 용어 각각에 의해 정의된 양태는 본 개시의 범주 내에 있다. 따라서, 방법 및 조성물은 추가 단계 및 성분을 포괄할 수 있거나 (포함하는) 또는 대안적으로 중요하지 않은 단계 및 조성물을 포괄할 수 있거나 (본질적으로 이루어지는) 또는 대안적으로, 오직 명시된 방법 단계 또는 조성물을 의도 (이루어지는)하고자 의도된다.
본 명세서에서 사용되는 용어 "알돌-탈수 생성물 생합성 폴리펩티드"는 본 명세서에 기술된 바와 같은 알돌-탈수 생성물의 합성에 관여되는 폴리펩티드를 지칭한다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알돌라제 폴리펩티드, 히드라타제, 히드라타제-알돌라제 폴리펩티드 (예를 들어, 히드라타제-알돌라제)일 수 있거나 또는 그를 포함할 수 있다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제 폴리펩티드 (예를 들어, 히드라타제-알돌라제)일 수 있거나 또는 그를 포함할 수 있다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 자연계, 예를 들어, 미생물 (예를 들어, 자연계에서 발견되는 기준 알돌-탈수 생합성 폴리펩티드)에서 발견되는 아미노산 서열을 갖는다. 대안적으로 또는 추가적으로, 일부 구현예에서, 알돌-탈수 생합성 폴리펩티드는 적절한 기준 알돌-탈수 생합성 폴리펩티드 (예를 들어, 자연계에서 발견되고/되거나 본 명세서 (예를 들어, 하나 이상의 관련 표 (예를 들어, 표 1 및 5-8))에서 표시되는 바와 같음) 또는 이의 일부분 (예를 들어, 관련 반응을 촉매하는 부분 (예를 들어, 도메인 (예를 들어, 관련 촉매 도메인) 및/또는 (연속될 수 있거나 또는 이격될 수 있는) 아미노산 잔기의 세트)과 특징적 서열 엘리먼트 및/또는 전체 동일성 백분율을 공유한다.
본 명세서에서 사용되는, "알돌-탈수 생성물"은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기에 접합된 이중 결합을 포함하는 화합물을 의미한다. 일부 구현예에서, 알돌-탈수 생성물은 화학식 P-2의 화합물 또는 이의 염이다.
본 명세서에서 사용되는, 용어 "알돌 생성물"은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착된 히드록실 기를 포함하는 화합물을 지칭한다. 일부 구현예에서, 알돌 생성물은 알돌 반응의 생성물이다. 일부 구현예에서, 알돌 생성물은 화학식 P-1의 구조 또는 이의 염을 갖는다.
본 명세서에서 사용되는, 용어 "알돌 생성물 생합성 폴리펩티드"는 본 명세서에 기술된 바와 같은 알돌 생성물의 합성에 관여하는 폴리펩티드를 지칭한다. 일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알돌라제 폴리펩티드, 히드라타제-알돌라제 폴리펩티드 (예를 들어, 히드라타제-알돌라제)일 수 있거나 또는 그를 포함할 수 있다. 일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알돌라제 폴리펩티드이거나 또는 그를 포함한다. 일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 자연계, 예를 들어 미생물 (예를 들어, 자연계에서 발견되는 기준 알돌 생합성 폴리펩티드)에서 발견되는 아미노산 서열을 갖는다. 대안적으로 또는 추가로 일부 구현예에서, 알돌 생합성 폴리펩티드는 적절한 기준 알돌 생합성 폴리펩티드 (예를 들어, 자연계에서 발견되고/되거나 본 명세서 (예를 들어, 하나 이상의 관련 표)에서 표시되는 바와 같음) 또는 이의 일부분 (예를 들어, 관련 반응을 촉매하는 부분 (예를 들어, 도메인 (예를 들어, 관련 촉매 도메인) 및/또는 (연속될 수 있거나 또는 이격될 수 있는) 아미노산 잔기의 세트)과 특징적 서열 엘리먼트 및/또는 전체 동일성 백분율을 공유한다.
본 명세서에서 사용되는, 용어 "알켄 환원 생성물 생합성 폴리펩티드"는 본 명세서에 기술된 바와 같이 이중 결합의 단일 결합으로의 전환 (및 알켄 환원 생성물의 형성)에 관여하는 폴리펩티드를 지칭한다. 일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 퀴논 옥시도리덕타제일 수 있거나 또는 그를 포함할 수 있다. 일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 자연계, 예를 들어, 미생물 (예를 들어, 자연계에서 발견되는 기준 알켄 환원 생합성 폴리펩티드)에서 발견되는 아미노산 서열을 갖는다. 대안적으로 또는 추가로, 일부 구현예에서, 알돌 생합성 폴리펩티드는 적절한 기준 알돌 생합성 폴리펩티드 (예를 들어, 자연계에서 발견되고/되거나 본 명세서 (예를 들어, 하나 이상의 관련 표)에서 표시되는 바와 같음) 또는 이의 일부분 (예를 들어, 관련 반응을 촉매하는 부분 (예를 들어, 도메인 (예를 들어, 관련 촉매 도메인) 및/또는 (연속될 수 있거나 또는 이격될 수 있는) 아미노산 잔기의 세트)과 특징적 서열 엘리먼트 및/또는 전체 동일성 백분율을 공유한다.
본 명세서에서 사용되는, 용어 "지방족"은 완전 포화되거나 또는 하나 이상의 불포화 단위를 함유하는 직쇄 (즉, 미분지) 또는 분지쇄, 치환 또는 미치환 탄화수소 사슬, 또는 완전 포화되거나 또는 하나 이상의 불포화 단위 (방향족이 아님)를 함유하는 치환 또는 미치환 단환식, 이환식, 또는 다환식 탄화수소 고리, 또는 이의 조합을 의미한다. 일부 구현예에서, 지방족 기는 1-50 지방족 탄소 원자를 함유한다. 일부 구현예에서, 지방족 기는 1-20 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-10 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-9 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-8 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-7 지방족 탄소 원자를 함유한다. 다른 구현예에서, 지방족 기는 1-6 지방족 탄소 원자를 함유한다. 여전히 다른 구현예에서, 지방족 기는 1-5 지방족 탄소 원자를 함유하고, 또 다른 구현예에서, 지방족 기는 1, 2, 3, 또는 4 지방족 탄소 원자를 함유한다. 적합한 지방족 기는 선형 또는 분지형, 치환 또는 미치환된 알킬, 알케닐, 알키닐 기 및 이의 하이브리드 예컨대 (시클로알킬)알킬, (시클로알케닐)알킬 또는 (시클로알킬)알케닐을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는, 용어 "알킬"은 당분야에서의 이의 통상의 의미이고, 직쇄 알킬 기, 분지쇄 알킬 기, 시클로알킬 (지환족) 기, 알킬 치환된 시클로알킬 기, 및 시클로알킬 치환된 알킬 기를 포함하는, 포화 지방족 기를 포함할 수 있다. 일부 구현예에서, 알킬은 1-100 탄소 원자를 갖는다. 일정 구현예에서, 직쇄 또는 분지쇄 알킬은 이의 골격에 약 1-20 탄소 원자 (예를 들어, 직쇄 경우 C1-C20, 분지쇄 경우 C2-C20), 및 대안적으로, 약 1-10을 갖는다. 일부 구현예에서, 시클로알킬 고리는 그들 고리 구조에 약 3-10 탄소 원자를 가지고 이러한 고리는 단환식, 이환식, 또는 다환식이고, 대안적으로, 고리 구조에 약 5, 6 또는 7 탄소를 갖는다. 일부 구현예에서, 알킬 기는 저급 알킬 기일 수 있고, 저급 알킬 기는 1-4 탄소 원자를 포함한다 (예를 들어, 직쇄 저급 알킬 경우 C1-C4).
본 명세서에서 사용되는, "아르알킬", "아르알콕시", 또는 "아릴옥시알킬"에서 처럼 더 큰 모이어트의 일부로서 또는 단독으로 사용되는, 용어 "아릴"은 총 5원 내지 30원 고리 구성원을 갖는 단환식, 이환식 또는 다환식 고리계를 지칭하고, 고리계 중 적어도 하나의 고리는 방향족이다. 일부 구현예에서, 아릴 기는 총 5원 내지 14원 고리 구성원을 갖는 단환식, 이환식 또는 다환식 고리계이고, 고리계 중 적어도 하나의 고리는 방향족이고, 고리계 중 각각의 고리는 3원 내지 7원 고리 구성원을 함유한다. 일부 구현예에서, 아릴 기는 바이아릴 기이다. 용어 "아릴"은 용어 "아릴 고리"와 상호교환적으로 사용될 수 있다. 본 개시의 일정 구현예에서, "아릴"은 하나 이상의 치환기를 보유할 수 있는, 제한없이, 페닐, 바이페닐, 나프틸, 바이나프틸, 안트라실 등을 포함하는 방향족 고리계를 지칭한다. 본 명세서에서 사용되는 용어 "아릴"의 범주 내에는 또한 방향족 고리가 하나 이상의 비-방향족 고리, 예컨대 인다닐, 프탈이미딜, 나프티미딜, 펜안트리디닐, 또는 테트라히드로나프틸 등에 융합된 기가 포함된다.
본 명세서에서 사용되는, 용어 "시클로지방족", "카르보시클", "카르보시클릴", "카르보시클릭 라디칼", 및 "카르보시클릭 고리"는 상호교환적으로 사용되고, 달리 명시하지 않으면, 3원 내지 30원 고리 구성원을 갖는, 본 명세서에 기술된 바와 같은, 포화 또는 부분 불포화되나, 비-방향족, 환형 지방족 단환식, 이환식, 또는 다환식 고리계를 지칭한다. 시클로지방족 기는 제한없이, 시클로프로필, 시클로부틸, 시클로펜틸, 시클로펜테닐, 시클로헥실, 시클로헥세닐, 시클로헵틸, 시클로헵테닐, 시클로옥틸, 시클로옥테닐, 노르보르닐, 아다만틸, 및 시클로옥타디에닐을 포함한다. 일부 구현예에서, 시클로지방족 기는 3-6 탄소를 갖는다. 일부 구현예에서, 시클로지방족 기는 포화되고 시클로알킬이다. 용어 "시클로지방족"은 또한 하나 이상의 방향족 또는 비방향족 고리에 융합된 지방족 고리, 예컨대 데카히드로나프틸 또는 테트라히드로나프틸을 포함할 수 있다. 일부 구현예에서, 시클로지방족 기는 이환식이다. 일부 구현예에서, 시클로지방족 기는 삼환식이다. 일부 구현예에서, 시클로지방족 기는 다환식이다. 일부 구현예에서, "시클로지방족"은 완전 포화되거나 또는 하나 이상의 불포화 단위를 함유하지만, 방향족은 아니고, 분자의 나머지에 단일 부착점을 갖는 C3-C6 단환식 탄화수소, 또는 C8-C10 이환식 또는 다환식 탄화수소, 또는 완전 포화되거나 또는 하나 이상의 불포화 단위를 함유하지만, 방향족은 아니고, 분자의 나머지에 단일 부착점을 갖는, C9-C16 다환식 탄화수소를 지칭한다.
본 명세서에서 사용되는, 용어 "헤테로지방족"은 당분야에서 제공되는 이의 통상의 의미이고, 하나 이상의 탄소 원자가 하나 이상의 이종원자 (예를 들어, 산소, 질소, 황, 규소, 인 등)로 독립적으로 치환된 본 명세서에 기술된 바와 같은 지방족 기를 지칭한다. 일부 구현예에서, C, CH, CH2, 및 CH3 으로부터 선택되는 하나 이상의 단위는 하나 이상의 이종원자 (이의 산화 및/또는 치환된 형태 포함)로 독립적으로 치환된다. 일부 구현예에서, 헤테로지방족 기는 헤테로알킬이다. 일부 구현예에서, 헤테로지방족 기는 헤테로알케닐이다.
본 명세서에서 사용되는, 용어 "헤테로알킬"은 당분야에서 제공되는 이의 통상의 의미이고 하나 이상의 탄소 원자가 하나 이상의 이종원자 (예를 들어, 산소, 질소, 황, 규소, 인 등)로 독립적으로 치환된 본 명세서에 기술된 바와 같은 알킬 기를 지칭한다. 헤테로알킬 기의 예는 알콕시, 폴리(에틸렌 글리콜)-, 알킬-치환된 아미노, 테트라히드로퓨라닐, 피페리디닐, 모르폴리닐 등을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는, 더 큰 모이어티, 예를 들어, "헤테로아르알킬", 또는 "헤테로아르알콕시"의 일부로서 또는 단독으로 사용되는, 용어 "헤테로아릴" 및 "헤테로아르-"는 총 5원 내지 30원 고리 구성원을 갖는 단환식, 이환식 또는 다환화학식 고리계를 지칭하고, 고리계 중 적어도 하나의 고리는 방향족이고 적어도 하나의 방향족 고리 원자는 이종원자이다. 일부 구현예에서, 헤테로아릴 기는 5 내지 10 고리 원자 (즉, 단환식, 이환식 또는 다환식), 일부 구현예에서 5, 6, 9, 또는 10 고리 원자를 갖는 기이다. 일부 구현예에서, 헤테로아릴 기는 6, 10, 또는 14 π 전자를 환식 배열 중에 공유하고; 탄소 원자이외에도, 1 내지 5 이종원자를 갖는다. 헤테로아릴 기는 제한없이, 티에닐, 퓨라닐, 피롤릴, 이미다졸릴, 피라졸릴, 트리아졸릴, 테트라졸릴, 옥사졸릴, 이속사졸릴, 옥사디아졸릴, 티아졸릴, 이소티아졸릴, 티아디아졸릴, 피리딜, 피리다지닐, 피리미디닐, 피라지닐, 인돌리지닐, 푸리닐, 나프티리디닐, 및 프테리디닐을 포함한다. 일부 구현예에서, 헤테로아릴은 헤테로바이아릴 기, 예컨대 바이피리딜 등이다. 본 명세서에서 사용되는 용어 "헤테로아릴" 및 "헤테로아르-"는 또한 헤테로방향족 고리는 하나 이상의 아릴, 시클로지방족, 또는 헤테로시클릴 고리에 융합된 기를 포함하고, 라디칼 또는 부착점은 헤테로방향족 고리 상에 있다. 비제한적인 예는 인돌릴, 이소인돌릴, 벤조티에닐, 벤조퓨라닐, 디벤조퓨라닐, 인다졸릴, 벤즈이미다졸릴, 벤즈티아졸릴, 퀴놀릴, 이소퀴놀릴, 신놀리닐, 프탈라지닐, 퀴나졸리닐, 퀴녹살리닐, 4H-퀴놀리지닐, 카르바졸릴, 아크리디닐, 페나지닐, 페노티아지닐, 페녹사지닐, 테트라히드로퀴놀리닐, 테트라히드로이소퀴놀리닐, 및 피리도[2,3-b]-1,4-옥사진-3(4H)-온을 포함한다. 헤테로아릴 기는 단환식, 이환식 또는 다환식일 수 있다. 용어 "헤테로아릴"은 용어 "헤테로아릴 고리", "헤테로아릴 기", 또는 "헤테로방향족"과 상호교환적으로 사용될 수 있고, 임의의 이들 용어는 임의 치환되는 고리를 포함한다. 용어 "헤테로아르알킬"은 헤테로아릴 기에 의해 치환된 알킬 기를 지칭하고, 알킬 및 헤테로아릴 부분은 독립적으로 임의 치환된다.
본 명세서에서 사용되는, 용어 "이종원자"는 탄소 또는 수소가 아닌 원자를 지칭한다. 일부 구현예에서, 이종원자는 붕소, 산소, 황, 질소, 인, 또는 규소 (질소, 황, 인, 또는 규소의 산화된 형태; 질소 (예를 들어, 4차화된 형태, 이미늄 기 등에서와 같은 형태 등), 인, 황, 산소의 하전된 형태 등 포함)이다. 일부 구현예에서, 이종원자는 산소, 황 또는 질소이다.
본 명세서에서 사용되는, 용어 "헤테로시클", "헤테로시클릴", "헤테로시클릭 라디칼", 및 "헤테로시클릭 고리"는 본 명세서에서 상호교환적으로 사용되고, 포화 또는 부분 불포화되고 하나 이상의 이종원자 고리 원자를 갖는 단환식, 이환화학식 또는 다환식 고리 모이어티 (예를 들어, 3-30원)를 지칭한다. 일부 구현예에서, 헤테로시클릴 기는 포화 또는 부분 불포화되고, 탄소 원자 이외에, 하나 이상, 바람직하게 1 내지 4의, 상기 정의된 바와 같은, 이종원자를 갖는 안정한 5-원 내지 7-원 단환식 또는 7-원 내지 10-원 이환식 헤테로시클릭 모이어티이다. 헤테로시클의 고리 원자를 참조하여 사용될 때, 용어 "질소"는 치환된 질소를 포함한다. 예로서, 산소, 황 및 질소로부터 선택되는 0-3 이종원자를 갖는 포화 또는 부분 불포화 고리에서, 질소는 N (3,4-디히드로-2H-피롤릴에서 처럼), NH (피롤리디닐에서 처럼), 또는 +NR (N-치환된 피롤리디닐에서 처럼)일 수 있다. 헤테로시클릭 고리는 임의의 이종원자 또는 탄소 원자에서 이의 현수기에 부착되어서 안정한 구조를 생성시킬 수 있고 임의의 고리 원자는 임의 치환될 수 있다. 이러한 포화 또는 부분 불포화된 헤테로시클릭 라디칼의 예는 제한없이, 테트라히드로퓨라닐, 테트라히드로티에닐, 피롤리디닐, 피페리디닐, 피롤리닐, 테트라히드로퀴놀리닐, 테트라히드로이소퀴놀리닐, 데카히드로퀴놀리닐, 옥사졸리디닐, 피페라지닐, 디옥사닐, 디옥솔라닐, 디아제피닐, 옥사제피닐, 티아제피닐, 모르폴리닐, 및 퀴뉴클리디닐을 포함한다. 용어 "헤테로시클", "헤테로시클릴", "헤테로시클릴 고리", "헤테로시클릭 기", "헤테로시클릭 모이어티" 및 "헤테로시클릭 라디칼"은 본 명세서에서 상호교환적으로 사용되고, 또한 헤테로시클릴 고리가 하나 이상의 아릴, 헤테로아릴, 또는 시클로지방족 고리, 예컨대 인돌리닐, 3H-인돌릴, 크로마닐, 펜안트리디닐, 또는 테트라히드로퀴놀리닐에 융합된 기를 포함한다. 헤테로시클릴 기는 단환식, 이환식 또는 다환식일 수 있다. 용어 "헤테로시클릴알킬"은 헤테로시클릴에 의해 치환된 알킬 기를 지칭하고, 알킬 및 헤테로시클릴 부분은 독립적으로 임의 치환된다.
임의 치환된: 본 명세서에 기술된 바와 같이, 본 개시의 화학적 독립체, 예를 들어, 다양한 화합물은 임의 치환 및/또는 치환된 모이어티를 함유할 수 있다. 일반적으로, 용어 "치환된"은 지정된 모이어티의 하나 이상의 수소가 적합한 치환기로 치환된 것을 의미한다. 달리 표시하지 않으면, "임의 치환된" 기는 그 기의 각각의 치환가능한 위치에서 적합한 치환기를 가질 수 있고, 임의의 소정 구조 중 하나 초과의 위치가 명시된 기로부터 선택되는 하나 초과의 치환기로 치환될 수 있을 경우에, 치환기는 모든 위치에서 동일할 수 있거나 또는 상이할 수 있다. 일부 구현예에서, 임의 치환된 기는 치환된다. 일부 구현예에서, 임의 치환된 기는 미치환된다. 본 개시에서 고려되는 치환기의 조합은 바람직하게 적합하거나 또는 화학적으로 실현가능한 화합물의 형성을 발생시키는 것이다. 본 명세서에서 사용되는 용어 "안정한"은 본 명세서에 개시된 하나 이상의 목적을 위해 그들 생성, 검출, 및, 일정 구현예에서, 그들 회수, 정제, 및 사용을 가능하게 하는 조건을 가할 때 실질적으로 변경되지 않는 화합물을 의미한다.
치환가능한 원자, 예를 들어 적합한 탄소 원자 상의 적합한 1가 치환기는 독립적으로 할로겐; -(CH2)0-4R○; -(CH2)0-4OR○; -O(CH2)0-4R○, -O-(CH2)0-4C(O)OR○; -(CH2)0-4CH(OR○)2; R○로 치환될 수 있는, -(CH2)0-4Ph; R○로 치환될 수 있는, -(CH2)0-4O(CH2)0-1Ph; R○로 치환될 수 있는, -CH=CHPh; R○로 치환될 수 있는, -(CH2)0-4O(CH2)0-1-피리딜; -NO2; -CN; -N3; -(CH2)0-4N(R○)2; -(CH2)0-4N(R○)C(O)R○; -N(R○)C(S)R○; -(CH2)0-4N(R○)C(O)NR○ 2; -N(R○)C(S)NR○ 2; -(CH2)0-4N(R○)C(O)OR○; -N(R○)N(R○)C(O)R○; -N(R○)N(R○)C(O)NR○ 2; -N(R○)N(R○)C(O)OR○; -(CH2)0-4C(O)R○; -C(S)R○; -(CH2)0-4C(O)OR○; -(CH2)0-4C(O)SR○; -(CH2)0-4C(O)OSiR○ 3; -(CH2)0-4OC(O)R○; -OC(O)(CH2)0-4SR○, -SC(S)SR○; -(CH2)0-4SC(O)R○; -(CH2)0-4C(O)NR○ 2; -C(S)NR○ 2; -C(S)SR○; -(CH2)0-4OC(O)NR○ 2; -C(O)N(OR○)R○; -C(O)C(O)R○; -C(O)CH2C(O)R○; -C(NOR○)R○; -(CH2)0-4SSR○; -(CH2)0-4S(O)2R○; -(CH2)0-4S(O)2OR○; -(CH2)0-4OS(O)2R○; -S(O)2NR○ 2; -(CH2)0-4S(O)R○; -N(R○)S(O)2NR○ 2; -N(R○)S(O)2R○; -N(OR○)R○; -C(NH)NR○ 2; -Si(R○)3; -OSi(R○)3; -B(R○)2; -OB(R○)2; -OB(OR○)2; -P(R○)2; -P(OR○)2; -P(R○)(OR○); -OP(R○)2; -OP(OR○)2; -OP(R○)(OR○); -P(O)(R○)2; -P(O)(OR○)2; -OP(O)(R○)2; -OP(O)(OR○)2; -OP(O)(OR○)(SR○); -SP(O)(R○)2; -SP(O)(OR○)2; -N(R○)P(O)(R○)2; -N(R○)P(O)(OR○)2; -P(R○)2[B(R○)3]; -P(OR○)2[B(R○)3]; -OP(R○)2[B(R○)3]; -OP(OR○)2[B(R○)3]; -(C1-4 직쇄 또는 분지쇄 알킬렌)O-N(R○)2; 또는 -(C1-4 직쇄 또는 분지쇄 알킬렌)C(O)O-N(R○)2 이고, 상기 화학식에서, 각각의 R○는 본 명세서에 정의된 바와 같이 치환될 수 있고 독립적으로 수소, C1-20 지방족, 질소, 산소, 황, 규소 및 인으로부터 독립적으로 선택되는 1-5 이종원자를 갖는 C1-20 헤테로지방족, -CH2-(C6-14 아릴), -O(CH2)0-1(C6-14 아릴), -CH2-(5-14원 헤테로아릴 고리), 질소, 산소, 황, 규소 및 인으로부터 독립적으로 선택되는 0-5 이종원자를 갖는, 5-20원, 단환식, 이환식, 또는 다환식, 포화, 부분 불포화 또는 아릴 고리이거나, 또는 상기 정의와 무관하게, R○의 2개 독립 존재는 그들의 개재 원자(들)와 함께, 하기 정의된 바와 같이 치환될 수 있는, 질소, 산소, 황, 규소, 및 인으로부터 독립적으로 선택되는 0-5 이종원자를 갖는 5-20원, 단환식, 이환식, 또는 다환식, 포화, 부분 불포화 또는 아릴 고리를 형성한다.
R°(또는 그들의 개재 원자와 함께 R○의 2개 독립 존재에 의해 형성되는 고리) 상의 적합한 1가 치환기는 독립적으로 할로겐, -(CH2)0-2R●, -(할로R●), -(CH2)0-2OH, -(CH2)0-2OR●, -(CH2)0-2CH(OR●)2; -O(haloR●), -CN, -N3, -(CH2)0-2C(O)R●, -(CH2)0-2C(O)OH, -(CH2)0-2C(O)OR●, -(CH2)0-2SR●, -(CH2)0-2SH, -(CH2)0-2NH2, -(CH2)0-2NHR●, -(CH2)0-2NR● 2, -NO2, -SiR● 3, -OSiR● 3, -C(O)SR● , -(C1-4 직쇄 또는 분지쇄 알킬렌)C(O)ORl, 또는 -SSR● 이고, 각각의 R● 은 미치환되거나 또는 "할로"가 선행되는 경우에 하나 이상의 할로겐으로만 치환되고, C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 및 질소, 산소, 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 5-6원 포화, 부분 불포화, 또는 아릴 고리로부터 독립적으로 선택된다. R○ 의 포화된 탄소 원자 상의 적합한 2가 치환기는 =O 및 =S를 포함한다.
예를 들어, 적합한 탄소 원자 상의 적합한 2가 치환기는 독립적으로 하기와 같다: =O, =S, =NNR* 2, =NNHC(O)R*, =NNHC(O)OR*, =NNHS(O)2R*, =NR*, =NOR*, -O(C(R* 2))2-3O-, 또는 -S(C(R* 2))2-3S-, 여기서 R* 의 각각의 독립 존재는 수소, 하기 정의된 바와 같이 치환될 수 있는, C1-6 지방족, 및 질소, 산소, 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 미치환된 5-6원 포화, 부분 불포화, 또는 아릴 고리로부터 선택된다. "임의 치환된" 기의 인접한 치환가능한 탄소에 결합되는 적합한 2가 치환기는 -O(CR* 2)2-3O-를 포함하고, 여기서 R* 의 각각의 독립 존재는 수소, 하기 정의된 바와 같이 치환될 수 있는 C1-6 지방족, 및 질소, 산소 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 미치환된 5-6원 포화, 부분 불포화, 및 아릴 고리로부터 선택된다.
R* 의 지방족 기 상의 적합한 치환기는 독립적으로 할로겐, -R●, -(할로R●), -OH, -OR●, -O(할로R●), -CN, -C(O)OH, -C(O)OR●, -NH2, -NHR●, -NR● 2, 또는 -NO2 이고, 여기서 각각의 R● 은 미치환되거나 또는 "할로"가 선행되는 경우에 하나 이상의 할로겐으로만 치환되고, 독립적으로 C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 또는 질소, 산소 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 5-6원 포화, 부분 불포화, 또는 아릴 고리이다.
일부 구현예에서, 치환가능한 질소 상에서 적합한 치환기는 독립적으로 -R†, -NR† 2, -C(O)R†, -C(O)OR†, -C(O)C(O)R†, -C(O)CH2C(O)R†, -S(O)2R†, -S(O)2NR† 2, -C(S)NR† 2, -C(NH)NR† 2, 또는 -N(R†)S(O)2R†;이고, 여기서 각각의 R† 는 독립적으로 수소, 하기 정의된 바와 같이 치환될 수 있는 C1-6 지방족, 미치환된 -OPh, 또는 질소, 산소 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 미치환된 5-6원 포화, 부분 불포화, 또는 아릴 고리이거나, 또는 상기 정의와 무관하게, R† 의 2개 독립 존재는 그들의 개재 원자(들)와 함께 질소, 산소 및 황으로부터 독립적으로 선택되는 0-4 이종원자를 갖는 미치환된 3-12원 포화, 부분 불포화, 또는 아릴 단환식 또는 이환식 고리를 형성한다.
R† 의 지방족 기 상의 적합한 치환기는 독립적으로 할로겐, -Rl, -(할로R●), -OH, -OR●, -O(할로R●), -CN, -C(O)OH, -C(O)OR●, -NH2, -NHR●, -NR● 2, 또는 -NO2 이고, 여기서 각각의 R● 는 미치환되거나 또는 "할로"가 선행되는 경우에 하나 이상의 할로겐으로만 치환되고, 독립적으로 C1-4 지방족, -CH2Ph, -O(CH2)0-1Ph, 또는 질소, 산소 및 황으로 독립적으로 선택되는 0-4 이종원자를 갖는 5-6원 포화, 부분 불포화, 또는 아릴 고리이다.
본 명세서에서 사용되는, 용어 "부분 불포화"는 적어도 하나의 이중 또는 삼중 결합을 포함하는 고리 모이어티를 지칭한다. 용어 "부분 불포화"는 다수의 불포화 부위를 갖는 고리를 포괄하고자 하지만, 본 명세서에 정의되는 바와 같이, 아릴 또는 헤테로아릴 모이어티를 포함하고자 의도하지 않는다.
"야생형"은 자연계에 존재하는 대로의 세포, 조성물, 조직, 또는 다른 생물학적 물질을 정의한다.
일부 구현예에서, 3-히드록시-프로파날 및 피루베이트는 하나 이상의 글리세롤, C5 당, C6 당, 포스포글리세레이트, 다른 탄소원, 해당 경로의 중간체, 및 이의 조합으로부터 제조된다. 일부 구현예에서, C5 당은 하나 이상의 자일로스, 자일룰로스, 리불로스, 아라비노스, 릭소스, 및 리보스를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어지고, C6 당은 알로스, 알트로스, 글루코스, 만노스, 굴로스, 이도스, 탈로스, 프룩토스, 사이코스, 솔보스, 및 타가토스를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다. 일부 구현예에서, 다른 탄소원은 미생물에 대한 탄소원으로서 적합한 공급원료이고, 여기서 공급원료는 하나 이상의 아미노산, 지질, 옥수수대, 억새, 도시 폐기물, 에너지 수수, 사탕수수, 바가스, 전분 스트림, 덱스트로스 스트림, 포르메이트, 메탄올, 및 이의 조합을 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
본 명세서에서 사용되는, 용어 "C5 당"은 5개 탄소를 함유하는 당 분자를 지칭한다.
본 명세서에서 사용되는, 용어 "C6 당"은 6개 탄소를 함유하는 당 분자를 지칭한다.
일부 구현예에서, 용어 "알돌 부가"는 피루베이트 분자가 CN+3 4-히드록시-2-케토-카르복실산 중간체를 생성시키기 위해 CN 알데히드의 알데히드 작용기와 반응하는 해당 에놀 또는 에놀레이트 이온 또는 시프 염기 또는 에나민을 형성하는 화학 반응을 지칭한다. 일부 구현예에서, CN 알데히드는 3-히드록시-프로파날이고 CN+3 4-히드록시-2-케토-카르복실산 중간체는 4,6-디히드록시-2-케토-헥산산이다.
일부 구현예에서, 용어 "알돌 축합"은 CN+3 3,4-데히드로-2-케토-카르복실산을 생성시키기 위해 CN 알데히드의 알데히드 작용기와 반응하는 해당 에놀 또는 에놀레이트 이온 또는 시프 염기 또는 에나민을 형성하는 화학 반응을 지칭한다. 일부 구현예에서, CN 알데히드는 3-히드록시-프로파날이고 CN+3 3,4-데히드로-2-케토-카르복실산은 6-히드록시-3,4-데히드로-2-케토-헥산산이다.
본 명세서에서 사용되는 용어 "용액"은 용매 및 용질, 예컨대 본 명세서에 기술된 방법에서 사용되는 출발 물질을 함유하는 액상 조성물을 지칭한다. 일부 구현예에서, 용매는 물이다. 일부 구현예에서, 용매는 유기 용매이다.
본 명세서에서 사용되는, 용어 "효소 단계" 또는 "효소 반응"은 바람직한 효소 반응을 촉진하도록 선택된 효소에 의해 촉매되는 분자 반응을 지칭한다. 효소는 대형 생물학적 분자 및 고도의 선택적 촉매이다. 대부분의 효소는 단백질이지만, 일부 촉매성 RNA 분자가 확인되었다.
본 출원 전반에서, 효소 단계는 "단계 1", "단계 2" 등으로서 표시될 수 있고 이들 단계를 특이적으로 촉매하는 효소는 각각 "1", "2" 등으로 표시된다. 이러한 효소는 또한 "반응 특이적 효소"라고도 지칭된다.
본 명세서에서 사용되는, 용어 "CoA" 또는 "조효소 A"는 그의 존재가 활성 효소 시스템을 형성하는 많은 효소의 활성에 요구되는 유기 보조인자 또는 보결분자단 (효소의 비단백질 부분)을 의미하고자 한다.
본 명세서에서 사용되는, 배양물 또는 성장 조건에 대해서 사용될 때 용어 "실질적으로 혐기성"은 산소의 양이 액상 배지 중 용존 산소에 대한 포화의 약 10% 미만인 것을 의미하고자 한다. 이 용어는 또한 약 1% 미만의 산소 대기가 유지되는 액체 또는 고체 배지의 밀봉 챔버를 포함하고자 한다.
본 명세서에서 사용되는, 본 개시의 미생물 유기체 또는 미생물에 대해서 사용될 때 용어 "비-천연 발생" 또는 "비-천연"은 미생물 유기체가 참조된 종의 야생형 균주를 포함하여, 참조된 종의 천연 발생 균주에서 정상적으로 발견되지 않는 적어도 하나의 유전자 변경을 갖는다는 것을 의미하고자 한다. 유전자 변경은 예를 들어, 폴리펩티드를 코딩하는 발현가능한 핵산을 도입시키는 변형, 다른 핵산 부가, 핵산 결실, 및/또는 미생물 유기체의 유전자 물질의 다른 기능적 파괴를 포함하지만, 이에 제한되지 않는다. 이러한 변형은 예를 들어, 참조된 종에 대한 이종성, 동종성 또는 이종성 및 동종성 폴리펩티드 둘 모두에 대한 코딩 영역 및 이의 기능적 단편을 포함하지만, 이에 제한되지 않는다. 추가 변형은 예를 들어, 변형이 유전자 또는 오페론의 발현을 변경시키지 않는 비-코딩 조절 영역을 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 "외생성"은 참조된 분자 또는 참조된 활성이 숙주 미생물 유기체로 도입되는 것을 의미하고자 한다. 분자는 예를 들어, 코딩 핵산을 숙주 유전자 물질에 도입시켜서, 예컨대 숙주 염색체 또는 비-염색체 유전자 물질 예컨대 플라스미드에 통합시켜서, 도입될 수 있다. 그러므로, 코딩 핵산의 발현에 대해서 사용되는 이 용어는 발현가능한 형태의 코딩 핵산의 미생물 유기체로의 도입을 지칭한다. 효소 활성에 대해서 사용될 때, 이 용어는 숙주 기준 유기체에 도입되는 활성을 지칭한다. 공급원은 예를 들어, 숙주 미생물 유기체로 도입 후 참조된 활성을 발현하는 동종성 또는 이종성 코딩 핵산일 수 있다. 그러므로, 용어 "내생성"은 야생형 숙주에서 본래 또는 자연적으로 존재하는 참조된 분자 또는 활성을 지칭한다. 유사하게, 코딩 핵산의 발현에 대해서 사용될 때 이 용어는 야생형 미생물 내에 함유되는 코딩 핵산의 발현을 지칭한다.
용어 "이종성"은 참조된 종 이외의 공급원으로부터 유래되는 분자 또는 활성을 의미하는 반면 본 문맥에서 사용될 때 "동종성"은 숙주 미생물 유기체로부터 유래된 분자 또는 활성을 지칭한다. 따라서, 코딩 핵산의 외생성 발현은 이종성 또는 동종성 코딩 핵산 중 어느 하나 또는 둘 모두를 이용할 수 있다.
하나 초과의 외생성 핵산이 유기체 미생물에 포함될 때, 하나 초과의 외생성 핵산은 상기 논의된 바와 같은, 참조된 코딩 핵산 또는 효소 활성을 지칭한다는 것을 이해한다. 하나 초과의 외생성 핵산은 별도 핵산 분자, 폴리시스트론 핵산 분자, 또는 이의 조합 상에서 숙주 미생물 유기체로 도입될 수 있고, 여전히 하나 초과의 외생성 핵산으로서 간주될 수 있다는 것을 본 명세서에 개시된 바와 같이, 더욱 이해한다. 예를 들어, 본 명세서에 개시된 바와 같이, 미생물 유기체는 바람직한 경로 효소 또는 단백질을 코딩하는 둘 이상의 외생성 핵산을 발현하도록 조작될 수 있다. 바람직한 활성을 코딩하는 2종의 외생성 핵산이 숙주 미생물 유기체로 도입되는 경우에, 2종의 외생성 핵산은 단일 핵산으로서 도입될 수 있고, 예를 들어, 단일 플라스미드 상에서, 별도 플라스미드 상에서, 단일 부위 또는 다수 부위에서 숙주 염색체에 통합될 수 있고, 여전히 2종의 외생성 핵산으로서 간주될 수 있다는 것을 이해한다. 유사하게, 둘 초과의 외생성 핵산은 숙주 유기체로 임의의 바람직한 조합으로 도입될 수 있고, 예를 들어, 단일 플라스미드 상에, 별도 플라스미드 상에서, 단일 부위 또는 다수 부위에서 숙주 염색체로 통합될 수 있으며, 여전히 둘 이상의 외생성 핵산으로서, 예를 들어, 3종의 외생성 핵산으로서 간주될 수 있다는 것을 이해한다. 따라서, 참조된 외생성 핵산 또는 효소 활성의 수는 코딩 핵산의 수 또는 효소 활성의 수를 지칭하나, 숙주 유기체로 도입된 별도 핵산의 수를 지칭하는 것은 아니다.
일부 구현예에서, 코딩 핵산의 외생성 발현이 적용된다. 외생성 발현은 숙주에 대해 발현 및/또는 조절 엘리먼트를 맞춤 제작하는 능력 및 사용자에 의해 제어되는 바람직한 발현 수준을 획득하기 위한 응용성을 부여한다. 그러나, 내생성 발현은 또한 다른 구현예에서, 예컨대 유도성 프로모터 또는 다른 조절 엘리먼트에 연결될 때 유전자 프로모터의 유도 또는 음성 조절 이펙터를 제거하여 이용될 수 있다. 따라서, 천연 발생 유도성 프로모터를 갖는 내생성 유전자는 적절한 유도제를 제공하여 상향-조절될 수 있거나, 또는 내생성 유전자의 조절 영역은 유도성 조절 엘리먼트를 유입시키도록 조작될 수 있어서, 바람직한 시간에 내생성 유전자의 증가된 발현의 조절을 허용한다. 유사하게, 유도성 프로모터는 비-천연 발생 미생물 유기체로 도입된 외생성 유전자에 대한 조절 엘리먼트로서 포함될 수 있다.
당업자는 유전자 변경이 적합한 숙주 유기체 예컨대 이. 콜라이 및 그들의 해당 물질대사 반응 또는 바람직한 유전자 물질 예컨대 바람직한 생합성 경로에 대한 유전자에 대한 적합한 공급원 유기체에 대해 기술된다는 것을 이해할 것이다. 그러나, 광범위하게 다양한 유기체의 완전한 게놈 시퀀싱 및 유전체학 분야의 높은 기술 수준을 고려하면, 당업자는 본 명세서에 제공된 교시 및 지침을 본질적으로 모든 다른 유기체에 쉽게 적용할 수 있을 것이다. 예를 들어, 본 명세서에 예시된 이. 콜라이 물질대사 변경은 참조된 종 이외의 종으로부터의 동일하거나 또는 유사한 코딩 핵산을 유입시켜서 다른 종에 쉽게 적용할 수 있다. 이러한 유전자 변경은 예를 들어, 종 상동성, 일반적으로, 특히, 오솔로그, 파라로그 또는 비-오솔로그 유전자 치환의 유전자 변경을 포함한다.
경로 효소를 코딩하는 핵산의 공급원은 예를 들어, 코딩된 유전자 생성물이 참조된 반응을 촉매할 수 있는 임의 종을 포함할 수 있다. 이러한 종은 제한없이, 고세균 및 진정세균을 포함하는 박테리아, 및 효모, 식물, 곤충, 동물, 및 인간을 포함한 포유동물을 포함한, 진핵생물을 포함하는, 원핵생물 및 진핵생물 유기체 둘 모두를 포함한다. 이러한 공급원의 예시적인 종은 예를 들어, 에스케리치아 콜라이 (Escherichia coli), 슈도모나스 크낙무씨이 (Pseudomonas knackmussii), 슈도모나스 푸티다 (Pseudomonas putida), 슈도모나스 플루오레센스 (Pseudomonas fluorescens), 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae), 세라티아 프로테아마쿨란스 (Serratia proteamaculans), 스트렙토마이세스 (Streptomyces) sp. 2065, 슈도모나스 애루지노사 (Pseudomonas aeruginosa), 랄스토니아 유트로파 (Ralstonia eutropha), 클로스트리듐 아세토부틸리쿰 (Clostridium acetobutylicum), 유글레나 그라실리스 (Euglena gracilis), 트레포네마 덴티콜라 (Treponema denticola), 클로스트리듐 클루이베리 (Clostridium kluyveri), 호모 사피엔스 (Homo sapiens), 라투스 노르베지쿠스 (Rattus norvegicus), 아시네토박터 (Acinetobacter) sp. ADP1, 스트렙토마이세스 코엘리콜로르 (Streptomyces coelicolor), 유박테리움 바르케리 (Eubacterium barkeri), 펩토스트렙토코쿠스 아사카롤리티쿠스 (Peptostreptococcus asaccharolyticus), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 티로부티리쿰 (Clostridium tyrobutyricum), 클로스트리듐 써모아세티쿰 (Clostridium thermoaceticum) (무렐라 써모아세티쿰 (Moorella thermoaceticum)), 아시네토박터 칼코아세티쿠스 (Acinetobacter calcoaceticus), 무스 무스쿨루스 (Mus musculus), 수스 스크로파 (Sus scrofa), 플라보박테리움 (Flavobacterium) sp, 아트로박터 아우레센스 (Arthrobacter aurescens), 페니실리움 크리소게눔 (Penicillium chrysogenum), 아스퍼질러스 니거 (Aspergillus niger), 아스퍼질러스 니둘란스 (Aspergillus nidulans), 바실러스 서브틸리스 (Bacillus subtilis), 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae), 자이모모나스 모빌리스 (Zymomonas mobilis), 만헤이미아 숙시니시프로두센스 (Mannheimia succiniciproducens), 클로스트리듐 융달리이 (Clostridium ljungdahlii), 클로스트리듐 카르복시디보란스 (Clostridium 카르복시divorans), 지오바실러스 스테아로써모필루스 (Geobacillus stearothermophilus), 아그로박테리움 투머파시엔스 (Agrobacterium tumefaciens), 아크로모박터 데니트리피칸스 (Achromobacter denitrificans), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 해모필루스 인플루엔자에 (Haemophilus influenzae), 악시다미노코쿠스 퍼멘탄스 (Acidaminococcus fermentans), 클로스트리듐 (Clostridium) sp. M62/1, 푸소박테리움 누클레아툼 (Fusobacterium nucleatum) 을 비롯하여, 본 명세서에 개시되거나 또는 해당 유전자에 대한 공급원 유기체로서 이용가능한 다른 예시적인 종을 포함한다 (실시예 참조). 그러나, 이제 400 초과의 미생물 게놈 및 다양한 효모, 진균, 식물, 및 포유동물 게놈에 대해 입수가능한 완전 게놈 서열을 사용하여, 예를 들어, 기지 유전자의 상동성, 오솔로그, 파라로그 및 비-오솔로그 유전자 치환, 및 유기체 간 유전자 변경의 상호교환을 포함한, 관련되거나 또는 먼 종에서 하나 이상의 유전자에 대한, 필수 경로 효소를 코딩하는 유전자의 확인은 통상적이고 당분야에 충분히 공지되어 있다.
오솔로그는 종 분화에 의해서 공통 조상 유전자로부터 진화된 상이한 종에서의 유전자를 지칭한다. 보통, 오솔로그는 진화 과정 동안 동일 기능을 보유한다. 오솔로그의 확인은 새롭게 시퀀싱된 게놈에서 유전자 기능의 신뢰할만한 예측에 결정적이다.
파라로그는 게놈 내 중복으로 관련된 유전자를 지칭한다. 오솔로그는 일반적으로 진화 과정에서 동일한 기능을 보유하지만, 파라로그는 이들이 본래의 것과 관련되더라도, 새로운 기능을 진화시킬 수 있다.
비오솔로그 유전자 치환은 상이한 종에서 참조된 유전자 기능을 대체할 수 있는 한 종으로부터의 비오솔로그 유전자이다. 치환은 예를 들어, 상이한 종에서 참조된 기능과 비교된 기원 종에서 실질적으로 동일하거나 또는 유사한 기능을 수행할 수 있는 것을 포함한다. 일반적으로, 비오솔로그 유전자 치환은 참조된 기능을 코딩하는 기지 유전자와 구조적으로 관련된 것으로 확인가능할 수 있지만, 구조적으로 덜 관련있지만 기능적으로 유사한 유전자 및 그들의 해당 유전자 생성물은 그럼에도 불구하고 여전히 본 명세서에서 사용되는 용어의 의미 내에 속하게 될 것이다. 기능적 유사성은 예를 들어, 대체하고자 하는 기능을 코딩하는 유전자와 비교하여 비오솔로그 유전자 생성물의 활성 부위 또는 결합 영역 내에 적어도 일부 구조적 유사성을 요구한다. 그러므로, 비오솔로그 유전자는 예를 들어 파라로그 또는 비관련 유전자를 포함한다.
본 명세서에서 사용되는, 용어 "미생물" 또는 "미생물 유기체" 또는 "미생물들"은 상호교환적으로 사용되고 외생성 또는 재조합 핵산, 예컨대 DNA 또는 RNA의 삽입을 통해서 형질전환 또는 형질감염될 수 있는 살아있는 생물학적 및 단리된 원핵생물 또는 진핵생물 세포를 지칭한다. 임의의 적합한 원핵생물 또는 진핵생물 미생물은 핵산의 서열로 형질전환된 이후에 여전히 살아있으면 본 개시에서 사용될 수 있다. 본 개시의 적합한 미생물은 방법에서 적어도 하나의 단계를 촉매할 수 있는 하나 이상의 재조합 단백질을 코딩하는 하나 이상의 핵산 구성체를 발현할 수 있다. 미생물은 박테리아, 효모, 진균, 곰팡이, 및 고세균의 군으로부터 선택될 수 있다. 이들은 상업적으로 입수가능하다.
본 명세서에서 사용되는, "진균"은 진균계 내에서 분류되는 임의의 진핵생물 유기체를 지칭한다. 진균계 내 문은 아스코마이코타 (Ascomycota), 바시디오마이코타 (Basidiomycota), 블라스토클라디오마이코타 (Blastocladiomycota), 카이트리디오마이코타 (Chytridiomycota), 글로머로마이코타 (Glomeromycota), 미크로스포리디아 (Microsporidia), 및 네오칼리마스티고마이코타 (Neocallimastigomycota)를 포함한다. 본 명세서에서 사용되는, "효모"는 (예를 들어, 출아에 의해) 단일-세포 형태로 성장하는 진균을 지칭하는데 반해서, "곰팡이"는 다세포 균사 또는 균사체로 만들어진 필라멘트로 성장하는 진균을 지칭한다 (McGinnis, M.R. and Tyring, S.K. "Introduction to Mycology." Medical Microbiology. 4th ed. Galveston: Univ. of TX Medical Branch at Galveston, 1996).
일부 구현예에서, 미생물은 효모 세포이다. 일부 구현예에서, 효모 세포는 칸디다 (Candida), 한세눌라 (Hansenula), 이사트첸키아 (Issatchenkia), 클루이베로마이세스 (Kluyveromyces), 피키아 (Pichia), 사카로마이세스 (Saccharomyces), 스키조사카로마이세스 (Schizosaccharomyces), 또는 야로위아 (Yarrowia) 종 유래이다.
일부 구현예에서, 미생물은 곰팡이 세포이다. 일부 구현예에서, 곰팡이 숙주 세포는 뉴로스포라 (Neurospora), 트리코더마 (Trichoderma), 아스퍼질러스 (Aspergillus), 푸사리움 (Fusarium), 또는 크리소스포리움 (Chrysosporium) 종 유래이다.
일부 구현예에서, 미생물은 고세균이다. 일부 구현예에서, 적합한 고세균은 아카에오글로부스 (Archaeoglobus), 아에로피룸 (Aeropyrum), 할로박테리움 (Halobacterium), 피로바쿨룸 (Pyrobaculum), 피로코쿠스 (Pyrococcus), 술폴로부스 (Sulfolobus), 메타노코쿠스 (Methanococcus), 메타노스파에라 (Methanosphaera), 메타노피루스 (Methanopyrus), 메타노브레비박터 (Methanobrevibacter), 메타노칼도코쿠스 (Methanocaldococcus), 또는 메타노사르시나 (Methanosarcina) 종 유래이다.
용어 "박테리아"는 원핵생물 유기체의 계 또는 영역 내 임의 미생물을 지칭한다. 박테리아계 또는 영역 내 문은 악시도박테리아 (Acidobacteria), 악티노박테리아 (Actinobacteria), 악티노바실러스 (Actinobacillus), 아그로박테리움 (Agrobacterium), 아나에로비오스피룰룸 (Anaerobiospirrulum), 아퀴피카에 (Aquificae), 아르마티모나데테스 (Armatimonadetes), 박테로이데테스 (Bacteroidetes), 버크홀데리아 (Burkholderia), 칼디세리카 (Caldiserica), 클라미디아에 (Chlamydiae), 클로로비 (Chlorobi), 클로렐라 (Chlorella), 클로로플렉시 (Chloroflexi), 크리시오게네테스 (Chrysiogenetes), 시트로박터 (Citrobacter), 클로스트리듐 (Clostridium), 시아노박테리아 (Cyanobacteria), 데페리박테레스 (Deferribacteres), 데이노코쿠스-써무스 (Deinococcus-thermus), 딕티오글로미 (Dictyoglomi), 엔테로박터 (Enterobacter), 엘루시미크로비아 (Elusimicrobia), 피브로박테레스 (Fibrobacteres), 피르미쿠테스 (Firmicutes), 푸소박테리아 (Fusobacteria), 지오바실러스 (Geobacillus), 겜마티모나데테스 (Gemmatimonadetes), 글루코노박터 (Gluconobacter), 할라나에로비움 (Halanaerobium), 클렙시엘라 (Klebsiella), 클루이베라 (Kluyvera), 락토바실러스 (Lactobacillus), 렌티스파에라에 (Lentisphaerae), 메틸로박테리움 (Methylobacterium), 니트로스피라 (Nitrospira), 파스퇴렐라세아에 (Pasteurellaceae), 파에니바실러스 (Paenibacillus), 플란크토마이세테스 (Planctomycetes), 프로피오니박테리움 (Propionibacterium), 슈도모나스 (Pseudomonas), 프로테오박테리아 (Proteobacteria), 랄스토니아 (Ralstonia), 스키조키트리움 (Schizochytrium), 스피로카에테스 (Spirochaetes), 스트렙토마이세스 (Streptomyces), 시네르기스테테스 (Synergistetes), 테네리쿠테스 (Tenericutes), 써모아나에로박테리움 (Thermoanaerobacterium), 써모데술포박테리아 (Thermodesulfobacteria), 써모토가에 (Thermotogae), 베루코미크로비아 (Verrucomicrobia), 조벨렐라 (Zobellella), 및 자이모모나스 (Zymomonas)를 포함한다. 일부 구현예에서, 박테리아 미생물은 이. 콜라이 세포이다. 일부 구현예에서, 박테리아 미생물은 바실러스 (Bacillus) sp. 세포이다. 바실러스 종의 예는 제한없이, 바실러스 서브틸리스 (Bacillus subtilis), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 세레우스 (Bacillus cereus), 바실러스 투린지엔시스 (Bacillus thuringiensis), 바실러스 미코이데스 (Bacillus mycoides), 및 바실러스 리케니포르미스 (Bacillus licheniformis)를 포함한다.
본 개시의 방법으로 제조된 카르복실산 화합물은 제한없이, 금속 이온, 예를 들어, 알칼리 금속 이온, 예컨대 소듐, 포타슘, 알칼리토 이온, 예컨대 칼슘, 마그네슘, 또는 알루미늄 이온을 포함한 반대 이온과 염을 형성할 수 있거나; 또는 유기 염기 예컨대 테트라알킬암모늄, 에탄올아민, 디에탄올아민, 트리에탄올아민, 트리메틸아민, N-메틸글루카민 등과 배위결합될 수 있다. 산은 반응 조건 하에 존재하는 반대 이온 또는 유기 염기와 염을 형성할 수 있거나 또는 무기 또는 유기 염기와 반영하여 염으로 전환될 수 있다.
본 명세서의 임의의 카르복실산 함유 화합물은 임의의 이의 염 형태를 포함하여, 임의의 이의 중성 또는 이온화 형태의 화합물을 지칭하기 위해 전반에서 상호교환적으로 사용된, 산 또는 염기를 지칭한다. 특이적 형태는 pH에 의존적일 것임을 당업자는 이해한다.
화합물의 용매화물은 결정 격자 내부에서 용매의 하나 미만, 하나 또는 하나 초과의 분자와 결정화되는 화합물의 고체-형태이다. 용매화물, 예컨대 약학적으로 허용가능한 용매화물을 생성시키는데 사용될 수 있는 용매의 소수 예는 제한없이, 물, C1-C6 알콜 (예컨대 메탄올, 에탄올, 이소프로판올, 부탄올, 및 임의 치환될 수 있는) 일반적으로, 테트라히드로퓨란, 아세톤, 에틸렌 글리콜, 프로필렌 글리콜, 아세트산, 포름산, 및 이의 용매 혼합물을 포함한다. 약학적으로 허용가능한 용매화물을 만드는 것을 보조할 수 있는 다른 이러한 생체적합성 용매는 당분야에 충분히 공지되어 있다. 추가로, 다양한 유기 및 무기 산 및 염기는 바람직한 용매화물을 생성시키기 위해 첨가될 수 있다. 이러한 산 및 염기는 당분야에 공지되어 있다. 용매가 물인 경우에, 용매화물은 수화물이라고 지칭될 수 있다. 일부 구현예에서, 화합물의 한 분자는 0.1 내지 5 분자의 용매, 예컨대 0.5 분자의 용매 (반용매화물, 예컨대 반수화물), 1 분자의 용매 (단일용매화물, 예컨대 단일수화물) 및 2 분자의 용매 (2용매화물, 예컨대 이수화물)와의 용매화물을 형성할 수 있다.
몇개의 이성질체 (예를 들어, 시스 및 트랜스 이성질체, R 및 S 이성질체, 또는 이의 조합)가 존재하는 화합물을 언급할 때, 원론적으로 화합물은 본 개시의 방법에서 사용할 수 있는 그 화합물의 모든 가능한 거울상이성질체, 부분입체이성질체 및 시스/트랜스 이성질체를 포함한다.
각 종의 경우에, 그 종에 속하는 임의 세포는 본 개시의 적합한 미생물로 간주된다. 임의 종의 숙주 세포는 자연계로부터 단리된 대로 존재할 수 있거나, 또는 임의 수의 유전자 변형 (예를 들어, 유전자 돌연변이, 결실, 또는 재조합 폴리뉴클레오티드)을 함유할 수 있다.
용어 "재조합 핵산" 또는 "재조합 폴리뉴클레오티드"는 본 명세서에서 사용되는 하기 중 적어도 하나가 참인 핵산의 중합체를 지칭한다: (a) 핵산의 서열이 소정 미생물에 대해 외래인 경우 (즉, 자연적으로 발견되지 않음); (b) 서열이 소정 미생물에서 자연적으로 발견될 수 있지만, 비자연적인 (예를 들어, 기대 초과) 양으로 발견될 수 있는 경우; 또는 (c) 핵산의 서열이 자연계에서 서로에 대해 동일한 관계로 발견되지 않는 둘 이상의 하위서열을 함유하는 경우. 예를 들어, (c)의 예와 관련하여, 재조합 핵산 서열은 새로운 기능성 핵산을 만들도록 배열된 미관련 유전자로부터의 둘 이상의 서열을 가질 수 있다.
일부 구현예에서, 본 개시의 재조합 폴리펩티드 또는 단백질 또는 효소는 하나 이상의 발현 벡터의 일부로서 유전자 물질에 의해 코딩될 수 있다. 발현 벡터는 하나 이상의 폴리펩티드-코딩 핵산을 함유하고, 핵산(들)의 발현을 제어하는 임의의 바람직한 엘리먼트를 비롯하여, 소정 숙주 세포 내부에서 발현 벡터의 복제 및 유지를 가능하게 하는 임의의 엘리먼트를 더 함유할 수 있다. 모든 재조합 핵산은 단일 발현 벡터 상에 존재할 수 있거나, 또는 그들은 다수 발현 벡터에 의해 코딩될 수 있다.
발현 벡터 또는 벡터들은 숙주 유기체에서 기능하는 발현 제어 서열에 작동적으로 연결된 본 명세서에 예시된 바와 같은 하나 이상의 경로-코딩 핵산을 포함하도록 구축될 수 있다. 제공되는 미생물 숙주 유기체에서 사용을 위해 적용가능한 발현 벡터는 예를 들어, 벡터를 포함한, 플라스미드, 파지 벡터, 바이러스 벡터, 에피솜 및 인공 염색체, 및 숙주 염색체로 안정한 통합을 위해 작동가능한 선택 서열 또는 마커를 포함한다. 추가로, 발현 벡터는 하나 이상의 선별 마커 유전자 및 적절한 발현 제어 서열을 포함할 수 있다. 선별 마커 유전자는 또한 예를 들어, 항생제 또는 독소에 대한 내성, 상보성 영양요구성 결핍을 제공하거나, 또는 배양 배지에 없는 결정적 영양분을 공급하는 것이 포함될 수 있다. 발현 제어 서열은 당분야에 충분히 공지된 항상성 및 유도성 프로모터, 전사 인핸서, 전사 종결자 등을 포함할 수 있다. 둘 이상의 외생성 코딩 핵산을 공-발현시키려고 할 때, 양쪽 핵산은 예를 들어 단일 발현 벡터 또는 별도 발현 벡터에 삽입될 수 있다. 단일 벡터 발현을 위해서, 코딩 핵산은 하나의 공통 발현 제어 서열에 작동적으로 연결될 수 있거나 또는 상이한 발현 제어 서열, 예컨대 하나의 유도성 프로모터 및 하나의 항상성 프로모터에 연결된다. 폴리뉴클레오티드가 작동적으로 연결되는 클로닝 부위 및 프로모터 둘 모두를 함유하는 벡터는 당분야에 충분히 공지되어 있다. 이러한 벡터는 생체내 또는 시험관내에서 RNA를 전사시킬 수 있고, Stratagene (La Jolla, CA) 및 Promega Biotech (Madison, WI) 같은 공급처로부터 상업적으로 입수가능하다. 발현 및/또는 시험관내 전사를 최적화하기 위해서, 여분의, 잠재적으로 부적절한 선택적 번역 개시 코돈 또는 전사 또는 번역 수준에서 발현을 간섭할 수 있거나 또는 감소시킬 수 있는 다른 서열을 제거시키기 위해 클론의 5' 및/또는 3' 비번역 부분을 제거, 첨가, 또는 변경시키는 것이 필요할 수 있다. 대안적으로, 공통 리보솜 결합 부위는 발현을 증강시키기 위해 출발 코돈의 바로 5'에 삽입될 수 있다.
본 명세서에 기술된 바람직한 화합물의 합성을 위한 경로에 관여되는 외생성 핵산 서열은 제한없이, 접합, 전기영동, 화학적 형질전환, 형질도입, 형질감염, 및 초음파 형질전환을 포함한 당분야에 충분히 공지된 기술을 사용해 숙주 세포로 안정하게 또는 일시적으로 도입될 수 있다. 이. 콜라이 또는 다른 원핵생물 세포에서 외생성 발현을 위해서, 진핵생물 핵산의 유전자 또는 cDNA 중 일부 핵산 서열은 바람직하면, 원핵생물 숙주 세포로 형질전환 전에 제거될 수 있는, 표적화 신호 예컨대 N-말단 미토콘드리아 또는 다른 표적화 신호를 코딩할 수 있다. 예를 들어, 미토콘드리아 리더 서열의 제거는 이. 콜라이에서 증가된 발현을 초래하였다 (Hoffmeister et al., J. Biol. Chem. 280:4329-4338 (2005)). 효모 또는 다른 진핵생물 세포에서 외생성 발현을 위해서, 유전자는 리더 서열의 첨가없이 시토졸에서 발현될 수 있거나, 또는 적합한 표적화 서열 예컨대 숙주 세포에 적합한 미토콘드리아 표적화 또는 분비 신호의 첨가를 통해서, 분비를 위해 표적화되거나, 또는 미토콘드리아 또는 다른 세포소기관으로 표적화될 수 있다. 표적화 서열을 제거 또는 포함시키기 위한 핵산 서열에 대한 적절한 변형이 바람직한 성질을 부여하도록 외생성 핵산 서열에 유입될 수 있다는 것을 이해한다. 더 나아가서, 유전자는 단백질의 최적 발현을 획득하기 위해 당분야에 충분히 공지된 기술을 사용해 코돈 최적화될 수 있다.
범위를 포함하여, 모든 수치 표시, 예를 들어, pH, 온도, 시간, 농도, 및 분자량은 0.1의 증분만큼 (+) 또는 (-)로 다양한 근사치이다. 항상 명확하게 명시하지 않지만, 모든 수치 표시는 용어 "약"이 선행된다는 것을 이해해야 한다. 본 명세서에서 사용되는, "약"은 10%를 더하거나 또는 뺀것을 의미할 것이다. 항상 분명하게 명시하지 않지만, 본 명세서에 기술된 시약은 단지 예시이고 이의 균등물은 당분야에 공지되어 있다는 것을 이해해야 한다.
"작동적으로 연결된"은 엘리먼트가 그들을 기능하게 허용하는 배열로 존재하는 병렬을 지칭한다.
용어 "배양하는"은 다양한 종류의 배지 (배양물) 상에서 또는 그 안에서 세포 또는 유기체의 시험관내 전파를 의미한다. 배양물 중에서 성장된 세포의 후손은 부모 세포와 (즉, 형태학적으로, 유전적으로, 또는 표현형적으로) 완전히 동일하지 않을 수 있다는 것을 이해한다.
"유전자"는 전사되고 번역된 후에 특정 폴리펩티드 또는 단백질을 코딩할 수 있는 적어도 하나의 오픈 리딩 프레임 (ORF)을 함유하는 폴리뉴클레오티드를 지칭한다. 본 명세서에 기술된 임의의 폴리뉴클레오티드 서열은 그들이 회합된 유전자의 더 큰 단편 또는 전체-길이 코딩 서열을 확인하는데 사용될 수 있다. 더 큰 단편 서열을 단리하는 방법은 당업자에게 공지되어 있다.
용어 "발현하다"는 유전자 생성물의 생성을 의미한다. 용어 과발현은 정상 또는 대조군 세포의 것을 초과하여, 예를 들어, 대조군 샘플 또는 야생형 세포에서 검출되는 발현 수준에 비해 0.5배, 1.0배, 1.5배, 또는 대안적으로, 2배, 또는 대안적으로, 적어도 2.5배, 또는 대안적으로, 적어도 3.0배, 또는 대안적으로, 적어도 3.5배, 또는 대안적으로, 적어도 4.0배, 또는 대안적으로, 적어도 5배, 또는 대안적으로 10배 더 높게, 유전자로부터 전사되는 mRNA 또는 유전자에 의해 코딩되는 단백질 생성물의 생성을 지칭한다.
본 명세서에서 사용되는, "상동성"은 기준 서열 및 적어도 제2 서열의 단편 간 서열 유사성을 지칭한다. 상동성은 바람직하게, 기준 서열을 단일 제2 서열 또는 서열의 단편과 또는 서열의 데이터베이스와 비교하기 위한 BLAST 도구를 사용하여, 당분야에 공지된 임의 방법으로 확인할 수 있다. 하기에 기술된 바와 같이, BLAST는 동일성 및 유사성 백분율을 기반으로 서열을 비교할 것이다.
둘 이상의 핵산s 또는 폴리펩티드 서열의 문맥에서, 용어 "동일한" 또는 "동일성" 백분율은 동일한 둘 이상의 서열 또는 하위서열을 지칭한다. 2개 서열은 2개 서열이 하기 서열 비교 알고리즘 중 하나를 사용하거나 또는 수동 정렬 및 육안 검사를 통해서 측정되는 지정된 영역, 또는 비교창 상에서 최적 상응도로 비교 및 정렬되었을 때, 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 백분율 (즉, 명시된 영역 상에서, 또는 명시되지 않은 경우, 전체 서열 상에서, 29% 동일성, 임의로 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100% 동일성)을 가지면, "실질적으로 동일"하다. 임의로, 동일성은 적어도 약 50 뉴클레오티드 (또는 10 아미노산) 길이인 영역, 또는 보다 바람직하게 100 내지 500 또는 1000 이상의 뉴클레오티드 (또는 20, 50, 200 이상의 아미노산) 길이인 영역 상에서 존재한다.
비교를 위한 서열의 정렬 방법은 당분야에 충분히 공지되어 있다. 예를 들어, 임의의 2개 서열 간 서열 동일성 백분율의 결정은 수학 알고리즘을 사용해 수행될 수 있다. 이러한 수학 알고리즘의 비제한적인 예는 [Myers and Miller, CABIOS 4:11 17 (1988)]의 알고리즘; [Smith et al., Adv. Appl. Math. 2:482 (1981)]의 국소 상동성 알고리즘; [Needleman and Wunsch, J. Mol. Biol. 48:443 453 (1970)]의 상동성 정렬 알고리즘; [Pearson and Lipman, Proc. Natl. Acad. Sci. 85:2444 2448 (1988)]의 유사성 검색 방법; [Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873 5877 (1993)]의 알고리즘이다.
서열 비교를 위해서, 전형적으로 하나의 서열은 시험 서열이 비교되는 기준 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열은 컴퓨터에 입력되고, 필요하면, 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 매개변수를 지정한다. 디폴트 프로그램 매개변수를 사용할 수 있거나, 또는 대안적인 매개변수를 지정할 수 있다. 다음으로 서열 비교 알고리즘은 프로그램 매개변수를 기반으로, 기준 서열에 대해 시험 서열의 서열 동일성 백분율을 계산한다. 동일성에 대해 2개 서열을 비교할 때, 서열이 연속적일 필요는 없지만, 임의 갭은 전체 동일성 백분율을 감소시키는 패널티와 함께 수반될 것이다. blastn 경우에, 디폴트 매개변수는 갭 오프닝 패널티=5 및 갭 확장 패널티=2이다. blastp 경우에, 디폴트 매개변수는 Gap 오프닝 패널티=11 및 Gap 확장 패널티=1이다.
본 명세서에서 사용되는, "비교창"은 2개 서열이 최적으로 정렬된 후에 서열을 동일한 수의 인접된 위치의 기준 서열과 비교할 수 있는, 제한없이, 20 내지 600, 일반적으로, 약 50 내지 약 200, 보다 일반적으로 약 100 내지 약 150을 포함한 인접한 위치의 수의 어느 하나의 절편에 대한 기준을 포함한다. 비교를 위한 서열의 정렬 방법은 당분야에 충분히 공지되어 있다. 비교를 위한 서열의 최적 정렬은 예를 들어, [Smith and Waterman (1981)]의 국소 상동성 알고리즘, [Needleman and Wunsch, J Mol Biol 48(3):443-453 (1970)]의 상동성 정렬 알고리즘, [Pearson and Lipman, Proc Natl Acad Sci USA 85(8):2444-2448 (1988)]의 유사성 검색 방법을 통해서, 이들 알고리즘 ([Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI]의 GAP, BESTFIT, FASTA, 및 TFASTA)의 컴퓨터 구현에 의해서, 또는 수동 정렬 및 육안 검사 [참조; 예를 들어, Brent et al., (2003) Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (Ringbou Ed)]를 통해서 수행될 수 있다.
서열 동일성 및 서열 유사성 백분율을 결정하는데 적합한 알고리즘의 2개 예는 BLAST 및 BLAST 2.0 알고리즘으로서, 각각 [Altschul et al., Nucleic Acids Res 25(17):3389-3402 (1997)] 및 [Altschul et al., J. Mol Biol 215(3)-403-410 (1990)]에 기술되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물정보 센터를 통해 공공으로 입수가능하다. 이러한 알고리즘은 데이터베이스 서열 중 동일 길이의 단어와 정렬했을 때 일부 양의 값의 한계치 점수와 일치하거나 또는 그를 만족하는, 질의 서열 중 짧은 단어 길이 W를 확인하여 고점수 서열쌍 (HSP)을 먼저 확인하는 단계를 포함한다. T는 이웃 단어 점수 한계치로서 지칭된다 (Altschul et al., 상동). 이들 초기 이웃 단어 히트는 그들을 함유하는 더 긴 HSP를 찾기 위한 검색을 개시하기 위한 씨드로서 작용된다. 단어 히트는 누적 정렬 점수가 증가되는 한 각 서열을 따라서 양쪽 방향으로 연장된다. 누적 점수는 뉴클레오티드 서열의 경우에, 매개변수 M (일치 잔기쌍에 대한 보상 점수; 항상 > 0) 및 N (불일치 잔기에 대한 패널티 점수; 항상 < 0)을 사용해 계산된다. 아미노산 서열 경우에, 채점 매트릭스는 누적 점수를 계산하는데 사용된다. 각 방향으로 단어 히트의 연장은 누적 정렬 점수가 이의 최대 획득값으로부터 X 분량만큼 감소되는 경우; 하나 이상의 음의 채점 잔기 정렬의 축적으로 인해, 누적 점수가 0 또는 그 이하로 가는 경우; 또는 양쪽 서열의 말단에 도달하는 경우에 중지된다. BLAST 알고리즘 매개변수 W, T, 및 X는 알고리즘의 감도 및 속도를 결정한다. BLASTN 프로그램 (뉴클레오티드 서열 경우)은 디폴트로서 11의 단어길이 (W), 10의 기대치 (E), M=5, N=-4, 및 양쪽 가닥의 비교를 사용한다. 아미노산 서열 경우, BLASTP 프로그램은 디폴트로서 3의 단어길이, 10의 기대치 (E), 및 50의 BLOSUM62 채점 매트릭스 (참조: Henikoff and Henikoff, Proc Natl Acad Sci USA 89(22):10915-10919 (1992)) 정렬 (B), 10의 기대치 (E), M=5, N=-4, 및 양쪽 가닥의 비교를 사용한다.
BLAST 알고리즘은 2개 서열 간 유사성의 통계 분석을 또한 수행한다 (참조: 예를 들어, Karlin and Altschul, Proc Natl Acad Sci USA 90(12):5873-5877 (1993)). BLAST 알고리즘을 통해 제공되는 유사성의 한 척도는 2개 뉴클레오티드 또는 아미노산 서열 간 일치가 우연하게 발생되는 확률의 표시를 제공하는, 최소 총합 확률 (P(N))이다. 예를 들어, 핵산은 기준 핵산에 대한 시험 핵산의 비교에서 최소 총합 확률이 약 0.2 미만, 보다 바람직하게 약 0.01 미만, 및 가장 바람직하게 약 0.001 미만이면 기준 서열과 유사한 것으로 간주된다.
상기 언급된 서열 동일성의 백분율 이외에, 2개 핵산 서열 또는 폴리펩티드가 실질적으로 동일하다는 다른 표시는 제1 핵산에 의해 코딩되는 폴리펩티드가 제2 핵산에 의해 코딩되는 폴리펩티드에 대한 항체와 면역학적으로 교차-반응한다는 것이다. 따라서, 폴리펩티드는 전형적으로, 예를 들어, 2개 펩티드가 보존성 치환만이 상이한 제2 폴리펩티드와 실질적으로 동일하다. 2개 핵산 서열이 실질적으로 동일하다는 다른 표시는 2개 분자 또는 그들 상보체가 엄격 조건 하에서 서로 혼성화한다는 것이다. 2개 핵산 서열이 실질적으로 동일하다는 또 다른 표시는 동일한 프라이머가 서열을 증폭시키는데 사용될 수 있다는 것이다.
어구 "기능적으로 동등한 단백질"은 엄격 조건 하에서 예시된 폴리뉴클레오티드에 혼성화하고 예를 들어 표준 또는 대조군 생물학적 활성과 비교하여 120% 이상, 또는 대안적으로 110% 이상, 또는 대안적으로 100% 이상, 또는 대안적으로, 90% 이상 또는 대안적으로 85% 이상 또는 대안적으로 80% 이상으로 생체내에서 유사하거나 또는 증강된 생물학적 활성을 나타내는 단백질 또는 폴리뉴클레오티드를 지칭한다. 본 개시의 범주 내에서 추가 구현예는 80% 초과, 또는 대안적으로, 85% 초과, 또는 대안적으로, 90% 초과, 또는 대안적으로, 95% 초과, 또는 대안적으로 97% 초과, 또는 대안적으로, 98% 또는 99% 초과의 서열 상동성을 갖는 것으로 확인된다. 상동성 백분율은 적절한 조건 하에서 실행되는 BLAST 같은 서열 비교 프로그램을 통해서 결정될 수 있다. 일부 구현예에서, 프로그램은 디폴트 매개변수 하에서 실행된다. 일부 구현예에서, 일정 효소 또는 단백질에 대한 기준은 이의 기능적으로 동등한 효소 또는 단백질을 포함한다.
세포의 개체군은 표현형 및/또는 유전자형이 동일 (클론)하거나 또는 동일하지 않은 하나 초과의 세포의 컬렉션을 의도한다. 세포의 실질적으로 균질한 개체군은 사전-선택된 마커를 통해 측정되는 적어도 70%, 또는 대안적으로 적어도 75%, 또는 대안적으로 적어도 80%, 또는 대안적으로 적어도 85%, 또는 대안적으로 적어도 90%, 또는 대안적으로 적어도 95%, 또는 대안적으로 적어도 98% 동일한 표현형을 갖는 개체군이다.
효소가 효소 클래스 (EC)에 대해서 언급될 때, 효소 클래스는 효소가 분류되거나, 또는 국제 생화학 및 분자 생물학 연합의 명명 위원회가 제공하는 효소 명명법을 기반으로 분류될 수 있는 클래스이다. 특별한 클래스로 아직 분류되지 않았지만 그와 같이 분류될 수 있는 다른 적합한 효소가 또한 포함된다.
비-천연 발생 미생물 유기체
본 명세서에서 제공되는 비-천연 발생 미생물 유기체는 화합물 예컨대 2-케토 펜탄산, 2-케토 헥산산, 6-히드록시-2-케토-헥산산, 1,5-펜탄디올, 아디프산, 1, 6-헥산디올, 또는 6-히드록시 헥산산을 생성시키기에 충분한 양으로 본 명세서에 기술된 생합성 경로에서 사용되는 효소 또는 단백질을 코딩하는 적어도 하나의 핵산을 외생적으로 발현시키기 위해 본 명세서에서 예시된 바와 같은 당분야에 충분히 공지된 방법을 사용해 구축된다.
본 명세서에 기술된 바람직한 생성물을 생성할 수 있는 미생물 숙주의 성공적인 조작은 경로에서 다양한 단계를 촉매하기 위한 충분한 활성 및 특이성을 갖는 효소의 적절한 세트, 예를 들어 본 명세서의 실시예 및 문헌에 기술된 것들을 확인하는 단계를 포함한다. 외생성 DNA 서열로부터의 개별 효소 또는 단백질 활성은 또한 당분야에 충분히 공지된 방법을 사용해 어세이될 수 있다. 또한, 이들 효소는 바람직한 기질 특이성의 획득, 거울상 순수 또는 라세믹 생성물을 합성하도록 입체선택성의 제어, 반감기, 열안정성, 억제제/생성물 내성을 개선시키고 선택된 바람직한 미생물 생성 숙주에서 효소 발현 및 가용성의 개선을 통해서 거친 산업 과정 조건을 견디도록 효소의 안정화를 위해서, 현대 단백질 조작 접근법 (Protein Engineering Handbook; Lutz S., & Bornscheuer U.T. Wiley-VCH Verlag GmbH & Co. KGaA: 2008; Vol. 1 & 2) 예컨대 유도 진화, 합리적 돌연변이유발법, 컴퓨터 디자인 (Zanghellini, A et al, 2008) 또는 이의 조합을 사용해 조작될 수 있다. 경로의 각 단계를 촉매할 수 있는 바람직한 효소가 특징규명되면, 이들 효소를 코딩하는 유전자는 선택 미생물에 클로닝될 것이고, 발효배양 조건은 최적화될 것이고 생성물 형성은 발효배양 이후에 모니터링될 것이다. 효소가 확인된 후에, 하나 이상의 효소에 해당하는 유전자가 미생물 숙주로 클로닝된다. 일부 구현예에서, 본 명세서에 기술된 특정 경로의 각 효소를 코딩하는 유전자는 미생물 숙주에 클로닝된다.
이러한 목적에 적합한 미생물, 및 벡터로 재조합/외생성 핵산/단백질을 도입시키는 방법은 당분야에 충분히 공지되어 있다. 예를 들어, 다양한 기술이 [Current Protocols in Molecular Biology, Ausubel et al., eds. (Wiley & Sons, New York, 1988, and quarterly updates)]에 예시되어 있다. 미생물 숙주 세포로 발현 벡터를 전달하기 위한 방법은 당분야에 충분히 공지되어 있다. 특별한 방법 및 벡터는 바람직한 미생물 숙주의 종에 의존하여 상이할 수 있다. 예를 들어, 박테리아 숙주 세포는 열충격, 칼슘 클로라이드 처리, 전기영동, 리포솜, 또는 파지 감염을 통해 형질전환될 수 있다. 효모 숙주 세포는 리튬 아세테이트 처리 (캐리어 DNA 및 PEG 처리를 더 포함할 수 있음) 또는 전기 영동을 통해서 형질전환될 수 있다. 이들 방법은 예시적인 목적을 위해 포함되고 제한적이거나 또는 포괄적인 것을 의도하는 방식이 아니다. 당분야에 충분히 공지된 수단을 통한 통상의 실험을 사용하여 특정 발현 벡터 또는 형질전환 방법이 소정 미생물 숙주에 적합한지 여부를 결정할 수 있다. 더 나아가서, 많은 상이한 미생물 숙주에 적합한 시약 및 벡터가 상업적으로 입수가능하고 당분야에 충분히 공지되어 있다.
효소의 구축, 발현 또는 과발현 및 비-천연 발생 미생물 숙주에서 발현 수준의 시험을 위한 방법은 당분야에 충분히 공지되어 있다 (Protein Expression Technologies: Current Status and Future Trends, Baneyx F. eds. Horizon Bioscience, 2004, Norfolk, UK; and Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); and Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)).
미생물의 발효배양을 수행하는 방법은 당분야에 충분히 공지되어 있다. 예를 들어, 다양한 기술은 [Biochemical Engineering, Clark et al., eds. (CRC press, 1997, 2nd edition)]에 예시되어 있다. 발효배양을 위한 특별한 방법은 바람직한 미생물 숙주의 종에 의존하여 상이할 수 있다. 전형적으로, 미생물은 회분식 또는 연속 발효배양 방식으로 탄소원과 함께 적절한 배지에서 성장된다. 이화산물 억제 또는 효소 활성을 조절하는 것으로 공지된 작용제의 사용을 사용하여 아디프산 또는 글루타르산 생성을 증강시킬 수 있다. 발효배양에 적합한 pH는 3-10이다. 발효배양은 미생물의 요건을 기반으로 호기성, 혐기성, 또는 무산소 조건 하에서 수행될 수 있다. 발효배양은 회분식, 유가-배양식, 또는 연속식 방식으로 수행될 수 있다. 발효배양은 또한 바람직하면 2개 시기로 수행될 수 있다. 예를 들어, 제1 시기는 고성장 및 그러므로 고생산성을 허용하도록 호기성일 수 있고, 이후에 높은 카프로락톤 수율의 혐기성 시기가 후속될 수 있다.
탄소원은 예를 들어, 탄소 공급원을 비-천연 발생 미생물에게 공급할 수 있는 임의의 탄화수소 공급원을 포함할 수 있다. 이러한 공급원은 예를 들어, 당 예컨대 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스 및 전분을 포함한다. 탄화수소의 다른 공급원은 예를 들어 재생가능한 공급원료 및 생물량을 포함한다. 본 개시의 방법에서 공급원료로서 사용할 수 있는 생물량의 예시적인 유형은 셀루로식 생물량, 헤미셀룰로식 생물량 및 리그닌 공급원로 또는 공급원료의 일부분을 포함한다. 이러한 생물량 공급원료는 예를 들어 탄소원으로서 유용한 탄수화물 기질, 예컨대 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스 및 전분을 함유한다. 본 명세서에 제공된 교시 및 지침을 고려하면, 당업자는 또한 상기 예시된 것 이외의 재생가능한 공급원료 및 생물량이 바람직한 화합물의 생성을 위한 본 개시의 미생물 유기체를 배양하는데 사용될 수 있다는 것을 이해할 것이다.
본 명세서에 기술된 반응은 모니터링될 수 있고 발효배양 배지 중 출발 물질, 생성물 또는 중간체는 고압 액상 크로마토그래피 (HPLC) 분석, GC-MS (Gas Chromatography-Mass Spectroscopy) 및 LC-MS (Liquid Chromatography-Mass Spectroscopy) 또는 당분야에 충분히 공지된 통상의 절차를 사용한 다른 적합한 분석 방법을 사용해 배지를 분석하여 확인할 수 있다.
본 명세서에 기술된 임의의 비-천연 발생 미생물 유기체는 본 개시의 생성물을 생성 및/또는 분비하도록 배양될 수 있다.
본 명세서에 기술된 방법으로 제조된 화합물은 생합성 또는 발효배양으로 제조된 유기 화합물의 단리를 위해 당분야에 일반적으로 공지된 방법으로 단리될 수 있다. 예를 들어, 화합물은 결정화, 염 형성, 막증발, 반응성 추출, 추출 (액상-액상 및 2층), 흡착, 이온 교환, 투석, 증류, 가스 스트리핑, 및 막 기반 분류 (Roffler et al., Trends Biotechnolgy.2: 129-136 (1984))를 통해서 용액으로부터 단리될 수 있다. 1,5-펜탄디올은 증류, 추출 (액상-액상 및 2층), 막증발, 및 막 기반 분리 (Roffler et al., Trends Biotechnolgy.2: 129-136 (1984))를 사용해 용액으로부터 단리될 수 있다.
본 명세서에 기술된 바와 같이, 바람직한 생성물의 생합성을 획득하기 위한 하나의 예시적인 성장 조건은 혐기성 배양 또는 발효배양 조건을 포함한다. 일정 구현예에서, 본 개시의 비-천연 발생 미생물 유기체는 혐기성 또는 실질적으로 혐기성 조건 하에서 유지될 수 있거나, 배양될 수 있거나 또는 발효배양될 수 있다. 간략하게, 혐기성 조건은 산소가 없는 환경을 의미한다. 실질적으로 혐기성 조건은 예를 들어, 배지 중 용존 산소 농도가 포화의 0 내지 105로 남아있도록 하는 배양, 회분식 발효배양 또는 연속 발효배양을 포함한다. 실질적으로 혐기성 조건은 또한 1% 미만의 산소 대기를 유지하는 밀봉된 챔버 내부에서 액상 배지 또는 고체 한천 상에서 성장하거나 또는 휴지된 세포를 포함한다. 산소의 백분율은 예를 들어, N2/CO2 혼합물 또는 다른 적합한 비-산소 가스 또는 가스들로 배양물을 살포하여 유지될 수 있다.
본 명세서에 기술된 배양 조건은 생성물을 제조하기 위해 규모를 확장할 수 있고 연속적으로 성장될 수 있다. 예시적인 성장 절차는 예를 들어 유가-배양화학식 발효배양 및 회분식 분리; 유가-배양식 발효배양 및 연속 분리, 또는 연속 발효배양 및 연속 분리를 포함한다. 모든 이들 과정은 당분야에 충분히 공지되어 있다. 발효배양 절차는 상업적 분량으로 생합성 생성을 위해 특히 유용하다.
용어 "충분량으로 발현된 경로 효소"는 효소가 바람직한 경로 생성물의 검출을 허용하기에 충분한 양으로 발현된다는 것을 암시한다.
다른 양태에서, 본 명세서는 알돌라제 히드라타제 효소를 코딩하는 제1 외생성 핵산을 포함하는 재조합 미생물 유기체를 제공하고, 재조합 미생물 유기체는 변형되지 않은 동일 미생물 유기체 또는 야생형과 비교하여 퀴논 옥시도리덕타제의 증가된 양을 발현하도록 더욱 변형되고, 임의로 미생물 유기체는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 클로스트리듐 (clostridium) 종, 또는 이. 콜라이 (E. coli)이다.
일부 구현예에서, 유기체는 퀴논 옥시도리덕타제를 코딩하는 제2 외생성 핵산을 포함한다. 일부 구현예에서, 제1 외생성 핵산 및/또는 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 제1 외생성 핵산 또는 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 제1 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다. 일부 구현예에서, 조절 엘리먼트는 프로모터 또는 인핸서로부터 선택된다. 일부 구현예에서, 조절 엘리먼트는 프로모터이다. 일부 구현예에서, 조절 엘리먼트는 인핸서이다.
일부 구현예에서, 알돌라제 히드라타제 효소는 EC 번호 4.1.2.45, EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는다. 일부 구현예에서, 알돌라제 히드라타제 효소는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1, 또는 알돌-탈수 생성물의 형성을 촉진하는 이의 일부분 (예를 들어, 도메인, 아미노산 잔기의 세트 (연속될 수 있거나 또는 이격될 수 있음) 등) 하에 확인된 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 표 1, 5, 6, 7, 및 8로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 표 1, 5, 6, 7, 및 8로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각 벡터에 함유된다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각 동일 벡터에 함유된다. 일부 구현예에서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각 그들 자신의 별도 벡터에 함유된다. 일부 구현예에서, 벡터는 플라스미드이다. 일부 구현예에서, 벡터는 바이러스 벡터이다.
일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인된 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인된 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 재조합 미생물 유기체는 하기 화학식의 2-케토 카르복실산을 생성시킬 수 있다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
일부 구현예에서, 재조합 미생물 유기체는 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 생성시킬 수 있다.
일부 구현예에서, 재조합 미생물 유기체는 탄소원으로부터 피루베이트의 생성을 개선시키도록 유전자 변형된다. 일부 구현예에서, 탄소원은 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택된다.
다른 양태에서, 본 명세서는 본 명세서에 개시된 재조합 미생물 유기체의 개체군을 제공한다. 일부 구현예에서, 개체군은 실질적으로 균질하다. 일부 구현예에서, 실질적으로 균질한은 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 균질한 것을 의미한다.
다른 양태에서, 본 명세서는 적합한 조건 하에서 본 명세서에 개시된 개체군을 배양하는 단계를 포함하는, 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 제조하는 방법을 제공한다. 일부 구현예에서, 방법은 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 배양물 또는 미생물 유기체로부터 단리시키는 단계를 더 포함한다.
일정 구현예의 상세한 설명
특히, 본 개시는 소정 폴리펩티드, 예를 들어, 히드라타제-알돌라제 폴리펩티드이거나 또는 그를 포함하는 다양한 알돌-탈수 생성물 생합성 폴리펩티드가 다양한 화합물을 효과적으로 생성시키는데 이용될 수 있다는 인식을 포괄한다. 일부 구현예에서, 본 개시는 다양한 알데히드, 예를 들어, 이러한 폴리펩티드의 천연 및/또는 기지 알데히드 기질과 구조적으로 상이한, 본 명세서에 기술된 다양한 지방족 알데히드가 본 명세서에 기술된 알돌-탈수 생성물 생합성 폴리펩티드를 사용하여 많은 생성물의 효과적 제조를 위해 이용될 수 있다는 것을 입증한다. 특히, 본 개시는 다양한 알돌-탈수 생성물의 생성이 단일 알돌-탈수 생성물 생합성 폴리펩티드 (예를 들어, 본 명세서에 기술된 바와 같은 다양한 히드라타제-알돌라제 폴리펩티드)에 의해 촉매될 수 있다는 것을 입증한다.
일부 구현예에서, 본 개시는 피루베이트 및 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
일부 구현예에서, 알데히드는 지방족 알데히드이다. 일부 구현예에서, 알데히드의 -CHO 기는 예를 들어, 이중 결합, 삼중 결합, 또는 방향족 기에 접합되지 않는다.
일부 구현예에서, 본 개시는 피루베이트 및 지방족 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제 폴리펩티드, 예를 들어, 본 명세서에 예시된 것들이거나 또는 그를 포함한다. 일부 구현예에서, 제공된 방법은 피루베이트 및 지방족 알데히드를 히드라타제-알돌라제와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함한다.
일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 알돌라제 폴리펩티드를 포함한다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제 폴리펩티드를 포함한다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제 폴리펩티드를 포함한다. 일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제 폴리펩티드이다. 일부 구현예에서, 히드라타제-알돌라제 폴리펩티드는 히드라타제-알돌라제, 예를 들어, 본 명세서에 기술된 바와 같이, 예를 들어, EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34, 또는 EC 4.1.1.4를 갖는 효소이거나, 또는 그를 포함하거나, 또는 표 1 및 5-8로부터 선택된다.
일부 구현예에서, 알돌-탈수 생성물 생합성 폴리펩티드는 유기체, 예를 들어, 미생물 내에 있다. 일부 구현예에서, 유기체는 조작된 알돌-탈수 생성물 생합성 폴리펩티드를 발현한다. 일부 구현예에서, 유기체는 알돌-탈수 생성물 생합성 폴리펩티드의 증가된 수준 및/또는 활성을 발현한다. 일부 구현예에서, 유기체는 알돌-탈수 생성물을 생성시키기 위한 증가된 속도 및/또는 수율을 제공한다. 일부 구현예에서, 유기체는 알돌-탈수 생성물을 생성시키기 위한 증가된 기질 이용성을 제공한다.
일부 구현예에서, 피루베이트 및 지방족 알데히드의 알돌-탈수 생성물로의 전환은 알돌-탈수 생성물 생합성 폴리펩티드에 의해 촉매된다.
일부 구현예에서, 알돌-탈수 생성물은 대체 경로를 통해서 제공될 수 있다. 일부 구현예에서, 알돌-탈수 생성물은 알돌 생성물로부터 생성된다.
일부 구현예에서, 본 개시는 피루베이트 및 알데히드를 알돌 생성물 생합성 폴리펩티드와 접촉시켜서 알돌 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
일부 구현예에서, 알데히드는 지방족 알데히드이다. 일부 구현예에서, 알데히드의 -CHO 기는 이중 결합, 삼중 결합 또는 방향족 기에 접합되지 않는다.
일부 구현예에서, 본 개시는 피루베이트 및 지방족 알데히드를 알돌 생성물 생합성 폴리펩티드와 접촉시켜서 알돌 생성물을 생성시키는 단계를 포함하는 방법을 제공하고, 지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착된 히드록실 기를 포함하는 화합물이다.
본 개시의 다양한 방법은 생합성 폴리펩티드의 이용성을 포함한다. 일부 구현예에서, 특정 생성물, 예를 들어, 알돌 생성물 생합성 폴리펩티드, 환원 생성물 생합성 폴리펩티드 등과 함께 사용될 때, 생합성 폴리펩티드는 특정 생성물의 합성에 관여하는 폴리펩티드를 의미한다. 일부 구현예에서, 특정 생성물과 함께 사용될 때 생합성 폴리펩티드는 특정 생성물의 형성을 촉매하는 효소이거나 또는 그를 포함한다. 일부 구현예에서, 생합성 폴리펩티드는 자연계, 예를 들어, 미생물 (예를 들어, 자연계에서 발견되는 특정 생성물에 대한 기준 생합성 폴리펩티드)에서 발견되는 아미노산 서열을 갖는다. 대안적으로 또는 추가로, 일부 구현예에서, 생합성 폴리펩티드는 적절한 기준 생합성 폴리펩티드 (예를 들어, 자연계에서 발견되고/되거나 본 명세서 (예를 들어, 하나 이상의 관련 표)에 표시) 또는 이의 일부분 (예를 들어, 관련 반응을 촉진하는 일부분 (예를 들어, 도메인 (예를 들어, 관련 촉매 도메인) 및/또는 (연속될 수 있거나 또는 이격될 수 있는) 아미노산 잔기의 세트)과 특징적 서열 엘리먼트 및/또는 전체 동일성 백분율을 공유한다.
일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 알돌라제 폴리펩티드이거나 또는 그를 포함한다. 본 개시를 읽는 당업자는 다양한 알돌라제 폴리펩티드가 본 개시에 따라서 이용될 수 있다는 것을 이해한다. 일부 구현예에서, 알돌라제 폴리펩티드는 US20170044551에 기술된 알돌라제이거나 또는 그를 포함하고, 이의 알돌라제는 참조로 본 명세서에 편입된다.
일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알돌라제-히드라타제이거나 또는 그를 포함한다.
일부 구현예에서, 알돌 생성물 생합성 폴리펩티드는 유기체 예컨대 미생물 중에 있다. 일부 구현예에서, 유기체는 조작되거나 또는 외생성인 알돌 생성물 생합성 폴리펩티드를 종종 더 높은 단백질 수준 및/또는 활성 수준으로 발현하도록 조작된다. 일부 구현예에서, 피루베이트 및 지방족 알데히드의 알돌 생성물로의 전환은 알돌 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 방법은 배양물, 예를 들어, 박테리아 배양물에서 수행된다. 다른 생합성 폴리펩티드에 대한 것처럼, 알돌 생성물 생합성 폴리펩티드는 유기체 예컨대 박테리아일 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 알돌 생성물은 효소를 통해 촉매에 의해서, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서 알돌-탈수 생성물로 전환된다. 일부 구현예에서, 전환은 알돌 생성물을 탈수 생성물 생합성 폴리펩티드를 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함한다. 일부 구현예에서, 탈수 생성물 생합성 폴리펩티드는 히드라타제이거나 또는 그를 포함한다. 일부 구현예에서, 탈수 생성물 생합성 폴리펩티드는 데히드라타제이거나 또는 그를 포함한다. 일부 구현예에서, 히드라타제 또는 데히드라타제는 US20170044551에 기술되어 있고, 이의 히드라타제 및 데히드라타제는 참조로 본 명세서에 편입된다. 다른 생합성 폴리펩티드에 대한 것처럼, 탈수 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
당업자가 이해하는 바와 같이, 알돌-탈수 생성물은 광범위한 생성물, 예컨대 중합체, 수지, 코팅 생성물 등을 제조하는데 이용될 수 있는, 다양한 생성물, 예를 들어, 1,5-펜탄디올, 1,6-헥산디올, 6HH, 아디프산 등을 제조하는데 이용될 수 있다. 일부 구현예에서, 알돌-탈수 생성물의 이용성은 하나 이상의 화학적 전환을 포함하고, 이의 각각은 임의로 유기체 중에서, 폴리펩티드 (예를 들어, 본 명세서에 기술된 효소)에 의해 독립적으로 촉매될 수 있거나, 또는 효소 이용없이 전통적인 화학적 과정을 통해서 수행될 수 있다. 당업자가 이해하는 바와 같이, 하나 이상 또는 전체 단계는 하나 이상의 유기체에서 수행될 수 있고, 이들 각각은 독립적으로 하나 이상의 유형의 유기체 (이들 각각은 독립적으로 그 자체 내에서 또는 배양물 (예를 들어, 공급 화합물, 다른 유기체가 생성한 화합물 등)로부터 생성되는 기질(들)을 사용해 하나 이상의 반응을 수행할 수 있음)를 포함하는 하나 이상의 배양물, 및/또는 유기체의 외부로부터 또는 그 자체 내에서 생성되는 기질(들)을 사용해 하나 이상의 반응을 수행할 수 있다. 일부 구현예에서, 하나 이상 또는 모든 생합성 폴리펩티드는 독립적으로 하나의 유기체, 예를 들어 임의 조작된 박테리아 중에 있다. 일부 구현예에서, 생성물을 생성시키기 위한 생합성 폴리펩티드의 세트의 하나 이상은 하나의 유기체, 예를 들어 임의로 조작된 박테리아에서 발현되고, 세트 중 다른 생합성 폴리펩티드 중 하나 이상은 하나 이상의 다른 유기체, 예를 들어 임의 조작된 박테리아에서 발현된다. 일부 구현예에서, 유기체, 예를 들어, 박테리아는 생합성 폴리펩티드의 하나 이상 또는 전부를 코딩하는 하나 이상의 외생성 핵산을 함유하도록 조작된다. 일부 구현예에서, 제조 방법은 각각 독립적으로 하나 이상 또는 전부를 포함하고, 함께 모든, 필요한 생합성 폴리펩티드를 포함하는, 하나 이상의 박테리아를 포함하는 단일 배양물에서 수행되는 다수 단계의 반응을 포함한다. 일부 구현예에서, 생성물의 제조는 각각 독립적으로 하나 이상 또는 전부를 포함하고, 함께 모든 필요한 생합성 폴리펩티드를 포함하는, 하나 이상의 박테리아를 각각 독립적으로 포함하는 둘 이상의 배양물에서 수행되는 다수 단계의 반응을 포함한다.
예를 들어, 일부 구현예에서, 알돌-탈수 생성물 중 이중 결합은 단일 결합으로 전환된다.
일부 구현예에서, 본 개시는 알켄을 알켄 환원 생성물 생합성 폴리펩티드와 접촉시켜서 알켄 환원 생성물을 생성시키는 단계를 포함하는 방법을 제공하고,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고,
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어서 알켄 환원 생성물을 제공한다.
일부 구현예에서, 알켄은 알돌-탈수 생성물이다.
일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 알돌-탈수 생성물, 예를 들어, 본 명세서에 기술된 바와 같은, 2-옥소-3-에노산의 환원을 촉매하는 효소이거나 또는 그를 포함한다. 일부 구현예에서, 이러한 효소는 본 명세서에 기술되니 바와 같은, 퀴논 옥시도리덕타제이다. 일부 구현예에서, 이러한 효소는 EC 1.6.5에 속한다. 일부 구현예에서, 이러한 효소는 EC 1.6.5.5에 속한다. 일부 구현예에서, 이러한 효소는 표 9로부터 선택된다.
일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 유기체, 예를 들어, 미생물 내에 존재한다. 일부 구현예에서, 유기체는 조작된 알켄 환원 생성물 생합성 폴리펩티드를 발현한다. 일부 구현예에서, 유기체는 알켄 환원 생성물 생합성 폴리펩티드의 증가된 수준 및/또는 활성을 발현한다. 일부 구현예에서, 유기체는 알켄 환원 생성물을 생성시키기 위한 증가된 속도 및/또는 수율을 제공한다. 일부 구현예에서, 유기체는 알켄 환원 생성물을 생성시키기 위해 증가된 기질 이용성을 제공한다.
일부 구현예에서, 알켄 환원 생성물 생합성 폴리펩티드는 조작없이 내생적으로 유기체에 의해 코딩 및/또는 발현되는 효소이거나 또는 그를 포함한다.
본 개시를 읽은 당업자는 다양한 알데히드는 본 개시에 따라서 이용될 수 있다는 것을 이해한다. 일부 구현예에서, 알데히드는 히드라타제-알돌라제이거나 또는 그를 포함하는 생합성 폴리펩티드, 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드의 천연 또는 기지 기질이다. 일부 구현예에서, 알데히드는 천연 또는 기지 기질이 아니다. 예를 들어, 특히, 본 개시는 지방족 알데히드는 그의 천연 또는 기지 기질이 방향족이거나 또는 접합된 알데히드인 히드라타제-알돌라제를 사용한 생성물 제조에 이용될 수 있다는 것을 입증한다.
일부 구현예에서, 알데히드는 지방족 알데히드이다. 일부 구현예에서, 알데히드는 하나 또는 2개 알파-수소를 갖는다. 일부 구현예에서, 알데히드는 하기 화학식 A-1의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-C(O)H,
A-1
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, 알돌 생성물은 하기 화학식 P-1 또는 이의 염을 갖는다:
Ra-L2-L1-CH(OH)-CH2-C(O)-C(O)OH,
P-1
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, 알돌-탈수 생성물은 하기 화학식 P-2의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH=CH-C(O)-C(O)OH,
P-2
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C- , -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들 개재 원자와 함께 개재 원자 이외에, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, 화학식 P-2의 -CH=CH- 는 E 입체배열이다. 일부 구현예에서, 화학식 P-2의 -CH=CH- 는 Z 입체배열이다.
일부 구현예에서, 알켄 환원 생성물은 하기 화학식 P-3의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-C(O)-C(O)OH,
P-3
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 여기서 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
일부 구현예에서, Ra 는 R"이다. 일부 구현예에서, Ra 는 -OR"이다.
일부 구현예에서, R"은 R'이다. 일부 구현예에서, R"은 --C(O)R'이다. 일부 구현예에서, R"은 --CO2R'이다. 일부 구현예에서, R"은 -SO2R'이다.
일부 구현예에서, R'은 수소이다. 일부 구현예에서, R'은 수소가 아니다.
일부 구현예에서, Ra 는 R'이다. 일부 구현예에서, Ra 는 -OR'이다. 일부 구현예에서, Ra 는 -H이다. 일부 구현예에서, Ra 는 -OH이다.
일부 구현예에서, L1 은 공유 결합이다. 일부 구현예에서, L1 은 공유 결합이 아니다.
일부 구현예에서, L1 은 임의 치환된 C1-6 알킬렌이다. 일부 구현예에서, L1 은 임의 치환된 선형 C1-6 알킬렌이다. 일부 구현예에서, L1 은 임의 치환된 -CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L1 은 임의 치환된 -CH2CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 미치환된다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 단일-치환된다. 일부 구현예에서, L1 은 치환된다. 일부 구현예에서, L1 은 미치환된다. 일부 구현예에서, L1 은 -CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L1 은 -CH2CH2CH2CH2CH2CH2- 이다.
일부 구현예에서, L2 는 공유 결합이다. 일부 구현예에서, L2 는 공유 결합이 아니다.
일부 구현예에서, L2 는 임의 치환된 C1-6 알킬렌이다. 일부 구현예에서, L2 는 임의 치환된 선형 C1-6 알킬렌이다. 일부 구현예에서, L2 는 임의 치환된 -CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L2 는 임의 치환된 -CH2CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 미치환된다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 단일-치환된다. 일부 구현예에서, L2 는 치환된다. 일부 구현예에서, L2 는 미치환된다. 일부 구현예에서, L2 는 -CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L2 는 -CH2CH2CH2CH2CH2CH2- 이다.
일부 구현예에서, L1 및 L2 중 적어도 하나는 공유 결합이 아니다.
일부 구현예에서, 알데히드는 CH3CHO 이다. 일부 구현예에서, 알데히드는 CH3CH2CHO 이다. 일부 구현예에서, 알데히드는 CH3CH2CH2CHO 이다. 일부 구현예에서, 알데히드는 CH2OHCHO 이다. 일부 구현예에서, 알데히드는 CH2OHCH2CHO 이다. 일부 구현예에서, 알데히드는 CH2OHCH2CH2CHO 이다.
일부 구현예에서, 알돌 생성물은 CH3CH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH3CH2CH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH3CH2CH2CH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH2OHCH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH2OHCH2CH(OH)CH2C(O)COOH 이다. 일부 구현예에서, 알돌 생성물은 CH2OHCH2CH2CH(OH)CH2C(O)COOH 이다.
일부 구현예에서, 알돌-탈수 생성물은 CH3CH=CHC(O)COOH 이다. 일부 구현예에서, 알돌-탈수 생성물은 CH3CH2CH=CHC(O)COOH 이다. 일부 구현예에서, 알돌-탈수 생성물은 CH3CH2CH2CH=CHC(O)COOH 이다. 일부 구현예에서, 알돌-탈수 생성물은 CH2OHCH=CHC(O)COOH 이다. 일부 구현예에서, 알돌-탈수 생성물은 CH2OHCH2CH=CHC(O)COOH. 일부 구현예에서, 알돌-탈수 생성물은 CH2OH CH2CH2CH=CHC(O)COOH.
일부 구현예에서, 알켄 환원 생성물은 CH3CH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH3CH2CH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH3CH2CH2CH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH2OHCH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH2OHCH2CH2CH2C(O)COOH 이다. 일부 구현예에서, 알켄 환원 생성물은 CH2OHCH2CH2CH2CH2C(O)COOH.
일부 구현예에서, 알켄 환원 생성물은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 카르보닐 환원 생성물로 전환된다. 일부 구현예에서, 알켄 환원 생성물은 카르보닐 기를 포함하고, 카르보닐 기는 -CH(OH)- 로 전환된다. 일부 구현예에서, 방법은 알켄 환원 생성물을 카르보닐 환원 생성물 생합성 폴리펩티드와 접촉시켜서 카르보닐 환원 생성물을 생성시키는 단계를 포함하고,
알켄 환원 생성물은 카르보닐 기를 포함하고;
알켄 환원 생성물의 카르보닐 기는 -CH(OH)- 로 전환된다.
일부 구현예에서, 카르보닐 환원 생성물 생합성 폴리펩티드는 리덕타제이거나 또는 그를 포함한다. 일부 구현예에서, 카르보닐 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 케토 리덕타제이거나 또는 그를 포함한다. 일부 구현예에서, 카르보닐 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 2-케토 산-2-리덕타제이거나 또는 그를 포함한다. 일부 구현예에서, 이러한 효소는 본 명세서에 기술된 바와 같은 6-히드록시-2-옥소헥사노에이트-2-리덕타제이다. 일부 구현예에서, 이러한 효소는 US20170044551에 기술되어 있고, 이의 효소는 참조로 본 명세서에 편입된다.
일부 구현예에서, 알켄 환원 생성물의 카르보닐 환원 생성물로의 전환은 카르보닐 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 카르보닐 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 잇고, 그들 생성물은 증가된 비율 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 카르보닐 환원 생성물은 하기 화학식 P-4의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)OH,
P-4
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 카르보닐 환원 생성물은 CH3CH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH3CH2CH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH3CH2CH2CH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH2OHCH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH2OHCH2CH2CH2CH(OH)COOH 이다. 일부 구현예에서, 카르보닐 환원 생성물은 CH2OHCH2CH2CH2CH2CH(OH)COOH 이다.
일부 구현예에서, 카르보닐 환원 생성물은 효소에 의해 촉매되거나, 생합성을 통하거나, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, CoA 전달 생성물로 전환된다. 일부 구현예에서, CoA 전달 생성물은 하기 화학식 P-5의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)-S-CoA,
P-5
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 CoA (CoA = 조효소 A) 전달 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, CoA 전달 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 CoA 트랜스퍼라제, 예를 들어, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제이거나 또는 그를 포함한다. 일부 구현예에서, CoA 트랜스퍼라제는 US20170044551에 기술된 것이고, 이의 CoA 트랜스퍼라제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 CoA 전달 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, CoA 전달 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2CH(OH)C(O)S-CoA 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2CH2CH(OH)C(O)S-COA 이다.
일부 구현예에서, CoA 전달 생성물은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 탈수 생성물로 전환된다. 일부 구현예에서, 탈수 생성물은 하기 화학식 P-6의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH=CH-C(O)-S-CoA
P-6
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 탈수 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 탈수 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 데히드라타제이거나 또는 그를 포함한다. 일부 구현예에서, 데히드라타제는 본 명세서에 기술된 바와 같은 2,6-디히드록시-헥사노일-CoA 2-데히드라타제이거나 또는 그를 포함한다. 일부 구현예에서, 데히드라타제는 US20170044551에 기술되어 있고, 이의 데히드라타제는 참조로 편입된다.
일부 구현예에서, 이러한 전환은 탈수 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 탈수 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 탈수 생성물은 CH3CH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH3CH2CH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH3CH2CH2CH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH2OHCH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH2OHCH2CH2CH=CHC(O)S-CoA 이다. 일부 구현예에서, 탈수 생성물은 CH2OHCH2CH2CH2CH=CHC(O)S-COA 이다.
일부 구현예에서, 탈수 생성물, 예를 들어, 화학식 P-6의 화합물 또는 이의 염은 환원 생성물, 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서 환원 생성물로 전환된다. 일부 구현예에서, 환원 생성물은 하기 화학식 P-7의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-S-CoA
P-7
각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 환원 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 환원 생성물 생합성 폴리펩티드는 2,3-에노일-CoA 리덕타제, 2,3-데히드로-카르복실 CoA 2'3-리덕타제, 예를 들어, 본 명세서에 기술된 바와 같은 2,3-데히드로-헥사노일-CoA 2,3-리덕타제이거나 또는 그를 포함한다. 일부 구현예에서, 적합한 리덕타제는 US20170044551에 기술되어 있고, 이의 리덕타제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 환원 생성물은 CH3CH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH3CH2CH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH3CH2CH2CH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH2OHCH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH2OHCH2CH2CH2CH2C(O)S-CoA 이다. 일부 구현예에서, 환원 생성물은 CH2OHCH2CH2CH2CH2CH2C(O)S-COA 이다.
일부 구현예에서, 환원 생성물, 예를 들어, 화학식 P-7의 화합물 또는 이의 염은 CoA 전달 생성물, 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, CoA 전달 생성물로 전환된다. 일부 구현예에서, CoA 전달 생성물은 하기 화학식 P-8의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-OH
P-8
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 CoA 전달 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, CoA 전달 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 CoA 트랜스퍼라제, 예를 들어, 본 명세서에 기술된 바와 같은 6-히드록시헥사노일-CoA 트랜스퍼라제이거나 또는 그를 포함한다. 일부 구현예에서, CoA 트랜스퍼라제는 US20170044551에 기술되어 있고, 이의 CoA 트랜스퍼라제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 CoA 전달 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, CoA 전달 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH3CH2CH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, CoA 전달 생성물은 CH2OHCH2CH2CH2CH2CH2C(O)OH 이다.
일부 구현예에서, CoA 전달 생성물, 예를 들어, Ra 는 -OH 인, 화학식 P-8의 화합물 또는 이의 염은 산화 생성물, 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 산화 생성물로 전환된다. 일부 구현예에서, 산화 생성물은 하기 화학식 P-9의 화합물, 또는 이의 염이다:
H-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-9
상기 화학식에서, L2' 은 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-19 지방족 또는 C1-19 헤테로지방족이고, 여기서 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고, 각각의 다른 변수는 독립적으로 본 명세서에 기술된 바와 같다.
일부 구현예에서, L2' 은 공유 결합이다. 일부 구현예에서, L2' 은 공유 결합이 아니다. 일부 구현예에서, L1 및 L2' 중 적어도 하나는 공유 결합이 아니다.
일부 구현예에서, L2' 은 임의 치환된 C1-6 알킬렌이다. 일부 구현예에서, L2' 은 임의 치환된 선형 C1-6 알킬렌이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 임의 치환된 -CH2CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 미치환된다. 일부 구현예에서, -C(O)H에 결합된 -CH2- 는 단일-치환된다. 일부 구현예에서, L2' 은 치환된다. 일부 구현예에서, L2' 은 미치환된다. 일부 구현예에서, L2' 은 -CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2CH2CH2CH2- 이다. 일부 구현예에서, L2' 은 -CH2CH2CH2CH2CH2CH2- 이다.
일부 구현예에서, 이러한 전환은 산화 생성물 생합성 폴리펩티드에 의해 전환된다. 일부 구현예에서, 산화 생성물 생합성 폴리펩티드는 알콜 데히드로게나제, 예를 들어, 본 명세서에 기술된 바와 같은, 1차 알콜 데히드로게나제 예컨대 6-히드록시헥사노에이트 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 알콜 데히드로게나제는 US20170044551에 기술되어 있고, 이의 알콜 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 산화 생성물 생합성 폴리펩티드에 의해 전환된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 산화 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 산화 생성물은 HC(O)CH2CH2CH2C(O)OH 이다. 일부 구현예에서, 산화 생성물은 HC(O)CH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, 산화 생성물은 HC(O)CH2CH2CH2CH2CH2C(O)OH 이다.
일부 구현예에서, 산화 생성물, 예를 들어, 화학식 P-9의 화합물 또는 이의 염은효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 알데히드 산화 생성물로 전환된다. 일부 구현예에서, 산화 생성물은 하기 화학식 P-10의 화합물 또는 이의 염이다:
HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-10
상기 화학식에서, 각각의 다른 변수는 독립적으로 본 명세서에 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 알데히드 산화 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 알데히드 산화 생성물 생합성 폴리펩티드는 알데히드 데히드로게나제, 예를 들어, 본 명세서에 기술된 바와 같은, 6-히드록시헥사노에이트 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 알데히드 데히드로게나제는 US20170044551에 기술되고, 이의 알데히드 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 알데히드 산화 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 알데히드 산화 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 알데히드 산화 생성물은 HOC(O)CH2CH2CH2C(O)OH 이다. 일부 구현예에서, 산화 생성물은 HOC(O)CH2CH2CH2CH2C(O)OH 이다. 일부 구현예에서, 산화 생성물은 HOC(O)CH2CH2CH2CH2CH2C(O)OH 이다.
일부 구현예에서, CoA 전달 생성물, 예를 들어, 화학식 P-8의 화합물 또는 이의 염은 카르복실 환원 생성물, 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 카르복실 환원 생성물로 전환된다. 일부 구현예에서, 카르복실 환원 생성물은 하기 화학식 P-9'의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-H
P-9'
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 카르복실 환원 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 카르복실 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 카르복실산 리덕타제 또는 알데히드 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 카르복실 환원 생성물 생합성 폴리펩티드는 6-히드록시헥사노에이트 1-리덕타제를 포함하거나 또는 그를 포함한다. 일부 구현예에서, 카르복실 환원 생성물 생합성 폴리펩티드는 US20170044551에 기술된 카르복실산 리덕타제 또는 알데히드 데히드로게나제이거나 또는 그를 포함하고, 이의 카르복실산 리덕타제 또는 알데히드 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 카르복실 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 카르복실 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 카르복실 환원 생성물은 CH3CH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH3CH2CH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH3CH2CH2CH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH2OHCH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH2OHCH2CH2CH2CH2C(O)H 이다. 일부 구현예에서, 카르복실 환원 생성물은 CH2OHCH2CH2CH2CH2CH2C(O)H 이다.
일부 구현예에서, 카르복실 환원 생성물, 예를 들어, 화학식 P-9'의 화합물 또는 이의 염은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 알데히드 환원 생성물로 전환된다. 일부 구현예에서, 알데히드 환원 생성물은 하기 화학식 P-10'의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-CH2-OH
P-10'
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 알데히드 환원 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 알데히드 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 알데히드 리덕타제 또는 알콜 (예를 들어, 1차 알콜) 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 알데히드 리덕타제 또는 알콜 (예를 들어, 1차 알콜) 데히드로게나제는 US20170044551에 기술되고, 이의 리덕타제 및 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 알데히드 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 알데히드 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2CH2CH2OH 이다.
일부 구현예에서, 알켄 환원 생성물, 예를 들어, 화학식 P-3의 화합물 또는 이의 염은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 탈카르복실화 생성물로 전환된다. 일부 구현예에서, 탈카르복실화 생성물은 하기 화학식 P-4'의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-C(O)-H
P-4'
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 탈카르복실화 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 탈카르복실화 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 데카르복실라제이거나 또는 그를 포함한다. 일부 구현예에서, 데카르복실라제는 본 명세서에 기술된 바와 같은 2-케토-산 데카르복실라제이다. 일부 구현예에서, 데카르복실라제는 US20170044551에 기술되고, 이의 데카르복실라제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 탈카르복실화 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 탈카르복실화 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 탈카르복실화 생성물은 CH3CH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH3CH2CH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH3CH2CH2CH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH2OHCH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH2OHCH2CH2CH2CHO 이다. 일부 구현예에서, 탈카르복실화 생성물은 CH2OHCH2CH2CH2CH2CHO 이다.
일부 구현예에서, 탈카르복실화 생성물, 예를 들어, 화학식 P-4'의 화합물 또는 이의 염은 효소에 의해 촉매되거나, 생합성을 통해서, 또는 효소 촉매작용없이 전통적인 유기 합성을 통해서, 알데히드 환원 생성물로 전환된다. 일부 구현예에서, 알데히드 환원 생성물은 하기 화학식 P-5'의 화합물 또는 이의 염이다:
Ra-L2-L1-CH2-CH2-CH2-OH
P-5'
상기 화학식에서, 각각의 변수는 독립적으로 본 명세서에서 기술된 바와 같다.
일부 구현예에서, 이러한 전환은 알데히드 환원 생성물 생합성 폴리펩티드에 의해 촉매된다. 일부 구현예에서, 알데히드 환원 생성물 생합성 폴리펩티드는 본 명세서에 기술된 바와 같은 1차 알콜 데히드로게나제이거나 또는 그를 포함한다. 일부 구현예에서, 1차 알콜 데히드로게나제는 US20170044551에 기술되고, 이의 1차 알콜 데히드로게나제는 참조로 본 명세서에 편입된다. 일부 구현예에서, 이러한 전환은 알데히드 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
많은 다른 생합성 폴리펩티드에 대한 것처럼, 알데히드 환원 생성물 생합성 폴리펩티드는 유기체, 예컨대 박테리아에 있을 수 있고/있거나, 조작될 수 있고/있거나, 증가된 단백질 및/또는 활성 수준으로 증가되게 발현될 수 있고, 그들 생성물은 증가된 속도 및/또는 수율 및/또는 기질 이용성으로 생성될 수 있다.
일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH3CH2CH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2OH 이다. 일부 구현예에서, 알데히드 환원 생성물은 CH2OHCH2CH2CH2CH2CH2OH 이다.
일부 구현예에서, 본 개시는 하나 이상의 생합성 폴리펩티드를 코딩하는 핵산을 제공한다. 일부 구현예에서, 이러한 핵산은 비천연 서열을 포함한다. 일부 구현예에서, 이러한 핵산은 생산 유기체, 예를 들어 박테리아에서 발현을 위해 최적화된다.
본 명세서에서 입증된 바와 같이, 다양한 기술은 생합성 활성을 위한 폴리펩티드의 활성을 평가하는데 이용가능하다. 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드 (예를 들어, 히드라타제-알돌라제) 또는 알켄 환원 생성물 생합성 폴리펩티드 (예를 들어, 알돌-탈수 생성물의 환원을 위한 효소)의 활성을 평가하기 위한 다양한 기술은 실시예에 기술된다.
일부 구현예에서, 다양한 생합성 폴리펩티드, 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드는 유기체, 많은 구현예에서, 미생물 예컨대 박테리아, 진균 등에 존재한다. 일부 구현예에서, 그들은 하나 이상의 재조합 핵산으로부터 발현된다. 일부 구현예에서, 다양한 형질전환이 생합성적으로, 예를 들어, 유기체, 예컨대 박테리아에서 수행된다. 일부 구현예에서, 유기체 (예를 들어, 미생물, 예컨대 박테리아)는 생합성 폴리펩티드, 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드 예컨대 히드라타제-알돌라제를 코딩하는 외생성 핵산을 함유하도록 조작된다.
일부 구현예에서, 유기체, 예를 들어, 알돌-탈수 생성물을 생성하도록 조작된 것들은 알돌-탈수 생성물 생합성 폴리펩티드 예컨대 히드라타제-알돌라제 폴리펩티드의 조절된 수준, 전형적으로 증가된 수준 및/또는 활성을 발현한다.
일부 구현예에서, 유기체는 조작된 핵산을 포함하고/하거나, 조작된 생합성 폴리펩티드, 예를 들어, 알돌-탈수 생성물 생합성 폴리펩티드 (예를 들어, 다양한 히드라타제-알돌라제)를 발현한다. 일부 구현예에서, 조작된 핵산은 기준 핵산과 비교하여 하나 이상의 서열 편차를 포함한다. 일부 구현예에서, 기준 핵산은 조작된 핵산이 도입되는 유기체 내에서의 해당 핵산이다. 일부 구현예에서, 기준 핵산은 천연 핵산이다. 일부 구현예에서, 조작된 핵산은 기준 핵산, 예를 들어, 천연 핵산과 동일한 폴리펩티드 또는 이의 특징적 엘리먼트를 코딩한다. 일부 구현예에서, 조작된 핵산은 기준 핵산에 의해 코딩되는 것과 상이한 폴리펩티드 또는 이의 특징적 엘리먼트를 코딩한다. 일부 구현예에서, 조작된 폴리펩티드는 (예를 들어, 자연계 등에서 발견되는, 기준 핵산에 의해 코딩되는) 기준 폴리펩티드와 비교하여 하나 이상의 편차를 포함한다. 일부 구현예에서, 조작된 폴리펩티드는 기준 폴리펩티드와 비교하여 하나 이상의 상이한 아미노산 잔기를 포함한다. 일부 구현예에서, 조작된 폴리펩티드는 도입되는 유기체에 부재하는 폴리펩티드이다. 일부 구현예에서, 조작된 폴리펩티드는 기준 폴리펩티드와 상동성이고, 예를 들어, 기준 폴리펩티드 또는 이의 특징적인 엘리먼트와 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 95%, 99% 이상의 상동성을 공유한다. 일부 구현예에서, 특징적인 엘리먼트는 관련 반응을 촉매하는 도메인이다. 일부 구현예에서, 특징적 엘리먼트는 아미노산 잔기의 세트이다. 일부 구현예에서, 특징적 엘리먼트는 기질, 생성물, 보조인자 등과 접촉하고/하거나, 관련 반응을 촉진하는 아미노산 잔기의 세트이다. 당업자가 이해하는 바와 같이, 아미노산 잔기의 세트 내 잔기는 서열 중에서 서로 옆에 있을 수 있거나, 또는 이격될 수 있다. 일부 구현예에서, 세트 중 둘 이상의 아미노산 잔기는 공간적으로 서로와 밀접할 수 있고, 예를 들어 촉매 포켓에 있을 수 있다.
일부 구현예에서, 생합성 생성을 위해서, 유기체는 하나 이상의 생합성 폴리펩티드의 높은 수준 및/또는 활성을 발현할 수 있다. 일부 구현예에서, 유기체는 바람직한 생성물을 생성시키기 위해 증가된 속도 및/또는 수율을 제공한다.
본 명세서에 기술된 바와 같이, 일부 구현예에서, 본 개시는 높은 생성물 수율을 제공한다. 일부 구현예에서, 예를 들어, 하나 이상의 생합성 폴리펩티드를 포함하는 하나 또는 다수의 단계 과정의 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 일부 구현예에서, 제공된 기술은 바람직한 생성물을 위해, 기질, 예를 들어, 피루베이트의 높은 이용성을 제공한다. 일부 구현예에서, 바람직한 생성물에 대한 이용성 백분율은 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 이다.
당업자는 본 개시의 다양한 화합물, 예를 들어, 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염은 다양한 화합물, 물질, 및 생성물의 생성을 위한 재료로서 유용하다는 것을 이해한다. 예를 들어, 아디프산이 나일론 6,6, 폴리에스테르 폴리올, 폴리에스테르 수지, 가소제, 식품 및 다른 물질을 생성시키는데 사용될 수 있다. 1,5-펜탄디올은 다양한 폴리우레탄, 폴리에스테르 폴리올, 및 폴리에스테르를 제조하는데 사용될 수 있다. 1,6-헥산디올 (HDO)은 다양한 폴리에스테르를 제조하는데 사용될 수 있고, 이의 일부는 산업적 코팅 응용분야에 유용하다. HDO는 또한 특히 자동차 응용분야용 코팅재로서 사용될 수 있는, 폴리우레탄을 생성시키는데 이용될 수 있다. 일부 구현예에서, HDO는 예를 들어, 엘라스토머 및 폴리우레탄 분산물 (예를 들어, 파케이 바닥마감 및 가죽 코팅용)에서 사용되는 마크로디올, 예를 들어, 아디페이트 에스테르 및 폴리카르보네이트 디올의 생성에 사용된다. 전통적인 화학 과정을 통하거나 또는 생합성 과정을 통하거나 또는 이의 조합을 통해서, 6-히드록시 헥산산은 환화되어서 ε-카프로락톤을 만들 수 있고 그 다음에 아미노화되어서 ε-카프로락탐을 만들 수 있다. 전통적인 화학 과정을 통해서 또는 생합성 과정을 통해서 또는 이의 조합을 통해서, 6-히드록시 헥산산은 아미노화되어 6-아미노 헥산산을 만들 수 있고 그 다음으로 환화되어서 ε-카프로락탐을 만들 수 있다. 특히, ε-카프로락탐은 많은 상이한 산업에서 광범위하게 사용되는 중합체인, 나일론6의 생성에 사용될 수 있다. ε-카프로락톤은 중합되어서 특수 폴리우레탄의 생성을 포함한 다양한 응용분야를 갖는 생분해성 폴리에스테르인, 폴리카프로락톤 (PCL)을 만들 수 있다. 다양한 2-케토카르복실산은 다양한 관련 화학물 및 약학물에 유용하다. 일부 구현예에서, 이러한 화학물 및 약학물, 또는 이의 중간체는 아미노산 또는 α-히드록시 카르복실산이다. 일부 구현예에서, 본 개시의 화합물은 폴리에스테르, 폴리에스테르 폴리올, 폴리우레탄, 나일론 (예를 들어, 아디프산으로부터), 폴리카르보네이트 디올 (예를 들어, HDO 또는 1,5-펜탄디올 등으로부터), 디아크릴레이트 에스테르 (예를 들어, HDO 또는 1,5-펜탄디올 등으로부터), 디글리시딜 에테르 (예를 들어, HDO 또는 1,5-펜탄디올 등으로부터) 등을 제조하는데 이용된다.
일부 구현예에서, 본 개시는 제공된 과정의 조제물, 예를 들어, 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염, 및 이러한 화합물로부터 제조된 다양한 화합물, 물질, 생성물 등의 조제물을 제공한다.
제공된 기술은 다수의 장점을 제공한다. 특히, 제공된 과정은 효율을 개선시킬 수 있고/있거나 오염을 감소시킬 수 있는, 재생가능한 자원으로부터의 하나 이상의 생합성 폴리펩티드 및/또는 물질을 이용한다. 일부 구현예에서, 본 개시 (예를 들어, 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염, 및 이러한 화합물로부터 제조된 다양한 화합물, 물질, 생성물 등)의 조제물은 화석 탄소원으로부터 제조된 것과 비교하여, 하나 이상의 동위원소, 예를 들어, 14C의 농축된 수준을 포함한다. 일부 구현예에서, 화석 탄소원을 사용한 조제물은 0 또는 실제로 0의 14C 수준을 갖는다. 화합물, 조성물, 조제물 생성물 등에서 다양한 원자의 동위원소 비율 및/또는 수준을 평가하기 위한 기술은 당업자에게 충분히 공지되어 있고 본 개시에 따라서 이용될 수 있다. 예를 들어, 일부 구현예에서, 동위원소 농축은 가속 질량 분광법 (AMS) 및/또는 안정한 동위원소 비율 질량 분광법 (SIRMS), 및/또는 핵자기 공명을 통한 부위-특이적 자연 동위원소 분획법 (SNIF-NMR) 같은 기술을 사용한 질량 분광법으로 쉽게 평가할 수 있다.
당업자가 이해하는 바와 같이, 제공된 방법은 하나 이상의 생합성 폴리펩티드를 포함하는 시스템에서 시험관내에서 수행될 수 있다. 많은 구현예에서, 제공된 기술은 하나 이상의 생합성 폴리펩티드를 발현하는, 유기체, 예를 들어, 미생물, 예컨대 박테리아를 사용해 수행된다. 일부 구현예에서, 본 개시는 본 명세서에 기술된 바와 같은 하나 이상의 생합성 폴리펩티드를 발현하는 유기체, 예를 들어, 박테리아를 제공한다. 일부 구현예에서, 이러한 유기체는 조작된다. 일부 구현예에서, 이러한 유기체는 하나 이상의 생합성 폴리펩티드의 단백질 및/또는 활성의 증가된 수준을 발현하도록 조작 및/또는 배양된다. 일부 구현예에서, 이러한 유기체는 보다 효율적으로 바람직한 생성물을 생성시키기 위해 탄소원을 이용하도록 조작 및/또는 배양된다.
일부 구현예에서, 본 개시는 지방족 알데히드의 알돌 생성물을 생성하는 유기체로서, 알돌 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하는 미생물을 제공한다. 일부 구현예에서, 유기체는 조작된다. 일부 구현예에서, 유기체는 박테리아이다.
일부 구현예에서, 본 개시는 알데히드의 알돌-탈수 생성물을 생성하는 유기체로서, 알돌 생성물 생합성 폴리펩티드, 알돌-탈수 생성물 생합성 폴리펩티드, 탈수 생성물 생합성 폴리펩티드, 및 이의 조합의 증가된 발현 또는 활성을 포함하는 미생물을 제공한다. 일부 구현예에서, 본 개시는 알데히드의 알돌-탈수 생성물을 생성하는 유기체를 제공하고, 미생물은 알돌-탈수 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함한다. 일부 구현예에서, 유기체는 조작된다. 일부 구현예에서, 유기체는 박테리아이다. 일부 구현예에서, 알데히드는 지방족 알데히드이다.
일부 구현예에서, 본 개시는 알켄 환원 생성물을 생성하는 유기체로서, 알켄 환원 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하는 미생물을 제공한다. 일부 구현예에서, 본 개시는 피루베이트 및 알데히드로부터 알켄 환원 생성물을 생성하는 유기체로서, 알켄 환원 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하는 미생물을 제공한다. 일부 구현예에서, 유기체는 조작된다. 일부 구현예에서, 유기체는 박테리아이다.
일부 구현예에서, 본 개시는 본 명세서에 기술된 바와 같은 유기체의 배양물을 제공한다. 일부 구현예에서, 본 개시는 박테리아의 배양물을 제공한다. 일부 구현예에서, 배양물은 하나 이상의 생합성 폴리펩티드의 하나 이상의 생성물, 예를 들어, 하나 이상의 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염을 포함한다.
당분자가 이해하는 바와 같이, 피루베이트는 피루브산 또는 이의 염으로서 제공할 수 있다.
일 양태에서, 본 명세서는 하기 화학식 I의 화합물 또는 이의 염, 또는 화합물 또는 염의 용매화물을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 CH2OH, CH3 또는 H다.
방법은 효소적 단계를 포함한다.
일부 구현예에서, 방법은 의 CN 알데히드 (상기 화학식에서, R은 CH2OH, CH3 또는 H임), 및 피루베이트를, (a) EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 히드라타제-알돌라제 (본 명세서에서 Ads-Hyd로서 지칭)에 의해 촉매되는 알돌 축합 반응을 통해서 CN 알데히드 및 피루베이트를 CN+3 3,4-데히드로-2-케토-카르복실산 중간체로 전환시키고; 그 다음으로 (b) EC 번호 1.6.5. (예를 들어, EC 번호 1.6.5.5.)를 갖는 옥시도리덕타제를 사용하여, CN+3 3,4-데히드로-2-케토-카르복실산을 CN+3 2-케토-카르복실산 (즉, 화학식 I의 화합물), 또는 이의 염, 또는 와합물의 용매화물 또는 염으로 전환시키는, 조건 하에 용매 중에서 배합 또는 인큐베이션시키는 단계를 포함하거나, 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 방법은 의 CN 알데히드 (상기 화학식에서, R은 CH2OH, CH3 또는 H임), 및 피루베이트를, (a) EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 히드라타제-알돌라제 (본 명세서에서 Ads-Hyd로 지칭)에 의해 촉매되는 알돌 부가 반응을 통해서 CN 알데히드 및 피루베이트를 먼저 CN+3 4-히드록시-2-케토-카르복실산 중간체로 전환시키고; 다음으로 (b) 히드라타제-알돌라제를 사용하여 4-히드록시-2-케토-카르복실산을 CN+3 3,4-데히드로-2-케토-카르복실산으로 전환시키고; 그 다음으로 (c) EC 번호 1.6.5. (예를 들어, EC 번호 1.6.5.5.)를 갖는 옥시도리덕타제를 사용하여, CN+3 3,4-데히드로-2-케토-카르복실산을 CN+3 2-케토-카르복실산 (즉, 화학식 I의 화합물), 또는 이의 염, 또는 화합물 또는 염의 용매화물으로 전환시키는 조건 하에 용매 중에서, 배합 또는 인큐베이션시키는 단계를 포함하거나, 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
다른 양태에서, 본 명세서는 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 및 6-히드록시 헥산산으로부터 선택되는 화합물을 제조하기 위한 방법을 제공하고, 상기 방법은 a) EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 히드라타제-알돌라제, 및 EC 번호 1.6.5 (예를 들어, EC 번호 1.6.5.5)를 갖는 옥시도리덕타제의 조합을 사용하여 3-히드록시-프로파날 및 피루베이트를 6-히드록시-2-케토 카르복실산 중간체로 전환시키는 단계; 및 b) 효소적 단계를 통해서 6-히드록시-2-케토 카르복실산 중간체를 화합물로 전환시키는 단계를 포함하거나, 또는 대안적으로 그로 본질적으로 이루어지거나, 역시 또한 그로 이루어진다.
일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45를 갖는 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.34를 갖는 트랜스-2'-카르복시벤잘피루베이트 히드라타제-알돌라제이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.1.4를 갖는 아세토아세테이트 데카르복실라제이다.
일부 구현예에서, 미생물은 화학식 I의 화합물, 또는 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 및 6-히드록시 헥산산, 또는 이의 염, 또는 화합물 또는 염의 용매화물로부터 선택되는 화합물의 조제물을 위한 숙주로서 사용된다. 본 명세서에서 사용되는, "숙주"는 세포 또는 미생물의 내부 (예를 들어, 출발 물질(들)을 흡수하고, 임의로 생성물(들)을 분비시켜서) 또는 외부 (예를 들어, 효소를 분비시켜서)에서 반응을 촉매할 수 있는 하나 이상의 효소를 생성시킬 수 있는 세포 또는 미생물을 지칭한다.
일부 구현예에서, 방법은 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 및 6-히드록시 헥산산 또는 이의 염, 또는 화합물 또는 염의 용매화물로부터 선택되는 화합물을 용액, 배양물, 및/또는 숙주 세포로부터 단리시키는 단계를 더 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 본 명세서에 개시된 방법의 조건은 성분을 약 10 내지 약 200℃, 또는 대안적으로 적어도 (모든 온도는 섭씨도로 제공) 10, 15, 20, 25, 28, 29, 30, 31, 32, 33, 34, 35, 37, 37, 38, 39, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180 또는 190℃, 또는 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 또는 25℃ 미만 (10℃의 온도 하한치)의 온도에서 인큐베이션 또는 접촉시키는 단계를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 역시 또한 그로 이루어진다. 일부 구현예에서, 조건은 대안적으로 약 2 내지 약 12의 인큐베이션 용액의 pH로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다. 일부 구현예에서, pH는 적어도 2, 또는 3, 4, 5, 5.5, 6, 6.5, 7, 7.5, 8, 또는 9 내지 약 12이다. 일부 구현예에서, pH는 12, 11, 10, 9, 8, 7.5, 7, 6.5, 6, 5.5, 또는 4 미만이고 pH의 하한치는 2 초과이다.
일부 구현예에서, 조건은 약 0.1 μM 내지 약 5 M의 농도로 존재하는 피루베이트 및 CN 알데히드의 몰 농도를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또는 그로 이루어진다. 일부 구현예에서, 농도는 적어도 약 0.1, 0.5, 1, 10, 100, 500 μM 또는 1 M 이다. 일부 구현예에서, 농도는 약 4 M, 3 M, 2 M, 1 M, 500 μM, 200 μM, 100 μM, 또는 10 μM 미만이다. 피루베이트 및 CN 의 농도는 독립적으로 동일할 수 있거나 또는 상이할 수 있고 인큐베이션의 다른 조건에 따라 가변적일 것이다.
일부 구현예에서, 조건은 클래스 I/II 피루베이트 의존적 알돌라제, 히드라타제-알돌라제, 데히드라타제, 퀴논 옥시도리덕타제, 에노일-CoA 리덕타제, 1차 알콜 데히드로게나제, 케토-산 데카르복실라제, 조효소 A 트랜스퍼라제, 및 카르복실산 리덕타제로 이루어진 군으로부터 선택되는 하나 이상의 효소를 생성시키는 비-천연 미생물의 존재를 포함한다. 각각의 이들 효소는 반응 특이적 효소이다.
일부 구현예에서, 미생물 또는 숙주는 야생형 대응체를 초과하는 양으로 효소를 발현하거나 또는 효소를 과발현하도록 유전자 조작된다. 효소 또는 발현 생성물의 발현 수준을 결정하는 방법은 당분야에 공지되어 있고, 예를 들어, PCR에 의한다.
일부 구현예에서, CN 알데히드는 3-히드록시-프로파날이다.
일부 구현예에서, 방법은 3-히드록시-프로파날 및 피루베이트를 글리세롤, C5 당, C6 당, 포스포-글리세레이트, 다른 탄소원, 해당 경로의 중간체, 프로파노에이트 물질대사의 중간체, 또는 이의 조합으로 제조하는 단계를 더 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 3-히드록시-프로파날은 글리세롤의 탈수를 통해서 수득된다.
일부 구현예에서, C5 당은 하나 이상의 자일로스, 자일룰로스, 리불로스, 아라비노스, 릭소스, 및 리보스를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, C6 당은 하나 이상의 알로스, 알트로스, 글루코스, 만노스, 굴로스, 이도스, 탈로스, 갈락토스, 프룩토스, 사이코스, 솔보스, 및 타가토스를 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 다른 탄소원은 미생물에 대한 탄소원으로서 적합한 공급원료이고, 여기서 공급원료는 아미노산, 지질, 옥수수대, 억새, 도시 폐기물, 에너지 수수, 사탕수수, 바가스, 전분 스트림, 덱스트로스 스트림, 메탄올, 포르메이트, 또는 이의 조합을 포함하거나 또는 대안적으로 그로 본질적으로 이루어지거나, 또는 역시 또한 그로 이루어진다.
일부 구현예에서, 미생물은 1,5-펜탄디올, 아디프산, 1,6-헥산디올, 또는 6-히드록시 헥산산의 제조를 위한 숙주로서 사용된다.
일부 구현예에서, 미생물은 C5 당, C6 당, 글리세롤, 다른 탄소원, 또는 이의 조합을 피루베이트로 전환시키는 능력을 갖는다.
일부 구현예에서, 미생물은 증강된 당 흡수, 예를 들어, C5 당 흡수, 동시 C6/C5 당 흡수, 동시 C6 당/글리세롤 흡수, 동시 C5 당/글리세롤 흡수, 또는 이의 조합을 위해 조작된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
다른 양태에서, 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 하나 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및 를 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 하나 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현되고; 피루베이트 및 는 히드라타제-알돌라제에 의해 단독으로 촉매되는 알돌 축합 반응을 겪어서 2-옥소-3-에노산을 생성하고, 2-옥소-3-에노산은 퀴논 옥시도리덕타제에 의해 단독으로 촉매되는 환원을 겪어서 2-케토 카르복실산을 생성시킨다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 하나 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행되고; 피루베이트 및 은 히드라타제-알돌라제에 의해 단독으로 촉매되는 알돌 축합 반응을 겪어서 2-옥소-3-에노산을 생성시키고, 2-옥소-3-에노산은 퀴논 옥시도리덕타제에 의해 단독으로 촉매되는 환원을 겪어서 2-케토 카르복실산을 생성시킨다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제를 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 둘 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및 를 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 둘 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서, 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되고; 피루베이트 및 는 히드라타제-알돌라제에 의해 단독으로 촉매되는 알돌 축합 반응을 겪어서 2-옥소-3-에노산을 생성시키고, 2-옥소-3-에노산은 퀴논 옥시도리덕타제에 의해 단독으로 촉매되는 환원을 겪어서 2-케토 카르복실산을 생성시킨다.
다른 양태에서, 본 명세서는 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법을 제공한다:
상기 화학식에서, R은 H, CH3, 또는 CH2OH이다.
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현되고, 방법은 둘 이상의 비-천연 발생 미생물 유기체의 존재 하에서 수행되고, 피루베이트 및 는 히드라타제-알돌라제에 의해 단독으로 촉매되는 알돌 축합 반응을 겪어서 2-옥소-3-에노산을 생성시키고, 2-옥소-3-에노산은 퀴논 옥시도리덕타제에 의해 단독으로 촉매되는 환원을 겪어서 2-케토 카르복실산을 생성시킨다.
일부 구현예에서, 는 3-히드록시-프로파날이다. 일부 구현예에서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수를 통해 생성된다.
일부 구현예에서, 2-케토 카르복실산을 제조하기 위한 방법은 2-케토 카르복실산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
다른 양태에서, 본 명세서는 1,5-펜탄디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,5-펜탄디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,6-헥산디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 1,6-헥산디올을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 6-히드록시-헥사노에이트를 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 6-히드록시-헥사노에이트를 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 아디프산 (AA)을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
다른 양태에서, 본 명세서는 아디프산 (AA)을 제조하기 위한 방법을 제공하고, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.45를 갖는 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.2.34를 갖는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 EC 번호 4.1.1.4를 갖는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 Genbank 또는 RefSeq 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
일부 구현예에서, 히드라타제-알돌라제는 Genbank 또는 RefSeq 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, A0A370X7D8, WP_028222253, F2J6L6, A0A0N0L9F6, A0A1G9YWG7, A0A2U1BT09, A0A244DHE8, WP_107818191, A0A023WZF9, PYN48855, A0A421PAQ6, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 표 1, 5, 6, 7, 및 8로부터 선택되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 표 1, 5, 6, 7, 및 8로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5.5를 갖는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
일부 구현예에서, 퀴논 옥시도리덕타제는 GenBank, RefSeq, 또는 Uniprot ID No. P28304, P40783, Q0K2I0, A0A1Z1SRY9, P43903, I7G8G0, 또는 Q142L2, ALK19324.1, A0A1G9R408, G4Q8R5, ANA98723.1, K0EUQ3, A0A061CRS8, Q9A212, A0A1I6RWW2, WP_026197277.1, Q5NKZ3, WP_012333034.1, 또는 WP_136898000.1 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 하나 이상의 비-천연 발생 미생물에 의해 발현되는 하나 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 둘 이상의 비-천연 발생 미생물에 의해 발현되는 하나 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 하나 이상의 비-천연 발생 미생물에 의해 발현되는 둘 이상의 외생성 유전자에 의해 발현된다. 일부 구현예에서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 효소 중 적어도 하나는 둘 이상의 비-천연 발생 미생물에 의해 발현되는 둘 이상의 외생성 유전자에 의해 발현된다. 하나 이상의 외생성 유전자는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 이상의 외생성 유전자를 포함한다. 둘 이상의 외생성 유전자는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 이상의 외생성 유전자를 포함한다.
일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다. 일부 구현예에서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
일부 구현예에서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다. 일부 구현예에서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다. 일부 구현예에서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 2-케토-산-데카르복실라제는 EC 번호 4.1.1.1; EC 번호 4.1.1.2; EC 번호 4.1.1.3; EC 번호 4.1.1.4; EC 번호 4.1.1.5; EC 번호 4.1.1.6; EC 번호 4.1.1.7; EC 번호 4.1.1.11; EC 번호 4.1.1.12; EC 번호 4.1.1.15; EC 번호 4.1.1.16; EC 번호 4.1.1.17; EC 번호 4.1.1.18; EC 번호 4.1.1.19; EC 번호 4.1.1.20; EC 번호 4.1.1.34; EC 번호 4.1.1.35; EC 번호 4.1.1.40; EC 번호 4.1.1.54; EC 번호 4.1.1.56; EC 번호 4.1.1.71; EC 번호 4.1.1.72; EC 번호 4.1.1.73; EC 번호 4.1.1.74; EC 번호 4.1.1.75; 또는 EC 번호 4.1.1.77 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 2-케토-산-데카르복실라제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 1차 알콜 데히드로게나제는 EC 번호 1.1.1.61을 갖는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다. 일부 구현예에서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소이다. 일부 구현예에서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 1차 알콜 데히드로게나제는 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 히드라타제-알돌라제는 Uniprot ID No. A0A286PH18 하에 확인되는 효소이고; 퀴논 옥시도리덕타제는 Uniprot ID No. P28304 하에 확인되는 효소이고; 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4 하에 확인되는 효소이고; 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다. 일부 구현예에서, 히드라타제-알돌라제는 Uniprot ID No. A0A286PH18 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 퀴논 옥시도리덕타제는 Uniprot ID No. P28304 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 EC 번호 1.2.99.6을 갖는 효소이고; 6-히드록시헥사날 1-리덕타제는 EC 번호 1.1.1을 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1 , BAL51292.1 , Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC6409 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 하에 확인되는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소이고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC6409 하에 확인되는 효소의 군으로부터 선택되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 0A2X3BTQ9 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소이고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A0C7GD16, A0A175L1W4, 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694.1, WP_036338301.1, WP_007472106.1, 또는 A0QWI7 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사날 1-리덕타제는 Uniprot 또는 GenBank ID No. D6Z860, YP_001705436.1, ANO06407.1, AAR91681.1, AHH98121.1, ANB00612.1, ANO04655.1, A0R484, AFP42026.1, GAJ86510.1, YP_001704097.1, ANA99315.1, GAJ83027.1, ANA98925.1, ANA98924.1, ANO04656.1, YP_001703694 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소이고; 6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot 또는 GenBank ID No. WP_003431407.1, BAL51292.1, Q5FTU6, AKC64094.1, WP_002876862.1, AGP69017.1, WP_003640741.1, AKC64095.1, 및 AKC64094.1 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93, A0A2X3BTQ9, A0A0C7GD16, 또는 A0A175L1W4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6, EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110 하에 확인되는 효소의 군으로부터 선택되고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 EC 번호 1.1.1.258을 갖는 효소이고; 6-옥소-헥사노에이트 옥시다제는 EC 번호 1.2.1.63을 갖는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot ID No. Q5FTU6 하에 확인되는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 Uniprot ID No. Q7WVD0 또는 Q84H78 하에 확인되는 효소이고; 6-옥소-헥사노에이트 옥시다제는 Uniprot ID No. Q9R2F4 하에 확인되는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 Uniprot ID No. Q5FTU6 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 Uniprot ID No. Q5U924, Q5U925, 및 Q5U923; 또는 A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 Uniprot ID No. Q73Q47 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 Uniprot ID No. T4VW93 또는 A0A2X3BTQ9 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 데히드로게나제는 Uniprot ID No. Q7WVD0 또는 Q84H78 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-옥소-헥사노에이트 옥시다제는 Uniprot ID No. Q9R2F4 하에 확인되는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고; 6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 것으로 확인된 효소이고; 6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소이다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 및 SEQ ID NO:72의 서열을 포함하는 것으로 확인된 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 가지고; 6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 또는 그 이상의 동일성을 갖는다.
일부 구현예에서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다. 일부 구현예에서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
일부 구현예에서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
일부 구현예에서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제에 의한 글리세롤의 탈수에 의해 생성된다.
하나 이상의 비-천연 발생 미생물 유기체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 이상의 비-천연 발생 미생물 유기체를 포함한다. 둘 이상의 비-천연 발생 미생물 유기체는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 이상의 비-천연 발생 미생물 유기체를 포함한다. 일부 구현예에서, 본 명세서에 개시된 방법은 하나의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다. 일부 구현예에서, 본 명세서에 개시된 방법은 2종의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다. 일부 구현예에서, 본 명세서에 개시된 방법은 3종의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다. 일부 구현예에서, 본 명세서에 개시된 방법은 4종의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다. 일부 구현예에서, 본 명세서에 개시된 방법은 5종의 비-천연 발생 미생물 유기체의 존재 하에서 수행된다.
본 출원 전반에서 다양한 공개물이 참조되었다. 이들 공개물 중 GenBank 등록 번호(들) 또는 Uniprot ID 번호(들) 또는 RefSeq ID 번호를 포함하여, 그들 전체로 이들 공개물의 개시는 본 개시가 속하는 분야의 기술을 보다 완전하게 설명하기 위해서 본 출원에서 참조로 편입된다.
일부 구현예에서, 본 개시는 예로서 하기 구현예를 제공한다:
1. 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법:
(상기 화학식에서, R은 H, CH3, 또는 CH2OH임);
방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하고; 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
2. 구현예 1의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
3. 구현예 1의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
4. 구현예 1의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
5. 구현예 1의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
6. 구현예 1의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
8. 구현예 7의 방법에 있어서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수를 통해서 생성된다.
9. 구현예 1-8 중 어느 하나의 방법에 있어서, 2-케토 카르복실산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
10. 하기 화학식의 2-케토 카르복실산을 제조하기 위한 방법으로서,
(상기 화학식에서, R은 H, CH3, 또는 CH2OH임),
방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 피루베이트 및 를 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 2-케토 카르복실산을 생성시키는 단계를 포함하고, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
11. 구현예 10의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
12. 구현예 10의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
13. 구현예 10의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
14. 구현예 10의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
15. 구현예 10의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되고, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
17. 구현예 16의 방법에 있어서, 3-히드록시-프로파날은 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
18. 구현예 10-17 중 어느 하나의 방법에 있어서, 2-케토 카르복실산을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
19. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다.
20. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
21. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
22. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
23. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
24. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
25. 구현예 1-18 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 표 1, 5-8로부터 선택되는 효소이다.
26. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
27. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
28. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
29. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
30. 구현예 1-25 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
31. 구현예 1-30 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
32. 구현예 31의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
33. 구현예 1-32 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
34. 구현예 1-11 중 어느 하나의 방법에 있어서, R은 CH2OH 이다.
35. 1,5-펜탄디올을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
36. 구현예 35의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
37. 구현예 35의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
38. 구현예 35의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
39. 구현예 35의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
40. 구현예 35의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
41. 구현예 35-40 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
42. 구현예 35-40 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
43. 구현예 35-40 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제 중 하나 이상은 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
44. 구현예 35-43 중 어느 하나의 방법에 있어서, 1,5-펜탄디올을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
45. 1,5-펜탄디올을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 2-케토-산-데카르복실라제와 접촉시켜서 5-히드록시-펜타날을 생성시키는 단계; 및
5-히드록시-펜타날을 1차 알콜 데히드로게나제와 접촉시켜서 1,5-펜탄디올을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
46. 구현예 45의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
47. 구현예 45의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
48. 구현예 45의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
49. 구현예 45의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
50. 구현예 45의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
51. 구현예 45-50 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
52. 구현예 45-50 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
53. 구현예 45-50 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제 및 1차 알콜 데히드로게나제 중 하나 이상은 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
54. 구현예 45-53 중 어느 하나의 방법에 있어서, 1,5-펜탄디올을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
55. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다.
56. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
57. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
58. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
59. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
60. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
61. 구현예 35-54 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 표 1, 5-8로부터 선택되는 효소이다.
62. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
63. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
64. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
65. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
66. 구현예 35-61 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
67. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 EC 번호 4.1.1.1; EC 번호 4.1.1.2; EC 번호 4.1.1.3; EC 번호 4.1.1.4; EC 번호 4.1.1.5; EC 번호 4.1.1.6; EC 번호 4.1.1.7; EC 번호 4.1.1.11; EC 번호 4.1.1.12; EC 번호 4.1.1.15; EC 번호 4.1.1.16; EC 번호 4.1.1.17; EC 번호 4.1.1.18; EC 번호 4.1.1.19; EC 번호 4.1.1.20; EC 번호 4.1.1.34; EC 번호 4.1.1.35; EC 번호 4.1.1.40; EC 번호 4.1.1.54; EC 번호 4.1.1.56; EC 번호 4.1.1.71; EC 번호 4.1.1.72; EC 번호 4.1.1.73; EC 번호 4.1.1.74; EC 번호 4.1.1.75; 또는 EC 번호 4.1.1.77을 갖는 효소이다.
68. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
69. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 50% 동일성을 갖는다.
70. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 70% 동일성을 갖는다.
71. 구현예 35-66 중 어느 하나의 방법에 있어서, 2-케토-산-데카르복실라제는 Uniprot ID No. Q6QBS4, A7M7D6, 또는 P20906 하에 확인되는 효소의 군으로부터 선택되는 효소와 적어도 90% 동일성을 갖는다.
72. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 EC 번호 1.1.1.61을 갖는 효소이다.
73. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 Uniprot 또는 GenBank ID No. NP_417279.1, NP_349892.1, NP_349891.1, BAB12273.1, L21902.1, Q94B07, AAB03015.1, NP_014032.1, NP_ 013892.1, NP_015019.1, NP_010996.2, ABX39192.1, XP_001210625.1, ABO67118, ABO68223, BAE77068.1, 또는 CAA47743.1 하에 확인된 효소의 군으로부터 선택되는 효소이다.
74. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소이다.
75. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
76. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
77. 구현예 35-71 중 어느 하나의 방법에 있어서, 1차 알콜 데히드로게나제는 SEQ ID NO:70, SEQ ID NO:71, SEQ ID NO:72, SEQ ID NO:73, 또는 SEQ ID NO:74의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
78. 구현예 35-54 중 어느 하나의 방법에 있어서,
히드라타제-알돌라제는 SEQ ID NO:8의 서열을 포함하는 효소이고;
퀴논 옥시도리덕타제는 SEQ ID NO:45의 서열을 포함하는 효소이고;
2-케토-산-데카르복실라제는 SEQ ID NO:83의 서열을 포함하는 효소이고;
1차 알콜 데히드로게나제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
79. 구현예 35-78 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제, 퀴논 옥시도리덕타제, 2-케토-산-데카르복실라제, 및 1차 알콜 데히드로게나제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
80. 구현예 79의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
81. 구현예 35-80 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
82. 구현예 35-81 중 어느 하나의 방법에 있어서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
83. 1,6-헥산디올을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
84. 구현예 83의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
85. 구현예 83의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
86. 구현예 83의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
87. 구현예 83의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
88. 구현예 83의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
89. 구현예 83-88 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
90. 구현예 83-88 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
91. 구현예 83-88 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
92. 구현예 83-91 중 어느 하나의 방법에 있어서, 1,6-헥산디올을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
93. 1,6-헥산디올을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 1-리덕타제와 접촉시켜서 6-히드록시-헥사날을 생성시키는 단계; 및
6-히드록시-헥사날을 6-히드록시헥사날 1-리덕타제와 접촉시켜서 1,6-헥산디올을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
94. 구현예 93의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
95. 구현예 93의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
96. 구현예 93의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
97. 구현예 93의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
98. 구현예 93의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
99. 구현예 93-98 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
100. 구현예 93-98 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
101. 구현예 93-98 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
102. 구현예 93-101 중 어느 하나의 방법에 있어서, 1,6-헥산디올을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
103. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다.
104. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
105. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
106. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
107. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
108. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
109. 구현예 83-102 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 표 1 및 5-8로부터 선택되는 효소이다.
110. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
111. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
112. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
113. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
114. 구현예 83-109 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
115. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6 , EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110을 갖는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
6-히드록시헥사노에이트 1-리덕타제는 EC 번호 1.2.99.6을 갖는 효소이고;
6-히드록시헥사날 1-리덕타제는 EC 번호 1.1.1을 갖는 효소이다.
116. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소이고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
117. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
118. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
119. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
120. 구현예 83-119 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 1-리덕타제, 및 6-히드록시헥사날 1-리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
121. 구현예 120,의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
122. 구현예 83-121 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
123. 구현예 83-122 중 어느 하나의 방법에 있어서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
124. 6-히드록시-헥사노에이트를 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
125. 구현예 124의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
126. 구현예 124의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
127. 구현예 124의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
128. 구현예 124의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
129. 구현예 124의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
130. 구현예 124-129 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
131. 구현예 124-129 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
132. 구현예 124-129 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제 중 하나 이상은 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
133. 구현예 124-132 중 어느 하나의 방법에 있어서, 6-히드록시-헥사노에이트를 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
134. 6-히드록시-헥사노에이트를 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계; 및
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
135. 구현예 134의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
136. 구현예 134의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
137. 구현예 134의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
138. 구현예 134의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
139. 구현예 134의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
140. 구현예 134-139 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
141. 구현예 134-139 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
142. 구현예 134-139 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제 중 하나 이상은 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
143. 구현예 134-142 중어느 하나의 방법에 있어서, 6-히드록시-헥사노에이트를 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 포함한다.
115. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6 , EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110을 갖는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
6-히드록시헥사노에이트 1-리덕타제는 EC 번호 1.2.99.6을 갖는 효소이고;
6-히드록시헥사날 1-리덕타제는 EC 번호 1.1.1을 갖는 효소이다.
116. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소이고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소이다.
117. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
118. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
119. 구현예 83-102 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노에이트 1-리덕타제는 SEQ ID NO:66, SEQ ID NO:67, 또는 SEQ ID NO:68의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사날 1-리덕타제는 SEQ ID NO:70의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
156. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6 , EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110을 갖는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이다.
157. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소이다.
158. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
159. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
160. 구현예 124-143 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55, SEQ ID NO:56, SEQ ID NO:57, 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
161. 구현예 124-160 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 및 6-히드록시헥사노일-CoA 트랜스퍼라제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
162. 구현예 161의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
163. 구현예 124-162 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
164. 구현예 124-163 중 어느 하나의 방법에 있어서, 3-히드록시-프로파날은하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
165. 아디프산을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계를 포함하고,
여기서 방법은 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
166. 구현예 165의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
167. 구현예 165의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
168. 구현예 165의 방법에 있어서, 히드라타제-알돌라제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
169. 구현예 165의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
170. 구현예 165의 방법에 있어서, 퀴논 옥시도리덕타제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
171. 구현예 165-170 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 하나 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
172. 구현예 165-170 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
173. 구현예 165-170 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 하나 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
174. 구현예 165-173 중 어느 하나의 방법에 있어서, 아디프산을 하나 이상의 비-천연 발생 미생물 유기체 또는 하나 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
175. 아디프산을 제조하기 위한 방법으로서, 방법은
피루베이트 및 3-히드록시-프로파날을 히드라타제-알돌라제 및 퀴논 옥시도리덕타제와 접촉시켜서 하기 화학식의 2-케토 카르복실산을 생성시키는 단계:
(상기 화학식에서, R은 CH2OH임);
2-케토 카르복실산을 6-히드록시-2-옥소헥사노에이트-2-리덕타제와 접촉시켜서 2,6-디히드록시-헥사노에이트를 생성시키는 단계;
2,6-디히드록시-헥사노에이트를 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제와 접촉시켜서 2,6-디히드록시-헥사노일-CoA를 생성시키는 단계;
2,6-디히드록시-헥사노일-CoA를 2,6-디히드록시-헥사노일-CoA 2-데히드라타제와 접촉시켜서 6-히드록시-2,3-데히드로-헥사노일-CoA를 생성시키는 단계;
6-히드록시-2,3-데히드로-헥사노일-CoA를 2,3-데히드로-헥사노일-CoA 2,3-리덕타제와 접촉시켜서 6-히드록시-헥사노일-CoA를 생성시키는 단계;
6-히드록시-헥사노일-CoA를 6-히드록시헥사노일-CoA 트랜스퍼라제와 접촉시켜서 6-히드록시-헥사노에이트를 생성시키는 단계;
6-히드록시-헥사노에이트를 6-히드록시헥사노에이트 데히드로게나제와 접촉시켜서 6-옥소-헥사노에이트를 생성시키는 단계; 및
6-옥소-헥사노에이트를 6-옥소-헥사노에이트 옥시다제와 접촉시켜서 아디프산을 생성시키는 단계를 포함하고,
여기서 방법은 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물 중에서 수행된다.
176. 구현예 175의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
177. 구현예 175의 방법에 있어서, 히드라타제-알돌라제 및 퀴논 옥시도리덕타제 중 적어도 하나는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
178. 구현예 175의 방법에 있어서, 히드라타제-알돌라제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
179. 구현예 175의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
180. 구현예 175의 방법에 있어서, 퀴논 옥시도리덕타제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
181. 구현예 175-180 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 발현된다.
182. 구현예 175-180 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제는 둘 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현된다.
183. 구현예 175-180 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 둘 이상의 비-천연 발생 미생물 유기체에 의해 과발현된다.
184. 구현예 175-183 중 어느 하나의 방법에 있어서, 아디프산을 둘 이상의 비-천연 발생 미생물 유기체 또는 둘 이상의 비-천연 발생 미생물 유기체를 포함하는 배양물로부터 분리시키는 단계를 더 포함한다.
185. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는 효소이다.
186. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 GenBank, RefSeq, 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인되는 효소의 군으로부터 선택되는 효소이다.
187. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
188. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
189. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
190. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
191. 구현예 165-184 중 어느 하나의 방법에 있어서, 히드라타제-알돌라제는 표 1 및 5-8로부터 선택되는 효소이다.
192. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
193. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
194. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
195. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
196. 구현예 165-191 중 어느 하나의 방법에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
197. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 EC 번호 1.1.99.6 , EC 번호 1.1.1.169, EC 번호 1.1.1.215, EC 번호 1.1.1.28, 또는 EC 번호 1.1.1.110을 갖는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 EC 번호 4.2.1.167을 갖는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 EC 번호 1.3.1.44를 갖는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 EC 번호 2.8.3, EC 번호 2.8.3.1, 또는 EC 번호 2.8.3.12를 갖는 효소이고;
6-히드록시헥사노에이트 데히드로게나제는 EC 번호 1.1.1.258을 갖는 효소이고;
6-옥소-헥사노에이트 옥시다제는 EC 번호 1.2.1.63을 갖는 효소이다.
198. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소이고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소이고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소이고;
6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 것으로 확인된 효소이고;
6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소이다.
199. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 효소와 적어도 50% 동일성을 가지고;
6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
200. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 효소와 적어도 70% 동일성을 가지고;
6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
201. 구현예 165-184 중 어느 하나의 방법에 있어서,
6-히드록시-2-옥소헥사노에이트-2-리덕타제는 SEQ ID NO:53, SEQ ID NO:54, SEQ ID NO:98, SEQ ID NO:99, SEQ ID NO:100, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:104, 또는 SEQ ID NO:105의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,6-디히드록시-헥사노일-CoA 2-데히드라타제는 SEQ ID NO:59, SEQ ID NO:61, 및 SEQ ID NO:63; 또는 SEQ ID NO:60, SEQ ID NO:62, 및 SEQ ID NO:64의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
2,3-데히드로-헥사노일-CoA 2,3-리덕타제는 SEQ ID NO:65의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노일-CoA 트랜스퍼라제는 SEQ ID NO:55 또는 SEQ ID NO:58의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-히드록시헥사노에이트 데히드로게나제는 SEQ ID NO:71 또는 SEQ ID NO:72의 서열을 포함하는 효소와 적어도 90% 동일성을 가지고;
6-옥소-헥사노에이트 옥시다제는 SEQ ID NO:75의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
202. 구현예 165-201 중 어느 하나의 방법에 있어서, 6-히드록시-2-옥소헥사노에이트-2-리덕타제, 2,6-디히드록시-헥사노에이트 CoA-트랜스퍼라제, 2,6-디히드록시-헥사노일-CoA 2-데히드라타제, 2,3-데히드로-헥사노일-CoA 2,3-리덕타제, 6-히드록시헥사노일-CoA 트랜스퍼라제, 6-히드록시헥사노에이트 데히드로게나제, 및 6-옥소-헥사노에이트 옥시다제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
203. 구현예 202의 방법에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
204. 구현예 165-203 중 어느 하나의 방법에 있어서, 피루베이트는 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택되는 탄소원으로부터 생성된다.
205. 구현예 165-204 중 어느 하나의 방법에 있어서, 3-히드록시-프로파날은 하나 이상의 비-천연 발생 미생물 유기체에 의해 외생적으로 발현되는 글리세롤 데히드라타제 효소에 의한 글리세롤의 탈수에 의해 생성된다.
206. 알돌라제 히드라타제 효소를 코딩하는 제1 외생성 핵산을 포함하는 재조합 미생물 유기체로서, 재조합 미생물 유기체는 변형되지 않은 동일 미생물 유기체 또는 야생형과 비교하여 퀴논 옥시도리덕타제의 증가된 양을 발현하도록 더 변형되고, 임의로 미생물 유기체는 코리네박테리움 글루타미쿰, 클로스트리듐 종, 또는 이. 콜라이이다.
207. 구현예 206의 재조합 미생물에 있어서, 유기체는 퀴논 옥시도리덕타제를 코딩하는 제2 외생성 핵산을 포함한다.
208. 구현예 207의 재조합 미생물에 있어서, 제1 및/또는 제2 외생성 핵산은 제2 외생성 핵산의 발현을 구동하는 조절 엘리먼트를 더 포함한다.
209. 구현예 208의 재조합 미생물에 있어서, 조절 엘리먼트는 프로모터 또는 인핸서로부터 선택된다.
210. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34 또는 EC 번호 4.1.1.4를 갖는다.
211. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 Genbank 또는 RefSeq 또는 Uniprot ID No. D7C0E5, P0A144, Q79EM8, A0A0N0AHI8, A0A0N1FRY3, M3DYR1, W7SU48, A0A286PH18, Q9X9Q6, Q9WXH7, A4XDS1, F2J6N9, A0A063BFL5, Q9ZHH6, A0A0C1K853, WP_034398482, PYK12191, WP_115478033, WP_028222253, WP_013654807, WP_059403060, WP_092508530, WP_116642627, WP_009770659, WP_107818191, WP_003292061, PYN48855, WP_122212965, WP_028217297, WP_034507049, KMK64081.1, WP_070028041.1, 또는 KZL92449.1 하에 확인된 효소의 군으로부터 선택되는 효소이다.
212. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소이다.
213. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
214. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
215. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:28, SEQ ID NO:29, SEQ ID NO:30, SEQ ID NO:84, SEQ ID NO:85, 또는 SEQ ID NO:86의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
216. 구현예 206-209 중 어느 하나의 재조합 미생물 유기체에 있어서, 알돌라제 히드라타제 효소는 표 1, 5-8로부터 선택되는 효소이다.
217. 구현예 206-216 중 어느 하나의 재조합 미생물 유기체에 있어서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 벡터에 함유된다.
218. 구현예 217의 재조합 미생물 유기체에 있어서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각 동일한 벡터에 함유된다.
219. 구현예 218의 재조합 미생물 유기체에 있어서, 제1 외생성 핵산 및 제2 외생성 핵산은 각각이 그들 자신의 별도 벡터에 함유된다.
220. 구현예 217-219 중 어느 하나의 재조합 미생물 유기체에 있어서, 벡터는 플라스미드이다.
221. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 EC 번호 1.6.5 (예를 들어, EC 1.6.5.5)를 갖는 효소이다.
222. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소이다.
223. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 50% 동일성을 갖는다.
224. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 70% 동일성을 갖는다.
225. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 퀴논 옥시도리덕타제는 SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:47, SEQ ID NO:48, SEQ ID NO:49, SEQ ID NO:50, SEQ ID NO:51, SEQ ID NO:52, SEQ ID NO:87, SEQ ID NO:88, SEQ ID NO:89, SEQ ID NO:90, SEQ ID NO:91, SEQ ID NO:92, SEQ ID NO:93, SEQ ID NO:94, SEQ ID NO:95, SEQ ID NO:96, 또는 SEQ ID NO:97의 서열을 포함하는 효소와 적어도 90% 동일성을 갖는다.
226. 구현예 206-220 중 어느 하나의 재조합 미생물 유기체에 있어서, 히드라타제-알돌라제 효소 및 퀴논 옥시도리덕타제 중 하나 이상은 하나 이상의 단백질 태그를 더 포함한다.
227. 구현예 226의 재조합 미생물 유기체에 있어서, 단백질 태그는 폴리히스티딘 태그, GST 태그 (글루타티온-S-트랜스퍼라제 태그), HA 태그 (헤마글루티닌 태그), FLAG 태그, Myc 태그, 말토스 결합 단백질 태그, 키틴 결합 단백질 태그, 및 형광 태그로부터 선택된다.
228. 구현예 206-227 중 어느 하나의 재조합 미생물 유기체에 있어서, 재조합 미생물 유기체는 하기 화학식의 2-케토 카르복실산을 생성할 수 있다:
(상기 화학식에서, R은 H, CH3, 또는 CH2OH임).
229. 구현예 206-228 중 어느 하나의 재조합 미생물 유기체에 있어서, 재조합 미생물 유기체는 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 생성시킬 수 있다.
230. 구현예 206-229 중 어느 하나의 재조합 미생물 유기체에 있어서, 재조합 미생물 유기체는 탄소원으로부터 피루베이트의 생성을 개선시키도록 유전자 변형된다.
231. 구현예 230의 재조합 미생물 유기체에 있어서, 탄소원은 글리세롤, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프룩토스, 수크로스, 및 전분, 또는 이의 조합으로부터 선택된다.
232. 구현예 206-231 중 어느 하나의 재조합 미생물 유기체의 개체군.
233. 구현예 232의 개체군에 있어서, 실질적으로 균질하다.
234. 적합한 조건 하에서 구현예 232 또는 구현예 233의 개체군을 배양하는 단계를 포함하는, 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 제조하는 방법.
235. 구현예 234의 방법에 있어서, 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 또는 6-히드록시 헥사노에이트를 배양물 또는 미생물 유기체로부터 단리시키는 단계를 더 포함한다.
236. 구현예 206-231 중 어느 하나의 재조합 미생물 유기체를 포함하는 배양물.
237. 구현예 232 또는 구현예 233의 개체군을 포함하는 배양물.
238. 피루베이트 및 알데히드를 알돌 생성물 생합성 폴리펩티드와 접촉시켜서 알돌 생성물을 생성시키는 단계를 포함하는 방법으로서,
알돌 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착된 히드록실 기를 포함하는 화합물이다.
239. 구현예 238의 방법에 있어서, 알데히드의 -CHO 기는 이중 결합, 삼중 결합 또는 방향족 기에 접합되지 않는다.
240. 피루베이트 및 지방족 알데히드를 알돌 생성물 생합성 폴리펩티드와 접촉시켜서 알돌 생성물을 생성시키는 단계를 포함하는 방법으로서,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착되는 히드록실 기를 포함하는 화합물이다.
241. 구현예 238-240 중 어느 하나의 방법에 있어서, 알돌 생성물 생합성 폴리펩티드는 알돌라제이거나 또는 그를 포함한다.
242. 구현예 238-241 중 어느 하나의 방법에 있어서, 알돌 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
243. 구현예 242의 방법에 있어서, 미생물은 알돌 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
244. 구현예 242-243 중 어느 하나의 구현예의 방법에 있어서, 미생물은 알돌 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
245. 구현예 242-244 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 알돌 생성물 생합성 폴리펩티드를 발현한다.
246. 구현예 238-245 중 어느 하나의 방법에 있어서, 피루베이트 및 지방족 알데히드의 알돌 생성물로의 전환은 알돌 생성물 생합성 폴리펩티드에 의해 촉매된다.
247. 구현예 238-246 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
248. 구현예 238-247 중 어느 하나의 방법에 있어서, 알돌 생성물을 알돌-탈수 생성물로 전환시키는 단계를 포함하고, 알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
249. 구현예 248의 방법에 있어서, 전환은 알돌 생성물을 탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함한다.
250. 구현예 248-249 중 어느 하나의 방법에 있어서, 탈수 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
251. 구현예 250의 방법에 있어서, 미생물은 탈수 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
252. 구현예 250-251 중 어느 하나의 구현예의 방법에 있어서, 미생물은 탈수 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
253. 구현예 250-252 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 탈수 생성물 생합성 폴리펩티드를 발현한다.
254. 구현예 248-253 중 어느 하나의 방법에 있어서, 알돌 생성물의 알돌-탈수 생성물로의 전환은 탈수 생성물 생합성 폴리펩티드에 의해 촉매된다.
255. 구현예 248-254 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
256. 구현예 249의 방법에 있어서, 탈수 생성물 생합성 폴리펩티드는 데히드라타제이다.
257. 피루베이트 및 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법으로서,
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
258. 구현예 257의 방법에 있어서, 알데히드의 -CHO 기는 이중 결합, 삼중 결합 또는 방향족 기에 접합되지 않는다.
259. 피루베이트 및 지방족 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
260. 구현예 257-259 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제이거나 또는 그를 포함한다.
261. 구현예 260의 방법에 있어서, 피루베이트 및 지방족 알데히드를 히드라타제-알돌라제와 접촉시키는 단계는 알돌-탈수 생성물을 생성시킨다.
262. 구현예 257-259 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34, 또는 EC 4.1.1.4를 갖는 효소이거나 또는 그를 포함하거나, 또는 표 1 및 5-8로부터 선택된다.
263. 구현예 257-259 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 구현예 262의 효소와 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 95%, 99% 이상의 상동성을 공유하는 폴리펩티드이거나 또는 그를 포함한다.
264. 구현예 257-259 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 알돌라제이거나 또는 그를 포함한다.
265. 구현예 257-264 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
266. 구현예 265의 방법에 있어서, 미생물은 알돌-탈수 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
267. 구현예 265-266 중 어느 하나의 구현예의 방법에 있어서, 미생물은 알돌-탈수 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
268. 구현예 265-267 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 알돌-탈수 생성물 생합성 폴리펩티드를 발현한다.
269. 구현예 257-268 중 어느 하나의 방법에 있어서, 피루베이트 및 지방족 알데히드의 알돌-탈수 생성물로의 전환은 알돌-탈수 생성물 생합성 폴리펩티드에 의해 촉매된다.
270. 구현예 257-269 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
271. 알켄을 알켄 환원 생성물 생합성 폴리펩티드와 접촉시켜서 알켄 환원 생성물을 생성시키는 단계를 포함하는 방법으로서,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고,
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어서 알켄 환원 생성물을 제공한다.
272. 구현예 271의 방법에 있어서, 알켄은 구현예 257-270 중 어느 하나의 알돌-탈수 생성물이다.
273. 구현예 271-272 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 2-옥소-3-에노산 또는 이의 염의 환원을 촉매하는 효소이거나 또는 그를 포함한다.
274. 구현예 271-272 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 EC 1.6.5에 속하는 효소이거나 또는 그를 포함한다.
275. 구현예 271-272 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 EC 1.6.5.5에 속하는 효소이거나 또는 그를 포함하거나, 또는 표 9로부터 선택된다.
276. 구현예 271-272 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 구현예 274-275 중 어느 하나의 효소와 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 95%, 99% 이상의 상동성을 공유하는 폴리펩티드이거나 또는 그를 포함한다.
277. 구현예 271-276 중 어느 하나의 방법에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
278. 구현예 277의 방법에 있어서, 미생물은 알켄 환원 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
279. 구현예 277-278 중 어느 하나의 구현예의 방법에 있어서, 미생물은 알켄 환원 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
280. 구현예 277-279 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 알켄 환원 생성물 생합성 폴리펩티드를 발현한다.
281. 구현예 271-280 중 어느 하나의 방법에 있어서, 알켄의 알켄 환원 생성물로의 전환은 알켄 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
282. 구현예 271-281 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
283. 구현예 238-270 중 어느 하나의 방법에 있어서, 구현예 271-282 중 어느 하나의 방법을 포함한다.
284. 구현예 238-283 중 어느 하나의 방법에 있어서, 알데히드는 하기 화학식 A-1의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-C(O)H
A-1
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원가를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
285. 구현예 238-256 및 284 중 어느 하나의 방법에 있어서, 알돌 생성물은 화학식 P-1의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH(OH)-CH2-C(O)-C(O)OH,
P-1
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
286. 구현예 257-285 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물은 하기 화학식 P-2의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH=CH-C(O)-C(O)OH,
P-2
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
287. 구현예 286의 방법에 있어서, -CH=CH- 는 E 입체배열이다.
288. 구현예 286의 방법에 있어서, -CH=CH- 는 Z 입체배열이다.
289. 구현예 271-288 중 어느 하나의 방법에 있어서, 알켄 환원 생성물은 하기 화학식 P-3의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-C(O)-C(O)OH,
P-3
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
290. 구현예 238-284 중 어느 하나의 방법에 있어서, 알켄 환원 생성물을 하기 화학식 P-10의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-10
291. 구현예 238-284 중 어느 하나의 방법에 있어서, 알켄 환원 생성물을 하기 화학식 P-10'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-CH2-OH,
P-10'
292. 구현예 283-291 중 어느 하나의 방법에 있어서, 알켄 환원 생성물을 카르보닐 환원 생성물로 전환시키는 단계를 포함하고,
알켄 환원 생성물은 카르보닐 기를 포함하고;
알켄 환원 생성물의 카르보닐 기는 -CH(OH)- 로 전환된다.
293. 구현예 283-291 중 어느 하나의 방법에 있어서, 알켄 환원 생성물을 카르보닐 환원 생성물 생합성 폴리펩티드과 접촉시켜서 카르보닐 환원 생성물을 생성시키는 단계를 포함하고,
알켄 환원 생성물은 카르보닐 기를 포함하고;
알켄 환원 생성물의 카르보닐 기는 -CH(OH)- 로 전환된다.
294. 구현예 293의 방법에 있어서, 카르보닐 환원 생성물 생합성 폴리펩티드는 케토 리덕타제 또는 2-케토 산 -2-리덕타제이거나 또는 그를 포함한다.
295. 구현예 293-294 중 어느 하나의 방법에 있어서, 카르보닐 환원 생성물 생합성 폴리펩티드는 미생물 중에 존재한다.
296. 구현예 295의 방법에 있어서, 미생물은 카르보닐 환원 생성물 생합성 폴리펩티드를 코딩하는 외생성 핵산을 함유하도록 조작된다.
297. 구현예 295-296 중 어느 하나의 구현예의 방법에 있어서, 미생물은 카르보닐 환원 생성물 생합성 폴리펩티드의 조절된 수준을 발현한다.
298. 구현예 295-297 중 어느 하나의 구현예의 방법에 있어서, 미생물은 조작된 카르보닐 환원 생성물 생합성 폴리펩티드를 발현한다.
299. 구현예 290-298 중 어느 하나의 방법에 있어서, 알켄 환원 생성물의 카르보닐 환원 생성물로의 전환은 카르보닐 환원 생성물 생합성 폴리펩티드에 의해 촉매된다.
300. 구현예 290-299 중 어느 하나의 방법에 있어서, 방법은 배양물 중에서 수행된다.
301. 구현예 290-300 중 어느 하나의 방법에 있어서, 카르보닐 환원 생성물은 하기 화학식 P-4의 구조 또는 이의 염을 갖는다:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)OH
P-4
상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이다.
302. 구현예 238-301 중 어느 하나의 방법에 있어서, 화학식 P-4의 화합물 또는 이의 염을 하기 화학식 P-5의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)-S-CoA
P-5
303. 구현예 302의 방법에 있어서, 전환은 화학식 P-4의 화합물 또는 이의 염을 CoA 전달 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
304. 구현예 238-303 중 어느 하나의 방법에 있어서, 화학식 P-5의 화합물 또는 이의 염을 하기 화학식 P-6의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH=CH-C(O)-S-CoA
P-6
305. 구현예 304의 방법에 있어서, 전환은 화학식 P-5의 화합물 또는 이의 염을 탈수 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
306. 구현예 238-305 중 어느 하나의 방법에 있어서, 화학식 P-6의 화합물 또는 이의 염을 하기 화학식 P-7의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-S-CoA
P-7
307. 구현예 306의 방법에 있어서, 전환은 화학식 P-6의 화합물 또는 이의 염을 2,3-에노일-CoA 리덕타제이거나 또는 그를 포함하는 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
308. 구현예 238-307 중 어느 하나의 방법에 있어서, 화학식 P-7의 화합물 또는 이의 염을 하기 화학식 P-8의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-OH
P-8
309. 구현예 308의 방법에 있어서, 전환은 화학식 P-7의 화합물 또는 이의 염을 CoA 전달 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
310. 구현예 238-309 중 어느 하나의 방법에 있어서, 화학식 P-8의 화합물 (식에서, L2 는 -CH2-L2'- 임), 또는 이의 염을 하기 화학식 P-9의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
H-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-9
상기 화학식에서,
L2' 은 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-19 지방족 또는 C1-19 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O-에 의해 치환된다.
311. 구현예 310의 방법에 있어서, 전환은 화학식 P-8의 화합물 또는 이의 염을 알콜 데히드로게나제이거나 또는 그를 포함하는 산화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
312. 구현예 238-311 중 어느 하나의 방법에 있어서, 화학식 P-9의 화합물 또는 이의 염을 하기 화학식 P-10의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-10
313. 구현예 312의 방법에 있어서, 전환은 화학식 P-9의 화합물 또는 이의 염을 알데히드 산화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
314. 구현예 238-312 중 어느 하나의 방법에 있어서, 화학식 P-8의 화합물 또는 이의 염을 하기 화학식 P-9'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-C(O)-H
P-9'
315. 구현예 314의 방법에 있어서, 화학식 P-8의 화합물 또는 이의 염을 카르복실 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
316. 구현예 238-315 중 어느 하나의 방법에 있어서, 화학식 P-9'의 화합물 또는 이의 염을 화학식 P-10'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-CH2-OH
P-10'
317. 구현예 316의 방법에 있어서, 화학식 P-9'의 화합물 또는 이의 염을 알데히드 리덕타제 또는 1차 알콜 데히드로게나제이거나 또는 그를 포함하는 알데히드 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
318. 구현예 238-290 중 어느 하나의 방법에 있어서, 화학식 P-3의 화합물 또는 이의 염을 하기 화학식 P-5'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-OH
P-5'
319. 구현예 238-290 또는 318 중 어느 하나의 방법에 있어서, 화학식 P-3의 화합물 또는 이의 염을 화학식 P-4'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-C(O)-H
P-4'
320. 구현예 319의 방법에 있어서, 화학식 P-3의 화합물 또는 이의 염을 탈카르복실화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
321. 구현예 238-290 중 어느 하나의 방법에 있어서, 화학식 P-4'의 화합물 또는 이의 염을 화학식 P-5'의 화합물 또는 이의 염으로 전환시키는 단계를 포함한다:
Ra-L2-L1-CH2-CH2-CH2-OH
P-5'
322. 구현예 321의 방법에 있어서, 화학식 P-4'의 화합물 또는 이의 염을 알데히드 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
323. 구현예 301-322 중 어느 하나의 방법에 있어서, 하나 이상의 각각의 전환은 독립적으로 화합물을 적합한 생합성 폴리펩티드와 접촉시키는 단계를 포함한다.
324. 구현예 323의 방법에 있어서, 하나 이상 또는 모든 생합성 폴리펩티드는 독립적으로 미생물 중에 존재한다.
325. 구현예 324의 방법에 있어서, 미생물은 하나 이상 또는 모든 생합성 폴리펩티드를 코딩하는 하나 이상의 외생성 핵산을 함유하도록 조작된다.
326. 구현예 324-325 중 어느 하나의 구현예의 방법에 있어서, 미생물은 하나 이상 또는 모든 생합성 폴리펩티드의 조절된 수준을 발현한다.
327. 구현예 324-326 중 어느 하나의 구현예의 방법에 있어서, 하나 이상 또는 모든 생합성 폴리펩티드는 독립적으로 조작된다.
328. 구현예 324-326 중 어느 하나의 방법에 있어서, 적합한 생합성 폴리펩티드는 해당 전환을 촉매한다.
329. 구현예 285-328 중 어느 하나의 방법에 있어서, Ra 는 -H 이다.
330. 구현예 285-328 중 어느 하나의 방법에 있어서, Ra 는 -OH 이다.
331. 구현예 285-330 중 어느 하나의 방법에 있어서, L1 은 임의 치환된 C1-6 알킬렌이다.
332. 구현예 285-330 중 어느 하나의 방법에 있어서, L1 은 미치환된 C1-6 알킬렌이다.
333. 구현예 331-332 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2- 이다.
334. 구현예 331-332 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2CH2- 이다.
335. 구현예 331-332 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2CH2CH2- 이다.
336. 구현예 285-330 중 어느 하나의 방법에 있어서, L1 은 공유 결합이다.
337. 구현예 285-336 중 어느 하나의 방법에 있어서, L2 는 공유 결합이다.
338. 구현예 285-336 중 어느 하나의 방법에 있어서, L2 는 임의 치환된 C1-6 알킬렌이다.
339. 구현예 285-336 중 어느 하나의 방법에 있어서, L2 는 미치환된 C1-6 알킬렌이다.
340. 구현예 338-339 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2- 이다.
341. 구현예 338-339 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2CH2- 이다.
342. 구현예 338-339 중 어느 하나의 방법에 있어서, 알킬렌은 -CH2CH2CH2- 이다.
343. 구현예 284의 방법에 있어서, 지방족 알데히드는 HO-CH2-CH2-CHO 이다.
344. 구현예 285 또는 343의 방법에 있어서, 알돌 생성물은 HO-CH2-CH2-CH(OH)-CH2-C(O)-COOH 또는 이의 염이다.
345. 구현예 286 및 343-344 중 어느 하나의 방법에 있어서, 알돌-탈수 생성물은 HO-CH2-CH2-CH=CH-C(O)-COOH 또는 이의 염이다.
346. 구현예 289 및 343-345 중 어느 하나의 방법에 있어서, 알켄 환원 생성물은 HO-CH2-CH2-CH2-CH2-C(O)-COOH 또는 이의 염이다.
347. 구현예 301 및 343-346 중 어느 하나의 방법에 있어서, 카르보닐 환원 생성물은 HO-CH2-CH2-CH2-CH2-CH(OH)-COOH 또는 이의 염이다.
348. 구현예 302 및 343-347 중 어느 하나의 방법에 있어서, 화학식 P-5의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH(OH)-CO-S-CoA 또는 이의 염이다.
349. 구현예 303 및 343-348 중 어느 하나의 방법에 있어서, 화학식 P-6의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH=CH-CO-S-CoA 또는 이의 염이다.
350. 구현예 305 및 343-349 중 어느 하나의 방법에 있어서, 화학식 P-7의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CO-S-CoA 또는 이의 염이다.
351. 구현예 308 및 343-350 중 어느 하나의 방법에 있어서, 화학식 P-8의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염이다.
352. 구현예 310 및 343-351 중 어느 하나의 방법에 있어서, 화학식 P-9의 화합물 또는 이의 염은 H-C(O)-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염이다.
353. 구현예 312 및 343-352 중 어느 하나의 방법에 있어서, 화학식 P-10의 화합물 또는 이의 염은 HO-CO-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염이다.
354. 구현예 310 및 343-351 중 어느 하나의 방법에 있어서, 화학식 P-9'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-C(O)-H 또는 이의 염이다.
355. 구현예 312 및 343-351 및 354 중 어느 하나의 방법에 있어서, 화학식 P-10'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CH2-OH 또는 이의 염이다.
356. 구현예 317 및 343-346 중 어느 하나의 방법에 있어서, 화학식 P-4'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-C(O)-H 또는 이의 염이다.
357. 구현예 317 및 343-346 및 356 중 어느 하나의 방법에 있어서, 화학식 P-5'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-OH 또는 이의 염이다.
358. 구현예 238-357 중 어느 하나의 방법에 있어서, 미생물은 접촉 단계에서 둘 이상의 생합성 폴리펩티드를 포함한다.
359. 구현예 238-358 중 어느 하나의 방법에 있어서, 한 유형의 미생물 중에서 하나 이상의 접촉 및/또는 전환 단계, 및 다른 유형의 미생물 중에서 하나 이상의 다른 접촉 및/또는 전환 단계를 수행하는 단계를 포함한다.
360. 구현예 238-359 중 어느 하나의 방법에 있어서, 한 배양물 중에서 하나 이상의 접촉 및/또는 전환 단계, 및 다른 배양물 중에서 하나 이상의 다른 접촉 및/또는 전환 단계를 수행하는 단계를 포함한다.
361. 구현예 238-359 중 어느 하나의 방법에 있어서, 단일 배양물 중에서 접촉 및/또는 전환 단계를 수행하는 단계를 포함한다.
362. 구현예 238-361 중 어느 하나의 방법에 있어서, 미생물은 접촉 단계에서 언급된 모든 생합성 폴리펩티드를 포함한다.
363. 구현예 362의 방법에 있어서, 단일 배양물 중에서 접촉 및/또는 전환 단계를 수행하는 단계를 포함한다.
364. 전술한 구현예 중 어느 하나의 방법에 있어서, 생성물은 약 또는 적어도 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L의 배양물로 생성된다.
365. 전술한 구현예 중 어느 하나의 방법에 있어서, 바람직한 생성물에 대한 피루베이트 이용성은 약 또는 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 이다.
366. 전술한 구현예 중 어느 하나의 방법에 의해 제조되는 조제물.
367. 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염의 조제물, 또는 전술한 구현예 중 어느 하나의 방법으로 제조된 조제물로서, 조제물은 화합물의 기준 조제물에서 관찰된 것에 비해 14C 동위원소에 대해 농축되고, 기준 조제물은 화석 탄소원을 사용해 제조된다.
368. 폴리에스테르, 폴리에스테르 폴리올, 폴리우레탄, 나일론 6, 나일론 6,6, 폴리카르보네이트 디올, 디아크릴레이트 에스테르, 또는 디글리시딜 에테르의 조제물로서, 조제물은 전술한 구현예 중 어느 하나의 방법으로 제조된 조제물을 사용해 제조된다.
369. 구현예 368의 조제물에 있어서, 조제물은 화합물의 기준 조제물에서 관찰된 것에 비해서 14C 동위원소에 대해 농축되고, 기준 조제물은 화석 탄소원을 사용해 제조된다.
370. 전술한 구현예 중 어느 하나의 하나 이상의 생합성 폴리펩티드를 코딩하는 핵산.
371. 구현예 370의 핵산에 있어서, 핵산은 동일한 생합성 폴리펩티드를 코딩하는 천연 핵산과 상이하다.
372. 구현예 370 또는 371의 핵산에 있어서, 핵산은 미생물에서 발현을 위해 최적화된다.
373. 지방족 알데히드의 알돌 생성물을 생성시키는 조작된 미생물로서, 미생물은 알돌 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 카르보닐 기의 베타-탄소에 부착된 히드록실 기를 포함하는 화합물이다.
374. 구현예 373의 미생물에 있어서, 지방족 알데히드는 구현예 238-363 중 어느 하나에 기술된다.
375. 구현예 373의 미생물에 있어서, 알돌 생성물은 구현예 238-363 중 어느 하나에 기술된다.
376. 지방족 알데히드의 알돌-탈수 생성물을 생성시키는 조작된 미생물로서, 미생물은 알돌 생성물 생합성 폴리펩티드, 알돌-탈수 생성물 생합성 폴리펩티드, 탈수 생성물 생합성 폴리펩티드, 또는 이의 임의 조합의 증가된 발현 또는 활성을 포함하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물이다.
377. 구현예 376의 미생물에 있어서, 지방족 알데히드는 구현예 238-363 중 어느 하나에 기술된다.
378. 구현예 376의 미생물에 있어서, 알돌-탈수 생성물은 구현예 238-363 중 어느 하나에 기술된다.
379. 알켄 환원 생성물을 생성시키는 조작된 미생물로서, 미생물은 알켄 환원 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하고,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고,
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어 알켄 환원 생성물을 제공한다.
380. 구현예 379의 미생물에 있어서, 알켄은 구현예 271-363 중 어느 하나에 기술된다.
381. 구현예 379의 미생물에 있어서, 알켄 환원 생성물은 구현예 238-363 중 어느 하나에 기술된다.
382. 구현예 373-381 중 어느 하나의 미생물에 있어서, 구현예 271-363 중 어느 하나의 생합성 폴리펩티드의 증가된 발현 또는 활성을 더 포함한다.
383. 구현예 238-382 중 어느 하나의 미생물, 및 독립적으로 식 P-1 내지 P-10, P-9', P-10', P-4' 또는 P-5'의 하나 이상의 화합물, 또는 이의 염을 포함하는 배양물.
384. 구현예 383의 배양물에 있어서, 하나 이상의 화합물은 독립적으로 생합성 폴리펩티드(들)의 증가된 발현 또는 활성이 없는 비슷한 미생물의 기준 배양물과 비교하여 더 높은 수준이다.
385. 구현예 383-384 중 어느 하나의 배양물에 있어서, 식 P-1 내지 P-10, P-9', P-10', P-4' 또는 P-5'의 화합물의 각각, 또는 이의 염은 독립적으로 구현예 238-363 중 어느 하나에 기술된 바와 같다.
386. 본 명세서에 기술된 바와 같은 방법, 조제물, 화합물, 유기체, 미생물, 배양물, 또는 생성물.
실시예
하기 실시예는 개시된 대상 주제에 따라 방법 및 결과를 예시하기 위해 하기에 기재된다. 이들 실시예는 본 명세서에 개시된 대상 주제의 모든 양태를 포괄하려는 의도는 아니지만, 그 보다는 소정 대표적인 방법 및 결과를 예시하려는 것이다. 이들 실시예는 당업자에게 자명한 본 명세서에 기술된 대상 주제의 균등물 및 변이를 배제하려는 의도가 아니다. 실시예 전반에서, 효소 또는 단백질의 서열은 그들의 Uniprot ID 또는 그들의 GenBank 등록 번호 (GenBank ID 또는 GenBank 등록 No.라고 지칭) 또는 그들의 RefSeq ID를 통해서 확인된다. Uniprot ID의 경우에, 서열은 최초 (인용가능) 등록 번호로 표시된다. RefSeq 단백질 기록은 NCBI 데이터베이스 내 비-중복 단백질 서열을 나타낸다. 비-중복 단백질 기록은 상이한 균주 또는 종에서 1회 또는 다수회 관찰된 하나의 정확한 서열을 나타낸다.
실시예 1: 지방족 알데히드를 사용하는 알돌-탈수 생성물 생합성을 촉매하는 효소.
본 명세서에서 누적하여 히드라타제-알돌라제 또는 Ads-Hyd로서 지칭되는, 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 (EC 4.1.2.45)1-5 또는 4-(2-카르복시페닐)-2-옥소부트-3-에노에이트 알돌라제 (E.C. 4.1.2.34; 트랜스-2'-카르복시벤잘피루베이트 히드라타제-알돌라제라고도 함)6 는 지방족 알데히드1-6, 특히 알데히드 기 옆에 임의의 불포화가 없는 것들5 에 대해 임의의 알돌 부가 또는 알돌 축합 활성을 보유한다는 것은 이전에 입증되지 않았다. 대신에, 이들 효소의 알돌 축합 활성은 이전에 기질에 제한적이었고, 여기서 새롭게 형성된 불포화는 알데히드 기질1-5 내에 존재하는 불포화에 대한 접합을 통해서 안정화될 수 있다. 이러한 알데히드 기질의 예는 방향족 접합된 알데히드 예컨대 벤즈알데히드 또는 알케날 (즉, C2 및 C3 사이에 이중 결합을 갖는 지방족 알데히드)을 포함한다. 이들 히드라타제-알돌라제는 수많은 지방족 알데히드, 예를 들어, 상이한 탄소 길이 및 상이한 기능성의 선형 알데히드를 기질로서 이용할 수 있고, 임의의 이론에 국한하고자 하는 의도없이, 해당 4-히드록시-2-케토-카르복실산 및 3,4-데히드로-2-케토-카르복실산을 각각 생성물로서 제공하기 위해 도너 (친핵성)로서 피루베이트와 알돌 부가 및 알돌 축합 반응 둘 모두의 수행을 통해, 알돌-탈수 생성물을 제공할 수 있다는 것을 예상치 않게 발견하였다. 대표적인 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제 (예를 들어, 표 1에 등재된 Ads-Hyd 2 & 9) 및 트랜스-2'-카르복시벤잘피루베이트 히드라타제-알돌라제 (예를 들어, 표 1에 등재된 Ads-Hyd 3)에 대한 결과는 알돌-탈수 활성 (알돌 부가 및 알돌 축합)에 대해 표 1에 요약되어 있고, 피루베이트는 도너로서 사용되고 아세트알데히드, 프로피온알데히드, 및 3-히드록시-프로파날은 억셉터 알데히드로서 사용된다.
표 1의 효소의 서브세트에 의한 상이한 탄소 길이 및 기능성의 지방족 비접합 알데히드에 대한 알돌 부가 및 알돌 축합 활성은 표 2에 요약되고, 이러한 반응에 적합한 비접합 알데히드 기질의 다재다능성을 더욱 입증한다.
특히, 기술은 예를 들어, 기질, 예를 들어, 피루베이트의 생성물의 생성 속도, 수율, 및/또는 이용성의 관점에서, 높은 효율을 제공한다. 일부 구현예에서, 생합성 폴리펩티드는 관련 기준 생합성 폴리펩티드와 비교하여, 적합한 조건 하에서 비슷한 생성물의 생성으로 측정하여, 약 50%, 100%, 또는 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100배 이상 활성이 있다. 일부 구현예에서, 본 개시는 기질, 예를 들어, 피루베이트의 고도로 효율적인 이용성을 제공한다. 일부 구현예에서, 기질, 예를 들어, 피루베이트의 이용성은 약 또는 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 이다. 일부 구현예에서, 배양물 중 바람직한 생성물 농도는 생성 시간 (예를 들어, 90분)의 기간 이후에 약 또는 적어도 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 g/L 이다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 예를 들어, 표 3은 해당 반응을 촉매하는 것으로 이전에 알려진 알돌라제와 비교하여 제공된 기술의 효율을 극적으로 개선시켰다는 것을 입증한다: 표 3의 대표적인 트랜스-o-히드록시벤질리덴피루베이트 히드라타제-알돌라제는 시험된 기질에 대한 알돌 부가 활성의 관점에서 다른 알돌라제를 능가한다 (예를 들어, >5배 활성). 특히, 표 4는 Ads-Hyd 효소가 비교 알돌라제와 비교하여 기질 피루베이트의 고도의 효율적인 이용성을 비롯하여 개선된 생성물 수율을 제공할 수 있다는 것을 입증하였다. 이것은 피루베이트가 중심 대사산물이고 미생물 내에서 다른 반응에 의해 소모될 수 있므로 특히 주목할만하다. 본 명세서에서 입증된 바와 같이, 알돌-탈수 생성물 생합성 폴리펩티드를 포함하는 제공된 기술은 생체내에서 바람직한 생성물 수율을 개선시키는데 핵심적인, 비바람직한 반응에 의한 생체내 피루베이트 소모를 효율적으로 최소화시킬 수 있다.
소수의 히드라타제-알돌라제가 EC 4.1.2.45 또는 EC 4.1.2.34에 속하는 것으로 분류되었지만 (표 5 참조), 표 1에 보고된 대부분의 효소 서열 및 상동성 검색으로 확인된 서열 (BLAST 사용; 표 6-8 참조)은 EC 번호를 지정하지 않았다. 추가로, 이들 효소는 또한 문헌 또는 데이터베이스 (예를 들어, Uniprot)에서 이들 다른 클래스의 효소와 유사성에 기인하여 아세토아세테이트 데카르복실라제 또는 디히드로디피콜리네이트 신써타제 또는 단순히 알돌라제로서 주석이 달렸다. 예를 들어, Ads-Hyd 8 효소는 히드라타제-알돌라제로서 주석이 달리지 않고, 히드라타제-알돌라제로서 기능할 때 아세토아세테이트 데카르복실라제인 것으로 주석이 달린다 (이 서열에 대한 Uniprot 페이지 참조) (표 1 참조). 유사하게, Ads-Hyd 11-13 효소는 디히드로디피콜리네이트 신써타제로서 주석이 달렸었지만, 그들은 히드라타제-알돌라제로서 기능한다 (표 1 참조). 많은 히드라타제-알돌라제 효소 서열은 공공 데이터베이스에서 아세토아세테이트 데카르복실라제 또는 디히드로디피콜리네이트 신써타제 또는 알돌라제에 속하는 것으로 주석 달리거나 또는 추론되거나 또는 그렇게 될것이며 EC 4.1.2.45 또는 EC 4.1.2.34에 속하는 것으로 분류되지 않는다는 것이 예상된다. 따라서, 히드라타제-알돌라제 효소 서열을 확인하기 위해서, 히드라타제-알돌라제 서열에 대한 상동성-기반 검색이 수행되었고, 최종 효소는 본 명세서에 기술된 방법을 사용해 그들 활성에 관해 이후에 검증되었다. (a) EC 4.1.2.34에 속하는 하나의 서열 (Ads-Hyd 3; 표 8의 결과); (b) EC 4.1.2.34 및 EC 4.1.2.45에 속하는 효소와 극도로 낮은 상동성을 갖는 미지정된 효소에 속하는 하나의 서열 (Ads-Hyd 8; 표 6의 결과) 및 (c) EC 4.1.2.34 및 EC 4.1.2.45에 속하는 효소와 중간도 상동성을 보이는 미지정 효소에 속하는 하나의 서열 (Ads-Hyd 10; 표 7의 결과)을 사용하는 예시적인, 상동성-기반 검색은 >500 효소를 밝혀주었고, 이의 일부는 하기 표에 열거되어 있으며, 이들 중 많은 것들이 시험 시에 알돌 부가 및 축합에 대해 활성이 있는 것으로 확인되었다 (표 1의 데이터). 예를 들어, 표 6에서 확인된 13개 서열 (표 1의 서열에 대한 데이터와 표 6의 밑줄표시된 서열 참조), 및 표 7에서 확인된 11개 서열 (표 1의 서열에 대한 데이터와 표 7의 밑줄표시된 서열 참조)은 기능성 Ads-Hyd 효소로서 확인되었다. 특히, 본 개시는 E.C 4.1.1.4에 속하는 것으로 분류되고 아세테토아세테이트 데카르복실라제로서 주석이 달린, Ads-Hyd 112는 또한 수많은 상이한 알데히드에 의해 알돌 부가 및 알돌 축합 반응을 촉매하는 것으로 확인되었다는 것이 입증되었다 (표 2). 일부 구현예에서, 아세토아세테이트 데카르복실라제로서 주석달린 효소뿐만 아니라 E.C 4.1.1.4에 속하는 것들은 역시 알돌 축합 및 부가 반응을 촉매하는데 유용하다. EC 4.1.2.34에 속하는 Ads-Hyd 3, EC 4.1.2.45에 속하는 Ads-Hyd 2, 및 Ads-Hyd 8 효소에 대해서 각각 35% (표 1의 Ads-Hyd 68), 38% (표 1의 Ads-Hyd 3) 및 49% (표 1의 Ads-Hyd 93) 만큼 낮은 범위의 동일성을 갖는 효소들이 히드라타제-알돌라제 활성을 갖는 것으로 확인되었다.
클로닝, 및 발현: 이종성 알돌라제 히드라타제 효소를 코딩하는 DNA는 이. 콜라이에서 발현을 위해 코돈-최적화되었고 상업적 DNA 합성 회사가 합성하였다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 pB11 골격 플라스미드의 T7 RNA 중합효소 프로모터의 하류 및 T7 종결자 서열의 상류에 클로닝되었다. 추가로, 선택된 알데히드가 3-히드록시-프로피온알데히드인 실험 경우에, B12-의존적 효소 (하기와 같은 5종 유전자를 포함하는 락토코쿠스 류테리 (Lactococcus reuteri) 글리세롤 데히드라타제: pduC [Uniprot ID No. A5VMB2]; pduD [Uniprot ID No. A5VMB1]; pduE [Uniprot ID No. A5VMB0]; pduG [Uniprot ID No. A5VMA9]; 및 pduH [Uniprot ID No. A5VMA8])인 글리세롤 데히드라타제 효소는 또한 이 효소를 사용해 글리세롤로부터 3-히드록시-프로피온알데히드를 생성시킬 수 있도록 제2의 상용성 플라스미드에 클로닝되었다. 플라스미드는 이. 콜라이 BL21*(DE3)ΔldhA를 형질전환시켰다. 각 클론에 대한 출발 배양물을 1 g/L D-글루코스 및 적절한 항생제가 존재하는 5 mL 2xYT 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현을 위한 세포 배양물은 96웰 플레이트 중 2 mL 성장 배지에서 수행하였다. 복합 (2xYT) 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 100 mg/L 철 암모늄 시트레이트가 보충되었다. 유도-전 성장은 호기성 조건 하에 30℃에서 2시간 동안 수행하였다. 재조합 단백질 발현은 250 μM IPTG로 0.2-0.4의 OD600에서 유도시켰다. 유도-후 발현은 30-180분 동안 30℃에 호기성 조건 하에서 수행한 이후에 0-60분 동안 혐기성 조건 하에서 수행하였다.
효소 어세이: 발현 후에, 세포를 회수하였고 반응을 위한 기질과 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 0.4 mL의 신선한 배지 (OD600 ∼30)에 재현탁시켰다. 활성 결정을 위해서, 피루베이트 (10 - 20 g/L)는 5 - 40 g/L 알데히드 (예를 들어, 아세트알데히드, 프로피온알데히드, 부티르알데히드, 2-히드록시-아세트알데히드, 또는 4-히드록시-부티르알데히드)와 12시간 동안 호기적으로 인큐베이션시켰다. 3-히드록시-프로파날을 사용해 활성 결정을 위해, 발현 후 세포를 회수하였고 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)와 10-20 g/L 글루코스, 5-10 g/L 글리세롤, 및 10 g/L 피루베이트를 함유하는 0.4 mL의 신선한 배지 (OD600 ∼30)에 15시간 동안 혐기성 조건 하에 재현탁시켰다. 반응 믹스는 또한 10 μM 비타민 B12 및 1 g/L 글루타티온이 보충되었다. 실온에서 인큐베이션 후에, 세포를 원심분리하였고, 상청액을 여과하고 HPLC로 분석하였다.
생성물의 분석: 등용매 HPLC를 주로 사용하여 효소 생성물, 알돌 부가 생성물 (4-히드록시-2-케토-카르복실산), 알돌 축합 생성물 (3,4-데히드로-2-케토-카르복실산)의 생성을 검출하고 정량하였다. 한 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.05% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 이의 후자는 210 nm 및 260 nm에서 신호를 측정하는데 사용되었다. 추가로, 알돌 부가 및 알돌 축합 생성물은 HPLC를 통해 이전에 확인된 개별 피크의 질량을 측정하여, LC-MS를 통해서도 확인하였다 (본 명세서에 데이터 미포함).
실시예 2: 알돌-탈수 생성물의 환원을 촉매하는 효소.
본 명세서에서 입증되는 바와 같이, 활성화된 이중 결합, 즉, 카르보닐 또는 카르복실레이트 기 옆의 이중 결합의 환원은 효소에 의해 촉매될 수 있다. 알돌-탈수 생성물, 예를 들어, 2-옥소-3-에노산은 효소를 사용해 더 환원되어서 해당 2-옥소-카르복실산을 제공할 수 있다. 퀴논의 환원을 위해 NADH 및/또는 NADPH를 이용하는 EC 1.6.5 (예를 들어, EC 1.6.5.5)에 속하는 옥시도리덕타제는 이러한 반응을 촉매할 수 있다는 것을 예상치않게 발견하였다. 예를 들어, Ads-Hyd 효소 (실시예 1 참조)가 실시예 1에 기술된 바와 같이 2-케토-카르복실산의 생성을 위한 이. 콜라이 BL21 또는 이. 콜라이 MG1655 균주에서 재조합적으로 발현되었을 때, Ads-Hyd 효소 생성물 (즉, 2-옥소-3-에노산)의 일부분이 해당 2-케토-카르복실산으로 전환되었다는 것을 발견하였다. 이것은 이들 이. 콜라이 균주 내에서 일부 천연적으로 발현된 효소 또는 효소들이 2-옥소-3-에노산의 환원의 수행을 담당하였다는 가능성을 야기하였다. 이들 균주 내에서 활성화된 이중 결합의 환원을 생각한대로 수행할 수 있는 기지 옥시도리덕타제 (즉, EC 1.3.- 내지 EC 1.6.-)의 조사가 수행되었다. 17종의 이러한 유망한 효소가 각각 이. 콜라이 MG1655 및 이. 콜라이 BL21 내에서 확인되었다. 이들 숙주 둘 모두에서 이들 효소 각각에 대한 녹아웃 균주는 당분야에 공지된 방법을 사용해 제조되었다. 이후에 각각의 이러한 녹아웃 균주는 상기 기술된 방법을 사용하고 재조합적으로 발현된 Ads-Hyd 효소를 사용해 2-옥소-3-에노산 및 2-케토-카르복실산의 이의 생성물 둘 모두를 생성시키는 이의 능력에 대해 시험되었다. 이것은 qorA 유전자 또는 퀴논 옥시도리덕타제-1의 녹아웃이 2-옥소-3-에노산의 생성을 초래하였지만 2-케토-카르복실산은 그렇지 않았다는 확인을 이끌었다. 이것은 qorA에 의해 코딩되는 효소가 아마도 이 반응을 천연적으로 수행하는 것을 담당하였음을 확인하였다. 이후에, N-말단 His6 태그화 QorA 효소를 과발현시키고 정제하였으며, 실제로 바람직한 반응을 수행하는데 활성이 있었다는 것을 확인하였다 (도 6). 이것은 EC 1.6.5 (예를 들어, EC 1.6.5.5)에 속하는 이. 콜라이 유래의 퀴논 옥시도리덕타제 효소가 환형 구조인, 그들 천연 기질과 매우 상이한 기질에 대해 기능할 수 있다는 것을 분명하게 최초로 확인하였다. 더 나아가서, 이 효소는 생물생성 동안 호기성 및 혐기성 조건 하에 이러한 효소를 이용할 수 있으므로, 매우 유리한, 반응 동안 보조인자로서 NADH 및 NADPH 둘 모두를 이용할 수 있다는 것을 확인하였다 (도 6).
EC 1.6.5에 속하는 다양한 생합성 폴리펩티드는 본 개시에 따라서, 예를 들어, 알켄 환원 생성물 생합성 폴리펩티드로서 및/또는 알돌-탈수 생성물의 환원을 위해서, 이용될 수 있다. 예를 들어, EC 1.6.5.5의 다수의 퀴논 옥시도리덕타제는 이. 콜라이 Qor-1 효소와 그의 동일성이 37-90% 범위인 18종 효소 (표 9 참조)를 포함하여, 본 개시에 따라서 그들 활성에 대해 평가되었다. 선택된 모든 효소는 적어도 하나의 기질에 대해 활성인 것으로 확인되었고 (표 9), 이러한 반응을 수행하기 위해 이러한 클래스의 효소의 일반성을 더욱 확인하였다.
다른 환원 생성물 생합성 폴리펩티드, 예를 들어, EC 1.6.5의 다양한 하위클래스에 속하는 것들, 예컨대 EC 1.6.5.5에 속하는 다양한 퀴논 옥시도리덕타제 효소가 또한 이러한 반응을 수행할 수 있다.
클로닝 및 발현: 표 5에 표시된 이종성 알돌라제 히드라타제 (Ads-Hyd 1) 및 퀴논 옥시도리덕타제 효소를 코딩하는 DNA는 이. 콜라이에서의 발현을 위해 코돈-최적화되었고 상업적 DNA 합성 회사가 합성하였다. 시험관내 활성 측정을 위해서, N-말단 His6 태그가 Qor-1 효소에 부가되었다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 단일 pB11 골격 플라스미드의 T7 RNA 중합효소 프로모터의 하류 및 T7 종결자 서열의 상류에 클로닝되었다. 추가로, 선택된 알데히드가 3-히드록시-프로피온알데히드인 실험의 경우에, B12-의존적 효소인 글리세롤 데히드라타제 효소 (하기와 같은 5종 유전자를 포함하는 락토코쿠스 류테리 글리세롤 데히드라타제: pduC [Uniprot ID No. A5VMB2]; pduD [Uniprot ID No. A5VMB1]; pduE [Uniprot ID No. A5VMB0]; pduG [Uniprot ID No. A5VMA9]; 및 pduH [Uniprot ID No. A5VMA8])를 또한 이 효소를 사용해 글리세롤로부터 3-히드록시-프로피온알데히드를 생성시킬 수 있도로 제2의 상용성 플라스미드에 클로닝되었다. 플라스미드로 이. 콜라이 BL21*(DE3) ΔldhA ΔqorA를 형질전환시켰다. 재조합 단백질 발현은 실시예 1에서 상기 기술된 바와 같이 수행되었다. 시험관내 연구를 위해서, Qor-1 효소는 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도시켰다. 유도-후 발현은 180분 동안 30℃에 호기성 조건 하에서 수행하였다. 유도 후에, 효소는 당분야의 표준 방법을 사용하여 Ni-NTA 친화성 크로마토그래피를 사용하여 정제하였다.
효소 어세이: 상이한 퀴논 옥시도리덕타제의 생체내 활성 측정의 실시예 1과 동일하다. 도 6에 표시된 시험관내 활성 측정을 위해서, Qor-1 효소 (0.3 mg/mL)는 ∼10 mM의 6-히드록시-3,4-데히드로-2-옥소헥사노에이트 (자가 합성), 0.5 mM의 NADH 또는 NADPH와 100 mM pH 7 포스페이트 완충제 중에서 인큐베이션시켰다.
생성물의 분석: 실시예 1에 기술된 등용매 HPLC 방법을 사용하여 효소 생성물, 즉, 2-케토-카르복실산의 생성을 검출 및 정량하였다. 시험관내 활성 측정을 위해서, 340 nm에서의 흡광도 감소를 사용하여 NADH 또는 NADPH 보조인자의 고갈 및 그에 따른 Qor-1 활성을 측정하였다.
실시예 3: 피루베이트 및 지방족 알데히드로부터 2-케토-카르복실산의 생성을 위한 2-효소 시스템.
광범위한 2-케토 산의 생성을 위해 퀴논 옥시도리덕타제 효소와 조합한 알돌라제-히드라타제 효소(들)의 사용이 조사되었다. 이러한 조합은 수많은 산업적으로 바람직한 생성물 예컨대 1,5-펜탄디올, 1,6-헥산디올, 아디프산, 카프로락탐, 카프로락톤, 6-히드록시 헥산산, 6-아미노 카프로산, 아미노산, 및 많은 상이한 지방 분자의 생성을 위한 전구체인 광범위 2-케토 산의 생성을 가능하게 한다. 알돌라제-히드라타제 효소 및 옥시도리덕타제의 수많은 상이한 조합이 상이한 2-케토 산의 생성에 활성인 것으로 확인되었다 (표 10). 본 명세서에서 입증된 바와 같이, 제공된 기술은 높은 생성물 농도, 예를 들어, 약 또는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 15, 17, 18, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1500, 2000, 2500, 3000 mM을 제공할 수 있다.
다양한 생합성 폴리펩티드, 특히 EC 1.6.5에 속하는 것들은 환원에 이용될 수 있다. 예를 들어, EC 1.6.5.5에 속하는 퀴논 옥시도리덕타제는 전자 캐리어 활성에 관여되는 것으로 보고되어 있고, 그들이 예를 들어 포유동물, 진균, 및 박테리아에 존재한다고 보고되어 있으므로 편재성 효소로 보고되어 있다 (Brenda.org에서 이러한 EC 클래스에 대한 등재 참조). 다양한 숙주 전반에서 이들 효소의 천연 발현 수준이 공지되어 있지 않지만, 효소의 이러한 클래스의 발현 수준이 천연적으로 미생물 숙주가 대면하게 되는 산화 스트레스에 의해 영향받을 수 있다는 것은 이전에 상정되었었다. 이. 콜라이 (MG1655 및 BL 21 균주) QorA 유전자 (Qor-1)는 특히 실시예 2에 기술된 조건 하에서, 천연적으로 발현되는 것으로 발견되었다. Ads-Hyd 효소 (예를 들어, Ads-Hyd 8)가 이. 콜라이에서 과발현될 때 이. 콜라이에서 Qor-1의 천연 효소 수준이더라도 2-케토산의 생성에 충분할 수 있다고 입증되었다. 예를 들어, Ads-Hyd 8이 이. 콜라이 BL 21*(DE3) ΔldhA에서 발현될 때, 그 결과로 ∼3 mM의 6-히드록시 2-케토 헥사노에이트가 생성되었다. 그러나, Ads-Hyd 8이외에도, 플라스미드로부터 Qor-1의 과발현은 ∼2x 개선된 생성 (∼5.8 mM 6-히드록시 2-케토 헥사노에이트)을 야기시켰다. 이 결과를 기반으로, 시험관내 동역학 데이터를 내부에서 수집하였고, 전형적인 효소 수준이 이. 콜라이에서 발견되었으며, 일부 구현예에서, 일부 구현예에서, 이들 조건 하에 발현되는 Qor-1 효소의 천연량은 <100 μM이고, 아마도 0.1-100 μM 범위일 것으로 추정된다.
알돌 부가, 탈수, 및 후속 환원이 3종의 별도 효소에 의해 수행되는, 3-효소 시스템과 비교하여, 2-효소 시스템을 사용하여 제공되는 기술은 중요한 개선을 제공하였는데, 예를 들어, (1) 3종 효소보다는 오직 2종 효소가 발현되는 것이 필요하고 - 따라서 반응이 생체 내에서 수행될 때 요구되는 촉매를 감소시키고, 단백질 생성을 위한 세포 자원을 감소시키며, (2) 알돌 부가 및 축합 반응 둘 모두를 단일 생합성 폴리펩티드가 수행하여서, 반응 평형이 과정을 통해서 실현가능한 전체 수율쪽으로 호의적일 수 있는, 바람직한 생성물의 생성 방향쪽으로 이동된다.
클로닝, 및 발현: 표 5에 표시된 이종성 알돌라제 히드라타제 및 퀴논 옥시도리덕타제 효소를 코딩하는 DNA는 이. 콜라이에서 발현을 위해 코돈 최적화되었고 상업적 DNA 합성 회사에서 합성하였다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 2종의 상용성 플라스미드 상에서 T7 RNA 중합효소 프로모터의 하류 및 T7 종결자 서열의 상류에 클로닝되었다. 추가로, 선택된 알데히드가 3-히드록시-프로피온알데히드인 실험에서, B12-의존적 효소인 글리세롤 데히드라타제 효소 (하기와 같은 5종 유전자를 포함하는 락토모쿠스 류테리 글리세롤 데히드라타제: pduC [Uniprot ID No. A5VMB2]; pduD [Uniprot ID No. A5VMB1]; pduE [Uniprot ID No. A5VMB0]; pduG [Uniprot ID No. A5VMA9]; 및 pduH [Uniprot ID No. A5VMA8])를 또한 이 효소를 사용해 글리세롤로부터 3-히드록시-프로피온알데히드를 생성시킬 수 있도록 제3 상용성 플라스미드에 클로닝하였다. 플라스미드로 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC ΔpoxB ΔpflB ΔackA-pta ΔyqhD, ΔadhP, ΔeutG, ΔgldA, ΔyiaY, ΔfucO를 형질전환시켰다. 재조합 단백질 발현은 실시예 1에서 상기 기술된 바와 같이 수행되었다.
효소 어세이: 실시예 1과 동일하다.
생성물의 분석: 실시예 1에 기술된 등용매 HPLC 방법을 사용하여 효소 생성물, 즉, 2-케토-카르복실산의 생성을 검출하고 정량하였다.
실시예 4: 1,5-펜탄디올의 생성을 위한 생합성 경로
이 실시예는 1,5-펜탄디올을 피루베이트 및 3-히드록시-프로피온알데히드로부터 생성하기 위한 생합성 경로를 기술한다. 도 2에 도시된 바와 같이, 피루베이트 및 3-히드록시-프로피온알데히드로부터의 생합성 경로는 5개 반응을 포함한다. 피루베이트 및 3-히드록시-프로피온알데히드를 6-히드록시-2-케토-헥사노에이트로 전환시키는 단계를 포함하는, 처음 3개 반응은 실시예 3에 기술되어 있다. 경로의 나머지 2개 단계로부터의 양쪽 기지의 효소는 하기에 기술된다. 특히, 효소는 생체내에서 완전한 경로를 입증하는 단계를 포함하는, 모든 5개 반응에 대해 검증되었다 (실시예 5 참조).
단계 1-3: 피루베이트 및 3-히드록시-프로피온알데히드의 6-히드록시-2-옥소-헥사노에이트로의 전환. 상세 사항은 실시예 3을 참조한다.
단계 4: 6-히드록시-2-옥소-헥사노에이트의 5-히드록시-펜타날로의 전환. 예시적인 효소는 표 11에 표시되어 있다. 2-케토-산 데카르복실라제 (EC 4.1.1.7)는 (Cn) 2-케토 산의 티아민 디포스페이트 (TPP) 의존적 탈카르복실화를 촉매하여 해당 (Cn-1) 알데히드를 제공한다. 피루베이트에 대한 활성이 최소이거나 또는 전혀없는 장쇄 2-옥소-산에 대한 고-활성을 보유하는 효소는 피루베이트와 교차-반응성이 이 경로의 수율에 극적으로 영향을 미칠 수 있으므로 바람직하다. 지. 모빌리스 (Z. mobilis) 피루베이트 데카르복실라제 (PDC)는 피루베이트에 대한 이의 활성에서 극적 감소 (>2000배)와 함께 장쇄 2-옥소-산에 대한 증가된 효율을 위해 이의 활성 부위를 유의하게 변형시키기 위해 돌연변이되었다 (I472A/I476F).7 지. 모빌리스 PDC 돌연변이체 I472A/I476F는 또한 바람직한 기질과 구조적으로 유사한 2-옥소-헥사노에이트에 대해 탁월한 동역학적 성질을 보인다. 이 단계를 촉매하기 위한 다른 유망한 효소 후보는 엘. 락티스 (L. lactis) 분지쇄 케토-산 데카르복실라제 KdcA (케토산 데카르복실라제), 및 피. 푸티다 (P. putida) 벤조일 포르메이트 데카르복실라제 (BFD) 돌연변이체 A460I이다.8-10 슈도모나스 푸티다 (pseudomonas putida) BFD 및 엘. 락티스 (l. lactis) KdcA는 탈카르복실화를 위한 피루베이트와 비교하여 장쇄 2-옥소-산에 대해 >50 내지 500배 선택성을 보인다. 특히, 엘. 락티스 KdcA는 2-옥소-헥산산에 대해 특이적 활성을 가지고 C3 및 C4 위치 상에서의 치환을 견딜 수 있다. 이러한 효소는 탈카르복실화 반응을 촉매하는데 활성인 것으로 확인되었다 (표 14).
다른 EC 번호를 갖는 데카르복실라제는 또한 이 반응을 수행하는데 적합하다. 대표적인 목록은 표 12에 표시된다.
단계 5: 5-히드록시-펜트알데히드의 1,5-펜탄디올로의 전환. 1차 알콜 데히드로게나제는 1차 알콜로 알데히드의 NAD(P)H-의존적 환원을 촉매한다.
많은 1차 알콜 데히드로게나제가 문헌에 공지되어 있고, 이 단계를 촉매하는 예시적인 후보는 하기에 기술되고 하기 표 13에 표시된다. AdhE, adhP, eutG, yiaY, yqhD, fucO, 및 yjgB를 포함하는, 다수의 이. 콜라이 알콜-알데히드 데히드로게나제가 공지되어 있다.11 최근에, 44종 알데히드 리덕타제가 이. 콜라이에서 확인되었다. 씨. 아세토부틸리쿰 (C. acetobutylicum) 유래의 부탄올 데히드로게나제12 는 이들 전환을 촉매하는데 흥미롭다. 다수의 에스. 세레비지아에 (S. cerevisiae) 알콜 데히드로게나제는 ADH2-6을 포함하여 광범위한 상이한 알데히드를 환원시키는 것으로 확인되었다. 특히 흥미로운 것은 장쇄 알칸-분해 균주 지오바실러스 써보데니트리피칸스 (Geobacillus thermodenitrificans) NG80-2로부터의 2종 알킬 알콜 데히드로게나제 (ADH) 유전자13로부터의 ADHI-ADHII이다. 다른 잡다한 ADH는 중간쇄 알콜 데히드로게나제를 코딩하는 AlrA를 포함한다.14 또한 흥미로운 것은 에이. 탈리아나 (A. thaliana)15, 이. 콜라이 (yihu)16, 및 역시 씨. 엘루이베리 (C. Eluyveri)에서 발견된 4-옥소 부티레이트의 환원을 촉매하는 4-히드록시 부티레이트 데히드로게나제 (EC 1.1.1.61)이다.17 에이. 탈리아나 효소를 비롯하여 에이. 테루스 (A. terrus) 효소 (표 13의 ATEG)는 글루타레이트 세미알데히드를 환원시킬 수 있다 (WO 2010/068953A2, WO 2010/068953A2). 수많은 알콜 데히드로게나제가 이 반응을 수행하는데 흥미롭지만, 5-히드록시 펜타날의 환원을 위한 이의 높은 활성 수준에 기인하여 특히 흥미로운 특이적 효소는 레이프소니아 (Leifsonia) sp. S749 (GenBank ID No. AB213459.1)로부터의 알콜 데히드로게나제이다. 이 효소 및 4종의 다른 알콜 데히드로게나제가 이 반응을 수행하는 것으로 검증되었다 (표 14).
클로닝, 및 발현: 하기 표 14에 표시된 이종성 2-케토 산 데카르복실라제 및 알콜 데히드로게나제 효소를 코딩하는 DNA는 이. 콜라이에서의 발현을 위해 코돈-최적화되었고 합성되었다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 단일 플라스미드 상에서 T7 RNA 중합효소 프로모터의 하류 및 T7 종결자 서열의 상류에 클로닝되었다. 플라스미드로 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC를 형질전환시켰다. 재조합 단백질 발현은 실시예 1에서 상기 기술된 바와 같이 수행되었다.
활성 어세이: 외부로부터 공급된 6-히드록시-2-케토-헥사노에이트로부터 1,5-펜탄디올의 생성의 관찰은 2-케토 산 데카르복실라제 및 알콜 데히드로게나제 효소의 성공적인 활성을 의미하였다. 따라서 발현 후, 세포를 회수하였고 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)와 6-히드록시-2-케토-헥사노에이트 (∼5 g/L) 및 10 g/L 글루코스를 함유하는 0.4 mL의 신선한 배지 (OD600 ∼30)에 15시간 동안 혐기성 조건 하에서 재현탁시켰다. 실온에서 인큐베이션 이후에, 세포를 원심분리하였고, 상청액을 여과하였으며 6-히드록시-2-케토-헥사노에이트로부터 1,5-펜탄디올의 형성에 대해 HPLC를 통해 분석하였다.
1,5-펜탄디올 생성의 HPLC 분석: 등용매 HPLC를 사용하여 1,5-펜탄디올을 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.05% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행되었고, 후자를 사용해 210 및 260 nm에서 신호를 측정하였다. HPLC 결과는 1,5-펜탄디올의 생성을 보여주었고; 소정 조제물의 결과는 표 14에 표시하였다.
실시예 5: 6-히드록시-2-케토-헥사노에이트 중간체를 통해 상이한 탄소원으로부터 1,5-펜탄디올의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 1,5-펜탄디올을 생성하기 위한 기술을 제공한다. 일부 구현예에서, 글리세롤이 탄소원으로서 이용된다. 일부 구현예에서, 하나 이상, 또는 모든, 생합성 단계가 하나의 유기체 (예를 들어, 박테리아) 및 배양물 중에서 수행된다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다.
도 2에 도시되고 또한 실시예 4에 기술된 물질대사 경로를 사용하여, 이들 탄소원으로부터 유래된 물질대사 전구체 피루베이트 및 3-히드록시-프로피온알데히드를 통해서 글리세롤 및/또는 글루코스같은 탄소원으로부터 1,5-펜탄디올의 생성을 조작하기 위한 예시적인 유기체로서 이. 콜라이를 사용하였다. 바람직한 탄소원 (예를 들어, 글리세롤 및/또는 글루코스)으로부터 이러한 경로를 통해서 1,5-펜탄디올을 제조할 수 있는 이. 콜라이를 생성시키기 위해서, 이 경로의 각각의 개별 효소 및 3-히드록시-프로피온알데히드 생성에 필요한 다른 효소를 코딩하는 핵산은 이. 콜라이에 대해 코돈-최적화되었고 상업적으로 합성하였거나 또는 이. 콜라이 게놈 DNA를 사용한 PCR 증폭을 통해 수득되었다. 유전자를 플라스미드로 클로닝하였고, 이로 이. 콜라이를 형질전환시켰다. 모든 경로 효소의 생체내 발현 결과로 1,5-펜탄디올이 생성되었다.
1,5-펜탄디올 경로 유전자의 클로닝: 1,5-펜탄디올 경로의 이종성 효소를 코딩하는 DNA는 이. 콜라이에서 발현을 위해 코돈-최적화되었고 상업적 DNA 합성 회사 (예를 들어, Twist Biosciences)가 합성하였다. 1,5-펜탄디올 경로의 천연 효소를 코딩하는 DNA는 PCR을 통해 이. 콜라이 게놈 DNA로부터 증폭시켰다. 표준 클로닝 방법을 사용하여, 각각의 유전자는 T7 RNA 중합효소 프로모터의 하류 및 종결자 서열의 상류에 클로닝하였다. 유전자에 대한 발현 카세트를 보유하는 상용성 플라스미드는 마커 및 레플리콘의 하기 조합 중 하나를 함유하였다: (1) 클로람페니콜 마커 + P15A 레플리콘, (2) 암피실린 마커 + ColE1 레플리콘, 및 (3) 카나마이신 마커 + COLA 레플리콘. 사용된 유전자의 예는 다음을 포함한다: Ads-Hyd 8 (Uniprot ID No. A0A286PH18), Qor-1 (Uniprot ID No. P28304), 6-히드록시-2-옥소-헥사노에이트 데카르복실라제 (Uniprot ID No. Q6QBS4), 5-히드록시-펜타날 1-리덕타제라고도 하는 1차 알콜 데히드로게나제 (GenBank ID No. AB213459.1). 추가로, 비타민 B12-독립적인 글리세롤 데히드라타제 효소 (예를 들어, 하기 2개 서브유닛을 포함하는 클로스트리듐 부티리쿰 글리세롤 데히드라타제: DhaB1 [Uniprot ID No. Q8GEZ8]; DhaB2 [Uniprot ID No. Q8GEZ7]) 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소 (하기와 같은 5종 유전자를 포함하는 락토코쿠스 류테리 글리세롤 데히드라타제: pduC [Uniprot ID No. A5VMB2]; pduD [Uniprot ID No. A5VMB1]; pduE [Uniprot ID No. A5VMB0]; pduG [Uniprot ID No. A5VMA9]; 및 pduH [Uniprot ID No. A5VMA8])를 또한 이러한 효소를 사용해 글리세롤로부터 만들 수 있는 1,5-펜탄디올 경로 전구체인 3-히드록시-프로피온알데히드를 생성할 수 있도록 클로닝하였다. 락토코쿠스 류테리 글리세롤 데히드라타제를 코딩하는 모든 5종 유전자는 단일 유전자 오페론으로서 클로닝하였다.
1,5-펜탄디올의 생성을 위한 균주(들)의 구축: 이. 콜라이 균주 BL21* (DE3) ΔldhA 가 1,5-펜탄디올 경로 효소의 시험을 위한 배경 균주로서 사용되었다. 경로 효소를 코딩하는 유전자를 보유하는 플라스미드는 이. 콜라이의 형질전환과 연관된 표준 전기영동 방법을 사용해 형질전환시켰다.
1,5-펜탄디올의 생성: 하기 발현 균주는 이. 콜라이로 하기 플라스미드를 순차적으로 형질전환시킨 후에 수득되었다.
균주 PeDO1: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - DhaB1), 유전자 2 (글리세롤 데히드라타제 - DhaB2), 유전자 3 (Qor 1). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1 (6-히드록시-2-옥소-헥사노에이트 데카르복실라제), 유전자 2 (Ads-Hyd 8). 플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 1 (5-히드록시-펜타날 1-리덕타제).
균주 PeDO2: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - DhaB1), 유전자 2 (글리세롤 데히드라타제 - DhaB2), 유전자 3 (Qor 1). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1 (6-히드록시-2-옥소-헥사노에이트 데카르복실라제), 유전자 2 (Ads-Hyd 8).
균주 PeDO3: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - pduCDEGH). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1 (6-히드록시-2-옥소-헥사노에이트 데카르복실라제), 유전자 2 (Ads-Hyd 8), 유전자 3 (5-히드록시-펜타날 1-리덕타제). 플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 1 (Qor 1).
균주 PeDO4: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - pduCDEGH). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1 (6-히드록시-2-옥소-헥사노에이트 데카르복실라제), 유전자 2 (Ads-Hyd 8). 플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 1 (5-히드록시-펜타날 1-리덕타제).
균주 PeDO1 및 PeDO2의 배양: 출발 배양물은 5 mL 2xYT 배지와 1 g/L D-글루코스 및 적절한 항생제를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 1,5-펜탄디올 경로 효소를 위한 세포 배양은 40 mL 성장 배지 중에서 125 mL 배플드 플라스크를 사용하여 수행하였다. 복합 (2xYT) 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 100 mg/L 철 암모늄 시트레이트를 보충하였다. 유도-전 성장은 호기성 조건 하에 30℃에서 2시간 동안 수행하였다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었다. 유도-후 발현은 30분 동안 30℃에서 호기성 조건 하에 수행되었다. 다음으로 세포 배양물을 100 mL 유리병으로 옮겼고, L-시스테인-HCl-단일수화물을 성장 배지에 첨가하였고 (1 g/L 최농 농도), 병을 혐기성 글로브 박스 (Coy Laboratory) 내에서 밀봉하였다. 이어서 배양물은 유리병에서 2시간 동안 30℃에서 혐기성 조건 하에 성장시켰다. 이후에, 세포를 회수하였고 8 g/L 글루코스, 4 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 0.4 mL 신선한 배지 (OD600 ∼30)에 재현탁시켰다. 24시간 동안 실온에 혐기성 조건 하에서 인큐베이션 후에, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
균주 PeDO3 및 PeDO4의 배양: 생성 배지는 하기 조성을 함유한다: 1X MOPS 최소 배지, 5 g/L 효모 추출물, 10 g/L 글리세롤, 20 g/L 글루코스, 및 10 μM의 시아노코발라민 (pH7.2). 1X MOPS 최소 배지는 40 mM MOPS, 4 mM 트리신, 0.01 mM FeSO4, 9.5 mM NH4Cl, 0.276 mM K2SO4, 0.5 μM CaCl2, 0.525 mM MgCl2, 50 mM NaCl, 2.92E-7 mM (NH4)2MoO4, 4.0E-5 mM H3BO3, 3.02E-6 mM CoCl2, 9.62E-7 mM CuSO4, 8.08E-6 mM MnCl2, 9.74E-7 mM ZnSO4, 및 1.32 mM K2PO4 로 구성된다. 씨드 배양물은 10 mL 2xYT 배지 및 적절한 항생제를 함유하는 튜브에서 밤새 성장시켰다. 1,5-펜탄디올 생성을 위한 세포 배양물은 마개 존재의 125 mL 플라스크 중 적절한 항생제와 10 mL 생성 배지를 사용해 제조하였고, 1 mL의 씨드 배양물을 접종하여 세포가 유도 전 2시간 동안 37℃에서 성장될 수 있게 하였다. 2시간 후에, 세포 배양물은 0.1 mM IPTG로 유도시켰고 배양물이 생성을 시작하도록 26℃로 옮겼다. 12시간마다 호기적으로 샘플을 채취하였고 마지막 샘플은 72시간에 채취하였으며, 상청액을 여과하고 HPLC를 통해 분석하였다.
1,5-펜탄디올 생성의 HPLC 분석: 등용매 HPLC를 사용하여 1,5-펜탄디올을 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.05% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자를 사용하여 210 nm 및 260 nm에서 신호를 측정하였다. HPLC 결과는 800 mg/L (균주 PeDO1), 400 mg/L (PeDO2), 212 mg/L (PeDO3), 및 41 mg/L (PeDO4)의 최종 역가에서 분명한 1,5-펜탄디올 생성을 보였다.
1,5-펜탄디올 생성을 위한 추가 작업예:
상기 기술된 균주를 사용한 1,5-펜탄디올을생성의 성공을 기반으로, 1,5-펜탄디올의 생성에 대해 실시예 2 및 3에서 확인된 대체 퀴논 옥시도리덕타제의 사용을 평가하였다. 간략하게, 상기 기술된 실시예에서 균주 PeDO3의 플라스미드 조합이 사용되었고, 플라스미드 3은 상이한 Qor 효소 즉 Qor-1 (Uniprot ID No. P28304), Qor-2 (Uniprot ID No. P40783), 및 Qor-5 (Uniprot ID No. P43903)를 함유하였다. 균주 구축, 생성, 및 분석 방법은 상기 기술된 것과 동일하였다. 균주 PeDO5 (Qor-1 함유), 균주 PeDO6 (Qor-2 함유), 및 균주 PeDO6 (Qor-5 함유)는 상기 기술된 생성 조건 하에서 각각 ∼2 g/L, 2.2 g/L 및 2.4 g/L 1,5-펜탄디올의 생성을 이끌었다.
실시예 6: 6-히드록시-헥사노에이트 중간체로부터 1,6-헥산디올의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 6HH 및 HDO를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 6-히드록시-헥사노에이트 (6HH) 중간체로부터 1,6-헥산디올의 생성을 위한 생합성 경로는 도 3에 도시된다. 6HH로부터 1,6-헥산디올의 생성을 검증하기 위해 이러한 경로의 각 단계에 대한 상이한 효소의 사용을 도입시키는 실시예는 하기에 표시된다. 6HH 중간체로부터 1,6-헥산디올 생합성 경로의 각 단계를 수행하는데 사용된 그들이 유전자 및 그들이 코딩한 해당 효소의 예는 하기 표 15에 표시된다. 여기서의 각 효소는 동일한 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다.
유전자 1에 의해 코딩되는, 6-히드록시헥사노에이트 1-리덕타제라고 명명된 효소에 의해 촉매되는 반응: 6-히드록시-헥사노에이트 --> 6-히드록시-헥사날. 유전자 2에 의해 코딩되는 효소: 6-히드록시헥사노에이트 1-리덕타제 활성제. 유전자 3에 의해 코딩되는, 6-히드록시헥사날 1-리덕타제로 명명된 효소에 의해 촉매되는 반응: 6-히드록시-헥사날 --> 1,6-헥산디올
(i) HDO 생성을 위한 플라스미드의 제조:
HDO 생성 경로 유전자는 하기 표시된 2개 플라스미드에 클로닝하였다. 합성 유전자는 상업적 판매사로부터 수득하였고, 각 유전자는 이. 콜라이에서 발현을 위해 코돈 최적화되었다. 각 유전자는 표준 분자 생물학 방법을 사용하여 그 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이는 1,6-헥산디올 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 MG1655 (DE3) Δrne131, ΔldhA에서 모든 2개 플라스미드의 공-형질전환 이후에 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1. 플라스미드 2 (COLA 레플리콘, 카나마이신 마커): 유전자 2, 및 유전자 3
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 적절한 항생제가 존재하는 10 mL LB를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양물은 유리병을 사용하여 100 mL 부피로 수행하였다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행하였다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용하여 유도하였다. 유도-후 발현은 30℃에 호기성 조건하에서 60-90분 동안 이후에 혐기성 조건에서 2-3시간 동안 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, ∼10 g/L 글루코스, 6-히드록시-헥사노에이트 (∼5 g/L), 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 ∼40의 OD600에서 0.5 mL 부피 중에 재현탁시켰다. 실온에서 24시간 동안 인큐베이션 이후에, 세포를 원심분리하였고, 상청액을 여과하였으며 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출하였고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 표 15에서 모든 실시예의 경우에서 0.1 내지 2.5 g/L의 1,6-헥산디올의 생성을 보여주었다.
실시예 7: 6-히드록시-2-케토-헥사노에이트 중간체로부터 1,6-헥산디올의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 6HH 및 HDO를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 1,6-헥산디올의 생성을 위한 생합성 경로는 도 3에 도시된다. 이 경로를 통한 1,6-헥산디올의 생성을 검증하기 위해서 각 단계에 대한 상이한 효소의 사용을 도입시킨 실시예가 하기에 표시된다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 1,6-헥산디올 생합성 경로의 각 단계를 수행하기 위해 사용된 유전자 및 그들이 코딩하는 해당 효소의 예는 하기 표 16에 표시된다. 그에서의 각 효소는 동일한 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다. 추가로, 하기 실시예는 CoA-전달 반응 및 2,6-디히드록시-헥사노일-CoA 탈수 반응 둘 모두를 수행하기 위한 다수 효소의 확인을 강조한다.
(i) HDO 생성을 위한 플라스미드의 제조:
HDO 생성 경로 유전자는 하기 표시된 2개의 별도 상용성 플라스미드에 클로닝되었다. 각각의 플라스미드는 표시된 바와 같이, 상이한 복제 기원 및 항생제 마커를 가졌다. 합성 유전자는 상업적 판매처로부터 수득하였고, 각각의 유전자는 이. 콜라이에서 발현을 위해 코돈 최적화되었다. 각각의 유전자는 표준 분자 생물학 방법을 사용하여 이 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이는 1,6-헥산디올 생성을 조작하기 위한 표적 유기체로서 사용하였다. 발현 균주는 전기적격성 이. 콜라이 BL21*(DE3) Δldh, ΔadhE, ΔfrdA에 모든 3종 플라스미드를 공-형질전환시킨 후에 수득되었다.
플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 10, 유전자 9,
플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 유전자 2, 유전자 3, 및 유전자 4
플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 11.
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양물은 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지가 사용되었고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도하였다. 유도-후 발현은 30℃에서 호기성 조건 하에 60-90분 동안에 이어서 2-3시간 동안 혐기성 조건에서 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, ∼10 g/L 글루코스, 6-히드록시-2-케토-헥사노에이트 (∼5 g/L), 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 ∼40의 OD600에서 0.5 mL 부피에 재현탁하였다. 24시간 동안 실온에서 인큐베이션 후에, 세포를 원심분리하였고, 상청액을 여과하였고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 각각 표 16의 실시예 7A-7E의 경우에 700 mg/L, 1.2 g/L, 1.1 g/L, 1.1 g/L, 및 1 g/L의 1,6-헥산디올의 생성을 확인하였다.
실시예 8: 6-히드록시-2-케토-헥사노에이트 중간체를 통해 상이한 탄소원으로부터 1,6-헥산디올의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 6HH 및 HDO를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 탄소원으로서 글리세롤을 사용해 HDO를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각 독립적으로 하나 이상의 생합성 반응을 수행하는, 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 HDO 생성을 위한 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통해서 1,6-헥산디올의 생성을 위한 생합성 경로가 도 3에 도시된다. 이 경로를 통한 1,6-헥산디올의 생성을 위해 알돌라제-히드라타제 기반 2 효소 시스템의 사용을 도입시킨 실시예 (8a 및 8b)가 하기에 표시된다. 비타민 B12-독립적인 글리세롤 데히드라타제 효소 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소는 이 효소를 사용해 글리세롤로부터 만들어질 수 있는 3-히드록시-프로피온알데히드 - 1,6-헥산디올 경로 전구체를 생성할 수 있도록 클로닝될 수 있다. B12-의존적 글리세롤 데히드라타제가 본 명세서에서 사용되었다. 1,6-헥산디올 생합성 경로를 비롯하여 3-히드록시-프로피온알데히드의 생성의 각 단계를 수행하기 위해 사용된 유전자 및 그들이 코딩하는 해당 효소의 예는 표 17에 표시된다. 본 명세서의 각 효소는 동일한 E.C 클래스에 속하는 동종 효소로 대체될 수 있다는 것을 유의하는 것이 중요하다.
실시예 8a: 단일 이. 콜라이 균주에서 1,6-헥산디올 (HDO)의 생성
(i) HDO 생성을 위한 플라스미드의 제조:
HDO 생성 경로 유전자는 하기 표시된 3종의 별도 상용성 플라스미드에 클로닝되었다. 각각의 플라스미드는 표시된 대로 상이한 복제 기원 및 항생제 마커를 가졌다. 합성 유전자는 상업적 판매처로부터 수득하였고, 각 유전자는 이. 콜라이에서 발현을 위해 코돈 최적화되었다. 각 유전자는 표준 분자 생물학을 사용해 그 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이는1,6-헥산디올 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 BL21*(DE3) Δldh, ΔadhE, ΔfrdA에서 모든 3종 플라스미드를 공-형질전환 후 수득되었다.
플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 12, 유전자 13, 유전자 2, 유전자 10
플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 3, 유전자 4, 유전자 1, 및 유전자 9
플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 11.
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양은 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 60-90분 동안 그 이후에 2-3시간 동안 혐기성 조건에서 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 ∼40의 OD600에서 0.5 mL 부피로 재현탁되었다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 25-100 mg/L의 1,6-헥산디올의 생성을 보여주었다. 경로의 특별한 단계를 수행하기 위해 이전에 검증된 대체 효소가 이러한 방법론을 사용하여 HDO 생성에 사용될 수 있다는 것을 예시하기 위해서, 유전자 5-7가 각각 Uniport IDs A0A2X3BK09, A0A2X3BU19, 및 A0A1V9IXA9에 의해 코딩되는 것인 대체 HDO 생성 균주를 상기 방법을 사용해 구축하고 평가하였다. 이러한 생성 균주는 >10 mg/L의 1,6-헥산디올의 생성을 이끌었다.
실시예 8b: 2종 이. 콜라이 균주에서 1,6-헥산디올 (HDO)의 생성
(i) HDO 생성을 위한 플라스미드 및 균주의 제조
플라스미드로부터 발현된 HDO 생성 경로 유전자의 수를 최소화시키기 위해서, 이. 콜라이 발현 균주는 소정 경로 유전자가 게놈에 통합된 것으로 구축하였다. 특히, arsB 위치에 HDO 경로 유전자 (유전자 12, 유전자 13)를 함유하는 HDO 생성 균주 BL21*(DE3) Δldh, ΔadhE, ΔfrdA는 각 유전자의 발현이 그 자신의 T7 프로모터에 의해 제어된다. 나머지 HDO 생성 경로 유전자는 상기 실시예에 기술된 기술을 사용하여 하기 도시된 4종의 별도 플라스미드에 클로닝하였다. 유전자의 동일성은 실시예 8a에 기술되었다. 2종의 이. 콜라이 기반 발현 균주를 구축하였다. 발현 균주 1은 이. 콜라이에 플라스미드 1 및 플라스미드 2의 공-형질전환 후에 수득되었고, 발현 균주 2는 이. 콜라이에 플라스미드 3 및 플라스미드 4의 공-형질전환 후에 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 4, 유전자 3, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 2.
플라스미드 3 (RSF 레플리콘, 카나마이신 마커): 유전자 4, 및 유전자 11.
플라스미드 4 (ColE1 레플리콘, 암피실린 마커): 유전자 9 및 유전자 10.
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대한 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양은 별도로 각 발현 균주에 대한 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분을 보충하였다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 각 발현 균주에 대해 별도로 수행되었다. 이후에, 양쪽 발현 균주로부터의 세포는 동일한 양으로 혼합하였고, 이후에 그들을 회수하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 재현탁하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 100-550 mg/L의 1,6-헥산디올의 생성을 보여주었다.
실시예 9: 6-히드록시-2-케토-헥사노에이트 중간체로부터 6-히드록시헥사노에이트의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 6HH를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각이 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각 독립적으로 하나 이상의 생합성 반응을 수행하는, 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 6HH 생성을 위해 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L의 6HH이다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 6-히드록시헥사노에이트 (6HH)의 생성을 위한 생합성 경로는 도 4에 도시된다. 이러한 경로를 통해 6HH의 생성을 검증하기 위한 이 경로의 각 단계에 대한 상이한 효소의 사용을 도입시킨 실시예가 하기에 표시된다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 6HH 생합성 경로의 각 단계를 수행하는데 사용되는 유전자 및 그들이 코딩하는 해당 효소의 예가 표 18에 표시된다. 여기서 각각의 효소는 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다. 추가로, 하기 실시예는 CoA-전달 반응 및 2,6-디히드록시-헥사노일-CoA 탈수 반응 둘 모두를 수행하기 위한 다수 효소의 확인을 강조한다.
(i) 6HH 생성을 위한 플라스미드의 제조:
6HH 생성 경로 유전자는 하기 표시된 2종의 별도의 상용성 플라스미드에 클로닝되었다. 각각의 플라스미드는 표시된 바와 같은, 상이한 복제 기원 및 항생제 마커를 가졌다. 합성 유전자는 상업적 판매처로부터 수득하였고, 각 유전자는 이. 콜라이에서의 발현을 위해 코돈 최적화되었다. 각 유전자는 표준 분자 생물학 방법을 사용해 그 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이가 6HH 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 BL21*(DE3) Δldh, ΔadhE, ΔfrdA에서 모든 3종 플라스미드의 공-형질전환 후 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 유전자 2, 및 유전자 3 (오직 실시예 6 및 7)
플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 4, 유전자 5, 유전자 6, 및 유전자 7.
(ii) 세포 배양, 단백질 발현, 및 6HH 생성 분석:
출발 배양물은 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 6HH 생성을 위한 세포 배양은 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도하였다. 유도-후 발현은 30℃에 호기성 조건 하에서 60-90분 동안 그 이후에 2-3시간 동안 혐기성 조건에서 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 ∼10 g/L 글루코스, 6-히드록시-2-케토-헥사노에이트 (5-10 g/L), 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 재현탁되었다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 표 18의 실시예 9A-9G의 균주로부터 ∼0.4-5 g/L 의 6HH의 생성을 확인하였다.
실시예 10: 6-히드록시-2-케토-헥사노에이트 중간체를 통해 상이한 탄소원으로부터 6-히드록시헥산산 (6HH)의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 6HH를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 탄소원으로서 글리세롤을 사용해 6HH를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각이 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각 독립적으로 하나 이상의 생합성 반응을 수행하는, 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 6HH 생성을 위한 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통한 6HH의 생성을 위한 생합성 경로는 도 4에 도시된다. 이 경로를 통해 6HH의 생성을 위한 알돌라제-히드라타제 기반 2 효소 시스템의 사용을 도입한 실시예가 하기에 표시된다. 비타민 B12-독립적인 글리세롤 데히드라타제 효소 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소는 이 효소를 사용해 글리세롤로부터 만들 수 있는 3-히드록시-프로피온알데히드 - 6HH 경로 전구체를 생성시킬 수 있도록 클로닝될 수 있다. 양쪽 유형의 글리세롤 데히드라타제가 본 명세서에서 사용되었지만, 표 19에 표시된 등재물들은 B12-독립적 글리세롤 데히드라타제 효소를 사용하는 실시예에 집중한다. 여기서 각 효소는 6HH를 산출하기 위해 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있고, 표 19의 실시예 10B 및 10C는 CoA-전달 반응 및 2,6-디히드록시-헥사노일-CoA 탈수 반응 둘 모두를 촉매하는 효소가 동종 효소로 대체되었다는 이러한 점을 입증한다.
(i) 6HH 생성을 위한 플라스미드 및 균주의 제조:
플라스미드로부터 발현되는 6HH 생성 경로 유전자의 수를 최소화하기 위해서, 이. 콜라이 발현 균주는 소정 경로 유전자가 게놈에 통합된 것으로 구축하였다. 특히, 6HH 생성 균주 BL21*(DE3) Δldh, ΔadhE, ΔfrdA는 arsB 위치에 6HH 경로 유전자 (유전자 12, 유전자 13)를 함유하고 각 유전자의 발현은 그 자신이 T7 프로모터에 의해 제어된다. 나머지 6HH 생성 경로 유전자는 상기 실시예에 기술된 기술을 사용해 하기 표시된 2종 별도 플라스미드에 클로닝되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 4, 유전자 3, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 2.
(ii) 세포 배양, 단백질 발현, 및 6HH 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대해 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 HDO 생성을 위한 세포 배양은 별도로 각 발현 균주에 대한 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 별도로 각 발현 균주에 대해 수행되었다. 이후에, 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지에 재현탁시켰다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) 6HH 생성의 HPLC 분석: 등용매 HPLC를 사용하여 HDO를 검출 및 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 표 19의 실시예 10A-10C의 균주로부터 ∼50-800 mg/L의 6HH의 생성을 보여주었다. 대안적인 실시예는 B12-의존적인 글리세롤 데히드라타제 pduCDEGH (COLA 레플리콘, 카나마이신 마커를 갖는 제3 플라스미드 상의 단일 유전자 오페론으로서 코딩됨)가 B12-독립적 글리세롤 데히드라타제 대신에 사용되었고, 경로의 효소의 나머지는 실시예 10A와 동일하였다. 이러한 시스템은 또한 실시예 5에서 B12-의존적 효소를 함유하는 균주 PeDO3 및 PeDO4에 대해 기술된 배양 조건을 사용해 ∼350 mg/L의 6HH의 생성을 이끌었다.
실시예 11: 6-히드록시-헥사노에이트 (6HH) 중간체로부터 아디프산 (AA)의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 AA를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-헥사노에이트 중간체를 통해서 AA의 생성을 위한 생합성 경로는 도 5에 도시된다. 표 20은 6HH의 AA로의 전환을 가능하게 하는 효소의 예를 표시한다. 여기서 각 효소가 AA를 산출하기 위해 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다는 것을 유의하는 것이 중요하다.
(i) 6HH로부터 AA 생성을 위한 플라스미드 및 균주의 제조: AA 생성 경로 유전자는 이전 실시예에 기술된 기술을 사용해 하기 표시된 단일 플라스에 클로닝되었다. BL21*(DE3) Δldh, -ΔadhE, ΔfrdA가 생성 균주로서 사용되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 및 유전자 2.
(ii) 세포 배양, 단백질 발현, 및 AA 생성 분석: 출발 배양물은 별도로 각 발현 균주에 대한 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장되었다. 발현 및 AA 생성을 위한 세포 배양은 별도로 각 발현 균주에 대해 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 30-120분 동안에 이어서 2-3시간 동안 혐기성 조건에서 별도로 각 발현 균주에 대해 수행되었다. 이후에, 세포를 수확하였고, 농축하였으며,0.5 mL 부피로 ∼40의 OD600에서 5-10 g/L 글루코스, 5 g/L 6HH, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지에 재현탁되었다. 3시간 동안 실온에서 인큐베이션 후에, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) AA 생성의 HPLC 분석: 등용매 HPLC를 사용해 AA를 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 표 20의 실시예 11A 및 11B에 대해 500 - 1500 mg/L의 AA의 생성을 보여주었다.
실시예 12: 6-히드록시-2-케토-헥사노에이트 중간체로부터 아디프산 (AA)의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 6H2KH로부터 AA를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통한 AA의 생성을 위한 생합성 경로는 도 5에 도시된다. 이러한 경로를 통한 AA의 생성을 검증하기 위해 이 경로의 각 단계에 대한 상이한 효소의 사용을 도입한 실시예가 하기에 표시된다. 6-히드록시-2-케토-헥사노에이트 중간체로부터 AA 생합성 경로의 각 단계를 수행하기 위해 사용되는 유전자 및 그들이 코딩하는 해당 효소의 예는 하기 표 21에 표시된다. 여기서 각각의 효소는 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다. 표 21의 실시예 12A 및 12B는 이 경로를 통한 AA의 성공적인 생성이 가능하도록 CoA-전달 반응 및 2,6-디히드록시-헥사노일-CoA 탈수 반응 둘 모두를 수행하기 위한 다수 효소의 확인을 강조한다.
(i) 6-히드록시-2-케토-헥사노에이트로부터 AA 생성을 위한 플라스미드 및 균주의 제조: AA 생성 경로 유전자는 하기 표시된 2종의 별도 상용성 플라스미드에 클로닝되었다. 각각의 플라스미드는 표시된 바와 같이, 상이한 복제 기원 및 항생제 마커를 가졌다. 합성 유전자는 상업적 판매처로부터 수득되었고, 각 유전자는 이. 콜라이에서 발현을 위해 코돈 최적화되었다. 각 유전자는 표준 분자 생물학 방법을 사용해 그 자신의 T7 프로모터 및 종결자 하에 클로닝되었다. 에스케리치아 콜라이는 6HH 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC에서 양쪽 플라스미드의 공-형질전환 후에 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 3, 유전자 4, 유전자 9, 및 유전자 10
플라스미드 3 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 및 유전자 8
(ii) 세포 배양, 단백질 발현, 및 AA 생성 분석: (실시예 11에서 사용된 6HH 대신) 10 g/L의 6-히드록시-2-케토-헥사노에이트를 기질로서 사용한 것을 제외하고 실시예 11과 동일하였다.
(iii) AA 생성의 HPLC 분석: 등용매 HPLC를 사용해 상기 기술된 대로 AA를 검출 및 정량하였다. 결과는 표 21의 실시예 12A-12C에 대해 100 - 800 mg/L의 AA의 생성을 보여주었다.
실시예 13: 6-히드록시-2-케토-헥사노에이트 중간체를 통해 상이한 탄소원으로부터 아디프산 (AA)의 생성을 위한 미생물 유기체의 제조 및 사용
일부 구현예에서, 본 개시는 AA를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 3HPA 및 피루베이트를 사용해 AA를 생성하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 탄소원으로서 글리세롤을 사용해 AA를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각이 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각 독립적으로 하나 이상의 생합성 반응을 수행하는 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 AA 생성을 위해 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통해 AA의 생성을 위한 생합성 경로는 도 5에 도시된다. 이 경로를 통해 AA의 생성을 위한 알돌라제-히드라타제-기반 2-효소 시스템의 사용을 도입한 실시예가 하기에 표시된다. 비타민 B12-독립적인 글리세롤 데히드라타제 효소 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소는 이 효소를 사용해 글리세롤로부터 만들어질 수 있는 3-히드록시-프로피온알데히드 - 6HH 경로 전구체를 생성시킬 수 있도록 클로닝될 수 있다. B12-의존적 글리세롤 데히드라타제는 본 명세서에서 사용되었다. AA 생합성 경로를 비롯하여 3-히드록시-프로피온알데히드의 생성의 각 단계를 수행하는데 사용된 유전자 및 그들이 코딩하는 해당 효소의 예는 표 22에 표시된다. 여기서 각각의 효소는 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다.
(i) AA 생성을 위한 플라스미드 및 균주의 제조:
플라스미드로부터 발현되는 AA 생성 경로 유전자의 수를 최소화하기 위해서, 이. 콜라이 발현 균주는 소정 경로 유전자를 게놈에 통합시킨 것을 구축하였다. 특히, AA 생성 균주 BL21*(DE3) Δldh, ΔadhE, ΔfrdA는 arsB 위치에 경로 유전자 (유전자 12, 유전자 13)를 함유하였고 각 유전자의 발현은 이의 자체 T7 프로모터에 의해 제어된다. 2종의 이. 콜라이 기반 발현 균주를 구축하였다. 발현 균주 1은 이. 콜라이에 플라스미드 1 및 플라스미드 2의 공-형질전환 이후에 수득되었고, 발현 균주 2는 이. 콜라이에 플라스미드 3을 형질전환 후 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 4, 유전자 3, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 2.
플라스미드 3 (ColE1 레플리콘, 암피실린 마커): 유전자 9, 유전자 10, 및 유전자 3.
(ii) 세포 배양, 단백질 발현, 및 AA 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대한 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장되었다. 발현 및 AA 생성을 위한 세포 배양은 별도로 각 발현 균주에 대해 유리병을 사용해 100 mL 부피에서 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분을 보충하였다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에서 호기성 조건 하에 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 각 발현 균주에 대해 별도로 수행되었다. 이후에, 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 재현탁하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) AA 생성의 HPLC 분석: 등용매 HPLC를 사용해 AA를 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기) 및 UV 검출기를 사용해 수행하였고, 후자는 전형적으로 210 nm, 260 nm, 및 280 nm에서 신호를 측정하는데 사용되었다. 결과는 20 - 350 mg/L의 AA의 생성을 보여주었다.
실시예 14: 6-히드록시헥사노에이트의 다수-균주 및 다수-포트 생성.
일부 구현예에서, 생성물 예를 들어, 6HH의 생성은 한 균주에서 수행된다. 일부 구현예에서, 생성은 둘 이상의 균주에서 수행된다. 일부 구현예에서, 둘 이상의 균주는 함께 생성에서 이용되는 모든 생합성 폴리펩티드를 발현한다. 일부 구현예에서, 한 균주에서 생합성 폴리펩티드의 생성물은 다른 균주의 생합성 폴리펩티드의 기질이다. 일부 구현예에서, 한 균주의 둘 이상의 생합성 폴리펩티드의 생성물은 독립적으로 하나 이상의 다른 균주에서 둘 이상의 생합성 폴리펩티드의 기질이다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L의 6-히드록시헥사노에이트이다.
상기 실시예 10은 단일 이. 콜라이 균주에서 6HH의 생성을 기술하고, 피루베이트 및 3-히드록시 프로파날의 전환 (및 글리세롤로부터 이의 생성)에 필요한 모든 생합성 경로 효소는 단일 이. 콜라이 균주 내에서 동시에 모두 발현된다. 일부 구현예에서, 전체 생합성 경로가 모듈이라고 불리는 더 작은 섹션으로 분할되고, 각각의 모듈은 그 자신의 고유한 이. 콜라이 균주에서 발현되는 생합성 경로의 일련의 순차적 효소를 포함하는 것인, 다수균주 접근법을 추구하는 것이 유리할 수 있다. 예를 들어, 전체 6HH 생합성 경로를 2개 모듈로 분할하는 것이 실현가능하였음을 입증하였다. 특히, 단일 이. 콜라이 균주에서 6-히드록시-2-케토-헥사노에이트 - 6HH 생합성 경로의 중간체의 생성을 허용하는, 제1 모듈의 구축은 상기 실시예 3에 기술되고, 피루베이트 및 3-히드록시 프로파날의 전환 (및 글리세롤로부터 이의 생성)에 필요한 모든 효소는 단일 이. 콜라이 균주 내에서 동시에 모두 발현되었다. 제2 (별도) 이. 콜라이 균주에서 6-히드록시-2-케토-헥사노에이트로부터 6HH의 생성을 허용하는, 제2 모듈의 구축은 상기 9에 기술되고, 6-히드록시-2-케토-헥사노에이트의 6HH로의 전환에 필요한 모든 효소는 이러한 단일 이. 콜라이 균주 내에서 동시에 모두 발현된다. 양쪽 모듈의 사용은 2종의 별도의 이. 콜라이 균주에서 6HH의 생성을 위한 완전한 생합성 경로를 유도한다. 이러한 다수균주 접근법은 다수의 이유로 유리할 수 있는데, 예컨대 제한없이, a) 이들같은 대규모 생합성 경로를 개발하기 위한 플라스미드의 구축 및 시험은 거대 라이브러리를 생성시킬 수 있고, 기능성 (또는 최고) 유전자 구성체를 스크리닝하는 통상의 무차별 방법은 비효율적이고 값비쌀 수 있고; b) 효소 발현는 경로에 걸쳐 단순화되고 균형잡힐 수 있어서 실질적으로 더 빠른 개발 사이클을 초래할 수 있고; c) 각각의 별도 모듈에 대한 이. 콜라이 균주의 유전 배경은 산화환원 반응을 적합화하도록 조율할 수 있고 다른 것들은 각 모듈에 대한 생성을 최대화하는 것을 필요로 한다 (단일 균주 최적화가 전체 경로에 효율적이지 않을 수 있기 때문). 하기 표 23에 요약된 결과는 동시에 (즉, 1-포트) 또는 순차적 생성 방법론을 통해서 6HH의 생성을 위한 이러한 다수-균주 접근법의 성공적인 사용을 입증한다.
(i) 6HH 생성을 위한 플라스미드 및 균주의 제조:
전체 6HH 생합성 경로는 상기 기술된 바와 같이 2종의 이. 콜라이 균주 (또는 모듈)로 분할되었다. 2종의 이. 콜라이 기반 발현 균주를 구축하였다. 발현 균주 1은 플라스미드 1, 및 플라스미드 2를 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC ΔpoxB ΔpflB ΔackA-pta ΔyqhD, ΔadhP, ΔeutG, ΔgldA, ΔyiaY, ΔfucO에 공-형질전환 후 수득되었고; 발현 균주 2는 플라스미드 3 및 4를 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC에 형질전환 후 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 유전자 2, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 9.
플라스미드 3 (ColE1 레플리콘, 암피실린 마커): 유전자 4.
플라스미드 4 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 3.
(ii) 세포 배양, 단백질 발현, 및 6HH 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대해 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 6HH 생성을 위한 세포 배양는 별도로 각 발현 균주에 대해 유리병을 사용해 100 mL 부피로 수행되었다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 별도로 각 발현 균주에 대해 수행되었다. 이후에, 양쪽 발현 균주로부터의 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 재현탁시켰다. 실시예 14A 경우에, 양쪽 균주로부터 동일 수의 세포를 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 배지에 재현탁시켰다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다. 실시예 14B 경우에, 발현 균주 1로부터의 세포는 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 배지에 현탁시켰다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하였고 발현 균주 2로부터의 세포와 혼합하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) 6HH 생성의 HPLC 분석: 이것은 이전에 언급된 대로 수행되었다. 결과는 350 - 1100 mg/L의 6HH의 생성을 보여주었다.
실시예 15: 1,6-헥산디올의 다수-균주 및 다수-포트 생성.
일부 구현예에서, 본 개시는 HDO를 제조하기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 3HPA 및 피루베이트로부터 HDO를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 본 개시는 탄소원으로서 글리세롤을 사용해 HDO를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 생성은 하나의 유기체에서 수행된다. 일부 구현예에서, 생성은 각각이 생합성 폴리펩티드의 상이한 세트를 발현하는 둘 이상의 유기체에서 수행된다. 일부 구현예에서, 생성은 단일 박테리아 균주에서 수행된다. 일부 구현예에서, 생성은 각각이 독립적으로 하나 이상의 생합성 반응을 수행하는, 둘 이상의 박테리아 균주에서 수행된다. 일부 구현예에서, 배양물은 HDO 생성을 위해 둘 이상 또는 모든 균주를 포함한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다. 상기 실시예 8은 단일 또는 이중 이. 콜라이에서 HDO의 생성을 기술하고, 피루베이트 및 3-히드록시 프로파날의 전환 (및 글리세롤로부터 이의 생성)에 필요한 모든 생합성 경로 효소는 단일 이. 콜라이 균주 또는 2종의 별도 이. 콜라이 균주에서 동시에 모두 발현된다. 이러한 다수-균주 접근법은 실시예 14에 언급된 다수 이유로 유리할 수 있다. 표 24에 요약된 결과는 동시에 (즉, 1-포트) 또는 순차적 생성 방법론을 통해서 HDO의 생성을 위한 이러한 다수-균주 접근법의 다른 성공적 사용을 입증한다.
(i) HDO 생성을 위한 플라스미드 및 균주의 제조:
전체 HDO 생합성 경로는 상기 기술된 바와 같은 2종의 이. 콜라이 균주 (또는 모듈)로 분할되었다. 2종의 이. 콜라이 기반 발현 균주를 구축하였다. 발현 균주 1은 플라스미드 1, 및 플라스미드 2를 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC ΔpoxB ΔpflB ΔackA-pta ΔyqhD, ΔadhP, ΔeutG, ΔgldA, ΔyiaY, ΔfucO에 공-형질전환 후에 수득하였고; 발현 균주 2는 플라스미드 3 및 4를 이. 콜라이 MG1655 (DE3) rne131 ΔldhA ΔadhE ΔfrdBC에 형질전환 후 수득되었다.
플라스미드 1 (ColE1 레플리콘, 암피실린 마커): 유전자 1, 유전자 2, 및 유전자 1.
플라스미드 2 (P15A 레플리콘, 클로람페니콜 마커): 유전자 12.
플라스미드 3 (ColE1 레플리콘, 암피실린 마커): 유전자 3, 유전자 9, 유전자 4, 유전자 11, 및 유전자 10.
플라스미드 4 (P15A 레플리콘, 클로람페니콜 마커): 유전자 5, 유전자 6, 유전자 7, 유전자 8, 및 유전자 4.
(ii) 세포 배양, 단백질 발현, 및 HDO 생성 분석:
출발 배양물은 별도로 각 발현 균주에 대해 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 6HH 생성을 위한 세포 배양은 별도로 각 발현 균주에 대해 유리병을 사용해 100 mL 부피로 수행하였다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분을 보충하였다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 각 발현 균주에 대해 별도로 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도되었고, 별도로 각 발현 균주에 대해 수행되었다. 유도-후 발현은 30℃에 호기성 조건 하에서 30분 동안에 이어서 2-3시간 동안 혐기성 조건에서 별도로 각 발현 균주에 대해 수행되었다. 이후에, 양쪽 발현 균주로부터의 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 재현탁되었다. 실시예 15A의 경우, 양쪽 균주로부터의 동일 수의 세포를 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 배지에 재현탁하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다. 실시예 15B 경우에, 발현 균주 1로부터의 세포는 5-20 g/L 글루코스, 2.5-5 g/L 글리세롤, 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 배지에 현탁하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하였고 발현 균주 2로부터의 세포와 혼합하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) HDO 생성의 HPLC 분석: 이것은 이전에 언급된 바와 같이 수행되었다. 결과는 400 - 800 mg/L의 HDO의 생성을 보여주었다.
실시예 16: 글리세롤로부터 3-히드록시-프로파날의 합성
3-히드록시-프로파날은 글리세롤로부터 글리세롤 데히드라타제를 사용해 합성하였다. 글리세롤 데히드라타제는 재활성화 단백질의 존재 하에서 조효소 B12-의존적 또는 조효소 B12-독립적 방식으로 탈수를 촉매할 수 있다. 조효소 B12-의존적 데히드라타제는 3개 서브유닛: 대형 또는 "α" 서브유닛, 중간형 또는 "β" 서브유닛, 및 소형 또는 "γ" 서브유닛으로 구성된다. 이들 서브유닛은 α2β2γ2 구조로 조립되어 아포효소를 형성한다. 조효소 B12 (활성 보조인자 종)는 아포효소에 결합하여 촉매적으로 활성인 할로효소를 형성한다. 조효소 B12는 촉매반응이 일어나는 라디칼 기전에 관여되므로 촉매 활성에 필요하다. 생화학적으로, 조효소 B12-의존적 글리세롤 및 조효소 B12-의존적 디올 데히드라타제 둘 모두는 글리세롤 및 다른 기질에 의한 기전-기반 자살 불활성화를 겪는 것으로 공지되어 있다 (Daniel et al., FEMS Microbiology Reviews 22:553-566 (1999); Seifert, et al., Eur. J. Biochem. 268:2369-2378 (2001)). 불활성화는 데히드라타제 활성화를 복원하기 위해 데히드라타제 재활성화 인자에 의존하여 극복할 수 있다 (Toraya and Mori (J. Biol. Chem. 274:3372 (1999); 및 Tobimatsu et al. (J. Bacteria 181:4110 (1999)). 데히드라타제 재활성화 및 조효소 B12 재생 과정 둘 모두는 ATP를 요구한다. 글리세롤 데히드라타제, 디올 데히드라타제 및 재활성화 인자의 소수예가 하기에 표시된다. 당업자는 시트로박터 프룬디이 (Citrobacter freundii), 락토코쿠스 류테리 (Lactococcus reuteri), 클로스트리듐 파스퇴리아눔 (Clostridium pasteurianum), 클로스트리듐 부티리쿰 (Clostridium butyricum), 케이. 뉴모니아에 (K. pneumoniae) 또는 그들 균주의 글리세롤 데히드라타제; 살모넬라 티피뮤리움 (Salmonella typhimurium), 클렙시엘라 옥시토카 (Klebsiella oxytoca) 또는 케이. 뉴모니아에 (K. pneumoniae)의 디올 데히드라타제; 및 하기 표 25에 열거된 E.C. 군에 속하는 다른 데히드라타제 효소 또는 이들 서열의 동종 효소가 또한 이 단계를 수행하는데 사용될 수 있다는 것을 인식할 것이다. 이들 효소의 돌연변이체 (미국 특허 제8445659호 및 제7410754호)는 또한 과정의 효율을 증가시키기 위해 본 명세서에서 사용될 수 있다. 특히, 조효소 B12-독립적-데히드라타제 (Raynaud, C., et al., Proc. Natl. Acad. Sci. U.S.A. 100, 5010-5015 (2003))는 비타민-B12의 고비용으로 인해 산업적 과정에 호의적이다.
실시예 17: 피루베이트의 합성.
당의 피루베이트로의 전환.
해당과정을 통한 당의 피루베이트로의 전환은 매우 충분히 공지되어 있다. 해당과정에서, 글루코스의 각 몰은 2몰의 ATP, 2몰의 NAD(P)H 형태의 환원 균등물, 및 2몰의 피루베이트를 제공한다.
글리세롤의 피루베이트로의 전환.
글리세롤은 혐기적 및 미세-호기적으로 해당작용 중간체로 전환될 수 있다. 혐기적으로, 글리세롤은 디히드록시아세톤으로 탈수소화되고, (포스포에놀 피루베이트 또는 ATP를 사용한) 인산화 이후에, 디히드록시아세톤 포스페이트 해당작용 경로 중간체로 전환된다 (Dharmadi, et al., Biotechnol. Bioeng. 94:821-829 (2006)). 글리세롤 전환을 위한 호흡 경로는 (ATP에 의한) 글리세롤의 인산화 이후 산화 (전자 억셉터로서 퀴논)되어 해당작용을 통해 피루베이트로 전환될 수 있는 디히드록시아세톤 포스페이트를 제공하는 것을 포함한다 (Booth IR. Glycerol and methylglyoxal metabolism. Neidhardt FC, et al., editors. In: Escherichia coli and Salmonella: Cellular and molecular biology (web edition). 2005, Washington, DC, ASM Press; Durnin et al., Biotechnol Bioeng. 103(1):148-161 (2009)).
실시예 18: 6-히드록시-2-케토-헥사노에이트 중간체로부터 2,6-디히드록시-헥사노에이트의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 2,6-디히드록시-헥사노에이트를 6-히드록시-2-케토-헥사노에이트로부터 생성시키기 위한 기술을 제공한다. 소정 실시예를 하기에 기술한다.
2,6-디히드록시-헥사노에이트 (6H2HH)를 6-히드록시-2-케토-헥사노에이트 중간체로부터 생성시키기 위한 생합성 경로는 도 4에 도시된다. 6H2KH를 6H2HH로 환원을 위한 상이한 2-케토 리덕타제 효소 즉 6-히드록시-2-옥소헥사노에이트 2-리덕타제의 사용을 도입한 실시예가 하기에 표시된다. 이 단계에 사용된 유전자 및 그들이 코딩하는 해당 효소의 예는 표 26에 표시된다. 여기서 각 효소는 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다.
(i) 6H2HH 생성을 위한 플라스미드의 제조:
6-히드록시-2-옥소헥사노에이트 2-리덕타제를 코딩하는 유전자는 표준 분자 생물학 방법을 사용해 발현이 T7 프로모터에 의해 구동되는 플라스미드에 클로닝되었다. 에스케리치아 콜라이는 6H2HH 생성을 조작하기 위한 표적 유기체로서 사용되었다. 발현 균주는 전기적격성 이. 콜라이 BL21*(DE3) Δldh에서 모든 3종 플라스미드를 공-형질전환 후 수득되었다.
(ii) 세포 배양, 단백질 발현, 및 6H2HH 생성 분석:
출발 배양물은 적절한 항생제와 10 mL LB 배지를 함유하는 튜브에서 밤새 성장시켰다. 발현 및 6H2HH 생성을 위한 세포 배양은 유리병을 사용해 100 mL 부피로 수행하였다. 복합 성장 배지를 사용하였고 2 g/L D-글루코스, 0.5 g/L 포타슘 포스페이트 완충제 (pH 7.2), 및 효소 발현에 중요한 다른 기질/영양분이 보충되었다. 유도-전 성장은 ∼2시간 동안 호기성 조건 하에 30℃에서 수행되었다. 재조합 단백질 발현은 0.2-0.4의 OD600에서 250 μM IPTG를 사용해 유도하였다. 유도-후 발현은 30℃에 호기성 조건 하에서 60-90분 동안 그 이후에 2-3시간 동안 혐기성 조건에서 수행하였다. 이후에, 세포를 수확하였고, 농축하였으며, 0.5 mL 부피로 ∼40의 OD600에서 ∼10 g/L 글루코스, 6-히드록시-2-케토-헥사노에이트 (5-10 g/L), 및 15 g/L 포타슘 포스페이트 완충제 (pH 7.2)를 함유하는 신선한 배지 중에 재현탁시켰다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) 6H2HH 생성의 HPLC 분석: 등용매 HPLC를 사용하여 6H2HH를 검출하고 정량하였다. 방법은 Bio-Rad Aminex HPX-87 컬럼, 0.7 mL/분의 0.5% 포름산 (또는 5 mM 황산)을 35℃에서 적용하였다. 검출은 RID (굴절률 검출기)를 사용해 수행하였다. 결과는 표 26의 실시예 1-9의 모든 균주로부터 6H2HH의 생성을 확인하였다.
실시예 19: 6-히드록시-2-케토-헥사노에이트 중간체를 통한 상이한 탄소원으로부터 2,6-디히드록시-섹사노에이트의 생성을 위한 미생물 유기체의 제조 및 사용.
일부 구현예에서, 본 개시는 다양한 탄소원으로부터 2,6-디히드록시-헥사노에이트를 생성시키기 위한 기술을 제공한다. 소정 실시예가 하기에 기술된다. 일부 구현예에서, 본 개시는 피루베이트 및 3HPA로부터 2,6-디히드록시-헥사노에이트를 생성시키기 위한 기술을 제공한다. 일부 구현예에서, 수율은 약 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 또는 1000 mg/L 이거나, 또는 약 또는 적어도 약 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.1, 2.2, 2.3, 2.4, 2.5, 2.7, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 250, 또는 300 g/L 이다.
피루베이트 및 3-히드록시-프로파날로부터 6-히드록시-2-케토-헥사노에이트 중간체를 통해서 6H2HH의 생성을 위한 생합성 경로는 도 4에 도시된다. 이러한 경로를 통해 6H2HH의 생성을 위한 알돌라제-히드라타제 기반 2 효소 시스템의 사용을 도입시킨 실시예가 하기에 표시된다. 비타민 B12-독립적인 글리세롤 데히드라타제 효소 또는 B12-의존적 효소인 글리세롤 데히드라타제 효소는 이 효소를 사용해 글리세롤로부터 만들 수 있는 3-히드록시-프로피온알데히드 - 6H2HH 경로 전구체를 생성할 수 있도록 클로닝될 수 있다. 글리세롤 데히드라타제의 2가지 유형이 본 명세서에서 사용될 수 있지만, 하기 표시된 실시예는 12-의존적 글리세롤 데히드라타제 효소를 사용한다. 여기서 각각의 효소는 6H2HH를 산출하기 위해 동일 E.C. 클래스에 속하는 동종 효소로 대체될 수 있다.
(i) 6H2HH 생성을 위한 플라스미드 및 균주의 제조: MG1655(DE3) Δrne131, ΔldhA, Δ[frdB, frdC], ΔadhE, ΔpoxB, ΔpflB, Δ[ackA, pta] 가 하기 플라스미드 조합을 갖는 균주로서 사용되었다: 플라스미드 1 (COLA 레플리콘, 카나마이신 마커): 유전자 1 (글리세롤 데히드라타제 - pduCDEGH). 플라스미드 2 (ColE1 레플리콘, 암피실린 마커): 유전자 2 (Ads-Hyd 8), 유전자 2 (Qor-1), 및 유전자 3 (6-히드록시-2-옥소헥사노에이트 2-리덕타제 - Q5FTU6).
(ii) 세포 배양, 단백질 발현, 및 6H2HH 생성 분석:
세포 배양 (적절한 항생제 존재), 및 단백질 발현은 3-히드록시 프로파날에 대해 실시예 1에 기술된 것과 유사하였다. 24시간 동안 실온에서 인큐베이션 후, 세포를 원심분리하였고, 상청액을 여과하고 HPLC를 통해 분석하였다.
(iii) 6H2HH 생성의 HPLC 분석: 분석읜 실시예 18에 언급된 대로 수행되었다. 균주는 이들 조건 하에서 > 1 g/L의 6H2HH를 생성시킬 수 있었다.
균등물
달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시가 속하는 분야의 당업자가 통상으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 제공되는 모든 뉴클레오티드는 5'에서 3' 방향으로 표시된다.
본 명세서에서 예시적으로 기술되는 구현예는 본 명세서에 특별히 개시하지 않은 임의 구성요소 또는 구성요소들, 제한 또는 제한들의 부재 하에서 적합하게 실시될 수 있다. 따라서, 예를 들어, 용어 "포함하는", "포괄하는", "함유하는" 등은 제한없이 광범위하게 판독되어야 한다. 추가로, 본 명세서에서 적용되는 용어 및 표현은 제한이 아니라 설명의 관점에서 사용되었고, 이러한 용어 및 발현의 사용이 표시되고 기술된 특징의 임의 균등물 또는 이의 일부를 배제하려는 의도가 아니지만, 다양한 변형이 청구된 본 발명의 범주 내에서 가능하다는 것을 인식한다.
본 기술이 상기 양태와 함께 기술되었지만, 전술한 설명 및 실시예는 본 기술의 범주를 예시하려는 의도이고 제한하려는 것이 아님을 이해해야 한다. 본 기술의 범주 내에서 다른 양태, 장점, 및 변형은 본 기술이 속하는 분야의 당업자에게 자명할 것이다.
참조문헌
<110> ZYMOCHEM, INC.
<120> PRODUCTION OF CHEMICALS FROM RENEWABLE SOURCES
<130> 2013662-0014
<140> PCT/US2020/029981
<141> 2020-04-25
<150> 62/868,824
<151> 2019-06-28
<150> 62/838,793
<151> 2019-04-25
<160> 106
<170> PatentIn version 3.5
<210> 1
<211> 265
<212> PRT
<213> Streptomyces bingchenggensis
<400> 1
Met Lys Gly Tyr Thr Val Pro Leu Ser Pro Arg Gly Ile Ala Asn Leu
1 5 10 15
Ala Pro Ala Pro Pro Trp His Tyr Ala Gly Thr Val Val Gly Val Glu
20 25 30
Phe Phe Thr Asp Pro Ala Ala Ala Ala Ala Thr Leu Pro Glu Gly Leu
35 40 45
Thr Pro Asp Pro Asp Ser Ala Gly Arg Gly Val Ala Met Phe Ile Asp
50 55 60
Trp Gln Tyr Ser Ser Thr Gly Leu Glu Tyr Leu Asp Pro Ala Arg Ser
65 70 75 80
Gln Tyr Arg Glu Phe Leu Ile Thr Leu Asp Ala His Cys Asn Gly Ala
85 90 95
Pro Val Ala Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ala Ala Met
100 105 110
Ala Arg Gly Trp Val Gln Gly Phe Pro Lys Lys Leu Gly Ala Val His
115 120 125
Gln Thr Arg Ala Tyr Ser Val Gly Gly Pro Gly Thr Pro Val Leu Gly
130 135 140
Pro Gly Gly Gln Phe Gly Ala Thr Ala Ser Ser Ala Gly Gln Arg Ile
145 150 155 160
Ala Glu Ala Lys Ile Thr Leu Glu Gln Pro Val Pro Asp Pro Ala Ala
165 170 175
Leu Met Ser Arg Pro Val Ile Asn Leu Arg His Phe Pro Arg Leu Ala
180 185 190
Ala Gly Gln His Asp Gln Pro Ala Val His Glu Leu Val Met Ser Val
195 200 205
Leu Asp Asp Thr Ala Val Ser Asp Ala Trp Val Gly Thr Ala Asp Leu
210 215 220
Ala Phe Leu Pro Ala His Gly Glu Glu Leu Ala Asp Leu Pro Val Arg
225 230 235 240
Arg Thr Gly Lys Gly Phe His Phe Asp Leu Ala Tyr Thr Val Thr Asp
245 250 255
Leu Met Thr Leu Ala Asp His Ser Ala
260 265
<210> 2
<211> 334
<212> PRT
<213> Pseudomonas putida
<400> 2
Met Ser Asn Lys Ile Met Lys Thr Ser Arg Leu Thr Ala Glu Asp Ile
1 5 10 15
Asn Gly Ala Trp Thr Ile Met Pro Thr Pro Ser Thr Pro Asp Ala Ser
20 25 30
Asp Trp Arg Ser Thr Ala Thr Val Asp Leu Glu Glu Thr Ala Arg Ile
35 40 45
Val Glu Glu Leu Ile Ala Ala Gly Val Asn Gly Ile Leu Ser Met Gly
50 55 60
Thr Phe Gly Glu Cys Ala Thr Leu Thr Trp Asp Glu Lys Arg Asp Tyr
65 70 75 80
Val Ser Thr Ile Val Glu Thr Ile Arg Gly Arg Val Pro Tyr Phe Cys
85 90 95
Gly Thr Thr Ala Leu Asn Thr Arg Glu Val Ile Arg Gln Thr Arg Glu
100 105 110
Leu Ile Asp Ile Gly Ala Asn Gly Thr Met Leu Gly Val Pro Met Trp
115 120 125
Val Lys Met Asp Leu Pro Thr Ala Val Gln Phe Tyr Arg Asp Val Ala
130 135 140
Asp Ala Val Pro Glu Ala Ala Ile Ala Ile Tyr Ala Asn Pro Glu Ala
145 150 155 160
Phe Lys Phe Asp Phe Pro Arg Pro Phe Trp Ala Glu Met Ser Lys Ile
165 170 175
Pro Gln Val Val Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu
180 185 190
Asp Leu Arg Leu Ala Pro Asn Ile Arg Phe Leu Pro His Glu Asp Asp
195 200 205
Tyr Tyr Ala Ala Ala Arg Ile Asn Pro Glu Arg Ile Thr Ala Phe Trp
210 215 220
Ser Ser Gly Ala Met Cys Gly Pro Ala Thr Ala Ile Met Leu Arg Asp
225 230 235 240
Glu Val Val Arg Ala Lys Ser Thr Gly Asp Trp Ala Lys Ala Lys Ala
245 250 255
Ile Ser Asp Asp Met Arg Ala Ala Asp Ser Thr Leu Phe Pro Arg Gly
260 265 270
Asp Phe Ser Glu Phe Ser Lys Tyr Asn Ile Gly Leu Glu Lys Ala Arg
275 280 285
Met Asp Ala Ala Gly Trp Leu Lys Ala Gly Pro Cys Arg Pro Pro Tyr
290 295 300
Asn Leu Val Pro Glu Asp Tyr Leu Ala Gly Ala Gln Lys Ser Gly Lys
305 310 315 320
Ala Trp Ala Ala Leu His Ala Lys Tyr Ser Asn Glu Leu Lys
325 330
<210> 3
<211> 332
<212> PRT
<213> Nocardioides sp.
<400> 3
Met Thr Ser Pro Ala Val Thr Ser Ala Asp Ile Thr Gly Leu Val Gly
1 5 10 15
Ile Val Pro Thr Pro Ser Lys Pro Gly Ser Glu Ala Pro Asp Ala Val
20 25 30
Asp Thr Val Asp Leu Asp Glu Thr Ala Arg Met Val Glu Leu Ile Val
35 40 45
Ala Ser Gly Val Asp Val Leu Leu Thr Asn Gly Thr Phe Gly Glu Val
50 55 60
Ala Thr Leu Thr Tyr Glu Glu Leu Leu Ala Phe Asn Asp Thr Val Ile
65 70 75 80
Arg Thr Val Ala Asn Arg Ile Pro Val Phe Cys Gly Ala Ser Thr Leu
85 90 95
Asn Thr Arg Asp Thr Ile Ala Arg Ser Leu Ala Leu Met Gly Leu Gly
100 105 110
Ala Asn Gly Leu Phe Val Gly Arg Pro Met Trp Leu Pro Leu Asp Asp
115 120 125
Glu Gln Leu Val Ser Tyr Tyr Ala Ala Val Cys Asp Ala Val Pro Ala
130 135 140
Ala Ala Val Val Val Tyr Asp Asn Thr Gly Val Phe Lys Gly Lys Ile
145 150 155 160
Ser Ser Ala Ala Tyr Ala Ala Leu Ala Glu Ile Pro Gln Ile Val Ala
165 170 175
Ser Lys His Leu Gly Val Leu Ser Gly Ser Asp Ala Tyr Ala Ser Asp
180 185 190
Leu Ala Ala Val Lys Gly Arg Phe Pro Leu Leu Pro Thr Ala Asp Asn
195 200 205
Trp Leu Pro Ser Leu Glu Ala Phe Pro Gly Glu Val Pro Ala Ala Trp
210 215 220
Ser Gly Asp Val Ala Cys Gly Pro Glu Pro Val Met Ala Leu Arg Arg
225 230 235 240
Ala Ile Ala Glu Gly Leu Trp Asp Asp Ala Arg Ala Val His Glu Asp
245 250 255
Ile Ala Trp Ala Thr Glu Pro Leu Phe Pro Gly Gly Asp Ile Ser Lys
260 265 270
Phe Met Pro Tyr Ser Ile Gln Ile Asp Arg Ala Glu Phe Glu Ala Ala
275 280 285
Gly Tyr Ile Val Pro Gly Pro Ser Arg His Pro Tyr Gly Thr Ala Pro
290 295 300
Ala Ala Tyr Leu Glu Gly Gly Ala Glu Val Gly Arg Arg Trp Ala Gly
305 310 315 320
Ile Arg Gln Lys Tyr Val Ala Thr Leu Ala Glu Pro
325 330
<210> 4
<211> 259
<212> PRT
<213> Micromonospora sp.
<400> 4
Met Lys Gly Tyr Thr Tyr Pro Leu Ser Pro Arg Gly Val Ala Asn Leu
1 5 10 15
Ala Gly Lys Pro Pro Trp His Tyr Val Gly Asp Ala Val Gly Val Glu
20 25 30
Phe Trp Thr Ser Pro Glu Ala Ala Ala Ala Ser Leu Pro Thr Gly Leu
35 40 45
Asp Pro Asp Pro Ala Asn Pro Gly His Gly Tyr Ala Val Phe Ile Asp
50 55 60
Trp Gln Phe Asn Gly Ala Thr Asp Asp Tyr Leu Asp Pro Pro Phe Ser
65 70 75 80
Gln Tyr Ser Glu Phe Leu Val Leu Leu Asp Ala Gln Trp Gln Gly Thr
85 90 95
Pro Val Ala Trp Cys Pro Phe Ile Trp Val Asp Asn Asp Ala Ser Leu
100 105 110
Ala Arg Gly Trp Val Gln Gly Phe Pro Lys Lys Met Gly Ser Ile Arg
115 120 125
Gln Thr Arg Ala Phe Ala Ile Asp Ser Pro Ala Ala Pro Thr Val Gly
130 135 140
Lys Gly Gly Arg Phe Ala Ala Val Met Ser Ala Gly Gly Arg Arg Leu
145 150 155 160
Ala Glu Thr Thr Val Thr Leu Asp Arg Thr Thr Asp Arg Leu Pro Ala
165 170 175
Leu Thr Arg Pro Leu Val Asn Leu Arg His Phe Pro Arg Leu Ser Ala
180 185 190
Gly Gln His Asp Asn Pro Ala Val His Glu Leu Thr Met Ser Val Leu
195 200 205
Ala Asn Leu Lys Phe Ala Asn Thr Trp Ile Gly Thr Gly Glu Leu Arg
210 215 220
Phe Leu Pro Ala Pro Arg Glu Glu Leu Ala Asp Leu Thr Pro Arg Arg
225 230 235 240
Val Gly Val Gly Phe Arg Gly Ser Leu Ser Tyr Thr Val Asn Asp Leu
245 250 255
Arg Ile Leu
<210> 5
<211> 265
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: Actinobacteria bacterium sequence
<400> 5
Met Lys Gly Tyr Thr Val Pro Leu Ser Pro Arg Gly Val Ala Asn Leu
1 5 10 15
Ala Pro Ala Pro Pro Trp His Tyr Ala Gly Thr Val Val Gly Val Glu
20 25 30
Phe Phe Thr Asp Pro Ala Ala Ala Ala Ala Ala Leu Pro Glu Gly Leu
35 40 45
Ser Ser Asp Pro Asp Ser Ala Gly Arg Gly Val Ala Met Phe Ile Asp
50 55 60
Trp Gln Tyr Ser Ser Thr Asp Leu Glu Tyr Leu Asp Pro Ala Arg Ser
65 70 75 80
Gln Tyr Arg Glu Phe Leu Val Thr Leu Asp Ala His Tyr Tyr Gly Ala
85 90 95
Pro Val Ala Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ser Ala Met
100 105 110
Ala Arg Gly Trp Val Gln Gly Phe Pro Lys Lys Leu Gly Ala Val His
115 120 125
Gln Thr Arg Ala Tyr Ser Val Gly Gly Gln Gly Thr Pro Val Leu Gly
130 135 140
Pro Gly Gly Gln Phe Gly Ala Thr Ala Ser Ala Ala Gly Gln Arg Ile
145 150 155 160
Ala Glu Ala Lys Ile Thr Leu Glu Gln Ala Val Pro Asp Pro Ala Ala
165 170 175
Leu Met Ser Arg Pro Val Val Asn Leu Arg His Phe Pro Arg Leu Thr
180 185 190
Ala Gly Gln His His Lys Pro Ala Val His Glu Leu Val Met Ser Val
195 200 205
Leu Asp Gly Ala Ala Val Ser Asp Ala Trp Ala Gly Thr Ala Asp Leu
210 215 220
Ala Phe Leu Pro Ala Arg Gly Glu Glu Leu Ala Asp Leu Pro Ile Gln
225 230 235 240
Arg Thr Gly Arg Gly Phe His Phe Asp Leu Ala Tyr Thr Val Thr Asp
245 250 255
Leu Lys Thr Leu Ile Asp His Ser Asn
260 265
<210> 6
<211> 262
<212> PRT
<213> Streptomyces gancidicus
<400> 6
Met Leu Lys Gly Tyr Thr Val Pro Leu Ser Pro Lys Gly Glu Ala Asn
1 5 10 15
Ile Ala Pro Thr Pro Pro Trp His Tyr Ala Gly Asp Ile Val Gly Val
20 25 30
Glu Phe Phe Thr Glu Pro Ala Ala Ala Glu Ala Thr Leu Pro Glu Gly
35 40 45
Leu Asp Pro Asp Pro Asp Thr Ser Gly Arg Val Val Ala Phe Phe Val
50 55 60
Asp Trp Gln Phe Asn Gly Glu Arg Asp Glu Tyr Leu Asp Pro Val Arg
65 70 75 80
Ser Gln Tyr Arg Glu Phe Phe Val Leu Val Asp Ala Arg His Gln Gly
85 90 95
Arg Pro Val Ser Trp Cys Pro Tyr Ile Tyr Val Asp Asn His His Ala
100 105 110
Leu Ala Arg Gly Trp Ile Gln Gly Phe Pro Lys Lys Ala Gly Asn Val
115 120 125
His Gln Thr Arg Val Phe Ala Ser Pro Gly Lys Ala Ser Pro Thr Leu
130 135 140
Ser Pro Gly Ala Arg Phe Gly Ala Ser Val Ser Ser Asp Glu Arg Thr
145 150 155 160
Leu Ala Glu Ala Arg Val Thr Leu Glu Ala Pro Met Glu Asp Pro Ser
165 170 175
Ala Leu Leu Ser Arg Asp Thr Ile Asn Leu Arg His Phe Pro Thr Leu
180 185 190
Glu Ala Gly Arg Tyr Asp Lys Pro Ala Val His Glu Leu Val Arg Met
195 200 205
Asp Tyr Ala Asp Gln Gln Val Ala Asp Val Trp Thr Gly Thr Ser Glu
210 215 220
Ile Thr Leu Phe Pro Ala Val Gly Glu Glu Leu Ala Asp Leu Ala Pro
225 230 235 240
Val Arg Ser Gly Met Gly Phe Arg Ala Ser Met Ser Tyr Asn Val Thr
245 250 255
Gln Val Glu Pro Leu Leu
260
<210> 7
<211> 264
<212> PRT
<213> Kutzneria sp.
<400> 7
Met Leu Gly Tyr Ser Leu Pro Leu Ser Ala Asn Gly Thr Ala Asn Val
1 5 10 15
Val Pro Ala Pro Pro Trp His Tyr Ala Gly Asp Val Val Gly Val Glu
20 25 30
Phe Trp Thr Thr Pro Ala Ala Ala Ala Ala Thr Leu Pro Ser Gly Leu
35 40 45
Thr Pro Asp Pro Thr Thr Ser Gly His Ala Tyr Ala Leu Phe Val Asp
50 55 60
Trp Gln Trp Ala Gly Ser His Gln Glu Tyr Leu Asp Pro Val Arg Ser
65 70 75 80
Gln Tyr Ser Glu Phe Leu Ile Leu Met Asp Ala Gln Phe Gln Gly Arg
85 90 95
Ala Val Ala Trp Cys Pro Tyr Ile Trp Val Asp Asn Asp Ala Ala Leu
100 105 110
Ala Arg Gly Trp Phe Gln Gly Phe Pro Lys Lys Leu Gly Ala Ile Arg
115 120 125
Gln Thr Arg Ala Phe Ser Val Pro Gly Gln Ala Ser Pro Val Val Gly
130 135 140
Pro Gly Gly Gln Phe Gly Ala Ser Leu Ser Ala Ala Gly Arg Arg Leu
145 150 155 160
Ala Glu Ala Gln Ile Thr Leu Gln Ala Pro Ser Ala Thr Leu Pro Ala
165 170 175
Leu Gly Arg Pro Ile Val Asn Leu Arg His Phe Pro Arg Leu Ile Ala
180 185 190
Gly Gln Tyr Asp Asn Pro Ser Val His Glu Leu Thr Gln Ser Val Leu
195 200 205
Asp Thr Pro Val Val Gly Asn Asn Trp Thr Gly Thr Ser Thr Leu Asn
210 215 220
Phe Phe Thr Ala Pro Gly Glu Glu Leu Ala Asp Leu Gln Pro Val Arg
225 230 235 240
Thr Gly Ser Gly Phe Arg Gly Ser Leu Ser Tyr Thr Val Thr Thr Leu
245 250 255
Lys Met Leu Ser Gly Pro Asp Ala
260
<210> 8
<211> 265
<212> PRT
<213> Streptomyces olivochromogenes
<400> 8
Met Lys Gly Tyr Thr Val Pro Leu Ser Pro Arg Gly Ile Ala Asn Leu
1 5 10 15
Ala Pro Ala Pro Pro Trp His Tyr Ala Gly Thr Val Val Gly Val Glu
20 25 30
Phe Phe Thr Asp Pro Ala Ala Ala Ala Ala Thr Leu Pro Glu Gly Leu
35 40 45
Thr Pro Asp Pro Asp Ser Ala Gly Arg Gly Val Ala Met Phe Ile Asp
50 55 60
Trp Gln Tyr Ser Ser Thr Gly Leu Glu Tyr Leu Asp Pro Ala Arg Ser
65 70 75 80
Gln Tyr Arg Glu Phe Leu Leu Thr Leu Asp Ala His Tyr Asn Gly Thr
85 90 95
Pro Val Ala Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ser Ala Met
100 105 110
Ala Arg Gly Trp Val Gln Gly Phe Pro Lys Lys Leu Gly Ala Val His
115 120 125
Gln Thr Arg Ala Tyr Ser Val Gly Gly Pro Gly Thr Pro Val Leu Gly
130 135 140
Pro Gly Gly Gln Phe Gly Ala Thr Ala Ser Ala Ala Gly Gln Arg Ile
145 150 155 160
Ala Glu Ala Lys Val Thr Leu Glu Gln Pro Val Pro Asp Pro Ala Ala
165 170 175
Leu Met Ser Arg Pro Val Val Asn Leu Arg His Phe Pro Arg Leu Ala
180 185 190
Ala Gly Gln His Asp Lys Pro Ala Val His Glu Leu Val Met Ser Val
195 200 205
Leu Asp Gly Val Ala Val Ser Asp Ala Trp Ala Gly Thr Ala Asp Leu
210 215 220
Ala Phe Leu Pro Ala His Gly Glu Glu Leu Ala Asp Leu Pro Val Gln
225 230 235 240
Arg Thr Gly Arg Gly Phe His Phe Asp Leu Ala Tyr Thr Val Thr Asp
245 250 255
Leu Lys Thr Leu Ile Asp Arg Ser Asn
260 265
<210> 9
<211> 328
<212> PRT
<213> Sphingobium xenophagum
<400> 9
Met Ala Arg Thr Leu Met Lys Pro Asp Asp Val Lys Gly Ala Trp Ala
1 5 10 15
Ile Ile Pro Thr Pro Ala Lys Asp Asp Ala Ser Asp Trp Arg Ala Thr
20 25 30
Lys Thr Val Asp Leu Asp Glu Thr Ala Arg Val Val Asn Gly Leu Ile
35 40 45
Asp Ala Gly Ile Asn Gly Ile Leu Ser Met Gly Thr Leu Gly Glu Ala
50 55 60
Ala Thr Met Thr His Asp Glu Lys Leu Asp Phe Ile Lys Ala Leu Val
65 70 75 80
Asp Ala Ala Ala Gly Arg Val Pro Ile Phe Val Gly Thr Thr Cys Leu
85 90 95
Asn Thr Arg Asp Thr Ile Ala Leu Thr Arg Gln Ala Leu Asp Ile Gly
100 105 110
Ala Asp Gly Thr Met Leu Gly Val Pro Met Trp Cys Ala Pro Ser Val
115 120 125
Asp Val Ala Val Gln Phe Tyr Lys Asp Leu Ala Glu Ala Val Pro Glu
130 135 140
Met Asn Ile Ala Ile Tyr Ala Asn Pro Glu Ala Phe Lys Phe Asp Phe
145 150 155 160
Pro Arg Ser Phe Trp Ala Gln Val Ala Glu Ile Pro Gln Val Val Thr
165 170 175
Ala Lys Tyr Ile Gly Val Ala His Leu Leu Pro Asp Leu Ala Ala Ile
180 185 190
Arg Gly Arg Ile Lys Leu Leu Pro Ile Asp Phe Asp Tyr Tyr Gly Ala
195 200 205
Ala Arg Met Asp Glu Ser Ile Asp Ala Phe Trp Ser Ser Gly Ala Val
210 215 220
Cys Asp Pro Leu Val Thr Thr Thr Leu Arg Asp Leu Val Ser Gln Ala
225 230 235 240
Arg Ala Thr Gly Asp Trp Ser Ala Ala Arg Ala Phe Met Gly Arg Leu
245 250 255
Gly Pro Thr Ala Ala Pro Leu Phe Pro Asn Gly Ser Phe Lys Glu Phe
260 265 270
Ser Thr Tyr Asn Ile Ala Leu Glu Lys Ala Arg Met Asn Ala Gly Gly
275 280 285
Trp Met Asn Ala Gly Pro Val Arg Pro Pro Tyr His Leu Cys Pro Glu
290 295 300
Pro Tyr Leu Glu Gly Ala Arg Leu Ser Gly Arg Met Trp Ala Glu Leu
305 310 315 320
Gly Lys Ala Leu Ala Ala Glu Lys
325
<210> 10
<211> 332
<212> PRT
<213> Alcaligenes faecalis
<400> 10
Met Ala Lys Ser Gly Leu Leu Asn Ala Ser Asp Ile His Gly Val Trp
1 5 10 15
Ser Ile Leu Pro Thr Pro Ser Lys Pro Asp Ala Ser Asp Trp Arg Ala
20 25 30
Thr Asn Thr Val Asp Leu Asp Glu Thr Ala Arg Ala Val Glu Gly Leu
35 40 45
Ile Ala Ala Gly Ala Asn Gly Ile Leu Ser Met Gly Thr Leu Gly Glu
50 55 60
Cys Glu Ser Leu Thr Trp Glu Glu Lys Lys Val Phe Met Gln Thr Ile
65 70 75 80
Val Glu Thr Ala Arg Gly Arg Val Pro Val Phe Val Gly Thr Thr Thr
85 90 95
Leu Asn Thr Arg Asp Thr Ile Glu Gln Thr Arg Tyr Ala His Ser Ile
100 105 110
Gly Ala Asp Gly Thr Met Leu Gly Ile Pro Met Trp Cys Asn Pro Cys
115 120 125
Val Asp Met Ala Val Gln Tyr Tyr Lys Asp Val Ala Glu Ala Val Pro
130 135 140
Glu Met Asn Ile Ala Ile Tyr Ala Asn Thr Glu Ala Phe Lys Phe Asp
145 150 155 160
Phe Pro Arg Ala Phe Trp Ala Arg Val Ser Glu Ile Arg Gln Val Val
165 170 175
Ala Ala Lys Tyr Ile Gly Ile Glu Phe Leu Leu Gln Asp Leu His Leu
180 185 190
Thr Lys His Arg Met Lys Leu Leu Pro Leu Asp Tyr Gln Tyr Tyr Ala
195 200 205
Ala Ala Arg Met Asp Asp Phe Val Asp Ala Phe Trp Ser Ser Gly Thr
210 215 220
Val Cys Gly Pro Leu Val Ser Thr Thr Leu Arg Asp Lys Val Ile Ala
225 230 235 240
Ala Arg Arg Thr Lys Asp Trp Thr Asp Ala His Ala Phe Gln Gly Arg
245 250 255
Leu Val Lys Thr Ala Ala Pro Phe Pro Glu Asp Ser Phe Lys Thr Phe
260 265 270
Ser Ile Tyr Asn Val Ala Leu Glu Lys Gly Arg Ile Asp Ala Ala Gly
275 280 285
Trp Met Asn Ala Gly Pro Val Arg Pro Pro Tyr Asn Asp Ile Cys Pro
290 295 300
Ala Ser Tyr Leu Asp Ser Trp Lys Ala Ser Gly Gln Arg Trp Ala Glu
305 310 315 320
Leu His Lys Gln Leu Glu Thr Glu Ser Ser Gly Lys
325 330
<210> 11
<211> 328
<212> PRT
<213> Novosphingobium aromaticivorans
<400> 11
Met Ala Arg Glu Leu Leu Thr Ala Ala Asp Val Lys Gly Ala Trp Ala
1 5 10 15
Ile Val Pro Thr Pro Ala Lys Glu Gly Ala Ser Asp Trp Arg Ala Ala
20 25 30
Asp Thr Val Asn Val Glu Glu Ala Ala Arg Met Ile Asp Gly Leu Ile
35 40 45
Glu Ala Gly Val Asp Gly Ile Leu Ser Met Gly Thr Leu Gly Glu Ala
50 55 60
Ala Thr Met Thr Leu Asp Glu Lys Leu Val Phe Met Lys Thr Ile Val
65 70 75 80
Asp Thr Ala Ala Gly Arg Val Pro Val Phe Val Gly Thr Thr Cys Ile
85 90 95
Asn Thr Arg Asp Thr Ile Ala Leu Thr Arg Lys Ala Val Asp Ile Gly
100 105 110
Ala Thr Gly Thr Met Leu Gly Val Pro Met Trp Cys Ala Pro Ser Val
115 120 125
Asp Val Ala Val Gln Phe Tyr Arg Asp Val Ala Glu Ala Val Pro Asp
130 135 140
Ile Asn Ile Ala Ile Tyr Ala Asn Pro Glu Ala Phe Lys Phe Asp Phe
145 150 155 160
Pro Arg Thr Phe Trp Gly Gln Val Ala Glu Ile Pro Gln Val Val Thr
165 170 175
Ala Lys Tyr Ile Gly Val Gly Thr Leu Leu Pro Asp Leu Ala Ala Ile
180 185 190
Lys Gly Arg Ile Lys Leu Leu Pro Ile Asp Phe Asp Tyr Tyr Gly Ala
195 200 205
Ala Arg Met Asp Asp Ser Ile Asp Ala Phe Trp Thr Ser Gly Ala Val
210 215 220
Cys His Pro Leu Val Ser Thr Thr Leu Arg Asp Val Val Ala Ala Ala
225 230 235 240
Arg Ala Ser Gly Asp Trp Ser Ala Ala Lys Ala Phe Met Gly Arg Leu
245 250 255
Ala Pro Thr Ala Ala Thr Leu Phe Pro Asn Gly Ser Phe Lys Glu Phe
260 265 270
Ser Thr Tyr Asn Ile Pro Leu Glu Lys Ala Arg Met Thr Ala Gly Gly
275 280 285
Trp Met Asn Ala Gly Pro Cys Arg Pro Pro Tyr His Leu Cys Pro Glu
290 295 300
Asn Tyr Leu Glu Gly Ala Arg Asn Ser Gly Arg Met Trp Ala Glu Leu
305 310 315 320
Gly Lys Ala Leu Glu Ala Glu Arg
325
<210> 12
<211> 331
<212> PRT
<213> Polymorphum gilvum
<400> 12
Met Thr Arg Lys Leu Leu Thr Val Asp Asp Val Asn Gly Cys Trp Ala
1 5 10 15
Ile Met Pro Thr Pro Ser Lys Pro Gly Ala Ser Asp Pro Asn Ala Val
20 25 30
Asp Thr Val Asp Leu Glu Glu Thr Ala Arg Ala Ala Glu Ala Leu Val
35 40 45
Ala Ala Gly Val Asp Gly Ile Leu Ser Leu Gly Thr Phe Gly Glu Ala
50 55 60
Ala Thr Thr Thr Trp Glu Glu Lys Gln Ala Phe Met Arg Thr Leu Val
65 70 75 80
Glu Thr Val Arg Gly Arg Val Pro Val Phe Gly Gly Thr Thr Ser Leu
85 90 95
Asn Thr Arg Asp Thr Ile Arg Met Thr Arg Ala Ala Arg Glu Ile Gly
100 105 110
Val Asp Gly Val Met Leu Gly Leu Pro Met Trp Val Gln Pro Asp Leu
115 120 125
Ala Thr Ala Val Gln Phe Phe Arg Asp Val Ala Ser Ala Cys Pro Asp
130 135 140
Val Ala Ile Cys Ala Tyr Ala Asn Pro Glu Ala Phe Lys Phe Glu Phe
145 150 155 160
Pro Arg Ala Phe Trp Ala Gln Ile Ala Asp Ile Pro Gln Ile Val Ser
165 170 175
Ala Lys Tyr Ile His Thr Ala Gly Leu Tyr Ala Asp Leu Asn Leu Thr
180 185 190
Lys Arg Arg Ile Arg Leu Met Pro Leu Asp Val Asp Tyr Tyr Ala Ala
195 200 205
Ala Arg Ile Asp Pro Asp Ala Cys Thr Ala Phe Trp Thr Ser Gly Ala
210 215 220
Val Cys Gly Pro Ala Pro Ala Ile Gln Leu Arg Asp Leu Val Ser Lys
225 230 235 240
Ala Lys Lys Thr Gly Asp Trp Thr Gly Ala Lys Lys Leu Thr Asp Arg
245 250 255
Ile Gly Gln Thr Tyr Arg Thr Leu Phe Pro Asn Gly Ser Phe Lys Asp
260 265 270
Phe Ser Val Tyr Asn Ile Gly Ile Glu Lys Ala Arg Met Asp Ala Ala
275 280 285
Gly Trp Met Lys Ala Gly Pro Cys Arg Ala Pro Tyr Ser Leu Val Pro
290 295 300
Glu Pro Tyr Leu Glu Gly Ala Arg Glu Ser Gly Arg Gln Trp Ala Lys
305 310 315 320
Leu Ala Ala Glu Leu Ala Thr Glu Arg Ala Glu
325 330
<210> 13
<211> 333
<212> PRT
<213> Burkholderia sp.
<400> 13
Met Ile His Pro Lys Leu Arg Ile Asp Ala Ser Gly Ile Asn Gly Leu
1 5 10 15
Trp Pro Ile Leu Pro Thr Pro Ala Lys Pro Asn Ala Ser Asp Trp Arg
20 25 30
Glu Arg Ser Thr Val Asp Leu Asp Glu Thr Ala Arg Ile Val Glu Ser
35 40 45
Leu Ile Asp Ala Gly Val Asp Gly Leu Leu Ser Leu Gly Thr Tyr Gly
50 55 60
Glu Ala His Ser Leu Leu Trp Glu Glu Lys Lys Ala Phe Val Gly Cys
65 70 75 80
Val Leu Glu Thr Ile Arg Gly Arg Ile Pro Phe Phe Thr Gly Thr Thr
85 90 95
Ala Leu Asn Thr Arg Glu Val Val Glu Gln Thr Arg Ala Met His Asp
100 105 110
Met Gly Val Ser Gly Thr Met Leu Gly Val Pro Met Trp Cys Lys Thr
115 120 125
Asp Leu Ala Thr Ala Val Gln Phe Phe Arg Asp Val Thr Glu Ala Cys
130 135 140
Pro Asp Thr Ala Leu Ala Ile Tyr Ala Asn Thr Glu Ala Phe Lys Phe
145 150 155 160
Glu Phe Pro Arg Pro Phe Trp Ala Glu Ile Gly Lys Met Pro Gln Ala
165 170 175
Val Ala Cys Lys Tyr Leu Gly Ile Gly Met Leu Ala Val Asp Leu Glu
180 185 190
Leu Ala Pro Asn Met Arg Phe Leu Pro Asn Glu Gln Asp Tyr Tyr Ala
195 200 205
Ala Ala Arg Ile Asp Pro Glu Arg Val Thr Ala Phe Trp Ser Ser Gly
210 215 220
Ala Leu Cys Gly Pro Leu Pro Ala Leu Thr Leu Arg Asp Arg Val Ala
225 230 235 240
Arg Ala Lys Ser Ser Asn Asp Trp Thr Ser Ala Lys Glu Ile Ala Asp
245 250 255
Arg Met Arg Ala Cys Asp Val Gly Phe Phe Pro Lys Gly Glu Phe Ser
260 265 270
Glu Phe Ser Lys Phe Asn Ala Pro Leu Glu Lys Ala Arg Met Asn Thr
275 280 285
Ala Gly Tyr Val Asn Ala Gly Pro Cys Arg Pro Pro Tyr His Val Ile
290 295 300
Pro Gln Glu Tyr Leu Ala Gly Ala Glu Arg Ser Gly Arg Ala His Ala
305 310 315 320
Ala Leu Asn Ala Glu Leu Lys Gln Ala Glu His Ser Ile
325 330
<210> 14
<211> 330
<212> PRT
<213> Paraburkholderia sartisoli
<400> 14
Met Ser Lys Gln Arg Lys Gln Arg Leu Gly Thr Glu Asp Val Asn Gly
1 5 10 15
Ala Trp Val Ile Met Pro Thr Pro Ala Lys Pro Glu Ala Ser Asp Trp
20 25 30
Arg Ala Thr Asp Thr Val Asp Leu Asp Glu Thr Ala Arg Ile Val Glu
35 40 45
Ala Leu Ile Asp Ser Gly Val Asn Gly Ile Leu Ser Leu Gly Thr Phe
50 55 60
Gly Glu Cys Ala Thr Leu Thr Trp Glu Glu Lys Gln Ala Phe Ile Gly
65 70 75 80
Ala Val Val Glu Thr Thr Arg Gly Arg Val Pro Phe Phe Cys Gly Thr
85 90 95
Thr Ala Leu Asn Thr Arg Glu Val Val Arg Gln Thr Arg Ala Ala Leu
100 105 110
Asp Ile Gly Val Asp Gly Thr Met Leu Gly Val Pro Met Trp Ser Arg
115 120 125
Met Glu Val Pro Ala Ala Val Gln Phe Tyr Arg Asp Val Ala Glu Ala
130 135 140
Cys Pro Glu Ala Ala Ile Ala Val Tyr Ala Asn Ala Asp Ala Phe Lys
145 150 155 160
Phe Glu Phe Pro Arg Ala Phe Trp Ala Gln Val Ala Gln Ile Pro Gln
165 170 175
Val Val Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu Asp Leu
180 185 190
Thr Leu Ala Pro Gly Ile Arg Phe Leu Pro His Glu Asp Asp Tyr Tyr
195 200 205
Ala Ala Ala Arg Val Ala Pro Glu Arg Val Thr Ala Phe Trp Ser Ser
210 215 220
Gly Ala Met Cys Gly Pro Ala Thr Ala Ile Arg Leu Arg Asp Glu Val
225 230 235 240
Ala Lys Ala Lys Gln Thr Gly Asp Trp Arg Leu Ala Lys Glu Leu Ser
245 250 255
Asp Ala Met Arg Arg Ala Asp Ala Thr Leu Phe Pro Arg Gly Asp Phe
260 265 270
Ala Glu Phe Ser Lys Tyr Asn Ile Ala Ile Glu Lys Glu Arg Met Asn
275 280 285
Ala Ala Gly Trp Leu Arg Ala Gly Pro Cys Arg Pro Pro Tyr His Ile
290 295 300
Ala Pro Glu Glu Tyr Leu Asp Gly Ala Arg Gln Ser Gly Arg Ala Trp
305 310 315 320
Ala Glu Leu His Gln Gln Tyr Ser Asp Leu
325 330
<210> 15
<211> 332
<212> PRT
<213> Pseudomonas sp.
<400> 15
Met Met Ser Asp Met Val Lys Pro Arg Met Thr Ala Asp Asp Val Asn
1 5 10 15
Gly Val Trp Val Ile Met Pro Thr Pro Ala Lys Pro Asp Ala Ser Asp
20 25 30
Trp Arg Val Glu Asn Thr Val Asp Leu Asp Glu Thr Val Arg Ile Val
35 40 45
Glu Asn Leu Leu Ala Ser Gly Val Asn Gly Ile Met Ser Asn Gly Thr
50 55 60
Phe Gly Glu Cys Ala Thr Leu Thr Trp Asp Glu Lys Arg Asp Phe Ile
65 70 75 80
Ala Thr Val Ala Glu Thr Ile Lys Gly Arg Val Pro Phe Phe Cys Gly
85 90 95
Thr Thr Ala Leu His Thr Arg Glu Val Ile Arg Gln Thr Arg Glu Val
100 105 110
Met Arg Leu Gly Ala Asp Gly Val Met Leu Gly Leu Pro Met Trp Cys
115 120 125
Lys Met Glu Thr Pro Ser Ala Ile Gln Phe Tyr Arg Asp Val Ala Glu
130 135 140
Ala Val Pro Asp Ala Ala Ile Ala Val Tyr Ala Asn Pro Glu Ala Phe
145 150 155 160
Lys Tyr Glu Phe Pro Arg Glu Phe Trp Ala Gln Val Ser Glu Ile Pro
165 170 175
Gln Val Val Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu Asp
180 185 190
Leu Arg Leu Ala Ser Ser Ile Arg Phe Leu Pro His Glu Asp Asp Tyr
195 200 205
Tyr Ala Ala Ala Arg Ile Asn Pro Glu Arg Met Thr Ala Phe Trp Ser
210 215 220
Ser Ala Ala Met Cys Gly Pro Ala Thr Pro Leu Lys Leu Arg Asp Ala
225 230 235 240
Val Ala Asp Ala Lys Val Thr Gly Lys Trp Ser Val Ala Lys Ala Ile
245 250 255
Ser Asp Glu Met Arg Lys Ala Asp Ser Met Leu Phe Pro Lys Gly Asp
260 265 270
Phe Ser Glu Phe Ser Lys Tyr Asn Ile Gly Leu Glu Lys Ala Arg Met
275 280 285
Asp Glu Ala Gly Trp Leu Lys Ala Gly Pro Cys Arg Pro Pro Tyr His
290 295 300
Val Ile Pro Glu Met Tyr Leu Glu Gly Ala Arg Lys Ser Gly Arg Ala
305 310 315 320
Trp Ala Glu Leu His Ala Lys Tyr Ser Ala Glu Gly
325 330
<210> 16
<211> 331
<212> PRT
<213> Comamonas thiooxydans
<400> 16
Met Ala Lys Gln Lys Lys Ser Arg Met Thr Ala Glu Asp Ile His Gly
1 5 10 15
Ala Trp Val Ile Met Pro Thr Pro Ala Thr Pro Asp Ala Ser Asp Trp
20 25 30
Arg Val Gln His Thr Val Asp Leu Glu Glu Thr Ala Arg Ile Val Glu
35 40 45
Ala Leu Ile Ala Ala Gly Val Asn Gly Ile Phe Ser Asn Gly Thr Phe
50 55 60
Gly Glu Cys Ala Thr Leu Thr Trp Glu Glu Lys Arg Asp Phe Ile Ala
65 70 75 80
Thr Val Val Glu Thr Ala Arg Gly Arg Val Pro Phe Phe Cys Gly Thr
85 90 95
Thr Ala Leu His Thr Arg Glu Val Ile Arg Gln Thr Arg Glu Ala Met
100 105 110
Asp Ile Gly Ala Ser Gly Thr Met Leu Gly Val Pro Met Trp Cys Lys
115 120 125
Met Glu Val Pro Thr Ala Val Gln Phe Tyr Arg Asp Val Ala Glu Ala
130 135 140
Val Pro Glu Ala Ala Ile Ala Ile Tyr Ala Asn Pro Glu Ala Phe Lys
145 150 155 160
Phe Asp Phe Pro Arg Ser Phe Trp Ala Gln Val Ser Asn Ile Pro Gln
165 170 175
Val Ile Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu Asp Leu
180 185 190
Arg Leu Ala Pro Ser Ile Arg Phe Leu Pro His Glu Asp Asp Tyr Tyr
195 200 205
Ala Ala Ala Arg Ile Asp Pro Glu Arg Met Thr Ala Phe Trp Ser Ser
210 215 220
Gly Ala Met Cys Gly Pro Ala Thr Ala Ile Arg Leu Arg Asp Thr Val
225 230 235 240
Gly Ala Ala Lys Arg Ser Gly Asp Trp Thr Asp Ala Lys Ala Ile Ser
245 250 255
Asp Ala Met Arg Gln Ala Asp Ser Thr Leu Phe Pro Arg Gly Asp Phe
260 265 270
Ser Glu Phe Ser Lys Phe Asn Ile Gly Leu Glu Lys Ala Arg Met Asp
275 280 285
Ala Ala Gly Trp Leu Lys Ala Gly Pro Cys Arg Pro Pro Tyr His Ile
290 295 300
Val Pro Glu Glu His Leu Ala Gly Ala Arg Lys Ser Gly Glu Ala Trp
305 310 315 320
Ala Ala Leu His Ala Arg Tyr Ala Thr Leu Asp
325 330
<210> 17
<211> 270
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: Verrucomicrobia bacterium sequence
<400> 17
Met Asn Thr Ala Lys Leu Ile Gly Phe Asn Tyr Pro Leu Thr Pro Lys
1 5 10 15
Gly Lys Ser Thr Leu Asn Pro Pro Pro Pro Trp Tyr Tyr Ser Ser Asp
20 25 30
Phe Leu Asp Val Glu Phe Trp Ala Gln Pro Ala Ala Val Ala Ser Leu
35 40 45
Leu Pro Asn Gly Leu Glu Pro Asp Pro Ala Ala Asn Gly His Cys Asn
50 55 60
Ala Leu Phe Tyr Asp Trp Gln Phe Ser Gly Asp Asn Glu Glu Tyr Leu
65 70 75 80
Asp Pro Ala Arg Tyr Gln Tyr Arg Glu Phe Phe Ile Leu Val Asp Ala
85 90 95
Leu Phe Glu Gly Arg Ser Val Ser Tyr Cys Pro Tyr Ile Phe Val Asp
100 105 110
Asn Asp Ala Ala Leu Ala Arg Gly Trp Thr Gln Gly Tyr Pro Lys Arg
115 120 125
Leu Gly Gln Val Phe Gln Thr Arg Tyr Tyr Ala Ala Thr Ser Lys Ala
130 135 140
Gly Pro Ala Leu Ala Pro Gly Ser Lys Phe Ala Gly Ser Leu Thr Ala
145 150 155 160
Ala Gly Gln Leu Ile Ala Glu Ala Val Val Thr Leu Arg Gln Ala Val
165 170 175
Thr Asp Pro Ser Leu Leu Lys Gln Lys Pro Val Ile Asn Leu Leu His
180 185 190
Val Pro Arg Leu Ala Ala Asp Lys His Asp Lys Pro Ala Ile His Glu
195 200 205
Leu Val Glu Asn Val Pro Ser Ser Val Lys Ile Glu Gln Ala Trp Ile
210 215 220
Gly Glu Gly Ser Leu Thr Leu Pro Val Cys Arg Gly Glu Glu Ile Ser
225 230 235 240
Asp Leu Ala Pro Leu Arg Cys Gly Lys Gly Ile Arg Ala Ser Met Ala
245 250 255
Tyr Val Val Asp Asp Leu Lys Thr Leu Lys Asp Leu Arg Asn
260 265 270
<210> 18
<211> 267
<212> PRT
<213> Dyella psychrodurans
<400> 18
Met Lys Ser Asn Phe Phe Val Pro Met Thr Pro Arg Gly Leu Ser Asn
1 5 10 15
Ile Ser Pro Pro Pro Pro Trp His Tyr Ala Gly Asp Phe Leu Ile Ile
20 25 30
Asp Phe Trp Ala Arg Pro Asp Ala Val Ala Ser Leu Leu Pro Ala Glu
35 40 45
Leu Gln Pro Asp Val Lys Ala Glu Gly His Ala Gln Ala Tyr Phe Ile
50 55 60
Asp Trp Gln Tyr Thr Ala Ala His Asp Glu Phe Leu Asp Pro Ala Arg
65 70 75 80
Tyr Gln Tyr Arg Glu Phe Phe Val Leu Val Asp Ala Leu Phe Gln Gly
85 90 95
Lys Pro Val Ala Phe Cys Pro Tyr Ile Phe Val Asp Asn Asp Ala Ala
100 105 110
Ile Ala Arg Gly Trp Ala Gln Gly Phe Pro Lys Arg Tyr Gly Thr Ile
115 120 125
Leu Gln Thr Arg Leu Phe Ala Ala Ser Gly Pro Ala Ser Pro Lys Leu
130 135 140
Ala Pro Gly Gly Arg Phe Gly Ala Ser Ala Ser Thr Ala Gly Gln Arg
145 150 155 160
Ile Ala Arg Gly Leu Val Thr Leu Glu Lys Ala Val Thr Asp Pro Ala
165 170 175
Ala Leu Gly Ser Arg Pro Thr Ile Asn Leu Arg His Phe Pro Arg Leu
180 185 190
Ala Ala Gly Gln Trp Glu Arg Pro Ala Val His Glu Leu Val Glu Ser
195 200 205
Val Met Asp Asn Phe Thr Val Ala Asp Ala Trp Met Gly Lys Gly Glu
210 215 220
Leu Thr Leu Pro Glu Cys Glu Asn Glu Glu Leu Ser Asp Leu Ala Pro
225 230 235 240
Val Arg Cys Gly Asn Gly Tyr Arg Met Ser Val Ser Tyr Ser Val Thr
245 250 255
Asp Leu Lys Thr Leu Val Asp His Ser Ala Lys
260 265
<210> 19
<211> 269
<212> PRT
<213> Paraburkholderia oxyphila
<400> 19
Met Leu Lys Gly Tyr Met Ala Pro Leu Ser Pro Leu Gly Lys Ala Ser
1 5 10 15
Ile Asn Pro Pro Pro Pro Trp His Tyr Ser Gly Asp Val Ile Gly Ala
20 25 30
Glu Phe Trp Ala Glu Pro Glu Ala Thr Ala Ala Thr Leu Pro Pro Gly
35 40 45
Leu Asp Pro Asp Pro Ser Thr Ala Gly His Gly Val Val Leu Phe Ile
50 55 60
Asp Trp Gln Phe Thr Ala Gln Asp Asp Glu Phe Leu Asp Pro Ala Arg
65 70 75 80
Tyr Gln Tyr Arg Glu Cys Leu Phe Leu Val Asp Ala Val His Lys Gly
85 90 95
Thr Pro Val Met Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ala Ala
100 105 110
Leu Ala Arg Gly Trp Ala Gln Gly Phe Pro Lys Lys Leu Ala Ser Val
115 120 125
Tyr Gln Thr Arg Thr Phe Ala Ala Pro Ser Ala Ala Ala Ala Pro Val
130 135 140
Ala Ser Gly Ser Arg Phe Gly Ala Ser Leu Ser Ala His Gly Glu Arg
145 150 155 160
Leu Ala Glu Ala Arg Ile Thr Leu Arg Gln Pro Val Ala Asp Pro Lys
165 170 175
Ser Leu Leu Ala Arg Pro Thr Val Asn Arg Arg Tyr Phe Ala Ser Leu
180 185 190
Val Ala Gly Leu His Asp Lys Pro Ala Val Asp Glu Leu Val Leu Ser
195 200 205
Val Thr Asp Asn Leu Ser Val Ala Asp Ala Trp Ala Gly Asp Ala Glu
210 215 220
Leu Leu Phe Pro Asp Ala Arg Gly Glu Glu Ile Cys Ala Phe Gly Pro
225 230 235 240
Val Lys Val Gly Gly Gly Phe Arg Phe Ser Leu Ala Tyr Ser Val Thr
245 250 255
Asp Leu Lys Leu Leu Glu Asp Leu Thr Arg Leu Gly Lys
260 265
<210> 20
<211> 331
<212> PRT
<213> Polymorphum gilvum
<400> 20
Met Lys Arg Asp Met Leu Thr Val Asp Asp Val Thr Gly Cys Trp Ala
1 5 10 15
Ile Met Pro Thr Pro Ser Lys Pro Asn Ala Ser Asp Pro Ser Ala Thr
20 25 30
Asp Thr Val Asp Leu Asp Glu Thr Ala Arg Val Ala Glu Ala Leu Val
35 40 45
Ala Ala Gly Val Asp Gly Ile Leu Ser Leu Gly Thr Leu Gly Glu Cys
50 55 60
Ala Thr Thr Thr Trp Asp Glu Lys Gln Ala Tyr Met Arg Thr Leu Val
65 70 75 80
Glu Thr Leu Arg Gly Arg Ile Pro Val Phe Gly Gly Thr Thr Gly Leu
85 90 95
Asn Thr Arg Asp Ser Ile Ala Met Thr Arg Ala Ala Arg Glu Ile Gly
100 105 110
Val Asp Gly Val Met Leu Gly Leu Pro Met Trp Val Gln Pro Asp Val
115 120 125
Pro Thr Ala Val Gln Phe Tyr Arg Asp Val Ala Ala Ala Cys Pro Asp
130 135 140
Val Ala Ile Cys Val Tyr Ala Asn Pro Glu Ala Phe Lys Phe Glu Phe
145 150 155 160
Pro Arg Ala Phe Trp Ala Gln Ile Ala Glu Ile Pro Gln Val Val Ser
165 170 175
Ala Lys Tyr Ile Asn Ile Ala Ala Leu Tyr Thr Asp Leu Asn Leu Thr
180 185 190
Arg Arg Arg Ile Arg Leu Met Pro Leu Asp Val Asp Tyr Tyr Ala Ala
195 200 205
Ala Arg Val Asp Pro Glu Ala Cys Ser Ala Phe Trp Thr Ser Gly Ala
210 215 220
Val Cys Gly Pro Ala Pro Ala Ile Gln Leu Arg Asp Leu Val Leu Glu
225 230 235 240
Ala Arg Gln Ser Gly Asp Trp Ser Lys Ala Lys Ala Leu Thr Asp Arg
245 250 255
Ile Gly Met Thr Tyr Arg Thr Leu Phe Pro Asn Gly Ser Phe Lys Glu
260 265 270
Phe Ser Val Tyr Asn Ile Gly Ile Glu Lys Ala Arg Met Asp Ala Ala
275 280 285
Gly Trp Met Thr Ala Gly Pro Val Arg Pro Pro Tyr His Ile Val Pro
290 295 300
Glu Ala Ile Leu Glu Gly Gly Arg Glu Ser Gly Arg Gln Trp Ala Lys
305 310 315 320
Leu Ala Ala Glu Leu Glu Arg Glu Ala Gly Arg
325 330
<210> 21
<211> 270
<212> PRT
<213> Pseudomonas sp.
<400> 21
Met Thr Gln Ser Tyr Thr Thr Pro Leu Thr Pro Arg Gly Leu Ser Ser
1 5 10 15
Ile Ala Pro Pro Pro Pro Trp His Tyr Ser Gly Asp Phe Leu Val Val
20 25 30
Glu Phe Trp Ala Asp Pro Ile Ala Val Ala Asn Thr Leu Pro Ala Gly
35 40 45
Leu Thr Val Asp Ser Ala Ser Pro Gly His Ala Ser Ala Val Phe Val
50 55 60
Asp Trp Gln Phe Thr Gly Glu Asn Asp Glu Leu Leu Asp Pro Ala Arg
65 70 75 80
Tyr Gln Tyr Arg Glu Phe Phe Ile Leu Leu Asp Ala Leu His Glu Gly
85 90 95
Gln Pro Val Ser Tyr Cys Pro Tyr Ile Phe Val Asp Asn Asp Ser Ala
100 105 110
Leu Met Arg Gly Leu Ile Gln Gly Phe Pro Lys Arg Leu Gly Ala Val
115 120 125
His Gln Thr Arg Thr Phe Ser Ala Pro Ser Arg Ala Ala Ala Gln Val
130 135 140
Glu Pro Gly Ala Arg Phe Ala Ala Thr Ala Ser Thr Ala Gly Gln Arg
145 150 155 160
Ile Ala Arg Gly Glu Val Gln Leu Gln His Lys Ile Asp Asp Val Ser
165 170 175
Lys Leu Gly Phe Gly Ala Arg Pro Leu Ile Asn Leu Arg His Phe Pro
180 185 190
Arg Leu Ala Thr Gly Gln His Asn Asp Pro Ala Val His Glu Leu Val
195 200 205
Val Ser Val Met Asp Asn Pro Asn Ile Val Asp Ala Trp Ala Gly Glu
210 215 220
Gly Asn Leu Val Phe Pro Gln Ala Glu Gly Glu Glu Val Ser Asp Leu
225 230 235 240
Ala Pro Thr Arg Val Gly Ala Gly Phe Arg Ala Ser Met Ser Tyr Thr
245 250 255
Val Thr Asp Leu Lys Ala Leu Pro Asn Ala Thr Ile Glu Arg
260 265 270
<210> 22
<211> 267
<212> PRT
<213> Afipia sp.
<400> 22
Met Leu Arg Gly Phe Thr Val Pro Lys Ser Pro Phe Gly Gln Ala Ala
1 5 10 15
Leu Thr Pro Pro Pro Pro Trp His Tyr Ala Gly Asp Val Val Gly Val
20 25 30
Glu Phe Trp Thr Asp Pro Glu Ala Thr Ala Ala Thr Leu Pro Asn Gly
35 40 45
Leu Ser Pro Asp Pro Asn Ser Asn Gly His Ala Val Met Met Phe Leu
50 55 60
Asp Trp Gln Phe Thr Ala Gln Asp Asp Glu Tyr Leu Glu Pro Ala Arg
65 70 75 80
Tyr Gln Tyr Arg Glu Ala Phe Ile Leu Val Asp Ala Met Tyr Arg Asp
85 90 95
Glu Pro Val Met Trp Cys Pro Tyr Ile Tyr Val Asp Asn Asp Ala Ala
100 105 110
Leu Ala Arg Gly Trp Thr Gln Gly Phe Pro Lys Lys Met Gly Ser Ile
115 120 125
Phe Gln Thr Arg Ser Phe Ala Ala Ser Gly Pro Ala Ala Ala Pro Val
130 135 140
Ala Ser Gly Ser Arg Phe Gly Ala Ser Leu Ser Ala His Gly Gln Arg
145 150 155 160
Leu Ala Glu Ala Cys Val Thr Leu His Arg Pro Val Glu Asn Gly Leu
165 170 175
Ser Leu Leu Ser Arg Pro Thr Val Leu Leu Arg Tyr Phe Pro Arg Leu
180 185 190
Ala Ala Gly Tyr Gln Asp Lys Pro Ala Val Asn Glu Leu Ala Met Ser
195 200 205
Ile Thr Asp Asn Leu Thr Val Ala Gly Ala Trp Ile Gly Lys Gly Glu
210 215 220
Leu Asn Phe Pro Glu Ala Ser Gly Glu Glu Leu Asn Ala Leu Ala Pro
225 230 235 240
Lys Arg Ile Glu Ser Gly Phe Arg Tyr Ser Leu Ser Tyr Ser Val Ser
245 250 255
Asp Leu Lys Ile Leu Glu Asp His Gly Ser Gln
260 265
<210> 23
<211> 331
<212> PRT
<213> Pseudomonas kilonensis
<400> 23
Met Ser Thr Lys Arg Thr Leu Met Thr Ala Asn Asp Val Gln Gly Ala
1 5 10 15
Trp Ala Ile Met Pro Thr Ser Ala Lys Asp Gly Ser Glu Ser Trp Arg
20 25 30
Met Thr Asp Ser Leu Asp Leu Asp Ala Thr Val Ala Ala Ile Asn Gly
35 40 45
Leu Ile Asp Ser Gly Val Asp Gly Ile Leu Thr Met Gly Thr Tyr Gly
50 55 60
Glu Ala Ala Thr Leu Thr Val Asp Glu Lys Lys Arg Phe Met Ala Cys
65 70 75 80
Leu Val Glu Thr Val Ala Gly Arg Val Pro Cys Phe Val Gly Thr Thr
85 90 95
Thr Leu Asn Thr Arg Asp Thr Ile Glu Leu Thr Arg Tyr Ala Ala Asp
100 105 110
Leu Gly Ala Asp Gly Thr Met Leu Gly Leu Pro Met Trp Cys Ala Pro
115 120 125
Thr Leu Pro Ala Ala Val Arg Phe Tyr Arg Asp Val Ala Glu Ala Cys
130 135 140
Pro Asp Met Ala Gln Cys Ile Tyr Ala Asn Pro Glu Ala Phe Arg Phe
145 150 155 160
Asp Phe Pro Pro Pro Phe Trp Ala Gln Val Ala Asp Ile Pro Gln Val
165 170 175
Val Ser Ala Lys Phe Thr Ser Val Gly His Leu Ile Gln Asn Leu Glu
180 185 190
Ile Thr Arg Gly Lys Val Arg Ala Leu Pro Ile Glu Leu Asp Tyr Tyr
195 200 205
Ala Ala Thr Arg Val Asp Asp Asp Val Cys Ala Phe Trp Ser Ser Gly
210 215 220
Ala Val Cys Gly Pro Thr Pro Thr Ile Ala Leu Arg Asp Glu Ile Thr
225 230 235 240
Arg Ala Lys Thr Ser Gly Asp Trp Thr Lys Ala Lys Glu Leu Thr Asp
245 250 255
Lys Met Trp Ala Ala Val Thr Pro Met Phe Pro Ala Gly Gly Phe Arg
260 265 270
Glu Phe Ser Met Tyr Asn Ile Ala Ile Asp Lys Met Arg Met Gln Thr
275 280 285
Ala Gly Trp Met Arg Val Gly Pro Thr Arg Pro Pro Tyr Asp Met Met
290 295 300
Pro Asp His Ile Arg Gly Gly Ala Val Glu Ala Gly Lys Leu Trp Ala
305 310 315 320
Glu Leu Ala Lys Ala Thr Val Leu Ala Gly Ala
325 330
<210> 24
<211> 270
<212> PRT
<213> Paraburkholderia hospita
<400> 24
Met Ser Lys Gln Tyr Ala Val Pro Leu Ser Pro Arg Gly Leu Ser Ser
1 5 10 15
Ile Ala Pro Pro Pro Pro Trp His Tyr Ser Gly Asp Phe Leu Ile Val
20 25 30
Glu Phe Trp Ala Asp Pro Ala Ala Val Ala Ala Thr Leu Pro Ala Gly
35 40 45
Leu Ser Val Asp Pro Ser Ser Pro Gly His Ala Thr Ala Leu Phe Val
50 55 60
Asp Trp Gln Phe Thr Gly Gln Asn Asp Glu Leu Leu Asp Pro Ala Arg
65 70 75 80
Tyr Gln Tyr Arg Glu Phe Phe Leu Leu Val Asp Ala Leu Tyr Glu Gly
85 90 95
Gln Pro Val Ala Tyr Cys Pro Tyr Ile Phe Val Asp Asn Asp Ser Ala
100 105 110
Met Met Arg Gly Leu Ile Gln Gly Phe Pro Lys Arg Leu Gly Ala Val
115 120 125
His Gln Thr Arg Thr Phe Ala Ala Pro Ser Leu Ala Ala Ala Gln Val
130 135 140
Ala Pro Gly Ala Arg Phe Ala Ala Thr Ala Ser Thr Ala Gly Gln Arg
145 150 155 160
Ile Ala Arg Ala Glu Val Lys Leu Thr Gly Lys Val Asp Asp Pro Ser
165 170 175
Thr Val Ser Leu Ala Gly Arg Pro Ile Val Asn Leu Arg His Phe Pro
180 185 190
Arg Leu Ala Ala Gly Gln His Glu Thr Pro Ala Val His Glu Leu Val
195 200 205
Met Ser Ile Met Asp Asp Pro Arg Met Ala Asp Val Trp Ala Gly Glu
210 215 220
Gly Gln Leu Ser Leu Pro Val Ala Glu Gly Glu Glu Ile Ser Asp Leu
225 230 235 240
Ala Pro Val Arg Val Gly Ala Gly Tyr Arg Leu Ser Met Ser Tyr Thr
245 250 255
Val Thr Asp Leu Lys Thr Leu Ser Asp Gly Thr Gln Ala Ala
260 265 270
<210> 25
<211> 331
<212> PRT
<213> Celeribacter persicus
<400> 25
Met Lys Lys Pro Leu Leu Thr Val Asp Asp Val Thr Gly Cys Trp Ala
1 5 10 15
Ile Met Pro Thr Pro Ser Lys Pro Asn Gly Ser Asp Ile Asn Ala Thr
20 25 30
Asp Thr Val Asp Leu Asp Glu Thr Ala Arg Ala Ala Glu Ala Leu Val
35 40 45
Ala Ser Gly Val Asn Gly Ile Leu Ser Gln Gly Thr Phe Gly Glu Ala
50 55 60
Ala Thr Thr Thr Trp Glu Glu Lys Gln Ala Phe Leu Arg Thr Leu Val
65 70 75 80
Glu Thr Val Asp Gly Arg Val Pro Val Phe Gly Gly Thr Thr Ser Leu
85 90 95
Asn Thr Arg Asp Thr Ile Arg Met Thr Lys Ala Val Arg Glu Ile Gly
100 105 110
Val Asp Gly Val Met Leu Gly Pro Pro Met Trp Cys Gln Pro Asp Val
115 120 125
Pro Thr Ala Val Gln Phe Phe Arg Asp Val Ala Glu Ala Cys Pro Asp
130 135 140
Thr Ala Ile Cys Ala Tyr Ala Asn Pro Glu Ala Phe Lys Phe Asp Phe
145 150 155 160
Pro Arg Ala Phe Trp Ala Gln Ile Ala Glu Ile Pro Gln Val Val Ser
165 170 175
Ala Lys Tyr Met Asn Ile Ala Ala Leu Tyr Met Asp Leu Asn Leu Thr
180 185 190
Gly Arg Lys Ile Arg Leu Met Pro Leu Asp Met Asp Tyr Tyr Ala Ala
195 200 205
Ala Arg Met Asp Pro Glu Ala Cys Thr Ala Phe Trp Thr Ser Gly Ala
210 215 220
Ile Cys Gly Pro Glu Pro Val Ile Gln Leu Arg Asp Leu Val Ala Glu
225 230 235 240
Ala His Lys Thr Gly Asp Trp Gly Lys Ala Lys Ala Leu Thr Asp Arg
245 250 255
Ile Ala Ala Thr Tyr Arg Thr Leu Phe Pro Asn Gly Ser Phe Lys Glu
260 265 270
Phe Ser Val Tyr Asn Ile Gly Ile Glu Lys Ala Arg Ile Asp Ala Ala
275 280 285
Gly Trp Met Thr Ala Gly Pro Cys Arg Pro Pro Tyr His Val Ile Pro
290 295 300
Glu Pro Ile Leu Asp Gly Ala Arg Glu Ala Gly Leu Gln Trp Ala Lys
305 310 315 320
Leu Val Ser Ala Leu Glu Ser Glu Lys Thr Ala
325 330
<210> 26
<211> 334
<212> PRT
<213> Pseudomonas stutzeri
<400> 26
Met Ser Asn Lys Thr Met Lys Pro Ala Arg Leu Thr Ala Glu Asp Ile
1 5 10 15
His Gly Val Trp Ala Ile Met Pro Thr Pro Ala Thr Pro Asp Ala Ser
20 25 30
Asn Trp Arg Ser Thr Asn Thr Val Asp Leu Asn Glu Thr Ala Arg Ile
35 40 45
Val Glu Glu Leu Ile Ala Ala Gly Val Asn Gly Ile Leu Ser Met Gly
50 55 60
Thr Phe Gly Glu Cys Ala Thr Leu Thr Trp Glu Glu Lys Arg Asp Tyr
65 70 75 80
Val Ser Thr Ile Val Glu Thr Ile Arg Gly Arg Val Pro Tyr Phe Cys
85 90 95
Gly Thr Thr Ala Leu Asn Thr Arg Glu Val Ile Arg Gln Thr Arg Glu
100 105 110
Phe Met Asp Met Gly Ala Ser Gly Thr Met Leu Gly Val Pro Met Trp
115 120 125
Val Lys Met Asp Leu Pro Thr Ala Val Gln Phe Tyr Arg Asp Val Ala
130 135 140
Glu Ala Val Pro Glu Ala Ala Ile Ala Ile Tyr Ala Asn Pro Glu Ala
145 150 155 160
Phe Lys Phe Asp Phe Pro Arg Pro Phe Trp Ala Glu Met Ser Lys Ile
165 170 175
Pro Gln Val Val Thr Ala Lys Tyr Leu Gly Ile Gly Met Leu Asp Leu
180 185 190
Asp Leu Lys Leu Ala Pro Asn Ile Arg Phe Leu Pro His Glu Asp Asp
195 200 205
Tyr Tyr Ala Ala Ala Arg Ile Asn Pro Glu Arg Met Thr Ala Phe Trp
210 215 220
Ser Ser Gly Ser Met Cys Gly Pro Ala Thr Ala Ile Met Leu Arg Asp
225 230 235 240
Ala Val Asp Gln Ala Lys Ser Ser Gly Asp Trp Ile Lys Ala Lys Ala
245 250 255
Ile Ser Asp Asp Met Arg Ala Ala Asp Ser Thr Leu Phe Pro Arg Gly
260 265 270
Asp Phe Ser Glu Phe Ser Lys Tyr Asn Ile Gly Leu Glu Lys Ala Arg
275 280 285
Met Asp Ala Ala Gly Trp Leu Thr Ala Gly Pro Cys Arg Pro Pro Tyr
290 295 300
Asn Ile Val Pro Glu Asp Tyr Ile Ala Gly Ala Leu Lys Ser Gly Lys
305 310 315 320
Ala Trp Ala Ala Leu His Ala Lys Tyr Ser Lys Glu Leu Lys
325 330
<210> 27
<211> 272
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: Candidatus Rokubacteria bacterium
sequence
<400> 27
Met Leu Lys Gly Phe Asn Tyr Pro Leu Thr Pro Lys Gly Lys Ser Thr
1 5 10 15
Leu Asn Pro Ser Pro Pro Trp His Tyr Ser Ala Asp Phe Leu Asp Ile
20 25 30
Glu Phe Trp Ser Glu Pro Ser Ala Val Thr Ala Val Leu Pro Ala Gly
35 40 45
Leu Asp Pro Asp Pro Ala Ala Asn Gly His Gly His Ala Leu Phe Tyr
50 55 60
Asp Trp Gln Phe Ala Gly Glu Asn Glu Glu Tyr Leu Asp Pro Ala Arg
65 70 75 80
Tyr Gln Tyr Arg Glu Phe Phe Leu Leu Val Asp Ala Leu Tyr Glu Gly
85 90 95
Gln Pro Ile Ser Tyr Cys Pro Tyr Ile Phe Val Asp Asn Asp Ala Ala
100 105 110
Ile Ala Arg Gly Trp Thr Gln Gly Tyr Pro Lys Arg Leu Gly Gln Val
115 120 125
Phe Gln Thr Arg Tyr Tyr Ala Ala Thr Gly Lys Ala Gly Pro Ala Leu
130 135 140
Ala Pro Gly Ser Lys Phe Ala Gly Ser Leu Thr Ala Gly Gly Gln Arg
145 150 155 160
Leu Ala Glu Ala Leu Val Thr Leu Lys Glu Pro Val Thr Asp Pro Ala
165 170 175
Leu Leu Lys Gln Arg Pro Ile Val Asn Leu Leu His Tyr Pro Gln Leu
180 185 190
Ala Ala Asp Lys Gln Asp Glu Pro Ala Ile His Gln Leu Val Glu Asn
195 200 205
Val Pro His Asp Leu Lys Ile Glu Gln Ala Trp Ile Gly Asp Gly Ser
210 215 220
Leu Thr Leu Pro Val Cys Arg Ser Glu Glu Leu Ser Asp Leu Ala Pro
225 230 235 240
Val Arg Cys Gly Lys Gly Ile Arg Ala Ser Met Ala Tyr Ile Val Asp
245 250 255
Asp Leu Lys Thr Leu Lys Asp Leu Thr Lys Gly Phe Ser Leu Leu Ala
260 265 270
<210> 28
<211> 262
<212> PRT
<213> Streptomyces sp.
<400> 28
Met Leu Lys Gly Tyr Thr Val Pro Leu Ser Pro Lys Gly Glu Ala Asn
1 5 10 15
Ile Ala Pro Thr Pro Pro Trp His Tyr Ala Gly Asp Ile Val Gly Val
20 25 30
Glu Phe Phe Thr Glu Pro Ser Ala Ala Glu Ala Thr Leu Pro Glu Gly
35 40 45
Leu Asp Pro Asp Pro Asp Thr Ser Gly Arg Val Val Ala Phe Phe Val
50 55 60
Asp Trp Gln Phe Asn Gly Glu Gln Asp Glu Tyr Leu Asp Pro Val Arg
65 70 75 80
Ser Gln Tyr Arg Glu Phe Phe Val Leu Val Asp Ala Arg His Gln Gly
85 90 95
Arg Pro Val Ser Trp Cys Pro Tyr Ile Tyr Val Asp Asn His His Ala
100 105 110
Leu Ala Arg Gly Trp Ile Gln Gly Phe Pro Lys Lys Ala Gly Asn Val
115 120 125
His Gln Thr Arg Val Phe Ala Ser Pro Gly Lys Ala Ser Pro Thr Leu
130 135 140
Ser Pro Gly Ala Arg Phe Gly Ala Thr Val Ser Ser Asp Glu Arg Thr
145 150 155 160
Leu Ala Glu Ala Arg Val Thr Leu Glu Ala Pro Met Glu Asp Pro Ser
165 170 175
Ala Leu Leu Ala Arg Asp Thr Ile Asn Leu Arg His Phe Pro Thr Leu
180 185 190
Glu Val Gly Lys Tyr Asp Lys Pro Ala Val His Glu Leu Val Arg Met
195 200 205
Asp Tyr Ala Asp Gln Gln Val Ala Asp Val Trp Thr Gly Thr Ser Glu
210 215 220
Ile Thr Leu Phe Pro Ala Val Gly Glu Glu Leu Ala Asp Leu Ala Pro
225 230 235 240
Val Arg Pro Gly Met Gly Phe Arg Ala Ser Met Ser Tyr Asn Val Thr
245 250 255
Gln Val Glu Pro Leu Gly
260
<210> 29
<211> 268
<212> PRT
<213> Paraburkholderia oxyphila
<400> 29
Met Asn Lys Pro Tyr Ala Val Pro Leu Ser Pro Arg Gly Leu Ser Ser
1 5 10 15
Ile Ala Pro Pro Pro Pro Trp His Tyr Ala Gly Asp Phe Ile Leu Val
20 25 30
Glu Phe Trp Ala Asp Pro Ala Ala Ala Ala Ala Val Leu Pro Lys Gly
35 40 45
Leu Ser Leu Asp Pro Ala Ser Pro Gly His Ala Thr Ala Leu Phe Ile
50 55 60
Asp Trp Gln Phe Thr Gly Ser Asn Asp Glu Met Leu Asp Pro Ala Arg
65 70 75 80
Tyr Gln Tyr Arg Glu Phe Phe Val Leu Val Asp Ala Leu His Glu Gly
85 90 95
Lys Pro Val Ser Phe Cys Pro Tyr Ile Phe Val Asp Asn Asp Ser Ala
100 105 110
Met Met Arg Gly Leu Ile Gln Gly Phe Pro Lys Arg Tyr Gly Gln Ile
115 120 125
His Gln Thr Arg Thr Phe Ala Ala Leu Ser Pro Ala Ala Ala Pro Val
130 135 140
Thr Ala Gly Thr Arg Phe Ala Ala Thr Ala Ser Ala Ala Gly Gln Arg
145 150 155 160
Leu Ala His Ala Glu Val Lys Leu Glu Ala Ala Val Gln Asp Val Ser
165 170 175
Lys Leu Gly Ile Ala Gly Arg Pro Val Val Asn Gln Arg Tyr Phe Pro
180 185 190
Arg Leu Ala Ala Gly Gln His Asp Thr Pro Ala Val Asn Glu Leu Val
195 200 205
Leu Ser Ile Met Asp Asn Ala Gln Ile Ala Asp Val Trp Ala Gly Glu
210 215 220
Gly Lys Leu Thr Phe Pro Phe Ala Gln Gly Glu Glu Ile Ala Asp Leu
225 230 235 240
Gln Pro Val Arg Val Gly Ala Gly Phe Arg Gly Ser Met Ala Tyr Ser
245 250 255
Val Thr Asp Leu Lys Thr Leu Val Asp His Thr Lys
260 265
<210> 30
<211> 266
<212> PRT
<213> Agrobacterium rhizogenes
<400> 30
Met Leu Lys Gly Phe Thr Leu Pro Lys Ser Pro Phe Gly Gln Ala Ala
1 5 10 15
Leu Thr Pro Pro Pro Pro Trp His Tyr Ser Gly Asp Val Ile Gly Val
20 25 30
Glu Phe Arg Thr Asp Pro Ser Ala Thr Ala Ala Thr Leu Pro Asn Gly
35 40 45
Leu Ser Pro Asp Pro Lys Ser Asn Gly His Ala Val Met Met Phe Val
50 55 60
Asp Trp Gln Phe Thr Ala Gln Asn Asp Glu Tyr Leu Asp Pro Ala Arg
65 70 75 80
Tyr Arg Tyr Arg Glu Ala Phe Val Leu Leu Asp Ala Val Tyr Arg Asn
85 90 95
Ala Pro Val Met Trp Cys Pro Tyr Val Phe Val Asp Asn Asp Ala Ala
100 105 110
Leu Ala Arg Gly Trp Thr Gln Gly Phe Pro Lys Lys Ile Gly Ser Ile
115 120 125
Phe Gln Thr Arg Thr Tyr Ala Ala Ala Ser Pro Ala Ala Ala Pro Val
130 135 140
Ala Pro Gly Gly Arg Phe Gly Ala Ser Leu Ser Ala His Gly Gln Arg
145 150 155 160
Leu Ala Glu Ala Arg Ile Thr Leu Gln Glu Pro Val Glu Asp Gly Leu
165 170 175
Ser Leu Leu Ser Arg Pro Thr Val Leu Leu Arg Tyr Phe Pro Arg Leu
180 185 190
Ala Ala Gly Tyr Gln Asp Lys Pro Ala Val Asn Glu Leu Thr Met Ala
195 200 205
Ile Thr Asp Asn Leu Thr Val Ala Asp Ala Trp Ile Gly Asp Gly Glu
210 215 220
Leu Asn Leu Pro Glu Val His Gly Glu Glu Leu His Gly Leu Ala Pro
225 230 235 240
Ile Ala Ile Glu Ser Gly Phe Arg Tyr Ser Leu Ser Tyr Ser Val Thr
245 250 255
Asp Leu Lys Ile Leu Glu Asp His Ala Ser
260 265
<210> 31
<211> 262
<212> PRT
<213> Escherichia coli
<400> 31
Met Glu Asn Ser Phe Lys Ala Ala Leu Lys Ala Gly Arg Pro Gln Ile
1 5 10 15
Gly Leu Trp Leu Gly Leu Ser Ser Ser Tyr Ser Ala Glu Leu Leu Ala
20 25 30
Gly Ala Gly Phe Asp Trp Leu Leu Ile Asp Gly Glu His Ala Pro Asn
35 40 45
Asn Val Gln Thr Val Leu Thr Gln Leu Gln Ala Ile Ala Pro Tyr Pro
50 55 60
Ser Gln Pro Val Val Arg Pro Ser Trp Asn Asp Pro Val Gln Ile Lys
65 70 75 80
Gln Leu Leu Asp Val Gly Thr Gln Thr Leu Leu Val Pro Met Val Gln
85 90 95
Asn Ala Asp Glu Ala Arg Glu Ala Val Arg Ala Thr Arg Tyr Pro Pro
100 105 110
Ala Gly Ile Arg Gly Val Gly Ser Ala Leu Ala Arg Ala Ser Arg Trp
115 120 125
Asn Arg Ile Pro Asp Tyr Leu Gln Lys Ala Asn Asp Gln Met Cys Val
130 135 140
Leu Val Gln Ile Glu Thr Arg Glu Ala Met Lys Asn Leu Pro Gln Ile
145 150 155 160
Leu Asp Val Glu Gly Val Asp Gly Val Phe Ile Gly Pro Ala Asp Leu
165 170 175
Ser Ala Asp Met Gly Tyr Ala Gly Asn Pro Gln His Pro Glu Val Gln
180 185 190
Ala Ala Ile Glu Gln Ala Ile Val Gln Ile Arg Glu Ser Gly Lys Ala
195 200 205
Pro Gly Ile Leu Ile Ala Asn Glu Gln Leu Ala Lys Arg Tyr Leu Glu
210 215 220
Leu Gly Ala Leu Phe Val Ala Val Gly Val Asp Thr Thr Leu Leu Ala
225 230 235 240
Arg Ala Ala Glu Ala Leu Ala Ala Arg Phe Gly Ala Gln Ala Thr Ala
245 250 255
Val Lys Pro Gly Val Tyr
260
<210> 32
<211> 302
<212> PRT
<213> Escherichia coli
<400> 32
Met Pro Gln Ser Ala Leu Phe Thr Gly Ile Ile Pro Pro Val Ser Thr
1 5 10 15
Ile Phe Thr Ala Asp Gly Gln Leu Asp Lys Pro Gly Thr Ala Ala Leu
20 25 30
Ile Asp Asp Leu Ile Lys Ala Gly Val Asp Gly Leu Phe Phe Leu Gly
35 40 45
Ser Gly Gly Glu Phe Ser Gln Leu Gly Ala Glu Glu Arg Lys Ala Ile
50 55 60
Ala Arg Phe Ala Ile Asp His Val Asp Arg Arg Val Pro Val Leu Ile
65 70 75 80
Gly Thr Gly Gly Thr Asn Ala Arg Glu Thr Ile Glu Leu Ser Gln His
85 90 95
Ala Gln Gln Ala Gly Ala Asp Gly Ile Val Val Ile Asn Pro Tyr Tyr
100 105 110
Trp Lys Val Ser Glu Ala Asn Leu Ile Arg Tyr Phe Glu Gln Val Ala
115 120 125
Asp Ser Val Thr Leu Pro Val Met Leu Tyr Asn Phe Pro Ala Leu Thr
130 135 140
Gly Gln Asp Leu Thr Pro Ala Leu Val Lys Thr Leu Ala Asp Ser Arg
145 150 155 160
Ser Asn Ile Ile Gly Ile Lys Asp Thr Ile Asp Ser Val Ala His Leu
165 170 175
Arg Ser Met Ile His Thr Val Lys Gly Ala His Pro His Phe Thr Val
180 185 190
Leu Cys Gly Tyr Asp Asp His Leu Phe Asn Thr Leu Leu Leu Gly Gly
195 200 205
Asp Gly Ala Ile Ser Ala Ser Gly Asn Phe Ala Pro Gln Val Ser Val
210 215 220
Asn Leu Leu Lys Ala Trp Arg Asp Gly Asp Val Ala Lys Ala Ala Gly
225 230 235 240
Tyr His Gln Thr Leu Leu Gln Ile Pro Gln Met Tyr Gln Leu Asp Thr
245 250 255
Pro Phe Val Asn Val Ile Lys Glu Ala Ile Val Leu Cys Gly Arg Pro
260 265 270
Val Ser Thr His Val Leu Pro Pro Ala Ser Pro Leu Asp Glu Pro Arg
275 280 285
Lys Ala Gln Leu Lys Thr Leu Leu Gln Gln Leu Lys Leu Cys
290 295 300
<210> 33
<211> 297
<212> PRT
<213> Escherichia coli
<400> 33
Met Ala Thr Asn Leu Arg Gly Val Met Ala Ala Leu Leu Thr Pro Phe
1 5 10 15
Asp Gln Gln Gln Ala Leu Asp Lys Ala Ser Leu Arg Arg Leu Val Gln
20 25 30
Phe Asn Ile Gln Gln Gly Ile Asp Gly Leu Tyr Val Gly Gly Ser Thr
35 40 45
Gly Glu Ala Phe Val Gln Ser Leu Ser Glu Arg Glu Gln Val Leu Glu
50 55 60
Ile Val Ala Glu Glu Ala Lys Gly Lys Ile Lys Leu Ile Ala His Val
65 70 75 80
Gly Cys Val Ser Thr Ala Glu Ser Gln Gln Leu Ala Ala Ser Ala Lys
85 90 95
Arg Tyr Gly Phe Asp Ala Val Ser Ala Val Thr Pro Phe Tyr Tyr Pro
100 105 110
Phe Ser Phe Glu Glu His Cys Asp His Tyr Arg Ala Ile Ile Asp Ser
115 120 125
Ala Asp Gly Leu Pro Met Val Val Tyr Asn Ile Pro Ala Leu Ser Gly
130 135 140
Val Lys Leu Thr Leu Asp Gln Ile Asn Thr Leu Val Thr Leu Pro Gly
145 150 155 160
Val Gly Ala Leu Lys Gln Thr Ser Gly Asp Leu Tyr Gln Met Glu Gln
165 170 175
Ile Arg Arg Glu His Pro Asp Leu Val Leu Tyr Asn Gly Tyr Asp Glu
180 185 190
Ile Phe Ala Ser Gly Leu Leu Ala Gly Ala Asp Gly Gly Ile Gly Ser
195 200 205
Thr Tyr Asn Ile Met Gly Trp Arg Tyr Gln Gly Ile Val Lys Ala Leu
210 215 220
Lys Glu Gly Asp Ile Gln Thr Ala Gln Lys Leu Gln Thr Glu Cys Asn
225 230 235 240
Lys Val Ile Asp Leu Leu Ile Lys Thr Gly Val Phe Arg Gly Leu Lys
245 250 255
Thr Val Leu His Tyr Met Asp Val Val Ser Val Pro Leu Cys Arg Lys
260 265 270
Pro Phe Gly Pro Val Asp Glu Lys Tyr Leu Pro Glu Leu Lys Ala Leu
275 280 285
Ala Gln Gln Leu Met Gln Glu Arg Gly
290 295
<210> 34
<211> 256
<212> PRT
<213> Escherichia coli
<400> 34
Met Asn Asn Asp Val Phe Pro Asn Lys Phe Lys Ala Ala Leu Ala Ala
1 5 10 15
Lys Gln Val Gln Ile Gly Cys Trp Ser Ala Leu Ser Asn Pro Ile Ser
20 25 30
Thr Glu Val Leu Gly Leu Ala Gly Phe Asp Trp Leu Val Leu Asp Gly
35 40 45
Glu His Ala Pro Asn Asp Ile Ser Thr Phe Ile Pro Gln Leu Met Ala
50 55 60
Leu Lys Gly Ser Ala Ser Ala Pro Val Val Arg Val Pro Thr Asn Glu
65 70 75 80
Pro Val Ile Ile Lys Arg Leu Leu Asp Ile Gly Phe Tyr Asn Phe Leu
85 90 95
Ile Pro Phe Val Glu Thr Lys Glu Glu Ala Glu Leu Ala Val Ala Ser
100 105 110
Thr Arg Tyr Pro Pro Glu Gly Ile Arg Gly Val Ser Val Ser His Arg
115 120 125
Ala Asn Met Phe Gly Thr Val Ala Asp Tyr Phe Ala Gln Ser Asn Lys
130 135 140
Asn Ile Thr Ile Leu Val Gln Ile Glu Ser Gln Gln Gly Val Asp Asn
145 150 155 160
Val Asp Ala Ile Ala Ala Thr Glu Gly Val Asp Gly Ile Phe Val Gly
165 170 175
Pro Ser Asp Leu Ala Ala Ala Leu Gly His Leu Gly Asn Ala Ser His
180 185 190
Pro Asp Val Gln Lys Ala Ile Gln His Ile Phe Asn Arg Ala Ser Ala
195 200 205
His Gly Lys Pro Ser Gly Ile Leu Ala Pro Val Glu Ala Asp Ala Arg
210 215 220
Arg Tyr Leu Glu Trp Gly Ala Thr Phe Val Ala Val Gly Ser Asp Leu
225 230 235 240
Gly Val Phe Arg Ser Ala Thr Gln Lys Leu Ala Asp Thr Phe Lys Lys
245 250 255
<210> 35
<211> 213
<212> PRT
<213> Escherichia coli
<400> 35
Met Lys Asn Trp Lys Thr Ser Ala Glu Ser Ile Leu Thr Thr Gly Pro
1 5 10 15
Val Val Pro Val Ile Val Val Lys Lys Leu Glu His Ala Val Pro Met
20 25 30
Ala Lys Ala Leu Val Ala Gly Gly Val Arg Val Leu Glu Val Thr Leu
35 40 45
Arg Thr Glu Cys Ala Val Asp Ala Ile Arg Ala Ile Ala Lys Glu Val
50 55 60
Pro Glu Ala Ile Val Gly Ala Gly Thr Val Leu Asn Pro Gln Gln Leu
65 70 75 80
Ala Glu Val Thr Glu Ala Gly Ala Gln Phe Ala Ile Ser Pro Gly Leu
85 90 95
Thr Glu Pro Leu Leu Lys Ala Ala Thr Glu Gly Thr Ile Pro Leu Ile
100 105 110
Pro Gly Ile Ser Thr Val Ser Glu Leu Met Leu Gly Met Asp Tyr Gly
115 120 125
Leu Lys Glu Phe Lys Phe Phe Pro Ala Glu Ala Asn Gly Gly Val Lys
130 135 140
Ala Leu Gln Ala Ile Ala Gly Pro Phe Ser Gln Val Arg Phe Cys Pro
145 150 155 160
Thr Gly Gly Ile Ser Pro Ala Asn Tyr Arg Asp Tyr Leu Ala Leu Lys
165 170 175
Ser Val Leu Cys Ile Gly Gly Ser Trp Leu Val Pro Ala Asp Ala Leu
180 185 190
Glu Ala Gly Asp Tyr Asp Arg Ile Thr Lys Leu Ala Arg Glu Ala Val
195 200 205
Glu Gly Ala Lys Leu
210
<210> 36
<211> 205
<212> PRT
<213> Escherichia coli
<400> 36
Met Gln Trp Gln Thr Lys Leu Pro Leu Ile Ala Ile Leu Arg Gly Ile
1 5 10 15
Thr Pro Asp Glu Ala Leu Ala His Val Gly Ala Val Ile Asp Ala Gly
20 25 30
Phe Asp Ala Val Glu Ile Pro Leu Asn Ser Pro Gln Trp Glu Gln Ser
35 40 45
Ile Pro Ala Ile Val Asp Ala Tyr Gly Asp Lys Ala Leu Ile Gly Ala
50 55 60
Gly Thr Val Leu Lys Pro Glu Gln Val Asp Ala Leu Ala Arg Met Gly
65 70 75 80
Cys Gln Leu Ile Val Thr Pro Asn Ile His Ser Glu Val Ile Arg Arg
85 90 95
Ala Val Gly Tyr Gly Met Thr Val Cys Pro Gly Cys Ala Thr Ala Thr
100 105 110
Glu Ala Phe Thr Ala Leu Glu Ala Gly Ala Gln Ala Leu Lys Ile Phe
115 120 125
Pro Ser Ser Ala Phe Gly Pro Gln Tyr Ile Lys Ala Leu Lys Ala Val
130 135 140
Leu Pro Ser Asp Ile Ala Val Phe Ala Val Gly Gly Val Thr Pro Glu
145 150 155 160
Asn Leu Ala Gln Trp Ile Asp Ala Gly Cys Ala Gly Ala Gly Leu Gly
165 170 175
Ser Asp Leu Tyr Arg Ala Gly Gln Ser Val Glu Arg Thr Ala Gln Gln
180 185 190
Ala Ala Ala Phe Val Lys Ala Tyr Arg Glu Ala Val Gln
195 200 205
<210> 37
<211> 301
<212> PRT
<213> Azotobacter vinelandii
<400> 37
Met Pro Ala Pro Val Leu Ala Ala Thr Ser Pro Gly Ala Gly Arg Ala
1 5 10 15
Ile His Leu Ile Asn Pro Ala Met Pro Ala Phe Arg Ala Ala Phe Glu
20 25 30
Glu Thr Leu Met Lys Met Pro His Asn Ala Phe Lys Ala Ala Leu Gln
35 40 45
Arg Pro Glu Thr Gln Tyr Gly Ile Trp Ala Gly Phe Ala Ser Gly Tyr
50 55 60
Ala Ala Glu Ile Val Ala Gly Thr Gly Tyr Asp Trp Met Leu Ile Asp
65 70 75 80
Gly Glu His Ala Pro Asn Ser Val Pro Thr Ile Leu Ala Gln Leu Gln
85 90 95
Ser Val Ala Pro Tyr Pro Thr Gln Pro Val Val Arg Pro Val Cys Gly
100 105 110
Asp Pro Val Leu Ile Lys Gln Leu Leu Asp Ile Gly Ala Gln Thr Leu
115 120 125
Met Val Pro Met Val Glu Ser Ala Glu Gln Ala Arg Ala Leu Val Arg
130 135 140
Ala Met Arg Tyr Pro Pro His Gly Ile Arg Gly Val Gly Gly Gly Leu
145 150 155 160
Ala Arg Ala Thr Arg Trp Asp Gly Val Pro Asp Tyr Leu Asn Thr Ala
165 170 175
His Glu Glu Leu Cys Leu Ile Val Gln Val Glu Ser Arg Ala Gly Val
180 185 190
Glu Asn Val Glu Ala Ile Ala Ala Val Glu Gly Val Asp Ala Val Phe
195 200 205
Ile Gly Pro Ala Asp Leu Ser Ile Gly Leu Gly His Pro Gly Asp Pro
210 215 220
Gly His Pro Gln Val Gln Glu Leu Ile His His Ala Ile Glu Ala Thr
225 230 235 240
Arg Ala Ala Gly Lys Ala Cys Gly Ile Leu Ala Pro His Glu Glu Asp
245 250 255
Ala Arg Arg Tyr Arg Glu Trp Gly Cys Arg Phe Ile Ala Val Ala Ile
260 265 270
Asp Ile Ser Leu Leu Arg Gln Gly Ala Leu Ala Gly Leu Ala Arg Phe
275 280 285
Arg Asp Thr Pro Ala Ser Asp Ala Pro Ser Arg Thr Tyr
290 295 300
<210> 38
<211> 312
<212> PRT
<213> Corynebacterium glutamicum
<400> 38
Met Ala Ser Ala Thr Phe Thr Gly Val Ile Pro Pro Val Met Thr Pro
1 5 10 15
Leu His Ala Asp Gly Ser Val Asp Val Glu Ser Leu Arg Lys Leu Val
20 25 30
Asp His Leu Ile Asn Gly Gly Val Asp Gly Leu Phe Ala Leu Gly Ser
35 40 45
Ser Gly Glu Ala Ala Phe Leu Thr Arg Ala Gln Arg Lys Leu Ala Leu
50 55 60
Thr Thr Ile Ile Glu His Thr Ala Gly Arg Val Pro Val Thr Ala Gly
65 70 75 80
Val Ile Glu Thr Thr Thr Ala Arg Val Ile Glu Leu Val Glu Asp Ala
85 90 95
Leu Glu Ala Gly Ala Glu Gly Leu Val Ala Thr Ala Pro Phe Tyr Thr
100 105 110
Arg Thr His Asp Val Glu Ile Glu Glu His Phe Arg Lys Ile His Ala
115 120 125
Ala Ala Pro Glu Leu Pro Leu Phe Ala Tyr Asn Ile Pro Val Ser Val
130 135 140
His Ser Asn Leu Asn Pro Val Met Leu Leu Thr Leu Ala Lys Asp Gly
145 150 155 160
Val Leu Ala Gly Thr Lys Asp Ser Ser Gly Asn Asp Gly Ala Ile Arg
165 170 175
Ser Leu Ile Glu Ala Arg Asp Asp Ala Gly Leu Thr Glu Gln Phe Lys
180 185 190
Ile Leu Thr Gly Ser Glu Thr Thr Val Asp Phe Ala Tyr Leu Ala Gly
195 200 205
Ala Asp Gly Val Val Pro Gly Leu Gly Asn Val Asp Pro Ala Ala Tyr
210 215 220
Ala Ala Leu Ala Lys Leu Cys Leu Asp Gly Lys Trp Ala Glu Ala Ala
225 230 235 240
Ala Leu Gln Lys Arg Ile Asn His Leu Phe His Ile Val Phe Val Gly
245 250 255
Asp Thr Ser His Met Ser Gly Ser Ser Ala Gly Leu Gly Gly Phe Lys
260 265 270
Thr Ala Leu Ala His Leu Gly Ile Ile Glu Ser Asn Ala Met Ala Val
275 280 285
Pro His Gln Ser Leu Ser Asp Glu Glu Thr Ala Arg Ile His Ala Ile
290 295 300
Val Asp Glu Phe Leu Tyr Thr Ala
305 310
<210> 39
<211> 298
<212> PRT
<213> Campylobacter jejuni
<400> 39
Met Asp Lys Asn Ile Ile Ile Gly Ala Met Thr Ala Leu Ile Thr Pro
1 5 10 15
Phe Lys Asn Gly Lys Val Asp Glu Gln Ser Tyr Ala Arg Leu Ile Lys
20 25 30
Arg Gln Ile Glu Asn Gly Ile Asp Ala Val Val Pro Val Gly Thr Thr
35 40 45
Gly Glu Ser Ala Thr Leu Thr His Glu Glu His Arg Thr Cys Ile Glu
50 55 60
Ile Ala Val Glu Thr Cys Lys Glu Thr Lys Val Lys Val Leu Ala Gly
65 70 75 80
Ala Gly Ser Asn Ala Thr His Glu Ala Val Gly Leu Ala Lys Phe Ala
85 90 95
Lys Glu His Gly Ala Asp Gly Ile Leu Ser Val Ala Pro Tyr Tyr Asn
100 105 110
Lys Pro Thr Gln Gln Gly Leu Tyr Glu His Tyr Lys Ala Ile Ala Gln
115 120 125
Ser Val Asp Ile Pro Val Leu Leu Tyr Asn Val Pro Gly Arg Thr Gly
130 135 140
Cys Glu Ile Ser Thr Asp Thr Ile Ile Lys Leu Phe Arg Asp Cys Glu
145 150 155 160
Asn Ile Tyr Gly Val Lys Glu Ala Ser Gly Asn Ile Asp Lys Cys Val
165 170 175
Asp Leu Leu Ala His Glu Pro Arg Met Met Leu Ile Ser Gly Glu Asp
180 185 190
Ala Ile Asn Tyr Pro Ile Leu Ser Asn Gly Gly Lys Gly Val Ile Ser
195 200 205
Val Thr Ser Asn Leu Leu Pro Asp Met Ile Ser Thr Leu Thr His Phe
210 215 220
Ala Leu Asp Glu Asn Tyr Lys Glu Ala Lys Lys Ile Asn Asp Glu Leu
225 230 235 240
Tyr Asn Ile Asn Lys Ile Leu Phe Cys Glu Ser Asn Pro Ile Pro Ile
245 250 255
Lys Thr Ala Met Tyr Ile Ala Gly Leu Ile Glu Ser Leu Glu Phe Arg
260 265 270
Leu Pro Leu Cys Pro Pro Ser Lys Glu Asn Phe Ala Lys Ile Glu Glu
275 280 285
Val Met Lys Lys Tyr Lys Ile Lys Gly Phe
290 295
<210> 40
<211> 297
<212> PRT
<213> Caldanaerobacter subterraneus
<400> 40
Met Pro Val Phe Lys Gly Ser Cys Val Ala Ile Val Thr Pro Phe Thr
1 5 10 15
Glu Asn Gly Val Asn Phe Asp Lys Leu Gly Glu Leu Ile Glu Trp His
20 25 30
Ile Lys Glu Gly Thr Asp Ala Ile Leu Ile Cys Gly Thr Thr Gly Glu
35 40 45
Ala Ser Thr Met Thr Asp Glu Glu Gln Lys Glu Ala Ile Lys Phe Thr
50 55 60
Val Glu Lys Val Ala Lys Arg Ile Pro Val Ile Ala Gly Thr Gly Ser
65 70 75 80
Asn Asn Thr Ala His Ala Ile Glu Leu Ser Glu Tyr Ala Gln Ser Val
85 90 95
Gly Ala Asp Ala Leu Leu Val Ile Thr Pro Tyr Tyr Asn Lys Thr Thr
100 105 110
Gln Lys Gly Leu Val Ala His Phe Thr Glu Ile Ala Arg His Val Asp
115 120 125
Ile Pro Ile Ile Ile Tyr Asn Val Pro Ser Arg Thr Ser Leu Asn Met
130 135 140
Leu Pro Glu Thr Tyr Leu Glu Val Lys Lys Lys Ala Glu Asn Val Val
145 150 155 160
Gly Val Lys Glu Ala Ser Gly Asp Ile Ser Gln Ile Ala Glu Ile Ala
165 170 175
Arg Ile Met Gly Lys Ser Phe Glu Ile Tyr Ser Gly Asn Asp Asp Gln
180 185 190
Val Ile Pro Ile Met Ser Leu Gly Gly Leu Gly Val Ile Ser Val Thr
195 200 205
Ala Asn Ile Ile Pro Ala Lys Ile His Glu Met Thr Thr Ala Tyr Leu
210 215 220
Asn Gly Asp Ile Glu Lys Ala Arg Asp Met Gln Leu Glu Leu Asn Pro
225 230 235 240
Leu Asn Lys Ala Leu Phe Ile Glu Thr Asn Pro Ile Pro Val Lys Thr
245 250 255
Ala Met Asn Leu Met Gly Phe Gly Val Gly Pro Leu Arg Leu Pro Leu
260 265 270
Val Glu Met Ser Glu Lys Asn Leu Glu Tyr Leu Lys Ser Val Leu Arg
275 280 285
Gln Tyr Gly Leu Leu Lys Glu Glu Asn
290 295
<210> 41
<211> 310
<212> PRT
<213> Scheffersomyces stipitis
<400> 41
Met Thr Ile Ser Ala Ala Leu Pro Lys Arg Gly Val Tyr Thr Pro Val
1 5 10 15
Pro Thr Phe Phe Lys Lys Asp Leu His Thr Ile Asp Tyr Asp Ser Gln
20 25 30
Ile Glu His Ala Lys Phe Leu Gln Gln Asn Gly Ile Thr Gly Leu Val
35 40 45
Leu Leu Gly Ser Thr Gly Glu Asn Ser His Leu Thr Arg Lys Glu Arg
50 55 60
Ile Glu Leu Val Ser Thr Ile His Glu Glu Leu Pro Asp Phe Pro Leu
65 70 75 80
Met Ala Gly Val Ala Gln Asn Ser Val Glu Asp Ala Ile Glu Glu Ile
85 90 95
Leu Gln Leu Lys Asn Ala Gly Ala Gln His Ala Leu Val Leu Pro Ser
100 105 110
Ser Tyr Phe Gly Ala Ser Ile Lys Gln Gln Gly Ile Ile Asp Trp Tyr
115 120 125
Thr Glu Val Ala Asp Asn Ala Ser Leu Pro Val Leu Ile Tyr Val Tyr
130 135 140
Pro Gly Val Ser Asn Asn Ile Ser Ile Asp Pro Arg Thr Ile Lys Lys
145 150 155 160
Leu Ser Ala His Pro Asn Ile Val Gly Ala Lys Ile Ser His Gly Asp
165 170 175
Val Ser His His Ala Ile Ile Gly Leu Asp Gln Glu Ile Ala Ala Asn
180 185 190
Gln Phe Ile Thr Leu Thr Gly Leu Gly Gln Ile Leu Leu Pro Val Leu
195 200 205
Val Val Gly Ile Gln Gly Thr Val Asp Ala Leu Cys Gly Ala Phe Pro
210 215 220
Lys Ile Tyr Val Lys Leu Leu Glu Asn Tyr Asp Lys Gly Asp Leu Arg
225 230 235 240
Ala Ala Ala Glu Leu Gln Leu Val Ile Ser Arg Ala Glu Glu Leu Val
245 250 255
Val Lys Phe Gly Val Val Gly Ile Lys Lys Ala Ile His Phe Ala Thr
260 265 270
Gly Ile Gly Glu Thr Tyr Leu Gly Arg Ala Pro Leu Thr Gln Asp Val
275 280 285
Asn Asp Ala Asp Trp Lys Ser Tyr Asn Asp Tyr Leu Leu Gly Ile Val
290 295 300
Ser Val Glu Ser Thr Leu
305 310
<210> 42
<211> 288
<212> PRT
<213> Sulfolobus acidocaldarius
<400> 42
Met Glu Ile Ile Ser Pro Ile Ile Thr Pro Phe Asp Lys Gln Gly Lys
1 5 10 15
Val Asn Val Asp Ala Leu Lys Thr His Ala Lys Asn Leu Leu Glu Lys
20 25 30
Gly Ile Asp Ala Ile Phe Val Asn Gly Thr Thr Gly Leu Gly Pro Ala
35 40 45
Leu Ser Lys Asp Glu Lys Arg Gln Asn Leu Asn Ala Leu Tyr Asp Val
50 55 60
Thr His Lys Leu Ile Phe Gln Val Gly Ser Leu Asn Leu Asn Asp Val
65 70 75 80
Met Glu Leu Val Lys Phe Ser Asn Glu Met Asp Ile Leu Gly Val Ser
85 90 95
Ser His Ser Pro Tyr Tyr Phe Pro Arg Leu Pro Glu Lys Phe Leu Ala
100 105 110
Lys Tyr Tyr Glu Glu Ile Ala Arg Ile Ser Ser His Ser Leu Tyr Ile
115 120 125
Tyr Asn Tyr Pro Ala Ala Thr Gly Tyr Asp Ile Pro Pro Ser Ile Leu
130 135 140
Lys Ser Leu Pro Val Lys Gly Ile Lys Asp Thr Asn Gln Asp Leu Ala
145 150 155 160
His Ser Leu Glu Tyr Lys Leu Asn Leu Pro Gly Val Lys Val Tyr Asn
165 170 175
Gly Ser Asn Thr Leu Ile Tyr Tyr Ser Leu Leu Ser Leu Asp Gly Val
180 185 190
Val Ala Ser Phe Thr Asn Phe Ile Pro Glu Val Ile Val Lys Gln Arg
195 200 205
Asp Leu Ile Lys Gln Gly Lys Leu Asp Asp Ala Leu Arg Leu Gln Glu
210 215 220
Leu Ile Asn Arg Leu Ala Asp Ile Leu Arg Lys Tyr Gly Ser Ile Ser
225 230 235 240
Ala Ile Tyr Val Leu Val Asn Glu Phe Gln Gly Tyr Asp Val Gly Tyr
245 250 255
Pro Arg Pro Pro Ile Phe Pro Leu Thr Asp Glu Glu Ala Leu Ser Leu
260 265 270
Lys Arg Glu Ile Glu Pro Leu Lys Arg Lys Ile Gln Glu Leu Val His
275 280 285
<210> 43
<211> 294
<212> PRT
<213> Saccharolobus solfataricus
<400> 43
Met Pro Glu Ile Ile Thr Pro Ile Ile Thr Pro Phe Thr Lys Asp Asn
1 5 10 15
Arg Ile Asp Lys Glu Lys Leu Lys Ile His Ala Glu Asn Leu Ile Arg
20 25 30
Lys Gly Ile Asp Lys Leu Phe Val Asn Gly Thr Thr Gly Leu Gly Pro
35 40 45
Ser Leu Ser Pro Glu Glu Lys Leu Glu Asn Leu Lys Ala Val Tyr Asp
50 55 60
Val Thr Asn Lys Ile Ile Phe Gln Val Gly Gly Leu Asn Leu Asp Asp
65 70 75 80
Ala Ile Arg Leu Ala Lys Leu Ser Lys Asp Phe Asp Ile Val Gly Ile
85 90 95
Ala Ser Tyr Ala Pro Tyr Tyr Tyr Pro Arg Met Ser Glu Lys His Leu
100 105 110
Val Lys Tyr Phe Lys Thr Leu Cys Glu Val Ser Pro His Pro Val Tyr
115 120 125
Leu Tyr Asn Tyr Pro Thr Ala Thr Gly Lys Asp Ile Asp Ala Lys Val
130 135 140
Ala Lys Glu Ile Gly Cys Phe Thr Gly Val Lys Asp Thr Ile Glu Asn
145 150 155 160
Ile Ile His Thr Leu Asp Tyr Lys Arg Leu Asn Pro Asn Met Leu Val
165 170 175
Tyr Ser Gly Ser Asp Met Leu Ile Ala Thr Val Ala Ser Thr Gly Leu
180 185 190
Asp Gly Asn Val Ala Ala Gly Ser Asn Tyr Leu Pro Glu Val Thr Val
195 200 205
Thr Ile Lys Lys Leu Ala Met Glu Arg Lys Ile Asp Glu Ala Leu Lys
210 215 220
Leu Gln Phe Leu His Asp Glu Val Ile Glu Ala Ser Arg Ile Phe Gly
225 230 235 240
Ser Leu Ser Ser Asn Tyr Val Leu Thr Lys Tyr Phe Gln Gly Tyr Asp
245 250 255
Leu Gly Tyr Pro Arg Pro Pro Ile Phe Pro Leu Asp Asp Glu Glu Glu
260 265 270
Arg Gln Leu Ile Lys Lys Val Glu Gly Ile Arg Ala Lys Leu Val Glu
275 280 285
Leu Lys Ile Leu Lys Glu
290
<210> 44
<211> 290
<212> PRT
<213> Sulfurisphaera tokodaii
<400> 44
Met Asp Ile Val Thr Pro Ile Leu Thr Pro Phe Thr Lys Glu Gly Lys
1 5 10 15
Ile Asp Val Glu Lys Leu Lys Ala His Ala Lys Phe Leu Ile Asp Asn
20 25 30
Gly Ile Asp Leu Leu Phe Val Asn Gly Thr Thr Gly Leu Gly Pro Ala
35 40 45
Leu Ser Lys Glu Glu Lys Leu Thr Thr Leu Lys Thr Ile Tyr Asp Val
50 55 60
Thr Asn Lys Val Ile Phe Gln Val Gly Ser Leu Asn Ile Asn Asp Val
65 70 75 80
Ile Asp Leu Val Lys Ala Ser Lys Asp Phe Asp Ile Val Gly Ile Ala
85 90 95
Ser Tyr Pro Pro Phe Tyr Phe Pro Arg Leu Pro Glu Lys Phe Leu Leu
100 105 110
Lys Tyr Phe Thr Thr Ile Ala Asn Tyr Ser Pro His Ser Leu Tyr Ile
115 120 125
Tyr Asn Tyr Pro Leu Ala Thr Gly Tyr Asp Ile Ser Ala Lys Ile Val
130 135 140
Tyr Gln Met Lys Asp Leu Ile Thr Gly Leu Lys Asp Thr Asn Gln Asp
145 150 155 160
Leu Ser His Ser Leu Glu Tyr Lys Ile Leu Met Pro Asn Leu Lys Val
165 170 175
Tyr Asn Gly Ser Asp Ser Leu Val Phe Tyr Ser Leu Thr Ser Leu Asp
180 185 190
Gly Ser Val Thr Ala Ala Ser Asn Tyr Leu Pro His Val Met Lys Lys
195 200 205
Met Lys Glu His Ile Thr Ser Gly Gln Val Ser Lys Ala Ile Glu Leu
210 215 220
Gln Lys Leu Ile Asn Lys Ala Leu Asp Ile Ser Arg Lys Tyr Gly Gln
225 230 235 240
Leu Ser Ala Ile Tyr Tyr Leu Val Lys Glu Phe Leu Gly Tyr Asp Val
245 250 255
Gly Tyr Pro Arg Gly Pro Ile Phe Pro Leu Glu Glu Asp Glu Val Lys
260 265 270
Ala Leu Leu Ser Glu Ile Gln Pro Val Lys Lys Glu Ile Glu Arg Ala
275 280 285
Val Ser
290
<210> 45
<211> 327
<212> PRT
<213> Escherichia coli
<400> 45
Met Ala Thr Arg Ile Glu Phe His Lys His Gly Gly Pro Glu Val Leu
1 5 10 15
Gln Ala Val Glu Phe Thr Pro Ala Asp Pro Ala Glu Asn Glu Ile Gln
20 25 30
Val Glu Asn Lys Ala Ile Gly Ile Asn Phe Ile Asp Thr Tyr Ile Arg
35 40 45
Ser Gly Leu Tyr Pro Pro Pro Ser Leu Pro Ser Gly Leu Gly Thr Glu
50 55 60
Ala Ala Gly Ile Val Ser Lys Val Gly Ser Gly Val Lys His Ile Lys
65 70 75 80
Ala Gly Asp Arg Val Val Tyr Ala Gln Ser Ala Leu Gly Ala Tyr Ser
85 90 95
Ser Val His Asn Ile Ile Ala Asp Lys Ala Ala Ile Leu Pro Ala Ala
100 105 110
Ile Ser Phe Glu Gln Ala Ala Ala Ser Phe Leu Lys Gly Leu Thr Val
115 120 125
Tyr Tyr Leu Leu Arg Lys Thr Tyr Glu Ile Lys Pro Asp Glu Gln Phe
130 135 140
Leu Phe His Ala Ala Ala Gly Gly Val Gly Leu Ile Ala Cys Gln Trp
145 150 155 160
Ala Lys Ala Leu Gly Ala Lys Leu Ile Gly Thr Val Gly Thr Ala Gln
165 170 175
Lys Ala Gln Ser Ala Leu Lys Ala Gly Ala Trp Gln Val Ile Asn Tyr
180 185 190
Arg Glu Glu Asp Leu Val Glu Arg Leu Lys Glu Ile Thr Gly Gly Lys
195 200 205
Lys Val Arg Val Val Tyr Asp Ser Val Gly Arg Asp Thr Trp Glu Arg
210 215 220
Ser Leu Asp Cys Leu Gln Arg Arg Gly Leu Met Val Ser Phe Gly Asn
225 230 235 240
Ser Ser Gly Ala Val Thr Gly Val Asn Leu Gly Ile Leu Asn Gln Lys
245 250 255
Gly Ser Leu Tyr Val Thr Arg Pro Ser Leu Gln Gly Tyr Ile Thr Thr
260 265 270
Arg Glu Glu Leu Thr Glu Ala Ser Asn Glu Leu Phe Ser Leu Ile Ala
275 280 285
Ser Gly Val Ile Lys Val Asp Val Ala Glu Gln Gln Lys Tyr Pro Leu
290 295 300
Lys Asp Ala Gln Arg Ala His Glu Ile Leu Glu Ser Arg Ala Thr Gln
305 310 315 320
Gly Ser Ser Leu Leu Ile Pro
325
<210> 46
<211> 327
<212> PRT
<213> Salmonella enterica
<400> 46
Met Ala Thr Arg Ile Glu Phe His Lys His Gly Gly Pro Glu Val Leu
1 5 10 15
Gln Thr Val Glu Phe Thr Pro Ala Glu Pro Ala Glu His Glu Ile Gln
20 25 30
Val Glu Asn Lys Ala Ile Gly Ile Asn Phe Ile Asp Thr Tyr Ile Arg
35 40 45
Ser Gly Leu Tyr Pro Pro Pro Ser Leu Pro Ala Gly Leu Gly Thr Glu
50 55 60
Ala Ala Gly Val Val Ser Lys Val Gly Asn Gly Val Glu His Ile Arg
65 70 75 80
Val Gly Asp Arg Val Val Tyr Ala Gln Ser Thr Leu Gly Ala Tyr Ser
85 90 95
Ser Val His Asn Val Thr Ala Asp Lys Ala Ala Ile Leu Pro Asp Ala
100 105 110
Ile Ser Phe Glu Gln Ala Ala Ala Ser Phe Leu Lys Gly Leu Thr Val
115 120 125
Phe Tyr Leu Leu Arg Lys Thr Tyr Glu Val Lys Pro Asp Glu Pro Phe
130 135 140
Leu Phe His Ala Ala Ala Gly Gly Val Gly Leu Ile Ala Cys Gln Trp
145 150 155 160
Ala Lys Ala Leu Gly Ala Lys Leu Ile Gly Thr Val Gly Ser Ala Gln
165 170 175
Lys Ala Gln Arg Ala Leu Asp Ala Gly Ala Trp Gln Val Ile Asn Tyr
180 185 190
Arg Glu Glu Ser Ile Val Glu Arg Val Lys Glu Ile Thr Gly Gly Lys
195 200 205
Lys Val Arg Val Val Tyr Asp Ser Val Gly Lys Asp Thr Trp Glu Ala
210 215 220
Ser Leu Asp Cys Leu Gln Arg Arg Gly Leu Met Val Ser Phe Gly Asn
225 230 235 240
Ala Ser Gly Pro Val Thr Gly Val Asn Leu Gly Ile Leu Asn Gln Lys
245 250 255
Gly Ser Leu Tyr Ala Thr Arg Pro Ser Leu Gln Gly Tyr Ile Thr Thr
260 265 270
Arg Glu Glu Leu Thr Glu Ala Ser Asn Glu Leu Phe Ser Leu Ile Ala
275 280 285
Ser Gly Val Ile Lys Val Asp Val Ala Glu Asn Gln Arg Tyr Ala Leu
290 295 300
Lys Asp Ala Arg Arg Ala His Glu Val Leu Glu Ser Arg Ala Thr Gln
305 310 315 320
Gly Ser Ser Leu Leu Ile Pro
325
<210> 47
<211> 354
<212> PRT
<213> Cupriavidus necator
<400> 47
Met Pro Arg His Gly Cys Leu Thr Ile Val Thr Val Ala Pro Met Ile
1 5 10 15
Ala Ala Arg Ala Gly His Asp Asn Gln Glu Thr Ala Leu Ala Lys Ala
20 25 30
Ile Arg Met Tyr Glu Thr Gly Gly Pro Glu Val Leu Arg Tyr Glu Asp
35 40 45
Ala Glu Val Gly Asp Pro Gly Pro Gly Glu Val Arg Ile Arg His Ala
50 55 60
Ala Val Gly Leu Asn Tyr Ala Asp Thr Tyr Phe Arg Asn Gly Thr Tyr
65 70 75 80
Pro Val Pro Leu Pro Gly Gly Met Gly Val Glu Ala Ala Gly Val Val
85 90 95
Gln Ala Val Gly Pro Gly Val Thr His Val Ala Glu Gly Asp Arg Val
100 105 110
Thr Tyr Thr Gly Phe Ile Asn Thr Leu Gly Ala Tyr Ser Thr Glu Arg
115 120 125
Leu Val Pro Ala Ala Pro Leu Ile Arg Leu Pro Glu Ala Ile Ser Phe
130 135 140
Glu Thr Ala Ala Ala Met Thr Met Arg Gly Leu Thr Ser Ala Tyr Leu
145 150 155 160
Met Arg Arg Ile Tyr Pro Phe Gln Gly Gly Glu Ala Ile Leu Leu His
165 170 175
Ala Ala Ala Gly Gly Val Gly Leu Ile Val Ser Gln Trp Ala Arg Leu
180 185 190
Leu Gly Leu Thr Val Ile Gly Thr Val Ser Thr Glu Ala Lys Ala Glu
195 200 205
Val Ala Arg Ala His Gly Cys Asp His Ile Ile Asn Tyr Ser His Glu
210 215 220
Asp Val Ala Lys Arg Val Arg Glu Leu Thr Asp Gly Ala Gly Val Ser
225 230 235 240
Val Val Phe Asp Ser Val Gly Lys Ser Thr Phe Met Ala Ser Leu Asp
245 250 255
Ser Leu Lys Arg Arg Gly Leu Met Val Cys Val Gly Thr Ala Ser Gly
260 265 270
Thr Ile Pro Pro Phe Asp Pro Gln Leu Leu Ala Arg Lys Gly Ser Val
275 280 285
Tyr Leu Thr Arg Pro Ala Leu Ala Asp Tyr Ile Ala Asp Pro Ala Glu
290 295 300
Lys Ala Glu Leu Ala Ala Glu Val Phe Gly His Val Ala Ala Gly Arg
305 310 315 320
Ile Arg Ile Glu Ile Asn Gln Arg Tyr Ala Leu Gln Asp Ala Val Gln
325 330 335
Ala His Arg Asp Leu Glu Ser Arg Lys Thr Thr Gly Ser Ser Ile Phe
340 345 350
Val Leu
<210> 48
<211> 327
<212> PRT
<213> Proteus mirabilis
<400> 48
Met Ala Lys Arg Ile Gln Phe Ala Ala His Gly Asn Ala Asp Val Leu
1 5 10 15
Glu Leu Thr Ser Phe Thr Pro Ala Pro Leu Gly Asp Asn Glu Val Gln
20 25 30
Val Ala Asn Lys Ala Ile Gly Ile Asn Tyr Ile Asp Thr Tyr Val Arg
35 40 45
Ser Gly Leu Tyr Pro Val Glu His Phe Pro Ser Gly Leu Gly Thr Glu
50 55 60
Ala Ala Gly Val Val Ile Lys Thr Gly Ala His Val Thr Ser Leu Lys
65 70 75 80
Glu Gly Asp Arg Val Val Tyr Ala Gln Ser Pro Leu Gly Ala Tyr Ser
85 90 95
Asp Thr His Asn Val Pro Glu Asn Lys Val Ala Arg Leu Pro Asp Asn
100 105 110
Ile Ser Phe Glu Gln Ala Ala Ala Ser Phe Leu Lys Gly Leu Thr Val
115 120 125
Tyr Tyr Leu Phe Asn Glu Thr Tyr Lys Leu Arg Ala Gly Glu Thr Phe
130 135 140
Leu Phe His Ala Ala Ala Gly Gly Val Gly Leu Ile Ala Ser Gln Trp
145 150 155 160
Ala Lys Ala Ile Gly Ala Lys Met Ile Gly Thr Ala Gly Ser Asp Glu
165 170 175
Lys Val Ala Lys Ala Lys Ala Ala Gly Ala Trp Lys Val Ile Asn Tyr
180 185 190
Gln Thr Glu Ser Ile Val Glu Arg Val Leu Ala Leu Thr Asn Asn Gln
195 200 205
Lys Val Pro Val Val Tyr Asp Ser Val Gly Lys Ala Thr Trp Leu Asp
210 215 220
Ser Leu His Cys Leu Gln Arg Arg Gly Leu Met Val Ser Phe Gly Asn
225 230 235 240
Ala Ser Gly Ala Val Thr Gly Val Asp Leu Gly Ile Leu Asn Lys Leu
245 250 255
Gly Ser Leu Tyr Val Thr Arg Pro Ser Ile Ser Gly Tyr Ile Thr Thr
260 265 270
Arg Glu Glu Leu Asp Ala Ala Ser Glu Ala Leu Phe Thr Leu Ile Gly
275 280 285
Arg Gly Lys Ile Asp Val Ser Val Pro Asp Asn Gln Lys Phe Ala Leu
290 295 300
Ala Asp Ala Lys Ala Ala His Arg Tyr Leu Glu Ser Arg Gln Ser Gln
305 310 315 320
Gly Ser Ser Leu Leu Ile Pro
325
<210> 49
<211> 325
<212> PRT
<213> Pseudomonas aeruginosa
<400> 49
Met Ala Lys Arg Ile Gln Phe Ala Ala Tyr Gly Gly Pro Glu Val Leu
1 5 10 15
Glu Tyr Arg Asp Tyr Gln Pro Ala Glu Pro Gly Pro Arg Glu Val Arg
20 25 30
Val Arg Asn Arg Ala Ile Gly Leu Asn Phe Ile Asp Thr Tyr Tyr Arg
35 40 45
Ser Gly Leu Tyr Pro Ala Pro Gly Leu Pro Ser Gly Leu Gly Ser Glu
50 55 60
Gly Ala Gly Glu Val Glu Ala Val Gly Ser Glu Val Thr Arg Phe Lys
65 70 75 80
Val Gly Asp Arg Val Ala Tyr Ala Thr Gly Pro Leu Gly Ala Tyr Ser
85 90 95
Glu Leu His Val Leu Ala Glu Glu Lys Leu Val His Leu Pro Asp Gly
100 105 110
Ile Asp Phe Glu Gln Ala Ala Ala Val Met Leu Lys Gly Leu Thr Thr
115 120 125
Gln Tyr Leu Leu Arg Gln Thr Tyr Glu Leu Arg Gly Gly Glu Thr Ile
130 135 140
Leu Phe His Ala Ala Ala Gly Gly Val Gly Leu Phe Ala Cys Gln Trp
145 150 155 160
Ala Lys Ala Leu Gly Val Gln Leu Ile Gly Thr Val Ser Ser Pro Glu
165 170 175
Lys Ala Arg Leu Ala Arg Gln His Gly Ala Trp Glu Thr Ile Asp Tyr
180 185 190
Ser His Glu Asn Val Ala Arg Arg Val Leu Glu Leu Thr Asp Gly Lys
195 200 205
Lys Cys Pro Val Val Tyr Asp Ser Val Gly Lys Asp Thr Trp Glu Thr
210 215 220
Ser Leu Asp Cys Val Ala Pro Arg Gly Leu Leu Val Ser Phe Gly Asn
225 230 235 240
Ala Ser Gly Pro Val Thr Gly Val Asn Leu Gly Ile Leu Ser Gln Lys
245 250 255
Gly Ser Leu Tyr Val Thr Arg Pro Thr Leu Gly Ser Tyr Ala Asp Thr
260 265 270
Pro Glu Lys Leu Gln Ala Met Ala Asp Glu Leu Phe Gly Leu Ile Glu
275 280 285
Arg Gly Asp Ile Arg Ile Glu Ile Asn Gln Arg Phe Ala Leu Ala Glu
290 295 300
Ala Ala Arg Ala His Thr Glu Leu Ala Ala Arg Arg Thr Thr Gly Ser
305 310 315 320
Thr Val Leu Leu Pro
325
<210> 50
<211> 326
<212> PRT
<213> Mycolicibacterium smegmatis
<400> 50
Met His Ala Ile Glu Val Ala Glu Thr Gly Gly Pro Glu Val Leu Asn
1 5 10 15
Tyr Ile Glu Arg Pro Glu Pro Ser Pro Gly Pro Gly Glu Val Leu Ile
20 25 30
Lys Ala Asp Ala Ile Gly Val Asn Phe Ile Asp Thr Tyr Phe Arg Ser
35 40 45
Gly Leu Tyr Pro Arg Glu Leu Pro Phe Val Val Gly Thr Glu Val Cys
50 55 60
Gly Thr Val Ala Ala Ile Gly Asn Asp Val Ala Ala Leu Lys Val Gly
65 70 75 80
Asp Arg Val Val Thr Ala Asn Ala Val Gly Ala Tyr Ala Asp Tyr Cys
85 90 95
Val Ala Pro Ala Asp Phe Val Ala Tyr Val Pro Asp Gly Val Ala Pro
100 105 110
Glu Ala Val Ala Ser Ala Leu Leu Lys Gly Met Thr Ala His Tyr Leu
115 120 125
Leu Lys Ser Thr Tyr Pro Val Gln Pro Ser Asp Thr Val Leu Val His
130 135 140
Ala Gly Ala Gly Gly Val Gly Leu Ile Leu Thr Gln Trp Ala Thr Ser
145 150 155 160
Leu Gly Thr Arg Val Ile Thr Thr Ala Ser Thr Pro Glu Lys Ala Glu
165 170 175
Leu Ser Arg Gln Ala Gly Ala Val Glu Val Leu Asp Tyr Pro Asp Pro
180 185 190
Asp Asp Pro Gln Pro Phe Ala Ser Arg Val Arg Glu Leu Thr Gly Gly
195 200 205
Ala Gly Val Ala Ala Val Tyr Asp Gly Val Gly Ala Thr Thr Phe Asp
210 215 220
Ala Ser Leu Ala Ser Leu Ala Val Arg Gly Thr Leu Ala Leu Phe Gly
225 230 235 240
Ala Ser Ser Gly Pro Val Pro Pro Phe Asp Pro Gln Arg Leu Asn Ala
245 250 255
Ala Gly Ser Val Phe Leu Thr Arg Pro Thr Leu Ala His His Thr Arg
260 265 270
Thr Ala Asp Glu Phe Ser Trp Arg Ala Gly Glu Leu Ile Asn Ala Ile
275 280 285
Ala Asp Gly Ser Ile Lys Ile Thr Val Gly Gly Thr Tyr Pro Leu Ala
290 295 300
Glu Ala Ser Arg Ala His Thr Asp Leu Gln Gly Arg Lys Thr Val Gly
305 310 315 320
Ser Ile Val Leu Ile Pro
325
<210> 51
<211> 324
<212> PRT
<213> Paraburkholderia xenovorans
<400> 51
Met Val Lys Ala Ile Arg Phe Asp Lys Thr Gly Gly Pro Glu Val Met
1 5 10 15
Lys Trp Val Asp Val Glu Val Gly Glu Pro Gly Ala Gly Glu Ile Arg
20 25 30
Val Arg Gln Thr Ala Val Gly Leu Asn Tyr Ile Asp Val Tyr Phe Arg
35 40 45
Thr Gly Leu Tyr Pro Leu Pro Leu Pro Gly Gly Leu Gly Met Glu Ala
50 55 60
Ala Gly Glu Val Thr Ala Leu Gly Ser Gly Val Ser Gly Leu Lys Val
65 70 75 80
Gly Asp Arg Ile Ala Tyr Val Ala Arg Pro Pro Gly Ala Tyr Ala Gln
85 90 95
Glu Arg Val Leu Gln Ala Ala Gln Val Val Lys Val Pro Asp Ala Leu
100 105 110
Thr Asp Glu Gln Ala Ala Ser Val Met Leu Gln Gly Leu Thr Ala Gln
115 120 125
Tyr Leu Leu Arg Arg Thr Tyr Pro Val Lys Ala Gly Asp Thr Ile Leu
130 135 140
Ile Gln Ala Ala Ala Gly Gly Val Gly Leu Leu Val Cys Gln Trp Ala
145 150 155 160
Lys Ala Leu Gly Ala Thr Val Ile Gly Thr Val Gly Ser Asp Glu Lys
165 170 175
Ala Glu Ile Ala Thr Ala His Gly Cys Asp His Ala Ile Val Tyr Thr
180 185 190
Arg Glu Asn Phe Thr Arg Arg Val Arg Glu Ile Thr Asn Gly Ala Gly
195 200 205
Val Pro Val Val Tyr Asp Ser Ile Gly Lys Asp Thr Phe Thr Gly Ser
210 215 220
Leu Asp Cys Leu Ala Pro Leu Gly Met Phe Val Ser Phe Gly Asn Ala
225 230 235 240
Ser Gly Pro Leu Pro Pro Ile Asp Ser Ser Glu Phe Ala Gly Arg Gly
245 250 255
Ser Leu Phe Phe Thr Arg Pro Thr Leu Phe Thr Tyr Ile Ala Lys Arg
260 265 270
Ser Asp Tyr Glu Ala Met Ser Thr Glu Leu Phe Asp Val Leu Val Ser
275 280 285
Gly Lys Val Lys Thr Ser Ile Asn Gln Arg Tyr Ala Leu Ala Asp Val
290 295 300
Gly Arg Ala His Ala Asp Leu Glu Gly Arg Arg Thr Thr Gly Ser Thr
305 310 315 320
Val Leu Leu Pro
<210> 52
<211> 324
<212> PRT
<213> Burkholderia cepacia
<400> 52
Met Pro Lys Ala Ile Arg Tyr Asp Gln Pro Gly Gly Pro Asp Val Met
1 5 10 15
Lys Trp Val Asp Val Glu Val Gly Glu Pro Lys Ala Gly Glu Val Arg
20 25 30
Ile Arg Gln His Ala Val Gly Leu Asn Tyr Ile Asp Val Tyr Phe Arg
35 40 45
Thr Gly Leu Tyr Ser Gln Pro Leu Pro Gly Gly Leu Gly Met Glu Ala
50 55 60
Ala Gly Glu Val Thr Ala Val Gly Glu Gly Val Thr Ala Leu Lys Ala
65 70 75 80
Gly Asp Arg Val Ala Tyr Val Gly Gln Pro Pro Gly Ala Tyr Ala Gln
85 90 95
Glu Arg Val Met Pro Ala Glu Arg Leu Val Lys Leu Pro Asp Gly Ile
100 105 110
Ser Tyr Asp Asp Ala Ala Ser Val Met Leu Gln Gly Leu Thr Ala His
115 120 125
Tyr Leu Leu Arg Arg Thr Tyr Pro Val Lys Ala Gly Asp Thr Ile Leu
130 135 140
Ile His Ala Ala Ala Gly Gly Val Gly Leu Leu Val Cys Gln Trp Ala
145 150 155 160
Lys Ala Leu Gly Ala Thr Val Ile Gly Thr Val Gly Ser Asp Glu Lys
165 170 175
Ala Ala Leu Ala Lys Ala His Gly Cys Asp His Pro Ile Val Tyr Thr
180 185 190
Arg Glu Asn Phe Thr Gln Arg Val Lys Glu Ile Thr Asn Gly Ala Gly
195 200 205
Val Pro Val Val Tyr Asp Ser Ile Gly Lys Asp Thr Tyr Ile Gly Ser
210 215 220
Leu Asp Cys Leu Ala Pro Leu Gly Tyr Phe Val Ser Phe Gly Asn Ala
225 230 235 240
Ser Gly Pro Leu Pro Ala Ile Asp Ser Lys Glu Phe Ser Ser Arg Gly
245 250 255
Ser Leu Phe Phe Thr Arg Pro Thr Leu Phe Ser Tyr Ile Ala Lys Arg
260 265 270
Ala Asp Leu Glu Ser Ala Ala Ala Glu Leu Phe Asp Val Ile Leu Ser
275 280 285
Gly Lys Val Lys Thr Ser Ile Asn Gln Arg Tyr Pro Leu Ala Glu Val
290 295 300
Gly Arg Ala His Ala Asp Leu Glu Ser Arg Asn Thr Thr Gly Ser Thr
305 310 315 320
Ile Leu Val Pro
<210> 53
<211> 310
<212> PRT
<213> Gluconobacter oxydans
<400> 53
Met Ser Ser Lys Pro Asp Ile Leu Thr Ile Asp Pro Leu Val Pro Val
1 5 10 15
Met Lys Glu Arg Leu Glu Lys Ser Phe Thr Leu His Pro Tyr Thr Ser
20 25 30
Leu Glu Asn Leu Lys Asn Ile Ala Pro Ala Ile Arg Gly Ile Thr Thr
35 40 45
Gly Gly Gly Ser Gly Val Pro Ser Glu Ile Met Asp Ala Leu Pro Asn
50 55 60
Leu Glu Val Ile Ser Val Asn Gly Val Gly Thr Asp Arg Ile Asn Leu
65 70 75 80
Asp Glu Ala Arg Arg Arg Asn Ile Gly Val Ala Ile Thr Gln Asn Thr
85 90 95
Leu Thr Asp Asp Val Ala Asp Met Ala Val Ala Leu Met Met Ala Val
100 105 110
Met Arg Ser Ile Val Thr Asn Asp Ala Phe Val Arg Ala Gly Lys Trp
115 120 125
Pro Ser Ala Thr Ala Pro Leu Gly Arg Ser Leu Thr Arg Lys Lys Val
130 135 140
Gly Ile Ala Gly Phe Gly His Ile Gly Gln Ala Ile Ala Lys Arg Val
145 150 155 160
Ser Ala Phe Gly Met Glu Val Ala Tyr Phe Asn Ser His Ala Arg Pro
165 170 175
Glu Ser Thr Cys His Phe Glu Pro Asp Leu Lys Ala Leu Ala Thr Trp
180 185 190
Cys Asp Val Leu Ile Leu Ala Val Ser Gly Gly Pro Arg Ser Ala Asn
195 200 205
Met Ile Asp Arg Asp Thr Leu Asp Ala Leu Gly Lys Asp Gly Phe Leu
210 215 220
Val Asn Ile Ala Arg Gly Thr Val Val Asp Glu Ala Ala Leu Leu Ser
225 230 235 240
Ala Leu Gln Glu Lys Arg Ile Ala Gly Ala Gly Leu Asp Val Phe Gln
245 250 255
Asn Glu Pro Asn Ile Asn Pro Ala Phe Leu Ser Leu Pro Asn Thr Val
260 265 270
Leu Gln Ala His Gln Ala Ser Ala Thr Val Glu Thr Arg Thr Thr Met
275 280 285
Ala Asn Leu Val Val Asp Asn Leu Ile Ala Tyr Phe Thr Asp Lys Thr
290 295 300
Leu Leu Thr Pro Val Ile
305 310
<210> 54
<211> 331
<212> PRT
<213> Clostridium sporogenes
<400> 54
Met Lys Ile Leu Ala Tyr Cys Val Arg Pro Asp Glu Ile Asp Ser Phe
1 5 10 15
Lys Asn Phe Ser Glu Lys Tyr Gly His Thr Val Asp Leu Ile Pro Asp
20 25 30
Ser Phe Gly Pro Ser Val Ala His Leu Ala Lys Gly Tyr Asp Gly Ile
35 40 45
Ser Ile Leu Gly Asn Asp Thr Cys Asn Arg Glu Ala Leu Glu Lys Ile
50 55 60
Lys Asp Cys Gly Ile Lys Tyr Leu Ala Thr Arg Thr Ala Gly Val Asn
65 70 75 80
Asn Ile Asp Phe Asp Ala Ala Lys Glu Phe Gly Ile Asn Val Ala Asn
85 90 95
Val Pro Ala Tyr Ser Pro Asn Ser Val Ser Glu Phe Thr Val Gly Leu
100 105 110
Ala Leu Ser Leu Thr Arg Lys Ile Pro Phe Ala Leu Lys Arg Val Glu
115 120 125
Leu Asn Asn Phe Ala Leu Gly Gly Leu Ile Gly Val Glu Leu Arg Asn
130 135 140
Leu Thr Leu Gly Val Ile Gly Thr Gly Arg Ile Gly Leu Lys Val Ile
145 150 155 160
Glu Gly Phe Ser Gly Phe Gly Met Lys Lys Met Ile Gly Tyr Asp Ile
165 170 175
Phe Glu Asn Glu Lys Ala Lys Glu Tyr Ile Glu Tyr Lys Ser Leu Asp
180 185 190
Glu Val Tyr Lys Glu Ala Asp Ile Ile Thr Leu His Ala Pro Leu Thr
195 200 205
Asp Asp Asn Tyr His Met Ile Gly Lys Glu Ser Ile Ala Lys Met Lys
210 215 220
Asp Gly Val Phe Ile Ile Asn Ala Ala Arg Gly Ala Leu Ile Asp Ser
225 230 235 240
Glu Ala Leu Ile Glu Gly Leu Lys Ser Gly Lys Ile Ala Gly Ala Ala
245 250 255
Leu Asp Ser Tyr Glu Tyr Glu Gln Gly Val Phe His Asn Asn Lys Met
260 265 270
Asn Glu Ile Met Lys Asp Asp Thr Leu Ala Arg Leu Lys Ser Phe Pro
275 280 285
Asn Val Val Ile Thr Pro His Leu Gly Phe Tyr Thr Asp Glu Ala Val
290 295 300
Ser Asn Met Val Glu Ile Thr Leu Met Asn Leu Gln Glu Phe Glu Leu
305 310 315 320
Lys Gly Thr Cys Lys Asn Gln Arg Val Cys Lys
325 330
<210> 55
<211> 410
<212> PRT
<213> Paraclostridium bifermentans
<400> 55
Met Asp Asn Lys Ala Leu Leu Lys Gly Val Arg Val Val Glu Leu Ser
1 5 10 15
Ser Phe Val Ala Ala Pro Cys Cys Ala Lys Leu Leu Gly Asp Trp Gly
20 25 30
Ala Glu Val Ile Lys Ile Glu Pro Leu Gly Gly Asp Gly Ile Arg Val
35 40 45
Met Gly Gly Thr Phe Lys Ser Pro Cys Thr Asp Glu Glu Asn Pro Met
50 55 60
Phe Glu Leu Glu Asn Gly Asn Lys Lys Gly Ile Ser Val Asn Val Lys
65 70 75 80
Thr Lys Glu Gly Val Glu Ile Ile His Lys Leu Leu Ala Lys Ala Asp
85 90 95
Ile Phe Ile Thr Asn Val Arg Glu Gln Ala Leu Ser Lys Ile Gly Leu
100 105 110
Thr Tyr Asp Gln Leu Lys Asp Glu Phe Pro Ala Leu Ile His Ala His
115 120 125
Ile Leu Gly Tyr Gly Glu Asn Gly Pro Leu Lys Asp Lys Pro Gly Phe
130 135 140
Asp Tyr Thr Ala Tyr Phe Ala Arg Gly Gly Val Ser Gln Ser Leu Met
145 150 155 160
Glu Lys Gly Thr Ser Pro Cys Asn Thr Ala Ala Ala Phe Gly Asp His
165 170 175
Tyr Ala Gly Val Ser Leu Thr Ala Gly Ile Leu Ala Ala Leu Tyr Lys
180 185 190
Lys Gln Met Thr Gly Glu Gly Asp Arg Val Thr Val Ser Leu Tyr His
195 200 205
Thr Ala Leu Tyr Gly Met Gly Met Met Ile Thr Thr Ala Gln Tyr Gly
210 215 220
Asn Lys Met Pro Ile Ser Arg Ala Asn Pro Asn Ser Pro Leu Met Thr
225 230 235 240
Thr Tyr Lys Cys Lys Asp Gly Lys Trp Ile Gln Leu Ala Leu Ile Gln
245 250 255
Tyr Asn Lys Trp Leu Pro Lys Phe Cys Asn Val Ile Asn Arg Pro Glu
260 265 270
Ile Met Glu Asp Glu Arg Phe Asn Asp Ile Lys Val Met Pro Leu His
275 280 285
Val Asp Glu Met Val Glu Ile Val Gly Glu Ala Met Leu Glu Lys Thr
290 295 300
Leu Asp Glu Trp Ser Ala Leu Leu Glu Glu Ala Asp Leu Pro Phe Glu
305 310 315 320
Lys Val Gln Ser Cys Glu Asp Ile Leu Glu Asp Glu Gln Ala Trp Ala
325 330 335
Asn Asp Phe Leu Phe Lys Thr Lys Tyr Ala Asn Gly Asn Glu Gly Val
340 345 350
Leu Val Asn Gly Pro Val Lys Phe Lys Thr Met Gly Ile Lys Glu Tyr
355 360 365
Thr Pro Ala Pro Arg Val Gly Glu His Thr Glu Glu Val Leu Lys Glu
370 375 380
Leu Gly Tyr Thr Glu Glu Glu Ile Leu Asn Met Val Asn Ser Gln Ala
385 390 395 400
Val Lys Leu Asp Asp Ser Lys Glu Leu Val
405 410
<210> 56
<211> 410
<212> PRT
<213> Paeniclostridium sordellii
<400> 56
Met Asp Asn Arg Ala Leu Leu Lys Gly Val Arg Val Val Glu Leu Ser
1 5 10 15
Ser Phe Val Ala Ala Pro Cys Cys Ala Lys Leu Leu Ala Asp Trp Gly
20 25 30
Ala Glu Val Ile Lys Ile Glu Pro Leu Gly Gly Asp Gly Ile Arg Val
35 40 45
Met Gly Gly Thr Phe Lys Ser Pro Cys Thr Asp Asp Glu Asn Pro Met
50 55 60
Phe Glu Leu Glu Asn Gly Asn Lys Lys Gly Ile Ser Val Asn Val Lys
65 70 75 80
Thr Lys Glu Gly Val Glu Ile Leu His Lys Leu Leu Ser Lys Ser Asp
85 90 95
Ile Phe Val Thr Asn Val Arg Glu Lys Ala Leu Ala Lys Met Gly Leu
100 105 110
Thr Tyr Asp Gln Leu Lys Asp Asp Phe Pro Gly Leu Ile His Ala His
115 120 125
Ile Leu Gly Tyr Gly Glu Glu Gly Pro Leu Lys Asp Lys Pro Gly Phe
130 135 140
Asp Tyr Thr Ala Tyr Phe Ala Arg Gly Gly Val Ser Gln Ser Leu Met
145 150 155 160
Glu Lys Gly Thr Ser Pro Cys Asn Thr Ala Ala Gly Phe Gly Asp His
165 170 175
Tyr Ala Gly Ile Ser Leu Thr Ala Gly Ile Leu Ala Ala Leu Tyr Lys
180 185 190
Lys Gln Ile Thr Gly Glu Gly Asp Arg Val Thr Val Ser Leu Phe His
195 200 205
Thr Ala Leu Tyr Gly Met Gly Met Met Ile Thr Thr Ser Gln Tyr Gly
210 215 220
Asn Glu Met Pro Ile Ser Arg Thr Glu Pro Asn Ser Pro Leu Met Thr
225 230 235 240
Thr Tyr Lys Cys Lys Asp Gly Lys Trp Ile Gln Leu Ala Leu Ile Gln
245 250 255
Tyr Asn Lys Trp Leu Pro Lys Phe Cys Glu Val Ile Asn Arg Pro Glu
260 265 270
Ile Met Lys Asp Asp Arg Phe Asn Asp Ile Lys Val Met Pro Leu His
275 280 285
Val Asp Glu Met Val Lys Ile Val Glu Lys Ala Met Leu Glu Lys Thr
290 295 300
Leu Asp Glu Trp Ser Asp Leu Leu Glu Glu Ala Asp Leu Pro Phe Glu
305 310 315 320
Lys Val Gln Ser Cys Glu Asp Ile Ile Asn Asp Asp Gln Ala Trp Ala
325 330 335
Asn Asp Phe Leu Phe Lys Thr Thr Tyr Glu Asn Gly Asn Glu Gly Val
340 345 350
Leu Val Asn Gly Pro Val Lys Phe Lys Thr Met Gly Ile Lys Glu Tyr
355 360 365
Glu Pro Ala Pro Arg Leu Gly Gln His Thr Glu Glu Val Leu Lys Ser
370 375 380
Ile Gly Tyr Thr Glu Glu Glu Ile Leu Asp Met Val Asn Ser Gln Ala
385 390 395 400
Ile Lys Leu Asp Asp Ala Lys Glu Leu Val
405 410
<210> 57
<211> 404
<212> PRT
<213> Clostridium botulinum
<400> 57
Met Thr Lys Glu Gly Leu Ala Leu Glu Gly Val Lys Val Val Glu Leu
1 5 10 15
Ser Ser Phe Val Ala Ala Pro Ser Cys Ser Lys Leu Leu Ala Asp Trp
20 25 30
Gly Ala Asp Val Ile Lys Ile Glu Pro Ile Gln Gly Asp Asn Ile Arg
35 40 45
Val Val Gly Gly Val Tyr Asn Ser Pro Ala Arg Asp Asp Glu Asn Pro
50 55 60
Met Phe Glu Leu Glu Asn Gly Asn Lys Arg Gly Ile Ala Ile Asn Thr
65 70 75 80
Arg Ser Glu Lys Gly Lys Glu Val Leu Gly Lys Leu Leu Lys Asp Ala
85 90 95
Asp Val Phe Val Thr Asn Val Arg Glu Lys Ala Leu Gln Arg Ser Gly
100 105 110
Leu Ser Tyr Asp Gln Leu Lys Asp Lys Tyr Pro Ser Leu Ile His Ala
115 120 125
His Ile Leu Gly Tyr Gly Glu Lys Gly Pro Leu Lys Asp Lys Pro Gly
130 135 140
Phe Asp Tyr Thr Ala Tyr Phe Ala Arg Gly Ala Val Ser Thr Ser Leu
145 150 155 160
Met Glu Lys Gly Thr Ser Pro Ala Asn Thr Asn Ala Gly Phe Gly Asp
165 170 175
His Tyr Ala Gly Met Ser Leu Ala Ala Gly Ile Leu Ala Ala Leu His
180 185 190
Arg Lys Thr Leu Thr Gly Lys Gly Asp Arg Val Thr Val Ser Leu Tyr
195 200 205
His Thr Ala Ile Phe Gly Met Gly Leu Met Ile Thr Thr Ala Gln Tyr
210 215 220
Gly Asn Lys Met Pro Leu Ser Arg Arg Thr Pro Asn Asn Pro Leu Ala
225 230 235 240
Thr Thr Tyr Arg Cys Lys Asp Asp Arg Trp Ile Gln Leu Ala Leu Leu
245 250 255
Lys Tyr Asp Ala Trp Phe Pro Lys Phe Cys Lys Glu Val Ile Asn Arg
260 265 270
Pro Asp Leu Ile Glu Asp Leu Arg Phe Asn Lys Gln Ser Glu Val Val
275 280 285
Lys His Val Glu Thr Phe Val Gly Ile Leu Glu Glu Glu Phe Ile Lys
290 295 300
Lys Asp Leu Lys Glu Trp Ala Asp Leu Leu Asp Lys Ala Asp Leu Pro
305 310 315 320
Tyr Glu Lys Leu Gln Tyr Cys Glu Asp Ile Leu Glu Asp Glu Gln Ala
325 330 335
Trp Ala Asn Asp Tyr Leu Phe Lys Thr Thr Tyr Asp Ser Gly Asn Thr
340 345 350
Gly Val Leu Val Asn Ser Pro Val Lys Phe Ser Glu Ala Gly Met Arg
355 360 365
Thr Tyr Lys Ala Ala Pro Lys Ile Gly Glu Asp Thr Glu Val Val Leu
370 375 380
Thr Ser Leu Gly Tyr Ser Lys Glu Glu Ile Glu Glu Met Arg Lys Glu
385 390 395 400
Glu Ser Ile Lys
<210> 58
<211> 404
<212> PRT
<213> Clostridium sporogenes
<400> 58
Met Thr Lys Glu Gly Leu Ala Leu Glu Gly Val Lys Val Val Glu Leu
1 5 10 15
Ser Ser Phe Val Ala Ala Pro Ser Cys Ser Lys Leu Leu Ala Asp Trp
20 25 30
Gly Ala Asp Val Ile Lys Ile Glu Pro Ile Gln Gly Asp Asn Ile Arg
35 40 45
Val Val Gly Gly Val Tyr Asn Ser Pro Ala Arg Asp Asp Glu Asn Pro
50 55 60
Met Phe Glu Leu Glu Asn Gly Asn Lys Arg Gly Val Ala Ile Asn Thr
65 70 75 80
Arg Ser Glu Lys Gly Lys Glu Val Leu Gly Lys Leu Leu Lys Asp Ala
85 90 95
Asp Val Phe Val Thr Asn Val Arg Glu Lys Ala Leu Gln Arg Ser Gly
100 105 110
Leu Ser Tyr Asp Gln Leu Lys Asp Lys Tyr Pro Ser Leu Ile His Ala
115 120 125
His Ile Leu Gly Tyr Gly Glu Lys Gly Pro Leu Lys Asp Lys Pro Gly
130 135 140
Phe Asp Tyr Thr Ala Tyr Phe Ala Arg Gly Ala Val Ser Thr Ser Leu
145 150 155 160
Met Glu Lys Gly Thr Ser Pro Ala Asn Thr Asn Ala Gly Phe Gly Asp
165 170 175
His Tyr Ala Gly Met Ser Leu Ala Ala Gly Ile Leu Ala Ala Leu His
180 185 190
Arg Lys Thr Leu Thr Gly Lys Gly Asp Arg Val Thr Val Ser Leu Tyr
195 200 205
His Thr Ala Ile Phe Gly Met Gly Leu Met Ile Thr Thr Ala Gln Tyr
210 215 220
Gly Asn Lys Met Pro Leu Ser Arg Arg Thr Pro Asn Asn Pro Leu Ala
225 230 235 240
Thr Thr Tyr Arg Cys Lys Asp Asp Arg Trp Ile Gln Leu Ala Leu Leu
245 250 255
Lys Tyr Asp Ala Trp Phe Pro Lys Phe Cys Lys Glu Val Ile Asn Arg
260 265 270
Pro Asp Leu Ile Glu Asp Ser Arg Phe Asn Lys Gln Ser Glu Val Val
275 280 285
Lys His Val Glu Thr Phe Val Gly Val Leu Glu Gly Glu Phe Ile Lys
290 295 300
Lys Asp Leu Lys Glu Trp Ala Asp Leu Leu Asp Lys Ala Asp Leu Pro
305 310 315 320
Tyr Glu Lys Leu Gln Tyr Cys Glu Asp Ile Leu Glu Asp Glu Gln Ala
325 330 335
Trp Ala Asn Asp Tyr Leu Phe Lys Thr Thr Tyr Asp Ser Gly Asn Thr
340 345 350
Gly Val Leu Val Asn Ser Pro Val Lys Phe Ser Glu Ala Gly Met Arg
355 360 365
Pro Tyr Lys Ala Ala Pro Lys Ile Gly Glu Asp Thr Glu Ala Ile Leu
370 375 380
Thr Ser Leu Gly Tyr Ser Lys Glu Glu Ile Glu Glu Met Arg Lys Glu
385 390 395 400
Asn Ala Ile Lys
<210> 59
<211> 408
<212> PRT
<213> Clostridioides difficile
<400> 59
Met Ser Glu Lys Lys Glu Ala Arg Val Val Ile Asn Asp Leu Leu Ala
1 5 10 15
Glu Gln Tyr Ala Asn Ala Phe Lys Ala Lys Glu Glu Gly Arg Pro Val
20 25 30
Gly Trp Ser Thr Ser Val Phe Pro Gln Glu Leu Ala Glu Val Phe Asp
35 40 45
Leu Asn Val Leu Tyr Pro Glu Asn Gln Ala Ala Gly Val Ala Ala Lys
50 55 60
Lys Gly Ser Leu Glu Leu Cys Glu Ile Ala Glu Ser Lys Gly Tyr Ser
65 70 75 80
Ile Asp Leu Cys Ala Tyr Ala Arg Thr Asn Phe Gly Leu Leu Glu Asn
85 90 95
Gly Gly Cys Glu Ala Leu Asp Met Pro Ala Pro Asp Phe Leu Leu Cys
100 105 110
Cys Asn Asn Ile Cys Asn Gln Val Ile Lys Trp Tyr Glu Asn Ile Ser
115 120 125
Arg Glu Leu Asp Ile Pro Leu Ile Met Ile Asp Thr Thr Phe Asn Asn
130 135 140
Glu Asp Glu Val Thr Gln Ser Arg Ile Asp Tyr Ile Lys Ala Gln Phe
145 150 155 160
Glu Glu Ala Ile Lys Gln Leu Glu Ile Ile Ser Gly Lys Lys Phe Asp
165 170 175
Pro Lys Lys Phe Glu Glu Val Met Lys Ile Ser Ala Glu Asn Gly Arg
180 185 190
Leu Trp Lys Tyr Ser Met Ser Leu Pro Ala Asp Ser Ser Pro Ser Pro
195 200 205
Met Asn Gly Phe Asp Leu Phe Thr Tyr Met Ala Val Ile Val Cys Ala
210 215 220
Arg Gly Lys Lys Glu Thr Thr Glu Ala Phe Lys Leu Leu Ile Glu Glu
225 230 235 240
Leu Glu Asp Asn Met Lys Thr Gly Lys Ser Ser Phe Arg Gly Glu Glu
245 250 255
Lys Tyr Arg Ile Met Met Glu Gly Ile Pro Cys Trp Pro Tyr Ile Gly
260 265 270
Tyr Lys Met Lys Thr Leu Ala Lys Phe Gly Val Asn Met Thr Gly Ser
275 280 285
Val Tyr Pro His Ala Trp Ala Leu Gln Tyr Glu Val Asn Asp Leu Asp
290 295 300
Gly Met Ala Val Ala Tyr Ser Thr Met Phe Asn Asn Val Asn Leu Asp
305 310 315 320
Arg Met Thr Lys Tyr Arg Val Asp Ser Leu Val Glu Gly Lys Cys Asp
325 330 335
Gly Ala Phe Tyr His Met Asn Arg Ser Cys Lys Leu Met Ser Leu Ile
340 345 350
Gln Tyr Glu Met Gln Arg Arg Ala Ala Glu Glu Thr Gly Leu Pro Tyr
355 360 365
Ala Gly Phe Asp Gly Asp Gln Ala Asp Pro Arg Ala Phe Thr Asn Ala
370 375 380
Gln Phe Glu Thr Arg Ile Gln Gly Leu Val Glu Val Met Glu Glu Arg
385 390 395 400
Lys Lys Leu Asn Arg Gly Glu Ile
405
<210> 60
<211> 410
<212> PRT
<213> Clostridium sporogenes
<400> 60
Met Ala Asp Lys Lys Glu Val Lys Lys Asn Ala Ala Lys Met Ile Asn
1 5 10 15
Gly Ile Leu Ala Lys Ser Tyr Ala Asp Ala Trp Lys Ala Lys Glu Glu
20 25 30
Gly Lys Pro Val Gly Trp Ser Thr Ser Val Phe Pro Gln Glu Leu Val
35 40 45
Glu Thr Phe Gly Leu Asp Val Leu Tyr Pro Glu Asn Gln Ala Ala Gly
50 55 60
Val Ala Ala Lys Lys Glu Ser Leu Ser Leu Cys Glu Ala Ala Glu Ser
65 70 75 80
Ala Gly Tyr Ser Ile Asp Leu Cys Ala Tyr Ala Arg Thr Asn Phe Gly
85 90 95
Leu Leu Glu Lys Gly Gly Ser Glu Asn Leu Asn Met Pro Lys Pro Asp
100 105 110
Phe Ile Cys Cys Cys Asn Asn Ile Cys Asn Gln Val Ile Lys Trp Tyr
115 120 125
Glu Asn Ile Ala Lys Glu Leu Asp Ile Pro Leu Ile Met Ile Asp Thr
130 135 140
Thr Phe Asn Asn Glu Asp Glu Val Thr Glu Asn Arg Ile Lys Tyr Leu
145 150 155 160
Arg Ala Gln Phe Glu Glu Ala Ile Lys Gln Leu Glu Lys Ile Ser Gly
165 170 175
Lys Lys Phe Asp Pro Lys Lys Phe Glu Glu Val Met Lys Ile Ser Ala
180 185 190
Glu Asn Gly Lys Leu Trp Lys Tyr Ser Met Ser Leu Pro Ser Gly Ser
195 200 205
Phe Pro Ser Pro Met Asn Gly Phe Asp Leu Phe Thr Tyr Met Ala Val
210 215 220
Ile Val Cys Tyr Arg Gly Lys Lys Glu Thr Thr Glu Ala Phe Lys Leu
225 230 235 240
Leu Ile Ser Glu Leu Glu Asp Asn Ile Lys Asn Lys Ala Thr Ser Phe
245 250 255
Arg Gly Glu Glu Lys Tyr Arg Ile Met Met Glu Gly Ile Pro Cys Trp
260 265 270
Pro Tyr Ile Gly Tyr Lys Met Arg Thr Leu Ala Gly Tyr Gly Val Asn
275 280 285
Met Thr Gly Ser Val Tyr Pro His Ala Trp Ala Leu Gln Tyr Glu Val
290 295 300
Asn Asp Leu Asp Gly Met Ala Lys Ala Tyr Ser Thr Met Phe Asn Asn
305 310 315 320
Val Asn Leu Glu Thr Met Cys Lys Tyr Arg Ile Asp Ser Leu Ile Asp
325 330 335
Gly Asn Cys Asp Gly Ala Phe Tyr His Met Asn Arg Ser Cys Lys Leu
340 345 350
Met Ser Phe Ile Gln Tyr Glu Met Glu Arg Lys Val Phe Glu Glu Thr
355 360 365
Gly Ile Pro Tyr Ala Gly Phe Asp Gly Asp Gln Ala Asp Pro Arg Asn
370 375 380
Phe Ser Lys Ala Gln Phe Glu Thr Arg Leu Gln Gly Leu Val Glu Val
385 390 395 400
Met Glu Glu Arg Lys Lys Gly Gly Asn Lys
405 410
<210> 61
<211> 266
<212> PRT
<213> Clostridioides difficile
<400> 61
Met Tyr Thr Met Gly Leu Asp Ile Gly Ser Thr Ala Ser Lys Gly Val
1 5 10 15
Ile Leu Lys Asn Gly Glu Asp Ile Val Ala Ser Glu Thr Ile Ser Ser
20 25 30
Gly Thr Gly Thr Thr Gly Pro Ser Arg Val Leu Glu Lys Leu Tyr Gly
35 40 45
Lys Thr Gly Leu Ala Arg Glu Asp Ile Lys Lys Val Val Val Thr Gly
50 55 60
Tyr Gly Arg Met Asn Tyr Ser Asp Ala Asp Lys Gln Ile Ser Glu Leu
65 70 75 80
Ser Cys His Ala Arg Gly Val Asn Phe Ile Ile Pro Glu Thr Arg Thr
85 90 95
Ile Ile Asp Ile Gly Gly Gln Asp Ala Lys Val Leu Lys Leu Asp Asn
100 105 110
Asn Gly Arg Leu Leu Asn Phe Leu Met Asn Asp Lys Cys Ala Ala Gly
115 120 125
Thr Gly Arg Phe Leu Asp Val Met Ala Lys Ile Ile Glu Val Asp Val
130 135 140
Ser Glu Leu Gly Ser Ile Ser Met Asn Ser Gln Asn Glu Val Ser Ile
145 150 155 160
Ser Ser Thr Cys Thr Val Phe Ala Glu Ser Glu Val Ile Ser His Leu
165 170 175
Ser Glu Asn Ala Lys Ile Glu Asp Ile Val Ala Gly Ile His Thr Ser
180 185 190
Val Ala Lys Arg Val Ser Ser Leu Val Lys Arg Ile Gly Val Gln Arg
195 200 205
Asn Val Val Met Val Gly Gly Val Ala Arg Asn Ser Gly Ile Val Arg
210 215 220
Ala Met Ala Arg Glu Ile Asn Thr Glu Ile Ile Val Pro Asp Ile Pro
225 230 235 240
Gln Leu Thr Gly Ala Leu Gly Ala Ala Leu Tyr Ala Phe Asp Glu Ala
245 250 255
Lys Glu Ser Gln Lys Glu Val Lys Asn Ile
260 265
<210> 62
<211> 375
<212> PRT
<213> Clostridium sporogenes
<400> 62
Met Asp Asn Ile Lys Asn Ile Leu Ser Lys Leu Glu Gly Ile Val Lys
1 5 10 15
Asn Pro Lys Lys Val Val Ser Asp Tyr Lys Glu Arg Thr Gly Asn Lys
20 25 30
Val Ile Gly Cys Phe Pro Val Tyr Thr Pro Glu Glu Ile Val Tyr Ala
35 40 45
Ala Asp Met Leu Pro Ile Gly Ile Trp Gly Gly Asp Val Glu Ala Asn
50 55 60
Leu Ala Lys Gln Tyr Tyr Pro Ala Phe Cys Cys Ser Ile Met Gln Ser
65 70 75 80
Cys Met Glu Phe Gly Leu Lys Gly Ile Tyr Glu Gly Leu Ser Ala Val
85 90 95
Ile Ile Pro Gly Met Cys Asp Thr Leu Asn Cys Met Gly Gln Asn Trp
100 105 110
Lys Phe Ala Ile Lys Asp Ile Pro Tyr Ile Ala Leu Val His Pro Gln
115 120 125
Asn Arg Lys Leu Glu Ala Gly Val Glu Tyr Leu Val Glu Glu Tyr Lys
130 135 140
His Val Lys Ala Lys Ile Glu Glu Ile Arg Gly Lys Glu Ile Thr Glu
145 150 155 160
Glu Glu Met Gln Asn Ser Ile Asp Ile Tyr Asn Glu His Arg Lys Val
165 170 175
Met Arg Ser Phe Val Asp Glu Ala Ala Lys His Pro Asn Thr Ile Asn
180 185 190
Asn Tyr Gln Arg Asn Leu Val Ile Lys Ser Gly Phe Phe Met Arg Lys
195 200 205
Asp Glu His Thr Lys Ile Val Lys Glu Leu Asn Glu Leu Leu Ala Val
210 215 220
Leu Pro Glu Glu Lys Tyr Asp Gly Lys Lys Val Leu Val Thr Gly Ile
225 230 235 240
Leu Leu Asp Ser Lys Glu Met Leu Asp Val Phe Glu Glu Asn Lys Leu
245 250 255
Arg Ile Val Ala Asp Asp Leu Ala Gln Glu Ser Arg Gln Phe Arg Thr
260 265 270
Asp Val Pro Glu Gly Lys Asn Ala Leu Asp Arg Leu Ala Arg Gln Trp
275 280 285
Ser Asn Ile Glu Gly Cys Ser Leu Ala Tyr Asp Pro Lys Lys Ile Arg
290 295 300
Gly Ser Met Ile Ala Lys Glu Ala Lys Ala Lys Gly Ile Asp Gly Val
305 310 315 320
Val Phe Ala Met Met Lys Phe Cys Asp Pro Glu Glu Tyr Asp Tyr Pro
325 330 335
Ile Val Lys Lys Asp Ile Glu Lys Glu Asp Ile Pro Thr Thr Met Ile
340 345 350
Glu Val Asp Gln Gln Asn Lys Ser Val Glu Gln Ile Arg Thr Arg Ile
355 360 365
Gln Thr Phe Ser Glu Ile Leu
370 375
<210> 63
<211> 375
<212> PRT
<213> Clostridioides difficile
<400> 63
Met Glu Ala Ile Leu Ser Lys Met Lys Glu Val Val Glu Asn Pro Asn
1 5 10 15
Ala Ala Val Lys Lys Tyr Lys Ser Glu Thr Gly Lys Lys Ala Ile Gly
20 25 30
Cys Phe Pro Val Tyr Cys Pro Glu Glu Ile Ile His Ala Ala Gly Met
35 40 45
Leu Pro Val Gly Ile Trp Gly Gly Gln Thr Glu Leu Asp Leu Ala Lys
50 55 60
Gln Tyr Phe Pro Ala Phe Ala Cys Ser Ile Met Gln Ser Cys Leu Glu
65 70 75 80
Tyr Gly Leu Lys Gly Ala Tyr Asp Glu Leu Ser Gly Val Ile Ile Pro
85 90 95
Gly Met Cys Asp Thr Leu Ile Cys Leu Gly Gln Asn Trp Lys Ser Ala
100 105 110
Val Pro His Ile Lys Tyr Ile Ser Leu Val His Pro Gln Asn Arg Lys
115 120 125
Leu Glu Ala Gly Val Lys Tyr Leu Ile Ser Glu Tyr Lys Gly Val Lys
130 135 140
Arg Glu Leu Glu Glu Ile Cys Gly Tyr Glu Ile Glu Glu Ala Lys Ile
145 150 155 160
His Glu Ser Ile Glu Val Tyr Asn Glu His Arg Lys Thr Met Arg Asp
165 170 175
Phe Val Glu Val Ala Tyr Lys His Ser Asn Thr Ile Lys Pro Ser Ile
180 185 190
Arg Ser Leu Val Ile Lys Ser Gly Phe Phe Met Arg Lys Glu Glu His
195 200 205
Thr Glu Leu Val Lys Asp Leu Ile Ala Lys Leu Asn Ala Met Pro Glu
210 215 220
Glu Val Cys Ser Gly Lys Lys Val Leu Leu Thr Gly Ile Leu Ala Asp
225 230 235 240
Ser Lys Asp Ile Leu Asp Ile Leu Glu Asp Asn Asn Ile Ser Val Val
245 250 255
Ala Asp Asp Leu Ala Gln Glu Thr Arg Gln Phe Arg Thr Asp Val Pro
260 265 270
Ala Gly Asp Asp Ala Leu Glu Arg Leu Ala Arg Gln Trp Ser Asn Ile
275 280 285
Glu Gly Cys Ser Leu Ala Tyr Asp Pro Lys Lys Lys Arg Gly Ser Leu
290 295 300
Ile Val Asp Glu Val Lys Lys Lys Asp Ile Asp Gly Val Ile Phe Cys
305 310 315 320
Met Met Lys Phe Cys Asp Pro Glu Glu Tyr Asp Tyr Pro Leu Val Arg
325 330 335
Lys Asp Ile Glu Asp Ser Gly Ile Pro Thr Leu Tyr Val Glu Ile Asp
340 345 350
Gln Gln Thr Gln Asn Asn Glu Gln Ala Arg Thr Arg Ile Gln Thr Phe
355 360 365
Ala Glu Met Met Ser Leu Ala
370 375
<210> 64
<211> 257
<212> PRT
<213> Clostridium sporogenes
<400> 64
Met Tyr Thr Met Gly Leu Asp Ile Gly Ser Thr Thr Ser Lys Gly Val
1 5 10 15
Ile Ile Lys Asp Gly Glu Glu Ile Val Ala Ser Val Leu Val Pro Val
20 25 30
Gly Thr Gly Thr Ser Gly Pro Leu Lys Leu Ile Lys Glu Leu Lys Glu
35 40 45
Lys Ser Asn Leu Thr Glu Lys Asp Ile Glu Lys Thr Val Val Thr Gly
50 55 60
Tyr Gly Arg Ile Gln Tyr Lys Asp Ala Asp Lys Gln Ile Ser Glu Leu
65 70 75 80
Ser Cys His Ala Lys Gly Val Ala Phe Leu Ile Pro Gly Ala Arg Thr
85 90 95
Ile Ile Asp Ile Gly Gly Gln Asp Ala Lys Ala Met Lys Leu Asn Asp
100 105 110
Lys Gly Lys Leu Ile Asn Phe Ile Met Asn Asp Lys Cys Ala Ala Gly
115 120 125
Thr Gly Arg Phe Leu Asp Val Met Ala Gly Val Leu Glu Thr Asp Val
130 135 140
Ser Lys Leu Gly Glu Ile Ser Glu Lys Ser Thr Lys Glu Val Ser Ile
145 150 155 160
Ser Ser Thr Cys Thr Val Phe Ala Glu Ser Glu Val Ile Ser His Leu
165 170 175
Ser Ala Asn Ala Lys Lys Glu Asp Ile Val Ala Gly Ile His Thr Ser
180 185 190
Val Val Arg Arg Val Ser Thr Leu Ala Met Arg Val Gly Ile Glu Asp
195 200 205
Gln Val Val Met Val Gly Gly Val Ala Arg Asn Lys Gly Ile Val Lys
210 215 220
Ala Met Glu Lys Glu Leu Gly His Asp Ile Lys Val Pro Glu Leu Ala
225 230 235 240
Gln Leu Thr Gly Ala Leu Gly Ala Ala Ile Tyr Ala Phe Glu Glu Thr
245 250 255
Lys
<210> 65
<211> 397
<212> PRT
<213> Treponema denticola
<400> 65
Met Ile Val Lys Pro Met Val Arg Asn Asn Ile Cys Leu Asn Ala His
1 5 10 15
Pro Gln Gly Cys Lys Lys Gly Val Glu Asp Gln Ile Glu Tyr Thr Lys
20 25 30
Lys Arg Ile Thr Ala Glu Val Lys Ala Gly Ala Lys Ala Pro Lys Asn
35 40 45
Val Leu Val Leu Gly Cys Ser Asn Gly Tyr Gly Leu Ala Ser Arg Ile
50 55 60
Thr Ala Ala Phe Gly Tyr Gly Ala Ala Thr Ile Gly Val Ser Phe Glu
65 70 75 80
Lys Ala Gly Ser Glu Thr Lys Tyr Gly Thr Pro Gly Trp Tyr Asn Asn
85 90 95
Leu Ala Phe Asp Glu Ala Ala Lys Arg Glu Gly Leu Tyr Ser Val Thr
100 105 110
Ile Asp Gly Asp Ala Phe Ser Asp Glu Ile Lys Ala Gln Val Ile Glu
115 120 125
Glu Ala Lys Lys Lys Gly Ile Lys Phe Asp Leu Ile Val Tyr Ser Leu
130 135 140
Ala Ser Pro Val Arg Thr Asp Pro Asp Thr Gly Ile Met His Lys Ser
145 150 155 160
Val Leu Lys Pro Phe Gly Lys Thr Phe Thr Gly Lys Thr Val Asp Pro
165 170 175
Phe Thr Gly Glu Leu Lys Glu Ile Ser Ala Glu Pro Ala Asn Asp Glu
180 185 190
Glu Ala Ala Ala Thr Val Lys Val Met Gly Gly Glu Asp Trp Glu Arg
195 200 205
Trp Ile Lys Gln Leu Ser Lys Glu Gly Leu Leu Glu Glu Gly Cys Ile
210 215 220
Thr Leu Ala Tyr Ser Tyr Ile Gly Pro Glu Ala Thr Gln Ala Leu Tyr
225 230 235 240
Arg Lys Gly Thr Ile Gly Lys Ala Lys Glu His Leu Glu Ala Thr Ala
245 250 255
His Arg Leu Asn Lys Glu Asn Pro Ser Ile Arg Ala Phe Val Ser Val
260 265 270
Asn Lys Gly Leu Val Thr Arg Ala Ser Ala Val Ile Pro Val Ile Pro
275 280 285
Leu Tyr Leu Ala Ser Leu Phe Lys Val Met Lys Glu Lys Gly Asn His
290 295 300
Glu Gly Cys Ile Glu Gln Ile Thr Arg Leu Tyr Ala Glu Arg Leu Tyr
305 310 315 320
Arg Lys Asp Gly Thr Ile Pro Val Asp Glu Glu Asn Arg Ile Arg Ile
325 330 335
Asp Asp Trp Glu Leu Glu Glu Asp Val Gln Lys Ala Val Ser Ala Leu
340 345 350
Met Glu Lys Val Thr Gly Glu Asn Ala Glu Ser Leu Thr Asp Leu Ala
355 360 365
Gly Tyr Arg His Asp Phe Leu Ala Ser Asn Gly Phe Asp Val Glu Gly
370 375 380
Ile Asn Tyr Glu Ala Glu Val Glu Arg Phe Asp Arg Ile
385 390 395
<210> 66
<211> 1173
<212> PRT
<213> Mycolicibacterium smegmatis
<400> 66
Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala
1 5 10 15
Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr
20 25 30
Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala
35 40 45
Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe
50 55 60
Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu
65 70 75 80
Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe
85 90 95
Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala
100 105 110
Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala
115 120 125
Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu
130 135 140
Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala
145 150 155 160
Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile
165 170 175
Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg
180 185 190
Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu
195 200 205
Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala
210 215 220
Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly
225 230 235 240
Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg
245 250 255
Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly
260 265 270
Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe
275 280 285
Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu
290 295 300
Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly
305 310 315 320
Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu
325 330 335
Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val
340 345 350
Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val
355 360 365
Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu
370 375 380
Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser
385 390 395 400
Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu
405 410 415
Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val
420 425 430
Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu
435 440 445
Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro
450 455 460
Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr
465 470 475 480
Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr
485 490 495
His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr
500 505 510
Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val
515 520 525
Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg
530 535 540
Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val
545 550 555 560
Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu
565 570 575
Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu
580 585 590
Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro
595 600 605
Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg
610 615 620
Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala
625 630 635 640
Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala
645 650 655
Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr
660 665 670
Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp
675 680 685
Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser
690 695 700
Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala
705 710 715 720
Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala
725 730 735
Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr
740 745 750
Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu
755 760 765
Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg
770 775 780
Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr
785 790 795 800
Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr
805 810 815
Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln
820 825 830
Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala
835 840 845
Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu
850 855 860
Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu
865 870 875 880
Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln
885 890 895
Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala
900 905 910
Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val
915 920 925
Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val
930 935 940
Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn
945 950 955 960
Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys
965 970 975
Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro
980 985 990
Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu
995 1000 1005
Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile Gly
1010 1015 1020
Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val Asp Phe
1025 1030 1035 1040
Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg Glu Gly Tyr
1045 1050 1055
Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly Ile Ser Leu Asp
1060 1065 1070
Val Phe Val Asp Trp Leu Ile Arg Ala Gly His Pro Ile Asp Arg Val
1075 1080 1085
Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe Glu Thr Ala Leu Thr Ala
1090 1095 1100
Leu Pro Glu Lys Arg Arg Ala Gln Thr Val Leu Pro Leu Leu His Ala
1105 1110 1115 1120
Phe Arg Ala Pro Gln Ala Pro Leu Arg Gly Ala Pro Glu Pro Thr Glu
1125 1130 1135
Val Phe His Ala Ala Val Arg Thr Ala Lys Val Gly Pro Gly Asp Ile
1140 1145 1150
Pro His Leu Asp Glu Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg
1155 1160 1165
Glu Phe Gly Leu Ile
1170
<210> 67
<211> 1168
<212> PRT
<213> Mycolicibacterium smegmatis
<400> 67
Met Thr Ile Glu Thr Arg Glu Asp Arg Phe Asn Arg Arg Ile Asp His
1 5 10 15
Leu Phe Glu Thr Asp Pro Gln Phe Ala Ala Ala Arg Pro Asp Glu Ala
20 25 30
Ile Ser Ala Ala Ala Ala Asp Pro Glu Leu Arg Leu Pro Ala Ala Val
35 40 45
Lys Gln Ile Leu Ala Gly Tyr Ala Asp Arg Pro Ala Leu Gly Lys Arg
50 55 60
Ala Val Glu Phe Val Thr Asp Glu Glu Gly Arg Thr Thr Ala Lys Leu
65 70 75 80
Leu Pro Arg Phe Asp Thr Ile Thr Tyr Arg Gln Leu Ala Gly Arg Ile
85 90 95
Gln Ala Val Thr Asn Ala Trp His Asn His Pro Val Asn Ala Gly Asp
100 105 110
Arg Val Ala Ile Leu Gly Phe Thr Ser Val Asp Tyr Thr Thr Ile Asp
115 120 125
Ile Ala Leu Leu Glu Leu Gly Ala Val Ser Val Pro Leu Gln Thr Ser
130 135 140
Ala Pro Val Ala Gln Leu Gln Pro Ile Val Ala Glu Thr Glu Pro Lys
145 150 155 160
Val Ile Ala Ser Ser Val Asp Phe Leu Ala Asp Ala Val Ala Leu Val
165 170 175
Glu Ser Gly Pro Ala Pro Ser Arg Leu Val Val Phe Asp Tyr Ser His
180 185 190
Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala Ala Lys Gly Lys Leu
195 200 205
Ala Gly Thr Gly Val Val Val Glu Thr Ile Thr Asp Ala Leu Asp Arg
210 215 220
Gly Arg Ser Leu Ala Asp Ala Pro Leu Tyr Val Pro Asp Glu Ala Asp
225 230 235 240
Pro Leu Thr Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys
245 250 255
Gly Ala Met Tyr Pro Glu Ser Lys Thr Ala Thr Met Trp Gln Ala Gly
260 265 270
Ser Lys Ala Arg Trp Asp Glu Thr Leu Gly Val Met Pro Ser Ile Thr
275 280 285
Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gly Ile Leu Cys
290 295 300
Ser Thr Leu Ala Ser Gly Gly Thr Ala Tyr Phe Ala Ala Arg Ser Asp
305 310 315 320
Leu Ser Thr Phe Leu Glu Asp Leu Ala Leu Val Arg Pro Thr Gln Leu
325 330 335
Asn Phe Val Pro Arg Ile Trp Asp Met Leu Phe Gln Glu Tyr Gln Ser
340 345 350
Arg Leu Asp Asn Arg Arg Ala Glu Gly Ser Glu Asp Arg Ala Glu Ala
355 360 365
Ala Val Leu Glu Glu Val Arg Thr Gln Leu Leu Gly Gly Arg Phe Val
370 375 380
Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Ala Glu Met Lys Ser Trp
385 390 395 400
Val Glu Asp Leu Leu Asp Met His Leu Leu Glu Gly Tyr Gly Ser Thr
405 410 415
Glu Ala Gly Ala Val Phe Ile Asp Gly Gln Ile Gln Arg Pro Pro Val
420 425 430
Ile Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe Ala Thr
435 440 445
Asp Arg Pro Tyr Pro Arg Gly Glu Leu Leu Val Lys Ser Glu Gln Met
450 455 460
Phe Pro Gly Tyr Tyr Lys Arg Pro Glu Ile Thr Ala Glu Met Phe Asp
465 470 475 480
Glu Asp Gly Tyr Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Gly Pro
485 490 495
Asp His Leu Glu Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ser
500 505 510
Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe Gly Asp
515 520 525
Ser Pro Leu Val Arg Gln Ile Tyr Val Tyr Gly Asn Ser Ala Arg Ser
530 535 540
Tyr Leu Leu Ala Val Val Val Pro Thr Glu Glu Ala Leu Ser Arg Trp
545 550 555 560
Asp Gly Asp Glu Leu Lys Ser Arg Ile Ser Asp Ser Leu Gln Asp Ala
565 570 575
Ala Arg Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp Phe Leu
580 585 590
Val Glu Thr Thr Pro Phe Thr Leu Glu Asn Gly Leu Leu Thr Gly Ile
595 600 605
Arg Lys Leu Ala Arg Pro Lys Leu Lys Ala His Tyr Gly Glu Arg Leu
610 615 620
Glu Gln Leu Tyr Thr Asp Leu Ala Glu Gly Gln Ala Asn Glu Leu Arg
625 630 635 640
Glu Leu Arg Arg Asn Gly Ala Asp Arg Pro Val Val Glu Thr Val Ser
645 650 655
Arg Ala Ala Val Ala Leu Leu Gly Ala Ser Val Thr Asp Leu Arg Ser
660 665 670
Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser
675 680 685
Phe Ser Asn Leu Leu His Glu Ile Phe Asp Val Asp Val Pro Val Gly
690 695 700
Val Ile Val Ser Pro Ala Thr Asp Leu Ala Gly Val Ala Ala Tyr Ile
705 710 715 720
Glu Gly Glu Leu Arg Gly Ser Lys Arg Pro Thr Tyr Ala Ser Val His
725 730 735
Gly Arg Asp Ala Thr Glu Val Arg Ala Arg Asp Leu Ala Leu Gly Lys
740 745 750
Phe Ile Asp Ala Lys Thr Leu Ser Ala Ala Pro Gly Leu Pro Arg Ser
755 760 765
Gly Thr Glu Ile Arg Thr Val Leu Leu Thr Gly Ala Thr Gly Phe Leu
770 775 780
Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu Arg Met Asp Leu Val Asp
785 790 795 800
Gly Lys Val Ile Cys Leu Val Arg Ala Arg Ser Asp Asp Glu Ala Arg
805 810 815
Ala Arg Leu Asp Ala Thr Phe Asp Thr Gly Asp Ala Thr Leu Leu Glu
820 825 830
His Tyr Arg Ala Leu Ala Ala Asp His Leu Glu Val Ile Ala Gly Asp
835 840 845
Lys Gly Glu Ala Asp Leu Gly Leu Asp His Asp Thr Trp Gln Arg Leu
850 855 860
Ala Asp Thr Val Asp Leu Ile Val Asp Pro Ala Ala Leu Val Asn His
865 870 875 880
Val Leu Pro Tyr Ser Gln Met Phe Gly Pro Asn Ala Leu Gly Thr Ala
885 890 895
Glu Leu Ile Arg Ile Ala Leu Thr Thr Thr Ile Lys Pro Tyr Val Tyr
900 905 910
Val Ser Thr Ile Gly Val Gly Gln Gly Ile Ser Pro Glu Ala Phe Val
915 920 925
Glu Asp Ala Asp Ile Arg Glu Ile Ser Ala Thr Arg Arg Val Asp Asp
930 935 940
Ser Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu
945 950 955 960
Leu Arg Glu Ala His Asp Trp Cys Gly Leu Pro Val Ser Val Phe Arg
965 970 975
Cys Asp Met Ile Leu Ala Asp Thr Thr Tyr Ser Gly Gln Leu Asn Leu
980 985 990
Pro Asp Met Phe Thr Arg Leu Met Leu Ser Leu Val Ala Thr Gly Ile
995 1000 1005
Ala Pro Gly Ser Phe Tyr Glu Leu Asp Ala Asp Gly Asn Arg Gln Arg
1010 1015 1020
Ala His Tyr Asp Gly Leu Pro Val Glu Phe Ile Ala Glu Ala Ile Ser
1025 1030 1035 1040
Thr Ile Gly Ser Gln Val Thr Asp Gly Phe Glu Thr Phe His Val Met
1045 1050 1055
Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp Glu Tyr Val Asp Trp Leu
1060 1065 1070
Ile Glu Ala Gly Tyr Pro Val His Arg Val Asp Asp Tyr Ala Thr Trp
1075 1080 1085
Leu Ser Arg Phe Glu Thr Ala Leu Arg Ala Leu Pro Glu Arg Gln Arg
1090 1095 1100
Gln Ala Ser Leu Leu Pro Leu Leu His Asn Tyr Gln Gln Pro Ser Pro
1105 1110 1115 1120
Pro Val Cys Gly Ala Met Ala Pro Thr Asp Arg Phe Arg Ala Ala Val
1125 1130 1135
Gln Asp Ala Lys Ile Gly Pro Asp Lys Asp Ile Pro His Val Thr Ala
1140 1145 1150
Asp Val Ile Val Lys Tyr Ile Ser Asn Leu Gln Met Leu Gly Leu Leu
1155 1160 1165
<210> 68
<211> 1186
<212> PRT
<213> Segniliparus rotundus
<400> 68
Met Thr Gln Ser His Thr Gln Gly Pro Gln Ala Ser Ala Ala His Ser
1 5 10 15
Arg Leu Ala Arg Arg Ala Ala Glu Leu Leu Ala Thr Asp Pro Gln Ala
20 25 30
Ala Ala Thr Leu Pro Asp Pro Glu Val Val Arg Gln Ala Thr Arg Pro
35 40 45
Gly Leu Arg Leu Ala Glu Arg Val Asp Ala Ile Leu Ser Gly Tyr Ala
50 55 60
Asp Arg Pro Ala Leu Gly Gln Arg Ser Phe Gln Thr Val Lys Asp Pro
65 70 75 80
Ile Thr Gly Arg Ser Ser Val Glu Leu Leu Pro Thr Phe Asp Thr Ile
85 90 95
Thr Tyr Arg Glu Leu Arg Glu Arg Ala Thr Ala Ile Ala Ser Asp Leu
100 105 110
Ala His His Pro Gln Ala Pro Ala Lys Pro Gly Asp Phe Leu Ala Ser
115 120 125
Ile Gly Phe Ile Ser Val Asp Tyr Val Ala Ile Asp Ile Ala Gly Val
130 135 140
Phe Ala Gly Leu Thr Ala Val Pro Leu Gln Thr Gly Ala Thr Leu Ala
145 150 155 160
Thr Leu Thr Ala Ile Thr Ala Glu Thr Ala Pro Thr Leu Phe Ala Ala
165 170 175
Ser Ile Glu His Leu Pro Thr Ala Val Asp Ala Val Leu Ala Thr Pro
180 185 190
Ser Val Arg Arg Leu Leu Val Phe Asp Tyr Arg Ala Gly Ser Asp Glu
195 200 205
Asp Arg Glu Ala Val Glu Ala Ala Lys Arg Lys Ile Ala Asp Ala Gly
210 215 220
Ser Ser Val Leu Val Asp Val Leu Asp Glu Val Ile Ala Arg Gly Lys
225 230 235 240
Ser Ala Pro Lys Ala Pro Leu Pro Pro Ala Thr Asp Ala Gly Asp Asp
245 250 255
Ser Leu Ser Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys
260 265 270
Gly Ala Met Tyr Pro Glu Arg Asn Val Ala His Phe Trp Gly Gly Val
275 280 285
Trp Ala Ala Ala Phe Asp Glu Asp Ala Ala Pro Pro Val Pro Ala Ile
290 295 300
Asn Ile Thr Phe Leu Pro Leu Ser His Val Ala Ser Arg Leu Ser Leu
305 310 315 320
Met Pro Thr Leu Ala Arg Gly Gly Leu Met His Phe Val Ala Lys Ser
325 330 335
Asp Leu Ser Thr Leu Phe Glu Asp Leu Lys Leu Ala Arg Pro Thr Asn
340 345 350
Leu Phe Leu Val Pro Arg Val Val Glu Met Leu Tyr Gln His Tyr Gln
355 360 365
Ser Glu Leu Asp Arg Arg Gly Val Gln Asp Gly Thr Arg Glu Ala Glu
370 375 380
Ala Val Lys Asp Asp Leu Arg Thr Gly Leu Leu Gly Gly Arg Ile Leu
385 390 395 400
Thr Ala Gly Phe Gly Ser Ala Pro Leu Ser Ala Glu Leu Ala Gly Phe
405 410 415
Ile Glu Ser Leu Leu Gln Ile His Leu Val Asp Gly Tyr Gly Ser Thr
420 425 430
Glu Ala Gly Pro Val Trp Arg Asp Gly Tyr Leu Val Lys Pro Pro Val
435 440 445
Thr Asp Tyr Lys Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr
450 455 460
Asp Ser Pro His Pro Arg Gly Glu Leu Ala Ile Lys Thr Gln Thr Ile
465 470 475 480
Leu Pro Gly Tyr Tyr Lys Arg Pro Glu Thr Thr Ala Glu Val Phe Asp
485 490 495
Glu Asp Gly Phe Tyr Leu Thr Gly Asp Val Val Ala Gln Ile Gly Pro
500 505 510
Glu Gln Phe Ala Tyr Val Asp Arg Arg Lys Asn Val Leu Lys Leu Ser
515 520 525
Gln Gly Glu Phe Val Thr Leu Ala Lys Leu Glu Ala Ala Tyr Ser Ser
530 535 540
Ser Pro Leu Val Arg Gln Leu Phe Val Tyr Gly Ser Ser Glu Arg Ser
545 550 555 560
Tyr Leu Leu Ala Val Ile Val Pro Thr Pro Asp Ala Leu Lys Lys Phe
565 570 575
Gly Val Gly Glu Ala Ala Lys Ala Ala Leu Gly Glu Ser Leu Gln Lys
580 585 590
Ile Ala Arg Asp Glu Gly Leu Gln Ser Tyr Glu Val Pro Arg Asp Phe
595 600 605
Ile Ile Glu Thr Asp Pro Phe Thr Val Glu Asn Gly Leu Leu Ser Asp
610 615 620
Ala Arg Lys Ser Leu Arg Pro Lys Leu Lys Glu His Tyr Gly Glu Arg
625 630 635 640
Leu Glu Ala Met Tyr Lys Glu Leu Ala Asp Gly Gln Ala Asn Glu Leu
645 650 655
Arg Asp Ile Arg Arg Gly Val Gln Gln Arg Pro Thr Leu Glu Thr Val
660 665 670
Arg Arg Ala Ala Ala Ala Met Leu Gly Ala Ser Ala Ala Glu Ile Lys
675 680 685
Pro Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu
690 695 700
Thr Phe Ser Asn Phe Leu His Asp Leu Phe Glu Val Asp Val Pro Val
705 710 715 720
Gly Val Ile Val Ser Ala Ala Asn Thr Leu Gly Ser Val Ala Glu His
725 730 735
Ile Asp Ala Gln Leu Ala Gly Gly Arg Ala Arg Pro Thr Phe Ala Thr
740 745 750
Val His Gly Lys Gly Ser Thr Thr Ile Lys Ala Ser Asp Leu Thr Leu
755 760 765
Asp Lys Phe Ile Asp Glu Gln Thr Leu Glu Ala Ala Lys His Leu Pro
770 775 780
Lys Pro Ala Asp Pro Pro Arg Thr Val Leu Leu Thr Gly Ala Asn Gly
785 790 795 800
Trp Leu Gly Arg Phe Leu Ala Leu Glu Trp Leu Glu Arg Leu Ala Pro
805 810 815
Ala Gly Gly Lys Leu Ile Thr Ile Val Arg Gly Lys Asp Ala Ala Gln
820 825 830
Ala Lys Ala Arg Leu Asp Ala Ala Tyr Glu Ser Gly Asp Pro Lys Leu
835 840 845
Ala Gly His Tyr Gln Asp Leu Ala Ala Thr Thr Leu Glu Val Leu Ala
850 855 860
Gly Asp Phe Ser Glu Pro Arg Leu Gly Leu Asp Glu Ala Thr Trp Asn
865 870 875 880
Arg Leu Ala Asp Glu Val Asp Phe Ile Ser His Pro Gly Ala Leu Val
885 890 895
Asn His Val Leu Pro Tyr Asn Gln Leu Phe Gly Pro Asn Val Ala Gly
900 905 910
Val Ala Glu Ile Ile Lys Leu Ala Ile Thr Thr Arg Ile Lys Pro Val
915 920 925
Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly Val Glu Pro Ser Ala
930 935 940
Leu Asp Glu Asp Gly Asp Ile Arg Thr Val Ser Ala Glu Arg Ser Val
945 950 955 960
Asp Glu Gly Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Gly Gly Glu
965 970 975
Val Leu Leu Arg Glu Ala His Asp Arg Thr Gly Leu Pro Val Arg Val
980 985 990
Phe Arg Ser Asp Met Ile Leu Ala His Gln Lys Tyr Thr Gly Gln Val
995 1000 1005
Asn Ala Thr Asp Gln Phe Thr Arg Leu Val Gln Ser Leu Leu Ala Thr
1010 1015 1020
Gly Leu Ala Pro Lys Ser Phe Tyr Glu Leu Asp Ala Gln Gly Asn Arg
1025 1030 1035 1040
Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp Phe Thr Ala Glu Ser
1045 1050 1055
Ile Thr Thr Leu Gly Gly Asp Gly Leu Glu Gly Tyr Arg Ser Tyr Asn
1060 1065 1070
Val Phe Asn Pro His Arg Asp Gly Val Gly Leu Asp Glu Phe Val Asp
1075 1080 1085
Trp Leu Ile Glu Ala Gly His Pro Ile Thr Arg Ile Asp Asp Tyr Asp
1090 1095 1100
Gln Trp Leu Ser Arg Phe Glu Thr Ser Leu Arg Gly Leu Pro Glu Ser
1105 1110 1115 1120
Lys Arg Gln Ala Ser Val Leu Pro Leu Leu His Ala Phe Ala Arg Pro
1125 1130 1135
Gly Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Thr Val Phe Arg Thr
1140 1145 1150
Asp Val Gln Lys Ala Lys Ile Gly Ala Glu His Asp Ile Pro His Leu
1155 1160 1165
Gly Lys Ala Leu Val Leu Lys Tyr Ala Asp Asp Ile Lys Gln Leu Gly
1170 1175 1180
Leu Leu
1185
<210> 69
<211> 224
<212> PRT
<213> Bacillus subtilis
<400> 69
Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu
1 5 10 15
Asn Glu Arg Phe Met Ser Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys
20 25 30
Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp
35 40 45
Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser
50 55 60
Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp
65 70 75 80
Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile
85 90 95
Cys Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys
100 105 110
Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr
115 120 125
Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr
130 135 140
His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly
145 150 155 160
Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly
165 170 175
Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys
180 185 190
Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His
195 200 205
Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu
210 215 220
<210> 70
<211> 251
<212> PRT
<213> Leifsonia sp.
<400> 70
Met Ala Gln Tyr Asp Val Ala Asp Arg Ser Ala Ile Val Thr Gly Gly
1 5 10 15
Gly Ser Gly Ile Gly Arg Ala Val Ala Leu Thr Leu Ala Ala Ser Gly
20 25 30
Ala Ala Val Leu Val Thr Asp Leu Asn Glu Glu His Ala Gln Ala Val
35 40 45
Val Ala Glu Ile Glu Ala Ala Gly Gly Lys Ala Ala Ala Leu Ala Gly
50 55 60
Asp Val Thr Asp Pro Ala Phe Gly Glu Ala Ser Val Ala Gly Ala Asn
65 70 75 80
Ala Leu Ala Pro Leu Lys Ile Ala Val Asn Asn Ala Gly Ile Gly Gly
85 90 95
Glu Ala Ala Thr Val Gly Asp Tyr Ser Leu Asp Ser Trp Arg Thr Val
100 105 110
Ile Glu Val Asn Leu Asn Ala Val Phe Tyr Gly Met Gln Pro Gln Leu
115 120 125
Lys Ala Met Ala Ala Asn Gly Gly Gly Ala Ile Val Asn Met Ala Ser
130 135 140
Ile Leu Gly Ser Val Gly Phe Ala Asn Ser Ser Ala Tyr Val Thr Ala
145 150 155 160
Lys His Ala Leu Leu Gly Leu Thr Gln Asn Ala Ala Leu Glu Tyr Ala
165 170 175
Ala Asp Lys Val Arg Val Val Ala Val Gly Pro Gly Phe Ile Arg Thr
180 185 190
Pro Leu Val Glu Ala Asn Leu Ser Ala Asp Ala Leu Ala Phe Leu Glu
195 200 205
Gly Lys His Ala Leu Gly Arg Leu Gly Glu Pro Glu Glu Val Ala Ser
210 215 220
Leu Val Ala Phe Leu Ala Ser Asp Ala Ala Ser Phe Ile Thr Gly Ser
225 230 235 240
Tyr His Leu Val Asp Gly Gly Tyr Thr Ala Gln
245 250
<210> 71
<211> 352
<212> PRT
<213> Rhodococcus sp.
<400> 71
Met Arg Val Phe Ala Val Gln Pro Glu Asp Thr Thr Ile His Asp Leu
1 5 10 15
Gln Val Pro Thr Pro Ser Pro Glu Gly Arg Glu Val Leu Leu Arg Val
20 25 30
Val Arg Ala Gly Val Cys His Thr Asp Thr His Leu Arg Ala Gly Gly
35 40 45
Tyr Asp Leu Gly Ser Arg Gly Met Met Ser Met Lys Glu Arg Gly Ile
50 55 60
Glu Tyr Pro Met Val Leu Gly His Glu Val Val Gly Val Val Glu Lys
65 70 75 80
Val Gly Asp Gly Val Glu Ser Val Gln Val Gly Asp Ile Arg Leu Ile
85 90 95
Tyr Pro Trp Ile Gly Cys Gly Glu Cys Arg Gln Cys Arg Ala Gly His
100 105 110
Asp Asn Arg Cys Ala Ala Gly Lys Asn Leu Gly Val Ala Arg His Gly
115 120 125
Gly Tyr Ala Glu Asn Ile Leu Val Pro Asp Glu Lys Tyr Leu Val Asp
130 135 140
Ile Asp Gly Leu Asp Pro Ser Trp Ala Ala Thr Leu Ala Cys Ser Gly
145 150 155 160
Leu Thr Ala Tyr Ser Ala Val Asp Lys Ala Leu Pro Leu Glu Pro Asp
165 170 175
Glu Pro Val Val Val Phe Gly Ala Gly Gly Leu Gly Leu Thr Ala Ile
180 185 190
Ala Ile Leu Arg Ser Arg Gly His Arg Asn Ile Cys Ala Val Asp Val
195 200 205
Ala Glu Arg Asn Leu Ala Leu Ala Arg Asp Met Gly Ala Ser Ser Thr
210 215 220
Val Leu Ser Gly Thr Gly Ser Gly Ala Asp Asp Ile Arg Gly Ala Ala
225 230 235 240
Gly Gly Pro Ala Gly Ala Val Ile Asp Phe Val Asn Asn Gly Ala Thr
245 250 255
Ala Thr Thr Ala Phe Glu Val Leu Ala Lys Ala Gly Ile Met Ile Gln
260 265 270
Val Gly Leu Phe Gly Gly Glu Val Thr Leu Pro Thr Ala Leu Leu Ala
275 280 285
Leu Arg Met Ile Arg Ile Glu Gly Ser Phe Val Gly Thr Leu Val Gln
290 295 300
Met Gln Asp Leu Val Arg Leu Ala Gln Arg Gly Glu Leu Pro His Ile
305 310 315 320
Pro Val Val Glu Arg Ser Leu Ser Ala Ala Ala Val Ser Gln Ala Leu
325 330 335
Asp Asp Leu Thr Ala Gly Gly Val Ala Gly Arg Ile Val Leu Thr Ala
340 345 350
<210> 72
<211> 352
<212> PRT
<213> Acinetobacter sp.
<400> 72
Met His Cys Tyr Cys Val Thr His His Gly Gln Pro Leu Glu Asp Val
1 5 10 15
Glu Lys Glu Ile Pro Gln Pro Lys Gly Thr Glu Val Leu Leu His Val
20 25 30
Lys Ala Ala Gly Leu Cys His Thr Asp Leu His Leu Trp Glu Gly Tyr
35 40 45
Tyr Asp Leu Gly Gly Gly Lys Arg Leu Ser Leu Ala Asp Arg Gly Leu
50 55 60
Lys Pro Pro Leu Thr Leu Ser His Glu Ile Thr Gly Gln Val Val Ala
65 70 75 80
Val Gly Pro Asp Ala Glu Ser Val Lys Val Gly Met Val Ser Leu Val
85 90 95
His Pro Trp Ile Gly Cys Gly Glu Cys Asn Tyr Cys Lys Arg Gly Glu
100 105 110
Glu Asn Leu Cys Ala Lys Pro Gln Gln Leu Gly Ile Ala Lys Pro Gly
115 120 125
Gly Phe Ala Glu Tyr Ile Ile Val Pro His Pro Arg Tyr Leu Val Asp
130 135 140
Ile Ala Gly Leu Asp Leu Ala Glu Ala Ala Pro Leu Ala Cys Ala Gly
145 150 155 160
Val Thr Thr Tyr Ser Ala Leu Lys Lys Phe Gly Asp Leu Ile Gln Ser
165 170 175
Glu Pro Val Val Ile Ile Gly Ala Gly Gly Leu Gly Leu Met Ala Leu
180 185 190
Glu Leu Leu Lys Ala Met Gln Ala Lys Gly Ala Ile Val Val Asp Ile
195 200 205
Asp Asp Ser Lys Leu Glu Ala Ala Arg Ala Ala Gly Ala Leu Ser Val
210 215 220
Ile Asn Ser Arg Ser Glu Asp Ala Ala Gln Gln Leu Ile Gln Ala Thr
225 230 235 240
Asp Gly Gly Ala Arg Leu Ile Leu Asp Leu Val Gly Ser Asn Pro Thr
245 250 255
Leu Ser Leu Ala Leu Ala Ser Ala Ala Arg Gly Gly His Ile Val Ile
260 265 270
Cys Gly Leu Met Gly Gly Glu Ile Lys Leu Ser Ile Pro Val Ile Pro
275 280 285
Met Arg Pro Leu Thr Ile Gln Gly Ser Tyr Val Gly Thr Val Glu Glu
290 295 300
Leu Arg Glu Leu Val Glu Leu Val Lys Glu Thr His Met Ser Ala Ile
305 310 315 320
Pro Val Lys Lys Leu Pro Ile Ser Gln Ile Asn Ser Ala Phe Gly Asp
325 330 335
Leu Lys Asp Gly Asn Val Ile Gly Arg Ile Val Leu Met His Glu Asn
340 345 350
<210> 73
<211> 391
<212> PRT
<213> Clostridium ljungdahlii
<400> 73
Met Glu Asn Phe Ile Phe Lys Asn Ala Thr Glu Ile Ile Phe Gly Lys
1 5 10 15
Asp Thr Glu Asn Leu Val Gly Ser Lys Val Lys Glu Tyr Ser Lys Ser
20 25 30
Asp Lys Ile Leu Phe Cys Tyr Gly Gly Gly Ser Ile Lys Arg Ser Gly
35 40 45
Leu Tyr Asp Arg Val Ile Lys Ser Leu Lys Glu Asn Gly Ile Glu Phe
50 55 60
Ile Glu Leu Pro Gly Ile Lys Pro Asn Pro Arg Leu Gly Pro Val Lys
65 70 75 80
Glu Gly Ile Arg Leu Cys Arg Glu Asn Asn Ile Lys Phe Val Leu Ser
85 90 95
Val Gly Gly Gly Ser Ser Ala Asp Thr Ala Lys Ala Ile Ala Val Gly
100 105 110
Val Pro Tyr Lys Gly Asp Val Trp Asp Phe Tyr Thr Gly Lys Ala Glu
115 120 125
Val Lys Glu Ala Leu Pro Val Gly Val Val Ile Thr Leu Pro Ala Thr
130 135 140
Gly Thr Glu Ser Ser Asn Ser Ser Val Ile Met Asn Glu Asp Gly Trp
145 150 155 160
Phe Lys Lys Gly Leu Asn Thr Val Leu Ile Arg Pro Ala Phe Ser Ile
165 170 175
Met Asn Pro Glu Leu Thr Phe Thr Leu Pro Glu Tyr Gln Thr Ala Cys
180 185 190
Gly Ala Cys Asp Ile Met Ala His Ile Met Glu Arg Tyr Phe Thr Asn
195 200 205
Val Lys His Val Asp Ile Thr Asp Arg Leu Cys Glu Ala Ala Leu Arg
210 215 220
Asn Val Ile Asn Asn Ala Pro Ile Val Leu Lys Asp Pro Lys Asn Tyr
225 230 235 240
Asp Ala Arg Ala Glu Ile Met Trp Thr Gly Thr Ile Ala His Asn Asp
245 250 255
Val Leu Ser Ala Gly Arg Ile Gly Asp Trp Ala Ser His Lys Ile Glu
260 265 270
His Glu Leu Ser Gly Glu Thr Asp Ile Ala His Gly Ala Gly Leu Ala
275 280 285
Ile Val Phe Pro Ala Trp Met Lys Tyr Val Tyr Lys His Asp Ile Asn
290 295 300
Arg Phe Val Gln Phe Ala Val Arg Val Trp Asp Val Asp Leu Ser Tyr
305 310 315 320
Ser Ser Cys Glu Asp Ile Val Leu Glu Gly Ile Arg Arg Met Thr Ala
325 330 335
Phe Phe Lys Ser Met Gly Leu Pro Val Thr Leu Lys Glu Gly Ser Ile
340 345 350
Gly Glu Asp Lys Ile Glu Glu Met Ala Asn Lys Cys Thr Asp Asn Gly
355 360 365
Thr Lys Thr Val Gly Gln Phe Val Lys Leu Asn Lys Asp Asp Ile Val
370 375 380
Lys Ile Leu Asn Leu Ala Lys
385 390
<210> 74
<211> 389
<212> PRT
<213> Clostridium acetobutylicum
<400> 74
Met Leu Ser Phe Asp Tyr Ser Ile Pro Thr Lys Val Phe Phe Gly Lys
1 5 10 15
Gly Lys Ile Asp Val Ile Gly Glu Glu Ile Lys Lys Tyr Gly Ser Arg
20 25 30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
35 40 45
Asp Arg Ala Thr Ala Ile Leu Lys Glu Asn Asn Ile Ala Phe Tyr Glu
50 55 60
Leu Ser Gly Val Glu Pro Asn Pro Arg Ile Thr Thr Val Lys Lys Gly
65 70 75 80
Ile Glu Ile Cys Arg Glu Asn Asn Val Asp Leu Val Leu Ala Ile Gly
85 90 95
Gly Gly Ser Ala Ile Asp Cys Ser Lys Val Ile Ala Ala Gly Val Tyr
100 105 110
Tyr Asp Gly Asp Thr Trp Asp Met Val Lys Asp Pro Ser Lys Ile Thr
115 120 125
Lys Val Leu Pro Ile Ala Ser Ile Leu Thr Leu Ser Ala Thr Gly Ser
130 135 140
Glu Met Asp Gln Ile Ala Val Ile Ser Asn Met Glu Thr Asn Glu Lys
145 150 155 160
Leu Gly Val Gly His Asp Asp Met Arg Pro Lys Phe Ser Val Leu Asp
165 170 175
Pro Thr Tyr Thr Phe Thr Val Pro Lys Asn Gln Thr Ala Ala Gly Thr
180 185 190
Ala Asp Ile Met Ser His Thr Phe Glu Ser Tyr Phe Ser Gly Val Glu
195 200 205
Gly Ala Tyr Val Gln Asp Gly Ile Ala Glu Ala Ile Leu Arg Thr Cys
210 215 220
Ile Lys Tyr Gly Lys Ile Ala Met Glu Lys Thr Asp Asp Tyr Glu Ala
225 230 235 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
245 250 255
Ser Leu Gly Lys Asp Arg Lys Trp Ser Cys His Pro Met Glu His Glu
260 265 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
275 280 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asp Asp Thr Leu His Lys
290 295 300
Phe Val Ser Tyr Gly Ile Asn Val Trp Gly Ile Asp Lys Asn Lys Asp
305 310 315 320
Asn Tyr Glu Ile Ala Arg Glu Ala Ile Lys Asn Thr Arg Glu Tyr Phe
325 330 335
Asn Ser Leu Gly Ile Pro Ser Lys Leu Arg Glu Val Gly Ile Gly Lys
340 345 350
Asp Lys Leu Glu Leu Met Ala Lys Gln Ala Val Arg Asn Ser Gly Gly
355 360 365
Thr Ile Gly Ser Leu Arg Pro Ile Asn Ala Glu Asp Val Leu Glu Ile
370 375 380
Phe Lys Lys Ser Tyr
385
<210> 75
<211> 477
<212> PRT
<213> Acinetobacter sp.
<400> 75
Met Asn Tyr Pro Asn Ile Pro Leu Tyr Ile Asn Gly Glu Phe Leu Asp
1 5 10 15
His Thr Asn Arg Asp Val Lys Glu Val Phe Asn Pro Val Asn His Glu
20 25 30
Cys Ile Gly Leu Met Ala Cys Ala Ser Gln Ala Asp Leu Asp Tyr Ala
35 40 45
Leu Glu Ser Ser Gln Gln Ala Phe Leu Arg Trp Lys Lys Thr Ser Pro
50 55 60
Ile Thr Arg Ser Glu Ile Leu Arg Thr Phe Ala Lys Leu Ala Arg Glu
65 70 75 80
Lys Ala Ala Glu Ile Gly Arg Asn Ile Thr Leu Asp Gln Gly Lys Pro
85 90 95
Leu Lys Glu Ala Ile Ala Glu Val Thr Val Cys Ala Glu His Ala Glu
100 105 110
Trp His Ala Glu Glu Cys Arg Arg Ile Tyr Gly Arg Val Ile Pro Pro
115 120 125
Arg Asn Pro Asn Val Gln Gln Leu Val Val Arg Glu Pro Leu Gly Val
130 135 140
Cys Leu Ala Phe Ser Pro Trp Asn Phe Pro Phe Asn Gln Ala Ile Arg
145 150 155 160
Lys Ile Ser Ala Ala Ile Ala Ala Gly Cys Thr Ile Ile Val Lys Gly
165 170 175
Ser Gly Asp Thr Pro Ser Ala Val Tyr Ala Ile Ala Gln Leu Phe His
180 185 190
Glu Ala Gly Leu Pro Asn Gly Val Leu Asn Val Ile Trp Gly Asp Ser
195 200 205
Asn Phe Ile Ser Asp Tyr Met Ile Lys Ser Pro Ile Ile Gln Lys Ile
210 215 220
Ser Phe Thr Gly Ser Thr Pro Val Gly Lys Lys Leu Ala Ser Gln Ala
225 230 235 240
Ser Leu Tyr Met Lys Pro Cys Thr Met Glu Leu Gly Gly His Ala Pro
245 250 255
Val Ile Val Cys Asp Asp Ala Asp Ile Asp Ala Ala Val Glu His Leu
260 265 270
Val Gly Tyr Lys Phe Arg Asn Ala Gly Gln Val Cys Val Ser Pro Thr
275 280 285
Arg Phe Tyr Val Gln Glu Gly Ile Tyr Lys Glu Phe Ser Glu Lys Val
290 295 300
Val Leu Arg Ala Lys Gln Ile Lys Val Gly Cys Gly Leu Asp Ala Ser
305 310 315 320
Ser Asp Met Gly Pro Leu Ala Gln Ala Arg Arg Met His Ala Met Gln
325 330 335
Gln Ile Val Glu Asp Ala Val His Lys Gly Ser Lys Leu Leu Leu Gly
340 345 350
Gly Asn Lys Ile Ser Asp Lys Gly Asn Phe Phe Glu Pro Thr Val Leu
355 360 365
Gly Asp Leu Cys Asn Asp Thr Gln Phe Met Asn Asp Glu Pro Phe Gly
370 375 380
Pro Ile Ile Gly Leu Ile Pro Phe Asp Thr Ile Asp His Val Leu Glu
385 390 395 400
Glu Ala Asn Arg Leu Pro Phe Gly Leu Ala Ser Tyr Ala Phe Thr Thr
405 410 415
Ser Ser Lys Asn Ala His Gln Ile Ser Tyr Gly Leu Glu Ala Gly Met
420 425 430
Val Ser Ile Asn His Met Gly Leu Ala Leu Ala Glu Thr Pro Phe Gly
435 440 445
Gly Ile Lys Asp Ser Gly Phe Gly Ser Glu Gly Gly Ile Glu Thr Phe
450 455 460
Asp Gly Tyr Leu Arg Thr Lys Phe Ile Thr Gln Leu Asn
465 470 475
<210> 76
<211> 787
<212> PRT
<213> Clostridium butyricum
<400> 76
Met Ile Ser Lys Gly Phe Ser Thr Gln Thr Glu Arg Ile Asn Ile Leu
1 5 10 15
Lys Ala Gln Ile Leu Asn Ala Lys Pro Cys Val Glu Ser Glu Arg Ala
20 25 30
Ile Leu Ile Thr Glu Ser Phe Lys Gln Thr Glu Gly Gln Pro Ala Ile
35 40 45
Leu Arg Arg Ala Leu Ala Leu Lys His Ile Leu Glu Asn Ile Pro Ile
50 55 60
Thr Ile Arg Asp Gln Glu Leu Ile Val Gly Ser Leu Thr Lys Glu Pro
65 70 75 80
Arg Ser Ser Gln Val Phe Pro Glu Phe Ser Asn Lys Trp Leu Gln Asp
85 90 95
Glu Leu Asp Arg Leu Asn Lys Arg Thr Gly Asp Ala Phe Gln Ile Ser
100 105 110
Glu Glu Ser Lys Glu Lys Leu Lys Asp Val Phe Glu Tyr Trp Asn Gly
115 120 125
Lys Thr Thr Ser Glu Leu Ala Thr Ser Tyr Met Thr Glu Glu Thr Arg
130 135 140
Glu Ala Val Asn Cys Asp Val Phe Thr Val Gly Asn Tyr Tyr Tyr Asn
145 150 155 160
Gly Val Gly His Val Ser Val Asp Tyr Gly Lys Val Leu Arg Val Gly
165 170 175
Phe Asn Gly Ile Ile Asn Glu Ala Lys Glu Gln Leu Glu Lys Asn Arg
180 185 190
Ser Ile Asp Pro Asp Phe Ile Lys Lys Glu Lys Phe Leu Asn Ser Val
195 200 205
Ile Ile Ser Cys Glu Ala Ala Ile Thr Tyr Val Asn Arg Tyr Ala Lys
210 215 220
Lys Ala Lys Glu Ile Ala Asp Asn Thr Ser Asp Ala Lys Arg Lys Ala
225 230 235 240
Glu Leu Asn Glu Ile Ala Lys Ile Cys Ser Lys Val Ser Gly Glu Gly
245 250 255
Ala Lys Ser Phe Tyr Glu Ala Cys Gln Leu Phe Trp Phe Ile His Ala
260 265 270
Ile Ile Asn Ile Glu Ser Asn Gly His Ser Ile Ser Pro Ala Arg Phe
275 280 285
Asp Gln Tyr Met Tyr Pro Tyr Tyr Glu Asn Asp Lys Asn Ile Thr Asp
290 295 300
Lys Phe Ala Gln Glu Leu Ile Asp Cys Ile Trp Ile Lys Leu Asn Asp
305 310 315 320
Ile Asn Lys Val Arg Asp Glu Ile Ser Thr Lys His Phe Gly Gly Tyr
325 330 335
Pro Met Tyr Gln Asn Leu Ile Val Gly Gly Gln Asn Ser Glu Gly Lys
340 345 350
Asp Ala Thr Asn Lys Val Ser Tyr Met Ala Leu Glu Ala Ala Val His
355 360 365
Val Lys Leu Pro Gln Pro Ser Leu Ser Val Arg Ile Trp Asn Lys Thr
370 375 380
Pro Asp Glu Phe Leu Leu Arg Ala Ala Glu Leu Thr Arg Glu Gly Leu
385 390 395 400
Gly Leu Pro Ala Tyr Tyr Asn Asp Glu Val Ile Ile Pro Ala Leu Val
405 410 415
Ser Arg Gly Leu Thr Leu Glu Asp Ala Arg Asp Tyr Gly Ile Ile Gly
420 425 430
Cys Val Glu Pro Gln Lys Pro Gly Lys Thr Glu Gly Trp His Asp Ser
435 440 445
Ala Phe Phe Asn Leu Ala Arg Ile Val Glu Leu Thr Ile Asn Ser Gly
450 455 460
Phe Asp Lys Asn Lys Gln Ile Gly Pro Lys Thr Gln Asn Phe Glu Glu
465 470 475 480
Met Lys Ser Phe Asp Glu Phe Met Lys Ala Tyr Lys Ala Gln Met Glu
485 490 495
Tyr Phe Val Lys His Met Cys Cys Ala Asp Asn Cys Ile Asp Ile Ala
500 505 510
His Ala Glu Arg Ala Pro Leu Pro Phe Leu Ser Ser Met Val Asp Asn
515 520 525
Cys Ile Gly Lys Gly Lys Ser Leu Gln Asp Gly Gly Ala Glu Tyr Asn
530 535 540
Phe Ser Gly Pro Gln Gly Val Gly Val Ala Asn Ile Gly Asp Ser Leu
545 550 555 560
Val Ala Val Lys Lys Ile Val Phe Asp Glu Asn Lys Ile Thr Pro Ser
565 570 575
Glu Leu Lys Lys Thr Leu Asn Asn Asp Phe Lys Asn Ser Glu Glu Ile
580 585 590
Gln Ala Leu Leu Lys Asn Ala Pro Lys Phe Gly Asn Asp Ile Asp Glu
595 600 605
Val Asp Asn Leu Ala Arg Glu Gly Ala Leu Val Tyr Cys Arg Glu Val
610 615 620
Asn Lys Tyr Thr Asn Pro Arg Gly Gly Asn Phe Gln Pro Gly Leu Tyr
625 630 635 640
Pro Ser Ser Ile Asn Val Tyr Phe Gly Ser Leu Thr Gly Ala Thr Pro
645 650 655
Asp Gly Arg Lys Ser Gly Gln Pro Leu Ala Asp Gly Val Ser Pro Ser
660 665 670
Arg Gly Cys Asp Val Ser Gly Pro Thr Ala Ala Cys Asn Ser Val Ser
675 680 685
Lys Leu Asp His Phe Ile Ala Ser Asn Gly Thr Leu Phe Asn Gln Lys
690 695 700
Phe His Pro Ser Ala Leu Lys Gly Asp Asn Gly Leu Met Asn Leu Ser
705 710 715 720
Ser Leu Ile Arg Ser Tyr Phe Asp Gln Lys Gly Phe His Val Gln Phe
725 730 735
Asn Val Ile Asp Lys Lys Ile Leu Leu Ala Ala Gln Lys Asn Pro Glu
740 745 750
Lys Tyr Gln Asp Leu Ile Val Arg Val Ala Gly Tyr Ser Ala Gln Phe
755 760 765
Ile Ser Leu Asp Lys Ser Ile Gln Asn Asp Ile Ile Ala Arg Thr Glu
770 775 780
His Val Met
785
<210> 77
<211> 304
<212> PRT
<213> Clostridium butyricum
<400> 77
Met Ser Lys Glu Ile Lys Gly Val Leu Phe Asn Ile Gln Lys Phe Ser
1 5 10 15
Leu His Asp Gly Pro Gly Ile Arg Thr Ile Val Phe Phe Lys Gly Cys
20 25 30
Ser Met Ser Cys Leu Trp Cys Ser Asn Pro Glu Ser Gln Asp Ile Lys
35 40 45
Pro Gln Val Met Phe Asn Lys Asn Leu Cys Thr Lys Cys Gly Arg Cys
50 55 60
Lys Ser Gln Cys Lys Ser Ala Ala Ile Asp Met Asn Ser Glu Tyr Arg
65 70 75 80
Ile Asp Lys Ser Lys Cys Thr Glu Cys Thr Lys Cys Val Asp Asn Cys
85 90 95
Leu Ser Gly Ala Leu Val Ile Glu Gly Arg Asn Tyr Ser Val Glu Asp
100 105 110
Val Ile Lys Glu Leu Lys Lys Asp Ser Val Gln Tyr Arg Arg Ser Asn
115 120 125
Gly Gly Ile Thr Leu Ser Gly Gly Glu Val Leu Leu Gln Pro Asp Phe
130 135 140
Ala Val Glu Leu Leu Lys Glu Cys Lys Ser Tyr Gly Trp His Thr Ala
145 150 155 160
Ile Glu Thr Ala Met Tyr Val Asn Ser Glu Ser Val Lys Lys Val Ile
165 170 175
Pro Tyr Ile Asp Leu Ala Met Ile Asp Ile Lys Ser Met Asn Asp Glu
180 185 190
Ile His Arg Lys Phe Thr Gly Val Ser Asn Glu Ile Ile Leu Gln Asn
195 200 205
Ile Lys Leu Ser Asp Glu Leu Ala Lys Glu Ile Ile Ile Arg Ile Pro
210 215 220
Val Ile Glu Gly Phe Asn Ala Asp Leu Gln Ser Ile Gly Ala Ile Ala
225 230 235 240
Gln Phe Ser Lys Ser Leu Thr Asn Leu Lys Arg Ile Asp Leu Leu Pro
245 250 255
Tyr His Asn Tyr Gly Glu Asn Lys Tyr Gln Ala Ile Gly Arg Glu Tyr
260 265 270
Ser Leu Lys Glu Leu Lys Ser Pro Ser Lys Asp Lys Met Glu Arg Leu
275 280 285
Lys Ala Leu Val Glu Ile Met Gly Ile Pro Cys Thr Ile Gly Ala Glu
290 295 300
<210> 78
<211> 558
<212> PRT
<213> Lactobacillus reuteri
<400> 78
Met Lys Arg Gln Lys Arg Phe Glu Glu Leu Glu Lys Arg Pro Ile His
1 5 10 15
Gln Asp Thr Phe Val Lys Glu Trp Pro Glu Glu Gly Phe Val Ala Met
20 25 30
Met Gly Pro Asn Asp Pro Lys Pro Ser Val Lys Val Glu Asn Gly Lys
35 40 45
Ile Val Glu Met Asp Gly Lys Lys Leu Glu Asp Phe Asp Leu Ile Asp
50 55 60
Leu Tyr Ile Ala Lys Tyr Gly Ile Asn Ile Asp Asn Val Glu Lys Val
65 70 75 80
Met Asn Met Asp Ser Thr Lys Ile Ala Arg Met Leu Val Asp Pro Asn
85 90 95
Val Ser Arg Asp Glu Ile Ile Glu Ile Thr Ser Ala Leu Thr Pro Ala
100 105 110
Lys Ala Glu Glu Ile Ile Ser Lys Leu Asp Phe Gly Glu Met Ile Met
115 120 125
Ala Val Lys Lys Met Arg Pro Arg Arg Lys Pro Asp Asn Gln Cys His
130 135 140
Val Thr Asn Thr Val Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala
145 150 155 160
Asp Ala Ala Leu Arg Gly Phe Pro Glu Gln Glu Thr Thr Thr Ala Val
165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Ile Ser Ile Leu Ile Gly Ala Gln
180 185 190
Thr Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr
195 200 205
Glu Leu Gln Leu Gly Met Arg Gly Phe Thr Ala Tyr Ala Glu Thr Ile
210 215 220
Ser Val Tyr Gly Thr Asp Arg Val Phe Thr Asp Gly Asp Asp Thr Pro
225 230 235 240
Trp Ser Lys Gly Phe Leu Ala Ser Cys Tyr Ala Ser Arg Gly Leu Lys
245 250 255
Met Arg Phe Thr Ser Gly Ala Gly Ser Glu Val Leu Met Gly Tyr Pro
260 265 270
Glu Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Leu Leu Thr
275 280 285
Lys Ala Ser Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile
290 295 300
Glu Ile Pro Gly Ala Val Pro Asn Gly Ile Arg Glu Val Leu Gly Glu
305 310 315 320
Asn Leu Leu Cys Met Met Cys Asp Ile Glu Cys Ala Ser Gly Cys Asp
325 330 335
Gln Ala Tyr Ser His Ser Asp Met Arg Arg Thr Glu Arg Phe Ile Gly
340 345 350
Gln Phe Ile Ala Gly Thr Asp Tyr Ile Asn Ser Gly Tyr Ser Ser Thr
355 360 365
Pro Asn Tyr Asp Asn Thr Phe Ala Gly Ser Asn Thr Asp Ala Met Asp
370 375 380
Tyr Asp Asp Met Tyr Val Met Glu Arg Asp Leu Gly Gln Tyr Tyr Gly
385 390 395 400
Ile His Pro Val Lys Glu Glu Thr Ile Ile Lys Ala Arg Asn Lys Ala
405 410 415
Ala Lys Ala Leu Gln Ala Val Phe Glu Asp Leu Gly Leu Pro Lys Ile
420 425 430
Thr Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala Asn Thr His Asp Asp
435 440 445
Met Pro Lys Arg Asp Met Val Ala Asp Met Lys Ala Ala Gln Asp Met
450 455 460
Met Asp Arg Gly Ile Thr Ala Ile Asp Ile Ile Lys Ala Leu Tyr Asn
465 470 475 480
His Gly Phe Lys Asp Val Ala Glu Ala Ile Leu Asn Leu Gln Lys Gln
485 490 495
Lys Val Val Gly Asp Tyr Leu Gln Thr Ser Ser Ile Phe Asp Lys Asp
500 505 510
Trp Asn Val Thr Ser Ala Val Asn Asp Gly Asn Asp Tyr Gln Gly Pro
515 520 525
Gly Thr Gly Tyr Arg Leu Tyr Glu Asp Lys Glu Glu Trp Asp Arg Ile
530 535 540
Lys Asp Leu Pro Phe Ala Leu Asp Pro Glu His Leu Glu Leu
545 550 555
<210> 79
<211> 236
<212> PRT
<213> Lactobacillus reuteri
<400> 79
Met Ala Asp Ile Asp Glu Asn Leu Leu Arg Lys Ile Val Lys Glu Val
1 5 10 15
Leu Ser Glu Thr Asn Gln Ile Asp Thr Lys Ile Asp Phe Asp Lys Ser
20 25 30
Asn Asp Ser Thr Ala Thr Ala Thr Gln Glu Val Gln Gln Pro Asn Ser
35 40 45
Lys Ala Val Pro Glu Lys Lys Leu Asp Trp Phe Gln Pro Val Gly Glu
50 55 60
Ala Lys Pro Gly Tyr Ser Lys Asp Glu Val Val Ile Ala Val Gly Pro
65 70 75 80
Ala Phe Ala Thr Val Leu Asp Lys Thr Glu Thr Gly Ile Pro His Lys
85 90 95
Glu Val Leu Arg Gln Val Ile Ala Gly Ile Glu Glu Glu Gly Leu Lys
100 105 110
Ala Arg Val Val Lys Val Tyr Arg Ser Ser Asp Val Ala Phe Cys Ala
115 120 125
Val Gln Gly Asp His Leu Ser Gly Ser Gly Ile Ala Ile Gly Ile Gln
130 135 140
Ser Lys Gly Thr Thr Val Ile His Gln Lys Asp Gln Asp Pro Leu Gly
145 150 155 160
Asn Leu Glu Leu Phe Pro Gln Ala Pro Val Leu Thr Pro Glu Thr Tyr
165 170 175
Arg Ala Ile Gly Lys Asn Ala Ala Met Tyr Ala Lys Gly Glu Ser Pro
180 185 190
Glu Pro Val Pro Ala Lys Asn Asp Gln Leu Ala Arg Ile His Tyr Gln
195 200 205
Ala Ile Ser Ala Ile Met His Ile Arg Glu Thr His Gln Val Val Val
210 215 220
Gly Lys Pro Glu Glu Glu Ile Lys Val Thr Phe Asp
225 230 235
<210> 80
<211> 172
<212> PRT
<213> Lactobacillus reuteri
<400> 80
Met Met Ser Glu Val Asp Asp Leu Val Ala Lys Ile Met Ala Gln Met
1 5 10 15
Gly Asn Ser Ser Ser Ala Asn Ser Ser Thr Gly Thr Ser Thr Ala Ser
20 25 30
Thr Ser Lys Glu Met Thr Ala Asp Asp Tyr Pro Leu Tyr Gln Lys His
35 40 45
Arg Asp Leu Val Lys Thr Pro Lys Gly His Asn Leu Asp Asp Ile Asn
50 55 60
Leu Gln Lys Val Val Asn Asn Gln Val Asp Pro Lys Glu Leu Arg Ile
65 70 75 80
Thr Pro Glu Ala Leu Lys Leu Gln Gly Glu Ile Ala Ala Asn Ala Gly
85 90 95
Arg Pro Ala Ile Gln Lys Asn Leu Gln Arg Ala Ala Glu Leu Thr Arg
100 105 110
Val Pro Asp Glu Arg Val Leu Glu Met Tyr Asp Ala Leu Arg Pro Phe
115 120 125
Arg Ser Thr Lys Gln Glu Leu Leu Asn Ile Ala Lys Glu Leu Arg Asp
130 135 140
Lys Tyr Asp Ala Asn Val Cys Ala Ala Trp Phe Glu Glu Ala Ala Asp
145 150 155 160
Tyr Tyr Glu Ser Arg Lys Lys Leu Lys Gly Asp Asn
165 170
<210> 81
<211> 616
<212> PRT
<213> Lactobacillus reuteri
<400> 81
Met Ala Thr Glu Lys Val Ile Gly Val Asp Ile Gly Asn Ser Ser Thr
1 5 10 15
Glu Val Ala Leu Ala Asp Val Ser Asp Ser Gly Gln Val His Phe Ile
20 25 30
Asn Ser Gly Ile Ala Pro Thr Thr Gly Ile Lys Gly Thr Lys Gln Asn
35 40 45
Leu Val Gly Ile Arg Asp Ser Ile Thr Gln Val Leu Asn Lys Ser Asn
50 55 60
Leu Thr Ile Asp Asp Ile Asp Leu Ile Arg Ile Asn Glu Ala Thr Pro
65 70 75 80
Val Ile Gly Asp Val Ala Met Glu Thr Ile Thr Glu Thr Val Val Thr
85 90 95
Glu Ser Thr Met Ile Gly His Asn Pro Asn Thr Pro Gly Gly Ile Gly
100 105 110
Thr Gly Ala Gly Ile Thr Val Arg Leu Leu Asp Leu Leu Lys Lys Thr
115 120 125
Asp Lys Ser Lys Asn Tyr Ile Val Val Val Pro Lys Asp Ile Asp Phe
130 135 140
Glu Asp Val Ala Lys Leu Ile Asn Ala Tyr Val Ala Ser Gly Tyr Lys
145 150 155 160
Ile Thr Ala Ala Ile Leu Arg Asn Asp Asp Gly Val Leu Val Asp Asn
165 170 175
Arg Leu Asn His Lys Ile Pro Ile Val Asp Glu Val Ala Met Ile Asp
180 185 190
Lys Val Pro Leu Asn Met Leu Ala Ala Val Glu Val Ala Gly Pro Gly
195 200 205
Gln Val Ile Ser Gln Leu Ser Asn Pro Tyr Gly Ile Ala Thr Leu Phe
210 215 220
Gly Leu Thr Pro Glu Glu Thr Lys Asn Ile Val Pro Val Ser Arg Ala
225 230 235 240
Leu Ile Gly Asn Arg Ser Ala Val Val Ile Lys Thr Pro Ala Gly Asp
245 250 255
Val Lys Ala Arg Val Ile Pro Ala Gly Lys Ile Ile Ile Asn Gly Asp
260 265 270
Thr Gly Lys Glu Glu Val Gly Val Ser Glu Gly Ala Asp Ala Ile Met
275 280 285
Lys Lys Val Ser Ser Phe Arg His Ile Asn Asn Ile Thr Gly Glu Ser
290 295 300
Gly Thr Asn Val Gly Gly Met Leu Glu Asn Val Arg Gln Thr Met Ala
305 310 315 320
Asp Leu Thr Gly Lys Lys Asn Asp Glu Ile Ala Ile Gln Asp Leu Leu
325 330 335
Ala Val Asp Thr Gln Val Pro Val Glu Val Arg Gly Gly Leu Ala Gly
340 345 350
Glu Phe Ser Asn Glu Ser Ala Val Gly Ile Ala Ala Met Val Lys Ser
355 360 365
Asp His Leu Gln Met Glu Val Ile Ala Lys Leu Ile Glu Lys Glu Phe
370 375 380
Asn Thr Lys Val Glu Ile Gly Gly Ala Glu Val Glu Ser Ala Ile Arg
385 390 395 400
Gly Ala Leu Thr Thr Pro Gly Thr Asp Lys Pro Ile Ala Ile Leu Asp
405 410 415
Leu Gly Ala Gly Ser Thr Asp Ala Ser Ile Ile Asn Lys Glu Asn Asn
420 425 430
Thr Val Ala Ile His Leu Ala Gly Ala Gly Asp Met Val Thr Met Ile
435 440 445
Ile Asn Ser Glu Leu Gly Leu Asn Asp Ile His Leu Ala Glu Asp Ile
450 455 460
Lys Arg Tyr Pro Leu Ala Lys Val Glu Asn Leu Phe Gln Ile Arg His
465 470 475 480
Glu Asp Gly Ser Val Gln Phe Phe Lys Asp Pro Leu Pro Ser Ser Leu
485 490 495
Phe Ala Lys Val Val Val Ile Lys Pro Asp Gly Tyr Glu Pro Val Thr
500 505 510
Gly Asn Pro Ser Ile Glu Lys Ile Lys Leu Val Arg Gln Ser Ala Lys
515 520 525
Lys Arg Val Phe Val Thr Asn Ala Leu Arg Ala Leu Lys Tyr Val Ser
530 535 540
Pro Thr Gly Asn Ile Arg Asp Ile Pro Phe Val Val Ile Val Gly Gly
545 550 555 560
Ser Ala Leu Asp Phe Glu Ile Pro Gln Leu Val Thr Asp Glu Leu Ala
565 570 575
His Phe Asn Leu Val Ala Gly Arg Gly Asn Val Arg Gly Val Glu Gly
580 585 590
Pro Arg Asn Ala Val Ala Thr Gly Leu Ile Leu Arg Tyr Gly Glu Glu
595 600 605
Arg Arg Lys Arg Tyr Glu Gln Arg
610 615
<210> 82
<211> 119
<212> PRT
<213> Lactobacillus reuteri
<400> 82
Met Asn Asn Asp Asp Ser Gln Arg Pro Ser Ile Val Val Gly Leu Glu
1 5 10 15
Asn Gly Ile Thr Ile Pro Asp Ser Val Lys Pro Leu Phe Tyr Gly Ile
20 25 30
Glu Glu Glu Gln Ile Pro Val Ser Val Arg Lys Ile Asn Ile Asn Asp
35 40 45
Thr Val Glu Arg Ala Tyr Gln Ser Ala Leu Ala Ser Arg Leu Ser Val
50 55 60
Gly Ile Ala Phe Glu Gly Asp His Phe Ile Val His Tyr Lys Asn Leu
65 70 75 80
Lys Glu Asn Gln Pro Leu Phe Asp Met Thr Ile Asn Asp Lys Lys Gln
85 90 95
Leu Arg Ile Leu Gly Ala Asn Ala Ala Arg Leu Val Lys Gly Ile Pro
100 105 110
Phe Lys Glu Met Ala Asn Arg
115
<210> 83
<211> 547
<212> PRT
<213> Lactococcus lactis
<400> 83
Met Tyr Thr Val Gly Asp Tyr Leu Leu Asp Arg Leu His Glu Leu Gly
1 5 10 15
Ile Glu Glu Ile Phe Gly Val Pro Gly Asp Tyr Asn Leu Gln Phe Leu
20 25 30
Asp Gln Ile Ile Ser Arg Glu Asp Met Lys Trp Ile Gly Asn Ala Asn
35 40 45
Glu Leu Asn Ala Ser Tyr Met Ala Asp Gly Tyr Ala Arg Thr Lys Lys
50 55 60
Ala Ala Ala Phe Leu Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Ile
65 70 75 80
Asn Gly Leu Ala Gly Ser Tyr Ala Glu Asn Leu Pro Val Val Glu Ile
85 90 95
Val Gly Ser Pro Thr Ser Lys Val Gln Asn Asp Gly Lys Phe Val His
100 105 110
His Thr Leu Ala Asp Gly Asp Phe Lys His Phe Met Lys Met His Glu
115 120 125
Pro Val Thr Ala Ala Arg Thr Leu Leu Thr Ala Glu Asn Ala Thr Tyr
130 135 140
Glu Ile Asp Arg Val Leu Ser Gln Leu Leu Lys Glu Arg Lys Pro Val
145 150 155 160
Tyr Ile Asn Leu Pro Val Asp Val Ala Ala Ala Lys Ala Glu Lys Pro
165 170 175
Ala Leu Ser Leu Glu Lys Glu Ser Ser Thr Thr Asn Thr Thr Glu Gln
180 185 190
Val Ile Leu Ser Lys Ile Glu Glu Ser Leu Lys Asn Ala Gln Lys Pro
195 200 205
Val Val Ile Ala Gly His Glu Val Ile Ser Phe Gly Leu Glu Lys Thr
210 215 220
Val Thr Gln Phe Val Ser Glu Thr Lys Leu Pro Ile Thr Thr Leu Asn
225 230 235 240
Phe Gly Lys Ser Ala Val Asp Glu Ser Leu Pro Ser Phe Leu Gly Ile
245 250 255
Tyr Asn Gly Lys Leu Ser Glu Ile Ser Leu Lys Asn Phe Val Glu Ser
260 265 270
Ala Asp Phe Ile Leu Met Leu Gly Val Lys Leu Thr Asp Ser Ser Thr
275 280 285
Gly Ala Phe Thr His His Leu Asp Glu Asn Lys Met Ile Ser Leu Asn
290 295 300
Ile Asp Glu Gly Ile Ile Phe Asn Lys Val Val Glu Asp Phe Asp Phe
305 310 315 320
Arg Ala Val Val Ser Ser Leu Ser Glu Leu Lys Gly Ile Glu Tyr Glu
325 330 335
Gly Gln Tyr Ile Asp Lys Gln Tyr Glu Glu Phe Ile Pro Ser Ser Ala
340 345 350
Pro Leu Ser Gln Asp Arg Leu Trp Gln Ala Val Glu Ser Leu Thr Gln
355 360 365
Ser Asn Glu Thr Ile Val Ala Glu Gln Gly Thr Ser Phe Phe Gly Ala
370 375 380
Ser Thr Ile Phe Leu Lys Ser Asn Ser Arg Phe Ile Gly Gln Pro Leu
385 390 395 400
Trp Gly Ser Ile Gly Tyr Thr Phe Pro Ala Ala Leu Gly Ser Gln Ile
405 410 415
Ala Asp Lys Glu Ser Arg His Leu Leu Phe Ile Gly Asp Gly Ser Leu
420 425 430
Gln Leu Thr Val Gln Glu Leu Gly Leu Ser Ile Arg Glu Lys Leu Asn
435 440 445
Pro Ile Cys Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg Glu
450 455 460
Ile His Gly Pro Thr Gln Ser Tyr Asn Asp Ile Pro Met Trp Asn Tyr
465 470 475 480
Ser Lys Leu Pro Glu Thr Phe Gly Ala Thr Glu Asp Arg Val Val Ser
485 490 495
Lys Ile Val Arg Thr Glu Asn Glu Phe Val Ser Val Met Lys Glu Ala
500 505 510
Gln Ala Asp Val Asn Arg Met Tyr Trp Ile Glu Leu Val Leu Glu Lys
515 520 525
Glu Asp Ala Pro Lys Leu Leu Lys Lys Met Gly Lys Leu Phe Ala Glu
530 535 540
Gln Asn Lys
545
<210> 84
<211> 331
<212> PRT
<213> Puniceibacterium sp.
<400> 84
Met Ser Ala Lys Arg Thr Leu Leu Thr Val Asp Asp Val Thr Gly Cys
1 5 10 15
Trp Ala Ile Met Pro Thr Pro Ala Lys Asp Asp Ala Ser Asp Trp Arg
20 25 30
Thr Glu Phe Ser Val Asp Leu Asp Glu Thr Ala Arg Val Ala Asn Ala
35 40 45
Leu Val Glu Ser Gly Val Asp Gly Ile Leu Ala Leu Gly Thr Phe Gly
50 55 60
Glu Gly Ala Thr Leu Thr Trp Glu Glu Lys Glu Ala Tyr Val Arg Thr
65 70 75 80
Val Val Asp Ala Val Ala Gly Arg Val Pro Phe Phe Ala Gly Thr Thr
85 90 95
Ser Leu Asn Thr Arg Glu Thr Ile Arg Gln Met Arg Ile Val Arg Asp
100 105 110
Ile Gly Val Asp Gly Val Met Leu Gly Ile Pro Met Trp Val Glu Ala
115 120 125
Asp Thr Ala Thr Ala Val Gln Phe Tyr Arg Asp Val Thr Glu Ala Cys
130 135 140
Pro Asp Val Ala Ile Cys Ala Tyr Ala Asn Pro Glu Ala Phe Lys Tyr
145 150 155 160
Glu Phe Gly Arg Ala Phe Trp Ala Gln Val Ser Asp Leu Pro Gln Ile
165 170 175
Val Ser Ala Lys Tyr Leu Asn Met Gly Gly Leu Tyr Pro Asp Leu Asn
180 185 190
Leu Ser Lys Arg Arg Ile Arg Leu Met Pro Leu Asp Val Asp Tyr Tyr
195 200 205
Ala Ala Ala Arg Ile Asp Pro Asp His Cys Thr Ala Phe Trp Thr Ser
210 215 220
Gly Ala Val Cys Gly Pro Glu Pro Ala Ile Leu Leu Arg Asp Leu Met
225 230 235 240
Glu Lys Ala Arg Lys Ser Gly Asp Trp Ala Glu Ala Lys Ala Leu Thr
245 250 255
Asp Arg Ile Gly Met Thr Tyr Lys Thr Leu Phe Pro Asn Gly Ser Phe
260 265 270
Lys Glu Phe Ser Arg Tyr Asn Ile Ser Ile Glu Lys Ile Arg Met Asp
275 280 285
Ala Ala Gly Trp Met Lys Ala Gly Pro Cys Arg Pro Pro Tyr His Val
290 295 300
Thr Pro Glu Pro Ile Leu Glu Gly Gly Arg Ile Ala Gly Gln Lys Trp
305 310 315 320
Ala Glu Leu Ala Glu Ser Leu Arg Ala Gly Asn
325 330
<210> 85
<211> 327
<212> PRT
<213> Streptomyces sp.
<400> 85
Met Ile Thr Ala Ala Glu Ile Asn Gly Met Tyr Gly Ile Ile Pro Thr
1 5 10 15
Pro Ala Leu Pro Gly Ala Glu Arg Leu Asp Ala Arg Asp Thr Val Asp
20 25 30
Val Asp Glu Thr Ala Arg Val Val Asp Arg Leu Ile Arg Asp Gly Val
35 40 45
Ser Gly Ile Ile Ala Leu Gly Thr Thr Gly Glu Cys Pro Ala Leu Ser
50 55 60
Glu Asp Asp Phe Asp Val Val Thr Asp Thr Val Val Glu Ala Val Ala
65 70 75 80
Gly Arg Val Pro Val Phe Val Gly Ala Thr Gly Ala Gly Gly His Gly
85 90 95
Thr Ala Arg Arg Leu Arg Lys Val Ala Ala Ser Gly Ala Thr Gly Ala
100 105 110
Leu Leu Gly Leu Pro Met Trp Gln Pro Leu Thr Thr Ala Met Ala Val
115 120 125
Glu Tyr Tyr Ala Gln Ala Ser Ala Ala Phe Pro Asp Leu Ala Leu Met
130 135 140
Val Tyr Ala Asn Ala Arg Ala Phe Arg Tyr Thr Phe Pro Val Glu Phe
145 150 155 160
Trp Gln Gly Val Ser Ser Gln Ala Pro Thr Val Thr Ser Ala Lys Val
165 170 175
Ser Arg Ala Pro Gln Leu Glu Arg Met Leu Glu Val Thr Gly Lys Lys
180 185 190
Val Asn Phe Ile Pro Ser Asp Met Val Val His Asp Phe Ala Ala Arg
195 200 205
Ala Pro Gln Thr Thr Thr Ala Cys Trp Ala Thr Ala Ala Gly Met Gly
210 215 220
Pro Glu Pro Ser Ile Ala Leu Met Asp Ala Leu Arg Arg Gly Asp Ser
225 230 235 240
Glu Ala Ala Gly Arg Ala Val Ala Gly Ile Ala Trp Ala Asn Glu Pro
245 250 255
Leu Ala His Leu Phe Ala Asp Gln Glu Ile Phe Ala Ser Tyr Asn Thr
260 265 270
Gln Ile Glu Lys Ser Arg Ile Ala Ala Ala Gly Tyr Cys Arg Pro Gly
275 280 285
Pro Val Arg Ser Pro Tyr His His Leu Pro Glu Glu Tyr Ala Ala Ala
290 295 300
Ser Ala Val Cys Gly Gln Arg Trp Arg Glu Leu Arg Glu Arg Ile Ala
305 310 315 320
Ala Gly Thr Asn Asp Gln Lys
325
<210> 86
<211> 261
<212> PRT
<213> Clostridium magnum
<400> 86
Met Ile Lys Gly Tyr Ser Leu Pro Leu Thr Pro Lys Gly Thr Ser Asn
1 5 10 15
Ile Val Pro Ala Pro Pro Trp His Tyr Val Gly Asn Val Leu Ala Ile
20 25 30
Glu Tyr Glu Ala Tyr Ala Glu Asn Ile Ala Ala Phe Leu Pro Glu Gly
35 40 45
Leu Glu Phe Ser Ser Asn Gln Cys Ala Ile Tyr Phe Ile Glu Trp Gln
50 55 60
Tyr Cys Ser Glu Phe Gly Glu Glu His Leu Asp Pro Val Asn Ser Gln
65 70 75 80
Tyr Lys Glu Thr Ile Val Leu Val Ser Ala Asn Tyr Lys Gly Thr Pro
85 90 95
Val Ser Tyr Cys Pro Phe Ile Trp Val Asp Gln Asp Leu Ser Leu Met
100 105 110
Arg Gly Leu Ile Gln Gly Trp Pro Lys Gln Leu Gly Glu Thr Tyr Ile
115 120 125
Thr Arg Pro Tyr Asn Leu Pro Ser Lys Ala Ala Ser Asn Leu Glu Lys
130 135 140
Gly Gly Lys Leu Gly Ala Thr Leu Ser Val Lys Gly Arg Arg Leu Val
145 150 155 160
Asp Ala Arg Ile Thr Val Asn Lys Lys Thr Glu Thr Leu Pro Asn Pro
165 170 175
Thr Phe Ala Gln Ala Ile Asn Leu Arg His Phe Pro Glu Leu Val Leu
180 185 190
Gly Arg His Asn Gln Pro Leu Ile His Glu Leu Val Gln Leu Lys Ser
195 200 205
Arg Asp Leu His Ile Ser Pro Ile Trp Lys Gly Asp Ala Ile Leu Asn
210 215 220
Phe Phe Asp His Pro Phe Ile Glu Leu Ser Asp Leu Lys Pro Thr Lys
225 230 235 240
Val Lys Asn Ser Tyr Tyr Phe Ser Ala Ala Leu Thr Val Asp Asp Leu
245 250 255
Ser Gln Leu Glu Val
260
<210> 87
<211> 323
<212> PRT
<213> Allokutzneria albata
<400> 87
Met Arg Ala Val Val Val Arg Ser His Gly Gly Pro Glu Val Leu Val
1 5 10 15
Ala Glu Glu Leu Asp Arg Pro Glu Pro Gly Pro Gly Ala Val Leu Val
20 25 30
Asp Val Ala Ala Ala Gly Val Asn Tyr Ile Asp Thr Tyr His Arg Glu
35 40 45
Gly Val Tyr Pro Ile Pro Thr Pro Phe Thr Leu Gly Leu Glu Gly Ala
50 55 60
Gly Thr Val Ala Ala Leu Gly Glu Gly Val Thr Glu Phe Ala Val Gly
65 70 75 80
Asp Arg Val Ala Trp Ala Ser Ala Ile Gly Ser Tyr Ala Gln Gln Val
85 90 95
Ala Ala Pro Ala Ala Gln Leu Val Pro Val Pro Ser Thr Val Asp Leu
100 105 110
Glu Ile Ala Ala Gly Ala Met Leu Gln Gly Met Thr Ala His Tyr Leu
115 120 125
Thr Ala Ser Thr His Pro Ile Ala Glu Gly Asp Val Ala Leu Val His
130 135 140
Ala Ala Ala Gly Gly Met Gly Leu Leu Leu Thr Gln Met Ile Lys Ala
145 150 155 160
Arg Gly Gly Arg Val Ile Gly Thr Val Ser Thr Ala Glu Lys Glu Lys
165 170 175
Leu Ala Arg Glu Ala Gly Ala Asp Glu Val Ile Arg Tyr Thr Glu Gln
180 185 190
Asp Val Ala Gln Arg Val Arg Glu Leu Thr Asp Gly Val Gly Val His
195 200 205
Val Val Tyr Asp Gly Val Gly Lys Asp Thr Phe Asp Ala Ser Leu Ala
210 215 220
Ser Leu Arg Pro Arg Gly Leu Leu Ala Leu Tyr Gly Ala Ala Ser Gly
225 230 235 240
Ala Val Pro Pro Phe Asp Ala Gln Arg Leu Asn Ala Gly Gly Ser Leu
245 250 255
Phe Leu Thr Arg Pro Ser Leu Gly His His Thr Ala Thr Arg Glu Glu
260 265 270
Leu Leu Trp Arg Ala Gly Glu Val Phe Asp Ala Ile Gln Ala Gly Glu
275 280 285
Leu Asp Ile Ala Ile Gly Gly Arg Tyr Ala Leu Asp Ser Ala Arg Gln
290 295 300
Ala His Glu Asp Leu Gln Gly Arg Arg Thr Thr Gly Lys Leu Leu Leu
305 310 315 320
Thr Thr Ser
<210> 88
<211> 326
<212> PRT
<213> Acidaminococcus intestini
<400> 88
Met Lys Ala Ile Val Met Lys Glu Phe Gly Gly Pro Glu Val Leu Lys
1 5 10 15
Tyr Val Asp Val Pro Asp Pro Val Pro Glu Ala Asn Glu Val Leu Ile
20 25 30
Lys Leu Ala Phe Cys Gly Val Asn Pro Asn Glu Thr Tyr Val Arg Thr
35 40 45
Gly Thr Tyr Asn Phe Tyr Lys Pro Glu Leu Pro Tyr Thr Pro Gly Tyr
50 55 60
Asp Gly Ala Gly Val Ile Glu Lys Val Gly Ala Gly Val Thr His Val
65 70 75 80
Lys Val Gly Asp Arg Val Phe Val Ala Ala Leu Leu Ala Lys Arg Asn
85 90 95
Thr Gly Thr Tyr Ala Gln Lys Val Val Cys Asp Ala Asp Ser Val His
100 105 110
Lys Leu Pro Asp Phe Ile Ser Phe Glu Glu Gly Ala Ser Phe Gly Ile
115 120 125
Pro Ala Met Ala Ala Tyr Arg Ala Leu Phe His Arg Ala His Ile Lys
130 135 140
Ala Gly Glu Ile Val Met Ile His Gly Ala Glu Gly Gly Val Gly Ser
145 150 155 160
Leu Ala Val Gln Met Ala Lys Ala Val Gly Ala Ile Val Ile Gly Thr
165 170 175
Gly Thr Thr Pro Glu Gly Leu Asp Ile Val Arg Ser Phe Gly Ala Asp
180 185 190
Tyr Ala Ile Tyr His Leu Lys Ala Asp Asn Gln Asp Glu Leu Met Glu
195 200 205
Leu Thr Lys Gly Lys Gly Pro Asp Val Ile Ile Glu Phe Leu Ala Asn
210 215 220
Val Asn Leu Gln Thr Asp Leu Lys Val Ile Ala Lys Tyr Gly Arg Ile
225 230 235 240
Val Val Val Gly Asn Arg Gly Thr Ile Glu Ile Asn Pro Arg Leu Ala
245 250 255
Met Ala Asn Glu Ser Thr Ile Leu Gly Met Ala Leu Trp Asn Ala Pro
260 265 270
Ala Asn Glu Tyr Arg Glu Ser Leu Phe Ala Leu Arg Ala Phe Met Gln
275 280 285
Ser Gly Ala Val Arg Ala Lys Val Gly Lys Gln Leu Leu Leu Lys Asp
290 295 300
Ala Ala Gln Ala His Asn Glu Ile Ile Asn Gly Leu Ala Lys Gly Lys
305 310 315 320
Met Ile Leu Lys Ile Glu
325
<210> 89
<211> 325
<212> PRT
<213> Mycobacteroides chelonae
<400> 89
Met Arg Ala Ile Glu Val Pro Val Thr Gly Gly Pro Glu Val Leu Thr
1 5 10 15
Leu Val Glu Lys Thr Ala Pro Thr Pro Gly Pro Gly Glu Val Leu Ile
20 25 30
Asp Val Asp Ala Val Gly Val Asn Phe Arg Asp Ile Tyr Leu Arg Asn
35 40 45
Gly Ser Tyr Ala Ala Pro Leu Pro His Ile Pro Gly Ser Glu Val Thr
50 55 60
Gly Val Val Ser Ala Val Gly Glu Gly Val Glu Asn Leu Ala Pro Gly
65 70 75 80
Asp Arg Val Ala Ser Pro Val Ala Ala Trp Gly Tyr Ala Glu Ser Thr
85 90 95
Thr Ala Pro Ala Asp Tyr Thr Ala Lys Val Pro Ala Gly Leu Ser Ser
100 105 110
Glu Val Ala Ala Ser Ala Leu Leu Gln Gly Ile Thr Ala His Tyr Leu
115 120 125
Leu Thr Ser Val Tyr Pro Val Ala Ala Gly Asp Thr Val Leu Val His
130 135 140
Ala Gly Ala Gly Gly Met Gly Leu Leu Leu Thr Gln Trp Ala Ser His
145 150 155 160
Arg Gly Val Arg Val Ile Thr Thr Val Ser Ser Ala Ala Lys Glu Lys
165 170 175
Leu Ser Arg Glu Ala Gly Ala Ala Glu Val Leu Pro Tyr Pro Asp Pro
180 185 190
Thr Asp Pro Ala Glu Phe Ala Glu Lys Ile Leu Glu Leu Thr Ser Gly
195 200 205
Glu Gly Val Ala Val Ala Tyr Asp Gly Val Gly Lys Ser Thr Phe Glu
210 215 220
Ala Ser Leu Ala Ala Val Arg Val Arg Gly Leu Ile Ala Leu Tyr Gly
225 230 235 240
Ala Ala Ser Gly Gln Val Pro Pro Phe Asp Pro Gln Arg Leu Thr Ala
245 250 255
Lys Ser Ala Val Leu Thr Arg Pro Thr Met Gly His Phe Ile Arg Thr
260 265 270
Pro Ala Glu Phe Ala Trp Arg Ala Asp Asp Val Leu Asp Leu Val Ser
275 280 285
Arg Gly Thr Leu Lys Ile Thr Val Gly Ala Ser Tyr Pro Leu Glu Gln
290 295 300
Ala Ala Gln Ala His Ile Asp Leu Glu Ala Arg Lys Thr Thr Gly Ser
305 310 315 320
Val Val Leu Val Pro
325
<210> 90
<211> 321
<212> PRT
<213> Nocardia brasiliensis
<400> 90
Met Arg Ala Ile Gln Val Ser Glu His Gly Gly Pro Glu Val Leu His
1 5 10 15
His Val Glu Leu Pro Asp Pro Thr Ile Asp Ala Asp Gln Leu Leu Val
20 25 30
Asp Val Gln Ala Thr Gly Ile Asn Phe Ile Asp Thr Tyr Ile Arg Thr
35 40 45
Gly Arg Tyr Pro Gln Asp Val Pro Tyr Val Pro Gly Ser Glu Ala Thr
50 55 60
Gly Val Val Ala Glu Val Gly Ala Asn Val Thr Glu Phe Ala Val Gly
65 70 75 80
Asp Arg Val Ala Trp Ala Ser Ala Pro Gly Ser Tyr Ala Glu Arg Val
85 90 95
Ala Val Arg Ala Asp Val Ala Val Glu Val Pro Asp Gly Val Glu Pro
100 105 110
Pro Val Ala Ala Ser Ala Leu Leu Gln Gly Met Thr Ala His Tyr Leu
115 120 125
Leu Glu Ser Ile Tyr Thr Pro Glu Pro Gly Glu Thr Val Leu Val His
130 135 140
Ala Gly Ala Gly Gly Val Gly Leu Ile Leu Thr Gln Leu Ala Val Ala
145 150 155 160
Arg Gly Ala Arg Val Ile Thr Thr Val Ser Ser Asp Val Lys Glu Lys
165 170 175
Leu Ser Arg Glu Ala Gly Ala Thr Glu Val Leu Arg Tyr Gly Asp Asp
180 185 190
Leu Ala Asp Glu Val Arg Thr Leu Thr Asp Gly Val Gly Val Ala Ala
195 200 205
Val Tyr Asp Gly Val Gly Ala Ser Thr Phe Glu Ala Ser Leu Arg Ser
210 215 220
Leu Arg Val Arg Gly Met Leu Ala Leu Phe Gly Ala Ala Ser Gly Pro
225 230 235 240
Val Pro Pro Phe Asp Leu Gln Arg Leu Asn Gly Ala Gly Ser Leu Phe
245 250 255
Val Thr Arg Pro Ser Leu Ala Phe Tyr Thr Arg Asp Arg Ala Glu Leu
260 265 270
Leu Trp Arg Ala Thr Asp Ile Phe Thr Ala Ile Ala Glu Gly Thr Leu
275 280 285
Gln Ile Arg Ile Gly Ala Thr Tyr Pro Leu Ala Glu Ala Glu Gln Ala
290 295 300
His Arg Asp Leu Glu Ser Arg Lys Thr Thr Gly Ser Ile Val Leu Leu
305 310 315 320
Pro
<210> 91
<211> 325
<212> PRT
<213> Pseudomonas oleovorans
<400> 91
Met Ala Lys Arg Ile Gln Phe Ser Gln His Gly Gly Ser Glu Val Leu
1 5 10 15
Glu Tyr Arg Asp Tyr Gln Pro Ala Ala Pro Gly Pro Arg Glu Val Arg
20 25 30
Val Ala Asn Lys Ala Ile Gly Leu Asn Phe Ile Asp Thr Tyr Phe Arg
35 40 45
Ser Gly Leu Tyr Gln Pro Pro Ala Leu Pro Ser Ser Leu Gly Thr Glu
50 55 60
Gly Ala Gly Val Val Glu Ala Ile Gly Ser Glu Val Glu Gly Leu Lys
65 70 75 80
Val Gly Asp Arg Val Ala Tyr Ala Thr Gly Pro Leu Gly Ala Tyr Ser
85 90 95
Glu Leu His Val Leu Pro Ala Asp Asn Leu Val His Leu Pro Asp Ser
100 105 110
Ile Ser Phe Glu Gln Ala Ala Ala Val Met Leu Lys Gly Leu Thr Val
115 120 125
Gln Tyr Leu Leu Arg Gln Thr Tyr Glu Leu Lys Gly Gly Glu Thr Ile
130 135 140
Leu Phe His Ala Ala Ala Gly Gly Val Gly Ser Phe Ala Cys Gln Trp
145 150 155 160
Ala Lys Ala Leu Gly Val Asn Leu Ile Gly Thr Val Ser Ser Ala Lys
165 170 175
Lys Ala Ala Leu Ala Lys Glu Leu Gly Ala Trp Glu Thr Ile Asp Tyr
180 185 190
Ser His Glu Asn Val Val Gln Arg Val Leu Glu Leu Thr Asp Gly Ala
195 200 205
Lys Cys Pro Val Val Tyr Asp Gly Val Gly Lys Asp Thr Trp Glu Thr
210 215 220
Ser Leu Asp Cys Val Ala Pro Arg Gly Leu Leu Val Ser Phe Gly Asn
225 230 235 240
Ala Ser Gly Ala Val Thr Gly Val Asn Leu Gly Ile Leu Ala Gln Lys
245 250 255
Gly Ser Leu Tyr Val Thr Arg Pro Thr Leu Ala Ser Tyr Ala Asn Thr
260 265 270
Pro Gln Asn Leu Gln Ala Met Ala Asp Glu Leu Phe Ala Met Ile Ser
275 280 285
Ser Gly Lys Leu Gln Val Asp Ile Ser Asn Arg Tyr Ala Leu Lys Asp
290 295 300
Ala Ala Ala Ala Gln Asp Ala Leu Ser Ser Arg Gln Thr Thr Gly Ser
305 310 315 320
Thr Ile Leu Leu Pro
325
<210> 92
<211> 321
<212> PRT
<213> Caulobacter vibrioides
<400> 92
Met Leu Ala Val Gln Ala Val Arg Thr Gly Gly Pro Glu Val Leu Glu
1 5 10 15
Val Val Asp Leu Pro Leu Pro Ser Pro Gly Pro Gly Gln Ile Leu Val
20 25 30
Arg His Gln Ala Val Gly Leu Asn Tyr Ile Asp Thr Tyr His Arg Ser
35 40 45
Gly Leu Tyr Pro Val Lys Thr Pro Leu Val Ile Gly Leu Glu Ala Ala
50 55 60
Gly Val Val Glu Ser Val Gly Glu Ala Val Thr Arg Phe Lys Val Gly
65 70 75 80
Asp Arg Val Ala Tyr Asn Gly Thr Met Gly Ala Tyr Ala Gln Ala Ala
85 90 95
Val Val Pro Ala Glu Arg Ala Val Leu Val Pro Asp Gly Val Ser Leu
100 105 110
Glu Val Ala Ala Ala Ala Leu Leu Lys Gly Met Thr Ala Glu Phe Leu
115 120 125
Val Arg Arg Cys Phe His Val Lys Gln Gly Asp Trp Val Leu Val His
130 135 140
Ala Ala Ala Gly Gly Val Gly Gln Ile Leu Val Gln Trp Cys Lys Ala
145 150 155 160
Leu Gly Ala Thr Val Val Ala Thr Val Gly Ser Thr Ala Lys Ala Thr
165 170 175
Ile Ala Arg Asp Leu Gly Ala Asp His Val Ile Asp Tyr Ser His Glu
180 185 190
Asp Val Ala Ala Arg Val Ala Glu Leu Thr Gly Gly Arg Gly Val Ala
195 200 205
Val Val Tyr Asp Gly Val Gly Lys Asp Thr Trp Glu Ala Ser Leu Ala
210 215 220
Ser Leu Ala Arg Arg Gly Met Leu Val Thr Phe Gly Asn Ala Ser Gly
225 230 235 240
Pro Ala Pro Ala Phe Pro Pro Leu Ala Leu Ala Pro Lys Ser Ala Phe
245 250 255
Val Thr Arg Pro Lys Leu Phe Asp Tyr Ile Val Thr Thr Glu Glu Leu
260 265 270
Asp Glu Ser Ala Gln Ala Leu Phe Ala Val Ile Ala Ser Gly Ala Ile
275 280 285
Lys Ile Asp Ile Gly Gln Thr Phe Pro Leu Ala Glu Ala Arg Ala Ala
290 295 300
His Glu Ala Leu Glu Gly Arg Arg Thr Thr Gly Ala Thr Leu Leu Leu
305 310 315 320
Pro
<210> 93
<211> 322
<212> PRT
<213> Saccharopolyspora flava
<400> 93
Met Arg Ala Ile Arg Val Thr Ser His Gly Gly Pro Glu Ala Leu Glu
1 5 10 15
Val Ser Glu Val Glu Val Pro Glu Pro Gly Pro Gly Gln Leu Leu Val
20 25 30
Asp Val Ala Ala Ser Gly Val Asn Phe Ile Asp Thr Tyr Gln Arg Ser
35 40 45
Gly Val Tyr Ser Val Pro Leu Pro Phe Thr Pro Gly Ser Glu Gly Ala
50 55 60
Gly Glu Ile Val Ala Val Gly Pro Asp Val Asp Gly Phe Ala Val Gly
65 70 75 80
Glu Arg Val Ala Trp Ala Met Thr Pro Gly Ser Tyr Ala Glu Lys Ala
85 90 95
Leu Val Pro Ala Arg Ala Ala Val Lys Ile Pro Asp Gly Val Asp Thr
100 105 110
Arg Thr Ala Ala Ala Ala Thr Leu Gln Gly Met Thr Ala His Phe Leu
115 120 125
Val Thr Ser Thr His Glu Ile Lys Thr Gly Glu Thr Ala Leu Val His
130 135 140
Ala Ala Ala Gly Gly Met Gly Leu Leu Leu Thr Gln Leu Ile Lys Ser
145 150 155 160
Lys Gly Gly Asn Val Ile Gly Thr Val Ser Thr Asp Glu Lys Glu Arg
165 170 175
Leu Ala Arg Glu Ala Gly Ala Asp Glu Ile Ile Arg Tyr Thr Glu Ala
180 185 190
Asp Val Ala Ala Glu Val Lys Asp Leu Thr Asp Gly Arg Gly Val Asp
195 200 205
Val Val Tyr Asp Gly Val Gly Lys Ser Thr Phe Glu Ala Ser Leu Ala
210 215 220
Ser Leu Arg Pro Arg Gly Thr Leu Ala Leu Phe Gly Gly Ala Ser Gly
225 230 235 240
Gln Val Pro Pro Phe Asp Pro Gln Arg Leu Asn Gly Ala Gly Ser Leu
245 250 255
Phe Leu Thr Arg Pro Ser Leu Ala His His Val Leu Thr Arg Glu Glu
260 265 270
Leu Glu Trp Arg Ala Gly Glu Val Phe Gly Trp Ile Ser Ser Gly Ala
275 280 285
Leu His Ile Arg Val Ser Gly Thr Tyr Ser Leu Glu Asp Ala Ala Arg
290 295 300
Ala His Glu Asp Leu Glu Gly Arg Arg Thr Thr Gly Lys Leu Leu Ile
305 310 315 320
Leu Pro
<210> 94
<211> 320
<212> PRT
<213> Sciscionella marina
<400> 94
Met Thr Asn Ala Ile Arg Val His Glu Thr Gly Gly Pro Glu Val Leu
1 5 10 15
Arg Leu Asp Glu Val Thr Arg Glu Ala Gly Ala Gly Gln Leu Leu Val
20 25 30
Arg Val Glu Ala Ala Gly Val Asn Phe Ile Asp Thr Tyr Gln Arg Ser
35 40 45
Gly Val Tyr Ser Val Glu Leu Pro His Ala Leu Gly Leu Glu Gly Ala
50 55 60
Gly Thr Val Glu Ala Val Gly Asp Glu Ala Ser Asp Phe Thr Pro Gly
65 70 75 80
Asp Arg Val Ala Trp Val Trp Ala Ala Gly Ser Tyr Ala Glu His Thr
85 90 95
Val Val Pro Val Glu Arg Ala Val Arg Ile Pro Asp Asp Val Asp Thr
100 105 110
Lys Thr Ala Gly Ala Leu Met Leu Gln Gly Leu Thr Ala His Tyr Leu
115 120 125
Leu Arg Ser Thr Tyr Arg Val Asp Glu Thr Asp Thr Val Leu Val His
130 135 140
Ala Ala Ala Gly Gly Val Gly Leu Leu Leu Val Gln Leu Ala Lys Ser
145 150 155 160
Leu Gly Ala Arg Val Ile Ala Thr Ala Ser Thr Ala Glu Lys Arg Ala
165 170 175
Leu Ala Thr Gly Ala Gly Ala Asp Glu Val Leu Gly Tyr Glu Gly Phe
180 185 190
Asp Thr Lys Leu Arg Glu Leu Thr Gly Gly Ile Gly Val Ser Val Val
195 200 205
Tyr Asp Gly Val Gly Lys Asp Thr Phe Asp Ala Ser Leu Ala Ser Ile
210 215 220
Arg Pro Arg Gly Tyr Leu Val Leu Phe Gly Gly Ser Ser Gly Gln Val
225 230 235 240
Pro Pro Phe Asp Leu Gln Arg Leu Asn Ala Ala Gly Ser Leu Phe Val
245 250 255
Thr Arg Pro Ser Leu Gly Pro Tyr Ile Ala Asp Arg Thr Glu Tyr Glu
260 265 270
Trp Arg Val Gly Glu Leu Phe Glu Ala Val Gly Asn Gly Ser Leu Asn
275 280 285
Val Arg Ile Gly Gly Ser Tyr Pro Leu Ala Glu Ala Ala Asn Ala His
290 295 300
Arg Asp Leu Glu Gly Arg Lys Thr Thr Gly Lys Leu Leu Leu Val Pro
305 310 315 320
<210> 95
<211> 332
<212> PRT
<213> Zymomonas mobilis
<400> 95
Met Ser Glu Ala Tyr Ala Ile Ile Ala Glu Lys Ala Gly Gly Pro Glu
1 5 10 15
Val Leu Val Lys Lys Pro Leu Asp Leu Gly Lys Met Lys Pro Glu Ala
20 25 30
Gly Gln Val Leu Leu Arg His Gln Ala Ile Gly Leu Asn Phe Ile Asp
35 40 45
Ile Tyr His Arg Ser Gly Leu Tyr Lys Gln Asp Phe Pro Ala Asn Leu
50 55 60
Gly Cys Glu Ala Ala Gly Val Ile Glu Val Val Gly Asp Lys Val Lys
65 70 75 80
Gly Phe Lys Ala Gly Asp Arg Val Ala Val Phe Thr Ser Lys Pro Gly
85 90 95
Ala Tyr Ala Thr His Arg Ile Val Asp Ala Ser Glu Leu Val Ala Leu
100 105 110
Pro Asp Asp Ile Ser Ala Glu Thr Ala Ala Ala Val Leu Leu Lys Gly
115 120 125
Met Thr Ser Trp Met Leu Ala Glu Lys Cys Leu Ala His Ala Ala Ile
130 135 140
Glu Gly Glu Ala Pro Lys Val Met Val Leu Ala Ala Ala Gly Gly Val
145 150 155 160
Gly Ser Leu Leu Ile Pro Trp Leu Lys Tyr Leu Gly Val Thr Val Phe
165 170 175
Ala His Thr Ser Thr Glu Glu Lys Ala Ala Lys Val Lys Ala Asn Gly
180 185 190
Ala Asp Tyr Val Thr Thr Leu Pro Tyr Ser Asp Leu Pro Asp Trp Val
195 200 205
Arg Lys Gln Asn His Gly Glu Gly Val His Ala Val Leu Asp Ser Val
210 215 220
Gly Ala Asp Ser Trp Lys Ser Ser Ile Ala Ser Leu Arg Lys Lys Gly
225 230 235 240
Leu Trp Val Val Tyr Gly Asn Ala Ser Gly Pro Val Pro Ala Leu Ser
245 250 255
Pro Leu Glu Leu Ser Lys Ala Gly Ser Ile Tyr Thr Ser Arg Pro Arg
260 265 270
Leu Ile Asp Tyr Val Asp Asn Ser Val Asp Leu Thr Thr Ala Ser Gln
275 280 285
Lys Leu Phe Ala Leu Leu Arg Lys Asn Ile Leu Lys Val Glu Ile Asn
290 295 300
Gln Arg Phe Pro Leu Thr Glu Val Ala Lys Ala His Gln Leu Leu Glu
305 310 315 320
Ser Arg Lys Thr Thr Gly Ser Thr Val Leu Ile Pro
325 330
<210> 96
<211> 324
<212> PRT
<213> Methylobacterium sp.
<400> 96
Met Pro Lys Ala Ile Arg Val His Glu Tyr Gly Gly Pro Glu Val Met
1 5 10 15
Arg Tyr Glu Glu Val Asp Leu Pro Ala Pro Gly Pro Gly Gln Ile Arg
20 25 30
Val Arg Gln Arg Ala Val Gly Val Asn Phe Ile Asp Ile Tyr Phe Arg
35 40 45
Ser Gly Leu Tyr Lys Ala Pro Gln Leu Pro Phe Thr Pro Gly Asn Glu
50 55 60
Gly Thr Gly Glu Val Val Ala Val Gly Glu Gly Val Ala Gly Leu Ala
65 70 75 80
Val Gly Asp Arg Val Ala Tyr Gly Ser Ala Ala Gln Thr Tyr Ala Gln
85 90 95
Glu Ala Val Ile Glu Ala Arg Met Ala Val Lys Val Pro Asp Gly Ile
100 105 110
Asp Asp Ala Thr Ala Ala Ala Met Met Leu Lys Gly Leu Thr Ala Gln
115 120 125
Tyr Leu Leu Arg Lys Thr Tyr Arg Val Gln Pro Gly Asp Thr Ile Leu
130 135 140
Phe His Ala Ala Ala Gly Gly Val Gly Leu Ile Ala Thr Gln Trp Ala
145 150 155 160
Lys His Leu Gly Ala Thr Val Ile Gly Thr Val Gly Ser Arg Asp Lys
165 170 175
Ala Glu Leu Ala Lys Gln His Gly Cys Asp His Val Ile Leu Tyr Arg
180 185 190
Asp Glu Asp Phe Ala Ala Arg Val Lys Glu Ile Thr Gly Gly Lys Gly
195 200 205
Cys Ala Val Val Tyr Asp Gly Val Gly Gln Ala Thr Tyr Pro Ala Ser
210 215 220
Leu Asp Cys Leu Arg Pro Phe Gly Met Phe Val Ser Phe Gly Asn Ala
225 230 235 240
Ser Gly Val Ile Glu Asn Phe Asn Ile Gly Leu Leu Gly Pro Lys Gly
245 250 255
Ser Leu Tyr Ala Thr Arg Pro Thr Leu Phe Thr His Val Ala Glu Arg
260 265 270
Ala Ser Leu Glu Ala Met Ala Asp Asp Leu Phe Gly Val Val Gly Ser
275 280 285
Gly Ala Val Arg Ile Pro Val His Ser Arg Val Pro Leu Ala Glu Ala
290 295 300
Ala Gln Val His Arg Asp Leu Ala Gly Arg Gln Thr Thr Gly Ala Thr
305 310 315 320
Val Leu Ile Pro
<210> 97
<211> 324
<212> PRT
<213> Trinickia sp.
<400> 97
Met Ala Lys Ala Ile Arg Phe Glu Lys Thr Gly Gly Pro Glu Val Met
1 5 10 15
Gln Trp Val Asp Val Glu Val Gly Asp Pro Gly Ser Gly Glu Val Arg
20 25 30
Ile Lys Gln His Ala Val Gly Leu Asn Tyr Ile Asp Val Tyr Phe Arg
35 40 45
Thr Gly Leu Tyr Pro Met Pro Leu Pro Gly Gly Leu Gly Met Glu Ala
50 55 60
Ala Gly Glu Val Thr Ala Val Gly Pro Asp Val Glu Gly Leu Arg Val
65 70 75 80
Gly Asp Arg Val Ala Tyr Val Ala Arg Pro Pro Gly Ala Tyr Ala Gln
85 90 95
Glu Arg Val Leu Pro Ala Ala Ala Leu Val Lys Leu Pro Gly Ala Leu
100 105 110
Gly Tyr Asp Asp Ala Ala Ser Ala Met Leu Gln Gly Leu Thr Ala Gln
115 120 125
Tyr Leu Leu Arg Arg Thr Tyr Arg Val Lys Ala Gly Asp Thr Ile Leu
130 135 140
Ile Gln Ala Ala Ala Gly Gly Val Gly Leu Phe Val Cys Gln Trp Ala
145 150 155 160
Lys Ala Leu Gly Ala Thr Val Ile Gly Thr Val Ser Ser Asp Glu Lys
165 170 175
Ala Glu Leu Ala Lys Ala His Gly Cys Asp Tyr Pro Ile Val Tyr Thr
180 185 190
Arg Glu Ser Phe Thr Lys Arg Val Lys Glu Ile Thr Gly Gly Ala Gly
195 200 205
Val Pro Val Val Tyr Asp Ser Ile Gly Lys Asp Thr Phe Thr Gly Ser
210 215 220
Leu Asp Cys Leu Ala Pro Leu Gly Leu Phe Val Ser Phe Gly Asn Ala
225 230 235 240
Ser Gly Pro Leu Pro Pro Ile Asp Ser Ser Glu Phe Ala Gly Arg Gly
245 250 255
Ser Leu Phe Phe Thr Arg Pro Thr Leu Phe Thr His Ile Ala Lys Arg
260 265 270
Ser Asp Tyr Asp Ala Met Ala Ala Glu Leu Phe Asp Val Ile Val Ser
275 280 285
Gly Lys Val Lys Thr Met Ile Arg Gln Arg Phe Pro Leu Ala Glu Val
290 295 300
Gly Gln Ala His Ala Asp Leu Glu Ala Arg Arg Thr Thr Gly Ser Thr
305 310 315 320
Ile Leu Ile Pro
<210> 98
<211> 332
<212> PRT
<213> Clostridioides difficile
<400> 98
Met Lys Ile Leu Val Phe Gly Ala Arg Asp Tyr Glu Glu Pro Val Ile
1 5 10 15
Lys Lys Trp Ser Glu Glu His Lys Asp Val Gln Val Asp Ile Tyr Pro
20 25 30
Glu Asn Met Thr Glu Glu Asn Val Val Lys Ala Lys Gly Tyr Asp Gly
35 40 45
Ile Ser Ile Gln Gln Thr Asn Tyr Ile Asp Asn Pro Tyr Ile Tyr Glu
50 55 60
Thr Leu Lys Asp Ala Gly Val Lys Val Ile Ala Ser Arg Thr Ala Gly
65 70 75 80
Val Asp Met Ile His Phe Asp Leu Val Asn Glu Asn Gly Leu Ile Val
85 90 95
Thr Asn Val Pro Ser Tyr Ser Pro Asn Ala Ile Ala Glu Leu Ala Val
100 105 110
Thr Gln Ala Met Asn Leu Leu Arg Lys Thr Pro Leu Val Lys Lys Lys
115 120 125
Val Cys Glu Gly Asp Tyr Arg Trp Ile Ala Glu Leu Leu Gly Thr Glu
130 135 140
Val Arg Ser Ile Thr Val Gly Val Ile Gly Thr Gly Lys Ile Gly Ala
145 150 155 160
Thr Ser Ala Lys Leu Phe Lys Gly Leu Gly Ala Asn Val Ile Ala Phe
165 170 175
Asp Gln Tyr Pro Asn Ser Asp Leu Asn Asp Ile Leu Thr Tyr Lys Asp
180 185 190
Ser Leu Glu Asp Leu Leu Lys Glu Ala Asp Leu Ile Thr Leu His Thr
195 200 205
Pro Leu Leu Glu Gly Thr Lys His Met Ile Asn Lys Asp Thr Leu Ala
210 215 220
Ile Met Lys Asp Gly Ala Tyr Ile Val Asn Thr Gly Arg Gly Gly Leu
225 230 235 240
Ile Asn Thr Gly Asp Leu Ile Glu Ala Leu Glu Ser Gly Lys Ile Arg
245 250 255
Ala Ala Ala Leu Asp Thr Phe Glu Thr Glu Gly Leu Phe Leu Asn Lys
260 265 270
Lys Met Asn Pro Gly Glu Leu Thr Asp Pro Glu Ile Asn Lys Leu Leu
275 280 285
Ser Met Glu Gln Val Ile Phe Thr His His Leu Gly Phe Phe Thr Ser
290 295 300
Thr Ala Ile Glu Asn Ile Val Tyr Ser Ser Leu Ser Ser Ala Val Glu
305 310 315 320
Val Ile Lys Thr Gly Thr Ala Thr Asn Arg Val Asn
325 330
<210> 99
<211> 312
<212> PRT
<213> Lactococcus lactis
<400> 99
Met Arg Ile Thr Ile Ala Gly Ala Gly Ala Met Gly Ser Arg Phe Gly
1 5 10 15
Leu Met Leu His Lys Gly Gly Asn Glu Val Thr Leu Ile Asp Gly Trp
20 25 30
Pro Glu His Val Lys Ala Ile Lys Asp His Gly Leu Arg Ala Asn Tyr
35 40 45
Asn Gly Glu Glu Leu Thr Ala His Leu Ser Val Glu Leu Gln Ser Glu
50 55 60
Ile Ser Ser Lys Glu Lys Thr Asp Leu Ile Ile Leu Phe Thr Lys Ala
65 70 75 80
Met Gln Leu Asp Lys Met Leu Gln Asp Ile Lys Pro Leu Ile Asp Glu
85 90 95
His Thr Lys Val Leu Cys Leu Leu Asn Gly Ile Gly His Glu Asp Thr
100 105 110
Ile Glu Lys Tyr Val Ser Lys Asn Asn Ile Phe Ile Gly Asn Thr Met
115 120 125
Trp Thr Ala Gly Leu Glu Gly Pro Gly Lys Ala Lys Leu Phe Gly Asp
130 135 140
Gly Ser Val Glu Leu Gln Asn Leu Ile Ser Gly Glu Glu Glu Thr Ala
145 150 155 160
Lys Lys Leu Ala Glu Ile Leu Ser Glu Ser Gly Leu Asn Ala Lys Tyr
165 170 175
Ser Asn Asn Ile His Tyr Ser Ile Tyr Arg Lys Ala Cys Val Asn Gly
180 185 190
Thr Met Asn Gly Leu Cys Thr Ile Leu Asp Thr Asn Met Ala Gly Leu
195 200 205
Gly Glu Thr Lys Pro Ala His Asp Met Val Val Thr Ile Val Asn Glu
210 215 220
Phe Ala Ala Val Ala Lys Phe Glu Asn Val Asn Leu Asp Ile Ala Glu
225 230 235 240
Val Val Gln His Val Glu Thr Cys Phe Asp Pro Ala Thr Ile Gly Leu
245 250 255
His Tyr Pro Ser Met Tyr Gln Asp Leu Ile Lys Asn Asn Arg Leu Thr
260 265 270
Glu Ile Asp Tyr Ile Asn Gly Ala Val Ser Arg Lys Gly Lys Lys Tyr
275 280 285
Asn Val Ala Thr Pro Tyr Cys Asp Phe Leu Thr Gln Leu Val His Ser
290 295 300
Lys Glu Glu Leu Leu Lys Ala Lys
305 310
<210> 100
<211> 334
<212> PRT
<213> Clostridium sporogenes
<400> 100
Met Lys Ile Leu Met Tyr Ser Val Arg Glu His Glu Lys Pro Ala Ile
1 5 10 15
Lys Lys Trp Leu Glu Ala Asn Pro Gly Val Gln Ile Asp Leu Ser Asp
20 25 30
Glu Ala Leu Ser Glu Asp Thr Val Cys Lys Val Lys Asp Tyr Asp Gly
35 40 45
Ile Ala Ile Gln Gln Thr Asn Ser Ile Gly Gly Glu Thr Val Tyr Ser
50 55 60
Thr Leu Lys Lys Tyr Gly Ile Arg Gln Ile Ala Ser Arg Thr Ala Gly
65 70 75 80
Val Asp Met Ile Asp Leu Lys Met Ala Ser Glu Asn Asn Ile Ile Val
85 90 95
Thr Asn Val Pro Ala Tyr Ser Pro Asn Ala Ile Ala Glu Leu Ala Val
100 105 110
Thr His Thr Met Asn Leu Leu Arg Asn Ile Lys Thr Val Asn Lys Arg
115 120 125
Ile Ala Phe Gly Asp Tyr Arg Trp Ser Ala Asp Leu Ile Ala Arg Glu
130 135 140
Val Arg Ser Ile Thr Val Gly Val Val Gly Thr Gly Lys Ile Gly Arg
145 150 155 160
Thr Ser Ala Lys Leu Phe Lys Gly Leu Gly Ala Asn Val Ile Gly Tyr
165 170 175
Asp Ala Tyr Pro Asp Lys Lys Leu Glu Glu Asn Asn Leu Leu Thr Tyr
180 185 190
Lys Asp Ser Leu Glu Asp Leu Leu Lys Glu Ala Asp Val Val Thr Leu
195 200 205
His Thr Pro Leu Leu Glu Ser Thr Lys His Met Ile Asn Lys Asn Asn
210 215 220
Leu Lys Tyr Met Lys Pro Asn Ala Phe Ile Val Asn Thr Gly Arg Gly
225 230 235 240
Gly Ile Ile Asn Thr Glu Asp Leu Ile Glu Ala Leu Glu Glu Asn Lys
245 250 255
Ile Ala Gly Ala Ala Leu Asp Thr Phe Glu Asn Glu Gly Leu Phe Leu
260 265 270
Asn Lys Val Ile Asp Pro Thr Lys Ile Pro Asp Pro Gln Leu Asp Lys
275 280 285
Leu Leu Lys Met Asp Gln Val Leu Ile Thr His His Val Gly Phe Phe
290 295 300
Thr Thr Thr Ala Val Gln Asn Met Val Asp Thr Ser Leu Asp Ser Val
305 310 315 320
Met Glu Val Leu Lys Thr Asn Asp Ser Val Asn Lys Ala Asn
325 330
<210> 101
<211> 333
<212> PRT
<213> Lactobacillus delbrueckii
<400> 101
Met Thr Lys Ile Ala Met Tyr Asn Val Ser Pro Ile Glu Val Pro Tyr
1 5 10 15
Ile Glu Asp Trp Ala Lys Lys Asn Asp Val Glu Ile Lys Thr Thr Asp
20 25 30
Gln Ala Leu Thr Ser Ala Thr Val Asp Leu Ala Glu Gly Cys Ser Ser
35 40 45
Val Ser Leu Lys Pro Leu Gly Pro Val Asp Glu Glu Val Val Tyr Gln
50 55 60
Lys Leu Ser Glu Tyr Gly Val Lys Cys Ile Gly Leu Arg Ile Val Gly
65 70 75 80
Phe Asn Thr Ile Asn Phe Asp Trp Thr Lys Lys Tyr Asn Leu Leu Val
85 90 95
Thr Asn Val Pro Val Tyr Ser Pro Arg Ala Ile Ala Glu Met Thr Val
100 105 110
Thr Gln Ala Met Tyr Leu Leu Arg Lys Ile Gly Glu Phe Arg Tyr Arg
115 120 125
Met Asp His Asp His Asp Phe Thr Trp Pro Ser Asn Leu Ile Ser Asn
130 135 140
Glu Ile Tyr Asn Leu Thr Val Gly Leu Ile Gly Val Gly His Ile Gly
145 150 155 160
Ser Ala Val Ala Glu Ile Phe Ser Ala Met Gly Ala Lys Val Ile Ala
165 170 175
Tyr Asp Val Ala Tyr Asn Pro Glu Phe Glu Pro Phe Leu Thr Tyr Thr
180 185 190
Asp Phe Asp Thr Val Leu Lys Glu Ala Asp Ile Val Ser Leu His Thr
195 200 205
Pro Leu Leu Pro Ser Thr Glu Asn Met Ile Gly Glu Lys Gln Leu Lys
210 215 220
Glu Met Lys Lys Ser Ala Tyr Leu Ile Asn Cys Ala Arg Gly Glu Leu
225 230 235 240
Val Asp Thr Gly Ala Leu Ile Lys Ala Leu Gln Asp Gly Glu Ile Ala
245 250 255
Gly Ala Gly Leu Asp Thr Leu Ala Gly Glu Ser Ser Tyr Phe Gly His
260 265 270
Thr Gly Leu Thr Asp Ser Glu Ile Pro Glu Asp Tyr Lys Thr Leu Ala
275 280 285
Lys Met Pro Asn Val Val Ile Thr Pro His Ser Ala Phe Tyr Thr Glu
290 295 300
Thr Ser Ile Arg Asn Met Val Gln Ile Cys Leu Thr Asp Gln Leu Thr
305 310 315 320
Ile Ala Lys Gly Gly Arg Pro Arg Ser Ile Val Asn Leu
325 330
<210> 102
<211> 330
<212> PRT
<213> Lacticaseibacillus paracasei
<400> 102
Met Thr Lys Ile Leu Met Tyr Thr Val Arg Pro Asp Glu Arg Ala Ala
1 5 10 15
Ile Asp Ala Trp Val Ala Ala Asn Asp Ile Gln Val Asp Thr Asn Thr
20 25 30
Val Glu Phe Gly Pro Asp Thr Val Asp Leu Ala Lys Gly Tyr Asp Gly
35 40 45
Val Val Ile Gln Gln His Gly Ala Ile Pro Glu Glu Met Val Tyr Gln
50 55 60
Lys Leu Lys Ala Phe Gly Ile Lys Gln Leu Thr Leu Arg Ile Thr Gly
65 70 75 80
Tyr Asp Ile Val Asn Leu Asp Ala Ala Thr Ala Asn Gly Leu Val Val
85 90 95
Thr Asn Val Pro Ala Tyr Ser Pro Arg Ser Val Ser Glu Leu Val Leu
100 105 110
Ala Gln Val Met Arg Leu Ile Arg His Leu Gly Glu Ala Ser Ala Arg
115 120 125
Glu Ala Lys Asp Asp Tyr Ser Trp Thr Gly Leu Glu Ala Pro Glu Ile
130 135 140
His Asn Leu Thr Val Gly Ile Ile Gly Ala Gly Lys Ile Gly Ser Ala
145 150 155 160
Val Ala Arg Ile Phe Arg Ala Leu Gly Ala Thr Val Ile Val Ser Asp
165 170 175
Pro Val Lys Arg Pro Glu Leu Ala Asp Thr Val Ser Tyr Val Asp Leu
180 185 190
Asn Thr Leu Leu Thr Thr Ser Asp Val Val Thr Val His Thr Pro Leu
195 200 205
Asp Gly Leu Thr Thr His Leu Ile Asp Ala Asp Ala Leu Arg Lys Met
210 215 220
Lys Ser Thr Ala Tyr Leu Ile Asn Ala Ala Arg Gly Pro Ile Val Asp
225 230 235 240
Thr Glu Ala Leu Ile Lys Ala Leu Asn Asp His Thr Ile Ala Gly Ala
245 250 255
Ala Leu Asp Thr Ile Glu Gly Glu Ala Gly Ile Phe Gly Glu Asp Arg
260 265 270
Ser Gln Thr Leu Val Asp Asn Gln Thr Leu Glu Thr Leu Lys Ala Met
275 280 285
Pro Asn Val Glu Ile Ser Pro His Ile Gly Phe Tyr Thr Asp Ala Ala
290 295 300
Val Lys Asn Met Ile Asp Ile Ser Leu Asp Asp Val Lys Thr Ile Leu
305 310 315 320
Glu Gly Gly Lys Ser Ala His Gln Val Asn
325 330
<210> 103
<211> 332
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: Lactobacillaceae family sequence
<400> 103
Met Lys Ile Ile Ala Tyr Ala Val Arg Asp Asp Glu Arg Pro Phe Phe
1 5 10 15
Asp Thr Trp Met Lys Glu Asn Pro Asp Val Glu Val Lys Leu Val Pro
20 25 30
Glu Leu Leu Thr Glu Asp Asn Val Asp Leu Ala Lys Gly Phe Asp Gly
35 40 45
Ala Asp Val Tyr Gln Gln Lys Asp Tyr Thr Ala Glu Val Leu Asn Lys
50 55 60
Leu Ala Asp Glu Gly Val Lys Asn Ile Ser Leu Arg Asn Val Gly Val
65 70 75 80
Asp Asn Leu Asp Val Pro Thr Val Lys Ala Arg Gly Leu Asn Ile Ser
85 90 95
Asn Val Pro Ala Tyr Ser Pro Asn Ala Ile Ala Glu Leu Ser Val Thr
100 105 110
Gln Leu Met Gln Leu Leu Arg Gln Thr Pro Leu Phe Asn Lys Lys Leu
115 120 125
Ala Lys Gln Asp Phe Arg Trp Ala Pro Asp Ile Ala Lys Glu Leu Asn
130 135 140
Thr Met Thr Val Gly Val Ile Gly Thr Gly Arg Ile Gly Arg Ala Ala
145 150 155 160
Ile Asp Ile Phe Lys Gly Phe Gly Ala Lys Val Ile Gly Tyr Asp Val
165 170 175
Tyr Arg Asn Ala Glu Leu Glu Lys Glu Gly Met Tyr Val Asp Thr Leu
180 185 190
Asp Glu Leu Tyr Ala Gln Ala Asp Val Ile Thr Leu His Val Pro Ala
195 200 205
Leu Lys Asp Asn Tyr His Met Leu Asn Ala Asp Ala Phe Ser Lys Met
210 215 220
Lys Asp Gly Ala Tyr Ile Leu Asn Phe Ala Arg Gly Thr Leu Ile Asp
225 230 235 240
Ser Glu Asp Leu Ile Lys Ala Leu Asp Ser Gly Lys Val Ala Gly Ala
245 250 255
Ala Leu Asp Thr Tyr Glu Tyr Glu Thr Lys Ile Phe Asn Lys Asp Leu
260 265 270
Glu Gly Gln Thr Ile Asp Asp Lys Val Phe Met Asn Leu Phe Asn Arg
275 280 285
Asp Asn Val Leu Ile Thr Pro His Thr Ala Phe Tyr Thr Glu Thr Ala
290 295 300
Val His Asn Met Val His Val Ser Met Asn Ser Asn Lys Gln Phe Ile
305 310 315 320
Glu Thr Gly Lys Ala Asp Thr Gln Val Lys Phe Asp
325 330
<210> 104
<211> 331
<212> PRT
<213> Clostridium sporogenes
<400> 104
Met Lys Ile Leu Ala Tyr Cys Val Arg Pro Asp Glu Ile Asp Ser Phe
1 5 10 15
Lys Asn Phe Ser Glu Lys Tyr Gly His Thr Val Asp Leu Ile Pro Asp
20 25 30
Ser Phe Gly Pro Ser Val Ala His Leu Ala Lys Gly Tyr Asp Gly Ile
35 40 45
Ser Ile Leu Gly Asn Asp Thr Cys Asn Arg Glu Ala Leu Glu Lys Ile
50 55 60
Lys Asp Cys Gly Ile Lys Tyr Leu Ala Thr Arg Thr Ala Gly Val Asn
65 70 75 80
Asn Ile Asp Phe Asp Ala Ala Lys Glu Phe Gly Ile Asn Val Ala Asn
85 90 95
Val Pro Ala Tyr Ser Pro Asn Ser Val Ser Glu Phe Thr Val Gly Leu
100 105 110
Ala Leu Ser Leu Thr Arg Lys Ile Pro Phe Ala Leu Lys Arg Val Glu
115 120 125
Leu Asn Asn Phe Ala Leu Gly Gly Leu Ile Gly Val Glu Leu Arg Asn
130 135 140
Leu Thr Leu Gly Val Ile Gly Thr Gly Arg Ile Gly Leu Lys Val Ile
145 150 155 160
Glu Gly Phe Ser Gly Phe Gly Met Lys Lys Met Ile Gly Tyr Asp Ile
165 170 175
Phe Glu Asn Glu Lys Ala Lys Glu Tyr Ile Glu Tyr Lys Ser Leu Asp
180 185 190
Glu Val Tyr Lys Glu Ala Asp Ile Ile Thr Leu His Ala Pro Leu Thr
195 200 205
Asp Asp Asn Tyr His Met Ile Gly Lys Glu Ser Ile Ala Lys Met Lys
210 215 220
Asp Gly Val Phe Ile Ile Asn Ala Ala Arg Gly Ala Leu Ile Asp Ser
225 230 235 240
Glu Ala Leu Ile Glu Gly Leu Lys Ser Gly Lys Ile Ala Gly Ala Ala
245 250 255
Leu Asp Ser Tyr Glu Tyr Glu Gln Gly Val Phe His Asn Asn Lys Met
260 265 270
Asn Glu Ile Met Lys Asp Asp Thr Leu Ala Arg Leu Lys Ser Phe Pro
275 280 285
Asn Val Val Ile Thr Pro His Leu Gly Phe Tyr Thr Asp Glu Ala Val
290 295 300
Ser Asn Met Val Glu Ile Thr Leu Met Asn Leu Gln Glu Phe Glu Leu
305 310 315 320
Lys Gly Thr Cys Lys Asn Gln Arg Val Cys Lys
325 330
<210> 105
<211> 334
<212> PRT
<213> Clostridium sporogenes
<400> 105
Met Lys Ile Leu Met Tyr Ser Val Arg Glu His Glu Lys Pro Ala Ile
1 5 10 15
Lys Lys Trp Leu Glu Ala Asn Pro Gly Val Gln Ile Asp Leu Ser Asp
20 25 30
Glu Ala Leu Ser Glu Asp Thr Val Cys Lys Val Lys Asp Tyr Asp Gly
35 40 45
Ile Ala Ile Gln Gln Thr Asn Ser Ile Gly Gly Glu Thr Val Tyr Ser
50 55 60
Thr Leu Lys Lys Tyr Gly Ile Arg Gln Ile Ala Ser Arg Thr Ala Gly
65 70 75 80
Val Asp Met Ile Asp Leu Lys Met Ala Ser Glu Asn Asn Ile Ile Val
85 90 95
Thr Asn Val Pro Ala Tyr Ser Pro Asn Ala Ile Ala Glu Leu Ala Val
100 105 110
Thr His Thr Met Asn Leu Leu Arg Asn Ile Lys Thr Val Asn Lys Arg
115 120 125
Ile Ala Phe Gly Asp Tyr Arg Trp Ser Ala Asp Leu Ile Ala Arg Glu
130 135 140
Val Arg Ser Ile Thr Val Gly Val Val Gly Thr Gly Lys Ile Gly Arg
145 150 155 160
Thr Ser Ala Lys Leu Phe Lys Gly Leu Gly Ala Asn Val Ile Gly Tyr
165 170 175
Asp Ala Tyr Pro Asp Lys Lys Leu Glu Glu Asn Asn Leu Leu Thr Tyr
180 185 190
Lys Asp Ser Leu Glu Asp Leu Leu Lys Glu Ala Asp Val Val Thr Leu
195 200 205
His Thr Pro Leu Leu Glu Ser Thr Lys His Met Ile Asn Lys Asn Asn
210 215 220
Leu Lys Tyr Met Lys Pro Asn Ala Phe Ile Val Asn Thr Gly Arg Gly
225 230 235 240
Gly Ile Ile Asn Thr Glu Asp Leu Ile Glu Ala Leu Glu Glu Asn Lys
245 250 255
Ile Ala Gly Ala Ala Leu Asp Thr Phe Glu Asn Glu Gly Leu Phe Leu
260 265 270
Asn Lys Val Ile Asp Pro Thr Lys Ile Pro Asp Pro Gln Leu Asp Lys
275 280 285
Leu Leu Lys Met Asp Gln Val Leu Ile Thr His His Val Gly Phe Phe
290 295 300
Thr Thr Thr Ala Val Gln Asn Met Val Asp Thr Ser Leu Asp Ser Val
305 310 315 320
Met Glu Val Leu Lys Thr Asn Asp Ser Val Asn Lys Ala Asn
325 330
<210> 106
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic 6xHis tag
<400> 106
His His His His His His
1 5
Claims (73)
- 피루베이트 및 지방족 알데히드를 알돌-탈수 생성물 생합성 폴리펩티드와 접촉시켜서 알돌-탈수 생성물을 생성시키는 단계를 포함하는 방법으로서,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기와 접합된 이중 결합을 포함하는 화합물인, 방법. - 제1항에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 히드라타제-알돌라제이거나 또는 그를 포함하는 것인 방법.
- 제1항에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 EC 번호 4.1.2.45 또는 EC 번호 4.1.2.34, 또는 EC 4.1.1.4를 갖는 효소이거나 또는 그를 포함하거나, 또는 표 1 및 5-8로부터 선택되는 것인 방법.
- 제3항에 있어서, 알돌-탈수 생성물 생합성 폴리펩티드는 미생물 중에 존재하는 것인 방법.
- 알켄을 알켄 환원 생성물 생합성 폴리펩티드와 접촉시켜서 알켄 환원 생성물을 생성시키는 단계를 포함하는 방법으로서,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고;
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어 알켄 환원 생성물을 제공하는 것인, 방법. - 제5항에 있어서, 알켄은 제1항의 알돌-탈수 생성물인 방법.
- 제6항에 있어서, 알켄 환원 생성물 생합성 폴리펩티드는 EC 1.6.5에 속하는 효소이거나 또는 그를 포함하거나, 또는 표 9로부터 선택되는 것인 방법.
- 제4항에 있어서, 지방족 알데히드는 하기 화학식 A-1의 구조 또는 이의 염을 갖는 것인 방법:
Ra-L2-L1-C(O)H,
A-1
(상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리임). - 제8항에 있어서, 알돌-탈수 생성물은 하기 화학식 P-2의 구조 또는 이의 염을 갖는 것인 방법:
Ra-L2-L1-CH=CH-C(O)-C(O)OH,
P-2
(상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R'이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리임). - 제9항에 있어서, -CH=CH- 는 E 입체배열인 방법.
- 제9항에 있어서, -CH=CH- 는 Z 입체배열인 방법.
- 제5항 내지 제11항 중 어느 하나의 항에 있어서, 알켄 환원 생성물은 하기 화학식 P-3의 구조 또는 이의 염을 갖는 것인 방법:
Ra-L2-L1-CH2-CH2-C(O)-C(O)OH,
P-3
(상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리임). - 제5항에 있어서, 알켄 환원 생성물을 하기 화학식 P-10의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH
P-10 - 제5항에 있어서, 알켄 환원 생성물을 하기 화학식 P-10'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-CH2-CH2-OH
P-10' - 제12항에 있어서, 화학식 P-3의 화합물 또는 이의 염을 하기 화학식 P-4의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)OH,
P-4
(상기 화학식에서,
Ra 는 R" 또는 -OR"이고,
L1 및 L2 의 각각은 독립적으로 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-20 지방족 또는 C1-20 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환되고;
-Cy- 는 2가, 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리이고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리이고;
각각의 R" 은 독립적으로 -R', -C(O)R', -CO2R', 또는 -SO2R' 이고;
R' 은 수소, 또는 C1-10 지방족, 1-5 이종원자를 갖는 C1-10 헤테로지방족, 6-10원 아릴 고리, 1-5 이종원자를 갖는 5-10원 헤테로아릴 고리, 및 1-5 이종원자를 갖는 3-10원 헤테로시클릭 고리로부터 선택되는 임의 치환된 기이거나, 또는
둘 이상의 R' 기는 그들의 개재 원자와 함께 개재 원자 이외에도, 0-5 이종원자를 갖는 임의 치환된 3-20원 단환식, 이환식 또는 다환식 고리를 형성하고, 각각의 단환식 고리는 독립적으로 0-5 이종원자를 갖는 임의 치환, 포화, 부분 포화 또는 방향족 3-20원 고리임). - 제15항에 있어서, 전환은 화학식 P-3의 화합물 또는 이의 염을 카르보닐 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제15항에 있어서, 화학식 P-4의 화합물 또는 이의 염을 하기 화학식 P-5의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-CH(OH)-C(O)-S-CoA
P-5 - 제17항에 있어서, 전환은 화학식 P-4의 화합물 또는 이의 염을 CoA 전달 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제17항에 있어서, 화학식 P-5의 화합물 또는 이의 염을 하기 화학식 P-6의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH=CH-C(O)-S-CoA
P-6 - 제19항에 있어서, 전환은 화학식 P-5의 화합물 또는 이의 염을 탈수 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제19항에 있어서, 화학식 P-6의 화합물 또는 이의 염을 하기 화학식 P-7의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-CH2-C(O)-S-CoA,
P-7 - 제21항에 있어서, 전환은 화학식 P-6의 화합물 또는 이의 염을 2,3-에노일-CoA 리덕타제이거나 또는 그를 포함하는 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제21항에 있어서, 화학식 P-7의 화합물 또는 이의 염을 하기 화학식 P-8의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-CH2-C(O)-OH,
P-8 - 제23항에 있어서, 전환은 화학식 P-7의 화합물 또는 이의 염을 CoA 전달 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제23항에 있어서, 화학식 P-8의 화합물 (식에서, L2 는 -CH2-L2'-임) 또는 이의 염을 하기 화학식 P-9의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
H-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH,
P-9
(상기 화학식에서,
L2' 은 공유 결합, 또는 2가, 임의 치환된, 선형 또는 분지형 C1-19 지방족 또는 C1-19 헤테로지방족이고, 하나 이상의 메틸렌 단위는 임의로 독립적으로 -C≡C-, -C(R")2-, -Cy-, -O-, -S-, -S-S-, -N(R")-, -C(O)-, -C(S)-, -C(NR")-, -C(O)N(R")-, -N(R")C(O)N(R")-, -N(R")C(O)O-, -S(O)-, -S(O)2-, -S(O)2N(R")-, -C(O)S-, 또는 -C(O)O- 에 의해 치환됨). - 제25항에 있어서, 전환은 화학식 P-8의 화합물 또는 이의 염을 알콜 데히드로게나제이거나 또는 그를 포함하는 산화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제25항에 있어서, 화학식 P-9의 화합물 또는 이의 염을 하기 화학식 P-10의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
HO-C(O)-L2'-L1-CH2-CH2-CH2-C(O)-OH,
P-10 - 제27항에 있어서, 전환은 화학식 P-9의 화합물 또는 이의 염을 알데히드 산화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제23항에 있어서, 화학식 P-8의 화합물 또는 이의 염을 하기 화학식 P-9'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-CH2-C(O)-H,
P-9' - 제29항에 있어서, 화학식 P-8의 화합물 또는 이의 염을 카르복실 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제29항에 있어서, 화학식 P-9'의 화합물 또는 이의 염을 하기 화학식 P-10'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-CH2-CH2-OH,
P-10' - 제31항에 있어서, 화학식 P-9'의 화합물 또는 이의 염을 알데히드 리덕타제 또는 1차 알콜 데히드로게나제이거나 또는 그를 포함하는 알데히드 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제12항에 있어서, 화학식 P-3의 화합물 또는 이의 염을 하기 화학식 P-4'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-C(O)-H
P-4' - 제33항에 있어서, 화학식 P-3의 화합물 또는 이의 염을 탈카르복실화 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제33항에 있어서, 화학식 P-4'의 화합물 또는 이의 염을 하기 화학식 P-5'의 화합물 또는 이의 염으로 전환시키는 단계를 포함하는 것인 방법:
Ra-L2-L1-CH2-CH2-CH2-OH,
P-5' - 제35항에 있어서, 화학식 P-4'의 화합물 또는 이의 염을 알데히드 환원 생성물 생합성 폴리펩티드와 접촉시키는 단계를 포함하는 것인 방법.
- 제1항 내지 제36항 중 어느 하나의 항에 있어서, Ra 는 -H인 방법.
- 제1항 내지 제36항 중 어느 하나의 항에 있어서, Ra 는 -OH인 방법.
- 제1항 내지 제38항 중 어느 하나의 항에 있어서, L1 은 임의 치환된 C1-6 알킬렌인 방법.
- 제1항 내지 제38항 중 어느 하나의 항에 있어서, L1 은 미치환된 C1-6 알킬렌인 방법.
- 제39항 또는 제40항에 있어서, 알킬렌은 -CH2- 인 방법.
- 제39항 또는 제40항에 있어서, 알킬렌은 -CH2CH2- 인 방법.
- 제39항 또는 제40항에 있어서, 알킬렌은 -CH2CH2CH2- 인 방법.
- 제1항 내지 제38항 중 어느 하나의 항에 있어서, L1 은 공유 결합인 방법.
- 제1항 내지 제44항 중 어느 하나의 항에 있어서, L2 는 공유 결합인 방법.
- 제1항 내지 제44항 중 어느 하나의 항에 있어서, L2 는 임의 치환된 C1-6 알킬렌인 방법.
- 제1항 내지 제44항 중 어느 하나의 항에 있어서, L2 는 미치환된 C1-6 알킬렌인 방법.
- 제46항 또는 제47항에 있어서, 알킬렌은 -CH2- 인 방법.
- 제46항 또는 제47항에 있어서, 알킬렌은 -CH2CH2- 인 방법.
- 제46항 또는 제47항에 있어서, 알킬렌은 -CH2CH2CH2- 인 방법.
- 제8항에 있어서, 지방족 알데히드는 HO-CH2-CH2-CHO 인 방법.
- 제9항에 있어서, 알돌-탈수 생성물은 HO-CH2-CH2-CH=CH-C(O)-COOH 또는 이의 염인 방법.
- 제12항에 있어서, 알켄 환원 생성물은 HO-CH2-CH2-CH2-CH2-C(O)-COOH 또는 이의 염인 방법.
- 제15항에 있어서, 카르보닐 환원 생성물은 HO-CH2-CH2-CH2-CH2-CH(OH)-COOH 또는 이의 염인 방법.
- 제16항에 있어서, 화학식 P-5의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH(OH)-CO-S-CoA 또는 이의 염인 방법.
- 제18항에 있어서, 화학식 P-6의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH=CH-CO-S-CoA 또는 이의 염인 방법.
- 제20항에 있어서, 화학식 P-7의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CO-S-CoA 또는 이의 염인 방법.
- 제23항에 있어서, 화학식 P-8의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염인 방법.
- 제25항에 있어서, 화학식 P-9의 화합물 또는 이의 염은 H-C(O)-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염인 방법.
- 제27항에 있어서, 화학식 P-10의 화합물 또는 이의 염은 HO-CO-CH2-CH2-CH2-CH2-CO-OH 또는 이의 염인 방법.
- 제25항에 있어서, 화학식 P-9'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-C(O)-H 또는 이의 염인 방법.
- 제27항에 있어서, 화학식 P-10'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-CH2-OH 또는 이의 염인 방법.
- 제32항에 있어서, 화학식 P-4'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-C(O)-H 또는 이의 염인 방법.
- 제32항에 있어서, 화학식 P-5'의 화합물 또는 이의 염은 HO-CH2-CH2-CH2-CH2-CH2-OH 또는 이의 염인 방법.
- 제1항 내지 제64항 중 어느 하나의 항의 방법으로 제조된 조제물.
- 화학식 P-1, P-2, P-3, P-4, P-4', P-5, P-5', P-6, P-7, P-8, P-9, P-9', P-10, 또는 P-10'의 화합물, 또는 이의 염의 조제물, 또는 제1항 내지 64항 중 어느 하나의 항의 방법으로 제조된 조제물로서, 조제물은 화합물의 기준 조제물에서 관찰된 것에 비해 14C 동위원소에 대해 농축되고, 기준 조제물은 화석 탄소원을 사용해 제조된 것인 조제물.
- 폴리에스테르, 폴리에스테르 폴리올, 폴리우레탄, 나일론 6, 나일론 6,6, 폴리카르보네이트 디올, 디아크릴레이트 에스테르, 또는 디글리시딜 에테르의 조제물로서, 조제물은 제1항 내지 제64항 중 어느 하나의 항의 방법으로 제조된 조제물을 사용하여 제조된 것인 조제물.
- 제67항에 있어서, 조제물은 화합물의 기준 조제물에서 관찰된 것에 비해 14C 동위원소에 대해 농축되고, 기준 조제물은 화석 탄소원을 사용해 제조된 것인 조제물.
- 제1항 내지 제68항 중 어느 하나의 항의 생합성 폴리펩티드를 코딩하는 핵산.
- 지방족 알데히드의 알돌-탈수 생성물을 생성하는 조작된 미생물로서, 미생물은 알돌 생성물 생합성 폴리펩티드, 알돌-탈수 생성물 생합성 폴리펩티드, 탈수 생성물 생합성 폴리펩티드, 또는 이의 임의 조합의 증가된 발현 또는 활성을 포함하고,
지방족 알데히드의 카르보닐 기는 알케닐, 알키닐, 또는 방향족 기에 접합되지 않고;
알돌-탈수 생성물은 알데히드 또는 케톤 기 및 알데히드 또는 케톤 기에 접합된 이중 결합을 포함하는 화합물인, 조작된 미생물. - 알켄 환원 생성물을 생성하는 조작된 미생물로서, 미생물은 알켄 환원 생성물 생합성 폴리펩티드의 증가된 발현 또는 활성을 포함하고,
알켄은 카르보닐 기에 접합된 이중 결합을 포함하고;
알켄 중 카르보닐 기에 접합된 이중 결합은 단일 결합으로 환원되어 알켄 환원 생성물을 제공하는 것인, 조작된 미생물. - 독립적으로 화학식 P-1 내지 P-10, P-9', P-10', P-4' 또는 P-5'의 하나 이상의 화합물, 또는 이의 염을 포함하는, 제70항 또는 제71항의 미생물을 포함하는, 배양물.
- 구현예 1-386 중 어느 하나의 방법, 조제물, 핵산, 미생물, 또는 배양물.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962838793P | 2019-04-25 | 2019-04-25 | |
US62/838,793 | 2019-04-25 | ||
US201962868824P | 2019-06-28 | 2019-06-28 | |
US62/868,824 | 2019-06-28 | ||
PCT/US2020/029981 WO2020220001A1 (en) | 2019-04-25 | 2020-04-25 | Production of chemicals from renewable sources |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220012847A true KR20220012847A (ko) | 2022-02-04 |
Family
ID=72941776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217036672A KR20220012847A (ko) | 2019-04-25 | 2020-04-25 | 재생가능한 공급원으로부터 화학물질의 생산 |
Country Status (9)
Country | Link |
---|---|
US (2) | US20220372528A1 (ko) |
EP (1) | EP3959328A4 (ko) |
JP (1) | JP2022530467A (ko) |
KR (1) | KR20220012847A (ko) |
CN (1) | CN114026246A (ko) |
AU (1) | AU2020262490A1 (ko) |
BR (1) | BR112021021193A2 (ko) |
CA (1) | CA3134763A1 (ko) |
WO (1) | WO2020220001A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112021021193A2 (pt) | 2019-04-25 | 2022-01-04 | Zymochem Inc | Produção de produtos químicos a partir de fontes renováveis |
CN113336336B (zh) * | 2021-06-04 | 2022-03-29 | 中国科学院重庆绿色智能技术研究院 | 卓贝尔氏菌在高效除氨氮中的应用 |
WO2024020161A2 (en) * | 2022-07-20 | 2024-01-25 | Zymochem, Inc. | Purification technologies |
JP7480925B1 (ja) * | 2022-07-22 | 2024-05-10 | Dic株式会社 | 1,6-ヘキサンジオール組成物、ポリマー、硬化性樹脂組成物及び塗料 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7582455B2 (en) | 2005-04-26 | 2009-09-01 | Cargill, Incorporated | Polypeptides and biosynthetic pathways for the production of stereoisomers of monatin and their precursors |
EP2112227B1 (en) * | 2006-03-07 | 2013-05-15 | Cargill, Incorporated | Aldolases, nucleic acids encoding them and methods for making and using them |
NZ584162A (en) | 2007-10-04 | 2012-05-25 | Bio Architecture Lab Inc | Biofuel production |
US8986963B2 (en) | 2008-02-23 | 2015-03-24 | James Weifu Lee | Designer calvin-cycle-channeled production of butanol and related higher alcohols |
CN103555643B (zh) | 2008-03-27 | 2016-08-10 | 基因组股份公司 | 用于产生己二酸和其他化合物的微生物 |
KR101930540B1 (ko) | 2009-05-07 | 2019-03-15 | 게노마티카 인코포레이티드 | 아디페이트, 헥사메틸렌디아민 및 6-아미노카프로산의 생합성을 위한 미생물 및 방법 |
JP2013538060A (ja) * | 2010-08-30 | 2013-10-10 | アルゼダ コーポレーション | レブリン酸、レブリン酸エステル、バレロラクトン、およびこれらの誘導体の産生のための発酵経路 |
BR112014014675A2 (pt) | 2011-12-16 | 2017-06-13 | Invista Tech Sarl | método para biossintetizar um ou mais produtos e hospedeiro recombinante |
ES2800341T3 (es) * | 2012-07-11 | 2020-12-29 | Adisseo France Sas | Método para la preparación de 2,4-dihidroxibutirato |
JP6680671B2 (ja) * | 2013-09-17 | 2020-04-15 | ズィモケム インコーポレイテッドZymochem Inc. | 再生可能資源から化合物を生成するための高収量経路 |
BR112021021193A2 (pt) | 2019-04-25 | 2022-01-04 | Zymochem Inc | Produção de produtos químicos a partir de fontes renováveis |
-
2020
- 2020-04-25 BR BR112021021193A patent/BR112021021193A2/pt unknown
- 2020-04-25 CA CA3134763A patent/CA3134763A1/en active Pending
- 2020-04-25 CN CN202080044700.4A patent/CN114026246A/zh active Pending
- 2020-04-25 JP JP2021563326A patent/JP2022530467A/ja active Pending
- 2020-04-25 WO PCT/US2020/029981 patent/WO2020220001A1/en unknown
- 2020-04-25 EP EP20794199.8A patent/EP3959328A4/en active Pending
- 2020-04-25 KR KR1020217036672A patent/KR20220012847A/ko unknown
- 2020-04-25 US US17/605,389 patent/US20220372528A1/en active Pending
- 2020-04-25 AU AU2020262490A patent/AU2020262490A1/en active Pending
-
2022
- 2022-09-16 US US17/947,048 patent/US11692208B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3959328A1 (en) | 2022-03-02 |
US20230109883A1 (en) | 2023-04-13 |
US20220372528A1 (en) | 2022-11-24 |
EP3959328A4 (en) | 2024-01-17 |
CN114026246A (zh) | 2022-02-08 |
AU2020262490A1 (en) | 2021-11-25 |
CA3134763A1 (en) | 2020-10-29 |
WO2020220001A1 (en) | 2020-10-29 |
BR112021021193A2 (pt) | 2022-01-04 |
JP2022530467A (ja) | 2022-06-29 |
US11692208B2 (en) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220389433A1 (en) | High yield route for the production of compounds from renewable sources | |
US10947569B2 (en) | Recombinant microorganism for the production of useful metabolites | |
US11692208B2 (en) | Production of chemicals from renewable sources | |
US10626423B2 (en) | Methods and microorganisms for the production of 1,3-butanediol | |
US20100184173A1 (en) | Microorganisms for the production of methyl ethyl ketone and 2-butanol | |
WO2010022763A1 (en) | Method for the preparation of 2-hydroxy-isobutyrate | |
EP2909325A1 (en) | Microorganisms and methods for enhancing the availability of reducing equivalents in the presence of methanol, and for producing succinate related thereto | |
EP3087174B1 (en) | Methods and organisms with increased carbon flux efficiencies | |
US20170356016A1 (en) | Modified microorganisms and methods for production of useful products | |
EP3303421A1 (en) | Vinylisomerase-dehydratases, alkenol dehydratases, linalool dehydratases and/ crotyl alcohol dehydratases and methods for making and using them | |
WO2018203076A1 (en) | Modified microorganisms and methods for production of branched c5 carbon compounds | |
US10184138B2 (en) | Bacteria engineered for conversion of ethylene to ethanol | |
CN112513282A (zh) | 从磷酸二羟丙酮和甘油醛-3-磷酸产生果糖-6-磷酸的方法 | |
WO2023069957A1 (en) | Aldehyde dehydrogenase variants and methods of use | |
WO2023069952A1 (en) | Aldehyde dehydrogenase variants and methods of use | |
WO2017168161A1 (en) | Modified enzyme |