KR20210068489A - 알데하이드 데하이드로게나제 변이체 및 이의 이용 방법 - Google Patents
알데하이드 데하이드로게나제 변이체 및 이의 이용 방법 Download PDFInfo
- Publication number
- KR20210068489A KR20210068489A KR1020217012341A KR20217012341A KR20210068489A KR 20210068489 A KR20210068489 A KR 20210068489A KR 1020217012341 A KR1020217012341 A KR 1020217012341A KR 20217012341 A KR20217012341 A KR 20217012341A KR 20210068489 A KR20210068489 A KR 20210068489A
- Authority
- KR
- South Korea
- Prior art keywords
- bdo
- hbal
- amino acid
- cell
- polypeptide
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/02—Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
- C12P7/26—Ketones
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01003—Aldehyde dehydrogenase (NAD+) (1.2.1.3)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Abstract
본 발명은 알데하이드 데하이드로게나제 변이체의 폴리펩타이드 및 코딩 핵산을 제공한다. 또한, 본 발명은 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 제공한다. 또한, 본 발명은, 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 본 발명은 또한 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하는 것을 포함하는, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4- 부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다.
Description
본 출원은 2018년 9월 26일자 미국 가출원번호 62/737,053 및 2018년 10월 3일자 미국 가출원번호 62/740,830에 대한 우선권을 주장하며, 이들 가출원은 그 전체 내용이 원용에 의해 본 명세서에 포함된다.
하기 가출원 및 국제 출원을 참조하며, 이들 문헌은 그 전체가 원용에 의해 본 명세서에 포함된다: (1) 2017년 3월 31일자 미국 가출원 번호 62/480,194 표제 "알데하이드 데하이드로게나제 변이체 및 이용 방법" (변호사 사건 번호 12956-408-888); (2) 2017년 3월 31일자 미국 가출원번호 62/480,208 표제 "3-하이드록시부티릴-CoA 데하이드로게나제 변이체 및 이용 방법" (변호사 사건 번호 12956-409-888); (3) 2017년 3월 31일자 미국 가출원 번호 62/480,270 표제 "발효 브로스로부터 1.3-부탄다이올을 수득하는 방법 및 시스템" (변호사 사건 번호 12956-407-888); (4) 2018년 3월 29일자 국제 특허 출원 번호 PCT/US2018/025122 표제 "알데하이드 데하이드로게나제 변이체 및 이용 방법" (변호사 사건 번호 12956-408-228); (5) 2018년 3월 29일자 국제 특허 출원 번호 PCT/US2018/025086 표제 "3-하이드록시부티릴-CoA 데하이드로게나제 변이체 및 이용 방법" (변호사 사건 번호 12956-409-228); 및 (6) 2018년 3월 29일자 국제 출원 번호 PCT/US2018/025068 표제 "발효 브로스로부터 1,3-부탄다이올 수득 방법 및 시스템" (변호사 사건 번호 12956-407-228).
본 출원은 2019년 9월 17일자로 생성된 서열목록을 498,106 바이트 크기의 파일명 "12956-462-228_SL.TXT" ASCII 문서 파일로서 원용에 의해 본 명세서에 포함한다.
본 발명은 일반적으로 원하는 산물을 생산하도록 조작된 유기체, 원하는 산물의 생산을 촉진하는 조작된 효소에 관한 것이며, 보다 상세하게는 3-하이드록시부티르알데하이드, 1,3-부탄다이올, 4-하이드록시부티르알데하이드, 1,4-부탄다이올 및 이와 관련된 산물과 같은 원하는 산물을 생산하는 효소 및 세포, 그리고 이로부터 유래되는 생산물에 관한 것이다.
다양한 범용 화학제 (commodity chemical)들이 상업적인 용도를 가진 원하는 제품을 제조하는데 사용된다. 다수의 범용 화학제들은 석유로부터 유래한다. 이러한 범용 화학제들은 용매, 수지, 폴리머 전구체 및 특수 화학제로서의 용도를 비롯하여 다양한 용도들을 가진다. 바람직한 범용 화학제로는 4-탄소 분자, 예를 들어, 1,4-부탄다이올 및 1,3-부탄다이올, 업스트림 전구체 및 다운스트림 산물 등이 있다. 석유계 제품에 대한 재생가능한 원료를 공급하고 에너지 및 자본 집약성이 낮은 공정을 제공하기 위한, 범용 화학제의 제조 방법에 대한 개발이 요망되고 있다.
따라서, 원하는 생산물을 용이하게 제조하는 방법이 요구되고 있다. 본 발명은 이러한 요구를 충족시키며, 관련 이점 역시 제공한다.
본 발명은 알데하이드 데하이드로게나제 변이체의 폴리펩타이드 및 코딩 핵산을 제공한다. 또한, 본 발명은 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 제공한다. 또한, 본 발명은, 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이들의 에스테르 또는 아미드 화합물의 제조 방법을 제공한다. 또한, 본 발명은, 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하는 것을 포함하는, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이들의 에스테르 또는 아미드 화합물의 제조 방법을 제공한다.
도 1은 알데하이드 데하이드로게나제를 포함하는 1,3-부탄다이올 (1,3-BDO) 경로의 예를 도시한다. 도 1은 아세토아세틸-CoA에서부터 1,3-부탄다이올까지의 경로를 나타낸다. 효소는 다음과 같다: (A) 아세토아세틸-CoA 리덕타제 (CoA-의존적인, 알데하이드 형성); (B) 3-옥소부티르알데하이드 리덕타제 (케톤 환원); (C) 3-하이드록시부티르알데하이드 리덕타제, 본원에서 1,3-부탄다이올 데하이드로게나제로도 지칭됨; (D) 아세토아세틸-CoA 리덕타제 (CoA-의존적인, 알코올 형성); (E) 3-옥소부티르알데하이드 리덕타제 (알데하이드 환원); (F) 4-하이드록시, 2-부타논 리덕타제; (G) 아세토아세틸-CoA 리덕타제 (케톤 환원); (H) 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성), 본원에서 또한 3-하이드록시부티르알데하이드 데하이드로게나제로도 지칭됨; 및 (I) 3-하이드록시부티릴-CoA 리덕타제 (알코올 형성).
도 2는 알데하이드 데하이드로게나제를 포함하는 1,4-부탄다이올 (1,4-BDO) 경로의 예를 도시한다. 생합성 반응의 촉매 효소는 다음과 같다: (1) 숙시닐-CoA 신테타제; (2) CoA-비의존적인 숙시닉 세미알데하이드 데하이드로게나제; (3) α-케토글루타레이트 데하이드로게나제; (4) 글루타메이트:숙시네이트 세미알데하이드 트랜스아미나제; (5) 글루타메이트 데카르복실라제; (6) CoA-의존적인 숙시닉 세미알데하이드 데하이드로게나제; (7) 4-하이드록시부타노에이트 데하이드로게나제 (4-하이드록시부티레이트 데하이드로게나제로도 지칭됨); (8) α-케토글루타레이트 데카르복실라제; (9) 4-하이드록시부티릴 CoA:아세틸-CoA 트랜스퍼라제; (10) 부티레이트 키나제 (4-하이드록시부티레이트 키나제로도 지칭됨); (11) 포스포트랜스부티릴라제 (포스포-트랜스-4-하이드록시부티릴라제로도 지칭됨); (12) 알데하이드 데하이드로게나제 (4-하이드록시부티릴-CoA 리덕타제로도 지칭됨); (13) 알코올 데하이드로게나제 (4-하이드록시부타날 리덕타제 또는 4-하이드록시부티르알데하이드 리덕타제로도 지칭됨).
도 3은 ALD-1, ALD-2 및 ALD-3의 서열을 정렬하여 도시한 것이다. 서열은 각각 서열번호 1, 2 및 3이다. 도에서 밑줄친 부분은 첫번째는 A로 두번째는 B로 표시된 루프 영역 2곳이며, 이 부위는 본원에서 확인된 바와 같이 기질 특이성 및 거울상 이성질체 특이성에 관여한다. ALD-1에서 루프 A는 서열 LQKNNETQEYSINKKWVGKD (서열번호 124)이고, ALD-2에서는 서열 IGPKGAPDRKFVGKD (서열번호 125)이고, ALD-3에서는 서열 ITPKGLNRNCVGKD (서열번호 126)이다. ALD-1에서 루프 B는 서열 SFAGVGYEAEGFTTFTIA (서열번호 127)이고, ALD-2에서는 서열 TYCGTGVATNGAHSGASALTIA (서열번호 128)이고, ALD-3에서는 서열 SYAAIGFGGEGFCTFTIA (서열번호 129)이다. ALD-2의 기질 특이성 루프 A와 B는 서열 및 길이가 ALD-1 및 ALD-3의 것과는 다르지만; 그럼에도 불구하고, 정렬하였을 때, 특히 도 6에 도시된 바와 같이 3D 모델링과 연계하였을 경우, 본원에 언급된 치환에 해당하는 위치를 쉽게 동정할 수 있는 충분한 보존성이 확인된다. ALD-3는 결정 구조를 모델링하는 주형으로 사용하였으며; 특히 본원에 기술된 예시적인 치환으로의 변환시, 상호작용하여 기질 특이성 및 거울상이성질체 특이성에 영향을 주는 루프 영역 2곳을 도시한 도 6을 참조한다. ALD-1과 ALD-3의 동일성은 51.9%이다. ALD-1과 ALD-2의 동일성은 35.9%이다. ALD-3와 ALD-2의 동일성은 40%이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 A에 대한 컨센서스는 IXPKG-----XXNRKXVGKD (서열번호 5)이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 B에 대한 컨센서스는 SYAGXGXXXE----GFXTFTIA (서열번호 6)이다. 컨센서스 서열에서 특이적으로 동정된 아미노산은 보존적인 잔기이고, 여기서 "X"로 표시된 위치는 가변적임을 의미하며, 본원에 기술된 바람직한 임의의 아미노산에 해당할 수 있는 것으로, 이해된다. "---"은 아미노산 잔기들이 가변적인 개수로 존재하거나 또는 존재하는 않는 의미일 수 있는 것으로 추가로 이해된다. 이러한 가변적인 개수의 아미노산 잔기들의 예를 도 3 및 4a-4c에 나타낸다. 나아가, 컨센서스 서열에서 보존적인 잔기는 예를 들어 본원에 기술된 바와 같이 보존적인 아미노산으로 치환될 수 있는 것으로 이해된다 (예, 도 4a-4c 참조).
도 4a-4c는 예시적인 알데하이드 데하이드로게나제 (ALD)들을 정렬한 것으로, 도시된 정렬은 본 발명의 치환이 수행될 수 있는 각 주형 ALD 서열에서의 위치에 대응되는 ALD 위치를 식별하는 것을 보여준다. 도 3에서와 같이, 밑줄 친 부분은 2개의 루프 영역, 즉 A로 명명된 첫번째 것과 B로 명명된 두번째 것으로, 이 둘다 본원에서 확인된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. 도 4a는 ALD-1에 대해 컷오프가 40-55%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4a에 나타낸 바와 같이 서열번호 1 (ALD-1), 13, 20 및 24이다. 도 4b는 ALD-1에 대해 컷오프가 75-90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4b에 나타낸 바와 같이 서열번호 1 (ALD-1), 30, 33 및 37이다. 루프 A와 B는 밑줄 표시된다. 도 4c는 ALD-1에 대해 컷오프가 90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4c에 나타낸 바와 같이 서열번호 1 (ALD-1), 38, 40 및 44이다. ALD-1은 서열번호 38, 40 및 44와 각각 99%, 97% 및 95%의 동일성을 가진다. 도 4a-4c는, 본원에 언급된 치환에 대응하는 위치를, ALD-1, 특히 루프 A 및 B 영역, 특히 고도로 보존적인 루프 B 영역에 대해 동일성이 40% 이상인 ALD에서 동정할 수 있음을, 보여준다.
도 5a 및 5b는 다양한 예시적인 알데하이드 데하이드로게나제들의 효소 활성을 나타낸 것이다. 도 5a는 3 하이드록시-(R)-부티르알데하이드 (막대 세트에서 좌측 막대) 및 3 하이드록시-(S)-부티르알데하이드 (막대 세트에서 우측 막대)에 대한 ALD-2, ALD-1 및 ALD-1 변이체의 효소 활성을 보여준다. 도 5b는 3-하이드록시부티르알데하이드의 R 형태 : S 형태의 활성 비율을 도시한다.
도 6a-6c는 알데하이드 데하이드로게나제 959의 구조를 도시한 리본 다이아그램이다. 다이아그램은 3-하이드록시-(R)-부티르알데하이드 (도 6a) 또는 3-하이드록시-(S)-부티르알데하이드 (도 6b)가 959의 구조에 도킹하는 방식을 보여준다. 도 6c는 3-하이드록시-(R)-부티르알데하이드 (R3HB)와 동일한 배향성 (orientation)을 나타낸 것이다.
도 2는 알데하이드 데하이드로게나제를 포함하는 1,4-부탄다이올 (1,4-BDO) 경로의 예를 도시한다. 생합성 반응의 촉매 효소는 다음과 같다: (1) 숙시닐-CoA 신테타제; (2) CoA-비의존적인 숙시닉 세미알데하이드 데하이드로게나제; (3) α-케토글루타레이트 데하이드로게나제; (4) 글루타메이트:숙시네이트 세미알데하이드 트랜스아미나제; (5) 글루타메이트 데카르복실라제; (6) CoA-의존적인 숙시닉 세미알데하이드 데하이드로게나제; (7) 4-하이드록시부타노에이트 데하이드로게나제 (4-하이드록시부티레이트 데하이드로게나제로도 지칭됨); (8) α-케토글루타레이트 데카르복실라제; (9) 4-하이드록시부티릴 CoA:아세틸-CoA 트랜스퍼라제; (10) 부티레이트 키나제 (4-하이드록시부티레이트 키나제로도 지칭됨); (11) 포스포트랜스부티릴라제 (포스포-트랜스-4-하이드록시부티릴라제로도 지칭됨); (12) 알데하이드 데하이드로게나제 (4-하이드록시부티릴-CoA 리덕타제로도 지칭됨); (13) 알코올 데하이드로게나제 (4-하이드록시부타날 리덕타제 또는 4-하이드록시부티르알데하이드 리덕타제로도 지칭됨).
도 3은 ALD-1, ALD-2 및 ALD-3의 서열을 정렬하여 도시한 것이다. 서열은 각각 서열번호 1, 2 및 3이다. 도에서 밑줄친 부분은 첫번째는 A로 두번째는 B로 표시된 루프 영역 2곳이며, 이 부위는 본원에서 확인된 바와 같이 기질 특이성 및 거울상 이성질체 특이성에 관여한다. ALD-1에서 루프 A는 서열 LQKNNETQEYSINKKWVGKD (서열번호 124)이고, ALD-2에서는 서열 IGPKGAPDRKFVGKD (서열번호 125)이고, ALD-3에서는 서열 ITPKGLNRNCVGKD (서열번호 126)이다. ALD-1에서 루프 B는 서열 SFAGVGYEAEGFTTFTIA (서열번호 127)이고, ALD-2에서는 서열 TYCGTGVATNGAHSGASALTIA (서열번호 128)이고, ALD-3에서는 서열 SYAAIGFGGEGFCTFTIA (서열번호 129)이다. ALD-2의 기질 특이성 루프 A와 B는 서열 및 길이가 ALD-1 및 ALD-3의 것과는 다르지만; 그럼에도 불구하고, 정렬하였을 때, 특히 도 6에 도시된 바와 같이 3D 모델링과 연계하였을 경우, 본원에 언급된 치환에 해당하는 위치를 쉽게 동정할 수 있는 충분한 보존성이 확인된다. ALD-3는 결정 구조를 모델링하는 주형으로 사용하였으며; 특히 본원에 기술된 예시적인 치환으로의 변환시, 상호작용하여 기질 특이성 및 거울상이성질체 특이성에 영향을 주는 루프 영역 2곳을 도시한 도 6을 참조한다. ALD-1과 ALD-3의 동일성은 51.9%이다. ALD-1과 ALD-2의 동일성은 35.9%이다. ALD-3와 ALD-2의 동일성은 40%이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 A에 대한 컨센서스는 IXPKG-----XXNRKXVGKD (서열번호 5)이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 B에 대한 컨센서스는 SYAGXGXXXE----GFXTFTIA (서열번호 6)이다. 컨센서스 서열에서 특이적으로 동정된 아미노산은 보존적인 잔기이고, 여기서 "X"로 표시된 위치는 가변적임을 의미하며, 본원에 기술된 바람직한 임의의 아미노산에 해당할 수 있는 것으로, 이해된다. "---"은 아미노산 잔기들이 가변적인 개수로 존재하거나 또는 존재하는 않는 의미일 수 있는 것으로 추가로 이해된다. 이러한 가변적인 개수의 아미노산 잔기들의 예를 도 3 및 4a-4c에 나타낸다. 나아가, 컨센서스 서열에서 보존적인 잔기는 예를 들어 본원에 기술된 바와 같이 보존적인 아미노산으로 치환될 수 있는 것으로 이해된다 (예, 도 4a-4c 참조).
도 4a-4c는 예시적인 알데하이드 데하이드로게나제 (ALD)들을 정렬한 것으로, 도시된 정렬은 본 발명의 치환이 수행될 수 있는 각 주형 ALD 서열에서의 위치에 대응되는 ALD 위치를 식별하는 것을 보여준다. 도 3에서와 같이, 밑줄 친 부분은 2개의 루프 영역, 즉 A로 명명된 첫번째 것과 B로 명명된 두번째 것으로, 이 둘다 본원에서 확인된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. 도 4a는 ALD-1에 대해 컷오프가 40-55%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4a에 나타낸 바와 같이 서열번호 1 (ALD-1), 13, 20 및 24이다. 도 4b는 ALD-1에 대해 컷오프가 75-90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4b에 나타낸 바와 같이 서열번호 1 (ALD-1), 30, 33 및 37이다. 루프 A와 B는 밑줄 표시된다. 도 4c는 ALD-1에 대해 컷오프가 90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4c에 나타낸 바와 같이 서열번호 1 (ALD-1), 38, 40 및 44이다. ALD-1은 서열번호 38, 40 및 44와 각각 99%, 97% 및 95%의 동일성을 가진다. 도 4a-4c는, 본원에 언급된 치환에 대응하는 위치를, ALD-1, 특히 루프 A 및 B 영역, 특히 고도로 보존적인 루프 B 영역에 대해 동일성이 40% 이상인 ALD에서 동정할 수 있음을, 보여준다.
도 5a 및 5b는 다양한 예시적인 알데하이드 데하이드로게나제들의 효소 활성을 나타낸 것이다. 도 5a는 3 하이드록시-(R)-부티르알데하이드 (막대 세트에서 좌측 막대) 및 3 하이드록시-(S)-부티르알데하이드 (막대 세트에서 우측 막대)에 대한 ALD-2, ALD-1 및 ALD-1 변이체의 효소 활성을 보여준다. 도 5b는 3-하이드록시부티르알데하이드의 R 형태 : S 형태의 활성 비율을 도시한다.
도 6a-6c는 알데하이드 데하이드로게나제 959의 구조를 도시한 리본 다이아그램이다. 다이아그램은 3-하이드록시-(R)-부티르알데하이드 (도 6a) 또는 3-하이드록시-(S)-부티르알데하이드 (도 6b)가 959의 구조에 도킹하는 방식을 보여준다. 도 6c는 3-하이드록시-(R)-부티르알데하이드 (R3HB)와 동일한 배향성 (orientation)을 나타낸 것이다.
본 발명은 원하는 특성을 가지고 있으며 원하는 생산물을 제조하는데 이용가능한 효소 변이체에 관한 것이다. 특정 구현예에서, 본 발명은, 자연에서 생성되는 야생형 효소와 비교해, 특히 다른 구조적 및/또는 기능적 특징을 가진, 효소 변이체, 즉 알데하이드 데하이드로게나제 변이체에 관한 것이다. 즉, 본 발명의 알데하이드 데하이드로게나제는 자연적으로 생성되는 효소가 아니다. 이러한 본 발명의 알데하이드 데하이드로게나제 변이체는, 원하는 생산물을 생산하도록 조작된 미생물 유기체와 같은 조작된 세포에서 이용가능하다. 예를 들어, 본원에 기술된 바와 같이, 대사 경로를 가진 미생물 유기체와 같은 세포는 원하는 생산물을 생산할 수 있다. 원하는 특징을 가진 본 발명의 알데하이드 데하이드로게나제는, 원하는 생산물을 생산하기 위해 알데하이드 데하이드로게나제 효소 활성을 이용하는 대사 경로를 가진, 미생물 유기체와 같은 세포에 도입될 수 있다. 이러한 알데하이드 데하이드로게나제 변이체는 시험관내에서 바람직한 반응을 수행하기 위한 생촉매로서 부가적으로 유용하다. 즉, 본 발명의 알데하이드 데하이드로게나제 변이체는, 원하는 생산물을 생산하기 위해 또는 원하는 생산물을 생산하기 위한 시험관내 생촉매로서, 미생물 유기체와 같은 조작된 세포에서 이용할 수 있다.
본원에서, 용어 "비-천연성"은, 본 발명의 세포, 미생물 유기체 또는 미생물에 사용되는 경우, 세포가 언급된 종의 야생형 균주를 비롯해, 언급된 종의 천연 균주에서 정상적으로 발견되지 않는 하나 이상의 유전자 변형을 가지는 것을 의미하는 것으로 의도된다. 유전자 변형으로는, 예를 들어, 대사 폴리펩타이드를 코딩하는 발현가능한 핵산을 도입하는 변형, 그외 핵산 부가, 핵산 결손 및/또는 세포 유전 물질의 그외 기능적인 파괴 등이 있다. 이러한 변형은, 예를 들어, 언급된 종들에 대해 이종의 폴리펩타이드, 상동적인 폴리펩타이드 또는 이종의 폴리펩타이드와 상동적인 폴리펩타이드에 대한, 코딩 영역 및 이의 기능성 단편을 포함한다. 부가적인 변형으로는, 예를 들어, 변형이 유전자 또는 오페론의 발현을 달라지게 하는, 비-코딩 조절 영역을 포함한다. 대사 폴리펩타이드의 예로는 원하는 생산물을 생산하기 위한 생합성 경로에 속하는 효소 또는 단백질 등이 있다.
대사 변형은 생화학적 반응이 자연 생성되는 상태로부터 변형되는 것을 의미한다. 즉, 비-천연성 세포는 대사 폴리펩타이드 또는 이의 기능성 단편을 코딩하는 핵산에 유전자 변형을 가질 수 있다. 대사 변형의 예들은 본원에 기술되어 있다.
본원에서, 세포 또는 미생물 유기체를 언급할 때 사용되는 용어 "단리된"은, 만일 이러한 세포가 자연에서 발견된다면, 언급된 세포가 자연에서 발견되는 바와 같이 하나 이상의 성분이 실질적으로 없는 세포를 의미하는 것으로 의도된다. 이 용어는 자연 환경에서 발견되는 성분들 중 일부 또는 전체가 제거된 세포를 포함한다. 또한, 이 용어는 세포가 비-천연성 환경에서 발견되는 성분들 일부 또는 전부가 제거된 세포도 포함한다. 즉, 단리된 세포는, 자연에서 발견되거나 또는 비-천연성 환경에서 증식, 보관 또는 유지되는 바와 같이 다른 물질들로부터 부분적으로 또는 완전히 분리된다. 단리된 세포에 대한 구체적인 예로는 부분적으로 순수한 세포, 실질적으로 순수한 세포 및 비-천연성 배지에서 배양된 세포 등이 있다.
본원에서, 용어 "미생물 (microbial)", "미생물 유기체" 또는 "미생물 (microorganism)"은 고세균, 박테리아 또는 진핵생물류 범위에 속하는 미시 세포로서 존재하는 모든 유기체를 의미한다. 즉, 이 용어는 미시적인 크기의 원핵생물 또는 진핵생물 세포 또는 유기체를 포괄하며, 모든 종의 박테리아, 고세균류 및 유박테리아 (eubacteria)뿐 아니라 효모 및 진균과 같은 진핵 미생물을 포함하는 것으로 의도된다. 또한, 이 용어는 생화학적으로 생산하기 위해 배양가능한 임의 종의 세포 배양물을 포함한다.
본원에서, 용어 "CoA" 또는 "코엔자임 A"는, 활성 효소 시스템을 구성하기 위해 다수 효소 (주효소( apoenzyme))들의 활성에 필요한 유기 조인자 또는 보결기 (효소의 비-단백질 영역)를 의미하는 것으로 의도된다. 코엔자임 A는 일부 축합 효소에서 작용하며, 아세틸 또는 기타 아실기를 전달하는 역할을 하고, 지방산 합성 및 산화, 피루베이트 산화 및 기타 아세틸화에 참여한다.
본원에서, 용어 "실질적으로 혐기성"은 배양 또는 생장 조건에 대해 사용되는 경우, 산소의 양이 액체 매질내 용해된 산소 포화도가 약 10% 미만에 해당하는 것을 의미한다. 또한, 이 용어는 산소가 약 1% 미만인 분위기 하에 유지되는 액체 또는 고체 배지가 든 밀폐된 챔버를 포괄하는 것으로 의도된다.
본원에서 "외인성"은 언급된 분자 또는 언급된 활성이 숙주 미생물 유기체에 도입되는 것을 의미하는 것으로 의도된다. 이러한 분자는, 예를 들어, 숙주 염색체 또는 플라스미드와 같은 비-염색체성 유전 물질에의 삽입에 의해서와 같이, 코딩 핵산을 숙주 유전 물질에 도입함으로써, 도입할 수 있다. 따라서, 이 용어는, 코딩 핵산의 발현에서 사용되는 바와 같이, 코딩 핵산을 발현가능한 형태로 미생물 유기체에 도입하는 것을 의미한다. 생합성 활성에서 사용되는 경우, 이 용어는 숙주 참조 유기체에 도입되는 활성을 의미한다. 그 소스는, 예를 들어 숙주 세포에 도입된 후 언급된 활성을 발현하는 동종의 또는 이종의 코딩 핵산일 수 있다. 이에, 용어 "내인성"은 숙주에 존재하는 언급된 분자 또는 활성에 대해 사용된다. 마찬가지로, 이 용어는, 코딩 핵산의 발현에서 사용되는 경우, 세포에 내재된 코딩 핵산의 발현을 의미한다. 용어 "이종"은 언급된 종 이외의 다른 소스로부터 유래되는 분자 또는 활성을 의미하며, "동종"은 숙주 세포로부터 유래되는 분자 또는 활성을 의미한다. 즉, 본 발명의 코딩 핵산의 외인성 발현은 이종 또는 동종의 코딩 핵산 중 어느 하나 또는 둘다를 이용할 수 있다.
2 이상의 외인성 핵산이 세포에 포함되는 경우, 2 이상의 외인성 핵산은 전술한 바와 같이 언급된 코딩 핵산 또는 생합성 활성을 의미하는 것으로 이해된다. 또한, 본원에 기술된 바와 같이, 이러한 2 이상의 외인성 핵산은 숙주 세포에 개별 핵산 분자로, 폴리시스트론 핵산 분자로 또는 이의 조합으로 도입할 수 있으며, 여전히 2 이상의 외인성 핵산으로서 간주할 수 있는 것으로 또한 이해된다. 예를 들어, 본원에 기술된 바와 같이, 세포는 경로 효소 또는 단백질 등의 원하는 효소 또는 단백질을 코딩하는 2종 이상의 외인성 핵산을 발현하도록 조작할 수 있다. 원하는 활성을 코딩하는 2종의 외인성 핵산을 숙주 세포에 도입하는 경우, 이들 2종의 외인성 핵산은 단일 핵산으로서, 예를 들어 단일 플라스미드 형태로 또는 분리된 플라스미드 형태로 도입할 수 있으며, 숙주 염색체에서 한 부위 또는 여러 부위에 병합될 수 있으며, 여전히 2종의 외인성 핵산으로 간주되는 것으로 이해된다. 마찬가지로, 3종 이상의 외인성 핵산을, 숙주 유기체에 임의의 원하는 조합으로, 예를 들어 하나의 플라스미드로, 각각의 개별 플라스미드로 도입할 수 있으며, 숙주 염색체에 한 위치 또는 여러 위치에 삽입할 수 있으며, 여전히 2 이상의 외인성 핵산, 예를 들어 3종의 외인성 핵산으로 간주되는 것으로 이해된다. 즉, 언급된 외인성 핵산 또는 생합성 활성의 개수는 숙주 유기체에 도입되는 분리된 핵산의 개수를 지칭하는 것이 아니라, 코딩 핵산의 개수 또는 생합성 활성의 개수를 지칭한다.
본원에서, 용어 "유전자 파괴" 또는 이의 문법상 동의어는 코딩 유전자 산물을 불활성화하거나 또는 감쇠시키는 유전자 변형을 의미하는 것으로 의도된다. 유전자 변형은, 예를 들어, 유전자 전체의 결손, 전사 또는 번역에 필수적인 조절 서열의 결손, 절단된 유전자 산물 (truncated gene product)을 만드는 유전자의 일부 결손이거나, 또는 코딩된 유전자 산물을 불활성화 또는 감쇠시키는 임의의 다양한 돌연변이 전략에 의한 것일 수 있다. 유전자를 파괴하기 위해 특히 이용가능한 방법은 완전한 유전자 결손 (complete gene deletion)이며, 그 이유는 본 발명의 비-천연성 세포에서 유전자 복귀 (genetic reversion) 가능성 줄이거나 또는 없애기 때문이다. 또한, 유전자 파괴는, 유전자 또는 유전자 함유 영역에서 유전자를 RNA로 전사되지 않게 하거나 및/또는 기능성 유전자 산물로 번역되지 않게 만드는 돌연변이를 의미하는, null 돌연변이를 포함한다. 이러한 null 돌연변이는, 예를 들어, 불활성화 점 돌연변이, 유전자 일부 결손, 유전자 전체 결손 또는 염색체 세그먼트의 결손 등의, 여러가지 타입의 돌연변이로부터 발생할 수 있다.
본원에서, 용어 "증식-연계된 (growth-coupled)"은, 생화학적 생산물의 제조에 대해 사용되는 경우, 언급된 생화학적 생산물의 생합성이 미생물의 증식 단계 중에 이루어지는 것을 의미한다. 특정 구현예에서, 증식-연계된 생산은 필수일 수 있으며, 이는 언급된 생화학적 생산물의 생합성이 미생물의 증식 단계 동안에 생산되는 필수 생산물 (obligatory product)이라는 것을 의미한다.
본원에서, 용어 "감쇠시킨다 (attenuate)" 또는 이의 문법상 동의어는 효소 또는 단백질의 활성 또는 양을 감소시키는, 낮추는 또는 없애는 것을 의미하는 것으로 의도된다. 효소 또는 단백질의 활성 또는 양적 감쇠는, 감쇠를 통해 활성 또는 양이 소정의 기능에 필요한 임계 수준 미만으로 저하된다면, 완전한 파괴 (complete disruption)를 모방할 수 있다. 그러나, 완전한 파괴, 예를 들어 하나의 경로에 대한 완전한 파괴를 모방하는 효소 또는 단백질의 활성 또는 양적 감쇠는, 별개의 경로를 계속 작동시키기에는 여전히 충분할 수 있다. 예를 들어, 내인성 효소 또는 단백질의 감쇠가 본 발명의 원하는 생산물을 생산하기 위해 동일한 효소 또는 단백질의 완전한 파괴를 모방하기에 충분할 순 있지만, 효소 또는 단백질의 잔류 활성 또는 양은 숙주 세포가 생존, 재생 또는 증식하는데 필요한 경로 등의 다른 경로를 유지시키기에는 여전히 충분할 수 있다. 또한, 효소 또는 단백질의 감쇠는 본 발명의 원하는 생산물의 수율을 높이기에 충분한 수준으로 효소 또는 단백질의 활성 또는 양적 감소, 저하 또는 소실일 수 있으며, 효소 또는 단백질의 완전한 파괴를 반드시 모방하는 것은 아니다.
본 발명의 비-천연성 세포는 안정적인 유전자 변형을 포함할 수 있는데, 이는 이러한 변형을 상실하지 않으면서 5 세대 이상 배양가능한 세포를 의미한다. 일반적으로, 안정적인 유전자 변형은 10 세대 이상 유지되는 변형을 포함하며, 특히 안정적인 변형은 약 25 세대 이상 유지될 것이며, 보다 구체적으로는 안정적인 유전자 변형은 50 세대 이상, 예를 들어 무한정 유지될 것이다.
유전자 파괴의 경우, 특히 유용한 안정적인 변형은 유전자 결손이다. 안정적인 유전자 변형 도입에 유전자 결손을 이용하는 것이, 특히 유전자 변형되기 이전의 표현형으로 복구될 가능성을 낮추기 위해 유용하다. 예를 들어, 안정적인 증식-연계된 생화합물의 생산은, 예를 들어, 대사 변형 세트에 포함된 하나 이상의 반응을 촉매하는 효소에 대한 코딩 유전자를 결손시킴으로써, 달성할 수 있다. 증식-연계된 생화합물의 생산 안정성은, 각각의 파괴된 활성에 대한 복수의 보완적인 복구 (compensatory reversion) 발생 가능성을 현저하게 낮추는, 복수의 결손을 통해 추가적으로 높일 수 있다.
당해 기술 분야의 당업자라면, 본원에 예시된 대사 변형을 포함한 유전자 변형은, E. coli와 같은 적절한 숙주 세포 또는 유기체 및 이의 대응되는 대사 반응 또는 원하는 대사 경로를 위한 유전자 등의, 바람직한 유전 물질에 적합한 소스 세포 또는 유기체에 대해 기술됨을, 이해할 것이다. 그러나, 매우 다양한 유기체들에서 전체 게놈 서열 분석 및 게놈학 분야의 높은 기술 수준을 감안하면, 당해 기술 분야의 당업자라면 본원에 기술된 교시 내용 및 지침을 기본적으로 다른 모든 유기체들에도 적용할 수 있음을 쉽게 알 것이다. 예를 들어, 본원에 예시된 E. coli의 대사 변형은 언급된 종이 아닌 다른 종 유래의 동일한 또는 유사한 코딩 핵산을 병합함으로써, 다른 종에도 쉽게 적용할 수 있다. 이러한 유전자 변형으로는, 예를 들어 일반적으로 종 상동체 (species homolog)의 유전자 변형 등이 있으며, 구체적으로 오르소로그 (ortholog), 파라로그 (paralog) 또는 비-오르소로그 유전자 치환 (non-orthologous gene displacement)을 포함한다.
오르소로그는, 수직 직계 (vertical descent) 관계이면서 여러가지 유기체들에서 실질적으로 동일하거나 상동한 기능을 담당하는, 유전자 또는 유전자들이다. 예를 들어, 마우스 에폭사이드 하이드롤라제와 인간 에폭사이드 하이드롤라제는 에폭사이드는 에폭사이드의 가수분해라는 생물학적 기능 측면에서 오르소로그로 간주할 수 있다. 예를 들어, 유전자들이 상동적이거나 또는 공통 조상으로부터 진화적으로 관련있는 것으로 보기에 충분한 서열 유사성을 공유하는 경우, 이들 유전자들은 수직 직계 관계이다. 또한, 유전자가, 3차 구조를 공유하지만, 1차 서열 유사성이 확인불가한 수준으로 공통 조상으로부터 진화된 것임을 의미하는 충분한 수준의 서열 유사성을 반드시 가지고 있지 않은 경우에도, 오르소로그로 간주할 수 있다. 오르소로그 유전자들은 아미노산 서열 아이덴터티 약 25% 내지 100%의 서열 유사성을 가진 단백질을 코딩할 수 있다. 25% 미만의 아미노산 유사성을 공유하는 단백질을 코딩하는 유전자들 역시, 이들의 3차원 구조에 유사성이 있다면, 수직 직계에 의해 생겨난 것으로 간주할 수 있다. 조직 플라스미노겐 활성인자 및 엘라스타제 등의 세린 프로테아제 패밀리 효소에 속하는 구성원들은 공통 조상으로부터 수직 직계에 의해 생겨난 것으로 간주된다.
오르소로그는, 예를 들어, 진화를 통해 구조적으로 또는 전체 활성 측면에서 분화된 유전자 또는 이로 코딩되는 유전자 산물을 포함한다. 예를 들어, 어떤 종이 2가지 기능을 나타내는 유전자 산물을 코딩하고 있으며 이 기능들이 제2의 종에서 별개의 유전자들로 분리되어 있다면, 이들 유전자 3개와 이의 대응되는 산물은 오르소로그로 간주한다. 당해 기술 분야의 당업자라면, 생화학적 산물 생산시, 비-천연성 세포를 구축하기 위해 도입 또는 파괴시킬 대사 활성을 가지고 있는 오르소로그 유전자를 선택해야 함을, 알 것이다. 분리가능한 활성들을 나타내는 오르소로그의 예는, 개개 활성이 2종 이상의 종들에서 또는 하나의 종에서 개별 유전자 산물로 분리되어 있는 경우이다. 구체적인 예는, 세린 프로테아제 활성을 가진 2가지 타입, 즉 엘라스타제 단백질 분해 활성과 플라스미노겐 단백질 분해 활성이, 플라스미노겐 활성인자 및 엘라스타제로서 개별 분자로 분리된 경우이다. 두 번째 예는, 마이코플라스마 5'-3' 엑소뉴클레아제 및 드로소필라 DNA 중합효소 III 활성이 분리된 경우이다. 첫 번째 종 유래의 DNA 중합효소는, 2번째 종 유래의 엑소뉴클레아제 또는 중합효소 중 어느 하나 또는 이들 둘다에 대해 오르소로그인 것으로 간주할 수 있으며, 그 역도 성립할 수 있다.
이와는 반대로, 파라로그는, 예를 들어, 복제 및 이후 진화적 분화 관계에 있는 상동체이며, 기능이 유사하거나 또는 공통적이지만, 동일하진 않다. 파라로그는, 예를 들어, 동일 종 또는 다른 종으로부터 기원하거나 또는 유래할 수 있다. 예를 들어, 마이크로솜 에폭사이드 하이드롤라제 (에폭사이드 하이드롤라제 I)와 가용성 에폭사이드 하이드롤라제 (에폭사이드 하이드롤라제 II)는, 이들이 별개의 반응을 촉매하고 동일 종에서 다른 기능을 가지고 있는, 공통 조상으로부터 함께 진화된 2종의 별개의 효소이므로, 파라로그로 간주할 수 있다. 파라로그는 서로 유의미한 수준의 서열 유사성을 보이는 동일한 종으로부터 유래된 단백질들이므로, 이들은 상동적이거나 또는 공통 조상으로부터 함께 진화된 관계임을 시사한다. 파라로그 단백질 패밀리 그룹으로는 HipA 상동체, 루시퍼라제 유전자, 펩티다제 등이 있다.
비-오르소로그 유전자 치환 (nonorthologous gene displacement)은 어떤 종 유래의 비-오르소로그 유전자가 다른 종에서 언급된 유전자의 기능을 치환할 수 있는 것을 의미한다. 치환은, 예를 들어 여러가지 종들에서 언급된 기능과 비교해, 기원 종에서 동일하거나 또는 유사한 작용을 실질적으로 수행할 수 있는 것을 포함한다. 일반적으로, 비-오르소로그 유전자 치환은 언급된 기능을 코딩하는 공지된 유전자와 구조적으로 관련있는 것으로 구분할 수 있지만, 구조적으로 관련성은 낮지만 기능적으로 유사한 유전자 및 이의 유전자 산물도 그럼에도 불구하고 여전히 본 발명에 사용되는 용어의 의미에 포함될 것이다. 기능 유사성에는, 예를 들어 치환하고자 하는 기능을 코딩하는 유전자에 대해, 비-오르소로그 유전자 산물의 활성부 또는 결합부에서 어느 정도 이상의 구조 유사성이 요구된다. 따라서, 비-오르소로그 유전자는 예를 들어 파라로그 또는 비-관련 유전자 (unrelated gene)를 포함한다.
이에, 원하는 생산물의 생합성 능력을 갖춘 본 발명의 비-천연성 세포를 동정하고 구축함에 있어, 당해 기술 분야의 당업자는, 본 발명에 제공된 교시 내용 및 지침을 특정 종들에 적용하여, 대사 변형의 식별이 오르소로그의 동정 및 이의 함유 또는 불활성화를 포함할 수 있음을 알 것이다. 당해 기술 분야의 당업자라면, 또한, 파라로그 및/또는 비-오르소로그 유전자 치환이, 유사하거나 또는 실질적으로 유사한 대사 반응을 촉매하는 효소를 코딩하는 언급된 미생물에 존재하는 한, 진화 관계인 유전자들을 이용할 수 있다. 마찬가지로, 유전자를 파괴하는 경우, 진화 관계인 유전자들도 숙주 세포에서 파괴 또는 결손시켜, 파괴에 표적이 되는 효소 활성들의 기능적 중복성 (functional redundancy)을 줄이거나 또는 없앨 수 있다.
오르소로그, 파라로그 및 비-오르소로그 유전자 치환은 당해 기술 분야의 당업자에게 널리 공지된 방법으로 결정할 수 있다. 예를 들어, 2종의 폴리펩타이드에 대한 핵산 또는 아미노산 서열을 조사함으로써, 비교 서열들 간의 서열 동일성 및 유사성을 확인한다. 이러한 유사성을 토대로, 당해 기술 분야의 당업자는 이들 단백질들이 공통 조상으로부터 진화된 관계임을 의미할 만큼 유사성이 충분히 높은지를 결정할 수 있다. 당해 기술 분야의 당업자들에게 널리 공지된 알고리즘, 예를 들어 Align, BLAST, Clustal W 등으로 원 (raw) 서열의 유사성 또는 동일성을 비교 및 확인하고, 또한, 서열에서 갭의 존재나 유의 수준을 결정하여, 가중치 (weight) 또는 스코어를 할당할 수 있다. 이들 알고리즘은 또한 당해 기술 분야에 공지되어 있으며, 뉴클레오타이드 서열 유사성 또는 동일성 결정에 마찬가지로 적용가능하다. 관계 (relatedness)를 정할 만큼 충분한 유사성에 대한 매개변수들은, 널리 공지된 통계학적 유사성 계산법, 또는 랜덤 폴리펩타이드에서 유사한 매칭을 발견할 확률, 그리고 확인된 매칭의 유의 수준을 토대로 산출한다. 2 이상 서열들에 대한 전산적 비교는, 또한, 필요한 경우, 당해 기술 분야의 당업자에 의해 시각적으로 최적화될 수 있다. 관련 유전자 산물 또는 단백질은 높은 유사성, 예를 들어 25% 내지 100%의 서열 동일성을 가지는 것으로 볼 수 있다. 비-관련 단백질은, 충분한 크기의 데이터베이스를 검색한다면, 우연히 발생할 것으로 예상되는 수준과 기본적으로 동일한, 동일성 (약 5%)을 가질 수 있다. 5% 내지 24% 사이의 서열은, 비교되는 서열들이 관련성이 있다고 판단할 만큼 충분한 상동성을 보이거나 또는 그렇지 않을 수 있다. 데이터 세트의 크기를 감안해 이러한 매칭의 유의 수준을 결정하기 위한 추가적인 통계학적 분석을 수행하여, 이들 서열들의 관련성을 결정할 수 있다.
BLAST 알고리즘을 사용해 2 이상의 서열들의 관계를 확인하기 위한 매개변수의 예는, 다음과 같을 수 있다. 간략하게는, 아미노산 서열 정렬은 BLASTP 버전 2.0.8 (1999년 1월 5일) 및 하기의 매개변수들을 사용하여 수행할 수 있다: 매트릭스: 0 BLOSUM62; 갭 오픈 (gap open): 11; 갭 연장 (gap extension): 1; x_드롭오프: 50; 예상: 10.0; 문자 크기: 3; 필터: 온 (on). 핵산 서열 정렬은 BLASTN 버전 2.0.6 (1998년 9월 16일) 및 하기의 매개변수들을 사용하여 수행할 수 있다: 매치: 1; 미스매치: -2; 갭 오픈: 5; 갭 연장: 2; x_드롭오프: 50; 예상: 10.0; 문자 크기: 11; 필터: 오프. 당해 기술 분야의 당업자는, 예를 들어 비교시 엄격성을 높이거나 또는 낮추고, 2 이상 서열의 관계를 정하기 위해, 상기한 매개변수에 어떤 변화를 가할 수 있음을 알 것이다.
일 구현예에서, 본 발명은 야생형 또는 모 (parent) 알데하이드 데하이드로게나제의 변이체인 알데하이드 데하이드로게나제를 제공한다. 본 발명의 알데하이드 데하이드로게나제는 아실-CoA를 이의 대응되는 알데하이드로 변환한다. 또한, 이 효소는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 옥시도리덕타제로 지칭할 수도 있다. 이러한 본 발명의 알데하이드 데하이드로게나제는 반응 1.2.1.b, 옥시도리덕타제 (아실-CoA -> 알데하이드)로서 분류할 수 있는데, 여기서 처음 숫자 3개는 기질 특이성과 독립적인 일반적인 변환 타입을 나타내는 효소 위원회 번호 (Enzyme Commission number)에서의 앞에 오는 숫자 3개이다. 본 발명의 알데하이드 데하이드로게나제의 효소 변환의 예로는, 비-제한적으로, 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드 (3-HBal로도 지칭됨)로의 변환 (도 1 참조), 및 4-하이드록시부티릴-CoA에서 4-하이드록시부티르알데하이드로의 변환 (도 2 참조)을 포함한다. 본 발명의 알데하이드 데하이드로게나제를 이용해, 3-하이드록시부티르알데하이드 (3-HBal), 1,3-부탄다이올 (1,3-BDO), 4-하이드록시부티르알데하이드 (4-HBal), 1,4-부탄다이올 (1,4-BDO) 또는 다운스트림 산물과 같은 다른 바람직한 생산물, 예를 들어, 이의 에스테르 또는 아미드 화합물을, 적합한 대사 경로를 가진 미생물 유기체와 같은 세포에서 또는 시험관내에서 제조할 수 있다. 예를 들어, 1,3-BDO를 생체내 또는 시험관내에서 산과 반응시켜, 예를 들어 리파제를 사용해 에스테르로 변환할 수 있다. 이러한 에스테르 화합물은 뉴트라수티컬 (nutraceutical), 의학적 및 식품 용도를 가질 수 있으며, 1,3-부탄다이올의 R-형태는 (아세트알데하이드 화학 합성 경로에 의해 석유 또는 에탄올로부터 제조되는 S-형태 또는 라세믹 혼합물과 비교해) 에너지원으로서 동물 및 인간에서 최상으로 이용되는 형태이기 때문에 (예, (미국에서 일반적으로 안전하다고 인정되는 물질 (Generally Recognized As Safe, GRAS)로 승인된 (R)-3-하이드록시부틸-R-1,3-부탄다이올 모노에스테르와 같은 케톤 에스테르, 및 (R)-3-하이드록시부티레이트 글리세롤 모노에스테르 또는 다이에스테르), 이 형태가 유용하다. 케톤 에스테르는 경구로 전달할 수 있으며, 이 에스테르 화합물은 신체에 의해 이용되는 R-1,3-부탄다이올로 해리된다 (예, WO2013150153 참조). 따라서, 본 발명은 개선된 효소 경로 및 미생물을 제공하여, 고도로 농화된 또는 기본적으로 거울상이성질체 측면에서 순수하며 추가적으로 부산물에 대해 개선된 순도 품질을 가진 1,3-부탄다이올, 즉 R-1,3-부탄다이올의 개선된 조성물을 제공하는데, 특히 유용하다.
부틸렌 글리콜이라고도 지칭되는 1,3-부탄다이올은 식품 원료, 식품 성분, 착향제, 착향제용 용매 또는 용해제, 안정제, 유화제 및 항-미생물제 및 보존제로서 직접 사용하는 등의, 추가적인 식품 관련 용도를 가진다. 1,3-부탄다이올은 비경구 약물 용매로서 제약 산업에서 사용된다. 1,3-부탄다이올은, 연화제 (emollient), 불용성 물질의 결정화를 방지하는 보습제 (humectant), 향료와 같은 수-난용성 물질에 대한 용해제, 및 항-미생물제 및 보존제로서 화장품에 유용성을 가진다. 예를 들어, 이는 보습제로서, 특히 헤어 스프레이제 및 세팅 로션에 보습제로서 사용할 수 있으며; 이는 에센셜 오일로부터 향 감소를 억제하고, 미생물에 의한 부패를 방지하며, 벤조에이트의 용매로서 사용된다. 1,3-부탄다이올은 0.1% 내지 50% 이상의 농도로 사용할 수 있다. 이는 헤어 및 샤워 제품, 눈 및 얼굴 메이크업, 향수, 개인 위생 제품 및 면도 및 피부 관리 제품에 사용된다 (예, the Cosmetic Ingredient Review board's report: "Final Report on the Safety Assessment of Butylene Glycol, Hexylene Glycol, Ethoxydiglycol, and Dipropylene Glycol", Journal of the American College of Toxicology, Volume 4, Number 5, 1985를 참조하며, 이는 원용에 의해 본 명세서에 포함됨). 이 보고서에는 화장품에서 1,3-부탄다이올 (부틸렌 글리콜)의 특수 용도 및 농도가 제시되어 있으며; 예를 들어, 이 보고서의 표 2 "제품 제형 데이터"를 참조한다.
일 구현예에서, 본 발명은 다음으로부터 선택되는 단리된 핵산 분자를 제공한다: (a) 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열을 코딩하고, 위치 I66에 대응하는 아미노산 치환을 포함하는, 핵산 분자; (b) 고 엄격성 혼성화 조건 (highly stringent hybridization condition)에서 (a)의 핵산에 혼성하고, 위치 I66에 대응하는 아미노산 치환을 코딩하는 핵산 서열을 포함하는, 핵산 분자; 및 (c) (a) 또는 (b)에 상보적인 핵산 분자.
본 발명의 핵산에 대한 일부 구현예에서, 위치 I66에서의 아미노산 치환은 표 1, 2 및/또는 3에 기재된 아미노산 치환이다. 일부 구현예에서, 아미노산 서열은, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 언급된 아미노산 변이 위치에서의 하나 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 서열은, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함한다.
본 발명의 핵산 분자에 대한 일부 구현예에서, 하나 이상의 아미노산 치환을 제외한, 아미노산 서열은, 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 이와 동일하다. 일부 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 변이체의 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함한다. 일부 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 변이체의 아미노산 치환을 포함한다.
일 구현예에서, 단리된 핵산 분자는 다음으로부터 선택할 수 있다: (a) 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열을 코딩하되 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 핵산 분자; (b) 고 엄격성 혼성화 조건에서 (a)의 핵산에 혼성하고, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 코딩하는 핵산 서열을 포함하는, 핵산 분자; (c) 루프 A (서열번호 5) 및/또는 루프 B (서열번호 6)의 컨센서스 서열을 포함하는 아미노산 서열을 코딩하되 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 핵산 분자; 및 (d) (a) 또는 (b)에 상보적인 핵산 분자. 일 구현예에서, 이들 핵산 분자에 의해 코딩되는 아미노산 서열은, 하나 이상의 아미노산 치환을 제외한 서열이, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 이와 동일하다. 아미노산 서열은 표 1, 2 및/또는 3에 기재된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개 이상, 예를 들어, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 또는 43개를 포함할 수 있으며, 즉, 전체 치환을 모두 포함할 수 있다.
또한, 본 발명은 본 발명의 핵산 분자를 포함하는 벡터를 제공한다. 일 구현예에서, 벡터는 발현 벡터이다. 일 구현예에서, 벡터는 이중 가닥 DNA를 포함한다.
또한, 본 발명은 본 발명의 알데하이드 데하이드로게나제 폴리펩타이드를 코딩하는 핵산을 제공한다. 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는 또한 서열번호, GenBank 및/또는 GI 번호로 표시되는 핵산에 혼성하는 핵산 분자, 또는 서열번호, GenBank 및/또는 GI 번호로 표시되는 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자를 포함할 수 있다. 혼성화 조건은 본원에 기술된 바와 같이 당해 기술 분야의 당업자들에게 잘 알려진 고 엄격성 혼성화 조건, 중간 엄격성 혼성화 조건 또는 저 엄격성 혼성화 조건을 포함할 수 있다. 마찬가지로, 본 발명에 사용될 수 있는 핵산 분자는 서열번호, GenBank 및/또는 GI 번호로 표시되는 핵산, 또는 서열번호, GenBank 및/또는 GI 번호로 표시되는 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자에 대해 특정 %의 서열 동일성을 가진 것으로 기술될 수 있다. 예를 들어, 핵산 분자는 본원에 기술된 핵산에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 가질 수 있거나, 또는 이와 동일할 수 있다.
엄격한 혼성화는 혼성된 폴리뉴클레오티드가 안정적으로 유지되는 조건을 나타낸다. 당해 기술 분야의 당업자들에게 공지된 바와 같이, 혼성된 폴리뉴클레오티드의 안정성은 하이브리드의 용융 온도 (Tm)를 반영한다. 일반적으로 혼성된 폴리뉴클레오티드의 안정성은 염 농도, 예를 들어 소듐 이온 농도 및 온도에 따라 달라진다. 혼성화 반응은 저 엄격성 조건에서 수행할 수 있으며, 이후 조건을 달리하여, 그러나 엄격성이 더 높은 조건에서 세척하여 수행할 수 있다. 혼성화에서 엄격성은 이러한 세척 조건에 관한 것이다. 고 엄격성 혼성화는 65℃에서 0.018M NaCl 중에서 안정적으로 혼성된 폴리뉴클레오티드를 형성하는 핵산 서열에 대해서만 혼성화를 허용하는 조건을 포함하며, 예를 들어, 하이브리드가 65℃, 0.018M NaCl 중에서 안정적이지 않다면, 본원에서 간주되는 바와 같이 고 엄격성 조건에서 안정적이지 않을 것이다. 고 엄격성 조건은, 예를 들어, 50% 포름아미드, 5X 덴하르트 용액, 5X SSPE, 0.2% SDS 및 42℃에서 혼성한 다음 0.1X SSPE 및 0.1% SDS에서 65℃ 하에 세척함으로써, 제공할 수 있다. 본원에 기술된 핵산 서열을 기술하기 위해 고 엄격성 혼성화 조건 이외의 혼성화 조건도 이용할 수 있다. 예를 들어, 중간 엄격성 혼성화 (moderately stringent hybridization)라는 표현은 50% 포름아미드, 5X 덴하르트 용액, 5X SSPE, 0.2% SDS 및 42℃에서 혼성한 다음 0.2X SSPE 및 0.2% SDS에서 42℃ 하에 세척하는 조건과 동일한 조건을 의미한다. 저 엄격성 혼성화라는 표현은 10% 포름아미드, 5X 덴하르트 용액, 6X SSPE, 0.2% SDS 및 22℃에서 혼성한 다음 1X SSPE 및 0.2% SDS에서 37℃ 하에 세척하는 조건과 동일한 조건을 의미한다. 덴하르트 용액은 1% Ficoll, 1% 폴리비닐피롤리돈 및 1% 소 혈청 알부민 (BSA)을 포함한다. 20X SSPE (소듐 클로라이드, 소듐 포스페이트, 에틸렌 다이아민 테트라아세트산 (EDTA))는 3M 소듐 클로라이드, 0.2M 소듐 포스페이트 및 0.025 M (EDTA)를 포함한다. 그외 적합한, 저, 중간 및 고 엄격성 혼성화 완충제 및 조건들은 당해 기술 분야의 당업자들에게 잘 알려져 있으며, 예를 들어, Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에 기술되어 있다.
본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는 본원에 기술된 뉴클레오티드 서열과 적어도 특정한 서열 동일성을 가질 수 있다. 이에, 본 발명의 일부 측면에서, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는, 서열번호, GenBank 및/또는 GI 번호에 의해 본원에 기술된 핵산, 또는 서열번호, GenBank 및/또는 GI 번호에 의해 본원에 기술된 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자에 대해, 적어도 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상 동일한, 뉴클레오티드 서열을 가지거나, 또는 이와 동일하다.
서열 동일성 (상동성 또는 유사성으로도 알려져 있음)은 2종의 핵산 분자들 간의 또는 2종의 폴리펩타이드들 간의 서열 유사성을 의미한다. 동일성은 비교 목적으로 정렬될 수 있는 각 서열에서 위치를 비교함으로써 결정할 수 있다. 비교되는 서열에서 한 위치에 동일한 염기 또는 아미노산이 존재한다면, 그 분자는 그 위치에서 동일한 것이다. 서열들 간의 동일성 정도는 서열들 간에 의해 공유되는 매칭되거나 또는 상동한 위치 개수에 대한 함수이다. 서열 동일성 %를 결정하기 위한 서열 2종 간의 정렬은, 예를 들어, Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에 기술된 바와 같이, 당해 기술 분야에 공지된 소프트웨어 프로그램을 사용해 수행할 수 있다. 바람직하게는, 정렬시 디폴트 파라미터를 적용한다. 사용될 수 있는 당해 기술 분야에 잘 알려진 한가지 정렬 프로그램은 디폴트 파라미터로 설정된 BLAST 세트이다. 구체적으로, 프로그램은, 다음과 같은 디폴트 파라미터로 설정된 BLASTN 및 BLASTP이다: 유전자 코드 = 표준; 필터 = 없음; 가닥 = 양쪽; 컷오프 = 60; 기대 = 10; 매트릭스 = BLOSUM62; 기술 = 서열 50개; 분류 = 높은 점수 (HIGH SCORE); 데이터베이스 = 비-중복 (non-redundant), GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + SwissProtein + SPupdate + PIR. 이들 프로그램들에 대한 상세 내용은 국립 생명공학 정보 센터에서 확인할 수 있다 (Altschul et al., " J. Mol . Biol. 215:403-410 (1990) 참조).
일부 구현예에서, 핵산 분자는 단리된 핵산 분자이다. 일부 구현예에서, 단리된 핵산 분자는 기준 폴리펩타이드의 변이체를 코딩하는 핵산 분자이며, 여기서 (i) 기준 폴리펩타이드는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4 (서열번호 7-123)에 열거된 아미노산 서열을 가지며, (ii) 변이체는 서열번호 1, 서열번호 2 또는 서열번호 3 또는 표 3에 기재된 것에 비해 하나 이상의 아미노산 치환을 포함하며, (iii) 하나 이상의 아미노산 치환은 표 1-3에 나타낸 아미노산 치환들로부터 선택된다. 표 1-3은 서열번호 1, 서열번호 2, 서열번호 3의 예시적인 변이체 또는 표 4에서의 변이체로 구성된 비-제한적인 목록을 제공한다. 일 구현예에서, 표 1-3의 각각의 변이체에서, 지정된 위치(들)를 제외한 모든 위치들은 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 것과 동일하다. 아미노산 치환들은, 오리지날 아미노산의 정체를 표시하는 문자, 그 다음으로 서열번호 1, 2, 3 또는 표 4에서 치환되는 아미노산의 위치를 나타내는 번호, 그리고 그 다음으로 치환된 아미노산의 정체를 나타내는 문자로 표시된다. 예를 들어, "D12A"는, 서열번호 1 또는 2에서 12번 위치의 아스파르트산이 알라닌으로 치환되는 것을 의미한다. 아미노산을 나타내기 위해 사용되는 단문자 코드는 당해 기술 분야에 공지된 표준 코드이다. 표 1-3에서 일부 변이체들은 치환 목록에 표시된 2 이상의 변형을 포함한다. 하나 이상의 아미노산 치환은 표 1-3에 열거된 변이체들 중 임의의 하나 또는 표 1-3에 열거된 2종 이상의 변이체들의 임의 조합으로부터 선택될 수 있다. 표 1-3의 단일 변이체로부터 선택하는 경우, 제조되는 변이체는 언급된 치환들 모두 또는 언급된 전체 치환보다 적은 수의 치환 등의, 선택된 변이체의 하나 이상의 치환을 임의 조합으로 포함할 수 있다. 치환이 표 1-3에서의 2 이상의 변이체들로부터 선택되는 경우, 제조되는 변이체는 언급된 모든 치환들 또는 언급된 전체 치환보다 적은 수의 치환 등의, 선택된 변이체의 하나 이상의 치환을 임의 조합으로 포함할 수 있다. 예를 들어, 제조되는 변이체는 표 1-3에서의 단일 변이체로부터 유래되는 1, 2, 3 또는 4개의 치환을 포함할 수 있다. 추가적인 예로서, 제조되는 변이체는 표 1-3의 1, 2, 3, 4, 5 또는 그 이상의 선택된 변이체들로부터 선택되는 치환 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25 또는 그 이상을 포함할 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3에서 선택된 변이체의 표시된 치환들을 모두 포함한다. 일부 구현예에서, 제조되는 변이체는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 것과 하나 이상의 아미노산 치환 차이를 가지지만, 아미노산 치환은 25개 미만, 20개 미만, 10개 미만, 5개 미만, 4개 미만 또는 3개 미만이다. 일부 구현예에서, 제조되는 변이체는, 언급된 아미노산 치환에서만 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 서열과 상이한, 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하거나, 그 서열로 필수적으로 구성되거나, 또는 그 서열로 구성된다.
일부 구현예에서, 핵산 분자는 기준 폴리펩타이드의 변이체를 코딩하는 단리된 핵산 분자이며 (기준 폴리펩타이드는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 아미노산 서열을 가짐), 여기서 변이체는 (i) 표 1-3으로부터 선택되는 대응되는 변이체의 하나 이상의 아미노산 치환을 포함하고, (ii) 대응되는 변이체와 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상 또는 100%의 서열 동일성을 가진다. 제2 변이체가 대응되는 변이체와 100%의 서열 동일성을 가지는 경우, 제2 변이체는 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하며, 아미노 말단 및 카르복시 말단 중 어느 하나 또는 양쪽에 하나 이상의 부가적인 아미노산을 가지거나 또는 가지지 않을 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 대응되는 변이체에 대해 80% 이상, 85% 이상, 90% 이상 또는 95% 이상의 서열 동일성을 가지며; 일부 경우에, 동일성은 적어도 90% 이상 또는 그 보다 높다. 제조되는 변이체가 표 1-3으로부터 선택되는 대응되는 변이체에 대해 동일성이 100% 미만일 경우, 대응되는 변이체에 표시된 하나 이상의 아미노산 치환의 위치는 이동될 수 있지만 (하나 이상의 아미노산이 삽입 또는 결손된 경우), 제조되는 변이체에 여전히 포함될 수 있다. 예를 들어, "D12A" (서열번호 1 또는 2에서 12번 위치)에 대응하는 아스파르트산에서 알라닌으로의 치환이, 제조되는 변이체의 다른 위치에 여전히 존재할 수 있다. 아미노산이 비록 다른 위치이지만 지정된 치환에 해당하는지는 당해 기술 분야에서 잘 알려진 바와 같이 서열 정렬에 의해 확인할 수 있다. 일반적으로, 측면 서열이 다른 폴리펩타이드의 상동적인 서열과 정렬되도록, 치환된 아미노산의 측면에 위치하는 아미노산에 대해 동일성 또는 유사성을 보여주는 정렬은, 치환된 아미노산을 표 1-3의 대응되는 변이체에 대해 국소적으로 위치시킬 수 있어, 소정의 폴리펩타이드 체인의 비록 이동된 번호 위치에서 치환을 수행하기 위한 대응되는 위치를 결정할 수 있을 것이다. 일 구현예에서, 치환된 위치를 포함하여 적어도 3-15개의 아미노산을 포함하는 영역은, 대응되는 변이체 서열에서 치환된 아미노산의 위치를 포함하여, 상대적으로 높은 동일성% (예, 90%, 95% 또는 100% 동일성)로 대응되는 변이체 서열과 국소 정렬될 것이다. 일부 구현예에서, 심지어 폴리펩타이드 체인의 다른 물리적 위치에서 발생한다면, 폴리펩타이드의 서열을 디폴트 파라미터를 적용한 BLASTP 정렬 알고리즘을 이용하는 경우 대응되는 변이체 서열의 지정된 위치에서 동일한 매치 또는 유사한 아미노산을 가진 대응되는 변이체와 정렬을 비교한다면, 유사한 아미노산이 정렬 알고리즘의 디폴트 파라미터를 적용해 대상 변이체 위치와 정렬하기에 충분한 화학적 특성을 가진 것으로 보이는 경우, 표 1-3으로부터 선택되는 대응되는 변이체에 의해 표시된 하나 이상의 아미노산 치환 (예, 아미노산 치환들 전부 또는 그보다는 적은 수의 아미노산 치환)이 소정의 변이체에 존재하는 것으로 간주된다.
일부 구현예에서, 본 발명의 핵산 분자는 본원의 다양한 임의 구현예과 연계하여 기술된 핵산에 상보적이다.
본 발명의 핵산 또는 본 발명의 폴리펩타이드는 야생형 모 세포, 예를 들어 서열번호 1, 2 또는 3과 같은 모 서열 또는 표 4에 기술된 서열을 배제할 수 있는 것으로 이해된다. 당해 기술 분야의 당업자라면 당해 기술 분야에 잘 알려진 사실을 토대로 야생형 모 서열의 의미를 쉽게 이해할 것이다. 본 발명의 이러한 핵산이 자연에서 발견되는 천연 아미노산 서열을 코딩하는 핵산 서열은 제외할 수 있는 것으로 또한 이해된다. 마찬가지로, 본 발명의 폴리펩타이드는 자연에서 발견되는 아미노산 서열을 배제할 수 있다. 즉, 특정 구현예에서, 본 발명의 핵산 또는 폴리펩타이드는 본원에 기술된 바와 같으며, 단, 코딩된 아미노산 서열은 야생형 모 세포 또는 천연 아미노산 서열이 아니거나 및/또는 핵산 서열은 야생형 또는 천연 핵산 서열이 아니다. 천연 아미노산 또는 핵산 서열은 자연에서 발견되는 바와 같이 천연 유기체에서 발견되는 서열과 관련있는 것으로서 당해 기술 분야의 당업자에게 이해된다. 즉, 동일한 상태로 발견되지 않거나 또는 천연 유기체에서와 동일한 뉴클레오티드 또는 코딩된 아미노산 서열을 가진 것으로 발견되지 않는, 핵산 또는 아미노산 서열은 본 발명의 핵산 및/또는 아미노산 서열의 의미에 포함된다. 예를 들어, 본원에 기술된 변이체를 비롯하여, 모 서열로부터 하나 이상의 뉴클레오티드 또는 아미노산 위치가 변형된 핵산 또는 아미노산 서열은, 본 발명의 핵산 또는 아미노산 서열이 비-천연성이라는 의미에 포함된다. 본 발명의 단리된 핵산 분자에는 핵산 서열을 포함하는 천연 염색체 (naturally occurring chromosome)가 제외되며, DNA 결합 단백질과 같은 천연 세포에서 발견되는 다른 분자, 예를 들어 진핵생물 세포 안에서 염색체에 결합하는 히스톤 등의 단백질을 또한 제외될 수 있다.
이에, 본 발명의 단리된 핵산 서열은 천연 핵산 서열과 물질적 및 화학적 차이를 가진다. 본 발명의 단리된 또는 비-천연성 핵산은 자연에서 발견되는 천연 핵산 서열의 공유 결합 또는 비-공유 결합과 같은 화학 결합들 중 일부 또는 전부를 포함하지 않거나 또는 필수적으로 가지지 않는다. 본 발명의 단리된 핵산은, 따라서, 예를 들어, 염색체에서 발견되는 천연 핵산 서열과는 다른 화학적 구조를 가짐으로써, 천연 핵산과 차이를 가진다. 예를 들어, 포스포다이에스테르 결합을 절단하여 천연 염색체로부터 단리된 핵산 서열을 분리함으로써, 다른 화학적 구조가 수득될 수 있다. 본 발명의 단리된 핵산은 또한 원핵생물 또는 진핵생물 세포에서 염색체 DNA에 결합하는 단백질로부터 핵산을 단리 또는 분리함으로써 천연 핵산과 상이할 수 있으며, 따라서 다른 비-공유 결합에 의해 천연 핵산과 상이할 수 있다. 원핵생물 기원의 핵산과 관련하여, 본 발명의 비-천연성 핵산은 염색체의 천연적인 화학 결합들 중 일부 또는 전부, 예를 들어 폴리머라제 또는 염색체 구조 단백질과 같은 DNA 결합 단백질에의 결합을 반드시 포함하는 것이 아니거나, 또는 슈퍼코일드형과 같은 고차 구조로 존재하지 않는다. 진핵생물 기원의 핵산과 관련하여, 본 발명의 비-천연성 핵산은 또한 동일한 내부 핵산 화학 결합 또는 염색질에서 발견되는 구조 단백질과의 화학 결합을 포함하지 않는다. 예를 들어, 본 발명의 비-천연성 핵산에는 히스톤 또는 스캐폴드 단백질이 화학적으로 결합되어 있지 않으며, 센트로미어 또는 텔로미어 형태로 포함되지 않는다. 즉, 본 발명의 비-천연성 핵산은, 천연적으로 발견되는 핵산 서열과는 다른 반 데르 발스 상호작용, 수소작용, 이온 결합 또는 정전기적 결합 및/또는 공유 결합을 포함하거나 또는 결여되어 있어, 천연 핵산과 화학적으로 구별된다. 이러한 결합 차이는 핵산의 별개 영역에서 내부적으로 생길 수 있거나 (즉, cis), 또는 이러한 결합 차이는 트랜스로, 예를 들어, 염색체 단백질과의 상호작용에서 발생할 수 있다. 진핵생물 기원의 핵산의 경우, cDNA 내부 화학 결합은 염색체 DNA 상의 유전자의 공유 결합, 즉 서열과 다르므로, cDNA는 단리된 또는 비-천연성 핵산인 것으로 간주된다. 이에, 당해 기술 분야의 당업자라면, 단리된 또는 비-천연성 핵산이 천연 핵산과 구별됨을 알 것이다.
일 구현예에서, 본 발명은 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열을 포함하되 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하는, 단리된 폴리펩타이드를 제공한다. 일 구현예에서, 위치 I66에서 아미노산 치환은 표 1, 2 및/또는 3에 언급된 아미노산 치환이다. 일부 구현예에서, 아미노산 서열은, 아미노산 위치 I66에 대응되는 치환과 더불어, 표 1, 2 및/또는 3에 언급된 아미노산 변이 위치에서 하나 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 서열은, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함한다.
다른 구현예에서, 본 발명은, 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하고; 위치 I66에 대응되는 아미노산 치환을 제외한 아미노산 서열이 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 동일한, 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열을 포함하는 단리된 폴리펩타이드를 제공한다.
본 발명의 단리된 폴리펩타이드에 대한 일부 구현예에서, 위치 I66에서의 아미노산 치환은 표 1, 2 및/또는 3에 기재된 아미노산 치환이다. 일부 구현예에서, 아미노산 서열은, 아미노산 위치 I66에 대응되는 치환과 더불어, 표 1, 2 및/또는 3에 언급된 아미노산 변이 위치에서의 하나 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 서열은, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 서열은 1-100 아미노산 위치들에서 보존적인 아미노산 치환을 더 포함하며, 이러한 위치는 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환이 아닌 다른 위치이다.
본 발명의 단리된 폴리펩타이드에 대한 일부 구현예에서, 아미노산 서열은 모 서열과 비교해 2-300 아미노산 위치들에서 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 제외한 변형을 포함하지 않으며, 이러한 위치는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열들 중 2, 3, 4 또는 5개들에서 동일한 위치로부터 선택된다. 일 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함한다. 특정 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 변이체의 아미노산 치환을 포함한다.
일 구현예에서, 단리된 폴리펩타이드는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열을 포함하되, 그 아미노산 서열은 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함한다. 일 구현예에서, 단리된 폴리펩타이드는 루프 A의 컨센서스 아미노산 서열 (서열번호 5) 및/또는 루프 B의 컨센서스 아미노산 서열 (서열번호 6)을 포함한다.
다른 구현예에서, 단리된 폴리펩타이드는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열을 포함하되, 그 아미노산 서열은 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함하고, 이러한 하나 이상의 아미노산 치환을 제외한 아미노산 서열은 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 이와 동일하다. 일 구현예에서, 아미노산 서열은 1-100 아미노산 위치들에서 보존적인 아미노산 치환을 더 포함하되, 그 위치는 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환과는 다른 위치이다. 다른 구현예에서, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 제외한 아미노산 서열은 모 서열과 비교해 2-300 아미노산 위치들에서 다른 변형을 포함하지 않으며, 그 위치는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열들 중 2, 3, 4 또는 5개들에서 동일한 위치들로부터 선택된다. 일 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16, 또는 그 이상을 포함하고, 예를 들어, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 또는 43개, 즉, 최대한으로는 치환이 존재하는 모든 아미노산 위치들을 포함한다.
일 구현예에서, 본 발명의 폴리펩타이드는 알데하이드 데하이드로게나제를 코딩한다. 일 구현예에서, 폴리펩타이드는 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환할 수 있다. 일 구현예에서, 폴리펩타이드는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 일 구현예에서, 폴리펩타이드는 모 폴리펩타이드와 비교해 더 높은 활성을 가진다. 일 구현예에서, 폴리펩타이드는 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가진다. 일 구현예에서, 폴리펩타이드는 아세틸-CoA에 비해 3-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가진다. 일 구현예에서, 폴리펩타이드는 아세틸-CoA와 비교해 4-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가진다. 일 구현예에서, 폴리펩타이드는 세포 또는 세포 추출물에서 부산물을 적게 생성한다. 특정 구현예에서, 부산물은 에탄올 또는 4-하이드록시-2-부타논이다. 일 구현예에서, 폴리펩타이드는 모 폴리펩타이드와 비교해 더 높은 kcat를 가진다.
일부 구현예에서, 본 발명은, 서열번호 1, 2 또는 3 또는 표 4에 기재된 서열과 같은 본원에 기술된 아미노산 서열을 가지며; 아미노산 서열아 표 1, 2 및/또는 3에 기재된 하나 이상의 변이 아미노산 위치를 포함하는, 단리된 폴리펩타이드를 제공한다. 특히, 이러한 폴리펩타이드는, 아실-CoA를 대응되는 알데하이드로, 예를 들어, 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 또는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있는, 알데하이드 데하이드로게나제를 코딩한다. 일부 측면에서, 본 발명의 단리된 폴리펩타이드는, 표 1, 2 및/또는 3에 기재된 하나 이상의 변이 아미노산 위치를 제외하고는, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 가지거나 또는 동일한 아미노산 서열을 포함한다. 변이 아미노산 위치는 20개의 천연 아미노산, 변이 아미노산 위치에 대응되는 위치에서의 야생형 또는 모 서열의 보존적인 치환, 또는 본원에서 표 1, 2 및/또는 3에서 본원에 기술된 바와 같은 변이 아미노산 위치에서의 특정 아미노산 중 어느 하나를 포함할 수 있는 것으로 이해된다. 변이 아미노산 위치들 중 임의의 위치를 조합하여 추가적인 변이체를 구축할 수 있는 것으로 또한 이해된다. 2 이상의 변이 아미노산 위치들의 조합을 가진 변이체는 야생형 보다 높은 활성을 나타낸다. 즉, 본원에 예시된 바와 같이, 활성 변이 아미노산 위치들을 조합함으로써 효소 변이체를 구축하는 경우, 개선된 특성을 가진 효소 변이체가 구축된다. 당해 기술 분야의 당업자라면 당해 기술 분야의 당업자에게 잘 알려진 방법을 이용하여 하나의 변이 위치 또는 변이 위치들의 조합을 가진 폴리펩타이드를 쉽게 구축하여, 본원에 기술된 바와 같이, 활성 증가, 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드의 S 형태 대비 R 형태에 대한 특이성 증가, 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 에탄올 또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, Kcat 증가, 생체내 및/또는 시험관내 안정성 증가 등과 같은 바람직한 특성을 가진 폴리펩타이드를 구축할 수 있다.
"상동성" 또는 "동일성" 또는 "유사성"은 2종의 폴리펩타이드 또는 2종의 핵산 분자들 간의 서열 유사성을 의미한다. 상동성은 비교하기 위해 정렬가능한 각 서열 내 위치를 비교함으로써 결정할 수 있다. 비교되는 서열에서 한 위치에서 동일한 염기 또는 아미노산이 존재한다면, 그 분자는 그 위치에서 동일한 것이다. 서열들 간의 상동성 정도는 서열들 간에 공유된 매칭 또는 상동적인 위치들의 개수에 대한 함수이다. 폴리펩타이드 또는 폴리펩타이드 영역 (또는 폴리뉴클레오티드 또는 폴리뉴클레오티드 영역)이 다른 서열에 대해 특정한 "서열 동일성" % (예, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%)를 가진다는 것은, 정렬하였을 때 아미노산 (또는 뉴클레오티드 염기)의 %가 서열 2개의 비교시 동일하다는 것을 의미한다.
특정 구현예에서, 본 발명은 본원에 기술된 임의의 조합으로 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 그 보다 많은 수의 변이를 포함하는 아미노산 서열을 가진 단리된 폴리펩타이드를 제공한다. 변이체는 표 1, 2 및/또는 3에 기재된 변이체들의 임의 조합을 포함할 수 있다. 일부 구현예에서, 단리된 폴리펩타이드는, 기준 폴리펩타이드가 서열번호 1, 2 또는 3 또는 표 4의 아미노산 서열을 가지고; 폴리펩타이드 변이체가 표 1-3으로부터 선택되고; 서열번호 1, 2 또는 3 또는 표 4의 서열에 대해 하나 이상의 아미노산 치환을 가진, 기준 폴리펩타이드에 대한 변이체이다.
일부 구현예에서, 단리된 폴리펩타이드는, 기준 폴리펩타이드가 서열번호 1, 2 또는 3 또는 표 4의 아미노산 서열을 가지는, 기준 폴리펩타이드에 대한 변이체로서, 폴리펩타이드 변이체는 서열번호 1, 2 또는 3 또는 표 4에 대해 하나 이상의 아미노산 치환을 포함하되 하나 이상의 아미노산 치환은 표 1-3으로부터 선택되고, 폴리펩타이드 변이체는 표 1-3으로부터 선택되는 대응되는 변이체에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가진다. 하나 이상의 아미노산 치환은 표 1-3에 열거된 변이체들 중 어느 하나로부터 또는 표 1-3에 열거된 2 이상의 변이체들의 임의 조합으로부터 선택할 수 있다. 표 1-3에서 하나의 변이체로부터 선택되는 경우, 제조되는 변이체는 표시된 치환들을 모두 또는 표시된 전체 치환보다 적은 수준의 치환을 비롯하여, 선택된 변이체들의 하나 이상의 치환을 임의 조합으로 포함할 수 있다. 치환이 표 1-3에서의 2 이상의 변이체들로부터 선택되는 경우, 제조되는 변이체는 2 이상의 선택된 변이체들 각각으로부터 유래되는 표시된 치환들 모두 또는 그 보다 적은 수의 치환을 비롯하여, 선택된 변이체의 하나 이상의 치환을 임의 조합으로 포함할 수 있다. 예를 들어, 제조되는 변이체는 표 1-3에서의 단일 변이체로부터 유래되는 1, 2, 3 또는 4개의 치환을 포함할 수 있다. 추가적인 예로서, 제조되는 변이체는 본원에 기술된 바와 같이, 최대한으로는 모든 위치가 치환되는 등의, 표 1-3의 1, 2, 3, 4, 5 또는 그보다 많은 수의 선택 변이체들로부터 선택되는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25 또는 그보다 많은 수의 치환을 포함할 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3에서 선택 변이체의 표시된 치환들을 모두 포함한다. 일부 구현예에서, 제조되는 변이체는 서열번호 1, 2 또는 3 또는 표 4의 서열과 1개 이상에서 25개 미만, 20개 미만, 10개 미만, 5개 미만, 4개 미만 또는 3개 미만의 아미노산 치환 차이를 가진다. 일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하거나, 이로 필수적으로 구성되거나 또는 이로 구성되며, 서열번호 1, 2 또는 3 또는 표 4의 서열과의 표시된 아미노산 치환(들) 차이를 가진다.
일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 대응되는 변이체와 적어도 80%, 85%, 90% 또는 95%의 서열 동일성을 가지며; 일부 경우에, 동일성은 적어도 90% 또는 그 보다 높다. 제조되는 변이체가 표 1-3으로부터 선택되는 대응되는 변이체와의 동일성이 100% 미만인 경우, 대응되는 변이체에 대해 표시된 하나 이상의 아미노산 치환 위치가 이동될 순 있지만 (예, 하나 이상의 아미노산이 삽입 또는 결손된 경우), 여전히 제조되는 변이체에 포함될 수 있다. 예를 들어, "D12A" (서열번호 1 또는 2에서 12번 위치)에 대응되는 글리신에서 글루탐산으로의 치환은 제조되는 변이체의 다른 위치에 존재할 수 있다. 아미노산이 비록 다른 위치이지만 표시된 치환에 해당되는지는 전술한 및 당해 기술 분야에서 잘 알려진 바와 같이 서열 정렬을 통해 결정할 수 있다. 일부 구현예에서, 표 1-3으로부터 선택되는 대응되는 변이체에 의해 표시되는 하나 이상의 아미노산 치환 (예를 들어, 아미노산 치환들 전체 또는 그보다 적은 수의 아미노산 치환)은, 심지어 폴리펩타이드 체인의 다른 물리적 위치에서 이루어진다면, 폴리펩타이드의 서열을 디폴트 파라미터가 적용된 BLASTP 정렬 알고리즘을 이용하는 경우 대응되는 변이체 서열의 지정된 위치에 동일한 매치 또는 유사한 아미노산을 가진 대응되는 변이체와 정렬을 비교하였을 때, 유사한 아미노산이 정렬 알고리즘의 디폴트 파라미터를 이용하여 대상 변이체 위치와 정렬하기에 충분한 화학적 특성을 가진 것으로 간주되는 경우, 소정의 변이체에 존재하는 것으로 간주된다.
변형은 단독으로 또는 조합하여 기준 폴리펩타이드, 예를 들어 야생형 (네이티브) 효소를 기준으로 활성을 개선 또는 유지하는 효소를 구축할 수 있다. 일부 측면에서, 본 발명의 폴리펩타이드는 표 1, 2 및/또는 3에 기술된 변이들의 임의 조합을 가질 수 있다. 일부 측면에서, 표 1, 2 및/또는 3에 기술된 변이들의 임의 조합을 가진 본 발명의 폴리펩타이드는 아실-CoA를 대응되는 알데하이드로, 예를 들어, 3-하이드록시부티릴-CoA를 3- 하이드록시부티르알데하이드로 또는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 이러한 폴리펩타이드의 제조 및 분석 방법들은 당해 기술 분야의 당업자들에게 잘 알려져 있다.
일부 구현예에서, 본 발명의 단리된 폴리펩타이는 1-100 아미노산 위치들, 또는 다른 예로 2-100 아미노산 위치들, 또는 다른 예로 3-100 아미노산 위치들, 또는 다른 예로 4-100 아미노산 위치들, 또는 다른 예로 5-100 아미노산 위치들, 또는 다른 예로 6-100 아미노산 위치들, 또는 다른 예로 7-100 아미노산 위치들, 또는 다른 예로 8-100 아미노산 위치들, 또는 다른 예로 9-100 아미노산 위치들, 또는 다른 예로 10-100 아미노산 위치들, 또는 다른 예로 15-100 아미노산 위치들, 또는 다른 예로 20-100 아미노산 위치들, 또는 다른 예로 30-100 아미노산 위치들, 또는 다른 예로 40-100 아미노산 위치들, 또는 다른 예로 50-100 아미노산 위치들, 또는 이들의 범위에 속하는 임의 정수 위치에 보존적인 아미노산 치환을 추가로 포함할 수 있으며, 이들 위치는 표 1, 2 및/또는 3에 기재된 변이체 아미노산 위치와는 다른 위치이다. 일부 측면에서, 보존적인 아미노산 서열은 화학적으로 보존적인 또는 진화적으로 보존적인 아미노산 치환이다. 보존적인 아미노산을 식별하는 방법들은 당해 기술 분야의 당업자들에게 널리 공지되어 있으며, 이중 임의의 방법을 사용해 본 발명의 단리된 폴리펩타이드를 구축할 수 있다.
일부 구현예에서, 본 발명의 단리된 폴리펩타이드는, 모 (야생형) 서열과 비교해, 2-300 아미노산 위치들, 또는 다른 예로 3-300 아미노산 위치들, 또는 다른 예로 4-300 아미노산 위치들, 또는 다른 예로 5-300 아미노산 위치들, 또는 다른 예로 10-300 아미노산 위치들, 또는 다른 예로 20-300 아미노산 위치들, 또는 다른 예로 30-300 아미노산 위치들, 또는 다른 예로 40-300 아미노산 위치들, 또는 다른 예로 50-300 아미노산 위치들, 또는 다른 예로 60-300 아미노산 위치들, 또는 다른 예로 80-300 아미노산 위치들, 또는 다른 예로 100-300 아미노산 위치들, 또는 다른 예로 150-300 아미노산 위치들, 또는 다른 예로 200-300 아미노산 위치들, 또는 다른 예로 250-300 아미노산 위치들, 또는 이들의 범위에 속하는 정수 위치에, 변형을 포함하지 않을 수 있으며, 그 위치는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열들 중 2, 3, 4 또는 5개들에서 동일한 위치로부터 선택된다.
본원에 기술된 바와 같이, 알데하이드 데하이드로게나제의 폴리펩타이드 변이체 등의 변이체 폴리펩타이드가 모 폴리펩타이드와 비슷한 효소 반응, 예를 들어, 아실-CoA에서 이의 대응되는 알데하이드로의 변환, 예로, 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드로의 변환 또는 4-하이드록시부티릴-CoA로부터 4-하이드록시부티르알데하이드로의 변환을 수행할 수 있는 것으로 이해된다. 알데하이드 데하이드로게나제 효소의 폴리펩타이드 변이체는, 비-제한적인 예로, 활성 증가, S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, 아세틸-CoA에 비해 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 에탄올 또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, kcat 증가, 생체내 및/또는 시험관내 안정성 증가 등 (실시예 참조)의, 폴리펩타이드에 유익한 특징을 제공하는 변이체를 포함할 수 있는 것으로, 또한 이해된다. 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드 보다 높거나 또는 적어도 동일한 활성을 나타낼 수 있으며, 즉 변이 아미노산 위치(들)가 없는 모 폴리펩타이드와 비교해 더 높은 활성을 나타낼 수 있다. 예를 들어, 본 발명의 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드와 비교해 1.2, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 10 또는 심지어 그 보다 높은 배수의 변이체 폴리펩타이드 활성을 가질 수 있다 (실시예 참조). 그 활성은 본 발명의 알데하이드 데하이드로게나제가 동일한 분석 조건에서 야생형 또는 모 폴리펩타이드와 비교해 기질을 생산물로 변환할 수 있는 능력을 지칭하는 것으로 이해된다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, 예를 들어, 약 2-40배, 예를 들어, 2-35, 2-30, 2-25, 2-20, 2-15, 2-10 또는 2-5, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40 또는 심지어 더 높은 배수의 활성을 나타낼 수 있다. 이러한 특이성 증가는 예를 들어 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드의 R 형태/S 형태의 활성 비율에 의해 측정할 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 예를 들어, 1.5-100, 1.5-95, 1.5-90, 1.5-85, 1.5-80, 1.5-75, 1.5-70, 1.5-65, 1.5-60, 1.5-55, 1.5-50, 1.5-45, 1.5-40, 1.5-35, 1.5-30, 1.5-25, 1.5-20, 1.5-15, 1.5-10 또는 1.5-5, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100배 증가를 나타낼 수 있다. 이러한 특이성 증가는, 예를 들어, 아세틸-CoA 대비 3-하이드록시부티릴-CoA 또는 4-하이드록시부티릴-CoA의 활성 비율에 의해 측정할 수 있다. 특이성은 3HB-CoA 또는 4HB-CoA에 대한 활성을 아세틸-CoA에 대한 활성으로 나누어 표시한다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 에탄올 및/또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, 예를 들어, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%의 부산물 발생 감소를 나타낼 수 있다. 이러한 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드, 즉 변이 아미노산 위치가 없는 모 폴리펩타이드와 비교해, 전술한 바와 같이, 부산물 발생 감소 활성을 나타낼 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는, 야생형 또는 모 폴리펩타이드, 즉 변이 아미노산 위치(들)가 없는 모 폴리펩타이드와 비교해, kcat 증가, 예를 들어, 1.25, 1.5, 1.75, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 10배 또는 그 보다 높은 수준의 kcat 증가를 나타낼 수 있다. kcat는 효소학에서 널리 공지된 의미, 턴오버수 kcat = Vmax/[ET]를 지칭하는 것으로 이해되며, 이때 Vmax는 포화 기질과의 효소 반응 속도이고, [ET]는 전체 효소 농도이다 (Segel, Enzyme Kinetics: Behavior and Analysis of Rapid Equilibrium and Steady-State Enzyme Kinetics, Wiley-Interscience, New York (1975) 참조). 이러한 알데하이드 데하이드로게나제 변이체는, 야생형 또는 모 폴리펩타이드, 즉 변이체 아미노산 위치(들)가 없는 모 폴리펩타이드에 비해 kcat가 증가된 활성을 나타낼 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드, 즉 변이 아미노산 위치(들)가 없는 모 폴리펩타이드에 비해 시험관내 또는 생체내 또는 둘다에서 안정성 증가를 나타낼 수 있다. 예를 들어, 알데하이드 데하이드로게나제 변이체는 세포용해물 (lysate)에서 시험관내 안정성 증가를 나타낼 수 있다.
특정 구현예들에서, 알데하이드 데하이드로게나제 변이체는 전술한 2가지 이상의 특징, 예를 들어, (1) 활성 증가, (2) S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, (3) 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, (4) 에탄올 및/또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, (5) kcat 증가, (6) 생체내 및/또는 시험관내 안정성 증가 등 중 2가지 이상의 특징을 임의 조합으로 나타낼 수 있는 것으로 이해된다. 이러한 임의 조합으로는, 예를 들어, 특징 1 및 2; 1 및 3; 1 및 4; 1 및 5; 1 및 6; 2 및 3; 2 및 4; 2 및 5; 2 및 6; 3 및 4; 3 및 5; 3 및 6; 4 및 5; 4 및 6; 5 및 6; 1, 2 및 3; 1, 2 및 4; 1, 2 및 5; 1, 2 및 6; 1, 3 및 4; 1, 3 및 5; 1, 3 및 6; 1, 4 및 5; 1, 4 및 6; 1, 5 및 6; 2, 3 및 4; 2, 3 및 5; 2, 3 및 6; 2, 4 및 5; 2, 4 및 6; 2, 5 및 6; 3, 4 및 5; 3, 4 및 6; 3, 5 및 6; 4, 5 및 6; 1, 2, 3 및 4; 1, 2, 3 및 5; 1, 2, 3 및 6; 1, 2, 4 및 5; 1, 2, 4 및 6; 1, 2, 5 및 6; 1, 3, 4 및 5; 1, 3, 4 및 6; 1, 3, 5 및 6; 1, 4, 5 및 6; 2, 3, 4 및 5; 2, 3, 4 및 6; 2, 3, 5 및 6; 3, 4, 5 및 6; 1, 2, 3, 4 및 5; 1, 3, 4, 5 및 6; 1, 2, 4, 5 및 6; 1, 2, 3, 5 및 6; 1, 2, 3, 4 및 6; 2, 3, 4, 5 및 6; 1, 2, 3, 4, 5 및 6을 포함한다.
본 발명의 폴리펩타이드는 당해 기술 분야에 널리 공지된 다양한 방법에 의해, 예를 들어 재조합 발현 시스템, 석출, 겔 여과, 이온-교환, 역상 및 친화성 크로마토그래피 등에 의해 단리할 수 있다. 그외 널리 공지된 방법들은 Deutscher et al., Guide to Protein Purification: Methods in Enzymology, Vol. 182, (Academic Press, (1990))에 기술되어 있다. 다른 예로, 본 발명의 단리된 폴리펩타이드는 널리 공지된 재조합 방법을 이용해 수득할 수 있다 (예, Sambrook et al., supra, 1989; Ausubel et al., supra, 1999 참조). 본 발명의 폴리펩타이드를 생화학적으로 정제하는 방법 및 조건은 당해 기술 분야의 당업자들이 선택할 수 있으며, 예를 들어 기능성 분석으로 정제를 모니터링할 수 있다.
본 발명의 폴리펩타이드를 정제하는 방법에 대한 비-제한적인 일 예는 박테리아 세포, 효모 세포 또는 그외 적절한 세포와 같은 적절한 숙주 세포에서 당해 기술 분야에 잘 알려진 방법을 이용해 폴리펩타이드를 코딩하는 핵산을 발현시키고, 발현된 폴리펩타이드를 널리 공지된 정제 방법을 다시 이용해 본원에 기술된 바와 같이 회수하는 것이다. 본 발명의 폴리펩타이드는 본원에 기술된 바와 같이 발현 벡터로 형질전환된 세포로부터 직접 단리할 수 있다. 재조합 방식으로 발현된 본 발명의 폴리펩타이드는 또한 글루타티온 S 트랜스퍼라제 (GST), poly His, 스트렙타비딘 등과 같은 적절한 친화성 태그와의 융합 단백질로서 발현시키고, 필요에 따라 친화성으로 정제할 수 있다. 본 발명의 폴리펩타이드는 필요에 따라 친화성 태그를 유지할 수 있거나, 또는 선택적으로 친화성 태그는 널리 공지된 방법을 이용해 폴리펩타이드로부터, 예를 들어 적절한 효소적 또는 화학적 절단을 이용하여 친화성 태그를 제거할 수 있다. 이에, 본 발명은 친화성 태그없이 또는 선택적으로 친화성 태그와 함께 본 발명의 폴리펩타이드를 제공한다. 일부 구현예에서, 본 발명은 본원에 기술된 폴리펩타이드를 발현하는 숙주 세포를 제공한다. 또한, 본 발명의 폴리펩타이드는 당해 기술 분야의 당업자에게 널리 공지된 폴리펩타이드 합성 방법을 이용해 화학 합성으로 제조할 수 있다 (Merrifield, J. Am. Chem . Soc . 85:2149 (1964); Bodansky, M., Principles of Peptide Synthesis (Springer-Verlag, 1984); Houghten, Proc . Natl . Acad . Sci ., USA 82:5131 (1985); Grant Synthetic Peptides: A User Guide. W.H. Freeman and Co., N.Y. (1992); Bodansky M and Trost B., Ed. Principles of Peptide Synthesis. Springer-Verlag Inc., NY (1993)).
일부 구현예에서, 본 발명은 생촉매 (biocatalyst)로서 본원에 언급된 폴리펩타이드를 이용하는 것을 제공한다. 본원에서, "생촉매"는 화학 반응을 개시 또는 속도를 변형시키는 생물학적 물질을 지칭한다. 생촉매는 효소일 수 있다. 본 발명의 폴리펩타이드는 기질을 본원에 기술된 생산물로 변환하는 속도를 증가시키기 위해 사용될 수 있다. 공업적인 반응 (industrial reaction) 맥락에서, 본 발명의 폴리펩타이드는, 반응을 개선하여 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 (downstream product)을, 예를 들어 시험관내 방법을 이용해 제조하기 위해, 폴리펩타이드를 발현하는 숙주 세포 없이 사용할 수 있다. 일 구현예에서, 본 발명은 생촉매로서 본 발명의 폴리펩타이드의 용도를 제공한다.
본 발명의 일부 구현예에서, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드는 알데하이드 데하이드로게나제를 발현하는 세포의 세포용해물로서 제공된다. 이 경우, 세포용해물은 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드로의 변환, 또는 4-하이드록시부티릴-CoA로부터 4-하이드록시부티르알데하이드로의 변환, 또는 역 반응을 시험관내 반응으로 수행하기 위한 알데하이드 데하이드로게나제의 소스로서 사용된다. 다른 구현예에서, 알데하이드 데하이드로게나제는 일부 정제된 형태로, 예를 들어 세포용해물로부터 일부 정제된 형태로 제공될 수 있다. 다른 구현예에서, 알데하이드 데하이드로게나제는, 알데하이드 데하이드로게나제가 세포 추출물의 성분들 등의 다른 성분들로부터 실질적으로 정제된, 실질적으로 정제된 형태로 제공될 수 있다. 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드를 일부 정제하거나 또는 실질적으로 정제하는 방법은 본원에 기술된 바와 같이 당해 기술 분야에 잘 알려져 있다. 일부 구현예에서, 알데하이드 데하이드로게나제를 고체 지지체, 예를 들어, 비드, 플레이트 또는 막에 고정한다. 특정 구현예에서, 알데하이드 데하이드로게나제는 친화성 태그를 포함하며, 친화성 태그를 사용해 알데하이드 데하이드로게나제를 고체 지지체에 고정한다. 이러한 친화성 태그로는, 비-제한적으로, 본원에 기술된 바와 같이, 글루타티온 S 트랜스퍼라제 (GST), poly His, 스트렙타비딘 등을 포함한다.
일부 구현예에서, 본 발명은 본원에 기술된 폴리펩타이드 및 이러한 폴리펩타이드에 대한 하나 이상의 기질을 가진 조성물을 제공한다. 본원에 기술된 각 폴리펩타이드에 대한 기질들은 본원에 기술되어 있으며, 도면에 예시되어 있다. 본 발명의 조성물 내 폴리펩타이드는 시험관내 또는 생체내 조건에서 기질과 반응할 수 있다. 이러한 맥락에서, 시험관내 조건은 본 발명의 세포 등의 세포 부재 하에 또는 세포 외부에서의 반응을 의미한다.
일 구현예에서, 본 발명은 본 발명의 폴리펩타이드 및 이러한 폴리펩타이드에 대한 하나 이상의 기질을 포함하는 조성물을 제공한다. 일 구현예에서, 폴리펩타이드는 시험관내 조건에서 기질과 반응할 수 있다. 일 구현예에서, 기질은 3-하이드록시부티릴-CoA이다. 일 구현예에서, 기질은 3-하이드록시-(R)-부티릴-CoA이다. 일 구현예에서, 기질은 4-하이드록시부티릴-CoA이다.
일부 구현예에서, 본 발명은, 다른 단계들 중에서도, 숙주 세포, 예를 들어, 벡터에 의해 코딩된 아미노산 서열을 발현할 수 있거나 및/또는 발효가능한, 숙주 세포에 본원에 기술된 벡터를 도입하는 단계를 포함할 수 있는, 숙주 균주를 구축하는 방법을 제공한다. 본 발명의 벡터는, 비-제한적인 예로, 접합, 전기천공, 화학적 형질전환, 형질도입, 형질감염 및 초음파 형질전환 등의 당해 기술 분야에 널리 공지된 기술을 이용해, 숙주 세포에 안정적으로 또는 일시적으로 도입시킬 수 있다. 본원에 부가적인 방법들이 기술되어 있으며, 이중 임의의 한가지 방법이 본 발명의 방법에 사용될 수 있다.
부가적인 구현예에서, 본 발명은 본 발명의 폴리펩타이드, 즉 본 발명의 알데하이드 데하이드로게나제를 포함하는 세포를 제공한다. 이에, 본 발명은 본 발명의 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드를 포함하는 비-천연성 세포를 제공한다. 선택적으로, 세포는 3-HBal 또는 1,3-BDO 경로, 또는 4-HBal 또는 1,4-BDO 경로를 포함할 수 있으며, 그리고 부가적으로 선택적으로 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위한 경로를 포함할 수 있다. 일부 구현예에서, 비-천연성 세포는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함한다. 당해 기술 분야의 당업자는, 이것이 단순 예이고, 원하는 생산물을 생산하기에 적합하고 기질에서 생산물로의 변환에 이용가능한 적절한 활성을 가진 본원에 기술된 기질-산물 쌍들 중 임의 쌍이, 본원에 교시된 내용을 토대로 당해 기술 분야의 당업자에 의해 쉽게 결정될 수 있는 것으로 이해할 것이다. 이에, 특정 구현예에서, 본 발명은, 알데하이드 데하이드로게나제가 도 1 및 2에 도시된 바와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서 기능하는, 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함하는, 세포, 특히 비-천연성 세포를 제공한다.
일 구현예에서, 본 발명은 본 발명의 핵산을 포함하는 본 발명의 벡터를 포함하는 세포를 제공한다. 또한, 본 발명은 본 발명의 핵산을 포함하는 세포를 제공한다. 일 구현예에서, 핵산 분자는 세포의 염색체에 병합된다. 특정 구현예에서, 병합은 부위-특이적이다. 본 발명의 일 구현예에서, 핵산 분자가 발현된다. 일 구현예에서, 본 발명은 본 발명의 폴리펩타이드를 포함하는 세포를 제공한다.
일 구현예에서, 벡터, 핵산 또는 폴리펩타이드를 포함하는 세포는 미생물 유기체이다. 특정 구현예에서, 미생물 유기체는 박테리아, 효모 또는 진균이다. 특정 구현예에서, 세포는 단리된 진핵생물 세포이다.
일 구현예에서, 세포는 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드를 생산하는 경로를 포함한다. 다른 구현예에서, 세포는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드를 생산하는 경로를 포함한다. 일 구현예에서, 세포는 발효할 수 있다. 일 구현예에서, 세포는 세포에서 발현되는 본 발명의 폴리펩타이드에 대한 하나 이상의 기질을 더 포함한다. 특정 구현예에서, 기질은 3-하이드록시부티릴-CoA이다. 특정 구현예에서, 기질은 3-하이드록시-(R)-부티릴-CoA이다. 일 구현예에서, 세포는 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가진다. 다른 특정 구현예에서, 기질은 4-하이드록시부티릴-CoA이다. 또한, 본 발명은 본 발명의 세포를 포함하는 배양 배지를 제공한다.
본 발명의 알데하이드 데하이드로게나제는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 경로에 이용할 수 있다. 알데하이드 데하이드로게나제를 포함하는 예시적인 3-HBal 및/또는 1,3-BDO 경로는, 예를 들어, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983, US 2013/0066035에 기술되어 있으며, 이들 문헌은 각각 원용에 의해 본 명세서에 포함된다.
3-HBal 및/또는 1,3-BDO 경로의 예들은 도 1에 도시되며, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983 및 US 2013/0066035에 기술되어 있다. 알데하이드 데하이드로게나제를 포함하는 이러한 3-HBal 및/또는 1,3-BDO 경로는, 예를 들어, (G) 아세토아세틸-CoA 리덕타제 (케톤 환원); (H) 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성), 본원에서 3-하이드록시부티르알데하이드 데하이드로게나제, 알데하이드 데하이드로게나제 (ALD)로도 지칭됨; 및 (C) 3-하이드록시부티르알데하이드 리덕타제, 본원에서 1,3-BDO 데하이드로게나제로도 지칭됨 (도 1 참조)를 포함한다. 아세토아세틸-CoA는 티올라제를 사용해 아세틸-CoA 2분자를 아세토아세틸-CoA 1분자로 변환함으로써 제조할 수 있다. 아세토아세틸-CoA 티올라제는 아세틸-CoA 2분자를 아세토아세틸-CoA 1분자 및 CoA 1분자로 변환한다 (WO 2013/036764 및 US 2013/0066035 참조).
1,3-BDO 경로의 예는 WO 2010/127319의 도 2에 도시되어 있다. 간략하게는, 아세토아세틸-CoA 리덕타제 (케톤 환원)(EC 1.1.1.a)에 의해 아세토아세틸-CoA를 3-하이드록시부티릴-CoA로 변환할 수 있다 (도 1의 단계 G). 3-하이드록시부티릴-CoA는, 본 발명의 알데하이드 데하이드로게나제 등의 본원에서 3-하이드록시부티르알데하이드 데하이드로게나제로도 지칭되는, 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성)(EC 1.2.1.b)에 의해 3-하이드록시부티르알데하이드로 변환할 수 있다 (도 1의 단계 H). 3-하이드록시부티르알데하이드는, 본원에서 1,3-BDO 데하이드로게나제로도 지칭되는 3-하이드록시부티르알데하이드 리덕타제 (EC 1.1.1.a)에 의해 1,3-부탄다이올로 변환할 수 있다 (도 1의 단계 C).
본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하는 경로에서 기능할 수 있다. 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하는 알데하이드 데하이드로게나제를 포함하는 전술한 경로에서, 이 경로는 아세토아세틸-CoA를 3-하이드록시부티릴-CoA로 변환한다 (도 1 참조). 또한, 본 발명의 알데하이드 데하이드로게나제는, 경로에서 기질/산물로서 3-하이드록시부티릴-CoA를 포함하는, 다른 3-HBal 및/또는 1,3-BDO 경로들에 사용할 수 있다. 당해 기술 분야의 당업자라면, 상기한 반응을 포함하는 임의의 원하는 경로에서 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하기 위해 본 발명의 알데하이드 데하이드로게나제를 쉽게 이용할 수 있다.
4-HBal 및/또는 1,4-BDO 경로의 예들은 도 2에 도시되며, WO 2008/115840, WO 2010/030711, WO 2010/141920, WO 2011/047101, WO 2013/184602, WO 2014/176514, 미국 특허 8,067,214, 미국 특허 7,858,350, 미국 특허 8,129,169, 미국 특허 8,377,666, US 2013/0029381, US 2014/0030779, US 2015/0148513 및 US 2014/0371417에 기술되어 있다. 알데하이드 데하이드로게나제를 포함하는 이러한 4-HBal 및/또는 1,4-BDO 경로는, 예를 들어, (1) 숙시닐-CoA 신테타제; (2) CoA-비의존적인 숙시닉 세미알데하이드 데하이드로게나제; (3) α-케토글루타레이트 데하이드로게나제; (4) 글루타메이트:숙시네이트 세미알데하이드 트랜스아미나제; (5) 글루타메이트 데카르복실라제; (6) CoA-의존적인 숙시닉 세미알데하이드 데하이드로게나제; (7) 4-하이드록시부타노에이트 데하이드로게나제; (8) α-케토글루타레이트 데카르복실라제; (9) 4-하이드록시부티릴 CoA:아세틸-CoA 트랜스퍼라제; (10) 부티레이트 키나제 (4-하이드록시부티레이트 키나제로도 지칭됨); (11) 포스포트랜스부티릴라제 (포스포-트랜스-4-하이드록시부티릴라제로도 지칭됨); (12) 알데하이드 데하이드로게나제 (4-하이드록시부티릴-CoA 리덕타제로도 지칭됨); (13) 알코올 데하이드로게나제, 예를 들어 1,4-부탄다이올 데하이드로게나제 (4-하이드록시부타날 리덕타제 또는 4-하이드록시부티르알데하이드 리덕타제로도 지칭됨)(도 2 참조)를 포함한다.
도 2와 마찬가지로, 1,4-BDO 경로의 예는 WO 2010/141920의 도 8a에 도시되어 있다. 간략하게는, 숙시닐-CoA는 숙시닐-CoA 리덕타제 (또는 숙시네이트 세미알데하이드 데하이드로게나제) (EC 1.2.1.b)에 의해 숙시닉 세미알데하이드로 변환할 수 있다. 숙시네이트 세미알데하이드는 4-하이드록시부티레이트 데하이드로게나제 (EC 1.1.1.a)에 의해 4-하이드록시부티레이트로 변환할 수 있다. 다른 예로, 숙시닐-CoA는 숙시닐-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 4-하이드록시부티레이트로 변환할 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-CoA 트랜스퍼라제 (EC 2.8.3.a), 4-하이드록시부티릴-CoA 하이드롤라제 (EC 3.1.2.a) 또는 4-하이드록시부티릴-CoA 리가제 (또는 4-하이드록시부티릴-CoA 신테타제) (EC 6.2.1.a)에 의해 4-하이드록시부티릴-CoA로 변환할 수 있다. 다른 예로, 4-하이드록시부티레이트는 4-하이드록시부티레이트 키나제 (EC 2.7.2.a)에 의해 4-하이드록시부티릴-포스페이트로 변환할 수 있다. 4-하이드록시부티릴-포스페이트는 포스포트랜스-4-하이드록시부티릴라제 (EC 2.3.1.a)에 의해 4-하이드록시부티릴-CoA로 변환할 수 있다. 다른 예로, 4-하이드록시부티릴-포스페이트는 4-하이드록시부타날 데하이드로게나제 (인산화) (EC 1.2.1.d)에 의해 4-하이드록시부타날로 변환할 수 있다. 4-하이드록시부티릴-CoA는 본 발명의 알데하이드 데하이드로게나제 변이체에 의한 것을 포함하여, 4-하이드록시부티릴-CoA 리덕타제 (또는 4-하이드록시부타날 데하이드로게나제) (EC 1.2.1.b)에 의해 4-하이드록시부타날로 변환할 수 있다. 다른 예로, 4-하이드록시부티릴-CoA는 4-하이드록시부티릴-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 1,4-부탄다이올로 변환할 수 있다. 4-하이드록시부타날은 1,4-부탄다이올 데하이드로게나제 (EC 1.1.1.a)에 의해 1,4-부탄다이올로 변환할 수 있다.
1,4-BDO 경로의 예들은 WO 2010/141920의 도 8B에 도시되어 있다. 간략하게는, α-케토글루타레이트는 α-케토글루타레이트 데카르복실라제 (EC 4.1.1.a)에 의해 숙시닉 세미알데하이드로 변환될 수 있다. 다른 예로, α-케토글루타레이트는 글루타메이트로 글루타메이트 데하이드로게나제 (EC 1.4.1.a)에 의해 변환될 수 있다. 4-아미노부티레이트는 숙시닉 세미알데하이드로 4-아미노부티레이트 옥시도리덕타제 (탈아민화) (EC 1.4.1.a) 또는 4-아미노부티레이트 트랜스아미나제 (EC 2.6.1.a)에 의해 변환될 수 있다. 글루타메이트는 4-아미노부티레이트로 글루타메이트 데카르복실라제 (EC 4.1.1.a)에 의해 변환될 수 있다. 숙시네이트 세미알데하이드는 4-하이드록시부티레이트로 4-하이드록시부티레이트 데하이드로게나제 (EC 1.1.1.a)에 의해 변환될 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-CoA로 4-하이드록시부티릴-CoA 트랜스퍼라제 (EC 2.8.3.a), 4-하이드록시부티릴-CoA 하이드롤라제 (EC 3.1.2.a) 또는 4-하이드록시부티릴-CoA 리가제 (또는 4-하이드록시부티릴-CoA 신테타제) (EC 6.2.1.a)에 의해 변환될 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-포스페이트로 4-하이드록시부티레이트 키나제 (EC 2.7.2.a)에 의해 변환될 수 있다. 4-하이드록시부티릴-포스페이트는 4-하이드록시부티릴-CoA로 포스포트랜스-4-하이드록시부티릴라제 (EC 2.3.1.a)에 의해 변환될 수 있다. 다른 예로, 4-하이드록시부티릴-포스페이트는 4-하이드록시부타날로 4-하이드록시부타날 데하이드로게나제 (인산화) (EC 1.2.1.d)에 의해 변환될 수 있다. 4-하이드록시부티릴-CoA는 4-하이드록시부타날로 본 발명의 알데하이드 데하이드로게나제 등의 4-하이드록시부티릴-CoA 리덕타제 (또는 4-하이드록시부타날 데하이드로게나제) (EC 1.2.1.b)에 의해 변환될 수 있다. 4-하이드록시부티릴-CoA는 1,4-부탄다이올로 4-하이드록시부티릴-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 변환될 수 있다. 4-하이드록시부타날은 1,4-부탄다이올로 1,4-부탄다이올 데하이드로게나제 (EC 1.1.1.a)에 의해 변환될 수 있다.
본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하는 경로에서 기능할 수 있다. 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하는 알데하이드 데하이드로게나제를 포함하는 전술한 경로에서, 이 경로는 4-하이드록시부티레이트를 4-하이드록시부티릴-CoA로 또는 4-하이드록시부티릴 포스페이트를 4-하이드록시부티릴-CoA로 변환한다 (도 2 참조). 또한, 본 발명의 알데하이드 데하이드로게나제는, 경로에서 기질/산물로서 4-하이드록시부티릴-CoA를 포함하는, 다른 4-HBal 및/또는 1,4-BDO 경로들에 사용할 수 있다. 당해 기술 분야의 당업자라면, 이러한 반응을 포함하는 임의의 원하는 경로에서, 본 발명의 알데하이드 데하이드로게나제를 사용해 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 예를 들어, 4-옥소부티릴-CoA를 WO 2010/141290, 도 9A에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 또한, 5-하이드록시-2-옥소펜탄산을 WO 2010/141290, 도 10 및 11에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 또한, 아세토아세틸-CoA, 3-하이드록시부티릴-CoA, 크로토닐-CoA 및/또는 비닐아세틸-CoA를 WO 2010/141290, 도 12에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 아울러, 4-하이드록시부트-2-에노일-CoA를 WO 2010/141290, 도 13에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 즉, 당해 기술 분야의 당업자라면, 필요에 따라 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하는 것을 포함하는 4-HBal 및/또는 1,4-BDO 경로에서 본 발명의 알데하이드 데하이드로게나제를 이용하는 방법을 쉽게 이해할 것이다.
공통적인 핵심 대사 중간산물을 1,3-BDO 또는 1,4-BDO로 변환하는데 필요한 효소 타입은 대표적인 EC (Enzyme Commission) 번호와 함께 상기에 기술된다 (WO 2010/127319, WO 2013/036764, WO 2008/115840, WO 2010/030711, WO 2010/141920, WO 2011/047101, WO 2013/184602, WO 2014/176514, 미국 특허 9,017,983, 미국 특허 8,067,214, 미국 특허 7,858,350, 미국 특허 8,129,169, 미국 특허 8,377,666, US 2013/0066035, US 2013/0029381, US 2014/0030779, US 2015/0148513 및 US 2014/0371417을 참조함). 각 라벨에서 앞에 위치한 숫자 3개는 기질 특이성과 독립적인 일반적인 변환 타입을 나타내는 효소 위원회 번호에서의 앞 숫자 3개이다. 효소의 예로는 1.1.1.a, 옥시도리덕타제 (케톤 -> 하이드록실 또는 알데하이드 -> 알코올); 1.1.1.c, 옥시도리덕타제 (2단계, 아실-CoA -> 알코올); 1.2.1.b, 옥시도리덕타제 (아실-CoA -> 알데하이드); 1.2.1.c, 옥시도리덕타제 (2-옥소산 -> 아실-CoA, 데카르복시화); 1.2.1.d, 옥시도리덕타제 (인산화/탈인산화); 1.3.1.a, CH-CH 도너에 작용하는 옥시도리덕타제; 1.4.1.a, 아미노산에 작용하는 옥시도리덕타제 (탈아민화); 2.3.1.a, 아실트랜스퍼라제 (포스페이트 기 전달); 2.6.1.a, 아미노트랜스퍼라제; 2.7.2.a, 포스포트랜스퍼라제, 카르복시기 어셉터; 2.8.3.a, 코엔자임-A 트랜스퍼라제; 3.1.2.a, 티올에스테르 하이드롤라제 (CoA 특이적); 4.1.1.a, 카르브옥시-리아제; 4.2.1.a, 하이드로-리아제; 4.3.1.a, 암모니아-리아제; 5.3.3.a, 이소머라제; 5.4.3.a, 아미노무타제; 및 6.2.1.a, 산-티올 리가제 등이 있다.
본 발명의 알데하이드 데하이드로게나제는 세포에서 또는 시험관내에서 사용해 아실-CoA를 이의 대응되는 알데하이드로 변환할 수 있다. 본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는, 비-제한적인 예로, S 거울상이성질체와 비교해 3-하이드록시부티릴-CoA에 대한 R 거울상이성질체의 특이성 증가, 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 활성 증가, 부산물 발생 감소, kcat 증가 등의, 유익하고 유용한 특성을 가진다. 본 발명의 알데하이드 데하이드로게나제를 이용해, 본 발명의 알데하이드 데하이드로게나제의 생산물 효소적으로 변환함으로써 1,3-부탄다이올 데하이드로게나제를 사용해 3-하이드록시-(R)-부티르알데하이드를 (R)-1,3-부탄다이올로 효소적으로 변환함으로써, 1,3-부탄다이올의 R-형태 ((R)-1,3-부탄다이올이라고도 함)를 제조할 수 있다.
1,3-부탄다이올의 생물-유래 R-형태는, R-형태가 바람직한 다운스트림 산물을 생산하는데 이용할 수 있다. 일부 구현예에서, R-형태는 약제 및/또는 뉴트라슈티컬로서 활용할 수 있다 (WO 2014/190251 참조). 예를 들어, (R)-1,3-부탄다이올은, 혈중 케톤체 농도 증가 등의 유익한 효과를 가질 수 있는, (3R)-하이드록시부틸 (3R)-하이드록시부티레이트를 생산하는데 이용할 수 있다. 케톤체 농도 증가는 신체 및 인지 성능 강화 및 심혈관 병태, 당뇨병 및 미토콘드리아 기능부전 장애의 치료 및 근육 피로와 손상 치료 등의, 다양한 임상적인 이점을 달성할 수 있다 (WO 2014/190251 참조). 1,3-부탄다이올의 생물-유래 R-형태는, 예를 들어, 석유-유래 라세메이트 1,3-부탄다이올, 이의 S-형태 또는 R-형태를 생물-유래 R-형태로 치환함으로써, 비-석유계 생산물이 바람직한 다운스트림 산물을 생산하는데 이용할 수 있다.
일 구현예에서, 본 발명은, 화합물의 R 형태에 대해 거울상이성질체 측면에서 농화된, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 제공한다. 일부 구현예에서, 3-HBal 또는 1,3-BDO는 R-거울상이성질체 측면에서 농화된 라세메이트이며, 즉 S-거울상이성질체 보다 R-거울상이성질체를 더 많이 함유한다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 55% 이상으로, S-거울상이성질체를 45% 미만으로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 60% 이상으로, S-거울상이성질체를 40% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 65% 이상으로, S-거울상이성질체를 35% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 70% 이상으로, S-거울상이성질체를 30% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 75% 이상으로, S-거울상이성질체를 25% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 80% 이상으로, S-거울상이성질체를 20% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 85% 이상으로, S-거울상이성질체를 15% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 90% 이상으로, S-거울상이성질체를 10% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 95% 이상으로, S-거울상이성질체를 5% 이하로 포함할 수 있다. 일부 구현예에서, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물은 R 형태를 90% 보다 많이, 예를 들어, R 형태를 95% 초과로, 96% 초과로, 97% 초과로, 98% 초과로, 99% 초과로 또는 99.9% 초과로 포함한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물은, ≥55% R-거울상 이성질체, ≥60% R-거울상 이성질체, ≥65% R-거울상 이성질체, ≥70% R-거울상 이성질체, ≥75% R-거울상 이성질체, ≥80% R-거울상 이성질체, ≥85% R-거울상 이성질체, ≥90% R-거울상 이성질체 또는 ≥95% R-거울상 이성질체이며, 화학적으로 고도로 순수할 수 있으며, 예를 들어 ≥99%일 수 있으며, 예로, R-거울상이성질체가 ≥95%, ≥96%, ≥97%, ≥98%, ≥99%, ≥99.1%, ≥99.2%, ≥99.3%, ≥99.4%, ≥99.5%, ≥99.6%, ≥99.7%, ≥99.8% 또는 ≥99.9%일 수 있다.
일 구현예에서, 3-HBal 및/또는 1,3-BDO의 전구체의 석유-유래 (petroleum-derived) 라세믹 혼합물, 특히 3-하이드록시부티릴-CoA의 라세믹 혼합물은, R 형태로 거울상이성질체 측면에서 농화된, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 제조하기 위해, S 형태에 비해 R 형태에 대해 증가된 특이성을 나타내는 본 발명의 알데하이드 데하이드로게나제의 기질로서 사용된다. 이러한 반응은 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포, 특히 전구체를 3-하이드록시부티릴-CoA로 변환할 수 있는 세포에 석유-유래 전구체를 공급함으로써 수행할 수 있거나, 또는 석유-유래 전구체를 3-하이드록시부티릴-CoA로 변환하기 위한 하나 이상의 효소를 이용하여 시험관내에서, 또는 생체내 반응과 시험관내 반응의 조합으로 수행할 수 있다. 본 발명의 알데하이드 데하이드로게나제를 이용해 4-하이드록시부티릴-CoA를 생산하기 위한 반응은, 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포, 특히 전구체를 4-하이드록시부티릴-CoA로 변환할 수 있는 세포에 석유-유래 전구체를 공급함으로써 마찬가지로 수행할 수 있거나, 또는 석유-유래 전구체를 4-하이드록시부티릴-CoA로 변환하는 하나 이상의 효소를 사용해 시험관내에서 또는 생체내 반응과 시험관내 반응의 조합을 이용하여 수행할 수 있다.
본원에서는 일반적으로 본 발명의 알데하이드 데하이드로게나제를 포함하는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로를 가진 세포에 대해 기술하지만, 본 발명은 또한 본 발명의 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함하는 세포도 제공하는 것으로 이해된다. 알데하이드 데하이드로게나제는 바람직한 생산물, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 생산물, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산할만큼 충분한 양으로 발현될 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 예들은 도 1 및 2에 도시되며, 본원에 기술된다.
실시예에 기술되고 도 1 및 도 2의 경로 등의 도면에 예시된 바와 같이, 본원에 기술된 임의 경로는, 필요에 따라 임의의 경로 중간산물 또는 생산물을 생산하는 세포를 생산하는 세포, 특히 본 발명의 알데하이드 데하이드로게나제를 이용하는 경로를 구축하는데 이용할 수 있는 것으로, 이해된다. 본원에 기술된 바와 같이, 중간산물을 생산하는 이러한 세포는 바람직한 생산물을 생산하기 위해 하나 이상의 업스트림 또는 다운스트림 경로 효소들을 발현하는 다른 세포와 조합하여 사용할 수 있다. 그러나, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 생산하는 세포는 바람직한 생산물로서 중간산물을 생산하는데 이용할 수 있는 것으로 이해된다.
본 발명은 대사 반응, 반응제 또는 이의 생산물을 일반적으로 참조하거나, 또는 참조한 대사 반응, 반응제 또는 생산물과 관련있는 단백질 또는 이를 촉매하거나 또는 이와 관련된 효소를 코딩하는 하나 이상의 핵산 또는 유전자를 구체적으로 참조하여 본원에 기술된다. 본원에 명확하게 언급되지 않은 한, 당해 기술 분야의 당업자는, 반응에 대한 언급 역시 반응의 반응제 및 생산물에 대한 언급임을 이해할 것이다. 마찬가지로, 본원에 명확하게 언급되지 않은 한, 반응제 또는 생산물에 대한 언급 역시 반응을 언급하는 것이며, 이들 임의의 대사 구성성분에 대한 언급 또한 참조 반응, 반응제 또는 생산물을 촉진하는 효소 또는 이에 참여한 단백질을 코딩하는 유전자 또는 유전자들을 언급하는 것이다. 마찬가지로, 널리 공지된 대사 생화학, 효소학 및 게놈 분야를 감안해, 유전자 또는 코딩 핵산에 대한 언급은 대응되는 코딩된 효소 및 이것이 촉매하는 반응 또는 반응과 관련된 단백질뿐 아니라 반응의 반응제 및 생산물을 또한 언급하는 것이다.
본원에 기술된 바와 같이, 생산물 또는 경로 중간산물, 즉 카르복시산은, 완전히 양성자화된 (fully protonated), 부분 양성자화된 및 완전히 탈양성자화된 형태 (fully deprotonated form) 등의, 다양한 이온화된 형태로 제조할 수 있다. 즉, 접미사 "-에이트" 또는 산 형태는, 특히, 이온화된 형태가 화합물이 발견되는 pH에 의존적인 것으로 공지되어 있으므로, 유리 산 형태뿐 아니라 임의의 탈양성화된 형태 둘다를 기술하기 위해 상호 호환적으로 사용될 수 있다. 카르복실레이트 생산물 또는 중간산물은, O-카르복실레이트 및 S-카르복실레이트 에스테르 등의, 카르복실레이트 생산물의 에스테르 형태 또는 경로 중간산물을 포함하는 것으로 이해된다. O- 및 S-카르복실레이트는 저급 알킬을 포함할 수 있으며, C1 내지 C6의 분지쇄 또는 직쇄 카르복실레이트이다. 이러한 O- 또는 S-카르복실레이트의 일부로는, 비-제한적으로, 메틸, 에틸, n-프로필, n-부틸, i-프로필, sec-부틸 및 tert-부틸, 펜틸, 헥실 O- 또는 S-카르복실레이트 등이 있으며, 이들 중 임의의 것은 불포화를 추가적으로 포함하여, 예를 들어 프로페닐, 부테닐, 펜틸 및 헥세닐 O- 또는 S-카르복실레이트를 제공할 수 있다. O-카르복실레이트는 생합성 경로의 생산물일 수 있다. 그외 생합성에 의해 입수가능한 O-카르복실레이트는, C7-C22인 중간쇄 내지 장쇄 기들, 지방 알코올 유래 O-카르복실레이트 에스테르, 예를 들어, 헵틸, 옥틸, 노닐, 데실, 운데실, 라우릴, 트리데실, 미리스틸, 펜타데실, 세틸, 팔미톨릴, 헵타데실, 스테아릴, 노나데실, 아라키딜, 헨에이코실 및 베헤닐 알코올을 포함할 수 있으며, 이들 중 임의의 기는 선택적으로 분지화될 수 있으며, 및/또는 불포화를 포함할 수 있다. 또한, O-카르복실레이트 에스테르는 유리 카르복시산 생산물의 에스테르화 또는 O- 또는 S-카르복실레이트의 트랜스에스테르화와 같은, 생화학적 또는 화학적 공정을 통해 입수할 수 있다. S-카르복실레이트는 CoA S-에스테르, 시스테이닐 S-에스테르, 알킬티오에스테르 및 다양한 아릴 및 헤테로아릴 티오에스테르로 예시된다.
본 발명의 세포는, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 발현가능한 핵산, 및 선택적으로 하나 이상의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로에 참여하는 하나 이상의 효소 또는 단백질을 코딩하는 발현가능한 핵산, 및 또한 선택적으로 이의 에스테르 또는 아미드와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 도입함으로써, 제조할 수 있다. 선택 숙주 세포에 따라, 구체적인 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로 전체 또는 일부 또는 다운스트림 산물을 위한 핵산을 발현시킬 수 있다. 예를 들어, 선택 숙주에서 원하는 생합성 경로를 위한 하나 이상의 효소 또는 단백질이 결핍되어 있다면, 결핍된 효소(들) 또는 단백질(들)에 대한 발현가능한 핵산을 후속적인 외인성 발현을 위해 숙주에 도입한다. 다른 예로, 선택 숙주가 일부 경로 유전자들의 내인성 발현을 나타내지만 다른 것들은 결핍된 경우에는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성을 달성하기 위해, 결핍 효소(들) 또는 단백질(들)에 대한 코딩 핵산을 포함시키거나, 또는 필요에 따라 경로 효소의 발현을 증가시키기 위해 내인성으로 발현되는 유전자의 외인성 발현을 제공할 수 있다. 이에, 본 발명의 세포는, 본 발명의 알데하이드 데하이드로게나제, 선택적으로 원하는 생합성 경로를 수득하기 위한 외인성 효소 또는 단백질 활성을 도입하거나, 또는 하나 이상의 내인성 효소 또는 단백질과 더불어 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물과 같은 원하는 생산물을 생산하는, 본 발명의 알데하이드 데하이드로게나제 등의 하나 이상의 외인성 효소 또는 단백질 활성을 도입함으로써, 제조할 수 있다.
숙주 세포는, 예를 들어, 박테리아, 효모, 진균 또는 발효 공정에 적용가능하거나 또는 적합한 다양한 임의의 미생물에서 생산되는 본 발명의 알데하이드 데하이드로게나제를 발현하는 비-천연성 세포로부터 선택될 수 있다. 박테리아의 예는 속명 에스케리키아 (Escherichia) 및 클렙시엘라 (Klebsiella) 등의, 장내세균목 (Enterobacteriales) 장내세균과 (Enterobacteriaceae); 속명 안에어로바이오스피릴륨 (Anaerobiospirillum) 등의, 과명 숙시니비브리오나시이 (Succinivibrionaceae)의 목명 에어로모나데일스 (Aeromonadales); 속명 액티노바실러스 (Actinobacillus) 및 만하이미아 (Mannheimia) 등의, 과명 파스퇴렐라시이 (Pasteurellaceae)의 목명 파스퇴렐레일스 (Pasteurellales); 속명 리조븀 (Rhizobium) 등의, 과명 브라디리조비아시이 (Bradyrhizobiaceae)의 목명 리조비에일스 (Rhizobiales); 속명 바실러스 (Bacillus) 등의, 과명 바실라시이 (Bacillaceae)의 목명 바실에일스 (Bacillales); 속명 코리네박테리움 (Corynebacterium) 및 스트렙토마이세스 (Streptomyces) 등의, 각각 과명 코리네박테리아시이 (Corynebacteriaceae) 및 스트렙토마이세타시이 (Streptomycetaceae)의목명 액티노바이세테일스 (Actinomycetales); 속명 글루코노박터 (Gluconobacter) 등의, 과명 아세토박테라시이 (Acetobacteraceae)의 목명 로도스피릴레일스 (Rhodospirillales); 속명 지모모나스 (Zymomonas) 등의, 과명 스핑고모나다시이 (Sphingomonadaceae)의 목명 스핑고모나데일스 (Sphingomonadales); 속명 락토바실러스 (Lactobacillus) 및 락토코커스 (Lactococcus) 등의, 각각 과명 락토바실라시이 (Lactobacillaceae) 및 스트렙토코카시이 (Streptococcaceae)의 목명 락토바실레일스 (Lactobacillales); 과명 클로스트리디아시이 (Clostridiaceae)의 목명 클로스트리디에일스 (Clostridiales), 예로 속명 클로스트리듐 (Clostridium); 과명 슈도모나다시이 (Pseudomonadaceae)의 목명 슈도모나데일스 (Pseudomonadales), 예로 속명 슈도모나스 (Pseudomonas)로부터 선택되는 임의의 종을 포함한다. 숙주 박테리아에 대한 비-제한적인 예로는 에스케리키아 콜라이 (Escherichia coli), 클렙시엘라 옥시토카 (Klebsiella oxytoca), 안에어로비오스피릴룸 숙시니시프로두센스 (Anaerobiospirillum succiniciproducens), 액티노바실러스 숙시노게네스 (Actinobacillus succinogenes), 만하이미아 숙시니시프로두센스 (Mannheimia succiniciproducens), 리조븀 에틸리 (Rhizobium etli), 바실러스 섭틸리스 (Bacillus subtilis), 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 클루코노박터 옥시단스 (Gluconobacter oxydans), 자이모모나스 모빌리스 (Zymomonas mobilis), 락토코커스 락티스 (Lactococcus lactis), 락토바실러스 플란타룸 (Lactobacillus plantarum), 스트렙토마이세스 코엘리콜러 (Streptomyces coelicolor), 클로스트리듐 아세토부틸리툼 (Clostridium acetobutylicum), 슈도모나스 플루오레센스 (Pseudomonas fluorescens) 및 슈도모나스 푸티다 (Pseudomonas putida) 등이 있다. E. coli는 유전자 조작에 적합한 잘 규명된 미생물 유기체이므로, 이 균주는 특히 유용한 숙주 미생물이다.
마찬가지로, 효모 또는 진균 종에 대한 예시적인 종으로는, 과 사카로마이세타시이 (Saccaromycetaceae) 목 사카로마이세테일스 (Saccharomycetales), 예를 들어 속 사카로마이세스 (Saccharomyces), 클루이베로마이세스 (Kluyveromyces) 및 피키아 (Pichia); 과 디포다스카시이 (Dipodascaceae) 목 사카로마이세테일스 (Saccharomycetales), 예를 들어 속 야로이와 (Yarrowia); 과 시조사카로마이세타시이 (Schizosaccaromycetaceae) 목 시조사카로마이세일스 (Schizosaccharomycetales), 예를 들어, 속 시조사카로마이세스 (Schizosaccharomyces); 과 트리코코마시이 (Trichocomaceae) 목 유로티에일스 (Eurotiales), 예를 들어 속 아스퍼질러스 (Aspergillus); 및 과 뮤코라시이 (Mucoraceae) 목 뮤코레일스 (Mucorales), 예를 들어 속 리조푸스 (Rhizopus)로부터 선택되는 임의의 종을 포함한다. 숙주 효모 또는 진균에 대한 비-제한적인 종으로는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 시조사카로마이세스 폼베 (Schizosaccharomyces pombe), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 아스퍼질러스 테레우스 (Aspergillus terreus), 아스퍼질러스 나이거 (Aspergillus niger), 피키아 파스토리스 (Pichia pastoris), 리조푸스 아리주스 (Rhizopus arrhizus), 리조부스 오리제 (Rhizobus oryzae), 야로이와 리폴리티카 (Yarrowia lipolytica) 등이 있다. 특히 유용한 숙주 효모 유기체는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)를 포함한다.
숙주 세포로서 미생물 유기체인 세포를 특히 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위해 이용하는 것으로 일반적으로 본원에서 기술되지만, 숙주 세포는 포유류 세포주 또는 곤충 세포주와 같은 고등 진핵생물의 세포주일 수 있는 것으로 이해된다. 즉, 미생물 유기체인 숙주 세포에 대한 본원의 언급이 대안적으로 원하는 생산물을 생산하기 위해 고등 진핵생물 세포를 활용할 수 있는 것으로 이해된다. 예시적인 고등 진핵생물 세포주로는, 비-제한적으로, 중국 햄스터 난소 (CHO), 인간 (Hela, 인간 배아 신장 (HEK) 293, Jurkat), 마우스 (3T3), 영장류 (Vero), 곤충 (Sf9) 등이 있다. 이들 세포주는 상업적으로 구입가능하다 (예, the American Type Culture Collection (ATCC; Manassas VA); Life Technologies, Carlsbad CA). 임의의 적절한 숙주 세포를 이용해 본 발명의 알데하이드 데하이드로게나제를 도입하고, 선택적으로 대사 및/또는 유전자 변형을 도입하여 원하는 생산물을 생산할 수 있는 것으로 이해된다.
선택 숙주 세포의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로의 구성 요소들에 따라, 본 발명의 비-천연성 세포는 하나 이상의 외인성으로 발현되는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로-코딩 핵산, 그리고 최대한으로는 하나 이상의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 코딩하는 핵산 전부, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 위한 것, 예를 들어 본 발명의 알데하이드 데하이드로게나제를 포함할 것이다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성은, 본 발명의 알데하이드 데하이드로게나제 등의, 대응되는 코딩 핵산을 외인성으로 발현함으로써 경로 효소 또는 단백질이 결핍된 숙주에서 확립할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 위한 모든 효소 또는 단백질이 모두 결핍된 숙주의 경우, 숙주가 하나 이상의 경로 효소 또는 단백질을 포함하더라도 경로의 모든 효소 또는 단백질을 발현시킬 수 있는 것으로 이해됨에도 불구하고, 경로의 모든 효소 또는 단백질의 외인성 발현을 포함할 수 있다. 예를 들어, 본 발명의 알데하이드 데하이드로게나제를 비롯하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생산 경로에서 모든 효소 또는 단백질의 외인성 발현을 포함할 수 있다.
본원에 제공된 교시 내용 및 지침을 감안하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로를 세포에 포함시키거자 한다면, 발현가능한 형태로 도입하기 위한 코딩 핵산의 개수는 적어도 선택 숙주 세포의 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO 경로에서 결여된 것에 대응함을, 당해 기술 분야의 당업자라면 이해할 것이다. 따라서, 본 발명의 비-천연성 세포는, 본원에 기술된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 구성하는 효소 또는 단백질을 코딩하는 핵산들을, 구체적인 경로에 따라, 1, 2, 3, 4, 5, 6, 7, 8종 등, 최대한으로는, 이들 전부를 포함할 수 있다. 일부 구현예에서, 비-천연성 세포는 또한 숙주 세포에 다른 유용한 기능을 부여하는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성을 촉진하거나 또는 최적화하는 다른 유전자 변형을 포함할 수 있다. 이러한 다른 기능성으로는, 예를 들어, 아세틸-CoA 또는 아세토아세틸-CoA 등의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 전구체들 중 하나 이상의 합성 증가를 포함할 수 있다.
일반적으로, 숙주 세포는, 본 발명의 알데하이드 데하이드로게나제를 발현할 수 있으며, 선택적으로 숙주 세포에 의해 천연적으로 생산되는 전구체의 생산 증가 또는 요망하는 전구체의 데 노보 생산을 제공하는 조작된 생산물로서, 또는 천연적으로 생산되는 분자로서, 이러한 경로를 함유한 세포에서 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 전구체를 생산할 수 있도록, 선택된다. 숙주 유기체는 본원에 기술된 바와 같이 전구체의 생산을 높이도록 조작할 수 있다. 또한, 원하는 전구체를 생산하도록 조작된 세포를 숙주 유기체로서 이용할 수 있으며, 필요에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 효소 또는 단백질을 발현하도록 추가로 조작할 수 있다.
일부 구현예에서, 본 발명의 비-천연성 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 합성하는 효소 능력을 포함하는 숙주로부터 구축된다. 이러한 특정 구현예에서, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 반응을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 방향으로 향하게 하기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 생산물의 합성 또는 축적을 증가시키는 것이 유용할 수 있다. 합성 또는 축적 증가는, 예를 들어, 본 발명의 알데하이드 데하이드로게나제 등의, 전술한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질들 중 하나 이상을 코딩하는 핵산의 과발현에 의해 달성할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 효소 또는 효소들 및/또는 단백질 또는 단백질들의 과발현은, 예를 들어, 본 발명의 알데하이드 데하이드로게나제의 외인성 발현 등의, 내인성 유전자 또는 유전자들의 외인성 발현을 통해, 또는 이종의 유전자 또는 유전자들의 외인성 발현을 통해 이루어질 수 있다. 따라서, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 1, 2, 3, 4, 5, 6, 7, 8 또는 그 이상, 최대 전부 과발현시킴으로써, 예를 들어 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 발현하는, 비-천연성 세포로 천연성 유기체를 쉽게 변환시킬 수 있다. 또한, 비-천연성 유기체는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로에서 효소의 활성, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 증가시키는, 내인성 유전자의 돌연변이 유발에 통해 구축할 수 있다.
특히 유용한 구현예에서, 인코딩 핵산의 외인성 발현을 이용한다. 외인성 발현은, 사용자에 의해 조절되는 원하는 발현 수준을 달성하기 위해, 발현 및/또는 조절 요소를 맞춤 조절하는 능력을 숙주 및 어플리케이션에 부여한다. 그러나, 내인성 발현도, 유도성 프로모터 또는 다른 조절 인자와 연계되었을 경우, 유전자의 프로모터의 유도 또는 네거티브 조절 작동인자를 제거함으로써와 같이, 다른 구현예에서 이용할 수 있다. 따라서, 천연적인 유도성 프로모터를 가진 내인성 유전자는 적절한 유도성 물질을 제공함으로써 상향-조절하거나, 또는 내인성 유전자의 조절 영역을 유도성 조절 인자가 병합되도록 조작하여, 원하는 시점에 내인성 유전자의 발현 증가를 조절할 수 있다. 마찬가지로, 유도성 프로모터를 비-천연성 세포에 도입된 외인성 유전자에 대한 조절 인자로서 포함시킬 수 있다.
하나 이상의 임의의 외인성 핵산을 세포에 도입하여 본 발명의 비-천연성 세포를 제조할 수 있는 것으로 이해된다. 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산의 도입 등의, 예를 들어, 세포에 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 생합성 경로를 부여하기 위해, 핵산을 도입할 수 있다. 다른 예로, 인코딩 핵산을 도입하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성의 중간산물 생산력을 제공하기 위해 필수 반응들 중 일부를 촉매하기 위한 생합성 능력을 가진 세포를 제조할 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 가진 비-천연성 세포는 본 발명의 알데하이드 데하이드로게나제 등의 원하는 효소 또는 단백질을 코딩하는 2 이상의 외인성 핵산을 포함할 수 있다. 이에, 본 발명의 알데하이드 데하이드로게나제를 포함하여, 생합성 경로의 2 이상의 효소 또는 단백질의 임의 조합이 본 발명의 비-천연성 세포에 포함될 수 있는 것으로 이해된다. 마찬가지로, 생합성 경로의 3가지 이상의 효소 또는 단백질의 임의 조합이, 원하는 생합성 경로의 효소 및/또는 단백질의 조합으로 대응되는 원하는 생산물의 생산을 달성하는 한, 필요에 따라, 본 발명의 비-천연성 세포에 포함될 수 있는 것으로 이해된다. 마찬가지로, 본원에 기술된 생합성 경로의 4가지 이상의 효소 또는 단백질의 임의 조합이, 원하는 생합성 경로의 효소 및/또는 단백질의 조합으로 대응되는 원하는 생산물의 생산이 달성되는 한, 필요에 따라, 본 발명의 비-천연성 세포에 포함될 수 있다.
본원에 기술된 바와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성과 더불어, 본 발명의 비-천연성 세포 및 방법은 또한 다른 경로를 통해 생산물의 생합성을 달성하기 위해 서로 다양한 조합 및/또는 다른 세포 및 당해 기술 분야에 잘 알려진 방법과의 다양한 조합으로 이용할 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산체 이외의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO를 생산하기 위한 한가지 대안은, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO로 변환할 수 있는 다른 세포의 부가함으로써 이루어진다. 이러한 한가지 방법은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 생산하는 세포의 발효이다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO로 변환하는 제2 세포의 기질로서 이용할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물은 제2 유기체의 다른 배양물에 직접 첨가하거나, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물 생산체의 오리지날 배양물은, 예를 들어, 세포 분리에 의해 이들 세포를 제거한 다음 발효 브로스에 제2 유기체를 후속적으로 첨가하여 중간산물의 정제 단계없이 최종 생산물을 제조할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 관련 다운스트림 산물, 예를 들어, 이의 에스테르 또는 아미드를 생산하는 세포를, 선택적으로 상기한 다운스트림 산물을 생산하기 위해 포함시킬 수 있다.
다른 예로, 이러한 효소적 변환은, 기질을 원하는 생산물로 변환하는 결과를 달성하는 효소에 대한 순차적인 기질 노출 또는 효소들의 조합을 이용해, 시험관내에서 수행할 수 있다. 다른 대안으로서, 세포-기반의 변환 및 시험관내 효소적 변환의 조합도 필요에 따라 사용할 수 있다.
다른 구현예들에서, 본 발명의 비-천연성 세포 및 방법은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 달성하기 위해, 매우 다양한 서브-경로들로 조립될 수 있다. 이들 구현예에서, 본 발명의 원하는 생산물의 생합성 경로들은 여러가지 다른 세포들에서 분할될 수 있으며, 이들 여러 세포를 공-배양하여 최종 생산물을 생산할 수 있다. 이러한 생합성 공정에서, 하나의 세포의 생산물은 최종 생산물이 합성될 때까지 제2 세포에 대한 기질이 된다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성은 하나의 경로 중간 생산물을 다른 경로 중간산물 또는 생산물로 변환하는 생합성 경로를 포함하는 세포를 구축함으로써, 달성할 수 있다. 다른 예로, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO는 동일 용기에서 2종의 서로 다른 세포를 이용한 공동-배양 또는 공동-발효를 통해 세포로부터 생합성 방식으로 생산할 수 있으며, 이때 제1 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 중간산물을 생산하고, 제2 세포는 이들 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물로 변환한다.
본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위해, 다른 세포, 서브-경로를 구비한 다른 비-천연성 세포들의 공동-배양 및 당해 기술 분야에 잘 알려진 다른 화학적 및/또는 생화학적 공정들의 조합과 더불어, 본 발명의 비-천연성 세포 및 방법에 대해 매우 다양한 조합 및 치환들이 존재한다는 것을, 이해할 것이다.
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물에 대한 코딩 핵산의 소스는, 예를 들어, 코딩된 유전자 산물이 참조 반응을 촉매할 수 있는 임의 종일 수 있다. 이러한 종은 원핵생물 및 진핵생물 유기체 둘다를 포함하며, 비-제한적인 예로는 고세균 및 유박테리아 등의 박테리아, 및 효모, 식물, 곤충, 동물 및 포유류, 예로 인간 등의 진핵생물 등이 있다. 이러한 소스에 대한 예시적인 종으로는, 예를 들어, 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 사카로마이세스 클루이베리 (Saccharomyces kluyveri), 클로스트리듐 클루이베리 (Clostridium kluyveri), 클로스트리듐 아세토부틸리컴 (Clostridium acetobutylicum), 클로스트리듐 베이예린키이 (Clostridium beijerinckii), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 퍼프린겐스 (Clostridium perfringens), 클로스트리듐 디피실 (Clostridium difficile), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 티로부티리컴 (Clostridium tyrobutyricum), 클로스트리듐 테타노모르품 (Clostridium tetanomorphum), 클로스트리듐 테타니 (Clostridium tetani), 클로스트리듐 프로피오니컴 (Clostridium propionicum), 클로스트리듐 아미노부티리컴 (Clostridium aminobutyricum), 클로스트리듐 섭터미날 (Clostridium subterminale), 클로스트리듐 스티클란디이 (Clostridium sticklandii), 랄스토니아 유트로파 (Ralstonia eutropha), 마이코박테리움 보비스 (Mycobacterium bovis), 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 테르무스 써모필러스 (Thermus thermophilus), 슈도모나스 종 (Pseudomonas species), 예를 들어, 슈도모나스 에어루지노사 (Pseudomonas aeruginosa), 슈도모나스 푸티다 (Pseudomonas putida), 슈도모나스 스투체리 (Pseudomonas stutzeri), 슈도모나스 플루오레센스 (Pseudomonas fluorescens), 호모 사피엔스 (Homo sapiens), 오리크톨라구스 쿠니쿨러스 (Oryctolagus cuniculus), 로도박터 스페어로이데스 (Rhodobacter spaeroides), 서모안에어로박터 브록키이 (Thermoanaerobacter brockii), 메탈로스페라 세둘라 (Metallosphaera sedula), 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides), 클로로플렉수스 아우란티아쿠스 (Chloroflexus aurantiacus), 로세이플렉수스 카스텐홀지이 (Roseiflexus castenholzii), 에리트로박터 (Erythrobacter), 심몬드시아 치넨시스 (Simmondsia chinensis), 아시네토박터 종, 예를 들어, 아시네토박터 칼코아세티쿠스 (Acinetobacter calcoaceticus) 및 아시네토박터 베일리이 (Acinetobacter baylyi), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 설폴로부스 토코다이 (Sulfolobus tokodaii), 설폴로부스 솔파타리쿠스 (Sulfolobus solfataricus), 설폴로부스 아시도칼다리우스 (Sulfolobus acidocaldarius), 바실러스 섭틸리스 (Bacillus subtilis), 바실러스 세레우스 (Bacillus cereus), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 브레비스 (Bacillus brevis), 바실러스 푸밀루스 (Bacillus pumilus), 라투스 노르베기쿠스 (Rattus norvegicus), 클렙시엘라 뉴모니아 (Klebsiella pneumonia), 클렙시엘라 옥시토카 (Klebsiella oxytoca), 유클레나 글라실리스 (Euglena gracilis), 트레포네마 덴티콜라 (Treponema denticola), 모렐라 서모아세티카 (Moorella thermoacetica), 서모토가 마리티마 (Thermotoga maritima), 할로박테리움 살리나룸 (Halobacterium salinarum), 지오바실러스 스테아로서모필러스 (Geobacillus stearothermophilus), 에어로피룸 퍼닉스 (Aeropyrum pernix), 수스 스크로파 (Sus scrofa), 케어노라브디티스 엘레강스 (Caenorhabditis elegans), 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 아시다미노코커스 퍼멘탄스 (Acidaminococcus fermentans), 락토코커스 락티스 (Lactococcus lactis), 락토바실러스 플란타룸 (Lactobacillus plantarum), 스트렙토코커스 서모필러스 (Streptococcus thermophilus), 엔테로박터 에어로게네스 (Enterobacter aerogenes), 칸디다 (Candida), 아스퍼질러스 테레우스 (Aspergillus terreus), 페디코커스 펜토사세우스 (Pedicoccus pentosaceus), 자이모모나스 모빌러스 (Zymomonas mobilus), 아세토박터 파스테리안스 (Acetobacter pasteurians), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 유박테리움 바르케리 (Eubacterium barkeri), 박테로이데스 카필로수스 (Bacteroides capillosus), 안에어로트룬쿠스 콜리호미니스 (Anaerotruncus colihominis), 나트란에어로비우스 서모필러스 (Natranaerobius thermophilusm), 캄필로박터 제주니 (Campylobacter jejuni), 헤모필러스 인플루엔자 (Haemophilus influenzae), 세라티아 마르세센스 (Serratia marcescens), 시트로박터 아말로나티쿠스 (Citrobacter amalonaticus), 믹소코커스 크산투스 (Myxococcus xanthus), 푸조박테리움 뉼레아툼 (Fusobacterium nuleatum), 페니실리움 크리소게눔 (Penicillium chrysogenum), 해양 감마 프로테오박테리움 (marine gamma proteobacterium), 부티레이트-생산 박테리암 (butyrate-producing bacterium), 노카르디아 오웬시스 (Nocardia iowensis), 노카르디아 파르시니카 (Nocardia farcinica), 스트렙토마이세스 그리세우스 (Streptomyces griseus), 시조사카로마이세스 품베 (Schizosaccharomyces pombe), 지오바실러스 서모글루코시다시우스 (Geobacillus thermoglucosidasius), 살모넬라 티피무리움 (Salmonella typhimurium), 비브리오 콜레라 (Vibrio cholera), 헬리오박터 필로리 (Heliobacter pylori), 니코티아나 타바쿰 (Nicotiana tabacum), 오리자 사티바 (Oryza sativa), 할로페락스 메디테라네이 (Haloferax mediterranei), 아그로박테리움 투메팍시엔스 (Agrobacterium tumefaciens), 아크로모박터 데니트리피칸스 (Achromobacter denitrificans), 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 스트렙토마이세스 클라불리게누스 (Streptomyces clavuligenus), 아시네토박터 바우마니이 (Acinetobacter baumanii), 무스 무스쿨러스 (Mus musculus), 라찬시아 클루이베리 (Lachancea kluyveri), 트리코모나스 바기날리스 (Trichomonas vaginalis), 트리파노소마 브루세이 (Trypanosoma brucei), 슈도모나스 스투체리 (Pseudomonas stutzeri), 브라디리조븀 자포니컴 (Bradyrhizobium japonicum), 메소리조븀 로티 (Mesorhizobium loti), 보스 타우루스 (Bos taurus), 니코티아나 글루티노사 (Nicotiana glutinosa), 비브리오 불니피쿠스 (Vibrio vulnificus), 셀레노모나스 루미난튬 (Selenomonas ruminantium), 비브리오 파라헤몰리티쿠스 (Vibrio parahaemolyticus), 아르케오글로부스 풀기두스 (Archaeoglobus fulgidus), 할로아르쿨라 마리스모르투이 (Haloarcula marismortui), 피로바쿨룸 에어로필럼 (Pyrobaculum aerophilum), 미코박테리움 스메그마티스 (Mycobacterium smegmatis), MC2 155, 미코박테리움 아븀 아종 파라투베르쿨로시스 K-10 (Mycobacterium avium subsp . paratuberculosis K-10), 미코박테리움 마리눔 M (Mycobacterium marinum M), 츠카무렐라 파우로메타볼라 (Tsukamurella paurometabola) DSM 20162, 시아노븀 PCC7001, 딕티오스텔륨 디스코이데움 AX4 (Dictyostelium discoideum AX4), 아시다미노코커스 퍼멘탄스 (Acidaminococcus fermentans), 아시네토박터 베일리이 (Acinetobacter baylyi), 아시네토박터 칼코아세티쿠스 (Acinetobacter calcoaceticus), 아쿠이페스 에어올리쿠스 (Aquifex aeolicus), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 아르케오글로부스 풀기두스 (Archaeoglobus fulgidus), 아스퍼질러스 나이거 (Aspergillus niger), 아스퍼질러스 테레우스 (Aspergillus terreus), 바실러스 섭틸리스 (Bacillus subtilis), 보스 타우루스 (Bos Taurus), 칸디다 알비칸스 (Candida albicans), 칸디다 트로피칼리스 (Candida tropicalis), 클라미도모나스 라인하르드티이 (Chlamydomonas reinhardtii), 클로로븀 테피둠 (Chlorobium tepidum), 시트로박터 코세리 (Citrobacter koseri), 시트러스 주노스 (Citrus junos), 클로스트리듐 아세토부틸리컴 (Clostridium acetobutylicum), 클로스트리듐 클루이베리 (Clostridium kluyveri), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 시아노븀 PCC7001, 데설파티바실륨 아케니보란스 (Desulfatibacillum alkenivorans), 딕티오스텔리움 디스코이데움 (Dictyostelium discoideum), 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 할로아르쿨라 마리스모르투이 (Haloarcula marismortui), 호모 사피엔스 (Homo sapiens), 하이드로게노박터 서모필러스 (Hydrogenobacter thermophilus), 클렙시엘라 뉴모니애 (Klebsiella pneumoniae), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 락토바실러스 브레비스 (Lactobacillus brevis), 루노코스톡 메센테로이데스 (Leuconostoc mesenteroides), 메탈로스페라 세둘라 (Metallosphaera sedula), 메타노서모박터 서마우토트로피쿠스 (Methanothermobacter thermautotrophicus), 무스 무스쿨러스 (Mus musculus), 미코박테리움 아븀 (Mycobacterium avium), 미코박테리움 보비스 (Mycobacterium bovis), 미코박테리움 마리눔 (Mycobacterium marinum), 미코박테리움 스메그마티스 (Mycobacterium smegmatis), 니코티아나 타바쿰 (Nicotiana tabacum), 노카르디아 오웬시스 (Nocardia iowensis), 오릭톨라구스 쿠니쿨러스 (Oryctolagus cuniculus), 페니실리움 크리소게눔 (Penicillium chrysogenum), 피키아 파스토리스 (Pichia pastoris), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 슈도모나스 에어루지노사 (Pseudomonas aeruginosa), 슈도모나스 푸티다 (Pseudomonas putida), 슈도모나스 에어로필럼 (Pyrobaculum aerophilum), 랄스토니아 유트로파 (Ralstonia eutropha), 라투스 노르베기쿠스 (Rattus norvegicus), 로도박터 스페어로이데스 (Rhodobacter sphaeroides), 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 살모넬라 엔테릭 (Salmonella enteric), 살모넬라 티피무리움 (Salmonella typhimurium), 시조사카로마이세스 폼베 (Schizosaccharomyces pombe), 설폴로부스 아시도칼다리우스 (Sulfolobus acidocaldarius), 설폴로부스 솔파타리쿠스 (Sulfolobus solfataricus), 설폴로부스 토코다이 (Sulfolobus tokodaii), 서모안에어로박터 텡콩엔시스 (Thermoanaerobacter tengcongensis), 터무스 서모필러스 (Thermus thermophilus), 트리파노소마 브루세이 (Trypanosoma brucei), 츠카무렐라 파우로메타볼라 (Tsukamurella paurometabola), 야로이야 리폴리티카 (Yarrowia lipolytica), 주글로에아 라미게라 (Zoogloea ramigera), 및 자이모모나스 모빌리스 (Zymomonas mobilis), 클로스트리듐 종, 예를 들어, 비-제한적으로, 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 베이예린키이 (Clostridium beijerinckii), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 메틸펜토섬 (Clostridium methylpentosum), 클로스트리듐 스티클란디이 (Clostridium sticklandii), 클로스트리듐 피토퍼멘탄스 (Clostridium phytofermentans), 클로스트리듐 사카로라이티컴 (Clostridium saccharolyticum), 클로스트리듐 아스파라기포르메 (Clostridium asparagiforme), 클로스트리듐 셀라툼 (Clostridium celatum), 클로스트리듐 카르복시디보란스 (Clostridium carboxidivorans), 클로스트리듐 클로스트리디오포르메 (Clostridium clostridioforme), 클로스트리듐 볼테아 (Clostridium bolteae), 칼달칼리바실러스 서마룸 (Caldalkalibacillus thermarum), 클로스트리듐 보툴리눔 (Clostridium botulinum), 펠로시누스 퍼멘탄스 (Pelosinus fermentans), 서모안에어로박테리움 서모사카로라이티컴 (Thermoanaerobacterium thermosaccharolyticum), 데설포스포로시누스 종 (Desulfosporosinus speices), 서모안에어로박테리움 종, 비-제한적인 예로, 서모안에어박테리움 사카로라이티컴 (Thermoanaerobacterium saccharolyticum), 서모안에어로박테리움 크실라놀라이티컴 (Thermoanaerobacterium xylanolyticum), 아세토네마 롱검 (Acetonema longum), 지오바실러스 종, 비-제한적인 예로, 지오바실러스 서모글루코시단스 (Geobacillus thermoglucosidans), 바실러스 아조토포르만스 (Bacillus azotoformans), 서민콜라 포텐스 (Thermincola potens), 푸조박테리움 종, 비-제한적인 예로, 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 푸조박테리움 울세란스 (Fusobacterium ulcerans), 푸조박테리움 바륨 (Fusobacterium varium), 루미노코커스 종 (Ruminococcus species), 비-제한적인 예로, 루미노코커스 그나부스 (Ruminococcus gnavus), 루미노코커스 오베움 (Ruminococcus obeum), 라크노스피라시이 박테리움 (Lachnospiraceae bacterium), 플라보니프락토 플라우티이 (Flavonifractor plautii), 로세부리아 이눌린이보란스 (Roseburia inulinivorans), 아세토박테리움 우디이 (Acetobacterium woodii), 유박테리움 종, 비-제한적인 예로, 유박테리움 프렉시카우다툼 (Eubacterium plexicaudatum), 유박테리움 할리이 (Eubacterium hallii), 유박테리움 리모숨 (Eubacterium limosum), 유박테리움 이우리이 (Eubacterium yurii), 유박테리아시이 박테리움 (Eubacteriaceae bacterium), 서모세디미니박터 오세아니 (Thermosediminibacter oceani), 일리오박터 폴리트로푸스 (Ilyobacter polytropus), 셔틀워티아 사텔레스 (Shuttleworthia satelles), 할안에어로븀 사카로라이티컴 (Halanaerobium saccharolyticum), 서모안에어로박터 에타놀리쿠스 (Thermoanaerobacter ethanolicus), 로도스피릴룸 루브룸 (Rhodospirillum rubrum), 비브리오 (Vibrio), 프로피오니박테리움 프로피오니컴 (Propionibacterium propionicum)뿐 아니라 본원에 기술되거나 또는 해당 유전자에 대한 소스 유기체로서 이용가능한 다른 예시 종들, 예를 들어 표 4에 기술된 알데하이드 데하이드로게나제의 소스 유기체 등이 있다. 그러나, 미생물 게놈 395종 및 다양한 효모, 진균, 식물 및 포유류 게놈을 비롯한, 현재 550종 이상에서 이용가능한 전체 게놈 서열을 이용해 (NCBI와 같은 공공의 데이터베이스에서 이용가능한 데이타의 절반 이상을 이용해), 공지 유전자의 상동체, 오르소로그, 파라로그 및 비-오르소로거스 유전자 치환 등의, 관련 또는 동떨어진 종들에서 하나 이상의 유전자에 대한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 활성을 코딩하는 유전자의 동정, 및 유기체들 간의 유전자 변형의 상호 교환은 일반적이며, 당해 기술 분야에 잘 알려져 있다. 이에, E. coli와 같은 특정 유기체를 참조하여 본원에 기술된, 본 발명의 알데하이드 데하이드로게나제의 발현 등의, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 허용하는 대사 변형은, 비슷한 원핵생물 및 진핵생물 유기체 등의, 미생물과 같은 다른 세포에도 쉽게 적용할 수 있다. 본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면 하나의 유기체에서 예시된 대사 변형이 다른 유기체에도 동일하게 적용할 수 있음을 알 것이다.
대안적인 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로가 비-관련 종에서 존재하는 경우에서와 같은 일부 경우에, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성은, 예를 들어, 참조 반응을 대체하기 위해 유사하지만 동일하진 않은 대사 반응을 촉매하는 비-관련 종들로부터 파라로그 또는 파라로그들의 외인성 발현에 의해, 숙주 종에 부여할 수 있다. 여러가지 유기체들 간에 대사 네트워크에 일부 차이가 존재하므로, 당해 기술 분야의 당업자라면, 서로 다른 유기체들 간의 실제 유전자 용법 (gene usage)이 다를 수 있음을 이해할 것이다. 그러나, 본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 또한 본 발명의 교시 내용 및 방법을, 본 발명의 알데하이드 데하이드로게나제를 도입하는 것을 포함하여, 필요에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 합성할 세포를 대상 종에서 구축하기 위해 본원에 예시된 내용에 대한 동계 (cognate) 대사 변형을 이용하여 모든 세포에 적용할 수 있음을, 이해할 것이다.
본 발명의 알데하이드 데하이드로게나제를 포함하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 비-천연성 숙주를 구축 및 발현 수준을 검사하는 방법은, 예를 들어, 당해 기술 분야에 잘 알려진 재조합 및 검출 방법에 의해 수행할 수 있다. 이러한 방법은 예를 들어, Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에서 확인할 수 있다.
본 발명의 알데하이드 데하이드로게나제를 코딩하는 외인성 핵산, 및 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생산 경로에 참여하는 외인성 핵산은, 비-제한적인 예로, 접합, 전기천공, 화학적 형질전환, 형질도입, 형질감염 및 초음파 형질전환 등의 당해 기술 분야에 잘 알려진 기법을 이용해 숙주 세포에 안정적으로 또는 일시적으로 도입시킬 수 있다. E. coli 또는 기타 원핵생물 세포에서 외인성 발현을 위해, 진핵생물 핵산의 유전자 또는 cDNA 내 일부 핵산 서열은, 필요에 따라, 원핵생물 숙주 세포에 형질전환하기 전에 제거될 수 있는, N-말단 미토콘드리아 또는 그외 타겟팅 신호와 같은 타겟팅 신호를 코딩할 수 있다. 예를 들어, 미토콘드리아 리더 서열의 제거는 E. coli에서 발현 증가를 유도한다 (Hoffmeister et al., J. Biol . Chem. 280:4329-4338 (2005)). 효모 또는 기타 진핵생물 세포에서 외인성 발현을 위해, 유전자는 리더 서열 부가 없이 세포질에서 발현시키거나, 또는 숙주 세포에 적합한 미토콘드리아 타겟팅 또는 방출 신호와 같은 적합한 타겟팅 서열을 부가함으로써, 미토콘드리아 또는 그외 소기관으로 타겟팅하거나 또는 분비하도록 타겟팅할 수 있다. 따라서, 타겟팅 서열을 제거 또는 포함하기 위한 핵산 서열에의 적절한 변형은 원하는 특성을 부여하기 위해 외인성 핵산 서열에 포함시킬 수 있는 것으로 이해된다. 또한, 유전자는 단백질의 최적화된 발현을 달성하기 위해 당해 기술 분야에 잘 알려진 기법으로 코돈 최적화를 이행할 수 있다.
발현 벡터 또는 벡터는, 본원에 예시된 바와 같이, 숙주 유기체에서 발현 조절 서열 기능에 작동가능하게 연결된, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산, 및/또는 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 코딩하는 하나 이상의 핵산, 또는 이의 에스테르 또는 아미드와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 포함하도록 구축할 수 있다. 본 발명의 숙주 세포에서 이용하기 위해 적용가능한 발현 벡터로는, 예를 들어, 벡터 및 숙주 염색체에 안정적으로 삽입하기 위해 작동가능한 선택 서열 또는 마커를 비롯하여, 플라스미드, 파지 벡터, 바이러스 벡터, 에피솜 및 인공 염색체 등이 있다. 또한, 발현 벡터는 하나 이상의 선별가능한 마커 유전자 및 적절한 발현 조절 서열을 포함할 수 있다. 또한, 예를 들어, 항생제 또는 독소에 대해 내성을 제공하거나, 영양요구성 결핍을 보완하거나 또는 배양 배지에 없는 중요한 영양분을 공급하는, 선별가능한 마커 유전자가 포함될 수 있다. 발현 조절 서열은 당해 기술 분야에 잘 공지되어 있는 구성적인 (constitutive) 프로모터, 유도성 프로모터, 전사 인핸서, 전사 종결인자 등을 포함할 수 있다. 2 이상의 외인성 코딩 핵산을 공동-발현시킬 경우, 이들 2종의 핵산은, 예를 들어, 단일한 발현 벡터에 또는 분리된 발현 벡터들에 삽입시킬 수 있다. 단일한 벡터 발현의 경우, 코딩 핵산에 하나의 공통적인 발현 조절 서열을 작동가능하게 연결하거나 또는 유도 프로모터 1개 및 구성적 프로모터 1개 등의 서로 다른 발현 조절 서열을 작동가능하게 연결할 수 있다. 본 발명의 알데하이드 데하이드로게나제 또는 대사 또는 합성 경로에 참여하는 폴리펩타이드를 코딩하는 외인성 핵산 서열의 형질전환은 당해 기술 분야에 잘 알려진 방법으로 검증할 수 있다. 이러한 방법으로는, 예를 들어, mRNA의 노던 블롯 또는 폴리머라제 연쇄 반응 (PCR) 증폭과 같은 핵산 분석, 또는 유전자 산물 발현에 대한 면역블롯팅, 또는 도입된 핵산 서열 또는 이의 대응되는 유전자 산물의 발현을 검사하기 위한 그외 적절한 분석 방법 등이 있다. 당해 기술 분야의 당업자라면, 외인성 핵산이 원하는 생산물을 생산하기에 충분한 양으로 발현되는 것으로 이해하며, 또한 당해 기술 분야에 잘 알려진 방법 및 본원에 기술된 방법을 이용해 충분한 발현을 수득하도록 발현 수준을 최적화할 수 있음을 알 것이다.
또한, 벡터 또는 발현 벡터를 이용해 코딩 핵산을 발현시켜 시험관내 전사 및 번역에 의해 코딩된 폴리펩타이드를 생산할 수 있다. 이러한 벡터 또는 발현 벡터는 적어도 프로모터를 포함할 것이며, 전술한 벡터를 포함할 것이다. 시험관내 전사 및 번역에서 상기한 벡터는 일반적으로 이중 가닥 DNA이다. 시험관내 전사 및 번역 방법은 당해 기술 분야의 당업자들에게 공지되어 있다 (Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999) 참조). 시험관내 전사 및 번역을 위한 키트들 역시 상업적으로 구입가능하다 (예, Promega, Madison, WI; New England Biolabs, Ipswich, MA; Thermo Fisher Scientific, Carlsbad, CA).
일 구현예에서, 본 발명은, 본 발명의 세포를 배양하여 3-HBal 및/또는 1,3-BDO 또는 이의 에스테르 또는 아미드를 생산하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이의 에스테르 또는 아미드의 생산 방법을 제공한다. 이러한 세포는 본 발명의 폴리펩타이드를 발현한다. 일 구현예에서, 본 발명은, 본 발명의 세포를 배양하여 4-HBal 및/또는 1,4-BDO 또는 이의 에스테르 또는 아미드를 생산하는 것을 포함하는, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이의 에스테르 또는 아미드의 생산 방법을 제공한다. 일 구현예에서, 세포는 실질적으로 혐기성 배양 배지에 존재한다. 일 구현예에서, 이 방법은 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 또는 이의 에스테르 또는 아미드를 단리 또는 정제하는 것을 더 포함할 수 있다. 특정 구현예에서, 단리 또는 정제는 증류를 포함한다.
일 구현예에서, 본 발명은, 생산물을 생산하는 반응으로 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 자체적으로 또는 다른 화합물과 화학적으로 반응시키는 것을 포함하는, 본 발명의 생산물의 생산 방법을 제공한다.
일 구현예에서, 본 발명은, 본 발명의 폴리펩타이드에 기질을 제공하고, 그 기질을 3-HBal 및/또는 1,3-BDO로 변환하는 것을 포함하며, 기질이 1,3-하이드록시부티릴-CoA의 라세믹 혼합물인, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 R 형태로 거울상이성질체 측면에서 농화된다. 일 구현예에서, 본 발명은, 기질을 본 발명의 폴리펩타이드에 제공하고, 그 기질을 4-HBal 및/또는 1,4-BDO로 변환하는 것을 포함하며, 기질이 1,4-하이드록시부티릴-CoA인, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 일 구현예에서, 폴리펩타이드는 세포에, 세포용해물에 존재하거나 또는 세포 또는 세포용해물로부터 단리한다.
일 구현예에서, 본 발명은, 본 발명의 세포의 세포용해물을 인큐베이션하여 3-HBal 및/또는 1,3- BDO, 또는 4-HBal 및/또는 1,4-BDO를 생산하는 것을 포함하는, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 제조 방법을 제공한다. 일 구현예에서, 세포용해물을 제2 세포용해물과 혼합하며, 제2 세포용해물은 본 발명의 폴리펩타이드의 기질, 또는 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 다운스트림 산물을 생산하기 위한 효소 활성을 포함한다.
또한, 본 발명은, 세포에서 폴리펩타이드를 발현시키는 것을 포함하는, 본 발명의 폴리펩타이드를 제조하는 방법을 제공한다. 본 발명은 부가적으로 본 발명의 핵산 또는 본 발명의 벡터를 시험관내 전사 및 번역하여 폴리펩타이드를 제조하는 것을 포함하는, 본 발명의 폴리펩타이드의 제조 방법을 제공한다.
본원에 기술된 바와 같이, 세포를 이용해 본 발명의 알데하이드 데하이드로게나제를 발현시킬 수 있으며, 선택적으로 세포는 본 발명의 알데하이드 데하이드로게나제를 이용해 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO와 같은 원하는 생산물을 생산하는 대사 경로를 포함할 수 있다. 원하는 생산물을 발현하는 이러한 방법이 본원에 기술된다. 다른 예로, 본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제를 발현시키거나, 및/또는 원하는 생산물을 세포용해물로, 예를 들어 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포 또는 본 발명의 알데하이드 데하이드로게나제와 원하는 생산물을 생산하기 위한 대사 경로를 발현하는 세포의 세포용해물로 생산할 수 있다. 다른 구현예에서, 본 발명의 알데하이드 데하이드로게나제는, 알데하이드 데하이드로게나제가 비-세포성 (cell-free) 시스템에서 제조되는, 시험관내 전사 및 번역에 의해 발현시킬 수 있다. 시험관내 전사 및 번역에 의해 발현된 알데하이드 데하이드로게나제를 이용해 시험관내에서 반응을 수행할 수 있다. 선택적으로, 기타 효소 또는 이러한 효소를 함유한 세포용해물(들)을 이용해, 알데하이드 데하이드로게나제 효소 반응의 생산물을 원하는 다운스트림 산물로 시험관내에서 변환할 수 있다.
알데하이드 데하이드로게나제의 활성을 검사하기 위한 분석을 포함하여, 알데하이드 데하이드로게나제의 발현, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물에 대한 적절한 정제 및/또는 이를 검사하기 위한 분석은, 잘 알려진 방법을 이용해 수행할 수 있다 (실시예 참조). 검사할 각 조작된 균주를 트리플리케이트 (triplicate) 배양과 같은 적절한 리플리케이트로 배양할 수 있다. 예를 들어, 조작된 생산 숙주에서 생산물 및 부산물의 형성을 모니터링할 수 있다. 최종 생산물 및 중간산물, 및 기타 유기 화합물은 HPLC (고 성능 액체 크로마토그래피), GC-MS (가스 크로마토그래피-질량 분광분석) 및 LC-MS (액체 크로마토그래피-질량 분광분석) 또는 당해 기술 분야에서 잘 알려진 통상적인 공정을 이용한 그외 적합한 분석 방법 등의 방법으로 분석할 수 있다. 발효 브로스로의 생산물의 방출은 또한 배양 상층액을 사용해 검사할 수 있다. 부산물 및 잔류 글루코스는, 예를 들어, 글루코스 및 알코올에 대한 굴절율 검출기, 및 유기산에 대한 UV 검출기를 이용해, HPLC에 의해 또는 당해 기술 분야에 잘 알려진 그외 적합한 분석 및 검출 방법으로 정량할 수 있다 (Lin et al., Biotechnol . Bioeng. 90:775-779 (2005)). 또한, 외인성 DNA 서열로부터 유래되는 개별 효소 또는 단백질의 활성은 당해 기술 분야에 잘 알려진 방법을 이용해 분석할 수 있다 (실시예 참조).
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 그외 원하는 생산물, 예를 들어, 이의 에스테르 또는 아미드와 같은 이와 관련있는 다운스트림 산물은, 당해 기술 분야에 잘 알려진 다양한 방법을 이용해 배양물에서 다른 성분들로부터 분리할 수 있다. 이러한 분리 방법으로는, 예를 들어, 추출 공정뿐 아니라 연속적인 액체-액체 추출, 투석증발 (pervaporation), 막 여과, 막 분리, 역 삼투압, 전기 투석, 증류, 결정화, 원심분리, 추출 여과 (extractive filtration), 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 흡착 크로마토그래피 및 초미세여과를 포함하는 방법 등이 있다. 전술한 방법들 모두 당해 기술 분야에 잘 공지되어 있다.
본원에 기술된 본 발명의 알데하이드 데하이드로게나제를 발현하는 임의의 비-천연성 세포를 배양하여 본 발명의 생합성 생산물을 생산 및/또는 분비시킬 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 세포는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생합성 생산하기 위해 배양할 수 있다. 즉, 일부 구현예에서, 본 발명은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 본원에 기술된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 함유한 배양 배지를 제공한다. 일부 측면에서, 배양 배지는 또한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 생산하는 본 발명의 비-천연성 세포로부터 분리할 수 있다. 배양 배지로부터 세포를 분리하는 방법은 당해 기술 분야에 잘 공지되어 있다. 예시적인 방법으로는 여과, 응집 (flocculation), 석출, 원심분리, 침강 등이 있다.
본 발명의 알데하이드 데하이드로게나제를 발현하는 세포에서, 본 발명의 알데하이드 데하이드로게나제, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위해, 재조합 균주를 탄소원 및 기타 필수 영양분이 첨가된 배지에서 배양한다. 전체 공정의 비용을 줄이기 위해 발효 장치를 혐기성 상태로 유지시키는 것이 종종 바람직하며, 매우 바람직할 수 있다. 이러한 조건은, 예를 들어, 배지를 질소로 퍼징한 다음 격막 (septum) 및 크림프-캡 (crimp-cap)으로 플라스크를 밀봉함으로써, 달성할 수 있다. 혐기성 상태에서는 증식이 관찰되지 않는 균주의 경우, 격막에 제한적인 호기를 위해 작은 구멍을 뚫어 미세호기 (microaerobic) 또는 실질적으로 혐기 조건을 적용할 수 있다. 예시적인 혐기 조건들은 기존에 기술되어 있으며, 당해 기술 분야에 잘 알려져 있다. 예시적인 호기 및 혐기 조건들은 2007년 8월 10일에 출원된 미국 특허 공개공보 2009/0047719에 기술되어 있다. 발효는 본원에 기술된 바와 같이 배치, 피드-배치 또는 연속적인 방식으로 수행할 수 있다. 또한, 발효는 필요에 따른 2 단계로 수행할 수 있다. 제1 단계는 높은 증식, 즉 높은 생산성을 허용하기 위해 호기성 단계일 수 있으며, 그 후 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물과 같은 원하는 생산물의 고 수율을 위한 혐기성 단계가 후속될 수 있다.
배지의 pH는, 필요에 따라 배양 배지를 원하는 pH에서 유지시키기 위해, NaOH와 같은 염기 또는 기타 염기 또는 산을 첨가함으로써, 원하는 pH, 특히 중성 pH, 예를 들어 약 pH 7에서 유지할 수 있다. 증식율은 분광광도계 (600 nm)를 사용해 광학 밀도를 측정함으로써 확인할 수 있으며, 글루코스 흡수율 (glucose uptake rate)은 시간 경과에 따른 탄소원 고갈을 모니터링함으로써 결정할 수 있다.
증식 배지는, 예를 들어, 비-천연성 세포에 탄소원을 공급할 수 있는, 임의의 탄수화물 소스를 포함할 수 있다. 이러한 소스로는, 예를 들어, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프럭토스, 슈크로스 및 전분과 같은 당; 또는 글리세롤 등이 있으며, 탄소원은 유일한 탄소원으로서 단독으로 또는 본원에 기술되거나 당해 기술 분야에 공지된 다른 탄소원과 조합하여 사용할 수 있다. 그외 탄수화물 소스로는 예를 들어 재생가능한 공급원료 (renewable feedstock) 및 바이오매스 (biomass) 등이 있다. 본 발명의 방법에서 공급원료로서 사용될 수 있는 바이오매스의 타입의 예로는 셀룰로스 바이오매스, 헤미셀룰로스 바이오매스 및 리그닌 공급원료 또는 공급원료의 일부 등이 있다. 이러한 바이오매스 공급원료는, 예를 들어, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프럭토스 및 전분과 같은 탄소원으로서 유용한 탄수화물 물질을 포함한다. 본원에 제공된 교시 내용 및 지침을 고려하여, 당해 기술 분야의 당업자라면, 상기에 예시된 것 이외의 재생가능한 공급원료 및 바이오매스 역시 본 발명의 알데하이드 데하이드로게나제를 발현시키고, 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이의 다운스트림 산물을 생산하기 위해, 본 발명의 세포를 배양하는데 사용할 수 있음을, 알 것이다.
상기에 예시된 것과 같은 재생가능한 공급원료 외에도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이의 다운스트림 산물을 생산하는 본 발명의 세포는, 또한 이의 탄소원으로서 합성가스 (syngas)에서 증식하도록 변형할 수 있다. 이러한 구체적인 구현예에서, 하나 이상의 단백질 또는 효소를 HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산 유기체에서 발현시켜, 합성가스 또는 기타 기체성 탄소원을 이용하는 대사 경로를 제공한다.
합성가스 또는 발생로 가스 (producer gas)로도 알려진 합성 가스 (synthesis gas)는, 석탄 및 농업 작물 및 잔재 (residues) 등의 바이오매스 물질과 같은 탄소질 물질의 주요 기화 산물이다. 합성 가스는 주로 H2 및 CO로 구성된 혼합물이며, 비-제한적인 예로, 석탄, 석탄 오일, 천연 가스, 바이오매스 및 폐기 유기물 등의 임의의 유기 공급원료의 기화로부터 수득할 수 있다. 기화는 일반적으로 높은 연료/산소 비율 하에 수행된다. 합성 가스는 주로 H2 및 CO이지만, CO2 및 기타 기체도 소량 포함할 수 있다. 따라서, 합성 가스는 CO, 추가적으로 CO2 등의 가스성 탄소에 대한 비용 효율적인 소스를 제공한다.
우드-룬달 (Wood-Ljungdahl) 경로는 CO와 H2를 아세틸-CoA와 아세테이트 등의 기타 생산물로 변환하는 반응을 촉매한다. 또한, CO 및 합성 가스를 이용할 수 있는 유기체는, 일반적으로, 우드-룬달 경로에 포함된 효소 및 변환으로 된 동일한 기본 세트를 통해, CO2 및 CO2/H2 혼합물을 이용할 수 있는 능력을 가지고 있다. 또한, 동일 유기체가 CO를 이용할 수 있고 동일한 경로가 관여한다는 것이 밝혀지기 전에는, 오랫동안 미생물이 이산화탄소를 H2-의존적인 방식으로 아세테이트로 변환하는 것으로 인지하였다. 수소가 존재하여 필요한 환원 당량을 제공하는 한, 여러 아세토젠 (acetogen)들이 이산화탄소의 존재 하에 증식해 아세테이트와 같은 화합물을 생산하는 것으로 확인된 바 있다 (예, Drake, Acetogenesis, pp. 3-60 Chapman and Hall, New York, (1994) 참조). 이를 아래 등식으로 요약할 수 있다:
2CO2 + 4H2 + nADP + nPi → CH3COOH + 2H2O + nATP
그래서, 우르-룬달 경로를 가진 비-천연성 미생물은 CO2 및 H2 혼합물을 이용할 수 있을 뿐만 아니라 아세틸-CoA 및 기타 원하는 생산물을 생산할 수 있다.
우드-룬달 경로는 당해 기술 분야에 잘 알려져 있으며, 2개의 분지, 즉 (1) 메틸 분지와 (2) 카보닐 분지로 나눌 수 있는 12가지 반응으로 구성되어 있다. 메틸 분지는 합성 가스를 메틸-테트라하이드로폴레이트(메틸-THF)로 변환하고, 카보닐 분지는 메틸-THF를 아세틸-CoA로 변환한다. 메틸 분지에서의 반응들은 다음과 같은 효소 또는 단백질에 의해 순차적으로 촉매된다: 페레독신옥시도리덕타제, 포르메이트 데하이드로게나제, 포르밀테트라하이드로폴레이트 신테타제, 메테닐테트라하이드로폴레이트 사이클로데하이드라타제, 메틸렌테트라하이드로폴레이트 데하이드로게나제 및 메틸렌테트라하이드로폴레이트 리덕타제. 카르보닐 분지에서의 반응들은 다음과 같은 효소 또는 단백질에 의해 순차적으로 촉매된다: 메틸테트라하이드로폴레이트:코리노이드 단백질 메틸트랜스퍼라제 (예, AcsE), 코리노이드 철-황 단백질, 니켈-단백질 어셈블리 단백질 (예, AcsF), 페레독신, 아세틸-CoA 신타제, 카본 모노옥사이드 데하이드로게나제 및 니켈-단백질 어셈블리 단백질 (예, CooC) (WO2009/094485 참조). 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 등의, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 제조하기 위한 충분한 개수로 코딩 핵산을 도입하는 것에 대한 본원에 제공된 교시 내용 및 지침에 따라, 당해 기술 분야의 당업자라면, 적어도 숙주 유기체에 존재하지 않는 우드-룬달 효소 또는 단백질을 코딩하는 핵산을 도입하는 것과 관련하여, 동일한 조작 설계를 수행할 수 있음을 이해할 것이다. 즉, 변형된 유기체에 우드-룬달의 전체 경로가 포함되도록 하나 이상의 코딩 핵산을 본 발명의 세포에 도입함으로써, 합성가스의 이용 능력을 부여하게 될 것이다.
또한, 일산화탄소 데하이드로게나제 활성 및/또는 하이드로게나제 활성과 커플링된 환원성(역) 트리카르복시산 사이클은, CO, CO2 및/또는 H2를 아세틸-CoA 및 아세테이트와 같은 기타 생산물로 변환하는데, 이용할 수 있다. 환원성 TCA 경로를 통해 탄소를 고정할 수 있는 유기체는 하나 이상의 다음과 같은 효소를 이용할 수 있다: ATP 사이트레이트-리아제, 사이트레이트 리아제, 아코니타제, 이소사이트레이트 데하이드로게나제, α-케토글루타레이트:페레독신옥시도리덕타제, 숙시닐-CoA 신테타제, 숙시닐-CoA 트랜스퍼라제, 푸마레이트 리덕타제, 푸마라제, 말레이트 데하이드로게나제, NAD(P)H:페레독신옥시도리덕타제, 일산화탄소 데하이드로게나제 및 하이드로게나제. 구체적으로, 일산화탄소 데하이드로게나제 및 하이드로게나제에 의해 CO 및/또는 H2로부터 추출된 환원 당량을 이용하여, 환원성 TCA 사이클을 통해 CO2를 아세틸-CoA 또는 아세테이트에 고정한다. 아세테이트는 아세틸-CoA 트랜스퍼라제, 아세테이트 키나제/포스포트랜스아세틸라제 및 아세틸-CoA 신테타제와 같은 효소에 의해 아세틸-CoA로 변환할 수 있다. 아세틸-CoA는, 피루베이트:페레독신 옥시도리덕타제 및 글루코스 신생 합성 (gluconeogenesis) 효소에 의해 글리세르알데하이드-3-포스페이트, 포스포에놀피루베이트 및 피루베이트로 변환할 수 있다. 또한, 아세틸-CoA는, 예를 들어, 아세토아세틸-CoA 티올라제에 의해 아세토아세틸-CoA로 변환되어, 본원에 기술된 바와 같이 1,3-BDO 경로로 이동할 수 있다 (도 1 참조). 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 제조하기 위한 경로를 구축하도록 충분한 개수의 코딩 핵산을 도입하는 것에 대한 본원에 제시된 교시된 내용 및 지침에 따라, 당해 기술 분야의 당업자라면, 숙주 유기체에 존재하지 않는 환원성 TCA 경로 효소 또는 단백질을 코딩하는 핵산을 적어도 도입하는 것에 대하여, 동일한 조작 설계를 수행할 수 있음을 이해할 것이다. 따라서, 본 발명의 세포에의 하나 이상의 코딩 핵산의 도입은 변형된 유기체가 환원성 TCA 경로를 포함하도록 수행될 수 있다.
따라서, 본원에 제시된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 탄수화물과 같은 탄소원에서 생육시켰을 때, 본 발명의 생합성 화합물을생산 및/또는 분비하는 비-천연성 세포를 생산할 수 있음을 이해할 것이다. 이러한 화합물로는, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 및 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서의 임의의 중간 대사산물을 포함한다. 예를 들면, 본 발명의 알데하이드 데하이드로게나제를 비롯하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성 경로의 일부 또는 전체를 포함하는 등의, 원하는 화합물 또는 중간산물의 생합성을 달성하도록 필수 효소 또는 단백질 활성 중 하나 이상을 조작하는 것이 필요한 전부이다. 이에, 본 발명은, 탄수화물 또는 기타 탄소원에서의 생육시 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산 및/또는 분비하고, 탄수화물 또는 기타 탄소원에서의 생육시 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서 확인되는 임의의 중간 대사산물을 생산 및/또는 분비하는, 비-천연성 세포를 제공한다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 본 발명의 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물로부터의 합성을 개시할 수 있다.
본 발명의 비-천연성 세포는, 본원에 예시된 당해 기술 분야에 잘 알려진 방법을 이용하여, 본 발명의 알데하이드 데하이드로게나제, 및 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 코딩하는 하나 이상의 핵산을 외인성으로 발현하도록 구축된다. 효소 또는 단백질은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하도록 충분한 양으로 발현될 수 있다. 본 발명의 세포는 본 발명의 알데하이드 데하이드로게나제를 발현하거나 또는 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기에 충분한 조건 하에서 배양되는 것으로 이해된다. 본원에 제시된 교시 내용 및 지침에 따라, 본 발명의 비-천연성 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 달성하여, 세포내 농도 약 0.1-300 mM 또는 그 이상, 예를 들어, 0.1-1.3 M 이상을 형성할 수 있다. 일반적으로, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 세포내 농도는 약 3 내지 150 mM, 특히 약 5 내지 125 mM, 보다 구체적으로 약 8 내지 100 mM이며, 예를 들어 약 10 mM, 20 mM, 50 mM, 80 mM 또는 그 이상을 포함한다. 또한, 이들 예시 범위에 속하거나 그 보다 높은 세포내 농도 역시 본 발명의 비-천연성 세포로부터 달성할 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 세포내 농도는, 약 100 mM, 200 mM, 500 mM, 800 mM, 1 M, 1.1 M, 1.2 M, 1.3 M 또는 그 이상 등의 약 100 mM 내지 1.3 M일 수 있다.
본 발명의 세포는 잘 알려진 방법을 이용해 배양한다. 배양 조건은, 예를 들어 액체 배양 공정뿐 아니라 발효 및 기타 대규모 배양 공정을 포함할 수 있다. 본원에 기술된 바와 같이, 본 발명의 생합성 생산물의 특히 유익한 수율은 혐기성 또는 실질적으로 혐기성 배양 조건 하에 수득할 수 있다.
일부 구현예에서, 배양 조건은 혐기성 또는 실질적으로 혐기성 배양 또는 유지 조건을 포함한다. 예시적인 혐기성 조건은 종래에 개시되어 있으며, 당해 기술 분야에 잘 알려져 있다. 발효 공정에 대한 예시적인 혐기성 조건은 본원에 기술되어 있으며, 예를 들어 2007년 8월 10일자 미국 공개공보 제2009/0047719호에 기술되어 있다. 이러한 조건들 중 임의의 조건을 비-천연성 세포와 함께 이용할 수 있으며, 아울러 당해 분야에 잘 알려진 다른 혐기성 조건도 적용할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산체 (producer)는, 상기한 혐기성 또는 실질적으로 혐기성 조건에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 세포내 농도 5-10 mM 또는 그 이상으로, 아울러 본원에 예시된 다른 모든 농도로 합성할 수 있다. 전술한 내용에서 세포내 농도가 언급되더라도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO를 생산하는 세포가 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 세포내에서 생산하거나, 및/또는 배양 배지로 생산물을 분비할 수 있는 것으로 이해된다.
본원에 기술된 바와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 달성하기 위한 하나의 예시적인 배양 조건은 혐기성 조건 및 발효 조건을 포함한다. 특정 구현예에서, 본 발명의 비-천연성 세포는 혐기 또는 실질적인 혐기 조건 하에 유지, 배양 또는 발효시킬 수 있다. 간략하게는, 혐기성 조건은 산소가 결여된 환경을 의미한다. 실질적인 혐기성 조건은, 예를 들어, 배지 내 용해 산소가 포화도 0-10%로 유지되는, 배양, 배치 발효 또는 연속 발효를 포함한다. 실질적인 혐기성 조건은 또한 산소 1% 미만의 대기가 유지되는 밀폐된 챔버 안에서 액체 배지 또는 고체 아가에서 세포를 배양하거나 또는 세포를 휴지시키는 것을 포함한다. 산소 %는, 예를 들어 배양물에 N2/CO2 혼합물 또는 기타 적절한 비-산소성 기체 또는 기체들을 퍼징함으로써 유지시킬 수 있다.
본원에 기술된 배양 조건은, 본 발명의 세포에 의해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위한, 규모 확대 및 연속 배양일 수 있다. 배양 공정의 예로는, 피드-배치 발효 (fed-batch fermentation) 및 배치 분리 (batch separation); 피드-배치 발효 및 연속 분리, 또는 연속 발효 및 연속 분리가 있다. 이들 공정 모두 당해 기술 분야에 잘 공지되어 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 공업적인 양으로 생합성 생산하는데에는 발효 공정이 특히 유용하다. 일반적으로, 그리고 비-연속적인 배양 공정을 이용하는 경우에서와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 연속 생산 및/또는 거의 연속적인 생산은, 본 발명의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 비-천연성 유기체를 지수기 (exponential phase) 상태로 증식을 유지시키거나 및/또는 거의 유지시키기에 충분한 영양분 및 배지에서 배양하는 것을 포함할 것이다. 이러한 조건에서의 연속 배양은, 예를 들어 1일, 2일, 3일, 4일, 5일, 6일 또는 7일 이상의 기간 동안의 증식 또는 배양을 포함할 수 있다. 추가적으로, 연속 배양은 1주일, 2주일, 3주일, 4주일 또는 5주일 이상에서, 최대 수 개월까지의 장기간을 포함할 수 있다. 다른 예로, 본 발명의 유기체는 특정 용도에 적합하다면, 수시간 배양할 수 있다. 연속적인 및/또는 거의 연속적인 배양 조건은 이러한 예시적인 기간들 사이의 모든 시간 간격을 포함하는 것으로 이해하여야 한다. 아울러, 본 발명의 세포를 배양하는 시간은 원하는 목적을 위해 생산물을 충분한 양으로 생산하기에 충분한 기간인 것으로 이해된다.
예시적인 발효 공정으로는, 비-제한적으로, 피드-배치 발효 및 배치 분리; 피드-배치 발효 및 연속 분리; 및 연속 발효 및 연속 분리를 포함한다. 예시적인 배치 발효 프로토콜의에서, 생산 유기체는 적정 기체가 퍼징되는 적절한 크기의 생물반응조에서 배양한다. 혐기성 조건에서, 배양물에 불활성 기체 또는 기체들의 조합, 예를 들어, 질소, N2/CO2 혼합물, 아르곤, 헬륨 등이 퍼징 처리된다. 세포가 증식하면서 탄소원을 이용함에 따라, 생물반응조에 탄소원 및/또는 영양분의 소모와 대략 균형을 유지하는 속도로 추가적인 탄소원(들) 및/또는 기타 영양분을 투입한다. 생물반응조의 온도는 바람직한 온도, 일반적으로 22-37℃ 범위에서 유지되지만, 온도는 생산 유기체의 증식 특징 및 발효 공정의 바람직한 조건에 따라 더 높거나 또는 낮은 온도에서 유지할 수 있다. 발효 장치에서 배양물의 바람직한 특징, 예를 들어, 세포 밀도, 생산물 농도 등을 달성하기 위한 바람직한 시간 동안 계속적으로 증식시킨다. 배치 발효 공정에서, 발효 시간은, 바람직한 배양 조건에 따라, 일반적으로 수 시간에서 수일, 예를 들어 8-24시간 또는 1일, 2일, 3일, 4일 또는 5일, 또는 최대 1주일의 범위이다. pH는 필요에 따라 조절하거나 또는 조절하지 않을 수 있으며, pH를 통제하지 않는 배양의 경우, pH는 운영 종료시까지 전형적으로 pH3-6으로 떨어질 것이다. 배양 기간이 끝나면, 발효 장치의 내용물을 세포 분리 유닛, 예를 들어 원심분리, 여과 유닛 등을 통과시켜 세포 및 세포 파편을 제거할 수 있다. 원하는 생산물이 세포 내에서 발현되는 경우, 필요에 따라, 발효 브로스로부터 세포를 분리하기 전 또는 분리한 후, 부가적인 생산물을 방출시키기 위해, 세포를 효소적으로 또는 화학적으로 파괴시키거나 또는 세포용해를 실시할 수 있다. 발효 브로스는 생산물 분리 유닛으로 이동시킬 수 있다. 생산물의 단리는 희석 수용액으로부터 원하는 생산물을 분리하기 위한 당해 기술 분야에서 사용되는 표준 분리 공정에 의해 이루어진다. 이러한 방법은, 비-제한적으로, 발효 공정의 생산물의 화학적 특징에 따라, 생산물의 유기 용액을 제공하기 위한 수 비-혼화성 유기 용매 (예, 톨루엔 또는 그외 적절한 용매, 비-제한적인 예로, 다이에틸 에테르, 에틸 아세테이트, 테트라하이드로푸란 (THF), 메틸렌 클로라이드, 클로로포름, 벤젠, 펜탄, 헥산, 헵탄, 페트롤륨 에테르, 메틸 터셔리 부틸 에테르 (MTBE), 다이옥산, 다이메틸포름아미드 (DMF), 다이메틸 설폭사이드 (DMSO) 등)를 이용한 액체-액체 추출, 적절한 경우, 표준 증류 방법 등을 포함한다.
예시적인 완전 연속 발효 프로토콜 (fully continuous fermentation protocol)의 경우, 일반적으로 원하는 세포 밀도를 달성하기 위해 생산 유기체를 배치 방식으로 먼저 증식시킨다. 탄소원 및/또는 기타 영양분이 고갈되면, 동일한 조성의 공급 배지를 원하는 속도로 연속적으로 공급하고, 발효액을 동일한 속도로 배출시킨다. 이러한 조건에서, 생물반응조 내 생산물 농도뿐 아니라 세포 밀도는 일반적으로 일정하게 유지된다. 발효 장치의 온도는 전술한 바와 같이 바람직한 온도에서 유지된다. 연속 발효 단계 동안에, 일반적으로 생산 최적화에 적합한 pH 범위를 유지하는 것이 바람직하다. pH는, 원하는 pH 범위를 유지하기 위해 적절한 산 또는 염기를 첨가하는 등의, 일반적인 방법으로 유지 및 모니터링할 수 있다. 생물 반응조는 장기간 동안, 일반적으로 1주일 이상에서 수주, 최대 1달 또는 심지어 적절한 바람직한 경우에는 이보다 더 긴 기간 동안 연속적으로 운영된다. 발효액 및/또는 발효 배양물은, 생산물 농도 및/또는 세포 밀도의 일관성을 보장하기 위해, 요망되는 바와 같이, 최대 매일 샘플을 취하는 등의 주기적인 모니터링을 실시한다. 연속 모드에서는, 새로운 신선한 배지를 공급하면서 발효 장치의 내용물을 일정하게 배출시킨다. 세포, 배지 및 생산물이 함유된 배출 스트림은, 일반적으로, 세포 및 세포 파편을 필요에 따라 제거하면서 또는 제거하지 않으면서, 연속적인 생산물 분리 공정을 거치게 된다. 비-제한적인 예로, 수 비-혼화성 유기 용매를 이용한 연속적인 액체-액체 추출 (예, 톨루엔 또는 기타 적절한 용매, 비-제한적인 예로, 다이에틸 에테르, 에틸 아세테이트, 테트라하이드로푸란 (THF), 메틸렌 클로라이드, 클로로포름, 벤젠, 펜탄, 헥산, 헵탄, 페트롤륨 에테르, 메틸 터셔리 부틸 에테르 (MTBE), 다이옥산, 다이메틸포름아미드 (DMF), 다이메틸 설폭사이드 (DMSO) 등), 표준적인 연속 증류 방법 등 또는 그외 당해 기술 분야에 잘 알려진 방법 등의, 당해 기술 분야에서 사용되는 연속적인 분리 방법을 이용해, 희석 수용액 (dilute aqueous solution)으로부터 생산물을 분리할 수 있다
발효 공정은 당해 기술 분야에 잘 공지되어 있다. 간략하게는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생합성 생산하기 위한 발효는, 예를 들어, 피드-배치 발효 및 배치 분리; 피드-배치 발효 및 연속 분리, 또는 연속 발효 및 연속 분리로 수행할 수 있다. 배치 및 연속 발효 공정의 예는 당해 기술 분야에 잘 공지되어 있으며, 본원에 기술되어 있다.
상당량의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 연속적으로 생산하기 위해, 본 발명의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생산체를 이용한 본원에 기술된 발효 공정 외에도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 생산체에 대해, 또한, 예를 들어, 생산물을 다른 화합물로 변환하는 화학적 합성 및/또는 효소 공정을 동시에 실시하거나, 또는 생산물을 발효 배양물로부터 분리한 다음 순차적으로 이를 필요에 따라 생산물을 다른 화합물로 변환하는 화학적 및/또는 효소적 변환 공정을 수행할 수 있다.
본원에 기술된 배양 및 발효 조건 외에도, 본 발명의 알데하이드 데하이드로게나제의 발현 또는 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 달성하기 위한 생육 조건은, 배양 조건에 내삼투압제 (osmoprotectant)의 첨가를 포함할 수 있다. 특정 구현예에서, 본 발명의 비-천연성 세포는 내삼투압제가 존재하는 조건에서 본원에 기술된 바와 같이 유지, 증식 및 발효할 수 있다. 간략하게는, 내삼투압제는 삼투 물질 (osmolyte)로서 작용하며 본원에 기술된 세포를 삼투 스트레스로부터 생존하는데 일조하는 화합물을 지칭한다. 내삼투압제로는, 베타인, 아미노산 및 당 트레할로스를 포함하지만, 이들로 한정되는 것은 아니다. 이에 대한 비-제한적인 예로는 글리신 베타인, 프랄린 베타인, 디메틸테틴, 다이메틸설포니오프로피오네이트, 3-다이메틸설포니오-2-메틸프로피오네이트, 피페콜산, 다이메틸설포니오아세테이트, 콜린, L-카르니틴 및 엑토인 등이 있다. 일 측면에서, 내삼투압제는 글리신 베타인이다. 당해 기술 분야의 당업자라면, 본원에 기술된 세포를 삼투 스트레스로부터 보호하기에 적합한 내삼투압제의 함량 및 종류가 사용되는 세포에 따라 결정됨을 알 것이다. 배양 조건에서 내삼투압제의 함량은, 예를 들어 약 0.1 mM 이하, 약 0.5 mM 이하, 약 1.0 mM 이하, 약 1.5 mM 이하, 약 2.0 mM 이하, 약 2.5 mM 이하, 약 3.0 mM 이하, 약 5.0 mM 이하, 약 7.0 mM 이하, 약 10 mM 이하, 약 50 mM 이하, 약 100 mM 이하, 또는 약 500 mM 이하일 수 있다.
일부 구현예들에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 임의의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물에 존재하는 원자의 동위원소 분포 (isotopic distribution)를 변경하기 위해, 탄소 공급원료 및 기타 세포 흡수원 (cellular uptake source), 예를 들어 포스페이트, 암모니아, 설페이트, 클로라이드 및 기타 할로겐 화합물을 선택할 수 있다. 상기에 열거된 다양한 탄소 공급원료 및 기타 흡수원들은 총체적으로 "흡수원"로서 본원에서 지칭될 것이다. 흡수원은 생산물, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물에 존재하는 임의의 원자, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로로부터 분기된 반응들에서 만들어지는 부산물에 대해 동위원소 농화를 제공할 수 있다. 동위원소 농화는, 예를 들어, 탄소, 수소, 산소, 질소, 황, 인, 염소 또는 기타 할로겐 화합물을 비롯한 임의의 타겟 원소에서 달성될 수 있다.
일부 구현예들에서, 흡수원을 선택하여, 탄소-12, 탄소-13 및 탄소-14의 비율을 달라지게 할 수 있다. 일부 구현예들에서, 흡수원은 산소-16, 산소-17 및 산소-18의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 수소, 중수소 및 삼중수소의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 질소-14 및 질소-15의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 황-32, 황-33, 황-34 및 황-35의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 인-31, 인-32 및 인-33의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 염소-35, 염소-36 및 염소-37의 비율이 달라지도록 선택할 수 있다.
일부 구현예들에서, 타겟 원소의 동위원소 비율은 하나 이상의 흡수원을 선택함으로써 원하는 비율로 변경할 수 있다. 흡수원은 자연에서 발견되는 천연 소스로부터 유래하거나 또는 인간이 제조한 소스로부터 유래할 수 있으며, 당해 기술 분야의 당업자는, 타겟 원소의 원하는 동위원소 비율을 달성하기 위해 천연 소스, 인간이 제조한 소스 또는 이들의 조합을 선택할 수 있다. 인간이 만든 소스의 예로는, 예를 들어, 화학 합성 반응으로부터 적어도 부분적으로 유래되는 흡수원을 포함한다. 이러한 동위원소 농화된 흡수원은 상업적으로 구입하거나 또는 실험실에서 제조하거나, 및/또는 선택적으로 상기 흡수원들의 천연 소스를 혼합하여 원하는 동위원소 비율을 달성할 수 있다. 일부 구현예들에서, 흡수원의 타겟 동위원소 비율은 자연에서 발견되는 바람직한 흡수원 오리진을 선택함으로써 달성할 수 있다. 예를 들어, 본원에 기술된 바와 같이, 천연 소스는 생물 유기체로부터 유래하거나 또는 이에 의해 합성되는 생물 기재 (biobase)이거나, 또는 석유계 생산물 또는 대기 등의 소스일 수 있다. 이러한 일부 구현예들에서, 탄소원은, 예를 들어, 탄소-14가 상대적으로 고갈되어 있을 수 있는 화석 연료-유래 탄소원, 또는 석유 유래 카운터파트 보다 탄소-14를 더 많이 포함할 수 있는 이산화탄소 등의 환경 또는 대기 탄소원으로부터 선택할 수 있다.
불안정한 탄소 동위원소인 탄소-14 또는 방사성 탄소 (radiocarbon)는 지구 대기 중에 탄소 원자 1012개 당 거의 1개이며, 반감기는 약 5700년이다. 탄소 스톡 (stock)은 우주선 (cosmic ray)과 일반 질소 (14N)가 참여하는 핵 반응으로 인해 대기 상층에 풍부하다. 화석 연료에는 오래전에 붕괴되어 탄소-14가 없다. 화석 연료의 연소는 대기 중의 탄소-14의 비율 (fraction)을 낮추게 되며, 이를 '수스 효과 (Suess effect)'라 한다.
화합물에서 원소의 동위원소 비율을 확인하는 방법은 당해 기술 분야의 당업자에게 잘 알려져 있다. 동위원소 농화는 가속 질량 분광 측정 (AMS), SIRMS (Stable Isotope Ratio Mass Spectrometry) 및 SNIF-NMR (Site-Specific Natural Isotopic Fractionation by Nuclear Magnetic Resonance) 등의 당해 기술 분야에 공지된 기법을 이용한 질량 분광 측정으로 쉽게 분석한다. 이러한 질량 분광 기법들은 액체 크로마토그래피 (LC), 고성능 액체 크로마토그래피 (HPLC) 및/또는 기체 크로마토그래피 등의 분리 기법과 통합할 수 있다.
탄소의 경우, 미국에서 국제 ASTM (the American Society for Testing and Materials)의 방사성탄소 연대 측정법을 이용하여 고체, 액체 및 기체 샘플의 생물 기재 함량 (biobased content)을 측정하기 위한 표준화된 분석 방법으로서 ASTM D6866이 개발되어 있다. 이 표준법은 제품의 생물 기재 함량을 측정하기 위한 방사성탄소 연대 측정법의 사용의 토대이다. ASTM D6866은 2004년에 최초로 공개되었으며, 현재 사용되는 버전은 ASTM D6866-11 (2011년 4월 1일자로 발효됨)이다. 방사성탄소 연대 측정 기법들은 본원에 기술된 내용을 포함하여 당해 기술 분야의 당업자에게 잘 알려져 있다.
화합물의 생물 기재 함량은 탄소-14 (14C) 대 탄소-12 (12C)의 비율에 의해 추정한다. 구체적으로, 프랙션 모던 (Fm: Fraction Modern)은 식: Fm = (S-B)/(M-B)으로부터 계산하며, 이때 B, S 및 M은 각각 블랭크, 샘플 및 모던 레퍼런스 (modern reference)의 14C/12C 비율이다. 프랙션 모던은 "모던"에 대한 샘플의 14C/12C 비율의 편차 측정값이다. 모던은 mil 당 δ13CVPDB=-19에 대해 표준화된 NBS (National Bureau of Standard) 옥살산 I (즉, 표준 레퍼런스 물질 (SRM) 4990b)의 방사성 탄소 농도 (AD 1950)의 95%로서 정의된다 (Olsson, The use of Oxalic acid as a Standard. In, Radiocarbon Variations and Absolute Chronology, Nobel Symposium, 12th Proc., John Wiley & Sons, New York (1970)). 예를 들어, AMS에 의해 측정된 질량 분광측정 결과는 mil 당 δ13CVPDB=-19에 대해 표준화된 NBS 옥살산 I (즉, SRM 4990b)의 비활성 * 0.95라는 국제적으로 합의된 정의를 이용하여 계산한다. 이는 절대 (AD 1950) 14C/12C 비율 1.176 ± 0.010 x 10-12와 등가이다 (Karlen et al., Arkiv Geofysik, 4:465-471 (1968)). 표준 계산은 다른 것에 대한 하나의 동위원소의 차별적인 흡수, 예를 들어, 생물 시스템의 C12 대비 C13 대비 C14의 선호적인 흡수성 (preferential uptake)을 계산에 고려하며, 이들 보정은 δ13에 대해 보정된 Fm으로서 반영된다.
옥살산 표준물질 (SRM 4990b 또는 HOx 1)은 1955년 사탕무 작물로부터 제조되었다. 1000 lbs가 제조되었지만, 이 옥살산 표준물질은 더 이상 시판되지 않는다. 옥살산 II 표준물질 (HOx 2; N.I.S.T designation SRM 4990 C)은 1977년 프랑스 사탕무 당밀로부터 제조되었다. 1980년대 초반에, 12개의 실험실 그룹에서 2가지 표준물질의 비를 측정하였다. 옥살산 II / I의 활성 비율은 1.2933 ± 0.001 (가중 평균)이었다. HOx II의 동위원소 비율은 -17.8 / mil이다. ASTM D6866-11은 모던 표준물질로 이용가능한 옥살산 II 표준물질 SRM 4990 C (Hox2)를 사용할 것을 권고한다 (Mann, Radiocarbon, 25(2):519-527 (1983)에서의, 오리지날 대 현재 시판되는 옥살산 표준물질을 비교한 내용 참조). Fm = 0%는 물질에 탄소-14가 전혀 없으며, 즉 화석 (예, 석유계) 탄소원이라는 것을 의미한다. 1950년대 이후 핵 폭발 실험에 의해 탄소-14가 대기로 발산된 것을 보정한 이후의, Fm = 100%은 전적으로 모던 탄소원이라는 것을 의미한다. 본원에서, "모던" 소스는 생물 기재 소스를 포함한다.
ASTM D6866에 기술된 바와 같이, 모던 탄소의 퍼센트 (pMC)는, 1950년대 핵 실험 프로그램의 효력이 지속되고 있고 소멸되지 않아, 100% 보다 클 수 있으며, 그 결과 ASTM D6866-11에 기술된 바와 같이 대기에서 탄소-14가 상당히 농화되었다. 모든 샘플의 탄소-14 활성은 "폭발 전 (pre-bomb)" 표준을 참조하고, 거의 모든 새로운 생물 기재 제품은 폭발 후 (post-bomb) 환경에서 만들어지기 때문에, 모든 pMC 값들은 (동위원소 분획에 대해 보정 후) 샘플의 실제 생물 기재의 함량을 더 잘 반영하도록 0.95 (2010 현재)를 곱해야 한다. 생물 기재의 함량이 103% 보다 높다는 것은 분석 에러가 발생하였거나 또는 생물 기재의 탄소 소스가 수년 이상 오래되었다는 것을 의미한다.
ASTM D6866은 물질의 총 유기 함량을 기준으로 생물 기재 함량을 정량하며, 존재하는 무기 탄소와 기타 비-탄소 함유 물질은 고려하지 않는다. 예를 들어, 50%가 전분-기재 물질이고 50%가 물인 제품은, ASTM D6866을 토대로, 생물 기재 함량 = 100%인 것으로 간주된다 (100% 생물 기재인 유기 탄소 함량 50%). 다른 예로, 전분-기재 물질 50%, 석유계 물질 25% 및 물 25%로 구성된 제품은, 생물 기재 함량 = 66.7% (유기 탄소 함량이 75%이나, 제품의 50%만 생물 기재임)이다. 다른 예로, 유기 탄소가 50%이고 석유계 생산물인 제품은 생물 기재 함량 = 0% (유기 탄소 함량이 50%이나, 화석 소스로부터 유래됨)인 것으로 간주될 것이다. 즉, 화합물 또는 물질의 생물 기재 함량을 측정하는 잘 알려져 있는 방법 및 공지 표준물질을 기반으로, 당해 기술 분야의 당업자는, 쉽게 화합물 또는 물질 및/또는 원하는 생물 기재 함량을 가진 본 발명의 화합물 또는 물질을 이용하는 제조된 다운스트림 산물 (downstream product)의 생물 기재 함량을 측정할 수 있다.
탄소-14 연대 측정 기법을 사용하여 물질의 생물 기재 함량을 정량하는 것은 당해 기술 분야에 공지되어 있다 (Currie et al., Nuclear Instruments and Methods in Physics Research B, 172:281-287 (2000)). 예를 들어, 탄소-14 연대 측정법은 테레프탈레이트 함유 물질에서 생물 기재 함량을 정량하는데 사용된다 (Colonna et al., Green Chemistry, 13:2543-2548 (2011)). 특히, 재생가능한 1,3-프로판디올로부터 유래된 폴리프로필렌 테레프탈레이트 (PPT) 폴리머와 석유계 테레프탈산은 Fm 값이 거의 30%이었다 (즉, 폴리머 탄소의 3/11이 재생가능한 1,3-프로판디올로부터 유래되며, 8/11은 화석 최종 멤버 테레프탈산으로부터 유래되므로) (Currie et al., supra, 2000). 반면, 재생가능한 1,4-부타디올 및 재생가능한 테레프탈산으로부터 유래된 폴리부틸렌 테레프탈레이트 폴리머는 생물 기재 함량이 90%를 초과하였다 (Colonna et al., supra, 2011).
이에, 일부 구현예에서, 본 발명은, 환경 탄소, 흡수원으로도 지칭되는, 대기 탄소 (atmospheric carbon)를 나타내는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 본 발명의 세포에 의해 생산되는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 예를 들어, 일부 측면에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 10% 이상, 15% 이상, 20% 이상, 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 98% 이상 또는 높게는 100%의 Fm 값을 가질 수 있다. 이러한 일부 구현예들에서, 흡수원은 CO2이다. 일부 구현예들에서, 본 발명은 석유계 탄소 흡수원 (petroleum-based carbon uptake source)을 반영하는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 이러한 측면에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 95% 미만, 90% 미만, 85% 미만, 80% 미만, 75% 미만, 70% 미만, 65% 미만, 60% 미만, 55% 미만, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2% 미만 또는 1% 미만의 Fm 값을 가질 수 있다. 일부 구현예에서, 본 발명은 대기 탄소 흡수원과 석유계 탄소 흡수원의 조합에 의해 형성되는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 이러한 흡수원들의 조합을 이용하는 것 역시 탄소-12, 탄소-13 및 탄소-14 비율을 다양하게 할 수 있는 한가지 수단이며, 각각의 비율은 흡수원의 비율을 반영할 것이다.
나아가, 본 발명은, 본원에 기술된 생물학적으로 생산된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물, 및 이로부터 유래된 생산물에 관한 것으로서, 여기서 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 환경에서 생성된 CO2에서와 대략 동일한 수치의 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가진다. 예를 들어, 일부 측면들에서, 본 발명은, 환경에서 발생하는 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율을 가진, 또는 본원에 기술된 다른 임의의 비율을 가진, 생물 유래 (bioderived) 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 중간산물을 제공한다. 본원에 기술된 바와 같이, 생산물은 환경에서 생성된 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율, 또는 본원에 기술된 다른 임의의 비율을 가질 수 있는 것으로 이해되며, 여기서 생산물은, 본원에 기술된 바와 같이, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물로부터 제조되며, 생물 유래 생산물은 화학적으로 변형되어 최종 생산물로 제조된다. 원하는 생산물을 제조하기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO의 중간산물의 생물 유래 생산물을 화학적으로 변형시키는 방법은, 본원에 기술된 바와 같이, 당해 기술 분야의 당업자에게 잘 알려져 있다. 본 발명은, 환경에서 생성된 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율을 가진, 3-HBal 및/또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 기재로 할 수 있는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리하이드록시알카노에이트, 나일론, 유기용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제 (hypoglycaemic agent), 부타다이엔 및/또는 부타다이엔-기재의 제품, 그리고 4-HBal 및/또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 기재로 할 수 있는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예로 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드라고도 함), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론 등을 추가로 제공하며, 여기서 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예로, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은, 본원에 기술된 바와 같이, 직접 제조되거나, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물과 조합하여 제조된다. 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는 방법은 종래에 개시된 바 있다 (예, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983, US 2013/0066035, WO/2012/018624, US 2012/0021478, 이들 각각은 원용에 의해 본 명세서에 포함됨). 1,3-BDO는 생체내 또는 시험관내에서 산과 반응시켜, 예를 들어 리파제를 사용해 에스테르로 변환할 수 있다. 이러한 에스테르는 누트라슈티컬, 약제 및 식품 용도를 가질 수 있으며, 1,3-BDO의 R-형태가 (S-형태 또는 라세믹 혼합물과 비교해) 동물 및 인간에서 에너지원으로서 가장 잘 활용되기 때문에, 이 형태가 유용하다 (예를 들어, (미국에서 일반적으로 안정한 것 (GRAS)으로 인정된) (R)-3-하이드록시부틸-R-1,3-부탄다이올 모노에스테르 및 (R)-3-하이드록시부티레이트 글리세롤 모노에스테르 또는 다이에스테르와 같은 케톤 에스테르). 케톤 에스테르는 경구로 전달할 수 있으며, 이 에스테르 화합물은 신체에 의해 사용되는 R-1,3-부탄다이올을 해리시킨다 (예, WO2013150153). 아미드 제조 방법은 당해 기술 분야에 잘 알려져 있다 (예, Goswami and Van Lanen, Mol. Biosyst. 11(2):338-353 (2015)).
이에, 본 발명은, 고도로 농화된 또는 기본적으로 거울상이성질체 측면에서 순수하며 추가적으로 부산물에 대해 개선된 순도 품질을 가진, 1,3-BDO, 즉 R-1,3-부탄다이올의 개선된 조성물을 제공하기 위한 개선된 효소 경로 및 미생물을 제공하는데 특히 유용하다. 1,3-BDO는 식품 소스, 식품 성분으로서, 착향제로서, 착향제용 용매 또는 용해제로서, 안정제로서, 유화제로서, 항균제로서 및 보존제로서 직접 사용하는 등의 추가적인 식품 관련 용도를 가진다. 1,3-BDO는 비경구 약물 용매로서 제약 산업에 사용된다. 1,3-BDO는 연화제 (emollient)의 성분으로서, 불용성 성분의 결정화를 방지하는 습윤제 (humectant), 향료와 같은 수-난용성 성분에 대한 용해제, 및 항균제 및 보존제로서 화장품에 사용된다. 예를 들어, 이는 특히 헤어 스프레이 및 세팅 로션에 습윤제로서 사용될 수 있으며; 이는 에센셜 오일로부터 아로마 감소를 억제하고, 미생물에 의한 부패를 방지하고, 벤조에이트의 용매로서 사용된다. 1,3-BDO는 0.1% 내지 50%, 심지어 0.1% 미만 및 50% 초과의 농도로 사용될 수 있다. 이는 헤어 및 목욕 제품, 눈 및 얼굴 메이크업, 향수, 개인 청결 제품 및 면도 및 피부 관리 제품에 사용된다 (예, the Cosmetic Ingredient Review board's report: "Final Report on the Safety Assessment of Butylene Glycol, Hexylene Glycol, Ethoxydiglycol, and Dipropylene Glycol", Journal of the American College of Toxicology, Volume 4, Number 5, 1985, 이는 원용에 의해 본 명세서에 포함됨). 이 보고서는 화장품에서의 1,3-BDO의 특수 용도 및 농도를 제공하며; 예를 들어, 보고서의 표 2 "제품 제형 데이터"를 참조한다.
일 구현예에서, 본 발명은, 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며; 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법으로 제조되는, 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는, 배양 배지를 제공한다. 일 구현예에서, 배양 배지는 세포로부터 분리된다.
일 구현예에서, 본 발명은, 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며; 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법으로 제조되는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO는 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가진다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법으로 제조된, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3- 부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)을 제공한다. 일 구현예에서, 본 발명은, 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며, 3-HBal 및/또는 1,3-BDO가 본 발명의 세포에 의해 또는 세포용해물 내 또는 본 발명의 방법으로 제조되고; 3-HBal 및/또는 1,3-BDO가 R-형태로 거울상이성질체 측면에서 농화된, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가진다.
일 구현예에서, 본 발명은, 3-HBal 및/또는 1,3-BDO가 R-형태로 거울상이성질체 측면에서 농화된, 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법으로 제조되는 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3- 부탄다이올 (1,3-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO에서 R 형태의 비율이 95% 보다 높거나, 96% 보다 높거나, 97% 보다 높거나, 98% 보다 높거나, 99% 보다 높거나, 99.1% 보다 높거나, 99.2% 보다 높거나, 99.3% 보다 높거나, 99.4% 보다 높거나, 99.5% 보다 높거나, 99.6% 보다 높거나, 99.7% 보다 높거나, 99.8% 보다 높거나 또는 99.9% 보다 높다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 R-거울상이성질체 비율이 ≥55%, ≥60%, ≥65%, ≥70%, ≥75%, ≥80%, ≥85%, ≥90% 또는 ≥95%이며, 화학적으로 매우 순수할 수 있으며, 예를 들어, R-거울상이성질체는 ≥99%, 예를 들어, ≥95%, ≥96%, ≥97%, ≥98%, ≥99%, ≥99.1%, ≥99.2%, ≥99.3%, ≥99.4%, ≥99.5%, ≥99.6%, ≥99.7%, ≥99.8% 또는 ≥99.9%이다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법에 의해 생산된, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO; 및 3-HBal 및/또는 1,3-BDO 또는 4-HBal 또는 1,4-BDO 이외의 화합물을 각각 포함하는 조성물을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO 또는 4-HBal 및/또는 1,4-BDO 이외의 화합물은, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 각각 생산하거나 또는 본 발명의 폴리펩타이드를 발현하는, 세포의 일부이다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법에 의해 생산된 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 조성물, 또는 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 생산하는 세포의 세포용해물 또는 배양 상층액을 제공한다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 본 발명의 세포용해물에서 또는 본 발명의 방법에 의해 생산된, 3-HBal 및/또는 1,3-BDO, 또는 4- HBal 및/또는 1,4-BDO를 포함하는 생산물을 제공하며, 여기서 생산물은 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 폴리하이드록시알카노에이트, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG), 폴리부틸렌 테레프탈레이트 (PBT), 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 또는 부타다이엔-기재의 제품이다. 일 구현예에서, 생산물은 화장품 제품 또는 식품 첨가제이다. 일 구현예에서, 생산물은 생물 유래 3-HBal 및/또는 1,3-BDO 또는 생물 유래 4-HBal 및/또는 1,4-BDO를 적어도 0.1%, 적어도 0.5%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50%로 포함한다. 일 구현예에서, 생산물은 제조된 3-HBal 및/또는 1,3-BDO의 일부 또는 제조된 4-HBal 및/또는 1,4-BDO의 일부를 반복 유닛으로서 포함한다. 일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 본 발명의 세포용해물 내 또는 본 발명의 방법에 의해 생산된 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 이용해 제조되거나 또는 이로부터 유래되는, 생산물을 성형함으로써 수득되는, 성형물 (molded product)을 제공한다.
본 발명은, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물; 및 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 이외의 화합물을 포함하는, 조성물을 또한 제공한다. 생물 유래 생산물 이외의 화합물은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 경로를 구비한 본 발명의 비-천연성 세포의, 세포 일부, 예를 들어, 미량의 세포 일부일 수 있거나, 또는 상기한 비-천연성 세포의 존재 하에 생산된 발효 브로스 또는 배양 배지, 또는 이의 정제된 또는 일부 정제된 일부일 수 있다. 조성물은, 예를 들어, 본원에 기술될 바와 같이, 부산물 발생이 저하된 유기체에 의해 생산되는 경우, 부산물은 감소된 수준으로 포함될 수 있다. 조성물은, 예를 들어, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 본 발명의 세포의 세포용해물 또는 배양 상층액을 포함할 수 있다.
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물은 상업적인 용도 및 공업적인 용도에서 사용되는 화합물이다. 이러한 용도에 대한 비-제한적인 예로는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품의 생산 등이 있다. 또한, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO는 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 포함하여 매우 다양한 생산물을 생산하는 원료로서 사용된다. 이에, 일부 구현예에서, 본 발명은, 예를 들어, 본 발명의 알데하이드 데하이드로게나제를 발현하는 본 발명의 비-천연성 세포에 의해 생산되거나 또는 본원에 개시된 방법을 이용해 생산되는, 하나 이상의 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 포함하는, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공한다.
본원에서, 용어 "생물 유래"는 생물 유기체로부터 유래되거나 또는 생물 유기체에 의해 합성되는 것을 의미하며, 생물 유기체에 의해 제조가능하므로 재생가능한 자원으로 간주할 수 있다. 이러한 생물 유기체는, 특히 본원에 기술된 본 발명의 세포는, 공급원료 또는 바이오매스, 예를 들어 농작물, 식물, 박테리아 또는 동물 소스로부터 수득되는 당 또는 탄수화물을 이용할 수 있다. 다른 예로, 생물 유기체는 대기 탄소를 이용할 수 있다. 본원에서, 용어 "생물 기재"는 전술한 바와 같이 본 발명의 생물 유래 화합물로 전체가 또는 일부분이 구성된 생산물을 의미한다. 생물 기재 또는 생물 유래 생산물은 석유 또는 석유화학 공급원료로부터 유래되거나 합성되는, 석유 유래 생산물과는 대비된다.
일부 구현예에서, 본 발명은, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 포함하는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공하며, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는데 사용되는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 모두 또는 일부를 포함한다. 예를 들어, 최종 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하기 위해, 생물 유래 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물, 또는 이의 일부를 포함할 수 있다. 이러한 제조는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을, 최종 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품으로 화학적으로 반응시키는 것을 포함할 수 있다 (예, 화학적 변환, 화학적 기능성화, 화학적 커플링, 산화, 환원, 중합, 공중합 등). 따라서, 일부 측면에서, 본 발명은, 본원에 기술된 바와 같이 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 적어도 2%, 적어도 3%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98% 또는 100%로 포함하는, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재 생산물을 제공한다.
또한, 일부 구현예에서, 본 발명은, 본원에 기술된 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물; 및 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물 이외의 화합물을 포함하는 조성물을 제공한다. 예를 들어, 일부 측면에서, 본 발명은 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공하며, 여기서 이의 제조시 사용되는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물의 생물 유래의 것과 석유 유래의 것의 조합이다. 예를 들어, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 50%; 및 석유 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 50%를 이용해 제조할 수 있거나, 또는 생산물의 적어도 일부가 본원에 기술된 세포에 의해 생산된 생물 유래 생산물을 포함하는 한 생물 유래/석유 유래 전구체 60%/40%, 70%/30%, 80%/20%, 90%/10%, 95%/5%, 100%/0%, 40%/60%, 30%/70%, 20%/80%, 10%/90%와 같은 다른 바람직한 비율을 사용해 제조할 수 있다. 본 발명의 생물 유래 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 사용해, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는 방법들은, 당해 기술 분야에 잘 공지되어 있는 것으로 이해된다.
우수한 생산체를 구축하기 위해, 대사 모델링을 이용해 생육 조건을 최적화할 수 있다. 또한, 모델링을 이용해 경로의 활용을 부가적으로 최적화하는 유전자 넉아웃을 설계할 수 있다 (예, US 특허 공개공보 2002/0012939, US 2003/0224363, US 2004/0029149, US 2004/0072723, US 2003/0059792, US 2002/0168654 및 US 2004/0009466, 및 미국 특허 7,127,379). 모델링 분석을 통해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 보다 효율적으로 생산하는 쪽으로 대사를 이동시키는 세포 증식에 대한 효과를 신뢰할 수 있게 예측할 수 있다.
원하는 생산물의 생합성에 유익한 대사 변이를 동정 및 설계하기 위한 한가지 전산 방식 (computational method)은 OptKnock 전산 프래임워크이다 (Burgard et al., Biotechnol. Bioeng. 84:647-657 (2003)). OptKnock는 타겟 생산물을 과생산하는 유전적으로 안정한 미생물을 만드는, 유전자 결손 또는 파괴 전략을 제안하는 대사 모델링 및 시뮬레이션 프로그램이다. 구체적으로, 이러한 프래임워크는, 원하는 생화합물이 세포 생육의 필수 부산물이 되도록 강제하는 유전자 조작을 제시하기 위해, 미생물의 전체 대사 및/또는 생화학적 네트워크를 조사한다. 전략적으로 배치된 유전자 결손 또는 그외 기능성 유전자의 파괴를 통해 생화학적 생산을 세포 증식과 커플링함으로써, 생물반응기에서 장기간 경과 후 조작된 균주에 부과된 증식 선택압은, 필연적인 증식-연계된 생화학적 생산의 결과로서 성능을 개선한다. 마지막으로, 유전자 결손이 구축되면, OptKnock에 의해 선택된 유전자는 게놈에서 완전히 제거되기 때문에, 설계된 균주가 야생형 형태로 되돌아갈 가능성이 거의 없다. 따라서, 이러한 전산 방법을 이용하여, 원하는 생산물의 생합성을 도출하는 대안적인 경로를 동정하거나, 또는 원하는 생산물의 생합성을 추가로 최적화하기 위해 비-천연성 세포와 조합하여 사용할 수 있다.
간략하게는, OptKnock는 세포 대사를 모델링하기 위한 전산 방법 및 시스템을 지칭하기 위해 본원에서 사용하는 용어이다. OptKnock 프로그램은 특정 제약 (particular constraint)을 플럭스 밸런스 분석 (FBA) 모델에 통합하는 방법 및 모델의 프래임워크에 관한 것이다. 이러한 제약으로는, 예를 들어 정성적인 동역학 정보 (qualitative kinetic information), 정성적인 조절 정보, 및/또는 DNA 마이크로어레이 실험 데이터를 포함한다. 또한, OptKnock는, 예를 들어, 플럭스 밸런스 모델로부터 파생되는 플럭스 바운더리를 확고히 한 다음 후속적으로 유전자 부가 또는 결손의 존재 하에 대사 네트워크의 성능 제한을 조사함으로써, 다양한 대사 문제들에 대한 해법을 도출한다. OptKnock 전산 프래임워크는 대사 네트워크의 성능 제한의 유효 쿼리를 허용하는 모델 포뮬레이션을 구축할 수 있으며, 구해진 혼합-정수 선형 프로그래밍 문제점을 해결하는 방법을 제공할 수 있다. 본원에서 OptKnock로 지칭되는 대사 모델링 및 시뮬레이션 방법들은, 예를 들어 2002년 1월 10일자로 출원된 미국 공개공보 2002/016854, 2002년 1월 10일자로 출원된 국제 특허 제 PCT/US02/00660, 및 2007년 8월 10일자로 출원된 미국 공개공보 2009/0047719에 개시되어 있다.
생산물의 생합성 생산에 유리한 대사 변이를 동정 및 설계하기 위한 또 다른 전산 방법은, SimPheny®로 지칭되는 대사 모델링 및 시뮬레이션 시스템이다. 이 전산 방법 및 시스템은, 예를 들어, 2002년 6월 14일자로 출원된 미국 공개공보 2003/0233218 및 2003년 6월 13일자로 출원된 국제 특허 출원 PCT/US03/18838에 개시되어 있다. SimPheny®는 인 실리코 (in silico) 네트워크 모델을 구축하고, 생물 시스템의 화학 반응들을 통해 질량, 에너지 또는 전하의 흐름을 시뮬레이션하여 시스템에서 화학 반응의 임의의 그리고 모든 가능한 작용기를 포괄하는 해법 영역을 규정함으로써, 생물 시스템에서 허용되는 다양한 활성들을 결정하기 위해 사용할 수 있는 전산 시스템이다. 이러한 방식은, 포함된 반응들의 공지된 화학량론 뿐 아니라 반응을 통한 최대 플럭스와 관련된 반응 열역학적 및 용량 제약 등의 제약에 의해 해법 영역을 규정하므로, 제약 조건 기반의 모델링 (constraints-based modeling)이라고도 한다. 이러한 제약에 의해 규정되는 영역을 조사하여, 생물 시스템 또는 이의 생화학적 성분들의 표현형 역량 및 거동을 결정할 수 있다.
이러한 전산 방법은, 생물 시스템들이 유연하고 다수의 다른 방식으로도 동일한 결과에 도달할 수 있기 때문에, 생물학적 현실과 부합한다. 생물 시스템은 모든 살아있는 시스템들이 직면하는 근본적인 제약들에 의해 제한되어 온 진화론적 기전을 통해 설계된다. 따라서, 제약 조건 기반의 모델링 전략은 이러한 일반적인 현실을 포괄한다. 더욱이, 제약 조건의 엄격화를 통해 네트워크 모델에 추가적인 제약을 계속적으로 부과하는 능력은 해법 영역의 크기를 줄이게 되고, 그래서 생리학적 성능 또는 표현형을 예견할 수 있는 정확도가 향상된다.
본 발명의 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 숙주 세포에서 원하는 화합물의 생합성을 설계 및 구현하기 위해 대사 모델링 및 시뮬레이션에 다양한 전산 프래임워크를 적용할 수 있을 것이다. 이러한 대사 모델링 및 시뮬레이션 방법은, 예를 들어 SimPheny® 및 OptKnock와 같이 상기에 예시된 전산 시스템을 포함한다. 본 발명을 예시하기 위해, 모델링 및 시뮬레이션을 위한 OptKnock 전산 프래임워크 체계를 참조하여, 일부 방법들이 본원에 기술된다. 당해 기술 분야의 당업자는, 당해 기술 분야에 잘 알려져 있는 임의의 이러한 다른 대사 모델링 및 시뮬레이션 전산 프래임워크 및 방법에, OptKnock를 이용한 대사 변이의 동정, 설계 및 구현을 적용하는 방법을 알 것이다.
전술한 방법은 파괴할 하나 이상의 대사 반응 세트를 제공할 것이다. 이러한 세트에서의 각 반응의 제거 또는 대사 변형으로, 원하는 생산물을 유기체의 증식 단계 동안에 필수 생산물로서 생산시킬 수 있다. 반응들이 공지되어 있으므로, bilevel OptKnock 문제에 대한 해법은, 또한, 반응 세트의 각 반응을 촉매하는 하나 이상의 효소를 코딩하는 관련 유전자 또는 유전자들을 제공해 줄 것이다. 반응 세트와, 각 반응에 참여하는 효소를 코딩하는 해당 유전자의 동정은, 일반적으로 효소와 코딩 유전자 간의 관련성이 포함된 반응 데이타베이스를 이용한 반응들의 상관 관계를 통해 달성되는, 자동화된 공정이다.
일단 동정하면, 원하는 생산물의 생산을 달성하기 위해 파괴시킬 반응 세트는, 세트에 포함된 각 대사 반응을 코딩하는 하나 이상의 유전자의 기능적 파괴에 의해, 타겟 세포 또는 유기체에서 구현한다. 반응 세트의 기능적 파괴를 달성하는데 특히 유용한 한가지 수단은, 각 코딩 유전자의 결손이다. 그러나, 일부 경우에, 예를 들어 조절 인자에 대한 cis 결합 부위 또는 프로모터와 같은 조절 영역의 돌연변이, 결손 등의 기타 유전적 변형에 의해, 또는 여러 위치들 중 어느 한 위치에서의 코딩 서열의 절단 (truncation)에 의해, 반응을 파괴하는 것이 유익할 수 있다. 유전자 세트의 전체 결손 미만의 수준으로 결손시키는 이러한 변형은, 예를 들어 생산물의 커플링을 신속하게 평가하거나 또는 유전자 복원이 이루어질 가능성이 거의 없을 경우에, 유용할 수 있다.
추가적인 반응 세트를 파괴하거나 또는 원하는 생산물의 증식-연계된 생합성 등의 생합성을 달성할 수 있는 대사 변형을 유발하는 전술한 bilevel OptKnock 문제점에 대한 추가적인 생산적인 해법을 동정하기 위해, 정수 컷 (integer cut)으로 칭해지는 최적화 방법을 수행할 수 있다. 이 방법은, 상기 예시된 OptKnock 문제를, 각 반복시 정수 컷으로 지칭되는 추가적인 제약을 통합하여, 반복적으로 해결함으로써, 진행한다. 정수 컷 제약은, 해결 과정이, 생산물 생합성을 증식과 필연적으로 연결시키는, 임의의 이전 반복에서 동정된 실제 동일한 반응 세트를 선택하지 않도록 방지한다. 예를 들어, 만일 앞서 동정된 증식-연계된 대사 변형으로 파괴시킬 반응 1, 2 및 3개가 정해지면, 후속적인 제약으로 동일한 반응들이 이후 해법에서 동시에 고려되지 않도록 한다. 정수 컷 방법은 당해 기술 분야에 널리 공지되어 있으며, 예를 들어 Burgard et al., Biotechnol . Prog. 17:791-797 (2001)에서 찾아 볼 수 있다. 대사 모델링 및 시뮬레이션을 위해 OptKnock 전산 프래임워크와 조합하여 사용되는 것과 관련하여 본원에 기술된 모든 방법에서와 같이, 반복적인 계산 분석에서 중복을 줄이는 정수 컷 방법을, 또한, 예를 들어, SimPheny® 등의 당해 기술 분야에 널리 공지된 그외 전산 프래임워크를 이용해 적용할 수 있다.
본원에 예시된 방법들로, 타겟 생화학 생산물의 생산을, 동정된 유전자 변이를 가지도록 조작된 세포 또는 유기체의 증식과, 필연적으로 커플링하는 등의, 원하는 생산물을 생합성으로 생산하는 세포 및 유기체를 구축할 수 있다. 따라서, 본원에 기술된 전산 방법은 OptKnock 및 SimPheny®로부터 선택되는 인 실리코 (in silico) 방법에 의해 동정되는 대사 변형들을 동정 및 구현할 수 있다. 대사 변형 세트는, 예를 들어 하나 이상의 생합성 경로 효소의 부가 및/또는 예를 들어 유전자 결손에 의한 파괴 등의 하나 이상의 대사 반응의 기능적 파괴를 포함할 수 있다.
전술한 바와 같이, OptKnock 방법은 장기간의 증식 선택을 거쳤을 때 미생물 돌연변이 네트워크가 전산적으로 예측되는 최대-증식 표현형 쪽으로 진화할 수 있다는, 전제 하에 개발되었다. 즉, 이 방법은 선택압 하에 유기체의 자기-최적화 능력을 활용한다. OptKnock 프래임워크는 네트워크 화학량론에 근거하여 생화학적 생산과 세포 증식을 인위적으로 커플링시키는 유전자 결손의 조합을 철저하게 조사할 수 있다. 최적의 유전자/반응 넉아웃을 확인하는데에는, 형성된 네트워크에 대한 최적의 증식 해법이 대상 생화학적 생산물을 과생산하도록, 활성 반응 세트를 선택하는 2단식 최적화 문제 해법이 요구된다 (Burgard et al., Biotechnol. Bioeng. 84:647-657 (2003)).
E. coli 대사의 인 실리코 화학량론 모델을 채택하여, 기존에 예시되고, 예를 들어 미국 특허 공개공보 US 2002/0012939, US 2003/0224363, US 2004/0029149, US 2004/0072723, US 2003/0059792, US 2002/0168654 및 US 2004/0009466 및 미국 특허 7,127,379에 기술된 바와 같이, 대사 경로의 필수 유전자들을 동정할 수 있다. 본원에 기술된 바와 같이, OptKnock의 수학적 프래임워크를 이용하여, 원하는 생산물을 증식과 조합하여 생산할 유전자 결손을 정확하게 파악할 수 있다. 나아가, 상기 bilevel OptKnock 문제 해법은 오직 하나의 결손 세트만 제공한다. 모든 의미 있는 해법들, 즉 증식-연계된 생산 형성을 유도하는 넉아웃 세트들을 모두 열거하기 위해, 정수 컷으로 지칭되는 최적화 기법을 구현할 수 있다. 이는, 전술한 바와 같이, 각 반복에서 정수 컷으로 지칭되는 추가적인 제약을 추가하면서 OptKonck 문제를 반복적으로 해결하는 과정을 수반한다.
본원에 기술된 바와 같이, 본 발명은 알데하이드 데하이드로게나제 변이체에 관한 것이다 (실시예 참조). 이러한 변이체의 제조는 실시예에 기술되어 있다. 다양한 방법들 중 임의의 방법을 이용해, 본원에 기술된 알데하이드 데하이드로게나제 변이체와 같은 알데하이드 데하이드로게나제 변이체를 구축할 수 있다. 이러한 방법으로는, 비-제한적으로, 부위-특이적인 돌연변이 유발, 랜덤 돌연변이 유발, 조합 라이브러리 (combinatorial libraries) 및 그외 후술한 돌연변이 유발 방법 등이 있다 (Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999); Gillman et al., Directed Evolution Library Creation: Methods and Protocols (Methods in Molecular Biology) Springer, 2nd ed (2014).
본원에 기술된 바와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물에 대한 경로의 바람직한 활성을 코딩하는 핵산을 숙주 유기체에 도입할 수 있다. 이 경우, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생산을 높이기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 경로 효소 또는 단백질의 활성을 변형하는 것이 바람직할 수 있다. 예를 들어, 단백질 또는 효소의 활성을 높이는 공지된 돌연변이를 코딩 핵산 분자에 도입할 수 있다. 또한, 효소 또는 단백질의 활성을 증가시키거나 및/또는 저해 활성을 낮추기 위해, 예를 들어 음성 조절인자의 활성을 낮추기 위해, 최적화 방법을 적용할 수 있다.
이러한 최적화 방법의 한가지가 방향성 진화 (directed evolution)이다. 방향성 진화는, 효소의 특성을 개선 및/또는 변형하기 위해, 특정 유전자에 표적화된 돌연변이를 도입하는 과정을 수반하는, 강력한 방법이다. 향상된 및/또는 변형된 효소는 다수의 (예, >104) 효소 변이체를 자동 스크리닝할 수 있는 민감한 고-처리 스크리닝 분석을 개발 및 구현함으로써, 동정할 수 있다. 돌연변이 유발 및 스크리닝 라운드를 전형적으로 반복 실시하여, 효소에 최적화된 특성을 부여할 수 있다. 돌연변이를 유발하기 위한 유전자의 영역들을 동정하는데 도움이 될 수 있는 수학적 알고리즘들도 또한 개발되어 있으며, 제조 및 스크리닝하여야 하는 효소 변이체들의 수를 현저하게 줄일 수 있다. 다양한 변이체 라이브러리 제조에 유효한 다수의 방향성 진화 기법들도 개발되어 있으며 (리뷰로서 Hibbert et al., Biomol . Eng 22:11-19 (2005); Huisman and Lalonde, In Biocatalysis in the pharmaceutical and biotechnology industries pgs. 717-742 (2007), Patel (ed.), CRC Press; Otten and Quax. Biomol . Eng 22:1-9 (2005); 및 Sen et al., Appl . Biochem . Biotechnol 143:212-223 (2007)을 참조함), 다수의 효소 클래스들에서 매우 다양한 특성을 개선하기 위해 이러한 방법들이 성공적으로 적용된 바 있다. 방향성 진화 기법에 의해 향상 및/또는 변형된 효소 특징들로는, 예를 들어, 비-천연성 기질의 변환에 있어서, 선택성/특이성; 확실한 고온 처리를 위한 온도 안정성; 높거나 낮은 pH 조건에서의 생물학적 처리를 위한 pH 안정성; 기질 또는 생산물 관용성 (product tolerance), 이로써 높은 생산 역가를 달성할 수 있음; 비-천연성 기질들을 포괄하기 위한 광범위한 기질 결합성 등의, 결합성 (Km); 생산물, 기질 또는 주요 중간산물에 의한 저해를 없애기 위한, 저해성 (Ki); 원하는 플럭스를 달성하도록 효소 반응 속도를 높이기 위한, 활성 (kcat); 단백질 수율 및 전체 경로 플럭스를 높이기 위한, 발현 수준; 호기 조건에서 공기 민감성 효소의 작용을 위한, 산소 안정성; 및 산소가 존재하지 않는 조건에서 호기성 효소의 작용을 위한, 혐기성 활성 등이 있다.
특정 효소의 바람직한 특징을 타겟팅하기 위해 유전자에 대한 돌연변이 유발 및 다양화를 위한 다수의 예시적인 방법들이 개발되었다. 이러한 방법들은 당해 기술 분야의 당업자들에게 잘 알려져 있다. 이러한 방법들 중 임의 방법을 이용해 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 본 발명의 알데하이드 데하이드로게나제를 생산하기 위해, 경로 효소 또는 단백질의 활성을 변형 및/또는 최적화할 수 있다. 이러한 방법으로는, 비-제한적인 예로, PCR 반응에 DNA 폴리머라제의 피델리티 (fidelity)를 낮춤으로써 랜덤 포인트 돌연변이를 도입하는 EpPCR (Pritchard et al., J Theor.Biol. 234:497-509 (2005)); 완전한 환형 플라스미드를 주형으로 사용하고, 마지막 뉴클레오티드 2개에 엑소뉴클레아제 내성 티오포스페이트 결합을 구비한 랜덤 6 mer를 이용하여 플라스미드를 증폭시킨 다음, 세포로 형질전환하고, 세포내에서 플라스미드를 탠덤 리피트에서 다시 고리화하는 것을 제외하고는, epPCR과 동일한 에러-유발 롤링 서클 증폭 (Error-prone Rolling Circle Amplification) (epRCA) (Fujii et al., Nucleic Acids Res. 32:e145 (2004); 및 Fujii et al., Nat. Protoc . 1:2493-2497 (2006)); 전형적으로 Dnase I 또는 Endo V와 같은 뉴클레아제로 2개 이상의 변이체 유전자를 절단하여, DNA 폴리머라제의 존재 하에 어닐링 및 연장 사이클에 의해 재조립되는 랜덤 단편 풀을 제조함으로써, 키메라 유전자 라이브러리를 구축하는 과정을 수반하는, DNA 또는 패밀리 셔플링 (Family Shuffling) (Stemmer, Proc Natl Acad Sci USA 91:10747-10751 (1994); 및 Stemmer, Nature 370:389-391 (1994)); 주형을 프라이밍한 후 변성과 매우 짧은 간격 (약 5초)의 어닐링/연장으로 이루어진 2단계 PCR 사이클을 반복하는 과정을 수반하는 스테거드 연장 (Staggered Extension, StEP) (Zhao et al., Nat. Biotechnol. 16:258-261 (1998)); 랜덤 서열 프라이머를 사용하여 주형의 여러가지 세그먼트에 대해 상보적인 복수의 짧은 DNA 단편을 제조하는 랜덤 프라이밍 재조합 (Random Priming Recombination, RPR) (Shao et al., Nucleic Acids Res 26:681-683 (1998)) 등이 있다.
추가적인 방법으로는, 선형화된 플라스미드 DNA를 사용해 미스매치 복원에 의해 복원되는 헤테로두플렉스를 형성하는 헤테로두플렉스 재조합 (Heteroduplex Recombination) (Volkov et al, Nucleic Acids Res. 27:e18 (1999); 및 Volkov et al., Methods Enzymol . 328:456-463 (2000)); Dnase I 단편화와 단일 가닥 DNA (ssDNA)의 크기 분획화를 이용한 RACHITT (Random Chimeragenesis on Transient Templates) (Coco et al., Nat. Biotechnol. 19:354-359 (2001)); 주형의 풀로서 사용되는 단일-방향성 ssDNA 단편들의 존재 하에 프라이머로부터 한쪽 방향으로 자라는 가닥들의 주형 스위칭을 수반하는 RETT (Recombined Extension on Truncated templates) (Lee et al., J. Molec . Catalysis 26:119-129 (2003)); 축중 프라이머 (degenerate primer)를 사용하여 분자들 간의 재조합을 제어하는 DOGS (Degenerate Oligonucleotide Gene Shuffling) (Bergquist and Gibbs, Methods Mol . Biol 352:191-204 (2007); Bergquist et al., Biomol . Eng 22:63-72 (2005); Gibbs et al., Gene 271:13-20 (2001)); 대상 유전자 또는 유전자 단편에서 1 bp가 결손된 조합 라이브러리를 구축하는 ITCHY (Incremental Truncation for the Creation of Hybrid Enzyme) (Ostermeier et al., Proc . Natl . Acad . Sci . USA 96:3562-3567 (1999); 및 Ostermeier et al., Nat. Biotechnol . 17:1205-1209 (1999)); 포스포티오에이트 dNTA를 이용하여 절단체 (truncation)를 제조하는 것을 제외하고는 ITCHY와 유사한 THIO-ITCHY (Thio-Incremental Truncation for the Creation of Hybrid Enzyme) (Lutz et al., Nucleic Acids Res 29:E16 (2001)); 재조합 유전자에 대한 ITCHY와 DNA 셔플링 방법 2가지를 조합한 SCRATCHY (Lutz et al., Proc . Natl . Acad. Sci . USA 98:11248-11253 (2001)); epPCR을 통해 제조된 돌연변이를 이후 유용한 활성 보유에 대해 스크리닝/선별하는 RNDM (Random Drift Mutagenesis) (Bergquist et al., Biomol . Eng . 22:63-72 (2005)); 포스포티오에이트 뉴클레오티드의 랜덤 병합 및 절단을 이용하여 랜덤 길이의 단편들의 풀을 제조하고, 이러한 풀을 주형으로 사용하여 이노신 등의 "유니버셜" 염기들의 존재 하에 연장시키고, 이노신-함유 상보체의 복제로 랜덤 염기 병합이 이루어지고, 결과적으로 돌연변이가 유발되는, 랜덤 돌연변이 유발 방법인, SeSaM (Sequence Saturation Mutagenesis) (Wong et al., Biotechnol . J. 3:74-82 (2008); Wong et al., Nucleic Acids Res. 32:e26 (2004); 및 Wong et al., Anal. Biochem . 341:187-189 (2005)); "타겟에서 모든 유전자 다양성"을 코딩하고 셔플링된 후대 (shuffled progeny)에 대해 매우 다양한 다양성을 허용할 수 있도록 설계된 중첩되는 올리고뉴클레오티드를 이용하는 합성 셔플링 (Synthetic Shuffling) (Ness et al., Nat. Biotechnol. 20:1251-1255 (2002)); dUTP를 병합시킨 후 우라실 DNA 글리코실라제와 이후 피페리딘을 처리하여 엔드포인트 DNA 단편화를 수행하는, 뉴클레오티드 교환 및 적출 기법 (Nucleotide Exchange and Excision Technology)인 NexT (Muller et al., Nucleic Acids Res. 33:e117 (2005)) 등이 있다.
추가적인 방법으로, 링커를 사용해 2종 간의 관련성이 멀거나 관련성이 없는 유전자들이 융합되게 촉진하고, 2종의 유전자들 간에 다양한 키메라를 제조함으로써 단일-교차 하이브리드 라이브러리를 제조하는, 서열 상동성-독립적인 단백질 재조합 (SHIPREC) (Sieber et al., Nat. Biotechnol. 19:456-460 (2001)); 출발 물질이 삽입체를 포함하는 슈퍼코일형의 이중 가닥 DNA (dsDNA) 플라스미드와 원하는 돌연변이 부위에서 축중성인 2개의 프라이머를 포함하는, 유전자 부위 포화 돌연변이 유발 (Gene Site Saturation Mutagenesis, GSSM™) (Kretz et al., Methods Enzymol. 388:3-11 (2004)); 제한된 영역을 매우 많은 수의 가능한 아미노산 서열 변이로 치환하는 짧은 올리고뉴클레오티드 카세트의 사용을 수반하는, 조합 카세트 돌연변이 유발 (Combinatorial Cassette Mutagenesis, CCM) (Reidhaar-Olson et al. Methods Enzymol . 208:564-586 (1991); 및 Reidhaar-Olson et al. Science 241:53-57 (1988)); 기본적으로 CCM과 비슷하지만, 높은 돌연변이 유발율로 epPCR을 이용하여 핫 스팟 및 핫 영역을 동정한 다음 CMCM에 의해 연장하여 단백질 서열 스페이스의 한정된 영역을 커버 (cover)하는, 조합형 다중 카세트 돌연변이 유발 (Combinatorial Multiple Cassette Mutagenesis, CMCM) (Reetz et al., Angew . Chem. Int . Ed Engl . 40:3589-3591 (2001)); DNA 폴리머라제 III의 돌연변이 서브유닛을 코딩하는, mutD5 유전자를 이용하여, 조건부 ts 돌연변이 유발 플라스미드가 선택 과정 중에 랜덤 및 천연 돌연변이 빈도를 20 내지 4000 X로 증가시키며, 선택 과정이 필요없을 때에는 유해한 돌연변이가 축적되는 것을 차단할 수 있는 돌연변이 유발 균주 기법 (Mutator Strains technique) (Selifonova et al., Appl . Environ. Microbiol . 67:3645-3649 (2001)); Low et al., J. Mol . Biol . 260:359-3680 (1996)) 등이 있다.
추가적인 방법의 예로는, 선택 아미노산의 조합 돌연변이 (combinatorial mutation)를 분석 및 최적화하는 다차원 돌연변이를 유발하는 방법인, LTM (Look-Through Mutagenesis) (Rajpal et al., Proc . Natl . Acad . Sci . USA 102:8466-8471 (2005)); 한번에 복수의 유전자에 적용할 수 있거나, 또는 단일 유전자의 대규모 키메라 (복수의 돌연변이) 라이브러리를 제조할 수 있는 DNA 셔플링 방법인, 유전자 리어셈블리 (Tunable GeneReassembly™ (TGR™) Technology, Verenium Corporation); 특정한 폴드를 가진 구조적으로 정의된 단백질 백본을 고정하고, 폴드와 전체 단백질 에너제틱스 (energetics)를 안정시킬 수 있는 아미노산 치환에 대한 서열 스페이스를 검색하는, 일반적으로 3차원 구조가 공지된 단백질에 대해 가장 효과적으로 작용하는 최적화 알고리즘인, PDA (in Silico Protein Design Automation) (Hayes et al., Proc . Natl . Acad . Sci . USA 99:15926-15931 (2002)); 및 구조/기능에 대한 지식을 이용하여 효소 개선이 가능한 부위를 선택하는 단계, Stratagene QuikChange (Stratagene; San Diego CA)와 같은 돌연변이 유발 방법을 이용하여 선택 부위에서의 포화 돌연변이 유발 (saturation mutagenesis)을 수행하는 단계, 바람직한 특징을 스크리닝/선별하는 단계, 및 개선된 클론(들)을 이용하여 다른 부위에 대해서도 다시 시작하여 바람직한 활성이 달성될 때까지 계속 반복하는 단계를 포함하는, ISM (Iterative Saturation Mutagenesis) (Reetz et al., Nat. Protoc . 2:891-903 (2007); 및 Reetz et al., Angew . Chem . Int . Ed Engl . 45:7745-7751 (2006)) 등이 있다.
돌연변이를 유발하기 위한 임의의 전술한 방법들은 단독으로 또는 임의 조합으로 사용할 수 있다. 아울러, 방향성 진화 방법들 중 임의의 한가지 방법 또는 조합을 본원에 기술된 후천적인 진화 기법과 함께 사용할 수 있다.
본 발명에 대한 다양한 구현예들의 작동에 실질적으로 영향을 미치지 않은 변형이 본원에 제공된 본 발명의 정의 내에서 제공되는 것으로 이해된다. 따라서, 하기 실시예들은 본 발명을 예시하기 위한 것일 뿐 제한하고자 하는 것은 아니다.
실시예
알데하이드
데하이드로게나제
변이체
본 실시예는 바람직한 특성을 가진 알데하이드 데하이드로게나제 변이체의 제조 방법을 기술한다.
돌연변이 유발 기법을 이용해 주형 ALD-1을 토대로 알데하이드 데하이드로게나제 변이체를 구축하였다. 변이체는 에러 유발성 PCR, 부위 특이적인 돌연변이 유발 및 유전자 선택시 자발적인 돌연변이에 의해 구축하였다. 주형 ALD-1은 아래 제시된 알데하이드 데하이드로게나제이다:
MIKDTLVSITKDLKLKTNVENANLKNYKDDSSCFGVFENVENAISNAVHAQKILSLHYTKEQREKIITEIRKAALENKEILATMILEETHMGRYEDKILKHELVAKYTPGTEDLTTTAWSGDNGLTVVEMSPYGVIGAITPSTNPTETVICNSIGMIAAGNTVVFNGHPGAKKCVAFAVEMINKAIISCGGPENLVTTIKNPTMDSLDAIIKHPSIKLLCGTGGPGMVKTLLNSGKKAIGAGAGNPPVIVDDTADIEKAGKSIIEGCSFDNNLPCIAEKEVFVFENVADDLISNMLKNNAVIINEDQVSKLIDLVLQKNNETQEYSINKKWVGKDAKLFLDEIDVESPSSVKCIICEVSASHPFVMTELMMPILPIVRVKDIDEAIEYAKIAEQNRKHSAYIYSKNIDNLNRFEREIDTTIFVKNAKSFAGVGYEAEGFTTFTIAGSTGEGITSARNFTRQRRCVLAG (서열번호 1).
ALD-2 및 ALD-3에 대한 부가적인 ALD 서열들을 아래에 나타낸다:
ALD-2
MNTENIEQAIRKILSEELSNPQSSTATNTTVPGKNGIFKTVNEAIAATKAAQENYADQPISVRNKVIDAIREGFRPYIEDMAKRIHDETGMGTVSAKIAKLNNALYNTPGPEILQPEAETGDGGLVMYEYAPFGVIGAVGPSTNPSETVIANAIMMLAGGNTLFFGAHPGAKNITRWTIEKLNELVADATGLHNLVVSLETPSIESVQEVMQHPDVAMLSITGGPAVVHQALISGKKAVGAGAGNPPAMVDATANIALAAHNIVDSAAFDNNILCTAEKEVVVEAAVKDELIMRMQQEGAFLVTDSADIEKLAQMTIGPKGAPDRKFVGKDATYILDQAGISYTGTPTLIILEAAKDHPLVTTEMLMPILPVVCCPDFDSVLATATEVEGGLHHTASIHSENLPHINKAAHRLNTSIFVVNGPTYCGTGVATNGAHSGASALTIATPTGEGTATSKTYTRRRRLNSPEGFSLRTWEA (서열번호 2)
ALD-3
MTVNEQLVQDIIKNVVASMQLTQTNKTELGVFDDMNQAIEAAKEAQLVVKKMSMDQREKIISAIRKKTIEHAETLARMAVEETGMGNVGHKILKHQLVAEKTPGTEDITTTAWSGDRGLTLVEMGPFGVIGAITPCTNPSETIICNTIGMLAGGNTVVFNPHPAAIKTSNFAVQLINEASLSAGGPVNIACSVRKPTLDSSKIMMSHQDIPLIAATGGPGVVTAVLQSGKRGIGAGAGNPPVLVDETADIRKAAEDIINGCTFDNNLPCIAEKEVVAIDAIANELMNYMVKEQGCYAITKEQQEKLTNLVITPKGLNRNCVGKDARTLLGMIGIDVPSNIRCIIFEGEKEHPLISEELMMPILGIVRAKSFDDAVEKAVWLEHGNRHSAHIHSKNVDRITTYAKAIDTAILVKNAPSYAAIGFGGEGFCTFTIASRTGEGLTSASTFTKRRRCVMSDSLCIR (서열번호 3).
ALD-1은 3-하이드록시부티릴-CoA의 S 거울상이성질체에 비해 R 거울상이성질체에 대해 약간 더 높은 특이성을 나타낸다. ALD-1을 ALD-2 및 ALD-3와 서열 정렬하여 도 3에 나타낸다. 이들 서열은 각각 서열번호 1, 2 및 3이다. 또한, ALD-3 (PDBID 4C3S)에 대한 결정 구조가 존재하며, ALD-2는 ALD-1 보다 ALD-3와 더 비슷하다. 따라서, ALD-3을 주형으로 사용하였다. 도 3에서 밑줄 친 부분은 A로 표시된 제1 영역과 B로 표시된 제2 영역인 루프 영역 2곳이며, 이 둘다 본원에서 확인된 바에 따르면 기질 특이성 및 거울상이성질체 특이성에 관여한다. ALD-1에서 루프 A는 서열 LQKNNETQEYSINKKWVGKD (서열번호 124)이고, ALD-2의 경우에는 서열 IGPKGAPDRKFVGKD (서열번호 125)이고, ALD-3의 경우에는 서열 ITPKGLNRNCVGKD (서열번호 126)이다. 루프 B는 ALD-1에서 서열 SFAGVGYEAEGFTTFTIA (서열번호 127), ALD-2에서 서열 TYCGTGVATNGAHSGASALTIA (서열번호 128), ALD-3에서 서열 SYAAIGFGGEGFCTFTIA (서열번호 129)이다. ALD-2의 기질 특이성 루프 A 및 B의 서열과 길이는 ALD-1 및 ALD-3와 상이하지만; 정렬시 본원에 기술된 치환 위치를 용이하게 동정할 만큼 충분한 보존성이 확인되며, 특히 도 6에 나타낸 바와 같이 3D 모델링과 조합하였을 때, 특히 본원에 기술된 예시적으로 치환에 의해 변형되었을 때, 기질 특이성 및 거울상이성질체 특이성에 영향을 주는 상호작용하는 2개의 루프 영역들이 확인된다. ALD-1과 ALD-3의 동일성은 51.9%이다. ALD-1와 ALD-2의 동일성은 35.9%이다. ALD-3과 ALD-2의 동일성은 40%이다. 도 3의 정렬에 기반하여 컨센서스 ALD 서열이 구축되었다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 A의 컨센서스 서열은 IXPKG-----XXNRKXVGKD (서열번호 5)이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 B의 컨센서스 서열은 SYAGXGXXXE----GFXTFTIA (서열번호 6)이다.
추가적인 정렬을 수행하였다 (도 4). 도 4a는 컷오프 40-55%로 ALD-1와 비교하여 정렬한 것이다. 도 4b는 컷오프 75-90%로 ALD-1와 비교하여 정렬한 것이다. 도 4c는 컷오프 90%로 ALD-1와 비교하여 정렬한 것이다. 도 4a-4c에 나타낸 예시적인 알데하이드 데하이드로게나제 (ALD) 정렬을 통해, 대표적인 주형 ALD 서열에서 본 발명의 치환을 행할 수 있는 위치에 해당되는 위치들이 ALD에서 동정되는 것으로 확인된다. 밑줄 친 부분은 중요한 2개의 루프 영역, 즉 A로 명명된 첫번째 것과 B로 명명된 두번째 것으로, 이 둘다 본원에서 확인된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. 도 4a-4c는, 본원에 기술된 치환에 대응되는 위치를 ALD-1, 특히 루프 A 및 B 영역과의 동일성이 40% 이상의 ALD들에서 동정할 수 있으며, 특히 루프 B 영역에서 고도로 보존되어 있음을, 보여준다.
변이체 45의, 아세틸-CoA에 비해 3HB-CoA에 대한 특이성을 높이는 돌연변이 유발을 통해, 1,3 BOD 생산이 증가되고 에탄올 생산은 감소된 몇가지 변이체들을 제조하였다. 아세틸-CoA에 비해 3-하이드록시부티릴-CoA에 대한 특이성을 높이는 돌연변이는, 아세틸-CoA로부터 제조된 아세트알데하이드가 숙주 세포의 천연적인 효소에 의해 또는 3-하이드록시부티르알데하이드를 1,3-부탄다이올로 변환하는 경로 효소에 의해 제조되므로, 에탄올 생성을 감소시킨다. 알데하이드 데하이드로게나제의 효소 활성을 높이거나 또는 3-하이드록시부티릴-CoA에 대한 특이성을 높이는 변이체는, 아세토아세틸-CoA를 1,3-부탄다이올을 형성하는 쪽으로 향하게 하는 효소 경로를 통해 1,3-부탄다이올로의 플럭스를 증가시킴으로써 4-하이드록시-2-부타논은 감소되고, 따라서 천연 효소 또는 특이성이 낮은 경로 효소에 의한 4-하이드록시-2-부타논으로의 2단계 변환에서의 이의 이용가능성을 감소시킨다. 변이체 45의 서열은 다음과 같다:
MIKDTLVSITKDLKLKTNVENANLKNYKDDSSCFGVFENVENAISNAVHAQKILSLHYTKEQREKIITEIRKAALENKEILATMILEETHMGRYEDKILKHELVAKYTPGTEDLTTTAWSGDNGLTVVEMSPYGVIGAITPSTNPTETVICNSIGMIAAGNTVVFNGHPGAKKSVAFAVEMINKAIISCGGPENLVTTIKNPTRDSLDAIIKHPSIKLLVGTGGPGMVKTLLNSGKKAIGAGAGNPPVIVDDTADIEKAGKSIIEGASFDNNLPCIAEKEVFVFENVADDLISNMLKNNAVIINEDQVSKLIDLVLQKNNETQEYSINKKWVGKDAKLFLDEIDVESPSSVKCIITEVSASHPFVMTELMMPILPIVRVKDIDEAIEYAKIAEQNHKHSAYIYSKNIDNLNRFEREIDTTIFVKNAKSFAGVGYEAPGFTTFTIAGSTGEGITSARNFTRQRRIVLVG (서열번호 4).
수행한 분석은 NADK가 NAD로 변환됨에 따른 흡광도 감소를 모니터링함으로써 3HB-CoA에 대한 활성을 조사하기 위한 시험관내 분석이다. 분석은 또한 기질로서 아세틸-CoA (AcCoA)를 사용하여 수행하였으며, 3HB-CoA vs. AcCoA에 대한 활성 비율 향상으로서 개선된 효소를 동정하였다. 아세틸-CoA로부터 제조되는 아세트알데하이드가 숙주 세포에서 천연적으로 효소에 의해 또는 3-하이드록시부티르알데하이드를 1,3-부탄다이올로 변환하는 경로 효소에 의해 에탄올로 변환될 수 있으므로, 아세틸-CoA 대비 3-하이드록시부티릴-CoA의 특이성을 높이는 돌연변이는 에탄올 감소를 나타내었다.
이들 변이체 서브세트를 (R) 및 (S) 3-하이드록시부티르알데하이드를 사용해 추가로 조사한 결과, 검사 변이체들 중 5개 (952, 955, 957, 959, 961)가 모 효소 (변이체 45) 및 야생형 ALD-1과 비교해, R 거울상이성질체에 대해 개선된 선택성을 가진 것으로, 확인되었다 (도 5). 도 5a는 3 하이드록시-(R)-부티르알데하이드 (막대 세트에서 좌측 막대) 및 3 하이드록시-(S)-부티르알데하이드 (막대 세트에서 우측 막대)에 대한 ALD-2, ALD-1 및 ALD-1 변이체들의 비활성을 보여준다. 정제된 스트렙타비딘-태그된 단백질들을 10 mM R 또는 S 3-하이드록시부티르알데하이드의 존재 하에, IVI 완충제 pH 7.5, 0.5 mM NAD+, 2 mM CoA 중에, 35℃에서 분석하였으며, 340 nm에서 NADH 흡광도 변화에 의해 활성을 모니터링하였다. IVI 완충제는 5 mM 포타슘 포스페이트 모노베이직, 20 mM 포타슘 포스페이트 다이베이직, 10 mM 소듐 글루타메이트, 일수화물, 및 150 mM 포타슘 클로라이드, pH 7.5를 포함하였다. 즉, 본 분석에서 효소 반응은 도 1에 나타낸 반응과는 역 방향으로 수행되며, 즉, 반응은 3-하이드록시부티르알데하이드에서 3-하이드록시부티릴-CoA로의 변환을 측정하였다. 도 5b에 나타낸 바와 같이, 특정 알데하이드 데하이드로게나제 변이체는 S-3-하이드록시부티르알데하이드 (S-3HB-알데하이드)에 비해 R-3-하이드록시부티르알데하이드 (R-3HB-알데하이드)에 대해 선택성을 나타내었다.
ALD-1 결정 구조를 이용한 돌연변이 959에 대한 컴퓨터 모델링에서, 아미노산 치환 F442N이 R 이성질체의 3번 탄소 상의 하이드록시 기와 수소 결합 네트워크를 형성할 수 있지만, (S) 이성질체와는 그렇지 않은 것으로, 확인되었다 (도 6). 도 6a-6c는 알데하이드 데하이드로게나제 959의 구조를 리본 다이아그램으로 보여준다. 다이아그램은 3-하이드록시-(R)-부티르알데하이드 (도 6a) 또는 3- 하이드록시-(S)-부티르알데하이드 (도 6b)가 959의 구조에 도킹하는 방식을 도시한다. 도 6c는, 3-하이드록시-(S)-부티르알데하이드가 도 6a에 나타낸 바와 같이 3-하이드록시-(R)-부티르알데하이드에 도킹하는데 가장 에너지 측면에서 우호적인 동일한 배향성으로 도킹되었을 때, 비-우호적인 상호작용 (원)이 활성 부위에 위치한 이소루신으로 생성됨을, 보여준다. 이 모델은, 돌연변이 F442N이 단백질과 3-하이드록시-(R)-부티르알데하이드의 하이드록시 간에 수소 결합을 형성하지만 S 거울상이성질체와는 그럴 가능성이 없음을 시사해준다.
예시적인 알데하이드 데하이드로게나제 변이체들을 표 1A-1D에 열거한다.
표 1A. ALD 변이체 예
표 1B. ALD 변이체 예
표 1C. ALD 변이체 예
표 1D. ALD 변이체 예
ALD 변이체들의 다양한 활성을 측정하여, 표 2에 나타낸다.
표 2: ALD 변이체 예들의 활성.
변이체 | 야생형 Ald 대비 돌연변이 | 소규모 생체내 1,3 BDO 생산 | 3HBCoA /AcCoA 특이성 2 | R- 3HB 알데하이드 / S-3HB 알데하이드 | 비활성 3 | |
12 | D12A, I139S, M204R, R396H | O | ||||
16 | D12A, C33R, I139S, C174S, C189A, M204R, C220V, C267A, C353A, C356T, R396H, C464V | |||||
17 | D12A, I139V, T143N, G167S, C174S, M204R, C220V, T230R, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V | |||||
30 | E129I, C174S, C220V, C267A, C356T, R396H, C464I, A467V | * | ||||
34 | D12A, I139S, C174S, M204R, C220V, C267A, C356T, R396H, C464I | O | ||||
56 | D12A, I139S, C174S, M204R, C220V, C267A, C356T, R396H, F429Y, , E437P, F442T, C464I, A467V | O | ||||
71 | Y107K, C174S, M204R, C220V, C267A, C356T, C464I, A467V | |||||
80 | Y107K, C174S, C220V, C267A, C356T, C464I | * | ||||
93 | D12A, I139S, C174S, M204R, T230R, C220V, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V | * | ||||
156 | D12A, Y107K, C174S, M204R, C220V, C267A, C356T, C464I, A467V | * | ||||
166 | D12A, Y107K, C174S, C220V, C267A, C356T, C464I | * | ||||
180 | D12A, I139S, C174S, M204R, C220V, C267A, C356T, R396H, C464I, A467V | * | ||||
182 | C174S, M204R, C220V, A243P, C267A, C356T, R396H, E437P, C464I, A467V | * | ||||
184 | D12A, I139S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V | * | ||||
194 | I139S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V | * | ||||
199 | C174S, M204R, C220V, C267A, C356T, R396H, F429Q, E437P, C464I, A467V | * | ||||
203 | C174S, M204R, C220V, C267A, C356T, R396H, F429Y, E437P, F442T, C464I, A467V | * | ||||
205 | D12A, I139S, C174S, M204R, C220V, A243P, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V | * | ||||
208 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442Y, C464I, A467V | * | ||||
213 | T143S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V | * | ||||
235 | D12A, I139S, C174S, M204R, C220V, A243P, C267A, C356T, R396H, E437P, C464I, A467V | * | ||||
240 | D12A, I139V, C174S, M204R, M227K, C220V, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V | * | ||||
321 | D12V, I139S, M204R, R396H | * | ||||
598 | D12A, I139S, C174S, M204R, M227Q, T230R, A243P, C220V, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V | O | + | |||
45 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V | O | +++ | + | ||
951 | C174S, M204R, C220V, C267A, C356T, R396H, F429H, E437P, F442H, C464I, A467V | + | + | |||
952 | C174S, M204R, C220V, C267A, C356T, R396H, F429M, E437P, F442H, C464I, A467V | + | ||||
953 | C174S, M204R, C220V, C267A, C356T, R396H, F429M, E437P, F442N, C464I, A467V | + | ||||
954 | C174S, M204R, C220V, C267A, C356T, R396H, F429Q, E437P, C464I, A467V | + | ||||
955 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | +++ | + | ||
957 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442Q, C464I, A467V | + | + | |||
958 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, I444V, C464I, A467V | + | + | |||
959 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, T440H, F442N, C464I, A467V | + | + | |||
960 | V19I, D122N, C174S, M204R, C220V, C267A, C356T, R396H, F429D, E437P, F442Q, E450E, C464I, A467V | + | ||||
961 | C174S, M204R, C220V, C267A, V315A, C356T, R396H, E437P, T440H, F442N, C464I, A467V | + | + | |||
975 | D12A, I139V, C174S, M204R, C220V, M227Q, T230R, A243P, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V | O | ||||
991 | D12A, I139L, T143N, C174S, M204R, C220V, T230R, A243P, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V | |||||
992 | A73S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M,S447M, C464I, A467V | + | `+ | |||
993 | C174S, M204R, C220V, A254T, C267A, C356T, R396H, E437P, F442M, C464I, A467V | + | ||||
994 | V163C, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V | + | ||||
995 | C174S, M204R, C220V,K 229S, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | ||||
996 | C174S, M204R, C220V, C267A, C356L, R396H, E437P, F442N, C464I, A467V | + | ||||
997 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, T441G, I44L, C464I, A467V | + | ||||
998 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V | + | `+ | |||
999 | K65A, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | ||||
1000 | V163C, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | `+ | |||
1001 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, R460K,C464I, A467V | + | ||||
1002 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, S447M, C464I, A467V | O | + | `+ | ||
1003 | G155G, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442F, C464I, A467V | |||||
1004 | P145P, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V | |||||
1005 | G244G, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V | |||||
1006 | C174S, M204R, C220V, C267A, C356T, R396H, V432V, E437P, C464I, A467V | |||||
1015 | C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1016 | C174S, M204R, C220V, T230R, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1017 | C174S, M204R, C220V, T230H, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1018 | C174S, M204R, C220V, T230A, A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1019 | C174S, M204R, C220V, T230M, A243S, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1020 | C174S, M204R, C220V, T230H, A243N, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1021 | C174S, M204R, C220V, M227V,T230C, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1022 | C174S, M204R, C220V, M227V,T230H, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1023 | C174S, M204R, C220V, M227I,T230L, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1024 | C174S, M204R, C220V, M227I,T230C, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1025 | C174S, M204R, C220V, T230M, A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1026 | C174S, M204R, C220V, T230S, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1027 | C174S, M204R, C220V, M227I, T230A, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1028 | C174S, M204R, C220V,T230K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `- | `- | ||
1029 | C174S, M204R, C220V, T230Y, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1030 | C174S, M204R, C220V, T230G, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1031 | C174S, M204R, C220V, T230M, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1032 | C174S, M204R, C220V, T230T, A243L,C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1033 | C174S, M204R, C220V, T230I,C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1034 | C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H,F429L,V432N, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1035 | C174S, M204R, C220V, T230H, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1036 | C174S, M204R, C220V, T230Y,A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1037 | K72N,C174S, M204R, C220V,A243S, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1038 | C174S, M204R, C220V, T230C,A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1039 | C174S, M204R, C220V, T230H,A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1040 | C174S, M204R, C220V, T230H,A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1041 | C174S, M204R, C220V, T230A,A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1042 | C174S, M204R, C220V, T230S,A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1043 | C174S, M204R, C220V, M227V,T230S, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1044 | C174S, M204R, C220V, T230H, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1045 | C174S, M204R, C220V, T230A, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1046 | C174S, M204R, C220V, T230W, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1047 | C174S, M204R, C220V, M227C,T230R, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1048 | C174S, M204R, C220V, M227L,T230N, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1049 | C174S, M204R, C220V, T230N, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1050 | C174S, M204R, C220V, M227C, T230L, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1051 | C174S, M204R, C220V, T230V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1052 | C174S, M204R, C220V, T230L, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1053 | C174S, M204R, C220V, M227C, T230K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `- | ||
1054 | C174S, M204R, C220V, M227C, T230V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1055 | C174S, M204R, C220V, T230T, A243N, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1056 | C174S, M204R, C220V, T230T, A243I, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1057 | C174S, M204R, C220V, T230T,A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `- | ||
1058 | C174S, M204R, C220V, T230G, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1059 | C174S, M204R, C220V, T230R, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1060 | C174S, M204R, C220V, M227L, A243P, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `- | ||
1061 | C174S, M204R, C220V, M227A, A243P, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1062 | C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `- | ||
1063 | C174S, M204R, C220V, T230Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1064 | C174S, M204R, C220V, T230N, A243I, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1065 | C174S, M204R, C220V, T230C, A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1066 | C174S, M204R, C220V, M227I, T230R, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1067 | C174S, M204R, C220V, M227I, A243L, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1068 | C174S, M204R, C220V, M227I, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1069 | C174S, M204R, C220V, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1070 | C174S, M204R, C220V, M227V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1071 | C174S, M204R, C220V, M227C, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1072 | C174S, M204R, C220V, T230R, A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1073 | C174S, M204R, C220V, T230L, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1074 | C174S, M204R, C220V, T230I, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+++ | `- | ||
1075 | C174S, M204R, C220V, T230M, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1076 | C174S, M204R, C220V, M227L, T230W, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1077 | C174S, M204R, C220V, T230V, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1078 | C174S, M204R, C220V, M227V, T230I, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `++ | `- | ||
1079 | A73D, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V | O | `++ | `+ | ||
1080 | A73G, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447H, C464I, A467V | O | `+ | `- | ||
1081 | A73L, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V | O | `+ | `- | ||
1082 | A73Q, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447R, C464I, A467V | O | `++ | `- | ||
1083 | A73F, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V | O | `+ | `- | ||
1084 | A73G, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V | O | `+ | `- | ||
1085 | A73E, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V | O | `+ | `- | ||
1086 | A73W, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447R, C464I, A467V | O | `++ | `- | ||
1087 | V163G, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V | O | `+ | `- | ||
1088 | V163T, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V | O | `+ | `- | ||
1089 | C174S, M204R, C220V, M227L, T230S, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `- | ||
1090 | C174S, M204R, C220V, A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `+ | ||
1091 | C174S, M204R, C220V, T230T, A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `- | ||
1092 | C174S, M204R, C220V, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `+ | ||
1093 | A73L, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V | O | `+ | `+ | ||
1094 | A73R, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447T, C464I, A467V | O | `+ | `+ | ||
1095 | A73C, V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, C464I, A467V | O | `+ | `+ | ||
1096 | V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447E, C464I, A467V | O | `+ | `- | ||
1097 | A73W, V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V | O | `+ | `+ | ||
1098 | A73M, V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447R, C464I, A467V | O | `+ | `+ | ||
1099 | V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V | O | `+ | `+ | ||
1100 | A73F, V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V | O | `+ | `- | ||
1101 | V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447S, C464I, A467V | O | `+++ | `- |
1* 다른 다이올 화합물에 대한 활성
2'- = 특이성 < 1'
' += 특이성 1,0-2.0'
'++ = 특이성 2.0-3.0'
'+++ = 특이성 > 3.0
3'- = 상대적인 활성 < 1'
'+ = 상대적인 활성 > 1'
ALD 변이체 예들의 부가적인 활성을 표 3에 나타낸다. 48시간 경과시 1,3-BOD 생산 수준은 ALD 변이체를 이용한 경우 50 g/L 이상, 60 g/L 이상, 70 g/L 이상, 80 g/L 이상 및 90 g/L 이상으로 높게 달성되었다.
표 3. ALD 변이체 예들의 활성
변이체 | 야생형 Ald에 대한 돌연변이 | 조 세포용해물에서의 안정적인 효소 활성 | 선호 조인자 | 3HBCoA / AcCoA 특이성 | R- 3HB 알데하이드 / S-3HB 알데하이드 | 생체내 1,3-BDO 생산 증가 | 시험관내 효소 활성 증가 |
45 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V | + | NADH | + | + | + | |
331 | K65A, I66M, C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADH | + | |||
681 | K65A, I66M, A73S, C174S, M204R, C220V, M227I, T230C, A243P, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V | + | NADH | + | |||
687 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V | + | NADH | + | |||
688 | K65A, C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADH | + | |||
721 | 66M, C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADH | + | |||
951 | C174S, M204R, C220V, C267A, C356T, R396H, F429H, E437P, F442H, C464I, A467V | + | NADH | + | + | + | |
952 | C174S, M204R, C220V, C267A, C356T, R396H, F429M, E437P, F442H, C464I, A467V | + | NADH | + | + | ||
953 | C174S, M204R, C220V, C267A, C356T, R396H, F429M, E437P, F442N, C464I, A467V | + | NADH | + | + | ||
954 | C174S, M204R, C220V, C267A, C356T, R396H, F429Q, E437P, C464I, A467V | + | NADH | + | + | ||
955 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADH | + | + | + | |
956 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADH | + | |||
957 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442Q, C464I, A467V | + | NADH | + | + | + | |
958 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, I444V, C464I, A467V | + | NADH | + | + | + | |
959 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, T440H, F442N, C464I, A467V | + | NADH | + | + | + | |
960 | V19I, D122N, C174S, M204R, C220V, C267A, C356T, R396H, F429D, E437P, F442Q, E450E, C464I, A467V | + | NADH | + | + | ||
961 | C174S, M204R, C220V, C267A, V315A, C356T, R396H, E437P, T440H, F442N, C464I, A467V | + | NADH | + | + | + | |
962 | A73S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M,S447M, C464I, A467V | + | + | + | |||
963 | C174S, M204R, C220V, A254T, C267A, C356T, R396H, E437P, F442M, C464I, A467V | + | + | + | |||
964 | V163C, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V | + | + | + | |||
965 | C174S, M204R, C220V,K 229S, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | + | + | |||
966 | C174S, M204R, C220V, C267A, C356L, R396H, E437P, F442N, C464I, A467V | + | + | + | |||
967 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, T441G, I44L, C464I, A467V | + | + | + | |||
968 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V | + | + | + | |||
969 | K65A, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | + | + | |||
970 | V163C, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | + | + | |||
971 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, R460K,C464I, A467V | + | + | + | |||
972 | C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, S447M, C464I, A467V | + | + | + | |||
598 | D12A, I139S, C174S, M204R, M227Q, T230R, A243P, C220V, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V | + | NADH/NADPH | + | + | ||
973 | C174S, M204R, C220V, C267A, A243K, C356T, R396H, E437P, F442N, C464I, A467V | + | NADH | + | + | ||
974 | Y107N, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADPH | + | + | ||
975 | D122G, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADPH | + | + | ||
976 | C174S, M204R, C220V, C267A, S349T, C356T, R396H, E437P, F442N, C464I, A467V | + | + | + | |||
977 | C174S, N201D, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | + | + | |||
978 | C174S, M204R, C220V, C267A, D313R, C356T, R396H, E437P, C464I, A467V | NADH | + | + | |||
979 | C174S, M204R, C220V, C267A, P348G, C356T, R396H, E437P, C464I, A467V | NADH | + | + | |||
980 | C174S, M204R, C220V, C267A, C356L, R396H, E437P, C464I, A467V | NADH | + | + | |||
981 | C174S, M204R, C220V, C267A, C356T, A360K, R396H, E437P, C464I, A467V | NADH | + | + | |||
982 | C174S, M204R, C220V, A243K, C267A, C356T, R396H, E437P, C464I, A467V | NADH | + | + | |||
983 | C174S, M204R, C220V, K258W, C267A, C356T, R396H, E437P, C464I, A467V | NADH | + | + | |||
984 | Y107N, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V | NADH | + | + | |||
985 | C174S, M204R, C220V, N223Q, C267A, C356T, R396H, E437P, C464I, A467V | NADH | + | + | |||
986 | S131A, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V | NADH | + | + | |||
1011 | C174S, M204R, C220V, A243P, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADH | + | |||
1062 | C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V | + | NADH | + |
전술한 상기한 알데하이드 데하이드로게나제 변이체는 3-하이드록시부티르알데하이드의 R 형태에 작용할 수 있으며, 이를 이용해, R-3-하이드록시부티르알데하이드 입체이성질체 또는 R 형태와 S 형태의 혼합물이되 R 형태의 비율이 더 높은 혼합물을 생산할 수 있다. 이러한 입체이성질체는 R-1,3-부탄다이올과 같은 다운스트림 산물의 입체이성질체를 제조하는데 이용할 수 있다. 이러한 입체이성질체는 약제 또는 뉴트라슈티컬로서 유용성을 가진다.
이들 결과는, 3-하이드록시부티르알데하이드, 1,3-부탄다이올, 4-하이드록시부티르알데하이드 또는 1,4-부탄다이올, 또는 알데하이드 데하이드로게나제를 포함하는 대사 경로에 의해 생산되는 다른 바람직한 생산물을 공업적으로 제조하는데 사용가능한, 바람직한 특성을 가진 알데하이드 데하이드로게나제 변이체를 생산할 수 있음을 입증해준다.
전술한 변이체들은 ALD-1 모 서열을 기본으로 한다. 표 1, 2 또는 3에 나타낸 다양한 아미노산 위치들은 상동적인 알데하이드 데하이드로게나제 서열에 적용할 수 있는 것으로 이해된다. 표 4는 상동성에 기반한 ALD 서열들의 예를 제시한다. 당해 기술 분야의 당업자들은, 이들 서열을 일상적이고 널리 공지된 서열 정렬 방법으로 분석할 수 있음을, 쉽게 알 것이다 (예, BLAST, blast.ncbi.nlm.nih.gov; Altschul et al., " J. Mol . Biol . 215:403-410 (1990)). 아울러, 국립 생물공학 정보 센터 (NCBI) GenBank 데이터베이스, 유럽 분자 생물학 레보레이토리 (EMBL), ExPasy Prosite 또는 BLAST를 이용한 그외 공개적으로 이용가능한 서열 데이터베이스에서 확인되는 등의 공개적으로 이용가능한 서열 데이터베이스를 검색함으로써, 부가적인 상동적인 ALD 서열들을 식별할 수 있다. 이러한 정렬은 효소 활성을 유지하기 위한 컨센서스 서열 및 추가적인 효소 변이체를 구축하기 위한 위치를 식별하는데에도 이용할 수 있는 보존된 잔기에 대한 정보를 제공할 수 있다.
표 4. 알데하이드 데하이드로게나제 (ALD) 서열의 예.
부티르알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] | AAP42563.1 GI:31075383 (서열번호 7) |
가상의 단백질 ROSEINA2194_01708 [로세부리아 이눌린이보란스 DSM 16841] | EEG94445.1 (서열번호 8) |
알데하이드 데하이드로게나제 [바실러스 sp. FJAT-21945] | KOP84001.1 (서열번호 9) |
알데하이드 데하이드로게나제 [바실러스 솔라니] | KQL21940.1 (서열번호 10 |
알데하이드 데하이드로게나제 [테리스포로박터 오티니엔시스] | WP_039679531.1 (서열번호 11) |
알데하이드 데하이드로게나제 [로세부리아 이눌린이보란스 DSM 16841] | ABC25528.1 GI:83596371 (서열번호 12) |
프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. ASF502] | WP_004073235.1 (서열번호 13) |
알데하이드 데하이드로게나제 [[바실러스] 셀레니티레두센스] | WP_013174003.1 (서열번호 14) |
알데하이드 데하이드로게나제 [블라우티아 오베움] | WP_005427729.1 (서열번호 15) |
가상의 단백질 CLOBOL_07248 [[클로스트리듐] 볼테아 ATCC BAA-613] | EDP12494.1 (서열번호 16) |
알데하이드 데하이드로게나제 [지오트갈리박실러스 알리멘타리우스] | WP_041123321.1 (서열번호 17) |
알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [[클로스트리듐 히라노니스 DSM 13275] | EEA85935.1 (서열번호 18) |
복수의 종: 알데하이드 데하이드로게나제 [서모안에어로박터] | WP_003870148.1 (서열번호 19) |
복수의 종: 알데하이드 데하이드로게나제 [클로스트리디에일스] | WP_008705584.1 (서열번호 20) |
알데하이드 데하이드로게나제 [세발델라 터미티디스 ATCC 33386] | ACZ07905.1 (서열번호 21) |
프로피온알데하이드 데하이드로게나제 [유박테리움 플렉시카우다툼] | WP_004061597.1 (서열번호 22) |
복수의 종: 알데하이드 데하이드로게나제 [에스케리키아] | WP_000997839.1 (서열번호 23) |
알데하이드 데하이드로게나제 [로도스피릴륨 루브룸] | WP_011388669.1 (서열번호 24) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_012060202.1 (서열번호 25) |
알데하이드 데하이드로게나제 [[유박테리움] 할리이] | WP_005344386.1 (서열번호 26) |
알데하이드 데하이드로게나제 [비브리오 sp. EJY3] | WP_014232054.1 (서열번호 27) |
알데하이드 데하이드로게나제 [로도슈도모나스 팔루스트리스 BisB18] | ABD86737.1 (서열번호 28) |
알데하이드 데하이드로게나제 EutE [덴설파티바실룸 알케니보란스] | WP_015949695.1 (서열번호 29) |
알데하이드 데하이드로게나제 Ald [클로스트리듐 사카로부틸리컴] | WP_022747467.1 (서열번호 30) |
알데하이드 데하이드로게나제 [클로스트리듐 sp. DL-VIII] | WP_009171375.1 (서열번호 31) |
알데하이드 데하이드로게나제 EutE [클로스트리듐 타에니오스포럼] | WP_069679818.1 (서열번호 32) |
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] | WP_012425099.1 (서열번호 33) |
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] | WP_035786720.1 (서열번호 34) |
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] | WP_039308447.1 (서열번호 35) |
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] | WP_035792132.1 (서열번호 36) |
알데하이드 데하이드로게나제 [클로스트리듐 파스테리아넘] | WP_023973059.1 (서열번호 37) |
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴] | WP_015395720.1 (서열번호 38) |
복수의 종: 알데하이드 데하이드로게나제 [클로스트리듐] | WP_023975647.1 (서열번호 39) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_026888070.1 (서열번호 40) |
클로스트리듐 베이예린키이 균주 NRRL B593 가상의 단백질, 코엔자임 A 아실화 알데하이드 데하이드로게나제 (ald), 아세토아세테이트:부티레이트/아세테이트 코엔자임 A 트랜스퍼라제 (ctfA), 아세토아세테이트:부티레이트/아세테이트 코엔자임 A 트랜스퍼라제 (ctfB), 및 아세토아세테이트 데카르복실라제 (adc) 유전자 (AF157306 AF132754) | AF157306.2 (서열번호 41) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_012059995.1 (서열번호 42) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_041898834.1 (서열번호 43) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | WP_017211959.1 (서열번호 44) |
알데하이드 데하이드로게나제 EutE [클로스트리듐 베이예린키이] | WP_065419149.1 (서열번호 45) |
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] >gb|AGF59413.1| NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] | YP_007458667.1 GI:451822466 (WP_015395720.1) (서열번호 46) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|AAQ12068.1| 코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|AAQ12072.1| 코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|AAT48939.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|AAT66436.1| 코엔자임 A-아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|ABR35947.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] | YP_001310903.1 GI:150018649 (WP_012059995.1) (서열번호 47) |
코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | AAD31841.1 GI:4884855 (서열번호 48) |
아세트알데하이드 데하이드로게나제 (아세틸화) [클로스트리듐 sp. DL-VIII] >gb|EHJ00721.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [클로스트리듐 sp. DL-VIII] | ZP_09206127.1 GI:359413662 (서열번호 49) |
코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 사카로부틸리컴] | CAQ57983.1 GI:189310620 (서열번호 50) |
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] >gb|ACD24339.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] | YP_001886323.1 GI:187934965 (WP_012425099.1) (서열번호 51) |
알데하이드 데하이드로게나제 [칼달칼리바실러스 서마룸 TA2.A1] >gb|EGL82399.1| 알데하이드 데하이드로게나제 [칼달칼리바실러스 서마룸 TA2.A1] | ZP_08533507.1 GI:335040377 (서열번호 52) |
알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 DSM 17108] >ref|ZP_15517111.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B4] >ref|ZP_15521980.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B3] >ref|ZP_15526533.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A12] >ref|ZP_15534416.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A11] >gb|EIW18982.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B4] >gb|EIW21808.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A11] >gb|EIW29163.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 DSM 17108] >gb|EIW35484.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B3] >gb|EIW36902.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A12] | ZP_10327808.1 GI:392962372 (서열번호 53) |
NAD-의존적인 알데하이드 데하이드로게나제 [서모안에어로박테리움 서모사카롤리티컴 M0795] >gb|AGB19701.1| NAD-의존적인 알데하이드 데하이드로게나제 [서모안에어로박테리움 서모사카롤리티컴 M0795] | YP_007299398.1 GI:433655690 (WP_015312185.1) (서열번호 54) |
알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 JBW45] >gb|EIW48189.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 JBW45] | ZP_15537951.1 GI:421076976 (서열번호 55) |
알데하이드 데하이드로게나제 패밀리 단백질 [데설포스포로시누스 sp. OT] >gb|EGW35902.1| 알데하이드 데하이드로게나제 패밀리 단백질 [데설포스포로시누스 sp. OT] | ZP_08814704.1 GI:345862484 (서열번호 56) |
가상의 단백질 CLOSTMETH_00016 [클로스트리듐 메틸펜토섬 DSM 5476] >gb|EEG32278.1| 가상의 단백질 CLOSTMETH_00016 [클로스트리듐 메틸펜토섬 DSM 5476] | ZP_03705305.1 GI:225016072 (서열번호 57) |
알데하이드 데하이드로게나제 [서모안에어로박테리움 사카롤리티컴 JW/SL-YS485] >gb|AFK85255.1| 알데하이드 데하이드로게나제 [서모안에어로박테리움 사카롤리티컴 JW/SL-YS485] | YP_006390854.1 GI:390933349 (WP_014757178.1) (서열번호 58) |
아세트알데하이드 데하이드로게나제 [서모안에어로박테리움 자일라놀리티컴 LX-11] >gb|AEF18105.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [서모안에어로박테리움 자일라놀리티컴 LX-11] | YP_004471777.1 GI:333897903 (WP_013788835.1) (서열번호 59) |
알데하이드 데하이드로게나제 EutE [아세톤마 롱검 DSM 6540] >gb|EGO64744.1| 알데하이드 데하이드로게나제 EutE [아세톤마 롱검 DSM 6540] | ZP_08623980.1 GI:338811775 (서열번호 60) |
에탄올아민 이용 단백질 eutE [지오바실러스 서모글루코시단스 TNO-09.020] >gb|EID44455.1| 에탄올아민 이용 단백질 eutE [지오바실러스 서모글루코시단스 TNO-09.020] | ZP_17694107.1 GI:423719925 (서열번호 61) |
알데하이드 데하이드로게나제 [지오바실러스 sp. Y4.1MC1] >gb|ADP74637.1| 알데하이드 데하이드로게나제 [지오바실러스 sp. Y4.1MC1] | YP_003989248.1 GI:312110932 (WP_013400810.1) (서열번호 62) |
아세트알데하이드 데하이드로게나제 [지오바실러스 서모글루코시다시우스 C56-YS93] >gb|AEH47899.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [지오바실러스 서모글루코시다시우스 C56-YS93] | YP_004587980.1 I:336235364 (WP_013876899.1) (서열번호 63) |
알데하이드 데하이드로게나제 EutE [바실러스 아조토포르만스 LMG 9581] >gb|EKN64472.1| 알데하이드 데하이드로게나제 EutE [바실러스 아조토포르만스 LMG 9581] | ZP_11313951.1 GI:410460269 (서열번호 64) |
추정의 알데하이드 데하이드로게나제, 에탄올아민 이용 단백질 [[클로스트리듐] 스티클란디이]>emb|CBH20800.1| 추정의 알데하이드 데하이드로게나제, 에탄올아민 이용 단백질 [[클로스트리듐] 스티클란디이] | YP_003935705.1 GI:310657984 (WP_013360893.1) (서열번호 65) |
알데하이드 데하이드로게나제 [서민콜라 포텐스 JR] >gb|ADG81503.1| 알데하이드 데하이드로게나제 [서민콜라 포텐스 JR] | YP_003639404.1 GI:296132157 (WP_013119524.1) (서열번호 66) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. D5] >gb|EGB92558.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. D5] | ZP_08130302.1 GI:325263568 (서열번호 67) |
아세트알데하이드 데하이드로게나제 (아세틸화) [푸조박테리움 sp. 3_1_33] >gb|EEW94895.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [푸조박테리움 sp. 3_1_33] | ZP_05815063.1 GI:260494934 (서열번호 68) |
에탄올아민 이용 단백질 eutE [푸조박테리움 sp. 7_1] >gb|EEO43449.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 sp. 7_1] | ZP_04573939.1 GI:237743458 (서열번호 69) |
NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 sp. SR1/5] >emb|CBL20089.1| NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 sp. SR1/5] | YP_007783752.1 GI:479153977 (WP_015525955.1) (서열번호 70) |
가상의 단백질 HMPREF9942_01197 [푸조박테리움 누클레아툼 subsp. 아니말리스 F0419] >gb|EHO78009.1| 가상의 단백질 HMPREF9942_01197 [푸조박테리움 누클레아툼 subsp. 아니말리스 F0419] | ZP_17125059.1 GI:423137416 (서열번호 71) |
잠재적인 알데하이드 데하이드로게나제 [푸조박테리움 누클레아툼 subsp. 폴리포르품 ATCC 10953] >gb|EDK87521.1| 잠재적인 알데하이드 데하이드로게나제 [푸조박테리움 누클레아툼 subsp. 폴리포르품 ATCC 10953] | ZP_04969437.1 GI:254302079 (서열번호 72) |
에탄올아민 이용 단백질 eutE [푸조박테리움 sp. D11] >gb|EFD80567.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 sp. D11] | ZP_06524378.1 GI:289765000 (서열번호 73) |
알데하이드 데하이드로게나제 EutE [푸조박테리움 누클레아툼 ChDC F128] >gb|EJU08233.1| 알데하이드 데하이드로게나제 EutE [푸조박테리움 누클레아툼 ChDC F128] | ZP_15972610.1 GI:421526001 (서열번호 74) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 누클레아툼 subsp. 폴리포르품 F0401] >gb|EHG19190.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 누클레아툼 subsp. 폴리포르품 F0401] | ZP_16419680.1; GI:422338720 (서열번호 75) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 11_3_2] >gb|EGN65750.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 11_3_2] | ZP_08600044.1 GI:336419790 (서열번호 76) |
가상의 단백질 CLOSTASPAR_02210 [클로스트리듐 아스파라기포르메 DSM 15981] >gb|EEG55710.1| 가상의 단백질 CLOSTASPAR_02210 [클로스트리듐 아스파라기포르메 DSM 15981] | ZP_03758198.1 GI:225388474 (서열번호 77) |
알데하이드 데하이드로게나제 [클로스트리듐 피토퍼멘탄스 ISDg] >gb|ABX41556.1| 알데하이드 데하이드로게나제_ [클로스트리듐 피토퍼멘탄스 ISDg] | YP_001558295.1 GI:160879327 (WP_012199204.1) (서열번호 78) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 1_1_41FAA] >gb|EFG28139.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 1_1_41FAA] | ZP_06748808.1 GI:294783484 (서열번호 79) |
가상의 단백질 HMPREF0991_01940 [라크노스피라시이 박테리움 2_1_58FAA] >gb|EGN47419.1| 가상의 단백질 HMPREF0991_01940 [라크노스피라시이 박테리움 2_1_58FAA] | ZP_08612821.1 GI:336432991 (서열번호 80) |
가상의 단백질 RUMGNA_01022 [루미노코커스 그나부스 ATCC 29149] >gb|EDN78612.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [루미노코커스 그나부스 ATCC 29149] | ZP_02040258.1 GI:154503198 (서열번호 81) |
NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 오베움 A2-162] >emb|CBL23217.1| NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 오베움 A2-162] | YP_007805199.1 GI:479177598 (WP_015542038.1) (서열번호 82) |
알데하이드 데하이드로게나제 [클로스트리듐 사카롤리티컴 WM1] >gb|ADL04402.1| 알데하이드 데하이드로게나제 [클로스트리듐 사카롤리티컴 WM1] | YP_003822025.1 GI:302386203 (WP_013272491.1) (서열번호 83) |
알데하이드 데하이드로게나제 패밀리 단백질 플라보니프락터 플라우티이 ATCC 29863] >gb|EHM40040.1| 알데하이드 데하이드로게나제 패밀리 단백질 [플라보니프락터 플라우티이 ATCC 29863] | ZP_09385796.1 GI:365844997 (서열번호 84) |
가상의 단백질 RUMOBE_00094 [루미노코커스 오베움 ATCC 29174] >gb|EDM88971.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [루미노코커스 오베움 ATCC 29174] | ZP_01962381.1 GI:153809713 (서열번호 85) |
알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >ref|ZP_06856832.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|EET88516.1| 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >gb|EFG86154.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|ADO12117.1| CoA-아실화 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] | ZP_05391061.1 GI:255524100 (서열번호 86) |
가상의 단백질 FUAG_00592 [푸조박테리움 울세란스 ATCC 49185] >gb|EFS25077.1| 가상의 단백질 FUAG_00592 [푸조박테리움 울세란스 ATCC 49185] | ZP_10974295.1 GI:404368948 (서열번호 87) |
가상의 단백질 HMPREF0402_00608 [푸조박테리움 sp. 12_1B] >gb|EHO83590.1| 가상의 단백질 HMPREF0402_00608 [푸조박테리움 sp. 12_1B] | ZP_09586735.1 GI:373496187 (서열번호 88) |
알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >ref|ZP_06855343.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|EET85788.1| 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >gb|EFG87815.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] | ZP_05393779.1 GI:255526882 (서열번호 89) |
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 cf. 사카롤리티컴 K10] >emb|CBK77787.1| NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 cf. 사카롤리티컴 K10] | YP_007849785.1 GI:479338567 (WP_015574070.1) (서열번호 90) |
에탄올아민 이용 단백질 eutE [푸조박테리움 바리움 ATCC 27725] >gb|EES62817.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 바리움 ATCC 27725] | ZP_08693593.1 GI:340756989 (서열번호 91) |
알데하이드 데하이드로게나제 패밀리 단백질 [클로스트리듐 켈라툼 DSM 1785] >gb|EKY29259.1| 알데하이드 데하이드로게나제 패밀리 단백질 [클로스트리듐 켈라툼 DSM 1785] | ZP_19296595.1 GI:429764274 (서열번호 92) |
프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. ASF502] | EMZ20682.1 GI:476613570 (서열번호 93) |
가상의 단백질 HMPREF0988_02063 [라크노스피라시이 박테리움 1_4_56FAA] >gb|EGN36620.1| 가상의 단백질 HMPREF0988_02063 [라크노스피라시이 박테리움 1_4_56FAA] | ZP_08616478.1 GI:336436768 (서열번호 94) |
가상의 단백질 HMPREF0994_03038 [라크노스피라시이 박테리움 3_1_57FAA_CT1] >gb|EGN40215.1| 가상의 단백질 HMPREF0994_03038 [라크노스피라시이 박테리움 3_1_57FAA_CT1] | ZP_08607032.1 GI:336427027 (서열번호 95) |
알데하이드 데하이드로게나제 [루미노코커스 sp. 5_1_39B_FAA] >gb|EES77009.1| 알데하이드 데하이드로게나제 [루미노코커스 sp. 5_1_39BFAA] | ZP_04856816.1 GI:253579547 (서열번호 96) |
CoA-의존적인 프로프리온알데하이드 데하이드로게나제 PduP [아세토박테리움 우디이 DSM 1030] >gb|AFA49334.1| CoA-의존적인 프로프리온알데하이드 데하이드로게나제 PduP [아세토박테리움 우디이 DSM 1030] | YP_005270223.1 GI:379012411 (WP_014356934.1) (서열번호 97) |
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E1 str. 'BoNT E Beluga'] >gb|EES50221.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E1 str. 'BoNT E Beluga'] | ZP_04822936.1 GI:251780016 (서열번호 98) |
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] >gb|ACD22415.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] | YP_001885942.1 GI:187933041 (WP_012423269.1) (서열번호 99) |
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E3 str. Alaska E43] >gb|ACD53952.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E3 str. Alaska E43] | YP_001921227.1 GI:188590535 (WP_012451752.1) (서열번호 100) |
프로피온알데하이드 데하이드로게나제 [유박테리움 플렉시카우다툼 ASF492] | EMZ27833.1 GI:476621007 (서열번호 101) |
알데하이드 데하이드로게나제 [서모세디미니박터 오세아니 DSM 16646] >gb|ADL07333.1| 알데하이드 데하이드로게나제 [서모세디미니박터오세아니 DSM 16646] | YP_003824956.1 GI:302389135 (WP_013275382.1) (서열번호 102) |
가상의 단백질 HMPREF1090_01637 [클로스트리듐 클로스트리디오포르메 90A8] | ENZ17687.1 GI:480674262 (서열번호 103) |
가상의 단백질 HMPREF9467_03550 [클로스트리듐 클로스트리디오포르메 2_1_49FAA] >gb|EHG29726.1| 가상의 단백질 HMPREF9467_03550 [클로스트리듐 클로스트리디오포르메 2_1_49FAA] | ZP_09116578.1 GI:357055510 (서열번호 104) |
알데하이드 데하이드로게나제 [일리오박터 폴리트로푸스 DSM 2926] >gb|ADO84118.1| 알데하이드 데하이드로게나제 [일리오박터 폴리트로푸스 DSM 2926] | YP_003968466.1 GI:310780134 (WP_013388777.1) (서열번호 105) |
가상의 단백질 GCWU000342_00651 [셔틀위티아 사텔레스 DSM 14600] >gb|EEP29295.1| 가상의 단백질 GCWU000342_00651 [셔틀위티아 사텔레스 DSM 14600] | ZP_04454656.1 GI:229828587 (서열번호 106) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|ABR36155.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] | YP_001311111.1 GI:150018857 (WP_012060202.1) (서열번호 107) |
프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 CM201] >gb|ENZ04399.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90B1] >gb|ENZ17257.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A8] >gb|ENZ22132.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A3] >gb|ENZ29200.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A1] >gb|ENZ64224.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A4] >gb|ENZ70105.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A6] | ENY83847.1 GI:480639338 (서열번호 108) |
알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [클로스트리듐 sp. MSTE9] >gb|EJF40077.1| 알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [클로스트리듐 sp. MSTE9] | ZP_14663848.1 GI:420157008 (서열번호 109) |
프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90B8] >gb|ENZ57487.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90A5] >gb|ENZ67775.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90B7] | ENZ31577.1 GI:480688660 (서열번호 110) |
가상의 단백질 EUBHAL_00514 [유박테리움 할리이 DSM 3353] >gb|EEG37590.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리움 할리이 DSM 3353] | ZP_03715465.1 GI:225026273 (서열번호 111) |
CoA-아실화 프로피온알데하이드 데하이드로게나제 [할란에어로븀 사카롤리티컴 subsp. 사카롤리티컴 DSM 6643] >emb|CCU77919.1| CoA-아실화 프로피온알데하이드 데하이드로게나제 [할란에어로븀 사카롤리티컴 subsp. 사카롤리티컴 DSM 6643] | ZP_23773859.1 GI:470960332 (서열번호 112) |
가상의 단백질 [유박테리움 리모섬 KIST612] >gb|ADO39014.1| 가상의 단백질 ELI_4072 [유박테리움 리모섬 KIST612] | YP_003961977.1 GI:310829620 (WP_013382321.1) (서열번호 113) |
알데하이드 데하이드로게나제 [서모안에어로박터 sp. X514] >ref|ZP_07131928.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X561] >ref|YP_003903905.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X513] >ref|ZP_08212082.1| 알데하이드 데하이드로게나제 [서모안에어로박터 에탄올리쿠스 JW 200] >gb|ABY93220.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X514] >gb|EFK84693.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X561] >gb|ADN54614.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X513] >gb|EGD51928.1| 알데하이드 데하이드로게나제 [서모안에어로박터 에탄올리쿠스 JW 200] | YP_001663556.1 GI:167040571 (WP_003870148.1) (서열번호 114) |
알데하이드 데하이드로게나제 [로도스피릴륨 루브룸 ATCC 11170] >ref|YP_006047210.1| 알데하이드 데하이드로게나제 EutE [로도스피릴륨 루브룸 F11] >gb|ABC21715.1| 알데하이드 데하이드로게나제 [로도스피릴륨 루브룸 ATCC 11170] >gb|AEO47413.1| 알데하이드 데하이드로게나제 EutE [로도스피릴륨 루브룸 F11] | YP_426002.1 GI:83592250 (서열번호 115) |
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [유박테리움 유리 subsp. 마르가레티아 ATCC 43715] >gb|EFM39950.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [유박테리움 유리 subsp. 마르가레티아 ATCC 43715] | ZP_07453625.1 GI:306819974 (서열번호 116) |
알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [유박테리움 sp. AS15] >gb|EJP26117.1| 알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [유박테리움 sp. AS15] | ZP_10828060.1 GI:402309064 (서열번호 117) |
알데하이드 데하이드로게나제 EutE [비브리오 sp. EJY3] >gb|AEX22176.1| 알데하이드 데하이드로게나제 EutE [비브리오 sp. EJY3] | YP_005023154.1 GI:375265711 (WP_014232054.1) (서열번호 118) |
가상의 단백질 HMPREF9629_00032 [유박테리아시이 박테리움 ACC19a] >gb|EHL16790.1| 가상의 단백질 HMPREF9629_00032 [유박테리아시이 박테리움 ACC19a] | ZP_09320518.1 GI:363893420 (서열번호 119) |
알데하이드-알코올 데하이드로게나제 도메인 단백질 [프로피오니박테리 움프로피오니컴 F0230a] >gb|AFN47240.1| 알데하이드-알코올 데하이드로게나제 도메인 단백질 [프로피오니박테리움 프로피오니컴 F0230a] | YP_006513121.1 GI:397671586 (WP_014847902.1) (서열번호 120) |
가상의 단백질 HMPREF9628_01348 [유박테리아시이 박테리움 CM5] >gb|EHL19659.1| 가상의 단백질 HMPREF9628_01348 [유박테리아시이 박테리움 CM5] | ZP_09316712.1 GI:363889349 (서열번호 121) |
알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리아시이 박테리움 OBRC8] >gb|EJU23517.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리아시이 박테리움 OBRC8] | ZP_10886417.1 GI:402837902 (서열번호 122) |
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] | AAT48939.1 (서열번호 123) |
전술한 변이체와 같은 개개 ALD 변이체는 단독으로 사용하거나 또는 본원에 기재된 변이 아미노산 위치들 중 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16곳, 또는 최대 전체 등의, 임의의 다른 변이 아미노산 위치와 조합하여 (표 1-3), 원하는 활성을 가진 부가적인 변이체를 구축할 수 있는 것으로, 이해된다. ALD 변이체들의 예로는, 비-제한적으로, 표 1-3 중 어느 하나에 기술된 아미노산 위치에서, 예를 들어, ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 아미노산 위치 12, 19, 33, 44, 65, 66, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189, 204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464 또는 467에서, 하나의 치환 또는 하나 이상의 치환 조합을 포함한다 (표 1-3 참조). 예를 들어, ALD 변이체는, 비-제한적으로, ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 아미노산 위치 D12, V19, C33, I44, K65, I66, K72, A73, Y107, D122, E129, I139, T143, P145, G155, V163, G167, C174, C189, M204, C220, M227, K229, T230, A243, G244, A254, C267, V315, C353, C356, R396, F429, V432, E437, T440, T441, F442, I444, S447, E450, R460, C464, 또는 A467에서, 아미노산 치환, 하나의 치환 또는 하나 이상의 치환 조합을 포함한다 (표 1-3 참조). 다른 아미노산 19개 중 어느 하나로의 치환이 하나 이상의 바람직한 아미노산 위치에서 수행될 수 있는 것으로 이해된다.
일 구현예에서, 변이체 ALD는 12번 위치에서 아미노산 치환 D12A를 포함한다. 일 구현예에서, 변이체 ALD는 19번 위치에서 아미노산 치환 V19I를 포함한다. 일 구현예에서, 변이체 ALD는 33번 위치에서 아미노산 치환 C33R을 포함한다. 일 구현예에서, 변이체 ALD는 44번 위치에서 아미노산 치환 I44L을 포함한다. 일 구현예에서, 변이체 ALD는 65번 위치에서 아미노산 치환 K65A를 포함한다. 일 구현예에서, 변이체 ALD는 I66M, I66Q, I66N, I66H, I66T 및 I66S로부터 선택되는 66번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 72번 위치에서 아미노산 치환 K72N를 포함한다. 일 구현예에서, 변이체 ALD는 A73S, A73D, A73G, A73L, A73Q, A73F, A73E, A73W, A73R, A73C 및 A73M으로부터 선택되는 73번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 107번 위치에서 아미노산 치환 Y107K를 포함한다. 일 구현예에서, 변이체 ALD는 122번 위치에서 아미노산 치환 D122N을 포함한다. 일 구현예에서, 변이체 ALD는 129번 위치에서 아미노산 치환 E129I를 포함한다. 일 구현예에서, 변이체 ALD는 I139S, I139V 및 I139L로부터 선택되는 139번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 143번 위치에서 아미노산 치환 T143N 또는 T143S를 포함한다. 일 구현예에서, 변이체 ALD는 V163C, V163G 및 V163T로부터 선택되는 163번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 167번 위치에서 아미노산 치환 G167S를 포함한다. 일 구현예에서, 변이체 ALD는 174번 위치에서 아미노산 치환 C174S를 포함한다. 일 구현예에서, 변이체 ALD는 189번 위치에서 아미노산 치환 C189A를 포함한다. 일 구현예에서, 변이체 ALD는 204번 위치에서 아미노산 치환 M204R을 포함한다. 일 구현예에서, 변이체 ALD는 220번 위치에서 아미노산 치환 C220V를 포함한다. 일 구현예에서, 변이체 ALD는 M227K, M227Q, M227I, M227V, M227C, M227L 및 M227A로부터 선택되는 227번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 229번 위치에서 아미노산 치환 K229S를 포함한다. 일 구현예에서, 변이체 ALD는 T230R, T230K, T230H, T230A, T230M, T230C, T230L, T230S, T230Y, T230G, T230T, T230I, T230W, T230N, T230V 및 T230Q로부터 선택되는 230번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 A243P, A243Q, A243E, A243S, A243N, A243K, A243L, A243C, A243M 및 A243I로부터 선택되는 243번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 254번 위치에서 아미노산 치환 A254T를 포함한다. 일 구현예에서, 변이체 ALD는 267번 위치에서 아미노산 치환 C267A를 포함한다. 일 구현예에서, 변이체 ALD는 315번 위치에서 아미노산 치환 V315A를 포함한다. 일 구현예에서, 변이체 ALD는 353번 위치에서 아미노산 치환 C353A를 포함한다. 일 구현예에서, 변이체 ALD는 356번 위치에서 아미노산 치환 C356T 또는 C356L을 포함한다. 일 구현예에서, 변이체 ALD는 396번 위치에서 아미노산 치환 R396H를 포함한다. 일 구현예에서, 변이체 ALD는 F429Y, F429Q, F429H, F429M, F429D 및 F429L로부터 선택되는 429번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 432번 위치에서 아미노산 치환 V432V 또는 V432N을 포함한다. 일 구현예에서, 변이체 ALD는 437번 위치에서 아미노산 치환 E437P를 포함한다. 일 구현예에서, 변이체 ALD는 440번 위치에서 아미노산 치환 T440H를 포함한다. 일 구현예에서, 변이체 ALD는 441번 위치에서 아미노산 치환 T441G를 포함한다. 일 구현예에서, 변이체 ALD는 F442T, F442Y, F442H, F442N, F442Q, F442M 및 F442F로부터 선택되는 442번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 444번 위치에서 아미노산 치환 I444V를 포함한다. 일 구현예에서, 변이체 ALD는 S447M, S447P, S447H, S447K, S447R, S447T, S447E 및 S447S로부터 선택되는 447번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 460번 위치에서 아미노산 치환 R460K를 포함한다. 일 구현예에서, 변이체 ALD는 464번 위치에서 아미노산 치환 C464V 또는 C464I를 포함한다. 일 구현예에서, 변이체 ALD는 467번 위치에서 아미노산 치환 A467V를 포함한다. 전술한 임의의 아미노산 위치는 하나의 아미노산 치환 또는 하나 이상의 치환의 조합에 이용해, 본 발명의 ALD 변이체를 구축할 수 있다.
예를 들어, ALD 변이체는 예를 들어 다음과 같은 2 이상의 아미노산 치환을 포함할 수 있다: D12 및 I139; K65 및 C174; M204 및 C220; C464 및 A467; R396 및 F442; C356 및 F442; C174 및 A243; K65 및 I66; I66 및 A73; I66 및 C174; I66 및 M204; I66 및 C220; I66 및 M227; I66 및 T230; I66 및 A243; I66 및 A243; I66 및 C267; I66 및 C356; I66 및 R396; I66 및 E437; I66 및 F442; I66 및 S447; I66 및 C464; I66 및 A467, 등. 예를 들어, ALD 변이체는 예를 들어 다음과 같은 2 이상의 아미노산 치환을 포함할 수 있다: D12A 및 I139L; K65A 및 C174S; M204R 및 C220V; C464I 및 A467V; R396H 및 F442N; C356T 및 F442M; C174S 및 A243Q; K65A 및 I66H; I66H 및 A73S; I66H 및 C174S; I66H 및 M204R; I66H 및 C220V; I66H 및 M227I; I66H 및 T230C; I66H 및 A243Q; I66H 및 A243P; I66H 및 C267A; I66H 및 C356T; I66H 및 R396H; I66H 및 E437P; I66H 및 F442N; I66H 및 S447P; I66H 및 C464I; I66H 및 A467V; K65A 및 I66T; I66M 및 A73S; I66T 및 C174S; I66T 및 M204R; I66T 및 C220V; I66T 및 M227I; I66T 및 T230C; I66T 및 A243Q; I66T 및 A243P; I66T 및 C267A; I66T 및 C356T; I66T 및 R396H; I66T 및 E437P; I66T 및 F442N; I66T 및 S447P; I66T 및 C464I; I66T 및 A467V; K65A 및 I66M; I66M 및 A73S; I66M 및 C174S; I66M 및 M204R; I66M 및 C220V; I66M 및 M227I; I66M 및 T230C; I66M 및 A243Q; I66M 및 A243P; I66M 및 C267A; I66M 및 C356T; I66M 및 R396H; I66M 및 E437P; I66M 및 F442N; I66M 및 S447P; I66M 및 C464I; I66M 및 A467V; K65A 및 I66N; I66N 및 A73S; I66N 및 C174S; I66N 및 M204R; I66N 및 C220V; I66N 및 M227I; I66N 및 T230C; I66N 및 A243Q; I66N 및 A243P; I66N 및 C267A; I66N 및 C356T; I66N 및 R396H; I66N 및 E437P; I66N 및 F442N; I66N 및 S447P; I66N 및 C464I; I66N 및 A467V, K65A 및 I66Q; I66Q 및 A73S; I66Q 및 C174S; I66Q 및 M204R; I66Q 및 C220V; I66Q 및 M227I; I66Q 및 T230C; I66Q 및 A243Q; I66Q 및 A243P; I66Q 및 C267A; I66Q 및 C356T; I66Q 및 R396H; I66Q 및 E437P; I66Q 및 F442N; I66Q 및 S447P; I66Q 및 C464I; I66Q 및 A467V; K65A 및 I66S; I66S 및 A73S; I66S 및 C174S; I66S 및 M204R; I66S 및 C220V; I66S 및 M227I; I66S 및 T230C; I66S 및 A243Q; I66S 및 A243P; I66S 및 C267A; I66S 및 C356T; I66S 및 R396H; I66S 및 E437P; I66S 및 F442N; I66S 및 S447P; I66S 및 C464I; I66S 및 A467V, 등.
또한, ALD 변이체는 예를 들어 다음과 같은 3개 이상의 아미노산 치환을 포함할 수 있다: D12, I139 및 R396; K65, C174 및 C356; M204, C220 및 A243; C174, C464 및 A467; A243, R396 및 F442; C220, C356 및 F442; C174, A243 및 E437; K65, I66 및 A243; I66, A73 및 E437; I66, C174 및 F442; I66, M204 및 R396; I66, C220 및 S447; I66, M227 및 C267; I66, T230 및 A243; I66, A243 및 C464; I66, A243 및 A467; I66, M204 및 C267; I66, C356 및 R396; I66, R396 및 F442; I66, E437 및 A467; I66, C220 및 F442; I66, S447 및 C464; I66, M204 및 C464; I66, C174 및 A467. 예를 들어, ALD 변이체는 예를 들어 다음과 같은 3개 이상의 아미노산 치환을 포함할 수 있다: D12A, I139L 및 R396H; K65A, C174S 및 C356T; M204R, C220V 및 A243Q; C174S, C464I 및 A467V; A243P, R396H 및 F442N;C220V, C356T 및 F442M; C174S, A243Q 및 E437P; K65A, I66H 및 A243Q; I66H, A73S 및 E437P; I66H, C174S 및 F442N; I66H, M204R 및 R396H; I66H, C220V 및 S447P; I66H, M227I 및 C267A; I66H, T230C 및 A243P; I66H, A243Q 및 C464I; I66H, A243P 및 A467V; I66H, M204R 및 C267A; I66H, C356T 및 R396M; I66H, R396H 및 F442N; I66H, E437P 및 A467V; I66H, C220V 및 F442N; I66H, S447P 및 C464I; I66H, M204R 및 C464I; I66H, C174S 및 A467V; K65A, I66T 및 A243Q; I66M, A73S 및 E437P; I66T, C174S 및 F442N; I66T, M204R 및 R396H; I66T, C220V 및 S447P; I66T, M227I 및 C267A; I66T, T230C 및 A243P; I66T, A243Q 및 C464I; I66T, A243P 및 A467V; I66T, M204R 및 C267A; I66T, C356T 및 R396M; I66T, R396H 및 F442N; I66T, E437P 및 A467V; I66T, C220V 및 F442N; I66T, S447P 및 C464I; I66T, M204R 및 C464I; I66T, 및 C174S 및 A467V; K65A, I66M 및 A243Q; I66M, A73S 및 A437P; I66M, C174S 및 F442N; I66M, M204R 및 R396H; I66M, C220V 및 F442N; I66M, M227I 및 C267A; I66M, T230C 및 A243P; I66M, A243Q 및 C464I; I66M, A243P 및 A467V; I66M, M204R 및 C267A; I66M, C356T 및 R396M; I66M, R396H 및 F442N; I66M, E437P 및 A467V; I66M, C220V 및 F442N; I66M, S447P 및 C464I; I66M, M204R 및 C464I; I66M, C174S 및 A467V; K65A, I66N 및 A243Q; I66N, A73S 및 M227I; I66N, C174S 및 E437P; I66N, M204R 및 R396H; I66N, C220V 및 S447P; I66N, C174S 및 M227I; I66N, T230C 및 C356T; I66N, M204R 및 A243Q; I66N, A243P 및 S447P; I66N, C267A 및 C356T; I66N, C220V 및 C356T; I66N, R396H 및 E437P; I66N, M227I 및 E437P; I66N, F442N 및 A467V; I66N, M227I 및 S447P; I66N, M227I 및 C464I; I66N, A73S 및 A467V, K65A, I66Q 및 C220V; I66Q, A73S 및 M227I; I66Q, C174S 및 R396H; I66Q, M204R 및 C220V; I66Q, C220V 및 E437P; I66Q, M227I 및 F442N; I66Q, C174S 및 T230C; I66Q, A243Q 및 C356T; I66Q, A243P amd C267A; I66Q, C267A 및 C356T; I66Q, C220V 및 C356T; I66Q, R396H 및 E437P; I66Q, M204R 및 E437P; I66Q, M227I 및 F442N; I66Q, F442N 및 S447P; I66Q, C256A 및 C464I; I66Q, A73S 및 A467V; K65A, I66S 및 A73S; I66S, A73S 및 C220V; I66S, C174S 및 C267A; I66S, M204R 및 R396H; I66S, C220V 및 T230C; I66S, C220V 및 M227I; I66S, T230C 및 A243P; I66S, A243Q 및 C356T; I66S, M227I 및 A243P; I66S, C267A 및 F442N; I66S, M204R 및 C356T; I66S, T230C 및 R396H; I66S, M204R 및 E437P; I66S, C220V 및 F442N; I66S, A73S 및 S447P; I66S, C174S 및 C464I; I66S, C356T 및 A467V, 등. 전술한 아미노산 치환 2개 이상 또는 3개 이상의 조합들은 단순 예에 불과하며, 당해 기술 분야의 당업자라면 요망하는 ALD에 대한 바람직한 아미노산 치환 조합을 쉽게 결정할 수 있음을 알 것이다.
본원의 교시 내용에 기초하여, 당해 기술 분야의 당업자라면, 상동적인 ALD 서열에서 ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 아미노산 위치들 12, 19, 33, 44, 65, 66, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189, 204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464 또는 467 중 임의 위치에 대응되는 아미노산 위치를 쉽게 파악할 수 있다. 예를 들어, 도 4a의 정렬에 나타낸 바와 같이, ALD-1의 아미노산 I139는 서열번호 13 및 20의 아미노산 I133에 해당한다. 서열번호 24에서는 대응되는 위치가 V199이다. 널리 공지된 아미노산 서열 정렬 방법을 일반적으로 본원에 기술된 바와 같이 디폴트 파라미터를 이용하여 적용함으로써, 당해 기술 분야의 당업자라면 ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 아미노산 위치들 12, 19, 33, 44, 65, 66, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189, 204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464, 또는 467 중 임의 위치에 해당하는 아미노산 위치를 다른 ALD 서열에서 쉽게 찾을 수 있다.
ALD 변이체는, 본원에 기술된, 예를 들어 표 1-3에 기술된 변이 아미노산 위치, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16곳, 최대 전부를 포함할 수 있는 것으로 또한 이해된다. 당해 기술 분야의 당업자라면, 본원에 기술된 바와 같이 임의의 하나의 아미노산 치환 또는 아미노산 치환 조합, 예를 들어 표 1-3 및 상기한 내용에 기술된 아미노산 변이 위치를 기반으로 ALD 변이체를 쉽게 구축할 수 있다. 특정 구현예에서, ALD 변이체는 표 1-3에 기술된 변이체이다.
본 명세서 전체에 걸쳐 다양한 간행물들이 참조되었다. 유전자은행 등재 버전 명 및 GI 번호 공개물을 비롯하여, 이들 간행물의 내용은 그 전체가 본 발명이 속하는 기술 분야의 상황을 보다 충분히 설명하기 위해 본 명세서에 원용에 의해 포함된다. 본 발명은 전술한 실시예를 참조하여 설명되지만, 본 발명의 사상으로부터 벗어나지 않는 범위 내에서 다양한 변형이 이루어질 수 있는 것으로 이해하여야 한다.
<110> GENOMATICA, INC.
<120> ALDEHYDE DEHYDROGENASE VARIANTS AND METHODS OF USING SAME
<130> 12956-462-228
<150> 62/740,830
<151> 2018-10-03
<150> 62/737,053
<151> 2018-09-26
<160> 129
<170> PatentIn version 3.5
<210> 1
<211> 468
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 1
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 2
<211> 477
<212> PRT
<213> Lactobacillus brevis
<400> 2
Met Asn Thr Glu Asn Ile Glu Gln Ala Ile Arg Lys Ile Leu Ser Glu
1 5 10 15
Glu Leu Ser Asn Pro Gln Ser Ser Thr Ala Thr Asn Thr Thr Val Pro
20 25 30
Gly Lys Asn Gly Ile Phe Lys Thr Val Asn Glu Ala Ile Ala Ala Thr
35 40 45
Lys Ala Ala Gln Glu Asn Tyr Ala Asp Gln Pro Ile Ser Val Arg Asn
50 55 60
Lys Val Ile Asp Ala Ile Arg Glu Gly Phe Arg Pro Tyr Ile Glu Asp
65 70 75 80
Met Ala Lys Arg Ile His Asp Glu Thr Gly Met Gly Thr Val Ser Ala
85 90 95
Lys Ile Ala Lys Leu Asn Asn Ala Leu Tyr Asn Thr Pro Gly Pro Glu
100 105 110
Ile Leu Gln Pro Glu Ala Glu Thr Gly Asp Gly Gly Leu Val Met Tyr
115 120 125
Glu Tyr Ala Pro Phe Gly Val Ile Gly Ala Val Gly Pro Ser Thr Asn
130 135 140
Pro Ser Glu Thr Val Ile Ala Asn Ala Ile Met Met Leu Ala Gly Gly
145 150 155 160
Asn Thr Leu Phe Phe Gly Ala His Pro Gly Ala Lys Asn Ile Thr Arg
165 170 175
Trp Thr Ile Glu Lys Leu Asn Glu Leu Val Ala Asp Ala Thr Gly Leu
180 185 190
His Asn Leu Val Val Ser Leu Glu Thr Pro Ser Ile Glu Ser Val Gln
195 200 205
Glu Val Met Gln His Pro Asp Val Ala Met Leu Ser Ile Thr Gly Gly
210 215 220
Pro Ala Val Val His Gln Ala Leu Ile Ser Gly Lys Lys Ala Val Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Ala Met Val Asp Ala Thr Ala Asn Ile
245 250 255
Ala Leu Ala Ala His Asn Ile Val Asp Ser Ala Ala Phe Asp Asn Asn
260 265 270
Ile Leu Cys Thr Ala Glu Lys Glu Val Val Val Glu Ala Ala Val Lys
275 280 285
Asp Glu Leu Ile Met Arg Met Gln Gln Glu Gly Ala Phe Leu Val Thr
290 295 300
Asp Ser Ala Asp Ile Glu Lys Leu Ala Gln Met Thr Ile Gly Pro Lys
305 310 315 320
Gly Ala Pro Asp Arg Lys Phe Val Gly Lys Asp Ala Thr Tyr Ile Leu
325 330 335
Asp Gln Ala Gly Ile Ser Tyr Thr Gly Thr Pro Thr Leu Ile Ile Leu
340 345 350
Glu Ala Ala Lys Asp His Pro Leu Val Thr Thr Glu Met Leu Met Pro
355 360 365
Ile Leu Pro Val Val Cys Cys Pro Asp Phe Asp Ser Val Leu Ala Thr
370 375 380
Ala Thr Glu Val Glu Gly Gly Leu His His Thr Ala Ser Ile His Ser
385 390 395 400
Glu Asn Leu Pro His Ile Asn Lys Ala Ala His Arg Leu Asn Thr Ser
405 410 415
Ile Phe Val Val Asn Gly Pro Thr Tyr Cys Gly Thr Gly Val Ala Thr
420 425 430
Asn Gly Ala His Ser Gly Ala Ser Ala Leu Thr Ile Ala Thr Pro Thr
435 440 445
Gly Glu Gly Thr Ala Thr Ser Lys Thr Tyr Thr Arg Arg Arg Arg Leu
450 455 460
Asn Ser Pro Glu Gly Phe Ser Leu Arg Thr Trp Glu Ala
465 470 475
<210> 3
<211> 462
<212> PRT
<213> Clostridium phytofermentans
<400> 3
Met Thr Val Asn Glu Gln Leu Val Gln Asp Ile Ile Lys Asn Val Val
1 5 10 15
Ala Ser Met Gln Leu Thr Gln Thr Asn Lys Thr Glu Leu Gly Val Phe
20 25 30
Asp Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Gln Leu Val
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Ala Ile
50 55 60
Arg Lys Lys Thr Ile Glu His Ala Glu Thr Leu Ala Arg Met Ala Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Ile
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Asn Phe Ala Val Gln Leu Ile
165 170 175
Asn Glu Ala Ser Leu Ser Ala Gly Gly Pro Val Asn Ile Ala Cys Ser
180 185 190
Val Arg Lys Pro Thr Leu Asp Ser Ser Lys Ile Met Met Ser His Gln
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Gln Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Ile Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Ile Asp Ala Ile Ala Asn Glu Leu Met Asn Tyr
275 280 285
Met Val Lys Glu Gln Gly Cys Tyr Ala Ile Thr Lys Glu Gln Gln Glu
290 295 300
Lys Leu Thr Asn Leu Val Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys
305 310 315 320
Val Gly Lys Asp Ala Arg Thr Leu Leu Gly Met Ile Gly Ile Asp Val
325 330 335
Pro Ser Asn Ile Arg Cys Ile Ile Phe Glu Gly Glu Lys Glu His Pro
340 345 350
Leu Ile Ser Glu Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Ser Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 4
<211> 468
<212> PRT
<213> Artificial Sequence
<220>
<223> source: /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 4
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Ser Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Arg Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Val Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Thr Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn His Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Pro Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Ile
450 455 460
Val Leu Val Gly
465
<210> 5
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> source: /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> MOD_RES
<222> (2)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (6)..(7)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (11)
<223> Any amino acid
<400> 5
Ile Xaa Pro Lys Gly Xaa Xaa Asn Arg Lys Xaa Val Gly Lys Asp
1 5 10 15
<210> 6
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> source: /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> MOD_RES
<222> (5)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (7)..(9)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (13)
<223> Any amino acid
<400> 6
Ser Tyr Ala Gly Xaa Gly Xaa Xaa Xaa Glu Gly Phe Xaa Thr Phe Thr
1 5 10 15
Ile Ala
<210> 7
<211> 468
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 7
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Ser Ala Arg His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 8
<211> 386
<212> PRT
<213> Roseburia inulinivorans
<400> 8
Met Gly Val Asn Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu
1 5 10 15
Lys His His Leu Thr Ala Asp Lys Val Pro Gly Thr Glu Asp Ile Ser
20 25 30
Thr Ile Ala Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly
35 40 45
Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Ala Thr Asn Pro Ser Glu
50 55 60
Thr Val Ile Cys Asn Cys Ile Gly Met Leu Ala Gly Gly Asn Thr Val
65 70 75 80
Val Phe Asn Pro His Pro Asn Ala Lys Lys Thr Thr Ile Tyr Thr Ile
85 90 95
Asn Met Ile Asn Glu Ala Ser Ile Glu Ala Gly Gly Pro Asp Asn Ile
100 105 110
Ala Val Thr Val Glu Ala Pro Thr Leu Asp Thr Ser Ala Ile Met Met
115 120 125
Lys His Pro Ser Ile His Leu Leu Val Ala Thr Gly Gly Pro Gly Val
130 135 140
Val Thr Ala Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala
145 150 155 160
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala
165 170 175
Ala Gln Asp Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys
180 185 190
Ile Ala Glu Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu
195 200 205
Met Asn Tyr Met Ile Ser Glu Asn Gly Cys Tyr Leu Ala Ser Lys Glu
210 215 220
Ile Gln Asp Lys Leu Val Gln Thr Val Phe Thr Pro Lys Gly Ala Leu
225 230 235 240
Asn Arg Lys Cys Val Gly Arg Ser Ala Gln Thr Leu Leu Ala Met Val
245 250 255
Gly Val Asn Val Gly Pro Glu Ile Arg Cys Ile Val Phe Glu Gly Gln
260 265 270
Lys Glu His Pro Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly
275 280 285
Met Val Arg Val Lys Ser Phe Glu Glu Gly Val Glu Thr Ala Val Trp
290 295 300
Leu Glu His Gly Asn Arg His Ser Ala His Ile His Ser Lys Asn Val
305 310 315 320
Asp His Ile Thr Thr Tyr Ala Arg Ala Leu Asp Thr Ala Ile Leu Val
325 330 335
Lys Asn Gly Pro Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr
340 345 350
Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ala Ala
355 360 365
His Ser Phe Thr Lys Ser Arg Arg Cys Thr Met Ser Asp Ser Leu Cys
370 375 380
Ile Arg
385
<210> 9
<211> 467
<212> PRT
<213> Bacillus sp.
<400> 9
Met Asn Pro Ala Glu Leu Pro His Gln Val His Glu Ser Gly Ala Asn
1 5 10 15
Gly Val Phe Asp Arg Ile Glu Asp Ala Ile Glu Ala Gly Tyr Ile Ala
20 25 30
Gln Leu Asn Tyr Val Lys Gln Phe Gln Leu Lys Asp Arg Glu Lys Ile
35 40 45
Ile Thr Ala Ile Arg Glu Ala Val Ile Glu Asn Lys Glu Lys Leu Ala
50 55 60
Gln Met Val Phe Glu Glu Thr Lys Leu Gly Arg Tyr Glu Asp Lys Ile
65 70 75 80
Ala Lys His Glu Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Ile
85 90 95
Thr Thr Ala Ala Phe Ser Gly Asp Glu Gly Leu Thr Ile Ile Glu Gln
100 105 110
Ala Pro Phe Gly Leu Val Gly Ala Val Thr Pro Val Thr Asn Pro Thr
115 120 125
Glu Thr Ile Ile Asn Asn Ser Ile Ser Leu Leu Ala Ala Gly Asn Ala
130 135 140
Val Val Leu Asn Val His Pro Ser Ser Lys Ala Ser Cys Ala Phe Val
145 150 155 160
Val Asn Leu Ile Asn Gln Ala Ile Lys Asp Thr Gly Gly Pro Glu Asn
165 170 175
Leu Val Ser Met Val Lys Asp Pro Thr Leu Glu Thr Leu Asn Arg Ile
180 185 190
Ile Glu Ser Pro Lys Val Lys Leu Leu Val Gly Thr Gly Gly Leu Gly
195 200 205
Met Val Lys Thr Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly
210 215 220
Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Lys Gln
225 230 235 240
Ala Ala Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn Leu Leu
245 250 255
Cys Ile Ala Glu Lys Glu Leu Phe Val Ile Asp Ser Val Ala Asp Asp
260 265 270
Leu Ile Phe His Met Leu Asn Glu Gly Ala Tyr Met Leu Asp Gln Gln
275 280 285
Gln Leu Ser Lys Leu Met Ser Phe Ala Leu Glu Glu Asn Val His Gln
290 295 300
Glu Ala Gly Gly Cys Ser Leu Asp Asn Lys Arg Glu Tyr His Val Ser
305 310 315 320
Lys Asp Trp Val Gly Lys Asp Ala Val Ser Phe Leu Arg Gln Leu Gly
325 330 335
Ile Ala His Glu Glu Asp Ile Lys Leu Leu Ile Cys Glu Val Asp Phe
340 345 350
Asp His Pro Phe Val Gln Leu Glu Gln Met Met Pro Val Phe Pro Ile
355 360 365
Val Arg Val Gly Asn Leu Asp Glu Ala Ile Glu Met Ala Leu Leu Ala
370 375 380
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp
385 390 395 400
His Leu Thr Lys Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys
405 410 415
Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr
420 425 430
Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Ala Lys
435 440 445
Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg
450 455 460
Ile Ile Gly
465
<210> 10
<211> 467
<212> PRT
<213> Bacillus solani
<400> 10
Met Asn Pro Ala Glu Leu Pro His Gln Val His Glu Ser Gly Ala Asn
1 5 10 15
Gly Val Phe Asp Arg Ile Glu Asp Ala Ile Glu Ala Gly Tyr Ile Ala
20 25 30
Gln Leu Asn Tyr Val Lys Gln Phe Gln Leu Lys Asp Arg Glu Lys Ile
35 40 45
Ile Thr Ala Ile Arg Glu Ala Val Ile Glu Asn Lys Glu Lys Leu Ala
50 55 60
Gln Met Val Phe Glu Glu Thr Lys Leu Gly Arg Tyr Glu Asp Lys Ile
65 70 75 80
Ala Lys His Glu Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Ile
85 90 95
Thr Thr Ala Ala Phe Ser Gly Asp Glu Gly Leu Thr Ile Ile Glu Gln
100 105 110
Ala Pro Phe Gly Leu Val Gly Ala Val Thr Pro Val Thr Asn Pro Thr
115 120 125
Glu Thr Ile Ile Asn Asn Ser Ile Ser Leu Leu Ala Ala Gly Asn Ala
130 135 140
Val Val Leu Asn Val His Pro Ser Ser Lys Val Ser Cys Ala Phe Val
145 150 155 160
Val Asn Leu Ile Asn Gln Ala Ile Lys Asp Thr Gly Gly Pro Glu Asn
165 170 175
Leu Val Ser Met Val Lys Asp Pro Thr Leu Glu Thr Leu Asn Arg Ile
180 185 190
Ile Glu Ser Pro Lys Val Lys Leu Leu Val Gly Thr Gly Gly Pro Gly
195 200 205
Met Val Lys Thr Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly
210 215 220
Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Lys Gln
225 230 235 240
Ala Ala Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn Leu Leu
245 250 255
Cys Ile Ala Glu Lys Glu Leu Phe Val Ile Asp Ser Val Ala Asp Asp
260 265 270
Leu Ile Phe His Met Leu Asn Glu Gly Ala Tyr Met Leu Asp Gln Gln
275 280 285
Gln Leu Ser Lys Leu Met Ser Phe Ala Leu Glu Glu Asn Val His Gln
290 295 300
Glu Ala Gly Gly Cys Ser Leu Asp Asn Lys Arg Glu Tyr His Val Ser
305 310 315 320
Lys Asp Trp Val Gly Lys Asp Ala Val Ser Phe Leu Arg Gln Leu Gly
325 330 335
Ile Ala His Glu Glu Asp Ile Lys Leu Leu Ile Cys Glu Val Asp Phe
340 345 350
Asp His Pro Phe Val Gln Leu Glu Gln Met Met Pro Val Phe Pro Ile
355 360 365
Val Arg Val Gly Asn Leu Asp Glu Ala Ile Glu Met Ala Leu Leu Ala
370 375 380
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp
385 390 395 400
His Leu Thr Lys Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys
405 410 415
Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr
420 425 430
Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Ala Lys
435 440 445
Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg
450 455 460
Ile Ile Gly
465
<210> 11
<211> 473
<212> PRT
<213> Terrisporobacter othiniensis
<400> 11
Met Asp Ile Asp Val Lys Leu Ile Glu Lys Met Val Ser Asp Ala Leu
1 5 10 15
Lys Glu Ile Lys Ile Glu Asn Ile Thr Gln Glu Val Glu Lys Asn Ser
20 25 30
Ile Glu Asp Asn Tyr Gly Val Phe Lys Thr Ile Glu Gly Ala Ile Asp
35 40 45
Ala Ser Tyr Val Ala Gln Lys Glu Leu Leu Phe Ser Lys Ile Ser Asp
50 55 60
Arg Gln Lys Tyr Val Asp Ala Ile Arg Ser Ala Ile Leu Asn Gln Glu
65 70 75 80
Asn Leu Glu Leu Ile Ser Lys Leu Ala Val Asp Glu Thr Glu Ile Gly
85 90 95
Cys Tyr Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr
100 105 110
Pro Gly Thr Glu Asp Leu Ile Ser Ser Val Lys Thr Gly Asp Asp Gly
115 120 125
Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr
130 135 140
Pro Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met
145 150 155 160
Ile Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Thr
165 170 175
Lys Val Ser Gln Thr Ile Ile Lys Ile Leu Asn Lys Ala Leu Glu Glu
180 185 190
Val Gly Ala Pro Lys Asn Leu Ile Thr Met Val Glu Lys Pro Ser Ile
195 200 205
Glu Asn Thr Asn Lys Met Ile Glu Asn Pro Lys Val Arg Phe Leu Val
210 215 220
Ala Thr Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys
225 230 235 240
Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu
245 250 255
Thr Ala Asp Ile Arg Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser
260 265 270
Phe Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val
275 280 285
Ala Ser Ile Cys Asp Ser Leu Ile Glu Asn Met Lys Leu Asn Gly Ala
290 295 300
Tyr Leu Val Lys Asp Lys Lys Val Ile Glu Gln Leu Leu Ser Val Val
305 310 315 320
Ala Lys Glu Asn Gly Ala Pro Lys Thr Asn Phe Val Gly Lys Ser Ala
325 330 335
Lys Tyr Ile Leu Asp Lys Ile Gly Val Thr Val Asp Asp Asn Ile Lys
340 345 350
Ala Ile Ile Met Glu Val Asp Lys Asp His Thr Phe Val Gln Glu Glu
355 360 365
Met Met Met Pro Ile Leu Pro Ile Val Arg Val Glu Asp Val Asp Lys
370 375 380
Ala Ile Glu Tyr Ala Gln Glu Ala Glu His Gly Asn Arg His Thr Ala
385 390 395 400
Ile Met His Ser Lys Asn Ile Asp Lys Leu Ser Lys Met Ser Lys Ile
405 410 415
Met Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile
420 425 430
Gly Val Gly Gly Glu Gly His Ser Thr Phe Thr Ile Ala Gly Pro Thr
435 440 445
Gly Glu Gly Leu Thr Ser Pro Lys Ser Phe Cys Arg Ile Arg Arg Cys
450 455 460
Val Val Ser Asp Ser Phe Ser Ile Arg
465 470
<210> 12
<211> 457
<212> PRT
<213> Roseburia inulinivorans
<400> 12
Met Val His Asp Ile Val Gln Lys Val Met Ala Asn Met Gln Ile Ser
1 5 10 15
Gly Ser Val Ser Gly Met His Gly Val Phe Lys Asp Met Asn Asp Ala
20 25 30
Ile Asn Ala Ser Ile Glu Ala Gln Lys Lys Val Cys Thr Met Thr Leu
35 40 45
Asp Gln Arg Glu Gln Ile Ile Ser Leu Ile Arg Lys Lys Thr His Glu
50 55 60
Asn Ala Glu Ile Leu Ala Asn Met Gly Val Asn Glu Thr Gly Met Gly
65 70 75 80
Asn Val Gly Asp Lys Ile Leu Lys His His Leu Thr Ala Asp Lys Val
85 90 95
Pro Gly Thr Glu Asp Ile Ser Thr Ile Ala Trp Ser Gly Asp Arg Gly
100 105 110
Leu Thr Leu Val Glu Met Gly Pro Phe Gly Val Ile Gly Ala Ile Thr
115 120 125
Pro Ala Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Cys Ile Gly Met
130 135 140
Leu Ala Gly Gly Asn Thr Val Val Phe Asn Pro His Pro Asn Ala Lys
145 150 155 160
Lys Thr Thr Ile Tyr Thr Ile Asn Met Ile Asn Glu Ala Ser Ile Glu
165 170 175
Ala Gly Gly Pro Asp Asn Ile Ala Val Thr Val Glu Ala Pro Thr Leu
180 185 190
Asp Thr Ser Ala Ile Met Met Lys His Pro Ser Ile His Leu Leu Val
195 200 205
Ala Thr Gly Gly Pro Gly Val Val Thr Ala Val Leu Ser Ser Gly Lys
210 215 220
Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu
225 230 235 240
Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp Ile Val Asn Gly Cys Thr
245 250 255
Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Ile Val Ala Val
260 265 270
Asp Ser Val Ala Asp Glu Leu Met Asn Tyr Met Ile Ser Glu Asn Gly
275 280 285
Cys Tyr Leu Ala Ser Lys Glu Ile Gln Asp Lys Leu Val Gln Thr Val
290 295 300
Phe Thr Pro Lys Gly Ala Leu Asn Arg Lys Cys Val Gly Arg Ser Ala
305 310 315 320
Gln Thr Leu Leu Ala Met Val Gly Val Asn Val Gly Pro Glu Ile Arg
325 330 335
Cys Ile Val Phe Glu Gly Gln Lys Glu His Pro Leu Ile Ala Glu Glu
340 345 350
Leu Met Met Pro Ile Leu Gly Met Val Arg Val Lys Ser Phe Glu Glu
355 360 365
Gly Val Glu Thr Ala Val Trp Leu Glu His Gly Asn Arg His Ser Ala
370 375 380
His Ile His Ser Lys Asn Val Asp His Ile Thr Thr Tyr Ala Arg Ala
385 390 395 400
Leu Asp Thr Ala Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Ala Leu
405 410 415
Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr
420 425 430
Gly Glu Gly Leu Thr Ala Ala His Ser Phe Thr Lys Ser Arg Arg Cys
435 440 445
Thr Met Ser Asp Ser Leu Cys Ile Arg
450 455
<210> 13
<211> 462
<212> PRT
<213> Clostridium sp.
<400> 13
Met Ser Val Asn Glu Arg Met Val Gln Asp Ile Val Gln Glu Val Val
1 5 10 15
Ala Lys Met Gln Ile Ala Ser Asp Val Thr Gly Asn His Gly Val Phe
20 25 30
Gln Asp Met Asn Ala Ala Ile Glu Ala Ala Lys Lys Thr Gln Lys Val
35 40 45
Val Ala Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile
50 55 60
Arg Ala Lys Ile Lys Glu His Ala Glu Ile Phe Ala Arg Met Gly Val
65 70 75 80
Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Gln Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Ile
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu Asn Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr
275 280 285
Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg
450 455 460
<210> 14
<211> 509
<212> PRT
<213> Bacillus selenitireducens
<400> 14
Met Ser Ile Ser Glu Asp Met Leu Lys Gln Ile Val Lys Ser Val Met
1 5 10 15
Asn Asn Val Glu Lys Glu Leu Gly Glu Ser Pro Lys Pro Gln Pro Arg
20 25 30
Thr Ile Pro Val Thr Val Leu Asn Glu Val Thr Pro Val Lys Glu Ser
35 40 45
Arg Asp Pro Ser Pro Val His Gln His Val Leu Gly Val Phe Pro Asp
50 55 60
Val Asp Gln Ala Val His Ala Ala Ala Gly Ser Gln Lys Glu Trp Val
65 70 75 80
Lys Arg Pro Val Ser Glu Arg Arg Val Ile Leu Glu Ala Met Lys Gln
85 90 95
Thr Val Asp Ser Gln Lys Glu Arg Tyr Ser Glu Leu Ala Val Glu Glu
100 105 110
Thr Gly Leu Gly Asn Val Ala Asp Lys Ile Ala Lys His Glu Leu Ile
115 120 125
Ile Thr Lys Thr Pro Gly Val Glu Asp Leu Arg Thr Asp Ala Val Ser
130 135 140
Gly Asp His Gly Leu Thr Ile Glu Glu Asp Ala Pro Phe Gly Val Ile
145 150 155 160
Gly Ala Val Thr Pro Val Thr Asn Pro Thr Thr Thr Val Ile His Asn
165 170 175
Ser Leu Val Met Leu Ala Ala Gly Asn Ala Val Val Phe Asn Val His
180 185 190
Pro Ser Ser Lys Ala Thr Cys Gln Arg Val Val Ser Asp Leu Asn Ala
195 200 205
Ala Ile Lys Asp Ala Gly Gly Pro Gln Asn Leu Ile Thr Met Ile Ala
210 215 220
Glu Pro Thr Leu Asp Thr Leu Asn Gln Leu Ala Gly His Gln Glu Ile
225 230 235 240
Arg Leu Leu Val Gly Thr Gly Gly Gln Gly Leu Val Arg Ser Leu Leu
245 250 255
Gln Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val
260 265 270
Ile Val Asp Glu Thr Ala Asp Ile Glu Ala Ala Ala Lys Ala Ile Ile
275 280 285
Leu Gly Ala Ser Phe Asp Asn Asn Ile Leu Cys Ile Ala Glu Lys Glu
290 295 300
Val Phe Ala Leu Asp Val Ile Tyr Asp Asp Leu Ile Tyr His Leu Leu
305 310 315 320
Gln Glu Gly Ala Tyr Met Leu Ser Glu Ser Glu Leu Ser Gln Val Met
325 330 335
Lys Thr Val Leu Val Gly Asp Ala Pro Ile Glu Ala Ala Lys Ser Cys
340 345 350
Ser Val Ser Val Arg Pro Asp Leu His Ile Ala Lys Ala Trp Val Gly
355 360 365
Lys Glu Ala Ser Ala Ile Leu Lys Ala Ala Thr Gly Lys Asp Leu Pro
370 375 380
Val Lys Leu Leu Ile Cys Asp Val Glu Ala Thr His Pro Phe Val Gln
385 390 395 400
Leu Glu Gln Met Met Pro Val Leu Pro Ile Val Arg Met Pro Asp Phe
405 410 415
Asp Ala Ala Val Glu Ala Ala Val Lys Ala Glu Lys Gly Asn Arg His
420 425 430
Thr Ala Val Ile His Ser Lys Asn Val Asp Arg Leu Thr Gln Phe Ala
435 440 445
Arg Arg Ile Glu Thr Thr Ile Phe Val Lys Asn Ala Ser Ser Leu Ala
450 455 460
Gly Val Gly Phe Gly Gly Glu Gly Tyr Ala Thr Met Thr Ile Ala Gly
465 470 475 480
Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Thr Phe Thr Arg Lys Arg
485 490 495
Arg Cys Val Leu Ala Glu Gly Gly Phe Arg Ile Ile Gly
500 505
<210> 15
<211> 462
<212> PRT
<213> Blautia obeum
<400> 15
Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe
20 25 30
Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Glu Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr
275 280 285
Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Ile Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 16
<211> 478
<212> PRT
<213> Clostridium bolteae
<400> 16
Met Lys Glu Gly Val Ile Arg Leu Asp Met Asp Ile Lys Val Ile Glu
1 5 10 15
Gln Leu Val Glu Gln Ala Leu Lys Glu Ile Lys Ala Glu Gln Pro Leu
20 25 30
Lys Phe Thr Ala Pro Lys Leu Glu Arg Tyr Gly Val Phe Lys Thr Met
35 40 45
Asp Glu Ala Ile Ala Ala Ser Glu Glu Ala Gln Lys Lys Leu Leu Phe
50 55 60
Ser Lys Ile Ser Asp Arg Gln Lys Tyr Val Asp Val Ile Arg Ser Thr
65 70 75 80
Ile Ile Lys Arg Glu Asn Leu Glu Leu Ile Ser Arg Leu Ser Val Glu
85 90 95
Glu Thr Glu Ile Gly Asp Tyr Glu His Lys Leu Ile Lys Asn Arg Leu
100 105 110
Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Leu Thr Glu Ala Ile
115 120 125
Thr Gly Asp Asn Gly Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val
130 135 140
Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile Ile Asn
145 150 155 160
Asn Ser Ile Ser Met Ile Ala Gly Gly Asn Thr Val Val Phe Ser Pro
165 170 175
His Pro Arg Ala Lys Lys Val Ser Gln Met Thr Val Lys Met Leu Asn
180 185 190
Lys Ala Leu Ile Asp Asn Gly Ala Pro Pro Asn Leu Ile Thr Met Val
195 200 205
Glu Glu Pro Ser Ile Glu Asn Thr Asn Lys Met Ile Asp Asn Pro Ser
210 215 220
Val Arg Leu Leu Val Ala Thr Gly Gly Pro Ser Ile Val Lys Lys Val
225 230 235 240
Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro
245 250 255
Val Val Val Asp Glu Thr Ala Asp Ile Asp Lys Ala Ala Lys Asp Ile
260 265 270
Val Asp Gly Cys Ser Phe Asp Asn Asn Val Pro Cys Ile Ala Glu Lys
275 280 285
Glu Val Phe Ala Val Asp Ser Ile Cys Asp Tyr Leu Ile His His Met
290 295 300
Lys Glu Asn Gly Ala Tyr Gln Ile Thr Asp Pro Met Leu Leu Glu Gln
305 310 315 320
Leu Val Ala Leu Val Thr Thr Glu Lys Gly Gly Pro Lys Thr Ser Phe
325 330 335
Val Gly Lys Ser Ala Arg Tyr Ile Leu Asp Lys Leu Gly Ile Thr Val
340 345 350
Asp Ala Ser Val Arg Val Ile Ile Met Glu Val Pro Lys Asp His Leu
355 360 365
Leu Val Gln Glu Glu Met Met Met Pro Ile Leu Pro Val Val Arg Val
370 375 380
Ser Asp Val Asp Thr Ala Ile Glu Tyr Ala His Gln Ala Glu His Gly
385 390 395 400
Asn Arg His Thr Ala Met Met His Ser Lys Asn Val Glu Lys Leu Ser
405 410 415
Lys Met Ala Lys Ile Met Glu Thr Thr Ile Phe Val Lys Asn Ala Pro
420 425 430
Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Thr Thr Phe Thr
435 440 445
Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro Arg Thr Phe Cys
450 455 460
Arg Lys Arg Lys Cys Val Met Thr Asp Ala Phe Ser Ile Arg
465 470 475
<210> 17
<211> 515
<212> PRT
<213> Jeotgalibacillus alimentarius
<400> 17
Met Ser Ile Ser Glu Glu Thr Leu Gln Gln Ile Ile Lys Ser Val Val
1 5 10 15
Thr Gln Val Glu Ser Glu Leu Gly His Lys His Ser Ala Pro Ala Thr
20 25 30
Gly Ser Gln Ser Ala Thr Pro Val Ala Pro Val Lys Met Lys Ala Val
35 40 45
Thr Asn Lys Pro Val Phe Lys Glu His Thr Tyr Arg Ser Ser Gly Glu
50 55 60
Gly Ile Tyr Thr Thr Val Asp Glu Ala Val Ser Arg Ser Ala Ala Ala
65 70 75 80
Gln Lys Lys Tyr Val Lys His Phe Thr Met Asn Asp Arg Val Thr Val
85 90 95
Leu Asn Ala Ile Lys Gln Thr Val Leu Ser Ser Lys Asp Thr Leu Ser
100 105 110
Lys Met Ala Val Glu Glu Thr Gly Ile Gly Cys Tyr Glu Asp Lys Ile
115 120 125
Gln Lys His Glu Leu Val Cys Lys Lys Thr Pro Gly Ile Glu Asp Leu
130 135 140
Lys Thr Glu Ala Met Ser Gly Asp Asp Gly Leu Thr Ile Ile Glu Glu
145 150 155 160
Ala Pro Phe Gly Val Ile Gly Ala Val Thr Pro Val Thr Asn Pro Thr
165 170 175
Thr Thr Ile Ile Asn Asn Ser Leu Ser Met Leu Ala Ala Gly Asn Thr
180 185 190
Val Val Phe Asn Val His Pro Ser Ser Lys Lys Val Cys Ser Tyr Leu
195 200 205
Ile Arg Glu Leu His Gln Ser Ile Val Gln Ala Gly Gly Pro Ala Asp
210 215 220
Leu Ile Thr Met Val Ala Asp Pro Thr Leu Asp Thr Leu Asn Glu Leu
225 230 235 240
Ala Ala His Pro Asp Ile Arg Leu Leu Val Gly Thr Gly Gly Pro Gly
245 250 255
Leu Val Lys Ser Leu Leu Gln Ser Gly Lys Lys Ala Ile Gly Ala Gly
260 265 270
Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Val Asn
275 280 285
Ala Ala Lys Ser Ile Ile Leu Gly Ala Ser Phe Asp His Asn Leu Leu
290 295 300
Cys Ile Ala Glu Lys Glu Val Phe Val Leu Glu Glu Ala Ala Asn Glu
305 310 315 320
Leu Ile Tyr Gln Met Leu Asp Gln Gly Ala Tyr Met Leu Asn Asn Glu
325 330 335
Glu Leu Ser Arg Val Met Ser Leu Val Leu Thr Glu Asp Ser Ser Ser
340 345 350
Pro Val Ala Gly Gly Cys Thr Gly Lys Pro Ser Lys Lys Tyr His Val
355 360 365
Lys Lys Glu Trp Ile Gly Gln Ser Ala Ala Ala Ile Ala Arg Ala Ala
370 375 380
Gly Ile Asn Lys Glu Asn Ile Lys Leu Leu Ile Cys Glu Thr Asp Pro
385 390 395 400
Asp His Pro Phe Val Val Leu Glu Gln Met Met Pro Val Leu Pro Ile
405 410 415
Val Lys Thr Gln Ser Phe Glu Glu Ala Val Glu Trp Ala Val Ala Ala
420 425 430
Glu Lys Gly Asn Arg His Thr Ala Val Ile His Ser Thr Asn Val Asp
435 440 445
Arg Met Thr Ala Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys
450 455 460
Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr
465 470 475 480
Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Val Thr Ser Ala Arg
485 490 495
Ser Phe Thr Arg Lys Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg
500 505 510
Ile Ile Gly
515
<210> 18
<211> 470
<212> PRT
<213> Clostridium hiranonis
<400> 18
Met Lys Met Glu Leu Asp Leu Ile Gln Glu Met Ile Lys Gln Val Leu
1 5 10 15
Glu Glu Ile Lys Glu Glu Gly Val Glu Val Ser Ser Lys Glu Glu Tyr
20 25 30
Gly Tyr Gly Val Phe Asp Ser Met Val Glu Ala Ile Asp Ala Ser Glu
35 40 45
Lys Ala Gln Lys Glu Leu Phe Glu Cys Ser Val Gln Gln Arg Asp Lys
50 55 60
Phe Val Asp Ala Ile Arg Ala Glu Ile Leu Lys Lys Glu Asn Leu Glu
65 70 75 80
Met Ile Ser Tyr Asp Ala Val Glu Glu Thr Lys Ile Gly Arg Val Glu
85 90 95
Asp Lys Ile Ile Lys Asn Arg Val Ala Ala Glu Asn Thr Pro Gly Thr
100 105 110
Glu Asp Leu Lys Thr Arg Ala Ile Thr Gly Glu Asp Gly Leu Thr Ile
115 120 125
Glu Glu Tyr Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr
130 135 140
Asn Pro Thr Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Ala Gly
145 150 155 160
Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val Ser
165 170 175
Ile Lys Leu Val Lys Met Met Asn Lys Ala Leu Glu Glu Ala Gly Ala
180 185 190
Pro Arg Asn Leu Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Ser
195 200 205
Lys Ile Met Met Glu Ser Pro Lys Val Arg Leu Leu Val Ala Thr Gly
210 215 220
Gly Pro Ala Ile Val Lys Gln Val Leu Ser Ala Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Lys Asp Ile Val Ser Gly Ala Ser Phe Asp Asn
260 265 270
Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Val
275 280 285
Val Asp Gln Leu Ile Tyr Tyr Met Lys Lys Asn Gly Ala Tyr Glu Ile
290 295 300
Thr Ser Pro Glu Val Leu Glu Gln Leu Asp Lys Ala Val Ser Lys Glu
305 310 315 320
Asn Gly Lys Pro Asn Pro Ser Leu Val Gly Lys Ser Ala Lys Glu Leu
325 330 335
Leu Ala Leu Val Gly Ile Asn Val Asp Asp Asp Val Lys Leu Val Ile
340 345 350
Ala Arg Thr Asn Lys Asp His His Leu Val Thr Glu Glu Met Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Ser Val Ser Asp Val Asp Thr Ala Ile Asp
370 375 380
Trp Ala Tyr Glu Ala Glu Ala Gly Asn Arg His Thr Ala Ile Met His
385 390 395 400
Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Lys Lys Leu Glu Ala
405 410 415
Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly
420 425 430
Gly Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Ile Thr Ser Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met Ser
450 455 460
Glu Ala Leu Ser Ile Arg
465 470
<210> 19
<211> 466
<212> PRT
<213> Thermoanaerobacter sp.
<400> 19
Met Ile Asp Glu Asn Leu Val Val Thr Ile Thr Lys Lys Ile Leu Asn
1 5 10 15
Glu Ile Asn Leu Lys Glu Ala Glu Glu Lys Lys Glu Lys Asp Asn Pro
20 25 30
Asp Leu Gly Ile Phe Asn Asp Val Asn Glu Ala Val Glu Cys Ala Lys
35 40 45
Glu Ala Gln Lys Lys Phe Ala Leu Met Asp Leu Glu Lys Arg Glu Glu
50 55 60
Ile Ile Ala Ala Ile Arg Glu Ala Cys Val Asn Asn Ala Arg Leu Leu
65 70 75 80
Ala Glu Ile Ala Cys Ser Glu Thr Gly Arg Gly Arg Val Glu Asp Lys
85 90 95
Val Ala Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp
100 105 110
Leu Lys Pro Thr Ala Trp Thr Gly Asp Arg Gly Leu Thr Leu Val Glu
115 120 125
Met Ala Pro Val Gly Val Ile Ala Ser Ile Thr Pro Val Thr Asn Pro
130 135 140
Thr Ala Thr Ile Ile Asn Asn Thr Ile Ser Met Leu Ala Ala Gly Asn
145 150 155 160
Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Lys Thr Ser Asn Lys
165 170 175
Ala Val Glu Ile Ile Asn Glu Ala Ile Leu Lys Val Gly Ala Pro Asn
180 185 190
Gly Leu Val Cys Ser Ile Asn Asn Pro Thr Ile Gln Thr Ala Gln Lys
195 200 205
Leu Met Glu His Pro Glu Val Asn Met Val Val Val Thr Gly Gly Lys
210 215 220
Ala Val Val Gln Thr Ala Leu Arg Cys Gly Lys Lys Val Ile Gly Ala
225 230 235 240
Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val
245 250 255
Lys Ala Ala His Asp Ile Ala Cys Gly Ala Ser Phe Asp Asn Asn Leu
260 265 270
Pro Cys Ile Ala Glu Lys Glu Ile Ile Ala Val Glu Arg Ile Ala Asp
275 280 285
Thr Leu Leu Glu Arg Met Lys Arg Glu Gly Ala Tyr Val Leu His Gly
290 295 300
Lys Asp Ile Asp Arg Met Thr Glu Leu Ile Phe Gln Gly Gly Ala Ile
305 310 315 320
Asn Lys Asp Leu Ile Gly Arg Asp Ala His Phe Ile Leu Ser Gln Ile
325 330 335
Gly Ile Glu Thr Gly Lys Asp Ile Arg Leu Val Val Met Pro Val Asp
340 345 350
Val Ser His Pro Leu Val Tyr His Glu Gln Leu Met Pro Val Ile Pro
355 360 365
Phe Val Thr Val Pro Thr Val Glu Glu Ala Ile Asn Leu Ala Val Lys
370 375 380
Ala Glu Gly Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val
385 390 395 400
Glu Asn Met Thr Ala Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe Val
405 410 415
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
435 440 445
Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Arg
450 455 460
Ile Val
465
<210> 20
<211> 462
<212> PRT
<213> Clostridiales sp.
<400> 20
Met Pro Ile Asn Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe
20 25 30
Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Gln Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Val Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu
165 170 175
Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Val Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Thr Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Ser Ser Ile Val Asp Glu Leu Met His Tyr
275 280 285
Leu Val Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Ile Arg Cys Ile Val Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Cys Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ala Asp Ser Leu Cys Ile Arg
450 455 460
<210> 21
<211> 468
<212> PRT
<213> Sebaldella termitidis
<400> 21
Met Leu Asp Gly Leu Gln Leu Glu Asp Ile Ile Lys Lys Val Ile Asn
1 5 10 15
Asp Val Lys Asn Glu Lys Asp Ile Asn Ile Thr Asn Lys Glu Asn Ser
20 25 30
Cys Gly His Gly Ile Phe Thr Asn Ile Glu Thr Ala Val Asp Lys Ala
35 40 45
Tyr Glu Ala Gln Gln Thr Tyr Asn Ser Arg Ser Leu Glu Glu Arg Arg
50 55 60
Asn Ile Ile Ser Asn Ile Arg Lys Glu Leu Leu Lys Tyr Thr Glu Glu
65 70 75 80
Met Ala Glu Lys Thr Val Ala Glu Thr Lys Met Gly Arg Ile Lys Asp
85 90 95
Lys Ile Leu Lys Asn Lys Leu Ala Ile Glu Lys Thr Pro Gly Val Glu
100 105 110
Asp Leu Gly Thr Glu Val Phe Thr Gly Asp Asp Gly Leu Thr Leu Val
115 120 125
Glu Leu Ser Ala Phe Gly Val Leu Gly Ser Val Thr Pro Val Thr Asn
130 135 140
Pro Thr Glu Thr Ile Ile Asn Asn Thr Ile Gly Ala Leu Ala Gly Gly
145 150 155 160
Asn Ser Ile Val Phe Cys Pro His Pro Ser Ala Lys Asn Ile Cys Leu
165 170 175
Trp Leu Ile Lys Lys Leu Asn Gly Ile Ile Thr Glu Ala Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Ser Ala Ser Glu Ala Lys Lys Glu Asn Val Asp
195 200 205
Ile Leu Phe Ser His Glu Lys Ile Asn Met Leu Val Ile Thr Gly Gly
210 215 220
Thr Glu Ile Val Lys Leu Ala Leu Lys Ser Gly Lys Lys Val Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile
245 250 255
Glu Lys Ala Ala Lys Asp Ile Val Asn Gly Ala Gly Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Leu Val Leu Glu Ser Val Ala
275 280 285
Asp Tyr Leu Ile Phe Asn Met Glu Lys Ala Gly Ala Phe His Ile Thr
290 295 300
Asp Lys Glu Asp Ile Lys Lys Leu Glu Asp Thr Val Tyr Lys Asn Gly
305 310 315 320
Met Val Asn Lys Glu Phe Ile Gly Lys Asp Ala Gly Phe Ile Leu Glu
325 330 335
Lys Ser Gly Ile Lys Cys Ser Phe Asp Pro Ala Leu Ile Thr Leu Glu
340 345 350
Thr Asp Ile Asn His Val Phe Val Gln Lys Glu Leu Met Met Pro Val
355 360 365
Leu Ala Val Val Arg Gln Lys Asn Phe Glu Glu Ala Leu Lys Asn Ala
370 375 380
Ile Leu Thr Glu His Gly Leu Lys His Thr Ala Val Met His Ser Gln
385 390 395 400
Asn Val Thr Arg Leu Ser Ile Ala Ala Arg Glu Met Gln Thr Thr Ile
405 410 415
Phe Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Phe Gln Gly Glu
420 425 430
Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr
435 440 445
Ser Ala Arg Asn Phe Thr Arg Lys Arg Arg Cys Val Leu Gly Gly Ser
450 455 460
Phe Ser Ile Arg
465
<210> 22
<211> 462
<212> PRT
<213> Eubacterium plexicaudatum
<400> 22
Met Ser Val Asn Asp Gln Met Val Gln Asp Ile Val Arg Gln Val Leu
1 5 10 15
Ala Asn Met Arg Ile Ser Ser Asp Ala Ser Gly Ser Arg Gly Val Phe
20 25 30
Ser Asp Met Asn Glu Ala Val Glu Ala Ala Lys Lys Ala Gln Ala Val
35 40 45
Ile Gly Lys Met Pro Met Asp His Arg Glu Lys Ile Ile Ser Ser Ile
50 55 60
Arg Ala Lys Ile Met Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Lys Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Lys Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Ile Gly Met Val Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Val Asn Leu Val
165 170 175
Asn Glu Ala Ser Val Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu His Pro Thr Leu Asp Thr Ser Ala Ile Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr
275 280 285
Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Ala Lys Glu Gln Glu
290 295 300
Ala Leu Ile Ser Val Val Leu Lys Gly Gly Gln Leu Asn Arg Asp Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Gln Ala
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Asp Ser Phe Glu Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp His Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg
450 455 460
<210> 23
<211> 505
<212> PRT
<213> Escherichia sp.
<400> 23
Met Asn Asp Ile Glu Ile Ala Gln Ala Val Ser Thr Ile Leu Ser Lys
1 5 10 15
Phe Thr Lys Ala Thr Pro Asp Glu Ala Pro Ala Thr Ser Glu Ala Ala
20 25 30
Arg Val Asp Gly Leu Asp Glu Ile Val Ala Lys Ala Leu Ala Gln His
35 40 45
Ser Ser Val Arg Asp Ala Ser Ala Ile Ser Gln Val Ala Lys Val Ala
50 55 60
Asn Ala Ser Thr Gly Ala Phe Asp Thr Met Asp Glu Ala Ile Ser Ala
65 70 75 80
Ala Val Leu Ala Gln Val Gln Tyr Arg His Cys Ser Met Gln Asp Arg
85 90 95
Ala Ser Phe Ile Asn Gly Ile Arg Asp Val Phe Leu Gln Glu Asp Val
100 105 110
Leu Cys Ala Leu Ser Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn
115 120 125
Tyr Glu Asp Lys Leu Ile Lys Asn Arg Val Ala Ala Leu Lys Thr Pro
130 135 140
Gly Ile Glu Asp Leu Thr Thr Ser Ala Val Ser Gly Asp Gly Gly Leu
145 150 155 160
Thr Leu Ile Glu Tyr Ser Ala Phe Gly Val Ile Gly Ser Ile Thr Pro
165 170 175
Thr Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu
180 185 190
Ala Ala Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ser Arg Lys
195 200 205
Val Ser Leu Tyr Ala Val Glu Leu Ile Asn Asn Lys Leu Ala Gln Leu
210 215 220
Gly Ala Pro Ala Asn Met Val Val Thr Val Thr Lys Pro Ser Ile Asp
225 230 235 240
Asn Thr Asn Val Leu Ile Asn Asp Pro Arg Ile Asn Met Leu Val Ala
245 250 255
Thr Gly Gly Pro Ala Ile Val Lys Thr Val Met Ser Ser Gly Lys Lys
260 265 270
Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr
275 280 285
Ala Asp Ile Glu Lys Ala Ala Arg Asp Ile Ile Lys Gly Cys Ser Phe
290 295 300
Asp Asn Asn Leu Pro Cys Val Ala Glu Lys Glu Val Ile Val Val Asn
305 310 315 320
Gln Val Ala Asp Tyr Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr
325 330 335
Leu Leu Cys Asp Lys Lys Leu Ser Gln Gln Leu Gln Ser Leu Val Leu
340 345 350
Asn Glu Lys Gly Thr Gly Pro Asn Thr Ala Phe Val Gly Lys Asp Ala
355 360 365
Arg Tyr Ile Leu Gln Gln Leu Gly Ile Gln Val Gly Asp Asp Ile Lys
370 375 380
Val Ile Leu Ile Glu Ala Glu Lys Thr His Pro Phe Val Val His Glu
385 390 395 400
Leu Met Met Pro Val Leu Pro Val Val Arg Val Asp Asn Val Asp Glu
405 410 415
Ala Ile Glu Leu Ala Val Lys Val Glu His Gly Asn Arg His Thr Ala
420 425 430
Val Met His Ser Thr Asn Val Glu Lys Leu Thr Lys Met Ala Arg Leu
435 440 445
Ile Gln Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Leu
450 455 460
Gly Val Gly Gly Glu Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr
465 470 475 480
Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Ala Arg Arg Arg Arg Cys
485 490 495
Val Met Val Glu Ala Leu Asn Ile Arg
500 505
<210> 24
<211> 529
<212> PRT
<213> Rhodospirillum rubrum
<400> 24
Met Asn Asp Gly Gln Ile Ala Ala Ala Val Ala Lys Val Leu Glu Ala
1 5 10 15
Tyr Gly Val Pro Ala Asp Pro Ser Ala Ala Ala Pro Ala Pro Ala Ala
20 25 30
Pro Val Ala Pro Ala Ala Pro Thr Ala Gly Ser Val Ser Glu Met Ile
35 40 45
Ala Arg Gly Ile Ala Lys Ala Ser Ser Asp Asp Gln Ile Ala Gln Ile
50 55 60
Val Ala Lys Val Val Gly Asp Tyr Ser Ala Gln Ala Ala Lys Pro Ala
65 70 75 80
Val Val Pro Gly Ala Ala Ala Ser Thr Glu Ala Gly Asp Gly Val Phe
85 90 95
Asp Thr Met Asp Ala Ala Val Asp Ala Ala Val Leu Ala Gln Gln Gln
100 105 110
Tyr Leu Leu Cys Ser Met Thr Asp Arg Gln Arg Phe Val Asp Gly Ile
115 120 125
Arg Glu Val Ile Leu Gln Lys Asp Thr Leu Glu Leu Ile Ser Arg Met
130 135 140
Ala Ala Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys
145 150 155 160
Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr
165 170 175
Glu Ala Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Ser Pro
180 185 190
Phe Gly Ala Ile Gly Ala Val Ala Pro Thr Thr Asn Pro Thr Glu Thr
195 200 205
Ile Ile Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Ile
210 215 220
Phe Ser Pro His Pro Arg Ala Thr Lys Val Ser Leu Leu Thr Val Lys
225 230 235 240
Leu Ile Asn Gln Lys Leu Ala Cys Leu Gly Ala Pro Ala Asn Leu Val
245 250 255
Val Thr Val Ser Lys Pro Ser Val Glu Asn Thr Asn Ala Met Met Ala
260 265 270
His Pro Lys Ile Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile Val
275 280 285
Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
290 295 300
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
305 310 315 320
Leu Asp Ile Ile Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
325 330 335
Ala Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile
340 345 350
Phe Ser Met Lys Lys Gln Gly Ala Tyr Gln Ile Thr Asp Pro Ala Val
355 360 365
Leu Arg Lys Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln
370 375 380
Thr Ser Cys Val Gly Lys Ser Ala Val Trp Leu Leu Asn Lys Ile Gly
385 390 395 400
Ile Glu Val Asp Ser Ser Val Lys Val Ile Leu Met Glu Val Pro Lys
405 410 415
Glu His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu
420 425 430
Val Arg Val Ser Asp Val Asp Glu Ala Ile Ala Val Ala Ile Glu Val
435 440 445
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr Asn Val Arg
450 455 460
Lys Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys
465 470 475 480
Asn Gly Pro Ser Tyr Ala Gly Leu Gly Val Gly Gly Glu Gly Tyr Thr
485 490 495
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys
500 505 510
Ser Phe Ala Arg Lys Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile
515 520 525
Arg
<210> 25
<211> 472
<212> PRT
<213> Clostridium beijerinckii
<400> 25
Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile
1 5 10 15
Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser
20 25 30
Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala
35 40 45
Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys
50 55 60
Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn
65 70 75 80
Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys
85 90 95
Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro
100 105 110
Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu
115 120 125
Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro
130 135 140
Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile
145 150 155 160
Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn
165 170 175
Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala
180 185 190
Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu
195 200 205
Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala
210 215 220
Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys
225 230 235 240
Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr
245 250 255
Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe
260 265 270
Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp
275 280 285
Gln Ile Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr
290 295 300
Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr
305 310 315 320
Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro
325 330 335
Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val
340 345 350
Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile
385 390 395 400
Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu
405 410 415
Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly
420 425 430
Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val
450 455 460
Met Val Asp Ala Phe Asn Ile Arg
465 470
<210> 26
<211> 468
<212> PRT
<213> Eubacterium hallii
<400> 26
Met Asn Ile Asp Val Glu Leu Ile Glu Lys Val Val Lys Lys Val Leu
1 5 10 15
Asn Asp Val Glu Thr Gly Ser Ser Glu Ser Glu Tyr Gly Tyr Gly Ile
20 25 30
Phe Asp Thr Met Asp Glu Ala Ile Glu Ala Ser Ala Lys Ala Gln Lys
35 40 45
Glu Tyr Met Asn His Ser Met Ala Asp Arg Gln Arg Tyr Val Glu Gly
50 55 60
Ile Arg Glu Val Val Cys Thr Lys Glu Asn Leu Glu Tyr Met Ser Lys
65 70 75 80
Leu Ala Val Glu Glu Ser Gly Met Gly Ala Tyr Glu Tyr Lys Val Ile
85 90 95
Lys Asn Arg Leu Ala Ala Val Lys Ser Pro Gly Val Glu Asp Leu Thr
100 105 110
Thr Glu Ala Leu Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Cys
115 120 125
Pro Phe Gly Val Ile Gly Ala Ile Ala Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Ala Met Leu Ala Gly Gly Asn Thr Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ser Lys Gly Val Ser Ile Trp Leu Ile
165 170 175
Lys Lys Leu Asn Ala Lys Leu Glu Glu Leu Gly Ala Pro Arg Asn Leu
180 185 190
Ile Val Thr Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Ile Met Met
195 200 205
Asn His Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile
210 215 220
Val Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Ile Ala Val Asp Gln Ile Ala Asp Tyr Leu
275 280 285
Ile Phe Asn Met Lys Asn Asn Gly Ala Tyr Glu Val Lys Asp Pro Glu
290 295 300
Ile Ile Glu Lys Met Val Asp Leu Val Thr Lys Asp Arg Lys Lys Pro
305 310 315 320
Ala Val Asn Phe Val Gly Lys Ser Ala Gln Tyr Ile Leu Asp Lys Val
325 330 335
Gly Ile Lys Val Gly Pro Glu Val Lys Cys Ile Ile Met Glu Ala Pro
340 345 350
Lys Asp His Pro Phe Val Gln Ile Glu Leu Met Met Pro Ile Leu Pro
355 360 365
Ile Val Arg Val Pro Asn Val Asp Glu Ala Ile Asp Phe Ala Val Glu
370 375 380
Val Glu His Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val
385 390 395 400
Asp Lys Leu Thr Lys Met Ala Lys Glu Ile Glu Thr Thr Ile Phe Val
405 410 415
Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Met Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
435 440 445
Lys Ser Phe Cys Arg Lys Arg Arg Cys Val Leu Gln Asp Gly Leu His
450 455 460
Ile Arg Met Lys
465
<210> 27
<211> 532
<212> PRT
<213> Vibrio sp.
<400> 27
Met Asn Glu Gln Glu Ile Ala His Ala Val Glu Asn Val Leu Ser Lys
1 5 10 15
Tyr Thr Asn Val Thr Ala Gln Asn Ala Glu Pro Val Ser Tyr Ser Ser
20 25 30
Asn Ala Ser Leu Glu Asn Ile Val Ser Gln Ala Leu Ala Gly Asn Met
35 40 45
Val Lys Gln Pro Glu Thr Gln Thr Ala Pro Asp Leu Asn Ser Asn Ile
50 55 60
Glu Asn Ile Val Ser Gln Ile Leu Ala Glu Asn Gln Ala Lys Pro Gln
65 70 75 80
Ser Val Gln Cys Gln Ser Ala Asn His Gly Thr Thr Glu Tyr Leu Gly
85 90 95
Cys Phe Ala Ser Met Glu Glu Ala Ile Ser Ala Ala Ser His Ala Gln
100 105 110
Val Gln Tyr Arg His Cys Thr Met Gly Asp Arg Ala Ser Phe Val Lys
115 120 125
Gly Ile Arg Glu Val Phe Thr Gln Asp Asp Val Leu Glu Lys Ile Ser
130 135 140
Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Ala Asp Lys Leu
145 150 155 160
Thr Lys Asn Arg Ile Ala Ala Thr Lys Thr Pro Gly Ile Glu Asp Leu
165 170 175
Thr Thr Ser Ala Leu Ser Gly Asp Ser Gly Leu Thr Leu Thr Glu Phe
180 185 190
Ser Ala Tyr Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
195 200 205
Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Thr
210 215 220
Val Val Tyr Ser Pro His Pro Arg Ser Arg Asn Val Ser Leu Val Ala
225 230 235 240
Val Asp Leu Ile Asn Arg Lys Leu Ala Glu Leu Gly Ala Pro Ala Asn
245 250 255
Leu Val Val Thr Val Leu Glu Pro Ser Ile Asp Asn Thr Asn Ala Met
260 265 270
Met Asn Asp Pro Arg Val Asn Met Leu Val Ala Thr Gly Gly Pro Ser
275 280 285
Ile Val Lys Thr Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly
290 295 300
Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr Ala Asn Ile Glu Lys
305 310 315 320
Ala Ala Lys Asp Ile Ile Asn Gly Cys Ala Phe Asp Asn Asn Leu Pro
325 330 335
Cys Ile Ala Glu Lys Glu Val Ile Val Val Asn Glu Val Ala Asp Tyr
340 345 350
Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr Leu Leu Cys Asp Lys
355 360 365
Gln Lys Ile Gln Gln Leu Gln Ser Leu Val Leu Asn Glu Lys Gly Thr
370 375 380
Gly Pro Asn Thr Ser Phe Val Gly Lys Gly Ala Arg Tyr Ile Leu Asp
385 390 395 400
Lys Leu Asn Ile Gln Val Ser Asp Asp Ile Lys Val Ile Leu Ile Glu
405 410 415
Thr Glu Arg Asn His Pro Phe Val Val His Glu Leu Met Met Pro Ile
420 425 430
Leu Pro Val Val Arg Val Glu Asn Val Asp Glu Ala Ile Asp Leu Ala
435 440 445
Ile Lys Val Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr
450 455 460
Asn Val Glu Lys Leu Ser Lys Met Ala Arg Leu Ile Gln Thr Thr Ile
465 470 475 480
Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu
485 490 495
Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr
500 505 510
Ser Ala Arg Ser Phe Ala Arg Tyr Arg Arg Cys Val Met Val Glu Ala
515 520 525
Leu Asn Ile Arg
530
<210> 28
<211> 464
<212> PRT
<213> Rhodopseudomonas palustris
<400> 28
Met Val Ala Lys Ala Ile Arg Asp His Ala Gly Thr Ala Gln Pro Ser
1 5 10 15
Gly Asn Ala Ala Thr Ser Ser Ala Ala Val Ser Asp Gly Val Phe Glu
20 25 30
Thr Met Asp Ala Ala Val Glu Ala Ala Ala Leu Ala Gln Gln Gln Tyr
35 40 45
Leu Leu Cys Ser Met Ser Asp Arg Ala Arg Phe Val Gln Gly Ile Arg
50 55 60
Asp Val Ile Leu Asn Gln Asp Thr Leu Glu Lys Met Ser Arg Met Ala
65 70 75 80
Val Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys Asn
85 90 95
Arg Leu Ala Gly Glu Lys Thr Pro Gly Ile Glu Asp Leu Thr Thr Asp
100 105 110
Ala Phe Ser Gly Asp Asn Gly Leu Thr Leu Val Glu Tyr Ser Pro Phe
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile
130 135 140
Val Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Val Phe
145 150 155 160
Ser Pro His Pro Arg Ala Arg Gln Val Ser Leu Leu Leu Val Arg Leu
165 170 175
Ile Asn Gln Lys Leu Ala Ala Leu Gly Ala Pro Glu Asn Leu Val Val
180 185 190
Thr Val Glu Lys Pro Ser Ile Glu Asn Thr Asn Ala Met Met Ala His
195 200 205
Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Ala Ile Val Lys
210 215 220
Ala Val Leu Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asn Ile Glu Lys Ala Ala Cys
245 250 255
Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala
260 265 270
Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile Phe
275 280 285
Asn Leu Lys Lys Asn Gly Ala Tyr Glu Ile Lys Asp Pro Ala Val Leu
290 295 300
Gln Gln Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln Thr
305 310 315 320
Lys Cys Val Gly Lys Ser Ala Val Trp Leu Leu Ser Gln Ile Gly Ile
325 330 335
Ser Val Asp Ala Ser Ile Lys Ile Ile Leu Met Glu Val Pro Arg Glu
340 345 350
His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu Val
355 360 365
Arg Val Glu Thr Val Asp Asp Ala Ile Asp Leu Ala Ile Glu Val Glu
370 375 380
His Asp Asn Arg His Thr Ala Ile Met His Ser Thr Asp Val Arg Lys
385 390 395 400
Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys Asn
405 410 415
Gly Pro Ser Tyr Ala Gly Leu Gly Ala Gly Gly Glu Gly Tyr Ser Thr
420 425 430
Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Ser
435 440 445
Phe Ala Arg Arg Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile Arg
450 455 460
<210> 29
<211> 468
<212> PRT
<213> Desulfatibacillum alkenivorans
<400> 29
Met Ser Val Lys Glu Phe Ala Leu Glu Asp Met Val Ala Ser Val Ile
1 5 10 15
Met Glu Met Met Asn Lys Asp Asp Asp Ser Cys Gln Pro Thr Gly Asp
20 25 30
Gly Ile Tyr Glu Thr Ile Asp Glu Ala Val Ala Lys Ala Lys Ala Ala
35 40 45
Gln Pro Arg Leu Ile Ser Leu Ser Leu Glu Lys Arg Glu Ala Ile Leu
50 55 60
Thr Ala Ile Arg Lys Ile Ser Leu Glu Lys Asn Glu Glu Trp Ala Lys
65 70 75 80
Ala Thr Val Ala Glu Thr Gly Leu Gly Arg Val Glu Asp Lys Ile Ala
85 90 95
Glu Asn Ile Leu Ala Ala Thr Lys Thr Pro Gly Thr Glu Asp Leu Asp
100 105 110
Ala Lys Ala Leu Ser Gly Asp Ala Gly Leu Thr Leu Ile Glu Tyr Ala
115 120 125
Pro Phe Gly Val Ile Gly Ser Leu Thr Pro Val Thr Asn Ala Thr Gly
130 135 140
Thr Leu Ile Asn Asn Thr Ile Ser Met Leu Ala Gly Gly Asn Thr Val
145 150 155 160
Val Tyr Asn Val His Pro Ser Ala Leu Lys Ile Ser Thr Glu Val Ile
165 170 175
Arg Thr Phe His Lys Val Ile Val Glu Asn Gly Gly Pro Glu Gly Cys
180 185 190
Val Gly Met Val Ala Thr Pro Thr Met Glu Thr Ala Gly Glu Ile Met
195 200 205
Ala His Pro Asp Ile Asn Val Leu Val Ala Thr Gly Gly Ala Gly Val
210 215 220
Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Cys Ile Arg Lys Ala
245 250 255
Ala Glu Glu Ile Ile Ala Gly His Ser Ile Asn Asn Asn Ile Phe Cys
260 265 270
Ile Ser Glu Lys Glu Val Ile Ala Val Asp Glu Val Ala Asp Asn Leu
275 280 285
Leu Lys Phe Met Glu Glu Thr Gly Lys Ala Ala Ile Leu Thr Pro Glu
290 295 300
Glu Ala Gln Lys Val Thr Glu Thr Val Ile His Asp Asn His Val Val
305 310 315 320
Lys Asp Tyr Val Gly Lys Asn Ala Ser Val Ile Ile Glu Gly Ala Gly
325 330 335
Leu Thr Arg Leu Ala Gly Lys Lys Asp Leu Arg Cys Leu Val Phe Glu
340 345 350
Ala Asp Cys Lys His Pro Met Val Trp Ile Glu Gln Met Met Pro Val
355 360 365
Leu Pro Met Val Arg Val Lys Asp Val Trp Glu Gly Ile Asp Leu Ala
370 375 380
Val Lys Val Glu Gln Gly Asn Arg His Thr Ala Met Met His Ser Thr
385 390 395 400
Asn Val Glu His Leu Thr Ala Leu Ala Arg Ala Ile Gln Thr Thr Ile
405 410 415
Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Leu Asn Gly Glu
420 425 430
Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr
435 440 445
Ser Ala Lys Ser Phe Cys Arg Gln Arg Arg Cys Val Leu Ile Asp Ser
450 455 460
Phe Arg Ile Val
465
<210> 30
<211> 469
<212> PRT
<213> Clostridium saccharobutylicum
<400> 30
Met Asn Asn Asn Leu Phe Val Ser Pro Glu Thr Lys Asp Leu Lys Leu
1 5 10 15
Arg Thr Asn Val Glu Asn Leu Lys Phe Lys Gly Cys Glu Gly Gly Ser
20 25 30
Thr Tyr Ile Gly Val Phe Glu Asn Ala Glu Thr Ala Ile Asp Glu Ala
35 40 45
Val Asn Ala Gln Lys Arg Leu Ser Leu Tyr Tyr Thr Lys Glu Gln Arg
50 55 60
Glu Lys Ile Ile Thr Glu Ile Arg Lys Val Thr Leu Lys Asn Lys Glu
65 70 75 80
Ile Leu Ala Gln Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu
85 90 95
Asp Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr
100 105 110
Glu Asp Leu Ala Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val
115 120 125
Val Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ser
145 150 155 160
Gly Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val
165 170 175
Ala Phe Ala Val Asp Met Ile Asn Arg Ala Ile Ile Ser Cys Gly Gly
180 185 190
Pro Arg Asn Leu Val Thr Ala Ile Lys Asn Pro Thr Met Glu Ser Leu
195 200 205
Asp Ala Ile Ile Lys His Pro Ala Ile Lys Leu Leu Cys Gly Thr Gly
210 215 220
Gly Pro Gly Met Val Lys Thr Leu Leu Ser Ser Gly Lys Lys Ser Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp
245 250 255
Ile Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val
275 280 285
Ala Asp Asp Leu Ile Lys Asn Met Leu Lys Asn Asn Ala Val Ile Ile
290 295 300
Asn Lys Asp Gln Val Ser Arg Leu Val Asn Leu Val Leu Gln Lys Asn
305 310 315 320
Asn Glu Thr Ser Glu Tyr Thr Ile Asn Lys Lys Trp Val Gly Lys Asp
325 330 335
Ala Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Ser Ser Asp Val
340 345 350
Arg Cys Ile Ile Cys Glu Val Asp Ala Asp His Pro Phe Val Met Thr
355 360 365
Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp
370 375 380
Glu Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser
385 390 395 400
Ala Tyr Ile Tyr Ser Lys Asn Ile Glu Asn Leu Asn Arg Phe Glu Lys
405 410 415
Glu Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly
420 425 430
Val Gly Tyr Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys
435 440 445
Thr Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg
450 455 460
Cys Val Phe Val Gly
465
<210> 31
<211> 468
<212> PRT
<213> Clostridium sp.
<400> 31
Met Asn Lys Asp Thr Thr Ile Ser Glu Thr Glu Asn Leu Lys Phe Lys
1 5 10 15
Thr Asn Ile Lys Asn Ala Asp Leu Lys Asn Tyr Glu Asn Ser Thr Ser
20 25 30
Tyr Ser Gly Val Phe Glu Asp Val Glu Val Ala Ile Asn Lys Ala Ile
35 40 45
Thr Ala Gln Lys Glu Phe Ser Leu Tyr Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Leu Thr Glu Ile Arg Lys Ala Thr Leu Lys Asn Lys Lys Ile
65 70 75 80
Leu Ala Lys Met Ile Leu Asp Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Ile Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Asp Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro
180 185 190
Lys Asn Leu Ile Thr Ala Val Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Glu Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Asp Asn Val Ala
275 280 285
Asp Asn Leu Ile Asp Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Lys Asp Lys Ile Thr Lys Leu Leu Asn Leu Ile Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Asn Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asn Glu Ile Asp Val Glu Ala Pro Ser Ser Val Arg
340 345 350
Cys Ile Ile Cys Glu Val Glu Pro Asp His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asn Ile Asp Asp
370 375 380
Ala Ile Gln Tyr Ala Lys Ile Ala Glu Gln Ser Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Asn Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 32
<211> 467
<212> PRT
<213> Clostridium taeniosporum
<400> 32
Met Glu Arg Asn Leu Ser Val Leu Ser Gln Lys Lys Asn Leu Lys Ile
1 5 10 15
Thr Arg Lys Val Glu Gly Asn Lys Ser Ile Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Glu Lys Val Asp Asn Ala Ile Thr Lys Ala Ile Tyr Ala
35 40 45
Gln Arg Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Glu Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Ile Ile Lys Cys Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Asp Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Val Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Lys His
245 250 255
Ala Ala Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asp Asp
275 280 285
Leu Ile Gln Asn Met Leu Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Glu Val Ser Lys Leu Leu Asp Leu Val Leu Ile Glu Lys Lys Asp Glu
305 310 315 320
Pro Ser Gly Tyr Val Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Lys Lys Val Ser Asp Asp Val Lys Cys
340 345 350
Ile Ile Cys Glu Val Asp Val Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Ala Ile Ala Arg Val Lys Asp Ile Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Gly Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 33
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 33
Met Glu Arg Asn Leu Ser Val Leu Ser Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Ser Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Arg Glu Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asp Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ala Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 34
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 34
Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 35
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 35
Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Glu Ala Ile Tyr Ala
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 36
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 36
Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ser
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 37
<211> 472
<212> PRT
<213> Clostridium beijerinckii
<400> 37
Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile
1 5 10 15
Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser
20 25 30
Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala
35 40 45
Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys
50 55 60
Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn
65 70 75 80
Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys
85 90 95
Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro
100 105 110
Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu
115 120 125
Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro
130 135 140
Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile
145 150 155 160
Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn
165 170 175
Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala
180 185 190
Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu
195 200 205
Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala
210 215 220
Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys
225 230 235 240
Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr
245 250 255
Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe
260 265 270
Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp
275 280 285
Gln Val Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr
290 295 300
Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr
305 310 315 320
Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro
325 330 335
Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val
340 345 350
Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile
385 390 395 400
Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu
405 410 415
Glu Thr Thr Ile Phe Val Lys Asn Ser Pro Ser Tyr Ala Gly Ile Gly
420 425 430
Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val
450 455 460
Met Val Asp Ala Phe Asn Ile Arg
465 470
<210> 38
<211> 468
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 38
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 39
<211> 468
<212> PRT
<213> Clostridium sp.
<400> 39
Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Cys Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 40
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 40
Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Thr Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Ala Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Asn Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asn
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Glu Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Ile Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 41
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 41
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Asn Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Ile Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Leu Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Ser Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Ile Lys
340 345 350
Cys Ile Val Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Val Lys Tyr Thr Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 42
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 42
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 43
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 43
Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
Gln Ala Gln Lys Ile Leu Ser Ile His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 44
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 44
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Ile Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Ile Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Glu Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Arg Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 45
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 45
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Asp Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Ile His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Ala
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 46
<211> 468
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 46
Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 47
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 47
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 48
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 48
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Leu Lys
1 5 10 15
Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Asn Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Ile Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Leu Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Ser Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Ile Lys
340 345 350
Cys Ile Val Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Val Lys Tyr Thr Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 49
<211> 468
<212> PRT
<213> Clostridium sp.
<400> 49
Met Asn Lys Asp Thr Thr Ile Ser Glu Thr Glu Asn Leu Lys Phe Lys
1 5 10 15
Thr Asn Ile Lys Asn Ala Asp Leu Lys Asn Tyr Glu Asn Ser Thr Ser
20 25 30
Tyr Ser Gly Val Phe Glu Asp Val Glu Val Ala Ile Asn Lys Ala Ile
35 40 45
Thr Ala Gln Lys Glu Phe Ser Leu Tyr Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Leu Thr Glu Ile Arg Lys Ala Thr Leu Lys Asn Lys Lys Ile
65 70 75 80
Leu Ala Lys Met Ile Leu Asp Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Ile Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Asp Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro
180 185 190
Lys Asn Leu Ile Thr Ala Val Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Glu Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Asp Asn Val Ala
275 280 285
Asp Asn Leu Ile Asp Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Lys Asp Lys Ile Thr Lys Leu Leu Asn Leu Ile Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Asn Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asn Glu Ile Asp Val Glu Ala Pro Ser Ser Val Arg
340 345 350
Cys Ile Ile Cys Glu Val Glu Pro Asp His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asn Ile Asp Asp
370 375 380
Ala Ile Gln Tyr Ala Lys Ile Ala Glu Gln Ser Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Asn Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 50
<211> 469
<212> PRT
<213> Clostridium saccharobutylicum
<400> 50
Met Asn Asn Asn Leu Phe Val Ser Pro Glu Thr Lys Asp Leu Lys Leu
1 5 10 15
Arg Thr Asn Val Glu Asn Leu Lys Phe Lys Gly Cys Glu Gly Gly Ser
20 25 30
Thr Tyr Ile Gly Val Phe Glu Asn Ala Glu Thr Ala Ile Asp Glu Ala
35 40 45
Val Asn Ala Gln Lys Arg Leu Ser Leu Tyr Tyr Thr Lys Glu Gln Arg
50 55 60
Glu Lys Ile Ile Thr Glu Ile Arg Lys Val Thr Leu Lys Asn Lys Glu
65 70 75 80
Ile Leu Ala Gln Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu
85 90 95
Asp Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr
100 105 110
Glu Asp Leu Ala Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val
115 120 125
Val Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ser
145 150 155 160
Gly Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val
165 170 175
Ala Phe Ala Val Asp Met Ile Asn Arg Ala Ile Ile Ser Cys Gly Gly
180 185 190
Pro Arg Asn Leu Val Thr Ala Ile Lys Asn Pro Thr Met Glu Ser Leu
195 200 205
Asp Ala Ile Ile Lys His Pro Ala Ile Lys Leu Leu Cys Gly Thr Gly
210 215 220
Gly Pro Gly Met Val Lys Thr Leu Leu Ser Ser Gly Lys Lys Ser Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp
245 250 255
Ile Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val
275 280 285
Ala Asp Asp Leu Ile Lys Asn Met Leu Lys Asn Asn Ala Val Ile Ile
290 295 300
Asn Lys Asp Gln Val Ser Arg Leu Val Asn Leu Val Leu Gln Lys Asn
305 310 315 320
Asn Glu Thr Ser Glu Tyr Thr Ile Asn Lys Lys Trp Val Gly Lys Asp
325 330 335
Ala Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Ser Ser Asp Val
340 345 350
Arg Cys Ile Ile Cys Glu Val Asp Ala Asp His Pro Phe Val Met Thr
355 360 365
Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp
370 375 380
Glu Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser
385 390 395 400
Ala Tyr Ile Tyr Ser Lys Asn Ile Glu Asn Leu Asn Arg Phe Glu Lys
405 410 415
Glu Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly
420 425 430
Val Gly Tyr Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys
435 440 445
Thr Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg
450 455 460
Cys Val Phe Val Gly
465
<210> 51
<211> 467
<212> PRT
<213> Clostridium botulinum
<400> 51
Met Glu Arg Asn Leu Ser Val Leu Ser Gln Thr Asn Asp Leu Lys Ile
1 5 10 15
Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu
20 25 30
Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala
35 40 45
Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile
50 55 60
Ile Lys Ser Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala
65 70 75 80
Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile
85 90 95
Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu
100 105 110
Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met
115 120 125
Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr
130 135 140
Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser
145 150 155 160
Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala
165 170 175
Val Asp Met Ile Asn Lys Ala Val Ile Arg Glu Gly Gly Pro Glu Asn
180 185 190
Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile
195 200 205
Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly
210 215 220
Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asp Lys
245 250 255
Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp
275 280 285
Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn
290 295 300
Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu
305 310 315 320
Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys
325 330 335
Leu Phe Leu Asp Lys Ile Gly Ile Lys Ala Ser Asp Asn Val Arg Cys
340 345 350
Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr
385 390 395 400
Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile
405 410 415
Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly
420 425 430
Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val
450 455 460
Leu Ala Gly
465
<210> 52
<211> 527
<212> PRT
<213> Caldalkalibacillus thermarum
<400> 52
Met Asn Met Thr Glu Lys Asp Ile Glu Lys Ile Val Gln Ser Val Leu
1 5 10 15
His Asn Val Glu Ser Ala Leu Gly Lys Ser Ala Ser Ala Ser Pro Ser
20 25 30
Val Ser Ala Val Ser Val Ala Ser Gly Glu Gly Ile Lys Pro Val Gln
35 40 45
Phe Lys Gln Val Pro Val Phe Gln Gln Glu Thr Val Lys Ser Pro Asn
50 55 60
Arg Asn Arg Asn Leu Gly Gly Ala Glu Glu Lys Trp Gly Val Phe Asn
65 70 75 80
His Met Glu Asp Ala Ile Glu Ala Ser Tyr Arg Ala Gln Met Glu Phe
85 90 95
Val Lys His Phe Gln Leu Lys Asp Arg Glu Lys Ile Ile Thr Ala Ile
100 105 110
Arg Glu Ala Val Leu Arg Glu Lys Glu Val Leu Ala Arg Lys Val Tyr
115 120 125
Glu Glu Thr Lys Ile Gly Arg Tyr Glu Asp Lys Val Ala Lys His Glu
130 135 140
Leu Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Lys Thr Glu Ala
145 150 155 160
Phe Ser Gly Asp Asn Gly Leu Thr Ile Val Glu Arg Ala Pro Tyr Gly
165 170 175
Leu Ile Gly Ala Val Thr Pro Val Thr Asn Pro Thr Glu Thr Ile Ile
180 185 190
Asn Asn Ala Ile Gly Met Leu Ala Ala Gly Asn Ala Val Val Phe Asn
195 200 205
Val His Pro Ser Ser Lys Arg Ser Cys Ala Tyr Ala Val Gln Leu Ile
210 215 220
Asn Lys Ala Ile Thr Glu Ala Gly Gly Pro His His Leu Val Thr Met
225 230 235 240
Val Lys Glu Pro Thr Leu Asp Thr Leu Gln Thr Leu Ile Asp Ser Pro
245 250 255
Lys Val Lys Leu Leu Val Gly Thr Gly Gly Pro Gly Leu Val Gln Thr
260 265 270
Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro
275 280 285
Pro Val Ile Val Asp Asp Thr Ala Asp Leu Glu His Ala Ala Arg Ser
290 295 300
Ile Ile Glu Gly Ala Ala Phe Asp Asn Asn Leu Leu Cys Ile Ala Glu
305 310 315 320
Lys Glu Val Phe Val Leu Glu Ser Val Ala Asp Asp Leu Ile Phe His
325 330 335
Met Leu Asn His Gly Ala Tyr Met Leu Gly Gln His Glu Val Glu Gln
340 345 350
Val Met Ala Phe Ala Leu Glu Glu Gln Gly Asn Glu Gln Asn Arg Gly
355 360 365
Cys Gly Phe Asn Pro Gln Arg His Tyr Gln Val Ser Lys Asp Trp Ile
370 375 380
Gly Gln Asp Ala Arg Leu Phe Leu Glu His Ile Gly Val Gln Pro Pro
385 390 395 400
Thr Glu Val Lys Leu Leu Ile Cys Asp Val Glu Phe Asp His Pro Phe
405 410 415
Val Gln Leu Glu Gln Met Met Pro Val Leu Pro Ile Val Arg Val Lys
420 425 430
Thr Leu Asp Glu Ala Ile Glu Lys Ala Val Met Ala Glu His Gly Asn
435 440 445
Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu Thr Lys
450 455 460
Phe Ala Arg Ala Ile Gln Thr Thr Leu Phe Val Lys Asn Ala Ser Ser
465 470 475 480
Leu Ala Gly Val Gly Tyr Gly Gly Glu Gly His Thr Thr Met Thr Ile
485 490 495
Ala Gly Pro Thr Gly Glu Gly Val Thr Ser Ala Lys Thr Phe Thr Arg
500 505 510
Glu Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg Ile Ile Gly
515 520 525
<210> 53
<211> 480
<212> PRT
<213> Pelosinus fermentans
<400> 53
Met Ser Ile Asp Gln Ala Leu Ile Glu Lys Ile Thr Leu Glu Ile Leu
1 5 10 15
Thr Lys Met Gln Thr Gly Ala Lys Ala Ala Pro Ala Gly Tyr Gly Asp
20 25 30
Gly Ile Phe Glu Thr Val Asp Glu Ala Val Ala Ala Ala Arg Lys Ala
35 40 45
Tyr Gln Glu Leu Lys Thr Leu Ser Leu Glu Lys Arg Glu Val Leu Ile
50 55 60
Lys Ala Met Arg Asp Val Ala Tyr Glu Asn Ala Thr Ile Leu Ala Gln
65 70 75 80
Met Ala Val Asp Glu Ser Gly Met Gly Arg Val Ser Asp Lys Ile Ile
85 90 95
Lys Asn Gln Val Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Thr
100 105 110
Thr Gln Ala Trp Ser Gly Asp Asn Gly Leu Thr Leu Ile Glu Met Gly
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Val Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Thr Val
145 150 155 160
Phe Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Met Lys Ile Ile
165 170 175
Thr Leu Leu Asn Gln Ala Ile Val Lys Ala Gly Gly Pro Asn Asn Leu
180 185 190
Leu Thr Ser Val Ala Asn Pro Ser Ile Lys Ala Ala Asn Glu Met Met
195 200 205
Lys His Pro Gly Ile Asn Met Leu Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Ile Ala Ile Gly Ser Ile Ala Asp Arg Leu
275 280 285
Ile Thr Tyr Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Asn
290 295 300
Ile Asp Arg Leu Leu Asp Val Ile Met Thr Val Gln Glu Glu Lys Ile
305 310 315 320
Ala Glu Gly Cys Thr Asp Lys Pro Lys Arg Ser Tyr Gly Ile Asn Lys
325 330 335
Asp Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Ser Lys Ile Gly Ile
340 345 350
Asp Val Pro Asp Ser Val Arg Val Val Leu Cys Glu Thr Pro Ala Asp
355 360 365
His Pro Phe Val Ile Glu Glu Leu Met Met Pro Val Leu Pro Val Val
370 375 380
Gln Val Lys Asp Ile Asp Glu Ala Ile Glu Val Ala Val Arg Val Glu
385 390 395 400
His Gly Asn Arg His Thr Ala Ala Met His Ser Lys Asn Val Asp His
405 410 415
Leu Thr Arg Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val Lys Asn
420 425 430
Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Ser
435 440 445
Phe Thr Leu Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Ser
450 455 460
Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Ser Ile Val
465 470 475 480
<210> 54
<211> 479
<212> PRT
<213> Thermoanaerobacterium thermosaccharolyticum
<400> 54
Met Glu Ile Asn Asp Asn Met Ile Ser Glu Ile Ile Glu Arg Val Leu
1 5 10 15
Lys Glu Val Gln Lys Lys Ser Ile Asn Asp Arg Tyr Gln Asn Gly Ile
20 25 30
Tyr Asp Arg Met Glu Asp Ala Ile Glu Ala Ala Tyr Glu Ala Gln Lys
35 40 45
Lys Leu Met Lys Met Ser Ile Glu Gln Arg Glu Arg Leu Ile Ser Ala
50 55 60
Met Arg Lys Ala Ile Leu Asp Asn Ala Lys Ser Cys Ala Lys Leu Ser
65 70 75 80
Val Glu Glu Thr Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu
85 90 95
Lys Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Val Leu Thr Thr Lys
100 105 110
Ala Tyr Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Ala Pro Phe
115 120 125
Gly Val Ile Gly Ser Ile Thr Pro Ser Thr Asn Pro Ala Glu Thr Val
130 135 140
Cys Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Thr Val Val Phe
145 150 155 160
Ser Pro His Pro Gly Ala Ile Lys Ser Ser Leu Met Ala Val Glu Phe
165 170 175
Leu Asn Lys Ala Ile Ile Glu Ala Gly Gly Pro Glu Asn Leu Ile Thr
180 185 190
Ser Val Arg Lys Pro Ser Ile Glu Phe Thr Asp Val Met Ile Asn His
195 200 205
Pro Lys Ile Asn Leu Leu Val Ala Thr Gly Gly Pro Ala Ile Val Lys
210 215 220
Lys Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Cys Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala Arg
245 250 255
Asp Ile Ile Leu Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala
260 265 270
Glu Lys Glu Val Ile Ala Val Glu Ser Ile Tyr Glu Glu Leu Ile Glu
275 280 285
Asn Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Asp Asp Glu Ala Glu
290 295 300
Lys Leu Ala Asp Ile Val Leu Thr Lys Lys Glu Glu Leu Lys Ala Glu
305 310 315 320
Gly Cys Ser Ile Asn Arg Pro Lys Phe Glu Tyr Ser Val Asn Lys Lys
325 330 335
Trp Val Gly Lys Asp Ala Lys Val Leu Leu Glu Gln Ile Gly Ile Asn
340 345 350
Val Gly Asp Asp Ile Val Cys Ile Ile Tyr Arg Cys Asp Lys Gln His
355 360 365
Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Ile Val Lys
370 375 380
Val Lys Asn Ile Asp Glu Ala Ile Asn Val Ala Val Glu Val Glu His
385 390 395 400
Gly Asn His His Thr Ala Glu Met His Ser Lys Asn Ile Asp Asn Leu
405 410 415
Thr Arg Phe Ala Lys Ala Ile Asn Thr Thr Ile Phe Val Lys Asn Ala
420 425 430
Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr Thr Thr Phe
435 440 445
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Ala Thr Phe
450 455 460
Thr Arg Gln Arg Arg Cys Val Met Val Asp Ser Phe Arg Ile Val
465 470 475
<210> 55
<211> 480
<212> PRT
<213> Pelosinus fermentans
<400> 55
Met Ser Ile Asp Gln Ala Leu Ile Glu Lys Ile Thr Leu Glu Ile Leu
1 5 10 15
Thr Lys Met Gln Thr Gly Ala Lys Ala Ala Pro Ala Gly Tyr Gly Asp
20 25 30
Gly Ile Phe Glu Thr Val Asp Glu Ala Val Ala Ala Ala Arg Lys Ala
35 40 45
Tyr Gln Glu Leu Lys Thr Leu Ser Leu Glu Lys Arg Glu Val Leu Ile
50 55 60
Lys Ala Met Arg Asp Val Ala Tyr Glu Asn Ala Thr Ile Leu Ala Gln
65 70 75 80
Met Ala Val Asp Glu Ser Gly Met Gly Arg Val Ser Asp Lys Ile Ile
85 90 95
Lys Asn Gln Val Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Thr
100 105 110
Thr Gln Ala Trp Ser Gly Asp Asn Gly Leu Thr Leu Ile Glu Met Gly
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Val Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Thr Val
145 150 155 160
Phe Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Met Lys Ile Ile
165 170 175
Thr Leu Leu Asn Gln Ala Ile Val Lys Ala Gly Gly Pro Asn Asn Leu
180 185 190
Leu Thr Ser Val Ala Asn Pro Ser Ile Lys Ala Ala Asn Glu Met Met
195 200 205
Lys His Pro Gly Ile Asn Met Leu Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Ile Ala Ile Gly Ser Ile Ala Asp Arg Leu
275 280 285
Ile Thr Tyr Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Asn
290 295 300
Ile Asp Arg Leu Leu Asn Val Ile Met Thr Val Gln Glu Glu Lys Ile
305 310 315 320
Ala Glu Gly Cys Thr Asp Lys Pro Lys Arg Ser Tyr Gly Ile Asn Lys
325 330 335
Asp Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Ser Lys Ile Gly Ile
340 345 350
Asp Val Pro Asp Ser Val Arg Val Val Leu Cys Glu Thr Pro Ala Asp
355 360 365
His Pro Phe Val Ile Glu Glu Leu Met Met Pro Val Leu Pro Val Val
370 375 380
Gln Val Lys Asp Ile Asp Glu Ala Ile Glu Val Ala Val Arg Val Glu
385 390 395 400
His Gly Asn Arg His Thr Ala Ala Met His Ser Lys Asn Val Asp His
405 410 415
Leu Thr Arg Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val Lys Asn
420 425 430
Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Ser
435 440 445
Phe Thr Leu Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Ser
450 455 460
Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Ser Ile Val
465 470 475 480
<210> 56
<211> 479
<212> PRT
<213> Desulfosporosinus sp.
<400> 56
Met Ser Val Asp Gln Ala Leu Ile Arg Lys Ile Thr Ser Glu Ile Leu
1 5 10 15
Ala Lys Met Gln Asn Arg Thr Val Ser Ala Cys Gln Asp Cys Asn Gly
20 25 30
Ile Phe Thr Thr Val Asp Glu Ala Val Ala Ala Ala Arg Ile Ala Tyr
35 40 45
Gln Glu Leu Arg Thr Leu Ser Leu Glu Lys Arg Glu Glu Leu Ile Lys
50 55 60
Ala Met Arg Asn Val Ala Leu Glu Asn Ala Thr Met Leu Ala Glu Met
65 70 75 80
Ala Val Lys Glu Ser Gly Met Gly Arg Val Glu Asp Lys Ile Ile Lys
85 90 95
His Lys Leu Val Ala Val Lys Thr Pro Gly Thr Glu Asp Leu Arg Thr
100 105 110
Glu Ala Trp Ser Gly Asp Ser Gly Leu Thr Leu Val Glu Met Gly Pro
115 120 125
Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Val Ala Thr
130 135 140
Ile Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Ala Val Phe
145 150 155 160
Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Ile Lys Thr Ile Thr
165 170 175
Leu Leu Asn Glu Ala Ile Val Lys Ala Gly Gly Pro Met Asn Leu Leu
180 185 190
Thr Ser Val Ala Asp Pro Ser Ile Ser Ala Ala Asn Ala Met Met Lys
195 200 205
His Ala Gly Ile Asn Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val
210 215 220
Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
225 230 235 240
Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
245 250 255
Arg Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
260 265 270
Ala Glu Lys Glu Val Ile Ala Val Gly Cys Ile Ala Asp Arg Leu Ile
275 280 285
Ser Asn Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Lys Ile
290 295 300
Asp Gln Met Leu Asp Val Val Met Thr Ala Thr Glu Glu Lys Met Ala
305 310 315 320
Glu Gly Cys Thr Ala Lys Pro Ile Lys Arg Tyr Gly Ile Asn Lys Asp
325 330 335
Phe Val Gly Lys Asp Ala Lys Tyr Ile Leu Thr Gln Ile Gly Leu Asp
340 345 350
Val Pro Asp Thr Ile Lys Val Ile Leu Cys Glu Thr Pro Ala Asp His
355 360 365
Pro Phe Val Ile Glu Glu Leu Met Met Pro Ile Leu Pro Val Val Gln
370 375 380
Val Lys Asp Ile Asp Ala Ala Ile Glu Leu Ala Val Lys Val Glu His
385 390 395 400
Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val Asp Asn Met
405 410 415
Thr Arg Phe Ala Lys Ala Ile Glu Thr Thr Ile Phe Val Lys Asn Ala
420 425 430
Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Cys Thr Phe
435 440 445
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Thr Ala Arg Ser Phe
450 455 460
Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ser Phe Ser Ile Ile
465 470 475
<210> 57
<211> 482
<212> PRT
<213> Clostridium methylpentosum
<400> 57
Met Glu Ile Thr Pro Asn Gln Ile Asp Gln Ile Val Ala Asn Val Met
1 5 10 15
Ala Gln Leu Gly Gly Ser Ala Ala Pro Ala Ala Ser Tyr Asp Ser Thr
20 25 30
Gln Tyr Ser Gly Arg Lys Tyr Ile Gly Ile Tyr Ala Thr Met Thr Glu
35 40 45
Ala Ile Asp Ala Val Ala Asp Ala Tyr Lys Val Leu Arg Ser Met Thr
50 55 60
Val Asp Gln Arg Glu Lys Ile Ile Glu Lys Ile Arg Glu Phe Thr Arg
65 70 75 80
Ala Glu Ala Glu Ile Met Ala Lys Met Gly Val Glu Glu Thr Gly Met
85 90 95
Gly Lys Val Glu His Lys Thr Leu Lys His His Leu Val Ala Asp Lys
100 105 110
Thr Pro Gly Thr Glu Asp Ile Gln Thr Glu Ala Met Ser Gly Asp Gly
115 120 125
Gly Leu Thr Leu Leu Glu Met Ala Pro Phe Gly Ile Ile Gly Ala Ile
130 135 140
Ser Pro Ser Thr Asn Pro Ser Glu Thr Val Leu Cys Asn Ser Met Gly
145 150 155 160
Met Ile Ala Gly Ala Asn Ala Val Val Phe Asn Pro His Pro Ser Ala
165 170 175
Ile Cys Thr Ser Asn Tyr Ala Val Asp Leu Val Asn Arg Ala Ser Leu
180 185 190
Ala Ala Gly Gly Pro Ala Asn Leu Cys Cys Ser Val Val Lys Pro Thr
195 200 205
Met Gln Ser Ala Asp Asp Met Val Lys Asp Pro Arg Val Lys Met Leu
210 215 220
Val Cys Thr Gly Gly Pro Gly Val Val Arg Ala Met Leu Ser Ser Gly
225 230 235 240
Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp
245 250 255
Asp Thr Ala Asp Ile Arg Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys
260 265 270
Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Ala
275 280 285
Phe Ser Asn Ile Ala Asp Glu Leu Met Tyr Tyr Met Gln Gln Asn Gly
290 295 300
Ala Tyr Phe Ile Ser Gly Glu Met Ala Asp Arg Leu Ala Lys Ile Val
305 310 315 320
Leu Val Glu Lys Lys Asn Glu Lys Thr Gly Lys Ile Ser Tyr Ser Val
325 330 335
Ser Arg Asp Trp Val Gly Arg Asp Ala Lys Lys Phe Leu Ala Ala Leu
340 345 350
Asp Ile Glu Val Gly Asp Asp Val Arg Cys Val Ile Cys Glu Thr Asp
355 360 365
Glu Asn His Leu Phe Val Gln Thr Glu Leu Met Met Pro Ile Leu Pro
370 375 380
Ile Val Arg Val Asn Asn Ile Asp Glu Ala Val Arg Met Ala Val Arg
385 390 395 400
Ala Glu His Gly Asn Arg His Thr Ala His Met His Ser Lys Asn Ile
405 410 415
Asp Asn Leu Thr Lys Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val
420 425 430
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Ser Glu Gly His
435 440 445
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
450 455 460
Arg Ser Phe Thr Arg Lys Arg Arg Cys Val Met Ser Asp Ser Phe Asn
465 470 475 480
Ile Val
<210> 58
<211> 467
<212> PRT
<213> Thermoanaerobacterium saccharolyticum
<400> 58
Met Lys Val Lys Glu Glu Asp Ile Glu Ala Ile Val Lys Lys Val Leu
1 5 10 15
Ser Glu Phe Asn Phe Glu Lys Asn Thr Lys Ser Phe Arg Asp Phe Gly
20 25 30
Val Phe Gln Asp Met Asn Asp Ala Ile Arg Ala Ala Lys Asp Ala Gln
35 40 45
Lys Lys Leu Arg Asn Met Ser Met Glu Ser Arg Glu Lys Ile Ile Gln
50 55 60
Asn Ile Arg Lys Lys Ile Met Glu Asn Lys Lys Ile Leu Ala Glu Met
65 70 75 80
Gly Val Ser Glu Thr Gly Met Gly Lys Val Glu His Lys Ile Ile Lys
85 90 95
His Glu Leu Val Ala Leu Lys Thr Pro Gly Thr Glu Asp Ile Val Thr
100 105 110
Thr Ala Trp Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Gly Pro
115 120 125
Phe Gly Val Ile Gly Thr Ile Thr Pro Ser Thr Asn Pro Ser Glu Thr
130 135 140
Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val
145 150 155 160
Phe Asn Pro His Pro Gly Ala Val Asn Val Ser Asn Tyr Ala Val Lys
165 170 175
Leu Val Asn Glu Ala Val Met Glu Ala Gly Gly Pro Glu Asn Leu Val
180 185 190
Ala Ser Val Glu Lys Pro Thr Leu Glu Thr Gly Asn Ile Met Phe Lys
195 200 205
Ser Pro Asp Val Ser Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val
210 215 220
Thr Ser Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly
225 230 235 240
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala
245 250 255
Lys Asp Ile Val Asp Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile
260 265 270
Ala Glu Lys Glu Val Val Ser Val Asp Lys Ile Thr Asp Glu Leu Ile
275 280 285
Tyr Tyr Met Gln Gln Asn Gly Cys Tyr Lys Ile Glu Gly Arg Glu Ile
290 295 300
Glu Lys Leu Ile Glu Leu Val Leu Asp His Lys Gly Gly Lys Ile Thr
305 310 315 320
Leu Asn Arg Lys Trp Val Gly Lys Asp Ala His Leu Ile Leu Lys Ala
325 330 335
Ile Gly Ile Asp Ala Asp Glu Ser Val Arg Cys Ile Ile Phe Glu Ala
340 345 350
Glu Lys Asp Asn Pro Leu Val Val Glu Glu Leu Met Met Pro Ile Leu
355 360 365
Gly Ile Val Arg Ala Lys Asn Val Asp Glu Ala Ile Met Ile Ala Thr
370 375 380
Glu Leu Glu His Gly Asn Arg His Ser Ala His Met His Ser Lys Asn
385 390 395 400
Val Asp Asn Leu Thr Lys Phe Gly Lys Ile Ile Asp Thr Ala Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Tyr Gly Gly Glu Gly
420 425 430
Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser
435 440 445
Ala Arg Thr Phe Thr Lys Ser Arg Arg Cys Val Leu Ala Asp Gly Leu
450 455 460
Ser Ile Arg
465
<210> 59
<211> 467
<212> PRT
<213> Thermoanaerobacterium xylanolyticum
<400> 59
Met Lys Val Lys Glu Glu Asp Ile Glu Ala Ile Val Lys Lys Val Leu
1 5 10 15
Ser Glu Phe Asn Leu Glu Lys Thr Thr Ser Lys Tyr Gly Asp Val Gly
20 25 30
Ile Phe Gln Asp Met Asn Asp Ala Ile Ser Ala Ala Lys Asp Ala Gln
35 40 45
Lys Lys Leu Arg Asn Met Pro Met Glu Ser Arg Glu Lys Ile Ile Gln
50 55 60
Asn Ile Arg Lys Lys Ile Met Glu Asn Lys Lys Ile Leu Ala Glu Met
65 70 75 80
Gly Val Arg Glu Thr Gly Met Gly Arg Val Glu His Lys Ile Val Lys
85 90 95
His Glu Leu Val Ala Leu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr
100 105 110
Thr Ala Trp Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Gly Pro
115 120 125
Phe Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu Thr
130 135 140
Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val
145 150 155 160
Phe Asn Pro His Pro Gly Ala Val Asn Val Ser Asn Tyr Ala Val Lys
165 170 175
Leu Val Asn Glu Ala Ala Met Glu Ala Gly Gly Pro Glu Asn Leu Val
180 185 190
Val Ser Val Glu Lys Pro Thr Leu Glu Thr Gly Asn Val Met Phe Lys
195 200 205
Ser Ser Asp Val Ser Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val
210 215 220
Thr Ala Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly
225 230 235 240
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala
245 250 255
Lys Asp Ile Ile Asp Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile
260 265 270
Ala Glu Lys Glu Val Val Ser Val Asp Lys Ile Thr Asp Glu Leu Ile
275 280 285
Tyr Tyr Met Gln Lys Asn Gly Cys Tyr Lys Ile Glu Gly Arg Glu Ile
290 295 300
Glu Lys Leu Ile Glu Leu Val Leu Asp His Glu Gly Gly Lys Thr Thr
305 310 315 320
Leu Asn Arg Lys Trp Val Gly Lys Asp Ala His Leu Ile Leu Lys Ala
325 330 335
Ile Gly Ile Asp Ala Asp Glu Ser Val Arg Cys Ile Ile Phe Glu Ala
340 345 350
Glu Lys Asp Asn Pro Leu Val Val Glu Glu Leu Met Met Pro Ile Leu
355 360 365
Gly Ile Val Arg Ala Lys Asn Val Asp Glu Ala Ile Met Ile Ala Thr
370 375 380
Glu Leu Glu His Gly Asn Arg His Ser Ala His Met His Ser Lys Asn
385 390 395 400
Ile Asp Asn Leu Thr Lys Phe Gly Lys Ile Ile Asp Thr Ala Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Tyr Gly Gly Glu Gly
420 425 430
Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser
435 440 445
Ala Arg Thr Phe Thr Lys Ser Arg Arg Cys Val Leu Ala Asp Gly Leu
450 455 460
Ser Ile Arg
465
<210> 60
<211> 477
<212> PRT
<213> Acetonema longum
<400> 60
Met Val Asp Gln Thr Leu Ile Glu Gln Ile Thr Arg Ala Val Leu Thr
1 5 10 15
Gln Met Lys Ala Gly Lys Asp Ala Ala Val Ser Gly Asp Gly Ile Phe
20 25 30
Ala Thr Val Asp Gln Ala Val Ala Ala Ala Arg Gln Ala Tyr Gln Glu
35 40 45
Leu Arg Leu Leu Thr Leu Glu Lys Arg Glu Thr Leu Ile Arg Ala Ile
50 55 60
Arg Asp Ala Ala Phe Ala Asn Ala Ala Val Ile Ala Gln Met Ala Val
65 70 75 80
Gln Glu Ser Gly Met Gly Arg Val Glu Asp Lys Ile Leu Lys Asn Gln
85 90 95
Leu Ala Ala Arg Lys Thr Pro Gly Thr Glu Asp Leu Thr Ser Arg Ala
100 105 110
Trp Ser Gly Asp His Gly Leu Thr Leu Val Glu Met Ala Pro Tyr Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Ser Glu Thr Val Ile
130 135 140
Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Ile Val Phe Ser
145 150 155 160
Pro His Pro Thr Ala Gln Asn Thr Ser Leu Thr Thr Ile Arg Leu Leu
165 170 175
Asn Glu Ala Ile Val Lys Ala Gly Gly Pro Asp Asn Leu Leu Thr Ala
180 185 190
Val Ala Glu Pro Ser Ile Glu Ala Ala Asn Ala Met Met Arg His Pro
195 200 205
Gly Ile Gln Met Leu Val Ala Thr Gly Gly Pro Ala Val Val Lys Ala
210 215 220
Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Val Val Asp Glu Thr Ala Asp Ile Ala Lys Ala Ala Lys Asp
245 250 255
Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Ile Ala Val Gly Arg Ile Ala Asp Glu Leu Ile Ser Tyr
275 280 285
Leu Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Arg Asp Ile Glu Arg
290 295 300
Leu Met Glu Val Val Leu Thr Glu Arg Thr Glu Glu Met Ala Pro Gly
305 310 315 320
Cys Val Gly Lys Pro Arg Arg Val Tyr Gly Val Asn Lys Asp Tyr Ile
325 330 335
Gly Lys Asp Ala Lys Phe Ile Leu Ser Lys Ile Asn Ile Gln Ala Pro
340 345 350
Asp His Ile Arg Val Ile Leu Cys Glu Thr Pro Ala Asp His Pro Phe
355 360 365
Val Leu Glu Glu Leu Met Met Pro Val Leu Pro Leu Val Ser Val Arg
370 375 380
Asp Ile Asp Ala Ala Ile Asp Leu Ala Val Lys Val Glu His Gly Asn
385 390 395 400
Arg His Thr Ala Val Met His Ser Lys Asn Val Asp Tyr Met Thr Arg
405 410 415
Leu Ala Lys Ala Ile Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser
420 425 430
Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Thr Phe Thr Ile
435 440 445
Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Thr Arg
450 455 460
Gln Arg Arg Cys Ala Leu Val Asp Ala Phe Ser Ile Val
465 470 475
<210> 61
<211> 465
<212> PRT
<213> Geobacillus thermoglucosidans
<400> 61
Met Ser Val Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu
1 5 10 15
Glu Glu Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp
20 25 30
Gly Ile Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala
35 40 45
Gln Lys Glu Leu Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile
50 55 60
Glu Ala Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg
65 70 75 80
Met Ala Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val
85 90 95
Lys Asn Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg
100 105 110
Thr Glu Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile
165 170 175
Lys Ile Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu
180 185 190
Ile Thr Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met
195 200 205
Lys His Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Val Ala Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu
275 280 285
Ile Asp Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu
290 295 300
Gln Ile Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn
305 310 315 320
Lys Glu Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly
325 330 335
Ile Asn Val Pro Pro Asp Ile Arg Val Ala Ile Met Glu Val Asp Gly
340 345 350
Lys His Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile
355 360 365
Val Arg Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val
370 375 380
Glu His Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp
385 390 395 400
His Leu Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys
405 410 415
Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys
435 440 445
Asp Phe Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile
450 455 460
Arg
465
<210> 62
<211> 463
<212> PRT
<213> Geobacillus sp.
<400> 62
Met Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu Glu Glu
1 5 10 15
Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp Gly Ile
20 25 30
Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala Gln Lys
35 40 45
Glu Leu Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile Glu Ala
50 55 60
Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg Met Ala
65 70 75 80
Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val Lys Asn
85 90 95
Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg Thr Glu
100 105 110
Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile
130 135 140
Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe
145 150 155 160
Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile Lys Ile
165 170 175
Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu Ile Thr
180 185 190
Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met Lys His
195 200 205
Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys
210 215 220
Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala Lys
245 250 255
Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala
260 265 270
Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu Ile Asp
275 280 285
Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu Gln Ile
290 295 300
Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn Lys Glu
305 310 315 320
Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly Ile Asn
325 330 335
Val Pro Pro Asp Thr Arg Val Ala Ile Met Glu Val Asp Gly Lys His
340 345 350
Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg
355 360 365
Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val Glu His
370 375 380
Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu
385 390 395 400
Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys Asn Ala
405 410 415
Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala Thr Phe
420 425 430
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe
435 440 445
Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile Arg
450 455 460
<210> 63
<211> 463
<212> PRT
<213> Geobacillus thermoglucosidasius
<400> 63
Met Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu Glu Glu
1 5 10 15
Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp Gly Ile
20 25 30
Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala Gln Lys
35 40 45
Glu Phe Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile Glu Ala
50 55 60
Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg Met Ala
65 70 75 80
Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val Lys Asn
85 90 95
Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg Thr Glu
100 105 110
Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile
130 135 140
Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe
145 150 155 160
Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile Lys Ile
165 170 175
Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu Ile Thr
180 185 190
Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met Lys His
195 200 205
Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys
210 215 220
Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala Lys
245 250 255
Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala
260 265 270
Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu Ile Asp
275 280 285
Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu Gln Ile
290 295 300
Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn Lys Glu
305 310 315 320
Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly Ile Asn
325 330 335
Val Pro Pro Asp Ile Arg Val Ala Ile Met Glu Val Asp Gly Lys His
340 345 350
Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg
355 360 365
Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val Glu His
370 375 380
Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu
385 390 395 400
Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys Asn Ala
405 410 415
Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala Thr Phe
420 425 430
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe
435 440 445
Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile Arg
450 455 460
<210> 64
<211> 463
<212> PRT
<213> Bacillus azotoformans
<400> 64
Met Ala Val Glu Ala Lys Ala Ile Glu Glu Ile Val Lys Lys Ile Leu
1 5 10 15
Glu Glu Met Met Ile Lys Lys Asp Ala Cys Ile Thr Gly Tyr Gly Ile
20 25 30
Phe Glu Asp Met Asn Glu Ala Ile Glu Ala Ala Thr Ile Ala Gln Lys
35 40 45
Glu Leu Leu Lys Leu Ser Leu Glu Gln Arg Gly Asn Leu Ile Thr Ala
50 55 60
Ile Arg Lys Ala Ala Lys Asp Asn Ala Glu Thr Phe Ala Gln Met Ala
65 70 75 80
Val Asp Glu Thr Gly Met Gly Asn Tyr Gly Asp Lys Val Ile Lys Asn
85 90 95
Leu Ile Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Thr Thr Glu
100 105 110
Ala Phe Ser Gly Asp His Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr
115 120 125
Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Val
130 135 140
Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe
145 150 155 160
Ser Pro His Pro Thr Ala Lys Asn Thr Ser Leu Lys Ala Ile Glu Val
165 170 175
Ile Asn Lys Ala Ile Ile Lys Ala Gly Gly Pro Pro Asn Leu Ile Thr
180 185 190
Ser Val Ala Asn Pro Thr Ile Asp Gln Ala Asn Ile Met Met Lys His
195 200 205
Lys Lys Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys
210 215 220
Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Ala Val Val Asp Glu Thr Ala Asn Leu Glu Lys Ala Ala Arg
245 250 255
Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Thr Ala
260 265 270
Glu Lys Glu Val Ile Val Val Asp Ser Val Ala Asp Tyr Leu Val Ser
275 280 285
Tyr Met Lys Lys His Gly Ala Phe Leu Ile Thr Asp Lys Glu Gln Ile
290 295 300
Gln Lys Leu Thr Glu Leu Val Val Asp Asn Gly His Ala Asn Lys Glu
305 310 315 320
Leu Val Gly Lys Ser Val Ala His Ile Leu Gln Arg Ile Gly Ile Glu
325 330 335
Val Pro Ser Asp Ala Arg Val Ala Ile Leu Asn Val Glu Arg Asn His
340 345 350
Pro Leu Val Lys Ala Glu Leu Met Met Pro Ile Leu Pro Val Val Arg
355 360 365
Val Glu Asn Val Asp Ala Ala Ile Glu Leu Ala Val Glu Ala Glu Gln
370 375 380
Gly Phe Arg His Thr Ala Ile Met His Ser Thr Asn Ile Asp Asn Leu
385 390 395 400
Thr Lys Phe Ser Lys Glu Ile Gln Thr Thr Ile Phe Val Lys Asn Gly
405 410 415
Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly Tyr Ala Thr Phe
420 425 430
Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe
435 440 445
Ala Arg Arg Arg Lys Cys Val Leu Val Asp Gly Leu Ser Ile Arg
450 455 460
<210> 65
<211> 503
<212> PRT
<213> Clostridium sticklandii
<400> 65
Met Lys Ala Gly Asp Ile Val Gln Asp Phe Ile Thr Glu Arg Asp Val
1 5 10 15
Glu Lys Ile Ile Glu Gln Val Leu Ser Lys Leu Glu Pro Val Ile Glu
20 25 30
Gln Val Lys Pro Lys Glu Ile Asn Met Leu Pro Asn Lys Thr Asn Ile
35 40 45
Asp Phe Ser Gln Asn Ala Asn Gly Ile Phe Glu Ser Ile Asp Leu Ala
50 55 60
Val Glu Ser Ala Leu Glu Ala His Ile Ile Leu Thr Ser Tyr Lys Leu
65 70 75 80
Glu Asp Arg Glu Lys Met Ile Gln Ser Ile Arg Lys Glu Val Leu Gly
85 90 95
Asp Ile Glu Asn Ile Ala Arg Leu Val Tyr Glu Glu Thr Lys Leu Gly
100 105 110
Lys Tyr Glu Asp Lys Ile Ala Lys Ile Asn Leu Ala Ala Ser Lys Thr
115 120 125
Pro Gly Thr Glu Asp Ile Lys Thr Ser Ala Ile Ser Gly Asp Tyr Gly
130 135 140
Leu Thr Ile Glu Glu Met Ala Pro Phe Gly Val Ile Gly Ala Val Thr
145 150 155 160
Pro Val Thr Asn Pro Val Glu Thr Leu Ile Asn Asn Ala Ile Ser Met
165 170 175
Ile Ser Gly Gly Asn Ser Val Val Phe Asn Val His Pro Ser Ser Lys
180 185 190
Lys Ser Ser Ala Tyr Thr Val Glu Leu Ile Asn Lys Ala Val Leu Lys
195 200 205
Ala Gly Gly Pro Gln Asn Leu Val Thr Met Val Lys Glu Pro Thr Ile
210 215 220
Glu Thr Val Asn Gln Leu Ser Ser His Pro Arg Ile Ser Met Met Val
225 230 235 240
Gly Thr Gly Gly Pro Gly Leu Val Lys Ser Leu Leu Lys Ser Gly Lys
245 250 255
Lys Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu
260 265 270
Thr Ala Asp Met Asn Leu Ala Ala Lys Gly Ile Ile Glu Gly Ala Ser
275 280 285
Phe Asp Asn Asn Ile Leu Cys Ile Ala Glu Lys Glu Val Phe Val Val
290 295 300
Asn Glu Val Ala Asp Asp Leu Ile Tyr Asn Met Leu Ser Ser Gly Ala
305 310 315 320
Tyr Met Leu Asn Gln Glu Glu Leu Glu Lys Val Met Lys Leu Thr Leu
325 330 335
Val Glu Asp Glu Asp Leu Gly Ala Lys Ser Cys Thr Leu Ser Pro Lys
340 345 350
Lys Lys Tyr His Val His Lys Asn Trp Val Gly Lys Asp Ala Ser Lys
355 360 365
Ile Leu Ser Glu Ile Gly Ile Thr Lys Gln Asp Val Lys Leu Leu Ile
370 375 380
Cys Glu Val Asp Ser Asp His Pro Tyr Val Thr Leu Glu Gln Met Met
385 390 395 400
Pro Ile Leu Pro Leu Val Arg Cys Ser Asp Val Asp Glu Ala Ile Lys
405 410 415
Leu Ala Val Lys Ala Glu Gly Thr Asn Lys His Thr Ala Ser Ile Phe
420 425 430
Ser Arg Asn Val Asp Asn Met Thr Lys Phe Ala Arg Ala Ile Asn Thr
435 440 445
Thr Ile Phe Val Lys Asn Ala Pro Thr Leu Ala Gly Val Gly Tyr Lys
450 455 460
Gly Glu Gly Asn Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
465 470 475 480
Ile Thr Ser Ala Lys Thr Phe Thr Arg Val Arg Arg Cys Val Leu Ala
485 490 495
Glu Gly Gly Phe Arg Ile Val
500
<210> 66
<211> 482
<212> PRT
<213> Thermincola potens
<400> 66
Met Ala Ile Glu Ala Tyr Gln Ile Glu Lys Ile Val Glu Glu Val Met
1 5 10 15
Arg Lys Met Val Ser Gly Gly Ser Gly Asp Ser Phe Ala Gly Lys Ala
20 25 30
Lys Gly Ile Phe Glu Ser Val Asp Glu Ala Val Lys Ala Ala Lys Ala
35 40 45
Ala Gln Lys Glu Leu Val Ala Met Arg Ile Glu Lys Arg Glu Met Leu
50 55 60
Leu Lys Ala Met Arg Glu Ala Ala Ile Ala His Ala Glu Glu Leu Ala
65 70 75 80
Arg Leu Ala Val Glu Glu Thr Gly Met Gly Arg Val Thr Asp Lys Ile
85 90 95
Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro Gly Thr Glu Asn Leu
100 105 110
Gln Pro Ser Ala Val Thr Gly Asp Arg Gly Leu Thr Leu Ile Glu Arg
115 120 125
Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Cys
130 135 140
Ala Thr Val Ile Asn Asn Ser Ile Ser Met Val Ala Ala Gly Asn Ser
145 150 155 160
Val Val Phe Ser Val His Pro Gly Ala Lys Lys Ala Ser Leu Leu Thr
165 170 175
Val Glu Ile Leu Asn Glu Ala Ile Glu Lys Ala Gly Gly Pro Ala Asn
180 185 190
Val Leu Thr Ala Val Ala Ser Pro Ser Leu Glu Asn Thr Asn Ala Leu
195 200 205
Met Lys His Pro Asp Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly
210 215 220
Leu Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Leu Glu Arg
245 250 255
Ala Ala Lys Ser Ile Val Ala Gly Ala Ser Phe Asp Asn Asn Leu Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Ile Val Val Asp Tyr Val Ala Asn Gln
275 280 285
Leu Ile Ser Tyr Met Lys Gln Asn Gly Ala Tyr Leu Ala Asn Asp Arg
290 295 300
Glu Ile Lys Ala Leu Met Asp Leu Val Leu Thr Lys Asn Glu Asn Leu
305 310 315 320
Lys Ala Glu Gly Cys Thr Val Lys Pro Glu Lys Leu Tyr Gly Gly Ile
325 330 335
Asn Lys Glu Tyr Val Gly Lys Asp Ala Ala Tyr Ile Met Lys Lys Ile
340 345 350
Gly Val Asp Ile Pro Glu Asp Thr Lys Leu Ile Ile Cys Glu Val Asp
355 360 365
Glu Asp His Pro Phe Val Leu Glu Glu Leu Met Met Pro Ile Leu Pro
370 375 380
Ile Val Arg Val Pro Asn Val Gln Lys Ala Ile Glu Val Gly Val Arg
385 390 395 400
Val Glu His Gly Asn Arg His Thr Ala Val Met His Ser Gln Asn Ile
405 410 415
Asp Asn Leu Ser Ala Phe Ala Arg Ala Val Gln Thr Thr Ile Phe Val
420 425 430
Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly Tyr
435 440 445
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ala Ala
450 455 460
Ser Ser Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Gly Phe Ser
465 470 475 480
Ile Val
<210> 67
<211> 462
<212> PRT
<213> Clostridium sp.
<400> 67
Met Ser Val Asn Glu Gln Met Ile Gln Asp Ile Val Ser Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Ser Glu Val Ser Asp Asn His Gly Ile Phe
20 25 30
Ala Asp Met Asn Glu Ala Ile Glu Ala Ala Lys Lys Ala Gln Lys Ile
35 40 45
Val Gly Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile
50 55 60
Arg Lys Lys Thr Val Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Gly Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Met Ile
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys
195 200 205
Ala Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu Met His Tyr
275 280 285
Met Val Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Glu
290 295 300
Ala Leu Thr Ala Val Val Leu Lys Asp Gly Arg Leu Asn Arg Asn Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Ser Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ser Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 68
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 68
Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Lys Ile
1 5 10 15
Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala
20 25 30
Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu
35 40 45
Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Ser His Val
65 70 75 80
Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Ser Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly
180 185 190
Gly Pro Asp Asn Leu Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Lys Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu
325 330 335
Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 69
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 69
Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile
1 5 10 15
Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala
20 25 30
Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu
35 40 45
Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val
65 70 75 80
Ser Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly
180 185 190
Gly Pro Asp Asn Leu Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu
325 330 335
Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 70
<211> 462
<212> PRT
<213> Ruminococcus sp.
<400> 70
Met Pro Ile Ser Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Ala Gly Lys His Gly Val Phe
20 25 30
Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ala Gln Leu Val
35 40 45
Val Lys Thr Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Leu Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Val Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu
165 170 175
Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Asp Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr
275 280 285
Met Ile Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Val Glu Thr Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Ser Met Ile Gly Val Gln Ala
325 330 335
Pro Ala Asn Thr Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg
450 455 460
<210> 71
<211> 465
<212> PRT
<213> Fusobacterium nucleatum
<400> 71
Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met
1 5 10 15
Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala Gly Asn Ser Lys Asn
20 25 30
Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu Glu Ala Lys Lys Ala
35 40 45
Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Lys Ile Ile
50 55 60
Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val Thr Glu Leu Ala Glu
65 70 75 80
Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu
85 90 95
Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys
100 105 110
Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Thr Val
165 170 175
Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly Gly Pro Asp Asn Leu
180 185 190
Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile
195 200 205
Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile Val Asn Tyr Leu
275 280 285
Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu
290 295 300
Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys Asn Asn Ser Pro Asp
305 310 315 320
Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly
325 330 335
Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys
340 345 350
Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile
355 360 365
Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu
370 375 380
Glu Arg Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp
385 390 395 400
Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys
405 410 415
Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys
435 440 445
Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile
450 455 460
Lys
465
<210> 72
<211> 465
<212> PRT
<213> Fusobacterium nucleatum
<400> 72
Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met
1 5 10 15
Lys Lys Met Thr Glu Gly Gly Val Ser Thr Ser Asn Asn Ser Thr Asn
20 25 30
Gly Val Phe Lys Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala
35 40 45
Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile
50 55 60
Ala Ser Ile Arg Asp Thr Leu Lys Ser His Ile Thr Glu Leu Ser Glu
65 70 75 80
Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu
85 90 95
Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys
100 105 110
Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val
165 170 175
Glu Leu Ile Asn Glu Ala Ile Lys Lys Ala Gly Gly Pro Asp Asn Leu
180 185 190
Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile
195 200 205
Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu
275 280 285
Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu
290 295 300
Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp
305 310 315 320
Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly
325 330 335
Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys
340 345 350
Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile
355 360 365
Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu
370 375 380
Glu Lys Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp
385 390 395 400
Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys
405 410 415
Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
435 440 445
Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile
450 455 460
Lys
465
<210> 73
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 73
Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile
1 5 10 15
Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala
20 25 30
Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Gly Ala Ile Glu
35 40 45
Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val
65 70 75 80
Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly
180 185 190
Gly Pro Asp Asn Leu Ile Val Thr Ile Arg Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu
325 330 335
Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 74
<211> 465
<212> PRT
<213> Fusobacterium nucleatum
<400> 74
Met Glu Phe Glu Val Asn Asn Leu Glu Glu Ile Val Glu Leu Ile Met
1 5 10 15
Lys Lys Met Ser Glu Ser Ser Ile Ser Thr Ser Ser Asn Ser Lys Asn
20 25 30
Gly Val Phe Glu Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala
35 40 45
Gln Thr Ile Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile
50 55 60
Ala Ser Ile Arg Asp Thr Leu Lys Pro Tyr Ile Thr Glu Leu Ser Glu
65 70 75 80
Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ser Asp Lys Glu Ile
85 90 95
Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys
100 105 110
Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val
165 170 175
Glu Leu Ile Asn Glu Ala Ile Lys Lys Val Gly Gly Pro Asp Asn Leu
180 185 190
Ile Val Thr Ile Thr Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile
195 200 205
Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu
275 280 285
Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Asp
290 295 300
Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp
305 310 315 320
Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly
325 330 335
Ile Glu Val Gly Asp Glu Ile Arg Val Ile Ile Val Glu Thr Ser Lys
340 345 350
Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile
355 360 365
Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu
370 375 380
Glu Lys Gly Leu Arg His Thr Ala Ile Ile His Ser Lys Asn Ile Asp
385 390 395 400
Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys
405 410 415
Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
435 440 445
Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile
450 455 460
Lys
465
<210> 75
<211> 465
<212> PRT
<213> Fusobacterium nucleatum
<400> 75
Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met
1 5 10 15
Lys Lys Met Ser Glu Ser Gly Val Ser Thr Ser Asn Asn Ser Thr Asn
20 25 30
Gly Val Phe Glu Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala
35 40 45
Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile
50 55 60
Ala Ser Ile Arg Asp Thr Leu Lys Thr His Ile Thr Glu Leu Ser Glu
65 70 75 80
Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu
85 90 95
Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys
100 105 110
Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser
115 120 125
Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val
145 150 155 160
Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val
165 170 175
Glu Leu Ile Asn Glu Ala Ile Lys Lys Ala Gly Gly Pro Asp Asn Leu
180 185 190
Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile
195 200 205
Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val
210 215 220
Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu
275 280 285
Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu
290 295 300
Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp
305 310 315 320
Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly
325 330 335
Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys
340 345 350
Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile
355 360 365
Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu
370 375 380
Glu Lys Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp
385 390 395 400
Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys
405 410 415
Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val
420 425 430
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
435 440 445
Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile
450 455 460
Lys
465
<210> 76
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 76
Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile
1 5 10 15
Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala
20 25 30
Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu
35 40 45
Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val
65 70 75 80
Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly
180 185 190
Gly Pro Asp Asn Leu Ile Val Thr Ile Arg Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu
325 330 335
Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 77
<211> 481
<212> PRT
<213> Clostridium asparagiforme
<400> 77
Met Glu Ile Glu Thr Arg Asp Ile Glu Arg Ile Val Arg Gln Val Met
1 5 10 15
Ala Ala Met Glu Gln Gln Gly Thr Ile Ala Gly Gly Ala Tyr Pro Pro
20 25 30
Ala Pro Gly Ile Thr Ala Pro Arg Gly Asp Asn Gly Val Phe Glu Arg
35 40 45
Val Glu Asp Ala Ile Asp Ala Ala Trp Ala Ala Gly Arg Val Trp Ala
50 55 60
Phe His Tyr Lys Val Glu Asp Arg Arg Arg Val Ile Glu Ala Ile Arg
65 70 75 80
Val Met Ala Arg Glu Asn Ala Arg Thr Leu Ala Gln Met Val Arg Asp
85 90 95
Glu Thr Gly Met Gly Arg Val Glu Asp Lys Val Glu Lys His Leu Ala
100 105 110
Val Ala Asp Lys Thr Pro Gly Val Glu Cys Leu Thr Thr Asp Ala Ile
115 120 125
Ser Gly Asp Gly Gly Leu Met Ile Glu Glu Tyr Ala Pro Phe Gly Val
130 135 140
Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr Glu Thr Val Ile His
145 150 155 160
Asn Thr Ile Ser Met Ile Ala Gly Gly Asn Ser Val Val Phe Asn Val
165 170 175
His Pro Gly Ala Lys Lys Cys Cys Ala Phe Cys Leu Gln Leu Leu Asn
180 185 190
Lys Thr Ile Val Glu Asn Gly Gly Pro Ala Asn Leu Ile Thr Met Gln
195 200 205
Arg Asp Pro Thr Met Asp Ala Val Asn Lys Met Thr Ser Ser Pro Lys
210 215 220
Ile Arg Leu Met Val Gly Thr Gly Gly Met Gly Met Val Asn Ala Leu
225 230 235 240
Leu Arg Ser Gly Lys Lys Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro
245 250 255
Val Ile Val Asp Asp Thr Ala Asp Val Lys Leu Ala Ala Arg Glu Leu
260 265 270
Tyr Trp Gly Ala Ser Phe Asp Asn Asn Leu Phe Cys Phe Ala Glu Lys
275 280 285
Glu Val Phe Val Met Glu Ala Ser Ala Asp Gly Leu Ile Arg Gly Leu
290 295 300
Val Glu Gln Gly Ala Tyr Leu Leu Thr Pro Ala Glu Thr Glu Ala Ile
305 310 315 320
Val Lys Leu Ala Leu Ile Gln Lys Asp Gly Lys Tyr Glu Val Asn Lys
325 330 335
Lys Trp Val Gly Lys Asp Ala Gly Leu Phe Leu Gln Ala Ile Gly Val
340 345 350
Ser Gly His Glu Asn Thr Arg Leu Leu Ile Cys Asp Val Pro Lys Cys
355 360 365
His Pro Tyr Val Met Val Glu Gln Leu Met Pro Val Leu Pro Ile Val
370 375 380
Arg Cys Arg Thr Phe Asp Glu Cys Ile Gln Cys Ser Val Glu Ala Glu
385 390 395 400
Gln Gly Asn Arg His Thr Ser Ser Ile Phe Ser Thr Asn Val Tyr Asn
405 410 415
Met Thr Lys Phe Gly Lys Glu Ile Glu Thr Thr Ile Tyr Val Lys Asn
420 425 430
Gly Ala Thr Leu Arg Gly Leu Gly Ile Gly Gly Glu Gly His Thr Thr
435 440 445
Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Arg Ser
450 455 460
Phe Thr Arg Arg Arg Arg Cys Met Leu Ala Glu Gly Gly Leu Arg Ile
465 470 475 480
Ile
<210> 78
<211> 462
<212> PRT
<213> Clostridium phytofermentans
<400> 78
Met Thr Val Asn Glu Gln Leu Val Gln Asp Ile Ile Lys Asn Val Val
1 5 10 15
Ala Ser Met Gln Leu Thr Gln Thr Asn Lys Thr Glu Leu Gly Val Phe
20 25 30
Asp Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Gln Leu Val
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Ala Ile
50 55 60
Arg Lys Lys Thr Ile Glu His Ala Glu Thr Leu Ala Arg Met Ala Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Ile
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Asn Phe Ala Val Gln Leu Ile
165 170 175
Asn Glu Ala Ser Leu Ser Ala Gly Gly Pro Val Asn Ile Ala Cys Ser
180 185 190
Val Arg Lys Pro Thr Leu Asp Ser Ser Lys Ile Met Met Ser His Gln
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Gln Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Ile Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Ile Asp Ala Ile Ala Asn Glu Leu Met Asn Tyr
275 280 285
Met Val Lys Glu Gln Gly Cys Tyr Ala Ile Thr Lys Glu Gln Gln Glu
290 295 300
Lys Leu Thr Asn Leu Val Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys
305 310 315 320
Val Gly Lys Asp Ala Arg Thr Leu Leu Gly Met Ile Gly Ile Asp Val
325 330 335
Pro Ser Asn Ile Arg Cys Ile Ile Phe Glu Gly Glu Lys Glu His Pro
340 345 350
Leu Ile Ser Glu Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Ser Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 79
<211> 470
<212> PRT
<213> Fusobacterium sp.
<400> 79
Met Arg Gly Glu Leu Met Glu Leu Glu Val Lys Asn Ile Glu Glu Ile
1 5 10 15
Val Asp Leu Ile Met Lys Lys Met Thr Glu Ser Asn Val Ala Val Ser
20 25 30
Tyr Asp Ser Lys Asn Gly Val Phe Asp Asp Val Asp Val Ala Ile Ala
35 40 45
Glu Ala Lys Lys Ala Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu
50 55 60
Arg Glu Arg Ile Ile Ala Ser Ile Arg Glu Thr Met Arg Ala His Ile
65 70 75 80
Thr Glu Leu Ser Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val
85 90 95
Lys Asp Lys Glu Gln Lys Asn Arg Val Ala Ile Asp Arg Thr Pro Gly
100 105 110
Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr
115 120 125
Val Met Glu Phe Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser
130 135 140
Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala
145 150 155 160
Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr
165 170 175
Ser Ile Arg Ala Val Glu Leu Ile Asn Glu Ala Ile Lys Lys Val Gly
180 185 190
Gly Pro Glu Asn Leu Val Val Thr Ile Ser Glu Pro Ser Ile Glu Asn
195 200 205
Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser
275 280 285
Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu
290 295 300
Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Val Ser Leu Val Leu Lys
305 310 315 320
Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Ile
325 330 335
Leu Lys Gln Leu Gly Ile Glu Val Gly Asp Glu Ile Arg Val Ile Ile
340 345 350
Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met
355 360 365
Pro Val Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys
370 375 380
Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Ile Ile His
385 390 395 400
Ser Lys Asn Ile Asp Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr
405 410 415
Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly
420 425 430
Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly
435 440 445
Leu Thr Ser Ala Arg Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val
450 455 460
Gly Gly Phe Ser Ile Lys
465 470
<210> 80
<211> 462
<212> PRT
<213> Lachnospiraceae bacterium
<400> 80
Met Ser Val Asn Glu Lys Met Val Gln Asp Ile Val Gln Glu Val Val
1 5 10 15
Ala Lys Met Gln Ile Ser Ser Asp Val Ser Gly Lys Lys Gly Val Phe
20 25 30
Ser Asp Met Asn Glu Ala Ile Glu Ala Ser Lys Lys Ala Gln Lys Ile
35 40 45
Val Ala Lys Met Ser Met Asp Gln Arg Glu Ala Ile Ile Ser Lys Ile
50 55 60
Arg Glu Lys Ile Lys Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Leu
165 170 175
Asn Glu Ala Ser Val Glu Val Gly Gly Pro Glu Asn Ile Ala Val Thr
180 185 190
Val Glu His Pro Thr Met Glu Thr Ser Asp Val Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr
275 280 285
Met Val Asn Glu Gln Gly Cys Tyr Met Ile Ser Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Ile Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg
450 455 460
<210> 81
<211> 462
<212> PRT
<213> Ruminococcus gnavus
<400> 81
Met Ser Val Asn Glu Lys Met Val Gln Asp Ile Val Gln Glu Val Val
1 5 10 15
Ala Lys Met Gln Ile Ser Ser Asp Val Ser Gly Lys Lys Gly Val Phe
20 25 30
Ser Asp Met Asn Glu Ala Ile Glu Ala Ser Lys Lys Ala Gln Lys Ile
35 40 45
Val Ala Lys Met Ser Met Asp Gln Arg Glu Ala Ile Ile Ser Lys Ile
50 55 60
Arg Glu Lys Ile Lys Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Leu
165 170 175
Asn Glu Ala Ser Val Glu Val Gly Gly Pro Glu Asn Ile Ala Val Thr
180 185 190
Val Glu His Pro Thr Met Glu Thr Ser Asp Ile Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr
275 280 285
Met Val Ser Glu Gln Gly Cys Tyr Met Ile Ser Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Ile Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg
450 455 460
<210> 82
<211> 462
<212> PRT
<213> Ruminococcus obeum
<400> 82
Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Val Phe
20 25 30
Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ala Glu Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr
275 280 285
Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Thr Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 83
<211> 473
<212> PRT
<213> Clostridium saccharolyticum
<400> 83
Met Glu Ile Gly Ala Lys Glu Ile Glu Leu Ile Val Arg Glu Val Leu
1 5 10 15
Ala Gly Ile Glu Ser Arg Gly Pro Lys Leu Ser Tyr Ile Pro Ala Gln
20 25 30
Ser Asp Asn Gly Val Phe Glu Arg Val Glu Asp Ala Ile Gly Ala Ala
35 40 45
His Thr Ala Gln Arg Glu Trp Val Glu His Tyr Arg Val Glu Asp Arg
50 55 60
Arg Arg Ile Ile Glu Ala Ile Arg Met Thr Ala Lys Ser His Ala Lys
65 70 75 80
Thr Leu Ala Lys Leu Val Trp Glu Glu Thr Gly Met Gly Arg Phe Glu
85 90 95
Asp Lys Ile Gln Lys His Met Ala Val Ile Glu Lys Thr Pro Gly Val
100 105 110
Glu Cys Leu Thr Thr Asp Ala Ile Ser Gly Asp Glu Gly Leu Met Ile
115 120 125
Glu Glu Tyr Ala Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Thr Glu Thr Ile Ile Asn Asn Thr Ile Ser Met Ile Ala Gly
145 150 155 160
Gly Asn Ala Val Val Phe Asn Val His Pro Gly Ala Lys Lys Cys Cys
165 170 175
Ala His Cys Leu Lys Leu Leu His Gln Ala Ile Val Glu Asn Gly Gly
180 185 190
Pro Ala Asn Leu Ile Thr Met Gln Lys Glu Pro Thr Met Glu Ala Val
195 200 205
Thr Lys Met Thr Ser Asp Pro Arg Ile Arg Leu Met Val Gly Thr Gly
210 215 220
Gly Met Pro Met Val Asn Ala Leu Leu Arg Ser Gly Lys Lys Thr Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp
245 250 255
Val Ser Leu Ala Ala Arg Glu Ile Tyr Arg Gly Ala Ser Phe Asp Asn
260 265 270
Asn Ile Leu Cys Leu Ala Glu Lys Glu Val Phe Val Met Glu Lys Ala
275 280 285
Ala Asp Glu Leu Val Asn Asn Leu Val Lys Glu Gly Ala Tyr Leu Leu
290 295 300
Asn Pro Met Glu Leu Asn Glu Ile Leu Lys Phe Ala Met Ile Glu Lys
305 310 315 320
Asn Gly Ser Cys Glu Val Asn Lys Lys Trp Val Gly Lys Asp Ala Gly
325 330 335
Leu Phe Leu Glu Ala Ile Gly Val Ser Gly His Lys Asp Val Arg Leu
340 345 350
Leu Ile Cys Glu Thr Asp Arg Asn His Pro Phe Val Met Val Glu Gln
355 360 365
Leu Met Pro Ile Leu Pro Ile Val Arg Leu Arg Thr Phe Glu Glu Cys
370 375 380
Val Glu Ser Ala Val Ala Ala Glu Ser Gly Asn Arg His Thr Ala Ser
385 390 395 400
Met Phe Ser Arg Asn Val Glu Asn Met Thr Arg Phe Gly Lys Val Ile
405 410 415
Glu Thr Thr Ile Phe Thr Lys Asn Gly Ser Thr Leu Lys Gly Val Gly
420 425 430
Ile Gly Gly Glu Gly His Thr Thr Met Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Cys Ala Arg Ser Phe Thr Arg Arg Arg Arg Cys Met
450 455 460
Leu Ala Glu Gly Gly Leu Arg Ile Ile
465 470
<210> 84
<211> 471
<212> PRT
<213> Flavonifractor plautii
<400> 84
Met Asn Ile Asp Glu Asn Val Val Glu Ser Ile Val Lys Arg Val Val
1 5 10 15
Ser Gln Leu Ser Thr Glu Thr Ala Ser Ala Gln Thr Cys Pro Ser Gly
20 25 30
Gly Asp Trp Gly Val Phe Glu Ser Met Asn Asp Ala Val Asp Ala Ala
35 40 45
Val Glu Ala Gln Arg Glu Tyr Leu Asn Arg Ser Met His Asp Arg Ala
50 55 60
Cys Tyr Val Gln Ala Ile Arg Asp Val Val Leu Asp Gln Glu Asn Leu
65 70 75 80
Glu Tyr Ile Ser Arg Leu Ala Val Glu Glu Thr Gly Met Gly Gly Tyr
85 90 95
Glu Tyr Lys Leu Ile Lys Asn Arg Leu Ala Ala Val Lys Thr Pro Gly
100 105 110
Ile Glu Asp Leu Thr Thr Asp Ala Met Ser Gly Asp Asp Gly Leu Thr
115 120 125
Leu Val Glu Tyr Ser Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Leu Ala
145 150 155 160
Ala Gly Asn Ala Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Leu His Leu Ile Gln Leu Ile Asn Lys Ala Leu Cys Lys Ala Gly
180 185 190
Ala Pro Ala Asn Leu Val Val Thr Val Ser Ala Pro Ser Ile Glu Asn
195 200 205
Thr Asn Ala Met Met Ser His Pro Lys Ile Arg Met Leu Val Ala Thr
210 215 220
Gly Gly Pro Ala Ile Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Ile Ala Val Asp Ser
275 280 285
Val Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu
290 295 300
Val Lys Asp Pro Ala Val Ile Ser Gln Leu Val Glu Leu Val Thr Lys
305 310 315 320
Glu Gly Lys Ser Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr
325 330 335
Ile Leu Asp Lys Ile Gly Ile Thr Val Gly Asp Asp Val Lys Val Ile
340 345 350
Leu Met Glu Ala Lys Glu Asp His Pro Phe Val Gln Val Glu Leu Met
355 360 365
Met Pro Ile Leu Pro Leu Val Arg Val Pro Asp Val Asp Gln Ala Ile
370 375 380
Glu Met Ala Val Arg Val Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Arg Asn Val Glu Lys Leu Thr Lys Met Ala Lys Leu Ile Gln
405 410 415
Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val
420 425 430
Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Ala Lys Ser Phe Ala Arg Arg Arg Arg Cys Val Leu
450 455 460
Val Gly Gly Met Asp Val Arg
465 470
<210> 85
<211> 462
<212> PRT
<213> Ruminococcus obeum
<400> 85
Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe
20 25 30
Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Glu Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr
275 280 285
Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Ile Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 86
<211> 469
<212> PRT
<213> Clostridium carboxidivorans
<400> 86
Met Glu Leu Gln Ser Asn Glu Leu Ser Leu Ile Ile Glu Lys Val Leu
1 5 10 15
Lys Glu Met Asn Lys Lys Glu Leu Lys Glu Glu Val Ser Asp Gly Val
20 25 30
Phe Asp Thr Met Glu Glu Ala Ile Glu Ala Ala Tyr Glu Ala Gln Lys
35 40 45
Lys Phe Ser Ser Tyr Thr Ile Glu Gln Arg Glu Lys Leu Ile Ala Ala
50 55 60
Met Arg Lys Ala Ile Ile Asp Asn Ala Met Glu Ile Ala Asn Leu Cys
65 70 75 80
Val Asn Glu Ser Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu
85 90 95
Lys Leu Thr Ala Glu Lys Thr Pro Gly Thr Glu Val Leu Gln Thr Thr
100 105 110
Ala Phe Thr Gly Asp Lys Gly Leu Thr Leu Val Glu Asn Gly Ala Phe
115 120 125
Gly Val Ile Gly Ser Ile Thr Pro Ser Thr Asn Pro Ala Ala Thr Val
130 135 140
Ala Cys Asn Gly Ile Gly Met Leu Ala Gly Gly Asn Thr Ala Val Phe
145 150 155 160
Ser Pro His Pro Gly Ala Phe Arg Ser Ser Leu Ala Met Leu Arg Ala
165 170 175
Leu Asn Lys Ala Ile Lys Glu Ala Gly Gly Pro Asp Asn Leu Leu Thr
180 185 190
Ser Val Lys Lys Pro Ser Ile Glu Ser Thr Asn Ser Met Met Lys Asn
195 200 205
Asp Lys Ile Arg Met Val Val Ala Thr Gly Gly Pro Gly Ile Val Lys
210 215 220
Met Val Leu Ser Ser Gly Arg Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala Arg
245 250 255
Asp Ile Ile Ala Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala
260 265 270
Glu Lys Glu Ala Leu Val Val Glu Ala Val Tyr Glu Glu Leu Ile Lys
275 280 285
Glu Met Lys Asn Asn Arg Ala Val Tyr Glu Leu Asn Asp Glu Glu Ala
290 295 300
Ala Lys Val Ala Glu Leu Val Leu Val His Asn Lys Glu Lys Asn Thr
305 310 315 320
Tyr Ser Ile Asn Lys Ala Phe Val Gly Lys Asp Ala Lys Tyr Ile Leu
325 330 335
Gln Asn Ile Gly Lys Asn Asp Ala Glu Gly Val Glu Cys Leu Ile Tyr
340 345 350
Arg Ala Glu Asn Ser His Pro Phe Val Gln Glu Glu Leu Met Met Pro
355 360 365
Ile Leu Pro Ile Val Lys Thr Lys Asp Phe Glu Glu Ala Leu Lys Leu
370 375 380
Ala Val Gln Asp Glu His Gly Asn Arg His Thr Ala Ile Met His Ser
385 390 395 400
Lys Asn Val Asp Asn Leu Thr Lys Met Ala Arg Ala Ile Asp Thr Thr
405 410 415
Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly
420 425 430
Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Asn Ala Val Ser Phe Thr Arg Lys Arg Arg Cys Thr Met Ala Glu
450 455 460
Ser Phe Arg Ile Val
465
<210> 87
<211> 469
<212> PRT
<213> Fusobacterium ulcerans
<400> 87
Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met
1 5 10 15
Lys Glu Leu Lys Lys Thr Asp Ile Lys Ala Gly Cys Gln Ser Cys Glu
20 25 30
Ser Pro Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Ala Ala
35 40 45
Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg
50 55 60
Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Val
65 70 75 80
Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Ala Ala
85 90 95
Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val
100 105 110
Glu Asp Leu Arg Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val
115 120 125
Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala
145 150 155 160
Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser
165 170 175
Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Lys Ala Gly Gly
180 185 190
Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr
195 200 205
Asn Arg Met Met Glu Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile
275 280 285
Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile
290 295 300
Lys Asp Lys Ser Val Ile Asp Arg Leu Val Ala Met Val Leu Lys Asn
305 310 315 320
Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu
325 330 335
Lys Asp Leu Gly Ile Asn Val Gly Gly Glu Ile Arg Val Ile Ile Thr
340 345 350
Glu Ala Asp Lys Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro
355 360 365
Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val
370 375 380
Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser
385 390 395 400
Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr
405 410 415
Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly
420 425 430
Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Leu Ser Ile Lys
465
<210> 88
<211> 469
<212> PRT
<213> Fusobacterium sp.
<400> 88
Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met
1 5 10 15
Lys Glu Leu Lys Lys Thr Asp Ile Lys Ala Gly Cys Gln Ser Cys Glu
20 25 30
Ser Leu Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Ala Ala
35 40 45
Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg
50 55 60
Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Val
65 70 75 80
Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Ala Ala
85 90 95
Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val
100 105 110
Glu Asp Leu Arg Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val
115 120 125
Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala
145 150 155 160
Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser
165 170 175
Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Arg Ala Gly Gly
180 185 190
Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr
195 200 205
Asn Arg Met Met Glu Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile
275 280 285
Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile
290 295 300
Lys Asp Lys Ser Val Ile Asp Arg Leu Val Ala Met Val Leu Lys Asn
305 310 315 320
Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu
325 330 335
Lys Asp Leu Gly Ile Asn Val Gly Asp Glu Ile Arg Val Ile Ile Thr
340 345 350
Glu Thr Asp Lys Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro
355 360 365
Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val
370 375 380
Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser
385 390 395 400
Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr
405 410 415
Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly
420 425 430
Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Leu Ser Ile Lys
465
<210> 89
<211> 469
<212> PRT
<213> Clostridium carboxidivorans
<400> 89
Met Glu Leu Glu Ser Asn Glu Leu Ser Val Ile Ile Glu Lys Val Leu
1 5 10 15
Lys Glu Met Asn Lys Lys Glu Phe Gly Lys Lys Glu Ser Asp Gly Ile
20 25 30
Phe Asp Thr Met Asp Glu Ala Val Glu Ala Ser Tyr Glu Ala Gln Lys
35 40 45
Lys Tyr Ser Ser Tyr Ser Leu Glu Gln Arg Glu Lys Leu Ile Gln Ala
50 55 60
Met Arg Lys Ala Ile Met Asp Asn Ala Met Glu Val Ala Asn Leu Cys
65 70 75 80
Val Lys Glu Ser Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu
85 90 95
Lys Leu Ile Val Glu Lys Thr Gln Gly Thr Glu Ile Leu Arg Pro Glu
100 105 110
Val Tyr Thr Gly Asp Asn Gly Leu Thr Leu Ile Glu His Gly Ala Phe
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ala Ala Thr Val
130 135 140
Ala Cys Asn Ser Ile Cys Met Leu Ala Gly Gly Asn Thr Val Val Phe
145 150 155 160
Ser Pro His Pro Gly Ala Leu Asn Ser Cys Leu Thr Met Ile Arg Ile
165 170 175
Leu Asn Lys Ala Ile Lys Glu Ala Gly Gly Pro Glu Asn Leu Ile Thr
180 185 190
Ser Val Lys Ala Pro Ser Ile Glu Asn Thr Asn Ile Met Ile Asn His
195 200 205
Lys Arg Ile Arg Leu Val Val Ala Thr Gly Gly Pro Gly Ile Val Lys
210 215 220
Leu Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Pro Lys Ala Ala Arg
245 250 255
Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile Ala
260 265 270
Glu Lys Glu Ala Ile Val Val Glu Ser Val Tyr Glu Glu Leu Ile Lys
275 280 285
Glu Phe Lys Lys Asn Arg Val Val Tyr Glu Leu Thr Asp Glu Glu Ala
290 295 300
Glu Lys Leu Val Gly Lys Val Leu Asn Tyr Asp Glu Lys Asn Lys Lys
305 310 315 320
Tyr Ser Ile Asn Lys Lys Phe Val Gly Lys Asp Ala Lys Tyr Leu Leu
325 330 335
Glu Ser Ile Gly Lys Asp Ala Gly Thr Gly Val Glu Cys Leu Ile Tyr
340 345 350
Arg Ala Glu Asn Ser His Pro Phe Val Gln Glu Glu Leu Met Met Pro
355 360 365
Ile Leu Pro Ile Val Lys Val Lys Asn Val Asp Glu Ala Ile Glu Thr
370 375 380
Ala Val Glu Asp Glu His Gly Asn Arg His Thr Ala Met Met His Ser
385 390 395 400
Lys Asn Val Val Asn Leu Thr Lys Met Ala Arg Ala Ile Asp Thr Thr
405 410 415
Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly
420 425 430
Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile
435 440 445
Thr Asn Ala Val Thr Phe Thr Arg Gln Arg Arg Cys Thr Met Val Asp
450 455 460
Ser Phe Arg Ile Val
465
<210> 90
<211> 471
<212> PRT
<213> Clostridium sp.
<400> 90
Met Glu Met Asp Met Lys Val Ile Glu Gln Leu Val Ala Gln Ala Leu
1 5 10 15
Lys Glu Met Lys Ala Glu Glu Pro Ala Ala Phe Ala Glu Lys Lys Glu
20 25 30
Glu Asn Tyr Gly Val Phe Ser Thr Met Asp Glu Ala Ile Glu Ala Ser
35 40 45
Glu Lys Ala Gln Lys Ala Leu Leu Phe Ser Lys Ile Gln Asp Arg Gln
50 55 60
Lys Tyr Val Asp Ile Ile Arg Ala Ala Ile Leu Lys Arg Glu Asn Leu
65 70 75 80
Glu Leu Ile Ser Arg Met Ala Val Glu Glu Thr Glu Ile Gly Lys Tyr
85 90 95
Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly
100 105 110
Thr Glu Asp Leu Thr Thr Glu Ala Gln Thr Gly Asp His Gly Leu Thr
115 120 125
Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile Ala
145 150 155 160
Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Gln Leu Leu Val Lys Met Leu Asn Lys Ala Leu Met Glu Gly Gly
180 185 190
Ala Pro Ala Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn
195 200 205
Thr Asn Lys Met Ile Glu His Pro Gly Val Arg Leu Leu Val Ala Thr
210 215 220
Gly Gly Pro Ala Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Glu Lys Ala Ala Arg Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser
275 280 285
Ile Cys Asp Tyr Leu Ile Gln Asn Met Lys Leu Asn Gly Ala Tyr Glu
290 295 300
Ile Arg Asp Ala Glu Thr Ile Glu Arg Leu Asp Ala Leu Val Thr Asn
305 310 315 320
Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Lys Tyr
325 330 335
Ile Leu Asp Lys Met Gly Ile Pro Ala Asp Asp Ser Val Lys Val Ile
340 345 350
Ile Met Glu Val Arg Arg Asp His His Leu Val Thr Glu Glu Met Met
355 360 365
Met Pro Ile Leu Pro Ile Val Arg Val Ser Asp Val Asp Thr Ala Ile
370 375 380
Glu Tyr Ala His Asp Ala Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Lys Asn Val Glu Lys Leu Ser Lys Met Ala Lys Leu Leu Glu
405 410 415
Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Ala
420 425 430
Gly Gly Glu Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val Met
450 455 460
Ser Asp Ala Phe Ser Ile Arg
465 470
<210> 91
<211> 469
<212> PRT
<213> Fusobacterium varium
<400> 91
Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met
1 5 10 15
Lys Glu Leu Lys Lys Thr Asp Ile Lys Thr Val Cys Gln Ser Cys Glu
20 25 30
Asn Pro Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Thr Ala
35 40 45
Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg
50 55 60
Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Leu
65 70 75 80
Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Val Ala
85 90 95
Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val
100 105 110
Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val
115 120 125
Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr
130 135 140
Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala
145 150 155 160
Gly Asn Ser Ile Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser
165 170 175
Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Lys Val Gly Gly
180 185 190
Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr
195 200 205
Asn Lys Met Met Ala Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Lys Asp Ile Val Ala Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile
275 280 285
Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile
290 295 300
Lys Asp Lys Ala Val Ile Glu Arg Leu Ala Gly Met Val Leu Lys Asn
305 310 315 320
Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu
325 330 335
Lys Asp Leu Gly Ile Asn Val Gly Asp Glu Ile Arg Val Ile Ile Ala
340 345 350
Glu Thr Asp Lys Glu His Pro Phe Ala Val Glu Glu Leu Leu Met Pro
355 360 365
Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val
370 375 380
Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser
385 390 395 400
Lys Asn Ile Asp Val Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr
405 410 415
Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly
420 425 430
Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Leu Ser Ile Lys
465
<210> 92
<211> 482
<212> PRT
<213> Clostridium celatum
<400> 92
Met Asp Asp Asn Thr Lys Leu Ile Gln Asp Ile Val Ala Lys Val Ile
1 5 10 15
Ser Glu Ile Gly Thr Lys Glu Ile Glu Glu Glu Ala Cys Cys Gly Asn
20 25 30
Gly Ser Cys Gly Gly Ser Cys Gly Cys Asn Lys Glu Lys Tyr Val Phe
35 40 45
Glu Asp Val Asp Ser Ala Val Ala Ala Ala Lys Lys Ala Tyr Lys Glu
50 55 60
Leu Lys Gln Leu Thr Ile Lys Asp Arg Glu Asn Ile Ile Thr Lys Ile
65 70 75 80
Arg Glu Lys Cys Leu Thr Tyr Ser Glu Arg Leu Ser Ile Met Ala Val
85 90 95
Asp Glu Thr Gly Met Gly Lys Val Glu Asp Lys Ile Thr Lys His Val
100 105 110
Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr Thr Ala
115 120 125
Trp Ser Gly Asp Gly Gly Leu Thr Leu Val Glu Arg Gly Ala Phe Gly
130 135 140
Val Ile Ala Ala Ile Thr Pro Ser Thr Asn Pro Thr Ala Thr Ile Phe
145 150 155 160
Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val Phe Ala
165 170 175
Pro His Pro Ala Ala Lys Ser Cys Ser Lys Phe Ala Val Lys Leu Ile
180 185 190
Asn Glu Ala Ser Ile Glu Val Gly Gly Pro Glu Asn Ile Val Val Thr
195 200 205
Phe Glu Asn Pro Ser Ile Glu Ile Thr Ser Ala Leu Met Lys His Lys
210 215 220
Asp Ile Pro Phe Ile Ser Ala Thr Gly Gly Pro Gly Val Val Thr Gln
225 230 235 240
Ala Cys Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro
245 250 255
Pro Val Leu Val Asp Glu Thr Ala Asp Ile Lys His Ala Ala Lys Ser
260 265 270
Ile Ile Ala Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
275 280 285
Lys Glu Val Val Ala Leu Asp Ser Ile Cys Asp Glu Leu Ile Glu Asp
290 295 300
Met Gln Lys Glu Gly Ala Tyr Phe Leu Asn Ser Thr Glu Leu Ile Asn
305 310 315 320
Arg Leu Ile Asp Thr Val Leu Ile Arg Lys Asp Gly Lys Val Thr Leu
325 330 335
Asn Arg Asn Phe Val Gly Arg Asp Ala Lys Ile Ile Leu Asp Ala Ile
340 345 350
Gly Val Tyr Ala Asp Asp Ser Val Lys Cys Ile Ile Phe Glu Gly Cys
355 360 365
Lys Ser Asn Leu Leu Ile Val Glu Glu Leu Met Met Pro Ile Leu Gly
370 375 380
Ile Val Arg Val Lys Asp Phe Asn Thr Ala Val Asp Val Ala Val Glu
385 390 395 400
Leu Glu His Gly Asn Arg His Ser Ala His Ile His Ser Lys Arg Ile
405 410 415
Asp Arg Leu Thr Tyr Phe Ala Arg Glu Ile Asp Thr Ala Ile Phe Val
420 425 430
Lys Asn Ala Pro Ser Tyr Ser Ala Leu Gly Val Glu Ala Glu Gly Tyr
435 440 445
Pro Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Ser Ser Ala
450 455 460
Lys Thr Phe Ser Lys Ser Arg Arg Cys Ile Met Lys Asp Ala Leu Ser
465 470 475 480
Ile Lys
<210> 93
<211> 462
<212> PRT
<213> Clostridium sp.
<400> 93
Met Ser Val Asn Glu Arg Met Val Gln Asp Ile Val Gln Glu Val Val
1 5 10 15
Ala Lys Met Gln Ile Ala Ser Asp Val Thr Gly Asn His Gly Val Phe
20 25 30
Gln Asp Met Asn Ala Ala Ile Glu Ala Ala Lys Lys Thr Gln Lys Val
35 40 45
Val Ala Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile
50 55 60
Arg Ala Lys Ile Lys Glu His Ala Glu Ile Phe Ala Arg Met Gly Val
65 70 75 80
Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Gln Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Ile
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu Asn Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr
275 280 285
Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg
450 455 460
<210> 94
<211> 462
<212> PRT
<213> Lachnospiraceae bacterium
<400> 94
Met Ser Val Asn Glu Gln Met Val Gln Asp Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Thr Ser Asp Val Ser Gly Ser His Gly Val Phe
20 25 30
Lys Asp Met Asn Glu Ala Ile Ala Ala Ala Lys Lys Thr Gln Lys Ile
35 40 45
Val Gly Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile
50 55 60
Arg Thr Lys Ile Lys Glu Asn Ala Glu Ile Met Ala Arg Met Gly Val
65 70 75 80
Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Val
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu
130 135 140
Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Leu
165 170 175
Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu Lys Pro Thr Leu Ala Ser Ser Asp Ile Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met Tyr Tyr
275 280 285
Met Val Ser Glu Gln Gly Cys Tyr Lys Ile Thr Lys Glu Glu Gln Asp
290 295 300
Ala Leu Thr Ala Val Val Leu Lys Asp Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg
450 455 460
<210> 95
<211> 463
<212> PRT
<213> Lachnospiraceae bacterium
<400> 95
Met Pro Val Ser Glu Ser Met Val Gln Asp Ile Val Lys Glu Val Val
1 5 10 15
Ala Arg Met Gln Leu Ser Gly Ser Ala Gly Thr Ala Gln His Gly Val
20 25 30
Phe Thr Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Glu Ala
35 40 45
Lys Val Arg Cys Met Thr Met Asp Gln Arg Glu Gln Ile Val Ser Asn
50 55 60
Ile Arg Arg Lys Thr His Glu Asn Ala Glu Leu Leu Ala Arg Met Gly
65 70 75 80
Val Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His
85 90 95
His Leu Leu Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr
100 105 110
Ala Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe
115 120 125
Gly Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val
130 135 140
Leu Cys Asn Ser Met Gly Met Ile Ala Ala Gly Asn Thr Val Val Phe
145 150 155 160
Asn Pro His Pro Gln Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Met
165 170 175
Val Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Val Ala Cys
180 185 190
Thr Val Ser Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His
195 200 205
Lys Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr
210 215 220
Ala Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn
225 230 235 240
Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Val Arg Lys Ala Ala Ala
245 250 255
Asp Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala
260 265 270
Glu Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu Met Asn
275 280 285
Tyr Met Ile Ser Glu Gln Gly Cys Tyr Leu Ile Ser Lys Glu Glu Gln
290 295 300
Asp Lys Leu Thr Ala Thr Val Ile Thr Pro Lys Gly Leu Asn Arg Lys
305 310 315 320
Cys Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Ile Gln
325 330 335
Ala Pro Glu Asn Ile Arg Cys Ile Val Phe Glu Gly Glu Lys Glu His
340 345 350
Pro Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Leu Val Arg
355 360 365
Ala Lys Asp Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His
370 375 380
Gly Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile
385 390 395 400
Thr Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala
405 410 415
Pro Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe
420 425 430
Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe
435 440 445
Thr Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg
450 455 460
<210> 96
<211> 462
<212> PRT
<213> Ruminococcus sp.
<400> 96
Met Pro Ile Asn Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met
1 5 10 15
Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe
20 25 30
Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Gln Leu Ile
35 40 45
Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile
50 55 60
Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val
65 70 75 80
Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His
85 90 95
Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Val Ile Thr Thr Thr Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu
165 170 175
Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr
180 185 190
Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Val Met Met Lys His Lys
195 200 205
Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Thr Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Ser Ser Ile Val Asp Glu Leu Met His Tyr
275 280 285
Leu Val Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp
290 295 300
Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys
305 310 315 320
Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala
325 330 335
Pro Ala Asn Ile Arg Cys Ile Val Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr
385 390 395 400
Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Cys Ala Ser Thr Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Ala Asp Ser Leu Cys Ile Arg
450 455 460
<210> 97
<211> 469
<212> PRT
<213> Acetobacterium woodii
<400> 97
Met Asn Ile Asp Thr Thr Gly Ile Glu Tyr Ile Val Lys Lys Val Met
1 5 10 15
Ala Glu Ile Asp Cys Ala Glu Glu Gly Gly Lys Pro Leu Lys Asp Gly
20 25 30
Glu Leu Gly Ile Phe Asn Asp Met Glu Asn Ala Ile Asp Ala Ala Phe
35 40 45
Ile Ala Gln Lys Ser Phe Met Arg Ala Ser Met Ala Phe Arg Ser Lys
50 55 60
Ile Ile Ala Ala Met Arg Ala Glu Met Leu Lys Lys Glu Asn Met Glu
65 70 75 80
Met Ile Cys Gln Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Glu
85 90 95
His Lys Leu Leu Lys His Glu Leu Ala Ala Thr Lys Thr Pro Gly Val
100 105 110
Glu Asp Leu Val Ala Asp Ala Phe Thr Gly Asp Asp Gly Leu Thr Leu
115 120 125
Ile Glu Gln Ser Pro Phe Gly Val Ile Gly Ala Val Ser Pro Ser Thr
130 135 140
Asn Pro Ser Glu Thr Ile Ile Cys Asn Gly Ile Gly Met Leu Ala Gly
145 150 155 160
Gly Asn Thr Val Val Phe Ala Pro His Pro Ser Ala Lys Lys Thr Ser
165 170 175
Ala Leu Val Val Lys Leu Leu Asn Lys Ala Ile Leu Glu Ala Gly Gly
180 185 190
Pro Glu Asn Leu Ile Val Thr Thr Val Lys Pro Thr Ile Asp Ser Ala
195 200 205
Asn Thr Met Phe Ala Ser Pro Lys Ile Thr Met Leu Cys Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ser Val Leu Gln Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Gly Lys Asp Ile Ile Asp Gly Cys Cys Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Val Val Glu Gln Val
275 280 285
Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu Leu
290 295 300
Lys Asp Ala Gln Lys Ile Lys Glu Leu Glu Glu Leu Val Ile Pro Gly
305 310 315 320
Gly Arg Leu Ser Arg Asp Tyr Val Gly Arg Ser Ala Lys Val Ile Leu
325 330 335
Lys Gly Ile Gly Ile Glu Val Asp Asp Ser Val Arg Val Val Ile Ile
340 345 350
Glu Thr Ser Lys Asp His Ile Phe Ala Val Glu Glu Leu Met Met Pro
355 360 365
Ile Leu Ala Ile Val Arg Val Lys Asp Val Ala Glu Gly Ile Asp Leu
370 375 380
Ala Val Ser Leu Glu His Gly Asn Arg His Thr Ala Ile Met His Ser
385 390 395 400
Thr Asn Ile Asn Asn Leu Thr Glu Met Ala Lys Arg Val Gln Thr Thr
405 410 415
Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly
420 425 430
Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Thr Phe Thr Arg Lys Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Phe Thr Ile Lys
465
<210> 98
<211> 497
<212> PRT
<213> Clostridium botulinum
<400> 98
Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile
1 5 10 15
Val Lys Glu Leu Thr Gly Asn Glu Lys Gly Gln Gly Ala Ile Thr Thr
20 25 30
Ala Thr Ala Pro Lys Glu Ala Asn Pro Leu Val Asp Ile Glu Lys Lys
35 40 45
Ile Met Gly Phe Met Asn Thr Pro Thr Met Pro Val Gly Glu Tyr Gly
50 55 60
Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Leu Ala Glu
65 70 75 80
Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu
85 90 95
Ala Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg
100 105 110
Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys
115 120 125
Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala
130 135 140
Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro
145 150 155 160
Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr
165 170 175
Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val
180 185 190
Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Val Gln
195 200 205
Leu Ile Asn Lys Ala Ile Glu Arg Ile Asn Gly Pro Lys Asn Leu Ile
210 215 220
Val Thr Val Lys Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ala
225 230 235 240
His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val
245 250 255
Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
260 265 270
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
275 280 285
Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
290 295 300
Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Ala Asp Tyr Leu Lys
305 310 315 320
Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met
325 330 335
Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn
340 345 350
Lys Gln Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly
355 360 365
Val Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Glu Ala
370 375 380
Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Val
385 390 395 400
Ile Arg Val Arg Asn Val Asp Glu Ala Ile Asp Leu Gly Val Glu Leu
405 410 415
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp
420 425 430
Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys
435 440 445
Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly
450 455 460
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
465 470 475 480
Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile
485 490 495
Lys
<210> 99
<211> 497
<212> PRT
<213> Clostridium botulinum
<400> 99
Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile
1 5 10 15
Val Lys Glu Leu Thr Gly Asn Glu Lys Glu Gln Gly Ala Ile Ile Thr
20 25 30
Ala Thr Ala Pro Lys Glu Val Asn Pro Leu Val Asp Ile Glu Lys Lys
35 40 45
Ile Met Gly Phe Met Asn Thr Pro Thr Met Gln Ala Gly Glu Tyr Gly
50 55 60
Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Leu Ala Glu
65 70 75 80
Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu
85 90 95
Val Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg
100 105 110
Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys
115 120 125
Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala
130 135 140
Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro
145 150 155 160
Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr
165 170 175
Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val
180 185 190
Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Ile Gln
195 200 205
Leu Ile Asn Lys Ala Ile Glu Arg Val Asn Gly Pro Lys Asn Leu Ile
210 215 220
Val Thr Val Arg Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ser
225 230 235 240
His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val
245 250 255
Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Val Gly Ala Gly Ala Gly
260 265 270
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
275 280 285
Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
290 295 300
Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Thr Asp Tyr Leu Lys
305 310 315 320
Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met
325 330 335
Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn
340 345 350
Lys Lys Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly
355 360 365
Ile Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Gly Ala
370 375 380
Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Ile
385 390 395 400
Ile Arg Val Arg Asn Val Asp Glu Ala Ile Glu Leu Gly Val Glu Leu
405 410 415
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp
420 425 430
Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys
435 440 445
Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly
450 455 460
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
465 470 475 480
Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile
485 490 495
Lys
<210> 100
<211> 497
<212> PRT
<213> Clostridium botulinum
<400> 100
Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile
1 5 10 15
Val Lys Glu Leu Thr Gly Asn Glu Lys Glu Gln Gly Thr Ile Thr Thr
20 25 30
Ala Ala Val Pro Lys Glu Val Asn Pro Leu Val Asp Ile Glu Lys Lys
35 40 45
Ile Met Gly Phe Val Asn Thr Pro Thr Met Pro Ile Gly Glu His Gly
50 55 60
Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Ile Ala Glu
65 70 75 80
Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu
85 90 95
Ala Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg
100 105 110
Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys
115 120 125
Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala
130 135 140
Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro
145 150 155 160
Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr
165 170 175
Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val
180 185 190
Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Ile Gln
195 200 205
Leu Ile Asn Lys Ala Ile Glu Arg Val Asn Gly Pro Lys Asn Leu Ile
210 215 220
Val Thr Val Arg Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ala
225 230 235 240
His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val
245 250 255
Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
260 265 270
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
275 280 285
Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
290 295 300
Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Ala Asp Tyr Leu Lys
305 310 315 320
Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met
325 330 335
Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn
340 345 350
Lys Lys Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly
355 360 365
Val Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Glu Ala
370 375 380
Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Val
385 390 395 400
Ile Arg Val Arg Asn Val Asp Glu Ala Ile Asp Leu Gly Val Glu Leu
405 410 415
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp
420 425 430
Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys
435 440 445
Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly
450 455 460
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg
465 470 475 480
Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile
485 490 495
Lys
<210> 101
<211> 462
<212> PRT
<213> Eubacterium plexicaudatum
<400> 101
Met Ser Val Asn Asp Gln Met Val Gln Asp Ile Val Arg Gln Val Leu
1 5 10 15
Ala Asn Met Arg Ile Ser Ser Asp Ala Ser Gly Ser Arg Gly Val Phe
20 25 30
Ser Asp Met Asn Glu Ala Val Glu Ala Ala Lys Lys Ala Gln Ala Val
35 40 45
Ile Gly Lys Met Pro Met Asp His Arg Glu Lys Ile Ile Ser Ser Ile
50 55 60
Arg Ala Lys Ile Met Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val
65 70 75 80
Lys Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln
85 90 95
Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Lys Ala
100 105 110
Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly
115 120 125
Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu
130 135 140
Cys Asn Thr Ile Gly Met Val Ala Gly Gly Asn Thr Val Val Phe Asn
145 150 155 160
Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Val Asn Leu Val
165 170 175
Asn Glu Ala Ser Val Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr
180 185 190
Val Glu His Pro Thr Leu Asp Thr Ser Ala Ile Met Met Lys His Lys
195 200 205
Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala
210 215 220
Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp
245 250 255
Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu
260 265 270
Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr
275 280 285
Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Ala Lys Glu Gln Glu
290 295 300
Ala Leu Ile Ser Val Val Leu Lys Gly Gly Gln Leu Asn Arg Asp Cys
305 310 315 320
Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Gln Ala
325 330 335
Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala
355 360 365
Asp Ser Phe Glu Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly
370 375 380
Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp His Ile Thr
385 390 395 400
Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr
435 440 445
Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg
450 455 460
<210> 102
<211> 467
<212> PRT
<213> Thermosediminibacter oceani
<400> 102
Met Val Asp Glu Lys Val Val Glu Ala Ile Ala Lys Arg Ile Ile Glu
1 5 10 15
Glu Leu Asn Leu Cys Glu Ser Gly Ser Ser Gly Gly Glu Ser Arg Glu
20 25 30
Glu Leu Gly Ile Phe Asp Asn Leu Asp Asp Ala Val Glu Ala Ala Ser
35 40 45
Gln Ala Gln Lys Arg Phe Ala Ala Leu Asp Leu Glu Lys Arg Glu Glu
50 55 60
Ile Ile Gln Ala Ile Arg Glu Ala Cys Leu Asn Asn Ala Arg Tyr Leu
65 70 75 80
Ala Glu Leu Thr Val Asn Glu Thr Gly Ile Gly Arg Val Glu Asp Lys
85 90 95
Ile Val Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp
100 105 110
Leu Arg Pro Ser Cys Trp Thr Gly Asp His Gly Leu Thr Leu Val Glu
115 120 125
Met Ala Pro Val Gly Val Ile Gly Ser Ile Thr Pro Val Thr Asn Pro
130 135 140
Val Ala Thr Val Ile Asn Asn Ser Ile Ser Met Leu Ala Ala Gly Asn
145 150 155 160
Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Arg Ser Ser Asn Lys
165 170 175
Ala Val Glu Ile Ile Asn Glu Ala Ile Met Lys Val Gly Gly Pro Arg
180 185 190
His Leu Val Asn Ser Val Ala Glu Pro Thr Ile Glu Thr Ala Lys Ala
195 200 205
Leu Met Ala His Pro Lys Val Asn Leu Val Ser Val Thr Gly Gly Lys
210 215 220
Ala Val Val Ser Glu Ala Leu Arg Ser Gly Lys Lys Val Ile Gly Ala
225 230 235 240
Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val
245 250 255
Lys Ala Ala His Asp Ile Tyr Cys Gly Ala Ser Phe Asp Asn Asn Leu
260 265 270
Pro Cys Ile Ala Glu Lys Glu Leu Ile Ala Val Glu Ala Val Ala Asp
275 280 285
Met Leu Leu Glu Arg Leu Ala Arg Glu Gly Ala Tyr Ile Leu Arg Gly
290 295 300
Lys Asp Val Glu Lys Ile Thr Glu Val Val Phe Asp Glu Asn His Arg
305 310 315 320
Ile Asn Lys Lys Leu Val Gly Lys Asp Ala Ser Phe Ile Leu Glu Gln
325 330 335
Ile Gly Ile Gln Val Gly Lys Asp Val Arg Leu Val Val Val Pro Val
340 345 350
Asn Pro Glu His Pro Leu Val His His Glu Gln Leu Met Pro Val Leu
355 360 365
Pro Phe Val Arg Val Pro Asn Ile Gln Glu Ala Val Glu Leu Ala Val
370 375 380
Arg Ala Glu Gly Gly Asn Arg His Thr Ala Val Met His Ser Lys Asn
385 390 395 400
Val Asp Asn Met Thr Asn Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly
420 425 430
Tyr Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser
435 440 445
Ala Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe
450 455 460
Arg Ile Ile
465
<210> 103
<211> 479
<212> PRT
<213> Clostridium clostridioforme
<400> 103
Met Glu Ile Ser Glu Lys Glu Val Glu Ala Ile Val Arg Ser Val Leu
1 5 10 15
Ser Gly Leu Gly Gln Lys Ser Phe Gln Ala Glu Ala Leu His Val Lys
20 25 30
Asp Lys Met Cys Ser Asp Gly Glu Asp Gly Ile Phe Glu Leu Val Glu
35 40 45
Asp Ala Ile Glu Ala Ala Ser Lys Ala Gln Lys Glu Trp Val His Arg
50 55 60
Tyr Lys Leu Lys Asp Arg Lys Arg Ile Ile Glu Ala Ile Arg Val Thr
65 70 75 80
Ser Arg Ala His Ala Glu Ser Leu Ala Arg Met Val His Glu Glu Thr
85 90 95
Gly Met Gly Arg Tyr Glu Asp Lys Ile Thr Lys His Met Ala Val Ile
100 105 110
Asp Lys Thr Pro Gly Val Glu Cys Leu Val Thr Asp Ala Ile Ser Gly
115 120 125
Asp Glu Gly Leu Met Ile Glu Glu Pro Ala Pro Phe Gly Val Ile Gly
130 135 140
Ala Ile Thr Pro Ser Thr Asn Pro Thr Glu Thr Met Ile Asn Asn Thr
145 150 155 160
Ile Ser Met Ile Ala Gly Gly Asn Ala Val Val Phe Asn Val His Pro
165 170 175
Gly Ala Lys Lys Cys Cys Ala Tyr Cys Leu Gln Ile Leu His Arg Ala
180 185 190
Ile Val Glu Asn Gly Gly Pro Lys Asn Leu Ile Thr Met Gln Arg Glu
195 200 205
Pro Asp Met Asp Ala Val His Lys Leu Thr Ser Ser Pro His Ile Arg
210 215 220
Leu Met Val Gly Thr Gly Gly Met Gly Met Val His Ala Leu Leu Cys
225 230 235 240
Ser Gly Lys Arg Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val
245 250 255
Val Asp Asp Thr Ala Asp Leu Ser Leu Ala Ala Arg Glu Leu Tyr Arg
260 265 270
Gly Ala Ser Phe Asp Asn Asn Leu Leu Cys Leu Ala Glu Lys Glu Val
275 280 285
Phe Val Met Asp Asn Val Ala Glu Glu Leu Val Asp Arg Leu Val Gly
290 295 300
Glu Gly Ala Tyr Leu Leu Asp Asp Leu Gln Leu Lys Lys Ile Thr Glu
305 310 315 320
Leu Ala Met Val Asn Lys Asp Gly Lys Tyr Glu Val Asn Lys Lys Trp
325 330 335
Val Gly Lys Asp Ala Gly Lys Phe Leu Glu Ala Ile Gly Ile Gln Glu
340 345 350
His Arg Glu Pro Arg Leu Leu Ile Cys Val Thr Asp Arg Ser His Pro
355 360 365
Phe Val Lys Val Glu Gln Leu Met Pro Val Leu Pro Ile Val Arg Cys
370 375 380
Gly Ser Phe Glu Lys Cys Val Glu Trp Ala Val Asp Thr Glu Ala Gly
385 390 395 400
Asn Arg His Thr Ala Ser Ile Phe Ser Lys Asn Val Glu His Met Thr
405 410 415
Leu Phe Gly Lys Glu Ile Glu Thr Thr Ile Tyr Thr Lys Asn Gly Ala
420 425 430
Thr Leu Lys Gly Ile Gly Ile Gly Gly Glu Gly His Thr Thr Met Thr
435 440 445
Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Arg Ser Phe Thr
450 455 460
Arg Arg Arg Arg Cys Met Leu Ala Glu Gly Gly Leu Arg Ile Ile
465 470 475
<210> 104
<211> 471
<212> PRT
<213> Clostridium clostridioforme
<400> 104
Met Asp Met Asp Ile Lys Val Ile Glu Gln Met Val Glu Gln Ala Leu
1 5 10 15
Lys Glu Ile Lys Ala Glu Gln Pro Gln Lys Phe Thr Met Pro Lys Ala
20 25 30
Glu Leu Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser
35 40 45
Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln
50 55 60
Lys Tyr Val Asp Val Ile Arg Arg Thr Ile Leu Lys Arg Glu Asn Leu
65 70 75 80
Glu Met Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr
85 90 95
Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly
100 105 110
Thr Glu Asp Leu Leu Thr Glu Ala Met Thr Gly Asp Asn Gly Leu Thr
115 120 125
Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala
145 150 155 160
Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Gln Met Thr Val Lys Leu Leu Asn Lys Ala Leu Thr Glu Ser Gly
180 185 190
Ala Pro Glu Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn
195 200 205
Thr Asn Lys Met Ile Glu Asn Pro Ser Val Arg Leu Leu Val Ala Thr
210 215 220
Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Val Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser
275 280 285
Ile Cys Asp Tyr Leu Ile His Asn Met Lys Glu Asn Gly Ala Tyr Gln
290 295 300
Ile Thr Asp Pro Ala Leu Leu Glu Lys Leu Val Thr Leu Val Thr Asn
305 310 315 320
Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr
325 330 335
Ile Leu Asp Lys Leu Gly Ile Thr Ala Asp Ala Ser Val Arg Val Ile
340 345 350
Ile Met Glu Val Pro Lys Glu His Leu Leu Val Gln Glu Glu Met Met
355 360 365
Met Pro Ile Leu Pro Val Val Arg Val Cys Asp Val Asp Thr Ala Ile
370 375 380
Glu Tyr Ala Arg Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Arg Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu
405 410 415
Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val
420 425 430
Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Pro Arg Ala Phe Cys Arg Lys Arg Lys Cys Val Met
450 455 460
Thr Asp Ala Phe Ser Ile Arg
465 470
<210> 105
<211> 472
<212> PRT
<213> Ilyobacter polytropus
<400> 105
Met Asn Leu Asp Ala Asn Asn Leu Asn Asn Ile Val Ser Leu Ile Met
1 5 10 15
Lys Glu Leu Asp Lys Asn Asn Asn Ile Asp Asp Thr Gly Gln Gly Cys
20 25 30
Gly Gly Glu Glu Gly Lys Asn Gly Ile Phe Ser Ser Met Asp Thr Ala
35 40 45
Val Ser Lys Ala Lys Glu Ala Gln Val Thr Leu Phe Ala Ser Lys Leu
50 55 60
Glu Leu Arg Glu Arg Ile Ile Lys Ala Ile Arg Glu Asp Val Arg Glu
65 70 75 80
Ala Ala Ala Glu Leu Ala Glu Ile Ala Val Glu Glu Thr Gly Met Gly
85 90 95
Arg Val Asp Asp Lys Thr Leu Lys His Tyr Val Thr Val Asp Lys Thr
100 105 110
Pro Gly Val Glu Asp Leu Arg Ala Phe Ala Tyr Ser Gly Asp Asn Gly
115 120 125
Leu Thr Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ser Ile Thr
130 135 140
Pro Ser Thr Asn Pro Ser Glu Thr Ile Val Cys Asn Ala Ile Gly Met
145 150 155 160
Ile Ala Ala Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys
165 170 175
Lys Thr Ser Leu Arg Ala Val Glu Ile Leu Asn Lys Ala Val Ala Arg
180 185 190
Ala Gly Gly Pro Asn Asn Leu Val Val Thr Ile Phe Glu Pro Ser Ile
195 200 205
Glu Asn Thr Asn Lys Met Val Lys Asn Pro Asp Ile Lys Met Val Val
210 215 220
Ala Thr Gly Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys
225 230 235 240
Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu
245 250 255
Thr Ala Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asn Gly Cys Ser
260 265 270
Phe Asp Asn Asn Leu Pro Cys Ile Thr Glu Lys Glu Val Val Ala Val
275 280 285
Asp Ser Ile Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala
290 295 300
Tyr Leu Val Gln Asp Ser Lys Thr Ile Lys Lys Leu Cys Glu Met Val
305 310 315 320
Ile Asn Asp Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asn Ala Ser
325 330 335
Tyr Ile Leu Lys Asp Leu Gly Ile Asp Val Gly Asp Glu Ile Lys Val
340 345 350
Ile Ile Val Glu Thr Asp Ala Gly His Pro Leu Ala Val Leu Glu Met
355 360 365
Leu Met Pro Val Leu Pro Ile Val Arg Val Lys Asp Ala Leu Glu Gly
370 375 380
Ile Lys Val Cys Lys Lys Leu Glu Asp Gly Leu Arg His Thr Ala Met
385 390 395 400
Ile His Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met
405 410 415
Glu Thr Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly
420 425 430
Val Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Ala
450 455 460
Leu Val Gly Gly Leu Ser Ile Lys
465 470
<210> 106
<211> 462
<212> PRT
<213> Shuttleworthia satelles
<400> 106
Met Ala Asp Glu Gln Leu Val Gln Asn Val Val Arg Glu Val Val Ala
1 5 10 15
Arg Met Gln Ile Ser Ala Pro Ala Arg Gly Met His Gly Val Phe Ser
20 25 30
Asp Met Glu Glu Ala Ile Glu Ala Ala Arg Thr Ala Gln Gln Thr Val
35 40 45
Arg Leu Leu Pro Met Asp Gln Arg Glu Lys Ile Ile Gly Ala Ile Arg
50 55 60
Arg Lys Thr Arg Glu Asn Ala Glu Ile Leu Ala Arg Met Ala Val Asn
65 70 75 80
Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His Leu Leu
85 90 95
Val Ala Asp Lys Val Pro Gly Thr Glu Asp Ile Ser Thr Arg Ala Phe
100 105 110
Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly Val
115 120 125
Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu Cys
130 135 140
Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn Pro
145 150 155 160
His Pro Gln Ala Ile Lys Thr Thr Leu Phe Thr Ile Gln Met Val Asn
165 170 175
Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr Val
180 185 190
Asp Ala Pro Thr Leu Ala Thr Ser Glu Ile Met Met Lys Ser Pro His
195 200 205
Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val Thr Ala Val
210 215 220
Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro
225 230 235 240
Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp Ile
245 250 255
Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys
260 265 270
Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr Met
275 280 285
Leu Thr Glu Gln Gly Cys Tyr Gln Ala Ser Glu Glu Glu Leu Asp Arg
290 295 300
Leu Thr Lys Ala Val Met Asp Glu Lys Gly Arg Leu Asn Arg Lys Ala
305 310 315 320
Val Gly Arg Ser Ala Arg Lys Leu Leu Ser Met Ile Gly Val Glu Val
325 330 335
Asp Ala Asn Ile Arg Cys Ile Thr Phe Phe Gly Pro Lys Glu His Pro
340 345 350
Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Val
355 360 365
Lys Asp Phe Ala Glu Gly Leu Glu Thr Ala Ala Trp Leu Glu His Gly
370 375 380
Asn Lys His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr
385 390 395 400
Glu Tyr Ala Arg Arg Leu Asp Thr Thr Ile Thr Val Lys Asn Gly Pro
405 410 415
Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Ser Tyr Cys Thr Phe Thr
420 425 430
Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Ile
435 440 445
Lys Ser Arg His Cys Val Met Thr Asp Ser Leu Cys Val Arg
450 455 460
<210> 107
<211> 472
<212> PRT
<213> Clostridium beijerinckii
<400> 107
Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile
1 5 10 15
Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser
20 25 30
Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala
35 40 45
Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys
50 55 60
Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn
65 70 75 80
Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys
85 90 95
Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro
100 105 110
Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu
115 120 125
Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro
130 135 140
Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile
145 150 155 160
Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn
165 170 175
Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala
180 185 190
Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu
195 200 205
Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala
210 215 220
Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys
225 230 235 240
Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr
245 250 255
Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe
260 265 270
Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp
275 280 285
Gln Ile Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr
290 295 300
Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr
305 310 315 320
Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro
325 330 335
Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val
340 345 350
Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met
355 360 365
Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala
370 375 380
Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile
385 390 395 400
Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu
405 410 415
Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly
420 425 430
Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly
435 440 445
Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val
450 455 460
Met Val Asp Ala Phe Asn Ile Arg
465 470
<210> 108
<211> 471
<212> PRT
<213> Clostridium clostridioforme
<400> 108
Met Asp Met Asp Ile Lys Val Ile Glu Gln Met Val Glu Gln Ala Leu
1 5 10 15
Lys Glu Ile Lys Ala Glu Gln Pro Gln Lys Phe Thr Met Pro Lys Ala
20 25 30
Glu Leu Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser
35 40 45
Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln
50 55 60
Lys Tyr Val Asp Val Ile Arg Arg Thr Ile Leu Lys Arg Glu Asn Leu
65 70 75 80
Glu Met Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr
85 90 95
Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly
100 105 110
Thr Glu Asp Leu Leu Thr Glu Ala Met Thr Gly Asp Asn Gly Leu Thr
115 120 125
Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala
145 150 155 160
Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Gln Met Thr Val Lys Leu Leu Asn Lys Ala Leu Thr Glu Ser Gly
180 185 190
Ala Pro Glu Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn
195 200 205
Thr Asn Lys Met Ile Glu Asn Pro Ser Val Arg Leu Leu Val Ala Thr
210 215 220
Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Val Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser
275 280 285
Ile Cys Asp Tyr Leu Ile His Asn Met Lys Glu Asn Gly Ala Tyr Gln
290 295 300
Ile Thr Asp Pro Ala Leu Leu Glu Lys Leu Val Thr Leu Val Thr Asn
305 310 315 320
Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr
325 330 335
Ile Leu Asp Lys Leu Gly Ile Thr Ala Asp Ala Ser Val Arg Val Ile
340 345 350
Ile Met Glu Val Pro Lys Glu His Leu Leu Val Gln Glu Glu Met Met
355 360 365
Met Pro Ile Leu Pro Val Val Arg Val Cys Asp Val Asp Thr Ala Ile
370 375 380
Glu Tyr Ala Arg Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Arg Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu
405 410 415
Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val
420 425 430
Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Pro Lys Ala Phe Cys Arg Lys Arg Lys Cys Val Met
450 455 460
Thr Asp Ala Phe Ser Ile Arg
465 470
<210> 109
<211> 473
<212> PRT
<213> Clostridium sp.
<400> 109
Met Lys Leu Asp Asp Lys Leu Ile Glu Gln Val Ala Arg Leu Val Met
1 5 10 15
Glu Glu Met Lys Ser Gly Ser Ala Ala Ala Cys Glu Glu Asn Gly Thr
20 25 30
Cys Gly Asp Ser Tyr Gly Ile Phe Asp Ser Met Asp Asp Ala Val Gln
35 40 45
Ala Ser Glu Ala Ala Gln Arg Lys Tyr Leu Phe Ser Thr Met Glu Asp
50 55 60
Arg Gln Lys Tyr Val Asp Val Ile Arg Gln Thr Val Leu Glu Pro Glu
65 70 75 80
Met Leu Gln Lys Ile Ser Arg Met Ala Val Glu Glu Thr Gly Met Gly
85 90 95
Asn Tyr Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Ser
100 105 110
Pro Gly Thr Glu Asp Leu Val Thr Glu Ala Met Thr Gly Asp Arg Gly
115 120 125
Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Val Thr
130 135 140
Pro Ala Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ala Met
145 150 155 160
Leu Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys
165 170 175
Asn Val Thr His Val Leu Val Thr Ala Leu Asn Gln Ala Leu Glu Lys
180 185 190
Val Gly Ala Pro Thr Asn Leu Ile Val Thr Val Arg Glu Pro Ser Val
195 200 205
Glu Asn Thr Asn Leu Met Ile Lys His Pro Lys Ile Arg Val Leu Val
210 215 220
Ala Thr Gly Gly Pro Gly Ile Val Lys Met Val Met Ser Thr Gly Lys
225 230 235 240
Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu
245 250 255
Thr Ala Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser
260 265 270
Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Ile Ala Val
275 280 285
Asp Thr Ile Ala Asp Cys Leu Ile Trp His Met Lys Arg Val Gly Ala
290 295 300
Phe Glu Leu Lys Glu Glu Ser Ala Ile Ser Arg Leu Leu Gln Leu Val
305 310 315 320
Thr Asn Glu Lys Gly Gly Pro Lys Val Glu Phe Val Gly Lys Ser Ala
325 330 335
Pro Tyr Ile Leu Asn Lys Leu Gly Ile Ser Gly Gly Glu Asn Ala Arg
340 345 350
Val Ile Leu Met Glu Thr Gln Lys Asp His Pro Phe Val Met Glu Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Ala Ala Asp Val Asp Glu
370 375 380
Ala Ile Glu Ile Ala Leu Val Ala Glu Arg Gly Asn Arg His Thr Ala
385 390 395 400
Met Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Lys Leu
405 410 415
Leu Gln Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile
420 425 430
Gly Val Gly Gly Glu Gly Cys Thr Thr Phe Thr Ile Ala Gly Pro Thr
435 440 445
Gly Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys
450 455 460
Val Met Ser Asp Ala Leu His Ile Arg
465 470
<210> 110
<211> 471
<212> PRT
<213> Clostridium bolteae
<400> 110
Met Asp Met Asp Ile Lys Val Ile Glu Gln Leu Val Glu Gln Ala Leu
1 5 10 15
Lys Glu Ile Lys Ala Glu Gln Pro Leu Lys Phe Thr Ala Pro Lys Leu
20 25 30
Glu Arg Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser
35 40 45
Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln
50 55 60
Lys Tyr Val Asp Val Ile Arg Ser Thr Ile Ile Lys Arg Glu Asn Leu
65 70 75 80
Glu Leu Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr
85 90 95
Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly
100 105 110
Thr Glu Asp Leu Leu Thr Glu Ala Ile Thr Gly Asp Asn Gly Leu Thr
115 120 125
Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr
130 135 140
Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala
145 150 155 160
Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val
165 170 175
Ser Gln Met Thr Val Lys Met Leu Asn Lys Ala Leu Ile Asp Asn Gly
180 185 190
Ala Pro Pro Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn
195 200 205
Thr Asn Lys Met Ile Asp Asn Pro Ser Val Arg Leu Leu Val Ala Thr
210 215 220
Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala
225 230 235 240
Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala
245 250 255
Asp Ile Asp Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp
260 265 270
Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser
275 280 285
Ile Cys Asp Tyr Leu Ile His His Met Lys Glu Asn Gly Ala Tyr Gln
290 295 300
Ile Thr Asp Pro Met Leu Leu Glu Gln Leu Val Ala Leu Val Thr Thr
305 310 315 320
Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr
325 330 335
Ile Leu Asp Lys Leu Gly Ile Thr Val Asp Ala Ser Val Arg Val Ile
340 345 350
Ile Met Glu Val Pro Lys Asp His Leu Leu Val Gln Glu Glu Met Met
355 360 365
Met Pro Ile Leu Pro Val Val Arg Val Ser Asp Val Asp Thr Ala Ile
370 375 380
Glu Tyr Ala His Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met
385 390 395 400
His Ser Lys Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu
405 410 415
Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val
420 425 430
Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu
435 440 445
Gly Leu Thr Ser Pro Arg Thr Phe Cys Arg Lys Arg Lys Cys Val Met
450 455 460
Thr Asp Ala Phe Ser Ile Arg
465 470
<210> 111
<211> 468
<212> PRT
<213> Eubacterium hallii
<400> 111
Met Asn Ile Asp Val Glu Leu Ile Glu Lys Val Val Lys Lys Val Leu
1 5 10 15
Asn Asp Val Glu Thr Gly Ser Ser Glu Ser Glu Tyr Gly Tyr Gly Ile
20 25 30
Phe Asp Thr Met Asp Glu Ala Ile Glu Ala Ser Ala Lys Ala Gln Lys
35 40 45
Glu Tyr Met Asn His Ser Met Ala Asp Arg Gln Arg Tyr Val Glu Gly
50 55 60
Ile Arg Glu Val Val Cys Thr Lys Glu Asn Leu Glu Tyr Met Ser Lys
65 70 75 80
Leu Ala Val Glu Glu Ser Gly Met Gly Ala Tyr Glu Tyr Lys Val Ile
85 90 95
Lys Asn Arg Leu Ala Ala Val Lys Ser Pro Gly Val Glu Asp Leu Thr
100 105 110
Thr Glu Ala Leu Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Cys
115 120 125
Pro Phe Gly Val Ile Gly Ala Ile Ala Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Val Ile Cys Asn Ser Ile Ala Met Leu Ala Gly Gly Asn Thr Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ser Lys Gly Val Ser Ile Trp Leu Ile
165 170 175
Lys Lys Leu Asn Ala Lys Leu Glu Glu Leu Gly Ala Pro Arg Asn Leu
180 185 190
Ile Val Thr Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Ile Met Met
195 200 205
Asn His Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile
210 215 220
Val Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Ile Ala Val Asp Gln Ile Ala Asp Tyr Leu
275 280 285
Ile Phe Asn Met Lys Asn Asn Gly Ala Tyr Glu Val Lys Asp Pro Glu
290 295 300
Ile Ile Glu Lys Met Val Asp Leu Val Thr Lys Asp Arg Lys Lys Pro
305 310 315 320
Ala Val Asn Phe Val Gly Lys Ser Ala Gln Tyr Ile Leu Asp Lys Val
325 330 335
Gly Ile Lys Val Gly Pro Glu Val Lys Cys Ile Ile Met Glu Ala Pro
340 345 350
Lys Asp His Pro Phe Val Gln Ile Glu Leu Met Met Pro Ile Leu Pro
355 360 365
Ile Val Arg Val Pro Asn Val Asp Glu Ala Ile Asp Phe Ala Val Glu
370 375 380
Val Glu His Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val
385 390 395 400
Asp Lys Leu Thr Lys Met Ala Lys Glu Ile Glu Thr Thr Ile Phe Val
405 410 415
Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Met Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
435 440 445
Lys Ser Phe Cys Arg Lys Arg Arg Cys Val Leu Gln Asp Gly Leu His
450 455 460
Ile Arg Met Lys
465
<210> 112
<211> 467
<212> PRT
<213> Halanaerobium saccharolyticum
<400> 112
Met Lys Ile Lys Glu Asn Glu Leu Asp Lys Ile Val Asn Gln Val Ile
1 5 10 15
Ser Ser Leu Asn Asn Lys Gln Asn Ser Asn Asp Phe Asn Thr Lys Ile
20 25 30
Asn Tyr Gly Ile Phe Ser Thr Met Asp Glu Ala Ile Ala Glu Ala Val
35 40 45
Lys Ala Gln Ala Cys Leu Gln Leu Asn Tyr Ser Thr Glu Ala Arg Glu
50 55 60
Lys Ile Ile Lys Ser Ile Arg Lys Asn Val Ser Lys His Val Glu Lys
65 70 75 80
Ile Ser Glu Met Ala Val Glu Glu Thr Asp Met Gly Arg Ile Glu Asp
85 90 95
Lys Ile Ile Lys Asn Asn Leu Ala Ile Asn Lys Thr Pro Gly Thr Glu
100 105 110
Asp Leu Arg Thr Glu Ala Phe Ser Gly Lys Lys Gly Leu Thr Ile Val
115 120 125
Glu Glu Ala Pro Phe Gly Val Ile Cys Ser Ile Ala Pro Val Thr Asn
130 135 140
Pro Thr Glu Thr Ile Ile Ser Asn Ala Ile Ser Met Ile Ala Ser Cys
145 150 155 160
Asn Gly Val Val Phe Asn Ser His Pro Gly Ala Lys Lys Val Ser Lys
165 170 175
Tyr Ile Ile Glu Val Leu Asn Lys Val Ile Met Glu Ala Gly Gly Pro
180 185 190
Glu Asn Leu Leu Thr Ala Val Asn Glu Pro Thr Leu Gln Thr Val Glu
195 200 205
Ser Cys Met Arg Asp Asp Arg Ile Ala Met Ile Val Ala Thr Gly Gly
210 215 220
Pro Gly Val Val Asn Ala Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Asp Thr Val Asp Leu
245 250 255
Lys Arg Val Ala Lys Asp Ile Ile Asn Gly Ala Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Thr Ser Glu Lys Ala Ile Val Ala Leu Glu Ser Ile Ala
275 280 285
Asp Ser Leu Leu Asn Glu Met Thr Asn Gln Asn Ala Gln Leu Val His
290 295 300
Asp Ile Lys Ala Leu Glu Arg Val Ile Leu Asn Asp Asp Gly Ser Ile
305 310 315 320
Asn Lys Ala Leu Val Gly Lys Asp Ala Ala Phe Ile Leu Asn Lys Ala
325 330 335
Gly Leu Lys Ala Lys Ser Glu Asp Leu Arg Leu Val Ile Val Asp Val
340 345 350
Asp Leu Arg His Pro Phe Val Gln Lys Glu Gln Leu Met Pro Val Ile
355 360 365
Pro Leu Val Arg Ala Lys Asn Phe Asn Glu Ala Met Glu Met Gly Val
370 375 380
Asp Ile Glu Glu Gly Asn Arg His Thr Ala Ile Ile His Ser Lys Asn
385 390 395 400
Val Asp Asn Leu Thr Lys Phe Ala Lys Lys Ile Glu Thr Thr Ile Tyr
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Ala Gly Gly Glu Gly
420 425 430
Tyr Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser
435 440 445
Ala Arg Ser Phe Thr Arg Lys Arg Arg Cys Val Leu Val Asp Gly Phe
450 455 460
Ser Ile Ile
465
<210> 113
<211> 469
<212> PRT
<213> Eubacterium limosum
<400> 113
Met Asn Ile Asp Thr Thr Gly Ile Glu Tyr Ile Val Lys Lys Val Met
1 5 10 15
Asp Gln Ile Asp Tyr Ala Glu Glu Thr Gly Ala Pro Val Val Asp Gly
20 25 30
Lys Asp Gly Val Phe Gln Thr Met Asp Ala Ala Ile Glu Ala Ala Ala
35 40 45
Val Ala Gln Lys Glu Tyr Met Lys Lys Pro Leu Ala Leu Arg Arg Gln
50 55 60
Met Ile Ala Ala Met Arg Glu Ile Met Leu Lys Lys Glu Asn Ile Glu
65 70 75 80
Thr Ile Cys Ala Met Val Val Glu Glu Ser Gly Met Gly Asn Tyr Glu
85 90 95
His Lys Leu Ala Lys His Arg Leu Ala Thr Thr Gly Thr Pro Gly Val
100 105 110
Glu Asp Leu Leu Thr Glu Ala Trp Ala Gly Asp Asp Gly Cys Thr Leu
115 120 125
Leu Glu Leu Ser Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr Thr
130 135 140
Asn Pro Asn Glu Thr Ile Val Asn Asn Ser Ile Gly Met Leu Ala Ala
145 150 155 160
Gly Asn Ala Val Val Phe Ser Pro His Pro Lys Ala Leu Lys Thr Ser
165 170 175
Phe Leu Cys Ile Lys Leu Leu Asn Glu Ala Ile Val Ser Val Gly Gly
180 185 190
Pro Arg Asn Leu Ile Val Thr Cys Ala Asn Pro Thr Ile Glu Ala Ala
195 200 205
Asn Glu Met Met Val His Pro Lys Ile Arg Met Leu Val Ala Thr Gly
210 215 220
Gly Pro Gly Val Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile
225 230 235 240
Gly Ala Gly Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp
245 250 255
Ile Glu Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn
260 265 270
Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Val Val Asp Gln Val
275 280 285
Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu Ile
290 295 300
Thr Asp Lys Lys Ala Ile Asp Ala Leu Ala Asp Leu Val Cys Pro Glu
305 310 315 320
Gly Arg Leu Ser Arg Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Ala
325 330 335
Ala Ala Ala Gly Leu Asp Val Pro Glu Asp Thr Arg Val Leu Ile Cys
340 345 350
Glu Thr Ser Lys Asp His Leu Leu Ala Val Glu Glu Leu Met Met Pro
355 360 365
Ile Leu Pro Ile Val Arg Val Ala Asn Val Asp Glu Gly Ile Asp Val
370 375 380
Ala Val Glu Leu Glu His Gly Asn Arg His Thr Ala Ile Met His Ser
385 390 395 400
Lys Asn Val Asp Lys Leu Thr Glu Met Ala Lys Arg Ile Gln Thr Thr
405 410 415
Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly
420 425 430
Glu Gly Tyr Pro Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu
435 440 445
Thr Ser Ala Lys Ser Phe Ala Arg Arg Arg Arg Cys Val Leu Val Gly
450 455 460
Gly Phe Asp Ile Lys
465
<210> 114
<211> 466
<212> PRT
<213> Thermoanaerobacter sp.
<400> 114
Met Ile Asp Glu Asn Leu Val Val Thr Ile Thr Lys Lys Ile Leu Asn
1 5 10 15
Glu Ile Asn Leu Lys Glu Ala Glu Glu Lys Lys Glu Lys Asp Asn Pro
20 25 30
Asp Leu Gly Ile Phe Asn Asp Val Asn Glu Ala Val Glu Cys Ala Lys
35 40 45
Glu Ala Gln Lys Lys Phe Ala Leu Met Asp Leu Glu Lys Arg Glu Glu
50 55 60
Ile Ile Ala Ala Ile Arg Glu Ala Cys Val Asn Asn Ala Arg Leu Leu
65 70 75 80
Ala Glu Ile Ala Cys Ser Glu Thr Gly Arg Gly Arg Val Glu Asp Lys
85 90 95
Val Ala Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp
100 105 110
Leu Lys Pro Thr Ala Trp Thr Gly Asp Arg Gly Leu Thr Leu Val Glu
115 120 125
Met Ala Pro Val Gly Val Ile Ala Ser Ile Thr Pro Val Thr Asn Pro
130 135 140
Thr Ala Thr Ile Ile Asn Asn Thr Ile Ser Met Leu Ala Ala Gly Asn
145 150 155 160
Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Lys Thr Ser Asn Lys
165 170 175
Ala Val Glu Ile Ile Asn Glu Ala Ile Leu Lys Val Gly Ala Pro Asn
180 185 190
Gly Leu Val Cys Ser Ile Asn Asn Pro Thr Ile Gln Thr Ala Gln Lys
195 200 205
Leu Met Glu His Pro Glu Val Asn Met Val Val Val Thr Gly Gly Lys
210 215 220
Ala Val Val Gln Thr Ala Leu Arg Cys Gly Lys Lys Val Ile Gly Ala
225 230 235 240
Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val
245 250 255
Lys Ala Ala His Asp Ile Ala Cys Gly Ala Ser Phe Asp Asn Asn Leu
260 265 270
Pro Cys Ile Ala Glu Lys Glu Ile Ile Ala Val Glu Arg Ile Ala Asp
275 280 285
Thr Leu Leu Glu Arg Met Lys Arg Glu Gly Ala Tyr Val Leu His Gly
290 295 300
Lys Asp Ile Asp Arg Met Thr Glu Leu Ile Phe Gln Gly Gly Ala Ile
305 310 315 320
Asn Lys Asp Leu Ile Gly Arg Asp Ala His Phe Ile Leu Ser Gln Ile
325 330 335
Gly Ile Glu Thr Gly Lys Asp Ile Arg Leu Val Val Met Pro Val Asp
340 345 350
Val Ser His Pro Leu Val Tyr His Glu Gln Leu Met Pro Val Ile Pro
355 360 365
Phe Val Thr Val Pro Thr Val Glu Glu Ala Ile Asn Leu Ala Val Lys
370 375 380
Ala Glu Gly Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val
385 390 395 400
Glu Asn Met Thr Ala Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe Val
405 410 415
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala
435 440 445
Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Arg
450 455 460
Ile Val
465
<210> 115
<211> 529
<212> PRT
<213> Rhodospirillum rubrum
<400> 115
Met Asn Asp Gly Gln Ile Ala Ala Ala Val Ala Lys Val Leu Glu Ala
1 5 10 15
Tyr Gly Val Pro Ala Asp Pro Ser Ala Ala Ala Pro Ala Pro Ala Ala
20 25 30
Pro Val Ala Pro Ala Ala Pro Thr Ala Gly Ser Val Ser Glu Met Ile
35 40 45
Ala Arg Gly Ile Ala Lys Ala Ser Ser Asp Asp Gln Ile Ala Gln Ile
50 55 60
Val Ala Lys Val Val Gly Asp Tyr Ser Ala Gln Ala Ala Lys Pro Ala
65 70 75 80
Val Val Pro Gly Ala Ala Ala Ser Thr Glu Ala Gly Asp Gly Val Phe
85 90 95
Asp Thr Met Asp Ala Ala Val Asp Ala Ala Val Leu Ala Gln Gln Gln
100 105 110
Tyr Leu Leu Cys Ser Met Thr Asp Arg Gln Arg Phe Val Asp Gly Ile
115 120 125
Arg Glu Val Ile Leu Gln Lys Asp Thr Leu Glu Leu Ile Ser Arg Met
130 135 140
Ala Ala Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys
145 150 155 160
Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr
165 170 175
Glu Ala Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Ser Pro
180 185 190
Phe Gly Ala Ile Gly Ala Val Ala Pro Thr Thr Asn Pro Thr Glu Thr
195 200 205
Ile Ile Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Ile
210 215 220
Phe Ser Pro His Pro Arg Ala Thr Lys Val Ser Leu Leu Thr Val Lys
225 230 235 240
Leu Ile Asn Gln Lys Leu Ala Cys Leu Gly Ala Pro Ala Asn Leu Val
245 250 255
Val Thr Val Ser Lys Pro Ser Val Glu Asn Thr Asn Ala Met Met Ala
260 265 270
His Pro Lys Ile Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile Val
275 280 285
Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly
290 295 300
Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala
305 310 315 320
Leu Asp Ile Ile Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile
325 330 335
Ala Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile
340 345 350
Phe Ser Met Lys Lys Gln Gly Ala Tyr Gln Ile Thr Asp Pro Ala Val
355 360 365
Leu Arg Lys Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln
370 375 380
Thr Ser Cys Val Gly Lys Ser Ala Val Trp Leu Leu Asn Lys Ile Gly
385 390 395 400
Ile Glu Val Asp Ser Ser Val Lys Val Ile Leu Met Glu Val Pro Lys
405 410 415
Glu His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu
420 425 430
Val Arg Val Ser Asp Val Asp Glu Ala Ile Ala Val Ala Ile Glu Val
435 440 445
Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr Asn Val Arg
450 455 460
Lys Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys
465 470 475 480
Asn Gly Pro Ser Tyr Ala Gly Leu Gly Val Gly Gly Glu Gly Tyr Thr
485 490 495
Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys
500 505 510
Ser Phe Ala Arg Lys Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile
515 520 525
Arg
<210> 116
<211> 466
<212> PRT
<213> Eubacterium yurii
<400> 116
Met Asn Pro Glu Leu Leu Glu Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Lys Met Val Asp Ile Tyr Asn Tyr Gly Ile
20 25 30
Phe Asp Ser Val Asp Asp Ala Ile Asn Ala Ser Glu Ile Ala Gln Arg
35 40 45
Gln Leu Phe Glu Cys Ser Val Gln Lys Arg Asn Glu Tyr Val Asn Ala
50 55 60
Ile Arg Gln Ile Ile Leu Lys Lys Asp Asn Leu Glu Met Met Ser Arg
65 70 75 80
Asp Ala Val Glu Glu Thr Gly Ile Gly Arg Tyr Glu Asp Lys Ile Leu
85 90 95
Lys Asn Lys Leu Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu Ile
100 105 110
Thr Arg Ala Val Ser Gly Gln Asp Gly Leu Thr Leu Glu Glu Tyr Cys
115 120 125
Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Phe Ile Ser Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Ile Lys Leu Val
165 170 175
Lys Leu Met Asn Lys Ala Leu Glu Gln Val Gly Ala Pro Arg Asn Leu
180 185 190
Ile Ser Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met Met
195 200 205
Asn His Pro Lys Ile Lys Met Leu Val Ala Thr Gly Gly Pro Ala Ile
210 215 220
Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Val Ala Gly Ser Ser Phe Asp Asn Asn Val Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Ile Cys Asp Gln Leu
275 280 285
Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Ser Tyr Glu
290 295 300
Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys Pro
305 310 315 320
Asn Thr Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys Leu
325 330 335
Gly Ile Ser Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr Asn
340 345 350
Lys Asp His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu Pro
355 360 365
Ile Val Ser Val Ser Asp Val Asp Val Ala Ile Glu Tyr Ala Tyr Glu
370 375 380
Ala Glu His Arg Asn Arg His Thr Ala Ile Met His Ser Arg Asn Val
385 390 395 400
Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe Val
405 410 415
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro
435 440 445
Lys Ser Phe Cys Arg Val Arg Arg Cys Thr Met Ser Asp Ser Phe Ser
450 455 460
Ile Arg
465
<210> 117
<211> 466
<212> PRT
<213> Eubacterium sp.
<400> 117
Met Asn Pro Glu Leu Leu Glu Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Lys Met Val Asp Ile Tyr Asn Tyr Gly Ile
20 25 30
Phe Asp Ser Val Asp Asp Ala Ile Asn Ala Ser Glu Ile Ala Gln Arg
35 40 45
Gln Leu Phe Glu Cys Ser Val Gln Lys Arg Asn Glu Tyr Val Asn Ala
50 55 60
Ile Arg Gln Ile Ile Leu Lys Lys Asp Asn Leu Glu Met Met Ser Arg
65 70 75 80
Asp Ala Val Glu Glu Thr Gly Ile Gly Arg Tyr Glu Asp Lys Ile Leu
85 90 95
Lys Asn Lys Leu Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu Ile
100 105 110
Thr Arg Ala Val Ser Gly Gln Asp Gly Leu Thr Leu Glu Glu Tyr Cys
115 120 125
Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu
130 135 140
Thr Phe Ile Ser Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr Val
145 150 155 160
Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Ile Lys Leu Val
165 170 175
Lys Leu Met Asn Lys Ala Leu Glu Gln Val Gly Ala Pro Arg Asn Leu
180 185 190
Ile Ser Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met Met
195 200 205
Asn His Pro Lys Ile Lys Met Leu Val Ala Thr Gly Gly Pro Ala Ile
210 215 220
Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala
225 230 235 240
Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala
245 250 255
Ala Lys Asp Ile Val Ala Gly Ser Ser Phe Asp Asn Asn Val Pro Cys
260 265 270
Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Ile Cys Asp Gln Leu
275 280 285
Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Ser Tyr Glu
290 295 300
Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys Pro
305 310 315 320
Asn Thr Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys Leu
325 330 335
Gly Ile Asn Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr Asn
340 345 350
Lys Asp His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu Pro
355 360 365
Ile Val Ser Val Ser Asp Val Asp Val Ala Ile Glu Tyr Ala Tyr Glu
370 375 380
Ala Glu His Arg Asn Arg His Thr Ala Ile Met His Ser Arg Asn Val
385 390 395 400
Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe Val
405 410 415
Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr
420 425 430
Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro
435 440 445
Lys Ser Phe Cys Arg Val Arg Arg Cys Thr Met Ser Asp Ser Phe Ser
450 455 460
Ile Arg
465
<210> 118
<211> 532
<212> PRT
<213> Vibrio sp.
<400> 118
Met Asn Glu Gln Glu Ile Ala His Ala Val Glu Asn Val Leu Ser Lys
1 5 10 15
Tyr Thr Asn Val Thr Ala Gln Asn Ala Glu Pro Val Ser Tyr Ser Ser
20 25 30
Asn Ala Ser Leu Glu Asn Ile Val Ser Gln Ala Leu Ala Gly Asn Met
35 40 45
Val Lys Gln Pro Glu Thr Gln Thr Ala Pro Asp Leu Asn Ser Asn Ile
50 55 60
Glu Asn Ile Val Ser Gln Ile Leu Ala Glu Asn Gln Ala Lys Pro Gln
65 70 75 80
Ser Val Gln Cys Gln Ser Ala Asn His Gly Thr Thr Glu Tyr Leu Gly
85 90 95
Cys Phe Ala Ser Met Glu Glu Ala Ile Ser Ala Ala Ser His Ala Gln
100 105 110
Val Gln Tyr Arg His Cys Thr Met Gly Asp Arg Ala Ser Phe Val Lys
115 120 125
Gly Ile Arg Glu Val Phe Thr Gln Asp Asp Val Leu Glu Lys Ile Ser
130 135 140
Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Ala Asp Lys Leu
145 150 155 160
Thr Lys Asn Arg Ile Ala Ala Thr Lys Thr Pro Gly Ile Glu Asp Leu
165 170 175
Thr Thr Ser Ala Leu Ser Gly Asp Ser Gly Leu Thr Leu Thr Glu Phe
180 185 190
Ser Ala Tyr Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
195 200 205
Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Thr
210 215 220
Val Val Tyr Ser Pro His Pro Arg Ser Arg Asn Val Ser Leu Val Ala
225 230 235 240
Val Asp Leu Ile Asn Arg Lys Leu Ala Glu Leu Gly Ala Pro Ala Asn
245 250 255
Leu Val Val Thr Val Leu Glu Pro Ser Ile Asp Asn Thr Asn Ala Met
260 265 270
Met Asn Asp Pro Arg Val Asn Met Leu Val Ala Thr Gly Gly Pro Ser
275 280 285
Ile Val Lys Thr Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly
290 295 300
Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr Ala Asn Ile Glu Lys
305 310 315 320
Ala Ala Lys Asp Ile Ile Asn Gly Cys Ala Phe Asp Asn Asn Leu Pro
325 330 335
Cys Ile Ala Glu Lys Glu Val Ile Val Val Asn Glu Val Ala Asp Tyr
340 345 350
Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr Leu Leu Cys Asp Lys
355 360 365
Gln Lys Ile Gln Gln Leu Gln Ser Leu Val Leu Asn Glu Lys Gly Thr
370 375 380
Gly Pro Asn Thr Ser Phe Val Gly Lys Gly Ala Arg Tyr Ile Leu Asp
385 390 395 400
Lys Leu Asn Ile Gln Val Ser Asp Asp Ile Lys Val Ile Leu Ile Glu
405 410 415
Thr Glu Arg Asn His Pro Phe Val Val His Glu Leu Met Met Pro Ile
420 425 430
Leu Pro Val Val Arg Val Glu Asn Val Asp Glu Ala Ile Asp Leu Ala
435 440 445
Ile Lys Val Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr
450 455 460
Asn Val Glu Lys Leu Ser Lys Met Ala Arg Leu Ile Gln Thr Thr Ile
465 470 475 480
Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu
485 490 495
Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr
500 505 510
Ser Ala Arg Ser Phe Ala Arg Tyr Arg Arg Cys Val Met Val Glu Ala
515 520 525
Leu Asn Ile Arg
530
<210> 119
<211> 467
<212> PRT
<213> Eubacteriaceae bacterium
<400> 119
Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly
20 25 30
Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln
35 40 45
Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn
50 55 60
Val Ile Arg Lys Glu Ile Leu Lys Lys Asp Asn Leu Glu Met Ile Ser
65 70 75 80
Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile
85 90 95
Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu
100 105 110
Thr Thr Arg Ala Ile Ser Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr
115 120 125
Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
130 135 140
Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr
145 150 155 160
Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu
165 170 175
Val Lys Met Met Asn Lys Ala Leu Glu Glu His Gly Ala Pro Arg Asn
180 185 190
Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met
195 200 205
Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe
210 215 220
Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys
245 250 255
Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met
275 280 285
Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln
290 295 300
Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys
305 310 315 320
Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys
325 330 335
Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr
340 345 350
Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu
355 360 365
Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr
370 375 380
Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn
385 390 395 400
Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly
420 425 430
His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser
435 440 445
Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe
450 455 460
Ser Ile Arg
465
<210> 120
<211> 473
<212> PRT
<213> Propionibacterium propionicum
<400> 120
Met Lys Ile Asp Pro Ala Gln Leu Glu Ala Thr Ile Arg Glu Val Leu
1 5 10 15
Ala Ala Met Leu Pro Gly Asn Asp Asn Gln Thr Glu Ala Pro Ala Thr
20 25 30
Gln Gln Glu Ala Pro Gly Asp Gly Val Phe Ala Asp Met Asp Ser Ala
35 40 45
Val Glu Ala Ala His Leu Ala Gln Arg Glu Tyr Leu Ser His Pro Met
50 55 60
Ala Asp Arg Arg Arg Tyr Val Ala Ala Ile Arg Glu Ala Met Leu Ala
65 70 75 80
Pro Glu Ala Leu Asp Tyr Met Ser Glu Gln Ala Val Ala Gln Ser Gly
85 90 95
Met Gly Asp Val Gly His Lys Tyr Leu Lys Asn Lys Val Ala Ala Ala
100 105 110
Glu Thr Pro Gly Val Glu Asp Leu Val Thr Glu Ala Trp Ser Gly Asp
115 120 125
Asp Gly Leu Thr Thr Ile Glu Tyr Ser Pro Tyr Gly Val Ile Gly Ala
130 135 140
Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile Thr Cys Asn Ser Ile
145 150 155 160
Gly Met Leu Ala Ala Gly Asn Ala Val Val Phe Ser Pro His Pro Arg
165 170 175
Val Ala Lys Leu Ser Cys Trp Gln Val Arg Arg Ile Asn Arg Ala Leu
180 185 190
Arg Ala Ala Gly Ala Pro Asp Asn Leu Val Val Thr Val Thr Ala Pro
195 200 205
Ser Leu Glu Asn Thr Asn Ala Met Met Ala His Pro Lys Val Arg Met
210 215 220
Leu Val Ala Thr Gly Gly Pro Gly Ile Val Lys Ala Val Leu Ser Ser
225 230 235 240
Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Ala Val Val
245 250 255
Asp Glu Thr Ala Asp Ile Glu His Ala Ala Lys Cys Ile Val Asp Gly
260 265 270
Ala Ser Phe Asp Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Ile Ile
275 280 285
Ala Val Asp Ser Ile Ala Asp Met Leu Lys Phe Cys Met Ile Lys His
290 295 300
Gly Ala Tyr Glu Ala Thr Ala Ser Glu Val Ala Glu Leu Glu Lys Leu
305 310 315 320
Leu Val Asn Gly Asp Lys Pro Arg Thr Glu Trp Val Gly Lys Pro Ala
325 330 335
Ala Lys Ile Leu Glu Ala Ile Gly Val Thr Pro Pro Pro Gly Val Arg
340 345 350
Leu Ile Val Cys Glu Ala Ser Ala Thr His Pro Phe Val Val His Glu
355 360 365
Leu Met Met Pro Val Leu Gly Leu Val Arg Val Pro Asp Val Asp Ala
370 375 380
Ala Ile Asp Leu Ala Val Glu Leu Glu His Gly Asn Arg His Thr Ala
385 390 395 400
Val Met His Ser Leu Asn Val Ser Lys Leu Thr Lys Met Gly Lys Leu
405 410 415
Ile Gln Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Asn Gly Ile
420 425 430
Gly Ile Gly Gly Glu Gly Tyr Pro Thr Phe Thr Ile Ala Gly Pro Thr
435 440 445
Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Thr Arg Lys Arg Arg Cys
450 455 460
Val Leu Val Gly Asp Leu Asn Val Arg
465 470
<210> 121
<211> 467
<212> PRT
<213> Eubacteriaceae bacterium
<400> 121
Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly
20 25 30
Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln
35 40 45
Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn
50 55 60
Val Ile Arg Lys Glu Ile Leu Lys Lys Asp Asn Leu Glu Met Ile Ser
65 70 75 80
Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile
85 90 95
Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu
100 105 110
Thr Thr Arg Ala Leu Thr Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr
115 120 125
Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
130 135 140
Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr
145 150 155 160
Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu
165 170 175
Val Lys Met Met Asn Lys Ala Leu Glu Glu Tyr Gly Ala Pro Arg Asn
180 185 190
Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met
195 200 205
Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe
210 215 220
Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys
245 250 255
Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met
275 280 285
Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln
290 295 300
Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys
305 310 315 320
Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys
325 330 335
Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr
340 345 350
Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu
355 360 365
Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr
370 375 380
Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn
385 390 395 400
Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly
420 425 430
His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser
435 440 445
Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe
450 455 460
Ser Ile Arg
465
<210> 122
<211> 467
<212> PRT
<213> Eubacteriaceae bacterium
<400> 122
Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu
1 5 10 15
Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly
20 25 30
Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln
35 40 45
Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn
50 55 60
Val Ile Arg Arg Glu Val Leu Lys Lys Asp Asn Leu Glu Met Ile Ser
65 70 75 80
Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile
85 90 95
Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu
100 105 110
Thr Thr Arg Ala Leu Thr Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr
115 120 125
Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr
130 135 140
Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr
145 150 155 160
Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu
165 170 175
Val Lys Met Met Asn Lys Ala Leu Glu Glu Tyr Gly Ala Pro Arg Asn
180 185 190
Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met
195 200 205
Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe
210 215 220
Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly
225 230 235 240
Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys
245 250 255
Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro
260 265 270
Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met
275 280 285
Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln
290 295 300
Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys
305 310 315 320
Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys
325 330 335
Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr
340 345 350
Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu
355 360 365
Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr
370 375 380
Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn
385 390 395 400
Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe
405 410 415
Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly
420 425 430
His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser
435 440 445
Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe
450 455 460
Ser Ile Arg
465
<210> 123
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 123
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 124
<211> 20
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 124
Leu Gln Lys Asn Asn Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp
1 5 10 15
Val Gly Lys Asp
20
<210> 125
<211> 15
<212> PRT
<213> Lactobacillus brevis
<400> 125
Ile Gly Pro Lys Gly Ala Pro Asp Arg Lys Phe Val Gly Lys Asp
1 5 10 15
<210> 126
<211> 14
<212> PRT
<213> Clostridium phytofermentans
<400> 126
Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys Val Gly Lys Asp
1 5 10
<210> 127
<211> 18
<212> PRT
<213> Clostridium saccharoperbutylacetonicum
<400> 127
Ser Phe Ala Gly Val Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr
1 5 10 15
Ile Ala
<210> 128
<211> 22
<212> PRT
<213> Lactobacillus brevis
<400> 128
Thr Tyr Cys Gly Thr Gly Val Ala Thr Asn Gly Ala His Ser Gly Ala
1 5 10 15
Ser Ala Leu Thr Ile Ala
20
<210> 129
<211> 18
<212> PRT
<213> Clostridium phytofermentans
<400> 129
Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr
1 5 10 15
Ile Ala
Claims (89)
- 하기로부터 선택되는 단리된 핵산 분자:
(a) 서열번호 1, 서열번호 2 또는 서열번호 3, 또는 표 4에 언급된 아미노산 서열을 코딩하고, 상기 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하는, 핵산 분자;
(b) 위치 I66에 대응되는 아미노산 치환을 코딩하는 핵산 서열을 포함하며 고 엄격성 혼성화 조건에서 (a)의 핵산에 혼성하는, 핵산 분자; 및
(c) (a) 또는 (b)에 상보적인 핵산 분자. - 제1항에 있어서,
상기 위치 I66에서 아미노산 치환이 표 1, 2 및/또는 3에 기재된 아미노산 치환인, 단리된 핵산 분자. - 제1항 또는 제2항에 있어서,
상기 아미노산 서열이, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 다른 아미노산 변이 위치에서의 아미노산 치환을 하나 이상 포함하는, 단리된 핵산 분자. - 제1항 내지 제3항 중 어느 한 항에 있어서,
상기 아미노산 서열이, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 아미노산 치환을 하나 이상 포함하는, 단리된 핵산 분자. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 하나 이상의 아미노산 치환을 제외한, 아미노산 서열이, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열과 동일하거나 또는 이에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지는, 단리된 핵산 분자. - 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 아미노산 서열이 표 1, 2 및/또는 3에 기재된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함하는, 단리된 핵산 분자. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 아미노산 서열이 표 1, 2 및/또는 3에 기재된 변이체의 아미노산 치환을 포함하는, 단리된 핵산 분자. - 제1항 내지 제7항 중 어느 한 항에 따른 핵산 분자를 포함하는 벡터.
- 제8항에 있어서,
상기 벡터가 발현 벡터인, 벡터. - 제8항 또는 제9항에 있어서,
상기 벡터가 이중 가닥 DNA를 포함하는, 벡터. - 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열을 포함하고,
상기 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하는,
단리된 폴리펩타이드. - 제11항에 있어서,
상기 위치 I66에서의 아미노산 치환이 표 1, 2 및/또는 3에 언급된 아미노산 치환인, 단리된 폴리펩타이드. - 제11항 또는 제12항에 있어서,
상기 아미노산 서열이, 아미노산 위치 I66에 대응되는 치환과 더불어, 표 1, 2 및/또는 3에 언급된 다른 아미노산 변이 위치에서의 아미노산 치환 하나 이상을 포함하는, 단리된 폴리펩타이드. - 제11항 내지 제13항 중 어느 한 항에 있어서,
상기 아미노산 서열이, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 아미노산 치환 하나 이상을 포함하는, 단리된 폴리펩타이드. - 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열을 포함하고,
상기 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하며,
상기 위치 I66에 대응되는 아미노산 치환을 제외한, 아미노산 서열이, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열과 동일하거나 또는 이에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지는,
단리된 폴리펩타이드. - 제15항에 있어서,
상기 위치 I66에서의 아미노산 치환이 표 1, 2 및/또는 3에 언급된 아미노산 치환인, 단리된 폴리펩타이드. - 제15항 또는 제16항에 있어서,
상기 아미노산 서열이, 아미노산 위치 I66에 대응되는 치환과 더불어, 표 1, 2 및/또는 3에 언급된 아미노산 변이 위치에서의 아미노산 치환 하나 이상을 포함하는, 단리된 폴리펩타이드. - 제15항 내지 제17항 중 어느 한 항에 있어서,
상기 아미노산 서열이, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 아미노산 치환 하나 이상을 포함하는, 단리된 폴리펩타이드. - 제15항 내지 제18항 중 어느 한 항에 있어서,
상기 아미노산 서열이 1-100 아미노산 위치들에서 보존적인 아미노산 치환을 더 포함하고, 그 위치가 표 1, 2 및/또는 3에 언급된 하나 이상의 아미노산 치환과는 다른 위치인, 단리된 폴리펩타이드. - 제11항 내지 제19항 중 어느 한 항에 있어서,
상기 표 1, 2 및/또는 3에 언급된 하나 이상의 아미노산 치환을 제외한, 아미노산 서열이, 모 서열과 비교해 2-300 아미노산 위치들에 변형을 포함하지 않으며, 그 위치가 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열들 중 2, 3, 4 또는 5개의 서열들 간에 동일한 위치들로부터 선택되는, 단리된 폴리펩타이드. - 제11항 내지 제20항 중 어느 한 항에 있어서,
상기 아미노산 서열이 표 1, 2 및/또는 3에 언급된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함하는, 단리된 폴리펩타이드. - 제11항 내지 제21항 중 어느 한 항에 있어서,
상기 아미노산 서열이 표 1, 2 및/또는 3에 언급된 변이체의 아미노산 치환을 포함하는, 단리된 폴리펩타이드. - 제11항 내지 제22항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 알데하이드 데하이드로게나제를 코딩하는, 단리된 폴리펩타이드. - 제11항 내지 제23항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환할 수 있는, 단리된 폴리펩타이드. - 제11항 내지 제23항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있는, 단리된 폴리펩타이드. - 제11항 내지 제25항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 모 폴리펩타이드에 비해 더 높은 활성을 가지는, 단리된 폴리펩타이드. - 제11항 내지 제24항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가지는, 단리된 폴리펩타이드. - 제11항 내지 제24항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 아세틸-CoA에 비해 3-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가지는, 단리된 폴리펩타이드. - 제11항 내지 제23항 또는 제25항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 아세틸-CoA에 비해 4-하이드록시부티릴-CoA에 대해 더높은 특이성을 가지는, 단리된 폴리펩타이드. - 제11항 내지 제25항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 세포 또는 세포 추출물에서 부산물을 적게 생성하는, 단리된 폴리펩타이드. - 제30항에 있어서,
상기 부산물이 에탄올 또는 4-하이드록시-2-부타논인, 단리된 폴리펩타이드. - 제11항 내지 제25항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 모 폴리펩타이드와 비교해 더 높은 kcat를 가지는, 단리된 폴리펩타이드. - 제8항 내지 제10항 중 어느 한 항에 따른 벡터를 포함하는 세포.
- 제1항 내지 제7항 중 어느 한 항에 따른 핵산을 포함하는 세포.
- 제34항에 있어서,
상기 핵산 분자가 상기 세포의 염색체에 병합된, 세포. - 제35항에 있어서,
상기 병합이 부위-특이적인, 세포. - 제33항 내지 제36항 중 어느 한 항에 있어서,
상기 핵산 분자가 발현되는, 세포. - 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드를 포함하는 세포.
- 제33항 내지 제38항 중 어느 한 항에 있어서,
상기 세포가 미생물 유기체인, 세포. - 제39항에 있어서,
상기 미생물 유기체가 세균, 효모 또는 진균인, 세포. - 제33항 내지 제38항 중 어느 한 항에 있어서,
상기 세포가 단리된 진핵생물 세포인, 세포. - 제33항 내지 제41항 중 어느 한 항에 있어서,
상기 세포가 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이들의 에스테르 또는 아미드를 생산하는 경로를 포함하는, 세포. - 제33항 내지 제41항 중 어느 한 항에 있어서,
상기 세포가 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이들의 에스테르 또는 아미드를 생산하는 경로를 포함하는, 세포. - 제33항 내지 제43항 중 어느 한 항에 있어서,
상기 세포가 발효가능한, 세포. - 제33항 내지 제44항 중 어느 한 항에 있어서,
상기 폴리펩타이드에 대한 하나 이상의 기질을 더 포함하는, 세포. - 제45항에 있어서,
상기 기질이 3-하이드록시부티릴-CoA인, 세포. - 제46항에 있어서,
상기 기질이 3-하이드록시-(R)-부티릴-CoA인, 세포. - 제46항 또는 제47항에 있어서,
상기 세포가 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가지는, 세포. - 제45항에 있어서,
상기 기질이 4-하이드록시부티릴-CoA인, 세포. - 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드의 생촉매로서의 용도.
- 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드; 및 상기 폴리펩타이드에 대한 하나 이상의 기질을 포함하는, 조성물.
- 제51항에 있어서,
상기 폴리펩타이드가 시험관내 조건에서 상기 기질과 반응할 수 있는, 조성물. - 제51항 또는 제52항에 있어서,
상기 기질이 3-하이드록시부티릴-CoA인, 조성물. - 제53항에 있어서,
상기 기질이 3-하이드록시-(R)-부티릴-CoA인, 조성물. - 제51항 또는 제52항에 있어서,
상기 기질이 4-하이드록시부티릴-CoA인, 조성물. - 제33항 내지 제49항 중 어느 한 항에 따른 세포를 포함하는 배양 배지 (culture medium).
- 제8항 내지 제10항 중 어느 한 항에 따른 벡터를 발효가능한 세포에 도입하는 것을 포함하는, 숙주 균주를 구축하는 방법.
- 제33항 내지 제49항 중 어느 한 항에 따른 세포를 배양하여, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이들의 에스테르 또는 아미드를 생산하는 것을 포함하는,
3-HBal 및/또는 1,3-BDO 또는 이들의 에스테르 또는 아미드의 생산 방법. - 제33항 내지 제49항 중 어느 한 항에 따른 세포를 배양하여, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이들의 에스테르 또는 아미드를 생산하는 것을 포함하는,
4-HBal 및/또는 1,4-BDO 또는 이들의 에스테르 또는 아미드의 생산 방법. - 제58항 또는 제59항에 있어서,
상기 세포가 실질적으로 혐기성 배양 배지에 존재하는, 방법. - 제58항 내지 제60항 중 어느 한 항에 있어서,
3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 또는 이들의 에스테르 또는 아미드를 단리 또는 정제하는 것을 더 포함하는, 방법. - 제61항에 있어서,
상기 단리 또는 정제가 증류를 포함하는, 방법. - 생물 유래의 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 배양 배지로서,
상기 생물 유래의 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 대기 이산화탄소 흡수원 (atmospheric carbon dioxide uptake source)을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며,
상기 생물 유래의 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되는, 배양 배지. - 제63항에 있어서,
상기 배양 배지는 상기 세포로부터 분리되는, 배양 배지. - 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며,
3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)이 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되는,
3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO. - 제65항에 있어서,
상기 3-HBal 및/또는 1,3-BDO, 또는 상기 4-HBal 및/또는 1,4-BDO가 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가지는, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO. - 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO).
- 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며,
3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)가 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되고,
상기 3-HBal 및/또는 1,3-BDO가 R 형태에 대해 거울상이성질체 측면에서 농화된,
3-HBal 및/또는 1,3-BDO. - 제68항에 있어서,
상기 3-HBal 및/또는 1,3-BDO가 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가지는, 3-HBal 및/또는 1,3-BDO. - 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되고,
R 형태에 대해 거울상이성질체 측면에서 농화된,
3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO). - 제70항에 있어서,
3-HBal 및/또는 1,3-BDO의 R 형태가 95% 보다 높은, 96% 보다 높은, 97% 보다 높은, 98% 보다 높은, 99% 보다 높은, 99.5% 보다 높은 또는 99.9% 보다 높은 비율을 차지하는, 3-HBal 및/또는 1,3-BDO. - 제68항 내지 제71항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO; 및
3-HBal 및/또는 1,3-BDO, 또는 4-HBal 또는 1,4-BDO 이외의 다른 화합물을 각각 포함하는,
조성물. - 제62항에 있어서,
상기 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO 이외의 다른 화합물이, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 각각 생산하거나 또는 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드를 발현하는 세포의 일부인, 조성물. - 제65항 내지 제71항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 또는
3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 생산하는 세포의 세포용해물 (cell lysate) 또는 배양 상층액을 포함하는,
조성물. - 제65항 내지 제71항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 생산물로서,
상기 생산물이 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 폴리하이드록시알카노에이트, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG), 폴리부틸렌 테레프탈레이트 (PBT), 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 또는 부타다이엔-기재의 생산물인, 생산물. - 제75항에 있어서,
상기 생산물이 화장품 또는 식품 첨가제인, 생산물. - 제75항 또는 제76항에 있어서,
생물 유래의 3-HBal 및/또는 1,3-BDO, 또는 생물 유래의 4-HBal 및/또는 1,4-BDO를 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50%로 포함하는, 생산물. - 제75항 내지 제77항 중 어느 한 항에 있어서,
상기 생산물이 생산된 3-HBal 및/또는 1,3-BDO, 또는 생산된 4-HBal 및/또는 1,4-BDO 중 일부를 반복 단위로 포함하는, 생산물. - 제75항, 제77항 또는 제78항 중 어느 한 항에 따른 생산물을 성형함으로써 수득되는 성형물 (molded product).
- 제75항 내지 제78항 중 어느 한 항에 따른 생산물의 제조 방법으로서,
상기 생산물을 제조하는 반응으로 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 자체적으로 또는 다른 화합물과 화학적으로 반응시키는 것을 포함하는, 제조 방법. - 제79항에 따른 성형물의 제조 방법으로서,
상기 성형물을 제조하는 반응으로 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 자체적으로 또는 다른 화합물과 화학적으로 반응시키는 것을 포함하는, 제조 방법. - 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드에 기질을 제공하고,
상기 기질을 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)로 변환하는 것을 포함하며,
상기 기질이 1,3-하이드록시부티릴-CoA의 라세믹 혼합물인,
3-HBal 및/또는 1,3-BDO, 또는 이들의 에스테르 또는 아미드의 제조 방법. - 제82항에 있어서,
상기 3-HBal 및/또는 1,3-BDO가 R 형태에 대해 거울상이성질체 측면에서 농화된, 방법. - 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드에 기질을 제공하고,
상기 기질을 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)로 변환하는 것을 포함하며,
상기 기질이 1,4-하이드록시부티릴-CoA인,
4-HBal 및/또는 1,4-BDO, 또는 이들의 에스테르 또는 아미드의 제조 방법. - 제82항 내지 제84항 중 어느 한 항에 있어서,
상기 폴리펩타이드가 세포 내 또는 세포용해물 내에 존재하거나, 또는 세포 또는 세포용해물로부터 단리되는, 방법. - 제33항 내지 제49항 중 어느 한 항에 따른 세포의 세포용해물을 인큐베이션하여, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 제조하는 것을 포함하는,
3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 제조 방법. - 제86항에 있어서,
상기 세포용해물을 제2 세포용해물과 혼합하고,
상기 제2 세포용해물이 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드의 기질 또는 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 다운스트림 산물 (downstream product)을 생산하기 위한 효소 활성을 포함하는, 방법. - 세포에서 폴리펩타이드를 발현시키는 것을 포함하는,
제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드의 제조 방법. - 제1항 내지 제7항 중 어느 한 항에 따른 핵산 또는 제4항 내지 제6항 중 어느 한 항에 따른 벡터를 시험관내에서 전사 및 번역하여 폴리펩타이드를 제조하는 것을 포함하는,
제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드의 제조 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862737053P | 2018-09-26 | 2018-09-26 | |
US62/737,053 | 2018-09-26 | ||
US201862740830P | 2018-10-03 | 2018-10-03 | |
US62/740,830 | 2018-10-03 | ||
PCT/US2019/052829 WO2020068900A1 (en) | 2018-09-26 | 2019-09-25 | Aldehyde dehydrogenase variants and methods of using same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210068489A true KR20210068489A (ko) | 2021-06-09 |
Family
ID=68165808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217012341A KR20210068489A (ko) | 2018-09-26 | 2019-09-25 | 알데하이드 데하이드로게나제 변이체 및 이의 이용 방법 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11634692B2 (ko) |
EP (1) | EP3856896A1 (ko) |
KR (1) | KR20210068489A (ko) |
CN (1) | CN113179645A (ko) |
WO (1) | WO2020068900A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110791439B (zh) * | 2019-10-10 | 2022-04-19 | 天津科技大学 | 一株基因工程构建发酵生产苹果酸的重组黑曲霉菌株及应用 |
WO2023069957A1 (en) * | 2021-10-20 | 2023-04-27 | Genomatica, Inc. | Aldehyde dehydrogenase variants and methods of use |
WO2023069952A1 (en) * | 2021-10-20 | 2023-04-27 | Genomatica, Inc. | Aldehyde dehydrogenase variants and methods of use |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1147229A2 (en) | 1999-02-02 | 2001-10-24 | Bernhard O. Palsson | Methods for identifying drug targets based on genomic sequence data |
US7711490B2 (en) | 2001-01-10 | 2010-05-04 | The Penn State Research Foundation | Method and system for modeling cellular metabolism |
US7127379B2 (en) | 2001-01-31 | 2006-10-24 | The Regents Of The University Of California | Method for the evolutionary design of biochemical reaction networks |
US20030059792A1 (en) | 2001-03-01 | 2003-03-27 | Palsson Bernhard O. | Models and methods for determining systemic properties of regulated reaction networks |
US20030224363A1 (en) | 2002-03-19 | 2003-12-04 | Park Sung M. | Compositions and methods for modeling bacillus subtilis metabolism |
JP2005521929A (ja) | 2002-03-29 | 2005-07-21 | ジェノマティカ・インコーポレイテッド | ヒト代謝モデルおよび方法 |
US7856317B2 (en) | 2002-06-14 | 2010-12-21 | Genomatica, Inc. | Systems and methods for constructing genomic-based phenotypic models |
EP1532516A4 (en) | 2002-07-10 | 2007-05-23 | Penn State Res Found | METHOD FOR DETERMINING GENE KNOCKOUT STRATEGIES |
JP4528624B2 (ja) * | 2002-09-27 | 2010-08-18 | ディーエスエム アイピー アセッツ ビー.ブイ. | アルデヒドデヒドロゲナーゼ遺伝子 |
WO2004035009A2 (en) | 2002-10-15 | 2004-04-29 | The Regents Of The University Of California | Methods and systems to identify operational reaction pathways |
BRPI0808988A2 (pt) | 2007-03-16 | 2011-11-08 | Genomatica Inc | micro-organismos e métodos para a produção de 1,4-butanodiol (1,4-bdo) |
US7947483B2 (en) | 2007-08-10 | 2011-05-24 | Genomatica, Inc. | Methods and organisms for the growth-coupled production of 1,4-butanediol |
CN101978042B (zh) | 2008-01-22 | 2017-03-08 | 基因组股份公司 | 利用合成气或其它气态碳源和甲醇的方法和有机体 |
CA2735883C (en) | 2008-09-10 | 2020-05-05 | Genomatica, Inc. | Microorganisms for the production of 1,4-butanediol |
KR102302146B1 (ko) | 2009-04-30 | 2021-09-14 | 게노마티카 인코포레이티드 | 1,3-부탄다이올 생산 유기체 |
US20100305519A1 (en) | 2009-06-02 | 2010-12-02 | Becton, Dickinson And Company | Cannula having an overlapping cannula feature and notch feature |
US8129169B2 (en) | 2009-06-04 | 2012-03-06 | Genomatica, Inc. | Microorganisms for the production of 1,4-butanediol and related methods |
CN105441374A (zh) | 2009-10-13 | 2016-03-30 | 基因组股份公司 | 生产1,4-丁二醇、4-羟基丁醛、4-羟基丁酰-coa、腐胺和相关化合物的微生物及其相关方法 |
WO2012018624A2 (en) | 2010-07-26 | 2012-02-09 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of aromatics, 2,4-pentadienoate and 1,3-butadiene |
AU2012273177A1 (en) * | 2011-06-22 | 2013-05-02 | Genomatica, Inc. | Microorganisms for producing 1,3-butanediol and methods related thereto |
CN103917651A (zh) | 2011-09-08 | 2014-07-09 | 基因组股份公司 | 用于生产1,3-丁二醇的真核生物和方法 |
GB201206192D0 (en) | 2012-04-05 | 2012-05-23 | Tdeltas Ltd | Ketone bodies and ketone body esters and for maintaining or improving muscle power output |
EP2855687B1 (en) | 2012-06-04 | 2020-04-22 | Genomatica, Inc. | Microorganisms and methods for production of 4-hydroxybutyrate, 1,4-butanediol and related compounds |
US20140371417A1 (en) | 2013-04-26 | 2014-12-18 | Genomatica, Inc. | Microorganisms and methods for production of 4-hydroxybutyrate, 1,4-butanediol and related compounds |
WO2014190251A1 (en) | 2013-05-24 | 2014-11-27 | Genomatica, Inc. | Microorganisms and methods for producing (3r)-hydroxybutyl (3r)-hydroxybutyrate |
US20160138049A1 (en) * | 2013-06-10 | 2016-05-19 | The Regents Of The University Of California | OXYGEN-TOLERANT CoA-ACETYLATING ALDEHYDE DEHYDROGENASE CONTAINING PATHWAY FOR BIOFUEL PRODUCTION |
JP2020515255A (ja) * | 2017-03-31 | 2020-05-28 | ジェノマティカ, インコーポレイテッド | アルデヒドデヒドロゲナーゼバリアントおよび使用の方法 |
-
2019
- 2019-09-25 CN CN201980077426.8A patent/CN113179645A/zh active Pending
- 2019-09-25 KR KR1020217012341A patent/KR20210068489A/ko active Search and Examination
- 2019-09-25 US US17/280,181 patent/US11634692B2/en active Active
- 2019-09-25 EP EP19783867.5A patent/EP3856896A1/en active Pending
- 2019-09-25 WO PCT/US2019/052829 patent/WO2020068900A1/en unknown
-
2023
- 2023-03-28 US US18/191,774 patent/US20230416698A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN113179645A (zh) | 2021-07-27 |
US20230416698A1 (en) | 2023-12-28 |
EP3856896A1 (en) | 2021-08-04 |
WO2020068900A1 (en) | 2020-04-02 |
US11634692B2 (en) | 2023-04-25 |
US20210348134A1 (en) | 2021-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102645531B1 (ko) | 알데하이드 데하이드로게나제 변이체 및 사용 방법 | |
US9657316B2 (en) | Microorganisms and methods for enhancing the availability of reducing equivalents in the presence of methanol, and for producing 1,4-butanediol related thereto | |
US20230416698A1 (en) | Aldehyde dehydrogenase variants and methods of using same | |
US20230139515A1 (en) | 3-hydroxybutyryl-coa dehydrogenase variants and methods of use | |
US20220403420A1 (en) | Microorganisms and methods for increasing co-factors | |
US20190085303A1 (en) | Methanol dehydrogenase fusion proteins | |
KR20230003072A (ko) | 조작된 효소 및 이의 이용 및 제조 방법 | |
WO2023069952A1 (en) | Aldehyde dehydrogenase variants and methods of use | |
WO2023069957A1 (en) | Aldehyde dehydrogenase variants and methods of use | |
US20230287435A1 (en) | Microorganisms and methods for reducing by-products | |
WO2022217064A2 (en) | Phosphoketolase variants and methods of use | |
WO2023034745A2 (en) | Formate dehydrogenase variants and methods of use |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |