KR20210068489A - 알데하이드 데하이드로게나제 변이체 및 이의 이용 방법 - Google Patents

알데하이드 데하이드로게나제 변이체 및 이의 이용 방법 Download PDF

Info

Publication number
KR20210068489A
KR20210068489A KR1020217012341A KR20217012341A KR20210068489A KR 20210068489 A KR20210068489 A KR 20210068489A KR 1020217012341 A KR1020217012341 A KR 1020217012341A KR 20217012341 A KR20217012341 A KR 20217012341A KR 20210068489 A KR20210068489 A KR 20210068489A
Authority
KR
South Korea
Prior art keywords
bdo
hbal
amino acid
cell
polypeptide
Prior art date
Application number
KR1020217012341A
Other languages
English (en)
Inventor
아밋 샤
조셉 워너
Original Assignee
게노마티카 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 게노마티카 인코포레이티드 filed Critical 게노마티카 인코포레이티드
Publication of KR20210068489A publication Critical patent/KR20210068489A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/02Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/01003Aldehyde dehydrogenase (NAD+) (1.2.1.3)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

본 발명은 알데하이드 데하이드로게나제 변이체의 폴리펩타이드 및 코딩 핵산을 제공한다. 또한, 본 발명은 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 제공한다. 또한, 본 발명은, 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 본 발명은 또한 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하는 것을 포함하는, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4- 부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다.

Description

알데하이드 데하이드로게나제 변이체 및 이의 이용 방법
본 출원은 2018년 9월 26일자 미국 가출원번호 62/737,053 및 2018년 10월 3일자 미국 가출원번호 62/740,830에 대한 우선권을 주장하며, 이들 가출원은 그 전체 내용이 원용에 의해 본 명세서에 포함된다.
하기 가출원 및 국제 출원을 참조하며, 이들 문헌은 그 전체가 원용에 의해 본 명세서에 포함된다: (1) 2017년 3월 31일자 미국 가출원 번호 62/480,194 표제 "알데하이드 데하이드로게나제 변이체 및 이용 방법" (변호사 사건 번호 12956-408-888); (2) 2017년 3월 31일자 미국 가출원번호 62/480,208 표제 "3-하이드록시부티릴-CoA 데하이드로게나제 변이체 및 이용 방법" (변호사 사건 번호 12956-409-888); (3) 2017년 3월 31일자 미국 가출원 번호 62/480,270 표제 "발효 브로스로부터 1.3-부탄다이올을 수득하는 방법 및 시스템" (변호사 사건 번호 12956-407-888); (4) 2018년 3월 29일자 국제 특허 출원 번호 PCT/US2018/025122 표제 "알데하이드 데하이드로게나제 변이체 및 이용 방법" (변호사 사건 번호 12956-408-228); (5) 2018년 3월 29일자 국제 특허 출원 번호 PCT/US2018/025086 표제 "3-하이드록시부티릴-CoA 데하이드로게나제 변이체 및 이용 방법" (변호사 사건 번호 12956-409-228); 및 (6) 2018년 3월 29일자 국제 출원 번호 PCT/US2018/025068 표제 "발효 브로스로부터 1,3-부탄다이올 수득 방법 및 시스템" (변호사 사건 번호 12956-407-228).
본 출원은 2019년 9월 17일자로 생성된 서열목록을 498,106 바이트 크기의 파일명 "12956-462-228_SL.TXT" ASCII 문서 파일로서 원용에 의해 본 명세서에 포함한다.
본 발명은 일반적으로 원하는 산물을 생산하도록 조작된 유기체, 원하는 산물의 생산을 촉진하는 조작된 효소에 관한 것이며, 보다 상세하게는 3-하이드록시부티르알데하이드, 1,3-부탄다이올, 4-하이드록시부티르알데하이드, 1,4-부탄다이올 및 이와 관련된 산물과 같은 원하는 산물을 생산하는 효소 및 세포, 그리고 이로부터 유래되는 생산물에 관한 것이다.
다양한 범용 화학제 (commodity chemical)들이 상업적인 용도를 가진 원하는 제품을 제조하는데 사용된다. 다수의 범용 화학제들은 석유로부터 유래한다. 이러한 범용 화학제들은 용매, 수지, 폴리머 전구체 및 특수 화학제로서의 용도를 비롯하여 다양한 용도들을 가진다. 바람직한 범용 화학제로는 4-탄소 분자, 예를 들어, 1,4-부탄다이올 및 1,3-부탄다이올, 업스트림 전구체 및 다운스트림 산물 등이 있다. 석유계 제품에 대한 재생가능한 원료를 공급하고 에너지 및 자본 집약성이 낮은 공정을 제공하기 위한, 범용 화학제의 제조 방법에 대한 개발이 요망되고 있다.
따라서, 원하는 생산물을 용이하게 제조하는 방법이 요구되고 있다. 본 발명은 이러한 요구를 충족시키며, 관련 이점 역시 제공한다.
본 발명은 알데하이드 데하이드로게나제 변이체의 폴리펩타이드 및 코딩 핵산을 제공한다. 또한, 본 발명은 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 제공한다. 또한, 본 발명은, 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이들의 에스테르 또는 아미드 화합물의 제조 방법을 제공한다. 또한, 본 발명은, 알데하이드 데하이드로게나제 변이체를 발현하는 세포를 배양하거나 또는 이러한 세포의 세포용해물을 이용하는 것을 포함하는, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이들의 에스테르 또는 아미드 화합물의 제조 방법을 제공한다.
도 1은 알데하이드 데하이드로게나제를 포함하는 1,3-부탄다이올 (1,3-BDO) 경로의 예를 도시한다. 도 1은 아세토아세틸-CoA에서부터 1,3-부탄다이올까지의 경로를 나타낸다. 효소는 다음과 같다: (A) 아세토아세틸-CoA 리덕타제 (CoA-의존적인, 알데하이드 형성); (B) 3-옥소부티르알데하이드 리덕타제 (케톤 환원); (C) 3-하이드록시부티르알데하이드 리덕타제, 본원에서 1,3-부탄다이올 데하이드로게나제로도 지칭됨; (D) 아세토아세틸-CoA 리덕타제 (CoA-의존적인, 알코올 형성); (E) 3-옥소부티르알데하이드 리덕타제 (알데하이드 환원); (F) 4-하이드록시, 2-부타논 리덕타제; (G) 아세토아세틸-CoA 리덕타제 (케톤 환원); (H) 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성), 본원에서 또한 3-하이드록시부티르알데하이드 데하이드로게나제로도 지칭됨; 및 (I) 3-하이드록시부티릴-CoA 리덕타제 (알코올 형성).
도 2는 알데하이드 데하이드로게나제를 포함하는 1,4-부탄다이올 (1,4-BDO) 경로의 예를 도시한다. 생합성 반응의 촉매 효소는 다음과 같다: (1) 숙시닐-CoA 신테타제; (2) CoA-비의존적인 숙시닉 세미알데하이드 데하이드로게나제; (3) α-케토글루타레이트 데하이드로게나제; (4) 글루타메이트:숙시네이트 세미알데하이드 트랜스아미나제; (5) 글루타메이트 데카르복실라제; (6) CoA-의존적인 숙시닉 세미알데하이드 데하이드로게나제; (7) 4-하이드록시부타노에이트 데하이드로게나제 (4-하이드록시부티레이트 데하이드로게나제로도 지칭됨); (8) α-케토글루타레이트 데카르복실라제; (9) 4-하이드록시부티릴 CoA:아세틸-CoA 트랜스퍼라제; (10) 부티레이트 키나제 (4-하이드록시부티레이트 키나제로도 지칭됨); (11) 포스포트랜스부티릴라제 (포스포-트랜스-4-하이드록시부티릴라제로도 지칭됨); (12) 알데하이드 데하이드로게나제 (4-하이드록시부티릴-CoA 리덕타제로도 지칭됨); (13) 알코올 데하이드로게나제 (4-하이드록시부타날 리덕타제 또는 4-하이드록시부티르알데하이드 리덕타제로도 지칭됨).
도 3은 ALD-1, ALD-2 및 ALD-3의 서열을 정렬하여 도시한 것이다. 서열은 각각 서열번호 1, 2 및 3이다. 도에서 밑줄친 부분은 첫번째는 A로 두번째는 B로 표시된 루프 영역 2곳이며, 이 부위는 본원에서 확인된 바와 같이 기질 특이성 및 거울상 이성질체 특이성에 관여한다. ALD-1에서 루프 A는 서열 LQKNNETQEYSINKKWVGKD (서열번호 124)이고, ALD-2에서는 서열 IGPKGAPDRKFVGKD (서열번호 125)이고, ALD-3에서는 서열 ITPKGLNRNCVGKD (서열번호 126)이다. ALD-1에서 루프 B는 서열 SFAGVGYEAEGFTTFTIA (서열번호 127)이고, ALD-2에서는 서열 TYCGTGVATNGAHSGASALTIA (서열번호 128)이고, ALD-3에서는 서열 SYAAIGFGGEGFCTFTIA (서열번호 129)이다. ALD-2의 기질 특이성 루프 A와 B는 서열 및 길이가 ALD-1 및 ALD-3의 것과는 다르지만; 그럼에도 불구하고, 정렬하였을 때, 특히 도 6에 도시된 바와 같이 3D 모델링과 연계하였을 경우, 본원에 언급된 치환에 해당하는 위치를 쉽게 동정할 수 있는 충분한 보존성이 확인된다. ALD-3는 결정 구조를 모델링하는 주형으로 사용하였으며; 특히 본원에 기술된 예시적인 치환으로의 변환시, 상호작용하여 기질 특이성 및 거울상이성질체 특이성에 영향을 주는 루프 영역 2곳을 도시한 도 6을 참조한다. ALD-1과 ALD-3의 동일성은 51.9%이다. ALD-1과 ALD-2의 동일성은 35.9%이다. ALD-3와 ALD-2의 동일성은 40%이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 A에 대한 컨센서스는 IXPKG-----XXNRKXVGKD (서열번호 5)이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 B에 대한 컨센서스는 SYAGXGXXXE----GFXTFTIA (서열번호 6)이다. 컨센서스 서열에서 특이적으로 동정된 아미노산은 보존적인 잔기이고, 여기서 "X"로 표시된 위치는 가변적임을 의미하며, 본원에 기술된 바람직한 임의의 아미노산에 해당할 수 있는 것으로, 이해된다. "---"은 아미노산 잔기들이 가변적인 개수로 존재하거나 또는 존재하는 않는 의미일 수 있는 것으로 추가로 이해된다. 이러한 가변적인 개수의 아미노산 잔기들의 예를 도 3 및 4a-4c에 나타낸다. 나아가, 컨센서스 서열에서 보존적인 잔기는 예를 들어 본원에 기술된 바와 같이 보존적인 아미노산으로 치환될 수 있는 것으로 이해된다 (예, 도 4a-4c 참조).
도 4a-4c는 예시적인 알데하이드 데하이드로게나제 (ALD)들을 정렬한 것으로, 도시된 정렬은 본 발명의 치환이 수행될 수 있는 각 주형 ALD 서열에서의 위치에 대응되는 ALD 위치를 식별하는 것을 보여준다. 도 3에서와 같이, 밑줄 친 부분은 2개의 루프 영역, 즉 A로 명명된 첫번째 것과 B로 명명된 두번째 것으로, 이 둘다 본원에서 확인된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. 도 4a는 ALD-1에 대해 컷오프가 40-55%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4a에 나타낸 바와 같이 서열번호 1 (ALD-1), 13, 20 및 24이다. 도 4b는 ALD-1에 대해 컷오프가 75-90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4b에 나타낸 바와 같이 서열번호 1 (ALD-1), 30, 33 및 37이다. 루프 A와 B는 밑줄 표시된다. 도 4c는 ALD-1에 대해 컷오프가 90%인 예시적인 ALD 서열들을 정렬한 것이다. 이들 서열은 도 4c에 나타낸 바와 같이 서열번호 1 (ALD-1), 38, 40 및 44이다. ALD-1은 서열번호 38, 40 및 44와 각각 99%, 97% 및 95%의 동일성을 가진다. 도 4a-4c는, 본원에 언급된 치환에 대응하는 위치를, ALD-1, 특히 루프 A 및 B 영역, 특히 고도로 보존적인 루프 B 영역에 대해 동일성이 40% 이상인 ALD에서 동정할 수 있음을, 보여준다.
도 5a 및 5b는 다양한 예시적인 알데하이드 데하이드로게나제들의 효소 활성을 나타낸 것이다. 도 5a는 3 하이드록시-(R)-부티르알데하이드 (막대 세트에서 좌측 막대) 및 3 하이드록시-(S)-부티르알데하이드 (막대 세트에서 우측 막대)에 대한 ALD-2, ALD-1 및 ALD-1 변이체의 효소 활성을 보여준다. 도 5b는 3-하이드록시부티르알데하이드의 R 형태 : S 형태의 활성 비율을 도시한다.
도 6a-6c는 알데하이드 데하이드로게나제 959의 구조를 도시한 리본 다이아그램이다. 다이아그램은 3-하이드록시-(R)-부티르알데하이드 (도 6a) 또는 3-하이드록시-(S)-부티르알데하이드 (도 6b)가 959의 구조에 도킹하는 방식을 보여준다. 도 6c는 3-하이드록시-(R)-부티르알데하이드 (R3HB)와 동일한 배향성 (orientation)을 나타낸 것이다.
본 발명은 원하는 특성을 가지고 있으며 원하는 생산물을 제조하는데 이용가능한 효소 변이체에 관한 것이다. 특정 구현예에서, 본 발명은, 자연에서 생성되는 야생형 효소와 비교해, 특히 다른 구조적 및/또는 기능적 특징을 가진, 효소 변이체, 즉 알데하이드 데하이드로게나제 변이체에 관한 것이다. 즉, 본 발명의 알데하이드 데하이드로게나제는 자연적으로 생성되는 효소가 아니다. 이러한 본 발명의 알데하이드 데하이드로게나제 변이체는, 원하는 생산물을 생산하도록 조작된 미생물 유기체와 같은 조작된 세포에서 이용가능하다. 예를 들어, 본원에 기술된 바와 같이, 대사 경로를 가진 미생물 유기체와 같은 세포는 원하는 생산물을 생산할 수 있다. 원하는 특징을 가진 본 발명의 알데하이드 데하이드로게나제는, 원하는 생산물을 생산하기 위해 알데하이드 데하이드로게나제 효소 활성을 이용하는 대사 경로를 가진, 미생물 유기체와 같은 세포에 도입될 수 있다. 이러한 알데하이드 데하이드로게나제 변이체는 시험관내에서 바람직한 반응을 수행하기 위한 생촉매로서 부가적으로 유용하다. 즉, 본 발명의 알데하이드 데하이드로게나제 변이체는, 원하는 생산물을 생산하기 위해 또는 원하는 생산물을 생산하기 위한 시험관내 생촉매로서, 미생물 유기체와 같은 조작된 세포에서 이용할 수 있다.
본원에서, 용어 "비-천연성"은, 본 발명의 세포, 미생물 유기체 또는 미생물에 사용되는 경우, 세포가 언급된 종의 야생형 균주를 비롯해, 언급된 종의 천연 균주에서 정상적으로 발견되지 않는 하나 이상의 유전자 변형을 가지는 것을 의미하는 것으로 의도된다. 유전자 변형으로는, 예를 들어, 대사 폴리펩타이드를 코딩하는 발현가능한 핵산을 도입하는 변형, 그외 핵산 부가, 핵산 결손 및/또는 세포 유전 물질의 그외 기능적인 파괴 등이 있다. 이러한 변형은, 예를 들어, 언급된 종들에 대해 이종의 폴리펩타이드, 상동적인 폴리펩타이드 또는 이종의 폴리펩타이드와 상동적인 폴리펩타이드에 대한, 코딩 영역 및 이의 기능성 단편을 포함한다. 부가적인 변형으로는, 예를 들어, 변형이 유전자 또는 오페론의 발현을 달라지게 하는, 비-코딩 조절 영역을 포함한다. 대사 폴리펩타이드의 예로는 원하는 생산물을 생산하기 위한 생합성 경로에 속하는 효소 또는 단백질 등이 있다.
대사 변형은 생화학적 반응이 자연 생성되는 상태로부터 변형되는 것을 의미한다. 즉, 비-천연성 세포는 대사 폴리펩타이드 또는 이의 기능성 단편을 코딩하는 핵산에 유전자 변형을 가질 수 있다. 대사 변형의 예들은 본원에 기술되어 있다.
본원에서, 세포 또는 미생물 유기체를 언급할 때 사용되는 용어 "단리된"은, 만일 이러한 세포가 자연에서 발견된다면, 언급된 세포가 자연에서 발견되는 바와 같이 하나 이상의 성분이 실질적으로 없는 세포를 의미하는 것으로 의도된다. 이 용어는 자연 환경에서 발견되는 성분들 중 일부 또는 전체가 제거된 세포를 포함한다. 또한, 이 용어는 세포가 비-천연성 환경에서 발견되는 성분들 일부 또는 전부가 제거된 세포도 포함한다. 즉, 단리된 세포는, 자연에서 발견되거나 또는 비-천연성 환경에서 증식, 보관 또는 유지되는 바와 같이 다른 물질들로부터 부분적으로 또는 완전히 분리된다. 단리된 세포에 대한 구체적인 예로는 부분적으로 순수한 세포, 실질적으로 순수한 세포 및 비-천연성 배지에서 배양된 세포 등이 있다.
본원에서, 용어 "미생물 (microbial)", "미생물 유기체" 또는 "미생물 (microorganism)"은 고세균, 박테리아 또는 진핵생물류 범위에 속하는 미시 세포로서 존재하는 모든 유기체를 의미한다. 즉, 이 용어는 미시적인 크기의 원핵생물 또는 진핵생물 세포 또는 유기체를 포괄하며, 모든 종의 박테리아, 고세균류 및 유박테리아 (eubacteria)뿐 아니라 효모 및 진균과 같은 진핵 미생물을 포함하는 것으로 의도된다. 또한, 이 용어는 생화학적으로 생산하기 위해 배양가능한 임의 종의 세포 배양물을 포함한다.
본원에서, 용어 "CoA" 또는 "코엔자임 A"는, 활성 효소 시스템을 구성하기 위해 다수 효소 (주효소( apoenzyme))들의 활성에 필요한 유기 조인자 또는 보결기 (효소의 비-단백질 영역)를 의미하는 것으로 의도된다. 코엔자임 A는 일부 축합 효소에서 작용하며, 아세틸 또는 기타 아실기를 전달하는 역할을 하고, 지방산 합성 및 산화, 피루베이트 산화 및 기타 아세틸화에 참여한다.
본원에서, 용어 "실질적으로 혐기성"은 배양 또는 생장 조건에 대해 사용되는 경우, 산소의 양이 액체 매질내 용해된 산소 포화도가 약 10% 미만에 해당하는 것을 의미한다. 또한, 이 용어는 산소가 약 1% 미만인 분위기 하에 유지되는 액체 또는 고체 배지가 든 밀폐된 챔버를 포괄하는 것으로 의도된다.
본원에서 "외인성"은 언급된 분자 또는 언급된 활성이 숙주 미생물 유기체에 도입되는 것을 의미하는 것으로 의도된다. 이러한 분자는, 예를 들어, 숙주 염색체 또는 플라스미드와 같은 비-염색체성 유전 물질에의 삽입에 의해서와 같이, 코딩 핵산을 숙주 유전 물질에 도입함으로써, 도입할 수 있다. 따라서, 이 용어는, 코딩 핵산의 발현에서 사용되는 바와 같이, 코딩 핵산을 발현가능한 형태로 미생물 유기체에 도입하는 것을 의미한다. 생합성 활성에서 사용되는 경우, 이 용어는 숙주 참조 유기체에 도입되는 활성을 의미한다. 그 소스는, 예를 들어 숙주 세포에 도입된 후 언급된 활성을 발현하는 동종의 또는 이종의 코딩 핵산일 수 있다. 이에, 용어 "내인성"은 숙주에 존재하는 언급된 분자 또는 활성에 대해 사용된다. 마찬가지로, 이 용어는, 코딩 핵산의 발현에서 사용되는 경우, 세포에 내재된 코딩 핵산의 발현을 의미한다. 용어 "이종"은 언급된 종 이외의 다른 소스로부터 유래되는 분자 또는 활성을 의미하며, "동종"은 숙주 세포로부터 유래되는 분자 또는 활성을 의미한다. 즉, 본 발명의 코딩 핵산의 외인성 발현은 이종 또는 동종의 코딩 핵산 중 어느 하나 또는 둘다를 이용할 수 있다.
2 이상의 외인성 핵산이 세포에 포함되는 경우, 2 이상의 외인성 핵산은 전술한 바와 같이 언급된 코딩 핵산 또는 생합성 활성을 의미하는 것으로 이해된다. 또한, 본원에 기술된 바와 같이, 이러한 2 이상의 외인성 핵산은 숙주 세포에 개별 핵산 분자로, 폴리시스트론 핵산 분자로 또는 이의 조합으로 도입할 수 있으며, 여전히 2 이상의 외인성 핵산으로서 간주할 수 있는 것으로 또한 이해된다. 예를 들어, 본원에 기술된 바와 같이, 세포는 경로 효소 또는 단백질 등의 원하는 효소 또는 단백질을 코딩하는 2종 이상의 외인성 핵산을 발현하도록 조작할 수 있다. 원하는 활성을 코딩하는 2종의 외인성 핵산을 숙주 세포에 도입하는 경우, 이들 2종의 외인성 핵산은 단일 핵산으로서, 예를 들어 단일 플라스미드 형태로 또는 분리된 플라스미드 형태로 도입할 수 있으며, 숙주 염색체에서 한 부위 또는 여러 부위에 병합될 수 있으며, 여전히 2종의 외인성 핵산으로 간주되는 것으로 이해된다. 마찬가지로, 3종 이상의 외인성 핵산을, 숙주 유기체에 임의의 원하는 조합으로, 예를 들어 하나의 플라스미드로, 각각의 개별 플라스미드로 도입할 수 있으며, 숙주 염색체에 한 위치 또는 여러 위치에 삽입할 수 있으며, 여전히 2 이상의 외인성 핵산, 예를 들어 3종의 외인성 핵산으로 간주되는 것으로 이해된다. 즉, 언급된 외인성 핵산 또는 생합성 활성의 개수는 숙주 유기체에 도입되는 분리된 핵산의 개수를 지칭하는 것이 아니라, 코딩 핵산의 개수 또는 생합성 활성의 개수를 지칭한다.
본원에서, 용어 "유전자 파괴" 또는 이의 문법상 동의어는 코딩 유전자 산물을 불활성화하거나 또는 감쇠시키는 유전자 변형을 의미하는 것으로 의도된다. 유전자 변형은, 예를 들어, 유전자 전체의 결손, 전사 또는 번역에 필수적인 조절 서열의 결손, 절단된 유전자 산물 (truncated gene product)을 만드는 유전자의 일부 결손이거나, 또는 코딩된 유전자 산물을 불활성화 또는 감쇠시키는 임의의 다양한 돌연변이 전략에 의한 것일 수 있다. 유전자를 파괴하기 위해 특히 이용가능한 방법은 완전한 유전자 결손 (complete gene deletion)이며, 그 이유는 본 발명의 비-천연성 세포에서 유전자 복귀 (genetic reversion) 가능성 줄이거나 또는 없애기 때문이다. 또한, 유전자 파괴는, 유전자 또는 유전자 함유 영역에서 유전자를 RNA로 전사되지 않게 하거나 및/또는 기능성 유전자 산물로 번역되지 않게 만드는 돌연변이를 의미하는, null 돌연변이를 포함한다. 이러한 null 돌연변이는, 예를 들어, 불활성화 점 돌연변이, 유전자 일부 결손, 유전자 전체 결손 또는 염색체 세그먼트의 결손 등의, 여러가지 타입의 돌연변이로부터 발생할 수 있다.
본원에서, 용어 "증식-연계된 (growth-coupled)"은, 생화학적 생산물의 제조에 대해 사용되는 경우, 언급된 생화학적 생산물의 생합성이 미생물의 증식 단계 중에 이루어지는 것을 의미한다. 특정 구현예에서, 증식-연계된 생산은 필수일 수 있으며, 이는 언급된 생화학적 생산물의 생합성이 미생물의 증식 단계 동안에 생산되는 필수 생산물 (obligatory product)이라는 것을 의미한다.
본원에서, 용어 "감쇠시킨다 (attenuate)" 또는 이의 문법상 동의어는 효소 또는 단백질의 활성 또는 양을 감소시키는, 낮추는 또는 없애는 것을 의미하는 것으로 의도된다. 효소 또는 단백질의 활성 또는 양적 감쇠는, 감쇠를 통해 활성 또는 양이 소정의 기능에 필요한 임계 수준 미만으로 저하된다면, 완전한 파괴 (complete disruption)를 모방할 수 있다. 그러나, 완전한 파괴, 예를 들어 하나의 경로에 대한 완전한 파괴를 모방하는 효소 또는 단백질의 활성 또는 양적 감쇠는, 별개의 경로를 계속 작동시키기에는 여전히 충분할 수 있다. 예를 들어, 내인성 효소 또는 단백질의 감쇠가 본 발명의 원하는 생산물을 생산하기 위해 동일한 효소 또는 단백질의 완전한 파괴를 모방하기에 충분할 순 있지만, 효소 또는 단백질의 잔류 활성 또는 양은 숙주 세포가 생존, 재생 또는 증식하는데 필요한 경로 등의 다른 경로를 유지시키기에는 여전히 충분할 수 있다. 또한, 효소 또는 단백질의 감쇠는 본 발명의 원하는 생산물의 수율을 높이기에 충분한 수준으로 효소 또는 단백질의 활성 또는 양적 감소, 저하 또는 소실일 수 있으며, 효소 또는 단백질의 완전한 파괴를 반드시 모방하는 것은 아니다.
본 발명의 비-천연성 세포는 안정적인 유전자 변형을 포함할 수 있는데, 이는 이러한 변형을 상실하지 않으면서 5 세대 이상 배양가능한 세포를 의미한다. 일반적으로, 안정적인 유전자 변형은 10 세대 이상 유지되는 변형을 포함하며, 특히 안정적인 변형은 약 25 세대 이상 유지될 것이며, 보다 구체적으로는 안정적인 유전자 변형은 50 세대 이상, 예를 들어 무한정 유지될 것이다.
유전자 파괴의 경우, 특히 유용한 안정적인 변형은 유전자 결손이다. 안정적인 유전자 변형 도입에 유전자 결손을 이용하는 것이, 특히 유전자 변형되기 이전의 표현형으로 복구될 가능성을 낮추기 위해 유용하다. 예를 들어, 안정적인 증식-연계된 생화합물의 생산은, 예를 들어, 대사 변형 세트에 포함된 하나 이상의 반응을 촉매하는 효소에 대한 코딩 유전자를 결손시킴으로써, 달성할 수 있다. 증식-연계된 생화합물의 생산 안정성은, 각각의 파괴된 활성에 대한 복수의 보완적인 복구 (compensatory reversion) 발생 가능성을 현저하게 낮추는, 복수의 결손을 통해 추가적으로 높일 수 있다.
당해 기술 분야의 당업자라면, 본원에 예시된 대사 변형을 포함한 유전자 변형은, E. coli와 같은 적절한 숙주 세포 또는 유기체 및 이의 대응되는 대사 반응 또는 원하는 대사 경로를 위한 유전자 등의, 바람직한 유전 물질에 적합한 소스 세포 또는 유기체에 대해 기술됨을, 이해할 것이다. 그러나, 매우 다양한 유기체들에서 전체 게놈 서열 분석 및 게놈학 분야의 높은 기술 수준을 감안하면, 당해 기술 분야의 당업자라면 본원에 기술된 교시 내용 및 지침을 기본적으로 다른 모든 유기체들에도 적용할 수 있음을 쉽게 알 것이다. 예를 들어, 본원에 예시된 E. coli의 대사 변형은 언급된 종이 아닌 다른 종 유래의 동일한 또는 유사한 코딩 핵산을 병합함으로써, 다른 종에도 쉽게 적용할 수 있다. 이러한 유전자 변형으로는, 예를 들어 일반적으로 종 상동체 (species homolog)의 유전자 변형 등이 있으며, 구체적으로 오르소로그 (ortholog), 파라로그 (paralog) 또는 비-오르소로그 유전자 치환 (non-orthologous gene displacement)을 포함한다.
오르소로그는, 수직 직계 (vertical descent) 관계이면서 여러가지 유기체들에서 실질적으로 동일하거나 상동한 기능을 담당하는, 유전자 또는 유전자들이다. 예를 들어, 마우스 에폭사이드 하이드롤라제와 인간 에폭사이드 하이드롤라제는 에폭사이드는 에폭사이드의 가수분해라는 생물학적 기능 측면에서 오르소로그로 간주할 수 있다. 예를 들어, 유전자들이 상동적이거나 또는 공통 조상으로부터 진화적으로 관련있는 것으로 보기에 충분한 서열 유사성을 공유하는 경우, 이들 유전자들은 수직 직계 관계이다. 또한, 유전자가, 3차 구조를 공유하지만, 1차 서열 유사성이 확인불가한 수준으로 공통 조상으로부터 진화된 것임을 의미하는 충분한 수준의 서열 유사성을 반드시 가지고 있지 않은 경우에도, 오르소로그로 간주할 수 있다. 오르소로그 유전자들은 아미노산 서열 아이덴터티 약 25% 내지 100%의 서열 유사성을 가진 단백질을 코딩할 수 있다. 25% 미만의 아미노산 유사성을 공유하는 단백질을 코딩하는 유전자들 역시, 이들의 3차원 구조에 유사성이 있다면, 수직 직계에 의해 생겨난 것으로 간주할 수 있다. 조직 플라스미노겐 활성인자 및 엘라스타제 등의 세린 프로테아제 패밀리 효소에 속하는 구성원들은 공통 조상으로부터 수직 직계에 의해 생겨난 것으로 간주된다.
오르소로그는, 예를 들어, 진화를 통해 구조적으로 또는 전체 활성 측면에서 분화된 유전자 또는 이로 코딩되는 유전자 산물을 포함한다. 예를 들어, 어떤 종이 2가지 기능을 나타내는 유전자 산물을 코딩하고 있으며 이 기능들이 제2의 종에서 별개의 유전자들로 분리되어 있다면, 이들 유전자 3개와 이의 대응되는 산물은 오르소로그로 간주한다. 당해 기술 분야의 당업자라면, 생화학적 산물 생산시, 비-천연성 세포를 구축하기 위해 도입 또는 파괴시킬 대사 활성을 가지고 있는 오르소로그 유전자를 선택해야 함을, 알 것이다. 분리가능한 활성들을 나타내는 오르소로그의 예는, 개개 활성이 2종 이상의 종들에서 또는 하나의 종에서 개별 유전자 산물로 분리되어 있는 경우이다. 구체적인 예는, 세린 프로테아제 활성을 가진 2가지 타입, 즉 엘라스타제 단백질 분해 활성과 플라스미노겐 단백질 분해 활성이, 플라스미노겐 활성인자 및 엘라스타제로서 개별 분자로 분리된 경우이다. 두 번째 예는, 마이코플라스마 5'-3' 엑소뉴클레아제 및 드로소필라 DNA 중합효소 III 활성이 분리된 경우이다. 첫 번째 종 유래의 DNA 중합효소는, 2번째 종 유래의 엑소뉴클레아제 또는 중합효소 중 어느 하나 또는 이들 둘다에 대해 오르소로그인 것으로 간주할 수 있으며, 그 역도 성립할 수 있다.
이와는 반대로, 파라로그는, 예를 들어, 복제 및 이후 진화적 분화 관계에 있는 상동체이며, 기능이 유사하거나 또는 공통적이지만, 동일하진 않다. 파라로그는, 예를 들어, 동일 종 또는 다른 종으로부터 기원하거나 또는 유래할 수 있다. 예를 들어, 마이크로솜 에폭사이드 하이드롤라제 (에폭사이드 하이드롤라제 I)와 가용성 에폭사이드 하이드롤라제 (에폭사이드 하이드롤라제 II)는, 이들이 별개의 반응을 촉매하고 동일 종에서 다른 기능을 가지고 있는, 공통 조상으로부터 함께 진화된 2종의 별개의 효소이므로, 파라로그로 간주할 수 있다. 파라로그는 서로 유의미한 수준의 서열 유사성을 보이는 동일한 종으로부터 유래된 단백질들이므로, 이들은 상동적이거나 또는 공통 조상으로부터 함께 진화된 관계임을 시사한다. 파라로그 단백질 패밀리 그룹으로는 HipA 상동체, 루시퍼라제 유전자, 펩티다제 등이 있다.
비-오르소로그 유전자 치환 (nonorthologous gene displacement)은 어떤 종 유래의 비-오르소로그 유전자가 다른 종에서 언급된 유전자의 기능을 치환할 수 있는 것을 의미한다. 치환은, 예를 들어 여러가지 종들에서 언급된 기능과 비교해, 기원 종에서 동일하거나 또는 유사한 작용을 실질적으로 수행할 수 있는 것을 포함한다. 일반적으로, 비-오르소로그 유전자 치환은 언급된 기능을 코딩하는 공지된 유전자와 구조적으로 관련있는 것으로 구분할 수 있지만, 구조적으로 관련성은 낮지만 기능적으로 유사한 유전자 및 이의 유전자 산물도 그럼에도 불구하고 여전히 본 발명에 사용되는 용어의 의미에 포함될 것이다. 기능 유사성에는, 예를 들어 치환하고자 하는 기능을 코딩하는 유전자에 대해, 비-오르소로그 유전자 산물의 활성부 또는 결합부에서 어느 정도 이상의 구조 유사성이 요구된다. 따라서, 비-오르소로그 유전자는 예를 들어 파라로그 또는 비-관련 유전자 (unrelated gene)를 포함한다.
이에, 원하는 생산물의 생합성 능력을 갖춘 본 발명의 비-천연성 세포를 동정하고 구축함에 있어, 당해 기술 분야의 당업자는, 본 발명에 제공된 교시 내용 및 지침을 특정 종들에 적용하여, 대사 변형의 식별이 오르소로그의 동정 및 이의 함유 또는 불활성화를 포함할 수 있음을 알 것이다. 당해 기술 분야의 당업자라면, 또한, 파라로그 및/또는 비-오르소로그 유전자 치환이, 유사하거나 또는 실질적으로 유사한 대사 반응을 촉매하는 효소를 코딩하는 언급된 미생물에 존재하는 한, 진화 관계인 유전자들을 이용할 수 있다. 마찬가지로, 유전자를 파괴하는 경우, 진화 관계인 유전자들도 숙주 세포에서 파괴 또는 결손시켜, 파괴에 표적이 되는 효소 활성들의 기능적 중복성 (functional redundancy)을 줄이거나 또는 없앨 수 있다.
오르소로그, 파라로그 및 비-오르소로그 유전자 치환은 당해 기술 분야의 당업자에게 널리 공지된 방법으로 결정할 수 있다. 예를 들어, 2종의 폴리펩타이드에 대한 핵산 또는 아미노산 서열을 조사함으로써, 비교 서열들 간의 서열 동일성 및 유사성을 확인한다. 이러한 유사성을 토대로, 당해 기술 분야의 당업자는 이들 단백질들이 공통 조상으로부터 진화된 관계임을 의미할 만큼 유사성이 충분히 높은지를 결정할 수 있다. 당해 기술 분야의 당업자들에게 널리 공지된 알고리즘, 예를 들어 Align, BLAST, Clustal W 등으로 원 (raw) 서열의 유사성 또는 동일성을 비교 및 확인하고, 또한, 서열에서 갭의 존재나 유의 수준을 결정하여, 가중치 (weight) 또는 스코어를 할당할 수 있다. 이들 알고리즘은 또한 당해 기술 분야에 공지되어 있으며, 뉴클레오타이드 서열 유사성 또는 동일성 결정에 마찬가지로 적용가능하다. 관계 (relatedness)를 정할 만큼 충분한 유사성에 대한 매개변수들은, 널리 공지된 통계학적 유사성 계산법, 또는 랜덤 폴리펩타이드에서 유사한 매칭을 발견할 확률, 그리고 확인된 매칭의 유의 수준을 토대로 산출한다. 2 이상 서열들에 대한 전산적 비교는, 또한, 필요한 경우, 당해 기술 분야의 당업자에 의해 시각적으로 최적화될 수 있다. 관련 유전자 산물 또는 단백질은 높은 유사성, 예를 들어 25% 내지 100%의 서열 동일성을 가지는 것으로 볼 수 있다. 비-관련 단백질은, 충분한 크기의 데이터베이스를 검색한다면, 우연히 발생할 것으로 예상되는 수준과 기본적으로 동일한, 동일성 (약 5%)을 가질 수 있다. 5% 내지 24% 사이의 서열은, 비교되는 서열들이 관련성이 있다고 판단할 만큼 충분한 상동성을 보이거나 또는 그렇지 않을 수 있다. 데이터 세트의 크기를 감안해 이러한 매칭의 유의 수준을 결정하기 위한 추가적인 통계학적 분석을 수행하여, 이들 서열들의 관련성을 결정할 수 있다.
BLAST 알고리즘을 사용해 2 이상의 서열들의 관계를 확인하기 위한 매개변수의 예는, 다음과 같을 수 있다. 간략하게는, 아미노산 서열 정렬은 BLASTP 버전 2.0.8 (1999년 1월 5일) 및 하기의 매개변수들을 사용하여 수행할 수 있다: 매트릭스: 0 BLOSUM62; 갭 오픈 (gap open): 11; 갭 연장 (gap extension): 1; x_드롭오프: 50; 예상: 10.0; 문자 크기: 3; 필터: 온 (on). 핵산 서열 정렬은 BLASTN 버전 2.0.6 (1998년 9월 16일) 및 하기의 매개변수들을 사용하여 수행할 수 있다: 매치: 1; 미스매치: -2; 갭 오픈: 5; 갭 연장: 2; x_드롭오프: 50; 예상: 10.0; 문자 크기: 11; 필터: 오프. 당해 기술 분야의 당업자는, 예를 들어 비교시 엄격성을 높이거나 또는 낮추고, 2 이상 서열의 관계를 정하기 위해, 상기한 매개변수에 어떤 변화를 가할 수 있음을 알 것이다.
일 구현예에서, 본 발명은 야생형 또는 모 (parent) 알데하이드 데하이드로게나제의 변이체인 알데하이드 데하이드로게나제를 제공한다. 본 발명의 알데하이드 데하이드로게나제는 아실-CoA를 이의 대응되는 알데하이드로 변환한다. 또한, 이 효소는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 옥시도리덕타제로 지칭할 수도 있다. 이러한 본 발명의 알데하이드 데하이드로게나제는 반응 1.2.1.b, 옥시도리덕타제 (아실-CoA -> 알데하이드)로서 분류할 수 있는데, 여기서 처음 숫자 3개는 기질 특이성과 독립적인 일반적인 변환 타입을 나타내는 효소 위원회 번호 (Enzyme Commission number)에서의 앞에 오는 숫자 3개이다. 본 발명의 알데하이드 데하이드로게나제의 효소 변환의 예로는, 비-제한적으로, 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드 (3-HBal로도 지칭됨)로의 변환 (도 1 참조), 및 4-하이드록시부티릴-CoA에서 4-하이드록시부티르알데하이드로의 변환 (도 2 참조)을 포함한다. 본 발명의 알데하이드 데하이드로게나제를 이용해, 3-하이드록시부티르알데하이드 (3-HBal), 1,3-부탄다이올 (1,3-BDO), 4-하이드록시부티르알데하이드 (4-HBal), 1,4-부탄다이올 (1,4-BDO) 또는 다운스트림 산물과 같은 다른 바람직한 생산물, 예를 들어, 이의 에스테르 또는 아미드 화합물을, 적합한 대사 경로를 가진 미생물 유기체와 같은 세포에서 또는 시험관내에서 제조할 수 있다. 예를 들어, 1,3-BDO를 생체내 또는 시험관내에서 산과 반응시켜, 예를 들어 리파제를 사용해 에스테르로 변환할 수 있다. 이러한 에스테르 화합물은 뉴트라수티컬 (nutraceutical), 의학적 및 식품 용도를 가질 수 있으며, 1,3-부탄다이올의 R-형태는 (아세트알데하이드 화학 합성 경로에 의해 석유 또는 에탄올로부터 제조되는 S-형태 또는 라세믹 혼합물과 비교해) 에너지원으로서 동물 및 인간에서 최상으로 이용되는 형태이기 때문에 (예, (미국에서 일반적으로 안전하다고 인정되는 물질 (Generally Recognized As Safe, GRAS)로 승인된 (R)-3-하이드록시부틸-R-1,3-부탄다이올 모노에스테르와 같은 케톤 에스테르, 및 (R)-3-하이드록시부티레이트 글리세롤 모노에스테르 또는 다이에스테르), 이 형태가 유용하다. 케톤 에스테르는 경구로 전달할 수 있으며, 이 에스테르 화합물은 신체에 의해 이용되는 R-1,3-부탄다이올로 해리된다 (예, WO2013150153 참조). 따라서, 본 발명은 개선된 효소 경로 및 미생물을 제공하여, 고도로 농화된 또는 기본적으로 거울상이성질체 측면에서 순수하며 추가적으로 부산물에 대해 개선된 순도 품질을 가진 1,3-부탄다이올, 즉 R-1,3-부탄다이올의 개선된 조성물을 제공하는데, 특히 유용하다.
부틸렌 글리콜이라고도 지칭되는 1,3-부탄다이올은 식품 원료, 식품 성분, 착향제, 착향제용 용매 또는 용해제, 안정제, 유화제 및 항-미생물제 및 보존제로서 직접 사용하는 등의, 추가적인 식품 관련 용도를 가진다. 1,3-부탄다이올은 비경구 약물 용매로서 제약 산업에서 사용된다. 1,3-부탄다이올은, 연화제 (emollient), 불용성 물질의 결정화를 방지하는 보습제 (humectant), 향료와 같은 수-난용성 물질에 대한 용해제, 및 항-미생물제 및 보존제로서 화장품에 유용성을 가진다. 예를 들어, 이는 보습제로서, 특히 헤어 스프레이제 및 세팅 로션에 보습제로서 사용할 수 있으며; 이는 에센셜 오일로부터 향 감소를 억제하고, 미생물에 의한 부패를 방지하며, 벤조에이트의 용매로서 사용된다. 1,3-부탄다이올은 0.1% 내지 50% 이상의 농도로 사용할 수 있다. 이는 헤어 및 샤워 제품, 눈 및 얼굴 메이크업, 향수, 개인 위생 제품 및 면도 및 피부 관리 제품에 사용된다 (예, the Cosmetic Ingredient Review board's report: "Final Report on the Safety Assessment of Butylene Glycol, Hexylene Glycol, Ethoxydiglycol, and Dipropylene Glycol", Journal of the American College of Toxicology, Volume 4, Number 5, 1985를 참조하며, 이는 원용에 의해 본 명세서에 포함됨). 이 보고서에는 화장품에서 1,3-부탄다이올 (부틸렌 글리콜)의 특수 용도 및 농도가 제시되어 있으며; 예를 들어, 이 보고서의 표 2 "제품 제형 데이터"를 참조한다.
일 구현예에서, 본 발명은 다음으로부터 선택되는 단리된 핵산 분자를 제공한다: (a) 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열을 코딩하고, 위치 I66에 대응하는 아미노산 치환을 포함하는, 핵산 분자; (b) 고 엄격성 혼성화 조건 (highly stringent hybridization condition)에서 (a)의 핵산에 혼성하고, 위치 I66에 대응하는 아미노산 치환을 코딩하는 핵산 서열을 포함하는, 핵산 분자; 및 (c) (a) 또는 (b)에 상보적인 핵산 분자.
본 발명의 핵산에 대한 일부 구현예에서, 위치 I66에서의 아미노산 치환은 표 1, 2 및/또는 3에 기재된 아미노산 치환이다. 일부 구현예에서, 아미노산 서열은, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 언급된 아미노산 변이 위치에서의 하나 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 서열은, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함한다.
본 발명의 핵산 분자에 대한 일부 구현예에서, 하나 이상의 아미노산 치환을 제외한, 아미노산 서열은, 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 이와 동일하다. 일부 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 변이체의 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함한다. 일부 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 변이체의 아미노산 치환을 포함한다.
일 구현예에서, 단리된 핵산 분자는 다음으로부터 선택할 수 있다: (a) 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열을 코딩하되 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 핵산 분자; (b) 고 엄격성 혼성화 조건에서 (a)의 핵산에 혼성하고, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 코딩하는 핵산 서열을 포함하는, 핵산 분자; (c) 루프 A (서열번호 5) 및/또는 루프 B (서열번호 6)의 컨센서스 서열을 포함하는 아미노산 서열을 코딩하되 아미노산 서열이 표 1, 2 및/또는 3에 표시된 하나 이상의 아미노산 치환을 포함하는, 핵산 분자; 및 (d) (a) 또는 (b)에 상보적인 핵산 분자. 일 구현예에서, 이들 핵산 분자에 의해 코딩되는 아미노산 서열은, 하나 이상의 아미노산 치환을 제외한 서열이, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 이와 동일하다. 아미노산 서열은 표 1, 2 및/또는 3에 기재된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개 이상, 예를 들어, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 또는 43개를 포함할 수 있으며, 즉, 전체 치환을 모두 포함할 수 있다.
또한, 본 발명은 본 발명의 핵산 분자를 포함하는 벡터를 제공한다. 일 구현예에서, 벡터는 발현 벡터이다. 일 구현예에서, 벡터는 이중 가닥 DNA를 포함한다.
또한, 본 발명은 본 발명의 알데하이드 데하이드로게나제 폴리펩타이드를 코딩하는 핵산을 제공한다. 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는 또한 서열번호, GenBank 및/또는 GI 번호로 표시되는 핵산에 혼성하는 핵산 분자, 또는 서열번호, GenBank 및/또는 GI 번호로 표시되는 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자를 포함할 수 있다. 혼성화 조건은 본원에 기술된 바와 같이 당해 기술 분야의 당업자들에게 잘 알려진 고 엄격성 혼성화 조건, 중간 엄격성 혼성화 조건 또는 저 엄격성 혼성화 조건을 포함할 수 있다. 마찬가지로, 본 발명에 사용될 수 있는 핵산 분자는 서열번호, GenBank 및/또는 GI 번호로 표시되는 핵산, 또는 서열번호, GenBank 및/또는 GI 번호로 표시되는 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자에 대해 특정 %의 서열 동일성을 가진 것으로 기술될 수 있다. 예를 들어, 핵산 분자는 본원에 기술된 핵산에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 가질 수 있거나, 또는 이와 동일할 수 있다.
엄격한 혼성화는 혼성된 폴리뉴클레오티드가 안정적으로 유지되는 조건을 나타낸다. 당해 기술 분야의 당업자들에게 공지된 바와 같이, 혼성된 폴리뉴클레오티드의 안정성은 하이브리드의 용융 온도 (Tm)를 반영한다. 일반적으로 혼성된 폴리뉴클레오티드의 안정성은 염 농도, 예를 들어 소듐 이온 농도 및 온도에 따라 달라진다. 혼성화 반응은 저 엄격성 조건에서 수행할 수 있으며, 이후 조건을 달리하여, 그러나 엄격성이 더 높은 조건에서 세척하여 수행할 수 있다. 혼성화에서 엄격성은 이러한 세척 조건에 관한 것이다. 고 엄격성 혼성화는 65℃에서 0.018M NaCl 중에서 안정적으로 혼성된 폴리뉴클레오티드를 형성하는 핵산 서열에 대해서만 혼성화를 허용하는 조건을 포함하며, 예를 들어, 하이브리드가 65℃, 0.018M NaCl 중에서 안정적이지 않다면, 본원에서 간주되는 바와 같이 고 엄격성 조건에서 안정적이지 않을 것이다. 고 엄격성 조건은, 예를 들어, 50% 포름아미드, 5X 덴하르트 용액, 5X SSPE, 0.2% SDS 및 42℃에서 혼성한 다음 0.1X SSPE 및 0.1% SDS에서 65℃ 하에 세척함으로써, 제공할 수 있다. 본원에 기술된 핵산 서열을 기술하기 위해 고 엄격성 혼성화 조건 이외의 혼성화 조건도 이용할 수 있다. 예를 들어, 중간 엄격성 혼성화 (moderately stringent hybridization)라는 표현은 50% 포름아미드, 5X 덴하르트 용액, 5X SSPE, 0.2% SDS 및 42℃에서 혼성한 다음 0.2X SSPE 및 0.2% SDS에서 42℃ 하에 세척하는 조건과 동일한 조건을 의미한다. 저 엄격성 혼성화라는 표현은 10% 포름아미드, 5X 덴하르트 용액, 6X SSPE, 0.2% SDS 및 22℃에서 혼성한 다음 1X SSPE 및 0.2% SDS에서 37℃ 하에 세척하는 조건과 동일한 조건을 의미한다. 덴하르트 용액은 1% Ficoll, 1% 폴리비닐피롤리돈 및 1% 소 혈청 알부민 (BSA)을 포함한다. 20X SSPE (소듐 클로라이드, 소듐 포스페이트, 에틸렌 다이아민 테트라아세트산 (EDTA))는 3M 소듐 클로라이드, 0.2M 소듐 포스페이트 및 0.025 M (EDTA)를 포함한다. 그외 적합한, 저, 중간 및 고 엄격성 혼성화 완충제 및 조건들은 당해 기술 분야의 당업자들에게 잘 알려져 있으며, 예를 들어, Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에 기술되어 있다.
본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는 본원에 기술된 뉴클레오티드 서열과 적어도 특정한 서열 동일성을 가질 수 있다. 이에, 본 발명의 일부 측면에서, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 분자는, 서열번호, GenBank 및/또는 GI 번호에 의해 본원에 기술된 핵산, 또는 서열번호, GenBank 및/또는 GI 번호에 의해 본원에 기술된 아미노산 서열을 코딩하는 핵산 분자에 혼성하는 핵산 분자에 대해, 적어도 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상 또는 99% 이상 동일한, 뉴클레오티드 서열을 가지거나, 또는 이와 동일하다.
서열 동일성 (상동성 또는 유사성으로도 알려져 있음)은 2종의 핵산 분자들 간의 또는 2종의 폴리펩타이드들 간의 서열 유사성을 의미한다. 동일성은 비교 목적으로 정렬될 수 있는 각 서열에서 위치를 비교함으로써 결정할 수 있다. 비교되는 서열에서 한 위치에 동일한 염기 또는 아미노산이 존재한다면, 그 분자는 그 위치에서 동일한 것이다. 서열들 간의 동일성 정도는 서열들 간에 의해 공유되는 매칭되거나 또는 상동한 위치 개수에 대한 함수이다. 서열 동일성 %를 결정하기 위한 서열 2종 간의 정렬은, 예를 들어, Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에 기술된 바와 같이, 당해 기술 분야에 공지된 소프트웨어 프로그램을 사용해 수행할 수 있다. 바람직하게는, 정렬시 디폴트 파라미터를 적용한다. 사용될 수 있는 당해 기술 분야에 잘 알려진 한가지 정렬 프로그램은 디폴트 파라미터로 설정된 BLAST 세트이다. 구체적으로, 프로그램은, 다음과 같은 디폴트 파라미터로 설정된 BLASTN 및 BLASTP이다: 유전자 코드 = 표준; 필터 = 없음; 가닥 = 양쪽; 컷오프 = 60; 기대 = 10; 매트릭스 = BLOSUM62; 기술 = 서열 50개; 분류 = 높은 점수 (HIGH SCORE); 데이터베이스 = 비-중복 (non-redundant), GenBank + EMBL + DDBJ + PDB + GenBank CDS translations + SwissProtein + SPupdate + PIR. 이들 프로그램들에 대한 상세 내용은 국립 생명공학 정보 센터에서 확인할 수 있다 (Altschul et al., " J. Mol . Biol. 215:403-410 (1990) 참조).
일부 구현예에서, 핵산 분자는 단리된 핵산 분자이다. 일부 구현예에서, 단리된 핵산 분자는 기준 폴리펩타이드의 변이체를 코딩하는 핵산 분자이며, 여기서 (i) 기준 폴리펩타이드는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4 (서열번호 7-123)에 열거된 아미노산 서열을 가지며, (ii) 변이체는 서열번호 1, 서열번호 2 또는 서열번호 3 또는 표 3에 기재된 것에 비해 하나 이상의 아미노산 치환을 포함하며, (iii) 하나 이상의 아미노산 치환은 표 1-3에 나타낸 아미노산 치환들로부터 선택된다. 표 1-3은 서열번호 1, 서열번호 2, 서열번호 3의 예시적인 변이체 또는 표 4에서의 변이체로 구성된 비-제한적인 목록을 제공한다. 일 구현예에서, 표 1-3의 각각의 변이체에서, 지정된 위치(들)를 제외한 모든 위치들은 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 것과 동일하다. 아미노산 치환들은, 오리지날 아미노산의 정체를 표시하는 문자, 그 다음으로 서열번호 1, 2, 3 또는 표 4에서 치환되는 아미노산의 위치를 나타내는 번호, 그리고 그 다음으로 치환된 아미노산의 정체를 나타내는 문자로 표시된다. 예를 들어, "D12A"는, 서열번호 1 또는 2에서 12번 위치의 아스파르트산이 알라닌으로 치환되는 것을 의미한다. 아미노산을 나타내기 위해 사용되는 단문자 코드는 당해 기술 분야에 공지된 표준 코드이다. 표 1-3에서 일부 변이체들은 치환 목록에 표시된 2 이상의 변형을 포함한다. 하나 이상의 아미노산 치환은 표 1-3에 열거된 변이체들 중 임의의 하나 또는 표 1-3에 열거된 2종 이상의 변이체들의 임의 조합으로부터 선택될 수 있다. 표 1-3의 단일 변이체로부터 선택하는 경우, 제조되는 변이체는 언급된 치환들 모두 또는 언급된 전체 치환보다 적은 수의 치환 등의, 선택된 변이체의 하나 이상의 치환을 임의 조합으로 포함할 수 있다. 치환이 표 1-3에서의 2 이상의 변이체들로부터 선택되는 경우, 제조되는 변이체는 언급된 모든 치환들 또는 언급된 전체 치환보다 적은 수의 치환 등의, 선택된 변이체의 하나 이상의 치환을 임의 조합으로 포함할 수 있다. 예를 들어, 제조되는 변이체는 표 1-3에서의 단일 변이체로부터 유래되는 1, 2, 3 또는 4개의 치환을 포함할 수 있다. 추가적인 예로서, 제조되는 변이체는 표 1-3의 1, 2, 3, 4, 5 또는 그 이상의 선택된 변이체들로부터 선택되는 치환 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25 또는 그 이상을 포함할 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3에서 선택된 변이체의 표시된 치환들을 모두 포함한다. 일부 구현예에서, 제조되는 변이체는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 것과 하나 이상의 아미노산 치환 차이를 가지지만, 아미노산 치환은 25개 미만, 20개 미만, 10개 미만, 5개 미만, 4개 미만 또는 3개 미만이다. 일부 구현예에서, 제조되는 변이체는, 언급된 아미노산 치환에서만 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 서열과 상이한, 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하거나, 그 서열로 필수적으로 구성되거나, 또는 그 서열로 구성된다.
일부 구현예에서, 핵산 분자는 기준 폴리펩타이드의 변이체를 코딩하는 단리된 핵산 분자이며 (기준 폴리펩타이드는 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4의 아미노산 서열을 가짐), 여기서 변이체는 (i) 표 1-3으로부터 선택되는 대응되는 변이체의 하나 이상의 아미노산 치환을 포함하고, (ii) 대응되는 변이체와 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 98% 이상, 99% 이상 또는 100%의 서열 동일성을 가진다. 제2 변이체가 대응되는 변이체와 100%의 서열 동일성을 가지는 경우, 제2 변이체는 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하며, 아미노 말단 및 카르복시 말단 중 어느 하나 또는 양쪽에 하나 이상의 부가적인 아미노산을 가지거나 또는 가지지 않을 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 대응되는 변이체에 대해 80% 이상, 85% 이상, 90% 이상 또는 95% 이상의 서열 동일성을 가지며; 일부 경우에, 동일성은 적어도 90% 이상 또는 그 보다 높다. 제조되는 변이체가 표 1-3으로부터 선택되는 대응되는 변이체에 대해 동일성이 100% 미만일 경우, 대응되는 변이체에 표시된 하나 이상의 아미노산 치환의 위치는 이동될 수 있지만 (하나 이상의 아미노산이 삽입 또는 결손된 경우), 제조되는 변이체에 여전히 포함될 수 있다. 예를 들어, "D12A" (서열번호 1 또는 2에서 12번 위치)에 대응하는 아스파르트산에서 알라닌으로의 치환이, 제조되는 변이체의 다른 위치에 여전히 존재할 수 있다. 아미노산이 비록 다른 위치이지만 지정된 치환에 해당하는지는 당해 기술 분야에서 잘 알려진 바와 같이 서열 정렬에 의해 확인할 수 있다. 일반적으로, 측면 서열이 다른 폴리펩타이드의 상동적인 서열과 정렬되도록, 치환된 아미노산의 측면에 위치하는 아미노산에 대해 동일성 또는 유사성을 보여주는 정렬은, 치환된 아미노산을 표 1-3의 대응되는 변이체에 대해 국소적으로 위치시킬 수 있어, 소정의 폴리펩타이드 체인의 비록 이동된 번호 위치에서 치환을 수행하기 위한 대응되는 위치를 결정할 수 있을 것이다. 일 구현예에서, 치환된 위치를 포함하여 적어도 3-15개의 아미노산을 포함하는 영역은, 대응되는 변이체 서열에서 치환된 아미노산의 위치를 포함하여, 상대적으로 높은 동일성% (예, 90%, 95% 또는 100% 동일성)로 대응되는 변이체 서열과 국소 정렬될 것이다. 일부 구현예에서, 심지어 폴리펩타이드 체인의 다른 물리적 위치에서 발생한다면, 폴리펩타이드의 서열을 디폴트 파라미터를 적용한 BLASTP 정렬 알고리즘을 이용하는 경우 대응되는 변이체 서열의 지정된 위치에서 동일한 매치 또는 유사한 아미노산을 가진 대응되는 변이체와 정렬을 비교한다면, 유사한 아미노산이 정렬 알고리즘의 디폴트 파라미터를 적용해 대상 변이체 위치와 정렬하기에 충분한 화학적 특성을 가진 것으로 보이는 경우, 표 1-3으로부터 선택되는 대응되는 변이체에 의해 표시된 하나 이상의 아미노산 치환 (예, 아미노산 치환들 전부 또는 그보다는 적은 수의 아미노산 치환)이 소정의 변이체에 존재하는 것으로 간주된다.
일부 구현예에서, 본 발명의 핵산 분자는 본원의 다양한 임의 구현예과 연계하여 기술된 핵산에 상보적이다.
본 발명의 핵산 또는 본 발명의 폴리펩타이드는 야생형 모 세포, 예를 들어 서열번호 1, 2 또는 3과 같은 모 서열 또는 표 4에 기술된 서열을 배제할 수 있는 것으로 이해된다. 당해 기술 분야의 당업자라면 당해 기술 분야에 잘 알려진 사실을 토대로 야생형 모 서열의 의미를 쉽게 이해할 것이다. 본 발명의 이러한 핵산이 자연에서 발견되는 천연 아미노산 서열을 코딩하는 핵산 서열은 제외할 수 있는 것으로 또한 이해된다. 마찬가지로, 본 발명의 폴리펩타이드는 자연에서 발견되는 아미노산 서열을 배제할 수 있다. 즉, 특정 구현예에서, 본 발명의 핵산 또는 폴리펩타이드는 본원에 기술된 바와 같으며, 단, 코딩된 아미노산 서열은 야생형 모 세포 또는 천연 아미노산 서열이 아니거나 및/또는 핵산 서열은 야생형 또는 천연 핵산 서열이 아니다. 천연 아미노산 또는 핵산 서열은 자연에서 발견되는 바와 같이 천연 유기체에서 발견되는 서열과 관련있는 것으로서 당해 기술 분야의 당업자에게 이해된다. 즉, 동일한 상태로 발견되지 않거나 또는 천연 유기체에서와 동일한 뉴클레오티드 또는 코딩된 아미노산 서열을 가진 것으로 발견되지 않는, 핵산 또는 아미노산 서열은 본 발명의 핵산 및/또는 아미노산 서열의 의미에 포함된다. 예를 들어, 본원에 기술된 변이체를 비롯하여, 모 서열로부터 하나 이상의 뉴클레오티드 또는 아미노산 위치가 변형된 핵산 또는 아미노산 서열은, 본 발명의 핵산 또는 아미노산 서열이 비-천연성이라는 의미에 포함된다. 본 발명의 단리된 핵산 분자에는 핵산 서열을 포함하는 천연 염색체 (naturally occurring chromosome)가 제외되며, DNA 결합 단백질과 같은 천연 세포에서 발견되는 다른 분자, 예를 들어 진핵생물 세포 안에서 염색체에 결합하는 히스톤 등의 단백질을 또한 제외될 수 있다.
이에, 본 발명의 단리된 핵산 서열은 천연 핵산 서열과 물질적 및 화학적 차이를 가진다. 본 발명의 단리된 또는 비-천연성 핵산은 자연에서 발견되는 천연 핵산 서열의 공유 결합 또는 비-공유 결합과 같은 화학 결합들 중 일부 또는 전부를 포함하지 않거나 또는 필수적으로 가지지 않는다. 본 발명의 단리된 핵산은, 따라서, 예를 들어, 염색체에서 발견되는 천연 핵산 서열과는 다른 화학적 구조를 가짐으로써, 천연 핵산과 차이를 가진다. 예를 들어, 포스포다이에스테르 결합을 절단하여 천연 염색체로부터 단리된 핵산 서열을 분리함으로써, 다른 화학적 구조가 수득될 수 있다. 본 발명의 단리된 핵산은 또한 원핵생물 또는 진핵생물 세포에서 염색체 DNA에 결합하는 단백질로부터 핵산을 단리 또는 분리함으로써 천연 핵산과 상이할 수 있으며, 따라서 다른 비-공유 결합에 의해 천연 핵산과 상이할 수 있다. 원핵생물 기원의 핵산과 관련하여, 본 발명의 비-천연성 핵산은 염색체의 천연적인 화학 결합들 중 일부 또는 전부, 예를 들어 폴리머라제 또는 염색체 구조 단백질과 같은 DNA 결합 단백질에의 결합을 반드시 포함하는 것이 아니거나, 또는 슈퍼코일드형과 같은 고차 구조로 존재하지 않는다. 진핵생물 기원의 핵산과 관련하여, 본 발명의 비-천연성 핵산은 또한 동일한 내부 핵산 화학 결합 또는 염색질에서 발견되는 구조 단백질과의 화학 결합을 포함하지 않는다. 예를 들어, 본 발명의 비-천연성 핵산에는 히스톤 또는 스캐폴드 단백질이 화학적으로 결합되어 있지 않으며, 센트로미어 또는 텔로미어 형태로 포함되지 않는다. 즉, 본 발명의 비-천연성 핵산은, 천연적으로 발견되는 핵산 서열과는 다른 반 데르 발스 상호작용, 수소작용, 이온 결합 또는 정전기적 결합 및/또는 공유 결합을 포함하거나 또는 결여되어 있어, 천연 핵산과 화학적으로 구별된다. 이러한 결합 차이는 핵산의 별개 영역에서 내부적으로 생길 수 있거나 (즉, cis), 또는 이러한 결합 차이는 트랜스로, 예를 들어, 염색체 단백질과의 상호작용에서 발생할 수 있다. 진핵생물 기원의 핵산의 경우, cDNA 내부 화학 결합은 염색체 DNA 상의 유전자의 공유 결합, 즉 서열과 다르므로, cDNA는 단리된 또는 비-천연성 핵산인 것으로 간주된다. 이에, 당해 기술 분야의 당업자라면, 단리된 또는 비-천연성 핵산이 천연 핵산과 구별됨을 알 것이다.
일 구현예에서, 본 발명은 서열번호 1, 2 또는 3 또는 표 4에 기재된 아미노산 서열을 포함하되 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하는, 단리된 폴리펩타이드를 제공한다. 일 구현예에서, 위치 I66에서 아미노산 치환은 표 1, 2 및/또는 3에 언급된 아미노산 치환이다. 일부 구현예에서, 아미노산 서열은, 아미노산 위치 I66에 대응되는 치환과 더불어, 표 1, 2 및/또는 3에 언급된 아미노산 변이 위치에서 하나 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 서열은, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함한다.
다른 구현예에서, 본 발명은, 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하고; 위치 I66에 대응되는 아미노산 치환을 제외한 아미노산 서열이 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 동일한, 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열을 포함하는 단리된 폴리펩타이드를 제공한다.
본 발명의 단리된 폴리펩타이드에 대한 일부 구현예에서, 위치 I66에서의 아미노산 치환은 표 1, 2 및/또는 3에 기재된 아미노산 치환이다. 일부 구현예에서, 아미노산 서열은, 아미노산 위치 I66에 대응되는 치환과 더불어, 표 1, 2 및/또는 3에 언급된 아미노산 변이 위치에서의 하나 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 서열은, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함한다. 일부 구현예에서, 아미노산 서열은 1-100 아미노산 위치들에서 보존적인 아미노산 치환을 더 포함하며, 이러한 위치는 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환이 아닌 다른 위치이다.
본 발명의 단리된 폴리펩타이드에 대한 일부 구현예에서, 아미노산 서열은 모 서열과 비교해 2-300 아미노산 위치들에서 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 제외한 변형을 포함하지 않으며, 이러한 위치는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열들 중 2, 3, 4 또는 5개들에서 동일한 위치로부터 선택된다. 일 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함한다. 특정 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 변이체의 아미노산 치환을 포함한다.
일 구현예에서, 단리된 폴리펩타이드는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열을 포함하되, 그 아미노산 서열은 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함한다. 일 구현예에서, 단리된 폴리펩타이드는 루프 A의 컨센서스 아미노산 서열 (서열번호 5) 및/또는 루프 B의 컨센서스 아미노산 서열 (서열번호 6)을 포함한다.
다른 구현예에서, 단리된 폴리펩타이드는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열을 포함하되, 그 아미노산 서열은 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 포함하고, 이러한 하나 이상의 아미노산 치환을 제외한 아미노산 서열은 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지거나 또는 이와 동일하다. 일 구현예에서, 아미노산 서열은 1-100 아미노산 위치들에서 보존적인 아미노산 치환을 더 포함하되, 그 위치는 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환과는 다른 위치이다. 다른 구현예에서, 표 1, 2 및/또는 3에 기재된 하나 이상의 아미노산 치환을 제외한 아미노산 서열은 모 서열과 비교해 2-300 아미노산 위치들에서 다른 변형을 포함하지 않으며, 그 위치는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열들 중 2, 3, 4 또는 5개들에서 동일한 위치들로부터 선택된다. 일 구현예에서, 아미노산 서열은 표 1, 2 및/또는 3에 기재된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16, 또는 그 이상을 포함하고, 예를 들어, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42 또는 43개, 즉, 최대한으로는 치환이 존재하는 모든 아미노산 위치들을 포함한다.
일 구현예에서, 본 발명의 폴리펩타이드는 알데하이드 데하이드로게나제를 코딩한다. 일 구현예에서, 폴리펩타이드는 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환할 수 있다. 일 구현예에서, 폴리펩타이드는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 일 구현예에서, 폴리펩타이드는 모 폴리펩타이드와 비교해 더 높은 활성을 가진다. 일 구현예에서, 폴리펩타이드는 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가진다. 일 구현예에서, 폴리펩타이드는 아세틸-CoA에 비해 3-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가진다. 일 구현예에서, 폴리펩타이드는 아세틸-CoA와 비교해 4-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가진다. 일 구현예에서, 폴리펩타이드는 세포 또는 세포 추출물에서 부산물을 적게 생성한다. 특정 구현예에서, 부산물은 에탄올 또는 4-하이드록시-2-부타논이다. 일 구현예에서, 폴리펩타이드는 모 폴리펩타이드와 비교해 더 높은 kcat를 가진다.
일부 구현예에서, 본 발명은, 서열번호 1, 2 또는 3 또는 표 4에 기재된 서열과 같은 본원에 기술된 아미노산 서열을 가지며; 아미노산 서열아 표 1, 2 및/또는 3에 기재된 하나 이상의 변이 아미노산 위치를 포함하는, 단리된 폴리펩타이드를 제공한다. 특히, 이러한 폴리펩타이드는, 아실-CoA를 대응되는 알데하이드로, 예를 들어, 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 또는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있는, 알데하이드 데하이드로게나제를 코딩한다. 일부 측면에서, 본 발명의 단리된 폴리펩타이드는, 표 1, 2 및/또는 3에 기재된 하나 이상의 변이 아미노산 위치를 제외하고는, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 기재된 아미노산 서열에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 가지거나 또는 동일한 아미노산 서열을 포함한다. 변이 아미노산 위치는 20개의 천연 아미노산, 변이 아미노산 위치에 대응되는 위치에서의 야생형 또는 모 서열의 보존적인 치환, 또는 본원에서 표 1, 2 및/또는 3에서 본원에 기술된 바와 같은 변이 아미노산 위치에서의 특정 아미노산 중 어느 하나를 포함할 수 있는 것으로 이해된다. 변이 아미노산 위치들 중 임의의 위치를 조합하여 추가적인 변이체를 구축할 수 있는 것으로 또한 이해된다. 2 이상의 변이 아미노산 위치들의 조합을 가진 변이체는 야생형 보다 높은 활성을 나타낸다. 즉, 본원에 예시된 바와 같이, 활성 변이 아미노산 위치들을 조합함으로써 효소 변이체를 구축하는 경우, 개선된 특성을 가진 효소 변이체가 구축된다. 당해 기술 분야의 당업자라면 당해 기술 분야의 당업자에게 잘 알려진 방법을 이용하여 하나의 변이 위치 또는 변이 위치들의 조합을 가진 폴리펩타이드를 쉽게 구축하여, 본원에 기술된 바와 같이, 활성 증가, 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드의 S 형태 대비 R 형태에 대한 특이성 증가, 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 에탄올 또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, Kcat 증가, 생체내 및/또는 시험관내 안정성 증가 등과 같은 바람직한 특성을 가진 폴리펩타이드를 구축할 수 있다.
"상동성" 또는 "동일성" 또는 "유사성"은 2종의 폴리펩타이드 또는 2종의 핵산 분자들 간의 서열 유사성을 의미한다. 상동성은 비교하기 위해 정렬가능한 각 서열 내 위치를 비교함으로써 결정할 수 있다. 비교되는 서열에서 한 위치에서 동일한 염기 또는 아미노산이 존재한다면, 그 분자는 그 위치에서 동일한 것이다. 서열들 간의 상동성 정도는 서열들 간에 공유된 매칭 또는 상동적인 위치들의 개수에 대한 함수이다. 폴리펩타이드 또는 폴리펩타이드 영역 (또는 폴리뉴클레오티드 또는 폴리뉴클레오티드 영역)이 다른 서열에 대해 특정한 "서열 동일성" % (예, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%)를 가진다는 것은, 정렬하였을 때 아미노산 (또는 뉴클레오티드 염기)의 %가 서열 2개의 비교시 동일하다는 것을 의미한다.
특정 구현예에서, 본 발명은 본원에 기술된 임의의 조합으로 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 그 보다 많은 수의 변이를 포함하는 아미노산 서열을 가진 단리된 폴리펩타이드를 제공한다. 변이체는 표 1, 2 및/또는 3에 기재된 변이체들의 임의 조합을 포함할 수 있다. 일부 구현예에서, 단리된 폴리펩타이드는, 기준 폴리펩타이드가 서열번호 1, 2 또는 3 또는 표 4의 아미노산 서열을 가지고; 폴리펩타이드 변이체가 표 1-3으로부터 선택되고; 서열번호 1, 2 또는 3 또는 표 4의 서열에 대해 하나 이상의 아미노산 치환을 가진, 기준 폴리펩타이드에 대한 변이체이다.
일부 구현예에서, 단리된 폴리펩타이드는, 기준 폴리펩타이드가 서열번호 1, 2 또는 3 또는 표 4의 아미노산 서열을 가지는, 기준 폴리펩타이드에 대한 변이체로서, 폴리펩타이드 변이체는 서열번호 1, 2 또는 3 또는 표 4에 대해 하나 이상의 아미노산 치환을 포함하되 하나 이상의 아미노산 치환은 표 1-3으로부터 선택되고, 폴리펩타이드 변이체는 표 1-3으로부터 선택되는 대응되는 변이체에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가진다. 하나 이상의 아미노산 치환은 표 1-3에 열거된 변이체들 중 어느 하나로부터 또는 표 1-3에 열거된 2 이상의 변이체들의 임의 조합으로부터 선택할 수 있다. 표 1-3에서 하나의 변이체로부터 선택되는 경우, 제조되는 변이체는 표시된 치환들을 모두 또는 표시된 전체 치환보다 적은 수준의 치환을 비롯하여, 선택된 변이체들의 하나 이상의 치환을 임의 조합으로 포함할 수 있다. 치환이 표 1-3에서의 2 이상의 변이체들로부터 선택되는 경우, 제조되는 변이체는 2 이상의 선택된 변이체들 각각으로부터 유래되는 표시된 치환들 모두 또는 그 보다 적은 수의 치환을 비롯하여, 선택된 변이체의 하나 이상의 치환을 임의 조합으로 포함할 수 있다. 예를 들어, 제조되는 변이체는 표 1-3에서의 단일 변이체로부터 유래되는 1, 2, 3 또는 4개의 치환을 포함할 수 있다. 추가적인 예로서, 제조되는 변이체는 본원에 기술된 바와 같이, 최대한으로는 모든 위치가 치환되는 등의, 표 1-3의 1, 2, 3, 4, 5 또는 그보다 많은 수의 선택 변이체들로부터 선택되는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 20, 25 또는 그보다 많은 수의 치환을 포함할 수 있다. 일부 구현예에서, 제조되는 변이체는 표 1-3에서 선택 변이체의 표시된 치환들을 모두 포함한다. 일부 구현예에서, 제조되는 변이체는 서열번호 1, 2 또는 3 또는 표 4의 서열과 1개 이상에서 25개 미만, 20개 미만, 10개 미만, 5개 미만, 4개 미만 또는 3개 미만의 아미노산 치환 차이를 가진다. 일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 변이체에 의해 표시되는 서열을 포함하거나, 이로 필수적으로 구성되거나 또는 이로 구성되며, 서열번호 1, 2 또는 3 또는 표 4의 서열과의 표시된 아미노산 치환(들) 차이를 가진다.
일부 구현예에서, 제조되는 변이체는 표 1-3으로부터 선택되는 대응되는 변이체와 적어도 80%, 85%, 90% 또는 95%의 서열 동일성을 가지며; 일부 경우에, 동일성은 적어도 90% 또는 그 보다 높다. 제조되는 변이체가 표 1-3으로부터 선택되는 대응되는 변이체와의 동일성이 100% 미만인 경우, 대응되는 변이체에 대해 표시된 하나 이상의 아미노산 치환 위치가 이동될 순 있지만 (예, 하나 이상의 아미노산이 삽입 또는 결손된 경우), 여전히 제조되는 변이체에 포함될 수 있다. 예를 들어, "D12A" (서열번호 1 또는 2에서 12번 위치)에 대응되는 글리신에서 글루탐산으로의 치환은 제조되는 변이체의 다른 위치에 존재할 수 있다. 아미노산이 비록 다른 위치이지만 표시된 치환에 해당되는지는 전술한 및 당해 기술 분야에서 잘 알려진 바와 같이 서열 정렬을 통해 결정할 수 있다. 일부 구현예에서, 표 1-3으로부터 선택되는 대응되는 변이체에 의해 표시되는 하나 이상의 아미노산 치환 (예를 들어, 아미노산 치환들 전체 또는 그보다 적은 수의 아미노산 치환)은, 심지어 폴리펩타이드 체인의 다른 물리적 위치에서 이루어진다면, 폴리펩타이드의 서열을 디폴트 파라미터가 적용된 BLASTP 정렬 알고리즘을 이용하는 경우 대응되는 변이체 서열의 지정된 위치에 동일한 매치 또는 유사한 아미노산을 가진 대응되는 변이체와 정렬을 비교하였을 때, 유사한 아미노산이 정렬 알고리즘의 디폴트 파라미터를 이용하여 대상 변이체 위치와 정렬하기에 충분한 화학적 특성을 가진 것으로 간주되는 경우, 소정의 변이체에 존재하는 것으로 간주된다.
변형은 단독으로 또는 조합하여 기준 폴리펩타이드, 예를 들어 야생형 (네이티브) 효소를 기준으로 활성을 개선 또는 유지하는 효소를 구축할 수 있다. 일부 측면에서, 본 발명의 폴리펩타이드는 표 1, 2 및/또는 3에 기술된 변이들의 임의 조합을 가질 수 있다. 일부 측면에서, 표 1, 2 및/또는 3에 기술된 변이들의 임의 조합을 가진 본 발명의 폴리펩타이드는 아실-CoA를 대응되는 알데하이드로, 예를 들어, 3-하이드록시부티릴-CoA를 3- 하이드록시부티르알데하이드로 또는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 이러한 폴리펩타이드의 제조 및 분석 방법들은 당해 기술 분야의 당업자들에게 잘 알려져 있다.
일부 구현예에서, 본 발명의 단리된 폴리펩타이는 1-100 아미노산 위치들, 또는 다른 예로 2-100 아미노산 위치들, 또는 다른 예로 3-100 아미노산 위치들, 또는 다른 예로 4-100 아미노산 위치들, 또는 다른 예로 5-100 아미노산 위치들, 또는 다른 예로 6-100 아미노산 위치들, 또는 다른 예로 7-100 아미노산 위치들, 또는 다른 예로 8-100 아미노산 위치들, 또는 다른 예로 9-100 아미노산 위치들, 또는 다른 예로 10-100 아미노산 위치들, 또는 다른 예로 15-100 아미노산 위치들, 또는 다른 예로 20-100 아미노산 위치들, 또는 다른 예로 30-100 아미노산 위치들, 또는 다른 예로 40-100 아미노산 위치들, 또는 다른 예로 50-100 아미노산 위치들, 또는 이들의 범위에 속하는 임의 정수 위치에 보존적인 아미노산 치환을 추가로 포함할 수 있으며, 이들 위치는 표 1, 2 및/또는 3에 기재된 변이체 아미노산 위치와는 다른 위치이다. 일부 측면에서, 보존적인 아미노산 서열은 화학적으로 보존적인 또는 진화적으로 보존적인 아미노산 치환이다. 보존적인 아미노산을 식별하는 방법들은 당해 기술 분야의 당업자들에게 널리 공지되어 있으며, 이중 임의의 방법을 사용해 본 발명의 단리된 폴리펩타이드를 구축할 수 있다.
일부 구현예에서, 본 발명의 단리된 폴리펩타이드는, 모 (야생형) 서열과 비교해, 2-300 아미노산 위치들, 또는 다른 예로 3-300 아미노산 위치들, 또는 다른 예로 4-300 아미노산 위치들, 또는 다른 예로 5-300 아미노산 위치들, 또는 다른 예로 10-300 아미노산 위치들, 또는 다른 예로 20-300 아미노산 위치들, 또는 다른 예로 30-300 아미노산 위치들, 또는 다른 예로 40-300 아미노산 위치들, 또는 다른 예로 50-300 아미노산 위치들, 또는 다른 예로 60-300 아미노산 위치들, 또는 다른 예로 80-300 아미노산 위치들, 또는 다른 예로 100-300 아미노산 위치들, 또는 다른 예로 150-300 아미노산 위치들, 또는 다른 예로 200-300 아미노산 위치들, 또는 다른 예로 250-300 아미노산 위치들, 또는 이들의 범위에 속하는 정수 위치에, 변형을 포함하지 않을 수 있으며, 그 위치는 서열번호 1, 2 또는 3 또는 표 4에 언급된 아미노산 서열들 중 2, 3, 4 또는 5개들에서 동일한 위치로부터 선택된다.
본원에 기술된 바와 같이, 알데하이드 데하이드로게나제의 폴리펩타이드 변이체 등의 변이체 폴리펩타이드가 모 폴리펩타이드와 비슷한 효소 반응, 예를 들어, 아실-CoA에서 이의 대응되는 알데하이드로의 변환, 예로, 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드로의 변환 또는 4-하이드록시부티릴-CoA로부터 4-하이드록시부티르알데하이드로의 변환을 수행할 수 있는 것으로 이해된다. 알데하이드 데하이드로게나제 효소의 폴리펩타이드 변이체는, 비-제한적인 예로, 활성 증가, S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, 아세틸-CoA에 비해 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 에탄올 또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, kcat 증가, 생체내 및/또는 시험관내 안정성 증가 등 (실시예 참조)의, 폴리펩타이드에 유익한 특징을 제공하는 변이체를 포함할 수 있는 것으로, 또한 이해된다. 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드 보다 높거나 또는 적어도 동일한 활성을 나타낼 수 있으며, 즉 변이 아미노산 위치(들)가 없는 모 폴리펩타이드와 비교해 더 높은 활성을 나타낼 수 있다. 예를 들어, 본 발명의 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드와 비교해 1.2, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 10 또는 심지어 그 보다 높은 배수의 변이체 폴리펩타이드 활성을 가질 수 있다 (실시예 참조). 그 활성은 본 발명의 알데하이드 데하이드로게나제가 동일한 분석 조건에서 야생형 또는 모 폴리펩타이드와 비교해 기질을 생산물로 변환할 수 있는 능력을 지칭하는 것으로 이해된다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, 예를 들어, 약 2-40배, 예를 들어, 2-35, 2-30, 2-25, 2-20, 2-15, 2-10 또는 2-5, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40 또는 심지어 더 높은 배수의 활성을 나타낼 수 있다. 이러한 특이성 증가는 예를 들어 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드의 R 형태/S 형태의 활성 비율에 의해 측정할 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 예를 들어, 1.5-100, 1.5-95, 1.5-90, 1.5-85, 1.5-80, 1.5-75, 1.5-70, 1.5-65, 1.5-60, 1.5-55, 1.5-50, 1.5-45, 1.5-40, 1.5-35, 1.5-30, 1.5-25, 1.5-20, 1.5-15, 1.5-10 또는 1.5-5, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100배 증가를 나타낼 수 있다. 이러한 특이성 증가는, 예를 들어, 아세틸-CoA 대비 3-하이드록시부티릴-CoA 또는 4-하이드록시부티릴-CoA의 활성 비율에 의해 측정할 수 있다. 특이성은 3HB-CoA 또는 4HB-CoA에 대한 활성을 아세틸-CoA에 대한 활성으로 나누어 표시한다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 에탄올 및/또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, 예를 들어, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%의 부산물 발생 감소를 나타낼 수 있다. 이러한 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드, 즉 변이 아미노산 위치가 없는 모 폴리펩타이드와 비교해, 전술한 바와 같이, 부산물 발생 감소 활성을 나타낼 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는, 야생형 또는 모 폴리펩타이드, 즉 변이 아미노산 위치(들)가 없는 모 폴리펩타이드와 비교해, kcat 증가, 예를 들어, 1.25, 1.5, 1.75, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5, 10배 또는 그 보다 높은 수준의 kcat 증가를 나타낼 수 있다. kcat는 효소학에서 널리 공지된 의미, 턴오버수 kcat = Vmax/[ET]를 지칭하는 것으로 이해되며, 이때 Vmax는 포화 기질과의 효소 반응 속도이고, [ET]는 전체 효소 농도이다 (Segel, Enzyme Kinetics: Behavior and Analysis of Rapid Equilibrium and Steady-State Enzyme Kinetics, Wiley-Interscience, New York (1975) 참조). 이러한 알데하이드 데하이드로게나제 변이체는, 야생형 또는 모 폴리펩타이드, 즉 변이체 아미노산 위치(들)가 없는 모 폴리펩타이드에 비해 kcat가 증가된 활성을 나타낼 수 있다.
다른 특정 구현예에서, 알데하이드 데하이드로게나제 변이체는 야생형 또는 모 폴리펩타이드, 즉 변이 아미노산 위치(들)가 없는 모 폴리펩타이드에 비해 시험관내 또는 생체내 또는 둘다에서 안정성 증가를 나타낼 수 있다. 예를 들어, 알데하이드 데하이드로게나제 변이체는 세포용해물 (lysate)에서 시험관내 안정성 증가를 나타낼 수 있다.
특정 구현예들에서, 알데하이드 데하이드로게나제 변이체는 전술한 2가지 이상의 특징, 예를 들어, (1) 활성 증가, (2) S 형태 대비 R 형태의 3-하이드록시부티릴-CoA 또는 3-하이드록시부티르알데하이드에 대한 특이성 증가, (3) 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, (4) 에탄올 및/또는 4-하이드록시-2-부타논과 같은 부산물 발생 감소, (5) kcat 증가, (6) 생체내 및/또는 시험관내 안정성 증가 등 중 2가지 이상의 특징을 임의 조합으로 나타낼 수 있는 것으로 이해된다. 이러한 임의 조합으로는, 예를 들어, 특징 1 및 2; 1 및 3; 1 및 4; 1 및 5; 1 및 6; 2 및 3; 2 및 4; 2 및 5; 2 및 6; 3 및 4; 3 및 5; 3 및 6; 4 및 5; 4 및 6; 5 및 6; 1, 2 및 3; 1, 2 및 4; 1, 2 및 5; 1, 2 및 6; 1, 3 및 4; 1, 3 및 5; 1, 3 및 6; 1, 4 및 5; 1, 4 및 6; 1, 5 및 6; 2, 3 및 4; 2, 3 및 5; 2, 3 및 6; 2, 4 및 5; 2, 4 및 6; 2, 5 및 6; 3, 4 및 5; 3, 4 및 6; 3, 5 및 6; 4, 5 및 6; 1, 2, 3 및 4; 1, 2, 3 및 5; 1, 2, 3 및 6; 1, 2, 4 및 5; 1, 2, 4 및 6; 1, 2, 5 및 6; 1, 3, 4 및 5; 1, 3, 4 및 6; 1, 3, 5 및 6; 1, 4, 5 및 6; 2, 3, 4 및 5; 2, 3, 4 및 6; 2, 3, 5 및 6; 3, 4, 5 및 6; 1, 2, 3, 4 및 5; 1, 3, 4, 5 및 6; 1, 2, 4, 5 및 6; 1, 2, 3, 5 및 6; 1, 2, 3, 4 및 6; 2, 3, 4, 5 및 6; 1, 2, 3, 4, 5 및 6을 포함한다.
본 발명의 폴리펩타이드는 당해 기술 분야에 널리 공지된 다양한 방법에 의해, 예를 들어 재조합 발현 시스템, 석출, 겔 여과, 이온-교환, 역상 및 친화성 크로마토그래피 등에 의해 단리할 수 있다. 그외 널리 공지된 방법들은 Deutscher et al., Guide to Protein Purification: Methods in Enzymology, Vol. 182, (Academic Press, (1990))에 기술되어 있다. 다른 예로, 본 발명의 단리된 폴리펩타이드는 널리 공지된 재조합 방법을 이용해 수득할 수 있다 (예, Sambrook et al., supra, 1989; Ausubel et al., supra, 1999 참조). 본 발명의 폴리펩타이드를 생화학적으로 정제하는 방법 및 조건은 당해 기술 분야의 당업자들이 선택할 수 있으며, 예를 들어 기능성 분석으로 정제를 모니터링할 수 있다.
본 발명의 폴리펩타이드를 정제하는 방법에 대한 비-제한적인 일 예는 박테리아 세포, 효모 세포 또는 그외 적절한 세포와 같은 적절한 숙주 세포에서 당해 기술 분야에 잘 알려진 방법을 이용해 폴리펩타이드를 코딩하는 핵산을 발현시키고, 발현된 폴리펩타이드를 널리 공지된 정제 방법을 다시 이용해 본원에 기술된 바와 같이 회수하는 것이다. 본 발명의 폴리펩타이드는 본원에 기술된 바와 같이 발현 벡터로 형질전환된 세포로부터 직접 단리할 수 있다. 재조합 방식으로 발현된 본 발명의 폴리펩타이드는 또한 글루타티온 S 트랜스퍼라제 (GST), poly His, 스트렙타비딘 등과 같은 적절한 친화성 태그와의 융합 단백질로서 발현시키고, 필요에 따라 친화성으로 정제할 수 있다. 본 발명의 폴리펩타이드는 필요에 따라 친화성 태그를 유지할 수 있거나, 또는 선택적으로 친화성 태그는 널리 공지된 방법을 이용해 폴리펩타이드로부터, 예를 들어 적절한 효소적 또는 화학적 절단을 이용하여 친화성 태그를 제거할 수 있다. 이에, 본 발명은 친화성 태그없이 또는 선택적으로 친화성 태그와 함께 본 발명의 폴리펩타이드를 제공한다. 일부 구현예에서, 본 발명은 본원에 기술된 폴리펩타이드를 발현하는 숙주 세포를 제공한다. 또한, 본 발명의 폴리펩타이드는 당해 기술 분야의 당업자에게 널리 공지된 폴리펩타이드 합성 방법을 이용해 화학 합성으로 제조할 수 있다 (Merrifield, J. Am. Chem . Soc . 85:2149 (1964); Bodansky, M., Principles of Peptide Synthesis (Springer-Verlag, 1984); Houghten, Proc . Natl . Acad . Sci ., USA 82:5131 (1985); Grant Synthetic Peptides: A User Guide. W.H. Freeman and Co., N.Y. (1992); Bodansky M and Trost B., Ed. Principles of Peptide Synthesis. Springer-Verlag Inc., NY (1993)).
일부 구현예에서, 본 발명은 생촉매 (biocatalyst)로서 본원에 언급된 폴리펩타이드를 이용하는 것을 제공한다. 본원에서, "생촉매"는 화학 반응을 개시 또는 속도를 변형시키는 생물학적 물질을 지칭한다. 생촉매는 효소일 수 있다. 본 발명의 폴리펩타이드는 기질을 본원에 기술된 생산물로 변환하는 속도를 증가시키기 위해 사용될 수 있다. 공업적인 반응 (industrial reaction) 맥락에서, 본 발명의 폴리펩타이드는, 반응을 개선하여 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 (downstream product)을, 예를 들어 시험관내 방법을 이용해 제조하기 위해, 폴리펩타이드를 발현하는 숙주 세포 없이 사용할 수 있다. 일 구현예에서, 본 발명은 생촉매로서 본 발명의 폴리펩타이드의 용도를 제공한다.
본 발명의 일부 구현예에서, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드는 알데하이드 데하이드로게나제를 발현하는 세포의 세포용해물로서 제공된다. 이 경우, 세포용해물은 3-하이드록시부티릴-CoA에서 3-하이드록시부티르알데하이드로의 변환, 또는 4-하이드록시부티릴-CoA로부터 4-하이드록시부티르알데하이드로의 변환, 또는 역 반응을 시험관내 반응으로 수행하기 위한 알데하이드 데하이드로게나제의 소스로서 사용된다. 다른 구현예에서, 알데하이드 데하이드로게나제는 일부 정제된 형태로, 예를 들어 세포용해물로부터 일부 정제된 형태로 제공될 수 있다. 다른 구현예에서, 알데하이드 데하이드로게나제는, 알데하이드 데하이드로게나제가 세포 추출물의 성분들 등의 다른 성분들로부터 실질적으로 정제된, 실질적으로 정제된 형태로 제공될 수 있다. 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드를 일부 정제하거나 또는 실질적으로 정제하는 방법은 본원에 기술된 바와 같이 당해 기술 분야에 잘 알려져 있다. 일부 구현예에서, 알데하이드 데하이드로게나제를 고체 지지체, 예를 들어, 비드, 플레이트 또는 막에 고정한다. 특정 구현예에서, 알데하이드 데하이드로게나제는 친화성 태그를 포함하며, 친화성 태그를 사용해 알데하이드 데하이드로게나제를 고체 지지체에 고정한다. 이러한 친화성 태그로는, 비-제한적으로, 본원에 기술된 바와 같이, 글루타티온 S 트랜스퍼라제 (GST), poly His, 스트렙타비딘 등을 포함한다.
일부 구현예에서, 본 발명은 본원에 기술된 폴리펩타이드 및 이러한 폴리펩타이드에 대한 하나 이상의 기질을 가진 조성물을 제공한다. 본원에 기술된 각 폴리펩타이드에 대한 기질들은 본원에 기술되어 있으며, 도면에 예시되어 있다. 본 발명의 조성물 내 폴리펩타이드는 시험관내 또는 생체내 조건에서 기질과 반응할 수 있다. 이러한 맥락에서, 시험관내 조건은 본 발명의 세포 등의 세포 부재 하에 또는 세포 외부에서의 반응을 의미한다.
일 구현예에서, 본 발명은 본 발명의 폴리펩타이드 및 이러한 폴리펩타이드에 대한 하나 이상의 기질을 포함하는 조성물을 제공한다. 일 구현예에서, 폴리펩타이드는 시험관내 조건에서 기질과 반응할 수 있다. 일 구현예에서, 기질은 3-하이드록시부티릴-CoA이다. 일 구현예에서, 기질은 3-하이드록시-(R)-부티릴-CoA이다. 일 구현예에서, 기질은 4-하이드록시부티릴-CoA이다.
일부 구현예에서, 본 발명은, 다른 단계들 중에서도, 숙주 세포, 예를 들어, 벡터에 의해 코딩된 아미노산 서열을 발현할 수 있거나 및/또는 발효가능한, 숙주 세포에 본원에 기술된 벡터를 도입하는 단계를 포함할 수 있는, 숙주 균주를 구축하는 방법을 제공한다. 본 발명의 벡터는, 비-제한적인 예로, 접합, 전기천공, 화학적 형질전환, 형질도입, 형질감염 및 초음파 형질전환 등의 당해 기술 분야에 널리 공지된 기술을 이용해, 숙주 세포에 안정적으로 또는 일시적으로 도입시킬 수 있다. 본원에 부가적인 방법들이 기술되어 있으며, 이중 임의의 한가지 방법이 본 발명의 방법에 사용될 수 있다.
부가적인 구현예에서, 본 발명은 본 발명의 폴리펩타이드, 즉 본 발명의 알데하이드 데하이드로게나제를 포함하는 세포를 제공한다. 이에, 본 발명은 본 발명의 알데하이드 데하이드로게나제를 코딩하는 폴리펩타이드를 포함하는 비-천연성 세포를 제공한다. 선택적으로, 세포는 3-HBal 또는 1,3-BDO 경로, 또는 4-HBal 또는 1,4-BDO 경로를 포함할 수 있으며, 그리고 부가적으로 선택적으로 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위한 경로를 포함할 수 있다. 일부 구현예에서, 비-천연성 세포는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함한다. 당해 기술 분야의 당업자는, 이것이 단순 예이고, 원하는 생산물을 생산하기에 적합하고 기질에서 생산물로의 변환에 이용가능한 적절한 활성을 가진 본원에 기술된 기질-산물 쌍들 중 임의 쌍이, 본원에 교시된 내용을 토대로 당해 기술 분야의 당업자에 의해 쉽게 결정될 수 있는 것으로 이해할 것이다. 이에, 특정 구현예에서, 본 발명은, 알데하이드 데하이드로게나제가 도 1 및 2에 도시된 바와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서 기능하는, 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함하는, 세포, 특히 비-천연성 세포를 제공한다.
일 구현예에서, 본 발명은 본 발명의 핵산을 포함하는 본 발명의 벡터를 포함하는 세포를 제공한다. 또한, 본 발명은 본 발명의 핵산을 포함하는 세포를 제공한다. 일 구현예에서, 핵산 분자는 세포의 염색체에 병합된다. 특정 구현예에서, 병합은 부위-특이적이다. 본 발명의 일 구현예에서, 핵산 분자가 발현된다. 일 구현예에서, 본 발명은 본 발명의 폴리펩타이드를 포함하는 세포를 제공한다.
일 구현예에서, 벡터, 핵산 또는 폴리펩타이드를 포함하는 세포는 미생물 유기체이다. 특정 구현예에서, 미생물 유기체는 박테리아, 효모 또는 진균이다. 특정 구현예에서, 세포는 단리된 진핵생물 세포이다.
일 구현예에서, 세포는 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드를 생산하는 경로를 포함한다. 다른 구현예에서, 세포는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드를 생산하는 경로를 포함한다. 일 구현예에서, 세포는 발효할 수 있다. 일 구현예에서, 세포는 세포에서 발현되는 본 발명의 폴리펩타이드에 대한 하나 이상의 기질을 더 포함한다. 특정 구현예에서, 기질은 3-하이드록시부티릴-CoA이다. 특정 구현예에서, 기질은 3-하이드록시-(R)-부티릴-CoA이다. 일 구현예에서, 세포는 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가진다. 다른 특정 구현예에서, 기질은 4-하이드록시부티릴-CoA이다. 또한, 본 발명은 본 발명의 세포를 포함하는 배양 배지를 제공한다.
본 발명의 알데하이드 데하이드로게나제는 아실-CoA를 이의 대응되는 알데하이드로 변환하는 경로에 이용할 수 있다. 알데하이드 데하이드로게나제를 포함하는 예시적인 3-HBal 및/또는 1,3-BDO 경로는, 예를 들어, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983, US 2013/0066035에 기술되어 있으며, 이들 문헌은 각각 원용에 의해 본 명세서에 포함된다.
3-HBal 및/또는 1,3-BDO 경로의 예들은 도 1에 도시되며, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983 및 US 2013/0066035에 기술되어 있다. 알데하이드 데하이드로게나제를 포함하는 이러한 3-HBal 및/또는 1,3-BDO 경로는, 예를 들어, (G) 아세토아세틸-CoA 리덕타제 (케톤 환원); (H) 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성), 본원에서 3-하이드록시부티르알데하이드 데하이드로게나제, 알데하이드 데하이드로게나제 (ALD)로도 지칭됨; 및 (C) 3-하이드록시부티르알데하이드 리덕타제, 본원에서 1,3-BDO 데하이드로게나제로도 지칭됨 (도 1 참조)를 포함한다. 아세토아세틸-CoA는 티올라제를 사용해 아세틸-CoA 2분자를 아세토아세틸-CoA 1분자로 변환함으로써 제조할 수 있다. 아세토아세틸-CoA 티올라제는 아세틸-CoA 2분자를 아세토아세틸-CoA 1분자 및 CoA 1분자로 변환한다 (WO 2013/036764 및 US 2013/0066035 참조).
1,3-BDO 경로의 예는 WO 2010/127319의 도 2에 도시되어 있다. 간략하게는, 아세토아세틸-CoA 리덕타제 (케톤 환원)(EC 1.1.1.a)에 의해 아세토아세틸-CoA를 3-하이드록시부티릴-CoA로 변환할 수 있다 (도 1의 단계 G). 3-하이드록시부티릴-CoA는, 본 발명의 알데하이드 데하이드로게나제 등의 본원에서 3-하이드록시부티르알데하이드 데하이드로게나제로도 지칭되는, 3-하이드록시부티릴-CoA 리덕타제 (알데하이드 형성)(EC 1.2.1.b)에 의해 3-하이드록시부티르알데하이드로 변환할 수 있다 (도 1의 단계 H). 3-하이드록시부티르알데하이드는, 본원에서 1,3-BDO 데하이드로게나제로도 지칭되는 3-하이드록시부티르알데하이드 리덕타제 (EC 1.1.1.a)에 의해 1,3-부탄다이올로 변환할 수 있다 (도 1의 단계 C).
본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하는 경로에서 기능할 수 있다. 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하는 알데하이드 데하이드로게나제를 포함하는 전술한 경로에서, 이 경로는 아세토아세틸-CoA를 3-하이드록시부티릴-CoA로 변환한다 (도 1 참조). 또한, 본 발명의 알데하이드 데하이드로게나제는, 경로에서 기질/산물로서 3-하이드록시부티릴-CoA를 포함하는, 다른 3-HBal 및/또는 1,3-BDO 경로들에 사용할 수 있다. 당해 기술 분야의 당업자라면, 상기한 반응을 포함하는 임의의 원하는 경로에서 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환하기 위해 본 발명의 알데하이드 데하이드로게나제를 쉽게 이용할 수 있다.
4-HBal 및/또는 1,4-BDO 경로의 예들은 도 2에 도시되며, WO 2008/115840, WO 2010/030711, WO 2010/141920, WO 2011/047101, WO 2013/184602, WO 2014/176514, 미국 특허 8,067,214, 미국 특허 7,858,350, 미국 특허 8,129,169, 미국 특허 8,377,666, US 2013/0029381, US 2014/0030779, US 2015/0148513 및 US 2014/0371417에 기술되어 있다. 알데하이드 데하이드로게나제를 포함하는 이러한 4-HBal 및/또는 1,4-BDO 경로는, 예를 들어, (1) 숙시닐-CoA 신테타제; (2) CoA-비의존적인 숙시닉 세미알데하이드 데하이드로게나제; (3) α-케토글루타레이트 데하이드로게나제; (4) 글루타메이트:숙시네이트 세미알데하이드 트랜스아미나제; (5) 글루타메이트 데카르복실라제; (6) CoA-의존적인 숙시닉 세미알데하이드 데하이드로게나제; (7) 4-하이드록시부타노에이트 데하이드로게나제; (8) α-케토글루타레이트 데카르복실라제; (9) 4-하이드록시부티릴 CoA:아세틸-CoA 트랜스퍼라제; (10) 부티레이트 키나제 (4-하이드록시부티레이트 키나제로도 지칭됨); (11) 포스포트랜스부티릴라제 (포스포-트랜스-4-하이드록시부티릴라제로도 지칭됨); (12) 알데하이드 데하이드로게나제 (4-하이드록시부티릴-CoA 리덕타제로도 지칭됨); (13) 알코올 데하이드로게나제, 예를 들어 1,4-부탄다이올 데하이드로게나제 (4-하이드록시부타날 리덕타제 또는 4-하이드록시부티르알데하이드 리덕타제로도 지칭됨)(도 2 참조)를 포함한다.
도 2와 마찬가지로, 1,4-BDO 경로의 예는 WO 2010/141920의 도 8a에 도시되어 있다. 간략하게는, 숙시닐-CoA는 숙시닐-CoA 리덕타제 (또는 숙시네이트 세미알데하이드 데하이드로게나제) (EC 1.2.1.b)에 의해 숙시닉 세미알데하이드로 변환할 수 있다. 숙시네이트 세미알데하이드는 4-하이드록시부티레이트 데하이드로게나제 (EC 1.1.1.a)에 의해 4-하이드록시부티레이트로 변환할 수 있다. 다른 예로, 숙시닐-CoA는 숙시닐-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 4-하이드록시부티레이트로 변환할 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-CoA 트랜스퍼라제 (EC 2.8.3.a), 4-하이드록시부티릴-CoA 하이드롤라제 (EC 3.1.2.a) 또는 4-하이드록시부티릴-CoA 리가제 (또는 4-하이드록시부티릴-CoA 신테타제) (EC 6.2.1.a)에 의해 4-하이드록시부티릴-CoA로 변환할 수 있다. 다른 예로, 4-하이드록시부티레이트는 4-하이드록시부티레이트 키나제 (EC 2.7.2.a)에 의해 4-하이드록시부티릴-포스페이트로 변환할 수 있다. 4-하이드록시부티릴-포스페이트는 포스포트랜스-4-하이드록시부티릴라제 (EC 2.3.1.a)에 의해 4-하이드록시부티릴-CoA로 변환할 수 있다. 다른 예로, 4-하이드록시부티릴-포스페이트는 4-하이드록시부타날 데하이드로게나제 (인산화) (EC 1.2.1.d)에 의해 4-하이드록시부타날로 변환할 수 있다. 4-하이드록시부티릴-CoA는 본 발명의 알데하이드 데하이드로게나제 변이체에 의한 것을 포함하여, 4-하이드록시부티릴-CoA 리덕타제 (또는 4-하이드록시부타날 데하이드로게나제) (EC 1.2.1.b)에 의해 4-하이드록시부타날로 변환할 수 있다. 다른 예로, 4-하이드록시부티릴-CoA는 4-하이드록시부티릴-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 1,4-부탄다이올로 변환할 수 있다. 4-하이드록시부타날은 1,4-부탄다이올 데하이드로게나제 (EC 1.1.1.a)에 의해 1,4-부탄다이올로 변환할 수 있다.
1,4-BDO 경로의 예들은 WO 2010/141920의 도 8B에 도시되어 있다. 간략하게는, α-케토글루타레이트는 α-케토글루타레이트 데카르복실라제 (EC 4.1.1.a)에 의해 숙시닉 세미알데하이드로 변환될 수 있다. 다른 예로, α-케토글루타레이트는 글루타메이트로 글루타메이트 데하이드로게나제 (EC 1.4.1.a)에 의해 변환될 수 있다. 4-아미노부티레이트는 숙시닉 세미알데하이드로 4-아미노부티레이트 옥시도리덕타제 (탈아민화) (EC 1.4.1.a) 또는 4-아미노부티레이트 트랜스아미나제 (EC 2.6.1.a)에 의해 변환될 수 있다. 글루타메이트는 4-아미노부티레이트로 글루타메이트 데카르복실라제 (EC 4.1.1.a)에 의해 변환될 수 있다. 숙시네이트 세미알데하이드는 4-하이드록시부티레이트로 4-하이드록시부티레이트 데하이드로게나제 (EC 1.1.1.a)에 의해 변환될 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-CoA로 4-하이드록시부티릴-CoA 트랜스퍼라제 (EC 2.8.3.a), 4-하이드록시부티릴-CoA 하이드롤라제 (EC 3.1.2.a) 또는 4-하이드록시부티릴-CoA 리가제 (또는 4-하이드록시부티릴-CoA 신테타제) (EC 6.2.1.a)에 의해 변환될 수 있다. 4-하이드록시부티레이트는 4-하이드록시부티릴-포스페이트로 4-하이드록시부티레이트 키나제 (EC 2.7.2.a)에 의해 변환될 수 있다. 4-하이드록시부티릴-포스페이트는 4-하이드록시부티릴-CoA로 포스포트랜스-4-하이드록시부티릴라제 (EC 2.3.1.a)에 의해 변환될 수 있다. 다른 예로, 4-하이드록시부티릴-포스페이트는 4-하이드록시부타날로 4-하이드록시부타날 데하이드로게나제 (인산화) (EC 1.2.1.d)에 의해 변환될 수 있다. 4-하이드록시부티릴-CoA는 4-하이드록시부타날로 본 발명의 알데하이드 데하이드로게나제 등의 4-하이드록시부티릴-CoA 리덕타제 (또는 4-하이드록시부타날 데하이드로게나제) (EC 1.2.1.b)에 의해 변환될 수 있다. 4-하이드록시부티릴-CoA는 1,4-부탄다이올로 4-하이드록시부티릴-CoA 리덕타제 (알코올 형성) (EC 1.1.1.c)에 의해 변환될 수 있다. 4-하이드록시부타날은 1,4-부탄다이올로 1,4-부탄다이올 데하이드로게나제 (EC 1.1.1.a)에 의해 변환될 수 있다.
본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하는 경로에서 기능할 수 있다. 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하는 알데하이드 데하이드로게나제를 포함하는 전술한 경로에서, 이 경로는 4-하이드록시부티레이트를 4-하이드록시부티릴-CoA로 또는 4-하이드록시부티릴 포스페이트를 4-하이드록시부티릴-CoA로 변환한다 (도 2 참조). 또한, 본 발명의 알데하이드 데하이드로게나제는, 경로에서 기질/산물로서 4-하이드록시부티릴-CoA를 포함하는, 다른 4-HBal 및/또는 1,4-BDO 경로들에 사용할 수 있다. 당해 기술 분야의 당업자라면, 이러한 반응을 포함하는 임의의 원하는 경로에서, 본 발명의 알데하이드 데하이드로게나제를 사용해 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있다. 예를 들어, 4-옥소부티릴-CoA를 WO 2010/141290, 도 9A에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 또한, 5-하이드록시-2-옥소펜탄산을 WO 2010/141290, 도 10 및 11에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 또한, 아세토아세틸-CoA, 3-하이드록시부티릴-CoA, 크로토닐-CoA 및/또는 비닐아세틸-CoA를 WO 2010/141290, 도 12에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 아울러, 4-하이드록시부트-2-에노일-CoA를 WO 2010/141290, 도 13에 기술 및 도시된 바와 같이 4-하이드록시부티릴-CoA로 변환할 수 있다. 즉, 당해 기술 분야의 당업자라면, 필요에 따라 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환하는 것을 포함하는 4-HBal 및/또는 1,4-BDO 경로에서 본 발명의 알데하이드 데하이드로게나제를 이용하는 방법을 쉽게 이해할 것이다.
공통적인 핵심 대사 중간산물을 1,3-BDO 또는 1,4-BDO로 변환하는데 필요한 효소 타입은 대표적인 EC (Enzyme Commission) 번호와 함께 상기에 기술된다 (WO 2010/127319, WO 2013/036764, WO 2008/115840, WO 2010/030711, WO 2010/141920, WO 2011/047101, WO 2013/184602, WO 2014/176514, 미국 특허 9,017,983, 미국 특허 8,067,214, 미국 특허 7,858,350, 미국 특허 8,129,169, 미국 특허 8,377,666, US 2013/0066035, US 2013/0029381, US 2014/0030779, US 2015/0148513 및 US 2014/0371417을 참조함). 각 라벨에서 앞에 위치한 숫자 3개는 기질 특이성과 독립적인 일반적인 변환 타입을 나타내는 효소 위원회 번호에서의 앞 숫자 3개이다. 효소의 예로는 1.1.1.a, 옥시도리덕타제 (케톤 -> 하이드록실 또는 알데하이드 -> 알코올); 1.1.1.c, 옥시도리덕타제 (2단계, 아실-CoA -> 알코올); 1.2.1.b, 옥시도리덕타제 (아실-CoA -> 알데하이드); 1.2.1.c, 옥시도리덕타제 (2-옥소산 -> 아실-CoA, 데카르복시화); 1.2.1.d, 옥시도리덕타제 (인산화/탈인산화); 1.3.1.a, CH-CH 도너에 작용하는 옥시도리덕타제; 1.4.1.a, 아미노산에 작용하는 옥시도리덕타제 (탈아민화); 2.3.1.a, 아실트랜스퍼라제 (포스페이트 기 전달); 2.6.1.a, 아미노트랜스퍼라제; 2.7.2.a, 포스포트랜스퍼라제, 카르복시기 어셉터; 2.8.3.a, 코엔자임-A 트랜스퍼라제; 3.1.2.a, 티올에스테르 하이드롤라제 (CoA 특이적); 4.1.1.a, 카르브옥시-리아제; 4.2.1.a, 하이드로-리아제; 4.3.1.a, 암모니아-리아제; 5.3.3.a, 이소머라제; 5.4.3.a, 아미노무타제; 및 6.2.1.a, 산-티올 리가제 등이 있다.
본 발명의 알데하이드 데하이드로게나제는 세포에서 또는 시험관내에서 사용해 아실-CoA를 이의 대응되는 알데하이드로 변환할 수 있다. 본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제는, 비-제한적인 예로, S 거울상이성질체와 비교해 3-하이드록시부티릴-CoA에 대한 R 거울상이성질체의 특이성 증가, 아세틸-CoA 대비 3-하이드록시부티릴-CoA 및/또는 4-하이드록시부티릴-CoA에 대한 특이성 증가, 활성 증가, 부산물 발생 감소, kcat 증가 등의, 유익하고 유용한 특성을 가진다. 본 발명의 알데하이드 데하이드로게나제를 이용해, 본 발명의 알데하이드 데하이드로게나제의 생산물 효소적으로 변환함으로써 1,3-부탄다이올 데하이드로게나제를 사용해 3-하이드록시-(R)-부티르알데하이드를 (R)-1,3-부탄다이올로 효소적으로 변환함으로써, 1,3-부탄다이올의 R-형태 ((R)-1,3-부탄다이올이라고도 함)를 제조할 수 있다.
1,3-부탄다이올의 생물-유래 R-형태는, R-형태가 바람직한 다운스트림 산물을 생산하는데 이용할 수 있다. 일부 구현예에서, R-형태는 약제 및/또는 뉴트라슈티컬로서 활용할 수 있다 (WO 2014/190251 참조). 예를 들어, (R)-1,3-부탄다이올은, 혈중 케톤체 농도 증가 등의 유익한 효과를 가질 수 있는, (3R)-하이드록시부틸 (3R)-하이드록시부티레이트를 생산하는데 이용할 수 있다. 케톤체 농도 증가는 신체 및 인지 성능 강화 및 심혈관 병태, 당뇨병 및 미토콘드리아 기능부전 장애의 치료 및 근육 피로와 손상 치료 등의, 다양한 임상적인 이점을 달성할 수 있다 (WO 2014/190251 참조). 1,3-부탄다이올의 생물-유래 R-형태는, 예를 들어, 석유-유래 라세메이트 1,3-부탄다이올, 이의 S-형태 또는 R-형태를 생물-유래 R-형태로 치환함으로써, 비-석유계 생산물이 바람직한 다운스트림 산물을 생산하는데 이용할 수 있다.
일 구현예에서, 본 발명은, 화합물의 R 형태에 대해 거울상이성질체 측면에서 농화된, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 제공한다. 일부 구현예에서, 3-HBal 또는 1,3-BDO는 R-거울상이성질체 측면에서 농화된 라세메이트이며, 즉 S-거울상이성질체 보다 R-거울상이성질체를 더 많이 함유한다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 55% 이상으로, S-거울상이성질체를 45% 미만으로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 60% 이상으로, S-거울상이성질체를 40% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 65% 이상으로, S-거울상이성질체를 35% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 70% 이상으로, S-거울상이성질체를 30% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 75% 이상으로, S-거울상이성질체를 25% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 80% 이상으로, S-거울상이성질체를 20% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 85% 이상으로, S-거울상이성질체를 15% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 90% 이상으로, S-거울상이성질체를 10% 이하로 포함할 수 있다. 예를 들어, 3-HBal 또는 1,3-BDO 라세메이트는 R-거울상이성질체를 95% 이상으로, S-거울상이성질체를 5% 이하로 포함할 수 있다. 일부 구현예에서, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물은 R 형태를 90% 보다 많이, 예를 들어, R 형태를 95% 초과로, 96% 초과로, 97% 초과로, 98% 초과로, 99% 초과로 또는 99.9% 초과로 포함한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물은, ≥55% R-거울상 이성질체, ≥60% R-거울상 이성질체, ≥65% R-거울상 이성질체, ≥70% R-거울상 이성질체, ≥75% R-거울상 이성질체, ≥80% R-거울상 이성질체, ≥85% R-거울상 이성질체, ≥90% R-거울상 이성질체 또는 ≥95% R-거울상 이성질체이며, 화학적으로 고도로 순수할 수 있으며, 예를 들어 ≥99%일 수 있으며, 예로, R-거울상이성질체가 ≥95%, ≥96%, ≥97%, ≥98%, ≥99%, ≥99.1%, ≥99.2%, ≥99.3%, ≥99.4%, ≥99.5%, ≥99.6%, ≥99.7%, ≥99.8% 또는 ≥99.9%일 수 있다.
일 구현예에서, 3-HBal 및/또는 1,3-BDO의 전구체의 석유-유래 (petroleum-derived) 라세믹 혼합물, 특히 3-하이드록시부티릴-CoA의 라세믹 혼합물은, R 형태로 거울상이성질체 측면에서 농화된, 3-HBal 또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 제조하기 위해, S 형태에 비해 R 형태에 대해 증가된 특이성을 나타내는 본 발명의 알데하이드 데하이드로게나제의 기질로서 사용된다. 이러한 반응은 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포, 특히 전구체를 3-하이드록시부티릴-CoA로 변환할 수 있는 세포에 석유-유래 전구체를 공급함으로써 수행할 수 있거나, 또는 석유-유래 전구체를 3-하이드록시부티릴-CoA로 변환하기 위한 하나 이상의 효소를 이용하여 시험관내에서, 또는 생체내 반응과 시험관내 반응의 조합으로 수행할 수 있다. 본 발명의 알데하이드 데하이드로게나제를 이용해 4-하이드록시부티릴-CoA를 생산하기 위한 반응은, 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포, 특히 전구체를 4-하이드록시부티릴-CoA로 변환할 수 있는 세포에 석유-유래 전구체를 공급함으로써 마찬가지로 수행할 수 있거나, 또는 석유-유래 전구체를 4-하이드록시부티릴-CoA로 변환하는 하나 이상의 효소를 사용해 시험관내에서 또는 생체내 반응과 시험관내 반응의 조합을 이용하여 수행할 수 있다.
본원에서는 일반적으로 본 발명의 알데하이드 데하이드로게나제를 포함하는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로를 가진 세포에 대해 기술하지만, 본 발명은 또한 본 발명의 알데하이드 데하이드로게나제를 코딩하는 하나 이상의 외인성 핵산을 포함하는 세포도 제공하는 것으로 이해된다. 알데하이드 데하이드로게나제는 바람직한 생산물, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 생산물, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산할만큼 충분한 양으로 발현될 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 예들은 도 1 및 2에 도시되며, 본원에 기술된다.
실시예에 기술되고 도 1 및 도 2의 경로 등의 도면에 예시된 바와 같이, 본원에 기술된 임의 경로는, 필요에 따라 임의의 경로 중간산물 또는 생산물을 생산하는 세포를 생산하는 세포, 특히 본 발명의 알데하이드 데하이드로게나제를 이용하는 경로를 구축하는데 이용할 수 있는 것으로, 이해된다. 본원에 기술된 바와 같이, 중간산물을 생산하는 이러한 세포는 바람직한 생산물을 생산하기 위해 하나 이상의 업스트림 또는 다운스트림 경로 효소들을 발현하는 다른 세포와 조합하여 사용할 수 있다. 그러나, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 생산하는 세포는 바람직한 생산물로서 중간산물을 생산하는데 이용할 수 있는 것으로 이해된다.
본 발명은 대사 반응, 반응제 또는 이의 생산물을 일반적으로 참조하거나, 또는 참조한 대사 반응, 반응제 또는 생산물과 관련있는 단백질 또는 이를 촉매하거나 또는 이와 관련된 효소를 코딩하는 하나 이상의 핵산 또는 유전자를 구체적으로 참조하여 본원에 기술된다. 본원에 명확하게 언급되지 않은 한, 당해 기술 분야의 당업자는, 반응에 대한 언급 역시 반응의 반응제 및 생산물에 대한 언급임을 이해할 것이다. 마찬가지로, 본원에 명확하게 언급되지 않은 한, 반응제 또는 생산물에 대한 언급 역시 반응을 언급하는 것이며, 이들 임의의 대사 구성성분에 대한 언급 또한 참조 반응, 반응제 또는 생산물을 촉진하는 효소 또는 이에 참여한 단백질을 코딩하는 유전자 또는 유전자들을 언급하는 것이다. 마찬가지로, 널리 공지된 대사 생화학, 효소학 및 게놈 분야를 감안해, 유전자 또는 코딩 핵산에 대한 언급은 대응되는 코딩된 효소 및 이것이 촉매하는 반응 또는 반응과 관련된 단백질뿐 아니라 반응의 반응제 및 생산물을 또한 언급하는 것이다.
본원에 기술된 바와 같이, 생산물 또는 경로 중간산물, 즉 카르복시산은, 완전히 양성자화된 (fully protonated), 부분 양성자화된 및 완전히 탈양성자화된 형태 (fully deprotonated form) 등의, 다양한 이온화된 형태로 제조할 수 있다. 즉, 접미사 "-에이트" 또는 산 형태는, 특히, 이온화된 형태가 화합물이 발견되는 pH에 의존적인 것으로 공지되어 있으므로, 유리 산 형태뿐 아니라 임의의 탈양성화된 형태 둘다를 기술하기 위해 상호 호환적으로 사용될 수 있다. 카르복실레이트 생산물 또는 중간산물은, O-카르복실레이트 및 S-카르복실레이트 에스테르 등의, 카르복실레이트 생산물의 에스테르 형태 또는 경로 중간산물을 포함하는 것으로 이해된다. O- 및 S-카르복실레이트는 저급 알킬을 포함할 수 있으며, C1 내지 C6의 분지쇄 또는 직쇄 카르복실레이트이다. 이러한 O- 또는 S-카르복실레이트의 일부로는, 비-제한적으로, 메틸, 에틸, n-프로필, n-부틸, i-프로필, sec-부틸 및 tert-부틸, 펜틸, 헥실 O- 또는 S-카르복실레이트 등이 있으며, 이들 중 임의의 것은 불포화를 추가적으로 포함하여, 예를 들어 프로페닐, 부테닐, 펜틸 및 헥세닐 O- 또는 S-카르복실레이트를 제공할 수 있다. O-카르복실레이트는 생합성 경로의 생산물일 수 있다. 그외 생합성에 의해 입수가능한 O-카르복실레이트는, C7-C22인 중간쇄 내지 장쇄 기들, 지방 알코올 유래 O-카르복실레이트 에스테르, 예를 들어, 헵틸, 옥틸, 노닐, 데실, 운데실, 라우릴, 트리데실, 미리스틸, 펜타데실, 세틸, 팔미톨릴, 헵타데실, 스테아릴, 노나데실, 아라키딜, 헨에이코실 및 베헤닐 알코올을 포함할 수 있으며, 이들 중 임의의 기는 선택적으로 분지화될 수 있으며, 및/또는 불포화를 포함할 수 있다. 또한, O-카르복실레이트 에스테르는 유리 카르복시산 생산물의 에스테르화 또는 O- 또는 S-카르복실레이트의 트랜스에스테르화와 같은, 생화학적 또는 화학적 공정을 통해 입수할 수 있다. S-카르복실레이트는 CoA S-에스테르, 시스테이닐 S-에스테르, 알킬티오에스테르 및 다양한 아릴 및 헤테로아릴 티오에스테르로 예시된다.
본 발명의 세포는, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 발현가능한 핵산, 및 선택적으로 하나 이상의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로에 참여하는 하나 이상의 효소 또는 단백질을 코딩하는 발현가능한 핵산, 및 또한 선택적으로 이의 에스테르 또는 아미드와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 도입함으로써, 제조할 수 있다. 선택 숙주 세포에 따라, 구체적인 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로 전체 또는 일부 또는 다운스트림 산물을 위한 핵산을 발현시킬 수 있다. 예를 들어, 선택 숙주에서 원하는 생합성 경로를 위한 하나 이상의 효소 또는 단백질이 결핍되어 있다면, 결핍된 효소(들) 또는 단백질(들)에 대한 발현가능한 핵산을 후속적인 외인성 발현을 위해 숙주에 도입한다. 다른 예로, 선택 숙주가 일부 경로 유전자들의 내인성 발현을 나타내지만 다른 것들은 결핍된 경우에는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성을 달성하기 위해, 결핍 효소(들) 또는 단백질(들)에 대한 코딩 핵산을 포함시키거나, 또는 필요에 따라 경로 효소의 발현을 증가시키기 위해 내인성으로 발현되는 유전자의 외인성 발현을 제공할 수 있다. 이에, 본 발명의 세포는, 본 발명의 알데하이드 데하이드로게나제, 선택적으로 원하는 생합성 경로를 수득하기 위한 외인성 효소 또는 단백질 활성을 도입하거나, 또는 하나 이상의 내인성 효소 또는 단백질과 더불어 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물과 같은 원하는 생산물을 생산하는, 본 발명의 알데하이드 데하이드로게나제 등의 하나 이상의 외인성 효소 또는 단백질 활성을 도입함으로써, 제조할 수 있다.
숙주 세포는, 예를 들어, 박테리아, 효모, 진균 또는 발효 공정에 적용가능하거나 또는 적합한 다양한 임의의 미생물에서 생산되는 본 발명의 알데하이드 데하이드로게나제를 발현하는 비-천연성 세포로부터 선택될 수 있다. 박테리아의 예는 속명 에스케리키아 (Escherichia) 및 클렙시엘라 (Klebsiella) 등의, 장내세균목 (Enterobacteriales) 장내세균과 (Enterobacteriaceae); 속명 안에어로바이오스피릴륨 (Anaerobiospirillum) 등의, 과명 숙시니비브리오나시이 (Succinivibrionaceae)의 목명 에어로모나데일스 (Aeromonadales); 속명 액티노바실러스 (Actinobacillus) 및 만하이미아 (Mannheimia) 등의, 과명 파스퇴렐라시이 (Pasteurellaceae)의 목명 파스퇴렐레일스 (Pasteurellales); 속명 리조븀 (Rhizobium) 등의, 과명 브라디리조비아시이 (Bradyrhizobiaceae)의 목명 리조비에일스 (Rhizobiales); 속명 바실러스 (Bacillus) 등의, 과명 바실라시이 (Bacillaceae)의 목명 바실에일스 (Bacillales); 속명 코리네박테리움 (Corynebacterium) 및 스트렙토마이세스 (Streptomyces) 등의, 각각 과명 코리네박테리아시이 (Corynebacteriaceae) 및 스트렙토마이세타시이 (Streptomycetaceae)의목명 액티노바이세테일스 (Actinomycetales); 속명 글루코노박터 (Gluconobacter) 등의, 과명 아세토박테라시이 (Acetobacteraceae)의 목명 로도스피릴레일스 (Rhodospirillales); 속명 지모모나스 (Zymomonas) 등의, 과명 스핑고모나다시이 (Sphingomonadaceae)의 목명 스핑고모나데일스 (Sphingomonadales); 속명 락토바실러스 (Lactobacillus) 및 락토코커스 (Lactococcus) 등의, 각각 과명 락토바실라시이 (Lactobacillaceae) 및 스트렙토코카시이 (Streptococcaceae)의 목명 락토바실레일스 (Lactobacillales); 과명 클로스트리디아시이 (Clostridiaceae)의 목명 클로스트리디에일스 (Clostridiales), 예로 속명 클로스트리듐 (Clostridium); 과명 슈도모나다시이 (Pseudomonadaceae)의 목명 슈도모나데일스 (Pseudomonadales), 예로 속명 슈도모나스 (Pseudomonas)로부터 선택되는 임의의 종을 포함한다. 숙주 박테리아에 대한 비-제한적인 예로는 에스케리키아 콜라이 (Escherichia coli), 클렙시엘라 옥시토카 (Klebsiella oxytoca), 안에어로비오스피릴룸 숙시니시프로두센스 (Anaerobiospirillum succiniciproducens), 액티노바실러스 숙시노게네스 (Actinobacillus succinogenes), 만하이미아 숙시니시프로두센스 (Mannheimia succiniciproducens), 리조븀 에틸리 (Rhizobium etli), 바실러스 섭틸리스 (Bacillus subtilis), 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 클루코노박터 옥시단스 (Gluconobacter oxydans), 자이모모나스 모빌리스 (Zymomonas mobilis), 락토코커스 락티스 (Lactococcus lactis), 락토바실러스 플란타룸 (Lactobacillus plantarum), 스트렙토마이세스 코엘리콜러 (Streptomyces coelicolor), 클로스트리듐 아세토부틸리툼 (Clostridium acetobutylicum), 슈도모나스 플루오레센스 (Pseudomonas fluorescens) 및 슈도모나스 푸티다 (Pseudomonas putida) 등이 있다. E. coli는 유전자 조작에 적합한 잘 규명된 미생물 유기체이므로, 이 균주는 특히 유용한 숙주 미생물이다.
마찬가지로, 효모 또는 진균 종에 대한 예시적인 종으로는, 과 사카로마이세타시이 (Saccaromycetaceae) 목 사카로마이세테일스 (Saccharomycetales), 예를 들어 속 사카로마이세스 (Saccharomyces), 클루이베로마이세스 (Kluyveromyces) 및 피키아 (Pichia); 과 디포다스카시이 (Dipodascaceae) 목 사카로마이세테일스 (Saccharomycetales), 예를 들어 속 야로이와 (Yarrowia); 과 시조사카로마이세타시이 (Schizosaccaromycetaceae) 목 시조사카로마이세일스 (Schizosaccharomycetales), 예를 들어, 속 시조사카로마이세스 (Schizosaccharomyces); 과 트리코코마시이 (Trichocomaceae) 목 유로티에일스 (Eurotiales), 예를 들어 속 아스퍼질러스 (Aspergillus); 및 과 뮤코라시이 (Mucoraceae) 목 뮤코레일스 (Mucorales), 예를 들어 속 리조푸스 (Rhizopus)로부터 선택되는 임의의 종을 포함한다. 숙주 효모 또는 진균에 대한 비-제한적인 종으로는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 시조사카로마이세스 폼베 (Schizosaccharomyces pombe), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 클루이베로마이세스 마르시아누스 (Kluyveromyces marxianus), 아스퍼질러스 테레우스 (Aspergillus terreus), 아스퍼질러스 나이거 (Aspergillus niger), 피키아 파스토리스 (Pichia pastoris), 리조푸스 아리주스 (Rhizopus arrhizus), 리조부스 오리제 (Rhizobus oryzae), 야로이와 리폴리티카 (Yarrowia lipolytica) 등이 있다. 특히 유용한 숙주 효모 유기체는 사카로마이세스 세레비지애 (Saccharomyces cerevisiae)를 포함한다.
숙주 세포로서 미생물 유기체인 세포를 특히 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위해 이용하는 것으로 일반적으로 본원에서 기술되지만, 숙주 세포는 포유류 세포주 또는 곤충 세포주와 같은 고등 진핵생물의 세포주일 수 있는 것으로 이해된다. 즉, 미생물 유기체인 숙주 세포에 대한 본원의 언급이 대안적으로 원하는 생산물을 생산하기 위해 고등 진핵생물 세포를 활용할 수 있는 것으로 이해된다. 예시적인 고등 진핵생물 세포주로는, 비-제한적으로, 중국 햄스터 난소 (CHO), 인간 (Hela, 인간 배아 신장 (HEK) 293, Jurkat), 마우스 (3T3), 영장류 (Vero), 곤충 (Sf9) 등이 있다. 이들 세포주는 상업적으로 구입가능하다 (예, the American Type Culture Collection (ATCC; Manassas VA); Life Technologies, Carlsbad CA). 임의의 적절한 숙주 세포를 이용해 본 발명의 알데하이드 데하이드로게나제를 도입하고, 선택적으로 대사 및/또는 유전자 변형을 도입하여 원하는 생산물을 생산할 수 있는 것으로 이해된다.
선택 숙주 세포의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로의 구성 요소들에 따라, 본 발명의 비-천연성 세포는 하나 이상의 외인성으로 발현되는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로-코딩 핵산, 그리고 최대한으로는 하나 이상의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 코딩하는 핵산 전부, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 위한 것, 예를 들어 본 발명의 알데하이드 데하이드로게나제를 포함할 것이다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성은, 본 발명의 알데하이드 데하이드로게나제 등의, 대응되는 코딩 핵산을 외인성으로 발현함으로써 경로 효소 또는 단백질이 결핍된 숙주에서 확립할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 위한 모든 효소 또는 단백질이 모두 결핍된 숙주의 경우, 숙주가 하나 이상의 경로 효소 또는 단백질을 포함하더라도 경로의 모든 효소 또는 단백질을 발현시킬 수 있는 것으로 이해됨에도 불구하고, 경로의 모든 효소 또는 단백질의 외인성 발현을 포함할 수 있다. 예를 들어, 본 발명의 알데하이드 데하이드로게나제를 비롯하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생산 경로에서 모든 효소 또는 단백질의 외인성 발현을 포함할 수 있다.
본원에 제공된 교시 내용 및 지침을 감안하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로를 세포에 포함시키거자 한다면, 발현가능한 형태로 도입하기 위한 코딩 핵산의 개수는 적어도 선택 숙주 세포의 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO 경로에서 결여된 것에 대응함을, 당해 기술 분야의 당업자라면 이해할 것이다. 따라서, 본 발명의 비-천연성 세포는, 본원에 기술된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 구성하는 효소 또는 단백질을 코딩하는 핵산들을, 구체적인 경로에 따라, 1, 2, 3, 4, 5, 6, 7, 8종 등, 최대한으로는, 이들 전부를 포함할 수 있다. 일부 구현예에서, 비-천연성 세포는 또한 숙주 세포에 다른 유용한 기능을 부여하는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성을 촉진하거나 또는 최적화하는 다른 유전자 변형을 포함할 수 있다. 이러한 다른 기능성으로는, 예를 들어, 아세틸-CoA 또는 아세토아세틸-CoA 등의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 전구체들 중 하나 이상의 합성 증가를 포함할 수 있다.
일반적으로, 숙주 세포는, 본 발명의 알데하이드 데하이드로게나제를 발현할 수 있으며, 선택적으로 숙주 세포에 의해 천연적으로 생산되는 전구체의 생산 증가 또는 요망하는 전구체의 데 노보 생산을 제공하는 조작된 생산물로서, 또는 천연적으로 생산되는 분자로서, 이러한 경로를 함유한 세포에서 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 전구체를 생산할 수 있도록, 선택된다. 숙주 유기체는 본원에 기술된 바와 같이 전구체의 생산을 높이도록 조작할 수 있다. 또한, 원하는 전구체를 생산하도록 조작된 세포를 숙주 유기체로서 이용할 수 있으며, 필요에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 효소 또는 단백질을 발현하도록 추가로 조작할 수 있다.
일부 구현예에서, 본 발명의 비-천연성 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 합성하는 효소 능력을 포함하는 숙주로부터 구축된다. 이러한 특정 구현예에서, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 반응을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 방향으로 향하게 하기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 생산물의 합성 또는 축적을 증가시키는 것이 유용할 수 있다. 합성 또는 축적 증가는, 예를 들어, 본 발명의 알데하이드 데하이드로게나제 등의, 전술한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질들 중 하나 이상을 코딩하는 핵산의 과발현에 의해 달성할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 효소 또는 효소들 및/또는 단백질 또는 단백질들의 과발현은, 예를 들어, 본 발명의 알데하이드 데하이드로게나제의 외인성 발현 등의, 내인성 유전자 또는 유전자들의 외인성 발현을 통해, 또는 이종의 유전자 또는 유전자들의 외인성 발현을 통해 이루어질 수 있다. 따라서, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 1, 2, 3, 4, 5, 6, 7, 8 또는 그 이상, 최대 전부 과발현시킴으로써, 예를 들어 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 발현하는, 비-천연성 세포로 천연성 유기체를 쉽게 변환시킬 수 있다. 또한, 비-천연성 유기체는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로에서 효소의 활성, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 증가시키는, 내인성 유전자의 돌연변이 유발에 통해 구축할 수 있다.
특히 유용한 구현예에서, 인코딩 핵산의 외인성 발현을 이용한다. 외인성 발현은, 사용자에 의해 조절되는 원하는 발현 수준을 달성하기 위해, 발현 및/또는 조절 요소를 맞춤 조절하는 능력을 숙주 및 어플리케이션에 부여한다. 그러나, 내인성 발현도, 유도성 프로모터 또는 다른 조절 인자와 연계되었을 경우, 유전자의 프로모터의 유도 또는 네거티브 조절 작동인자를 제거함으로써와 같이, 다른 구현예에서 이용할 수 있다. 따라서, 천연적인 유도성 프로모터를 가진 내인성 유전자는 적절한 유도성 물질을 제공함으로써 상향-조절하거나, 또는 내인성 유전자의 조절 영역을 유도성 조절 인자가 병합되도록 조작하여, 원하는 시점에 내인성 유전자의 발현 증가를 조절할 수 있다. 마찬가지로, 유도성 프로모터를 비-천연성 세포에 도입된 외인성 유전자에 대한 조절 인자로서 포함시킬 수 있다.
하나 이상의 임의의 외인성 핵산을 세포에 도입하여 본 발명의 비-천연성 세포를 제조할 수 있는 것으로 이해된다. 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산의 도입 등의, 예를 들어, 세포에 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 생합성 경로를 부여하기 위해, 핵산을 도입할 수 있다. 다른 예로, 인코딩 핵산을 도입하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성의 중간산물 생산력을 제공하기 위해 필수 반응들 중 일부를 촉매하기 위한 생합성 능력을 가진 세포를 제조할 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 가진 비-천연성 세포는 본 발명의 알데하이드 데하이드로게나제 등의 원하는 효소 또는 단백질을 코딩하는 2 이상의 외인성 핵산을 포함할 수 있다. 이에, 본 발명의 알데하이드 데하이드로게나제를 포함하여, 생합성 경로의 2 이상의 효소 또는 단백질의 임의 조합이 본 발명의 비-천연성 세포에 포함될 수 있는 것으로 이해된다. 마찬가지로, 생합성 경로의 3가지 이상의 효소 또는 단백질의 임의 조합이, 원하는 생합성 경로의 효소 및/또는 단백질의 조합으로 대응되는 원하는 생산물의 생산을 달성하는 한, 필요에 따라, 본 발명의 비-천연성 세포에 포함될 수 있는 것으로 이해된다. 마찬가지로, 본원에 기술된 생합성 경로의 4가지 이상의 효소 또는 단백질의 임의 조합이, 원하는 생합성 경로의 효소 및/또는 단백질의 조합으로 대응되는 원하는 생산물의 생산이 달성되는 한, 필요에 따라, 본 발명의 비-천연성 세포에 포함될 수 있다.
본원에 기술된 바와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성과 더불어, 본 발명의 비-천연성 세포 및 방법은 또한 다른 경로를 통해 생산물의 생합성을 달성하기 위해 서로 다양한 조합 및/또는 다른 세포 및 당해 기술 분야에 잘 알려진 방법과의 다양한 조합으로 이용할 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산체 이외의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO를 생산하기 위한 한가지 대안은, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO로 변환할 수 있는 다른 세포의 부가함으로써 이루어진다. 이러한 한가지 방법은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 생산하는 세포의 발효이다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO로 변환하는 제2 세포의 기질로서 이용할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물은 제2 유기체의 다른 배양물에 직접 첨가하거나, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물 생산체의 오리지날 배양물은, 예를 들어, 세포 분리에 의해 이들 세포를 제거한 다음 발효 브로스에 제2 유기체를 후속적으로 첨가하여 중간산물의 정제 단계없이 최종 생산물을 제조할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 관련 다운스트림 산물, 예를 들어, 이의 에스테르 또는 아미드를 생산하는 세포를, 선택적으로 상기한 다운스트림 산물을 생산하기 위해 포함시킬 수 있다.
다른 예로, 이러한 효소적 변환은, 기질을 원하는 생산물로 변환하는 결과를 달성하는 효소에 대한 순차적인 기질 노출 또는 효소들의 조합을 이용해, 시험관내에서 수행할 수 있다. 다른 대안으로서, 세포-기반의 변환 및 시험관내 효소적 변환의 조합도 필요에 따라 사용할 수 있다.
다른 구현예들에서, 본 발명의 비-천연성 세포 및 방법은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 달성하기 위해, 매우 다양한 서브-경로들로 조립될 수 있다. 이들 구현예에서, 본 발명의 원하는 생산물의 생합성 경로들은 여러가지 다른 세포들에서 분할될 수 있으며, 이들 여러 세포를 공-배양하여 최종 생산물을 생산할 수 있다. 이러한 생합성 공정에서, 하나의 세포의 생산물은 최종 생산물이 합성될 때까지 제2 세포에 대한 기질이 된다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성은 하나의 경로 중간 생산물을 다른 경로 중간산물 또는 생산물로 변환하는 생합성 경로를 포함하는 세포를 구축함으로써, 달성할 수 있다. 다른 예로, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO는 동일 용기에서 2종의 서로 다른 세포를 이용한 공동-배양 또는 공동-발효를 통해 세포로부터 생합성 방식으로 생산할 수 있으며, 이때 제1 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 중간산물을 생산하고, 제2 세포는 이들 중간산물을 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물로 변환한다.
본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위해, 다른 세포, 서브-경로를 구비한 다른 비-천연성 세포들의 공동-배양 및 당해 기술 분야에 잘 알려진 다른 화학적 및/또는 생화학적 공정들의 조합과 더불어, 본 발명의 비-천연성 세포 및 방법에 대해 매우 다양한 조합 및 치환들이 존재한다는 것을, 이해할 것이다.
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물에 대한 코딩 핵산의 소스는, 예를 들어, 코딩된 유전자 산물이 참조 반응을 촉매할 수 있는 임의 종일 수 있다. 이러한 종은 원핵생물 및 진핵생물 유기체 둘다를 포함하며, 비-제한적인 예로는 고세균 및 유박테리아 등의 박테리아, 및 효모, 식물, 곤충, 동물 및 포유류, 예로 인간 등의 진핵생물 등이 있다. 이러한 소스에 대한 예시적인 종으로는, 예를 들어, 에스케리키아 콜라이 (Escherichia coli), 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 사카로마이세스 클루이베리 (Saccharomyces kluyveri), 클로스트리듐 클루이베리 (Clostridium kluyveri), 클로스트리듐 아세토부틸리컴 (Clostridium acetobutylicum), 클로스트리듐 베이예린키이 (Clostridium beijerinckii), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 퍼프린겐스 (Clostridium perfringens), 클로스트리듐 디피실 (Clostridium difficile), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 티로부티리컴 (Clostridium tyrobutyricum), 클로스트리듐 테타노모르품 (Clostridium tetanomorphum), 클로스트리듐 테타니 (Clostridium tetani), 클로스트리듐 프로피오니컴 (Clostridium propionicum), 클로스트리듐 아미노부티리컴 (Clostridium aminobutyricum), 클로스트리듐 섭터미날 (Clostridium subterminale), 클로스트리듐 스티클란디이 (Clostridium sticklandii), 랄스토니아 유트로파 (Ralstonia eutropha), 마이코박테리움 보비스 (Mycobacterium bovis), 마이코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 테르무스 써모필러스 (Thermus thermophilus), 슈도모나스 종 (Pseudomonas species), 예를 들어, 슈도모나스 에어루지노사 (Pseudomonas aeruginosa), 슈도모나스 푸티다 (Pseudomonas putida), 슈도모나스 스투체리 (Pseudomonas stutzeri), 슈도모나스 플루오레센스 (Pseudomonas fluorescens), 호모 사피엔스 (Homo sapiens), 오리크톨라구스 쿠니쿨러스 (Oryctolagus cuniculus), 로도박터 스페어로이데스 (Rhodobacter spaeroides), 서모안에어로박터 브록키이 (Thermoanaerobacter brockii), 메탈로스페라 세둘라 (Metallosphaera sedula), 루코노스톡 메센테로이데스 (Leuconostoc mesenteroides), 클로로플렉수스 아우란티아쿠스 (Chloroflexus aurantiacus), 로세이플렉수스 카스텐홀지이 (Roseiflexus castenholzii), 에리트로박터 (Erythrobacter), 심몬드시아 치넨시스 (Simmondsia chinensis), 아시네토박터 종, 예를 들어, 아시네토박터 칼코아세티쿠스 (Acinetobacter calcoaceticus) 및 아시네토박터 베일리이 (Acinetobacter baylyi), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 설폴로부스 토코다이 (Sulfolobus tokodaii), 설폴로부스 솔파타리쿠스 (Sulfolobus solfataricus), 설폴로부스 아시도칼다리우스 (Sulfolobus acidocaldarius), 바실러스 섭틸리스 (Bacillus subtilis), 바실러스 세레우스 (Bacillus cereus), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 브레비스 (Bacillus brevis), 바실러스 푸밀루스 (Bacillus pumilus), 라투스 노르베기쿠스 (Rattus norvegicus), 클렙시엘라 뉴모니아 (Klebsiella pneumonia), 클렙시엘라 옥시토카 (Klebsiella oxytoca), 유클레나 글라실리스 (Euglena gracilis), 트레포네마 덴티콜라 (Treponema denticola), 모렐라 서모아세티카 (Moorella thermoacetica), 서모토가 마리티마 (Thermotoga maritima), 할로박테리움 살리나룸 (Halobacterium salinarum), 지오바실러스 스테아로서모필러스 (Geobacillus stearothermophilus), 에어로피룸 퍼닉스 (Aeropyrum pernix), 수스 스크로파 (Sus scrofa), 케어노라브디티스 엘레강스 (Caenorhabditis elegans), 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 아시다미노코커스 퍼멘탄스 (Acidaminococcus fermentans), 락토코커스 락티스 (Lactococcus lactis), 락토바실러스 플란타룸 (Lactobacillus plantarum), 스트렙토코커스 서모필러스 (Streptococcus thermophilus), 엔테로박터 에어로게네스 (Enterobacter aerogenes), 칸디다 (Candida), 아스퍼질러스 테레우스 (Aspergillus terreus), 페디코커스 펜토사세우스 (Pedicoccus pentosaceus), 자이모모나스 모빌러스 (Zymomonas mobilus), 아세토박터 파스테리안스 (Acetobacter pasteurians), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 유박테리움 바르케리 (Eubacterium barkeri), 박테로이데스 카필로수스 (Bacteroides capillosus), 안에어로트룬쿠스 콜리호미니스 (Anaerotruncus colihominis), 나트란에어로비우스 서모필러스 (Natranaerobius thermophilusm), 캄필로박터 제주니 (Campylobacter jejuni), 헤모필러스 인플루엔자 (Haemophilus influenzae), 세라티아 마르세센스 (Serratia marcescens), 시트로박터 아말로나티쿠스 (Citrobacter amalonaticus), 믹소코커스 크산투스 (Myxococcus xanthus), 푸조박테리움 뉼레아툼 (Fusobacterium nuleatum), 페니실리움 크리소게눔 (Penicillium chrysogenum), 해양 감마 프로테오박테리움 (marine gamma proteobacterium), 부티레이트-생산 박테리암 (butyrate-producing bacterium), 노카르디아 오웬시스 (Nocardia iowensis), 노카르디아 파르시니카 (Nocardia farcinica), 스트렙토마이세스 그리세우스 (Streptomyces griseus), 시조사카로마이세스 품베 (Schizosaccharomyces pombe), 지오바실러스 서모글루코시다시우스 (Geobacillus thermoglucosidasius), 살모넬라 티피무리움 (Salmonella typhimurium), 비브리오 콜레라 (Vibrio cholera), 헬리오박터 필로리 (Heliobacter pylori), 니코티아나 타바쿰 (Nicotiana tabacum), 오리자 사티바 (Oryza sativa), 할로페락스 메디테라네이 (Haloferax mediterranei), 아그로박테리움 투메팍시엔스 (Agrobacterium tumefaciens), 아크로모박터 데니트리피칸스 (Achromobacter denitrificans), 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 스트렙토마이세스 클라불리게누스 (Streptomyces clavuligenus), 아시네토박터 바우마니이 (Acinetobacter baumanii), 무스 무스쿨러스 (Mus musculus), 라찬시아 클루이베리 (Lachancea kluyveri), 트리코모나스 바기날리스 (Trichomonas vaginalis), 트리파노소마 브루세이 (Trypanosoma brucei), 슈도모나스 스투체리 (Pseudomonas stutzeri), 브라디리조븀 자포니컴 (Bradyrhizobium japonicum), 메소리조븀 로티 (Mesorhizobium loti), 보스 타우루스 (Bos taurus), 니코티아나 글루티노사 (Nicotiana glutinosa), 비브리오 불니피쿠스 (Vibrio vulnificus), 셀레노모나스 루미난튬 (Selenomonas ruminantium), 비브리오 파라헤몰리티쿠스 (Vibrio parahaemolyticus), 아르케오글로부스 풀기두스 (Archaeoglobus fulgidus), 할로아르쿨라 마리스모르투이 (Haloarcula marismortui), 피로바쿨룸 에어로필럼 (Pyrobaculum aerophilum), 미코박테리움 스메그마티스 (Mycobacterium smegmatis), MC2 155, 미코박테리움 아븀 아종 파라투베르쿨로시스 K-10 (Mycobacterium avium subsp . paratuberculosis K-10), 미코박테리움 마리눔 M (Mycobacterium marinum M), 츠카무렐라 파우로메타볼라 (Tsukamurella paurometabola) DSM 20162, 시아노븀 PCC7001, 딕티오스텔륨 디스코이데움 AX4 (Dictyostelium discoideum AX4), 아시다미노코커스 퍼멘탄스 (Acidaminococcus fermentans), 아시네토박터 베일리이 (Acinetobacter baylyi), 아시네토박터 칼코아세티쿠스 (Acinetobacter calcoaceticus), 아쿠이페스 에어올리쿠스 (Aquifex aeolicus), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 아르케오글로부스 풀기두스 (Archaeoglobus fulgidus), 아스퍼질러스 나이거 (Aspergillus niger), 아스퍼질러스 테레우스 (Aspergillus terreus), 바실러스 섭틸리스 (Bacillus subtilis), 보스 타우루스 (Bos Taurus), 칸디다 알비칸스 (Candida albicans), 칸디다 트로피칼리스 (Candida tropicalis), 클라미도모나스 라인하르드티이 (Chlamydomonas reinhardtii), 클로로븀 테피둠 (Chlorobium tepidum), 시트로박터 코세리 (Citrobacter koseri), 시트러스 주노스 (Citrus junos), 클로스트리듐 아세토부틸리컴 (Clostridium acetobutylicum), 클로스트리듐 클루이베리 (Clostridium kluyveri), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 시아노븀 PCC7001, 데설파티바실륨 아케니보란스 (Desulfatibacillum alkenivorans), 딕티오스텔리움 디스코이데움 (Dictyostelium discoideum), 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 할로아르쿨라 마리스모르투이 (Haloarcula marismortui), 호모 사피엔스 (Homo sapiens), 하이드로게노박터 서모필러스 (Hydrogenobacter thermophilus), 클렙시엘라 뉴모니애 (Klebsiella pneumoniae), 클루이베로마이세스 락티스 (Kluyveromyces lactis), 락토바실러스 브레비스 (Lactobacillus brevis), 루노코스톡 메센테로이데스 (Leuconostoc mesenteroides), 메탈로스페라 세둘라 (Metallosphaera sedula), 메타노서모박터 서마우토트로피쿠스 (Methanothermobacter thermautotrophicus), 무스 무스쿨러스 (Mus musculus), 미코박테리움 아븀 (Mycobacterium avium), 미코박테리움 보비스 (Mycobacterium bovis), 미코박테리움 마리눔 (Mycobacterium marinum), 미코박테리움 스메그마티스 (Mycobacterium smegmatis), 니코티아나 타바쿰 (Nicotiana tabacum), 노카르디아 오웬시스 (Nocardia iowensis), 오릭톨라구스 쿠니쿨러스 (Oryctolagus cuniculus), 페니실리움 크리소게눔 (Penicillium chrysogenum), 피키아 파스토리스 (Pichia pastoris), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 포르피로모나스 깅기발리스 (Porphyromonas gingivalis), 슈도모나스 에어루지노사 (Pseudomonas aeruginosa), 슈도모나스 푸티다 (Pseudomonas putida), 슈도모나스 에어로필럼 (Pyrobaculum aerophilum), 랄스토니아 유트로파 (Ralstonia eutropha), 라투스 노르베기쿠스 (Rattus norvegicus), 로도박터 스페어로이데스 (Rhodobacter sphaeroides), 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 살모넬라 엔테릭 (Salmonella enteric), 살모넬라 티피무리움 (Salmonella typhimurium), 시조사카로마이세스 폼베 (Schizosaccharomyces pombe), 설폴로부스 아시도칼다리우스 (Sulfolobus acidocaldarius), 설폴로부스 솔파타리쿠스 (Sulfolobus solfataricus), 설폴로부스 토코다이 (Sulfolobus tokodaii), 서모안에어로박터 텡콩엔시스 (Thermoanaerobacter tengcongensis), 터무스 서모필러스 (Thermus thermophilus), 트리파노소마 브루세이 (Trypanosoma brucei), 츠카무렐라 파우로메타볼라 (Tsukamurella paurometabola), 야로이야 리폴리티카 (Yarrowia lipolytica), 주글로에아 라미게라 (Zoogloea ramigera), 및 자이모모나스 모빌리스 (Zymomonas mobilis), 클로스트리듐 종, 예를 들어, 비-제한적으로, 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 베이예린키이 (Clostridium beijerinckii), 클로스트리듐 사카로퍼부틸아세토니컴 (Clostridium saccharoperbutylacetonicum), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 메틸펜토섬 (Clostridium methylpentosum), 클로스트리듐 스티클란디이 (Clostridium sticklandii), 클로스트리듐 피토퍼멘탄스 (Clostridium phytofermentans), 클로스트리듐 사카로라이티컴 (Clostridium saccharolyticum), 클로스트리듐 아스파라기포르메 (Clostridium asparagiforme), 클로스트리듐 셀라툼 (Clostridium celatum), 클로스트리듐 카르복시디보란스 (Clostridium carboxidivorans), 클로스트리듐 클로스트리디오포르메 (Clostridium clostridioforme), 클로스트리듐 볼테아 (Clostridium bolteae), 칼달칼리바실러스 서마룸 (Caldalkalibacillus thermarum), 클로스트리듐 보툴리눔 (Clostridium botulinum), 펠로시누스 퍼멘탄스 (Pelosinus fermentans), 서모안에어로박테리움 서모사카로라이티컴 (Thermoanaerobacterium thermosaccharolyticum), 데설포스포로시누스 종 (Desulfosporosinus speices), 서모안에어로박테리움 종, 비-제한적인 예로, 서모안에어박테리움 사카로라이티컴 (Thermoanaerobacterium saccharolyticum), 서모안에어로박테리움 크실라놀라이티컴 (Thermoanaerobacterium xylanolyticum), 아세토네마 롱검 (Acetonema longum), 지오바실러스 종, 비-제한적인 예로, 지오바실러스 서모글루코시단스 (Geobacillus thermoglucosidans), 바실러스 아조토포르만스 (Bacillus azotoformans), 서민콜라 포텐스 (Thermincola potens), 푸조박테리움 종, 비-제한적인 예로, 푸조박테리움 뉴클레아툼 (Fusobacterium nucleatum), 푸조박테리움 울세란스 (Fusobacterium ulcerans), 푸조박테리움 바륨 (Fusobacterium varium), 루미노코커스 종 (Ruminococcus species), 비-제한적인 예로, 루미노코커스 그나부스 (Ruminococcus gnavus), 루미노코커스 오베움 (Ruminococcus obeum), 라크노스피라시이 박테리움 (Lachnospiraceae bacterium), 플라보니프락토 플라우티이 (Flavonifractor plautii), 로세부리아 이눌린이보란스 (Roseburia inulinivorans), 아세토박테리움 우디이 (Acetobacterium woodii), 유박테리움 종, 비-제한적인 예로, 유박테리움 프렉시카우다툼 (Eubacterium plexicaudatum), 유박테리움 할리이 (Eubacterium hallii), 유박테리움 리모숨 (Eubacterium limosum), 유박테리움 이우리이 (Eubacterium yurii), 유박테리아시이 박테리움 (Eubacteriaceae bacterium), 서모세디미니박터 오세아니 (Thermosediminibacter oceani), 일리오박터 폴리트로푸스 (Ilyobacter polytropus), 셔틀워티아 사텔레스 (Shuttleworthia satelles), 할안에어로븀 사카로라이티컴 (Halanaerobium saccharolyticum), 서모안에어로박터 에타놀리쿠스 (Thermoanaerobacter ethanolicus), 로도스피릴룸 루브룸 (Rhodospirillum rubrum), 비브리오 (Vibrio), 프로피오니박테리움 프로피오니컴 (Propionibacterium propionicum)뿐 아니라 본원에 기술되거나 또는 해당 유전자에 대한 소스 유기체로서 이용가능한 다른 예시 종들, 예를 들어 표 4에 기술된 알데하이드 데하이드로게나제의 소스 유기체 등이 있다. 그러나, 미생물 게놈 395종 및 다양한 효모, 진균, 식물 및 포유류 게놈을 비롯한, 현재 550종 이상에서 이용가능한 전체 게놈 서열을 이용해 (NCBI와 같은 공공의 데이터베이스에서 이용가능한 데이타의 절반 이상을 이용해), 공지 유전자의 상동체, 오르소로그, 파라로그 및 비-오르소로거스 유전자 치환 등의, 관련 또는 동떨어진 종들에서 하나 이상의 유전자에 대한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 활성을 코딩하는 유전자의 동정, 및 유기체들 간의 유전자 변형의 상호 교환은 일반적이며, 당해 기술 분야에 잘 알려져 있다. 이에, E. coli와 같은 특정 유기체를 참조하여 본원에 기술된, 본 발명의 알데하이드 데하이드로게나제의 발현 등의, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 허용하는 대사 변형은, 비슷한 원핵생물 및 진핵생물 유기체 등의, 미생물과 같은 다른 세포에도 쉽게 적용할 수 있다. 본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면 하나의 유기체에서 예시된 대사 변형이 다른 유기체에도 동일하게 적용할 수 있음을 알 것이다.
대안적인 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로가 비-관련 종에서 존재하는 경우에서와 같은 일부 경우에, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성은, 예를 들어, 참조 반응을 대체하기 위해 유사하지만 동일하진 않은 대사 반응을 촉매하는 비-관련 종들로부터 파라로그 또는 파라로그들의 외인성 발현에 의해, 숙주 종에 부여할 수 있다. 여러가지 유기체들 간에 대사 네트워크에 일부 차이가 존재하므로, 당해 기술 분야의 당업자라면, 서로 다른 유기체들 간의 실제 유전자 용법 (gene usage)이 다를 수 있음을 이해할 것이다. 그러나, 본원에 제공된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 또한 본 발명의 교시 내용 및 방법을, 본 발명의 알데하이드 데하이드로게나제를 도입하는 것을 포함하여, 필요에 따라, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 합성할 세포를 대상 종에서 구축하기 위해 본원에 예시된 내용에 대한 동계 (cognate) 대사 변형을 이용하여 모든 세포에 적용할 수 있음을, 이해할 것이다.
본 발명의 알데하이드 데하이드로게나제를 포함하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 비-천연성 숙주를 구축 및 발현 수준을 검사하는 방법은, 예를 들어, 당해 기술 분야에 잘 알려진 재조합 및 검출 방법에 의해 수행할 수 있다. 이러한 방법은 예를 들어, Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)에서 확인할 수 있다.
본 발명의 알데하이드 데하이드로게나제를 코딩하는 외인성 핵산, 및 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생산 경로에 참여하는 외인성 핵산은, 비-제한적인 예로, 접합, 전기천공, 화학적 형질전환, 형질도입, 형질감염 및 초음파 형질전환 등의 당해 기술 분야에 잘 알려진 기법을 이용해 숙주 세포에 안정적으로 또는 일시적으로 도입시킬 수 있다. E. coli 또는 기타 원핵생물 세포에서 외인성 발현을 위해, 진핵생물 핵산의 유전자 또는 cDNA 내 일부 핵산 서열은, 필요에 따라, 원핵생물 숙주 세포에 형질전환하기 전에 제거될 수 있는, N-말단 미토콘드리아 또는 그외 타겟팅 신호와 같은 타겟팅 신호를 코딩할 수 있다. 예를 들어, 미토콘드리아 리더 서열의 제거는 E. coli에서 발현 증가를 유도한다 (Hoffmeister et al., J. Biol . Chem. 280:4329-4338 (2005)). 효모 또는 기타 진핵생물 세포에서 외인성 발현을 위해, 유전자는 리더 서열 부가 없이 세포질에서 발현시키거나, 또는 숙주 세포에 적합한 미토콘드리아 타겟팅 또는 방출 신호와 같은 적합한 타겟팅 서열을 부가함으로써, 미토콘드리아 또는 그외 소기관으로 타겟팅하거나 또는 분비하도록 타겟팅할 수 있다. 따라서, 타겟팅 서열을 제거 또는 포함하기 위한 핵산 서열에의 적절한 변형은 원하는 특성을 부여하기 위해 외인성 핵산 서열에 포함시킬 수 있는 것으로 이해된다. 또한, 유전자는 단백질의 최적화된 발현을 달성하기 위해 당해 기술 분야에 잘 알려진 기법으로 코돈 최적화를 이행할 수 있다.
발현 벡터 또는 벡터는, 본원에 예시된 바와 같이, 숙주 유기체에서 발현 조절 서열 기능에 작동가능하게 연결된, 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산, 및/또는 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생합성 경로를 코딩하는 하나 이상의 핵산, 또는 이의 에스테르 또는 아미드와 같이 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO와 관련된 다운스트림 산물을 생산하는 효소를 코딩하는 핵산을 포함하도록 구축할 수 있다. 본 발명의 숙주 세포에서 이용하기 위해 적용가능한 발현 벡터로는, 예를 들어, 벡터 및 숙주 염색체에 안정적으로 삽입하기 위해 작동가능한 선택 서열 또는 마커를 비롯하여, 플라스미드, 파지 벡터, 바이러스 벡터, 에피솜 및 인공 염색체 등이 있다. 또한, 발현 벡터는 하나 이상의 선별가능한 마커 유전자 및 적절한 발현 조절 서열을 포함할 수 있다. 또한, 예를 들어, 항생제 또는 독소에 대해 내성을 제공하거나, 영양요구성 결핍을 보완하거나 또는 배양 배지에 없는 중요한 영양분을 공급하는, 선별가능한 마커 유전자가 포함될 수 있다. 발현 조절 서열은 당해 기술 분야에 잘 공지되어 있는 구성적인 (constitutive) 프로모터, 유도성 프로모터, 전사 인핸서, 전사 종결인자 등을 포함할 수 있다. 2 이상의 외인성 코딩 핵산을 공동-발현시킬 경우, 이들 2종의 핵산은, 예를 들어, 단일한 발현 벡터에 또는 분리된 발현 벡터들에 삽입시킬 수 있다. 단일한 벡터 발현의 경우, 코딩 핵산에 하나의 공통적인 발현 조절 서열을 작동가능하게 연결하거나 또는 유도 프로모터 1개 및 구성적 프로모터 1개 등의 서로 다른 발현 조절 서열을 작동가능하게 연결할 수 있다. 본 발명의 알데하이드 데하이드로게나제 또는 대사 또는 합성 경로에 참여하는 폴리펩타이드를 코딩하는 외인성 핵산 서열의 형질전환은 당해 기술 분야에 잘 알려진 방법으로 검증할 수 있다. 이러한 방법으로는, 예를 들어, mRNA의 노던 블롯 또는 폴리머라제 연쇄 반응 (PCR) 증폭과 같은 핵산 분석, 또는 유전자 산물 발현에 대한 면역블롯팅, 또는 도입된 핵산 서열 또는 이의 대응되는 유전자 산물의 발현을 검사하기 위한 그외 적절한 분석 방법 등이 있다. 당해 기술 분야의 당업자라면, 외인성 핵산이 원하는 생산물을 생산하기에 충분한 양으로 발현되는 것으로 이해하며, 또한 당해 기술 분야에 잘 알려진 방법 및 본원에 기술된 방법을 이용해 충분한 발현을 수득하도록 발현 수준을 최적화할 수 있음을 알 것이다.
또한, 벡터 또는 발현 벡터를 이용해 코딩 핵산을 발현시켜 시험관내 전사 및 번역에 의해 코딩된 폴리펩타이드를 생산할 수 있다. 이러한 벡터 또는 발현 벡터는 적어도 프로모터를 포함할 것이며, 전술한 벡터를 포함할 것이다. 시험관내 전사 및 번역에서 상기한 벡터는 일반적으로 이중 가닥 DNA이다. 시험관내 전사 및 번역 방법은 당해 기술 분야의 당업자들에게 공지되어 있다 (Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); 및 Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999) 참조). 시험관내 전사 및 번역을 위한 키트들 역시 상업적으로 구입가능하다 (예, Promega, Madison, WI; New England Biolabs, Ipswich, MA; Thermo Fisher Scientific, Carlsbad, CA).
일 구현예에서, 본 발명은, 본 발명의 세포를 배양하여 3-HBal 및/또는 1,3-BDO 또는 이의 에스테르 또는 아미드를 생산하는 것을 포함하는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이의 에스테르 또는 아미드의 생산 방법을 제공한다. 이러한 세포는 본 발명의 폴리펩타이드를 발현한다. 일 구현예에서, 본 발명은, 본 발명의 세포를 배양하여 4-HBal 및/또는 1,4-BDO 또는 이의 에스테르 또는 아미드를 생산하는 것을 포함하는, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이의 에스테르 또는 아미드의 생산 방법을 제공한다. 일 구현예에서, 세포는 실질적으로 혐기성 배양 배지에 존재한다. 일 구현예에서, 이 방법은 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 또는 이의 에스테르 또는 아미드를 단리 또는 정제하는 것을 더 포함할 수 있다. 특정 구현예에서, 단리 또는 정제는 증류를 포함한다.
일 구현예에서, 본 발명은, 생산물을 생산하는 반응으로 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 자체적으로 또는 다른 화합물과 화학적으로 반응시키는 것을 포함하는, 본 발명의 생산물의 생산 방법을 제공한다.
일 구현예에서, 본 발명은, 본 발명의 폴리펩타이드에 기질을 제공하고, 그 기질을 3-HBal 및/또는 1,3-BDO로 변환하는 것을 포함하며, 기질이 1,3-하이드록시부티릴-CoA의 라세믹 혼합물인, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 R 형태로 거울상이성질체 측면에서 농화된다. 일 구현예에서, 본 발명은, 기질을 본 발명의 폴리펩타이드에 제공하고, 그 기질을 4-HBal 및/또는 1,4-BDO로 변환하는 것을 포함하며, 기질이 1,4-하이드록시부티릴-CoA인, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO), 또는 이의 에스테르 또는 아미드의 제조 방법을 제공한다. 일 구현예에서, 폴리펩타이드는 세포에, 세포용해물에 존재하거나 또는 세포 또는 세포용해물로부터 단리한다.
일 구현예에서, 본 발명은, 본 발명의 세포의 세포용해물을 인큐베이션하여 3-HBal 및/또는 1,3- BDO, 또는 4-HBal 및/또는 1,4-BDO를 생산하는 것을 포함하는, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 제조 방법을 제공한다. 일 구현예에서, 세포용해물을 제2 세포용해물과 혼합하며, 제2 세포용해물은 본 발명의 폴리펩타이드의 기질, 또는 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 다운스트림 산물을 생산하기 위한 효소 활성을 포함한다.
또한, 본 발명은, 세포에서 폴리펩타이드를 발현시키는 것을 포함하는, 본 발명의 폴리펩타이드를 제조하는 방법을 제공한다. 본 발명은 부가적으로 본 발명의 핵산 또는 본 발명의 벡터를 시험관내 전사 및 번역하여 폴리펩타이드를 제조하는 것을 포함하는, 본 발명의 폴리펩타이드의 제조 방법을 제공한다.
본원에 기술된 바와 같이, 세포를 이용해 본 발명의 알데하이드 데하이드로게나제를 발현시킬 수 있으며, 선택적으로 세포는 본 발명의 알데하이드 데하이드로게나제를 이용해 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO와 같은 원하는 생산물을 생산하는 대사 경로를 포함할 수 있다. 원하는 생산물을 발현하는 이러한 방법이 본원에 기술된다. 다른 예로, 본원에 기술된 바와 같이, 본 발명의 알데하이드 데하이드로게나제를 발현시키거나, 및/또는 원하는 생산물을 세포용해물로, 예를 들어 본 발명의 알데하이드 데하이드로게나제를 발현하는 세포 또는 본 발명의 알데하이드 데하이드로게나제와 원하는 생산물을 생산하기 위한 대사 경로를 발현하는 세포의 세포용해물로 생산할 수 있다. 다른 구현예에서, 본 발명의 알데하이드 데하이드로게나제는, 알데하이드 데하이드로게나제가 비-세포성 (cell-free) 시스템에서 제조되는, 시험관내 전사 및 번역에 의해 발현시킬 수 있다. 시험관내 전사 및 번역에 의해 발현된 알데하이드 데하이드로게나제를 이용해 시험관내에서 반응을 수행할 수 있다. 선택적으로, 기타 효소 또는 이러한 효소를 함유한 세포용해물(들)을 이용해, 알데하이드 데하이드로게나제 효소 반응의 생산물을 원하는 다운스트림 산물로 시험관내에서 변환할 수 있다.
알데하이드 데하이드로게나제의 활성을 검사하기 위한 분석을 포함하여, 알데하이드 데하이드로게나제의 발현, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물에 대한 적절한 정제 및/또는 이를 검사하기 위한 분석은, 잘 알려진 방법을 이용해 수행할 수 있다 (실시예 참조). 검사할 각 조작된 균주를 트리플리케이트 (triplicate) 배양과 같은 적절한 리플리케이트로 배양할 수 있다. 예를 들어, 조작된 생산 숙주에서 생산물 및 부산물의 형성을 모니터링할 수 있다. 최종 생산물 및 중간산물, 및 기타 유기 화합물은 HPLC (고 성능 액체 크로마토그래피), GC-MS (가스 크로마토그래피-질량 분광분석) 및 LC-MS (액체 크로마토그래피-질량 분광분석) 또는 당해 기술 분야에서 잘 알려진 통상적인 공정을 이용한 그외 적합한 분석 방법 등의 방법으로 분석할 수 있다. 발효 브로스로의 생산물의 방출은 또한 배양 상층액을 사용해 검사할 수 있다. 부산물 및 잔류 글루코스는, 예를 들어, 글루코스 및 알코올에 대한 굴절율 검출기, 및 유기산에 대한 UV 검출기를 이용해, HPLC에 의해 또는 당해 기술 분야에 잘 알려진 그외 적합한 분석 및 검출 방법으로 정량할 수 있다 (Lin et al., Biotechnol . Bioeng. 90:775-779 (2005)). 또한, 외인성 DNA 서열로부터 유래되는 개별 효소 또는 단백질의 활성은 당해 기술 분야에 잘 알려진 방법을 이용해 분석할 수 있다 (실시예 참조).
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 그외 원하는 생산물, 예를 들어, 이의 에스테르 또는 아미드와 같은 이와 관련있는 다운스트림 산물은, 당해 기술 분야에 잘 알려진 다양한 방법을 이용해 배양물에서 다른 성분들로부터 분리할 수 있다. 이러한 분리 방법으로는, 예를 들어, 추출 공정뿐 아니라 연속적인 액체-액체 추출, 투석증발 (pervaporation), 막 여과, 막 분리, 역 삼투압, 전기 투석, 증류, 결정화, 원심분리, 추출 여과 (extractive filtration), 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 흡착 크로마토그래피 및 초미세여과를 포함하는 방법 등이 있다. 전술한 방법들 모두 당해 기술 분야에 잘 공지되어 있다.
본원에 기술된 본 발명의 알데하이드 데하이드로게나제를 발현하는 임의의 비-천연성 세포를 배양하여 본 발명의 생합성 생산물을 생산 및/또는 분비시킬 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 세포는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생합성 생산하기 위해 배양할 수 있다. 즉, 일부 구현예에서, 본 발명은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 본원에 기술된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물을 함유한 배양 배지를 제공한다. 일부 측면에서, 배양 배지는 또한 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 생산하는 본 발명의 비-천연성 세포로부터 분리할 수 있다. 배양 배지로부터 세포를 분리하는 방법은 당해 기술 분야에 잘 공지되어 있다. 예시적인 방법으로는 여과, 응집 (flocculation), 석출, 원심분리, 침강 등이 있다.
본 발명의 알데하이드 데하이드로게나제를 발현하는 세포에서, 본 발명의 알데하이드 데하이드로게나제, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위해, 재조합 균주를 탄소원 및 기타 필수 영양분이 첨가된 배지에서 배양한다. 전체 공정의 비용을 줄이기 위해 발효 장치를 혐기성 상태로 유지시키는 것이 종종 바람직하며, 매우 바람직할 수 있다. 이러한 조건은, 예를 들어, 배지를 질소로 퍼징한 다음 격막 (septum) 및 크림프-캡 (crimp-cap)으로 플라스크를 밀봉함으로써, 달성할 수 있다. 혐기성 상태에서는 증식이 관찰되지 않는 균주의 경우, 격막에 제한적인 호기를 위해 작은 구멍을 뚫어 미세호기 (microaerobic) 또는 실질적으로 혐기 조건을 적용할 수 있다. 예시적인 혐기 조건들은 기존에 기술되어 있으며, 당해 기술 분야에 잘 알려져 있다. 예시적인 호기 및 혐기 조건들은 2007년 8월 10일에 출원된 미국 특허 공개공보 2009/0047719에 기술되어 있다. 발효는 본원에 기술된 바와 같이 배치, 피드-배치 또는 연속적인 방식으로 수행할 수 있다. 또한, 발효는 필요에 따른 2 단계로 수행할 수 있다. 제1 단계는 높은 증식, 즉 높은 생산성을 허용하기 위해 호기성 단계일 수 있으며, 그 후 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물과 같은 원하는 생산물의 고 수율을 위한 혐기성 단계가 후속될 수 있다.
배지의 pH는, 필요에 따라 배양 배지를 원하는 pH에서 유지시키기 위해, NaOH와 같은 염기 또는 기타 염기 또는 산을 첨가함으로써, 원하는 pH, 특히 중성 pH, 예를 들어 약 pH 7에서 유지할 수 있다. 증식율은 분광광도계 (600 nm)를 사용해 광학 밀도를 측정함으로써 확인할 수 있으며, 글루코스 흡수율 (glucose uptake rate)은 시간 경과에 따른 탄소원 고갈을 모니터링함으로써 결정할 수 있다.
증식 배지는, 예를 들어, 비-천연성 세포에 탄소원을 공급할 수 있는, 임의의 탄수화물 소스를 포함할 수 있다. 이러한 소스로는, 예를 들어, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프럭토스, 슈크로스 및 전분과 같은 당; 또는 글리세롤 등이 있으며, 탄소원은 유일한 탄소원으로서 단독으로 또는 본원에 기술되거나 당해 기술 분야에 공지된 다른 탄소원과 조합하여 사용할 수 있다. 그외 탄수화물 소스로는 예를 들어 재생가능한 공급원료 (renewable feedstock) 및 바이오매스 (biomass) 등이 있다. 본 발명의 방법에서 공급원료로서 사용될 수 있는 바이오매스의 타입의 예로는 셀룰로스 바이오매스, 헤미셀룰로스 바이오매스 및 리그닌 공급원료 또는 공급원료의 일부 등이 있다. 이러한 바이오매스 공급원료는, 예를 들어, 글루코스, 자일로스, 아라비노스, 갈락토스, 만노스, 프럭토스 및 전분과 같은 탄소원으로서 유용한 탄수화물 물질을 포함한다. 본원에 제공된 교시 내용 및 지침을 고려하여, 당해 기술 분야의 당업자라면, 상기에 예시된 것 이외의 재생가능한 공급원료 및 바이오매스 역시 본 발명의 알데하이드 데하이드로게나제를 발현시키고, 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이의 다운스트림 산물을 생산하기 위해, 본 발명의 세포를 배양하는데 사용할 수 있음을, 알 것이다.
상기에 예시된 것과 같은 재생가능한 공급원료 외에도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드와 같은 이의 다운스트림 산물을 생산하는 본 발명의 세포는, 또한 이의 탄소원으로서 합성가스 (syngas)에서 증식하도록 변형할 수 있다. 이러한 구체적인 구현예에서, 하나 이상의 단백질 또는 효소를 HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산 유기체에서 발현시켜, 합성가스 또는 기타 기체성 탄소원을 이용하는 대사 경로를 제공한다.
합성가스 또는 발생로 가스 (producer gas)로도 알려진 합성 가스 (synthesis gas)는, 석탄 및 농업 작물 및 잔재 (residues) 등의 바이오매스 물질과 같은 탄소질 물질의 주요 기화 산물이다. 합성 가스는 주로 H2 및 CO로 구성된 혼합물이며, 비-제한적인 예로, 석탄, 석탄 오일, 천연 가스, 바이오매스 및 폐기 유기물 등의 임의의 유기 공급원료의 기화로부터 수득할 수 있다. 기화는 일반적으로 높은 연료/산소 비율 하에 수행된다. 합성 가스는 주로 H2 및 CO이지만, CO2 및 기타 기체도 소량 포함할 수 있다. 따라서, 합성 가스는 CO, 추가적으로 CO2 등의 가스성 탄소에 대한 비용 효율적인 소스를 제공한다.
우드-룬달 (Wood-Ljungdahl) 경로는 CO와 H2를 아세틸-CoA와 아세테이트 등의 기타 생산물로 변환하는 반응을 촉매한다. 또한, CO 및 합성 가스를 이용할 수 있는 유기체는, 일반적으로, 우드-룬달 경로에 포함된 효소 및 변환으로 된 동일한 기본 세트를 통해, CO2 및 CO2/H2 혼합물을 이용할 수 있는 능력을 가지고 있다. 또한, 동일 유기체가 CO를 이용할 수 있고 동일한 경로가 관여한다는 것이 밝혀지기 전에는, 오랫동안 미생물이 이산화탄소를 H2-의존적인 방식으로 아세테이트로 변환하는 것으로 인지하였다. 수소가 존재하여 필요한 환원 당량을 제공하는 한, 여러 아세토젠 (acetogen)들이 이산화탄소의 존재 하에 증식해 아세테이트와 같은 화합물을 생산하는 것으로 확인된 바 있다 (예, Drake, Acetogenesis, pp. 3-60 Chapman and Hall, New York, (1994) 참조). 이를 아래 등식으로 요약할 수 있다:
2CO2 + 4H2 + nADP + nPi → CH3COOH + 2H2O + nATP
그래서, 우르-룬달 경로를 가진 비-천연성 미생물은 CO2 및 H2 혼합물을 이용할 수 있을 뿐만 아니라 아세틸-CoA 및 기타 원하는 생산물을 생산할 수 있다.
우드-룬달 경로는 당해 기술 분야에 잘 알려져 있으며, 2개의 분지, 즉 (1) 메틸 분지와 (2) 카보닐 분지로 나눌 수 있는 12가지 반응으로 구성되어 있다. 메틸 분지는 합성 가스를 메틸-테트라하이드로폴레이트(메틸-THF)로 변환하고, 카보닐 분지는 메틸-THF를 아세틸-CoA로 변환한다. 메틸 분지에서의 반응들은 다음과 같은 효소 또는 단백질에 의해 순차적으로 촉매된다: 페레독신옥시도리덕타제, 포르메이트 데하이드로게나제, 포르밀테트라하이드로폴레이트 신테타제, 메테닐테트라하이드로폴레이트 사이클로데하이드라타제, 메틸렌테트라하이드로폴레이트 데하이드로게나제 및 메틸렌테트라하이드로폴레이트 리덕타제. 카르보닐 분지에서의 반응들은 다음과 같은 효소 또는 단백질에 의해 순차적으로 촉매된다: 메틸테트라하이드로폴레이트:코리노이드 단백질 메틸트랜스퍼라제 (예, AcsE), 코리노이드 철-황 단백질, 니켈-단백질 어셈블리 단백질 (예, AcsF), 페레독신, 아세틸-CoA 신타제, 카본 모노옥사이드 데하이드로게나제 및 니켈-단백질 어셈블리 단백질 (예, CooC) (WO2009/094485 참조). 본 발명의 알데하이드 데하이드로게나제를 코딩하는 핵산 등의, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 제조하기 위한 충분한 개수로 코딩 핵산을 도입하는 것에 대한 본원에 제공된 교시 내용 및 지침에 따라, 당해 기술 분야의 당업자라면, 적어도 숙주 유기체에 존재하지 않는 우드-룬달 효소 또는 단백질을 코딩하는 핵산을 도입하는 것과 관련하여, 동일한 조작 설계를 수행할 수 있음을 이해할 것이다. 즉, 변형된 유기체에 우드-룬달의 전체 경로가 포함되도록 하나 이상의 코딩 핵산을 본 발명의 세포에 도입함으로써, 합성가스의 이용 능력을 부여하게 될 것이다.
또한, 일산화탄소 데하이드로게나제 활성 및/또는 하이드로게나제 활성과 커플링된 환원성(역) 트리카르복시산 사이클은, CO, CO2 및/또는 H2를 아세틸-CoA 및 아세테이트와 같은 기타 생산물로 변환하는데, 이용할 수 있다. 환원성 TCA 경로를 통해 탄소를 고정할 수 있는 유기체는 하나 이상의 다음과 같은 효소를 이용할 수 있다: ATP 사이트레이트-리아제, 사이트레이트 리아제, 아코니타제, 이소사이트레이트 데하이드로게나제, α-케토글루타레이트:페레독신옥시도리덕타제, 숙시닐-CoA 신테타제, 숙시닐-CoA 트랜스퍼라제, 푸마레이트 리덕타제, 푸마라제, 말레이트 데하이드로게나제, NAD(P)H:페레독신옥시도리덕타제, 일산화탄소 데하이드로게나제 및 하이드로게나제. 구체적으로, 일산화탄소 데하이드로게나제 및 하이드로게나제에 의해 CO 및/또는 H2로부터 추출된 환원 당량을 이용하여, 환원성 TCA 사이클을 통해 CO2를 아세틸-CoA 또는 아세테이트에 고정한다. 아세테이트는 아세틸-CoA 트랜스퍼라제, 아세테이트 키나제/포스포트랜스아세틸라제 및 아세틸-CoA 신테타제와 같은 효소에 의해 아세틸-CoA로 변환할 수 있다. 아세틸-CoA는, 피루베이트:페레독신 옥시도리덕타제 및 글루코스 신생 합성 (gluconeogenesis) 효소에 의해 글리세르알데하이드-3-포스페이트, 포스포에놀피루베이트 및 피루베이트로 변환할 수 있다. 또한, 아세틸-CoA는, 예를 들어, 아세토아세틸-CoA 티올라제에 의해 아세토아세틸-CoA로 변환되어, 본원에 기술된 바와 같이 1,3-BDO 경로로 이동할 수 있다 (도 1 참조). 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 제조하기 위한 경로를 구축하도록 충분한 개수의 코딩 핵산을 도입하는 것에 대한 본원에 제시된 교시된 내용 및 지침에 따라, 당해 기술 분야의 당업자라면, 숙주 유기체에 존재하지 않는 환원성 TCA 경로 효소 또는 단백질을 코딩하는 핵산을 적어도 도입하는 것에 대하여, 동일한 조작 설계를 수행할 수 있음을 이해할 것이다. 따라서, 본 발명의 세포에의 하나 이상의 코딩 핵산의 도입은 변형된 유기체가 환원성 TCA 경로를 포함하도록 수행될 수 있다.
따라서, 본원에 제시된 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 탄수화물과 같은 탄소원에서 생육시켰을 때, 본 발명의 생합성 화합물을생산 및/또는 분비하는 비-천연성 세포를 생산할 수 있음을 이해할 것이다. 이러한 화합물로는, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 및 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서의 임의의 중간 대사산물을 포함한다. 예를 들면, 본 발명의 알데하이드 데하이드로게나제를 비롯하여, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성 경로의 일부 또는 전체를 포함하는 등의, 원하는 화합물 또는 중간산물의 생합성을 달성하도록 필수 효소 또는 단백질 활성 중 하나 이상을 조작하는 것이 필요한 전부이다. 이에, 본 발명은, 탄수화물 또는 기타 탄소원에서의 생육시 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산 및/또는 분비하고, 탄수화물 또는 기타 탄소원에서의 생육시 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로에서 확인되는 임의의 중간 대사산물을 생산 및/또는 분비하는, 비-천연성 세포를 제공한다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 본 발명의 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물로부터의 합성을 개시할 수 있다.
본 발명의 비-천연성 세포는, 본원에 예시된 당해 기술 분야에 잘 알려진 방법을 이용하여, 본 발명의 알데하이드 데하이드로게나제, 및 선택적으로 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 효소 또는 단백질, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 코딩하는 하나 이상의 핵산을 외인성으로 발현하도록 구축된다. 효소 또는 단백질은 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하도록 충분한 양으로 발현될 수 있다. 본 발명의 세포는 본 발명의 알데하이드 데하이드로게나제를 발현하거나 또는 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기에 충분한 조건 하에서 배양되는 것으로 이해된다. 본원에 제시된 교시 내용 및 지침에 따라, 본 발명의 비-천연성 세포는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 달성하여, 세포내 농도 약 0.1-300 mM 또는 그 이상, 예를 들어, 0.1-1.3 M 이상을 형성할 수 있다. 일반적으로, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 세포내 농도는 약 3 내지 150 mM, 특히 약 5 내지 125 mM, 보다 구체적으로 약 8 내지 100 mM이며, 예를 들어 약 10 mM, 20 mM, 50 mM, 80 mM 또는 그 이상을 포함한다. 또한, 이들 예시 범위에 속하거나 그 보다 높은 세포내 농도 역시 본 발명의 비-천연성 세포로부터 달성할 수 있다. 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 세포내 농도는, 약 100 mM, 200 mM, 500 mM, 800 mM, 1 M, 1.1 M, 1.2 M, 1.3 M 또는 그 이상 등의 약 100 mM 내지 1.3 M일 수 있다.
본 발명의 세포는 잘 알려진 방법을 이용해 배양한다. 배양 조건은, 예를 들어 액체 배양 공정뿐 아니라 발효 및 기타 대규모 배양 공정을 포함할 수 있다. 본원에 기술된 바와 같이, 본 발명의 생합성 생산물의 특히 유익한 수율은 혐기성 또는 실질적으로 혐기성 배양 조건 하에 수득할 수 있다.
일부 구현예에서, 배양 조건은 혐기성 또는 실질적으로 혐기성 배양 또는 유지 조건을 포함한다. 예시적인 혐기성 조건은 종래에 개시되어 있으며, 당해 기술 분야에 잘 알려져 있다. 발효 공정에 대한 예시적인 혐기성 조건은 본원에 기술되어 있으며, 예를 들어 2007년 8월 10일자 미국 공개공보 제2009/0047719호에 기술되어 있다. 이러한 조건들 중 임의의 조건을 비-천연성 세포와 함께 이용할 수 있으며, 아울러 당해 분야에 잘 알려진 다른 혐기성 조건도 적용할 수 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 생산체 (producer)는, 상기한 혐기성 또는 실질적으로 혐기성 조건에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 세포내 농도 5-10 mM 또는 그 이상으로, 아울러 본원에 예시된 다른 모든 농도로 합성할 수 있다. 전술한 내용에서 세포내 농도가 언급되더라도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO를 생산하는 세포가 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 세포내에서 생산하거나, 및/또는 배양 배지로 생산물을 분비할 수 있는 것으로 이해된다.
본원에 기술된 바와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 달성하기 위한 하나의 예시적인 배양 조건은 혐기성 조건 및 발효 조건을 포함한다. 특정 구현예에서, 본 발명의 비-천연성 세포는 혐기 또는 실질적인 혐기 조건 하에 유지, 배양 또는 발효시킬 수 있다. 간략하게는, 혐기성 조건은 산소가 결여된 환경을 의미한다. 실질적인 혐기성 조건은, 예를 들어, 배지 내 용해 산소가 포화도 0-10%로 유지되는, 배양, 배치 발효 또는 연속 발효를 포함한다. 실질적인 혐기성 조건은 또한 산소 1% 미만의 대기가 유지되는 밀폐된 챔버 안에서 액체 배지 또는 고체 아가에서 세포를 배양하거나 또는 세포를 휴지시키는 것을 포함한다. 산소 %는, 예를 들어 배양물에 N2/CO2 혼합물 또는 기타 적절한 비-산소성 기체 또는 기체들을 퍼징함으로써 유지시킬 수 있다.
본원에 기술된 배양 조건은, 본 발명의 세포에 의해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하기 위한, 규모 확대 및 연속 배양일 수 있다. 배양 공정의 예로는, 피드-배치 발효 (fed-batch fermentation) 및 배치 분리 (batch separation); 피드-배치 발효 및 연속 분리, 또는 연속 발효 및 연속 분리가 있다. 이들 공정 모두 당해 기술 분야에 잘 공지되어 있다. 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 공업적인 양으로 생합성 생산하는데에는 발효 공정이 특히 유용하다. 일반적으로, 그리고 비-연속적인 배양 공정을 이용하는 경우에서와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 연속 생산 및/또는 거의 연속적인 생산은, 본 발명의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 비-천연성 유기체를 지수기 (exponential phase) 상태로 증식을 유지시키거나 및/또는 거의 유지시키기에 충분한 영양분 및 배지에서 배양하는 것을 포함할 것이다. 이러한 조건에서의 연속 배양은, 예를 들어 1일, 2일, 3일, 4일, 5일, 6일 또는 7일 이상의 기간 동안의 증식 또는 배양을 포함할 수 있다. 추가적으로, 연속 배양은 1주일, 2주일, 3주일, 4주일 또는 5주일 이상에서, 최대 수 개월까지의 장기간을 포함할 수 있다. 다른 예로, 본 발명의 유기체는 특정 용도에 적합하다면, 수시간 배양할 수 있다. 연속적인 및/또는 거의 연속적인 배양 조건은 이러한 예시적인 기간들 사이의 모든 시간 간격을 포함하는 것으로 이해하여야 한다. 아울러, 본 발명의 세포를 배양하는 시간은 원하는 목적을 위해 생산물을 충분한 양으로 생산하기에 충분한 기간인 것으로 이해된다.
예시적인 발효 공정으로는, 비-제한적으로, 피드-배치 발효 및 배치 분리; 피드-배치 발효 및 연속 분리; 및 연속 발효 및 연속 분리를 포함한다. 예시적인 배치 발효 프로토콜의에서, 생산 유기체는 적정 기체가 퍼징되는 적절한 크기의 생물반응조에서 배양한다. 혐기성 조건에서, 배양물에 불활성 기체 또는 기체들의 조합, 예를 들어, 질소, N2/CO2 혼합물, 아르곤, 헬륨 등이 퍼징 처리된다. 세포가 증식하면서 탄소원을 이용함에 따라, 생물반응조에 탄소원 및/또는 영양분의 소모와 대략 균형을 유지하는 속도로 추가적인 탄소원(들) 및/또는 기타 영양분을 투입한다. 생물반응조의 온도는 바람직한 온도, 일반적으로 22-37℃ 범위에서 유지되지만, 온도는 생산 유기체의 증식 특징 및 발효 공정의 바람직한 조건에 따라 더 높거나 또는 낮은 온도에서 유지할 수 있다. 발효 장치에서 배양물의 바람직한 특징, 예를 들어, 세포 밀도, 생산물 농도 등을 달성하기 위한 바람직한 시간 동안 계속적으로 증식시킨다. 배치 발효 공정에서, 발효 시간은, 바람직한 배양 조건에 따라, 일반적으로 수 시간에서 수일, 예를 들어 8-24시간 또는 1일, 2일, 3일, 4일 또는 5일, 또는 최대 1주일의 범위이다. pH는 필요에 따라 조절하거나 또는 조절하지 않을 수 있으며, pH를 통제하지 않는 배양의 경우, pH는 운영 종료시까지 전형적으로 pH3-6으로 떨어질 것이다. 배양 기간이 끝나면, 발효 장치의 내용물을 세포 분리 유닛, 예를 들어 원심분리, 여과 유닛 등을 통과시켜 세포 및 세포 파편을 제거할 수 있다. 원하는 생산물이 세포 내에서 발현되는 경우, 필요에 따라, 발효 브로스로부터 세포를 분리하기 전 또는 분리한 후, 부가적인 생산물을 방출시키기 위해, 세포를 효소적으로 또는 화학적으로 파괴시키거나 또는 세포용해를 실시할 수 있다. 발효 브로스는 생산물 분리 유닛으로 이동시킬 수 있다. 생산물의 단리는 희석 수용액으로부터 원하는 생산물을 분리하기 위한 당해 기술 분야에서 사용되는 표준 분리 공정에 의해 이루어진다. 이러한 방법은, 비-제한적으로, 발효 공정의 생산물의 화학적 특징에 따라, 생산물의 유기 용액을 제공하기 위한 수 비-혼화성 유기 용매 (예, 톨루엔 또는 그외 적절한 용매, 비-제한적인 예로, 다이에틸 에테르, 에틸 아세테이트, 테트라하이드로푸란 (THF), 메틸렌 클로라이드, 클로로포름, 벤젠, 펜탄, 헥산, 헵탄, 페트롤륨 에테르, 메틸 터셔리 부틸 에테르 (MTBE), 다이옥산, 다이메틸포름아미드 (DMF), 다이메틸 설폭사이드 (DMSO) 등)를 이용한 액체-액체 추출, 적절한 경우, 표준 증류 방법 등을 포함한다.
예시적인 완전 연속 발효 프로토콜 (fully continuous fermentation protocol)의 경우, 일반적으로 원하는 세포 밀도를 달성하기 위해 생산 유기체를 배치 방식으로 먼저 증식시킨다. 탄소원 및/또는 기타 영양분이 고갈되면, 동일한 조성의 공급 배지를 원하는 속도로 연속적으로 공급하고, 발효액을 동일한 속도로 배출시킨다. 이러한 조건에서, 생물반응조 내 생산물 농도뿐 아니라 세포 밀도는 일반적으로 일정하게 유지된다. 발효 장치의 온도는 전술한 바와 같이 바람직한 온도에서 유지된다. 연속 발효 단계 동안에, 일반적으로 생산 최적화에 적합한 pH 범위를 유지하는 것이 바람직하다. pH는, 원하는 pH 범위를 유지하기 위해 적절한 산 또는 염기를 첨가하는 등의, 일반적인 방법으로 유지 및 모니터링할 수 있다. 생물 반응조는 장기간 동안, 일반적으로 1주일 이상에서 수주, 최대 1달 또는 심지어 적절한 바람직한 경우에는 이보다 더 긴 기간 동안 연속적으로 운영된다. 발효액 및/또는 발효 배양물은, 생산물 농도 및/또는 세포 밀도의 일관성을 보장하기 위해, 요망되는 바와 같이, 최대 매일 샘플을 취하는 등의 주기적인 모니터링을 실시한다. 연속 모드에서는, 새로운 신선한 배지를 공급하면서 발효 장치의 내용물을 일정하게 배출시킨다. 세포, 배지 및 생산물이 함유된 배출 스트림은, 일반적으로, 세포 및 세포 파편을 필요에 따라 제거하면서 또는 제거하지 않으면서, 연속적인 생산물 분리 공정을 거치게 된다. 비-제한적인 예로, 수 비-혼화성 유기 용매를 이용한 연속적인 액체-액체 추출 (예, 톨루엔 또는 기타 적절한 용매, 비-제한적인 예로, 다이에틸 에테르, 에틸 아세테이트, 테트라하이드로푸란 (THF), 메틸렌 클로라이드, 클로로포름, 벤젠, 펜탄, 헥산, 헵탄, 페트롤륨 에테르, 메틸 터셔리 부틸 에테르 (MTBE), 다이옥산, 다이메틸포름아미드 (DMF), 다이메틸 설폭사이드 (DMSO) 등), 표준적인 연속 증류 방법 등 또는 그외 당해 기술 분야에 잘 알려진 방법 등의, 당해 기술 분야에서 사용되는 연속적인 분리 방법을 이용해, 희석 수용액 (dilute aqueous solution)으로부터 생산물을 분리할 수 있다
발효 공정은 당해 기술 분야에 잘 공지되어 있다. 간략하게는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생합성 생산하기 위한 발효는, 예를 들어, 피드-배치 발효 및 배치 분리; 피드-배치 발효 및 연속 분리, 또는 연속 발효 및 연속 분리로 수행할 수 있다. 배치 및 연속 발효 공정의 예는 당해 기술 분야에 잘 공지되어 있으며, 본원에 기술되어 있다.
상당량의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 연속적으로 생산하기 위해, 본 발명의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생산체를 이용한 본원에 기술된 발효 공정 외에도, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 생산체에 대해, 또한, 예를 들어, 생산물을 다른 화합물로 변환하는 화학적 합성 및/또는 효소 공정을 동시에 실시하거나, 또는 생산물을 발효 배양물로부터 분리한 다음 순차적으로 이를 필요에 따라 생산물을 다른 화합물로 변환하는 화학적 및/또는 효소적 변환 공정을 수행할 수 있다.
본원에 기술된 배양 및 발효 조건 외에도, 본 발명의 알데하이드 데하이드로게나제의 발현 또는 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생합성을 달성하기 위한 생육 조건은, 배양 조건에 내삼투압제 (osmoprotectant)의 첨가를 포함할 수 있다. 특정 구현예에서, 본 발명의 비-천연성 세포는 내삼투압제가 존재하는 조건에서 본원에 기술된 바와 같이 유지, 증식 및 발효할 수 있다. 간략하게는, 내삼투압제는 삼투 물질 (osmolyte)로서 작용하며 본원에 기술된 세포를 삼투 스트레스로부터 생존하는데 일조하는 화합물을 지칭한다. 내삼투압제로는, 베타인, 아미노산 및 당 트레할로스를 포함하지만, 이들로 한정되는 것은 아니다. 이에 대한 비-제한적인 예로는 글리신 베타인, 프랄린 베타인, 디메틸테틴, 다이메틸설포니오프로피오네이트, 3-다이메틸설포니오-2-메틸프로피오네이트, 피페콜산, 다이메틸설포니오아세테이트, 콜린, L-카르니틴 및 엑토인 등이 있다. 일 측면에서, 내삼투압제는 글리신 베타인이다. 당해 기술 분야의 당업자라면, 본원에 기술된 세포를 삼투 스트레스로부터 보호하기에 적합한 내삼투압제의 함량 및 종류가 사용되는 세포에 따라 결정됨을 알 것이다. 배양 조건에서 내삼투압제의 함량은, 예를 들어 약 0.1 mM 이하, 약 0.5 mM 이하, 약 1.0 mM 이하, 약 1.5 mM 이하, 약 2.0 mM 이하, 약 2.5 mM 이하, 약 3.0 mM 이하, 약 5.0 mM 이하, 약 7.0 mM 이하, 약 10 mM 이하, 약 50 mM 이하, 약 100 mM 이하, 또는 약 500 mM 이하일 수 있다.
일부 구현예들에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 임의의 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물에 존재하는 원자의 동위원소 분포 (isotopic distribution)를 변경하기 위해, 탄소 공급원료 및 기타 세포 흡수원 (cellular uptake source), 예를 들어 포스페이트, 암모니아, 설페이트, 클로라이드 및 기타 할로겐 화합물을 선택할 수 있다. 상기에 열거된 다양한 탄소 공급원료 및 기타 흡수원들은 총체적으로 "흡수원"로서 본원에서 지칭될 것이다. 흡수원은 생산물, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물에 존재하는 임의의 원자, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로로부터 분기된 반응들에서 만들어지는 부산물에 대해 동위원소 농화를 제공할 수 있다. 동위원소 농화는, 예를 들어, 탄소, 수소, 산소, 질소, 황, 인, 염소 또는 기타 할로겐 화합물을 비롯한 임의의 타겟 원소에서 달성될 수 있다.
일부 구현예들에서, 흡수원을 선택하여, 탄소-12, 탄소-13 및 탄소-14의 비율을 달라지게 할 수 있다. 일부 구현예들에서, 흡수원은 산소-16, 산소-17 및 산소-18의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 수소, 중수소 및 삼중수소의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 질소-14 및 질소-15의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 황-32, 황-33, 황-34 및 황-35의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 인-31, 인-32 및 인-33의 비율이 달라지도록 선택할 수 있다. 일부 구현예들에서, 흡수원은 염소-35, 염소-36 및 염소-37의 비율이 달라지도록 선택할 수 있다.
일부 구현예들에서, 타겟 원소의 동위원소 비율은 하나 이상의 흡수원을 선택함으로써 원하는 비율로 변경할 수 있다. 흡수원은 자연에서 발견되는 천연 소스로부터 유래하거나 또는 인간이 제조한 소스로부터 유래할 수 있으며, 당해 기술 분야의 당업자는, 타겟 원소의 원하는 동위원소 비율을 달성하기 위해 천연 소스, 인간이 제조한 소스 또는 이들의 조합을 선택할 수 있다. 인간이 만든 소스의 예로는, 예를 들어, 화학 합성 반응으로부터 적어도 부분적으로 유래되는 흡수원을 포함한다. 이러한 동위원소 농화된 흡수원은 상업적으로 구입하거나 또는 실험실에서 제조하거나, 및/또는 선택적으로 상기 흡수원들의 천연 소스를 혼합하여 원하는 동위원소 비율을 달성할 수 있다. 일부 구현예들에서, 흡수원의 타겟 동위원소 비율은 자연에서 발견되는 바람직한 흡수원 오리진을 선택함으로써 달성할 수 있다. 예를 들어, 본원에 기술된 바와 같이, 천연 소스는 생물 유기체로부터 유래하거나 또는 이에 의해 합성되는 생물 기재 (biobase)이거나, 또는 석유계 생산물 또는 대기 등의 소스일 수 있다. 이러한 일부 구현예들에서, 탄소원은, 예를 들어, 탄소-14가 상대적으로 고갈되어 있을 수 있는 화석 연료-유래 탄소원, 또는 석유 유래 카운터파트 보다 탄소-14를 더 많이 포함할 수 있는 이산화탄소 등의 환경 또는 대기 탄소원으로부터 선택할 수 있다.
불안정한 탄소 동위원소인 탄소-14 또는 방사성 탄소 (radiocarbon)는 지구 대기 중에 탄소 원자 1012개 당 거의 1개이며, 반감기는 약 5700년이다. 탄소 스톡 (stock)은 우주선 (cosmic ray)과 일반 질소 (14N)가 참여하는 핵 반응으로 인해 대기 상층에 풍부하다. 화석 연료에는 오래전에 붕괴되어 탄소-14가 없다. 화석 연료의 연소는 대기 중의 탄소-14의 비율 (fraction)을 낮추게 되며, 이를 '수스 효과 (Suess effect)'라 한다.
화합물에서 원소의 동위원소 비율을 확인하는 방법은 당해 기술 분야의 당업자에게 잘 알려져 있다. 동위원소 농화는 가속 질량 분광 측정 (AMS), SIRMS (Stable Isotope Ratio Mass Spectrometry) 및 SNIF-NMR (Site-Specific Natural Isotopic Fractionation by Nuclear Magnetic Resonance) 등의 당해 기술 분야에 공지된 기법을 이용한 질량 분광 측정으로 쉽게 분석한다. 이러한 질량 분광 기법들은 액체 크로마토그래피 (LC), 고성능 액체 크로마토그래피 (HPLC) 및/또는 기체 크로마토그래피 등의 분리 기법과 통합할 수 있다.
탄소의 경우, 미국에서 국제 ASTM (the American Society for Testing and Materials)의 방사성탄소 연대 측정법을 이용하여 고체, 액체 및 기체 샘플의 생물 기재 함량 (biobased content)을 측정하기 위한 표준화된 분석 방법으로서 ASTM D6866이 개발되어 있다. 이 표준법은 제품의 생물 기재 함량을 측정하기 위한 방사성탄소 연대 측정법의 사용의 토대이다. ASTM D6866은 2004년에 최초로 공개되었으며, 현재 사용되는 버전은 ASTM D6866-11 (2011년 4월 1일자로 발효됨)이다. 방사성탄소 연대 측정 기법들은 본원에 기술된 내용을 포함하여 당해 기술 분야의 당업자에게 잘 알려져 있다.
화합물의 생물 기재 함량은 탄소-14 (14C) 대 탄소-12 (12C)의 비율에 의해 추정한다. 구체적으로, 프랙션 모던 (Fm: Fraction Modern)은 식: Fm = (S-B)/(M-B)으로부터 계산하며, 이때 B, S 및 M은 각각 블랭크, 샘플 및 모던 레퍼런스 (modern reference)의 14C/12C 비율이다. 프랙션 모던은 "모던"에 대한 샘플의 14C/12C 비율의 편차 측정값이다. 모던은 mil 당 δ13CVPDB=-19에 대해 표준화된 NBS (National Bureau of Standard) 옥살산 I (즉, 표준 레퍼런스 물질 (SRM) 4990b)의 방사성 탄소 농도 (AD 1950)의 95%로서 정의된다 (Olsson, The use of Oxalic acid as a Standard. In, Radiocarbon Variations and Absolute Chronology, Nobel Symposium, 12th Proc., John Wiley & Sons, New York (1970)). 예를 들어, AMS에 의해 측정된 질량 분광측정 결과는 mil 당 δ13CVPDB=-19에 대해 표준화된 NBS 옥살산 I (즉, SRM 4990b)의 비활성 * 0.95라는 국제적으로 합의된 정의를 이용하여 계산한다. 이는 절대 (AD 1950) 14C/12C 비율 1.176 ± 0.010 x 10-12와 등가이다 (Karlen et al., Arkiv Geofysik, 4:465-471 (1968)). 표준 계산은 다른 것에 대한 하나의 동위원소의 차별적인 흡수, 예를 들어, 생물 시스템의 C12 대비 C13 대비 C14의 선호적인 흡수성 (preferential uptake)을 계산에 고려하며, 이들 보정은 δ13에 대해 보정된 Fm으로서 반영된다.
옥살산 표준물질 (SRM 4990b 또는 HOx 1)은 1955년 사탕무 작물로부터 제조되었다. 1000 lbs가 제조되었지만, 이 옥살산 표준물질은 더 이상 시판되지 않는다. 옥살산 II 표준물질 (HOx 2; N.I.S.T designation SRM 4990 C)은 1977년 프랑스 사탕무 당밀로부터 제조되었다. 1980년대 초반에, 12개의 실험실 그룹에서 2가지 표준물질의 비를 측정하였다. 옥살산 II / I의 활성 비율은 1.2933 ± 0.001 (가중 평균)이었다. HOx II의 동위원소 비율은 -17.8 / mil이다. ASTM D6866-11은 모던 표준물질로 이용가능한 옥살산 II 표준물질 SRM 4990 C (Hox2)를 사용할 것을 권고한다 (Mann, Radiocarbon, 25(2):519-527 (1983)에서의, 오리지날 대 현재 시판되는 옥살산 표준물질을 비교한 내용 참조). Fm = 0%는 물질에 탄소-14가 전혀 없으며, 즉 화석 (예, 석유계) 탄소원이라는 것을 의미한다. 1950년대 이후 핵 폭발 실험에 의해 탄소-14가 대기로 발산된 것을 보정한 이후의, Fm = 100%은 전적으로 모던 탄소원이라는 것을 의미한다. 본원에서, "모던" 소스는 생물 기재 소스를 포함한다.
ASTM D6866에 기술된 바와 같이, 모던 탄소의 퍼센트 (pMC)는, 1950년대 핵 실험 프로그램의 효력이 지속되고 있고 소멸되지 않아, 100% 보다 클 수 있으며, 그 결과 ASTM D6866-11에 기술된 바와 같이 대기에서 탄소-14가 상당히 농화되었다. 모든 샘플의 탄소-14 활성은 "폭발 전 (pre-bomb)" 표준을 참조하고, 거의 모든 새로운 생물 기재 제품은 폭발 후 (post-bomb) 환경에서 만들어지기 때문에, 모든 pMC 값들은 (동위원소 분획에 대해 보정 후) 샘플의 실제 생물 기재의 함량을 더 잘 반영하도록 0.95 (2010 현재)를 곱해야 한다. 생물 기재의 함량이 103% 보다 높다는 것은 분석 에러가 발생하였거나 또는 생물 기재의 탄소 소스가 수년 이상 오래되었다는 것을 의미한다.
ASTM D6866은 물질의 총 유기 함량을 기준으로 생물 기재 함량을 정량하며, 존재하는 무기 탄소와 기타 비-탄소 함유 물질은 고려하지 않는다. 예를 들어, 50%가 전분-기재 물질이고 50%가 물인 제품은, ASTM D6866을 토대로, 생물 기재 함량 = 100%인 것으로 간주된다 (100% 생물 기재인 유기 탄소 함량 50%). 다른 예로, 전분-기재 물질 50%, 석유계 물질 25% 및 물 25%로 구성된 제품은, 생물 기재 함량 = 66.7% (유기 탄소 함량이 75%이나, 제품의 50%만 생물 기재임)이다. 다른 예로, 유기 탄소가 50%이고 석유계 생산물인 제품은 생물 기재 함량 = 0% (유기 탄소 함량이 50%이나, 화석 소스로부터 유래됨)인 것으로 간주될 것이다. 즉, 화합물 또는 물질의 생물 기재 함량을 측정하는 잘 알려져 있는 방법 및 공지 표준물질을 기반으로, 당해 기술 분야의 당업자는, 쉽게 화합물 또는 물질 및/또는 원하는 생물 기재 함량을 가진 본 발명의 화합물 또는 물질을 이용하는 제조된 다운스트림 산물 (downstream product)의 생물 기재 함량을 측정할 수 있다.
탄소-14 연대 측정 기법을 사용하여 물질의 생물 기재 함량을 정량하는 것은 당해 기술 분야에 공지되어 있다 (Currie et al., Nuclear Instruments and Methods in Physics Research B, 172:281-287 (2000)). 예를 들어, 탄소-14 연대 측정법은 테레프탈레이트 함유 물질에서 생물 기재 함량을 정량하는데 사용된다 (Colonna et al., Green Chemistry, 13:2543-2548 (2011)). 특히, 재생가능한 1,3-프로판디올로부터 유래된 폴리프로필렌 테레프탈레이트 (PPT) 폴리머와 석유계 테레프탈산은 Fm 값이 거의 30%이었다 (즉, 폴리머 탄소의 3/11이 재생가능한 1,3-프로판디올로부터 유래되며, 8/11은 화석 최종 멤버 테레프탈산으로부터 유래되므로) (Currie et al., supra, 2000). 반면, 재생가능한 1,4-부타디올 및 재생가능한 테레프탈산으로부터 유래된 폴리부틸렌 테레프탈레이트 폴리머는 생물 기재 함량이 90%를 초과하였다 (Colonna et al., supra, 2011).
이에, 일부 구현예에서, 본 발명은, 환경 탄소, 흡수원으로도 지칭되는, 대기 탄소 (atmospheric carbon)를 나타내는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 본 발명의 세포에 의해 생산되는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 예를 들어, 일부 측면에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 10% 이상, 15% 이상, 20% 이상, 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 98% 이상 또는 높게는 100%의 Fm 값을 가질 수 있다. 이러한 일부 구현예들에서, 흡수원은 CO2이다. 일부 구현예들에서, 본 발명은 석유계 탄소 흡수원 (petroleum-based carbon uptake source)을 반영하는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 이러한 측면에서, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 95% 미만, 90% 미만, 85% 미만, 80% 미만, 75% 미만, 70% 미만, 65% 미만, 60% 미만, 55% 미만, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 2% 미만 또는 1% 미만의 Fm 값을 가질 수 있다. 일부 구현예에서, 본 발명은 대기 탄소 흡수원과 석유계 탄소 흡수원의 조합에 의해 형성되는 탄소-12, 탄소-13 및 탄소-14 비율을 가진, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 제공한다. 이러한 흡수원들의 조합을 이용하는 것 역시 탄소-12, 탄소-13 및 탄소-14 비율을 다양하게 할 수 있는 한가지 수단이며, 각각의 비율은 흡수원의 비율을 반영할 것이다.
나아가, 본 발명은, 본원에 기술된 생물학적으로 생산된 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물, 및 이로부터 유래된 생산물에 관한 것으로서, 여기서 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은 환경에서 생성된 CO2에서와 대략 동일한 수치의 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가진다. 예를 들어, 일부 측면들에서, 본 발명은, 환경에서 발생하는 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율을 가진, 또는 본원에 기술된 다른 임의의 비율을 가진, 생물 유래 (bioderived) 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 중간산물을 제공한다. 본원에 기술된 바와 같이, 생산물은 환경에서 생성된 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율, 또는 본원에 기술된 다른 임의의 비율을 가질 수 있는 것으로 이해되며, 여기서 생산물은, 본원에 기술된 바와 같이, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물로부터 제조되며, 생물 유래 생산물은 화학적으로 변형되어 최종 생산물로 제조된다. 원하는 생산물을 제조하기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO의 중간산물의 생물 유래 생산물을 화학적으로 변형시키는 방법은, 본원에 기술된 바와 같이, 당해 기술 분야의 당업자에게 잘 알려져 있다. 본 발명은, 환경에서 생성된 CO2에서와 대략 동일한 수치의 탄소-12 대 탄소-13 대 탄소-14 동위원소 비율을 가진, 3-HBal 및/또는 1,3-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 기재로 할 수 있는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리하이드록시알카노에이트, 나일론, 유기용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제 (hypoglycaemic agent), 부타다이엔 및/또는 부타다이엔-기재의 제품, 그리고 4-HBal 및/또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 기재로 할 수 있는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예로 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드라고도 함), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론 등을 추가로 제공하며, 여기서 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예로, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은, 본원에 기술된 바와 같이, 직접 제조되거나, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물과 조합하여 제조된다. 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는 방법은 종래에 개시된 바 있다 (예, WO 2010/127319, WO 2013/036764, 미국 특허 9,017,983, US 2013/0066035, WO/2012/018624, US 2012/0021478, 이들 각각은 원용에 의해 본 명세서에 포함됨). 1,3-BDO는 생체내 또는 시험관내에서 산과 반응시켜, 예를 들어 리파제를 사용해 에스테르로 변환할 수 있다. 이러한 에스테르는 누트라슈티컬, 약제 및 식품 용도를 가질 수 있으며, 1,3-BDO의 R-형태가 (S-형태 또는 라세믹 혼합물과 비교해) 동물 및 인간에서 에너지원으로서 가장 잘 활용되기 때문에, 이 형태가 유용하다 (예를 들어, (미국에서 일반적으로 안정한 것 (GRAS)으로 인정된) (R)-3-하이드록시부틸-R-1,3-부탄다이올 모노에스테르 및 (R)-3-하이드록시부티레이트 글리세롤 모노에스테르 또는 다이에스테르와 같은 케톤 에스테르). 케톤 에스테르는 경구로 전달할 수 있으며, 이 에스테르 화합물은 신체에 의해 사용되는 R-1,3-부탄다이올을 해리시킨다 (예, WO2013150153). 아미드 제조 방법은 당해 기술 분야에 잘 알려져 있다 (예, Goswami and Van Lanen, Mol. Biosyst. 11(2):338-353 (2015)).
이에, 본 발명은, 고도로 농화된 또는 기본적으로 거울상이성질체 측면에서 순수하며 추가적으로 부산물에 대해 개선된 순도 품질을 가진, 1,3-BDO, 즉 R-1,3-부탄다이올의 개선된 조성물을 제공하기 위한 개선된 효소 경로 및 미생물을 제공하는데 특히 유용하다. 1,3-BDO는 식품 소스, 식품 성분으로서, 착향제로서, 착향제용 용매 또는 용해제로서, 안정제로서, 유화제로서, 항균제로서 및 보존제로서 직접 사용하는 등의 추가적인 식품 관련 용도를 가진다. 1,3-BDO는 비경구 약물 용매로서 제약 산업에 사용된다. 1,3-BDO는 연화제 (emollient)의 성분으로서, 불용성 성분의 결정화를 방지하는 습윤제 (humectant), 향료와 같은 수-난용성 성분에 대한 용해제, 및 항균제 및 보존제로서 화장품에 사용된다. 예를 들어, 이는 특히 헤어 스프레이 및 세팅 로션에 습윤제로서 사용될 수 있으며; 이는 에센셜 오일로부터 아로마 감소를 억제하고, 미생물에 의한 부패를 방지하고, 벤조에이트의 용매로서 사용된다. 1,3-BDO는 0.1% 내지 50%, 심지어 0.1% 미만 및 50% 초과의 농도로 사용될 수 있다. 이는 헤어 및 목욕 제품, 눈 및 얼굴 메이크업, 향수, 개인 청결 제품 및 면도 및 피부 관리 제품에 사용된다 (예, the Cosmetic Ingredient Review board's report: "Final Report on the Safety Assessment of Butylene Glycol, Hexylene Glycol, Ethoxydiglycol, and Dipropylene Glycol", Journal of the American College of Toxicology, Volume 4, Number 5, 1985, 이는 원용에 의해 본 명세서에 포함됨). 이 보고서는 화장품에서의 1,3-BDO의 특수 용도 및 농도를 제공하며; 예를 들어, 보고서의 표 2 "제품 제형 데이터"를 참조한다.
일 구현예에서, 본 발명은, 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며; 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법으로 제조되는, 생물 유래 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는, 배양 배지를 제공한다. 일 구현예에서, 배양 배지는 세포로부터 분리된다.
일 구현예에서, 본 발명은, 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며; 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법으로 제조되는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO는 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가진다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법으로 제조된, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3- 부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)을 제공한다. 일 구현예에서, 본 발명은, 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며, 3-HBal 및/또는 1,3-BDO가 본 발명의 세포에 의해 또는 세포용해물 내 또는 본 발명의 방법으로 제조되고; 3-HBal 및/또는 1,3-BDO가 R-형태로 거울상이성질체 측면에서 농화된, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가진다.
일 구현예에서, 본 발명은, 3-HBal 및/또는 1,3-BDO가 R-형태로 거울상이성질체 측면에서 농화된, 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법으로 제조되는 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3- 부탄다이올 (1,3-BDO)을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO에서 R 형태의 비율이 95% 보다 높거나, 96% 보다 높거나, 97% 보다 높거나, 98% 보다 높거나, 99% 보다 높거나, 99.1% 보다 높거나, 99.2% 보다 높거나, 99.3% 보다 높거나, 99.4% 보다 높거나, 99.5% 보다 높거나, 99.6% 보다 높거나, 99.7% 보다 높거나, 99.8% 보다 높거나 또는 99.9% 보다 높다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO는 R-거울상이성질체 비율이 ≥55%, ≥60%, ≥65%, ≥70%, ≥75%, ≥80%, ≥85%, ≥90% 또는 ≥95%이며, 화학적으로 매우 순수할 수 있으며, 예를 들어, R-거울상이성질체는 ≥99%, 예를 들어, ≥95%, ≥96%, ≥97%, ≥98%, ≥99%, ≥99.1%, ≥99.2%, ≥99.3%, ≥99.4%, ≥99.5%, ≥99.6%, ≥99.7%, ≥99.8% 또는 ≥99.9%이다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법에 의해 생산된, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO; 및 3-HBal 및/또는 1,3-BDO 또는 4-HBal 또는 1,4-BDO 이외의 화합물을 각각 포함하는 조성물을 제공한다. 일 구현예에서, 3-HBal 및/또는 1,3-BDO 또는 4-HBal 및/또는 1,4-BDO 이외의 화합물은, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 각각 생산하거나 또는 본 발명의 폴리펩타이드를 발현하는, 세포의 일부이다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 세포용해물에서 또는 본 발명의 방법에 의해 생산된 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 조성물, 또는 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 생산하는 세포의 세포용해물 또는 배양 상층액을 제공한다.
일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 본 발명의 세포용해물에서 또는 본 발명의 방법에 의해 생산된, 3-HBal 및/또는 1,3-BDO, 또는 4- HBal 및/또는 1,4-BDO를 포함하는 생산물을 제공하며, 여기서 생산물은 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 폴리하이드록시알카노에이트, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG), 폴리부틸렌 테레프탈레이트 (PBT), 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 또는 부타다이엔-기재의 제품이다. 일 구현예에서, 생산물은 화장품 제품 또는 식품 첨가제이다. 일 구현예에서, 생산물은 생물 유래 3-HBal 및/또는 1,3-BDO 또는 생물 유래 4-HBal 및/또는 1,4-BDO를 적어도 0.1%, 적어도 0.5%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50%로 포함한다. 일 구현예에서, 생산물은 제조된 3-HBal 및/또는 1,3-BDO의 일부 또는 제조된 4-HBal 및/또는 1,4-BDO의 일부를 반복 유닛으로서 포함한다. 일 구현예에서, 본 발명은, 본 발명의 세포에 의해 또는 본 발명의 세포용해물 내 또는 본 발명의 방법에 의해 생산된 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 이용해 제조되거나 또는 이로부터 유래되는, 생산물을 성형함으로써 수득되는, 성형물 (molded product)을 제공한다.
본 발명은, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물; 및 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 이외의 화합물을 포함하는, 조성물을 또한 제공한다. 생물 유래 생산물 이외의 화합물은, 예를 들어, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 생산하는 경로를 구비한 본 발명의 비-천연성 세포의, 세포 일부, 예를 들어, 미량의 세포 일부일 수 있거나, 또는 상기한 비-천연성 세포의 존재 하에 생산된 발효 브로스 또는 배양 배지, 또는 이의 정제된 또는 일부 정제된 일부일 수 있다. 조성물은, 예를 들어, 본원에 기술될 바와 같이, 부산물 발생이 저하된 유기체에 의해 생산되는 경우, 부산물은 감소된 수준으로 포함될 수 있다. 조성물은, 예를 들어, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 본 발명의 세포의 세포용해물 또는 배양 상층액을 포함할 수 있다.
3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물은 상업적인 용도 및 공업적인 용도에서 사용되는 화합물이다. 이러한 용도에 대한 비-제한적인 예로는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 LycraTM로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품의 생산 등이 있다. 또한, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO는 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 포함하여 매우 다양한 생산물을 생산하는 원료로서 사용된다. 이에, 일부 구현예에서, 본 발명은, 예를 들어, 본 발명의 알데하이드 데하이드로게나제를 발현하는 본 발명의 비-천연성 세포에 의해 생산되거나 또는 본원에 개시된 방법을 이용해 생산되는, 하나 이상의 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 포함하는, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공한다.
본원에서, 용어 "생물 유래"는 생물 유기체로부터 유래되거나 또는 생물 유기체에 의해 합성되는 것을 의미하며, 생물 유기체에 의해 제조가능하므로 재생가능한 자원으로 간주할 수 있다. 이러한 생물 유기체는, 특히 본원에 기술된 본 발명의 세포는, 공급원료 또는 바이오매스, 예를 들어 농작물, 식물, 박테리아 또는 동물 소스로부터 수득되는 당 또는 탄수화물을 이용할 수 있다. 다른 예로, 생물 유기체는 대기 탄소를 이용할 수 있다. 본원에서, 용어 "생물 기재"는 전술한 바와 같이 본 발명의 생물 유래 화합물로 전체가 또는 일부분이 구성된 생산물을 의미한다. 생물 기재 또는 생물 유래 생산물은 석유 또는 석유화학 공급원료로부터 유래되거나 합성되는, 석유 유래 생산물과는 대비된다.
일부 구현예에서, 본 발명은, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 포함하는, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공하며, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는데 사용되는, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 모두 또는 일부를 포함한다. 예를 들어, 최종 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하기 위해, 생물 유래 3-HBal, 1,3- BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물, 또는 이의 일부를 포함할 수 있다. 이러한 제조는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을, 최종 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품으로 화학적으로 반응시키는 것을 포함할 수 있다 (예, 화학적 변환, 화학적 기능성화, 화학적 커플링, 산화, 환원, 중합, 공중합 등). 따라서, 일부 측면에서, 본 발명은, 본원에 기술된 바와 같이 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 적어도 2%, 적어도 3%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98% 또는 100%로 포함하는, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재 생산물을 제공한다.
또한, 일부 구현예에서, 본 발명은, 본원에 기술된 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물; 및 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로 중간산물 이외의 화합물을 포함하는 조성물을 제공한다. 예를 들어, 일부 측면에서, 본 발명은 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제공하며, 여기서 이의 제조시 사용되는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물은, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물의 생물 유래의 것과 석유 유래의 것의 조합이다. 예를 들어, 생물 기재의 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품은, 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 50%; 및 석유 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 50%를 이용해 제조할 수 있거나, 또는 생산물의 적어도 일부가 본원에 기술된 세포에 의해 생산된 생물 유래 생산물을 포함하는 한 생물 유래/석유 유래 전구체 60%/40%, 70%/30%, 80%/20%, 90%/10%, 95%/5%, 100%/0%, 40%/60%, 30%/70%, 20%/80%, 10%/90%와 같은 다른 바람직한 비율을 사용해 제조할 수 있다. 본 발명의 생물 유래 3-HBal, 1,3-BDO, 4- HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 또는 생물 유래 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO 경로의 중간산물을 사용해, 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 예를 들어, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머와 같은 폴리하이드록시알카노에이트, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG)(PTMO, 폴리테트라메틸렌 옥사이드로도 지칭됨), 폴리부틸렌 테레프탈레이트 (PBT), 및 스판덱스, 엘라스탄 또는 Lycra™로도 지칭되는 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 및/또는 부타다이엔-기재의 제품을 제조하는 방법들은, 당해 기술 분야에 잘 공지되어 있는 것으로 이해된다.
우수한 생산체를 구축하기 위해, 대사 모델링을 이용해 생육 조건을 최적화할 수 있다. 또한, 모델링을 이용해 경로의 활용을 부가적으로 최적화하는 유전자 넉아웃을 설계할 수 있다 (예, US 특허 공개공보 2002/0012939, US 2003/0224363, US 2004/0029149, US 2004/0072723, US 2003/0059792, US 2002/0168654 및 US 2004/0009466, 및 미국 특허 7,127,379). 모델링 분석을 통해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물을 보다 효율적으로 생산하는 쪽으로 대사를 이동시키는 세포 증식에 대한 효과를 신뢰할 수 있게 예측할 수 있다.
원하는 생산물의 생합성에 유익한 대사 변이를 동정 및 설계하기 위한 한가지 전산 방식 (computational method)은 OptKnock 전산 프래임워크이다 (Burgard et al., Biotechnol. Bioeng. 84:647-657 (2003)). OptKnock는 타겟 생산물을 과생산하는 유전적으로 안정한 미생물을 만드는, 유전자 결손 또는 파괴 전략을 제안하는 대사 모델링 및 시뮬레이션 프로그램이다. 구체적으로, 이러한 프래임워크는, 원하는 생화합물이 세포 생육의 필수 부산물이 되도록 강제하는 유전자 조작을 제시하기 위해, 미생물의 전체 대사 및/또는 생화학적 네트워크를 조사한다. 전략적으로 배치된 유전자 결손 또는 그외 기능성 유전자의 파괴를 통해 생화학적 생산을 세포 증식과 커플링함으로써, 생물반응기에서 장기간 경과 후 조작된 균주에 부과된 증식 선택압은, 필연적인 증식-연계된 생화학적 생산의 결과로서 성능을 개선한다. 마지막으로, 유전자 결손이 구축되면, OptKnock에 의해 선택된 유전자는 게놈에서 완전히 제거되기 때문에, 설계된 균주가 야생형 형태로 되돌아갈 가능성이 거의 없다. 따라서, 이러한 전산 방법을 이용하여, 원하는 생산물의 생합성을 도출하는 대안적인 경로를 동정하거나, 또는 원하는 생산물의 생합성을 추가로 최적화하기 위해 비-천연성 세포와 조합하여 사용할 수 있다.
간략하게는, OptKnock는 세포 대사를 모델링하기 위한 전산 방법 및 시스템을 지칭하기 위해 본원에서 사용하는 용어이다. OptKnock 프로그램은 특정 제약 (particular constraint)을 플럭스 밸런스 분석 (FBA) 모델에 통합하는 방법 및 모델의 프래임워크에 관한 것이다. 이러한 제약으로는, 예를 들어 정성적인 동역학 정보 (qualitative kinetic information), 정성적인 조절 정보, 및/또는 DNA 마이크로어레이 실험 데이터를 포함한다. 또한, OptKnock는, 예를 들어, 플럭스 밸런스 모델로부터 파생되는 플럭스 바운더리를 확고히 한 다음 후속적으로 유전자 부가 또는 결손의 존재 하에 대사 네트워크의 성능 제한을 조사함으로써, 다양한 대사 문제들에 대한 해법을 도출한다. OptKnock 전산 프래임워크는 대사 네트워크의 성능 제한의 유효 쿼리를 허용하는 모델 포뮬레이션을 구축할 수 있으며, 구해진 혼합-정수 선형 프로그래밍 문제점을 해결하는 방법을 제공할 수 있다. 본원에서 OptKnock로 지칭되는 대사 모델링 및 시뮬레이션 방법들은, 예를 들어 2002년 1월 10일자로 출원된 미국 공개공보 2002/016854, 2002년 1월 10일자로 출원된 국제 특허 제 PCT/US02/00660, 및 2007년 8월 10일자로 출원된 미국 공개공보 2009/0047719에 개시되어 있다.
생산물의 생합성 생산에 유리한 대사 변이를 동정 및 설계하기 위한 또 다른 전산 방법은, SimPheny®로 지칭되는 대사 모델링 및 시뮬레이션 시스템이다. 이 전산 방법 및 시스템은, 예를 들어, 2002년 6월 14일자로 출원된 미국 공개공보 2003/0233218 및 2003년 6월 13일자로 출원된 국제 특허 출원 PCT/US03/18838에 개시되어 있다. SimPheny®는 인 실리코 (in silico) 네트워크 모델을 구축하고, 생물 시스템의 화학 반응들을 통해 질량, 에너지 또는 전하의 흐름을 시뮬레이션하여 시스템에서 화학 반응의 임의의 그리고 모든 가능한 작용기를 포괄하는 해법 영역을 규정함으로써, 생물 시스템에서 허용되는 다양한 활성들을 결정하기 위해 사용할 수 있는 전산 시스템이다. 이러한 방식은, 포함된 반응들의 공지된 화학량론 뿐 아니라 반응을 통한 최대 플럭스와 관련된 반응 열역학적 및 용량 제약 등의 제약에 의해 해법 영역을 규정하므로, 제약 조건 기반의 모델링 (constraints-based modeling)이라고도 한다. 이러한 제약에 의해 규정되는 영역을 조사하여, 생물 시스템 또는 이의 생화학적 성분들의 표현형 역량 및 거동을 결정할 수 있다.
이러한 전산 방법은, 생물 시스템들이 유연하고 다수의 다른 방식으로도 동일한 결과에 도달할 수 있기 때문에, 생물학적 현실과 부합한다. 생물 시스템은 모든 살아있는 시스템들이 직면하는 근본적인 제약들에 의해 제한되어 온 진화론적 기전을 통해 설계된다. 따라서, 제약 조건 기반의 모델링 전략은 이러한 일반적인 현실을 포괄한다. 더욱이, 제약 조건의 엄격화를 통해 네트워크 모델에 추가적인 제약을 계속적으로 부과하는 능력은 해법 영역의 크기를 줄이게 되고, 그래서 생리학적 성능 또는 표현형을 예견할 수 있는 정확도가 향상된다.
본 발명의 교시 내용 및 지침을 감안하여, 당해 기술 분야의 당업자라면, 숙주 세포에서 원하는 화합물의 생합성을 설계 및 구현하기 위해 대사 모델링 및 시뮬레이션에 다양한 전산 프래임워크를 적용할 수 있을 것이다. 이러한 대사 모델링 및 시뮬레이션 방법은, 예를 들어 SimPheny® 및 OptKnock와 같이 상기에 예시된 전산 시스템을 포함한다. 본 발명을 예시하기 위해, 모델링 및 시뮬레이션을 위한 OptKnock 전산 프래임워크 체계를 참조하여, 일부 방법들이 본원에 기술된다. 당해 기술 분야의 당업자는, 당해 기술 분야에 잘 알려져 있는 임의의 이러한 다른 대사 모델링 및 시뮬레이션 전산 프래임워크 및 방법에, OptKnock를 이용한 대사 변이의 동정, 설계 및 구현을 적용하는 방법을 알 것이다.
전술한 방법은 파괴할 하나 이상의 대사 반응 세트를 제공할 것이다. 이러한 세트에서의 각 반응의 제거 또는 대사 변형으로, 원하는 생산물을 유기체의 증식 단계 동안에 필수 생산물로서 생산시킬 수 있다. 반응들이 공지되어 있으므로, bilevel OptKnock 문제에 대한 해법은, 또한, 반응 세트의 각 반응을 촉매하는 하나 이상의 효소를 코딩하는 관련 유전자 또는 유전자들을 제공해 줄 것이다. 반응 세트와, 각 반응에 참여하는 효소를 코딩하는 해당 유전자의 동정은, 일반적으로 효소와 코딩 유전자 간의 관련성이 포함된 반응 데이타베이스를 이용한 반응들의 상관 관계를 통해 달성되는, 자동화된 공정이다.
일단 동정하면, 원하는 생산물의 생산을 달성하기 위해 파괴시킬 반응 세트는, 세트에 포함된 각 대사 반응을 코딩하는 하나 이상의 유전자의 기능적 파괴에 의해, 타겟 세포 또는 유기체에서 구현한다. 반응 세트의 기능적 파괴를 달성하는데 특히 유용한 한가지 수단은, 각 코딩 유전자의 결손이다. 그러나, 일부 경우에, 예를 들어 조절 인자에 대한 cis 결합 부위 또는 프로모터와 같은 조절 영역의 돌연변이, 결손 등의 기타 유전적 변형에 의해, 또는 여러 위치들 중 어느 한 위치에서의 코딩 서열의 절단 (truncation)에 의해, 반응을 파괴하는 것이 유익할 수 있다. 유전자 세트의 전체 결손 미만의 수준으로 결손시키는 이러한 변형은, 예를 들어 생산물의 커플링을 신속하게 평가하거나 또는 유전자 복원이 이루어질 가능성이 거의 없을 경우에, 유용할 수 있다.
추가적인 반응 세트를 파괴하거나 또는 원하는 생산물의 증식-연계된 생합성 등의 생합성을 달성할 수 있는 대사 변형을 유발하는 전술한 bilevel OptKnock 문제점에 대한 추가적인 생산적인 해법을 동정하기 위해, 정수 컷 (integer cut)으로 칭해지는 최적화 방법을 수행할 수 있다. 이 방법은, 상기 예시된 OptKnock 문제를, 각 반복시 정수 컷으로 지칭되는 추가적인 제약을 통합하여, 반복적으로 해결함으로써, 진행한다. 정수 컷 제약은, 해결 과정이, 생산물 생합성을 증식과 필연적으로 연결시키는, 임의의 이전 반복에서 동정된 실제 동일한 반응 세트를 선택하지 않도록 방지한다. 예를 들어, 만일 앞서 동정된 증식-연계된 대사 변형으로 파괴시킬 반응 1, 2 및 3개가 정해지면, 후속적인 제약으로 동일한 반응들이 이후 해법에서 동시에 고려되지 않도록 한다. 정수 컷 방법은 당해 기술 분야에 널리 공지되어 있으며, 예를 들어 Burgard et al., Biotechnol . Prog. 17:791-797 (2001)에서 찾아 볼 수 있다. 대사 모델링 및 시뮬레이션을 위해 OptKnock 전산 프래임워크와 조합하여 사용되는 것과 관련하여 본원에 기술된 모든 방법에서와 같이, 반복적인 계산 분석에서 중복을 줄이는 정수 컷 방법을, 또한, 예를 들어, SimPheny® 등의 당해 기술 분야에 널리 공지된 그외 전산 프래임워크를 이용해 적용할 수 있다.
본원에 예시된 방법들로, 타겟 생화학 생산물의 생산을, 동정된 유전자 변이를 가지도록 조작된 세포 또는 유기체의 증식과, 필연적으로 커플링하는 등의, 원하는 생산물을 생합성으로 생산하는 세포 및 유기체를 구축할 수 있다. 따라서, 본원에 기술된 전산 방법은 OptKnock 및 SimPheny®로부터 선택되는 인 실리코 (in silico) 방법에 의해 동정되는 대사 변형들을 동정 및 구현할 수 있다. 대사 변형 세트는, 예를 들어 하나 이상의 생합성 경로 효소의 부가 및/또는 예를 들어 유전자 결손에 의한 파괴 등의 하나 이상의 대사 반응의 기능적 파괴를 포함할 수 있다.
전술한 바와 같이, OptKnock 방법은 장기간의 증식 선택을 거쳤을 때 미생물 돌연변이 네트워크가 전산적으로 예측되는 최대-증식 표현형 쪽으로 진화할 수 있다는, 전제 하에 개발되었다. 즉, 이 방법은 선택압 하에 유기체의 자기-최적화 능력을 활용한다. OptKnock 프래임워크는 네트워크 화학량론에 근거하여 생화학적 생산과 세포 증식을 인위적으로 커플링시키는 유전자 결손의 조합을 철저하게 조사할 수 있다. 최적의 유전자/반응 넉아웃을 확인하는데에는, 형성된 네트워크에 대한 최적의 증식 해법이 대상 생화학적 생산물을 과생산하도록, 활성 반응 세트를 선택하는 2단식 최적화 문제 해법이 요구된다 (Burgard et al., Biotechnol. Bioeng. 84:647-657 (2003)).
E. coli 대사의 인 실리코 화학량론 모델을 채택하여, 기존에 예시되고, 예를 들어 미국 특허 공개공보 US 2002/0012939, US 2003/0224363, US 2004/0029149, US 2004/0072723, US 2003/0059792, US 2002/0168654 및 US 2004/0009466 및 미국 특허 7,127,379에 기술된 바와 같이, 대사 경로의 필수 유전자들을 동정할 수 있다. 본원에 기술된 바와 같이, OptKnock의 수학적 프래임워크를 이용하여, 원하는 생산물을 증식과 조합하여 생산할 유전자 결손을 정확하게 파악할 수 있다. 나아가, 상기 bilevel OptKnock 문제 해법은 오직 하나의 결손 세트만 제공한다. 모든 의미 있는 해법들, 즉 증식-연계된 생산 형성을 유도하는 넉아웃 세트들을 모두 열거하기 위해, 정수 컷으로 지칭되는 최적화 기법을 구현할 수 있다. 이는, 전술한 바와 같이, 각 반복에서 정수 컷으로 지칭되는 추가적인 제약을 추가하면서 OptKonck 문제를 반복적으로 해결하는 과정을 수반한다.
본원에 기술된 바와 같이, 본 발명은 알데하이드 데하이드로게나제 변이체에 관한 것이다 (실시예 참조). 이러한 변이체의 제조는 실시예에 기술되어 있다. 다양한 방법들 중 임의의 방법을 이용해, 본원에 기술된 알데하이드 데하이드로게나제 변이체와 같은 알데하이드 데하이드로게나제 변이체를 구축할 수 있다. 이러한 방법으로는, 비-제한적으로, 부위-특이적인 돌연변이 유발, 랜덤 돌연변이 유발, 조합 라이브러리 (combinatorial libraries) 및 그외 후술한 돌연변이 유발 방법 등이 있다 (Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999); Gillman et al., Directed Evolution Library Creation: Methods and Protocols (Methods in Molecular Biology) Springer, 2nd ed (2014).
본원에 기술된 바와 같이, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물에 대한 경로의 바람직한 활성을 코딩하는 핵산을 숙주 유기체에 도입할 수 있다. 이 경우, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물의 생산을 높이기 위해, 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물, 경로 효소 또는 단백질의 활성을 변형하는 것이 바람직할 수 있다. 예를 들어, 단백질 또는 효소의 활성을 높이는 공지된 돌연변이를 코딩 핵산 분자에 도입할 수 있다. 또한, 효소 또는 단백질의 활성을 증가시키거나 및/또는 저해 활성을 낮추기 위해, 예를 들어 음성 조절인자의 활성을 낮추기 위해, 최적화 방법을 적용할 수 있다.
이러한 최적화 방법의 한가지가 방향성 진화 (directed evolution)이다. 방향성 진화는, 효소의 특성을 개선 및/또는 변형하기 위해, 특정 유전자에 표적화된 돌연변이를 도입하는 과정을 수반하는, 강력한 방법이다. 향상된 및/또는 변형된 효소는 다수의 (예, >104) 효소 변이체를 자동 스크리닝할 수 있는 민감한 고-처리 스크리닝 분석을 개발 및 구현함으로써, 동정할 수 있다. 돌연변이 유발 및 스크리닝 라운드를 전형적으로 반복 실시하여, 효소에 최적화된 특성을 부여할 수 있다. 돌연변이를 유발하기 위한 유전자의 영역들을 동정하는데 도움이 될 수 있는 수학적 알고리즘들도 또한 개발되어 있으며, 제조 및 스크리닝하여야 하는 효소 변이체들의 수를 현저하게 줄일 수 있다. 다양한 변이체 라이브러리 제조에 유효한 다수의 방향성 진화 기법들도 개발되어 있으며 (리뷰로서 Hibbert et al., Biomol . Eng 22:11-19 (2005); Huisman and Lalonde, In Biocatalysis in the pharmaceutical and biotechnology industries pgs. 717-742 (2007), Patel (ed.), CRC Press; Otten and Quax. Biomol . Eng 22:1-9 (2005); 및 Sen et al., Appl . Biochem . Biotechnol 143:212-223 (2007)을 참조함), 다수의 효소 클래스들에서 매우 다양한 특성을 개선하기 위해 이러한 방법들이 성공적으로 적용된 바 있다. 방향성 진화 기법에 의해 향상 및/또는 변형된 효소 특징들로는, 예를 들어, 비-천연성 기질의 변환에 있어서, 선택성/특이성; 확실한 고온 처리를 위한 온도 안정성; 높거나 낮은 pH 조건에서의 생물학적 처리를 위한 pH 안정성; 기질 또는 생산물 관용성 (product tolerance), 이로써 높은 생산 역가를 달성할 수 있음; 비-천연성 기질들을 포괄하기 위한 광범위한 기질 결합성 등의, 결합성 (Km); 생산물, 기질 또는 주요 중간산물에 의한 저해를 없애기 위한, 저해성 (Ki); 원하는 플럭스를 달성하도록 효소 반응 속도를 높이기 위한, 활성 (kcat); 단백질 수율 및 전체 경로 플럭스를 높이기 위한, 발현 수준; 호기 조건에서 공기 민감성 효소의 작용을 위한, 산소 안정성; 및 산소가 존재하지 않는 조건에서 호기성 효소의 작용을 위한, 혐기성 활성 등이 있다.
특정 효소의 바람직한 특징을 타겟팅하기 위해 유전자에 대한 돌연변이 유발 및 다양화를 위한 다수의 예시적인 방법들이 개발되었다. 이러한 방법들은 당해 기술 분야의 당업자들에게 잘 알려져 있다. 이러한 방법들 중 임의 방법을 이용해 3-HBal, 1,3-BDO, 4-HBal 또는 1,4-BDO, 또는 이의 에스테르 또는 아미드 등의 이와 관련된 다운스트림 산물 또는 본 발명의 알데하이드 데하이드로게나제를 생산하기 위해, 경로 효소 또는 단백질의 활성을 변형 및/또는 최적화할 수 있다. 이러한 방법으로는, 비-제한적인 예로, PCR 반응에 DNA 폴리머라제의 피델리티 (fidelity)를 낮춤으로써 랜덤 포인트 돌연변이를 도입하는 EpPCR (Pritchard et al., J Theor.Biol. 234:497-509 (2005)); 완전한 환형 플라스미드를 주형으로 사용하고, 마지막 뉴클레오티드 2개에 엑소뉴클레아제 내성 티오포스페이트 결합을 구비한 랜덤 6 mer를 이용하여 플라스미드를 증폭시킨 다음, 세포로 형질전환하고, 세포내에서 플라스미드를 탠덤 리피트에서 다시 고리화하는 것을 제외하고는, epPCR과 동일한 에러-유발 롤링 서클 증폭 (Error-prone Rolling Circle Amplification) (epRCA) (Fujii et al., Nucleic Acids Res. 32:e145 (2004); 및 Fujii et al., Nat. Protoc . 1:2493-2497 (2006)); 전형적으로 Dnase I 또는 Endo V와 같은 뉴클레아제로 2개 이상의 변이체 유전자를 절단하여, DNA 폴리머라제의 존재 하에 어닐링 및 연장 사이클에 의해 재조립되는 랜덤 단편 풀을 제조함으로써, 키메라 유전자 라이브러리를 구축하는 과정을 수반하는, DNA 또는 패밀리 셔플링 (Family Shuffling) (Stemmer, Proc Natl Acad Sci USA 91:10747-10751 (1994); 및 Stemmer, Nature 370:389-391 (1994)); 주형을 프라이밍한 후 변성과 매우 짧은 간격 (약 5초)의 어닐링/연장으로 이루어진 2단계 PCR 사이클을 반복하는 과정을 수반하는 스테거드 연장 (Staggered Extension, StEP) (Zhao et al., Nat. Biotechnol. 16:258-261 (1998)); 랜덤 서열 프라이머를 사용하여 주형의 여러가지 세그먼트에 대해 상보적인 복수의 짧은 DNA 단편을 제조하는 랜덤 프라이밍 재조합 (Random Priming Recombination, RPR) (Shao et al., Nucleic Acids Res 26:681-683 (1998)) 등이 있다.
추가적인 방법으로는, 선형화된 플라스미드 DNA를 사용해 미스매치 복원에 의해 복원되는 헤테로두플렉스를 형성하는 헤테로두플렉스 재조합 (Heteroduplex Recombination) (Volkov et al, Nucleic Acids Res. 27:e18 (1999); 및 Volkov et al., Methods Enzymol . 328:456-463 (2000)); Dnase I 단편화와 단일 가닥 DNA (ssDNA)의 크기 분획화를 이용한 RACHITT (Random Chimeragenesis on Transient Templates) (Coco et al., Nat. Biotechnol. 19:354-359 (2001)); 주형의 풀로서 사용되는 단일-방향성 ssDNA 단편들의 존재 하에 프라이머로부터 한쪽 방향으로 자라는 가닥들의 주형 스위칭을 수반하는 RETT (Recombined Extension on Truncated templates) (Lee et al., J. Molec . Catalysis 26:119-129 (2003)); 축중 프라이머 (degenerate primer)를 사용하여 분자들 간의 재조합을 제어하는 DOGS (Degenerate Oligonucleotide Gene Shuffling) (Bergquist and Gibbs, Methods Mol . Biol 352:191-204 (2007); Bergquist et al., Biomol . Eng 22:63-72 (2005); Gibbs et al., Gene 271:13-20 (2001)); 대상 유전자 또는 유전자 단편에서 1 bp가 결손된 조합 라이브러리를 구축하는 ITCHY (Incremental Truncation for the Creation of Hybrid Enzyme) (Ostermeier et al., Proc . Natl . Acad . Sci . USA 96:3562-3567 (1999); 및 Ostermeier et al., Nat. Biotechnol . 17:1205-1209 (1999)); 포스포티오에이트 dNTA를 이용하여 절단체 (truncation)를 제조하는 것을 제외하고는 ITCHY와 유사한 THIO-ITCHY (Thio-Incremental Truncation for the Creation of Hybrid Enzyme) (Lutz et al., Nucleic Acids Res 29:E16 (2001)); 재조합 유전자에 대한 ITCHY와 DNA 셔플링 방법 2가지를 조합한 SCRATCHY (Lutz et al., Proc . Natl . Acad. Sci . USA 98:11248-11253 (2001)); epPCR을 통해 제조된 돌연변이를 이후 유용한 활성 보유에 대해 스크리닝/선별하는 RNDM (Random Drift Mutagenesis) (Bergquist et al., Biomol . Eng . 22:63-72 (2005)); 포스포티오에이트 뉴클레오티드의 랜덤 병합 및 절단을 이용하여 랜덤 길이의 단편들의 풀을 제조하고, 이러한 풀을 주형으로 사용하여 이노신 등의 "유니버셜" 염기들의 존재 하에 연장시키고, 이노신-함유 상보체의 복제로 랜덤 염기 병합이 이루어지고, 결과적으로 돌연변이가 유발되는, 랜덤 돌연변이 유발 방법인, SeSaM (Sequence Saturation Mutagenesis) (Wong et al., Biotechnol . J. 3:74-82 (2008); Wong et al., Nucleic Acids Res. 32:e26 (2004); 및 Wong et al., Anal. Biochem . 341:187-189 (2005)); "타겟에서 모든 유전자 다양성"을 코딩하고 셔플링된 후대 (shuffled progeny)에 대해 매우 다양한 다양성을 허용할 수 있도록 설계된 중첩되는 올리고뉴클레오티드를 이용하는 합성 셔플링 (Synthetic Shuffling) (Ness et al., Nat. Biotechnol. 20:1251-1255 (2002)); dUTP를 병합시킨 후 우라실 DNA 글리코실라제와 이후 피페리딘을 처리하여 엔드포인트 DNA 단편화를 수행하는, 뉴클레오티드 교환 및 적출 기법 (Nucleotide Exchange and Excision Technology)인 NexT (Muller et al., Nucleic Acids Res. 33:e117 (2005)) 등이 있다.
추가적인 방법으로, 링커를 사용해 2종 간의 관련성이 멀거나 관련성이 없는 유전자들이 융합되게 촉진하고, 2종의 유전자들 간에 다양한 키메라를 제조함으로써 단일-교차 하이브리드 라이브러리를 제조하는, 서열 상동성-독립적인 단백질 재조합 (SHIPREC) (Sieber et al., Nat. Biotechnol. 19:456-460 (2001)); 출발 물질이 삽입체를 포함하는 슈퍼코일형의 이중 가닥 DNA (dsDNA) 플라스미드와 원하는 돌연변이 부위에서 축중성인 2개의 프라이머를 포함하는, 유전자 부위 포화 돌연변이 유발 (Gene Site Saturation Mutagenesis, GSSM™) (Kretz et al., Methods Enzymol. 388:3-11 (2004)); 제한된 영역을 매우 많은 수의 가능한 아미노산 서열 변이로 치환하는 짧은 올리고뉴클레오티드 카세트의 사용을 수반하는, 조합 카세트 돌연변이 유발 (Combinatorial Cassette Mutagenesis, CCM) (Reidhaar-Olson et al. Methods Enzymol . 208:564-586 (1991); 및 Reidhaar-Olson et al. Science 241:53-57 (1988)); 기본적으로 CCM과 비슷하지만, 높은 돌연변이 유발율로 epPCR을 이용하여 핫 스팟 및 핫 영역을 동정한 다음 CMCM에 의해 연장하여 단백질 서열 스페이스의 한정된 영역을 커버 (cover)하는, 조합형 다중 카세트 돌연변이 유발 (Combinatorial Multiple Cassette Mutagenesis, CMCM) (Reetz et al., Angew . Chem. Int . Ed Engl . 40:3589-3591 (2001)); DNA 폴리머라제 III의 돌연변이 서브유닛을 코딩하는, mutD5 유전자를 이용하여, 조건부 ts 돌연변이 유발 플라스미드가 선택 과정 중에 랜덤 및 천연 돌연변이 빈도를 20 내지 4000 X로 증가시키며, 선택 과정이 필요없을 때에는 유해한 돌연변이가 축적되는 것을 차단할 수 있는 돌연변이 유발 균주 기법 (Mutator Strains technique) (Selifonova et al., Appl . Environ. Microbiol . 67:3645-3649 (2001)); Low et al., J. Mol . Biol . 260:359-3680 (1996)) 등이 있다.
추가적인 방법의 예로는, 선택 아미노산의 조합 돌연변이 (combinatorial mutation)를 분석 및 최적화하는 다차원 돌연변이를 유발하는 방법인, LTM (Look-Through Mutagenesis) (Rajpal et al., Proc . Natl . Acad . Sci . USA 102:8466-8471 (2005)); 한번에 복수의 유전자에 적용할 수 있거나, 또는 단일 유전자의 대규모 키메라 (복수의 돌연변이) 라이브러리를 제조할 수 있는 DNA 셔플링 방법인, 유전자 리어셈블리 (Tunable GeneReassembly™ (TGR™) Technology, Verenium Corporation); 특정한 폴드를 가진 구조적으로 정의된 단백질 백본을 고정하고, 폴드와 전체 단백질 에너제틱스 (energetics)를 안정시킬 수 있는 아미노산 치환에 대한 서열 스페이스를 검색하는, 일반적으로 3차원 구조가 공지된 단백질에 대해 가장 효과적으로 작용하는 최적화 알고리즘인, PDA (in Silico Protein Design Automation) (Hayes et al., Proc . Natl . Acad . Sci . USA 99:15926-15931 (2002)); 및 구조/기능에 대한 지식을 이용하여 효소 개선이 가능한 부위를 선택하는 단계, Stratagene QuikChange (Stratagene; San Diego CA)와 같은 돌연변이 유발 방법을 이용하여 선택 부위에서의 포화 돌연변이 유발 (saturation mutagenesis)을 수행하는 단계, 바람직한 특징을 스크리닝/선별하는 단계, 및 개선된 클론(들)을 이용하여 다른 부위에 대해서도 다시 시작하여 바람직한 활성이 달성될 때까지 계속 반복하는 단계를 포함하는, ISM (Iterative Saturation Mutagenesis) (Reetz et al., Nat. Protoc . 2:891-903 (2007); 및 Reetz et al., Angew . Chem . Int . Ed Engl . 45:7745-7751 (2006)) 등이 있다.
돌연변이를 유발하기 위한 임의의 전술한 방법들은 단독으로 또는 임의 조합으로 사용할 수 있다. 아울러, 방향성 진화 방법들 중 임의의 한가지 방법 또는 조합을 본원에 기술된 후천적인 진화 기법과 함께 사용할 수 있다.
본 발명에 대한 다양한 구현예들의 작동에 실질적으로 영향을 미치지 않은 변형이 본원에 제공된 본 발명의 정의 내에서 제공되는 것으로 이해된다. 따라서, 하기 실시예들은 본 발명을 예시하기 위한 것일 뿐 제한하고자 하는 것은 아니다.
실시예
알데하이드 데하이드로게나제 변이체
본 실시예는 바람직한 특성을 가진 알데하이드 데하이드로게나제 변이체의 제조 방법을 기술한다.
돌연변이 유발 기법을 이용해 주형 ALD-1을 토대로 알데하이드 데하이드로게나제 변이체를 구축하였다. 변이체는 에러 유발성 PCR, 부위 특이적인 돌연변이 유발 및 유전자 선택시 자발적인 돌연변이에 의해 구축하였다. 주형 ALD-1은 아래 제시된 알데하이드 데하이드로게나제이다:
MIKDTLVSITKDLKLKTNVENANLKNYKDDSSCFGVFENVENAISNAVHAQKILSLHYTKEQREKIITEIRKAALENKEILATMILEETHMGRYEDKILKHELVAKYTPGTEDLTTTAWSGDNGLTVVEMSPYGVIGAITPSTNPTETVICNSIGMIAAGNTVVFNGHPGAKKCVAFAVEMINKAIISCGGPENLVTTIKNPTMDSLDAIIKHPSIKLLCGTGGPGMVKTLLNSGKKAIGAGAGNPPVIVDDTADIEKAGKSIIEGCSFDNNLPCIAEKEVFVFENVADDLISNMLKNNAVIINEDQVSKLIDLVLQKNNETQEYSINKKWVGKDAKLFLDEIDVESPSSVKCIICEVSASHPFVMTELMMPILPIVRVKDIDEAIEYAKIAEQNRKHSAYIYSKNIDNLNRFEREIDTTIFVKNAKSFAGVGYEAEGFTTFTIAGSTGEGITSARNFTRQRRCVLAG (서열번호 1).
ALD-2 및 ALD-3에 대한 부가적인 ALD 서열들을 아래에 나타낸다:
ALD-2
MNTENIEQAIRKILSEELSNPQSSTATNTTVPGKNGIFKTVNEAIAATKAAQENYADQPISVRNKVIDAIREGFRPYIEDMAKRIHDETGMGTVSAKIAKLNNALYNTPGPEILQPEAETGDGGLVMYEYAPFGVIGAVGPSTNPSETVIANAIMMLAGGNTLFFGAHPGAKNITRWTIEKLNELVADATGLHNLVVSLETPSIESVQEVMQHPDVAMLSITGGPAVVHQALISGKKAVGAGAGNPPAMVDATANIALAAHNIVDSAAFDNNILCTAEKEVVVEAAVKDELIMRMQQEGAFLVTDSADIEKLAQMTIGPKGAPDRKFVGKDATYILDQAGISYTGTPTLIILEAAKDHPLVTTEMLMPILPVVCCPDFDSVLATATEVEGGLHHTASIHSENLPHINKAAHRLNTSIFVVNGPTYCGTGVATNGAHSGASALTIATPTGEGTATSKTYTRRRRLNSPEGFSLRTWEA (서열번호 2)
ALD-3
MTVNEQLVQDIIKNVVASMQLTQTNKTELGVFDDMNQAIEAAKEAQLVVKKMSMDQREKIISAIRKKTIEHAETLARMAVEETGMGNVGHKILKHQLVAEKTPGTEDITTTAWSGDRGLTLVEMGPFGVIGAITPCTNPSETIICNTIGMLAGGNTVVFNPHPAAIKTSNFAVQLINEASLSAGGPVNIACSVRKPTLDSSKIMMSHQDIPLIAATGGPGVVTAVLQSGKRGIGAGAGNPPVLVDETADIRKAAEDIINGCTFDNNLPCIAEKEVVAIDAIANELMNYMVKEQGCYAITKEQQEKLTNLVITPKGLNRNCVGKDARTLLGMIGIDVPSNIRCIIFEGEKEHPLISEELMMPILGIVRAKSFDDAVEKAVWLEHGNRHSAHIHSKNVDRITTYAKAIDTAILVKNAPSYAAIGFGGEGFCTFTIASRTGEGLTSASTFTKRRRCVMSDSLCIR (서열번호 3).
ALD-1은 3-하이드록시부티릴-CoA의 S 거울상이성질체에 비해 R 거울상이성질체에 대해 약간 더 높은 특이성을 나타낸다. ALD-1을 ALD-2 및 ALD-3와 서열 정렬하여 도 3에 나타낸다. 이들 서열은 각각 서열번호 1, 2 및 3이다. 또한, ALD-3 (PDBID 4C3S)에 대한 결정 구조가 존재하며, ALD-2는 ALD-1 보다 ALD-3와 더 비슷하다. 따라서, ALD-3을 주형으로 사용하였다. 도 3에서 밑줄 친 부분은 A로 표시된 제1 영역과 B로 표시된 제2 영역인 루프 영역 2곳이며, 이 둘다 본원에서 확인된 바에 따르면 기질 특이성 및 거울상이성질체 특이성에 관여한다. ALD-1에서 루프 A는 서열 LQKNNETQEYSINKKWVGKD (서열번호 124)이고, ALD-2의 경우에는 서열 IGPKGAPDRKFVGKD (서열번호 125)이고, ALD-3의 경우에는 서열 ITPKGLNRNCVGKD (서열번호 126)이다. 루프 B는 ALD-1에서 서열 SFAGVGYEAEGFTTFTIA (서열번호 127), ALD-2에서 서열 TYCGTGVATNGAHSGASALTIA (서열번호 128), ALD-3에서 서열 SYAAIGFGGEGFCTFTIA (서열번호 129)이다. ALD-2의 기질 특이성 루프 A 및 B의 서열과 길이는 ALD-1 및 ALD-3와 상이하지만; 정렬시 본원에 기술된 치환 위치를 용이하게 동정할 만큼 충분한 보존성이 확인되며, 특히 도 6에 나타낸 바와 같이 3D 모델링과 조합하였을 때, 특히 본원에 기술된 예시적으로 치환에 의해 변형되었을 때, 기질 특이성 및 거울상이성질체 특이성에 영향을 주는 상호작용하는 2개의 루프 영역들이 확인된다. ALD-1과 ALD-3의 동일성은 51.9%이다. ALD-1와 ALD-2의 동일성은 35.9%이다. ALD-3과 ALD-2의 동일성은 40%이다. 도 3의 정렬에 기반하여 컨센서스 ALD 서열이 구축되었다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 A의 컨센서스 서열은 IXPKG-----XXNRKXVGKD (서열번호 5)이다. ALD-1, ALD-2 및 ALD-3의 정렬에 기반한 루프 B의 컨센서스 서열은 SYAGXGXXXE----GFXTFTIA (서열번호 6)이다.
추가적인 정렬을 수행하였다 (도 4). 도 4a는 컷오프 40-55%로 ALD-1와 비교하여 정렬한 것이다. 도 4b는 컷오프 75-90%로 ALD-1와 비교하여 정렬한 것이다. 도 4c는 컷오프 90%로 ALD-1와 비교하여 정렬한 것이다. 도 4a-4c에 나타낸 예시적인 알데하이드 데하이드로게나제 (ALD) 정렬을 통해, 대표적인 주형 ALD 서열에서 본 발명의 치환을 행할 수 있는 위치에 해당되는 위치들이 ALD에서 동정되는 것으로 확인된다. 밑줄 친 부분은 중요한 2개의 루프 영역, 즉 A로 명명된 첫번째 것과 B로 명명된 두번째 것으로, 이 둘다 본원에서 확인된 바와 같이 기질 특이성 및 거울상이성질체 특이성에 관여한다. 도 4a-4c는, 본원에 기술된 치환에 대응되는 위치를 ALD-1, 특히 루프 A 및 B 영역과의 동일성이 40% 이상의 ALD들에서 동정할 수 있으며, 특히 루프 B 영역에서 고도로 보존되어 있음을, 보여준다.
변이체 45의, 아세틸-CoA에 비해 3HB-CoA에 대한 특이성을 높이는 돌연변이 유발을 통해, 1,3 BOD 생산이 증가되고 에탄올 생산은 감소된 몇가지 변이체들을 제조하였다. 아세틸-CoA에 비해 3-하이드록시부티릴-CoA에 대한 특이성을 높이는 돌연변이는, 아세틸-CoA로부터 제조된 아세트알데하이드가 숙주 세포의 천연적인 효소에 의해 또는 3-하이드록시부티르알데하이드를 1,3-부탄다이올로 변환하는 경로 효소에 의해 제조되므로, 에탄올 생성을 감소시킨다. 알데하이드 데하이드로게나제의 효소 활성을 높이거나 또는 3-하이드록시부티릴-CoA에 대한 특이성을 높이는 변이체는, 아세토아세틸-CoA를 1,3-부탄다이올을 형성하는 쪽으로 향하게 하는 효소 경로를 통해 1,3-부탄다이올로의 플럭스를 증가시킴으로써 4-하이드록시-2-부타논은 감소되고, 따라서 천연 효소 또는 특이성이 낮은 경로 효소에 의한 4-하이드록시-2-부타논으로의 2단계 변환에서의 이의 이용가능성을 감소시킨다. 변이체 45의 서열은 다음과 같다:
MIKDTLVSITKDLKLKTNVENANLKNYKDDSSCFGVFENVENAISNAVHAQKILSLHYTKEQREKIITEIRKAALENKEILATMILEETHMGRYEDKILKHELVAKYTPGTEDLTTTAWSGDNGLTVVEMSPYGVIGAITPSTNPTETVICNSIGMIAAGNTVVFNGHPGAKKSVAFAVEMINKAIISCGGPENLVTTIKNPTRDSLDAIIKHPSIKLLVGTGGPGMVKTLLNSGKKAIGAGAGNPPVIVDDTADIEKAGKSIIEGASFDNNLPCIAEKEVFVFENVADDLISNMLKNNAVIINEDQVSKLIDLVLQKNNETQEYSINKKWVGKDAKLFLDEIDVESPSSVKCIITEVSASHPFVMTELMMPILPIVRVKDIDEAIEYAKIAEQNHKHSAYIYSKNIDNLNRFEREIDTTIFVKNAKSFAGVGYEAPGFTTFTIAGSTGEGITSARNFTRQRRIVLVG (서열번호 4).
수행한 분석은 NADK가 NAD로 변환됨에 따른 흡광도 감소를 모니터링함으로써 3HB-CoA에 대한 활성을 조사하기 위한 시험관내 분석이다. 분석은 또한 기질로서 아세틸-CoA (AcCoA)를 사용하여 수행하였으며, 3HB-CoA vs. AcCoA에 대한 활성 비율 향상으로서 개선된 효소를 동정하였다. 아세틸-CoA로부터 제조되는 아세트알데하이드가 숙주 세포에서 천연적으로 효소에 의해 또는 3-하이드록시부티르알데하이드를 1,3-부탄다이올로 변환하는 경로 효소에 의해 에탄올로 변환될 수 있으므로, 아세틸-CoA 대비 3-하이드록시부티릴-CoA의 특이성을 높이는 돌연변이는 에탄올 감소를 나타내었다.
이들 변이체 서브세트를 (R) 및 (S) 3-하이드록시부티르알데하이드를 사용해 추가로 조사한 결과, 검사 변이체들 중 5개 (952, 955, 957, 959, 961)가 모 효소 (변이체 45) 및 야생형 ALD-1과 비교해, R 거울상이성질체에 대해 개선된 선택성을 가진 것으로, 확인되었다 (도 5). 도 5a는 3 하이드록시-(R)-부티르알데하이드 (막대 세트에서 좌측 막대) 및 3 하이드록시-(S)-부티르알데하이드 (막대 세트에서 우측 막대)에 대한 ALD-2, ALD-1 및 ALD-1 변이체들의 비활성을 보여준다. 정제된 스트렙타비딘-태그된 단백질들을 10 mM R 또는 S 3-하이드록시부티르알데하이드의 존재 하에, IVI 완충제 pH 7.5, 0.5 mM NAD+, 2 mM CoA 중에, 35℃에서 분석하였으며, 340 nm에서 NADH 흡광도 변화에 의해 활성을 모니터링하였다. IVI 완충제는 5 mM 포타슘 포스페이트 모노베이직, 20 mM 포타슘 포스페이트 다이베이직, 10 mM 소듐 글루타메이트, 일수화물, 및 150 mM 포타슘 클로라이드, pH 7.5를 포함하였다. 즉, 본 분석에서 효소 반응은 도 1에 나타낸 반응과는 역 방향으로 수행되며, 즉, 반응은 3-하이드록시부티르알데하이드에서 3-하이드록시부티릴-CoA로의 변환을 측정하였다. 도 5b에 나타낸 바와 같이, 특정 알데하이드 데하이드로게나제 변이체는 S-3-하이드록시부티르알데하이드 (S-3HB-알데하이드)에 비해 R-3-하이드록시부티르알데하이드 (R-3HB-알데하이드)에 대해 선택성을 나타내었다.
ALD-1 결정 구조를 이용한 돌연변이 959에 대한 컴퓨터 모델링에서, 아미노산 치환 F442N이 R 이성질체의 3번 탄소 상의 하이드록시 기와 수소 결합 네트워크를 형성할 수 있지만, (S) 이성질체와는 그렇지 않은 것으로, 확인되었다 (도 6). 도 6a-6c는 알데하이드 데하이드로게나제 959의 구조를 리본 다이아그램으로 보여준다. 다이아그램은 3-하이드록시-(R)-부티르알데하이드 (도 6a) 또는 3- 하이드록시-(S)-부티르알데하이드 (도 6b)가 959의 구조에 도킹하는 방식을 도시한다. 도 6c는, 3-하이드록시-(S)-부티르알데하이드가 도 6a에 나타낸 바와 같이 3-하이드록시-(R)-부티르알데하이드에 도킹하는데 가장 에너지 측면에서 우호적인 동일한 배향성으로 도킹되었을 때, 비-우호적인 상호작용 (원)이 활성 부위에 위치한 이소루신으로 생성됨을, 보여준다. 이 모델은, 돌연변이 F442N이 단백질과 3-하이드록시-(R)-부티르알데하이드의 하이드록시 간에 수소 결합을 형성하지만 S 거울상이성질체와는 그럴 가능성이 없음을 시사해준다.
예시적인 알데하이드 데하이드로게나제 변이체들을 표 1A-1D에 열거한다.
표 1A. ALD 변이체 예
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
표 1B. ALD 변이체 예
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
표 1C. ALD 변이체 예
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
표 1D. ALD 변이체 예
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
ALD 변이체들의 다양한 활성을 측정하여, 표 2에 나타낸다.
표 2: ALD 변이체 예들의 활성.
변이체 야생형 Ald 대비 돌연변이 소규모 생체내 1,3 BDO 생산 3HBCoA /AcCoA 특이성 2 R- 3HB 알데하이드 / S-3HB 알데하이드 비활성 3
12 D12A, I139S, M204R, R396H O
16 D12A, C33R, I139S, C174S, C189A, M204R, C220V, C267A, C353A, C356T, R396H, C464V
17 D12A, I139V, T143N, G167S, C174S, M204R, C220V, T230R, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V
30 E129I, C174S, C220V, C267A, C356T, R396H, C464I, A467V *
34 D12A, I139S, C174S, M204R, C220V, C267A, C356T, R396H, C464I O
56 D12A, I139S, C174S, M204R, C220V, C267A, C356T, R396H, F429Y, , E437P, F442T, C464I, A467V O
71 Y107K, C174S, M204R, C220V, C267A, C356T, C464I, A467V
80 Y107K, C174S, C220V, C267A, C356T, C464I *
93 D12A, I139S, C174S, M204R, T230R, C220V, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V *
156 D12A, Y107K, C174S, M204R, C220V, C267A, C356T, C464I, A467V *
166 D12A, Y107K, C174S, C220V, C267A, C356T, C464I *
180 D12A, I139S, C174S, M204R, C220V, C267A, C356T, R396H, C464I, A467V *
182 C174S, M204R, C220V, A243P, C267A, C356T, R396H, E437P, C464I, A467V *
184 D12A, I139S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V *
194 I139S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V *
199 C174S, M204R, C220V, C267A, C356T, R396H, F429Q, E437P, C464I, A467V *
203 C174S, M204R, C220V, C267A, C356T, R396H, F429Y, E437P, F442T, C464I, A467V *
205 D12A, I139S, C174S, M204R, C220V, A243P, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V *
208 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442Y, C464I, A467V *
213 T143S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V *
235 D12A, I139S, C174S, M204R, C220V, A243P, C267A, C356T, R396H, E437P, C464I, A467V *
240 D12A, I139V, C174S, M204R, M227K, C220V, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V *
321 D12V, I139S, M204R, R396H *
598 D12A, I139S, C174S, M204R, M227Q, T230R, A243P, C220V, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V O +
45 C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V O +++ +
951 C174S, M204R, C220V, C267A, C356T, R396H, F429H, E437P, F442H, C464I, A467V + +
952 C174S, M204R, C220V, C267A, C356T, R396H, F429M, E437P, F442H, C464I, A467V +
953 C174S, M204R, C220V, C267A, C356T, R396H, F429M, E437P, F442N, C464I, A467V +
954 C174S, M204R, C220V, C267A, C356T, R396H, F429Q, E437P, C464I, A467V +
955 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V O +++ +
957 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442Q, C464I, A467V + +
958 C174S, M204R, C220V, C267A, C356T, R396H, E437P, I444V, C464I, A467V + +
959 C174S, M204R, C220V, C267A, C356T, R396H, E437P, T440H, F442N, C464I, A467V + +
960 V19I, D122N, C174S, M204R, C220V, C267A, C356T, R396H, F429D, E437P, F442Q, E450E, C464I, A467V +
961 C174S, M204R, C220V, C267A, V315A, C356T, R396H, E437P, T440H, F442N, C464I, A467V + +
975 D12A, I139V, C174S, M204R, C220V, M227Q, T230R, A243P, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V O
991 D12A, I139L, T143N, C174S, M204R, C220V, T230R, A243P, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V
992 A73S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M,S447M, C464I, A467V + `+
993 C174S, M204R, C220V, A254T, C267A, C356T, R396H, E437P, F442M, C464I, A467V +
994 V163C, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V +
995 C174S, M204R, C220V,K 229S, C267A, C356T, R396H, E437P, F442N, C464I, A467V +
996 C174S, M204R, C220V, C267A, C356L, R396H, E437P, F442N, C464I, A467V +
997 C174S, M204R, C220V, C267A, C356T, R396H, E437P, T441G, I44L, C464I, A467V +
998 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V + `+
999 K65A, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V +
1000 V163C, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V + `+
1001 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, R460K,C464I, A467V +
1002 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, S447M, C464I, A467V O + `+
1003 G155G, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442F, C464I, A467V
1004 P145P, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V
1005 G244G, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V
1006 C174S, M204R, C220V, C267A, C356T, R396H, V432V, E437P, C464I, A467V
1015 C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1016 C174S, M204R, C220V, T230R, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1017 C174S, M204R, C220V, T230H, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1018 C174S, M204R, C220V, T230A, A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1019 C174S, M204R, C220V, T230M, A243S, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1020 C174S, M204R, C220V, T230H, A243N, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1021 C174S, M204R, C220V, M227V,T230C, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1022 C174S, M204R, C220V, M227V,T230H, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1023 C174S, M204R, C220V, M227I,T230L, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1024 C174S, M204R, C220V, M227I,T230C, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1025 C174S, M204R, C220V, T230M, A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1026 C174S, M204R, C220V, T230S, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1027 C174S, M204R, C220V, M227I, T230A, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1028 C174S, M204R, C220V,T230K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `- `-
1029 C174S, M204R, C220V, T230Y, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1030 C174S, M204R, C220V, T230G, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1031 C174S, M204R, C220V, T230M, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1032 C174S, M204R, C220V, T230T, A243L,C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1033 C174S, M204R, C220V, T230I,C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1034 C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H,F429L,V432N, E437P, F442N, C464I, A467V O `++ `-
1035 C174S, M204R, C220V, T230H, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1036 C174S, M204R, C220V, T230Y,A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1037 K72N,C174S, M204R, C220V,A243S, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1038 C174S, M204R, C220V, T230C,A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1039 C174S, M204R, C220V, T230H,A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1040 C174S, M204R, C220V, T230H,A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1041 C174S, M204R, C220V, T230A,A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1042 C174S, M204R, C220V, T230S,A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1043 C174S, M204R, C220V, M227V,T230S, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1044 C174S, M204R, C220V, T230H, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1045 C174S, M204R, C220V, T230A, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1046 C174S, M204R, C220V, T230W, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1047 C174S, M204R, C220V, M227C,T230R, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1048 C174S, M204R, C220V, M227L,T230N, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1049 C174S, M204R, C220V, T230N, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1050 C174S, M204R, C220V, M227C, T230L, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1051 C174S, M204R, C220V, T230V, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1052 C174S, M204R, C220V, T230L, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1053 C174S, M204R, C220V, M227C, T230K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `-
1054 C174S, M204R, C220V, M227C, T230V, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1055 C174S, M204R, C220V, T230T, A243N, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1056 C174S, M204R, C220V, T230T, A243I, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1057 C174S, M204R, C220V, T230T,A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `-
1058 C174S, M204R, C220V, T230G, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1059 C174S, M204R, C220V, T230R, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1060 C174S, M204R, C220V, M227L, A243P, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `-
1061 C174S, M204R, C220V, M227A, A243P, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1062 C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `-
1063 C174S, M204R, C220V, T230Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1064 C174S, M204R, C220V, T230N, A243I, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1065 C174S, M204R, C220V, T230C, A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1066 C174S, M204R, C220V, M227I, T230R, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1067 C174S, M204R, C220V, M227I, A243L, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1068 C174S, M204R, C220V, M227I, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1069 C174S, M204R, C220V, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1070 C174S, M204R, C220V, M227V, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1071 C174S, M204R, C220V, M227C, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1072 C174S, M204R, C220V, T230R, A243C, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1073 C174S, M204R, C220V, T230L, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1074 C174S, M204R, C220V, T230I, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+++ `-
1075 C174S, M204R, C220V, T230M, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1076 C174S, M204R, C220V, M227L, T230W, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1077 C174S, M204R, C220V, T230V, A243M, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1078 C174S, M204R, C220V, M227V, T230I, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `++ `-
1079 A73D, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V O `++ `+
1080 A73G, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447H, C464I, A467V O `+ `-
1081 A73L, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V O `+ `-
1082 A73Q, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447R, C464I, A467V O `++ `-
1083 A73F, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V O `+ `-
1084 A73G, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V O `+ `-
1085 A73E, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V O `+ `-
1086 A73W, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447R, C464I, A467V O `++ `-
1087 V163G, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V O `+ `-
1088 V163T, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V O `+ `-
1089 C174S, M204R, C220V, M227L, T230S, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `-
1090 C174S, M204R, C220V, A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `+
1091 C174S, M204R, C220V, T230T, A243E, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `-
1092 C174S, M204R, C220V, A243K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `+
1093 A73L, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V O `+ `+
1094 A73R, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447T, C464I, A467V O `+ `+
1095 A73C, V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, C464I, A467V O `+ `+
1096 V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447E, C464I, A467V O `+ `-
1097 A73W, V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447K, C464I, A467V O `+ `+
1098 A73M, V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447R, C464I, A467V O `+ `+
1099 V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V O `+ `+
1100 A73F, V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V O `+ `-
1101 V163C, C174S, M204R, C220V, M227I, T230K, C267A, C356T, R396H, E437P, F442N, S447S, C464I, A467V O `+++ `-
1* 다른 다이올 화합물에 대한 활성
2'- = 특이성 < 1'
' += 특이성 1,0-2.0'
'++ = 특이성 2.0-3.0'
'+++ = 특이성 > 3.0
3'- = 상대적인 활성 < 1'
'+ = 상대적인 활성 > 1'
ALD 변이체 예들의 부가적인 활성을 표 3에 나타낸다. 48시간 경과시 1,3-BOD 생산 수준은 ALD 변이체를 이용한 경우 50 g/L 이상, 60 g/L 이상, 70 g/L 이상, 80 g/L 이상 및 90 g/L 이상으로 높게 달성되었다.
표 3. ALD 변이체 예들의 활성
변이체 야생형 Ald에 대한 돌연변이 조 세포용해물에서의 안정적인 효소 활성 선호 조인자 3HBCoA / AcCoA 특이성 R- 3HB 알데하이드 / S-3HB 알데하이드 생체내 1,3-BDO 생산 증가 시험관내 효소 활성 증가
45 C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V + NADH + + +
331 K65A, I66M, C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADH +
681 K65A, I66M, A73S, C174S, M204R, C220V, M227I, T230C, A243P, C267A, C356T, R396H, E437P, F442N, S447P, C464I, A467V + NADH +
687 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V + NADH +
688 K65A, C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADH +
721 66M, C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADH +
951 C174S, M204R, C220V, C267A, C356T, R396H, F429H, E437P, F442H, C464I, A467V + NADH + + +
952 C174S, M204R, C220V, C267A, C356T, R396H, F429M, E437P, F442H, C464I, A467V + NADH + +
953 C174S, M204R, C220V, C267A, C356T, R396H, F429M, E437P, F442N, C464I, A467V + NADH + +
954 C174S, M204R, C220V, C267A, C356T, R396H, F429Q, E437P, C464I, A467V + NADH + +
955 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADH + + +
956 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADH +
957 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442Q, C464I, A467V + NADH + + +
958 C174S, M204R, C220V, C267A, C356T, R396H, E437P, I444V, C464I, A467V + NADH + + +
959 C174S, M204R, C220V, C267A, C356T, R396H, E437P, T440H, F442N, C464I, A467V + NADH + + +
960 V19I, D122N, C174S, M204R, C220V, C267A, C356T, R396H, F429D, E437P, F442Q, E450E, C464I, A467V + NADH + +
961 C174S, M204R, C220V, C267A, V315A, C356T, R396H, E437P, T440H, F442N, C464I, A467V + NADH + + +
962 A73S, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M,S447M, C464I, A467V + + +
963 C174S, M204R, C220V, A254T, C267A, C356T, R396H, E437P, F442M, C464I, A467V + + +
964 V163C, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V + + +
965 C174S, M204R, C220V,K 229S, C267A, C356T, R396H, E437P, F442N, C464I, A467V + + +
966 C174S, M204R, C220V, C267A, C356L, R396H, E437P, F442N, C464I, A467V + + +
967 C174S, M204R, C220V, C267A, C356T, R396H, E437P, T441G, I44L, C464I, A467V + + +
968 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, C464I, A467V + + +
969 K65A, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V + + +
970 V163C, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V + + +
971 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, R460K,C464I, A467V + + +
972 C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442M, S447M, C464I, A467V + + +
598 D12A, I139S, C174S, M204R, M227Q, T230R, A243P, C220V, C267A, C356T, R396H, F429Y, F442T, E437P, C464I, A467V + NADH/NADPH + +
973 C174S, M204R, C220V, C267A, A243K, C356T, R396H, E437P, F442N, C464I, A467V + NADH + +
974 Y107N, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADPH + +
975 D122G, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADPH + +
976 C174S, M204R, C220V, C267A, S349T, C356T, R396H, E437P, F442N, C464I, A467V + + +
977 C174S, N201D, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V + + +
978 C174S, M204R, C220V, C267A, D313R, C356T, R396H, E437P, C464I, A467V NADH + +
979 C174S, M204R, C220V, C267A, P348G, C356T, R396H, E437P, C464I, A467V NADH + +
980 C174S, M204R, C220V, C267A, C356L, R396H, E437P, C464I, A467V NADH + +
981 C174S, M204R, C220V, C267A, C356T, A360K, R396H, E437P, C464I, A467V NADH + +
982 C174S, M204R, C220V, A243K, C267A, C356T, R396H, E437P, C464I, A467V NADH + +
983 C174S, M204R, C220V, K258W, C267A, C356T, R396H, E437P, C464I, A467V NADH + +
984 Y107N, C174S, M204R, C220V, C267A, C356T, R396H, E437P, C464I, A467V NADH + +
985 C174S, M204R, C220V, N223Q, C267A, C356T, R396H, E437P, C464I, A467V NADH + +
986 S131A, C174S, M204R, C220V, C267A, C356T, R396H, E437P, F442N, C464I, A467V NADH + +
1011 C174S, M204R, C220V, A243P, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADH +
1062 C174S, M204R, C220V, A243Q, C267A, C356T, R396H, E437P, F442N, C464I, A467V + NADH +
전술한 상기한 알데하이드 데하이드로게나제 변이체는 3-하이드록시부티르알데하이드의 R 형태에 작용할 수 있으며, 이를 이용해, R-3-하이드록시부티르알데하이드 입체이성질체 또는 R 형태와 S 형태의 혼합물이되 R 형태의 비율이 더 높은 혼합물을 생산할 수 있다. 이러한 입체이성질체는 R-1,3-부탄다이올과 같은 다운스트림 산물의 입체이성질체를 제조하는데 이용할 수 있다. 이러한 입체이성질체는 약제 또는 뉴트라슈티컬로서 유용성을 가진다.
이들 결과는, 3-하이드록시부티르알데하이드, 1,3-부탄다이올, 4-하이드록시부티르알데하이드 또는 1,4-부탄다이올, 또는 알데하이드 데하이드로게나제를 포함하는 대사 경로에 의해 생산되는 다른 바람직한 생산물을 공업적으로 제조하는데 사용가능한, 바람직한 특성을 가진 알데하이드 데하이드로게나제 변이체를 생산할 수 있음을 입증해준다.
전술한 변이체들은 ALD-1 모 서열을 기본으로 한다. 표 1, 2 또는 3에 나타낸 다양한 아미노산 위치들은 상동적인 알데하이드 데하이드로게나제 서열에 적용할 수 있는 것으로 이해된다. 표 4는 상동성에 기반한 ALD 서열들의 예를 제시한다. 당해 기술 분야의 당업자들은, 이들 서열을 일상적이고 널리 공지된 서열 정렬 방법으로 분석할 수 있음을, 쉽게 알 것이다 (예, BLAST, blast.ncbi.nlm.nih.gov; Altschul et al., " J. Mol . Biol . 215:403-410 (1990)). 아울러, 국립 생물공학 정보 센터 (NCBI) GenBank 데이터베이스, 유럽 분자 생물학 레보레이토리 (EMBL), ExPasy Prosite 또는 BLAST를 이용한 그외 공개적으로 이용가능한 서열 데이터베이스에서 확인되는 등의 공개적으로 이용가능한 서열 데이터베이스를 검색함으로써, 부가적인 상동적인 ALD 서열들을 식별할 수 있다. 이러한 정렬은 효소 활성을 유지하기 위한 컨센서스 서열 및 추가적인 효소 변이체를 구축하기 위한 위치를 식별하는데에도 이용할 수 있는 보존된 잔기에 대한 정보를 제공할 수 있다.
표 4. 알데하이드 데하이드로게나제 (ALD) 서열의 예.
부티르알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] AAP42563.1
GI:31075383
(서열번호 7)
가상의 단백질 ROSEINA2194_01708 [로세부리아 이눌린이보란스 DSM 16841] EEG94445.1
(서열번호 8)
알데하이드 데하이드로게나제 [바실러스 sp. FJAT-21945] KOP84001.1
(서열번호 9)
알데하이드 데하이드로게나제 [바실러스 솔라니] KQL21940.1
(서열번호 10
알데하이드 데하이드로게나제 [테리스포로박터 오티니엔시스] WP_039679531.1
(서열번호 11)
알데하이드 데하이드로게나제 [로세부리아 이눌린이보란스 DSM 16841] ABC25528.1
GI:83596371
(서열번호 12)
프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. ASF502] WP_004073235.1
(서열번호 13)
알데하이드 데하이드로게나제 [[바실러스] 셀레니티레두센스] WP_013174003.1
(서열번호 14)
알데하이드 데하이드로게나제 [블라우티아 오베움] WP_005427729.1
(서열번호 15)
가상의 단백질 CLOBOL_07248 [[클로스트리듐] 볼테아 ATCC BAA-613] EDP12494.1
(서열번호 16)
알데하이드 데하이드로게나제 [지오트갈리박실러스 알리멘타리우스] WP_041123321.1
(서열번호 17)
알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [[클로스트리듐 히라노니스 DSM 13275] EEA85935.1
(서열번호 18)
복수의 종: 알데하이드 데하이드로게나제 [서모안에어로박터] WP_003870148.1
(서열번호 19)
복수의 종: 알데하이드 데하이드로게나제 [클로스트리디에일스] WP_008705584.1
(서열번호 20)
알데하이드 데하이드로게나제 [세발델라 터미티디스 ATCC 33386] ACZ07905.1
(서열번호 21)
프로피온알데하이드 데하이드로게나제 [유박테리움 플렉시카우다툼] WP_004061597.1
(서열번호 22)
복수의 종: 알데하이드 데하이드로게나제 [에스케리키아] WP_000997839.1
(서열번호 23)
알데하이드 데하이드로게나제 [로도스피릴륨 루브룸] WP_011388669.1
(서열번호 24)
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] WP_012060202.1
(서열번호 25)
알데하이드 데하이드로게나제 [[유박테리움] 할리이] WP_005344386.1
(서열번호 26)
알데하이드 데하이드로게나제 [비브리오 sp. EJY3] WP_014232054.1
(서열번호 27)
알데하이드 데하이드로게나제 [로도슈도모나스 팔루스트리스 BisB18] ABD86737.1
(서열번호 28)
알데하이드 데하이드로게나제 EutE [덴설파티바실룸 알케니보란스] WP_015949695.1
(서열번호 29)
알데하이드 데하이드로게나제 Ald [클로스트리듐 사카로부틸리컴] WP_022747467.1
(서열번호 30)
알데하이드 데하이드로게나제 [클로스트리듐 sp. DL-VIII] WP_009171375.1
(서열번호 31)
알데하이드 데하이드로게나제 EutE [클로스트리듐 타에니오스포럼] WP_069679818.1
(서열번호 32)
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] WP_012425099.1
(서열번호 33)
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] WP_035786720.1
(서열번호 34)
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] WP_039308447.1
(서열번호 35)
알데하이드 데하이드로게나제 [클로스트리듐 보툴리넘] WP_035792132.1
(서열번호 36)
알데하이드 데하이드로게나제 [클로스트리듐 파스테리아넘] WP_023973059.1
(서열번호 37)
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴] WP_015395720.1
(서열번호 38)
복수의 종: 알데하이드 데하이드로게나제 [클로스트리듐] WP_023975647.1
(서열번호 39)
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] WP_026888070.1
(서열번호 40)
클로스트리듐 베이예린키이 균주 NRRL B593 가상의 단백질, 코엔자임 A 아실화 알데하이드 데하이드로게나제 (ald), 아세토아세테이트:부티레이트/아세테이트 코엔자임 A 트랜스퍼라제 (ctfA), 아세토아세테이트:부티레이트/아세테이트 코엔자임 A 트랜스퍼라제 (ctfB), 및 아세토아세테이트 데카르복실라제 (adc) 유전자 (AF157306 AF132754) AF157306.2
(서열번호 41)
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] WP_012059995.1
(서열번호 42)
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] WP_041898834.1
(서열번호 43)
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] WP_017211959.1
(서열번호 44)
알데하이드 데하이드로게나제 EutE [클로스트리듐 베이예린키이] WP_065419149.1
(서열번호 45)
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] >gb|AGF59413.1| NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 사카로퍼부틸아세토니컴 N1-4(HMT)] YP_007458667.1
GI:451822466 (WP_015395720.1)
(서열번호 46)
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|AAQ12068.1| 코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|AAQ12072.1| 코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|AAT48939.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|AAT66436.1| 코엔자임 A-아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] >gb|ABR35947.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] YP_001310903.1
GI:150018649
(WP_012059995.1)
(서열번호 47)
코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] AAD31841.1
GI:4884855
(서열번호 48)
아세트알데하이드 데하이드로게나제 (아세틸화) [클로스트리듐 sp. DL-VIII] >gb|EHJ00721.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [클로스트리듐 sp. DL-VIII] ZP_09206127.1
GI:359413662
(서열번호 49)
코엔자임 A 아실화 알데하이드 데하이드로게나제 [클로스트리듐 사카로부틸리컴] CAQ57983.1
GI:189310620
(서열번호 50)
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] >gb|ACD24339.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] YP_001886323.1
GI:187934965
(WP_012425099.1)
(서열번호 51)
알데하이드 데하이드로게나제 [칼달칼리바실러스 서마룸 TA2.A1] >gb|EGL82399.1| 알데하이드 데하이드로게나제 [칼달칼리바실러스 서마룸 TA2.A1] ZP_08533507.1
GI:335040377
(서열번호 52)
알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 DSM 17108] >ref|ZP_15517111.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B4] >ref|ZP_15521980.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B3] >ref|ZP_15526533.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A12] >ref|ZP_15534416.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A11] >gb|EIW18982.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B4] >gb|EIW21808.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A11] >gb|EIW29163.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 DSM 17108] >gb|EIW35484.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 B3] >gb|EIW36902.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 A12] ZP_10327808.1
GI:392962372
(서열번호 53)
NAD-의존적인 알데하이드 데하이드로게나제 [서모안에어로박테리움 서모사카롤리티컴 M0795] >gb|AGB19701.1| NAD-의존적인 알데하이드 데하이드로게나제 [서모안에어로박테리움 서모사카롤리티컴 M0795] YP_007299398.1
GI:433655690
(WP_015312185.1)
(서열번호 54)
알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 JBW45] >gb|EIW48189.1| 알데하이드 데하이드로게나제 [펠로시누스 퍼멘탄스 JBW45] ZP_15537951.1
GI:421076976
(서열번호 55)
알데하이드 데하이드로게나제 패밀리 단백질 [데설포스포로시누스 sp. OT] >gb|EGW35902.1| 알데하이드 데하이드로게나제 패밀리 단백질 [데설포스포로시누스 sp. OT] ZP_08814704.1
GI:345862484
(서열번호 56)
가상의 단백질 CLOSTMETH_00016 [클로스트리듐 메틸펜토섬 DSM 5476] >gb|EEG32278.1| 가상의 단백질 CLOSTMETH_00016 [클로스트리듐 메틸펜토섬 DSM 5476] ZP_03705305.1
GI:225016072
(서열번호 57)
알데하이드 데하이드로게나제 [서모안에어로박테리움 사카롤리티컴 JW/SL-YS485] >gb|AFK85255.1| 알데하이드 데하이드로게나제 [서모안에어로박테리움 사카롤리티컴 JW/SL-YS485] YP_006390854.1
GI:390933349
(WP_014757178.1)
(서열번호 58)
아세트알데하이드 데하이드로게나제 [서모안에어로박테리움 자일라놀리티컴 LX-11] >gb|AEF18105.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [서모안에어로박테리움 자일라놀리티컴 LX-11] YP_004471777.1
GI:333897903
(WP_013788835.1)
(서열번호 59)
알데하이드 데하이드로게나제 EutE [아세톤마 롱검 DSM 6540] >gb|EGO64744.1| 알데하이드 데하이드로게나제 EutE [아세톤마 롱검 DSM 6540] ZP_08623980.1
GI:338811775
(서열번호 60)
에탄올아민 이용 단백질 eutE [지오바실러스 서모글루코시단스 TNO-09.020] >gb|EID44455.1| 에탄올아민 이용 단백질 eutE [지오바실러스 서모글루코시단스 TNO-09.020] ZP_17694107.1
GI:423719925
(서열번호 61)
알데하이드 데하이드로게나제 [지오바실러스 sp. Y4.1MC1] >gb|ADP74637.1| 알데하이드 데하이드로게나제 [지오바실러스 sp. Y4.1MC1] YP_003989248.1
GI:312110932
(WP_013400810.1)
(서열번호 62)
아세트알데하이드 데하이드로게나제 [지오바실러스 서모글루코시다시우스 C56-YS93] >gb|AEH47899.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [지오바실러스 서모글루코시다시우스 C56-YS93] YP_004587980.1
I:336235364
(WP_013876899.1)
(서열번호 63)
알데하이드 데하이드로게나제 EutE [바실러스 아조토포르만스 LMG 9581] >gb|EKN64472.1| 알데하이드 데하이드로게나제 EutE [바실러스 아조토포르만스 LMG 9581] ZP_11313951.1
GI:410460269
(서열번호 64)
추정의 알데하이드 데하이드로게나제, 에탄올아민 이용 단백질 [[클로스트리듐] 스티클란디이]>emb|CBH20800.1| 추정의 알데하이드 데하이드로게나제, 에탄올아민 이용 단백질 [[클로스트리듐] 스티클란디이] YP_003935705.1
GI:310657984
(WP_013360893.1)
(서열번호 65)
알데하이드 데하이드로게나제 [서민콜라 포텐스 JR] >gb|ADG81503.1| 알데하이드 데하이드로게나제 [서민콜라 포텐스 JR] YP_003639404.1
GI:296132157
(WP_013119524.1)
(서열번호 66)
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. D5] >gb|EGB92558.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. D5] ZP_08130302.1
GI:325263568
(서열번호 67)
아세트알데하이드 데하이드로게나제 (아세틸화) [푸조박테리움 sp. 3_1_33] >gb|EEW94895.1| 아세트알데하이드 데하이드로게나제 (아세틸화) [푸조박테리움 sp. 3_1_33] ZP_05815063.1
GI:260494934
(서열번호 68)
에탄올아민 이용 단백질 eutE [푸조박테리움 sp. 7_1] >gb|EEO43449.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 sp. 7_1] ZP_04573939.1
GI:237743458
(서열번호 69)
NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 sp. SR1/5] >emb|CBL20089.1| NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 sp. SR1/5] YP_007783752.1
GI:479153977
(WP_015525955.1)
(서열번호 70)
가상의 단백질 HMPREF9942_01197 [푸조박테리움 누클레아툼 subsp. 아니말리스 F0419] >gb|EHO78009.1| 가상의 단백질 HMPREF9942_01197 [푸조박테리움 누클레아툼 subsp. 아니말리스 F0419] ZP_17125059.1
GI:423137416
(서열번호 71)
잠재적인 알데하이드 데하이드로게나제 [푸조박테리움 누클레아툼 subsp. 폴리포르품 ATCC 10953] >gb|EDK87521.1| 잠재적인 알데하이드 데하이드로게나제 [푸조박테리움 누클레아툼 subsp. 폴리포르품 ATCC 10953] ZP_04969437.1
GI:254302079
(서열번호 72)
에탄올아민 이용 단백질 eutE [푸조박테리움 sp. D11] >gb|EFD80567.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 sp. D11] ZP_06524378.1
GI:289765000
(서열번호 73)
알데하이드 데하이드로게나제 EutE [푸조박테리움 누클레아툼 ChDC F128] >gb|EJU08233.1| 알데하이드 데하이드로게나제 EutE [푸조박테리움 누클레아툼 ChDC F128] ZP_15972610.1
GI:421526001
(서열번호 74)
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 누클레아툼 subsp. 폴리포르품 F0401] >gb|EHG19190.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 누클레아툼 subsp. 폴리포르품 F0401] ZP_16419680.1; GI:422338720
(서열번호 75)
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 11_3_2] >gb|EGN65750.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 11_3_2] ZP_08600044.1
GI:336419790
(서열번호 76)
가상의 단백질 CLOSTASPAR_02210 [클로스트리듐 아스파라기포르메 DSM 15981] >gb|EEG55710.1| 가상의 단백질 CLOSTASPAR_02210 [클로스트리듐 아스파라기포르메 DSM 15981] ZP_03758198.1
GI:225388474
(서열번호 77)
알데하이드 데하이드로게나제 [클로스트리듐 피토퍼멘탄스 ISDg] >gb|ABX41556.1| 알데하이드 데하이드로게나제_ [클로스트리듐 피토퍼멘탄스 ISDg] YP_001558295.1
GI:160879327
(WP_012199204.1)
(서열번호 78)
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 1_1_41FAA] >gb|EFG28139.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [푸조박테리움 sp. 1_1_41FAA] ZP_06748808.1
GI:294783484
(서열번호 79)
가상의 단백질 HMPREF0991_01940 [라크노스피라시이 박테리움 2_1_58FAA] >gb|EGN47419.1| 가상의 단백질 HMPREF0991_01940 [라크노스피라시이 박테리움 2_1_58FAA] ZP_08612821.1
GI:336432991
(서열번호 80)
가상의 단백질 RUMGNA_01022 [루미노코커스 그나부스 ATCC 29149] >gb|EDN78612.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [루미노코커스 그나부스 ATCC 29149] ZP_02040258.1
GI:154503198
(서열번호 81)
NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 오베움 A2-162] >emb|CBL23217.1| NAD-의존적인 알데하이드 데하이드로게나제 [루미노코커스 오베움 A2-162] YP_007805199.1
GI:479177598
(WP_015542038.1)
(서열번호 82)
알데하이드 데하이드로게나제 [클로스트리듐 사카롤리티컴 WM1] >gb|ADL04402.1| 알데하이드 데하이드로게나제 [클로스트리듐 사카롤리티컴 WM1] YP_003822025.1
GI:302386203
(WP_013272491.1)
(서열번호 83)
알데하이드 데하이드로게나제 패밀리 단백질 플라보니프락터 플라우티이 ATCC 29863] >gb|EHM40040.1| 알데하이드 데하이드로게나제 패밀리 단백질 [플라보니프락터 플라우티이 ATCC 29863] ZP_09385796.1
GI:365844997
(서열번호 84)
가상의 단백질 RUMOBE_00094 [루미노코커스 오베움 ATCC 29174] >gb|EDM88971.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [루미노코커스 오베움 ATCC 29174] ZP_01962381.1
GI:153809713
(서열번호 85)
알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >ref|ZP_06856832.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|EET88516.1| 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >gb|EFG86154.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|ADO12117.1| CoA-아실화 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] ZP_05391061.1
GI:255524100
(서열번호 86)
가상의 단백질 FUAG_00592 [푸조박테리움 울세란스 ATCC 49185] >gb|EFS25077.1| 가상의 단백질 FUAG_00592 [푸조박테리움 울세란스 ATCC 49185] ZP_10974295.1
GI:404368948
(서열번호 87)
가상의 단백질 HMPREF0402_00608 [푸조박테리움 sp. 12_1B] >gb|EHO83590.1| 가상의 단백질 HMPREF0402_00608 [푸조박테리움 sp. 12_1B] ZP_09586735.1
GI:373496187
(서열번호 88)
알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >ref|ZP_06855343.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] >gb|EET85788.1| 알데하이드 데하이드로게나제 [클로스트리듐 카르복시디보란스 P7] >gb|EFG87815.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [클로스트리듐 카르복시디보란스 P7] ZP_05393779.1
GI:255526882
(서열번호 89)
NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 cf. 사카롤리티컴 K10] >emb|CBK77787.1| NAD-의존적인 알데하이드 데하이드로게나제 [클로스트리듐 cf. 사카롤리티컴 K10] YP_007849785.1
GI:479338567
(WP_015574070.1)
(서열번호 90)
에탄올아민 이용 단백질 eutE [푸조박테리움 바리움 ATCC 27725] >gb|EES62817.1| 에탄올아민 이용 단백질 eutE [푸조박테리움 바리움 ATCC 27725] ZP_08693593.1
GI:340756989
(서열번호 91)
알데하이드 데하이드로게나제 패밀리 단백질 [클로스트리듐 켈라툼 DSM 1785] >gb|EKY29259.1| 알데하이드 데하이드로게나제 패밀리 단백질 [클로스트리듐 켈라툼 DSM 1785] ZP_19296595.1
GI:429764274
(서열번호 92)
프로피온알데하이드 데하이드로게나제 [클로스트리듐 sp. ASF502] EMZ20682.1
GI:476613570
(서열번호 93)
가상의 단백질 HMPREF0988_02063 [라크노스피라시이 박테리움 1_4_56FAA] >gb|EGN36620.1| 가상의 단백질 HMPREF0988_02063 [라크노스피라시이 박테리움 1_4_56FAA] ZP_08616478.1
GI:336436768
(서열번호 94)
가상의 단백질 HMPREF0994_03038 [라크노스피라시이 박테리움 3_1_57FAA_CT1] >gb|EGN40215.1| 가상의 단백질 HMPREF0994_03038 [라크노스피라시이 박테리움 3_1_57FAA_CT1] ZP_08607032.1
GI:336427027
(서열번호 95)
알데하이드 데하이드로게나제 [루미노코커스 sp. 5_1_39B_FAA] >gb|EES77009.1| 알데하이드 데하이드로게나제 [루미노코커스 sp. 5_1_39BFAA] ZP_04856816.1
GI:253579547
(서열번호 96)
CoA-의존적인 프로프리온알데하이드 데하이드로게나제 PduP [아세토박테리움 우디이 DSM 1030] >gb|AFA49334.1| CoA-의존적인 프로프리온알데하이드 데하이드로게나제 PduP [아세토박테리움 우디이 DSM 1030] YP_005270223.1 GI:379012411
(WP_014356934.1)
(서열번호 97)
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E1 str. 'BoNT E Beluga'] >gb|EES50221.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E1 str. 'BoNT E Beluga'] ZP_04822936.1
GI:251780016
(서열번호 98)
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] >gb|ACD22415.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 B str. Eklund 17B] YP_001885942.1 GI:187933041
(WP_012423269.1)
(서열번호 99)
에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E3 str. Alaska E43] >gb|ACD53952.1| 에탄올아민 이용 단백질 EutE [클로스트리듐 보툴리넘 E3 str. Alaska E43] YP_001921227.1 GI:188590535
(WP_012451752.1)
(서열번호 100)
프로피온알데하이드 데하이드로게나제 [유박테리움 플렉시카우다툼 ASF492] EMZ27833.1
GI:476621007
(서열번호 101)
알데하이드 데하이드로게나제 [서모세디미니박터 오세아니 DSM 16646] >gb|ADL07333.1| 알데하이드 데하이드로게나제 [서모세디미니박터오세아니 DSM 16646] YP_003824956.1
GI:302389135
(WP_013275382.1)
(서열번호 102)
가상의 단백질 HMPREF1090_01637 [클로스트리듐 클로스트리디오포르메 90A8] ENZ17687.1
GI:480674262
(서열번호 103)
가상의 단백질 HMPREF9467_03550 [클로스트리듐 클로스트리디오포르메 2_1_49FAA] >gb|EHG29726.1| 가상의 단백질 HMPREF9467_03550 [클로스트리듐 클로스트리디오포르메 2_1_49FAA] ZP_09116578.1
GI:357055510
(서열번호 104)
알데하이드 데하이드로게나제 [일리오박터 폴리트로푸스 DSM 2926] >gb|ADO84118.1| 알데하이드 데하이드로게나제 [일리오박터 폴리트로푸스 DSM 2926] YP_003968466.1
GI:310780134
(WP_013388777.1)
(서열번호 105)
가상의 단백질 GCWU000342_00651 [셔틀위티아 사텔레스 DSM 14600] >gb|EEP29295.1| 가상의 단백질 GCWU000342_00651 [셔틀위티아 사텔레스 DSM 14600] ZP_04454656.1
GI:229828587
(서열번호 106)
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] >gb|ABR36155.1| 알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이 NCIMB 8052] YP_001311111.1
GI:150018857
(WP_012060202.1)
(서열번호 107)
프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 CM201] >gb|ENZ04399.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90B1] >gb|ENZ17257.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A8] >gb|ENZ22132.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A3] >gb|ENZ29200.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A1] >gb|ENZ64224.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A4] >gb|ENZ70105.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 클로스트리디오포르메 90A6] ENY83847.1
GI:480639338
(서열번호 108)
알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [클로스트리듐 sp. MSTE9] >gb|EJF40077.1| 알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [클로스트리듐 sp. MSTE9] ZP_14663848.1
GI:420157008
(서열번호 109)
프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90B8] >gb|ENZ57487.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90A5] >gb|ENZ67775.1| 프로피온알데하이드 데하이드로게나제 [클로스트리듐 볼테아 90B7] ENZ31577.1
GI:480688660
(서열번호 110)
가상의 단백질 EUBHAL_00514 [유박테리움 할리이 DSM 3353] >gb|EEG37590.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리움 할리이 DSM 3353] ZP_03715465.1
GI:225026273
(서열번호 111)
CoA-아실화 프로피온알데하이드 데하이드로게나제 [할란에어로븀 사카롤리티컴 subsp. 사카롤리티컴 DSM 6643] >emb|CCU77919.1| CoA-아실화 프로피온알데하이드 데하이드로게나제 [할란에어로븀 사카롤리티컴 subsp. 사카롤리티컴 DSM 6643] ZP_23773859.1
GI:470960332
(서열번호 112)
가상의 단백질 [유박테리움 리모섬 KIST612] >gb|ADO39014.1| 가상의 단백질 ELI_4072 [유박테리움 리모섬 KIST612] YP_003961977.1
GI:310829620
(WP_013382321.1)
(서열번호 113)
알데하이드 데하이드로게나제 [서모안에어로박터 sp. X514] >ref|ZP_07131928.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X561] >ref|YP_003903905.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X513] >ref|ZP_08212082.1| 알데하이드 데하이드로게나제 [서모안에어로박터 에탄올리쿠스 JW 200] >gb|ABY93220.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X514] >gb|EFK84693.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X561] >gb|ADN54614.1| 알데하이드 데하이드로게나제 [서모안에어로박터 sp. X513] >gb|EGD51928.1| 알데하이드 데하이드로게나제 [서모안에어로박터 에탄올리쿠스 JW 200] YP_001663556.1
GI:167040571
(WP_003870148.1)
(서열번호 114)
알데하이드 데하이드로게나제 [로도스피릴륨 루브룸 ATCC 11170] >ref|YP_006047210.1| 알데하이드 데하이드로게나제 EutE [로도스피릴륨 루브룸 F11] >gb|ABC21715.1| 알데하이드 데하이드로게나제 [로도스피릴륨 루브룸 ATCC 11170] >gb|AEO47413.1| 알데하이드 데하이드로게나제 EutE [로도스피릴륨 루브룸 F11] YP_426002.1
GI:83592250
(서열번호 115)
CoA-의존적인 프로피온알데하이드 데하이드로게나제 [유박테리움 유리 subsp. 마르가레티아 ATCC 43715] >gb|EFM39950.1| CoA-의존적인 프로피온알데하이드 데하이드로게나제 [유박테리움 유리 subsp. 마르가레티아 ATCC 43715] ZP_07453625.1
GI:306819974
(서열번호 116)
알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [유박테리움 sp. AS15] >gb|EJP26117.1| 알데하이드 데하이드로게나제 (NAD) 도메인 단백질 [유박테리움 sp. AS15] ZP_10828060.1
GI:402309064
(서열번호 117)
알데하이드 데하이드로게나제 EutE [비브리오 sp. EJY3] >gb|AEX22176.1| 알데하이드 데하이드로게나제 EutE [비브리오 sp. EJY3] YP_005023154.1
GI:375265711
(WP_014232054.1)
(서열번호 118)
가상의 단백질 HMPREF9629_00032 [유박테리아시이 박테리움 ACC19a] >gb|EHL16790.1| 가상의 단백질 HMPREF9629_00032 [유박테리아시이 박테리움 ACC19a] ZP_09320518.1
GI:363893420
(서열번호 119)
알데하이드-알코올 데하이드로게나제 도메인 단백질 [프로피오니박테리 움프로피오니컴 F0230a] >gb|AFN47240.1| 알데하이드-알코올 데하이드로게나제 도메인 단백질 [프로피오니박테리움 프로피오니컴 F0230a] YP_006513121.1
GI:397671586
(WP_014847902.1)
(서열번호 120)
가상의 단백질 HMPREF9628_01348 [유박테리아시이 박테리움 CM5] >gb|EHL19659.1| 가상의 단백질 HMPREF9628_01348 [유박테리아시이 박테리움 CM5] ZP_09316712.1
GI:363889349
(서열번호 121)
알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리아시이 박테리움 OBRC8] >gb|EJU23517.1| 알데하이드 데하이드로게나제 (NAD) 패밀리 단백질 [유박테리아시이 박테리움 OBRC8] ZP_10886417.1
GI:402837902
(서열번호 122)
알데하이드 데하이드로게나제 [클로스트리듐 베이예린키이] AAT48939.1
(서열번호 123)
전술한 변이체와 같은 개개 ALD 변이체는 단독으로 사용하거나 또는 본원에 기재된 변이 아미노산 위치들 중 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16곳, 또는 최대 전체 등의, 임의의 다른 변이 아미노산 위치와 조합하여 (표 1-3), 원하는 활성을 가진 부가적인 변이체를 구축할 수 있는 것으로, 이해된다. ALD 변이체들의 예로는, 비-제한적으로, 표 1-3 중 어느 하나에 기술된 아미노산 위치에서, 예를 들어, ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 아미노산 위치 12, 19, 33, 44, 65, 66, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189, 204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464 또는 467에서, 하나의 치환 또는 하나 이상의 치환 조합을 포함한다 (표 1-3 참조). 예를 들어, ALD 변이체는, 비-제한적으로, ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 아미노산 위치 D12, V19, C33, I44, K65, I66, K72, A73, Y107, D122, E129, I139, T143, P145, G155, V163, G167, C174, C189, M204, C220, M227, K229, T230, A243, G244, A254, C267, V315, C353, C356, R396, F429, V432, E437, T440, T441, F442, I444, S447, E450, R460, C464, 또는 A467에서, 아미노산 치환, 하나의 치환 또는 하나 이상의 치환 조합을 포함한다 (표 1-3 참조). 다른 아미노산 19개 중 어느 하나로의 치환이 하나 이상의 바람직한 아미노산 위치에서 수행될 수 있는 것으로 이해된다.
일 구현예에서, 변이체 ALD는 12번 위치에서 아미노산 치환 D12A를 포함한다. 일 구현예에서, 변이체 ALD는 19번 위치에서 아미노산 치환 V19I를 포함한다. 일 구현예에서, 변이체 ALD는 33번 위치에서 아미노산 치환 C33R을 포함한다. 일 구현예에서, 변이체 ALD는 44번 위치에서 아미노산 치환 I44L을 포함한다. 일 구현예에서, 변이체 ALD는 65번 위치에서 아미노산 치환 K65A를 포함한다. 일 구현예에서, 변이체 ALD는 I66M, I66Q, I66N, I66H, I66T 및 I66S로부터 선택되는 66번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 72번 위치에서 아미노산 치환 K72N를 포함한다. 일 구현예에서, 변이체 ALD는 A73S, A73D, A73G, A73L, A73Q, A73F, A73E, A73W, A73R, A73C 및 A73M으로부터 선택되는 73번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 107번 위치에서 아미노산 치환 Y107K를 포함한다. 일 구현예에서, 변이체 ALD는 122번 위치에서 아미노산 치환 D122N을 포함한다. 일 구현예에서, 변이체 ALD는 129번 위치에서 아미노산 치환 E129I를 포함한다. 일 구현예에서, 변이체 ALD는 I139S, I139V 및 I139L로부터 선택되는 139번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 143번 위치에서 아미노산 치환 T143N 또는 T143S를 포함한다. 일 구현예에서, 변이체 ALD는 V163C, V163G 및 V163T로부터 선택되는 163번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 167번 위치에서 아미노산 치환 G167S를 포함한다. 일 구현예에서, 변이체 ALD는 174번 위치에서 아미노산 치환 C174S를 포함한다. 일 구현예에서, 변이체 ALD는 189번 위치에서 아미노산 치환 C189A를 포함한다. 일 구현예에서, 변이체 ALD는 204번 위치에서 아미노산 치환 M204R을 포함한다. 일 구현예에서, 변이체 ALD는 220번 위치에서 아미노산 치환 C220V를 포함한다. 일 구현예에서, 변이체 ALD는 M227K, M227Q, M227I, M227V, M227C, M227L 및 M227A로부터 선택되는 227번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 229번 위치에서 아미노산 치환 K229S를 포함한다. 일 구현예에서, 변이체 ALD는 T230R, T230K, T230H, T230A, T230M, T230C, T230L, T230S, T230Y, T230G, T230T, T230I, T230W, T230N, T230V 및 T230Q로부터 선택되는 230번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 A243P, A243Q, A243E, A243S, A243N, A243K, A243L, A243C, A243M 및 A243I로부터 선택되는 243번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 254번 위치에서 아미노산 치환 A254T를 포함한다. 일 구현예에서, 변이체 ALD는 267번 위치에서 아미노산 치환 C267A를 포함한다. 일 구현예에서, 변이체 ALD는 315번 위치에서 아미노산 치환 V315A를 포함한다. 일 구현예에서, 변이체 ALD는 353번 위치에서 아미노산 치환 C353A를 포함한다. 일 구현예에서, 변이체 ALD는 356번 위치에서 아미노산 치환 C356T 또는 C356L을 포함한다. 일 구현예에서, 변이체 ALD는 396번 위치에서 아미노산 치환 R396H를 포함한다. 일 구현예에서, 변이체 ALD는 F429Y, F429Q, F429H, F429M, F429D 및 F429L로부터 선택되는 429번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 432번 위치에서 아미노산 치환 V432V 또는 V432N을 포함한다. 일 구현예에서, 변이체 ALD는 437번 위치에서 아미노산 치환 E437P를 포함한다. 일 구현예에서, 변이체 ALD는 440번 위치에서 아미노산 치환 T440H를 포함한다. 일 구현예에서, 변이체 ALD는 441번 위치에서 아미노산 치환 T441G를 포함한다. 일 구현예에서, 변이체 ALD는 F442T, F442Y, F442H, F442N, F442Q, F442M 및 F442F로부터 선택되는 442번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 444번 위치에서 아미노산 치환 I444V를 포함한다. 일 구현예에서, 변이체 ALD는 S447M, S447P, S447H, S447K, S447R, S447T, S447E 및 S447S로부터 선택되는 447번 위치에서 아미노산 치환을 포함한다. 일 구현예에서, 변이체 ALD는 460번 위치에서 아미노산 치환 R460K를 포함한다. 일 구현예에서, 변이체 ALD는 464번 위치에서 아미노산 치환 C464V 또는 C464I를 포함한다. 일 구현예에서, 변이체 ALD는 467번 위치에서 아미노산 치환 A467V를 포함한다. 전술한 임의의 아미노산 위치는 하나의 아미노산 치환 또는 하나 이상의 치환의 조합에 이용해, 본 발명의 ALD 변이체를 구축할 수 있다.
예를 들어, ALD 변이체는 예를 들어 다음과 같은 2 이상의 아미노산 치환을 포함할 수 있다: D12 및 I139; K65 및 C174; M204 및 C220; C464 및 A467; R396 및 F442; C356 및 F442; C174 및 A243; K65 및 I66; I66 및 A73; I66 및 C174; I66 및 M204; I66 및 C220; I66 및 M227; I66 및 T230; I66 및 A243; I66 및 A243; I66 및 C267; I66 및 C356; I66 및 R396; I66 및 E437; I66 및 F442; I66 및 S447; I66 및 C464; I66 및 A467, 등. 예를 들어, ALD 변이체는 예를 들어 다음과 같은 2 이상의 아미노산 치환을 포함할 수 있다: D12A 및 I139L; K65A 및 C174S; M204R 및 C220V; C464I 및 A467V; R396H 및 F442N; C356T 및 F442M; C174S 및 A243Q; K65A 및 I66H; I66H 및 A73S; I66H 및 C174S; I66H 및 M204R; I66H 및 C220V; I66H 및 M227I; I66H 및 T230C; I66H 및 A243Q; I66H 및 A243P; I66H 및 C267A; I66H 및 C356T; I66H 및 R396H; I66H 및 E437P; I66H 및 F442N; I66H 및 S447P; I66H 및 C464I; I66H 및 A467V; K65A 및 I66T; I66M 및 A73S; I66T 및 C174S; I66T 및 M204R; I66T 및 C220V; I66T 및 M227I; I66T 및 T230C; I66T 및 A243Q; I66T 및 A243P; I66T 및 C267A; I66T 및 C356T; I66T 및 R396H; I66T 및 E437P; I66T 및 F442N; I66T 및 S447P; I66T 및 C464I; I66T 및 A467V; K65A 및 I66M; I66M 및 A73S; I66M 및 C174S; I66M 및 M204R; I66M 및 C220V; I66M 및 M227I; I66M 및 T230C; I66M 및 A243Q; I66M 및 A243P; I66M 및 C267A; I66M 및 C356T; I66M 및 R396H; I66M 및 E437P; I66M 및 F442N; I66M 및 S447P; I66M 및 C464I; I66M 및 A467V; K65A 및 I66N; I66N 및 A73S; I66N 및 C174S; I66N 및 M204R; I66N 및 C220V; I66N 및 M227I; I66N 및 T230C; I66N 및 A243Q; I66N 및 A243P; I66N 및 C267A; I66N 및 C356T; I66N 및 R396H; I66N 및 E437P; I66N 및 F442N; I66N 및 S447P; I66N 및 C464I; I66N 및 A467V, K65A 및 I66Q; I66Q 및 A73S; I66Q 및 C174S; I66Q 및 M204R; I66Q 및 C220V; I66Q 및 M227I; I66Q 및 T230C; I66Q 및 A243Q; I66Q 및 A243P; I66Q 및 C267A; I66Q 및 C356T; I66Q 및 R396H; I66Q 및 E437P; I66Q 및 F442N; I66Q 및 S447P; I66Q 및 C464I; I66Q 및 A467V; K65A 및 I66S; I66S 및 A73S; I66S 및 C174S; I66S 및 M204R; I66S 및 C220V; I66S 및 M227I; I66S 및 T230C; I66S 및 A243Q; I66S 및 A243P; I66S 및 C267A; I66S 및 C356T; I66S 및 R396H; I66S 및 E437P; I66S 및 F442N; I66S 및 S447P; I66S 및 C464I; I66S 및 A467V, 등.
또한, ALD 변이체는 예를 들어 다음과 같은 3개 이상의 아미노산 치환을 포함할 수 있다: D12, I139 및 R396; K65, C174 및 C356; M204, C220 및 A243; C174, C464 및 A467; A243, R396 및 F442; C220, C356 및 F442; C174, A243 및 E437; K65, I66 및 A243; I66, A73 및 E437; I66, C174 및 F442; I66, M204 및 R396; I66, C220 및 S447; I66, M227 및 C267; I66, T230 및 A243; I66, A243 및 C464; I66, A243 및 A467; I66, M204 및 C267; I66, C356 및 R396; I66, R396 및 F442; I66, E437 및 A467; I66, C220 및 F442; I66, S447 및 C464; I66, M204 및 C464; I66, C174 및 A467. 예를 들어, ALD 변이체는 예를 들어 다음과 같은 3개 이상의 아미노산 치환을 포함할 수 있다: D12A, I139L 및 R396H; K65A, C174S 및 C356T; M204R, C220V 및 A243Q; C174S, C464I 및 A467V; A243P, R396H 및 F442N;C220V, C356T 및 F442M; C174S, A243Q 및 E437P; K65A, I66H 및 A243Q; I66H, A73S 및 E437P; I66H, C174S 및 F442N; I66H, M204R 및 R396H; I66H, C220V 및 S447P; I66H, M227I 및 C267A; I66H, T230C 및 A243P; I66H, A243Q 및 C464I; I66H, A243P 및 A467V; I66H, M204R 및 C267A; I66H, C356T 및 R396M; I66H, R396H 및 F442N; I66H, E437P 및 A467V; I66H, C220V 및 F442N; I66H, S447P 및 C464I; I66H, M204R 및 C464I; I66H, C174S 및 A467V; K65A, I66T 및 A243Q; I66M, A73S 및 E437P; I66T, C174S 및 F442N; I66T, M204R 및 R396H; I66T, C220V 및 S447P; I66T, M227I 및 C267A; I66T, T230C 및 A243P; I66T, A243Q 및 C464I; I66T, A243P 및 A467V; I66T, M204R 및 C267A; I66T, C356T 및 R396M; I66T, R396H 및 F442N; I66T, E437P 및 A467V; I66T, C220V 및 F442N; I66T, S447P 및 C464I; I66T, M204R 및 C464I; I66T, 및 C174S 및 A467V; K65A, I66M 및 A243Q; I66M, A73S 및 A437P; I66M, C174S 및 F442N; I66M, M204R 및 R396H; I66M, C220V 및 F442N; I66M, M227I 및 C267A; I66M, T230C 및 A243P; I66M, A243Q 및 C464I; I66M, A243P 및 A467V; I66M, M204R 및 C267A; I66M, C356T 및 R396M; I66M, R396H 및 F442N; I66M, E437P 및 A467V; I66M, C220V 및 F442N; I66M, S447P 및 C464I; I66M, M204R 및 C464I; I66M, C174S 및 A467V; K65A, I66N 및 A243Q; I66N, A73S 및 M227I; I66N, C174S 및 E437P; I66N, M204R 및 R396H; I66N, C220V 및 S447P; I66N, C174S 및 M227I; I66N, T230C 및 C356T; I66N, M204R 및 A243Q; I66N, A243P 및 S447P; I66N, C267A 및 C356T; I66N, C220V 및 C356T; I66N, R396H 및 E437P; I66N, M227I 및 E437P; I66N, F442N 및 A467V; I66N, M227I 및 S447P; I66N, M227I 및 C464I; I66N, A73S 및 A467V, K65A, I66Q 및 C220V; I66Q, A73S 및 M227I; I66Q, C174S 및 R396H; I66Q, M204R 및 C220V; I66Q, C220V 및 E437P; I66Q, M227I 및 F442N; I66Q, C174S 및 T230C; I66Q, A243Q 및 C356T; I66Q, A243P amd C267A; I66Q, C267A 및 C356T; I66Q, C220V 및 C356T; I66Q, R396H 및 E437P; I66Q, M204R 및 E437P; I66Q, M227I 및 F442N; I66Q, F442N 및 S447P; I66Q, C256A 및 C464I; I66Q, A73S 및 A467V; K65A, I66S 및 A73S; I66S, A73S 및 C220V; I66S, C174S 및 C267A; I66S, M204R 및 R396H; I66S, C220V 및 T230C; I66S, C220V 및 M227I; I66S, T230C 및 A243P; I66S, A243Q 및 C356T; I66S, M227I 및 A243P; I66S, C267A 및 F442N; I66S, M204R 및 C356T; I66S, T230C 및 R396H; I66S, M204R 및 E437P; I66S, C220V 및 F442N; I66S, A73S 및 S447P; I66S, C174S 및 C464I; I66S, C356T 및 A467V, 등. 전술한 아미노산 치환 2개 이상 또는 3개 이상의 조합들은 단순 예에 불과하며, 당해 기술 분야의 당업자라면 요망하는 ALD에 대한 바람직한 아미노산 치환 조합을 쉽게 결정할 수 있음을 알 것이다.
본원의 교시 내용에 기초하여, 당해 기술 분야의 당업자라면, 상동적인 ALD 서열에서 ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 아미노산 위치들 12, 19, 33, 44, 65, 66, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189, 204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464 또는 467 중 임의 위치에 대응되는 아미노산 위치를 쉽게 파악할 수 있다. 예를 들어, 도 4a의 정렬에 나타낸 바와 같이, ALD-1의 아미노산 I139는 서열번호 13 및 20의 아미노산 I133에 해당한다. 서열번호 24에서는 대응되는 위치가 V199이다. 널리 공지된 아미노산 서열 정렬 방법을 일반적으로 본원에 기술된 바와 같이 디폴트 파라미터를 이용하여 적용함으로써, 당해 기술 분야의 당업자라면 ALD-1의 아미노산 서열 (서열번호 1)에 대응되는 아미노산 위치들 12, 19, 33, 44, 65, 66, 72, 73, 107, 122, 129, 139, 143, 145, 155, 163, 167, 174, 189, 204, 220, 227, 229, 230, 243, 244, 254, 267, 315, 353, 356, 396, 429, 432, 437, 440, 441, 442, 444, 447, 450, 460, 464, 또는 467 중 임의 위치에 해당하는 아미노산 위치를 다른 ALD 서열에서 쉽게 찾을 수 있다.
ALD 변이체는, 본원에 기술된, 예를 들어 표 1-3에 기술된 변이 아미노산 위치, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16곳, 최대 전부를 포함할 수 있는 것으로 또한 이해된다. 당해 기술 분야의 당업자라면, 본원에 기술된 바와 같이 임의의 하나의 아미노산 치환 또는 아미노산 치환 조합, 예를 들어 표 1-3 및 상기한 내용에 기술된 아미노산 변이 위치를 기반으로 ALD 변이체를 쉽게 구축할 수 있다. 특정 구현예에서, ALD 변이체는 표 1-3에 기술된 변이체이다.
본 명세서 전체에 걸쳐 다양한 간행물들이 참조되었다. 유전자은행 등재 버전 명 및 GI 번호 공개물을 비롯하여, 이들 간행물의 내용은 그 전체가 본 발명이 속하는 기술 분야의 상황을 보다 충분히 설명하기 위해 본 명세서에 원용에 의해 포함된다. 본 발명은 전술한 실시예를 참조하여 설명되지만, 본 발명의 사상으로부터 벗어나지 않는 범위 내에서 다양한 변형이 이루어질 수 있는 것으로 이해하여야 한다.
<110> GENOMATICA, INC. <120> ALDEHYDE DEHYDROGENASE VARIANTS AND METHODS OF USING SAME <130> 12956-462-228 <150> 62/740,830 <151> 2018-10-03 <150> 62/737,053 <151> 2018-09-26 <160> 129 <170> PatentIn version 3.5 <210> 1 <211> 468 <212> PRT <213> Clostridium saccharoperbutylacetonicum <400> 1 Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 2 <211> 477 <212> PRT <213> Lactobacillus brevis <400> 2 Met Asn Thr Glu Asn Ile Glu Gln Ala Ile Arg Lys Ile Leu Ser Glu 1 5 10 15 Glu Leu Ser Asn Pro Gln Ser Ser Thr Ala Thr Asn Thr Thr Val Pro 20 25 30 Gly Lys Asn Gly Ile Phe Lys Thr Val Asn Glu Ala Ile Ala Ala Thr 35 40 45 Lys Ala Ala Gln Glu Asn Tyr Ala Asp Gln Pro Ile Ser Val Arg Asn 50 55 60 Lys Val Ile Asp Ala Ile Arg Glu Gly Phe Arg Pro Tyr Ile Glu Asp 65 70 75 80 Met Ala Lys Arg Ile His Asp Glu Thr Gly Met Gly Thr Val Ser Ala 85 90 95 Lys Ile Ala Lys Leu Asn Asn Ala Leu Tyr Asn Thr Pro Gly Pro Glu 100 105 110 Ile Leu Gln Pro Glu Ala Glu Thr Gly Asp Gly Gly Leu Val Met Tyr 115 120 125 Glu Tyr Ala Pro Phe Gly Val Ile Gly Ala Val Gly Pro Ser Thr Asn 130 135 140 Pro Ser Glu Thr Val Ile Ala Asn Ala Ile Met Met Leu Ala Gly Gly 145 150 155 160 Asn Thr Leu Phe Phe Gly Ala His Pro Gly Ala Lys Asn Ile Thr Arg 165 170 175 Trp Thr Ile Glu Lys Leu Asn Glu Leu Val Ala Asp Ala Thr Gly Leu 180 185 190 His Asn Leu Val Val Ser Leu Glu Thr Pro Ser Ile Glu Ser Val Gln 195 200 205 Glu Val Met Gln His Pro Asp Val Ala Met Leu Ser Ile Thr Gly Gly 210 215 220 Pro Ala Val Val His Gln Ala Leu Ile Ser Gly Lys Lys Ala Val Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Ala Met Val Asp Ala Thr Ala Asn Ile 245 250 255 Ala Leu Ala Ala His Asn Ile Val Asp Ser Ala Ala Phe Asp Asn Asn 260 265 270 Ile Leu Cys Thr Ala Glu Lys Glu Val Val Val Glu Ala Ala Val Lys 275 280 285 Asp Glu Leu Ile Met Arg Met Gln Gln Glu Gly Ala Phe Leu Val Thr 290 295 300 Asp Ser Ala Asp Ile Glu Lys Leu Ala Gln Met Thr Ile Gly Pro Lys 305 310 315 320 Gly Ala Pro Asp Arg Lys Phe Val Gly Lys Asp Ala Thr Tyr Ile Leu 325 330 335 Asp Gln Ala Gly Ile Ser Tyr Thr Gly Thr Pro Thr Leu Ile Ile Leu 340 345 350 Glu Ala Ala Lys Asp His Pro Leu Val Thr Thr Glu Met Leu Met Pro 355 360 365 Ile Leu Pro Val Val Cys Cys Pro Asp Phe Asp Ser Val Leu Ala Thr 370 375 380 Ala Thr Glu Val Glu Gly Gly Leu His His Thr Ala Ser Ile His Ser 385 390 395 400 Glu Asn Leu Pro His Ile Asn Lys Ala Ala His Arg Leu Asn Thr Ser 405 410 415 Ile Phe Val Val Asn Gly Pro Thr Tyr Cys Gly Thr Gly Val Ala Thr 420 425 430 Asn Gly Ala His Ser Gly Ala Ser Ala Leu Thr Ile Ala Thr Pro Thr 435 440 445 Gly Glu Gly Thr Ala Thr Ser Lys Thr Tyr Thr Arg Arg Arg Arg Leu 450 455 460 Asn Ser Pro Glu Gly Phe Ser Leu Arg Thr Trp Glu Ala 465 470 475 <210> 3 <211> 462 <212> PRT <213> Clostridium phytofermentans <400> 3 Met Thr Val Asn Glu Gln Leu Val Gln Asp Ile Ile Lys Asn Val Val 1 5 10 15 Ala Ser Met Gln Leu Thr Gln Thr Asn Lys Thr Glu Leu Gly Val Phe 20 25 30 Asp Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Gln Leu Val 35 40 45 Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Ala Ile 50 55 60 Arg Lys Lys Thr Ile Glu His Ala Glu Thr Leu Ala Arg Met Ala Val 65 70 75 80 Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Ile 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Asn Phe Ala Val Gln Leu Ile 165 170 175 Asn Glu Ala Ser Leu Ser Ala Gly Gly Pro Val Asn Ile Ala Cys Ser 180 185 190 Val Arg Lys Pro Thr Leu Asp Ser Ser Lys Ile Met Met Ser His Gln 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Gln Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Ile Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Val Val Ala Ile Asp Ala Ile Ala Asn Glu Leu Met Asn Tyr 275 280 285 Met Val Lys Glu Gln Gly Cys Tyr Ala Ile Thr Lys Glu Gln Gln Glu 290 295 300 Lys Leu Thr Asn Leu Val Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys 305 310 315 320 Val Gly Lys Asp Ala Arg Thr Leu Leu Gly Met Ile Gly Ile Asp Val 325 330 335 Pro Ser Asn Ile Arg Cys Ile Ile Phe Glu Gly Glu Lys Glu His Pro 340 345 350 Leu Ile Ser Glu Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala 355 360 365 Lys Ser Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr 385 390 395 400 Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro 405 410 415 Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg 450 455 460 <210> 4 <211> 468 <212> PRT <213> Artificial Sequence <220> <223> source: /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 4 Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Ser Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Arg Asp Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Val Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys 340 345 350 Cys Ile Ile Thr Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn His Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Pro Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Ile 450 455 460 Val Leu Val Gly 465 <210> 5 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> source: /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (2) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (11) <223> Any amino acid <400> 5 Ile Xaa Pro Lys Gly Xaa Xaa Asn Arg Lys Xaa Val Gly Lys Asp 1 5 10 15 <210> 6 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> source: /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (5) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (13) <223> Any amino acid <400> 6 Ser Tyr Ala Gly Xaa Gly Xaa Xaa Xaa Glu Gly Phe Xaa Thr Phe Thr 1 5 10 15 Ile Ala <210> 7 <211> 468 <212> PRT <213> Clostridium saccharoperbutylacetonicum <400> 7 Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Ser Ala Arg His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 8 <211> 386 <212> PRT <213> Roseburia inulinivorans <400> 8 Met Gly Val Asn Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu 1 5 10 15 Lys His His Leu Thr Ala Asp Lys Val Pro Gly Thr Glu Asp Ile Ser 20 25 30 Thr Ile Ala Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly 35 40 45 Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Ala Thr Asn Pro Ser Glu 50 55 60 Thr Val Ile Cys Asn Cys Ile Gly Met Leu Ala Gly Gly Asn Thr Val 65 70 75 80 Val Phe Asn Pro His Pro Asn Ala Lys Lys Thr Thr Ile Tyr Thr Ile 85 90 95 Asn Met Ile Asn Glu Ala Ser Ile Glu Ala Gly Gly Pro Asp Asn Ile 100 105 110 Ala Val Thr Val Glu Ala Pro Thr Leu Asp Thr Ser Ala Ile Met Met 115 120 125 Lys His Pro Ser Ile His Leu Leu Val Ala Thr Gly Gly Pro Gly Val 130 135 140 Val Thr Ala Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala 145 150 155 160 Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala 165 170 175 Ala Gln Asp Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys 180 185 190 Ile Ala Glu Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu 195 200 205 Met Asn Tyr Met Ile Ser Glu Asn Gly Cys Tyr Leu Ala Ser Lys Glu 210 215 220 Ile Gln Asp Lys Leu Val Gln Thr Val Phe Thr Pro Lys Gly Ala Leu 225 230 235 240 Asn Arg Lys Cys Val Gly Arg Ser Ala Gln Thr Leu Leu Ala Met Val 245 250 255 Gly Val Asn Val Gly Pro Glu Ile Arg Cys Ile Val Phe Glu Gly Gln 260 265 270 Lys Glu His Pro Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly 275 280 285 Met Val Arg Val Lys Ser Phe Glu Glu Gly Val Glu Thr Ala Val Trp 290 295 300 Leu Glu His Gly Asn Arg His Ser Ala His Ile His Ser Lys Asn Val 305 310 315 320 Asp His Ile Thr Thr Tyr Ala Arg Ala Leu Asp Thr Ala Ile Leu Val 325 330 335 Lys Asn Gly Pro Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr 340 345 350 Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ala Ala 355 360 365 His Ser Phe Thr Lys Ser Arg Arg Cys Thr Met Ser Asp Ser Leu Cys 370 375 380 Ile Arg 385 <210> 9 <211> 467 <212> PRT <213> Bacillus sp. <400> 9 Met Asn Pro Ala Glu Leu Pro His Gln Val His Glu Ser Gly Ala Asn 1 5 10 15 Gly Val Phe Asp Arg Ile Glu Asp Ala Ile Glu Ala Gly Tyr Ile Ala 20 25 30 Gln Leu Asn Tyr Val Lys Gln Phe Gln Leu Lys Asp Arg Glu Lys Ile 35 40 45 Ile Thr Ala Ile Arg Glu Ala Val Ile Glu Asn Lys Glu Lys Leu Ala 50 55 60 Gln Met Val Phe Glu Glu Thr Lys Leu Gly Arg Tyr Glu Asp Lys Ile 65 70 75 80 Ala Lys His Glu Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Ile 85 90 95 Thr Thr Ala Ala Phe Ser Gly Asp Glu Gly Leu Thr Ile Ile Glu Gln 100 105 110 Ala Pro Phe Gly Leu Val Gly Ala Val Thr Pro Val Thr Asn Pro Thr 115 120 125 Glu Thr Ile Ile Asn Asn Ser Ile Ser Leu Leu Ala Ala Gly Asn Ala 130 135 140 Val Val Leu Asn Val His Pro Ser Ser Lys Ala Ser Cys Ala Phe Val 145 150 155 160 Val Asn Leu Ile Asn Gln Ala Ile Lys Asp Thr Gly Gly Pro Glu Asn 165 170 175 Leu Val Ser Met Val Lys Asp Pro Thr Leu Glu Thr Leu Asn Arg Ile 180 185 190 Ile Glu Ser Pro Lys Val Lys Leu Leu Val Gly Thr Gly Gly Leu Gly 195 200 205 Met Val Lys Thr Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly 210 215 220 Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Lys Gln 225 230 235 240 Ala Ala Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn Leu Leu 245 250 255 Cys Ile Ala Glu Lys Glu Leu Phe Val Ile Asp Ser Val Ala Asp Asp 260 265 270 Leu Ile Phe His Met Leu Asn Glu Gly Ala Tyr Met Leu Asp Gln Gln 275 280 285 Gln Leu Ser Lys Leu Met Ser Phe Ala Leu Glu Glu Asn Val His Gln 290 295 300 Glu Ala Gly Gly Cys Ser Leu Asp Asn Lys Arg Glu Tyr His Val Ser 305 310 315 320 Lys Asp Trp Val Gly Lys Asp Ala Val Ser Phe Leu Arg Gln Leu Gly 325 330 335 Ile Ala His Glu Glu Asp Ile Lys Leu Leu Ile Cys Glu Val Asp Phe 340 345 350 Asp His Pro Phe Val Gln Leu Glu Gln Met Met Pro Val Phe Pro Ile 355 360 365 Val Arg Val Gly Asn Leu Asp Glu Ala Ile Glu Met Ala Leu Leu Ala 370 375 380 Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp 385 390 395 400 His Leu Thr Lys Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys 405 410 415 Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr 420 425 430 Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Ala Lys 435 440 445 Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg 450 455 460 Ile Ile Gly 465 <210> 10 <211> 467 <212> PRT <213> Bacillus solani <400> 10 Met Asn Pro Ala Glu Leu Pro His Gln Val His Glu Ser Gly Ala Asn 1 5 10 15 Gly Val Phe Asp Arg Ile Glu Asp Ala Ile Glu Ala Gly Tyr Ile Ala 20 25 30 Gln Leu Asn Tyr Val Lys Gln Phe Gln Leu Lys Asp Arg Glu Lys Ile 35 40 45 Ile Thr Ala Ile Arg Glu Ala Val Ile Glu Asn Lys Glu Lys Leu Ala 50 55 60 Gln Met Val Phe Glu Glu Thr Lys Leu Gly Arg Tyr Glu Asp Lys Ile 65 70 75 80 Ala Lys His Glu Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Ile 85 90 95 Thr Thr Ala Ala Phe Ser Gly Asp Glu Gly Leu Thr Ile Ile Glu Gln 100 105 110 Ala Pro Phe Gly Leu Val Gly Ala Val Thr Pro Val Thr Asn Pro Thr 115 120 125 Glu Thr Ile Ile Asn Asn Ser Ile Ser Leu Leu Ala Ala Gly Asn Ala 130 135 140 Val Val Leu Asn Val His Pro Ser Ser Lys Val Ser Cys Ala Phe Val 145 150 155 160 Val Asn Leu Ile Asn Gln Ala Ile Lys Asp Thr Gly Gly Pro Glu Asn 165 170 175 Leu Val Ser Met Val Lys Asp Pro Thr Leu Glu Thr Leu Asn Arg Ile 180 185 190 Ile Glu Ser Pro Lys Val Lys Leu Leu Val Gly Thr Gly Gly Pro Gly 195 200 205 Met Val Lys Thr Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly 210 215 220 Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Lys Gln 225 230 235 240 Ala Ala Lys Ser Ile Ile Glu Gly Ala Ser Phe Asp Asn Asn Leu Leu 245 250 255 Cys Ile Ala Glu Lys Glu Leu Phe Val Ile Asp Ser Val Ala Asp Asp 260 265 270 Leu Ile Phe His Met Leu Asn Glu Gly Ala Tyr Met Leu Asp Gln Gln 275 280 285 Gln Leu Ser Lys Leu Met Ser Phe Ala Leu Glu Glu Asn Val His Gln 290 295 300 Glu Ala Gly Gly Cys Ser Leu Asp Asn Lys Arg Glu Tyr His Val Ser 305 310 315 320 Lys Asp Trp Val Gly Lys Asp Ala Val Ser Phe Leu Arg Gln Leu Gly 325 330 335 Ile Ala His Glu Glu Asp Ile Lys Leu Leu Ile Cys Glu Val Asp Phe 340 345 350 Asp His Pro Phe Val Gln Leu Glu Gln Met Met Pro Val Phe Pro Ile 355 360 365 Val Arg Val Gly Asn Leu Asp Glu Ala Ile Glu Met Ala Leu Leu Ala 370 375 380 Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp 385 390 395 400 His Leu Thr Lys Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys 405 410 415 Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr 420 425 430 Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Ala Lys 435 440 445 Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg 450 455 460 Ile Ile Gly 465 <210> 11 <211> 473 <212> PRT <213> Terrisporobacter othiniensis <400> 11 Met Asp Ile Asp Val Lys Leu Ile Glu Lys Met Val Ser Asp Ala Leu 1 5 10 15 Lys Glu Ile Lys Ile Glu Asn Ile Thr Gln Glu Val Glu Lys Asn Ser 20 25 30 Ile Glu Asp Asn Tyr Gly Val Phe Lys Thr Ile Glu Gly Ala Ile Asp 35 40 45 Ala Ser Tyr Val Ala Gln Lys Glu Leu Leu Phe Ser Lys Ile Ser Asp 50 55 60 Arg Gln Lys Tyr Val Asp Ala Ile Arg Ser Ala Ile Leu Asn Gln Glu 65 70 75 80 Asn Leu Glu Leu Ile Ser Lys Leu Ala Val Asp Glu Thr Glu Ile Gly 85 90 95 Cys Tyr Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr 100 105 110 Pro Gly Thr Glu Asp Leu Ile Ser Ser Val Lys Thr Gly Asp Asp Gly 115 120 125 Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr 130 135 140 Pro Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met 145 150 155 160 Ile Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Thr 165 170 175 Lys Val Ser Gln Thr Ile Ile Lys Ile Leu Asn Lys Ala Leu Glu Glu 180 185 190 Val Gly Ala Pro Lys Asn Leu Ile Thr Met Val Glu Lys Pro Ser Ile 195 200 205 Glu Asn Thr Asn Lys Met Ile Glu Asn Pro Lys Val Arg Phe Leu Val 210 215 220 Ala Thr Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys 225 230 235 240 Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu 245 250 255 Thr Ala Asp Ile Arg Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser 260 265 270 Phe Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val 275 280 285 Ala Ser Ile Cys Asp Ser Leu Ile Glu Asn Met Lys Leu Asn Gly Ala 290 295 300 Tyr Leu Val Lys Asp Lys Lys Val Ile Glu Gln Leu Leu Ser Val Val 305 310 315 320 Ala Lys Glu Asn Gly Ala Pro Lys Thr Asn Phe Val Gly Lys Ser Ala 325 330 335 Lys Tyr Ile Leu Asp Lys Ile Gly Val Thr Val Asp Asp Asn Ile Lys 340 345 350 Ala Ile Ile Met Glu Val Asp Lys Asp His Thr Phe Val Gln Glu Glu 355 360 365 Met Met Met Pro Ile Leu Pro Ile Val Arg Val Glu Asp Val Asp Lys 370 375 380 Ala Ile Glu Tyr Ala Gln Glu Ala Glu His Gly Asn Arg His Thr Ala 385 390 395 400 Ile Met His Ser Lys Asn Ile Asp Lys Leu Ser Lys Met Ser Lys Ile 405 410 415 Met Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile 420 425 430 Gly Val Gly Gly Glu Gly His Ser Thr Phe Thr Ile Ala Gly Pro Thr 435 440 445 Gly Glu Gly Leu Thr Ser Pro Lys Ser Phe Cys Arg Ile Arg Arg Cys 450 455 460 Val Val Ser Asp Ser Phe Ser Ile Arg 465 470 <210> 12 <211> 457 <212> PRT <213> Roseburia inulinivorans <400> 12 Met Val His Asp Ile Val Gln Lys Val Met Ala Asn Met Gln Ile Ser 1 5 10 15 Gly Ser Val Ser Gly Met His Gly Val Phe Lys Asp Met Asn Asp Ala 20 25 30 Ile Asn Ala Ser Ile Glu Ala Gln Lys Lys Val Cys Thr Met Thr Leu 35 40 45 Asp Gln Arg Glu Gln Ile Ile Ser Leu Ile Arg Lys Lys Thr His Glu 50 55 60 Asn Ala Glu Ile Leu Ala Asn Met Gly Val Asn Glu Thr Gly Met Gly 65 70 75 80 Asn Val Gly Asp Lys Ile Leu Lys His His Leu Thr Ala Asp Lys Val 85 90 95 Pro Gly Thr Glu Asp Ile Ser Thr Ile Ala Trp Ser Gly Asp Arg Gly 100 105 110 Leu Thr Leu Val Glu Met Gly Pro Phe Gly Val Ile Gly Ala Ile Thr 115 120 125 Pro Ala Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Cys Ile Gly Met 130 135 140 Leu Ala Gly Gly Asn Thr Val Val Phe Asn Pro His Pro Asn Ala Lys 145 150 155 160 Lys Thr Thr Ile Tyr Thr Ile Asn Met Ile Asn Glu Ala Ser Ile Glu 165 170 175 Ala Gly Gly Pro Asp Asn Ile Ala Val Thr Val Glu Ala Pro Thr Leu 180 185 190 Asp Thr Ser Ala Ile Met Met Lys His Pro Ser Ile His Leu Leu Val 195 200 205 Ala Thr Gly Gly Pro Gly Val Val Thr Ala Val Leu Ser Ser Gly Lys 210 215 220 Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu 225 230 235 240 Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp Ile Val Asn Gly Cys Thr 245 250 255 Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Ile Val Ala Val 260 265 270 Asp Ser Val Ala Asp Glu Leu Met Asn Tyr Met Ile Ser Glu Asn Gly 275 280 285 Cys Tyr Leu Ala Ser Lys Glu Ile Gln Asp Lys Leu Val Gln Thr Val 290 295 300 Phe Thr Pro Lys Gly Ala Leu Asn Arg Lys Cys Val Gly Arg Ser Ala 305 310 315 320 Gln Thr Leu Leu Ala Met Val Gly Val Asn Val Gly Pro Glu Ile Arg 325 330 335 Cys Ile Val Phe Glu Gly Gln Lys Glu His Pro Leu Ile Ala Glu Glu 340 345 350 Leu Met Met Pro Ile Leu Gly Met Val Arg Val Lys Ser Phe Glu Glu 355 360 365 Gly Val Glu Thr Ala Val Trp Leu Glu His Gly Asn Arg His Ser Ala 370 375 380 His Ile His Ser Lys Asn Val Asp His Ile Thr Thr Tyr Ala Arg Ala 385 390 395 400 Leu Asp Thr Ala Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Ala Leu 405 410 415 Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr 420 425 430 Gly Glu Gly Leu Thr Ala Ala His Ser Phe Thr Lys Ser Arg Arg Cys 435 440 445 Thr Met Ser Asp Ser Leu Cys Ile Arg 450 455 <210> 13 <211> 462 <212> PRT <213> Clostridium sp. <400> 13 Met Ser Val Asn Glu Arg Met Val Gln Asp Ile Val Gln Glu Val Val 1 5 10 15 Ala Lys Met Gln Ile Ala Ser Asp Val Thr Gly Asn His Gly Val Phe 20 25 30 Gln Asp Met Asn Ala Ala Ile Glu Ala Ala Lys Lys Thr Gln Lys Val 35 40 45 Val Ala Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile 50 55 60 Arg Ala Lys Ile Lys Glu His Ala Glu Ile Phe Ala Arg Met Gly Val 65 70 75 80 Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Gln Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Ile 165 170 175 Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr 180 185 190 Val Glu Asn Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr 275 280 285 Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp 290 295 300 Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val 325 330 335 Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg 450 455 460 <210> 14 <211> 509 <212> PRT <213> Bacillus selenitireducens <400> 14 Met Ser Ile Ser Glu Asp Met Leu Lys Gln Ile Val Lys Ser Val Met 1 5 10 15 Asn Asn Val Glu Lys Glu Leu Gly Glu Ser Pro Lys Pro Gln Pro Arg 20 25 30 Thr Ile Pro Val Thr Val Leu Asn Glu Val Thr Pro Val Lys Glu Ser 35 40 45 Arg Asp Pro Ser Pro Val His Gln His Val Leu Gly Val Phe Pro Asp 50 55 60 Val Asp Gln Ala Val His Ala Ala Ala Gly Ser Gln Lys Glu Trp Val 65 70 75 80 Lys Arg Pro Val Ser Glu Arg Arg Val Ile Leu Glu Ala Met Lys Gln 85 90 95 Thr Val Asp Ser Gln Lys Glu Arg Tyr Ser Glu Leu Ala Val Glu Glu 100 105 110 Thr Gly Leu Gly Asn Val Ala Asp Lys Ile Ala Lys His Glu Leu Ile 115 120 125 Ile Thr Lys Thr Pro Gly Val Glu Asp Leu Arg Thr Asp Ala Val Ser 130 135 140 Gly Asp His Gly Leu Thr Ile Glu Glu Asp Ala Pro Phe Gly Val Ile 145 150 155 160 Gly Ala Val Thr Pro Val Thr Asn Pro Thr Thr Thr Val Ile His Asn 165 170 175 Ser Leu Val Met Leu Ala Ala Gly Asn Ala Val Val Phe Asn Val His 180 185 190 Pro Ser Ser Lys Ala Thr Cys Gln Arg Val Val Ser Asp Leu Asn Ala 195 200 205 Ala Ile Lys Asp Ala Gly Gly Pro Gln Asn Leu Ile Thr Met Ile Ala 210 215 220 Glu Pro Thr Leu Asp Thr Leu Asn Gln Leu Ala Gly His Gln Glu Ile 225 230 235 240 Arg Leu Leu Val Gly Thr Gly Gly Gln Gly Leu Val Arg Ser Leu Leu 245 250 255 Gln Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val 260 265 270 Ile Val Asp Glu Thr Ala Asp Ile Glu Ala Ala Ala Lys Ala Ile Ile 275 280 285 Leu Gly Ala Ser Phe Asp Asn Asn Ile Leu Cys Ile Ala Glu Lys Glu 290 295 300 Val Phe Ala Leu Asp Val Ile Tyr Asp Asp Leu Ile Tyr His Leu Leu 305 310 315 320 Gln Glu Gly Ala Tyr Met Leu Ser Glu Ser Glu Leu Ser Gln Val Met 325 330 335 Lys Thr Val Leu Val Gly Asp Ala Pro Ile Glu Ala Ala Lys Ser Cys 340 345 350 Ser Val Ser Val Arg Pro Asp Leu His Ile Ala Lys Ala Trp Val Gly 355 360 365 Lys Glu Ala Ser Ala Ile Leu Lys Ala Ala Thr Gly Lys Asp Leu Pro 370 375 380 Val Lys Leu Leu Ile Cys Asp Val Glu Ala Thr His Pro Phe Val Gln 385 390 395 400 Leu Glu Gln Met Met Pro Val Leu Pro Ile Val Arg Met Pro Asp Phe 405 410 415 Asp Ala Ala Val Glu Ala Ala Val Lys Ala Glu Lys Gly Asn Arg His 420 425 430 Thr Ala Val Ile His Ser Lys Asn Val Asp Arg Leu Thr Gln Phe Ala 435 440 445 Arg Arg Ile Glu Thr Thr Ile Phe Val Lys Asn Ala Ser Ser Leu Ala 450 455 460 Gly Val Gly Phe Gly Gly Glu Gly Tyr Ala Thr Met Thr Ile Ala Gly 465 470 475 480 Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Thr Phe Thr Arg Lys Arg 485 490 495 Arg Cys Val Leu Ala Glu Gly Gly Phe Arg Ile Ile Gly 500 505 <210> 15 <211> 462 <212> PRT <213> Blautia obeum <400> 15 Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met 1 5 10 15 Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe 20 25 30 Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Glu Leu Ile 35 40 45 Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile 50 55 60 Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val 65 70 75 80 Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His 85 90 95 Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu 130 135 140 Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val 165 170 175 Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr 180 185 190 Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr 275 280 285 Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp 290 295 300 Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala 325 330 335 Pro Ala Asn Ile Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg 450 455 460 <210> 16 <211> 478 <212> PRT <213> Clostridium bolteae <400> 16 Met Lys Glu Gly Val Ile Arg Leu Asp Met Asp Ile Lys Val Ile Glu 1 5 10 15 Gln Leu Val Glu Gln Ala Leu Lys Glu Ile Lys Ala Glu Gln Pro Leu 20 25 30 Lys Phe Thr Ala Pro Lys Leu Glu Arg Tyr Gly Val Phe Lys Thr Met 35 40 45 Asp Glu Ala Ile Ala Ala Ser Glu Glu Ala Gln Lys Lys Leu Leu Phe 50 55 60 Ser Lys Ile Ser Asp Arg Gln Lys Tyr Val Asp Val Ile Arg Ser Thr 65 70 75 80 Ile Ile Lys Arg Glu Asn Leu Glu Leu Ile Ser Arg Leu Ser Val Glu 85 90 95 Glu Thr Glu Ile Gly Asp Tyr Glu His Lys Leu Ile Lys Asn Arg Leu 100 105 110 Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Leu Thr Glu Ala Ile 115 120 125 Thr Gly Asp Asn Gly Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val 130 135 140 Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile Ile Asn 145 150 155 160 Asn Ser Ile Ser Met Ile Ala Gly Gly Asn Thr Val Val Phe Ser Pro 165 170 175 His Pro Arg Ala Lys Lys Val Ser Gln Met Thr Val Lys Met Leu Asn 180 185 190 Lys Ala Leu Ile Asp Asn Gly Ala Pro Pro Asn Leu Ile Thr Met Val 195 200 205 Glu Glu Pro Ser Ile Glu Asn Thr Asn Lys Met Ile Asp Asn Pro Ser 210 215 220 Val Arg Leu Leu Val Ala Thr Gly Gly Pro Ser Ile Val Lys Lys Val 225 230 235 240 Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro 245 250 255 Val Val Val Asp Glu Thr Ala Asp Ile Asp Lys Ala Ala Lys Asp Ile 260 265 270 Val Asp Gly Cys Ser Phe Asp Asn Asn Val Pro Cys Ile Ala Glu Lys 275 280 285 Glu Val Phe Ala Val Asp Ser Ile Cys Asp Tyr Leu Ile His His Met 290 295 300 Lys Glu Asn Gly Ala Tyr Gln Ile Thr Asp Pro Met Leu Leu Glu Gln 305 310 315 320 Leu Val Ala Leu Val Thr Thr Glu Lys Gly Gly Pro Lys Thr Ser Phe 325 330 335 Val Gly Lys Ser Ala Arg Tyr Ile Leu Asp Lys Leu Gly Ile Thr Val 340 345 350 Asp Ala Ser Val Arg Val Ile Ile Met Glu Val Pro Lys Asp His Leu 355 360 365 Leu Val Gln Glu Glu Met Met Met Pro Ile Leu Pro Val Val Arg Val 370 375 380 Ser Asp Val Asp Thr Ala Ile Glu Tyr Ala His Gln Ala Glu His Gly 385 390 395 400 Asn Arg His Thr Ala Met Met His Ser Lys Asn Val Glu Lys Leu Ser 405 410 415 Lys Met Ala Lys Ile Met Glu Thr Thr Ile Phe Val Lys Asn Ala Pro 420 425 430 Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Thr Thr Phe Thr 435 440 445 Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro Arg Thr Phe Cys 450 455 460 Arg Lys Arg Lys Cys Val Met Thr Asp Ala Phe Ser Ile Arg 465 470 475 <210> 17 <211> 515 <212> PRT <213> Jeotgalibacillus alimentarius <400> 17 Met Ser Ile Ser Glu Glu Thr Leu Gln Gln Ile Ile Lys Ser Val Val 1 5 10 15 Thr Gln Val Glu Ser Glu Leu Gly His Lys His Ser Ala Pro Ala Thr 20 25 30 Gly Ser Gln Ser Ala Thr Pro Val Ala Pro Val Lys Met Lys Ala Val 35 40 45 Thr Asn Lys Pro Val Phe Lys Glu His Thr Tyr Arg Ser Ser Gly Glu 50 55 60 Gly Ile Tyr Thr Thr Val Asp Glu Ala Val Ser Arg Ser Ala Ala Ala 65 70 75 80 Gln Lys Lys Tyr Val Lys His Phe Thr Met Asn Asp Arg Val Thr Val 85 90 95 Leu Asn Ala Ile Lys Gln Thr Val Leu Ser Ser Lys Asp Thr Leu Ser 100 105 110 Lys Met Ala Val Glu Glu Thr Gly Ile Gly Cys Tyr Glu Asp Lys Ile 115 120 125 Gln Lys His Glu Leu Val Cys Lys Lys Thr Pro Gly Ile Glu Asp Leu 130 135 140 Lys Thr Glu Ala Met Ser Gly Asp Asp Gly Leu Thr Ile Ile Glu Glu 145 150 155 160 Ala Pro Phe Gly Val Ile Gly Ala Val Thr Pro Val Thr Asn Pro Thr 165 170 175 Thr Thr Ile Ile Asn Asn Ser Leu Ser Met Leu Ala Ala Gly Asn Thr 180 185 190 Val Val Phe Asn Val His Pro Ser Ser Lys Lys Val Cys Ser Tyr Leu 195 200 205 Ile Arg Glu Leu His Gln Ser Ile Val Gln Ala Gly Gly Pro Ala Asp 210 215 220 Leu Ile Thr Met Val Ala Asp Pro Thr Leu Asp Thr Leu Asn Glu Leu 225 230 235 240 Ala Ala His Pro Asp Ile Arg Leu Leu Val Gly Thr Gly Gly Pro Gly 245 250 255 Leu Val Lys Ser Leu Leu Gln Ser Gly Lys Lys Ala Ile Gly Ala Gly 260 265 270 Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Leu Val Asn 275 280 285 Ala Ala Lys Ser Ile Ile Leu Gly Ala Ser Phe Asp His Asn Leu Leu 290 295 300 Cys Ile Ala Glu Lys Glu Val Phe Val Leu Glu Glu Ala Ala Asn Glu 305 310 315 320 Leu Ile Tyr Gln Met Leu Asp Gln Gly Ala Tyr Met Leu Asn Asn Glu 325 330 335 Glu Leu Ser Arg Val Met Ser Leu Val Leu Thr Glu Asp Ser Ser Ser 340 345 350 Pro Val Ala Gly Gly Cys Thr Gly Lys Pro Ser Lys Lys Tyr His Val 355 360 365 Lys Lys Glu Trp Ile Gly Gln Ser Ala Ala Ala Ile Ala Arg Ala Ala 370 375 380 Gly Ile Asn Lys Glu Asn Ile Lys Leu Leu Ile Cys Glu Thr Asp Pro 385 390 395 400 Asp His Pro Phe Val Val Leu Glu Gln Met Met Pro Val Leu Pro Ile 405 410 415 Val Lys Thr Gln Ser Phe Glu Glu Ala Val Glu Trp Ala Val Ala Ala 420 425 430 Glu Lys Gly Asn Arg His Thr Ala Val Ile His Ser Thr Asn Val Asp 435 440 445 Arg Met Thr Ala Phe Ala Arg Ala Ile Glu Thr Thr Ile Phe Val Lys 450 455 460 Asn Ala Ser Ser Leu Ala Gly Val Gly Phe Gly Gly Glu Gly His Thr 465 470 475 480 Thr Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Val Thr Ser Ala Arg 485 490 495 Ser Phe Thr Arg Lys Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg 500 505 510 Ile Ile Gly 515 <210> 18 <211> 470 <212> PRT <213> Clostridium hiranonis <400> 18 Met Lys Met Glu Leu Asp Leu Ile Gln Glu Met Ile Lys Gln Val Leu 1 5 10 15 Glu Glu Ile Lys Glu Glu Gly Val Glu Val Ser Ser Lys Glu Glu Tyr 20 25 30 Gly Tyr Gly Val Phe Asp Ser Met Val Glu Ala Ile Asp Ala Ser Glu 35 40 45 Lys Ala Gln Lys Glu Leu Phe Glu Cys Ser Val Gln Gln Arg Asp Lys 50 55 60 Phe Val Asp Ala Ile Arg Ala Glu Ile Leu Lys Lys Glu Asn Leu Glu 65 70 75 80 Met Ile Ser Tyr Asp Ala Val Glu Glu Thr Lys Ile Gly Arg Val Glu 85 90 95 Asp Lys Ile Ile Lys Asn Arg Val Ala Ala Glu Asn Thr Pro Gly Thr 100 105 110 Glu Asp Leu Lys Thr Arg Ala Ile Thr Gly Glu Asp Gly Leu Thr Ile 115 120 125 Glu Glu Tyr Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr 130 135 140 Asn Pro Thr Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Ala Gly 145 150 155 160 Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val Ser 165 170 175 Ile Lys Leu Val Lys Met Met Asn Lys Ala Leu Glu Glu Ala Gly Ala 180 185 190 Pro Arg Asn Leu Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Ser 195 200 205 Lys Ile Met Met Glu Ser Pro Lys Val Arg Leu Leu Val Ala Thr Gly 210 215 220 Gly Pro Ala Ile Val Lys Gln Val Leu Ser Ala Gly Lys Lys Ala Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp 245 250 255 Ile Glu Lys Ala Ala Lys Asp Ile Val Ser Gly Ala Ser Phe Asp Asn 260 265 270 Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Val 275 280 285 Val Asp Gln Leu Ile Tyr Tyr Met Lys Lys Asn Gly Ala Tyr Glu Ile 290 295 300 Thr Ser Pro Glu Val Leu Glu Gln Leu Asp Lys Ala Val Ser Lys Glu 305 310 315 320 Asn Gly Lys Pro Asn Pro Ser Leu Val Gly Lys Ser Ala Lys Glu Leu 325 330 335 Leu Ala Leu Val Gly Ile Asn Val Asp Asp Asp Val Lys Leu Val Ile 340 345 350 Ala Arg Thr Asn Lys Asp His His Leu Val Thr Glu Glu Met Leu Met 355 360 365 Pro Ile Leu Pro Ile Val Ser Val Ser Asp Val Asp Thr Ala Ile Asp 370 375 380 Trp Ala Tyr Glu Ala Glu Ala Gly Asn Arg His Thr Ala Ile Met His 385 390 395 400 Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Lys Lys Leu Glu Ala 405 410 415 Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly 420 425 430 Gly Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly 435 440 445 Ile Thr Ser Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met Ser 450 455 460 Glu Ala Leu Ser Ile Arg 465 470 <210> 19 <211> 466 <212> PRT <213> Thermoanaerobacter sp. <400> 19 Met Ile Asp Glu Asn Leu Val Val Thr Ile Thr Lys Lys Ile Leu Asn 1 5 10 15 Glu Ile Asn Leu Lys Glu Ala Glu Glu Lys Lys Glu Lys Asp Asn Pro 20 25 30 Asp Leu Gly Ile Phe Asn Asp Val Asn Glu Ala Val Glu Cys Ala Lys 35 40 45 Glu Ala Gln Lys Lys Phe Ala Leu Met Asp Leu Glu Lys Arg Glu Glu 50 55 60 Ile Ile Ala Ala Ile Arg Glu Ala Cys Val Asn Asn Ala Arg Leu Leu 65 70 75 80 Ala Glu Ile Ala Cys Ser Glu Thr Gly Arg Gly Arg Val Glu Asp Lys 85 90 95 Val Ala Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp 100 105 110 Leu Lys Pro Thr Ala Trp Thr Gly Asp Arg Gly Leu Thr Leu Val Glu 115 120 125 Met Ala Pro Val Gly Val Ile Ala Ser Ile Thr Pro Val Thr Asn Pro 130 135 140 Thr Ala Thr Ile Ile Asn Asn Thr Ile Ser Met Leu Ala Ala Gly Asn 145 150 155 160 Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Lys Thr Ser Asn Lys 165 170 175 Ala Val Glu Ile Ile Asn Glu Ala Ile Leu Lys Val Gly Ala Pro Asn 180 185 190 Gly Leu Val Cys Ser Ile Asn Asn Pro Thr Ile Gln Thr Ala Gln Lys 195 200 205 Leu Met Glu His Pro Glu Val Asn Met Val Val Val Thr Gly Gly Lys 210 215 220 Ala Val Val Gln Thr Ala Leu Arg Cys Gly Lys Lys Val Ile Gly Ala 225 230 235 240 Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val 245 250 255 Lys Ala Ala His Asp Ile Ala Cys Gly Ala Ser Phe Asp Asn Asn Leu 260 265 270 Pro Cys Ile Ala Glu Lys Glu Ile Ile Ala Val Glu Arg Ile Ala Asp 275 280 285 Thr Leu Leu Glu Arg Met Lys Arg Glu Gly Ala Tyr Val Leu His Gly 290 295 300 Lys Asp Ile Asp Arg Met Thr Glu Leu Ile Phe Gln Gly Gly Ala Ile 305 310 315 320 Asn Lys Asp Leu Ile Gly Arg Asp Ala His Phe Ile Leu Ser Gln Ile 325 330 335 Gly Ile Glu Thr Gly Lys Asp Ile Arg Leu Val Val Met Pro Val Asp 340 345 350 Val Ser His Pro Leu Val Tyr His Glu Gln Leu Met Pro Val Ile Pro 355 360 365 Phe Val Thr Val Pro Thr Val Glu Glu Ala Ile Asn Leu Ala Val Lys 370 375 380 Ala Glu Gly Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val 385 390 395 400 Glu Asn Met Thr Ala Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe Val 405 410 415 Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr 420 425 430 Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala 435 440 445 Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Arg 450 455 460 Ile Val 465 <210> 20 <211> 462 <212> PRT <213> Clostridiales sp. <400> 20 Met Pro Ile Asn Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met 1 5 10 15 Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe 20 25 30 Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Gln Leu Ile 35 40 45 Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile 50 55 60 Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val 65 70 75 80 Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His 85 90 95 Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Val Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu 130 135 140 Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu 165 170 175 Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr 180 185 190 Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Val Met Met Lys His Lys 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Thr Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Ser Ser Ile Val Asp Glu Leu Met His Tyr 275 280 285 Leu Val Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp 290 295 300 Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala 325 330 335 Pro Ala Asn Ile Arg Cys Ile Val Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro 405 410 415 Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Cys Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Ala Asp Ser Leu Cys Ile Arg 450 455 460 <210> 21 <211> 468 <212> PRT <213> Sebaldella termitidis <400> 21 Met Leu Asp Gly Leu Gln Leu Glu Asp Ile Ile Lys Lys Val Ile Asn 1 5 10 15 Asp Val Lys Asn Glu Lys Asp Ile Asn Ile Thr Asn Lys Glu Asn Ser 20 25 30 Cys Gly His Gly Ile Phe Thr Asn Ile Glu Thr Ala Val Asp Lys Ala 35 40 45 Tyr Glu Ala Gln Gln Thr Tyr Asn Ser Arg Ser Leu Glu Glu Arg Arg 50 55 60 Asn Ile Ile Ser Asn Ile Arg Lys Glu Leu Leu Lys Tyr Thr Glu Glu 65 70 75 80 Met Ala Glu Lys Thr Val Ala Glu Thr Lys Met Gly Arg Ile Lys Asp 85 90 95 Lys Ile Leu Lys Asn Lys Leu Ala Ile Glu Lys Thr Pro Gly Val Glu 100 105 110 Asp Leu Gly Thr Glu Val Phe Thr Gly Asp Asp Gly Leu Thr Leu Val 115 120 125 Glu Leu Ser Ala Phe Gly Val Leu Gly Ser Val Thr Pro Val Thr Asn 130 135 140 Pro Thr Glu Thr Ile Ile Asn Asn Thr Ile Gly Ala Leu Ala Gly Gly 145 150 155 160 Asn Ser Ile Val Phe Cys Pro His Pro Ser Ala Lys Asn Ile Cys Leu 165 170 175 Trp Leu Ile Lys Lys Leu Asn Gly Ile Ile Thr Glu Ala Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Ser Ala Ser Glu Ala Lys Lys Glu Asn Val Asp 195 200 205 Ile Leu Phe Ser His Glu Lys Ile Asn Met Leu Val Ile Thr Gly Gly 210 215 220 Thr Glu Ile Val Lys Leu Ala Leu Lys Ser Gly Lys Lys Val Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile 245 250 255 Glu Lys Ala Ala Lys Asp Ile Val Asn Gly Ala Gly Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Leu Val Leu Glu Ser Val Ala 275 280 285 Asp Tyr Leu Ile Phe Asn Met Glu Lys Ala Gly Ala Phe His Ile Thr 290 295 300 Asp Lys Glu Asp Ile Lys Lys Leu Glu Asp Thr Val Tyr Lys Asn Gly 305 310 315 320 Met Val Asn Lys Glu Phe Ile Gly Lys Asp Ala Gly Phe Ile Leu Glu 325 330 335 Lys Ser Gly Ile Lys Cys Ser Phe Asp Pro Ala Leu Ile Thr Leu Glu 340 345 350 Thr Asp Ile Asn His Val Phe Val Gln Lys Glu Leu Met Met Pro Val 355 360 365 Leu Ala Val Val Arg Gln Lys Asn Phe Glu Glu Ala Leu Lys Asn Ala 370 375 380 Ile Leu Thr Glu His Gly Leu Lys His Thr Ala Val Met His Ser Gln 385 390 395 400 Asn Val Thr Arg Leu Ser Ile Ala Ala Arg Glu Met Gln Thr Thr Ile 405 410 415 Phe Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Phe Gln Gly Glu 420 425 430 Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr 435 440 445 Ser Ala Arg Asn Phe Thr Arg Lys Arg Arg Cys Val Leu Gly Gly Ser 450 455 460 Phe Ser Ile Arg 465 <210> 22 <211> 462 <212> PRT <213> Eubacterium plexicaudatum <400> 22 Met Ser Val Asn Asp Gln Met Val Gln Asp Ile Val Arg Gln Val Leu 1 5 10 15 Ala Asn Met Arg Ile Ser Ser Asp Ala Ser Gly Ser Arg Gly Val Phe 20 25 30 Ser Asp Met Asn Glu Ala Val Glu Ala Ala Lys Lys Ala Gln Ala Val 35 40 45 Ile Gly Lys Met Pro Met Asp His Arg Glu Lys Ile Ile Ser Ser Ile 50 55 60 Arg Ala Lys Ile Met Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val 65 70 75 80 Lys Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Lys Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu 130 135 140 Cys Asn Thr Ile Gly Met Val Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Val Asn Leu Val 165 170 175 Asn Glu Ala Ser Val Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr 180 185 190 Val Glu His Pro Thr Leu Asp Thr Ser Ala Ile Met Met Lys His Lys 195 200 205 Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr 275 280 285 Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Ala Lys Glu Gln Glu 290 295 300 Ala Leu Ile Ser Val Val Leu Lys Gly Gly Gln Leu Asn Arg Asp Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Gln Ala 325 330 335 Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Asp Ser Phe Glu Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp His Ile Thr 385 390 395 400 Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg 450 455 460 <210> 23 <211> 505 <212> PRT <213> Escherichia sp. <400> 23 Met Asn Asp Ile Glu Ile Ala Gln Ala Val Ser Thr Ile Leu Ser Lys 1 5 10 15 Phe Thr Lys Ala Thr Pro Asp Glu Ala Pro Ala Thr Ser Glu Ala Ala 20 25 30 Arg Val Asp Gly Leu Asp Glu Ile Val Ala Lys Ala Leu Ala Gln His 35 40 45 Ser Ser Val Arg Asp Ala Ser Ala Ile Ser Gln Val Ala Lys Val Ala 50 55 60 Asn Ala Ser Thr Gly Ala Phe Asp Thr Met Asp Glu Ala Ile Ser Ala 65 70 75 80 Ala Val Leu Ala Gln Val Gln Tyr Arg His Cys Ser Met Gln Asp Arg 85 90 95 Ala Ser Phe Ile Asn Gly Ile Arg Asp Val Phe Leu Gln Glu Asp Val 100 105 110 Leu Cys Ala Leu Ser Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn 115 120 125 Tyr Glu Asp Lys Leu Ile Lys Asn Arg Val Ala Ala Leu Lys Thr Pro 130 135 140 Gly Ile Glu Asp Leu Thr Thr Ser Ala Val Ser Gly Asp Gly Gly Leu 145 150 155 160 Thr Leu Ile Glu Tyr Ser Ala Phe Gly Val Ile Gly Ser Ile Thr Pro 165 170 175 Thr Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu 180 185 190 Ala Ala Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ser Arg Lys 195 200 205 Val Ser Leu Tyr Ala Val Glu Leu Ile Asn Asn Lys Leu Ala Gln Leu 210 215 220 Gly Ala Pro Ala Asn Met Val Val Thr Val Thr Lys Pro Ser Ile Asp 225 230 235 240 Asn Thr Asn Val Leu Ile Asn Asp Pro Arg Ile Asn Met Leu Val Ala 245 250 255 Thr Gly Gly Pro Ala Ile Val Lys Thr Val Met Ser Ser Gly Lys Lys 260 265 270 Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr 275 280 285 Ala Asp Ile Glu Lys Ala Ala Arg Asp Ile Ile Lys Gly Cys Ser Phe 290 295 300 Asp Asn Asn Leu Pro Cys Val Ala Glu Lys Glu Val Ile Val Val Asn 305 310 315 320 Gln Val Ala Asp Tyr Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr 325 330 335 Leu Leu Cys Asp Lys Lys Leu Ser Gln Gln Leu Gln Ser Leu Val Leu 340 345 350 Asn Glu Lys Gly Thr Gly Pro Asn Thr Ala Phe Val Gly Lys Asp Ala 355 360 365 Arg Tyr Ile Leu Gln Gln Leu Gly Ile Gln Val Gly Asp Asp Ile Lys 370 375 380 Val Ile Leu Ile Glu Ala Glu Lys Thr His Pro Phe Val Val His Glu 385 390 395 400 Leu Met Met Pro Val Leu Pro Val Val Arg Val Asp Asn Val Asp Glu 405 410 415 Ala Ile Glu Leu Ala Val Lys Val Glu His Gly Asn Arg His Thr Ala 420 425 430 Val Met His Ser Thr Asn Val Glu Lys Leu Thr Lys Met Ala Arg Leu 435 440 445 Ile Gln Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Leu 450 455 460 Gly Val Gly Gly Glu Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr 465 470 475 480 Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Ala Arg Arg Arg Arg Cys 485 490 495 Val Met Val Glu Ala Leu Asn Ile Arg 500 505 <210> 24 <211> 529 <212> PRT <213> Rhodospirillum rubrum <400> 24 Met Asn Asp Gly Gln Ile Ala Ala Ala Val Ala Lys Val Leu Glu Ala 1 5 10 15 Tyr Gly Val Pro Ala Asp Pro Ser Ala Ala Ala Pro Ala Pro Ala Ala 20 25 30 Pro Val Ala Pro Ala Ala Pro Thr Ala Gly Ser Val Ser Glu Met Ile 35 40 45 Ala Arg Gly Ile Ala Lys Ala Ser Ser Asp Asp Gln Ile Ala Gln Ile 50 55 60 Val Ala Lys Val Val Gly Asp Tyr Ser Ala Gln Ala Ala Lys Pro Ala 65 70 75 80 Val Val Pro Gly Ala Ala Ala Ser Thr Glu Ala Gly Asp Gly Val Phe 85 90 95 Asp Thr Met Asp Ala Ala Val Asp Ala Ala Val Leu Ala Gln Gln Gln 100 105 110 Tyr Leu Leu Cys Ser Met Thr Asp Arg Gln Arg Phe Val Asp Gly Ile 115 120 125 Arg Glu Val Ile Leu Gln Lys Asp Thr Leu Glu Leu Ile Ser Arg Met 130 135 140 Ala Ala Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys 145 150 155 160 Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr 165 170 175 Glu Ala Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Ser Pro 180 185 190 Phe Gly Ala Ile Gly Ala Val Ala Pro Thr Thr Asn Pro Thr Glu Thr 195 200 205 Ile Ile Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Ile 210 215 220 Phe Ser Pro His Pro Arg Ala Thr Lys Val Ser Leu Leu Thr Val Lys 225 230 235 240 Leu Ile Asn Gln Lys Leu Ala Cys Leu Gly Ala Pro Ala Asn Leu Val 245 250 255 Val Thr Val Ser Lys Pro Ser Val Glu Asn Thr Asn Ala Met Met Ala 260 265 270 His Pro Lys Ile Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile Val 275 280 285 Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly 290 295 300 Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala 305 310 315 320 Leu Asp Ile Ile Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile 325 330 335 Ala Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile 340 345 350 Phe Ser Met Lys Lys Gln Gly Ala Tyr Gln Ile Thr Asp Pro Ala Val 355 360 365 Leu Arg Lys Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln 370 375 380 Thr Ser Cys Val Gly Lys Ser Ala Val Trp Leu Leu Asn Lys Ile Gly 385 390 395 400 Ile Glu Val Asp Ser Ser Val Lys Val Ile Leu Met Glu Val Pro Lys 405 410 415 Glu His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu 420 425 430 Val Arg Val Ser Asp Val Asp Glu Ala Ile Ala Val Ala Ile Glu Val 435 440 445 Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr Asn Val Arg 450 455 460 Lys Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys 465 470 475 480 Asn Gly Pro Ser Tyr Ala Gly Leu Gly Val Gly Gly Glu Gly Tyr Thr 485 490 495 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys 500 505 510 Ser Phe Ala Arg Lys Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile 515 520 525 Arg <210> 25 <211> 472 <212> PRT <213> Clostridium beijerinckii <400> 25 Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile 1 5 10 15 Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser 20 25 30 Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala 35 40 45 Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys 50 55 60 Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn 65 70 75 80 Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys 85 90 95 Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro 100 105 110 Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu 115 120 125 Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro 130 135 140 Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile 145 150 155 160 Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn 165 170 175 Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala 180 185 190 Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu 195 200 205 Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala 210 215 220 Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys 225 230 235 240 Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr 245 250 255 Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe 260 265 270 Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp 275 280 285 Gln Ile Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr 290 295 300 Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr 305 310 315 320 Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro 325 330 335 Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val 340 345 350 Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met 355 360 365 Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala 370 375 380 Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile 385 390 395 400 Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu 405 410 415 Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly 420 425 430 Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val 450 455 460 Met Val Asp Ala Phe Asn Ile Arg 465 470 <210> 26 <211> 468 <212> PRT <213> Eubacterium hallii <400> 26 Met Asn Ile Asp Val Glu Leu Ile Glu Lys Val Val Lys Lys Val Leu 1 5 10 15 Asn Asp Val Glu Thr Gly Ser Ser Glu Ser Glu Tyr Gly Tyr Gly Ile 20 25 30 Phe Asp Thr Met Asp Glu Ala Ile Glu Ala Ser Ala Lys Ala Gln Lys 35 40 45 Glu Tyr Met Asn His Ser Met Ala Asp Arg Gln Arg Tyr Val Glu Gly 50 55 60 Ile Arg Glu Val Val Cys Thr Lys Glu Asn Leu Glu Tyr Met Ser Lys 65 70 75 80 Leu Ala Val Glu Glu Ser Gly Met Gly Ala Tyr Glu Tyr Lys Val Ile 85 90 95 Lys Asn Arg Leu Ala Ala Val Lys Ser Pro Gly Val Glu Asp Leu Thr 100 105 110 Thr Glu Ala Leu Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Cys 115 120 125 Pro Phe Gly Val Ile Gly Ala Ile Ala Pro Thr Thr Asn Pro Thr Glu 130 135 140 Thr Val Ile Cys Asn Ser Ile Ala Met Leu Ala Gly Gly Asn Thr Val 145 150 155 160 Val Phe Ser Pro His Pro Arg Ser Lys Gly Val Ser Ile Trp Leu Ile 165 170 175 Lys Lys Leu Asn Ala Lys Leu Glu Glu Leu Gly Ala Pro Arg Asn Leu 180 185 190 Ile Val Thr Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Ile Met Met 195 200 205 Asn His Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile 210 215 220 Val Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Ile Ala Glu Lys Glu Val Ile Ala Val Asp Gln Ile Ala Asp Tyr Leu 275 280 285 Ile Phe Asn Met Lys Asn Asn Gly Ala Tyr Glu Val Lys Asp Pro Glu 290 295 300 Ile Ile Glu Lys Met Val Asp Leu Val Thr Lys Asp Arg Lys Lys Pro 305 310 315 320 Ala Val Asn Phe Val Gly Lys Ser Ala Gln Tyr Ile Leu Asp Lys Val 325 330 335 Gly Ile Lys Val Gly Pro Glu Val Lys Cys Ile Ile Met Glu Ala Pro 340 345 350 Lys Asp His Pro Phe Val Gln Ile Glu Leu Met Met Pro Ile Leu Pro 355 360 365 Ile Val Arg Val Pro Asn Val Asp Glu Ala Ile Asp Phe Ala Val Glu 370 375 380 Val Glu His Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val 385 390 395 400 Asp Lys Leu Thr Lys Met Ala Lys Glu Ile Glu Thr Thr Ile Phe Val 405 410 415 Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Met Gly Tyr 420 425 430 Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala 435 440 445 Lys Ser Phe Cys Arg Lys Arg Arg Cys Val Leu Gln Asp Gly Leu His 450 455 460 Ile Arg Met Lys 465 <210> 27 <211> 532 <212> PRT <213> Vibrio sp. <400> 27 Met Asn Glu Gln Glu Ile Ala His Ala Val Glu Asn Val Leu Ser Lys 1 5 10 15 Tyr Thr Asn Val Thr Ala Gln Asn Ala Glu Pro Val Ser Tyr Ser Ser 20 25 30 Asn Ala Ser Leu Glu Asn Ile Val Ser Gln Ala Leu Ala Gly Asn Met 35 40 45 Val Lys Gln Pro Glu Thr Gln Thr Ala Pro Asp Leu Asn Ser Asn Ile 50 55 60 Glu Asn Ile Val Ser Gln Ile Leu Ala Glu Asn Gln Ala Lys Pro Gln 65 70 75 80 Ser Val Gln Cys Gln Ser Ala Asn His Gly Thr Thr Glu Tyr Leu Gly 85 90 95 Cys Phe Ala Ser Met Glu Glu Ala Ile Ser Ala Ala Ser His Ala Gln 100 105 110 Val Gln Tyr Arg His Cys Thr Met Gly Asp Arg Ala Ser Phe Val Lys 115 120 125 Gly Ile Arg Glu Val Phe Thr Gln Asp Asp Val Leu Glu Lys Ile Ser 130 135 140 Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Ala Asp Lys Leu 145 150 155 160 Thr Lys Asn Arg Ile Ala Ala Thr Lys Thr Pro Gly Ile Glu Asp Leu 165 170 175 Thr Thr Ser Ala Leu Ser Gly Asp Ser Gly Leu Thr Leu Thr Glu Phe 180 185 190 Ser Ala Tyr Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr 195 200 205 Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Thr 210 215 220 Val Val Tyr Ser Pro His Pro Arg Ser Arg Asn Val Ser Leu Val Ala 225 230 235 240 Val Asp Leu Ile Asn Arg Lys Leu Ala Glu Leu Gly Ala Pro Ala Asn 245 250 255 Leu Val Val Thr Val Leu Glu Pro Ser Ile Asp Asn Thr Asn Ala Met 260 265 270 Met Asn Asp Pro Arg Val Asn Met Leu Val Ala Thr Gly Gly Pro Ser 275 280 285 Ile Val Lys Thr Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly 290 295 300 Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr Ala Asn Ile Glu Lys 305 310 315 320 Ala Ala Lys Asp Ile Ile Asn Gly Cys Ala Phe Asp Asn Asn Leu Pro 325 330 335 Cys Ile Ala Glu Lys Glu Val Ile Val Val Asn Glu Val Ala Asp Tyr 340 345 350 Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr Leu Leu Cys Asp Lys 355 360 365 Gln Lys Ile Gln Gln Leu Gln Ser Leu Val Leu Asn Glu Lys Gly Thr 370 375 380 Gly Pro Asn Thr Ser Phe Val Gly Lys Gly Ala Arg Tyr Ile Leu Asp 385 390 395 400 Lys Leu Asn Ile Gln Val Ser Asp Asp Ile Lys Val Ile Leu Ile Glu 405 410 415 Thr Glu Arg Asn His Pro Phe Val Val His Glu Leu Met Met Pro Ile 420 425 430 Leu Pro Val Val Arg Val Glu Asn Val Asp Glu Ala Ile Asp Leu Ala 435 440 445 Ile Lys Val Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr 450 455 460 Asn Val Glu Lys Leu Ser Lys Met Ala Arg Leu Ile Gln Thr Thr Ile 465 470 475 480 Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu 485 490 495 Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr 500 505 510 Ser Ala Arg Ser Phe Ala Arg Tyr Arg Arg Cys Val Met Val Glu Ala 515 520 525 Leu Asn Ile Arg 530 <210> 28 <211> 464 <212> PRT <213> Rhodopseudomonas palustris <400> 28 Met Val Ala Lys Ala Ile Arg Asp His Ala Gly Thr Ala Gln Pro Ser 1 5 10 15 Gly Asn Ala Ala Thr Ser Ser Ala Ala Val Ser Asp Gly Val Phe Glu 20 25 30 Thr Met Asp Ala Ala Val Glu Ala Ala Ala Leu Ala Gln Gln Gln Tyr 35 40 45 Leu Leu Cys Ser Met Ser Asp Arg Ala Arg Phe Val Gln Gly Ile Arg 50 55 60 Asp Val Ile Leu Asn Gln Asp Thr Leu Glu Lys Met Ser Arg Met Ala 65 70 75 80 Val Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys Asn 85 90 95 Arg Leu Ala Gly Glu Lys Thr Pro Gly Ile Glu Asp Leu Thr Thr Asp 100 105 110 Ala Phe Ser Gly Asp Asn Gly Leu Thr Leu Val Glu Tyr Ser Pro Phe 115 120 125 Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile 130 135 140 Val Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Val Phe 145 150 155 160 Ser Pro His Pro Arg Ala Arg Gln Val Ser Leu Leu Leu Val Arg Leu 165 170 175 Ile Asn Gln Lys Leu Ala Ala Leu Gly Ala Pro Glu Asn Leu Val Val 180 185 190 Thr Val Glu Lys Pro Ser Ile Glu Asn Thr Asn Ala Met Met Ala His 195 200 205 Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Ala Ile Val Lys 210 215 220 Ala Val Leu Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn 225 230 235 240 Pro Pro Val Val Val Asp Glu Thr Ala Asn Ile Glu Lys Ala Ala Cys 245 250 255 Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala 260 265 270 Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile Phe 275 280 285 Asn Leu Lys Lys Asn Gly Ala Tyr Glu Ile Lys Asp Pro Ala Val Leu 290 295 300 Gln Gln Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln Thr 305 310 315 320 Lys Cys Val Gly Lys Ser Ala Val Trp Leu Leu Ser Gln Ile Gly Ile 325 330 335 Ser Val Asp Ala Ser Ile Lys Ile Ile Leu Met Glu Val Pro Arg Glu 340 345 350 His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu Val 355 360 365 Arg Val Glu Thr Val Asp Asp Ala Ile Asp Leu Ala Ile Glu Val Glu 370 375 380 His Asp Asn Arg His Thr Ala Ile Met His Ser Thr Asp Val Arg Lys 385 390 395 400 Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys Asn 405 410 415 Gly Pro Ser Tyr Ala Gly Leu Gly Ala Gly Gly Glu Gly Tyr Ser Thr 420 425 430 Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Ser 435 440 445 Phe Ala Arg Arg Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile Arg 450 455 460 <210> 29 <211> 468 <212> PRT <213> Desulfatibacillum alkenivorans <400> 29 Met Ser Val Lys Glu Phe Ala Leu Glu Asp Met Val Ala Ser Val Ile 1 5 10 15 Met Glu Met Met Asn Lys Asp Asp Asp Ser Cys Gln Pro Thr Gly Asp 20 25 30 Gly Ile Tyr Glu Thr Ile Asp Glu Ala Val Ala Lys Ala Lys Ala Ala 35 40 45 Gln Pro Arg Leu Ile Ser Leu Ser Leu Glu Lys Arg Glu Ala Ile Leu 50 55 60 Thr Ala Ile Arg Lys Ile Ser Leu Glu Lys Asn Glu Glu Trp Ala Lys 65 70 75 80 Ala Thr Val Ala Glu Thr Gly Leu Gly Arg Val Glu Asp Lys Ile Ala 85 90 95 Glu Asn Ile Leu Ala Ala Thr Lys Thr Pro Gly Thr Glu Asp Leu Asp 100 105 110 Ala Lys Ala Leu Ser Gly Asp Ala Gly Leu Thr Leu Ile Glu Tyr Ala 115 120 125 Pro Phe Gly Val Ile Gly Ser Leu Thr Pro Val Thr Asn Ala Thr Gly 130 135 140 Thr Leu Ile Asn Asn Thr Ile Ser Met Leu Ala Gly Gly Asn Thr Val 145 150 155 160 Val Tyr Asn Val His Pro Ser Ala Leu Lys Ile Ser Thr Glu Val Ile 165 170 175 Arg Thr Phe His Lys Val Ile Val Glu Asn Gly Gly Pro Glu Gly Cys 180 185 190 Val Gly Met Val Ala Thr Pro Thr Met Glu Thr Ala Gly Glu Ile Met 195 200 205 Ala His Pro Asp Ile Asn Val Leu Val Ala Thr Gly Gly Ala Gly Val 210 215 220 Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Cys Ile Arg Lys Ala 245 250 255 Ala Glu Glu Ile Ile Ala Gly His Ser Ile Asn Asn Asn Ile Phe Cys 260 265 270 Ile Ser Glu Lys Glu Val Ile Ala Val Asp Glu Val Ala Asp Asn Leu 275 280 285 Leu Lys Phe Met Glu Glu Thr Gly Lys Ala Ala Ile Leu Thr Pro Glu 290 295 300 Glu Ala Gln Lys Val Thr Glu Thr Val Ile His Asp Asn His Val Val 305 310 315 320 Lys Asp Tyr Val Gly Lys Asn Ala Ser Val Ile Ile Glu Gly Ala Gly 325 330 335 Leu Thr Arg Leu Ala Gly Lys Lys Asp Leu Arg Cys Leu Val Phe Glu 340 345 350 Ala Asp Cys Lys His Pro Met Val Trp Ile Glu Gln Met Met Pro Val 355 360 365 Leu Pro Met Val Arg Val Lys Asp Val Trp Glu Gly Ile Asp Leu Ala 370 375 380 Val Lys Val Glu Gln Gly Asn Arg His Thr Ala Met Met His Ser Thr 385 390 395 400 Asn Val Glu His Leu Thr Ala Leu Ala Arg Ala Ile Gln Thr Thr Ile 405 410 415 Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Leu Asn Gly Glu 420 425 430 Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr 435 440 445 Ser Ala Lys Ser Phe Cys Arg Gln Arg Arg Cys Val Leu Ile Asp Ser 450 455 460 Phe Arg Ile Val 465 <210> 30 <211> 469 <212> PRT <213> Clostridium saccharobutylicum <400> 30 Met Asn Asn Asn Leu Phe Val Ser Pro Glu Thr Lys Asp Leu Lys Leu 1 5 10 15 Arg Thr Asn Val Glu Asn Leu Lys Phe Lys Gly Cys Glu Gly Gly Ser 20 25 30 Thr Tyr Ile Gly Val Phe Glu Asn Ala Glu Thr Ala Ile Asp Glu Ala 35 40 45 Val Asn Ala Gln Lys Arg Leu Ser Leu Tyr Tyr Thr Lys Glu Gln Arg 50 55 60 Glu Lys Ile Ile Thr Glu Ile Arg Lys Val Thr Leu Lys Asn Lys Glu 65 70 75 80 Ile Leu Ala Gln Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu 85 90 95 Asp Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr 100 105 110 Glu Asp Leu Ala Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val 115 120 125 Val Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr 130 135 140 Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ser 145 150 155 160 Gly Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val 165 170 175 Ala Phe Ala Val Asp Met Ile Asn Arg Ala Ile Ile Ser Cys Gly Gly 180 185 190 Pro Arg Asn Leu Val Thr Ala Ile Lys Asn Pro Thr Met Glu Ser Leu 195 200 205 Asp Ala Ile Ile Lys His Pro Ala Ile Lys Leu Leu Cys Gly Thr Gly 210 215 220 Gly Pro Gly Met Val Lys Thr Leu Leu Ser Ser Gly Lys Lys Ser Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp 245 250 255 Ile Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn 260 265 270 Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val 275 280 285 Ala Asp Asp Leu Ile Lys Asn Met Leu Lys Asn Asn Ala Val Ile Ile 290 295 300 Asn Lys Asp Gln Val Ser Arg Leu Val Asn Leu Val Leu Gln Lys Asn 305 310 315 320 Asn Glu Thr Ser Glu Tyr Thr Ile Asn Lys Lys Trp Val Gly Lys Asp 325 330 335 Ala Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Ser Ser Asp Val 340 345 350 Arg Cys Ile Ile Cys Glu Val Asp Ala Asp His Pro Phe Val Met Thr 355 360 365 Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp 370 375 380 Glu Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser 385 390 395 400 Ala Tyr Ile Tyr Ser Lys Asn Ile Glu Asn Leu Asn Arg Phe Glu Lys 405 410 415 Glu Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly 420 425 430 Val Gly Tyr Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys 435 440 445 Thr Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg 450 455 460 Cys Val Phe Val Gly 465 <210> 31 <211> 468 <212> PRT <213> Clostridium sp. <400> 31 Met Asn Lys Asp Thr Thr Ile Ser Glu Thr Glu Asn Leu Lys Phe Lys 1 5 10 15 Thr Asn Ile Lys Asn Ala Asp Leu Lys Asn Tyr Glu Asn Ser Thr Ser 20 25 30 Tyr Ser Gly Val Phe Glu Asp Val Glu Val Ala Ile Asn Lys Ala Ile 35 40 45 Thr Ala Gln Lys Glu Phe Ser Leu Tyr Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Leu Thr Glu Ile Arg Lys Ala Thr Leu Lys Asn Lys Lys Ile 65 70 75 80 Leu Ala Lys Met Ile Leu Asp Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Ile Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Asp Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro 180 185 190 Lys Asn Leu Ile Thr Ala Val Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Glu Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Asp Asn Val Ala 275 280 285 Asp Asn Leu Ile Asp Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Lys Asp Lys Ile Thr Lys Leu Leu Asn Leu Ile Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Asn Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asn Glu Ile Asp Val Glu Ala Pro Ser Ser Val Arg 340 345 350 Cys Ile Ile Cys Glu Val Glu Pro Asp His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asn Ile Asp Asp 370 375 380 Ala Ile Gln Tyr Ala Lys Ile Ala Glu Gln Ser Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Asn Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 32 <211> 467 <212> PRT <213> Clostridium taeniosporum <400> 32 Met Glu Arg Asn Leu Ser Val Leu Ser Gln Lys Lys Asn Leu Lys Ile 1 5 10 15 Thr Arg Lys Val Glu Gly Asn Lys Ser Ile Asn Lys Glu Ser Tyr Leu 20 25 30 Gly Val Phe Glu Lys Val Asp Asn Ala Ile Thr Lys Ala Ile Tyr Ala 35 40 45 Gln Arg Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile 50 55 60 Ile Glu Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala 65 70 75 80 Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile 85 90 95 Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu 100 105 110 Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met 115 120 125 Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr 130 135 140 Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser 145 150 155 160 Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala 165 170 175 Val Asp Met Ile Asn Lys Ala Ile Ile Lys Cys Gly Gly Pro Glu Asn 180 185 190 Leu Val Thr Thr Val Glu Asn Pro Thr Met Asp Ser Leu Asn Val Ile 195 200 205 Met Lys His Pro Tyr Val Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly 210 215 220 Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Lys His 245 250 255 Ala Ala Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asp Asp 275 280 285 Leu Ile Gln Asn Met Leu Lys Asn Asn Ala Val Leu Ile Asn Glu Asn 290 295 300 Glu Val Ser Lys Leu Leu Asp Leu Val Leu Ile Glu Lys Lys Asp Glu 305 310 315 320 Pro Ser Gly Tyr Val Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys 325 330 335 Leu Phe Leu Asp Lys Ile Gly Lys Lys Val Ser Asp Asp Val Lys Cys 340 345 350 Ile Ile Cys Glu Val Asp Val Asn His Pro Phe Val Met Thr Glu Leu 355 360 365 Met Met Pro Ile Leu Ala Ile Ala Arg Val Lys Asp Ile Asp Glu Ala 370 375 380 Ile Glu Cys Ala Lys Thr Ala Glu Gln Gly Lys Arg His Ser Ala Tyr 385 390 395 400 Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile 405 410 415 Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly 420 425 430 Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val 450 455 460 Leu Ala Gly 465 <210> 33 <211> 467 <212> PRT <213> Clostridium botulinum <400> 33 Met Glu Arg Asn Leu Ser Val Leu Ser Gln Thr Asn Asp Leu Lys Ile 1 5 10 15 Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu 20 25 30 Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala 35 40 45 Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile 50 55 60 Ile Lys Ser Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala 65 70 75 80 Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile 85 90 95 Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu 100 105 110 Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met 115 120 125 Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr 130 135 140 Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser 145 150 155 160 Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala 165 170 175 Val Asp Met Ile Asn Lys Ala Val Ile Arg Glu Gly Gly Pro Glu Asn 180 185 190 Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile 195 200 205 Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly 210 215 220 Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asp Lys 245 250 255 Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp 275 280 285 Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn 290 295 300 Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu 305 310 315 320 Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys 325 330 335 Leu Phe Leu Asp Lys Ile Gly Ile Lys Ala Ser Asp Asn Val Arg Cys 340 345 350 Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu 355 360 365 Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala 370 375 380 Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr 385 390 395 400 Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile 405 410 415 Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly 420 425 430 Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val 450 455 460 Leu Ala Gly 465 <210> 34 <211> 467 <212> PRT <213> Clostridium botulinum <400> 34 Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile 1 5 10 15 Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu 20 25 30 Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala 35 40 45 Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile 50 55 60 Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala 65 70 75 80 Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile 85 90 95 Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu 100 105 110 Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met 115 120 125 Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr 130 135 140 Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser 145 150 155 160 Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala 165 170 175 Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn 180 185 190 Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile 195 200 205 Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly 210 215 220 Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys 245 250 255 Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp 275 280 285 Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn 290 295 300 Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu 305 310 315 320 Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys 325 330 335 Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys 340 345 350 Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu 355 360 365 Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala 370 375 380 Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr 385 390 395 400 Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile 405 410 415 Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly 420 425 430 Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val 450 455 460 Leu Ala Gly 465 <210> 35 <211> 467 <212> PRT <213> Clostridium botulinum <400> 35 Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile 1 5 10 15 Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu 20 25 30 Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Glu Ala Ile Tyr Ala 35 40 45 Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile 50 55 60 Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala 65 70 75 80 Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile 85 90 95 Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu 100 105 110 Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met 115 120 125 Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr 130 135 140 Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser 145 150 155 160 Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala 165 170 175 Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn 180 185 190 Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile 195 200 205 Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly 210 215 220 Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys 245 250 255 Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp 275 280 285 Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn 290 295 300 Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu 305 310 315 320 Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys 325 330 335 Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys 340 345 350 Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu 355 360 365 Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala 370 375 380 Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr 385 390 395 400 Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile 405 410 415 Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly 420 425 430 Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val 450 455 460 Leu Ala Gly 465 <210> 36 <211> 467 <212> PRT <213> Clostridium botulinum <400> 36 Met Lys Arg Asn Leu Ser Val Leu Leu Gln Thr Asn Asp Leu Lys Ile 1 5 10 15 Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu 20 25 30 Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ser 35 40 45 Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile 50 55 60 Ile Lys Gly Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala 65 70 75 80 Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile 85 90 95 Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu 100 105 110 Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met 115 120 125 Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr 130 135 140 Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser 145 150 155 160 Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala 165 170 175 Val Asp Met Ile Asn Lys Ala Val Ile Lys Ala Gly Gly Pro Glu Asn 180 185 190 Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile 195 200 205 Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly 210 215 220 Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asn Lys 245 250 255 Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Ser Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp 275 280 285 Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn 290 295 300 Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu 305 310 315 320 Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys 325 330 335 Leu Phe Leu Asp Lys Ile Gly Ile Lys Ser Ser Asp Asn Val Arg Cys 340 345 350 Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu 355 360 365 Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala 370 375 380 Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr 385 390 395 400 Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile 405 410 415 Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly 420 425 430 Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val 450 455 460 Leu Ala Gly 465 <210> 37 <211> 472 <212> PRT <213> Clostridium beijerinckii <400> 37 Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile 1 5 10 15 Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser 20 25 30 Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala 35 40 45 Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys 50 55 60 Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn 65 70 75 80 Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys 85 90 95 Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro 100 105 110 Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu 115 120 125 Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro 130 135 140 Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile 145 150 155 160 Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn 165 170 175 Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala 180 185 190 Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu 195 200 205 Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala 210 215 220 Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys 225 230 235 240 Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr 245 250 255 Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe 260 265 270 Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp 275 280 285 Gln Val Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr 290 295 300 Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr 305 310 315 320 Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro 325 330 335 Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val 340 345 350 Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met 355 360 365 Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala 370 375 380 Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile 385 390 395 400 Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu 405 410 415 Glu Thr Thr Ile Phe Val Lys Asn Ser Pro Ser Tyr Ala Gly Ile Gly 420 425 430 Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val 450 455 460 Met Val Asp Ala Phe Asn Ile Arg 465 470 <210> 38 <211> 468 <212> PRT <213> Clostridium saccharoperbutylacetonicum <400> 38 Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 39 <211> 468 <212> PRT <213> Clostridium sp. <400> 39 Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Cys Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 40 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 40 Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Thr Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Ala Glu Asn Ala Ile Ser Asn Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Asn Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asn 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Glu Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Ile Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 41 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 41 Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Asn Ser Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Ile Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Leu Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Ser Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Ile Lys 340 345 350 Cys Ile Val Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Val Lys Tyr Thr Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 42 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 42 Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys 1 5 10 15 Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 43 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 43 Met Ile Lys Asp Thr Leu Val Ser Val Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val 35 40 45 Gln Ala Gln Lys Ile Leu Ser Ile His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 44 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 44 Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys 1 5 10 15 Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Ile Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Ile Glu Ser Pro Ser Asn Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Asn Glu Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Arg Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 45 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 45 Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys 1 5 10 15 Thr Asn Asp Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Ile His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Ala 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 46 <211> 468 <212> PRT <213> Clostridium saccharoperbutylacetonicum <400> 46 Met Ile Lys Asp Thr Leu Val Ser Ile Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ala Asn Leu Lys Asn Tyr Lys Asp Asp Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Asn Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Ile 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Thr Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Asp Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Ser Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Ser Ala Ser His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Glu Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 47 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 47 Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys 1 5 10 15 Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 48 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 48 Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Leu Lys 1 5 10 15 Thr Asn Val Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Asn Ser Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Glu Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Ile Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Leu Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Ser Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Ile Lys 340 345 350 Cys Ile Val Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Val Lys Tyr Thr Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 49 <211> 468 <212> PRT <213> Clostridium sp. <400> 49 Met Asn Lys Asp Thr Thr Ile Ser Glu Thr Glu Asn Leu Lys Phe Lys 1 5 10 15 Thr Asn Ile Lys Asn Ala Asp Leu Lys Asn Tyr Glu Asn Ser Thr Ser 20 25 30 Tyr Ser Gly Val Phe Glu Asp Val Glu Val Ala Ile Asn Lys Ala Ile 35 40 45 Thr Ala Gln Lys Glu Phe Ser Leu Tyr Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Leu Thr Glu Ile Arg Lys Ala Thr Leu Lys Asn Lys Lys Ile 65 70 75 80 Leu Ala Lys Met Ile Leu Asp Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Ile Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Ser Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Asp Met Ile Asn Lys Ala Ile Val Ser Cys Gly Gly Pro 180 185 190 Lys Asn Leu Ile Thr Ala Val Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Glu Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Asp Asn Val Ala 275 280 285 Asp Asn Leu Ile Asp Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Lys Asp Lys Ile Thr Lys Leu Leu Asn Leu Ile Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Asn Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asn Glu Ile Asp Val Glu Ala Pro Ser Ser Val Arg 340 345 350 Cys Ile Ile Cys Glu Val Glu Pro Asp His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asn Ile Asp Asp 370 375 380 Ala Ile Gln Tyr Ala Lys Ile Ala Glu Gln Ser Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Asn Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 50 <211> 469 <212> PRT <213> Clostridium saccharobutylicum <400> 50 Met Asn Asn Asn Leu Phe Val Ser Pro Glu Thr Lys Asp Leu Lys Leu 1 5 10 15 Arg Thr Asn Val Glu Asn Leu Lys Phe Lys Gly Cys Glu Gly Gly Ser 20 25 30 Thr Tyr Ile Gly Val Phe Glu Asn Ala Glu Thr Ala Ile Asp Glu Ala 35 40 45 Val Asn Ala Gln Lys Arg Leu Ser Leu Tyr Tyr Thr Lys Glu Gln Arg 50 55 60 Glu Lys Ile Ile Thr Glu Ile Arg Lys Val Thr Leu Lys Asn Lys Glu 65 70 75 80 Ile Leu Ala Gln Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu 85 90 95 Asp Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr 100 105 110 Glu Asp Leu Ala Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val 115 120 125 Val Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr 130 135 140 Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ser 145 150 155 160 Gly Asn Ala Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val 165 170 175 Ala Phe Ala Val Asp Met Ile Asn Arg Ala Ile Ile Ser Cys Gly Gly 180 185 190 Pro Arg Asn Leu Val Thr Ala Ile Lys Asn Pro Thr Met Glu Ser Leu 195 200 205 Asp Ala Ile Ile Lys His Pro Ala Ile Lys Leu Leu Cys Gly Thr Gly 210 215 220 Gly Pro Gly Met Val Lys Thr Leu Leu Ser Ser Gly Lys Lys Ser Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp 245 250 255 Ile Glu Lys Ala Gly Lys Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn 260 265 270 Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val 275 280 285 Ala Asp Asp Leu Ile Lys Asn Met Leu Lys Asn Asn Ala Val Ile Ile 290 295 300 Asn Lys Asp Gln Val Ser Arg Leu Val Asn Leu Val Leu Gln Lys Asn 305 310 315 320 Asn Glu Thr Ser Glu Tyr Thr Ile Asn Lys Lys Trp Val Gly Lys Asp 325 330 335 Ala Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Ser Ser Asp Val 340 345 350 Arg Cys Ile Ile Cys Glu Val Asp Ala Asp His Pro Phe Val Met Thr 355 360 365 Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp 370 375 380 Glu Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser 385 390 395 400 Ala Tyr Ile Tyr Ser Lys Asn Ile Glu Asn Leu Asn Arg Phe Glu Lys 405 410 415 Glu Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly 420 425 430 Val Gly Tyr Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Cys 435 440 445 Thr Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg 450 455 460 Cys Val Phe Val Gly 465 <210> 51 <211> 467 <212> PRT <213> Clostridium botulinum <400> 51 Met Glu Arg Asn Leu Ser Val Leu Ser Gln Thr Asn Asp Leu Lys Ile 1 5 10 15 Thr Lys Arg Thr Glu Gly Asp Lys Ser Asn Asn Lys Glu Ser Tyr Leu 20 25 30 Gly Val Phe Lys Lys Val Glu Asn Ala Ile Thr Lys Ala Ile Tyr Ala 35 40 45 Gln Lys Lys Leu Ser Leu Tyr Tyr Thr Lys Glu Asp Arg Glu Arg Ile 50 55 60 Ile Lys Ser Ile Arg Lys Ala Thr Leu Glu Asn Lys Glu Ile Leu Ala 65 70 75 80 Lys Met Ile Val Asp Glu Thr His Met Gly Arg Tyr Glu Asp Lys Ile 85 90 95 Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu Asp Leu 100 105 110 Ile Thr Thr Ala Trp Ser Gly Asp Gln Gly Leu Thr Leu Val Glu Met 115 120 125 Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr 130 135 140 Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asp Ser 145 150 155 160 Val Val Phe Asn Gly His Pro Gly Ala Lys Lys Cys Val Ala Phe Ala 165 170 175 Val Asp Met Ile Asn Lys Ala Val Ile Arg Glu Gly Gly Pro Glu Asn 180 185 190 Leu Val Thr Thr Val Glu Asn Pro Thr Met Glu Ser Leu Asn Val Ile 195 200 205 Met Lys His Pro Tyr Ile Lys Leu Leu Cys Gly Thr Gly Gly Pro Gly 210 215 220 Leu Ile Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp Ile Asp Lys 245 250 255 Ala Ala Lys Asn Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn Leu Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala Asn Asp 275 280 285 Leu Ile Gln Asn Met Ile Lys Asn Asn Ala Val Leu Ile Asn Glu Asn 290 295 300 Gln Val Ser Lys Leu Leu Asp Leu Val Leu Leu Glu Arg Lys Asp Glu 305 310 315 320 Thr Leu Glu Tyr Ala Ile Asn Lys Lys Trp Val Gly Lys Asp Ala Lys 325 330 335 Leu Phe Leu Asp Lys Ile Gly Ile Lys Ala Ser Asp Asn Val Arg Cys 340 345 350 Ile Ile Cys Glu Val Asp Ala Asn His Pro Phe Val Met Thr Glu Leu 355 360 365 Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Val Asp Glu Ala 370 375 380 Ile Glu Cys Ala Lys Thr Ala Glu Gln Arg Lys Arg His Ser Ala Tyr 385 390 395 400 Met Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Lys Glu Ile 405 410 415 Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val Gly 420 425 430 Phe Gly Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys Val 450 455 460 Leu Ala Gly 465 <210> 52 <211> 527 <212> PRT <213> Caldalkalibacillus thermarum <400> 52 Met Asn Met Thr Glu Lys Asp Ile Glu Lys Ile Val Gln Ser Val Leu 1 5 10 15 His Asn Val Glu Ser Ala Leu Gly Lys Ser Ala Ser Ala Ser Pro Ser 20 25 30 Val Ser Ala Val Ser Val Ala Ser Gly Glu Gly Ile Lys Pro Val Gln 35 40 45 Phe Lys Gln Val Pro Val Phe Gln Gln Glu Thr Val Lys Ser Pro Asn 50 55 60 Arg Asn Arg Asn Leu Gly Gly Ala Glu Glu Lys Trp Gly Val Phe Asn 65 70 75 80 His Met Glu Asp Ala Ile Glu Ala Ser Tyr Arg Ala Gln Met Glu Phe 85 90 95 Val Lys His Phe Gln Leu Lys Asp Arg Glu Lys Ile Ile Thr Ala Ile 100 105 110 Arg Glu Ala Val Leu Arg Glu Lys Glu Val Leu Ala Arg Lys Val Tyr 115 120 125 Glu Glu Thr Lys Ile Gly Arg Tyr Glu Asp Lys Val Ala Lys His Glu 130 135 140 Leu Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Lys Thr Glu Ala 145 150 155 160 Phe Ser Gly Asp Asn Gly Leu Thr Ile Val Glu Arg Ala Pro Tyr Gly 165 170 175 Leu Ile Gly Ala Val Thr Pro Val Thr Asn Pro Thr Glu Thr Ile Ile 180 185 190 Asn Asn Ala Ile Gly Met Leu Ala Ala Gly Asn Ala Val Val Phe Asn 195 200 205 Val His Pro Ser Ser Lys Arg Ser Cys Ala Tyr Ala Val Gln Leu Ile 210 215 220 Asn Lys Ala Ile Thr Glu Ala Gly Gly Pro His His Leu Val Thr Met 225 230 235 240 Val Lys Glu Pro Thr Leu Asp Thr Leu Gln Thr Leu Ile Asp Ser Pro 245 250 255 Lys Val Lys Leu Leu Val Gly Thr Gly Gly Pro Gly Leu Val Gln Thr 260 265 270 Leu Leu Lys Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro 275 280 285 Pro Val Ile Val Asp Asp Thr Ala Asp Leu Glu His Ala Ala Arg Ser 290 295 300 Ile Ile Glu Gly Ala Ala Phe Asp Asn Asn Leu Leu Cys Ile Ala Glu 305 310 315 320 Lys Glu Val Phe Val Leu Glu Ser Val Ala Asp Asp Leu Ile Phe His 325 330 335 Met Leu Asn His Gly Ala Tyr Met Leu Gly Gln His Glu Val Glu Gln 340 345 350 Val Met Ala Phe Ala Leu Glu Glu Gln Gly Asn Glu Gln Asn Arg Gly 355 360 365 Cys Gly Phe Asn Pro Gln Arg His Tyr Gln Val Ser Lys Asp Trp Ile 370 375 380 Gly Gln Asp Ala Arg Leu Phe Leu Glu His Ile Gly Val Gln Pro Pro 385 390 395 400 Thr Glu Val Lys Leu Leu Ile Cys Asp Val Glu Phe Asp His Pro Phe 405 410 415 Val Gln Leu Glu Gln Met Met Pro Val Leu Pro Ile Val Arg Val Lys 420 425 430 Thr Leu Asp Glu Ala Ile Glu Lys Ala Val Met Ala Glu His Gly Asn 435 440 445 Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu Thr Lys 450 455 460 Phe Ala Arg Ala Ile Gln Thr Thr Leu Phe Val Lys Asn Ala Ser Ser 465 470 475 480 Leu Ala Gly Val Gly Tyr Gly Gly Glu Gly His Thr Thr Met Thr Ile 485 490 495 Ala Gly Pro Thr Gly Glu Gly Val Thr Ser Ala Lys Thr Phe Thr Arg 500 505 510 Glu Arg Arg Cys Val Leu Ala Glu Gly Gly Phe Arg Ile Ile Gly 515 520 525 <210> 53 <211> 480 <212> PRT <213> Pelosinus fermentans <400> 53 Met Ser Ile Asp Gln Ala Leu Ile Glu Lys Ile Thr Leu Glu Ile Leu 1 5 10 15 Thr Lys Met Gln Thr Gly Ala Lys Ala Ala Pro Ala Gly Tyr Gly Asp 20 25 30 Gly Ile Phe Glu Thr Val Asp Glu Ala Val Ala Ala Ala Arg Lys Ala 35 40 45 Tyr Gln Glu Leu Lys Thr Leu Ser Leu Glu Lys Arg Glu Val Leu Ile 50 55 60 Lys Ala Met Arg Asp Val Ala Tyr Glu Asn Ala Thr Ile Leu Ala Gln 65 70 75 80 Met Ala Val Asp Glu Ser Gly Met Gly Arg Val Ser Asp Lys Ile Ile 85 90 95 Lys Asn Gln Val Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Thr 100 105 110 Thr Gln Ala Trp Ser Gly Asp Asn Gly Leu Thr Leu Ile Glu Met Gly 115 120 125 Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu 130 135 140 Thr Val Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Thr Val 145 150 155 160 Phe Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Met Lys Ile Ile 165 170 175 Thr Leu Leu Asn Gln Ala Ile Val Lys Ala Gly Gly Pro Asn Asn Leu 180 185 190 Leu Thr Ser Val Ala Asn Pro Ser Ile Lys Ala Ala Asn Glu Met Met 195 200 205 Lys His Pro Gly Ile Asn Met Leu Val Ala Thr Gly Gly Pro Gly Val 210 215 220 Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Ile Ala Glu Lys Glu Val Ile Ala Ile Gly Ser Ile Ala Asp Arg Leu 275 280 285 Ile Thr Tyr Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Asn 290 295 300 Ile Asp Arg Leu Leu Asp Val Ile Met Thr Val Gln Glu Glu Lys Ile 305 310 315 320 Ala Glu Gly Cys Thr Asp Lys Pro Lys Arg Ser Tyr Gly Ile Asn Lys 325 330 335 Asp Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Ser Lys Ile Gly Ile 340 345 350 Asp Val Pro Asp Ser Val Arg Val Val Leu Cys Glu Thr Pro Ala Asp 355 360 365 His Pro Phe Val Ile Glu Glu Leu Met Met Pro Val Leu Pro Val Val 370 375 380 Gln Val Lys Asp Ile Asp Glu Ala Ile Glu Val Ala Val Arg Val Glu 385 390 395 400 His Gly Asn Arg His Thr Ala Ala Met His Ser Lys Asn Val Asp His 405 410 415 Leu Thr Arg Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val Lys Asn 420 425 430 Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Ser 435 440 445 Phe Thr Leu Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Ser 450 455 460 Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Ser Ile Val 465 470 475 480 <210> 54 <211> 479 <212> PRT <213> Thermoanaerobacterium thermosaccharolyticum <400> 54 Met Glu Ile Asn Asp Asn Met Ile Ser Glu Ile Ile Glu Arg Val Leu 1 5 10 15 Lys Glu Val Gln Lys Lys Ser Ile Asn Asp Arg Tyr Gln Asn Gly Ile 20 25 30 Tyr Asp Arg Met Glu Asp Ala Ile Glu Ala Ala Tyr Glu Ala Gln Lys 35 40 45 Lys Leu Met Lys Met Ser Ile Glu Gln Arg Glu Arg Leu Ile Ser Ala 50 55 60 Met Arg Lys Ala Ile Leu Asp Asn Ala Lys Ser Cys Ala Lys Leu Ser 65 70 75 80 Val Glu Glu Thr Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu 85 90 95 Lys Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Val Leu Thr Thr Lys 100 105 110 Ala Tyr Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Ala Pro Phe 115 120 125 Gly Val Ile Gly Ser Ile Thr Pro Ser Thr Asn Pro Ala Glu Thr Val 130 135 140 Cys Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Thr Val Val Phe 145 150 155 160 Ser Pro His Pro Gly Ala Ile Lys Ser Ser Leu Met Ala Val Glu Phe 165 170 175 Leu Asn Lys Ala Ile Ile Glu Ala Gly Gly Pro Glu Asn Leu Ile Thr 180 185 190 Ser Val Arg Lys Pro Ser Ile Glu Phe Thr Asp Val Met Ile Asn His 195 200 205 Pro Lys Ile Asn Leu Leu Val Ala Thr Gly Gly Pro Ala Ile Val Lys 210 215 220 Lys Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn 225 230 235 240 Pro Pro Cys Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala Arg 245 250 255 Asp Ile Ile Leu Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala 260 265 270 Glu Lys Glu Val Ile Ala Val Glu Ser Ile Tyr Glu Glu Leu Ile Glu 275 280 285 Asn Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Asp Asp Glu Ala Glu 290 295 300 Lys Leu Ala Asp Ile Val Leu Thr Lys Lys Glu Glu Leu Lys Ala Glu 305 310 315 320 Gly Cys Ser Ile Asn Arg Pro Lys Phe Glu Tyr Ser Val Asn Lys Lys 325 330 335 Trp Val Gly Lys Asp Ala Lys Val Leu Leu Glu Gln Ile Gly Ile Asn 340 345 350 Val Gly Asp Asp Ile Val Cys Ile Ile Tyr Arg Cys Asp Lys Gln His 355 360 365 Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Ile Val Lys 370 375 380 Val Lys Asn Ile Asp Glu Ala Ile Asn Val Ala Val Glu Val Glu His 385 390 395 400 Gly Asn His His Thr Ala Glu Met His Ser Lys Asn Ile Asp Asn Leu 405 410 415 Thr Arg Phe Ala Lys Ala Ile Asn Thr Thr Ile Phe Val Lys Asn Ala 420 425 430 Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr Thr Thr Phe 435 440 445 Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Ala Thr Phe 450 455 460 Thr Arg Gln Arg Arg Cys Val Met Val Asp Ser Phe Arg Ile Val 465 470 475 <210> 55 <211> 480 <212> PRT <213> Pelosinus fermentans <400> 55 Met Ser Ile Asp Gln Ala Leu Ile Glu Lys Ile Thr Leu Glu Ile Leu 1 5 10 15 Thr Lys Met Gln Thr Gly Ala Lys Ala Ala Pro Ala Gly Tyr Gly Asp 20 25 30 Gly Ile Phe Glu Thr Val Asp Glu Ala Val Ala Ala Ala Arg Lys Ala 35 40 45 Tyr Gln Glu Leu Lys Thr Leu Ser Leu Glu Lys Arg Glu Val Leu Ile 50 55 60 Lys Ala Met Arg Asp Val Ala Tyr Glu Asn Ala Thr Ile Leu Ala Gln 65 70 75 80 Met Ala Val Asp Glu Ser Gly Met Gly Arg Val Ser Asp Lys Ile Ile 85 90 95 Lys Asn Gln Val Ala Ala Leu Lys Thr Pro Gly Thr Glu Asp Leu Thr 100 105 110 Thr Gln Ala Trp Ser Gly Asp Asn Gly Leu Thr Leu Ile Glu Met Gly 115 120 125 Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu 130 135 140 Thr Val Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Thr Val 145 150 155 160 Phe Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Met Lys Ile Ile 165 170 175 Thr Leu Leu Asn Gln Ala Ile Val Lys Ala Gly Gly Pro Asn Asn Leu 180 185 190 Leu Thr Ser Val Ala Asn Pro Ser Ile Lys Ala Ala Asn Glu Met Met 195 200 205 Lys His Pro Gly Ile Asn Met Leu Val Ala Thr Gly Gly Pro Gly Val 210 215 220 Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Ile Ala Glu Lys Glu Val Ile Ala Ile Gly Ser Ile Ala Asp Arg Leu 275 280 285 Ile Thr Tyr Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Asn 290 295 300 Ile Asp Arg Leu Leu Asn Val Ile Met Thr Val Gln Glu Glu Lys Ile 305 310 315 320 Ala Glu Gly Cys Thr Asp Lys Pro Lys Arg Ser Tyr Gly Ile Asn Lys 325 330 335 Asp Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Ser Lys Ile Gly Ile 340 345 350 Asp Val Pro Asp Ser Val Arg Val Val Leu Cys Glu Thr Pro Ala Asp 355 360 365 His Pro Phe Val Ile Glu Glu Leu Met Met Pro Val Leu Pro Val Val 370 375 380 Gln Val Lys Asp Ile Asp Glu Ala Ile Glu Val Ala Val Arg Val Glu 385 390 395 400 His Gly Asn Arg His Thr Ala Ala Met His Ser Lys Asn Val Asp His 405 410 415 Leu Thr Arg Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val Lys Asn 420 425 430 Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Ser 435 440 445 Phe Thr Leu Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser Pro Arg Ser 450 455 460 Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Ser Ile Val 465 470 475 480 <210> 56 <211> 479 <212> PRT <213> Desulfosporosinus sp. <400> 56 Met Ser Val Asp Gln Ala Leu Ile Arg Lys Ile Thr Ser Glu Ile Leu 1 5 10 15 Ala Lys Met Gln Asn Arg Thr Val Ser Ala Cys Gln Asp Cys Asn Gly 20 25 30 Ile Phe Thr Thr Val Asp Glu Ala Val Ala Ala Ala Arg Ile Ala Tyr 35 40 45 Gln Glu Leu Arg Thr Leu Ser Leu Glu Lys Arg Glu Glu Leu Ile Lys 50 55 60 Ala Met Arg Asn Val Ala Leu Glu Asn Ala Thr Met Leu Ala Glu Met 65 70 75 80 Ala Val Lys Glu Ser Gly Met Gly Arg Val Glu Asp Lys Ile Ile Lys 85 90 95 His Lys Leu Val Ala Val Lys Thr Pro Gly Thr Glu Asp Leu Arg Thr 100 105 110 Glu Ala Trp Ser Gly Asp Ser Gly Leu Thr Leu Val Glu Met Gly Pro 115 120 125 Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Val Ala Thr 130 135 140 Ile Ile Cys Asn Gly Ile Gly Met Ile Ala Ala Gly Asn Ala Val Phe 145 150 155 160 Phe Ser Pro His Pro Thr Ala Lys Asn Thr Ser Ile Lys Thr Ile Thr 165 170 175 Leu Leu Asn Glu Ala Ile Val Lys Ala Gly Gly Pro Met Asn Leu Leu 180 185 190 Thr Ser Val Ala Asp Pro Ser Ile Ser Ala Ala Asn Ala Met Met Lys 195 200 205 His Ala Gly Ile Asn Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val 210 215 220 Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly 225 230 235 240 Asn Pro Pro Val Ile Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala 245 250 255 Arg Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile 260 265 270 Ala Glu Lys Glu Val Ile Ala Val Gly Cys Ile Ala Asp Arg Leu Ile 275 280 285 Ser Asn Met Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Ser Lys Ile 290 295 300 Asp Gln Met Leu Asp Val Val Met Thr Ala Thr Glu Glu Lys Met Ala 305 310 315 320 Glu Gly Cys Thr Ala Lys Pro Ile Lys Arg Tyr Gly Ile Asn Lys Asp 325 330 335 Phe Val Gly Lys Asp Ala Lys Tyr Ile Leu Thr Gln Ile Gly Leu Asp 340 345 350 Val Pro Asp Thr Ile Lys Val Ile Leu Cys Glu Thr Pro Ala Asp His 355 360 365 Pro Phe Val Ile Glu Glu Leu Met Met Pro Ile Leu Pro Val Val Gln 370 375 380 Val Lys Asp Ile Asp Ala Ala Ile Glu Leu Ala Val Lys Val Glu His 385 390 395 400 Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val Asp Asn Met 405 410 415 Thr Arg Phe Ala Lys Ala Ile Glu Thr Thr Ile Phe Val Lys Asn Ala 420 425 430 Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Cys Thr Phe 435 440 445 Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Thr Ala Arg Ser Phe 450 455 460 Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ser Phe Ser Ile Ile 465 470 475 <210> 57 <211> 482 <212> PRT <213> Clostridium methylpentosum <400> 57 Met Glu Ile Thr Pro Asn Gln Ile Asp Gln Ile Val Ala Asn Val Met 1 5 10 15 Ala Gln Leu Gly Gly Ser Ala Ala Pro Ala Ala Ser Tyr Asp Ser Thr 20 25 30 Gln Tyr Ser Gly Arg Lys Tyr Ile Gly Ile Tyr Ala Thr Met Thr Glu 35 40 45 Ala Ile Asp Ala Val Ala Asp Ala Tyr Lys Val Leu Arg Ser Met Thr 50 55 60 Val Asp Gln Arg Glu Lys Ile Ile Glu Lys Ile Arg Glu Phe Thr Arg 65 70 75 80 Ala Glu Ala Glu Ile Met Ala Lys Met Gly Val Glu Glu Thr Gly Met 85 90 95 Gly Lys Val Glu His Lys Thr Leu Lys His His Leu Val Ala Asp Lys 100 105 110 Thr Pro Gly Thr Glu Asp Ile Gln Thr Glu Ala Met Ser Gly Asp Gly 115 120 125 Gly Leu Thr Leu Leu Glu Met Ala Pro Phe Gly Ile Ile Gly Ala Ile 130 135 140 Ser Pro Ser Thr Asn Pro Ser Glu Thr Val Leu Cys Asn Ser Met Gly 145 150 155 160 Met Ile Ala Gly Ala Asn Ala Val Val Phe Asn Pro His Pro Ser Ala 165 170 175 Ile Cys Thr Ser Asn Tyr Ala Val Asp Leu Val Asn Arg Ala Ser Leu 180 185 190 Ala Ala Gly Gly Pro Ala Asn Leu Cys Cys Ser Val Val Lys Pro Thr 195 200 205 Met Gln Ser Ala Asp Asp Met Val Lys Asp Pro Arg Val Lys Met Leu 210 215 220 Val Cys Thr Gly Gly Pro Gly Val Val Arg Ala Met Leu Ser Ser Gly 225 230 235 240 Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp 245 250 255 Asp Thr Ala Asp Ile Arg Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys 260 265 270 Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Ala 275 280 285 Phe Ser Asn Ile Ala Asp Glu Leu Met Tyr Tyr Met Gln Gln Asn Gly 290 295 300 Ala Tyr Phe Ile Ser Gly Glu Met Ala Asp Arg Leu Ala Lys Ile Val 305 310 315 320 Leu Val Glu Lys Lys Asn Glu Lys Thr Gly Lys Ile Ser Tyr Ser Val 325 330 335 Ser Arg Asp Trp Val Gly Arg Asp Ala Lys Lys Phe Leu Ala Ala Leu 340 345 350 Asp Ile Glu Val Gly Asp Asp Val Arg Cys Val Ile Cys Glu Thr Asp 355 360 365 Glu Asn His Leu Phe Val Gln Thr Glu Leu Met Met Pro Ile Leu Pro 370 375 380 Ile Val Arg Val Asn Asn Ile Asp Glu Ala Val Arg Met Ala Val Arg 385 390 395 400 Ala Glu His Gly Asn Arg His Thr Ala His Met His Ser Lys Asn Ile 405 410 415 Asp Asn Leu Thr Lys Phe Ala Arg Ala Val Glu Thr Thr Ile Phe Val 420 425 430 Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Ser Glu Gly His 435 440 445 Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala 450 455 460 Arg Ser Phe Thr Arg Lys Arg Arg Cys Val Met Ser Asp Ser Phe Asn 465 470 475 480 Ile Val <210> 58 <211> 467 <212> PRT <213> Thermoanaerobacterium saccharolyticum <400> 58 Met Lys Val Lys Glu Glu Asp Ile Glu Ala Ile Val Lys Lys Val Leu 1 5 10 15 Ser Glu Phe Asn Phe Glu Lys Asn Thr Lys Ser Phe Arg Asp Phe Gly 20 25 30 Val Phe Gln Asp Met Asn Asp Ala Ile Arg Ala Ala Lys Asp Ala Gln 35 40 45 Lys Lys Leu Arg Asn Met Ser Met Glu Ser Arg Glu Lys Ile Ile Gln 50 55 60 Asn Ile Arg Lys Lys Ile Met Glu Asn Lys Lys Ile Leu Ala Glu Met 65 70 75 80 Gly Val Ser Glu Thr Gly Met Gly Lys Val Glu His Lys Ile Ile Lys 85 90 95 His Glu Leu Val Ala Leu Lys Thr Pro Gly Thr Glu Asp Ile Val Thr 100 105 110 Thr Ala Trp Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Gly Pro 115 120 125 Phe Gly Val Ile Gly Thr Ile Thr Pro Ser Thr Asn Pro Ser Glu Thr 130 135 140 Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val 145 150 155 160 Phe Asn Pro His Pro Gly Ala Val Asn Val Ser Asn Tyr Ala Val Lys 165 170 175 Leu Val Asn Glu Ala Val Met Glu Ala Gly Gly Pro Glu Asn Leu Val 180 185 190 Ala Ser Val Glu Lys Pro Thr Leu Glu Thr Gly Asn Ile Met Phe Lys 195 200 205 Ser Pro Asp Val Ser Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val 210 215 220 Thr Ser Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly 225 230 235 240 Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala 245 250 255 Lys Asp Ile Val Asp Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile 260 265 270 Ala Glu Lys Glu Val Val Ser Val Asp Lys Ile Thr Asp Glu Leu Ile 275 280 285 Tyr Tyr Met Gln Gln Asn Gly Cys Tyr Lys Ile Glu Gly Arg Glu Ile 290 295 300 Glu Lys Leu Ile Glu Leu Val Leu Asp His Lys Gly Gly Lys Ile Thr 305 310 315 320 Leu Asn Arg Lys Trp Val Gly Lys Asp Ala His Leu Ile Leu Lys Ala 325 330 335 Ile Gly Ile Asp Ala Asp Glu Ser Val Arg Cys Ile Ile Phe Glu Ala 340 345 350 Glu Lys Asp Asn Pro Leu Val Val Glu Glu Leu Met Met Pro Ile Leu 355 360 365 Gly Ile Val Arg Ala Lys Asn Val Asp Glu Ala Ile Met Ile Ala Thr 370 375 380 Glu Leu Glu His Gly Asn Arg His Ser Ala His Met His Ser Lys Asn 385 390 395 400 Val Asp Asn Leu Thr Lys Phe Gly Lys Ile Ile Asp Thr Ala Ile Phe 405 410 415 Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Tyr Gly Gly Glu Gly 420 425 430 Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser 435 440 445 Ala Arg Thr Phe Thr Lys Ser Arg Arg Cys Val Leu Ala Asp Gly Leu 450 455 460 Ser Ile Arg 465 <210> 59 <211> 467 <212> PRT <213> Thermoanaerobacterium xylanolyticum <400> 59 Met Lys Val Lys Glu Glu Asp Ile Glu Ala Ile Val Lys Lys Val Leu 1 5 10 15 Ser Glu Phe Asn Leu Glu Lys Thr Thr Ser Lys Tyr Gly Asp Val Gly 20 25 30 Ile Phe Gln Asp Met Asn Asp Ala Ile Ser Ala Ala Lys Asp Ala Gln 35 40 45 Lys Lys Leu Arg Asn Met Pro Met Glu Ser Arg Glu Lys Ile Ile Gln 50 55 60 Asn Ile Arg Lys Lys Ile Met Glu Asn Lys Lys Ile Leu Ala Glu Met 65 70 75 80 Gly Val Arg Glu Thr Gly Met Gly Arg Val Glu His Lys Ile Val Lys 85 90 95 His Glu Leu Val Ala Leu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr 100 105 110 Thr Ala Trp Ser Gly Asp Lys Gly Leu Thr Leu Val Glu Met Gly Pro 115 120 125 Phe Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu Thr 130 135 140 Val Leu Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val 145 150 155 160 Phe Asn Pro His Pro Gly Ala Val Asn Val Ser Asn Tyr Ala Val Lys 165 170 175 Leu Val Asn Glu Ala Ala Met Glu Ala Gly Gly Pro Glu Asn Leu Val 180 185 190 Val Ser Val Glu Lys Pro Thr Leu Glu Thr Gly Asn Val Met Phe Lys 195 200 205 Ser Ser Asp Val Ser Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val 210 215 220 Thr Ala Val Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly 225 230 235 240 Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala 245 250 255 Lys Asp Ile Ile Asp Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile 260 265 270 Ala Glu Lys Glu Val Val Ser Val Asp Lys Ile Thr Asp Glu Leu Ile 275 280 285 Tyr Tyr Met Gln Lys Asn Gly Cys Tyr Lys Ile Glu Gly Arg Glu Ile 290 295 300 Glu Lys Leu Ile Glu Leu Val Leu Asp His Glu Gly Gly Lys Thr Thr 305 310 315 320 Leu Asn Arg Lys Trp Val Gly Lys Asp Ala His Leu Ile Leu Lys Ala 325 330 335 Ile Gly Ile Asp Ala Asp Glu Ser Val Arg Cys Ile Ile Phe Glu Ala 340 345 350 Glu Lys Asp Asn Pro Leu Val Val Glu Glu Leu Met Met Pro Ile Leu 355 360 365 Gly Ile Val Arg Ala Lys Asn Val Asp Glu Ala Ile Met Ile Ala Thr 370 375 380 Glu Leu Glu His Gly Asn Arg His Ser Ala His Met His Ser Lys Asn 385 390 395 400 Ile Asp Asn Leu Thr Lys Phe Gly Lys Ile Ile Asp Thr Ala Ile Phe 405 410 415 Val Lys Asn Ala Pro Ser Tyr Ala Ala Leu Gly Tyr Gly Gly Glu Gly 420 425 430 Tyr Cys Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser 435 440 445 Ala Arg Thr Phe Thr Lys Ser Arg Arg Cys Val Leu Ala Asp Gly Leu 450 455 460 Ser Ile Arg 465 <210> 60 <211> 477 <212> PRT <213> Acetonema longum <400> 60 Met Val Asp Gln Thr Leu Ile Glu Gln Ile Thr Arg Ala Val Leu Thr 1 5 10 15 Gln Met Lys Ala Gly Lys Asp Ala Ala Val Ser Gly Asp Gly Ile Phe 20 25 30 Ala Thr Val Asp Gln Ala Val Ala Ala Ala Arg Gln Ala Tyr Gln Glu 35 40 45 Leu Arg Leu Leu Thr Leu Glu Lys Arg Glu Thr Leu Ile Arg Ala Ile 50 55 60 Arg Asp Ala Ala Phe Ala Asn Ala Ala Val Ile Ala Gln Met Ala Val 65 70 75 80 Gln Glu Ser Gly Met Gly Arg Val Glu Asp Lys Ile Leu Lys Asn Gln 85 90 95 Leu Ala Ala Arg Lys Thr Pro Gly Thr Glu Asp Leu Thr Ser Arg Ala 100 105 110 Trp Ser Gly Asp His Gly Leu Thr Leu Val Glu Met Ala Pro Tyr Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Ser Glu Thr Val Ile 130 135 140 Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Ile Val Phe Ser 145 150 155 160 Pro His Pro Thr Ala Gln Asn Thr Ser Leu Thr Thr Ile Arg Leu Leu 165 170 175 Asn Glu Ala Ile Val Lys Ala Gly Gly Pro Asp Asn Leu Leu Thr Ala 180 185 190 Val Ala Glu Pro Ser Ile Glu Ala Ala Asn Ala Met Met Arg His Pro 195 200 205 Gly Ile Gln Met Leu Val Ala Thr Gly Gly Pro Ala Val Val Lys Ala 210 215 220 Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Val Val Asp Glu Thr Ala Asp Ile Ala Lys Ala Ala Lys Asp 245 250 255 Ile Val Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Ile Ala Val Gly Arg Ile Ala Asp Glu Leu Ile Ser Tyr 275 280 285 Leu Gln Lys Tyr Gly Ala Tyr Leu Ile Ser Gly Arg Asp Ile Glu Arg 290 295 300 Leu Met Glu Val Val Leu Thr Glu Arg Thr Glu Glu Met Ala Pro Gly 305 310 315 320 Cys Val Gly Lys Pro Arg Arg Val Tyr Gly Val Asn Lys Asp Tyr Ile 325 330 335 Gly Lys Asp Ala Lys Phe Ile Leu Ser Lys Ile Asn Ile Gln Ala Pro 340 345 350 Asp His Ile Arg Val Ile Leu Cys Glu Thr Pro Ala Asp His Pro Phe 355 360 365 Val Leu Glu Glu Leu Met Met Pro Val Leu Pro Leu Val Ser Val Arg 370 375 380 Asp Ile Asp Ala Ala Ile Asp Leu Ala Val Lys Val Glu His Gly Asn 385 390 395 400 Arg His Thr Ala Val Met His Ser Lys Asn Val Asp Tyr Met Thr Arg 405 410 415 Leu Ala Lys Ala Ile Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser 420 425 430 Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Phe Thr Thr Phe Thr Ile 435 440 445 Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Thr Arg 450 455 460 Gln Arg Arg Cys Ala Leu Val Asp Ala Phe Ser Ile Val 465 470 475 <210> 61 <211> 465 <212> PRT <213> Geobacillus thermoglucosidans <400> 61 Met Ser Val Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu 1 5 10 15 Glu Glu Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp 20 25 30 Gly Ile Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala 35 40 45 Gln Lys Glu Leu Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile 50 55 60 Glu Ala Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg 65 70 75 80 Met Ala Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val 85 90 95 Lys Asn Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg 100 105 110 Thr Glu Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser 115 120 125 Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu 130 135 140 Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val 145 150 155 160 Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile 165 170 175 Lys Ile Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu 180 185 190 Ile Thr Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met 195 200 205 Lys His Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val 210 215 220 Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Val Ala Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu 275 280 285 Ile Asp Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu 290 295 300 Gln Ile Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn 305 310 315 320 Lys Glu Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly 325 330 335 Ile Asn Val Pro Pro Asp Ile Arg Val Ala Ile Met Glu Val Asp Gly 340 345 350 Lys His Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile 355 360 365 Val Arg Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val 370 375 380 Glu His Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp 385 390 395 400 His Leu Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys 405 410 415 Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala 420 425 430 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys 435 440 445 Asp Phe Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile 450 455 460 Arg 465 <210> 62 <211> 463 <212> PRT <213> Geobacillus sp. <400> 62 Met Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu Glu Glu 1 5 10 15 Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp Gly Ile 20 25 30 Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala Gln Lys 35 40 45 Glu Leu Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile Glu Ala 50 55 60 Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg Met Ala 65 70 75 80 Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val Lys Asn 85 90 95 Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg Thr Glu 100 105 110 Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr 115 120 125 Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile 130 135 140 Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe 145 150 155 160 Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile Lys Ile 165 170 175 Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu Ile Thr 180 185 190 Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met Lys His 195 200 205 Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys 210 215 220 Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn 225 230 235 240 Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala Lys 245 250 255 Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala 260 265 270 Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu Ile Asp 275 280 285 Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu Gln Ile 290 295 300 Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn Lys Glu 305 310 315 320 Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly Ile Asn 325 330 335 Val Pro Pro Asp Thr Arg Val Ala Ile Met Glu Val Asp Gly Lys His 340 345 350 Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg 355 360 365 Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val Glu His 370 375 380 Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu 385 390 395 400 Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys Asn Ala 405 410 415 Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala Thr Phe 420 425 430 Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe 435 440 445 Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile Arg 450 455 460 <210> 63 <211> 463 <212> PRT <213> Geobacillus thermoglucosidasius <400> 63 Met Asp Ala Gln Lys Ile Glu Lys Leu Val Arg Lys Ile Leu Glu Glu 1 5 10 15 Met Glu Glu Lys Lys Lys Pro Ala Glu Thr Glu Cys Glu Trp Gly Ile 20 25 30 Phe Asp His Met Asn Gln Ala Ile Glu Ala Ala Glu Ile Ala Gln Lys 35 40 45 Glu Phe Val Gln Leu Ser Leu Gly Gln Arg Gly Lys Leu Ile Glu Ala 50 55 60 Ile Arg Lys Ala Ala Lys Glu Asn Ala Glu Lys Phe Ala Arg Met Ala 65 70 75 80 Val Asp Glu Thr Gly Met Gly Lys Tyr Glu Asp Lys Ile Val Lys Asn 85 90 95 Leu Leu Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Arg Thr Glu 100 105 110 Val Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr 115 120 125 Gly Val Ile Gly Ala Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile 130 135 140 Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe 145 150 155 160 Ser Pro His Pro Arg Ala Lys Asn Thr Ser Leu Tyr Ala Ile Lys Ile 165 170 175 Phe Asn Gln Ala Ile Val Glu Ala Gly Gly Pro Lys Asn Leu Ile Thr 180 185 190 Thr Val Ala Asn Pro Ser Ile Glu Gln Ala Glu Ile Met Met Lys His 195 200 205 Lys Thr Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys 210 215 220 Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn 225 230 235 240 Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala Lys 245 250 255 Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Val Ala 260 265 270 Glu Lys Glu Val Ile Ala Val Glu Ser Ile Ala Asp Arg Leu Ile Asp 275 280 285 Tyr Met Lys Lys His Gly Ala Tyr Glu Ile Thr Asn Lys Glu Gln Ile 290 295 300 Gln Gln Leu Thr Asp Leu Val Val Glu Asn Gly His Ala Asn Lys Glu 305 310 315 320 Phe Val Gly Lys Asp Ala Ala Tyr Ile Leu Lys His Ile Gly Ile Asn 325 330 335 Val Pro Pro Asp Ile Arg Val Ala Ile Met Glu Val Asp Gly Lys His 340 345 350 Pro Leu Val Thr Val Glu Leu Met Met Pro Ile Leu Pro Ile Val Arg 355 360 365 Val Lys Asn Val Asp Gln Ala Ile Glu Leu Ala Val Glu Val Glu His 370 375 380 Gly Phe Arg His Thr Ala Ile Met His Ser Lys Asn Val Asp His Leu 385 390 395 400 Thr Lys Phe Ala Lys Ala Ile Gln Thr Thr Ile Phe Val Lys Asn Ala 405 410 415 Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr Ala Thr Phe 420 425 430 Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe 435 440 445 Ala Arg Lys Arg Lys Cys Val Leu Val Asp Ala Leu Ser Ile Arg 450 455 460 <210> 64 <211> 463 <212> PRT <213> Bacillus azotoformans <400> 64 Met Ala Val Glu Ala Lys Ala Ile Glu Glu Ile Val Lys Lys Ile Leu 1 5 10 15 Glu Glu Met Met Ile Lys Lys Asp Ala Cys Ile Thr Gly Tyr Gly Ile 20 25 30 Phe Glu Asp Met Asn Glu Ala Ile Glu Ala Ala Thr Ile Ala Gln Lys 35 40 45 Glu Leu Leu Lys Leu Ser Leu Glu Gln Arg Gly Asn Leu Ile Thr Ala 50 55 60 Ile Arg Lys Ala Ala Lys Asp Asn Ala Glu Thr Phe Ala Gln Met Ala 65 70 75 80 Val Asp Glu Thr Gly Met Gly Asn Tyr Gly Asp Lys Val Ile Lys Asn 85 90 95 Leu Ile Ala Ala Glu Lys Thr Pro Gly Ile Glu Asp Leu Thr Thr Glu 100 105 110 Ala Phe Ser Gly Asp His Gly Leu Thr Leu Val Glu Leu Ser Pro Tyr 115 120 125 Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Val 130 135 140 Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val Val Phe 145 150 155 160 Ser Pro His Pro Thr Ala Lys Asn Thr Ser Leu Lys Ala Ile Glu Val 165 170 175 Ile Asn Lys Ala Ile Ile Lys Ala Gly Gly Pro Pro Asn Leu Ile Thr 180 185 190 Ser Val Ala Asn Pro Thr Ile Asp Gln Ala Asn Ile Met Met Lys His 195 200 205 Lys Lys Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val Lys 210 215 220 Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn 225 230 235 240 Pro Pro Ala Val Val Asp Glu Thr Ala Asn Leu Glu Lys Ala Ala Arg 245 250 255 Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Thr Ala 260 265 270 Glu Lys Glu Val Ile Val Val Asp Ser Val Ala Asp Tyr Leu Val Ser 275 280 285 Tyr Met Lys Lys His Gly Ala Phe Leu Ile Thr Asp Lys Glu Gln Ile 290 295 300 Gln Lys Leu Thr Glu Leu Val Val Asp Asn Gly His Ala Asn Lys Glu 305 310 315 320 Leu Val Gly Lys Ser Val Ala His Ile Leu Gln Arg Ile Gly Ile Glu 325 330 335 Val Pro Ser Asp Ala Arg Val Ala Ile Leu Asn Val Glu Arg Asn His 340 345 350 Pro Leu Val Lys Ala Glu Leu Met Met Pro Ile Leu Pro Val Val Arg 355 360 365 Val Glu Asn Val Asp Ala Ala Ile Glu Leu Ala Val Glu Ala Glu Gln 370 375 380 Gly Phe Arg His Thr Ala Ile Met His Ser Thr Asn Ile Asp Asn Leu 385 390 395 400 Thr Lys Phe Ser Lys Glu Ile Gln Thr Thr Ile Phe Val Lys Asn Gly 405 410 415 Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly Tyr Ala Thr Phe 420 425 430 Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys Asp Phe 435 440 445 Ala Arg Arg Arg Lys Cys Val Leu Val Asp Gly Leu Ser Ile Arg 450 455 460 <210> 65 <211> 503 <212> PRT <213> Clostridium sticklandii <400> 65 Met Lys Ala Gly Asp Ile Val Gln Asp Phe Ile Thr Glu Arg Asp Val 1 5 10 15 Glu Lys Ile Ile Glu Gln Val Leu Ser Lys Leu Glu Pro Val Ile Glu 20 25 30 Gln Val Lys Pro Lys Glu Ile Asn Met Leu Pro Asn Lys Thr Asn Ile 35 40 45 Asp Phe Ser Gln Asn Ala Asn Gly Ile Phe Glu Ser Ile Asp Leu Ala 50 55 60 Val Glu Ser Ala Leu Glu Ala His Ile Ile Leu Thr Ser Tyr Lys Leu 65 70 75 80 Glu Asp Arg Glu Lys Met Ile Gln Ser Ile Arg Lys Glu Val Leu Gly 85 90 95 Asp Ile Glu Asn Ile Ala Arg Leu Val Tyr Glu Glu Thr Lys Leu Gly 100 105 110 Lys Tyr Glu Asp Lys Ile Ala Lys Ile Asn Leu Ala Ala Ser Lys Thr 115 120 125 Pro Gly Thr Glu Asp Ile Lys Thr Ser Ala Ile Ser Gly Asp Tyr Gly 130 135 140 Leu Thr Ile Glu Glu Met Ala Pro Phe Gly Val Ile Gly Ala Val Thr 145 150 155 160 Pro Val Thr Asn Pro Val Glu Thr Leu Ile Asn Asn Ala Ile Ser Met 165 170 175 Ile Ser Gly Gly Asn Ser Val Val Phe Asn Val His Pro Ser Ser Lys 180 185 190 Lys Ser Ser Ala Tyr Thr Val Glu Leu Ile Asn Lys Ala Val Leu Lys 195 200 205 Ala Gly Gly Pro Gln Asn Leu Val Thr Met Val Lys Glu Pro Thr Ile 210 215 220 Glu Thr Val Asn Gln Leu Ser Ser His Pro Arg Ile Ser Met Met Val 225 230 235 240 Gly Thr Gly Gly Pro Gly Leu Val Lys Ser Leu Leu Lys Ser Gly Lys 245 250 255 Lys Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu 260 265 270 Thr Ala Asp Met Asn Leu Ala Ala Lys Gly Ile Ile Glu Gly Ala Ser 275 280 285 Phe Asp Asn Asn Ile Leu Cys Ile Ala Glu Lys Glu Val Phe Val Val 290 295 300 Asn Glu Val Ala Asp Asp Leu Ile Tyr Asn Met Leu Ser Ser Gly Ala 305 310 315 320 Tyr Met Leu Asn Gln Glu Glu Leu Glu Lys Val Met Lys Leu Thr Leu 325 330 335 Val Glu Asp Glu Asp Leu Gly Ala Lys Ser Cys Thr Leu Ser Pro Lys 340 345 350 Lys Lys Tyr His Val His Lys Asn Trp Val Gly Lys Asp Ala Ser Lys 355 360 365 Ile Leu Ser Glu Ile Gly Ile Thr Lys Gln Asp Val Lys Leu Leu Ile 370 375 380 Cys Glu Val Asp Ser Asp His Pro Tyr Val Thr Leu Glu Gln Met Met 385 390 395 400 Pro Ile Leu Pro Leu Val Arg Cys Ser Asp Val Asp Glu Ala Ile Lys 405 410 415 Leu Ala Val Lys Ala Glu Gly Thr Asn Lys His Thr Ala Ser Ile Phe 420 425 430 Ser Arg Asn Val Asp Asn Met Thr Lys Phe Ala Arg Ala Ile Asn Thr 435 440 445 Thr Ile Phe Val Lys Asn Ala Pro Thr Leu Ala Gly Val Gly Tyr Lys 450 455 460 Gly Glu Gly Asn Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly 465 470 475 480 Ile Thr Ser Ala Lys Thr Phe Thr Arg Val Arg Arg Cys Val Leu Ala 485 490 495 Glu Gly Gly Phe Arg Ile Val 500 <210> 66 <211> 482 <212> PRT <213> Thermincola potens <400> 66 Met Ala Ile Glu Ala Tyr Gln Ile Glu Lys Ile Val Glu Glu Val Met 1 5 10 15 Arg Lys Met Val Ser Gly Gly Ser Gly Asp Ser Phe Ala Gly Lys Ala 20 25 30 Lys Gly Ile Phe Glu Ser Val Asp Glu Ala Val Lys Ala Ala Lys Ala 35 40 45 Ala Gln Lys Glu Leu Val Ala Met Arg Ile Glu Lys Arg Glu Met Leu 50 55 60 Leu Lys Ala Met Arg Glu Ala Ala Ile Ala His Ala Glu Glu Leu Ala 65 70 75 80 Arg Leu Ala Val Glu Glu Thr Gly Met Gly Arg Val Thr Asp Lys Ile 85 90 95 Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro Gly Thr Glu Asn Leu 100 105 110 Gln Pro Ser Ala Val Thr Gly Asp Arg Gly Leu Thr Leu Ile Glu Arg 115 120 125 Ala Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Cys 130 135 140 Ala Thr Val Ile Asn Asn Ser Ile Ser Met Val Ala Ala Gly Asn Ser 145 150 155 160 Val Val Phe Ser Val His Pro Gly Ala Lys Lys Ala Ser Leu Leu Thr 165 170 175 Val Glu Ile Leu Asn Glu Ala Ile Glu Lys Ala Gly Gly Pro Ala Asn 180 185 190 Val Leu Thr Ala Val Ala Ser Pro Ser Leu Glu Asn Thr Asn Ala Leu 195 200 205 Met Lys His Pro Asp Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly 210 215 220 Leu Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Leu Glu Arg 245 250 255 Ala Ala Lys Ser Ile Val Ala Gly Ala Ser Phe Asp Asn Asn Leu Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Ile Val Val Asp Tyr Val Ala Asn Gln 275 280 285 Leu Ile Ser Tyr Met Lys Gln Asn Gly Ala Tyr Leu Ala Asn Asp Arg 290 295 300 Glu Ile Lys Ala Leu Met Asp Leu Val Leu Thr Lys Asn Glu Asn Leu 305 310 315 320 Lys Ala Glu Gly Cys Thr Val Lys Pro Glu Lys Leu Tyr Gly Gly Ile 325 330 335 Asn Lys Glu Tyr Val Gly Lys Asp Ala Ala Tyr Ile Met Lys Lys Ile 340 345 350 Gly Val Asp Ile Pro Glu Asp Thr Lys Leu Ile Ile Cys Glu Val Asp 355 360 365 Glu Asp His Pro Phe Val Leu Glu Glu Leu Met Met Pro Ile Leu Pro 370 375 380 Ile Val Arg Val Pro Asn Val Gln Lys Ala Ile Glu Val Gly Val Arg 385 390 395 400 Val Glu His Gly Asn Arg His Thr Ala Val Met His Ser Gln Asn Ile 405 410 415 Asp Asn Leu Ser Ala Phe Ala Arg Ala Val Gln Thr Thr Ile Phe Val 420 425 430 Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly Tyr 435 440 445 Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ala Ala 450 455 460 Ser Ser Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Gly Phe Ser 465 470 475 480 Ile Val <210> 67 <211> 462 <212> PRT <213> Clostridium sp. <400> 67 Met Ser Val Asn Glu Gln Met Ile Gln Asp Ile Val Ser Glu Val Met 1 5 10 15 Ala Lys Met Gln Ile Ala Ser Glu Val Ser Asp Asn His Gly Ile Phe 20 25 30 Ala Asp Met Asn Glu Ala Ile Glu Ala Ala Lys Lys Ala Gln Lys Ile 35 40 45 Val Gly Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile 50 55 60 Arg Lys Lys Thr Val Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val 65 70 75 80 Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Gly Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Met Ile 165 170 175 Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr 180 185 190 Val Glu Lys Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys 195 200 205 Ala Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu Met His Tyr 275 280 285 Met Val Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Glu 290 295 300 Ala Leu Thr Ala Val Val Leu Lys Asp Gly Arg Leu Asn Arg Asn Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Ser Val 325 330 335 Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Ala Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ser Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg 450 455 460 <210> 68 <211> 470 <212> PRT <213> Fusobacterium sp. <400> 68 Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Lys Ile 1 5 10 15 Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala 20 25 30 Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu 35 40 45 Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu 50 55 60 Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Ser His Val 65 70 75 80 Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val 85 90 95 Ser Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly 100 105 110 Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr 115 120 125 Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser 130 135 140 Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala 145 150 155 160 Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr 165 170 175 Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly 180 185 190 Gly Pro Asp Asn Leu Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn 195 200 205 Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr 210 215 220 Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala 245 250 255 Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp 260 265 270 Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser 275 280 285 Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu 290 295 300 Leu Lys Asp Lys Lys Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys 305 310 315 320 Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu 325 330 335 Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile 340 345 350 Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met 355 360 365 Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys 370 375 380 Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His 385 390 395 400 Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr 405 410 415 Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly 420 425 430 Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly 435 440 445 Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val 450 455 460 Gly Gly Phe Ser Ile Lys 465 470 <210> 69 <211> 470 <212> PRT <213> Fusobacterium sp. <400> 69 Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile 1 5 10 15 Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala 20 25 30 Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu 35 40 45 Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu 50 55 60 Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val 65 70 75 80 Ser Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val 85 90 95 Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly 100 105 110 Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr 115 120 125 Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser 130 135 140 Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala 145 150 155 160 Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr 165 170 175 Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly 180 185 190 Gly Pro Asp Asn Leu Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn 195 200 205 Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr 210 215 220 Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala 245 250 255 Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp 260 265 270 Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser 275 280 285 Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu 290 295 300 Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys 305 310 315 320 Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu 325 330 335 Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile 340 345 350 Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met 355 360 365 Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys 370 375 380 Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His 385 390 395 400 Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr 405 410 415 Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly 420 425 430 Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly 435 440 445 Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val 450 455 460 Gly Gly Phe Ser Ile Lys 465 470 <210> 70 <211> 462 <212> PRT <213> Ruminococcus sp. <400> 70 Met Pro Ile Ser Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met 1 5 10 15 Ala Lys Met Gln Ile Ala Asp Ala Pro Ala Gly Lys His Gly Val Phe 20 25 30 Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ala Gln Leu Val 35 40 45 Val Lys Thr Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile 50 55 60 Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Leu Ala Arg Met Gly Val 65 70 75 80 Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His 85 90 95 Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu 130 135 140 Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Val Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu 165 170 175 Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr 180 185 190 Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys 195 200 205 Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Asp Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr 275 280 285 Met Ile Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp 290 295 300 Lys Leu Val Glu Thr Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Ser Met Ile Gly Val Gln Ala 325 330 335 Pro Ala Asn Thr Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg 450 455 460 <210> 71 <211> 465 <212> PRT <213> Fusobacterium nucleatum <400> 71 Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met 1 5 10 15 Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala Gly Asn Ser Lys Asn 20 25 30 Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu Glu Ala Lys Lys Ala 35 40 45 Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Lys Ile Ile 50 55 60 Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val Thr Glu Leu Ala Glu 65 70 75 80 Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu 85 90 95 Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys 100 105 110 Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser 115 120 125 Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu 130 135 140 Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val 145 150 155 160 Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Thr Val 165 170 175 Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly Gly Pro Asp Asn Leu 180 185 190 Val Val Thr Ile Arg Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile 195 200 205 Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr Gly Gly Pro Gly Val 210 215 220 Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile Val Asn Tyr Leu 275 280 285 Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu 290 295 300 Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys Asn Asn Ser Pro Asp 305 310 315 320 Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly 325 330 335 Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys 340 345 350 Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile 355 360 365 Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu 370 375 380 Glu Arg Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp 385 390 395 400 Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys 405 410 415 Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val 420 425 430 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys 435 440 445 Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile 450 455 460 Lys 465 <210> 72 <211> 465 <212> PRT <213> Fusobacterium nucleatum <400> 72 Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met 1 5 10 15 Lys Lys Met Thr Glu Gly Gly Val Ser Thr Ser Asn Asn Ser Thr Asn 20 25 30 Gly Val Phe Lys Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala 35 40 45 Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile 50 55 60 Ala Ser Ile Arg Asp Thr Leu Lys Ser His Ile Thr Glu Leu Ser Glu 65 70 75 80 Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu 85 90 95 Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys 100 105 110 Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser 115 120 125 Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu 130 135 140 Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val 145 150 155 160 Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val 165 170 175 Glu Leu Ile Asn Glu Ala Ile Lys Lys Ala Gly Gly Pro Asp Asn Leu 180 185 190 Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile 195 200 205 Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val 210 215 220 Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu 275 280 285 Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu 290 295 300 Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp 305 310 315 320 Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly 325 330 335 Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys 340 345 350 Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile 355 360 365 Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu 370 375 380 Glu Lys Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp 385 390 395 400 Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys 405 410 415 Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val 420 425 430 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg 435 440 445 Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile 450 455 460 Lys 465 <210> 73 <211> 470 <212> PRT <213> Fusobacterium sp. <400> 73 Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile 1 5 10 15 Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala 20 25 30 Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Gly Ala Ile Glu 35 40 45 Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu 50 55 60 Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val 65 70 75 80 Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val 85 90 95 Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly 100 105 110 Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr 115 120 125 Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser 130 135 140 Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala 145 150 155 160 Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr 165 170 175 Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly 180 185 190 Gly Pro Asp Asn Leu Ile Val Thr Ile Arg Glu Pro Ser Ile Glu Asn 195 200 205 Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr 210 215 220 Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala 245 250 255 Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp 260 265 270 Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser 275 280 285 Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu 290 295 300 Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys 305 310 315 320 Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu 325 330 335 Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile 340 345 350 Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met 355 360 365 Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys 370 375 380 Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His 385 390 395 400 Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr 405 410 415 Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly 420 425 430 Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly 435 440 445 Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val 450 455 460 Gly Gly Phe Ser Ile Lys 465 470 <210> 74 <211> 465 <212> PRT <213> Fusobacterium nucleatum <400> 74 Met Glu Phe Glu Val Asn Asn Leu Glu Glu Ile Val Glu Leu Ile Met 1 5 10 15 Lys Lys Met Ser Glu Ser Ser Ile Ser Thr Ser Ser Asn Ser Lys Asn 20 25 30 Gly Val Phe Glu Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala 35 40 45 Gln Thr Ile Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile 50 55 60 Ala Ser Ile Arg Asp Thr Leu Lys Pro Tyr Ile Thr Glu Leu Ser Glu 65 70 75 80 Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ser Asp Lys Glu Ile 85 90 95 Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys 100 105 110 Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser 115 120 125 Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu 130 135 140 Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val 145 150 155 160 Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val 165 170 175 Glu Leu Ile Asn Glu Ala Ile Lys Lys Val Gly Gly Pro Asp Asn Leu 180 185 190 Ile Val Thr Ile Thr Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile 195 200 205 Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val 210 215 220 Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu 275 280 285 Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Asp 290 295 300 Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp 305 310 315 320 Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly 325 330 335 Ile Glu Val Gly Asp Glu Ile Arg Val Ile Ile Val Glu Thr Ser Lys 340 345 350 Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile 355 360 365 Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu 370 375 380 Glu Lys Gly Leu Arg His Thr Ala Ile Ile His Ser Lys Asn Ile Asp 385 390 395 400 Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys 405 410 415 Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val 420 425 430 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg 435 440 445 Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile 450 455 460 Lys 465 <210> 75 <211> 465 <212> PRT <213> Fusobacterium nucleatum <400> 75 Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile Val Glu Leu Ile Met 1 5 10 15 Lys Lys Met Ser Glu Ser Gly Val Ser Thr Ser Asn Asn Ser Thr Asn 20 25 30 Gly Val Phe Glu Asn Val Asp Glu Ala Ile Ala Glu Ala Lys Lys Ala 35 40 45 Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu Arg Glu Arg Ile Ile 50 55 60 Ala Ser Ile Arg Asp Thr Leu Lys Thr His Ile Thr Glu Leu Ser Glu 65 70 75 80 Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val Ala Asp Lys Glu Leu 85 90 95 Lys Asn Arg Ile Ala Ile Glu Lys Thr Pro Gly Leu Glu Asp Leu Lys 100 105 110 Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val Met Glu Leu Ser 115 120 125 Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ser Glu 130 135 140 Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ala Val 145 150 155 160 Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser Ile Arg Ala Val 165 170 175 Glu Leu Ile Asn Glu Ala Ile Lys Lys Ala Gly Gly Pro Asp Asn Leu 180 185 190 Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr Glu Lys Ile Ile 195 200 205 Ala Asn Pro Asn Ile Lys Met Val Val Ala Thr Gly Gly Pro Gly Val 210 215 220 Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser Ile Val Asn Tyr Leu 275 280 285 Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Leu Lys Asp Lys Glu 290 295 300 Leu Ile Glu Lys Leu Leu Ser Ile Val Leu Lys Asn Asn Ser Pro Asp 305 310 315 320 Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Leu Leu Lys Gln Ile Gly 325 330 335 Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile Val Glu Thr Asp Lys 340 345 350 Asn His Pro Phe Ala Val Glu Glu Leu Leu Met Pro Ile Leu Pro Ile 355 360 365 Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys Val Ala Lys Glu Leu 370 375 380 Glu Lys Gly Leu Arg His Thr Ala Val Ile His Ser Lys Asn Ile Asp 385 390 395 400 Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr Thr Ile Leu Val Lys 405 410 415 Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly Gly Glu Gly His Val 420 425 430 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg 435 440 445 Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly Gly Phe Ser Ile 450 455 460 Lys 465 <210> 76 <211> 470 <212> PRT <213> Fusobacterium sp. <400> 76 Met Arg Gly Glu Leu Met Glu Phe Glu Val Asn Asn Ile Glu Glu Ile 1 5 10 15 Val Glu Leu Ile Met Lys Lys Met Ala Glu Ser Asn Ile Ser Thr Ala 20 25 30 Gly Asn Ser Lys Asn Gly Val Phe Asp Asn Val Asp Glu Ala Ile Glu 35 40 45 Glu Ala Lys Lys Ala Gln Ala Ile Leu Phe Ser Ser Lys Leu Glu Leu 50 55 60 Arg Glu Lys Ile Ile Ala Ser Ile Arg Asp Thr Leu Lys Asn His Val 65 70 75 80 Thr Glu Leu Ala Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val 85 90 95 Ala Asp Lys Glu Leu Lys Asn Lys Ile Ala Ile Glu Lys Thr Pro Gly 100 105 110 Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr 115 120 125 Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser 130 135 140 Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala 145 150 155 160 Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr 165 170 175 Ser Ile Arg Thr Val Glu Leu Ile Asn Glu Ala Ile Arg Lys Val Gly 180 185 190 Gly Pro Asp Asn Leu Ile Val Thr Ile Arg Glu Pro Ser Ile Glu Asn 195 200 205 Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr 210 215 220 Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala 245 250 255 Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Ala Gly Cys Ser Phe Asp 260 265 270 Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Val Ala Val Asp Ser 275 280 285 Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu 290 295 300 Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Leu Ser Leu Val Leu Lys 305 310 315 320 Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Arg Asp Ala Lys Tyr Leu 325 330 335 Leu Lys Gln Ile Gly Ile Glu Val Gly Asp Glu Ile Lys Val Ile Ile 340 345 350 Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met 355 360 365 Pro Ile Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys 370 375 380 Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Val Ile His 385 390 395 400 Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Glu Met Glu Thr 405 410 415 Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly 420 425 430 Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly 435 440 445 Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val 450 455 460 Gly Gly Phe Ser Ile Lys 465 470 <210> 77 <211> 481 <212> PRT <213> Clostridium asparagiforme <400> 77 Met Glu Ile Glu Thr Arg Asp Ile Glu Arg Ile Val Arg Gln Val Met 1 5 10 15 Ala Ala Met Glu Gln Gln Gly Thr Ile Ala Gly Gly Ala Tyr Pro Pro 20 25 30 Ala Pro Gly Ile Thr Ala Pro Arg Gly Asp Asn Gly Val Phe Glu Arg 35 40 45 Val Glu Asp Ala Ile Asp Ala Ala Trp Ala Ala Gly Arg Val Trp Ala 50 55 60 Phe His Tyr Lys Val Glu Asp Arg Arg Arg Val Ile Glu Ala Ile Arg 65 70 75 80 Val Met Ala Arg Glu Asn Ala Arg Thr Leu Ala Gln Met Val Arg Asp 85 90 95 Glu Thr Gly Met Gly Arg Val Glu Asp Lys Val Glu Lys His Leu Ala 100 105 110 Val Ala Asp Lys Thr Pro Gly Val Glu Cys Leu Thr Thr Asp Ala Ile 115 120 125 Ser Gly Asp Gly Gly Leu Met Ile Glu Glu Tyr Ala Pro Phe Gly Val 130 135 140 Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Thr Glu Thr Val Ile His 145 150 155 160 Asn Thr Ile Ser Met Ile Ala Gly Gly Asn Ser Val Val Phe Asn Val 165 170 175 His Pro Gly Ala Lys Lys Cys Cys Ala Phe Cys Leu Gln Leu Leu Asn 180 185 190 Lys Thr Ile Val Glu Asn Gly Gly Pro Ala Asn Leu Ile Thr Met Gln 195 200 205 Arg Asp Pro Thr Met Asp Ala Val Asn Lys Met Thr Ser Ser Pro Lys 210 215 220 Ile Arg Leu Met Val Gly Thr Gly Gly Met Gly Met Val Asn Ala Leu 225 230 235 240 Leu Arg Ser Gly Lys Lys Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro 245 250 255 Val Ile Val Asp Asp Thr Ala Asp Val Lys Leu Ala Ala Arg Glu Leu 260 265 270 Tyr Trp Gly Ala Ser Phe Asp Asn Asn Leu Phe Cys Phe Ala Glu Lys 275 280 285 Glu Val Phe Val Met Glu Ala Ser Ala Asp Gly Leu Ile Arg Gly Leu 290 295 300 Val Glu Gln Gly Ala Tyr Leu Leu Thr Pro Ala Glu Thr Glu Ala Ile 305 310 315 320 Val Lys Leu Ala Leu Ile Gln Lys Asp Gly Lys Tyr Glu Val Asn Lys 325 330 335 Lys Trp Val Gly Lys Asp Ala Gly Leu Phe Leu Gln Ala Ile Gly Val 340 345 350 Ser Gly His Glu Asn Thr Arg Leu Leu Ile Cys Asp Val Pro Lys Cys 355 360 365 His Pro Tyr Val Met Val Glu Gln Leu Met Pro Val Leu Pro Ile Val 370 375 380 Arg Cys Arg Thr Phe Asp Glu Cys Ile Gln Cys Ser Val Glu Ala Glu 385 390 395 400 Gln Gly Asn Arg His Thr Ser Ser Ile Phe Ser Thr Asn Val Tyr Asn 405 410 415 Met Thr Lys Phe Gly Lys Glu Ile Glu Thr Thr Ile Tyr Val Lys Asn 420 425 430 Gly Ala Thr Leu Arg Gly Leu Gly Ile Gly Gly Glu Gly His Thr Thr 435 440 445 Met Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Arg Ser 450 455 460 Phe Thr Arg Arg Arg Arg Cys Met Leu Ala Glu Gly Gly Leu Arg Ile 465 470 475 480 Ile <210> 78 <211> 462 <212> PRT <213> Clostridium phytofermentans <400> 78 Met Thr Val Asn Glu Gln Leu Val Gln Asp Ile Ile Lys Asn Val Val 1 5 10 15 Ala Ser Met Gln Leu Thr Gln Thr Asn Lys Thr Glu Leu Gly Val Phe 20 25 30 Asp Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Gln Leu Val 35 40 45 Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Ala Ile 50 55 60 Arg Lys Lys Thr Ile Glu His Ala Glu Thr Leu Ala Arg Met Ala Val 65 70 75 80 Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Val Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Ile 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Asn Phe Ala Val Gln Leu Ile 165 170 175 Asn Glu Ala Ser Leu Ser Ala Gly Gly Pro Val Asn Ile Ala Cys Ser 180 185 190 Val Arg Lys Pro Thr Leu Asp Ser Ser Lys Ile Met Met Ser His Gln 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Gln Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Val Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Ile Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Val Val Ala Ile Asp Ala Ile Ala Asn Glu Leu Met Asn Tyr 275 280 285 Met Val Lys Glu Gln Gly Cys Tyr Ala Ile Thr Lys Glu Gln Gln Glu 290 295 300 Lys Leu Thr Asn Leu Val Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys 305 310 315 320 Val Gly Lys Asp Ala Arg Thr Leu Leu Gly Met Ile Gly Ile Asp Val 325 330 335 Pro Ser Asn Ile Arg Cys Ile Ile Phe Glu Gly Glu Lys Glu His Pro 340 345 350 Leu Ile Ser Glu Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala 355 360 365 Lys Ser Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr 385 390 395 400 Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro 405 410 415 Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg 450 455 460 <210> 79 <211> 470 <212> PRT <213> Fusobacterium sp. <400> 79 Met Arg Gly Glu Leu Met Glu Leu Glu Val Lys Asn Ile Glu Glu Ile 1 5 10 15 Val Asp Leu Ile Met Lys Lys Met Thr Glu Ser Asn Val Ala Val Ser 20 25 30 Tyr Asp Ser Lys Asn Gly Val Phe Asp Asp Val Asp Val Ala Ile Ala 35 40 45 Glu Ala Lys Lys Ala Gln Thr Val Leu Phe Ser Ser Lys Leu Glu Leu 50 55 60 Arg Glu Arg Ile Ile Ala Ser Ile Arg Glu Thr Met Arg Ala His Ile 65 70 75 80 Thr Glu Leu Ser Glu Leu Ala Val Lys Glu Thr Gly Met Gly Arg Val 85 90 95 Lys Asp Lys Glu Gln Lys Asn Arg Val Ala Ile Asp Arg Thr Pro Gly 100 105 110 Leu Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr 115 120 125 Val Met Glu Phe Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser 130 135 140 Thr Asn Pro Ser Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala 145 150 155 160 Ala Gly Asn Ala Val Ile Phe Ala Pro His Pro Gly Ala Lys Arg Thr 165 170 175 Ser Ile Arg Ala Val Glu Leu Ile Asn Glu Ala Ile Lys Lys Val Gly 180 185 190 Gly Pro Glu Asn Leu Val Val Thr Ile Ser Glu Pro Ser Ile Glu Asn 195 200 205 Thr Glu Lys Ile Ile Ala Asn Pro Asn Ile Lys Met Leu Val Ala Thr 210 215 220 Gly Gly Pro Gly Val Val Lys Thr Val Met Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala 245 250 255 Asp Ile Glu Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser Phe Asp 260 265 270 Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Val Ile Ala Val Asp Ser 275 280 285 Ile Val Asn Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu 290 295 300 Leu Lys Asp Lys Glu Leu Ile Glu Lys Leu Val Ser Leu Val Leu Lys 305 310 315 320 Asn Asn Ser Pro Asp Arg Lys Tyr Val Gly Lys Asp Ala Lys Tyr Ile 325 330 335 Leu Lys Gln Leu Gly Ile Glu Val Gly Asp Glu Ile Arg Val Ile Ile 340 345 350 Val Glu Thr Asp Lys Asn His Pro Phe Ala Val Glu Glu Leu Leu Met 355 360 365 Pro Val Leu Pro Ile Val Lys Val Lys Asp Ala Leu Glu Gly Ile Lys 370 375 380 Val Ala Lys Glu Leu Glu Arg Gly Leu Arg His Thr Ala Ile Ile His 385 390 395 400 Ser Lys Asn Ile Asp Ile Leu Ser Lys Tyr Ala Arg Glu Met Glu Thr 405 410 415 Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Ile Gly 420 425 430 Gly Glu Gly His Val Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly 435 440 445 Leu Thr Ser Ala Arg Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val 450 455 460 Gly Gly Phe Ser Ile Lys 465 470 <210> 80 <211> 462 <212> PRT <213> Lachnospiraceae bacterium <400> 80 Met Ser Val Asn Glu Lys Met Val Gln Asp Ile Val Gln Glu Val Val 1 5 10 15 Ala Lys Met Gln Ile Ser Ser Asp Val Ser Gly Lys Lys Gly Val Phe 20 25 30 Ser Asp Met Asn Glu Ala Ile Glu Ala Ser Lys Lys Ala Gln Lys Ile 35 40 45 Val Ala Lys Met Ser Met Asp Gln Arg Glu Ala Ile Ile Ser Lys Ile 50 55 60 Arg Glu Lys Ile Lys Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val 65 70 75 80 Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Leu 165 170 175 Asn Glu Ala Ser Val Glu Val Gly Gly Pro Glu Asn Ile Ala Val Thr 180 185 190 Val Glu His Pro Thr Met Glu Thr Ser Asp Val Met Met Lys His Lys 195 200 205 Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr 275 280 285 Met Val Asn Glu Gln Gly Cys Tyr Met Ile Ser Lys Glu Glu Gln Asp 290 295 300 Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Ile Thr Val 325 330 335 Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg 450 455 460 <210> 81 <211> 462 <212> PRT <213> Ruminococcus gnavus <400> 81 Met Ser Val Asn Glu Lys Met Val Gln Asp Ile Val Gln Glu Val Val 1 5 10 15 Ala Lys Met Gln Ile Ser Ser Asp Val Ser Gly Lys Lys Gly Val Phe 20 25 30 Ser Asp Met Asn Glu Ala Ile Glu Ala Ser Lys Lys Ala Gln Lys Ile 35 40 45 Val Ala Lys Met Ser Met Asp Gln Arg Glu Ala Ile Ile Ser Lys Ile 50 55 60 Arg Glu Lys Ile Lys Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val 65 70 75 80 Glu Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Leu 165 170 175 Asn Glu Ala Ser Val Glu Val Gly Gly Pro Glu Asn Ile Ala Val Thr 180 185 190 Val Glu His Pro Thr Met Glu Thr Ser Asp Ile Met Met Lys His Lys 195 200 205 Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr 275 280 285 Met Val Ser Glu Gln Gly Cys Tyr Met Ile Ser Lys Glu Glu Gln Asp 290 295 300 Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Ile Thr Val 325 330 335 Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg 450 455 460 <210> 82 <211> 462 <212> PRT <213> Ruminococcus obeum <400> 82 Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met 1 5 10 15 Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Val Phe 20 25 30 Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ala Glu Leu Ile 35 40 45 Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile 50 55 60 Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val 65 70 75 80 Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His 85 90 95 Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val 165 170 175 Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr 180 185 190 Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr 275 280 285 Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp 290 295 300 Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Ser Met Ile Gly Val Asn Ala 325 330 335 Pro Ala Asn Thr Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg 450 455 460 <210> 83 <211> 473 <212> PRT <213> Clostridium saccharolyticum <400> 83 Met Glu Ile Gly Ala Lys Glu Ile Glu Leu Ile Val Arg Glu Val Leu 1 5 10 15 Ala Gly Ile Glu Ser Arg Gly Pro Lys Leu Ser Tyr Ile Pro Ala Gln 20 25 30 Ser Asp Asn Gly Val Phe Glu Arg Val Glu Asp Ala Ile Gly Ala Ala 35 40 45 His Thr Ala Gln Arg Glu Trp Val Glu His Tyr Arg Val Glu Asp Arg 50 55 60 Arg Arg Ile Ile Glu Ala Ile Arg Met Thr Ala Lys Ser His Ala Lys 65 70 75 80 Thr Leu Ala Lys Leu Val Trp Glu Glu Thr Gly Met Gly Arg Phe Glu 85 90 95 Asp Lys Ile Gln Lys His Met Ala Val Ile Glu Lys Thr Pro Gly Val 100 105 110 Glu Cys Leu Thr Thr Asp Ala Ile Ser Gly Asp Glu Gly Leu Met Ile 115 120 125 Glu Glu Tyr Ala Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Ser Thr 130 135 140 Asn Pro Thr Glu Thr Ile Ile Asn Asn Thr Ile Ser Met Ile Ala Gly 145 150 155 160 Gly Asn Ala Val Val Phe Asn Val His Pro Gly Ala Lys Lys Cys Cys 165 170 175 Ala His Cys Leu Lys Leu Leu His Gln Ala Ile Val Glu Asn Gly Gly 180 185 190 Pro Ala Asn Leu Ile Thr Met Gln Lys Glu Pro Thr Met Glu Ala Val 195 200 205 Thr Lys Met Thr Ser Asp Pro Arg Ile Arg Leu Met Val Gly Thr Gly 210 215 220 Gly Met Pro Met Val Asn Ala Leu Leu Arg Ser Gly Lys Lys Thr Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Ser Ala Asp 245 250 255 Val Ser Leu Ala Ala Arg Glu Ile Tyr Arg Gly Ala Ser Phe Asp Asn 260 265 270 Asn Ile Leu Cys Leu Ala Glu Lys Glu Val Phe Val Met Glu Lys Ala 275 280 285 Ala Asp Glu Leu Val Asn Asn Leu Val Lys Glu Gly Ala Tyr Leu Leu 290 295 300 Asn Pro Met Glu Leu Asn Glu Ile Leu Lys Phe Ala Met Ile Glu Lys 305 310 315 320 Asn Gly Ser Cys Glu Val Asn Lys Lys Trp Val Gly Lys Asp Ala Gly 325 330 335 Leu Phe Leu Glu Ala Ile Gly Val Ser Gly His Lys Asp Val Arg Leu 340 345 350 Leu Ile Cys Glu Thr Asp Arg Asn His Pro Phe Val Met Val Glu Gln 355 360 365 Leu Met Pro Ile Leu Pro Ile Val Arg Leu Arg Thr Phe Glu Glu Cys 370 375 380 Val Glu Ser Ala Val Ala Ala Glu Ser Gly Asn Arg His Thr Ala Ser 385 390 395 400 Met Phe Ser Arg Asn Val Glu Asn Met Thr Arg Phe Gly Lys Val Ile 405 410 415 Glu Thr Thr Ile Phe Thr Lys Asn Gly Ser Thr Leu Lys Gly Val Gly 420 425 430 Ile Gly Gly Glu Gly His Thr Thr Met Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Leu Thr Cys Ala Arg Ser Phe Thr Arg Arg Arg Arg Cys Met 450 455 460 Leu Ala Glu Gly Gly Leu Arg Ile Ile 465 470 <210> 84 <211> 471 <212> PRT <213> Flavonifractor plautii <400> 84 Met Asn Ile Asp Glu Asn Val Val Glu Ser Ile Val Lys Arg Val Val 1 5 10 15 Ser Gln Leu Ser Thr Glu Thr Ala Ser Ala Gln Thr Cys Pro Ser Gly 20 25 30 Gly Asp Trp Gly Val Phe Glu Ser Met Asn Asp Ala Val Asp Ala Ala 35 40 45 Val Glu Ala Gln Arg Glu Tyr Leu Asn Arg Ser Met His Asp Arg Ala 50 55 60 Cys Tyr Val Gln Ala Ile Arg Asp Val Val Leu Asp Gln Glu Asn Leu 65 70 75 80 Glu Tyr Ile Ser Arg Leu Ala Val Glu Glu Thr Gly Met Gly Gly Tyr 85 90 95 Glu Tyr Lys Leu Ile Lys Asn Arg Leu Ala Ala Val Lys Thr Pro Gly 100 105 110 Ile Glu Asp Leu Thr Thr Asp Ala Met Ser Gly Asp Asp Gly Leu Thr 115 120 125 Leu Val Glu Tyr Ser Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr 130 135 140 Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Leu Ala 145 150 155 160 Ala Gly Asn Ala Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val 165 170 175 Ser Leu His Leu Ile Gln Leu Ile Asn Lys Ala Leu Cys Lys Ala Gly 180 185 190 Ala Pro Ala Asn Leu Val Val Thr Val Ser Ala Pro Ser Ile Glu Asn 195 200 205 Thr Asn Ala Met Met Ser His Pro Lys Ile Arg Met Leu Val Ala Thr 210 215 220 Gly Gly Pro Ala Ile Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala 245 250 255 Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp 260 265 270 Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Ile Ala Val Asp Ser 275 280 285 Val Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu 290 295 300 Val Lys Asp Pro Ala Val Ile Ser Gln Leu Val Glu Leu Val Thr Lys 305 310 315 320 Glu Gly Lys Ser Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr 325 330 335 Ile Leu Asp Lys Ile Gly Ile Thr Val Gly Asp Asp Val Lys Val Ile 340 345 350 Leu Met Glu Ala Lys Glu Asp His Pro Phe Val Gln Val Glu Leu Met 355 360 365 Met Pro Ile Leu Pro Leu Val Arg Val Pro Asp Val Asp Gln Ala Ile 370 375 380 Glu Met Ala Val Arg Val Glu His Gly Asn Arg His Thr Ala Met Met 385 390 395 400 His Ser Arg Asn Val Glu Lys Leu Thr Lys Met Ala Lys Leu Ile Gln 405 410 415 Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val 420 425 430 Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu 435 440 445 Gly Leu Thr Ser Ala Lys Ser Phe Ala Arg Arg Arg Arg Cys Val Leu 450 455 460 Val Gly Gly Met Asp Val Arg 465 470 <210> 85 <211> 462 <212> PRT <213> Ruminococcus obeum <400> 85 Met Pro Ile Ser Glu Ser Met Val Gln Asp Ile Val Gln Glu Val Met 1 5 10 15 Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe 20 25 30 Lys Asp Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Glu Leu Ile 35 40 45 Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile 50 55 60 Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val 65 70 75 80 Asp Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His 85 90 95 Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu 130 135 140 Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Val 165 170 175 Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Val Thr 180 185 190 Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His Lys 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Val Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Gln Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Val Val Ala Val Ser Ser Val Val Asp Glu Leu Met His Tyr 275 280 285 Met Leu Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp 290 295 300 Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala 325 330 335 Pro Ala Asn Ile Arg Cys Ile Ile Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ser Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg 450 455 460 <210> 86 <211> 469 <212> PRT <213> Clostridium carboxidivorans <400> 86 Met Glu Leu Gln Ser Asn Glu Leu Ser Leu Ile Ile Glu Lys Val Leu 1 5 10 15 Lys Glu Met Asn Lys Lys Glu Leu Lys Glu Glu Val Ser Asp Gly Val 20 25 30 Phe Asp Thr Met Glu Glu Ala Ile Glu Ala Ala Tyr Glu Ala Gln Lys 35 40 45 Lys Phe Ser Ser Tyr Thr Ile Glu Gln Arg Glu Lys Leu Ile Ala Ala 50 55 60 Met Arg Lys Ala Ile Ile Asp Asn Ala Met Glu Ile Ala Asn Leu Cys 65 70 75 80 Val Asn Glu Ser Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu 85 90 95 Lys Leu Thr Ala Glu Lys Thr Pro Gly Thr Glu Val Leu Gln Thr Thr 100 105 110 Ala Phe Thr Gly Asp Lys Gly Leu Thr Leu Val Glu Asn Gly Ala Phe 115 120 125 Gly Val Ile Gly Ser Ile Thr Pro Ser Thr Asn Pro Ala Ala Thr Val 130 135 140 Ala Cys Asn Gly Ile Gly Met Leu Ala Gly Gly Asn Thr Ala Val Phe 145 150 155 160 Ser Pro His Pro Gly Ala Phe Arg Ser Ser Leu Ala Met Leu Arg Ala 165 170 175 Leu Asn Lys Ala Ile Lys Glu Ala Gly Gly Pro Asp Asn Leu Leu Thr 180 185 190 Ser Val Lys Lys Pro Ser Ile Glu Ser Thr Asn Ser Met Met Lys Asn 195 200 205 Asp Lys Ile Arg Met Val Val Ala Thr Gly Gly Pro Gly Ile Val Lys 210 215 220 Met Val Leu Ser Ser Gly Arg Lys Ala Ile Gly Ala Gly Ala Gly Asn 225 230 235 240 Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Lys Lys Ala Ala Arg 245 250 255 Asp Ile Ile Ala Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala 260 265 270 Glu Lys Glu Ala Leu Val Val Glu Ala Val Tyr Glu Glu Leu Ile Lys 275 280 285 Glu Met Lys Asn Asn Arg Ala Val Tyr Glu Leu Asn Asp Glu Glu Ala 290 295 300 Ala Lys Val Ala Glu Leu Val Leu Val His Asn Lys Glu Lys Asn Thr 305 310 315 320 Tyr Ser Ile Asn Lys Ala Phe Val Gly Lys Asp Ala Lys Tyr Ile Leu 325 330 335 Gln Asn Ile Gly Lys Asn Asp Ala Glu Gly Val Glu Cys Leu Ile Tyr 340 345 350 Arg Ala Glu Asn Ser His Pro Phe Val Gln Glu Glu Leu Met Met Pro 355 360 365 Ile Leu Pro Ile Val Lys Thr Lys Asp Phe Glu Glu Ala Leu Lys Leu 370 375 380 Ala Val Gln Asp Glu His Gly Asn Arg His Thr Ala Ile Met His Ser 385 390 395 400 Lys Asn Val Asp Asn Leu Thr Lys Met Ala Arg Ala Ile Asp Thr Thr 405 410 415 Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly 420 425 430 Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu 435 440 445 Thr Asn Ala Val Ser Phe Thr Arg Lys Arg Arg Cys Thr Met Ala Glu 450 455 460 Ser Phe Arg Ile Val 465 <210> 87 <211> 469 <212> PRT <213> Fusobacterium ulcerans <400> 87 Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met 1 5 10 15 Lys Glu Leu Lys Lys Thr Asp Ile Lys Ala Gly Cys Gln Ser Cys Glu 20 25 30 Ser Pro Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Ala Ala 35 40 45 Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg 50 55 60 Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Val 65 70 75 80 Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Ala Ala 85 90 95 Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val 100 105 110 Glu Asp Leu Arg Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val 115 120 125 Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr 130 135 140 Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala 145 150 155 160 Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser 165 170 175 Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Lys Ala Gly Gly 180 185 190 Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr 195 200 205 Asn Arg Met Met Glu Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly 210 215 220 Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp 245 250 255 Ile Glu Lys Ala Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn 260 265 270 Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile 275 280 285 Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile 290 295 300 Lys Asp Lys Ser Val Ile Asp Arg Leu Val Ala Met Val Leu Lys Asn 305 310 315 320 Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu 325 330 335 Lys Asp Leu Gly Ile Asn Val Gly Gly Glu Ile Arg Val Ile Ile Thr 340 345 350 Glu Ala Asp Lys Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro 355 360 365 Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val 370 375 380 Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser 385 390 395 400 Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr 405 410 415 Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly 420 425 430 Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu 435 440 445 Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly 450 455 460 Gly Leu Ser Ile Lys 465 <210> 88 <211> 469 <212> PRT <213> Fusobacterium sp. <400> 88 Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met 1 5 10 15 Lys Glu Leu Lys Lys Thr Asp Ile Lys Ala Gly Cys Gln Ser Cys Glu 20 25 30 Ser Leu Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Ala Ala 35 40 45 Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg 50 55 60 Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Val 65 70 75 80 Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Ala Ala 85 90 95 Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val 100 105 110 Glu Asp Leu Arg Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val 115 120 125 Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr 130 135 140 Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala 145 150 155 160 Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser 165 170 175 Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Arg Ala Gly Gly 180 185 190 Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr 195 200 205 Asn Arg Met Met Glu Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly 210 215 220 Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp 245 250 255 Ile Glu Lys Ala Ala Arg Asp Ile Val Ala Gly Cys Ser Phe Asp Asn 260 265 270 Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile 275 280 285 Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile 290 295 300 Lys Asp Lys Ser Val Ile Asp Arg Leu Val Ala Met Val Leu Lys Asn 305 310 315 320 Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu 325 330 335 Lys Asp Leu Gly Ile Asn Val Gly Asp Glu Ile Arg Val Ile Ile Thr 340 345 350 Glu Thr Asp Lys Asp His Pro Phe Ala Val Glu Glu Leu Leu Met Pro 355 360 365 Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val 370 375 380 Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser 385 390 395 400 Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr 405 410 415 Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly 420 425 430 Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu 435 440 445 Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly 450 455 460 Gly Leu Ser Ile Lys 465 <210> 89 <211> 469 <212> PRT <213> Clostridium carboxidivorans <400> 89 Met Glu Leu Glu Ser Asn Glu Leu Ser Val Ile Ile Glu Lys Val Leu 1 5 10 15 Lys Glu Met Asn Lys Lys Glu Phe Gly Lys Lys Glu Ser Asp Gly Ile 20 25 30 Phe Asp Thr Met Asp Glu Ala Val Glu Ala Ser Tyr Glu Ala Gln Lys 35 40 45 Lys Tyr Ser Ser Tyr Ser Leu Glu Gln Arg Glu Lys Leu Ile Gln Ala 50 55 60 Met Arg Lys Ala Ile Met Asp Asn Ala Met Glu Val Ala Asn Leu Cys 65 70 75 80 Val Lys Glu Ser Gly Met Gly Arg Val Asp His Lys Tyr Leu Lys Leu 85 90 95 Lys Leu Ile Val Glu Lys Thr Gln Gly Thr Glu Ile Leu Arg Pro Glu 100 105 110 Val Tyr Thr Gly Asp Asn Gly Leu Thr Leu Ile Glu His Gly Ala Phe 115 120 125 Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn Pro Ala Ala Thr Val 130 135 140 Ala Cys Asn Ser Ile Cys Met Leu Ala Gly Gly Asn Thr Val Val Phe 145 150 155 160 Ser Pro His Pro Gly Ala Leu Asn Ser Cys Leu Thr Met Ile Arg Ile 165 170 175 Leu Asn Lys Ala Ile Lys Glu Ala Gly Gly Pro Glu Asn Leu Ile Thr 180 185 190 Ser Val Lys Ala Pro Ser Ile Glu Asn Thr Asn Ile Met Ile Asn His 195 200 205 Lys Arg Ile Arg Leu Val Val Ala Thr Gly Gly Pro Gly Ile Val Lys 210 215 220 Leu Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn 225 230 235 240 Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Pro Lys Ala Ala Arg 245 250 255 Asp Ile Ile Ala Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile Ala 260 265 270 Glu Lys Glu Ala Ile Val Val Glu Ser Val Tyr Glu Glu Leu Ile Lys 275 280 285 Glu Phe Lys Lys Asn Arg Val Val Tyr Glu Leu Thr Asp Glu Glu Ala 290 295 300 Glu Lys Leu Val Gly Lys Val Leu Asn Tyr Asp Glu Lys Asn Lys Lys 305 310 315 320 Tyr Ser Ile Asn Lys Lys Phe Val Gly Lys Asp Ala Lys Tyr Leu Leu 325 330 335 Glu Ser Ile Gly Lys Asp Ala Gly Thr Gly Val Glu Cys Leu Ile Tyr 340 345 350 Arg Ala Glu Asn Ser His Pro Phe Val Gln Glu Glu Leu Met Met Pro 355 360 365 Ile Leu Pro Ile Val Lys Val Lys Asn Val Asp Glu Ala Ile Glu Thr 370 375 380 Ala Val Glu Asp Glu His Gly Asn Arg His Thr Ala Met Met His Ser 385 390 395 400 Lys Asn Val Val Asn Leu Thr Lys Met Ala Arg Ala Ile Asp Thr Thr 405 410 415 Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly 420 425 430 Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile 435 440 445 Thr Asn Ala Val Thr Phe Thr Arg Gln Arg Arg Cys Thr Met Val Asp 450 455 460 Ser Phe Arg Ile Val 465 <210> 90 <211> 471 <212> PRT <213> Clostridium sp. <400> 90 Met Glu Met Asp Met Lys Val Ile Glu Gln Leu Val Ala Gln Ala Leu 1 5 10 15 Lys Glu Met Lys Ala Glu Glu Pro Ala Ala Phe Ala Glu Lys Lys Glu 20 25 30 Glu Asn Tyr Gly Val Phe Ser Thr Met Asp Glu Ala Ile Glu Ala Ser 35 40 45 Glu Lys Ala Gln Lys Ala Leu Leu Phe Ser Lys Ile Gln Asp Arg Gln 50 55 60 Lys Tyr Val Asp Ile Ile Arg Ala Ala Ile Leu Lys Arg Glu Asn Leu 65 70 75 80 Glu Leu Ile Ser Arg Met Ala Val Glu Glu Thr Glu Ile Gly Lys Tyr 85 90 95 Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly 100 105 110 Thr Glu Asp Leu Thr Thr Glu Ala Gln Thr Gly Asp His Gly Leu Thr 115 120 125 Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr 130 135 140 Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile Ala 145 150 155 160 Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val 165 170 175 Ser Gln Leu Leu Val Lys Met Leu Asn Lys Ala Leu Met Glu Gly Gly 180 185 190 Ala Pro Ala Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn 195 200 205 Thr Asn Lys Met Ile Glu His Pro Gly Val Arg Leu Leu Val Ala Thr 210 215 220 Gly Gly Pro Ala Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala 245 250 255 Asp Ile Glu Lys Ala Ala Arg Asp Ile Val Asp Gly Cys Ser Phe Asp 260 265 270 Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser 275 280 285 Ile Cys Asp Tyr Leu Ile Gln Asn Met Lys Leu Asn Gly Ala Tyr Glu 290 295 300 Ile Arg Asp Ala Glu Thr Ile Glu Arg Leu Asp Ala Leu Val Thr Asn 305 310 315 320 Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Lys Tyr 325 330 335 Ile Leu Asp Lys Met Gly Ile Pro Ala Asp Asp Ser Val Lys Val Ile 340 345 350 Ile Met Glu Val Arg Arg Asp His His Leu Val Thr Glu Glu Met Met 355 360 365 Met Pro Ile Leu Pro Ile Val Arg Val Ser Asp Val Asp Thr Ala Ile 370 375 380 Glu Tyr Ala His Asp Ala Glu His Gly Asn Arg His Thr Ala Met Met 385 390 395 400 His Ser Lys Asn Val Glu Lys Leu Ser Lys Met Ala Lys Leu Leu Glu 405 410 415 Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Ala 420 425 430 Gly Gly Glu Gly His Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu 435 440 445 Gly Leu Thr Ser Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val Met 450 455 460 Ser Asp Ala Phe Ser Ile Arg 465 470 <210> 91 <211> 469 <212> PRT <213> Fusobacterium varium <400> 91 Met Asn Leu Glu Ala Asn Asn Met Asp Glu Ile Val Ala Leu Ile Met 1 5 10 15 Lys Glu Leu Lys Lys Thr Asp Ile Lys Thr Val Cys Gln Ser Cys Glu 20 25 30 Asn Pro Lys Asn Gly Val Phe Ser Ser Met Asp Glu Ala Ile Thr Ala 35 40 45 Ala Lys Lys Ala Gln Glu Ile Leu Phe Ser Ser Arg Leu Glu Met Arg 50 55 60 Glu Lys Ile Val Ala Ser Ile Arg Glu Val Met Lys Asp Tyr Val Leu 65 70 75 80 Glu Leu Ala Glu Leu Gly Val Lys Glu Thr Gly Met Gly Arg Val Ala 85 90 95 Asp Lys Ala Leu Lys His Gln Val Thr Ile Glu Lys Thr Pro Gly Val 100 105 110 Glu Asp Leu Lys Ala Phe Ala Phe Ser Gly Asp Asp Gly Leu Thr Val 115 120 125 Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr 130 135 140 Asn Pro Ser Glu Thr Ile Ile Cys Asn Ser Ile Gly Met Ile Ser Ala 145 150 155 160 Gly Asn Ser Ile Val Phe Ala Pro His Pro Gly Ala Lys Arg Thr Ser 165 170 175 Ile Lys Thr Val Glu Ile Ile Asn Glu Ala Val Arg Lys Val Gly Gly 180 185 190 Pro Glu Asn Leu Val Val Thr Ile Ala Glu Pro Ser Ile Glu Asn Thr 195 200 205 Asn Lys Met Met Ala Asn Pro Asp Ile Lys Met Leu Val Ala Thr Gly 210 215 220 Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys Lys Ala Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu Thr Ala Asp 245 250 255 Ile Glu Lys Ala Ala Lys Asp Ile Val Ala Gly Cys Ser Phe Asp Asn 260 265 270 Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Ala Val Asp Ser Ile 275 280 285 Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala Tyr Leu Ile 290 295 300 Lys Asp Lys Ala Val Ile Glu Arg Leu Ala Gly Met Val Leu Lys Asn 305 310 315 320 Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asp Ala Ser Tyr Ile Leu 325 330 335 Lys Asp Leu Gly Ile Asn Val Gly Asp Glu Ile Arg Val Ile Ile Ala 340 345 350 Glu Thr Asp Lys Glu His Pro Phe Ala Val Glu Glu Leu Leu Met Pro 355 360 365 Ile Leu Pro Ile Ile Arg Val Lys Asn Ala Leu Glu Gly Ile Glu Val 370 375 380 Ser Lys Lys Leu Glu His Gly Leu Arg His Thr Ala Met Ile His Ser 385 390 395 400 Lys Asn Ile Asp Val Leu Thr Lys Tyr Ala Arg Asp Met Glu Thr Thr 405 410 415 Ile Leu Val Lys Asn Gly Pro Ser Phe Ala Gly Ile Gly Val Gly Gly 420 425 430 Glu Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu 435 440 445 Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Val Leu Val Gly 450 455 460 Gly Leu Ser Ile Lys 465 <210> 92 <211> 482 <212> PRT <213> Clostridium celatum <400> 92 Met Asp Asp Asn Thr Lys Leu Ile Gln Asp Ile Val Ala Lys Val Ile 1 5 10 15 Ser Glu Ile Gly Thr Lys Glu Ile Glu Glu Glu Ala Cys Cys Gly Asn 20 25 30 Gly Ser Cys Gly Gly Ser Cys Gly Cys Asn Lys Glu Lys Tyr Val Phe 35 40 45 Glu Asp Val Asp Ser Ala Val Ala Ala Ala Lys Lys Ala Tyr Lys Glu 50 55 60 Leu Lys Gln Leu Thr Ile Lys Asp Arg Glu Asn Ile Ile Thr Lys Ile 65 70 75 80 Arg Glu Lys Cys Leu Thr Tyr Ser Glu Arg Leu Ser Ile Met Ala Val 85 90 95 Asp Glu Thr Gly Met Gly Lys Val Glu Asp Lys Ile Thr Lys His Val 100 105 110 Leu Val Ala Arg Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr Thr Ala 115 120 125 Trp Ser Gly Asp Gly Gly Leu Thr Leu Val Glu Arg Gly Ala Phe Gly 130 135 140 Val Ile Ala Ala Ile Thr Pro Ser Thr Asn Pro Thr Ala Thr Ile Phe 145 150 155 160 Cys Asn Ser Ile Gly Met Ile Ala Ala Gly Asn Ser Val Val Phe Ala 165 170 175 Pro His Pro Ala Ala Lys Ser Cys Ser Lys Phe Ala Val Lys Leu Ile 180 185 190 Asn Glu Ala Ser Ile Glu Val Gly Gly Pro Glu Asn Ile Val Val Thr 195 200 205 Phe Glu Asn Pro Ser Ile Glu Ile Thr Ser Ala Leu Met Lys His Lys 210 215 220 Asp Ile Pro Phe Ile Ser Ala Thr Gly Gly Pro Gly Val Val Thr Gln 225 230 235 240 Ala Cys Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro 245 250 255 Pro Val Leu Val Asp Glu Thr Ala Asp Ile Lys His Ala Ala Lys Ser 260 265 270 Ile Ile Ala Gly Ala Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 275 280 285 Lys Glu Val Val Ala Leu Asp Ser Ile Cys Asp Glu Leu Ile Glu Asp 290 295 300 Met Gln Lys Glu Gly Ala Tyr Phe Leu Asn Ser Thr Glu Leu Ile Asn 305 310 315 320 Arg Leu Ile Asp Thr Val Leu Ile Arg Lys Asp Gly Lys Val Thr Leu 325 330 335 Asn Arg Asn Phe Val Gly Arg Asp Ala Lys Ile Ile Leu Asp Ala Ile 340 345 350 Gly Val Tyr Ala Asp Asp Ser Val Lys Cys Ile Ile Phe Glu Gly Cys 355 360 365 Lys Ser Asn Leu Leu Ile Val Glu Glu Leu Met Met Pro Ile Leu Gly 370 375 380 Ile Val Arg Val Lys Asp Phe Asn Thr Ala Val Asp Val Ala Val Glu 385 390 395 400 Leu Glu His Gly Asn Arg His Ser Ala His Ile His Ser Lys Arg Ile 405 410 415 Asp Arg Leu Thr Tyr Phe Ala Arg Glu Ile Asp Thr Ala Ile Phe Val 420 425 430 Lys Asn Ala Pro Ser Tyr Ser Ala Leu Gly Val Glu Ala Glu Gly Tyr 435 440 445 Pro Thr Phe Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Ser Ser Ala 450 455 460 Lys Thr Phe Ser Lys Ser Arg Arg Cys Ile Met Lys Asp Ala Leu Ser 465 470 475 480 Ile Lys <210> 93 <211> 462 <212> PRT <213> Clostridium sp. <400> 93 Met Ser Val Asn Glu Arg Met Val Gln Asp Ile Val Gln Glu Val Val 1 5 10 15 Ala Lys Met Gln Ile Ala Ser Asp Val Thr Gly Asn His Gly Val Phe 20 25 30 Gln Asp Met Asn Ala Ala Ile Glu Ala Ala Lys Lys Thr Gln Lys Val 35 40 45 Val Ala Arg Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile 50 55 60 Arg Ala Lys Ile Lys Glu His Ala Glu Ile Phe Ala Arg Met Gly Val 65 70 75 80 Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Gln Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Val Asn Leu Ile 165 170 175 Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr 180 185 190 Val Glu Asn Pro Thr Leu Glu Ser Ser Asn Ile Met Met Lys His Lys 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr 275 280 285 Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp 290 295 300 Ala Leu Thr Glu Val Val Leu Lys Gly Gly Arg Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val 325 330 335 Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg 450 455 460 <210> 94 <211> 462 <212> PRT <213> Lachnospiraceae bacterium <400> 94 Met Ser Val Asn Glu Gln Met Val Gln Asp Ile Val Gln Glu Val Met 1 5 10 15 Ala Lys Met Gln Ile Thr Ser Asp Val Ser Gly Ser His Gly Val Phe 20 25 30 Lys Asp Met Asn Glu Ala Ile Ala Ala Ala Lys Lys Thr Gln Lys Ile 35 40 45 Val Gly Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Ser Asn Ile 50 55 60 Arg Thr Lys Ile Lys Glu Asn Ala Glu Ile Met Ala Arg Met Gly Val 65 70 75 80 Gln Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Val 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu 130 135 140 Cys Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Leu Leu 165 170 175 Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr 180 185 190 Val Glu Lys Pro Thr Leu Ala Ser Ser Asp Ile Met Met Lys His Lys 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met Tyr Tyr 275 280 285 Met Val Ser Glu Gln Gly Cys Tyr Lys Ile Thr Lys Glu Glu Gln Asp 290 295 300 Ala Leu Thr Ala Val Val Leu Lys Asp Gly Lys Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Thr Val 325 330 335 Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Lys Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile Thr 385 390 395 400 Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Thr Asp Ser Leu Cys Ile Arg 450 455 460 <210> 95 <211> 463 <212> PRT <213> Lachnospiraceae bacterium <400> 95 Met Pro Val Ser Glu Ser Met Val Gln Asp Ile Val Lys Glu Val Val 1 5 10 15 Ala Arg Met Gln Leu Ser Gly Ser Ala Gly Thr Ala Gln His Gly Val 20 25 30 Phe Thr Asp Met Asn Gln Ala Ile Glu Ala Ala Lys Glu Ala Glu Ala 35 40 45 Lys Val Arg Cys Met Thr Met Asp Gln Arg Glu Gln Ile Val Ser Asn 50 55 60 Ile Arg Arg Lys Thr His Glu Asn Ala Glu Leu Leu Ala Arg Met Gly 65 70 75 80 Val Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His 85 90 95 His Leu Leu Ala Asp Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Thr 100 105 110 Ala Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe 115 120 125 Gly Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val 130 135 140 Leu Cys Asn Ser Met Gly Met Ile Ala Ala Gly Asn Thr Val Val Phe 145 150 155 160 Asn Pro His Pro Gln Ala Ile Lys Thr Ser Ile Phe Ala Ile Asn Met 165 170 175 Val Asn Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Val Ala Cys 180 185 190 Thr Val Ser Lys Pro Thr Leu Glu Thr Ser Asn Ile Met Met Lys His 195 200 205 Lys Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr 210 215 220 Ala Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn 225 230 235 240 Pro Pro Ala Leu Val Asp Glu Thr Ala Asp Val Arg Lys Ala Ala Ala 245 250 255 Asp Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala 260 265 270 Glu Lys Glu Ile Val Ala Val Asp Ser Val Ala Asp Glu Leu Met Asn 275 280 285 Tyr Met Ile Ser Glu Gln Gly Cys Tyr Leu Ile Ser Lys Glu Glu Gln 290 295 300 Asp Lys Leu Thr Ala Thr Val Ile Thr Pro Lys Gly Leu Asn Arg Lys 305 310 315 320 Cys Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Ile Gln 325 330 335 Ala Pro Glu Asn Ile Arg Cys Ile Val Phe Glu Gly Glu Lys Glu His 340 345 350 Pro Leu Ile Ala Glu Glu Leu Met Met Pro Ile Leu Gly Leu Val Arg 355 360 365 Ala Lys Asp Phe Asp Asp Ala Val Glu Lys Ala Val Trp Leu Glu His 370 375 380 Gly Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp Asn Ile 385 390 395 400 Thr Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala 405 410 415 Pro Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe 420 425 430 Thr Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Thr Phe 435 440 445 Thr Lys Arg Arg Arg Cys Val Met Ser Asp Ser Leu Cys Ile Arg 450 455 460 <210> 96 <211> 462 <212> PRT <213> Ruminococcus sp. <400> 96 Met Pro Ile Asn Glu Asn Met Val Gln Glu Ile Val Gln Glu Val Met 1 5 10 15 Ala Lys Met Gln Ile Ala Asp Ala Pro Thr Gly Lys His Gly Ile Phe 20 25 30 Lys Glu Met Asn Asp Ala Ile Glu Ala Ala Lys Lys Ser Gln Leu Ile 35 40 45 Val Lys Lys Met Ser Met Asp Gln Arg Glu Lys Ile Ile Thr Cys Ile 50 55 60 Arg Lys Lys Ile Lys Glu Asn Ala Glu Val Met Ala Arg Met Gly Val 65 70 75 80 Glu Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His His 85 90 95 Leu Val Ala Asp Lys Thr Pro Gly Thr Glu Val Ile Thr Thr Thr Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu 130 135 140 Cys Asn Thr Met Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Tyr Ala Ile Asn Leu Leu 165 170 175 Asn Glu Ala Ser Leu Glu Ser Gly Gly Pro Asp Asn Ile Ala Val Thr 180 185 190 Val Glu Lys Pro Thr Leu Glu Thr Ser Asn Val Met Met Lys His Lys 195 200 205 Asp Ile Pro Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Thr Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Ser Ser Ile Val Asp Glu Leu Met His Tyr 275 280 285 Leu Val Thr Glu Asn Asp Cys Tyr Leu Ala Ser Lys Glu Glu Gln Asp 290 295 300 Lys Leu Thr Glu Val Val Leu Ala Gly Gly Lys Leu Asn Arg Lys Cys 305 310 315 320 Val Gly Arg Asp Ala Arg Thr Leu Leu Ser Met Ile Gly Val Asn Ala 325 330 335 Pro Ala Asn Ile Arg Cys Ile Val Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Arg Asp Phe Asp Asp Ala Val Glu Gln Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Ile Asp Asn Ile Thr 385 390 395 400 Lys Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Ala Pro 405 410 415 Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Cys Ala Ser Thr Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Ala Asp Ser Leu Cys Ile Arg 450 455 460 <210> 97 <211> 469 <212> PRT <213> Acetobacterium woodii <400> 97 Met Asn Ile Asp Thr Thr Gly Ile Glu Tyr Ile Val Lys Lys Val Met 1 5 10 15 Ala Glu Ile Asp Cys Ala Glu Glu Gly Gly Lys Pro Leu Lys Asp Gly 20 25 30 Glu Leu Gly Ile Phe Asn Asp Met Glu Asn Ala Ile Asp Ala Ala Phe 35 40 45 Ile Ala Gln Lys Ser Phe Met Arg Ala Ser Met Ala Phe Arg Ser Lys 50 55 60 Ile Ile Ala Ala Met Arg Ala Glu Met Leu Lys Lys Glu Asn Met Glu 65 70 75 80 Met Ile Cys Gln Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Glu 85 90 95 His Lys Leu Leu Lys His Glu Leu Ala Ala Thr Lys Thr Pro Gly Val 100 105 110 Glu Asp Leu Val Ala Asp Ala Phe Thr Gly Asp Asp Gly Leu Thr Leu 115 120 125 Ile Glu Gln Ser Pro Phe Gly Val Ile Gly Ala Val Ser Pro Ser Thr 130 135 140 Asn Pro Ser Glu Thr Ile Ile Cys Asn Gly Ile Gly Met Leu Ala Gly 145 150 155 160 Gly Asn Thr Val Val Phe Ala Pro His Pro Ser Ala Lys Lys Thr Ser 165 170 175 Ala Leu Val Val Lys Leu Leu Asn Lys Ala Ile Leu Glu Ala Gly Gly 180 185 190 Pro Glu Asn Leu Ile Val Thr Thr Val Lys Pro Thr Ile Asp Ser Ala 195 200 205 Asn Thr Met Phe Ala Ser Pro Lys Ile Thr Met Leu Cys Ala Thr Gly 210 215 220 Gly Pro Gly Val Val Lys Ser Val Leu Gln Ser Gly Lys Lys Ala Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp 245 250 255 Ile Glu Lys Ala Gly Lys Asp Ile Ile Asp Gly Cys Cys Phe Asp Asn 260 265 270 Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Val Val Glu Gln Val 275 280 285 Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu Leu 290 295 300 Lys Asp Ala Gln Lys Ile Lys Glu Leu Glu Glu Leu Val Ile Pro Gly 305 310 315 320 Gly Arg Leu Ser Arg Asp Tyr Val Gly Arg Ser Ala Lys Val Ile Leu 325 330 335 Lys Gly Ile Gly Ile Glu Val Asp Asp Ser Val Arg Val Val Ile Ile 340 345 350 Glu Thr Ser Lys Asp His Ile Phe Ala Val Glu Glu Leu Met Met Pro 355 360 365 Ile Leu Ala Ile Val Arg Val Lys Asp Val Ala Glu Gly Ile Asp Leu 370 375 380 Ala Val Ser Leu Glu His Gly Asn Arg His Thr Ala Ile Met His Ser 385 390 395 400 Thr Asn Ile Asn Asn Leu Thr Glu Met Ala Lys Arg Val Gln Thr Thr 405 410 415 Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly 420 425 430 Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu 435 440 445 Thr Ser Ala Lys Thr Phe Thr Arg Lys Arg Arg Cys Val Leu Val Gly 450 455 460 Gly Phe Thr Ile Lys 465 <210> 98 <211> 497 <212> PRT <213> Clostridium botulinum <400> 98 Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile 1 5 10 15 Val Lys Glu Leu Thr Gly Asn Glu Lys Gly Gln Gly Ala Ile Thr Thr 20 25 30 Ala Thr Ala Pro Lys Glu Ala Asn Pro Leu Val Asp Ile Glu Lys Lys 35 40 45 Ile Met Gly Phe Met Asn Thr Pro Thr Met Pro Val Gly Glu Tyr Gly 50 55 60 Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Leu Ala Glu 65 70 75 80 Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu 85 90 95 Ala Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg 100 105 110 Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys 115 120 125 Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala 130 135 140 Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro 145 150 155 160 Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr 165 170 175 Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val 180 185 190 Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Val Gln 195 200 205 Leu Ile Asn Lys Ala Ile Glu Arg Ile Asn Gly Pro Lys Asn Leu Ile 210 215 220 Val Thr Val Lys Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ala 225 230 235 240 His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val 245 250 255 Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly 260 265 270 Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala 275 280 285 Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile 290 295 300 Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Ala Asp Tyr Leu Lys 305 310 315 320 Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met 325 330 335 Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn 340 345 350 Lys Gln Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly 355 360 365 Val Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Glu Ala 370 375 380 Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Val 385 390 395 400 Ile Arg Val Arg Asn Val Asp Glu Ala Ile Asp Leu Gly Val Glu Leu 405 410 415 Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp 420 425 430 Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys 435 440 445 Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly 450 455 460 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg 465 470 475 480 Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile 485 490 495 Lys <210> 99 <211> 497 <212> PRT <213> Clostridium botulinum <400> 99 Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile 1 5 10 15 Val Lys Glu Leu Thr Gly Asn Glu Lys Glu Gln Gly Ala Ile Ile Thr 20 25 30 Ala Thr Ala Pro Lys Glu Val Asn Pro Leu Val Asp Ile Glu Lys Lys 35 40 45 Ile Met Gly Phe Met Asn Thr Pro Thr Met Gln Ala Gly Glu Tyr Gly 50 55 60 Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Leu Ala Glu 65 70 75 80 Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu 85 90 95 Val Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg 100 105 110 Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys 115 120 125 Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala 130 135 140 Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro 145 150 155 160 Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr 165 170 175 Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val 180 185 190 Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Ile Gln 195 200 205 Leu Ile Asn Lys Ala Ile Glu Arg Val Asn Gly Pro Lys Asn Leu Ile 210 215 220 Val Thr Val Arg Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ser 225 230 235 240 His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val 245 250 255 Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Val Gly Ala Gly Ala Gly 260 265 270 Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala 275 280 285 Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile 290 295 300 Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Thr Asp Tyr Leu Lys 305 310 315 320 Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met 325 330 335 Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn 340 345 350 Lys Lys Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly 355 360 365 Ile Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Gly Ala 370 375 380 Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Ile 385 390 395 400 Ile Arg Val Arg Asn Val Asp Glu Ala Ile Glu Leu Gly Val Glu Leu 405 410 415 Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp 420 425 430 Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys 435 440 445 Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly 450 455 460 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg 465 470 475 480 Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile 485 490 495 Lys <210> 100 <211> 497 <212> PRT <213> Clostridium botulinum <400> 100 Met Asn Asp Phe Asn Met Ile Asp Ile Glu Ser Ile Val Lys Asn Ile 1 5 10 15 Val Lys Glu Leu Thr Gly Asn Glu Lys Glu Gln Gly Thr Ile Thr Thr 20 25 30 Ala Ala Val Pro Lys Glu Val Asn Pro Leu Val Asp Ile Glu Lys Lys 35 40 45 Ile Met Gly Phe Val Asn Thr Pro Thr Met Pro Ile Gly Glu His Gly 50 55 60 Val Phe Glu Asp Ile Asn Asp Ala Ile Glu Gln Ala Trp Ile Ala Glu 65 70 75 80 Gln Glu Tyr Arg Lys Val Gly Leu Asp Lys Arg Thr Glu Ile Ile Glu 85 90 95 Ala Phe Lys Ala Glu Val Arg Lys Asn Val Glu Glu Ile Ser Arg Arg 100 105 110 Thr Phe Glu Glu Thr Gly Met Gly Arg Tyr Glu Asp Lys Ile Leu Lys 115 120 125 Asn Asn Leu Ala Leu Asp Lys Thr Pro Gly Val Glu Asp Leu Glu Ala 130 135 140 Gly Val Lys Thr Gly Asp Gly Gly Leu Thr Leu Tyr Glu Met Ser Pro 145 150 155 160 Phe Gly Val Ile Gly Ala Ile Ala Pro Ser Thr Asn Pro Thr Glu Thr 165 170 175 Ile Ile Asn Asn Gly Ile Ser Met Leu Ala Gly Gly Asn Thr Val Val 180 185 190 Phe Ser Pro His Pro Gly Ala Lys Asp Val Ser Val Phe Ile Ile Gln 195 200 205 Leu Ile Asn Lys Ala Ile Glu Arg Val Asn Gly Pro Lys Asn Leu Ile 210 215 220 Val Thr Val Arg Asn Pro Asn Ile Glu Ser Thr Asn Ile Met Leu Ala 225 230 235 240 His Pro Lys Val Asn Met Ile Cys Ala Thr Gly Gly Pro Gly Ile Val 245 250 255 Lys Val Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly 260 265 270 Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala 275 280 285 Val Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile 290 295 300 Cys Glu Lys Glu Val Ile Val Val Asp Lys Val Ala Asp Tyr Leu Lys 305 310 315 320 Thr Cys Met Ser Lys Tyr Cys Ala Leu Glu Ile Thr Asp Lys Asn Met 325 330 335 Leu Ala Gln Leu Glu Lys Leu Val Leu Thr Glu Asn Gly Thr Ile Asn 340 345 350 Lys Lys Phe Val Gly Lys Asn Ala Asp Tyr Ile Met Ser Lys Leu Gly 355 360 365 Val Asn Ile Asp Pro Ser Ile Arg Val Ile Phe Ala Glu Val Glu Ala 370 375 380 Asn His Pro Phe Ala Val Glu Glu Leu Met Met Pro Ile Leu Pro Val 385 390 395 400 Ile Arg Val Arg Asn Val Asp Glu Ala Ile Asp Leu Gly Val Glu Leu 405 410 415 Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys His Ile Asp 420 425 430 Asn Leu Ser Lys Phe Ala Lys Ala Val Gln Thr Thr Ile Phe Val Lys 435 440 445 Asn Ala Pro Ser Tyr Ala Gly Ile Gly Tyr Gly Ala Glu Gly His Gly 450 455 460 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Arg 465 470 475 480 Thr Phe Thr Arg Lys Arg Arg Cys Val Met Val Asp Asn Phe Ser Ile 485 490 495 Lys <210> 101 <211> 462 <212> PRT <213> Eubacterium plexicaudatum <400> 101 Met Ser Val Asn Asp Gln Met Val Gln Asp Ile Val Arg Gln Val Leu 1 5 10 15 Ala Asn Met Arg Ile Ser Ser Asp Ala Ser Gly Ser Arg Gly Val Phe 20 25 30 Ser Asp Met Asn Glu Ala Val Glu Ala Ala Lys Lys Ala Gln Ala Val 35 40 45 Ile Gly Lys Met Pro Met Asp His Arg Glu Lys Ile Ile Ser Ser Ile 50 55 60 Arg Ala Lys Ile Met Glu Asn Ala Glu Ile Leu Ala Arg Met Gly Val 65 70 75 80 Lys Glu Thr Gly Met Gly Asn Val Gly His Lys Ile Leu Lys His Gln 85 90 95 Leu Val Ala Glu Lys Thr Pro Gly Thr Glu Asp Ile Thr Thr Lys Ala 100 105 110 Trp Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly 115 120 125 Val Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Ile Leu 130 135 140 Cys Asn Thr Ile Gly Met Val Ala Gly Gly Asn Thr Val Val Phe Asn 145 150 155 160 Pro His Pro Ala Ala Ile Lys Thr Ser Ile Phe Ala Val Asn Leu Val 165 170 175 Asn Glu Ala Ser Val Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr 180 185 190 Val Glu His Pro Thr Leu Asp Thr Ser Ala Ile Met Met Lys His Lys 195 200 205 Asp Ile His Leu Ile Ala Ala Thr Gly Gly Pro Gly Val Val Thr Ala 210 215 220 Val Leu Ser Ser Gly Lys Arg Gly Ile Gly Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp 245 250 255 Ile Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu 260 265 270 Lys Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Met His Tyr 275 280 285 Met Ile Ser Glu Gln Gly Cys Tyr Leu Ala Ser Ala Lys Glu Gln Glu 290 295 300 Ala Leu Ile Ser Val Val Leu Lys Gly Gly Gln Leu Asn Arg Asp Cys 305 310 315 320 Val Gly Arg Asp Ala Lys Thr Leu Leu Gly Met Ile Gly Val Gln Ala 325 330 335 Pro Asp Asn Ile Arg Cys Ile Thr Phe Glu Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Glu Glu Leu Met Met Pro Ile Leu Gly Val Val Arg Ala 355 360 365 Asp Ser Phe Glu Asp Ala Val Glu Lys Ala Val Trp Leu Glu His Gly 370 375 380 Asn Arg His Ser Ala His Ile His Ser Lys Asn Val Asp His Ile Thr 385 390 395 400 Thr Tyr Ala Lys Ala Ile Asp Thr Ala Ile Leu Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Ser Ala Phe Thr 435 440 445 Lys Arg Arg Arg Cys Val Met Cys Asp Ser Leu Cys Ile Arg 450 455 460 <210> 102 <211> 467 <212> PRT <213> Thermosediminibacter oceani <400> 102 Met Val Asp Glu Lys Val Val Glu Ala Ile Ala Lys Arg Ile Ile Glu 1 5 10 15 Glu Leu Asn Leu Cys Glu Ser Gly Ser Ser Gly Gly Glu Ser Arg Glu 20 25 30 Glu Leu Gly Ile Phe Asp Asn Leu Asp Asp Ala Val Glu Ala Ala Ser 35 40 45 Gln Ala Gln Lys Arg Phe Ala Ala Leu Asp Leu Glu Lys Arg Glu Glu 50 55 60 Ile Ile Gln Ala Ile Arg Glu Ala Cys Leu Asn Asn Ala Arg Tyr Leu 65 70 75 80 Ala Glu Leu Thr Val Asn Glu Thr Gly Ile Gly Arg Val Glu Asp Lys 85 90 95 Ile Val Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp 100 105 110 Leu Arg Pro Ser Cys Trp Thr Gly Asp His Gly Leu Thr Leu Val Glu 115 120 125 Met Ala Pro Val Gly Val Ile Gly Ser Ile Thr Pro Val Thr Asn Pro 130 135 140 Val Ala Thr Val Ile Asn Asn Ser Ile Ser Met Leu Ala Ala Gly Asn 145 150 155 160 Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Arg Ser Ser Asn Lys 165 170 175 Ala Val Glu Ile Ile Asn Glu Ala Ile Met Lys Val Gly Gly Pro Arg 180 185 190 His Leu Val Asn Ser Val Ala Glu Pro Thr Ile Glu Thr Ala Lys Ala 195 200 205 Leu Met Ala His Pro Lys Val Asn Leu Val Ser Val Thr Gly Gly Lys 210 215 220 Ala Val Val Ser Glu Ala Leu Arg Ser Gly Lys Lys Val Ile Gly Ala 225 230 235 240 Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val 245 250 255 Lys Ala Ala His Asp Ile Tyr Cys Gly Ala Ser Phe Asp Asn Asn Leu 260 265 270 Pro Cys Ile Ala Glu Lys Glu Leu Ile Ala Val Glu Ala Val Ala Asp 275 280 285 Met Leu Leu Glu Arg Leu Ala Arg Glu Gly Ala Tyr Ile Leu Arg Gly 290 295 300 Lys Asp Val Glu Lys Ile Thr Glu Val Val Phe Asp Glu Asn His Arg 305 310 315 320 Ile Asn Lys Lys Leu Val Gly Lys Asp Ala Ser Phe Ile Leu Glu Gln 325 330 335 Ile Gly Ile Gln Val Gly Lys Asp Val Arg Leu Val Val Val Pro Val 340 345 350 Asn Pro Glu His Pro Leu Val His His Glu Gln Leu Met Pro Val Leu 355 360 365 Pro Phe Val Arg Val Pro Asn Ile Gln Glu Ala Val Glu Leu Ala Val 370 375 380 Arg Ala Glu Gly Gly Asn Arg His Thr Ala Val Met His Ser Lys Asn 385 390 395 400 Val Asp Asn Met Thr Asn Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe 405 410 415 Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly 420 425 430 Tyr Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser 435 440 445 Ala Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe 450 455 460 Arg Ile Ile 465 <210> 103 <211> 479 <212> PRT <213> Clostridium clostridioforme <400> 103 Met Glu Ile Ser Glu Lys Glu Val Glu Ala Ile Val Arg Ser Val Leu 1 5 10 15 Ser Gly Leu Gly Gln Lys Ser Phe Gln Ala Glu Ala Leu His Val Lys 20 25 30 Asp Lys Met Cys Ser Asp Gly Glu Asp Gly Ile Phe Glu Leu Val Glu 35 40 45 Asp Ala Ile Glu Ala Ala Ser Lys Ala Gln Lys Glu Trp Val His Arg 50 55 60 Tyr Lys Leu Lys Asp Arg Lys Arg Ile Ile Glu Ala Ile Arg Val Thr 65 70 75 80 Ser Arg Ala His Ala Glu Ser Leu Ala Arg Met Val His Glu Glu Thr 85 90 95 Gly Met Gly Arg Tyr Glu Asp Lys Ile Thr Lys His Met Ala Val Ile 100 105 110 Asp Lys Thr Pro Gly Val Glu Cys Leu Val Thr Asp Ala Ile Ser Gly 115 120 125 Asp Glu Gly Leu Met Ile Glu Glu Pro Ala Pro Phe Gly Val Ile Gly 130 135 140 Ala Ile Thr Pro Ser Thr Asn Pro Thr Glu Thr Met Ile Asn Asn Thr 145 150 155 160 Ile Ser Met Ile Ala Gly Gly Asn Ala Val Val Phe Asn Val His Pro 165 170 175 Gly Ala Lys Lys Cys Cys Ala Tyr Cys Leu Gln Ile Leu His Arg Ala 180 185 190 Ile Val Glu Asn Gly Gly Pro Lys Asn Leu Ile Thr Met Gln Arg Glu 195 200 205 Pro Asp Met Asp Ala Val His Lys Leu Thr Ser Ser Pro His Ile Arg 210 215 220 Leu Met Val Gly Thr Gly Gly Met Gly Met Val His Ala Leu Leu Cys 225 230 235 240 Ser Gly Lys Arg Thr Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val 245 250 255 Val Asp Asp Thr Ala Asp Leu Ser Leu Ala Ala Arg Glu Leu Tyr Arg 260 265 270 Gly Ala Ser Phe Asp Asn Asn Leu Leu Cys Leu Ala Glu Lys Glu Val 275 280 285 Phe Val Met Asp Asn Val Ala Glu Glu Leu Val Asp Arg Leu Val Gly 290 295 300 Glu Gly Ala Tyr Leu Leu Asp Asp Leu Gln Leu Lys Lys Ile Thr Glu 305 310 315 320 Leu Ala Met Val Asn Lys Asp Gly Lys Tyr Glu Val Asn Lys Lys Trp 325 330 335 Val Gly Lys Asp Ala Gly Lys Phe Leu Glu Ala Ile Gly Ile Gln Glu 340 345 350 His Arg Glu Pro Arg Leu Leu Ile Cys Val Thr Asp Arg Ser His Pro 355 360 365 Phe Val Lys Val Glu Gln Leu Met Pro Val Leu Pro Ile Val Arg Cys 370 375 380 Gly Ser Phe Glu Lys Cys Val Glu Trp Ala Val Asp Thr Glu Ala Gly 385 390 395 400 Asn Arg His Thr Ala Ser Ile Phe Ser Lys Asn Val Glu His Met Thr 405 410 415 Leu Phe Gly Lys Glu Ile Glu Thr Thr Ile Tyr Thr Lys Asn Gly Ala 420 425 430 Thr Leu Lys Gly Ile Gly Ile Gly Gly Glu Gly His Thr Thr Met Thr 435 440 445 Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Cys Ala Arg Ser Phe Thr 450 455 460 Arg Arg Arg Arg Cys Met Leu Ala Glu Gly Gly Leu Arg Ile Ile 465 470 475 <210> 104 <211> 471 <212> PRT <213> Clostridium clostridioforme <400> 104 Met Asp Met Asp Ile Lys Val Ile Glu Gln Met Val Glu Gln Ala Leu 1 5 10 15 Lys Glu Ile Lys Ala Glu Gln Pro Gln Lys Phe Thr Met Pro Lys Ala 20 25 30 Glu Leu Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser 35 40 45 Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln 50 55 60 Lys Tyr Val Asp Val Ile Arg Arg Thr Ile Leu Lys Arg Glu Asn Leu 65 70 75 80 Glu Met Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr 85 90 95 Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly 100 105 110 Thr Glu Asp Leu Leu Thr Glu Ala Met Thr Gly Asp Asn Gly Leu Thr 115 120 125 Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr 130 135 140 Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala 145 150 155 160 Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val 165 170 175 Ser Gln Met Thr Val Lys Leu Leu Asn Lys Ala Leu Thr Glu Ser Gly 180 185 190 Ala Pro Glu Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn 195 200 205 Thr Asn Lys Met Ile Glu Asn Pro Ser Val Arg Leu Leu Val Ala Thr 210 215 220 Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala 245 250 255 Asp Ile Val Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp 260 265 270 Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser 275 280 285 Ile Cys Asp Tyr Leu Ile His Asn Met Lys Glu Asn Gly Ala Tyr Gln 290 295 300 Ile Thr Asp Pro Ala Leu Leu Glu Lys Leu Val Thr Leu Val Thr Asn 305 310 315 320 Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr 325 330 335 Ile Leu Asp Lys Leu Gly Ile Thr Ala Asp Ala Ser Val Arg Val Ile 340 345 350 Ile Met Glu Val Pro Lys Glu His Leu Leu Val Gln Glu Glu Met Met 355 360 365 Met Pro Ile Leu Pro Val Val Arg Val Cys Asp Val Asp Thr Ala Ile 370 375 380 Glu Tyr Ala Arg Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met 385 390 395 400 His Ser Arg Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu 405 410 415 Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val 420 425 430 Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu 435 440 445 Gly Leu Thr Ser Pro Arg Ala Phe Cys Arg Lys Arg Lys Cys Val Met 450 455 460 Thr Asp Ala Phe Ser Ile Arg 465 470 <210> 105 <211> 472 <212> PRT <213> Ilyobacter polytropus <400> 105 Met Asn Leu Asp Ala Asn Asn Leu Asn Asn Ile Val Ser Leu Ile Met 1 5 10 15 Lys Glu Leu Asp Lys Asn Asn Asn Ile Asp Asp Thr Gly Gln Gly Cys 20 25 30 Gly Gly Glu Glu Gly Lys Asn Gly Ile Phe Ser Ser Met Asp Thr Ala 35 40 45 Val Ser Lys Ala Lys Glu Ala Gln Val Thr Leu Phe Ala Ser Lys Leu 50 55 60 Glu Leu Arg Glu Arg Ile Ile Lys Ala Ile Arg Glu Asp Val Arg Glu 65 70 75 80 Ala Ala Ala Glu Leu Ala Glu Ile Ala Val Glu Glu Thr Gly Met Gly 85 90 95 Arg Val Asp Asp Lys Thr Leu Lys His Tyr Val Thr Val Asp Lys Thr 100 105 110 Pro Gly Val Glu Asp Leu Arg Ala Phe Ala Tyr Ser Gly Asp Asn Gly 115 120 125 Leu Thr Val Met Glu Leu Ser Pro Tyr Gly Val Ile Gly Ser Ile Thr 130 135 140 Pro Ser Thr Asn Pro Ser Glu Thr Ile Val Cys Asn Ala Ile Gly Met 145 150 155 160 Ile Ala Ala Gly Asn Ser Val Val Phe Ala Pro His Pro Gly Ala Lys 165 170 175 Lys Thr Ser Leu Arg Ala Val Glu Ile Leu Asn Lys Ala Val Ala Arg 180 185 190 Ala Gly Gly Pro Asn Asn Leu Val Val Thr Ile Phe Glu Pro Ser Ile 195 200 205 Glu Asn Thr Asn Lys Met Val Lys Asn Pro Asp Ile Lys Met Val Val 210 215 220 Ala Thr Gly Gly Pro Gly Val Val Lys Ser Val Met Ser Ser Gly Lys 225 230 235 240 Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Glu 245 250 255 Thr Ala Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asn Gly Cys Ser 260 265 270 Phe Asp Asn Asn Leu Pro Cys Ile Thr Glu Lys Glu Val Val Ala Val 275 280 285 Asp Ser Ile Thr Asp Tyr Leu Ile Phe Glu Met Gln Lys Asn Gly Ala 290 295 300 Tyr Leu Val Gln Asp Ser Lys Thr Ile Lys Lys Leu Cys Glu Met Val 305 310 315 320 Ile Asn Asp Gly Ser Pro Asn Arg Ala Tyr Val Gly Lys Asn Ala Ser 325 330 335 Tyr Ile Leu Lys Asp Leu Gly Ile Asp Val Gly Asp Glu Ile Lys Val 340 345 350 Ile Ile Val Glu Thr Asp Ala Gly His Pro Leu Ala Val Leu Glu Met 355 360 365 Leu Met Pro Val Leu Pro Ile Val Arg Val Lys Asp Ala Leu Glu Gly 370 375 380 Ile Lys Val Cys Lys Lys Leu Glu Asp Gly Leu Arg His Thr Ala Met 385 390 395 400 Ile His Ser Lys Asn Ile Asp Ile Leu Thr Lys Tyr Ala Arg Asp Met 405 410 415 Glu Thr Thr Ile Leu Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly 420 425 430 Val Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Leu Thr Ser Ala Lys Ser Phe Ala Arg Asn Arg Arg Cys Ala 450 455 460 Leu Val Gly Gly Leu Ser Ile Lys 465 470 <210> 106 <211> 462 <212> PRT <213> Shuttleworthia satelles <400> 106 Met Ala Asp Glu Gln Leu Val Gln Asn Val Val Arg Glu Val Val Ala 1 5 10 15 Arg Met Gln Ile Ser Ala Pro Ala Arg Gly Met His Gly Val Phe Ser 20 25 30 Asp Met Glu Glu Ala Ile Glu Ala Ala Arg Thr Ala Gln Gln Thr Val 35 40 45 Arg Leu Leu Pro Met Asp Gln Arg Glu Lys Ile Ile Gly Ala Ile Arg 50 55 60 Arg Lys Thr Arg Glu Asn Ala Glu Ile Leu Ala Arg Met Ala Val Asn 65 70 75 80 Glu Thr Gly Met Gly Asn Val Gly Asp Lys Ile Leu Lys His Leu Leu 85 90 95 Val Ala Asp Lys Val Pro Gly Thr Glu Asp Ile Ser Thr Arg Ala Phe 100 105 110 Ser Gly Asp Arg Gly Leu Thr Leu Ile Glu Met Gly Pro Phe Gly Val 115 120 125 Ile Gly Ala Ile Thr Pro Cys Thr Asn Pro Ser Glu Thr Val Leu Cys 130 135 140 Asn Thr Ile Gly Met Leu Ala Gly Gly Asn Thr Val Val Phe Asn Pro 145 150 155 160 His Pro Gln Ala Ile Lys Thr Thr Leu Phe Thr Ile Gln Met Val Asn 165 170 175 Glu Ala Ser Leu Glu Ala Gly Gly Pro Asp Asn Ile Ala Cys Thr Val 180 185 190 Asp Ala Pro Thr Leu Ala Thr Ser Glu Ile Met Met Lys Ser Pro His 195 200 205 Ile Lys Leu Leu Val Ala Thr Gly Gly Pro Gly Val Val Thr Ala Val 210 215 220 Leu Ser Ser Gly Lys Arg Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro 225 230 235 240 Ala Leu Val Asp Glu Thr Ala Asp Ile Arg Lys Ala Ala Glu Asp Ile 245 250 255 Val Asn Gly Cys Thr Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys 260 265 270 Glu Ile Val Ala Val Asp Ser Ile Ala Asp Glu Leu Leu His Tyr Met 275 280 285 Leu Thr Glu Gln Gly Cys Tyr Gln Ala Ser Glu Glu Glu Leu Asp Arg 290 295 300 Leu Thr Lys Ala Val Met Asp Glu Lys Gly Arg Leu Asn Arg Lys Ala 305 310 315 320 Val Gly Arg Ser Ala Arg Lys Leu Leu Ser Met Ile Gly Val Glu Val 325 330 335 Asp Ala Asn Ile Arg Cys Ile Thr Phe Phe Gly Pro Lys Glu His Pro 340 345 350 Leu Ile Thr Thr Glu Leu Met Met Pro Ile Leu Gly Ile Val Arg Val 355 360 365 Lys Asp Phe Ala Glu Gly Leu Glu Thr Ala Ala Trp Leu Glu His Gly 370 375 380 Asn Lys His Ser Ala His Ile His Ser Lys Asn Val Asp Arg Ile Thr 385 390 395 400 Glu Tyr Ala Arg Arg Leu Asp Thr Thr Ile Thr Val Lys Asn Gly Pro 405 410 415 Ser Tyr Ala Ala Leu Gly Phe Gly Gly Glu Ser Tyr Cys Thr Phe Thr 420 425 430 Ile Ala Ser Arg Thr Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Ile 435 440 445 Lys Ser Arg His Cys Val Met Thr Asp Ser Leu Cys Val Arg 450 455 460 <210> 107 <211> 472 <212> PRT <213> Clostridium beijerinckii <400> 107 Met Asp Val Asp Val Val Leu Val Glu Lys Leu Val Arg Gln Ala Ile 1 5 10 15 Glu Glu Val Lys Asn Lys Asn Leu Leu Asn Leu Asp Lys Phe Glu Ser 20 25 30 Val Lys Asn Tyr Gly Ile Phe Gly Thr Met Asp Ala Ala Val Glu Ala 35 40 45 Ser Phe Val Ala Gln Lys Gln Leu Leu Asn Ala Ser Met Thr Asp Lys 50 55 60 Gln Lys Tyr Val Asp Thr Ile Lys Ala Thr Ile Leu Lys Lys Glu Asn 65 70 75 80 Leu Glu Leu Ile Ser Arg Met Ser Val Glu Glu Thr Glu Ile Gly Lys 85 90 95 Tyr Glu His Lys Leu Ile Lys Asn Arg Val Ala Ala Glu Lys Thr Pro 100 105 110 Gly Ile Glu Asp Leu Thr Thr Glu Ala Met Thr Gly Asp Asn Gly Leu 115 120 125 Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro 130 135 140 Thr Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ser Met Ile 145 150 155 160 Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Asn 165 170 175 Val Ser Ile Lys Leu Val Thr Met Leu Asn Lys Ala Leu Glu Glu Ala 180 185 190 Gly Ala Pro Asp Asn Leu Ile Ala Thr Val Lys Glu Pro Ser Ile Glu 195 200 205 Asn Thr Asn Ile Met Met Glu His Pro Lys Ile Arg Met Leu Val Ala 210 215 220 Thr Gly Gly Pro Ala Ile Val Asn Lys Val Met Ser Thr Gly Lys Lys 225 230 235 240 Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr 245 250 255 Ala Asp Ile Glu Lys Ala Ala Ile Asp Ile Val Asn Gly Cys Ser Phe 260 265 270 Asp Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp 275 280 285 Gln Ile Cys Asp Tyr Leu Ile His Tyr Met Lys Leu Asn Gly Ala Tyr 290 295 300 Glu Ile Lys Asp Arg Asp Leu Ile Gln Lys Leu Leu Asp Leu Val Thr 305 310 315 320 Asn Glu Asn Gly Gly Pro Lys Val Ser Phe Val Gly Lys Ser Ala Pro 325 330 335 Tyr Ile Leu Asn Lys Leu Gly Ile Ser Val Asp Glu Asn Ile Lys Val 340 345 350 Ile Ile Met Glu Val Glu Lys Asn His His Phe Val Leu Glu Glu Met 355 360 365 Met Met Pro Ile Leu Pro Ile Val Arg Thr Lys Asp Val Asp Glu Ala 370 375 380 Ile Glu Cys Ala Tyr Val Ala Glu His Gly Asn Arg His Thr Ala Ile 385 390 395 400 Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Arg Leu Leu 405 410 415 Glu Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly 420 425 430 Val Gly Gly Glu Gly Thr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly 435 440 445 Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys Val 450 455 460 Met Val Asp Ala Phe Asn Ile Arg 465 470 <210> 108 <211> 471 <212> PRT <213> Clostridium clostridioforme <400> 108 Met Asp Met Asp Ile Lys Val Ile Glu Gln Met Val Glu Gln Ala Leu 1 5 10 15 Lys Glu Ile Lys Ala Glu Gln Pro Gln Lys Phe Thr Met Pro Lys Ala 20 25 30 Glu Leu Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser 35 40 45 Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln 50 55 60 Lys Tyr Val Asp Val Ile Arg Arg Thr Ile Leu Lys Arg Glu Asn Leu 65 70 75 80 Glu Met Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr 85 90 95 Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly 100 105 110 Thr Glu Asp Leu Leu Thr Glu Ala Met Thr Gly Asp Asn Gly Leu Thr 115 120 125 Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr 130 135 140 Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala 145 150 155 160 Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val 165 170 175 Ser Gln Met Thr Val Lys Leu Leu Asn Lys Ala Leu Thr Glu Ser Gly 180 185 190 Ala Pro Glu Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn 195 200 205 Thr Asn Lys Met Ile Glu Asn Pro Ser Val Arg Leu Leu Val Ala Thr 210 215 220 Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala 245 250 255 Asp Ile Val Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp 260 265 270 Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser 275 280 285 Ile Cys Asp Tyr Leu Ile His Asn Met Lys Glu Asn Gly Ala Tyr Gln 290 295 300 Ile Thr Asp Pro Ala Leu Leu Glu Lys Leu Val Thr Leu Val Thr Asn 305 310 315 320 Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr 325 330 335 Ile Leu Asp Lys Leu Gly Ile Thr Ala Asp Ala Ser Val Arg Val Ile 340 345 350 Ile Met Glu Val Pro Lys Glu His Leu Leu Val Gln Glu Glu Met Met 355 360 365 Met Pro Ile Leu Pro Val Val Arg Val Cys Asp Val Asp Thr Ala Ile 370 375 380 Glu Tyr Ala Arg Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met 385 390 395 400 His Ser Arg Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu 405 410 415 Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val 420 425 430 Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu 435 440 445 Gly Leu Thr Ser Pro Lys Ala Phe Cys Arg Lys Arg Lys Cys Val Met 450 455 460 Thr Asp Ala Phe Ser Ile Arg 465 470 <210> 109 <211> 473 <212> PRT <213> Clostridium sp. <400> 109 Met Lys Leu Asp Asp Lys Leu Ile Glu Gln Val Ala Arg Leu Val Met 1 5 10 15 Glu Glu Met Lys Ser Gly Ser Ala Ala Ala Cys Glu Glu Asn Gly Thr 20 25 30 Cys Gly Asp Ser Tyr Gly Ile Phe Asp Ser Met Asp Asp Ala Val Gln 35 40 45 Ala Ser Glu Ala Ala Gln Arg Lys Tyr Leu Phe Ser Thr Met Glu Asp 50 55 60 Arg Gln Lys Tyr Val Asp Val Ile Arg Gln Thr Val Leu Glu Pro Glu 65 70 75 80 Met Leu Gln Lys Ile Ser Arg Met Ala Val Glu Glu Thr Gly Met Gly 85 90 95 Asn Tyr Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Ser 100 105 110 Pro Gly Thr Glu Asp Leu Val Thr Glu Ala Met Thr Gly Asp Arg Gly 115 120 125 Leu Thr Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Val Thr 130 135 140 Pro Ala Thr Asn Pro Thr Glu Thr Ile Ile Cys Asn Ser Ile Ala Met 145 150 155 160 Leu Ala Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys 165 170 175 Asn Val Thr His Val Leu Val Thr Ala Leu Asn Gln Ala Leu Glu Lys 180 185 190 Val Gly Ala Pro Thr Asn Leu Ile Val Thr Val Arg Glu Pro Ser Val 195 200 205 Glu Asn Thr Asn Leu Met Ile Lys His Pro Lys Ile Arg Val Leu Val 210 215 220 Ala Thr Gly Gly Pro Gly Ile Val Lys Met Val Met Ser Thr Gly Lys 225 230 235 240 Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu 245 250 255 Thr Ala Asp Ile Glu Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser 260 265 270 Phe Asp Asn Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Ile Ala Val 275 280 285 Asp Thr Ile Ala Asp Cys Leu Ile Trp His Met Lys Arg Val Gly Ala 290 295 300 Phe Glu Leu Lys Glu Glu Ser Ala Ile Ser Arg Leu Leu Gln Leu Val 305 310 315 320 Thr Asn Glu Lys Gly Gly Pro Lys Val Glu Phe Val Gly Lys Ser Ala 325 330 335 Pro Tyr Ile Leu Asn Lys Leu Gly Ile Ser Gly Gly Glu Asn Ala Arg 340 345 350 Val Ile Leu Met Glu Thr Gln Lys Asp His Pro Phe Val Met Glu Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Ala Ala Asp Val Asp Glu 370 375 380 Ala Ile Glu Ile Ala Leu Val Ala Glu Arg Gly Asn Arg His Thr Ala 385 390 395 400 Met Met His Ser Lys Asn Val Asp Lys Leu Thr Lys Met Ala Lys Leu 405 410 415 Leu Gln Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile 420 425 430 Gly Val Gly Gly Glu Gly Cys Thr Thr Phe Thr Ile Ala Gly Pro Thr 435 440 445 Gly Glu Gly Leu Thr Thr Ala Arg Ser Phe Cys Arg Lys Arg Arg Cys 450 455 460 Val Met Ser Asp Ala Leu His Ile Arg 465 470 <210> 110 <211> 471 <212> PRT <213> Clostridium bolteae <400> 110 Met Asp Met Asp Ile Lys Val Ile Glu Gln Leu Val Glu Gln Ala Leu 1 5 10 15 Lys Glu Ile Lys Ala Glu Gln Pro Leu Lys Phe Thr Ala Pro Lys Leu 20 25 30 Glu Arg Tyr Gly Val Phe Lys Thr Met Asp Glu Ala Ile Ala Ala Ser 35 40 45 Glu Glu Ala Gln Lys Lys Leu Leu Phe Ser Lys Ile Ser Asp Arg Gln 50 55 60 Lys Tyr Val Asp Val Ile Arg Ser Thr Ile Ile Lys Arg Glu Asn Leu 65 70 75 80 Glu Leu Ile Ser Arg Leu Ser Val Glu Glu Thr Glu Ile Gly Asp Tyr 85 90 95 Glu His Lys Leu Ile Lys Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly 100 105 110 Thr Glu Asp Leu Leu Thr Glu Ala Ile Thr Gly Asp Asn Gly Leu Thr 115 120 125 Leu Val Glu Tyr Cys Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr 130 135 140 Thr Asn Pro Thr Glu Thr Ile Ile Asn Asn Ser Ile Ser Met Ile Ala 145 150 155 160 Gly Gly Asn Thr Val Val Phe Ser Pro His Pro Arg Ala Lys Lys Val 165 170 175 Ser Gln Met Thr Val Lys Met Leu Asn Lys Ala Leu Ile Asp Asn Gly 180 185 190 Ala Pro Pro Asn Leu Ile Thr Met Val Glu Glu Pro Ser Ile Glu Asn 195 200 205 Thr Asn Lys Met Ile Asp Asn Pro Ser Val Arg Leu Leu Val Ala Thr 210 215 220 Gly Gly Pro Ser Ile Val Lys Lys Val Leu Ser Ser Gly Lys Lys Ala 225 230 235 240 Ile Gly Ala Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala 245 250 255 Asp Ile Asp Lys Ala Ala Lys Asp Ile Val Asp Gly Cys Ser Phe Asp 260 265 270 Asn Asn Val Pro Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser 275 280 285 Ile Cys Asp Tyr Leu Ile His His Met Lys Glu Asn Gly Ala Tyr Gln 290 295 300 Ile Thr Asp Pro Met Leu Leu Glu Gln Leu Val Ala Leu Val Thr Thr 305 310 315 320 Glu Lys Gly Gly Pro Lys Thr Ser Phe Val Gly Lys Ser Ala Arg Tyr 325 330 335 Ile Leu Asp Lys Leu Gly Ile Thr Val Asp Ala Ser Val Arg Val Ile 340 345 350 Ile Met Glu Val Pro Lys Asp His Leu Leu Val Gln Glu Glu Met Met 355 360 365 Met Pro Ile Leu Pro Val Val Arg Val Ser Asp Val Asp Thr Ala Ile 370 375 380 Glu Tyr Ala His Gln Ala Glu His Gly Asn Arg His Thr Ala Met Met 385 390 395 400 His Ser Lys Asn Val Glu Lys Leu Ser Lys Met Ala Lys Ile Met Glu 405 410 415 Thr Thr Ile Phe Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val 420 425 430 Gly Gly Glu Gly Tyr Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu 435 440 445 Gly Leu Thr Ser Pro Arg Thr Phe Cys Arg Lys Arg Lys Cys Val Met 450 455 460 Thr Asp Ala Phe Ser Ile Arg 465 470 <210> 111 <211> 468 <212> PRT <213> Eubacterium hallii <400> 111 Met Asn Ile Asp Val Glu Leu Ile Glu Lys Val Val Lys Lys Val Leu 1 5 10 15 Asn Asp Val Glu Thr Gly Ser Ser Glu Ser Glu Tyr Gly Tyr Gly Ile 20 25 30 Phe Asp Thr Met Asp Glu Ala Ile Glu Ala Ser Ala Lys Ala Gln Lys 35 40 45 Glu Tyr Met Asn His Ser Met Ala Asp Arg Gln Arg Tyr Val Glu Gly 50 55 60 Ile Arg Glu Val Val Cys Thr Lys Glu Asn Leu Glu Tyr Met Ser Lys 65 70 75 80 Leu Ala Val Glu Glu Ser Gly Met Gly Ala Tyr Glu Tyr Lys Val Ile 85 90 95 Lys Asn Arg Leu Ala Ala Val Lys Ser Pro Gly Val Glu Asp Leu Thr 100 105 110 Thr Glu Ala Leu Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Cys 115 120 125 Pro Phe Gly Val Ile Gly Ala Ile Ala Pro Thr Thr Asn Pro Thr Glu 130 135 140 Thr Val Ile Cys Asn Ser Ile Ala Met Leu Ala Gly Gly Asn Thr Val 145 150 155 160 Val Phe Ser Pro His Pro Arg Ser Lys Gly Val Ser Ile Trp Leu Ile 165 170 175 Lys Lys Leu Asn Ala Lys Leu Glu Glu Leu Gly Ala Pro Arg Asn Leu 180 185 190 Ile Val Thr Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Ile Met Met 195 200 205 Asn His Pro Lys Val Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile 210 215 220 Val Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Val Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys 260 265 270 Ile Ala Glu Lys Glu Val Ile Ala Val Asp Gln Ile Ala Asp Tyr Leu 275 280 285 Ile Phe Asn Met Lys Asn Asn Gly Ala Tyr Glu Val Lys Asp Pro Glu 290 295 300 Ile Ile Glu Lys Met Val Asp Leu Val Thr Lys Asp Arg Lys Lys Pro 305 310 315 320 Ala Val Asn Phe Val Gly Lys Ser Ala Gln Tyr Ile Leu Asp Lys Val 325 330 335 Gly Ile Lys Val Gly Pro Glu Val Lys Cys Ile Ile Met Glu Ala Pro 340 345 350 Lys Asp His Pro Phe Val Gln Ile Glu Leu Met Met Pro Ile Leu Pro 355 360 365 Ile Val Arg Val Pro Asn Val Asp Glu Ala Ile Asp Phe Ala Val Glu 370 375 380 Val Glu His Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val 385 390 395 400 Asp Lys Leu Thr Lys Met Ala Lys Glu Ile Glu Thr Thr Ile Phe Val 405 410 415 Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Met Gly Tyr 420 425 430 Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala 435 440 445 Lys Ser Phe Cys Arg Lys Arg Arg Cys Val Leu Gln Asp Gly Leu His 450 455 460 Ile Arg Met Lys 465 <210> 112 <211> 467 <212> PRT <213> Halanaerobium saccharolyticum <400> 112 Met Lys Ile Lys Glu Asn Glu Leu Asp Lys Ile Val Asn Gln Val Ile 1 5 10 15 Ser Ser Leu Asn Asn Lys Gln Asn Ser Asn Asp Phe Asn Thr Lys Ile 20 25 30 Asn Tyr Gly Ile Phe Ser Thr Met Asp Glu Ala Ile Ala Glu Ala Val 35 40 45 Lys Ala Gln Ala Cys Leu Gln Leu Asn Tyr Ser Thr Glu Ala Arg Glu 50 55 60 Lys Ile Ile Lys Ser Ile Arg Lys Asn Val Ser Lys His Val Glu Lys 65 70 75 80 Ile Ser Glu Met Ala Val Glu Glu Thr Asp Met Gly Arg Ile Glu Asp 85 90 95 Lys Ile Ile Lys Asn Asn Leu Ala Ile Asn Lys Thr Pro Gly Thr Glu 100 105 110 Asp Leu Arg Thr Glu Ala Phe Ser Gly Lys Lys Gly Leu Thr Ile Val 115 120 125 Glu Glu Ala Pro Phe Gly Val Ile Cys Ser Ile Ala Pro Val Thr Asn 130 135 140 Pro Thr Glu Thr Ile Ile Ser Asn Ala Ile Ser Met Ile Ala Ser Cys 145 150 155 160 Asn Gly Val Val Phe Asn Ser His Pro Gly Ala Lys Lys Val Ser Lys 165 170 175 Tyr Ile Ile Glu Val Leu Asn Lys Val Ile Met Glu Ala Gly Gly Pro 180 185 190 Glu Asn Leu Leu Thr Ala Val Asn Glu Pro Thr Leu Gln Thr Val Glu 195 200 205 Ser Cys Met Arg Asp Asp Arg Ile Ala Met Ile Val Ala Thr Gly Gly 210 215 220 Pro Gly Val Val Asn Ala Ala Leu Ser Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Leu Val Asp Asp Thr Val Asp Leu 245 250 255 Lys Arg Val Ala Lys Asp Ile Ile Asn Gly Ala Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Thr Ser Glu Lys Ala Ile Val Ala Leu Glu Ser Ile Ala 275 280 285 Asp Ser Leu Leu Asn Glu Met Thr Asn Gln Asn Ala Gln Leu Val His 290 295 300 Asp Ile Lys Ala Leu Glu Arg Val Ile Leu Asn Asp Asp Gly Ser Ile 305 310 315 320 Asn Lys Ala Leu Val Gly Lys Asp Ala Ala Phe Ile Leu Asn Lys Ala 325 330 335 Gly Leu Lys Ala Lys Ser Glu Asp Leu Arg Leu Val Ile Val Asp Val 340 345 350 Asp Leu Arg His Pro Phe Val Gln Lys Glu Gln Leu Met Pro Val Ile 355 360 365 Pro Leu Val Arg Ala Lys Asn Phe Asn Glu Ala Met Glu Met Gly Val 370 375 380 Asp Ile Glu Glu Gly Asn Arg His Thr Ala Ile Ile His Ser Lys Asn 385 390 395 400 Val Asp Asn Leu Thr Lys Phe Ala Lys Lys Ile Glu Thr Thr Ile Tyr 405 410 415 Val Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Ala Gly Gly Glu Gly 420 425 430 Tyr Ala Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser 435 440 445 Ala Arg Ser Phe Thr Arg Lys Arg Arg Cys Val Leu Val Asp Gly Phe 450 455 460 Ser Ile Ile 465 <210> 113 <211> 469 <212> PRT <213> Eubacterium limosum <400> 113 Met Asn Ile Asp Thr Thr Gly Ile Glu Tyr Ile Val Lys Lys Val Met 1 5 10 15 Asp Gln Ile Asp Tyr Ala Glu Glu Thr Gly Ala Pro Val Val Asp Gly 20 25 30 Lys Asp Gly Val Phe Gln Thr Met Asp Ala Ala Ile Glu Ala Ala Ala 35 40 45 Val Ala Gln Lys Glu Tyr Met Lys Lys Pro Leu Ala Leu Arg Arg Gln 50 55 60 Met Ile Ala Ala Met Arg Glu Ile Met Leu Lys Lys Glu Asn Ile Glu 65 70 75 80 Thr Ile Cys Ala Met Val Val Glu Glu Ser Gly Met Gly Asn Tyr Glu 85 90 95 His Lys Leu Ala Lys His Arg Leu Ala Thr Thr Gly Thr Pro Gly Val 100 105 110 Glu Asp Leu Leu Thr Glu Ala Trp Ala Gly Asp Asp Gly Cys Thr Leu 115 120 125 Leu Glu Leu Ser Pro Phe Gly Val Ile Gly Ala Ile Thr Pro Thr Thr 130 135 140 Asn Pro Asn Glu Thr Ile Val Asn Asn Ser Ile Gly Met Leu Ala Ala 145 150 155 160 Gly Asn Ala Val Val Phe Ser Pro His Pro Lys Ala Leu Lys Thr Ser 165 170 175 Phe Leu Cys Ile Lys Leu Leu Asn Glu Ala Ile Val Ser Val Gly Gly 180 185 190 Pro Arg Asn Leu Ile Val Thr Cys Ala Asn Pro Thr Ile Glu Ala Ala 195 200 205 Asn Glu Met Met Val His Pro Lys Ile Arg Met Leu Val Ala Thr Gly 210 215 220 Gly Pro Gly Val Val Lys Ala Val Leu Ser Ser Gly Lys Lys Ala Ile 225 230 235 240 Gly Ala Gly Ala Gly Asn Pro Pro Ala Leu Val Asp Glu Thr Ala Asp 245 250 255 Ile Glu Lys Ala Ala Lys Asp Ile Ile Asp Gly Cys Ser Phe Asp Asn 260 265 270 Asn Leu Pro Cys Ile Ala Glu Lys Glu Val Val Val Val Asp Gln Val 275 280 285 Ala Asp Tyr Leu Ile Phe Asn Met Lys Lys Asn Gly Ala Tyr Glu Ile 290 295 300 Thr Asp Lys Lys Ala Ile Asp Ala Leu Ala Asp Leu Val Cys Pro Glu 305 310 315 320 Gly Arg Leu Ser Arg Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Ala 325 330 335 Ala Ala Ala Gly Leu Asp Val Pro Glu Asp Thr Arg Val Leu Ile Cys 340 345 350 Glu Thr Ser Lys Asp His Leu Leu Ala Val Glu Glu Leu Met Met Pro 355 360 365 Ile Leu Pro Ile Val Arg Val Ala Asn Val Asp Glu Gly Ile Asp Val 370 375 380 Ala Val Glu Leu Glu His Gly Asn Arg His Thr Ala Ile Met His Ser 385 390 395 400 Lys Asn Val Asp Lys Leu Thr Glu Met Ala Lys Arg Ile Gln Thr Thr 405 410 415 Ile Phe Val Lys Asn Gly Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly 420 425 430 Glu Gly Tyr Pro Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu 435 440 445 Thr Ser Ala Lys Ser Phe Ala Arg Arg Arg Arg Cys Val Leu Val Gly 450 455 460 Gly Phe Asp Ile Lys 465 <210> 114 <211> 466 <212> PRT <213> Thermoanaerobacter sp. <400> 114 Met Ile Asp Glu Asn Leu Val Val Thr Ile Thr Lys Lys Ile Leu Asn 1 5 10 15 Glu Ile Asn Leu Lys Glu Ala Glu Glu Lys Lys Glu Lys Asp Asn Pro 20 25 30 Asp Leu Gly Ile Phe Asn Asp Val Asn Glu Ala Val Glu Cys Ala Lys 35 40 45 Glu Ala Gln Lys Lys Phe Ala Leu Met Asp Leu Glu Lys Arg Glu Glu 50 55 60 Ile Ile Ala Ala Ile Arg Glu Ala Cys Val Asn Asn Ala Arg Leu Leu 65 70 75 80 Ala Glu Ile Ala Cys Ser Glu Thr Gly Arg Gly Arg Val Glu Asp Lys 85 90 95 Val Ala Lys Asn Ile Leu Ala Ala Lys Lys Thr Pro Gly Thr Glu Asp 100 105 110 Leu Lys Pro Thr Ala Trp Thr Gly Asp Arg Gly Leu Thr Leu Val Glu 115 120 125 Met Ala Pro Val Gly Val Ile Ala Ser Ile Thr Pro Val Thr Asn Pro 130 135 140 Thr Ala Thr Ile Ile Asn Asn Thr Ile Ser Met Leu Ala Ala Gly Asn 145 150 155 160 Ala Val Val Phe Asn Pro His Pro Ser Ala Lys Lys Thr Ser Asn Lys 165 170 175 Ala Val Glu Ile Ile Asn Glu Ala Ile Leu Lys Val Gly Ala Pro Asn 180 185 190 Gly Leu Val Cys Ser Ile Asn Asn Pro Thr Ile Gln Thr Ala Gln Lys 195 200 205 Leu Met Glu His Pro Glu Val Asn Met Val Val Val Thr Gly Gly Lys 210 215 220 Ala Val Val Gln Thr Ala Leu Arg Cys Gly Lys Lys Val Ile Gly Ala 225 230 235 240 Gly Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Val 245 250 255 Lys Ala Ala His Asp Ile Ala Cys Gly Ala Ser Phe Asp Asn Asn Leu 260 265 270 Pro Cys Ile Ala Glu Lys Glu Ile Ile Ala Val Glu Arg Ile Ala Asp 275 280 285 Thr Leu Leu Glu Arg Met Lys Arg Glu Gly Ala Tyr Val Leu His Gly 290 295 300 Lys Asp Ile Asp Arg Met Thr Glu Leu Ile Phe Gln Gly Gly Ala Ile 305 310 315 320 Asn Lys Asp Leu Ile Gly Arg Asp Ala His Phe Ile Leu Ser Gln Ile 325 330 335 Gly Ile Glu Thr Gly Lys Asp Ile Arg Leu Val Val Met Pro Val Asp 340 345 350 Val Ser His Pro Leu Val Tyr His Glu Gln Leu Met Pro Val Ile Pro 355 360 365 Phe Val Thr Val Pro Thr Val Glu Glu Ala Ile Asn Leu Ala Val Lys 370 375 380 Ala Glu Gly Gly Asn Arg His Thr Ala Met Met His Ser Lys Asn Val 385 390 395 400 Glu Asn Met Thr Ala Phe Ala Arg Ala Ile Gln Thr Thr Ile Phe Val 405 410 415 Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Phe Gly Gly Glu Gly Tyr 420 425 430 Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala 435 440 445 Arg Thr Phe Thr Arg Gln Arg Arg Cys Val Leu Val Asp Ala Phe Arg 450 455 460 Ile Val 465 <210> 115 <211> 529 <212> PRT <213> Rhodospirillum rubrum <400> 115 Met Asn Asp Gly Gln Ile Ala Ala Ala Val Ala Lys Val Leu Glu Ala 1 5 10 15 Tyr Gly Val Pro Ala Asp Pro Ser Ala Ala Ala Pro Ala Pro Ala Ala 20 25 30 Pro Val Ala Pro Ala Ala Pro Thr Ala Gly Ser Val Ser Glu Met Ile 35 40 45 Ala Arg Gly Ile Ala Lys Ala Ser Ser Asp Asp Gln Ile Ala Gln Ile 50 55 60 Val Ala Lys Val Val Gly Asp Tyr Ser Ala Gln Ala Ala Lys Pro Ala 65 70 75 80 Val Val Pro Gly Ala Ala Ala Ser Thr Glu Ala Gly Asp Gly Val Phe 85 90 95 Asp Thr Met Asp Ala Ala Val Asp Ala Ala Val Leu Ala Gln Gln Gln 100 105 110 Tyr Leu Leu Cys Ser Met Thr Asp Arg Gln Arg Phe Val Asp Gly Ile 115 120 125 Arg Glu Val Ile Leu Gln Lys Asp Thr Leu Glu Leu Ile Ser Arg Met 130 135 140 Ala Ala Glu Glu Thr Gly Met Gly Asn Tyr Glu His Lys Leu Ile Lys 145 150 155 160 Asn Arg Leu Ala Ala Glu Lys Thr Pro Gly Thr Glu Asp Leu Thr Thr 165 170 175 Glu Ala Phe Ser Gly Asp Asp Gly Leu Thr Leu Val Glu Tyr Ser Pro 180 185 190 Phe Gly Ala Ile Gly Ala Val Ala Pro Thr Thr Asn Pro Thr Glu Thr 195 200 205 Ile Ile Cys Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Ser Val Ile 210 215 220 Phe Ser Pro His Pro Arg Ala Thr Lys Val Ser Leu Leu Thr Val Lys 225 230 235 240 Leu Ile Asn Gln Lys Leu Ala Cys Leu Gly Ala Pro Ala Asn Leu Val 245 250 255 Val Thr Val Ser Lys Pro Ser Val Glu Asn Thr Asn Ala Met Met Ala 260 265 270 His Pro Lys Ile Arg Met Leu Val Ala Thr Gly Gly Pro Gly Ile Val 275 280 285 Lys Ala Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly 290 295 300 Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala Ala 305 310 315 320 Leu Asp Ile Ile Asn Gly Cys Ser Phe Asp Asn Asn Leu Pro Cys Ile 325 330 335 Ala Glu Lys Glu Ile Ile Ala Val Ala Gln Ile Ala Asp Tyr Leu Ile 340 345 350 Phe Ser Met Lys Lys Gln Gly Ala Tyr Gln Ile Thr Asp Pro Ala Val 355 360 365 Leu Arg Lys Leu Gln Asp Leu Val Leu Thr Ala Lys Gly Gly Pro Gln 370 375 380 Thr Ser Cys Val Gly Lys Ser Ala Val Trp Leu Leu Asn Lys Ile Gly 385 390 395 400 Ile Glu Val Asp Ser Ser Val Lys Val Ile Leu Met Glu Val Pro Lys 405 410 415 Glu His Pro Phe Val Gln Glu Glu Leu Met Met Pro Ile Leu Pro Leu 420 425 430 Val Arg Val Ser Asp Val Asp Glu Ala Ile Ala Val Ala Ile Glu Val 435 440 445 Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr Asn Val Arg 450 455 460 Lys Leu Thr Lys Met Ala Lys Leu Ile Gln Thr Thr Ile Phe Val Lys 465 470 475 480 Asn Gly Pro Ser Tyr Ala Gly Leu Gly Val Gly Gly Glu Gly Tyr Thr 485 490 495 Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Ala Lys 500 505 510 Ser Phe Ala Arg Lys Arg Lys Cys Val Met Val Glu Ala Leu Asn Ile 515 520 525 Arg <210> 116 <211> 466 <212> PRT <213> Eubacterium yurii <400> 116 Met Asn Pro Glu Leu Leu Glu Asp Val Val Arg Gln Val Leu Ser Glu 1 5 10 15 Met Lys Leu Glu Ser Ser Lys Met Val Asp Ile Tyr Asn Tyr Gly Ile 20 25 30 Phe Asp Ser Val Asp Asp Ala Ile Asn Ala Ser Glu Ile Ala Gln Arg 35 40 45 Gln Leu Phe Glu Cys Ser Val Gln Lys Arg Asn Glu Tyr Val Asn Ala 50 55 60 Ile Arg Gln Ile Ile Leu Lys Lys Asp Asn Leu Glu Met Met Ser Arg 65 70 75 80 Asp Ala Val Glu Glu Thr Gly Ile Gly Arg Tyr Glu Asp Lys Ile Leu 85 90 95 Lys Asn Lys Leu Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu Ile 100 105 110 Thr Arg Ala Val Ser Gly Gln Asp Gly Leu Thr Leu Glu Glu Tyr Cys 115 120 125 Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu 130 135 140 Thr Phe Ile Ser Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr Val 145 150 155 160 Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Ile Lys Leu Val 165 170 175 Lys Leu Met Asn Lys Ala Leu Glu Gln Val Gly Ala Pro Arg Asn Leu 180 185 190 Ile Ser Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met Met 195 200 205 Asn His Pro Lys Ile Lys Met Leu Val Ala Thr Gly Gly Pro Ala Ile 210 215 220 Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Val Ala Gly Ser Ser Phe Asp Asn Asn Val Pro Cys 260 265 270 Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Ile Cys Asp Gln Leu 275 280 285 Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Ser Tyr Glu 290 295 300 Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys Pro 305 310 315 320 Asn Thr Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys Leu 325 330 335 Gly Ile Ser Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr Asn 340 345 350 Lys Asp His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu Pro 355 360 365 Ile Val Ser Val Ser Asp Val Asp Val Ala Ile Glu Tyr Ala Tyr Glu 370 375 380 Ala Glu His Arg Asn Arg His Thr Ala Ile Met His Ser Arg Asn Val 385 390 395 400 Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe Val 405 410 415 Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr 420 425 430 Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro 435 440 445 Lys Ser Phe Cys Arg Val Arg Arg Cys Thr Met Ser Asp Ser Phe Ser 450 455 460 Ile Arg 465 <210> 117 <211> 466 <212> PRT <213> Eubacterium sp. <400> 117 Met Asn Pro Glu Leu Leu Glu Asp Val Val Arg Gln Val Leu Ser Glu 1 5 10 15 Met Lys Leu Glu Ser Ser Lys Met Val Asp Ile Tyr Asn Tyr Gly Ile 20 25 30 Phe Asp Ser Val Asp Asp Ala Ile Asn Ala Ser Glu Ile Ala Gln Arg 35 40 45 Gln Leu Phe Glu Cys Ser Val Gln Lys Arg Asn Glu Tyr Val Asn Ala 50 55 60 Ile Arg Gln Ile Ile Leu Lys Lys Asp Asn Leu Glu Met Met Ser Arg 65 70 75 80 Asp Ala Val Glu Glu Thr Gly Ile Gly Arg Tyr Glu Asp Lys Ile Leu 85 90 95 Lys Asn Lys Leu Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu Ile 100 105 110 Thr Arg Ala Val Ser Gly Gln Asp Gly Leu Thr Leu Glu Glu Tyr Cys 115 120 125 Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr Glu 130 135 140 Thr Phe Ile Ser Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr Val 145 150 155 160 Val Phe Ser Pro His Pro Arg Ala Lys Asn Thr Ser Ile Lys Leu Val 165 170 175 Lys Leu Met Asn Lys Ala Leu Glu Gln Val Gly Ala Pro Arg Asn Leu 180 185 190 Ile Ser Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met Met 195 200 205 Asn His Pro Lys Ile Lys Met Leu Val Ala Thr Gly Gly Pro Ala Ile 210 215 220 Val Lys Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly Ala 225 230 235 240 Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys Ala 245 250 255 Ala Lys Asp Ile Val Ala Gly Ser Ser Phe Asp Asn Asn Val Pro Cys 260 265 270 Ile Ala Glu Lys Glu Val Phe Ala Val Glu Ser Ile Cys Asp Gln Leu 275 280 285 Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Thr Ser Tyr Glu 290 295 300 Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys Pro 305 310 315 320 Asn Thr Asp Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys Leu 325 330 335 Gly Ile Asn Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr Asn 340 345 350 Lys Asp His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu Pro 355 360 365 Ile Val Ser Val Ser Asp Val Asp Val Ala Ile Glu Tyr Ala Tyr Glu 370 375 380 Ala Glu His Arg Asn Arg His Thr Ala Ile Met His Ser Arg Asn Val 385 390 395 400 Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe Val 405 410 415 Lys Asn Ala Pro Ser Tyr Ala Gly Ile Gly Val Gly Gly Glu Gly Tyr 420 425 430 Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Leu Thr Ser Pro 435 440 445 Lys Ser Phe Cys Arg Val Arg Arg Cys Thr Met Ser Asp Ser Phe Ser 450 455 460 Ile Arg 465 <210> 118 <211> 532 <212> PRT <213> Vibrio sp. <400> 118 Met Asn Glu Gln Glu Ile Ala His Ala Val Glu Asn Val Leu Ser Lys 1 5 10 15 Tyr Thr Asn Val Thr Ala Gln Asn Ala Glu Pro Val Ser Tyr Ser Ser 20 25 30 Asn Ala Ser Leu Glu Asn Ile Val Ser Gln Ala Leu Ala Gly Asn Met 35 40 45 Val Lys Gln Pro Glu Thr Gln Thr Ala Pro Asp Leu Asn Ser Asn Ile 50 55 60 Glu Asn Ile Val Ser Gln Ile Leu Ala Glu Asn Gln Ala Lys Pro Gln 65 70 75 80 Ser Val Gln Cys Gln Ser Ala Asn His Gly Thr Thr Glu Tyr Leu Gly 85 90 95 Cys Phe Ala Ser Met Glu Glu Ala Ile Ser Ala Ala Ser His Ala Gln 100 105 110 Val Gln Tyr Arg His Cys Thr Met Gly Asp Arg Ala Ser Phe Val Lys 115 120 125 Gly Ile Arg Glu Val Phe Thr Gln Asp Asp Val Leu Glu Lys Ile Ser 130 135 140 Arg Met Ala Val Glu Glu Thr Gly Met Gly Asn Tyr Ala Asp Lys Leu 145 150 155 160 Thr Lys Asn Arg Ile Ala Ala Thr Lys Thr Pro Gly Ile Glu Asp Leu 165 170 175 Thr Thr Ser Ala Leu Ser Gly Asp Ser Gly Leu Thr Leu Thr Glu Phe 180 185 190 Ser Ala Tyr Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr 195 200 205 Glu Thr Ile Ile Asn Asn Ser Ile Gly Met Leu Ala Ala Gly Asn Thr 210 215 220 Val Val Tyr Ser Pro His Pro Arg Ser Arg Asn Val Ser Leu Val Ala 225 230 235 240 Val Asp Leu Ile Asn Arg Lys Leu Ala Glu Leu Gly Ala Pro Ala Asn 245 250 255 Leu Val Val Thr Val Leu Glu Pro Ser Ile Asp Asn Thr Asn Ala Met 260 265 270 Met Asn Asp Pro Arg Val Asn Met Leu Val Ala Thr Gly Gly Pro Ser 275 280 285 Ile Val Lys Thr Val Met Ser Thr Gly Lys Lys Ala Ile Gly Ala Gly 290 295 300 Ala Gly Asn Pro Pro Ala Val Val Asp Glu Thr Ala Asn Ile Glu Lys 305 310 315 320 Ala Ala Lys Asp Ile Ile Asn Gly Cys Ala Phe Asp Asn Asn Leu Pro 325 330 335 Cys Ile Ala Glu Lys Glu Val Ile Val Val Asn Glu Val Ala Asp Tyr 340 345 350 Leu Ile His Cys Met Lys Lys Ser Gly Ala Tyr Leu Leu Cys Asp Lys 355 360 365 Gln Lys Ile Gln Gln Leu Gln Ser Leu Val Leu Asn Glu Lys Gly Thr 370 375 380 Gly Pro Asn Thr Ser Phe Val Gly Lys Gly Ala Arg Tyr Ile Leu Asp 385 390 395 400 Lys Leu Asn Ile Gln Val Ser Asp Asp Ile Lys Val Ile Leu Ile Glu 405 410 415 Thr Glu Arg Asn His Pro Phe Val Val His Glu Leu Met Met Pro Ile 420 425 430 Leu Pro Val Val Arg Val Glu Asn Val Asp Glu Ala Ile Asp Leu Ala 435 440 445 Ile Lys Val Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Thr 450 455 460 Asn Val Glu Lys Leu Ser Lys Met Ala Arg Leu Ile Gln Thr Thr Ile 465 470 475 480 Phe Val Lys Asn Gly Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu 485 490 495 Gly His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr 500 505 510 Ser Ala Arg Ser Phe Ala Arg Tyr Arg Arg Cys Val Met Val Glu Ala 515 520 525 Leu Asn Ile Arg 530 <210> 119 <211> 467 <212> PRT <213> Eubacteriaceae bacterium <400> 119 Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu 1 5 10 15 Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly 20 25 30 Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln 35 40 45 Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn 50 55 60 Val Ile Arg Lys Glu Ile Leu Lys Lys Asp Asn Leu Glu Met Ile Ser 65 70 75 80 Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile 85 90 95 Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu 100 105 110 Thr Thr Arg Ala Ile Ser Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr 115 120 125 Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr 130 135 140 Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr 145 150 155 160 Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu 165 170 175 Val Lys Met Met Asn Lys Ala Leu Glu Glu His Gly Ala Pro Arg Asn 180 185 190 Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met 195 200 205 Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe 210 215 220 Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys 245 250 255 Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met 275 280 285 Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln 290 295 300 Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys 305 310 315 320 Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys 325 330 335 Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr 340 345 350 Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu 355 360 365 Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr 370 375 380 Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn 385 390 395 400 Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe 405 410 415 Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly 420 425 430 His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser 435 440 445 Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe 450 455 460 Ser Ile Arg 465 <210> 120 <211> 473 <212> PRT <213> Propionibacterium propionicum <400> 120 Met Lys Ile Asp Pro Ala Gln Leu Glu Ala Thr Ile Arg Glu Val Leu 1 5 10 15 Ala Ala Met Leu Pro Gly Asn Asp Asn Gln Thr Glu Ala Pro Ala Thr 20 25 30 Gln Gln Glu Ala Pro Gly Asp Gly Val Phe Ala Asp Met Asp Ser Ala 35 40 45 Val Glu Ala Ala His Leu Ala Gln Arg Glu Tyr Leu Ser His Pro Met 50 55 60 Ala Asp Arg Arg Arg Tyr Val Ala Ala Ile Arg Glu Ala Met Leu Ala 65 70 75 80 Pro Glu Ala Leu Asp Tyr Met Ser Glu Gln Ala Val Ala Gln Ser Gly 85 90 95 Met Gly Asp Val Gly His Lys Tyr Leu Lys Asn Lys Val Ala Ala Ala 100 105 110 Glu Thr Pro Gly Val Glu Asp Leu Val Thr Glu Ala Trp Ser Gly Asp 115 120 125 Asp Gly Leu Thr Thr Ile Glu Tyr Ser Pro Tyr Gly Val Ile Gly Ala 130 135 140 Ile Thr Pro Thr Thr Asn Pro Thr Glu Thr Ile Thr Cys Asn Ser Ile 145 150 155 160 Gly Met Leu Ala Ala Gly Asn Ala Val Val Phe Ser Pro His Pro Arg 165 170 175 Val Ala Lys Leu Ser Cys Trp Gln Val Arg Arg Ile Asn Arg Ala Leu 180 185 190 Arg Ala Ala Gly Ala Pro Asp Asn Leu Val Val Thr Val Thr Ala Pro 195 200 205 Ser Leu Glu Asn Thr Asn Ala Met Met Ala His Pro Lys Val Arg Met 210 215 220 Leu Val Ala Thr Gly Gly Pro Gly Ile Val Lys Ala Val Leu Ser Ser 225 230 235 240 Gly Lys Lys Ala Ile Gly Ala Gly Ala Gly Asn Pro Pro Ala Val Val 245 250 255 Asp Glu Thr Ala Asp Ile Glu His Ala Ala Lys Cys Ile Val Asp Gly 260 265 270 Ala Ser Phe Asp Asn Asn Leu Pro Cys Thr Ala Glu Lys Glu Ile Ile 275 280 285 Ala Val Asp Ser Ile Ala Asp Met Leu Lys Phe Cys Met Ile Lys His 290 295 300 Gly Ala Tyr Glu Ala Thr Ala Ser Glu Val Ala Glu Leu Glu Lys Leu 305 310 315 320 Leu Val Asn Gly Asp Lys Pro Arg Thr Glu Trp Val Gly Lys Pro Ala 325 330 335 Ala Lys Ile Leu Glu Ala Ile Gly Val Thr Pro Pro Pro Gly Val Arg 340 345 350 Leu Ile Val Cys Glu Ala Ser Ala Thr His Pro Phe Val Val His Glu 355 360 365 Leu Met Met Pro Val Leu Gly Leu Val Arg Val Pro Asp Val Asp Ala 370 375 380 Ala Ile Asp Leu Ala Val Glu Leu Glu His Gly Asn Arg His Thr Ala 385 390 395 400 Val Met His Ser Leu Asn Val Ser Lys Leu Thr Lys Met Gly Lys Leu 405 410 415 Ile Gln Thr Thr Ile Phe Val Lys Asn Gly Pro Ser Tyr Asn Gly Ile 420 425 430 Gly Ile Gly Gly Glu Gly Tyr Pro Thr Phe Thr Ile Ala Gly Pro Thr 435 440 445 Gly Glu Gly Leu Thr Ser Ala Arg Ser Phe Thr Arg Lys Arg Arg Cys 450 455 460 Val Leu Val Gly Asp Leu Asn Val Arg 465 470 <210> 121 <211> 467 <212> PRT <213> Eubacteriaceae bacterium <400> 121 Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu 1 5 10 15 Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly 20 25 30 Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln 35 40 45 Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn 50 55 60 Val Ile Arg Lys Glu Ile Leu Lys Lys Asp Asn Leu Glu Met Ile Ser 65 70 75 80 Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile 85 90 95 Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu 100 105 110 Thr Thr Arg Ala Leu Thr Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr 115 120 125 Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr 130 135 140 Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr 145 150 155 160 Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu 165 170 175 Val Lys Met Met Asn Lys Ala Leu Glu Glu Tyr Gly Ala Pro Arg Asn 180 185 190 Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met 195 200 205 Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe 210 215 220 Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys 245 250 255 Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met 275 280 285 Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln 290 295 300 Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys 305 310 315 320 Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys 325 330 335 Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr 340 345 350 Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu 355 360 365 Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr 370 375 380 Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn 385 390 395 400 Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe 405 410 415 Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly 420 425 430 His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser 435 440 445 Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe 450 455 460 Ser Ile Arg 465 <210> 122 <211> 467 <212> PRT <213> Eubacteriaceae bacterium <400> 122 Met Asn Ala Glu Leu Leu Gln Asp Val Val Arg Gln Val Leu Ser Glu 1 5 10 15 Met Lys Leu Glu Ser Ser Asn Ile Leu Ser Asn Glu Tyr Asn Tyr Gly 20 25 30 Ile Phe Asp Asp Met Glu Ala Ala Ile Asn Ala Ser Glu Thr Ala Gln 35 40 45 Arg Lys Leu Phe Glu Cys Ser Val Gln Gln Arg Asn Glu Phe Ala Asn 50 55 60 Val Ile Arg Arg Glu Val Leu Lys Lys Asp Asn Leu Glu Met Ile Ser 65 70 75 80 Arg Asp Ala Val Glu Glu Thr Glu Ile Gly Arg Phe Glu Asp Lys Ile 85 90 95 Leu Lys Asn Lys Val Ala Ala Glu Lys Thr Pro Gly Met Glu Asp Leu 100 105 110 Thr Thr Arg Ala Leu Thr Gly Lys Asp Gly Leu Met Ile Glu Glu Tyr 115 120 125 Cys Pro Phe Gly Val Ile Gly Ser Ile Thr Pro Thr Thr Asn Pro Thr 130 135 140 Glu Thr Leu Ile Asn Asn Ser Ile Ser Met Ile Val Gly Gly Asn Thr 145 150 155 160 Val Val Phe Ser Pro His Pro Arg Ala Lys Asn Val Ser Ile Lys Leu 165 170 175 Val Lys Met Met Asn Lys Ala Leu Glu Glu Tyr Gly Ala Pro Arg Asn 180 185 190 Met Ile Thr Met Val Lys Glu Pro Ser Ile Glu Asn Thr Asn Leu Met 195 200 205 Met Ser Asn Pro Lys Val Lys Leu Leu Val Ala Thr Gly Gly Pro Phe 210 215 220 Ile Val Asn Thr Val Leu Ser Ser Gly Lys Lys Ala Ile Gly Ala Gly 225 230 235 240 Ala Gly Asn Pro Pro Val Val Val Asp Glu Thr Ala Asp Ile Glu Lys 245 250 255 Ala Ala Ile Asp Ile Val Ser Gly Ala Ser Phe Asp Asn Asn Val Pro 260 265 270 Cys Ile Ala Glu Lys Glu Val Phe Ala Val Asp Ser Ile Ser Asp Met 275 280 285 Leu Ile Tyr His Met Lys Lys Asn Gly Ala Tyr Glu Ile Val Ser Gln 290 295 300 Asp Met Ile Glu Lys Leu Asp Lys Leu Val Ser Gln Glu Asn Gly Lys 305 310 315 320 Pro Lys Thr Glu Phe Val Gly Lys Ser Ala Lys Tyr Ile Leu Glu Lys 325 330 335 Leu Gly Ile Tyr Val Asp Asp Ser Ile Arg Leu Ile Ile Cys Arg Thr 340 345 350 Ser Lys Asn His His Leu Val Gln Glu Glu Met Leu Met Pro Ile Leu 355 360 365 Pro Ile Val Ser Val Ser Asp Val Asp Ile Ala Ile Glu Tyr Ala Tyr 370 375 380 Glu Ala Glu His Gly Asn Arg His Thr Ala Ile Met His Ser Lys Asn 385 390 395 400 Val Glu Lys Leu Ser Lys Met Ala Lys Lys Leu Glu Ala Thr Ile Phe 405 410 415 Val Lys Asn Ala Pro Ser Tyr Ser Gly Ile Gly Val Gly Gly Glu Gly 420 425 430 His Thr Thr Phe Thr Ile Ala Gly Pro Thr Gly Glu Gly Ile Thr Ser 435 440 445 Ala Lys Ser Phe Cys Arg Ile Arg Arg Cys Val Met His Asp Ser Phe 450 455 460 Ser Ile Arg 465 <210> 123 <211> 468 <212> PRT <213> Clostridium beijerinckii <400> 123 Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys 1 5 10 15 Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser 20 25 30 Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val 35 40 45 His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu 50 55 60 Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val 65 70 75 80 Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp 85 90 95 Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu 100 105 110 Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val 115 120 125 Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly 145 150 155 160 Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala 165 170 175 Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro 180 185 190 Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp 195 200 205 Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly 210 215 220 Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile 245 250 255 Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn 260 265 270 Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala 275 280 285 Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn 290 295 300 Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn 305 310 315 320 Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala 325 330 335 Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys 340 345 350 Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu 355 360 365 Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu 370 375 380 Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala 385 390 395 400 Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu 405 410 415 Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val 420 425 430 Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr 435 440 445 Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys 450 455 460 Val Leu Ala Gly 465 <210> 124 <211> 20 <212> PRT <213> Clostridium saccharoperbutylacetonicum <400> 124 Leu Gln Lys Asn Asn Glu Thr Gln Glu Tyr Ser Ile Asn Lys Lys Trp 1 5 10 15 Val Gly Lys Asp 20 <210> 125 <211> 15 <212> PRT <213> Lactobacillus brevis <400> 125 Ile Gly Pro Lys Gly Ala Pro Asp Arg Lys Phe Val Gly Lys Asp 1 5 10 15 <210> 126 <211> 14 <212> PRT <213> Clostridium phytofermentans <400> 126 Ile Thr Pro Lys Gly Leu Asn Arg Asn Cys Val Gly Lys Asp 1 5 10 <210> 127 <211> 18 <212> PRT <213> Clostridium saccharoperbutylacetonicum <400> 127 Ser Phe Ala Gly Val Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr 1 5 10 15 Ile Ala <210> 128 <211> 22 <212> PRT <213> Lactobacillus brevis <400> 128 Thr Tyr Cys Gly Thr Gly Val Ala Thr Asn Gly Ala His Ser Gly Ala 1 5 10 15 Ser Ala Leu Thr Ile Ala 20 <210> 129 <211> 18 <212> PRT <213> Clostridium phytofermentans <400> 129 Ser Tyr Ala Ala Ile Gly Phe Gly Gly Glu Gly Phe Cys Thr Phe Thr 1 5 10 15 Ile Ala

Claims (89)

  1. 하기로부터 선택되는 단리된 핵산 분자:
    (a) 서열번호 1, 서열번호 2 또는 서열번호 3, 또는 표 4에 언급된 아미노산 서열을 코딩하고, 상기 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하는, 핵산 분자;
    (b) 위치 I66에 대응되는 아미노산 치환을 코딩하는 핵산 서열을 포함하며 고 엄격성 혼성화 조건에서 (a)의 핵산에 혼성하는, 핵산 분자; 및
    (c) (a) 또는 (b)에 상보적인 핵산 분자.
  2. 제1항에 있어서,
    상기 위치 I66에서 아미노산 치환이 표 1, 2 및/또는 3에 기재된 아미노산 치환인, 단리된 핵산 분자.
  3. 제1항 또는 제2항에 있어서,
    상기 아미노산 서열이, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 다른 아미노산 변이 위치에서의 아미노산 치환을 하나 이상 포함하는, 단리된 핵산 분자.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 아미노산 서열이, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 아미노산 치환을 하나 이상 포함하는, 단리된 핵산 분자.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 하나 이상의 아미노산 치환을 제외한, 아미노산 서열이, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열과 동일하거나 또는 이에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지는, 단리된 핵산 분자.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 아미노산 서열이 표 1, 2 및/또는 3에 기재된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함하는, 단리된 핵산 분자.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 아미노산 서열이 표 1, 2 및/또는 3에 기재된 변이체의 아미노산 치환을 포함하는, 단리된 핵산 분자.
  8. 제1항 내지 제7항 중 어느 한 항에 따른 핵산 분자를 포함하는 벡터.
  9. 제8항에 있어서,
    상기 벡터가 발현 벡터인, 벡터.
  10. 제8항 또는 제9항에 있어서,
    상기 벡터가 이중 가닥 DNA를 포함하는, 벡터.
  11. 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열을 포함하고,
    상기 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하는,
    단리된 폴리펩타이드.
  12. 제11항에 있어서,
    상기 위치 I66에서의 아미노산 치환이 표 1, 2 및/또는 3에 언급된 아미노산 치환인, 단리된 폴리펩타이드.
  13. 제11항 또는 제12항에 있어서,
    상기 아미노산 서열이, 아미노산 위치 I66에 대응되는 치환과 더불어, 표 1, 2 및/또는 3에 언급된 다른 아미노산 변이 위치에서의 아미노산 치환 하나 이상을 포함하는, 단리된 폴리펩타이드.
  14. 제11항 내지 제13항 중 어느 한 항에 있어서,
    상기 아미노산 서열이, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 아미노산 치환 하나 이상을 포함하는, 단리된 폴리펩타이드.
  15. 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열을 포함하고,
    상기 아미노산 서열이 위치 I66에 대응되는 아미노산 치환을 포함하며,
    상기 위치 I66에 대응되는 아미노산 치환을 제외한, 아미노산 서열이, 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열과 동일하거나 또는 이에 대해 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%의 서열 동일성을 가지는,
    단리된 폴리펩타이드.
  16. 제15항에 있어서,
    상기 위치 I66에서의 아미노산 치환이 표 1, 2 및/또는 3에 언급된 아미노산 치환인, 단리된 폴리펩타이드.
  17. 제15항 또는 제16항에 있어서,
    상기 아미노산 서열이, 아미노산 위치 I66에 대응되는 치환과 더불어, 표 1, 2 및/또는 3에 언급된 아미노산 변이 위치에서의 아미노산 치환 하나 이상을 포함하는, 단리된 폴리펩타이드.
  18. 제15항 내지 제17항 중 어느 한 항에 있어서,
    상기 아미노산 서열이, 위치 I66에서의 치환과 더불어, 표 1, 2 및/또는 3에 기재된 아미노산 치환 하나 이상을 포함하는, 단리된 폴리펩타이드.
  19. 제15항 내지 제18항 중 어느 한 항에 있어서,
    상기 아미노산 서열이 1-100 아미노산 위치들에서 보존적인 아미노산 치환을 더 포함하고, 그 위치가 표 1, 2 및/또는 3에 언급된 하나 이상의 아미노산 치환과는 다른 위치인, 단리된 폴리펩타이드.
  20. 제11항 내지 제19항 중 어느 한 항에 있어서,
    상기 표 1, 2 및/또는 3에 언급된 하나 이상의 아미노산 치환을 제외한, 아미노산 서열이, 모 서열과 비교해 2-300 아미노산 위치들에 변형을 포함하지 않으며, 그 위치가 서열번호 1, 서열번호 2, 서열번호 3 또는 표 4에 언급된 아미노산 서열들 중 2, 3, 4 또는 5개의 서열들 간에 동일한 위치들로부터 선택되는, 단리된 폴리펩타이드.
  21. 제11항 내지 제20항 중 어느 한 항에 있어서,
    상기 아미노산 서열이 표 1, 2 및/또는 3에 언급된 아미노산 치환들 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 또는 16개를 포함하는, 단리된 폴리펩타이드.
  22. 제11항 내지 제21항 중 어느 한 항에 있어서,
    상기 아미노산 서열이 표 1, 2 및/또는 3에 언급된 변이체의 아미노산 치환을 포함하는, 단리된 폴리펩타이드.
  23. 제11항 내지 제22항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 알데하이드 데하이드로게나제를 코딩하는, 단리된 폴리펩타이드.
  24. 제11항 내지 제23항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 3-하이드록시부티릴-CoA를 3-하이드록시부티르알데하이드로 변환할 수 있는, 단리된 폴리펩타이드.
  25. 제11항 내지 제23항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 4-하이드록시부티릴-CoA를 4-하이드록시부티르알데하이드로 변환할 수 있는, 단리된 폴리펩타이드.
  26. 제11항 내지 제25항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 모 폴리펩타이드에 비해 더 높은 활성을 가지는, 단리된 폴리펩타이드.
  27. 제11항 내지 제24항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가지는, 단리된 폴리펩타이드.
  28. 제11항 내지 제24항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 아세틸-CoA에 비해 3-하이드록시부티릴-CoA에 대해 더 높은 특이성을 가지는, 단리된 폴리펩타이드.
  29. 제11항 내지 제23항 또는 제25항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 아세틸-CoA에 비해 4-하이드록시부티릴-CoA에 대해 더높은 특이성을 가지는, 단리된 폴리펩타이드.
  30. 제11항 내지 제25항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 세포 또는 세포 추출물에서 부산물을 적게 생성하는, 단리된 폴리펩타이드.
  31. 제30항에 있어서,
    상기 부산물이 에탄올 또는 4-하이드록시-2-부타논인, 단리된 폴리펩타이드.
  32. 제11항 내지 제25항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 모 폴리펩타이드와 비교해 더 높은 kcat를 가지는, 단리된 폴리펩타이드.
  33. 제8항 내지 제10항 중 어느 한 항에 따른 벡터를 포함하는 세포.
  34. 제1항 내지 제7항 중 어느 한 항에 따른 핵산을 포함하는 세포.
  35. 제34항에 있어서,
    상기 핵산 분자가 상기 세포의 염색체에 병합된, 세포.
  36. 제35항에 있어서,
    상기 병합이 부위-특이적인, 세포.
  37. 제33항 내지 제36항 중 어느 한 항에 있어서,
    상기 핵산 분자가 발현되는, 세포.
  38. 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드를 포함하는 세포.
  39. 제33항 내지 제38항 중 어느 한 항에 있어서,
    상기 세포가 미생물 유기체인, 세포.
  40. 제39항에 있어서,
    상기 미생물 유기체가 세균, 효모 또는 진균인, 세포.
  41. 제33항 내지 제38항 중 어느 한 항에 있어서,
    상기 세포가 단리된 진핵생물 세포인, 세포.
  42. 제33항 내지 제41항 중 어느 한 항에 있어서,
    상기 세포가 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이들의 에스테르 또는 아미드를 생산하는 경로를 포함하는, 세포.
  43. 제33항 내지 제41항 중 어느 한 항에 있어서,
    상기 세포가 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이들의 에스테르 또는 아미드를 생산하는 경로를 포함하는, 세포.
  44. 제33항 내지 제43항 중 어느 한 항에 있어서,
    상기 세포가 발효가능한, 세포.
  45. 제33항 내지 제44항 중 어느 한 항에 있어서,
    상기 폴리펩타이드에 대한 하나 이상의 기질을 더 포함하는, 세포.
  46. 제45항에 있어서,
    상기 기질이 3-하이드록시부티릴-CoA인, 세포.
  47. 제46항에 있어서,
    상기 기질이 3-하이드록시-(R)-부티릴-CoA인, 세포.
  48. 제46항 또는 제47항에 있어서,
    상기 세포가 3-하이드록시-(S)-부티릴-CoA에 비해 3-하이드록시-(R)-부티릴-CoA에 대해 더 높은 활성을 가지는, 세포.
  49. 제45항에 있어서,
    상기 기질이 4-하이드록시부티릴-CoA인, 세포.
  50. 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드의 생촉매로서의 용도.
  51. 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드; 및 상기 폴리펩타이드에 대한 하나 이상의 기질을 포함하는, 조성물.
  52. 제51항에 있어서,
    상기 폴리펩타이드가 시험관내 조건에서 상기 기질과 반응할 수 있는, 조성물.
  53. 제51항 또는 제52항에 있어서,
    상기 기질이 3-하이드록시부티릴-CoA인, 조성물.
  54. 제53항에 있어서,
    상기 기질이 3-하이드록시-(R)-부티릴-CoA인, 조성물.
  55. 제51항 또는 제52항에 있어서,
    상기 기질이 4-하이드록시부티릴-CoA인, 조성물.
  56. 제33항 내지 제49항 중 어느 한 항에 따른 세포를 포함하는 배양 배지 (culture medium).
  57. 제8항 내지 제10항 중 어느 한 항에 따른 벡터를 발효가능한 세포에 도입하는 것을 포함하는, 숙주 균주를 구축하는 방법.
  58. 제33항 내지 제49항 중 어느 한 항에 따른 세포를 배양하여, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO) 또는 이들의 에스테르 또는 아미드를 생산하는 것을 포함하는,
    3-HBal 및/또는 1,3-BDO 또는 이들의 에스테르 또는 아미드의 생산 방법.
  59. 제33항 내지 제49항 중 어느 한 항에 따른 세포를 배양하여, 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO) 또는 이들의 에스테르 또는 아미드를 생산하는 것을 포함하는,
    4-HBal 및/또는 1,4-BDO 또는 이들의 에스테르 또는 아미드의 생산 방법.
  60. 제58항 또는 제59항에 있어서,
    상기 세포가 실질적으로 혐기성 배양 배지에 존재하는, 방법.
  61. 제58항 내지 제60항 중 어느 한 항에 있어서,
    3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 또는 이들의 에스테르 또는 아미드를 단리 또는 정제하는 것을 더 포함하는, 방법.
  62. 제61항에 있어서,
    상기 단리 또는 정제가 증류를 포함하는, 방법.
  63. 생물 유래의 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 배양 배지로서,
    상기 생물 유래의 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 대기 이산화탄소 흡수원 (atmospheric carbon dioxide uptake source)을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며,
    상기 생물 유래의 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO가 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되는, 배양 배지.
  64. 제63항에 있어서,
    상기 배양 배지는 상기 세포로부터 분리되는, 배양 배지.
  65. 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며,
    3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)이 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되는,
    3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO.
  66. 제65항에 있어서,
    상기 3-HBal 및/또는 1,3-BDO, 또는 상기 4-HBal 및/또는 1,4-BDO가 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가지는, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO.
  67. 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되는, 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO), 또는 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO).
  68. 대기 이산화탄소 흡수원을 반영하는 탄소-12, 탄소-13 및 탄소-14 동위원소 비율을 가지며,
    3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)가 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되고,
    상기 3-HBal 및/또는 1,3-BDO가 R 형태에 대해 거울상이성질체 측면에서 농화된,
    3-HBal 및/또는 1,3-BDO.
  69. 제68항에 있어서,
    상기 3-HBal 및/또는 1,3-BDO가 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98%의 Fm 값을 가지는, 3-HBal 및/또는 1,3-BDO.
  70. 제33항 내지 제49항 중 어느 한 항에 따른 세포 또는 제58항 내지 제62항 중 어느 한 항에 따른 방법에 의해 생산되고,
    R 형태에 대해 거울상이성질체 측면에서 농화된,
    3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO).
  71. 제70항에 있어서,
    3-HBal 및/또는 1,3-BDO의 R 형태가 95% 보다 높은, 96% 보다 높은, 97% 보다 높은, 98% 보다 높은, 99% 보다 높은, 99.5% 보다 높은 또는 99.9% 보다 높은 비율을 차지하는, 3-HBal 및/또는 1,3-BDO.
  72. 제68항 내지 제71항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO; 및
    3-HBal 및/또는 1,3-BDO, 또는 4-HBal 또는 1,4-BDO 이외의 다른 화합물을 각각 포함하는,
    조성물.
  73. 제62항에 있어서,
    상기 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO 이외의 다른 화합물이, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 각각 생산하거나 또는 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드를 발현하는 세포의 일부인, 조성물.
  74. 제65항 내지 제71항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO, 또는
    3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 생산하는 세포의 세포용해물 (cell lysate) 또는 배양 상층액을 포함하는,
    조성물.
  75. 제65항 내지 제71항 중 어느 한 항에 따른 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 포함하는 생산물로서,
    상기 생산물이 플라스틱, 탄성 섬유, 폴리우레탄, 폴리에스테르, 폴리하이드록시알카노에이트, 폴리-4-하이드록시부티레이트 (P4HB) 또는 이의 코폴리머, 폴리(테트라메틸렌 에테르) 글리콜 (PTMEG), 폴리부틸렌 테레프탈레이트 (PBT), 폴리우레탄-폴리우레아 코폴리머, 나일론, 유기 용매, 폴리우레탄 수지, 폴리에스테르 수지, 저혈당제, 부타다이엔 또는 부타다이엔-기재의 생산물인, 생산물.
  76. 제75항에 있어서,
    상기 생산물이 화장품 또는 식품 첨가제인, 생산물.
  77. 제75항 또는 제76항에 있어서,
    생물 유래의 3-HBal 및/또는 1,3-BDO, 또는 생물 유래의 4-HBal 및/또는 1,4-BDO를 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40% 또는 적어도 50%로 포함하는, 생산물.
  78. 제75항 내지 제77항 중 어느 한 항에 있어서,
    상기 생산물이 생산된 3-HBal 및/또는 1,3-BDO, 또는 생산된 4-HBal 및/또는 1,4-BDO 중 일부를 반복 단위로 포함하는, 생산물.
  79. 제75항, 제77항 또는 제78항 중 어느 한 항에 따른 생산물을 성형함으로써 수득되는 성형물 (molded product).
  80. 제75항 내지 제78항 중 어느 한 항에 따른 생산물의 제조 방법으로서,
    상기 생산물을 제조하는 반응으로 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 자체적으로 또는 다른 화합물과 화학적으로 반응시키는 것을 포함하는, 제조 방법.
  81. 제79항에 따른 성형물의 제조 방법으로서,
    상기 성형물을 제조하는 반응으로 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 자체적으로 또는 다른 화합물과 화학적으로 반응시키는 것을 포함하는, 제조 방법.
  82. 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드에 기질을 제공하고,
    상기 기질을 3-하이드록시부티르알데하이드 (3-HBal) 및/또는 1,3-부탄다이올 (1,3-BDO)로 변환하는 것을 포함하며,
    상기 기질이 1,3-하이드록시부티릴-CoA의 라세믹 혼합물인,
    3-HBal 및/또는 1,3-BDO, 또는 이들의 에스테르 또는 아미드의 제조 방법.
  83. 제82항에 있어서,
    상기 3-HBal 및/또는 1,3-BDO가 R 형태에 대해 거울상이성질체 측면에서 농화된, 방법.
  84. 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드에 기질을 제공하고,
    상기 기질을 4-하이드록시부티르알데하이드 (4-HBal) 및/또는 1,4-부탄다이올 (1,4-BDO)로 변환하는 것을 포함하며,
    상기 기질이 1,4-하이드록시부티릴-CoA인,
    4-HBal 및/또는 1,4-BDO, 또는 이들의 에스테르 또는 아미드의 제조 방법.
  85. 제82항 내지 제84항 중 어느 한 항에 있어서,
    상기 폴리펩타이드가 세포 내 또는 세포용해물 내에 존재하거나, 또는 세포 또는 세포용해물로부터 단리되는, 방법.
  86. 제33항 내지 제49항 중 어느 한 항에 따른 세포의 세포용해물을 인큐베이션하여, 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO를 제조하는 것을 포함하는,
    3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 제조 방법.
  87. 제86항에 있어서,
    상기 세포용해물을 제2 세포용해물과 혼합하고,
    상기 제2 세포용해물이 제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드의 기질 또는 3-HBal 및/또는 1,3-BDO, 또는 4-HBal 및/또는 1,4-BDO의 다운스트림 산물 (downstream product)을 생산하기 위한 효소 활성을 포함하는, 방법.
  88. 세포에서 폴리펩타이드를 발현시키는 것을 포함하는,
    제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드의 제조 방법.
  89. 제1항 내지 제7항 중 어느 한 항에 따른 핵산 또는 제4항 내지 제6항 중 어느 한 항에 따른 벡터를 시험관내에서 전사 및 번역하여 폴리펩타이드를 제조하는 것을 포함하는,
    제11항 내지 제32항 중 어느 한 항에 따른 폴리펩타이드의 제조 방법.
KR1020217012341A 2018-09-26 2019-09-25 알데하이드 데하이드로게나제 변이체 및 이의 이용 방법 KR20210068489A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862737053P 2018-09-26 2018-09-26
US62/737,053 2018-09-26
US201862740830P 2018-10-03 2018-10-03
US62/740,830 2018-10-03
PCT/US2019/052829 WO2020068900A1 (en) 2018-09-26 2019-09-25 Aldehyde dehydrogenase variants and methods of using same

Publications (1)

Publication Number Publication Date
KR20210068489A true KR20210068489A (ko) 2021-06-09

Family

ID=68165808

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217012341A KR20210068489A (ko) 2018-09-26 2019-09-25 알데하이드 데하이드로게나제 변이체 및 이의 이용 방법

Country Status (5)

Country Link
US (2) US11634692B2 (ko)
EP (1) EP3856896A1 (ko)
KR (1) KR20210068489A (ko)
CN (1) CN113179645A (ko)
WO (1) WO2020068900A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110791439B (zh) * 2019-10-10 2022-04-19 天津科技大学 一株基因工程构建发酵生产苹果酸的重组黑曲霉菌株及应用
WO2023069957A1 (en) * 2021-10-20 2023-04-27 Genomatica, Inc. Aldehyde dehydrogenase variants and methods of use
WO2023069952A1 (en) * 2021-10-20 2023-04-27 Genomatica, Inc. Aldehyde dehydrogenase variants and methods of use

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1147229A2 (en) 1999-02-02 2001-10-24 Bernhard O. Palsson Methods for identifying drug targets based on genomic sequence data
US7711490B2 (en) 2001-01-10 2010-05-04 The Penn State Research Foundation Method and system for modeling cellular metabolism
US7127379B2 (en) 2001-01-31 2006-10-24 The Regents Of The University Of California Method for the evolutionary design of biochemical reaction networks
US20030059792A1 (en) 2001-03-01 2003-03-27 Palsson Bernhard O. Models and methods for determining systemic properties of regulated reaction networks
US20030224363A1 (en) 2002-03-19 2003-12-04 Park Sung M. Compositions and methods for modeling bacillus subtilis metabolism
JP2005521929A (ja) 2002-03-29 2005-07-21 ジェノマティカ・インコーポレイテッド ヒト代謝モデルおよび方法
US7856317B2 (en) 2002-06-14 2010-12-21 Genomatica, Inc. Systems and methods for constructing genomic-based phenotypic models
EP1532516A4 (en) 2002-07-10 2007-05-23 Penn State Res Found METHOD FOR DETERMINING GENE KNOCKOUT STRATEGIES
JP4528624B2 (ja) * 2002-09-27 2010-08-18 ディーエスエム アイピー アセッツ ビー.ブイ. アルデヒドデヒドロゲナーゼ遺伝子
WO2004035009A2 (en) 2002-10-15 2004-04-29 The Regents Of The University Of California Methods and systems to identify operational reaction pathways
BRPI0808988A2 (pt) 2007-03-16 2011-11-08 Genomatica Inc micro-organismos e métodos para a produção de 1,4-butanodiol (1,4-bdo)
US7947483B2 (en) 2007-08-10 2011-05-24 Genomatica, Inc. Methods and organisms for the growth-coupled production of 1,4-butanediol
CN101978042B (zh) 2008-01-22 2017-03-08 基因组股份公司 利用合成气或其它气态碳源和甲醇的方法和有机体
CA2735883C (en) 2008-09-10 2020-05-05 Genomatica, Inc. Microorganisms for the production of 1,4-butanediol
KR102302146B1 (ko) 2009-04-30 2021-09-14 게노마티카 인코포레이티드 1,3-부탄다이올 생산 유기체
US20100305519A1 (en) 2009-06-02 2010-12-02 Becton, Dickinson And Company Cannula having an overlapping cannula feature and notch feature
US8129169B2 (en) 2009-06-04 2012-03-06 Genomatica, Inc. Microorganisms for the production of 1,4-butanediol and related methods
CN105441374A (zh) 2009-10-13 2016-03-30 基因组股份公司 生产1,4-丁二醇、4-羟基丁醛、4-羟基丁酰-coa、腐胺和相关化合物的微生物及其相关方法
WO2012018624A2 (en) 2010-07-26 2012-02-09 Genomatica, Inc. Microorganisms and methods for the biosynthesis of aromatics, 2,4-pentadienoate and 1,3-butadiene
AU2012273177A1 (en) * 2011-06-22 2013-05-02 Genomatica, Inc. Microorganisms for producing 1,3-butanediol and methods related thereto
CN103917651A (zh) 2011-09-08 2014-07-09 基因组股份公司 用于生产1,3-丁二醇的真核生物和方法
GB201206192D0 (en) 2012-04-05 2012-05-23 Tdeltas Ltd Ketone bodies and ketone body esters and for maintaining or improving muscle power output
EP2855687B1 (en) 2012-06-04 2020-04-22 Genomatica, Inc. Microorganisms and methods for production of 4-hydroxybutyrate, 1,4-butanediol and related compounds
US20140371417A1 (en) 2013-04-26 2014-12-18 Genomatica, Inc. Microorganisms and methods for production of 4-hydroxybutyrate, 1,4-butanediol and related compounds
WO2014190251A1 (en) 2013-05-24 2014-11-27 Genomatica, Inc. Microorganisms and methods for producing (3r)-hydroxybutyl (3r)-hydroxybutyrate
US20160138049A1 (en) * 2013-06-10 2016-05-19 The Regents Of The University Of California OXYGEN-TOLERANT CoA-ACETYLATING ALDEHYDE DEHYDROGENASE CONTAINING PATHWAY FOR BIOFUEL PRODUCTION
JP2020515255A (ja) * 2017-03-31 2020-05-28 ジェノマティカ, インコーポレイテッド アルデヒドデヒドロゲナーゼバリアントおよび使用の方法

Also Published As

Publication number Publication date
CN113179645A (zh) 2021-07-27
US20230416698A1 (en) 2023-12-28
EP3856896A1 (en) 2021-08-04
WO2020068900A1 (en) 2020-04-02
US11634692B2 (en) 2023-04-25
US20210348134A1 (en) 2021-11-11

Similar Documents

Publication Publication Date Title
KR102645531B1 (ko) 알데하이드 데하이드로게나제 변이체 및 사용 방법
US9657316B2 (en) Microorganisms and methods for enhancing the availability of reducing equivalents in the presence of methanol, and for producing 1,4-butanediol related thereto
US20230416698A1 (en) Aldehyde dehydrogenase variants and methods of using same
US20230139515A1 (en) 3-hydroxybutyryl-coa dehydrogenase variants and methods of use
US20220403420A1 (en) Microorganisms and methods for increasing co-factors
US20190085303A1 (en) Methanol dehydrogenase fusion proteins
KR20230003072A (ko) 조작된 효소 및 이의 이용 및 제조 방법
WO2023069952A1 (en) Aldehyde dehydrogenase variants and methods of use
WO2023069957A1 (en) Aldehyde dehydrogenase variants and methods of use
US20230287435A1 (en) Microorganisms and methods for reducing by-products
WO2022217064A2 (en) Phosphoketolase variants and methods of use
WO2023034745A2 (en) Formate dehydrogenase variants and methods of use

Legal Events

Date Code Title Description
A201 Request for examination