KR20220023339A

KR20220023339A - 조작된 트랜스아미나아제 및 제조 및 사용 방법

Info

Publication number: KR20220023339A
Application number: KR1020217038307A
Authority: KR
Inventors: 아미트 엠 샤; 해리시 나가라잔; 조셉 알 워너; 러셀 에스 코모어
Original assignee: 게노마티카 인코포레이티드
Priority date: 2019-04-24
Filing date: 2020-04-24
Publication date: 2022-03-02
Also published as: EP3959327A1; US20220333142A1; CA3137571A1; CN114341344A; KR20220023757A; WO2020219863A1; JP2022530475A; EP3959310A1; CN114269908A; EP3959309A1; WO2020219866A1; US20220348890A1; SG11202111575WA; BR112021021294A2; US20220235385A1; WO2020219859A1; AU2020262938A1

Abstract

트랜스아미나아제(TA) 효소 및 이를 인코딩하는 핵산이 개시되어 있다. 일부 경우에, 트랜스아미나아제 효소는 비천연의 조작된 트랜스아미나아제이다. 또한, 6-아미노카프로에이트, 헥사메틸렌디아민, 카프로산, 카프로락톤, 또는 카프로락탐의 생합성을 향상시키거나 개선시키는 생합성 방법 및 조작된 미생물이 개시된다. 조작된 미생물은 외인성 TA 및 일부 경우에, 조작된 TA를 포함한다.

Description

조작된 트랜스아미나아제 및 제조 및 사용 방법

관련 출원에 대한 상호 참조문헌

본 출원은 2019년 4월 24일에 출원된 미국 가출원 제62/837,888호; 2019년 6월 11일에 출원된 제62/860,123호; 및 2019년 6월 11일에 출원된 제62/860,160호의 이익을 청구하며, 이들 문헌의 개시내용은 전문이 본원에 참고로 포함된다.

서열목록의 통합

본 출원은 2020년 4월 24일에 생성되었고 크기가 154 킬로바이트인, 파일명이 "GNO00100WO Sequence Listing.txt"인 서열목록을 포함한다. 서열목록은 본원에 참고로 포함된다.

나일론은 디아민과 디카복실산의 축중합 또는 락탐의 축중합에 의해 합성될 수 있는 폴리아미드이다. 나일론 6,6은 헥사메틸렌디아민(HMD) 및 아디프산의 반응에 의해 생성되며, 나일론 6은 카프로락탐의 개환 중합에 의해 생성된다. 이에 따라, 아디프산, 헥사메틸렌디아민, 및 카프로락탐은 나일론 생산에서 중요한 중간체이다.

미생물은 나일론 중간체 중 일부를 생산하도록 조작되었다. 그러나, 조작된 미생물은 경로 중간체 및 최종 산물에 대한 원하지 않는 효소 활성의 결과로서 원하지 않는 부산물을 제조할 수 있다. 이에 따라, 이러한 부산물 및 불순물은 화합물을 생합성하는 비용 및 복잡성을 증가시키고, 원하는 산물의 효율 또는 수율을 감소시킬 수 있다.

본원에는 아디페이트 세미알데하이드와 반응하여 6-아미노카프로산(6ACA)을 형성하는 비천연, 조작된 트랜스아미나아제(TA) 효소가 제공된다. TA 효소는 아미노산 서열번호 1, 13 또는 31에 의해 인코딩된다. 서열번호 1, 13, 또는 31의 트랜스아미나아제는 야생형 서열번호 1, 13 또는 31과 비교하여 아디페이트 세미알데하이드에 대한 더 양호한 활성 또는 특이성을 갖도록 조작된다.

또한, 6-아미노카프로산 경로, 카프로락탐 경로, 헥사메틸렌디아민 경로, 카프로락톤 경로, 1,6-헥산디올 경로, 또는 이러한 경로 중 하나 이상의 조합을 갖는 비천연 미생물 유기체가 제공된다. 비천연 미생물 유기체는 아디페이트 세미알데하이드와 반응하여 6-아미노카프로산(6ACA)을 형성하는 트랜스아미나아제 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함한다. 트랜스아미나아제 효소는 숙시네이트 세미알데하이드와 관련하여 아디페이트 세미알데하이드 기질에 대한 전환 수, 촉매 효율, 또는 이들의 조합을 갖는다.

비천연 미생물 유기체는 개개 생성물을 제조하기에 충분한 양으로 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민을 제조하는 데 필요한 효소를 인코딩하는 추가 외인성 핵산을 추가로 포함할 수 있다. 일부 경우에, 이러한 외인성 핵산 중 하나 이상은 미생물 유기체에 대해 이종일 수 있다.

또한, 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민을 제조하는 방법이 개시된다. 방법은 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 및/또는 헥사메틸렌디아민을 배양하여 비천연 미생물 유기체를 제조하는 것을 포함할 수 있으며, 여기서, 미생물 유기체는 아디페이트 세미알데하이드 기질과 반응하여 6-아미노카프로산(6ACA)을 형성하는 트랜스아미나아제 효소를 인코딩하는 적어도 하나의 외인성 핵산을 발현시킨다. 방법은 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민을 제조하기 위해 충분한 기간 동안 및 조건하에서 비천연 미생물 유기체를 배양하는 것을 포함한다.

하나의 구현예에서, 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 적어도 25개 이상의 인접 아미노산과 적어도 40% 서열 동일성을 갖는 아미노산 서열을 포함하는 TA가 있다.

하나의 양태에서, 서열번호 1, 서열번호 13, 또는 서열번호 31의 하나 이상의 아미노산 변경을 포함하는 조작된 TA 효소가 있다.

하나의 구현예에서, 서열번호 1, 서열번호 13 또는 서열번호 31의 하나 이상의 아미노산 잔기 위치에서 하나 이상의 아미노산 변경 또는 서열번호 1, 서열번호 13 또는 서열번호 31의 아미노산 변경 및 잔기 위치의 조합을 포함하는 조작된 TA 효소가 있다.

일부 구현예에서, TA 효소는 서열번호 1, 13, 또는 31의 적어도 2, 3, 4, 5, 6, 7, 8개 또는 그 이상의 아미노산 위치에서 변경을 포함한다. 일부 구현예에서, 아미노산 변경은 아미노산 치환이다. 일부 구현예에서, 아미노산 치환은 보존적 치환이다. 일부 구현예에서, 아미노산 치환은 비보존적 치환이다. 일부 구현예에서, 조작된 TA는 아미노산 변경을 가지지 않는 서열번호 1, 13, 또는 31의 트랜스아미나아제의 활성보다 적어도 20% 더 높은 트랜스아미나아제 활성을 포함한다.

하나의 구현예에서, 조작된 TA는 서열번호 1의 아미노산 변경 및 잔기 위치에 대해 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392, 및 이들의 조합에 해당하는 위치로부터 선택된 하나 이상의 아미노산에 대한 하나 이상의 아미노산 변경을 갖는다. 일부 구현예에서, 아미노산 치환은 보존적 치환이다. 일부 구현예에서, 아미노산 치환은 비보존적 치환이다. 일부 구현예에서, 조작된 TA는 아미노산 변경을 가지지 않는 서열번호 1의 트랜스아미나아제의 활성보다 적어도 20% 더 높은 트랜스아미나아제 활성을 포함한다. 일부 구현예에서, 서열번호 1 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392 또는 아미노산 변경의 조합의 잔기에 해당하는 위치로부터 선택된 아미노산이 대체될 수 있다. 아미노산 변경은 20개의 다른 아미노산 중 19개로 대체될 수 있다. 하나의 구현예에서, 선택된 TA 및 조작된 TA는

a) 아디페이트 세미알데하이드 기질로부터 6-아미노카프로산을 형성하거나;

b) 야생형 트랜스아미나아제와 비교하여 더 높은 비율로 아디페이트 세미알데하이드 기질로부터 6-아미노카프로산을 형성하거나;

c) 야생형 트랜스아미나아제와 비교하여 아디페이트 세미알데하이드 기질에 대한 더 높은 친화력을 갖거나;

d) a), b), 및 c)의 임의의 조합을 가능하게 할 수 있다.

하나의 구현예에서, 적어도 하나의 외인성 효소를 포함하는 비천연 미생물 유기체가 있으며, 적어도 하나의 외인성 효소는 아디페이트 세미알데하이드 기질로부터의 TA 전환 6-아미노카프로산을 포함하며, TA는

(i) 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 적어도 25개 이상의 인접 아미노산과 적어도 50% 서열 동일성을 갖는 아미노산 서열을 포함하는 트랜스아미나아제; 또는

(ii) 서열번호 1, 13, 또는 31의 조작된 TA로부터 선택된다.

일부 구현예에서, 비천연 미생물 유기체는 조작된 TA가 유래된 야생형 TA를 발현시키는 대조 세포보다 적어도 10% 이상 6ACA를 제조할 수 있는 3-옥소아디필-CoA 티올라아제, 3-옥소아디필-CoA 데하이드로게나아제, 및 3-옥소아디필-CoA 데하이드라타아제를 인코딩하는 유전자를 포함한다.

일부 구현예에서, 비천연 미생물 유기체는 6-아미노카프로산 경로, 헥사메틸렌디아민 경로, 카프로락톤 경로, 또는 카프로락탐 경로를 위해 필요한 효소를 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 카프로산 경로, 헥사메틸렌디아민 경로, 카프로락톤 경로, 또는 카프로락탐 경로를 위해 필요한 효소를 인코딩하는 외인성 핵산을 포함한다. 일부 구현예에서, 외인성 핵산은 미생물 유기체에 대해 이종이다.

하나의 구현예에서, 아디필 CoA를 제조하기 위한 충분한 기간 및 조건으로 상기 양태 및 구현예 중 어느 하나의 비천연 발생 미생물을 배양하는 것을 포함하는 아디필 CoA를 제조하는 방법이 제공된다.

하나의 구현예에서, 6ACA를 제조하기 위한 충분한 기간 및 조건으로 상기 양태 및 구현예 중 어느 하나의 비천연 미생물 유기체를 배양하는 것을 포함하는 6-아미노카프로산(6ACA)을 제조하는 방법이 제공된다. 일부 구현예에서, 방법은 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 6ACA를 회수하는 것을 추가로 포함한다.

하나의 구현예에서, 헥사메틸렌디아민을 제조하기 위한 충분한 기간 및 조건으로 상기 양태 및 구현예 중 어느 하나의 비천연 미생물 유기체를 배양하는 것을 포함하는 헥사메틸렌디아민을 제조하는 방법이 제공한다. 일부 구현예에서, 방법은 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 헥사메틸렌디아민을 회수하는 것을 추가로 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 2, 3, 4, 5, 6, 7개 또는 그 이상의 외인성 핵산 서열을 포함하며, 각각은 헥사메틸렌디아민 경로 효소를 인코딩한다.

하나의 구현예에서, 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 및 헥사메틸렌디아민을 제조하기 위한 충분한 기간 및 조건으로 상기 양태 및 구현예 중 어느 하나의 비천연 미생물 유기체를 배양하는 것을 포함하는 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민을 제조하는 방법이 제공된다. 일부 구현예에서, 방법은 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 카프로락탐을 회수하는 것을 추가로 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 2, 3, 4, 5, 6 또는 7개의 외인성 핵산 서열을 포함하며, 각각은 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민 경로 효소를 인코딩한다.

하나의 구현예에서, 상기 개시된 방법을 이용하여 합성된 생체 유래 6-아미노카프로산, 헥사메틸렌디아민, 또는 카프로락탐이 제공된다.

일부 구현예에서, 비천연 미생물 유기체의 TA 효소는 숙시네이트 세미알데하이드와 유사한 아디페이트 세미알데하이드 기질에 대한 촉매 효율을 갖는다. 일부 구현예에서, 비천연 미생물 유기체의 TA 효소는 6-아미노카프로일-CoA와 추가로 반응하여 6-아미노카프로에이트 세미알데하이드를 형성한다.

일부 구현예에서, TA 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 비천연 미생물 유기체는, 대조군 미생물 유기체가 TA 효소를 인코딩하는 외인성 핵산을 포함하지 않는 것을 제외하고, 비천연 미생물 유기체와 실질적으로 동일한 대조군 미생물 유기체보다 더 많은 아디페이트 세미알데하이드를 a6-아미노카프로산으로 전환시킨다.

TA 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 비천연 미생물 유기체는, 야생형 미생물 유기체가 조작된 TER 효소를 인코딩하는 외인성 핵산을 포함하지 않는 것을 제외하고 비천연 미생물 유기체와 실질적으로 동일한 이의 야생형 미생물 유기체보다 더 많이 아디페이트 세미알데하이드를 6-아미노카프로산으로 전환시킨다.

일부 구현예에서, 아디페이트 세미알데하이드와 반응하여 6-아미노카프로산을 형성하는 TA 효소를 인코딩하는 적어도 하나의 외인성 핵산은 미생물 유기체에 대해 이종이다.

일부 구현예에서, 비천연 미생물 유기체는 6-아미노카프로산 경로를 포함한다. 일부 구현예에서, 6-아미노카프로산 경로는 (i) 트랜스아미나아제, (ii) 6-아미노카프로에이트 데하이드로게나아제, 또는 (iii) 트랜스아미나아제 및 6-아미노카프로에이트 데하이드로게나아제 효소 둘 모두를 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 6-아미노카프로산 경로 효소 중 하나 이상을 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함한다. 일부 구현예에서, 6-아미노카프로산 경로 효소 중 하나 이상을 인코딩하는 외인성 핵산은 미생물 유기체에 대해 이종이다.

일부 구현예에서, 비천연 미생물 유기체는 헥사메틸렌디아민 경로를 포함한다. 일부 구현예에서, 헥사메틸렌디아민 경로는 (i) 6-아미노아카프로일 CoA 트랜스퍼라아제, (ii) 6-아미노카프로일 CoA 신타아제, (iii) 6-아미노카프로일 CoA 리덕타아제, (iv) 헥사메틸렌디아민 트랜스아미나아제, (v) 헥사메틸렌디아민 데하이드로게나아제, 또는 (v) 효소 (i) 내지 (v) 중 하나 이상의 조합을 포함한다. 일부 구현예에서, 미생물 유기체는 헥사메틸렌디아민 경로 효소 중 하나 이상을 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함한다. 일부 구현예에서, 헥사메틸렌디아민 경로 효소 중 하나 이상을 인코딩하는 외인성 핵산은 미생물 유기체에 대해 이종이다.

일부 구현예에서, 비천연 미생물 유기체는 카프로락탐 경로를 포함한다. 일부 구현예에서, 카프로락탐 경로는 아미노하이드롤라아제 효소를 포함한다. 일부 구현예에서, 미생물 유기체는 아미노하이드롤라아제 효소를 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함한다. 일부 구현예에서, 아미노하이드롤라아제 효소를 인코딩하는 외인성 핵산은 미생물 유기체에 대해 이종이다.

일부 구현예에서, 비천연 미생물 유기체는 1,6-헥산디올 경로를 포함한다. 일부 구현예에서, 1,6-헥산디올 경로는 하기 효소를 포함한다: 6ACA에서 6-아미노카프로일-CoA로의 6-아미노카프로일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환; 6-아미노카프로일-CoA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로일-CoA 리덕타아제 촉매 전환; 6-아미노카프로에이트 세미알데하이드에서 6-아미노헥산올로의 6-아미노카프로에이트 세미알데하이드 리덕타아제 촉매 전환; 6ACA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로에이트 리덕타아제 촉매 전환; 아디페이트 세미알데하이드로의 아디필-CoA 리덕타아제 아디필-CoA; 아디페이트 세미알데하이드에서 6-하이드록시헥사노에이트로의 아디페이트 세미알데하이드 리덕타아제 촉매 전환; 6-하이드록시헥사노에이트에서 6-하이드록시헥사노일-CoA로의 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환; 6-하이드록시헥사노일-CoA에서 6-하이드록시헥사날로의 6-하이드록시헥사노일-CoA 리덕타아제 촉매 전환; 6-하이드록시헥사날에서 HDO로의 6-하이드록시헥사날 리덕타아제 촉매 전환; 6-아미노헥산올에서 6-하이드록시헥사날로의 6-아미노헥산올 아미노트랜스퍼라아제 또는 옥시도리덕타아제 촉매 전환; 6-하이드록시헥사노에이트에서 6-하이드록시헥사날로의 6-하이드록시헥사노에이트 리덕타아제 촉매 전환; ADA에서 아디페이트 세미알데하이드로의 아디페이트 리덕타아제 촉매 전환; 및 아디필-CoA에서 ADA로의 아디필-CoA 트랜스퍼라아제, 하이드롤라아제 또는 신타아제 촉매 전환.

일부 구현예에서, 비천연 미생물 유기체는 아디페이트 또는 아디필-CoA에서 카프로락톤으로의 경로를 포함한다. 일부 구현예에서, 아디페이트 또는 아디필-CoA에서 카프로락톤으로의 경로는 하기 효소를 포함한다: 아디필-CoA 리덕타아제, 아디페이트 세미알데하이드 리덕타아제, 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제, 6-하이드록시헥사노일-CoA 시클라아제 또는 자발적 고리화, 아디페이트 리덕타아제, 아디필-CoA 트랜스퍼라아제, 신타아제 또는 하이드롤라아제, 6-하이드록시헥사노에이트 시클라아제, 6-하이드록시헥사노에이트 키나아제, 6-하이드록시헥사노일 포스페이트 시클라아제 또는 자발적 고리화, 포스포트랜스-6-하이드록시헥사노일라아제.

일부 구현예에서, 비천연 미생물 유기체의 TA는 원핵생물 종으로부터 유래된 것이다. 일부 구현예에서, TA 효소는 아르트로박터(Arthrobacter), 파에나트로박터(Paenarthrobacter), 사카로마이세스(Saccharomyces), 클로스트리듐(Clostridium), 굴로시박터(Gulosibacter), 코쿠리아(Kocuria), 슈도모나스(Pseudomonas), 및 알칼리게네스(Alcaligenes)로부터 유래된 것이다.

일부 구현예에서, 비천연 미생물 유기체는 아시네토박터(Acinetobacter), 악티노바실러스(Actinobacillus), 아나에로바이오스필리룸(Anaerobiospirillum), 아스페르길루스(Aspergillus), 바실루스(Bacillus), 클로스트리듐(Clostridium), 코리네박테리움(Corynebacterium), 에셔리키아(Escherichia), 글루코노박터(Gluconobacter), 클렙시엘라(Klebsiella), 클루베로마이세스(Kluyveromyces), 락토코쿠스(Lactococcus), 락토바실루스(Lactobacillus), 만헤이미아(Mannheimia), 피키아(Pichia), 슈도모나스(Pseudomonas), 리조비움(Rhizobium), 리조푸스(Rhizopus), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 스트렙토마이세스(Streptomyces) 및 자이모모나스(Zymomonas)의 종을 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 에셔리키아. 콜라이의 균주이다.

일부 구현예에서, 배양은 당을 포함하는 발효 브로쓰에서 수행된다.

도 1은 숙시닐-CoA 및 아세틸-CoA로부터 6-아미노카프로에이트, 헥사메틸렌디아민(HMDA), 및 카프로락탐으로의 대표적인 경로를 도시한 것이다. 효소는 하기와 같이 지정된다: A) 3-옥소아디필-CoA 티올라아제, B) 3-옥소아디필-CoA 리덕타아제, C) 3-하이드록시아디필-CoA 데하이드라타아제, D) 5-카복시-2-펜테노일-CoA 리덕타아제, E) 3-옥소아디필-CoA/아실-CoA 트랜스퍼라아제, F) 3-옥소아디필-CoA 신타아제, G) 3-옥소아디필-CoA 하이드롤라아제, H) 3-옥소아디페이트 리덕타아제, I) 3-하이드록시아디페이트 데하이드라타아제, J) 5-카복시-2-펜테노에이트 리덕타아제, K) 아디필-CoA/아실-CoA 트랜스퍼라아제, L) 아디필-CoA 신타아제, M) 아디필-CoA 하이드롤라아제, N) 아디필-CoA 리덕타아제(알데하이드 형성), O) 6-아미노카프로에이트 트랜스아미나아제, P) 6-아미노카프로에이트 데하이드로게나아제, Q) 6-아미노카프로일-CoA/아실-CoA 트랜스퍼라아제, R) 6-아미노카프로일-CoA 신타아제, S) 아미도하이드롤라아제, T) 자발적 고리화, U) 6-아미노카프로일-CoA 리덕타아제(알데하이드 형성), V) HMDA 트랜스아미나아제, W) HMDA 데하이드로게나아제, X) 아디페이트 리덕타아제, Y) 아디페이트 키나아제, Z) 아디필포스페이트 리덕타아제.
도 2는 서열번호 1에서 돌연변이된 아미노산 위치의 그래프 도식이다.
도 3은 야생형 서열번호 1 대조군(서열번호 1)에 대한 변이체의 활성의 그래프 도식이다.
도 4는 출발점으로서 라이신을 사용한 6-아미노카프로산 및 아디페이트의 합성에 대한 대표적인 경로를 도시한 것이다.
도 5는 출발점으로서 아디필-CoA를 사용한 대표적인 카프로락탐 합성 경로를 도시한 것이다.
도 6은 피루베이트 및 숙신 세미알데하이드로부터 6-아미노카프로에이트로의 대표적인 경로를 도시한 것이다. 효소는 A) HODH 알돌라아제, B) OHED 하이드라타아제, C) OHED 리덕타아제, D) 2-OHD 데카복실라아제, E) 아디페이트 세미알데하이드 아미노트랜스퍼라아제 및/또는 아디페이트 세미알데하이드 옥시도리덕타아제(아민화), F) OHED 데카복실라아제, G) 6-OHE 리덕타아제, H) 2-OHD 아미노트랜스퍼라아제 및/또는 2-OHD 옥시도리덕타아제(아민화), I) 2-AHD 데카복실라아제, J) OHED 아미노트랜스퍼라아제 및/또는 OHED 옥시도리덕타아제(아민화), K) 2-AHE 리덕타아제, L) HODH 포르메이트-리아제 및/또는 HODH 데하이드로게나아제, M) 3-하이드록시아디필-CoA 데하이드라타아제, N) 2,3-데하이드로아디필-CoA 리덕타아제, O) 아디필-CoA 데하이드로게나아제, P) OHED 포르메이트-리아제 및/또는 OHED 데하이드로게나아제, Q) 2-OHD 포르메이트-리아제 및/또는 2-OHD 데하이드로게나아제이다. 약어는 하기와 같다: HODH = 4-하이드록시-2-옥소헵탄-1,7-디오에이트, OHED = 2-옥소헵트-4-엔-1,7-디오에이트, 2-OHD = 2-옥소헵탄-1,7-디오에이트, 2-AHE = 2-아미노헵트-4-엔-1,7-디오에이트, 2-AHD = 2-아미노헵탄-1,7-디오에이트, 및 6-OHE = 6-옥소헥스-4-에노에이트.
도 7은 6-아미노카프로페이트로부터 헥사메틸렌디아민으로의 대표적인 경로를 도시한 것이다. 효소는 A) 6-아미노카프로에이트 키나아제, B) 6-AHOP 옥시도리덕타아제, C) 6-아미노카프로 세미알데하이드 아미노트랜스퍼라아제 및/또는 6-아미노카프로 세미알데하이드 옥시도리덕타아제(아민화), D) 6-아미노카프로에이트 N-아세틸트랜스퍼라아제, E) 6-아세트아미도헥사노에이트 키나아제, F) 6-AAHOP 옥시도리덕타아제, G) 6-아세트아미도헥사날 아미노트랜스퍼라아제 및/또는 6-아세트아미도헥사날 옥시도리덕타아제(아민화), H) 6-아세트아미도헥산아민 N-아세틸트랜스퍼라아제 및/또는 6-아세트아미도헥산아민 하이드롤라아제(아미드), I) 6-아세트아미도헥사노에이트 CoA 트랜스퍼라아제 및/또는 6-아세트아미도헥사노에이트 CoA 리가아제, J) 6-아세트아미도헥사노일-CoA 옥시도리덕타아제, K) 6-AAHOP 아실트랜스퍼라아제, L) 6-AHOP 아실트랜스퍼라아제, M) 6-아미노카프로에이트 CoA 트랜스퍼라아제 및/또는 6-아미노카프로에이트 CoA 리가아제, N) 6-아미노카프로일-CoA 옥시도리덕타아제이다. 약어는 하기와 같다: 6-AAHOP = [(6-아세트아미도헥사노일)옥시]포스포네이트 및 6-AHOP = [(6-아미노헥사노일)옥시]포스포네이트.
도 8은 1,6-헥산디올에 이르는 대표적인 생합성 경로를 도시한 것이다. A)는 6ACA에서 6-아미노카프로일-CoA로의 6-아미노카프로일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환이며; B)는 6-아미노카프로일-CoA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로일-CoA 리덕타아제 촉매 전환이며; C)는 6-아미노카프로에이트 세미알데하이드에서 6-아미노헥산올로의 6-아미노카프로에이트 세미알데하이드 리덕타아제 촉매 전환이며; D)는 6ACA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로에이트 리덕타아제 촉매 전환이며; E)는 아디필-CoA에서 아디페이트 세미알데하이드로의 아디필-CoA 리덕타아제 촉매 전환이며; F)는 아디페이트 세미알데하이드에서 6-하이드록시헥사노에이트로의 아디페이트 세미알데하이드 리덕타아제 촉매 전환이며; G)는 6-하이드록시헥사노에이트에서 6-하이드록시헥사노일-CoA로의 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환이며; H)는 6-하이드록시헥사노일-CoA에서 6-하이드록시헥사날로의 6-하이드록시헥사노일-CoA 리덕타아제 촉매 전환이며; I)는 6-하이드록시헥사날에서 HDO로의 6-하이드록시헥사날 리덕타아제 촉매 전환이며; J)는 6-아미노헥산올에서 6-하이드록시헥사날로의 6-아미노헥산올 아미노트랜스퍼라아제 또는 옥시도리덕타아제 촉매 전환이며; K)는 6-하이드록시헥사노에이트에서 6-하이드록시헥사날로의 6-하이드록시헥사노에이트 리덕타아제 촉매 전환이며; L)은 ADA에서 아디페이트 세미알데하이드로의 아디페이트 리덕타아제 촉매 전환이며; M)은 아디필-CoA에서 ADA로의 아디필-CoA 트랜스퍼라아제, 하이드롤라아제 또는 신타아제 촉매 전환이다.
도 9는 아디페이트 또는 아디필-CoA로부터 카프로락톤으로의 대표적인 경로를 도시한 것이다. 효소는 A. 아디필-CoA 리덕타아제, B. 아디페이트 세미알데하이드 리덕타아제, C. 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제, D. 6-하이드록시헥사노일-CoA 시클라아제 또는 자발적 고리화, E. 아디페이트 리덕타아제, F. 아디필-CoA 트랜스퍼라아제, 신타아제 또는 하이드롤라아제, G. 6-하이드록시헥사노에이트 시클라아제, H. 6-하이드록시헥사노에이트 키나아제, I. 6-하이드록시헥사노일 포스페이트 시클라아제 또는 자발적 고리화, J. 포스포트랜스-6-하이드록시헥사노일라아제이다.

달리 정의하지 않는 한, 본원에서 사용되는 모든 기술 용어 및 과학 용어는 본 발명의 구체예가 속하는 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기술된 것과 유사하거나 동일한 임의의 방법, 디바이스 및 물질은 본 발명의 구현예의 실무에서 사용될 수 있다. 하기 정의는 본원에서 자주 사용되는 특정 용어의 이해를 용이하게 하기 위해 제공되고, 본 개시의 범위를 제한하는 것을 의미하지 않는다. 본원에서 언급되는 모든 문헌(예를 들어, 특허 출원 또는 특허)은 전문이 참고로 포함된다.

아미노 도너 기질의 1차 아민에서 아미노 수용체 분자의 카보닐 기로 아미노 기, 한 쌍의 전자, 및 양성자의 전달을 촉매화하는 트랜스아미나아제(E.C. 2.6.1)로도 알려진 아미노트랜스페라아제가 기술되어 있다. 트랜스아미나아제의 원하는 반응은 글루타메이트 또는 알라닌의 아미노 기를 아디페이트 세미알데하이드로 전달하여 6-아미노카프로산(6ACA)을 형성하는 것으로서, 이는 하기에 나타나 있다:

아디페이트 세미알데하이드 + 글루타메이트 → 6ACA + 알파-케토글루타르산

그러나, 트랜스아미나아제는 또한, 하기에 나타낸 바와 같이 숙시네이트 세미알데하이드 또는 피루베이트에 대한 특이성을 갖는다:

숙시네이트 세미알데하이드 + 글루타메이트 → 감마-아미노부티르산 + 알파-케토글루타르산

피루베이트 + 글루타메이트 → 알라닌 + 알파-케토글루타르산

알라닌은 아민 도너로서 글루타메이트를 대체할 수 있다.

6-아미노카프로산을 형성하기 위해 아디페이트 세미알데하이드 기질 상에서 활성인 것으로 식별된 트랜스아미나아제(TA) 효소가 기술되어 있다. 이러한 효소는 나일론 중간체에 이르는 다양한 경로에서 사용될 수 있다.

원하는 트랜스아미나아제는 6ACA를 제조하기 위한 경로에서 원하는 반응을 수행할 수 있는 효소에 대한 상동성 검색뿐만 아니라 메타게놈 발견에 의해 식별되었다. 아디페이트 세미알데하이드 사용을 위해 트랜스아미나아제를 평가하기 위해, 일부 구현예에서, 검정은, 아디페이트 세미알데하이드가 상업적으로 입수 가능하지 않기 때문에, 6ACA와 역으로 수행된다.

일부 구현예에서, 서열번호 1에 의해 인코딩된 아크로모박터 크실로스옥시단스가 식별되었다. 다른 TA 효소를 식별하기 위해, 서열번호 1이 사용되었다. 동종 효소는 표 4에 기술된 바와 같이 식별되었다. 일부 구현예에서, 트랜스아미나아제 효소 또는 서열은 BLAST에 의해 식별된다. 일부 구현예에서, 트랜스아미나아제는 표 4의 트랜스아미나아제의 아미노산 서열의 적어도 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 공유한다.

일부 구현예에서, 표 4에서 식별된 트랜스아미나아제는 서열번호 1, 13 또는 31의 트랜스아미나아제의 아미노산 서열의 적어도 25, 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 공유한다.

일부 구현예에서, 트랜스아미나아제 효소는 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 적어도 25, 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 50% 아미노산 서열 일치성을 갖는다. 일부 구현예에서, 아디페이트 세미알데하이드와 반응하여 6ACA를 형성하는 트랜스아미나아제 효소의 아미노산 서열은 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116의 아미노산 서열로부터 선택된다.

일부 구현예에서, TA 효소는 숙시네이트 세미알데하이드가 기질일 때와 유사한 기질로서 아디페이트 세미알데하이드에 대한 촉매 효율, 및/또는 전환 수를 갖는다. 일부 구현예에서, 효소는 숙시네이트 세미알데하이드가 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116의 트랜스아미나아제의 아미노산 서열의 적어도 25, 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 공유할 때와 유사한 기질로서 아디페이트 세미알데하이드에 대한 촉매 효율, 및/또는 전환 수를 갖는다.

본원에서 사용되는 용어 전환 수(k_cat로도 언급됨)는 단일 촉매 부위가 제공된 효소 농도[ET]에 대해 실행할 초당 기질 분자의 화학적 전환의 최대 수로서 정의된다. 이는 하기와 같이 최대 반응 속도 Vmax 및 촉매 부위 농도[E_T]로부터 계산될 수 있다:

Kcat = Vmax/[E_T]. 단위는 s^-1이다.

본원에서 사용되는 용어 "촉매 효율"은 효소가 얼마나 효율적으로 기질을 산물로 전환시키는 지에 대한 척도이다. 촉매 효율의 비교는 또한, 상이한 기질에 대한 효소의 선호도(즉, 기질 특이성)의 척도로서 사용될 수 있다. 촉매 효율이 높을수록, 효소가 그러한 기질을 더욱 "선호"하는 것이다. 이는 수학식, k_cat/K_M으로부터 계산될 수 있으며, 여기서, k_cat는 전환 수이며, K_M은 마이켈리스 상수(Michaelis constant)이며, K_M은 반응 속도가 Vmax의 절반인 기질 농도이다. 촉매 효율의 단위는 s^-1M^-1로서 표현될 수 있다.

식별된 트랜스아미나아제 효소는 매우 유전적으로 다양한 유기체로부터 유래된 것이다. 하기에는 표 1에 나타낸 바와 같이 일부 예시적인 트랜스아미나아제의 쌍별 서열 정렬이 나타나 있다.

트랜스아미나아제 효소는 보존된 도메인을 갖는다. 다중 서열 정렬 및 은닉 마르코프 모델(HMM: hidden Markov model)을 기초로 하여, 트랜스아미나아제 효소는 유럽 생물정보학 연구소의 Pfam 데이터베이스(pfam.xfam.org)의 Pfam PF00202로 그룹화된다.

일부 구현예에서, 아미노산 위치는 단백질의 결정 구조의 시험에 의해 서열번호 1에서의 돌연변이에 대해 식별되었으며, 서열번호 1을 인코딩하는 유전자는 선택된 아미노산 위치에서 포화 돌연변이 유발되었다. 야생형 (변형되지 않은) 서열번호 1보다 더 양호한 활성을 갖는 변이체 아미노산을 제공하기 위해 변경될 수 있는 촉매-관련 잔기가 식별되었다.

일부 구현예에서, 트랜스아미나아제 효소는 이의 상응하는 야생형보다 아디페이트 세미알데하이드 기질에 대해 더 큰 특이성을 갖도록 조작된다.

본원에서 사용되는 "조작된" 또는 "변이체"는 폴리펩타이드 또는 핵산의 맥락에서 사용될 때, 변형되지 않은, 야생형 서열과 비교하여 아미노산 위치 또는 핵산 위치에 적어도 하나의 변이 또는 변경을 갖는 서열을 지칭한다.

일부 구현예에서, 조작된 트랜스아미나아제는 서열번호 1, 서열번호 13, 또는 서열번호 31의 아미노산의 하나 이상의 변경을 갖는다. 일부 구현예에서, 조작된 트랜스아미나아제는 서열번호 1 서열번호 13, 서열번호 31에 대해 아미노산의 적어도 1, 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 또는 적어도 8개의 변경을 갖는 아미노산 서열에서 변경을 갖는다.

일부 구현예에서, 조작된 TA는 서열번호 1의 아미노산 변경 및 아미노산 잔기 위치의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265 및 L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, 또는 조합에 해당하는 하나 이상의 위치로부터 선택된 하나 이상의 아미노산 변경을 갖는다.

일부 구현예에서, 조작된 단백질의 하나 이상의 아미노산 변경은 서열번호 1의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265 및 L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, 및 A421에 상응하는 하나 이상의 위치 또는 아미노산 변경 및 아미노산 잔기 위치의 조합에서 보존적 또는 비보존적 아미노산의 치환이다.

일부 구현예에서, 조작된 TA는 표 5에 나타낸 잔기에 해당하는 위치에서 변경인 조작된 단백질의 하나 이상의 아미노산 변경을 갖는다.

일부 구현예에서, 조작된 TA 효소는 적어도 서열번호 1, 13, 또는 31의 상응하는 야생형과 비교하여 적어도 1.5X, 적어도 2X, 적어도 5X, 적어도 10X, 적어도 25X, 또는 1.5 내지 25X인 아디페이트 세미알데하이드 기질에 대한 촉매 효율을 갖는다.

일부 구현예에서, 표준 조건하에서 조작된 트랜스아미나아제 효소에 의한 아디페이트 세미알데하이드의 효소 전환은 서열번호 1, 13, 또는 31의 상응하는 야생형에 대한 효소의 효소 활성보다 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 또는 적어도 90% 더 크다.

일부 구현예에서, TA 변이체를 제공하기 위해, 본 개시의 서열번호 1로 표현된 아크로모박터 크실로스옥시단스 TA는 주형으로서 선택된다. 본원에 기술된 변이체는 아디페이트 세미알데하이드 또는 이의 유사체에 대한 증가된 활성 및 특이성에 대해 시험하기 위해 주형 내에 하나 이상의 아미노산 변경(예를 들어, 치환)을 도입함으로써 생성될 수 있다.

아미노산 위치 넘버링의 목적을 위해, 일부 구현예에서, 서열번호 1은 참조 서열로서 사용된다. 이에 따라, 예를 들어, 서열번호 1과 관련하여 아미노산 위치 79가 언급되어 있지만, 다른 TA 서열(표적 서열 또는 다른 주형 서열)의 맥락에서, 변이체 생성에 대한 상응하는 아미노산 위치는 동일하거나 상이한 위치 번호(예를 들어, 78, 79 또는 80)를 가질 수 있다. 일부 경우에, 서열번호 1 참조 주형에서 본래 아미노산 및 이의 위치는 표적 TA 상에서 본래 아미노산 및 위치와 정확하게 상관관계가 있을 것이다. 다른 경우에, 서열번호 1 주형에서 본래 아미노산 및 이의 위치는 본래 아미노산과 상관관계가 있을 것이지만, 표적에서 이의 위치는 상응하는 주형 위치에 있지 않을 것이다. 그러나, 표적에서의 상응하는 아미노산은 주형에서의 위치로부터 예를 들어, 주형 위치로부터 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 위치 내의 사전결정된 거리일 수 있다. 다른 경우에, 서열번호 1 주형에서 본래 아미노산은 표적에서 본래 아미노산과 정확하게 상관계가 있지 않을 것이다. 그러나, 표적 서열에서 어떠한 상응하는 아미노산이 주형에서의 아미노산의 일반적인 위치 및 표적 아미노산 부근의 아미노산 서열을 기반으로 하는 것이 이해될 수 있다. 서열 정렬이 본원에 구체적으로 개시되지 않은 TA 서열로 생성될 수 있으며, 이러한 정렬이 본 개시에 비추어 새로운 TA 변이체를 이해하거 생성시키기 위해 사용될 수 있는 것으로 이해된다. 일부 구현예에서, 서열 정렬은 표적 아미노산 부근의 공통 또는 유사한 아미노산을 이해할 수 있게 하며, 그러한 아미노산은 주형과 타겟 서열 간에 특정 양의 동일성 또는 유사성을 갖는 "서열 모티프"로서 보여질 수 있다. 그러한 서열 모티프는 변이체 아모니산이 위치된 TA 서열의 부분, 및 모티프에 존재할 수 있는 변이(들)의 타입을 기술하기 위해 사용될 수 있다.

일부 경우에, 주형 서열 및 표적 서열에서 아미노산 모티프 간의 서열 동일성을 이해하기 위해 기본 로컬 정렬 조사 툴(Basic Local Alignment Search Tool; BLAST) 알고리즘을 이용하는 것이 유용할 수 있다. 이에 따라, 바람직한 실시 모드에서, BLAST는 주형과 표적 단백질 간의 아미노산(예를 들어, 서열 모티프)의 더 짧은 스트레치를 식별하거나 이의 동일성을 이해하기 위해 사용된다. BLAST는 2개의 서열 사이에 짧은 매치를 위치시킴으로써 스미스-워터만(Smith-Waterman) 알고리즘을 근사하는 휴리스틱(heuristic) 방법을 이용하여 유사한 서열을 발견한다. (BLAST) 알고리즘은 특정의 임계값을 초과하는 문의 서열을 닮은 라이브러리 서열을 식별할 수 있다. BLAST 알고리즘을 이용하여 2개 이상의 서열의 관련성을 결정하기 위한 대표적인 파라미터는 예를 들어, 하기에 기술된 바와 같을 수 있다. 간단하게, 아미노산 서열 정렬은 BLASTP 버젼 2.0.8(Jan-05-1999) 및 하기 파라미터를 이용하여 수행될 수 있다. 매트릭스: 0 BLOSUM62; 갭 오픈: 11; 갭 연장: 1; x_드롭오프: 50; 예상: 10. 0; 워드사이즈: 3; 필터: 온. 핵산 서열 정렬은 BLASTN 버젼 2.0.6(Sept-16-1998) 및 하기 파라미터를 이용하여 수행될 수 있다: 매치: 1; 미스매치: -2; 갭 오픈: 5; 갭 연장: 2; x_드롭오프: 50; 예상: 10. 0; 워드크기: 11; 필터: 오프. 당업자는 비교의 엄격성을 증가 또는 감소시키기 위해, 예를 들어, 2개 이상의 서열의 관련성을 결정하기 위해 상기 파라미터를 어떻게 변경시킬 수 있는 지를 인지할 것이다.

부위-유도 돌연변이 유발 또는 서열 변경(예를 들어, 부위-특이적 돌연변이 유발 또는 올리고뉴클레오타이드-유도)은 TA를 인코딩하는 변이체 DNA 서열에 원하는 아미노산 치환을 제공하기 위해 표적 TA DNA 서열에 대한 특정 변화를 이루기 위해 사용될 수 있다. 일반적으로, 변이체 아미노산을 인코딩하는 코돈을 제공하는 서열을 갖는 올리고뉴클레오타이드가 사용된다. 일부 구현예에서, 변이체 TA DNA 서열의 전체 코딩 영역의 인공 유전자 합성은 치환을 위해 표적화된 바람직한 TA가 일반적으로 150개 미만 길이의 아미노산일 때 수행된다.

변이체 TA 서열의 생성을 위한 돌연변이 유발 올리고뉴클레오타이드를 사용한 대표적인 기술은 파지미드에 배치된 TA 유전자 서열을 사용할 수 있는 쿤켈(Kunkel) 방법을 포함한다. E. 콜라이 TA ssDNA에서 파지미드는 주형 상에서 확장된 프라이머인 올리고뉴클레오타이드를 사용한 돌연변이 유발을 위한 주형이다.

TA DNA에서 고려되는 위치의 측면에 있는 제한 효소 부위에 따라, 카세트 돌연변이 유발은 고려되는 변이체 서열을 생성하기 위해 사용될 수 있다. 카세트 돌연변이 유발을 위해, DNA 단편은 플라스미드에 합성 및 삽입되고, 제한 효소로 절단되고, 이후에 후속하여 TA 변이체 돌연변이를 함유한 상보적 올리고뉴클레오타이드의 쌍에 결찰된다. 플라스미드 및 올리고뉴클레오타이드의 제한 단편은 서로 결찰될 수 있다.

다른 구현예에서, 변이체 TA 서열을 생성시키기 위해 사용되는 다른 기술은 PCR 부위 유도 돌연변이 유발이다. 돌연변이 유발 올리고뉴클레오타이드 프라이머는 원하는 돌연변이를 도입하고 돌연변이된 서열을 지닌 PCR 단편을 제공하기 위해 사용된다. 추가 올리고뉴클레오타이드는 제한 효소 소화 및 유전자 내에 삽입을 위해 적합한 제한 부위를 제공하기 위해 돌연변이된 단편의 단부를 연장하기 위해 사용될 수 있다.

부위-유도 돌연변이 유발 기술을 위한 상업적 키트가 또한 이용 가능하다. 예를 들어, QuikchangeTM 키트는 pfu 폴리머라아제와 같은 고-충실도 비-가닥-대체 DNA 폴리머라아제를 사용하여 유전자 영역을 PCR 증폭시키기 위해 상보적 돌연변이 유발 프라이머를 사용한다. 반응은 이완된 닉드(nicked), 원형 DNA를 생성한다. 주형 DNA는 메틸화된 DNA에 대해 특이적인 DpnI와 같은 제한 효소로의 효소적 소화에 의해 제거된다.

일부 구현예에서, 최적화 방법은 유도 진화이다. 유도 진화는 효소의 특성을 개선 및/또는 변경시키기 위해 특정 유전자에 표적화된 돌연변이의 도입을 포함하는 강력한 apprTAh이다. 개선 및/또는 변경된 효소는 여러 효소 변이체(예를 들어, >104)의 자동화된 스크리닝을 허용하는 민감한 고처리량 스크리닝 검정의 개발 및 구현을 통해 식별될 수 있다. 돌연변이 유발의 반복적인 라운드 및 스크리닝은 통상적으로 최적화된 특성을 갖는 효소를 제공하기 위해 수행된다. 돌연변이 유발에 대한 유전자의 영역을 식별하는 데 도움이 될 수 있는 계산 알고리즘이 또한, 개발되었으며, 이는 생성되고 스크리닝되어야 하는 효소 변이체의 수를 크게 감소시킬 수 있다. 다양한 변이체 라이브러리를 생성하는 데 효과적이게 하는 여러 유도 진화 기술이 개발되었고(리뷰를 위해 문헌[Hibbert et al., Biomol. Eng 22:11-19 (2005); Huisman and Lalonde, In Biocatalysis in the pharmaceutical and biotechnology industries pgs. 717-742 (2007), Patel (ed.), CRC Press; Otten and Quax. Biomol. Eng 22:1-9 (2005); 및 Sen et al., Appl Biochem. Biotechnol 143:212-223 (2007)] 참조), 이러한 방법은 여러 효소 부류에 걸쳐 광범위한 특성의 개선에 성공적으로 적용되었다. 유도 진화 기술에 의해 개선 및/또는 변경된 효소 특징은 예를 들어, 비천연 기질의 전환을 위한 선택성/특이성; 튼튼한 고온 가공을 위한 온도 안정성; 낮은 또는 높은 pH 조건하에서 바이오 가공을 위한 pH 안정성; 높은 산물 역가(high product titers)가 달성될 수 있는 기질 또는 산물 내성; 비천연 기질을 포함하기 위한 브로드닝 기질 결합을 포함하는 결합(Km); 산물, 기질, 또는 중요한 중간체에 의해 억제를 제거하는 억제(Ki); 원하는 플럭스를 달성하기 위해 효소 반응속도를 증가시키는 활성(k_cat); 단백질 수율 및 전체 경로 플럭스를 증가시키는 발현 수준; 혐기성 조건하에서 공기 민감성 효소의 작업을 위한 산소 안정성; 및 산소의 부재 하에서 혐기성 효소의 작업을 위한 혐기성 활성을 포함한다.

특정 효소의 원하는 성질을 표적으로 하는 돌연변이 유발 및 유전자의 다양화를 위한 다수의 예시적인 방법이 개발되었다. 이러한 방법은 당업자에게 널리 공지되어 있다. 이러한 것들 중 어느 하나는 6ACA, 헥사메틸렌디아민 또는 카프로락탐 경로 효소 또는 단백질의 활성을 변경 및/또는 최적화하기 위해 사용될 수 있다. 이러한 방법은 PCR 반응에서 DNA 폴리머라아제의 충실도를 감소시킴으로써 랜덤 점 돌연변이를 도입하는 EpPCR(Pritchard et al., J Theor. Biol. 234:497-509 (2005)); 전체 원형 플라스미드가 주형으로서 사용되며 마지막 2개의 뉴클레오타이드에 엑소뉴클레아제 내성 티오포스페이트 결합을 갖는 랜덤 6-머가 사용되어 플라스미드를 증폭시키고 이후에 플라스미드가 탠뎀 반복부에서 재순환되는 세포로 형질전환시키는 것을 제외하고 epPCR과 유사한 오류-발생이 쉬운 롤링 원형 증폭(Error-prone Rolling Circle Amplification; epRCA)(Fujii et al., Nucleic Acids Res. 32:e145 (2004); and Fujii et al., Nat. Protoc. 1:2493-2497 (2006)); 키메라 유전자의 라이브러리를 생성하기 위해 DNA 폴리머라아제의 존재 하에서 어닐링 및 연장의 사이클에 의해 다시 어셈블링된 랜덤 단편의 풀을 생성하기 위해 Dnase I 또는 EndoV와 같은 뉴클레아제로 2개 이상의 변이체 유전자의 소화를 통상적으로 포함하는 DNA 또는 패밀리 셔플링(Family Shuffling)(Stemmer, Proc Natl Acad Sci USA 91:10747-10751 (1994); 및 Stemmer, Nature 370:389-391 (1994)); 주형 프라이밍 후 변성 및 어닐링/연장의 매우 짧은 기간(5초 정도로 짧음)과 함께 2 단계 PCR의 반복 사이클을 수반하는 시차 연장(Staggered Extension; StEP)(Zhao et al., Nat. Biotechnol. 16:258-261 (1998)); 랜덤 서열 프라이머가 사용되어 주형의 상이한 세그먼트에 대해 상보적인 다수의 짧은 DNA 단편을 생성하는 랜덤 프라이밍 재조합(Random Priming Recombination; RPR)(Shao et al., Nucleic Acids Res 26:681-683 (1998))을 포함하지만, 이로 제한되지 않는다.

추가 방법은 미스매치 복원에 의해 복원되는 헤테로듀플렉스를 형성하기 위해 선형화된 플라스미드 DNA를 사용하는 헤테로듀플렉스 재조합(Volkov et al, Nucleic Acids Res. 27:e18 (1999); 및 Volkov et al., Methods Enzymol. 328:456-463 (2000)); 단일 가닥 DNA(ssDNA)의 Dnase I 단편화 및 크기 분획화를 이용하는 과도성 주형에서의 랜덤 키메라유발(RACHITT)(Coco et al., Nat. Biotechnol. 19:354-359 (2001)); 주형의 풀로서 사용된 단방향 ssDNA의 존재 하에서 프라이머로부터 단방향으로 성장하는 가닥의 주형 스위칭을 수반하는 절단된 주형에서의 재조합 연장(RETT)(Lee et al., J. Molec. Catalysis 26:119-129 (2003)); 퇴화 프라이머가 분자들 간의 재조합을 제어하기 위해 사용되는 퇴화 올리고뉴클레오타이드 유전자 셔플링(DOGS)(Bergquist and Gibbs, Methods Mol. Biol 352:191-204 (2007); Bergquist et al., Biomol. Eng 22:63-72 (2005); Gibbs et al., Gene 271:13-20 (2001)); 고려되는 유전자 또는 유전자 단편의 1개의 염기쌍 결실과 함께 조합 라이브러리를 생성시키는, 하이브리드 효소의 생성을 위한 증분 절단(ITCHY)(Ostermeier et al., Proc. Natl. Acad Sci. USA 96:3562-3567 (1999); 및 Ostermeier et al., Nat. Biotechnol. 17:1205-1209 (1999)); 포스포티오에이트 dNTP가 사용되어 절단을 생성시키는 것을 제외하고 ITCHY와 유사한 하이브리드 효소의 생성을 위한 티오-증분 절단(THIO-ITCHY)(Lutz et al., Nucleic Acids Res 29:E16 (2001)); 유전자를 재조합하기 위한 2가지 방법, 즉, ITCHY 및 DNA 셔플링을 조합하는 SCRATCHY(Lutz et al., Proc. Natl. Acad Sci. USA 98:11248-11253 (2001)); epPCR을 통해 이루어진 돌연변이 이후에 사용 가능한 활성을 보유한 것에 대해 스크리닝/선택하는 랜덤 드리프트 돌연변이 유발(RNDM)(Bergquist et al., Biomol. Eng. 22:63-72 (2005)); 이노신과 같은 "보편적인" 염기의 존재 하에서 연장시키기 위한 주형으로서 사용되고 이노신-함유 보체의 복제가 랜덤 염기 도입을 제공하고 결과적으로, 돌연변이 유발을 제공하는, 포스포티오에이트 뉴클레오타이드의 랜덤 도입 및 절단을 이용하여 랜덤 길이 단편의 풀을 생성하는 랜덤 돌연변이 유발 방법인 서열 포화 돌연변이 유발(SeSaM)(Wong et al., Biotechnol. J. 3:74-82 (2008); Wong et al., Nucleic Acids Res. 32:e26 (2004); 및 Wong et al., Anal. Biochem. 341:187-189 (2005)); "표적에서 모든 유전적 다양성"을 인코딩하기 위해 설계된 중첩 올리고뉴클레오타이드를 사용하고 셔플링된 자손에 대해 매우 높은 다양성을 어용하는 합성 셔플링(Ness et al., Nat. Biotechnol. 20:1251-1255 (2002)); dUTP 도입의 조합을 이용하고 이후에 종점 DNA 단편화를 수행하기 위해 우라실 DNA 글리코실라아제 이후 피페리딘으로 처리하는, 뉴클레오타이드 교환 및 절제 기술 NexT(Muller et al., Nucleic Acids Res. 33:e17 (2005))을 포함한다.

다른 방법은 링커가 사용되어 2개의 별개의 관련되거나 관련되지 않은 유전자 간에 융합을 용이하게 하며 소정 범위의 키메라가 2개의 유전자 사이에 생성되어 단일-교차 하이브리드의 라이브러리를 야기시키는 서열 상동성-독립 단백질 재조합(SHIPREC)(Sieber et al., Nat. Biotechnol. 19:456-460 (2001)); 출발 물질이 돌연변이의 원하는 부위에서 퇴화되는 2개의 프라이머 및 인서트를 함유한 초나선 이중 가닥 DNA(dsDNA) 플라스미드를 포함하는 Gene Site Saturation Mutagenesis™(GSSM™)(Kretz et al., Methods Enzymol. 388:3-11 (2004)); 제한된 영역을 다수의 가능한 아미노산 서열 변경으로 대체하기 위해 짧은 올리고뉴클레오타이드 카세트의 사용을 포함하는 조합 카세트 돌연변이 유발(CCM)(Reidhaar-Olson et al. Methods Enzymol. 208:564-586 (1991); 및 Reidhaar-Olson et al. Science 241:53-57 (1988)); CCM과 본질적으로 유사하고 핫 스폿 및 핫 영역을 식별하고 이후에 단백질 서열 공간의 규정된 영역을 덮기 위해 CMCM에 의해 연장하기 위해 높은 돌연변이 비율로 epPCR을 이용하는 조합 다수 카세트 돌연변이 유발(CMCM)(Reetz et al., Angew. Chem. Int. Ed Engl. 40:3589-3591 (2001)); mutD5 유전자를 사용하는 조건부 ts 돌연변이 유발 유전자 플라스미드가 선택 동안 랜덤 및 천연 돌연변이 빈도를 20 내지 4000-X 증가시킬 수 있고 선택이 필요하지 않을 때 유해한 돌연변이의 축적을 차단하기 위해, DNA 폴리머라아제 III의 돌연변이체 하위단위를 인코딩하는, 돌연변이 유발 유전자 균주 기술(Selifonova et al., Appl. Environ. Microbiol. 67:3645-3649 (2001)); Low et al., J. Mol. Biol. 260:359-3680 (1996))을 포함한다.

추가의 예시적인 방법은 선택된 아미노산의 조합 돌연변이를 평가하고 최적화하는 다차원 돌연변이 유발 방법인 룩-스루(look-through) 돌연변이 유발(LTM)(Rajpal et al., Proc. Natl. Acad Sci. USA 102:8466-8471 (2005)); 한번에 또는 단일 유전자의 키메라(다수 돌연변이)의 큰 라이브러리를 생성하기 위해 다수의 유전자에 적용될 수 있는 DNA 셔플링 방법(Verenium Corporation에 의해 공급된 Tunable GeneReassembly™ (TGR™) Technology), 특정 폴드를 갖는 구조적으로 규정된 단백질 골격을 고정시키고 폴드 및 전체 단백질 에너지를 안정화시킬 수 있는 아미노산 치환에 대한 서열 공간을 조사하고 일반적으로 공지된 3차원 구조를 갖는 단백질에서 가장 효율적으로 작동하는 최적화 알고리즘인 인 실리코 단백질 설계 자동화(PDA)인 유전자 재어셈블리(Hayes et al., Proc. Natl. Acad Sci. USA 99:15926-15931 (2002)); 및 효소 개선을 위해 유사한 부위를 선택하기 위해 구조/기능의 지식을 이용하고, 돌연변이 유발 방법, 예를 들어, Stratagene QuikChange(Stratagene; San Diego Calif.)을 이용하여 선택된 부위에서 포화 돌연변이 유발을 수행하고, 원하는 특성에 대해 스크리닝/선택하고, 개선된 클론(들)을 이용하여, 다른 부위에서 다시 시작하고 원하는 활성이 달성될 때까지 계속 반복하는 것을 포함하는 반복 포화 돌연변이 유발(ISM)(Reetz et al., Nat. Protoc. 2:891-903 (2007); 및 Reetz et al., Angew. Chem. Int. Ed Engl. 45:7745-7751 (2006))을 포함한다.

돌연변이 유발을 위한 임의의 상술된 방법은 단독으로 또는 임의의 조합으로 사용될 수 있다. 추가적으로, 유도 진화 방법의 임의의 하나 또는 조합은 본원에 기술된 바와 같이, 적응 진화 기술과 함께 사용될 수 있다.

원하는 효소 활성을 갖는 세포는 당분야에 공지된 임의의 방법을 이용하여 식별될 수 있다. 예를 들어, 효소 활성 검정은 효소 활성을 갖는 세포를 식별하기 위해 이용될 수 있다[예를 들어, 문헌[Enzyme Nomenclature, Academic Press, Inc., New York 2007] 참조]. 아디페이트 세미알데하이드 상의 TA 간의 반응을 결정하기 위해 사용될 수 있는 다른 검정은 GC/MS 분석을 포함한다. 다른 예에서, NADH/NADPH의 수준이 모니터링될 수 있다. 예를 들어, NADH/NADPH는 NADP/NADPH 검정 키트(예를 들어, ABCAM™으로부터 입수 가능한 ab65349)를 이용하여 비색적으로 또는 분광학적으로 모니터링될 수 있다.

개시된 TA 효소는 나일론 중간체의 제조를 위한 경로에서 사용될 수 있다. 일부 구현예에서, 비천연 미생물은 아디페이트 세미알데하이드, 또는 중간체로서 아디페이트 세미알데하이드를 사용하여 제조된 다른 나일론 중간체의 제조에서 사용될 수 있다.

일부 구현예에서, 유전적으로 조작된 세포(예를 들어, 비천연 미생물)는 6-아미노카프로산, 카프로락탐, 및 헥사메틸렌디아민과 같은 나일론 중간체를 제조할 수 있다.

일부 구현예에서, 나일론 중간체는 도 1에 기술된 경로를 이용하여 생합성된다. 일부 구현예에서, 도 1 경로는 본원에 기술된 유전적으로 조작된 세포(예를 들어, 비천연 미생물)에서 제공되며, 여기서, 경로는 6-아미노카프로산, 카프로락탐, 및 헥사메틸렌디아민을 제조하기에 충분한 양으로 발현된 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함한다.

일부 구현예에서, 경로는 도 1에 도시된 HMD 경로이다. HMD 경로는 본원에 기술된 유전적으로 개질된 세포(예를 들어, 비천연 미생물)에 제공되며, 여기서, HMD 경로는 HMD를 제조하기에 충분한 양으로 발현되는 HMD 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함한다. 효소 1A는 3-옥소아디필-CoA 티올라아제이며; 1B는 3-옥소아디필-CoA 리덕트랜스아미나아제이며; 1C는 3-하이드록시아디필-CoA 데하이드라리덕트랜스아미나아제이며; 1D는 아디페이트 세미알데하이드리덕트랜스아미나아제이며; 1E는 3-옥소아디필-CoA/아실-CoA 트랜스퍼라아제이며; 1F는 3-옥소아디필-CoA 신타아제이며; 1G는 3-옥소아디필-CoA 하이드롤라아제이며; 1H는 3-옥소아디페이트 리덕트랜스아미나아제이며; 1I는 3-하이드록시아디페이트 데하이드라트랜스아미나아제이며; 1J는 5-카복시-2-펜테노에이트 리덕트랜스아미나아제이며; 1K는 아디필-CoA/아실-CoA 트랜스퍼라아제이며; 1L은 아디필-CoA 신타아제이며; 1M은 아디필-CoA 하이드롤라아제이며; 1N은 아디필-CoA 리덕트랜스아미나아제(알데하이드 형성)이며; 1O는 6-아미노카프로에이트 트랜스아미나아제이며; 1P는 6-아미노카프로에이트 데하이드로게나아제이며; 1Q는 6-아미노카프로일-CoA/아실-CoA 트랜스퍼라아제이며; 1R은 6-아미노카프로일-CoA 신타아제이며; 1S는 아미도하이드롤라아제이며; 1T는 자발적 고리화이며; 1U는 6-아미노카프로일-CoA 리덕트랜스아미나아제(알데하이드 형성)이며; 1V는 HMDA 트랜스아미나아제이며; 1W는 HMDA 데하이드로게나아제이다.

도 1을 참조하면, 일부 구현예에서, 비천연 미생물은 하기 경로들 중 하나 이상을 갖는다: ABCDNOPQRUVW; ABCDNOPQRT; 또는, ABCDNOPS. 아디페이트 세미알데하이드를 제조하기 위한 TA 효소를 포함하는 다른 대표적인 경로는 미국특허 제8,377,680호에 기술된 것을 포함하며, 이러한 문헌은 전문이 본원에 참고로 포함된다.

도 1은 또한, 트랜스퍼라아제 또는 신타아제 효소에 의한 6-아미노카프로에이트로부터 6-아미노카프로일-CoA로의 경로(도 1, 단계 Q 또는 R), 이후 카프로락탐을 형성하기 위한 6-아미노카프로일-CoA의 자발적 고리화(도 1, 단계 T)를 도시한 것이다. 다른 구현예에서, 6-아미노카프로에이트는 6-아미노카프로일-CoA로 활성화되고(도 1, 단계 Q 또는 R), 이후에, HMDA를 형성하기 위해 환원(도 1, 단계 U) 및 아민화(도 1, 단계 V 또는 W)된다. 6-아미노카프로산은 또한, 6-아미노카프로일-CoA 대신에 6-아미노카프로일-포스페이트로 활성화될 수 있다. 6-아미노카프로일-포스페이트는 카프로락탐을 형성하기 위해 자발적으로 환형화될 수 있다. 일부 구현예에서, 6-아미노카프로일-포스페이트는 6-아미노카프로에이트 세미알데하이드로 환원되고, 이는 이후에 도 1에 도시된 바와 같이 HMDA로 전환될 수 있다.

미생물 유기체 또는 미생물을 참조하여 사용될 때 본원에서 사용되는 용어 "비천연"은 미생물 유기체가 언급된 종의 야생형 균주를 포함하는, 언급된 종의 자연 발생 균주에서 일반적으로 발견되지 않는 적어도 하나의 유전적 변경을 가짐을 의미하는 것으로 의도된다. 유전적 변경은 예를 들어, 대사 폴리펩타이드를 인코딩하는 발현 가능한 핵산을 도입한 변형, 다른 핵산 첨가, 핵산 결실, 및/또는 미생물 유전 물질의 다른 기능 파괴를 포함한다. 이러한 변형은 예를 들어, 언급된 종에 대한 이종, 동종, 또는 이종과 동종 폴리펩타이드 둘 모두에 대한, 코딩 영역 및 이의 기능적 단편을 포함한다. 추가 변형은 예를 들어, 변형이 유전자 또는 오페론의 발현을 변경시키는 비-코딩 조절 영역을 포함한다. 대표적인 대사 폴리펩타이드는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 내의 효소를 포함한다.

대사 변형은 이의 자연 발생 상태로부터 변경된 생화학적 반응을 지칭한다. 이에 따라, 비천연 미생물은 대사 폴리펩타이드를 인코딩하는 핵산 또는 이의 기능성 단편에 대한 유전적 변형을 가질 수 있다. 대표적인 대사 변형은 본원에 개시되어 있다.

본원에서 사용되는 용어 "미생물의," "미생물 유기체" 또는 "미생물"은 서로 교환 가능하게 사용되었고, 고세균, 박테리아 또는 진핵생물의 도메인 내에 포함된 미세한 세포로서 존재하는 임의의 유기체를 의미하는 것으로 의도된다. 이에 따라, 이러한 용어는 미세한 크기를 갖는 원핵 세포 또는 진핵 세포 또는 유기체를 포함하는 것으로 의도되고, 모든 종의 박테리아, 고세균 및 진정세균뿐만 아니라 진핵 미생물, 예를 들어, 효모 및 진균을 포함한다. 이러한 용어는 또한 생화학적 제조를 위해 배양될 수 있는 임의의 종의 세포 배양물을 포함한다.

본원에서 사용되는 용어 "CoA" 또는 "조효소 A"는 유기 보조인자 또는 보정 그룹(prosthetic group)(효소의 비단백질 부분)을 의미하는 것으로 의도되며, 이의 존재는 활성 효소 시스템을 형성하기 위한 여러 효소(아포효소)의 활성을 위해 요구된다. 특정의 축합 효소에서 조효소 A 기능은 아세틸 또는 다른 아실 기 전달에서 및 지방산 합성 및 산화, 피루베이트 산화에서, 및 다른 아세틸화에서 작용한다.

본원에서 사용되는, 화학식 -OOC-(CH2)4-COO-(도 1 참조)(IUPAC명 헥산디오에이트)를 갖는 "아디페이트"는 아디프산(IUPAC명 헥산디오산)의 이온화된 형태이며, 아디페이트 및 아디프산은 이의 임의의 염 형태를 포함하는 임의의 이의 중성 또는 이온화된 형태의 화합물을 지칭하기 위해 전반에 걸쳐 서로 교환 가능하게 사용될 수 있는 것으로 이해된다. 특정 형태가 pH에 따라 달라질 것이라는 것이 당업자에 의해 이해된다.

본원에서 사용되는, 화학식 -OOC-(CH2)5-NH2(도 1 참조, 및 6-ACA로서 약침됨)를 갖는 "6-아미노카프로에이트"는 6-아미노카프로산(IUPAC명 6-아미노헥산산)의 이온화된 형태이며, 6-아미노카프로에이트 및 6-아미노카프로산은 이의 임의의 염 형태를 포함하는 임의의 이의 중성 또는 이온화된 형태의 화합물을 지칭하기 위해 전반에 걸쳐 서로 교환 가능하게 사용될 수 있는 것으로 이해된다. 특정 형태가 pH에 따라 달라질 것이라는 것이 당업자에 의해 이해된다.

본원에서 사용되는 "카프로락탐"(IUPAC명 아제판-2-온)은 6-아미노헥산산의 락탐(도 1 참조, 및 CPO로서 약칭됨)이다.

본원에서 사용되는 1,6-디아미노헥산 또는 1,6-헥산디아민으로도 지칭되는 "헥사메틸렌디아민"은 화학식 H2N(CH2)6NH2(도 1 참조, 및 HMD로서 약칭됨)를 갖는다.

배양 또는 성장 조건과 관련하여 사용될 때 본원에서 사용되는 용어 "실질적으로 혐기성"은 산소의 양이 액체 배지 중 용존 산소에 대한 포화도의 약 10% 미만임을 의미하는 것으로 의도된다. 이러한 용어는 또한, 약 1% 미만의 산소의 대기와 함께 유지된 액체 또는 고체 배치의 시일링된 챔버를 포함하는 것으로 의도된다.

배양 또는 성장 조건과 관련하여 사용될 때 본원에서 사용되는 용어 "삼투 억제제"는 삼투물질로서 작용하고 본원에 기술된 미생물 유기체가 삼투 스트레스에서 생존하는 데 도움을 주는 화합물을 의미하는 것으로 의도된다. 삼투 억제제는 예를 들어, 베타인, 아미노산, 및 당 트레할로오스를 포함한다. 이의 비제한적인 예에는 글리신 베타인, 프랄린 베타인, 디메틸테틴, 디메틸설포니오프로피오네이트, 3-디메틸설포니오-2-메틸프로프리오네이트, 피페콜린산, 디메틸설포니오아세테이트, 콜린, L-카르니틴 및 엑토인이 있다.

생화학물질의 제조와 관련하여 사용될 때 본원에서 사용되는 용어 "성장-커플링된"은 언급된 생화학물의 생합성이 미생물의 성장 시기 동안 제조되는 것을 의미하는 것으로 의도된다. 특정 구현예에서, 성장-커플링된 제조는 필수적일 수 있는데, 이는 언급된 생화학물의 생합성이 미생물의 성장 시기 동안 제조된 필수 산물임을 의미한다.

본원에서 사용되는 "대사 변형"은 이의 천연 발생 상태로부터 변경되는 생화학적 반응을 지칭하는 것으로 의도된다. 대사 변형은 예를 들어, 반응에 참여하는 효소를 인코딩하는 하나 이상의 유전자의 기능적 파괴에 의해 생화학적 반응 활성의 제거를 포함할 수 있다.

본원에서 사용되는 용어 "유전자 파괴," 또는 이의 문법적 등가물은 인코딩된 유전자 산물을 비활성화시키는 유전적 변형을 의미하는 것으로 의도된다. 유전적 변경은 예를 들어, 전체 유전자의 결실, 전사 또는 번역을 위해 필요한 조절 서열의 결실, 절단된 유전자 산물을 초래하는 유전자의 일부의 결실, 또는 인코딩된 유전자 산물을 비활성화시키는 임의의 다양한 돌연변이 전략에 의한 것일 수 있다. 유전자 파괴의 하나의 특히 유용한 방법은 완전 유전자 결실인데, 왜냐하면, 이러한 것이 비천연 미생물에서 유전적 반전의 발생을 감소시키거나 제거하기 때문이다.

본원에서 사용되는 "외인성"은 언급된 분자 또는 언급된 활성이 숙주 미생물 유기체 내에 도입됨을 의미하는 것으로 의도된다. 분자는 예를 들어, 숙주 유전 물질 내에 인코딩 핵산의 도입에 의해, 예를 들어, 숙주 염색체 내에 또는 플라스미드와 같은 비-염색체 유전 물질로서 통합에 의해 도입될 수 있다. 이에 따라, 인코딩 핵산의 발현과 관련하여 사용될 때 이러한 용어는 미생물 유기체 내에 발현 가능한 형태로 인코딩 핵산의 도입을 지칭한다. 생합성 활성과 관련하여 사용될 때, 이러한 용어는 언급된 숙주 유기체 내에 도입된 활성을 지칭한다. 소스는 예를 들어, 숙주 미생물 유기체 내에 도입된 후 언급된 활성을 발현시키는 동종 또는 이종 인코딩 핵산일 수 있다. 이에 따라, 용어 "내인성"은 숙주에 존재하는 언급된 분자 또는 활성을 지칭한다. 유사하게는, 이러한 용어는 인코딩 핵산의 발현과 관련하여 사용될 때, 미생물 유기체 내에 함유된 인코딩 핵산의 발현을 지칭한다.

용어 "이종"은 언급된 종과는 다른 소스로부터 유래된 분자, 물질, 또는 활성을 지칭하며, "동종"은 숙주 미생물 유기체로부터 유래된 분자, 물질, 또는 활성을 지칭한다. 이에 따라, 인코딩 핵산의 외인성 발현은 이종 또는 동종 인코딩 핵산 중 어느 하나 또는 둘 모두를 사용할 수 있다.

본원에서 사용되는 용어 "약"은 기술된 값의 ± 10%를 의미한다. 용어 "약"은 가장 가까운 유효 숫자로 반올림된 것을 의미할 수 있다. 이에 따라, 약 5%는 4.5% 내지 5.5%를 의미한다. 추가적으로, 특정 수와 관련한 약은 또한, 그러한 정확한 숫자도 포함한다. 예를 들어, 약 5%는 또한 정확하게 5%도 포함한다.

6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 또는 헥사메틸렌디아민의 맥락에서 본원에서 사용되는 용어 "생체 유래"는 이러한 화합물이 미생물 유기체에서 합성됨을 의미한다.

하나 초과의 외인성 핵산이 미생물 유기체에 포함될 때, 외인성 핵산이 상기에 논의된 바와 같이, 언급된 인코딩 핵산 또는 생합성 활성을 지칭하는 것으로 이해된다. 또한, 본원에 개시된 바와 같이, 이러한 외인성 핵산이 별도의 핵산 분자, 폴리시스트론 핵산 분자 또는 이들의 조합 상에서 숙주 미생물 유기체 내에 도입될 수 있고, 여전히 하나 초과의 외인성 핵산으로서 여겨지는 것으로 이해된다. 예를 들어, 본원에 개시된 바와 같이, 미생물 유기체는 원하는 경로 효소 또는 단백질을 인코딩하는 2개 이상의 외인성 핵산을 발현하도록 조작될 수 있다. 원하는 활성을 인코딩하는 2개의 외인성 핵산이 숙주 미생물 유기체 내에 도입되는 경우에, 2개의 외인성 핵산이 예를 들어, 단일 플라스미드, 별도의 플라스미드 상에 단일 핵산으로서 도입될 수 있고, 단일 부위 또는 다수의 부위에 숙주 염색체 내에 도입될 수 있고, 여전히 2개의 외인성 핵산으로서 여겨질 수 있다. 유사하게는, 2개 초과의 외인성 핵산이 예를 들어, 단일 플라스미드, 숙주 염색체 내에 도입되지 않은 별도의 플라스미드 상에 임의의 원하는 조합으로 숙주 유기체 내에 도입될 수 있으며, 플라스미드는 염색체외 구성요소로서 잔류하고, 여전히 2개 이상의 외인성 핵산으로서 여겨진다. 언급된 외인성 핵산 또는 생합성 활성의 수는 숙주 유기체 내에 도입된 별도의 핵산의 수가 아닌, 인코딩 핵산의 수 또는 생합성 활성의 수를 지칭한다.

비천연 미생물 유기체는 안전한 유전적 변경을 함유할 수 있으며, 이는 변경의 상실 없이 5세대 이상 배양될 수 있는 미생물을 지칭한다. 일반적으로, 안정한 유전적 변경은 10세대 이상 지속하는 변형을 포함하며, 특히 안정한 변형은 약 25세대 이상 지속할 것이며, 보다 특히, 안정한 유전적 변형은 무기한을 포함하는, 50세대 이상일 것이다.

유전자 파괴의 경우에, 특히 유용한 안정한 유전적 변경은 유전자 결실이다. 안정한 유전적 변경을 도입하기 위한 유전자 결실의 사용은 유전적 변경 이전에 표현형에 대한 반전의 가능성을 감소시키는 데 특히 유용하다. 예를 들어, 생화학물질의 안정한 성장-커플링된 제조는 예를 들어, 한 세트의 대사 변형 내에 하나 이상의 반응을 촉매화하는 효소를 인코딩하는 유전자의 결실에 의해 달성될 수 있다. 생화학물질의 성장-커플링된 제조의 안정성은 다수의 결실을 통해 추가로 향상되어, 각 파괴된 활성을 위해 발생하는 다수의 보상적 반전의 가능성을 크게 감소시킬 수 있다.

당업자는 본원에 예시된 대사 변형을 포함하는 유전적 변경이 E. 콜라이와 같은 적합한 숙주 유기체, 및 이의 상응하는 대사 반응 또는 원하는 대사 경로에 대한 유전자와 같은 원하는 유전 물질에 대한 적합한 소스 유기체와 관련하여 기술된다는 것을 이해할 것이다. 그러나, 매우 다양한 유기체의 완전한 게놈 시퀀싱 및 게놈학의 분야의 높은 수준의 기술을 고려하여, 당업자는 본질적으로 모든 다른 유기체에 본원에 제공된 교시 및 지침을 용이하게 적용할 수 있을 것이다. 예를 들어, 본원에서 예시된 E. 콜라이 대사 변경은 언급된 종과는 다른 종으로부터 동일하거나 유사한 인코딩 핵산을 도입함으로써 다른 종에 용이하게 적용될 수 있다. 이러한 유전적 변경은 예를 들어, 일반적으로 종 동족체, 및 특히 오르소로그(ortholog), 파라로그(paralog) 또는 비-오르소로그 유전자 변위의 유전적 변경을 포함한다.

오르소로그는 수직 혈통에 의해 관련된 유전자 또는 유전자들이고, 상이한 유기체에서 실질적으로 동일하거나 동일한 기능을 담당한다. 예를 들어, 마우스 에폭사이드 하이드롤라아제 및 인간 에폭사이드 하이드롤라아제는 에폭사이드의 가수분해의 생물학적 기능에 대한 오르소로그로 여겨질 수 있다. 유전자는 예를 들어, 동종이거나 공통 조상으로부터의 진화에 의해 연관된 것을 나타내기 위해 충분한 양의 서열 유사성을 공유할 때 수직 형태에 의해 관련된다. 유전자는 또한, 이러한 것이 1차 서열 유사성이 식별 가능하지 않은 정도로 공통 조상으로부터 진환되었음을 나타내기에 충분한 양의 3차원 구조를 공유하지만, 반드시 서열 유사성을 공유하지 않는 경우 오르소로그로 여겨질 수 있다. 오르소로그인 유전자는 약 25% 내지 100% 아미노산 서열 동일성을 갖는 단백질을 인코딩할 수 있다. 25% 미만의 아미노산 유사성을 공유하는 단백질을 인코딩하는 유전자는 또한, 이의 3차원 구조가 또한 유사성을 나타내는 경우 수직 혈통에 의해 발생한 것으로 여겨질 수 있다. 조직 플라스미노겐 활성제 및 엘라스트랜스아미나아제를 포함하는, 효소의 세린 프로테아제 패밀리의 구성원은 공통 조상으로부터 수직 혈통에 의해 발생한 것으로 여겨진다.

오르소로그는 예를 들어, 진화를 통해 구조 또는 전체 활성으로 분기된 유전자 또는 이의 인코딩된 유전자 산물을 포함한다. 예를 들어, 하나의 종이 2가지 기능을 나타내는 유전자 산물을 인코딩하는 경우 및 이러한 기능이 제2 종에서 별개의 유전자로 분리된 경우에, 3개의 유전자 및 이의 상응하는 산물은 오르소로그로 여겨진다. 생화학적 산물의 제조를 위해, 당업자는 도입되거나 파괴된 대사 활성을 은닉하는 오르소로그 유전자가 비천연 미생물의 구성을 위해 선택되어야 함을 이해할 것이다. 분리 가능한 활성을 나타내는 오르소로그의 예는 별개의 활성이 2개 이상의 종 사이에 또는 단일 종 내에 별개의 유전자 산물로 분리되는 경우이다. 특정 예는 엘라스트랜스아미나아제 단백질분해 및 플라스미노겐 단백질분해, 즉, 2가지 타입의 세린 프로테아제 활성의 팔르스미노겐 활성제 및 엘라스트랜스아미나아제로서 별도의 분자로의 분리이다. 제2 예는 미코플라스마 5'-3' 엑소뉴클레아제 및 트로소필라 DNA 폴리머라아제 III 활성의 분리이다. 제1 종으로부터의 DNA 폴리머라아제는 제2 종으로부터의 엑소뉴클레아제 또는 폴리머라아제 중 어느 하나 또는 둘 모두에 오르소로그으로 여겨질 수 있거나, 그 반대로도 여겨질 수 있다.

반대로, 유사체는 예를 들어, 복제 이후 진화적 발산에 의해 관련된 동족체이고, 유사하거나 공통적인 기능을 가지지만, 동일한 기능을 갖는 것은 아니다. 유사체는 예를 들어, 동일한 종 또는 상이한 종으로부터 기원하거나 유래될 수 있다. 예를 들어, 마이크로솜 에폭사이드 하이드롤라아제(에폭사이드 하이드롤라아제 I) 및 가용성 에폭사이드 하이드롤라아제(에폭사이드 하이드롤라아제 II)는 별개의 반응을 촉매화하고 동일한 종에서 별도의 기능을 갖는 유사체로서 여겨질 수 있는데, 왜냐하면, 이러한 것이 2개의 별개의 효소를 나타내고, 공통 조상으로부터 공동-진화하기 때문이다. 유사체는 서로 유의미한 서열 유사성을 갖는 동일한 종으로부터의 단백질로서, 이는 이러한 것이 동종이거나, 공통 조상으로부터 공진화를 통해 동해 관련이 있음을 시사한다. 파라로그 단백질 패밀리의 그룹은 HipA 동족체, 루시페라아제 유전자, 펩티다아제 등을 포함한다.

비-오르소로그 유전자 변위는 상이한 종에서 언급된 유전자 기능을 치환할 수 있는 하나의 종으로부터의 비-오르소로그 유전자이다. 치환은 예를 들어, 상이한 종에서 언급된 기능과 비교하여 본래 종에서 실질적으로 동일하거나 유사한 기능을 수행할 수 있는 것을 포함한다. 일반적으로, 비-오르소로그 유전자 변위가 언급된 기능을 인코딩하는 공지된 유전자와 구조적으로 관련된 바와 같이 식별 가능할 수 있지만, 그럼에도 불구하고, 덜 구조적으로 관련되지만, 기능적으로 유사한 유전자 및 이의 상응하는 유전자 산물은 본원에서 사용되는 용어의 의미 내에 여전히 속할 것이다. 기능적 유사성은 예를 들어, 치환하고자 하는 기능을 인코딩하는 유전자와 비교하여 비-오르소로그 유전자 산물의 활성 부위 또는 결합 영역에 적어도 일부 구조적 유사성을 필요로 한다. 이에 따라, 비-오르소로그 유전자는 예를 들어, 파라로그 유전자 또는 관련되지 않은 유전자를 포함한다.

이에 따라, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 능력을 식별하고 작제화함에 있어서, 당업자는 특정 종에 본원에 제공된 교시 및 지침을 적용하면서, 대사 변형의 식별이 오르소로그 유전자의 식별 및 포함 또는 비활성화를 포함할 수 있다는 것을 이해할 것이다. 유사한 또는 실질적으로 유사한 대사 반응을 촉매화하는 효소를 인코딩하는 언급된 미생물에 파라로그 유전자 및/또는 비-오르소로그 유전자 변위가 존재하는 한, 당업자는 또한, 이러한 진화적으로 관련된 유전자를 사용할 수 있다. 유전자 파괴 전략에서, 진화적으로 관련된 유전자는 또한, 파괴에 대해 표적화된 효소 활성의 임의의 기능적 중복이 설계된 대사 변형을 단락시키지 않음을 보장하기 위해 활성을 감소시키거나 제거하기 위해 숙주 미생물 유기체, 파라로그 유전자 또는 오르소로그 유전자에서 파괴되거나 결실될 수 있다.

오르소로그, 파라로그 및 비-오르소로그 유전자 변위는 당업자에게 널리 공지된 방법에 의해 결정될 수 있다. 예를 들어, 2개의 폴리펩타이드에 대한 핵산 또는 아미노산 서열의 검사는 비교된 서열 간의 서열 동일성 및 유사성을 나타낼 것이다. 이러한 유사성을 기초로 하여, 당업자는 단백질이 공통 조상으로부터의 진화를 통해 관련되어 있음을 나타낼만큼 유사성이 충분히 높은 지를 결정할 수 있다. 당업자에게 널리 공지된 알고리즘, 예를 들어, Align, BLAST, Clustal W 및 다른 것들은 원시 서열 유사성 또는 동일성을 비교하고, 결정하고, 또한, 가중치 또는 스코어를 할당할 수 있는 서열에서 갭의 존재 또는 유의도를 결정한다. 이러한 알고리즘은 또한, 당분야에 공지되어 있고, 뉴클레오타이드 서열 유사성 또는 동일성을 결정하기 위해 유사하게 적용 가능하다. 관련성을 결정하기 위한 충분한 유사성에 대한 파라미터는 통계학적 유사성을 계산하기 위한 널리 공지된 방법, 또는 랜덤 폴리펩타이드에서 유사한 일치를 발견할 기회, 및 결정될 일치의 유의도를 기초로 하여 계산된다. 2개 이상의 서열의 컴퓨터 비교는 원하는 경우에, 또한, 당업자에 의해 시각적으로 최적화될 수 있다. 관련된 유전자 산물 또는 단백질은 높은 유사성, 예를 들어, 25% 내지 100% 서열 동일성을 갖는 것으로 예상될 수 있다. 관련되지 않은 단백질은 충분한 크기의 데이터베이스가 스캐닝되는 경우(약 5%), 우연히 발생하는 것으로 예상되는 것과 본질적으로 동일한 동일성을 가질 수 있다. 5% 내지 24%의 서열은 비교된 서열이 관련되어 있다는 결론을 내리기 위해 충분한 동족성을 나타낼 수 있거나 나타내지 않을 수 있다. 데이터 세트의 크기가 제공된 이러한 일치의 유의도를 결정하기 위한 추가 통계학적 분석은 이러한 서열의 관련성을 결정하기 위해 수행될 수 있다.

예를 들어, BLAST 알고리즘을 이용하여 2개 이상의 서열의 관련성을 결정하기 위한 예시적인 파라미터는 하기에 기술될 수 있다. 간단하게, 아미노산 서열 정렬은 BLASTP 버젼 2.2.29+(Jan-14, 2014) 및 하기 파라메트랜스아미나아제를 이용하여 수행될 수 있다: 매트릭스: 0 BLOSUM62; 갭 오픈(gap open): 11; 갭 연장(gap extension): 1; x_드롭오프: 50; 예상: 10.0; 워드사이즈: 3; 필터(filter): 온(on). 핵산 서열 정렬은 BLASTN 버젼 2.0.6(Sept-16-1998) 및 하기 파라메트랜스아미나아제를 이용하여 수행될 수 있다: 매치: 1; 미스매치: -2; 갭 오픈: 5; 갭 연장: 2; x_드롭오프: 50; 예상: 10.0; 워드사이즈: 11; 필터: 오프(off). 당업자는 비교의 엄격성을 증가 또는 감소시키기 위해, 예를 들어, 2개 이상의 서열의 관련성을 결정하기 위해 상기 파라메트랜스아미나아제를 어떻게 변경시킬 수 있는 지를 인지할 것이다.

도면에 기술된 바와 같은 것을 포함하는 본원에 개시된 임의의 경로가 원하는 경우에 임의의 경로 중간체 또는 생성물을 제조하는 비천연 미생물 유기체를 생성시키기 위해 사용될 수 있는 것으로 이해된다. 본원에 개시된 바와 같이, 중간체를 제조하는 이러한 미생물 유기체는 원하는 생성물을 제조하기 위해 다운스트림 경로 효소를 발현시키는 다른 미생물 유기체와 조합하여 사용될 수 있다. 그러나, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체를 제조하는 비천연 미생물 유기체가 원하는 생성물로서 중간체를 제조하기 위해 사용될 수 있는 것으로 이해된다.

본원에는 대사 반응, 이의 반응물 또는 생성물에 대한 일반적인 언급, 또는 언급된 대사 반응, 반응물 또는 생성물과 관련되거나 이를 촉매화하는 효소를 인코딩하는 하나 이상의 핵산 또는 유전자에 대한 특정 언급이 기술된다. 본원에서 달리 명확하게 기술하지 않는 한, 당업자는 반응에 대한 언급이 또한, 반응물 및 반응 생성물에 대한 언급을 구성한다는 것을 이해할 것이다. 유사하게는, 본원에서 달리 명확하게 기술하지 않는 한, 반응물 또는 생성물에 대한 언급은 또한, 반응을 언급하며, 임의의 이러한 대사 구성성분에 대한 언급은 또한 언급된 반응을 촉매화하는 효소를 인코딩하는 유전자 또는 유전자들, 반응물 또는 생성물을 언급한다. 마찬가지로, 대사 생화학, 효소학 및 게놈학의 널리 공지된 분야를 고려하면, 본원에서 유전자 또는 인코딩 핵산에 대한 언급은 또한, 상응하는 인코딩된 효소 및 이를 촉매화하는 반응뿐만 아니라 반응물 및 반응 생성물에 대한 언급을 구성한다.

비천연 미생물 유기체는 하나 이상의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로에 참여하는 효소들 중 하나 이상을 인코딩하는 발현 가능한 핵산을 도입함으로써 제조될 수 있다. 생합성을 위해 선택된 숙주 미생물 유기체에 따라, 특정 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 중 일부 또는 모두에 대한 핵산이 발현될 수 있다. 예를 들어, 선택된 숙주에서 원하는 생합성 경로를 위한 하나 이상의 효소가 결핍된 경우에, 결핍된 효소(들)에 대한 발현 가능한 핵산은 후속 외인성 발현을 위해 숙주 내에 도입된다. 대안적으로, 선택된 숙주가 일부 경로 유전자의 내인성 발현을 나타내지만, 다른 것이 결핍된 경우에, 인코딩 핵산은 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성을 달성하기 위해 결핍된 효소(들)에 대해 요구된다. 이에 따라, 비천연 미생물 유기체는 원하는 생합성 경로를 얻기 위해 외인성 효소 활성을 도입함으로써 제조될 수 있거나, 원하는 생합성 경로는 하나 이상의 내인성 효소와 함께, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산과 같은 원하는 산물을 제조하는 하나 이상의 외인성 효소 활성을 도입함으로써 얻어질 수 있다.

선택된 숙주 미생물 유기체의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 구성성분에 따라, 비천연 미생물 유기체는 적어도 하나의 외인성으로 발현된 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로-인코딩 핵산 및 최대 모든, 하나 이상의 아디페이트, 6-아미노카프로산 또는 카프로락탐 생합성 경로에 대한 인코딩 핵산을 포함할 것이다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성은 상응하는 인코딩 핵산의 외인성 발현을 통해 경로 효소에서 결핍된 숙주에서 확립될 수 있다. 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로의 모든 효소가 결핍된 숙주에서, 경로에서 모든 효소의 외인성 발현이 포함될 수 있지만, 숙주가 경로 효소들 중 적어도 하나를 함유하는 경우에도 경로의 모든 효소가 발현될 수 있는 것으로 이해된다.

본원에 제공된 교시 및 지침을 고려하면, 당업자는 발현 가능한 형태로 도입하는 인코딩 핵산의 수가 적어도, 선택된 숙주 미생물 유기체의 아디페이트, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 결점과 적어도 아주 유사할 것임을 이해할 것이다. 이에 따라, 비천연 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로를 구성하는 상기 효소를 인코딩하는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12, 최대 모든 핵산을 가질 수 있다. 일부 구현예에서, 비천연 미생물 유기체는 또한, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성을 촉진시키거나 최적화하거나 숙주 미생물 유기체 상에 다른 유용한 기능을 부여하는 다른 유전적 변형을 포함할 수 있다. 하나의 이러한 다른 작용성은 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 전구체 중 하나 이상, 예를 들어, 아디페이트 합성의 경우에 숙시닐-CoA 및/또는 아세틸-CoA, 또는 본원에 개시된 아디페이트 경로 효소를 포함하는, 6-아미노카프로산 또는 카프로락탐 합성의 경우에 아디필-CoA 또는 아디페이트, 또는 6-아미노카프리오에이트 합성의 경우에 피루베이트 및 숙신 세미알데하이드, 글루타메이트, 글루타릴-CoA, 호모라이신 또는 2-아미노-7-옥소수바레이트, 또는 헥사메틸렌디아민 합성의 경우에 6-아미노카프로에이트, 글루타메이트, 글루타릴-CoA, 피루베이트 및 4-아미노부타날, 또는 2-아미노-7-옥소수바레이트를 포함하는, 이의 합성의 증대를 포함할 수 있다.

일부 구현예에서, 비천연 미생물 유기체는 아디페이트 세미알데하이드와 반응하여 6ACA를 형성하고, 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 적어도 25, 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 50% 아미노산 서열 일치성을 갖는 아미노산 서열을 포함하는 트랜스아미나아제로부터 선택된 트랜스아미나아제를 인코딩하는 적어도 하나의 외인성 핵산을 갖는다.

일반적으로, 숙주 미생물 유기체는 자연적으로 제조된 분자로서 또는 원하는 전구체의 새로운 생산 또는 숙주 미생물 유기체에 의해 자연적으로 제조된 전구체의 증가된 생산을 제공하는 조작된 산물로서, 6-아미노카프로산, 카프로락탐, 또는 헥사메틸렌디아민 경로의 전구체를 제조하도록 선택된다. 숙주 유기체는 본원에 개시된 바와 같이, 전구체의 제조를 증가시키기 위해 조작될 수 있다. 또한, 원하는 전구체를 제조하기 위해 조작된 미생물 유기체는 숙주 유기체로서 사용될 수 있고, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로의 효소 또는 단백질을 발현시키기 위해 추가로 조작될 수 있다.

일부 구현예에서, 비천연 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 합성하는 효소 능력을 함유하는 숙주로부터 발생된다. 이러한 특정 구현예에서, 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 제조를 위한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 반응을 유도하기 위해, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 산물의 합성 또는 축적을 증가시키는 것이 유용할 수 있다. 합성 또는 축적 증가는 예를 들어, 상술된 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소 중 하나 이상을 인코딩하는 핵산의 과발현에 의해 달성될 수 있다. 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소 또는 효소들의 과발현은 예를 들어, 내인성 유전자 또는 유전자들의 외인성 발현을 통해, 또는 이종 유전자 또는 유전자들의 외인성 발현을 통해 일어날 수 있다. 이에 따라, 자연 발생 유기체는 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 효소를 인코딩하는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 즉 최대 모든 핵산의 과발현을 통해 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하는, 비천연 미생물 유기체이도록 용이하게 발생될 수 있다. 또한, 비천연 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로에서 효소의 활성을 증가시키는 내인성 유전자의 돌연변이 유발에 의해 생성될 수 있다.

특히 유용한 구현예에서, 인코딩 핵산의 외인성 발현이 사용된다. 외인성 발현은 사용자에 의해 제어된 원하는 발현 수준을 달성하기 위해 발현 및/또는 조절 요소를 숙주 및 적용에 맞춤화할 수 있는 능력을 부여한다. 그러나, 내인성 발현은 또한, 다른 구현예에서, 유도 가능한 프로모터 또는 다른 조절 요소에 연결될 때 유전자의 프로모터의 유도 또는 음성 조절 이펙터를 제거함으로써 사용될 수 있다. 이에 따라, 자연 발생 유도 가능한 프로모터를 갖는 내인성 유전자는 적절한 유도제를 제공함으로써 상향-조절될 수 있거나, 내인성 유전자의 조절 영역은 유도 가능한 조절 요소를 도입하기 위해 조작되어, 원하는 시간에 내인성 유전자의 발현 증가를 조절할 수 있다. 유사하게는, 유도 가능한 프로모터는 비천연 미생물 유기체 내에 도입된 외인성 유전자에 대한 조절 구성요소로서 포함될 수 있다.

일부 구현예에서, 비천연 미생물 유기체는 하나 이상의 유전자 파괴를 포함하며, 여기서, 유기체는 6-ACA, 아디페이트 및/또는 HMDA를 제조한다. 유전자 파괴가 비천연 유기체 상에 아디페이트, 6-ACA 및/또는 HMDA의 제조 증가를 부여하도록, 유전자 파괴가 효소의 활성을 감소시킬 때 유기체의 성장에 대한 아디페이트, 6-ACA 및/또는 HMDA의 제조를 커플링시키는 효소를 인코딩하는 효소에서 일어난다. 이에 따라, 일부 구현예에서, 단백질을 인코딩하는 유전자에서 발생하는 하나 이상의 유전자 파괴를 포함하는 비천연 미생물 유기체, 또는 하나 이상의 유전자 파괴가 유기체에서 아디페이트, 6-ACA 및/또는 HMDA의 제조 증가를 부여하는 효소가 제공된다. 본원에 개시된 바와 같이, 이러한 유기체는 아디페이트, 6-ACA 및/또는 HMDA의 제조를 위한 경로를 함유한다.

방법에서, 임의의 하나 이상의 외인성 핵산이 비천연 미생물 유기체를 제조하기 위해 미생물 유기체 내에 도입될 수 있는 것으로 이해된다. 핵산은 예를 들어, 미생물 유기체 상에 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로를 부여하기 위해 도입될 수 있다. 대안적으로, 인코딩 핵산은 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 능력을 부여하기 위해 원하는 반응들 중 일부를 촉매화하는 생합성 능력을 갖는 중간 미생물 유기체를 제조하기 위해 도입될 수 있다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로를 갖는 비천연 미생물 유기체는 원하는 효소를 인코딩하는 적어도 2개의 외인성 핵산을 포함할 수 있다. 아디페이트 제조의 경우에, 적어도 2개의 외인성 핵산은 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제 및 3-하이드록시아실-CoA 데하이드로게나아제, 또는 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제 및 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제, 또는 3-하이드록시아디필-CoA 및 아디페이트 세미알데하이드 트랜스미나아제, 또는 3-하이드록시아실-CoA 및 아디필-CoA 신타아제 등의 조합과 같은 효소를 인코딩할 수 있다. 카프로락탐 제조의 경우에, 적어도 2개의 외인성 핵산은 CoA-의존 트랜스-에노일-CoA 리덕타아제 및 트랜스아미나아제, 또는 CoA-의존 트랜스-에노일-CoA 리덕트랜스아미나아제 및 아미도하이드롤라아제, 또는 트랜스아미나아제 및 아미도하이드롤라아제의 조합과 같은 효소를 인코딩할 수 있다. 6-아미노카프로산 제조의 경우에, 적어도 2개의 외인성 핵산은 4-하이드록시-2-옥소헵탄-1,7-디오에이트(HODH) TA올라아제 및 2-옥소헵트-4-엔-1,7-디오에이트(OHED) 하이드라트랜스아미나아제, 또는 2-옥소헵트-4-엔-1,7-디오에이트(OHED) 하이드라트랜스아미나아제 및 2-아미노헵탄-1,7-디오에이트(2-AHD) 데카복실라아제, 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제 및 아디필-CoA 데하이드로게나아제, 글루타밀-CoA 트랜스퍼라아제 및 6-아미노피멜로일-CoA 하이드롤라아제, 또는 글루타릴-CoA 베타-케토티올라아제 및 3-아미노피멜레이트 2,3-아미노트랜스아미나아제의 조합과 같은 효소를 인코딩할 수 있다. 헥사메틸렌디아민 제조의 경우에, 적어도 2개의 외인성 핵산은 6-아미노카프로에이트 키나아제 및 [(6-아미노헥사노일)옥시]포스포네이트(6-AHOP) 옥시도리덕트랜스아미나아제, 또는 6-아세트아미도헥사노에이트 키나아제 및 [(6-아세트아미도헥사노일)옥시]포스포네이트(6-AAHOP) 옥시도리덕트랜스아미나아제, 6-아미노카프로에이트 N-아세틸트랜스퍼라아제 및 6-아세트아미도헥사노일-CoA 옥시도리덕트랜스아미나아제, 3-하이드록시-6-아미노피멜로일-CoA 데하이드라트랜스아미나아제 및 2-아미노-7-옥소헵타노에이트 아미노트랜스퍼라아제, 또는 3-옥소피멜로일-CoA 리가아제 및 호모라이신 데카복실라아제의 조합과 같은 효소를 인코딩할 수 있다. 이에 따라, 생합성 경로의 2개 이상의 효소의 임의의 조합이 비천연 미생물 유기체에 포함될 수 있는 것으로 이해된다.

유사하게는, 생합성 경로의 3개 이상의 효소의 임의의 조합이 비천연 미생물 유기체에 포함될 수 있는 것으로 이해되며, 예를 들어, 아디페이트 제조의 경우에, 원하는 생합성 경로의 효소들의 조합이 상응하는 원하는 산물을 제조하는 한, 원하는 경우, 효소 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-하이드록시아실-CoA 데하이드로게나아제, 및 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제; 또는 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-하이드록시아실-CoA 데하이드로게나아제 및 아디페이트 세미알데하이드 데하이드로리덕트랜스아미나아제; 또는 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-하이드록시아실-CoA 데하이드로게나아제 및 아디필-CoA 신테트랜스아미나아제; 또는 3-하이드록시아실-CoA 데하이드로게나아제, 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제 및 아디필-CoA: 아세틸-CoA 트랜스퍼라아제 등의 조합이 비천연 미생물 유기체에 포함될 수 있는 것으로 이해된다. 6-아미노카프로산 제조의 경우에, 적어도 3개의 외인성 핵산은 4-하이드록시-2-옥소헵탄-1,7-디오에이트(HODH) TA올라아제, 2-옥소헵트-4-엔-1,7-디오에이트(OHED) 하이드라트랜스아미나아제 및 2-옥소헵탄-1,7-디오에이트(2-OHD) 데카복실라아제, 또는 2-옥소헵트-4-엔-1,7-디오에이트(OHED) 하이드라트랜스아미나아제, 2-아미노헵트-4-엔-1,7-디오에이트(2-AHE) 리덕트랜스아미나아제 및 2-아미노헵탄-1,7-디오에이트(2-AHD) 데카복실라아제, 또는 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제, 2,3-데하이드로아디필-CoA 리덕트랜스아미나아제 및 아디필-CoA 데하이드로게나아제, 또는 6-아미노-7-카복시헵트-2-에노일-CoA 리덕트랜스아미나아제, 6-아미노피멜로일-CoA 하이드롤라아제 및 2-아미노피멜레이트 데카복실라아제, 또는 글루타릴-CoA 베타-케토티올라아제, 3-아민화 옥시도리덕트랜스아미나아제 및 2-아미노피멜레이트 데카복실라아제, 또는 3-옥소아디필-CoA 티올라아제, 5-카복시-2-펜테노에이트 리덕트랜스아미나아제 및 아디페이트 리덕트랜스아미나아제의 조합과 같은 효소를 인코딩할 수 있다. 헥사메틸렌디아민 제조의 경우에, 적어도 3개의 외인성 핵산은 6-아미노카프로에이트 키나아제, [(6-아미노헥사노일)옥시]포스포네이트(6-AHOP) 옥시도리덕트랜스아미나아제 및 6-아미노카프로 세미알데하이드 아미노트랜스퍼라아제, 또는 6-아미노카프로에이트 N-아세틸트랜스퍼라아제, 6-아세트아미도헥사노에이트 키나아제 및 [(6-아세트아미도헥사노일)옥시]포스포네이트(6-AAHOP) 옥시도리덕트랜스아미나아제, 또는 6-아미노카프로에이트 N-아세틸트랜스퍼라아제, [(6-아세트아미도헥사노일)옥시]포스포네이트(6-AAHOP) 아실트랜스퍼라아제 및 6-아세트아미도헥사노일-CoA 옥시도리덕트랜스아미나아제, 또는 3-옥소-6-아미노피멜로일-CoA 옥시도리덕트랜스아미나아제, 3-하이드록시-6-아미노피멜로일-CoA 데하이드라트랜스아미나아제 및 호모라이신 데카복실라아제, 또는 2-옥소-4-하이드록시-7-아미노헵타노에이트 TA올라아제, 2-옥소-7-아미노헵트-3-에노에이트 리덕트랜스아미나아제 및 호모라이신 데카복실라아제, 또는 6-아세트아미도헥사노에이트 리덕트랜스아미나아제, 6-아세트아미도헥사날 아미노트랜스퍼라아제 및 6-아세트아미도헥산아민 N-아세틸트랜스퍼라아제의 조합과 같은 효소를 인코딩할 수 있다. 유사하게는, 본원에 개시된 생합성 경로의 4개 이상의 효소의 임의의 조합은 원하는 생합성 경로의 효소들의 조합이 상응하는 원하는 산물을 제조하는 한, 원하는 경우에, 비천연 미생물 유기체에 포함될 수 있다.

본원에 기술된 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성 이외에, 비천연 미생물 유기체 및 방법은 서로 및 다른 경로에 의해 생성물 생합성을 달성하기 위한 당분야에 널리 공지된 다른 미생물 유기체 및 방법과의 다양한 조합으로 사용될 수 있다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자의 사용을 제외하고 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산를 제조하는 하나의 대안예는 아디페이트, 6-아미노카프로산 또는 카프로락탐 경로 중간체를 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산으로 전환시킬 수 있는 다른 미생물 유기체의 첨가를 통하는 것이다. 하나의 이러한 절차는 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체를 제조하는 미생물 유기체의 발효를 포함한다. 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체는 이후에, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체를 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산으로 전환시키는 제2 미생물 유기체에 대한 기질로서 사용될 수 있다. 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체는 제2 유기체의 다른 배양물에 직접적으로 첨가될 수 있거나, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체 제조업체의 본래 배양물에는 예를 들어, 세포 분리에 의해 이러한 미생물 유기체가 결여될 수 있으며, 이후에, 발효 브로스에 제2 유기체의 후속 첨가는 중간체 정제 단계 없이 최종 산물을 제조하기 위해 사용될 수 있다.

다른 구현예에서, 비천연 미생물 유기체 및 방법은 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 달성하기 위해 매우 다양한 하위 경로에서 어셈블링될 수 있다. 이러한 구현예에서, 원하는 산물을 위한 생합성 경로는 상이한 미생물 유기체로 구분될 수 있으며, 상이한 미생물 유기체는 최종 산물을 제조하기 위해 공동-배양될 수 있다. 이러한 생합성 방식에서, 하나의 미생물 유기체의 산물은 최종 산물이 합성될 때까지 제2 미생물 유기체에 대한 기질이다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성은 하나의 경로 중간체의 다른 경로 중간체 또는 산물로의 전환을 위한 생합성 경로를 함유하는 미생물 유기체를 작제화함으로써 달성될 수 있다. 대안적으로, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산은 또한, 동일한 용기에서 2개의 유기체를 사용하여 공동-배양 또는 공동-발효를 통해 미생물 유기체로부터 생합성적으로 제조될 수 있으며, 여기서, 제1 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 중간체를 제조하며, 제2 미생물 유기체는 중간체를 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산으로 전환시킨다.

본원에 제공된 교시 및 지침을 고려하면, 당업자는, 매우 다양한 조합 및 순열이 다른 미생물 유기체, 하위 경로를 갖는 다른 비천연 미생물 유기체의 공동-배양, 및 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하기 위한 당해 분야에 널리 공지된 다른 화학적 및/또는 생화학적 절차의 조합과 함께 비천연 미생물 유기체 및 방법에 대해 존재한다는 것을 이해할 것이다.

유사하게는, 숙주 유기체가 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 증가시키기 위해 하나 이상의 유전자 파괴의 도입을 위한 원하는 특징을 기초로 하여 선택될 수 있다는 것이 당업자에 의해 이해된다. 이에 따라, 유전적 변형이 유전자를 파괴하기 위해 숙주 유기체 내에 도입되는 경우에, 유사하지만 동일하지 않은 대사 반응을 촉매화하는 임의의 동족체, 오르소로그 유전자 또는 유사체가 유사하게, 원하는 대사 반응이 충분히 파괴되도록 유사하게 파괴될 수 있다는 것이 이해된다. 상이한 유기체 간의 대사 네트워크 사이에 특정 차이가 존재하기 때문에, 당업자는 제공된 유기체에서 파괴된 실제 유전자가 유기체들 간에 상이할 수 있다는 것을 이해할 것이다. 그러나, 본원에 제공된 교시 및 지침을 고려하면, 당업자는 또한, 방법이 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성을 증가시키는 고려되는 종에서 유기체를 작제화하는 데 필요한 동족 대사 변경을 식별하기 위해 임의의 적합한 숙주 미생물에 적용될 수 있다는 것을 이해할 것이다. 특정 구현예에서, 제조 증가는 유기체의 성장에 대한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 커플링하고, 원하는 경우에 및 본원에 개시된 바와 같이 유기체의 성장에 대한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 필수적으로 커플링시킬 수 있다.

6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소를 위한 핵산을 인코딩하는 소스는 예를 들어, 인코딩된 유전자 산물이 언급된 반응을 촉매화할 수 있는 임의의 종을 포함할 수 있다. 이러한 종은 고세균 및 진정세균을 포함하는 박테리아, 및 효소, 식물, 곤충, 동물, 및 인간을 포함하는 포유동물을 포함하는 진핵 세포를 포함하지만, 이로 제한되지 않는 원핵 및 진핵 유기체 둘 모두를 포함한다. 일부 구현예에서, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소에 대한 인코딩 핵산의 소스는 표 4에 나타나 있다. 일부 구현예에서, 트랜스아미나아제 효소에 대한 인코딩 핵산의 소스는 표 4에 나타나 있다. 일부 구현예에서, 트랜스아미나아제 효소에 대한 인코딩 핵산의 소스에는 아크로모박터(Achromobacter) 속, 아시다미노코쿠스(Acidaminococcus), 콜린셀라(Collinsella), 펩토스트렙토코카세애(Peptostreptococcaceae), 패나르트로박터(Paenarthrobacter) 또는 롬보우스트시아(Romboustsia)가 있다. 일부 구현예에서, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소에 대한 인코딩 핵산의 소스는 에셔리키아 콜라이(Escherichia coli), 에셔리키아 콜라이 str. K12(Escherichia coli str. K12), 에셔리키아 콜라이 C(Escherichia coli C), 에셔리키아 콜라이 W(Escherichia coli W), 슈도모나스 sp(Pseudomonas sp), 슈도모나스 내크무시이(Pseudomonas knackmussii), 슈도모나스 sp. 균주 B13(Pseudomonas sp. Strain B13), 슈도모나스 푸티다(Pseudomonas putida), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 스튜트제리(Pseudomonas stutzeri), 슈도모나스 멘도시나(Pseudomonas mendocina), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris), 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 비브리오 콜레라(Vibrio cholera), 헬리오박터 피로리(Heliobacter pylori), 클렙시엘라 뉴모니애(Klebsiella pneumoniae), 세라티아 프로테아마쿨란스(Serratia proteamaculans), 스트렙토마이세스 sp. 2065(Streptomyces sp. 2065), 슈도모나스 에루지노사(Pseudomonas aeruginosa), 슈도모나스 에루지노사 PAO1(Pseudomonas aeruginosa PAO1), 랄스토니아 유트로파(Ralstonia eutropha), 랄스토니아 유트로파 H16(Ralstonia eutropha H16), 클로스트리듐 아세토부틸리쿰(Clostridium acetobutylicum), 유글레나 그라실리스(Euglena gracilis), 트레포네마 덴티콜라(Treponema denticola), 클로스트리듐 클루이베리(Clostridium kluyveri), 호모 사피엔스(Homo sapiens), 라투스 노르베기쿠스(Rattus norvegicus), 아시네토박터 sp. ADP1(Acinetobacter sp. ADP1), 아시네토박터 sp. 균주 M-1(Acinetobacter sp. Strain M-1), 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor), 유박테리움 바르케리(Eubacterium barkeri), 펩토스트렙토코쿠스 아사카롤리티쿠스(Peptostreptococcus asaccharolyticus), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 보툴리눔 A3 str(Clostridium botulinum A3 str), 클로스트리듐 티로부티리쿰(Clostridium tyrobutyricum), 클로스트리듐 파스테우리아눔(Clostridium pasteurianum), 클로스트리듐 써모아세티쿰(Clostridium thermoaceticum)(무렐라 써모아세티쿰(Moorella thermoaceticum)), 무렐라 테르모아세티카 아시네토박터 칼코아세티쿠스(Moorella thermoacetica Acinetobacter calcoaceticus), 무스 무스쿨루스(Mus musculus), 수스 스크로파(Sus scrofa), 플라보박테리움 sp(Flavobacterium sp), 아르트로박터 아우레센스(Arthrobacter aurescens), 페니실리움 크리소게눔(Penicillium chrysogenum), 아스페르길루스 니제르(Aspergillus niger), 아스페르길루스 니둘란스(Aspergillus nidulans), 바실루스 서브틸리스(Bacillus subtilis), 사카로마이세스 세레비시애(Saccharomyces cerevisiae), 자이모모나스 모빌리스(Zymomonas mobilis), 만헤이미아 숙시니프로듀센스(Mannheimia succiniciproducens), 클로스트리듐 리운그다흘리이(Clostridium ljungdahlii), 클로스트리듐 카복시디보란스(Clostridium carboxydivorans), 게오바실러스 스테아로테르모필루스(Geobacillus stearothermophilus), 아그로박테리움 튜메파시엔스(Agrobacterium tumefaciens), 아크로모박터 자일로속시단스(xylosoxidans), 아크로모박터 데니트리피칸스(Achromobacter denitrificans), 아라비돕시스 탈리아나(Arabidopsis thaliana), 해모필루스 인플루엔재(Haemophilus influenzae), 아시다미노코쿠스 페르멘탄스(Acidaminococcus fermentans), 클로스트리듐 sp. M62/1(Clostridium sp. M62/1), 푸소박테리움 누클레아툼(Fusobacterium nucleatum), 보스 타우루스(Bos taurus), 주글로에아 라미게라(Zoogloea ramigera), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 클로스트리듐 베이제린키이(Clostridium beijerinckii), 메탈로스파에라 세둘라(Metallosphaera sedula), 테르모아내로박터(Thermoanaerobacter) 종, 테르모아내로박터 브록키이(Thermoanaerobacter brockii), 아시네토박터 바일리(Acinetobacter baylyi), 포르피로모나스 깅기발리스(Porphyromonas gingivalis), 류코노스톡 메센테로이데스(Leuconostoc mesenteroides), 술폴로부스 토코다이이(Sulfolobus tokodaii), 술폴로부스 토코다이이 7(Sulfolobus tokodaii 7), 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus), 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus), 술폴로부스 아시도칼다리우스(Sulfolobus acidocaldarius), 살모넬라 티피무륨(Salmonella typhimurium), 살모넬라 엔테리카(Salmonella enterica), 테르모토가 마리티마(Thermotoga maritima), 할로박테리움 살리나룸(Halobacterium salinarum), 바실루스 세레우스(Bacillus cereus), 클로스트리듐 디피실(Clostridium difficile), 알칼리필루스 메탈리레디게네스(Alkaliphilus metalliredigenes), 테르모아내로박터 텡콘게네시스(Thermoanaerobacter tengcongensis), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 헬리코박터 피로리(Helicobacter pylori), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 클로스트리듐 사카로페르부틸아세토니쿰(Clostridium saccharoperbutylacetonicum), 슈도모나스 클로로라피스(Pseudomonas chlororaphis), 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus), 캄필로박터 제주니(Campylobacter jejuni), 테르무스 테르모필루스(Thermus thermophilus), 팰로토말쿨룸 테르모프로피오니쿰(Pelotomaculum thermopropionicum), 박테로이데스 카필로수스(Bacteroides capillosus), 아나에로트룬쿠스 콜리호미니스(Anaerotruncus colihominis), 나트라나에로비우스 테르모필루스(Natranaerobius thermophilius), 아르카에오글로부스 풀기두스(Archaeoglobus fulgidus), 아르카에오글로부스 풀기두스 DSM 4304(Archaeoglobus fulgidus DSM 4304), 할로아르쿨라 마리스모르투이(Haloarcula marismortui), 피로바쿨룸 아에로필룸(Pyrobaculum aerophilum), 피로바쿨룸 아에로필룸 str. IM2(Pyrobaculum aerophilum str. IM2), 니코티아나 타바쿰(Nicotiana tabacum), 멘테 피페리타(Menthe piperita), 피누스 타에다(Pinus taeda), 호르데움 불가레(Hordeum vulgare), 제아 메이스(Zea mays), 로도코쿠스 오파쿠스(Rhodococcus opacus), 큐프리아비두스 네카토르(Cupriavidus necator), 브라디리조비움 자포니쿰(Bradyrhizobium japonicum), 브라디리조비움 자포니쿰 USDA110(Bradyrhizobium japonicum USDA110), 아스카리우스 수움(Ascarius suum), 부티레이트-제조 박테리움 L2-50, 바실루스 메가테리움(Bacillus megaterium), 메타노코쿠스 마리팔루디스(Methanococcus maripaludis), 메타노사르시나 마제이(Methanosarcina mazei), 메타노사르시나 마제이(Methanosarcina mazei), 메타노사르시나 바르케리(Methanocarcina barkeri), 메타노칼도코쿠스 잔나스키이(Methanocaldococcus jannaschii), 카에노르하브디티스 엘레간스(Caenorhabditis elegans), 레이스마니아 마조르(Leishmania major), 메틸로미크로븀 알칼리필룸 20Z(Methylomicrobium alcaliphilum 20Z), 크로모할로박터 살렉시겐스(Chromohalobacter salexigens), 아르카에글루부스 풀기두스(Archaeglubus fulgidus), 클라미도모나스 레인하르드티이(Chlamydomonas reinhardtii), 트리코모나스 바기날리스 G3(trichomonas vaginalis G3), 트리파노소마 브루세이(Trypanosoma brucei), 미코플라나 라모스(Mycoplana ramose), 미크로코쿠스 루테아스(Micrococcus luteas), 아세토박터 파스테우리안스(Acetobacter pasteurians), 클루베로마이세스 락티스(Kluyveromyces lactis), 메소리조비움 로티(Mesorhizobium loti), 락토코쿠스 락티스(Lactococcus lactis), 리시니바실루스 스파에리쿠스(Lysinibacillus sphaericus), 칸디다 보이디니이(Candida boidinii), 칸디다 알비칸스 SC5314(Candida albicans SC5314), 버크홀데리아 암비파리아 AMMD(Burkholderia ambifaria AMMD), 아스카리스 수운(Ascaris suun), 아시네토박터 바우마니이(Acinetobacter baumanii), 아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus), 버크홀데리아 피마툼(Burkholderia phymatum), 칸디다 알비칸스(Candida albicans), 클로스트리듐 서브테르미날레(Clostridium subterminale), 큐프리아비두스 타이와넨시스(Cupriavidus taiwanensis), 플라보박테리움 루테센스(Flavobacterium lutescens), 라칸세아 클루이베리(Lachancea kluyveri), 락토바실루스 sp. 30a(Lactobacillus sp. 30a), 렙토스피라 인테로간스(Leptospira interrogans), 무렐라 테르모아세티카(Moorella thermoacetica), 믹소코쿠스 잔투스(Myxococcus xanthus), 니코티아나 글루티노사(Nicotiana glutinosa), 노카르디아 아이오웬시스(Nocardia iowensis)(sp. NRRL 5646), 슈도모나스 레이네케이 MT1(Pseudomonas reinekei MT1), 랄스토니아 유트로파 JMP134(Ralstonia eutropha JMP134), 랄스토니아 메탈리두란스(Ralstonia metallidurans), 로도코쿠스 조스티이(Rhodococcus jostii), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 셀레노모나스 루미난티움(Selenomonas ruminantium), 스트렙토마이세스 클라불리게누스(Streptomyces clavuligenus), 신트로푸스 아시디트로피쿠스(Syntrophus aciditrophicus), 비브리오 파라해몰리티쿠스(Vibrio parahaemolyticus), 비브리오 불니피쿠스(Vibrio vulnificus) 뿐만 아니라 상응하는 유전자에 대한 본원에 개시되거나 소스 유기체로서 입수 가능한 다른 대표적인 종(실시예 참조)과 같은 종이다. 그러나, 395개의 미생물 게놈 및 다양한 효모, 진균, 식물, 및 포유류 게놈을 포함하는, 현재 550개 초과의 종에 대해 이용 가능한 완전 게놈 서열(NCBI와 같은 공개 데이터베이스에서 입수 가능한 것들 중 절반 이상)과 함께, 예를 들어, 공지된 유전자의 동종, 오르소로그, 파라로그 및 비-오르소로그 유전자 변위 및 유기체 간의 유전적 변경의 상호교환을 포함하는, 관련되거나 별개의 종에서의 하나 이상의 유전자에 대한 필요한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 활성을 인코딩하는 유전자의 식별은 일반적이고, 당분야에 널리 공지되어 있다. 이에 따라, E. 콜라이와 같은 특정 유기체와 관련하여 본원에 기술된 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 가능하게 하는 대사 변경은 원핵 유기체 및 진핵 유기체 모두를 포함하는 다른 미생물에 용이하게 적용될 수 있다. 본원에 제공된 교시 및 지침을 고려하면, 당업자는 하나의 유기체에서 예시된 대사 변경이 다른 유기체에 동일하게 적용될 수 있다는 것을 인지할 것이다.

일부 경우에, 예를 들어, 관련되지 않은 종에서 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로가 존재할 때, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성은 예를 들어, 언급된 반응을 대체하기 위해 유사한, 그러나 동일하지 않은 대사 반응을 촉매화하는 관련되지 않은 종으로부터 유사체 또는 유사체들의 외인성 발현에 의해 숙주 종 상에 부여될 수 있다. 대사 네트워크 간의 특정 차이가 상이한 유기체 간에 존재하기 때문에, 당업자는, 상이한 유기체들 간의 실제 유전자 사용방법이 상이할 수 있다는 것을 이해할 것이다. 그러나, 본원에 제공된 교시 및 지침을 고려하여, 당업자는 또한, 교시 및 방법이 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 합성하는 고려되는 종에서 미생물 유기체를 작제화하기 위해 본원에 예시된 것에 대한 동족 대사 변경을 이용하여 모든 미생물 유기체에 적용될 수 있다는 것을 이해할 것이다.

숙주 미생물 유기체는 예를 들어, 박테리아, 효모, 진균 또는 발효 과정에 적용 가능한 임의의 다양한 다른 미생물에서 생성된 비천연 미생물 유기체로부터 선택될 수 있다. 대표적인 박테리아는 에셔리키아 콜라이(Escherichia coli), 클렙시엘라 옥시토카(Klebsiella oxytoca), 아나에로바이오스필리룸 숙시니프로듀센스(Anaerobiospirillum succiniciproducens), 악티노바실러스 숙시노게네스(Actinobacillus succinogenes), 만헤이미아 숙시니프로듀센스(Mannheimia succiniciproducens), 리조비움 에틀리(Rhizobium etli), 바실루스 서브틸리스(Bacillus subtilis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 글루코노박터 옥시단스(Gluconobacter oxydans), 자이모모나스 모빌리스(Zymomonas mobilis), 락토코쿠스 락티스(Lactococcus lactis), 락토바실루스 플란타룸(Lactobacillus plantarum), 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor), 클로스트리듐 아세토부틸리쿰(Clostridium acetobutylicum), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 및 슈도모나스 푸티다(Pseudomonas putida)로부터 선택된 종을 포함한다. 대표적인 효모 또는 진균은 사카로마이세스 세레비시애(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 클루베로마이세스 락티스(Kluyveromyces lactis), 클루베로마이세스 마르시아누스(Kluyveromyces marxianus), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 니제르(Aspergillus niger), 피키아 파스토리스(Pichia pastoris), 리조푸스 아리주스(Rhizopus arrhizus), 리조부스 오리재(Rhizobus oryzae) 등으로부터 선택된 종을 포함한다. 예를 들어, E. 콜라이는 특히 유용한 숙주 유기체인데, 왜냐하면, 이러한 것이 유전적 조작을 위해 적합한 널리 특징된 미생물 유기체이기 때문이다. 다른 특히 유용한 숙주 유기체는 사카로마이세스 세레비시애와 같은 효모를 포함한다. 임의의 적합한 미생물 숙주 유기체가 원하는 산물을 제조하기 위해 대사 및/또는 유전적 변형을 도입하기 위해 사용될 수 있는 것으로 이해된다.

비천연 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산-제조 숙주의 발현 수준을 구성하고 시험하기 위한 방법은 예를 들어, 당분야에 널리 공지된 재조합 및 검출 방법에 의해 수행될 수 있다. 이러한 방법은 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); and Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)]에 기술된 문헌에서 확인될 수 있다.

6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 위한 경로에 포함된 외인성 핵산 서열은 비제한적으로, 컨쥬게이션, 전기천공, 화학적 변형, 형질도입, 트랜스펙션, 및 초음파 변형을 포함하는, 당분야에 널리 공지된 기술을 이용하여 숙주 세포에 안정적으로 또는 일시적으로 도입될 수 있다. E. 콜라이 또는 다른 원핵 세포에서의 외인성 발현을 위해, 진핵 핵산의 유전자 또는 cDNA에서의 일부 핵산 서열은 표적화 신호, 예를 들어, N-말단 미토콘드리아 또는 다른 표적화 신호를 인코딩할 수 있으며, 이는 원하는 경우에, 원핵 숙주 세포에서 변형 전에 제거될 수 있다. 예를 들어, 미토콘드리아 리더 서열의 제거는 E. 콜라이의 발현 증가를 초래하였다[Hoffmeister et al., J. Biol. Chem. 280:4329-4338 (2005)]. 효모 또는 다른 진핵 세포에서 외인성 발현을 위해, 유전자는 리더 서열의 첨가 없이 시토솔에서 발현될 수 있거나, 숙주 세포에 대해 적합한 미토콘드리아 표적화 또는 분비 신호와 같은 적합한 표적화 서열의 첨가에 의해 미토콘드리온 또는 다른 소기관에 대해 표적화되거나 분비를 대해 표적화될 수 있다. 이에 따라, 표적화 서열을 제거하거나 포함하기 위한 핵산 서열에 대한 적절한 변형이 원하는 특성을 부여하기 위해 외인성 핵산 서열에 도입될 수 있다는 것이 이해된다. 또한, 유전자는 단백질의 최적화된 발현을 달성하기 위해 당분야에 널리 공지된 기술로 코돈 최적화될 수 있다.

발현 벡터 또는 벡터들은 숙주 유기체에서 기능성인 발현 제어 서열에 작동 가능하게 연결된 본원에서 예시된 하나 이상의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 인코딩 핵산을 포함하도록 작제화될 수 있다. 미생물 숙주 유기체에서 사용하기에 적용 가능한 발현 벡터는 예를 들어, 숙주 염색체 내에 안정한 통합을 위해 작동 가능한 벡터 및 선택 서열 또는 마커를 포함하는, 플라스미드, 파지 벡터, 바이러스 벡터, 에피솜 및 인공 염색체를 포함한다. 추가적으로, 발현 벡터는 하나 이상의 선택 가능한 마커 유전자 및 적절한 발현 제어 서열을 포함할 수 있다. 예를 들어, 항생제 또는 독소에 대한 내성을 제공하거나, 영양요구성 결핍을 보완하거나, 배양 배지에 중요한 영양소를 공급하지 않는 선택 가능한 마커 유전자가 또한 포함될 수 있다. 발현 제어 서열은 당분야에 널리 공지된, 구성적 및 유도성 프로모트랜스아미나아제, 전사 인헨서, 전사 종결자 등을 포함할 수 있다. 2개 이상의 외인성 인코딩 핵산이 공동-발현될 때, 두 핵산 모두는 예를 들어, 단일 발현 벡터 내에 또는 별도의 발현 벡터에 삽입될 수 있다. 단일 벡터 발현에 대하여, 인코딩 핵산은 하나의 공통 발현 제어 서열에 작동 가능하게 연결되거나 하나의 유도성 프로모터 및 하나의 구성적 프로모터와 같은, 상이한 발현 제어 서열에 연결될 수 있다. 대사 또는 합성 경로에 관여된 외인성 핵산 서열의 형질전환은 당분야에 널리 공지된 방법을 이용하여 확인될 수 있다. 이러한 방법은 예를 들어, 핵산 분석, 예를 들어, mRNA의 노턴 블롯 또는 폴리머라아제 연쇄 반응(PCR) 증폭, 또는 유전자 산물의 발현을 위한 면역블롯팅, 또는 도입된 핵산 서열 또는 이의 상응하는 유전자 산물의 발현을 시험하기 위한 다른 적합한 분석 방법을 포함한다. 당업자에 의해, 외인성 핵산이 원하는 산물을 제조하기 위해 충분한 양으로 발현된다는 것이 이해되며, 또한, 발현 수준이 당분야에 널리 공지되고 본원에 개시된 바와 같은 방법을 이용하여 충분한 발현을 얻기 위해 최적화될 수 있다는 것이 이해된다.

일부 구현예에서, 아디페이트, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산과 같은 원하는 중간체 또는 산물을 제조하는 방법이 제공된다. 예를 들어, 아디페이트를 제조하는 방법은 아디페이트를 제조하기에 충분한 기간 동안 및 조건하에서 아디페이트를 제조하기에 충분한 양으로 발현되는 아디페이트 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 아디페이트 경로를 갖는 비천연 미생물 유기체를 배양하는 것을 포함할 수 있으며, 아디페이트 경로는 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-하이드록시아실-CoA 데하이드로게나아제, 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제, 아디페이트 세미알데하이드리덕트랜스아미나아제, 및 아디필-CoA 신테트랜스아미나아제 또는 포스포트랜스아디필라아제/아디페이트 키나아제 또는 아디필-CoA: 아세틸-CoA 트랜스퍼라아제 또는 아디필-CoA 하이드롤라아제를 포함한다. 추가적으로, 아디페이트를 제조하는 방법은 아디페이트 경로, 아디페이트를 제조하기에 충분한 기간 동안 및 조건하에서 아디페이트를 제조하기에 충분한 양으로 발현되는 아디페이트 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 경로, 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-옥소아디필-CoA 트랜스퍼라아제, 3-옥소아디페이트 리덕트랜스아미나아제, 3-하이드록시아디페이트 데하이드라트랜스아미나아제, 및 2-에노에이트 리덕트랜스아미나아제를 포함하는 아디페이트 경로를 갖는 비천연 미생물 유기체를 배양하는 것을 포함할 수 있다.

또한, 6-아미노카프로산을 제조하는 방법은 6-아미노카프로산 경로, 6-아미노카프로산을 제조하기에 충분한 기간 동안 및 조건하에서 6-아미노카프로산을 제조하기에 충분한 양으로 발현된 6-아미노카프로산 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 경로, CoA-의존 트랜스-에노일-CoA 리덕트랜스아미나아제 및 트랜스아미나아제 또는 6-아미노카프로에이트 데하이드로게나아제를 포함하는 6-아미노카프로산 경로를 갖는 비천연 미생물 유기체를 배양하는 것을 포함할 수 있다. 추가적으로, 카프로락탐을 제조하기 위한 방법은 카프로락탐 경로, 카프로락탐을 제조하기에 충분한 기간 동안 및 조건하에서 카프로락탐을 제조하기에 충분한 양으로 발현되는 카프로락탐 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 경로, CoA-의존 알데하이드 데하이드로게나아제, 트랜스아미나아제 또는 6-아미노카프로에이트 데하이드로게나아제, 및 아미도하이드롤라아제를 포함하는 카프로락탐 경로를 갖는 비천연 미생물 유기체를 배양하는 것을 포함할 수 있다.

6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조에 대한 적합한 정제 및/또는 시험 검정은 널리 공지된 방법을 이용하여 수행될 수 있다. 적합한 복제물, 예를 들어, 삼중복제 배양물은 시험되는 각 조작된 균주에 대해 성장될 수 있다. 예를 들어, 조작된 생산 숙주에서 산물 및 부산물 형성이 모니터링될 수 있다. 최종 산물 및 중간체, 및 다른 유기 화합물은 HPLC(고성능 액체 크로마토그래피), GC-MS(가스 크로마토그래피-질량 분광법) 및 LC-MS(액체 크로마토그래피-질량 분광법) 또는 당분야에 널리 공지된 일상적인 절차를 이용한 다른 적합한 분석 방법과 같은 방법에 의해 분석될 수 있다. 발효 브로스에서 산물의 방출은 또한, 배양 상청액으로 시험될 수 있다. 부산물 및 잔류 글루코오스는 예를 들어, 글루코오스 및 알코올에 대한 굴절률 검출기, 및 유기산에 대한 UV 검출기(Lin et al., Biotechnol. Bioeng. 90:775-779 (2005))를 이용한 HPLC, 또는 당분야에 널리 공지된 다른 적합한 검정 및 검출 방법에 의해 정량화될 수 있다. 외인성 DNA 서열로부터의 개개 효소 활성은 또한, 당분야에 널리 공지된 방법을 이용하여 검정될 수 있다.

6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산은 당분야에 널리 공지된 다양한 방법을 이용하여 배양물 중의 다른 성분들과 분리될 수 있다. 이러한 분리 방법은 예를 들어, 연속 액체-액체 추출, 투과증발, 멤브레인 여과, 멤브레인 분리, 역삼투압, 전기투석, 증류, 결정화, 원심분리, 추출 여과, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 흡수 크로마토그래피, 및 한외여과를 포함하는 추출 절차뿐만 아니라 방법을 포함한다. 상기 모든 방법은 당분야에 널리 공지되어 있다.

본원에 기술된 임의의 비천연 미생물 유기체는 생합성 산물을 제조하고/하거나 분비하기 위해 배양될 수 있다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성 제조를 위해 배양될 수 있다.

6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 위해, 재조합 균주는 탄소 소스 및 다른 필수 영양물을 갖는 배지에서 배양된다. 전체 과정의 비용을 감소시키기 위해 발효기에서 혐기성 조건을 유지하는 것이 때때로 바람직하고 매우 바람직할 수 있다. 이러한 조건은 예를 들어, 먼저 배지에 질소를 살포하고 이후에 플라스크를 셉텀 및 크림프-캡으로 시일링함으로써 얻어질 수 있다. 성장이 혐기성에서 관찰되지 않은 균주에 대하여, 미세호기성 또는 실질적으로 혐기성 조건은 셉텀에 제한된 통기를 위한 작은 홀을 천공시킴으로써 적용될 수 있다. 대표적인 혐기성 조건은 이전에 기술되었고, 당분야에 널리 공지되어 있다. 대표적인 호기성 및 혐기성 조건은 예를 들어, 미국특허 제7,947,483호(2011년 5월 24일에 발표됨)에 기술되어 있다. 발효는 본원에 개시된 바와 같이, 배치, 유가 또는 연속 방식으로 수행될 수 있다.

원하는 경우에, 배지의 pH는 원하는 pH에서 배양 배지를 유지시키기 위해 필요한 경우에, 염기, 예를 들어, NaOH 또는 다른 염기, 또는 산의 첨가에 의해 원하는 pH, 특히, 중성 pH, 예를 들어, 대략 7의 pH에서 유지될 수 있다. 성장 속도는 분광광도계(600 nm)를 이용하여 광학 밀도를 측정함으로써 결정될 수 있으며, 글루코오스 섭취 속도는 시간에 따라 탄소 소스 고갈을 모니터링함으로써 결정될 수 있다.

성장 배지는 예를 들어, 비천연 미생물에 탄소 소스를 공급할 수 있는 임의의 탄수화물 소스를 포함할 수 있다. 이러한 소스는 예를 들어, 당, 예를 들어, 글루코오스, 자일로오스, 아라비노오스, 갈락토오스, 만노오스, 프룩토오스, 수크로오스 및 전분을 포함한다. 탄수화물의 다른 소스는 예를 들어, 재생 가능한 공급원료 및 바이오매스를 포함한다. 방법에서 공급원료로서 사용될 수 있는 바이오매스의 대표적인 타입은 셀룰로오스 바이오매스, 헤미셀룰로오스 바이오매스 및 리그닌 공급원료 또는 공급원료의 일부를 포함한다. 이러한 바이오매스 공급원료는 예를 들어, 글루코오스, 자일로오스, 아라비노오스, 갈락토오스, 만노오스, 플룩토오스 및 전분과 같은 탄소 소스로서 유용한 탄수화물 기질을 함유한다. 본원에 제공된 교시 및 지침을 고려하면, 당업자는 상기에 예시된 것과는 다른 재생 가능한 공급원료 및 바이오매스가 또한, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 위한 미생물 유기체를 배양하기 위해 사용될 수 있다.

상기에 예시된 것과 같은 재생 가능한 공급 원료 이외에, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민, 또는 레불린산 미생물 유기체는 또한, 이의 탄소 소스로서 합성 가스에 성장을 위해 변형될 수 있다. 이러한 특정 구현예에서, 하나 이상의 단백질 또는 효소는 합성 가스 또는 다른 가스상 탄소 소스의 사용을 위한 대사 경로를 제공하기 위해 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 제조 유기체에서 발현된다.

합성 가스 또는 생산자 가스로도 알려진, 합성 가스는 석탄, 및 농작물 및 잔류물을 포함하는, 바이오매스 물질과 같은 탄소 함유 물질의 가스화의 주요 산물이다. 합성 가스는 주로 H2와 CO의 혼합물이고, 석탄, 석탄 오일, 천연 가스, 바이오매스, 및 폐 유기물을 포함하지만, 이로 제한되지 않는, 임의의 유기 공급원료의 가스화로부터 얻어질 수 있다. 가스화는 일반적으로, 높은 산소에 대한 연료의 비율 하에서 수행된다. 대부분이 H2 및 CO이지만, 합성 가스는 또한, CO2 및 다른 가스를 더 작은 용량으로 포함할 수 있다. 이에 따라, 합성 가스는 가스상 탄소의 비용 효과적인 소스, 예를 들어, CO 및 추가적으로, CO2를 제공한다.

우드-륭달(Wood-Ljungdahl) 경로는 CO 및 H2의 아세틸-CoA 및 다른 산물, 예를 들어, 아세테이트로의 전환을 촉매화한다. CO 및 합성 가스를 사용할 수 있는 유기체는 또한, 일반적으로, 동일한 기본 세트의 효소를 통해 CO2 및 CO2/H2 혼합물을 사용하는 능력 및 우드-륭달 경로에 의해 포함된 형질변환을 갖는다. 미생물에 의한 CO2의 아세테이트로의 H2-의존 전환은 CO가 동일한 유기체에 의해 사용될 수 있고 동일한 경로가 관여된 것을 나타내기 전에 오래 인식되었다. 여러 아세토겐은 필요한 환원 동등물을 공급하기 위해 수소가 존재하는 한, 아세테이트와 같은 CO2 및 생성 화합물의 존재 하에서 성장하는 것을 나타내었다[예를 들어, Drake, Acetogenesis, pp. 3-60 Chapman and Hall, New York, (1994)]. 이는 하기 반응식에 의해 요약될 수 있다:

2 CO2 + 4 H2 + n ADP + n Pi → CH3COOH + 2 H2O + n ATP

이에 따라, 우드-륭달 경로를 지닌 비천연 미생물은 아세틸-CoA 및 다른 원하는 산물의 제조를 위해 또한, CO2 및 H2 혼합물을 사용할 수 있다.

우드-륭달 경로는 당분야에 널리 공지되어 있고, 2개의 분기, 즉, (1) 메틸 분기 및 (2) 카보닐 분기로 분리될 수 있는 12개의 반응으로 이루어진다. 메틸 분기는 합성 가스를 메틸-테트라하이드로폴레이트(메틸-THF)로 전환시키는 반면, 카보닐 분기는 메틸-THF를 아세틸-CoA로 전환시킨다. 메틸 분기에서 반응은 하기 효소에 의해 순서대로 촉매화된다: 페레독신 옥시도리덕트랜스아미나아제, 포르메이트 데하이드로게나아제, 포르밀테트라하이드로폴레이트 신테트랜스아미나아제, 메테닐테트라하이드로폴레이트 사이클로데하이드라트랜스아미나아제, 메틸렌테트라하이드로폴레이트 데하이드로게나아제 및 메틸렌테트라하이드로폴레이트 리덕트랜스아미나아제. 카보닐 분기에서 반응은 하기 효소 또는 단백질에 의해 순서대로 촉매화된다: 코발아미드 코리노이드/철-황 단백질, 메틸트랜스퍼라아제, 일산화탄소 데하이드로게나아제, 아세틸-CoA 신타아제, 아세틸-CoA 신타아제 디설파이드 리덕트랜스아미나아제 및 하이드로게나아제, 및 이러한 효소는 또한, 메틸테트라하이드로폴레이트로도 지칭될 수 있음: 코리노이드 단백질 메틸트랜스퍼라아제(예를 들어, AcsE), 코리노이드 철-황 단백질, 니켈-단백질 어셈블리 단백질(예를 들어, AcsF), 페레독신, 아세틸-CoA 신타아제, 일산화탄소 데하이드로게나아제 및 니켈-단백질 어셈블리 단백질(예를 들어, CooC). 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로를 생성하기 위해 상당한 수의 인코딩 핵산을 도입하기 위한 본원에 제공된 교시 및 지침에 따라, 당업자는 동일한 조작 설계가 또한, 적어도, 우드-륭달 효소를 인코딩하는 핵산 또는 숙주 유기체에 존재하지 않는 단백질을 도입하는 것과 관련하여 수행될 수 있음을 이해할 것이다. 이에 따라, 변형된 유기체가 완전 우드-륭달 경로를 함유하게 미생물 유기체 내에 하나 이상의 인코딩 핵산의 도입은 합성 가스 사용 능력을 부여할 것이다.

추가적으로, 일산화탄소 데하이드로게나아제 및/또는 하이드로게나아제 활성과 커플링된 환원성(역) 트리카복실산 사이클은 또한, CO, CO2 및/또는 H2의 아세틸-CoA 및 다른 산물, 예를 들어, 아세테이트로의 전환을 위해 사용될 수 있다. 환원성 TCA 경로를 통해 탄소를 고정시킬 수 있는 유기체는 하기 효소들 중 하나 이상을 사용할 수 있다: ATP 시트레이트-리아제, 시트레이트 리아제, 아코니트랜스아미나아제 이소시트레이트 데하이드로게나아제, 알파-케토글루타레이트: 페레독신 옥시도리덕트랜스아미나아제, 숙시닐-CoA 신테트랜스아미나아제, 숙시닐-CoA 트랜스퍼라아제, 푸마레이트 리덕트랜스아미나아제, 푸마라아제, 말레이트 데하이드로게나아제, NAD(P)페레독신 옥시도리덕트랜스아미나아제, 일산화탄소 데하이드로게나아제, 및 하이드로게나아제. 상세하게는, 일산화탄소 데하이드로게나아제 및 하이드로게나아제에 의해 CO 및/또는 H2로부터 추출된 환원 등가물은 환원성 TCA 사이클을 통해 CO2를 아세틸-CoA 또는 아세테이트에 고정시키기 위해 사용된다. 아세테이트는 효소, 예를 들어, 아세틸-CoA 트랜스퍼라아제, 아세테이트 키나아제/포스포트랜스아세틸라아제, 및 아세틸-CoA 신테트랜스아미나아제에 의해 아세틸-CoA로 전환될 수 있다. 아세틸-CoA는 피루베이트:페레독신 옥시도리덕트랜스아미나아제 및 글루코네오생성 효소에 의해 p-톨루에이트, 테레파탈레이트, 또는 (2-하이드록시-3-메틸-4-옥소부톡시) 포스포네이트 전구체, 글리세르알데하이드-3-포스페이트, 포스포에놀피루베이트, 및 피루베이트로 전환될 수 있다. p-톨루에이트, 테레프탈레이트 또는 (2-하이드록시-3-메틸-4-옥소부톡시) 포스포네이트 경로를 생성하기 위해 충분한 수의 인코딩 핵산을 도입하기 위한 본원에 제공된 교시 및 지침에 따라, 당업자는 동일한 조작 설계가 또한, 적어도, 환원성 TCA 경로 효소 또는 숙주 유기체에 존재하지 않는 단백질을 인코딩하는 핵산을 도입하는 것과 관련하여 수행될 수 있다. 이에 따라, 변형된 유기체가 완전 환원성 TCA 경로를 함유하게 미생물 유기체 내에 하나 이상의 인코딩 핵산의 도입은 합성 가스 사용 능력을 부여할 것이다.

본원에 제공된 교시 및 지침을 고려하면, 당업자는 탄수화물과 같은 탄소 공급원에서 성장하였을 때 생합성된 화합물을 분비하는 비천연 미생물 유기체가 제조될 수 있다는 것을 이해할 것이다. 이러한 화합물은 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로에서 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 및 임의의 중간 대사물을 제조한다. 요구되는 모든 것은 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 중 일부 또는 모두를 포함하는 원하는 화합물 또는 중간체의 생합성을 달성하기 위해 원하는 효소 활성 중 하나 이상을 조작하는 것이다. 이에 따라, 일부 구현예는 탄수화물에서 성장할 때 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하고/하거나 분비하고/하거나 탄수화물에서 성장할 때 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로에서 나타낸 임의의 중간 대사물을 분비하는 비천연 미생물 유기체를 제공한다. 예를 들어, 아디페이트 생산 미생물 유기체는 원하는 경우에, 중간체, 예를 들어, 3-옥소아디필-CoA, 3-하이드록시아디필-CoA, 5-카복시-2-펜테노일-CoA, 또는 아디필-CoA(도 1 참조)로부터 합성을 개시할 수 있다. 또한, 아디페이트 생산 미생물 유기체는 중간체, 예를 들어, 3-옥소아디필-CoA, 3-옥소아디페이트, 3-하이드록시아디페이트, 또는 헥사-2-엔디오에이트로부터 합성을 개시할 수 있다. 6-아미노카프로산 생산 미생물 유기체는 중간체, 예를 들어, 아디페이트 세미알데하이드로부터 합성을 개시할 수 있다. 카프로락탐 생산 미생물 유기체는 원하는 경우에, 중간체, 예를 들어, 아디페이트 세미알데하이드 또는 6-아미노카프로산(도 1 참조)으로부터 합성을 개시할 수 있다.

일부 구현예에서, 비천연 미생물은 도 4 내지 도 9에 도시된 바와 같이 아디페이트, 6ACA, 카프로락톤, 헥사메틸렌디아민 또는 카프로락탐을 생성시킬 수 있다.

일부 구현예에서, 비천연 미생물 유기체는 알데하이드 데하이드로게나아제(ALD) 또는 트랜스에노일 리덕타아제(TER) 또는 둘 모두를 인코딩하는 외인성으로 발현된 핵산을 추가로 포함한다. ALD는 아디페이트 세미알데하이드를 생성하기 위해 아디필-CoA와 반응하며, TER은 5-카복시-2-펜테노일-CoA(CPCoA)와 반응하여 아디필CoA를 형성한다.

일부 구현예에서, ALD 효소는 숙시닐-CoA, 또는 아세틸-CoA, 또는 두 개의 기질 모두와 비교하여 아디필 CoA 기질에 대한 더 큰 촉매 효율 및 활성을 갖는다. 일부 구현예에서, ALD 효소는 표 2에 나타낸 바와 같다.

일부 구현예에서, TER 효소는 하기 표 3에 나타나 있다.

비천연 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하기에 충분한 양으로 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소를 인코딩하는 적어도 하나의 핵산을 외인성으로 발현시키기 위해 본원에 예시된 바와 같은 당분야에 널리 공지된 방법을 이용하여 작제화된다. 본원에 제공된 교시 및 지침에 따라, 비천연 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 달성하여 약 0.1 내지 200 mM 또는 그 이상의 세포내 농도를 야기시킬 수 있다. 일반적으로, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 세포내 농도는 약 3 내지 150 mM, 특히, 약 5 내지 125 mM 및 보다 특히, 약 8 내지 100 mM이며, 약 10 mM, 20 mM, 50 mM, 80 mM, 또는 그 이상을 포함한다. 이러한 대표적인 범위 사이 및 각각 이상의 세포내 농도는 또한 비천연 미생물 유기체로부터 달성될 수 있다.

일부 구현예에서, 배양 조건은 혐기성 또는 실질적인 혐기성 성장 또는 유지 조건을 포함한다. 대표적인 혐기성 조건은 이전에 기술되었고, 당분야에 널리 공지되어 있다. 발효 과정을 위한 대표적인 혐기성 조건은 본원에 기술되어 있고, 예를 들어, 미국특허 제7,947,483호(2011년 5월 24일에 발표됨)에 기술되어 있다. 임의의 이러한 조건은 비천연 미생물 유기체뿐만 아니라 당분야에 널리 공지된 다른 혐기성 조건과 함께 이용될 수 있다. 이러한 혐기성 조건하에서, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자는 5 내지 10 mM의 또는 그 이상의 세포내 농도뿐만 아니라 본원에 예시된 모든 다른 농도로 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 합성할 수 있다. 상기 설명이 세포내 농도를 지칭함에도 불구하고, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산 미생물 유기체가 세포내에서 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하고/하거나 산물을 배양 배지 내로 분비할 수 있는 것으로 이해된다.

배양 조건은 예를 들어, 액체 배양 절차뿐만 아니라 발효 및 다른 대규모 배양 절차를 포함할 수 있다. 본원에 기술된 바와 같이, 특히 유용한 수율의 생합성 산물은 혐기성 또는 실질적으로 혐기성 배양 조건하에서 얻어질 수 있다.

본원에 기술된 바와 같이, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 달성하기 위한 하나의 대표적인 성장 조건은 혐기성 배양 또는 발효 조건을 포함한다. 특정 구현예에서, 비천연 미생물 유기체는 혐기성 또는 실질적으로 혐기성 조건하에서 유지되거나, 배양되거나, 발효될 수 있다. 간단하게, 혐기성 조건은 산소가 결여된 환경을 지칭한다. 실질적으로 혐기성 조건은 예를 들어, 배지 중의 용해된 산소 농도가 0 내지 10%의 포화를 유지하게 하는, 배양, 배치 발효 또는 연속 발효를 포함한다. 실질적으로 혐기성 조건은 또한, 1% 미만의 산소의 대기로 유지된 시일링된 챔버 내측의 액체 배지 또는 고체 아가에서 세포를 성장 또는 휴지시키는 것을 포함한다. 산소의 백분율은 예를 들어, 배양물에 N₂/CO₂ 혼합물 또는 다른 적합한 비-산소 가스 또는 가스들을 살포함으로써 유지될 수 있다.

본원에 기술된 배양 조건은 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 위해 스케일 업되고 연속적으로 성장될 수 있다. 대표적인 성장 절차는 예를 들어, 유가 발효 및 배치 분리; 유가 발효 및 연속 분리, 또는 연속 발효 및 연속 분리를 포함한다. 이러한 과정 모두는 당분야에 널리 공지되어 있다. 발효 절차는 상업적 양의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성 제조를 위해 특히 유용하다. 일반적으로, 및 비-연속 배양 절차와 관련하여, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 연속 및/또는 거의-연속 제조는 대수 증식기에서 성장을 유지하고/하거나 거의 유지하기 위해 충분한 영양분 및 배지에서 비천연 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산 유기체를 배양하는 것을 포함할 것이다. 이러한 조건하에서 연속 배양은 예를 들어, 1일, 2, 3, 4, 5, 6 또는 7일 또는 그 이상을 포함할 수 있다. 추가적으로, 연속 배양은 1주, 2, 3, 4 또는 5주 또는 그 이상, 및 최대 수 개월을 포함할 수 있다. 대안적으로, 유기체는 특정 적용을 위해 적합한 경우, 수 시간 동안 배양될 수 있다. 연속 및/또는 거의-연속 배양 조건이 또한 이러한 대표적인 기간 사이의 모든 시간 간격을 포함할 수 있는 것으로 이해되어야 한다. 미생물 유기체를 배양하는 시간이 원하는 목적을 위해 충분한 양의 산물을 제조하기 위해 충분한 시간인 것으로 추가로 이해된다.

발효 절차는 당분야에 널리 공지되어 있다. 간단하게, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성 제조를 위한 발효는 예를 들어, 유가 발효 및 배치 분리; 유가 발효 및 연속 분리, 또는 연속 발효 및 연속 분리에서 사용될 수 있다. 배치 및 연속 발효 절차의 예는 당분야에 널리 공지되어 있다.

실질적인 양의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 연속 제조를 위한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자를 이용한 상기 발효 절차 이외에, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자는 또한, 예를 들어, 산물을 다른 화합물로 전환시키기 위해 화학적 합성 절차로 동시에 처리될 수 있거나, 산물은 발효 배양물로부터 분리될 수 있고, 순차적으로, 원하는 경우, 산물을 다른 화합물로 전환시키기 위한 화학적 전환으로 처리될 수 있다. 본원에 기술된 바와 같이, 3-옥소아디페이트, 헥사-2-엔디오에이트를 사용하는 아디페이트 경로에서의 중간체는 예를 들어, 백금 촉매 상에서 화학적 수소화에 의해 아디페이트로 전환될 수 있다.

본원에 기술된 바와 같이, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 달성하기 위한 대표적인 성장 조건은 배양 조건에 삼투 억제제의 첨가를 포함한다. 특정 구현예에서, 비천연 미생물 유기체는 삼투 억제제의 존재 하에 상기에 기술된 바와 같이 유지, 배양 또는 발효될 수 있다. 간단하게, 삼투 억제제는 삼투물질로서 작용하고 본원에 기술된 바와 같은 미생물 유기체가 삼투 스트레스를 유지하는 것을 돕는 화합물을 의미한다. 삼투 억제제는 베타인, 아미노산, 및 당 트레할로오스를 포함하지만, 이로 제한되지 않는다. 이의 비제한적인 예에는 글리신 베타인, 프랄린 베타인, 디메틸테틴, 디메틸설포니오프로피오네이트, 3-디메틸설포니오-2-메틸프로프리오네이트, 피페콜린산, 디메틸설포니오아세테이트, 콜린, L-카르니틴 및 엑토인이 있다. 하나의 양태에서, 삼투 억제제는 글리신 베타인이다. 당업자는 삼투 스트레스으로부터 본원에 기술된 미생물 유기체를 보호하기에 적합한 삼투 억제제의 양 및 타입이 사용되는 미생물 유기체에 따라 달리질 것이라는 것을 이해한다. 예를 들어, 다양한 양의 6-아미노카프로산의 존재 하에서의 에셔리키아 콜라이는 2 mM 글리신 베타인의 존재 하에서 적합하게 성장된다. 배양 조건에서 삼투 억제제의 양은 예를 들어, 약 0.1 mM 이하, 약 0.5 mM 이하, 약 1.0 mM 이하, 약 1.5 mM 이하, 약 2.0 mM 이하, 약 2.5 mM 이하, 약 3.0 mM 이하, 약 5.0 mM 이하, 약 7.0 mM 이하, 약 10 mM 이하, 약 50 mM 이하, 약 100 mM 또는 약 500 mM 이하일 수 있다.

경로를 성공적으로 조작하는 것은 충분한 활성 및 특이성을 갖는 적절한 효소 세트를 식별하는 것을 포함한다. 이는 적절한 효소 세트를 식별하고, 이의 상응하는 유전자를 생산 숙주 내에 클로닝하고, 발효 조건을 최적화하고, 발효 후 산물 형성에 대해 검정하는 것을 수반한다. 6-아미노카프로산 또는 카프로락탐의 제조를 위한 제조 숙주를 조작하기 위해, 하나 이상의 외인성 DNA 서열(들)은 숙주 미생물에서 발현될 수 있다. 또한, 미생물은 기능적으로 결실된 내인성 유전자(들)를 가질 수 있다. 이러한 변형은 재생 가능한 공급원료를 사용하여 6-아미노카프로에이트 또는 카프로락탐을 제조할 수 있을 것이다.

일부 구현예에서, 6-아미노카프로산의 HMDA로의 전환 동안 환형 이민 또는 카프로락탐의 형성을 최소화하거나 심지어 제거하는 것은 작용기(예를 들어, 아세틸, 숙시닐)을 6-아미노카프로산의 아민 기에 첨가하여 환형화하는 것을 방지하는 것을 수반한다. 이는 에셔리키아 콜라이에서 L-글루타메이트로부터 오르니틴 형성과 유사하다. 상세하게는, 글루타메이트는 먼저, N-아세틸글루타메이트 신타아제에 의해 N-아세틸-L-글루타메이트로 전환된다. N-아세틸-L-글루타메이트는 이후에 N-아세틸글루타밀-포스페이트로 활성화되며, 이는 환원되고 아민교환되어 N-아세틸-L-오르니틴을 형성한다. 아세틸 기는 이후에, N-아세틸-L-오르니틴 데아세틸라아제에 의해 N-아세틸-L-오르니틴으로부터 제거되어 L-오르니틴을 형성한다. 이러한 경로는, 글루타메이트로부터의 글루타메이트-5-포스페이트의 형성 이후 글루타메이트-5-세미알데하이드로의 환원이 글루타메이트-5-세미알데하이드로부터 자발적으로 형성된 환형 이민인 (S)-1-피롤린-5-카복실레이트의 형성을 야기시키기 때문에 필요하다. 6-아미노카프로산으로부터 HMDA를 형성하는 경우에, 단계는 6-아미노카프로산을 아세틸-6-아미노카프로산으로 아세틸화하고, 카복실산 기를 CoA 또는 포스페이트 기로 활성화시키고, 환원하고, 아민화하고, 탈아세틸화하는 것을 포함할 수 있다.

실험

실시예 1. 6-아미노카프로산(6ACA) 상에서 활성을 갖는 트랜스아미나아제의 식별

트랜스아미나아제를 인코딩하는 유전자를 기본 로컬 정렬 조사 툴(basic local alignment search tool; BALST)를 이용한 메타게놈 라이브러리 및 공개 데이터베이스로부터 생물정보학적으로 식별하였다(표 4). 각 트랜스아미나아제를 인코딩하는 유전자를 효소-커플링 검정을 이용하여 6-아미노카프로산(6ACA) 및 γ-아미노부티르산(GABA) 중에서 합성, 발현, 및 이에 대한 촉매 활성에 대해 평가하였다.

표 4의 TA 효소 후보물을 인코딩하는 유전자를 구성적 프로모터 하에서 낮은 카피 수의 벡터에 클로닝하고, 작제물을 표준 기술을 이용하여 E. 콜라이로 형질전환시켰다. 형질전환체를 35℃에서 밤새 항생제의 존재 하에서 LB 배지 중에서 배양하고, 그 후에, 세포를 실온에서 15,000 x g으로 스핀 다운하였다. 용해물을 제조하기 위해, 상청액을 제거하고, TA 유전자를 발현시키는 E. 콜라이 세포를 리소자임, 뉴클레아제, 및 10 mM DTT를 함유한 화학적 용해 용액 중에 재현탁시켰다. 용해물을 바로 사용하였다.

트랜스아미나아제 검정 용액은 0.1 M Tris-HCl, pH 8.0; 0.3 mM 6ACA, 0.3 mM GABA, 또는 20 mM Ala; 0.1 mM γ-케토글루타레이트; 1 mM NAD; 및 50 U/mL 글루타메이트 데하이드로게나아제를 함유하였다. TA 용해물을 첨가함으로써 검정을 개시하였고, 실온에서 수행하였다. TA를 함유하지 않은 용해물과 비교하여, 340 nm에서 NADHdml 흡광도의 증가에 의해 활성을 모니터링하였다. 선형률을 Δabs/분으로서 계산하였다. > 100의 선형률은 (++)로 지정되었으며, 1 내지 100의 선형률은 (+)로서 지정되었으며, 활성이 거의 없거나 전혀 없는 선형률은 (-)로 지정되었다. ND는 측정 불가이다.

표 4는 TA 동족체 1, 3, 4, 5, 9, 12, 26, 27, 30, 31, 38, 50, 64, 74, 78, 79, 81, 91, 106, 108, 및 116이 6ACA에 대한 최고 활성 수준을 가짐을 나타낸다.

실시예 2. 트랜스아미나아제 동족체의 생체내 검정

생체내 트랜스아미나아제 동족체의 활성을 시험하기 위해, 선택된 트랜스아미나아제를 인코딩하는 유전자를 1) 3-옥소아디필-CoA 티올라아제(Thl), 2) 3-옥소아디필-CoA 데하이드로게나아제(Hbd), 3) 3-옥소아디필-CoA 데하이드레이트레이타아제("크로토나아제" 또는 Crt), 4) 5-카복시-2-펜테노일-CoA 리덕타아제(Ter); 및 5) 알데하이드 데하이드로게나아제(Ald)를 인코딩하는 도입된 유전자를 또한 포함한 E. 콜라이의 균주로 형질전환하였다. Thl, Hbd, Crt, Ter, Ald 유전자는 미국특허 제8,377,680호(예를 들어, 실시예 8, 이러한 문헌은 전문이 참고로 포함됨)에 보고되어 있다. 이러한 유전자를, TA 효소를 제외하고, 6-아미노카프로에이트(6ACA)를 생성하는 데 필수적인 모든 경로 효소를 포함한 E. 콜라이 균주에 도입하였다. 유전자는 사용한다.

TA 유전자를 발현시키기 위한 벡터를 Thl/Hbd/Crt/Ter/Ald E. 콜라이드 균주 내로 형질전환시키고, 형질전환체를 6ACA 생성에 대해 시험하였다. 조작된 E. 콜라이 세포에 최소 배지 중에서 2% 글루코오스를 공급하였고, 35℃에서 18시간 인큐베이션 후에, 세포를 수확하고, 상청액을 6ACA 생성에 대한 분석 HPLC 또는 표준 LC/MS 분석 방법에 의해 평가하였다. 표 4에 나타낸 바와 같이, Thl, Hbd, Crt, Ter, 및 Ald 유전자를 포함한 E. 콜라이에서 TA 효소를 인코딩하는 유전자의 발현은 이러한 균주에 의해 6ACA를 생성하였다.

실시예 3. 트랜스아미나아제 변이체

아미노산 위치를 아크로모박터 크실로스옥시단스의 동족체 1 TA에서 돌연변이에 대해 식별하였고, 단백질의 결정 구조의 시험에 의해 서열번호 1에 의해 인코딩하였으며, 서열번호 1을 인코딩한 유전자를 선택된 아미노산 위치에서 포화 돌연변이 유발시켰다. 얻어진 변이체를 실시예 1에 기술된 바와 같이 용해물 검정에서 활성에 대해 시험하였다. TA 서열번호 1에 대한 결과는 도 2에 도시되어 있다. 도 2는 서열번호 1의 위치가 활성에 대해 중요함을 나타낸다.

V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265 및 L386에 대한 아미노산 위치에서 TA 효소(서열번호 1)를 인코딩하는 유전자뿐만 아니라 G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, 및 A421에 대한 코돈을 돌연변이시킴으로써 변이체를 생성하였다. 돌연변이는 단독으로 이루어지거나 다른 아미노산 위치에서의 돌연변이와 조합하여 이루어졌다. 소정 아미노산 위치에서의 돌연변이는 변성 프라이머 서열 및 PCR을 이용하여 이루어졌으며, 여기서, 변경된 유전자 서열 혼합물을 E. 콜라이 내로 형질전환시켰다. 형질전환체를 실시예 1에 기술된 바와 같은 용해물 검정에서 시험하였다. 검정에서 야생형 대조군보다 더 높은 활성을 나타내는 용해물을 제공한 클론을 삼중 용해물 검정에서 다시 시험하였다. 계속 야생형 활성보다 더 높은 활성을 나타내는 클론을 이후에 이러한 것이 포함된 TA 유전자의 서열 분석을 위해 준비하였다.

표 5 및 도 3은 활성 클론의 변이체 TA 유전자 서열에서 발견된 돌연변이를 제공한다. "+" 또는 "++"로 나타낸, 야생형 활성보다 더 높은 활성을 나타내는 변이체는 TA 유전자에서 단일 돌연변이 및 조합(다중) 돌연변이를 포함하였다. 표 5는 아미노산 위치 위치 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392(서열번호 1에 대해 식별된 위치)에서 돌연변이를 갖는, 다수의 변이체가 야생형 TA(서열번호 1)보다 더 큰 활성을 나타내어, 이러한 것이 유래된 야생형 TA보다 더 높은 활성을 갖는 다수의 변이체를 야기시킴을 나타낸다.

또한, 여러 변이체를 6ACA 또는 GABA 대신에 기질로서 20 mM 알라닌을 사용하여 검정하였다.

SEQUENCE LISTING <110> Genomatica Inc. Shah, Amit M. Komor, Russell Scott Warner, Joseph Roy Nagarajan, Harish <120> Engineered Transaminase and Methods of Making and Using <130> GNO0100/WO <150> US 62/860,160 <151> 2019-06-11 <160> 146 <170> PatentIn version 3.5 <210> 1 <211> 421 <212> PRT <213> Achromobacter xylosoxidans <400> 1 Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg 1 5 10 15 Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala 20 25 30 Thr Leu Trp Asp Ala Asn Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly 35 40 45 Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Lys Ala Ala 50 55 60 Val Ala Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val 65 70 75 80 Pro Tyr Glu Gly Tyr Val Ser Leu Ala Glu Arg Ile Asn Arg Leu Ala 85 90 95 Pro Ile Asp Gly Leu Lys Lys Ser Ala Phe Phe Thr Thr Gly Val Glu 100 105 110 Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ala Thr Gly Arg Ser 115 120 125 Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly 130 135 140 Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro 145 150 155 160 Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser 165 170 175 Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Cys 180 185 190 Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln 195 200 205 Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu 210 215 220 Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val 225 230 235 240 Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His 245 250 255 Ser Val Gln Ala Asp Leu Ile Thr Met Ala Lys Ser Leu Gly Gly Gly 260 265 270 Phe Pro Ile Ser Gly Val Val Gly Arg Ala Asp Val Met Asp Ala Pro 275 280 285 Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val 290 295 300 Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys 305 310 315 320 Glu Arg Ala Asp Ala Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly 325 330 335 Leu Arg Ala Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser 340 345 350 Met Val Ala Leu Glu Leu Asn Asp Pro Ala Thr Gly Lys Pro Asp Ala 355 360 365 Glu Ala Val Lys Arg Val Gln Ala Arg Ala Ile Glu Lys Gly Leu Ile 370 375 380 Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro 385 390 395 400 Leu Thr Ile Pro Asp Ala Gln Phe Asp Arg Ala Leu Ala Ile Leu Ser 405 410 415 Glu Ala Leu Ala Ala 420 <210> 2 <400> 2 000 <210> 3 <211> 426 <212> PRT <213> Metagenomic <400> 3 Met Phe Ile Glu Ala Glu Met Lys Asn Gln Asp Leu Asn Thr Arg Arg 1 5 10 15 Ser Leu Ala Thr Pro Arg Gly Val Gly Val Met Cys Asp Phe Tyr Ala 20 25 30 Val Arg Ala Glu Asn Ala Thr Leu Trp Asp Ala Asn Gly Lys Glu Tyr 35 40 45 Ile Asp Phe Ala Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His 50 55 60 Pro Lys Val Lys Ala Ala Val Ala Ala Gln Leu Asp Asn Phe Thr His 65 70 75 80 Thr Ala Tyr Gln Ile Val Pro Tyr Glu Ser Tyr Ile Ser Leu Ala Glu 85 90 95 Arg Ile Asn Arg Leu Ala Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe 100 105 110 Phe Thr Thr Gly Val Glu Ala Val Glu Asn Ala Ile Lys Ile Ala Arg 115 120 125 Ser Ser Thr Gly Arg Ser Gly Val Ile Ala Phe Ser Gly Ser Phe His 130 135 140 Gly Arg Thr Met Leu Gly Met Ala Leu Thr Gly Lys Val Ala Pro Tyr 145 150 155 160 Lys Leu Ser Phe Gly Pro Met Pro Gly Asp Ile Tyr His Val Pro Phe 165 170 175 Pro Asn Ala Thr Gln Ala Ile Ser Val Ala Asp Ser Leu Lys Ala Leu 180 185 190 Asp Leu Leu Phe Lys Cys Asp Ile Asp Pro Lys Arg Val Ala Ala Ile 195 200 205 Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro 210 215 220 Glu Leu Met Thr Ala Leu Arg Lys Ile Cys Asp Glu His Gly Ile Leu 225 230 235 240 Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu 245 250 255 Tyr Ala Met Glu His His Ser Val Gln Ala Asp Leu Ile Thr Met Ala 260 265 270 Lys Ser Leu Gly Gly Gly Phe Pro Ile Ser Gly Val Val Gly Arg Ala 275 280 285 Asp Val Met Asp Gly Pro Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala 290 295 300 Gly Asn Pro Leu Ala Val Ala Ala Ala His Ala Val Leu Asp Val Ile 305 310 315 320 Ala Glu Glu Lys Leu Cys Asp Arg Ala Asn Val Leu Gly Glu Lys Leu 325 330 335 Arg Ala His Leu Glu Gly Leu Arg Ala Lys Val Pro Gly Ile Ala Asp 340 345 350 Val Arg Gly Leu Gly Ser Met Val Ala Leu Glu Leu Asn Asp Ala Ser 355 360 365 Gly Lys Pro Asp Ala Glu Ala Val Lys Arg Val Gln Ala Arg Ala Leu 370 375 380 Glu Gln Gly Leu Ile Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu 385 390 395 400 Arg Phe Leu Tyr Pro Leu Thr Ile Pro Asp Ala Gln Phe Asp Arg Ala 405 410 415 Leu Ala Ile Leu Ser Asp Ala Leu Ala Ala 420 425 <210> 4 <211> 446 <212> PRT <213> Metagenomic <400> 4 Met Val His Leu Arg Ala Ala Thr Arg Thr Ser Cys Thr Pro Val Leu 1 5 10 15 Thr Pro Ser Leu Thr Trp Arg Ser Ala Met Lys Asn Met Asp Leu Asp 20 25 30 Thr Arg Arg Ser Leu Ala Thr Pro Arg Gly Val Gly Val Ala Tyr Ser 35 40 45 Val Tyr Ala Val Arg Ala Glu Asn Ala Thr Ile Trp Asp Ala Asp Gly 50 55 60 Lys Glu Tyr Ile Asp Phe Ala Gly Gly Ile Ala Val Leu Asn Thr Gly 65 70 75 80 His Arg His Pro Lys Val Lys Ala Ala Ile Ala Ala Gln Leu Glu Cys 85 90 95 Phe Thr His Thr Ala Tyr Gln Ile Ile Pro Tyr Glu Pro Tyr Val Ala 100 105 110 Leu Ala Glu Arg Leu Asn Lys Ile Ala Pro Ile Asp Gly Leu Lys Lys 115 120 125 Thr Ala Phe Phe Thr Thr Gly Ala Glu Ala Val Glu Asn Ala Ile Lys 130 135 140 Ile Ala Arg Ala Tyr Thr Lys Arg Thr Gly Val Ile Ala Phe Ser Gly 145 150 155 160 Ala Phe His Gly Arg Thr Leu Leu Gly Met Ala Leu Thr Gly Lys Val 165 170 175 Ala Pro Tyr Lys Val Asp Phe Gly Ala Met Pro Pro Asp Ile Phe His 180 185 190 Ala Pro Phe Pro Asn Thr Thr Gln Asp Ile Ser Val Ala Asp Ala Leu 195 200 205 Lys His Leu Glu Leu Leu Phe Lys Val Asp Ile Asp Pro Lys Arg Val 210 215 220 Ala Ala Ile Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe Asn Pro 225 230 235 240 Ala Pro Ala Glu Leu Met Thr Ala Leu Arg Arg Ile Cys Asp Glu His 245 250 255 Gly Ile Val Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Ala Arg Thr 260 265 270 Gly Lys Leu Phe Ala Met Gln His Tyr Asp Val Gln Pro Asp Met Met 275 280 285 Thr Val Ala Lys Ser Leu Ala Gly Gly Met Pro Leu Ser Gly Val Ile 290 295 300 Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro Gly Gly Leu Gly Gly 305 310 315 320 Thr Tyr Ala Gly Asn Ala Leu Ala Leu Ala Ser Ala His Ala Val Leu 325 330 335 Asp Val Ile Glu Glu Glu Gln Leu Cys Ala Arg Ala Glu Thr Leu Gly 340 345 350 Gln Arg Leu Arg Asp Arg Leu Thr Ala Leu Lys Gly Thr Val Pro Ala 355 360 365 Leu Gly Glu Val Arg Gly Pro Gly Ser Met Val Ala Val Glu Met Asn 370 375 380 Asp Pro Ala Thr Gly Lys Pro Asp Ala Glu Ala Val Lys Arg Val Gln 385 390 395 400 Ala Arg Ala Leu Ala Gln Gly Leu Ile Leu Ile Thr Cys Gly Val Tyr 405 410 415 Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu Thr Ile Pro Asp Ala Gln 420 425 430 Phe Asp Arg Ala Leu Asp Ile Leu Ala Asp Ala Ile Thr Ala 435 440 445 <210> 5 <211> 456 <212> PRT <213> Metagenomic <400> 5 Met Thr Thr Thr Ala Ala Asp Ile Thr Tyr Arg Leu Glu Gln Lys Arg 1 5 10 15 Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Val Ala Leu Thr Glu 20 25 30 Arg Arg Lys Ser Val Val Ala Ala Gly Val Ala Ser Ser Val Pro Val 35 40 45 Tyr Val Ala Asp Ala Asp Gly Gly Ile Ile Gln Asp Val Asp Gly Asn 50 55 60 Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala 65 70 75 80 Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His Phe 85 90 95 Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val 100 105 110 Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg Thr 115 120 125 Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val 130 135 140 Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala 145 150 155 160 Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met 165 170 175 Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met 180 185 190 Pro Met Ser Tyr Pro Tyr Arg Glu Glu Asn Pro Ser Ile Thr Gly Ala 195 200 205 Glu Ala Ala Lys Arg Ala Ile Thr Ala Ile Glu Lys Gln Ile Gly Gly 210 215 220 Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly 225 230 235 240 Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ala Ala Trp Ala 245 250 255 Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe 260 265 270 Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Val Ile Pro 275 280 285 Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser 290 295 300 Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly 305 310 315 320 Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu 325 330 335 Ala Ser Ile Gly Ser Met Glu Glu Tyr Gly Leu Asn Ala Arg Ala Lys 340 345 350 His Ile Glu Glu Leu Ala Thr Thr Arg Leu Ser Ala Leu Gln Glu Glu 355 360 365 Leu Ala Gly Ala Gly Ser Ala Val Ile Gly Asp Ile Arg Gly Arg Gly 370 375 380 Ala Met Leu Ala Ile Glu Leu Val His Ala Gly Ser Lys Glu Pro Asn 385 390 395 400 Pro Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val 405 410 415 Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro 420 425 430 Pro Leu Val Ile Thr Asp Glu Leu Leu Asn Asp Gly Leu Asp Val Leu 435 440 445 Ala Ala Ala Ile Lys Ala Asn Ala 450 455 <210> 6 <400> 6 000 <210> 7 <400> 7 000 <210> 8 <400> 8 000 <210> 9 <211> 451 <212> PRT <213> Metagenomic <400> 9 Met Thr Thr Thr Ala Asn Glu Leu Ser Tyr Arg Ile Glu Gln Lys Arg 1 5 10 15 Asn Ile Asn Gly Ala Phe Pro Gly Pro Lys Ser Gln Ala Leu Ala Glu 20 25 30 Arg Arg Ala Ala Val Val Ala Ala Gly Val Ala Ser Gly Val Pro Val 35 40 45 Tyr Val Glu Asp Ala Asp Gly Gly Ile Val Arg Asp Val Asp Gly Asn 50 55 60 Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala 65 70 75 80 Ser Asp Pro Ala Val Val Ala Ala Val Gln Glu Ala Ala Ala His Phe 85 90 95 Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val 100 105 110 Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Ala Lys Arg Thr 115 120 125 Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val 130 135 140 Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala 145 150 155 160 Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met 165 170 175 Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met 180 185 190 Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Glu Ile Thr Gly Ala 195 200 205 Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile Gly Gly 210 215 220 Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly 225 230 235 240 Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ser Ala Trp Ala 245 250 255 Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe 260 265 270 Cys Arg Thr Gly Glu Trp Phe Ala Val Asp His Glu Gly Val Val Pro 275 280 285 Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Leu Pro Leu Ser 290 295 300 Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly 305 310 315 320 Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu 325 330 335 Ala Ala Ile Asp Thr Met Glu Gln His Asp Leu Asn Gly Arg Ala Arg 340 345 350 His Ile Glu Glu Leu Ala Leu Gly Lys Leu Arg Glu Leu Ala Asp Glu 355 360 365 Val Ser Val Val Gly Asp Ile Arg Gly His Gly Ala Met Leu Ala Ile 370 375 380 Glu Leu Val Gln Ser Gly Ser Lys Glu Pro Asn Ala Glu Leu Thr Lys 385 390 395 400 Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val Ile Ile Leu Thr Cys 405 410 415 Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val Ile Ser 420 425 430 Asp Glu Leu Leu Ile Asp Gly Leu Glu Val Leu Ala Ala Ala Ile Lys 435 440 445 Ala His Ala 450 <210> 10 <400> 10 000 <210> 11 <400> 11 000 <210> 12 <211> 456 <212> PRT <213> Metagenomic <400> 12 Met Thr Ala Thr Ala Ser Glu Ile Thr Tyr Arg Leu Glu Gln Lys Arg 1 5 10 15 Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Ala Ala Leu Thr Glu 20 25 30 Arg Arg Lys Ser Val Val Ala Ala Gly Val Ala Ser Ser Val Pro Val 35 40 45 Tyr Val Ala Asp Ala Asp Gly Gly Ile Ile His Asp Val Asp Gly Asn 50 55 60 Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala 65 70 75 80 Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His Phe 85 90 95 Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val 100 105 110 Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg Thr 115 120 125 Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Ile Lys Val 130 135 140 Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala 145 150 155 160 Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met 165 170 175 Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met 180 185 190 Pro Met Ser Tyr Pro Tyr Arg Glu Glu Asn Pro Ala Ile Thr Gly Ala 195 200 205 Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile Gly Gly 210 215 220 Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly 225 230 235 240 Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ala Ala Trp Ala 245 250 255 Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe 260 265 270 Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Ile Val Pro 275 280 285 Asp Ile Met Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser 290 295 300 Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly 305 310 315 320 Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu 325 330 335 Ala Ser Ile Gly Ser Met Glu Glu Tyr Asp Leu Ala Gly Arg Ala Arg 340 345 350 His Ile Glu Ala Leu Ala Thr Gly Arg Leu Arg Glu Leu Gln Ala Glu 355 360 365 Leu Ala Asp Ala Gly Thr Ala Val Ile Gly Asp Val Arg Gly Arg Gly 370 375 380 Ala Met Leu Ala Ile Glu Leu Val Gln Ala Gly Ser Lys Glu Pro Asn 385 390 395 400 Pro Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val 405 410 415 Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro 420 425 430 Pro Leu Val Ile Thr Asp Glu Leu Leu Asn Asp Gly Leu Asp Val Leu 435 440 445 Ala Ala Ala Ile Lys Ala Asn Ala 450 455 <210> 13 <211> 456 <212> PRT <213> Paenarthrobacter aurescens TC1 <400> 13 Met Thr Thr Thr Ala Asn Glu Leu Ser Tyr Arg Ile Glu Gln Lys Arg 1 5 10 15 Asn Ile Asn Gly Ala Phe Pro Gly Pro Lys Ser Gln Ala Leu Ala Glu 20 25 30 Arg Arg Ser Ala Val Val Ala Ala Gly Val Ala Ser Gly Val Pro Val 35 40 45 Tyr Val Glu Asp Ala Asp Gly Gly Ile Ile Arg Asp Val Asp Gly Asn 50 55 60 Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala 65 70 75 80 Ser Asp Pro Ala Val Val Ala Ala Val Gln Glu Ala Ala Ala His Phe 85 90 95 Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val 100 105 110 Thr Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Ala Lys Arg Thr 115 120 125 Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val 130 135 140 Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala 145 150 155 160 Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met 165 170 175 Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met 180 185 190 Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Glu Ile Thr Gly Ala 195 200 205 Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile Gly Gly 210 215 220 Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly 225 230 235 240 Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ser Glu Trp Ala 245 250 255 Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe 260 265 270 Cys Arg Thr Gly Glu Trp Phe Ala Val Asp His Glu Gly Val Val Pro 275 280 285 Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Leu Pro Leu Ser 290 295 300 Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly 305 310 315 320 Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu 325 330 335 Ala Ala Ile Asp Thr Met Glu Gln His Asp Leu Asn Gly Arg Ala Arg 340 345 350 His Ile Glu Glu Leu Ala Leu Gly Lys Leu Arg Glu Leu Ala Ala Glu 355 360 365 Leu Ser Ala Gly Gly Gly Ser Val Val Gly Asp Ile Arg Gly Arg Gly 370 375 380 Ala Met Leu Ala Ile Glu Leu Val Gln Pro Gly Ser Lys Glu Pro Asn 385 390 395 400 Ala Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val 405 410 415 Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro 420 425 430 Pro Leu Val Ile Ser Asp Glu Leu Leu Ile Asp Gly Leu Glu Val Leu 435 440 445 Ala Ala Ala Ile Lys Ala His Ala 450 455 <210> 14 <400> 14 000 <210> 15 <211> 425 <212> PRT <213> Metagenomic <400> 15 Met Ser Lys Thr Asn Ala Ser Leu Met Lys Arg Arg Glu Ala Ala Val 1 5 10 15 Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Lys 20 25 30 Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala 35 40 45 Gly Gly Ile Ala Val Leu Asn Thr Gly His Val His Pro Lys Ile Ile 50 55 60 Ala Ala Val Thr Glu Gln Leu Asn Lys Leu Thr His Thr Cys Phe Gln 65 70 75 80 Val Leu Ala Tyr Glu Pro Tyr Val Glu Val Cys Glu Lys Ile Asn Ala 85 90 95 Lys Val Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly 100 105 110 Ser Glu Ala Val Glu Asn Ser Ile Lys Ile Ala Arg Ala Ala Thr Gly 115 120 125 Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met 130 135 140 Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met 145 150 155 160 Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Tyr Pro Asn Glu Leu 165 170 175 His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe 180 185 190 Lys Asn Asp Ala Glu Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro 195 200 205 Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys 210 215 220 Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp 225 230 235 240 Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu 245 250 255 Gln Met Gly Val Ala Ala Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala 260 265 270 Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp 275 280 285 Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile 290 295 300 Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu His 305 310 315 320 Leu Leu Asp Arg Cys Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu 325 330 335 Lys Ala Ile Gln Ala Lys Tyr Pro Val Ile Gly Glu Val Arg Ala Leu 340 345 350 Gly Ala Met Ile Ala Val Glu Leu Phe Val Asp Gly Asp Ser His Lys 355 360 365 Pro Asn Ala Pro Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys 370 375 380 Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Val 385 390 395 400 Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala 405 410 415 Ile Ile Glu Glu Cys Phe Ser Glu Leu 420 425 <210> 16 <400> 16 000 <210> 17 <400> 17 000 <210> 18 <400> 18 000 <210> 19 <400> 19 000 <210> 20 <400> 20 000 <210> 21 <400> 21 000 <210> 22 <400> 22 000 <210> 23 <400> 23 000 <210> 24 <400> 24 000 <210> 25 <400> 25 000 <210> 26 <211> 421 <212> PRT <213> Metagenomic <400> 26 Val Asn Asn His Glu Leu Asn Glu Arg Arg Leu Gln Ala Thr Pro Arg 1 5 10 15 Gly Ile Gly Val Met Cys Gly Phe Tyr Ala Asp Lys Ala Glu Asn Ala 20 25 30 Thr Leu Trp Asp Ile Glu Gly Asn Glu Val Ile Asp Phe Ala Ala Gly 35 40 45 Ile Ala Val Leu Asn Thr Gly His Arg His Pro Lys Val Ile Ala Ala 50 55 60 Ile Glu Lys Gln Leu Gln Ser Phe Thr His Thr Ala Tyr Gln Ile Val 65 70 75 80 Pro Tyr Glu Gly Tyr Ile Ala Leu Ala Glu Arg Ile Asn Ala Arg Val 85 90 95 Pro Ile Glu Gly Pro Ala Lys Thr Ala Phe Phe Ser Thr Gly Ala Glu 100 105 110 Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Tyr Thr Lys Arg Pro 115 120 125 Gly Leu Ile Thr Phe Gly Gly Ala Phe His Gly Arg Thr Phe Met Thr 130 135 140 Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Gly Phe Gly Pro 145 150 155 160 Phe Pro Gly Ser Val Tyr His Ala Gln Tyr Pro Asn Thr Leu His Gly 165 170 175 Val Ser Ser Gln Asp Ala Leu Lys Ser Leu Glu Arg Ile Phe Lys Ala 180 185 190 Asp Ile Ala Pro Asp Gln Val Ala Ala Ile Ile Leu Glu Pro Val Gln 195 200 205 Gly Glu Gly Gly Phe Asn Val Ala Pro Pro Asp Phe Met Gln Gly Leu 210 215 220 Arg Ala Leu Cys Asp Thr His Gly Ile Leu Leu Ile Ala Asp Glu Val 225 230 235 240 Gln Thr Gly Phe Ala Arg Thr Gly Lys Leu Phe Ser Met Glu His His 245 250 255 Cys Val Lys Pro Asp Leu Ile Thr Met Ala Lys Ser Leu Ala Gly Gly 260 265 270 Met Pro Leu Ser Ala Val Ser Gly Arg Ala Glu Val Met Asp Ala Pro 275 280 285 Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Ile 290 295 300 Ala Ala Ala Leu Ala Val Leu Asp Val Ile Asp Glu Glu Asp Leu Cys 305 310 315 320 Ala Arg Ala Ser His Leu Gly His His Leu Val Glu Val Leu Ser Lys 325 330 335 Ala Lys Ser Gly Cys Pro Tyr Ile Ala Asp Ile Arg Ala Gln Gly Ser 340 345 350 Met Val Ala Val Glu Phe Asn Asp Pro Glu Thr Gly Gln Pro Ser Pro 355 360 365 Glu Phe Thr Arg Gln Val Gln Glu Arg Ala Leu Ala Glu Gly Leu Leu 370 375 380 Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Ile Arg Phe Leu Tyr Pro 385 390 395 400 Leu Thr Ile Pro Asp Ala Gln Phe Arg Lys Ala Leu Asp Ile Ile Ser 405 410 415 Ala Ser Leu Thr Arg 420 <210> 27 <211> 457 <212> PRT <213> Metagenomic <400> 27 Met Thr Ile Leu Glu His Gly Thr Glu Thr Cys Ile Gly Gly Pro Thr 1 5 10 15 Leu Pro Gln Ile Arg Arg Leu Val Thr Glu Val Pro Gly Pro Asn Ser 20 25 30 Arg Ala Leu Ala Lys Arg Arg Ser Ala Ala Leu Pro Ala Gly Leu Thr 35 40 45 Ser Gly Ser Ser Ile Tyr Val Ala Ala Ala Gly Gly Gly Val Val Val 50 55 60 Asp Val Asp Asp Asn Ser Phe Ile Asp Phe Gly Ser Gly Ile Ala Val 65 70 75 80 Thr Thr Val Gly Asn Ser Ala Pro Arg Val Val Glu Arg Thr Thr Arg 85 90 95 Gln Leu Gly Gln Phe Thr His Thr Cys Phe Leu Ala Asn Pro Tyr Glu 100 105 110 Gly Tyr Leu Glu Val Cys Glu Ala Leu Asn Arg Leu Thr Pro Gly Asp 115 120 125 His Glu Lys Arg Thr Ala Leu Phe Asn Thr Gly Ser Glu Ala Leu Glu 130 135 140 Asn Ala Val Lys Tyr Ala Arg Ala Ala Thr Gly Arg Pro Ala Val Val 145 150 155 160 Val Phe Asp His Ala Phe His Gly Arg Thr Leu Met Thr Met Thr Met 165 170 175 Thr Ala Lys Asn Gln Pro Tyr Lys Ala Thr Phe Gly Pro Phe Ala Pro 180 185 190 Glu Val Tyr Arg Val Pro Met Ala Tyr Pro Tyr Arg Trp Pro Ser Gly 195 200 205 Pro Glu Asn Ala Ala Asp Glu Ala Phe Ala Gln Phe Arg Leu Ala Ile 210 215 220 Asp Thr Gln Ile Gly Ala Glu Ser Val Ala Ala Val Val Val Glu Pro 225 230 235 240 Ile Gln Gly Glu Gly Gly Phe Ile Val Pro Ala Pro Gly Phe Leu Lys 245 250 255 Arg Ile Ser Glu Phe Cys Arg Glu Arg Gly Ile Leu Val Val Ala Asp 260 265 270 Glu Val Gln Thr Gly Ile Ala Arg Thr Gly Ser Trp Phe Ala Ser Glu 275 280 285 Ser Glu Asp Phe Val Pro Asp Ile Ile Thr Thr Ala Lys Gly Leu Ala 290 295 300 Gly Gly Met Pro Leu Ala Ala Val Thr Gly Arg Ala Asp Val Met Asp 305 310 315 320 Ala Ala His Pro Gly Gly Ile Gly Gly Thr Tyr Ser Gly Asn Pro Val 325 330 335 Ala Cys Glu Ala Ala Leu Ala Val Phe Glu Thr Ile Glu Met Glu Gly 340 345 350 Leu Leu Asp Arg Ala Lys Asp Ile Gly Asp Ile Leu Thr Thr Gly Leu 355 360 365 Ser Glu Ile Ala Ser Glu Thr Asp Ile Ile Gly Asp Ile Arg Gly Arg 370 375 380 Gly Ala Met Ile Ala Ile Glu Leu Val His Asp Glu Asp Lys Ala Pro 385 390 395 400 Asn Arg Glu Ala Val Ala Gln Ile Val Ser Tyr Ala His Thr His Gly 405 410 415 Leu Leu Leu Leu Thr Ala Gly Thr Tyr Gly Asn Val Val Arg Phe Leu 420 425 430 Pro Pro Leu Ser Ile Ser Asp Glu Leu Leu Thr Glu Gly Leu Gly Ile 435 440 445 Leu Arg Asp Ala Val Ala Ala Val Arg 450 455 <210> 28 <400> 28 000 <210> 29 <400> 29 000 <210> 30 <211> 469 <212> PRT <213> Metagenomic <400> 30 Met Arg Ser Ala Ser Ala Pro Pro Val Arg Ile Ser Gln Lys Gly Asn 1 5 10 15 His Pro Met Thr Thr Thr Ala Asn Glu Leu Ser Tyr Arg Ile Glu Gln 20 25 30 Lys Arg Asn Ile Asn Gly Ala Phe Pro Gly Pro Lys Ser Gln Ala Leu 35 40 45 Ala Glu Arg Arg Ser Ala Val Val Ala Ala Gly Val Ala Ser Gly Val 50 55 60 Pro Val Tyr Val Glu Asp Ala Asp Gly Gly Ile Ile Arg Asp Val Asp 65 70 75 80 Gly Asn Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val 85 90 95 Gly Ala Ser Asp Pro Ala Val Val Ala Ala Val Gln Glu Ala Ala Ala 100 105 110 His Phe Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val 115 120 125 Ala Val Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Ala Lys 130 135 140 Arg Thr Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val 145 150 155 160 Lys Val Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp 165 170 175 His Ala Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys 180 185 190 Ala Met Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr 195 200 205 Arg Met Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Glu Ile Thr 210 215 220 Gly Ala Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile 225 230 235 240 Gly Gly Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu 245 250 255 Gly Gly Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ser Glu 260 265 270 Trp Ala Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser 275 280 285 Gly Phe Cys Arg Thr Gly Glu Trp Phe Ala Val Asp His Glu Gly Val 290 295 300 Val Pro Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Leu Pro 305 310 315 320 Leu Ser Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro 325 330 335 Gly Gly Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala 340 345 350 Ala Leu Ala Ala Ile Asp Thr Met Glu Gln His Asp Leu Asn Gly Arg 355 360 365 Ala Arg His Ile Glu Glu Leu Ala Leu Gly Lys Leu Arg Glu Leu Ala 370 375 380 Gly Glu Val Ser Val Val Gly Asp Ile Arg Gly Arg Gly Ala Met Leu 385 390 395 400 Ala Ile Glu Leu Val Gln Ser Gly Ser Lys Glu Pro Asn Ala Glu Leu 405 410 415 Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val Ile Ile Leu 420 425 430 Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val 435 440 445 Ile Ser Asp Glu Leu Leu Ile Asp Gly Leu Glu Val Leu Ala Ala Ala 450 455 460 Ile Lys Ala His Ala 465 <210> 31 <211> 421 <212> PRT <213> Metagenomic <400> 31 Met Gln Asn Pro Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg 1 5 10 15 Gly Val Gly Val Met Cys Asp Phe Tyr Ala Met Arg Ala Glu Asn Ala 20 25 30 Thr Leu Trp Asp Ser Thr Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly 35 40 45 Ile Ala Val Leu Asn Thr Gly His Arg His Pro Lys Ile Lys Ala Ala 50 55 60 Val Ala Glu Gln Leu Glu Ala Phe Thr His Thr Ala Tyr Gln Ile Val 65 70 75 80 Pro Tyr Glu Ser Tyr Val Ala Leu Ala Glu Arg Ile Asn Gly Leu Ala 85 90 95 Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu 100 105 110 Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala His Thr Gly Arg Ser 115 120 125 Gly Val Val Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly 130 135 140 Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ala Phe Gly Pro 145 150 155 160 Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Gly Thr Gln Asp 165 170 175 Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Ser 180 185 190 Asp Ile Asp Pro Arg Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln 195 200 205 Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu 210 215 220 Arg Lys Ile Cys Asp Glu Tyr Gly Ile Met Leu Ile Ala Asp Glu Val 225 230 235 240 Gln Thr Gly Phe Ala Arg Thr Gly Lys Leu Tyr Ala Met Gln His His 245 250 255 Asp Val Gln Ala Asp Leu Ile Thr Met Ala Lys Ser Leu Gly Gly Gly 260 265 270 Phe Pro Ile Ser Gly Val Val Gly Arg Ala Glu Val Met Asp Gly Pro 275 280 285 Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val 290 295 300 Ala Ala Ala His Ala Val Leu Asp Val Ile Glu Glu Glu Lys Leu Cys 305 310 315 320 Glu Arg Ala Ala Glu Leu Gly Gln Arg Leu Gln Glu Arg Leu Asn Gly 325 330 335 Leu Arg Pro Gln Cys Pro Ala Ile Ala Asp Val Arg Gly Leu Gly Ser 340 345 350 Met Val Ala Leu Glu Leu Arg Asp Pro Ala Thr Gly Gln Pro Asp Ala 355 360 365 Ala Ala Val Lys Arg Val Gln Asp Ala Ala Ile Glu Arg Gly Leu Ile 370 375 380 Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro 385 390 395 400 Leu Thr Ile Pro Asp Glu Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser 405 410 415 Asp Ile Leu Thr Ala 420 <210> 32 <400> 32 000 <210> 33 <400> 33 000 <210> 34 <400> 34 000 <210> 35 <400> 35 000 <210> 36 <211> 353 <212> PRT <213> Metagenomic <400> 36 Lys Leu Thr His Thr Cys Phe Gln Val Leu Ala Tyr Glu Pro Tyr Val 1 5 10 15 Glu Leu Cys Glu Lys Ile Asn Ala Lys Val Pro Gly Asp Phe Ala Lys 20 25 30 Lys Thr Leu Leu Val Thr Thr Gly Ser Glu Ala Val Glu Asn Ala Val 35 40 45 Lys Ile Ala Arg Ala Ala Thr Gly Arg Ala Gly Val Ile Ala Phe Thr 50 55 60 Gly Ala Tyr His Gly Arg Thr Met Met Thr Leu Gly Leu Thr Gly Lys 65 70 75 80 Val Val Pro Tyr Ser Ala Gly Met Gly Leu Met Pro Gly Gly Val Phe 85 90 95 Arg Ala Leu Tyr Pro Asn Glu Leu His Gly Val Ser Val Asp Asp Ser 100 105 110 Ile Ala Ser Ile Glu Arg Ile Phe Lys Asn Asp Ala Glu Pro Arg Asp 115 120 125 Ile Ala Ala Ile Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe Tyr 130 135 140 Val Ala Pro Lys Glu Phe Met Lys Arg Leu Arg Ala Leu Cys Asp Gln 145 150 155 160 His Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Ala Gly Arg 165 170 175 Thr Gly Thr Phe Phe Ala Met Glu Gln Met Gly Val Ser Ala Asp Leu 180 185 190 Thr Thr Phe Ala Lys Ser Ile Ala Gly Gly Phe Pro Leu Ala Gly Val 195 200 205 Cys Gly Lys Ala Glu Tyr Met Asp Ala Ile Ala Pro Gly Gly Leu Gly 210 215 220 Gly Thr Tyr Ala Gly Ser Pro Ile Ala Cys Ala Ala Ala Leu Ala Val 225 230 235 240 Met Glu Val Phe Glu Glu Glu His Leu Leu Asp Arg Cys Lys Ala Val 245 250 255 Gly Glu Arg Leu Val Thr Gly Leu Lys Ala Ile Gln Ser Lys Tyr Pro 260 265 270 Val Ile Gly Glu Val Arg Ala Leu Gly Ala Met Ile Ala Val Glu Leu 275 280 285 Phe Val Asp Gly Asp Ser His Lys Pro Asn Ala Ala Ala Val Ala Ser 290 295 300 Val Val Ala Lys Ala Arg Asp Lys Gly Leu Ile Leu Leu Ser Cys Gly 305 310 315 320 Thr Tyr Gly Asn Val Leu Arg Val Leu Val Pro Leu Thr Ser Pro Asp 325 330 335 Glu Gln Leu Asp Lys Gly Leu Ala Ile Ile Glu Glu Cys Phe Ser Glu 340 345 350 Leu <210> 37 <400> 37 000 <210> 38 <211> 456 <212> PRT <213> Metagenomic <400> 38 Met Thr Thr Thr Ala Ala Asp Ile Thr Tyr Arg Leu Glu Gln Lys Arg 1 5 10 15 Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Val Ala Leu Thr Glu 20 25 30 Arg Arg Lys Ser Val Val Ala Ala Gly Val Ala Ser Ser Val Pro Val 35 40 45 Tyr Val Ala Asp Ala Asp Gly Gly Ile Ile Gln Asp Val Asp Gly Asn 50 55 60 Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala 65 70 75 80 Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His Phe 85 90 95 Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val 100 105 110 Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg Thr 115 120 125 Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val 130 135 140 Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala 145 150 155 160 Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met 165 170 175 Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met 180 185 190 Pro Met Ser Tyr Pro Tyr Arg Glu Glu Asn Pro Ser Ile Thr Gly Ala 195 200 205 Glu Ala Ala Lys Arg Ala Ile Thr Ala Ile Glu Lys Gln Ile Gly Gly 210 215 220 Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly 225 230 235 240 Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ala Ala Trp Ala 245 250 255 Lys Asp Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe 260 265 270 Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Val Val Pro 275 280 285 Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser 290 295 300 Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly 305 310 315 320 Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu 325 330 335 Ala Ser Ile Gly Ser Met Glu Glu Tyr Gly Leu Asn Ala Arg Ala Lys 340 345 350 His Ile Glu Glu Leu Ala Thr Thr Arg Leu Ser Ala Leu Gln Glu Glu 355 360 365 Leu Ala Gly Ala Gly Ser Ala Val Ile Gly Asp Ile Arg Gly Arg Gly 370 375 380 Ala Met Leu Ala Ile Glu Leu Val Gln Ala Gly Ser Lys Glu Pro Asn 385 390 395 400 Pro Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val 405 410 415 Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro 420 425 430 Pro Leu Val Ile Thr Asp Glu Leu Leu Asn Asp Gly Leu Asp Val Leu 435 440 445 Ala Ala Ala Ile Lys Ala Asn Ala 450 455 <210> 39 <400> 39 000 <210> 40 <400> 40 000 <210> 41 <400> 41 000 <210> 42 <400> 42 000 <210> 43 <400> 43 000 <210> 44 <400> 44 000 <210> 45 <400> 45 000 <210> 46 <400> 46 000 <210> 47 <400> 47 000 <210> 48 <400> 48 000 <210> 49 <400> 49 000 <210> 50 <211> 420 <212> PRT <213> Metagenomic <400> 50 Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg 1 5 10 15 Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala 20 25 30 Thr Leu Trp Asp Ala Glu Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly 35 40 45 Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Lys Ala Ala 50 55 60 Val Ala Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val 65 70 75 80 Pro Tyr Glu Gly Tyr Ile Ser Leu Ala Glu Arg Ile Asn Arg Leu Ala 85 90 95 Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu 100 105 110 Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ser Thr Gly Arg Ser 115 120 125 Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly 130 135 140 Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro 145 150 155 160 Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser 165 170 175 Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Val 180 185 190 Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln 195 200 205 Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu 210 215 220 Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val 225 230 235 240 Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His 245 250 255 Gly Val Gln Ala Asp Ile Ile Thr Met Ala Lys Ser Leu Gly Gly Gly 260 265 270 Phe Pro Ile Ser Gly Ile Val Gly Arg Ala Asp Val Met Asp Gly Pro 275 280 285 Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val 290 295 300 Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys 305 310 315 320 Glu Arg Ala Ala Gln Leu Gly Glu Lys Leu Arg Ala His Leu Glu Gly 325 330 335 Leu Arg Ala Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser 340 345 350 Met Val Ala Leu Glu Leu Asn Asp Ala Ala Gly Lys Pro Asp Ala Glu 355 360 365 Ala Val Lys Arg Val Gln Gln Arg Ala Leu Asp Ala Gly Leu Ile Leu 370 375 380 Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu 385 390 395 400 Thr Ile Pro Asp Ala Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser Glu 405 410 415 Ala Leu Ala Ala 420 <210> 51 <400> 51 000 <210> 52 <211> 429 <212> PRT <213> Metagenomic <400> 52 Met Leu Thr Gln Val Thr Thr Asn Ala Ser Leu Gln Ala Arg Lys Asn 1 5 10 15 Ala Ala Cys Ala Gln Gly Ile Gly Thr Leu Thr Pro His Phe Thr Ala 20 25 30 Arg Ala Asp Asn Ala Glu Leu Trp Asp Val Glu Gly Arg Arg Phe Val 35 40 45 Asp Phe Ala Ser Gly Ile Ala Thr Leu Ala Thr Gly His Arg His Pro 50 55 60 Arg Ile Val Ala Ala Val Arg Ala Gln Leu Asp Asp Phe His His Thr 65 70 75 80 Cys Phe His Val Thr Pro Tyr Glu Glu Tyr Val Ala Leu Cys Glu Gln 85 90 95 Leu Asn Arg Val Val Pro Gly Pro Ser Ala Lys Lys Ser Ala Leu Phe 100 105 110 Thr Thr Gly Ala Glu Ala Ile Glu Asn Ala Met Lys Val Ala Arg Ala 115 120 125 Ala Thr Gly Arg Ser Gly Val Val Ala Phe Ser Gly Ala Phe His Gly 130 135 140 Arg Thr Phe Met Gly Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys 145 150 155 160 Ala Gly Phe Gly Pro Met Pro Gly Asp Val Trp His Val Pro Phe Pro 165 170 175 Ala Ala Pro Leu Gly Val Thr Val Asp Asp Ser Ile Ala Ala Leu Asp 180 185 190 Arg Leu Phe Lys Thr Asp Val Asp Pro Gln Arg Val Ala Ala Ile Val 195 200 205 Ile Glu Leu Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Pro Ala 210 215 220 Leu Met Glu Tyr Leu Arg Ala Glu Cys Asp Arg His Gly Ile Leu Leu 225 230 235 240 Val Val Asp Glu Ile Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe 245 250 255 Ala Leu Glu His Tyr Gly Ile Glu Ala Asp Leu Val Thr Thr Ala Lys 260 265 270 Ser Leu Ala Gly Gly Phe Pro Leu Ser Ala Leu Thr Gly Arg Ala Glu 275 280 285 Leu Met Asp Ala Thr Arg Val Gly Ser Leu Gly Gly Thr Tyr Ala Gly 290 295 300 Asn Pro Leu Ala Val Ala Ala Ala Leu Glu Thr Met Arg Val Ile Glu 305 310 315 320 Asp Glu Gly Leu Val Ala Arg Ala Arg Met Leu Gly Glu Arg Leu Thr 325 330 335 Ala Cys Leu Ala Ala Leu Arg Thr Glu Val Pro Arg Ile Cys Asp Val 340 345 350 Arg Gly Leu Gly Ala Met Val Ala Val Glu Phe Arg Asp Pro His Ser 355 360 365 Gly Glu Pro Asp Ala Glu Phe Thr Lys Arg Val His Ala Ala Gly Leu 370 375 380 Glu Arg Gly Leu Leu Leu Leu Thr Cys Gly Val His Gly Asn Val Val 385 390 395 400 Arg Phe Leu Phe Pro Leu Thr Ile Pro Glu Ala Val Tyr Glu Glu Gly 405 410 415 Leu Gly Leu Leu Ala Glu Ser Ile Arg Ala Ala Asn Val 420 425 <210> 53 <400> 53 000 <210> 54 <400> 54 000 <210> 55 <400> 55 000 <210> 56 <211> 425 <212> PRT <213> Metagenomic <400> 56 Met Ser Lys Thr Asn Ala Ser Leu Met Lys Arg Arg Glu Ala Ala Val 1 5 10 15 Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Lys 20 25 30 Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala 35 40 45 Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Ile 50 55 60 Ala Ala Val Thr Ala Gln Leu Asn Lys Leu Thr His Thr Cys Phe Gln 65 70 75 80 Val Leu Ala Tyr Glu Pro Tyr Val Glu Leu Cys Glu Lys Ile Asn Ala 85 90 95 Lys Val Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly 100 105 110 Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Ala Thr Gly 115 120 125 Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met 130 135 140 Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met 145 150 155 160 Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Tyr Pro Asn Glu Leu 165 170 175 His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe 180 185 190 Lys Asn Asp Ala Glu Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro 195 200 205 Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys 210 215 220 Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp 225 230 235 240 Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu 245 250 255 Gln Met Gly Val Ala Ala Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala 260 265 270 Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp 275 280 285 Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile 290 295 300 Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu His 305 310 315 320 Leu Leu Asp Arg Cys Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu 325 330 335 Lys Ala Ile Gln Ala Lys Tyr Pro Val Ile Gly Glu Val Arg Ala Leu 340 345 350 Gly Ala Met Ile Ala Val Glu Leu Phe Val Asp Gly Asp Ser His Lys 355 360 365 Pro Asn Ala Pro Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys 370 375 380 Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Val 385 390 395 400 Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala 405 410 415 Ile Ile Glu Glu Cys Phe Ala Glu Leu 420 425 <210> 57 <400> 57 000 <210> 58 <400> 58 000 <210> 59 <400> 59 000 <210> 60 <400> 60 000 <210> 61 <400> 61 000 <210> 62 <400> 62 000 <210> 63 <400> 63 000 <210> 64 <211> 455 <212> PRT <213> Arthrobacter sp. Edens01 <400> 64 Met Thr Phe Thr Ala Ser Glu Ala Thr Leu Pro Gln Thr Arg His Leu 1 5 10 15 Ala Thr Ala Val Pro Gly Pro Arg Ser Arg Glu Leu His Ala Glu Arg 20 25 30 Arg Gln Gln Val Ser Ser Gly Phe Gly Thr Val Leu Pro Val Phe Ile 35 40 45 Glu Arg Ala Glu Gly Gly Ile Leu Gln Asp Val Asp Gly Asn Arg Phe 50 55 60 Ile Asp Phe Ala Ser Gly Ile Ala Val Thr Ser Val Gly Ala Ser Asn 65 70 75 80 Ala Arg Val Arg Glu Arg Val Ala Ala Gln Leu Glu Arg Phe Thr His 85 90 95 Thr Cys Phe Met Val Thr Glu Tyr Glu Ser Phe Thr Gln Val Cys Arg 100 105 110 Trp Leu Asn Glu His Thr Pro Gly Thr Phe Glu Lys Arg Thr Ala Leu 115 120 125 Phe Ser Thr Gly Ala Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg 130 135 140 Ala Ala Thr Gly Arg Pro Asn Val Leu Val Phe Asp Glu Ala Tyr His 145 150 155 160 Gly Arg Ser Leu Leu Thr Met Ala Met Thr Ala Lys Glu Asn Pro Tyr 165 170 175 Arg Leu Asn Phe Gly Pro Leu Pro Gly Glu Val Leu Arg Ala Pro Ser 180 185 190 Ala Asn Pro Leu Arg Pro Ser Arg Ala Ser Val Pro Gly Ala Asp Pro 195 200 205 Ala Ala Ala Ala Leu Ala Gly Val Glu Glu Leu Leu Ser Glu His Gly 210 215 220 Ala Gly Ser Phe Ala Ala Met Val Ile Glu Pro Ile Gln Gly Glu Gly 225 230 235 240 Gly Phe Val Val Pro Ala Pro Gly Phe Leu Gln Gly Leu Arg Ser Leu 245 250 255 Ala Asp Gln His Gly Ile Val Leu Val Ile Asp Glu Ile Gln Ala Gly 260 265 270 Met Gly Arg Thr Gly Thr Leu Tyr Ala Ser Glu His Glu Gly Val Ala 275 280 285 Gly Asp Ile Thr Leu Ser Ala Lys Ala Leu Ala Gly Gly Leu Pro Leu 290 295 300 Ser Ala Val Thr Gly Arg Ala Asp Leu Met Asp Ala Val His Thr Gly 305 310 315 320 Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Cys Glu Ala Ala 325 330 335 Leu Ala Val Phe Glu Glu Phe Glu Asp Gly Thr Leu Leu Ala Asn Ala 340 345 350 Arg Ala Ile Glu Glu Thr Val Arg Glu Val Leu Glu Pro Leu Val Ala 355 360 365 Gln Val Pro Ala Val Ala Glu Phe Arg Gly Arg Gly Ala Met Leu Ala 370 375 380 Leu Glu Phe Ala Asp Pro Glu Thr Leu Glu Pro Arg Ala Asp Leu Ala 385 390 395 400 Gln Ala Ala Ser Ala Ala Cys His Ala Gln Gly Val Leu Thr Leu Thr 405 410 415 Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val Ile 420 425 430 Pro Arg Asp Leu Leu Leu Asp Gly Leu His Val Leu Arg Ser Ala Ile 435 440 445 Leu Glu Ala Ala Ala Asn Ser 450 455 <210> 65 <400> 65 000 <210> 66 <400> 66 000 <210> 67 <400> 67 000 <210> 68 <400> 68 000 <210> 69 <400> 69 000 <210> 70 <400> 70 000 <210> 71 <400> 71 000 <210> 72 <400> 72 000 <210> 73 <400> 73 000 <210> 74 <211> 421 <212> PRT <213> Metagenomic <400> 74 Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg 1 5 10 15 Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala 20 25 30 Thr Leu Trp Asp Ala Asp Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly 35 40 45 Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Lys Ala Ala 50 55 60 Val Ser Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val 65 70 75 80 Pro Tyr Glu Gly Tyr Val Ser Leu Ala Glu Arg Ile Asn Arg Leu Ala 85 90 95 Pro Ile Asp Gly Leu Lys Lys Ser Ala Phe Phe Thr Thr Gly Val Glu 100 105 110 Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ser Thr Gly Arg Ser 115 120 125 Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly 130 135 140 Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro 145 150 155 160 Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser 165 170 175 Ile Thr Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Cys 180 185 190 Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln 195 200 205 Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu 210 215 220 Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val 225 230 235 240 Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His 245 250 255 Ser Val Gln Ala Asp Leu Ile Thr Met Ala Lys Ser Leu Gly Gly Gly 260 265 270 Phe Pro Ile Ser Gly Val Val Gly Arg Ala Glu Ile Met Asp Gly Pro 275 280 285 Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val 290 295 300 Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys 305 310 315 320 Glu Arg Ala Val Ala Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly 325 330 335 Leu Arg Ala Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser 340 345 350 Met Val Ala Leu Glu Leu Asn Asp Pro Ala Thr Gly Lys Pro Asp Ala 355 360 365 Glu Ala Val Lys Arg Val Gln Ala Arg Ala Ile Glu Lys Gly Leu Ile 370 375 380 Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro 385 390 395 400 Leu Thr Ile Pro Asp Ala Gln Phe Asp Arg Ala Leu Ala Ile Leu Ser 405 410 415 Glu Val Leu Ala Ala 420 <210> 75 <400> 75 000 <210> 76 <400> 76 000 <210> 77 <211> 420 <212> PRT <213> Metagenomic <400> 77 Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg 1 5 10 15 Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala 20 25 30 Thr Leu Trp Asp Ala Glu Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly 35 40 45 Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Lys Ala Ala 50 55 60 Val Thr Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val 65 70 75 80 Pro Tyr Glu Gly Tyr Ile Ser Leu Ala Glu Arg Ile Asn Arg Val Ala 85 90 95 Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu 100 105 110 Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ala Thr Gly Arg Ser 115 120 125 Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly 130 135 140 Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro 145 150 155 160 Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser 165 170 175 Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Val 180 185 190 Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln 195 200 205 Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu 210 215 220 Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val 225 230 235 240 Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His 245 250 255 Thr Val Gln Ala Asp Ile Ile Thr Met Ala Lys Ser Leu Gly Gly Gly 260 265 270 Phe Pro Ile Ser Gly Ile Val Gly Arg Ala Glu Ile Met Asp Gly Pro 275 280 285 Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val 290 295 300 Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys 305 310 315 320 Glu Arg Ala Thr Gln Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly 325 330 335 Leu Arg Gly Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser 340 345 350 Met Val Ala Leu Glu Leu Asn Asp Ala Ala Gly Lys Pro Asp Ala Glu 355 360 365 Ala Val Lys Arg Val Gln Lys Arg Ala Leu Asp Ala Gly Leu Ile Leu 370 375 380 Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu 385 390 395 400 Thr Ile Pro Asp Ala Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser Glu 405 410 415 Ala Leu Ala Ala 420 <210> 78 <400> 78 000 <210> 79 <400> 79 000 <210> 80 <211> 422 <212> PRT <213> Metagenomic <400> 80 Met Met Gln Arg Arg Val Ala Ala Val Pro Arg Gly Val Gly Gln Ile 1 5 10 15 His Pro Ile Phe Ala Asp His Ala Lys Asn Ser Ser Val Val Asp Val 20 25 30 Glu Gly Arg Glu Phe Ile Asp Phe Ala Gly Gly Ile Ala Val Leu Asn 35 40 45 Thr Gly His Leu His Pro Lys Ile Val Lys Ala Val Glu Glu Gln Leu 50 55 60 His Lys Leu Thr His Thr Cys Phe Gln Val Leu Ala Tyr Glu Pro Tyr 65 70 75 80 Ile Ala Leu Cys Glu Ala Ile Ala Lys Arg Val Pro Gly Asp Phe Ala 85 90 95 Lys Lys Thr Leu Leu Val Thr Ser Gly Ser Glu Ala Val Glu Asn Ala 100 105 110 Val Lys Ile Ala Arg Ala Ala Thr Gly Arg Ala Gly Val Ile Ala Phe 115 120 125 Thr Gly Ala Tyr His Gly Arg Thr Met Met Thr Leu Ser Leu Thr Gly 130 135 140 Lys Val Val Pro Tyr Ser Ala Gly Met Gly Leu Met Pro Gly Gly Val 145 150 155 160 Phe Arg Ala Leu Ala Pro Cys Pro Leu His Gly Ile Ser Glu Asp Asp 165 170 175 Ala Ile Ala Ser Ile Glu Arg Val Phe Lys Asn Asp Ala Gln Pro Arg 180 185 190 Asp Ile Ala Ala Ile Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe 195 200 205 Tyr Val Asn Ser Pro Ala Phe Met Gln Arg Leu Arg Ala Leu Cys Asp 210 215 220 Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Ala Gly 225 230 235 240 Arg Thr Gly Thr Phe Phe Ala Cys Glu Gln Leu Gly Ile Val Pro Asp 245 250 255 Leu Thr Thr Phe Ala Lys Ser Val Gly Gly Gly Phe Pro Ile Ser Gly 260 265 270 Val Cys Gly Lys Ala Glu Ile Met Asp Val Ile Ala Pro Gly Gly Leu 275 280 285 Gly Gly Thr Tyr Ala Gly Ser Pro Ile Ala Cys Ala Ala Ala Leu Ala 290 295 300 Val Met Glu Val Phe Glu Glu Glu Lys Leu Leu Glu Arg Ser Gln Ala 305 310 315 320 Val Gly Glu Lys Leu Lys Ala Gly Leu Asn Ala Ile Ala Ala Arg His 325 330 335 Lys Val Ile Gly Asp Val Arg Gly Leu Gly Ser Met Val Ala Ile Glu 340 345 350 Leu Phe Glu Gly Gly Asp His Ser Lys Pro Ala Ala Glu Leu Val Gly 355 360 365 Arg Ile Val Ala Arg Ala Arg Asp Lys Gly Leu Leu Leu Leu Ser Cys 370 375 380 Gly Thr Tyr Tyr Asn Val Ile Arg Phe Leu Met Pro Leu Thr Ile Pro 385 390 395 400 Asp Ala Gln Leu Glu Arg Gly Leu Ala Ile Val Ala Glu Cys Phe Asp 405 410 415 Glu Leu Ala Ser Glu Gln 420 <210> 81 <400> 81 000 <210> 82 <400> 82 000 <210> 83 <400> 83 000 <210> 84 <400> 84 000 <210> 85 <400> 85 000 <210> 86 <400> 86 000 <210> 87 <400> 87 000 <210> 88 <211> 422 <212> PRT <213> Metagenomic <400> 88 Met Thr Thr Met Thr Asp Arg Lys Asn Ala Ala Ile Ser Arg Gly Val 1 5 10 15 Gly Met Thr Thr Gln Ile Tyr Ala Glu Arg Ala Glu Asn Ala Glu Ile 20 25 30 Trp Asp Arg Glu Gly Arg Arg Tyr Ile Asp Phe Ala Ala Gly Ile Ala 35 40 45 Val Val Asn Thr Gly His Arg His Pro Lys Val Val Gln Ala Val Lys 50 55 60 Asp Gln Leu Asp Arg Phe Thr His Thr Cys His Gln Val Val Pro Tyr 65 70 75 80 Glu Asn Tyr Val Ala Leu Ala Glu Arg Leu Asn Asp Leu Val Pro Gly 85 90 95 Asp Phe Glu Lys Lys Thr Ile Phe Ala Thr Thr Gly Ala Glu Ala Val 100 105 110 Glu Asn Ala Val Lys Ile Ala Arg Phe Ala Thr Gly Arg Ser Ala Ile 115 120 125 Ile Ala Phe Thr Gly Ala Phe His Gly Arg Thr Phe Met Gly Met Thr 130 135 140 Leu Thr Gly Lys Val Gln Pro Tyr Lys Ala Gly Phe Gly Ala Met Met 145 150 155 160 Pro Asp Val Phe His Leu Pro Phe Pro Asn Glu Leu His Gly Val Ser 165 170 175 Gln Asp Asp Ala Leu Ala Ala Leu Asp Lys Leu Phe Lys Ala Asp Val 180 185 190 Asp Pro Ala Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln Gly Glu 195 200 205 Gly Gly Phe Tyr Pro Val Pro Ser Gly Phe Met Gln Lys Leu Arg Ala 210 215 220 Ile Cys Asp Asp Asn Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr 225 230 235 240 Gly Phe Ala Arg Thr Gly Arg Leu Phe Ala Met Glu His His Gly Val 245 250 255 Ser Ala Asp Ile Thr Thr Met Ala Lys Gly Leu Gly Gly Gly Leu Pro 260 265 270 Ile Ser Ala Val Thr Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro 275 280 285 Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Val Ala Ala 290 295 300 Ala His Ala Val Leu Asp Ile Ile Glu Glu Glu Gly Leu Cys Asp Arg 305 310 315 320 Ala Glu Arg Leu Gly Gln Arg Leu Lys Gln Arg Leu Ala Ser Leu Arg 325 330 335 Asp Asp Val Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Leu Met Asn 340 345 350 Ala Val Glu Phe Asn Val Ala Gly Ser Asp Arg Pro Asn Pro Glu Met 355 360 365 Thr Asn Arg Val Arg Glu Gln Ala Leu Lys Arg Gly Leu Ile Leu Leu 370 375 380 Thr Cys Gly Val His Gly Asn Val Ile Arg Phe Leu Pro Pro Leu Thr 385 390 395 400 Val Pro Asp Ala Val Phe Asp Glu Ala Leu Gly Ile Leu Glu Asp Ser 405 410 415 Ile Arg Ala Ala Arg Gly 420 <210> 89 <400> 89 000 <210> 90 <400> 90 000 <210> 91 <400> 91 000 <210> 92 <400> 92 000 <210> 93 <400> 93 000 <210> 94 <400> 94 000 <210> 95 <400> 95 000 <210> 96 <400> 96 000 <210> 97 <400> 97 000 <210> 98 <400> 98 000 <210> 99 <400> 99 000 <210> 100 <400> 100 000 <210> 101 <400> 101 000 <210> 102 <400> 102 000 <210> 103 <211> 422 <212> PRT <213> Metagenomic <400> 103 Met Thr Thr Met Thr Asp Arg Lys Asn Ala Ala Ile Ser Arg Gly Val 1 5 10 15 Gly Met Thr Thr Gln Ile Tyr Ala Glu Arg Ala Glu Asn Ala Glu Ile 20 25 30 Trp Asp Arg Glu Gly Arg Arg Tyr Ile Asp Phe Ala Ala Gly Ile Ala 35 40 45 Val Val Asn Thr Gly His Arg His Pro Lys Val Val Gln Ala Val Lys 50 55 60 Asp Gln Leu Asp Arg Phe Thr His Thr Cys His Gln Val Val Pro Tyr 65 70 75 80 Glu Asn Tyr Val Ser Leu Ala Glu Arg Leu Asn Glu Leu Val Pro Gly 85 90 95 Asp Phe Glu Lys Lys Thr Ile Phe Ala Thr Thr Gly Ala Glu Ala Val 100 105 110 Glu Asn Ala Val Lys Ile Ala Arg Phe Ala Thr Gly Arg Ser Ala Ile 115 120 125 Ile Ala Phe Thr Gly Ala Phe His Gly Arg Thr Phe Met Gly Met Thr 130 135 140 Leu Thr Gly Lys Val Gln Pro Tyr Lys Ala Gly Phe Gly Ala Met Met 145 150 155 160 Pro Asp Val Phe His Leu Pro Phe Pro Asn Glu Leu His Gly Val Ser 165 170 175 Gln Asp Asp Ala Leu Ala Ala Leu Asp Lys Leu Phe Lys Ala Asp Val 180 185 190 Asp Pro Ala Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln Gly Glu 195 200 205 Gly Gly Phe Tyr Pro Val Pro Ser Gly Phe Met Gln Lys Leu Arg Ala 210 215 220 Leu Cys Asp Asp Asn Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr 225 230 235 240 Gly Phe Ala Arg Thr Gly Arg Leu Phe Ala Met Glu Leu His Gly Val 245 250 255 Ala Ala Asp Ile Thr Thr Met Ala Lys Gly Leu Gly Gly Gly Leu Pro 260 265 270 Ile Ser Ala Val Thr Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro 275 280 285 Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Val Ala Ala 290 295 300 Ala His Ala Val Leu Asp Ile Ile Glu Glu Glu Gly Leu Cys Asp Arg 305 310 315 320 Ala Glu Arg Leu Gly Gln Arg Leu Lys Gln Arg Leu Ala Ser Leu Arg 325 330 335 Asp Asp Val Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Leu Met Asn 340 345 350 Ala Val Glu Phe Asn Val Ala Gly Ser Asp Arg Pro Asn Pro Glu Met 355 360 365 Thr Asn Arg Val Arg Glu Glu Ala Leu Glu Arg Gly Leu Ile Leu Leu 370 375 380 Thr Cys Gly Val Tyr Gly Asn Val Ile Arg Phe Leu Pro Pro Leu Thr 385 390 395 400 Val Pro Asp Ala Val Phe Asp Glu Ala Leu Gly Ile Leu Glu Asp Ser 405 410 415 Ile Arg Ala Ala Arg Gly 420 <210> 104 <400> 104 000 <210> 105 <211> 420 <212> PRT <213> Metagenomic <400> 105 Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg 1 5 10 15 Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala 20 25 30 Thr Leu Trp Asp Ala Glu Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly 35 40 45 Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Lys Ala Ala 50 55 60 Val Thr Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val 65 70 75 80 Pro Tyr Glu Gly Tyr Ile Ser Leu Ala Glu Arg Ile Asn Arg Val Ala 85 90 95 Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu 100 105 110 Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ala Thr Gly Arg Ser 115 120 125 Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly 130 135 140 Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro 145 150 155 160 Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser 165 170 175 Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Val 180 185 190 Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln 195 200 205 Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu 210 215 220 Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val 225 230 235 240 Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ser Met Glu His His 245 250 255 Ser Val Gln Ala Asp Ile Ile Thr Met Ala Lys Ser Leu Gly Gly Gly 260 265 270 Phe Pro Ile Ser Gly Val Val Gly Arg Ala Glu Ile Met Asp Gly Pro 275 280 285 Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val 290 295 300 Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys 305 310 315 320 Glu Arg Ala Ala Glu Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly 325 330 335 Leu Arg Gly Lys Val Ala Gly Ile Ala Asp Val Arg Gly Leu Gly Ser 340 345 350 Met Val Ala Leu Glu Leu Asn Asp Ala Ala Gly Lys Pro Asp Ala Glu 355 360 365 Ala Val Lys Arg Val Gln Lys Arg Ala Leu Asp Ala Gly Leu Ile Leu 370 375 380 Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu 385 390 395 400 Thr Ile Pro Asp Ala Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser Glu 405 410 415 Ala Leu Ala Ala 420 <210> 106 <400> 106 000 <210> 107 <400> 107 000 <210> 108 <400> 108 000 <210> 109 <211> 419 <212> PRT <213> Metagenomic <400> 109 Met Thr Asp Arg Lys Asn Ala Ala Ile Ser Arg Gly Val Gly Met Thr 1 5 10 15 Thr Gln Ile Tyr Ala Glu Arg Ala Glu Asn Ala Glu Ile Trp Asp Arg 20 25 30 Glu Gly Arg Arg Tyr Ile Asp Phe Ala Ala Gly Ile Ala Val Val Asn 35 40 45 Thr Gly His Arg His Pro Lys Val Val Gln Ala Val Lys Asp Gln Leu 50 55 60 Asp Arg Phe Thr His Thr Cys His Gln Val Val Pro Tyr Glu Asn Tyr 65 70 75 80 Val Ala Leu Ala Glu Arg Leu Asn Asp Leu Val Pro Gly Asp Phe Glu 85 90 95 Lys Lys Thr Ile Phe Ala Thr Thr Gly Ala Glu Ala Val Glu Asn Ala 100 105 110 Val Lys Ile Ala Arg Phe Ala Thr Gly Arg Ser Ala Ile Ile Ala Phe 115 120 125 Thr Gly Ala Phe His Gly Arg Thr Phe Met Gly Met Thr Leu Thr Gly 130 135 140 Lys Val Gln Pro Tyr Lys Ala Gly Phe Gly Ala Met Met Pro Asp Val 145 150 155 160 Phe His Leu Pro Phe Pro Asn Glu Leu His Gly Val Ser Gln Asp Asp 165 170 175 Ala Leu Ala Ala Leu Asp Lys Leu Phe Lys Ala Asp Val Asp Pro Ala 180 185 190 Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln Gly Glu Gly Gly Phe 195 200 205 Tyr Pro Val Pro Ser Gly Phe Met Gln Lys Leu Arg Ala Leu Cys Asp 210 215 220 Asp Asn Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Ala 225 230 235 240 Arg Thr Gly Arg Leu Phe Ala Met Glu Leu His Gly Val Ser Ala Asp 245 250 255 Ile Thr Thr Met Ala Lys Gly Leu Gly Gly Gly Leu Pro Ile Ser Ala 260 265 270 Val Thr Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro Gly Gly Leu 275 280 285 Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Val Ala Ala Ala His Ala 290 295 300 Val Leu Asp Ile Ile Glu Glu Glu Gly Leu Cys Asp Arg Ala Glu Arg 305 310 315 320 Leu Gly Gln Arg Leu Lys Gln Arg Leu Ala Ser Leu Arg Asp Asp Val 325 330 335 Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Leu Met Asn Ala Val Glu 340 345 350 Phe Asn Val Ala Gly Ser Asp Arg Pro Asn Pro Glu Met Thr Asn Arg 355 360 365 Val Arg Glu Glu Ala Leu Lys Arg Gly Leu Ile Leu Leu Thr Cys Gly 370 375 380 Val Tyr Gly Asn Val Val Arg Phe Leu Pro Pro Leu Thr Val Pro Asp 385 390 395 400 Ala Val Phe Asp Glu Ala Leu Gly Ile Leu Glu Asp Ser Ile Arg Ala 405 410 415 Ala Arg Gly <210> 110 <400> 110 000 <210> 111 <400> 111 000 <210> 112 <400> 112 000 <210> 113 <211> 424 <212> PRT <213> Metagenomic <400> 113 Met Lys Asn Asp Ala Ile Ser Asp Arg Lys Asn Ala Ala Ile Ser Arg 1 5 10 15 Gly Val Gly Met Thr Thr Gln Ile Tyr Ala Asp Arg Ala Glu Asn Ser 20 25 30 Glu Ile Trp Asp Val Glu Gly Arg Arg Tyr Ile Asp Phe Ser Ser Gly 35 40 45 Ile Ala Val Val Asn Thr Gly His Arg His Pro Lys Val Ile Ala Ala 50 55 60 Val Lys Glu Gln Leu Asp Arg Phe Thr His Thr Cys His Gln Val Val 65 70 75 80 Pro Tyr Glu Asn Tyr Val His Leu Ala Glu Arg Leu Asn Ser Met Leu 85 90 95 Pro Gly Lys Phe Glu Lys Lys Thr Val Phe Val Thr Thr Gly Ala Glu 100 105 110 Ala Val Glu Asn Ala Ile Lys Ile Ala Arg Ala Ala Thr Gly Arg Gln 115 120 125 Ala Ile Val Ser Phe Ser Gly Ala Phe His Gly Arg Thr Leu Leu Gly 130 135 140 Met Ala Leu Thr Gly Lys Val Val Pro Tyr Lys Val Gly Phe Gly Ala 145 150 155 160 Met Pro Gly Asp Val Phe His Val Pro Phe Pro Val Pro Leu His Gly 165 170 175 Val Ser Val Ala Asp Ser Leu Ala Ala Leu Asp Arg Leu Phe Lys Ala 180 185 190 Asp Val Asp Pro Asn Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln 195 200 205 Gly Glu Gly Gly Phe Tyr Glu Ala Pro Arg Glu Leu Thr Thr Ala Leu 210 215 220 Arg Arg Ile Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp Glu Val 225 230 235 240 Gln Thr Gly Phe Ala Arg Thr Gly Lys Met Phe Ala Met Glu His His 245 250 255 Asp Ala Ala Pro Asp Leu Thr Thr Met Ala Lys Ser Leu Ala Gly Gly 260 265 270 Phe Pro Leu Ser Ala Val Thr Gly Arg Ala Glu Leu Met Asp Ala Pro 275 280 285 Gly Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Ile 290 295 300 Ala Ala Ala His Ala Val Leu Asp Val Ile Glu Glu Glu Lys Leu Cys 305 310 315 320 Asp Arg Ala Asn Thr Leu Gly Asn Arg Leu Lys Gln Arg Leu Glu Ser 325 330 335 Leu Arg Asp Asp Val Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Phe 340 345 350 Met Asn Ala Ile Glu Phe Asn Asp Val Ala Lys Gly Leu Pro Ser Ala 355 360 365 Glu Ile Ala Asn Ala Ile Arg Leu Lys Ala Leu Asp Lys Gly Leu Ile 370 375 380 Leu Leu Thr Cys Gly Val Tyr Gly Asn Val Ile Arg Phe Leu Ala Pro 385 390 395 400 Ile Thr Ile Gln Asp Asn Val Met Asn Glu Ala Leu Asp Ile Leu Glu 405 410 415 Ser Ser Ile Arg Glu Ala Gln Ala 420 <210> 114 <400> 114 000 <210> 115 <400> 115 000 <210> 116 <400> 116 000 <210> 117 <400> 117 000 <210> 118 <400> 118 000 <210> 119 <400> 119 000 <210> 120 <400> 120 000 <210> 121 <400> 121 000 <210> 122 <400> 122 000 <210> 123 <400> 123 000 <210> 124 <400> 124 000 <210> 125 <400> 125 000 <210> 126 <400> 126 000 <210> 127 <400> 127 000 <210> 128 <400> 128 000 <210> 129 <400> 129 000 <210> 130 <211> 471 <212> PRT <213> Saccharomyces cerevisiae <400> 130 Met Ser Ile Cys Glu Gln Tyr Tyr Pro Glu Glu Pro Thr Lys Pro Thr 1 5 10 15 Val Lys Thr Glu Ser Ile Pro Gly Pro Glu Ser Gln Lys Gln Leu Lys 20 25 30 Glu Leu Gly Glu Val Phe Asp Thr Arg Pro Ala Tyr Phe Leu Ala Asp 35 40 45 Tyr Glu Lys Ser Leu Gly Asn Tyr Ile Thr Asp Val Asp Gly Asn Thr 50 55 60 Tyr Leu Asp Leu Tyr Ala Gln Ile Ser Ser Ile Ala Leu Gly Tyr Asn 65 70 75 80 Asn Pro Ala Leu Ile Lys Ala Ala Gln Ser Pro Glu Met Ile Arg Ala 85 90 95 Leu Val Asp Arg Pro Ala Leu Gly Asn Phe Pro Ser Lys Asp Leu Asp 100 105 110 Lys Ile Leu Lys Gln Ile Leu Lys Ser Ala Pro Lys Gly Gln Asp His 115 120 125 Val Trp Ser Gly Leu Ser Gly Ala Asp Ala Asn Glu Leu Ala Phe Lys 130 135 140 Ala Ala Phe Ile Tyr Tyr Arg Ala Lys Gln Arg Gly Tyr Asp Ala Asp 145 150 155 160 Phe Ser Glu Lys Glu Asn Leu Ser Val Met Asp Asn Asp Ala Pro Gly 165 170 175 Ala Pro His Leu Ala Val Leu Ser Phe Lys Arg Ala Phe His Gly Arg 180 185 190 Leu Phe Ala Ser Gly Ser Thr Thr Cys Ser Lys Pro Ile His Lys Leu 195 200 205 Asp Phe Pro Ala Phe His Trp Pro His Ala Glu Tyr Pro Ser Tyr Gln 210 215 220 Tyr Pro Leu Asp Glu Asn Ser Asp Ala Asn Arg Lys Glu Asp Asp His 225 230 235 240 Cys Leu Ala Ile Val Glu Glu Leu Ile Lys Thr Trp Ser Ile Pro Val 245 250 255 Ala Ala Leu Ile Ile Glu Pro Ile Gln Ser Glu Gly Gly Asp Asn His 260 265 270 Ala Ser Lys Tyr Phe Leu Gln Lys Leu Arg Asp Ile Thr Leu Lys Tyr 275 280 285 Asn Val Val Tyr Ile Ile Asp Glu Val Gln Thr Gly Val Gly Ala Thr 290 295 300 Gly Lys Leu Trp Cys His Glu Tyr Ala Asp Ile Gln Pro Pro Val Asp 305 310 315 320 Leu Val Thr Phe Ser Lys Lys Phe Gln Ser Ala Gly Tyr Phe Phe His 325 330 335 Asp Pro Lys Phe Ile Pro Asn Lys Pro Tyr Arg Gln Phe Asn Thr Trp 340 345 350 Cys Gly Glu Pro Ala Arg Met Ile Ile Ala Gly Ala Ile Gly Gln Glu 355 360 365 Ile Ser Asp Lys Lys Leu Thr Glu Gln Cys Ser Arg Val Gly Asp Tyr 370 375 380 Leu Phe Lys Lys Leu Glu Gly Leu Gln Lys Lys Tyr Pro Glu Asn Phe 385 390 395 400 Gln Asn Leu Arg Gly Lys Gly Arg Gly Thr Phe Ile Ala Trp Asp Leu 405 410 415 Pro Thr Gly Glu Lys Arg Asp Leu Leu Leu Lys Lys Leu Lys Leu Asn 420 425 430 Gly Cys Asn Val Gly Gly Cys Ala Val His Ala Val Arg Leu Arg Pro 435 440 445 Ser Leu Thr Phe Glu Glu Lys His Ala Asp Ile Phe Ile Glu Ala Leu 450 455 460 Ala Lys Ser Val Asn Glu Leu 465 470 <210> 131 <211> 450 <212> PRT <213> Clostridium viride <400> 131 Met Leu Lys Asn Ala Leu Pro Lys Ile Val Thr Glu Ser Leu Pro Gly 1 5 10 15 Pro Lys Ala Lys Ala Ile Ile Asp Arg Arg Ala Asn Ala Ile Pro Ser 20 25 30 Ala Ile Arg Cys Val Tyr Pro Val Val Ile Asp Arg Gly Glu Gly Ala 35 40 45 Met Val Glu Asp Val Asp Gly Asn His Phe Leu Asp Trp Ile Gly Gly 50 55 60 Val Gly Val Leu Asn Ile Gly Tyr Ser His Pro Glu Val Val Asp Ala 65 70 75 80 Val Lys Lys Gln Thr Glu Arg Tyr Phe His Gly Met Phe Asn Ile Val 85 90 95 Thr His Glu Gly Tyr Val Ala Leu Ala Glu Lys Leu Ser Thr Leu Ala 100 105 110 Pro Val Leu Gly Lys Glu Lys Lys Ala Phe Phe Ala Asn Ser Gly Ala 115 120 125 Glu Ala Asn Glu Asn Ala Ile Lys Ile Ala Lys Ala Tyr Thr Lys Arg 130 135 140 Pro Asn Ile Ile Val Phe Ser Gly Ala Phe His Gly Arg Thr Met Leu 145 150 155 160 Thr Met Ser Met Thr Ser Lys Lys Ala Tyr Ala Asn Gly Met Gly Pro 165 170 175 Phe Pro Asp Gly Val Tyr Arg Ala Lys Phe Pro Tyr Tyr Tyr Arg Asn 180 185 190 Pro Val Gly Leu Pro Gln Glu Glu Ala Val Asn Tyr Tyr Ile Glu Ser 195 200 205 Ile Lys Ser Val Phe Glu Glu Ala Ser Pro Pro Glu His Val Ala Ala 210 215 220 Ile Val Val Glu Pro Leu Gln Gly Glu Gly Gly Phe Ile Pro Ala Pro 225 230 235 240 Ile Glu Trp Val Lys Ala Val Arg Gln Leu Cys Asp Gln His Gly Ile 245 250 255 Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Cys Arg Ala Gly Lys 260 265 270 Met Phe Ala Ser Glu Tyr Trp Gln Gly Ala Gly Ala Ser Pro Asp Ile 275 280 285 Leu Thr Thr Ala Lys Ser Ile Ala Ala Gly Val Pro Ile Ser Ala Ile 290 295 300 Val Ala Arg Asn Glu Ile Met Asp Ala Val Pro Ala Gly Ile Ile Gly 305 310 315 320 Gly Thr Tyr Cys Gly Asn Pro Leu Ala Cys Ala Ala Ala Leu Lys Val 325 330 335 Ile Glu Val Met Glu Arg Asp Lys Phe Ala Gln Arg Ser Thr Glu Ile 340 345 350 Gly Lys Ile Ala Met Glu Arg Phe Gln Gln Phe Lys Gln Asn Tyr Pro 355 360 365 Val Val Gly Asp Val Arg Gly Leu Gly Ser Met Ile Gly Leu Glu Phe 370 375 380 Val Lys Asp Pro Val Ser Lys Glu Pro Asn Ala Pro Phe Val Asn Ala 385 390 395 400 Leu Val Gln Glu Ala Val Lys Arg Gly Leu Met Ile Glu Asn Ala Gly 405 410 415 Thr Tyr Gly Asn Val Ile Arg Phe Leu Ala Pro Leu Thr Ile Thr Asp 420 425 430 Glu Gln Leu Tyr Ala Gly Leu Asp Ile Met Glu Glu Ser Ile Lys Ala 435 440 445 Leu Leu 450 <210> 132 <211> 441 <212> PRT <213> Gulosibacter molinativorax <400> 132 Met Glu Phe Arg Leu Glu Gln Gln Arg Lys Ile Val Thr Glu Ile Pro 1 5 10 15 Gly Pro Lys Ser Glu Glu Leu Leu Lys Arg Arg Gln Gln Tyr Val Ser 20 25 30 Ser Ser Ile Gly Ser Ser Leu Pro Val Tyr Ile Gly Glu Ala Asp Gly 35 40 45 Ala Ile Leu Arg Asp Val Asp Gly Asn Gln Phe Ile Asp Phe Gly Ser 50 55 60 Gly Ile Gly Val Thr Thr Val Gly Asn Ala Asn Pro Lys Val Val Lys 65 70 75 80 Ala Ile Gln Asp Ala Ala Ala Ala Ser Thr His Leu Gln Ile Asn Thr 85 90 95 Ala Pro Tyr Gly Ser Tyr Val Asp Leu Cys Gln Lys Leu Thr Glu Leu 100 105 110 Thr Pro Gly Asp Phe Pro Lys Lys Ala Ala Leu Phe Asn Ser Gly Ala 115 120 125 Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Lys Tyr Thr Gly Arg 130 135 140 Asp Ala Val Ile Val Phe Asp His Ala Phe His Gly Arg Thr Asn Leu 145 150 155 160 Thr Met Ala Met Thr Ser Lys Ser Met Pro Tyr Lys Asp Gly Phe Gly 165 170 175 Pro Phe Ala Pro Glu Val Tyr Arg Ala Pro Leu Ser Tyr Pro Phe Arg 180 185 190 Asp Glu Leu Ser Gly Pro Glu Ala Ala Ala Arg Thr Ile Asp Val Ile 195 200 205 Asp Lys Gln Val Gly Ala Lys Asn Val Ala Ala Ile Ile Ile Glu Pro 210 215 220 Ile Val Gly Glu Gly Gly Phe Ile Val Pro Ala Glu Gly Phe Leu Pro 225 230 235 240 Ala Leu Val Glu Tyr Ala Asn Glu Asn Gly Ile Val Phe Val Ala Asp 245 250 255 Glu Val Gln Ala Gly Met Ser Arg Thr Gly Lys Trp Phe Cys Ser Glu 260 265 270 Trp Glu Gly Ile Glu Pro Asp Leu Val Thr Ser Ala Lys Gly Ile Ala 275 280 285 Gly Gly Met Pro Leu Ser Ala Val Val Gly Arg Ala Glu Ile Met Asp 290 295 300 Ala Pro His Thr Gly Gly Ile Gly Gly Thr Tyr Ala Gly Asn Pro Val 305 310 315 320 Ala Asn Ala Ala Ala Leu Ala Thr Ile Ala Ser Tyr Glu Glu Asp Gly 325 330 335 Leu Gln Glu Ala Ala Leu Arg Ile Glu Lys Thr Ile Arg Gly Val Leu 340 345 350 Glu Pro Leu Val Asp Glu Leu Asp Val Val Gly Glu Val Arg Gly Arg 355 360 365 Gly Ala Met Leu Ala Ile Glu Leu Val Thr Gly Ala Asp Lys Thr Pro 370 375 380 Asn Pro Glu Leu Val Lys Thr Val Val Ala Glu Ala Gln Ala Gln Gly 385 390 395 400 Val Val Phe Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Phe Leu 405 410 415 Pro Pro Leu Val Ile Thr Asp Glu Leu Leu Thr Asp Gly Leu Asn Val 420 425 430 Leu Val Asp Ala Ile Arg Lys Asn Ala 435 440 <210> 133 <211> 447 <212> PRT <213> Kocuria rhizophila <400> 133 Met Ala Glu Ile Glu Tyr Arg Leu Pro Gln Lys Arg Glu Leu Val Thr 1 5 10 15 Ser Ile Pro Gly Pro Lys Ser Gln Ser Leu Ala Glu Arg Arg Ala Gln 20 25 30 Thr Val Ala Ala Gly Val Ala Ser Ser Leu Pro Val Phe Ala Asp Glu 35 40 45 Leu Asp Gly Gly Val Ile Lys Asp Val Asp Gly Asn Gln Met Val Asp 50 55 60 Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala Ser Asn Pro Lys 65 70 75 80 Val Val Ala Arg Val Gln Asp Ala Val Ala Lys Phe Thr His Thr Cys 85 90 95 Phe Met Val Thr Pro Tyr Glu Asp Tyr Val Ala Val Gly Glu Lys Met 100 105 110 Ala Gln Leu Thr Pro Gly Ser Phe Asp Lys Arg Thr Ala Leu Phe Thr 115 120 125 Ser Gly Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Val Arg 130 135 140 Thr Lys Arg Gln Ala Val Val Val Phe Asp His Ala Tyr His Gly Arg 145 150 155 160 Thr Asn Leu Thr Met Ala Met Thr Ala Lys Val Met Pro Tyr Lys Gln 165 170 175 Gly Phe Gly Pro Phe Ala Asn Glu Val Tyr Arg Val Pro Met Ser Tyr 180 185 190 Pro Phe Arg Asp Pro Glu Gly Met Thr Gly Thr Glu Ala Ala Lys Arg 195 200 205 Ala Leu Thr Met Val Glu Lys Gln Val Gly Ala Glu Asn Val Ala Ala 210 215 220 Val Val Ile Glu Pro Ile Gln Gly Glu Gly Gly Phe Ile Val Pro Ala 225 230 235 240 Glu Gly Phe Leu Pro Ala Leu Ser Ser Trp Cys Arg Glu Asn Gly Ala 245 250 255 Val Phe Val Ala Asp Glu Val Gln Ala Gly Ile Ala Arg Thr Gly Ala 260 265 270 Trp Phe Ala Ser Glu His Glu Gly Val Glu Pro Asp Leu Val Thr Phe 275 280 285 Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser Gly Val Val Gly Arg 290 295 300 Ala Glu Ile Met Asp Ala Val His Pro Gly Gly Leu Gly Gly Thr Tyr 305 310 315 320 Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu Gly Ala Leu Glu Ala 325 330 335 Ile Glu Glu Trp Asp Leu Val Ala Arg Ala Gln Glu Ile Glu Lys Val 340 345 350 Ile Arg Glu Glu Leu Gly Ser Val Ala Glu Ser Ser Pro Val Val Gly 355 360 365 Asp Leu Arg Gly Arg Gly Ala Met Ile Ala Leu Glu Phe Val Lys Pro 370 375 380 Gly Thr Thr Glu Pro Asn Pro Asp Ala Ala Lys Gln Ile Ala Ala Arg 385 390 395 400 Cys Leu Glu Gln Gly Val Ala Ile Leu Thr Cys Gly Thr Tyr Gly Asn 405 410 415 Ile Val Arg Leu Leu Pro Pro Leu Val Ile Asp Met Asp Leu Leu Arg 420 425 430 Asp Ala Leu Gly Val Phe Ala Ala Ala Ile Gln Glu Val Gly Ala 435 440 445 <210> 134 <211> 468 <212> PRT <213> Arthrobacter sp. FB24 <400> 134 Met Val Glu Leu Val Glu Thr Arg Thr Gly Thr His Gln Lys Gly Ile 1 5 10 15 Pro Met Thr Ala Thr Ala Pro Asp Ile Thr Tyr Arg Leu Glu Gln Lys 20 25 30 Arg Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Val Ala Leu Thr 35 40 45 Glu Arg Arg Lys Ala Val Val Ala Ala Gly Val Ala Ser Ser Val Pro 50 55 60 Val Phe Val Ser Asp Ala Asp Gly Gly Ile Ile His Asp Val Asp Gly 65 70 75 80 Asn Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly 85 90 95 Ala Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His 100 105 110 Phe Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala 115 120 125 Val Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg 130 135 140 Thr Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys 145 150 155 160 Val Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His 165 170 175 Ala Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala 180 185 190 Met Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg 195 200 205 Met Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Ala Ile Thr Gly 210 215 220 Ala Glu Ala Ala Lys Arg Ala Ile Thr Ala Ile Glu Lys Gln Ile Gly 225 230 235 240 Gly Glu Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly 245 250 255 Gly Phe Ile Val Pro Ala Asp Gly Phe Leu Pro Ala Leu Ala Ala Trp 260 265 270 Ala Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly 275 280 285 Phe Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Val Val 290 295 300 Pro Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu 305 310 315 320 Ser Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly 325 330 335 Gly Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala 340 345 350 Leu Ala Ser Ile Gly Ser Met Glu Glu Tyr Asp Leu Asn Ala Arg Ala 355 360 365 Lys His Ile Glu Glu Leu Ala Thr Gly Arg Leu Arg Glu Leu Gln Gly 370 375 380 Glu Val Ser Val Ile Gly Asp Ile Arg Gly Arg Gly Ala Met Leu Ala 385 390 395 400 Ile Glu Leu Val Gln Ala Gly Ser Lys Glu Pro Asn Pro Glu Leu Thr 405 410 415 Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val Ile Ile Leu Thr 420 425 430 Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val Ile 435 440 445 Gly Asp Glu Leu Leu Leu Asp Gly Leu Glu Val Leu Ala Ala Ala Ile 450 455 460 Lys Ala His Ala 465 <210> 135 <211> 426 <212> PRT <213> Pseudomonas sp. AAC <400> 135 Met Ser Lys Thr Asn Glu Ser Leu Leu Gln Arg Arg Gln Ala Ala Val 1 5 10 15 Pro Arg Gly Val Gly Gln Ile His Pro Val Val Ala Glu Arg Ala Glu 20 25 30 Asn Ala Thr Val Trp Asp Val Glu Gly Arg Glu Tyr Ile Asp Phe Ala 35 40 45 Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Val 50 55 60 Ala Ala Val Gln Glu Gln Leu Thr Lys Leu Ser His Thr Cys Phe Gln 65 70 75 80 Val Leu Ala Tyr Glu Pro Tyr Ile Glu Leu Ala Glu Glu Ile Ala Lys 85 90 95 Arg Val Pro Gly Asn Phe Pro Lys Lys Thr Leu Leu Val Thr Ser Gly 100 105 110 Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Ala Thr Gly 115 120 125 Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met 130 135 140 Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met 145 150 155 160 Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Ala Pro Cys Glu Leu 165 170 175 His Gly Ile Ser Glu Asp Glu Ser Ile Ala Ser Ile Glu Arg Ile Phe 180 185 190 Lys Asn Asp Ala Gln Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro 195 200 205 Val Gln Gly Glu Gly Gly Phe Tyr Val Asn Ser Lys Pro Phe Met Gln 210 215 220 Arg Leu Arg Ala Leu Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp 225 230 235 240 Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Thr Glu 245 250 255 Gln Leu Gly Ile Val Pro Asp Leu Thr Thr Phe Ala Lys Ser Val Gly 260 265 270 Gly Gly Phe Pro Ile Ser Gly Val Val Gly Lys Ala Glu Ile Met Asp 275 280 285 Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile 290 295 300 Ala Cys Ala Ala Ala Leu Ala Val Leu Lys Val Phe Asp Glu Glu Lys 305 310 315 320 Leu Leu Glu Arg Ser Gln Ala Val Gly Glu Thr Leu Lys Ala Gly Leu 325 330 335 Arg Glu Ile Gln Ala Lys His Lys Val Ile Gly Asp Val Arg Gly Leu 340 345 350 Gly Ser Met Val Ala Ile Glu Leu Phe Glu Gly Gly Asp Val Asn Lys 355 360 365 Pro Ala Ala Glu Leu Val Ser Lys Ile Val Val Arg Ala Arg Glu Lys 370 375 380 Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Tyr Asn Val Ile Arg Phe 385 390 395 400 Leu Met Pro Val Thr Ile Pro Asp Ala Gln Leu Lys Gln Gly Leu Ala 405 410 415 Ile Leu Ala Glu Cys Phe Asp Glu Leu Ala 420 425 <210> 136 <211> 426 <212> PRT <213> Pseudomonas putida KG-4 <400> 136 Met Ser Lys Thr Asn Glu Ser Leu Met Gln Arg Arg Val Ala Ala Val 1 5 10 15 Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Arg 20 25 30 Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala 35 40 45 Gly Gly Ile Ala Val Leu Asn Thr Gly His Val His Pro Lys Ile Ile 50 55 60 Ala Ala Val Glu Ala Gln Leu His Lys Leu Thr His Thr Cys Phe Gln 65 70 75 80 Val Leu Ala Tyr Glu Pro Tyr Val Glu Val Cys Glu Lys Ile Asn Ala 85 90 95 Leu Ile Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly 100 105 110 Ser Glu Ala Val Glu Asn Ala Ile Lys Ile Ala Arg Ala Ala Thr Gly 115 120 125 Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met 130 135 140 Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met 145 150 155 160 Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Ile Tyr Pro Asn Glu Leu 165 170 175 His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe 180 185 190 Lys Asn Asp Ala Glu Ala Lys Asp Ile Ala Ala Ile Ile Leu Glu Pro 195 200 205 Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys 210 215 220 Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp 225 230 235 240 Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu 245 250 255 Gln Met Gly Val Ala Pro Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala 260 265 270 Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp 275 280 285 Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile 290 295 300 Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu Lys 305 310 315 320 Leu Leu Asp Arg Ser Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu 325 330 335 Arg Lys Ile Gln Asp Lys His Pro Ile Ile Gly Asp Val Arg Ala Leu 340 345 350 Gly Ser Met Ile Ala Val Glu Val Phe Asp Lys Ala Gly Ser His Thr 355 360 365 Pro Asn Pro Thr Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys 370 375 380 Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Ile 385 390 395 400 Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala 405 410 415 Ile Ile Glu Glu Cys Phe Ala Glu Leu Ala 420 425 <210> 137 <211> 442 <212> PRT <213> Alcaligenes A. faecalis <400> 137 Met Ser Lys Asp Lys Ala Met Leu Asn Ala Phe Asp Pro Ala Ala Ala 1 5 10 15 Asp Ser Leu Pro Ala Ala Glu Arg Ala Leu Ile Glu Arg Arg Gln Arg 20 25 30 Val Leu Gly Thr Ala Tyr Arg Leu Phe Tyr Asp Asn Pro Leu His Ile 35 40 45 Val Arg Gly Glu Gly Val Trp Leu Tyr Asp Ala Ala Gly Glu Arg Tyr 50 55 60 Leu Asp Ala Tyr Asn Asn Val Ala Ser Val Gly His Ser His Pro Arg 65 70 75 80 Val Val Ala Ala Ile Ala Glu Gln Ala Ala Ile Leu Asn Thr His Thr 85 90 95 Arg Tyr Leu His Asp Gly Val Val Glu Tyr Ala Glu Arg Leu Val Ala 100 105 110 Thr Phe Pro Ser Ala Leu Ser Gln Ala Met Phe Thr Cys Thr Gly Ser 115 120 125 Glu Ala Asn Asp Leu Ala Leu Arg Ile Ala Arg Ser His Thr Gly Ala 130 135 140 Ser Gly Val Ile Val Thr Glu Leu Ala Tyr His Gly Val Thr Ala Ala 145 150 155 160 Val Ala Ala Val Ser Pro Ser Leu Gly Lys Thr Val Pro Leu Gly Val 165 170 175 Asp Val Arg Ala Val Ser Ala Pro Asp Thr Tyr Arg His Asp Pro Ala 180 185 190 Thr Ile Gly Val Trp Phe Ala Ala Arg Val Gln Glu Ala Ile Asp Asp 195 200 205 Met Leu Arg His Gly Ile Arg Pro Ala Ala Leu Leu Val Asp Thr Val 210 215 220 Phe Ser Ser Asp Gly Val Tyr Thr Asp Pro Ala Pro Phe Leu Ala Pro 225 230 235 240 Ala Val Glu Ala Ile Arg Ala Ala Gly Gly Leu Phe Ile Ala Asp Glu 245 250 255 Val Gln Ala Gly Phe Ala Arg Thr Gly Ser Cys Met Trp Gly Phe Gln 260 265 270 Arg His Gly Leu Val Pro Asp Ile Val Thr Met Gly Lys Pro Met Gly 275 280 285 Asn Gly His Pro Ile Ala Gly Val Val Ala Arg Pro Glu Ile Phe Glu 290 295 300 Arg Phe Gly Arg Asp Ala Arg Tyr Phe Asn Thr Phe Gly Gly Asn Pro 305 310 315 320 Val Ser Cys Ala Ala Ala Leu Ala Thr Leu Asp Val Ile Gln Asp Glu 325 330 335 Gly Leu Gln Ala Asn Ala Ala Arg Thr Gly Ala Tyr Leu Arg Asp Lys 340 345 350 Phe Arg Glu Met Ala Arg Lys His Ser Trp Ile Gly Asp Val Arg Gly 355 360 365 Asp Gly Leu Phe Met Gly Ile Glu Leu Val Lys Asp Gln Ala Ala Lys 370 375 380 Thr Pro Ala Thr Glu Glu Thr His Arg Phe Val Asn Leu Met Arg Glu 385 390 395 400 His Arg Val Leu Leu Ser Ala Thr Gly Leu Arg Gly Asn Val Ile Lys 405 410 415 Leu Arg Pro Gln Leu Pro Phe Ser Leu Glu Asn Ala Asp Gln Leu Met 420 425 430 Gln Ala Ala Asp Glu Val Phe Ala Lys Leu 435 440 <210> 138 <211> 453 <212> PRT <213> Clostridium kluyveri DSM555 <400> 138 Met Ser Asn Glu Val Ser Ile Lys Glu Leu Ile Glu Lys Ala Lys Val 1 5 10 15 Ala Gln Lys Lys Leu Glu Ala Tyr Ser Gln Glu Gln Val Asp Val Leu 20 25 30 Val Lys Ala Leu Gly Lys Val Val Tyr Asp Asn Ala Glu Met Phe Ala 35 40 45 Lys Glu Ala Val Glu Glu Thr Glu Met Gly Val Tyr Glu Asp Lys Val 50 55 60 Ala Lys Cys His Leu Lys Ser Gly Ala Ile Trp Asn His Ile Lys Asp 65 70 75 80 Lys Lys Thr Val Gly Ile Ile Lys Glu Glu Pro Glu Arg Ala Leu Val 85 90 95 Tyr Val Ala Lys Pro Lys Gly Val Val Ala Ala Thr Thr Pro Ile Thr 100 105 110 Asn Pro Val Val Thr Pro Met Cys Asn Ala Met Ala Ala Ile Lys Gly 115 120 125 Arg Asn Thr Ile Ile Val Ala Pro His Pro Lys Ala Lys Lys Val Ser 130 135 140 Ala His Thr Val Glu Leu Met Asn Ala Glu Leu Lys Lys Leu Gly Ala 145 150 155 160 Pro Glu Asn Ile Ile Gln Ile Val Glu Ala Pro Ser Arg Glu Ala Ala 165 170 175 Lys Glu Leu Met Glu Ser Ala Asp Val Val Ile Ala Thr Gly Gly Ala 180 185 190 Gly Arg Val Lys Ala Ala Tyr Ser Ser Gly Arg Pro Ala Tyr Gly Val 195 200 205 Gly Pro Gly Asn Ser Gln Val Ile Val Asp Lys Gly Tyr Asp Tyr Asn 210 215 220 Lys Ala Ala Gln Asp Ile Ile Thr Gly Arg Lys Tyr Asp Asn Gly Ile 225 230 235 240 Ile Cys Ser Ser Glu Gln Ser Val Ile Ala Pro Ala Glu Asp Tyr Asp 245 250 255 Lys Val Ile Ala Ala Phe Val Glu Asn Gly Ala Phe Tyr Val Glu Asp 260 265 270 Glu Glu Thr Val Glu Lys Phe Arg Ser Thr Leu Phe Lys Asp Gly Lys 275 280 285 Ile Asn Ser Lys Ile Ile Gly Lys Ser Val Gln Ile Ile Ala Asp Leu 290 295 300 Ala Gly Val Lys Val Pro Glu Gly Thr Lys Val Ile Val Leu Lys Gly 305 310 315 320 Lys Gly Ala Gly Glu Lys Asp Val Leu Cys Lys Glu Lys Met Cys Pro 325 330 335 Val Leu Val Ala Leu Lys Tyr Asp Thr Phe Glu Glu Ala Val Glu Ile 340 345 350 Ala Met Ala Asn Tyr Met Tyr Glu Gly Ala Gly His Thr Ala Gly Ile 355 360 365 His Ser Asp Asn Asp Glu Asn Ile Arg Tyr Ala Gly Thr Val Leu Pro 370 375 380 Ile Ser Arg Leu Val Val Asn Gln Pro Ala Thr Thr Ala Gly Gly Ser 385 390 395 400 Phe Asn Asn Gly Phe Asn Pro Thr Thr Thr Leu Gly Cys Gly Ser Trp 405 410 415 Gly Arg Asn Ser Ile Ser Glu Asn Leu Thr Tyr Glu His Leu Ile Asn 420 425 430 Val Ser Arg Ile Gly Tyr Phe Asn Lys Glu Ala Lys Val Pro Ser Tyr 435 440 445 Glu Glu Ile Trp Gly 450 <210> 139 <211> 451 <212> PRT <213> Porphyromonas gingivalis W83 <400> 139 Met Glu Ile Lys Glu Met Val Ser Leu Ala Arg Lys Ala Gln Lys Glu 1 5 10 15 Tyr Gln Ala Thr His Asn Gln Glu Ala Val Asp Asn Ile Cys Arg Ala 20 25 30 Ala Ala Lys Val Ile Tyr Glu Asn Ala Ala Ile Leu Ala Arg Glu Ala 35 40 45 Val Asp Glu Thr Gly Met Gly Val Tyr Glu His Lys Val Ala Lys Asn 50 55 60 Gln Gly Lys Ser Lys Gly Val Trp Tyr Asn Leu His Asn Lys Lys Ser 65 70 75 80 Ile Gly Ile Leu Asn Ile Asp Glu Arg Thr Gly Met Ile Glu Ile Ala 85 90 95 Lys Pro Ile Gly Val Val Gly Ala Val Thr Pro Thr Thr Asn Pro Ile 100 105 110 Val Thr Pro Met Ser Asn Ile Ile Phe Ala Leu Lys Thr Cys Asn Ala 115 120 125 Ile Ile Ile Ala Pro His Pro Arg Ser Lys Lys Cys Ser Ala His Ala 130 135 140 Val Arg Leu Ile Lys Glu Ala Ile Ala Pro Phe Asn Val Pro Glu Gly 145 150 155 160 Met Val Gln Ile Ile Glu Glu Pro Ser Ile Glu Lys Thr Gln Glu Leu 165 170 175 Met Gly Ala Val Asp Val Val Val Ala Thr Gly Gly Met Gly Met Val 180 185 190 Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ser Phe Gly Val Gly Ala Gly 195 200 205 Asn Val Gln Val Ile Val Asp Ser Asn Ile Asp Phe Glu Ala Ala Ala 210 215 220 Glu Lys Ile Ile Thr Gly Arg Ala Phe Asp Asn Gly Ile Ile Cys Ser 225 230 235 240 Gly Glu Gln Ser Ile Ile Tyr Asn Glu Ala Asp Lys Glu Ala Val Phe 245 250 255 Thr Ala Phe Arg Asn His Gly Ala Tyr Phe Cys Asp Glu Ala Glu Gly 260 265 270 Asp Arg Ala Arg Ala Ala Ile Phe Glu Asn Gly Ala Ile Ala Lys Asp 275 280 285 Val Val Gly Gln Ser Val Ala Phe Ile Ala Lys Lys Ala Asn Ile Asn 290 295 300 Ile Pro Glu Gly Thr Arg Ile Leu Val Val Glu Ala Arg Gly Val Gly 305 310 315 320 Ala Glu Asp Val Ile Cys Lys Glu Lys Met Cys Pro Val Met Cys Ala 325 330 335 Leu Ser Tyr Lys His Phe Glu Glu Gly Val Glu Ile Ala Arg Thr Asn 340 345 350 Leu Ala Asn Glu Gly Asn Gly His Thr Cys Ala Ile His Ser Asn Asn 355 360 365 Gln Ala His Ile Ile Leu Ala Gly Ser Glu Leu Thr Val Ser Arg Ile 370 375 380 Val Val Asn Ala Pro Ser Ala Thr Thr Ala Gly Gly His Ile Gln Asn 385 390 395 400 Gly Leu Ala Val Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn 405 410 415 Ser Ile Ser Glu Asn Phe Thr Tyr Lys His Leu Leu Asn Ile Ser Arg 420 425 430 Ile Ala Pro Leu Asn Ser Ser Ile His Ile Pro Asp Asp Lys Glu Ile 435 440 445 Trp Glu Leu 450 <210> 140 <211> 463 <212> PRT <213> Clostridium difficile 630 <400> 140 Met Glu Lys Ala Val Glu Asn Phe Glu Asp Leu Ser Lys Glu Tyr Ile 1 5 10 15 Asn Gly Tyr Ile Glu Arg Ala Arg Lys Ala Gln Arg Glu Phe Glu Cys 20 25 30 Tyr Thr Gln Glu Gln Val Asp Lys Ile Val Lys Ile Val Gly Lys Val 35 40 45 Val Tyr Tyr Asn Ala Glu Tyr Leu Ala Lys Leu Ala Val Glu Glu Thr 50 55 60 Gly Met Gly Val Tyr Glu Asp Lys Val Ala Lys Asn Lys Ser Lys Ala 65 70 75 80 Lys Val Ile Tyr Asn Asn Leu Lys Asp Lys Lys Ser Val Gly Ile Ile 85 90 95 Asp Ile Asp Arg Glu Thr Gly Ile Thr Lys Val Ala Lys Pro Val Gly 100 105 110 Val Val Ala Ala Ile Thr Pro Cys Thr Asn Pro Ile Val Thr Pro Met 115 120 125 Ser Asn Ala Met Phe Ala Leu Lys Gly Arg Asn Ala Ile Ile Ile Thr 130 135 140 Pro His His Lys Ala Ile Gly Cys Ser Thr Lys Thr Val Glu Met Ile 145 150 155 160 Asn Glu Glu Leu Glu Lys Ile Gly Ala Pro Glu Asn Leu Ile Gln Ile 165 170 175 Leu Asp Gln Gln Ser Arg Glu Asn Thr Arg Asn Leu Ile Ser Ser Ala 180 185 190 Asp Val Val Ile Ala Thr Gly Gly Met Gly Met Val Lys Ala Ala Tyr 195 200 205 Ser Ser Gly Lys Pro Ala Leu Gly Val Gly Ala Gly Asn Val Gln Cys 210 215 220 Ile Ile Asp Arg Asp Val Asp Ile Lys Glu Ala Val Pro Lys Ile Ile 225 230 235 240 Ala Gly Arg Ile Phe Asp Asn Gly Ile Ile Cys Ser Gly Glu Gln Ser 245 250 255 Val Ile Val Ala Glu Glu Met Phe Asp Lys Ile Met Asp Glu Phe Lys 260 265 270 Asn Asn Lys Gly Phe Ile Val Arg Asp Lys Val Gln Lys Glu Ala Phe 275 280 285 Arg Asn Ala Met Phe Val Asn Lys Ser Met Asn Lys Asp Ala Val Gly 290 295 300 Gln Ser Val His Thr Ile Ala Lys Ile Ala Gly Val Glu Ile Pro Glu 305 310 315 320 Asp Thr Lys Ile Ile Val Ile Glu Ala Asp Gly Pro Gly Glu Glu Asp 325 330 335 Ile Ile Ala Lys Glu Lys Met Cys Pro Val Ile Ser Ala Tyr Lys Tyr 340 345 350 Lys Ser Phe Glu Glu Gly Val Ala Ile Ala Lys Ala Asn Leu Asn Val 355 360 365 Glu Gly Lys Gly His Ser Val Ser Ile His Ser Asn Thr Val Lys Asn 370 375 380 Ile Glu Tyr Ala Gly Glu Asn Ile Glu Val Ser Arg Phe Val Ile Asn 385 390 395 400 Gln Cys Cys Ala Thr Ser Ala Gly Gly Ser Phe Phe Asn Gly Leu Ala 405 410 415 Pro Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn Ser Ile Ser 420 425 430 Glu Asn Leu Asp Tyr Lys His Leu Ile Asn Ile Ser Arg Ile Ala Tyr 435 440 445 Tyr Met Pro Glu Asn Glu Val Pro Thr Asp Glu Glu Leu Trp Gly 450 455 460 <210> 141 <211> 364 <212> PRT <213> Candida tropicalis <400> 141 Met Ile Thr Ala Gln Ala Val Leu Tyr Thr Gln His Gly Glu Pro Lys 1 5 10 15 Asp Val Leu Phe Thr Gln Ser Phe Glu Ile Asp Asp Asp Asn Leu Ala 20 25 30 Pro Asn Glu Val Ile Val Lys Thr Leu Gly Ser Pro Val Asn Pro Ser 35 40 45 Asp Ile Asn Gln Ile Gln Gly Val Tyr Pro Ser Lys Pro Ala Lys Thr 50 55 60 Thr Gly Phe Gly Thr Thr Glu Pro Ala Ala Pro Cys Gly Asn Glu Gly 65 70 75 80 Leu Phe Glu Val Ile Lys Val Gly Ser Asn Val Leu Ser Leu Glu Ala 85 90 95 Gly Asp Trp Val Ile Pro Ser His Val Asn Phe Gly Thr Trp Arg Thr 100 105 110 His Ala Leu Gly Asn Asp Asp Asp Phe Ile Lys Leu Pro Asn Pro Ala 115 120 125 Gln Ser Lys Ala Asn Gly Lys Pro Asn Gly Leu Thr Ile Asn Gln Gly 130 135 140 Ala Thr Ile Ser Val Asn Pro Leu Thr Ala Tyr Leu Met Leu Thr His 145 150 155 160 Tyr Val Lys Leu Thr Pro Gly Lys Asp Trp Phe Ile Gln Asn Gly Gly 165 170 175 Thr Ser Ala Val Gly Lys Tyr Ala Ser Gln Ile Gly Lys Leu Leu Asn 180 185 190 Phe Asn Ser Ile Ser Val Ile Arg Asp Arg Pro Asn Leu Asp Glu Val 195 200 205 Val Ala Ser Leu Lys Glu Leu Gly Ala Thr Gln Val Ile Thr Glu Asp 210 215 220 Gln Asn Asn Ser Arg Glu Phe Gly Pro Thr Ile Lys Glu Trp Ile Lys 225 230 235 240 Gln Ser Gly Gly Glu Ala Lys Leu Ala Leu Asn Cys Val Gly Gly Lys 245 250 255 Ser Ser Thr Gly Ile Ala Arg Lys Leu Asn Asn Asn Gly Leu Met Leu 260 265 270 Thr Tyr Gly Gly Met Ser Phe Gln Pro Val Thr Ile Pro Thr Ser Leu 275 280 285 Tyr Ile Phe Lys Asn Phe Thr Ser Ala Gly Phe Trp Val Thr Glu Leu 290 295 300 Leu Lys Asn Asn Lys Glu Leu Lys Thr Leu Thr Leu Asn Gln Ile Ile 305 310 315 320 Ala Trp Tyr Glu Glu Gly Lys Leu Thr Asp Ala Lys Ser Ile Glu Thr 325 330 335 Leu Tyr Asp Gly Thr Lys Pro Leu His Glu Leu Tyr Gln Asp Gly Val 340 345 350 Ala Asn Ser Lys Asp Gly Lys Gln Leu Ile Thr Tyr 355 360 <210> 142 <211> 340 <212> PRT <213> Drosophila melanogaster <400> 142 Met Met Ser Val Val Ala Lys Ser Leu Lys Tyr Thr Gln His Gly Glu 1 5 10 15 Pro Gln Glu Val Leu Gln Leu Val Glu Asp Lys Leu Pro Asp Pro Lys 20 25 30 Asp Asn Gln Val Leu Val Lys Ile Leu Ala Ala Pro Ile Asn Pro Ala 35 40 45 Asp Ile Asn Thr Ile Gln Gly Lys Tyr Pro Val Lys Pro Lys Phe Pro 50 55 60 Ala Val Gly Gly Asn Glu Cys Val Ala Glu Val Ile Cys Val Gly Asp 65 70 75 80 Lys Val Lys Gly Phe Glu Ala Gly Gln His Val Ile Pro Leu Ala Ser 85 90 95 Gly Leu Gly Thr Trp Thr Thr His Ala Val Tyr Lys Glu Asp Gln Leu 100 105 110 Leu Ile Val Ser Lys Lys Val Gly Leu Ala Glu Ala Ala Thr Ser Thr 115 120 125 Val Asn Pro Thr Thr Ala Tyr Arg Met Leu Lys Asp Phe Val Gln Leu 130 135 140 Cys Pro Gly Asp Thr Val Ile Gln Asn Gly Ala Asn Ser Ala Val Gly 145 150 155 160 Gln Ala Val His Gln Leu Cys Arg Ala Trp Gly Ile Asn Ser Val Gly 165 170 175 Ile Val Arg Asp Arg Pro Glu Ile Ala Glu Leu Lys Gln Met Leu Gln 180 185 190 Cys Leu Gly Ala Thr Glu Val Leu Thr Glu Ala Glu Ile Arg Thr Ser 195 200 205 Asp Ile Phe Lys Ser Gly Lys Leu Lys Lys Pro Arg Leu Ala Phe Asn 210 215 220 Cys Val Gly Gly Lys Ser Ala Thr Glu Val Ser Arg His Leu Asp Asn 225 230 235 240 Gly Gly Val Leu Val Thr Tyr Gly Gly Met Ser Arg Glu Pro Val Thr 245 250 255 Val Ala Thr Gly Pro Leu Ile Phe Lys Asp Ile Ala Phe Arg Gly Phe 260 265 270 Trp Met Thr Arg Trp Ser Lys Glu Asn Tyr Ser Ser Pro Glu Arg Ser 275 280 285 Lys Met Phe Lys Glu Ile Phe Glu Leu Met Glu Gln Gly Lys Phe Val 290 295 300 Ala Pro Asn His Glu Met Val Pro Leu Ala Lys Phe Lys Asp Ala Ala 305 310 315 320 Ala Ala Ala Leu Ser Phe Lys Gly Phe Thr Gly Lys Lys Tyr Ile Leu 325 330 335 Asp Met Ser Ile 340 <210> 143 <211> 1266 <212> DNA <213> Achromobacter xylosoxidans <400> 143 atgaagaatc aggacctgaa tacccgccgt tccctggcca cgccgcgcgg cgtcggcgtc 60 atgtgcgact tctacgcggt gcgcgccgaa aacgccaccc tgtgggacgc caatggcaag 120 gaatacatcg atttcgcagg cggcatcgcc gtcctgaaca cgggccacct gcacccgaag 180 atcaaggccg ccgttgccgc gcagctggac aacttcacgc acacggccta ccagatcgtg 240 ccgtacgaag gctatgtctc gctggccgag cgcatcaacc gcctcgcccc catcgacggc 300 ctgaagaaga gcgccttctt caccaccggc gtggaagccg tcgaaaacgc cgtcaagatc 360 gcgcgttcgg ccaccggccg ctcgggcgtc atcgccttct cgggctcgtt ccacggccgc 420 accatgctgg gcatggcgct gactggcaag gtcgccccgt acaagctgtc gttcggtccg 480 atgccgggcg acatctatca cgtgcccttc cccaacgcca cccagtccat cagcgtggcg 540 gactcgctca aggcgctgga cctgctgttc aagtgcgaca tcgatcccaa gcgcgtcgcg 600 gccatcatca tcgaaccggt gcagggtgaa ggcggcttca acatcacccc gcccgagttg 660 atgacggcgc tgcgcaaggt ctgcgacgag cacggcattc tgctgatcgc cgacgaagtc 720 cagaccggct tcggccgcac cggcaagctg ttcgccatgg agcaccactc ggtccaggcc 780 gacctgatca ccatggccaa gagcctgggc ggcggcttcc cgatatcggg cgtggtcggc 840 cgcgccgacg tcatggacgc gcccgccgcc ggcggcctgg gcggcaccta cgccggcaac 900 ccgctggcgg tcgccgcggc gcatgccgtg ctggacgtga tcgccgagga aaagctgtgc 960 gaacgcgccg acgccctggg cgacaagctg cgcgcgcatc tggaaggcct gcgcgccaag 1020 gttccgggca tcgccgacgt gcgcggcctg ggttccatgg tcgccctgga actgaacgat 1080 cccgccaccg gcaagccgga cgcggaagcg gtcaagcgcg tgcaagcccg cgccatcgaa 1140 aagggcctga ttttgctaag ctgcggtgtg tacggcaacg tcctgcgctt cctgtacccc 1200 ttgaccatcc ccgacgccca gttcgatcgc gcgctggcca tcctgtccga ggcgcttgcc 1260 gcctga 1266 <210> 144 <211> 1266 <212> DNA <213> Achromobacter xylosoxidans <400> 144 atgaaaaatc aggatctgaa tacccgtcgt agcctggcaa caccgcgtgg tgtgggtgtt 60 atgtgtgatt tttatgcagt tcgtgcagaa aatgcaaccc tgtgggatgc aaatggcaaa 120 gaatatattg attttgccgg tggtattgcc gtgctgaata ccggtcatct gcatccgaaa 180 atcaaagcag cagttgcagc acagctggat aactttaccc ataccgcata tcagattgtt 240 ccgtatgaag gttatgttag cctggccgaa cgtattaatc gtctggcacc gattgatggt 300 ctgaaaaaat cagcattttt taccaccggt gtggaagcag ttgaaaatgc agttaaaatt 360 gcacgtagcg caaccggtcg tagcggtgtt attgcattta gcggtagctt tcatggtcgt 420 accatgctgg gtatggcact gaccggtaaa gttgcaccgt ataaactgag ctttggtccg 480 atgcctggtg atatttatca tgttccgttt ccgaatgcca cccagagcat tagcgttgca 540 gatagcctga aagcactgga tctgctgttt aaatgtgata ttgatccgaa acgtgtggca 600 gccattatta tcgaaccggt gcagggtgaa ggtggtttta acattacccc tccggaactg 660 atgaccgcac tgcgtaaagt ttgtgatgaa catggtattc tgctgattgc agatgaagtt 720 cagaccggtt ttggtcgcac cggtaaactg tttgcaatgg aacatcatag cgttcaggca 780 gatctgatta ccatggcaaa aagcctgggt ggtggttttc cgattagcgg tgtggttggt 840 cgtgcagatg ttatggatgc accggcagcg ggtggtctgg gtggtacata tgcaggtaat 900 ccgctggcag ttgccgcagc acatgcagtt ctggatgtta ttgccgaaga aaaactgtgt 960 gaacgtgccg atgcactggg cgataaactg cgtgcacatc tggaaggtct gcgtgcaaaa 1020 gttccgggta ttgcggatgt tcgcggtctg ggtagcatgg ttgcactgga actgaatgat 1080 ccggcaaccg gcaaaccgga tgccgaagca gttaaacgtg ttcaggcacg tgcgattgaa 1140 aaaggtctga ttctgctgtc atgtggtgtt tatggtaatg ttctgcgttt tctgtatccg 1200 ctgaccattc cggatgcaca gtttgatcgt gcactggcaa ttctgagcga agcactggca 1260 gcatag 1266 <210> 145 <211> 1198 <212> DNA <213> Achromobacter xylosoxidans <400> 145 tttttatgca gttcgtgcag aaaatgcaac cctgtgggat gcaaatggca aagaatatat 60 tgattttgcc ggtggtattg ccgtgctgaa taccggtcat ctgcatccga aaatcaaagc 120 agcagttgca gcacagctgg ataactttac ccataccgca tatcagattg ttccgtatga 180 aggttatgtt agcctggccg aacgtattaa tcgtctggca ccgattgatg gtctgaaaaa 240 atcagcattt tttaccaccg gtgtggaagc agttgaaaat gcagttaaaa ttgcacgtag 300 cgcaaccggt cgtagcggtg ttattgcatt tagcggtagc tttcatggtc gtaccatgct 360 gggtatggca ctgaccggta aagttgcacc gtataaactg agctttggtc cgatgcctgg 420 tgatatttat catgttccgt ttccgaatgc cacccagagc attagcgttg cagatagcct 480 gaaagcactg gatctgctgt ttaaatgtga tattgatccg aaacgtgtgg cagccattat 540 tatcgaaccg gtgcagggtg aaggtggttt taacattacc cctccggaac tgatgaccgc 600 actgcgtaaa gtttgtgatg aacatggtat tctgctgatt gcagatgaag ttcagaccgg 660 ttttggtcgc accggtaaac tgtttgcaat ggaacatcat agcgttcagg cagatctgat 720 taccatggca aaaagcctgg gtggtggttt tccgattagc ggtgtggttg gtcgtgcaga 780 tgttatggat gcaccggcag cgggtggtct gggtggtaca tatgcaggta atccgctggc 840 agttgccgca gcacatgcag ttctggatgt tattgccgaa gaaaaactgt gtgaacgtgc 900 cgatgcactg ggcgataaac tgcgtgcaca tctggaaggt ctgcgtgcaa aagttccggg 960 tattgcggat gttcgcggtc tgggtagcat ggttgcactg gaactgaatg atccggcaac 1020 cggcaaaccg gatgccgaag cagttaaacg tgttcaggca cgtgcgattg aaaaaggtct 1080 gattctgctg tcatgtggtg tttatggtaa tgttctgcgt tttctgtatc cgctgaccat 1140 tccggatgca cagtttgatc gtgcactggc aattctgagc gaagcactgg cagcataa 1198 <210> 146 <211> 1266 <212> DNA <213> Achromobacter xylosoxidans <400> 146 atgaaaaatc aggacttaaa cacccgtcgc agcttagcca ctcctcgcgg ggtcggggtc 60 atgtgcgact tctatgcagt gcgtgccgag aacgcgacgc tgtgggatgc caacggcaaa 120 gaatatatcg attttgcggg cggtattgcc gtgttgaata cgggccacct gcatcctaag 180 ataaaggcag ctgtcgcggc gcaactggat aatttcacgc acaccgcata tcaaatcgta 240 ccatacgaag ggtacgtatc gctggccgaa agaattaacc gtttggcccc gattgacggt 300 ctaaaaaaaa gcgcgttttt cacaaccggt gtggaagcag tcgaaaacgc ggtaaaaatc 360 gcgcgtagcg ccactggccg ctccggtgtt atcgcgttca gcggaagttt ccatggccgc 420 actatgttag gcatggcgct gactgggaaa gttgcgccgt ataaactgag ctttgggccg 480 atgcctggcg atatttatca cgttccattc cctaacgcca ctcagtctat ttcagtcgcc 540 gattctttga aagcattaga cctgctgttt aaatgcgata ttgatcccaa acgcgtagca 600 gccataatta ttgagccggt tcagggagag ggcggcttca atatcacacc accggaactc 660 atgacggccc tgcgtaaggt atgcgacgaa catggtattc tcctgattgc agatgaagta 720 cagaccggat ttggccgcac cggtaaactg tttgctatgg agcaccactc tgtgcaagct 780 gatctgatca cgatggccaa aagtttaggc ggtggcttcc cgatctctgg cgtagtgggt 840 cgggcagatg tcatggatgc gcccgcagcg ggagggttag gtggtactta tgctggtaat 900 cctttggctg tagcagcagc gcacgcagtt cttgacgtga ttgcagaaga aaagttatgt 960 gaacgcgccg atgcattagg tgacaaattg cgggcacatc tggagggtct gcgcgcgaaa 1020 gttcctggca ttgcggatgt ccgcggtttg ggcagcatgg tggcactgga actgaacgac 1080 ccggctacgg gcaaacccga cgcagaagcc gtaaaacgtg ttcaggcgcg tgccattgaa 1140 aaaggcttaa ttttactgag ctgcggcgtc tacgggaatg tgttacgttt cctgtacccg 1200 ctgaccattc cggatgcgca atttgaccgg gccttagcga ttctgtctga ggccctggca 1260 gcatag 1266

Claims

서열번호 1의 아미노산의 적어도 하나의 변경을 포함하는 조작된 트랜스아미나아제(TA) 효소.
서열번호 13 또는 서열번호 31의 아미노산의 적어도 하나의 변경을 포함하는 조작된 트랜스아미나아제(TA) 효소.
제1항 또는 제2항에 있어서, 상기 조작된 트랜스아미나아제 효소는
a) 아디페이트 세미알데하이드 기질로부터 6-아미노카프로산을 형성하는 것;
b) 야생형 트랜스아미나아제와 비교하여 더 큰 비율로 아디페이트 세미알데하이드 기질로부터 6-아미노카프로산을 형성하는 것;
c) 야생형 트랜스아미나아제와 비교하여 아디페이트 세미알데하이드 기질에 대해 더 높은 친화력을 갖는 것; 또는
d) a), b), 및 c)의 임의의 조합
을 가능하게 하는 것인 조작된 TA.
제1항 또는 제3항에 있어서, 서열번호 1의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392 또는 이들의 조합으로부터 선택된 하나 이상의 위치에서 하나 이상의 아미노산 변경을 포함하는 조작된 TA.
제1항, 제3항 및 제4항 중 어느 한 항에 있어서, 상기 조작된 트랜스아미나아제는 서열번호 1의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392 또는 이들의 조합으로부터 선택된 하나 이상의 위치에서 하나 이상의 아미노산 변경을 포함하며, 이는 보존적 아미노산 변경인 조작된 TA.
제1항 및 제3항 내지 제5항 중 어느 한 항에 있어서, 상기 조작된 트랜스아미나아제는 서열번호 1의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, 또는 이들의 조합으로부터 선택된 하나 이상의 위치에서 하나 이상의 아미노산 변경을 포함하며, 이는 비보존적 아미노산 변경인 조작된 TA.
제1항 및 제3항 내지 제6항 중 어느 한 항에 있어서, 조작된 단백질의 상기 적어도 하나의 아미노산 변경은 서열번호 1의 표 5 및 이들의 조합으로부터 선택된 변경인 조작된 TA.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 아미노산 변경은 서열번호 1, 13, 또는 31의 적어도 2, 3, 4, 5, 6, 7, 8개 또는 그 이상의 아미노산을 포함하는 것인 조작된 TA.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 아미노산 위치는 서열번호 1, 13, 또는 31의 적어도 2, 3, 4, 5, 6, 7, 8개 또는 그 이상의 아미노산 위치를 포함하는 것인 조작된 TA.
제1항 내지 제9항 중 어느 한 항에 있어서, 아미노산 변경이 없는 서열번호 1, 13, 또는 31의 트랜스아미나아제의 활성보다 적어도 20% 더 높은 활성을 포함하는 조작된 TA.
제1항 내지 제10항 중 어느 한 항에 있어서, 3-옥소아디필-CoA 티올라아제, 3-옥소아디필-CoA 데하이드로게나아제, 및 3-옥소아디필-CoA 데하이드라타아제를 인코딩하는 유전자를 포함하는 세포에서 상기 조작된 TA의 발현을 추가로 포함하는 조작된 TA로서, 이는 상기 조작된 TA가 유래된 야생형 TA를 발현시키는 대조 세포보다 적어도 10% 더 많은 6ACA를 제조할 수 있는 것인 조작된 TA.
제1항 내지 제11항 중 어느 한 항의 조작된 트랜스아미나아제를 인코딩하는 핵산.
제12항에 있어서, 조작된 TA를 인코딩하는 핵산 서열은 이종 프로모터에 작동 가능하게 연결된 것인 핵산 분자.
제13항의 핵산 분자를 포함하는 벡터.
제1항 내지 제14항 중 어느 한 항의 조작된 트랜스아미나아제를 포함하는 조작된 세포.
적어도 하나의 외인성 효소를 포함하는 비천연 미생물 유기체로서, 상기 적어도 하나의 외인성 효소는 아디페이트 세미알데하이드를 6-아미노카프로산으로 전환시키는 트랜스아미나아제 효소를 포함하며, 상기 트랜스아미나아제는
(i) 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 25개 이상의 인접 아미노산과 적어도 50% 서열 동일성을 갖는 아미노산 서열을 포함하는 트랜스아미나아제; 또는
(ii) 제1항 내지 제15항 중 어느 한 항의 조작된 TA
로부터 선택되는 것인 비천연 미생물 유기체.
제16항에 있어서, 6-아미노카프로산 경로, 6-하이드록시카프로산 경로, 헥사메틸렌디아민 경로, 카프로락톤 경로, 또는 카프로락탐 경로를 포함하는 비천연 미생물 유기체.
제16항 또는 제17항에 있어서, TA 효소를 인코딩하는 적어도 하나의 외인성 핵산은 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
제16항 내지 제18항 중 어느 한 항에 있어서, 6-아미노카프로산 경로를 포함하는 비천연 미생물 유기체.
제19항에 있어서, 상기 6-아미노카프로산 경로는 (i) 5-카복시-2-펜테노일-CoA 리덕타아제, (ii) 6-아미노카프로에이트 데하이드로게나아제, (iii) 6-아미노카프로에이트 트랜스아미나아제, 또는 (iv) 효소 (i) 내지 (iii) 중 하나 이상의 조합을 포함하는 것인 비천연 미생물 유기체.
제16항 내지 제20항 중 어느 한 항에 있어서, 6-아미노카프로산 경로 효소 중 하나 이상을 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함하는 비천연 미생물 유기체.
제21항에 있어서, 상기 6-아미노카프로산 경로 효소 중 하나 이상을 인코딩하는 상기 외인성 핵산은 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
제16항 내지 제22항 중 어느 한 항에 있어서, 헥사메틸렌디아민 경로를 포함하는 비천연 미생물 유기체.
제23항에 있어서, 상기 헥사메틸렌디아민 경로는 (i) 6-아미노아카프로일 CoA 트랜스퍼라아제, (ii) 6-아미노카프로일 CoA 신타아제, (iii) 6-아미노카프로일 CoA 리덕타아제, (iv) 헥사메틸렌디아민 트랜스아미나아제, (v) 헥사메틸렌디아민 데하이드로게나아제, 또는 (v) 효소 (i) 내지 (v) 중 하나 이상의 조합을 포함하는 것인 비천연 미생물 유기체.
제16항 내지 제24항 중 어느 한 항에 있어서, 상기 헥사메틸렌디아민 경로 효소 중 하나 이상을 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함하는 비천연 미생물 유기체.
제25항에 있어서, 상기 헥사메틸렌디아민 경로 효소 중 하나 이상을 인코딩하는 상기 외인성 핵산은 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
제16항 내지 제26항 중 어느 한 항에 있어서, 카프로락탐 경로를 포함하는 비천연 미생물 유기체.
제27항에 있어서, 상기 카프로락탐 경로는 아미노하이드롤라아제 효소를 포함하는 것인 비천연 미생물 유기체.
제16항 내지 제28항 중 어느 한 항에 있어서, 아미노하이드롤라아제 효소를 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함하는 비천연 미생물 유기체.
제29항에 있어서, 아미노하이드롤라아제 효소를 인코딩하는 상기 외인성 핵산은 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
제16항 내지 제30항 중 어느 한 항에 있어서, 아디페이트 세미알데하이드와 반응하여 6-아미노카프로산을 형성하는 상기 트랜스아미나아제 효소를 인코딩하는 적어도 하나의 외인성 핵산은 비천연 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
제16항 내지 제31항 중 어느 한 항에 있어서, 대조군 미생물 유기체가 상기 트랜스아미나아제 효소를 인코딩하는 상기 외인성 핵산을 포함하지 않는 것을 제외하고 상기 비천연 미생물 유기체와 실질적으로 동일한 대조군 미생물 유기체보다 더 많은 아디페이트 세미알데하이드를 6-아미노카프로산으로 전환시키는 비천연 미생물 유기체.
제16항 내지 제32항 중 어느 한 항에 있어서, 상기 TA는 박테리아, 효모, 진균, 조류, 동물, 또는 식물 종으로부터 유래된 것인 비천연 미생물 유기체.
제16항 내지 제33항 중 어느 한 항에 있어서, 아시네토박터(Acinetobacter), 악티노바실러스(Actinobacillus), 아나에로바이오스필리룸(Anaerobiospirillum), 아스페르길루스(Aspergillus), 바실루스(Bacillus), 클로스트리듐(Clostridium), 코리네박테리움(Corynebacterium), 에셔리키아(Escherichia), 글루코노박터(Gluconobacter), 클렙시엘라(Klebsiella), 클루베로마이세스(Kluyveromyces), 락토코쿠스(Lactococcus), 락토바실루스(Lactobacillus), 만헤이미아(Mannheimia), 피키아(Pichia), 슈도모나스(Pseudomonas), 리조비움(Rhizobium), 리조푸스(Rhizopus), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 스트렙토마이세스(Streptomyces) 및 자이모모나스(Zymomonas)의 종을 포함하는 비천연 미생물 유기체.
제16항 내지 제34항 중 어느 한 항에 있어서, 상기 TA는 아르트로박터(Arthrobacter), 파에나트로박터(Paenarthrobacter), 사카로마이세스(Saccharomyces), 클로스트리듐(Clostridium), 굴로시박터(Gulosibacter), 코쿠리아(Kocuria), 슈도모나스(Pseudomonas) 및 알칼리게네스로(Alcaligenes)부터 유래된 것인 비천연 미생물 유기체.
제12항 내지 제15항 중 어느 한 항에 따른 핵산 분자로 형질전환된 숙주 세포.
제36항에 있어서, 아시네토박터, 악티노바실러스, 아나에로바이오스필리룸, 아스페르길루스, 바실루스, 클로스트리듐, 코리네박테리움, 에셔리키아, 글루코노박터, 클렙시엘라, 클루베로마이세스, 락토코쿠스, 락토바실루스, 만헤이미아, 피키아, 슈도모나스, 리조비움, 리조푸스, 사카로마이세스, 스키조사카로마이세스, 스트렙토마이세스 및 자이모모나스의 종을 포함하는 숙주 세포.
제16항 내지 제37항 중 어느 한 항에 있어서, 상기 비천연 미생물 유기체는 2, 3, 4, 5, 6, 7개 또는 그 이상의 외인성 핵산을 포함하며, 각각은 6-아미노카프로산 경로, 헥사메틸렌디아민 경로, 카프로락탐 경로, 1,6-헥산디올 경로, 카프로락톤 경로, 또는 2개 이상의 경로의 조합을 위한 효소를 인코딩하는 것인 비천연 미생물 유기체.
제16항 내지 제38항 중 어느 한 항에 있어서, 대조군 미생물 유기체 또는 숙주 세포가 외인성 트랜스아미나아제 또는 상기 트랜스아미나아제를 인코딩하는 외인성 핵산 서열을 포함하지 않는 것을 제외하고 상기 비천연 미생물 유기체 또는 숙주 세포와 실질적으로 동일한 대조군 미생물 유기체 또는 숙주 세포에 의해 생성된 것보다 더 많은 아디페이트, 카프로산, 헥사메틸렌디아민, 카프로락톤, 또는 카프로락탐 중 하나 이상을 생성하는 비천연 미생물 유기체 또는 숙주 세포.
6-아미노카프로산을 제조하는 방법으로서,
6-아미노카프로산을 제조하기 위한 충분한 기간 및 조건으로 제16항 내지 제39항 중 어느 한 항의 비천연 미생물 유기체 또는 숙주 세포를 배양하는 단계
를 포함하는 제조 방법.
제40항에 있어서, 비천연 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 6-아미노카프로산을 회수하는 단계를 추가로 포함하는 제조 방법.
헥사메틸렌디아민을 제조하는 방법으로서,
헥사메틸렌디아민을 제조하기 위한 충분한 기간 및 조건으로 제16항 내지 제39항 중 어느 한 항의 비천연 미생물 유기체 또는 숙주 세포를 배양하는 단계
를 포함하는 제조 방법.
제42항에 있어서, 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 헥사메틸렌디아민을 회수하는 단계를 추가로 포함하는 제조 방법.
제40항 내지 제43항 중 어느 한 항에 있어서, 상기 미생물 유기체 또는 숙주 세포는 2, 3, 4, 5, 6, 7개 또는 그 이상의 외인성 핵산 서열을 포함하며, 각각은 헥사메틸렌디아민 경로 효소를 인코딩하는 것인 제조 방법.
카프로락탐을 제조하는 방법으로서,
카프로락탐을 제조하기 위한 충분한 기간 및 조건으로 제16항 내지 제39항 중 어느 한 항의 비천연 미생물 유기체를 배양하는 단계
를 포함하는 제조 방법.
제45항에 있어서, 비천연 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 카프로락탐을 회수하는 단계를 추가로 포함하는 제조 방법.
제40항 내지 제46항 중 어느 한 항에 있어서, 상기 미생물 유기체는, 2, 3, 4, 5, 6 또는 7개의 외인성 핵산 서열을 포함하며, 각각은 카프로락탐 경로 효소를 인코딩하는 것인 제조 방법.
제40항 내지 제47항 중 어느 한 항에 있어서, 배양이 당을 포함하는 발효 브로쓰에서 수행되는 것인 제조 방법.
제40항 내지 제48항 중 어느 한 항에 있어서, 상기 비천연 미생물은 아시네토박터, 악티노바실러스, 아나에로바이오스필리룸, 아스페르길루스, 바실루스, 클로스트리듐, 코리네박테리움, 에셔리키아, 글루코노박터, 클렙시엘라, 클루베로마이세스, 락토코쿠스, 락토바실루스, 만헤이미아, 피키아, 슈도모나스, 리조비움, 리조푸스, 사카로마이세스, 스키조사카로마이세스, 스트렙토마이세스, 및 자이모모나스의 종을 포함하는 것인 제조 방법.
제40항 내지 제49항 중 어느 한 항의 방법으로 합성된 생체 유래, 아디페이트, 6-아미노카프로산, 헥사메틸렌디아민, 카프로락톤, 또는 카프로락탐.
제50항의 아디페이트, 카프로산, 헥사메틸렌디아민, 카프로락톤, 또는 카프로락탐의 용도.