KR20220023339A - 조작된 트랜스아미나아제 및 제조 및 사용 방법 - Google Patents
조작된 트랜스아미나아제 및 제조 및 사용 방법 Download PDFInfo
- Publication number
- KR20220023339A KR20220023339A KR1020217038307A KR20217038307A KR20220023339A KR 20220023339 A KR20220023339 A KR 20220023339A KR 1020217038307 A KR1020217038307 A KR 1020217038307A KR 20217038307 A KR20217038307 A KR 20217038307A KR 20220023339 A KR20220023339 A KR 20220023339A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- gly
- val
- leu
- glu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/001—Amines; Imines
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/005—Amino acids other than alpha- or beta amino acids, e.g. gamma amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/08—Oxygen as only ring hetero atoms containing a hetero ring of at least seven ring members, e.g. zearalenone, macrolide aglycons
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/10—Nitrogen as only ring hetero atom
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
- C12P7/625—Polyesters of hydroxy carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01003—Aldehyde dehydrogenase (NAD+) (1.2.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/01—Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
- C12Y103/01044—Trans-2-enoyl-CoA reductase (NAD+) (1.3.1.44)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/01—Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
- C12Y103/01038—Trans-2-enoyl-CoA reductase (NADPH) (1.3.1.38)
Abstract
트랜스아미나아제(TA) 효소 및 이를 인코딩하는 핵산이 개시되어 있다. 일부 경우에, 트랜스아미나아제 효소는 비천연의 조작된 트랜스아미나아제이다. 또한, 6-아미노카프로에이트, 헥사메틸렌디아민, 카프로산, 카프로락톤, 또는 카프로락탐의 생합성을 향상시키거나 개선시키는 생합성 방법 및 조작된 미생물이 개시된다. 조작된 미생물은 외인성 TA 및 일부 경우에, 조작된 TA를 포함한다.
Description
관련 출원에 대한 상호 참조문헌
본 출원은 2019년 4월 24일에 출원된 미국 가출원 제62/837,888호; 2019년 6월 11일에 출원된 제62/860,123호; 및 2019년 6월 11일에 출원된 제62/860,160호의 이익을 청구하며, 이들 문헌의 개시내용은 전문이 본원에 참고로 포함된다.
서열목록의 통합
본 출원은 2020년 4월 24일에 생성되었고 크기가 154 킬로바이트인, 파일명이 "GNO00100WO Sequence Listing.txt"인 서열목록을 포함한다. 서열목록은 본원에 참고로 포함된다.
나일론은 디아민과 디카복실산의 축중합 또는 락탐의 축중합에 의해 합성될 수 있는 폴리아미드이다. 나일론 6,6은 헥사메틸렌디아민(HMD) 및 아디프산의 반응에 의해 생성되며, 나일론 6은 카프로락탐의 개환 중합에 의해 생성된다. 이에 따라, 아디프산, 헥사메틸렌디아민, 및 카프로락탐은 나일론 생산에서 중요한 중간체이다.
미생물은 나일론 중간체 중 일부를 생산하도록 조작되었다. 그러나, 조작된 미생물은 경로 중간체 및 최종 산물에 대한 원하지 않는 효소 활성의 결과로서 원하지 않는 부산물을 제조할 수 있다. 이에 따라, 이러한 부산물 및 불순물은 화합물을 생합성하는 비용 및 복잡성을 증가시키고, 원하는 산물의 효율 또는 수율을 감소시킬 수 있다.
본원에는 아디페이트 세미알데하이드와 반응하여 6-아미노카프로산(6ACA)을 형성하는 비천연, 조작된 트랜스아미나아제(TA) 효소가 제공된다. TA 효소는 아미노산 서열번호 1, 13 또는 31에 의해 인코딩된다. 서열번호 1, 13, 또는 31의 트랜스아미나아제는 야생형 서열번호 1, 13 또는 31과 비교하여 아디페이트 세미알데하이드에 대한 더 양호한 활성 또는 특이성을 갖도록 조작된다.
또한, 6-아미노카프로산 경로, 카프로락탐 경로, 헥사메틸렌디아민 경로, 카프로락톤 경로, 1,6-헥산디올 경로, 또는 이러한 경로 중 하나 이상의 조합을 갖는 비천연 미생물 유기체가 제공된다. 비천연 미생물 유기체는 아디페이트 세미알데하이드와 반응하여 6-아미노카프로산(6ACA)을 형성하는 트랜스아미나아제 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함한다. 트랜스아미나아제 효소는 숙시네이트 세미알데하이드와 관련하여 아디페이트 세미알데하이드 기질에 대한 전환 수, 촉매 효율, 또는 이들의 조합을 갖는다.
비천연 미생물 유기체는 개개 생성물을 제조하기에 충분한 양으로 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민을 제조하는 데 필요한 효소를 인코딩하는 추가 외인성 핵산을 추가로 포함할 수 있다. 일부 경우에, 이러한 외인성 핵산 중 하나 이상은 미생물 유기체에 대해 이종일 수 있다.
또한, 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민을 제조하는 방법이 개시된다. 방법은 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 및/또는 헥사메틸렌디아민을 배양하여 비천연 미생물 유기체를 제조하는 것을 포함할 수 있으며, 여기서, 미생물 유기체는 아디페이트 세미알데하이드 기질과 반응하여 6-아미노카프로산(6ACA)을 형성하는 트랜스아미나아제 효소를 인코딩하는 적어도 하나의 외인성 핵산을 발현시킨다. 방법은 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민을 제조하기 위해 충분한 기간 동안 및 조건하에서 비천연 미생물 유기체를 배양하는 것을 포함한다.
하나의 구현예에서, 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 적어도 25개 이상의 인접 아미노산과 적어도 40% 서열 동일성을 갖는 아미노산 서열을 포함하는 TA가 있다.
하나의 양태에서, 서열번호 1, 서열번호 13, 또는 서열번호 31의 하나 이상의 아미노산 변경을 포함하는 조작된 TA 효소가 있다.
하나의 구현예에서, 서열번호 1, 서열번호 13 또는 서열번호 31의 하나 이상의 아미노산 잔기 위치에서 하나 이상의 아미노산 변경 또는 서열번호 1, 서열번호 13 또는 서열번호 31의 아미노산 변경 및 잔기 위치의 조합을 포함하는 조작된 TA 효소가 있다.
일부 구현예에서, TA 효소는 서열번호 1, 13, 또는 31의 적어도 2, 3, 4, 5, 6, 7, 8개 또는 그 이상의 아미노산 위치에서 변경을 포함한다. 일부 구현예에서, 아미노산 변경은 아미노산 치환이다. 일부 구현예에서, 아미노산 치환은 보존적 치환이다. 일부 구현예에서, 아미노산 치환은 비보존적 치환이다. 일부 구현예에서, 조작된 TA는 아미노산 변경을 가지지 않는 서열번호 1, 13, 또는 31의 트랜스아미나아제의 활성보다 적어도 20% 더 높은 트랜스아미나아제 활성을 포함한다.
하나의 구현예에서, 조작된 TA는 서열번호 1의 아미노산 변경 및 잔기 위치에 대해 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392, 및 이들의 조합에 해당하는 위치로부터 선택된 하나 이상의 아미노산에 대한 하나 이상의 아미노산 변경을 갖는다. 일부 구현예에서, 아미노산 치환은 보존적 치환이다. 일부 구현예에서, 아미노산 치환은 비보존적 치환이다. 일부 구현예에서, 조작된 TA는 아미노산 변경을 가지지 않는 서열번호 1의 트랜스아미나아제의 활성보다 적어도 20% 더 높은 트랜스아미나아제 활성을 포함한다. 일부 구현예에서, 서열번호 1 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392 또는 아미노산 변경의 조합의 잔기에 해당하는 위치로부터 선택된 아미노산이 대체될 수 있다. 아미노산 변경은 20개의 다른 아미노산 중 19개로 대체될 수 있다. 하나의 구현예에서, 선택된 TA 및 조작된 TA는
a) 아디페이트 세미알데하이드 기질로부터 6-아미노카프로산을 형성하거나;
b) 야생형 트랜스아미나아제와 비교하여 더 높은 비율로 아디페이트 세미알데하이드 기질로부터 6-아미노카프로산을 형성하거나;
c) 야생형 트랜스아미나아제와 비교하여 아디페이트 세미알데하이드 기질에 대한 더 높은 친화력을 갖거나;
d) a), b), 및 c)의 임의의 조합을 가능하게 할 수 있다.
하나의 구현예에서, 적어도 하나의 외인성 효소를 포함하는 비천연 미생물 유기체가 있으며, 적어도 하나의 외인성 효소는 아디페이트 세미알데하이드 기질로부터의 TA 전환 6-아미노카프로산을 포함하며, TA는
(i) 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 적어도 25개 이상의 인접 아미노산과 적어도 50% 서열 동일성을 갖는 아미노산 서열을 포함하는 트랜스아미나아제; 또는
(ii) 서열번호 1, 13, 또는 31의 조작된 TA로부터 선택된다.
일부 구현예에서, 비천연 미생물 유기체는 조작된 TA가 유래된 야생형 TA를 발현시키는 대조 세포보다 적어도 10% 이상 6ACA를 제조할 수 있는 3-옥소아디필-CoA 티올라아제, 3-옥소아디필-CoA 데하이드로게나아제, 및 3-옥소아디필-CoA 데하이드라타아제를 인코딩하는 유전자를 포함한다.
일부 구현예에서, 비천연 미생물 유기체는 6-아미노카프로산 경로, 헥사메틸렌디아민 경로, 카프로락톤 경로, 또는 카프로락탐 경로를 위해 필요한 효소를 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 카프로산 경로, 헥사메틸렌디아민 경로, 카프로락톤 경로, 또는 카프로락탐 경로를 위해 필요한 효소를 인코딩하는 외인성 핵산을 포함한다. 일부 구현예에서, 외인성 핵산은 미생물 유기체에 대해 이종이다.
하나의 구현예에서, 아디필 CoA를 제조하기 위한 충분한 기간 및 조건으로 상기 양태 및 구현예 중 어느 하나의 비천연 발생 미생물을 배양하는 것을 포함하는 아디필 CoA를 제조하는 방법이 제공된다.
하나의 구현예에서, 6ACA를 제조하기 위한 충분한 기간 및 조건으로 상기 양태 및 구현예 중 어느 하나의 비천연 미생물 유기체를 배양하는 것을 포함하는 6-아미노카프로산(6ACA)을 제조하는 방법이 제공된다. 일부 구현예에서, 방법은 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 6ACA를 회수하는 것을 추가로 포함한다.
하나의 구현예에서, 헥사메틸렌디아민을 제조하기 위한 충분한 기간 및 조건으로 상기 양태 및 구현예 중 어느 하나의 비천연 미생물 유기체를 배양하는 것을 포함하는 헥사메틸렌디아민을 제조하는 방법이 제공한다. 일부 구현예에서, 방법은 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 헥사메틸렌디아민을 회수하는 것을 추가로 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 2, 3, 4, 5, 6, 7개 또는 그 이상의 외인성 핵산 서열을 포함하며, 각각은 헥사메틸렌디아민 경로 효소를 인코딩한다.
하나의 구현예에서, 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 및 헥사메틸렌디아민을 제조하기 위한 충분한 기간 및 조건으로 상기 양태 및 구현예 중 어느 하나의 비천연 미생물 유기체를 배양하는 것을 포함하는 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민을 제조하는 방법이 제공된다. 일부 구현예에서, 방법은 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 카프로락탐을 회수하는 것을 추가로 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 2, 3, 4, 5, 6 또는 7개의 외인성 핵산 서열을 포함하며, 각각은 6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 헥사메틸렌디아민 경로 효소를 인코딩한다.
하나의 구현예에서, 상기 개시된 방법을 이용하여 합성된 생체 유래 6-아미노카프로산, 헥사메틸렌디아민, 또는 카프로락탐이 제공된다.
일부 구현예에서, 비천연 미생물 유기체의 TA 효소는 숙시네이트 세미알데하이드와 유사한 아디페이트 세미알데하이드 기질에 대한 촉매 효율을 갖는다. 일부 구현예에서, 비천연 미생물 유기체의 TA 효소는 6-아미노카프로일-CoA와 추가로 반응하여 6-아미노카프로에이트 세미알데하이드를 형성한다.
일부 구현예에서, TA 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 비천연 미생물 유기체는, 대조군 미생물 유기체가 TA 효소를 인코딩하는 외인성 핵산을 포함하지 않는 것을 제외하고, 비천연 미생물 유기체와 실질적으로 동일한 대조군 미생물 유기체보다 더 많은 아디페이트 세미알데하이드를 a6-아미노카프로산으로 전환시킨다.
TA 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 비천연 미생물 유기체는, 야생형 미생물 유기체가 조작된 TER 효소를 인코딩하는 외인성 핵산을 포함하지 않는 것을 제외하고 비천연 미생물 유기체와 실질적으로 동일한 이의 야생형 미생물 유기체보다 더 많이 아디페이트 세미알데하이드를 6-아미노카프로산으로 전환시킨다.
일부 구현예에서, 아디페이트 세미알데하이드와 반응하여 6-아미노카프로산을 형성하는 TA 효소를 인코딩하는 적어도 하나의 외인성 핵산은 미생물 유기체에 대해 이종이다.
일부 구현예에서, 비천연 미생물 유기체는 6-아미노카프로산 경로를 포함한다. 일부 구현예에서, 6-아미노카프로산 경로는 (i) 트랜스아미나아제, (ii) 6-아미노카프로에이트 데하이드로게나아제, 또는 (iii) 트랜스아미나아제 및 6-아미노카프로에이트 데하이드로게나아제 효소 둘 모두를 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 6-아미노카프로산 경로 효소 중 하나 이상을 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함한다. 일부 구현예에서, 6-아미노카프로산 경로 효소 중 하나 이상을 인코딩하는 외인성 핵산은 미생물 유기체에 대해 이종이다.
일부 구현예에서, 비천연 미생물 유기체는 헥사메틸렌디아민 경로를 포함한다. 일부 구현예에서, 헥사메틸렌디아민 경로는 (i) 6-아미노아카프로일 CoA 트랜스퍼라아제, (ii) 6-아미노카프로일 CoA 신타아제, (iii) 6-아미노카프로일 CoA 리덕타아제, (iv) 헥사메틸렌디아민 트랜스아미나아제, (v) 헥사메틸렌디아민 데하이드로게나아제, 또는 (v) 효소 (i) 내지 (v) 중 하나 이상의 조합을 포함한다. 일부 구현예에서, 미생물 유기체는 헥사메틸렌디아민 경로 효소 중 하나 이상을 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함한다. 일부 구현예에서, 헥사메틸렌디아민 경로 효소 중 하나 이상을 인코딩하는 외인성 핵산은 미생물 유기체에 대해 이종이다.
일부 구현예에서, 비천연 미생물 유기체는 카프로락탐 경로를 포함한다. 일부 구현예에서, 카프로락탐 경로는 아미노하이드롤라아제 효소를 포함한다. 일부 구현예에서, 미생물 유기체는 아미노하이드롤라아제 효소를 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함한다. 일부 구현예에서, 아미노하이드롤라아제 효소를 인코딩하는 외인성 핵산은 미생물 유기체에 대해 이종이다.
일부 구현예에서, 비천연 미생물 유기체는 1,6-헥산디올 경로를 포함한다. 일부 구현예에서, 1,6-헥산디올 경로는 하기 효소를 포함한다: 6ACA에서 6-아미노카프로일-CoA로의 6-아미노카프로일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환; 6-아미노카프로일-CoA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로일-CoA 리덕타아제 촉매 전환; 6-아미노카프로에이트 세미알데하이드에서 6-아미노헥산올로의 6-아미노카프로에이트 세미알데하이드 리덕타아제 촉매 전환; 6ACA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로에이트 리덕타아제 촉매 전환; 아디페이트 세미알데하이드로의 아디필-CoA 리덕타아제 아디필-CoA; 아디페이트 세미알데하이드에서 6-하이드록시헥사노에이트로의 아디페이트 세미알데하이드 리덕타아제 촉매 전환; 6-하이드록시헥사노에이트에서 6-하이드록시헥사노일-CoA로의 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환; 6-하이드록시헥사노일-CoA에서 6-하이드록시헥사날로의 6-하이드록시헥사노일-CoA 리덕타아제 촉매 전환; 6-하이드록시헥사날에서 HDO로의 6-하이드록시헥사날 리덕타아제 촉매 전환; 6-아미노헥산올에서 6-하이드록시헥사날로의 6-아미노헥산올 아미노트랜스퍼라아제 또는 옥시도리덕타아제 촉매 전환; 6-하이드록시헥사노에이트에서 6-하이드록시헥사날로의 6-하이드록시헥사노에이트 리덕타아제 촉매 전환; ADA에서 아디페이트 세미알데하이드로의 아디페이트 리덕타아제 촉매 전환; 및 아디필-CoA에서 ADA로의 아디필-CoA 트랜스퍼라아제, 하이드롤라아제 또는 신타아제 촉매 전환.
일부 구현예에서, 비천연 미생물 유기체는 아디페이트 또는 아디필-CoA에서 카프로락톤으로의 경로를 포함한다. 일부 구현예에서, 아디페이트 또는 아디필-CoA에서 카프로락톤으로의 경로는 하기 효소를 포함한다: 아디필-CoA 리덕타아제, 아디페이트 세미알데하이드 리덕타아제, 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제, 6-하이드록시헥사노일-CoA 시클라아제 또는 자발적 고리화, 아디페이트 리덕타아제, 아디필-CoA 트랜스퍼라아제, 신타아제 또는 하이드롤라아제, 6-하이드록시헥사노에이트 시클라아제, 6-하이드록시헥사노에이트 키나아제, 6-하이드록시헥사노일 포스페이트 시클라아제 또는 자발적 고리화, 포스포트랜스-6-하이드록시헥사노일라아제.
일부 구현예에서, 비천연 미생물 유기체의 TA는 원핵생물 종으로부터 유래된 것이다. 일부 구현예에서, TA 효소는 아르트로박터(Arthrobacter), 파에나트로박터(Paenarthrobacter), 사카로마이세스(Saccharomyces), 클로스트리듐(Clostridium), 굴로시박터(Gulosibacter), 코쿠리아(Kocuria), 슈도모나스(Pseudomonas), 및 알칼리게네스(Alcaligenes)로부터 유래된 것이다.
일부 구현예에서, 비천연 미생물 유기체는 아시네토박터(Acinetobacter), 악티노바실러스(Actinobacillus), 아나에로바이오스필리룸(Anaerobiospirillum), 아스페르길루스(Aspergillus), 바실루스(Bacillus), 클로스트리듐(Clostridium), 코리네박테리움(Corynebacterium), 에셔리키아(Escherichia), 글루코노박터(Gluconobacter), 클렙시엘라(Klebsiella), 클루베로마이세스(Kluyveromyces), 락토코쿠스(Lactococcus), 락토바실루스(Lactobacillus), 만헤이미아(Mannheimia), 피키아(Pichia), 슈도모나스(Pseudomonas), 리조비움(Rhizobium), 리조푸스(Rhizopus), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 스트렙토마이세스(Streptomyces) 및 자이모모나스(Zymomonas)의 종을 포함한다. 일부 구현예에서, 비천연 미생물 유기체는 에셔리키아. 콜라이의 균주이다.
일부 구현예에서, 배양은 당을 포함하는 발효 브로쓰에서 수행된다.
도 1은 숙시닐-CoA 및 아세틸-CoA로부터 6-아미노카프로에이트, 헥사메틸렌디아민(HMDA), 및 카프로락탐으로의 대표적인 경로를 도시한 것이다. 효소는 하기와 같이 지정된다: A) 3-옥소아디필-CoA 티올라아제, B) 3-옥소아디필-CoA 리덕타아제, C) 3-하이드록시아디필-CoA 데하이드라타아제, D) 5-카복시-2-펜테노일-CoA 리덕타아제, E) 3-옥소아디필-CoA/아실-CoA 트랜스퍼라아제, F) 3-옥소아디필-CoA 신타아제, G) 3-옥소아디필-CoA 하이드롤라아제, H) 3-옥소아디페이트 리덕타아제, I) 3-하이드록시아디페이트 데하이드라타아제, J) 5-카복시-2-펜테노에이트 리덕타아제, K) 아디필-CoA/아실-CoA 트랜스퍼라아제, L) 아디필-CoA 신타아제, M) 아디필-CoA 하이드롤라아제, N) 아디필-CoA 리덕타아제(알데하이드 형성), O) 6-아미노카프로에이트 트랜스아미나아제, P) 6-아미노카프로에이트 데하이드로게나아제, Q) 6-아미노카프로일-CoA/아실-CoA 트랜스퍼라아제, R) 6-아미노카프로일-CoA 신타아제, S) 아미도하이드롤라아제, T) 자발적 고리화, U) 6-아미노카프로일-CoA 리덕타아제(알데하이드 형성), V) HMDA 트랜스아미나아제, W) HMDA 데하이드로게나아제, X) 아디페이트 리덕타아제, Y) 아디페이트 키나아제, Z) 아디필포스페이트 리덕타아제.
도 2는 서열번호 1에서 돌연변이된 아미노산 위치의 그래프 도식이다.
도 3은 야생형 서열번호 1 대조군(서열번호 1)에 대한 변이체의 활성의 그래프 도식이다.
도 4는 출발점으로서 라이신을 사용한 6-아미노카프로산 및 아디페이트의 합성에 대한 대표적인 경로를 도시한 것이다.
도 5는 출발점으로서 아디필-CoA를 사용한 대표적인 카프로락탐 합성 경로를 도시한 것이다.
도 6은 피루베이트 및 숙신 세미알데하이드로부터 6-아미노카프로에이트로의 대표적인 경로를 도시한 것이다. 효소는 A) HODH 알돌라아제, B) OHED 하이드라타아제, C) OHED 리덕타아제, D) 2-OHD 데카복실라아제, E) 아디페이트 세미알데하이드 아미노트랜스퍼라아제 및/또는 아디페이트 세미알데하이드 옥시도리덕타아제(아민화), F) OHED 데카복실라아제, G) 6-OHE 리덕타아제, H) 2-OHD 아미노트랜스퍼라아제 및/또는 2-OHD 옥시도리덕타아제(아민화), I) 2-AHD 데카복실라아제, J) OHED 아미노트랜스퍼라아제 및/또는 OHED 옥시도리덕타아제(아민화), K) 2-AHE 리덕타아제, L) HODH 포르메이트-리아제 및/또는 HODH 데하이드로게나아제, M) 3-하이드록시아디필-CoA 데하이드라타아제, N) 2,3-데하이드로아디필-CoA 리덕타아제, O) 아디필-CoA 데하이드로게나아제, P) OHED 포르메이트-리아제 및/또는 OHED 데하이드로게나아제, Q) 2-OHD 포르메이트-리아제 및/또는 2-OHD 데하이드로게나아제이다. 약어는 하기와 같다: HODH = 4-하이드록시-2-옥소헵탄-1,7-디오에이트, OHED = 2-옥소헵트-4-엔-1,7-디오에이트, 2-OHD = 2-옥소헵탄-1,7-디오에이트, 2-AHE = 2-아미노헵트-4-엔-1,7-디오에이트, 2-AHD = 2-아미노헵탄-1,7-디오에이트, 및 6-OHE = 6-옥소헥스-4-에노에이트.
도 7은 6-아미노카프로페이트로부터 헥사메틸렌디아민으로의 대표적인 경로를 도시한 것이다. 효소는 A) 6-아미노카프로에이트 키나아제, B) 6-AHOP 옥시도리덕타아제, C) 6-아미노카프로 세미알데하이드 아미노트랜스퍼라아제 및/또는 6-아미노카프로 세미알데하이드 옥시도리덕타아제(아민화), D) 6-아미노카프로에이트 N-아세틸트랜스퍼라아제, E) 6-아세트아미도헥사노에이트 키나아제, F) 6-AAHOP 옥시도리덕타아제, G) 6-아세트아미도헥사날 아미노트랜스퍼라아제 및/또는 6-아세트아미도헥사날 옥시도리덕타아제(아민화), H) 6-아세트아미도헥산아민 N-아세틸트랜스퍼라아제 및/또는 6-아세트아미도헥산아민 하이드롤라아제(아미드), I) 6-아세트아미도헥사노에이트 CoA 트랜스퍼라아제 및/또는 6-아세트아미도헥사노에이트 CoA 리가아제, J) 6-아세트아미도헥사노일-CoA 옥시도리덕타아제, K) 6-AAHOP 아실트랜스퍼라아제, L) 6-AHOP 아실트랜스퍼라아제, M) 6-아미노카프로에이트 CoA 트랜스퍼라아제 및/또는 6-아미노카프로에이트 CoA 리가아제, N) 6-아미노카프로일-CoA 옥시도리덕타아제이다. 약어는 하기와 같다: 6-AAHOP = [(6-아세트아미도헥사노일)옥시]포스포네이트 및 6-AHOP = [(6-아미노헥사노일)옥시]포스포네이트.
도 8은 1,6-헥산디올에 이르는 대표적인 생합성 경로를 도시한 것이다. A)는 6ACA에서 6-아미노카프로일-CoA로의 6-아미노카프로일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환이며; B)는 6-아미노카프로일-CoA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로일-CoA 리덕타아제 촉매 전환이며; C)는 6-아미노카프로에이트 세미알데하이드에서 6-아미노헥산올로의 6-아미노카프로에이트 세미알데하이드 리덕타아제 촉매 전환이며; D)는 6ACA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로에이트 리덕타아제 촉매 전환이며; E)는 아디필-CoA에서 아디페이트 세미알데하이드로의 아디필-CoA 리덕타아제 촉매 전환이며; F)는 아디페이트 세미알데하이드에서 6-하이드록시헥사노에이트로의 아디페이트 세미알데하이드 리덕타아제 촉매 전환이며; G)는 6-하이드록시헥사노에이트에서 6-하이드록시헥사노일-CoA로의 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환이며; H)는 6-하이드록시헥사노일-CoA에서 6-하이드록시헥사날로의 6-하이드록시헥사노일-CoA 리덕타아제 촉매 전환이며; I)는 6-하이드록시헥사날에서 HDO로의 6-하이드록시헥사날 리덕타아제 촉매 전환이며; J)는 6-아미노헥산올에서 6-하이드록시헥사날로의 6-아미노헥산올 아미노트랜스퍼라아제 또는 옥시도리덕타아제 촉매 전환이며; K)는 6-하이드록시헥사노에이트에서 6-하이드록시헥사날로의 6-하이드록시헥사노에이트 리덕타아제 촉매 전환이며; L)은 ADA에서 아디페이트 세미알데하이드로의 아디페이트 리덕타아제 촉매 전환이며; M)은 아디필-CoA에서 ADA로의 아디필-CoA 트랜스퍼라아제, 하이드롤라아제 또는 신타아제 촉매 전환이다.
도 9는 아디페이트 또는 아디필-CoA로부터 카프로락톤으로의 대표적인 경로를 도시한 것이다. 효소는 A. 아디필-CoA 리덕타아제, B. 아디페이트 세미알데하이드 리덕타아제, C. 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제, D. 6-하이드록시헥사노일-CoA 시클라아제 또는 자발적 고리화, E. 아디페이트 리덕타아제, F. 아디필-CoA 트랜스퍼라아제, 신타아제 또는 하이드롤라아제, G. 6-하이드록시헥사노에이트 시클라아제, H. 6-하이드록시헥사노에이트 키나아제, I. 6-하이드록시헥사노일 포스페이트 시클라아제 또는 자발적 고리화, J. 포스포트랜스-6-하이드록시헥사노일라아제이다.
도 2는 서열번호 1에서 돌연변이된 아미노산 위치의 그래프 도식이다.
도 3은 야생형 서열번호 1 대조군(서열번호 1)에 대한 변이체의 활성의 그래프 도식이다.
도 4는 출발점으로서 라이신을 사용한 6-아미노카프로산 및 아디페이트의 합성에 대한 대표적인 경로를 도시한 것이다.
도 5는 출발점으로서 아디필-CoA를 사용한 대표적인 카프로락탐 합성 경로를 도시한 것이다.
도 6은 피루베이트 및 숙신 세미알데하이드로부터 6-아미노카프로에이트로의 대표적인 경로를 도시한 것이다. 효소는 A) HODH 알돌라아제, B) OHED 하이드라타아제, C) OHED 리덕타아제, D) 2-OHD 데카복실라아제, E) 아디페이트 세미알데하이드 아미노트랜스퍼라아제 및/또는 아디페이트 세미알데하이드 옥시도리덕타아제(아민화), F) OHED 데카복실라아제, G) 6-OHE 리덕타아제, H) 2-OHD 아미노트랜스퍼라아제 및/또는 2-OHD 옥시도리덕타아제(아민화), I) 2-AHD 데카복실라아제, J) OHED 아미노트랜스퍼라아제 및/또는 OHED 옥시도리덕타아제(아민화), K) 2-AHE 리덕타아제, L) HODH 포르메이트-리아제 및/또는 HODH 데하이드로게나아제, M) 3-하이드록시아디필-CoA 데하이드라타아제, N) 2,3-데하이드로아디필-CoA 리덕타아제, O) 아디필-CoA 데하이드로게나아제, P) OHED 포르메이트-리아제 및/또는 OHED 데하이드로게나아제, Q) 2-OHD 포르메이트-리아제 및/또는 2-OHD 데하이드로게나아제이다. 약어는 하기와 같다: HODH = 4-하이드록시-2-옥소헵탄-1,7-디오에이트, OHED = 2-옥소헵트-4-엔-1,7-디오에이트, 2-OHD = 2-옥소헵탄-1,7-디오에이트, 2-AHE = 2-아미노헵트-4-엔-1,7-디오에이트, 2-AHD = 2-아미노헵탄-1,7-디오에이트, 및 6-OHE = 6-옥소헥스-4-에노에이트.
도 7은 6-아미노카프로페이트로부터 헥사메틸렌디아민으로의 대표적인 경로를 도시한 것이다. 효소는 A) 6-아미노카프로에이트 키나아제, B) 6-AHOP 옥시도리덕타아제, C) 6-아미노카프로 세미알데하이드 아미노트랜스퍼라아제 및/또는 6-아미노카프로 세미알데하이드 옥시도리덕타아제(아민화), D) 6-아미노카프로에이트 N-아세틸트랜스퍼라아제, E) 6-아세트아미도헥사노에이트 키나아제, F) 6-AAHOP 옥시도리덕타아제, G) 6-아세트아미도헥사날 아미노트랜스퍼라아제 및/또는 6-아세트아미도헥사날 옥시도리덕타아제(아민화), H) 6-아세트아미도헥산아민 N-아세틸트랜스퍼라아제 및/또는 6-아세트아미도헥산아민 하이드롤라아제(아미드), I) 6-아세트아미도헥사노에이트 CoA 트랜스퍼라아제 및/또는 6-아세트아미도헥사노에이트 CoA 리가아제, J) 6-아세트아미도헥사노일-CoA 옥시도리덕타아제, K) 6-AAHOP 아실트랜스퍼라아제, L) 6-AHOP 아실트랜스퍼라아제, M) 6-아미노카프로에이트 CoA 트랜스퍼라아제 및/또는 6-아미노카프로에이트 CoA 리가아제, N) 6-아미노카프로일-CoA 옥시도리덕타아제이다. 약어는 하기와 같다: 6-AAHOP = [(6-아세트아미도헥사노일)옥시]포스포네이트 및 6-AHOP = [(6-아미노헥사노일)옥시]포스포네이트.
도 8은 1,6-헥산디올에 이르는 대표적인 생합성 경로를 도시한 것이다. A)는 6ACA에서 6-아미노카프로일-CoA로의 6-아미노카프로일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환이며; B)는 6-아미노카프로일-CoA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로일-CoA 리덕타아제 촉매 전환이며; C)는 6-아미노카프로에이트 세미알데하이드에서 6-아미노헥산올로의 6-아미노카프로에이트 세미알데하이드 리덕타아제 촉매 전환이며; D)는 6ACA에서 6-아미노카프로에이트 세미알데하이드로의 6-아미노카프로에이트 리덕타아제 촉매 전환이며; E)는 아디필-CoA에서 아디페이트 세미알데하이드로의 아디필-CoA 리덕타아제 촉매 전환이며; F)는 아디페이트 세미알데하이드에서 6-하이드록시헥사노에이트로의 아디페이트 세미알데하이드 리덕타아제 촉매 전환이며; G)는 6-하이드록시헥사노에이트에서 6-하이드록시헥사노일-CoA로의 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제 촉매 전환이며; H)는 6-하이드록시헥사노일-CoA에서 6-하이드록시헥사날로의 6-하이드록시헥사노일-CoA 리덕타아제 촉매 전환이며; I)는 6-하이드록시헥사날에서 HDO로의 6-하이드록시헥사날 리덕타아제 촉매 전환이며; J)는 6-아미노헥산올에서 6-하이드록시헥사날로의 6-아미노헥산올 아미노트랜스퍼라아제 또는 옥시도리덕타아제 촉매 전환이며; K)는 6-하이드록시헥사노에이트에서 6-하이드록시헥사날로의 6-하이드록시헥사노에이트 리덕타아제 촉매 전환이며; L)은 ADA에서 아디페이트 세미알데하이드로의 아디페이트 리덕타아제 촉매 전환이며; M)은 아디필-CoA에서 ADA로의 아디필-CoA 트랜스퍼라아제, 하이드롤라아제 또는 신타아제 촉매 전환이다.
도 9는 아디페이트 또는 아디필-CoA로부터 카프로락톤으로의 대표적인 경로를 도시한 것이다. 효소는 A. 아디필-CoA 리덕타아제, B. 아디페이트 세미알데하이드 리덕타아제, C. 6-하이드록시헥사노일-CoA 트랜스퍼라아제 또는 신타아제, D. 6-하이드록시헥사노일-CoA 시클라아제 또는 자발적 고리화, E. 아디페이트 리덕타아제, F. 아디필-CoA 트랜스퍼라아제, 신타아제 또는 하이드롤라아제, G. 6-하이드록시헥사노에이트 시클라아제, H. 6-하이드록시헥사노에이트 키나아제, I. 6-하이드록시헥사노일 포스페이트 시클라아제 또는 자발적 고리화, J. 포스포트랜스-6-하이드록시헥사노일라아제이다.
달리 정의하지 않는 한, 본원에서 사용되는 모든 기술 용어 및 과학 용어는 본 발명의 구체예가 속하는 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기술된 것과 유사하거나 동일한 임의의 방법, 디바이스 및 물질은 본 발명의 구현예의 실무에서 사용될 수 있다. 하기 정의는 본원에서 자주 사용되는 특정 용어의 이해를 용이하게 하기 위해 제공되고, 본 개시의 범위를 제한하는 것을 의미하지 않는다. 본원에서 언급되는 모든 문헌(예를 들어, 특허 출원 또는 특허)은 전문이 참고로 포함된다.
아미노 도너 기질의 1차 아민에서 아미노 수용체 분자의 카보닐 기로 아미노 기, 한 쌍의 전자, 및 양성자의 전달을 촉매화하는 트랜스아미나아제(E.C. 2.6.1)로도 알려진 아미노트랜스페라아제가 기술되어 있다. 트랜스아미나아제의 원하는 반응은 글루타메이트 또는 알라닌의 아미노 기를 아디페이트 세미알데하이드로 전달하여 6-아미노카프로산(6ACA)을 형성하는 것으로서, 이는 하기에 나타나 있다:
아디페이트 세미알데하이드 + 글루타메이트 → 6ACA + 알파-케토글루타르산
그러나, 트랜스아미나아제는 또한, 하기에 나타낸 바와 같이 숙시네이트 세미알데하이드 또는 피루베이트에 대한 특이성을 갖는다:
숙시네이트 세미알데하이드 + 글루타메이트 → 감마-아미노부티르산 + 알파-케토글루타르산
피루베이트 + 글루타메이트 → 알라닌 + 알파-케토글루타르산
알라닌은 아민 도너로서 글루타메이트를 대체할 수 있다.
6-아미노카프로산을 형성하기 위해 아디페이트 세미알데하이드 기질 상에서 활성인 것으로 식별된 트랜스아미나아제(TA) 효소가 기술되어 있다. 이러한 효소는 나일론 중간체에 이르는 다양한 경로에서 사용될 수 있다.
원하는 트랜스아미나아제는 6ACA를 제조하기 위한 경로에서 원하는 반응을 수행할 수 있는 효소에 대한 상동성 검색뿐만 아니라 메타게놈 발견에 의해 식별되었다. 아디페이트 세미알데하이드 사용을 위해 트랜스아미나아제를 평가하기 위해, 일부 구현예에서, 검정은, 아디페이트 세미알데하이드가 상업적으로 입수 가능하지 않기 때문에, 6ACA와 역으로 수행된다.
일부 구현예에서, 서열번호 1에 의해 인코딩된 아크로모박터 크실로스옥시단스가 식별되었다. 다른 TA 효소를 식별하기 위해, 서열번호 1이 사용되었다. 동종 효소는 표 4에 기술된 바와 같이 식별되었다. 일부 구현예에서, 트랜스아미나아제 효소 또는 서열은 BLAST에 의해 식별된다. 일부 구현예에서, 트랜스아미나아제는 표 4의 트랜스아미나아제의 아미노산 서열의 적어도 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 공유한다.
일부 구현예에서, 표 4에서 식별된 트랜스아미나아제는 서열번호 1, 13 또는 31의 트랜스아미나아제의 아미노산 서열의 적어도 25, 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 공유한다.
일부 구현예에서, 트랜스아미나아제 효소는 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 적어도 25, 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 50% 아미노산 서열 일치성을 갖는다. 일부 구현예에서, 아디페이트 세미알데하이드와 반응하여 6ACA를 형성하는 트랜스아미나아제 효소의 아미노산 서열은 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116의 아미노산 서열로부터 선택된다.
일부 구현예에서, TA 효소는 숙시네이트 세미알데하이드가 기질일 때와 유사한 기질로서 아디페이트 세미알데하이드에 대한 촉매 효율, 및/또는 전환 수를 갖는다. 일부 구현예에서, 효소는 숙시네이트 세미알데하이드가 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116의 트랜스아미나아제의 아미노산 서열의 적어도 25, 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 공유할 때와 유사한 기질로서 아디페이트 세미알데하이드에 대한 촉매 효율, 및/또는 전환 수를 갖는다.
본원에서 사용되는 용어 전환 수(kcat로도 언급됨)는 단일 촉매 부위가 제공된 효소 농도[ET]에 대해 실행할 초당 기질 분자의 화학적 전환의 최대 수로서 정의된다. 이는 하기와 같이 최대 반응 속도 Vmax 및 촉매 부위 농도[ET]로부터 계산될 수 있다:
Kcat = Vmax/[ET]. 단위는 s-1이다.
본원에서 사용되는 용어 "촉매 효율"은 효소가 얼마나 효율적으로 기질을 산물로 전환시키는 지에 대한 척도이다. 촉매 효율의 비교는 또한, 상이한 기질에 대한 효소의 선호도(즉, 기질 특이성)의 척도로서 사용될 수 있다. 촉매 효율이 높을수록, 효소가 그러한 기질을 더욱 "선호"하는 것이다. 이는 수학식, kcat/KM으로부터 계산될 수 있으며, 여기서, kcat는 전환 수이며, KM은 마이켈리스 상수(Michaelis constant)이며, KM은 반응 속도가 Vmax의 절반인 기질 농도이다. 촉매 효율의 단위는 s-1M-1로서 표현될 수 있다.
식별된 트랜스아미나아제 효소는 매우 유전적으로 다양한 유기체로부터 유래된 것이다. 하기에는 표 1에 나타낸 바와 같이 일부 예시적인 트랜스아미나아제의 쌍별 서열 정렬이 나타나 있다.
트랜스아미나아제 효소는 보존된 도메인을 갖는다. 다중 서열 정렬 및 은닉 마르코프 모델(HMM: hidden Markov model)을 기초로 하여, 트랜스아미나아제 효소는 유럽 생물정보학 연구소의 Pfam 데이터베이스(pfam.xfam.org)의 Pfam PF00202로 그룹화된다.
일부 구현예에서, 아미노산 위치는 단백질의 결정 구조의 시험에 의해 서열번호 1에서의 돌연변이에 대해 식별되었으며, 서열번호 1을 인코딩하는 유전자는 선택된 아미노산 위치에서 포화 돌연변이 유발되었다. 야생형 (변형되지 않은) 서열번호 1보다 더 양호한 활성을 갖는 변이체 아미노산을 제공하기 위해 변경될 수 있는 촉매-관련 잔기가 식별되었다.
일부 구현예에서, 트랜스아미나아제 효소는 이의 상응하는 야생형보다 아디페이트 세미알데하이드 기질에 대해 더 큰 특이성을 갖도록 조작된다.
본원에서 사용되는 "조작된" 또는 "변이체"는 폴리펩타이드 또는 핵산의 맥락에서 사용될 때, 변형되지 않은, 야생형 서열과 비교하여 아미노산 위치 또는 핵산 위치에 적어도 하나의 변이 또는 변경을 갖는 서열을 지칭한다.
일부 구현예에서, 조작된 트랜스아미나아제는 서열번호 1, 서열번호 13, 또는 서열번호 31의 아미노산의 하나 이상의 변경을 갖는다. 일부 구현예에서, 조작된 트랜스아미나아제는 서열번호 1 서열번호 13, 서열번호 31에 대해 아미노산의 적어도 1, 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 또는 적어도 8개의 변경을 갖는 아미노산 서열에서 변경을 갖는다.
일부 구현예에서, 조작된 TA는 서열번호 1의 아미노산 변경 및 아미노산 잔기 위치의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265 및 L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, 또는 조합에 해당하는 하나 이상의 위치로부터 선택된 하나 이상의 아미노산 변경을 갖는다.
일부 구현예에서, 조작된 단백질의 하나 이상의 아미노산 변경은 서열번호 1의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265 및 L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, 및 A421에 상응하는 하나 이상의 위치 또는 아미노산 변경 및 아미노산 잔기 위치의 조합에서 보존적 또는 비보존적 아미노산의 치환이다.
일부 구현예에서, 조작된 TA는 표 5에 나타낸 잔기에 해당하는 위치에서 변경인 조작된 단백질의 하나 이상의 아미노산 변경을 갖는다.
일부 구현예에서, 조작된 TA 효소는 적어도 서열번호 1, 13, 또는 31의 상응하는 야생형과 비교하여 적어도 1.5X, 적어도 2X, 적어도 5X, 적어도 10X, 적어도 25X, 또는 1.5 내지 25X인 아디페이트 세미알데하이드 기질에 대한 촉매 효율을 갖는다.
일부 구현예에서, 표준 조건하에서 조작된 트랜스아미나아제 효소에 의한 아디페이트 세미알데하이드의 효소 전환은 서열번호 1, 13, 또는 31의 상응하는 야생형에 대한 효소의 효소 활성보다 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 또는 적어도 90% 더 크다.
일부 구현예에서, TA 변이체를 제공하기 위해, 본 개시의 서열번호 1로 표현된 아크로모박터 크실로스옥시단스 TA는 주형으로서 선택된다. 본원에 기술된 변이체는 아디페이트 세미알데하이드 또는 이의 유사체에 대한 증가된 활성 및 특이성에 대해 시험하기 위해 주형 내에 하나 이상의 아미노산 변경(예를 들어, 치환)을 도입함으로써 생성될 수 있다.
아미노산 위치 넘버링의 목적을 위해, 일부 구현예에서, 서열번호 1은 참조 서열로서 사용된다. 이에 따라, 예를 들어, 서열번호 1과 관련하여 아미노산 위치 79가 언급되어 있지만, 다른 TA 서열(표적 서열 또는 다른 주형 서열)의 맥락에서, 변이체 생성에 대한 상응하는 아미노산 위치는 동일하거나 상이한 위치 번호(예를 들어, 78, 79 또는 80)를 가질 수 있다. 일부 경우에, 서열번호 1 참조 주형에서 본래 아미노산 및 이의 위치는 표적 TA 상에서 본래 아미노산 및 위치와 정확하게 상관관계가 있을 것이다. 다른 경우에, 서열번호 1 주형에서 본래 아미노산 및 이의 위치는 본래 아미노산과 상관관계가 있을 것이지만, 표적에서 이의 위치는 상응하는 주형 위치에 있지 않을 것이다. 그러나, 표적에서의 상응하는 아미노산은 주형에서의 위치로부터 예를 들어, 주형 위치로부터 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개의 아미노산 위치 내의 사전결정된 거리일 수 있다. 다른 경우에, 서열번호 1 주형에서 본래 아미노산은 표적에서 본래 아미노산과 정확하게 상관계가 있지 않을 것이다. 그러나, 표적 서열에서 어떠한 상응하는 아미노산이 주형에서의 아미노산의 일반적인 위치 및 표적 아미노산 부근의 아미노산 서열을 기반으로 하는 것이 이해될 수 있다. 서열 정렬이 본원에 구체적으로 개시되지 않은 TA 서열로 생성될 수 있으며, 이러한 정렬이 본 개시에 비추어 새로운 TA 변이체를 이해하거 생성시키기 위해 사용될 수 있는 것으로 이해된다. 일부 구현예에서, 서열 정렬은 표적 아미노산 부근의 공통 또는 유사한 아미노산을 이해할 수 있게 하며, 그러한 아미노산은 주형과 타겟 서열 간에 특정 양의 동일성 또는 유사성을 갖는 "서열 모티프"로서 보여질 수 있다. 그러한 서열 모티프는 변이체 아모니산이 위치된 TA 서열의 부분, 및 모티프에 존재할 수 있는 변이(들)의 타입을 기술하기 위해 사용될 수 있다.
일부 경우에, 주형 서열 및 표적 서열에서 아미노산 모티프 간의 서열 동일성을 이해하기 위해 기본 로컬 정렬 조사 툴(Basic Local Alignment Search Tool; BLAST) 알고리즘을 이용하는 것이 유용할 수 있다. 이에 따라, 바람직한 실시 모드에서, BLAST는 주형과 표적 단백질 간의 아미노산(예를 들어, 서열 모티프)의 더 짧은 스트레치를 식별하거나 이의 동일성을 이해하기 위해 사용된다. BLAST는 2개의 서열 사이에 짧은 매치를 위치시킴으로써 스미스-워터만(Smith-Waterman) 알고리즘을 근사하는 휴리스틱(heuristic) 방법을 이용하여 유사한 서열을 발견한다. (BLAST) 알고리즘은 특정의 임계값을 초과하는 문의 서열을 닮은 라이브러리 서열을 식별할 수 있다. BLAST 알고리즘을 이용하여 2개 이상의 서열의 관련성을 결정하기 위한 대표적인 파라미터는 예를 들어, 하기에 기술된 바와 같을 수 있다. 간단하게, 아미노산 서열 정렬은 BLASTP 버젼 2.0.8(Jan-05-1999) 및 하기 파라미터를 이용하여 수행될 수 있다. 매트릭스: 0 BLOSUM62; 갭 오픈: 11; 갭 연장: 1; x_드롭오프: 50; 예상: 10. 0; 워드사이즈: 3; 필터: 온. 핵산 서열 정렬은 BLASTN 버젼 2.0.6(Sept-16-1998) 및 하기 파라미터를 이용하여 수행될 수 있다: 매치: 1; 미스매치: -2; 갭 오픈: 5; 갭 연장: 2; x_드롭오프: 50; 예상: 10. 0; 워드크기: 11; 필터: 오프. 당업자는 비교의 엄격성을 증가 또는 감소시키기 위해, 예를 들어, 2개 이상의 서열의 관련성을 결정하기 위해 상기 파라미터를 어떻게 변경시킬 수 있는 지를 인지할 것이다.
부위-유도 돌연변이 유발 또는 서열 변경(예를 들어, 부위-특이적 돌연변이 유발 또는 올리고뉴클레오타이드-유도)은 TA를 인코딩하는 변이체 DNA 서열에 원하는 아미노산 치환을 제공하기 위해 표적 TA DNA 서열에 대한 특정 변화를 이루기 위해 사용될 수 있다. 일반적으로, 변이체 아미노산을 인코딩하는 코돈을 제공하는 서열을 갖는 올리고뉴클레오타이드가 사용된다. 일부 구현예에서, 변이체 TA DNA 서열의 전체 코딩 영역의 인공 유전자 합성은 치환을 위해 표적화된 바람직한 TA가 일반적으로 150개 미만 길이의 아미노산일 때 수행된다.
변이체 TA 서열의 생성을 위한 돌연변이 유발 올리고뉴클레오타이드를 사용한 대표적인 기술은 파지미드에 배치된 TA 유전자 서열을 사용할 수 있는 쿤켈(Kunkel) 방법을 포함한다. E. 콜라이 TA ssDNA에서 파지미드는 주형 상에서 확장된 프라이머인 올리고뉴클레오타이드를 사용한 돌연변이 유발을 위한 주형이다.
TA DNA에서 고려되는 위치의 측면에 있는 제한 효소 부위에 따라, 카세트 돌연변이 유발은 고려되는 변이체 서열을 생성하기 위해 사용될 수 있다. 카세트 돌연변이 유발을 위해, DNA 단편은 플라스미드에 합성 및 삽입되고, 제한 효소로 절단되고, 이후에 후속하여 TA 변이체 돌연변이를 함유한 상보적 올리고뉴클레오타이드의 쌍에 결찰된다. 플라스미드 및 올리고뉴클레오타이드의 제한 단편은 서로 결찰될 수 있다.
다른 구현예에서, 변이체 TA 서열을 생성시키기 위해 사용되는 다른 기술은 PCR 부위 유도 돌연변이 유발이다. 돌연변이 유발 올리고뉴클레오타이드 프라이머는 원하는 돌연변이를 도입하고 돌연변이된 서열을 지닌 PCR 단편을 제공하기 위해 사용된다. 추가 올리고뉴클레오타이드는 제한 효소 소화 및 유전자 내에 삽입을 위해 적합한 제한 부위를 제공하기 위해 돌연변이된 단편의 단부를 연장하기 위해 사용될 수 있다.
부위-유도 돌연변이 유발 기술을 위한 상업적 키트가 또한 이용 가능하다. 예를 들어, QuikchangeTM 키트는 pfu 폴리머라아제와 같은 고-충실도 비-가닥-대체 DNA 폴리머라아제를 사용하여 유전자 영역을 PCR 증폭시키기 위해 상보적 돌연변이 유발 프라이머를 사용한다. 반응은 이완된 닉드(nicked), 원형 DNA를 생성한다. 주형 DNA는 메틸화된 DNA에 대해 특이적인 DpnI와 같은 제한 효소로의 효소적 소화에 의해 제거된다.
일부 구현예에서, 최적화 방법은 유도 진화이다. 유도 진화는 효소의 특성을 개선 및/또는 변경시키기 위해 특정 유전자에 표적화된 돌연변이의 도입을 포함하는 강력한 apprTAh이다. 개선 및/또는 변경된 효소는 여러 효소 변이체(예를 들어, >104)의 자동화된 스크리닝을 허용하는 민감한 고처리량 스크리닝 검정의 개발 및 구현을 통해 식별될 수 있다. 돌연변이 유발의 반복적인 라운드 및 스크리닝은 통상적으로 최적화된 특성을 갖는 효소를 제공하기 위해 수행된다. 돌연변이 유발에 대한 유전자의 영역을 식별하는 데 도움이 될 수 있는 계산 알고리즘이 또한, 개발되었으며, 이는 생성되고 스크리닝되어야 하는 효소 변이체의 수를 크게 감소시킬 수 있다. 다양한 변이체 라이브러리를 생성하는 데 효과적이게 하는 여러 유도 진화 기술이 개발되었고(리뷰를 위해 문헌[Hibbert et al., Biomol. Eng 22:11-19 (2005); Huisman and Lalonde, In Biocatalysis in the pharmaceutical and biotechnology industries pgs. 717-742 (2007), Patel (ed.), CRC Press; Otten and Quax. Biomol. Eng 22:1-9 (2005); 및 Sen et al., Appl Biochem. Biotechnol 143:212-223 (2007)] 참조), 이러한 방법은 여러 효소 부류에 걸쳐 광범위한 특성의 개선에 성공적으로 적용되었다. 유도 진화 기술에 의해 개선 및/또는 변경된 효소 특징은 예를 들어, 비천연 기질의 전환을 위한 선택성/특이성; 튼튼한 고온 가공을 위한 온도 안정성; 낮은 또는 높은 pH 조건하에서 바이오 가공을 위한 pH 안정성; 높은 산물 역가(high product titers)가 달성될 수 있는 기질 또는 산물 내성; 비천연 기질을 포함하기 위한 브로드닝 기질 결합을 포함하는 결합(Km); 산물, 기질, 또는 중요한 중간체에 의해 억제를 제거하는 억제(Ki); 원하는 플럭스를 달성하기 위해 효소 반응속도를 증가시키는 활성(kcat); 단백질 수율 및 전체 경로 플럭스를 증가시키는 발현 수준; 혐기성 조건하에서 공기 민감성 효소의 작업을 위한 산소 안정성; 및 산소의 부재 하에서 혐기성 효소의 작업을 위한 혐기성 활성을 포함한다.
특정 효소의 원하는 성질을 표적으로 하는 돌연변이 유발 및 유전자의 다양화를 위한 다수의 예시적인 방법이 개발되었다. 이러한 방법은 당업자에게 널리 공지되어 있다. 이러한 것들 중 어느 하나는 6ACA, 헥사메틸렌디아민 또는 카프로락탐 경로 효소 또는 단백질의 활성을 변경 및/또는 최적화하기 위해 사용될 수 있다. 이러한 방법은 PCR 반응에서 DNA 폴리머라아제의 충실도를 감소시킴으로써 랜덤 점 돌연변이를 도입하는 EpPCR(Pritchard et al., J Theor. Biol. 234:497-509 (2005)); 전체 원형 플라스미드가 주형으로서 사용되며 마지막 2개의 뉴클레오타이드에 엑소뉴클레아제 내성 티오포스페이트 결합을 갖는 랜덤 6-머가 사용되어 플라스미드를 증폭시키고 이후에 플라스미드가 탠뎀 반복부에서 재순환되는 세포로 형질전환시키는 것을 제외하고 epPCR과 유사한 오류-발생이 쉬운 롤링 원형 증폭(Error-prone Rolling Circle Amplification; epRCA)(Fujii et al., Nucleic Acids Res. 32:e145 (2004); and Fujii et al., Nat. Protoc. 1:2493-2497 (2006)); 키메라 유전자의 라이브러리를 생성하기 위해 DNA 폴리머라아제의 존재 하에서 어닐링 및 연장의 사이클에 의해 다시 어셈블링된 랜덤 단편의 풀을 생성하기 위해 Dnase I 또는 EndoV와 같은 뉴클레아제로 2개 이상의 변이체 유전자의 소화를 통상적으로 포함하는 DNA 또는 패밀리 셔플링(Family Shuffling)(Stemmer, Proc Natl Acad Sci USA 91:10747-10751 (1994); 및 Stemmer, Nature 370:389-391 (1994)); 주형 프라이밍 후 변성 및 어닐링/연장의 매우 짧은 기간(5초 정도로 짧음)과 함께 2 단계 PCR의 반복 사이클을 수반하는 시차 연장(Staggered Extension; StEP)(Zhao et al., Nat. Biotechnol. 16:258-261 (1998)); 랜덤 서열 프라이머가 사용되어 주형의 상이한 세그먼트에 대해 상보적인 다수의 짧은 DNA 단편을 생성하는 랜덤 프라이밍 재조합(Random Priming Recombination; RPR)(Shao et al., Nucleic Acids Res 26:681-683 (1998))을 포함하지만, 이로 제한되지 않는다.
추가 방법은 미스매치 복원에 의해 복원되는 헤테로듀플렉스를 형성하기 위해 선형화된 플라스미드 DNA를 사용하는 헤테로듀플렉스 재조합(Volkov et al, Nucleic Acids Res. 27:e18 (1999); 및 Volkov et al., Methods Enzymol. 328:456-463 (2000)); 단일 가닥 DNA(ssDNA)의 Dnase I 단편화 및 크기 분획화를 이용하는 과도성 주형에서의 랜덤 키메라유발(RACHITT)(Coco et al., Nat. Biotechnol. 19:354-359 (2001)); 주형의 풀로서 사용된 단방향 ssDNA의 존재 하에서 프라이머로부터 단방향으로 성장하는 가닥의 주형 스위칭을 수반하는 절단된 주형에서의 재조합 연장(RETT)(Lee et al., J. Molec. Catalysis 26:119-129 (2003)); 퇴화 프라이머가 분자들 간의 재조합을 제어하기 위해 사용되는 퇴화 올리고뉴클레오타이드 유전자 셔플링(DOGS)(Bergquist and Gibbs, Methods Mol. Biol 352:191-204 (2007); Bergquist et al., Biomol. Eng 22:63-72 (2005); Gibbs et al., Gene 271:13-20 (2001)); 고려되는 유전자 또는 유전자 단편의 1개의 염기쌍 결실과 함께 조합 라이브러리를 생성시키는, 하이브리드 효소의 생성을 위한 증분 절단(ITCHY)(Ostermeier et al., Proc. Natl. Acad Sci. USA 96:3562-3567 (1999); 및 Ostermeier et al., Nat. Biotechnol. 17:1205-1209 (1999)); 포스포티오에이트 dNTP가 사용되어 절단을 생성시키는 것을 제외하고 ITCHY와 유사한 하이브리드 효소의 생성을 위한 티오-증분 절단(THIO-ITCHY)(Lutz et al., Nucleic Acids Res 29:E16 (2001)); 유전자를 재조합하기 위한 2가지 방법, 즉, ITCHY 및 DNA 셔플링을 조합하는 SCRATCHY(Lutz et al., Proc. Natl. Acad Sci. USA 98:11248-11253 (2001)); epPCR을 통해 이루어진 돌연변이 이후에 사용 가능한 활성을 보유한 것에 대해 스크리닝/선택하는 랜덤 드리프트 돌연변이 유발(RNDM)(Bergquist et al., Biomol. Eng. 22:63-72 (2005)); 이노신과 같은 "보편적인" 염기의 존재 하에서 연장시키기 위한 주형으로서 사용되고 이노신-함유 보체의 복제가 랜덤 염기 도입을 제공하고 결과적으로, 돌연변이 유발을 제공하는, 포스포티오에이트 뉴클레오타이드의 랜덤 도입 및 절단을 이용하여 랜덤 길이 단편의 풀을 생성하는 랜덤 돌연변이 유발 방법인 서열 포화 돌연변이 유발(SeSaM)(Wong et al., Biotechnol. J. 3:74-82 (2008); Wong et al., Nucleic Acids Res. 32:e26 (2004); 및 Wong et al., Anal. Biochem. 341:187-189 (2005)); "표적에서 모든 유전적 다양성"을 인코딩하기 위해 설계된 중첩 올리고뉴클레오타이드를 사용하고 셔플링된 자손에 대해 매우 높은 다양성을 어용하는 합성 셔플링(Ness et al., Nat. Biotechnol. 20:1251-1255 (2002)); dUTP 도입의 조합을 이용하고 이후에 종점 DNA 단편화를 수행하기 위해 우라실 DNA 글리코실라아제 이후 피페리딘으로 처리하는, 뉴클레오타이드 교환 및 절제 기술 NexT(Muller et al., Nucleic Acids Res. 33:e17 (2005))을 포함한다.
다른 방법은 링커가 사용되어 2개의 별개의 관련되거나 관련되지 않은 유전자 간에 융합을 용이하게 하며 소정 범위의 키메라가 2개의 유전자 사이에 생성되어 단일-교차 하이브리드의 라이브러리를 야기시키는 서열 상동성-독립 단백질 재조합(SHIPREC)(Sieber et al., Nat. Biotechnol. 19:456-460 (2001)); 출발 물질이 돌연변이의 원하는 부위에서 퇴화되는 2개의 프라이머 및 인서트를 함유한 초나선 이중 가닥 DNA(dsDNA) 플라스미드를 포함하는 Gene Site Saturation Mutagenesis™(GSSM™)(Kretz et al., Methods Enzymol. 388:3-11 (2004)); 제한된 영역을 다수의 가능한 아미노산 서열 변경으로 대체하기 위해 짧은 올리고뉴클레오타이드 카세트의 사용을 포함하는 조합 카세트 돌연변이 유발(CCM)(Reidhaar-Olson et al. Methods Enzymol. 208:564-586 (1991); 및 Reidhaar-Olson et al. Science 241:53-57 (1988)); CCM과 본질적으로 유사하고 핫 스폿 및 핫 영역을 식별하고 이후에 단백질 서열 공간의 규정된 영역을 덮기 위해 CMCM에 의해 연장하기 위해 높은 돌연변이 비율로 epPCR을 이용하는 조합 다수 카세트 돌연변이 유발(CMCM)(Reetz et al., Angew. Chem. Int. Ed Engl. 40:3589-3591 (2001)); mutD5 유전자를 사용하는 조건부 ts 돌연변이 유발 유전자 플라스미드가 선택 동안 랜덤 및 천연 돌연변이 빈도를 20 내지 4000-X 증가시킬 수 있고 선택이 필요하지 않을 때 유해한 돌연변이의 축적을 차단하기 위해, DNA 폴리머라아제 III의 돌연변이체 하위단위를 인코딩하는, 돌연변이 유발 유전자 균주 기술(Selifonova et al., Appl. Environ. Microbiol. 67:3645-3649 (2001)); Low et al., J. Mol. Biol. 260:359-3680 (1996))을 포함한다.
추가의 예시적인 방법은 선택된 아미노산의 조합 돌연변이를 평가하고 최적화하는 다차원 돌연변이 유발 방법인 룩-스루(look-through) 돌연변이 유발(LTM)(Rajpal et al., Proc. Natl. Acad Sci. USA 102:8466-8471 (2005)); 한번에 또는 단일 유전자의 키메라(다수 돌연변이)의 큰 라이브러리를 생성하기 위해 다수의 유전자에 적용될 수 있는 DNA 셔플링 방법(Verenium Corporation에 의해 공급된 Tunable GeneReassembly™ (TGR™) Technology), 특정 폴드를 갖는 구조적으로 규정된 단백질 골격을 고정시키고 폴드 및 전체 단백질 에너지를 안정화시킬 수 있는 아미노산 치환에 대한 서열 공간을 조사하고 일반적으로 공지된 3차원 구조를 갖는 단백질에서 가장 효율적으로 작동하는 최적화 알고리즘인 인 실리코 단백질 설계 자동화(PDA)인 유전자 재어셈블리(Hayes et al., Proc. Natl. Acad Sci. USA 99:15926-15931 (2002)); 및 효소 개선을 위해 유사한 부위를 선택하기 위해 구조/기능의 지식을 이용하고, 돌연변이 유발 방법, 예를 들어, Stratagene QuikChange(Stratagene; San Diego Calif.)을 이용하여 선택된 부위에서 포화 돌연변이 유발을 수행하고, 원하는 특성에 대해 스크리닝/선택하고, 개선된 클론(들)을 이용하여, 다른 부위에서 다시 시작하고 원하는 활성이 달성될 때까지 계속 반복하는 것을 포함하는 반복 포화 돌연변이 유발(ISM)(Reetz et al., Nat. Protoc. 2:891-903 (2007); 및 Reetz et al., Angew. Chem. Int. Ed Engl. 45:7745-7751 (2006))을 포함한다.
돌연변이 유발을 위한 임의의 상술된 방법은 단독으로 또는 임의의 조합으로 사용될 수 있다. 추가적으로, 유도 진화 방법의 임의의 하나 또는 조합은 본원에 기술된 바와 같이, 적응 진화 기술과 함께 사용될 수 있다.
원하는 효소 활성을 갖는 세포는 당분야에 공지된 임의의 방법을 이용하여 식별될 수 있다. 예를 들어, 효소 활성 검정은 효소 활성을 갖는 세포를 식별하기 위해 이용될 수 있다[예를 들어, 문헌[Enzyme Nomenclature, Academic Press, Inc., New York 2007] 참조]. 아디페이트 세미알데하이드 상의 TA 간의 반응을 결정하기 위해 사용될 수 있는 다른 검정은 GC/MS 분석을 포함한다. 다른 예에서, NADH/NADPH의 수준이 모니터링될 수 있다. 예를 들어, NADH/NADPH는 NADP/NADPH 검정 키트(예를 들어, ABCAM™으로부터 입수 가능한 ab65349)를 이용하여 비색적으로 또는 분광학적으로 모니터링될 수 있다.
개시된 TA 효소는 나일론 중간체의 제조를 위한 경로에서 사용될 수 있다. 일부 구현예에서, 비천연 미생물은 아디페이트 세미알데하이드, 또는 중간체로서 아디페이트 세미알데하이드를 사용하여 제조된 다른 나일론 중간체의 제조에서 사용될 수 있다.
일부 구현예에서, 유전적으로 조작된 세포(예를 들어, 비천연 미생물)는 6-아미노카프로산, 카프로락탐, 및 헥사메틸렌디아민과 같은 나일론 중간체를 제조할 수 있다.
일부 구현예에서, 나일론 중간체는 도 1에 기술된 경로를 이용하여 생합성된다. 일부 구현예에서, 도 1 경로는 본원에 기술된 유전적으로 조작된 세포(예를 들어, 비천연 미생물)에서 제공되며, 여기서, 경로는 6-아미노카프로산, 카프로락탐, 및 헥사메틸렌디아민을 제조하기에 충분한 양으로 발현된 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함한다.
일부 구현예에서, 경로는 도 1에 도시된 HMD 경로이다. HMD 경로는 본원에 기술된 유전적으로 개질된 세포(예를 들어, 비천연 미생물)에 제공되며, 여기서, HMD 경로는 HMD를 제조하기에 충분한 양으로 발현되는 HMD 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함한다. 효소 1A는 3-옥소아디필-CoA 티올라아제이며; 1B는 3-옥소아디필-CoA 리덕트랜스아미나아제이며; 1C는 3-하이드록시아디필-CoA 데하이드라리덕트랜스아미나아제이며; 1D는 아디페이트 세미알데하이드리덕트랜스아미나아제이며; 1E는 3-옥소아디필-CoA/아실-CoA 트랜스퍼라아제이며; 1F는 3-옥소아디필-CoA 신타아제이며; 1G는 3-옥소아디필-CoA 하이드롤라아제이며; 1H는 3-옥소아디페이트 리덕트랜스아미나아제이며; 1I는 3-하이드록시아디페이트 데하이드라트랜스아미나아제이며; 1J는 5-카복시-2-펜테노에이트 리덕트랜스아미나아제이며; 1K는 아디필-CoA/아실-CoA 트랜스퍼라아제이며; 1L은 아디필-CoA 신타아제이며; 1M은 아디필-CoA 하이드롤라아제이며; 1N은 아디필-CoA 리덕트랜스아미나아제(알데하이드 형성)이며; 1O는 6-아미노카프로에이트 트랜스아미나아제이며; 1P는 6-아미노카프로에이트 데하이드로게나아제이며; 1Q는 6-아미노카프로일-CoA/아실-CoA 트랜스퍼라아제이며; 1R은 6-아미노카프로일-CoA 신타아제이며; 1S는 아미도하이드롤라아제이며; 1T는 자발적 고리화이며; 1U는 6-아미노카프로일-CoA 리덕트랜스아미나아제(알데하이드 형성)이며; 1V는 HMDA 트랜스아미나아제이며; 1W는 HMDA 데하이드로게나아제이다.
도 1을 참조하면, 일부 구현예에서, 비천연 미생물은 하기 경로들 중 하나 이상을 갖는다: ABCDNOPQRUVW; ABCDNOPQRT; 또는, ABCDNOPS. 아디페이트 세미알데하이드를 제조하기 위한 TA 효소를 포함하는 다른 대표적인 경로는 미국특허 제8,377,680호에 기술된 것을 포함하며, 이러한 문헌은 전문이 본원에 참고로 포함된다.
도 1은 또한, 트랜스퍼라아제 또는 신타아제 효소에 의한 6-아미노카프로에이트로부터 6-아미노카프로일-CoA로의 경로(도 1, 단계 Q 또는 R), 이후 카프로락탐을 형성하기 위한 6-아미노카프로일-CoA의 자발적 고리화(도 1, 단계 T)를 도시한 것이다. 다른 구현예에서, 6-아미노카프로에이트는 6-아미노카프로일-CoA로 활성화되고(도 1, 단계 Q 또는 R), 이후에, HMDA를 형성하기 위해 환원(도 1, 단계 U) 및 아민화(도 1, 단계 V 또는 W)된다. 6-아미노카프로산은 또한, 6-아미노카프로일-CoA 대신에 6-아미노카프로일-포스페이트로 활성화될 수 있다. 6-아미노카프로일-포스페이트는 카프로락탐을 형성하기 위해 자발적으로 환형화될 수 있다. 일부 구현예에서, 6-아미노카프로일-포스페이트는 6-아미노카프로에이트 세미알데하이드로 환원되고, 이는 이후에 도 1에 도시된 바와 같이 HMDA로 전환될 수 있다.
미생물 유기체 또는 미생물을 참조하여 사용될 때 본원에서 사용되는 용어 "비천연"은 미생물 유기체가 언급된 종의 야생형 균주를 포함하는, 언급된 종의 자연 발생 균주에서 일반적으로 발견되지 않는 적어도 하나의 유전적 변경을 가짐을 의미하는 것으로 의도된다. 유전적 변경은 예를 들어, 대사 폴리펩타이드를 인코딩하는 발현 가능한 핵산을 도입한 변형, 다른 핵산 첨가, 핵산 결실, 및/또는 미생물 유전 물질의 다른 기능 파괴를 포함한다. 이러한 변형은 예를 들어, 언급된 종에 대한 이종, 동종, 또는 이종과 동종 폴리펩타이드 둘 모두에 대한, 코딩 영역 및 이의 기능적 단편을 포함한다. 추가 변형은 예를 들어, 변형이 유전자 또는 오페론의 발현을 변경시키는 비-코딩 조절 영역을 포함한다. 대표적인 대사 폴리펩타이드는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 내의 효소를 포함한다.
대사 변형은 이의 자연 발생 상태로부터 변경된 생화학적 반응을 지칭한다. 이에 따라, 비천연 미생물은 대사 폴리펩타이드를 인코딩하는 핵산 또는 이의 기능성 단편에 대한 유전적 변형을 가질 수 있다. 대표적인 대사 변형은 본원에 개시되어 있다.
본원에서 사용되는 용어 "미생물의," "미생물 유기체" 또는 "미생물"은 서로 교환 가능하게 사용되었고, 고세균, 박테리아 또는 진핵생물의 도메인 내에 포함된 미세한 세포로서 존재하는 임의의 유기체를 의미하는 것으로 의도된다. 이에 따라, 이러한 용어는 미세한 크기를 갖는 원핵 세포 또는 진핵 세포 또는 유기체를 포함하는 것으로 의도되고, 모든 종의 박테리아, 고세균 및 진정세균뿐만 아니라 진핵 미생물, 예를 들어, 효모 및 진균을 포함한다. 이러한 용어는 또한 생화학적 제조를 위해 배양될 수 있는 임의의 종의 세포 배양물을 포함한다.
본원에서 사용되는 용어 "CoA" 또는 "조효소 A"는 유기 보조인자 또는 보정 그룹(prosthetic group)(효소의 비단백질 부분)을 의미하는 것으로 의도되며, 이의 존재는 활성 효소 시스템을 형성하기 위한 여러 효소(아포효소)의 활성을 위해 요구된다. 특정의 축합 효소에서 조효소 A 기능은 아세틸 또는 다른 아실 기 전달에서 및 지방산 합성 및 산화, 피루베이트 산화에서, 및 다른 아세틸화에서 작용한다.
본원에서 사용되는, 화학식 -OOC-(CH2)4-COO-(도 1 참조)(IUPAC명 헥산디오에이트)를 갖는 "아디페이트"는 아디프산(IUPAC명 헥산디오산)의 이온화된 형태이며, 아디페이트 및 아디프산은 이의 임의의 염 형태를 포함하는 임의의 이의 중성 또는 이온화된 형태의 화합물을 지칭하기 위해 전반에 걸쳐 서로 교환 가능하게 사용될 수 있는 것으로 이해된다. 특정 형태가 pH에 따라 달라질 것이라는 것이 당업자에 의해 이해된다.
본원에서 사용되는, 화학식 -OOC-(CH2)5-NH2(도 1 참조, 및 6-ACA로서 약침됨)를 갖는 "6-아미노카프로에이트"는 6-아미노카프로산(IUPAC명 6-아미노헥산산)의 이온화된 형태이며, 6-아미노카프로에이트 및 6-아미노카프로산은 이의 임의의 염 형태를 포함하는 임의의 이의 중성 또는 이온화된 형태의 화합물을 지칭하기 위해 전반에 걸쳐 서로 교환 가능하게 사용될 수 있는 것으로 이해된다. 특정 형태가 pH에 따라 달라질 것이라는 것이 당업자에 의해 이해된다.
본원에서 사용되는 "카프로락탐"(IUPAC명 아제판-2-온)은 6-아미노헥산산의 락탐(도 1 참조, 및 CPO로서 약칭됨)이다.
본원에서 사용되는 1,6-디아미노헥산 또는 1,6-헥산디아민으로도 지칭되는 "헥사메틸렌디아민"은 화학식 H2N(CH2)6NH2(도 1 참조, 및 HMD로서 약칭됨)를 갖는다.
배양 또는 성장 조건과 관련하여 사용될 때 본원에서 사용되는 용어 "실질적으로 혐기성"은 산소의 양이 액체 배지 중 용존 산소에 대한 포화도의 약 10% 미만임을 의미하는 것으로 의도된다. 이러한 용어는 또한, 약 1% 미만의 산소의 대기와 함께 유지된 액체 또는 고체 배치의 시일링된 챔버를 포함하는 것으로 의도된다.
배양 또는 성장 조건과 관련하여 사용될 때 본원에서 사용되는 용어 "삼투 억제제"는 삼투물질로서 작용하고 본원에 기술된 미생물 유기체가 삼투 스트레스에서 생존하는 데 도움을 주는 화합물을 의미하는 것으로 의도된다. 삼투 억제제는 예를 들어, 베타인, 아미노산, 및 당 트레할로오스를 포함한다. 이의 비제한적인 예에는 글리신 베타인, 프랄린 베타인, 디메틸테틴, 디메틸설포니오프로피오네이트, 3-디메틸설포니오-2-메틸프로프리오네이트, 피페콜린산, 디메틸설포니오아세테이트, 콜린, L-카르니틴 및 엑토인이 있다.
생화학물질의 제조와 관련하여 사용될 때 본원에서 사용되는 용어 "성장-커플링된"은 언급된 생화학물의 생합성이 미생물의 성장 시기 동안 제조되는 것을 의미하는 것으로 의도된다. 특정 구현예에서, 성장-커플링된 제조는 필수적일 수 있는데, 이는 언급된 생화학물의 생합성이 미생물의 성장 시기 동안 제조된 필수 산물임을 의미한다.
본원에서 사용되는 "대사 변형"은 이의 천연 발생 상태로부터 변경되는 생화학적 반응을 지칭하는 것으로 의도된다. 대사 변형은 예를 들어, 반응에 참여하는 효소를 인코딩하는 하나 이상의 유전자의 기능적 파괴에 의해 생화학적 반응 활성의 제거를 포함할 수 있다.
본원에서 사용되는 용어 "유전자 파괴," 또는 이의 문법적 등가물은 인코딩된 유전자 산물을 비활성화시키는 유전적 변형을 의미하는 것으로 의도된다. 유전적 변경은 예를 들어, 전체 유전자의 결실, 전사 또는 번역을 위해 필요한 조절 서열의 결실, 절단된 유전자 산물을 초래하는 유전자의 일부의 결실, 또는 인코딩된 유전자 산물을 비활성화시키는 임의의 다양한 돌연변이 전략에 의한 것일 수 있다. 유전자 파괴의 하나의 특히 유용한 방법은 완전 유전자 결실인데, 왜냐하면, 이러한 것이 비천연 미생물에서 유전적 반전의 발생을 감소시키거나 제거하기 때문이다.
본원에서 사용되는 "외인성"은 언급된 분자 또는 언급된 활성이 숙주 미생물 유기체 내에 도입됨을 의미하는 것으로 의도된다. 분자는 예를 들어, 숙주 유전 물질 내에 인코딩 핵산의 도입에 의해, 예를 들어, 숙주 염색체 내에 또는 플라스미드와 같은 비-염색체 유전 물질로서 통합에 의해 도입될 수 있다. 이에 따라, 인코딩 핵산의 발현과 관련하여 사용될 때 이러한 용어는 미생물 유기체 내에 발현 가능한 형태로 인코딩 핵산의 도입을 지칭한다. 생합성 활성과 관련하여 사용될 때, 이러한 용어는 언급된 숙주 유기체 내에 도입된 활성을 지칭한다. 소스는 예를 들어, 숙주 미생물 유기체 내에 도입된 후 언급된 활성을 발현시키는 동종 또는 이종 인코딩 핵산일 수 있다. 이에 따라, 용어 "내인성"은 숙주에 존재하는 언급된 분자 또는 활성을 지칭한다. 유사하게는, 이러한 용어는 인코딩 핵산의 발현과 관련하여 사용될 때, 미생물 유기체 내에 함유된 인코딩 핵산의 발현을 지칭한다.
용어 "이종"은 언급된 종과는 다른 소스로부터 유래된 분자, 물질, 또는 활성을 지칭하며, "동종"은 숙주 미생물 유기체로부터 유래된 분자, 물질, 또는 활성을 지칭한다. 이에 따라, 인코딩 핵산의 외인성 발현은 이종 또는 동종 인코딩 핵산 중 어느 하나 또는 둘 모두를 사용할 수 있다.
본원에서 사용되는 용어 "약"은 기술된 값의 ± 10%를 의미한다. 용어 "약"은 가장 가까운 유효 숫자로 반올림된 것을 의미할 수 있다. 이에 따라, 약 5%는 4.5% 내지 5.5%를 의미한다. 추가적으로, 특정 수와 관련한 약은 또한, 그러한 정확한 숫자도 포함한다. 예를 들어, 약 5%는 또한 정확하게 5%도 포함한다.
6-아미노카프로산, 1,6-헥산디올, 카프로락톤, 카프로락탐, 또는 헥사메틸렌디아민의 맥락에서 본원에서 사용되는 용어 "생체 유래"는 이러한 화합물이 미생물 유기체에서 합성됨을 의미한다.
하나 초과의 외인성 핵산이 미생물 유기체에 포함될 때, 외인성 핵산이 상기에 논의된 바와 같이, 언급된 인코딩 핵산 또는 생합성 활성을 지칭하는 것으로 이해된다. 또한, 본원에 개시된 바와 같이, 이러한 외인성 핵산이 별도의 핵산 분자, 폴리시스트론 핵산 분자 또는 이들의 조합 상에서 숙주 미생물 유기체 내에 도입될 수 있고, 여전히 하나 초과의 외인성 핵산으로서 여겨지는 것으로 이해된다. 예를 들어, 본원에 개시된 바와 같이, 미생물 유기체는 원하는 경로 효소 또는 단백질을 인코딩하는 2개 이상의 외인성 핵산을 발현하도록 조작될 수 있다. 원하는 활성을 인코딩하는 2개의 외인성 핵산이 숙주 미생물 유기체 내에 도입되는 경우에, 2개의 외인성 핵산이 예를 들어, 단일 플라스미드, 별도의 플라스미드 상에 단일 핵산으로서 도입될 수 있고, 단일 부위 또는 다수의 부위에 숙주 염색체 내에 도입될 수 있고, 여전히 2개의 외인성 핵산으로서 여겨질 수 있다. 유사하게는, 2개 초과의 외인성 핵산이 예를 들어, 단일 플라스미드, 숙주 염색체 내에 도입되지 않은 별도의 플라스미드 상에 임의의 원하는 조합으로 숙주 유기체 내에 도입될 수 있으며, 플라스미드는 염색체외 구성요소로서 잔류하고, 여전히 2개 이상의 외인성 핵산으로서 여겨진다. 언급된 외인성 핵산 또는 생합성 활성의 수는 숙주 유기체 내에 도입된 별도의 핵산의 수가 아닌, 인코딩 핵산의 수 또는 생합성 활성의 수를 지칭한다.
비천연 미생물 유기체는 안전한 유전적 변경을 함유할 수 있으며, 이는 변경의 상실 없이 5세대 이상 배양될 수 있는 미생물을 지칭한다. 일반적으로, 안정한 유전적 변경은 10세대 이상 지속하는 변형을 포함하며, 특히 안정한 변형은 약 25세대 이상 지속할 것이며, 보다 특히, 안정한 유전적 변형은 무기한을 포함하는, 50세대 이상일 것이다.
유전자 파괴의 경우에, 특히 유용한 안정한 유전적 변경은 유전자 결실이다. 안정한 유전적 변경을 도입하기 위한 유전자 결실의 사용은 유전적 변경 이전에 표현형에 대한 반전의 가능성을 감소시키는 데 특히 유용하다. 예를 들어, 생화학물질의 안정한 성장-커플링된 제조는 예를 들어, 한 세트의 대사 변형 내에 하나 이상의 반응을 촉매화하는 효소를 인코딩하는 유전자의 결실에 의해 달성될 수 있다. 생화학물질의 성장-커플링된 제조의 안정성은 다수의 결실을 통해 추가로 향상되어, 각 파괴된 활성을 위해 발생하는 다수의 보상적 반전의 가능성을 크게 감소시킬 수 있다.
당업자는 본원에 예시된 대사 변형을 포함하는 유전적 변경이 E. 콜라이와 같은 적합한 숙주 유기체, 및 이의 상응하는 대사 반응 또는 원하는 대사 경로에 대한 유전자와 같은 원하는 유전 물질에 대한 적합한 소스 유기체와 관련하여 기술된다는 것을 이해할 것이다. 그러나, 매우 다양한 유기체의 완전한 게놈 시퀀싱 및 게놈학의 분야의 높은 수준의 기술을 고려하여, 당업자는 본질적으로 모든 다른 유기체에 본원에 제공된 교시 및 지침을 용이하게 적용할 수 있을 것이다. 예를 들어, 본원에서 예시된 E. 콜라이 대사 변경은 언급된 종과는 다른 종으로부터 동일하거나 유사한 인코딩 핵산을 도입함으로써 다른 종에 용이하게 적용될 수 있다. 이러한 유전적 변경은 예를 들어, 일반적으로 종 동족체, 및 특히 오르소로그(ortholog), 파라로그(paralog) 또는 비-오르소로그 유전자 변위의 유전적 변경을 포함한다.
오르소로그는 수직 혈통에 의해 관련된 유전자 또는 유전자들이고, 상이한 유기체에서 실질적으로 동일하거나 동일한 기능을 담당한다. 예를 들어, 마우스 에폭사이드 하이드롤라아제 및 인간 에폭사이드 하이드롤라아제는 에폭사이드의 가수분해의 생물학적 기능에 대한 오르소로그로 여겨질 수 있다. 유전자는 예를 들어, 동종이거나 공통 조상으로부터의 진화에 의해 연관된 것을 나타내기 위해 충분한 양의 서열 유사성을 공유할 때 수직 형태에 의해 관련된다. 유전자는 또한, 이러한 것이 1차 서열 유사성이 식별 가능하지 않은 정도로 공통 조상으로부터 진환되었음을 나타내기에 충분한 양의 3차원 구조를 공유하지만, 반드시 서열 유사성을 공유하지 않는 경우 오르소로그로 여겨질 수 있다. 오르소로그인 유전자는 약 25% 내지 100% 아미노산 서열 동일성을 갖는 단백질을 인코딩할 수 있다. 25% 미만의 아미노산 유사성을 공유하는 단백질을 인코딩하는 유전자는 또한, 이의 3차원 구조가 또한 유사성을 나타내는 경우 수직 혈통에 의해 발생한 것으로 여겨질 수 있다. 조직 플라스미노겐 활성제 및 엘라스트랜스아미나아제를 포함하는, 효소의 세린 프로테아제 패밀리의 구성원은 공통 조상으로부터 수직 혈통에 의해 발생한 것으로 여겨진다.
오르소로그는 예를 들어, 진화를 통해 구조 또는 전체 활성으로 분기된 유전자 또는 이의 인코딩된 유전자 산물을 포함한다. 예를 들어, 하나의 종이 2가지 기능을 나타내는 유전자 산물을 인코딩하는 경우 및 이러한 기능이 제2 종에서 별개의 유전자로 분리된 경우에, 3개의 유전자 및 이의 상응하는 산물은 오르소로그로 여겨진다. 생화학적 산물의 제조를 위해, 당업자는 도입되거나 파괴된 대사 활성을 은닉하는 오르소로그 유전자가 비천연 미생물의 구성을 위해 선택되어야 함을 이해할 것이다. 분리 가능한 활성을 나타내는 오르소로그의 예는 별개의 활성이 2개 이상의 종 사이에 또는 단일 종 내에 별개의 유전자 산물로 분리되는 경우이다. 특정 예는 엘라스트랜스아미나아제 단백질분해 및 플라스미노겐 단백질분해, 즉, 2가지 타입의 세린 프로테아제 활성의 팔르스미노겐 활성제 및 엘라스트랜스아미나아제로서 별도의 분자로의 분리이다. 제2 예는 미코플라스마 5'-3' 엑소뉴클레아제 및 트로소필라 DNA 폴리머라아제 III 활성의 분리이다. 제1 종으로부터의 DNA 폴리머라아제는 제2 종으로부터의 엑소뉴클레아제 또는 폴리머라아제 중 어느 하나 또는 둘 모두에 오르소로그으로 여겨질 수 있거나, 그 반대로도 여겨질 수 있다.
반대로, 유사체는 예를 들어, 복제 이후 진화적 발산에 의해 관련된 동족체이고, 유사하거나 공통적인 기능을 가지지만, 동일한 기능을 갖는 것은 아니다. 유사체는 예를 들어, 동일한 종 또는 상이한 종으로부터 기원하거나 유래될 수 있다. 예를 들어, 마이크로솜 에폭사이드 하이드롤라아제(에폭사이드 하이드롤라아제 I) 및 가용성 에폭사이드 하이드롤라아제(에폭사이드 하이드롤라아제 II)는 별개의 반응을 촉매화하고 동일한 종에서 별도의 기능을 갖는 유사체로서 여겨질 수 있는데, 왜냐하면, 이러한 것이 2개의 별개의 효소를 나타내고, 공통 조상으로부터 공동-진화하기 때문이다. 유사체는 서로 유의미한 서열 유사성을 갖는 동일한 종으로부터의 단백질로서, 이는 이러한 것이 동종이거나, 공통 조상으로부터 공진화를 통해 동해 관련이 있음을 시사한다. 파라로그 단백질 패밀리의 그룹은 HipA 동족체, 루시페라아제 유전자, 펩티다아제 등을 포함한다.
비-오르소로그 유전자 변위는 상이한 종에서 언급된 유전자 기능을 치환할 수 있는 하나의 종으로부터의 비-오르소로그 유전자이다. 치환은 예를 들어, 상이한 종에서 언급된 기능과 비교하여 본래 종에서 실질적으로 동일하거나 유사한 기능을 수행할 수 있는 것을 포함한다. 일반적으로, 비-오르소로그 유전자 변위가 언급된 기능을 인코딩하는 공지된 유전자와 구조적으로 관련된 바와 같이 식별 가능할 수 있지만, 그럼에도 불구하고, 덜 구조적으로 관련되지만, 기능적으로 유사한 유전자 및 이의 상응하는 유전자 산물은 본원에서 사용되는 용어의 의미 내에 여전히 속할 것이다. 기능적 유사성은 예를 들어, 치환하고자 하는 기능을 인코딩하는 유전자와 비교하여 비-오르소로그 유전자 산물의 활성 부위 또는 결합 영역에 적어도 일부 구조적 유사성을 필요로 한다. 이에 따라, 비-오르소로그 유전자는 예를 들어, 파라로그 유전자 또는 관련되지 않은 유전자를 포함한다.
이에 따라, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 능력을 식별하고 작제화함에 있어서, 당업자는 특정 종에 본원에 제공된 교시 및 지침을 적용하면서, 대사 변형의 식별이 오르소로그 유전자의 식별 및 포함 또는 비활성화를 포함할 수 있다는 것을 이해할 것이다. 유사한 또는 실질적으로 유사한 대사 반응을 촉매화하는 효소를 인코딩하는 언급된 미생물에 파라로그 유전자 및/또는 비-오르소로그 유전자 변위가 존재하는 한, 당업자는 또한, 이러한 진화적으로 관련된 유전자를 사용할 수 있다. 유전자 파괴 전략에서, 진화적으로 관련된 유전자는 또한, 파괴에 대해 표적화된 효소 활성의 임의의 기능적 중복이 설계된 대사 변형을 단락시키지 않음을 보장하기 위해 활성을 감소시키거나 제거하기 위해 숙주 미생물 유기체, 파라로그 유전자 또는 오르소로그 유전자에서 파괴되거나 결실될 수 있다.
오르소로그, 파라로그 및 비-오르소로그 유전자 변위는 당업자에게 널리 공지된 방법에 의해 결정될 수 있다. 예를 들어, 2개의 폴리펩타이드에 대한 핵산 또는 아미노산 서열의 검사는 비교된 서열 간의 서열 동일성 및 유사성을 나타낼 것이다. 이러한 유사성을 기초로 하여, 당업자는 단백질이 공통 조상으로부터의 진화를 통해 관련되어 있음을 나타낼만큼 유사성이 충분히 높은 지를 결정할 수 있다. 당업자에게 널리 공지된 알고리즘, 예를 들어, Align, BLAST, Clustal W 및 다른 것들은 원시 서열 유사성 또는 동일성을 비교하고, 결정하고, 또한, 가중치 또는 스코어를 할당할 수 있는 서열에서 갭의 존재 또는 유의도를 결정한다. 이러한 알고리즘은 또한, 당분야에 공지되어 있고, 뉴클레오타이드 서열 유사성 또는 동일성을 결정하기 위해 유사하게 적용 가능하다. 관련성을 결정하기 위한 충분한 유사성에 대한 파라미터는 통계학적 유사성을 계산하기 위한 널리 공지된 방법, 또는 랜덤 폴리펩타이드에서 유사한 일치를 발견할 기회, 및 결정될 일치의 유의도를 기초로 하여 계산된다. 2개 이상의 서열의 컴퓨터 비교는 원하는 경우에, 또한, 당업자에 의해 시각적으로 최적화될 수 있다. 관련된 유전자 산물 또는 단백질은 높은 유사성, 예를 들어, 25% 내지 100% 서열 동일성을 갖는 것으로 예상될 수 있다. 관련되지 않은 단백질은 충분한 크기의 데이터베이스가 스캐닝되는 경우(약 5%), 우연히 발생하는 것으로 예상되는 것과 본질적으로 동일한 동일성을 가질 수 있다. 5% 내지 24%의 서열은 비교된 서열이 관련되어 있다는 결론을 내리기 위해 충분한 동족성을 나타낼 수 있거나 나타내지 않을 수 있다. 데이터 세트의 크기가 제공된 이러한 일치의 유의도를 결정하기 위한 추가 통계학적 분석은 이러한 서열의 관련성을 결정하기 위해 수행될 수 있다.
예를 들어, BLAST 알고리즘을 이용하여 2개 이상의 서열의 관련성을 결정하기 위한 예시적인 파라미터는 하기에 기술될 수 있다. 간단하게, 아미노산 서열 정렬은 BLASTP 버젼 2.2.29+(Jan-14, 2014) 및 하기 파라메트랜스아미나아제를 이용하여 수행될 수 있다: 매트릭스: 0 BLOSUM62; 갭 오픈(gap open): 11; 갭 연장(gap extension): 1; x_드롭오프: 50; 예상: 10.0; 워드사이즈: 3; 필터(filter): 온(on). 핵산 서열 정렬은 BLASTN 버젼 2.0.6(Sept-16-1998) 및 하기 파라메트랜스아미나아제를 이용하여 수행될 수 있다: 매치: 1; 미스매치: -2; 갭 오픈: 5; 갭 연장: 2; x_드롭오프: 50; 예상: 10.0; 워드사이즈: 11; 필터: 오프(off). 당업자는 비교의 엄격성을 증가 또는 감소시키기 위해, 예를 들어, 2개 이상의 서열의 관련성을 결정하기 위해 상기 파라메트랜스아미나아제를 어떻게 변경시킬 수 있는 지를 인지할 것이다.
도면에 기술된 바와 같은 것을 포함하는 본원에 개시된 임의의 경로가 원하는 경우에 임의의 경로 중간체 또는 생성물을 제조하는 비천연 미생물 유기체를 생성시키기 위해 사용될 수 있는 것으로 이해된다. 본원에 개시된 바와 같이, 중간체를 제조하는 이러한 미생물 유기체는 원하는 생성물을 제조하기 위해 다운스트림 경로 효소를 발현시키는 다른 미생물 유기체와 조합하여 사용될 수 있다. 그러나, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체를 제조하는 비천연 미생물 유기체가 원하는 생성물로서 중간체를 제조하기 위해 사용될 수 있는 것으로 이해된다.
본원에는 대사 반응, 이의 반응물 또는 생성물에 대한 일반적인 언급, 또는 언급된 대사 반응, 반응물 또는 생성물과 관련되거나 이를 촉매화하는 효소를 인코딩하는 하나 이상의 핵산 또는 유전자에 대한 특정 언급이 기술된다. 본원에서 달리 명확하게 기술하지 않는 한, 당업자는 반응에 대한 언급이 또한, 반응물 및 반응 생성물에 대한 언급을 구성한다는 것을 이해할 것이다. 유사하게는, 본원에서 달리 명확하게 기술하지 않는 한, 반응물 또는 생성물에 대한 언급은 또한, 반응을 언급하며, 임의의 이러한 대사 구성성분에 대한 언급은 또한 언급된 반응을 촉매화하는 효소를 인코딩하는 유전자 또는 유전자들, 반응물 또는 생성물을 언급한다. 마찬가지로, 대사 생화학, 효소학 및 게놈학의 널리 공지된 분야를 고려하면, 본원에서 유전자 또는 인코딩 핵산에 대한 언급은 또한, 상응하는 인코딩된 효소 및 이를 촉매화하는 반응뿐만 아니라 반응물 및 반응 생성물에 대한 언급을 구성한다.
비천연 미생물 유기체는 하나 이상의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로에 참여하는 효소들 중 하나 이상을 인코딩하는 발현 가능한 핵산을 도입함으로써 제조될 수 있다. 생합성을 위해 선택된 숙주 미생물 유기체에 따라, 특정 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 중 일부 또는 모두에 대한 핵산이 발현될 수 있다. 예를 들어, 선택된 숙주에서 원하는 생합성 경로를 위한 하나 이상의 효소가 결핍된 경우에, 결핍된 효소(들)에 대한 발현 가능한 핵산은 후속 외인성 발현을 위해 숙주 내에 도입된다. 대안적으로, 선택된 숙주가 일부 경로 유전자의 내인성 발현을 나타내지만, 다른 것이 결핍된 경우에, 인코딩 핵산은 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성을 달성하기 위해 결핍된 효소(들)에 대해 요구된다. 이에 따라, 비천연 미생물 유기체는 원하는 생합성 경로를 얻기 위해 외인성 효소 활성을 도입함으로써 제조될 수 있거나, 원하는 생합성 경로는 하나 이상의 내인성 효소와 함께, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산과 같은 원하는 산물을 제조하는 하나 이상의 외인성 효소 활성을 도입함으로써 얻어질 수 있다.
선택된 숙주 미생물 유기체의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 구성성분에 따라, 비천연 미생물 유기체는 적어도 하나의 외인성으로 발현된 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로-인코딩 핵산 및 최대 모든, 하나 이상의 아디페이트, 6-아미노카프로산 또는 카프로락탐 생합성 경로에 대한 인코딩 핵산을 포함할 것이다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성은 상응하는 인코딩 핵산의 외인성 발현을 통해 경로 효소에서 결핍된 숙주에서 확립될 수 있다. 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로의 모든 효소가 결핍된 숙주에서, 경로에서 모든 효소의 외인성 발현이 포함될 수 있지만, 숙주가 경로 효소들 중 적어도 하나를 함유하는 경우에도 경로의 모든 효소가 발현될 수 있는 것으로 이해된다.
본원에 제공된 교시 및 지침을 고려하면, 당업자는 발현 가능한 형태로 도입하는 인코딩 핵산의 수가 적어도, 선택된 숙주 미생물 유기체의 아디페이트, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 결점과 적어도 아주 유사할 것임을 이해할 것이다. 이에 따라, 비천연 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로를 구성하는 상기 효소를 인코딩하는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12, 최대 모든 핵산을 가질 수 있다. 일부 구현예에서, 비천연 미생물 유기체는 또한, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성을 촉진시키거나 최적화하거나 숙주 미생물 유기체 상에 다른 유용한 기능을 부여하는 다른 유전적 변형을 포함할 수 있다. 하나의 이러한 다른 작용성은 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 전구체 중 하나 이상, 예를 들어, 아디페이트 합성의 경우에 숙시닐-CoA 및/또는 아세틸-CoA, 또는 본원에 개시된 아디페이트 경로 효소를 포함하는, 6-아미노카프로산 또는 카프로락탐 합성의 경우에 아디필-CoA 또는 아디페이트, 또는 6-아미노카프리오에이트 합성의 경우에 피루베이트 및 숙신 세미알데하이드, 글루타메이트, 글루타릴-CoA, 호모라이신 또는 2-아미노-7-옥소수바레이트, 또는 헥사메틸렌디아민 합성의 경우에 6-아미노카프로에이트, 글루타메이트, 글루타릴-CoA, 피루베이트 및 4-아미노부타날, 또는 2-아미노-7-옥소수바레이트를 포함하는, 이의 합성의 증대를 포함할 수 있다.
일부 구현예에서, 비천연 미생물 유기체는 아디페이트 세미알데하이드와 반응하여 6ACA를 형성하고, 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 적어도 25, 50, 75, 100, 150, 200, 250, 300개 이상의 인접 아미노산과 적어도 약 50% 아미노산 서열 일치성을 갖는 아미노산 서열을 포함하는 트랜스아미나아제로부터 선택된 트랜스아미나아제를 인코딩하는 적어도 하나의 외인성 핵산을 갖는다.
일반적으로, 숙주 미생물 유기체는 자연적으로 제조된 분자로서 또는 원하는 전구체의 새로운 생산 또는 숙주 미생물 유기체에 의해 자연적으로 제조된 전구체의 증가된 생산을 제공하는 조작된 산물로서, 6-아미노카프로산, 카프로락탐, 또는 헥사메틸렌디아민 경로의 전구체를 제조하도록 선택된다. 숙주 유기체는 본원에 개시된 바와 같이, 전구체의 제조를 증가시키기 위해 조작될 수 있다. 또한, 원하는 전구체를 제조하기 위해 조작된 미생물 유기체는 숙주 유기체로서 사용될 수 있고, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로의 효소 또는 단백질을 발현시키기 위해 추가로 조작될 수 있다.
일부 구현예에서, 비천연 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 합성하는 효소 능력을 함유하는 숙주로부터 발생된다. 이러한 특정 구현예에서, 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 제조를 위한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 반응을 유도하기 위해, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 산물의 합성 또는 축적을 증가시키는 것이 유용할 수 있다. 합성 또는 축적 증가는 예를 들어, 상술된 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소 중 하나 이상을 인코딩하는 핵산의 과발현에 의해 달성될 수 있다. 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소 또는 효소들의 과발현은 예를 들어, 내인성 유전자 또는 유전자들의 외인성 발현을 통해, 또는 이종 유전자 또는 유전자들의 외인성 발현을 통해 일어날 수 있다. 이에 따라, 자연 발생 유기체는 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 효소를 인코딩하는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 즉 최대 모든 핵산의 과발현을 통해 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하는, 비천연 미생물 유기체이도록 용이하게 발생될 수 있다. 또한, 비천연 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로에서 효소의 활성을 증가시키는 내인성 유전자의 돌연변이 유발에 의해 생성될 수 있다.
특히 유용한 구현예에서, 인코딩 핵산의 외인성 발현이 사용된다. 외인성 발현은 사용자에 의해 제어된 원하는 발현 수준을 달성하기 위해 발현 및/또는 조절 요소를 숙주 및 적용에 맞춤화할 수 있는 능력을 부여한다. 그러나, 내인성 발현은 또한, 다른 구현예에서, 유도 가능한 프로모터 또는 다른 조절 요소에 연결될 때 유전자의 프로모터의 유도 또는 음성 조절 이펙터를 제거함으로써 사용될 수 있다. 이에 따라, 자연 발생 유도 가능한 프로모터를 갖는 내인성 유전자는 적절한 유도제를 제공함으로써 상향-조절될 수 있거나, 내인성 유전자의 조절 영역은 유도 가능한 조절 요소를 도입하기 위해 조작되어, 원하는 시간에 내인성 유전자의 발현 증가를 조절할 수 있다. 유사하게는, 유도 가능한 프로모터는 비천연 미생물 유기체 내에 도입된 외인성 유전자에 대한 조절 구성요소로서 포함될 수 있다.
일부 구현예에서, 비천연 미생물 유기체는 하나 이상의 유전자 파괴를 포함하며, 여기서, 유기체는 6-ACA, 아디페이트 및/또는 HMDA를 제조한다. 유전자 파괴가 비천연 유기체 상에 아디페이트, 6-ACA 및/또는 HMDA의 제조 증가를 부여하도록, 유전자 파괴가 효소의 활성을 감소시킬 때 유기체의 성장에 대한 아디페이트, 6-ACA 및/또는 HMDA의 제조를 커플링시키는 효소를 인코딩하는 효소에서 일어난다. 이에 따라, 일부 구현예에서, 단백질을 인코딩하는 유전자에서 발생하는 하나 이상의 유전자 파괴를 포함하는 비천연 미생물 유기체, 또는 하나 이상의 유전자 파괴가 유기체에서 아디페이트, 6-ACA 및/또는 HMDA의 제조 증가를 부여하는 효소가 제공된다. 본원에 개시된 바와 같이, 이러한 유기체는 아디페이트, 6-ACA 및/또는 HMDA의 제조를 위한 경로를 함유한다.
방법에서, 임의의 하나 이상의 외인성 핵산이 비천연 미생물 유기체를 제조하기 위해 미생물 유기체 내에 도입될 수 있는 것으로 이해된다. 핵산은 예를 들어, 미생물 유기체 상에 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로를 부여하기 위해 도입될 수 있다. 대안적으로, 인코딩 핵산은 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 능력을 부여하기 위해 원하는 반응들 중 일부를 촉매화하는 생합성 능력을 갖는 중간 미생물 유기체를 제조하기 위해 도입될 수 있다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로를 갖는 비천연 미생물 유기체는 원하는 효소를 인코딩하는 적어도 2개의 외인성 핵산을 포함할 수 있다. 아디페이트 제조의 경우에, 적어도 2개의 외인성 핵산은 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제 및 3-하이드록시아실-CoA 데하이드로게나아제, 또는 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제 및 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제, 또는 3-하이드록시아디필-CoA 및 아디페이트 세미알데하이드 트랜스미나아제, 또는 3-하이드록시아실-CoA 및 아디필-CoA 신타아제 등의 조합과 같은 효소를 인코딩할 수 있다. 카프로락탐 제조의 경우에, 적어도 2개의 외인성 핵산은 CoA-의존 트랜스-에노일-CoA 리덕타아제 및 트랜스아미나아제, 또는 CoA-의존 트랜스-에노일-CoA 리덕트랜스아미나아제 및 아미도하이드롤라아제, 또는 트랜스아미나아제 및 아미도하이드롤라아제의 조합과 같은 효소를 인코딩할 수 있다. 6-아미노카프로산 제조의 경우에, 적어도 2개의 외인성 핵산은 4-하이드록시-2-옥소헵탄-1,7-디오에이트(HODH) TA올라아제 및 2-옥소헵트-4-엔-1,7-디오에이트(OHED) 하이드라트랜스아미나아제, 또는 2-옥소헵트-4-엔-1,7-디오에이트(OHED) 하이드라트랜스아미나아제 및 2-아미노헵탄-1,7-디오에이트(2-AHD) 데카복실라아제, 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제 및 아디필-CoA 데하이드로게나아제, 글루타밀-CoA 트랜스퍼라아제 및 6-아미노피멜로일-CoA 하이드롤라아제, 또는 글루타릴-CoA 베타-케토티올라아제 및 3-아미노피멜레이트 2,3-아미노트랜스아미나아제의 조합과 같은 효소를 인코딩할 수 있다. 헥사메틸렌디아민 제조의 경우에, 적어도 2개의 외인성 핵산은 6-아미노카프로에이트 키나아제 및 [(6-아미노헥사노일)옥시]포스포네이트(6-AHOP) 옥시도리덕트랜스아미나아제, 또는 6-아세트아미도헥사노에이트 키나아제 및 [(6-아세트아미도헥사노일)옥시]포스포네이트(6-AAHOP) 옥시도리덕트랜스아미나아제, 6-아미노카프로에이트 N-아세틸트랜스퍼라아제 및 6-아세트아미도헥사노일-CoA 옥시도리덕트랜스아미나아제, 3-하이드록시-6-아미노피멜로일-CoA 데하이드라트랜스아미나아제 및 2-아미노-7-옥소헵타노에이트 아미노트랜스퍼라아제, 또는 3-옥소피멜로일-CoA 리가아제 및 호모라이신 데카복실라아제의 조합과 같은 효소를 인코딩할 수 있다. 이에 따라, 생합성 경로의 2개 이상의 효소의 임의의 조합이 비천연 미생물 유기체에 포함될 수 있는 것으로 이해된다.
유사하게는, 생합성 경로의 3개 이상의 효소의 임의의 조합이 비천연 미생물 유기체에 포함될 수 있는 것으로 이해되며, 예를 들어, 아디페이트 제조의 경우에, 원하는 생합성 경로의 효소들의 조합이 상응하는 원하는 산물을 제조하는 한, 원하는 경우, 효소 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-하이드록시아실-CoA 데하이드로게나아제, 및 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제; 또는 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-하이드록시아실-CoA 데하이드로게나아제 및 아디페이트 세미알데하이드 데하이드로리덕트랜스아미나아제; 또는 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-하이드록시아실-CoA 데하이드로게나아제 및 아디필-CoA 신테트랜스아미나아제; 또는 3-하이드록시아실-CoA 데하이드로게나아제, 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제 및 아디필-CoA: 아세틸-CoA 트랜스퍼라아제 등의 조합이 비천연 미생물 유기체에 포함될 수 있는 것으로 이해된다. 6-아미노카프로산 제조의 경우에, 적어도 3개의 외인성 핵산은 4-하이드록시-2-옥소헵탄-1,7-디오에이트(HODH) TA올라아제, 2-옥소헵트-4-엔-1,7-디오에이트(OHED) 하이드라트랜스아미나아제 및 2-옥소헵탄-1,7-디오에이트(2-OHD) 데카복실라아제, 또는 2-옥소헵트-4-엔-1,7-디오에이트(OHED) 하이드라트랜스아미나아제, 2-아미노헵트-4-엔-1,7-디오에이트(2-AHE) 리덕트랜스아미나아제 및 2-아미노헵탄-1,7-디오에이트(2-AHD) 데카복실라아제, 또는 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제, 2,3-데하이드로아디필-CoA 리덕트랜스아미나아제 및 아디필-CoA 데하이드로게나아제, 또는 6-아미노-7-카복시헵트-2-에노일-CoA 리덕트랜스아미나아제, 6-아미노피멜로일-CoA 하이드롤라아제 및 2-아미노피멜레이트 데카복실라아제, 또는 글루타릴-CoA 베타-케토티올라아제, 3-아민화 옥시도리덕트랜스아미나아제 및 2-아미노피멜레이트 데카복실라아제, 또는 3-옥소아디필-CoA 티올라아제, 5-카복시-2-펜테노에이트 리덕트랜스아미나아제 및 아디페이트 리덕트랜스아미나아제의 조합과 같은 효소를 인코딩할 수 있다. 헥사메틸렌디아민 제조의 경우에, 적어도 3개의 외인성 핵산은 6-아미노카프로에이트 키나아제, [(6-아미노헥사노일)옥시]포스포네이트(6-AHOP) 옥시도리덕트랜스아미나아제 및 6-아미노카프로 세미알데하이드 아미노트랜스퍼라아제, 또는 6-아미노카프로에이트 N-아세틸트랜스퍼라아제, 6-아세트아미도헥사노에이트 키나아제 및 [(6-아세트아미도헥사노일)옥시]포스포네이트(6-AAHOP) 옥시도리덕트랜스아미나아제, 또는 6-아미노카프로에이트 N-아세틸트랜스퍼라아제, [(6-아세트아미도헥사노일)옥시]포스포네이트(6-AAHOP) 아실트랜스퍼라아제 및 6-아세트아미도헥사노일-CoA 옥시도리덕트랜스아미나아제, 또는 3-옥소-6-아미노피멜로일-CoA 옥시도리덕트랜스아미나아제, 3-하이드록시-6-아미노피멜로일-CoA 데하이드라트랜스아미나아제 및 호모라이신 데카복실라아제, 또는 2-옥소-4-하이드록시-7-아미노헵타노에이트 TA올라아제, 2-옥소-7-아미노헵트-3-에노에이트 리덕트랜스아미나아제 및 호모라이신 데카복실라아제, 또는 6-아세트아미도헥사노에이트 리덕트랜스아미나아제, 6-아세트아미도헥사날 아미노트랜스퍼라아제 및 6-아세트아미도헥산아민 N-아세틸트랜스퍼라아제의 조합과 같은 효소를 인코딩할 수 있다. 유사하게는, 본원에 개시된 생합성 경로의 4개 이상의 효소의 임의의 조합은 원하는 생합성 경로의 효소들의 조합이 상응하는 원하는 산물을 제조하는 한, 원하는 경우에, 비천연 미생물 유기체에 포함될 수 있다.
본원에 기술된 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성 이외에, 비천연 미생물 유기체 및 방법은 서로 및 다른 경로에 의해 생성물 생합성을 달성하기 위한 당분야에 널리 공지된 다른 미생물 유기체 및 방법과의 다양한 조합으로 사용될 수 있다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자의 사용을 제외하고 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산를 제조하는 하나의 대안예는 아디페이트, 6-아미노카프로산 또는 카프로락탐 경로 중간체를 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산으로 전환시킬 수 있는 다른 미생물 유기체의 첨가를 통하는 것이다. 하나의 이러한 절차는 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체를 제조하는 미생물 유기체의 발효를 포함한다. 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체는 이후에, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체를 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산으로 전환시키는 제2 미생물 유기체에 대한 기질로서 사용될 수 있다. 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체는 제2 유기체의 다른 배양물에 직접적으로 첨가될 수 있거나, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 중간체 제조업체의 본래 배양물에는 예를 들어, 세포 분리에 의해 이러한 미생물 유기체가 결여될 수 있으며, 이후에, 발효 브로스에 제2 유기체의 후속 첨가는 중간체 정제 단계 없이 최종 산물을 제조하기 위해 사용될 수 있다.
다른 구현예에서, 비천연 미생물 유기체 및 방법은 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 달성하기 위해 매우 다양한 하위 경로에서 어셈블링될 수 있다. 이러한 구현예에서, 원하는 산물을 위한 생합성 경로는 상이한 미생물 유기체로 구분될 수 있으며, 상이한 미생물 유기체는 최종 산물을 제조하기 위해 공동-배양될 수 있다. 이러한 생합성 방식에서, 하나의 미생물 유기체의 산물은 최종 산물이 합성될 때까지 제2 미생물 유기체에 대한 기질이다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성은 하나의 경로 중간체의 다른 경로 중간체 또는 산물로의 전환을 위한 생합성 경로를 함유하는 미생물 유기체를 작제화함으로써 달성될 수 있다. 대안적으로, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산은 또한, 동일한 용기에서 2개의 유기체를 사용하여 공동-배양 또는 공동-발효를 통해 미생물 유기체로부터 생합성적으로 제조될 수 있으며, 여기서, 제1 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 중간체를 제조하며, 제2 미생물 유기체는 중간체를 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산으로 전환시킨다.
본원에 제공된 교시 및 지침을 고려하면, 당업자는, 매우 다양한 조합 및 순열이 다른 미생물 유기체, 하위 경로를 갖는 다른 비천연 미생물 유기체의 공동-배양, 및 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하기 위한 당해 분야에 널리 공지된 다른 화학적 및/또는 생화학적 절차의 조합과 함께 비천연 미생물 유기체 및 방법에 대해 존재한다는 것을 이해할 것이다.
유사하게는, 숙주 유기체가 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 증가시키기 위해 하나 이상의 유전자 파괴의 도입을 위한 원하는 특징을 기초로 하여 선택될 수 있다는 것이 당업자에 의해 이해된다. 이에 따라, 유전적 변형이 유전자를 파괴하기 위해 숙주 유기체 내에 도입되는 경우에, 유사하지만 동일하지 않은 대사 반응을 촉매화하는 임의의 동족체, 오르소로그 유전자 또는 유사체가 유사하게, 원하는 대사 반응이 충분히 파괴되도록 유사하게 파괴될 수 있다는 것이 이해된다. 상이한 유기체 간의 대사 네트워크 사이에 특정 차이가 존재하기 때문에, 당업자는 제공된 유기체에서 파괴된 실제 유전자가 유기체들 간에 상이할 수 있다는 것을 이해할 것이다. 그러나, 본원에 제공된 교시 및 지침을 고려하면, 당업자는 또한, 방법이 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성을 증가시키는 고려되는 종에서 유기체를 작제화하는 데 필요한 동족 대사 변경을 식별하기 위해 임의의 적합한 숙주 미생물에 적용될 수 있다는 것을 이해할 것이다. 특정 구현예에서, 제조 증가는 유기체의 성장에 대한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 커플링하고, 원하는 경우에 및 본원에 개시된 바와 같이 유기체의 성장에 대한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 필수적으로 커플링시킬 수 있다.
6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소를 위한 핵산을 인코딩하는 소스는 예를 들어, 인코딩된 유전자 산물이 언급된 반응을 촉매화할 수 있는 임의의 종을 포함할 수 있다. 이러한 종은 고세균 및 진정세균을 포함하는 박테리아, 및 효소, 식물, 곤충, 동물, 및 인간을 포함하는 포유동물을 포함하는 진핵 세포를 포함하지만, 이로 제한되지 않는 원핵 및 진핵 유기체 둘 모두를 포함한다. 일부 구현예에서, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소에 대한 인코딩 핵산의 소스는 표 4에 나타나 있다. 일부 구현예에서, 트랜스아미나아제 효소에 대한 인코딩 핵산의 소스는 표 4에 나타나 있다. 일부 구현예에서, 트랜스아미나아제 효소에 대한 인코딩 핵산의 소스에는 아크로모박터(Achromobacter) 속, 아시다미노코쿠스(Acidaminococcus), 콜린셀라(Collinsella), 펩토스트렙토코카세애(Peptostreptococcaceae), 패나르트로박터(Paenarthrobacter) 또는 롬보우스트시아(Romboustsia)가 있다. 일부 구현예에서, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소에 대한 인코딩 핵산의 소스는 에셔리키아 콜라이(Escherichia coli), 에셔리키아 콜라이 str. K12(Escherichia coli str. K12), 에셔리키아 콜라이 C(Escherichia coli C), 에셔리키아 콜라이 W(Escherichia coli W), 슈도모나스 sp(Pseudomonas sp), 슈도모나스 내크무시이(Pseudomonas knackmussii), 슈도모나스 sp. 균주 B13(Pseudomonas sp. Strain B13), 슈도모나스 푸티다(Pseudomonas putida), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 스튜트제리(Pseudomonas stutzeri), 슈도모나스 멘도시나(Pseudomonas mendocina), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris), 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 비브리오 콜레라(Vibrio cholera), 헬리오박터 피로리(Heliobacter pylori), 클렙시엘라 뉴모니애(Klebsiella pneumoniae), 세라티아 프로테아마쿨란스(Serratia proteamaculans), 스트렙토마이세스 sp. 2065(Streptomyces sp. 2065), 슈도모나스 에루지노사(Pseudomonas aeruginosa), 슈도모나스 에루지노사 PAO1(Pseudomonas aeruginosa PAO1), 랄스토니아 유트로파(Ralstonia eutropha), 랄스토니아 유트로파 H16(Ralstonia eutropha H16), 클로스트리듐 아세토부틸리쿰(Clostridium acetobutylicum), 유글레나 그라실리스(Euglena gracilis), 트레포네마 덴티콜라(Treponema denticola), 클로스트리듐 클루이베리(Clostridium kluyveri), 호모 사피엔스(Homo sapiens), 라투스 노르베기쿠스(Rattus norvegicus), 아시네토박터 sp. ADP1(Acinetobacter sp. ADP1), 아시네토박터 sp. 균주 M-1(Acinetobacter sp. Strain M-1), 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor), 유박테리움 바르케리(Eubacterium barkeri), 펩토스트렙토코쿠스 아사카롤리티쿠스(Peptostreptococcus asaccharolyticus), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 보툴리눔 A3 str(Clostridium botulinum A3 str), 클로스트리듐 티로부티리쿰(Clostridium tyrobutyricum), 클로스트리듐 파스테우리아눔(Clostridium pasteurianum), 클로스트리듐 써모아세티쿰(Clostridium thermoaceticum)(무렐라 써모아세티쿰(Moorella thermoaceticum)), 무렐라 테르모아세티카 아시네토박터 칼코아세티쿠스(Moorella thermoacetica Acinetobacter calcoaceticus), 무스 무스쿨루스(Mus musculus), 수스 스크로파(Sus scrofa), 플라보박테리움 sp(Flavobacterium sp), 아르트로박터 아우레센스(Arthrobacter aurescens), 페니실리움 크리소게눔(Penicillium chrysogenum), 아스페르길루스 니제르(Aspergillus niger), 아스페르길루스 니둘란스(Aspergillus nidulans), 바실루스 서브틸리스(Bacillus subtilis), 사카로마이세스 세레비시애(Saccharomyces cerevisiae), 자이모모나스 모빌리스(Zymomonas mobilis), 만헤이미아 숙시니프로듀센스(Mannheimia succiniciproducens), 클로스트리듐 리운그다흘리이(Clostridium ljungdahlii), 클로스트리듐 카복시디보란스(Clostridium carboxydivorans), 게오바실러스 스테아로테르모필루스(Geobacillus stearothermophilus), 아그로박테리움 튜메파시엔스(Agrobacterium tumefaciens), 아크로모박터 자일로속시단스(xylosoxidans), 아크로모박터 데니트리피칸스(Achromobacter denitrificans), 아라비돕시스 탈리아나(Arabidopsis thaliana), 해모필루스 인플루엔재(Haemophilus influenzae), 아시다미노코쿠스 페르멘탄스(Acidaminococcus fermentans), 클로스트리듐 sp. M62/1(Clostridium sp. M62/1), 푸소박테리움 누클레아툼(Fusobacterium nucleatum), 보스 타우루스(Bos taurus), 주글로에아 라미게라(Zoogloea ramigera), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 클로스트리듐 베이제린키이(Clostridium beijerinckii), 메탈로스파에라 세둘라(Metallosphaera sedula), 테르모아내로박터(Thermoanaerobacter) 종, 테르모아내로박터 브록키이(Thermoanaerobacter brockii), 아시네토박터 바일리(Acinetobacter baylyi), 포르피로모나스 깅기발리스(Porphyromonas gingivalis), 류코노스톡 메센테로이데스(Leuconostoc mesenteroides), 술폴로부스 토코다이이(Sulfolobus tokodaii), 술폴로부스 토코다이이 7(Sulfolobus tokodaii 7), 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus), 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus), 술폴로부스 아시도칼다리우스(Sulfolobus acidocaldarius), 살모넬라 티피무륨(Salmonella typhimurium), 살모넬라 엔테리카(Salmonella enterica), 테르모토가 마리티마(Thermotoga maritima), 할로박테리움 살리나룸(Halobacterium salinarum), 바실루스 세레우스(Bacillus cereus), 클로스트리듐 디피실(Clostridium difficile), 알칼리필루스 메탈리레디게네스(Alkaliphilus metalliredigenes), 테르모아내로박터 텡콘게네시스(Thermoanaerobacter tengcongensis), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 헬리코박터 피로리(Helicobacter pylori), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 클로스트리듐 사카로페르부틸아세토니쿰(Clostridium saccharoperbutylacetonicum), 슈도모나스 클로로라피스(Pseudomonas chlororaphis), 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus), 캄필로박터 제주니(Campylobacter jejuni), 테르무스 테르모필루스(Thermus thermophilus), 팰로토말쿨룸 테르모프로피오니쿰(Pelotomaculum thermopropionicum), 박테로이데스 카필로수스(Bacteroides capillosus), 아나에로트룬쿠스 콜리호미니스(Anaerotruncus colihominis), 나트라나에로비우스 테르모필루스(Natranaerobius thermophilius), 아르카에오글로부스 풀기두스(Archaeoglobus fulgidus), 아르카에오글로부스 풀기두스 DSM 4304(Archaeoglobus fulgidus DSM 4304), 할로아르쿨라 마리스모르투이(Haloarcula marismortui), 피로바쿨룸 아에로필룸(Pyrobaculum aerophilum), 피로바쿨룸 아에로필룸 str. IM2(Pyrobaculum aerophilum str. IM2), 니코티아나 타바쿰(Nicotiana tabacum), 멘테 피페리타(Menthe piperita), 피누스 타에다(Pinus taeda), 호르데움 불가레(Hordeum vulgare), 제아 메이스(Zea mays), 로도코쿠스 오파쿠스(Rhodococcus opacus), 큐프리아비두스 네카토르(Cupriavidus necator), 브라디리조비움 자포니쿰(Bradyrhizobium japonicum), 브라디리조비움 자포니쿰 USDA110(Bradyrhizobium japonicum USDA110), 아스카리우스 수움(Ascarius suum), 부티레이트-제조 박테리움 L2-50, 바실루스 메가테리움(Bacillus megaterium), 메타노코쿠스 마리팔루디스(Methanococcus maripaludis), 메타노사르시나 마제이(Methanosarcina mazei), 메타노사르시나 마제이(Methanosarcina mazei), 메타노사르시나 바르케리(Methanocarcina barkeri), 메타노칼도코쿠스 잔나스키이(Methanocaldococcus jannaschii), 카에노르하브디티스 엘레간스(Caenorhabditis elegans), 레이스마니아 마조르(Leishmania major), 메틸로미크로븀 알칼리필룸 20Z(Methylomicrobium alcaliphilum 20Z), 크로모할로박터 살렉시겐스(Chromohalobacter salexigens), 아르카에글루부스 풀기두스(Archaeglubus fulgidus), 클라미도모나스 레인하르드티이(Chlamydomonas reinhardtii), 트리코모나스 바기날리스 G3(trichomonas vaginalis G3), 트리파노소마 브루세이(Trypanosoma brucei), 미코플라나 라모스(Mycoplana ramose), 미크로코쿠스 루테아스(Micrococcus luteas), 아세토박터 파스테우리안스(Acetobacter pasteurians), 클루베로마이세스 락티스(Kluyveromyces lactis), 메소리조비움 로티(Mesorhizobium loti), 락토코쿠스 락티스(Lactococcus lactis), 리시니바실루스 스파에리쿠스(Lysinibacillus sphaericus), 칸디다 보이디니이(Candida boidinii), 칸디다 알비칸스 SC5314(Candida albicans SC5314), 버크홀데리아 암비파리아 AMMD(Burkholderia ambifaria AMMD), 아스카리스 수운(Ascaris suun), 아시네토박터 바우마니이(Acinetobacter baumanii), 아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus), 버크홀데리아 피마툼(Burkholderia phymatum), 칸디다 알비칸스(Candida albicans), 클로스트리듐 서브테르미날레(Clostridium subterminale), 큐프리아비두스 타이와넨시스(Cupriavidus taiwanensis), 플라보박테리움 루테센스(Flavobacterium lutescens), 라칸세아 클루이베리(Lachancea kluyveri), 락토바실루스 sp. 30a(Lactobacillus sp. 30a), 렙토스피라 인테로간스(Leptospira interrogans), 무렐라 테르모아세티카(Moorella thermoacetica), 믹소코쿠스 잔투스(Myxococcus xanthus), 니코티아나 글루티노사(Nicotiana glutinosa), 노카르디아 아이오웬시스(Nocardia iowensis)(sp. NRRL 5646), 슈도모나스 레이네케이 MT1(Pseudomonas reinekei MT1), 랄스토니아 유트로파 JMP134(Ralstonia eutropha JMP134), 랄스토니아 메탈리두란스(Ralstonia metallidurans), 로도코쿠스 조스티이(Rhodococcus jostii), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 셀레노모나스 루미난티움(Selenomonas ruminantium), 스트렙토마이세스 클라불리게누스(Streptomyces clavuligenus), 신트로푸스 아시디트로피쿠스(Syntrophus aciditrophicus), 비브리오 파라해몰리티쿠스(Vibrio parahaemolyticus), 비브리오 불니피쿠스(Vibrio vulnificus) 뿐만 아니라 상응하는 유전자에 대한 본원에 개시되거나 소스 유기체로서 입수 가능한 다른 대표적인 종(실시예 참조)과 같은 종이다. 그러나, 395개의 미생물 게놈 및 다양한 효모, 진균, 식물, 및 포유류 게놈을 포함하는, 현재 550개 초과의 종에 대해 이용 가능한 완전 게놈 서열(NCBI와 같은 공개 데이터베이스에서 입수 가능한 것들 중 절반 이상)과 함께, 예를 들어, 공지된 유전자의 동종, 오르소로그, 파라로그 및 비-오르소로그 유전자 변위 및 유기체 간의 유전적 변경의 상호교환을 포함하는, 관련되거나 별개의 종에서의 하나 이상의 유전자에 대한 필요한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 활성을 인코딩하는 유전자의 식별은 일반적이고, 당분야에 널리 공지되어 있다. 이에 따라, E. 콜라이와 같은 특정 유기체와 관련하여 본원에 기술된 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 가능하게 하는 대사 변경은 원핵 유기체 및 진핵 유기체 모두를 포함하는 다른 미생물에 용이하게 적용될 수 있다. 본원에 제공된 교시 및 지침을 고려하면, 당업자는 하나의 유기체에서 예시된 대사 변경이 다른 유기체에 동일하게 적용될 수 있다는 것을 인지할 것이다.
일부 경우에, 예를 들어, 관련되지 않은 종에서 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로가 존재할 때, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성은 예를 들어, 언급된 반응을 대체하기 위해 유사한, 그러나 동일하지 않은 대사 반응을 촉매화하는 관련되지 않은 종으로부터 유사체 또는 유사체들의 외인성 발현에 의해 숙주 종 상에 부여될 수 있다. 대사 네트워크 간의 특정 차이가 상이한 유기체 간에 존재하기 때문에, 당업자는, 상이한 유기체들 간의 실제 유전자 사용방법이 상이할 수 있다는 것을 이해할 것이다. 그러나, 본원에 제공된 교시 및 지침을 고려하여, 당업자는 또한, 교시 및 방법이 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 합성하는 고려되는 종에서 미생물 유기체를 작제화하기 위해 본원에 예시된 것에 대한 동족 대사 변경을 이용하여 모든 미생물 유기체에 적용될 수 있다는 것을 이해할 것이다.
숙주 미생물 유기체는 예를 들어, 박테리아, 효모, 진균 또는 발효 과정에 적용 가능한 임의의 다양한 다른 미생물에서 생성된 비천연 미생물 유기체로부터 선택될 수 있다. 대표적인 박테리아는 에셔리키아 콜라이(Escherichia coli), 클렙시엘라 옥시토카(Klebsiella oxytoca), 아나에로바이오스필리룸 숙시니프로듀센스(Anaerobiospirillum succiniciproducens), 악티노바실러스 숙시노게네스(Actinobacillus succinogenes), 만헤이미아 숙시니프로듀센스(Mannheimia succiniciproducens), 리조비움 에틀리(Rhizobium etli), 바실루스 서브틸리스(Bacillus subtilis), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 글루코노박터 옥시단스(Gluconobacter oxydans), 자이모모나스 모빌리스(Zymomonas mobilis), 락토코쿠스 락티스(Lactococcus lactis), 락토바실루스 플란타룸(Lactobacillus plantarum), 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor), 클로스트리듐 아세토부틸리쿰(Clostridium acetobutylicum), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 및 슈도모나스 푸티다(Pseudomonas putida)로부터 선택된 종을 포함한다. 대표적인 효모 또는 진균은 사카로마이세스 세레비시애(Saccharomyces cerevisiae), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 클루베로마이세스 락티스(Kluyveromyces lactis), 클루베로마이세스 마르시아누스(Kluyveromyces marxianus), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 니제르(Aspergillus niger), 피키아 파스토리스(Pichia pastoris), 리조푸스 아리주스(Rhizopus arrhizus), 리조부스 오리재(Rhizobus oryzae) 등으로부터 선택된 종을 포함한다. 예를 들어, E. 콜라이는 특히 유용한 숙주 유기체인데, 왜냐하면, 이러한 것이 유전적 조작을 위해 적합한 널리 특징된 미생물 유기체이기 때문이다. 다른 특히 유용한 숙주 유기체는 사카로마이세스 세레비시애와 같은 효모를 포함한다. 임의의 적합한 미생물 숙주 유기체가 원하는 산물을 제조하기 위해 대사 및/또는 유전적 변형을 도입하기 위해 사용될 수 있는 것으로 이해된다.
비천연 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산-제조 숙주의 발현 수준을 구성하고 시험하기 위한 방법은 예를 들어, 당분야에 널리 공지된 재조합 및 검출 방법에 의해 수행될 수 있다. 이러한 방법은 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Ed., Cold Spring Harbor Laboratory, New York (2001); and Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, MD (1999)]에 기술된 문헌에서 확인될 수 있다.
6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 위한 경로에 포함된 외인성 핵산 서열은 비제한적으로, 컨쥬게이션, 전기천공, 화학적 변형, 형질도입, 트랜스펙션, 및 초음파 변형을 포함하는, 당분야에 널리 공지된 기술을 이용하여 숙주 세포에 안정적으로 또는 일시적으로 도입될 수 있다. E. 콜라이 또는 다른 원핵 세포에서의 외인성 발현을 위해, 진핵 핵산의 유전자 또는 cDNA에서의 일부 핵산 서열은 표적화 신호, 예를 들어, N-말단 미토콘드리아 또는 다른 표적화 신호를 인코딩할 수 있으며, 이는 원하는 경우에, 원핵 숙주 세포에서 변형 전에 제거될 수 있다. 예를 들어, 미토콘드리아 리더 서열의 제거는 E. 콜라이의 발현 증가를 초래하였다[Hoffmeister et al., J. Biol. Chem. 280:4329-4338 (2005)]. 효모 또는 다른 진핵 세포에서 외인성 발현을 위해, 유전자는 리더 서열의 첨가 없이 시토솔에서 발현될 수 있거나, 숙주 세포에 대해 적합한 미토콘드리아 표적화 또는 분비 신호와 같은 적합한 표적화 서열의 첨가에 의해 미토콘드리온 또는 다른 소기관에 대해 표적화되거나 분비를 대해 표적화될 수 있다. 이에 따라, 표적화 서열을 제거하거나 포함하기 위한 핵산 서열에 대한 적절한 변형이 원하는 특성을 부여하기 위해 외인성 핵산 서열에 도입될 수 있다는 것이 이해된다. 또한, 유전자는 단백질의 최적화된 발현을 달성하기 위해 당분야에 널리 공지된 기술로 코돈 최적화될 수 있다.
발현 벡터 또는 벡터들은 숙주 유기체에서 기능성인 발현 제어 서열에 작동 가능하게 연결된 본원에서 예시된 하나 이상의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 인코딩 핵산을 포함하도록 작제화될 수 있다. 미생물 숙주 유기체에서 사용하기에 적용 가능한 발현 벡터는 예를 들어, 숙주 염색체 내에 안정한 통합을 위해 작동 가능한 벡터 및 선택 서열 또는 마커를 포함하는, 플라스미드, 파지 벡터, 바이러스 벡터, 에피솜 및 인공 염색체를 포함한다. 추가적으로, 발현 벡터는 하나 이상의 선택 가능한 마커 유전자 및 적절한 발현 제어 서열을 포함할 수 있다. 예를 들어, 항생제 또는 독소에 대한 내성을 제공하거나, 영양요구성 결핍을 보완하거나, 배양 배지에 중요한 영양소를 공급하지 않는 선택 가능한 마커 유전자가 또한 포함될 수 있다. 발현 제어 서열은 당분야에 널리 공지된, 구성적 및 유도성 프로모트랜스아미나아제, 전사 인헨서, 전사 종결자 등을 포함할 수 있다. 2개 이상의 외인성 인코딩 핵산이 공동-발현될 때, 두 핵산 모두는 예를 들어, 단일 발현 벡터 내에 또는 별도의 발현 벡터에 삽입될 수 있다. 단일 벡터 발현에 대하여, 인코딩 핵산은 하나의 공통 발현 제어 서열에 작동 가능하게 연결되거나 하나의 유도성 프로모터 및 하나의 구성적 프로모터와 같은, 상이한 발현 제어 서열에 연결될 수 있다. 대사 또는 합성 경로에 관여된 외인성 핵산 서열의 형질전환은 당분야에 널리 공지된 방법을 이용하여 확인될 수 있다. 이러한 방법은 예를 들어, 핵산 분석, 예를 들어, mRNA의 노턴 블롯 또는 폴리머라아제 연쇄 반응(PCR) 증폭, 또는 유전자 산물의 발현을 위한 면역블롯팅, 또는 도입된 핵산 서열 또는 이의 상응하는 유전자 산물의 발현을 시험하기 위한 다른 적합한 분석 방법을 포함한다. 당업자에 의해, 외인성 핵산이 원하는 산물을 제조하기 위해 충분한 양으로 발현된다는 것이 이해되며, 또한, 발현 수준이 당분야에 널리 공지되고 본원에 개시된 바와 같은 방법을 이용하여 충분한 발현을 얻기 위해 최적화될 수 있다는 것이 이해된다.
일부 구현예에서, 아디페이트, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산과 같은 원하는 중간체 또는 산물을 제조하는 방법이 제공된다. 예를 들어, 아디페이트를 제조하는 방법은 아디페이트를 제조하기에 충분한 기간 동안 및 조건하에서 아디페이트를 제조하기에 충분한 양으로 발현되는 아디페이트 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 아디페이트 경로를 갖는 비천연 미생물 유기체를 배양하는 것을 포함할 수 있으며, 아디페이트 경로는 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-하이드록시아실-CoA 데하이드로게나아제, 3-하이드록시아디필-CoA 데하이드라트랜스아미나아제, 아디페이트 세미알데하이드리덕트랜스아미나아제, 및 아디필-CoA 신테트랜스아미나아제 또는 포스포트랜스아디필라아제/아디페이트 키나아제 또는 아디필-CoA: 아세틸-CoA 트랜스퍼라아제 또는 아디필-CoA 하이드롤라아제를 포함한다. 추가적으로, 아디페이트를 제조하는 방법은 아디페이트 경로, 아디페이트를 제조하기에 충분한 기간 동안 및 조건하에서 아디페이트를 제조하기에 충분한 양으로 발현되는 아디페이트 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 경로, 숙시닐-CoA: 아세틸-CoA 아실 트랜스퍼라아제, 3-옥소아디필-CoA 트랜스퍼라아제, 3-옥소아디페이트 리덕트랜스아미나아제, 3-하이드록시아디페이트 데하이드라트랜스아미나아제, 및 2-에노에이트 리덕트랜스아미나아제를 포함하는 아디페이트 경로를 갖는 비천연 미생물 유기체를 배양하는 것을 포함할 수 있다.
또한, 6-아미노카프로산을 제조하는 방법은 6-아미노카프로산 경로, 6-아미노카프로산을 제조하기에 충분한 기간 동안 및 조건하에서 6-아미노카프로산을 제조하기에 충분한 양으로 발현된 6-아미노카프로산 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 경로, CoA-의존 트랜스-에노일-CoA 리덕트랜스아미나아제 및 트랜스아미나아제 또는 6-아미노카프로에이트 데하이드로게나아제를 포함하는 6-아미노카프로산 경로를 갖는 비천연 미생물 유기체를 배양하는 것을 포함할 수 있다. 추가적으로, 카프로락탐을 제조하기 위한 방법은 카프로락탐 경로, 카프로락탐을 제조하기에 충분한 기간 동안 및 조건하에서 카프로락탐을 제조하기에 충분한 양으로 발현되는 카프로락탐 경로 효소를 인코딩하는 적어도 하나의 외인성 핵산을 포함하는 경로, CoA-의존 알데하이드 데하이드로게나아제, 트랜스아미나아제 또는 6-아미노카프로에이트 데하이드로게나아제, 및 아미도하이드롤라아제를 포함하는 카프로락탐 경로를 갖는 비천연 미생물 유기체를 배양하는 것을 포함할 수 있다.
6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조에 대한 적합한 정제 및/또는 시험 검정은 널리 공지된 방법을 이용하여 수행될 수 있다. 적합한 복제물, 예를 들어, 삼중복제 배양물은 시험되는 각 조작된 균주에 대해 성장될 수 있다. 예를 들어, 조작된 생산 숙주에서 산물 및 부산물 형성이 모니터링될 수 있다. 최종 산물 및 중간체, 및 다른 유기 화합물은 HPLC(고성능 액체 크로마토그래피), GC-MS(가스 크로마토그래피-질량 분광법) 및 LC-MS(액체 크로마토그래피-질량 분광법) 또는 당분야에 널리 공지된 일상적인 절차를 이용한 다른 적합한 분석 방법과 같은 방법에 의해 분석될 수 있다. 발효 브로스에서 산물의 방출은 또한, 배양 상청액으로 시험될 수 있다. 부산물 및 잔류 글루코오스는 예를 들어, 글루코오스 및 알코올에 대한 굴절률 검출기, 및 유기산에 대한 UV 검출기(Lin et al., Biotechnol. Bioeng. 90:775-779 (2005))를 이용한 HPLC, 또는 당분야에 널리 공지된 다른 적합한 검정 및 검출 방법에 의해 정량화될 수 있다. 외인성 DNA 서열로부터의 개개 효소 활성은 또한, 당분야에 널리 공지된 방법을 이용하여 검정될 수 있다.
6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산은 당분야에 널리 공지된 다양한 방법을 이용하여 배양물 중의 다른 성분들과 분리될 수 있다. 이러한 분리 방법은 예를 들어, 연속 액체-액체 추출, 투과증발, 멤브레인 여과, 멤브레인 분리, 역삼투압, 전기투석, 증류, 결정화, 원심분리, 추출 여과, 이온 교환 크로마토그래피, 크기 배제 크로마토그래피, 흡수 크로마토그래피, 및 한외여과를 포함하는 추출 절차뿐만 아니라 방법을 포함한다. 상기 모든 방법은 당분야에 널리 공지되어 있다.
본원에 기술된 임의의 비천연 미생물 유기체는 생합성 산물을 제조하고/하거나 분비하기 위해 배양될 수 있다. 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성 제조를 위해 배양될 수 있다.
6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 위해, 재조합 균주는 탄소 소스 및 다른 필수 영양물을 갖는 배지에서 배양된다. 전체 과정의 비용을 감소시키기 위해 발효기에서 혐기성 조건을 유지하는 것이 때때로 바람직하고 매우 바람직할 수 있다. 이러한 조건은 예를 들어, 먼저 배지에 질소를 살포하고 이후에 플라스크를 셉텀 및 크림프-캡으로 시일링함으로써 얻어질 수 있다. 성장이 혐기성에서 관찰되지 않은 균주에 대하여, 미세호기성 또는 실질적으로 혐기성 조건은 셉텀에 제한된 통기를 위한 작은 홀을 천공시킴으로써 적용될 수 있다. 대표적인 혐기성 조건은 이전에 기술되었고, 당분야에 널리 공지되어 있다. 대표적인 호기성 및 혐기성 조건은 예를 들어, 미국특허 제7,947,483호(2011년 5월 24일에 발표됨)에 기술되어 있다. 발효는 본원에 개시된 바와 같이, 배치, 유가 또는 연속 방식으로 수행될 수 있다.
원하는 경우에, 배지의 pH는 원하는 pH에서 배양 배지를 유지시키기 위해 필요한 경우에, 염기, 예를 들어, NaOH 또는 다른 염기, 또는 산의 첨가에 의해 원하는 pH, 특히, 중성 pH, 예를 들어, 대략 7의 pH에서 유지될 수 있다. 성장 속도는 분광광도계(600 nm)를 이용하여 광학 밀도를 측정함으로써 결정될 수 있으며, 글루코오스 섭취 속도는 시간에 따라 탄소 소스 고갈을 모니터링함으로써 결정될 수 있다.
성장 배지는 예를 들어, 비천연 미생물에 탄소 소스를 공급할 수 있는 임의의 탄수화물 소스를 포함할 수 있다. 이러한 소스는 예를 들어, 당, 예를 들어, 글루코오스, 자일로오스, 아라비노오스, 갈락토오스, 만노오스, 프룩토오스, 수크로오스 및 전분을 포함한다. 탄수화물의 다른 소스는 예를 들어, 재생 가능한 공급원료 및 바이오매스를 포함한다. 방법에서 공급원료로서 사용될 수 있는 바이오매스의 대표적인 타입은 셀룰로오스 바이오매스, 헤미셀룰로오스 바이오매스 및 리그닌 공급원료 또는 공급원료의 일부를 포함한다. 이러한 바이오매스 공급원료는 예를 들어, 글루코오스, 자일로오스, 아라비노오스, 갈락토오스, 만노오스, 플룩토오스 및 전분과 같은 탄소 소스로서 유용한 탄수화물 기질을 함유한다. 본원에 제공된 교시 및 지침을 고려하면, 당업자는 상기에 예시된 것과는 다른 재생 가능한 공급원료 및 바이오매스가 또한, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 위한 미생물 유기체를 배양하기 위해 사용될 수 있다.
상기에 예시된 것과 같은 재생 가능한 공급 원료 이외에, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민, 또는 레불린산 미생물 유기체는 또한, 이의 탄소 소스로서 합성 가스에 성장을 위해 변형될 수 있다. 이러한 특정 구현예에서, 하나 이상의 단백질 또는 효소는 합성 가스 또는 다른 가스상 탄소 소스의 사용을 위한 대사 경로를 제공하기 위해 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 제조 유기체에서 발현된다.
합성 가스 또는 생산자 가스로도 알려진, 합성 가스는 석탄, 및 농작물 및 잔류물을 포함하는, 바이오매스 물질과 같은 탄소 함유 물질의 가스화의 주요 산물이다. 합성 가스는 주로 H2와 CO의 혼합물이고, 석탄, 석탄 오일, 천연 가스, 바이오매스, 및 폐 유기물을 포함하지만, 이로 제한되지 않는, 임의의 유기 공급원료의 가스화로부터 얻어질 수 있다. 가스화는 일반적으로, 높은 산소에 대한 연료의 비율 하에서 수행된다. 대부분이 H2 및 CO이지만, 합성 가스는 또한, CO2 및 다른 가스를 더 작은 용량으로 포함할 수 있다. 이에 따라, 합성 가스는 가스상 탄소의 비용 효과적인 소스, 예를 들어, CO 및 추가적으로, CO2를 제공한다.
우드-륭달(Wood-Ljungdahl) 경로는 CO 및 H2의 아세틸-CoA 및 다른 산물, 예를 들어, 아세테이트로의 전환을 촉매화한다. CO 및 합성 가스를 사용할 수 있는 유기체는 또한, 일반적으로, 동일한 기본 세트의 효소를 통해 CO2 및 CO2/H2 혼합물을 사용하는 능력 및 우드-륭달 경로에 의해 포함된 형질변환을 갖는다. 미생물에 의한 CO2의 아세테이트로의 H2-의존 전환은 CO가 동일한 유기체에 의해 사용될 수 있고 동일한 경로가 관여된 것을 나타내기 전에 오래 인식되었다. 여러 아세토겐은 필요한 환원 동등물을 공급하기 위해 수소가 존재하는 한, 아세테이트와 같은 CO2 및 생성 화합물의 존재 하에서 성장하는 것을 나타내었다[예를 들어, Drake, Acetogenesis, pp. 3-60 Chapman and Hall, New York, (1994)]. 이는 하기 반응식에 의해 요약될 수 있다:
2 CO2 + 4 H2 + n ADP + n Pi → CH3COOH + 2 H2O + n ATP
이에 따라, 우드-륭달 경로를 지닌 비천연 미생물은 아세틸-CoA 및 다른 원하는 산물의 제조를 위해 또한, CO2 및 H2 혼합물을 사용할 수 있다.
우드-륭달 경로는 당분야에 널리 공지되어 있고, 2개의 분기, 즉, (1) 메틸 분기 및 (2) 카보닐 분기로 분리될 수 있는 12개의 반응으로 이루어진다. 메틸 분기는 합성 가스를 메틸-테트라하이드로폴레이트(메틸-THF)로 전환시키는 반면, 카보닐 분기는 메틸-THF를 아세틸-CoA로 전환시킨다. 메틸 분기에서 반응은 하기 효소에 의해 순서대로 촉매화된다: 페레독신 옥시도리덕트랜스아미나아제, 포르메이트 데하이드로게나아제, 포르밀테트라하이드로폴레이트 신테트랜스아미나아제, 메테닐테트라하이드로폴레이트 사이클로데하이드라트랜스아미나아제, 메틸렌테트라하이드로폴레이트 데하이드로게나아제 및 메틸렌테트라하이드로폴레이트 리덕트랜스아미나아제. 카보닐 분기에서 반응은 하기 효소 또는 단백질에 의해 순서대로 촉매화된다: 코발아미드 코리노이드/철-황 단백질, 메틸트랜스퍼라아제, 일산화탄소 데하이드로게나아제, 아세틸-CoA 신타아제, 아세틸-CoA 신타아제 디설파이드 리덕트랜스아미나아제 및 하이드로게나아제, 및 이러한 효소는 또한, 메틸테트라하이드로폴레이트로도 지칭될 수 있음: 코리노이드 단백질 메틸트랜스퍼라아제(예를 들어, AcsE), 코리노이드 철-황 단백질, 니켈-단백질 어셈블리 단백질(예를 들어, AcsF), 페레독신, 아세틸-CoA 신타아제, 일산화탄소 데하이드로게나아제 및 니켈-단백질 어셈블리 단백질(예를 들어, CooC). 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로를 생성하기 위해 상당한 수의 인코딩 핵산을 도입하기 위한 본원에 제공된 교시 및 지침에 따라, 당업자는 동일한 조작 설계가 또한, 적어도, 우드-륭달 효소를 인코딩하는 핵산 또는 숙주 유기체에 존재하지 않는 단백질을 도입하는 것과 관련하여 수행될 수 있음을 이해할 것이다. 이에 따라, 변형된 유기체가 완전 우드-륭달 경로를 함유하게 미생물 유기체 내에 하나 이상의 인코딩 핵산의 도입은 합성 가스 사용 능력을 부여할 것이다.
추가적으로, 일산화탄소 데하이드로게나아제 및/또는 하이드로게나아제 활성과 커플링된 환원성(역) 트리카복실산 사이클은 또한, CO, CO2 및/또는 H2의 아세틸-CoA 및 다른 산물, 예를 들어, 아세테이트로의 전환을 위해 사용될 수 있다. 환원성 TCA 경로를 통해 탄소를 고정시킬 수 있는 유기체는 하기 효소들 중 하나 이상을 사용할 수 있다: ATP 시트레이트-리아제, 시트레이트 리아제, 아코니트랜스아미나아제 이소시트레이트 데하이드로게나아제, 알파-케토글루타레이트: 페레독신 옥시도리덕트랜스아미나아제, 숙시닐-CoA 신테트랜스아미나아제, 숙시닐-CoA 트랜스퍼라아제, 푸마레이트 리덕트랜스아미나아제, 푸마라아제, 말레이트 데하이드로게나아제, NAD(P)페레독신 옥시도리덕트랜스아미나아제, 일산화탄소 데하이드로게나아제, 및 하이드로게나아제. 상세하게는, 일산화탄소 데하이드로게나아제 및 하이드로게나아제에 의해 CO 및/또는 H2로부터 추출된 환원 등가물은 환원성 TCA 사이클을 통해 CO2를 아세틸-CoA 또는 아세테이트에 고정시키기 위해 사용된다. 아세테이트는 효소, 예를 들어, 아세틸-CoA 트랜스퍼라아제, 아세테이트 키나아제/포스포트랜스아세틸라아제, 및 아세틸-CoA 신테트랜스아미나아제에 의해 아세틸-CoA로 전환될 수 있다. 아세틸-CoA는 피루베이트:페레독신 옥시도리덕트랜스아미나아제 및 글루코네오생성 효소에 의해 p-톨루에이트, 테레파탈레이트, 또는 (2-하이드록시-3-메틸-4-옥소부톡시) 포스포네이트 전구체, 글리세르알데하이드-3-포스페이트, 포스포에놀피루베이트, 및 피루베이트로 전환될 수 있다. p-톨루에이트, 테레프탈레이트 또는 (2-하이드록시-3-메틸-4-옥소부톡시) 포스포네이트 경로를 생성하기 위해 충분한 수의 인코딩 핵산을 도입하기 위한 본원에 제공된 교시 및 지침에 따라, 당업자는 동일한 조작 설계가 또한, 적어도, 환원성 TCA 경로 효소 또는 숙주 유기체에 존재하지 않는 단백질을 인코딩하는 핵산을 도입하는 것과 관련하여 수행될 수 있다. 이에 따라, 변형된 유기체가 완전 환원성 TCA 경로를 함유하게 미생물 유기체 내에 하나 이상의 인코딩 핵산의 도입은 합성 가스 사용 능력을 부여할 것이다.
본원에 제공된 교시 및 지침을 고려하면, 당업자는 탄수화물과 같은 탄소 공급원에서 성장하였을 때 생합성된 화합물을 분비하는 비천연 미생물 유기체가 제조될 수 있다는 것을 이해할 것이다. 이러한 화합물은 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로에서 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 및 임의의 중간 대사물을 제조한다. 요구되는 모든 것은 예를 들어, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생합성 경로 중 일부 또는 모두를 포함하는 원하는 화합물 또는 중간체의 생합성을 달성하기 위해 원하는 효소 활성 중 하나 이상을 조작하는 것이다. 이에 따라, 일부 구현예는 탄수화물에서 성장할 때 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하고/하거나 분비하고/하거나 탄수화물에서 성장할 때 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로에서 나타낸 임의의 중간 대사물을 분비하는 비천연 미생물 유기체를 제공한다. 예를 들어, 아디페이트 생산 미생물 유기체는 원하는 경우에, 중간체, 예를 들어, 3-옥소아디필-CoA, 3-하이드록시아디필-CoA, 5-카복시-2-펜테노일-CoA, 또는 아디필-CoA(도 1 참조)로부터 합성을 개시할 수 있다. 또한, 아디페이트 생산 미생물 유기체는 중간체, 예를 들어, 3-옥소아디필-CoA, 3-옥소아디페이트, 3-하이드록시아디페이트, 또는 헥사-2-엔디오에이트로부터 합성을 개시할 수 있다. 6-아미노카프로산 생산 미생물 유기체는 중간체, 예를 들어, 아디페이트 세미알데하이드로부터 합성을 개시할 수 있다. 카프로락탐 생산 미생물 유기체는 원하는 경우에, 중간체, 예를 들어, 아디페이트 세미알데하이드 또는 6-아미노카프로산(도 1 참조)으로부터 합성을 개시할 수 있다.
일부 구현예에서, 비천연 미생물은 도 4 내지 도 9에 도시된 바와 같이 아디페이트, 6ACA, 카프로락톤, 헥사메틸렌디아민 또는 카프로락탐을 생성시킬 수 있다.
일부 구현예에서, 비천연 미생물 유기체는 알데하이드 데하이드로게나아제(ALD) 또는 트랜스에노일 리덕타아제(TER) 또는 둘 모두를 인코딩하는 외인성으로 발현된 핵산을 추가로 포함한다. ALD는 아디페이트 세미알데하이드를 생성하기 위해 아디필-CoA와 반응하며, TER은 5-카복시-2-펜테노일-CoA(CPCoA)와 반응하여 아디필CoA를 형성한다.
일부 구현예에서, ALD 효소는 숙시닐-CoA, 또는 아세틸-CoA, 또는 두 개의 기질 모두와 비교하여 아디필 CoA 기질에 대한 더 큰 촉매 효율 및 활성을 갖는다. 일부 구현예에서, ALD 효소는 표 2에 나타낸 바와 같다.
일부 구현예에서, TER 효소는 하기 표 3에 나타나 있다.
비천연 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하기에 충분한 양으로 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 경로 효소를 인코딩하는 적어도 하나의 핵산을 외인성으로 발현시키기 위해 본원에 예시된 바와 같은 당분야에 널리 공지된 방법을 이용하여 작제화된다. 본원에 제공된 교시 및 지침에 따라, 비천연 미생물 유기체는 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 달성하여 약 0.1 내지 200 mM 또는 그 이상의 세포내 농도를 야기시킬 수 있다. 일반적으로, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 세포내 농도는 약 3 내지 150 mM, 특히, 약 5 내지 125 mM 및 보다 특히, 약 8 내지 100 mM이며, 약 10 mM, 20 mM, 50 mM, 80 mM, 또는 그 이상을 포함한다. 이러한 대표적인 범위 사이 및 각각 이상의 세포내 농도는 또한 비천연 미생물 유기체로부터 달성될 수 있다.
일부 구현예에서, 배양 조건은 혐기성 또는 실질적인 혐기성 성장 또는 유지 조건을 포함한다. 대표적인 혐기성 조건은 이전에 기술되었고, 당분야에 널리 공지되어 있다. 발효 과정을 위한 대표적인 혐기성 조건은 본원에 기술되어 있고, 예를 들어, 미국특허 제7,947,483호(2011년 5월 24일에 발표됨)에 기술되어 있다. 임의의 이러한 조건은 비천연 미생물 유기체뿐만 아니라 당분야에 널리 공지된 다른 혐기성 조건과 함께 이용될 수 있다. 이러한 혐기성 조건하에서, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자는 5 내지 10 mM의 또는 그 이상의 세포내 농도뿐만 아니라 본원에 예시된 모든 다른 농도로 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 합성할 수 있다. 상기 설명이 세포내 농도를 지칭함에도 불구하고, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산 미생물 유기체가 세포내에서 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산을 제조하고/하거나 산물을 배양 배지 내로 분비할 수 있는 것으로 이해된다.
배양 조건은 예를 들어, 액체 배양 절차뿐만 아니라 발효 및 다른 대규모 배양 절차를 포함할 수 있다. 본원에 기술된 바와 같이, 특히 유용한 수율의 생합성 산물은 혐기성 또는 실질적으로 혐기성 배양 조건하에서 얻어질 수 있다.
본원에 기술된 바와 같이, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 달성하기 위한 하나의 대표적인 성장 조건은 혐기성 배양 또는 발효 조건을 포함한다. 특정 구현예에서, 비천연 미생물 유기체는 혐기성 또는 실질적으로 혐기성 조건하에서 유지되거나, 배양되거나, 발효될 수 있다. 간단하게, 혐기성 조건은 산소가 결여된 환경을 지칭한다. 실질적으로 혐기성 조건은 예를 들어, 배지 중의 용해된 산소 농도가 0 내지 10%의 포화를 유지하게 하는, 배양, 배치 발효 또는 연속 발효를 포함한다. 실질적으로 혐기성 조건은 또한, 1% 미만의 산소의 대기로 유지된 시일링된 챔버 내측의 액체 배지 또는 고체 아가에서 세포를 성장 또는 휴지시키는 것을 포함한다. 산소의 백분율은 예를 들어, 배양물에 N2/CO2 혼합물 또는 다른 적합한 비-산소 가스 또는 가스들을 살포함으로써 유지될 수 있다.
본원에 기술된 배양 조건은 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 제조를 위해 스케일 업되고 연속적으로 성장될 수 있다. 대표적인 성장 절차는 예를 들어, 유가 발효 및 배치 분리; 유가 발효 및 연속 분리, 또는 연속 발효 및 연속 분리를 포함한다. 이러한 과정 모두는 당분야에 널리 공지되어 있다. 발효 절차는 상업적 양의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성 제조를 위해 특히 유용하다. 일반적으로, 및 비-연속 배양 절차와 관련하여, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 연속 및/또는 거의-연속 제조는 대수 증식기에서 성장을 유지하고/하거나 거의 유지하기 위해 충분한 영양분 및 배지에서 비천연 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산 유기체를 배양하는 것을 포함할 것이다. 이러한 조건하에서 연속 배양은 예를 들어, 1일, 2, 3, 4, 5, 6 또는 7일 또는 그 이상을 포함할 수 있다. 추가적으로, 연속 배양은 1주, 2, 3, 4 또는 5주 또는 그 이상, 및 최대 수 개월을 포함할 수 있다. 대안적으로, 유기체는 특정 적용을 위해 적합한 경우, 수 시간 동안 배양될 수 있다. 연속 및/또는 거의-연속 배양 조건이 또한 이러한 대표적인 기간 사이의 모든 시간 간격을 포함할 수 있는 것으로 이해되어야 한다. 미생물 유기체를 배양하는 시간이 원하는 목적을 위해 충분한 양의 산물을 제조하기 위해 충분한 시간인 것으로 추가로 이해된다.
발효 절차는 당분야에 널리 공지되어 있다. 간단하게, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성 제조를 위한 발효는 예를 들어, 유가 발효 및 배치 분리; 유가 발효 및 연속 분리, 또는 연속 발효 및 연속 분리에서 사용될 수 있다. 배치 및 연속 발효 절차의 예는 당분야에 널리 공지되어 있다.
실질적인 양의 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 연속 제조를 위한 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자를 이용한 상기 발효 절차 이외에, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산 생산자는 또한, 예를 들어, 산물을 다른 화합물로 전환시키기 위해 화학적 합성 절차로 동시에 처리될 수 있거나, 산물은 발효 배양물로부터 분리될 수 있고, 순차적으로, 원하는 경우, 산물을 다른 화합물로 전환시키기 위한 화학적 전환으로 처리될 수 있다. 본원에 기술된 바와 같이, 3-옥소아디페이트, 헥사-2-엔디오에이트를 사용하는 아디페이트 경로에서의 중간체는 예를 들어, 백금 촉매 상에서 화학적 수소화에 의해 아디페이트로 전환될 수 있다.
본원에 기술된 바와 같이, 6-아미노카프로산, 카프로락탐, 헥사메틸렌디아민 또는 레불린산의 생합성을 달성하기 위한 대표적인 성장 조건은 배양 조건에 삼투 억제제의 첨가를 포함한다. 특정 구현예에서, 비천연 미생물 유기체는 삼투 억제제의 존재 하에 상기에 기술된 바와 같이 유지, 배양 또는 발효될 수 있다. 간단하게, 삼투 억제제는 삼투물질로서 작용하고 본원에 기술된 바와 같은 미생물 유기체가 삼투 스트레스를 유지하는 것을 돕는 화합물을 의미한다. 삼투 억제제는 베타인, 아미노산, 및 당 트레할로오스를 포함하지만, 이로 제한되지 않는다. 이의 비제한적인 예에는 글리신 베타인, 프랄린 베타인, 디메틸테틴, 디메틸설포니오프로피오네이트, 3-디메틸설포니오-2-메틸프로프리오네이트, 피페콜린산, 디메틸설포니오아세테이트, 콜린, L-카르니틴 및 엑토인이 있다. 하나의 양태에서, 삼투 억제제는 글리신 베타인이다. 당업자는 삼투 스트레스으로부터 본원에 기술된 미생물 유기체를 보호하기에 적합한 삼투 억제제의 양 및 타입이 사용되는 미생물 유기체에 따라 달리질 것이라는 것을 이해한다. 예를 들어, 다양한 양의 6-아미노카프로산의 존재 하에서의 에셔리키아 콜라이는 2 mM 글리신 베타인의 존재 하에서 적합하게 성장된다. 배양 조건에서 삼투 억제제의 양은 예를 들어, 약 0.1 mM 이하, 약 0.5 mM 이하, 약 1.0 mM 이하, 약 1.5 mM 이하, 약 2.0 mM 이하, 약 2.5 mM 이하, 약 3.0 mM 이하, 약 5.0 mM 이하, 약 7.0 mM 이하, 약 10 mM 이하, 약 50 mM 이하, 약 100 mM 또는 약 500 mM 이하일 수 있다.
경로를 성공적으로 조작하는 것은 충분한 활성 및 특이성을 갖는 적절한 효소 세트를 식별하는 것을 포함한다. 이는 적절한 효소 세트를 식별하고, 이의 상응하는 유전자를 생산 숙주 내에 클로닝하고, 발효 조건을 최적화하고, 발효 후 산물 형성에 대해 검정하는 것을 수반한다. 6-아미노카프로산 또는 카프로락탐의 제조를 위한 제조 숙주를 조작하기 위해, 하나 이상의 외인성 DNA 서열(들)은 숙주 미생물에서 발현될 수 있다. 또한, 미생물은 기능적으로 결실된 내인성 유전자(들)를 가질 수 있다. 이러한 변형은 재생 가능한 공급원료를 사용하여 6-아미노카프로에이트 또는 카프로락탐을 제조할 수 있을 것이다.
일부 구현예에서, 6-아미노카프로산의 HMDA로의 전환 동안 환형 이민 또는 카프로락탐의 형성을 최소화하거나 심지어 제거하는 것은 작용기(예를 들어, 아세틸, 숙시닐)을 6-아미노카프로산의 아민 기에 첨가하여 환형화하는 것을 방지하는 것을 수반한다. 이는 에셔리키아 콜라이에서 L-글루타메이트로부터 오르니틴 형성과 유사하다. 상세하게는, 글루타메이트는 먼저, N-아세틸글루타메이트 신타아제에 의해 N-아세틸-L-글루타메이트로 전환된다. N-아세틸-L-글루타메이트는 이후에 N-아세틸글루타밀-포스페이트로 활성화되며, 이는 환원되고 아민교환되어 N-아세틸-L-오르니틴을 형성한다. 아세틸 기는 이후에, N-아세틸-L-오르니틴 데아세틸라아제에 의해 N-아세틸-L-오르니틴으로부터 제거되어 L-오르니틴을 형성한다. 이러한 경로는, 글루타메이트로부터의 글루타메이트-5-포스페이트의 형성 이후 글루타메이트-5-세미알데하이드로의 환원이 글루타메이트-5-세미알데하이드로부터 자발적으로 형성된 환형 이민인 (S)-1-피롤린-5-카복실레이트의 형성을 야기시키기 때문에 필요하다. 6-아미노카프로산으로부터 HMDA를 형성하는 경우에, 단계는 6-아미노카프로산을 아세틸-6-아미노카프로산으로 아세틸화하고, 카복실산 기를 CoA 또는 포스페이트 기로 활성화시키고, 환원하고, 아민화하고, 탈아세틸화하는 것을 포함할 수 있다.
실험
실시예 1. 6-아미노카프로산(6ACA) 상에서 활성을 갖는 트랜스아미나아제의 식별
트랜스아미나아제를 인코딩하는 유전자를 기본 로컬 정렬 조사 툴(basic local alignment search tool; BALST)를 이용한 메타게놈 라이브러리 및 공개 데이터베이스로부터 생물정보학적으로 식별하였다(표 4). 각 트랜스아미나아제를 인코딩하는 유전자를 효소-커플링 검정을 이용하여 6-아미노카프로산(6ACA) 및 γ-아미노부티르산(GABA) 중에서 합성, 발현, 및 이에 대한 촉매 활성에 대해 평가하였다.
표 4의 TA 효소 후보물을 인코딩하는 유전자를 구성적 프로모터 하에서 낮은 카피 수의 벡터에 클로닝하고, 작제물을 표준 기술을 이용하여 E. 콜라이로 형질전환시켰다. 형질전환체를 35℃에서 밤새 항생제의 존재 하에서 LB 배지 중에서 배양하고, 그 후에, 세포를 실온에서 15,000 x g으로 스핀 다운하였다. 용해물을 제조하기 위해, 상청액을 제거하고, TA 유전자를 발현시키는 E. 콜라이 세포를 리소자임, 뉴클레아제, 및 10 mM DTT를 함유한 화학적 용해 용액 중에 재현탁시켰다. 용해물을 바로 사용하였다.
트랜스아미나아제 검정 용액은 0.1 M Tris-HCl, pH 8.0; 0.3 mM 6ACA, 0.3 mM GABA, 또는 20 mM Ala; 0.1 mM γ-케토글루타레이트; 1 mM NAD; 및 50 U/mL 글루타메이트 데하이드로게나아제를 함유하였다. TA 용해물을 첨가함으로써 검정을 개시하였고, 실온에서 수행하였다. TA를 함유하지 않은 용해물과 비교하여, 340 nm에서 NADHdml 흡광도의 증가에 의해 활성을 모니터링하였다. 선형률을 Δabs/분으로서 계산하였다. > 100의 선형률은 (++)로 지정되었으며, 1 내지 100의 선형률은 (+)로서 지정되었으며, 활성이 거의 없거나 전혀 없는 선형률은 (-)로 지정되었다. ND는 측정 불가이다.
표 4는 TA 동족체 1, 3, 4, 5, 9, 12, 26, 27, 30, 31, 38, 50, 64, 74, 78, 79, 81, 91, 106, 108, 및 116이 6ACA에 대한 최고 활성 수준을 가짐을 나타낸다.
실시예
2. 트랜스아미나아제 동족체의
생체내
검정
생체내 트랜스아미나아제 동족체의 활성을 시험하기 위해, 선택된 트랜스아미나아제를 인코딩하는 유전자를 1) 3-옥소아디필-CoA 티올라아제(Thl), 2) 3-옥소아디필-CoA 데하이드로게나아제(Hbd), 3) 3-옥소아디필-CoA 데하이드레이트레이타아제("크로토나아제" 또는 Crt), 4) 5-카복시-2-펜테노일-CoA 리덕타아제(Ter); 및 5) 알데하이드 데하이드로게나아제(Ald)를 인코딩하는 도입된 유전자를 또한 포함한 E. 콜라이의 균주로 형질전환하였다. Thl, Hbd, Crt, Ter, Ald 유전자는 미국특허 제8,377,680호(예를 들어, 실시예 8, 이러한 문헌은 전문이 참고로 포함됨)에 보고되어 있다. 이러한 유전자를, TA 효소를 제외하고, 6-아미노카프로에이트(6ACA)를 생성하는 데 필수적인 모든 경로 효소를 포함한 E. 콜라이 균주에 도입하였다. 유전자는 사용한다.
TA 유전자를 발현시키기 위한 벡터를 Thl/Hbd/Crt/Ter/Ald E. 콜라이드 균주 내로 형질전환시키고, 형질전환체를 6ACA 생성에 대해 시험하였다. 조작된 E. 콜라이 세포에 최소 배지 중에서 2% 글루코오스를 공급하였고, 35℃에서 18시간 인큐베이션 후에, 세포를 수확하고, 상청액을 6ACA 생성에 대한 분석 HPLC 또는 표준 LC/MS 분석 방법에 의해 평가하였다. 표 4에 나타낸 바와 같이, Thl, Hbd, Crt, Ter, 및 Ald 유전자를 포함한 E. 콜라이에서 TA 효소를 인코딩하는 유전자의 발현은 이러한 균주에 의해 6ACA를 생성하였다.
실시예 3. 트랜스아미나아제 변이체
아미노산 위치를 아크로모박터 크실로스옥시단스의 동족체 1 TA에서 돌연변이에 대해 식별하였고, 단백질의 결정 구조의 시험에 의해 서열번호 1에 의해 인코딩하였으며, 서열번호 1을 인코딩한 유전자를 선택된 아미노산 위치에서 포화 돌연변이 유발시켰다. 얻어진 변이체를 실시예 1에 기술된 바와 같이 용해물 검정에서 활성에 대해 시험하였다. TA 서열번호 1에 대한 결과는 도 2에 도시되어 있다. 도 2는 서열번호 1의 위치가 활성에 대해 중요함을 나타낸다.
V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265 및 L386에 대한 아미노산 위치에서 TA 효소(서열번호 1)를 인코딩하는 유전자뿐만 아니라 G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, 및 A421에 대한 코돈을 돌연변이시킴으로써 변이체를 생성하였다. 돌연변이는 단독으로 이루어지거나 다른 아미노산 위치에서의 돌연변이와 조합하여 이루어졌다. 소정 아미노산 위치에서의 돌연변이는 변성 프라이머 서열 및 PCR을 이용하여 이루어졌으며, 여기서, 변경된 유전자 서열 혼합물을 E. 콜라이 내로 형질전환시켰다. 형질전환체를 실시예 1에 기술된 바와 같은 용해물 검정에서 시험하였다. 검정에서 야생형 대조군보다 더 높은 활성을 나타내는 용해물을 제공한 클론을 삼중 용해물 검정에서 다시 시험하였다. 계속 야생형 활성보다 더 높은 활성을 나타내는 클론을 이후에 이러한 것이 포함된 TA 유전자의 서열 분석을 위해 준비하였다.
표 5 및 도 3은 활성 클론의 변이체 TA 유전자 서열에서 발견된 돌연변이를 제공한다. "+" 또는 "++"로 나타낸, 야생형 활성보다 더 높은 활성을 나타내는 변이체는 TA 유전자에서 단일 돌연변이 및 조합(다중) 돌연변이를 포함하였다. 표 5는 아미노산 위치 위치 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392(서열번호 1에 대해 식별된 위치)에서 돌연변이를 갖는, 다수의 변이체가 야생형 TA(서열번호 1)보다 더 큰 활성을 나타내어, 이러한 것이 유래된 야생형 TA보다 더 높은 활성을 갖는 다수의 변이체를 야기시킴을 나타낸다.
또한, 여러 변이체를 6ACA 또는 GABA 대신에 기질로서 20 mM 알라닌을 사용하여 검정하였다.
SEQUENCE LISTING
<110> Genomatica Inc.
Shah, Amit M.
Komor, Russell Scott
Warner, Joseph Roy
Nagarajan, Harish
<120> Engineered Transaminase and Methods of Making and Using
<130> GNO0100/WO
<150> US 62/860,160
<151> 2019-06-11
<160> 146
<170> PatentIn version 3.5
<210> 1
<211> 421
<212> PRT
<213> Achromobacter xylosoxidans
<400> 1
Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ala Asn Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Lys Ala Ala
50 55 60
Val Ala Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Gly Tyr Val Ser Leu Ala Glu Arg Ile Asn Arg Leu Ala
85 90 95
Pro Ile Asp Gly Leu Lys Lys Ser Ala Phe Phe Thr Thr Gly Val Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ala Thr Gly Arg Ser
115 120 125
Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro
145 150 155 160
Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser
165 170 175
Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Cys
180 185 190
Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu
210 215 220
Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His
245 250 255
Ser Val Gln Ala Asp Leu Ile Thr Met Ala Lys Ser Leu Gly Gly Gly
260 265 270
Phe Pro Ile Ser Gly Val Val Gly Arg Ala Asp Val Met Asp Ala Pro
275 280 285
Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys
305 310 315 320
Glu Arg Ala Asp Ala Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly
325 330 335
Leu Arg Ala Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser
340 345 350
Met Val Ala Leu Glu Leu Asn Asp Pro Ala Thr Gly Lys Pro Asp Ala
355 360 365
Glu Ala Val Lys Arg Val Gln Ala Arg Ala Ile Glu Lys Gly Leu Ile
370 375 380
Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro
385 390 395 400
Leu Thr Ile Pro Asp Ala Gln Phe Asp Arg Ala Leu Ala Ile Leu Ser
405 410 415
Glu Ala Leu Ala Ala
420
<210> 2
<400> 2
000
<210> 3
<211> 426
<212> PRT
<213> Metagenomic
<400> 3
Met Phe Ile Glu Ala Glu Met Lys Asn Gln Asp Leu Asn Thr Arg Arg
1 5 10 15
Ser Leu Ala Thr Pro Arg Gly Val Gly Val Met Cys Asp Phe Tyr Ala
20 25 30
Val Arg Ala Glu Asn Ala Thr Leu Trp Asp Ala Asn Gly Lys Glu Tyr
35 40 45
Ile Asp Phe Ala Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His
50 55 60
Pro Lys Val Lys Ala Ala Val Ala Ala Gln Leu Asp Asn Phe Thr His
65 70 75 80
Thr Ala Tyr Gln Ile Val Pro Tyr Glu Ser Tyr Ile Ser Leu Ala Glu
85 90 95
Arg Ile Asn Arg Leu Ala Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe
100 105 110
Phe Thr Thr Gly Val Glu Ala Val Glu Asn Ala Ile Lys Ile Ala Arg
115 120 125
Ser Ser Thr Gly Arg Ser Gly Val Ile Ala Phe Ser Gly Ser Phe His
130 135 140
Gly Arg Thr Met Leu Gly Met Ala Leu Thr Gly Lys Val Ala Pro Tyr
145 150 155 160
Lys Leu Ser Phe Gly Pro Met Pro Gly Asp Ile Tyr His Val Pro Phe
165 170 175
Pro Asn Ala Thr Gln Ala Ile Ser Val Ala Asp Ser Leu Lys Ala Leu
180 185 190
Asp Leu Leu Phe Lys Cys Asp Ile Asp Pro Lys Arg Val Ala Ala Ile
195 200 205
Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro
210 215 220
Glu Leu Met Thr Ala Leu Arg Lys Ile Cys Asp Glu His Gly Ile Leu
225 230 235 240
Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu
245 250 255
Tyr Ala Met Glu His His Ser Val Gln Ala Asp Leu Ile Thr Met Ala
260 265 270
Lys Ser Leu Gly Gly Gly Phe Pro Ile Ser Gly Val Val Gly Arg Ala
275 280 285
Asp Val Met Asp Gly Pro Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala
290 295 300
Gly Asn Pro Leu Ala Val Ala Ala Ala His Ala Val Leu Asp Val Ile
305 310 315 320
Ala Glu Glu Lys Leu Cys Asp Arg Ala Asn Val Leu Gly Glu Lys Leu
325 330 335
Arg Ala His Leu Glu Gly Leu Arg Ala Lys Val Pro Gly Ile Ala Asp
340 345 350
Val Arg Gly Leu Gly Ser Met Val Ala Leu Glu Leu Asn Asp Ala Ser
355 360 365
Gly Lys Pro Asp Ala Glu Ala Val Lys Arg Val Gln Ala Arg Ala Leu
370 375 380
Glu Gln Gly Leu Ile Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu
385 390 395 400
Arg Phe Leu Tyr Pro Leu Thr Ile Pro Asp Ala Gln Phe Asp Arg Ala
405 410 415
Leu Ala Ile Leu Ser Asp Ala Leu Ala Ala
420 425
<210> 4
<211> 446
<212> PRT
<213> Metagenomic
<400> 4
Met Val His Leu Arg Ala Ala Thr Arg Thr Ser Cys Thr Pro Val Leu
1 5 10 15
Thr Pro Ser Leu Thr Trp Arg Ser Ala Met Lys Asn Met Asp Leu Asp
20 25 30
Thr Arg Arg Ser Leu Ala Thr Pro Arg Gly Val Gly Val Ala Tyr Ser
35 40 45
Val Tyr Ala Val Arg Ala Glu Asn Ala Thr Ile Trp Asp Ala Asp Gly
50 55 60
Lys Glu Tyr Ile Asp Phe Ala Gly Gly Ile Ala Val Leu Asn Thr Gly
65 70 75 80
His Arg His Pro Lys Val Lys Ala Ala Ile Ala Ala Gln Leu Glu Cys
85 90 95
Phe Thr His Thr Ala Tyr Gln Ile Ile Pro Tyr Glu Pro Tyr Val Ala
100 105 110
Leu Ala Glu Arg Leu Asn Lys Ile Ala Pro Ile Asp Gly Leu Lys Lys
115 120 125
Thr Ala Phe Phe Thr Thr Gly Ala Glu Ala Val Glu Asn Ala Ile Lys
130 135 140
Ile Ala Arg Ala Tyr Thr Lys Arg Thr Gly Val Ile Ala Phe Ser Gly
145 150 155 160
Ala Phe His Gly Arg Thr Leu Leu Gly Met Ala Leu Thr Gly Lys Val
165 170 175
Ala Pro Tyr Lys Val Asp Phe Gly Ala Met Pro Pro Asp Ile Phe His
180 185 190
Ala Pro Phe Pro Asn Thr Thr Gln Asp Ile Ser Val Ala Asp Ala Leu
195 200 205
Lys His Leu Glu Leu Leu Phe Lys Val Asp Ile Asp Pro Lys Arg Val
210 215 220
Ala Ala Ile Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe Asn Pro
225 230 235 240
Ala Pro Ala Glu Leu Met Thr Ala Leu Arg Arg Ile Cys Asp Glu His
245 250 255
Gly Ile Val Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Ala Arg Thr
260 265 270
Gly Lys Leu Phe Ala Met Gln His Tyr Asp Val Gln Pro Asp Met Met
275 280 285
Thr Val Ala Lys Ser Leu Ala Gly Gly Met Pro Leu Ser Gly Val Ile
290 295 300
Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro Gly Gly Leu Gly Gly
305 310 315 320
Thr Tyr Ala Gly Asn Ala Leu Ala Leu Ala Ser Ala His Ala Val Leu
325 330 335
Asp Val Ile Glu Glu Glu Gln Leu Cys Ala Arg Ala Glu Thr Leu Gly
340 345 350
Gln Arg Leu Arg Asp Arg Leu Thr Ala Leu Lys Gly Thr Val Pro Ala
355 360 365
Leu Gly Glu Val Arg Gly Pro Gly Ser Met Val Ala Val Glu Met Asn
370 375 380
Asp Pro Ala Thr Gly Lys Pro Asp Ala Glu Ala Val Lys Arg Val Gln
385 390 395 400
Ala Arg Ala Leu Ala Gln Gly Leu Ile Leu Ile Thr Cys Gly Val Tyr
405 410 415
Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu Thr Ile Pro Asp Ala Gln
420 425 430
Phe Asp Arg Ala Leu Asp Ile Leu Ala Asp Ala Ile Thr Ala
435 440 445
<210> 5
<211> 456
<212> PRT
<213> Metagenomic
<400> 5
Met Thr Thr Thr Ala Ala Asp Ile Thr Tyr Arg Leu Glu Gln Lys Arg
1 5 10 15
Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Val Ala Leu Thr Glu
20 25 30
Arg Arg Lys Ser Val Val Ala Ala Gly Val Ala Ser Ser Val Pro Val
35 40 45
Tyr Val Ala Asp Ala Asp Gly Gly Ile Ile Gln Asp Val Asp Gly Asn
50 55 60
Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala
65 70 75 80
Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His Phe
85 90 95
Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val
100 105 110
Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg Thr
115 120 125
Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val
130 135 140
Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala
145 150 155 160
Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met
165 170 175
Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met
180 185 190
Pro Met Ser Tyr Pro Tyr Arg Glu Glu Asn Pro Ser Ile Thr Gly Ala
195 200 205
Glu Ala Ala Lys Arg Ala Ile Thr Ala Ile Glu Lys Gln Ile Gly Gly
210 215 220
Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly
225 230 235 240
Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ala Ala Trp Ala
245 250 255
Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe
260 265 270
Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Val Ile Pro
275 280 285
Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser
290 295 300
Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly
305 310 315 320
Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu
325 330 335
Ala Ser Ile Gly Ser Met Glu Glu Tyr Gly Leu Asn Ala Arg Ala Lys
340 345 350
His Ile Glu Glu Leu Ala Thr Thr Arg Leu Ser Ala Leu Gln Glu Glu
355 360 365
Leu Ala Gly Ala Gly Ser Ala Val Ile Gly Asp Ile Arg Gly Arg Gly
370 375 380
Ala Met Leu Ala Ile Glu Leu Val His Ala Gly Ser Lys Glu Pro Asn
385 390 395 400
Pro Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val
405 410 415
Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro
420 425 430
Pro Leu Val Ile Thr Asp Glu Leu Leu Asn Asp Gly Leu Asp Val Leu
435 440 445
Ala Ala Ala Ile Lys Ala Asn Ala
450 455
<210> 6
<400> 6
000
<210> 7
<400> 7
000
<210> 8
<400> 8
000
<210> 9
<211> 451
<212> PRT
<213> Metagenomic
<400> 9
Met Thr Thr Thr Ala Asn Glu Leu Ser Tyr Arg Ile Glu Gln Lys Arg
1 5 10 15
Asn Ile Asn Gly Ala Phe Pro Gly Pro Lys Ser Gln Ala Leu Ala Glu
20 25 30
Arg Arg Ala Ala Val Val Ala Ala Gly Val Ala Ser Gly Val Pro Val
35 40 45
Tyr Val Glu Asp Ala Asp Gly Gly Ile Val Arg Asp Val Asp Gly Asn
50 55 60
Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala
65 70 75 80
Ser Asp Pro Ala Val Val Ala Ala Val Gln Glu Ala Ala Ala His Phe
85 90 95
Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val
100 105 110
Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Ala Lys Arg Thr
115 120 125
Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val
130 135 140
Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala
145 150 155 160
Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met
165 170 175
Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met
180 185 190
Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Glu Ile Thr Gly Ala
195 200 205
Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile Gly Gly
210 215 220
Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly
225 230 235 240
Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ser Ala Trp Ala
245 250 255
Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe
260 265 270
Cys Arg Thr Gly Glu Trp Phe Ala Val Asp His Glu Gly Val Val Pro
275 280 285
Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Leu Pro Leu Ser
290 295 300
Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly
305 310 315 320
Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu
325 330 335
Ala Ala Ile Asp Thr Met Glu Gln His Asp Leu Asn Gly Arg Ala Arg
340 345 350
His Ile Glu Glu Leu Ala Leu Gly Lys Leu Arg Glu Leu Ala Asp Glu
355 360 365
Val Ser Val Val Gly Asp Ile Arg Gly His Gly Ala Met Leu Ala Ile
370 375 380
Glu Leu Val Gln Ser Gly Ser Lys Glu Pro Asn Ala Glu Leu Thr Lys
385 390 395 400
Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val Ile Ile Leu Thr Cys
405 410 415
Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val Ile Ser
420 425 430
Asp Glu Leu Leu Ile Asp Gly Leu Glu Val Leu Ala Ala Ala Ile Lys
435 440 445
Ala His Ala
450
<210> 10
<400> 10
000
<210> 11
<400> 11
000
<210> 12
<211> 456
<212> PRT
<213> Metagenomic
<400> 12
Met Thr Ala Thr Ala Ser Glu Ile Thr Tyr Arg Leu Glu Gln Lys Arg
1 5 10 15
Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Ala Ala Leu Thr Glu
20 25 30
Arg Arg Lys Ser Val Val Ala Ala Gly Val Ala Ser Ser Val Pro Val
35 40 45
Tyr Val Ala Asp Ala Asp Gly Gly Ile Ile His Asp Val Asp Gly Asn
50 55 60
Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala
65 70 75 80
Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His Phe
85 90 95
Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val
100 105 110
Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg Thr
115 120 125
Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Ile Lys Val
130 135 140
Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala
145 150 155 160
Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met
165 170 175
Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met
180 185 190
Pro Met Ser Tyr Pro Tyr Arg Glu Glu Asn Pro Ala Ile Thr Gly Ala
195 200 205
Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile Gly Gly
210 215 220
Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly
225 230 235 240
Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ala Ala Trp Ala
245 250 255
Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe
260 265 270
Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Ile Val Pro
275 280 285
Asp Ile Met Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser
290 295 300
Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly
305 310 315 320
Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu
325 330 335
Ala Ser Ile Gly Ser Met Glu Glu Tyr Asp Leu Ala Gly Arg Ala Arg
340 345 350
His Ile Glu Ala Leu Ala Thr Gly Arg Leu Arg Glu Leu Gln Ala Glu
355 360 365
Leu Ala Asp Ala Gly Thr Ala Val Ile Gly Asp Val Arg Gly Arg Gly
370 375 380
Ala Met Leu Ala Ile Glu Leu Val Gln Ala Gly Ser Lys Glu Pro Asn
385 390 395 400
Pro Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val
405 410 415
Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro
420 425 430
Pro Leu Val Ile Thr Asp Glu Leu Leu Asn Asp Gly Leu Asp Val Leu
435 440 445
Ala Ala Ala Ile Lys Ala Asn Ala
450 455
<210> 13
<211> 456
<212> PRT
<213> Paenarthrobacter aurescens TC1
<400> 13
Met Thr Thr Thr Ala Asn Glu Leu Ser Tyr Arg Ile Glu Gln Lys Arg
1 5 10 15
Asn Ile Asn Gly Ala Phe Pro Gly Pro Lys Ser Gln Ala Leu Ala Glu
20 25 30
Arg Arg Ser Ala Val Val Ala Ala Gly Val Ala Ser Gly Val Pro Val
35 40 45
Tyr Val Glu Asp Ala Asp Gly Gly Ile Ile Arg Asp Val Asp Gly Asn
50 55 60
Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala
65 70 75 80
Ser Asp Pro Ala Val Val Ala Ala Val Gln Glu Ala Ala Ala His Phe
85 90 95
Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val
100 105 110
Thr Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Ala Lys Arg Thr
115 120 125
Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val
130 135 140
Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala
145 150 155 160
Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met
165 170 175
Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met
180 185 190
Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Glu Ile Thr Gly Ala
195 200 205
Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile Gly Gly
210 215 220
Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly
225 230 235 240
Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ser Glu Trp Ala
245 250 255
Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe
260 265 270
Cys Arg Thr Gly Glu Trp Phe Ala Val Asp His Glu Gly Val Val Pro
275 280 285
Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Leu Pro Leu Ser
290 295 300
Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly
305 310 315 320
Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu
325 330 335
Ala Ala Ile Asp Thr Met Glu Gln His Asp Leu Asn Gly Arg Ala Arg
340 345 350
His Ile Glu Glu Leu Ala Leu Gly Lys Leu Arg Glu Leu Ala Ala Glu
355 360 365
Leu Ser Ala Gly Gly Gly Ser Val Val Gly Asp Ile Arg Gly Arg Gly
370 375 380
Ala Met Leu Ala Ile Glu Leu Val Gln Pro Gly Ser Lys Glu Pro Asn
385 390 395 400
Ala Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val
405 410 415
Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro
420 425 430
Pro Leu Val Ile Ser Asp Glu Leu Leu Ile Asp Gly Leu Glu Val Leu
435 440 445
Ala Ala Ala Ile Lys Ala His Ala
450 455
<210> 14
<400> 14
000
<210> 15
<211> 425
<212> PRT
<213> Metagenomic
<400> 15
Met Ser Lys Thr Asn Ala Ser Leu Met Lys Arg Arg Glu Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Lys
20 25 30
Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Val His Pro Lys Ile Ile
50 55 60
Ala Ala Val Thr Glu Gln Leu Asn Lys Leu Thr His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Val Glu Val Cys Glu Lys Ile Asn Ala
85 90 95
Lys Val Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly
100 105 110
Ser Glu Ala Val Glu Asn Ser Ile Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Tyr Pro Asn Glu Leu
165 170 175
His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Glu Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys
210 215 220
Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu
245 250 255
Gln Met Gly Val Ala Ala Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala
260 265 270
Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu His
305 310 315 320
Leu Leu Asp Arg Cys Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu
325 330 335
Lys Ala Ile Gln Ala Lys Tyr Pro Val Ile Gly Glu Val Arg Ala Leu
340 345 350
Gly Ala Met Ile Ala Val Glu Leu Phe Val Asp Gly Asp Ser His Lys
355 360 365
Pro Asn Ala Pro Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Val
385 390 395 400
Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala
405 410 415
Ile Ile Glu Glu Cys Phe Ser Glu Leu
420 425
<210> 16
<400> 16
000
<210> 17
<400> 17
000
<210> 18
<400> 18
000
<210> 19
<400> 19
000
<210> 20
<400> 20
000
<210> 21
<400> 21
000
<210> 22
<400> 22
000
<210> 23
<400> 23
000
<210> 24
<400> 24
000
<210> 25
<400> 25
000
<210> 26
<211> 421
<212> PRT
<213> Metagenomic
<400> 26
Val Asn Asn His Glu Leu Asn Glu Arg Arg Leu Gln Ala Thr Pro Arg
1 5 10 15
Gly Ile Gly Val Met Cys Gly Phe Tyr Ala Asp Lys Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ile Glu Gly Asn Glu Val Ile Asp Phe Ala Ala Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Arg His Pro Lys Val Ile Ala Ala
50 55 60
Ile Glu Lys Gln Leu Gln Ser Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Gly Tyr Ile Ala Leu Ala Glu Arg Ile Asn Ala Arg Val
85 90 95
Pro Ile Glu Gly Pro Ala Lys Thr Ala Phe Phe Ser Thr Gly Ala Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Tyr Thr Lys Arg Pro
115 120 125
Gly Leu Ile Thr Phe Gly Gly Ala Phe His Gly Arg Thr Phe Met Thr
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Gly Phe Gly Pro
145 150 155 160
Phe Pro Gly Ser Val Tyr His Ala Gln Tyr Pro Asn Thr Leu His Gly
165 170 175
Val Ser Ser Gln Asp Ala Leu Lys Ser Leu Glu Arg Ile Phe Lys Ala
180 185 190
Asp Ile Ala Pro Asp Gln Val Ala Ala Ile Ile Leu Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Val Ala Pro Pro Asp Phe Met Gln Gly Leu
210 215 220
Arg Ala Leu Cys Asp Thr His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Ala Arg Thr Gly Lys Leu Phe Ser Met Glu His His
245 250 255
Cys Val Lys Pro Asp Leu Ile Thr Met Ala Lys Ser Leu Ala Gly Gly
260 265 270
Met Pro Leu Ser Ala Val Ser Gly Arg Ala Glu Val Met Asp Ala Pro
275 280 285
Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Ile
290 295 300
Ala Ala Ala Leu Ala Val Leu Asp Val Ile Asp Glu Glu Asp Leu Cys
305 310 315 320
Ala Arg Ala Ser His Leu Gly His His Leu Val Glu Val Leu Ser Lys
325 330 335
Ala Lys Ser Gly Cys Pro Tyr Ile Ala Asp Ile Arg Ala Gln Gly Ser
340 345 350
Met Val Ala Val Glu Phe Asn Asp Pro Glu Thr Gly Gln Pro Ser Pro
355 360 365
Glu Phe Thr Arg Gln Val Gln Glu Arg Ala Leu Ala Glu Gly Leu Leu
370 375 380
Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Ile Arg Phe Leu Tyr Pro
385 390 395 400
Leu Thr Ile Pro Asp Ala Gln Phe Arg Lys Ala Leu Asp Ile Ile Ser
405 410 415
Ala Ser Leu Thr Arg
420
<210> 27
<211> 457
<212> PRT
<213> Metagenomic
<400> 27
Met Thr Ile Leu Glu His Gly Thr Glu Thr Cys Ile Gly Gly Pro Thr
1 5 10 15
Leu Pro Gln Ile Arg Arg Leu Val Thr Glu Val Pro Gly Pro Asn Ser
20 25 30
Arg Ala Leu Ala Lys Arg Arg Ser Ala Ala Leu Pro Ala Gly Leu Thr
35 40 45
Ser Gly Ser Ser Ile Tyr Val Ala Ala Ala Gly Gly Gly Val Val Val
50 55 60
Asp Val Asp Asp Asn Ser Phe Ile Asp Phe Gly Ser Gly Ile Ala Val
65 70 75 80
Thr Thr Val Gly Asn Ser Ala Pro Arg Val Val Glu Arg Thr Thr Arg
85 90 95
Gln Leu Gly Gln Phe Thr His Thr Cys Phe Leu Ala Asn Pro Tyr Glu
100 105 110
Gly Tyr Leu Glu Val Cys Glu Ala Leu Asn Arg Leu Thr Pro Gly Asp
115 120 125
His Glu Lys Arg Thr Ala Leu Phe Asn Thr Gly Ser Glu Ala Leu Glu
130 135 140
Asn Ala Val Lys Tyr Ala Arg Ala Ala Thr Gly Arg Pro Ala Val Val
145 150 155 160
Val Phe Asp His Ala Phe His Gly Arg Thr Leu Met Thr Met Thr Met
165 170 175
Thr Ala Lys Asn Gln Pro Tyr Lys Ala Thr Phe Gly Pro Phe Ala Pro
180 185 190
Glu Val Tyr Arg Val Pro Met Ala Tyr Pro Tyr Arg Trp Pro Ser Gly
195 200 205
Pro Glu Asn Ala Ala Asp Glu Ala Phe Ala Gln Phe Arg Leu Ala Ile
210 215 220
Asp Thr Gln Ile Gly Ala Glu Ser Val Ala Ala Val Val Val Glu Pro
225 230 235 240
Ile Gln Gly Glu Gly Gly Phe Ile Val Pro Ala Pro Gly Phe Leu Lys
245 250 255
Arg Ile Ser Glu Phe Cys Arg Glu Arg Gly Ile Leu Val Val Ala Asp
260 265 270
Glu Val Gln Thr Gly Ile Ala Arg Thr Gly Ser Trp Phe Ala Ser Glu
275 280 285
Ser Glu Asp Phe Val Pro Asp Ile Ile Thr Thr Ala Lys Gly Leu Ala
290 295 300
Gly Gly Met Pro Leu Ala Ala Val Thr Gly Arg Ala Asp Val Met Asp
305 310 315 320
Ala Ala His Pro Gly Gly Ile Gly Gly Thr Tyr Ser Gly Asn Pro Val
325 330 335
Ala Cys Glu Ala Ala Leu Ala Val Phe Glu Thr Ile Glu Met Glu Gly
340 345 350
Leu Leu Asp Arg Ala Lys Asp Ile Gly Asp Ile Leu Thr Thr Gly Leu
355 360 365
Ser Glu Ile Ala Ser Glu Thr Asp Ile Ile Gly Asp Ile Arg Gly Arg
370 375 380
Gly Ala Met Ile Ala Ile Glu Leu Val His Asp Glu Asp Lys Ala Pro
385 390 395 400
Asn Arg Glu Ala Val Ala Gln Ile Val Ser Tyr Ala His Thr His Gly
405 410 415
Leu Leu Leu Leu Thr Ala Gly Thr Tyr Gly Asn Val Val Arg Phe Leu
420 425 430
Pro Pro Leu Ser Ile Ser Asp Glu Leu Leu Thr Glu Gly Leu Gly Ile
435 440 445
Leu Arg Asp Ala Val Ala Ala Val Arg
450 455
<210> 28
<400> 28
000
<210> 29
<400> 29
000
<210> 30
<211> 469
<212> PRT
<213> Metagenomic
<400> 30
Met Arg Ser Ala Ser Ala Pro Pro Val Arg Ile Ser Gln Lys Gly Asn
1 5 10 15
His Pro Met Thr Thr Thr Ala Asn Glu Leu Ser Tyr Arg Ile Glu Gln
20 25 30
Lys Arg Asn Ile Asn Gly Ala Phe Pro Gly Pro Lys Ser Gln Ala Leu
35 40 45
Ala Glu Arg Arg Ser Ala Val Val Ala Ala Gly Val Ala Ser Gly Val
50 55 60
Pro Val Tyr Val Glu Asp Ala Asp Gly Gly Ile Ile Arg Asp Val Asp
65 70 75 80
Gly Asn Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val
85 90 95
Gly Ala Ser Asp Pro Ala Val Val Ala Ala Val Gln Glu Ala Ala Ala
100 105 110
His Phe Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val
115 120 125
Ala Val Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Ala Lys
130 135 140
Arg Thr Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val
145 150 155 160
Lys Val Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp
165 170 175
His Ala Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys
180 185 190
Ala Met Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr
195 200 205
Arg Met Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Glu Ile Thr
210 215 220
Gly Ala Glu Ala Ala Lys Arg Ala Ile Thr Met Ile Glu Lys Gln Ile
225 230 235 240
Gly Gly Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu
245 250 255
Gly Gly Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ser Glu
260 265 270
Trp Ala Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser
275 280 285
Gly Phe Cys Arg Thr Gly Glu Trp Phe Ala Val Asp His Glu Gly Val
290 295 300
Val Pro Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Leu Pro
305 310 315 320
Leu Ser Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro
325 330 335
Gly Gly Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala
340 345 350
Ala Leu Ala Ala Ile Asp Thr Met Glu Gln His Asp Leu Asn Gly Arg
355 360 365
Ala Arg His Ile Glu Glu Leu Ala Leu Gly Lys Leu Arg Glu Leu Ala
370 375 380
Gly Glu Val Ser Val Val Gly Asp Ile Arg Gly Arg Gly Ala Met Leu
385 390 395 400
Ala Ile Glu Leu Val Gln Ser Gly Ser Lys Glu Pro Asn Ala Glu Leu
405 410 415
Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val Ile Ile Leu
420 425 430
Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val
435 440 445
Ile Ser Asp Glu Leu Leu Ile Asp Gly Leu Glu Val Leu Ala Ala Ala
450 455 460
Ile Lys Ala His Ala
465
<210> 31
<211> 421
<212> PRT
<213> Metagenomic
<400> 31
Met Gln Asn Pro Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Met Arg Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ser Thr Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Arg His Pro Lys Ile Lys Ala Ala
50 55 60
Val Ala Glu Gln Leu Glu Ala Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Ser Tyr Val Ala Leu Ala Glu Arg Ile Asn Gly Leu Ala
85 90 95
Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala His Thr Gly Arg Ser
115 120 125
Gly Val Val Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ala Phe Gly Pro
145 150 155 160
Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Gly Thr Gln Asp
165 170 175
Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Ser
180 185 190
Asp Ile Asp Pro Arg Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu
210 215 220
Arg Lys Ile Cys Asp Glu Tyr Gly Ile Met Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Ala Arg Thr Gly Lys Leu Tyr Ala Met Gln His His
245 250 255
Asp Val Gln Ala Asp Leu Ile Thr Met Ala Lys Ser Leu Gly Gly Gly
260 265 270
Phe Pro Ile Ser Gly Val Val Gly Arg Ala Glu Val Met Asp Gly Pro
275 280 285
Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Glu Glu Glu Lys Leu Cys
305 310 315 320
Glu Arg Ala Ala Glu Leu Gly Gln Arg Leu Gln Glu Arg Leu Asn Gly
325 330 335
Leu Arg Pro Gln Cys Pro Ala Ile Ala Asp Val Arg Gly Leu Gly Ser
340 345 350
Met Val Ala Leu Glu Leu Arg Asp Pro Ala Thr Gly Gln Pro Asp Ala
355 360 365
Ala Ala Val Lys Arg Val Gln Asp Ala Ala Ile Glu Arg Gly Leu Ile
370 375 380
Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro
385 390 395 400
Leu Thr Ile Pro Asp Glu Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser
405 410 415
Asp Ile Leu Thr Ala
420
<210> 32
<400> 32
000
<210> 33
<400> 33
000
<210> 34
<400> 34
000
<210> 35
<400> 35
000
<210> 36
<211> 353
<212> PRT
<213> Metagenomic
<400> 36
Lys Leu Thr His Thr Cys Phe Gln Val Leu Ala Tyr Glu Pro Tyr Val
1 5 10 15
Glu Leu Cys Glu Lys Ile Asn Ala Lys Val Pro Gly Asp Phe Ala Lys
20 25 30
Lys Thr Leu Leu Val Thr Thr Gly Ser Glu Ala Val Glu Asn Ala Val
35 40 45
Lys Ile Ala Arg Ala Ala Thr Gly Arg Ala Gly Val Ile Ala Phe Thr
50 55 60
Gly Ala Tyr His Gly Arg Thr Met Met Thr Leu Gly Leu Thr Gly Lys
65 70 75 80
Val Val Pro Tyr Ser Ala Gly Met Gly Leu Met Pro Gly Gly Val Phe
85 90 95
Arg Ala Leu Tyr Pro Asn Glu Leu His Gly Val Ser Val Asp Asp Ser
100 105 110
Ile Ala Ser Ile Glu Arg Ile Phe Lys Asn Asp Ala Glu Pro Arg Asp
115 120 125
Ile Ala Ala Ile Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe Tyr
130 135 140
Val Ala Pro Lys Glu Phe Met Lys Arg Leu Arg Ala Leu Cys Asp Gln
145 150 155 160
His Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Ala Gly Arg
165 170 175
Thr Gly Thr Phe Phe Ala Met Glu Gln Met Gly Val Ser Ala Asp Leu
180 185 190
Thr Thr Phe Ala Lys Ser Ile Ala Gly Gly Phe Pro Leu Ala Gly Val
195 200 205
Cys Gly Lys Ala Glu Tyr Met Asp Ala Ile Ala Pro Gly Gly Leu Gly
210 215 220
Gly Thr Tyr Ala Gly Ser Pro Ile Ala Cys Ala Ala Ala Leu Ala Val
225 230 235 240
Met Glu Val Phe Glu Glu Glu His Leu Leu Asp Arg Cys Lys Ala Val
245 250 255
Gly Glu Arg Leu Val Thr Gly Leu Lys Ala Ile Gln Ser Lys Tyr Pro
260 265 270
Val Ile Gly Glu Val Arg Ala Leu Gly Ala Met Ile Ala Val Glu Leu
275 280 285
Phe Val Asp Gly Asp Ser His Lys Pro Asn Ala Ala Ala Val Ala Ser
290 295 300
Val Val Ala Lys Ala Arg Asp Lys Gly Leu Ile Leu Leu Ser Cys Gly
305 310 315 320
Thr Tyr Gly Asn Val Leu Arg Val Leu Val Pro Leu Thr Ser Pro Asp
325 330 335
Glu Gln Leu Asp Lys Gly Leu Ala Ile Ile Glu Glu Cys Phe Ser Glu
340 345 350
Leu
<210> 37
<400> 37
000
<210> 38
<211> 456
<212> PRT
<213> Metagenomic
<400> 38
Met Thr Thr Thr Ala Ala Asp Ile Thr Tyr Arg Leu Glu Gln Lys Arg
1 5 10 15
Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Val Ala Leu Thr Glu
20 25 30
Arg Arg Lys Ser Val Val Ala Ala Gly Val Ala Ser Ser Val Pro Val
35 40 45
Tyr Val Ala Asp Ala Asp Gly Gly Ile Ile Gln Asp Val Asp Gly Asn
50 55 60
Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala
65 70 75 80
Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His Phe
85 90 95
Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala Val
100 105 110
Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg Thr
115 120 125
Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys Val
130 135 140
Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His Ala
145 150 155 160
Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala Met
165 170 175
Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg Met
180 185 190
Pro Met Ser Tyr Pro Tyr Arg Glu Glu Asn Pro Ser Ile Thr Gly Ala
195 200 205
Glu Ala Ala Lys Arg Ala Ile Thr Ala Ile Glu Lys Gln Ile Gly Gly
210 215 220
Asp Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly Gly
225 230 235 240
Phe Ile Val Pro Ala Glu Gly Phe Leu Pro Ala Leu Ala Ala Trp Ala
245 250 255
Lys Asp Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly Phe
260 265 270
Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Val Val Pro
275 280 285
Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser
290 295 300
Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly Gly
305 310 315 320
Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu
325 330 335
Ala Ser Ile Gly Ser Met Glu Glu Tyr Gly Leu Asn Ala Arg Ala Lys
340 345 350
His Ile Glu Glu Leu Ala Thr Thr Arg Leu Ser Ala Leu Gln Glu Glu
355 360 365
Leu Ala Gly Ala Gly Ser Ala Val Ile Gly Asp Ile Arg Gly Arg Gly
370 375 380
Ala Met Leu Ala Ile Glu Leu Val Gln Ala Gly Ser Lys Glu Pro Asn
385 390 395 400
Pro Glu Leu Thr Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val
405 410 415
Ile Ile Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro
420 425 430
Pro Leu Val Ile Thr Asp Glu Leu Leu Asn Asp Gly Leu Asp Val Leu
435 440 445
Ala Ala Ala Ile Lys Ala Asn Ala
450 455
<210> 39
<400> 39
000
<210> 40
<400> 40
000
<210> 41
<400> 41
000
<210> 42
<400> 42
000
<210> 43
<400> 43
000
<210> 44
<400> 44
000
<210> 45
<400> 45
000
<210> 46
<400> 46
000
<210> 47
<400> 47
000
<210> 48
<400> 48
000
<210> 49
<400> 49
000
<210> 50
<211> 420
<212> PRT
<213> Metagenomic
<400> 50
Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ala Glu Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Lys Ala Ala
50 55 60
Val Ala Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Gly Tyr Ile Ser Leu Ala Glu Arg Ile Asn Arg Leu Ala
85 90 95
Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ser Thr Gly Arg Ser
115 120 125
Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro
145 150 155 160
Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser
165 170 175
Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Val
180 185 190
Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu
210 215 220
Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His
245 250 255
Gly Val Gln Ala Asp Ile Ile Thr Met Ala Lys Ser Leu Gly Gly Gly
260 265 270
Phe Pro Ile Ser Gly Ile Val Gly Arg Ala Asp Val Met Asp Gly Pro
275 280 285
Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys
305 310 315 320
Glu Arg Ala Ala Gln Leu Gly Glu Lys Leu Arg Ala His Leu Glu Gly
325 330 335
Leu Arg Ala Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser
340 345 350
Met Val Ala Leu Glu Leu Asn Asp Ala Ala Gly Lys Pro Asp Ala Glu
355 360 365
Ala Val Lys Arg Val Gln Gln Arg Ala Leu Asp Ala Gly Leu Ile Leu
370 375 380
Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu
385 390 395 400
Thr Ile Pro Asp Ala Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser Glu
405 410 415
Ala Leu Ala Ala
420
<210> 51
<400> 51
000
<210> 52
<211> 429
<212> PRT
<213> Metagenomic
<400> 52
Met Leu Thr Gln Val Thr Thr Asn Ala Ser Leu Gln Ala Arg Lys Asn
1 5 10 15
Ala Ala Cys Ala Gln Gly Ile Gly Thr Leu Thr Pro His Phe Thr Ala
20 25 30
Arg Ala Asp Asn Ala Glu Leu Trp Asp Val Glu Gly Arg Arg Phe Val
35 40 45
Asp Phe Ala Ser Gly Ile Ala Thr Leu Ala Thr Gly His Arg His Pro
50 55 60
Arg Ile Val Ala Ala Val Arg Ala Gln Leu Asp Asp Phe His His Thr
65 70 75 80
Cys Phe His Val Thr Pro Tyr Glu Glu Tyr Val Ala Leu Cys Glu Gln
85 90 95
Leu Asn Arg Val Val Pro Gly Pro Ser Ala Lys Lys Ser Ala Leu Phe
100 105 110
Thr Thr Gly Ala Glu Ala Ile Glu Asn Ala Met Lys Val Ala Arg Ala
115 120 125
Ala Thr Gly Arg Ser Gly Val Val Ala Phe Ser Gly Ala Phe His Gly
130 135 140
Arg Thr Phe Met Gly Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys
145 150 155 160
Ala Gly Phe Gly Pro Met Pro Gly Asp Val Trp His Val Pro Phe Pro
165 170 175
Ala Ala Pro Leu Gly Val Thr Val Asp Asp Ser Ile Ala Ala Leu Asp
180 185 190
Arg Leu Phe Lys Thr Asp Val Asp Pro Gln Arg Val Ala Ala Ile Val
195 200 205
Ile Glu Leu Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Pro Ala
210 215 220
Leu Met Glu Tyr Leu Arg Ala Glu Cys Asp Arg His Gly Ile Leu Leu
225 230 235 240
Val Val Asp Glu Ile Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe
245 250 255
Ala Leu Glu His Tyr Gly Ile Glu Ala Asp Leu Val Thr Thr Ala Lys
260 265 270
Ser Leu Ala Gly Gly Phe Pro Leu Ser Ala Leu Thr Gly Arg Ala Glu
275 280 285
Leu Met Asp Ala Thr Arg Val Gly Ser Leu Gly Gly Thr Tyr Ala Gly
290 295 300
Asn Pro Leu Ala Val Ala Ala Ala Leu Glu Thr Met Arg Val Ile Glu
305 310 315 320
Asp Glu Gly Leu Val Ala Arg Ala Arg Met Leu Gly Glu Arg Leu Thr
325 330 335
Ala Cys Leu Ala Ala Leu Arg Thr Glu Val Pro Arg Ile Cys Asp Val
340 345 350
Arg Gly Leu Gly Ala Met Val Ala Val Glu Phe Arg Asp Pro His Ser
355 360 365
Gly Glu Pro Asp Ala Glu Phe Thr Lys Arg Val His Ala Ala Gly Leu
370 375 380
Glu Arg Gly Leu Leu Leu Leu Thr Cys Gly Val His Gly Asn Val Val
385 390 395 400
Arg Phe Leu Phe Pro Leu Thr Ile Pro Glu Ala Val Tyr Glu Glu Gly
405 410 415
Leu Gly Leu Leu Ala Glu Ser Ile Arg Ala Ala Asn Val
420 425
<210> 53
<400> 53
000
<210> 54
<400> 54
000
<210> 55
<400> 55
000
<210> 56
<211> 425
<212> PRT
<213> Metagenomic
<400> 56
Met Ser Lys Thr Asn Ala Ser Leu Met Lys Arg Arg Glu Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Lys
20 25 30
Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Ile
50 55 60
Ala Ala Val Thr Ala Gln Leu Asn Lys Leu Thr His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Val Glu Leu Cys Glu Lys Ile Asn Ala
85 90 95
Lys Val Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly
100 105 110
Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Tyr Pro Asn Glu Leu
165 170 175
His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Glu Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys
210 215 220
Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu
245 250 255
Gln Met Gly Val Ala Ala Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala
260 265 270
Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu His
305 310 315 320
Leu Leu Asp Arg Cys Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu
325 330 335
Lys Ala Ile Gln Ala Lys Tyr Pro Val Ile Gly Glu Val Arg Ala Leu
340 345 350
Gly Ala Met Ile Ala Val Glu Leu Phe Val Asp Gly Asp Ser His Lys
355 360 365
Pro Asn Ala Pro Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Val
385 390 395 400
Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala
405 410 415
Ile Ile Glu Glu Cys Phe Ala Glu Leu
420 425
<210> 57
<400> 57
000
<210> 58
<400> 58
000
<210> 59
<400> 59
000
<210> 60
<400> 60
000
<210> 61
<400> 61
000
<210> 62
<400> 62
000
<210> 63
<400> 63
000
<210> 64
<211> 455
<212> PRT
<213> Arthrobacter sp. Edens01
<400> 64
Met Thr Phe Thr Ala Ser Glu Ala Thr Leu Pro Gln Thr Arg His Leu
1 5 10 15
Ala Thr Ala Val Pro Gly Pro Arg Ser Arg Glu Leu His Ala Glu Arg
20 25 30
Arg Gln Gln Val Ser Ser Gly Phe Gly Thr Val Leu Pro Val Phe Ile
35 40 45
Glu Arg Ala Glu Gly Gly Ile Leu Gln Asp Val Asp Gly Asn Arg Phe
50 55 60
Ile Asp Phe Ala Ser Gly Ile Ala Val Thr Ser Val Gly Ala Ser Asn
65 70 75 80
Ala Arg Val Arg Glu Arg Val Ala Ala Gln Leu Glu Arg Phe Thr His
85 90 95
Thr Cys Phe Met Val Thr Glu Tyr Glu Ser Phe Thr Gln Val Cys Arg
100 105 110
Trp Leu Asn Glu His Thr Pro Gly Thr Phe Glu Lys Arg Thr Ala Leu
115 120 125
Phe Ser Thr Gly Ala Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg
130 135 140
Ala Ala Thr Gly Arg Pro Asn Val Leu Val Phe Asp Glu Ala Tyr His
145 150 155 160
Gly Arg Ser Leu Leu Thr Met Ala Met Thr Ala Lys Glu Asn Pro Tyr
165 170 175
Arg Leu Asn Phe Gly Pro Leu Pro Gly Glu Val Leu Arg Ala Pro Ser
180 185 190
Ala Asn Pro Leu Arg Pro Ser Arg Ala Ser Val Pro Gly Ala Asp Pro
195 200 205
Ala Ala Ala Ala Leu Ala Gly Val Glu Glu Leu Leu Ser Glu His Gly
210 215 220
Ala Gly Ser Phe Ala Ala Met Val Ile Glu Pro Ile Gln Gly Glu Gly
225 230 235 240
Gly Phe Val Val Pro Ala Pro Gly Phe Leu Gln Gly Leu Arg Ser Leu
245 250 255
Ala Asp Gln His Gly Ile Val Leu Val Ile Asp Glu Ile Gln Ala Gly
260 265 270
Met Gly Arg Thr Gly Thr Leu Tyr Ala Ser Glu His Glu Gly Val Ala
275 280 285
Gly Asp Ile Thr Leu Ser Ala Lys Ala Leu Ala Gly Gly Leu Pro Leu
290 295 300
Ser Ala Val Thr Gly Arg Ala Asp Leu Met Asp Ala Val His Thr Gly
305 310 315 320
Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Cys Glu Ala Ala
325 330 335
Leu Ala Val Phe Glu Glu Phe Glu Asp Gly Thr Leu Leu Ala Asn Ala
340 345 350
Arg Ala Ile Glu Glu Thr Val Arg Glu Val Leu Glu Pro Leu Val Ala
355 360 365
Gln Val Pro Ala Val Ala Glu Phe Arg Gly Arg Gly Ala Met Leu Ala
370 375 380
Leu Glu Phe Ala Asp Pro Glu Thr Leu Glu Pro Arg Ala Asp Leu Ala
385 390 395 400
Gln Ala Ala Ser Ala Ala Cys His Ala Gln Gly Val Leu Thr Leu Thr
405 410 415
Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val Ile
420 425 430
Pro Arg Asp Leu Leu Leu Asp Gly Leu His Val Leu Arg Ser Ala Ile
435 440 445
Leu Glu Ala Ala Ala Asn Ser
450 455
<210> 65
<400> 65
000
<210> 66
<400> 66
000
<210> 67
<400> 67
000
<210> 68
<400> 68
000
<210> 69
<400> 69
000
<210> 70
<400> 70
000
<210> 71
<400> 71
000
<210> 72
<400> 72
000
<210> 73
<400> 73
000
<210> 74
<211> 421
<212> PRT
<213> Metagenomic
<400> 74
Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ala Asp Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Ile Lys Ala Ala
50 55 60
Val Ser Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Gly Tyr Val Ser Leu Ala Glu Arg Ile Asn Arg Leu Ala
85 90 95
Pro Ile Asp Gly Leu Lys Lys Ser Ala Phe Phe Thr Thr Gly Val Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ser Thr Gly Arg Ser
115 120 125
Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro
145 150 155 160
Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser
165 170 175
Ile Thr Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Cys
180 185 190
Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu
210 215 220
Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His
245 250 255
Ser Val Gln Ala Asp Leu Ile Thr Met Ala Lys Ser Leu Gly Gly Gly
260 265 270
Phe Pro Ile Ser Gly Val Val Gly Arg Ala Glu Ile Met Asp Gly Pro
275 280 285
Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys
305 310 315 320
Glu Arg Ala Val Ala Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly
325 330 335
Leu Arg Ala Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser
340 345 350
Met Val Ala Leu Glu Leu Asn Asp Pro Ala Thr Gly Lys Pro Asp Ala
355 360 365
Glu Ala Val Lys Arg Val Gln Ala Arg Ala Ile Glu Lys Gly Leu Ile
370 375 380
Leu Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro
385 390 395 400
Leu Thr Ile Pro Asp Ala Gln Phe Asp Arg Ala Leu Ala Ile Leu Ser
405 410 415
Glu Val Leu Ala Ala
420
<210> 75
<400> 75
000
<210> 76
<400> 76
000
<210> 77
<211> 420
<212> PRT
<213> Metagenomic
<400> 77
Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ala Glu Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Lys Ala Ala
50 55 60
Val Thr Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Gly Tyr Ile Ser Leu Ala Glu Arg Ile Asn Arg Val Ala
85 90 95
Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ala Thr Gly Arg Ser
115 120 125
Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro
145 150 155 160
Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser
165 170 175
Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Val
180 185 190
Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu
210 215 220
Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ala Met Glu His His
245 250 255
Thr Val Gln Ala Asp Ile Ile Thr Met Ala Lys Ser Leu Gly Gly Gly
260 265 270
Phe Pro Ile Ser Gly Ile Val Gly Arg Ala Glu Ile Met Asp Gly Pro
275 280 285
Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys
305 310 315 320
Glu Arg Ala Thr Gln Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly
325 330 335
Leu Arg Gly Lys Val Pro Gly Ile Ala Asp Val Arg Gly Leu Gly Ser
340 345 350
Met Val Ala Leu Glu Leu Asn Asp Ala Ala Gly Lys Pro Asp Ala Glu
355 360 365
Ala Val Lys Arg Val Gln Lys Arg Ala Leu Asp Ala Gly Leu Ile Leu
370 375 380
Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu
385 390 395 400
Thr Ile Pro Asp Ala Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser Glu
405 410 415
Ala Leu Ala Ala
420
<210> 78
<400> 78
000
<210> 79
<400> 79
000
<210> 80
<211> 422
<212> PRT
<213> Metagenomic
<400> 80
Met Met Gln Arg Arg Val Ala Ala Val Pro Arg Gly Val Gly Gln Ile
1 5 10 15
His Pro Ile Phe Ala Asp His Ala Lys Asn Ser Ser Val Val Asp Val
20 25 30
Glu Gly Arg Glu Phe Ile Asp Phe Ala Gly Gly Ile Ala Val Leu Asn
35 40 45
Thr Gly His Leu His Pro Lys Ile Val Lys Ala Val Glu Glu Gln Leu
50 55 60
His Lys Leu Thr His Thr Cys Phe Gln Val Leu Ala Tyr Glu Pro Tyr
65 70 75 80
Ile Ala Leu Cys Glu Ala Ile Ala Lys Arg Val Pro Gly Asp Phe Ala
85 90 95
Lys Lys Thr Leu Leu Val Thr Ser Gly Ser Glu Ala Val Glu Asn Ala
100 105 110
Val Lys Ile Ala Arg Ala Ala Thr Gly Arg Ala Gly Val Ile Ala Phe
115 120 125
Thr Gly Ala Tyr His Gly Arg Thr Met Met Thr Leu Ser Leu Thr Gly
130 135 140
Lys Val Val Pro Tyr Ser Ala Gly Met Gly Leu Met Pro Gly Gly Val
145 150 155 160
Phe Arg Ala Leu Ala Pro Cys Pro Leu His Gly Ile Ser Glu Asp Asp
165 170 175
Ala Ile Ala Ser Ile Glu Arg Val Phe Lys Asn Asp Ala Gln Pro Arg
180 185 190
Asp Ile Ala Ala Ile Ile Ile Glu Pro Val Gln Gly Glu Gly Gly Phe
195 200 205
Tyr Val Asn Ser Pro Ala Phe Met Gln Arg Leu Arg Ala Leu Cys Asp
210 215 220
Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Ala Gly
225 230 235 240
Arg Thr Gly Thr Phe Phe Ala Cys Glu Gln Leu Gly Ile Val Pro Asp
245 250 255
Leu Thr Thr Phe Ala Lys Ser Val Gly Gly Gly Phe Pro Ile Ser Gly
260 265 270
Val Cys Gly Lys Ala Glu Ile Met Asp Val Ile Ala Pro Gly Gly Leu
275 280 285
Gly Gly Thr Tyr Ala Gly Ser Pro Ile Ala Cys Ala Ala Ala Leu Ala
290 295 300
Val Met Glu Val Phe Glu Glu Glu Lys Leu Leu Glu Arg Ser Gln Ala
305 310 315 320
Val Gly Glu Lys Leu Lys Ala Gly Leu Asn Ala Ile Ala Ala Arg His
325 330 335
Lys Val Ile Gly Asp Val Arg Gly Leu Gly Ser Met Val Ala Ile Glu
340 345 350
Leu Phe Glu Gly Gly Asp His Ser Lys Pro Ala Ala Glu Leu Val Gly
355 360 365
Arg Ile Val Ala Arg Ala Arg Asp Lys Gly Leu Leu Leu Leu Ser Cys
370 375 380
Gly Thr Tyr Tyr Asn Val Ile Arg Phe Leu Met Pro Leu Thr Ile Pro
385 390 395 400
Asp Ala Gln Leu Glu Arg Gly Leu Ala Ile Val Ala Glu Cys Phe Asp
405 410 415
Glu Leu Ala Ser Glu Gln
420
<210> 81
<400> 81
000
<210> 82
<400> 82
000
<210> 83
<400> 83
000
<210> 84
<400> 84
000
<210> 85
<400> 85
000
<210> 86
<400> 86
000
<210> 87
<400> 87
000
<210> 88
<211> 422
<212> PRT
<213> Metagenomic
<400> 88
Met Thr Thr Met Thr Asp Arg Lys Asn Ala Ala Ile Ser Arg Gly Val
1 5 10 15
Gly Met Thr Thr Gln Ile Tyr Ala Glu Arg Ala Glu Asn Ala Glu Ile
20 25 30
Trp Asp Arg Glu Gly Arg Arg Tyr Ile Asp Phe Ala Ala Gly Ile Ala
35 40 45
Val Val Asn Thr Gly His Arg His Pro Lys Val Val Gln Ala Val Lys
50 55 60
Asp Gln Leu Asp Arg Phe Thr His Thr Cys His Gln Val Val Pro Tyr
65 70 75 80
Glu Asn Tyr Val Ala Leu Ala Glu Arg Leu Asn Asp Leu Val Pro Gly
85 90 95
Asp Phe Glu Lys Lys Thr Ile Phe Ala Thr Thr Gly Ala Glu Ala Val
100 105 110
Glu Asn Ala Val Lys Ile Ala Arg Phe Ala Thr Gly Arg Ser Ala Ile
115 120 125
Ile Ala Phe Thr Gly Ala Phe His Gly Arg Thr Phe Met Gly Met Thr
130 135 140
Leu Thr Gly Lys Val Gln Pro Tyr Lys Ala Gly Phe Gly Ala Met Met
145 150 155 160
Pro Asp Val Phe His Leu Pro Phe Pro Asn Glu Leu His Gly Val Ser
165 170 175
Gln Asp Asp Ala Leu Ala Ala Leu Asp Lys Leu Phe Lys Ala Asp Val
180 185 190
Asp Pro Ala Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln Gly Glu
195 200 205
Gly Gly Phe Tyr Pro Val Pro Ser Gly Phe Met Gln Lys Leu Arg Ala
210 215 220
Ile Cys Asp Asp Asn Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr
225 230 235 240
Gly Phe Ala Arg Thr Gly Arg Leu Phe Ala Met Glu His His Gly Val
245 250 255
Ser Ala Asp Ile Thr Thr Met Ala Lys Gly Leu Gly Gly Gly Leu Pro
260 265 270
Ile Ser Ala Val Thr Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro
275 280 285
Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Val Ala Ala
290 295 300
Ala His Ala Val Leu Asp Ile Ile Glu Glu Glu Gly Leu Cys Asp Arg
305 310 315 320
Ala Glu Arg Leu Gly Gln Arg Leu Lys Gln Arg Leu Ala Ser Leu Arg
325 330 335
Asp Asp Val Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Leu Met Asn
340 345 350
Ala Val Glu Phe Asn Val Ala Gly Ser Asp Arg Pro Asn Pro Glu Met
355 360 365
Thr Asn Arg Val Arg Glu Gln Ala Leu Lys Arg Gly Leu Ile Leu Leu
370 375 380
Thr Cys Gly Val His Gly Asn Val Ile Arg Phe Leu Pro Pro Leu Thr
385 390 395 400
Val Pro Asp Ala Val Phe Asp Glu Ala Leu Gly Ile Leu Glu Asp Ser
405 410 415
Ile Arg Ala Ala Arg Gly
420
<210> 89
<400> 89
000
<210> 90
<400> 90
000
<210> 91
<400> 91
000
<210> 92
<400> 92
000
<210> 93
<400> 93
000
<210> 94
<400> 94
000
<210> 95
<400> 95
000
<210> 96
<400> 96
000
<210> 97
<400> 97
000
<210> 98
<400> 98
000
<210> 99
<400> 99
000
<210> 100
<400> 100
000
<210> 101
<400> 101
000
<210> 102
<400> 102
000
<210> 103
<211> 422
<212> PRT
<213> Metagenomic
<400> 103
Met Thr Thr Met Thr Asp Arg Lys Asn Ala Ala Ile Ser Arg Gly Val
1 5 10 15
Gly Met Thr Thr Gln Ile Tyr Ala Glu Arg Ala Glu Asn Ala Glu Ile
20 25 30
Trp Asp Arg Glu Gly Arg Arg Tyr Ile Asp Phe Ala Ala Gly Ile Ala
35 40 45
Val Val Asn Thr Gly His Arg His Pro Lys Val Val Gln Ala Val Lys
50 55 60
Asp Gln Leu Asp Arg Phe Thr His Thr Cys His Gln Val Val Pro Tyr
65 70 75 80
Glu Asn Tyr Val Ser Leu Ala Glu Arg Leu Asn Glu Leu Val Pro Gly
85 90 95
Asp Phe Glu Lys Lys Thr Ile Phe Ala Thr Thr Gly Ala Glu Ala Val
100 105 110
Glu Asn Ala Val Lys Ile Ala Arg Phe Ala Thr Gly Arg Ser Ala Ile
115 120 125
Ile Ala Phe Thr Gly Ala Phe His Gly Arg Thr Phe Met Gly Met Thr
130 135 140
Leu Thr Gly Lys Val Gln Pro Tyr Lys Ala Gly Phe Gly Ala Met Met
145 150 155 160
Pro Asp Val Phe His Leu Pro Phe Pro Asn Glu Leu His Gly Val Ser
165 170 175
Gln Asp Asp Ala Leu Ala Ala Leu Asp Lys Leu Phe Lys Ala Asp Val
180 185 190
Asp Pro Ala Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln Gly Glu
195 200 205
Gly Gly Phe Tyr Pro Val Pro Ser Gly Phe Met Gln Lys Leu Arg Ala
210 215 220
Leu Cys Asp Asp Asn Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr
225 230 235 240
Gly Phe Ala Arg Thr Gly Arg Leu Phe Ala Met Glu Leu His Gly Val
245 250 255
Ala Ala Asp Ile Thr Thr Met Ala Lys Gly Leu Gly Gly Gly Leu Pro
260 265 270
Ile Ser Ala Val Thr Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro
275 280 285
Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Val Ala Ala
290 295 300
Ala His Ala Val Leu Asp Ile Ile Glu Glu Glu Gly Leu Cys Asp Arg
305 310 315 320
Ala Glu Arg Leu Gly Gln Arg Leu Lys Gln Arg Leu Ala Ser Leu Arg
325 330 335
Asp Asp Val Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Leu Met Asn
340 345 350
Ala Val Glu Phe Asn Val Ala Gly Ser Asp Arg Pro Asn Pro Glu Met
355 360 365
Thr Asn Arg Val Arg Glu Glu Ala Leu Glu Arg Gly Leu Ile Leu Leu
370 375 380
Thr Cys Gly Val Tyr Gly Asn Val Ile Arg Phe Leu Pro Pro Leu Thr
385 390 395 400
Val Pro Asp Ala Val Phe Asp Glu Ala Leu Gly Ile Leu Glu Asp Ser
405 410 415
Ile Arg Ala Ala Arg Gly
420
<210> 104
<400> 104
000
<210> 105
<211> 420
<212> PRT
<213> Metagenomic
<400> 105
Met Lys Asn Gln Asp Leu Asn Thr Arg Arg Ser Leu Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Val Arg Ala Glu Asn Ala
20 25 30
Thr Leu Trp Asp Ala Glu Gly Lys Glu Tyr Ile Asp Phe Ala Gly Gly
35 40 45
Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Lys Ala Ala
50 55 60
Val Thr Ala Gln Leu Asp Asn Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Glu Gly Tyr Ile Ser Leu Ala Glu Arg Ile Asn Arg Val Ala
85 90 95
Pro Ile Asp Gly Leu Lys Lys Thr Ala Phe Phe Thr Thr Gly Val Glu
100 105 110
Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ser Ala Thr Gly Arg Ser
115 120 125
Gly Val Ile Ala Phe Ser Gly Ser Phe His Gly Arg Thr Met Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Ser Phe Gly Pro
145 150 155 160
Met Pro Gly Asp Ile Tyr His Val Pro Phe Pro Asn Ala Thr Gln Ser
165 170 175
Ile Ser Val Ala Asp Ser Leu Lys Ala Leu Asp Leu Leu Phe Lys Val
180 185 190
Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Ile Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Asn Ile Thr Pro Pro Glu Leu Met Thr Ala Leu
210 215 220
Arg Lys Val Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Gly Arg Thr Gly Lys Leu Phe Ser Met Glu His His
245 250 255
Ser Val Gln Ala Asp Ile Ile Thr Met Ala Lys Ser Leu Gly Gly Gly
260 265 270
Phe Pro Ile Ser Gly Val Val Gly Arg Ala Glu Ile Met Asp Gly Pro
275 280 285
Ala Ala Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Ala Glu Glu Lys Leu Cys
305 310 315 320
Glu Arg Ala Ala Glu Leu Gly Asp Lys Leu Arg Ala His Leu Glu Gly
325 330 335
Leu Arg Gly Lys Val Ala Gly Ile Ala Asp Val Arg Gly Leu Gly Ser
340 345 350
Met Val Ala Leu Glu Leu Asn Asp Ala Ala Gly Lys Pro Asp Ala Glu
355 360 365
Ala Val Lys Arg Val Gln Lys Arg Ala Leu Asp Ala Gly Leu Ile Leu
370 375 380
Leu Ser Cys Gly Val Tyr Gly Asn Val Leu Arg Phe Leu Tyr Pro Leu
385 390 395 400
Thr Ile Pro Asp Ala Gln Phe Ala Arg Ala Leu Asp Ile Leu Ser Glu
405 410 415
Ala Leu Ala Ala
420
<210> 106
<400> 106
000
<210> 107
<400> 107
000
<210> 108
<400> 108
000
<210> 109
<211> 419
<212> PRT
<213> Metagenomic
<400> 109
Met Thr Asp Arg Lys Asn Ala Ala Ile Ser Arg Gly Val Gly Met Thr
1 5 10 15
Thr Gln Ile Tyr Ala Glu Arg Ala Glu Asn Ala Glu Ile Trp Asp Arg
20 25 30
Glu Gly Arg Arg Tyr Ile Asp Phe Ala Ala Gly Ile Ala Val Val Asn
35 40 45
Thr Gly His Arg His Pro Lys Val Val Gln Ala Val Lys Asp Gln Leu
50 55 60
Asp Arg Phe Thr His Thr Cys His Gln Val Val Pro Tyr Glu Asn Tyr
65 70 75 80
Val Ala Leu Ala Glu Arg Leu Asn Asp Leu Val Pro Gly Asp Phe Glu
85 90 95
Lys Lys Thr Ile Phe Ala Thr Thr Gly Ala Glu Ala Val Glu Asn Ala
100 105 110
Val Lys Ile Ala Arg Phe Ala Thr Gly Arg Ser Ala Ile Ile Ala Phe
115 120 125
Thr Gly Ala Phe His Gly Arg Thr Phe Met Gly Met Thr Leu Thr Gly
130 135 140
Lys Val Gln Pro Tyr Lys Ala Gly Phe Gly Ala Met Met Pro Asp Val
145 150 155 160
Phe His Leu Pro Phe Pro Asn Glu Leu His Gly Val Ser Gln Asp Asp
165 170 175
Ala Leu Ala Ala Leu Asp Lys Leu Phe Lys Ala Asp Val Asp Pro Ala
180 185 190
Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln Gly Glu Gly Gly Phe
195 200 205
Tyr Pro Val Pro Ser Gly Phe Met Gln Lys Leu Arg Ala Leu Cys Asp
210 215 220
Asp Asn Gly Ile Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Ala
225 230 235 240
Arg Thr Gly Arg Leu Phe Ala Met Glu Leu His Gly Val Ser Ala Asp
245 250 255
Ile Thr Thr Met Ala Lys Gly Leu Gly Gly Gly Leu Pro Ile Ser Ala
260 265 270
Val Thr Gly Arg Ala Glu Ile Met Asp Ala Pro Asn Pro Gly Gly Leu
275 280 285
Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Val Ala Ala Ala His Ala
290 295 300
Val Leu Asp Ile Ile Glu Glu Glu Gly Leu Cys Asp Arg Ala Glu Arg
305 310 315 320
Leu Gly Gln Arg Leu Lys Gln Arg Leu Ala Ser Leu Arg Asp Asp Val
325 330 335
Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Leu Met Asn Ala Val Glu
340 345 350
Phe Asn Val Ala Gly Ser Asp Arg Pro Asn Pro Glu Met Thr Asn Arg
355 360 365
Val Arg Glu Glu Ala Leu Lys Arg Gly Leu Ile Leu Leu Thr Cys Gly
370 375 380
Val Tyr Gly Asn Val Val Arg Phe Leu Pro Pro Leu Thr Val Pro Asp
385 390 395 400
Ala Val Phe Asp Glu Ala Leu Gly Ile Leu Glu Asp Ser Ile Arg Ala
405 410 415
Ala Arg Gly
<210> 110
<400> 110
000
<210> 111
<400> 111
000
<210> 112
<400> 112
000
<210> 113
<211> 424
<212> PRT
<213> Metagenomic
<400> 113
Met Lys Asn Asp Ala Ile Ser Asp Arg Lys Asn Ala Ala Ile Ser Arg
1 5 10 15
Gly Val Gly Met Thr Thr Gln Ile Tyr Ala Asp Arg Ala Glu Asn Ser
20 25 30
Glu Ile Trp Asp Val Glu Gly Arg Arg Tyr Ile Asp Phe Ser Ser Gly
35 40 45
Ile Ala Val Val Asn Thr Gly His Arg His Pro Lys Val Ile Ala Ala
50 55 60
Val Lys Glu Gln Leu Asp Arg Phe Thr His Thr Cys His Gln Val Val
65 70 75 80
Pro Tyr Glu Asn Tyr Val His Leu Ala Glu Arg Leu Asn Ser Met Leu
85 90 95
Pro Gly Lys Phe Glu Lys Lys Thr Val Phe Val Thr Thr Gly Ala Glu
100 105 110
Ala Val Glu Asn Ala Ile Lys Ile Ala Arg Ala Ala Thr Gly Arg Gln
115 120 125
Ala Ile Val Ser Phe Ser Gly Ala Phe His Gly Arg Thr Leu Leu Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Val Pro Tyr Lys Val Gly Phe Gly Ala
145 150 155 160
Met Pro Gly Asp Val Phe His Val Pro Phe Pro Val Pro Leu His Gly
165 170 175
Val Ser Val Ala Asp Ser Leu Ala Ala Leu Asp Arg Leu Phe Lys Ala
180 185 190
Asp Val Asp Pro Asn Arg Val Ala Ala Ile Ile Val Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Tyr Glu Ala Pro Arg Glu Leu Thr Thr Ala Leu
210 215 220
Arg Arg Ile Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Ala Arg Thr Gly Lys Met Phe Ala Met Glu His His
245 250 255
Asp Ala Ala Pro Asp Leu Thr Thr Met Ala Lys Ser Leu Ala Gly Gly
260 265 270
Phe Pro Leu Ser Ala Val Thr Gly Arg Ala Glu Leu Met Asp Ala Pro
275 280 285
Gly Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Gly Ile
290 295 300
Ala Ala Ala His Ala Val Leu Asp Val Ile Glu Glu Glu Lys Leu Cys
305 310 315 320
Asp Arg Ala Asn Thr Leu Gly Asn Arg Leu Lys Gln Arg Leu Glu Ser
325 330 335
Leu Arg Asp Asp Val Pro Glu Ile Val Asp Ile Arg Gly Pro Gly Phe
340 345 350
Met Asn Ala Ile Glu Phe Asn Asp Val Ala Lys Gly Leu Pro Ser Ala
355 360 365
Glu Ile Ala Asn Ala Ile Arg Leu Lys Ala Leu Asp Lys Gly Leu Ile
370 375 380
Leu Leu Thr Cys Gly Val Tyr Gly Asn Val Ile Arg Phe Leu Ala Pro
385 390 395 400
Ile Thr Ile Gln Asp Asn Val Met Asn Glu Ala Leu Asp Ile Leu Glu
405 410 415
Ser Ser Ile Arg Glu Ala Gln Ala
420
<210> 114
<400> 114
000
<210> 115
<400> 115
000
<210> 116
<400> 116
000
<210> 117
<400> 117
000
<210> 118
<400> 118
000
<210> 119
<400> 119
000
<210> 120
<400> 120
000
<210> 121
<400> 121
000
<210> 122
<400> 122
000
<210> 123
<400> 123
000
<210> 124
<400> 124
000
<210> 125
<400> 125
000
<210> 126
<400> 126
000
<210> 127
<400> 127
000
<210> 128
<400> 128
000
<210> 129
<400> 129
000
<210> 130
<211> 471
<212> PRT
<213> Saccharomyces cerevisiae
<400> 130
Met Ser Ile Cys Glu Gln Tyr Tyr Pro Glu Glu Pro Thr Lys Pro Thr
1 5 10 15
Val Lys Thr Glu Ser Ile Pro Gly Pro Glu Ser Gln Lys Gln Leu Lys
20 25 30
Glu Leu Gly Glu Val Phe Asp Thr Arg Pro Ala Tyr Phe Leu Ala Asp
35 40 45
Tyr Glu Lys Ser Leu Gly Asn Tyr Ile Thr Asp Val Asp Gly Asn Thr
50 55 60
Tyr Leu Asp Leu Tyr Ala Gln Ile Ser Ser Ile Ala Leu Gly Tyr Asn
65 70 75 80
Asn Pro Ala Leu Ile Lys Ala Ala Gln Ser Pro Glu Met Ile Arg Ala
85 90 95
Leu Val Asp Arg Pro Ala Leu Gly Asn Phe Pro Ser Lys Asp Leu Asp
100 105 110
Lys Ile Leu Lys Gln Ile Leu Lys Ser Ala Pro Lys Gly Gln Asp His
115 120 125
Val Trp Ser Gly Leu Ser Gly Ala Asp Ala Asn Glu Leu Ala Phe Lys
130 135 140
Ala Ala Phe Ile Tyr Tyr Arg Ala Lys Gln Arg Gly Tyr Asp Ala Asp
145 150 155 160
Phe Ser Glu Lys Glu Asn Leu Ser Val Met Asp Asn Asp Ala Pro Gly
165 170 175
Ala Pro His Leu Ala Val Leu Ser Phe Lys Arg Ala Phe His Gly Arg
180 185 190
Leu Phe Ala Ser Gly Ser Thr Thr Cys Ser Lys Pro Ile His Lys Leu
195 200 205
Asp Phe Pro Ala Phe His Trp Pro His Ala Glu Tyr Pro Ser Tyr Gln
210 215 220
Tyr Pro Leu Asp Glu Asn Ser Asp Ala Asn Arg Lys Glu Asp Asp His
225 230 235 240
Cys Leu Ala Ile Val Glu Glu Leu Ile Lys Thr Trp Ser Ile Pro Val
245 250 255
Ala Ala Leu Ile Ile Glu Pro Ile Gln Ser Glu Gly Gly Asp Asn His
260 265 270
Ala Ser Lys Tyr Phe Leu Gln Lys Leu Arg Asp Ile Thr Leu Lys Tyr
275 280 285
Asn Val Val Tyr Ile Ile Asp Glu Val Gln Thr Gly Val Gly Ala Thr
290 295 300
Gly Lys Leu Trp Cys His Glu Tyr Ala Asp Ile Gln Pro Pro Val Asp
305 310 315 320
Leu Val Thr Phe Ser Lys Lys Phe Gln Ser Ala Gly Tyr Phe Phe His
325 330 335
Asp Pro Lys Phe Ile Pro Asn Lys Pro Tyr Arg Gln Phe Asn Thr Trp
340 345 350
Cys Gly Glu Pro Ala Arg Met Ile Ile Ala Gly Ala Ile Gly Gln Glu
355 360 365
Ile Ser Asp Lys Lys Leu Thr Glu Gln Cys Ser Arg Val Gly Asp Tyr
370 375 380
Leu Phe Lys Lys Leu Glu Gly Leu Gln Lys Lys Tyr Pro Glu Asn Phe
385 390 395 400
Gln Asn Leu Arg Gly Lys Gly Arg Gly Thr Phe Ile Ala Trp Asp Leu
405 410 415
Pro Thr Gly Glu Lys Arg Asp Leu Leu Leu Lys Lys Leu Lys Leu Asn
420 425 430
Gly Cys Asn Val Gly Gly Cys Ala Val His Ala Val Arg Leu Arg Pro
435 440 445
Ser Leu Thr Phe Glu Glu Lys His Ala Asp Ile Phe Ile Glu Ala Leu
450 455 460
Ala Lys Ser Val Asn Glu Leu
465 470
<210> 131
<211> 450
<212> PRT
<213> Clostridium viride
<400> 131
Met Leu Lys Asn Ala Leu Pro Lys Ile Val Thr Glu Ser Leu Pro Gly
1 5 10 15
Pro Lys Ala Lys Ala Ile Ile Asp Arg Arg Ala Asn Ala Ile Pro Ser
20 25 30
Ala Ile Arg Cys Val Tyr Pro Val Val Ile Asp Arg Gly Glu Gly Ala
35 40 45
Met Val Glu Asp Val Asp Gly Asn His Phe Leu Asp Trp Ile Gly Gly
50 55 60
Val Gly Val Leu Asn Ile Gly Tyr Ser His Pro Glu Val Val Asp Ala
65 70 75 80
Val Lys Lys Gln Thr Glu Arg Tyr Phe His Gly Met Phe Asn Ile Val
85 90 95
Thr His Glu Gly Tyr Val Ala Leu Ala Glu Lys Leu Ser Thr Leu Ala
100 105 110
Pro Val Leu Gly Lys Glu Lys Lys Ala Phe Phe Ala Asn Ser Gly Ala
115 120 125
Glu Ala Asn Glu Asn Ala Ile Lys Ile Ala Lys Ala Tyr Thr Lys Arg
130 135 140
Pro Asn Ile Ile Val Phe Ser Gly Ala Phe His Gly Arg Thr Met Leu
145 150 155 160
Thr Met Ser Met Thr Ser Lys Lys Ala Tyr Ala Asn Gly Met Gly Pro
165 170 175
Phe Pro Asp Gly Val Tyr Arg Ala Lys Phe Pro Tyr Tyr Tyr Arg Asn
180 185 190
Pro Val Gly Leu Pro Gln Glu Glu Ala Val Asn Tyr Tyr Ile Glu Ser
195 200 205
Ile Lys Ser Val Phe Glu Glu Ala Ser Pro Pro Glu His Val Ala Ala
210 215 220
Ile Val Val Glu Pro Leu Gln Gly Glu Gly Gly Phe Ile Pro Ala Pro
225 230 235 240
Ile Glu Trp Val Lys Ala Val Arg Gln Leu Cys Asp Gln His Gly Ile
245 250 255
Leu Leu Ile Ala Asp Glu Val Gln Thr Gly Phe Cys Arg Ala Gly Lys
260 265 270
Met Phe Ala Ser Glu Tyr Trp Gln Gly Ala Gly Ala Ser Pro Asp Ile
275 280 285
Leu Thr Thr Ala Lys Ser Ile Ala Ala Gly Val Pro Ile Ser Ala Ile
290 295 300
Val Ala Arg Asn Glu Ile Met Asp Ala Val Pro Ala Gly Ile Ile Gly
305 310 315 320
Gly Thr Tyr Cys Gly Asn Pro Leu Ala Cys Ala Ala Ala Leu Lys Val
325 330 335
Ile Glu Val Met Glu Arg Asp Lys Phe Ala Gln Arg Ser Thr Glu Ile
340 345 350
Gly Lys Ile Ala Met Glu Arg Phe Gln Gln Phe Lys Gln Asn Tyr Pro
355 360 365
Val Val Gly Asp Val Arg Gly Leu Gly Ser Met Ile Gly Leu Glu Phe
370 375 380
Val Lys Asp Pro Val Ser Lys Glu Pro Asn Ala Pro Phe Val Asn Ala
385 390 395 400
Leu Val Gln Glu Ala Val Lys Arg Gly Leu Met Ile Glu Asn Ala Gly
405 410 415
Thr Tyr Gly Asn Val Ile Arg Phe Leu Ala Pro Leu Thr Ile Thr Asp
420 425 430
Glu Gln Leu Tyr Ala Gly Leu Asp Ile Met Glu Glu Ser Ile Lys Ala
435 440 445
Leu Leu
450
<210> 132
<211> 441
<212> PRT
<213> Gulosibacter molinativorax
<400> 132
Met Glu Phe Arg Leu Glu Gln Gln Arg Lys Ile Val Thr Glu Ile Pro
1 5 10 15
Gly Pro Lys Ser Glu Glu Leu Leu Lys Arg Arg Gln Gln Tyr Val Ser
20 25 30
Ser Ser Ile Gly Ser Ser Leu Pro Val Tyr Ile Gly Glu Ala Asp Gly
35 40 45
Ala Ile Leu Arg Asp Val Asp Gly Asn Gln Phe Ile Asp Phe Gly Ser
50 55 60
Gly Ile Gly Val Thr Thr Val Gly Asn Ala Asn Pro Lys Val Val Lys
65 70 75 80
Ala Ile Gln Asp Ala Ala Ala Ala Ser Thr His Leu Gln Ile Asn Thr
85 90 95
Ala Pro Tyr Gly Ser Tyr Val Asp Leu Cys Gln Lys Leu Thr Glu Leu
100 105 110
Thr Pro Gly Asp Phe Pro Lys Lys Ala Ala Leu Phe Asn Ser Gly Ala
115 120 125
Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Lys Tyr Thr Gly Arg
130 135 140
Asp Ala Val Ile Val Phe Asp His Ala Phe His Gly Arg Thr Asn Leu
145 150 155 160
Thr Met Ala Met Thr Ser Lys Ser Met Pro Tyr Lys Asp Gly Phe Gly
165 170 175
Pro Phe Ala Pro Glu Val Tyr Arg Ala Pro Leu Ser Tyr Pro Phe Arg
180 185 190
Asp Glu Leu Ser Gly Pro Glu Ala Ala Ala Arg Thr Ile Asp Val Ile
195 200 205
Asp Lys Gln Val Gly Ala Lys Asn Val Ala Ala Ile Ile Ile Glu Pro
210 215 220
Ile Val Gly Glu Gly Gly Phe Ile Val Pro Ala Glu Gly Phe Leu Pro
225 230 235 240
Ala Leu Val Glu Tyr Ala Asn Glu Asn Gly Ile Val Phe Val Ala Asp
245 250 255
Glu Val Gln Ala Gly Met Ser Arg Thr Gly Lys Trp Phe Cys Ser Glu
260 265 270
Trp Glu Gly Ile Glu Pro Asp Leu Val Thr Ser Ala Lys Gly Ile Ala
275 280 285
Gly Gly Met Pro Leu Ser Ala Val Val Gly Arg Ala Glu Ile Met Asp
290 295 300
Ala Pro His Thr Gly Gly Ile Gly Gly Thr Tyr Ala Gly Asn Pro Val
305 310 315 320
Ala Asn Ala Ala Ala Leu Ala Thr Ile Ala Ser Tyr Glu Glu Asp Gly
325 330 335
Leu Gln Glu Ala Ala Leu Arg Ile Glu Lys Thr Ile Arg Gly Val Leu
340 345 350
Glu Pro Leu Val Asp Glu Leu Asp Val Val Gly Glu Val Arg Gly Arg
355 360 365
Gly Ala Met Leu Ala Ile Glu Leu Val Thr Gly Ala Asp Lys Thr Pro
370 375 380
Asn Pro Glu Leu Val Lys Thr Val Val Ala Glu Ala Gln Ala Gln Gly
385 390 395 400
Val Val Phe Leu Thr Cys Gly Thr Tyr Gly Asn Val Ile Arg Phe Leu
405 410 415
Pro Pro Leu Val Ile Thr Asp Glu Leu Leu Thr Asp Gly Leu Asn Val
420 425 430
Leu Val Asp Ala Ile Arg Lys Asn Ala
435 440
<210> 133
<211> 447
<212> PRT
<213> Kocuria rhizophila
<400> 133
Met Ala Glu Ile Glu Tyr Arg Leu Pro Gln Lys Arg Glu Leu Val Thr
1 5 10 15
Ser Ile Pro Gly Pro Lys Ser Gln Ser Leu Ala Glu Arg Arg Ala Gln
20 25 30
Thr Val Ala Ala Gly Val Ala Ser Ser Leu Pro Val Phe Ala Asp Glu
35 40 45
Leu Asp Gly Gly Val Ile Lys Asp Val Asp Gly Asn Gln Met Val Asp
50 55 60
Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly Ala Ser Asn Pro Lys
65 70 75 80
Val Val Ala Arg Val Gln Asp Ala Val Ala Lys Phe Thr His Thr Cys
85 90 95
Phe Met Val Thr Pro Tyr Glu Asp Tyr Val Ala Val Gly Glu Lys Met
100 105 110
Ala Gln Leu Thr Pro Gly Ser Phe Asp Lys Arg Thr Ala Leu Phe Thr
115 120 125
Ser Gly Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Val Arg
130 135 140
Thr Lys Arg Gln Ala Val Val Val Phe Asp His Ala Tyr His Gly Arg
145 150 155 160
Thr Asn Leu Thr Met Ala Met Thr Ala Lys Val Met Pro Tyr Lys Gln
165 170 175
Gly Phe Gly Pro Phe Ala Asn Glu Val Tyr Arg Val Pro Met Ser Tyr
180 185 190
Pro Phe Arg Asp Pro Glu Gly Met Thr Gly Thr Glu Ala Ala Lys Arg
195 200 205
Ala Leu Thr Met Val Glu Lys Gln Val Gly Ala Glu Asn Val Ala Ala
210 215 220
Val Val Ile Glu Pro Ile Gln Gly Glu Gly Gly Phe Ile Val Pro Ala
225 230 235 240
Glu Gly Phe Leu Pro Ala Leu Ser Ser Trp Cys Arg Glu Asn Gly Ala
245 250 255
Val Phe Val Ala Asp Glu Val Gln Ala Gly Ile Ala Arg Thr Gly Ala
260 265 270
Trp Phe Ala Ser Glu His Glu Gly Val Glu Pro Asp Leu Val Thr Phe
275 280 285
Ala Lys Gly Ile Ala Gly Gly Met Pro Leu Ser Gly Val Val Gly Arg
290 295 300
Ala Glu Ile Met Asp Ala Val His Pro Gly Gly Leu Gly Gly Thr Tyr
305 310 315 320
Gly Gly Asn Pro Val Ala Cys Ala Ala Ala Leu Gly Ala Leu Glu Ala
325 330 335
Ile Glu Glu Trp Asp Leu Val Ala Arg Ala Gln Glu Ile Glu Lys Val
340 345 350
Ile Arg Glu Glu Leu Gly Ser Val Ala Glu Ser Ser Pro Val Val Gly
355 360 365
Asp Leu Arg Gly Arg Gly Ala Met Ile Ala Leu Glu Phe Val Lys Pro
370 375 380
Gly Thr Thr Glu Pro Asn Pro Asp Ala Ala Lys Gln Ile Ala Ala Arg
385 390 395 400
Cys Leu Glu Gln Gly Val Ala Ile Leu Thr Cys Gly Thr Tyr Gly Asn
405 410 415
Ile Val Arg Leu Leu Pro Pro Leu Val Ile Asp Met Asp Leu Leu Arg
420 425 430
Asp Ala Leu Gly Val Phe Ala Ala Ala Ile Gln Glu Val Gly Ala
435 440 445
<210> 134
<211> 468
<212> PRT
<213> Arthrobacter sp. FB24
<400> 134
Met Val Glu Leu Val Glu Thr Arg Thr Gly Thr His Gln Lys Gly Ile
1 5 10 15
Pro Met Thr Ala Thr Ala Pro Asp Ile Thr Tyr Arg Leu Glu Gln Lys
20 25 30
Arg Arg Val Gln Ala Asp Phe Pro Gly Pro Lys Ser Val Ala Leu Thr
35 40 45
Glu Arg Arg Lys Ala Val Val Ala Ala Gly Val Ala Ser Ser Val Pro
50 55 60
Val Phe Val Ser Asp Ala Asp Gly Gly Ile Ile His Asp Val Asp Gly
65 70 75 80
Asn Ser Phe Ile Asp Leu Gly Ser Gly Ile Ala Val Thr Ser Val Gly
85 90 95
Ala Ser Asp Pro Ala Val Val Gly Ala Val Lys Glu Ala Val Glu His
100 105 110
Phe Thr His Thr Cys Phe Met Val Thr Pro Tyr Glu Gly Tyr Val Ala
115 120 125
Val Ala Glu Gln Leu Asn Arg Leu Thr Pro Gly Asp His Glu Lys Arg
130 135 140
Thr Val Leu Phe Asn Ser Gly Ala Glu Ala Val Glu Asn Ala Val Lys
145 150 155 160
Val Ala Arg Leu Ala Thr Gly Arg Asp Ala Val Val Ala Phe Asp His
165 170 175
Ala Tyr His Gly Arg Thr Asn Leu Thr Met Ala Leu Thr Ala Lys Ala
180 185 190
Met Pro Tyr Lys Thr Asn Phe Gly Pro Phe Ala Pro Glu Val Tyr Arg
195 200 205
Met Pro Met Ser Tyr Pro Phe Arg Glu Glu Asn Pro Ala Ile Thr Gly
210 215 220
Ala Glu Ala Ala Lys Arg Ala Ile Thr Ala Ile Glu Lys Gln Ile Gly
225 230 235 240
Gly Glu Gln Val Ala Ala Ile Ile Ile Glu Pro Ile Gln Gly Glu Gly
245 250 255
Gly Phe Ile Val Pro Ala Asp Gly Phe Leu Pro Ala Leu Ala Ala Trp
260 265 270
Ala Lys Glu Lys Gly Ile Val Phe Ile Ala Asp Glu Val Gln Ser Gly
275 280 285
Phe Cys Arg Thr Gly Glu Trp Phe Ala Val Asn His Glu Gly Val Val
290 295 300
Pro Asp Ile Ile Thr Met Ala Lys Gly Ile Ala Gly Gly Met Pro Leu
305 310 315 320
Ser Ala Ile Thr Gly Arg Ala Asp Leu Leu Asp Ala Val His Pro Gly
325 330 335
Gly Leu Gly Gly Thr Tyr Gly Gly Asn Pro Val Ala Cys Ala Ala Ala
340 345 350
Leu Ala Ser Ile Gly Ser Met Glu Glu Tyr Asp Leu Asn Ala Arg Ala
355 360 365
Lys His Ile Glu Glu Leu Ala Thr Gly Arg Leu Arg Glu Leu Gln Gly
370 375 380
Glu Val Ser Val Ile Gly Asp Ile Arg Gly Arg Gly Ala Met Leu Ala
385 390 395 400
Ile Glu Leu Val Gln Ala Gly Ser Lys Glu Pro Asn Pro Glu Leu Thr
405 410 415
Lys Ala Val Ala Ala Ala Cys Leu Lys Glu Gly Val Ile Ile Leu Thr
420 425 430
Cys Gly Thr Tyr Gly Asn Val Ile Arg Leu Leu Pro Pro Leu Val Ile
435 440 445
Gly Asp Glu Leu Leu Leu Asp Gly Leu Glu Val Leu Ala Ala Ala Ile
450 455 460
Lys Ala His Ala
465
<210> 135
<211> 426
<212> PRT
<213> Pseudomonas sp. AAC
<400> 135
Met Ser Lys Thr Asn Glu Ser Leu Leu Gln Arg Arg Gln Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Val Val Ala Glu Arg Ala Glu
20 25 30
Asn Ala Thr Val Trp Asp Val Glu Gly Arg Glu Tyr Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Leu His Pro Lys Val Val
50 55 60
Ala Ala Val Gln Glu Gln Leu Thr Lys Leu Ser His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Ile Glu Leu Ala Glu Glu Ile Ala Lys
85 90 95
Arg Val Pro Gly Asn Phe Pro Lys Lys Thr Leu Leu Val Thr Ser Gly
100 105 110
Ser Glu Ala Val Glu Asn Ala Val Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Leu Ala Pro Cys Glu Leu
165 170 175
His Gly Ile Ser Glu Asp Glu Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Gln Pro Arg Asp Ile Ala Ala Ile Ile Ile Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Asn Ser Lys Pro Phe Met Gln
210 215 220
Arg Leu Arg Ala Leu Cys Asp Glu His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Thr Glu
245 250 255
Gln Leu Gly Ile Val Pro Asp Leu Thr Thr Phe Ala Lys Ser Val Gly
260 265 270
Gly Gly Phe Pro Ile Ser Gly Val Val Gly Lys Ala Glu Ile Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Leu Lys Val Phe Asp Glu Glu Lys
305 310 315 320
Leu Leu Glu Arg Ser Gln Ala Val Gly Glu Thr Leu Lys Ala Gly Leu
325 330 335
Arg Glu Ile Gln Ala Lys His Lys Val Ile Gly Asp Val Arg Gly Leu
340 345 350
Gly Ser Met Val Ala Ile Glu Leu Phe Glu Gly Gly Asp Val Asn Lys
355 360 365
Pro Ala Ala Glu Leu Val Ser Lys Ile Val Val Arg Ala Arg Glu Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Tyr Asn Val Ile Arg Phe
385 390 395 400
Leu Met Pro Val Thr Ile Pro Asp Ala Gln Leu Lys Gln Gly Leu Ala
405 410 415
Ile Leu Ala Glu Cys Phe Asp Glu Leu Ala
420 425
<210> 136
<211> 426
<212> PRT
<213> Pseudomonas putida KG-4
<400> 136
Met Ser Lys Thr Asn Glu Ser Leu Met Gln Arg Arg Val Ala Ala Val
1 5 10 15
Pro Arg Gly Val Gly Gln Ile His Pro Ile Phe Ala Glu Ser Ala Arg
20 25 30
Asn Ala Thr Val Thr Asp Val Glu Gly Arg Glu Phe Ile Asp Phe Ala
35 40 45
Gly Gly Ile Ala Val Leu Asn Thr Gly His Val His Pro Lys Ile Ile
50 55 60
Ala Ala Val Glu Ala Gln Leu His Lys Leu Thr His Thr Cys Phe Gln
65 70 75 80
Val Leu Ala Tyr Glu Pro Tyr Val Glu Val Cys Glu Lys Ile Asn Ala
85 90 95
Leu Ile Pro Gly Asp Phe Ala Lys Lys Thr Leu Leu Val Thr Thr Gly
100 105 110
Ser Glu Ala Val Glu Asn Ala Ile Lys Ile Ala Arg Ala Ala Thr Gly
115 120 125
Arg Ala Gly Val Ile Ala Phe Thr Gly Ala Tyr His Gly Arg Thr Met
130 135 140
Met Thr Leu Gly Leu Thr Gly Lys Val Val Pro Tyr Ser Ala Gly Met
145 150 155 160
Gly Leu Met Pro Gly Gly Ile Phe Arg Ala Ile Tyr Pro Asn Glu Leu
165 170 175
His Gly Val Ser Ile Asp Asp Ser Ile Ala Ser Ile Glu Arg Ile Phe
180 185 190
Lys Asn Asp Ala Glu Ala Lys Asp Ile Ala Ala Ile Ile Leu Glu Pro
195 200 205
Val Gln Gly Glu Gly Gly Phe Tyr Val Ala Pro Lys Glu Phe Met Lys
210 215 220
Arg Leu Arg Ala Leu Cys Asp Gln His Gly Ile Leu Leu Ile Ala Asp
225 230 235 240
Glu Val Gln Thr Gly Ala Gly Arg Thr Gly Thr Phe Phe Ala Met Glu
245 250 255
Gln Met Gly Val Ala Pro Asp Leu Thr Thr Phe Ala Lys Ser Ile Ala
260 265 270
Gly Gly Phe Pro Leu Ala Gly Val Cys Gly Lys Ala Glu Tyr Met Asp
275 280 285
Ala Ile Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Ser Pro Ile
290 295 300
Ala Cys Ala Ala Ala Leu Ala Val Met Glu Val Phe Glu Glu Glu Lys
305 310 315 320
Leu Leu Asp Arg Ser Lys Ala Val Gly Glu Arg Leu Val Thr Gly Leu
325 330 335
Arg Lys Ile Gln Asp Lys His Pro Ile Ile Gly Asp Val Arg Ala Leu
340 345 350
Gly Ser Met Ile Ala Val Glu Val Phe Asp Lys Ala Gly Ser His Thr
355 360 365
Pro Asn Pro Thr Ala Val Ala Ala Val Val Ala Lys Ala Arg Asp Lys
370 375 380
Gly Leu Ile Leu Leu Ser Cys Gly Thr Tyr Gly Asn Val Leu Arg Ile
385 390 395 400
Leu Val Pro Leu Thr Ser Pro Asp Glu Gln Leu Asp Lys Gly Leu Ala
405 410 415
Ile Ile Glu Glu Cys Phe Ala Glu Leu Ala
420 425
<210> 137
<211> 442
<212> PRT
<213> Alcaligenes A. faecalis
<400> 137
Met Ser Lys Asp Lys Ala Met Leu Asn Ala Phe Asp Pro Ala Ala Ala
1 5 10 15
Asp Ser Leu Pro Ala Ala Glu Arg Ala Leu Ile Glu Arg Arg Gln Arg
20 25 30
Val Leu Gly Thr Ala Tyr Arg Leu Phe Tyr Asp Asn Pro Leu His Ile
35 40 45
Val Arg Gly Glu Gly Val Trp Leu Tyr Asp Ala Ala Gly Glu Arg Tyr
50 55 60
Leu Asp Ala Tyr Asn Asn Val Ala Ser Val Gly His Ser His Pro Arg
65 70 75 80
Val Val Ala Ala Ile Ala Glu Gln Ala Ala Ile Leu Asn Thr His Thr
85 90 95
Arg Tyr Leu His Asp Gly Val Val Glu Tyr Ala Glu Arg Leu Val Ala
100 105 110
Thr Phe Pro Ser Ala Leu Ser Gln Ala Met Phe Thr Cys Thr Gly Ser
115 120 125
Glu Ala Asn Asp Leu Ala Leu Arg Ile Ala Arg Ser His Thr Gly Ala
130 135 140
Ser Gly Val Ile Val Thr Glu Leu Ala Tyr His Gly Val Thr Ala Ala
145 150 155 160
Val Ala Ala Val Ser Pro Ser Leu Gly Lys Thr Val Pro Leu Gly Val
165 170 175
Asp Val Arg Ala Val Ser Ala Pro Asp Thr Tyr Arg His Asp Pro Ala
180 185 190
Thr Ile Gly Val Trp Phe Ala Ala Arg Val Gln Glu Ala Ile Asp Asp
195 200 205
Met Leu Arg His Gly Ile Arg Pro Ala Ala Leu Leu Val Asp Thr Val
210 215 220
Phe Ser Ser Asp Gly Val Tyr Thr Asp Pro Ala Pro Phe Leu Ala Pro
225 230 235 240
Ala Val Glu Ala Ile Arg Ala Ala Gly Gly Leu Phe Ile Ala Asp Glu
245 250 255
Val Gln Ala Gly Phe Ala Arg Thr Gly Ser Cys Met Trp Gly Phe Gln
260 265 270
Arg His Gly Leu Val Pro Asp Ile Val Thr Met Gly Lys Pro Met Gly
275 280 285
Asn Gly His Pro Ile Ala Gly Val Val Ala Arg Pro Glu Ile Phe Glu
290 295 300
Arg Phe Gly Arg Asp Ala Arg Tyr Phe Asn Thr Phe Gly Gly Asn Pro
305 310 315 320
Val Ser Cys Ala Ala Ala Leu Ala Thr Leu Asp Val Ile Gln Asp Glu
325 330 335
Gly Leu Gln Ala Asn Ala Ala Arg Thr Gly Ala Tyr Leu Arg Asp Lys
340 345 350
Phe Arg Glu Met Ala Arg Lys His Ser Trp Ile Gly Asp Val Arg Gly
355 360 365
Asp Gly Leu Phe Met Gly Ile Glu Leu Val Lys Asp Gln Ala Ala Lys
370 375 380
Thr Pro Ala Thr Glu Glu Thr His Arg Phe Val Asn Leu Met Arg Glu
385 390 395 400
His Arg Val Leu Leu Ser Ala Thr Gly Leu Arg Gly Asn Val Ile Lys
405 410 415
Leu Arg Pro Gln Leu Pro Phe Ser Leu Glu Asn Ala Asp Gln Leu Met
420 425 430
Gln Ala Ala Asp Glu Val Phe Ala Lys Leu
435 440
<210> 138
<211> 453
<212> PRT
<213> Clostridium kluyveri DSM555
<400> 138
Met Ser Asn Glu Val Ser Ile Lys Glu Leu Ile Glu Lys Ala Lys Val
1 5 10 15
Ala Gln Lys Lys Leu Glu Ala Tyr Ser Gln Glu Gln Val Asp Val Leu
20 25 30
Val Lys Ala Leu Gly Lys Val Val Tyr Asp Asn Ala Glu Met Phe Ala
35 40 45
Lys Glu Ala Val Glu Glu Thr Glu Met Gly Val Tyr Glu Asp Lys Val
50 55 60
Ala Lys Cys His Leu Lys Ser Gly Ala Ile Trp Asn His Ile Lys Asp
65 70 75 80
Lys Lys Thr Val Gly Ile Ile Lys Glu Glu Pro Glu Arg Ala Leu Val
85 90 95
Tyr Val Ala Lys Pro Lys Gly Val Val Ala Ala Thr Thr Pro Ile Thr
100 105 110
Asn Pro Val Val Thr Pro Met Cys Asn Ala Met Ala Ala Ile Lys Gly
115 120 125
Arg Asn Thr Ile Ile Val Ala Pro His Pro Lys Ala Lys Lys Val Ser
130 135 140
Ala His Thr Val Glu Leu Met Asn Ala Glu Leu Lys Lys Leu Gly Ala
145 150 155 160
Pro Glu Asn Ile Ile Gln Ile Val Glu Ala Pro Ser Arg Glu Ala Ala
165 170 175
Lys Glu Leu Met Glu Ser Ala Asp Val Val Ile Ala Thr Gly Gly Ala
180 185 190
Gly Arg Val Lys Ala Ala Tyr Ser Ser Gly Arg Pro Ala Tyr Gly Val
195 200 205
Gly Pro Gly Asn Ser Gln Val Ile Val Asp Lys Gly Tyr Asp Tyr Asn
210 215 220
Lys Ala Ala Gln Asp Ile Ile Thr Gly Arg Lys Tyr Asp Asn Gly Ile
225 230 235 240
Ile Cys Ser Ser Glu Gln Ser Val Ile Ala Pro Ala Glu Asp Tyr Asp
245 250 255
Lys Val Ile Ala Ala Phe Val Glu Asn Gly Ala Phe Tyr Val Glu Asp
260 265 270
Glu Glu Thr Val Glu Lys Phe Arg Ser Thr Leu Phe Lys Asp Gly Lys
275 280 285
Ile Asn Ser Lys Ile Ile Gly Lys Ser Val Gln Ile Ile Ala Asp Leu
290 295 300
Ala Gly Val Lys Val Pro Glu Gly Thr Lys Val Ile Val Leu Lys Gly
305 310 315 320
Lys Gly Ala Gly Glu Lys Asp Val Leu Cys Lys Glu Lys Met Cys Pro
325 330 335
Val Leu Val Ala Leu Lys Tyr Asp Thr Phe Glu Glu Ala Val Glu Ile
340 345 350
Ala Met Ala Asn Tyr Met Tyr Glu Gly Ala Gly His Thr Ala Gly Ile
355 360 365
His Ser Asp Asn Asp Glu Asn Ile Arg Tyr Ala Gly Thr Val Leu Pro
370 375 380
Ile Ser Arg Leu Val Val Asn Gln Pro Ala Thr Thr Ala Gly Gly Ser
385 390 395 400
Phe Asn Asn Gly Phe Asn Pro Thr Thr Thr Leu Gly Cys Gly Ser Trp
405 410 415
Gly Arg Asn Ser Ile Ser Glu Asn Leu Thr Tyr Glu His Leu Ile Asn
420 425 430
Val Ser Arg Ile Gly Tyr Phe Asn Lys Glu Ala Lys Val Pro Ser Tyr
435 440 445
Glu Glu Ile Trp Gly
450
<210> 139
<211> 451
<212> PRT
<213> Porphyromonas gingivalis W83
<400> 139
Met Glu Ile Lys Glu Met Val Ser Leu Ala Arg Lys Ala Gln Lys Glu
1 5 10 15
Tyr Gln Ala Thr His Asn Gln Glu Ala Val Asp Asn Ile Cys Arg Ala
20 25 30
Ala Ala Lys Val Ile Tyr Glu Asn Ala Ala Ile Leu Ala Arg Glu Ala
35 40 45
Val Asp Glu Thr Gly Met Gly Val Tyr Glu His Lys Val Ala Lys Asn
50 55 60
Gln Gly Lys Ser Lys Gly Val Trp Tyr Asn Leu His Asn Lys Lys Ser
65 70 75 80
Ile Gly Ile Leu Asn Ile Asp Glu Arg Thr Gly Met Ile Glu Ile Ala
85 90 95
Lys Pro Ile Gly Val Val Gly Ala Val Thr Pro Thr Thr Asn Pro Ile
100 105 110
Val Thr Pro Met Ser Asn Ile Ile Phe Ala Leu Lys Thr Cys Asn Ala
115 120 125
Ile Ile Ile Ala Pro His Pro Arg Ser Lys Lys Cys Ser Ala His Ala
130 135 140
Val Arg Leu Ile Lys Glu Ala Ile Ala Pro Phe Asn Val Pro Glu Gly
145 150 155 160
Met Val Gln Ile Ile Glu Glu Pro Ser Ile Glu Lys Thr Gln Glu Leu
165 170 175
Met Gly Ala Val Asp Val Val Val Ala Thr Gly Gly Met Gly Met Val
180 185 190
Lys Ser Ala Tyr Ser Ser Gly Lys Pro Ser Phe Gly Val Gly Ala Gly
195 200 205
Asn Val Gln Val Ile Val Asp Ser Asn Ile Asp Phe Glu Ala Ala Ala
210 215 220
Glu Lys Ile Ile Thr Gly Arg Ala Phe Asp Asn Gly Ile Ile Cys Ser
225 230 235 240
Gly Glu Gln Ser Ile Ile Tyr Asn Glu Ala Asp Lys Glu Ala Val Phe
245 250 255
Thr Ala Phe Arg Asn His Gly Ala Tyr Phe Cys Asp Glu Ala Glu Gly
260 265 270
Asp Arg Ala Arg Ala Ala Ile Phe Glu Asn Gly Ala Ile Ala Lys Asp
275 280 285
Val Val Gly Gln Ser Val Ala Phe Ile Ala Lys Lys Ala Asn Ile Asn
290 295 300
Ile Pro Glu Gly Thr Arg Ile Leu Val Val Glu Ala Arg Gly Val Gly
305 310 315 320
Ala Glu Asp Val Ile Cys Lys Glu Lys Met Cys Pro Val Met Cys Ala
325 330 335
Leu Ser Tyr Lys His Phe Glu Glu Gly Val Glu Ile Ala Arg Thr Asn
340 345 350
Leu Ala Asn Glu Gly Asn Gly His Thr Cys Ala Ile His Ser Asn Asn
355 360 365
Gln Ala His Ile Ile Leu Ala Gly Ser Glu Leu Thr Val Ser Arg Ile
370 375 380
Val Val Asn Ala Pro Ser Ala Thr Thr Ala Gly Gly His Ile Gln Asn
385 390 395 400
Gly Leu Ala Val Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn
405 410 415
Ser Ile Ser Glu Asn Phe Thr Tyr Lys His Leu Leu Asn Ile Ser Arg
420 425 430
Ile Ala Pro Leu Asn Ser Ser Ile His Ile Pro Asp Asp Lys Glu Ile
435 440 445
Trp Glu Leu
450
<210> 140
<211> 463
<212> PRT
<213> Clostridium difficile 630
<400> 140
Met Glu Lys Ala Val Glu Asn Phe Glu Asp Leu Ser Lys Glu Tyr Ile
1 5 10 15
Asn Gly Tyr Ile Glu Arg Ala Arg Lys Ala Gln Arg Glu Phe Glu Cys
20 25 30
Tyr Thr Gln Glu Gln Val Asp Lys Ile Val Lys Ile Val Gly Lys Val
35 40 45
Val Tyr Tyr Asn Ala Glu Tyr Leu Ala Lys Leu Ala Val Glu Glu Thr
50 55 60
Gly Met Gly Val Tyr Glu Asp Lys Val Ala Lys Asn Lys Ser Lys Ala
65 70 75 80
Lys Val Ile Tyr Asn Asn Leu Lys Asp Lys Lys Ser Val Gly Ile Ile
85 90 95
Asp Ile Asp Arg Glu Thr Gly Ile Thr Lys Val Ala Lys Pro Val Gly
100 105 110
Val Val Ala Ala Ile Thr Pro Cys Thr Asn Pro Ile Val Thr Pro Met
115 120 125
Ser Asn Ala Met Phe Ala Leu Lys Gly Arg Asn Ala Ile Ile Ile Thr
130 135 140
Pro His His Lys Ala Ile Gly Cys Ser Thr Lys Thr Val Glu Met Ile
145 150 155 160
Asn Glu Glu Leu Glu Lys Ile Gly Ala Pro Glu Asn Leu Ile Gln Ile
165 170 175
Leu Asp Gln Gln Ser Arg Glu Asn Thr Arg Asn Leu Ile Ser Ser Ala
180 185 190
Asp Val Val Ile Ala Thr Gly Gly Met Gly Met Val Lys Ala Ala Tyr
195 200 205
Ser Ser Gly Lys Pro Ala Leu Gly Val Gly Ala Gly Asn Val Gln Cys
210 215 220
Ile Ile Asp Arg Asp Val Asp Ile Lys Glu Ala Val Pro Lys Ile Ile
225 230 235 240
Ala Gly Arg Ile Phe Asp Asn Gly Ile Ile Cys Ser Gly Glu Gln Ser
245 250 255
Val Ile Val Ala Glu Glu Met Phe Asp Lys Ile Met Asp Glu Phe Lys
260 265 270
Asn Asn Lys Gly Phe Ile Val Arg Asp Lys Val Gln Lys Glu Ala Phe
275 280 285
Arg Asn Ala Met Phe Val Asn Lys Ser Met Asn Lys Asp Ala Val Gly
290 295 300
Gln Ser Val His Thr Ile Ala Lys Ile Ala Gly Val Glu Ile Pro Glu
305 310 315 320
Asp Thr Lys Ile Ile Val Ile Glu Ala Asp Gly Pro Gly Glu Glu Asp
325 330 335
Ile Ile Ala Lys Glu Lys Met Cys Pro Val Ile Ser Ala Tyr Lys Tyr
340 345 350
Lys Ser Phe Glu Glu Gly Val Ala Ile Ala Lys Ala Asn Leu Asn Val
355 360 365
Glu Gly Lys Gly His Ser Val Ser Ile His Ser Asn Thr Val Lys Asn
370 375 380
Ile Glu Tyr Ala Gly Glu Asn Ile Glu Val Ser Arg Phe Val Ile Asn
385 390 395 400
Gln Cys Cys Ala Thr Ser Ala Gly Gly Ser Phe Phe Asn Gly Leu Ala
405 410 415
Pro Thr Asn Thr Leu Gly Cys Gly Ser Trp Gly Asn Asn Ser Ile Ser
420 425 430
Glu Asn Leu Asp Tyr Lys His Leu Ile Asn Ile Ser Arg Ile Ala Tyr
435 440 445
Tyr Met Pro Glu Asn Glu Val Pro Thr Asp Glu Glu Leu Trp Gly
450 455 460
<210> 141
<211> 364
<212> PRT
<213> Candida tropicalis
<400> 141
Met Ile Thr Ala Gln Ala Val Leu Tyr Thr Gln His Gly Glu Pro Lys
1 5 10 15
Asp Val Leu Phe Thr Gln Ser Phe Glu Ile Asp Asp Asp Asn Leu Ala
20 25 30
Pro Asn Glu Val Ile Val Lys Thr Leu Gly Ser Pro Val Asn Pro Ser
35 40 45
Asp Ile Asn Gln Ile Gln Gly Val Tyr Pro Ser Lys Pro Ala Lys Thr
50 55 60
Thr Gly Phe Gly Thr Thr Glu Pro Ala Ala Pro Cys Gly Asn Glu Gly
65 70 75 80
Leu Phe Glu Val Ile Lys Val Gly Ser Asn Val Leu Ser Leu Glu Ala
85 90 95
Gly Asp Trp Val Ile Pro Ser His Val Asn Phe Gly Thr Trp Arg Thr
100 105 110
His Ala Leu Gly Asn Asp Asp Asp Phe Ile Lys Leu Pro Asn Pro Ala
115 120 125
Gln Ser Lys Ala Asn Gly Lys Pro Asn Gly Leu Thr Ile Asn Gln Gly
130 135 140
Ala Thr Ile Ser Val Asn Pro Leu Thr Ala Tyr Leu Met Leu Thr His
145 150 155 160
Tyr Val Lys Leu Thr Pro Gly Lys Asp Trp Phe Ile Gln Asn Gly Gly
165 170 175
Thr Ser Ala Val Gly Lys Tyr Ala Ser Gln Ile Gly Lys Leu Leu Asn
180 185 190
Phe Asn Ser Ile Ser Val Ile Arg Asp Arg Pro Asn Leu Asp Glu Val
195 200 205
Val Ala Ser Leu Lys Glu Leu Gly Ala Thr Gln Val Ile Thr Glu Asp
210 215 220
Gln Asn Asn Ser Arg Glu Phe Gly Pro Thr Ile Lys Glu Trp Ile Lys
225 230 235 240
Gln Ser Gly Gly Glu Ala Lys Leu Ala Leu Asn Cys Val Gly Gly Lys
245 250 255
Ser Ser Thr Gly Ile Ala Arg Lys Leu Asn Asn Asn Gly Leu Met Leu
260 265 270
Thr Tyr Gly Gly Met Ser Phe Gln Pro Val Thr Ile Pro Thr Ser Leu
275 280 285
Tyr Ile Phe Lys Asn Phe Thr Ser Ala Gly Phe Trp Val Thr Glu Leu
290 295 300
Leu Lys Asn Asn Lys Glu Leu Lys Thr Leu Thr Leu Asn Gln Ile Ile
305 310 315 320
Ala Trp Tyr Glu Glu Gly Lys Leu Thr Asp Ala Lys Ser Ile Glu Thr
325 330 335
Leu Tyr Asp Gly Thr Lys Pro Leu His Glu Leu Tyr Gln Asp Gly Val
340 345 350
Ala Asn Ser Lys Asp Gly Lys Gln Leu Ile Thr Tyr
355 360
<210> 142
<211> 340
<212> PRT
<213> Drosophila melanogaster
<400> 142
Met Met Ser Val Val Ala Lys Ser Leu Lys Tyr Thr Gln His Gly Glu
1 5 10 15
Pro Gln Glu Val Leu Gln Leu Val Glu Asp Lys Leu Pro Asp Pro Lys
20 25 30
Asp Asn Gln Val Leu Val Lys Ile Leu Ala Ala Pro Ile Asn Pro Ala
35 40 45
Asp Ile Asn Thr Ile Gln Gly Lys Tyr Pro Val Lys Pro Lys Phe Pro
50 55 60
Ala Val Gly Gly Asn Glu Cys Val Ala Glu Val Ile Cys Val Gly Asp
65 70 75 80
Lys Val Lys Gly Phe Glu Ala Gly Gln His Val Ile Pro Leu Ala Ser
85 90 95
Gly Leu Gly Thr Trp Thr Thr His Ala Val Tyr Lys Glu Asp Gln Leu
100 105 110
Leu Ile Val Ser Lys Lys Val Gly Leu Ala Glu Ala Ala Thr Ser Thr
115 120 125
Val Asn Pro Thr Thr Ala Tyr Arg Met Leu Lys Asp Phe Val Gln Leu
130 135 140
Cys Pro Gly Asp Thr Val Ile Gln Asn Gly Ala Asn Ser Ala Val Gly
145 150 155 160
Gln Ala Val His Gln Leu Cys Arg Ala Trp Gly Ile Asn Ser Val Gly
165 170 175
Ile Val Arg Asp Arg Pro Glu Ile Ala Glu Leu Lys Gln Met Leu Gln
180 185 190
Cys Leu Gly Ala Thr Glu Val Leu Thr Glu Ala Glu Ile Arg Thr Ser
195 200 205
Asp Ile Phe Lys Ser Gly Lys Leu Lys Lys Pro Arg Leu Ala Phe Asn
210 215 220
Cys Val Gly Gly Lys Ser Ala Thr Glu Val Ser Arg His Leu Asp Asn
225 230 235 240
Gly Gly Val Leu Val Thr Tyr Gly Gly Met Ser Arg Glu Pro Val Thr
245 250 255
Val Ala Thr Gly Pro Leu Ile Phe Lys Asp Ile Ala Phe Arg Gly Phe
260 265 270
Trp Met Thr Arg Trp Ser Lys Glu Asn Tyr Ser Ser Pro Glu Arg Ser
275 280 285
Lys Met Phe Lys Glu Ile Phe Glu Leu Met Glu Gln Gly Lys Phe Val
290 295 300
Ala Pro Asn His Glu Met Val Pro Leu Ala Lys Phe Lys Asp Ala Ala
305 310 315 320
Ala Ala Ala Leu Ser Phe Lys Gly Phe Thr Gly Lys Lys Tyr Ile Leu
325 330 335
Asp Met Ser Ile
340
<210> 143
<211> 1266
<212> DNA
<213> Achromobacter xylosoxidans
<400> 143
atgaagaatc aggacctgaa tacccgccgt tccctggcca cgccgcgcgg cgtcggcgtc 60
atgtgcgact tctacgcggt gcgcgccgaa aacgccaccc tgtgggacgc caatggcaag 120
gaatacatcg atttcgcagg cggcatcgcc gtcctgaaca cgggccacct gcacccgaag 180
atcaaggccg ccgttgccgc gcagctggac aacttcacgc acacggccta ccagatcgtg 240
ccgtacgaag gctatgtctc gctggccgag cgcatcaacc gcctcgcccc catcgacggc 300
ctgaagaaga gcgccttctt caccaccggc gtggaagccg tcgaaaacgc cgtcaagatc 360
gcgcgttcgg ccaccggccg ctcgggcgtc atcgccttct cgggctcgtt ccacggccgc 420
accatgctgg gcatggcgct gactggcaag gtcgccccgt acaagctgtc gttcggtccg 480
atgccgggcg acatctatca cgtgcccttc cccaacgcca cccagtccat cagcgtggcg 540
gactcgctca aggcgctgga cctgctgttc aagtgcgaca tcgatcccaa gcgcgtcgcg 600
gccatcatca tcgaaccggt gcagggtgaa ggcggcttca acatcacccc gcccgagttg 660
atgacggcgc tgcgcaaggt ctgcgacgag cacggcattc tgctgatcgc cgacgaagtc 720
cagaccggct tcggccgcac cggcaagctg ttcgccatgg agcaccactc ggtccaggcc 780
gacctgatca ccatggccaa gagcctgggc ggcggcttcc cgatatcggg cgtggtcggc 840
cgcgccgacg tcatggacgc gcccgccgcc ggcggcctgg gcggcaccta cgccggcaac 900
ccgctggcgg tcgccgcggc gcatgccgtg ctggacgtga tcgccgagga aaagctgtgc 960
gaacgcgccg acgccctggg cgacaagctg cgcgcgcatc tggaaggcct gcgcgccaag 1020
gttccgggca tcgccgacgt gcgcggcctg ggttccatgg tcgccctgga actgaacgat 1080
cccgccaccg gcaagccgga cgcggaagcg gtcaagcgcg tgcaagcccg cgccatcgaa 1140
aagggcctga ttttgctaag ctgcggtgtg tacggcaacg tcctgcgctt cctgtacccc 1200
ttgaccatcc ccgacgccca gttcgatcgc gcgctggcca tcctgtccga ggcgcttgcc 1260
gcctga 1266
<210> 144
<211> 1266
<212> DNA
<213> Achromobacter xylosoxidans
<400> 144
atgaaaaatc aggatctgaa tacccgtcgt agcctggcaa caccgcgtgg tgtgggtgtt 60
atgtgtgatt tttatgcagt tcgtgcagaa aatgcaaccc tgtgggatgc aaatggcaaa 120
gaatatattg attttgccgg tggtattgcc gtgctgaata ccggtcatct gcatccgaaa 180
atcaaagcag cagttgcagc acagctggat aactttaccc ataccgcata tcagattgtt 240
ccgtatgaag gttatgttag cctggccgaa cgtattaatc gtctggcacc gattgatggt 300
ctgaaaaaat cagcattttt taccaccggt gtggaagcag ttgaaaatgc agttaaaatt 360
gcacgtagcg caaccggtcg tagcggtgtt attgcattta gcggtagctt tcatggtcgt 420
accatgctgg gtatggcact gaccggtaaa gttgcaccgt ataaactgag ctttggtccg 480
atgcctggtg atatttatca tgttccgttt ccgaatgcca cccagagcat tagcgttgca 540
gatagcctga aagcactgga tctgctgttt aaatgtgata ttgatccgaa acgtgtggca 600
gccattatta tcgaaccggt gcagggtgaa ggtggtttta acattacccc tccggaactg 660
atgaccgcac tgcgtaaagt ttgtgatgaa catggtattc tgctgattgc agatgaagtt 720
cagaccggtt ttggtcgcac cggtaaactg tttgcaatgg aacatcatag cgttcaggca 780
gatctgatta ccatggcaaa aagcctgggt ggtggttttc cgattagcgg tgtggttggt 840
cgtgcagatg ttatggatgc accggcagcg ggtggtctgg gtggtacata tgcaggtaat 900
ccgctggcag ttgccgcagc acatgcagtt ctggatgtta ttgccgaaga aaaactgtgt 960
gaacgtgccg atgcactggg cgataaactg cgtgcacatc tggaaggtct gcgtgcaaaa 1020
gttccgggta ttgcggatgt tcgcggtctg ggtagcatgg ttgcactgga actgaatgat 1080
ccggcaaccg gcaaaccgga tgccgaagca gttaaacgtg ttcaggcacg tgcgattgaa 1140
aaaggtctga ttctgctgtc atgtggtgtt tatggtaatg ttctgcgttt tctgtatccg 1200
ctgaccattc cggatgcaca gtttgatcgt gcactggcaa ttctgagcga agcactggca 1260
gcatag 1266
<210> 145
<211> 1198
<212> DNA
<213> Achromobacter xylosoxidans
<400> 145
tttttatgca gttcgtgcag aaaatgcaac cctgtgggat gcaaatggca aagaatatat 60
tgattttgcc ggtggtattg ccgtgctgaa taccggtcat ctgcatccga aaatcaaagc 120
agcagttgca gcacagctgg ataactttac ccataccgca tatcagattg ttccgtatga 180
aggttatgtt agcctggccg aacgtattaa tcgtctggca ccgattgatg gtctgaaaaa 240
atcagcattt tttaccaccg gtgtggaagc agttgaaaat gcagttaaaa ttgcacgtag 300
cgcaaccggt cgtagcggtg ttattgcatt tagcggtagc tttcatggtc gtaccatgct 360
gggtatggca ctgaccggta aagttgcacc gtataaactg agctttggtc cgatgcctgg 420
tgatatttat catgttccgt ttccgaatgc cacccagagc attagcgttg cagatagcct 480
gaaagcactg gatctgctgt ttaaatgtga tattgatccg aaacgtgtgg cagccattat 540
tatcgaaccg gtgcagggtg aaggtggttt taacattacc cctccggaac tgatgaccgc 600
actgcgtaaa gtttgtgatg aacatggtat tctgctgatt gcagatgaag ttcagaccgg 660
ttttggtcgc accggtaaac tgtttgcaat ggaacatcat agcgttcagg cagatctgat 720
taccatggca aaaagcctgg gtggtggttt tccgattagc ggtgtggttg gtcgtgcaga 780
tgttatggat gcaccggcag cgggtggtct gggtggtaca tatgcaggta atccgctggc 840
agttgccgca gcacatgcag ttctggatgt tattgccgaa gaaaaactgt gtgaacgtgc 900
cgatgcactg ggcgataaac tgcgtgcaca tctggaaggt ctgcgtgcaa aagttccggg 960
tattgcggat gttcgcggtc tgggtagcat ggttgcactg gaactgaatg atccggcaac 1020
cggcaaaccg gatgccgaag cagttaaacg tgttcaggca cgtgcgattg aaaaaggtct 1080
gattctgctg tcatgtggtg tttatggtaa tgttctgcgt tttctgtatc cgctgaccat 1140
tccggatgca cagtttgatc gtgcactggc aattctgagc gaagcactgg cagcataa 1198
<210> 146
<211> 1266
<212> DNA
<213> Achromobacter xylosoxidans
<400> 146
atgaaaaatc aggacttaaa cacccgtcgc agcttagcca ctcctcgcgg ggtcggggtc 60
atgtgcgact tctatgcagt gcgtgccgag aacgcgacgc tgtgggatgc caacggcaaa 120
gaatatatcg attttgcggg cggtattgcc gtgttgaata cgggccacct gcatcctaag 180
ataaaggcag ctgtcgcggc gcaactggat aatttcacgc acaccgcata tcaaatcgta 240
ccatacgaag ggtacgtatc gctggccgaa agaattaacc gtttggcccc gattgacggt 300
ctaaaaaaaa gcgcgttttt cacaaccggt gtggaagcag tcgaaaacgc ggtaaaaatc 360
gcgcgtagcg ccactggccg ctccggtgtt atcgcgttca gcggaagttt ccatggccgc 420
actatgttag gcatggcgct gactgggaaa gttgcgccgt ataaactgag ctttgggccg 480
atgcctggcg atatttatca cgttccattc cctaacgcca ctcagtctat ttcagtcgcc 540
gattctttga aagcattaga cctgctgttt aaatgcgata ttgatcccaa acgcgtagca 600
gccataatta ttgagccggt tcagggagag ggcggcttca atatcacacc accggaactc 660
atgacggccc tgcgtaaggt atgcgacgaa catggtattc tcctgattgc agatgaagta 720
cagaccggat ttggccgcac cggtaaactg tttgctatgg agcaccactc tgtgcaagct 780
gatctgatca cgatggccaa aagtttaggc ggtggcttcc cgatctctgg cgtagtgggt 840
cgggcagatg tcatggatgc gcccgcagcg ggagggttag gtggtactta tgctggtaat 900
cctttggctg tagcagcagc gcacgcagtt cttgacgtga ttgcagaaga aaagttatgt 960
gaacgcgccg atgcattagg tgacaaattg cgggcacatc tggagggtct gcgcgcgaaa 1020
gttcctggca ttgcggatgt ccgcggtttg ggcagcatgg tggcactgga actgaacgac 1080
ccggctacgg gcaaacccga cgcagaagcc gtaaaacgtg ttcaggcgcg tgccattgaa 1140
aaaggcttaa ttttactgag ctgcggcgtc tacgggaatg tgttacgttt cctgtacccg 1200
ctgaccattc cggatgcgca atttgaccgg gccttagcga ttctgtctga ggccctggca 1260
gcatag 1266
Claims (51)
- 서열번호 1의 아미노산의 적어도 하나의 변경을 포함하는 조작된 트랜스아미나아제(TA) 효소.
- 서열번호 13 또는 서열번호 31의 아미노산의 적어도 하나의 변경을 포함하는 조작된 트랜스아미나아제(TA) 효소.
- 제1항 또는 제2항에 있어서, 상기 조작된 트랜스아미나아제 효소는
a) 아디페이트 세미알데하이드 기질로부터 6-아미노카프로산을 형성하는 것;
b) 야생형 트랜스아미나아제와 비교하여 더 큰 비율로 아디페이트 세미알데하이드 기질로부터 6-아미노카프로산을 형성하는 것;
c) 야생형 트랜스아미나아제와 비교하여 아디페이트 세미알데하이드 기질에 대해 더 높은 친화력을 갖는 것; 또는
d) a), b), 및 c)의 임의의 조합
을 가능하게 하는 것인 조작된 TA. - 제1항 또는 제3항에 있어서, 서열번호 1의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392 또는 이들의 조합으로부터 선택된 하나 이상의 위치에서 하나 이상의 아미노산 변경을 포함하는 조작된 TA.
- 제1항, 제3항 및 제4항 중 어느 한 항에 있어서, 상기 조작된 트랜스아미나아제는 서열번호 1의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, G17, M21, A50, A76, Y77, Q78, I79, G84, F107, T108, K119, G139, M142, A152, P153, E205, G209, G211, D238, M285, A290, G291, G292, L293, Y297, M353, S387, S388, 및 G392 또는 이들의 조합으로부터 선택된 하나 이상의 위치에서 하나 이상의 아미노산 변경을 포함하며, 이는 보존적 아미노산 변경인 조작된 TA.
- 제1항 및 제3항 내지 제5항 중 어느 한 항에 있어서, 상기 조작된 트랜스아미나아제는 서열번호 1의 잔기 V114, S136, T148, P153, I203, I204, P206, V207, V111, T216, A237, T264, M265, L386, G19, C22, D70, R94, D99, T109, E112, A113, F137, G144, I149, K150, Y154, S178, L186, Q208, L234, T242, A315, K318, R338, G336, L386, V390, A406, S416, A421, 또는 이들의 조합으로부터 선택된 하나 이상의 위치에서 하나 이상의 아미노산 변경을 포함하며, 이는 비보존적 아미노산 변경인 조작된 TA.
- 제1항 및 제3항 내지 제6항 중 어느 한 항에 있어서, 조작된 단백질의 상기 적어도 하나의 아미노산 변경은 서열번호 1의 표 5 및 이들의 조합으로부터 선택된 변경인 조작된 TA.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 아미노산 변경은 서열번호 1, 13, 또는 31의 적어도 2, 3, 4, 5, 6, 7, 8개 또는 그 이상의 아미노산을 포함하는 것인 조작된 TA.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 아미노산 위치는 서열번호 1, 13, 또는 31의 적어도 2, 3, 4, 5, 6, 7, 8개 또는 그 이상의 아미노산 위치를 포함하는 것인 조작된 TA.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 아미노산 변경이 없는 서열번호 1, 13, 또는 31의 트랜스아미나아제의 활성보다 적어도 20% 더 높은 활성을 포함하는 조작된 TA.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 3-옥소아디필-CoA 티올라아제, 3-옥소아디필-CoA 데하이드로게나아제, 및 3-옥소아디필-CoA 데하이드라타아제를 인코딩하는 유전자를 포함하는 세포에서 상기 조작된 TA의 발현을 추가로 포함하는 조작된 TA로서, 이는 상기 조작된 TA가 유래된 야생형 TA를 발현시키는 대조 세포보다 적어도 10% 더 많은 6ACA를 제조할 수 있는 것인 조작된 TA.
- 제1항 내지 제11항 중 어느 한 항의 조작된 트랜스아미나아제를 인코딩하는 핵산.
- 제12항에 있어서, 조작된 TA를 인코딩하는 핵산 서열은 이종 프로모터에 작동 가능하게 연결된 것인 핵산 분자.
- 제13항의 핵산 분자를 포함하는 벡터.
- 제1항 내지 제14항 중 어느 한 항의 조작된 트랜스아미나아제를 포함하는 조작된 세포.
- 적어도 하나의 외인성 효소를 포함하는 비천연 미생물 유기체로서, 상기 적어도 하나의 외인성 효소는 아디페이트 세미알데하이드를 6-아미노카프로산으로 전환시키는 트랜스아미나아제 효소를 포함하며, 상기 트랜스아미나아제는
(i) 서열번호 1, 3, 4, 5, 9, 12, 13, 26, 27, 30, 31, 38, 50, 52, 64, 74, 78, 79, 81, 91, 106, 108, 및 116 중 어느 하나의 25개 이상의 인접 아미노산과 적어도 50% 서열 동일성을 갖는 아미노산 서열을 포함하는 트랜스아미나아제; 또는
(ii) 제1항 내지 제15항 중 어느 한 항의 조작된 TA
로부터 선택되는 것인 비천연 미생물 유기체. - 제16항에 있어서, 6-아미노카프로산 경로, 6-하이드록시카프로산 경로, 헥사메틸렌디아민 경로, 카프로락톤 경로, 또는 카프로락탐 경로를 포함하는 비천연 미생물 유기체.
- 제16항 또는 제17항에 있어서, TA 효소를 인코딩하는 적어도 하나의 외인성 핵산은 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
- 제16항 내지 제18항 중 어느 한 항에 있어서, 6-아미노카프로산 경로를 포함하는 비천연 미생물 유기체.
- 제19항에 있어서, 상기 6-아미노카프로산 경로는 (i) 5-카복시-2-펜테노일-CoA 리덕타아제, (ii) 6-아미노카프로에이트 데하이드로게나아제, (iii) 6-아미노카프로에이트 트랜스아미나아제, 또는 (iv) 효소 (i) 내지 (iii) 중 하나 이상의 조합을 포함하는 것인 비천연 미생물 유기체.
- 제16항 내지 제20항 중 어느 한 항에 있어서, 6-아미노카프로산 경로 효소 중 하나 이상을 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함하는 비천연 미생물 유기체.
- 제21항에 있어서, 상기 6-아미노카프로산 경로 효소 중 하나 이상을 인코딩하는 상기 외인성 핵산은 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
- 제16항 내지 제22항 중 어느 한 항에 있어서, 헥사메틸렌디아민 경로를 포함하는 비천연 미생물 유기체.
- 제23항에 있어서, 상기 헥사메틸렌디아민 경로는 (i) 6-아미노아카프로일 CoA 트랜스퍼라아제, (ii) 6-아미노카프로일 CoA 신타아제, (iii) 6-아미노카프로일 CoA 리덕타아제, (iv) 헥사메틸렌디아민 트랜스아미나아제, (v) 헥사메틸렌디아민 데하이드로게나아제, 또는 (v) 효소 (i) 내지 (v) 중 하나 이상의 조합을 포함하는 것인 비천연 미생물 유기체.
- 제16항 내지 제24항 중 어느 한 항에 있어서, 상기 헥사메틸렌디아민 경로 효소 중 하나 이상을 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함하는 비천연 미생물 유기체.
- 제25항에 있어서, 상기 헥사메틸렌디아민 경로 효소 중 하나 이상을 인코딩하는 상기 외인성 핵산은 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
- 제16항 내지 제26항 중 어느 한 항에 있어서, 카프로락탐 경로를 포함하는 비천연 미생물 유기체.
- 제27항에 있어서, 상기 카프로락탐 경로는 아미노하이드롤라아제 효소를 포함하는 것인 비천연 미생물 유기체.
- 제16항 내지 제28항 중 어느 한 항에 있어서, 아미노하이드롤라아제 효소를 인코딩하는 하나 이상의 추가 외인성 핵산을 추가로 포함하는 비천연 미생물 유기체.
- 제29항에 있어서, 아미노하이드롤라아제 효소를 인코딩하는 상기 외인성 핵산은 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
- 제16항 내지 제30항 중 어느 한 항에 있어서, 아디페이트 세미알데하이드와 반응하여 6-아미노카프로산을 형성하는 상기 트랜스아미나아제 효소를 인코딩하는 적어도 하나의 외인성 핵산은 비천연 미생물 유기체에 대해 이종인 것인 비천연 미생물 유기체.
- 제16항 내지 제31항 중 어느 한 항에 있어서, 대조군 미생물 유기체가 상기 트랜스아미나아제 효소를 인코딩하는 상기 외인성 핵산을 포함하지 않는 것을 제외하고 상기 비천연 미생물 유기체와 실질적으로 동일한 대조군 미생물 유기체보다 더 많은 아디페이트 세미알데하이드를 6-아미노카프로산으로 전환시키는 비천연 미생물 유기체.
- 제16항 내지 제32항 중 어느 한 항에 있어서, 상기 TA는 박테리아, 효모, 진균, 조류, 동물, 또는 식물 종으로부터 유래된 것인 비천연 미생물 유기체.
- 제16항 내지 제33항 중 어느 한 항에 있어서, 아시네토박터(Acinetobacter), 악티노바실러스(Actinobacillus), 아나에로바이오스필리룸(Anaerobiospirillum), 아스페르길루스(Aspergillus), 바실루스(Bacillus), 클로스트리듐(Clostridium), 코리네박테리움(Corynebacterium), 에셔리키아(Escherichia), 글루코노박터(Gluconobacter), 클렙시엘라(Klebsiella), 클루베로마이세스(Kluyveromyces), 락토코쿠스(Lactococcus), 락토바실루스(Lactobacillus), 만헤이미아(Mannheimia), 피키아(Pichia), 슈도모나스(Pseudomonas), 리조비움(Rhizobium), 리조푸스(Rhizopus), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 스트렙토마이세스(Streptomyces) 및 자이모모나스(Zymomonas)의 종을 포함하는 비천연 미생물 유기체.
- 제16항 내지 제34항 중 어느 한 항에 있어서, 상기 TA는 아르트로박터(Arthrobacter), 파에나트로박터(Paenarthrobacter), 사카로마이세스(Saccharomyces), 클로스트리듐(Clostridium), 굴로시박터(Gulosibacter), 코쿠리아(Kocuria), 슈도모나스(Pseudomonas) 및 알칼리게네스로(Alcaligenes)부터 유래된 것인 비천연 미생물 유기체.
- 제12항 내지 제15항 중 어느 한 항에 따른 핵산 분자로 형질전환된 숙주 세포.
- 제36항에 있어서, 아시네토박터, 악티노바실러스, 아나에로바이오스필리룸, 아스페르길루스, 바실루스, 클로스트리듐, 코리네박테리움, 에셔리키아, 글루코노박터, 클렙시엘라, 클루베로마이세스, 락토코쿠스, 락토바실루스, 만헤이미아, 피키아, 슈도모나스, 리조비움, 리조푸스, 사카로마이세스, 스키조사카로마이세스, 스트렙토마이세스 및 자이모모나스의 종을 포함하는 숙주 세포.
- 제16항 내지 제37항 중 어느 한 항에 있어서, 상기 비천연 미생물 유기체는 2, 3, 4, 5, 6, 7개 또는 그 이상의 외인성 핵산을 포함하며, 각각은 6-아미노카프로산 경로, 헥사메틸렌디아민 경로, 카프로락탐 경로, 1,6-헥산디올 경로, 카프로락톤 경로, 또는 2개 이상의 경로의 조합을 위한 효소를 인코딩하는 것인 비천연 미생물 유기체.
- 제16항 내지 제38항 중 어느 한 항에 있어서, 대조군 미생물 유기체 또는 숙주 세포가 외인성 트랜스아미나아제 또는 상기 트랜스아미나아제를 인코딩하는 외인성 핵산 서열을 포함하지 않는 것을 제외하고 상기 비천연 미생물 유기체 또는 숙주 세포와 실질적으로 동일한 대조군 미생물 유기체 또는 숙주 세포에 의해 생성된 것보다 더 많은 아디페이트, 카프로산, 헥사메틸렌디아민, 카프로락톤, 또는 카프로락탐 중 하나 이상을 생성하는 비천연 미생물 유기체 또는 숙주 세포.
- 6-아미노카프로산을 제조하는 방법으로서,
6-아미노카프로산을 제조하기 위한 충분한 기간 및 조건으로 제16항 내지 제39항 중 어느 한 항의 비천연 미생물 유기체 또는 숙주 세포를 배양하는 단계
를 포함하는 제조 방법. - 제40항에 있어서, 비천연 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 6-아미노카프로산을 회수하는 단계를 추가로 포함하는 제조 방법.
- 헥사메틸렌디아민을 제조하는 방법으로서,
헥사메틸렌디아민을 제조하기 위한 충분한 기간 및 조건으로 제16항 내지 제39항 중 어느 한 항의 비천연 미생물 유기체 또는 숙주 세포를 배양하는 단계
를 포함하는 제조 방법. - 제42항에 있어서, 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 헥사메틸렌디아민을 회수하는 단계를 추가로 포함하는 제조 방법.
- 제40항 내지 제43항 중 어느 한 항에 있어서, 상기 미생물 유기체 또는 숙주 세포는 2, 3, 4, 5, 6, 7개 또는 그 이상의 외인성 핵산 서열을 포함하며, 각각은 헥사메틸렌디아민 경로 효소를 인코딩하는 것인 제조 방법.
- 카프로락탐을 제조하는 방법으로서,
카프로락탐을 제조하기 위한 충분한 기간 및 조건으로 제16항 내지 제39항 중 어느 한 항의 비천연 미생물 유기체를 배양하는 단계
를 포함하는 제조 방법. - 제45항에 있어서, 비천연 미생물 유기체, 발효 브로쓰, 또는 둘 모두로부터 카프로락탐을 회수하는 단계를 추가로 포함하는 제조 방법.
- 제40항 내지 제46항 중 어느 한 항에 있어서, 상기 미생물 유기체는, 2, 3, 4, 5, 6 또는 7개의 외인성 핵산 서열을 포함하며, 각각은 카프로락탐 경로 효소를 인코딩하는 것인 제조 방법.
- 제40항 내지 제47항 중 어느 한 항에 있어서, 배양이 당을 포함하는 발효 브로쓰에서 수행되는 것인 제조 방법.
- 제40항 내지 제48항 중 어느 한 항에 있어서, 상기 비천연 미생물은 아시네토박터, 악티노바실러스, 아나에로바이오스필리룸, 아스페르길루스, 바실루스, 클로스트리듐, 코리네박테리움, 에셔리키아, 글루코노박터, 클렙시엘라, 클루베로마이세스, 락토코쿠스, 락토바실루스, 만헤이미아, 피키아, 슈도모나스, 리조비움, 리조푸스, 사카로마이세스, 스키조사카로마이세스, 스트렙토마이세스, 및 자이모모나스의 종을 포함하는 것인 제조 방법.
- 제40항 내지 제49항 중 어느 한 항의 방법으로 합성된 생체 유래, 아디페이트, 6-아미노카프로산, 헥사메틸렌디아민, 카프로락톤, 또는 카프로락탐.
- 제50항의 아디페이트, 카프로산, 헥사메틸렌디아민, 카프로락톤, 또는 카프로락탐의 용도.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962837888P | 2019-04-24 | 2019-04-24 | |
US62/837,888 | 2019-04-24 | ||
US201962860160P | 2019-06-11 | 2019-06-11 | |
US201962860123P | 2019-06-11 | 2019-06-11 | |
US62/860,160 | 2019-06-11 | ||
US62/860,123 | 2019-06-11 | ||
PCT/US2020/029797 WO2020219866A1 (en) | 2019-04-24 | 2020-04-24 | Engineered transaminase and methods of making and using |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220023339A true KR20220023339A (ko) | 2022-03-02 |
Family
ID=70740755
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217038307A KR20220023339A (ko) | 2019-04-24 | 2020-04-24 | 조작된 트랜스아미나아제 및 제조 및 사용 방법 |
KR1020217038305A KR20220023757A (ko) | 2019-04-24 | 2020-04-24 | 알데하이드 데하이드로게나아제 활성을 개선하기 위한 조작된 미생물 및 방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217038305A KR20220023757A (ko) | 2019-04-24 | 2020-04-24 | 알데하이드 데하이드로게나아제 활성을 개선하기 위한 조작된 미생물 및 방법 |
Country Status (10)
Country | Link |
---|---|
US (3) | US20220348890A1 (ko) |
EP (3) | EP3959327A1 (ko) |
JP (1) | JP2022530475A (ko) |
KR (2) | KR20220023339A (ko) |
CN (2) | CN114341344A (ko) |
AU (1) | AU2020262938A1 (ko) |
BR (1) | BR112021021294A2 (ko) |
CA (1) | CA3137571A1 (ko) |
SG (1) | SG11202111575WA (ko) |
WO (3) | WO2020219859A1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2020005324A (es) * | 2017-11-30 | 2020-08-13 | Toray Industries | Microorganismo modificado geneticamente para producir acido 3-hidroxidadipico, acido alfa-hidromuconico y/o acido adipico, y metodo de produccion para tales productos quimicos. |
KR20230159611A (ko) | 2021-03-30 | 2023-11-21 | 아사히 가세이 가부시키가이샤 | 재조합 미생물 및 c6 화합물의 제조 방법 |
WO2023076966A1 (en) * | 2021-10-27 | 2023-05-04 | Genomatica, Inc. | Engineered enzymes and methods of making and using |
CN114940950B (zh) * | 2022-03-28 | 2023-07-07 | 北京科技大学 | 一种丁酸梭菌发酵废液资源化利用的方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7947483B2 (en) | 2007-08-10 | 2011-05-24 | Genomatica, Inc. | Methods and organisms for the growth-coupled production of 1,4-butanediol |
RU2496880C2 (ru) * | 2008-12-12 | 2013-10-27 | СЕЛЕКСИОН, ЭлЭлСи | Биологический синтез дифункциональных алканов из альфа-кетокислот |
EP2427544B1 (en) * | 2009-05-07 | 2019-07-17 | Genomatica, Inc. | Microorganisms and methods for the biosynthesis of adipate, hexamethylenediamine and 6-aminocaproic acid |
WO2012089613A1 (en) * | 2010-12-28 | 2012-07-05 | Dsm Ip Assets B.V. | Process to increase the production of a succinyl-coa derived compound |
MY197970A (en) * | 2011-11-02 | 2023-07-25 | Genomatica Inc | Microorganisms and methods for the production of caprolactone |
BR112017013748A2 (pt) * | 2014-12-23 | 2018-03-13 | Genomatica Inc | método de produção & processamento de diaminas |
US20190300918A1 (en) * | 2015-06-23 | 2019-10-03 | Genomatica, Inc. | Microorganisms and methods for the production of biosynthesized target products having reduced levels of byproducts |
-
2020
- 2020-04-24 EP EP20730132.6A patent/EP3959327A1/en active Pending
- 2020-04-24 BR BR112021021294A patent/BR112021021294A2/pt unknown
- 2020-04-24 WO PCT/US2020/029788 patent/WO2020219859A1/en unknown
- 2020-04-24 US US17/605,499 patent/US20220348890A1/en active Pending
- 2020-04-24 AU AU2020262938A patent/AU2020262938A1/en active Pending
- 2020-04-24 KR KR1020217038307A patent/KR20220023339A/ko active Search and Examination
- 2020-04-24 WO PCT/US2020/029797 patent/WO2020219866A1/en unknown
- 2020-04-24 CA CA3137571A patent/CA3137571A1/en active Pending
- 2020-04-24 CN CN202080046801.5A patent/CN114341344A/zh active Pending
- 2020-04-24 CN CN202080046640.XA patent/CN114269908A/zh active Pending
- 2020-04-24 EP EP20726596.8A patent/EP3959310A1/en active Pending
- 2020-04-24 US US17/605,196 patent/US20220235385A1/en active Pending
- 2020-04-24 US US17/605,120 patent/US20220333142A1/en active Pending
- 2020-04-24 JP JP2021563375A patent/JP2022530475A/ja active Pending
- 2020-04-24 SG SG11202111575WA patent/SG11202111575WA/en unknown
- 2020-04-24 KR KR1020217038305A patent/KR20220023757A/ko active Search and Examination
- 2020-04-24 EP EP20728259.1A patent/EP3959309A1/en active Pending
- 2020-04-24 WO PCT/US2020/029793 patent/WO2020219863A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP3959327A1 (en) | 2022-03-02 |
US20220333142A1 (en) | 2022-10-20 |
CA3137571A1 (en) | 2020-10-29 |
CN114341344A (zh) | 2022-04-12 |
KR20220023757A (ko) | 2022-03-02 |
WO2020219863A1 (en) | 2020-10-29 |
JP2022530475A (ja) | 2022-06-29 |
EP3959310A1 (en) | 2022-03-02 |
CN114269908A (zh) | 2022-04-01 |
EP3959309A1 (en) | 2022-03-02 |
WO2020219866A1 (en) | 2020-10-29 |
US20220348890A1 (en) | 2022-11-03 |
SG11202111575WA (en) | 2021-11-29 |
BR112021021294A2 (pt) | 2022-03-29 |
US20220235385A1 (en) | 2022-07-28 |
WO2020219859A1 (en) | 2020-10-29 |
AU2020262938A1 (en) | 2021-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7370366B2 (ja) | アジペート、ヘキサメチレンジアミン、及び6-アミノカプロン酸の生合成のための微生物及び方法 | |
US10415063B2 (en) | Semi-synthetic terephthalic acid via microorganisms that produce muconic acid | |
US9023636B2 (en) | Microorganisms and methods for the biosynthesis of propylene | |
US20220348890A1 (en) | Engineered transaminase and methods of making and using | |
EP2491125A1 (en) | Microorganisms for the production of aniline | |
CN113179645A (zh) | 醛脱氢酶变体及其使用方法 | |
US20230348865A1 (en) | Engineered enzymes and methods of making and using | |
WO2023076966A1 (en) | Engineered enzymes and methods of making and using | |
JP2024503868A (ja) | アミド化合物を生成する方法および組成物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |