KR20110098936A - 범용화학제품의 생합성 - Google Patents
범용화학제품의 생합성 Download PDFInfo
- Publication number
- KR20110098936A KR20110098936A KR1020117015344A KR20117015344A KR20110098936A KR 20110098936 A KR20110098936 A KR 20110098936A KR 1020117015344 A KR1020117015344 A KR 1020117015344A KR 20117015344 A KR20117015344 A KR 20117015344A KR 20110098936 A KR20110098936 A KR 20110098936A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- gly
- seq
- leu
- polypeptide
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
- C12P7/26—Ketones
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/30—Fuel from waste, e.g. synthetic alcohol or diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T50/00—Aeronautics or air transport
- Y02T50/60—Efficient propulsion technologies, e.g. for aircraft
- Y02T50/678—Aviation using fuels of non-fossil origin
Landscapes
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
바이오매스로부터 유래된 것과 같은 적합한 단당류 또는 올리고당, 뿐만 아니라 다양한 알데히드 및/또는 케톤을 바이오연료와 같은 범용화학제품으로 전환시키기 위한 방법, 효소, 재조합 미생물 및 미생물 시스템이 제공된다. 여기에 기술된 방법에 의해 생성된 범용화학제품도 또한 제공된다. 범용화학제품 농축, 정제소-생산 석유 제품 뿐만 아니라 이것을 생산하는 방법도 또한 제공된다.
Description
관련 명세서에 대한 교차 참고
본 명세서는 2008년 12월 11에 출원된 미국 가출원 특허 제 61/121,869호의 35 U.S.C. §119(e)하의 이익을 주장하며, 이 출원의 전체내용은 참고로 여기서 포함된다.
서열 리스트에 대한 의견
본 출원과 연관된 서열 목록은 종이 카피 대신에 텍스트 형식으로 제공되고, 본 명세서내에 참고로 포함된다. 서열 목록이 포함된 텍스트 파일의 이름은 150097_403_SEQUENCE_LISTING.txt이다. 텍스트 파일은 178 KB이고 2009년 12월 11일에 생성되었고, EFS-Web을 통해 전자문서로 제출되었다.
본 출원은 일반적으로 알데히드 및/또는 케톤을 다양한 범용화학제품(commodity chemical) 또는 이소옥탄과 같은 바이오연료로 전환하는 재조합 미생물 및 화학/효소학적 시스템의 용도에 관한 것이다.
석유는 감소하고 있는 세계 매장량을 직면하고 있고 지구를 따뜻하게 하는 온실 가스 배출의 30% 이상에 기여한다. 연간 수송 연료의 8000억 배럴이 전세계적으로 소비되고 있다. 디젤 및 제트 연료는 지구전체 수송 연료의 50% 이상을 차지한다.
연료 생산자들에게 수송 연료의 생산 및 사용으로부터 탄소 배출의 상한을 정하거나 감소하도록 요구하는 중요한 법률이 통과하였다. 연료 생산자들은 현행 기반구조(예, 정제소, 파이프라인, 급유기)를 통해 혼합되고 분배될 수 있는 실질적으로 유사한 저탄소 연료를 찾고 있다.
증가하는 석유값 및 석유화학 공급원료의 의존도에 기인하여, 화학산업은 그의 환경적 족적을 감소시키면서, 마진 및 가격 안정성을 향상시키는 방법을 또한 추구하고 있다. 화학산업은 현재의 제품보다 보다 효율적인 많은 에너지, 물 및 CO2를 갖는 친환경 제품의 개발에 힘쓰고 있다. 바이오매스와 같은 생물 근원으로부터 생산된 연료는 그런 프로세스의 한 면을 나타낸다.
바이오매스를 바이오연료로 전환하는 다수의 현재 방법들은 목질 섬유소 바이오매스의 사용에 집중하고 있다. 그러나, 이들 프로세스 사용과 연관된 여러 문제들이 존재한다. 목질 섬유소 바이오매스의 대량 경작은 상당한 양의 경작농지가 필요하고, 이것은 식품 농작물 생산을 에너지 작물 생산, 산림벌채로 대체하거나, 경작되지 않은 토지를 재경작함으로써 이루어질 수 있다. 다른 문제는 물의 가용성 및 품질의 감소 뿐만 아니라 살충제 및 비료 사용의 증가를 포함한다.
생물학적 시스템을 사용하여 목질 섬유소 바이오매스의 분해는 그것의 실질적인 기계적 힘 및 복합 화학 성분에 기인하여 상당한 도전을 나타낸다. 약 30개의 다른 효소가 목질 섬유소를 단당류로 완전히 전환시키는데 필요하다. 이 복합 접근법의 유일하게 이용가능한 다른 대안은 상당량의 열, 압력, 및 강산을 필요로한다. 그러므로 상기 기술은 바이오매스를 바이오연료 또는 바이오패트롤을 위한 탄화수소로 전환하기 위해서 경제적이고 기술적으로 간단한 프로세스를 필요로 한다. 미국 특허 출원 제 12/245,537호 및 12/245,540호는 바이오매스로부터 다양한 바이오연료를 생성하는 재조합 미생물의 사용을 기술하고 있으며, 또한 바이오매스 유래 당류로부터 부틸알데히드 및 이소부틸알데히드등의 다양한 알데히드를 생성하는 재조합 미생물의 사용을 기술하고 있다.
또한 이소옥탄으로 알려진 2,2,4-트리메틸펜탄은 옥탄 평가 척도에서 100포인트를 정의하는 옥탄 이성질체이다. 이소옥탄은 가솔린의 중요한 성분을 나타낸다. 이소옥탄은 흔히 관련된 탄화수소와의 혼합물로서 석유 산업에서 대규모로 생성되고 있다. 석유 산업은 전형적으로 강산 촉매를 사용하여 이소부탄을 이소부틸렌으로 알킬화하는 이소옥탄을 생산하기 위해 알킬화 공정에 의존한다.
더욱이, 현재 석유 매장량은 낮은 옥탄 함량 때문에 가솔린에 대해 점점 덜 유용하며, 또한 옥탄을 첨가하는 능력은 현재의 석유 매장량의 사용성을 증가시킬 수 있다. 따라서, 상기 기술은 다른 관련 바이오연료 뿐만 아니라 이소옥탄을 생산하는 친환경적으로 및 기술적으로 단순한 절차를 필요로 한다.
본 발명의 구현 예들은 알데히드, 케톤 또는 둘 다의 근원으로 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생산하는 방법에 관한 것으로, 여기서 상기 재조합 미생물은 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 포함하고, 여기서 상기 폴리뉴클레오티드의 적어도 하나는 외인성이고 범용화학제품 또는 그의 중간체를 생성한다.
특정한 구현 예에서, 범용화학제품 또는 그의 중간체는 하기 화학식으로부터 선택된다:
상기 식 중, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고; 또한
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고,
n은 0 내지 30이다. 특정한 구현 예에서, 범용화학제품는 그의 상응하는 알칸으로 추가로 효소학적 또는 화학적으로 전환된다.
특정한 구현 예에서, 범용화학제품은 3-하이드록시-2,2,4 트리메틸펜타날 및 2,2,4-트리메틸-1,3-펜탄디올로 이루어진 그룹으로부터 선택된다. 특정한 구현 예에서, 2,2,4-트리메틸-1,3-펜탄디올은 2,2,4-트리메틸펜탄으로 추가로 효소학적 또는 화학적으로 전환된다.
특정한 구현 예에서, 범용화학제품은 3-하이드록시-2-에틸헥사날, 2-에틸-2-헥센-1-알, 2-에틸헥사날, 및 2-에틸헥사놀로 이루어진 그룹으로부터 선택된다. 특정한 구현 예에서, 2-에틸헥사놀은 2-에틸헥산으로 추가로 효소학적으로 또는 화학적으로 전환된다.
특정한 구현 예에서, 범용화학제품은 3-하이드록시-2-부틸-1-옥타놀, 2-부틸-2-옥텐-1-알, 2-부틸-옥타날, 및 2-부틸-옥타놀로 이루어진 그룹으로부터 선택된다. 특정한 구현 예에서, 2-부틸-옥타놀은 2-부틸-옥탄으로 추가로 효소학적으로 또는 화학적으로 전환된다.
특정한 구현 예에서, 알데히드, 케톤 또는 들 다의 근원은 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물이며 상기 생합성 경로는 아세토알데히드, 프로피온알데히드, 글루타르알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 헥산알데히드, 옥탄알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드, 및 숙시네이트 4-하이드록시페닐 아세타알데히드 생합성 경로, 및 그의 조합으로부터 선택된다.
임의의 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물은 범용화학제품을 생성 또는 합성하는 재조합 미생물과 동일하다. 특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물은 범용화학제품을 생성 또는 합성하는 재조합 미생물과 다르다.
특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로는 이소부틸알데히드 생합성 경로를 포함하며 여기서 상기 알데히드는 이소부틸알데히드이다. 특정한 구현 예에서, 상기 알데히드 및/또는 케톤 생합성 경로는 부틸알데히드 생합성 경로를 포함하며, 여기서 상기 알데히드는 부틸알데히드이다. 특정한 구현 예에서, 상기 알데히드 및/또는 케톤 생합성 경로는 헥산알데히드 생합성 경로를 포함하며 여기서 상기 알데히드는 헥산알데히드이다.
특정한 구현 예에서, 알돌라제 활성을 가지는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드가 (i) SEQ ID NOS:51-82 로 나타낸 적어도 하나의 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열 또는 (ii)중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체(complement)를 포함한다. 특정한 구현 예에서, 알돌라제 활성을 갖는 폴리펩티드는 SEQ ID NOS:223-244, 255-260로 나타낸 아미노산 서열로부터 선택되는 적어도 하나의 생물학적으로 활성이 있는 모티프를 포함한다.
특정한 구현 예에서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딘 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드가 (i) SEQ ID NOS: 1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시의 조건하에서 SEQ ID NOS:1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다. 특정한 구현 예에서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드가 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드 (NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NADP+), 또는 NADPH 결합 모티프를 포함한다. 특정한 구현 예에서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프는 Y-X- G-G-X-Y (SEQ ID NO:245), Y-X-X-G-G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X- Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X-G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y-X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X- X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택되며; 여기서 Y는 알라닌, 글리신, 및 세린으로부터 독립적으로 선택되고, G는 글리신이고, 또한 X는 유전적으로 인코딩된 아미노산으로부터 독립적으로 선택된다
특정한 구현 예에서, 재조합 미생물은 추가로 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함한다. 특정한 구현 예에서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 (i) SEQ ID NOS:35-50으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii)중간 스트린전시의 조건하에서 SEQ ID NOS:35-50으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다.
본 발명의 구현 예는 또한 일반적으로 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 포함하는 재조합 미생물에 관한 것이다.
특정한 구현 예에서, 재조합 미생물은 알데히드, 케톤 또는 둘 다의 근원을 범용화학제품 또는 그의 중간체로 전환시킬 수 있고, 여기서 범용화학제품 또는 그의 중간체는 하기의 화학식으로부터 선택되고:
상기 식에서,
R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
n은 0 내지 30이다.
특정한 구현 예에서, 재조합 미생물은 (iii) 알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 추가로 포함한다. 특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 추가로 포함하는 미생물은 적합한 단당류 또는 적합한 올리고당을 범용화학제품 또는 그의 중간체로 전환시킬 수 있고, 여기서 범용화학제품 또는 그의 중간체는 하기의 화학식으로부터 선택되고:
상기 식에서,
R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
n은 0 내지 30이다.
특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 아세토알데히드, 프로피온알데히드, 글루타르알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 헥산알데히드, 옥탄알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드, 및 숙시네이트 4-하이드록시페닐 아세트알데히드 생합성 경로, 및 그의 조합으로부터 선택된 경로를 포함한다.
특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로는 이소부틸알데히드 생합성 경로를 포함하고, 여기서 상기 알데히드는 이소부틸알데히드이다. 특정한 구현 예에서, 상기 알데히드 및/또는 케톤 생합성 경로는 부틸알데히드 생합성 경로를 포함하고 여기서 상기 알데히드는 부틸알데히드이다. 특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로는 헥산알데히드 생합성 경로를 포함하고 여기서 상기 알데히드는 헥산알데히드이다.
특정한 구현 예에서, 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 (i) SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii)중간 스트린전시의 조건하에서 SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다. 특정한 구현 예에서, 알돌라제 활성을 갖는 폴리펩티드는 SEQ ID NOS:223-244, 255-260으로 나타낸 아미노산 서열로부터 선택된 적어도 하나의 생물학적으로 활성이 있는 모티프를 포함한다.
특정한 구현 예에서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 (i) SEQ ID NOS: 1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시의 조건하에서 SEQ ID NOS:1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다. 특정한 구현 예에서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드는 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드 (NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NADP+), 또는 NADPH 결합 모티프를 포함한다. 특정한 구현 예에서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프는 Y-X-G-G-X-Y (SEQ ID NO:245), Y-X-X-G-G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X-Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X- G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y-X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X-X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택되고;
Y는 알라닌, 글리신, 및 세린으로부터 독립적으로 선택되고,
G는 글리신이고 또한
X는 유전학적으로 인코딩된 아미노산으로부터 독립적으로 선택된다.
특정한 구현 예에서, 재조합 미생물은 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함한다. 특정한 구현 예에서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 (i) SEQ ID NOS:35-50으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시의 조건하에서 SEQ ID NOS:35-50으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다.
본 발명의 구현 예는 또한 일반적으로 적합한 단당류 또는 올리고당 근원으로 첫 번째 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생성하는 방법에 관한 것으로, 여기서 상기 첫 번째 재조합 미생물은 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드, 및 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하며, 상기 폴리뉴클레오티드의 적어도 하나는 외인성이어서 범용화학제품 또는 그의 중간체를 생성한다. 특정한 구현 예에서, 적합한 단당류 또는 올리고당의 근원이 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있는 두 번째 재조합 미생물을 포함한다. 특정한 구현 예에서, 바이오매스-유래 다당류가 알지네이트 및 펙틴으로부터 선택된다.
본 발명의 구현 예는 또한 일반적으로 바이오매스-유래 다당류로 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생성하는 방법에 관한 것이며 여기서, 상기 재조합 미생물은 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있고, 또한 상기 재조합 미생물은 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드; 및 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하며, 여기서 상기 폴리뉴클레오티드의 적어도 하나는 외인성이어서 범용화학제품 또는 그의 중간체를 생성한다. 특정한 구현 예에서, 바이오매스-유래 다당류는 알지네이트 및 펙틴으로부터 선택된다.
본 발명의 구현 예는 또한 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드; 및 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 포함하는 재조합 미생물에 관한 것이다. 특정한 구현 예에서, 재조합 미생물은 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있다.
특정한 구현 예에서, 상기 미생물은 아세토박터 아세티(Acetobacter aceti), 아크로모박터(Achromobacter), 아시디필리움(Acidiphilium), 아시네토박터(Acinetobacter), 악티노마두라(Actinomadura), 악티노플래인(Actinoplanes), 애로피룸 퍼닉스(Aeropyrum pernix), 아그로박테리움(Agrobacterium), 알칼리진(Alcaligenes), 아나나스 코모수스(Ananas comosus)(M), 아스로박터(Arthrobacter), 아스파질러스 니거(Aspargillus nige), 아스파질러스 오리제(Aspargillus oryze), 아스파질러스 멜레우스(Aspergillus melleus), 아스파질러스 퍼브루엔투스(Aspergillus pulverulentus), 아스파질러스 사이토이(Aspergillus saitoi), 아스파질러스 소지(Aspergillus sojea), 아스파질러스 우사이이(Aspergillus usamii), 바실러스 알칼로필러스(Bacillus alcalophilus), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 브레비스(Bacillus brevis), 바실러스 설쿠란스(Bacillus circulans), 바실러스 클로시이(Bacillus clausii), 바실러스 렌터스(Bacillus lentus), 바실러스 리첸니포미스(Bacillus licheniformis), 바실러스 마세란스(Bacillus macerans), 바실러스 스티아로설모필러스(Bacillus stearothermophilus), 바실러스 서브티리스(Bacillus subtilis), 비피도박테리움(Bifidobacterium), 브레비바실러스 브레비스(Brevibacillus brevis), 버크홀데리아 세파시아(Burkholdeha cepacia), 캔디다 실린드라세아(Candida cylindracea), 캔디다 루고사(Candida rugosa), 칼리카 파파야 (Carica papaya)(L), 셀룰로시미크로비움(Cellulosimicrobium), 세팔로스포리움(Cephalospohum), 채토미움 에라티쿰(Chaetomium erraticum), 채토미움 그라사일(Chaetomium gracile), 클로스트리디움(Clostridium), 클로스트리디움 브티리쿰(Clostridium butyricum), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 클로스트리디움 설모셀룸(Clostridium thermocellum), 코리네박테리움 (Corynebacterium)(글루타미쿰), 코리네박테리움 에피시엔스(Corynebacterium efficiens), 이스체리키아 콜라이(Escherichia coli), 엔테로카쿠스(Enterococcus), 어위나 크리산테미(Erwina chrysanthemi), 글리코노박터(Gliconobacter), 글루콘아세토박터(Gluconacetobacter), 할로아큘라(Haloarcula), 휴미콜라 인솔엔스(Humicola insolens), 휴미콜라 엔솔렌스(Humicola nsolens), 키타사토스포라 세태(Kitasatospora setae), 클렙실라(Klebsiella), 클렙실라 옥시토카(Klebsiella oxytoca), 클루이브로마이세스(Kluyveromyces), 클루이브로마이세스 플래길리스(Kluyveromyces fragilis), 클루이브로마이세스 락티스(Kluyveromyces lactis), 코쿠리아(Kocuria), 락트락티스(Lactlactis), 락토바실러스(Lactobacillus), 락토바실러스 퍼멘툼(Lactobacillus fermentum), 락토바실러스 세이크(Lactobacillus sake), 락토코쿠스(Lactococcus), 락토코쿠스 락티스(Lactococcus lactis), 류코노스톡(Leuconostoc), 메틸오시티스(Methylocystis), 메탄노로버스 시실리애(Methanolobus siciliae), 메탄노게니움 오가노필룸(Methanogenium organophilum), 메탄노박테리움 브라이언타이(Methanobactehum bryantii), 마이크로박테리움 임페리얼리(Microbacterium imperiale), 마이크로코쿠스 라이소데익티쿠스(Micrococcus lysodeikticus), 마이크로루나투스(Microlunatus), 뮤콜자바니쿠스(Mucor javanicus), 마이코박터(Mycobacterium), 마이로테시움(Myrothecium), 나이트로박터(Nitrobacter), 나미트로소모나스(Nitrosomonas), 노카디아(Nocardia), 파파야 카리카(Papaya carica), 페디오코쿠스(Pediococcus), 페디오코구스 할로필러스(Pediococcus halophilus), 페니실리움(Penicillium), 페니실리움 카멤버티(Penicillium camemberti), 페니실리움 시트리넘(Penicillium citrinum), 페니실리움 에머소나이(Penicillium emersonii), 페니실리움 로퀘포티(Penicillium roqueforti), 페니실리움 릴락티눔(Penicillum lilactinum), 페니실리움 멀티컬러(Penicillum multicolor), 파라코쿠스 판토트로퍼스(Paracoccus pantotrophus), 프로피온니박테리움(Propionibacterium), 수도모나스(Pseudomonas), 수도모나스 플루오레센스(Pseudomonas fluorescens), 수도모나스 데니트리피칸스(Pseudomonas denithficans), 필오코쿠스(Pyrococcus), 필오코쿠스 퓨리오서스(Pyrococcus furiosus), 필오코쿠스 호리코사이(Pyrococcus hohkoshii), 리조비움(Rhizobium), 리조뮤콜 미헤이(Rhizomucor miehei), 리조뮤콜 퓨실루스 린트(Rhizomucor pusillus Lindt), 리조퍼스(Rhizopus), 리조퍼스 델레마(Rhizopus delemar), 리조퍼스 자폰이쿠스(Rhizopus japonicus), 리조퍼스 니비우스(Rhizopus niveus), 리조퍼스 오리재(Rhizopus oryzae), 리조퍼스 올리고스포러스(Rhizopus oligosporus), 로도코쿠스(Rhodococcus), 사카로마이시스 세레비지애(Sccharomyces cerevisiae), 스클레로티나 리버티나(Sclerotina libertina), 스핑고박테리움 멀티보룸(Sphingobacterium multivorum), 스핑고비움(Sphingobium), 스핑고모나스(Sphingomonas), 스트렙토코쿠스(Streptococcus), 스트렙토코쿠스 서모필루스 Y-1(Streptococcus thermophilus Y-1), 스트렙토마이시스(Streptomyces), 스트렙토마이시스 그리세우스(Streptomyces griseus), 스트렙토마이시스 리비단스(Streptomyces lividans), 스트렙토마이시스 무리누스(Streptomyces murinus), 스트렙토마이시스 루비기노수스(Streptomyces rubiginosus), 스트렙토마이시스 바이오라세오루버(Streptomyces violaceoruber), 스트렙토버티실리움 모바랜스(Streptoverticillium mobaraense), 테트라제노코쿠스(Tetragenococcus), 서머스(Thermus), 티오스패라 판토트로파(Thiosphaera pantotropha), 트라미테스(Trametes), 트리초더마(Trichoderma), 트리초더마 롱지브라키아툼(Trichoderma longibrachiatum), 트리초더마 리에시이(Trichoderma reesei), 트리초더마 비리데(Trichoderma viride), 트리초스포론 페니실라툼(Trichosporon penicillatum), 비브리오 알지노리티쿠스(Vibrio alginolyticus), 잔소모나스(Xanthomonas), 이스트(yeast), 자이고사카로마이시스 룩사이(Zygosaccharomyces rouxii), 자이모모나스(Zymomonas), 및 자미모모누스 모빌리스(Zymomonus mobilis)로부터 선택된다.
본 발명의 구현 예는 또한 여기에 기술된 임의의 방법 또는 재조합 미생물에 의해 생성된 범용화학제품에 관한 것이다. 특정한 구현 예는 또한 여기에 기술된 임의의 범용화학제품 및 정제소에서 생성된 석유 산물을 포함하는 혼합된 범용화학제품을 포함한다. 특정한 구현 예에서, 범용화학제품이 이소옥탄, 2-에틸헥산, 및 2-부틸-옥탄으로부터 선택된다. 특정한 구현 예에서, 정제소에서 생성된 석유 산물이 가솔린, 제트 연료, 및 디젤 연료로부터 선택된다.
본 발명은 또한 (a)여기에 기술된 방법 또는 재조합 미생물에 의해 생산된 임의의 범용화학제품을 정제소에서 생성된 석유 산물과 혼합하여 정제소에서 생성된 석유 산물로 농축된 범용화학제품을 생성함을 포함하는 정제소에서 생성된 석유 산물로 농축된 범용화학제품을 생성하는 방법에 관한 것이다.
발명의 상세한 설명
본 발명의 구현 예는 다양한 범용화학제품 또는 바이오연료의 생산에서 다양한 알데히드 및/또는 케톤을 사용하여 재조합 미생물을 제조할 수 있다는 발견에 관한 것이다. 예를 들어, 알돌라제 활성을 갖는 효소를 인코딩하는 하나 또는 그 이상의 외인성 폴리뉴클레오티드 및 알코올 디하이드로게나제 활성을 갖는 효소를 인코딩하는 하나 또는 그 이상의 외인성 폴리뉴클레오티드의 삽입은 미생물로 하여금 알데히드 및/또는 케톤을 다양한 범용화학제품 또는 그의 중간체로 전환할 수 있게 해준다. 특정한 양상에서, 이들 범용화학제품은 다음에 화학적 또는 효소학적으로 바이오연료를 포함하는 다른 범용화학제품으로 전환될 수 있다. 예를 들어, 그러한 바이오연료는 예를 들어 이소옥탄 및 2-에틸헥산등의 중쇄 내지 장쇄의 알칸을 포함할 수 있다.
특정한 구현 예에서, 여기에 제공된 상기 방법 및 재조합 미생물은 다양한 범용화학제품, 특히 중쇄 내지 장쇄의 탄화수소를 생성하는데 사용할 수 있다. 예를 들어, 본 발명의 재조합 미생물은 일반적으로 하기의 반응을 촉매하는데 사용할 수 있다:
상기 식에서,
R1은 CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2으로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2으로 이루어진 그룹으로부터 선택되고,
n은 0 내지 30이고 임의의 해당하는 알칸이 그것으로부터 생성된다.
전형적으로, 상기에서 예시된 반응에서 왼쪽으로부터 오른쪽으로의 첫 번째 화합물은 같거나 또는 다를 수 있는 두 개의 알데히드 및/또는 케톤의 농축으로부터 생성되며 이들 반응은 여기에 기술되고 당업계에 알려진 바와 같이 알돌라제 활성을 갖는 효소에 의해 촉매될 수 있다.
알돌라제 농축 단계 후, 상기에 예시된 반응에서 첫 번째 단계는 자발적으로 일어나거나 또는 디하드라타제에 의해 촉매될 수 있다. 상기 두 번째 반응은 내생적 이중 결합 리덕타제에 의해 촉매될 수 있거나 또는 외인성 이중 결합 리덕타제 첨가에 의해 강화될 수 있다. 디올 또는 알코올을 생성하는 세 번째 반응은 여기에 기술되고 당업계에 알려진 바와 같이 알코올 디하이드로게나제에 의해 촉매될 수 있다. 따라서, 본 발명의 특정한 재조합 미생물은 외인성 알돌라제, 임의로 외인성 이중 결합 리덕타제 및/또는 외인성 알코올 디하이드로게나제를 포함할 수 있다.
상기 주지된 바와 같이, 이소옥탄으로 알려진 2,2,4-트리메틸펜탄은 옥탄 평가 척도에서 100 포인트를 정의하며 가솔린의 중요 성분을 나타내는 옥탄이성질체이다. 이 분자의 생체 내(in vivo) 생물 합성의 구체적인 일 예로서, 이소옥탄을 생성하는 생합성 경로는 이소부틸알데히드의 근원에 접근하는 재조합 미생물에서 초기화될 수 있다. 특정한 구현 예에서, 이소부틸알데히드는 여기에 기술된 바와 같이 이소부틸알데히드 생합성 경로를 포함하며 또한 적합한 단당류 또는 올리고당을 이소부틸알데히드로 전환할 수 있는 재조합 미생물로부터 수득될 수 있다.
간단하게, 이소부틸알데히드의 근원에 관계없이, 본 발명의 재조합 미생물은 2개 분자의 이소부틸알데히드를 농축하는데 사용되어 알돌라제 활성을 갖는 외인성 효소를 포함하는 재조합 미생물에 의해 생체 내에서 촉매되는 3-하이드록시-2,2,4-트리메틸 펜타날을 형성한다. 특정한 구현 예에서, 3-하이드록시-2,2,4-트리메틸 펜타날은 그 후 알코올 디하이드로게나제(Adh) 활성을 갖는 외인성 효소를 포함하는 재조합 미생물에 의해 쉽게 생체 내에서 2,2,4-트리메틸-1,3-펜탄디올로 환원될 수 있다. 따라서, 특정한 구현 예에서, 알돌라제 효소를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드 및 알코올 디하이드로게나제 효소를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드를 포함하는 재조합 미생물은 사용되어 이소부틸알데히드 근원으로부터 3-하이드록시-2,2,4-트리메틸 펜타날 및 2,2,4-트리메틸-1,3-펜탄디올을 생성할 수 있으며, 이들은 그 후 추가로 이소옥탄으로 전환될 수 있다.
이소옥탄 생산의 마지막 단계에서, 필요에 따라 2,2,4-트리메틸-1,3-펜탄디올은 그 후 화학 또는 효소학적 공정과 같은 다양한 공정에 의해 2,2,4-트리메틸펜탄, 또는 이소옥탄으로 전환될 수 있다. 그런 공정의 일 예는 여기에 기술되고 당업계에 알려진 바와 같이 "수소처리(hydrotreating)"를 포함한다.
알데히드 또는 케톤을 범용화학제품으로 전환하는 부가적인 예로서, 여기서 제공되는 재조합 미생물은 2개 분자의 부틸알데히드를 농축하여 3-하이드록시-2-에틸헥사날을 형성하는데 사용할 수 있으며, 이들은 알돌라제 활성을 갖는 외인성 효소를 포함하는 재조합 미생물에 의해 생체 내에서 촉매 되는 것으로 나타났다. 그 후 3-하이드록시-2-에틸헥사날은 여기에 기술된 바와 같이 자발적으로 또는 효소학적으로 탈수화하여 2-에틸-2-헥센-1-알을 형성할 수 있다. 특정한 구현 예에서, 2-에틸-2-헥센-1-알은 그 후 연속적으로 환원되어 2-에틸헥사날 및 2-에틸헥사놀을 형성할 수 있으며, 이들은 각각 이중 결합 리덕타제 및 알코올 디하이드로게나제에 의해 촉매된다(실시예 4 참조). 마지막 단계에서, 필요에 따라, 2-에틸헥사놀은 화학 또는 효소학적 전환(예, 수소 처리)과 같은 당업계에 알려지고 여기에 기술된 바와 같은 기술에 따라 2-에틸헥산으로 전환될 수 있다.
따라서, 특정한 구현 예에서, 알돌라제 효소를 인코딩하는 하나 또는 그 이상의 외인성 폴리뉴클레오티드 및 알코올 디하이드로게나제 효소를 인코딩하는 하나 또는 그 이상의 외인성 폴리뉴클레오티드를 포함하는 재조합 미생물은 부틸알데히드 근원으로부터 2-에틸-2-헥센-1-알 및 2-에틸헥사놀을 합성하는데 사용할 수 있으며, 이들은 그 후 2-에틸헥산으로 전환될 수 있다. 특정한 구현 예에서, 여기에 기술된 바와 같이 부틸알데히드는 부틸알데히드 생합성 경로를 포함하며 또한 단당류 또는 올리고당을 부틸알데히드로 전환할 수 있는 재조합 미생물로부터 수득될 수 있다.
여기에 기술된 방법은 다른 바이오연료보다 상당히 유리한 점을 가진 바이오연료를 생산한다. 구체적으로, 이소옥탄 및 다른 중쇄 내지 장쇄 알칸은 에탄올 및 부탄올과 같은 현존하는 공통 바이오연료에 비해 다수의 중요한 이점을 제공하며, 미래에 가솔린, 디젤, 등유, 중유등의 석유 기반 연료의 매력적이고 장기적인 대체물이다. 일 예로서, 이소옥탄 및 다른 중쇄 내지 장쇄 알칸 및 알코올은 모든 석유 산물 및 특히 제트 연료의 주요 성분이며 따라서, 우리가 생산하는 알칸은 현존하는 엔진에 직접 사용될 수 있다. 추가의 예로서, 중쇄 내지 장쇄 알코올은 에탄올보다 더 양호한 연료이고 가솔린에 거의 버금가는 에너지 밀도를 갖는다. 상기에 주지된 바와 같이, 이소옥탄은 가솔린의 주요 성분이다.
또 다른 예로서, n-알칸은 가솔린, 디젤, 등유 및 중유를 포함하는 모든 기름 산물의 주요 성분이다. 재조합 미생물은 사용되어 예를 들어 C7 내지 C20 이상의 상이한 탄소 길이 범위: 가솔린(예, 자동차)의 경우 C7, 디젤(예, 자동차, 기차 및 배)의 경우 C10 내지 C15 및 등유(예, 비행기 및 배)의 경우 C8 내지 C16 및 모든 중유에 대해서 다른 탄소 길이 범위를 지닌 n-알칸을 생성할 수 있다.
본 발명의 특정한 구현 예는 일반적으로 바이오매스-유래 공급 원료로부터 이소옥탄 및 중쇄 내지 장쇄 알칸을 생성하여 바이오연료의 낮은 탄소원을 제공하는 방법에 관한 것이다. 예를 들어, 바이오매스로부터 범용화학제품 또는 바이오연료(예, 이소옥탄)를 생산하는데 있어서, 적합한 바이오매스-유래 단당류 또는 올리고당은 먼저 유일한 탄소원으로서 펙틴 또는 알기네이트등의 바이오매스-유래 다당류에서 성장할 수 있는 미생물과 같은 임의의 입수가능한 근원으로부터 직접 수득할 수 있다. 다음에 이러한 단당류 또는 올리고당은 단당류 또는 올리고당을 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물과 접촉시킴으로써 알데히드 및/또는 케톤으로 전환될 수 있다.
다음에 그러한 재조합 미생물에 의해 생산되는 알데히드 및/또는 케톤은 알데히드 및/또는 케톤을 본 발명의 재조합 미생물과 접촉시킴으로써 범용화학제품 또는 바이오연료로 전환될 수 있으며, 상기 미생물은 알돌라제 효소 및 알코올 디하이드로게나제 효소를 포함한다. 특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물은 알돌라제 효소 및 알코올 디하이드로게나제 효소를 포함하는 재조합 미생물과 같거나 또는 다를 수 있다.
당업자에게 명확한 다른 용도 중에서, 여기에 기술된 상기 방법과 재조합 미생물에 의해 생성된 범용화학제품 및 바이오연료는 전통적인 정제방법에 의해 생산된 석유 산물과 혼합하기 위한 현존 석유 정제 시설에 의해 사용하여 범용화학제품 강화된 정제소 생산 석유 제품을 생성한다. 상기에 기술된 바와 같이, 이러한 목적을 위해 연료 생산자는 현존하는 기반 구조(정제소, 파이프라인, 급유기)를 통해 혼합되고 분배될 수 있는 실질적으로 유사한 낮은 탄소 연료를 찾는다. 탄화수소로서, 본 방법에 따라 생산된 범용화학제품은 석유 유래 연료와 실질적으로 유사하고, 온실 가스 배출을 석유 유래 연료로부터의 80% 이상을 감소시키며, 또한 기름 및 가스 산업의 현존하는 기반 구조에 호환성이 있다.
예를 들어, 다른 것들 중에서 이소옥탄을 포함하는 여기에 생성된 범용화학제품은 가솔린, 제트 및 디젤 연료와 같은 정제소에서 생산된 석유 산물에 직접적으로 혼합할 수 있다. 가솔린, 제트 및 디젤 연료에 대해 블랜드스톡(blendstock)으로서 생물학적으로 생산된 범용화학제품을 사용하여, 정제소는 온실 가스 방출을 80% 이상 감소시킬 수 있다.
본 발명의 실시는, 구체적으로 다르게 언급되지 않는 이상, 당업계의 기술범위 내에서 분자 생물학 및 재조합 DNA 기술의 통상적인 방법을 사용할 것이며, 이들의 대부분은 예시목적으로 하기에 설명된다. 이들 기술은 다음 문헌에 상세히 설명되어 있다. 예를 들어, Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Maniatis et al., Molecular Cloning: A Laboratory Manual (1982); DNA Cloning: A Practical Approach, vol . I &11 (D. Glover, ed.); Oligonucleotide Synthesis (N. Gait, ed., 1984); Nucleic Acid Hybridization (B. Hames &S. Higgins, eds., 1985); Transcription and Translation (B. Hames &S. Higgins, eds., 1984); A Practical Guide to Molecular Cloning (B. Perbal, ed., 1984)를 참조한다.
정의
별도로 정의되어 있지 않다면, 여기서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 숙련된 기술자에 의해 공통적으로 이해되는 것과 같은 의미를 갖는다. 여기에 기술된 것과 유사하거나 또는 동일한 임의의 방법 및 재료는 본 발명의 실시 또는 검사에 사용될 수 있음에도 불구하고, 바람직한 방법 및 재료가 기술되어 있다. 본 발명의 목적에 위해, 하기의 용어는 아래에 기술되어 있다. 여기에 언급된 모든 문헌은 전체로서 참고로 포함된다.
관사인 "a" 및 "an"은 관사의 문법적 객체의 하나 또는 하나 이상(즉, 적어도 하나)을 언급할 때 여기서 사용된다. 예로서, "an element"는 하나의 요소 또는 하나 이상의 요소를 의미한다.
"약"이라는 용어는 참고 분량(quantity), 레벨, 값, 숫자, 빈도, 백분율, 치수(dimension), 크기, 양(amount), 무게 또는 길이에 대해서 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1 % 만큼 변화하는 분량, 레벨, 값, 숫자, 빈도, 백분율, 치수, 크기, 양(amount), 무게 또는 길이를 의미한다.
참고 폴리뉴클레오티드 또는 폴리펩티드 서열의 단편에 적용되는 용어 "생물학적으로 활성이 있는 단편"은 참고 서열 활성의 적어도 약 0.1, 0.5, 1, 2, 5, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99, 100, 110, 120, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000% 또는 그 이상을 갖는 단편을 언급한다.
"참고 서열"이라는 용어는 일반적으로 여기에 기술된(예, 알돌라제, 알코올 디하이드로게나제, 디하이드라타제, 디올 디하이드로게나제, 이중 결합 리덕타제 등) 생물학적 활성을 갖는 임의의 폴리펩티드 또는 효소의 핵산 코딩 서열 또는 아미노산 서열을 지칭하고, 그러한 "야생형" 서열은 SEQ ID NOS:1-96 및 215-222로 나타낸 폴리뉴클레오티드 및 폴리펩티드 참고 서열 및 SEQ ID NOS:223-260으로 나타낸 이들의 모티프 서열을 포함한다. 참고 서열은 여기에 기술된 서열의 자연적으로 발생하는 기능적 변형체(즉, 오르토로그 또는 호모로그)를 또한 포함할 수 있다.
본 발명의 범주에는 길이 적어도 약 18, 19, 20, 21 , 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 500, 600 또는 그 이상의 연속적인 뉴클레오티드 또는 아미노산 잔기인 생물학적 활성 단편을 포함하며, 그들 사이의 모든 정수를 포함하며, 참고 폴리뉴클레오티드 또는 폴리펩티드의 효소활성을 갖는 폴리펩티드를 포함하거나 또는 인코딩한다. 대표적인 생물학적으로 활성이 있는 단편은 일반적으로 상호작용, 예를 들어, 분자 내 또는 분자 간의 상호작용에 참여한다. 분자 간의 상호작용은 특이적 결합 상호작용 또는 효소학적 상호작용일 수 있다. 효소학적 상호작용 및 활성의 예는 여기에 기술된 다른 것들 중에서, 알돌라제 활성, 알코올 디하이드로게나제 활성, 디하드라타제 활성, 라이아제 활성, 트랜스포터 활성, 이소머라제 활성, 키나제 활성을 포함한다. 생물학적으로 활성이 있는 단편은 전형적으로 여기에 기술되고 당업계에 알려진 바와 같이 하나 또는 그 이상의 활성 부위 또는 효소학적/결합 모티프를 포함한다.
"생체분자"라는 용어는 살아있는 생명체에 의해 생성되는 유기 분자를 일반적으로 지칭하고, 단백질, 다당류 및 핵산과 같은 거대 중합 분자(생체고분자) 및 주요 2차 대사산물, 지질, 인지질, 당지질, 스테롤, 글리세로리피드, 비타민 및 호르몬과 같은 소분자를 포함한다. 다른 요소가 생체고분자에 포함될 수 있음에도 불구하고 유기 분자(예, 생체고분자)는 주로 탄소, 수소, 질소 및 산소 및 보다 적은 양으로, 인 및 황으로 이루어져 있다.
"생체고분자"라는 용어는 일반적으로 공유 화학 결합에 의해 연결된 반복되는 구조적 단위로 이루어진 대 분자 또는 거대분자를 지칭하며 이들은 살아있는 생명체에 의해 생성될 수 있다. 생체고분자의 예는 제한 없이 다당류, 핵산 및 단백질을 포함한다.
"코딩 서열"이라는 용어는 유전자의 폴리펩티드 생성물의 코드에 기여하는 임의의 핵산 서열을 의미한다. 대조적으로, "비코딩 서열"이라는 용어는 유전자의 폴리펩티드 생성물의 코드에 관여하지 않는 임의의 핵산 서열을 지칭한다.
본 명세서를 통해서, 문맥이 다른 것을 필요로 하지 않는다면, "포함하다(comprise)," "포함하다(comprises)" 및 "포함하는(comprising)"라는 용어는 언급된 단계 또는 요소 또는 단계 또는 요소의 그룹의 포함을 암시하도록 이해될 것이고, 임의의 다른 단계 또는 요소 또는 단계 또는 요소의 그룹의 배제를 암시하지는 않는다.
"로 이루어진(consisting of)"이라는 용어는 제한적이지만 문구 "로 이루어진"을 수반하는 어느 것도 포함함을 의미한다. 따라서 문구 "로 이루어진"은 열거된 요소가 필요로 되고 의무적인 것을 의미하고 다른 요소가 존재하지 않는다는 것을 의미한다.
"실질적으로 이루어진"이라는 문구는 구 뒤로 나타낸 임의의 요소를 포함함을 의미하고 열거된 요소를 위한 명세서에서 명시된 활성 또는 작용을 방해하지 않거나 기여하는 다른 요소에 제한적이다. 따라서, "실질적으로 이루어진"이라는 문구는 열거된 요소가 필요로 하고 의무적인 것을 의미하고 다른 요소는 선택적이라는 것을 의미하고 다른 요소가 열거된 요소의 활성과 작용에 영향을 주는지 여부에 의존하여 존재할 수도 있고 존재하지 않을 수도 있다.
"상보적인" 및 "상보성"이라는 용어는 염기-쌍 법칙에 의해 관계하는 폴리뉴클레오티드(예, 뉴클레오티드 서열)를 지칭한다. 예를 들어, 서열 "A-G-T"는 서열 "T-C-A"와 상보적이다. 상보성은 "부분적"일 수 있어서 핵산 염기의 오직 일부분만이 염기 쌍 법칙에 따라 부합 된다. 또는 핵산 간에 "완전한" 또는 "전체" 상보성일 수 있다. 핵산 가닥 간의 상보성 정도는 핵산 가닥간의 혼성화 효율 및 세기에 상당한 영향을 가지고 있다.
"에 상응하다" 또는 "에 상응하는"은 (a) 참고 폴리뉴클레오티드 서열의 전체 또는 일부와 실질적으로 동일하거나 또는 상보적인 뉴클레오티드 서열을 갖거나 펩티드 또는 단백질에서 아미노산 서열과 동일한 아미노산 서열을 인코딩하는 폴리뉴클레오티드를 의미하고, 또는 (b) 참고 펩티드 또는 단백질에서 아미노산 서열과 실질적으로 동일한 아미노산 서열을 갖는 펩티드 또는 폴리펩티드를 의미한다.
"유도체"라는 용어는 예를 들어, 다른 화학 부분(예, 페길화(pegylation))과 결합 또는 혼합 또는 당업계에서 이해되는 바와 같이 번역 후 변형에 의한 변형에 의해 기본 서열로부터 유래된 폴리펩티드를 의미한다. "유도체"라는 용어는 그것의 범주내에 기능적으로 동일 분자를 제공하는 첨가 또는 결실을 포함하는 모체 서열에 만들어진 변형을 포함한다.
"효소 활성화 조건"은 효소가 기능하도록 허락하는 환경(즉, 온도, pH, 저해물질의 결여와 같은 인자)에서 입수가능한 임의의 필요한 조건을 의미한다. 효소 활성화 조건은 시험관과 같은 in vitro , 또는 세포내에서와 같은 in vivo일수 있다.
여기서 사용되는 "기능" 및 "기능성의" 등의 용어는 생물학적 또는 효소학적 기능을 지칭한다.
"유전자"는 유전의 단위로서 염색체상에서 특정한 위치를 차지하고 전사 및/또는 번역 조절 서열 및/또는 코딩 지역 및/또는 비번역 서열(즉, 인트론, 5' 및 3' 비번역 서열)로 이루어져 있다.
"상동성"은 보존적 치환과 동일한 또는 구성하는 아미노산의 퍼센트 수를 지칭한다. 상동성은 참고로 여기에 포함된 GAP(Deveraux 등, 1984, Nucleic Acids Research 12, 387-395)과 같은 서열 비교 프로그램을 사용하여 결정될 수 있다. 이러한 방식으로 여기에 인용된 서열과 유사한 또는 실질적으로 다른 길이의 서열은 갭을 정렬 내에 삽입하여 비교될 수 있고 예를 들어, 그러한 갭은 GAP에 의해 사용된 비교 알고리즘을 사용하여 결정된다.
"숙주 세포"라는 용어는 임의의 재조합 벡터(들) 또는 본 발명의 분리된 폴리뉴클레오티드의 수령자일 수 있거나 수령자인 개개의 세포 또는 세포 배양체를 포함한다. 숙주 세포는 단일 숙주 세포의 자손을 포함하고 상기 자손은 자연적, 사고적, 고의적인 돌연변이 및/또는 변화에 기인하여 본래의 모체 세포와 (형태학적 또는 전체 DNA 보체에서) 완전히 동일할 필요는 없다. 숙주세포는 in vivo 또는 in vitro에서 재조합 벡터 또는 본 발명의 폴리뉴클레오티드로 형질 감염(transfected), 형질전환, 감염된(infected) 세포를 포함할 수 있다. 본 발명의 제조합 벡터를 포함하는 숙주 세포는 재조합 숙주 세포, 재조합 세포, 또는 재조합 미생물이다.
"분리된"은 그것의 자연 상태에서 그것을 정상적으로 동반하는 성분으로부터 실질적으로 또는 본질적으로 자유로운 물질을 의미한다. 예를 들어, 여기서 사용되는 "분리된 폴리뉴클레오티드"는 자연적으로 발생하는 상태에서 측면에 위치한 서열로부터 정제된 폴리뉴클레오티드, 예를 들어, DNA 단편에 정상적으로 인접한 서열로부터 제거된 DNA 단편을 지칭한다. 이와는 달리, 여기서 사용되는 "분리된 펩티드" 또는 "분리된 폴리펩티드" 등은 자연 세포 환경으로부터 및 세포의 다른 성분과 함께로부터 펩티드 또는 폴리펩티드를 in vitro에서 분리 및/또는 정제함을 지칭한다. 즉, 그것은 in vivo 물질과 함께하지 않는다.
"향상하다", "향상하는", "증가시키다" 또는 "증가시키는"은 하나 또는 그 이상의 재조합 미생물이 변형되지 않은 미생물 또는 다르게 변형된 미생물과 같은 대조군 미생물과 비교하여 주어진 산물 또는 분자(예, 범용화학제품, 바이오연료, 또는 그의 중간체 생성물)를 더 많이 생성하는 능력을 의미한다. "증가된" 양은 전형적으로 "통계학적으로 유의한" 양이고 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 변형되지 않은 미생물 또는 다르게 변형된 미생물에 의해 생성되는 양의 그 이상의 배수(모든 정수 및 예를 들어, 1.5, 1.6, 1.7. 1.8 등 사이의 소수점를 포함)인 증가를 포함할 수 있다. 증가된 양은 당업계의 일상화된 기술에 따라 측정될 수 있다. 예를 들어, 범용화학제품의 "증가된" 양은 이론적인 최대 산출량의 백분율에 따라 측정될 수 있다. 예를 들어, 어떤 구현 예에서, 본 발명의 방법은 타겟 분자(예, 범용화학제품)의 산출량을 이론적인 최대 산출량의 적어도 약 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%로 향상시킬 수 있다. 특정한 구현 예에서, 상기 방법은 상기와 같은 재조합 미생물을 대조군 또는 다른 조건하에서 항온처리하거나 또는 대조군(예, 변형되지 않은 또는 다르게 변형된) 미생물을 같은 또는 유사한 조건하에서 항온처리함과 비교하여 타겟 분자의 이론적인 최대 산출량의 백분율을 적어도 약 10% (예, 이론적인 최대 산출량의 약 30% 내지 약 40%), 15% (예, 이론적인 최대 산출량의 약 30% 내지 약 45%), 20%, 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80%, 또는 90% 증가시킴으로써 특징 지워질 수 있다.
"줄이다(reduce)"라는 용어는 일반적으로 진단 업계의 일상적인 기술에 따라 측정되는 NADH 또는 아세테이트 생산과 같은 관련 세포 내 반응에서의 "감소하다(decrease)"에 관한 것이다. 다른 관련 세포 반응(in vivo 또는 in vitro)은 당업자에게 분명할 것이다. 반응에서 "감소하다"는 변형되지 않은 미생물 또는 다르게 변형된 미생물에 의해, 또는 다른 조건에서 성장하는 미생물에 의해 생성되는 반응과 비교하여 "통계학적으로 유의한" 양일 수 있고, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% 감소를 포함할 수 있고, 이들 사이의 모든 정수를 포함한다.
"로부터 수득된"은 예를 들어, 폴리뉴클레오티드 추출물 또는 폴리펩티드 추출물과 같은 샘플이 바람직한 생명체, 통상적으로는 미생물과 같은 특정 근원으로부터 분리 또는 유래되는 것을 의미한다. "로부터 수득된"은 폴리뉴클레오티드 또는 폴리펩티드 서열이 특정 생명체 또는 미생물로부터 분리되거나 또는 유래되는 상황을 또한 지칭하기도 한다. 예를 들어, 벤즈알데히드 라이아제를 인코딩하는 폴리뉴클레오티드 서열은 수도모나스와 같은 다양한 원핵 또는 진핵 미생물로부터 분리될 수 있다. 다른 예로서, 알돌라제 효소를 인코딩하는 폴리뉴클레오티드 서열은 털모토가 마리티마 및 이스체리키아 콜라이 DH 1OB와 같은 다양한 원핵 또는 진핵 미생물로부터 분리될 수 있다.
여기서 사용되는 "작동적으로 연결된"이라는 용어는 유전자를 유전자의 전사 및 경우에 따라 번역을 조절하는 프로모터의 조절적인 통제하에 두는 것을 의미한다. 이종 기원의 프로모터/구조 유전자 조합의 구축에 있어서, 일반적으로 유전적 서열 또는 프로모터를 유전자 전사 시작 부위로부터 떨어진 곳에 위치시킴이 바람직하며, 이들 거리는 그것의 자연적 구성에서 유전적 서열 또는 프로모터 및 그것이 조절하는 상기 유전자 사이의 거리와 대략 같고 상기 유전자는 유전적 서열 또는 프로모터가 유래되는 유전자이다. 당업계에 알려져 있는 바와 같이, 이들 거리에서의 약간의 변화는 기능의 상실 없이 수용될 수 있다. 유사하게, 조절하에 위치한 이종 기원의 유전자에 대한 조절 서열 요소의 바람직한 위치는 그것의 자연적 구성에서 상기 요소의 위치에 의해 정의된다; 즉 그것이 유래한 유전자. "구조적인 프로모터"는 전형적으로 대다수의 조건하에서 활성이 있는 즉, 전사를 촉진한다. 유도성의 프로모터"는 전형적으로 어떤 조건하에서만 활성이 있다. 예를 들어, 주어진 분자 인자(예, IPTG)의 존재하에서 또는 주어진 환경 조건(예, CO2 농도, 영양분 레벨, 빛, 열)하에서 활성이 있다. 그러한 조건의 부재하에서는 유도성의 프로모터는 전형적으로 전사 활성의 현저하고 측정될 수 있는 레벨을 허용하지 않는다.
여기에 기술된 바와 같이 상술한 "폴리뉴클레오티드" 또는 "핵산"은 mRNA, RNA, cRNA, rRNA, cDNA 또는 DNA를 가리킨다. 통상적으로 상기 용어는 적어도 길이상 10개의 염기의 뉴클레오티드의 중합 형태를 지칭하고 이들은 리보뉴클레오티드 또는 디옥시뉴클레오티드 또는 이들 두 뉴클레오티드 타입의 변형체를 나타낸다. 상기 용어는 DNA의 단일 및 이중 가닥 형태를 포함한다.
당업자들에게 이해되는 바와 같이, 본 발명의 폴리뉴클레오티드 서열은 단백질, 폴리펩티드, 펩티드 등을 발현하거나 또는 발현하도록 적응될 수 있는 게놈믹 서열, 추가의 게놈믹 서열 및 플라스미드-인코딩 서열 및 보다 작은 가공된 유전자 세그멘트를 포함할 수 있다. 이러한 세그멘트는 자연적으로 분리되거나 또는 사람의 손에 의해 합성적으로 변형될 수 있다.
폴리뉴클레오티드는 단일 가닥(코딩 또는 안티센스) 또는 이중 가닥일 수 있고, DNA(게놈믹, cDNA 또는 합성) 또는 RNA 분자일 수 있다. 부가적인 코딩 또는 비코딩 서열은 본 발명의 폴리뉴클레오티드 내에 존재할 수 있지만 그렇게 하지 않아도 된다. 폴리뉴클레오티드는 다른 분자 및/또는 지지 물질에 연결될 수 있지만 그렇게 하지 않아도 된다.
폴리뉴클레오티드는 순수한 서열을 포함할 수 있거나 또는 변형체 또는 그러한 서열의 생물학적 기능적 동등체를 포함할 수 있다. 폴리뉴클레오티드 변형체는 하기에 추가로 기술된 바와 같이 하나 또는 그 이상의 치환, 첨가, 결실 및/또는 삽입을 포함할 수 있어서 바람직하게는 인코딩된 폴리펩티드의 효소 활성이 변형되지 않은 폴리펩티드에 대하여 실질적으로 감소 되지 않으며, 또한 바람직하게는 인코딩된 폴리펩티드의 효소 활성이 변형되지 않은 폴리펩티드에 대하여 향상(예, 최적화)된다. 인코딩된 폴리펩티드의 효소 활성에 대한 효과는 일반적으로 여기에 기술된 바와 같이 평가될 수 있다.
특정한 구현 예에서, 본 발명은 여기에 기술된 다른 것들 중에서 알돌라제 또는 알코올 디하이드로게나제에 동일하거나 또는 상보적인 다양한 길이의 연속적인 서열의 스트랫치(stretch)를 포함하는 분리된 폴리뉴클레오티드를 제공하며, 여기서 분리된 폴리뉴클레오티드는 생물학적으로 활성이 있는 끝이 절단된 효소를 인코딩한다.
본 출원의 효소를 인코딩하는 뉴클레오티드 서열의 예는 전장 알돌라제 및 알코올 디하이드로게나제 뿐만 아니라 전체 길이 또는 실질적으로 전장인 이들 유전자의 뉴클레오티드 서열의 일부, 또는 그들의 전사체 또는 이들 전사체의 DNA 카피를 포함한다. 뉴클레오티드 서열의 일부는 참고 폴리펩티드의 생물학적 활성을 보유하는 폴리펩티드 일부 또는 세그멘트를 인코딩할 수 있다. 여기에서 제공된 효소의 생물학적으로 활성이 있는 단편을 인코딩하는 뉴클레오티드 서열의 일부는 적어도 약 20, 21 , 22, 23, 24, 25, 30, 40, 50, 60, 70, 80, 90, 100, 120, 150, 200, 300, 400, 500, 600, 또는 그 이상의 연속적인 아미노산 잔기, 전장 효소에 존재하는 아미노산의 거의 전체 숫자까지를 인코딩할 수 있다. 여기서 사용되는 이 문맥 및 모든 다른 문맥에서의 "중간 길이"는 101, 102, 103, 등; 151, 152, 153, 등; 201, 202, 203, 등과 같은 인용된 값 사이의 임의의 길이를 의미한다.
본 발명의 폴리뉴클레오티드는, 코딩 서열 자체의 길이에 관계없이, 프로모터, 폴리아데닐화 신호, 부가적인 제한 효소 부위, 복수의 클로닝 부위, 다른 코딩 세그멘트 등과 같은 다른 DNA 서열과 결합될 수 있어서, 그들의 전체 길이는 상당히 변화할 수 있다. 따라서 대체로 임의의 길이의 폴리뉴클레오티드 단편은 제조의 편의성 및 계획된 재조합 DNA 프로토콜에서의 용도에 의해서 바람직하게 제한받는 전체 길이를 가지고 사용될 수 있다고 고려된다.
"폴리뉴클레오티드 변형체" 및 "변형체" 등은 여기에 기술된 임의의 참고 폴리뉴클레오티드 서열 또는 유전자를 가진 실질적인 서열 존재를 나타내는 폴리뉴클레오티드, 및 여기에 기술된 폴리뉴클레오티드 참고 서열, 또는 임의의 유전자 또는 폴리펩티드의 폴리뉴클레오티드 코딩 서열과 혼성화하는 폴리뉴클레오티드를 지칭하며 상기 혼성화는 이하에 정의되고 당업계에 알려진 낮은 스트린전시, 중간 스트린전시, 높은 스트린전시 또는 매우 높은 스트린전시 조건하에서 이루어진다. 이들 용어는 또한 적어도 하나의 뉴클레오티드의 추가, 결실 또는 치환에 의해 참고 폴리뉴클레오티드와 구별되는 폴리뉴클레오티드를 포함한다. 따라서, "폴리뉴클레오티드 변형체" 및 "변형체"는 하나 또는 그 이상의 뉴클레오티드가 추가되거나 또는 결실되고 또는 다른 뉴클레오티드로 대체되는 폴리뉴클레오티드를 포함한다. 이와 관련해서, 돌연변이, 추가, 결실 및 치환을 포함하는 특정한 변화도 참고 폴리뉴클레오티드에 이루어질 수 있어서 상기의 변형된 폴리뉴클레오티드는 참고 폴리뉴클레오티드의 생물학적 기능 및 활성을 보유하거나 또는 참고 폴리뉴클레오티드에 대해서 증가된 활성을 가지고 있다(즉, 최적화된다). 폴리뉴클레오티드 변형체는 예를 들어, 여기에 기술된 참고 폴리뉴클레오티드와 적어도 50% (및 적어도 51% 내지 적어도 99% 및 그 사이의 모든 정수 백분율) 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
"폴리뉴클레오티드 변형체" 및 "변형체"라는 용어는 또한 이들 효소를 인코딩하는 자연적으로 발생하는 대립 유전자 변형체를 포함한다. 자연적으로 발생하는 변형체의 예는 대립 유전자 변형체(같은 좌), 상동체(다른 좌), 및 오르토로그(다른 생명체)를 포함한다. 이들과 같은 자연적으로 발생하는 변형체는 예를 들어, 당업계에 잘 알려진 다양한 중합효소 연쇄 반응(PCR) 및 혼성화-기반 기술을 포함하는 잘 알려진 분자생물학적 기술을 사용하여 확인 및 분리될 수 있다. 자연적으로 발생하는 변형체는 여기에 기술된 적합한 효소 활성(예, C-C 리가아제, 알돌라제, 알코올 디하이드로게나제, 리덕타제 등)을 갖는 하나 또는 그 이상의 유전자를 인코딩하는 임의의 유기체로부터 분리될 수 있다.
비자연적으로 발생하는 변형체는 돌연변이 생성 기술로 제조될 수 있고 이 기술은 폴리뉴클레오티드, 세포 또는 유기체에 적용되는 것을 포함한다. 상기 변형체는 뉴클레오티드 치환, 결실, 역위 및 삽입을 포함할 수 있다. 변형은 코딩 및 비코딩 지역의 하나 또는 둘에서 일어날 수 있다. 특정한 양상에서는, 비자연적으로 발생하는 변형체는 증가된 활성, 안정성 또는 임의의 다른 바람직한 특징에 대하여 효소를 가공 및 스크리링함으로써 주어진 미생물(예, 이. 콜라이)의 사용을 위해 최적화될 수 있다. 상기 변형은 (본래의 인코딩된 산물과 비교하여) 보존적인 및 비보전적인 아미노산 치환을 생성할 수 있다. 뉴클레오티드 서열에 관해서, 보전적인 변형체는 유전자 코드의 축증(degeneracy) 때문에 참고 폴리펩티드의 아미노산 서열을 인코딩하는 서열을 포함한다. 변형체 뉴클레오티드 서열은 예를 들어, 위치지정 돌연변이에 의해 생성되나 생물학적 활성을 갖는 폴리펩티드를 아직도 인코딩하는 것과 같은 합성적으로 유래된 뉴클레오티드 서열을 또한 포함한다.
일반적으로, 특정 참고 뉴클레오티드 서열의 변형체는 디폴트 매개변수(default parameter)를 사용하여 여기의 그 밖에 기술된 서열 정렬 프로그램에 의해 결정된 것과 같이 특정 뉴클레오티드 서열과 적어도 약 30%, 40% 50%, 55%, 60%, 65%, 70%, 일반적으로 적어도 약 75%, 80%, 85%, 90% 내지 95% 또는 그 이상, 및 심지어 약 97% 또는 98% 또는 그 이상의 서열 동일성을 가질 수 있다.
공지진 알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제 및 다른 뉴클레오티드 참고 서열은 다른 유기체 특히 다른 미생물로부터 해당 서열 및 대립 유전자를 분리하는데 사용될 수 있다. 핵산 서열의 혼성화를 위한 방법들이 당업계에서 용이하게 이용가능하다. 다른 유기체로부터의 코딩 서열은 여기로 나타낸 코딩 서열과의 서열 동일성에 기반하여 잘 알려진 기술에 따라 분리될 수 있다. 이들 기술에서, 공지된 코딩 서열의 모두 및 일부는 선택된 유기체로부터 클론화된 게놈믹 DNA 또는 cDNA 단편(즉, 게놈믹 또는 cDNA 라이브러리)의 집단에 존재하는 다른 참고 코딩 서열에 선택적으로 혼성화하는 프로브로서 사용된다.
본 발명은 또한 하기에 기술된 스트린전시 조건하에서 참고 알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제, 또는 다른 뉴클레오티드 서열 또는 그들의 보체에 혼성화하는 폴리뉴클레오티드를 또한 고려한다. 여기서 사용되는 "낮은 스트린전시, 중간 스트린전시, 높은 스트린전시 또는 매우 높은 스트린전시 조건하에서 혼성화하다"라는 용어는 혼성화 및 세척을 위한 조건을 기술한다. 혼성화 반응을 실시하기 위한 지침은 Ausubel 등, "Current Protocols in Molecular Biology", John Wiley & Sons Inc, 1994-1998, Sections 6.3.1-6.3.6.에서 찾을 수 있다. 수성 및 비수성 방법들은 그 참고문헌에 기술되어 있고 두 가지 방법 모두 사용될 수 있다.
"낮은 스트린전시" 조건에 대한 언급은 적어도 약 1 % v/v 내지 적어도 약 15% v/v 포름아미드 및 42℃에서 혼성화를 위해 적어도 약 1 M 내지 적어도 약 2 M 염, 및 42℃에서 세척를 위해 적어도 약 1 M 내지 적어도 약 2 M 염을 포함한다. 낮은 스트린전시 조건은 65℃에서 혼성화를 위해 1 % 소 혈청 알부민(BSA), 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS를 또한 포함할 수 있고 실온에서 세척을 위해 (i) 2 x SSC, 0.1 % SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 5% SDS를 포함할 수 있다. 낮은 스트린전시 조건의 하나의 구현 예는 약 45℃에서 6 × 염화나트륨/구연산나트륨(SSC)에서 혼성화에 이은 적어도 50℃에서 0.2 × SSC, 0.1 % SDS에서 두 번의 세척을 포함한다(세척의온도는 낮은 스트린전시 조건을 위해서 55℃로 증가될 수 있다).
"중간 스트린전시" 조건은 적어도 약 16% v/v 내지 적어도 약 30% v/v 포름아미드 및 42℃에서 혼성화를 위해 적어도 약 0.5 M 내지 적어도 약 0.9 M 염, 및 55℃에서 세척를 위해 적어도 약 0.1 M 내지 적어도 약 0.2 M 염을 포함(include)하고 포함(encompass)한다. 중간 스트린전시 조건은 65℃에서 혼성화를 위해 1 % 소 혈청 알부민(BSA), 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS 및 60 내지 65℃에서 세척을 위해 (i) 2 x SSC, 0.1 % SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 5% SDS를 포함할 수 있다. 중간 스트린전시 조건의 하나의 구현 예는 약 45℃에서 6 x SSC에서 혼성화에 이은 60℃에서 0.2 x SSC, 0.1 % SDS에서 한 번 또는 그 이상의 세척을 포함한다.
"높은 스트린전시" 조건은 적어도 약 31 % v/v 내지 적어도 약 50% v/v 포름아미드 및 42℃에서 혼성화를 위해 약 0.01 M 내지 약 0.15 M 염 및 55℃에서 세척을 위해 약 0.01 M 내지 약 0.02 M 염을 포함한다. 높은 스트린전시 조건은 65℃에서 혼성화를 위해 1 % BSA, 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS 및 65℃ 이상의 온도에서 세척을 위해 (i) 0.2 x SSC, 0.1 % SDS; or (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 1 % SDS를 또한 포함할 수 있다. 높은 스트린전시 조건의 하나의 구현 예는 약 45℃에서 6 x SSC에서 혼성화에 이은 65℃에서 0.2 x SSC, 0.1 % SDS에서 하나 또는 그 이상의 세척을 포함한다.
"매우 높은 스트린전시" 조건의 하나의 구현 예는 65℃에서 0.5 M 인산나트륨, 7% SDS에서 혼성화에 이은 65℃에서 0.2 x SSC, 1 % SDS에서 하나 또는 그 이상의 세척을 포함한다.
다른 스트린전시 조건은 당업계에 잘 알려져 있고 당업자는 다양한 인자가 혼성화의 특이성을 최적화하는데 조작될 수 있음을 인식하고 있다. 마지막 세척의 스트린전시의 최적화는 혼성화의 높은 정도를 보장하는데 도움이 될 수 있다. 자세한 예로서, Ausubel 등, 위의 페이지 2.10.1 내지 2.10.16 및 Sambrook 등, Current Protocols in Molecular Biology (1989), 섹션 1.101 to 1.104.를 참조한다.
충실한 세척은 전형적으로 약 42℃ 내지 68℃의 온도에서 수행되고, 당업자는 다른 온도도 스트린전시 조건에 적합할 수 있음을 인식할 것이다. 최대의 혼성화 속도는 전형적으로 DNA-DNA 하이브리드 형성의 Tm 값 아래의 약 20℃ 내지 25℃에서 일어난다. Tm 값은 해리 온도 또는 두 개의 상보적인 폴리뉴클레오티드 서열이 분리되는 온도임이 당업계에 잘 알려져 있다. Tm 값을 계산하는 방법은 당업계에 잘 알려져 있다(Ausubel 등, 위의 페이지 2.10.8을 참조).
일반적으로, DNA의 완벽하게 매치된 이중가닥의 Tm 값은 하기 식에 의해 근사치로 예측될 수 있다: Tm = 81.5 + 16.6 (log10 M) + 0.41 (%G+C) - 0.63 (% 포름아미드) - (600/길이), 여기서 M은 바람직하게 0.01 M 내지 0.4 M 범위의 Na+의 농도이고; %G+C는 30% 및 75% G+C 사이의 범위 안에서 전체 염기 수의 퍼센트로서 구아노신 및 사이토신의 합이고; % 포름아미드는 부피에 의한 포름아미드의 % 농도이고; 길이는 DNA 이중 가닥에서 염기 쌍의 수를 나타낸다. 이중 가닥 DNA의 Tm 값은 무작위로 미스매치된 염기 쌍이 1% 씩 증가할 때마다 약 1℃ 감소한다. 세척은 일반적으로 높은 스트린전시에 대해서는 Tm - 15℃에서 또는 중간 스트린전시에 대해서는 Tm - 30℃에서 수행된다.
혼성화 절차의 한 예에서, 고정화된 DNA를 포함하는 멤브레인(예, 니트로셀룰로오스 멤브레인 또는 나일론 멤브레인)은 라벨된 프로브를 포함하는 혼성화 완충제(50% 탈이온화장치 포름아미드, 5 x SSC, 5 x Reinhardt 용액 (0.1 % 피컬(fecal), 0.1 % 폴리비닐피롤리돈 및 0.1 % 소 혈청 알부민), 0.1 % SDS 및 200 mg/mL 변성된 연어 정자 DNA)에서 42℃에서 하룻밤 혼성화된다. 상기 멤브레인은 그 후 2번의 연속적인 중간 충실의 세척도(즉,45℃에서 15분간 2 x SSC, 0.1 % SDS에 이어서 50℃에서 15분간 2 x SSC, 0.1 % SDS)에 이어서 2번의 연속적인 보다 높은 스트린전시의 세척(즉, 55℃에서 12분간 0.2 x SSC, 0.1 % SDS에 이어서 65℃ 내지 68℃에서 12분간 0.2 x SSC 및 0.1 % SDS)에 노출되었다. 상기에 기반하여, 본 발명의 구현 예는 여기에 기술되고 당업계에 잘 알려진 중간, 높은 또는 매우 높은 스트린전시 조건하에서 알돌라제 또는 알코올 디하이드로게나제 효소를 인코딩하는 폴리뉴클레오티드 서열과 같은 임의의 참고 폴리뉴클레오티드 서열의 보체와 혼성화하는 폴리뉴클레오티드 서열을 포함하는 재조합 미생물을 포함한다.
폴리뉴클레오티드 및 그의 융합은 임의의 다양한 당업계에 잘 알려지고 입수가능한 확립된 기술을 사용하여 제조, 조작 및/또는 발현될 수 있다. 예를 들어, 본 발명의 폴리펩티드 또는 융합 단백질 또는 그의 기능적 동등체를 인코딩하는 폴리뉴클레오티드 서열은 적합한 숙주 세포에서 선택된 효소의 직접적인 발현을 지시하기 위해 재조합 DNA 분자에서 사용될 수 있다. 유전자 코드의 고유의 축증에 기인하여 실질적으로 같거나 또는 기능적으로 동등한 아미노산을 인코딩하는 다른 DNA 서열은 생성될 수 있고 이들 서열은 주어진 폴리펩티드를 클론하고 발현하기 위해서 사용될 수 있다.
당업자들에게 이해되는 바와 같이, 몇몇 경우에 자연적으로 일어나지 않는 코돈을 포함하는 폴리펩티드-인코딩 뉴클레오티드 서열을 생성하는 것은 유익할 수 있다. 예를 들어, 특정 원핵 또는 진핵 숙주 세포에 의해 선호되는 코돈은 선택되어 단백질 발현의 속도를 증가시킬 수 있으며 또는 자연적으로 일어나는 서열로부터 생성된 전사체의 반감기보다 긴 반감기와 같은 원하는 특성을 지닌 재조합 RNA 전사체를 생성할 수 있다. 그런 뉴클레오티드는 전형적으로 "코돈-최적화된"으로서 지칭된다. 여기에 기술된 임의의 뉴클레오티드 서열은 "코돈-최적화된" 형태로서 사용될 수 있다.
더욱이, 본 발명의 폴리뉴클레오티드 서열은 당업계에 잘 알려진 방법을 사용하여 가공되어 다양한 이유 때문에 폴리펩티드 인코딩 서열을 변형시킬 수 있고 이들 변형은 유전자 산물의 클로닝, 프로세싱, 발현 및/또는 활성을 변형하는 것을 포함하나 여기에 제한적이지는 않다.
원하는 폴리펩티드를 발현하기 위해서, 폴리펩티드 또는 기능적 동등체를 인코딩하는 뉴클레오티드 서열은 적합한 발현 벡터에 삽입될 수 있고, 이들 벡터는 삽입된 코딩 서열의 전사 및 번역을 위한 필요한 요소를 포함한다. 당업자들에게 잘 알려진 방법이 사용되어 관심 있는 폴리펩티드 및 적합한 전사 및 번역 조절 요소를 인코딩하는 서열을 포함하는 발현 벡터를 구축할 수 있다. 이들 방법은 in vitro 재조합 DNA 기술, 합성 기술, 및 in vivo 유전자 재조합을 포함한다. 그러한 기술은 Sambrook 등, Molecular Cloning, A Laboratory Manual (1989), 및 Ausubel 등, Current Protocols in Molecular Biology (1989)에 기술되어 있다.
관심 있는 폴리뉴클레오티드 서열로 형질전환된 숙주 세포는 세포 배양체로부터 단백질 발현 및 수거에 적합한 조건하에서 배양될 수 있다. 재조합 세포에 의해 생성되는 단백질은 서열 및/또는 사용되는 벡터에 따라 분비되거나 또는 세포내로 저장될 수 있다. 당업자들에게 이해되는 것과 같이, 본 발명의 폴리뉴클레오티드를 포함하는 발현 벡터는 디자인되어 인코딩된 폴리펩티드를 세포 내의 원하는 부위에 직접적으로 위치시킬 수 있는 신호 서열을 포함할 수 있다. 다른 재조합 구조체는 사용되어 관심 있는 폴리펩티드를 인코딩하는 서열을 인코딩된 단백질을 직접적으로 분비시키는 폴리펩티드 도메인을 인코딩하는 뉴클레오티드 서열에 연결시킬 수 있다.
본 발명의 구현 예는 알돌라제 활성, 알코올 디하이드로게나제 활성, 이중 결합 리덕타제 활성, 또는 다른 활성을 지닌 "폴리펩티드"를 포함하는 재조합 미생물의 사용을 고려하고, 범용화학제품을 생산하기 위해 끝이 절단된 변형체 및/또는 그의 변형된 폴리펩티드를 포함한다. "폴리펩티드", "폴리펩티드 단편", "펩티드" 및 "단백질"은 여기서 호환성 있게 사용되어 아미노산 잔기의 중합체 및 중합체의 변형체 및 합성 유사체를 지칭한다. 따라서, 이들 용어는 아미노산 중합체에 적용되며, 여기서 하나 또는 그 이상의 아미노산 잔기는 해당하는 자연적으로 일어나는 아미노산의 화학적 유사체와 같은 자연적으로 일어나지 않는 아미노산뿐만 아니라 자연적으로 일어나는 아미노산 중합체이다. 특정한 양상에서는, 폴리펩티드는 효소적 폴리펩티드 또는 전형적으로 다양한 화학 반응을 촉매(즉, 반응속도를 높이는)하는 "효소"를 포함할 수 있다.
상술 폴리펩티드 "변형체"는 적어도 하나의 아미노산 잔기의 추가, 결실 또는 치환에 의해 참고 폴리펩티드 서열과 구별되는 폴리펩티드를 지칭한다. 특정한 구현 예에서, 폴리펩티드 변형체는 보존적 또는 비보전적일 수 있는 하나 또는 그 이상의 치환에 의해 참고 폴리펩티드와 구별된다. 특정한 구현 예에서, 폴리펩티드 변형체는 보전적인 치환을 포함한다. 이 관점에서, 몇몇 아미노산은 상기 폴리펩티드의 활성 성질에는 변화없이 광범위적으로 유사한 성질을 갖는 다른 아미노산으로 변형될 수 있다. 폴리펩티드 변형체는 또한 하나 또는 그 이상의 아미노산이 첨가 또는 결실 또는 다른 아미노산 잔기로 치환된 폴리펩티드를 포함한다.
본 명세서에 포함된 변형 단백질은 "생물학적으로 활성"이 있다. 즉, 그들은 계속하여 참고 폴리펩티드의 효소학적 활성을 지니고 있다. 예를 들어, 그러한 변형체는 유전학적 다형성 또는 인간의 조작을 통해 발생한다. 참고 폴리펩티드 서열 의 생물학적으로 활성이 있는 변형체 또는 그의 단편은 디폴트 매개변수를 사용하여 그 밖의 여기에 기술된 서열 정렬 프로그램에 의해 결정되듯이 참고 단백질에 대한 아미노산 서열과 적어도 약 40%, 50%, 60%, 70%, 일반적으로 적어도 약 75%, 80%, 85%, 대개 약 90% 내지 95% 또는 그 이상, 및 전형적으로 약 98% 또는 그 이상의 서열 유사성 또는 동일성을 갖는다. 참고 폴리펩티드의 생물학적으로 활성이 있는 변형체는 일반적으로 그 단백질과 200, 100, 50 또는 20개의 아미노산 잔기 만큼 또는 적합하게는 1 내지 15 개의 아미노산 잔기 만큼, 1 내지 10개의 잔기, 6 내지 10 개의 잔기, 5개 잔기 만큼, 4, 3, 2 만큼 또는 심지어 1 개의 아미노산 잔기만큼 다를 수 있다. 몇몇 구현 예에서, 변형체 폴리펩티드는 참고 폴리펩티드와 적어도 하나, 하지만 15, 10 또는 5 개의 아미노산 잔기 미만의 개수만큼 다르다. 다른 구현 예에서, 그것은 참고 서열과 적어도 하나의 잔기, 하지만 잔기의 20%, 15%, 10% 또는 5% 미만만큼 다르다.
본 발명은 여기에 기술된 방법에서 임의의 효소 활성(예, 알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제 등)을 갖는 전장 참고 폴리펩티드의 변형체의 사용, 이들 전장 폴리펩티드의 끝이 잘린 단편의 사용, 끝이 잘린 절편의 변형체의 사용, 뿐만 아니라 그의 관련된 생물학적으로 활성이 있는 절편의 사용을 고려한다. 전형적으로 폴리펩티드의 생물학적으로 활성이 있는 절편은 상호 작용, 예를 들어, 분자 내 상호작용, 분자 간 상호작용에 참여한다. 분자 간 상호작용은 특이적 결합 상호작용 또는 효소학적 상호작용(예, 상호작용은 일시적일 수 있고 공유결합이 형성되거나 깨어짐)일 수 있다. 폴리펩티드/효소의 생물학적으로 활성이 있는 절편 및 여기에 기술된 효소 활성은 (잠정적인) 전장 참고 폴리펩티드 서열의 아미노산 서열과 충분히 유사하거나 또는 아미노산 서열로부터 유래된 아미노산 서열을 포함하는 펩티드를 포함한다. 전형적으로, 생물학적으로 활성이 있는 절편은 적어도 하나의 효소 활성을 지닌 도메인 또는 모티프를 포함하고 하나 또는 그 이상(몇몇 경우 모두)의 다양한 활성 도메인을 포함할 수 있다. 효소의 생물학적으로 활성이 있는 절편은 예를 들어, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 25, 26, 27, 28, 29,30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 450, 500, 600 개 또는 그 이상의 연속적이고 사이에 끼인 모든 정수를 포함하는 아미노산인 참고 폴리펩티드 서열의 폴리펩티드 절편일 수 있다. 특정한 구현 예에서, 생물학적으로 활성이 있는 단편은 여기의 그밖에 기술되어 있고 당업계에 알려진 바와 같이 보존된 효소학적 서열, 도메인, 또는 모티프를 포함하고 있다. 적합하게, 생물학적으로 활성이 있는 단편은 그것이 유래된 야생형 폴리펩티드의 활성의 약 1%, 10%, 25%, 50% 만큼이다.
알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제 또는 다른 참고 폴리펩티드는 아미노산 치환, 결실, 절단, 및 삽입의 다양한 방법으로 변형될 수 있다. 그러한 조작의 방법은 당업계에 일반적으로 알려져 있다. 예를 들어, 참고 폴리펩티드의 아미노산 서열 변형체는 DNA의 돌연변이에 의해 제조될 수 있다. 돌연변이 생성 및 뉴클레오티드 서열 변형에 대한 방법은 당업계에 잘 알려져 있다. 예를 들어, Kunkel (1985, Proc. Natl. Acad. Sci. USA. 82: 488-492), Kunkel 등, (1987, Methods in Enzymol, 154: 367-382), 미국 특허 제4,873,192호, Watson, J. D. 등, ("Molecular Biology of the Gene", Fourth Edition, Benjamin/Cummings, Menlo Park, Calif., 1987) 및 그들 중에 인용된 문헌을 참조한다. 관심있는 단백질의 생물학적 활성에 영향을 주지 않는 적합한 아미노산 치환에 대한 지침은 Dayhoff 등, (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D. C)의 모델에서 참고할 수 있다.
점변이(point mutation) 또는 절단에 의해 만들어진 조합 라이브러리의 유전자 생산물 스크리닝 방법 및 선택된 특성을 가진 유전자 생산물에 대한 cDNA 라이브러리를 스크리닝하는 방법은 당업계에 잘 알려져 있다. 그러한 방법은 알돌라제 또는 알코올 디하이드로게나제 폴리펩티드의 조합 돌연변이에 의해 생성된 유전자 라이브러리를 빠르게 스크리닝하는데 적용된다. 라이브러리에서 기능적 돌연변이의 빈도를 향상시키는 기술인 반복적인 앙상블 돌연변이 생성(REM)은 폴리펩티드 변형체를 확인하는 스크리닝 검사와 조합으로 사용될 수 있다(Arkin 및 Yourvan (1992) Proc. Natl. Acad. Sci. USA 89: 7811 -7815; Delgrave 등, (1993) Protein Engineering, 6: 327-331 ). 하나의 아미노산을 유사한 성질을 갖는 다른 아미노산으로 교환하는 보존적 치환은 하기에 보다 더 자세히 기술된 바와 같이 바람직할 수 있다.
폴리펩티드 변형체는 참고 아미노산 서열과 비교하여 그들의 서열상 다양한 위치에서 보존적인 아미노산 치환을 포함할 수 있다. "보존적인 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산으로 대체되는 것이다. 유사한 측쇄를 갖는 아미노산 잔기 패밀리는 당업계에 정의되어 있으며 하기와 같이 일반적으로 세부적으로서 분류될 수 있다:
산성: 잔기는 생리학적 pH 하에서 수소 이온의 상실로 인해 음성 전하를 가지며 또한 상기 잔기는 펩티드가 생리학적 pH하의 수성 매체 중에 있을 때 포함되는 펩티드 구조의 표면 위치를 찾고자 수용액에 의해 끌려진다. 산성 측쇄를 갖는 아미노산은 글루탐 산 및 아스파르트산을 포함한다.
염기성: 잔기는 생리학적 pH 하 또는 그의 하나 또는 두 pH 단위(예, 히스티딘) 안에서 수소 이온과의 결합에 의해 양성 전하를 갖고 펩티드가 생리학적 pH하의 수용액 상에 있을 때 포함되는 펩티드 구조의 표면 위치를 찾고자 수용액에 의해 끌려진다. 염기성 측쇄를 갖는 아미노산은 알지닌, 라이신 및 히스티딘을 포함한다.
전하성: 잔기는 생리학적 pH 하에서 전하를 갖고 산성 또는 염기성 측쇄를 갖는 아미노산을 포함한다(즉, 글루탐산,아스파르트산, 알지닌, 라이신 및 히스티딘).
소수성: 잔기는 생리학적 pH 하에서 전하를 갖지 않고 펩티드가 수성 매체 중에 있을 때 포함되는 펩티드 구조의 내부 위치를 찾고자 수용액에 의해 격퇴된다. 소수성 측쇄를 갖는 아미노산은 티로신, 발린, 이소류신, 류신, 메티오닌, 페닐알라닌 및 트립토판을 포함한다.
중성/극성: 잔기는 생리학적 pH 하에서 전하를 갖지 않고 수용액에 의해 충분히 격퇴되지 않아서 펩티드가 수성 매체 중에 있을 때 포함되는 펩티드 구조의 내부 위치를 찾는다. 중성/극성의 측쇄를 갖는 아미노산은 아스파라긴, 글루타민, 시스테인, 히스티딘, 세린 및 트레오닌을 포함한다.
이러한 설명은 그들의 측쇄가 소수성을 부여하기에 충분히 크지 않기 때문에 극성 그룹이 부족하더라도 어떤 아미노산을 "작은 것"으로 특성화한다. 프롤린을 제외하고 "작은" 아미노산은 적어도 하나의 극성 그룹이 측쇄에 존재할 때 4개의 탄소 또는 그보다 적은 탄소를 갖는 것들이고 적어도 하나의 극성 그룹이 측쇄에 존재하지 않을 때 3개의 탄소 또는 그보다 적은 탄소를 갖는 것들이다. 작은 측쇄를 갖는 아미노산은 글리신, 세린, 알라닌 및 트레오닌을 포함한다. 유전지로 인코딩되는 2차 아미노산 프롤린은 펩티드 체인의 2차 구조에 대한 그것의 알려진 효과에 기인하여 특별한 경우이다. 프롤린의 구조는 그것의 측쇄가 α-탄소뿐만 아니라 α-아미노 그룹의 질소에도 결합되어 있어서 다른 자연적으로 발생하는 아미노산과 다르다. 몇몇 아미노산 유사성 매트릭스(예, PAM120 매트릭스 및 PAM250 매트릭스)가 예를 들어, Dayhoff 등, (1978), A model of evolutionary change in proteins에 기술되어 있다. 그러나 M. O. Dayhoff, (ed.), Atlas of protein sequence and structure, Vol. 5, pp. 345-358, National Biomedical Research Foundation, Washington DC; 및 Gonnet 등, (Science, 256: 14430-1445, 1992)에서의 거리 관계를 결정하는 매트릭스는 프롤린을 글리신, 게린, 알라닌 및 트레오닌과 같은 그룹으로 포함한다. 따라서, 본 발명의 목적을 위해. 프롤린은 "작은" 아미노산으로 분류된다.
극성 또는 비극성으로 분류하는데 필요한 끌어당김 또는 격퇴의 정도는 임의적이므로, 본 발명에 의해 특별히 고려되는 아미노산은 하나 또는 다른 것으로 분류된다. 특별히 이름이 부여되지 않은 대다수의 아미노산은 알려진 거동에 기초하여 분류될 수 있다.
아미노산 잔기는 환 또는 비환 및 방향족 또는 비방향족, 잔기의 측쇄 치환기 그룹에 대한 자명한 분류, 및 작은 또는 큰으로서 추가로 세부 분류될 수 있다. 잔기는 카르복실 탄소를 포함하여 부가적인 극성 치환기가 존재한다면 전체 4개 탄소 또는 그보다 적은 탄소를 포함할 때 작은 것으로 고려된다. 부가적인 극성 치환기가 존재하지 않는다면 전체 3개 또는 그보다 적은 탄소일 때 작은 것으로 고려된다. 작은 잔기는 물론 항상 비방향족이다. 그들의 구조적 특성에 의존하여, 아미노산 잔기는 2개 또는 그 이상의 클래스로 분류된다. 자연적으로 발생하는 단백질 아미노산에 대해, 이러한 도식에 따른 세부 분류는 표 A에 나타낸다.
보존적 아미노산 치환은 또한 측쇄에 근거한 그룹화를 포함한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 그룹은 글리신, 알라닌, 발린, 류신 및 이소류신이다; 지방족 하이드록실 측쇄를 갖는 아미노산 그룹은 세린 및 트레오닌이다; 아미드-포함 측쇄를 갖는 아미노산 그룹은 아스파라긴 및 글루타민이다; 방향족 측쇄를 갖는 아미노산 그룹은 페닐알라닌, 티로신 및 트립토판이다; 염기성 측쇄를 갖는 아미노산 그룹은 라이신, 아르기닌 및 히스티딘이다; 또한 황-포함 측쇄를 갖는 아미노산 그룹은 시스테인 및 메티오닌이다. 예를 들어, 류신을 이소류신 또는 발린으로의 교체, 아스파르트산을 글루탐산으로의 교체, 트레오닌을 세린으로의 교체, 또는 아미노산을 구조적으로 관계있는 아미노산으로의 유사한 교체는 수득된 변형 폴리펩티드의 성질에 주요한 영향을 갖지 않을 것이다. 아미노산 변화가 기능적으로 절단된 및/또는 변형된 폴리펩티드를 유발하는지의 여부는 여기에 기술된 바(실시예 2-4을 참조)와 같이 효소 활성을 측정함으로써 결정될 수 있다. 보존적인 치환은 전형적인 치환을 필두로서 표 B에 나타낸다. 본 발명의 범주에 분류되는 아미노산 치환은 (a) 치환 지역에서 펩티드 백본의 구조, (b) 타겟 부위에서 분자의 전하 또는 소수성, 또는 (c) 측쇄의 부피를 유지하는데 그들의 효과에서 크게 다르지 않은 치환을 선택함과 일반적으로 동반한다. 치환이 도입된 후, 생물학적 활성에 대해 변형체가 스크리닝된다.
이와는 달리, 보존적 치환을 만드는 유사한 아미노산은 측 쇄의 동일성에 따라 3개의 카테고리로 그룹화된다. Zubay, G., Biochemistry, third edition, Wm.C. Brown Publishers (1993)에 기술된 바와 같이, 첫 번째 그룹은 모두 전하 된 측 쇄를 갖는 글루탐산, 아스파르트산, 아르기닌, 라이신을 포함한다; 두 번째 그룹은 글리신, 세린, 트레오닌, 시스테인, 티로신, 글루타민, 아스파라긴을 포함한다; 또한 세 번째 그룹은 류신, 이소류신, 발린, 알라닌, 프롤린, 페닐알라닌, 트립토판, 메티오닌을 포함한다.
따라서, 알돌라제 또는 알코올 디하이드로게나제 폴리펩티드에서 예측된 비필수 아미노산 잔기는 전형적으로 같은 측 쇄 패밀리로부터의 다른 아미노산 잔기로 교체된다. 이와는 달리, 돌연변이는 포화 돌연변이와 같이 코딩 서열의 모두 또는 부분에 걸쳐 무작위로 도입될 수 있고, 수득된 돌연변이체는 그 활성을 보유하는 돌연변이를 확인하고자 모체 폴리펩티드의 활성에 대해 스크리닝될 수 있다. 코딩 서열의 돌연변이 생성을 따라, 인코딩된 펩티드는 재조합적으로 발현될 수 있으며 펩티드의 활성이 결정될 수 있다. "비필수" 아미노산 잔기는 하나 또는 그 이상의 활성을 제거 또는 실질적으로 변형됨이 없이 구현 예 폴리펩티드의 야생형 서열로부터 변형될 수 있는 잔기이다. 적합하게는, 상기 변형은 이들 활성의 하나를 실질적으로 제거하지 않는다. 예를 들어 상기 활성은 야생형의 적어도 20%, 40%, 60%, 70% 또는 80% 100%, 500%, 1000% 또는 그 이상이다. "필수" 아미노산 잔기는, 참고 폴리펩티드의 야생형 서열로부터 변형되었을 때, 모체 분자의 활성의 제거를 야기해서 야생형 활성의 20% 미만이 존재한다. 예를 들어, 그러한 필수 아미노산 잔기는 다양한 유래로부터 폴리펩티드의 효소 부위에서 보존적인 서열을 포함하는 알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제 또는 다른 종에 걸친 다른 참고 폴리펩티드에서 보존적인 잔기이다.
따라서, 본 발명은 자연적으로 발생하는 참고 폴리펩티드 서열의 변형체 또는 그들의 생물학적으로 활성이 있는 절편을 또한 고려하며, 여기서 변형체는 자연적으로 발생하는 서열과 하나 또는 그 이상의 아미노산 잔기의 첨가, 결실 또는 치환에 의해 구별된다. 일반적으로, 변형체는 참고 폴리펩티드 서열에 대해 적어도 약 30, 40, 50, 55, 60, 65, 70, 75, 80, 85, 90, 91 , 92, 93, 94, 95, 96, 97, 98, 99 % 유사성 또는 서열 동일성을 나타낸다. 더욱이, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 그 이상의 아미노산의 첨가, 결실 또는 치환에 의해 자연적 또는 모체 서열과 다르나 모체 또는 참고 폴리펩티드 서열의 특성을 보유하는 서열도 고려된다.
몇몇 구현 예에서, 변형체 폴리펩티드는 참고 알돌라제 또는 알코올 디하이드로게나제 폴리펩티드 서열과 적어도 하나 하지만 50, 40, 30, 20, 15, 10, 8, 6, 5, 4, 3 또는 2 개의 아미노산(들) 미만에 의해 다르다. 다른 구현 예에서, 변형 폴리펩티드는 참고 폴리펩티드와 적어도 잔기의 1% 하지만 잔기의 20%, 15%, 10% 또는 5% 미만에 의해 다르다.(이들 비교가 정렬을 필요로 한다면, 서열은 최대 유사성을 위해 정렬되어야 한다. 결실 또는 삽입 또는 미스매치로부터의 "루프트(looped)" 아웃 서열은 다른 것으로 고려된다.)
특정한 구현 예에서, 변형 폴리펩티드는 참고 폴리펩티드의 해당 서열에 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91 %, 92%, 93%, 94% 95%, 96%, 97%, 98%, 또는 99% 또는 이상의 서열 동일성 또는 유사성을 가진 아미노산 서열을 포함하고 참고 폴리펩티드의 효소 활성도 보유한다. 상술된 "서열 동일성" 또는 예를 들어 여기서 사용된 "에 50% 동일한 서열"을 포함하는 서열 동일성이 비교 윈도우 상에서 뉴클레오티드 대 뉴클레오티드 또는 아미노산 대 아미노산에 대해서 동일한 정도를 지칭한다. 따라서, "서열 동일성의 백분율"은 비교 윈도우 상에서 2개의 최적으로 정렬된 서열을 비교, 매치된 위치 수를 생성하기 위해 동일한 핵산 염기(예, A, T, C, G, I) 또는 동일한 아미노산 잔기(예, Ala, Pro, Ser, Thr, GIy, VaI, Leu, lie, Phe, Tyr, Trp, Lys, Arg, His, Asp, GIu, Asn, GIn, Cys 및 Met)가 두 서열에서 일어나는 위치의 수를 결정, 매치된 위치의 수를 비교 윈도우 상(즉, 윈도우 크기)에서 전체 위치의 수를 나눔 및 서열 동일성의 백분율을 구하고자 상기 값에 100을 곱해줘서 계산될 수 있다.
두 개 또는 그 이상의 폴리뉴클레오티드 또는 폴리펩티드 간의 서열 관계를 기술하는 용어는 "참고 서열", "비교 윈도우", "서열 동일성", "서열 동일성의 백분율" 및 "실질적 동일성"을 포함한다. "참고 서열"은 길이 상 뉴클레오티드 및 아미노산 잔기를 포함하는 적어도 12개 하지만 자주 15 내지 18개 및 종종 적어도 25 단량체 단위이다. 두 개의 폴리뉴클레오티드가 각각 (1) 두 개의 폴리뉴클레오티드 사이에서 유사한 서열(완전한 폴리뉴클레오티드 서열의 오직 일부분) 및 (2) 두 개의 폴리뉴클레오티드 사이에서 다른 서열을 포함할 수 있기 때문에, 두 개 (또는 그 이상의) 폴리뉴클레오티드의 서열 비교는 전형적으로 "비교 윈도우" 상에서 두 개의 폴리뉴클레오티드의 서열을 비교하여 서열 유사성의 부분적 부위를 확인 및 비교함으로써 실시된다. "비교 윈도우"는 적어도 6개의 연속적인 위치, 일반적으로 약 50 내지 약 100개, 더욱 일반적으로 약 100 내지 약 150개의 개념적인 세그멘트를 지칭하고 여기서, 두 서열이 최적으로 정렬된 후에 서열이 같은 수의 연속적인 위치의 참고 서열과 비교된다. 비교 윈도우는 두 서열의 최적 정렬을 대한 참고 서열(첨가 또는 결실을 포함하지 않음)과 비교하여 20% 또는 그 미만의 첨가 또는 결실(즉, 격차)을 포함할 수 있다.
비교 윈도우 정렬을 위한 최적의 서열 정렬은 알고리듬(Wisconsin Genetics Software Package Release 7.0 GAP의 BESTFIT, FASTA, 및 TFASTA, 유전 컴퓨터 그룹, 575 사이언스 드라이브 메디슨, 위스콘신, 미국)의 컴퓨터화된 실행 또는 검사 및 임의의 선택된 다양한 방법에 의해 생성된 최적의 정렬(즉, 비교 윈도우 상에서 가장 높은 백분율의 상동성을 야기하는)에 의해 실행될 수 있다. 참고 문헌은 예를 들어, Altschul 등, 1997, Nucl. Acids Res. 25:3389에 기술된 바와 같이 프로그램의 BLAST 패밀리에 또한 만들어질 수 있다. 서열 분석에 자세한 논의는 Ausubel 등, "Current Protocols in Molecular Biology", John Wiley &Sons Inc, 1994-1998, Chapter 15의 유닛 19.3에서 찾을 수 있다.
"내인성의"라는 용어는 유전적으로 변형 안된 야생형 세포 또는 생명체에서 발견될 수 있는 자연적으로 발생하는 유전자, 폴리뉴클레오티드 서열 또는 폴리펩티드의 카피를 지칭한다. 예를 들어, 어떤 자연적으로 발생하는 대장균 또는 효모 종은 전형적으로 알돌라제 유전자를 포함하고 있지 않아서, 알돌라제 효소를 인코딩하는 "내인성의" 폴리뉴클레오티드 서열을 포함하고 있지 않다.
"외인성의"라는 용어는 야생형 세포 또는 생명체에서 자연적으로 일어나지 않는 폴리뉴클레오티드 서열 또는 핵산 분자 또는 폴리펩티드의 카피, 유전자 카피를 지칭한다. 이들은 통상적으로 분자 생물학적 방법에 의해 세포 내로 도입된다. 즉, 재조합 미생물을 생성하기 위해 가공된다. "외인성의" 유전자 또는 폴리뉴클레오티드의 예는 벡터, 원하는 단백질 또는 효소를 인코딩하는 플라스미드 및/또는 사람이 만든 핵산 구조체를 포함한다.
이러한 양상에서, 생명체가 내재적 또는 자연적으로 발생하는 소정의 폴리뉴클레오티드 서열 또는 유전자를 포함하고 있음에도 불구하고, 인코딩된 단백질을 과잉발현 또는 발현 조절하기 위해서 그 유전자 또는 관련된 서열을 인코딩하는 플라스미드 또는 벡터의 도입은 그 유전자 또는 폴리뉴클레오티드 서열의 "외인성의" 카피를 나타낸다. 또한, 어떤 구현 예에서, 내재적인 유전자 또는 폴리뉴클레오티드를 내재적인 유전자 발현 레벨을 증가시키기 위해 구조적 또는 유도가능한 프로모터 하에 위치시키는 것은 본 발명의 의미 안에서 외인성 유전자 또는 폴리뉴클레오티드로 또한 고려될 수 있다. 유사하게, 키메릭 유전자 또는 폴리펩티드를 생성하는 것과 같은 자연적으로 일어나지 않는 서열의 첨가에 의한 내재적인 유전자 또는 폴리뉴클레오티드의 변형도 또한 본 발명의 의미내에서 외인성 유전자 또는 폴리뉴클레오티드로 고려될 수 있다.
여기에 기술된 임의의 경로, 유전자, 폴리뉴클레오티드, 핵산 분자, 폴리펩티드 또는 효소는 "내인성의" 서열을 사용하거나 또는 의존하고, 그렇지 않다면 하나 또는 그 이상의 "외인성" 서열로서 제공될 수 있다.
본 발명은 또한 키메릭 또는 융합 폴리펩티드도 고려한다. 여기서 사용되는 "키메릭 단백질", "융합 단백질" 또는 "융합 폴리펩티드"는 제한 없이 두 번째, 세 번째, 또는 네 번째(또는 그 이상의) 폴리펩티드 또는 그의 단편(예, 복수의 단편을 생성하기 위해)에 연결되는 첫 번째 폴리펩티드 또는 그의 단편을 포함할 수 있다. 두 번째, 세 번째 또는 네 번째 폴리펩티드는 그러한 첫 번째 폴리펩티드의 어떤 단편과 선택적으로 연결시키기 위해서 첫 번째 폴리펩티드와 같은 폴리펩티드를 지칭할 수 있거나 또는 같거나 다른 생명체로부터 유래 되고 첫 번째 폴리펩티드와 다른 단백질에 해당하는 아미노산 서열을 전형적으로 갖는 "이종 기원의 폴리펩티드"를 지칭할 수 있다. 특정한 구현 예에서, 융합 단백질은 주어진 폴리펩티드 단백질의 생물학적으로 활성이 있는 부분의 적어도 하나(또는 둘, 셋, 넷 또는 그 이상)를 포함할 수 있다. 융합 단백질을 형성하는 폴리펩티드는 그들이 또한 C-말단에서 C-말단으로, N-말단에서 N-말단으로, 또는 N-말단에서 C-말단으로 연결될 수 있음에도 불구하고, 전형적으로 C-말단이 N-말단으로 연결되어 있다. 융합 단백질의 폴리펩티드는 임의의 순서일 수 있다.
융합 파트너는 그들이 바람직하지 않게 폴리펩티드의 활성에 영향을 주지 않는다면 임의의 원하는 목적을 필수적으로 위해 디자인되거나 포함될 수 있다. 예를 들어, 하나의 구현예에서, 융합 파트너는 본래의 재조합 단백질보다 높은 수율로 단백질을 발현하는데 도움(발현 향상자)이 되는 서열을 포함할 수 있다. 다른 융합 파트너는 선택되어 단백질의 용해도를 높이거나, 상기 단백질을 원하는 세포 내 구역으로 타겟팅하거나 단백질을 분비하거나 또는 단백질을 세포 표면에 속박한다. 일 예로서, 융합 단백질은 N-말단에 이종 기원의 신호 펩티드를 포함할 수 있다. 어떤 숙주 세포에서, 융합 폴리펩티드의 분비 또는 세포 표면 속박은 전형적으로 폴리펩티드의 N-말단 또는 그 근처에 융합된 하나 또는 그 이상의 이종 기원 신호 펩티드 서열을 사용하여 증가 될 수 있다.
"재조합" 미생물은 전형적으로 하나 또는 그 이상의 외인성 유전자 또는 플라스미드 또는 벡터와 같은 폴리뉴클레오티드를 포함한다. 재조합 미생물로서 사용될 수 있는 미생물의 예는, 제한 없이, 이스체리키아 콜라이, 아세토박터 아세티, 아크로모박터, 아시디필리움, 아시네토박터, 악티노마두라, 악티노플래인, 애로피룸 퍼닉스, 아그로박테리움, 알칼리진, 아나나스 코모수스(M), 아스로박터, 아스파질러스 니거, 아스파질러스 오리제, 아스파질러스 멜레우스, 아스파질러스 퍼브루엔투스, 아스파질러스 사이토이, 아스파질러스 소지, 아스파질러스 우사이이, 바실러스 알칼로필러스, 바실러스 아밀로리퀘파시엔스, 바실러스 브레비스, 바실러스 설쿠란스, 바실러스 클로시이, 바실러스 렌터스, 바실러스 리첸니포미스, 바실러스 마세란스, 바실러스 스티아로설모필러스, 바실러스 서브티리스, 비피도박테리움, 브레비바실러스 브레비스, 버크홀데리아 세파시아, 캔디다 실린드라세아, 캔디다 루고사, 칼리카 파파야 (L), 셀룰로시미크로비움, 세팔로스포리움, 채토미움 에라티쿰, 채토미움 그라사일, 클로스트리디움, 클로스트리디움 브티리쿰, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 설모셀룸, 코리네박테히움 (글루타미쿰), 코리네박테리움 에피시엔스, 이스체리키아 콜라이, 엔테로카쿠스, 어위나 크리산테미, 글리코노박터, 글루콘아세토박터, 할로아큘라, 휴미콜라 인솔엔스, 휴미콜라 엔솔렌스, 키타사토스포라 세태, 클렙실라, 클렙실라 옥시토카, 클루이브로마이세스, 클루이브로마이세스 플래길리스, 클루이브로마이세스 락티스, 코쿠리아, 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 세이크, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸오시티스, 메탄노로버스 시실리애, 메탄노게니움 오가노필룸, 메탄노박테리움 브라이언타이, 마이크로박테리움 임페리얼리, 마이크로코쿠스 라이소 데익티쿠스, 마이크로루나투스, 뮤콜자바니쿠스, 마이코박터, 마이로테시움, 나이트로박터, 나미트로소모나스, 노카디아, 파파야 카리카, 페디오코쿠스, 페디오코구스 할로필러스, 페니실리움, 페니실리움 카멤버티, 페니실리움 시트리넘, 페니실리움 에머소나이, 페니실리움 로퀘포티, 페니실리움 릴락티눔, 페니실리움 멀티컬러, 파라코쿠스 판토트로퍼스, 프로피온니박테리움, 수도모나스, 수도모나스 플루오레센스, 수도모나스 데니트리피칸스, 필오코쿠스, 필오코쿠스 퓨리오서스, 필오코쿠스 호리코사이, 리조비움, 리조뮤콜 미헤이, 리조뮤콜 퓨실루스 린트, 리조퍼스, 리조퍼스 델레마, 리조퍼스 자폰이쿠스, 리조퍼스 니비우스, 리조퍼스 오리재, 리조퍼스 올리고스포러스, 로도코쿠스, 사카로마이시스 세레비지애, 스클레로티나 리버티나, 스핑고박테리움 멀티보룸, 스핑고비움, 그핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이시스, 스트렙토마이시스 그리세우스, 스트렙토마이시스 리비단스, 스트렙토마이시스 무리누스, 스트렙토마이시스 루비기노수스, 스트렙토마이시스 바이오라세오루버, 스트렙토버티실리움 모바랜스, 테트라제노코쿠스, 서머스, 티오스패라 판토트로파, 트라미테스, 트리초더마, 트리초더마 롱지브라키아툼, 트리초더마 리에시이, 트리초더마 비리데, 트리초스포론 페니실라툼, 비브리오 알지노리티쿠스, 비브리오 스플렌디더스, 잔소모나스, 이스트, 앨로위아 리프리티카, 자이고사카로마이시스 룩사이, 자이모모나스, 및 자이모모누스 모빌리스를 포함한다.
"형질전환"은 외래 유전자가 숙주 세포 게놈에 흡수되고 병합되어 일어나는 세포의 영구적이고 유전가능한 변형을 일반적으로 지칭한다; 또한 외인성 유전자의 한 생명체의 게놈에서 다른 생명체의 게놈으로의 전달을 지칭한다.
"벡터"는 폴리뉴클레오티드가 삽입되고 클로닝되는 예를 들어, 플라스미드, 박테리오파지, 효모 또는 바이러스로부터 유래된 폴리뉴클레오티드, 바람직하게는 DNA 분자를 의미한다. 벡터는 바람직하게는 하나 또는 그 이상의 독특한 제한 부위를 포함하고 타겟 세포 또는 조직 또는 어버이 세포 또는 그의 조직을 포함하는 정의된 숙주 세포에서 자가적으로 복제를 할 수 있고, 또는 정의된 숙주의 게놈 내로 포함될 수 있어서 클로닝된 서열이 재생산가능하다. 따라서, 상기 벡터는 자가적으로 복제하는 벡터, 즉, 염색체 외로 존재하는 실체인 벡터이고 그들의 복제는 염색체 복제와 독립적이다. 예를 들어 그들은 선형 또는 닫힌 형의 원형 플라스미드, 염색체 외 요소, 미니-염색체 또는 인공 염색체이다. 상기 벡터는 자가복제를 보증하는 임의의 도구를 포함할 수 있다. 이와는 달리, 상기 벡터는 숙주 세포에 도입되었을 때 게놈에 병합되어 그것이 병합된 염색체(들)와 함께 복제될 수 있다. 그러한 벡터는 숙주 염색체의 특정하고 원하는 위치에 재조합될 수 있는 특이적 서열을 포함할 수 있다.
벡터 시스템은 단일 벡터 또는 플라스미드, 두 개 또는 그 이상의 벡터 또는 플라스미드를 포함하고 이들은 전체 DNA를 함께 보유하고 있고 숙주 세포의 게놈 또는 트랜스포손에 전체 DNA를 도입할 수 있다. 벡터의 선택은 벡터가 도입되는 숙주 세포와의 벡터의 호환성에 의존한다. 본 건에서, 상기 벡터는 바람직하게 사이아노박테리아 세포와 같은 대장균에서 작동가능하게 기능적인 벡터이다. 상기 벡터는 녹색 형광 단백질(GFP)과 같은 라포터 유전자를 포함할 수 있고, 이들은 인코딩된 하나 또는 그 이상의 폴리펩티드에 융합될 수 있거나 또는 별개로 발현될 수 있다. 상기 벡터는 또한 적합한 형질전환자 선택을 위해 사용될 수 있는 항생제 내성 유전자와 같은 선택 마커를 포함할 수 있다.
"야생형" 및 "자연적으로 발생하는"이라는 용어는 자연적으로 일어나는 유래로부터 분리되는 유전자 또는 유전자 생성물의 특징을 갖는 유전자 또는 유전자 생성물을 지칭하는데 호환적으로 사용된다. 야생형 유전자 또는 유전자 생성물(예, 폴리펩티드)은 개체군에서 가장 흔히 발견되는 것이고 따라서 임의대로 유전자의 "정상적인" 또는 "야생형" 형태로 디자인된다.
"바이오매스"의 예는 여럿 가운데서 수생 또는 바다 바이오메스, 과일 쓰레기와 같은 과일-기반 바이오매스, 및 야채 쓰레기와 같은 야채-기반 바이오매스를 포함한다. 수생 또는 바다 바이오메스의 예는 제한적이지는 않지만 갈조류, 자이언트 갈조류, 해초, 조류, 바다 미소식물, 미세조류, 시글래스(sea grass) 등을 포함한다. 과일 및/또는 야채 바이오매스의 예는 제한적이지는 않지만 여럿 가운데서 나무 껍질과 같은 펙틴의 임의의 근원 및 감귤, 오렌지, 그레이프플루트, 감자, 토마토, 포도, 망고, 구스베리, 당근, 사탕무 및 사과를 포함하는 찌꺼기를 포함한다. 어떤 양상에서는, 바이오매스는 지각(예, 천연가스, 무연탄 석탄 등과 같은 거의 순수한 탄소로 이루어진 비휘발성 물질)의 최상층에서 전형적으로 발견되는 탄화수소와 같은 탄소의 화석화된 근원을 포함하지 않는다.
"범용화학제품" 또는 "그의 중간체"는 일반적으로 바이오연료와 같은 화학물질과 연관이 있고 하기의 화학식을 가지며, 그것으로부터 생성될 수 있는 임의의 상응하는 알칸을 포함한다:
여기서, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2 CH3CH(CH3)(CH2)nCH2 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고,
n은 0 내지 30이다.
특정한 구현 예에서, 범용 화학 제품은 3-하이드록시-2,2,4 트리메틸펜타날, 2,2,4-트리메틸-1,3-펜틸디올, 및/또는 2,2,4-트리메틸펜탄이다. 어떤 구현 예에서, 범용 화학 제품은 3-하이드록시-2-에틸헥사날, 2-에틸-2-헥센-1-알, 2-에틸헥산날, 2-에틸헥사놀, 및/또는 2-에틸헥산이다. 특정한 구현 예에서, 범용 화학 제품은 3-하이드록시-2-부틸-1-옥타놀, 2-부틸-2-옥텐-1-알, 2-부틸-옥타날, 또는 2- 부틸-옥타놀이다.
특정한 양상에서, 2,2,4-트리메틸-1,3-펜탄디올 또는 2-에틸헥사놀과 같은 디올 또는 알코올은 추가로 화학적 또는 효소학적으로 각각 2,2,4-트리메틸펜탄 또는 2-에틸헥산과 같은 그의 상응하는 알칸으로 전환될 수 있다. 그러한 프로세스의 일 예는 "수소화반응"으로 또한 알려진 "수소처리"를 포함한다. 예를 들어, 2,2,4-트리메틸-1,3-펜탄디올, 2-에틸헥사놀, 및 2-부틸-옥타놀과 같은 알코올은 "수소처리"되어 그들의 상응하는 알칸인 2,2,4-트리메틸펜탄, 2-에틸헥산, 및 2-부틸-옥탄을 각각 형성할 수 있다. 석유 정제 시스템에서 "수소처리" 프로세스는 일반적으로 기능기 그룹을 지닌 분자에 수소를 촉매적으로 첨가하는 것을 지칭한다. 수소 처리 촉매제는 일반적으로 몰리브데늄, 니켈 및 코발트 옥사이드의 조합을 하소알루미나(calcined alumina) 입자에 처리함으로써 제형화된다. 알루미나 입자는 그 다음 상당히 높은 내부 표면적(매우 다공성)을 갖도록 제형화되고 제조된다. 촉매 금속은 상기 입자의 내부 표면에 "단일-원자적으로" 침착되고 분배될 수 있다. 수소처리(대 "수소 첨가 분해")에서 알루미나 표면은 전형적으로 가능한 비활성적(즉, 화학적으로 수동적인)으로 제형화되고 제조된다.
"바이오매스-유래 다당류"의 일반적인 예는 제한적이지는 않지만, 알기네이트, 아가, 카라기닌, 후코이단, 펙틴, 폴리갈락터로네이트, 셀룰로오스, 헤미셀룰로오스, 자일란, 아라비난 및 만난을 포함한다. 다당류, 올리고당, 단당류 또는 다른 바이오매스의 당 성분의 예는 제한적이지는 않지만, 알기네이트(예, polyG, polyMG, polyM), 올리고알기네이트(예, ΔM, ΔG, ΔMM, ΔMG, ΔGM, ΔGG, MM, MG, GM, GG, MMM, MGM, MMG, MGG, GMM, GMG, GGM, GGG), 아가, 카라기닌, 후코이단, 펙틴, 글루론네이트, 굴루론네이트, 만눌로네이트, 만니톨, 릭소오스, 셀룰로오스, 헤미셀룰로오스, 셀로바이오스, 글리세롤, 자일리톨, 글루코스, 만노스, 갈락토스, 자일로스, 자일란, 만난, 아라비안, 아라비노스, 글루커론네이트, 갈락터론네이트(디- 및 트리-갈락터론네이트 포함), 람노스 등을 포함한다.
알기네이트-유래 다당류의 특정한 예는 포화 다당류 예를 들어, β-D-만널론네이트, α-L-글루론네이트, 디알기네이트, 탈기네이트, 펜타알기네이트, 헥사알기네이트, 헵타알기네이트, 옥타알기네이트, 논알기네이트, 테가알기네이트, 언데카알기네이트, 도데카알기네이트 및 폴리알기네이트 뿐만 아니라 불포화 다당류, 예를 들어 4-디옥시-L-이리트로-5-헥소세울로오스 우론산, 4-(4-디옥시-베타-D-만-4-에누로노실)-D-만널로네이트 또는 L-굴루론네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-디알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-탈기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-테트라알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-펜타알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-헥사알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-헵타알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-옥타알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-논알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-언데카알기네이트, 및 4-(4-디옥시-베타-D-만-4-에누로노실)-도데카알기네이트를 포함한다.
펙틴-유래 다당류의 특정한 예는 포화 다당류, 예를 들어 갈락터론네이트, 디갈락터론네이트, 트리갈락터론네이트, 테트라갈락터론네이트, 펜타갈락터론네이트, 헥사갈락터론네이트, 헵타갈락터론네이트, 옥타갈락터론네이트, 노나갈락터론네이트, 데카갈락터론네이트, 도데카갈락터론네이트, 폴리갈락터론네이트, 및 람노폴리갈락터론네이트 뿐만 아니라 포화 다당류, 예를 들어 4-디옥시-L-트레오-5-헥소술로오스 우론네이트, 4-(4-디옥시-알파-D-글루크-4-에뉴로노실)-D-갈락터론네이트, 4-(4-디옥시-알파-D- 글루크-4-에누로노실)-D-디갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-트리갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-테트라갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-펜타갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-헥사갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-헵타갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-옥타갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D- 노나갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D- 데카갈락터론네이트, 및 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-도데카갈락터론네이트를 포함한다.
"적합한 단당류" 또는 "적합한 당류"는 일반적으로 탄소의 근원 또는 유일한 근원으로서 펙틴, 알기네이트 또는 다른 당류(예, 갈락터론네이트, 셀룰로오스, 헤미-셀룰로오스 등을 포함하는 바이오매스-유래 다당류)에서 성장하는 재조합 미생물에 의해 생성될 수 있는 임의의 당류를 지칭하고 바이오연료 또는 바이오 휘발유와 같은 탄화수소를 생성하기 위한 본 발명의 바이오연료 생합성 경로에서 사용되는 임의의 당류를 또한 일반적으로 지칭한다. 적합한 단당류 또는 올리고당의 예는 제한적이지는 않지만 2-케토-3-디옥시 D-글루코네이트(KDG), D-만니톨, 글루론네이트, 만누론네이트, 만니톨, 릭소오스, 글리세롤, 자일리톨, 글루코스, 만노스, 갈락토스, 자일로스, 아라비노스, 글루커론네이트, 갈락터론네이트, 및 람노스 등을 포함한다. 여기에 주지된 바와 같이, 여기서 사용되는 "적합한 단당류" 또는 "적합한 당류"는 가공된 또는 재조합 미생물에 의해 생성될 수 있고 이것은 미국 특허 제 12/245,537호 및 제 12/245,540호에 그런 미생물을 설명하기 위해 여기에 참고로 포함되어 있으며 상업적인 입수가능한 출처로부터 수득될 수 있다.
여기에서 사용되는 상술 "최적화된"는 본래의 분자 또는 본래의 세포 환경(예, 주어진 폴리펩티드의 야생형 서열 또는 야생형 미생물)에 관한 기능적 특성을 향상시키고자 폴리펩티드의 아미노산 서열을 유전적으로 변경 또는 폴리펩티드의 주위 세포 환경을 변경/변화에 의한 것과 같은 변형된 생물학적 활성을 갖는 경로, 유전자, 폴리펩티드, 효소 또는 다른 분자를 지칭한다. 여기에 기술된 임의의 폴리펩티드 또는 효소는 경우에 따라 "최적화"될 수 있고, 여기에 기술된 임의의 유전자 또는 뉴클레오티드 서열은 경우에 따라 최적화된 폴리펩티드 또는 효소를 인코딩할 수 있다. 여기에 기술된 임의의 경로는 경우에 따라 하나 또는 그 이상의 "최적화된" 효소 또는 최적화된 효소 또는 폴리펩티드를 인코딩하는 하나 또는 그 이상의 뉴클레오티드 서열을 포함할 수 있다.
전형적으로, 폴리펩티드, 효소, 또는 다른 분자의 향상된 기능적 특성은 알데히드 및/또는 케톤을 이소옥탄과 같은 바이오연료로 전환하는 생물학적 경로(예, 알데히드 및/또는 케톤 생합성 경로, 알돌라제, 알코올 디하이드로게나제)에서 사용하기 위한 폴리펩티드 또는 다른 분자의 적합성과 관련한다. 따라서, 특정한 구현 예는 "최적화된" 생물학적 경로의 사용을 고려한다. 대표적인 "최적화된" 폴리펩티드는 그것의 아미노산 코딩 서열에서 하나 또는 그 이상의 변형 또는 돌연변이(예, 점 돌연변이, 결실, 이종 기원 서열의 첨가)를 포함할 수 있어서 소정의 미생물 시스템 또는 미생물에서의 향상된 발현 및/또는 안정성을 용이하게 하고, 원하는 기질에 대한 폴리펩티드 활성의 조절(예, 유도할 수 있는 또는 억제할 수 있는 활성)을 가능하게하고, 세포 내에서 폴리펩티드의 위치(예, 세포 내 위치, 세포외 분비)를 조절하고, 및/또는 원하는 기질에 대한 폴리펩티드의 전체 활성 레벨에 영향을 준다(예, 효소 활성을 감소 또는 증대한다). 폴리펩티드 또는 다른 분자는 시스템 또는 유기물 내에서 하나 이상의 경로를 변화시킴으로써 상기 발현(예, 상승 조절), 국재화(localization) 및/또는 "최적화된" 폴리펩티드 또는 다른 분자의 활성을 조절하는 경로를 변화시킴으로써, 또는 다른 변화 중에서 바람직하지 않은 부산물의 생성을 최소화하는 경로를 변화시킴으로써 소정의 미생물 시스템 또는 미생물과 함께 사용하기 위해 "최적화"될 수 있다. 이러한 방식으로 폴리펩티드 또는 다른 분자는 야생형의 아미노산 서열 또는 본래의 화학 구조를 변형하여 또는 변형 없이 "최적화"될 수 있다. 최적화된 폴리펩티드 또는 생물학적 경로는 예를 들어, 당업계에 알려진 기술에 따라 직접적인 돌연변이 또는 원하는 형질에 대한 자연적인 선택에 의해 얻어질 수 있다.
특정한 양상에서, "최적화된" 유전자 또는 폴리펩티드는 참고(예, 야생형) 유전자 또는 폴리펩티드의 뉴클레오티드 또는 아미노산 서열과 50% 내지 99% 동일한(이들 사이에 있는 모든 정수를 포함) 뉴클레오티드 서열 또는 아미노산 서열을 포함할 수 있다. 특정한 양상에서, "최적화된" 폴리펩티드 또는 효소는 참고 폴리펩티드의 생물 활성의 약 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 100 (이들 사이에 있는 모든 정수 및 소숫점을 포함, 예, 1.2, 1.3, 1.4, 1.5, 5.5, 5.6, 5.7, 60, 70, 등), 또는 그 이상 배수의 활성를 가질 수 있다.
본 발명의 특정한 양상은 또한 여기에 기술된 방법 및 재조합 미생물에 따라 생성된 바이오연료와 같은 범용 화학 제품을 포함한다. 그러한 바이오연료(예, 중간 내지 긴 쇄 알칸, 이소옥탄)는 방사성 탄소 연대 측정법에 의해서 조 탄소 근원으로부터 고전적인 정제에 의해 생성된 연료와 같은 다른 연료와 구별될 수 있다. 예를 들어, 탄소는 2개의 안정한 비방사성 동위원소를 가지고 있다: 탄소-12 (12C), 및 탄소-13 (13C). 게다가, 지구상에는 소량의 불안정한 동위원소인 탄소-14(14C)도 존재한다. 탄소-14는 5730년의 반감기를 가지고 있고, 이 동위 원소를 더 많이 생산하는 지구 대기 중의 질소에 대한 우주선의 끊임없는 영향이 없었다면 지구상에서 오래 전에 사라졌을 것이다. 우주선 상호작용으로부터 나오는 중성자는 대기상의 질소 분자(N2)의 원자에서의 핵 반응에 참여한다:
식물 및 다른 광합성 생명체는 광합성에 의해 공기중의 이산화탄소를 섭취한다. 다수의 식물이 동물에게 섭취되기 때문에, 지구상의 모든 살아있는 생명체는 탄소-14를 그들이 존재하는 동안 그들의 환경과 항상 교환한다. 생명체가 죽으면, 이러한 교환은 멈추고, 탄소-14의 양이 방사성 베타 붕괴를 통해 시간에 걸쳐서 점차적으로 감소한다.
원유 및 채광 작업으로부터 유래하는 천연 가스와 같은 대수의 탄화수소-기반 연료는 지질학적 시간에 걸친 고대 유기 물질(예, 유모(kerogen))의 압축 및 가열의 결과이다. 석유의 형성은 전형적으로 고온 및/또는 고압에서 다양한 주로 흡열 반응에서 탄화수소의 열분해로부터 일어난다. 오늘날의 기름은 산소 결핍하에서 대량으로 바다 또는 호수 밑바닥에 정착한 선사세대의 동물성 플랑크톤 및 조류의 보전적인 유해로부터 형성된다(선사시대의 육상 식물의 유해는 이와는 반대로 석탄을 형성한다). 지질학적 시간에 걸쳐, 유기 물질이 진흙과 혼합되고 거대한 침전물의 층에 묻혀 높은 수준의 열과 압력을 야기 시킨다(속성작용으로 알려짐). 이러한 프로세스가 유기 물질을 화학적으로 변하게 만들어 첫째로 세계의 다양한 오일 셰일에서 발견되는 유모로 알려진 밀랍 물질을 이루고, 그 후 더 많은 열과 함께 작용하여 퇴화 작용으로 알려진 프로세스에서 액체 및 기체의 탄화수소를 생성한다. 원유로부터 유래 된 대다수의 탄화수소 기반 연료는 지질학적 시간에 걸쳐 탄소-14 붕괴의 절차를 겪어서 탐지할 수 있는 탄소-14가 없다. 대조적으로, 본 발명의 살아있는 미생물에 의해 생성되는 어떤 바이오연료는 현재 모든 다른 살아있는 생물체와 비교할 만한 수준인 탄소-14를 포함하고 있을 것이다(즉, 평형 레벨). 이러한 방식으로, 본 발명의 탄화수소 기반 바이오연료의 탄소-12 대 탄소-14의 비율을 측정 및 그 비율을 원유로부터 유래 된 탄화수소 기반 연료와 비교하여, 여기서 제공된 방법으로 생성된 바이오연료를 통상적인 탄화수소 기반 연료의 근원과 구조적으로 구별할 수 있다.
본 발명의 구현 예는 알데히드, 케톤 또는 그 둘의 근원을 가지고 재조합 미생물을 성장시키는 것을 포함하는 범용 화학 물질을 생성하는 방법을 포함하고 여기서, 재조합 미생물은 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드(즉, 하나 또는 그 이상의 폴리뉴클레오티드) 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드(즉, 하나 또는 그 이상의 폴리뉴클레오티드)를 포함하고 범용 화학 제품을 생성한다. 어떤 구현 예에서, 재조합 미생물은 또한 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 특정한 구현 예에서, 적어도 하나 또는 둘의 폴리뉴클레오티드는 외인성 폴리뉴클레오티드이다. 어떤 구현 예에서, 각 폴리뉴클레오티드는 외인성이다.
본 발명의 구현 예는 또한 재조합 미생물을 포함하고 있으며, 이들 미생물은 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 특정한 구현 예에서, 그러한 미생물은 또한 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 특정한 구현 예에서, 적어도 하나 또는 둘의 폴리뉴클레오티드는 외인성 폴리뉴클레오티드이다. 어떤 구현 예에서, 각 폴리뉴클레오티드는 외인성이다. 이들 재조합 미생물은 전형적으로 알데히드, 케톤 또는 그 둘의 근원으로부터 범용화학제품 또는 그의 중간체를 생성할 수 있다.
본 발명의 구현 예는 또한 재조합 미생물을 포함하고 있으며, 이들 미생물은 (i) 알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 특정한 구현 예에서, 그러한 미생물은 또한 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 특정한 구현 예에서, 적어도 하나 또는 둘의 폴리뉴클레오티드는 외인성 폴리뉴클레오티드이다. 어떤 구현 예에서, 각 폴리뉴클레오티드는 외인성이다. 이들 재조합 미생물은 전형적으로 알데히드, 케톤 또는 그 둘의 근원으로부터 범용화학제품 또는 그의 중간체를 생성할 수 있고, 또한 적합한 단당류 또는 올리고당류로부터 알데히드, 케톤 또는 그 둘의 상기 근원을 생성할 수 있다.
상기 주지된 바와 같이, 어떤 구현 예에서, 재조합 미생믈은 이중 결합 리덕타제 활성을 갖는 폴리펩티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 또한 포함한다. 이들 및 관련된 구현 예에서, 외인성 이중 결합 리덕타제 또는 디하이드라타제의 존재 또는 과잉발현은 그러한 반응이 내재적인 리덕타제 및 디하이드라타제 효소에 의해 촉매될 수 있기 때문에 원하는 생산물(예, 이소옥탄)을 만드는데 필요하지 않을 수 있지만 재조합 미생물에 의해 생성되는 원하는 생성물의 양을 증가시키는데 사용될 수 있다.
여기에서 사용되는 것과 같이. "알돌라제" 활성을 갖는 효소 또는 폴리펩티드는 D-플럭토오스-1,6-비스포스페이트를 절단하여 디하이드록시아세톤 포스페이트 및 D-글리세알데히드-3-포스페이트를 형성하는 가역반응을 촉매할 수 있는 효소 클래스를 일반적으로 지칭한다. 알돌라제 효소는 모든 동물 및 식물 조직 및 다수의 미생물에 존재한다. 동물 및 고등 식물 조직에서 발견되는 클래스 I 알돌라제는 전형적으로 2가 금속 보조인자를 필요하지 않음 및 기질인 디하이드록시아세톤 포스페이트와 케티민 쉬프(ketimine Schiff) 염기 중간체의 형성으로 특성화된다. 전형적으로 효모 및 대장균과 같은 미생물에서 발견되는 클래스 II 알돌라제는 금속 보조인자를 필요로 하며 EDTA에 의해 저해될 수 있다.
하나의 대표적인 알돌라제인 플럭토오스 1,6-비포스페이트 알돌라제 (알돌라제 A)는 해당작용 및 에너지 생성의 주요 반응을 촉매한다. 알돌라제 B는 알돌라제 A의 동질효소(isoenzyme)로서 플럭토오스 1-포스페이트를 절단하여 글리세알데히드 및 디하이드록시아세톤 포스페이트를 형성할 수 있다. 그러나 이 반응은 가역성이라서 글리세알데히드 및 디하이드록시아세톤 포스페이트를 농축하는데 사용될 수 있다.
글리세알데히드 및 디하이드록시아세톤 포스페이트의 농축을 넘어서, 알돌라제 효소는 알데히드 및/또는 케톤 간의 다른 유용한 농축 반응을 촉매한다고 알려져 있다. 특히, 이들 촉매 활성의 가역적 성질은 알데히드 및/또는 케톤의 다양한 조합의 농축 생성물로부터 다양한 범용화학제품 또는 그의 중간체를 생성하는데 유용한 것으로 나타났다. 예를 들어, 본 발명의 알돌라제 효소는 2개 분자의 이소부틸알데히드의 농축을 촉매하여 3-하이드록시-2,2,4-트리메틸 펜타날을 형성할 수 있다. 다른 예로서, 본 발명의 알돌라제 효소는 2개 분자의 부틸알데히드의 농축을 촉매하여 3-하이드록시-2-에틸헥사날을 형성할 수 있다. 다른 예로서, 본 발명의 알돌라제 효소는 2개 분자의 헥산알데히드의 농축을 촉매하여 2-부틸-옥타날을 형성할 수 있다.
따라서, 특정한 양상에서, 상술된 "알돌라제"는 다양한 알데히드 및/케톤의 응축을 촉매할 수 있는 효소를 지칭하며, 알데히드의 예는 여럿 중의 아세토알데히드, 프로피온알데히드, 글루타르알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 헥사알데히드, 헵타알데히드, 옥타알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4- 하이드록시페닐) 아세트알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드, 및/또는 숙시네이트 4-하이드록시페닐 아세토알데히드이고 그의 조합을 포함한다. 알데히드 및/또는 케톤의 응축은 화합물을 생성하는데 사용될 수 있고, 그 화합물은 당업자에게 인식될 수 있는 여럿 중에서 프로파날, 부타날, 이소부타날, 펜타날, 2-메틸부타날, 3-메틸부타날, 헥사날, 2-메틸펜타날, 3-메틸펜타날, 4-메틸펜타날, 헵타날, 옥타날, 2-메틸헵타날, 노나날, 데카날, 언데카날, 도데카날이다.
여기서 사용되는 "알돌라제" 효소 또는 "알돌라제"는 아실-아실 운반체 단백질 (ACP) 활성, 예를 들어 ACP 티오에스터라제 활성을 갖는 효소를 또한 포함한다. 그러한 ACP 에스터라제는 전형적으로 효소 활성 조건하에서 지방 아실-ACP 기질(예, C8 내지 C14)로부터 자유 지방산(들)을 생성함을 촉매하는 능력을 갖는다. 그러나, 아실-ACP 에스터라제는 이소부틸알데히드 및 부틸알데히드와 같은 2개의 알데히드 및/또는 케톤의 농축을 촉매하여 각각 3-하이드록시-2,2,4-트리메틸펜타날 및 2-에틸-2-헥센-1-알과 같은 해당 알킬 알데히드를 형성할 수 있다.
그런 에스터라제는 여기에 제공된 특이적 예제 서열 및 관계된 유래로부터 수득될 수 있다. 예를 들어, 쿠페아(Cuphea) 속의 몇몇 종은 예를 들어, 프로컴벤스, 루테아, 후케하나, 히소피폴리아, 라이티 및 인플라타의 그들 씨앗에 중간 쇄 지방산을 포함하는 트리글리세리드를 축적한다. 중간 쇄 지방산의 다른 자연적 식물 유래는 로라시에(Lauraceae) 패밀리(예, 피사(악티노도픈 후케리(Actinodophne hookeri)) 및 스윗 베이 (로러스 노빌리스(Laurus nobilis)))의 씨이다. 다른 식물 유래는 C14 지방산을 축적하고 있다고 보고된 미리스티카과(Myristicaceae), 소태나무과(Simarubaceae), 보키시아과(Vochysiaceae), 및 살바도라과(Salvadoraceae), 및 에리스마(Erisma), 피크람니아 및 비롤라의 우림 종을 포함한다. FATB1 및 FATB2를 포함하는 알돌라제 활성을 갖는 대표적인 에스터라제는 미국 특허 제 5,298,421호, 제 5,304,481호, 제 5,344,771호, 제 5,455,167호, 및 제 5,667,997호 및 Yuan 등 (PNAS USA 92:10639-634, 1995)에 기술되어 있으며, 그들의 ACP-아실 티오에스터라제 폴리뉴클레오티드 및 폴리펩티드 서열을 위해 참고로 여기에 포함된다.
특정한 구현 예에서, 재조합 미생물은 알돌라제 활성을 갖는 폴리펩티드를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드 서열을 포함할 수 있으며, 여기서, 폴리뉴클레오티드는 SEQ ID NOS:215-222 또는 여기에 기술되고 당업계에 알려진 조건하에서 그들의 상보체와 혼성화하는 폴리뉴클레오티드 서열과 80%, 85%, 90%, 95%, 97%, 98%, 99%의 서열 동일성을 갖는다. SEQ ID NO:215는 쿠페아 후커리아나로부터의 FATB2 효소를 인코딩한다. SEQ ID NO:216는 쿠페아 란세올라타로부터 FATB3 효소를 인코딩한다. SEQ ID NOS:217 및 218는 쿠페아 란세올라타로부터 케토아실-ACP 신타제 IV (KASIV)를 인코딩한다. SEQ ID NO:219은 쿠페아 란세올라타로부터 ACP1-2 효소를 인코딩한다. SEQ ID NO:220은 쿠페아 란세올라타로부터 ACP1-3 효소를 인코딩하고 및 SEQ ID NO:221은 쿠페아 란세올라타로부터 ACP1-1 효소를 인코딩한다. SEQ ID NO:222는 쿠페아 란세올라타로부터 Acl1을 인코딩한다.
알돌라제 효소는 또한 여럿 중의 털모토가 마리티마 및 이스케리키아 콜라이 DH 1OB와 같은 유기체로부터 수득될 수 있다. 예를 들어, 어떤 구현 예에서, 알돌라제 효소는 SEQ ID NOS:51-82로 나타낸 폴리뉴클레오티드 참고 서열 및/또는 이들 폴리뉴클레오티드 참고 서열에 의해 인코딩되는 폴리펩티드 참고 서열에 기초를 둘 수 있다. 따라서, 본 발명의 특정한 재조합 미생물은 여기에 기술되어 있고 당업계에 알려진 바와 같이 SEQ ID NOS: 51-82 또는 중간 또는 고 스트린전시 조건하에서 그들의 상보체와 혼성화하는 폴리뉴클레오티드와 80%, 85%, 90%, 95%, 97%, 98%, 99%의 서열 동일성을 갖는 하나 또는 그 이상의 폴리뉴클레오티드 서열을 포함할 수 있다.
본 발명의 특정한 "알돌라제" 효소 또는 그 효소를 인코딩하는 폴리뉴클레오티드 서열은 특정의 보전적인 모티프 또는 도메인에 의해 또한 특성화될 수 있다. 이러한 관점에서, 이스체리키아 콜라이 DH 1Oβ로부터 20 개의 알돌라제 효소를 포함하는 다양한 아미노산 서열이 PROSITE 데이터베이스를 사용하여 공동 서열 모티프에 대해 분석되었다. 다수의 이들 서열은 알려진 서열 프로파일에 강한 매치를 생성하였다. ECDH10B0008 (SEQ ID NO:63)에 의해 인코딩된 ALDOL1, EC ECDH10B0894 (SEQ ID NO:64)에 의해 인코딩된 ALDOL2, ECDH10B2629 (SEQ ID NO:72)에 의해 인코딩된 ALDOL10, ECDH10B4135 (SEQ ID NO:81 )에 의해 인코딩된 ALDOL19는 모티프인 "트랜스알돌라제 시그너쳐 1" 및 "트랜스알돌라제 시그너쳐 2"를 공유한다(아래 표 4를 참조). 또한, ECDH10B1991 (SEQ ID NO:67)에 의해 인코딩된 ALDOL 5는 2개의 모티프인 "KDPG 및 KHG 알돌라제 활성 부위" 모티프 및 "KDPG 및 KHG 알돌라제 쉬프-염기 형성 잔기" 모티프를 포함하고(아래 표 4를 참조), 및 ECDH10B2249 (SEQ ID NO:68)에 의해 인코딩된 ALDOL6, ECDH10B3100 (SEQ ID NO:74)에 의해 인코딩된 ALDOL12, ECDH10B3310 (SEQ ID NO:78)에 의해 인코딩된 ALDOL16은 모티프인 "플럭토오스-비스포스페이트 알돌라제 클래스-ll 시그너쳐 1" 및 "플럭토오스-비스포스페이트 알돌라제 클래스-ll 시그너쳐 2"를 공유한다(아래 표 4를 참조).
대표적인 알돌라제 모티프는 하기 표 3에 나타나고, ECDH10B (E. 콜라이 DH10B) 알돌 서열 단편 매치는 표 4에 나타난다.
따라서, 특정한 구현 예에서, 본 발명의 재조합 미생물은 알돌라제 효소 또는 폴리펩티드를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드를 포함할 수 있고, 여기서 알돌라제 효소 또는 폴리펩티드는 표 3 및 4에 예시된 하나 또는 그 이상의 도메인 또는 모티프, 또는 이들 모티프의 생물학적으로 활성이 있는 변형체를 포함한다. 이들 변형체는 알데히드 및/또는 케톤의 다양한 조합의 농축의 촉매를 용이하게 할 수 있다.
"알코올 디하이드로게나제" 활성을 갖는 효소 또는 폴리펩티드는 일반적으로 알데히드 또는 케톤 치환기를 알코올 또는 디올로 전환시키는 것을 촉매하는 효소를 지칭하고, 2차 알코올 디하이드로게나제를 포함할 수 있다. 예를 들어, 2,2,4-트리메틸펜타날은 알코올 디하이드로게나제(Adh) 활성을 갖는 효소에 의해 2,2,4-트리메틸-1,3-펜탄디올로 환원될 수 있고, 이는 이소부틸알데히드를 이소옥탄으로 전환하는 하나의 효소 단계를 나타낸다.
특정한 양상에서, 재조합 미생물은 SEQ ID NOS:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 30, 31, 33, 및 83-96으로부터 선택된 뉴클레오티드 참고 서열에 의해 인코딩되는 하나 또는 그 이상의 알코올 디하이드로게나제, 또는 임의의 이들 폴리뉴클레오티드 서열에 의해 인코딩되고 SEQ ID NOS:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 및 34에서 선택된 폴리펩티드 서열과 같은 폴리펩티드 또는 효소를 포함할 수 있고, 이들은 생물학적으로 활성이 있는 단편 또는 최적화된 변형체와 같은 그의 변형체를 포함한다. 본 발명의 특정한 재조합 미생물은 SEQ ID NOS:1-34 또는 83-96에 80%, 85%, 90%, 95%, 97%, 98%, 99% 서열 동일성을 갖는 하나 또는 그 이상의 뉴클레오티드 서열 또는 폴리펩티드 서열을 포함할 수 있다.
상기에 언급된 알코올 디하이드로게나제 서열에 대해, SEQ ID NO:1는 뉴클레오티드 서열이고 SEQ ID NO:2는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-1: PP_1946)의 폴리펩티드 서열이다. SEQ ID NO:3은 뉴클레오티드 서열이고 SEQ ID NO:4는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-2: PP_1817)의 폴리펩티드 서열이다.
SEQ ID NO:5는 뉴클레오티드 서열이고, SEQ ID NO:6는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-3: PP_1953)의 폴리펩티드 서열이다. SEQ ID NO:7는 뉴클레오티드 서열이고, SEQ ID NO:8는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-4: PP_3037)의 폴리펩티드 서열이다.
SEQ ID NO:9는 뉴클레오티드 서열이고, SEQ ID NO:10는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-5: PP_1852)의 폴리펩티드 서열이다. SEQ ID NO:11는 뉴클레오티드 서열이고, SEQ ID NO:12는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-6: PP_2723)의 폴리펩티드 서열이다.
SEQ ID NO:13는 뉴클레오티드 서열이고 SEQ ID NO:14는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-7: PP_2002)의 폴리펩티드 서열이다. SEQ ID NO:15는 뉴클레오티드 서열이고 SEQ ID NO:16는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-8: PP_1914)의 폴리펩티드 서열이다.
SEQ ID NO:17는 뉴클레오티드 서열이고 SEQ ID NO:18는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-9: PP_1914)의 폴리펩티드 서열이다. SEQ ID NO:19는 뉴클레오티드 서열이고 SEQ ID NO:20는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-10: PP_3926)의 폴리펩티드 서열이다.
SEQ ID NO:21는 뉴클레오티드 서열이고 SEQ ID NO:22는 수도모나스 플루오레센스(Pseudomonas fluorescens) Pf-5로부터 분리된 2차 알코올 디하이드로게나제(2adh-11: PP_1756)의 폴리펩티드 서열이다. SEQ ID NO:23는 뉴클레오티드 서열이고 SEQ ID NO:24는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578(Klebsiella pneumoniae subsp. pneumoniae MGH 78578) 로부터 분리된 2차 알코올 디하이드로게나제(2adh-12: KPN_01694)의 폴리펩티드 서열이다.
SEQ ID NO:25는 뉴클레오티드 서열이고 SEQ ID NO:26는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-13: KPN_02061)의 폴리펩티드 서열이다. SEQ ID NO:27는 뉴클레오티드 서열이고 SEQ ID NO:28은 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-14: KPN_00827)의 폴리펩티드 서열이다.
SEQ ID NO:29는 뉴클레오티드 서열이고 SEQ ID NO:30는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-16: KPN_01350)의 폴리펩티드 서열이다. SEQ ID NO:31는 뉴클레오티드 서열이고 SEQ ID NO:32는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-17: KPN_03369)의 폴리펩티드 서열이다. SEQ ID NO:33는 뉴클레오티드 서열이고 SEQ ID NO:34는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-18: KPN_03363)의 폴리펩티드 서열이다.
SEQ ID NOS:83-96의 폴리뉴클레오티드 서열을 인코딩하는 알코올 디하이드로게나제는 수도모나스 퓨티다(Pseudomonas putida)로부터 수득되었다.
어떤 양상에서, 알코올 디하이드로게나제(adh), 2차 알코올 디하이드로게나제(2adh), 단편, 변형체, 또는 그의 유도체 또는 그러한 활성 부위를 사용하는 임의의 다른 효소는 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드(NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트(NADP+), 또는 NADPH 결합 모티프를 포함할 수 있다. 어떤 구현 예에서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프는 Y-X-G-G-X-Y (SEQ ID NO:245), Y-X-X-G- G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X-Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X-G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y- X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X-X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택될 수 있다; 여기서 Y는 알라닌, 글리신 및 세린으로부터 독립적으로 선택되고 여기서, G는 글리신이고 및 여기서 X는 유전적으로 인코딩되는 아미노산으로부터 독립적으로 선택된다.
특정한 구현 예에서, 미생물 시스템 또는 재조합 미생물은 수도모나스, 로도코커스 이리트로폴리스(Rhodococcus erythropolis) ATCC4277, 노르카디아 푸스카(Norcadia fusca) AKU2123, 크렙실라 또는 다른 적합한 생명체로부터 자연적인 또는 최적화된 알코올 디하이드로게나제를 포함할 수 있다. 알코올 디하이드로게나제를 인코딩하는 유전자는 당업계에 알려진 기술에 따라 이들 또는 다른 생명체로부터 분리될 수 있고 여기에 기술된 바와 같이 재조합 미생물내에 포함될 수 있다.
"이중 결합 리덕타제" 활성을 갖는 효소 또는 폴리펩티드는 하기의 일반적인 반응을 촉매하는 효소를 일반적으로 지칭한다:
여기에 주지된 바와 같이 특정한 구현 예에서, 상기 반응은 소정의 미생물에서 내인성의 효소에 의해 촉매될 수 있어서 이중 결합 리덕타제 활성을 갖는 외인성 효소의 첨가는 본 발명을 실시하는데 있어서 불필요할 수 있다. 그럼에도 불구하고, 특정한 양상에서 이중 결합 리덕타제 효소의 과잉 발현 또는 고려되는 특정 반응의 구성분에 증가된 친화도를 갖는 특정한 이중 결합 리덕타제의 발현은 원하는 범용화학제품 또는 그의 중간체의 증가된 생산이 가능할 수 있다.
이중 결합 리덕타제는 예를 들어, 여럿 중에서 새캐로마이스 세레비지에(Saccharomyces cerevisiae), 피키아 안구스타(Pichia angusta), 자이모모나스 모빌리스(Zymomonas mobilis), 이스체리키아 콜라이(E. coli), 크렙실라 뉴모니애, 수도모나스 푸티다(Pseudomonas putida)로부터 수득될 수 있다.
특정한 구현 예에서, 이중 결합 리덕타제는 SEQ ID NOS:35-50로 나타낸 폴리뉴클레오티드 참고 서열 및/또는 이들 폴리뉴클레오티드에 의해 인코딩되는 상응하는 폴리펩티드 참고 서열에 기반을 둘 수 있다. 따라서, 본 발명의 어떤 재조합 미생물은 SEQ ID NOS:35-50에 80%, 85%, 90%, 95%, 97%, 98%, 99% 서열 동일성을 갖는 하나 또는 그 이상의 폴리뉴클레오티드 또는 여기에 기술되고 당업계에 알려진 조건하에서 그들의 상보체와 혼성화하는 폴리뉴클레오티드 서열을 포함할 수 있다.
본 발명의 "이중 결합 리덕타제" 효소 또는 그 효소를 인코딩하는 폴리뉴클레오티드 서열은 여기에 기술되고 당업계에 알려진 바와 같이 특정의 보전적인 모티프 또는 도메인으로써 특성화될 수 있다.
특정한 구현 예에서, 알돌라제 활성을 갖는 효소에 의해 응축되어 범용화학제품 또는 그의 중간체를 형성하는 알데히드, 케톤 또는 그 둘의 유래는 알데히드 및/또는 케톤 생합성 경로를 함유하는 재조합 미생물을 포함할 수 있다. 어떤 구현 예에서, 그러한 생합성 경로는 알데히드 생합성 경로, 케톤 생합성 경로 또는 그 둘을 포함할 수 있다.
특정한 구현 예에서, 생합성 경로는 하나 또는 그 이상의 아세토알데히드, 프로피온알데히드, 글루타알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드, 및/또는 숙시네이트 4-하이드록시페닐 아세트알데히드 생합성 경로를 포함하고 그의 다양한 조합을 포함한다.
특정한 구현 예에서, 상기 생합성 경로는 부틸알데히드 또는 이소부틸알데히드 생합성 경로를 포함한다. 대표적인 알데히드 및 케톤 생합성 경로는 여기와 미국 출원 제 12/245,537호 및 제 12/245,540호에 기술되어 있으며 이들은 알데히드 및 케톤 생합성 경로 설명을 위해 여기에 참고로 포함된다.
특정한 양상에서, 프로피온알데히드 생합성 경로는 이스체리키아 콜라이와 같은 생명체로부터 트레오닌 디아미나제(ilvA) 유전자 및 락토카커스 락티스와 같은 생명체로부터 케토-이소발러레이트 디카르복실라제(kivd) 유전자 및/또는 그의 상동체 또는 오르토로그(ortholog) 뿐만 아니라 최적화된 변형체를 포함하는 이들 효소의 기능적 변형체를 포함할 수 있다. 이들 효소는 일반적으로 L-트레오닌을 프로피온알데히드로 전환하는데 사용될 수 있다.
특정한 양상에서, 부틸알데히드 생합성 경로는 이스체리키아 콜라이와 같은 생명체로부터 적어도 하나의 티올라제(atoB) 유전자, β-하이드록시 부티릴-CoA 디하이드로게나제(hbd) 유전자, 크로톤나제 (crt) 유전자, 부티릴-CoA 디하이드로게나제 (bcd) 유전자, 전자 전달 플라보프로테인 A (etfA) 유전자 및/또는 크로스트리디움 아세토부티리컴(예, ATCC 824)과 같은 생명체로부터의 전자 전달 플라보프로테인 B (etfB), 뿐만 아니라 크로스트리디움 베이저린키 아세토부티리컴 ATCC 824와 같은 생명체로부터 보조효소 A-연결 부틸알데히드 디하이드로게나제(ald) 유전자를 포함할 수 있다. 어떤 양상에서, 크로스트리디움 아세토부티리컴 ATCC 824와 같은 생명체로부터의 보조효소 A-연결 알코올 디하이드로게나제(adhE2) 유전자는 ald 유전자의 대안으로 사용될 수 있다.
특정한 양상에서, 이소부틸알데히드 생합성 경로는 바실러스 서브틸리스(Bacillus subtilis)와 같은 생명체로부터 아세토락테이트 신타제(alsS) 또는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578과 같은 생명체로부터 als 유전자를 포함할 수 있다(코돈 사용이 이스체리키아 콜라이 단백질 발현에 있어서 최적화될 수 있다). 그러한 경로는 이스체리키아 콜라이와 같은 생명체로부터 아세토락테이트 리덕토이소머라제 (ilvC) 및/또는 2,3-디하이드록시이소발러레이트 디하이드라타제(ilvD) 유전자, 뿐만 아니라 락토카커스 락티스와 같은 생명체로부터 케토-이소발러레이트 디카르복실라제(kivd) 유전자를 또한 포함할 수 있다.
특정한 양상에서, 3-메틸부틸알데히드 및 2-메틸부틸알데히드 생합성 경로는 바실러스 서브틸리스(Bacillus subtilis)와 같은 생명체로부터 아세토락테이트신타제(alsS) 또는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578과 같은 생명체로부터 (als) 유전자를 포함할 수 있다(코돈 사용이 이스체리키아 콜라이 단백질 발현에 있어서 최적화될 수 있다). 그러한 경로의 특정한 양상은 이스체리키아 콜라이와 같은 유기체로부터 아세토락테이트 리덕토이소머라제 (ilvC), 2,3-디하이드록시이소발러레이트 디하이드라타제 (ilvD), 이소프로필말레이트 신타제(LeuA), 이소프로필말레이트 이소머라제 (LeuC 및 LeuD), 및 3-이소프로필말레이트 디하이드로게나제(LeuB) 유전자, 뿐만 아니라 락토카커스 락티스(Lactococcus lactis)와 같은 유기체로부터 케토-이소발러레이트 디카르복실라제(kivd)를 또한 포함할 수 있다.
특정한 양상에서, 페닐아세토알데히드 및 4-하이드록시페닐아세토알데히드 생합성 경로는 이스체리키아 콜라이와 같은 유기체로부터 하나 또는 그 이상의 3-디옥시-7-포스포헵튤론네이트 신타제 (aroF, aroG, 및 aroH), 3-디하이드로퀴네이트 신타제(aroB), 3-디하이드로퀴네이트 디하이드라타제(aroD), 디하이드로쉬키메이트 리덕타제(aroE), 쉬키메이트 키나제 II(aroL), 쉬키메이트 키나제 I(aroK), 5-에놀피루빌쉬키메이트-3-포스페이트 신테타제(aroA), 코리스메이트 신타제(aroC), 융합 코리스메이트 뮤타제 P/프리페네이트 디하이드라타제(pheA), 및/또는 융합 코리스메이트 뮤타제 T/프리페네이트 디하이드로게나제 (tyrA) 유전자, 뿐만 아니라, 락토카커스 락티스(Lactococcus lactis)와 같은 생명체로부터 케토-이소발러레이트 디카르복실라제(kivd)를 포함할 수 있다.
특정한 구현 예에서, 알데히드, 케톤 또는 그 둘 다의 유래인 재조합 미생물은 알데히드 또는 케톤을 범용화학제품으로 전환하는 재조합 미생물과 같다. 예를 들어, 이소옥탄 생성에 있어서, 그러한 재조합 미생물은 이소부틸알데히드 생합성 경로, 알돌라제 효소, 경우에 따라 이중 결합 리덕타제 효소 및 알코올 디하이드로게나제 효소를 포함할 수 있고, 적합한 단당류를 이소부틸알데히드로 이어서 3-하이드록시-2,2,4-트리메틸 펜타날 및 2,2,4-트리메틸-1,3-펜탄디올로 전환할 수 있다. 이러한 및 관련된 양상에서, 2,2,4-트리메틸-1,3-펜탄디올은 여기에 기술되고 당업자에게 알려진 바와 같이 "수소처리"에 의해서 추가로 이소옥탄으로 전환될 수 있다.
추가적인 예로서, 2-에틸헥사놀 및 2-에틸헥산과 같은 범용화학제품의 생성에 있어서, 그러한 재조합 미생물은 부틸알데히드 생합성 경로, 알돌라제 효소, 경우에 따라 이중 결합 리덕타제 및 알코올 디하이드로게나제 효소를 포함할 수 있으며, 적합한 단당류를 부틸알데히드 이어서, 3-하이드록시-2-에틸 헥사날, 2-에틸-2-헥센-1-알, 2-에틸헥사날, 및 최종적으로 2-에틸헥사놀로 전환시킬 수 있다. 이러한 및 관련된 양상에서, 2-에틸헥산놀은 여기에 기술되고 당업자에게 알려진 바와 같이 "수소처리"에 의해서 추가로 2-에틸헥산으로 전환될 수 있다.
특정한 구현 예에서, 알데히드, 케톤 또는 그 둘 다의 유래인 재조합 미생물은 알데히드 또는 케톤을 범용화학제품으로 전환하는 재조합 미생물과 다를 수 있다. 이러한 및 관련된 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 갖는 첫번째 재조합 미생물은 하나 또는 그 이상의 알데히드 및/또는 케톤를 생성하기 위한 유래 또는 공급 원료로서 사용될 수 있으며 그 후, 알돌라제, 경우에 따라서 외인성 이중 결합 리덕타제 및 알코올 디하이드로게나제를 포함하는 두 번째 재조합 미생물에 의해 2,2,4-트리메틸-1,3-펜탄디올 또는 2-에틸헥사놀과 같은 원하는 범용화학제품으로 전환될 수 있다. 이러한 및 관련된 구현 예에서, 상기 두 재조합 미생물은 공동 배양될 수 있다. 대안적으로, 알데히드, 케톤, 또는 둘 다는 첫 번째 재조합 미생물에 의해서 생성될 수 있으며 그 후 알돌라제 및 알코올 디하이드로게나제를 포함하는 두 번째 재조합 미생물과 같이 항온처리될 수 있다. 다양한 다른 조합 및 본 발명의 양상이 이 관점에 있어서 당업자들에게 명확할 것이다.
다른 구현 예에서, 이소부틸알데히드와 같은 알데히드 및/또는 케톤의 유래는 상업적으로 입수가능한 근원과 같은 임의의 다른 적합한 유래일 수 있다. 이러한 및 임의의 구현 예에서, 알데히드, 케톤 또는 둘다의 "유래"는 알데히드 또는 케톤 그 자체를 포함할 수 있으며, 이들은 필요로 하다면 미생물 배양 시스템에 직접적으로 첨가될 수 있다.
여기에 기술된 모든 다른 경로 및 효소에 관해서, 여기에 기술된 알돌라제, 경우에 따른 이중 결합 리덕타제 및 알코올 디하이드로게나제 및 알데히드 및/또는 케톤 생합성 경로의 각 구성분은 내인성으로 또는 외인성으로 재조합 미생물에 존재한다. 주어진 생합성 경로의 효율을 향상시키고자, 예를 들어, 내인성 유전자는 내인성 유전자의 재조합 미생물 내로 부가적인 카피(즉, 외인성 유전자)를 도입함으로써 상승조절 또는 과잉발현될 수 있다. 그런 경로는 기능성을 향상시키고자 내인성 유전자를 돌연변이생성을 통해 변형함으로써, 그 후 변형된 유전자를 미생물 내로 도입함으로써 또한 최적화될 수 있다. 내인성 유전자의 발현은 당업계에 알려진 기술 및 여기에 기술된 바에 따라서 상승 또는 하강 조절될 수 있으며 심지어 제거될 수 있다. 유사하게, 내재적인 유전자 또는 폴리뉴클레오티드 서열의 발현 레벨은 다양한 구조적 또는 유도성의 프로모터에 의해 원하는 바와 같이 조절될 수 있다. 그러한 유전자 또는 폴리뉴클레오티드는 여기에 기술되고 당업계에 알려진 바와 같이 또한 "코돈-최적화"될 수 있다. 상동체 또는 그의 오르토로그를 포함하는 기능적으로 자연적으로 발생하는 상기 유전자 및 효소/폴리펩티드의 변형체도 또한 포함된다.
본 발명에 따라 임의의 미생물이 사용될 수 있다. 어떤 양상에서, 미생물은 진핵 또는 원핵미생물이다. 특정한 양상에서, 미생물은 S. 세레비지에와 같은 효모이다. 어떤 양상에서, 그람-양성 대장균 또는 그람-음성 대장균과 같은 대장균이다. 빠른 성장률, 잘 알려진 유전학, 다양한 유전학적 도구 및 이종 단백질을 생성하는 능력때문에, 유전학적으로 변형된 E. 콜라이가 알지네이트 또는 펙틴과 같은 다당류의 분해 및 대사, 또는 바이오연료와 같은 범용화학제품의 형성과 생합성에 대해서 여기에 기술된 미생물 시스템의 어떤 구현 예에서 사용될 수 있다.
숙주 세포와의 효소 및 대사체의 호환성에 부분적으로 기초하여 본 발명에 따라 다른 미생물이 사용될 수 있다. 예를 들어, 아세토박터 아세티, 아크로모박터, 아시디필리움, 아시네토박터, 악티노마두라, 악티노플래인, 애로피룸 퍼닉스, 아그로박테리움, 알칼리진, 아나나스 코모수스(M), 아스로박터, 아스파질러스 니거, 아스파질러스 오리제, 아스파질러스 멜레우스, 아스파질러스 퍼브루엔투스, 아스파질러스 사이토이, 아스파질러스 소지, 아스파질러스 우사이이, 바실러스 알칼로필러스, 바실러스 아밀로리퀘파시엔스, 바실러스 브레비스, 바실러스 설쿠란스, 바실러스 클로시이, 바실러스 렌터스, 바실러스 리첸니포미스, 바실러스 마세란스, 바실러스 스티아로설모필러스, 바실러스 서브티리스, 비피도박테리움, 브레비바실러스 브레비스, 버크홀데리아 세파시아, 캔디다 실린드라세아, 캔디다 루고사, 칼리카 파파야 (L), 셀룰로시미크로비움, 세팔로스포리움, 채토미움 에라티쿰, 채토미움 그라사일, 클로스트리디움, 클로스트리디움 브티리쿰, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 설모셀룸, 코리네박테히움 (글루타미쿰), 코리네박테리움 에피시엔스, 이스체리키아 콜라이, 엔테로카쿠스, 어위나 크리산테미, 글리코노박터, 글루콘아세토박터, 할로아큘라, 휴미콜라 인솔엔스, 휴미콜라 엔솔렌스, 키타사토스포라 세태, 클렙실라, 클렙실라 옥시토카, 클루이브로마이세스, 클루이브로마이세스 플래길리스, 클루이브로마이세스 락티스, 코쿠리아, 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 세이크, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸오시티스, 메탄노로버스 시실리애, 메탄노게니움 오가노필룸, 메탄노박테리움 브라이언타이, 마이크로박테리움 임페리얼리, 마이크로코쿠스 라이소 데익티쿠스, 마이크로루나투스, 뮤콜자바니쿠스, 마이코박터, 마이로테시움, 나이트로박터, 나미트로소모나스, 노카디아, 파파야 카리카, 페디오코쿠스, 페디오코구스 할로필러스, 페니실리움, 페니실리움 카멤버티, 페니실리움 시트리넘, 페니실리움 에머소나이, 페니실리움 로퀘포티, 페니실리움 릴락티눔, 페니실리움 멀티컬러, 파라코쿠스 판토트로퍼스, 프로피온니박테리움, 수도모나스, 수도모나스 플루오레센스, 수도모나스 데니트리피칸스, 필오코쿠스, 필오코쿠스 퓨리오서스, 필오코쿠스 호리코사이, 리조비움, 리조뮤콜 미헤이, 리조뮤콜 퓨실루스 린트, 리조퍼스, 리조퍼스 델레마, 리조퍼스 자폰이쿠스, 리조퍼스 니비우스, 리조퍼스 오리재, 리조퍼스 올리고스포러스, 로도코쿠스, 사카로마이시스 세레비지애, 스클레로티나 리버티나, 스핑고박테리움 멀티보룸, 스핑고비움, 그핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이시스, 스트렙토마이시스 그리세우스, 스트렙토마이시스 리비단스, 스트렙토마이시스 무리누스, 스트렙토마이시스 루비기노수스, 스트렙토마이시스 바이오라세오루버, 스트렙토버티실리움 모바랜스, 테트라제노코쿠스, 서머스, 티오스패라 판토트로파, 트라미테스, 트리초더마, 트리초더마 롱지브라키아툼, 트리초더마 리에시이, 트리초더마 비리데, 트리초스포론 페니실라툼, 비브리오 알지노리티쿠스, 잔소모나스, 이스트, 자이고사카로마이시스 룩사이, 자이모모나스, 및 자이모모누스 모빌리스로와 같은 다른 생명체가 여기에 제공되는 재조합 미생물로서 사용될 수 있고 따라서, 본 발명의 다양한 방법에 따라 사용될 수 있다.
여기에 기술된 다양한 구현 예는 추가의 구현 예를 제공하기 위해서 조합될 수 있다. 본 명세서 및/또는 출원 데이터 시트에 언급되거나 열거된 미국 특허, 미국 특허 출원 공개, 미국 특허 출원, 외국 특허, 외국 특허 출원 및 비특허 공개 모두는 그들의 전체로 참고로 여기에 포함된다. 추가로 구현 예를 제공하기 위해서, 다양한 특허, 출원 및 공개물의 개념을 사용하고자 구현 예의 양상이 변형될 수 있다.
이들 및 다른 변화가 상기의 자세한 설명 관점에서 구현 예에 만들어질 수 있다. 일반적으로, 하기의 청구항에서, 사용된 용어는 명세서 및 청구항에 개시된 특정 구현 예에 대한 청구항을 제한하도록 해석되어서는 안 되며, 그런 청구항의 자격이 있는 동등체의 전체 범위에 따라 모든 가능한 구현 예를 포함하도록 해석되어야 한다. 따라서, 청구항은 개시물에 의해서 제한받지 않는다.
하기의 실시 예는, 제한적이지 않고, 도시에 의해 제공된다.
도 1은 이소부틸알데히드가 생체 내에서 2,4,4-트리메틸-1,3-펜탄디올로 전환되는 대표적인 경로를 나타낸다.
도 2는 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 3-하이드록시-2,2,4-트리메틸펜타날의 생성을 나타낸다.
도 3은 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 2-에틸-2-헥센-1-알의 생성을 나타낸다.
도 4는 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 2-부틸-2-옥텐-1-알의 생성을 나타낸다.
도 2는 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 3-하이드록시-2,2,4-트리메틸펜타날의 생성을 나타낸다.
도 3은 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 2-에틸-2-헥센-1-알의 생성을 나타낸다.
도 4는 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 2-부틸-2-옥텐-1-알의 생성을 나타낸다.
실시예
실시예 1 알데히드/케톤 생합성 경로
부틸알데히드 및 이소부틸알데히드와 같은 알데히드 및/또는 케톤의 유용한 유래를 제공하기 위해서, 알데히드 및/또는 케톤생합성 경로를 포함하고 적합한 단당류 또는 올리고당을 알데히드 또는 케톤으로 전환시킬 수 있는 재조합 미생물을 작제하였다.
E. 콜라이로 부터의 티올라제(atoB) 유전자, 클로스트리디움 아세토부티리컴 ATCC 824로부터의 β-하이드록시 부티릴-CoA 디하이드로게나제(hbd), 크로톤나제(crt), 부티릴-CoA 디하이드로게나제(bcd), 전자 전달 플라보프로테인 A (etfA), 및 전자 전달 플라보프로테인 B(etfB) 유전자 및 클로스트리디움 베이저린키 아세토부티리컴 ATCC 824로부터의 보조효소 A-연결 부틸알데히드 디하이드로게나제(ald) 유전자를 포함하는 부틸알데히드 생합성 경로를 E. 콜라이에서 구축하여 부틸알데히드를 생성하는 능력을 테스트하였다. 또한, 클로스트리디움 아세토부티리컴 ATCC 824로부터의 보조효소 A-연결 알코올 디하이드로게나제(adhE2) 유전자를 ald의 대안으로 사용하여 부탄올을 생성하는 능력을 테스트하였다.
바실러스 서브틸리스로부터의 아세토락테이트 신타제(alsS) 또는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578(코돈 사용이 E. 콜라이 단백질 발현에 대해 최적화되었다)로부터의 (als) 및 E. 콜라이로부터의 아세토락테이트 리덕토이소머라제(ilvC) 및 2,3-디하이드록시이소발러레이트 디하이드라타제(ilvD) 유전자 및 락토카커스 락티스로부터의 케토-이소발러레이트 디카르복실라제(kivd)를 포함하는 이소부틸알데히드 생합성 경로를 구축하여 이소부타날 생성 측정과 같이 이소부틸알데히드를 생성하는 능력을 테스트하였다.
pBADButP
의
작제
클로스트리디움 아세토부티리컴 ATCC 824의 hbd, crt, bcd, etfA, 및 etfB를 인코딩하는 DNA 서열을 50μl중의 클로스트리디움 아세토부티리컴 ATCC 824 50 ng으로부터 중합효소 연쇄반응을 사용하여 증폭하였다. 증폭된 DNA 절편을 BamHI 및 Xbal로 절단하여 같은 제한 효소로 절단된 pBAD33내로 연결시켰다.
pBADButP
-
atoB
의
작제
이스체리키아 콜라이 DH10B의 atoB를 인코딩하는 DNA 서열을 50μl중의 이스체리키아 콜라이 DH10B 게놈 50ng으로부터 중합효소 연쇄반응을 사용하여 증폭하였다. 증폭된 DNA 절편을 Xbal 및 Pstl로 절단하여 같은 제한 효소로 절단된 pBADButP내로 연결시켰다.
pBADatoB
-
ald
의
작제
이스체리키아 콜라이 DH10B의 atoB를 인코딩하고 클로스트리디움 베이저린키로부터 ald를 인코딩하는 DNA 서열을 각각 50μl중의 이스체리키아 콜라이 DH10B 50ng 또는 클로스트리디움 베이저린키 게놈(ATCC) 50ng으로부터 중합효소 연쇄반응(PCR)을 사용하여 독립적으로 증폭하였다. 증폭된 DNA 절편을 겔상에서 정제하여 EB 완충제(Qiagen) 3Oul에 용출하였다. 각 DNA 용액 5 ul를 조합하여 각 DNA 절편을 PCR을 한 라운드 더 돌려 스플라이싱하였다. 스플라이싱된 절편을 SacI 및 HindIII로 절단하여 같은 제한 효소로 절단된 pBADButP내로 연결시켰다.
pBADButP
-
atoB
-
ALD
의
작제
클로람페니콜 아세틸트랜스퍼라제(CAT), 복제의 P15 오리진, araBAD 프로모터, 이스체리키아 콜라이 DH10B의 atoB 및 클로스트리디움 베이저린키로부터 ald를 인코딩하는 DNA 절편 1 및 클로스트리디움 아세토부티리컴 ATCC 824의 araBAD promoter, hbd, crt, bed, etfA, 및 etfB를 인코딩하는 DNA 절편 2를 각각 50μl중의 50ng pBADatoB-ald 또는 pBADButP로부터 중합효소 연쇄반응(PCR)을 사용하여 독립적으로 증폭하였다. 증폭된 DNA 절편은 NotI 및 KpnI를 사용하여 절단하여 서로 연결시켰다.
pBADals
-
ilvCD
의
작제
E.콜라이에서 과잉발현에 대해 최적화된 코돈을 사용하는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578의 als를 인코딩하는 DNA 절편을 50μl중의 pETals 50ng으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 SacI 및 XbaI을 사용하여 절단하여 같은 제한 효소로 절단된 pBADilvCD내로 연결시켰다.
pBADalsS
-
ilvCD
의
작제
바실러스 서브틸리스 B26의 alsS의 앞부분 반 및 뒷부분 반을 인코딩하는 DNA 절편을 50μl중의 바실러스 서브틸리스 B26 게놈(ATCC) 50ng으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 겔상에서 정제하여 EB 완충제(Qiagen) 3Oul에 용출하였다. 각 DNA 용액 5 ul를 조합하여 각 DNA 절편을 PCR을 한 라운드 더 돌려 스플라이싱하였다. 스플라이싱된 절편은 내부에 XbaI 절단부위를 포함하고 있어서 SacI 및 XbaI을 사용하여 절단하여 같은 제한 효소로 절단된 pBADilvCD내로 연결시켰다.
pTrcBALK
의
작제
락토카커스 라브티스의 케토이소발러레이트 디카르복실라제(kivd)를 인코딩하는 DNA 서열을 50μl중의 pETBAL 50 ng 으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 SacI 및 XbaI을 사용하여 절단하여 같은 제한 효소로 절단된 pTrcBAL내로 연결시켰다.
pTrcBALD
의
작제
클로스트리디움 베이저린키의 CoA-연결 알데히드 디하이드로게나제(ald)를 인코딩하는 DNA 서열을 50μl중의 pETBAL 50 ng 으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 SacI 및 HndIII을 사용하여 절단하여 같은 제한 효소로 절단된 pTrcBAL내로 연결시켰다.
pBBRPduCDEGH
의
작제
크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578의 프로판디올 디하이드라타제 중간(pduD) 및 소(pduE) 서브유닛 및 프로판디올 디하이드라타제 재활성화 대(pduG) 및 소(pduH) 서브유닛을 인코딩하는 DNA 서열을 50μl중의 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578 50 ng 으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 SacI 및 XbaI을 사용하여 절단하여 같은 제한 효소로 절단된 pTrc99A내로 연결시켜 pBBRPduDEGH를 형성하였다.
크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578의 프로판디올 디하이드라타제 대 서브유닛(pduC)을 인코딩하는 DNA 서열을 50μl중의 크렙실라 뉴모니애(Klebsiella pneumoniae subsp. pneumoniae MGH 78578) 50 ng 으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 Xhol 및 Xbal을 사용하여 절단하여 같은 제한 효소로 절단된 pBBRPduDEGH내로 연결시켰다.
부틸알데히드 생합성 경로를 테스트하기 위해서, pBADButP-atoB/pTrcBALD 및 pBADButP-atoB-ALD/pTrcB2DH/pBBRpduCDEGH를 갖는 DH 10B을 50 ug/ml 크로람페니콜 (Cm50) 및 100 ug/ml 암피실린 (Amp100)을 포함하는 LB 배지에서 37℃, 200rpm에서 하룻밤 배양하였다. 각 시드(seed) 배양의 분획을 Cm50 and Amp100을 포함하는 새로운 TB 배지에 접종한 후, 37℃ , 200 rpm의 배양기에서 성장시켰다. 접종 후 3시간에, 배양체를 13.3 mM 아라비노스 및 1mM IPTG로 유도(induction)하여 하룻밤 성장시켰다. 이들 배양체의 700 ul를 같은 부피의 에틸아세테이트로 추출하고 GC-MS를 사용하여 분석하였다.
이소부틸알데히드 생합성 경로를 테스트하기 위해서, pBADals-ilvCD/pTrcBALK 또는 pBADalsS-ilvCD/pTrcBALK를 갖는 DH 10B을 50 ug/ml 크로람페니콜 (Cm50) 및 100 ug/ml 암피실린 (Amp100)을 포함하는 LB 배지에서 37℃, 200rpm에서 하룻밤 배양하였다. 각 시드(seed) 배양의 분획을 Cm50 and Amp100을 포함하는 새로운 TB 배지에 접종한 후, 37℃ , 200 rpm의 배양기에서 성장시켰다. 접종 후 3시간에, 배양체를 13.3 mM 아라비노스 및 1mM IPTG로 유도(induction)하여 하룻밤 성장시켰다. 이들 배양체의 700 ul를 같은 부피의 에틸아세테이트로 추출하고 GC-MS를 사용하여 이소부타날 생성의 측정과 같이 이소부틸알데히드 생성에 대해 분석하였다. 도 2는 이들 배양체로부터 이소부타날의의 생성을 나타낸다. 이 종은 또한 소수 구성분으로서 2-메틸부틸알데히드 및 3-메틸부틸알데히드를 생성하였다(도시되지 않음).
실시예 2
이소부틸알데히드로부터 3-하이드록시-2,2,4 트리메틸펜타날의 생성
알돌라제 활성을 갖는 효소가 이소부틸알데히드를 응축하여 3-하이드록시-2,2,4-트리메틸펜타날을 형성하는 능력을 생체 내에서 테스트하였다. 하기의 실시예 5에 기술된 바와 같이 플라스미드 TrcTM1559를 구축하였고, 이들은 털모토가 마리티마로부터 수득된 알도오스-인코딩 폴리뉴클레오티드 서열을 포함한다.
pTrcTM1559을 포함하는 E. 콜라이 DH 10B 종의 단일 콜로니를 Amp100를 포함하는 새로운 LB 배지에 접종하고 상기 배양체를 하룻밤 동안 37℃에서 진탕 배양기에서 성장시켰다. 이들 배양체의 1 %를 Amp100을 포함하는 새로운 TB배지에 접종한 후 37℃에서 진탕 배양기에서 성장시켰다. 배양체가 OD600nm 값이 0.6 까지 자랐을때, 0.5 mM IPTG로 유도하였다. 5OmM 이소부틸알데히드를 첨가하여 하루 동안 배양시켰다. 배양체 500 μl를 에틸아세테이트 500 μl로 추출한 후 추출물을 GC-MS로 분석하였다. 3-하이드록시-2,2,4-트리메틸펜타날의 형성을 관찰하였다(도 2 참조).
실시예 3
이소부틸알데히드로부터 2,2,4-트리메틸-1,3-펜탄디올의 생성
알돌라제 효소 및 알코올 디하이드로게나제를 포함하는 재조합 미생물이 이소부틸알데히드를 2,2,4-트리메틸-1,3-펜탄디올로 전환시키는 능력을 테스트하였다. 플라스미드 TrcTM1559은 상기 실시예 2에 기술되어 있다. 다양한 알코올 디하이드로게나제를 수도모나스 퓨티다(Pseudomonas putida) KT2440, 수도모나스 플루오레센스(Pseudomonas fluorescens) Pf-5, 및 크렙실라 뉴모니애 MGH 78578(SEQ ID No:1-34 참조)로부터 분리하여 발현 벡터에 클로닝하였다. 이것은 미국 출원 제 12/245,537호 및 제 12/245,540호에 기술되어 있으며, 여기서 그들의 설명, 구축, 알코올 디하이드로게나제의 테스팅을 위해 참고로 포함된다. 부가적인 알코올 디하이드로게나제는 또한 수도모나스 퓨티다(SEQ ID NOS:83-96 참조)로부터 수득하였다.
pTrcTM1559 및 알코올 디하이드로게나제 발현 플라스미드를 포함하는 E. 콜라이 DH 10B 종의 단일 콜로니를 Amp100를 포함하는 새로운 LB 배지에 접종하고 상기 배양체를 하룻밤 동안 37℃에서 진탕 배양기에서 성장시켰다. 이들 배양체의 1 %를 Amp100을 포함하는 새로운 TB배지에 접종한 후 37℃에서 진탕 배양기에서 성장시켰다. 배양체가 OD600nm 값이 0.6 까지 자랐을때, 0.5 mM IPTG로 유도하였다. 5OmM 이소부틸알데히드를 첨가하여 하루 동안 배양시켰다. 배양체 500 μl를 에틸아세테이트 500 μl로 추출한 후 추출물을 GC-MS로 분석하였다. 2,2,4-트리메틸펜탄디올의 형성을 관찰하였다.
실시예 4
다른 중간 내지 장 쇄의 탄화수소의 생성
2,2,4-트리메틸-1,3-펜탄디올 및 그후 2,2,4, 트리메틸펜탄(이소옥탄)을 생성하는 상기에 언급된 경로뿐만 아니라, 효소학적 알돌 농축에 이은 알코올 탈수소반응은 출발 물질로서 다양한 알데히드 및 케톤으로부터 다양한 중간 내지 장 쇄의 탄화수소를 생성할 수 있다. 이들 알데히드 및/또는 케톤은 알데히드 및/또는 케톤 생합성 경로에 따라 재조합 미생물에 의해 생성될 수 있고 이것은 미국 출원 제 12/245,537호 및 제 12/245,540호에 기술되어 있고 여기서 이들 출원은 이들 경로의 설명, 작제, 및 테스팅을 위해 참고로 포함된다.
일 실시 예가 여기에 설명되어있고 여기서 부틸알데히드 2 분자가 알돌라제에 의해 농축하여 3-하이드록시-2-에틸 헥사날을 형성한다. 이 분자는 그 후 자발적으로 또는 효소학적으로 탈수되어 2-에틸-2-헥센-1-알을 형성하고, 이들은 이어서 순차적으로 이중 결합 리덕타제 및 알코올 디하이드로게나제에 의해 각각 촉매되어 2-에틸헥사날 및 2-에틸헥사놀로 환원될 수 있다.
2 분자의 헥산알데히드가 알돌라제에 의해 농축하여 3-하이드록시-2-부틸-1- 옥타날을 형성하는 반응도 여기에 또한 설명되어 있다. 이 분자는 그 후 자발적으로 또는 효소학적으로 탈수되어 2-부틸-2-옥텐-1-알을 형성하고 이어서 순차적으로 2-부틸-옥타날 및 2-부틸 옥타놀로 환원될 수 있다.
2-에틸-2-헥센-1-알의 생성을 테스트하기 위해서, pTrcTM1559을 포함하는 E. 콜라이 DH 10B 종의 단일 콜로니를 Amp100를 포함하는 새로운 LB 배지에 접종하고 상기 배양체를 하룻밤 동안 37℃에서 진탕 배양기에서 성장시켰다. 이들 배양체의 1 %를 Amp100을 포함하는 새로운 TB배지에 접종한 후 37℃에서 진탕 배양기에서 성장시켰다. 배양체가 OD600nm 값이 0.6 까지 자랐을때, 0.5 mM IPTG로 유도하였다. 5OmM 부틸알데히드 및 5OmM 헥산알데히드를 첨가하여 하루 동안 배양시켰다. 배양체 500 μl를 에틸아세테이트 500 μl로 추출한 후 추출물을 GC-MS로 분석하였다. 2-에틸-2-헥센-1-알의 형성을 관찰하였다(도 3 참도). 또한 2-부틸-2-옥텐-1-알의 형성도 관찰하였다(도 4 참도).
실시예 5
알돌라제의 분리 및 클로닝
알돌라제 활성을 갖는 효소를 인코딩하는 폴리뉴클레오티드 서열을 털모토가 마리티마 및 이스체리키아 콜라이 DH 10B로부터 분리하여 발현 벡터에 클로닝하였다.
Construction
of
pTrcTM0040
,
pTrcTM0066
,
pTrcTM0273
,
pTrcTM0283
,
pTrcTM0295
, pTrcTM0343,
pTrcTM0720
,
pTrcTM1072
,
pTrcTM1419
,
pTrcTM1521
.
pTrcTM1559
.
and
pTrcTM1744
TM0273, TM0283, TM0720, TM 1559, 및 TM1744를 인코딩하는 DNA 서열이 내부에 NcoI 부위를 포함하고 있어서, 각 유전자에 대한 NcoI 부위의 측면 지역을 중합효소 연쇄반응(PCR)을 통해 독립적으로 증폭하였다: 10초 동안 98℃, 15초 동안 60℃, 및 30분 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.5 μM 전방향 및 역방향 프라이머(표 5 참조), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 50 μl중의 털모토가 마리티마 게놈 50 ng을 포함했다.
터모토가 마리티마의 TM0040, TM0066, TM0273, TM0283, TM0295, TM0343, TM0720, TM1072, TM1419, TM 1521 , TM 1559, 및 TM1744를 인코딩하는 DNA 서열을 중합효소 연쇄반응(PCR)을 통해 독립적으로 증폭하였다: 10초 동안 98℃, 15초 동안 60℃, 및 1분 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.5 μM 전방향 및 역방향 프라이머(표 6 참조), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 50 μl중의 털모토가 마리티마 게놈 50 ng을 포함했다(주의; TM0273, TM0283, TM0720, TM 1559, 및 TM1744에 대해서, 이전 단락에서 기술된 바와 같이 제조된 단편들을 사용하였다). 상기의 DNA 절편은 NcoI 및 XbaI으로 절단하였고, 같은 제한 효소로 절단한 pTrc99A에 연결시켰다.
pTrcDH1OBxxx
의
작제
EC1648 및 EC4071을 인코딩하는 DNA 서열은 내부에 NcoI 부위를 포함하고, EC2249을 인코딩하는 DNA 서열은 XbaI 부위를 포함한다. 각 유전자에 대한 제한 부위의 측면 지역을 중합효소 연쇄반응(PCR)을 통해 독립적으로 증폭하였다: 30초 동안 98℃, 15초 동안 55℃, 및 45초 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.3 μM 전방향 및 역방향 프라이머(표 7 참조), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 E. 콜라이 DH10β 20 ng을 포함했다.
이스체리키아 콜라이 DH10β의 EC0008, EC0894, EC0940, EC1648, EC1991 , EC2249, EC2250, EC2465, EC2629, EC2969, EC3100, EC3233, EC3299, EC3305, EC3310, EC4071 , EC4092, EC4135 및 EC4539을 인코딩하는 DNA 서열을 중합효소 연쇄반응(PCR)을 통해 증폭하였다: 30초 동안 98℃, 30초 동안 55℃, 및 1분 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.3 μM 전방향 및 역방향 프라이머(표 8 참조), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 50μl중의 E. 콜라이 DH10β 게놈 20 ng을 포함했다(주의: EC1648, EC2249 및 EC4071에 대해서, 이전 단락에서 제조된 단편을 사용하였다).
EC3305 및 EC3310을 인코딩하는 증폭된 절편은 오버랩-PCR 방법을 사용하여 연결시켰다. (PCR): 30초 동안 98℃, 30초 동안 55℃, 및 1분 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.3 μM 전방향 및 역방향 프라이머(전방향 프라이머: catgccatggggatgaaacatctgacagaaatg (SEQ ID NO:189), 역방향 프라이머: gctctagattatgctgaaattcgattcg (SEQ ID NO:190)), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 이전 단락으로부터의 PCR 생성물 3μl를 포함했다.
증폭된 DNA 절편은 NcoI 및 XbaI으로 절단하였고, 같은 제한 효소로 절단한 pTrc99A에 연결시켰다.
<110> Bio Architecture Lab, Inc.
<120> BIOSYNTHESIS OF COMMODITY CHEMICALS
<130> IPA110358
<150> US61/121,869
<151> 2008-12-11
<160> 260
<170> KopatentIn 1.71
<210> 1
<211> 789
<212> DNA
<213> Pseudomonas putida KT2440
<400> 1
atgacagtca attatgattt ttccggaaaa gtcgtgctgg ttaccggcgc tggctctggt 60
attggccgtg ccactgcgct tgccttcgcg cagtcgggcg catccgttgc ggtcgcagac 120
atctcgactg accacggttt gaaaaccgta gagttggtca aagccgaagg aggcgaggcg 180
accttcttcc atgtcgatgt aggctctgaa cccagcgtcc agtcgatgct ggctggtgtc 240
gtggcgcatt acggcggcct ggacattgcg cacaacaacg ccggcattga ggccaatatc 300
gtgccgctgg ccgagctgga ctccgacaac tggcgtcgtg tcatcgatgt gaacctttcc 360
tcggtgttct attgcctgaa aggtgaaatc cctctgatgc tgaaaagggg cggcggcgcc 420
attgtgaata ccgcatcggc ctccgggctg attggcggct atcgcctttc cgggtatacc 480
gccacgaagc acggcgtagt ggggctgact aaggctgctg ctatcgatta tgcaaaccag 540
aatatccgga ttaatgccgt gtgccctggt ccagttgact ccccattcct ggctgacatg 600
ccgcaaccca tgcgcgatcg acttctcttt ggcactccaa ttggacgatt ggccaccgca 660
gaggagatcg cgcgttcggt tctgtggctg tgttctgacg atgcaaaata cgtggtgggc 720
cattcgatgt cagtcgacgg tggcgtggca gtgactgcgg ttggtactcg aatggatgat 780
ctcttttaa 789
<210> 2
<211> 262
<212> PRT
<213> Pseudomonas putida KT2440
<400> 2
Met Thr Val Asn Tyr Asp Phe Ser Gly Lys Val Val Leu Val Thr Gly
1 5 10 15
Ala Gly Ser Gly Ile Gly Arg Ala Thr Ala Leu Ala Phe Ala Gln Ser
20 25 30
Gly Ala Ser Val Ala Val Ala Asp Ile Ser Thr Asp His Gly Leu Lys
35 40 45
Thr Val Glu Leu Val Lys Ala Glu Gly Gly Glu Ala Thr Phe Phe His
50 55 60
Val Asp Val Gly Ser Glu Pro Ser Val Gln Ser Met Leu Ala Gly Val
65 70 75 80
Val Ala His Tyr Gly Gly Leu Asp Ile Ala His Asn Asn Ala Gly Ile
85 90 95
Glu Ala Asn Ile Val Pro Leu Ala Glu Leu Asp Ser Asp Asn Trp Arg
100 105 110
Arg Val Ile Asp Val Asn Leu Ser Ser Val Phe Tyr Cys Leu Lys Gly
115 120 125
Glu Ile Pro Leu Met Leu Lys Arg Gly Gly Gly Ala Ile Val Asn Thr
130 135 140
Ala Ser Ala Ser Gly Leu Ile Gly Gly Tyr Arg Leu Ser Gly Tyr Thr
145 150 155 160
Ala Thr Lys His Gly Val Val Gly Leu Thr Lys Ala Ala Ala Ile Asp
165 170 175
Tyr Ala Asn Gln Asn Ile Arg Ile Asn Ala Val Cys Pro Gly Pro Val
180 185 190
Asp Ser Pro Phe Leu Ala Asp Met Pro Gln Pro Met Arg Asp Arg Leu
195 200 205
Leu Phe Gly Thr Pro Ile Gly Arg Leu Ala Thr Ala Glu Glu Ile Ala
210 215 220
Arg Ser Val Leu Trp Leu Cys Ser Asp Asp Ala Lys Tyr Val Val Gly
225 230 235 240
His Ser Met Ser Val Asp Gly Gly Val Ala Val Thr Ala Val Gly Thr
245 250 255
Arg Met Asp Asp Leu Phe
260
<210> 3
<211> 762
<212> DNA
<213> Pseudomonas putida KT2440
<400> 3
atgagcatga ccttttctgg ccaggtagcc ctggtgaccg gcgcgggtgc cggcatcggc 60
cgggcaaccg ccctggcgtt cgcccacgag ggcatgaaag tggtggtggc ggacctcgac 120
ccggtcggcg gcgaggccac cgtggcgcag atccacgcgg caggcggcga agcgctgttc 180
attgcctgcg acgtgacccg cgacgccgag gtgcgccagt tgcatgagcg cctgatggcc 240
gcctacggcc ggctggacta cgccttcaac aacgccggga tcgagatcga gcaacaccgc 300
ctggccgaag gcagcgaagc ggagttcgat gccatcatgg gcgtgaacgt gaagggcgtg 360
tggttgtgca tgaagtatca gttgcccttg ttgctggccc aaggcggtgg ggccatcgtc 420
aataccgcgt cggtggcggg gctaggggcg gcgccaaaga tgagcatcta cagcgccagc 480
aagcatgcgg tcatcggtct gaccaagtcg gcggccatcg agtacgccaa gaagggcatc 540
cgcgtgaacg ccgtgtgccc ggccgtgatc gacaccgaca tgttccgccg cgcttaccag 600
gccgacccgc gcaaggccga gttcgccgca gccatgcacc cggtagggcg cattggcaag 660
gtcgaggaaa tcgccagcgc cgtgctgtat ctgtgcagtg acggcgcggc gtttaccacc 720
gggcattgcc tgacggtgga tggtggggct acggcgatct ga 762
<210> 4
<211> 253
<212> PRT
<213> Pseudomonas putida KT2440
<400> 4
Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Gly
1 5 10 15
Ala Gly Ile Gly Arg Ala Thr Ala Leu Ala Phe Ala His Glu Gly Met
20 25 30
Lys Val Val Val Ala Asp Leu Asp Pro Val Gly Gly Glu Ala Thr Val
35 40 45
Ala Gln Ile His Ala Ala Gly Gly Glu Ala Leu Phe Ile Ala Cys Asp
50 55 60
Val Thr Arg Asp Ala Glu Val Arg Gln Leu His Glu Arg Leu Met Ala
65 70 75 80
Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile
85 90 95
Glu Gln His Arg Leu Ala Glu Gly Ser Glu Ala Glu Phe Asp Ala Ile
100 105 110
Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu
115 120 125
Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser
130 135 140
Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ser Ala Ser
145 150 155 160
Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala
165 170 175
Lys Lys Gly Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr
180 185 190
Asp Met Phe Arg Arg Ala Tyr Gln Ala Asp Pro Arg Lys Ala Glu Phe
195 200 205
Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile
210 215 220
Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr
225 230 235 240
Gly His Cys Leu Thr Val Asp Gly Gly Ala Thr Ala Ile
245 250
<210> 5
<211> 810
<212> DNA
<213> Pseudomonas putida KT2440
<400> 5
atgtcttttc aaaacaaaat cgttgtgctc acaggcgcag cttctggcat cggcaaagcg 60
acagcacagc tgctagtgga gcagggcgcc catgtggttg ccatggatct taaaagcgac 120
ttgcttcaac aagcattcgg cagtgaggag cacgttctgt gcatccctac cgacgtcagc 180
gatagcgaag ccgtgcgagc cgccttccag gcagtggacg cgaaatttgg ccgtgtcgac 240
gtgattatta acgccgcggg catcaacgca cctacgcgag aagccaacca gaaaatggtt 300
gatgccaacg tcgctgccct cgatgccatg aagagcgggc gggcgcccac tttcgacttc 360
ctggccgata cctcggatca ggatttccgg cgcgtaatgg aagtcaattt gttcagccag 420
ttttactgca ttcgagaggg tgttccgctg atgcgccgag cgggtggcgg cagcatcgtc 480
aacatctcca gcgtggcagc gctcctgggc gtggcaatgc cactttacta ccccgcctcc 540
aaggcggcgg tgctgggcct cacccgtgca gcggcagctg agttggcacc ttacaacatt 600
cgtgtgaatg ccatcgctcc aggctctgtc gacacaccat tgatgcatga gcaaccaccg 660
gaagtcgttc agttcctggt cagcatgcaa cccatcaagc ggctggccca acccgaggag 720
cttgcccaaa gcatcctgtt ccttgccggt gagcattcgt ccttcatcac cggacagacg 780
ctttctccca acggcgggat gcacatgtaa 810
<210> 6
<211> 269
<212> PRT
<213> Pseudomonas putida KT2440
<400> 6
Met Ser Phe Gln Asn Lys Ile Val Val Leu Thr Gly Ala Ala Ser Gly
1 5 10 15
Ile Gly Lys Ala Thr Ala Gln Leu Leu Val Glu Gln Gly Ala His Val
20 25 30
Val Ala Met Asp Leu Lys Ser Asp Leu Leu Gln Gln Ala Phe Gly Ser
35 40 45
Glu Glu His Val Leu Cys Ile Pro Thr Asp Val Ser Asp Ser Glu Ala
50 55 60
Val Arg Ala Ala Phe Gln Ala Val Asp Ala Lys Phe Gly Arg Val Asp
65 70 75 80
Val Ile Ile Asn Ala Ala Gly Ile Asn Ala Pro Thr Arg Glu Ala Asn
85 90 95
Gln Lys Met Val Asp Ala Asn Val Ala Ala Leu Asp Ala Met Lys Ser
100 105 110
Gly Arg Ala Pro Thr Phe Asp Phe Leu Ala Asp Thr Ser Asp Gln Asp
115 120 125
Phe Arg Arg Val Met Glu Val Asn Leu Phe Ser Gln Phe Tyr Cys Ile
130 135 140
Arg Glu Gly Val Pro Leu Met Arg Arg Ala Gly Gly Gly Ser Ile Val
145 150 155 160
Asn Ile Ser Ser Val Ala Ala Leu Leu Gly Val Ala Met Pro Leu Tyr
165 170 175
Tyr Pro Ala Ser Lys Ala Ala Val Leu Gly Leu Thr Arg Ala Ala Ala
180 185 190
Ala Glu Leu Ala Pro Tyr Asn Ile Arg Val Asn Ala Ile Ala Pro Gly
195 200 205
Ser Val Asp Thr Pro Leu Met His Glu Gln Pro Pro Glu Val Val Gln
210 215 220
Phe Leu Val Ser Met Gln Pro Ile Lys Arg Leu Ala Gln Pro Glu Glu
225 230 235 240
Leu Ala Gln Ser Ile Leu Phe Leu Ala Gly Glu His Ser Ser Phe Ile
245 250 255
Thr Gly Gln Thr Leu Ser Pro Asn Gly Gly Met His Met
260 265
<210> 7
<211> 771
<212> DNA
<213> Pseudomonas putida KT2440
<400> 7
atgacccttg aaggcaaaac tgcactcgtc accggttcca ccagcggcat tggcctgggc 60
atcgcccagg tattggcccg ggctggcgcc aacatcgtgc tcaacggctt tggtgacccg 120
ggccccgcca tggcggaaat tgcccggcac ggggtgaagg ttgtgcacca cccggccgac 180
ctgtcggatg tggtccagat cgaggctttg ttcaacctgg ccgaacgcga gttcggcggc 240
gtcgacatcc tggtcaacaa cgccggtatc cagcatgtgg caccggttga gcagttcccg 300
ccagaaagct gggacaagat catcgccctg aacctgtcgg ccgtattcca tggcacgcgc 360
ctggcgctgc cgggcatgcg cacgcgcaac tgggggcgca tcatcaatat cgcttcggtg 420
catggcctgg tcggctcgat tggcaaggca gcctacgtgg cagccaagca tggcgtgatc 480
ggcctgacca aggtggtcgg cctggaaacc gccaccagtc atgtcacctg caatgccata 540
tgcccgggct gggtgctgac accgctggtg caaaagcaga tcgacgatcg tgcggccaag 600
ggtggcgatc ggctgcaagc gcagcacgat ctgctggcag aaaagcaacc gtcgctggct 660
ttcgtcaccc ccgaacacct cggtgagctg gtactctttc tgtgcagcga ggccggtagc 720
caggttcgcg gcgccgcctg gaacgtcgat ggtggctggt tggcccagtg a 771
<210> 8
<211> 256
<212> PRT
<213> Pseudomonas putida KT2440
<400> 8
Met Thr Leu Glu Gly Lys Thr Ala Leu Val Thr Gly Ser Thr Ser Gly
1 5 10 15
Ile Gly Leu Gly Ile Ala Gln Val Leu Ala Arg Ala Gly Ala Asn Ile
20 25 30
Val Leu Asn Gly Phe Gly Asp Pro Gly Pro Ala Met Ala Glu Ile Ala
35 40 45
Arg His Gly Val Lys Val Val His His Pro Ala Asp Leu Ser Asp Val
50 55 60
Val Gln Ile Glu Ala Leu Phe Asn Leu Ala Glu Arg Glu Phe Gly Gly
65 70 75 80
Val Asp Ile Leu Val Asn Asn Ala Gly Ile Gln His Val Ala Pro Val
85 90 95
Glu Gln Phe Pro Pro Glu Ser Trp Asp Lys Ile Ile Ala Leu Asn Leu
100 105 110
Ser Ala Val Phe His Gly Thr Arg Leu Ala Leu Pro Gly Met Arg Thr
115 120 125
Arg Asn Trp Gly Arg Ile Ile Asn Ile Ala Ser Val His Gly Leu Val
130 135 140
Gly Ser Ile Gly Lys Ala Ala Tyr Val Ala Ala Lys His Gly Val Ile
145 150 155 160
Gly Leu Thr Lys Val Val Gly Leu Glu Thr Ala Thr Ser His Val Thr
165 170 175
Cys Asn Ala Ile Cys Pro Gly Trp Val Leu Thr Pro Leu Val Gln Lys
180 185 190
Gln Ile Asp Asp Arg Ala Ala Lys Gly Gly Asp Arg Leu Gln Ala Gln
195 200 205
His Asp Leu Leu Ala Glu Lys Gln Pro Ser Leu Ala Phe Val Thr Pro
210 215 220
Glu His Leu Gly Glu Leu Val Leu Phe Leu Cys Ser Glu Ala Gly Ser
225 230 235 240
Gln Val Arg Gly Ala Ala Trp Asn Val Asp Gly Gly Trp Leu Ala Gln
245 250 255
<210> 9
<211> 750
<212> DNA
<213> Pseudomonas putida KT2440
<400> 9
atgtccaagc aacttacact cgaaggcaaa gtggccctgg ttcagggcgg ttcccgaggc 60
attggcgcag ctatcgtaag gcgcctggcc cgcgaaggcg cgcaagtggc cttcacctat 120
gtcagctctg ccggcccggc tgaagaactg gctcgggaaa ttaccgagaa cggcggcaaa 180
gccttggccc tgcgggctga cagcgctgat gccgcggccg tgcagctggc ggttgatgac 240
accgagaaag ccttgggccg gctggatatc ctggtcaaca acgccggtgt gctggcagtg 300
gccccagtga cagagttcga cctggccgac ttcgatcata tgctggccgt gaacgtacgc 360
agcgtgttcg tcgccagcca ggccgcggca cgctatatgg gccagggcgg tcgtatcatc 420
aacattggca gcaccaacgc cgagcgcatg ccgtttgccg gtggtgcacc gtacgccatg 480
agcaagtcgg cactggttgg tctgacccgc ggcatggcac gcgacctcgg gccgcagggc 540
attaccgtga acaacgtgca gcccggcccg gtggacaccg acatgaaccc ggccagtggc 600
gagtttgccg agagcctgat tccgctgatg gccattgggc gatatggcga gccggaggag 660
attgccagct tcgtggctta cctggcaggg cctgaagccg ggtatatcac cggggccagc 720
ctgactgtag atggtgggtt tgcagcctga 750
<210> 10
<211> 249
<212> PRT
<213> Pseudomonas putida KT2440
<400> 10
Met Ser Lys Gln Leu Thr Leu Glu Gly Lys Val Ala Leu Val Gln Gly
1 5 10 15
Gly Ser Arg Gly Ile Gly Ala Ala Ile Val Arg Arg Leu Ala Arg Glu
20 25 30
Gly Ala Gln Val Ala Phe Thr Tyr Val Ser Ser Ala Gly Pro Ala Glu
35 40 45
Glu Leu Ala Arg Glu Ile Thr Glu Asn Gly Gly Lys Ala Leu Ala Leu
50 55 60
Arg Ala Asp Ser Ala Asp Ala Ala Ala Val Gln Leu Ala Val Asp Asp
65 70 75 80
Thr Glu Lys Ala Leu Gly Arg Leu Asp Ile Leu Val Asn Asn Ala Gly
85 90 95
Val Leu Ala Val Ala Pro Val Thr Glu Phe Asp Leu Ala Asp Phe Asp
100 105 110
His Met Leu Ala Val Asn Val Arg Ser Val Phe Val Ala Ser Gln Ala
115 120 125
Ala Ala Arg Tyr Met Gly Gln Gly Gly Arg Ile Ile Asn Ile Gly Ser
130 135 140
Thr Asn Ala Glu Arg Met Pro Phe Ala Gly Gly Ala Pro Tyr Ala Met
145 150 155 160
Ser Lys Ser Ala Leu Val Gly Leu Thr Arg Gly Met Ala Arg Asp Leu
165 170 175
Gly Pro Gln Gly Ile Thr Val Asn Asn Val Gln Pro Gly Pro Val Asp
180 185 190
Thr Asp Met Asn Pro Ala Ser Gly Glu Phe Ala Glu Ser Leu Ile Pro
195 200 205
Leu Met Ala Ile Gly Arg Tyr Gly Glu Pro Glu Glu Ile Ala Ser Phe
210 215 220
Val Ala Tyr Leu Ala Gly Pro Glu Ala Gly Tyr Ile Thr Gly Ala Ser
225 230 235 240
Leu Thr Val Asp Gly Gly Phe Ala Ala
245
<210> 11
<211> 858
<212> DNA
<213> Pseudomonas putida KT2440
<400> 11
atgagcgact accctacccc tccattccca tcccaaccgc aaagcgttcc cggttcccag 60
cgcaagatgg atccgtatcc ggactgcggt gagcagagct acaccggcaa caatcgcctc 120
gcaggcaaga tcgccttgat aaccggtgct gacagcggca tcgggcgtgc ggtggcgatt 180
gcctatgccc gagaaggcgc tgacgttgcc attgcctatc tgaatgaaca cgacgatgcg 240
caggaaaccg cgcgctgggt caaagcggct ggccgccagt gcctgctgct gcccggcgac 300
ctggcacaga aacagcactg ccacgacatc gtcgacaaga ccgtggcgca gtttggtcgc 360
atcgatatcc tggtcaacaa cgccgcgttc cagatggccc atgaaagcct ggacgacatt 420
gatgacgatg aatgggtgaa gaccttcgat accaacatca ccgccatttt ccgcatttgc 480
cagcgcgctt tgccctcgat gccaaagggc ggttcgatca tcaacaccag ttcggtcaac 540
tctgacgacc cgtcacccag cctgttggcc tatgccgcga ccaaaggggc tattgccaat 600
ttcactgcag gccttgcgca actgctgggc aagcagggca ttcgcgtcaa cagcgtcgca 660
cccggcccga tctggacccc gctgatcccg gccaccatgc ctgatgaggc ggtgagaaac 720
ttcggttccg gttacccgat gggacggccg ggtcaacctg tggaggtggc gccaatctat 780
gtcttgctgg ggtccgatga agccagctac atctcgggtt cgcgttacgc cgtgacggga 840
ggcaaaccta ttctgtga 858
<210> 12
<211> 285
<212> PRT
<213> Pseudomonas putida KT2440
<400> 12
Met Ser Asp Tyr Pro Thr Pro Pro Phe Pro Ser Gln Pro Gln Ser Val
1 5 10 15
Pro Gly Ser Gln Arg Lys Met Asp Pro Tyr Pro Asp Cys Gly Glu Gln
20 25 30
Ser Tyr Thr Gly Asn Asn Arg Leu Ala Gly Lys Ile Ala Leu Ile Thr
35 40 45
Gly Ala Asp Ser Gly Ile Gly Arg Ala Val Ala Ile Ala Tyr Ala Arg
50 55 60
Glu Gly Ala Asp Val Ala Ile Ala Tyr Leu Asn Glu His Asp Asp Ala
65 70 75 80
Gln Glu Thr Ala Arg Trp Val Lys Ala Ala Gly Arg Gln Cys Leu Leu
85 90 95
Leu Pro Gly Asp Leu Ala Gln Lys Gln His Cys His Asp Ile Val Asp
100 105 110
Lys Thr Val Ala Gln Phe Gly Arg Ile Asp Ile Leu Val Asn Asn Ala
115 120 125
Ala Phe Gln Met Ala His Glu Ser Leu Asp Asp Ile Asp Asp Asp Glu
130 135 140
Trp Val Lys Thr Phe Asp Thr Asn Ile Thr Ala Ile Phe Arg Ile Cys
145 150 155 160
Gln Arg Ala Leu Pro Ser Met Pro Lys Gly Gly Ser Ile Ile Asn Thr
165 170 175
Ser Ser Val Asn Ser Asp Asp Pro Ser Pro Ser Leu Leu Ala Tyr Ala
180 185 190
Ala Thr Lys Gly Ala Ile Ala Asn Phe Thr Ala Gly Leu Ala Gln Leu
195 200 205
Leu Gly Lys Gln Gly Ile Arg Val Asn Ser Val Ala Pro Gly Pro Ile
210 215 220
Trp Thr Pro Leu Ile Pro Ala Thr Met Pro Asp Glu Ala Val Arg Asn
225 230 235 240
Phe Gly Ser Gly Tyr Pro Met Gly Arg Pro Gly Gln Pro Val Glu Val
245 250 255
Ala Pro Ile Tyr Val Leu Leu Gly Ser Asp Glu Ala Ser Tyr Ile Ser
260 265 270
Gly Ser Arg Tyr Ala Val Thr Gly Gly Lys Pro Ile Leu
275 280 285
<210> 13
<211> 774
<212> DNA
<213> Pseudomonas putida KT2440
<400> 13
atgatcgaaa tcagcggcag caccccgggc cacaatggcc gggtagcctt ggtcacgggc 60
gccgcccgcg gcatcggtct gggcattgcc gcatggctga tctgcgaagg ctggcaagtg 120
gtgctgagtg atctggaccg ccagcgtggt accaaagtgg ccaaggcgtt gggcgacaac 180
gcctggttca tcaccatgga cgttgccgac gaggcccagg tcagtgccgg cgtgtccgaa 240
gtgctcgggc agttcggccg gctggacgcg ctggtgtgca atgcggccat tgccaacccg 300
cacaaccaga cgctggaaag cctgagcctg gcacaatgga accgggtgct gggggtcaac 360
ctcagcggcc ccatgctgct ggccaagcat tgtgcgccgt acctgcgtgc gcacaatggg 420
gcgatcgtca acctgacctc tacccgtgct cggcagtccg aacccgacac cgaggcttac 480
gcggcaagca agggcggcct ggtggctttg acccatgccc tggccatgag cctgggcccg 540
gagattcgcg tcaatgcggt gagcccgggc tggatcgatg cccgtgatcc gtcgcagcgc 600
cgtgccgagc cgttgagcga agctgaccat gcccagcatc caacgggcag ggtagggacc 660
gtggaagatg tcgcggccat ggttgcctgg ttgctgtcac gccaggcggc atttgtcacc 720
ggccaggagt ttgtggtcga tggcggcatg acccgcaaga tgatctatac ctga 774
<210> 14
<211> 257
<212> PRT
<213> Pseudomonas putida KT2440
<400> 14
Met Ile Glu Ile Ser Gly Ser Thr Pro Gly His Asn Gly Arg Val Ala
1 5 10 15
Leu Val Thr Gly Ala Ala Arg Gly Ile Gly Leu Gly Ile Ala Ala Trp
20 25 30
Leu Ile Cys Glu Gly Trp Gln Val Val Leu Ser Asp Leu Asp Arg Gln
35 40 45
Arg Gly Thr Lys Val Ala Lys Ala Leu Gly Asp Asn Ala Trp Phe Ile
50 55 60
Thr Met Asp Val Ala Asp Glu Ala Gln Val Ser Ala Gly Val Ser Glu
65 70 75 80
Val Leu Gly Gln Phe Gly Arg Leu Asp Ala Leu Val Cys Asn Ala Ala
85 90 95
Ile Ala Asn Pro His Asn Gln Thr Leu Glu Ser Leu Ser Leu Ala Gln
100 105 110
Trp Asn Arg Val Leu Gly Val Asn Leu Ser Gly Pro Met Leu Leu Ala
115 120 125
Lys His Cys Ala Pro Tyr Leu Arg Ala His Asn Gly Ala Ile Val Asn
130 135 140
Leu Thr Ser Thr Arg Ala Arg Gln Ser Glu Pro Asp Thr Glu Ala Tyr
145 150 155 160
Ala Ala Ser Lys Gly Gly Leu Val Ala Leu Thr His Ala Leu Ala Met
165 170 175
Ser Leu Gly Pro Glu Ile Arg Val Asn Ala Val Ser Pro Gly Trp Ile
180 185 190
Asp Ala Arg Asp Pro Ser Gln Arg Arg Ala Glu Pro Leu Ser Glu Ala
195 200 205
Asp His Ala Gln His Pro Thr Gly Arg Val Gly Thr Val Glu Asp Val
210 215 220
Ala Ala Met Val Ala Trp Leu Leu Ser Arg Gln Ala Ala Phe Val Thr
225 230 235 240
Gly Gln Glu Phe Val Val Asp Gly Gly Met Thr Arg Lys Met Ile Tyr
245 250 255
Thr
<210> 15
<211> 741
<212> DNA
<213> Pseudomonas putida KT2440
<400> 15
atgagcctgc aaggtaaagt tgcactggtt accggcgcca gccgtggcat tggccaggcc 60
atcgccctcg agctgggccg ccagggcgcg accgtgatcg gtaccgccac gtcggcgtcc 120
ggtgccgagc gcatcgctgc caccctgaaa gaacacggca ttaccggcac tggcatggag 180
ctgaacgtga ccagcgccga atcggttgaa gccgtactgg ccgccattgg cgagcagttc 240
ggcgcgccgg ccatcttggt caacaatgcc ggtatcaccc gcgacaacct catgctgcgc 300
atgaaagacg acgagtggtt tgatgtcatc gacaccaacc tgaacagcct ctaccgtctg 360
tccaagggcg tgctgcgtgg catgaccaag gcgcgttggg gtcgtatcat cagcatcggc 420
tcggtcgttg gtgccatggg taacgcaggt caggccaact acgcggctgc caaggccggt 480
ctggaaggtt tcagccgcgc cctggcgcgt gaagtgggtt cgcgtggtat caccgtcaac 540
tcggtgaccc caggcttcat cgataccgac atgacccgcg agctgccaga agctcagcgc 600
gaagccctgc agacccagat tccgctgggc cgcctgggcc aggctgacga aattgccaag 660
gtggtttcgt tcctggcatc cgacggcgcc gcctacgtga ccggcgctac cgtgccggtc 720
aacggcggga tgtacatgta a 741
<210> 16
<211> 246
<212> PRT
<213> Pseudomonas putida KT2440
<400> 16
Met Ser Leu Gln Gly Lys Val Ala Leu Val Thr Gly Ala Ser Arg Gly
1 5 10 15
Ile Gly Gln Ala Ile Ala Leu Glu Leu Gly Arg Gln Gly Ala Thr Val
20 25 30
Ile Gly Thr Ala Thr Ser Ala Ser Gly Ala Glu Arg Ile Ala Ala Thr
35 40 45
Leu Lys Glu His Gly Ile Thr Gly Thr Gly Met Glu Leu Asn Val Thr
50 55 60
Ser Ala Glu Ser Val Glu Ala Val Leu Ala Ala Ile Gly Glu Gln Phe
65 70 75 80
Gly Ala Pro Ala Ile Leu Val Asn Asn Ala Gly Ile Thr Arg Asp Asn
85 90 95
Leu Met Leu Arg Met Lys Asp Asp Glu Trp Phe Asp Val Ile Asp Thr
100 105 110
Asn Leu Asn Ser Leu Tyr Arg Leu Ser Lys Gly Val Leu Arg Gly Met
115 120 125
Thr Lys Ala Arg Trp Gly Arg Ile Ile Ser Ile Gly Ser Val Val Gly
130 135 140
Ala Met Gly Asn Ala Gly Gln Ala Asn Tyr Ala Ala Ala Lys Ala Gly
145 150 155 160
Leu Glu Gly Phe Ser Arg Ala Leu Ala Arg Glu Val Gly Ser Arg Gly
165 170 175
Ile Thr Val Asn Ser Val Thr Pro Gly Phe Ile Asp Thr Asp Met Thr
180 185 190
Arg Glu Leu Pro Glu Ala Gln Arg Glu Ala Leu Gln Thr Gln Ile Pro
195 200 205
Leu Gly Arg Leu Gly Gln Ala Asp Glu Ile Ala Lys Val Val Ser Phe
210 215 220
Leu Ala Ser Asp Gly Ala Ala Tyr Val Thr Gly Ala Thr Val Pro Val
225 230 235 240
Asn Gly Gly Met Tyr Met
245
<210> 17
<211> 738
<212> DNA
<213> Pseudomonas putida KT2440
<400> 17
atgactcaga aaatagctgt cgtgaccggc ggcagtcgcg gcattggcaa gtccatcgtg 60
ctggccctgg ccggcgcggg ttatcaggtt gccttcagtt atgtccgtga cgaggcgtca 120
gccgctgcct tgcaggcgca ggtcgaaggg ctcggccggg actgcctggc cgtgcagtgt 180
gatgtcaagg aagcgccgag cattcaggcg ttttttgaac gggtcgagca acgtttcgag 240
cgtatcgact tgttggtcaa caacgccggt attacccgtg acggtttgct cgccacgcaa 300
tcgttgaacg acatcaccga ggtcatccag accaacctgg tcggcacgtt gttgtgctgt 360
cagcaggtgc tgccctgcat gatgcgccaa cgcagcgggt gcatcgtcaa cctcagttcg 420
gtggccgcgc aaaagcccgg caagggccag agcaactacg ccgccgccaa aggcggtgta 480
gaagcattga cacgcgcact ggcggtggag ttggcgccgc gcaacatccg ggtcaacgcg 540
gtggcgcccg gcatcgtcag caccgacatg agccaagccc tggtcggcgc ccatgagcag 600
gaaatccagt cgcggctgtt gatcaaacgg ttcgcccggc ctgaagaaat tgccgacgcg 660
gtgctgtatc tggccgagcg cggcctgtac atcacgggcg aagtcctgtc cgtcaacggc 720
ggattgaaaa tgccatga 738
<210> 18
<211> 245
<212> PRT
<213> Pseudomonas putida KT2440
<400> 18
Met Thr Gln Lys Ile Ala Val Val Thr Gly Gly Ser Arg Gly Ile Gly
1 5 10 15
Lys Ser Ile Val Leu Ala Leu Ala Gly Ala Gly Tyr Gln Val Ala Phe
20 25 30
Ser Tyr Val Arg Asp Glu Ala Ser Ala Ala Ala Leu Gln Ala Gln Val
35 40 45
Glu Gly Leu Gly Arg Asp Cys Leu Ala Val Gln Cys Asp Val Lys Glu
50 55 60
Ala Pro Ser Ile Gln Ala Phe Phe Glu Arg Val Glu Gln Arg Phe Glu
65 70 75 80
Arg Ile Asp Leu Leu Val Asn Asn Ala Gly Ile Thr Arg Asp Gly Leu
85 90 95
Leu Ala Thr Gln Ser Leu Asn Asp Ile Thr Glu Val Ile Gln Thr Asn
100 105 110
Leu Val Gly Thr Leu Leu Cys Cys Gln Gln Val Leu Pro Cys Met Met
115 120 125
Arg Gln Arg Ser Gly Cys Ile Val Asn Leu Ser Ser Val Ala Ala Gln
130 135 140
Lys Pro Gly Lys Gly Gln Ser Asn Tyr Ala Ala Ala Lys Gly Gly Val
145 150 155 160
Glu Ala Leu Thr Arg Ala Leu Ala Val Glu Leu Ala Pro Arg Asn Ile
165 170 175
Arg Val Asn Ala Val Ala Pro Gly Ile Val Ser Thr Asp Met Ser Gln
180 185 190
Ala Leu Val Gly Ala His Glu Gln Glu Ile Gln Ser Arg Leu Leu Ile
195 200 205
Lys Arg Phe Ala Arg Pro Glu Glu Ile Ala Asp Ala Val Leu Tyr Leu
210 215 220
Ala Glu Arg Gly Leu Tyr Ile Thr Gly Glu Val Leu Ser Val Asn Gly
225 230 235 240
Gly Leu Lys Met Pro
245
<210> 19
<211> 768
<212> DNA
<213> Pseudomonas putida KT2440
<400> 19
atgtccaaga cccacctgtt cgacctcgac ggcaagattg cctttgtttc cggcgccagc 60
cgtggcatcg gcgaggccat cgcccacttg ctcgcgcagc aaggggccca tgtgatcgtt 120
tccagccgca agcttgacgg gtgccagcag gtggccgacg ccatcattgc cgccggcggc 180
aaggccacgg ctgtggcctg ccacattggt gagctggaac agattcagca ggtgttcgcc 240
ggcattcgcg aacagttcgg gcgactggac gtgctggtca acaatgcagc caccaacccg 300
caattctgca atgtgctgga caccgaccca ggggcgttcc agaagaccgt ggacgtgaac 360
atccgtggtt acttcttcat gtcggtggag gctggcaagc tgatgcgcga gaacggcggc 420
ggcagcatca tcaacgtggc gtcgatcaac ggtgtttcac ccgggctgtt ccaaggcatc 480
tactcggtga ccaaggcggc ggtcatcaac atgaccaagg tgttcgccaa agagtgtgca 540
cccttcggta ttcgctgcaa cgcgctactg ccggggctga ccgataccaa gttcgcttcg 600
gcattggtga agaacgaagc catcctcaac gccgccttgc agcagatccc cctcaaacgc 660
gtggccgacc ccaaggaaat ggcgggtgcg gtgctgtacc tggccagcga tgcctccagc 720
tacaccaccg gcaccacgct caatgtcgac ggtggcttcc tgtcctga 768
<210> 20
<211> 255
<212> PRT
<213> Pseudomonas putida KT2440
<400> 20
Met Ser Lys Thr His Leu Phe Asp Leu Asp Gly Lys Ile Ala Phe Val
1 5 10 15
Ser Gly Ala Ser Arg Gly Ile Gly Glu Ala Ile Ala His Leu Leu Ala
20 25 30
Gln Gln Gly Ala His Val Ile Val Ser Ser Arg Lys Leu Asp Gly Cys
35 40 45
Gln Gln Val Ala Asp Ala Ile Ile Ala Ala Gly Gly Lys Ala Thr Ala
50 55 60
Val Ala Cys His Ile Gly Glu Leu Glu Gln Ile Gln Gln Val Phe Ala
65 70 75 80
Gly Ile Arg Glu Gln Phe Gly Arg Leu Asp Val Leu Val Asn Asn Ala
85 90 95
Ala Thr Asn Pro Gln Phe Cys Asn Val Leu Asp Thr Asp Pro Gly Ala
100 105 110
Phe Gln Lys Thr Val Asp Val Asn Ile Arg Gly Tyr Phe Phe Met Ser
115 120 125
Val Glu Ala Gly Lys Leu Met Arg Glu Asn Gly Gly Gly Ser Ile Ile
130 135 140
Asn Val Ala Ser Ile Asn Gly Val Ser Pro Gly Leu Phe Gln Gly Ile
145 150 155 160
Tyr Ser Val Thr Lys Ala Ala Val Ile Asn Met Thr Lys Val Phe Ala
165 170 175
Lys Glu Cys Ala Pro Phe Gly Ile Arg Cys Asn Ala Leu Leu Pro Gly
180 185 190
Leu Thr Asp Thr Lys Phe Ala Ser Ala Leu Val Lys Asn Glu Ala Ile
195 200 205
Leu Asn Ala Ala Leu Gln Gln Ile Pro Leu Lys Arg Val Ala Asp Pro
210 215 220
Lys Glu Met Ala Gly Ala Val Leu Tyr Leu Ala Ser Asp Ala Ser Ser
225 230 235 240
Tyr Thr Thr Gly Thr Thr Leu Asn Val Asp Gly Gly Phe Leu Ser
245 250 255
<210> 21
<211> 762
<212> DNA
<213> Pseudomonas fluorescens Pf-5
<400> 21
atgagcatga cgttttccgg ccaggtggcc ctagtgaccg gcgcagccaa tggtatcggc 60
cgcgccaccg cccaggcatt tgccgcacaa ggcttgaagg tggtggtggc ggacctggac 120
acggcggggg gcgagggcac cgtggcgctg atccgcgagg ccggtggcga ggcattgttc 180
gtgccgtgca acgttaccct ggaggcggat gtgcaaagcc tcatggcccg caccatcgaa 240
gcctatgggc gcctggatta cgccttcaac aatgccggta tcgagatcga aaagggccgc 300
cttgcggagg gctccatgga tgagttcgac gccatcatgg gggtcaacgt caaaggggtc 360
tggctgtgca tgaagtacca gttgccgctg ctgctggccc agggcggtgg ggcgatcgtc 420
aacaccgcct cggtggcggg cctgggcgcg gcgccgaaga tgagcatcta tgcggcctcc 480
aagcatgcgg tgatcggcct gaccaagtcg gcggccatcg aatatgcgaa gaagaaaatc 540
cgcgtgaacg cggtatgccc ggcggtgatc gacaccgaca tgttccgccg tgcctacgag 600
gcggacccga agaaggccga gttcgccgcg gccatgcacc cggtggggcg catcggcaag 660
gtcgaggaga tcgccagtgc ggtgctctac ctgtgcagcg atggcgcggc ctttaccacc 720
ggccatgcac tggcggtcga cggcggggcc accgcgatct ga 762
<210> 22
<211> 253
<212> PRT
<213> Pseudomonas fluorescens Pf-5
<400> 22
Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Ala
1 5 10 15
Asn Gly Ile Gly Arg Ala Thr Ala Gln Ala Phe Ala Ala Gln Gly Leu
20 25 30
Lys Val Val Val Ala Asp Leu Asp Thr Ala Gly Gly Glu Gly Thr Val
35 40 45
Ala Leu Ile Arg Glu Ala Gly Gly Glu Ala Leu Phe Val Pro Cys Asn
50 55 60
Val Thr Leu Glu Ala Asp Val Gln Ser Leu Met Ala Arg Thr Ile Glu
65 70 75 80
Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile
85 90 95
Glu Lys Gly Arg Leu Ala Glu Gly Ser Met Asp Glu Phe Asp Ala Ile
100 105 110
Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu
115 120 125
Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser
130 135 140
Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ala Ala Ser
145 150 155 160
Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala
165 170 175
Lys Lys Lys Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr
180 185 190
Asp Met Phe Arg Arg Ala Tyr Glu Ala Asp Pro Lys Lys Ala Glu Phe
195 200 205
Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile
210 215 220
Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr
225 230 235 240
Gly His Ala Leu Ala Val Asp Gly Gly Ala Thr Ala Ile
245 250
<210> 23
<211> 735
<212> DNA
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 23
atgaaacttg ccagtaaaac cgccattgtc accggcgccg cacgcggtat cggctttggc 60
attgcccagg tgcttgcgcg ggaaggcgcg cgagtgatta tcgccgatcg tgatgcacac 120
ggcgaagccg ccgccgcttc cctgcgcgaa tcgggcgcac aggcgctgtt tatcagctgc 180
aatatcgctg aaaaaacgca ggtcgaagcc ctgtattccc aggccgaaga ggcgtttggc 240
ccggtagaca ttctggtgaa taacgccgga atcaaccgcg acgccatgct gcacaaatta 300
acggaagcgg actgggacac ggttatcgac gttaacctga aaggcacttt cctctgtatg 360
cagcaggccg ctatccgcat gcgcgagcgc ggtgcgggcc gcattatcaa tatcgcttcc 420
gccagttggc ttggcaacgt cgggcaaacc aactattcgg cgtcaaaagc cggcgtggtg 480
ggaatgacca aaaccgcctg ccgcgaactg gcgaaaaaag gtgtcacggt gaatgccatc 540
tgcccgggct ttatcgatac cgacatgacg cgcggcgtac cggaaaacgt ctggcaaatc 600
atggtcagca aaattcccgc gggttacgcc ggcgaggcga aagacgtcgg cgagtgtgtg 660
gcgtttctgg cgtccgatgg cgcgcgctat atcaatggtg aagtgattaa cgtcggcggc 720
ggcatggtgc tgtaa 735
<210> 24
<211> 253
<212> PRT
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 24
Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Ala
1 5 10 15
Asn Gly Ile Gly Arg Ala Thr Ala Gln Ala Phe Ala Ala Gln Gly Leu
20 25 30
Lys Val Val Val Ala Asp Leu Asp Thr Ala Gly Gly Glu Gly Thr Val
35 40 45
Ala Leu Ile Arg Glu Ala Gly Gly Glu Ala Leu Phe Val Pro Cys Asn
50 55 60
Val Thr Leu Glu Ala Asp Val Gln Ser Leu Met Ala Arg Thr Ile Glu
65 70 75 80
Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile
85 90 95
Glu Lys Gly Arg Leu Ala Glu Gly Ser Met Asp Glu Phe Asp Ala Ile
100 105 110
Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu
115 120 125
Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser
130 135 140
Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ala Ala Ser
145 150 155 160
Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala
165 170 175
Lys Lys Lys Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr
180 185 190
Asp Met Phe Arg Arg Ala Tyr Glu Ala Asp Pro Lys Lys Ala Glu Phe
195 200 205
Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile
210 215 220
Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr
225 230 235 240
Gly His Ala Leu Ala Val Asp Gly Gly Ala Thr Ala Ile
245 250
<210> 25
<211> 750
<212> DNA
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 25
atgttattga aagataaagt cgccattatt actggcgcgg cctccgcacg cggtttgggc 60
ttcgcgactg cgaaattatt cgccgaaaac ggcgcgaaag tggtcattat cgacctcaat 120
ggcgaagcca gtaaaaccgc cgcggcggca ttaggcgaag accatctcgg cctggcggcc 180
aacgtcgctg atgaagtgca ggtgcaggcg gccatcgaac agatcctggc gaaatacggt 240
cgggttgatg tactggtcaa taacgccggg attacccagc cgctgaagct gatggatatc 300
aagcgcgcca actatgacgc ggtgcttgat gttagcctgc gcggcacgct gctgatgtcg 360
caggcggtta tccccaccat gcgggcgcaa aaatccggca gcatcgtctg catctcgtcc 420
gtctccgccc agcgcggcgg cggtattttc ggcggaccgc actacagcgc ggcaaaagcc 480
ggggtgctgg gtctggcgcg ggcgatggcg cgcgagcttg gcccggataa cgtccgcgtt 540
aactgcatca ccccggggct gattcagacc gacattaccg ccggcaagct gactgatgac 600
atgacggcca acattcttgc cggcattccg atgaaccgcc ttggcgacgc gatagacatc 660
gcgcgcgccg cgctgttcct cggcagcgat ctttcctcct actccaccgg catcaccctg 720
gacgttaacg gcggcatgtt aattcactaa 750
<210> 26
<211> 249
<212> PRT
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 26
Met Leu Leu Lys Asp Lys Val Ala Ile Ile Thr Gly Ala Ala Ser Ala
1 5 10 15
Arg Gly Leu Gly Phe Ala Thr Ala Lys Leu Phe Ala Glu Asn Gly Ala
20 25 30
Lys Val Val Ile Ile Asp Leu Asn Gly Glu Ala Ser Lys Thr Ala Ala
35 40 45
Ala Ala Leu Gly Glu Asp His Leu Gly Leu Ala Ala Asn Val Ala Asp
50 55 60
Glu Val Gln Val Gln Ala Ala Ile Glu Gln Ile Leu Ala Lys Tyr Gly
65 70 75 80
Arg Val Asp Val Leu Val Asn Asn Ala Gly Ile Thr Gln Pro Leu Lys
85 90 95
Leu Met Asp Ile Lys Arg Ala Asn Tyr Asp Ala Val Leu Asp Val Ser
100 105 110
Leu Arg Gly Thr Leu Leu Met Ser Gln Ala Val Ile Pro Thr Met Arg
115 120 125
Ala Gln Lys Ser Gly Ser Ile Val Cys Ile Ser Ser Val Ser Ala Gln
130 135 140
Arg Gly Gly Gly Ile Phe Gly Gly Pro His Tyr Ser Ala Ala Lys Ala
145 150 155 160
Gly Val Leu Gly Leu Ala Arg Ala Met Ala Arg Glu Leu Gly Pro Asp
165 170 175
Asn Val Arg Val Asn Cys Ile Thr Pro Gly Leu Ile Gln Thr Asp Ile
180 185 190
Thr Ala Gly Lys Leu Thr Asp Asp Met Thr Ala Asn Ile Leu Ala Gly
195 200 205
Ile Pro Met Asn Arg Leu Gly Asp Ala Ile Asp Ile Ala Arg Ala Ala
210 215 220
Leu Phe Leu Gly Ser Asp Leu Ser Ser Tyr Ser Thr Gly Ile Thr Leu
225 230 235 240
Asp Val Asn Gly Gly Met Leu Ile His
245
<210> 27
<211> 750
<212> DNA
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 27
atgttattga aagataaagt cgccattatt actggcgcgg cctccgcacg cggtttgggc 60
ttcgcgactg cgaaattatt cgccgaaaac ggcgcgaaag tggtcattat cgacctcaat 120
ggcgaagcca gtaaaaccgc cgcggcggca ttaggcgaag accatctcgg cctggcggcc 180
aacgtcgctg atgaagtgca ggtgcaggcg gccatcgaac agatcctggc gaaatacggt 240
cgggttgatg tactggtcaa taacgccggg attacccagc cgctgaagct gatggatatc 300
aagcgcgcca actatgacgc ggtgcttgat gttagcctgc gcggcacgct gctgatgtcg 360
caggcggtta tccccaccat gcgggcgcaa aaatccggca gcatcgtctg catctcgtcc 420
gtctccgccc agcgcggcgg cggtattttc ggcggaccgc actacagcgc ggcaaaagcc 480
ggggtgctgg gtctggcgcg ggcgatggcg cgcgagcttg gcccggataa cgtccgcgtt 540
aactgcatca ccccggggct gattcagacc gacattaccg ccggcaagct gactgatgac 600
atgacggcca acattcttgc cggcattccg atgaaccgcc ttggcgacgc gatagacatc 660
gcgcgcgccg cgctgttcct cggcagcgat ctttcctcct actccaccgg catcaccctg 720
gacgttaacg gcggcatgtt aattcactaa 750
<210> 28
<211> 249
<212> PRT
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 28
Met Leu Leu Lys Asp Lys Val Ala Ile Ile Thr Gly Ala Ala Ser Ala
1 5 10 15
Arg Gly Leu Gly Phe Ala Thr Ala Lys Leu Phe Ala Glu Asn Gly Ala
20 25 30
Lys Val Val Ile Ile Asp Leu Asn Gly Glu Ala Ser Lys Thr Ala Ala
35 40 45
Ala Ala Leu Gly Glu Asp His Leu Gly Leu Ala Ala Asn Val Ala Asp
50 55 60
Glu Val Gln Val Gln Ala Ala Ile Glu Gln Ile Leu Ala Lys Tyr Gly
65 70 75 80
Arg Val Asp Val Leu Val Asn Asn Ala Gly Ile Thr Gln Pro Leu Lys
85 90 95
Leu Met Asp Ile Lys Arg Ala Asn Tyr Asp Ala Val Leu Asp Val Ser
100 105 110
Leu Arg Gly Thr Leu Leu Met Ser Gln Ala Val Ile Pro Thr Met Arg
115 120 125
Ala Gln Lys Ser Gly Ser Ile Val Cys Ile Ser Ser Val Ser Ala Gln
130 135 140
Arg Gly Gly Gly Ile Phe Gly Gly Pro His Tyr Ser Ala Ala Lys Ala
145 150 155 160
Gly Val Leu Gly Leu Ala Arg Ala Met Ala Arg Glu Leu Gly Pro Asp
165 170 175
Asn Val Arg Val Asn Cys Ile Thr Pro Gly Leu Ile Gln Thr Asp Ile
180 185 190
Thr Ala Gly Lys Leu Thr Asp Asp Met Thr Ala Asn Ile Leu Ala Gly
195 200 205
Ile Pro Met Asn Arg Leu Gly Asp Ala Ile Asp Ile Ala Arg Ala Ala
210 215 220
Leu Phe Leu Gly Ser Asp Leu Ser Ser Tyr Ser Thr Gly Ile Thr Leu
225 230 235 240
Asp Val Asn Gly Gly Met Leu Ile His
245
<210> 29
<211> 714
<212> DNA
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 29
atgacagcgt ttcacaacaa atcagtgctg gttttaggcg ggagtcgggg aattggcgcg 60
gcgatcgtca ggcgttttgt cgccgatggc gcgtcggtgg tgtttagcta ttccggttcg 120
ccggaagcgg ccgagcggct ggcggcagag accggcagca cggcggtgca ggcggacagc 180
gccgatcgcg atgcggtgat aagcctggtc cgcgacagcg gcccgctgga cgtgttagtg 240
gtcaatgccg ggatcgcgct tttcggtgac gctctcgagc aggacagcga tgcaatcgat 300
cgcctgttcc acatcaatat tcacgccccc taccatgcct ccgtcgaagc ggcgcgccgc 360
atgccggaag gcgggcgcat tattgtcatc ggctcagtca atggcgatcg catgccgttg 420
ccgggaatgg cggcctatgc gctcagcaaa tcggccctgc aggggctggc gcgcggcctg 480
gcgcgggatt ttggcccgcg cggcatcacg gtcaacgtcg tccagcccgg cccaattgat 540
accgacgcca acccggagaa cggcccgatg aaagagctga tgcacagctt tatggccatt 600
aagcgccatg gccgtccgga agaggtggcg ggaatggtgg cgtggctggc cggtccggag 660
gcgtcgtttg tcactggcgc catgcacacc atcgacggag cgtttggcgc ctga 714
<210> 30
<211> 237
<212> PRT
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 30
Met Thr Ala Phe His Asn Lys Ser Val Leu Val Leu Gly Gly Ser Arg
1 5 10 15
Gly Ile Gly Ala Ala Ile Val Arg Arg Phe Val Ala Asp Gly Ala Ser
20 25 30
Val Val Phe Ser Tyr Ser Gly Ser Pro Glu Ala Ala Glu Arg Leu Ala
35 40 45
Ala Glu Thr Gly Ser Thr Ala Val Gln Ala Asp Ser Ala Asp Arg Asp
50 55 60
Ala Val Ile Ser Leu Val Arg Asp Ser Gly Pro Leu Asp Val Leu Val
65 70 75 80
Val Asn Ala Gly Ile Ala Leu Phe Gly Asp Ala Leu Glu Gln Asp Ser
85 90 95
Asp Ala Ile Asp Arg Leu Phe His Ile Asn Ile His Ala Pro Tyr His
100 105 110
Ala Ser Val Glu Ala Ala Arg Arg Met Pro Glu Gly Gly Arg Ile Ile
115 120 125
Val Ile Gly Ser Val Asn Gly Asp Arg Met Pro Leu Pro Gly Met Ala
130 135 140
Ala Tyr Ala Leu Ser Lys Ser Ala Leu Gln Gly Leu Ala Arg Gly Leu
145 150 155 160
Ala Arg Asp Phe Gly Pro Arg Gly Ile Thr Val Asn Val Val Gln Pro
165 170 175
Gly Pro Ile Asp Thr Asp Ala Asn Pro Glu Asn Gly Pro Met Lys Glu
180 185 190
Leu Met His Ser Phe Met Ala Ile Lys Arg His Gly Arg Pro Glu Glu
195 200 205
Val Ala Gly Met Val Ala Trp Leu Ala Gly Pro Glu Ala Ser Phe Val
210 215 220
Thr Gly Ala Met His Thr Ile Asp Gly Ala Phe Gly Ala
225 230 235
<210> 31
<211> 750
<212> DNA
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 31
atgaacggcc tgctaaacgg taaacgtatt gtcgtcaccg gtgcggcgcg cggtctcggg 60
taccactttg ccgaagcctg cgccgctcag ggcgcgacgg tggtgatgtg cgacatcctg 120
cagggagagc tggcggaaag cgctcatcgc ctgcagcaga agggctatca ggtcgaatct 180
cacgccatcg atcttgccag tcaagcatcg atcgagcagg tcttcagcgc catcggcgcg 240
caggggtcta tcgatggctt agtcaataac gcagcgatgg ccaccggcgt cggcggaaaa 300
aatatgatcg attacgatcc ggatctgtgg gatcgggtaa tgacggtcaa cgttaaaggc 360
acctggttgg tgacccgcgc ggcggtaccg ctgctgcgcg aaggggcggc gatcgtcaac 420
gtcgcttcgg ataccgcgct gtggggcgcg ccgcggctga tggcctatgt cgccagtaag 480
ggcgcggtga ttgcgatgac ccgctccatg gcccgcgagc tgggtgaaaa gcggatccgt 540
atcaacgcca tcgcgccggg actgacccgc gttgaggcca cggaatacgt tcccgccgag 600
cgtcatcagc tgtatgagaa cggccgcgcg ctcagcggcg cgcagcagcc ggaagatgtc 660
accggcagcg tggtctggct gctgagcgat ctttcgcgct ttatcaccgg ccaactgatc 720
ccggtcaacg gcggttttgt ctttaactaa 750
<210> 32
<211> 249
<212> PRT
<213> Klebsiella pneumonia subsp. pneumonia MGH78578
<400> 32
Met Asn Gly Leu Leu Asn Gly Lys Arg Ile Val Val Thr Gly Ala Ala
1 5 10 15
Arg Gly Leu Gly Tyr His Phe Ala Glu Ala Cys Ala Ala Gln Gly Ala
20 25 30
Thr Val Val Met Cys Asp Ile Leu Gln Gly Glu Leu Ala Glu Ser Ala
35 40 45
His Arg Leu Gln Gln Lys Gly Tyr Gln Val Glu Ser His Ala Ile Asp
50 55 60
Leu Ala Ser Gln Ala Ser Ile Glu Gln Val Phe Ser Ala Ile Gly Ala
65 70 75 80
Gln Gly Ser Ile Asp Gly Leu Val Asn Asn Ala Ala Met Ala Thr Gly
85 90 95
Val Gly Gly Lys Asn Met Ile Asp Tyr Asp Pro Asp Leu Trp Asp Arg
100 105 110
Val Met Thr Val Asn Val Lys Gly Thr Trp Leu Val Thr Arg Ala Ala
115 120 125
Val Pro Leu Leu Arg Glu Gly Ala Ala Ile Val Asn Val Ala Ser Asp
130 135 140
Thr Ala Leu Trp Gly Ala Pro Arg Leu Met Ala Tyr Val Ala Ser Lys
145 150 155 160
Gly Ala Val Ile Ala Met Thr Arg Ser Met Ala Arg Glu Leu Gly Glu
165 170 175
Lys Arg Ile Arg Ile Asn Ala Ile Ala Pro Gly Leu Thr Arg Val Glu
180 185 190
Ala Thr Glu Tyr Val Pro Ala Glu Arg His Gln Leu Tyr Glu Asn Gly
195 200 205
Arg Ala Leu Ser Gly Ala Gln Gln Pro Glu Asp Val Thr Gly Ser Val
210 215 220
Val Trp Leu Leu Ser Asp Leu Ser Arg Phe Ile Thr Gly Gln Leu Ile
225 230 235 240
Pro Val Asn Gly Gly Phe Val Phe Asn
245
<210> 33
<211> 795
<212> DNA
<213> Klebsiella pneumoniae subsp. pneumoniae MGH78578
<400> 33
atgaatgcac aaattgaagg gcgcgtcgcg gtagtcaccg gcggttcgtc aggaatcggc 60
tttgaaacgc tgcgcctgct gctgggcgaa ggggcgaaag tcgccttttg cggccgcaac 120
ccggatcggc ttgccagcgc ccatgcggcg ttgcaaaacg aatatccaga aggtgaggtg 180
ttctcctggc gctgtgacgt actgaacgaa gctgaagttg aggcgttcgc cgccgcggtc 240
gccgcgcgtt tcggcggcgt cgatatgctg attaataacg ccggccaggg ctatgtcgcc 300
cacttcgccg atacgccacg tgaggcctgg ctgcacgaag ccgaactgaa actgttcggc 360
gtgattaacc cggtaaaggc ctttcagtcc ctgctagagg cgtcggatat cgcctcgatt 420
acctgtgtga actcgctgct ggcgttacag ccggaagagc acatgatcgc cacctctgcc 480
gcccgcgccg cgctgctcaa tatgacgctg actctgtcga aagagctggt ggataaaggt 540
attcgtgtga attccattct gctggggatg gtggagtccg ggcagtggca gcgccgtttt 600
gagagccgaa gcgataagag ccagagttgg cagcagtgga ccgccgatat cgcccgtaag 660
cgggggatcc cgatggcgcg tctcggtaag ccgcaggagc cagcgcaagc gctgctattc 720
ctcgcttcgc cgctggcctc ctttaccacc ggcgcggcgc tggacgtttc cggcggtttc 780
tgtcgccatc tgtaa 795
<210> 34
<211> 264
<212> PRT
<213> Klebsiella pneumonia subsp. pneumoniae MGH78578
<400> 34
Met Asn Ala Gln Ile Glu Gly Arg Val Ala Val Val Thr Gly Gly Ser
1 5 10 15
Ser Gly Ile Gly Phe Glu Thr Leu Arg Leu Leu Leu Gly Glu Gly Ala
20 25 30
Lys Val Ala Phe Cys Gly Arg Asn Pro Asp Arg Leu Ala Ser Ala His
35 40 45
Ala Ala Leu Gln Asn Glu Tyr Pro Glu Gly Glu Val Phe Ser Trp Arg
50 55 60
Cys Asp Val Leu Asn Glu Ala Glu Val Glu Ala Phe Ala Ala Ala Val
65 70 75 80
Ala Ala Arg Phe Gly Gly Val Asp Met Leu Ile Asn Asn Ala Gly Gln
85 90 95
Gly Tyr Val Ala His Phe Ala Asp Thr Pro Arg Glu Ala Trp Leu His
100 105 110
Glu Ala Glu Leu Lys Leu Phe Gly Val Ile Asn Pro Val Lys Ala Phe
115 120 125
Gln Ser Leu Leu Glu Ala Ser Asp Ile Ala Ser Ile Thr Cys Val Asn
130 135 140
Ser Leu Leu Ala Leu Gln Pro Glu Glu His Met Ile Ala Thr Ser Ala
145 150 155 160
Ala Arg Ala Ala Leu Leu Asn Met Thr Leu Thr Leu Ser Lys Glu Leu
165 170 175
Val Asp Lys Gly Ile Arg Val Asn Ser Ile Leu Leu Gly Met Val Glu
180 185 190
Ser Gly Gln Trp Gln Arg Arg Phe Glu Ser Arg Ser Asp Lys Ser Gln
195 200 205
Ser Trp Gln Gln Trp Thr Ala Asp Ile Ala Arg Lys Arg Gly Ile Pro
210 215 220
Met Ala Arg Leu Gly Lys Pro Gln Glu Pro Ala Gln Ala Leu Leu Phe
225 230 235 240
Leu Ala Ser Pro Leu Ala Ser Phe Thr Thr Gly Ala Ala Leu Asp Val
245 250 255
Ser Gly Gly Phe Cys Arg His Leu
260
<210> 35
<211> 1204
<212> DNA
<213> Saccharomyces cerevisiae
<400> 35
atgccatttg taaaaggttt tgagccgatc tccctaagag acacaaacct ttttgaacca 60
attaagattg gtaacactca gctggcacat cgtgcggtta tgcccccatt gaccagaatg 120
agggccactc accccggaaa tattccaaat aaggagtggg ctgctgtgta ttatggtcag 180
cgtgctcaaa gacctggtac catgatcatc acggaaggta cgtttatttc ccctcaagcc 240
ggcggctatg acaacgcccc tgggatttgg tctgatgaac aggtcgctga gtggaagaat 300
atctttttag ccatccatga ttgtcagtcg ttcgcgtggg tacaactttg gtctttaggc 360
tgggcatcct tcccagacgt attggcaaga gacgggttac gctatgactg tgcatctgac 420
agagtgtata tgaatgctac gttacaagaa aaggccaaag atgcgaataa tctcgaacat 480
agtttgacta aagacgacat taaacagtat atcaaggatt acatccatgc cgctaagaat 540
tctatcgcgg ctggcgccga tggtgtagaa attcatagcg ccaatgggta cttgttgaat 600
cagttcttgg atccacattc taataagagg accgacgaat acggcggaac gatcgaaaac 660
agggcccgct ttacactgga ggttgtcgat gctcttatcg aaacaatcgg tcctgaacgg 720
gtgggtttga ggttgtcgcc atacggcact tttaacagta tgtctggagg tgctgaacca 780
ggtattatcg ctcaatatgc ttatgttttg ggtgaattag agaagagggc aaaggctggt 840
aagcgtttgg cctttgtgca ccttgttgaa ccacgtgtca cggacccatc gttggtggag 900
ggcgaaggag aatattccga gggtactaac gattttgcct actctatatg gaagggtcca 960
atcatcagag ctggtaatta cgctcttcat ccagaagtgg ttagagaaca agtaaaggat 1020
cccagaacct tgataggcta tggtagattc ttcatctcca acccagattt agtctaccgt 1080
ttagaagagg gcctgccatt gaacaagtat gacagaagta ccttctacac catgtccgcg 1140
gaaggttata ccgactaccc aacatatgaa gaggcagtag atttaggttg gaacaagaac 1200
tgat 1204
<210> 36
<211> 1203
<212> DNA
<213> Saccharomyces cerevisiae
<400> 36
atgccatttg ttaaggactt taagccacaa gctttgggtg acaccaactt attcaaacca 60
atcaaaattg gtaacaatga acttctacac cgtgctgtca ttcctccatt gactagaatg 120
agagcccaac atccaggtaa tattccaaac agagactggg ccgttgaata ctacgctcaa 180
cgtgctcaaa gaccaggaac cttgattatc actgaaggta cctttccctc tccacaatct 240
gggggttacg acaatgctcc aggtatctgg tccgaagaac aaattaaaga atggaccaag 300
attttcaagg ctattcatga gaagaaatcg ttcgcatggg tccaattatg ggttctaggt 360
tgggctgctt tcccagacac ccttgctagg gatggtttgc gttacgactc cgcttctgac 420
aacgtgtata tgaatgcaga acaagaagaa aaggctaaga aggctaacaa cccacaacac 480
agtataacaa aggatgaaat taagcaatac gtcaaagaat acgtccaagc tgccaaaaac 540
tccattgctg ctggtgccga tggtgttgaa atccacagcg ctaacggtta cttgttgaac 600
cagttcttgg acccacactc caataacaga accgatgagt atggtggatc catcgaaaac 660
agagcccgtt tcaccttgga agtggttgat gcagttgtcg atgctattgg ccctgaaaaa 720
gtcggtttga gattgtctcc atatggtgtc ttcaacagta tgtctggtgg tgctgaaacc 780
ggtattgttg ctcaatatgc ttatgtctta ggtgaactgg aaagaagagc taaagctggc 840
aagcgtttgg ctttcgtcca tctagttgaa cctcgtgtca ccaacccatt tttaactgaa 900
ggtgaaggtg aatacaatgg aggtagcaac gaatttgctt attctatctg gaagggtcca 960
attattagag caggtaactt tgctctgcac ccagaagttg tcagagaaga ggtgaaggat 1020
cctagaacat tgatcggtta cggtagattt tttatctcta atccagattt ggttgatcgt 1080
ttggaaaaag ggttaccatt aaacaaatat gacagagaca ctttctacaa aatgtcagct 1140
gagggataca ttgactaccc tacctacgaa gaagctctaa aactcggttg ggacaaaaat 1200
taa 1203
<210> 37
<211> 1203
<212> DNA
<213> Saccharomyces cerevisiae
<400> 37
atgccatttg taaaaggttt tgagccgatc tccctaagag acacaaacct ttttgaacca 60
attaagattg gtaacactca gcttgcacat cgtgcggtta tgcccccatt gaccagaatg 120
agggccactc accccggaaa tattccaaat aaggagtggg ctgctgtgta ttatggtcag 180
cgtgctcaaa gacctggtac catgatcatc acggaaggta cgtttatttc ccctcaagcc 240
ggcggctatg acaacgcccc tgggatttgg tctgatgagc aggtcgctga gtggaagaat 300
atctttttag ccatccatga ttgtcagtcg ttcgcgtggg tacaactttg gtctttaggc 360
tgggcatcct tcccagacgt attggcaaga gacgggttac gctatgactg tgcatctgac 420
agagtgtata tgaatgctac gttacaagaa aaggccaaag atgcgaataa tctcgaacat 480
agtttgacta aagacgacat taaacagtat atcaaggatt acatccatgc ggctaagaat 540
tctatcgcgg ctggcgccga tggtgtagaa attcatagcg ccaatgggta cttgttgaat 600
cagttcttgg atccacattc taataagagg accgacgaat acggcggaac gatcgaaaac 660
agggcccgct ttacactgga ggttgtcgat gctcttatcg aaactatcgg tcctgaacgg 720
gtgggtttga ggttgtcgcc gtacggcact tttaacagta tgtctggggg tgctgaacca 780
ggtattatcg ctcaatattc gtatgttttg ggtgaattag agaagagggc aaaggctggt 840
aagcgtttgg cctttgtgca cctcgttgaa ccacgtgtca cggacccatc gttggtggag 900
ggcgaaggag aatattccga gggtactaac gattttgcct actctatatg gaagggtcca 960
atcatcagag ctggtaatta cgctcttcat ccagaagtgg ttagagaaca agtaaaggat 1020
cccagaacct tgataggcta tggtagattc ttcatctcta acccagattt agtctaccgt 1080
ttagaagagg gcctgccatt gaacaagtat gacagaagta ccttctacac catgtccgcg 1140
gaaggttata ccgactaccc aacatatgaa gaggcagtag atttaggttg gaacaagaac 1200
tga 1203
<210> 38
<211> 1203
<212> DNA
<213> Saccharomyces cerevisiae
<400> 38
atgccatttg ttaaggactt taagccacaa gctttgggtg acaccaactt attcaaacca 60
atcaaaattg gtaacaatga acttctacac cgtgctgtca ttcctccatt gactagaatg 120
agagcccaac atccaggtaa tattccaaac agagactggg ccgttgaata ctacgctcaa 180
cgtgctcaaa gaccaggaac cttgattatc actgaaggta cctttccctc tccacaatct 240
gggggttacg acaatgctcc aggtatccgg tccgaagaac aaattaaaga atggaccaag 300
attttcaagg ctattcatga gaataaatcg ttcgcatggg tccaattatg ggttctaggt 360
tgggctgctt tcccagacac ccttgctagg gatggtttgc gttacgactc cgcttctgac 420
aacgtgtata tgaatgcaga acaagaagaa aaggctaaga aggctaacaa cccacaacac 480
agtataacaa aggatgaaat taagcaatac gtcaaagaat acgtccaagc tgccaaaaac 540
tccattgctg ctggtgccga tggtgttgaa atccacagcg ctaacggtta cttgttgaac 600
cagttcttgg acccacactc caataacaga accgatgagt atggtggatc catcgaaaac 660
agagcccgtt tcaccttgga agtggttgat gcagttgtcg atgctattgg ccctgaaaaa 720
gtcggtttga gattgtctcc atatggtgtc ttcaacagta tgtctggtgg tgctgaaacc 780
ggtattgttg ctcaatatgc ttatgtctta ggtgaactag aaagaagagc taaagctggc 840
aagcgtttgg ctttcgtcca tctagttgaa cctcgtgtca ccaacccatt tttaactgaa 900
ggtgaaggtg aatacaatgg aggtagcaac aaatttgctt attctatctg gaagggccca 960
attattagag ctggtaactt tgctctgcac ccagaagttg tcagagaaga ggtgaaggat 1020
cctagaacat tgatcggtta cggtagattt tttatctcta atccagattt ggttgatcgt 1080
ttggaaaaag ggttaccatt aaacaaatat gacagagaca ctttctacaa aatgtcagct 1140
gagggataca ttgactaccc tacgtacgaa gaagctctaa aactcggttg ggacaaaaat 1200
taa 1203
<210> 39
<211> 1209
<212> DNA
<213> Pichia angusta
<400> 39
atgaccccaa gcacttctct tgcttccagc aatctgttca agcctatcaa ggtcggcaaa 60
gtcgagctga aaaacagact tgttttcgct ccaaccacca gatacagagc ctcgaaggat 120
tttgttccta ccgactccat gctcaagtac tacgagcaaa gagcggaaaa taacggaggc 180
ttgctgactg ctgaggcaac ctacgtcgac ttcaattttg gcctctatcc gttcacgccg 240
atgatcaaga cgcctgcgca ggttgcggcc tgggccaaga tcatcgaggc tgtacacaag 300
cagggatcat atttctccat ccagctgtgg catctcggca gggctgccga ccccaagttc 360
aacaaggaga agggcgtgcc gttcgtggct ccgtcggcta tatacttgga ccaggactct 420
gagaaggcag cccgggaggc cggcaacgag cttagagaac tgacgatccc ggagattgag 480
gcgattgtca aagagtttgc tgcagccgcg aaaagagcca tccacgaggc caaggccgac 540
ttcatcgagc tgcacagcgc ccacggctat ctgctggacc agtttatcca gccaaacatc 600
aacaagagaa ccgacaagta cggtggttcg attgagaatc gcgcccggtt ggttctagag 660
gttgtcgacg cgtgcattga ggcggtcggc gcagaacacg tgggtataag actgtcgccg 720
tacgccaagt tccaaggcag cgagggtgtt gacagcgaaa tcaacccgat cgcgtccttc 780
ggctacattt tgagcgagct cgagaaaaga gccagagacg gaaacaggct ggcgtatgtt 840
tccgtagtcg agccaagagt tagcggaaac gtagacagca acgaccagcg gaagtttgac 900
acttcctgga tcagagaaat ctggaagggt attctattta gggccggcgg atacctcaaa 960
gaaaacgagc agtcgctgga gcacgatgtc aaccaggacg acagaacgct tattggcgtc 1020
tcgagatatt acacttcgaa tccagatctc gtggagagat tgaaaaaggg tctgtcgctg 1080
acgccctacg atagatcccg cttctacaac cactcctcca acgacggcta cctcacatgg 1140
cctaagtatg gcgaggacga ggagaagtac aaagctgtgc tggatgtcga gccaaaggcc 1200
cttgcgtag 1209
<210> 40
<211> 1206
<212> DNA
<213> Pichia angusta
<400> 40
atgtctcagc catcattaac agacacaaac ctattcaaac caatcaaggt cggtaatgtg 60
gagctcaagc acggattctt ctcggctcca accacgagat tcagagcatc tgatgatttc 120
gtgcctaccg actccatgct cagctactat gagcagcgcg cggagaacaa cggtggactt 180
atcgttgccg aagccacttt ccccgactac agctttggcc tgtatccaaa cgctcctatg 240
atcaagacgc cggagcaggt tgctgcctgg aagaaaatcg tggatgctgt ccataagcag 300
ggatctttct tctcgattca gctgtggcac ttgggaagag ttgccgtccc gcagctgaac 360
aagaagtaca acgttcccct tgttggtcct tccaaactct acgtcgacga gagcagcgag 420
aaggcagcaa aagaggcagg aaacgagcta cacgagctga ctatccctga aatcgaggcc 480
atcgtgaagg agtttgccgc cggcgccaag cgggtggttg acgaagccaa agcagacttt 540
gtggaaattc ttgctggagg aggctacttg ctggaccagt tcaaccactc aaacatcaac 600
aagagaaccg ataagtacgg tggctcgatc gaaaaccgtg ccagactgat tttggaggtt 660
gtcgacgcat gcatcgaggc ggtcggcgca gagcatgtcg gcatcaagct gtcgccatac 720
gcagcggtca atggtctcca gggtgtcgat acggagatcc accctatttc cagatatgga 780
tacatcttga gcgagttgga gagaagagga aaggagggaa agagaatcgc gtacatcaca 840
atgatcgagc ctcgtgtcaa cggcacggag gacagcaagg acacgcgggc gttcgactcc 900
tcgtgggtgg gcgagatctg gaagagcact ctgttgaggg cgggcgccta tctcaaccag 960
ttctcgaatt acctgatcca ggacgtcaac aaggacgaca gaacgctaat tggagccgct 1020
agatacttta cctccaaccc ggaccttatc gagagactga gaaagggaca ggagctgact 1080
ccgtacgaca gatcgaagtt ctacaccccg gccaccaatg acggctacat cacgtggacc 1140
aagtatggcg aggatcccga aaagtacaag ggccttgttg ccgtgaagcc acagccgctg 1200
tcctga 1206
<210> 41
<211> 1209
<212> DNA
<213> Pichia angusta
<400> 41
atgtccaaga caccaacgct agcaaacacg aatctgttca agcctattaa agtcggcaaa 60
gtcgagctga aaaacagact tgttttcgct ccaaccacca gatacagagc ctcgaaggac 120
tttgttccta ccgactccat gctcaagtac tacgaacaga gagcagagaa caacggcggt 180
ctcctggtga ccgaggctac ttatccggac tatagctttg gtctgtaccc cgacaccccg 240
atgatcaaga cgccggctca ggttgctggc tggaaaaagg tgattgaggc cgtccacaac 300
aagggctcct tcgtctctat ccagctgtgg cacctgggaa gaactgccag cgccgagttc 360
aacaagtcca agggtcttcc cctggtcggt gcttcgccga tctacatgga cgaggactcc 420
gagaaggcgg ccaaggaggc tggcaacgag ctcagagcgc tcacgattcc tgaaatagag 480
aacattgtta ccgaatatgc tgctgccgcc aagcgtgcga tccacgaggc caaggccgac 540
ttcatcgagc tgcacggcgc ccacggctat cttctcgatc agttcaacca gcctggctcc 600
aataagagaa ccgacaagta tggtggatcc atcgagaacc gcgccagact gatcctggag 660
gctgttgacg cctgcatcga ggctgttggc gctgagcacg ttgccatcag actgtctccg 720
tatgcggccg ttcagggtat caaaggtgtt gacagcgaga tccaccccat ctcctacttt 780
ggctacgtgc tgagcgagct cgagcgcaga gcccaggagg gaaagagact ggcctacatc 840
tctgttgtcg agccaagagt caacggcatc tacgactcca aggacaagag agaattcaac 900
acctcgtgga tcagcgaaat ctggaagggt gttcttctga gatctggtgc ctacctgaac 960
gagaactaca agttcttgca gcatgacgtg gacgagaacg acagaaccct gattggagtt 1020
tccagatact acacgtccaa cccagacctt gctgaccggc tcaagaacgg ccacgagctg 1080
acaccatatg atagatctaa attctacaaa cactcctcca acgacggata cctgacctgg 1140
accagatacg gagagaaaga gcctcagtac aaggatctgg tggatgttgc tccagagcca 1200
ctggcctga 1209
<210> 42
<211> 1077
<212> DNA
<213> Zymomonas mobilis
<400> 42
atgcctagct tgtttgatcc catccgcttc ggcgctttta ccgcaaaaaa tagaatttgg 60
atggcgcctc tgacccgtgg ccgtgccacg cgcgatcatg tccccactga aataatggcc 120
gaatattatg cccagagggc aagcgccgga ctgattattt cagaagcgac tggcattagt 180
caggaaggtt tgggctggcc ttatgctccg ggaatctgga gtgatgccca agtagaagcc 240
tggctgccga ttacgcaggc cgtgcatgat gccggcggtc ttatctttgc ccagctatgg 300
catatgggac gtatggtgcc gtctaatgtc agtgggatgc agcctgttgc gccttctgcc 360
agtcaggcac ccggattggg gcatacctat gatggtaaaa agccttatga tgttgcccgc 420
gctttgcgat tggatgaaat tccgcgtctt cttgatgatt atgaaaaggc tgcccgtcat 480
gccttgaagg ccggttttga tggcgtacag atccatgccg ctaatggtta tttgattgac 540
gaatttatac gggatagcac caaccatcgt catgatgaat atgggggtgc agttgaaaac 600
cgtattcgtt tgctgaaaga cgtcaccgaa cgagttattg caaccattgg gaaagagcgg 660
acggccgtta ggttatcacc gaatggtgaa atacagggga cggttgatag tcatcccgaa 720
caggttttta taccggcggc caaaatgttg tctgatttgg atattgcctt tttagggatg 780
cgagaagggg ctgttgatgg cacctttggc aaaacagatc agcccaaatt atcgcctgaa 840
atccgaaaag ttttcaaacc gcctttggtt cttaatcagg attatacttt tgaaaccgcg 900
caagctgctc ttgattccgg tgtggccgat gccatcagtt ttggaaggcc ttttatcggt 960
aatcctgatt tgccacggcg tttctttgag aaagcccccc ttaccaaaga tgtgattgag 1020
acttggtata cccaaacccc caagggatat acggattatc ctttgcttgg ggattga 1077
<210> 43
<211> 1098
<212> DNA
<213> Escherichia coli DH10B
<400> 43
atgtcatctg aaaaactgta ttccccactg aaagtgggcg cgatcacggc ggcaaaccgt 60
atttttatgg caccgctgac gcgtctgcgc agtattgaac cgggtgacat tcctaccccg 120
ttgatggcgg aatactatcg ccaacgtgcc agtgccggtt tgattattag tgaagccacg 180
caaatttctg cccaggcaaa aggatatgca ggtgcgcctg gcatccatag tccggagcaa 240
attgccgcat ggaaaaaaat caccgctggc gttcatgctg aaaatggtca tatggccgtg 300
cagctgtggc acaccggacg catttctcac gccagcctgc aacctggcgg tcaggcaccg 360
gtagcgcctt cagcacttag cgcgggaaca cgtacttctc tgcgcgatga aaatggtcag 420
gcgatccgtg ttgaaacatc catgccgcgt gcgcttgaac tggaagagat tccaggtatc 480
gtcaatgatt tccgtcaggc cattgctaac gcgcgtgaag ccggttttga tctggtagag 540
ctccactctg ctcacggtta tttgctgcat cagttccttt ctccttcttc aaaccatcgt 600
accgatcagt acggcggcag cgtggaaaat cgcgcacgtt tggtactgga agtggtcgat 660
gccgggattg aagaatgggg tgccgatcgc attggcattc gcgtttcacc aatcggtact 720
ttccagaaca cagataacgg cccgaatgaa gaagccgatg cactgtatct gattgaacaa 780
ctgggtaaac gcggcattgc ttatctgcat atgtcagaac cagattgggc ggggggtgaa 840
ccgtatactg atgcgttccg cgaaaaagta cgcgcccgtt tccacggtcc gattatcggc 900
gcaggtgcat acacagtaga aaaagctgaa acgctgatcg gcaaagggtt aattgatgcg 960
gtggcatttg gtcgtgactg gattgcgaac ccggatctgg tcgcccgctt gcagcgcaaa 1020
gctgagctta acccacagcg tgccgaaagt ttctacggtg gcggcgcgga aggctatacc 1080
gattacccga cgttgtaa 1098
<210> 44
<211> 2019
<212> DNA
<213> Escherichia coli DH10B
<400> 44
atgagctacc cgtcgctgtt cgccccgctg gatttaggtt ttaccacgtt aaaaaaccgc 60
gtgttgatgg gctcaatgca caccgggctg gaggaatacc cggacggtgc cgagcggctg 120
gcagcgtttt atgccgaacg cgcccgtcac ggcgtggcgc tgattgtcag cggcggcatt 180
gcaccagatt taacaggcgt tggcatggaa ggtggcgcaa tgctcaacga cgccagccag 240
atcccacacc atcgcaccat taccgaagcg gtacatcagg aaggcggcaa aatagccctg 300
caaattttgc ataccgggcg ctacagctac caaccgcatc tggtcgcccc gtccgcattg 360
caggccccca tcaaccgttt cgtgccccat gagttaagcc atgaagagat cctgcaactg 420
atcgacaatt tcgcccgctg cgcgcaactg gcgcgggagg caggatacga cggtgtagag 480
gtgatgggtt ccgaagggta tttgatcaac gaatttctga cgctgcgcac caatcagcgt 540
agtgaccagt ggggcggcga ttaccgcaac cggatgcgat ttgccgtaga agtagtgcgt 600
gcggtgcgcg aacgcgtcgg caacgacttc attattatct accgactgtc gatgctcgac 660
ctggtcgaag acggcgggac ttttgccgaa acggtagagc tggcgcaggc cattgaagcg 720
gcgggcgcga ccattatcaa caccggcatt ggctggcatg aagcacgtat tccgaccatt 780
gccacgcccg tgccgcgcgg cgcatttagc tgggtcacgc gcaaactgaa aggccacgtc 840
tcgctgccgc tggtaaccac caaccggatt aacgatccgc aggttgccga cgatattctc 900
tcgcgcggcg atgccgatat ggtatcgatg gcgcgaccgt ttcttgctga tgcggagctg 960
ctgtcaaaag cgcaatcggg acgagccgat gagatcaaca cttgtattgg ctgcaatcag 1020
gcctgtctcg atcaaatctt cgttggcaaa gtcacctcgt gcctggtgaa tcctcgcgcc 1080
tgccacgaaa ccaaaatgcc aatccttccc gccgtgcaga aaaaaaatct ggcggtggtc 1140
ggtgcgggac ctgctgggct ggcgtttgcc attaacgcgg cggcgcgtgg gcatcaggta 1200
acattgtttg acgctcatag cgagattggc gggcagttta atatcgccaa acagatcccc 1260
ggcaaagagg agttttacga aacgctgcgc tattaccgcc ggatgatcga agtgacgggc 1320
gtgacgctaa aactcaatca caccgtgacg gcggatcagt tacaggcttt cgatgaaacg 1380
atcctcgcca gtgggatcgt gccgcgcact ccgcccatcg acgggatcga tcatccgaag 1440
gtattgagtt atctcgatgt actgcgcgac aaagcgccgg ttggcaacaa agttgccatc 1500
atcggttgtg gcgggattgg ttttgatacg gcgatgtatt taagtcagcc gggcgaatcc 1560
accagccaga atatcgccgg gttctgtaat gaatggggga tcgacagtag cctacaacag 1620
gctggtggct taagcccgca gggaatgcag atcccccgta gcccacggca gattgtgatg 1680
ctccagcgca aagccagcaa accaggacag gggttaggca aaaccaccgg ctggatccat 1740
cgcaccaccc tgctctcgcg gggtgtgaaa atgatcccag gcgtaagtta tcagaagatt 1800
gacgatgacg ggctgcatgt ggtgatcaac ggcgaaacgc aggtattagc agtggacaat 1860
gtggtgatct gcgcagggca agagccaaac cgcgcgctgg cgcaaccgct gattgatagc 1920
gggaaaacgg tgcatttaat tggcggctgc gatgtggcta tggagctgga cgcacgacgg 1980
gcaattgccc agggaacacg gctggcgctg gagatttaa 2019
<210> 45
<211> 1098
<212> DNA
<213> Klebsiella pneumoniae MGH78578
<400> 45
atgtcggaag caaaattatt cagcccactg aaagtcggtg cggtcaccgt ccctaatcgc 60
gtatttatgg cgccgttgac gcgtctgcgc agcattgagc cgggcgatat ccctactccg 120
ctgatgggcg aatactaccg ccagcgcgcc agttccgggc tgatcatcac cgaagcgacg 180
cagatctccg cgcaggccaa aggctacgcc ggcgcgcctg ggctgcacag cccggagcag 240
attgccgcct ggcagaaaat taccgccggc gttcatgccg aaaacggtca tatcgccgtc 300
cagctgtggc acaccgggcg tatttcccat agcagcctgc agcctggcgg cgccgccccg 360
gtagcgcctt ccgcgctgag cgcgggcacc cgtacctcac tgcgtgacga aaacggccac 420
gccattcgcg tcgacacctc aatgccccgc gccctggaaa ccgcagagat cccagggatc 480
gtcaacgatt tccgtcaggc ggtcggcaat gcccgtgacg ccggcttcga tctggttgag 540
ctgcactcag cccacggcta tctgctgcac caattcctct cgccatcggc gaaccagcgt 600
accgatcagt acggcggcag cgtggagaac cgtgcccgtc tggtgctgga agtggttgac 660
gccgtgagtc aagagtggag cgccgagcgc attggcatcc gcgtgtcgcc gattggcagc 720
ttccagaatg tggataatgg cccgaacgaa gaagaagacg cgctgtatct gattagcgag 780
ctggcgaaac gcggtatcgc ctatctgcac atgtccgagc cggactgggc gggcggcaaa 840
ccttacagtg aagctttccg tcagaaagtc cgcgaccgct tcccgggggt gatcattggc 900
gctggcgctt acacagtaga aaaagccaac gatcttatca ataaagggct gattgatgcc 960
gtggcctttg gccgcgatta catcgccaac ccggatctgg tggctcgcct gcagaaaaaa 1020
gcgccgctta acccgcaacg cccggaatcc ttctacggcg gcggcgcgga aggctacacc 1080
gattacccga ctctgtaa 1098
<210> 46
<211> 2778
<212> DNA
<213> Klebsiella pneumoniae MGH78578
<400> 46
atgaccagta acgaacgtat tttgcagcca tttactttac caaatggtac cgagctgaaa 60
aaccgtttgc tcatggcgcc aatgaccacc tgcaccggtt atttcgatgg tactgtcacc 120
agcgagctgg tggagtacta ccgcgcgcgc gccggaagca tcggtaccat tattgtcgag 180
tgctgcttta ttgatgacta cggtctggcc ttcccgggcg cgatcggcat tgataatgat 240
gaaaaaattg ccggcctggc gaaaatcgct gaggcgatca aagccgaggg ttcaaaagcg 300
attctgcaga tctaccacgg cggccgtatg gtcgacccgc agctgatcgg ggggcgccag 360
ccggtggcgc cgagcgctat tgccgcgccg cgtgagggcg ccgccatgcc gcgggcgctg 420
agcggagaag aagtggaagg gatgatcgcc aagtttggcg acggcgttcg tcgcgccatt 480
ctcgccggtt tcgacggggt cgaaattcac ggcgccaaca cctatctcat tcagcagttc 540
tattcgccga actccaacca gcgcgatgac gagtggggcg gtagccgcga caaccgcgcc 600
cgtttcccac tggcggtgct ggatattacc cacaaaatgg cccgccagta cgccgacgat 660
gcctttatca tcggctatcg cttctcgccg gaggagatgg aggtcccggg gatccgcttt 720
gacgacacca tgtatctgct ggaaaagctg gccgcccgcg gtgtcgatta tctgcacttc 780
tcggtgggtg ccaccctgcg tccgtctatc gtcgatacca gcgatgcgac gccgctgatc 840
gagaaatact gcgcgatgcg ctctgacacc ctcgcccagg tgccggtgat gggcgtcggc 900
ggggtggtga acgccgctga tgccgagcag ggcctcgatc atggttatga cctgatcgcc 960
gtgggccgcg cctgcatcgc ctatccggac tgggcgtcac gtatcgccgc cggcgaagag 1020
ctggagctgt ttatcgacag cacccagcgt gaagcgctgc acattccgga accgctatgg 1080
cgtttctcgc tggtggaagc gatgatccgc gacatgagca tgggcgacgc caaatttaaa 1140
ccggggatgt ttgttgagac cgtccacgat gacgccaatg agctggtgat caacgtcagc 1200
ctcgaaaatg accatattgc cgatatcgaa ctggcggcga gcccggtcca gactgtggaa 1260
ttcaccacca gcttcgaaga gatccgcgaa cgtattctca ccgccaatac cccgcacgtc 1320
gatgccattt ccggggccac cagccagagc gaggcggtga aaaaagcggt cgccaaagcg 1380
atgctgaaat cgagtaaagc gctggcggcg gaagagggcg gcaatgacgc cgcgccgaaa 1440
agctatgatg tggtggtagt cggcagcggc ggcgccggtc tggcggcagc cattcaggca 1500
cacgacgaag gggccagcgt gctgatcgtt gaaaaaatgc caaccatcgg cgggaacacc 1560
atcaaggctt ccgccgggat gaacgccgcg gaaacccgct tccagcgcgt gaaaggtatc 1620
gaagacagta aggagttgtt ctatcaggaa accctgaagg gcggccacaa caaaaacaac 1680
ccgcagctgc tgcgccgttt cgttgaaaac gcgccgcaag ccattgagtg gctggcggac 1740
cggggcatta tgctcaacga cattaccacc accggtggga tgagcattga ccgtacccac 1800
cgtccgcgcg acgggtcagc ggttggcggc tatctgatta gcggcctggt gcgcaacatc 1860
accaaacgcg gtattgacgt cctgctggat acctcggtgg aagagatcct gatgcgcggg 1920
gatgaggtta gcggtgtacg tctgatcaac gacgaaaaag aggtcattga agtacagacc 1980
aaaagcatcg tagtggccac cggcggcttc agcgctaaca gcgcgatggt cgtgaagtat 2040
cgtcctgacc ttgaaggctt cgtcaccact aaccacaaag gggctaccgg gagcggtatc 2100
gcgttgctgg aacgcatcgg cgccggcacc gtggacatgg gcgaaattca gattcacccg 2160
accgtcgagc agcagacctc gtatctgatt tccgaatcga ttcgcggcgg cggcgctatt 2220
ctcgtaaacc agcaggggaa ccgcttcttc aacgagatgg agacccgcga taaagtctcg 2280
gcggcgatta tcgctctgcc ggaacactat gcttgcatcg tcttcgacga gcatgtgcgg 2340
gcgaaaaaca aagctgccga cgagtacatc gccaaaggct tcgtcaccag cgccagctca 2400
ccgcgggaac tggcggagaa actggggatg gattaccatg ccttcctcgc caccctcgag 2460
tgctataacg gggcggtgga aaaacagcat gatgaacagt ttggccggac caccgcgcta 2520
cgcgcgccga ttaacgaagg cccgttccac gccattcgca tcgcccccgg cgtgcaccac 2580
accatgggcg gcgtgaccat taataccgat ggcgaagtgc tgaatgtggc gcagcagccg 2640
atttgcggcg cctacgccgc cggtgaagtg gtgggcggga tccacggcgg caaccgtatc 2700
ggcggtaacg cggtggcgga tatcatcatc ttcggtaccc tcgcgggcca tcaggcggcg 2760
aaacgtgcca gaggataa 2778
<210> 47
<211> 1050
<212> DNA
<213> Pseudomonas fleurescens Pf-5
<400> 47
atgacgactc tctttgatcc gatcaaactc ggcgatctcg aactgtccaa ccgcatcatc 60
atggcgccgc tgacccgctg ccgcgccgat gccggccgcg tacccaacgc gctgatggcc 120
gaatactacg tacaacgggc ttccgccggc ctgatcctca gcgaggccac ctcggtgacc 180
cccatgggcg tgggctaccc ggacaccccc ggcatctggt ccaacgacca ggtgcgtggc 240
tgggccaatg tgaccaaggc agtacacggc gccggtggca agatattcct gcagctgtgg 300
cacgtcggac gcatctccca cccgtcctat ctgaacggcg aaaccccggt ggcacccagc 360
gccctgcagc ccaaggggca tgtcagcctg gtgcgcccgc tggccgactt cccaactccg 420
cgggccctgg aaaccgctga aatcgccgac atcgtcgatg cctaccgggt cggcgcggaa 480
aacgccaagg ccgccggttt cgacggcgtg gaaatccacg gcgccaacgg ctacctgctg 540
gaccagttcc tgcaaagcag caccaaccag cgtaccgacc agtacggcgg ctccctggaa 600
aaccgtgccc gcctgctgct ggaagtcacc gacgcggcca tcgagatctg gggtgccggc 660
cgggtaggcg tgcacctggc accacgtgcc gactcccatg acatgggtga tgccaacctg 720
gcggagacct tcacctacgt cgctcgggag ctgggcaaac gcggtatcgc ctttatctgc 780
tcccgcgaga aagaaggcgc cgacagcctg ggcccgcaac tcaaagaagc cttcggcggc 840
ccctacatcg ccaacgaacg cttcaccaag gacagcgcca acgcctggct ggccgctggc 900
aaggctgacg ccgtggcctt tggtgtgccc ttcatcgcca acccggacct gccagcccgc 960
ctgaaggccg atgcgccgtt gaacgaagcg cacccggaaa ccttctacgg caagggcccg 1020
gtcggctata tcgactaccc gactctgtaa 1050
<210> 48
<211> 1101
<212> DNA
<213> Pseudomonas fleurescens Pf-5
<400> 48
atgaccgatc agaatctgtt caccccttac acccttggcg ccctcgcgct ggcgaaccgc 60
atcgtcctcg cgccactgac ccgcaaccgc gcgggcgcag gctttgttcc cagcgaattc 120
gccgccacct attacagcca acgcgctagc gcaggcttgc tgatcagcga agccacgcag 180
atttcccaac agggccaggg ctatcaggac acccccggga tctacaccca ggcgcagatt 240
gatggctggc gcacggtgac cgacgcggtc cacgcccagg gcgcaaagat ctttgtgcaa 300
ctgtggcatg tcggccgcgt gtcccacgtt gatctgcaag aaaacggcgc cgcccccgtg 360
gccccttccg cgctgcgtgc ggccaccaag gtgttcgtca acaaccgctt tgaagacgcc 420
agcgagcccc gcgcactgga catcagcgag ctgccgggga tcgtcgccga tttccgccag 480
gccgcggcaa acgctatcgc tgccgggttc gatggcgtgg aaattcacgg cgcgaacggc 540
tatttgctgg atcagttcct caaggacagc gccaacgtac gcaccgatgc ttacggcggc 600
tcgattgaaa atcgtgcgcg tctgttgctc gaagtcaccg ctgccgtggt caatgaaatc 660
ggcgcggatc gcaccggggt gcgcttgtcg ccggtgtcgc cggccaacgg tgtctccagc 720
agcaatccgc aggcgcaatt caattacgtc gtcgatcaac tcgacgccct cgacgtcgtt 780
tacctgcaca tggtcgaagg cgcgaccggt ggcccacgtg acgtggcgcc attggatttc 840
accgccctgc gccagcgttt caaaaacacc tacatcgcca acaacggcta tgacctggag 900
ctggcaacct cacggctcgc cgaagaccag gccgatctga tcgcgttcgg tcgcccgttc 960
atcggcaacc cggatctggt ggagcgtctc aagaccggcg ccgccttgtc cgcattcaat 1020
cccgccaccc tctacggcgg cggcgcggca ggctacatcg actacccgac gctggttgat 1080
tcgagcgcca gcgcaagctg a 1101
<210> 49
<211> 1104
<212> DNA
<213> Pseudomonas fleurescens Pf-5
<400> 49
atgcctgttc aagccttgtt caaacccttt caactcggcg cgctggaact gccgactcgc 60
gtggtgatgg caccaatgac ccggtcgttt tcccccggtg gcgtgcccaa ctccaaggtc 120
atcgagtatt accgccgccg cgctgctgcg ggtgtcggcc tgatcattac cgagggcacc 180
acggtgggtc accaggctgc caatggttac cccaatgtgc cgcagttcca tggcgaggcg 240
gccctggccg gctggaagaa ggtggtggat gcggtccacg ccgaaggcgg caagatcgtc 300
ccgcaactct ggcatgtggg caatgtgcgg cgcctgggca ccgagccgga cgccagcgtg 360
cccggctacg gccccaccga gaagctcaag gacggcaagg tgctggtgca cggcatgacc 420
caccaggaca tccaggaggt gatcgcagcc tttgcccagg ccgccaagga tgcccagagc 480
atcggcatgg acggcgtgga gatccatggc gcccatggtt acctggtgga ccagttcttc 540
tgggaaggca ccaaccagcg taccgatgaa tacggtggcg acctggccca gcgctcgcgc 600
ttcgccattg agctgatcca ggccgtgcgg gctgccgtcg gtccggattt cccgatcatc 660
ctgcgttttt cccagtggaa gcagcaggac tacagcgcgc gcctggtgca gaccccggaa 720
gctctggagg ccttcctcaa gccgctggcg gatgccggtg tggatatctt ccactgctcg 780
acccgccgct tctgggagcc tgagttcgaa ggttccgacc tcaacctggc gggctggact 840
cgcaaactca ccggcaagcc caccatcacc gtgggcagcg tcggcctgga cggcgagttc 900
ctgcagttca tggtcaacac cgacaaggtg gcgcagccgg ccagcctgga aaacctgctg 960
cagcgtctga ataacgacga gttcgatctg gtggccgtgg gccgtgcact gctggtggat 1020
ccggattggg cgcagaaagt ccgtgaaggt cgcgagcagg acatcctgcc gttcagccgt 1080
gacgctctga cgaccctggt ttaa 1104
<210> 50
<211> 1050
<212> DNA
<213> Pseudomonas putida
<400> 50
atgaccacgc ttttcgatcc gatcaaactg ggcgacctgc aactgcccaa ccgtatcatc 60
atggccccgc tcacccgctg ccgtgccgat gaaggccgtg tgcccaatgc gctgatggcc 120
gaatactacg tacaacgtgc cagcgccggg ctgatcctca gcgaggccac ttcggtcagc 180
ccaatgggcg tcggctaccc agataccccc ggcatctgga acgatgaaca ggtacgtggc 240
tggaacaatg tgacaaaggc cgtacatgcc gcgggcggtc gcatcttcct gcagctgtgg 300
cacgtgggtc gtatctccca ccccagctat ctgaatggcg aactgcctgt ggcccccagc 360
gcgatccagc ccaagggcca tgtgagcctg gtgcgcccgc tgagtgacta ccctaccccg 420
cgggcgctgg aaaccgaaga aatcaacgac atcgtcgagg cctaccgcag tggtgccgaa 480
aatgccaagg ctgccggttt cgatggtgtg gagatccatg gcgccaacgg ttacctgctc 540
gaccaattcc tgcaaagcag caccaaccag cgcaccgacc gttacggtgg ctcgctggaa 600
aaccgcgcgc gcctgctgct ggaggtgacc gatgcggcca ttgaagtgtg gggcgcgcag 660
cgtgtaggtg tgcacctggc accgcgagcc gacgcccatg acatgggcga cgccgaccgc 720
gccgagacct tcacctatgt ggcccgagcg ctgggcaagc gcggcatcgc cttcatctgc 780
tcgcgggagc gggaagccga cgacagcatc gggccgctga tcaaagaggc attcggtggc 840
ccgtacatcg tcaacgagcg gttcgacaag gccagtgcca atgcggccct ggccagtggc 900
aaagcggatg ccgtggcgtt tggtgtgccg ttcatcgcca accctgacct gccggcacgg 960
ctggcagcgg atgcgccgtt gaatgaggcg cggcctgaga ctttctatgg caaggggccg 1020
gtggggtaca tcgattaccc gcggttgtaa 1050
<210> 51
<211> 747
<212> DNA
<213> Thermotoga maritima
<400> 51
atgatagagt acaggattga ggaggcagta gcgaagtaca gagagttcta cgaattcaag 60
cccgtcagag aaagcgcagg tattgaagat gtgaaaagtg ctatagagca cacgaatctg 120
aaaccgtttg ccacaccaga cgatataaaa aaactctgtc ttgaagcaag ggaaaatcgt 180
ttccatggag tctgtgtgaa tccgtgttat gtgaaactgg ctcgtgaaga actcgaagga 240
accgatgtga aagtcgtcac cgttgttggt tttccactgg gagcgaacga aactcggacg 300
aaagcccatg aggcgatttt cgctgttgag agtggagccg atgagatcga tatggtcatc 360
aacgttggca tgctcaaggc aaaggagtgg gagtacgttt acgaggatat aagaagtgtt 420
gtcgaatcgg tgaaaggaaa agttgtgaag gtgatcatcg aaacgtgcta tctggatacg 480
gaagagaaga tagcggcgtg tgtcatttcc aaacttgctg gagctcattt cgtgaagact 540
tccacgggat ttggaacagg aggggcgacc gcagaagacg ttcatctcat gaaatggatc 600
gtgggagatg agatgggtgt aaaagcttcc ggagggatca gaaccttcga ggacgctgtt 660
aaaatgatca tgtacggtgc tgatagaata ggaacgagtt cgggagttaa gatcgttcag 720
gggggagaag agagatatgg aggttaa 747
<210> 52
<211> 837
<212> DNA
<213> Thermotoga maritima
<400> 52
atggtttaca caactccatg gaacagaaag atcgagtttg gaagaacgat ggttatggga 60
ataataaacg tcacaccgga ctccttcttc gctgattcca gaaaacagag cgtactcgaa 120
gcggtggaaa ccgcaaagaa gatgatagaa gaaggtgctg acataataga cgtgggagga 180
atgtccaccc gtcccggatc agatcccgtc gatgaggaag aagaattgaa cagagtgatt 240
cccgtgataa gagcgatcag atcgataacc gacgttccga tttccgtaga tacatacagg 300
tggagggtgg ctttgaaagc tcttgaagcc ggagcggata tcgtaaacga tatcagcggt 360
tatcaattcg aaccggatat cgtcagagta gtttctgaaa acaacgtccc ttacgttctc 420
atgcacataa aaggaacgcc aaagacgatg caggaaaatc ctcattacga agatgtggtg 480
aaggagataa aagagtactt cacagaaaaa atagagtatc taaaagaaaa aggtgtgaac 540
cagatcgttc tggacccggg tatcgggttt ggaaaaagat acgaagacaa cctcgaaatt 600
cttcgaagga tcgacgaatt caaagagtta aaactgccca tcctcatagg tgcttcaaga 660
aaatctttca taggaatcac cttgggaaac gtgccccccg aagaaagact tgaaggtact 720
cttgcggtca ccgcgtactg cacgatgaaa ggagtagata taattcgggt acacgatgtc 780
ctccctaaca agagggtgat aagaatgatg gaggcgatac tctggcaaag gttgtaa 837
<210> 53
<211> 618
<212> DNA
<213> Thermotogo maritima
<400> 53
atgaagatgg aagagctctt caaaaaacac aagattgtag ccgtgctgag ggcaaacagt 60
gtggaagaag cgaaagaaaa ggcgttggct gtttttgaag gaggagttca cctcatcgaa 120
atcaccttca ctgttccaga cgctgacaca gtcatcaaag aactctcgtt cctcaaggaa 180
aaaggtgcca taataggtgc aggtacagtg acgagtgtcg aacagtgcag aaaagctgta 240
gaaagtggag cagagttcat cgtcagtcca caccttgacg aggaaatctc tcaattctgc 300
aaagaaaaag gtgtcttcta catgcccggt gtgatgacac ccaccgaact tgtaaaagcc 360
atgaaactcg gtcacacgat tttgaaactc ttccctggag aagtggtggg acctcagttt 420
gtaaaagcga tgaaaggacc gttccccaat gtgaaattcg tgcccactgg aggcgtgaat 480
ctggacaacg tgtgtgagtg gttcaaagcc ggagtcctcg ctgttggtgt tggaagtgcg 540
cttgtgaaag gaacaccaga cgaggtgaga gaaaaagcaa aagcgttcgt agaaaagatc 600
agggggtgca cagaataa 618
<210> 54
<211> 948
<212> DNA
<213> Thermotoga maritima
<400> 54
atgacaatgc cttatgtaaa gaacacgaaa gaaattctgg aaaaagccag caaagagaga 60
tacgctatcg gtgcattcaa tttcaacaac atggaatttc tccaggcaat tcttgaagcc 120
gctgaggaag aaaaagcacc ggtcatcgtc gctacatcgg aaggagcgat aaagtacata 180
ggaaagggcg atatagaaac aggagcaaaa cttgccgttg aaatggtgag aacttacgct 240
gaaaaacttt cagttcccgt cgcactccac ctggaccacg gaagagactt taaagttatc 300
atggctgcca taaaagcggg ttactcttca gtgatgatcg acgcttcgca tcttcccttc 360
gaggaaaacc tcagagagac gaagaggatc gtggagatag ctcacgcggt tggtataagt 420
gtagaagcgg aactcggaaa actcaaggga atagaggaca atgtggtgga aaaagagtcc 480
gtgctcgtcg atccggaaga agcaaaggta tttgtgaagg aaacagaagt ggatttcctg 540
gctccagcca ttggaaccag ccacggtgcg ttcaagttca aaggggaagc acagctcgac 600
tttgaacgac tgaagaaagt gaaagaatac acccagatac cgctcgttct tcacggagct 660
tccatggtac cgcaggatat tgtgaaactg gcgaacgaat acggtgccga gctttccggt 720
gcgaaaggcg ttccggaaga catgctgaag aaagctatag aacttggtat caacaagata 780
aacacagaca ccgatctgag aatcaccttc gtcgcgtatc tcaggaaggt tctctcagaa 840
gacaagtctc agatagatcc cagaaaaatt ttcaaacctg tcttcgaaca ggtgaaagaa 900
atcgtcaagg agagaatcag aatattcgga tccagcggaa aggcgtaa 948
<210> 55
<211> 765
<212> DNA
<213> Thermotoga maritima
<400> 55
atgaggagta cagacaggtt actgtttata gattttctgt tgaagtttga aaacaaaaac 60
ggaactgtga taccttgttg tgtggataat tttgactgta cgtttaccca taaaggaggt 120
aaaagcatgt acgaaaaaga aaggaaagag ctatacaatg cccatcttct gttggaaaaa 180
tacggtcttg tcgcttacac aagcggtaac gtgagtgtga gaatcggtga tcatgttctg 240
ataaagccct ccggtgttcc atacaccgag ctgaaaccag aggacttcgt cgtggtggac 300
cttgaaggaa acgtgatcga gggagagaag aaaccctccg tcgatacagc tacacatctg 360
tatctctaca aacacctcga ctgggcaaaa tccgtgattc acactcattc aacattcgcc 420
atggtgtggg caattctcga aaaatcaatc cccgttcttt gcacggcaca tgcggatgtt 480
ttcggagagg agattcctct tacagaatac gctcctgtag gatccgaggc gattggaaaa 540
gctgtcgtga aagtgattgg aaaatccggt gctgttcttc tcagaaaaca cggtgttatg 600
atcgtgggga cctctgtgga cgatgcagtg aaaaaggcga ttttccttga ggaggtagca 660
aaggcagcgt actttgcgac acttgcagga aaacccacac cattgccacc tgacgaggtg 720
gatcatctct acaatcagta ccacaccaag tacggtcaga agtaa 765
<210> 56
<211> 657
<212> DNA
<213> Thermotoga maritima
<400> 56
atgaagatct ttctggacac agcaaactta gaagagatca aaaaaggtgt tgaatggggt 60
atcgtggatg gagtaacgac gaatccaaca ctgatttcaa aggaaggagc agagttcaaa 120
cagagagtga aagagatctg cgatctggtg aaaggtcccg tttctgcgga ggttgtgtct 180
ctcgactacg aaggcatggt gagagaggcg agagaactcg ctcagatcag cgaatacgtg 240
gtgatcaaga taccaatgac acccgatggc atcaaagcgg tgaagactct ctctgcagag 300
ggtataaaga caaacgtgac actcgtgttc agcccagccc aggccattct ggccgcgaaa 360
gcgggagcaa cctacgtgag ccccttcgtt ggaaggatgg acgatctttc aaacgacgga 420
atgagaatgc ttggagaaat cgtcgagatc tacaacaact acggtttcga aaccgagatc 480
atcgccgcaa gcatcagaca tccaatgcac gtggtggaag cagcacttat gggtgtggat 540
atcgtgacga tgccatttgc cgtgctggag aaactcttca aacacccgat gacggatctt 600
ggaatagaaa ggttcatgga agactggaaa aagtatttgg agaacctgaa gaaataa 657
<210> 57
<211> 1017
<212> DNA
<213> Thermotoga maritima
<400> 57
atgatagtcg ttttgaaacc cggttccaca gaagaagata taaggaaggt ggtgaagttg 60
gccgagagtt acaacttgaa gtgtcacatt tccaaaggtc aggaaagaac ggttattggg 120
atcatcgggg acgacaggta cgtggtggcg gacaagttcg agtcgctgga ttgcgtggaa 180
agcgttgtga gggtgctcaa accttacaaa ctcgtttctc gtgagttcca tccggaggac 240
acggtgatcg acctcggaga tgtgaagata ggaaacggct acttcaccat catagcggga 300
ccgtgctcag ttgaaggcag ggaaatgctc atggaaaccg cacacttttt aagcgaactc 360
ggtgttaaag ttttgagggg aggggcctac aagcctcgaa catctcctta ctctttccaa 420
ggactcggag aaaaggggct ggaatacctg agagaggctg ccgacaagta cggtatgtac 480
gtggtgacgg aggctctcgg agaagacgat cttccaaaag tggccgagta cgctgatatc 540
attcagatag gagcgagaaa cgctcagaac ttcagattgc tctctaaagc gggaagctac 600
aacaaacccg ttcttctgaa aaggggtttc atgaacacca tcgaagagtt ccttctctcc 660
gctgaataca ttgcaaactc tggaaacacg aagatcatac tgtgtgaaag gggaatcaga 720
acgttcgaaa aggccacgag gaacacactc gatatatccg ctgttcctat aatcagaaag 780
gaatcccatc ttcccattct ggtggatccg agccactctg ggggaagaag agacctcgtt 840
attccactct cccgggccgc tatagcggtt ggagctcatg gaatcattgt ggaggttcat 900
ccggagccgg agaaggcact ttcggatgga aaacagagtc ttgacttcga gctcttcaag 960
gaactggttc aggaaatgaa gaaactcgct gatgccctgg gggtgaaggt gaattaa 1017
<210> 58
<211> 1284
<212> DNA
<213> Thermotoga maritima
<400> 58
atgtggaagc atgtaaaaca ggttgatccc gaaatatacg aagttcttgt gaacgagttg 60
aagcgtcagg agtacggcct ggagctgatc gcctctgaga acttcgcgtc actcgctgtc 120
atagaaacca tgggaagcat gctcaccaac aagtatgcgg aaggataccc gaagaagaga 180
tactacggtg gctgcgagtg ggtggatcga gcagaagaac gtgctataga gagagcgaag 240
aggttgtttg gagccaaatt tgcgaacgtt cagccgcact ccggttctca ggcgaacatg 300
gcggtttatc tggcactcgc ccagcccgga gacacgatca tgggaatgtc cctgtcacac 360
gggggacatc tcacccatgg agcaccggtg aatttctcag ggaagatctt caaggtggta 420
ccttacggag tcaatctgga aacggaaacg atagattacg atgaggtcag aagactcgct 480
ctggaacaca agccgaagat aatcgttgcg ggtggaagtg cttacgccag gatcatcgat 540
ttcaaaagat tcagagagat agccgatgag gtgggagcat atttgatggt ggatatggct 600
cactttgccg gactcgtcgc tgctggaatt catccaaatc ccttggaata cgcccacgtg 660
gtgacttcca ccacacacaa gactctcagg ggccccagag gtggtttgat actcacgaac 720
gatccggaga tcgccaaagc cgtggataaa actatcttcc ccggtatcca gggtggtcct 780
ctcatgcacg tcatagcggc gaaagctgtc tgtttcaaag aagccatgac ggaggagttc 840
aaagagtacc agaagcaggt ggtcaaaaat gctaaaaaga tggctgaaga gttccagaaa 900
cgaggttaca ggatcgtttc tggaggaact gatacacacc tgttcctggt ggatctcaca 960
ccaaaagaca taacgggtaa agcggcggaa aaggccctgg aaagctgtgg tatcacagtg 1020
aacaaaaaca ccattcccaa cgaaaagaga tctccgttcg tggcgagcgg tatcagaata 1080
ggaacacccg ctgttacaac ccgcggaatg aaggaagaag agatggaaga gatcgccgag 1140
atgatagatc tggttctttc gaacgtgatc gatgaaaacg gaacggtgaa accagaggtg 1200
agggaagagg tttcaaagaa ggtaagggag ctctgcgaaa ggtttcctct gtaccgtgac 1260
aagatcgaag gggtggaaat ataa 1284
<210> 59
<211> 711
<212> DNA
<213> Thermotoga maritima
<400> 59
atgagagaga cgataagaga gattcaaaaa gtagcttact ggcttgccat aaagggcctt 60
tccgaggcga acgcagggaa catctctgtc agactggatg aaagaccaga aggatacgag 120
gtcaagagtg tgaacgaata cgggttcgat tacgacggtc ccgagatgta ccttctgatc 180
acggcaacgg gctcgagaat gagagaagtc tacgaagacg acagcaagat ctgtcttctt 240
cacgtccttc cggggaaaca ctacgaaatt ctccacggaa acggaaaacc caccagtgag 300
tttcccacac acctcatgat ccacgcaaaa ttcaaggaga tgaatccgga aaagaaagcc 360
atcgttcaca ctcatcctct gaacctgctc actctgatga acttagagga attccaggag 420
cttcttccga agatgatgaa gattcatccg gaagttttga tctttttccc acagggaatc 480
tccgtcgtcg agttcgaaaa gccaggcagt gtggaactcg gcctgaagac ggtggagaag 540
tcagaaggga aagatgcagt tctctgggac aagcacggtg ttgtggcttt cggaaaagat 600
gtcgcagaag cgtacgacag ggtcgagatc ctggaaaaag cggcggagat ccttttgaga 660
gtgctcagcc tcggaagaaa tcccacgggt gttccggagg gatggctgta a 711
<210> 60
<211> 1149
<212> DNA
<213> Thermotoga maritima
<400> 60
atggtcaagg tcctgatcct cggtcagggc tacgttgcca gtacattcgt tgccggactt 60
gaaaagctca ggaaagggga aatagaacct tacggagtgc cccttgcaag ggaacttccc 120
atcggcttcg aagacatcaa gattgttgga agctacgacg tggacagagc gaagattgga 180
aagaaactga gcgaagtggt gaagcagtac tggaacgatg ttgactcgct gacgagtgat 240
cctgagattc gcaaaggagt acaccttgga agcgtgagga acctccccat cgaagctgaa 300
ggtctcgaag acagcatgac tctgaaggaa gcagttgata ctctcgtcaa ggaatggaca 360
gaactcgatc ccgatgtgat cgtgaacacc tgtactacag aagctttcgt gcccttcggg 420
aacaaagaag atcttctgaa agctatcgaa aacaacgaca aagagagact cactgcaact 480
caggtgtacg cttacgcagc ggcactgtac gcgaacaagc gtggaggagc ggcttttgtg 540
aacgttattc cgaccttcat agcgaacgac ccggctttcg ttgaactcgc gaaggagaac 600
aacctcgtcg ttttcggaga cgacggtgct accggtgcca caccgttcac agcggacgtt 660
ctcagccatc ttgcccagag aaacaggtac gtcaaagatg ttgcgcagtt caacatagga 720
gggaacatgg actttctggc actcacagac gatggaaaga acaagagtaa agaattcacc 780
aaatccagta tagtgaagga cattctcggt tacgatgcac cgcattacat aaaacctaca 840
gggtatcttg aaccacttgg agataaaaag ttcatagcca ttcacatcga gtacgtgagt 900
ttcaacggtg ctacagatga gctcatgata aacggaagaa taaacgacag cccggctctt 960
ggaggtctcc ttgttgacct tgtgagactc ggaaagatcg cactcgacag gaaggagttc 1020
ggaacggtct acccagtgaa cgccttctac atgaagaacc cgggaccggc ggaagaaaag 1080
aacatcccaa gaatcattgc ttacgagaag atgagaatct gggcgggatt gaaaccgaag 1140
tggctgtaa 1149
<210> 61
<211> 885
<212> DNA
<213> Thermotoga maritima
<400> 61
atgttcagag gagtaggaac tgctatcgtt acaccattca aaaatggtga gcttgatctt 60
gagtcttacg agaggcttgt caggtatcag ctcgaaaacg gcgtcaacgc gttgatcgtc 120
cttggaacga caggtgaatc accaaccgtc aacgaagacg agagagaaaa gctcgtttcc 180
agaactctcg agatcgtcga tgggaaaatc cctgtgatcg tgggagcggg aacgaattcc 240
accgaaaaaa cgctgaaact cgtcaagcag gcggaaaaac tcggagcgaa cggagttctt 300
gtggtcaccc cgtattacaa caagcccaca caggaaggac tctatcagca ctacaagtac 360
atctctgaga gaacggatct cgggatcgtt gtttacaacg tgcccggaag aaccggtgtg 420
aacgttctcc cggaaactgc tgcaaggatc gctgcggacc tcaagaacgt ggtgggaata 480
aaagaggcga acccggatat agaccagata gacaggacgg tatcactgac aaaacaggca 540
agaagcgatt tcatggtgtg gtccggcaac gatgatagaa cgttctatct cctctgcgcg 600
ggtggagacg gcgtcatctc tgttgtgtcg aacgtggcac cgaaacagat ggtagaactc 660
tgcgcagagt acttcagcgg aaacctcgaa aaatcgaggg aggttcacag aaaactcaga 720
cctctcatga aggcactgtt cgtggaaaca aatccgatac cagttaaagc cgctttgaat 780
ctcatgggat tcatcgagaa cgagctgaga ctaccgcttg tacctgccag tgaaaagacg 840
gtggaacttc tcagaaacgt tctcaaggag agtggattgc tataa 885
<210> 62
<211> 1032
<212> DNA
<213> Thermotoga maritima
<400> 62
atgatcgatc tcaggtccga caccgttaca aaaccaacag aagagatgag aaaagccatg 60
gcacaggctg aggtgggaga cgatgtgtac ggagaagatc caaccatcaa cgaactcgaa 120
aggctcgccg cagagacctt tggaaaggaa gcggctctct ttgtaccctc cggcaccatg 180
ggaaatcaag tgagcataat ggctcacacc cagaggggcg atgaagtgat actggaggca 240
gacagccaca tcttctggta cgaggtcgga gccatggcgg ttctctccgg agtcatgccc 300
catcctgtac ctggaaaaaa tggagccatg gaccccgatg atgtgaggaa ggccataaga 360
cccagaaaca tacacttccc cagaacttcg ctcattgcca tcgaaaacac acacaaccgt 420
tccggtggaa gagtggtccc gcttgaaaac ataaaagaga tttgcacgat agccaaagaa 480
cacggcataa acgttcacat agatggtgcg aggatcttca acgcctcaat cgcttcaggt 540
gttcccgtga aggagtacgc cgggtacgcc gattccgtga tgttctgtct ttcaaaaggt 600
ctctgcgcac ccgtcggttc ggtggttgta ggagacaggg acttcataga aagagcgaga 660
aaggcgagaa agatgctcgg tggagggatg agacaggcag gtgttctcgc tgccgctgga 720
ataatcgcct tgacaaagat ggtagatcga ttgaaagaag atcatgaaaa cgccagattt 780
ctcgccctga agttgaaaga aatagggtac tccgtgaatc ccgaagatgt gaaaaccaac 840
atggtgattc tgaggaccga caacctgaag gtgaacgcgc acgggttcat agaagcgctc 900
agaaacagcg gggtgctcgc gaacgccgta tccgacacgg agatcagact ggtaacccac 960
aaagacgttt caagaaacga catagaagag gctctgaaca tcttcgaaaa actcttcaga 1020
aaattctcct aa 1032
<210> 63
<211> 954
<212> DNA
<213> Escherichia coli DH10B
<400> 63
atgacggaca aattgacctc ccttcgtcag tacaccaccg tagtggccga cactggggac 60
atcgcggcaa tgaagctgta tcaaccgcag gatgccacaa ccaacccttc tctcattctt 120
aacgcagcgc agattccgga ataccgtaag ttgattgatg atgctgtcgc ctgggcgaaa 180
cagcagagca acgatcgcgc gcagcagatc gtggacgcga ccgacaaact ggcagtaaat 240
attggtctgg aaatcctgaa actggttccg ggccgtatct caactgaagt tgatgcgcgt 300
ctttcctatg acaccgaagc gtcaattgcg aaagcaaaac gcctgatcaa actctacaac 360
gatgctggta ttagcaacga tcgtattctg atcaaactgg cttctacctg gcagggtatc 420
cgtgctgcag aacagctgga aaaagaaggc atcaactgta acctgaccct gctgttctcc 480
ttcgctcagg ctcgtgcttg tgcggaagcg ggcgtgttcc tgatctcgcc gtttgttggc 540
cgtattcttg actggtacaa agcgaatacc gataagaaag agtacgctcc ggcagaagat 600
ccgggcgtgg tttctgtatc tgaaatctac cagtactaca aagagcacgg ttatgaaacc 660
gtggttatgg gcgcaagctt ccgtaacatc ggcgaaattc tggaactggc aggctgcgac 720
cgtctgacca tcgcaccggc actgctgaaa gagctggcgg agagcgaagg ggctatcgaa 780
cgtaaactgt cttacaccgg cgaagtgaaa gcgcgtccgg cgcgtatcac tgagtccgag 840
ttcctgtggc agcacaacca ggatccaatg gcagtagata aactggcgga aggtatccgt 900
aagtttgcta ttgaccagga aaaactggaa aaaatgatcg gcgatctgct gtaa 954
<210> 64
<211> 663
<212> DNA
<213> Escherichia coli DH10B
<400> 64
atggaactgt atctggatac ttcagacgtt gttgcggtga aggcgctgtc acgtattttt 60
ccgctggcgg gtgtgaccac taacccaagc attatcgccg cgggtaaaaa accgctggat 120
gttgtgcttc cgcaacttca tgaagcgatg ggcggtcagg ggcgtctgtt tgcccaggta 180
atggctacca ctgccgaagg gatggttaat gacgcgctta agctgcgttc tattattgcg 240
gatatcgtgg tgaaagttcc ggtgaccgcc gaggggctgg cagctattaa gatgttaaaa 300
gcggaaggga ttccgacgct gggaaccgcg gtatatggcg cagcacaagg gctgctgtcg 360
gcgctggcag gtgcggaata tgttgcgcct tacgttaatc gtattgatgc tcagggcggt 420
agcggcattc agactgtgac cgacttacac cagttattga aaatgcatgc gccgcaggcg 480
aaagtgctgg cagcgagttt caaaaccccg cgtcaggcgc tggactgctt actggcagga 540
tgtgaatcaa ttactctgcc actggatgtg gcacaacaga tgattagcta tccggcggtt 600
gatgccgctg tggcgaagtt tgagcaggac tggcagggag cgtttggcag aacgtcgatt 660
taa 663
<210> 65
<211> 1002
<212> DNA
<213> Escherichia coli DH10B
<400> 65
atgattgatt tacgcagtga taccgttacc cgaccaagcc gcgccatgct cgaagcgatg 60
atggccgccc cggttgggga cgacgtttac ggagacgacc ctaccgttaa tgctctgcag 120
gactacgcag cagagctttc cggtaaagaa gccgccattt ttctgcctac cggcactcag 180
gccaacctgg tcgctctgct cagtcactgc gaacgcggcg aagagtatat tgtcggtcag 240
gccgcgcata actatctgtt tgaagccggt ggcgcggcgg tgctgggcag tattcaaccg 300
caacccatag acgcggctgc cgacggcacg ctaccgctgg ataaagtggc gatgaaaatc 360
aaacccgacg atatccattt cgcccgcacc aaattactca gtctggaaaa cacccacaac 420
ggcaaagtgt tgccgcggga atacctgaaa gaagcatggg aatttacccg cgagcgcaat 480
ctggcgctgc atgttgacgg tgcgcgcatc tttaatgccg tggtggctta cggctgcgaa 540
ctgaaagaga tcacgcaata ttgtgattcg ttcaccattt gcctgtcgaa aggtcttggg 600
acgccagtcg gttcattact cgtcggtaat cgtgattaca ttaaacgtgc cattcgctgg 660
cggaaaatga caggtggcgg gatgcgccag tccggcattc tggctgccgc cgggatatat 720
gccctgaaaa ataacgttgc gcgcttgcag gaagaccacg acaacgctgc ctggatggcg 780
gagcagctgc gtgaagcagg cgcggatgtg atgcgtcagg acaccaatat gctgtttgtt 840
cgcgtcgggg aagaaaatgc tgccgcgtta ggcgaataca tgaaagcgag aaacgtgctg 900
attaacgcct cgccgattgt ccgcctggtg acgcatcttg acgtctcgcg cgaacaactg 960
gcggaagtcg ccgcccactg gcgtgcattc ctggcgcgtt aa 1002
<210> 66
<211> 876
<212> DNA
<213> Escherichia coli DH10B
<400> 66
atggcagatt tagacgatat taaagatggt aaagattttc gtaccgatca accgcaaaaa 60
aatatccctt ttaccctgaa aggttgcggt gcgctggatt ggggaatgca gtcacgctta 120
tcgcggatat ttaatccgaa aacgggtaaa accgtgatgc tggcttttga ccatggttat 180
tttcagggac cgactaccgg acttgaacgc attgatataa atatcgcccc gctgtttgaa 240
catgccgatg tattaatgtg tacgcgcggc attttgcgca gcgtagttcc ccctgcgacc 300
aataggccgg tggtactgcg ggcgtcaggt gcgaactcta ttctggcgga attaagtaat 360
gaagccgtgg cgttatcgat ggatgacgcc gtgcgcctga acagttgcgc ggtggcggcg 420
caggtttata tcggcagcga atatgaacat cagtcgatca aaaatattat tcagctggtt 480
gatgccggaa tgaaagtggg aatgccgacc atggccgtga ctggcgtggg caaagatatg 540
gtgcgcgatc agcgttattt ctcgctcgcg actcgaatcg ccgctgaaat gggggcgcaa 600
attatcaaaa cctattatgt cgaaaaaggt tttgaacgga ttgttgccgg atgtccggta 660
cccattgtta ttgctggcgg taaaaaatta ccggagcgcg aggcgctgga aatgtgctgg 720
caggctatcg atcagggcgc ttctggtgtg gatatggggc gtaatatttt ccagtctgac 780
catccggtgg cgatgatgaa agccgtacag gcggtggttc accataacga aacggctgat 840
cgggcatatg aactctatct gagtgaaaaa cagtaa 876
<210> 67
<211> 642
<212> DNA
<213> Escherichia coli DH10B
<400> 67
atgaaaaact ggaaaacaag tgcagaatca atcctgacca ccggcccggt tgtaccggtt 60
atcgtggtaa aaaaactgga acacgcggtg ccgatggcaa aagcgttggt tgctggtggg 120
gtgcgcgttc tggaagtgac tctgcgtacc gagtgtgcag ttgacgctat ccgtgctatc 180
gccaaagaag tgcctgaagc gattgtgggt gccggtacgg tgctgaatcc acagcagctg 240
gcagaagtca ctgaagcggg tgcacagttc gcaattagcc cgggtctgac cgagccgctg 300
ctgaaagctg ctaccgaagg gactattcct ctgattccgg ggatcagcac tgtttccgaa 360
ctgatgctgg gtatggacta cggtttgaaa gagttcaaat tcttcccggc tgaagctaac 420
ggcggcgtga aagccctgca ggcgatcgcg ggtccgttct cccaggtccg tttctgcccg 480
acgggtggta tttctccggc taactaccgt gactacctgg cgctgaaaag cgtgctgtgc 540
atcggtggtt cctggctggt tccggcagat gcgctggaag cgggcgatta cgaccgcatt 600
actaagctgg cgcgtgaagc tgtagaaggc gctaagctgt aa 642
<210> 68
<211> 855
<212> DNA
<213> Escherichia coli DH10B
<400> 68
atgtacgtgg tatcgacaaa gcagatgctg aacaacgcac agcgcggcgg ttatgcggtt 60
ccggcattca atattcacaa tctcgaaacg atgcaagtgg tggtagaaac cgctgccaac 120
ctgcatgcgc cggtcatcat cgccggaacg cctggcacat ttactcatgc tggtacagaa 180
aatctgttgg cgctggtcag cgcgatggcg aagcaatatc accatccact ggcaattcat 240
ctcgaccatc acacgaaatt tgacgatatc gctcagaagg ttcgttctgg cgtgcgctca 300
gtcatgattg acgcctcgca tttgcctttt gcgcaaaata tttcacgggt caaagaggtg 360
gtggattttt gccatcgctt tgatgtcagc gtcgaggcgg agctggggca acttggcggc 420
caggaagatg atgtgcaagt caatgaagcc gatgcgttgt acaccaaccc cgctcaggcg 480
cgtgaatttg ccgaggcaac cggaattgat tccctggcgg tcgccatcgg cacggctcat 540
gggatgtatg ccagcgcacc ggcgcttgat ttttctagac tggagaacat tcgccagtgg 600
gtgaacttac cgctggtgct gcatggcgcg tcagggttat cgactaagga tattcagcaa 660
accatcaaac tggggatatg caaaatcaac gttgcaacgg agctgaaaaa tgccttctcg 720
caggcgttaa aaaattacct gaccgagcac cctgaagcga ccgatccccg ggattatttg 780
cagtcggcta aatccgcaat gcgcgatgtg gtgagcaaag tgattgccga ttgtggctgc 840
gagggcaggg cataa 855
<210> 69
<211> 1053
<212> DNA
<213> Escherichia coli DH10B
<400> 69
atgacagata ttgcgcagtt gcttggcaaa gacgccgaca accttttaca gcaccgttgt 60
atgacaattc cttctgacca gctttatctc cccggacatg actacgtaga ccgcgtaatg 120
attgacaata atcgcccgcc agcggtgtta cgtaatatgc agacgttgta caacaccggg 180
cgtctggctg gcacaggata tctttctatt ctgccggttg accagggcgt tgagcactct 240
gccggagctt catttgctgc taacccgctc tactttgacc cgaaaaacat tgttgaactg 300
gcgatcgaag cgggctgtaa ctgtgtggcg tcaacttacg gcgtgctggc gtcggtatcg 360
cggcgttatg cgcatcgcat tccattcctc gtcaaactta atcacaacga gacgctaagt 420
tacccgaata cctacgatca aacgctgtat gccagcgtgg agcaggcgtt caacatgggc 480
gcggttgcgg ttggtgcgac tatctatttt ggctcggaag agtcacgtcg ccagattgaa 540
gaaatttctg cggcttttga acgtgcgcac gagctgggta tggtgacagt gctgtgggcc 600
tatttgcgta actccgcctt taagaaagat ggcgttgatt accatgtttc cgccgacctg 660
accggtcagg caaaccatct ggcggcaacc atcggtgcag atatcgtcaa acaaaaaatg 720
gcggaaaata acggcggcta taaagcaatt aattacggtt acaccgacga tcgtgtttac 780
agcaaattga ccagcgaaaa cccgattgat ctggtgcgtt atcagttagc taactgctat 840
atgggtcggg ctgggttgat aaactccggc ggtgctgcgg gcggtgaaac tgacctcagc 900
gatgcagtgc gtactgcggt tatcaacaaa cgcgcaggcg gaatggggct gattcttgga 960
cgtaaagcgt tcaagaaatc gatggctgac ggcgtgaaac tgattaacgc cgtgcaggac 1020
gtttatctcg atagcaaaat tactatcgcc tga 1053
<210> 70
<211> 804
<212> DNA
<213> Escherichia coli DH10B
<400> 70
atgaacgcat tattaagcaa tccctttaaa gaacgtttac gcaagggcga agtgcaaatt 60
ggtctgtggt taagctcaac gactgcctat atggcagaaa ttgccgccac ttctggttat 120
gactggttgc tgattgacgg ggagcacgcg ccaaacacca ttcaggatct ttatcatcag 180
ctacaggcgg tagcgcccta tgccagccaa cccgtgatcc gtccggtgga aggcagtaaa 240
ccgctgatta aacaagtcct ggatattggc gcgcaaactc tactgatccc gatggtcgat 300
actgccgaac aggcacgtca ggtggtgtct gccacgcgct atcctcccta cggtgagcgt 360
ggtgtcgggg ccagtgtggc acgggctgcg cgctggggac gcattgagaa ttacatggcg 420
caagttaacg attcgctttg tctgttggtg caggtggaaa gtaaaacggc actggataac 480
ctggacgaaa tcctcgacgt cgaagggatt gatggcgtgt ttattggacc tgcggatctt 540
tctgcgtcgt tgggctaccc ggataacgcc gggcacccgg aagtgcagcg aattattgaa 600
accagtattc ggcggatccg tgctgcgggt aaagcggctg gttttctggc tgtggctcct 660
gatatggcgc agcaatgcct ggcgtgggga gcgaactttg tcgctgttgg cgttgacacg 720
atgctctaca gcgatgccct ggatcaacga ctggcgatgt ttaaatcagg caaaaatggg 780
ccacgcataa aaggtagtta ttga 804
<210> 71
<211> 363
<212> DNA
<213> Escherichia coli DH10B
<400> 71
atggcacaac ctgccgctat tattcgtata aagaaccttc gtttgcgtac gtttatcgga 60
attaaggaag aagaaattaa caaccgtcag gatattgtta tcaatgtgac gatccactac 120
cccgccgata aagcgcgcac tagcgaagat atcaacgatg cgctgaatta tcgcaccgta 180
acgaaaaaca ttattcagca tgtagagaat aaccgtttct ctttgctgga aaaattaact 240
caggatgtgc tcgatatcgc acgtgaacat cactgggtga cgtatgctga agtggagatc 300
gataaactgc acgcgctgcg ctacgccgat tcggtatcca tgaccttaag ctggcagcgt 360
taa 363
<210> 72
<211> 951
<212> DNA
<213> Escherichia coli DH10B
<400> 72
atgaacgagt tagacggcat caaacagttc accactgtcg tggcagacag cggcgatatt 60
gagtccattc gccattatca tccccaggat gccaccacca atccttcgct gttactcaaa 120
gctgccggat tatcacaata tgagcattta atagacgatg ctatcgcctg gggtaaaaaa 180
aatggcaaga cccaggaaca acaggtggtc gcagcgtgtg acaaactggc ggtcaatttc 240
ggtgctgaaa tcctcaaaat cgtacccggt cgcgtgtcaa cagaagttga tgcacgcctc 300
tcttttgata aagaaaagag tattgagaag gcgcgccatc tggtggactt gtatcagcaa 360
caaggcgttg agaaatcacg cattctgatc aagctggctt cgacctggga aggaattcgc 420
gcggcagaag agctggaaaa agaaggtatt aactgcaacc tgacgctgct gttttctttt 480
gcacaggcac gggcctgtgc ggaagcaggc gtttttctga tttcgccgtt tgtcgggcgt 540
atttatgact ggtatcaggc acgcaagccg atggacccgt atgtggtgga agaagatccg 600
ggcgttaaat cggtgcgcaa tatctacgac tactataagc aacaccacta tgaaaccatt 660
gtgatgggcg cgagcttccg tcgcaccgaa caaatcctcg ccttaaccgg ctgcgatcga 720
ctgactatcg caccgaattt actgaaggag ctgcaggaaa aagtttcgcc agtggtacgt 780
aaattaatcc caccttctca gacgttccca cgcccagctc ccatgagcga agcggagttc 840
cgttgggagc acaatcagga tgcgatggcg gtagaaaaac tgtctgaagg cattcgtctg 900
ttcgccgttg atcaacgcaa actggaagat cttcttgccg ccaaactata a 951
<210> 73
<211> 648
<212> DNA
<213> Escherichia coli DH10B
<400> 73
atggaacgaa ataaacttgc tcgtcagatt attgacactt gcctggaaat gacccgcctg 60
ggactgaacc aggggacagc ggggaacgtc agtgtacgtt atcaggatgg gatgctgatt 120
acgcctacag gcattccata tgaaaaactg acggagtcgc atattgtctt tattgatggc 180
aacggtaaac atgaggaagg aaagctcccc tcaagcgaat ggcgtttcca tatggcagcc 240
tatcaaagca gaccggatgc caacgcggtt gttcacaatc atgccgttca ttgcacggca 300
gtttccattc ttaaccgatc gatccccgct attcactaca tgattgcggc ggctggcggt 360
aattctattc cttgcgcgcc ttatgcgacc tttggaacac gcgaactttc tgaacatgtt 420
gcgctggctc tcaaaaatcg taaggcaact ttgttacaac atcatgggct tatcgcttgt 480
gaggtgaatc tggaaaaagc gttatggctg gcgcatgaag ttgaagtgct ggcgcaactt 540
tacctgacga ccctggcgat tacggacccg gtgccagtgc tgagcgatga agagattgcc 600
gtagtgctgg agaaattcaa aacctatggg ttacgaattg aagagtaa 648
<210> 74
<211> 1080
<212> DNA
<213> Escherichia coli DH10B
<400> 74
atgtctaaga tttttgattt cgtaaaacct ggcgtaatca ctggtgatga cgtacagaaa 60
gttttccagg tagcaaaaga aaacaacttc gcactgccag cagtaaactg cgtcggtact 120
gactccatca acgccgtact ggaaaccgct gctaaagtta aagcgccggt tatcgttcag 180
ttctccaacg gtggtgcttc ctttatcgct ggtaaaggcg tgaaatctga cgttccgcag 240
ggtgctgcta tcctgggcgc gatctctggt gcgcatcacg ttcaccagat ggctgaacat 300
tatggtgttc cggttatcct gcacactgac cactgcgcga agaaactgct gccgtggatc 360
gacggtctgt tggacgcggg tgaaaaacac ttcgcagcta ccggtaagcc gctgttctct 420
tctcacatga tcgacctgtc tgaagaatct ctgcaagaga acatcgaaat ctgctctaaa 480
tacctggagc gcatgtccaa aatcggcatg actctggaaa tcgaactggg ttgcaccggt 540
ggtgaagaag acggcgtgga caacagccac atggacgctt ctgcactgta cacccagccg 600
gaagacgttg attacgcata caccgaactg agcaaaatca gcccgcgttt caccatcgca 660
gcgtccttcg gtaacgtaca cggtgtttac aagccgggta acgtggttct gactccgacc 720
atcctgcgtg attctcagga atatgtttcc aagaaacaca acctgccgca caacagcctg 780
aacttcgtat tccacggtgg ttccggttct actgctcagg aaatcaaaga ctccgtaagc 840
tacggcgtag taaaaatgaa catcgatacc gatacccaat gggcaacctg ggaaggcgtt 900
ctgaactact acaaagcgaa cgaagcttat ctgcagggtc agctgggtaa cccgaaaggc 960
gaagatcagc cgaacaagaa atactacgat ccgcgcgtat ggctgcgtgc cggtcagact 1020
tcgatgatcg ctcgtctgga gaaagcattc caggaactga acgcgatcga cgttctgtaa 1080
1080
<210> 75
<211> 369
<212> DNA
<213> Escherichia coli DH10B
<400> 75
atggatattg tatttataga gcaactttcg gtaatcacca ctattggtgt ttacgactgg 60
gaacagacca tcgaacagaa gttagtgttc gatatcgaaa tggcgtggga taaccgtaaa 120
gcggcgaaaa gtgatgatgt ggcggattgc ctcagttacg ctgacattgc agaaacggtg 180
gtcagccacg tcgagggggc gcgttttgcg ctggtggaac gcgtggctga agaggtggcg 240
gagctgctgt tagcacgctt caactcgccg tgggtgcgta tcaaactcag caagccaggc 300
gcagtggcgc gggcggcgaa tgttggcgta atcattgagc gtggcaataa tctgaaagaa 360
aataattaa 369
<210> 76
<211> 771
<212> DNA
<213> Escherichia coli DH10B
<400> 76
atgaataacg atgttttccc gaataaattc aaagccgcac tggctgcgaa acaggtacaa 60
attggttgct ggtcagcact ctctaacccg attagcactg aagttcttgg tttggctggg 120
tttgactggc tggtgctgga tggcgaacat gcgccaaacg atatctccac gtttattccg 180
cagttaatgg ccttgaaagg cagcgccagc gcgccagtag tgcgagtgcc gaccaacgag 240
ccggtaatta ttaagcgtct tctggatatc ggtttctata acttcctgat tccttttgta 300
gaaacaaaag aggaagcaga gctggcggtg gcatcaaccc gttacccacc ggaaggcatt 360
cgcggcgtct ccgtttctca ccgcgccaat atgtttggca ccgtggcgga ttatttcgct 420
cagtcgaaca agaacatcac tattctggtc cagatagaaa gtcagcaggg cgtagataac 480
gtcgatgcca ttgccgctac cgaaggcgta gacggcatct tcgtcggccc cagcgatctg 540
gccgcggcat taggccatct cggcaatgca tcacacccgg atgtacaaaa agcaattcag 600
cacattttta accgtgccag cgcgcacggc aaacccagcg gtatcctcgc gccggtcgaa 660
gccgatgcgc gtcgttatct ggaatggggc gcgacgtttg tggctgtcgg cagcgatctc 720
ggcgtcttcc gctctgccac tcagaaactg gctgatacct ttaaaaaata a 771
<210> 77
<211> 1281
<212> DNA
<213> Escherichia coli DH10B
<400> 77
atgaaacatc tgacagaaat ggtgagacag cacaaagcgg gcaaaacaaa tggaatttat 60
gccgtttgtt ccgcacatcc gctggtgctg gaagctgcaa tccgctacgc cagtgcaaac 120
caaacgccgt tactgattga agcaacctcc aatcaggtag accagttcgg cggttatacc 180
ggaatgacgc ccgccgattt tcgcggcttt gtttgtcagc tcgccgactc gttgaatttc 240
ccgcaggatg cgttgattct gggtggtgac catctggggc caaaccgctg gcaaaacctg 300
ccggccgctc aggcaatggc caatgccgat gatttgatta aaagctacgt tgcggcagga 360
ttcaaaaaaa tccaccttga ttgcagcatg tcctgtcagg acgatccgat tcccttaact 420
gatgacatcg tggctgaacg cgccgcccgt ctggcgaaag tggcggaaga aacctgtctt 480
gaacactttg gcgaagccga tctggagtat gtcattggta ccgaagtgcc ggtacctggc 540
ggcgcgcatg aaaccttaag cgagctggcg gtcaccacgc cggatgccgc ccgcgccacg 600
ctggaagccc atcgtcacgc ctttgaaaag caaggtttga atgccatctg gccacgcatc 660
attgccctgg tggttcaacc cggcgtcgaa ttcgatcaca ccaacgttat tgattatcag 720
cccgccaaag cgagcgcctt aagccagatg gtcgaaaact acgaaacgct gattttcgaa 780
gcgcactcta ccgattatca aacgccgcaa tcgctgcgcc agctggtgat tgaccacttt 840
gccattctga aagttggccc agcgctgacc ttcgccctgc gtgaagctct gttctctctg 900
gcggcgattg aagaagaact ggtgccagcg aaagcctgtt ctggtctgcg tcaggtgctg 960
gaagacgtga tgctcgaccg cccggaatac tggcaaagcc actaccacgg tgacggcaac 1020
gcgcgtcgtc tggcgcgtgg ttatagctac tcggatcgcg tgcgctatta ctggccggac 1080
agccagattg atgacgcttt cgctcatctg gtacgtaatc tggcggattc accaattccg 1140
ctgccgctga tcagccagta tctgccgctg cagtacgtga aagttcgctc cggcgagctg 1200
cagccaacgc cacgggaact cattatcaac catattcagg acatcctggc gcagtaccac 1260
acagcctgtg aaggccaata a 1281
<210> 78
<211> 861
<212> DNA
<213> Escherichia coli DH10B
<400> 78
atgagcatta tctccactaa atatctgtta caggacgccc aggccaatgg ctacgcggtg 60
cctgctttta acattcataa cgccgagacg atccaagcga tcctcgaagt gtgcagtgaa 120
atgcgatcgc cggtgatcct cgccggaacg ccggggacct ttaaacacat cgcgctggaa 180
gagatctacg ccctgtgtag cgcctattcc acaacctaca acatgccact ggcgctgcat 240
ctcgaccacc acgaatcgct ggatgatatt cgccgtaaag tccacgcagg tgtgcgcagt 300
gcgatgatcg acggcagcca cttcccgttt gccgagaacg tgaagctggt gaaatcggtt 360
gttgacttct gccactcaca agattgcagc gtggaagcag aactgggccg cctgggcggt 420
gttgaagatg acatgagcgt tgacgccgaa agtgcattcc tgaccgatcc acaagaagct 480
aaacgctttg tcgaactgac tggcgtcgac agcctggcgg tagcgattgg tacggcgcac 540
ggcttataca gcaaaacgcc gaagattgat ttccagcggc tggcggaaat tcgtgaagtg 600
gtggatgttc ctctggtgct gcatggtgcc agcgatgttc cggatgaatt tgtccgtcgc 660
actattgaac ttggcgtcac aaaagtgaac gttgccacag aattaaaaat agccttcgct 720
ggcgcggtta aagcctggtt tgcggaaaat ccgcagggta atgatcctcg ttattatatg 780
cgcgtcggaa tggatgcgat gaaagaagtt gtcagaaata aaattaatgt ctgtggttca 840
gcgaatcgaa tttcagcata a 861
<210> 79
<211> 879
<212> DNA
<213> Escherichia coli DH10B
<400> 79
atgaataagt acaccatcaa cgacattacg cgcgcatcgg gcggttttgc catgctggcg 60
gtcgatcagc gcgaagccat gcgcatgatg tttgccgcgg ctggggcacc cgctccggta 120
gccgatagcg ttttaactga tttcaaagtt aacgctgcaa aggccctctc gccttatgcc 180
tcggcgattc tggtagatca acaattctgc taccgccagg tggttgagca aaacgcgatt 240
gccaaaagtt gcgccatgat tgtcgccgcc gatgagttca ttcctggcaa cggtattccg 300
gtcgatagcg tggttattga ccgcaaaatc aatccgctac agatcaaaca agacggtggc 360
aaagccttaa aactgctggt gctgtggcgt agtgatgaag atgcgcagca acgtctggat 420
atggtgaaag agttcaacga actgtgccac tcacacggtc tggtaagcat cattgagcca 480
gtcgtccgcc caccgcgtcg tggcgataaa ttcgatcgcg aacaagcgat catcgatgcc 540
gccaaagagc tgggcgacag tggcgctgac ctctacaaag ttgaaatgcc gctttatggc 600
aaaggtccgc aacaagagct tctctgtgct tcacaacgtc tgaatgacca tatcaatatg 660
ccatgggtga tcctctcttc cggtgtcgac gaaaaactgt tcccgcgtgc cgtacgcgtg 720
gcaatgacgg cgggcgcatc gggattcctg gcaggccgtg cagtctgggc atcggtcgtc 780
ggtttaccag acaacgagct gatgctgcgt gacgtttgcg caccgaaatt acaacaactt 840
ggcgatatcg tcgacgaaat gatggctaaa cgccgctaa 879
<210> 80
<211> 825
<212> DNA
<213> Escherichia coli DH10B
<400> 80
atgcaaaaca ttactcagtc ctggtttgtc cagggaatga tcaaagccac caccgacgcc 60
tggctgaaag gctgggatga gcgcaacggc ggcaacctga cgctacgcct ggatgacgcc 120
gatatcgcac catatcacga caatttccac caacaaccgc gctatatccc gctcagccag 180
cccatgcctt tactggcaaa tacaccgttt attgtcaccg gctcgggcaa attcttccgt 240
aacgtccagc ttgatcctgc ggctaactta ggcatcgtaa aagtcgacag cgacggcgcg 300
ggctaccaca ttctttgggg gttaaccaac gaagccgtcc ccacttccga acttccggct 360
cacttccttt cccactgcga gcgcattaaa gccaccaacg gcaaagatcg ggtgatcatg 420
cactgccacg ccaccaacct gatcgccctc acctatgtac ttgaaaacga caccgcggtc 480
ttcactcgcc aactgtggga aggcagcacc gagtgtctgg tggtattccc ggatggcgtt 540
ggcattttgc cgtggatggt gcccggcacg gacgaaatcg gccaggcgac cgcacaagag 600
atgcaaaaac attcgctggt gttgtggccc ttccacggcg tcttcggcag cggaccgacg 660
ctggatgaaa ccttcggttt aatcgacacc gcagaaaaat cagcacaagt attagtgaag 720
gtttattcga tgggcggcat gaaacagacc atcagccgtg aagagttgat agcgctcggc 780
aagcgtttcg gcgttacgcc actcgccagt gcgctggcgc tgtaa 825
<210> 81
<211> 663
<212> DNA
<213> Escherichia coli DH10B
<400> 81
atggaactgt atctggacac cgctaacgtc gcagaagtcg aacgtctggc acgcatattc 60
cccattgccg gggtgacaac taacccgagc attatcgctg ccagcaagga gtccatatgg 120
gaagtgctgc cgcgtctgca aaaagcgatt ggtgatgagg gcattctgtt tgctcagacc 180
atgagccgcg acgcgcaggg gatggtggaa gaagcgaagc gcctgcgcga cgctattccg 240
ggtattgtgg tgaaaatccc ggtgacttcc gaaggtctgg cagcaattaa aatactgaaa 300
aaagagggta ttactacact tggcactgct gtatatagcg ccgcacaagg gttattagcc 360
gcactggcag gggcaaaata cgttgctccg tatgttaacc gcgtagatgc ccagggcgga 420
gacggcattc gtacggttca ggagctgcaa acgctgttag aaatgcacgc gccagaaagc 480
atggtgctgg cagccagctt taaaacgccg cgtcaggcgc tggactgttt actggcagga 540
tgtgaatcca tcaccctgcc cttagatgta gcgcaacaaa tgctcaacac ccctgcggta 600
gagtcagcta tagagaagtt cgaacacgac tggaatgccg catttggcac tactcatctc 660
taa 663
<210> 82
<211> 780
<212> DNA
<213> Escherichia coli DH10B
<400> 82
atgactgatc tgaaagcaag cagcctgcgt gcactgaaat tgatggacct gaccaccctg 60
aatgacgacg acaccgacga gaaagtgatc gccctgtgtc atcaggccaa aactccggtc 120
ggcaataccg ccgctatctg tatctatcct cgctttatcc cgattgctcg caaaactctg 180
aaagagcagg gcaccccgga aatccgtatc gctacggtaa ccaacttccc acacggtaac 240
gacgacatcg acatcgcgct ggcagaaacc cgtgcggcaa tcgcctacgg tgctgatgaa 300
gttgacgttg tgttcccgta ccgcgcgctg atggcgggta acgagcaggt tggttttgac 360
ctggtgaaag cctgtaaaga ggcttgcgcg gcagcgaatg tactgctgaa agtgatcatc 420
gaaaccggcg aactgaaaga cgaagcgctg atccgtaaag cgtctgaaat ctccatcaaa 480
gcgggtgcgg acttcatcaa aacctctacc ggtaaagtgg ctgtgaacgc gacgccggaa 540
agcgcgcgca tcatgatgga agtgatccgt gatatgggcg tagaaaaaac cgttggtttc 600
aaaccggcgg gcggcgtgcg tactgcggaa gatgcgcaga aatatctcgc cattgcagat 660
gaactgttcg gtgctgactg ggcagatgcg cgtcactacc gctttggcgc ttccagcctg 720
ctggcaagcc tgctgaaagc gctgggtcac ggcgacggta agagcgccag cagctactaa 780
780
<210> 83
<211> 963
<212> DNA
<213> Pseudomonas putida
<400> 83
gtgaaggcat tgcaaggcgt tgacggacat gtggagtggg tcgaggccga acgcccgacc 60
tgtgacgcgg gccaagtgcg cattcgcgtg gccgctgcgg ggctgaaccg cgccgacctg 120
ctgcagatga aaggtttgta cccgccacca ccaggtgcca gcccatacat ggggctggag 180
tgttccgggg tggttgaaga ggtgggggct ggtgccgcct ggcgcgtggg tgaccgcgtt 240
tgcgccctgc tggccagcgg cgccatggcc gaggaagtgg tggtcgatgc ccgtcacgta 300
ttgccggtac ccgaaggcct tggcctgcat gaggcggcag cgttgccgga ggtgtatgcc 360
accgcctggc tgaacatctt ccagctcggt gcagtgaagg ctggcgagaa ggtgctggtg 420
cacgccggcg ccagtggcgt tggctcggcc gccatccagc tgtgcaaggc gttcggcagc 480
ccggtatggg tcagcgtcgg ttcgcaggac cgcttggcct actgccaggc gctgggcgct 540
gcgggtggtg tggtacgtaa cgagaacctg gacgcgctgg aaggttttgg cccgttcgat 600
gtgattctcg acccggtggg cgccagctac ggtgagctga acctcaagct gctggcccgt 660
gacgggcgct gggtgatcat cggcctgatg ggcggacgca agttcgagct ggacctggcc 720
caagtgctgg gcaagcgtct ggaaattacc ggttccaccc tgcgcaaccg tgatgacggc 780
ttcaaggccg agctgttgcg cgaactgcag cagcaagtat ggccgctgtt cgccgagggg 840
cggttgtcgc cgcagctggt cgacacctat ccggtggagt ttgcccaggc ggcgtatgcc 900
gagctggaga ccaaccaggt gtcgggcaag ctggtgatgg tgatcgaccc tagcctggtg 960
taa 963
<210> 84
<211> 1002
<212> DNA
<213> Pseudomonas putida
<400> 84
atgacccaga ccaaccgccg cttcctgctt gccaaacgcc cggtcggcgc cgtgcgccgt 60
gacgacttca gcttcgagac cgtacccgcc gaacaacccg gcgaaggcca ggtactggtg 120
cgcaacctgt acctgtcgct ggacccggcc atgcgcggct ggatgaacga aggcaagtcc 180
tacatcccgc ccgtggccct gggccaggta atgcgtgcgc tgggtgtagg tgaagtggtt 240
gcctccaatc accccggcta ccagcccggc gaccatgtga gcggcgccct cggtgtgcag 300
gactacttca ccggcgagcc ccagggcctg cacaagatcg accccaagct ggcccccctg 360
ccccgttacc tgtcagcctt gggcatgacc ggcatgaccg cctacttcgc cctgctggag 420
gttggccaac ccaaagctgg cgacaccgtg gtcatttccg gcgcggccgg tgcggtgggc 480
agcattgtcg ggcagattgc caagatcaaa ggctgccgcg tggtcggcat tgccggcggt 540
gccgagaagt gccagtacct gaaggacgag ctgggctttg acggcgtgat cgactacaag 600
gccgaagacg tgctggccgg cctgaagcgc gaatgcccca aaggcgtgga cgtgtacttc 660
gacaacgtgg gcggcgatat cctcgatgcc gtgctgacgc gcatcaactt caaggcacgc 720
attgtgattt gcggcgcgat cagccagtac aacaacaaag aagcggtgaa aggcccggcc 780
aactacctgt cgctgctggt gaaccgcgcg cgcatggaag gttttgtggt gatggattac 840
accaaggact acggcaaggc cgcgcaggaa attgccggct ggttggccaa tggtcaggtg 900
aagagcaaag aggatgtggt ggaagggctg gaaaccttcc cggagacctt gttgaagctg 960
ttcagcgggg agaattttgg caagttggtg ttgaaggttt aa 1002
<210> 85
<211> 1164
<212> DNA
<213> Pseudomonas putida
<400> 85
atgcagcctt tcagctttgc caccactgcg cagatcctct gcgaacccgg cgcggtgcag 60
cgccttgcag gtctgtgccg tgagcgcggt gccaagcgtg ttttgattat cagtgacccg 120
ggtatcgccc gccttggcat gctcgatgac ctgctgccgg ggttcacggc agccaaggtc 180
ggtgtggcga tcttcagtga ggttacggcc gaccccagcg aggcatgcgt gctggcggcc 240
gcccagcgcg cccggcatat cggcgccgac ctggtggtgg ggttcggcgg cggcagctcg 300
atggatgtgg ccaagctggt tgcgctgctg gcccaccgcg attgttcgca gcccatcgcc 360
gagctgtacg gcatcgacag ggccaagggc cgccggctgc cgttgatcca ggtgcccacc 420
acggcaggta ccggttcgga ggtgacgccg atcgccatcg tcaccaccgg cgccaccacc 480
aagatgggca ttgtttcgcc gctgctgttg ccagacctgg cagtgctcga cgccgtctgc 540
accctcggcc tgccatcggc ggtgactgct gctaccggta tcgatgccat ggtgcatgcc 600
atcgaagcct ataccagccg cctcaaacgt aacccgctgt ccagcctgct ggcccgtgag 660
gcgctgcggc tgctggcgga taaccttgac caggctgtgc acaacggcgg caacctgcag 720
gcccgccagg ccatgctgtt gggggcttgc ctggccggcc aggcctttgc caatgcaccg 780
gtggcggcgg tgcatgccct ggcctatccg ctgggtgggc actttcatgt tccccatggc 840
ctggccaacg cgctggtgtt gccgcatgtg ctgcgcttca acctgccggt ggcggcagtg 900
gactacgccg aattggccgt gccgctgttg ggggcccgtt tgcagcccgg tgatcagcgc 960
cagcaggcag aacaattcgt ggccgagctg gccgcgctga gcagccgctg cgggttacct 1020
gaccgcctgc gcgacgccga tgtaccgcgt catcggcttg gccagctggc cgaagacgcg 1080
atgcaacagc agcgcctttt ggtcaataac ccgcgtgaag tcacccaggc cgatgcgttg 1140
gccatctatg aggcagccta ctga 1164
<210> 86
<211> 1035
<212> DNA
<213> Pseudomonas putida
<400> 86
atgccccaat caaagctaat caatcggcgc gtcgttctgg cctcacgtcc ccacggtgcg 60
cctctcgaag cgaattttcg cattgagcaa agccccattc ctgagccagc agaagggcag 120
gttctgttgc gtaccgttta cctctcactt gacccttaca tgcgtggtcg catgagtgat 180
gcaccgtcct atgctgcgcc ggtggaaatc ggtggagtga ttgtgggtgg cactgtatgc 240
cgtgtggagg cttcgaaaaa cccggcctac aaggtcggtg actgggtgct gtcctttgct 300
ggctggcagg actacacgct gtccgatgga agcgatctga ccgcgttggg tgagtcgccg 360
gcgcatcctt cttatgcctt gggcatcttt ggcatgccgg gcttcaccgc ttatatgggc 420
ttgctcgata ttggccggcc gcaggcgggt gaaaccctgg tggtggcggc ggccaccggg 480
ccggtcggcg cgactgtggg gcagatcggc aagatcaagg gctgccatgt ggtcggtgtc 540
gccggtggcg cggaaaaatg ccggcatgcg gtcgaggtgc tgggttttga tgcctgtcta 600
gatcaccgtg cgccggactt cgccgagcaa ctggccaagg cctgcccggc aggtatcgac 660
atctacttcg agaatgtcgg cggcaaggtc ttcgatgcgg tgctgccgct gctcaatacc 720
aaggcccgag tgcccgtctg cggcattatt gcgcactaca acgataccgc tttacccaac 780
gggccagatc gtttgcctgc tttgatgggc agcattctgc gcaagcgtat tcatgtgcag 840
ggtttcatta tttttgatga ttacggccac cgctacaacg agttctttaa cgatatgtcg 900
agctggtttg cgcagggccg gattaaatac cgtgaagaat tagtgagtgg tctggaggag 960
gcgcctaagg cctttatcgg cctgctcgag gggcgaaatt ttggcaagtt agtggttcgc 1020
gtcagtgagg actga 1035
<210> 87
<211> 1143
<212> DNA
<213> Pseudomonas putida
<400> 87
atgtccctga tcaactacat cacccagatc caattcgata tcggtgccat cgcctgcctg 60
cctgccgaat gtgagcgcat tggtataacc aggcctttga tcgtgaccga ccgtggcgtg 120
cgtgccgccg gtatcgtcga tacggcgttg aacaccttcg gcagcgacac cacacaactg 180
ccgatctacg acggtacgcc acccaacccc aacgagcatg ccgtgcgtga ggccgtggcc 240
atgttcaagg caaatggctg tgatggcatc atcgccattg gtggtggctc ggcgatcgac 300
ctggccaagg gggtggccgt gtgtgcccgg cacgacggcc cgttgaagag ctttgcggtg 360
atcgagggcg gcctggcccg gatcaccccg gcaaccgcgc cggtgattgc ggtgccgacc 420
acggccggca cggggagcga ggtcgggcgc ggtgccatcc tgatactcga tgacgggcgc 480
aaggtggggg tgatctcgcc ccatgtggtg cccaaggccg ccatctgtga cccgtcattg 540
accctcgggc tgccggcaca actcacggct gccaccggca tggacgcgat tgcccactgc 600
ctggaaacct tcatggcacc tgcgttcaac ccgcctgccg acggcattgc cctggacggc 660
ctgtggaggg cctggcgctt catcgaacga gccacccgcg cgccgggcaa cctggacggg 720
cgcatcaaca tgatgagcgc atcgctgcaa ggtgcgctgg ccttccagaa aggcctgggc 780
tgcgtgcaca gccttagcca cgcgctgggc gggatcaacc cgcgcctgca ccacggcacc 840
ctcaatgcga tcttcctgcc tgccgtcatc cgcttcaacc gcacggccga aacggtggtg 900
aatgaacaca agatgcaacg catcgcccag gcgatggggc tggccgatga cagccagatc 960
gaagatgcca ttcgccacat gacccgtacg ctgggcctgc cgaccggcct tggcgaactg 1020
gatgtcaacc cggacctgtt cccgcgcatc gtccagggtg cgttggccga tcacagccac 1080
cgcaccaacc cgcgtgaggc atctgccgag gactaccagt ggctgcttga agcgtcgatg 1140
taa 1143
<210> 88
<211> 1164
<212> DNA
<213> Pseudomonas putida
<400> 88
atgagccaga gtttcagccc ccttcgcaag ttcgtatcgc ctgaaatcat ctttggtgcc 60
ggctgccggc acaatgtggc caattacgcc aaaaccttcg gtgcgcgcaa ggtactggtg 120
gtcagcgacc ctggcgtgat cgccgccggc tgggtggcgg atgtggaggc cagcctgcag 180
gcccagggta tcgactactg cctgtacaca gcggtgtcac ccaacccgcg ggtcgaggag 240
gtgatgctcg gcgccgagat ctatcggcag aaccactgtg acgtgatcgt cgccgtcggt 300
ggcggcagcc cgatggattg cggcaaggcc atcggtatcg tggtggccca tgggcgcagc 360
atcctcgaat tcgaaggcgt ggacatgatc cgcgtgccca gcccgccgct gatcctgatc 420
ccgaccaccg ccggcacctc ggcggacgtg tcgcagttcg tgatcatttc caaccagcag 480
gaacgcatga agttctccat cgtcagcaag gcggtggtgc cggacgtgtc gctgatcgac 540
ccgcagacca ccctgagcat ggacccgttc ctgtcggcct gcaccggcat cgatgcgttg 600
gtgcatgcca tcgaggcctt cgtgtctacc ggccacgggc cgctgaccga cccccatgcg 660
ctggaagcca tgcgcctgat caatggcaac ctggtggaga tgatcgccaa ccctactgat 720
attgcgctgc gcgagaagat catgctcggc agcatgcagg cggggctggc gttctccaat 780
gcgatcctgg gcgcagtgca cgccatgtcg cacagcctgg gcggcttcct cgacttgccc 840
catggcttgt gcaacgcggt gctggtggag cacgtggtgg cgttcaacta cagctcggcg 900
ccggagcgtt tcaaggtgat cgccgaggtg tttggtatcg actgccgcgg tctcaatcac 960
cggcagatct gcgggcggct ggtggagcac ctgattgccc tgaagcgtgc catcggcttc 1020
catgaaaccc tgggcctgca cggggtgcgc acgtctgata tcccgttcct gtcgcaacac 1080
gcgatggacg acccgtgcat cctcaccaac ccccgtgcgt ccagccagcg tgatgtcgag 1140
gtggtctatg gcgaggccct ctga 1164
<210> 89
<211> 1023
<212> DNA
<213> Pseudomonas putida
<400> 89
atgtcccgca tgatccgttt ccacaagttt ggcgctgccg acgtgctccg ttgcgaagag 60
caggccgaac cgtcacccgc tgccgacgag gtgcagatcc gcgtcgaagc ggttggcgtc 120
agctggtatg acgtgctgtg gcgccagaat ctggcaccgt cccaggcgcg tctgccagcg 180
gggatcggtc acgaaatggc aggggtggtg actgcggttg gtgaaggggt cgatgatatt 240
gccgtcggtg accgggtcgc cagcttcccg gccaccagtg ccaacgacca cccggtgtac 300
ggcgatgtca tcgtactgcc ccgtacagcc atcacgcgct acccgaatgt gctcaccccg 360
atcgaggcca gcgtgcacta caccccgctg ctgatcgcct atttcgccta cgtcgacctg 420
gcacgtgcca aggccgggca gacagcactg gtcaccgatg ccagccattg cgccgggcct 480
gccttcgtgc agctgggcag ggccctgggg ctgaaagtgt tcgccgccac caaggaagcg 540
gcgcagcgtg actacctgct gggcttgggc gcagacaaag tgatcgtcac cgaagagcaa 600
gacctgctgc tgcagattgg caagtacacc gatggccgtg gtgtggacat ggtgctcgac 660
ggcatgggcg gcccgcagat gtcactgttg ggtgatgtgc tggcgccgcg tggcagcctg 720
gtgctgtacg gtctgcaagg cggcaaccag acgccgttcc cggcttgcgc ggcattccag 780
aagaacattc agttctatgt gcactgcatc ggtaatttca ccggcaagcc agagcttggc 840
atcagccagg accaggtggc gctgcagcgt gccttgcgcg atatcaacca gttcacggcc 900
gaccagctgc tgacaccgca gatcatcaag gtgtacccgt tcgagcaggt ggtcgaggcg 960
catcgttaca tggaccaatg cccgtgcggc gggcgcgtcg tgctggacat ggcgcaacac 1020
tga 1023
<210> 90
<211> 1008
<212> DNA
<213> Pseudomonas putida
<400> 90
atgaaagcga tcagtttcat ccacaaaggc ttgcctatcg aagaccctgc gtctctccag 60
gacatcttca tgcccaagcc cagccctggg cccagggacc ttctggtcga ggtcaaagcc 120
gtgtcggtca accccgtaga caccaaggta cgcgcgggaa ctttcacggg agagccgaaa 180
atactcggct gggacgcggc cggtgtcgac cgcgaagtcg ggcgccaggt gaccctgttc 240
aagcccggag accaggtgta ctacgccggc tccatcgcca ggcccggcag ctacagcgaa 300
tatcacctgg ttgacgaacg catcgtcggg catcaaccgc gtagcctggg tgcagcacag 360
gcagccgcgc tgccgctgac ggccatcacc gcctgggaac tgctgttcga tcgcctgggg 420
atcgcggagg gcggcgggga gggcgatgcc ctgctgatcg ttggcgctgc cggtggcgtc 480
ggttcgatgc tggtgcagtt ggcccggcaa ctgacccgct tgacggttat cggcacggcc 540
tcccgcgccg agaccagcaa ctgggtacgc gaactgggcg cccatcacgt catcgatcac 600
agtgcgccgc tgcaagggca gctgcaggcc ttggggatcg agtcggtcag ccatgtcgcc 660
agccttaccc atactgatca acactttgcg caactggttg aagtgctgcg accacaaggt 720
cgcctgggcg tgatcgacga cccgcagacc ctggacgtca tgccgctcaa gcgcaagtcg 780
ctgtcgctgc actgggagct gatgttcacc cgctcgcttt acgaaaccga cgacatggtg 840
cgccagcacg agctgctcga gcgcgtggcc gggctgatcg atcaaggcac cctgcgtacc 900
accttgggcg agcatttcgg cgccatcaat gccgccaaca tgcgccgtgc ccatgcgctg 960
gtcgagagtg gcaaggcgcg cggcaagatc gtcctggaag gcttctga 1008
<210> 91
<211> 1002
<212> DNA
<213> Pseudomonas putida
<400> 91
atgaatcaga ccatgcttgc cgctatcgcc gaatccgccc agaccccgct ggtcgtgcgc 60
cacatcgccc gccctgtgcc cggtaagggg caggttttgg tgcggattca cgccgccggg 120
gtcaacccgc tcgacaccaa gattgcaatc ggtgcgggtg ctcacgcccg ccaggagttg 180
ccggccgtgc tcggcctgga tctcgccggt acggtcgtcg aactgggcga ggcagttgat 240
ggcttcacgc ctggccagga ggtcttcggc atggccggcg gaatcggcgg cgcccaaggc 300
accctggccg aatacatcgc cgtggatgcc aggctgattg catcaaagcc gcatgcactc 360
ggcatgcgtg aggctgccgc gctgccgttg gtattcatca ccgcctggga aggtttggta 420
gatcacgcaa atgttcgtag tggtcagcgt gtgctgattc atggcggcgc aggtggcgtc 480
ggccaagttg cggtgcaatt ggccaaggct cgaggtgccg aagtctacgc caccggctcc 540
gcgggcagtc tagacttcat tcgctcgctg ggggccacgg caattgacta tcaggcgcag 600
ggtgtagagg cctatgtcga acaatatacg gccggggaag gtttcgacat cgtttatgac 660
accgtcggcg gcagcacgtt ggacgcgtca ttcaaggcag taaagcctta taccgggcac 720
gtactcagct gcctcggttg gggccagcac agtctcgcgc ctttatcctt caaaagtgcc 780
acctactcgg gcgtatttac cctggcaccg ctgctaaccg gcaagggacg cgaacaccat 840
ggaagtatcc tgcgcgaggc tgccgttctg gccaatgccg ggcaactggc gatccgggtg 900
gacccgcaac agtttgcatt ggatgaggtc aacgacgcat tccgacaggt cgccgaaggt 960
cgcggcaggg gcaagacggt tatccagttg ataagtgaat ag 1002
<210> 92
<211> 1017
<212> DNA
<213> Pseudomonas putida
<400> 92
atgatgaata gccgaatcat gcaagcactg accttcaagc gctacggcaa gtcacccgac 60
atcgggttgg ccgacgttcc ccgccccacg ccaaaggctg acgaattact ggtgcaagtc 120
cacgctgccg gcctgaaccc gatcgacaac atgattccaa cggggatgtt caagcctgta 180
ttgcatttcc agctgccagc caccctgggc agcgatctgg ccggcatcgt gaccgaggta 240
ggtagcaatg tgacccgctt caagccaggc gatgctgtct tcgccagcct cttcgatctt 300
ggcacagggg cgattgcgga gttcgcggtt gtgccggaaa gcgccgccgc gctgaaaccg 360
gccaatctga gcttcgagca ggcggcgtcg atcccgatgg tcggcctcac ctcatggcaa 420
gcgctgaaag agcgcctcaa gcttcaggcc gggcagaagg tgttcattcc tgccgggtcg 480
gggggcatcg gtacattcgc aatccagttg gccaaacacc tcggtgcaaa ggtgggcacc 540
actaccagta caggcaacgt tgacctggtg cgcgctctgg gggcggacga ggttgtggac 600
tacaagacgc aggatttcga gaccgtgctg cgcgactacg acgcggtgct cggaaccgta 660
aggggggatg cgattgaaaa atccttgtcc atcctcagac ccggaagcca gattgtctcg 720
ctcgttggcc cactggatgc tgcgttcgcc cgggccaaac gcctgaacct cctcctgacc 780
ttcgtgttcg gcctgatgag ccgcaagatc atgcgcctgg caaagaggcg gaatgtccaa 840
tactcgtttc ttttcgtgca gcccgacggt gcccaactcg ccgaaatcgg caagcttctg 900
gacgcccagc aaattcagcc ggtgatcgac cgggtatttc cgttcgagga cgcaaagggt 960
gcgcttgagt accttgctca agggcgctcc aagggcaagg tcgtaatcaa gatgtga 1017
<210> 93
<211> 1011
<212> DNA
<213> Pseudomonas putida
<400> 93
atgaaagctg ctgtcgttgc accaggccgt cgcgtggacg tgatagagaa aagcctgcgc 60
cctctcgaac acggcgaagc gctgctgaag atgcagtgct gcggtgtgtg ccacaccgac 120
ctgcacgtca aaaatggcga ctttggtgac aagaccgggg tagtactggg ccacgaaggt 180
attggcgtgg ttcaggaagt tggcccgggc gtcacctcgc tcaagccagg cgaccgagcc 240
agcgttgcct ggttctacca gggttgcgga cattgcgaat actgcaacag cggcaacgag 300
accctgtgcc gcgacgtgaa gaattccggt tacaccgtgg acggcggcat ggccgaggcc 360
tgcatcgtca aggccgacta ctcggttaaa gtgcccgacg gcctcgactc cgccgccgcc 420
agcagcatca cctgcgccgg cgtcacgacc tacaaggcag tgaaaatctc caacgtccgc 480
cccggccaat ggatcgccat ctacgggctc ggcggcctgg gcaacctggc cctgcaatat 540
gccaagaatg tgttcaacgc caaagtcatc gccatcgacg tcaacgaaga gcaactgcgc 600
ttcgccagcg agatgggcgc ggatctggtc gtcaacccgc tcaacgaaga tgccgcgaag 660
gtcatccagg ccaaaaccgg cggtgcacat gctgccgtcg ttactgctgt ggccaaaggc 720
gcgttcaact cggctgtcga tgccttgcgc gctggcgggc gactggtggc cgtcgggctt 780
ccgtcggagt ccatggacct gaatattccc cgcctggtgc ttgatgggat cgaagtggtg 840
ggctcgctgg taggtacacg ccaggacctg caggaagcct tccagtttgc cgctgaaggc 900
aaagtggtgc ccaaggtaac gctgcgaccg atcgaggata tcaaccagat ctttgacgag 960
atgctggagg gcaagatcaa aggccggatg gtgatacagt tcgaaggctg a 1011
<210> 94
<211> 1203
<212> DNA
<213> Pseudomonas putida
<400> 94
atgagagcag tctcctacca cggtgctaac gatgtgcggg tcgattctgt cccagacccc 60
atcctccaag acgcagacga catcatctta agggtgacgg ccaccgccat ctgcggatcc 120
gacctccacc tctatcgagg caagatcccg gaaacagagc aaggcgacat cttcggccac 180
gagttcatgg gcatcgtgga agaggttggc agggacgtga cgaccctgca ggttggcgac 240
cgagtggtga ttccttttgt catcgcttgt ggaagttgct ttttctgcca gcaggatctc 300
ttcgctgcct gtgaaaccac caataccggg cgcggatcga tcatcaacaa aaagggcata 360
ccaccaggcg cagcgctgtt cggatacagc catctgtatg gagggatccc tggaggccaa 420
gctgattacg ttagggtgcc caaaggcaat gtcgggccat tcaaagtccc gacgaccctc 480
gcggatgaca aagtgctgtt cctatccgac atccttccca ccgcttggca agcggtcatc 540
aatgccgaga ttggcgaagg ctcatcggta gcgatctatg gcgcggggcc agtggggctg 600
ttgagtgccg cctgcgcacg gatgctgggc gcgcacaccg tcttcatggt ggatgacaac 660
gactaccggc tggcctatgc ccaggaagcc tatggcgtca tcccgatcaa cttcgaaaag 720
gatgatgatc ctgccgacag catcattcgc cagacaccgg gtatgcgtgg cgtggacgcg 780
gtcatcgatg cggtcgggtt tgaagccaaa ggcagcacca cggaaaccgt gatgacggcc 840
ttgaaactgg agggtagcag cggcaaggcc ctgcgccaga gcatcgcggc tgtgcgacgt 900
ggcggcgtag tcagcgtgcc cggcgtctat gcagggttca ttcacggctt catgttcggt 960
gatgccttcg acaaaggcct gaccttcaag atgggtcaga cccatgttca aaaatacctt 1020
cccgaactgc tggagcacat cgaagcaggg cgcctgcaac cggaactgat cgttactcac 1080
cgcttagccc tagaagaggc ggccatgggc tacaaaatgt tcgatcaaaa gcaggataac 1140
tgccgcaagg tcatcctcgt gccaggtgct gcacccggca ccttgggccc tgaccacctc 1200
tag 1203
<210> 95
<211> 1011
<212> DNA
<213> Pseudomonas putida
<400> 95
atgagcagca aggccatcta cgtacaaccc ggcggcggct acgacaaggt cgaggtcggc 60
acctgcgagg cccaggcccc ccaggccggc gagattaccg tgcgcctgca cgccagttcc 120
ctcaactacc acgatttcgc cgtggtcagc ggcatgtggg gcccgagcga gcgacgcatc 180
ccaatggccg atggcgccgg cgaggtggtt gcggtggggg ctggcgtcac tgagttccag 240
gtcggcgaca atgtggtcag caccttcttc cccgactggc tcgatggcca ggccaatgtc 300
gagggcttcg ccagggtgcc cggcgacggc atcgatggct acgcccgtga gcaagtgact 360
gcccgcgcca ccgccttcac cctggcaccc cagggtttca gccatgccga ggctgccacc 420
ctgaccaccg ccggccttac cgcctggcgc gcgctgatga gcgacgatca cctcaagccc 480
ggcgacacgg tgctggtgca gggtaccggc ggtgtgtcga ttttcgccct gcagttcgcc 540
aagctggcgg gcgcgaccgt gatcgccacc tcgtccagcg atgccaagct ggagcgcctg 600
aaggccctgg gtgccgacca cctgatcaac tacaagagca ccccggcctg gggtgagaag 660
gtgcgcgagc tgactggcaa ccgtggtgtc gatcatgtga ttgaagtggg cggcccggcg 720
acgctggagc agtcgatgat tgctgcgcgc attggcgggc atgtttcgct gatcggcatc 780
cttaccgggg tggccgggca gttgccgctg gtgcaggcgc tggtgcggca gattcggctg 840
caaggggtgc tggttggcag ccgagcgcag cagcaggcga tggtacgggc gatcgatgcc 900
aacggcctgc ggccggtggt ggacaagcat ttcgaactgg aacagatcgt cgaggcgttc 960
cgttaccagg agagcaaccg gcatttcggc aagatctgcc tgacctggtg a 1011
<210> 96
<211> 978
<212> DNA
<213> Pseudomonas putida
<400> 96
atgaaagctg tgttgtgcaa aaccctgggt ccggcgcgca acctggtgct ggaagaggtg 60
gccagcccac tgccgaagaa gaacgagatc ctgctggacg tgcaagctgc cggggtcaac 120
ttccccgaca ccttgatcat cgaaggcaag taccagttcc agccgccgct gccgttctct 180
ccaggtggcg aggcagcggg cgtggtggcc gccgtcggcg aaaaggccgg cgcgttcaag 240
gtcggcgacc gggtcatggc gctcaccggc tggggtgcgt tcgccgagca agtggcggtg 300
ccgttctata acgttctgcc gatcccggcg agcatggact tcaccaccgc tgcggccttc 360
ggcatgacct acggcacctc gatgcacgcc ctgcgccagc gtggccagtt gcaagccggc 420
gagaccctgc tggtactggg cgcttccggc ggggtgggcc tggcggcggt ggagatcggc 480
aaggccatgg gcgcgcgggt gatcgcggcg gccagcagtg ccgagaaact ggccgtggcc 540
aaggctgccg gggcggatga gctgatcgac tacagccagg ccaacctgcg cgaagaaatc 600
aaacgcctga ccggtggcca gggcgtggac gtgatctatg acccggtcgg tggcgagctg 660
ttcgaacaag cggtgcgcgg gttggcctgg aatggcaggc tgctggtggt gggttttgcc 720
agtggcagca ttccacagct ggcggccaac ctggtgctgc tcaagggcgc ggcggtactg 780
ggcgtgttct ggggggcatt tgcccagcgc cagccggagg acaacgcggc caacttccac 840
cagctgtttg cctggcatgc cgagggcaag ttgaagccgc tggtgtcgca gacttatcca 900
ctggcagaag ccggggttgc tatcgagaag ctggggcaac ggcaggctgt gggtaagttg 960
gtggtgctgg ccaggtaa 978
<210> 97
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 97
catgccatgg ggatgacaat gccttatgta aagaaca 37
<210> 98
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 98
ctgcggtacc atagaagctc cgtga 25
<210> 99
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 99
tcacggagct tctatggtac cgcag 25
<210> 100
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 100
gctctagatt acgcctttcc gctggatccg aat 33
<210> 101
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 101
catgccatgg ggatgaggag tacagacagg ttactgt 37
<210> 102
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 102
tgcccacacc atcgcgaatg ttgaa 25
<210> 103
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 103
ttcaacattc gcgatggtgt gggca 25
<210> 104
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 104
gctctagatt acttctgacc gtacttggtg tgg 33
<210> 105
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 105
catgccatgg ggatgtggaa gcatgtaaaa caggttg 37
<210> 106
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 106
catgcttccc attgtttcta tgaca 25
<210> 107
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 107
tgtcatagaa acaatgggaa gcatg 25
<210> 108
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 108
caccggtgct ccgtgggtga gatgt 25
<210> 109
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 109
acatctcacc cacggagcac cggtg 25
<210> 110
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 110
gctctagatt atatttccac cccttcgatc ttg 33
<210> 111
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 111
catgccatgg ggatgataga gtacaggatt gaggagg 37
<210> 112
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 112
cacacagact ccgtggaaac gattt 25
<210> 113
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 113
aaatcgtttc cacggagtct gtgtg 25
<210> 114
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 114
gctctagatt aacctccata tctctcttct ccc 33
<210> 115
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 115
catgccatgg ggatgatcga tctcaggtcc gacaccg 37
<210> 116
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 116
agcctgtgcc atcgcttttc tcatc 25
<210> 117
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 117
gatgagaaaa gcgatggcac aggct 25
<210> 118
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 118
ttgatttccc attgtgccgg agggt 25
<210> 119
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 119
accctccggc acaatgggaa atcaa 25
<210> 120
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 120
gagaaccgcc atcgctccga cctcg 25
<210> 121
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 121
cgaggtcgga gcgatggcgg ttctc 25
<210> 122
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 122
atcggggtcc atcgctccat ttttt 25
<210> 123
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 123
aaaaaatgga gcgatggacc ccgat 25
<210> 124
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 124
gctctagatt aggagaattt tctgaagagt ttt 33
<210> 125
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 125
catgccatgg tttacacaac tccctggaac agaaag 36
<210> 126
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 126
gctctagatt acaacctttg ccagagtatc gcc 33
<210> 127
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 127
catgccatgg ggatgaagat ggaagagctc ttcaaaa 37
<210> 128
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 128
gctctagatt attctgtgca ccccctgatc ttt 33
<210> 129
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 129
catgccatgg ggatgacaat gccttatgta aagaaca 37
<210> 130
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 130
gctctagatt acgcctttcc gctggatccg aat 33
<210> 131
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 131
catgccatgg ggatgaggag tacagacagg ttactgt 37
<210> 132
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 132
gctctagatt acttctgacc gtacttggtg tgg 33
<210> 133
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 133
catgccatgg ggatgaagat ctttctggac acagcaa 37
<210> 134
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 134
gctctagatt atttcttcag gttctccaaa tac 33
<210> 135
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 135
catgccatgg ggatgatagt cgttttgaaa cccggtt 37
<210> 136
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 136
gctctagatt aattcacctt cacccccagg gca 33
<210> 137
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 137
catgccatgg ggatgtggaa gcatgtaaaa caggttg 37
<210> 138
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 138
gctctagatt atatttccac cccttcgatc ttg 33
<210> 139
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 139
catgccatgg ggatgagaga gacgataaga gagattc 37
<210> 140
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 140
gctctagatt acagccatcc ctccggaaca ccc 33
<210> 141
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 141
catgccatgg tcaaggtcct gatcctcggt c 31
<210> 142
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 142
gctctagatt acagccactt cggtttcaat ccc 33
<210> 143
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 143
catgccatgg ggatgttcag aggagtagga actgcta 37
<210> 144
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 144
gctctagatt atagcaatcc actctccttg aga 33
<210> 145
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 145
catgccatgg ggatgataga gtacaggatt gaggagg 37
<210> 146
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 146
gctctagatt aacctccata tctctcttct ccc 33
<210> 147
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 147
catgccatgg ggatgatcga tctcaggtcc gacaccg 37
<210> 148
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 148
gctctagatt aggagaattt tctgaagagt ttt 33
<210> 149
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 149
catgccatgg ggatggcaga tttagacgat attaaag 37
<210> 150
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 150
ctgaaaataa ccgtggtcaa aagcc 25
<210> 151
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 151
ggcttttgac cacggttatt ttcag 25
<210> 152
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 152
cagtcacggc catcgtcggc attccc 26
<210> 153
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 153
gggaatgccg acgatggccg tgactg 26
<210> 154
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 154
gctctagatt actgtttttc actcagatag 30
<210> 155
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 155
catgccatgg ggatgtacgt ggtatcgaca aag 33
<210> 156
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 156
gttctccagt ctcgaaaaat caagc 25
<210> 157
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 157
gcttgatttt tcgagactgg agaac 25
<210> 158
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 158
gctctagatt atgccctgcc ctcgcagc 28
<210> 159
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 159
catgccatgg ggatgaataa gtacaccatc aac 33
<210> 160
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 160
gaggatcacc cacggcatat tgatatg 27
<210> 161
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 161
catatcaata tgccgtgggt gatcctc 27
<210> 162
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 162
gctctagatt agcggcgttt agccatc 27
<210> 163
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 163
catgccatgg ggatgacgga caaattgacc tc 32
<210> 164
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 164
gctctagatt acagcagatc gccgatc 27
<210> 165
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 165
catgccatgg ggatggaact gtatctggat ac 32
<210> 166
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 166
gctctagatt aaatcgacgt tctgccaaac 30
<210> 167
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 167
catgccatgg ggatgattga tttacgcagt gatac 35
<210> 168
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 168
gctctagatt aacgcgccag gaatgcac 28
<210> 169
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 169
catgccatgg ggatggcaga tttagacgat attaaag 37
<210> 170
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 170
gctctagatt actgtttttc actcagatag 30
<210> 171
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 171
catgccatgg ggatgaaaaa ctggaaaaca ag 32
<210> 172
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 172
gctctagatt acagcttagc gccttctac 29
<210> 173
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 173
catgccatgg ggatgtacgt ggtatcgaca aag 33
<210> 174
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 174
gctctagatt atgccctgcc ctcgcagc 28
<210> 175
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 175
catgccatgg ggatgacaga tattgcgcag ttg 33
<210> 176
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 176
gctctagatc aggcgatagt aattttgc 28
<210> 177
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 177
catgccatgg ggatggcaca acctgccgct attattc 37
<210> 178
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 178
gctctagatt aacgctgcca gcttaagg 28
<210> 179
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 179
catgccatgg ggatgaacga gttagacggc atc 33
<210> 180
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 180
gctctagatt atagtttggc ggcaagaag 29
<210> 181
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 181
catgccatgg ggatggaacg aaataaactt gc 32
<210> 182
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 182
gctctagatt actcttcaat tcgtaacc 28
<210> 183
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 183
catgccatgg ggatgtctaa gatttttgat ttc 33
<210> 184
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 184
gctctagatt acagaacgtc gatcgcgttc 30
<210> 185
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 185
catgccatgg ggatggatat tgtatttata gag 33
<210> 186
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 186
gctctagatt aattattttc tttcagatta ttg 33
<210> 187
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 187
catgccatgg ggatgaataa cgatgttttc cc 32
<210> 188
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 188
gctctagatt attttttaaa ggtatcag 28
<210> 189
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 189
catgccatgg ggatgaaaca tctgacagaa atg 33
<210> 190
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 190
gctcatatat atatcctcct ttattggcct tcacaggctg tg 42
<210> 191
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 191
caataaagga ggatatatat atgagcatta tctccactaa atatc 45
<210> 192
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 192
gctctagatt atgctgaaat tcgattcg 28
<210> 193
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 193
catgccatgg ggatgaataa gtacaccatc aac 33
<210> 194
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 194
gctctagatt agcggcgttt agccatc 27
<210> 195
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 195
catgccatgg ggatgcaaaa cattactcag tc 32
<210> 196
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 196
gctctagatt acagcgccag cgcactgg 28
<210> 197
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 197
catgccatgg ggatggaact gtatctggac ac 32
<210> 198
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 198
gctctagatt agagatgagt agtgccaaat g 31
<210> 199
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 199
catgccatgg ggatgactga tctgaaagca ag 32
<210> 200
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 200
gctctagatt agtagctgct ggcgctc 27
<210> 201
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 201
cccgagctct taggaggatt agtcatggaa c 31
<210> 202
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 202
gctctagatt attttgaata atcgtagaaa cc 32
<210> 203
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 203
gctctagagg aggatatata tatgaaaaat tgtgtcatcg tc 42
<210> 204
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 204
aactgcagtt aattcaaccg ttcaatcacc 30
<210> 205
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 205
cgagctcagg aggatatata tatgaaaaat tgtgtcatcg tcagtg 46
<210> 206
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 206
ggttgaatta aggaggatat atatatgaat aaagacacac taatacctac 50
<210> 207
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 207
gtctttattc atatatatat cctccttaat tcaaccgttc aatcaccatc 50
<210> 208
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 208
cccaagctta gccggcaagt acacatcttc 30
<210> 209
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 209
cgagctcagg aggatatata tatgaaaaat tgtgtcatcg tcagtg 46
<210> 210
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 210
cccaagctta gccggcaagt acacatcttc 30
<210> 211
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 211
aaggaaaaaa gcggccgccc ctgaaccgac gaccgggtcg 40
<210> 212
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 212
cggggtacca cttttcatac tcccgccatt cag 33
<210> 213
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 213
cggggtaccg cggatacata tttgaatgta tttag 35
<210> 214
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 214
aaggaaaaaa gcggccgcgc ggatacatat ttgaatgtat ttag 44
<210> 215
<211> 1248
<212> DNA
<213> Cuphea hookeriana
<400> 215
atggtggctg ctgcagcaag ttccgcattc ttccctgttc cagccccggg agcctcccct 60
aaacccggga agttcggaaa ttggccctcg agcttgagcc cttccttcaa gcccaagtca 120
atccccaatg gcggatttca ggttaaggca aatgacagcg cccatccaaa ggctaacggt 180
tctgcagtta gtctaaagtc tggcagcctc aacactcagg aggacacttc gtcgtcccct 240
cctcctcgga ctttccttca ccagttgcct gattggagta ggcttctgac tgcaatcacg 300
accgtgttcg tgaaatctaa gaggcctgac atgcatgatc ggaaatccaa gaggcctgac 360
atgctggtgg actcgtttgg gttggagagt actgttcagg atgggctcgt gttccgacag 420
agtttttcga ttaggtctta tgaaataggc actgatcgaa cggcctctat agagacactt 480
atgaaccact tgcaggaaac atctctcaat cattgtaaga gtaccggtat tctccttgac 540
ggcttcggtc gtactcttga gatgtgtaaa agggacctca tttgggtggt aataaaaatg 600
cagatcaagg tgaatcgcta tccagcttgg ggcgatactg tcgagatcaa tacccggttc 660
tcccggttgg ggaaaatcgg tatgggtcgc gattggctaa taagtgattg caacacagga 720
gaaattcttg taagagctac gagcgcgtat gccatgatga atcaaaagac gagaagactc 780
tcaaaacttc catacgaggt tcaccaggag atagtgcctc tttttgtcga ctctcctgtc 840
attgaagaca gtgatctgaa agtgcataag tttaaagtga agactggtga ttccattcaa 900
aagggtctaa ctccggggtg gaatgacttg gatgtcaatc agcacgtaag caacgtgaag 960
tacattgggt ggattctcga gagtatgcca acagaagttt tggagaccca ggagctatgc 1020
tctctcgccc ttgaatatag gcgggaatgc ggaagggaca gtgtgctgga gtccgtgacc 1080
gctatggatc cctcaaaagt tggagtccgt tctcagtacc agcaccttct gcggcttgag 1140
gatgggactg ctatcgtgaa cggtgcaact gagtggcggc cgaagaatgc aggagctaac 1200
ggggcgatat caacgggaaa gacttcaaat ggaaactcgg tctcttag 1248
<210> 216
<211> 1260
<212> DNA
<213> Cuphea lanceolata
<400> 216
atggtggctg ctgcagcaac ttctgcattc ttccccgttc cagccccggg aacctcccct 60
aaacccggga agtccggcaa ctggccatcg agcttgagcc ctaccttcaa gcccaagtca 120
atccccaatg ctggatttca ggttaaggca aatgccagtg cccatcctaa ggctaacggt 180
tctgcagtaa atctaaagtc tggcagcctc aacactcagg aggacacttc gtcgtcccct 240
cctccccggg ctttccttaa ccagttgcct gattggagta tgcttctgac tgcaatcacg 300
accgtcttcg tggcggcaga gaagcagtgg actatgcttg ataggaaatc taagaggcct 360
gacatgctcg tggactcggt tgggttgaag agtattgttc gggatgggct cgtgtccaga 420
cagagttttt tgattagatc ttatgaaata ggcgctgatc gaacagcctc tatagagacg 480
ctgatgaacc acttgcagga aacatctatc aatcattgta agagtttggg tcttctcaat 540
gacggctttg gtcgtactcc tgggatgtgt aaaaacgacc tcatttgggt gcttacaaaa 600
atgcagatca tggtgaatcg ctacccaact tggggcgata ctgttgagat caatacctgg 660
ttctctcagt cggggaaaat cggtatggct agcgattggc taataagtga ttgcaacaca 720
ggagaaattc ttataagagc aacgagcgtg tgggctatga tgaatcaaaa gacgagaaga 780
ttctcaagac ttccatacga ggttcgccag gagttaacac ctcattttgt ggactctcct 840
catgtcattg aagacaatga tcagaaattg cataagtttg atgtgaagac tggtgattcc 900
attcgcaagg gtctaactcc gaggtggaat gacttggatg tgaatcagca cgtaagcaac 960
gtgaagtaca ttgggtggat tctcgagagt atgccaatag aagttttgga gacccaggag 1020
ctatgctctc tcaccgttga atataggcgg gaatgcggaa tggacagtgt gctggagtcc 1080
gtgactgctg tggatccctc agaaaatgga ggccggtctc agtacaagca ccttttgcgg 1140
cttgaggatg ggactgatat cgtgaagagc agaactgagt ggcgaccgaa gaatgcagga 1200
actaacgggg cgatatcaac atcaacagca aagacttcaa atggaaactc ggcctcttag 1260
1260
<210> 217
<211> 1617
<212> DNA
<213> Cuphea lanceolata
<400> 217
atggcggcgg cctcttccat ggctgcgtca ccgttctgta cgtggctcgt agctgcttgc 60
atgtccactt ccttcgaaaa caacccacgt tcgccctcca tcaagcgtct cccccgccgg 120
aggagggttc tctcccattg ctccctccgt ggatccacct tccaatgcct cgtcacctca 180
cacatcgacc cttgcaatca gaactgctcc tccgactccc ttagcttcat cggggttaac 240
ggattcggat ccaagccatt ccggtccaat cgcggccacc ggaggctcgg ccgtgcttcc 300
cattccgggg aggccatggc tgtggctctg caacctgcac aggaagtcgc cacgaagaag 360
aaacctgcta tcaagcaaag gcgagtagtt gttacaggaa tgggtgtggt gactcctcta 420
ggccatgaac ctgatgtttt ctacaacaat ctcctagatg gagtaagcgg cataagtgag 480
atagagaact tcgacagcac tcagtttccc acgagaattg ccggagagat caagtctttt 540
tccacagatg gctgggtggc cccaaagctc tccaagagga tggacaagct catgctttac 600
ttgttgactg ctggcaagaa agcattagca gatgctggaa tcaccgatga tgtgatgaaa 660
gagcttgata aaagaaagtg tggagttctc attggctccg gaatgggcgg catgaagttg 720
ttctacgatg cgcttgaagc cctgaaaatc tcttacagga agatgaaccc tttttgtgta 780
ccttttgcca ccacaaatat gggatcagct atgcttgcaa tggatctggg atggatgggt 840
ccaaactact ctatttcaac tgcctgtgca acaagtaatt tctgtatact gaatgctgca 900
aaccacataa tcagaggcga agctgacatg atgctttgtg gtggctcgga tgcggtcatt 960
atacctatcg gtttgggagg ttttgtggcg tgccgagctt tgtcacagag gaataatgac 1020
cctaccaaag cttcgagacc atgggatagt aatcgtgatg gatttgtaat gggcgaagga 1080
gctggagtgt tacttctcga ggagttagag catgcaaaga aaagaggtgc aaccatttat 1140
gcagaatttt tagggggcag tttcacttgc gatgcctacc acatgaccga gcctcaccct 1200
gaaggagctg gagtgatcct ctgcatagag aaggccatgg ctcaggccgg agtctctaga 1260
gaagatgtaa attacataaa tgcccatgca acttccactc ctgctggaga tatcaaagaa 1320
taccaagctc tcgcccactg tttcggccaa aacagcgagc tgagagtgaa ttccactaaa 1380
tcgatgatcg gtcatcttct tggagcagct ggtggcgtag aagcagttac tgtaattcag 1440
gcgataagga ctgggtggat ccatccaaat cttaatttgg aagacccgga caaagccgtg 1500
gatgcaaaat ttctcgtggg acctgagaag gagagactga atgtcaaggt cggtttgtcc 1560
aattcatttg ggttcggtgg gcataactcg tctatactct tcgcccctta caattag 1617
<210> 218
<211> 1641
<212> DNA
<213> Cuphea lanceolata
<400> 218
atgcctgccg cctcttccct gctcgcttcc cctctctgta cgtggctcct tgccgcctgc 60
atgtctacct ccttccaccc ctccgaccct cttccgcctt ccatctcctc tcctcgccga 120
cgcctctccc gccgccggat tctctcccaa tgcgccccac taccttctgc ttcctccgcc 180
ctccgcggat ccagtttcca taccctcgtc acctcttacc tcgcctgctt cgagccctgc 240
catgactact atacatccgc atccttgttc ggatccagac ccattcgcac cacccgcagg 300
caccggaggc tcaatcgagc ttccccttcc agggaggcaa tggccgtggc tctgcaacct 360
gaacaggaag ttaccacaaa gaagaagcca agtatcaaac agcggcgagt agttgtgact 420
ggaatgggtg tggtgactcc tctaggccat gaccctgatg ttttctacaa taatctgctt 480
gatggaacga gtggcataag cgagatagag acctttgatt gtgctcaatt tcctacgaga 540
attgctggag agatcaagtc tttctccaca gatggttggg tggccccgaa gctctctaag 600
aggatggaca agttcatgct atacatgctg accgctggca agaaagcatt aacagatggt 660
ggaatcaccg aagatgtgat gaaagagcta gataaaagaa aatgcggagt tctcattggc 720
tcagcaatgg gtggaatgaa ggtattcaat gatgccattg aagccctaag gatttcatat 780
aagaagatga atcccttttg tgtacctttc gctaccacaa atatgggatc agctatgctt 840
gcaatggact tgggatggat ggggcccaac tactcgatat ctactgcttg tgcaacgagt 900
aacttttgta taatgaatgc tgcgaaccat ataatcagag gcgaagcaga tgtgatgctt 960
tgcgggggct cagatgcggt aatcatacct attggtatgg gaggttttgt tgcatgccga 1020
gctttgtccc agagaaattc cgaccctact aaagcttcaa gaccatggga cagtaatcgt 1080
gatggatttg ttatggggga aggagctgga gtgctactac tagaggagtt ggagcatgca 1140
aagaaaagag gtgcgactat ttacgcagaa tttctaggtg ggagtttcac ttgcgatgcc 1200
taccacatga ccgagcctca ccctgatgga gctggagtga ttctctgcat agagaaggct 1260
ttggctcagt caggagtctc tagggaagac gtaaattaca taaatgccca tgccacatcc 1320
actccggctg gagatatcaa agagtaccaa gctcttatcc actgtttcgg ccaaaacaga 1380
gagttaaaag ttaattcaac caaatcaatg attggtcacc ttctcggagc agccggtggt 1440
gtggaagcag tttcagtagt tcaggcaata aggactgggt ggatccatcc gaatattaat 1500
ttggaaaacc cagatgaagg cgtggataca aaattgctcg tgggtcctaa gaaggagaga 1560
ctgaacgtta aggtcggttt gtctaattca tttgggtttg gtgggcacaa ctcgtccata 1620
ctcttcgccc cttacatcta g 1641
<210> 219
<211> 414
<212> DNA
<213> Cuphea lanceolata
<400> 219
atggcgtccg cagctcccgc ttcttcgatc tgcatcaaat ccgcctcctg ctcggctctg 60
gcgccgggta gaatctcgag cttgagatca gtctcactac ctgtcagtcg gaaaagcttc 120
ttctctcgca ggggttcgtt ctccctccga gtcaactgtc aggctaaacc agaaaccgtg 180
acaaaggtct gcaatatagt gaagaagcag ttggccttac cagacgactc tgatgtttcc 240
ggagtgtcca agttcagtgc tcttggagca gattctttgg acacggtgga gattgtcatg 300
ggactagagg aggagtttgg gatcagtgtg gaggaagaaa gtgcacagag catccagacc 360
gtccaagatg ccgccgatct catcgagaag ctcatggaga agaagggcca ttga 414
<210> 220
<211> 432
<212> DNA
<213> Cuphea lanceolata
<400> 220
atggctaccg ccgccgccgg atcttccctc atctgcatca agtccgcttc ctgctccctt 60
aaccgggctc aggtaccaag tggactttca agcctgagat ctgtctcgct acctatcagt 120
ggcaaaatct ttccctctct caggtcatcc aggggacctt tgagcttccg cgtctgctgt 180
caggctaagc aagaaaccgt aacgagggtc tgcgaaatag tcaagaagca gttggccttg 240
ccagaggact ctgaggttaa cggactgtca aagttctctg ctctcggtgc agactctttg 300
gacacggtgg agattgtcat gggactagag gaagagtttg ggatcagtgt ggaggaagag 360
agtgctcaga gcatccaaac cgtccaagac gctgcagatc tcatcgagaa gctcgttggg 420
aataagaaat aa 432
<210> 221
<211> 423
<212> DNA
<213> Cuphea lanceolata
<400> 221
atggcttccg cagctgccgg tgcttccatc tgcatcaagt ccgcctcctt ctcgcctctg 60
gcaccgggta gaatttcaag cttgagatct gtctcattac ctgtgagtcg gaaaagcttt 120
ccctctctca agtcatccaa gagttcgttc gctctccggg tcagctgtca ggctaaacca 180
gaaaccgtgg cgaaggtctg cggcatagtg aagaaacaat tggccttacc agacgactct 240
gaggttaatg gactatccaa gtttagtgct ctcggagcag attctctcga cacggtggag 300
attgtcatgg gactagagga ggaatttggg atcagcgtgg aggaagaaag tgcacagagc 360
atccagaccg tccaagatgc tgccgatctc atcgagaagc tcatggagaa gaagggccat 420
tga 423
<210> 222
<211> 420
<212> DNA
<213> Cuphea lanceolata
<400> 222
atggcttccg cagctgccgg tgcttccatc tgcatcaagt ccgcctcctg ctcgcctctg 60
gcaccgggta gaatttcaag cttgagatca gtctcattac ctgtgagtcg gaaaagcttt 120
ccctctctca ggtcatccaa gggttcgttt gcccgggtca gctgtcaggc taaaccagaa 180
accgtggcga aggtctgccg catagtgaag aaacaattgg ccttaccaga cgactctgag 240
gttaatggac tatccaagtt tagtgctctc ggagcagatt ctctcgacac ggtggagatt 300
gtcatgggac tagaggagga atttgggatc agcgtggagg aagaaagtgc acagagcatc 360
cagaccgtcc aagatgctgc cgatctcatc gagaagctca tggagaagaa gggccattga 420
420
<210> 223
<211> 8
<212> PRT
<213> Eschericia coli DH10B
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Asp, Gly, or His
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Ile, Val, Ser, Ala, or Cys
<220>
<221> VARIANT
<222> (4)
<223> Xaa = Ser or Thr
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Ser, Thr, or Ala
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Leu, Ile, Val, Met, or Phe
<400> 223
Xaa Xaa Thr Xaa Asn Pro Xaa Xaa
1 5
<210> 224
<211> 18
<212> PRT
<213> Eschericia coli DH10B
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Leu, Ile, Val, Met, or Ala
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (3)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Pro, Ala, or Ser
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Ser, Thr, or Cys
<220>
<221> VARIANT
<222> (9)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (10)
<223> Xaa = Asp, Glu, Asn, Gln, Pro, Ala, or Ser
<220>
<221> VARIANT
<222> (11)
<223> Xaa = Gly or Cys
<220>
<221> VARIANT
<222> (12)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (13)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (14)
<223> Xaa = Ala, Gly, or Val
<220>
<221> VARIANT
<222> (15)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (16)
<223> Xaa = Gln, Glu, Lys, Arg, Ser, Thr, or His
<220>
<221> VARIANT
<222> (17)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (18)
<223> Xaa = Leu, Ile, Val, Met, or Phe
<400> 224
Xaa Xaa Xaa Lys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa
<210> 225
<211> 10
<212> PRT
<213> Escherichia coli DH10B
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (3)..(5)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Leu, Ile, or Val
<220>
<221> VARIANT
<222> (9)
<223> Xaa = Leu or Phe
<400> 225
Gly Xaa Xaa Xaa Xaa Glu Xaa Thr Xaa Arg
1 5 10
<210> 226
<211> 14
<212> PRT
<213> Escherichia coli DH10B
<220>
<221> VARIANT
<222> (2)..(4)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Leu, Ile, Val, Met, or Phe
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Leu or Phe
<220>
<221> VARIANT
<222> (10)
<223> Xaa = Ser or Ala
<220>
<221> VARIANT
<222> (11)..(13)
<223> Xaa = Any amino acid
<400> 226
Gly Xaa Xaa Xaa Xaa Lys Xaa Phe Pro Xaa Xaa Xaa Xaa Gly
1 5 10
<210> 227
<211> 12
<212> PRT
<213> Escherichia coli
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Phe, Tyr, Val, Met, or Thr
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (3)
<223> Xaa = Leu, Ile, Val, Met, or His
<220>
<221> VARIANT
<222> (4)
<223> Xaa = Ala, Pro, Asn, or Thr
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (9)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (12)
<223> Xaa = Gly, Ala, Cys, or His
<400> 227
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa
1 5 10
<210> 228
<211> 12
<212> PRT
<213> Escherichia coli DH10B
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (3)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (9)
<223> Xaa = Gly or Met
<220>
<221> VARIANT
<222> (10)
<223> Xaa = Gly, Ser, Thr, or Ala
<220>
<221> VARIANT
<222> (11)
<223> Xaa = Any amino acid
<400> 228
Xaa Glu Xaa Glu Xaa Gly Xaa Xaa Xaa Xaa Xaa Glu
1 5 10
<210> 229
<211> 9
<212> PRT
<213> Escherichia coli DH10B
<400> 229
Asp Ala Thr Thr Asn Pro Ser Leu Ile
1 5
<210> 230
<211> 18
<212> PRT
<213> Escherichia coli DH10B
<400> 230
Ile Leu Ile Lys Leu Ala Ser Thr Trp Gln Gly Ile Arg Ala Ala Glu
1 5 10 15
Gln Leu
<210> 231
<211> 9
<212> PRT
<213> Escherichia coli DH10B
<400> 231
Gly Val Thr Thr Asn Pro Ser Ile Ile
1 5
<210> 232
<211> 17
<212> PRT
<213> Escherichia coli DH10B
<400> 232
Ile Val Val Lys Val Pro Val Thr Ala Glu Gly Leu Ala Ala Ile Lys
1 5 10 15
Met
<210> 233
<211> 9
<212> PRT
<213> Escherichia coli DH10B
<400> 233
Asp Ala Thr Thr Asn Pro Ser Leu Leu
1 5
<210> 234
<211> 18
<212> PRT
<213> Escherichia coli DH10B
<400> 234
Ile Leu Ile Lys Leu Ala Ser Thr Trp Glu Gly Ile Arg Ala Ala Glu
1 5 10 15
Glu Leu
<210> 235
<211> 9
<212> PRT
<213> Escherichia coli DH10B
<400> 235
Gly Val Thr Thr Asn Pro Ser Ile Ile
1 5
<210> 236
<211> 17
<212> PRT
<213> Escherichia coli DH10B
<400> 236
Ile Val Val Lys Ile Pro Val Thr Ser Glu Gly Leu Ala Ala Ile Lys
1 5 10 15
Ile
<210> 237
<211> 10
<212> PRT
<213> Escherichia coli DH10B
<400> 237
Gly Val Arg Val Leu Glu Val Thr Leu Arg
1 5 10
<210> 238
<211> 14
<212> PRT
<213> Escherichia coli DH10B
<400> 238
Gly Leu Lys Glu Phe Lys Phe Phe Pro Ala Glu Ala Asn Gly
1 5 10
<210> 239
<211> 12
<212> PRT
<213> Escherichia coli DH10B
<400> 239
Tyr His His Pro Leu Ala Ile His Leu Asp His His
1 5 10
<210> 240
<211> 12
<212> PRT
<213> Escherichia coli DH10B
<400> 240
Val Glu Ala Glu Leu Gly Gln Leu Gly Gly Gln Glu
1 5 10
<210> 241
<211> 12
<212> PRT
<213> Escherichia coli DH10B
<400> 241
Tyr Gly Val Pro Val Ile Leu His Thr Asp His Cys
1 5 10
<210> 242
<211> 11
<212> PRT
<213> Escherichia coli DH10B
<400> 242
Leu Glu Ile Glu Leu Gly Cys Thr Gly Gly Glu
1 5 10
<210> 243
<211> 14
<212> PRT
<213> Escherichia coli DH10B
<400> 243
Thr Thr Tyr Asn Met Pro Leu Ala Leu His Leu Asp His His
1 5 10
<210> 244
<211> 12
<212> PRT
<213> Escherichia coli DH10B
<400> 244
Val Glu Ala Glu Leu Gly Arg Leu Gly Gly Val Glu
1 5 10
<210> 245
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Ala, Gly, or Ser
<400> 245
Xaa Xaa Gly Gly Xaa Xaa
1 5
<210> 246
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)..(3)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Ala, Gly, or Ser
<400> 246
Xaa Xaa Xaa Gly Gly Xaa Xaa
1 5
<210> 247
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)..(4)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Ala, Gly, or Ser
<400> 247
Xaa Xaa Xaa Xaa Gly Gly Xaa Xaa
1 5
<210> 248
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (4)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Ala, Gly, or Ser
<400> 248
Xaa Xaa Gly Xaa Xaa Xaa
1 5
<210> 249
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)..(3)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Ala, Gly, or Ser
<400> 249
Xaa Xaa Xaa Gly Gly Xaa Xaa Xaa
1 5
<210> 250
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)..(4)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (6)..(7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Ala, Gly, or Ser
<400> 250
Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa
1 5
<210> 251
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (4)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Ala, Gly, or Ser
<400> 251
Xaa Xaa Gly Xaa Xaa
1 5
<210> 252
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)..(3)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Ala, Gly, or Ser
<400> 252
Xaa Xaa Xaa Gly Xaa Xaa
1 5
<210> 253
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)..(4)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Ala, Gly, or Ser
<400> 253
Xaa Xaa Xaa Xaa Gly Xaa Xaa
1 5
<210> 254
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH
binding motif.
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Ala, Gly, or Ser
<220>
<221> VARIANT
<222> (2)..(5)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Ala, Gly, or Ser
<400> 254
Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa
1 5
<210> 255
<211> 17
<212> PRT
<213> Escherichia coli DH10B
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Leu, Ile, Val, Met, or Ala
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (3)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Pro, Ala, or Ser
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Ser, Thr, or Cys
<220>
<221> VARIANT
<222> (9)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (10)
<223> Xaa = Asp, Glu, Asn, Gln, Pro, Ala, or Ser
<220>
<221> VARIANT
<222> (11)
<223> Xaa = Gly or Cys
<220>
<221> VARIANT
<222> (12)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (13)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (14)
<223> Xaa = Ala, Gly, or Val
<220>
<221> VARIANT
<222> (15)
<223> Xaa = Gln, Glu, Lys, Arg, Ser, Thr, or His
<220>
<221> VARIANT
<222> (16)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (17)
<223> Xaa = Leu, Ile, Val, Met, or Phe
<400> 255
Xaa Xaa Xaa Lys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa
<210> 256
<211> 13
<212> PRT
<213> Escherichia coli
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Phe, Tyr, Val, Met, or Thr
<220>
<221> VARIANT
<222> (2)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (3)
<223> Xaa = Leu, Ile, Val, Met, or His
<220>
<221> VARIANT
<222> (4)
<223> Xaa = Ala, Pro, Asn, or Thr
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (6)..(7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (10)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (13)
<223> Xaa = Gly, Ala, Cys, or His
<400> 256
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa
1 5 10
<210> 257
<211> 13
<212> PRT
<213> Escherichia coli
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Phe, Tyr, Val, Met, or Thr
<220>
<221> VARIANT
<222> (2)..(3)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (4)
<223> Xaa = Leu, Ile, Val, Met, or His
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Ala, Pro, Asn, or Thr
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (10)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (13)
<223> Xaa = Gly, Ala, Cys, or His
<400> 257
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa
1 5 10
<210> 258
<211> 14
<212> PRT
<213> Escherichia coli
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Phe, Tyr, Val, Met, or Thr
<220>
<221> VARIANT
<222> (2)..(3)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (4)
<223> Xaa = Leu, Ile, Val, Met, or His
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Ala, Pro, Asn, or Thr
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (7)..(8)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (9)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (11)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (14)
<223> Xaa = Gly, Ala, Cys, or His
<400> 258
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa
1 5 10
<210> 259
<211> 14
<212> PRT
<213> Escherichia coli
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Phe, Tyr, Val, Met, or Thr
<220>
<221> VARIANT
<222> (2)..(4)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Leu, Ile, Val, Met, or His
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Ala, Pro, Asn, or Thr
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (8)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (9)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (11)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (14)
<223> Xaa = Gly, Ala, Cys, or His
<400> 259
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa
1 5 10
<210> 260
<211> 15
<212> PRT
<213> Escherichia coli
<220>
<221> VARIANT
<222> (1)
<223> Xaa = Phe, Tyr, Val, Met, or Thr
<220>
<221> VARIANT
<222> (2)..(4)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (5)
<223> Xaa = Leu, Ile, Val, Met, or His
<220>
<221> VARIANT
<222> (6)
<223> Xaa = Ala, Pro, Asn, or Thr
<220>
<221> VARIANT
<222> (7)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (8)..(9)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (10)
<223> Xaa = Leu, Ile, Val, or Met
<220>
<221> VARIANT
<222> (12)
<223> Xaa = Any amino acid
<220>
<221> VARIANT
<222> (15)
<223> Xaa = Gly, Ala, Cys, or His
<400> 260
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa
1 5 10 15
Claims (49)
- 알데히드, 케톤 또는 둘 다의 근원을 가진 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생산하는 방법이며, 상기 재조합 미생물이 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩하고 발현하는 적어도 하나의 폴리뉴클레오티드; 및 (ii)알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩하고 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하고, 상기 폴리뉴클레오티드의 적어도 하나는 외인성이어서 범용화학제품 또는 그의 중 간체를 생성하는 방법.
- 제 1항에 있어서, 범용화학제품은 추가로 효소학적 또는 화학적으로 그의 상응하는 알칸으로 전환되는 방법.
- 제 1항에 있어서, 범용화학제품이 3-하이드록시-2,2,4 트리메틸펜타날 및 2,2,4-트리메틸-1,3-펜탄디올로 이루어진 그룹으로부터 선택되는 방법.
- 제 4항에 있어서, 상기의 2,2,4-트리메틸-1,3-펜탄디올이 추가로 효소학적으로 또는 화학적으로 2,2,4-트리메틸펜탄으로 전환되는 방법.
- 제 1항에 있어서, 범용화학제품이 3-하이드록시-2-에틸헥사날, 2-에틸-2-헥센-1-알, 2-에틸헥사날, 및 2-에틸헥사놀로 이루어진 그룹으로부터 선택되는 방법.
- 제 6항에 있어서, 2-에틸헥사놀이 추가로 효소학적으로 또는 화학적으로 2-에틸헥산으로 전환되는 방법.
- 제 1항에 있어서, 범용화학제품이 3-하이드록시-2-부틸-1-옥타놀, 2-부틸-2- 옥텐-1-알, 2-부틸-옥타날, 및 2-부틸-옥타놀로 이루어진 그룹으로부터 선택되는 방법.
- 제 8항에 있어서, 2-부틸-옥타놀이 추가로 효소학적으로 또는 화학적으로 2-부틸-옥탄으로 전환되는 방법.
- 제 1항에 있어서, 알데히드, 케톤 또는 둘 다의 근원이 재조합 미생물이고 이들 미생물이 아세토알데히드, 프로피온안데히드, 글루타르알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 헥사나알데히드, 옥타나알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드로 부터 선택되는 알데히드 및/또는 케톤 생합성 경로 및 숙시네이트 4-하이드록시페닐 아세트알데히드 생합성 경로 및 그의 조합을 포함하는 방법.
- 제 10항에 있어서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물이 제 1항의 재조합 미생물과 동일한 것인 방법.
- 제 10항에 있어서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물이 제 1항의 재조합 미생물과 상이한 것인 방법.
- 제 10항에 있어서, 알데히드 및/또는 케톤 생합성 경로가 이소부틸알데히드 생합성 경로를 포함하고, 여기서 상기 알데히드가 이소부틸알데히드인 방법.
- 제 10항에 있어서, 알데히드 및/또는 케톤 생합성 경로가 부틸알데히드 생합성 경로를 포함하고, 여기서 상기 알데히드가 부틸알데히드인 방법.
- 제 1항에 있어서, 알돌라제 활성을 가지는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i) SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열 또는 (ii)중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 방법.
- 제 1항에 있어서, 알돌라제 활성을 갖는 폴리펩티드가 SEQ ID NOS:223-244, 255-260으로 나타낸 아미노산 서열로부터 선택되는 적어도 하나의 생물학적으로 활성이 있는 모티프를 포함하는 방법.
- 제 1항에 있어서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딘 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i) SEQ ID NOS: 1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 방법.
- 제 1항에 있어서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드가 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드 (NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NADP+), 또는 NADPH 결합 모티프를 포함하는 방법.
- 제 18항에 있어서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프가 Y-X- G-G-X-Y (SEQ ID NO:245), Y-X-X-G-G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X- Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X-G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y-X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X- X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택되고; 여기서 Y는 알라닌, 글리신, 및 세린으로부터 독립적으로 선택되고, 여기서 G는 글리신이고, 또한 X는 유전적으로 인코딩된 아미노산으로부터 독립적으로 선택되는 방법.
- 제 1항에 있어서, 상기 재조합 미생물은 추가로 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하는 방법.
- 제 20항에 있어서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i)SEQ ID NOS:35-50으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii)중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:35-50으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 방법.
- (i)알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하는 재조합 미생물.
- 제 22항에 있어서, 상기 미생물이 알데히드, 케톤 또는 둘 다의 근원을 범용화학제품 또는 그의 중간체로 전환시킬 수 있으며, 여기서 상기 범용화학제품 또는 그의 중간체는 하기의 화학식으로부터 선택되는 재조합 미생물:
상기 식에서, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
n은 0 내지 30이다.
- 제 22항에 있어서, (iii)알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함하는 재조합 미생물.
- 제 24항에 있어서, 상기 미생물이 적합한 단당류 또는 적합한 올리고당을 범용화학제품 또는 그의 중간체로 전환시킬 수 있으며, 여기서 범용화학제품 또는 그의 중간체는 하기의 화학식으로부터 선택되는 방법:
상기 식에서, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
n은 0 내지 30이다.
- 제 22항에 있어서, 알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드는 아세토알데히드, 프로피온알데히드, 글루타르알데히드, 부티르알데히드, 이소부티르알데히드, 2-메틸-부티르알데히드, 3-메틸-부타르알데히드, 4-메틸펜타알데히드, 헥산알데히드, 옥탄알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드로부터 선택되는 경로 및 숙시네이트 4-하이드록시페닐 아세트알데히드 생합성 경로, 및 그의 조합으로부터 선택된 경로를 포함하는 재조합 미생물.
- 제 26항에 있어서, 알데히드 및/또는 케톤 생합성 경로는 이소부틸알데히드 생합성 경로를 포함하고 여기서 알데히드는 이소부틸알데히드인 재조합 미생물.
- 제 6항에 있어서, 알데히드 및/또는 케톤 생합성 경로는 부틸알데히드 생합성 경로를 포함하고 여기서 알데히드는 부틸알데히드인 재조합 미생물.
- 제 6항에 있어서, 알데히드 및/또는 케톤 생합성 경로는 헥산알데히드 생합성 경로를 포함하고 여기서 알데히드는 헥산알데히드인 재조합 미생물.
- 제 22항에 있어서, 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i)SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii)중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체을 포함하는 재조합 미생물.
- 제 22항에 있어서, 알돌라제 활성을 갖는 폴리펩티드가 SEQ ID NOS:223-244, 255-260으로 나타낸 아미노산 서열로부터 선택된 적어도 하나의 생물학적으로 활성이 있는 모티프를 포함하는 재조합 미생물.
- 제 22항에 있어서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i) SEQ ID NOS: 1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:1, 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 재조합 미생물.
- 제 22항에 있어서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드가 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드 (NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NADP+), 또는 NADPH 결합 모티프를 포함하는 재조합 미생물.
- 제 33항에 있어서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프가 Y-X-G-G-X-Y (SEQ ID NO:245), Y-X-X-G-G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X-Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X- G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y-X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X-X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택되고;
여기서, Y는 알라닌, 글리신, 및 세린으로부터 독립적으로 선택되고,
G는 글리신이고 또한
X는 유전학적으로 인코딩된 아미노산으로부터 독립적으로 선택되는 재조합 미생물.
- 제 22항에 있어서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함하는 재조합 미생물.
- 제 35항에 있어서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i) SEQ ID NOS:35-50으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:35-50으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 재조합 미생물.
- 적합한 단당류 또는 올리고당 근원을 가지는 첫 번째 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생성하는 방법이며, 상기 첫 번째 재조합 미생물이 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드, 및 (iii) 상기 폴리뉴클레오티드의 적어도 하나가 외인성이어서 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하고 여기서 즉, 범용화학제품 또는 그의 중간체를 생산하는 방법.
- 제 37항에 있어서, 적합한 단당류 또는 올리고당의 근원이 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있는 두 번째 재조합 미생물을 포함하는 방법.
- 제 37항에 있어서, 바이오매스-유래 다당류가 알지네이트 및 펙틴으로부터 선택되는 방법.
- 바이오매스-유래 다당류로 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생성하는 방법이며, 여기서, 재조합 미생물은 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있고, 또한 상기 재조합 미생물은 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드; 및 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하며, 상기 폴리뉴클레오티드의 적어도 하나가 외인성이어서 범용화학제품 또는 그의 중간체를 생성하는 방법.
- 제 40항에 있어서, 바이오매스-유래 다당류는 알지네이트 및 펙틴으로부터 선택되는 방법.
- (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드; 또한 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하는 재조합 미생물.
- 제 42항에 있어서, 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있는 재조합 미생물.
- 제 1항 내지 제 40항 중 어느 하나에 있어서, 아세토박터 아세티, 아크로모박터, 아시디필리움, 아시네토박터, 악티노마두라, 악티노플래인, 애로피룸 퍼닉스, 아그로박테리움, 알칼리진, 아나나스 코모수스(M), 아스로박터, 아스파질러스 니거, 아스파질러스 오리제, 아스파질러스 멜레우스, 아스파질러스 퍼브루엔투스, 아스파질러스 사이토이, 아스파질러스 소지, 아스파질러스 우사이이, 바실러스 알칼로필러스, 바실러스 아밀로리퀘파시엔스, 바실러스 브레비스, 바실러스 설쿠란스, 바실러스 클로시이, 바실러스 렌터스, 바실러스 리첸니포미스, 바실러스 마세란스, 바실러스 스티아로설모필러스, 바실러스 서브티리스, 비피도박테리움, 브레비바실러스 브레비스, 버크홀데리아 세파시아, 캔디다 실린드라세아, 캔디다 루고사, 칼리카 파파야 (L), 셀룰로시미크로비움, 세팔로스포리움, 채토미움 에라티쿰, 채토미움 그라사일, 클로스트리디움, 클로스트리디움 브티리쿰, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 설모셀룸, 코리네박테히움 (글루타미쿰), 코리네박테리움 에피시엔스, 이스체리키아 콜라이, 엔테로카쿠스, 어위나 크리산테미, 글리코노박터, 글루콘아세토박터, 할로아큘라, 휴미콜라 인솔엔스, 휴미콜라 엔솔렌스, 키타사토스포라 세태, 클렙실라, 클렙실라 옥시토카, 클루이브로마이세스, 클루이브로마이세스 플래길리스, 클루이브로마이세스 락티스, 코쿠리아, 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 세이크, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸오시티스, 메탄노로버스 시실리애, 메탄노게니움 오가노필룸, 메탄노박테리움 브라이언타이, 마이크로박테리움 임페리얼리, 마이크로코쿠스 라이소 데익티쿠스, 마이크로루나투스, 뮤콜자바니쿠스, 마이코박터, 마이로테시움, 나이트로박터, 나미트로소모나스, 노카디아, 파파야 카리카, 페디오코쿠스, 페디오코구스 할로필러스, 페니실리움, 페니실리움 카멤버티, 페니실리움 시트리넘, 페니실리움 에머소나이, 페니실리움 로퀘포티, 페니실리움 릴락티눔, 페니실리움 멀티컬러, 파라코쿠스 판토트로퍼스, 프로피온니박테리움, 수도모나스, 수도모나스 플루오레센스, 수도모나스 데니트리피칸스, 필오코쿠스, 필오코쿠스 퓨리오서스, 필오코쿠스 호리코사이, 리조비움, 리조뮤콜 미헤이, 리조뮤콜 퓨실루스 린트, 리조퍼스, 리조퍼스 델레마, 리조퍼스 자폰이쿠스, 리조퍼스 니비우스, 리조퍼스 오리재, 리조퍼스 올리고스포러스, 로도코쿠스, 사카로마이시스 세레비지애, 스클레로티나 리버티나, 스핑고박테리움 멀티보룸, 스핑고비움, 그핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이시스, 스트렙토마이시스 그리세우스, 스트렙토마이시스 리비단스, 스트렙토마이시스 무리누스, 스트렙토마이시스 루비기노수스, 스트렙토마이시스 바이오라세오루버, 스트렙토버티실리움 모바랜스, 테트라제노코쿠스, 서머스, 티오스패라 판토트로파, 트라미테스, 트리초더마, 트리초더마 롱지브라키아툼, 트리초더마 리에시이, 트리초더마 비리데, 트리초스포론 페니실라툼, 비브리오 알지노리티쿠스, 잔소모나스, 이스트, 자이고사카로마이시스 룩사이, 자이모모나스, 및 자이모모누스 모빌리스로부터 선택되는 재조합 미생물.
- 제 1항, 제 37항 또는 제 40항 중 어느 하나의 방법에 의하여 생산되는 범용화학제품.
- 제 45항의 범용화학제품 및 정제소에서 생성된 석유 산물을 포함하는 혼합된 범용화학제품.
- 제 46항에 있어서, 범용화학제품이 이소옥탄, 2-에틸헥산, 및 2-부틸-옥탄으로부터 선택되는 혼합된 범용화학제품.
- 제 46항에 있어서, 정제소에서 생성된 석유 산물이 가솔린, 제트 연료, 및 디젤 연료로부터 선택되는 혼합된 범용화학제품.
- (a)제 1항, 제 37항 또는 제 40항 중 어느 하나의 방법에 의하여 정제소에서 생산된 석유 산물을 범용화학제품과 혼합 및 정제소에서 생산된 석유 산물로 농축된 범용화학제품을 생산함을 포함하는 정제소에서 생산된 석유 산물로 강화된 범용화학제품을 생성하는 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12186908P | 2008-12-11 | 2008-12-11 | |
US61/121,869 | 2008-12-11 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20110098936A true KR20110098936A (ko) | 2011-09-02 |
Family
ID=42243347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020117015344A KR20110098936A (ko) | 2008-12-11 | 2009-12-11 | 범용화학제품의 생합성 |
Country Status (12)
Country | Link |
---|---|
US (3) | US8003365B2 (ko) |
EP (1) | EP2361310A2 (ko) |
JP (1) | JP2012511908A (ko) |
KR (1) | KR20110098936A (ko) |
CN (1) | CN102245779A (ko) |
AU (1) | AU2009324462A1 (ko) |
BR (1) | BRPI0922437A2 (ko) |
CA (1) | CA2745220A1 (ko) |
CL (1) | CL2011001414A1 (ko) |
MX (1) | MX2011006081A (ko) |
SG (1) | SG172076A1 (ko) |
WO (1) | WO2010068921A2 (ko) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100242345A1 (en) | 2006-05-19 | 2010-09-30 | LS9, Inc | Production of fatty acids & derivatives thereof |
US8110670B2 (en) | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
US8110093B2 (en) * | 2007-03-14 | 2012-02-07 | Ls9, Inc. | Process for producing low molecular weight hydrocarbons from renewable resources |
US20090004715A1 (en) | 2007-06-01 | 2009-01-01 | Solazyme, Inc. | Glycerol Feedstock Utilization for Oil-Based Fuel Manufacturing |
CL2008002960A1 (es) | 2007-10-04 | 2009-05-08 | Bio Arch Lab Inc | Método para producir 2-ceto-3-desoxi d-gluconato (kdg), basado en proporciopnar acido-desoxi l-eritro hexocelulosa uronico (dehu), y contactar dicha molecula con un microorganismo recombinante que codofica una dehu-hidrogenasa. |
EP2415860A4 (en) * | 2009-03-30 | 2012-09-05 | Res Inst Innovative Tech Earth | CORNEFORMED BACTERIUM TRANSFORMANT, AND METHOD FOR PRODUCING ISOBUTANOL USING THE SAME |
EP2425007A4 (en) | 2009-04-27 | 2013-01-02 | Ls9 Inc | PREPARATION OF FATTY ACID ESTERS |
CA2801057C (en) | 2010-05-28 | 2019-06-18 | Solazyme, Inc. | Tailored oils produced from recombinant heterotrophic microorganisms |
FI122886B (fi) | 2010-06-24 | 2012-08-31 | Valtion Teknillinen | Geneettisesti muokattuja sieniä ja niiden käyttö lipidituotannossa |
CA3024641A1 (en) | 2010-11-03 | 2012-05-10 | Corbion Biotech, Inc. | Microbial oils with lowered pour points, dielectric fluids produced therefrom, and related methods |
MX351063B (es) | 2011-02-02 | 2017-09-29 | Terravia Holdings Inc | Aceites adaptados producidos a partir de microorganismos oleaginosos recombinantes. |
ES2744868T3 (es) | 2012-04-18 | 2020-02-26 | Corbion Biotech Inc | Aceites hechos a medida |
EP3052636A2 (en) | 2013-10-04 | 2016-08-10 | Solazyme, Inc. | Tailored oils |
ES2764273T3 (es) * | 2014-07-10 | 2020-06-02 | Corbion Biotech Inc | Nuevos genes de cetoacil ACP sintasa y uso de los mismos |
US11191519B2 (en) * | 2014-08-05 | 2021-12-07 | HABICO, Inc. | Device, system, and method for hemispheric breast imaging |
EP3180437A2 (en) * | 2014-08-14 | 2017-06-21 | Repsol, S.A. | Process for production of branched chain alcohols |
CA3025584A1 (en) * | 2016-06-30 | 2018-01-04 | Ardra Bio Inc. | Methods and microorganisms for producing flavors and fragrance chemicals |
CN110387360B (zh) * | 2019-06-18 | 2021-12-28 | 华东理工大学 | 羟基类固醇脱氢酶及其在合成熊去氧胆酸前体中的应用 |
CN110423793B (zh) * | 2019-08-28 | 2021-09-03 | 精晶药业股份有限公司 | 一种2-羟基-3-甲基-3-甲酰基丁酸的生物合成方法 |
WO2022057854A1 (zh) * | 2020-09-16 | 2022-03-24 | 南京迈西可生物科技有限公司 | 病原体特异性核酸片段及其应用 |
CN114084957B (zh) * | 2021-10-18 | 2023-10-20 | 暨南大学 | 一种提高异养硝化-好氧反硝化菌脱氮的方法 |
CN116376989B (zh) * | 2022-04-11 | 2023-10-24 | 元素驱动(杭州)生物科技有限公司 | 一种制备酮酸的方法及该方法在制备氨基酸或氨基酸衍生物中的应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4873192A (en) | 1987-02-17 | 1989-10-10 | The United States Of America As Represented By The Department Of Health And Human Services | Process for site specific mutagenesis without phenotypic selection |
US5344771A (en) | 1990-04-26 | 1994-09-06 | Calgene, Inc. | Plant thiosterases |
US5298421A (en) | 1990-04-26 | 1994-03-29 | Calgene, Inc. | Plant medium-chain-preferring acyl-ACP thioesterases and related methods |
US5455167A (en) | 1991-05-21 | 1995-10-03 | Calgene Inc. | Medium-chain thioesterases in plants |
AU2002306849A1 (en) * | 2001-03-21 | 2002-10-08 | Elitra Pharmaceuticals, Inc. | Identification of essential genes in microorganisms |
-
2009
- 2009-12-11 BR BRPI0922437A patent/BRPI0922437A2/pt not_active IP Right Cessation
- 2009-12-11 SG SG2011042405A patent/SG172076A1/en unknown
- 2009-12-11 CA CA2745220A patent/CA2745220A1/en not_active Abandoned
- 2009-12-11 MX MX2011006081A patent/MX2011006081A/es not_active Application Discontinuation
- 2009-12-11 EP EP09795850A patent/EP2361310A2/en not_active Withdrawn
- 2009-12-11 JP JP2011540939A patent/JP2012511908A/ja active Pending
- 2009-12-11 CN CN2009801508174A patent/CN102245779A/zh active Pending
- 2009-12-11 AU AU2009324462A patent/AU2009324462A1/en not_active Abandoned
- 2009-12-11 US US12/636,046 patent/US8003365B2/en not_active Expired - Fee Related
- 2009-12-11 KR KR1020117015344A patent/KR20110098936A/ko not_active Application Discontinuation
- 2009-12-11 WO PCT/US2009/067750 patent/WO2010068921A2/en active Application Filing
-
2011
- 2011-06-10 CL CL2011001414A patent/CL2011001414A1/es unknown
- 2011-07-26 US US13/191,389 patent/US8137949B2/en not_active Expired - Fee Related
-
2012
- 2012-02-16 US US13/398,720 patent/US20120142081A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CN102245779A (zh) | 2011-11-16 |
US20100185017A1 (en) | 2010-07-22 |
WO2010068921A3 (en) | 2010-10-14 |
US8137949B2 (en) | 2012-03-20 |
CA2745220A1 (en) | 2010-06-17 |
BRPI0922437A2 (pt) | 2019-09-24 |
SG172076A1 (en) | 2011-07-28 |
CL2011001414A1 (es) | 2012-01-20 |
US20110287521A1 (en) | 2011-11-24 |
MX2011006081A (es) | 2011-06-24 |
US8003365B2 (en) | 2011-08-23 |
EP2361310A2 (en) | 2011-08-31 |
JP2012511908A (ja) | 2012-05-31 |
US20120142081A1 (en) | 2012-06-07 |
AU2009324462A1 (en) | 2010-06-17 |
WO2010068921A2 (en) | 2010-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20110098936A (ko) | 범용화학제품의 생합성 | |
KR20100091162A (ko) | 바이오연료 생산 | |
KR20100119877A (ko) | 단리된 알코올 디하이드로게나제 효소 및 이의 용도 | |
CN102459570A (zh) | 具有改善的阿拉伯糖利用率的发酵单胞菌属细菌 | |
CN101680007A (zh) | 使用高活性酮醇酸还原异构酶来发酵生产异丁醇 | |
CN106795483A (zh) | 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法 | |
CN107771214A (zh) | 用于具有增加的2,4‑二羟基丁酸外排物的优化的2,4‑二羟基丁酸产生的修饰的微生物 | |
CN113710798A (zh) | 戊糖和己糖的降解途径 | |
CN101748069B (zh) | 一种重组蓝藻 | |
JP5243748B2 (ja) | ブタノール生産能を有する形質転換体 | |
CN117693588A (zh) | 用于改进乙二醇的生物产生的微生物和方法 | |
KR20240015166A (ko) | 에틸렌 글리콜의 생물학적 생성을 개선하기 위한 미생물 및 방법 | |
KR20240046579A (ko) | 이소프레노이드 알코올 및 유도체의 생성을 위한 미생물 발효 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |