KR20110098936A - 범용화학제품의 생합성 - Google Patents

범용화학제품의 생합성 Download PDF

Info

Publication number
KR20110098936A
KR20110098936A KR1020117015344A KR20117015344A KR20110098936A KR 20110098936 A KR20110098936 A KR 20110098936A KR 1020117015344 A KR1020117015344 A KR 1020117015344A KR 20117015344 A KR20117015344 A KR 20117015344A KR 20110098936 A KR20110098936 A KR 20110098936A
Authority
KR
South Korea
Prior art keywords
ala
gly
seq
leu
polypeptide
Prior art date
Application number
KR1020117015344A
Other languages
English (en)
Inventor
야스오 요시쿠니
아담 제이. 월가키
아사엘 헤르만
Original Assignee
바이오 아키텍쳐 랩, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이오 아키텍쳐 랩, 인크. filed Critical 바이오 아키텍쳐 랩, 인크.
Publication of KR20110098936A publication Critical patent/KR20110098936A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/30Fuel from waste, e.g. synthetic alcohol or diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T50/00Aeronautics or air transport
    • Y02T50/60Efficient propulsion technologies, e.g. for aircraft
    • Y02T50/678Aviation using fuels of non-fossil origin

Landscapes

  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

바이오매스로부터 유래된 것과 같은 적합한 단당류 또는 올리고당, 뿐만 아니라 다양한 알데히드 및/또는 케톤을 바이오연료와 같은 범용화학제품으로 전환시키기 위한 방법, 효소, 재조합 미생물 및 미생물 시스템이 제공된다. 여기에 기술된 방법에 의해 생성된 범용화학제품도 또한 제공된다. 범용화학제품 농축, 정제소-생산 석유 제품 뿐만 아니라 이것을 생산하는 방법도 또한 제공된다.

Description

범용화학제품의 생합성{BIOSYNTHESIS OF COMMODITY CHEMICALS}
관련 명세서에 대한 교차 참고
본 명세서는 2008년 12월 11에 출원된 미국 가출원 특허 제 61/121,869호의 35 U.S.C. §119(e)하의 이익을 주장하며, 이 출원의 전체내용은 참고로 여기서 포함된다.
서열 리스트에 대한 의견
본 출원과 연관된 서열 목록은 종이 카피 대신에 텍스트 형식으로 제공되고, 본 명세서내에 참고로 포함된다. 서열 목록이 포함된 텍스트 파일의 이름은 150097_403_SEQUENCE_LISTING.txt이다. 텍스트 파일은 178 KB이고 2009년 12월 11일에 생성되었고, EFS-Web을 통해 전자문서로 제출되었다.
본 출원은 일반적으로 알데히드 및/또는 케톤을 다양한 범용화학제품(commodity chemical) 또는 이소옥탄과 같은 바이오연료로 전환하는 재조합 미생물 및 화학/효소학적 시스템의 용도에 관한 것이다.
석유는 감소하고 있는 세계 매장량을 직면하고 있고 지구를 따뜻하게 하는 온실 가스 배출의 30% 이상에 기여한다. 연간 수송 연료의 8000억 배럴이 전세계적으로 소비되고 있다. 디젤 및 제트 연료는 지구전체 수송 연료의 50% 이상을 차지한다.
연료 생산자들에게 수송 연료의 생산 및 사용으로부터 탄소 배출의 상한을 정하거나 감소하도록 요구하는 중요한 법률이 통과하였다. 연료 생산자들은 현행 기반구조(예, 정제소, 파이프라인, 급유기)를 통해 혼합되고 분배될 수 있는 실질적으로 유사한 저탄소 연료를 찾고 있다.
증가하는 석유값 및 석유화학 공급원료의 의존도에 기인하여, 화학산업은 그의 환경적 족적을 감소시키면서, 마진 및 가격 안정성을 향상시키는 방법을 또한 추구하고 있다. 화학산업은 현재의 제품보다 보다 효율적인 많은 에너지, 물 및 CO2를 갖는 친환경 제품의 개발에 힘쓰고 있다. 바이오매스와 같은 생물 근원으로부터 생산된 연료는 그런 프로세스의 한 면을 나타낸다.
바이오매스를 바이오연료로 전환하는 다수의 현재 방법들은 목질 섬유소 바이오매스의 사용에 집중하고 있다. 그러나, 이들 프로세스 사용과 연관된 여러 문제들이 존재한다. 목질 섬유소 바이오매스의 대량 경작은 상당한 양의 경작농지가 필요하고, 이것은 식품 농작물 생산을 에너지 작물 생산, 산림벌채로 대체하거나, 경작되지 않은 토지를 재경작함으로써 이루어질 수 있다. 다른 문제는 물의 가용성 및 품질의 감소 뿐만 아니라 살충제 및 비료 사용의 증가를 포함한다.
생물학적 시스템을 사용하여 목질 섬유소 바이오매스의 분해는 그것의 실질적인 기계적 힘 및 복합 화학 성분에 기인하여 상당한 도전을 나타낸다. 약 30개의 다른 효소가 목질 섬유소를 단당류로 완전히 전환시키는데 필요하다. 이 복합 접근법의 유일하게 이용가능한 다른 대안은 상당량의 열, 압력, 및 강산을 필요로한다. 그러므로 상기 기술은 바이오매스를 바이오연료 또는 바이오패트롤을 위한 탄화수소로 전환하기 위해서 경제적이고 기술적으로 간단한 프로세스를 필요로 한다. 미국 특허 출원 제 12/245,537호 및 12/245,540호는 바이오매스로부터 다양한 바이오연료를 생성하는 재조합 미생물의 사용을 기술하고 있으며, 또한 바이오매스 유래 당류로부터 부틸알데히드 및 이소부틸알데히드등의 다양한 알데히드를 생성하는 재조합 미생물의 사용을 기술하고 있다.
또한 이소옥탄으로 알려진 2,2,4-트리메틸펜탄은 옥탄 평가 척도에서 100포인트를 정의하는 옥탄 이성질체이다. 이소옥탄은 가솔린의 중요한 성분을 나타낸다. 이소옥탄은 흔히 관련된 탄화수소와의 혼합물로서 석유 산업에서 대규모로 생성되고 있다. 석유 산업은 전형적으로 강산 촉매를 사용하여 이소부탄을 이소부틸렌으로 알킬화하는 이소옥탄을 생산하기 위해 알킬화 공정에 의존한다.
더욱이, 현재 석유 매장량은 낮은 옥탄 함량 때문에 가솔린에 대해 점점 덜 유용하며, 또한 옥탄을 첨가하는 능력은 현재의 석유 매장량의 사용성을 증가시킬 수 있다. 따라서, 상기 기술은 다른 관련 바이오연료 뿐만 아니라 이소옥탄을 생산하는 친환경적으로 및 기술적으로 단순한 절차를 필요로 한다.
본 발명의 구현 예들은 알데히드, 케톤 또는 둘 다의 근원으로 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생산하는 방법에 관한 것으로, 여기서 상기 재조합 미생물은 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 포함하고, 여기서 상기 폴리뉴클레오티드의 적어도 하나는 외인성이고 범용화학제품 또는 그의 중간체를 생성한다.
특정한 구현 예에서, 범용화학제품 또는 그의 중간체는 하기 화학식으로부터 선택된다:
Figure pct00001
상기 식 중, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고; 또한
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고,
n은 0 내지 30이다. 특정한 구현 예에서, 범용화학제품는 그의 상응하는 알칸으로 추가로 효소학적 또는 화학적으로 전환된다.
특정한 구현 예에서, 범용화학제품은 3-하이드록시-2,2,4 트리메틸펜타날 및 2,2,4-트리메틸-1,3-펜탄디올로 이루어진 그룹으로부터 선택된다. 특정한 구현 예에서, 2,2,4-트리메틸-1,3-펜탄디올은 2,2,4-트리메틸펜탄으로 추가로 효소학적 또는 화학적으로 전환된다.
특정한 구현 예에서, 범용화학제품은 3-하이드록시-2-에틸헥사날, 2-에틸-2-헥센-1-알, 2-에틸헥사날, 및 2-에틸헥사놀로 이루어진 그룹으로부터 선택된다. 특정한 구현 예에서, 2-에틸헥사놀은 2-에틸헥산으로 추가로 효소학적으로 또는 화학적으로 전환된다.
특정한 구현 예에서, 범용화학제품은 3-하이드록시-2-부틸-1-옥타놀, 2-부틸-2-옥텐-1-알, 2-부틸-옥타날, 및 2-부틸-옥타놀로 이루어진 그룹으로부터 선택된다. 특정한 구현 예에서, 2-부틸-옥타놀은 2-부틸-옥탄으로 추가로 효소학적으로 또는 화학적으로 전환된다.
특정한 구현 예에서, 알데히드, 케톤 또는 들 다의 근원은 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물이며 상기 생합성 경로는 아세토알데히드, 프로피온알데히드, 글루타르알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 헥산알데히드, 옥탄알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드, 및 숙시네이트 4-하이드록시페닐 아세타알데히드 생합성 경로, 및 그의 조합으로부터 선택된다.
임의의 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물은 범용화학제품을 생성 또는 합성하는 재조합 미생물과 동일하다. 특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물은 범용화학제품을 생성 또는 합성하는 재조합 미생물과 다르다.
특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로는 이소부틸알데히드 생합성 경로를 포함하며 여기서 상기 알데히드는 이소부틸알데히드이다. 특정한 구현 예에서, 상기 알데히드 및/또는 케톤 생합성 경로는 부틸알데히드 생합성 경로를 포함하며, 여기서 상기 알데히드는 부틸알데히드이다. 특정한 구현 예에서, 상기 알데히드 및/또는 케톤 생합성 경로는 헥산알데히드 생합성 경로를 포함하며 여기서 상기 알데히드는 헥산알데히드이다.
특정한 구현 예에서, 알돌라제 활성을 가지는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드가 (i) SEQ ID NOS:51-82 로 나타낸 적어도 하나의 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열 또는 (ii)중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체(complement)를 포함한다. 특정한 구현 예에서, 알돌라제 활성을 갖는 폴리펩티드는 SEQ ID NOS:223-244, 255-260로 나타낸 아미노산 서열로부터 선택되는 적어도 하나의 생물학적으로 활성이 있는 모티프를 포함한다.
특정한 구현 예에서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딘 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드가 (i) SEQ ID NOS: 1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시의 조건하에서 SEQ ID NOS:1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다. 특정한 구현 예에서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드가 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드 (NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NADP+), 또는 NADPH 결합 모티프를 포함한다. 특정한 구현 예에서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프는 Y-X- G-G-X-Y (SEQ ID NO:245), Y-X-X-G-G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X- Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X-G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y-X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X- X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택되며; 여기서 Y는 알라닌, 글리신, 및 세린으로부터 독립적으로 선택되고, G는 글리신이고, 또한 X는 유전적으로 인코딩된 아미노산으로부터 독립적으로 선택된다
특정한 구현 예에서, 재조합 미생물은 추가로 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함한다. 특정한 구현 예에서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 (i) SEQ ID NOS:35-50으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii)중간 스트린전시의 조건하에서 SEQ ID NOS:35-50으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다.
본 발명의 구현 예는 또한 일반적으로 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 포함하는 재조합 미생물에 관한 것이다.
특정한 구현 예에서, 재조합 미생물은 알데히드, 케톤 또는 둘 다의 근원을 범용화학제품 또는 그의 중간체로 전환시킬 수 있고, 여기서 범용화학제품 또는 그의 중간체는 하기의 화학식으로부터 선택되고:
Figure pct00002
상기 식에서,
R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
n은 0 내지 30이다.
특정한 구현 예에서, 재조합 미생물은 (iii) 알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 추가로 포함한다. 특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 추가로 포함하는 미생물은 적합한 단당류 또는 적합한 올리고당을 범용화학제품 또는 그의 중간체로 전환시킬 수 있고, 여기서 범용화학제품 또는 그의 중간체는 하기의 화학식으로부터 선택되고:
Figure pct00003
상기 식에서,
R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
n은 0 내지 30이다.
특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 아세토알데히드, 프로피온알데히드, 글루타르알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 헥산알데히드, 옥탄알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드, 및 숙시네이트 4-하이드록시페닐 아세트알데히드 생합성 경로, 및 그의 조합으로부터 선택된 경로를 포함한다.
특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로는 이소부틸알데히드 생합성 경로를 포함하고, 여기서 상기 알데히드는 이소부틸알데히드이다. 특정한 구현 예에서, 상기 알데히드 및/또는 케톤 생합성 경로는 부틸알데히드 생합성 경로를 포함하고 여기서 상기 알데히드는 부틸알데히드이다. 특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로는 헥산알데히드 생합성 경로를 포함하고 여기서 상기 알데히드는 헥산알데히드이다.
특정한 구현 예에서, 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 (i) SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii)중간 스트린전시의 조건하에서 SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다. 특정한 구현 예에서, 알돌라제 활성을 갖는 폴리펩티드는 SEQ ID NOS:223-244, 255-260으로 나타낸 아미노산 서열로부터 선택된 적어도 하나의 생물학적으로 활성이 있는 모티프를 포함한다.
특정한 구현 예에서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 (i) SEQ ID NOS: 1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시의 조건하에서 SEQ ID NOS:1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다. 특정한 구현 예에서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드는 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드 (NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NADP+), 또는 NADPH 결합 모티프를 포함한다. 특정한 구현 예에서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프는 Y-X-G-G-X-Y (SEQ ID NO:245), Y-X-X-G-G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X-Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X- G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y-X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X-X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택되고;
Y는 알라닌, 글리신, 및 세린으로부터 독립적으로 선택되고,
G는 글리신이고 또한
X는 유전학적으로 인코딩된 아미노산으로부터 독립적으로 선택된다.
특정한 구현 예에서, 재조합 미생물은 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함한다. 특정한 구현 예에서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드는 (i) SEQ ID NOS:35-50으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시의 조건하에서 SEQ ID NOS:35-50으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함한다.
본 발명의 구현 예는 또한 일반적으로 적합한 단당류 또는 올리고당 근원으로 첫 번째 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생성하는 방법에 관한 것으로, 여기서 상기 첫 번째 재조합 미생물은 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드, 및 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하며, 상기 폴리뉴클레오티드의 적어도 하나는 외인성이어서 범용화학제품 또는 그의 중간체를 생성한다. 특정한 구현 예에서, 적합한 단당류 또는 올리고당의 근원이 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있는 두 번째 재조합 미생물을 포함한다. 특정한 구현 예에서, 바이오매스-유래 다당류가 알지네이트 및 펙틴으로부터 선택된다.
본 발명의 구현 예는 또한 일반적으로 바이오매스-유래 다당류로 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생성하는 방법에 관한 것이며 여기서, 상기 재조합 미생물은 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있고, 또한 상기 재조합 미생물은 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드; 및 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하며, 여기서 상기 폴리뉴클레오티드의 적어도 하나는 외인성이어서 범용화학제품 또는 그의 중간체를 생성한다. 특정한 구현 예에서, 바이오매스-유래 다당류는 알지네이트 및 펙틴으로부터 선택된다.
본 발명의 구현 예는 또한 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드; 및 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 포함하는 재조합 미생물에 관한 것이다. 특정한 구현 예에서, 재조합 미생물은 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있다.
특정한 구현 예에서, 상기 미생물은 아세토박터 아세티(Acetobacter aceti), 아크로모박터(Achromobacter), 아시디필리움(Acidiphilium), 아시네토박터(Acinetobacter), 악티노마두라(Actinomadura), 악티노플래인(Actinoplanes), 애로피룸 퍼닉스(Aeropyrum pernix), 아그로박테리움(Agrobacterium), 알칼리진(Alcaligenes), 아나나스 코모수스(Ananas comosus)(M), 아스로박터(Arthrobacter), 아스파질러스 니거(Aspargillus nige), 아스파질러스 오리제(Aspargillus oryze), 아스파질러스 멜레우스(Aspergillus melleus), 아스파질러스 퍼브루엔투스(Aspergillus pulverulentus), 아스파질러스 사이토이(Aspergillus saitoi), 아스파질러스 소지(Aspergillus sojea), 아스파질러스 우사이이(Aspergillus usamii), 바실러스 알칼로필러스(Bacillus alcalophilus), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 브레비스(Bacillus brevis), 바실러스 설쿠란스(Bacillus circulans), 바실러스 클로시이(Bacillus clausii), 바실러스 렌터스(Bacillus lentus), 바실러스 리첸니포미스(Bacillus licheniformis), 바실러스 마세란스(Bacillus macerans), 바실러스 스티아로설모필러스(Bacillus stearothermophilus), 바실러스 서브티리스(Bacillus subtilis), 비피도박테리움(Bifidobacterium), 브레비바실러스 브레비스(Brevibacillus brevis), 버크홀데리아 세파시아(Burkholdeha cepacia), 캔디다 실린드라세아(Candida cylindracea), 캔디다 루고사(Candida rugosa), 칼리카 파파야 (Carica papaya)(L), 셀룰로시미크로비움(Cellulosimicrobium), 세팔로스포리움(Cephalospohum), 채토미움 에라티쿰(Chaetomium erraticum), 채토미움 그라사일(Chaetomium gracile), 클로스트리디움(Clostridium), 클로스트리디움 브티리쿰(Clostridium butyricum), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 클로스트리디움 설모셀룸(Clostridium thermocellum), 코리네박테리움 (Corynebacterium)(글루타미쿰), 코리네박테리움 에피시엔스(Corynebacterium efficiens), 이스체리키아 콜라이(Escherichia coli), 엔테로카쿠스(Enterococcus), 어위나 크리산테미(Erwina chrysanthemi), 글리코노박터(Gliconobacter), 글루콘아세토박터(Gluconacetobacter), 할로아큘라(Haloarcula), 휴미콜라 인솔엔스(Humicola insolens), 휴미콜라 엔솔렌스(Humicola nsolens), 키타사토스포라 세태(Kitasatospora setae), 클렙실라(Klebsiella), 클렙실라 옥시토카(Klebsiella oxytoca), 클루이브로마이세스(Kluyveromyces), 클루이브로마이세스 플래길리스(Kluyveromyces fragilis), 클루이브로마이세스 락티스(Kluyveromyces lactis), 코쿠리아(Kocuria), 락트락티스(Lactlactis), 락토바실러스(Lactobacillus), 락토바실러스 퍼멘툼(Lactobacillus fermentum), 락토바실러스 세이크(Lactobacillus sake), 락토코쿠스(Lactococcus), 락토코쿠스 락티스(Lactococcus lactis), 류코노스톡(Leuconostoc), 메틸오시티스(Methylocystis), 메탄노로버스 시실리애(Methanolobus siciliae), 메탄노게니움 오가노필룸(Methanogenium organophilum), 메탄노박테리움 브라이언타이(Methanobactehum bryantii), 마이크로박테리움 임페리얼리(Microbacterium imperiale), 마이크로코쿠스 라이소데익티쿠스(Micrococcus lysodeikticus), 마이크로루나투스(Microlunatus), 뮤콜자바니쿠스(Mucor javanicus), 마이코박터(Mycobacterium), 마이로테시움(Myrothecium), 나이트로박터(Nitrobacter), 나미트로소모나스(Nitrosomonas), 노카디아(Nocardia), 파파야 카리카(Papaya carica), 페디오코쿠스(Pediococcus), 페디오코구스 할로필러스(Pediococcus halophilus), 페니실리움(Penicillium), 페니실리움 카멤버티(Penicillium camemberti), 페니실리움 시트리넘(Penicillium citrinum), 페니실리움 에머소나이(Penicillium emersonii), 페니실리움 로퀘포티(Penicillium roqueforti), 페니실리움 릴락티눔(Penicillum lilactinum), 페니실리움 멀티컬러(Penicillum multicolor), 파라코쿠스 판토트로퍼스(Paracoccus pantotrophus), 프로피온니박테리움(Propionibacterium), 수도모나스(Pseudomonas), 수도모나스 플루오레센스(Pseudomonas fluorescens), 수도모나스 데니트리피칸스(Pseudomonas denithficans), 필오코쿠스(Pyrococcus), 필오코쿠스 퓨리오서스(Pyrococcus furiosus), 필오코쿠스 호리코사이(Pyrococcus hohkoshii), 리조비움(Rhizobium), 리조뮤콜 미헤이(Rhizomucor miehei), 리조뮤콜 퓨실루스 린트(Rhizomucor pusillus Lindt), 리조퍼스(Rhizopus), 리조퍼스 델레마(Rhizopus delemar), 리조퍼스 자폰이쿠스(Rhizopus japonicus), 리조퍼스 니비우스(Rhizopus niveus), 리조퍼스 오리재(Rhizopus oryzae), 리조퍼스 올리고스포러스(Rhizopus oligosporus), 로도코쿠스(Rhodococcus), 사카로마이시스 세레비지애(Sccharomyces cerevisiae), 스클레로티나 리버티나(Sclerotina libertina), 스핑고박테리움 멀티보룸(Sphingobacterium multivorum), 스핑고비움(Sphingobium), 스핑고모나스(Sphingomonas), 스트렙토코쿠스(Streptococcus), 스트렙토코쿠스 서모필루스 Y-1(Streptococcus thermophilus Y-1), 스트렙토마이시스(Streptomyces), 스트렙토마이시스 그리세우스(Streptomyces griseus), 스트렙토마이시스 리비단스(Streptomyces lividans), 스트렙토마이시스 무리누스(Streptomyces murinus), 스트렙토마이시스 루비기노수스(Streptomyces rubiginosus), 스트렙토마이시스 바이오라세오루버(Streptomyces violaceoruber), 스트렙토버티실리움 모바랜스(Streptoverticillium mobaraense), 테트라제노코쿠스(Tetragenococcus), 서머스(Thermus), 티오스패라 판토트로파(Thiosphaera pantotropha), 트라미테스(Trametes), 트리초더마(Trichoderma), 트리초더마 롱지브라키아툼(Trichoderma longibrachiatum), 트리초더마 리에시이(Trichoderma reesei), 트리초더마 비리데(Trichoderma viride), 트리초스포론 페니실라툼(Trichosporon penicillatum), 비브리오 알지노리티쿠스(Vibrio alginolyticus), 잔소모나스(Xanthomonas), 이스트(yeast), 자이고사카로마이시스 룩사이(Zygosaccharomyces rouxii), 자이모모나스(Zymomonas), 및 자미모모누스 모빌리스(Zymomonus mobilis)로부터 선택된다.
본 발명의 구현 예는 또한 여기에 기술된 임의의 방법 또는 재조합 미생물에 의해 생성된 범용화학제품에 관한 것이다. 특정한 구현 예는 또한 여기에 기술된 임의의 범용화학제품 및 정제소에서 생성된 석유 산물을 포함하는 혼합된 범용화학제품을 포함한다. 특정한 구현 예에서, 범용화학제품이 이소옥탄, 2-에틸헥산, 및 2-부틸-옥탄으로부터 선택된다. 특정한 구현 예에서, 정제소에서 생성된 석유 산물이 가솔린, 제트 연료, 및 디젤 연료로부터 선택된다.
본 발명은 또한 (a)여기에 기술된 방법 또는 재조합 미생물에 의해 생산된 임의의 범용화학제품을 정제소에서 생성된 석유 산물과 혼합하여 정제소에서 생성된 석유 산물로 농축된 범용화학제품을 생성함을 포함하는 정제소에서 생성된 석유 산물로 농축된 범용화학제품을 생성하는 방법에 관한 것이다.
발명의 상세한 설명
본 발명의 구현 예는 다양한 범용화학제품 또는 바이오연료의 생산에서 다양한 알데히드 및/또는 케톤을 사용하여 재조합 미생물을 제조할 수 있다는 발견에 관한 것이다. 예를 들어, 알돌라제 활성을 갖는 효소를 인코딩하는 하나 또는 그 이상의 외인성 폴리뉴클레오티드 및 알코올 디하이드로게나제 활성을 갖는 효소를 인코딩하는 하나 또는 그 이상의 외인성 폴리뉴클레오티드의 삽입은 미생물로 하여금 알데히드 및/또는 케톤을 다양한 범용화학제품 또는 그의 중간체로 전환할 수 있게 해준다. 특정한 양상에서, 이들 범용화학제품은 다음에 화학적 또는 효소학적으로 바이오연료를 포함하는 다른 범용화학제품으로 전환될 수 있다. 예를 들어, 그러한 바이오연료는 예를 들어 이소옥탄 및 2-에틸헥산등의 중쇄 내지 장쇄의 알칸을 포함할 수 있다.
특정한 구현 예에서, 여기에 제공된 상기 방법 및 재조합 미생물은 다양한 범용화학제품, 특히 중쇄 내지 장쇄의 탄화수소를 생성하는데 사용할 수 있다. 예를 들어, 본 발명의 재조합 미생물은 일반적으로 하기의 반응을 촉매하는데 사용할 수 있다:
Figure pct00004
상기 식에서,
R1은 CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2으로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2으로 이루어진 그룹으로부터 선택되고,
n은 0 내지 30이고 임의의 해당하는 알칸이 그것으로부터 생성된다.
전형적으로, 상기에서 예시된 반응에서 왼쪽으로부터 오른쪽으로의 첫 번째 화합물은 같거나 또는 다를 수 있는 두 개의 알데히드 및/또는 케톤의 농축으로부터 생성되며 이들 반응은 여기에 기술되고 당업계에 알려진 바와 같이 알돌라제 활성을 갖는 효소에 의해 촉매될 수 있다.
알돌라제 농축 단계 후, 상기에 예시된 반응에서 첫 번째 단계는 자발적으로 일어나거나 또는 디하드라타제에 의해 촉매될 수 있다. 상기 두 번째 반응은 내생적 이중 결합 리덕타제에 의해 촉매될 수 있거나 또는 외인성 이중 결합 리덕타제 첨가에 의해 강화될 수 있다. 디올 또는 알코올을 생성하는 세 번째 반응은 여기에 기술되고 당업계에 알려진 바와 같이 알코올 디하이드로게나제에 의해 촉매될 수 있다. 따라서, 본 발명의 특정한 재조합 미생물은 외인성 알돌라제, 임의로 외인성 이중 결합 리덕타제 및/또는 외인성 알코올 디하이드로게나제를 포함할 수 있다.
상기 주지된 바와 같이, 이소옥탄으로 알려진 2,2,4-트리메틸펜탄은 옥탄 평가 척도에서 100 포인트를 정의하며 가솔린의 중요 성분을 나타내는 옥탄이성질체이다. 이 분자의 생체 내(in vivo) 생물 합성의 구체적인 일 예로서, 이소옥탄을 생성하는 생합성 경로는 이소부틸알데히드의 근원에 접근하는 재조합 미생물에서 초기화될 수 있다. 특정한 구현 예에서, 이소부틸알데히드는 여기에 기술된 바와 같이 이소부틸알데히드 생합성 경로를 포함하며 또한 적합한 단당류 또는 올리고당을 이소부틸알데히드로 전환할 수 있는 재조합 미생물로부터 수득될 수 있다.
간단하게, 이소부틸알데히드의 근원에 관계없이, 본 발명의 재조합 미생물은 2개 분자의 이소부틸알데히드를 농축하는데 사용되어 알돌라제 활성을 갖는 외인성 효소를 포함하는 재조합 미생물에 의해 생체 내에서 촉매되는 3-하이드록시-2,2,4-트리메틸 펜타날을 형성한다. 특정한 구현 예에서, 3-하이드록시-2,2,4-트리메틸 펜타날은 그 후 알코올 디하이드로게나제(Adh) 활성을 갖는 외인성 효소를 포함하는 재조합 미생물에 의해 쉽게 생체 내에서 2,2,4-트리메틸-1,3-펜탄디올로 환원될 수 있다. 따라서, 특정한 구현 예에서, 알돌라제 효소를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드 및 알코올 디하이드로게나제 효소를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드를 포함하는 재조합 미생물은 사용되어 이소부틸알데히드 근원으로부터 3-하이드록시-2,2,4-트리메틸 펜타날 및 2,2,4-트리메틸-1,3-펜탄디올을 생성할 수 있으며, 이들은 그 후 추가로 이소옥탄으로 전환될 수 있다.
이소옥탄 생산의 마지막 단계에서, 필요에 따라 2,2,4-트리메틸-1,3-펜탄디올은 그 후 화학 또는 효소학적 공정과 같은 다양한 공정에 의해 2,2,4-트리메틸펜탄, 또는 이소옥탄으로 전환될 수 있다. 그런 공정의 일 예는 여기에 기술되고 당업계에 알려진 바와 같이 "수소처리(hydrotreating)"를 포함한다.
알데히드 또는 케톤을 범용화학제품으로 전환하는 부가적인 예로서, 여기서 제공되는 재조합 미생물은 2개 분자의 부틸알데히드를 농축하여 3-하이드록시-2-에틸헥사날을 형성하는데 사용할 수 있으며, 이들은 알돌라제 활성을 갖는 외인성 효소를 포함하는 재조합 미생물에 의해 생체 내에서 촉매 되는 것으로 나타났다. 그 후 3-하이드록시-2-에틸헥사날은 여기에 기술된 바와 같이 자발적으로 또는 효소학적으로 탈수화하여 2-에틸-2-헥센-1-알을 형성할 수 있다. 특정한 구현 예에서, 2-에틸-2-헥센-1-알은 그 후 연속적으로 환원되어 2-에틸헥사날 및 2-에틸헥사놀을 형성할 수 있으며, 이들은 각각 이중 결합 리덕타제 및 알코올 디하이드로게나제에 의해 촉매된다(실시예 4 참조). 마지막 단계에서, 필요에 따라, 2-에틸헥사놀은 화학 또는 효소학적 전환(예, 수소 처리)과 같은 당업계에 알려지고 여기에 기술된 바와 같은 기술에 따라 2-에틸헥산으로 전환될 수 있다.
따라서, 특정한 구현 예에서, 알돌라제 효소를 인코딩하는 하나 또는 그 이상의 외인성 폴리뉴클레오티드 및 알코올 디하이드로게나제 효소를 인코딩하는 하나 또는 그 이상의 외인성 폴리뉴클레오티드를 포함하는 재조합 미생물은 부틸알데히드 근원으로부터 2-에틸-2-헥센-1-알 및 2-에틸헥사놀을 합성하는데 사용할 수 있으며, 이들은 그 후 2-에틸헥산으로 전환될 수 있다. 특정한 구현 예에서, 여기에 기술된 바와 같이 부틸알데히드는 부틸알데히드 생합성 경로를 포함하며 또한 단당류 또는 올리고당을 부틸알데히드로 전환할 수 있는 재조합 미생물로부터 수득될 수 있다.
여기에 기술된 방법은 다른 바이오연료보다 상당히 유리한 점을 가진 바이오연료를 생산한다. 구체적으로, 이소옥탄 및 다른 중쇄 내지 장쇄 알칸은 에탄올 및 부탄올과 같은 현존하는 공통 바이오연료에 비해 다수의 중요한 이점을 제공하며, 미래에 가솔린, 디젤, 등유, 중유등의 석유 기반 연료의 매력적이고 장기적인 대체물이다. 일 예로서, 이소옥탄 및 다른 중쇄 내지 장쇄 알칸 및 알코올은 모든 석유 산물 및 특히 제트 연료의 주요 성분이며 따라서, 우리가 생산하는 알칸은 현존하는 엔진에 직접 사용될 수 있다. 추가의 예로서, 중쇄 내지 장쇄 알코올은 에탄올보다 더 양호한 연료이고 가솔린에 거의 버금가는 에너지 밀도를 갖는다. 상기에 주지된 바와 같이, 이소옥탄은 가솔린의 주요 성분이다.
또 다른 예로서, n-알칸은 가솔린, 디젤, 등유 및 중유를 포함하는 모든 기름 산물의 주요 성분이다. 재조합 미생물은 사용되어 예를 들어 C7 내지 C20 이상의 상이한 탄소 길이 범위: 가솔린(예, 자동차)의 경우 C7, 디젤(예, 자동차, 기차 및 배)의 경우 C10 내지 C15 및 등유(예, 비행기 및 배)의 경우 C8 내지 C16 및 모든 중유에 대해서 다른 탄소 길이 범위를 지닌 n-알칸을 생성할 수 있다.
본 발명의 특정한 구현 예는 일반적으로 바이오매스-유래 공급 원료로부터 이소옥탄 및 중쇄 내지 장쇄 알칸을 생성하여 바이오연료의 낮은 탄소원을 제공하는 방법에 관한 것이다. 예를 들어, 바이오매스로부터 범용화학제품 또는 바이오연료(예, 이소옥탄)를 생산하는데 있어서, 적합한 바이오매스-유래 단당류 또는 올리고당은 먼저 유일한 탄소원으로서 펙틴 또는 알기네이트등의 바이오매스-유래 다당류에서 성장할 수 있는 미생물과 같은 임의의 입수가능한 근원으로부터 직접 수득할 수 있다. 다음에 이러한 단당류 또는 올리고당은 단당류 또는 올리고당을 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물과 접촉시킴으로써 알데히드 및/또는 케톤으로 전환될 수 있다.
다음에 그러한 재조합 미생물에 의해 생산되는 알데히드 및/또는 케톤은 알데히드 및/또는 케톤을 본 발명의 재조합 미생물과 접촉시킴으로써 범용화학제품 또는 바이오연료로 전환될 수 있으며, 상기 미생물은 알돌라제 효소 및 알코올 디하이드로게나제 효소를 포함한다. 특정한 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물은 알돌라제 효소 및 알코올 디하이드로게나제 효소를 포함하는 재조합 미생물과 같거나 또는 다를 수 있다.
당업자에게 명확한 다른 용도 중에서, 여기에 기술된 상기 방법과 재조합 미생물에 의해 생성된 범용화학제품 및 바이오연료는 전통적인 정제방법에 의해 생산된 석유 산물과 혼합하기 위한 현존 석유 정제 시설에 의해 사용하여 범용화학제품 강화된 정제소 생산 석유 제품을 생성한다. 상기에 기술된 바와 같이, 이러한 목적을 위해 연료 생산자는 현존하는 기반 구조(정제소, 파이프라인, 급유기)를 통해 혼합되고 분배될 수 있는 실질적으로 유사한 낮은 탄소 연료를 찾는다. 탄화수소로서, 본 방법에 따라 생산된 범용화학제품은 석유 유래 연료와 실질적으로 유사하고, 온실 가스 배출을 석유 유래 연료로부터의 80% 이상을 감소시키며, 또한 기름 및 가스 산업의 현존하는 기반 구조에 호환성이 있다.
예를 들어, 다른 것들 중에서 이소옥탄을 포함하는 여기에 생성된 범용화학제품은 가솔린, 제트 및 디젤 연료와 같은 정제소에서 생산된 석유 산물에 직접적으로 혼합할 수 있다. 가솔린, 제트 및 디젤 연료에 대해 블랜드스톡(blendstock)으로서 생물학적으로 생산된 범용화학제품을 사용하여, 정제소는 온실 가스 방출을 80% 이상 감소시킬 수 있다.
본 발명의 실시는, 구체적으로 다르게 언급되지 않는 이상, 당업계의 기술범위 내에서 분자 생물학 및 재조합 DNA 기술의 통상적인 방법을 사용할 것이며, 이들의 대부분은 예시목적으로 하기에 설명된다. 이들 기술은 다음 문헌에 상세히 설명되어 있다. 예를 들어, Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Maniatis et al., Molecular Cloning: A Laboratory Manual (1982); DNA Cloning: A Practical Approach, vol . I &11 (D. Glover, ed.); Oligonucleotide Synthesis (N. Gait, ed., 1984); Nucleic Acid Hybridization (B. Hames &S. Higgins, eds., 1985); Transcription and Translation (B. Hames &S. Higgins, eds., 1984); A Practical Guide to Molecular Cloning (B. Perbal, ed., 1984)를 참조한다.
정의
별도로 정의되어 있지 않다면, 여기서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 숙련된 기술자에 의해 공통적으로 이해되는 것과 같은 의미를 갖는다. 여기에 기술된 것과 유사하거나 또는 동일한 임의의 방법 및 재료는 본 발명의 실시 또는 검사에 사용될 수 있음에도 불구하고, 바람직한 방법 및 재료가 기술되어 있다. 본 발명의 목적에 위해, 하기의 용어는 아래에 기술되어 있다. 여기에 언급된 모든 문헌은 전체로서 참고로 포함된다.
관사인 "a" 및 "an"은 관사의 문법적 객체의 하나 또는 하나 이상(즉, 적어도 하나)을 언급할 때 여기서 사용된다. 예로서, "an element"는 하나의 요소 또는 하나 이상의 요소를 의미한다.
"약"이라는 용어는 참고 분량(quantity), 레벨, 값, 숫자, 빈도, 백분율, 치수(dimension), 크기, 양(amount), 무게 또는 길이에 대해서 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1 % 만큼 변화하는 분량, 레벨, 값, 숫자, 빈도, 백분율, 치수, 크기, 양(amount), 무게 또는 길이를 의미한다.
참고 폴리뉴클레오티드 또는 폴리펩티드 서열의 단편에 적용되는 용어 "생물학적으로 활성이 있는 단편"은 참고 서열 활성의 적어도 약 0.1, 0.5, 1, 2, 5, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99, 100, 110, 120, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000% 또는 그 이상을 갖는 단편을 언급한다.
"참고 서열"이라는 용어는 일반적으로 여기에 기술된(예, 알돌라제, 알코올 디하이드로게나제, 디하이드라타제, 디올 디하이드로게나제, 이중 결합 리덕타제 등) 생물학적 활성을 갖는 임의의 폴리펩티드 또는 효소의 핵산 코딩 서열 또는 아미노산 서열을 지칭하고, 그러한 "야생형" 서열은 SEQ ID NOS:1-96 및 215-222로 나타낸 폴리뉴클레오티드 및 폴리펩티드 참고 서열 및 SEQ ID NOS:223-260으로 나타낸 이들의 모티프 서열을 포함한다. 참고 서열은 여기에 기술된 서열의 자연적으로 발생하는 기능적 변형체(즉, 오르토로그 또는 호모로그)를 또한 포함할 수 있다.
본 발명의 범주에는 길이 적어도 약 18, 19, 20, 21 , 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 500, 600 또는 그 이상의 연속적인 뉴클레오티드 또는 아미노산 잔기인 생물학적 활성 단편을 포함하며, 그들 사이의 모든 정수를 포함하며, 참고 폴리뉴클레오티드 또는 폴리펩티드의 효소활성을 갖는 폴리펩티드를 포함하거나 또는 인코딩한다. 대표적인 생물학적으로 활성이 있는 단편은 일반적으로 상호작용, 예를 들어, 분자 내 또는 분자 간의 상호작용에 참여한다. 분자 간의 상호작용은 특이적 결합 상호작용 또는 효소학적 상호작용일 수 있다. 효소학적 상호작용 및 활성의 예는 여기에 기술된 다른 것들 중에서, 알돌라제 활성, 알코올 디하이드로게나제 활성, 디하드라타제 활성, 라이아제 활성, 트랜스포터 활성, 이소머라제 활성, 키나제 활성을 포함한다. 생물학적으로 활성이 있는 단편은 전형적으로 여기에 기술되고 당업계에 알려진 바와 같이 하나 또는 그 이상의 활성 부위 또는 효소학적/결합 모티프를 포함한다.
"생체분자"라는 용어는 살아있는 생명체에 의해 생성되는 유기 분자를 일반적으로 지칭하고, 단백질, 다당류 및 핵산과 같은 거대 중합 분자(생체고분자) 및 주요 2차 대사산물, 지질, 인지질, 당지질, 스테롤, 글리세로리피드, 비타민 및 호르몬과 같은 소분자를 포함한다. 다른 요소가 생체고분자에 포함될 수 있음에도 불구하고 유기 분자(예, 생체고분자)는 주로 탄소, 수소, 질소 및 산소 및 보다 적은 양으로, 인 및 황으로 이루어져 있다.
"생체고분자"라는 용어는 일반적으로 공유 화학 결합에 의해 연결된 반복되는 구조적 단위로 이루어진 대 분자 또는 거대분자를 지칭하며 이들은 살아있는 생명체에 의해 생성될 수 있다. 생체고분자의 예는 제한 없이 다당류, 핵산 및 단백질을 포함한다.
"코딩 서열"이라는 용어는 유전자의 폴리펩티드 생성물의 코드에 기여하는 임의의 핵산 서열을 의미한다. 대조적으로, "비코딩 서열"이라는 용어는 유전자의 폴리펩티드 생성물의 코드에 관여하지 않는 임의의 핵산 서열을 지칭한다.
본 명세서를 통해서, 문맥이 다른 것을 필요로 하지 않는다면, "포함하다(comprise)," "포함하다(comprises)" 및 "포함하는(comprising)"라는 용어는 언급된 단계 또는 요소 또는 단계 또는 요소의 그룹의 포함을 암시하도록 이해될 것이고, 임의의 다른 단계 또는 요소 또는 단계 또는 요소의 그룹의 배제를 암시하지는 않는다.
"로 이루어진(consisting of)"이라는 용어는 제한적이지만 문구 "로 이루어진"을 수반하는 어느 것도 포함함을 의미한다. 따라서 문구 "로 이루어진"은 열거된 요소가 필요로 되고 의무적인 것을 의미하고 다른 요소가 존재하지 않는다는 것을 의미한다.
"실질적으로 이루어진"이라는 문구는 구 뒤로 나타낸 임의의 요소를 포함함을 의미하고 열거된 요소를 위한 명세서에서 명시된 활성 또는 작용을 방해하지 않거나 기여하는 다른 요소에 제한적이다. 따라서, "실질적으로 이루어진"이라는 문구는 열거된 요소가 필요로 하고 의무적인 것을 의미하고 다른 요소는 선택적이라는 것을 의미하고 다른 요소가 열거된 요소의 활성과 작용에 영향을 주는지 여부에 의존하여 존재할 수도 있고 존재하지 않을 수도 있다.
"상보적인" 및 "상보성"이라는 용어는 염기-쌍 법칙에 의해 관계하는 폴리뉴클레오티드(예, 뉴클레오티드 서열)를 지칭한다. 예를 들어, 서열 "A-G-T"는 서열 "T-C-A"와 상보적이다. 상보성은 "부분적"일 수 있어서 핵산 염기의 오직 일부분만이 염기 쌍 법칙에 따라 부합 된다. 또는 핵산 간에 "완전한" 또는 "전체" 상보성일 수 있다. 핵산 가닥 간의 상보성 정도는 핵산 가닥간의 혼성화 효율 및 세기에 상당한 영향을 가지고 있다.
"에 상응하다" 또는 "에 상응하는"은 (a) 참고 폴리뉴클레오티드 서열의 전체 또는 일부와 실질적으로 동일하거나 또는 상보적인 뉴클레오티드 서열을 갖거나 펩티드 또는 단백질에서 아미노산 서열과 동일한 아미노산 서열을 인코딩하는 폴리뉴클레오티드를 의미하고, 또는 (b) 참고 펩티드 또는 단백질에서 아미노산 서열과 실질적으로 동일한 아미노산 서열을 갖는 펩티드 또는 폴리펩티드를 의미한다.
"유도체"라는 용어는 예를 들어, 다른 화학 부분(예, 페길화(pegylation))과 결합 또는 혼합 또는 당업계에서 이해되는 바와 같이 번역 후 변형에 의한 변형에 의해 기본 서열로부터 유래된 폴리펩티드를 의미한다. "유도체"라는 용어는 그것의 범주내에 기능적으로 동일 분자를 제공하는 첨가 또는 결실을 포함하는 모체 서열에 만들어진 변형을 포함한다.
"효소 활성화 조건"은 효소가 기능하도록 허락하는 환경(즉, 온도, pH, 저해물질의 결여와 같은 인자)에서 입수가능한 임의의 필요한 조건을 의미한다. 효소 활성화 조건은 시험관과 같은 in vitro , 또는 세포내에서와 같은 in vivo일수 있다.
여기서 사용되는 "기능" 및 "기능성의" 등의 용어는 생물학적 또는 효소학적 기능을 지칭한다.
"유전자"는 유전의 단위로서 염색체상에서 특정한 위치를 차지하고 전사 및/또는 번역 조절 서열 및/또는 코딩 지역 및/또는 비번역 서열(즉, 인트론, 5' 및 3' 비번역 서열)로 이루어져 있다.
"상동성"은 보존적 치환과 동일한 또는 구성하는 아미노산의 퍼센트 수를 지칭한다. 상동성은 참고로 여기에 포함된 GAP(Deveraux 등, 1984, Nucleic Acids Research 12, 387-395)과 같은 서열 비교 프로그램을 사용하여 결정될 수 있다. 이러한 방식으로 여기에 인용된 서열과 유사한 또는 실질적으로 다른 길이의 서열은 갭을 정렬 내에 삽입하여 비교될 수 있고 예를 들어, 그러한 갭은 GAP에 의해 사용된 비교 알고리즘을 사용하여 결정된다.
"숙주 세포"라는 용어는 임의의 재조합 벡터(들) 또는 본 발명의 분리된 폴리뉴클레오티드의 수령자일 수 있거나 수령자인 개개의 세포 또는 세포 배양체를 포함한다. 숙주 세포는 단일 숙주 세포의 자손을 포함하고 상기 자손은 자연적, 사고적, 고의적인 돌연변이 및/또는 변화에 기인하여 본래의 모체 세포와 (형태학적 또는 전체 DNA 보체에서) 완전히 동일할 필요는 없다. 숙주세포는 in vivo 또는 in vitro에서 재조합 벡터 또는 본 발명의 폴리뉴클레오티드로 형질 감염(transfected), 형질전환, 감염된(infected) 세포를 포함할 수 있다. 본 발명의 제조합 벡터를 포함하는 숙주 세포는 재조합 숙주 세포, 재조합 세포, 또는 재조합 미생물이다.
"분리된"은 그것의 자연 상태에서 그것을 정상적으로 동반하는 성분으로부터 실질적으로 또는 본질적으로 자유로운 물질을 의미한다. 예를 들어, 여기서 사용되는 "분리된 폴리뉴클레오티드"는 자연적으로 발생하는 상태에서 측면에 위치한 서열로부터 정제된 폴리뉴클레오티드, 예를 들어, DNA 단편에 정상적으로 인접한 서열로부터 제거된 DNA 단편을 지칭한다. 이와는 달리, 여기서 사용되는 "분리된 펩티드" 또는 "분리된 폴리펩티드" 등은 자연 세포 환경으로부터 및 세포의 다른 성분과 함께로부터 펩티드 또는 폴리펩티드를 in vitro에서 분리 및/또는 정제함을 지칭한다. 즉, 그것은 in vivo 물질과 함께하지 않는다.
"향상하다", "향상하는", "증가시키다" 또는 "증가시키는"은 하나 또는 그 이상의 재조합 미생물이 변형되지 않은 미생물 또는 다르게 변형된 미생물과 같은 대조군 미생물과 비교하여 주어진 산물 또는 분자(예, 범용화학제품, 바이오연료, 또는 그의 중간체 생성물)를 더 많이 생성하는 능력을 의미한다. "증가된" 양은 전형적으로 "통계학적으로 유의한" 양이고 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 변형되지 않은 미생물 또는 다르게 변형된 미생물에 의해 생성되는 양의 그 이상의 배수(모든 정수 및 예를 들어, 1.5, 1.6, 1.7. 1.8 등 사이의 소수점를 포함)인 증가를 포함할 수 있다. 증가된 양은 당업계의 일상화된 기술에 따라 측정될 수 있다. 예를 들어, 범용화학제품의 "증가된" 양은 이론적인 최대 산출량의 백분율에 따라 측정될 수 있다. 예를 들어, 어떤 구현 예에서, 본 발명의 방법은 타겟 분자(예, 범용화학제품)의 산출량을 이론적인 최대 산출량의 적어도 약 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 88%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%로 향상시킬 수 있다. 특정한 구현 예에서, 상기 방법은 상기와 같은 재조합 미생물을 대조군 또는 다른 조건하에서 항온처리하거나 또는 대조군(예, 변형되지 않은 또는 다르게 변형된) 미생물을 같은 또는 유사한 조건하에서 항온처리함과 비교하여 타겟 분자의 이론적인 최대 산출량의 백분율을 적어도 약 10% (예, 이론적인 최대 산출량의 약 30% 내지 약 40%), 15% (예, 이론적인 최대 산출량의 약 30% 내지 약 45%), 20%, 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80%, 또는 90% 증가시킴으로써 특징 지워질 수 있다.
"줄이다(reduce)"라는 용어는 일반적으로 진단 업계의 일상적인 기술에 따라 측정되는 NADH 또는 아세테이트 생산과 같은 관련 세포 내 반응에서의 "감소하다(decrease)"에 관한 것이다. 다른 관련 세포 반응(in vivo 또는 in vitro)은 당업자에게 분명할 것이다. 반응에서 "감소하다"는 변형되지 않은 미생물 또는 다르게 변형된 미생물에 의해, 또는 다른 조건에서 성장하는 미생물에 의해 생성되는 반응과 비교하여 "통계학적으로 유의한" 양일 수 있고, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% 감소를 포함할 수 있고, 이들 사이의 모든 정수를 포함한다.
"로부터 수득된"은 예를 들어, 폴리뉴클레오티드 추출물 또는 폴리펩티드 추출물과 같은 샘플이 바람직한 생명체, 통상적으로는 미생물과 같은 특정 근원으로부터 분리 또는 유래되는 것을 의미한다. "로부터 수득된"은 폴리뉴클레오티드 또는 폴리펩티드 서열이 특정 생명체 또는 미생물로부터 분리되거나 또는 유래되는 상황을 또한 지칭하기도 한다. 예를 들어, 벤즈알데히드 라이아제를 인코딩하는 폴리뉴클레오티드 서열은 수도모나스와 같은 다양한 원핵 또는 진핵 미생물로부터 분리될 수 있다. 다른 예로서, 알돌라제 효소를 인코딩하는 폴리뉴클레오티드 서열은 털모토가 마리티마 및 이스체리키아 콜라이 DH 1OB와 같은 다양한 원핵 또는 진핵 미생물로부터 분리될 수 있다.
여기서 사용되는 "작동적으로 연결된"이라는 용어는 유전자를 유전자의 전사 및 경우에 따라 번역을 조절하는 프로모터의 조절적인 통제하에 두는 것을 의미한다. 이종 기원의 프로모터/구조 유전자 조합의 구축에 있어서, 일반적으로 유전적 서열 또는 프로모터를 유전자 전사 시작 부위로부터 떨어진 곳에 위치시킴이 바람직하며, 이들 거리는 그것의 자연적 구성에서 유전적 서열 또는 프로모터 및 그것이 조절하는 상기 유전자 사이의 거리와 대략 같고 상기 유전자는 유전적 서열 또는 프로모터가 유래되는 유전자이다. 당업계에 알려져 있는 바와 같이, 이들 거리에서의 약간의 변화는 기능의 상실 없이 수용될 수 있다. 유사하게, 조절하에 위치한 이종 기원의 유전자에 대한 조절 서열 요소의 바람직한 위치는 그것의 자연적 구성에서 상기 요소의 위치에 의해 정의된다; 즉 그것이 유래한 유전자. "구조적인 프로모터"는 전형적으로 대다수의 조건하에서 활성이 있는 즉, 전사를 촉진한다. 유도성의 프로모터"는 전형적으로 어떤 조건하에서만 활성이 있다. 예를 들어, 주어진 분자 인자(예, IPTG)의 존재하에서 또는 주어진 환경 조건(예, CO2 농도, 영양분 레벨, 빛, 열)하에서 활성이 있다. 그러한 조건의 부재하에서는 유도성의 프로모터는 전형적으로 전사 활성의 현저하고 측정될 수 있는 레벨을 허용하지 않는다.
여기에 기술된 바와 같이 상술한 "폴리뉴클레오티드" 또는 "핵산"은 mRNA, RNA, cRNA, rRNA, cDNA 또는 DNA를 가리킨다. 통상적으로 상기 용어는 적어도 길이상 10개의 염기의 뉴클레오티드의 중합 형태를 지칭하고 이들은 리보뉴클레오티드 또는 디옥시뉴클레오티드 또는 이들 두 뉴클레오티드 타입의 변형체를 나타낸다. 상기 용어는 DNA의 단일 및 이중 가닥 형태를 포함한다.
당업자들에게 이해되는 바와 같이, 본 발명의 폴리뉴클레오티드 서열은 단백질, 폴리펩티드, 펩티드 등을 발현하거나 또는 발현하도록 적응될 수 있는 게놈믹 서열, 추가의 게놈믹 서열 및 플라스미드-인코딩 서열 및 보다 작은 가공된 유전자 세그멘트를 포함할 수 있다. 이러한 세그멘트는 자연적으로 분리되거나 또는 사람의 손에 의해 합성적으로 변형될 수 있다.
폴리뉴클레오티드는 단일 가닥(코딩 또는 안티센스) 또는 이중 가닥일 수 있고, DNA(게놈믹, cDNA 또는 합성) 또는 RNA 분자일 수 있다. 부가적인 코딩 또는 비코딩 서열은 본 발명의 폴리뉴클레오티드 내에 존재할 수 있지만 그렇게 하지 않아도 된다. 폴리뉴클레오티드는 다른 분자 및/또는 지지 물질에 연결될 수 있지만 그렇게 하지 않아도 된다.
폴리뉴클레오티드는 순수한 서열을 포함할 수 있거나 또는 변형체 또는 그러한 서열의 생물학적 기능적 동등체를 포함할 수 있다. 폴리뉴클레오티드 변형체는 하기에 추가로 기술된 바와 같이 하나 또는 그 이상의 치환, 첨가, 결실 및/또는 삽입을 포함할 수 있어서 바람직하게는 인코딩된 폴리펩티드의 효소 활성이 변형되지 않은 폴리펩티드에 대하여 실질적으로 감소 되지 않으며, 또한 바람직하게는 인코딩된 폴리펩티드의 효소 활성이 변형되지 않은 폴리펩티드에 대하여 향상(예, 최적화)된다. 인코딩된 폴리펩티드의 효소 활성에 대한 효과는 일반적으로 여기에 기술된 바와 같이 평가될 수 있다.
특정한 구현 예에서, 본 발명은 여기에 기술된 다른 것들 중에서 알돌라제 또는 알코올 디하이드로게나제에 동일하거나 또는 상보적인 다양한 길이의 연속적인 서열의 스트랫치(stretch)를 포함하는 분리된 폴리뉴클레오티드를 제공하며, 여기서 분리된 폴리뉴클레오티드는 생물학적으로 활성이 있는 끝이 절단된 효소를 인코딩한다.
본 출원의 효소를 인코딩하는 뉴클레오티드 서열의 예는 전장 알돌라제 및 알코올 디하이드로게나제 뿐만 아니라 전체 길이 또는 실질적으로 전장인 이들 유전자의 뉴클레오티드 서열의 일부, 또는 그들의 전사체 또는 이들 전사체의 DNA 카피를 포함한다. 뉴클레오티드 서열의 일부는 참고 폴리펩티드의 생물학적 활성을 보유하는 폴리펩티드 일부 또는 세그멘트를 인코딩할 수 있다. 여기에서 제공된 효소의 생물학적으로 활성이 있는 단편을 인코딩하는 뉴클레오티드 서열의 일부는 적어도 약 20, 21 , 22, 23, 24, 25, 30, 40, 50, 60, 70, 80, 90, 100, 120, 150, 200, 300, 400, 500, 600, 또는 그 이상의 연속적인 아미노산 잔기, 전장 효소에 존재하는 아미노산의 거의 전체 숫자까지를 인코딩할 수 있다. 여기서 사용되는 이 문맥 및 모든 다른 문맥에서의 "중간 길이"는 101, 102, 103, 등; 151, 152, 153, 등; 201, 202, 203, 등과 같은 인용된 값 사이의 임의의 길이를 의미한다.
본 발명의 폴리뉴클레오티드는, 코딩 서열 자체의 길이에 관계없이, 프로모터, 폴리아데닐화 신호, 부가적인 제한 효소 부위, 복수의 클로닝 부위, 다른 코딩 세그멘트 등과 같은 다른 DNA 서열과 결합될 수 있어서, 그들의 전체 길이는 상당히 변화할 수 있다. 따라서 대체로 임의의 길이의 폴리뉴클레오티드 단편은 제조의 편의성 및 계획된 재조합 DNA 프로토콜에서의 용도에 의해서 바람직하게 제한받는 전체 길이를 가지고 사용될 수 있다고 고려된다.
"폴리뉴클레오티드 변형체" 및 "변형체" 등은 여기에 기술된 임의의 참고 폴리뉴클레오티드 서열 또는 유전자를 가진 실질적인 서열 존재를 나타내는 폴리뉴클레오티드, 및 여기에 기술된 폴리뉴클레오티드 참고 서열, 또는 임의의 유전자 또는 폴리펩티드의 폴리뉴클레오티드 코딩 서열과 혼성화하는 폴리뉴클레오티드를 지칭하며 상기 혼성화는 이하에 정의되고 당업계에 알려진 낮은 스트린전시, 중간 스트린전시, 높은 스트린전시 또는 매우 높은 스트린전시 조건하에서 이루어진다. 이들 용어는 또한 적어도 하나의 뉴클레오티드의 추가, 결실 또는 치환에 의해 참고 폴리뉴클레오티드와 구별되는 폴리뉴클레오티드를 포함한다. 따라서, "폴리뉴클레오티드 변형체" 및 "변형체"는 하나 또는 그 이상의 뉴클레오티드가 추가되거나 또는 결실되고 또는 다른 뉴클레오티드로 대체되는 폴리뉴클레오티드를 포함한다. 이와 관련해서, 돌연변이, 추가, 결실 및 치환을 포함하는 특정한 변화도 참고 폴리뉴클레오티드에 이루어질 수 있어서 상기의 변형된 폴리뉴클레오티드는 참고 폴리뉴클레오티드의 생물학적 기능 및 활성을 보유하거나 또는 참고 폴리뉴클레오티드에 대해서 증가된 활성을 가지고 있다(즉, 최적화된다). 폴리뉴클레오티드 변형체는 예를 들어, 여기에 기술된 참고 폴리뉴클레오티드와 적어도 50% (및 적어도 51% 내지 적어도 99% 및 그 사이의 모든 정수 백분율) 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
"폴리뉴클레오티드 변형체" 및 "변형체"라는 용어는 또한 이들 효소를 인코딩하는 자연적으로 발생하는 대립 유전자 변형체를 포함한다. 자연적으로 발생하는 변형체의 예는 대립 유전자 변형체(같은 좌), 상동체(다른 좌), 및 오르토로그(다른 생명체)를 포함한다. 이들과 같은 자연적으로 발생하는 변형체는 예를 들어, 당업계에 잘 알려진 다양한 중합효소 연쇄 반응(PCR) 및 혼성화-기반 기술을 포함하는 잘 알려진 분자생물학적 기술을 사용하여 확인 및 분리될 수 있다. 자연적으로 발생하는 변형체는 여기에 기술된 적합한 효소 활성(예, C-C 리가아제, 알돌라제, 알코올 디하이드로게나제, 리덕타제 등)을 갖는 하나 또는 그 이상의 유전자를 인코딩하는 임의의 유기체로부터 분리될 수 있다.
비자연적으로 발생하는 변형체는 돌연변이 생성 기술로 제조될 수 있고 이 기술은 폴리뉴클레오티드, 세포 또는 유기체에 적용되는 것을 포함한다. 상기 변형체는 뉴클레오티드 치환, 결실, 역위 및 삽입을 포함할 수 있다. 변형은 코딩 및 비코딩 지역의 하나 또는 둘에서 일어날 수 있다. 특정한 양상에서는, 비자연적으로 발생하는 변형체는 증가된 활성, 안정성 또는 임의의 다른 바람직한 특징에 대하여 효소를 가공 및 스크리링함으로써 주어진 미생물(예, 이. 콜라이)의 사용을 위해 최적화될 수 있다. 상기 변형은 (본래의 인코딩된 산물과 비교하여) 보존적인 및 비보전적인 아미노산 치환을 생성할 수 있다. 뉴클레오티드 서열에 관해서, 보전적인 변형체는 유전자 코드의 축증(degeneracy) 때문에 참고 폴리펩티드의 아미노산 서열을 인코딩하는 서열을 포함한다. 변형체 뉴클레오티드 서열은 예를 들어, 위치지정 돌연변이에 의해 생성되나 생물학적 활성을 갖는 폴리펩티드를 아직도 인코딩하는 것과 같은 합성적으로 유래된 뉴클레오티드 서열을 또한 포함한다.
일반적으로, 특정 참고 뉴클레오티드 서열의 변형체는 디폴트 매개변수(default parameter)를 사용하여 여기의 그 밖에 기술된 서열 정렬 프로그램에 의해 결정된 것과 같이 특정 뉴클레오티드 서열과 적어도 약 30%, 40% 50%, 55%, 60%, 65%, 70%, 일반적으로 적어도 약 75%, 80%, 85%, 90% 내지 95% 또는 그 이상, 및 심지어 약 97% 또는 98% 또는 그 이상의 서열 동일성을 가질 수 있다.
공지진 알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제 및 다른 뉴클레오티드 참고 서열은 다른 유기체 특히 다른 미생물로부터 해당 서열 및 대립 유전자를 분리하는데 사용될 수 있다. 핵산 서열의 혼성화를 위한 방법들이 당업계에서 용이하게 이용가능하다. 다른 유기체로부터의 코딩 서열은 여기로 나타낸 코딩 서열과의 서열 동일성에 기반하여 잘 알려진 기술에 따라 분리될 수 있다. 이들 기술에서, 공지된 코딩 서열의 모두 및 일부는 선택된 유기체로부터 클론화된 게놈믹 DNA 또는 cDNA 단편(즉, 게놈믹 또는 cDNA 라이브러리)의 집단에 존재하는 다른 참고 코딩 서열에 선택적으로 혼성화하는 프로브로서 사용된다.
본 발명은 또한 하기에 기술된 스트린전시 조건하에서 참고 알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제, 또는 다른 뉴클레오티드 서열 또는 그들의 보체에 혼성화하는 폴리뉴클레오티드를 또한 고려한다. 여기서 사용되는 "낮은 스트린전시, 중간 스트린전시, 높은 스트린전시 또는 매우 높은 스트린전시 조건하에서 혼성화하다"라는 용어는 혼성화 및 세척을 위한 조건을 기술한다. 혼성화 반응을 실시하기 위한 지침은 Ausubel 등, "Current Protocols in Molecular Biology", John Wiley & Sons Inc, 1994-1998, Sections 6.3.1-6.3.6.에서 찾을 수 있다. 수성 및 비수성 방법들은 그 참고문헌에 기술되어 있고 두 가지 방법 모두 사용될 수 있다.
"낮은 스트린전시" 조건에 대한 언급은 적어도 약 1 % v/v 내지 적어도 약 15% v/v 포름아미드 및 42℃에서 혼성화를 위해 적어도 약 1 M 내지 적어도 약 2 M 염, 및 42℃에서 세척를 위해 적어도 약 1 M 내지 적어도 약 2 M 염을 포함한다. 낮은 스트린전시 조건은 65℃에서 혼성화를 위해 1 % 소 혈청 알부민(BSA), 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS를 또한 포함할 수 있고 실온에서 세척을 위해 (i) 2 x SSC, 0.1 % SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 5% SDS를 포함할 수 있다. 낮은 스트린전시 조건의 하나의 구현 예는 약 45℃에서 6 × 염화나트륨/구연산나트륨(SSC)에서 혼성화에 이은 적어도 50℃에서 0.2 × SSC, 0.1 % SDS에서 두 번의 세척을 포함한다(세척의온도는 낮은 스트린전시 조건을 위해서 55℃로 증가될 수 있다).
"중간 스트린전시" 조건은 적어도 약 16% v/v 내지 적어도 약 30% v/v 포름아미드 및 42℃에서 혼성화를 위해 적어도 약 0.5 M 내지 적어도 약 0.9 M 염, 및 55℃에서 세척를 위해 적어도 약 0.1 M 내지 적어도 약 0.2 M 염을 포함(include)하고 포함(encompass)한다. 중간 스트린전시 조건은 65℃에서 혼성화를 위해 1 % 소 혈청 알부민(BSA), 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS 및 60 내지 65℃에서 세척을 위해 (i) 2 x SSC, 0.1 % SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 5% SDS를 포함할 수 있다. 중간 스트린전시 조건의 하나의 구현 예는 약 45℃에서 6 x SSC에서 혼성화에 이은 60℃에서 0.2 x SSC, 0.1 % SDS에서 한 번 또는 그 이상의 세척을 포함한다.
"높은 스트린전시" 조건은 적어도 약 31 % v/v 내지 적어도 약 50% v/v 포름아미드 및 42℃에서 혼성화를 위해 약 0.01 M 내지 약 0.15 M 염 및 55℃에서 세척을 위해 약 0.01 M 내지 약 0.02 M 염을 포함한다. 높은 스트린전시 조건은 65℃에서 혼성화를 위해 1 % BSA, 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS 및 65℃ 이상의 온도에서 세척을 위해 (i) 0.2 x SSC, 0.1 % SDS; or (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 1 % SDS를 또한 포함할 수 있다. 높은 스트린전시 조건의 하나의 구현 예는 약 45℃에서 6 x SSC에서 혼성화에 이은 65℃에서 0.2 x SSC, 0.1 % SDS에서 하나 또는 그 이상의 세척을 포함한다.
"매우 높은 스트린전시" 조건의 하나의 구현 예는 65℃에서 0.5 M 인산나트륨, 7% SDS에서 혼성화에 이은 65℃에서 0.2 x SSC, 1 % SDS에서 하나 또는 그 이상의 세척을 포함한다.
다른 스트린전시 조건은 당업계에 잘 알려져 있고 당업자는 다양한 인자가 혼성화의 특이성을 최적화하는데 조작될 수 있음을 인식하고 있다. 마지막 세척의 스트린전시의 최적화는 혼성화의 높은 정도를 보장하는데 도움이 될 수 있다. 자세한 예로서, Ausubel 등, 위의 페이지 2.10.1 내지 2.10.16 및 Sambrook 등, Current Protocols in Molecular Biology (1989), 섹션 1.101 to 1.104.를 참조한다.
충실한 세척은 전형적으로 약 42℃ 내지 68℃의 온도에서 수행되고, 당업자는 다른 온도도 스트린전시 조건에 적합할 수 있음을 인식할 것이다. 최대의 혼성화 속도는 전형적으로 DNA-DNA 하이브리드 형성의 Tm 값 아래의 약 20℃ 내지 25℃에서 일어난다. Tm 값은 해리 온도 또는 두 개의 상보적인 폴리뉴클레오티드 서열이 분리되는 온도임이 당업계에 잘 알려져 있다. Tm 값을 계산하는 방법은 당업계에 잘 알려져 있다(Ausubel 등, 위의 페이지 2.10.8을 참조).
일반적으로, DNA의 완벽하게 매치된 이중가닥의 Tm 값은 하기 식에 의해 근사치로 예측될 수 있다: Tm = 81.5 + 16.6 (log10 M) + 0.41 (%G+C) - 0.63 (% 포름아미드) - (600/길이), 여기서 M은 바람직하게 0.01 M 내지 0.4 M 범위의 Na+의 농도이고; %G+C는 30% 및 75% G+C 사이의 범위 안에서 전체 염기 수의 퍼센트로서 구아노신 및 사이토신의 합이고; % 포름아미드는 부피에 의한 포름아미드의 % 농도이고; 길이는 DNA 이중 가닥에서 염기 쌍의 수를 나타낸다. 이중 가닥 DNA의 Tm 값은 무작위로 미스매치된 염기 쌍이 1% 씩 증가할 때마다 약 1℃ 감소한다. 세척은 일반적으로 높은 스트린전시에 대해서는 Tm - 15℃에서 또는 중간 스트린전시에 대해서는 Tm - 30℃에서 수행된다.
혼성화 절차의 한 예에서, 고정화된 DNA를 포함하는 멤브레인(예, 니트로셀룰로오스 멤브레인 또는 나일론 멤브레인)은 라벨된 프로브를 포함하는 혼성화 완충제(50% 탈이온화장치 포름아미드, 5 x SSC, 5 x Reinhardt 용액 (0.1 % 피컬(fecal), 0.1 % 폴리비닐피롤리돈 및 0.1 % 소 혈청 알부민), 0.1 % SDS 및 200 mg/mL 변성된 연어 정자 DNA)에서 42℃에서 하룻밤 혼성화된다. 상기 멤브레인은 그 후 2번의 연속적인 중간 충실의 세척도(즉,45℃에서 15분간 2 x SSC, 0.1 % SDS에 이어서 50℃에서 15분간 2 x SSC, 0.1 % SDS)에 이어서 2번의 연속적인 보다 높은 스트린전시의 세척(즉, 55℃에서 12분간 0.2 x SSC, 0.1 % SDS에 이어서 65℃ 내지 68℃에서 12분간 0.2 x SSC 및 0.1 % SDS)에 노출되었다. 상기에 기반하여, 본 발명의 구현 예는 여기에 기술되고 당업계에 잘 알려진 중간, 높은 또는 매우 높은 스트린전시 조건하에서 알돌라제 또는 알코올 디하이드로게나제 효소를 인코딩하는 폴리뉴클레오티드 서열과 같은 임의의 참고 폴리뉴클레오티드 서열의 보체와 혼성화하는 폴리뉴클레오티드 서열을 포함하는 재조합 미생물을 포함한다.
폴리뉴클레오티드 및 그의 융합은 임의의 다양한 당업계에 잘 알려지고 입수가능한 확립된 기술을 사용하여 제조, 조작 및/또는 발현될 수 있다. 예를 들어, 본 발명의 폴리펩티드 또는 융합 단백질 또는 그의 기능적 동등체를 인코딩하는 폴리뉴클레오티드 서열은 적합한 숙주 세포에서 선택된 효소의 직접적인 발현을 지시하기 위해 재조합 DNA 분자에서 사용될 수 있다. 유전자 코드의 고유의 축증에 기인하여 실질적으로 같거나 또는 기능적으로 동등한 아미노산을 인코딩하는 다른 DNA 서열은 생성될 수 있고 이들 서열은 주어진 폴리펩티드를 클론하고 발현하기 위해서 사용될 수 있다.
당업자들에게 이해되는 바와 같이, 몇몇 경우에 자연적으로 일어나지 않는 코돈을 포함하는 폴리펩티드-인코딩 뉴클레오티드 서열을 생성하는 것은 유익할 수 있다. 예를 들어, 특정 원핵 또는 진핵 숙주 세포에 의해 선호되는 코돈은 선택되어 단백질 발현의 속도를 증가시킬 수 있으며 또는 자연적으로 일어나는 서열로부터 생성된 전사체의 반감기보다 긴 반감기와 같은 원하는 특성을 지닌 재조합 RNA 전사체를 생성할 수 있다. 그런 뉴클레오티드는 전형적으로 "코돈-최적화된"으로서 지칭된다. 여기에 기술된 임의의 뉴클레오티드 서열은 "코돈-최적화된" 형태로서 사용될 수 있다.
더욱이, 본 발명의 폴리뉴클레오티드 서열은 당업계에 잘 알려진 방법을 사용하여 가공되어 다양한 이유 때문에 폴리펩티드 인코딩 서열을 변형시킬 수 있고 이들 변형은 유전자 산물의 클로닝, 프로세싱, 발현 및/또는 활성을 변형하는 것을 포함하나 여기에 제한적이지는 않다.
원하는 폴리펩티드를 발현하기 위해서, 폴리펩티드 또는 기능적 동등체를 인코딩하는 뉴클레오티드 서열은 적합한 발현 벡터에 삽입될 수 있고, 이들 벡터는 삽입된 코딩 서열의 전사 및 번역을 위한 필요한 요소를 포함한다. 당업자들에게 잘 알려진 방법이 사용되어 관심 있는 폴리펩티드 및 적합한 전사 및 번역 조절 요소를 인코딩하는 서열을 포함하는 발현 벡터를 구축할 수 있다. 이들 방법은 in vitro 재조합 DNA 기술, 합성 기술, 및 in vivo 유전자 재조합을 포함한다. 그러한 기술은 Sambrook 등, Molecular Cloning, A Laboratory Manual (1989), 및 Ausubel 등, Current Protocols in Molecular Biology (1989)에 기술되어 있다.
관심 있는 폴리뉴클레오티드 서열로 형질전환된 숙주 세포는 세포 배양체로부터 단백질 발현 및 수거에 적합한 조건하에서 배양될 수 있다. 재조합 세포에 의해 생성되는 단백질은 서열 및/또는 사용되는 벡터에 따라 분비되거나 또는 세포내로 저장될 수 있다. 당업자들에게 이해되는 것과 같이, 본 발명의 폴리뉴클레오티드를 포함하는 발현 벡터는 디자인되어 인코딩된 폴리펩티드를 세포 내의 원하는 부위에 직접적으로 위치시킬 수 있는 신호 서열을 포함할 수 있다. 다른 재조합 구조체는 사용되어 관심 있는 폴리펩티드를 인코딩하는 서열을 인코딩된 단백질을 직접적으로 분비시키는 폴리펩티드 도메인을 인코딩하는 뉴클레오티드 서열에 연결시킬 수 있다.
본 발명의 구현 예는 알돌라제 활성, 알코올 디하이드로게나제 활성, 이중 결합 리덕타제 활성, 또는 다른 활성을 지닌 "폴리펩티드"를 포함하는 재조합 미생물의 사용을 고려하고, 범용화학제품을 생산하기 위해 끝이 절단된 변형체 및/또는 그의 변형된 폴리펩티드를 포함한다. "폴리펩티드", "폴리펩티드 단편", "펩티드" 및 "단백질"은 여기서 호환성 있게 사용되어 아미노산 잔기의 중합체 및 중합체의 변형체 및 합성 유사체를 지칭한다. 따라서, 이들 용어는 아미노산 중합체에 적용되며, 여기서 하나 또는 그 이상의 아미노산 잔기는 해당하는 자연적으로 일어나는 아미노산의 화학적 유사체와 같은 자연적으로 일어나지 않는 아미노산뿐만 아니라 자연적으로 일어나는 아미노산 중합체이다. 특정한 양상에서는, 폴리펩티드는 효소적 폴리펩티드 또는 전형적으로 다양한 화학 반응을 촉매(즉, 반응속도를 높이는)하는 "효소"를 포함할 수 있다.
상술 폴리펩티드 "변형체"는 적어도 하나의 아미노산 잔기의 추가, 결실 또는 치환에 의해 참고 폴리펩티드 서열과 구별되는 폴리펩티드를 지칭한다. 특정한 구현 예에서, 폴리펩티드 변형체는 보존적 또는 비보전적일 수 있는 하나 또는 그 이상의 치환에 의해 참고 폴리펩티드와 구별된다. 특정한 구현 예에서, 폴리펩티드 변형체는 보전적인 치환을 포함한다. 이 관점에서, 몇몇 아미노산은 상기 폴리펩티드의 활성 성질에는 변화없이 광범위적으로 유사한 성질을 갖는 다른 아미노산으로 변형될 수 있다. 폴리펩티드 변형체는 또한 하나 또는 그 이상의 아미노산이 첨가 또는 결실 또는 다른 아미노산 잔기로 치환된 폴리펩티드를 포함한다.
본 명세서에 포함된 변형 단백질은 "생물학적으로 활성"이 있다. 즉, 그들은 계속하여 참고 폴리펩티드의 효소학적 활성을 지니고 있다. 예를 들어, 그러한 변형체는 유전학적 다형성 또는 인간의 조작을 통해 발생한다. 참고 폴리펩티드 서열 의 생물학적으로 활성이 있는 변형체 또는 그의 단편은 디폴트 매개변수를 사용하여 그 밖의 여기에 기술된 서열 정렬 프로그램에 의해 결정되듯이 참고 단백질에 대한 아미노산 서열과 적어도 약 40%, 50%, 60%, 70%, 일반적으로 적어도 약 75%, 80%, 85%, 대개 약 90% 내지 95% 또는 그 이상, 및 전형적으로 약 98% 또는 그 이상의 서열 유사성 또는 동일성을 갖는다. 참고 폴리펩티드의 생물학적으로 활성이 있는 변형체는 일반적으로 그 단백질과 200, 100, 50 또는 20개의 아미노산 잔기 만큼 또는 적합하게는 1 내지 15 개의 아미노산 잔기 만큼, 1 내지 10개의 잔기, 6 내지 10 개의 잔기, 5개 잔기 만큼, 4, 3, 2 만큼 또는 심지어 1 개의 아미노산 잔기만큼 다를 수 있다. 몇몇 구현 예에서, 변형체 폴리펩티드는 참고 폴리펩티드와 적어도 하나, 하지만 15, 10 또는 5 개의 아미노산 잔기 미만의 개수만큼 다르다. 다른 구현 예에서, 그것은 참고 서열과 적어도 하나의 잔기, 하지만 잔기의 20%, 15%, 10% 또는 5% 미만만큼 다르다.
본 발명은 여기에 기술된 방법에서 임의의 효소 활성(예, 알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제 등)을 갖는 전장 참고 폴리펩티드의 변형체의 사용, 이들 전장 폴리펩티드의 끝이 잘린 단편의 사용, 끝이 잘린 절편의 변형체의 사용, 뿐만 아니라 그의 관련된 생물학적으로 활성이 있는 절편의 사용을 고려한다. 전형적으로 폴리펩티드의 생물학적으로 활성이 있는 절편은 상호 작용, 예를 들어, 분자 내 상호작용, 분자 간 상호작용에 참여한다. 분자 간 상호작용은 특이적 결합 상호작용 또는 효소학적 상호작용(예, 상호작용은 일시적일 수 있고 공유결합이 형성되거나 깨어짐)일 수 있다. 폴리펩티드/효소의 생물학적으로 활성이 있는 절편 및 여기에 기술된 효소 활성은 (잠정적인) 전장 참고 폴리펩티드 서열의 아미노산 서열과 충분히 유사하거나 또는 아미노산 서열로부터 유래된 아미노산 서열을 포함하는 펩티드를 포함한다. 전형적으로, 생물학적으로 활성이 있는 절편은 적어도 하나의 효소 활성을 지닌 도메인 또는 모티프를 포함하고 하나 또는 그 이상(몇몇 경우 모두)의 다양한 활성 도메인을 포함할 수 있다. 효소의 생물학적으로 활성이 있는 절편은 예를 들어, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 25, 26, 27, 28, 29,30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 450, 500, 600 개 또는 그 이상의 연속적이고 사이에 끼인 모든 정수를 포함하는 아미노산인 참고 폴리펩티드 서열의 폴리펩티드 절편일 수 있다. 특정한 구현 예에서, 생물학적으로 활성이 있는 단편은 여기의 그밖에 기술되어 있고 당업계에 알려진 바와 같이 보존된 효소학적 서열, 도메인, 또는 모티프를 포함하고 있다. 적합하게, 생물학적으로 활성이 있는 단편은 그것이 유래된 야생형 폴리펩티드의 활성의 약 1%, 10%, 25%, 50% 만큼이다.
알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제 또는 다른 참고 폴리펩티드는 아미노산 치환, 결실, 절단, 및 삽입의 다양한 방법으로 변형될 수 있다. 그러한 조작의 방법은 당업계에 일반적으로 알려져 있다. 예를 들어, 참고 폴리펩티드의 아미노산 서열 변형체는 DNA의 돌연변이에 의해 제조될 수 있다. 돌연변이 생성 및 뉴클레오티드 서열 변형에 대한 방법은 당업계에 잘 알려져 있다. 예를 들어, Kunkel (1985, Proc. Natl. Acad. Sci. USA. 82: 488-492), Kunkel 등, (1987, Methods in Enzymol, 154: 367-382), 미국 특허 제4,873,192호, Watson, J. D. 등, ("Molecular Biology of the Gene", Fourth Edition, Benjamin/Cummings, Menlo Park, Calif., 1987) 및 그들 중에 인용된 문헌을 참조한다. 관심있는 단백질의 생물학적 활성에 영향을 주지 않는 적합한 아미노산 치환에 대한 지침은 Dayhoff 등, (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D. C)의 모델에서 참고할 수 있다.
점변이(point mutation) 또는 절단에 의해 만들어진 조합 라이브러리의 유전자 생산물 스크리닝 방법 및 선택된 특성을 가진 유전자 생산물에 대한 cDNA 라이브러리를 스크리닝하는 방법은 당업계에 잘 알려져 있다. 그러한 방법은 알돌라제 또는 알코올 디하이드로게나제 폴리펩티드의 조합 돌연변이에 의해 생성된 유전자 라이브러리를 빠르게 스크리닝하는데 적용된다. 라이브러리에서 기능적 돌연변이의 빈도를 향상시키는 기술인 반복적인 앙상블 돌연변이 생성(REM)은 폴리펩티드 변형체를 확인하는 스크리닝 검사와 조합으로 사용될 수 있다(Arkin 및 Yourvan (1992) Proc. Natl. Acad. Sci. USA 89: 7811 -7815; Delgrave 등, (1993) Protein Engineering, 6: 327-331 ). 하나의 아미노산을 유사한 성질을 갖는 다른 아미노산으로 교환하는 보존적 치환은 하기에 보다 더 자세히 기술된 바와 같이 바람직할 수 있다.
폴리펩티드 변형체는 참고 아미노산 서열과 비교하여 그들의 서열상 다양한 위치에서 보존적인 아미노산 치환을 포함할 수 있다. "보존적인 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산으로 대체되는 것이다. 유사한 측쇄를 갖는 아미노산 잔기 패밀리는 당업계에 정의되어 있으며 하기와 같이 일반적으로 세부적으로서 분류될 수 있다:
산성: 잔기는 생리학적 pH 하에서 수소 이온의 상실로 인해 음성 전하를 가지며 또한 상기 잔기는 펩티드가 생리학적 pH하의 수성 매체 중에 있을 때 포함되는 펩티드 구조의 표면 위치를 찾고자 수용액에 의해 끌려진다. 산성 측쇄를 갖는 아미노산은 글루탐 산 및 아스파르트산을 포함한다.
염기성: 잔기는 생리학적 pH 하 또는 그의 하나 또는 두 pH 단위(예, 히스티딘) 안에서 수소 이온과의 결합에 의해 양성 전하를 갖고 펩티드가 생리학적 pH하의 수용액 상에 있을 때 포함되는 펩티드 구조의 표면 위치를 찾고자 수용액에 의해 끌려진다. 염기성 측쇄를 갖는 아미노산은 알지닌, 라이신 및 히스티딘을 포함한다.
전하성: 잔기는 생리학적 pH 하에서 전하를 갖고 산성 또는 염기성 측쇄를 갖는 아미노산을 포함한다(즉, 글루탐산,아스파르트산, 알지닌, 라이신 및 히스티딘).
소수성: 잔기는 생리학적 pH 하에서 전하를 갖지 않고 펩티드가 수성 매체 중에 있을 때 포함되는 펩티드 구조의 내부 위치를 찾고자 수용액에 의해 격퇴된다. 소수성 측쇄를 갖는 아미노산은 티로신, 발린, 이소류신, 류신, 메티오닌, 페닐알라닌 및 트립토판을 포함한다.
중성/극성: 잔기는 생리학적 pH 하에서 전하를 갖지 않고 수용액에 의해 충분히 격퇴되지 않아서 펩티드가 수성 매체 중에 있을 때 포함되는 펩티드 구조의 내부 위치를 찾는다. 중성/극성의 측쇄를 갖는 아미노산은 아스파라긴, 글루타민, 시스테인, 히스티딘, 세린 및 트레오닌을 포함한다.
이러한 설명은 그들의 측쇄가 소수성을 부여하기에 충분히 크지 않기 때문에 극성 그룹이 부족하더라도 어떤 아미노산을 "작은 것"으로 특성화한다. 프롤린을 제외하고 "작은" 아미노산은 적어도 하나의 극성 그룹이 측쇄에 존재할 때 4개의 탄소 또는 그보다 적은 탄소를 갖는 것들이고 적어도 하나의 극성 그룹이 측쇄에 존재하지 않을 때 3개의 탄소 또는 그보다 적은 탄소를 갖는 것들이다. 작은 측쇄를 갖는 아미노산은 글리신, 세린, 알라닌 및 트레오닌을 포함한다. 유전지로 인코딩되는 2차 아미노산 프롤린은 펩티드 체인의 2차 구조에 대한 그것의 알려진 효과에 기인하여 특별한 경우이다. 프롤린의 구조는 그것의 측쇄가 α-탄소뿐만 아니라 α-아미노 그룹의 질소에도 결합되어 있어서 다른 자연적으로 발생하는 아미노산과 다르다. 몇몇 아미노산 유사성 매트릭스(예, PAM120 매트릭스 및 PAM250 매트릭스)가 예를 들어, Dayhoff 등, (1978), A model of evolutionary change in proteins에 기술되어 있다. 그러나 M. O. Dayhoff, (ed.), Atlas of protein sequence and structure, Vol. 5, pp. 345-358, National Biomedical Research Foundation, Washington DC; 및 Gonnet 등, (Science, 256: 14430-1445, 1992)에서의 거리 관계를 결정하는 매트릭스는 프롤린을 글리신, 게린, 알라닌 및 트레오닌과 같은 그룹으로 포함한다. 따라서, 본 발명의 목적을 위해. 프롤린은 "작은" 아미노산으로 분류된다.
극성 또는 비극성으로 분류하는데 필요한 끌어당김 또는 격퇴의 정도는 임의적이므로, 본 발명에 의해 특별히 고려되는 아미노산은 하나 또는 다른 것으로 분류된다. 특별히 이름이 부여되지 않은 대다수의 아미노산은 알려진 거동에 기초하여 분류될 수 있다.
아미노산 잔기는 환 또는 비환 및 방향족 또는 비방향족, 잔기의 측쇄 치환기 그룹에 대한 자명한 분류, 및 작은 또는 큰으로서 추가로 세부 분류될 수 있다. 잔기는 카르복실 탄소를 포함하여 부가적인 극성 치환기가 존재한다면 전체 4개 탄소 또는 그보다 적은 탄소를 포함할 때 작은 것으로 고려된다. 부가적인 극성 치환기가 존재하지 않는다면 전체 3개 또는 그보다 적은 탄소일 때 작은 것으로 고려된다. 작은 잔기는 물론 항상 비방향족이다. 그들의 구조적 특성에 의존하여, 아미노산 잔기는 2개 또는 그 이상의 클래스로 분류된다. 자연적으로 발생하는 단백질 아미노산에 대해, 이러한 도식에 따른 세부 분류는 표 A에 나타낸다.
Figure pct00005
보존적 아미노산 치환은 또한 측쇄에 근거한 그룹화를 포함한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 그룹은 글리신, 알라닌, 발린, 류신 및 이소류신이다; 지방족 하이드록실 측쇄를 갖는 아미노산 그룹은 세린 및 트레오닌이다; 아미드-포함 측쇄를 갖는 아미노산 그룹은 아스파라긴 및 글루타민이다; 방향족 측쇄를 갖는 아미노산 그룹은 페닐알라닌, 티로신 및 트립토판이다; 염기성 측쇄를 갖는 아미노산 그룹은 라이신, 아르기닌 및 히스티딘이다; 또한 황-포함 측쇄를 갖는 아미노산 그룹은 시스테인 및 메티오닌이다. 예를 들어, 류신을 이소류신 또는 발린으로의 교체, 아스파르트산을 글루탐산으로의 교체, 트레오닌을 세린으로의 교체, 또는 아미노산을 구조적으로 관계있는 아미노산으로의 유사한 교체는 수득된 변형 폴리펩티드의 성질에 주요한 영향을 갖지 않을 것이다. 아미노산 변화가 기능적으로 절단된 및/또는 변형된 폴리펩티드를 유발하는지의 여부는 여기에 기술된 바(실시예 2-4을 참조)와 같이 효소 활성을 측정함으로써 결정될 수 있다. 보존적인 치환은 전형적인 치환을 필두로서 표 B에 나타낸다. 본 발명의 범주에 분류되는 아미노산 치환은 (a) 치환 지역에서 펩티드 백본의 구조, (b) 타겟 부위에서 분자의 전하 또는 소수성, 또는 (c) 측쇄의 부피를 유지하는데 그들의 효과에서 크게 다르지 않은 치환을 선택함과 일반적으로 동반한다. 치환이 도입된 후, 생물학적 활성에 대해 변형체가 스크리닝된다.
Figure pct00006
이와는 달리, 보존적 치환을 만드는 유사한 아미노산은 측 쇄의 동일성에 따라 3개의 카테고리로 그룹화된다. Zubay, G., Biochemistry, third edition, Wm.C. Brown Publishers (1993)에 기술된 바와 같이, 첫 번째 그룹은 모두 전하 된 측 쇄를 갖는 글루탐산, 아스파르트산, 아르기닌, 라이신을 포함한다; 두 번째 그룹은 글리신, 세린, 트레오닌, 시스테인, 티로신, 글루타민, 아스파라긴을 포함한다; 또한 세 번째 그룹은 류신, 이소류신, 발린, 알라닌, 프롤린, 페닐알라닌, 트립토판, 메티오닌을 포함한다.
따라서, 알돌라제 또는 알코올 디하이드로게나제 폴리펩티드에서 예측된 비필수 아미노산 잔기는 전형적으로 같은 측 쇄 패밀리로부터의 다른 아미노산 잔기로 교체된다. 이와는 달리, 돌연변이는 포화 돌연변이와 같이 코딩 서열의 모두 또는 부분에 걸쳐 무작위로 도입될 수 있고, 수득된 돌연변이체는 그 활성을 보유하는 돌연변이를 확인하고자 모체 폴리펩티드의 활성에 대해 스크리닝될 수 있다. 코딩 서열의 돌연변이 생성을 따라, 인코딩된 펩티드는 재조합적으로 발현될 수 있으며 펩티드의 활성이 결정될 수 있다. "비필수" 아미노산 잔기는 하나 또는 그 이상의 활성을 제거 또는 실질적으로 변형됨이 없이 구현 예 폴리펩티드의 야생형 서열로부터 변형될 수 있는 잔기이다. 적합하게는, 상기 변형은 이들 활성의 하나를 실질적으로 제거하지 않는다. 예를 들어 상기 활성은 야생형의 적어도 20%, 40%, 60%, 70% 또는 80% 100%, 500%, 1000% 또는 그 이상이다. "필수" 아미노산 잔기는, 참고 폴리펩티드의 야생형 서열로부터 변형되었을 때, 모체 분자의 활성의 제거를 야기해서 야생형 활성의 20% 미만이 존재한다. 예를 들어, 그러한 필수 아미노산 잔기는 다양한 유래로부터 폴리펩티드의 효소 부위에서 보존적인 서열을 포함하는 알돌라제, 알코올 디하이드로게나제, 이중 결합 리덕타제 또는 다른 종에 걸친 다른 참고 폴리펩티드에서 보존적인 잔기이다.
따라서, 본 발명은 자연적으로 발생하는 참고 폴리펩티드 서열의 변형체 또는 그들의 생물학적으로 활성이 있는 절편을 또한 고려하며, 여기서 변형체는 자연적으로 발생하는 서열과 하나 또는 그 이상의 아미노산 잔기의 첨가, 결실 또는 치환에 의해 구별된다. 일반적으로, 변형체는 참고 폴리펩티드 서열에 대해 적어도 약 30, 40, 50, 55, 60, 65, 70, 75, 80, 85, 90, 91 , 92, 93, 94, 95, 96, 97, 98, 99 % 유사성 또는 서열 동일성을 나타낸다. 더욱이, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 그 이상의 아미노산의 첨가, 결실 또는 치환에 의해 자연적 또는 모체 서열과 다르나 모체 또는 참고 폴리펩티드 서열의 특성을 보유하는 서열도 고려된다.
몇몇 구현 예에서, 변형체 폴리펩티드는 참고 알돌라제 또는 알코올 디하이드로게나제 폴리펩티드 서열과 적어도 하나 하지만 50, 40, 30, 20, 15, 10, 8, 6, 5, 4, 3 또는 2 개의 아미노산(들) 미만에 의해 다르다. 다른 구현 예에서, 변형 폴리펩티드는 참고 폴리펩티드와 적어도 잔기의 1% 하지만 잔기의 20%, 15%, 10% 또는 5% 미만에 의해 다르다.(이들 비교가 정렬을 필요로 한다면, 서열은 최대 유사성을 위해 정렬되어야 한다. 결실 또는 삽입 또는 미스매치로부터의 "루프트(looped)" 아웃 서열은 다른 것으로 고려된다.)
특정한 구현 예에서, 변형 폴리펩티드는 참고 폴리펩티드의 해당 서열에 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91 %, 92%, 93%, 94% 95%, 96%, 97%, 98%, 또는 99% 또는 이상의 서열 동일성 또는 유사성을 가진 아미노산 서열을 포함하고 참고 폴리펩티드의 효소 활성도 보유한다. 상술된 "서열 동일성" 또는 예를 들어 여기서 사용된 "에 50% 동일한 서열"을 포함하는 서열 동일성이 비교 윈도우 상에서 뉴클레오티드 대 뉴클레오티드 또는 아미노산 대 아미노산에 대해서 동일한 정도를 지칭한다. 따라서, "서열 동일성의 백분율"은 비교 윈도우 상에서 2개의 최적으로 정렬된 서열을 비교, 매치된 위치 수를 생성하기 위해 동일한 핵산 염기(예, A, T, C, G, I) 또는 동일한 아미노산 잔기(예, Ala, Pro, Ser, Thr, GIy, VaI, Leu, lie, Phe, Tyr, Trp, Lys, Arg, His, Asp, GIu, Asn, GIn, Cys 및 Met)가 두 서열에서 일어나는 위치의 수를 결정, 매치된 위치의 수를 비교 윈도우 상(즉, 윈도우 크기)에서 전체 위치의 수를 나눔 및 서열 동일성의 백분율을 구하고자 상기 값에 100을 곱해줘서 계산될 수 있다.
두 개 또는 그 이상의 폴리뉴클레오티드 또는 폴리펩티드 간의 서열 관계를 기술하는 용어는 "참고 서열", "비교 윈도우", "서열 동일성", "서열 동일성의 백분율" 및 "실질적 동일성"을 포함한다. "참고 서열"은 길이 상 뉴클레오티드 및 아미노산 잔기를 포함하는 적어도 12개 하지만 자주 15 내지 18개 및 종종 적어도 25 단량체 단위이다. 두 개의 폴리뉴클레오티드가 각각 (1) 두 개의 폴리뉴클레오티드 사이에서 유사한 서열(완전한 폴리뉴클레오티드 서열의 오직 일부분) 및 (2) 두 개의 폴리뉴클레오티드 사이에서 다른 서열을 포함할 수 있기 때문에, 두 개 (또는 그 이상의) 폴리뉴클레오티드의 서열 비교는 전형적으로 "비교 윈도우" 상에서 두 개의 폴리뉴클레오티드의 서열을 비교하여 서열 유사성의 부분적 부위를 확인 및 비교함으로써 실시된다. "비교 윈도우"는 적어도 6개의 연속적인 위치, 일반적으로 약 50 내지 약 100개, 더욱 일반적으로 약 100 내지 약 150개의 개념적인 세그멘트를 지칭하고 여기서, 두 서열이 최적으로 정렬된 후에 서열이 같은 수의 연속적인 위치의 참고 서열과 비교된다. 비교 윈도우는 두 서열의 최적 정렬을 대한 참고 서열(첨가 또는 결실을 포함하지 않음)과 비교하여 20% 또는 그 미만의 첨가 또는 결실(즉, 격차)을 포함할 수 있다.
비교 윈도우 정렬을 위한 최적의 서열 정렬은 알고리듬(Wisconsin Genetics Software Package Release 7.0 GAP의 BESTFIT, FASTA, 및 TFASTA, 유전 컴퓨터 그룹, 575 사이언스 드라이브 메디슨, 위스콘신, 미국)의 컴퓨터화된 실행 또는 검사 및 임의의 선택된 다양한 방법에 의해 생성된 최적의 정렬(즉, 비교 윈도우 상에서 가장 높은 백분율의 상동성을 야기하는)에 의해 실행될 수 있다. 참고 문헌은 예를 들어, Altschul 등, 1997, Nucl. Acids Res. 25:3389에 기술된 바와 같이 프로그램의 BLAST 패밀리에 또한 만들어질 수 있다. 서열 분석에 자세한 논의는 Ausubel 등, "Current Protocols in Molecular Biology", John Wiley &Sons Inc, 1994-1998, Chapter 15의 유닛 19.3에서 찾을 수 있다.
"내인성의"라는 용어는 유전적으로 변형 안된 야생형 세포 또는 생명체에서 발견될 수 있는 자연적으로 발생하는 유전자, 폴리뉴클레오티드 서열 또는 폴리펩티드의 카피를 지칭한다. 예를 들어, 어떤 자연적으로 발생하는 대장균 또는 효모 종은 전형적으로 알돌라제 유전자를 포함하고 있지 않아서, 알돌라제 효소를 인코딩하는 "내인성의" 폴리뉴클레오티드 서열을 포함하고 있지 않다.
"외인성의"라는 용어는 야생형 세포 또는 생명체에서 자연적으로 일어나지 않는 폴리뉴클레오티드 서열 또는 핵산 분자 또는 폴리펩티드의 카피, 유전자 카피를 지칭한다. 이들은 통상적으로 분자 생물학적 방법에 의해 세포 내로 도입된다. 즉, 재조합 미생물을 생성하기 위해 가공된다. "외인성의" 유전자 또는 폴리뉴클레오티드의 예는 벡터, 원하는 단백질 또는 효소를 인코딩하는 플라스미드 및/또는 사람이 만든 핵산 구조체를 포함한다.
이러한 양상에서, 생명체가 내재적 또는 자연적으로 발생하는 소정의 폴리뉴클레오티드 서열 또는 유전자를 포함하고 있음에도 불구하고, 인코딩된 단백질을 과잉발현 또는 발현 조절하기 위해서 그 유전자 또는 관련된 서열을 인코딩하는 플라스미드 또는 벡터의 도입은 그 유전자 또는 폴리뉴클레오티드 서열의 "외인성의" 카피를 나타낸다. 또한, 어떤 구현 예에서, 내재적인 유전자 또는 폴리뉴클레오티드를 내재적인 유전자 발현 레벨을 증가시키기 위해 구조적 또는 유도가능한 프로모터 하에 위치시키는 것은 본 발명의 의미 안에서 외인성 유전자 또는 폴리뉴클레오티드로 또한 고려될 수 있다. 유사하게, 키메릭 유전자 또는 폴리펩티드를 생성하는 것과 같은 자연적으로 일어나지 않는 서열의 첨가에 의한 내재적인 유전자 또는 폴리뉴클레오티드의 변형도 또한 본 발명의 의미내에서 외인성 유전자 또는 폴리뉴클레오티드로 고려될 수 있다.
여기에 기술된 임의의 경로, 유전자, 폴리뉴클레오티드, 핵산 분자, 폴리펩티드 또는 효소는 "내인성의" 서열을 사용하거나 또는 의존하고, 그렇지 않다면 하나 또는 그 이상의 "외인성" 서열로서 제공될 수 있다.
본 발명은 또한 키메릭 또는 융합 폴리펩티드도 고려한다. 여기서 사용되는 "키메릭 단백질", "융합 단백질" 또는 "융합 폴리펩티드"는 제한 없이 두 번째, 세 번째, 또는 네 번째(또는 그 이상의) 폴리펩티드 또는 그의 단편(예, 복수의 단편을 생성하기 위해)에 연결되는 첫 번째 폴리펩티드 또는 그의 단편을 포함할 수 있다. 두 번째, 세 번째 또는 네 번째 폴리펩티드는 그러한 첫 번째 폴리펩티드의 어떤 단편과 선택적으로 연결시키기 위해서 첫 번째 폴리펩티드와 같은 폴리펩티드를 지칭할 수 있거나 또는 같거나 다른 생명체로부터 유래 되고 첫 번째 폴리펩티드와 다른 단백질에 해당하는 아미노산 서열을 전형적으로 갖는 "이종 기원의 폴리펩티드"를 지칭할 수 있다. 특정한 구현 예에서, 융합 단백질은 주어진 폴리펩티드 단백질의 생물학적으로 활성이 있는 부분의 적어도 하나(또는 둘, 셋, 넷 또는 그 이상)를 포함할 수 있다. 융합 단백질을 형성하는 폴리펩티드는 그들이 또한 C-말단에서 C-말단으로, N-말단에서 N-말단으로, 또는 N-말단에서 C-말단으로 연결될 수 있음에도 불구하고, 전형적으로 C-말단이 N-말단으로 연결되어 있다. 융합 단백질의 폴리펩티드는 임의의 순서일 수 있다.
융합 파트너는 그들이 바람직하지 않게 폴리펩티드의 활성에 영향을 주지 않는다면 임의의 원하는 목적을 필수적으로 위해 디자인되거나 포함될 수 있다. 예를 들어, 하나의 구현예에서, 융합 파트너는 본래의 재조합 단백질보다 높은 수율로 단백질을 발현하는데 도움(발현 향상자)이 되는 서열을 포함할 수 있다. 다른 융합 파트너는 선택되어 단백질의 용해도를 높이거나, 상기 단백질을 원하는 세포 내 구역으로 타겟팅하거나 단백질을 분비하거나 또는 단백질을 세포 표면에 속박한다. 일 예로서, 융합 단백질은 N-말단에 이종 기원의 신호 펩티드를 포함할 수 있다. 어떤 숙주 세포에서, 융합 폴리펩티드의 분비 또는 세포 표면 속박은 전형적으로 폴리펩티드의 N-말단 또는 그 근처에 융합된 하나 또는 그 이상의 이종 기원 신호 펩티드 서열을 사용하여 증가 될 수 있다.
"재조합" 미생물은 전형적으로 하나 또는 그 이상의 외인성 유전자 또는 플라스미드 또는 벡터와 같은 폴리뉴클레오티드를 포함한다. 재조합 미생물로서 사용될 수 있는 미생물의 예는, 제한 없이, 이스체리키아 콜라이, 아세토박터 아세티, 아크로모박터, 아시디필리움, 아시네토박터, 악티노마두라, 악티노플래인, 애로피룸 퍼닉스, 아그로박테리움, 알칼리진, 아나나스 코모수스(M), 아스로박터, 아스파질러스 니거, 아스파질러스 오리제, 아스파질러스 멜레우스, 아스파질러스 퍼브루엔투스, 아스파질러스 사이토이, 아스파질러스 소지, 아스파질러스 우사이이, 바실러스 알칼로필러스, 바실러스 아밀로리퀘파시엔스, 바실러스 브레비스, 바실러스 설쿠란스, 바실러스 클로시이, 바실러스 렌터스, 바실러스 리첸니포미스, 바실러스 마세란스, 바실러스 스티아로설모필러스, 바실러스 서브티리스, 비피도박테리움, 브레비바실러스 브레비스, 버크홀데리아 세파시아, 캔디다 실린드라세아, 캔디다 루고사, 칼리카 파파야 (L), 셀룰로시미크로비움, 세팔로스포리움, 채토미움 에라티쿰, 채토미움 그라사일, 클로스트리디움, 클로스트리디움 브티리쿰, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 설모셀룸, 코리네박테히움 (글루타미쿰), 코리네박테리움 에피시엔스, 이스체리키아 콜라이, 엔테로카쿠스, 어위나 크리산테미, 글리코노박터, 글루콘아세토박터, 할로아큘라, 휴미콜라 인솔엔스, 휴미콜라 엔솔렌스, 키타사토스포라 세태, 클렙실라, 클렙실라 옥시토카, 클루이브로마이세스, 클루이브로마이세스 플래길리스, 클루이브로마이세스 락티스, 코쿠리아, 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 세이크, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸오시티스, 메탄노로버스 시실리애, 메탄노게니움 오가노필룸, 메탄노박테리움 브라이언타이, 마이크로박테리움 임페리얼리, 마이크로코쿠스 라이소 데익티쿠스, 마이크로루나투스, 뮤콜자바니쿠스, 마이코박터, 마이로테시움, 나이트로박터, 나미트로소모나스, 노카디아, 파파야 카리카, 페디오코쿠스, 페디오코구스 할로필러스, 페니실리움, 페니실리움 카멤버티, 페니실리움 시트리넘, 페니실리움 에머소나이, 페니실리움 로퀘포티, 페니실리움 릴락티눔, 페니실리움 멀티컬러, 파라코쿠스 판토트로퍼스, 프로피온니박테리움, 수도모나스, 수도모나스 플루오레센스, 수도모나스 데니트리피칸스, 필오코쿠스, 필오코쿠스 퓨리오서스, 필오코쿠스 호리코사이, 리조비움, 리조뮤콜 미헤이, 리조뮤콜 퓨실루스 린트, 리조퍼스, 리조퍼스 델레마, 리조퍼스 자폰이쿠스, 리조퍼스 니비우스, 리조퍼스 오리재, 리조퍼스 올리고스포러스, 로도코쿠스, 사카로마이시스 세레비지애, 스클레로티나 리버티나, 스핑고박테리움 멀티보룸, 스핑고비움, 그핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이시스, 스트렙토마이시스 그리세우스, 스트렙토마이시스 리비단스, 스트렙토마이시스 무리누스, 스트렙토마이시스 루비기노수스, 스트렙토마이시스 바이오라세오루버, 스트렙토버티실리움 모바랜스, 테트라제노코쿠스, 서머스, 티오스패라 판토트로파, 트라미테스, 트리초더마, 트리초더마 롱지브라키아툼, 트리초더마 리에시이, 트리초더마 비리데, 트리초스포론 페니실라툼, 비브리오 알지노리티쿠스, 비브리오 스플렌디더스, 잔소모나스, 이스트, 앨로위아 리프리티카, 자이고사카로마이시스 룩사이, 자이모모나스, 및 자이모모누스 모빌리스를 포함한다.
"형질전환"은 외래 유전자가 숙주 세포 게놈에 흡수되고 병합되어 일어나는 세포의 영구적이고 유전가능한 변형을 일반적으로 지칭한다; 또한 외인성 유전자의 한 생명체의 게놈에서 다른 생명체의 게놈으로의 전달을 지칭한다.
"벡터"는 폴리뉴클레오티드가 삽입되고 클로닝되는 예를 들어, 플라스미드, 박테리오파지, 효모 또는 바이러스로부터 유래된 폴리뉴클레오티드, 바람직하게는 DNA 분자를 의미한다. 벡터는 바람직하게는 하나 또는 그 이상의 독특한 제한 부위를 포함하고 타겟 세포 또는 조직 또는 어버이 세포 또는 그의 조직을 포함하는 정의된 숙주 세포에서 자가적으로 복제를 할 수 있고, 또는 정의된 숙주의 게놈 내로 포함될 수 있어서 클로닝된 서열이 재생산가능하다. 따라서, 상기 벡터는 자가적으로 복제하는 벡터, 즉, 염색체 외로 존재하는 실체인 벡터이고 그들의 복제는 염색체 복제와 독립적이다. 예를 들어 그들은 선형 또는 닫힌 형의 원형 플라스미드, 염색체 외 요소, 미니-염색체 또는 인공 염색체이다. 상기 벡터는 자가복제를 보증하는 임의의 도구를 포함할 수 있다. 이와는 달리, 상기 벡터는 숙주 세포에 도입되었을 때 게놈에 병합되어 그것이 병합된 염색체(들)와 함께 복제될 수 있다. 그러한 벡터는 숙주 염색체의 특정하고 원하는 위치에 재조합될 수 있는 특이적 서열을 포함할 수 있다.
벡터 시스템은 단일 벡터 또는 플라스미드, 두 개 또는 그 이상의 벡터 또는 플라스미드를 포함하고 이들은 전체 DNA를 함께 보유하고 있고 숙주 세포의 게놈 또는 트랜스포손에 전체 DNA를 도입할 수 있다. 벡터의 선택은 벡터가 도입되는 숙주 세포와의 벡터의 호환성에 의존한다. 본 건에서, 상기 벡터는 바람직하게 사이아노박테리아 세포와 같은 대장균에서 작동가능하게 기능적인 벡터이다. 상기 벡터는 녹색 형광 단백질(GFP)과 같은 라포터 유전자를 포함할 수 있고, 이들은 인코딩된 하나 또는 그 이상의 폴리펩티드에 융합될 수 있거나 또는 별개로 발현될 수 있다. 상기 벡터는 또한 적합한 형질전환자 선택을 위해 사용될 수 있는 항생제 내성 유전자와 같은 선택 마커를 포함할 수 있다.
"야생형" 및 "자연적으로 발생하는"이라는 용어는 자연적으로 일어나는 유래로부터 분리되는 유전자 또는 유전자 생성물의 특징을 갖는 유전자 또는 유전자 생성물을 지칭하는데 호환적으로 사용된다. 야생형 유전자 또는 유전자 생성물(예, 폴리펩티드)은 개체군에서 가장 흔히 발견되는 것이고 따라서 임의대로 유전자의 "정상적인" 또는 "야생형" 형태로 디자인된다.
"바이오매스"의 예는 여럿 가운데서 수생 또는 바다 바이오메스, 과일 쓰레기와 같은 과일-기반 바이오매스, 및 야채 쓰레기와 같은 야채-기반 바이오매스를 포함한다. 수생 또는 바다 바이오메스의 예는 제한적이지는 않지만 갈조류, 자이언트 갈조류, 해초, 조류, 바다 미소식물, 미세조류, 시글래스(sea grass) 등을 포함한다. 과일 및/또는 야채 바이오매스의 예는 제한적이지는 않지만 여럿 가운데서 나무 껍질과 같은 펙틴의 임의의 근원 및 감귤, 오렌지, 그레이프플루트, 감자, 토마토, 포도, 망고, 구스베리, 당근, 사탕무 및 사과를 포함하는 찌꺼기를 포함한다. 어떤 양상에서는, 바이오매스는 지각(예, 천연가스, 무연탄 석탄 등과 같은 거의 순수한 탄소로 이루어진 비휘발성 물질)의 최상층에서 전형적으로 발견되는 탄화수소와 같은 탄소의 화석화된 근원을 포함하지 않는다.
"범용화학제품" 또는 "그의 중간체"는 일반적으로 바이오연료와 같은 화학물질과 연관이 있고 하기의 화학식을 가지며, 그것으로부터 생성될 수 있는 임의의 상응하는 알칸을 포함한다:
Figure pct00007
여기서, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2 CH3CH(CH3)(CH2)nCH2 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고,
n은 0 내지 30이다.
특정한 구현 예에서, 범용 화학 제품은 3-하이드록시-2,2,4 트리메틸펜타날, 2,2,4-트리메틸-1,3-펜틸디올, 및/또는 2,2,4-트리메틸펜탄이다. 어떤 구현 예에서, 범용 화학 제품은 3-하이드록시-2-에틸헥사날, 2-에틸-2-헥센-1-알, 2-에틸헥산날, 2-에틸헥사놀, 및/또는 2-에틸헥산이다. 특정한 구현 예에서, 범용 화학 제품은 3-하이드록시-2-부틸-1-옥타놀, 2-부틸-2-옥텐-1-알, 2-부틸-옥타날, 또는 2- 부틸-옥타놀이다.
특정한 양상에서, 2,2,4-트리메틸-1,3-펜탄디올 또는 2-에틸헥사놀과 같은 디올 또는 알코올은 추가로 화학적 또는 효소학적으로 각각 2,2,4-트리메틸펜탄 또는 2-에틸헥산과 같은 그의 상응하는 알칸으로 전환될 수 있다. 그러한 프로세스의 일 예는 "수소화반응"으로 또한 알려진 "수소처리"를 포함한다. 예를 들어, 2,2,4-트리메틸-1,3-펜탄디올, 2-에틸헥사놀, 및 2-부틸-옥타놀과 같은 알코올은 "수소처리"되어 그들의 상응하는 알칸인 2,2,4-트리메틸펜탄, 2-에틸헥산, 및 2-부틸-옥탄을 각각 형성할 수 있다. 석유 정제 시스템에서 "수소처리" 프로세스는 일반적으로 기능기 그룹을 지닌 분자에 수소를 촉매적으로 첨가하는 것을 지칭한다. 수소 처리 촉매제는 일반적으로 몰리브데늄, 니켈 및 코발트 옥사이드의 조합을 하소알루미나(calcined alumina) 입자에 처리함으로써 제형화된다. 알루미나 입자는 그 다음 상당히 높은 내부 표면적(매우 다공성)을 갖도록 제형화되고 제조된다. 촉매 금속은 상기 입자의 내부 표면에 "단일-원자적으로" 침착되고 분배될 수 있다. 수소처리(대 "수소 첨가 분해")에서 알루미나 표면은 전형적으로 가능한 비활성적(즉, 화학적으로 수동적인)으로 제형화되고 제조된다.
"바이오매스-유래 다당류"의 일반적인 예는 제한적이지는 않지만, 알기네이트, 아가, 카라기닌, 후코이단, 펙틴, 폴리갈락터로네이트, 셀룰로오스, 헤미셀룰로오스, 자일란, 아라비난 및 만난을 포함한다. 다당류, 올리고당, 단당류 또는 다른 바이오매스의 당 성분의 예는 제한적이지는 않지만, 알기네이트(예, polyG, polyMG, polyM), 올리고알기네이트(예, ΔM, ΔG, ΔMM, ΔMG, ΔGM, ΔGG, MM, MG, GM, GG, MMM, MGM, MMG, MGG, GMM, GMG, GGM, GGG), 아가, 카라기닌, 후코이단, 펙틴, 글루론네이트, 굴루론네이트, 만눌로네이트, 만니톨, 릭소오스, 셀룰로오스, 헤미셀룰로오스, 셀로바이오스, 글리세롤, 자일리톨, 글루코스, 만노스, 갈락토스, 자일로스, 자일란, 만난, 아라비안, 아라비노스, 글루커론네이트, 갈락터론네이트(디- 및 트리-갈락터론네이트 포함), 람노스 등을 포함한다.
알기네이트-유래 다당류의 특정한 예는 포화 다당류 예를 들어, β-D-만널론네이트, α-L-글루론네이트, 디알기네이트, 탈기네이트, 펜타알기네이트, 헥사알기네이트, 헵타알기네이트, 옥타알기네이트, 논알기네이트, 테가알기네이트, 언데카알기네이트, 도데카알기네이트 및 폴리알기네이트 뿐만 아니라 불포화 다당류, 예를 들어 4-디옥시-L-이리트로-5-헥소세울로오스 우론산, 4-(4-디옥시-베타-D-만-4-에누로노실)-D-만널로네이트 또는 L-굴루론네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-디알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-탈기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-테트라알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-펜타알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-헥사알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-헵타알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-옥타알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-논알기네이트, 4-(4-디옥시-베타-D-만-4-에누로노실)-언데카알기네이트, 및 4-(4-디옥시-베타-D-만-4-에누로노실)-도데카알기네이트를 포함한다.
펙틴-유래 다당류의 특정한 예는 포화 다당류, 예를 들어 갈락터론네이트, 디갈락터론네이트, 트리갈락터론네이트, 테트라갈락터론네이트, 펜타갈락터론네이트, 헥사갈락터론네이트, 헵타갈락터론네이트, 옥타갈락터론네이트, 노나갈락터론네이트, 데카갈락터론네이트, 도데카갈락터론네이트, 폴리갈락터론네이트, 및 람노폴리갈락터론네이트 뿐만 아니라 포화 다당류, 예를 들어 4-디옥시-L-트레오-5-헥소술로오스 우론네이트, 4-(4-디옥시-알파-D-글루크-4-에뉴로노실)-D-갈락터론네이트, 4-(4-디옥시-알파-D- 글루크-4-에누로노실)-D-디갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-트리갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-테트라갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-펜타갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-헥사갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-헵타갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-옥타갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D- 노나갈락터론네이트, 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D- 데카갈락터론네이트, 및 4-(4-디옥시-알파-D-글루크-4-에누로노실)-D-도데카갈락터론네이트를 포함한다.
"적합한 단당류" 또는 "적합한 당류"는 일반적으로 탄소의 근원 또는 유일한 근원으로서 펙틴, 알기네이트 또는 다른 당류(예, 갈락터론네이트, 셀룰로오스, 헤미-셀룰로오스 등을 포함하는 바이오매스-유래 다당류)에서 성장하는 재조합 미생물에 의해 생성될 수 있는 임의의 당류를 지칭하고 바이오연료 또는 바이오 휘발유와 같은 탄화수소를 생성하기 위한 본 발명의 바이오연료 생합성 경로에서 사용되는 임의의 당류를 또한 일반적으로 지칭한다. 적합한 단당류 또는 올리고당의 예는 제한적이지는 않지만 2-케토-3-디옥시 D-글루코네이트(KDG), D-만니톨, 글루론네이트, 만누론네이트, 만니톨, 릭소오스, 글리세롤, 자일리톨, 글루코스, 만노스, 갈락토스, 자일로스, 아라비노스, 글루커론네이트, 갈락터론네이트, 및 람노스 등을 포함한다. 여기에 주지된 바와 같이, 여기서 사용되는 "적합한 단당류" 또는 "적합한 당류"는 가공된 또는 재조합 미생물에 의해 생성될 수 있고 이것은 미국 특허 제 12/245,537호 및 제 12/245,540호에 그런 미생물을 설명하기 위해 여기에 참고로 포함되어 있으며 상업적인 입수가능한 출처로부터 수득될 수 있다.
여기에서 사용되는 상술 "최적화된"는 본래의 분자 또는 본래의 세포 환경(예, 주어진 폴리펩티드의 야생형 서열 또는 야생형 미생물)에 관한 기능적 특성을 향상시키고자 폴리펩티드의 아미노산 서열을 유전적으로 변경 또는 폴리펩티드의 주위 세포 환경을 변경/변화에 의한 것과 같은 변형된 생물학적 활성을 갖는 경로, 유전자, 폴리펩티드, 효소 또는 다른 분자를 지칭한다. 여기에 기술된 임의의 폴리펩티드 또는 효소는 경우에 따라 "최적화"될 수 있고, 여기에 기술된 임의의 유전자 또는 뉴클레오티드 서열은 경우에 따라 최적화된 폴리펩티드 또는 효소를 인코딩할 수 있다. 여기에 기술된 임의의 경로는 경우에 따라 하나 또는 그 이상의 "최적화된" 효소 또는 최적화된 효소 또는 폴리펩티드를 인코딩하는 하나 또는 그 이상의 뉴클레오티드 서열을 포함할 수 있다.
전형적으로, 폴리펩티드, 효소, 또는 다른 분자의 향상된 기능적 특성은 알데히드 및/또는 케톤을 이소옥탄과 같은 바이오연료로 전환하는 생물학적 경로(예, 알데히드 및/또는 케톤 생합성 경로, 알돌라제, 알코올 디하이드로게나제)에서 사용하기 위한 폴리펩티드 또는 다른 분자의 적합성과 관련한다. 따라서, 특정한 구현 예는 "최적화된" 생물학적 경로의 사용을 고려한다. 대표적인 "최적화된" 폴리펩티드는 그것의 아미노산 코딩 서열에서 하나 또는 그 이상의 변형 또는 돌연변이(예, 점 돌연변이, 결실, 이종 기원 서열의 첨가)를 포함할 수 있어서 소정의 미생물 시스템 또는 미생물에서의 향상된 발현 및/또는 안정성을 용이하게 하고, 원하는 기질에 대한 폴리펩티드 활성의 조절(예, 유도할 수 있는 또는 억제할 수 있는 활성)을 가능하게하고, 세포 내에서 폴리펩티드의 위치(예, 세포 내 위치, 세포외 분비)를 조절하고, 및/또는 원하는 기질에 대한 폴리펩티드의 전체 활성 레벨에 영향을 준다(예, 효소 활성을 감소 또는 증대한다). 폴리펩티드 또는 다른 분자는 시스템 또는 유기물 내에서 하나 이상의 경로를 변화시킴으로써 상기 발현(예, 상승 조절), 국재화(localization) 및/또는 "최적화된" 폴리펩티드 또는 다른 분자의 활성을 조절하는 경로를 변화시킴으로써, 또는 다른 변화 중에서 바람직하지 않은 부산물의 생성을 최소화하는 경로를 변화시킴으로써 소정의 미생물 시스템 또는 미생물과 함께 사용하기 위해 "최적화"될 수 있다. 이러한 방식으로 폴리펩티드 또는 다른 분자는 야생형의 아미노산 서열 또는 본래의 화학 구조를 변형하여 또는 변형 없이 "최적화"될 수 있다. 최적화된 폴리펩티드 또는 생물학적 경로는 예를 들어, 당업계에 알려진 기술에 따라 직접적인 돌연변이 또는 원하는 형질에 대한 자연적인 선택에 의해 얻어질 수 있다.
특정한 양상에서, "최적화된" 유전자 또는 폴리펩티드는 참고(예, 야생형) 유전자 또는 폴리펩티드의 뉴클레오티드 또는 아미노산 서열과 50% 내지 99% 동일한(이들 사이에 있는 모든 정수를 포함) 뉴클레오티드 서열 또는 아미노산 서열을 포함할 수 있다. 특정한 양상에서, "최적화된" 폴리펩티드 또는 효소는 참고 폴리펩티드의 생물 활성의 약 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 100 (이들 사이에 있는 모든 정수 및 소숫점을 포함, 예, 1.2, 1.3, 1.4, 1.5, 5.5, 5.6, 5.7, 60, 70, 등), 또는 그 이상 배수의 활성를 가질 수 있다.
본 발명의 특정한 양상은 또한 여기에 기술된 방법 및 재조합 미생물에 따라 생성된 바이오연료와 같은 범용 화학 제품을 포함한다. 그러한 바이오연료(예, 중간 내지 긴 쇄 알칸, 이소옥탄)는 방사성 탄소 연대 측정법에 의해서 조 탄소 근원으로부터 고전적인 정제에 의해 생성된 연료와 같은 다른 연료와 구별될 수 있다. 예를 들어, 탄소는 2개의 안정한 비방사성 동위원소를 가지고 있다: 탄소-12 (12C), 및 탄소-13 (13C). 게다가, 지구상에는 소량의 불안정한 동위원소인 탄소-14(14C)도 존재한다. 탄소-14는 5730년의 반감기를 가지고 있고, 이 동위 원소를 더 많이 생산하는 지구 대기 중의 질소에 대한 우주선의 끊임없는 영향이 없었다면 지구상에서 오래 전에 사라졌을 것이다. 우주선 상호작용으로부터 나오는 중성자는 대기상의 질소 분자(N2)의 원자에서의 핵 반응에 참여한다:
Figure pct00008
식물 및 다른 광합성 생명체는 광합성에 의해 공기중의 이산화탄소를 섭취한다. 다수의 식물이 동물에게 섭취되기 때문에, 지구상의 모든 살아있는 생명체는 탄소-14를 그들이 존재하는 동안 그들의 환경과 항상 교환한다. 생명체가 죽으면, 이러한 교환은 멈추고, 탄소-14의 양이 방사성 베타 붕괴를 통해 시간에 걸쳐서 점차적으로 감소한다.
원유 및 채광 작업으로부터 유래하는 천연 가스와 같은 대수의 탄화수소-기반 연료는 지질학적 시간에 걸친 고대 유기 물질(예, 유모(kerogen))의 압축 및 가열의 결과이다. 석유의 형성은 전형적으로 고온 및/또는 고압에서 다양한 주로 흡열 반응에서 탄화수소의 열분해로부터 일어난다. 오늘날의 기름은 산소 결핍하에서 대량으로 바다 또는 호수 밑바닥에 정착한 선사세대의 동물성 플랑크톤 및 조류의 보전적인 유해로부터 형성된다(선사시대의 육상 식물의 유해는 이와는 반대로 석탄을 형성한다). 지질학적 시간에 걸쳐, 유기 물질이 진흙과 혼합되고 거대한 침전물의 층에 묻혀 높은 수준의 열과 압력을 야기 시킨다(속성작용으로 알려짐). 이러한 프로세스가 유기 물질을 화학적으로 변하게 만들어 첫째로 세계의 다양한 오일 셰일에서 발견되는 유모로 알려진 밀랍 물질을 이루고, 그 후 더 많은 열과 함께 작용하여 퇴화 작용으로 알려진 프로세스에서 액체 및 기체의 탄화수소를 생성한다. 원유로부터 유래 된 대다수의 탄화수소 기반 연료는 지질학적 시간에 걸쳐 탄소-14 붕괴의 절차를 겪어서 탐지할 수 있는 탄소-14가 없다. 대조적으로, 본 발명의 살아있는 미생물에 의해 생성되는 어떤 바이오연료는 현재 모든 다른 살아있는 생물체와 비교할 만한 수준인 탄소-14를 포함하고 있을 것이다(즉, 평형 레벨). 이러한 방식으로, 본 발명의 탄화수소 기반 바이오연료의 탄소-12 대 탄소-14의 비율을 측정 및 그 비율을 원유로부터 유래 된 탄화수소 기반 연료와 비교하여, 여기서 제공된 방법으로 생성된 바이오연료를 통상적인 탄화수소 기반 연료의 근원과 구조적으로 구별할 수 있다.
본 발명의 구현 예는 알데히드, 케톤 또는 그 둘의 근원을 가지고 재조합 미생물을 성장시키는 것을 포함하는 범용 화학 물질을 생성하는 방법을 포함하고 여기서, 재조합 미생물은 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드(즉, 하나 또는 그 이상의 폴리뉴클레오티드) 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드(즉, 하나 또는 그 이상의 폴리뉴클레오티드)를 포함하고 범용 화학 제품을 생성한다. 어떤 구현 예에서, 재조합 미생물은 또한 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 특정한 구현 예에서, 적어도 하나 또는 둘의 폴리뉴클레오티드는 외인성 폴리뉴클레오티드이다. 어떤 구현 예에서, 각 폴리뉴클레오티드는 외인성이다.
본 발명의 구현 예는 또한 재조합 미생물을 포함하고 있으며, 이들 미생물은 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 특정한 구현 예에서, 그러한 미생물은 또한 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 특정한 구현 예에서, 적어도 하나 또는 둘의 폴리뉴클레오티드는 외인성 폴리뉴클레오티드이다. 어떤 구현 예에서, 각 폴리뉴클레오티드는 외인성이다. 이들 재조합 미생물은 전형적으로 알데히드, 케톤 또는 그 둘의 근원으로부터 범용화학제품 또는 그의 중간체를 생성할 수 있다.
본 발명의 구현 예는 또한 재조합 미생물을 포함하고 있으며, 이들 미생물은 (i) 알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함한다. 특정한 구현 예에서, 그러한 미생물은 또한 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 특정한 구현 예에서, 적어도 하나 또는 둘의 폴리뉴클레오티드는 외인성 폴리뉴클레오티드이다. 어떤 구현 예에서, 각 폴리뉴클레오티드는 외인성이다. 이들 재조합 미생물은 전형적으로 알데히드, 케톤 또는 그 둘의 근원으로부터 범용화학제품 또는 그의 중간체를 생성할 수 있고, 또한 적합한 단당류 또는 올리고당류로부터 알데히드, 케톤 또는 그 둘의 상기 근원을 생성할 수 있다.
상기 주지된 바와 같이, 어떤 구현 예에서, 재조합 미생믈은 이중 결합 리덕타제 활성을 갖는 폴리펩티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 외인성 폴리뉴클레오티드를 또한 포함한다. 이들 및 관련된 구현 예에서, 외인성 이중 결합 리덕타제 또는 디하이드라타제의 존재 또는 과잉발현은 그러한 반응이 내재적인 리덕타제 및 디하이드라타제 효소에 의해 촉매될 수 있기 때문에 원하는 생산물(예, 이소옥탄)을 만드는데 필요하지 않을 수 있지만 재조합 미생물에 의해 생성되는 원하는 생성물의 양을 증가시키는데 사용될 수 있다.
여기에서 사용되는 것과 같이. "알돌라제" 활성을 갖는 효소 또는 폴리펩티드는 D-플럭토오스-1,6-비스포스페이트를 절단하여 디하이드록시아세톤 포스페이트 및 D-글리세알데히드-3-포스페이트를 형성하는 가역반응을 촉매할 수 있는 효소 클래스를 일반적으로 지칭한다. 알돌라제 효소는 모든 동물 및 식물 조직 및 다수의 미생물에 존재한다. 동물 및 고등 식물 조직에서 발견되는 클래스 I 알돌라제는 전형적으로 2가 금속 보조인자를 필요하지 않음 및 기질인 디하이드록시아세톤 포스페이트와 케티민 쉬프(ketimine Schiff) 염기 중간체의 형성으로 특성화된다. 전형적으로 효모 및 대장균과 같은 미생물에서 발견되는 클래스 II 알돌라제는 금속 보조인자를 필요로 하며 EDTA에 의해 저해될 수 있다.
하나의 대표적인 알돌라제인 플럭토오스 1,6-비포스페이트 알돌라제 (알돌라제 A)는 해당작용 및 에너지 생성의 주요 반응을 촉매한다. 알돌라제 B는 알돌라제 A의 동질효소(isoenzyme)로서 플럭토오스 1-포스페이트를 절단하여 글리세알데히드 및 디하이드록시아세톤 포스페이트를 형성할 수 있다. 그러나 이 반응은 가역성이라서 글리세알데히드 및 디하이드록시아세톤 포스페이트를 농축하는데 사용될 수 있다.
글리세알데히드 및 디하이드록시아세톤 포스페이트의 농축을 넘어서, 알돌라제 효소는 알데히드 및/또는 케톤 간의 다른 유용한 농축 반응을 촉매한다고 알려져 있다. 특히, 이들 촉매 활성의 가역적 성질은 알데히드 및/또는 케톤의 다양한 조합의 농축 생성물로부터 다양한 범용화학제품 또는 그의 중간체를 생성하는데 유용한 것으로 나타났다. 예를 들어, 본 발명의 알돌라제 효소는 2개 분자의 이소부틸알데히드의 농축을 촉매하여 3-하이드록시-2,2,4-트리메틸 펜타날을 형성할 수 있다. 다른 예로서, 본 발명의 알돌라제 효소는 2개 분자의 부틸알데히드의 농축을 촉매하여 3-하이드록시-2-에틸헥사날을 형성할 수 있다. 다른 예로서, 본 발명의 알돌라제 효소는 2개 분자의 헥산알데히드의 농축을 촉매하여 2-부틸-옥타날을 형성할 수 있다.
따라서, 특정한 양상에서, 상술된 "알돌라제"는 다양한 알데히드 및/케톤의 응축을 촉매할 수 있는 효소를 지칭하며, 알데히드의 예는 여럿 중의 아세토알데히드, 프로피온알데히드, 글루타르알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 헥사알데히드, 헵타알데히드, 옥타알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4- 하이드록시페닐) 아세트알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드, 및/또는 숙시네이트 4-하이드록시페닐 아세토알데히드이고 그의 조합을 포함한다. 알데히드 및/또는 케톤의 응축은 화합물을 생성하는데 사용될 수 있고, 그 화합물은 당업자에게 인식될 수 있는 여럿 중에서 프로파날, 부타날, 이소부타날, 펜타날, 2-메틸부타날, 3-메틸부타날, 헥사날, 2-메틸펜타날, 3-메틸펜타날, 4-메틸펜타날, 헵타날, 옥타날, 2-메틸헵타날, 노나날, 데카날, 언데카날, 도데카날이다.
여기서 사용되는 "알돌라제" 효소 또는 "알돌라제"는 아실-아실 운반체 단백질 (ACP) 활성, 예를 들어 ACP 티오에스터라제 활성을 갖는 효소를 또한 포함한다. 그러한 ACP 에스터라제는 전형적으로 효소 활성 조건하에서 지방 아실-ACP 기질(예, C8 내지 C14)로부터 자유 지방산(들)을 생성함을 촉매하는 능력을 갖는다. 그러나, 아실-ACP 에스터라제는 이소부틸알데히드 및 부틸알데히드와 같은 2개의 알데히드 및/또는 케톤의 농축을 촉매하여 각각 3-하이드록시-2,2,4-트리메틸펜타날 및 2-에틸-2-헥센-1-알과 같은 해당 알킬 알데히드를 형성할 수 있다.
그런 에스터라제는 여기에 제공된 특이적 예제 서열 및 관계된 유래로부터 수득될 수 있다. 예를 들어, 쿠페아(Cuphea) 속의 몇몇 종은 예를 들어, 프로컴벤스, 루테아, 후케하나, 히소피폴리아, 라이티 및 인플라타의 그들 씨앗에 중간 쇄 지방산을 포함하는 트리글리세리드를 축적한다. 중간 쇄 지방산의 다른 자연적 식물 유래는 로라시에(Lauraceae) 패밀리(예, 피사(악티노도픈 후케리(Actinodophne hookeri)) 및 스윗 베이 (로러스 노빌리스(Laurus nobilis)))의 씨이다. 다른 식물 유래는 C14 지방산을 축적하고 있다고 보고된 미리스티카과(Myristicaceae), 소태나무과(Simarubaceae), 보키시아과(Vochysiaceae), 및 살바도라과(Salvadoraceae), 및 에리스마(Erisma), 피크람니아 및 비롤라의 우림 종을 포함한다. FATB1 및 FATB2를 포함하는 알돌라제 활성을 갖는 대표적인 에스터라제는 미국 특허 제 5,298,421호, 제 5,304,481호, 제 5,344,771호, 제 5,455,167호, 및 제 5,667,997호 및 Yuan 등 (PNAS USA 92:10639-634, 1995)에 기술되어 있으며, 그들의 ACP-아실 티오에스터라제 폴리뉴클레오티드 및 폴리펩티드 서열을 위해 참고로 여기에 포함된다.
특정한 구현 예에서, 재조합 미생물은 알돌라제 활성을 갖는 폴리펩티드를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드 서열을 포함할 수 있으며, 여기서, 폴리뉴클레오티드는 SEQ ID NOS:215-222 또는 여기에 기술되고 당업계에 알려진 조건하에서 그들의 상보체와 혼성화하는 폴리뉴클레오티드 서열과 80%, 85%, 90%, 95%, 97%, 98%, 99%의 서열 동일성을 갖는다. SEQ ID NO:215는 쿠페아 후커리아나로부터의 FATB2 효소를 인코딩한다. SEQ ID NO:216는 쿠페아 란세올라타로부터 FATB3 효소를 인코딩한다. SEQ ID NOS:217 및 218는 쿠페아 란세올라타로부터 케토아실-ACP 신타제 IV (KASIV)를 인코딩한다. SEQ ID NO:219은 쿠페아 란세올라타로부터 ACP1-2 효소를 인코딩한다. SEQ ID NO:220은 쿠페아 란세올라타로부터 ACP1-3 효소를 인코딩하고 및 SEQ ID NO:221은 쿠페아 란세올라타로부터 ACP1-1 효소를 인코딩한다. SEQ ID NO:222는 쿠페아 란세올라타로부터 Acl1을 인코딩한다.
알돌라제 효소는 또한 여럿 중의 털모토가 마리티마 및 이스케리키아 콜라이 DH 1OB와 같은 유기체로부터 수득될 수 있다. 예를 들어, 어떤 구현 예에서, 알돌라제 효소는 SEQ ID NOS:51-82로 나타낸 폴리뉴클레오티드 참고 서열 및/또는 이들 폴리뉴클레오티드 참고 서열에 의해 인코딩되는 폴리펩티드 참고 서열에 기초를 둘 수 있다. 따라서, 본 발명의 특정한 재조합 미생물은 여기에 기술되어 있고 당업계에 알려진 바와 같이 SEQ ID NOS: 51-82 또는 중간 또는 고 스트린전시 조건하에서 그들의 상보체와 혼성화하는 폴리뉴클레오티드와 80%, 85%, 90%, 95%, 97%, 98%, 99%의 서열 동일성을 갖는 하나 또는 그 이상의 폴리뉴클레오티드 서열을 포함할 수 있다.
본 발명의 특정한 "알돌라제" 효소 또는 그 효소를 인코딩하는 폴리뉴클레오티드 서열은 특정의 보전적인 모티프 또는 도메인에 의해 또한 특성화될 수 있다. 이러한 관점에서, 이스체리키아 콜라이 DH 1Oβ로부터 20 개의 알돌라제 효소를 포함하는 다양한 아미노산 서열이 PROSITE 데이터베이스를 사용하여 공동 서열 모티프에 대해 분석되었다. 다수의 이들 서열은 알려진 서열 프로파일에 강한 매치를 생성하였다. ECDH10B0008 (SEQ ID NO:63)에 의해 인코딩된 ALDOL1, EC ECDH10B0894 (SEQ ID NO:64)에 의해 인코딩된 ALDOL2, ECDH10B2629 (SEQ ID NO:72)에 의해 인코딩된 ALDOL10, ECDH10B4135 (SEQ ID NO:81 )에 의해 인코딩된 ALDOL19는 모티프인 "트랜스알돌라제 시그너쳐 1" 및 "트랜스알돌라제 시그너쳐 2"를 공유한다(아래 표 4를 참조). 또한, ECDH10B1991 (SEQ ID NO:67)에 의해 인코딩된 ALDOL 5는 2개의 모티프인 "KDPG 및 KHG 알돌라제 활성 부위" 모티프 및 "KDPG 및 KHG 알돌라제 쉬프-염기 형성 잔기" 모티프를 포함하고(아래 표 4를 참조), 및 ECDH10B2249 (SEQ ID NO:68)에 의해 인코딩된 ALDOL6, ECDH10B3100 (SEQ ID NO:74)에 의해 인코딩된 ALDOL12, ECDH10B3310 (SEQ ID NO:78)에 의해 인코딩된 ALDOL16은 모티프인 "플럭토오스-비스포스페이트 알돌라제 클래스-ll 시그너쳐 1" 및 "플럭토오스-비스포스페이트 알돌라제 클래스-ll 시그너쳐 2"를 공유한다(아래 표 4를 참조).
대표적인 알돌라제 모티프는 하기 표 3에 나타나고, ECDH10B (E. 콜라이 DH10B) 알돌 서열 단편 매치는 표 4에 나타난다.
Figure pct00009
Figure pct00010
따라서, 특정한 구현 예에서, 본 발명의 재조합 미생물은 알돌라제 효소 또는 폴리펩티드를 인코딩하는 하나 또는 그 이상의 폴리뉴클레오티드를 포함할 수 있고, 여기서 알돌라제 효소 또는 폴리펩티드는 표 3 및 4에 예시된 하나 또는 그 이상의 도메인 또는 모티프, 또는 이들 모티프의 생물학적으로 활성이 있는 변형체를 포함한다. 이들 변형체는 알데히드 및/또는 케톤의 다양한 조합의 농축의 촉매를 용이하게 할 수 있다.
"알코올 디하이드로게나제" 활성을 갖는 효소 또는 폴리펩티드는 일반적으로 알데히드 또는 케톤 치환기를 알코올 또는 디올로 전환시키는 것을 촉매하는 효소를 지칭하고, 2차 알코올 디하이드로게나제를 포함할 수 있다. 예를 들어, 2,2,4-트리메틸펜타날은 알코올 디하이드로게나제(Adh) 활성을 갖는 효소에 의해 2,2,4-트리메틸-1,3-펜탄디올로 환원될 수 있고, 이는 이소부틸알데히드를 이소옥탄으로 전환하는 하나의 효소 단계를 나타낸다.
특정한 양상에서, 재조합 미생물은 SEQ ID NOS:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 30, 31, 33, 및 83-96으로부터 선택된 뉴클레오티드 참고 서열에 의해 인코딩되는 하나 또는 그 이상의 알코올 디하이드로게나제, 또는 임의의 이들 폴리뉴클레오티드 서열에 의해 인코딩되고 SEQ ID NOS:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 및 34에서 선택된 폴리펩티드 서열과 같은 폴리펩티드 또는 효소를 포함할 수 있고, 이들은 생물학적으로 활성이 있는 단편 또는 최적화된 변형체와 같은 그의 변형체를 포함한다. 본 발명의 특정한 재조합 미생물은 SEQ ID NOS:1-34 또는 83-96에 80%, 85%, 90%, 95%, 97%, 98%, 99% 서열 동일성을 갖는 하나 또는 그 이상의 뉴클레오티드 서열 또는 폴리펩티드 서열을 포함할 수 있다.
상기에 언급된 알코올 디하이드로게나제 서열에 대해, SEQ ID NO:1는 뉴클레오티드 서열이고 SEQ ID NO:2는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-1: PP_1946)의 폴리펩티드 서열이다. SEQ ID NO:3은 뉴클레오티드 서열이고 SEQ ID NO:4는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-2: PP_1817)의 폴리펩티드 서열이다.
SEQ ID NO:5는 뉴클레오티드 서열이고, SEQ ID NO:6는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-3: PP_1953)의 폴리펩티드 서열이다. SEQ ID NO:7는 뉴클레오티드 서열이고, SEQ ID NO:8는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-4: PP_3037)의 폴리펩티드 서열이다.
SEQ ID NO:9는 뉴클레오티드 서열이고, SEQ ID NO:10는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-5: PP_1852)의 폴리펩티드 서열이다. SEQ ID NO:11는 뉴클레오티드 서열이고, SEQ ID NO:12는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-6: PP_2723)의 폴리펩티드 서열이다.
SEQ ID NO:13는 뉴클레오티드 서열이고 SEQ ID NO:14는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-7: PP_2002)의 폴리펩티드 서열이다. SEQ ID NO:15는 뉴클레오티드 서열이고 SEQ ID NO:16는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-8: PP_1914)의 폴리펩티드 서열이다.
SEQ ID NO:17는 뉴클레오티드 서열이고 SEQ ID NO:18는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-9: PP_1914)의 폴리펩티드 서열이다. SEQ ID NO:19는 뉴클레오티드 서열이고 SEQ ID NO:20는 수도모나스 퓨티다(Pseudomonas putida) KT2440로부터 분리된 2차 알코올 디하이드로게나제(2adh-10: PP_3926)의 폴리펩티드 서열이다.
SEQ ID NO:21는 뉴클레오티드 서열이고 SEQ ID NO:22는 수도모나스 플루오레센스(Pseudomonas fluorescens) Pf-5로부터 분리된 2차 알코올 디하이드로게나제(2adh-11: PP_1756)의 폴리펩티드 서열이다. SEQ ID NO:23는 뉴클레오티드 서열이고 SEQ ID NO:24는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578(Klebsiella pneumoniae subsp. pneumoniae MGH 78578) 로부터 분리된 2차 알코올 디하이드로게나제(2adh-12: KPN_01694)의 폴리펩티드 서열이다.
SEQ ID NO:25는 뉴클레오티드 서열이고 SEQ ID NO:26는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-13: KPN_02061)의 폴리펩티드 서열이다. SEQ ID NO:27는 뉴클레오티드 서열이고 SEQ ID NO:28은 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-14: KPN_00827)의 폴리펩티드 서열이다.
SEQ ID NO:29는 뉴클레오티드 서열이고 SEQ ID NO:30는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-16: KPN_01350)의 폴리펩티드 서열이다. SEQ ID NO:31는 뉴클레오티드 서열이고 SEQ ID NO:32는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-17: KPN_03369)의 폴리펩티드 서열이다. SEQ ID NO:33는 뉴클레오티드 서열이고 SEQ ID NO:34는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578로부터 분리된 2차 알코올 디하이드로게나제(2adh-18: KPN_03363)의 폴리펩티드 서열이다.
SEQ ID NOS:83-96의 폴리뉴클레오티드 서열을 인코딩하는 알코올 디하이드로게나제는 수도모나스 퓨티다(Pseudomonas putida)로부터 수득되었다.
어떤 양상에서, 알코올 디하이드로게나제(adh), 2차 알코올 디하이드로게나제(2adh), 단편, 변형체, 또는 그의 유도체 또는 그러한 활성 부위를 사용하는 임의의 다른 효소는 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드(NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트(NADP+), 또는 NADPH 결합 모티프를 포함할 수 있다. 어떤 구현 예에서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프는 Y-X-G-G-X-Y (SEQ ID NO:245), Y-X-X-G- G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X-Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X-G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y- X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X-X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택될 수 있다; 여기서 Y는 알라닌, 글리신 및 세린으로부터 독립적으로 선택되고 여기서, G는 글리신이고 및 여기서 X는 유전적으로 인코딩되는 아미노산으로부터 독립적으로 선택된다.
특정한 구현 예에서, 미생물 시스템 또는 재조합 미생물은 수도모나스, 로도코커스 이리트로폴리스(Rhodococcus erythropolis) ATCC4277, 노르카디아 푸스카(Norcadia fusca) AKU2123, 크렙실라 또는 다른 적합한 생명체로부터 자연적인 또는 최적화된 알코올 디하이드로게나제를 포함할 수 있다. 알코올 디하이드로게나제를 인코딩하는 유전자는 당업계에 알려진 기술에 따라 이들 또는 다른 생명체로부터 분리될 수 있고 여기에 기술된 바와 같이 재조합 미생물내에 포함될 수 있다.
"이중 결합 리덕타제" 활성을 갖는 효소 또는 폴리펩티드는 하기의 일반적인 반응을 촉매하는 효소를 일반적으로 지칭한다:
Figure pct00011
여기에 주지된 바와 같이 특정한 구현 예에서, 상기 반응은 소정의 미생물에서 내인성의 효소에 의해 촉매될 수 있어서 이중 결합 리덕타제 활성을 갖는 외인성 효소의 첨가는 본 발명을 실시하는데 있어서 불필요할 수 있다. 그럼에도 불구하고, 특정한 양상에서 이중 결합 리덕타제 효소의 과잉 발현 또는 고려되는 특정 반응의 구성분에 증가된 친화도를 갖는 특정한 이중 결합 리덕타제의 발현은 원하는 범용화학제품 또는 그의 중간체의 증가된 생산이 가능할 수 있다.
이중 결합 리덕타제는 예를 들어, 여럿 중에서 새캐로마이스 세레비지에(Saccharomyces cerevisiae), 피키아 안구스타(Pichia angusta), 자이모모나스 모빌리스(Zymomonas mobilis), 이스체리키아 콜라이(E. coli), 크렙실라 뉴모니애, 수도모나스 푸티다(Pseudomonas putida)로부터 수득될 수 있다.
특정한 구현 예에서, 이중 결합 리덕타제는 SEQ ID NOS:35-50로 나타낸 폴리뉴클레오티드 참고 서열 및/또는 이들 폴리뉴클레오티드에 의해 인코딩되는 상응하는 폴리펩티드 참고 서열에 기반을 둘 수 있다. 따라서, 본 발명의 어떤 재조합 미생물은 SEQ ID NOS:35-50에 80%, 85%, 90%, 95%, 97%, 98%, 99% 서열 동일성을 갖는 하나 또는 그 이상의 폴리뉴클레오티드 또는 여기에 기술되고 당업계에 알려진 조건하에서 그들의 상보체와 혼성화하는 폴리뉴클레오티드 서열을 포함할 수 있다.
본 발명의 "이중 결합 리덕타제" 효소 또는 그 효소를 인코딩하는 폴리뉴클레오티드 서열은 여기에 기술되고 당업계에 알려진 바와 같이 특정의 보전적인 모티프 또는 도메인으로써 특성화될 수 있다.
특정한 구현 예에서, 알돌라제 활성을 갖는 효소에 의해 응축되어 범용화학제품 또는 그의 중간체를 형성하는 알데히드, 케톤 또는 그 둘의 유래는 알데히드 및/또는 케톤 생합성 경로를 함유하는 재조합 미생물을 포함할 수 있다. 어떤 구현 예에서, 그러한 생합성 경로는 알데히드 생합성 경로, 케톤 생합성 경로 또는 그 둘을 포함할 수 있다.
특정한 구현 예에서, 생합성 경로는 하나 또는 그 이상의 아세토알데히드, 프로피온알데히드, 글루타알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드, 및/또는 숙시네이트 4-하이드록시페닐 아세트알데히드 생합성 경로를 포함하고 그의 다양한 조합을 포함한다.
특정한 구현 예에서, 상기 생합성 경로는 부틸알데히드 또는 이소부틸알데히드 생합성 경로를 포함한다. 대표적인 알데히드 및 케톤 생합성 경로는 여기와 미국 출원 제 12/245,537호 및 제 12/245,540호에 기술되어 있으며 이들은 알데히드 및 케톤 생합성 경로 설명을 위해 여기에 참고로 포함된다.
특정한 양상에서, 프로피온알데히드 생합성 경로는 이스체리키아 콜라이와 같은 생명체로부터 트레오닌 디아미나제(ilvA) 유전자 및 락토카커스 락티스와 같은 생명체로부터 케토-이소발러레이트 디카르복실라제(kivd) 유전자 및/또는 그의 상동체 또는 오르토로그(ortholog) 뿐만 아니라 최적화된 변형체를 포함하는 이들 효소의 기능적 변형체를 포함할 수 있다. 이들 효소는 일반적으로 L-트레오닌을 프로피온알데히드로 전환하는데 사용될 수 있다.
특정한 양상에서, 부틸알데히드 생합성 경로는 이스체리키아 콜라이와 같은 생명체로부터 적어도 하나의 티올라제(atoB) 유전자, β-하이드록시 부티릴-CoA 디하이드로게나제(hbd) 유전자, 크로톤나제 (crt) 유전자, 부티릴-CoA 디하이드로게나제 (bcd) 유전자, 전자 전달 플라보프로테인 A (etfA) 유전자 및/또는 크로스트리디움 아세토부티리컴(예, ATCC 824)과 같은 생명체로부터의 전자 전달 플라보프로테인 B (etfB), 뿐만 아니라 크로스트리디움 베이저린키 아세토부티리컴 ATCC 824와 같은 생명체로부터 보조효소 A-연결 부틸알데히드 디하이드로게나제(ald) 유전자를 포함할 수 있다. 어떤 양상에서, 크로스트리디움 아세토부티리컴 ATCC 824와 같은 생명체로부터의 보조효소 A-연결 알코올 디하이드로게나제(adhE2) 유전자는 ald 유전자의 대안으로 사용될 수 있다.
특정한 양상에서, 이소부틸알데히드 생합성 경로는 바실러스 서브틸리스(Bacillus subtilis)와 같은 생명체로부터 아세토락테이트 신타제(alsS) 또는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578과 같은 생명체로부터 als 유전자를 포함할 수 있다(코돈 사용이 이스체리키아 콜라이 단백질 발현에 있어서 최적화될 수 있다). 그러한 경로는 이스체리키아 콜라이와 같은 생명체로부터 아세토락테이트 리덕토이소머라제 (ilvC) 및/또는 2,3-디하이드록시이소발러레이트 디하이드라타제(ilvD) 유전자, 뿐만 아니라 락토카커스 락티스와 같은 생명체로부터 케토-이소발러레이트 디카르복실라제(kivd) 유전자를 또한 포함할 수 있다.
특정한 양상에서, 3-메틸부틸알데히드 및 2-메틸부틸알데히드 생합성 경로는 바실러스 서브틸리스(Bacillus subtilis)와 같은 생명체로부터 아세토락테이트신타제(alsS) 또는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578과 같은 생명체로부터 (als) 유전자를 포함할 수 있다(코돈 사용이 이스체리키아 콜라이 단백질 발현에 있어서 최적화될 수 있다). 그러한 경로의 특정한 양상은 이스체리키아 콜라이와 같은 유기체로부터 아세토락테이트 리덕토이소머라제 (ilvC), 2,3-디하이드록시이소발러레이트 디하이드라타제 (ilvD), 이소프로필말레이트 신타제(LeuA), 이소프로필말레이트 이소머라제 (LeuC 및 LeuD), 및 3-이소프로필말레이트 디하이드로게나제(LeuB) 유전자, 뿐만 아니라 락토카커스 락티스(Lactococcus lactis)와 같은 유기체로부터 케토-이소발러레이트 디카르복실라제(kivd)를 또한 포함할 수 있다.
특정한 양상에서, 페닐아세토알데히드 및 4-하이드록시페닐아세토알데히드 생합성 경로는 이스체리키아 콜라이와 같은 유기체로부터 하나 또는 그 이상의 3-디옥시-7-포스포헵튤론네이트 신타제 (aroF, aroG, 및 aroH), 3-디하이드로퀴네이트 신타제(aroB), 3-디하이드로퀴네이트 디하이드라타제(aroD), 디하이드로쉬키메이트 리덕타제(aroE), 쉬키메이트 키나제 II(aroL), 쉬키메이트 키나제 I(aroK), 5-에놀피루빌쉬키메이트-3-포스페이트 신테타제(aroA), 코리스메이트 신타제(aroC), 융합 코리스메이트 뮤타제 P/프리페네이트 디하이드라타제(pheA), 및/또는 융합 코리스메이트 뮤타제 T/프리페네이트 디하이드로게나제 (tyrA) 유전자, 뿐만 아니라, 락토카커스 락티스(Lactococcus lactis)와 같은 생명체로부터 케토-이소발러레이트 디카르복실라제(kivd)를 포함할 수 있다.
특정한 구현 예에서, 알데히드, 케톤 또는 그 둘 다의 유래인 재조합 미생물은 알데히드 또는 케톤을 범용화학제품으로 전환하는 재조합 미생물과 같다. 예를 들어, 이소옥탄 생성에 있어서, 그러한 재조합 미생물은 이소부틸알데히드 생합성 경로, 알돌라제 효소, 경우에 따라 이중 결합 리덕타제 효소 및 알코올 디하이드로게나제 효소를 포함할 수 있고, 적합한 단당류를 이소부틸알데히드로 이어서 3-하이드록시-2,2,4-트리메틸 펜타날 및 2,2,4-트리메틸-1,3-펜탄디올로 전환할 수 있다. 이러한 및 관련된 양상에서, 2,2,4-트리메틸-1,3-펜탄디올은 여기에 기술되고 당업자에게 알려진 바와 같이 "수소처리"에 의해서 추가로 이소옥탄으로 전환될 수 있다.
추가적인 예로서, 2-에틸헥사놀 및 2-에틸헥산과 같은 범용화학제품의 생성에 있어서, 그러한 재조합 미생물은 부틸알데히드 생합성 경로, 알돌라제 효소, 경우에 따라 이중 결합 리덕타제 및 알코올 디하이드로게나제 효소를 포함할 수 있으며, 적합한 단당류를 부틸알데히드 이어서, 3-하이드록시-2-에틸 헥사날, 2-에틸-2-헥센-1-알, 2-에틸헥사날, 및 최종적으로 2-에틸헥사놀로 전환시킬 수 있다. 이러한 및 관련된 양상에서, 2-에틸헥산놀은 여기에 기술되고 당업자에게 알려진 바와 같이 "수소처리"에 의해서 추가로 2-에틸헥산으로 전환될 수 있다.
특정한 구현 예에서, 알데히드, 케톤 또는 그 둘 다의 유래인 재조합 미생물은 알데히드 또는 케톤을 범용화학제품으로 전환하는 재조합 미생물과 다를 수 있다. 이러한 및 관련된 구현 예에서, 알데히드 및/또는 케톤 생합성 경로를 갖는 첫번째 재조합 미생물은 하나 또는 그 이상의 알데히드 및/또는 케톤를 생성하기 위한 유래 또는 공급 원료로서 사용될 수 있으며 그 후, 알돌라제, 경우에 따라서 외인성 이중 결합 리덕타제 및 알코올 디하이드로게나제를 포함하는 두 번째 재조합 미생물에 의해 2,2,4-트리메틸-1,3-펜탄디올 또는 2-에틸헥사놀과 같은 원하는 범용화학제품으로 전환될 수 있다. 이러한 및 관련된 구현 예에서, 상기 두 재조합 미생물은 공동 배양될 수 있다. 대안적으로, 알데히드, 케톤, 또는 둘 다는 첫 번째 재조합 미생물에 의해서 생성될 수 있으며 그 후 알돌라제 및 알코올 디하이드로게나제를 포함하는 두 번째 재조합 미생물과 같이 항온처리될 수 있다. 다양한 다른 조합 및 본 발명의 양상이 이 관점에 있어서 당업자들에게 명확할 것이다.
다른 구현 예에서, 이소부틸알데히드와 같은 알데히드 및/또는 케톤의 유래는 상업적으로 입수가능한 근원과 같은 임의의 다른 적합한 유래일 수 있다. 이러한 및 임의의 구현 예에서, 알데히드, 케톤 또는 둘다의 "유래"는 알데히드 또는 케톤 그 자체를 포함할 수 있으며, 이들은 필요로 하다면 미생물 배양 시스템에 직접적으로 첨가될 수 있다.
여기에 기술된 모든 다른 경로 및 효소에 관해서, 여기에 기술된 알돌라제, 경우에 따른 이중 결합 리덕타제 및 알코올 디하이드로게나제 및 알데히드 및/또는 케톤 생합성 경로의 각 구성분은 내인성으로 또는 외인성으로 재조합 미생물에 존재한다. 주어진 생합성 경로의 효율을 향상시키고자, 예를 들어, 내인성 유전자는 내인성 유전자의 재조합 미생물 내로 부가적인 카피(즉, 외인성 유전자)를 도입함으로써 상승조절 또는 과잉발현될 수 있다. 그런 경로는 기능성을 향상시키고자 내인성 유전자를 돌연변이생성을 통해 변형함으로써, 그 후 변형된 유전자를 미생물 내로 도입함으로써 또한 최적화될 수 있다. 내인성 유전자의 발현은 당업계에 알려진 기술 및 여기에 기술된 바에 따라서 상승 또는 하강 조절될 수 있으며 심지어 제거될 수 있다. 유사하게, 내재적인 유전자 또는 폴리뉴클레오티드 서열의 발현 레벨은 다양한 구조적 또는 유도성의 프로모터에 의해 원하는 바와 같이 조절될 수 있다. 그러한 유전자 또는 폴리뉴클레오티드는 여기에 기술되고 당업계에 알려진 바와 같이 또한 "코돈-최적화"될 수 있다. 상동체 또는 그의 오르토로그를 포함하는 기능적으로 자연적으로 발생하는 상기 유전자 및 효소/폴리펩티드의 변형체도 또한 포함된다.
본 발명에 따라 임의의 미생물이 사용될 수 있다. 어떤 양상에서, 미생물은 진핵 또는 원핵미생물이다. 특정한 양상에서, 미생물은 S. 세레비지에와 같은 효모이다. 어떤 양상에서, 그람-양성 대장균 또는 그람-음성 대장균과 같은 대장균이다. 빠른 성장률, 잘 알려진 유전학, 다양한 유전학적 도구 및 이종 단백질을 생성하는 능력때문에, 유전학적으로 변형된 E. 콜라이가 알지네이트 또는 펙틴과 같은 다당류의 분해 및 대사, 또는 바이오연료와 같은 범용화학제품의 형성과 생합성에 대해서 여기에 기술된 미생물 시스템의 어떤 구현 예에서 사용될 수 있다.
숙주 세포와의 효소 및 대사체의 호환성에 부분적으로 기초하여 본 발명에 따라 다른 미생물이 사용될 수 있다. 예를 들어, 아세토박터 아세티, 아크로모박터, 아시디필리움, 아시네토박터, 악티노마두라, 악티노플래인, 애로피룸 퍼닉스, 아그로박테리움, 알칼리진, 아나나스 코모수스(M), 아스로박터, 아스파질러스 니거, 아스파질러스 오리제, 아스파질러스 멜레우스, 아스파질러스 퍼브루엔투스, 아스파질러스 사이토이, 아스파질러스 소지, 아스파질러스 우사이이, 바실러스 알칼로필러스, 바실러스 아밀로리퀘파시엔스, 바실러스 브레비스, 바실러스 설쿠란스, 바실러스 클로시이, 바실러스 렌터스, 바실러스 리첸니포미스, 바실러스 마세란스, 바실러스 스티아로설모필러스, 바실러스 서브티리스, 비피도박테리움, 브레비바실러스 브레비스, 버크홀데리아 세파시아, 캔디다 실린드라세아, 캔디다 루고사, 칼리카 파파야 (L), 셀룰로시미크로비움, 세팔로스포리움, 채토미움 에라티쿰, 채토미움 그라사일, 클로스트리디움, 클로스트리디움 브티리쿰, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 설모셀룸, 코리네박테히움 (글루타미쿰), 코리네박테리움 에피시엔스, 이스체리키아 콜라이, 엔테로카쿠스, 어위나 크리산테미, 글리코노박터, 글루콘아세토박터, 할로아큘라, 휴미콜라 인솔엔스, 휴미콜라 엔솔렌스, 키타사토스포라 세태, 클렙실라, 클렙실라 옥시토카, 클루이브로마이세스, 클루이브로마이세스 플래길리스, 클루이브로마이세스 락티스, 코쿠리아, 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 세이크, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸오시티스, 메탄노로버스 시실리애, 메탄노게니움 오가노필룸, 메탄노박테리움 브라이언타이, 마이크로박테리움 임페리얼리, 마이크로코쿠스 라이소 데익티쿠스, 마이크로루나투스, 뮤콜자바니쿠스, 마이코박터, 마이로테시움, 나이트로박터, 나미트로소모나스, 노카디아, 파파야 카리카, 페디오코쿠스, 페디오코구스 할로필러스, 페니실리움, 페니실리움 카멤버티, 페니실리움 시트리넘, 페니실리움 에머소나이, 페니실리움 로퀘포티, 페니실리움 릴락티눔, 페니실리움 멀티컬러, 파라코쿠스 판토트로퍼스, 프로피온니박테리움, 수도모나스, 수도모나스 플루오레센스, 수도모나스 데니트리피칸스, 필오코쿠스, 필오코쿠스 퓨리오서스, 필오코쿠스 호리코사이, 리조비움, 리조뮤콜 미헤이, 리조뮤콜 퓨실루스 린트, 리조퍼스, 리조퍼스 델레마, 리조퍼스 자폰이쿠스, 리조퍼스 니비우스, 리조퍼스 오리재, 리조퍼스 올리고스포러스, 로도코쿠스, 사카로마이시스 세레비지애, 스클레로티나 리버티나, 스핑고박테리움 멀티보룸, 스핑고비움, 그핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이시스, 스트렙토마이시스 그리세우스, 스트렙토마이시스 리비단스, 스트렙토마이시스 무리누스, 스트렙토마이시스 루비기노수스, 스트렙토마이시스 바이오라세오루버, 스트렙토버티실리움 모바랜스, 테트라제노코쿠스, 서머스, 티오스패라 판토트로파, 트라미테스, 트리초더마, 트리초더마 롱지브라키아툼, 트리초더마 리에시이, 트리초더마 비리데, 트리초스포론 페니실라툼, 비브리오 알지노리티쿠스, 잔소모나스, 이스트, 자이고사카로마이시스 룩사이, 자이모모나스, 및 자이모모누스 모빌리스로와 같은 다른 생명체가 여기에 제공되는 재조합 미생물로서 사용될 수 있고 따라서, 본 발명의 다양한 방법에 따라 사용될 수 있다.
여기에 기술된 다양한 구현 예는 추가의 구현 예를 제공하기 위해서 조합될 수 있다. 본 명세서 및/또는 출원 데이터 시트에 언급되거나 열거된 미국 특허, 미국 특허 출원 공개, 미국 특허 출원, 외국 특허, 외국 특허 출원 및 비특허 공개 모두는 그들의 전체로 참고로 여기에 포함된다. 추가로 구현 예를 제공하기 위해서, 다양한 특허, 출원 및 공개물의 개념을 사용하고자 구현 예의 양상이 변형될 수 있다.
이들 및 다른 변화가 상기의 자세한 설명 관점에서 구현 예에 만들어질 수 있다. 일반적으로, 하기의 청구항에서, 사용된 용어는 명세서 및 청구항에 개시된 특정 구현 예에 대한 청구항을 제한하도록 해석되어서는 안 되며, 그런 청구항의 자격이 있는 동등체의 전체 범위에 따라 모든 가능한 구현 예를 포함하도록 해석되어야 한다. 따라서, 청구항은 개시물에 의해서 제한받지 않는다.
하기의 실시 예는, 제한적이지 않고, 도시에 의해 제공된다.
도 1은 이소부틸알데히드가 생체 내에서 2,4,4-트리메틸-1,3-펜탄디올로 전환되는 대표적인 경로를 나타낸다.
도 2는 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 3-하이드록시-2,2,4-트리메틸펜타날의 생성을 나타낸다.
도 3은 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 2-에틸-2-헥센-1-알의 생성을 나타낸다.
도 4는 GC-MS로 측정된바 (A) pTrcTM1559를 갖는 DH 10B 종 및 (B)그의 대조군 플라스미드를 갖는 DH 10B 종으로부터의 2-부틸-2-옥텐-1-알의 생성을 나타낸다.
실시예
실시예 1 알데히드/케톤 생합성 경로
부틸알데히드 및 이소부틸알데히드와 같은 알데히드 및/또는 케톤의 유용한 유래를 제공하기 위해서, 알데히드 및/또는 케톤생합성 경로를 포함하고 적합한 단당류 또는 올리고당을 알데히드 또는 케톤으로 전환시킬 수 있는 재조합 미생물을 작제하였다.
E. 콜라이로 부터의 티올라제(atoB) 유전자, 클로스트리디움 아세토부티리컴 ATCC 824로부터의 β-하이드록시 부티릴-CoA 디하이드로게나제(hbd), 크로톤나제(crt), 부티릴-CoA 디하이드로게나제(bcd), 전자 전달 플라보프로테인 A (etfA), 및 전자 전달 플라보프로테인 B(etfB) 유전자 및 클로스트리디움 베이저린키 아세토부티리컴 ATCC 824로부터의 보조효소 A-연결 부틸알데히드 디하이드로게나제(ald) 유전자를 포함하는 부틸알데히드 생합성 경로를 E. 콜라이에서 구축하여 부틸알데히드를 생성하는 능력을 테스트하였다. 또한, 클로스트리디움 아세토부티리컴 ATCC 824로부터의 보조효소 A-연결 알코올 디하이드로게나제(adhE2) 유전자를 ald의 대안으로 사용하여 부탄올을 생성하는 능력을 테스트하였다.
바실러스 서브틸리스로부터의 아세토락테이트 신타제(alsS) 또는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578(코돈 사용이 E. 콜라이 단백질 발현에 대해 최적화되었다)로부터의 (als) 및 E. 콜라이로부터의 아세토락테이트 리덕토이소머라제(ilvC) 및 2,3-디하이드록시이소발러레이트 디하이드라타제(ilvD) 유전자 및 락토카커스 락티스로부터의 케토-이소발러레이트 디카르복실라제(kivd)를 포함하는 이소부틸알데히드 생합성 경로를 구축하여 이소부타날 생성 측정과 같이 이소부틸알데히드를 생성하는 능력을 테스트하였다.
pBADButP 작제
클로스트리디움 아세토부티리컴 ATCC 824의 hbd, crt, bcd, etfA, 및 etfB를 인코딩하는 DNA 서열을 50μl중의 클로스트리디움 아세토부티리컴 ATCC 824 50 ng으로부터 중합효소 연쇄반응을 사용하여 증폭하였다. 증폭된 DNA 절편을 BamHI 및 Xbal로 절단하여 같은 제한 효소로 절단된 pBAD33내로 연결시켰다.
pBADButP - atoB 작제
이스체리키아 콜라이 DH10B의 atoB를 인코딩하는 DNA 서열을 50μl중의 이스체리키아 콜라이 DH10B 게놈 50ng으로부터 중합효소 연쇄반응을 사용하여 증폭하였다. 증폭된 DNA 절편을 Xbal 및 Pstl로 절단하여 같은 제한 효소로 절단된 pBADButP내로 연결시켰다.
pBADatoB - ald 작제
이스체리키아 콜라이 DH10B의 atoB를 인코딩하고 클로스트리디움 베이저린키로부터 ald를 인코딩하는 DNA 서열을 각각 50μl중의 이스체리키아 콜라이 DH10B 50ng 또는 클로스트리디움 베이저린키 게놈(ATCC) 50ng으로부터 중합효소 연쇄반응(PCR)을 사용하여 독립적으로 증폭하였다. 증폭된 DNA 절편을 겔상에서 정제하여 EB 완충제(Qiagen) 3Oul에 용출하였다. 각 DNA 용액 5 ul를 조합하여 각 DNA 절편을 PCR을 한 라운드 더 돌려 스플라이싱하였다. 스플라이싱된 절편을 SacI 및 HindIII로 절단하여 같은 제한 효소로 절단된 pBADButP내로 연결시켰다.
pBADButP - atoB - ALD 작제
클로람페니콜 아세틸트랜스퍼라제(CAT), 복제의 P15 오리진, araBAD 프로모터, 이스체리키아 콜라이 DH10B의 atoB 및 클로스트리디움 베이저린키로부터 ald를 인코딩하는 DNA 절편 1 및 클로스트리디움 아세토부티리컴 ATCC 824의 araBAD promoter, hbd, crt, bed, etfA, 및 etfB를 인코딩하는 DNA 절편 2를 각각 50μl중의 50ng pBADatoB-ald 또는 pBADButP로부터 중합효소 연쇄반응(PCR)을 사용하여 독립적으로 증폭하였다. 증폭된 DNA 절편은 NotI 및 KpnI를 사용하여 절단하여 서로 연결시켰다.
pBADals - ilvCD 작제
E.콜라이에서 과잉발현에 대해 최적화된 코돈을 사용하는 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578의 als를 인코딩하는 DNA 절편을 50μl중의 pETals 50ng으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 SacI 및 XbaI을 사용하여 절단하여 같은 제한 효소로 절단된 pBADilvCD내로 연결시켰다.
pBADalsS - ilvCD 작제
바실러스 서브틸리스 B26의 alsS의 앞부분 반 및 뒷부분 반을 인코딩하는 DNA 절편을 50μl중의 바실러스 서브틸리스 B26 게놈(ATCC) 50ng으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 겔상에서 정제하여 EB 완충제(Qiagen) 3Oul에 용출하였다. 각 DNA 용액 5 ul를 조합하여 각 DNA 절편을 PCR을 한 라운드 더 돌려 스플라이싱하였다. 스플라이싱된 절편은 내부에 XbaI 절단부위를 포함하고 있어서 SacI 및 XbaI을 사용하여 절단하여 같은 제한 효소로 절단된 pBADilvCD내로 연결시켰다.
pTrcBALK 작제
락토카커스 라브티스의 케토이소발러레이트 디카르복실라제(kivd)를 인코딩하는 DNA 서열을 50μl중의 pETBAL 50 ng 으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 SacI 및 XbaI을 사용하여 절단하여 같은 제한 효소로 절단된 pTrcBAL내로 연결시켰다.
pTrcBALD 작제
클로스트리디움 베이저린키의 CoA-연결 알데히드 디하이드로게나제(ald)를 인코딩하는 DNA 서열을 50μl중의 pETBAL 50 ng 으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 SacI 및 HndIII을 사용하여 절단하여 같은 제한 효소로 절단된 pTrcBAL내로 연결시켰다.
pBBRPduCDEGH 작제
크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578의 프로판디올 디하이드라타제 중간(pduD) 및 소(pduE) 서브유닛 및 프로판디올 디하이드라타제 재활성화 대(pduG) 및 소(pduH) 서브유닛을 인코딩하는 DNA 서열을 50μl중의 크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578 50 ng 으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 SacI 및 XbaI을 사용하여 절단하여 같은 제한 효소로 절단된 pTrc99A내로 연결시켜 pBBRPduDEGH를 형성하였다.
크렙실라 뉴모니애 subsp. 뉴모니애 MGH 78578의 프로판디올 디하이드라타제 대 서브유닛(pduC)을 인코딩하는 DNA 서열을 50μl중의 크렙실라 뉴모니애(Klebsiella pneumoniae subsp. pneumoniae MGH 78578) 50 ng 으로부터 중합효소 연쇄반응(PCR)을 사용하여 증폭하였다. 증폭된 DNA 절편을 Xhol 및 Xbal을 사용하여 절단하여 같은 제한 효소로 절단된 pBBRPduDEGH내로 연결시켰다.
부틸알데히드 생합성 경로를 테스트하기 위해서, pBADButP-atoB/pTrcBALD 및 pBADButP-atoB-ALD/pTrcB2DH/pBBRpduCDEGH를 갖는 DH 10B을 50 ug/ml 크로람페니콜 (Cm50) 및 100 ug/ml 암피실린 (Amp100)을 포함하는 LB 배지에서 37℃, 200rpm에서 하룻밤 배양하였다. 각 시드(seed) 배양의 분획을 Cm50 and Amp100을 포함하는 새로운 TB 배지에 접종한 후, 37℃ , 200 rpm의 배양기에서 성장시켰다. 접종 후 3시간에, 배양체를 13.3 mM 아라비노스 및 1mM IPTG로 유도(induction)하여 하룻밤 성장시켰다. 이들 배양체의 700 ul를 같은 부피의 에틸아세테이트로 추출하고 GC-MS를 사용하여 분석하였다.
이소부틸알데히드 생합성 경로를 테스트하기 위해서, pBADals-ilvCD/pTrcBALK 또는 pBADalsS-ilvCD/pTrcBALK를 갖는 DH 10B을 50 ug/ml 크로람페니콜 (Cm50) 및 100 ug/ml 암피실린 (Amp100)을 포함하는 LB 배지에서 37℃, 200rpm에서 하룻밤 배양하였다. 각 시드(seed) 배양의 분획을 Cm50 and Amp100을 포함하는 새로운 TB 배지에 접종한 후, 37℃ , 200 rpm의 배양기에서 성장시켰다. 접종 후 3시간에, 배양체를 13.3 mM 아라비노스 및 1mM IPTG로 유도(induction)하여 하룻밤 성장시켰다. 이들 배양체의 700 ul를 같은 부피의 에틸아세테이트로 추출하고 GC-MS를 사용하여 이소부타날 생성의 측정과 같이 이소부틸알데히드 생성에 대해 분석하였다. 도 2는 이들 배양체로부터 이소부타날의의 생성을 나타낸다. 이 종은 또한 소수 구성분으로서 2-메틸부틸알데히드 및 3-메틸부틸알데히드를 생성하였다(도시되지 않음).
실시예 2
이소부틸알데히드로부터 3-하이드록시-2,2,4 트리메틸펜타날의 생성
알돌라제 활성을 갖는 효소가 이소부틸알데히드를 응축하여 3-하이드록시-2,2,4-트리메틸펜타날을 형성하는 능력을 생체 내에서 테스트하였다. 하기의 실시예 5에 기술된 바와 같이 플라스미드 TrcTM1559를 구축하였고, 이들은 털모토가 마리티마로부터 수득된 알도오스-인코딩 폴리뉴클레오티드 서열을 포함한다.
pTrcTM1559을 포함하는 E. 콜라이 DH 10B 종의 단일 콜로니를 Amp100를 포함하는 새로운 LB 배지에 접종하고 상기 배양체를 하룻밤 동안 37℃에서 진탕 배양기에서 성장시켰다. 이들 배양체의 1 %를 Amp100을 포함하는 새로운 TB배지에 접종한 후 37℃에서 진탕 배양기에서 성장시켰다. 배양체가 OD600nm 값이 0.6 까지 자랐을때, 0.5 mM IPTG로 유도하였다. 5OmM 이소부틸알데히드를 첨가하여 하루 동안 배양시켰다. 배양체 500 μl를 에틸아세테이트 500 μl로 추출한 후 추출물을 GC-MS로 분석하였다. 3-하이드록시-2,2,4-트리메틸펜타날의 형성을 관찰하였다(도 2 참조).
실시예 3
이소부틸알데히드로부터 2,2,4-트리메틸-1,3-펜탄디올의 생성
알돌라제 효소 및 알코올 디하이드로게나제를 포함하는 재조합 미생물이 이소부틸알데히드를 2,2,4-트리메틸-1,3-펜탄디올로 전환시키는 능력을 테스트하였다. 플라스미드 TrcTM1559은 상기 실시예 2에 기술되어 있다. 다양한 알코올 디하이드로게나제를 수도모나스 퓨티다(Pseudomonas putida) KT2440, 수도모나스 플루오레센스(Pseudomonas fluorescens) Pf-5, 및 크렙실라 뉴모니애 MGH 78578(SEQ ID No:1-34 참조)로부터 분리하여 발현 벡터에 클로닝하였다. 이것은 미국 출원 제 12/245,537호 및 제 12/245,540호에 기술되어 있으며, 여기서 그들의 설명, 구축, 알코올 디하이드로게나제의 테스팅을 위해 참고로 포함된다. 부가적인 알코올 디하이드로게나제는 또한 수도모나스 퓨티다(SEQ ID NOS:83-96 참조)로부터 수득하였다.
pTrcTM1559 및 알코올 디하이드로게나제 발현 플라스미드를 포함하는 E. 콜라이 DH 10B 종의 단일 콜로니를 Amp100를 포함하는 새로운 LB 배지에 접종하고 상기 배양체를 하룻밤 동안 37℃에서 진탕 배양기에서 성장시켰다. 이들 배양체의 1 %를 Amp100을 포함하는 새로운 TB배지에 접종한 후 37℃에서 진탕 배양기에서 성장시켰다. 배양체가 OD600nm 값이 0.6 까지 자랐을때, 0.5 mM IPTG로 유도하였다. 5OmM 이소부틸알데히드를 첨가하여 하루 동안 배양시켰다. 배양체 500 μl를 에틸아세테이트 500 μl로 추출한 후 추출물을 GC-MS로 분석하였다. 2,2,4-트리메틸펜탄디올의 형성을 관찰하였다.
실시예 4
다른 중간 내지 장 쇄의 탄화수소의 생성
2,2,4-트리메틸-1,3-펜탄디올 및 그후 2,2,4, 트리메틸펜탄(이소옥탄)을 생성하는 상기에 언급된 경로뿐만 아니라, 효소학적 알돌 농축에 이은 알코올 탈수소반응은 출발 물질로서 다양한 알데히드 및 케톤으로부터 다양한 중간 내지 장 쇄의 탄화수소를 생성할 수 있다. 이들 알데히드 및/또는 케톤은 알데히드 및/또는 케톤 생합성 경로에 따라 재조합 미생물에 의해 생성될 수 있고 이것은 미국 출원 제 12/245,537호 및 제 12/245,540호에 기술되어 있고 여기서 이들 출원은 이들 경로의 설명, 작제, 및 테스팅을 위해 참고로 포함된다.
일 실시 예가 여기에 설명되어있고 여기서 부틸알데히드 2 분자가 알돌라제에 의해 농축하여 3-하이드록시-2-에틸 헥사날을 형성한다. 이 분자는 그 후 자발적으로 또는 효소학적으로 탈수되어 2-에틸-2-헥센-1-알을 형성하고, 이들은 이어서 순차적으로 이중 결합 리덕타제 및 알코올 디하이드로게나제에 의해 각각 촉매되어 2-에틸헥사날 및 2-에틸헥사놀로 환원될 수 있다.
2 분자의 헥산알데히드가 알돌라제에 의해 농축하여 3-하이드록시-2-부틸-1- 옥타날을 형성하는 반응도 여기에 또한 설명되어 있다. 이 분자는 그 후 자발적으로 또는 효소학적으로 탈수되어 2-부틸-2-옥텐-1-알을 형성하고 이어서 순차적으로 2-부틸-옥타날 및 2-부틸 옥타놀로 환원될 수 있다.
2-에틸-2-헥센-1-알의 생성을 테스트하기 위해서, pTrcTM1559을 포함하는 E. 콜라이 DH 10B 종의 단일 콜로니를 Amp100를 포함하는 새로운 LB 배지에 접종하고 상기 배양체를 하룻밤 동안 37℃에서 진탕 배양기에서 성장시켰다. 이들 배양체의 1 %를 Amp100을 포함하는 새로운 TB배지에 접종한 후 37℃에서 진탕 배양기에서 성장시켰다. 배양체가 OD600nm 값이 0.6 까지 자랐을때, 0.5 mM IPTG로 유도하였다. 5OmM 부틸알데히드 및 5OmM 헥산알데히드를 첨가하여 하루 동안 배양시켰다. 배양체 500 μl를 에틸아세테이트 500 μl로 추출한 후 추출물을 GC-MS로 분석하였다. 2-에틸-2-헥센-1-알의 형성을 관찰하였다(도 3 참도). 또한 2-부틸-2-옥텐-1-알의 형성도 관찰하였다(도 4 참도).
실시예 5
알돌라제의 분리 및 클로닝
알돌라제 활성을 갖는 효소를 인코딩하는 폴리뉴클레오티드 서열을 털모토가 마리티마 및 이스체리키아 콜라이 DH 10B로부터 분리하여 발현 벡터에 클로닝하였다.
Construction of pTrcTM0040 , pTrcTM0066 , pTrcTM0273 , pTrcTM0283 , pTrcTM0295 , pTrcTM0343, pTrcTM0720 , pTrcTM1072 , pTrcTM1419 , pTrcTM1521 . pTrcTM1559 . and pTrcTM1744
TM0273, TM0283, TM0720, TM 1559, 및 TM1744를 인코딩하는 DNA 서열이 내부에 NcoI 부위를 포함하고 있어서, 각 유전자에 대한 NcoI 부위의 측면 지역을 중합효소 연쇄반응(PCR)을 통해 독립적으로 증폭하였다: 10초 동안 98℃, 15초 동안 60℃, 및 30분 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.5 μM 전방향 및 역방향 프라이머(표 5 참조), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 50 μl중의 털모토가 마리티마 게놈 50 ng을 포함했다.
Figure pct00012
터모토가 마리티마의 TM0040, TM0066, TM0273, TM0283, TM0295, TM0343, TM0720, TM1072, TM1419, TM 1521 , TM 1559, 및 TM1744를 인코딩하는 DNA 서열을 중합효소 연쇄반응(PCR)을 통해 독립적으로 증폭하였다: 10초 동안 98℃, 15초 동안 60℃, 및 1분 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.5 μM 전방향 및 역방향 프라이머(표 6 참조), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 50 μl중의 털모토가 마리티마 게놈 50 ng을 포함했다(주의; TM0273, TM0283, TM0720, TM 1559, 및 TM1744에 대해서, 이전 단락에서 기술된 바와 같이 제조된 단편들을 사용하였다). 상기의 DNA 절편은 NcoI 및 XbaI으로 절단하였고, 같은 제한 효소로 절단한 pTrc99A에 연결시켰다.
Figure pct00013
pTrcDH1OBxxx 작제
EC1648 및 EC4071을 인코딩하는 DNA 서열은 내부에 NcoI 부위를 포함하고, EC2249을 인코딩하는 DNA 서열은 XbaI 부위를 포함한다. 각 유전자에 대한 제한 부위의 측면 지역을 중합효소 연쇄반응(PCR)을 통해 독립적으로 증폭하였다: 30초 동안 98℃, 15초 동안 55℃, 및 45초 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.3 μM 전방향 및 역방향 프라이머(표 7 참조), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 E. 콜라이 DH10β 20 ng을 포함했다.
Figure pct00014
이스체리키아 콜라이 DH10β의 EC0008, EC0894, EC0940, EC1648, EC1991 , EC2249, EC2250, EC2465, EC2629, EC2969, EC3100, EC3233, EC3299, EC3305, EC3310, EC4071 , EC4092, EC4135 및 EC4539을 인코딩하는 DNA 서열을 중합효소 연쇄반응(PCR)을 통해 증폭하였다: 30초 동안 98℃, 30초 동안 55℃, 및 1분 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.3 μM 전방향 및 역방향 프라이머(표 8 참조), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 50μl중의 E. 콜라이 DH10β 게놈 20 ng을 포함했다(주의: EC1648, EC2249 및 EC4071에 대해서, 이전 단락에서 제조된 단편을 사용하였다).
Figure pct00015
EC3305 및 EC3310을 인코딩하는 증폭된 절편은 오버랩-PCR 방법을 사용하여 연결시켰다. (PCR): 30초 동안 98℃, 30초 동안 55℃, 및 1분 동안 72℃, 30회 반복. 상기 반응 혼합물은 1 x Phusion 완충액 (NEB), 2 mM dNTP, 0.3 μM 전방향 및 역방향 프라이머(전방향 프라이머: catgccatggggatgaaacatctgacagaaatg (SEQ ID NO:189), 역방향 프라이머: gctctagattatgctgaaattcgattcg (SEQ ID NO:190)), 1 U Phusion High Fidelity DNA 중합효소(NEB), 및 이전 단락으로부터의 PCR 생성물 3μl를 포함했다.
증폭된 DNA 절편은 NcoI 및 XbaI으로 절단하였고, 같은 제한 효소로 절단한 pTrc99A에 연결시켰다.
<110> Bio Architecture Lab, Inc. <120> BIOSYNTHESIS OF COMMODITY CHEMICALS <130> IPA110358 <150> US61/121,869 <151> 2008-12-11 <160> 260 <170> KopatentIn 1.71 <210> 1 <211> 789 <212> DNA <213> Pseudomonas putida KT2440 <400> 1 atgacagtca attatgattt ttccggaaaa gtcgtgctgg ttaccggcgc tggctctggt 60 attggccgtg ccactgcgct tgccttcgcg cagtcgggcg catccgttgc ggtcgcagac 120 atctcgactg accacggttt gaaaaccgta gagttggtca aagccgaagg aggcgaggcg 180 accttcttcc atgtcgatgt aggctctgaa cccagcgtcc agtcgatgct ggctggtgtc 240 gtggcgcatt acggcggcct ggacattgcg cacaacaacg ccggcattga ggccaatatc 300 gtgccgctgg ccgagctgga ctccgacaac tggcgtcgtg tcatcgatgt gaacctttcc 360 tcggtgttct attgcctgaa aggtgaaatc cctctgatgc tgaaaagggg cggcggcgcc 420 attgtgaata ccgcatcggc ctccgggctg attggcggct atcgcctttc cgggtatacc 480 gccacgaagc acggcgtagt ggggctgact aaggctgctg ctatcgatta tgcaaaccag 540 aatatccgga ttaatgccgt gtgccctggt ccagttgact ccccattcct ggctgacatg 600 ccgcaaccca tgcgcgatcg acttctcttt ggcactccaa ttggacgatt ggccaccgca 660 gaggagatcg cgcgttcggt tctgtggctg tgttctgacg atgcaaaata cgtggtgggc 720 cattcgatgt cagtcgacgg tggcgtggca gtgactgcgg ttggtactcg aatggatgat 780 ctcttttaa 789 <210> 2 <211> 262 <212> PRT <213> Pseudomonas putida KT2440 <400> 2 Met Thr Val Asn Tyr Asp Phe Ser Gly Lys Val Val Leu Val Thr Gly 1 5 10 15 Ala Gly Ser Gly Ile Gly Arg Ala Thr Ala Leu Ala Phe Ala Gln Ser 20 25 30 Gly Ala Ser Val Ala Val Ala Asp Ile Ser Thr Asp His Gly Leu Lys 35 40 45 Thr Val Glu Leu Val Lys Ala Glu Gly Gly Glu Ala Thr Phe Phe His 50 55 60 Val Asp Val Gly Ser Glu Pro Ser Val Gln Ser Met Leu Ala Gly Val 65 70 75 80 Val Ala His Tyr Gly Gly Leu Asp Ile Ala His Asn Asn Ala Gly Ile 85 90 95 Glu Ala Asn Ile Val Pro Leu Ala Glu Leu Asp Ser Asp Asn Trp Arg 100 105 110 Arg Val Ile Asp Val Asn Leu Ser Ser Val Phe Tyr Cys Leu Lys Gly 115 120 125 Glu Ile Pro Leu Met Leu Lys Arg Gly Gly Gly Ala Ile Val Asn Thr 130 135 140 Ala Ser Ala Ser Gly Leu Ile Gly Gly Tyr Arg Leu Ser Gly Tyr Thr 145 150 155 160 Ala Thr Lys His Gly Val Val Gly Leu Thr Lys Ala Ala Ala Ile Asp 165 170 175 Tyr Ala Asn Gln Asn Ile Arg Ile Asn Ala Val Cys Pro Gly Pro Val 180 185 190 Asp Ser Pro Phe Leu Ala Asp Met Pro Gln Pro Met Arg Asp Arg Leu 195 200 205 Leu Phe Gly Thr Pro Ile Gly Arg Leu Ala Thr Ala Glu Glu Ile Ala 210 215 220 Arg Ser Val Leu Trp Leu Cys Ser Asp Asp Ala Lys Tyr Val Val Gly 225 230 235 240 His Ser Met Ser Val Asp Gly Gly Val Ala Val Thr Ala Val Gly Thr 245 250 255 Arg Met Asp Asp Leu Phe 260 <210> 3 <211> 762 <212> DNA <213> Pseudomonas putida KT2440 <400> 3 atgagcatga ccttttctgg ccaggtagcc ctggtgaccg gcgcgggtgc cggcatcggc 60 cgggcaaccg ccctggcgtt cgcccacgag ggcatgaaag tggtggtggc ggacctcgac 120 ccggtcggcg gcgaggccac cgtggcgcag atccacgcgg caggcggcga agcgctgttc 180 attgcctgcg acgtgacccg cgacgccgag gtgcgccagt tgcatgagcg cctgatggcc 240 gcctacggcc ggctggacta cgccttcaac aacgccggga tcgagatcga gcaacaccgc 300 ctggccgaag gcagcgaagc ggagttcgat gccatcatgg gcgtgaacgt gaagggcgtg 360 tggttgtgca tgaagtatca gttgcccttg ttgctggccc aaggcggtgg ggccatcgtc 420 aataccgcgt cggtggcggg gctaggggcg gcgccaaaga tgagcatcta cagcgccagc 480 aagcatgcgg tcatcggtct gaccaagtcg gcggccatcg agtacgccaa gaagggcatc 540 cgcgtgaacg ccgtgtgccc ggccgtgatc gacaccgaca tgttccgccg cgcttaccag 600 gccgacccgc gcaaggccga gttcgccgca gccatgcacc cggtagggcg cattggcaag 660 gtcgaggaaa tcgccagcgc cgtgctgtat ctgtgcagtg acggcgcggc gtttaccacc 720 gggcattgcc tgacggtgga tggtggggct acggcgatct ga 762 <210> 4 <211> 253 <212> PRT <213> Pseudomonas putida KT2440 <400> 4 Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Gly 1 5 10 15 Ala Gly Ile Gly Arg Ala Thr Ala Leu Ala Phe Ala His Glu Gly Met 20 25 30 Lys Val Val Val Ala Asp Leu Asp Pro Val Gly Gly Glu Ala Thr Val 35 40 45 Ala Gln Ile His Ala Ala Gly Gly Glu Ala Leu Phe Ile Ala Cys Asp 50 55 60 Val Thr Arg Asp Ala Glu Val Arg Gln Leu His Glu Arg Leu Met Ala 65 70 75 80 Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile 85 90 95 Glu Gln His Arg Leu Ala Glu Gly Ser Glu Ala Glu Phe Asp Ala Ile 100 105 110 Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu 115 120 125 Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser 130 135 140 Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ser Ala Ser 145 150 155 160 Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala 165 170 175 Lys Lys Gly Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr 180 185 190 Asp Met Phe Arg Arg Ala Tyr Gln Ala Asp Pro Arg Lys Ala Glu Phe 195 200 205 Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile 210 215 220 Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr 225 230 235 240 Gly His Cys Leu Thr Val Asp Gly Gly Ala Thr Ala Ile 245 250 <210> 5 <211> 810 <212> DNA <213> Pseudomonas putida KT2440 <400> 5 atgtcttttc aaaacaaaat cgttgtgctc acaggcgcag cttctggcat cggcaaagcg 60 acagcacagc tgctagtgga gcagggcgcc catgtggttg ccatggatct taaaagcgac 120 ttgcttcaac aagcattcgg cagtgaggag cacgttctgt gcatccctac cgacgtcagc 180 gatagcgaag ccgtgcgagc cgccttccag gcagtggacg cgaaatttgg ccgtgtcgac 240 gtgattatta acgccgcggg catcaacgca cctacgcgag aagccaacca gaaaatggtt 300 gatgccaacg tcgctgccct cgatgccatg aagagcgggc gggcgcccac tttcgacttc 360 ctggccgata cctcggatca ggatttccgg cgcgtaatgg aagtcaattt gttcagccag 420 ttttactgca ttcgagaggg tgttccgctg atgcgccgag cgggtggcgg cagcatcgtc 480 aacatctcca gcgtggcagc gctcctgggc gtggcaatgc cactttacta ccccgcctcc 540 aaggcggcgg tgctgggcct cacccgtgca gcggcagctg agttggcacc ttacaacatt 600 cgtgtgaatg ccatcgctcc aggctctgtc gacacaccat tgatgcatga gcaaccaccg 660 gaagtcgttc agttcctggt cagcatgcaa cccatcaagc ggctggccca acccgaggag 720 cttgcccaaa gcatcctgtt ccttgccggt gagcattcgt ccttcatcac cggacagacg 780 ctttctccca acggcgggat gcacatgtaa 810 <210> 6 <211> 269 <212> PRT <213> Pseudomonas putida KT2440 <400> 6 Met Ser Phe Gln Asn Lys Ile Val Val Leu Thr Gly Ala Ala Ser Gly 1 5 10 15 Ile Gly Lys Ala Thr Ala Gln Leu Leu Val Glu Gln Gly Ala His Val 20 25 30 Val Ala Met Asp Leu Lys Ser Asp Leu Leu Gln Gln Ala Phe Gly Ser 35 40 45 Glu Glu His Val Leu Cys Ile Pro Thr Asp Val Ser Asp Ser Glu Ala 50 55 60 Val Arg Ala Ala Phe Gln Ala Val Asp Ala Lys Phe Gly Arg Val Asp 65 70 75 80 Val Ile Ile Asn Ala Ala Gly Ile Asn Ala Pro Thr Arg Glu Ala Asn 85 90 95 Gln Lys Met Val Asp Ala Asn Val Ala Ala Leu Asp Ala Met Lys Ser 100 105 110 Gly Arg Ala Pro Thr Phe Asp Phe Leu Ala Asp Thr Ser Asp Gln Asp 115 120 125 Phe Arg Arg Val Met Glu Val Asn Leu Phe Ser Gln Phe Tyr Cys Ile 130 135 140 Arg Glu Gly Val Pro Leu Met Arg Arg Ala Gly Gly Gly Ser Ile Val 145 150 155 160 Asn Ile Ser Ser Val Ala Ala Leu Leu Gly Val Ala Met Pro Leu Tyr 165 170 175 Tyr Pro Ala Ser Lys Ala Ala Val Leu Gly Leu Thr Arg Ala Ala Ala 180 185 190 Ala Glu Leu Ala Pro Tyr Asn Ile Arg Val Asn Ala Ile Ala Pro Gly 195 200 205 Ser Val Asp Thr Pro Leu Met His Glu Gln Pro Pro Glu Val Val Gln 210 215 220 Phe Leu Val Ser Met Gln Pro Ile Lys Arg Leu Ala Gln Pro Glu Glu 225 230 235 240 Leu Ala Gln Ser Ile Leu Phe Leu Ala Gly Glu His Ser Ser Phe Ile 245 250 255 Thr Gly Gln Thr Leu Ser Pro Asn Gly Gly Met His Met 260 265 <210> 7 <211> 771 <212> DNA <213> Pseudomonas putida KT2440 <400> 7 atgacccttg aaggcaaaac tgcactcgtc accggttcca ccagcggcat tggcctgggc 60 atcgcccagg tattggcccg ggctggcgcc aacatcgtgc tcaacggctt tggtgacccg 120 ggccccgcca tggcggaaat tgcccggcac ggggtgaagg ttgtgcacca cccggccgac 180 ctgtcggatg tggtccagat cgaggctttg ttcaacctgg ccgaacgcga gttcggcggc 240 gtcgacatcc tggtcaacaa cgccggtatc cagcatgtgg caccggttga gcagttcccg 300 ccagaaagct gggacaagat catcgccctg aacctgtcgg ccgtattcca tggcacgcgc 360 ctggcgctgc cgggcatgcg cacgcgcaac tgggggcgca tcatcaatat cgcttcggtg 420 catggcctgg tcggctcgat tggcaaggca gcctacgtgg cagccaagca tggcgtgatc 480 ggcctgacca aggtggtcgg cctggaaacc gccaccagtc atgtcacctg caatgccata 540 tgcccgggct gggtgctgac accgctggtg caaaagcaga tcgacgatcg tgcggccaag 600 ggtggcgatc ggctgcaagc gcagcacgat ctgctggcag aaaagcaacc gtcgctggct 660 ttcgtcaccc ccgaacacct cggtgagctg gtactctttc tgtgcagcga ggccggtagc 720 caggttcgcg gcgccgcctg gaacgtcgat ggtggctggt tggcccagtg a 771 <210> 8 <211> 256 <212> PRT <213> Pseudomonas putida KT2440 <400> 8 Met Thr Leu Glu Gly Lys Thr Ala Leu Val Thr Gly Ser Thr Ser Gly 1 5 10 15 Ile Gly Leu Gly Ile Ala Gln Val Leu Ala Arg Ala Gly Ala Asn Ile 20 25 30 Val Leu Asn Gly Phe Gly Asp Pro Gly Pro Ala Met Ala Glu Ile Ala 35 40 45 Arg His Gly Val Lys Val Val His His Pro Ala Asp Leu Ser Asp Val 50 55 60 Val Gln Ile Glu Ala Leu Phe Asn Leu Ala Glu Arg Glu Phe Gly Gly 65 70 75 80 Val Asp Ile Leu Val Asn Asn Ala Gly Ile Gln His Val Ala Pro Val 85 90 95 Glu Gln Phe Pro Pro Glu Ser Trp Asp Lys Ile Ile Ala Leu Asn Leu 100 105 110 Ser Ala Val Phe His Gly Thr Arg Leu Ala Leu Pro Gly Met Arg Thr 115 120 125 Arg Asn Trp Gly Arg Ile Ile Asn Ile Ala Ser Val His Gly Leu Val 130 135 140 Gly Ser Ile Gly Lys Ala Ala Tyr Val Ala Ala Lys His Gly Val Ile 145 150 155 160 Gly Leu Thr Lys Val Val Gly Leu Glu Thr Ala Thr Ser His Val Thr 165 170 175 Cys Asn Ala Ile Cys Pro Gly Trp Val Leu Thr Pro Leu Val Gln Lys 180 185 190 Gln Ile Asp Asp Arg Ala Ala Lys Gly Gly Asp Arg Leu Gln Ala Gln 195 200 205 His Asp Leu Leu Ala Glu Lys Gln Pro Ser Leu Ala Phe Val Thr Pro 210 215 220 Glu His Leu Gly Glu Leu Val Leu Phe Leu Cys Ser Glu Ala Gly Ser 225 230 235 240 Gln Val Arg Gly Ala Ala Trp Asn Val Asp Gly Gly Trp Leu Ala Gln 245 250 255 <210> 9 <211> 750 <212> DNA <213> Pseudomonas putida KT2440 <400> 9 atgtccaagc aacttacact cgaaggcaaa gtggccctgg ttcagggcgg ttcccgaggc 60 attggcgcag ctatcgtaag gcgcctggcc cgcgaaggcg cgcaagtggc cttcacctat 120 gtcagctctg ccggcccggc tgaagaactg gctcgggaaa ttaccgagaa cggcggcaaa 180 gccttggccc tgcgggctga cagcgctgat gccgcggccg tgcagctggc ggttgatgac 240 accgagaaag ccttgggccg gctggatatc ctggtcaaca acgccggtgt gctggcagtg 300 gccccagtga cagagttcga cctggccgac ttcgatcata tgctggccgt gaacgtacgc 360 agcgtgttcg tcgccagcca ggccgcggca cgctatatgg gccagggcgg tcgtatcatc 420 aacattggca gcaccaacgc cgagcgcatg ccgtttgccg gtggtgcacc gtacgccatg 480 agcaagtcgg cactggttgg tctgacccgc ggcatggcac gcgacctcgg gccgcagggc 540 attaccgtga acaacgtgca gcccggcccg gtggacaccg acatgaaccc ggccagtggc 600 gagtttgccg agagcctgat tccgctgatg gccattgggc gatatggcga gccggaggag 660 attgccagct tcgtggctta cctggcaggg cctgaagccg ggtatatcac cggggccagc 720 ctgactgtag atggtgggtt tgcagcctga 750 <210> 10 <211> 249 <212> PRT <213> Pseudomonas putida KT2440 <400> 10 Met Ser Lys Gln Leu Thr Leu Glu Gly Lys Val Ala Leu Val Gln Gly 1 5 10 15 Gly Ser Arg Gly Ile Gly Ala Ala Ile Val Arg Arg Leu Ala Arg Glu 20 25 30 Gly Ala Gln Val Ala Phe Thr Tyr Val Ser Ser Ala Gly Pro Ala Glu 35 40 45 Glu Leu Ala Arg Glu Ile Thr Glu Asn Gly Gly Lys Ala Leu Ala Leu 50 55 60 Arg Ala Asp Ser Ala Asp Ala Ala Ala Val Gln Leu Ala Val Asp Asp 65 70 75 80 Thr Glu Lys Ala Leu Gly Arg Leu Asp Ile Leu Val Asn Asn Ala Gly 85 90 95 Val Leu Ala Val Ala Pro Val Thr Glu Phe Asp Leu Ala Asp Phe Asp 100 105 110 His Met Leu Ala Val Asn Val Arg Ser Val Phe Val Ala Ser Gln Ala 115 120 125 Ala Ala Arg Tyr Met Gly Gln Gly Gly Arg Ile Ile Asn Ile Gly Ser 130 135 140 Thr Asn Ala Glu Arg Met Pro Phe Ala Gly Gly Ala Pro Tyr Ala Met 145 150 155 160 Ser Lys Ser Ala Leu Val Gly Leu Thr Arg Gly Met Ala Arg Asp Leu 165 170 175 Gly Pro Gln Gly Ile Thr Val Asn Asn Val Gln Pro Gly Pro Val Asp 180 185 190 Thr Asp Met Asn Pro Ala Ser Gly Glu Phe Ala Glu Ser Leu Ile Pro 195 200 205 Leu Met Ala Ile Gly Arg Tyr Gly Glu Pro Glu Glu Ile Ala Ser Phe 210 215 220 Val Ala Tyr Leu Ala Gly Pro Glu Ala Gly Tyr Ile Thr Gly Ala Ser 225 230 235 240 Leu Thr Val Asp Gly Gly Phe Ala Ala 245 <210> 11 <211> 858 <212> DNA <213> Pseudomonas putida KT2440 <400> 11 atgagcgact accctacccc tccattccca tcccaaccgc aaagcgttcc cggttcccag 60 cgcaagatgg atccgtatcc ggactgcggt gagcagagct acaccggcaa caatcgcctc 120 gcaggcaaga tcgccttgat aaccggtgct gacagcggca tcgggcgtgc ggtggcgatt 180 gcctatgccc gagaaggcgc tgacgttgcc attgcctatc tgaatgaaca cgacgatgcg 240 caggaaaccg cgcgctgggt caaagcggct ggccgccagt gcctgctgct gcccggcgac 300 ctggcacaga aacagcactg ccacgacatc gtcgacaaga ccgtggcgca gtttggtcgc 360 atcgatatcc tggtcaacaa cgccgcgttc cagatggccc atgaaagcct ggacgacatt 420 gatgacgatg aatgggtgaa gaccttcgat accaacatca ccgccatttt ccgcatttgc 480 cagcgcgctt tgccctcgat gccaaagggc ggttcgatca tcaacaccag ttcggtcaac 540 tctgacgacc cgtcacccag cctgttggcc tatgccgcga ccaaaggggc tattgccaat 600 ttcactgcag gccttgcgca actgctgggc aagcagggca ttcgcgtcaa cagcgtcgca 660 cccggcccga tctggacccc gctgatcccg gccaccatgc ctgatgaggc ggtgagaaac 720 ttcggttccg gttacccgat gggacggccg ggtcaacctg tggaggtggc gccaatctat 780 gtcttgctgg ggtccgatga agccagctac atctcgggtt cgcgttacgc cgtgacggga 840 ggcaaaccta ttctgtga 858 <210> 12 <211> 285 <212> PRT <213> Pseudomonas putida KT2440 <400> 12 Met Ser Asp Tyr Pro Thr Pro Pro Phe Pro Ser Gln Pro Gln Ser Val 1 5 10 15 Pro Gly Ser Gln Arg Lys Met Asp Pro Tyr Pro Asp Cys Gly Glu Gln 20 25 30 Ser Tyr Thr Gly Asn Asn Arg Leu Ala Gly Lys Ile Ala Leu Ile Thr 35 40 45 Gly Ala Asp Ser Gly Ile Gly Arg Ala Val Ala Ile Ala Tyr Ala Arg 50 55 60 Glu Gly Ala Asp Val Ala Ile Ala Tyr Leu Asn Glu His Asp Asp Ala 65 70 75 80 Gln Glu Thr Ala Arg Trp Val Lys Ala Ala Gly Arg Gln Cys Leu Leu 85 90 95 Leu Pro Gly Asp Leu Ala Gln Lys Gln His Cys His Asp Ile Val Asp 100 105 110 Lys Thr Val Ala Gln Phe Gly Arg Ile Asp Ile Leu Val Asn Asn Ala 115 120 125 Ala Phe Gln Met Ala His Glu Ser Leu Asp Asp Ile Asp Asp Asp Glu 130 135 140 Trp Val Lys Thr Phe Asp Thr Asn Ile Thr Ala Ile Phe Arg Ile Cys 145 150 155 160 Gln Arg Ala Leu Pro Ser Met Pro Lys Gly Gly Ser Ile Ile Asn Thr 165 170 175 Ser Ser Val Asn Ser Asp Asp Pro Ser Pro Ser Leu Leu Ala Tyr Ala 180 185 190 Ala Thr Lys Gly Ala Ile Ala Asn Phe Thr Ala Gly Leu Ala Gln Leu 195 200 205 Leu Gly Lys Gln Gly Ile Arg Val Asn Ser Val Ala Pro Gly Pro Ile 210 215 220 Trp Thr Pro Leu Ile Pro Ala Thr Met Pro Asp Glu Ala Val Arg Asn 225 230 235 240 Phe Gly Ser Gly Tyr Pro Met Gly Arg Pro Gly Gln Pro Val Glu Val 245 250 255 Ala Pro Ile Tyr Val Leu Leu Gly Ser Asp Glu Ala Ser Tyr Ile Ser 260 265 270 Gly Ser Arg Tyr Ala Val Thr Gly Gly Lys Pro Ile Leu 275 280 285 <210> 13 <211> 774 <212> DNA <213> Pseudomonas putida KT2440 <400> 13 atgatcgaaa tcagcggcag caccccgggc cacaatggcc gggtagcctt ggtcacgggc 60 gccgcccgcg gcatcggtct gggcattgcc gcatggctga tctgcgaagg ctggcaagtg 120 gtgctgagtg atctggaccg ccagcgtggt accaaagtgg ccaaggcgtt gggcgacaac 180 gcctggttca tcaccatgga cgttgccgac gaggcccagg tcagtgccgg cgtgtccgaa 240 gtgctcgggc agttcggccg gctggacgcg ctggtgtgca atgcggccat tgccaacccg 300 cacaaccaga cgctggaaag cctgagcctg gcacaatgga accgggtgct gggggtcaac 360 ctcagcggcc ccatgctgct ggccaagcat tgtgcgccgt acctgcgtgc gcacaatggg 420 gcgatcgtca acctgacctc tacccgtgct cggcagtccg aacccgacac cgaggcttac 480 gcggcaagca agggcggcct ggtggctttg acccatgccc tggccatgag cctgggcccg 540 gagattcgcg tcaatgcggt gagcccgggc tggatcgatg cccgtgatcc gtcgcagcgc 600 cgtgccgagc cgttgagcga agctgaccat gcccagcatc caacgggcag ggtagggacc 660 gtggaagatg tcgcggccat ggttgcctgg ttgctgtcac gccaggcggc atttgtcacc 720 ggccaggagt ttgtggtcga tggcggcatg acccgcaaga tgatctatac ctga 774 <210> 14 <211> 257 <212> PRT <213> Pseudomonas putida KT2440 <400> 14 Met Ile Glu Ile Ser Gly Ser Thr Pro Gly His Asn Gly Arg Val Ala 1 5 10 15 Leu Val Thr Gly Ala Ala Arg Gly Ile Gly Leu Gly Ile Ala Ala Trp 20 25 30 Leu Ile Cys Glu Gly Trp Gln Val Val Leu Ser Asp Leu Asp Arg Gln 35 40 45 Arg Gly Thr Lys Val Ala Lys Ala Leu Gly Asp Asn Ala Trp Phe Ile 50 55 60 Thr Met Asp Val Ala Asp Glu Ala Gln Val Ser Ala Gly Val Ser Glu 65 70 75 80 Val Leu Gly Gln Phe Gly Arg Leu Asp Ala Leu Val Cys Asn Ala Ala 85 90 95 Ile Ala Asn Pro His Asn Gln Thr Leu Glu Ser Leu Ser Leu Ala Gln 100 105 110 Trp Asn Arg Val Leu Gly Val Asn Leu Ser Gly Pro Met Leu Leu Ala 115 120 125 Lys His Cys Ala Pro Tyr Leu Arg Ala His Asn Gly Ala Ile Val Asn 130 135 140 Leu Thr Ser Thr Arg Ala Arg Gln Ser Glu Pro Asp Thr Glu Ala Tyr 145 150 155 160 Ala Ala Ser Lys Gly Gly Leu Val Ala Leu Thr His Ala Leu Ala Met 165 170 175 Ser Leu Gly Pro Glu Ile Arg Val Asn Ala Val Ser Pro Gly Trp Ile 180 185 190 Asp Ala Arg Asp Pro Ser Gln Arg Arg Ala Glu Pro Leu Ser Glu Ala 195 200 205 Asp His Ala Gln His Pro Thr Gly Arg Val Gly Thr Val Glu Asp Val 210 215 220 Ala Ala Met Val Ala Trp Leu Leu Ser Arg Gln Ala Ala Phe Val Thr 225 230 235 240 Gly Gln Glu Phe Val Val Asp Gly Gly Met Thr Arg Lys Met Ile Tyr 245 250 255 Thr <210> 15 <211> 741 <212> DNA <213> Pseudomonas putida KT2440 <400> 15 atgagcctgc aaggtaaagt tgcactggtt accggcgcca gccgtggcat tggccaggcc 60 atcgccctcg agctgggccg ccagggcgcg accgtgatcg gtaccgccac gtcggcgtcc 120 ggtgccgagc gcatcgctgc caccctgaaa gaacacggca ttaccggcac tggcatggag 180 ctgaacgtga ccagcgccga atcggttgaa gccgtactgg ccgccattgg cgagcagttc 240 ggcgcgccgg ccatcttggt caacaatgcc ggtatcaccc gcgacaacct catgctgcgc 300 atgaaagacg acgagtggtt tgatgtcatc gacaccaacc tgaacagcct ctaccgtctg 360 tccaagggcg tgctgcgtgg catgaccaag gcgcgttggg gtcgtatcat cagcatcggc 420 tcggtcgttg gtgccatggg taacgcaggt caggccaact acgcggctgc caaggccggt 480 ctggaaggtt tcagccgcgc cctggcgcgt gaagtgggtt cgcgtggtat caccgtcaac 540 tcggtgaccc caggcttcat cgataccgac atgacccgcg agctgccaga agctcagcgc 600 gaagccctgc agacccagat tccgctgggc cgcctgggcc aggctgacga aattgccaag 660 gtggtttcgt tcctggcatc cgacggcgcc gcctacgtga ccggcgctac cgtgccggtc 720 aacggcggga tgtacatgta a 741 <210> 16 <211> 246 <212> PRT <213> Pseudomonas putida KT2440 <400> 16 Met Ser Leu Gln Gly Lys Val Ala Leu Val Thr Gly Ala Ser Arg Gly 1 5 10 15 Ile Gly Gln Ala Ile Ala Leu Glu Leu Gly Arg Gln Gly Ala Thr Val 20 25 30 Ile Gly Thr Ala Thr Ser Ala Ser Gly Ala Glu Arg Ile Ala Ala Thr 35 40 45 Leu Lys Glu His Gly Ile Thr Gly Thr Gly Met Glu Leu Asn Val Thr 50 55 60 Ser Ala Glu Ser Val Glu Ala Val Leu Ala Ala Ile Gly Glu Gln Phe 65 70 75 80 Gly Ala Pro Ala Ile Leu Val Asn Asn Ala Gly Ile Thr Arg Asp Asn 85 90 95 Leu Met Leu Arg Met Lys Asp Asp Glu Trp Phe Asp Val Ile Asp Thr 100 105 110 Asn Leu Asn Ser Leu Tyr Arg Leu Ser Lys Gly Val Leu Arg Gly Met 115 120 125 Thr Lys Ala Arg Trp Gly Arg Ile Ile Ser Ile Gly Ser Val Val Gly 130 135 140 Ala Met Gly Asn Ala Gly Gln Ala Asn Tyr Ala Ala Ala Lys Ala Gly 145 150 155 160 Leu Glu Gly Phe Ser Arg Ala Leu Ala Arg Glu Val Gly Ser Arg Gly 165 170 175 Ile Thr Val Asn Ser Val Thr Pro Gly Phe Ile Asp Thr Asp Met Thr 180 185 190 Arg Glu Leu Pro Glu Ala Gln Arg Glu Ala Leu Gln Thr Gln Ile Pro 195 200 205 Leu Gly Arg Leu Gly Gln Ala Asp Glu Ile Ala Lys Val Val Ser Phe 210 215 220 Leu Ala Ser Asp Gly Ala Ala Tyr Val Thr Gly Ala Thr Val Pro Val 225 230 235 240 Asn Gly Gly Met Tyr Met 245 <210> 17 <211> 738 <212> DNA <213> Pseudomonas putida KT2440 <400> 17 atgactcaga aaatagctgt cgtgaccggc ggcagtcgcg gcattggcaa gtccatcgtg 60 ctggccctgg ccggcgcggg ttatcaggtt gccttcagtt atgtccgtga cgaggcgtca 120 gccgctgcct tgcaggcgca ggtcgaaggg ctcggccggg actgcctggc cgtgcagtgt 180 gatgtcaagg aagcgccgag cattcaggcg ttttttgaac gggtcgagca acgtttcgag 240 cgtatcgact tgttggtcaa caacgccggt attacccgtg acggtttgct cgccacgcaa 300 tcgttgaacg acatcaccga ggtcatccag accaacctgg tcggcacgtt gttgtgctgt 360 cagcaggtgc tgccctgcat gatgcgccaa cgcagcgggt gcatcgtcaa cctcagttcg 420 gtggccgcgc aaaagcccgg caagggccag agcaactacg ccgccgccaa aggcggtgta 480 gaagcattga cacgcgcact ggcggtggag ttggcgccgc gcaacatccg ggtcaacgcg 540 gtggcgcccg gcatcgtcag caccgacatg agccaagccc tggtcggcgc ccatgagcag 600 gaaatccagt cgcggctgtt gatcaaacgg ttcgcccggc ctgaagaaat tgccgacgcg 660 gtgctgtatc tggccgagcg cggcctgtac atcacgggcg aagtcctgtc cgtcaacggc 720 ggattgaaaa tgccatga 738 <210> 18 <211> 245 <212> PRT <213> Pseudomonas putida KT2440 <400> 18 Met Thr Gln Lys Ile Ala Val Val Thr Gly Gly Ser Arg Gly Ile Gly 1 5 10 15 Lys Ser Ile Val Leu Ala Leu Ala Gly Ala Gly Tyr Gln Val Ala Phe 20 25 30 Ser Tyr Val Arg Asp Glu Ala Ser Ala Ala Ala Leu Gln Ala Gln Val 35 40 45 Glu Gly Leu Gly Arg Asp Cys Leu Ala Val Gln Cys Asp Val Lys Glu 50 55 60 Ala Pro Ser Ile Gln Ala Phe Phe Glu Arg Val Glu Gln Arg Phe Glu 65 70 75 80 Arg Ile Asp Leu Leu Val Asn Asn Ala Gly Ile Thr Arg Asp Gly Leu 85 90 95 Leu Ala Thr Gln Ser Leu Asn Asp Ile Thr Glu Val Ile Gln Thr Asn 100 105 110 Leu Val Gly Thr Leu Leu Cys Cys Gln Gln Val Leu Pro Cys Met Met 115 120 125 Arg Gln Arg Ser Gly Cys Ile Val Asn Leu Ser Ser Val Ala Ala Gln 130 135 140 Lys Pro Gly Lys Gly Gln Ser Asn Tyr Ala Ala Ala Lys Gly Gly Val 145 150 155 160 Glu Ala Leu Thr Arg Ala Leu Ala Val Glu Leu Ala Pro Arg Asn Ile 165 170 175 Arg Val Asn Ala Val Ala Pro Gly Ile Val Ser Thr Asp Met Ser Gln 180 185 190 Ala Leu Val Gly Ala His Glu Gln Glu Ile Gln Ser Arg Leu Leu Ile 195 200 205 Lys Arg Phe Ala Arg Pro Glu Glu Ile Ala Asp Ala Val Leu Tyr Leu 210 215 220 Ala Glu Arg Gly Leu Tyr Ile Thr Gly Glu Val Leu Ser Val Asn Gly 225 230 235 240 Gly Leu Lys Met Pro 245 <210> 19 <211> 768 <212> DNA <213> Pseudomonas putida KT2440 <400> 19 atgtccaaga cccacctgtt cgacctcgac ggcaagattg cctttgtttc cggcgccagc 60 cgtggcatcg gcgaggccat cgcccacttg ctcgcgcagc aaggggccca tgtgatcgtt 120 tccagccgca agcttgacgg gtgccagcag gtggccgacg ccatcattgc cgccggcggc 180 aaggccacgg ctgtggcctg ccacattggt gagctggaac agattcagca ggtgttcgcc 240 ggcattcgcg aacagttcgg gcgactggac gtgctggtca acaatgcagc caccaacccg 300 caattctgca atgtgctgga caccgaccca ggggcgttcc agaagaccgt ggacgtgaac 360 atccgtggtt acttcttcat gtcggtggag gctggcaagc tgatgcgcga gaacggcggc 420 ggcagcatca tcaacgtggc gtcgatcaac ggtgtttcac ccgggctgtt ccaaggcatc 480 tactcggtga ccaaggcggc ggtcatcaac atgaccaagg tgttcgccaa agagtgtgca 540 cccttcggta ttcgctgcaa cgcgctactg ccggggctga ccgataccaa gttcgcttcg 600 gcattggtga agaacgaagc catcctcaac gccgccttgc agcagatccc cctcaaacgc 660 gtggccgacc ccaaggaaat ggcgggtgcg gtgctgtacc tggccagcga tgcctccagc 720 tacaccaccg gcaccacgct caatgtcgac ggtggcttcc tgtcctga 768 <210> 20 <211> 255 <212> PRT <213> Pseudomonas putida KT2440 <400> 20 Met Ser Lys Thr His Leu Phe Asp Leu Asp Gly Lys Ile Ala Phe Val 1 5 10 15 Ser Gly Ala Ser Arg Gly Ile Gly Glu Ala Ile Ala His Leu Leu Ala 20 25 30 Gln Gln Gly Ala His Val Ile Val Ser Ser Arg Lys Leu Asp Gly Cys 35 40 45 Gln Gln Val Ala Asp Ala Ile Ile Ala Ala Gly Gly Lys Ala Thr Ala 50 55 60 Val Ala Cys His Ile Gly Glu Leu Glu Gln Ile Gln Gln Val Phe Ala 65 70 75 80 Gly Ile Arg Glu Gln Phe Gly Arg Leu Asp Val Leu Val Asn Asn Ala 85 90 95 Ala Thr Asn Pro Gln Phe Cys Asn Val Leu Asp Thr Asp Pro Gly Ala 100 105 110 Phe Gln Lys Thr Val Asp Val Asn Ile Arg Gly Tyr Phe Phe Met Ser 115 120 125 Val Glu Ala Gly Lys Leu Met Arg Glu Asn Gly Gly Gly Ser Ile Ile 130 135 140 Asn Val Ala Ser Ile Asn Gly Val Ser Pro Gly Leu Phe Gln Gly Ile 145 150 155 160 Tyr Ser Val Thr Lys Ala Ala Val Ile Asn Met Thr Lys Val Phe Ala 165 170 175 Lys Glu Cys Ala Pro Phe Gly Ile Arg Cys Asn Ala Leu Leu Pro Gly 180 185 190 Leu Thr Asp Thr Lys Phe Ala Ser Ala Leu Val Lys Asn Glu Ala Ile 195 200 205 Leu Asn Ala Ala Leu Gln Gln Ile Pro Leu Lys Arg Val Ala Asp Pro 210 215 220 Lys Glu Met Ala Gly Ala Val Leu Tyr Leu Ala Ser Asp Ala Ser Ser 225 230 235 240 Tyr Thr Thr Gly Thr Thr Leu Asn Val Asp Gly Gly Phe Leu Ser 245 250 255 <210> 21 <211> 762 <212> DNA <213> Pseudomonas fluorescens Pf-5 <400> 21 atgagcatga cgttttccgg ccaggtggcc ctagtgaccg gcgcagccaa tggtatcggc 60 cgcgccaccg cccaggcatt tgccgcacaa ggcttgaagg tggtggtggc ggacctggac 120 acggcggggg gcgagggcac cgtggcgctg atccgcgagg ccggtggcga ggcattgttc 180 gtgccgtgca acgttaccct ggaggcggat gtgcaaagcc tcatggcccg caccatcgaa 240 gcctatgggc gcctggatta cgccttcaac aatgccggta tcgagatcga aaagggccgc 300 cttgcggagg gctccatgga tgagttcgac gccatcatgg gggtcaacgt caaaggggtc 360 tggctgtgca tgaagtacca gttgccgctg ctgctggccc agggcggtgg ggcgatcgtc 420 aacaccgcct cggtggcggg cctgggcgcg gcgccgaaga tgagcatcta tgcggcctcc 480 aagcatgcgg tgatcggcct gaccaagtcg gcggccatcg aatatgcgaa gaagaaaatc 540 cgcgtgaacg cggtatgccc ggcggtgatc gacaccgaca tgttccgccg tgcctacgag 600 gcggacccga agaaggccga gttcgccgcg gccatgcacc cggtggggcg catcggcaag 660 gtcgaggaga tcgccagtgc ggtgctctac ctgtgcagcg atggcgcggc ctttaccacc 720 ggccatgcac tggcggtcga cggcggggcc accgcgatct ga 762 <210> 22 <211> 253 <212> PRT <213> Pseudomonas fluorescens Pf-5 <400> 22 Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Ala 1 5 10 15 Asn Gly Ile Gly Arg Ala Thr Ala Gln Ala Phe Ala Ala Gln Gly Leu 20 25 30 Lys Val Val Val Ala Asp Leu Asp Thr Ala Gly Gly Glu Gly Thr Val 35 40 45 Ala Leu Ile Arg Glu Ala Gly Gly Glu Ala Leu Phe Val Pro Cys Asn 50 55 60 Val Thr Leu Glu Ala Asp Val Gln Ser Leu Met Ala Arg Thr Ile Glu 65 70 75 80 Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile 85 90 95 Glu Lys Gly Arg Leu Ala Glu Gly Ser Met Asp Glu Phe Asp Ala Ile 100 105 110 Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu 115 120 125 Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser 130 135 140 Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ala Ala Ser 145 150 155 160 Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala 165 170 175 Lys Lys Lys Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr 180 185 190 Asp Met Phe Arg Arg Ala Tyr Glu Ala Asp Pro Lys Lys Ala Glu Phe 195 200 205 Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile 210 215 220 Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr 225 230 235 240 Gly His Ala Leu Ala Val Asp Gly Gly Ala Thr Ala Ile 245 250 <210> 23 <211> 735 <212> DNA <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 23 atgaaacttg ccagtaaaac cgccattgtc accggcgccg cacgcggtat cggctttggc 60 attgcccagg tgcttgcgcg ggaaggcgcg cgagtgatta tcgccgatcg tgatgcacac 120 ggcgaagccg ccgccgcttc cctgcgcgaa tcgggcgcac aggcgctgtt tatcagctgc 180 aatatcgctg aaaaaacgca ggtcgaagcc ctgtattccc aggccgaaga ggcgtttggc 240 ccggtagaca ttctggtgaa taacgccgga atcaaccgcg acgccatgct gcacaaatta 300 acggaagcgg actgggacac ggttatcgac gttaacctga aaggcacttt cctctgtatg 360 cagcaggccg ctatccgcat gcgcgagcgc ggtgcgggcc gcattatcaa tatcgcttcc 420 gccagttggc ttggcaacgt cgggcaaacc aactattcgg cgtcaaaagc cggcgtggtg 480 ggaatgacca aaaccgcctg ccgcgaactg gcgaaaaaag gtgtcacggt gaatgccatc 540 tgcccgggct ttatcgatac cgacatgacg cgcggcgtac cggaaaacgt ctggcaaatc 600 atggtcagca aaattcccgc gggttacgcc ggcgaggcga aagacgtcgg cgagtgtgtg 660 gcgtttctgg cgtccgatgg cgcgcgctat atcaatggtg aagtgattaa cgtcggcggc 720 ggcatggtgc tgtaa 735 <210> 24 <211> 253 <212> PRT <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 24 Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Ala 1 5 10 15 Asn Gly Ile Gly Arg Ala Thr Ala Gln Ala Phe Ala Ala Gln Gly Leu 20 25 30 Lys Val Val Val Ala Asp Leu Asp Thr Ala Gly Gly Glu Gly Thr Val 35 40 45 Ala Leu Ile Arg Glu Ala Gly Gly Glu Ala Leu Phe Val Pro Cys Asn 50 55 60 Val Thr Leu Glu Ala Asp Val Gln Ser Leu Met Ala Arg Thr Ile Glu 65 70 75 80 Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile 85 90 95 Glu Lys Gly Arg Leu Ala Glu Gly Ser Met Asp Glu Phe Asp Ala Ile 100 105 110 Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu 115 120 125 Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser 130 135 140 Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ala Ala Ser 145 150 155 160 Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala 165 170 175 Lys Lys Lys Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr 180 185 190 Asp Met Phe Arg Arg Ala Tyr Glu Ala Asp Pro Lys Lys Ala Glu Phe 195 200 205 Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile 210 215 220 Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr 225 230 235 240 Gly His Ala Leu Ala Val Asp Gly Gly Ala Thr Ala Ile 245 250 <210> 25 <211> 750 <212> DNA <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 25 atgttattga aagataaagt cgccattatt actggcgcgg cctccgcacg cggtttgggc 60 ttcgcgactg cgaaattatt cgccgaaaac ggcgcgaaag tggtcattat cgacctcaat 120 ggcgaagcca gtaaaaccgc cgcggcggca ttaggcgaag accatctcgg cctggcggcc 180 aacgtcgctg atgaagtgca ggtgcaggcg gccatcgaac agatcctggc gaaatacggt 240 cgggttgatg tactggtcaa taacgccggg attacccagc cgctgaagct gatggatatc 300 aagcgcgcca actatgacgc ggtgcttgat gttagcctgc gcggcacgct gctgatgtcg 360 caggcggtta tccccaccat gcgggcgcaa aaatccggca gcatcgtctg catctcgtcc 420 gtctccgccc agcgcggcgg cggtattttc ggcggaccgc actacagcgc ggcaaaagcc 480 ggggtgctgg gtctggcgcg ggcgatggcg cgcgagcttg gcccggataa cgtccgcgtt 540 aactgcatca ccccggggct gattcagacc gacattaccg ccggcaagct gactgatgac 600 atgacggcca acattcttgc cggcattccg atgaaccgcc ttggcgacgc gatagacatc 660 gcgcgcgccg cgctgttcct cggcagcgat ctttcctcct actccaccgg catcaccctg 720 gacgttaacg gcggcatgtt aattcactaa 750 <210> 26 <211> 249 <212> PRT <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 26 Met Leu Leu Lys Asp Lys Val Ala Ile Ile Thr Gly Ala Ala Ser Ala 1 5 10 15 Arg Gly Leu Gly Phe Ala Thr Ala Lys Leu Phe Ala Glu Asn Gly Ala 20 25 30 Lys Val Val Ile Ile Asp Leu Asn Gly Glu Ala Ser Lys Thr Ala Ala 35 40 45 Ala Ala Leu Gly Glu Asp His Leu Gly Leu Ala Ala Asn Val Ala Asp 50 55 60 Glu Val Gln Val Gln Ala Ala Ile Glu Gln Ile Leu Ala Lys Tyr Gly 65 70 75 80 Arg Val Asp Val Leu Val Asn Asn Ala Gly Ile Thr Gln Pro Leu Lys 85 90 95 Leu Met Asp Ile Lys Arg Ala Asn Tyr Asp Ala Val Leu Asp Val Ser 100 105 110 Leu Arg Gly Thr Leu Leu Met Ser Gln Ala Val Ile Pro Thr Met Arg 115 120 125 Ala Gln Lys Ser Gly Ser Ile Val Cys Ile Ser Ser Val Ser Ala Gln 130 135 140 Arg Gly Gly Gly Ile Phe Gly Gly Pro His Tyr Ser Ala Ala Lys Ala 145 150 155 160 Gly Val Leu Gly Leu Ala Arg Ala Met Ala Arg Glu Leu Gly Pro Asp 165 170 175 Asn Val Arg Val Asn Cys Ile Thr Pro Gly Leu Ile Gln Thr Asp Ile 180 185 190 Thr Ala Gly Lys Leu Thr Asp Asp Met Thr Ala Asn Ile Leu Ala Gly 195 200 205 Ile Pro Met Asn Arg Leu Gly Asp Ala Ile Asp Ile Ala Arg Ala Ala 210 215 220 Leu Phe Leu Gly Ser Asp Leu Ser Ser Tyr Ser Thr Gly Ile Thr Leu 225 230 235 240 Asp Val Asn Gly Gly Met Leu Ile His 245 <210> 27 <211> 750 <212> DNA <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 27 atgttattga aagataaagt cgccattatt actggcgcgg cctccgcacg cggtttgggc 60 ttcgcgactg cgaaattatt cgccgaaaac ggcgcgaaag tggtcattat cgacctcaat 120 ggcgaagcca gtaaaaccgc cgcggcggca ttaggcgaag accatctcgg cctggcggcc 180 aacgtcgctg atgaagtgca ggtgcaggcg gccatcgaac agatcctggc gaaatacggt 240 cgggttgatg tactggtcaa taacgccggg attacccagc cgctgaagct gatggatatc 300 aagcgcgcca actatgacgc ggtgcttgat gttagcctgc gcggcacgct gctgatgtcg 360 caggcggtta tccccaccat gcgggcgcaa aaatccggca gcatcgtctg catctcgtcc 420 gtctccgccc agcgcggcgg cggtattttc ggcggaccgc actacagcgc ggcaaaagcc 480 ggggtgctgg gtctggcgcg ggcgatggcg cgcgagcttg gcccggataa cgtccgcgtt 540 aactgcatca ccccggggct gattcagacc gacattaccg ccggcaagct gactgatgac 600 atgacggcca acattcttgc cggcattccg atgaaccgcc ttggcgacgc gatagacatc 660 gcgcgcgccg cgctgttcct cggcagcgat ctttcctcct actccaccgg catcaccctg 720 gacgttaacg gcggcatgtt aattcactaa 750 <210> 28 <211> 249 <212> PRT <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 28 Met Leu Leu Lys Asp Lys Val Ala Ile Ile Thr Gly Ala Ala Ser Ala 1 5 10 15 Arg Gly Leu Gly Phe Ala Thr Ala Lys Leu Phe Ala Glu Asn Gly Ala 20 25 30 Lys Val Val Ile Ile Asp Leu Asn Gly Glu Ala Ser Lys Thr Ala Ala 35 40 45 Ala Ala Leu Gly Glu Asp His Leu Gly Leu Ala Ala Asn Val Ala Asp 50 55 60 Glu Val Gln Val Gln Ala Ala Ile Glu Gln Ile Leu Ala Lys Tyr Gly 65 70 75 80 Arg Val Asp Val Leu Val Asn Asn Ala Gly Ile Thr Gln Pro Leu Lys 85 90 95 Leu Met Asp Ile Lys Arg Ala Asn Tyr Asp Ala Val Leu Asp Val Ser 100 105 110 Leu Arg Gly Thr Leu Leu Met Ser Gln Ala Val Ile Pro Thr Met Arg 115 120 125 Ala Gln Lys Ser Gly Ser Ile Val Cys Ile Ser Ser Val Ser Ala Gln 130 135 140 Arg Gly Gly Gly Ile Phe Gly Gly Pro His Tyr Ser Ala Ala Lys Ala 145 150 155 160 Gly Val Leu Gly Leu Ala Arg Ala Met Ala Arg Glu Leu Gly Pro Asp 165 170 175 Asn Val Arg Val Asn Cys Ile Thr Pro Gly Leu Ile Gln Thr Asp Ile 180 185 190 Thr Ala Gly Lys Leu Thr Asp Asp Met Thr Ala Asn Ile Leu Ala Gly 195 200 205 Ile Pro Met Asn Arg Leu Gly Asp Ala Ile Asp Ile Ala Arg Ala Ala 210 215 220 Leu Phe Leu Gly Ser Asp Leu Ser Ser Tyr Ser Thr Gly Ile Thr Leu 225 230 235 240 Asp Val Asn Gly Gly Met Leu Ile His 245 <210> 29 <211> 714 <212> DNA <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 29 atgacagcgt ttcacaacaa atcagtgctg gttttaggcg ggagtcgggg aattggcgcg 60 gcgatcgtca ggcgttttgt cgccgatggc gcgtcggtgg tgtttagcta ttccggttcg 120 ccggaagcgg ccgagcggct ggcggcagag accggcagca cggcggtgca ggcggacagc 180 gccgatcgcg atgcggtgat aagcctggtc cgcgacagcg gcccgctgga cgtgttagtg 240 gtcaatgccg ggatcgcgct tttcggtgac gctctcgagc aggacagcga tgcaatcgat 300 cgcctgttcc acatcaatat tcacgccccc taccatgcct ccgtcgaagc ggcgcgccgc 360 atgccggaag gcgggcgcat tattgtcatc ggctcagtca atggcgatcg catgccgttg 420 ccgggaatgg cggcctatgc gctcagcaaa tcggccctgc aggggctggc gcgcggcctg 480 gcgcgggatt ttggcccgcg cggcatcacg gtcaacgtcg tccagcccgg cccaattgat 540 accgacgcca acccggagaa cggcccgatg aaagagctga tgcacagctt tatggccatt 600 aagcgccatg gccgtccgga agaggtggcg ggaatggtgg cgtggctggc cggtccggag 660 gcgtcgtttg tcactggcgc catgcacacc atcgacggag cgtttggcgc ctga 714 <210> 30 <211> 237 <212> PRT <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 30 Met Thr Ala Phe His Asn Lys Ser Val Leu Val Leu Gly Gly Ser Arg 1 5 10 15 Gly Ile Gly Ala Ala Ile Val Arg Arg Phe Val Ala Asp Gly Ala Ser 20 25 30 Val Val Phe Ser Tyr Ser Gly Ser Pro Glu Ala Ala Glu Arg Leu Ala 35 40 45 Ala Glu Thr Gly Ser Thr Ala Val Gln Ala Asp Ser Ala Asp Arg Asp 50 55 60 Ala Val Ile Ser Leu Val Arg Asp Ser Gly Pro Leu Asp Val Leu Val 65 70 75 80 Val Asn Ala Gly Ile Ala Leu Phe Gly Asp Ala Leu Glu Gln Asp Ser 85 90 95 Asp Ala Ile Asp Arg Leu Phe His Ile Asn Ile His Ala Pro Tyr His 100 105 110 Ala Ser Val Glu Ala Ala Arg Arg Met Pro Glu Gly Gly Arg Ile Ile 115 120 125 Val Ile Gly Ser Val Asn Gly Asp Arg Met Pro Leu Pro Gly Met Ala 130 135 140 Ala Tyr Ala Leu Ser Lys Ser Ala Leu Gln Gly Leu Ala Arg Gly Leu 145 150 155 160 Ala Arg Asp Phe Gly Pro Arg Gly Ile Thr Val Asn Val Val Gln Pro 165 170 175 Gly Pro Ile Asp Thr Asp Ala Asn Pro Glu Asn Gly Pro Met Lys Glu 180 185 190 Leu Met His Ser Phe Met Ala Ile Lys Arg His Gly Arg Pro Glu Glu 195 200 205 Val Ala Gly Met Val Ala Trp Leu Ala Gly Pro Glu Ala Ser Phe Val 210 215 220 Thr Gly Ala Met His Thr Ile Asp Gly Ala Phe Gly Ala 225 230 235 <210> 31 <211> 750 <212> DNA <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 31 atgaacggcc tgctaaacgg taaacgtatt gtcgtcaccg gtgcggcgcg cggtctcggg 60 taccactttg ccgaagcctg cgccgctcag ggcgcgacgg tggtgatgtg cgacatcctg 120 cagggagagc tggcggaaag cgctcatcgc ctgcagcaga agggctatca ggtcgaatct 180 cacgccatcg atcttgccag tcaagcatcg atcgagcagg tcttcagcgc catcggcgcg 240 caggggtcta tcgatggctt agtcaataac gcagcgatgg ccaccggcgt cggcggaaaa 300 aatatgatcg attacgatcc ggatctgtgg gatcgggtaa tgacggtcaa cgttaaaggc 360 acctggttgg tgacccgcgc ggcggtaccg ctgctgcgcg aaggggcggc gatcgtcaac 420 gtcgcttcgg ataccgcgct gtggggcgcg ccgcggctga tggcctatgt cgccagtaag 480 ggcgcggtga ttgcgatgac ccgctccatg gcccgcgagc tgggtgaaaa gcggatccgt 540 atcaacgcca tcgcgccggg actgacccgc gttgaggcca cggaatacgt tcccgccgag 600 cgtcatcagc tgtatgagaa cggccgcgcg ctcagcggcg cgcagcagcc ggaagatgtc 660 accggcagcg tggtctggct gctgagcgat ctttcgcgct ttatcaccgg ccaactgatc 720 ccggtcaacg gcggttttgt ctttaactaa 750 <210> 32 <211> 249 <212> PRT <213> Klebsiella pneumonia subsp. pneumonia MGH78578 <400> 32 Met Asn Gly Leu Leu Asn Gly Lys Arg Ile Val Val Thr Gly Ala Ala 1 5 10 15 Arg Gly Leu Gly Tyr His Phe Ala Glu Ala Cys Ala Ala Gln Gly Ala 20 25 30 Thr Val Val Met Cys Asp Ile Leu Gln Gly Glu Leu Ala Glu Ser Ala 35 40 45 His Arg Leu Gln Gln Lys Gly Tyr Gln Val Glu Ser His Ala Ile Asp 50 55 60 Leu Ala Ser Gln Ala Ser Ile Glu Gln Val Phe Ser Ala Ile Gly Ala 65 70 75 80 Gln Gly Ser Ile Asp Gly Leu Val Asn Asn Ala Ala Met Ala Thr Gly 85 90 95 Val Gly Gly Lys Asn Met Ile Asp Tyr Asp Pro Asp Leu Trp Asp Arg 100 105 110 Val Met Thr Val Asn Val Lys Gly Thr Trp Leu Val Thr Arg Ala Ala 115 120 125 Val Pro Leu Leu Arg Glu Gly Ala Ala Ile Val Asn Val Ala Ser Asp 130 135 140 Thr Ala Leu Trp Gly Ala Pro Arg Leu Met Ala Tyr Val Ala Ser Lys 145 150 155 160 Gly Ala Val Ile Ala Met Thr Arg Ser Met Ala Arg Glu Leu Gly Glu 165 170 175 Lys Arg Ile Arg Ile Asn Ala Ile Ala Pro Gly Leu Thr Arg Val Glu 180 185 190 Ala Thr Glu Tyr Val Pro Ala Glu Arg His Gln Leu Tyr Glu Asn Gly 195 200 205 Arg Ala Leu Ser Gly Ala Gln Gln Pro Glu Asp Val Thr Gly Ser Val 210 215 220 Val Trp Leu Leu Ser Asp Leu Ser Arg Phe Ile Thr Gly Gln Leu Ile 225 230 235 240 Pro Val Asn Gly Gly Phe Val Phe Asn 245 <210> 33 <211> 795 <212> DNA <213> Klebsiella pneumoniae subsp. pneumoniae MGH78578 <400> 33 atgaatgcac aaattgaagg gcgcgtcgcg gtagtcaccg gcggttcgtc aggaatcggc 60 tttgaaacgc tgcgcctgct gctgggcgaa ggggcgaaag tcgccttttg cggccgcaac 120 ccggatcggc ttgccagcgc ccatgcggcg ttgcaaaacg aatatccaga aggtgaggtg 180 ttctcctggc gctgtgacgt actgaacgaa gctgaagttg aggcgttcgc cgccgcggtc 240 gccgcgcgtt tcggcggcgt cgatatgctg attaataacg ccggccaggg ctatgtcgcc 300 cacttcgccg atacgccacg tgaggcctgg ctgcacgaag ccgaactgaa actgttcggc 360 gtgattaacc cggtaaaggc ctttcagtcc ctgctagagg cgtcggatat cgcctcgatt 420 acctgtgtga actcgctgct ggcgttacag ccggaagagc acatgatcgc cacctctgcc 480 gcccgcgccg cgctgctcaa tatgacgctg actctgtcga aagagctggt ggataaaggt 540 attcgtgtga attccattct gctggggatg gtggagtccg ggcagtggca gcgccgtttt 600 gagagccgaa gcgataagag ccagagttgg cagcagtgga ccgccgatat cgcccgtaag 660 cgggggatcc cgatggcgcg tctcggtaag ccgcaggagc cagcgcaagc gctgctattc 720 ctcgcttcgc cgctggcctc ctttaccacc ggcgcggcgc tggacgtttc cggcggtttc 780 tgtcgccatc tgtaa 795 <210> 34 <211> 264 <212> PRT <213> Klebsiella pneumonia subsp. pneumoniae MGH78578 <400> 34 Met Asn Ala Gln Ile Glu Gly Arg Val Ala Val Val Thr Gly Gly Ser 1 5 10 15 Ser Gly Ile Gly Phe Glu Thr Leu Arg Leu Leu Leu Gly Glu Gly Ala 20 25 30 Lys Val Ala Phe Cys Gly Arg Asn Pro Asp Arg Leu Ala Ser Ala His 35 40 45 Ala Ala Leu Gln Asn Glu Tyr Pro Glu Gly Glu Val Phe Ser Trp Arg 50 55 60 Cys Asp Val Leu Asn Glu Ala Glu Val Glu Ala Phe Ala Ala Ala Val 65 70 75 80 Ala Ala Arg Phe Gly Gly Val Asp Met Leu Ile Asn Asn Ala Gly Gln 85 90 95 Gly Tyr Val Ala His Phe Ala Asp Thr Pro Arg Glu Ala Trp Leu His 100 105 110 Glu Ala Glu Leu Lys Leu Phe Gly Val Ile Asn Pro Val Lys Ala Phe 115 120 125 Gln Ser Leu Leu Glu Ala Ser Asp Ile Ala Ser Ile Thr Cys Val Asn 130 135 140 Ser Leu Leu Ala Leu Gln Pro Glu Glu His Met Ile Ala Thr Ser Ala 145 150 155 160 Ala Arg Ala Ala Leu Leu Asn Met Thr Leu Thr Leu Ser Lys Glu Leu 165 170 175 Val Asp Lys Gly Ile Arg Val Asn Ser Ile Leu Leu Gly Met Val Glu 180 185 190 Ser Gly Gln Trp Gln Arg Arg Phe Glu Ser Arg Ser Asp Lys Ser Gln 195 200 205 Ser Trp Gln Gln Trp Thr Ala Asp Ile Ala Arg Lys Arg Gly Ile Pro 210 215 220 Met Ala Arg Leu Gly Lys Pro Gln Glu Pro Ala Gln Ala Leu Leu Phe 225 230 235 240 Leu Ala Ser Pro Leu Ala Ser Phe Thr Thr Gly Ala Ala Leu Asp Val 245 250 255 Ser Gly Gly Phe Cys Arg His Leu 260 <210> 35 <211> 1204 <212> DNA <213> Saccharomyces cerevisiae <400> 35 atgccatttg taaaaggttt tgagccgatc tccctaagag acacaaacct ttttgaacca 60 attaagattg gtaacactca gctggcacat cgtgcggtta tgcccccatt gaccagaatg 120 agggccactc accccggaaa tattccaaat aaggagtggg ctgctgtgta ttatggtcag 180 cgtgctcaaa gacctggtac catgatcatc acggaaggta cgtttatttc ccctcaagcc 240 ggcggctatg acaacgcccc tgggatttgg tctgatgaac aggtcgctga gtggaagaat 300 atctttttag ccatccatga ttgtcagtcg ttcgcgtggg tacaactttg gtctttaggc 360 tgggcatcct tcccagacgt attggcaaga gacgggttac gctatgactg tgcatctgac 420 agagtgtata tgaatgctac gttacaagaa aaggccaaag atgcgaataa tctcgaacat 480 agtttgacta aagacgacat taaacagtat atcaaggatt acatccatgc cgctaagaat 540 tctatcgcgg ctggcgccga tggtgtagaa attcatagcg ccaatgggta cttgttgaat 600 cagttcttgg atccacattc taataagagg accgacgaat acggcggaac gatcgaaaac 660 agggcccgct ttacactgga ggttgtcgat gctcttatcg aaacaatcgg tcctgaacgg 720 gtgggtttga ggttgtcgcc atacggcact tttaacagta tgtctggagg tgctgaacca 780 ggtattatcg ctcaatatgc ttatgttttg ggtgaattag agaagagggc aaaggctggt 840 aagcgtttgg cctttgtgca ccttgttgaa ccacgtgtca cggacccatc gttggtggag 900 ggcgaaggag aatattccga gggtactaac gattttgcct actctatatg gaagggtcca 960 atcatcagag ctggtaatta cgctcttcat ccagaagtgg ttagagaaca agtaaaggat 1020 cccagaacct tgataggcta tggtagattc ttcatctcca acccagattt agtctaccgt 1080 ttagaagagg gcctgccatt gaacaagtat gacagaagta ccttctacac catgtccgcg 1140 gaaggttata ccgactaccc aacatatgaa gaggcagtag atttaggttg gaacaagaac 1200 tgat 1204 <210> 36 <211> 1203 <212> DNA <213> Saccharomyces cerevisiae <400> 36 atgccatttg ttaaggactt taagccacaa gctttgggtg acaccaactt attcaaacca 60 atcaaaattg gtaacaatga acttctacac cgtgctgtca ttcctccatt gactagaatg 120 agagcccaac atccaggtaa tattccaaac agagactggg ccgttgaata ctacgctcaa 180 cgtgctcaaa gaccaggaac cttgattatc actgaaggta cctttccctc tccacaatct 240 gggggttacg acaatgctcc aggtatctgg tccgaagaac aaattaaaga atggaccaag 300 attttcaagg ctattcatga gaagaaatcg ttcgcatggg tccaattatg ggttctaggt 360 tgggctgctt tcccagacac ccttgctagg gatggtttgc gttacgactc cgcttctgac 420 aacgtgtata tgaatgcaga acaagaagaa aaggctaaga aggctaacaa cccacaacac 480 agtataacaa aggatgaaat taagcaatac gtcaaagaat acgtccaagc tgccaaaaac 540 tccattgctg ctggtgccga tggtgttgaa atccacagcg ctaacggtta cttgttgaac 600 cagttcttgg acccacactc caataacaga accgatgagt atggtggatc catcgaaaac 660 agagcccgtt tcaccttgga agtggttgat gcagttgtcg atgctattgg ccctgaaaaa 720 gtcggtttga gattgtctcc atatggtgtc ttcaacagta tgtctggtgg tgctgaaacc 780 ggtattgttg ctcaatatgc ttatgtctta ggtgaactgg aaagaagagc taaagctggc 840 aagcgtttgg ctttcgtcca tctagttgaa cctcgtgtca ccaacccatt tttaactgaa 900 ggtgaaggtg aatacaatgg aggtagcaac gaatttgctt attctatctg gaagggtcca 960 attattagag caggtaactt tgctctgcac ccagaagttg tcagagaaga ggtgaaggat 1020 cctagaacat tgatcggtta cggtagattt tttatctcta atccagattt ggttgatcgt 1080 ttggaaaaag ggttaccatt aaacaaatat gacagagaca ctttctacaa aatgtcagct 1140 gagggataca ttgactaccc tacctacgaa gaagctctaa aactcggttg ggacaaaaat 1200 taa 1203 <210> 37 <211> 1203 <212> DNA <213> Saccharomyces cerevisiae <400> 37 atgccatttg taaaaggttt tgagccgatc tccctaagag acacaaacct ttttgaacca 60 attaagattg gtaacactca gcttgcacat cgtgcggtta tgcccccatt gaccagaatg 120 agggccactc accccggaaa tattccaaat aaggagtggg ctgctgtgta ttatggtcag 180 cgtgctcaaa gacctggtac catgatcatc acggaaggta cgtttatttc ccctcaagcc 240 ggcggctatg acaacgcccc tgggatttgg tctgatgagc aggtcgctga gtggaagaat 300 atctttttag ccatccatga ttgtcagtcg ttcgcgtggg tacaactttg gtctttaggc 360 tgggcatcct tcccagacgt attggcaaga gacgggttac gctatgactg tgcatctgac 420 agagtgtata tgaatgctac gttacaagaa aaggccaaag atgcgaataa tctcgaacat 480 agtttgacta aagacgacat taaacagtat atcaaggatt acatccatgc ggctaagaat 540 tctatcgcgg ctggcgccga tggtgtagaa attcatagcg ccaatgggta cttgttgaat 600 cagttcttgg atccacattc taataagagg accgacgaat acggcggaac gatcgaaaac 660 agggcccgct ttacactgga ggttgtcgat gctcttatcg aaactatcgg tcctgaacgg 720 gtgggtttga ggttgtcgcc gtacggcact tttaacagta tgtctggggg tgctgaacca 780 ggtattatcg ctcaatattc gtatgttttg ggtgaattag agaagagggc aaaggctggt 840 aagcgtttgg cctttgtgca cctcgttgaa ccacgtgtca cggacccatc gttggtggag 900 ggcgaaggag aatattccga gggtactaac gattttgcct actctatatg gaagggtcca 960 atcatcagag ctggtaatta cgctcttcat ccagaagtgg ttagagaaca agtaaaggat 1020 cccagaacct tgataggcta tggtagattc ttcatctcta acccagattt agtctaccgt 1080 ttagaagagg gcctgccatt gaacaagtat gacagaagta ccttctacac catgtccgcg 1140 gaaggttata ccgactaccc aacatatgaa gaggcagtag atttaggttg gaacaagaac 1200 tga 1203 <210> 38 <211> 1203 <212> DNA <213> Saccharomyces cerevisiae <400> 38 atgccatttg ttaaggactt taagccacaa gctttgggtg acaccaactt attcaaacca 60 atcaaaattg gtaacaatga acttctacac cgtgctgtca ttcctccatt gactagaatg 120 agagcccaac atccaggtaa tattccaaac agagactggg ccgttgaata ctacgctcaa 180 cgtgctcaaa gaccaggaac cttgattatc actgaaggta cctttccctc tccacaatct 240 gggggttacg acaatgctcc aggtatccgg tccgaagaac aaattaaaga atggaccaag 300 attttcaagg ctattcatga gaataaatcg ttcgcatggg tccaattatg ggttctaggt 360 tgggctgctt tcccagacac ccttgctagg gatggtttgc gttacgactc cgcttctgac 420 aacgtgtata tgaatgcaga acaagaagaa aaggctaaga aggctaacaa cccacaacac 480 agtataacaa aggatgaaat taagcaatac gtcaaagaat acgtccaagc tgccaaaaac 540 tccattgctg ctggtgccga tggtgttgaa atccacagcg ctaacggtta cttgttgaac 600 cagttcttgg acccacactc caataacaga accgatgagt atggtggatc catcgaaaac 660 agagcccgtt tcaccttgga agtggttgat gcagttgtcg atgctattgg ccctgaaaaa 720 gtcggtttga gattgtctcc atatggtgtc ttcaacagta tgtctggtgg tgctgaaacc 780 ggtattgttg ctcaatatgc ttatgtctta ggtgaactag aaagaagagc taaagctggc 840 aagcgtttgg ctttcgtcca tctagttgaa cctcgtgtca ccaacccatt tttaactgaa 900 ggtgaaggtg aatacaatgg aggtagcaac aaatttgctt attctatctg gaagggccca 960 attattagag ctggtaactt tgctctgcac ccagaagttg tcagagaaga ggtgaaggat 1020 cctagaacat tgatcggtta cggtagattt tttatctcta atccagattt ggttgatcgt 1080 ttggaaaaag ggttaccatt aaacaaatat gacagagaca ctttctacaa aatgtcagct 1140 gagggataca ttgactaccc tacgtacgaa gaagctctaa aactcggttg ggacaaaaat 1200 taa 1203 <210> 39 <211> 1209 <212> DNA <213> Pichia angusta <400> 39 atgaccccaa gcacttctct tgcttccagc aatctgttca agcctatcaa ggtcggcaaa 60 gtcgagctga aaaacagact tgttttcgct ccaaccacca gatacagagc ctcgaaggat 120 tttgttccta ccgactccat gctcaagtac tacgagcaaa gagcggaaaa taacggaggc 180 ttgctgactg ctgaggcaac ctacgtcgac ttcaattttg gcctctatcc gttcacgccg 240 atgatcaaga cgcctgcgca ggttgcggcc tgggccaaga tcatcgaggc tgtacacaag 300 cagggatcat atttctccat ccagctgtgg catctcggca gggctgccga ccccaagttc 360 aacaaggaga agggcgtgcc gttcgtggct ccgtcggcta tatacttgga ccaggactct 420 gagaaggcag cccgggaggc cggcaacgag cttagagaac tgacgatccc ggagattgag 480 gcgattgtca aagagtttgc tgcagccgcg aaaagagcca tccacgaggc caaggccgac 540 ttcatcgagc tgcacagcgc ccacggctat ctgctggacc agtttatcca gccaaacatc 600 aacaagagaa ccgacaagta cggtggttcg attgagaatc gcgcccggtt ggttctagag 660 gttgtcgacg cgtgcattga ggcggtcggc gcagaacacg tgggtataag actgtcgccg 720 tacgccaagt tccaaggcag cgagggtgtt gacagcgaaa tcaacccgat cgcgtccttc 780 ggctacattt tgagcgagct cgagaaaaga gccagagacg gaaacaggct ggcgtatgtt 840 tccgtagtcg agccaagagt tagcggaaac gtagacagca acgaccagcg gaagtttgac 900 acttcctgga tcagagaaat ctggaagggt attctattta gggccggcgg atacctcaaa 960 gaaaacgagc agtcgctgga gcacgatgtc aaccaggacg acagaacgct tattggcgtc 1020 tcgagatatt acacttcgaa tccagatctc gtggagagat tgaaaaaggg tctgtcgctg 1080 acgccctacg atagatcccg cttctacaac cactcctcca acgacggcta cctcacatgg 1140 cctaagtatg gcgaggacga ggagaagtac aaagctgtgc tggatgtcga gccaaaggcc 1200 cttgcgtag 1209 <210> 40 <211> 1206 <212> DNA <213> Pichia angusta <400> 40 atgtctcagc catcattaac agacacaaac ctattcaaac caatcaaggt cggtaatgtg 60 gagctcaagc acggattctt ctcggctcca accacgagat tcagagcatc tgatgatttc 120 gtgcctaccg actccatgct cagctactat gagcagcgcg cggagaacaa cggtggactt 180 atcgttgccg aagccacttt ccccgactac agctttggcc tgtatccaaa cgctcctatg 240 atcaagacgc cggagcaggt tgctgcctgg aagaaaatcg tggatgctgt ccataagcag 300 ggatctttct tctcgattca gctgtggcac ttgggaagag ttgccgtccc gcagctgaac 360 aagaagtaca acgttcccct tgttggtcct tccaaactct acgtcgacga gagcagcgag 420 aaggcagcaa aagaggcagg aaacgagcta cacgagctga ctatccctga aatcgaggcc 480 atcgtgaagg agtttgccgc cggcgccaag cgggtggttg acgaagccaa agcagacttt 540 gtggaaattc ttgctggagg aggctacttg ctggaccagt tcaaccactc aaacatcaac 600 aagagaaccg ataagtacgg tggctcgatc gaaaaccgtg ccagactgat tttggaggtt 660 gtcgacgcat gcatcgaggc ggtcggcgca gagcatgtcg gcatcaagct gtcgccatac 720 gcagcggtca atggtctcca gggtgtcgat acggagatcc accctatttc cagatatgga 780 tacatcttga gcgagttgga gagaagagga aaggagggaa agagaatcgc gtacatcaca 840 atgatcgagc ctcgtgtcaa cggcacggag gacagcaagg acacgcgggc gttcgactcc 900 tcgtgggtgg gcgagatctg gaagagcact ctgttgaggg cgggcgccta tctcaaccag 960 ttctcgaatt acctgatcca ggacgtcaac aaggacgaca gaacgctaat tggagccgct 1020 agatacttta cctccaaccc ggaccttatc gagagactga gaaagggaca ggagctgact 1080 ccgtacgaca gatcgaagtt ctacaccccg gccaccaatg acggctacat cacgtggacc 1140 aagtatggcg aggatcccga aaagtacaag ggccttgttg ccgtgaagcc acagccgctg 1200 tcctga 1206 <210> 41 <211> 1209 <212> DNA <213> Pichia angusta <400> 41 atgtccaaga caccaacgct agcaaacacg aatctgttca agcctattaa agtcggcaaa 60 gtcgagctga aaaacagact tgttttcgct ccaaccacca gatacagagc ctcgaaggac 120 tttgttccta ccgactccat gctcaagtac tacgaacaga gagcagagaa caacggcggt 180 ctcctggtga ccgaggctac ttatccggac tatagctttg gtctgtaccc cgacaccccg 240 atgatcaaga cgccggctca ggttgctggc tggaaaaagg tgattgaggc cgtccacaac 300 aagggctcct tcgtctctat ccagctgtgg cacctgggaa gaactgccag cgccgagttc 360 aacaagtcca agggtcttcc cctggtcggt gcttcgccga tctacatgga cgaggactcc 420 gagaaggcgg ccaaggaggc tggcaacgag ctcagagcgc tcacgattcc tgaaatagag 480 aacattgtta ccgaatatgc tgctgccgcc aagcgtgcga tccacgaggc caaggccgac 540 ttcatcgagc tgcacggcgc ccacggctat cttctcgatc agttcaacca gcctggctcc 600 aataagagaa ccgacaagta tggtggatcc atcgagaacc gcgccagact gatcctggag 660 gctgttgacg cctgcatcga ggctgttggc gctgagcacg ttgccatcag actgtctccg 720 tatgcggccg ttcagggtat caaaggtgtt gacagcgaga tccaccccat ctcctacttt 780 ggctacgtgc tgagcgagct cgagcgcaga gcccaggagg gaaagagact ggcctacatc 840 tctgttgtcg agccaagagt caacggcatc tacgactcca aggacaagag agaattcaac 900 acctcgtgga tcagcgaaat ctggaagggt gttcttctga gatctggtgc ctacctgaac 960 gagaactaca agttcttgca gcatgacgtg gacgagaacg acagaaccct gattggagtt 1020 tccagatact acacgtccaa cccagacctt gctgaccggc tcaagaacgg ccacgagctg 1080 acaccatatg atagatctaa attctacaaa cactcctcca acgacggata cctgacctgg 1140 accagatacg gagagaaaga gcctcagtac aaggatctgg tggatgttgc tccagagcca 1200 ctggcctga 1209 <210> 42 <211> 1077 <212> DNA <213> Zymomonas mobilis <400> 42 atgcctagct tgtttgatcc catccgcttc ggcgctttta ccgcaaaaaa tagaatttgg 60 atggcgcctc tgacccgtgg ccgtgccacg cgcgatcatg tccccactga aataatggcc 120 gaatattatg cccagagggc aagcgccgga ctgattattt cagaagcgac tggcattagt 180 caggaaggtt tgggctggcc ttatgctccg ggaatctgga gtgatgccca agtagaagcc 240 tggctgccga ttacgcaggc cgtgcatgat gccggcggtc ttatctttgc ccagctatgg 300 catatgggac gtatggtgcc gtctaatgtc agtgggatgc agcctgttgc gccttctgcc 360 agtcaggcac ccggattggg gcatacctat gatggtaaaa agccttatga tgttgcccgc 420 gctttgcgat tggatgaaat tccgcgtctt cttgatgatt atgaaaaggc tgcccgtcat 480 gccttgaagg ccggttttga tggcgtacag atccatgccg ctaatggtta tttgattgac 540 gaatttatac gggatagcac caaccatcgt catgatgaat atgggggtgc agttgaaaac 600 cgtattcgtt tgctgaaaga cgtcaccgaa cgagttattg caaccattgg gaaagagcgg 660 acggccgtta ggttatcacc gaatggtgaa atacagggga cggttgatag tcatcccgaa 720 caggttttta taccggcggc caaaatgttg tctgatttgg atattgcctt tttagggatg 780 cgagaagggg ctgttgatgg cacctttggc aaaacagatc agcccaaatt atcgcctgaa 840 atccgaaaag ttttcaaacc gcctttggtt cttaatcagg attatacttt tgaaaccgcg 900 caagctgctc ttgattccgg tgtggccgat gccatcagtt ttggaaggcc ttttatcggt 960 aatcctgatt tgccacggcg tttctttgag aaagcccccc ttaccaaaga tgtgattgag 1020 acttggtata cccaaacccc caagggatat acggattatc ctttgcttgg ggattga 1077 <210> 43 <211> 1098 <212> DNA <213> Escherichia coli DH10B <400> 43 atgtcatctg aaaaactgta ttccccactg aaagtgggcg cgatcacggc ggcaaaccgt 60 atttttatgg caccgctgac gcgtctgcgc agtattgaac cgggtgacat tcctaccccg 120 ttgatggcgg aatactatcg ccaacgtgcc agtgccggtt tgattattag tgaagccacg 180 caaatttctg cccaggcaaa aggatatgca ggtgcgcctg gcatccatag tccggagcaa 240 attgccgcat ggaaaaaaat caccgctggc gttcatgctg aaaatggtca tatggccgtg 300 cagctgtggc acaccggacg catttctcac gccagcctgc aacctggcgg tcaggcaccg 360 gtagcgcctt cagcacttag cgcgggaaca cgtacttctc tgcgcgatga aaatggtcag 420 gcgatccgtg ttgaaacatc catgccgcgt gcgcttgaac tggaagagat tccaggtatc 480 gtcaatgatt tccgtcaggc cattgctaac gcgcgtgaag ccggttttga tctggtagag 540 ctccactctg ctcacggtta tttgctgcat cagttccttt ctccttcttc aaaccatcgt 600 accgatcagt acggcggcag cgtggaaaat cgcgcacgtt tggtactgga agtggtcgat 660 gccgggattg aagaatgggg tgccgatcgc attggcattc gcgtttcacc aatcggtact 720 ttccagaaca cagataacgg cccgaatgaa gaagccgatg cactgtatct gattgaacaa 780 ctgggtaaac gcggcattgc ttatctgcat atgtcagaac cagattgggc ggggggtgaa 840 ccgtatactg atgcgttccg cgaaaaagta cgcgcccgtt tccacggtcc gattatcggc 900 gcaggtgcat acacagtaga aaaagctgaa acgctgatcg gcaaagggtt aattgatgcg 960 gtggcatttg gtcgtgactg gattgcgaac ccggatctgg tcgcccgctt gcagcgcaaa 1020 gctgagctta acccacagcg tgccgaaagt ttctacggtg gcggcgcgga aggctatacc 1080 gattacccga cgttgtaa 1098 <210> 44 <211> 2019 <212> DNA <213> Escherichia coli DH10B <400> 44 atgagctacc cgtcgctgtt cgccccgctg gatttaggtt ttaccacgtt aaaaaaccgc 60 gtgttgatgg gctcaatgca caccgggctg gaggaatacc cggacggtgc cgagcggctg 120 gcagcgtttt atgccgaacg cgcccgtcac ggcgtggcgc tgattgtcag cggcggcatt 180 gcaccagatt taacaggcgt tggcatggaa ggtggcgcaa tgctcaacga cgccagccag 240 atcccacacc atcgcaccat taccgaagcg gtacatcagg aaggcggcaa aatagccctg 300 caaattttgc ataccgggcg ctacagctac caaccgcatc tggtcgcccc gtccgcattg 360 caggccccca tcaaccgttt cgtgccccat gagttaagcc atgaagagat cctgcaactg 420 atcgacaatt tcgcccgctg cgcgcaactg gcgcgggagg caggatacga cggtgtagag 480 gtgatgggtt ccgaagggta tttgatcaac gaatttctga cgctgcgcac caatcagcgt 540 agtgaccagt ggggcggcga ttaccgcaac cggatgcgat ttgccgtaga agtagtgcgt 600 gcggtgcgcg aacgcgtcgg caacgacttc attattatct accgactgtc gatgctcgac 660 ctggtcgaag acggcgggac ttttgccgaa acggtagagc tggcgcaggc cattgaagcg 720 gcgggcgcga ccattatcaa caccggcatt ggctggcatg aagcacgtat tccgaccatt 780 gccacgcccg tgccgcgcgg cgcatttagc tgggtcacgc gcaaactgaa aggccacgtc 840 tcgctgccgc tggtaaccac caaccggatt aacgatccgc aggttgccga cgatattctc 900 tcgcgcggcg atgccgatat ggtatcgatg gcgcgaccgt ttcttgctga tgcggagctg 960 ctgtcaaaag cgcaatcggg acgagccgat gagatcaaca cttgtattgg ctgcaatcag 1020 gcctgtctcg atcaaatctt cgttggcaaa gtcacctcgt gcctggtgaa tcctcgcgcc 1080 tgccacgaaa ccaaaatgcc aatccttccc gccgtgcaga aaaaaaatct ggcggtggtc 1140 ggtgcgggac ctgctgggct ggcgtttgcc attaacgcgg cggcgcgtgg gcatcaggta 1200 acattgtttg acgctcatag cgagattggc gggcagttta atatcgccaa acagatcccc 1260 ggcaaagagg agttttacga aacgctgcgc tattaccgcc ggatgatcga agtgacgggc 1320 gtgacgctaa aactcaatca caccgtgacg gcggatcagt tacaggcttt cgatgaaacg 1380 atcctcgcca gtgggatcgt gccgcgcact ccgcccatcg acgggatcga tcatccgaag 1440 gtattgagtt atctcgatgt actgcgcgac aaagcgccgg ttggcaacaa agttgccatc 1500 atcggttgtg gcgggattgg ttttgatacg gcgatgtatt taagtcagcc gggcgaatcc 1560 accagccaga atatcgccgg gttctgtaat gaatggggga tcgacagtag cctacaacag 1620 gctggtggct taagcccgca gggaatgcag atcccccgta gcccacggca gattgtgatg 1680 ctccagcgca aagccagcaa accaggacag gggttaggca aaaccaccgg ctggatccat 1740 cgcaccaccc tgctctcgcg gggtgtgaaa atgatcccag gcgtaagtta tcagaagatt 1800 gacgatgacg ggctgcatgt ggtgatcaac ggcgaaacgc aggtattagc agtggacaat 1860 gtggtgatct gcgcagggca agagccaaac cgcgcgctgg cgcaaccgct gattgatagc 1920 gggaaaacgg tgcatttaat tggcggctgc gatgtggcta tggagctgga cgcacgacgg 1980 gcaattgccc agggaacacg gctggcgctg gagatttaa 2019 <210> 45 <211> 1098 <212> DNA <213> Klebsiella pneumoniae MGH78578 <400> 45 atgtcggaag caaaattatt cagcccactg aaagtcggtg cggtcaccgt ccctaatcgc 60 gtatttatgg cgccgttgac gcgtctgcgc agcattgagc cgggcgatat ccctactccg 120 ctgatgggcg aatactaccg ccagcgcgcc agttccgggc tgatcatcac cgaagcgacg 180 cagatctccg cgcaggccaa aggctacgcc ggcgcgcctg ggctgcacag cccggagcag 240 attgccgcct ggcagaaaat taccgccggc gttcatgccg aaaacggtca tatcgccgtc 300 cagctgtggc acaccgggcg tatttcccat agcagcctgc agcctggcgg cgccgccccg 360 gtagcgcctt ccgcgctgag cgcgggcacc cgtacctcac tgcgtgacga aaacggccac 420 gccattcgcg tcgacacctc aatgccccgc gccctggaaa ccgcagagat cccagggatc 480 gtcaacgatt tccgtcaggc ggtcggcaat gcccgtgacg ccggcttcga tctggttgag 540 ctgcactcag cccacggcta tctgctgcac caattcctct cgccatcggc gaaccagcgt 600 accgatcagt acggcggcag cgtggagaac cgtgcccgtc tggtgctgga agtggttgac 660 gccgtgagtc aagagtggag cgccgagcgc attggcatcc gcgtgtcgcc gattggcagc 720 ttccagaatg tggataatgg cccgaacgaa gaagaagacg cgctgtatct gattagcgag 780 ctggcgaaac gcggtatcgc ctatctgcac atgtccgagc cggactgggc gggcggcaaa 840 ccttacagtg aagctttccg tcagaaagtc cgcgaccgct tcccgggggt gatcattggc 900 gctggcgctt acacagtaga aaaagccaac gatcttatca ataaagggct gattgatgcc 960 gtggcctttg gccgcgatta catcgccaac ccggatctgg tggctcgcct gcagaaaaaa 1020 gcgccgctta acccgcaacg cccggaatcc ttctacggcg gcggcgcgga aggctacacc 1080 gattacccga ctctgtaa 1098 <210> 46 <211> 2778 <212> DNA <213> Klebsiella pneumoniae MGH78578 <400> 46 atgaccagta acgaacgtat tttgcagcca tttactttac caaatggtac cgagctgaaa 60 aaccgtttgc tcatggcgcc aatgaccacc tgcaccggtt atttcgatgg tactgtcacc 120 agcgagctgg tggagtacta ccgcgcgcgc gccggaagca tcggtaccat tattgtcgag 180 tgctgcttta ttgatgacta cggtctggcc ttcccgggcg cgatcggcat tgataatgat 240 gaaaaaattg ccggcctggc gaaaatcgct gaggcgatca aagccgaggg ttcaaaagcg 300 attctgcaga tctaccacgg cggccgtatg gtcgacccgc agctgatcgg ggggcgccag 360 ccggtggcgc cgagcgctat tgccgcgccg cgtgagggcg ccgccatgcc gcgggcgctg 420 agcggagaag aagtggaagg gatgatcgcc aagtttggcg acggcgttcg tcgcgccatt 480 ctcgccggtt tcgacggggt cgaaattcac ggcgccaaca cctatctcat tcagcagttc 540 tattcgccga actccaacca gcgcgatgac gagtggggcg gtagccgcga caaccgcgcc 600 cgtttcccac tggcggtgct ggatattacc cacaaaatgg cccgccagta cgccgacgat 660 gcctttatca tcggctatcg cttctcgccg gaggagatgg aggtcccggg gatccgcttt 720 gacgacacca tgtatctgct ggaaaagctg gccgcccgcg gtgtcgatta tctgcacttc 780 tcggtgggtg ccaccctgcg tccgtctatc gtcgatacca gcgatgcgac gccgctgatc 840 gagaaatact gcgcgatgcg ctctgacacc ctcgcccagg tgccggtgat gggcgtcggc 900 ggggtggtga acgccgctga tgccgagcag ggcctcgatc atggttatga cctgatcgcc 960 gtgggccgcg cctgcatcgc ctatccggac tgggcgtcac gtatcgccgc cggcgaagag 1020 ctggagctgt ttatcgacag cacccagcgt gaagcgctgc acattccgga accgctatgg 1080 cgtttctcgc tggtggaagc gatgatccgc gacatgagca tgggcgacgc caaatttaaa 1140 ccggggatgt ttgttgagac cgtccacgat gacgccaatg agctggtgat caacgtcagc 1200 ctcgaaaatg accatattgc cgatatcgaa ctggcggcga gcccggtcca gactgtggaa 1260 ttcaccacca gcttcgaaga gatccgcgaa cgtattctca ccgccaatac cccgcacgtc 1320 gatgccattt ccggggccac cagccagagc gaggcggtga aaaaagcggt cgccaaagcg 1380 atgctgaaat cgagtaaagc gctggcggcg gaagagggcg gcaatgacgc cgcgccgaaa 1440 agctatgatg tggtggtagt cggcagcggc ggcgccggtc tggcggcagc cattcaggca 1500 cacgacgaag gggccagcgt gctgatcgtt gaaaaaatgc caaccatcgg cgggaacacc 1560 atcaaggctt ccgccgggat gaacgccgcg gaaacccgct tccagcgcgt gaaaggtatc 1620 gaagacagta aggagttgtt ctatcaggaa accctgaagg gcggccacaa caaaaacaac 1680 ccgcagctgc tgcgccgttt cgttgaaaac gcgccgcaag ccattgagtg gctggcggac 1740 cggggcatta tgctcaacga cattaccacc accggtggga tgagcattga ccgtacccac 1800 cgtccgcgcg acgggtcagc ggttggcggc tatctgatta gcggcctggt gcgcaacatc 1860 accaaacgcg gtattgacgt cctgctggat acctcggtgg aagagatcct gatgcgcggg 1920 gatgaggtta gcggtgtacg tctgatcaac gacgaaaaag aggtcattga agtacagacc 1980 aaaagcatcg tagtggccac cggcggcttc agcgctaaca gcgcgatggt cgtgaagtat 2040 cgtcctgacc ttgaaggctt cgtcaccact aaccacaaag gggctaccgg gagcggtatc 2100 gcgttgctgg aacgcatcgg cgccggcacc gtggacatgg gcgaaattca gattcacccg 2160 accgtcgagc agcagacctc gtatctgatt tccgaatcga ttcgcggcgg cggcgctatt 2220 ctcgtaaacc agcaggggaa ccgcttcttc aacgagatgg agacccgcga taaagtctcg 2280 gcggcgatta tcgctctgcc ggaacactat gcttgcatcg tcttcgacga gcatgtgcgg 2340 gcgaaaaaca aagctgccga cgagtacatc gccaaaggct tcgtcaccag cgccagctca 2400 ccgcgggaac tggcggagaa actggggatg gattaccatg ccttcctcgc caccctcgag 2460 tgctataacg gggcggtgga aaaacagcat gatgaacagt ttggccggac caccgcgcta 2520 cgcgcgccga ttaacgaagg cccgttccac gccattcgca tcgcccccgg cgtgcaccac 2580 accatgggcg gcgtgaccat taataccgat ggcgaagtgc tgaatgtggc gcagcagccg 2640 atttgcggcg cctacgccgc cggtgaagtg gtgggcggga tccacggcgg caaccgtatc 2700 ggcggtaacg cggtggcgga tatcatcatc ttcggtaccc tcgcgggcca tcaggcggcg 2760 aaacgtgcca gaggataa 2778 <210> 47 <211> 1050 <212> DNA <213> Pseudomonas fleurescens Pf-5 <400> 47 atgacgactc tctttgatcc gatcaaactc ggcgatctcg aactgtccaa ccgcatcatc 60 atggcgccgc tgacccgctg ccgcgccgat gccggccgcg tacccaacgc gctgatggcc 120 gaatactacg tacaacgggc ttccgccggc ctgatcctca gcgaggccac ctcggtgacc 180 cccatgggcg tgggctaccc ggacaccccc ggcatctggt ccaacgacca ggtgcgtggc 240 tgggccaatg tgaccaaggc agtacacggc gccggtggca agatattcct gcagctgtgg 300 cacgtcggac gcatctccca cccgtcctat ctgaacggcg aaaccccggt ggcacccagc 360 gccctgcagc ccaaggggca tgtcagcctg gtgcgcccgc tggccgactt cccaactccg 420 cgggccctgg aaaccgctga aatcgccgac atcgtcgatg cctaccgggt cggcgcggaa 480 aacgccaagg ccgccggttt cgacggcgtg gaaatccacg gcgccaacgg ctacctgctg 540 gaccagttcc tgcaaagcag caccaaccag cgtaccgacc agtacggcgg ctccctggaa 600 aaccgtgccc gcctgctgct ggaagtcacc gacgcggcca tcgagatctg gggtgccggc 660 cgggtaggcg tgcacctggc accacgtgcc gactcccatg acatgggtga tgccaacctg 720 gcggagacct tcacctacgt cgctcgggag ctgggcaaac gcggtatcgc ctttatctgc 780 tcccgcgaga aagaaggcgc cgacagcctg ggcccgcaac tcaaagaagc cttcggcggc 840 ccctacatcg ccaacgaacg cttcaccaag gacagcgcca acgcctggct ggccgctggc 900 aaggctgacg ccgtggcctt tggtgtgccc ttcatcgcca acccggacct gccagcccgc 960 ctgaaggccg atgcgccgtt gaacgaagcg cacccggaaa ccttctacgg caagggcccg 1020 gtcggctata tcgactaccc gactctgtaa 1050 <210> 48 <211> 1101 <212> DNA <213> Pseudomonas fleurescens Pf-5 <400> 48 atgaccgatc agaatctgtt caccccttac acccttggcg ccctcgcgct ggcgaaccgc 60 atcgtcctcg cgccactgac ccgcaaccgc gcgggcgcag gctttgttcc cagcgaattc 120 gccgccacct attacagcca acgcgctagc gcaggcttgc tgatcagcga agccacgcag 180 atttcccaac agggccaggg ctatcaggac acccccggga tctacaccca ggcgcagatt 240 gatggctggc gcacggtgac cgacgcggtc cacgcccagg gcgcaaagat ctttgtgcaa 300 ctgtggcatg tcggccgcgt gtcccacgtt gatctgcaag aaaacggcgc cgcccccgtg 360 gccccttccg cgctgcgtgc ggccaccaag gtgttcgtca acaaccgctt tgaagacgcc 420 agcgagcccc gcgcactgga catcagcgag ctgccgggga tcgtcgccga tttccgccag 480 gccgcggcaa acgctatcgc tgccgggttc gatggcgtgg aaattcacgg cgcgaacggc 540 tatttgctgg atcagttcct caaggacagc gccaacgtac gcaccgatgc ttacggcggc 600 tcgattgaaa atcgtgcgcg tctgttgctc gaagtcaccg ctgccgtggt caatgaaatc 660 ggcgcggatc gcaccggggt gcgcttgtcg ccggtgtcgc cggccaacgg tgtctccagc 720 agcaatccgc aggcgcaatt caattacgtc gtcgatcaac tcgacgccct cgacgtcgtt 780 tacctgcaca tggtcgaagg cgcgaccggt ggcccacgtg acgtggcgcc attggatttc 840 accgccctgc gccagcgttt caaaaacacc tacatcgcca acaacggcta tgacctggag 900 ctggcaacct cacggctcgc cgaagaccag gccgatctga tcgcgttcgg tcgcccgttc 960 atcggcaacc cggatctggt ggagcgtctc aagaccggcg ccgccttgtc cgcattcaat 1020 cccgccaccc tctacggcgg cggcgcggca ggctacatcg actacccgac gctggttgat 1080 tcgagcgcca gcgcaagctg a 1101 <210> 49 <211> 1104 <212> DNA <213> Pseudomonas fleurescens Pf-5 <400> 49 atgcctgttc aagccttgtt caaacccttt caactcggcg cgctggaact gccgactcgc 60 gtggtgatgg caccaatgac ccggtcgttt tcccccggtg gcgtgcccaa ctccaaggtc 120 atcgagtatt accgccgccg cgctgctgcg ggtgtcggcc tgatcattac cgagggcacc 180 acggtgggtc accaggctgc caatggttac cccaatgtgc cgcagttcca tggcgaggcg 240 gccctggccg gctggaagaa ggtggtggat gcggtccacg ccgaaggcgg caagatcgtc 300 ccgcaactct ggcatgtggg caatgtgcgg cgcctgggca ccgagccgga cgccagcgtg 360 cccggctacg gccccaccga gaagctcaag gacggcaagg tgctggtgca cggcatgacc 420 caccaggaca tccaggaggt gatcgcagcc tttgcccagg ccgccaagga tgcccagagc 480 atcggcatgg acggcgtgga gatccatggc gcccatggtt acctggtgga ccagttcttc 540 tgggaaggca ccaaccagcg taccgatgaa tacggtggcg acctggccca gcgctcgcgc 600 ttcgccattg agctgatcca ggccgtgcgg gctgccgtcg gtccggattt cccgatcatc 660 ctgcgttttt cccagtggaa gcagcaggac tacagcgcgc gcctggtgca gaccccggaa 720 gctctggagg ccttcctcaa gccgctggcg gatgccggtg tggatatctt ccactgctcg 780 acccgccgct tctgggagcc tgagttcgaa ggttccgacc tcaacctggc gggctggact 840 cgcaaactca ccggcaagcc caccatcacc gtgggcagcg tcggcctgga cggcgagttc 900 ctgcagttca tggtcaacac cgacaaggtg gcgcagccgg ccagcctgga aaacctgctg 960 cagcgtctga ataacgacga gttcgatctg gtggccgtgg gccgtgcact gctggtggat 1020 ccggattggg cgcagaaagt ccgtgaaggt cgcgagcagg acatcctgcc gttcagccgt 1080 gacgctctga cgaccctggt ttaa 1104 <210> 50 <211> 1050 <212> DNA <213> Pseudomonas putida <400> 50 atgaccacgc ttttcgatcc gatcaaactg ggcgacctgc aactgcccaa ccgtatcatc 60 atggccccgc tcacccgctg ccgtgccgat gaaggccgtg tgcccaatgc gctgatggcc 120 gaatactacg tacaacgtgc cagcgccggg ctgatcctca gcgaggccac ttcggtcagc 180 ccaatgggcg tcggctaccc agataccccc ggcatctgga acgatgaaca ggtacgtggc 240 tggaacaatg tgacaaaggc cgtacatgcc gcgggcggtc gcatcttcct gcagctgtgg 300 cacgtgggtc gtatctccca ccccagctat ctgaatggcg aactgcctgt ggcccccagc 360 gcgatccagc ccaagggcca tgtgagcctg gtgcgcccgc tgagtgacta ccctaccccg 420 cgggcgctgg aaaccgaaga aatcaacgac atcgtcgagg cctaccgcag tggtgccgaa 480 aatgccaagg ctgccggttt cgatggtgtg gagatccatg gcgccaacgg ttacctgctc 540 gaccaattcc tgcaaagcag caccaaccag cgcaccgacc gttacggtgg ctcgctggaa 600 aaccgcgcgc gcctgctgct ggaggtgacc gatgcggcca ttgaagtgtg gggcgcgcag 660 cgtgtaggtg tgcacctggc accgcgagcc gacgcccatg acatgggcga cgccgaccgc 720 gccgagacct tcacctatgt ggcccgagcg ctgggcaagc gcggcatcgc cttcatctgc 780 tcgcgggagc gggaagccga cgacagcatc gggccgctga tcaaagaggc attcggtggc 840 ccgtacatcg tcaacgagcg gttcgacaag gccagtgcca atgcggccct ggccagtggc 900 aaagcggatg ccgtggcgtt tggtgtgccg ttcatcgcca accctgacct gccggcacgg 960 ctggcagcgg atgcgccgtt gaatgaggcg cggcctgaga ctttctatgg caaggggccg 1020 gtggggtaca tcgattaccc gcggttgtaa 1050 <210> 51 <211> 747 <212> DNA <213> Thermotoga maritima <400> 51 atgatagagt acaggattga ggaggcagta gcgaagtaca gagagttcta cgaattcaag 60 cccgtcagag aaagcgcagg tattgaagat gtgaaaagtg ctatagagca cacgaatctg 120 aaaccgtttg ccacaccaga cgatataaaa aaactctgtc ttgaagcaag ggaaaatcgt 180 ttccatggag tctgtgtgaa tccgtgttat gtgaaactgg ctcgtgaaga actcgaagga 240 accgatgtga aagtcgtcac cgttgttggt tttccactgg gagcgaacga aactcggacg 300 aaagcccatg aggcgatttt cgctgttgag agtggagccg atgagatcga tatggtcatc 360 aacgttggca tgctcaaggc aaaggagtgg gagtacgttt acgaggatat aagaagtgtt 420 gtcgaatcgg tgaaaggaaa agttgtgaag gtgatcatcg aaacgtgcta tctggatacg 480 gaagagaaga tagcggcgtg tgtcatttcc aaacttgctg gagctcattt cgtgaagact 540 tccacgggat ttggaacagg aggggcgacc gcagaagacg ttcatctcat gaaatggatc 600 gtgggagatg agatgggtgt aaaagcttcc ggagggatca gaaccttcga ggacgctgtt 660 aaaatgatca tgtacggtgc tgatagaata ggaacgagtt cgggagttaa gatcgttcag 720 gggggagaag agagatatgg aggttaa 747 <210> 52 <211> 837 <212> DNA <213> Thermotoga maritima <400> 52 atggtttaca caactccatg gaacagaaag atcgagtttg gaagaacgat ggttatggga 60 ataataaacg tcacaccgga ctccttcttc gctgattcca gaaaacagag cgtactcgaa 120 gcggtggaaa ccgcaaagaa gatgatagaa gaaggtgctg acataataga cgtgggagga 180 atgtccaccc gtcccggatc agatcccgtc gatgaggaag aagaattgaa cagagtgatt 240 cccgtgataa gagcgatcag atcgataacc gacgttccga tttccgtaga tacatacagg 300 tggagggtgg ctttgaaagc tcttgaagcc ggagcggata tcgtaaacga tatcagcggt 360 tatcaattcg aaccggatat cgtcagagta gtttctgaaa acaacgtccc ttacgttctc 420 atgcacataa aaggaacgcc aaagacgatg caggaaaatc ctcattacga agatgtggtg 480 aaggagataa aagagtactt cacagaaaaa atagagtatc taaaagaaaa aggtgtgaac 540 cagatcgttc tggacccggg tatcgggttt ggaaaaagat acgaagacaa cctcgaaatt 600 cttcgaagga tcgacgaatt caaagagtta aaactgccca tcctcatagg tgcttcaaga 660 aaatctttca taggaatcac cttgggaaac gtgccccccg aagaaagact tgaaggtact 720 cttgcggtca ccgcgtactg cacgatgaaa ggagtagata taattcgggt acacgatgtc 780 ctccctaaca agagggtgat aagaatgatg gaggcgatac tctggcaaag gttgtaa 837 <210> 53 <211> 618 <212> DNA <213> Thermotogo maritima <400> 53 atgaagatgg aagagctctt caaaaaacac aagattgtag ccgtgctgag ggcaaacagt 60 gtggaagaag cgaaagaaaa ggcgttggct gtttttgaag gaggagttca cctcatcgaa 120 atcaccttca ctgttccaga cgctgacaca gtcatcaaag aactctcgtt cctcaaggaa 180 aaaggtgcca taataggtgc aggtacagtg acgagtgtcg aacagtgcag aaaagctgta 240 gaaagtggag cagagttcat cgtcagtcca caccttgacg aggaaatctc tcaattctgc 300 aaagaaaaag gtgtcttcta catgcccggt gtgatgacac ccaccgaact tgtaaaagcc 360 atgaaactcg gtcacacgat tttgaaactc ttccctggag aagtggtggg acctcagttt 420 gtaaaagcga tgaaaggacc gttccccaat gtgaaattcg tgcccactgg aggcgtgaat 480 ctggacaacg tgtgtgagtg gttcaaagcc ggagtcctcg ctgttggtgt tggaagtgcg 540 cttgtgaaag gaacaccaga cgaggtgaga gaaaaagcaa aagcgttcgt agaaaagatc 600 agggggtgca cagaataa 618 <210> 54 <211> 948 <212> DNA <213> Thermotoga maritima <400> 54 atgacaatgc cttatgtaaa gaacacgaaa gaaattctgg aaaaagccag caaagagaga 60 tacgctatcg gtgcattcaa tttcaacaac atggaatttc tccaggcaat tcttgaagcc 120 gctgaggaag aaaaagcacc ggtcatcgtc gctacatcgg aaggagcgat aaagtacata 180 ggaaagggcg atatagaaac aggagcaaaa cttgccgttg aaatggtgag aacttacgct 240 gaaaaacttt cagttcccgt cgcactccac ctggaccacg gaagagactt taaagttatc 300 atggctgcca taaaagcggg ttactcttca gtgatgatcg acgcttcgca tcttcccttc 360 gaggaaaacc tcagagagac gaagaggatc gtggagatag ctcacgcggt tggtataagt 420 gtagaagcgg aactcggaaa actcaaggga atagaggaca atgtggtgga aaaagagtcc 480 gtgctcgtcg atccggaaga agcaaaggta tttgtgaagg aaacagaagt ggatttcctg 540 gctccagcca ttggaaccag ccacggtgcg ttcaagttca aaggggaagc acagctcgac 600 tttgaacgac tgaagaaagt gaaagaatac acccagatac cgctcgttct tcacggagct 660 tccatggtac cgcaggatat tgtgaaactg gcgaacgaat acggtgccga gctttccggt 720 gcgaaaggcg ttccggaaga catgctgaag aaagctatag aacttggtat caacaagata 780 aacacagaca ccgatctgag aatcaccttc gtcgcgtatc tcaggaaggt tctctcagaa 840 gacaagtctc agatagatcc cagaaaaatt ttcaaacctg tcttcgaaca ggtgaaagaa 900 atcgtcaagg agagaatcag aatattcgga tccagcggaa aggcgtaa 948 <210> 55 <211> 765 <212> DNA <213> Thermotoga maritima <400> 55 atgaggagta cagacaggtt actgtttata gattttctgt tgaagtttga aaacaaaaac 60 ggaactgtga taccttgttg tgtggataat tttgactgta cgtttaccca taaaggaggt 120 aaaagcatgt acgaaaaaga aaggaaagag ctatacaatg cccatcttct gttggaaaaa 180 tacggtcttg tcgcttacac aagcggtaac gtgagtgtga gaatcggtga tcatgttctg 240 ataaagccct ccggtgttcc atacaccgag ctgaaaccag aggacttcgt cgtggtggac 300 cttgaaggaa acgtgatcga gggagagaag aaaccctccg tcgatacagc tacacatctg 360 tatctctaca aacacctcga ctgggcaaaa tccgtgattc acactcattc aacattcgcc 420 atggtgtggg caattctcga aaaatcaatc cccgttcttt gcacggcaca tgcggatgtt 480 ttcggagagg agattcctct tacagaatac gctcctgtag gatccgaggc gattggaaaa 540 gctgtcgtga aagtgattgg aaaatccggt gctgttcttc tcagaaaaca cggtgttatg 600 atcgtgggga cctctgtgga cgatgcagtg aaaaaggcga ttttccttga ggaggtagca 660 aaggcagcgt actttgcgac acttgcagga aaacccacac cattgccacc tgacgaggtg 720 gatcatctct acaatcagta ccacaccaag tacggtcaga agtaa 765 <210> 56 <211> 657 <212> DNA <213> Thermotoga maritima <400> 56 atgaagatct ttctggacac agcaaactta gaagagatca aaaaaggtgt tgaatggggt 60 atcgtggatg gagtaacgac gaatccaaca ctgatttcaa aggaaggagc agagttcaaa 120 cagagagtga aagagatctg cgatctggtg aaaggtcccg tttctgcgga ggttgtgtct 180 ctcgactacg aaggcatggt gagagaggcg agagaactcg ctcagatcag cgaatacgtg 240 gtgatcaaga taccaatgac acccgatggc atcaaagcgg tgaagactct ctctgcagag 300 ggtataaaga caaacgtgac actcgtgttc agcccagccc aggccattct ggccgcgaaa 360 gcgggagcaa cctacgtgag ccccttcgtt ggaaggatgg acgatctttc aaacgacgga 420 atgagaatgc ttggagaaat cgtcgagatc tacaacaact acggtttcga aaccgagatc 480 atcgccgcaa gcatcagaca tccaatgcac gtggtggaag cagcacttat gggtgtggat 540 atcgtgacga tgccatttgc cgtgctggag aaactcttca aacacccgat gacggatctt 600 ggaatagaaa ggttcatgga agactggaaa aagtatttgg agaacctgaa gaaataa 657 <210> 57 <211> 1017 <212> DNA <213> Thermotoga maritima <400> 57 atgatagtcg ttttgaaacc cggttccaca gaagaagata taaggaaggt ggtgaagttg 60 gccgagagtt acaacttgaa gtgtcacatt tccaaaggtc aggaaagaac ggttattggg 120 atcatcgggg acgacaggta cgtggtggcg gacaagttcg agtcgctgga ttgcgtggaa 180 agcgttgtga gggtgctcaa accttacaaa ctcgtttctc gtgagttcca tccggaggac 240 acggtgatcg acctcggaga tgtgaagata ggaaacggct acttcaccat catagcggga 300 ccgtgctcag ttgaaggcag ggaaatgctc atggaaaccg cacacttttt aagcgaactc 360 ggtgttaaag ttttgagggg aggggcctac aagcctcgaa catctcctta ctctttccaa 420 ggactcggag aaaaggggct ggaatacctg agagaggctg ccgacaagta cggtatgtac 480 gtggtgacgg aggctctcgg agaagacgat cttccaaaag tggccgagta cgctgatatc 540 attcagatag gagcgagaaa cgctcagaac ttcagattgc tctctaaagc gggaagctac 600 aacaaacccg ttcttctgaa aaggggtttc atgaacacca tcgaagagtt ccttctctcc 660 gctgaataca ttgcaaactc tggaaacacg aagatcatac tgtgtgaaag gggaatcaga 720 acgttcgaaa aggccacgag gaacacactc gatatatccg ctgttcctat aatcagaaag 780 gaatcccatc ttcccattct ggtggatccg agccactctg ggggaagaag agacctcgtt 840 attccactct cccgggccgc tatagcggtt ggagctcatg gaatcattgt ggaggttcat 900 ccggagccgg agaaggcact ttcggatgga aaacagagtc ttgacttcga gctcttcaag 960 gaactggttc aggaaatgaa gaaactcgct gatgccctgg gggtgaaggt gaattaa 1017 <210> 58 <211> 1284 <212> DNA <213> Thermotoga maritima <400> 58 atgtggaagc atgtaaaaca ggttgatccc gaaatatacg aagttcttgt gaacgagttg 60 aagcgtcagg agtacggcct ggagctgatc gcctctgaga acttcgcgtc actcgctgtc 120 atagaaacca tgggaagcat gctcaccaac aagtatgcgg aaggataccc gaagaagaga 180 tactacggtg gctgcgagtg ggtggatcga gcagaagaac gtgctataga gagagcgaag 240 aggttgtttg gagccaaatt tgcgaacgtt cagccgcact ccggttctca ggcgaacatg 300 gcggtttatc tggcactcgc ccagcccgga gacacgatca tgggaatgtc cctgtcacac 360 gggggacatc tcacccatgg agcaccggtg aatttctcag ggaagatctt caaggtggta 420 ccttacggag tcaatctgga aacggaaacg atagattacg atgaggtcag aagactcgct 480 ctggaacaca agccgaagat aatcgttgcg ggtggaagtg cttacgccag gatcatcgat 540 ttcaaaagat tcagagagat agccgatgag gtgggagcat atttgatggt ggatatggct 600 cactttgccg gactcgtcgc tgctggaatt catccaaatc ccttggaata cgcccacgtg 660 gtgacttcca ccacacacaa gactctcagg ggccccagag gtggtttgat actcacgaac 720 gatccggaga tcgccaaagc cgtggataaa actatcttcc ccggtatcca gggtggtcct 780 ctcatgcacg tcatagcggc gaaagctgtc tgtttcaaag aagccatgac ggaggagttc 840 aaagagtacc agaagcaggt ggtcaaaaat gctaaaaaga tggctgaaga gttccagaaa 900 cgaggttaca ggatcgtttc tggaggaact gatacacacc tgttcctggt ggatctcaca 960 ccaaaagaca taacgggtaa agcggcggaa aaggccctgg aaagctgtgg tatcacagtg 1020 aacaaaaaca ccattcccaa cgaaaagaga tctccgttcg tggcgagcgg tatcagaata 1080 ggaacacccg ctgttacaac ccgcggaatg aaggaagaag agatggaaga gatcgccgag 1140 atgatagatc tggttctttc gaacgtgatc gatgaaaacg gaacggtgaa accagaggtg 1200 agggaagagg tttcaaagaa ggtaagggag ctctgcgaaa ggtttcctct gtaccgtgac 1260 aagatcgaag gggtggaaat ataa 1284 <210> 59 <211> 711 <212> DNA <213> Thermotoga maritima <400> 59 atgagagaga cgataagaga gattcaaaaa gtagcttact ggcttgccat aaagggcctt 60 tccgaggcga acgcagggaa catctctgtc agactggatg aaagaccaga aggatacgag 120 gtcaagagtg tgaacgaata cgggttcgat tacgacggtc ccgagatgta ccttctgatc 180 acggcaacgg gctcgagaat gagagaagtc tacgaagacg acagcaagat ctgtcttctt 240 cacgtccttc cggggaaaca ctacgaaatt ctccacggaa acggaaaacc caccagtgag 300 tttcccacac acctcatgat ccacgcaaaa ttcaaggaga tgaatccgga aaagaaagcc 360 atcgttcaca ctcatcctct gaacctgctc actctgatga acttagagga attccaggag 420 cttcttccga agatgatgaa gattcatccg gaagttttga tctttttccc acagggaatc 480 tccgtcgtcg agttcgaaaa gccaggcagt gtggaactcg gcctgaagac ggtggagaag 540 tcagaaggga aagatgcagt tctctgggac aagcacggtg ttgtggcttt cggaaaagat 600 gtcgcagaag cgtacgacag ggtcgagatc ctggaaaaag cggcggagat ccttttgaga 660 gtgctcagcc tcggaagaaa tcccacgggt gttccggagg gatggctgta a 711 <210> 60 <211> 1149 <212> DNA <213> Thermotoga maritima <400> 60 atggtcaagg tcctgatcct cggtcagggc tacgttgcca gtacattcgt tgccggactt 60 gaaaagctca ggaaagggga aatagaacct tacggagtgc cccttgcaag ggaacttccc 120 atcggcttcg aagacatcaa gattgttgga agctacgacg tggacagagc gaagattgga 180 aagaaactga gcgaagtggt gaagcagtac tggaacgatg ttgactcgct gacgagtgat 240 cctgagattc gcaaaggagt acaccttgga agcgtgagga acctccccat cgaagctgaa 300 ggtctcgaag acagcatgac tctgaaggaa gcagttgata ctctcgtcaa ggaatggaca 360 gaactcgatc ccgatgtgat cgtgaacacc tgtactacag aagctttcgt gcccttcggg 420 aacaaagaag atcttctgaa agctatcgaa aacaacgaca aagagagact cactgcaact 480 caggtgtacg cttacgcagc ggcactgtac gcgaacaagc gtggaggagc ggcttttgtg 540 aacgttattc cgaccttcat agcgaacgac ccggctttcg ttgaactcgc gaaggagaac 600 aacctcgtcg ttttcggaga cgacggtgct accggtgcca caccgttcac agcggacgtt 660 ctcagccatc ttgcccagag aaacaggtac gtcaaagatg ttgcgcagtt caacatagga 720 gggaacatgg actttctggc actcacagac gatggaaaga acaagagtaa agaattcacc 780 aaatccagta tagtgaagga cattctcggt tacgatgcac cgcattacat aaaacctaca 840 gggtatcttg aaccacttgg agataaaaag ttcatagcca ttcacatcga gtacgtgagt 900 ttcaacggtg ctacagatga gctcatgata aacggaagaa taaacgacag cccggctctt 960 ggaggtctcc ttgttgacct tgtgagactc ggaaagatcg cactcgacag gaaggagttc 1020 ggaacggtct acccagtgaa cgccttctac atgaagaacc cgggaccggc ggaagaaaag 1080 aacatcccaa gaatcattgc ttacgagaag atgagaatct gggcgggatt gaaaccgaag 1140 tggctgtaa 1149 <210> 61 <211> 885 <212> DNA <213> Thermotoga maritima <400> 61 atgttcagag gagtaggaac tgctatcgtt acaccattca aaaatggtga gcttgatctt 60 gagtcttacg agaggcttgt caggtatcag ctcgaaaacg gcgtcaacgc gttgatcgtc 120 cttggaacga caggtgaatc accaaccgtc aacgaagacg agagagaaaa gctcgtttcc 180 agaactctcg agatcgtcga tgggaaaatc cctgtgatcg tgggagcggg aacgaattcc 240 accgaaaaaa cgctgaaact cgtcaagcag gcggaaaaac tcggagcgaa cggagttctt 300 gtggtcaccc cgtattacaa caagcccaca caggaaggac tctatcagca ctacaagtac 360 atctctgaga gaacggatct cgggatcgtt gtttacaacg tgcccggaag aaccggtgtg 420 aacgttctcc cggaaactgc tgcaaggatc gctgcggacc tcaagaacgt ggtgggaata 480 aaagaggcga acccggatat agaccagata gacaggacgg tatcactgac aaaacaggca 540 agaagcgatt tcatggtgtg gtccggcaac gatgatagaa cgttctatct cctctgcgcg 600 ggtggagacg gcgtcatctc tgttgtgtcg aacgtggcac cgaaacagat ggtagaactc 660 tgcgcagagt acttcagcgg aaacctcgaa aaatcgaggg aggttcacag aaaactcaga 720 cctctcatga aggcactgtt cgtggaaaca aatccgatac cagttaaagc cgctttgaat 780 ctcatgggat tcatcgagaa cgagctgaga ctaccgcttg tacctgccag tgaaaagacg 840 gtggaacttc tcagaaacgt tctcaaggag agtggattgc tataa 885 <210> 62 <211> 1032 <212> DNA <213> Thermotoga maritima <400> 62 atgatcgatc tcaggtccga caccgttaca aaaccaacag aagagatgag aaaagccatg 60 gcacaggctg aggtgggaga cgatgtgtac ggagaagatc caaccatcaa cgaactcgaa 120 aggctcgccg cagagacctt tggaaaggaa gcggctctct ttgtaccctc cggcaccatg 180 ggaaatcaag tgagcataat ggctcacacc cagaggggcg atgaagtgat actggaggca 240 gacagccaca tcttctggta cgaggtcgga gccatggcgg ttctctccgg agtcatgccc 300 catcctgtac ctggaaaaaa tggagccatg gaccccgatg atgtgaggaa ggccataaga 360 cccagaaaca tacacttccc cagaacttcg ctcattgcca tcgaaaacac acacaaccgt 420 tccggtggaa gagtggtccc gcttgaaaac ataaaagaga tttgcacgat agccaaagaa 480 cacggcataa acgttcacat agatggtgcg aggatcttca acgcctcaat cgcttcaggt 540 gttcccgtga aggagtacgc cgggtacgcc gattccgtga tgttctgtct ttcaaaaggt 600 ctctgcgcac ccgtcggttc ggtggttgta ggagacaggg acttcataga aagagcgaga 660 aaggcgagaa agatgctcgg tggagggatg agacaggcag gtgttctcgc tgccgctgga 720 ataatcgcct tgacaaagat ggtagatcga ttgaaagaag atcatgaaaa cgccagattt 780 ctcgccctga agttgaaaga aatagggtac tccgtgaatc ccgaagatgt gaaaaccaac 840 atggtgattc tgaggaccga caacctgaag gtgaacgcgc acgggttcat agaagcgctc 900 agaaacagcg gggtgctcgc gaacgccgta tccgacacgg agatcagact ggtaacccac 960 aaagacgttt caagaaacga catagaagag gctctgaaca tcttcgaaaa actcttcaga 1020 aaattctcct aa 1032 <210> 63 <211> 954 <212> DNA <213> Escherichia coli DH10B <400> 63 atgacggaca aattgacctc ccttcgtcag tacaccaccg tagtggccga cactggggac 60 atcgcggcaa tgaagctgta tcaaccgcag gatgccacaa ccaacccttc tctcattctt 120 aacgcagcgc agattccgga ataccgtaag ttgattgatg atgctgtcgc ctgggcgaaa 180 cagcagagca acgatcgcgc gcagcagatc gtggacgcga ccgacaaact ggcagtaaat 240 attggtctgg aaatcctgaa actggttccg ggccgtatct caactgaagt tgatgcgcgt 300 ctttcctatg acaccgaagc gtcaattgcg aaagcaaaac gcctgatcaa actctacaac 360 gatgctggta ttagcaacga tcgtattctg atcaaactgg cttctacctg gcagggtatc 420 cgtgctgcag aacagctgga aaaagaaggc atcaactgta acctgaccct gctgttctcc 480 ttcgctcagg ctcgtgcttg tgcggaagcg ggcgtgttcc tgatctcgcc gtttgttggc 540 cgtattcttg actggtacaa agcgaatacc gataagaaag agtacgctcc ggcagaagat 600 ccgggcgtgg tttctgtatc tgaaatctac cagtactaca aagagcacgg ttatgaaacc 660 gtggttatgg gcgcaagctt ccgtaacatc ggcgaaattc tggaactggc aggctgcgac 720 cgtctgacca tcgcaccggc actgctgaaa gagctggcgg agagcgaagg ggctatcgaa 780 cgtaaactgt cttacaccgg cgaagtgaaa gcgcgtccgg cgcgtatcac tgagtccgag 840 ttcctgtggc agcacaacca ggatccaatg gcagtagata aactggcgga aggtatccgt 900 aagtttgcta ttgaccagga aaaactggaa aaaatgatcg gcgatctgct gtaa 954 <210> 64 <211> 663 <212> DNA <213> Escherichia coli DH10B <400> 64 atggaactgt atctggatac ttcagacgtt gttgcggtga aggcgctgtc acgtattttt 60 ccgctggcgg gtgtgaccac taacccaagc attatcgccg cgggtaaaaa accgctggat 120 gttgtgcttc cgcaacttca tgaagcgatg ggcggtcagg ggcgtctgtt tgcccaggta 180 atggctacca ctgccgaagg gatggttaat gacgcgctta agctgcgttc tattattgcg 240 gatatcgtgg tgaaagttcc ggtgaccgcc gaggggctgg cagctattaa gatgttaaaa 300 gcggaaggga ttccgacgct gggaaccgcg gtatatggcg cagcacaagg gctgctgtcg 360 gcgctggcag gtgcggaata tgttgcgcct tacgttaatc gtattgatgc tcagggcggt 420 agcggcattc agactgtgac cgacttacac cagttattga aaatgcatgc gccgcaggcg 480 aaagtgctgg cagcgagttt caaaaccccg cgtcaggcgc tggactgctt actggcagga 540 tgtgaatcaa ttactctgcc actggatgtg gcacaacaga tgattagcta tccggcggtt 600 gatgccgctg tggcgaagtt tgagcaggac tggcagggag cgtttggcag aacgtcgatt 660 taa 663 <210> 65 <211> 1002 <212> DNA <213> Escherichia coli DH10B <400> 65 atgattgatt tacgcagtga taccgttacc cgaccaagcc gcgccatgct cgaagcgatg 60 atggccgccc cggttgggga cgacgtttac ggagacgacc ctaccgttaa tgctctgcag 120 gactacgcag cagagctttc cggtaaagaa gccgccattt ttctgcctac cggcactcag 180 gccaacctgg tcgctctgct cagtcactgc gaacgcggcg aagagtatat tgtcggtcag 240 gccgcgcata actatctgtt tgaagccggt ggcgcggcgg tgctgggcag tattcaaccg 300 caacccatag acgcggctgc cgacggcacg ctaccgctgg ataaagtggc gatgaaaatc 360 aaacccgacg atatccattt cgcccgcacc aaattactca gtctggaaaa cacccacaac 420 ggcaaagtgt tgccgcggga atacctgaaa gaagcatggg aatttacccg cgagcgcaat 480 ctggcgctgc atgttgacgg tgcgcgcatc tttaatgccg tggtggctta cggctgcgaa 540 ctgaaagaga tcacgcaata ttgtgattcg ttcaccattt gcctgtcgaa aggtcttggg 600 acgccagtcg gttcattact cgtcggtaat cgtgattaca ttaaacgtgc cattcgctgg 660 cggaaaatga caggtggcgg gatgcgccag tccggcattc tggctgccgc cgggatatat 720 gccctgaaaa ataacgttgc gcgcttgcag gaagaccacg acaacgctgc ctggatggcg 780 gagcagctgc gtgaagcagg cgcggatgtg atgcgtcagg acaccaatat gctgtttgtt 840 cgcgtcgggg aagaaaatgc tgccgcgtta ggcgaataca tgaaagcgag aaacgtgctg 900 attaacgcct cgccgattgt ccgcctggtg acgcatcttg acgtctcgcg cgaacaactg 960 gcggaagtcg ccgcccactg gcgtgcattc ctggcgcgtt aa 1002 <210> 66 <211> 876 <212> DNA <213> Escherichia coli DH10B <400> 66 atggcagatt tagacgatat taaagatggt aaagattttc gtaccgatca accgcaaaaa 60 aatatccctt ttaccctgaa aggttgcggt gcgctggatt ggggaatgca gtcacgctta 120 tcgcggatat ttaatccgaa aacgggtaaa accgtgatgc tggcttttga ccatggttat 180 tttcagggac cgactaccgg acttgaacgc attgatataa atatcgcccc gctgtttgaa 240 catgccgatg tattaatgtg tacgcgcggc attttgcgca gcgtagttcc ccctgcgacc 300 aataggccgg tggtactgcg ggcgtcaggt gcgaactcta ttctggcgga attaagtaat 360 gaagccgtgg cgttatcgat ggatgacgcc gtgcgcctga acagttgcgc ggtggcggcg 420 caggtttata tcggcagcga atatgaacat cagtcgatca aaaatattat tcagctggtt 480 gatgccggaa tgaaagtggg aatgccgacc atggccgtga ctggcgtggg caaagatatg 540 gtgcgcgatc agcgttattt ctcgctcgcg actcgaatcg ccgctgaaat gggggcgcaa 600 attatcaaaa cctattatgt cgaaaaaggt tttgaacgga ttgttgccgg atgtccggta 660 cccattgtta ttgctggcgg taaaaaatta ccggagcgcg aggcgctgga aatgtgctgg 720 caggctatcg atcagggcgc ttctggtgtg gatatggggc gtaatatttt ccagtctgac 780 catccggtgg cgatgatgaa agccgtacag gcggtggttc accataacga aacggctgat 840 cgggcatatg aactctatct gagtgaaaaa cagtaa 876 <210> 67 <211> 642 <212> DNA <213> Escherichia coli DH10B <400> 67 atgaaaaact ggaaaacaag tgcagaatca atcctgacca ccggcccggt tgtaccggtt 60 atcgtggtaa aaaaactgga acacgcggtg ccgatggcaa aagcgttggt tgctggtggg 120 gtgcgcgttc tggaagtgac tctgcgtacc gagtgtgcag ttgacgctat ccgtgctatc 180 gccaaagaag tgcctgaagc gattgtgggt gccggtacgg tgctgaatcc acagcagctg 240 gcagaagtca ctgaagcggg tgcacagttc gcaattagcc cgggtctgac cgagccgctg 300 ctgaaagctg ctaccgaagg gactattcct ctgattccgg ggatcagcac tgtttccgaa 360 ctgatgctgg gtatggacta cggtttgaaa gagttcaaat tcttcccggc tgaagctaac 420 ggcggcgtga aagccctgca ggcgatcgcg ggtccgttct cccaggtccg tttctgcccg 480 acgggtggta tttctccggc taactaccgt gactacctgg cgctgaaaag cgtgctgtgc 540 atcggtggtt cctggctggt tccggcagat gcgctggaag cgggcgatta cgaccgcatt 600 actaagctgg cgcgtgaagc tgtagaaggc gctaagctgt aa 642 <210> 68 <211> 855 <212> DNA <213> Escherichia coli DH10B <400> 68 atgtacgtgg tatcgacaaa gcagatgctg aacaacgcac agcgcggcgg ttatgcggtt 60 ccggcattca atattcacaa tctcgaaacg atgcaagtgg tggtagaaac cgctgccaac 120 ctgcatgcgc cggtcatcat cgccggaacg cctggcacat ttactcatgc tggtacagaa 180 aatctgttgg cgctggtcag cgcgatggcg aagcaatatc accatccact ggcaattcat 240 ctcgaccatc acacgaaatt tgacgatatc gctcagaagg ttcgttctgg cgtgcgctca 300 gtcatgattg acgcctcgca tttgcctttt gcgcaaaata tttcacgggt caaagaggtg 360 gtggattttt gccatcgctt tgatgtcagc gtcgaggcgg agctggggca acttggcggc 420 caggaagatg atgtgcaagt caatgaagcc gatgcgttgt acaccaaccc cgctcaggcg 480 cgtgaatttg ccgaggcaac cggaattgat tccctggcgg tcgccatcgg cacggctcat 540 gggatgtatg ccagcgcacc ggcgcttgat ttttctagac tggagaacat tcgccagtgg 600 gtgaacttac cgctggtgct gcatggcgcg tcagggttat cgactaagga tattcagcaa 660 accatcaaac tggggatatg caaaatcaac gttgcaacgg agctgaaaaa tgccttctcg 720 caggcgttaa aaaattacct gaccgagcac cctgaagcga ccgatccccg ggattatttg 780 cagtcggcta aatccgcaat gcgcgatgtg gtgagcaaag tgattgccga ttgtggctgc 840 gagggcaggg cataa 855 <210> 69 <211> 1053 <212> DNA <213> Escherichia coli DH10B <400> 69 atgacagata ttgcgcagtt gcttggcaaa gacgccgaca accttttaca gcaccgttgt 60 atgacaattc cttctgacca gctttatctc cccggacatg actacgtaga ccgcgtaatg 120 attgacaata atcgcccgcc agcggtgtta cgtaatatgc agacgttgta caacaccggg 180 cgtctggctg gcacaggata tctttctatt ctgccggttg accagggcgt tgagcactct 240 gccggagctt catttgctgc taacccgctc tactttgacc cgaaaaacat tgttgaactg 300 gcgatcgaag cgggctgtaa ctgtgtggcg tcaacttacg gcgtgctggc gtcggtatcg 360 cggcgttatg cgcatcgcat tccattcctc gtcaaactta atcacaacga gacgctaagt 420 tacccgaata cctacgatca aacgctgtat gccagcgtgg agcaggcgtt caacatgggc 480 gcggttgcgg ttggtgcgac tatctatttt ggctcggaag agtcacgtcg ccagattgaa 540 gaaatttctg cggcttttga acgtgcgcac gagctgggta tggtgacagt gctgtgggcc 600 tatttgcgta actccgcctt taagaaagat ggcgttgatt accatgtttc cgccgacctg 660 accggtcagg caaaccatct ggcggcaacc atcggtgcag atatcgtcaa acaaaaaatg 720 gcggaaaata acggcggcta taaagcaatt aattacggtt acaccgacga tcgtgtttac 780 agcaaattga ccagcgaaaa cccgattgat ctggtgcgtt atcagttagc taactgctat 840 atgggtcggg ctgggttgat aaactccggc ggtgctgcgg gcggtgaaac tgacctcagc 900 gatgcagtgc gtactgcggt tatcaacaaa cgcgcaggcg gaatggggct gattcttgga 960 cgtaaagcgt tcaagaaatc gatggctgac ggcgtgaaac tgattaacgc cgtgcaggac 1020 gtttatctcg atagcaaaat tactatcgcc tga 1053 <210> 70 <211> 804 <212> DNA <213> Escherichia coli DH10B <400> 70 atgaacgcat tattaagcaa tccctttaaa gaacgtttac gcaagggcga agtgcaaatt 60 ggtctgtggt taagctcaac gactgcctat atggcagaaa ttgccgccac ttctggttat 120 gactggttgc tgattgacgg ggagcacgcg ccaaacacca ttcaggatct ttatcatcag 180 ctacaggcgg tagcgcccta tgccagccaa cccgtgatcc gtccggtgga aggcagtaaa 240 ccgctgatta aacaagtcct ggatattggc gcgcaaactc tactgatccc gatggtcgat 300 actgccgaac aggcacgtca ggtggtgtct gccacgcgct atcctcccta cggtgagcgt 360 ggtgtcgggg ccagtgtggc acgggctgcg cgctggggac gcattgagaa ttacatggcg 420 caagttaacg attcgctttg tctgttggtg caggtggaaa gtaaaacggc actggataac 480 ctggacgaaa tcctcgacgt cgaagggatt gatggcgtgt ttattggacc tgcggatctt 540 tctgcgtcgt tgggctaccc ggataacgcc gggcacccgg aagtgcagcg aattattgaa 600 accagtattc ggcggatccg tgctgcgggt aaagcggctg gttttctggc tgtggctcct 660 gatatggcgc agcaatgcct ggcgtgggga gcgaactttg tcgctgttgg cgttgacacg 720 atgctctaca gcgatgccct ggatcaacga ctggcgatgt ttaaatcagg caaaaatggg 780 ccacgcataa aaggtagtta ttga 804 <210> 71 <211> 363 <212> DNA <213> Escherichia coli DH10B <400> 71 atggcacaac ctgccgctat tattcgtata aagaaccttc gtttgcgtac gtttatcgga 60 attaaggaag aagaaattaa caaccgtcag gatattgtta tcaatgtgac gatccactac 120 cccgccgata aagcgcgcac tagcgaagat atcaacgatg cgctgaatta tcgcaccgta 180 acgaaaaaca ttattcagca tgtagagaat aaccgtttct ctttgctgga aaaattaact 240 caggatgtgc tcgatatcgc acgtgaacat cactgggtga cgtatgctga agtggagatc 300 gataaactgc acgcgctgcg ctacgccgat tcggtatcca tgaccttaag ctggcagcgt 360 taa 363 <210> 72 <211> 951 <212> DNA <213> Escherichia coli DH10B <400> 72 atgaacgagt tagacggcat caaacagttc accactgtcg tggcagacag cggcgatatt 60 gagtccattc gccattatca tccccaggat gccaccacca atccttcgct gttactcaaa 120 gctgccggat tatcacaata tgagcattta atagacgatg ctatcgcctg gggtaaaaaa 180 aatggcaaga cccaggaaca acaggtggtc gcagcgtgtg acaaactggc ggtcaatttc 240 ggtgctgaaa tcctcaaaat cgtacccggt cgcgtgtcaa cagaagttga tgcacgcctc 300 tcttttgata aagaaaagag tattgagaag gcgcgccatc tggtggactt gtatcagcaa 360 caaggcgttg agaaatcacg cattctgatc aagctggctt cgacctggga aggaattcgc 420 gcggcagaag agctggaaaa agaaggtatt aactgcaacc tgacgctgct gttttctttt 480 gcacaggcac gggcctgtgc ggaagcaggc gtttttctga tttcgccgtt tgtcgggcgt 540 atttatgact ggtatcaggc acgcaagccg atggacccgt atgtggtgga agaagatccg 600 ggcgttaaat cggtgcgcaa tatctacgac tactataagc aacaccacta tgaaaccatt 660 gtgatgggcg cgagcttccg tcgcaccgaa caaatcctcg ccttaaccgg ctgcgatcga 720 ctgactatcg caccgaattt actgaaggag ctgcaggaaa aagtttcgcc agtggtacgt 780 aaattaatcc caccttctca gacgttccca cgcccagctc ccatgagcga agcggagttc 840 cgttgggagc acaatcagga tgcgatggcg gtagaaaaac tgtctgaagg cattcgtctg 900 ttcgccgttg atcaacgcaa actggaagat cttcttgccg ccaaactata a 951 <210> 73 <211> 648 <212> DNA <213> Escherichia coli DH10B <400> 73 atggaacgaa ataaacttgc tcgtcagatt attgacactt gcctggaaat gacccgcctg 60 ggactgaacc aggggacagc ggggaacgtc agtgtacgtt atcaggatgg gatgctgatt 120 acgcctacag gcattccata tgaaaaactg acggagtcgc atattgtctt tattgatggc 180 aacggtaaac atgaggaagg aaagctcccc tcaagcgaat ggcgtttcca tatggcagcc 240 tatcaaagca gaccggatgc caacgcggtt gttcacaatc atgccgttca ttgcacggca 300 gtttccattc ttaaccgatc gatccccgct attcactaca tgattgcggc ggctggcggt 360 aattctattc cttgcgcgcc ttatgcgacc tttggaacac gcgaactttc tgaacatgtt 420 gcgctggctc tcaaaaatcg taaggcaact ttgttacaac atcatgggct tatcgcttgt 480 gaggtgaatc tggaaaaagc gttatggctg gcgcatgaag ttgaagtgct ggcgcaactt 540 tacctgacga ccctggcgat tacggacccg gtgccagtgc tgagcgatga agagattgcc 600 gtagtgctgg agaaattcaa aacctatggg ttacgaattg aagagtaa 648 <210> 74 <211> 1080 <212> DNA <213> Escherichia coli DH10B <400> 74 atgtctaaga tttttgattt cgtaaaacct ggcgtaatca ctggtgatga cgtacagaaa 60 gttttccagg tagcaaaaga aaacaacttc gcactgccag cagtaaactg cgtcggtact 120 gactccatca acgccgtact ggaaaccgct gctaaagtta aagcgccggt tatcgttcag 180 ttctccaacg gtggtgcttc ctttatcgct ggtaaaggcg tgaaatctga cgttccgcag 240 ggtgctgcta tcctgggcgc gatctctggt gcgcatcacg ttcaccagat ggctgaacat 300 tatggtgttc cggttatcct gcacactgac cactgcgcga agaaactgct gccgtggatc 360 gacggtctgt tggacgcggg tgaaaaacac ttcgcagcta ccggtaagcc gctgttctct 420 tctcacatga tcgacctgtc tgaagaatct ctgcaagaga acatcgaaat ctgctctaaa 480 tacctggagc gcatgtccaa aatcggcatg actctggaaa tcgaactggg ttgcaccggt 540 ggtgaagaag acggcgtgga caacagccac atggacgctt ctgcactgta cacccagccg 600 gaagacgttg attacgcata caccgaactg agcaaaatca gcccgcgttt caccatcgca 660 gcgtccttcg gtaacgtaca cggtgtttac aagccgggta acgtggttct gactccgacc 720 atcctgcgtg attctcagga atatgtttcc aagaaacaca acctgccgca caacagcctg 780 aacttcgtat tccacggtgg ttccggttct actgctcagg aaatcaaaga ctccgtaagc 840 tacggcgtag taaaaatgaa catcgatacc gatacccaat gggcaacctg ggaaggcgtt 900 ctgaactact acaaagcgaa cgaagcttat ctgcagggtc agctgggtaa cccgaaaggc 960 gaagatcagc cgaacaagaa atactacgat ccgcgcgtat ggctgcgtgc cggtcagact 1020 tcgatgatcg ctcgtctgga gaaagcattc caggaactga acgcgatcga cgttctgtaa 1080 1080 <210> 75 <211> 369 <212> DNA <213> Escherichia coli DH10B <400> 75 atggatattg tatttataga gcaactttcg gtaatcacca ctattggtgt ttacgactgg 60 gaacagacca tcgaacagaa gttagtgttc gatatcgaaa tggcgtggga taaccgtaaa 120 gcggcgaaaa gtgatgatgt ggcggattgc ctcagttacg ctgacattgc agaaacggtg 180 gtcagccacg tcgagggggc gcgttttgcg ctggtggaac gcgtggctga agaggtggcg 240 gagctgctgt tagcacgctt caactcgccg tgggtgcgta tcaaactcag caagccaggc 300 gcagtggcgc gggcggcgaa tgttggcgta atcattgagc gtggcaataa tctgaaagaa 360 aataattaa 369 <210> 76 <211> 771 <212> DNA <213> Escherichia coli DH10B <400> 76 atgaataacg atgttttccc gaataaattc aaagccgcac tggctgcgaa acaggtacaa 60 attggttgct ggtcagcact ctctaacccg attagcactg aagttcttgg tttggctggg 120 tttgactggc tggtgctgga tggcgaacat gcgccaaacg atatctccac gtttattccg 180 cagttaatgg ccttgaaagg cagcgccagc gcgccagtag tgcgagtgcc gaccaacgag 240 ccggtaatta ttaagcgtct tctggatatc ggtttctata acttcctgat tccttttgta 300 gaaacaaaag aggaagcaga gctggcggtg gcatcaaccc gttacccacc ggaaggcatt 360 cgcggcgtct ccgtttctca ccgcgccaat atgtttggca ccgtggcgga ttatttcgct 420 cagtcgaaca agaacatcac tattctggtc cagatagaaa gtcagcaggg cgtagataac 480 gtcgatgcca ttgccgctac cgaaggcgta gacggcatct tcgtcggccc cagcgatctg 540 gccgcggcat taggccatct cggcaatgca tcacacccgg atgtacaaaa agcaattcag 600 cacattttta accgtgccag cgcgcacggc aaacccagcg gtatcctcgc gccggtcgaa 660 gccgatgcgc gtcgttatct ggaatggggc gcgacgtttg tggctgtcgg cagcgatctc 720 ggcgtcttcc gctctgccac tcagaaactg gctgatacct ttaaaaaata a 771 <210> 77 <211> 1281 <212> DNA <213> Escherichia coli DH10B <400> 77 atgaaacatc tgacagaaat ggtgagacag cacaaagcgg gcaaaacaaa tggaatttat 60 gccgtttgtt ccgcacatcc gctggtgctg gaagctgcaa tccgctacgc cagtgcaaac 120 caaacgccgt tactgattga agcaacctcc aatcaggtag accagttcgg cggttatacc 180 ggaatgacgc ccgccgattt tcgcggcttt gtttgtcagc tcgccgactc gttgaatttc 240 ccgcaggatg cgttgattct gggtggtgac catctggggc caaaccgctg gcaaaacctg 300 ccggccgctc aggcaatggc caatgccgat gatttgatta aaagctacgt tgcggcagga 360 ttcaaaaaaa tccaccttga ttgcagcatg tcctgtcagg acgatccgat tcccttaact 420 gatgacatcg tggctgaacg cgccgcccgt ctggcgaaag tggcggaaga aacctgtctt 480 gaacactttg gcgaagccga tctggagtat gtcattggta ccgaagtgcc ggtacctggc 540 ggcgcgcatg aaaccttaag cgagctggcg gtcaccacgc cggatgccgc ccgcgccacg 600 ctggaagccc atcgtcacgc ctttgaaaag caaggtttga atgccatctg gccacgcatc 660 attgccctgg tggttcaacc cggcgtcgaa ttcgatcaca ccaacgttat tgattatcag 720 cccgccaaag cgagcgcctt aagccagatg gtcgaaaact acgaaacgct gattttcgaa 780 gcgcactcta ccgattatca aacgccgcaa tcgctgcgcc agctggtgat tgaccacttt 840 gccattctga aagttggccc agcgctgacc ttcgccctgc gtgaagctct gttctctctg 900 gcggcgattg aagaagaact ggtgccagcg aaagcctgtt ctggtctgcg tcaggtgctg 960 gaagacgtga tgctcgaccg cccggaatac tggcaaagcc actaccacgg tgacggcaac 1020 gcgcgtcgtc tggcgcgtgg ttatagctac tcggatcgcg tgcgctatta ctggccggac 1080 agccagattg atgacgcttt cgctcatctg gtacgtaatc tggcggattc accaattccg 1140 ctgccgctga tcagccagta tctgccgctg cagtacgtga aagttcgctc cggcgagctg 1200 cagccaacgc cacgggaact cattatcaac catattcagg acatcctggc gcagtaccac 1260 acagcctgtg aaggccaata a 1281 <210> 78 <211> 861 <212> DNA <213> Escherichia coli DH10B <400> 78 atgagcatta tctccactaa atatctgtta caggacgccc aggccaatgg ctacgcggtg 60 cctgctttta acattcataa cgccgagacg atccaagcga tcctcgaagt gtgcagtgaa 120 atgcgatcgc cggtgatcct cgccggaacg ccggggacct ttaaacacat cgcgctggaa 180 gagatctacg ccctgtgtag cgcctattcc acaacctaca acatgccact ggcgctgcat 240 ctcgaccacc acgaatcgct ggatgatatt cgccgtaaag tccacgcagg tgtgcgcagt 300 gcgatgatcg acggcagcca cttcccgttt gccgagaacg tgaagctggt gaaatcggtt 360 gttgacttct gccactcaca agattgcagc gtggaagcag aactgggccg cctgggcggt 420 gttgaagatg acatgagcgt tgacgccgaa agtgcattcc tgaccgatcc acaagaagct 480 aaacgctttg tcgaactgac tggcgtcgac agcctggcgg tagcgattgg tacggcgcac 540 ggcttataca gcaaaacgcc gaagattgat ttccagcggc tggcggaaat tcgtgaagtg 600 gtggatgttc ctctggtgct gcatggtgcc agcgatgttc cggatgaatt tgtccgtcgc 660 actattgaac ttggcgtcac aaaagtgaac gttgccacag aattaaaaat agccttcgct 720 ggcgcggtta aagcctggtt tgcggaaaat ccgcagggta atgatcctcg ttattatatg 780 cgcgtcggaa tggatgcgat gaaagaagtt gtcagaaata aaattaatgt ctgtggttca 840 gcgaatcgaa tttcagcata a 861 <210> 79 <211> 879 <212> DNA <213> Escherichia coli DH10B <400> 79 atgaataagt acaccatcaa cgacattacg cgcgcatcgg gcggttttgc catgctggcg 60 gtcgatcagc gcgaagccat gcgcatgatg tttgccgcgg ctggggcacc cgctccggta 120 gccgatagcg ttttaactga tttcaaagtt aacgctgcaa aggccctctc gccttatgcc 180 tcggcgattc tggtagatca acaattctgc taccgccagg tggttgagca aaacgcgatt 240 gccaaaagtt gcgccatgat tgtcgccgcc gatgagttca ttcctggcaa cggtattccg 300 gtcgatagcg tggttattga ccgcaaaatc aatccgctac agatcaaaca agacggtggc 360 aaagccttaa aactgctggt gctgtggcgt agtgatgaag atgcgcagca acgtctggat 420 atggtgaaag agttcaacga actgtgccac tcacacggtc tggtaagcat cattgagcca 480 gtcgtccgcc caccgcgtcg tggcgataaa ttcgatcgcg aacaagcgat catcgatgcc 540 gccaaagagc tgggcgacag tggcgctgac ctctacaaag ttgaaatgcc gctttatggc 600 aaaggtccgc aacaagagct tctctgtgct tcacaacgtc tgaatgacca tatcaatatg 660 ccatgggtga tcctctcttc cggtgtcgac gaaaaactgt tcccgcgtgc cgtacgcgtg 720 gcaatgacgg cgggcgcatc gggattcctg gcaggccgtg cagtctgggc atcggtcgtc 780 ggtttaccag acaacgagct gatgctgcgt gacgtttgcg caccgaaatt acaacaactt 840 ggcgatatcg tcgacgaaat gatggctaaa cgccgctaa 879 <210> 80 <211> 825 <212> DNA <213> Escherichia coli DH10B <400> 80 atgcaaaaca ttactcagtc ctggtttgtc cagggaatga tcaaagccac caccgacgcc 60 tggctgaaag gctgggatga gcgcaacggc ggcaacctga cgctacgcct ggatgacgcc 120 gatatcgcac catatcacga caatttccac caacaaccgc gctatatccc gctcagccag 180 cccatgcctt tactggcaaa tacaccgttt attgtcaccg gctcgggcaa attcttccgt 240 aacgtccagc ttgatcctgc ggctaactta ggcatcgtaa aagtcgacag cgacggcgcg 300 ggctaccaca ttctttgggg gttaaccaac gaagccgtcc ccacttccga acttccggct 360 cacttccttt cccactgcga gcgcattaaa gccaccaacg gcaaagatcg ggtgatcatg 420 cactgccacg ccaccaacct gatcgccctc acctatgtac ttgaaaacga caccgcggtc 480 ttcactcgcc aactgtggga aggcagcacc gagtgtctgg tggtattccc ggatggcgtt 540 ggcattttgc cgtggatggt gcccggcacg gacgaaatcg gccaggcgac cgcacaagag 600 atgcaaaaac attcgctggt gttgtggccc ttccacggcg tcttcggcag cggaccgacg 660 ctggatgaaa ccttcggttt aatcgacacc gcagaaaaat cagcacaagt attagtgaag 720 gtttattcga tgggcggcat gaaacagacc atcagccgtg aagagttgat agcgctcggc 780 aagcgtttcg gcgttacgcc actcgccagt gcgctggcgc tgtaa 825 <210> 81 <211> 663 <212> DNA <213> Escherichia coli DH10B <400> 81 atggaactgt atctggacac cgctaacgtc gcagaagtcg aacgtctggc acgcatattc 60 cccattgccg gggtgacaac taacccgagc attatcgctg ccagcaagga gtccatatgg 120 gaagtgctgc cgcgtctgca aaaagcgatt ggtgatgagg gcattctgtt tgctcagacc 180 atgagccgcg acgcgcaggg gatggtggaa gaagcgaagc gcctgcgcga cgctattccg 240 ggtattgtgg tgaaaatccc ggtgacttcc gaaggtctgg cagcaattaa aatactgaaa 300 aaagagggta ttactacact tggcactgct gtatatagcg ccgcacaagg gttattagcc 360 gcactggcag gggcaaaata cgttgctccg tatgttaacc gcgtagatgc ccagggcgga 420 gacggcattc gtacggttca ggagctgcaa acgctgttag aaatgcacgc gccagaaagc 480 atggtgctgg cagccagctt taaaacgccg cgtcaggcgc tggactgttt actggcagga 540 tgtgaatcca tcaccctgcc cttagatgta gcgcaacaaa tgctcaacac ccctgcggta 600 gagtcagcta tagagaagtt cgaacacgac tggaatgccg catttggcac tactcatctc 660 taa 663 <210> 82 <211> 780 <212> DNA <213> Escherichia coli DH10B <400> 82 atgactgatc tgaaagcaag cagcctgcgt gcactgaaat tgatggacct gaccaccctg 60 aatgacgacg acaccgacga gaaagtgatc gccctgtgtc atcaggccaa aactccggtc 120 ggcaataccg ccgctatctg tatctatcct cgctttatcc cgattgctcg caaaactctg 180 aaagagcagg gcaccccgga aatccgtatc gctacggtaa ccaacttccc acacggtaac 240 gacgacatcg acatcgcgct ggcagaaacc cgtgcggcaa tcgcctacgg tgctgatgaa 300 gttgacgttg tgttcccgta ccgcgcgctg atggcgggta acgagcaggt tggttttgac 360 ctggtgaaag cctgtaaaga ggcttgcgcg gcagcgaatg tactgctgaa agtgatcatc 420 gaaaccggcg aactgaaaga cgaagcgctg atccgtaaag cgtctgaaat ctccatcaaa 480 gcgggtgcgg acttcatcaa aacctctacc ggtaaagtgg ctgtgaacgc gacgccggaa 540 agcgcgcgca tcatgatgga agtgatccgt gatatgggcg tagaaaaaac cgttggtttc 600 aaaccggcgg gcggcgtgcg tactgcggaa gatgcgcaga aatatctcgc cattgcagat 660 gaactgttcg gtgctgactg ggcagatgcg cgtcactacc gctttggcgc ttccagcctg 720 ctggcaagcc tgctgaaagc gctgggtcac ggcgacggta agagcgccag cagctactaa 780 780 <210> 83 <211> 963 <212> DNA <213> Pseudomonas putida <400> 83 gtgaaggcat tgcaaggcgt tgacggacat gtggagtggg tcgaggccga acgcccgacc 60 tgtgacgcgg gccaagtgcg cattcgcgtg gccgctgcgg ggctgaaccg cgccgacctg 120 ctgcagatga aaggtttgta cccgccacca ccaggtgcca gcccatacat ggggctggag 180 tgttccgggg tggttgaaga ggtgggggct ggtgccgcct ggcgcgtggg tgaccgcgtt 240 tgcgccctgc tggccagcgg cgccatggcc gaggaagtgg tggtcgatgc ccgtcacgta 300 ttgccggtac ccgaaggcct tggcctgcat gaggcggcag cgttgccgga ggtgtatgcc 360 accgcctggc tgaacatctt ccagctcggt gcagtgaagg ctggcgagaa ggtgctggtg 420 cacgccggcg ccagtggcgt tggctcggcc gccatccagc tgtgcaaggc gttcggcagc 480 ccggtatggg tcagcgtcgg ttcgcaggac cgcttggcct actgccaggc gctgggcgct 540 gcgggtggtg tggtacgtaa cgagaacctg gacgcgctgg aaggttttgg cccgttcgat 600 gtgattctcg acccggtggg cgccagctac ggtgagctga acctcaagct gctggcccgt 660 gacgggcgct gggtgatcat cggcctgatg ggcggacgca agttcgagct ggacctggcc 720 caagtgctgg gcaagcgtct ggaaattacc ggttccaccc tgcgcaaccg tgatgacggc 780 ttcaaggccg agctgttgcg cgaactgcag cagcaagtat ggccgctgtt cgccgagggg 840 cggttgtcgc cgcagctggt cgacacctat ccggtggagt ttgcccaggc ggcgtatgcc 900 gagctggaga ccaaccaggt gtcgggcaag ctggtgatgg tgatcgaccc tagcctggtg 960 taa 963 <210> 84 <211> 1002 <212> DNA <213> Pseudomonas putida <400> 84 atgacccaga ccaaccgccg cttcctgctt gccaaacgcc cggtcggcgc cgtgcgccgt 60 gacgacttca gcttcgagac cgtacccgcc gaacaacccg gcgaaggcca ggtactggtg 120 cgcaacctgt acctgtcgct ggacccggcc atgcgcggct ggatgaacga aggcaagtcc 180 tacatcccgc ccgtggccct gggccaggta atgcgtgcgc tgggtgtagg tgaagtggtt 240 gcctccaatc accccggcta ccagcccggc gaccatgtga gcggcgccct cggtgtgcag 300 gactacttca ccggcgagcc ccagggcctg cacaagatcg accccaagct ggcccccctg 360 ccccgttacc tgtcagcctt gggcatgacc ggcatgaccg cctacttcgc cctgctggag 420 gttggccaac ccaaagctgg cgacaccgtg gtcatttccg gcgcggccgg tgcggtgggc 480 agcattgtcg ggcagattgc caagatcaaa ggctgccgcg tggtcggcat tgccggcggt 540 gccgagaagt gccagtacct gaaggacgag ctgggctttg acggcgtgat cgactacaag 600 gccgaagacg tgctggccgg cctgaagcgc gaatgcccca aaggcgtgga cgtgtacttc 660 gacaacgtgg gcggcgatat cctcgatgcc gtgctgacgc gcatcaactt caaggcacgc 720 attgtgattt gcggcgcgat cagccagtac aacaacaaag aagcggtgaa aggcccggcc 780 aactacctgt cgctgctggt gaaccgcgcg cgcatggaag gttttgtggt gatggattac 840 accaaggact acggcaaggc cgcgcaggaa attgccggct ggttggccaa tggtcaggtg 900 aagagcaaag aggatgtggt ggaagggctg gaaaccttcc cggagacctt gttgaagctg 960 ttcagcgggg agaattttgg caagttggtg ttgaaggttt aa 1002 <210> 85 <211> 1164 <212> DNA <213> Pseudomonas putida <400> 85 atgcagcctt tcagctttgc caccactgcg cagatcctct gcgaacccgg cgcggtgcag 60 cgccttgcag gtctgtgccg tgagcgcggt gccaagcgtg ttttgattat cagtgacccg 120 ggtatcgccc gccttggcat gctcgatgac ctgctgccgg ggttcacggc agccaaggtc 180 ggtgtggcga tcttcagtga ggttacggcc gaccccagcg aggcatgcgt gctggcggcc 240 gcccagcgcg cccggcatat cggcgccgac ctggtggtgg ggttcggcgg cggcagctcg 300 atggatgtgg ccaagctggt tgcgctgctg gcccaccgcg attgttcgca gcccatcgcc 360 gagctgtacg gcatcgacag ggccaagggc cgccggctgc cgttgatcca ggtgcccacc 420 acggcaggta ccggttcgga ggtgacgccg atcgccatcg tcaccaccgg cgccaccacc 480 aagatgggca ttgtttcgcc gctgctgttg ccagacctgg cagtgctcga cgccgtctgc 540 accctcggcc tgccatcggc ggtgactgct gctaccggta tcgatgccat ggtgcatgcc 600 atcgaagcct ataccagccg cctcaaacgt aacccgctgt ccagcctgct ggcccgtgag 660 gcgctgcggc tgctggcgga taaccttgac caggctgtgc acaacggcgg caacctgcag 720 gcccgccagg ccatgctgtt gggggcttgc ctggccggcc aggcctttgc caatgcaccg 780 gtggcggcgg tgcatgccct ggcctatccg ctgggtgggc actttcatgt tccccatggc 840 ctggccaacg cgctggtgtt gccgcatgtg ctgcgcttca acctgccggt ggcggcagtg 900 gactacgccg aattggccgt gccgctgttg ggggcccgtt tgcagcccgg tgatcagcgc 960 cagcaggcag aacaattcgt ggccgagctg gccgcgctga gcagccgctg cgggttacct 1020 gaccgcctgc gcgacgccga tgtaccgcgt catcggcttg gccagctggc cgaagacgcg 1080 atgcaacagc agcgcctttt ggtcaataac ccgcgtgaag tcacccaggc cgatgcgttg 1140 gccatctatg aggcagccta ctga 1164 <210> 86 <211> 1035 <212> DNA <213> Pseudomonas putida <400> 86 atgccccaat caaagctaat caatcggcgc gtcgttctgg cctcacgtcc ccacggtgcg 60 cctctcgaag cgaattttcg cattgagcaa agccccattc ctgagccagc agaagggcag 120 gttctgttgc gtaccgttta cctctcactt gacccttaca tgcgtggtcg catgagtgat 180 gcaccgtcct atgctgcgcc ggtggaaatc ggtggagtga ttgtgggtgg cactgtatgc 240 cgtgtggagg cttcgaaaaa cccggcctac aaggtcggtg actgggtgct gtcctttgct 300 ggctggcagg actacacgct gtccgatgga agcgatctga ccgcgttggg tgagtcgccg 360 gcgcatcctt cttatgcctt gggcatcttt ggcatgccgg gcttcaccgc ttatatgggc 420 ttgctcgata ttggccggcc gcaggcgggt gaaaccctgg tggtggcggc ggccaccggg 480 ccggtcggcg cgactgtggg gcagatcggc aagatcaagg gctgccatgt ggtcggtgtc 540 gccggtggcg cggaaaaatg ccggcatgcg gtcgaggtgc tgggttttga tgcctgtcta 600 gatcaccgtg cgccggactt cgccgagcaa ctggccaagg cctgcccggc aggtatcgac 660 atctacttcg agaatgtcgg cggcaaggtc ttcgatgcgg tgctgccgct gctcaatacc 720 aaggcccgag tgcccgtctg cggcattatt gcgcactaca acgataccgc tttacccaac 780 gggccagatc gtttgcctgc tttgatgggc agcattctgc gcaagcgtat tcatgtgcag 840 ggtttcatta tttttgatga ttacggccac cgctacaacg agttctttaa cgatatgtcg 900 agctggtttg cgcagggccg gattaaatac cgtgaagaat tagtgagtgg tctggaggag 960 gcgcctaagg cctttatcgg cctgctcgag gggcgaaatt ttggcaagtt agtggttcgc 1020 gtcagtgagg actga 1035 <210> 87 <211> 1143 <212> DNA <213> Pseudomonas putida <400> 87 atgtccctga tcaactacat cacccagatc caattcgata tcggtgccat cgcctgcctg 60 cctgccgaat gtgagcgcat tggtataacc aggcctttga tcgtgaccga ccgtggcgtg 120 cgtgccgccg gtatcgtcga tacggcgttg aacaccttcg gcagcgacac cacacaactg 180 ccgatctacg acggtacgcc acccaacccc aacgagcatg ccgtgcgtga ggccgtggcc 240 atgttcaagg caaatggctg tgatggcatc atcgccattg gtggtggctc ggcgatcgac 300 ctggccaagg gggtggccgt gtgtgcccgg cacgacggcc cgttgaagag ctttgcggtg 360 atcgagggcg gcctggcccg gatcaccccg gcaaccgcgc cggtgattgc ggtgccgacc 420 acggccggca cggggagcga ggtcgggcgc ggtgccatcc tgatactcga tgacgggcgc 480 aaggtggggg tgatctcgcc ccatgtggtg cccaaggccg ccatctgtga cccgtcattg 540 accctcgggc tgccggcaca actcacggct gccaccggca tggacgcgat tgcccactgc 600 ctggaaacct tcatggcacc tgcgttcaac ccgcctgccg acggcattgc cctggacggc 660 ctgtggaggg cctggcgctt catcgaacga gccacccgcg cgccgggcaa cctggacggg 720 cgcatcaaca tgatgagcgc atcgctgcaa ggtgcgctgg ccttccagaa aggcctgggc 780 tgcgtgcaca gccttagcca cgcgctgggc gggatcaacc cgcgcctgca ccacggcacc 840 ctcaatgcga tcttcctgcc tgccgtcatc cgcttcaacc gcacggccga aacggtggtg 900 aatgaacaca agatgcaacg catcgcccag gcgatggggc tggccgatga cagccagatc 960 gaagatgcca ttcgccacat gacccgtacg ctgggcctgc cgaccggcct tggcgaactg 1020 gatgtcaacc cggacctgtt cccgcgcatc gtccagggtg cgttggccga tcacagccac 1080 cgcaccaacc cgcgtgaggc atctgccgag gactaccagt ggctgcttga agcgtcgatg 1140 taa 1143 <210> 88 <211> 1164 <212> DNA <213> Pseudomonas putida <400> 88 atgagccaga gtttcagccc ccttcgcaag ttcgtatcgc ctgaaatcat ctttggtgcc 60 ggctgccggc acaatgtggc caattacgcc aaaaccttcg gtgcgcgcaa ggtactggtg 120 gtcagcgacc ctggcgtgat cgccgccggc tgggtggcgg atgtggaggc cagcctgcag 180 gcccagggta tcgactactg cctgtacaca gcggtgtcac ccaacccgcg ggtcgaggag 240 gtgatgctcg gcgccgagat ctatcggcag aaccactgtg acgtgatcgt cgccgtcggt 300 ggcggcagcc cgatggattg cggcaaggcc atcggtatcg tggtggccca tgggcgcagc 360 atcctcgaat tcgaaggcgt ggacatgatc cgcgtgccca gcccgccgct gatcctgatc 420 ccgaccaccg ccggcacctc ggcggacgtg tcgcagttcg tgatcatttc caaccagcag 480 gaacgcatga agttctccat cgtcagcaag gcggtggtgc cggacgtgtc gctgatcgac 540 ccgcagacca ccctgagcat ggacccgttc ctgtcggcct gcaccggcat cgatgcgttg 600 gtgcatgcca tcgaggcctt cgtgtctacc ggccacgggc cgctgaccga cccccatgcg 660 ctggaagcca tgcgcctgat caatggcaac ctggtggaga tgatcgccaa ccctactgat 720 attgcgctgc gcgagaagat catgctcggc agcatgcagg cggggctggc gttctccaat 780 gcgatcctgg gcgcagtgca cgccatgtcg cacagcctgg gcggcttcct cgacttgccc 840 catggcttgt gcaacgcggt gctggtggag cacgtggtgg cgttcaacta cagctcggcg 900 ccggagcgtt tcaaggtgat cgccgaggtg tttggtatcg actgccgcgg tctcaatcac 960 cggcagatct gcgggcggct ggtggagcac ctgattgccc tgaagcgtgc catcggcttc 1020 catgaaaccc tgggcctgca cggggtgcgc acgtctgata tcccgttcct gtcgcaacac 1080 gcgatggacg acccgtgcat cctcaccaac ccccgtgcgt ccagccagcg tgatgtcgag 1140 gtggtctatg gcgaggccct ctga 1164 <210> 89 <211> 1023 <212> DNA <213> Pseudomonas putida <400> 89 atgtcccgca tgatccgttt ccacaagttt ggcgctgccg acgtgctccg ttgcgaagag 60 caggccgaac cgtcacccgc tgccgacgag gtgcagatcc gcgtcgaagc ggttggcgtc 120 agctggtatg acgtgctgtg gcgccagaat ctggcaccgt cccaggcgcg tctgccagcg 180 gggatcggtc acgaaatggc aggggtggtg actgcggttg gtgaaggggt cgatgatatt 240 gccgtcggtg accgggtcgc cagcttcccg gccaccagtg ccaacgacca cccggtgtac 300 ggcgatgtca tcgtactgcc ccgtacagcc atcacgcgct acccgaatgt gctcaccccg 360 atcgaggcca gcgtgcacta caccccgctg ctgatcgcct atttcgccta cgtcgacctg 420 gcacgtgcca aggccgggca gacagcactg gtcaccgatg ccagccattg cgccgggcct 480 gccttcgtgc agctgggcag ggccctgggg ctgaaagtgt tcgccgccac caaggaagcg 540 gcgcagcgtg actacctgct gggcttgggc gcagacaaag tgatcgtcac cgaagagcaa 600 gacctgctgc tgcagattgg caagtacacc gatggccgtg gtgtggacat ggtgctcgac 660 ggcatgggcg gcccgcagat gtcactgttg ggtgatgtgc tggcgccgcg tggcagcctg 720 gtgctgtacg gtctgcaagg cggcaaccag acgccgttcc cggcttgcgc ggcattccag 780 aagaacattc agttctatgt gcactgcatc ggtaatttca ccggcaagcc agagcttggc 840 atcagccagg accaggtggc gctgcagcgt gccttgcgcg atatcaacca gttcacggcc 900 gaccagctgc tgacaccgca gatcatcaag gtgtacccgt tcgagcaggt ggtcgaggcg 960 catcgttaca tggaccaatg cccgtgcggc gggcgcgtcg tgctggacat ggcgcaacac 1020 tga 1023 <210> 90 <211> 1008 <212> DNA <213> Pseudomonas putida <400> 90 atgaaagcga tcagtttcat ccacaaaggc ttgcctatcg aagaccctgc gtctctccag 60 gacatcttca tgcccaagcc cagccctggg cccagggacc ttctggtcga ggtcaaagcc 120 gtgtcggtca accccgtaga caccaaggta cgcgcgggaa ctttcacggg agagccgaaa 180 atactcggct gggacgcggc cggtgtcgac cgcgaagtcg ggcgccaggt gaccctgttc 240 aagcccggag accaggtgta ctacgccggc tccatcgcca ggcccggcag ctacagcgaa 300 tatcacctgg ttgacgaacg catcgtcggg catcaaccgc gtagcctggg tgcagcacag 360 gcagccgcgc tgccgctgac ggccatcacc gcctgggaac tgctgttcga tcgcctgggg 420 atcgcggagg gcggcgggga gggcgatgcc ctgctgatcg ttggcgctgc cggtggcgtc 480 ggttcgatgc tggtgcagtt ggcccggcaa ctgacccgct tgacggttat cggcacggcc 540 tcccgcgccg agaccagcaa ctgggtacgc gaactgggcg cccatcacgt catcgatcac 600 agtgcgccgc tgcaagggca gctgcaggcc ttggggatcg agtcggtcag ccatgtcgcc 660 agccttaccc atactgatca acactttgcg caactggttg aagtgctgcg accacaaggt 720 cgcctgggcg tgatcgacga cccgcagacc ctggacgtca tgccgctcaa gcgcaagtcg 780 ctgtcgctgc actgggagct gatgttcacc cgctcgcttt acgaaaccga cgacatggtg 840 cgccagcacg agctgctcga gcgcgtggcc gggctgatcg atcaaggcac cctgcgtacc 900 accttgggcg agcatttcgg cgccatcaat gccgccaaca tgcgccgtgc ccatgcgctg 960 gtcgagagtg gcaaggcgcg cggcaagatc gtcctggaag gcttctga 1008 <210> 91 <211> 1002 <212> DNA <213> Pseudomonas putida <400> 91 atgaatcaga ccatgcttgc cgctatcgcc gaatccgccc agaccccgct ggtcgtgcgc 60 cacatcgccc gccctgtgcc cggtaagggg caggttttgg tgcggattca cgccgccggg 120 gtcaacccgc tcgacaccaa gattgcaatc ggtgcgggtg ctcacgcccg ccaggagttg 180 ccggccgtgc tcggcctgga tctcgccggt acggtcgtcg aactgggcga ggcagttgat 240 ggcttcacgc ctggccagga ggtcttcggc atggccggcg gaatcggcgg cgcccaaggc 300 accctggccg aatacatcgc cgtggatgcc aggctgattg catcaaagcc gcatgcactc 360 ggcatgcgtg aggctgccgc gctgccgttg gtattcatca ccgcctggga aggtttggta 420 gatcacgcaa atgttcgtag tggtcagcgt gtgctgattc atggcggcgc aggtggcgtc 480 ggccaagttg cggtgcaatt ggccaaggct cgaggtgccg aagtctacgc caccggctcc 540 gcgggcagtc tagacttcat tcgctcgctg ggggccacgg caattgacta tcaggcgcag 600 ggtgtagagg cctatgtcga acaatatacg gccggggaag gtttcgacat cgtttatgac 660 accgtcggcg gcagcacgtt ggacgcgtca ttcaaggcag taaagcctta taccgggcac 720 gtactcagct gcctcggttg gggccagcac agtctcgcgc ctttatcctt caaaagtgcc 780 acctactcgg gcgtatttac cctggcaccg ctgctaaccg gcaagggacg cgaacaccat 840 ggaagtatcc tgcgcgaggc tgccgttctg gccaatgccg ggcaactggc gatccgggtg 900 gacccgcaac agtttgcatt ggatgaggtc aacgacgcat tccgacaggt cgccgaaggt 960 cgcggcaggg gcaagacggt tatccagttg ataagtgaat ag 1002 <210> 92 <211> 1017 <212> DNA <213> Pseudomonas putida <400> 92 atgatgaata gccgaatcat gcaagcactg accttcaagc gctacggcaa gtcacccgac 60 atcgggttgg ccgacgttcc ccgccccacg ccaaaggctg acgaattact ggtgcaagtc 120 cacgctgccg gcctgaaccc gatcgacaac atgattccaa cggggatgtt caagcctgta 180 ttgcatttcc agctgccagc caccctgggc agcgatctgg ccggcatcgt gaccgaggta 240 ggtagcaatg tgacccgctt caagccaggc gatgctgtct tcgccagcct cttcgatctt 300 ggcacagggg cgattgcgga gttcgcggtt gtgccggaaa gcgccgccgc gctgaaaccg 360 gccaatctga gcttcgagca ggcggcgtcg atcccgatgg tcggcctcac ctcatggcaa 420 gcgctgaaag agcgcctcaa gcttcaggcc gggcagaagg tgttcattcc tgccgggtcg 480 gggggcatcg gtacattcgc aatccagttg gccaaacacc tcggtgcaaa ggtgggcacc 540 actaccagta caggcaacgt tgacctggtg cgcgctctgg gggcggacga ggttgtggac 600 tacaagacgc aggatttcga gaccgtgctg cgcgactacg acgcggtgct cggaaccgta 660 aggggggatg cgattgaaaa atccttgtcc atcctcagac ccggaagcca gattgtctcg 720 ctcgttggcc cactggatgc tgcgttcgcc cgggccaaac gcctgaacct cctcctgacc 780 ttcgtgttcg gcctgatgag ccgcaagatc atgcgcctgg caaagaggcg gaatgtccaa 840 tactcgtttc ttttcgtgca gcccgacggt gcccaactcg ccgaaatcgg caagcttctg 900 gacgcccagc aaattcagcc ggtgatcgac cgggtatttc cgttcgagga cgcaaagggt 960 gcgcttgagt accttgctca agggcgctcc aagggcaagg tcgtaatcaa gatgtga 1017 <210> 93 <211> 1011 <212> DNA <213> Pseudomonas putida <400> 93 atgaaagctg ctgtcgttgc accaggccgt cgcgtggacg tgatagagaa aagcctgcgc 60 cctctcgaac acggcgaagc gctgctgaag atgcagtgct gcggtgtgtg ccacaccgac 120 ctgcacgtca aaaatggcga ctttggtgac aagaccgggg tagtactggg ccacgaaggt 180 attggcgtgg ttcaggaagt tggcccgggc gtcacctcgc tcaagccagg cgaccgagcc 240 agcgttgcct ggttctacca gggttgcgga cattgcgaat actgcaacag cggcaacgag 300 accctgtgcc gcgacgtgaa gaattccggt tacaccgtgg acggcggcat ggccgaggcc 360 tgcatcgtca aggccgacta ctcggttaaa gtgcccgacg gcctcgactc cgccgccgcc 420 agcagcatca cctgcgccgg cgtcacgacc tacaaggcag tgaaaatctc caacgtccgc 480 cccggccaat ggatcgccat ctacgggctc ggcggcctgg gcaacctggc cctgcaatat 540 gccaagaatg tgttcaacgc caaagtcatc gccatcgacg tcaacgaaga gcaactgcgc 600 ttcgccagcg agatgggcgc ggatctggtc gtcaacccgc tcaacgaaga tgccgcgaag 660 gtcatccagg ccaaaaccgg cggtgcacat gctgccgtcg ttactgctgt ggccaaaggc 720 gcgttcaact cggctgtcga tgccttgcgc gctggcgggc gactggtggc cgtcgggctt 780 ccgtcggagt ccatggacct gaatattccc cgcctggtgc ttgatgggat cgaagtggtg 840 ggctcgctgg taggtacacg ccaggacctg caggaagcct tccagtttgc cgctgaaggc 900 aaagtggtgc ccaaggtaac gctgcgaccg atcgaggata tcaaccagat ctttgacgag 960 atgctggagg gcaagatcaa aggccggatg gtgatacagt tcgaaggctg a 1011 <210> 94 <211> 1203 <212> DNA <213> Pseudomonas putida <400> 94 atgagagcag tctcctacca cggtgctaac gatgtgcggg tcgattctgt cccagacccc 60 atcctccaag acgcagacga catcatctta agggtgacgg ccaccgccat ctgcggatcc 120 gacctccacc tctatcgagg caagatcccg gaaacagagc aaggcgacat cttcggccac 180 gagttcatgg gcatcgtgga agaggttggc agggacgtga cgaccctgca ggttggcgac 240 cgagtggtga ttccttttgt catcgcttgt ggaagttgct ttttctgcca gcaggatctc 300 ttcgctgcct gtgaaaccac caataccggg cgcggatcga tcatcaacaa aaagggcata 360 ccaccaggcg cagcgctgtt cggatacagc catctgtatg gagggatccc tggaggccaa 420 gctgattacg ttagggtgcc caaaggcaat gtcgggccat tcaaagtccc gacgaccctc 480 gcggatgaca aagtgctgtt cctatccgac atccttccca ccgcttggca agcggtcatc 540 aatgccgaga ttggcgaagg ctcatcggta gcgatctatg gcgcggggcc agtggggctg 600 ttgagtgccg cctgcgcacg gatgctgggc gcgcacaccg tcttcatggt ggatgacaac 660 gactaccggc tggcctatgc ccaggaagcc tatggcgtca tcccgatcaa cttcgaaaag 720 gatgatgatc ctgccgacag catcattcgc cagacaccgg gtatgcgtgg cgtggacgcg 780 gtcatcgatg cggtcgggtt tgaagccaaa ggcagcacca cggaaaccgt gatgacggcc 840 ttgaaactgg agggtagcag cggcaaggcc ctgcgccaga gcatcgcggc tgtgcgacgt 900 ggcggcgtag tcagcgtgcc cggcgtctat gcagggttca ttcacggctt catgttcggt 960 gatgccttcg acaaaggcct gaccttcaag atgggtcaga cccatgttca aaaatacctt 1020 cccgaactgc tggagcacat cgaagcaggg cgcctgcaac cggaactgat cgttactcac 1080 cgcttagccc tagaagaggc ggccatgggc tacaaaatgt tcgatcaaaa gcaggataac 1140 tgccgcaagg tcatcctcgt gccaggtgct gcacccggca ccttgggccc tgaccacctc 1200 tag 1203 <210> 95 <211> 1011 <212> DNA <213> Pseudomonas putida <400> 95 atgagcagca aggccatcta cgtacaaccc ggcggcggct acgacaaggt cgaggtcggc 60 acctgcgagg cccaggcccc ccaggccggc gagattaccg tgcgcctgca cgccagttcc 120 ctcaactacc acgatttcgc cgtggtcagc ggcatgtggg gcccgagcga gcgacgcatc 180 ccaatggccg atggcgccgg cgaggtggtt gcggtggggg ctggcgtcac tgagttccag 240 gtcggcgaca atgtggtcag caccttcttc cccgactggc tcgatggcca ggccaatgtc 300 gagggcttcg ccagggtgcc cggcgacggc atcgatggct acgcccgtga gcaagtgact 360 gcccgcgcca ccgccttcac cctggcaccc cagggtttca gccatgccga ggctgccacc 420 ctgaccaccg ccggccttac cgcctggcgc gcgctgatga gcgacgatca cctcaagccc 480 ggcgacacgg tgctggtgca gggtaccggc ggtgtgtcga ttttcgccct gcagttcgcc 540 aagctggcgg gcgcgaccgt gatcgccacc tcgtccagcg atgccaagct ggagcgcctg 600 aaggccctgg gtgccgacca cctgatcaac tacaagagca ccccggcctg gggtgagaag 660 gtgcgcgagc tgactggcaa ccgtggtgtc gatcatgtga ttgaagtggg cggcccggcg 720 acgctggagc agtcgatgat tgctgcgcgc attggcgggc atgtttcgct gatcggcatc 780 cttaccgggg tggccgggca gttgccgctg gtgcaggcgc tggtgcggca gattcggctg 840 caaggggtgc tggttggcag ccgagcgcag cagcaggcga tggtacgggc gatcgatgcc 900 aacggcctgc ggccggtggt ggacaagcat ttcgaactgg aacagatcgt cgaggcgttc 960 cgttaccagg agagcaaccg gcatttcggc aagatctgcc tgacctggtg a 1011 <210> 96 <211> 978 <212> DNA <213> Pseudomonas putida <400> 96 atgaaagctg tgttgtgcaa aaccctgggt ccggcgcgca acctggtgct ggaagaggtg 60 gccagcccac tgccgaagaa gaacgagatc ctgctggacg tgcaagctgc cggggtcaac 120 ttccccgaca ccttgatcat cgaaggcaag taccagttcc agccgccgct gccgttctct 180 ccaggtggcg aggcagcggg cgtggtggcc gccgtcggcg aaaaggccgg cgcgttcaag 240 gtcggcgacc gggtcatggc gctcaccggc tggggtgcgt tcgccgagca agtggcggtg 300 ccgttctata acgttctgcc gatcccggcg agcatggact tcaccaccgc tgcggccttc 360 ggcatgacct acggcacctc gatgcacgcc ctgcgccagc gtggccagtt gcaagccggc 420 gagaccctgc tggtactggg cgcttccggc ggggtgggcc tggcggcggt ggagatcggc 480 aaggccatgg gcgcgcgggt gatcgcggcg gccagcagtg ccgagaaact ggccgtggcc 540 aaggctgccg gggcggatga gctgatcgac tacagccagg ccaacctgcg cgaagaaatc 600 aaacgcctga ccggtggcca gggcgtggac gtgatctatg acccggtcgg tggcgagctg 660 ttcgaacaag cggtgcgcgg gttggcctgg aatggcaggc tgctggtggt gggttttgcc 720 agtggcagca ttccacagct ggcggccaac ctggtgctgc tcaagggcgc ggcggtactg 780 ggcgtgttct ggggggcatt tgcccagcgc cagccggagg acaacgcggc caacttccac 840 cagctgtttg cctggcatgc cgagggcaag ttgaagccgc tggtgtcgca gacttatcca 900 ctggcagaag ccggggttgc tatcgagaag ctggggcaac ggcaggctgt gggtaagttg 960 gtggtgctgg ccaggtaa 978 <210> 97 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 97 catgccatgg ggatgacaat gccttatgta aagaaca 37 <210> 98 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 98 ctgcggtacc atagaagctc cgtga 25 <210> 99 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 99 tcacggagct tctatggtac cgcag 25 <210> 100 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 100 gctctagatt acgcctttcc gctggatccg aat 33 <210> 101 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 101 catgccatgg ggatgaggag tacagacagg ttactgt 37 <210> 102 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 102 tgcccacacc atcgcgaatg ttgaa 25 <210> 103 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 103 ttcaacattc gcgatggtgt gggca 25 <210> 104 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 104 gctctagatt acttctgacc gtacttggtg tgg 33 <210> 105 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 105 catgccatgg ggatgtggaa gcatgtaaaa caggttg 37 <210> 106 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 106 catgcttccc attgtttcta tgaca 25 <210> 107 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 107 tgtcatagaa acaatgggaa gcatg 25 <210> 108 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 108 caccggtgct ccgtgggtga gatgt 25 <210> 109 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 109 acatctcacc cacggagcac cggtg 25 <210> 110 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 110 gctctagatt atatttccac cccttcgatc ttg 33 <210> 111 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 111 catgccatgg ggatgataga gtacaggatt gaggagg 37 <210> 112 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 112 cacacagact ccgtggaaac gattt 25 <210> 113 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 113 aaatcgtttc cacggagtct gtgtg 25 <210> 114 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 114 gctctagatt aacctccata tctctcttct ccc 33 <210> 115 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 115 catgccatgg ggatgatcga tctcaggtcc gacaccg 37 <210> 116 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 116 agcctgtgcc atcgcttttc tcatc 25 <210> 117 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 117 gatgagaaaa gcgatggcac aggct 25 <210> 118 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 118 ttgatttccc attgtgccgg agggt 25 <210> 119 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 119 accctccggc acaatgggaa atcaa 25 <210> 120 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 120 gagaaccgcc atcgctccga cctcg 25 <210> 121 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 121 cgaggtcgga gcgatggcgg ttctc 25 <210> 122 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 122 atcggggtcc atcgctccat ttttt 25 <210> 123 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 123 aaaaaatgga gcgatggacc ccgat 25 <210> 124 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 124 gctctagatt aggagaattt tctgaagagt ttt 33 <210> 125 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 125 catgccatgg tttacacaac tccctggaac agaaag 36 <210> 126 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 126 gctctagatt acaacctttg ccagagtatc gcc 33 <210> 127 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 127 catgccatgg ggatgaagat ggaagagctc ttcaaaa 37 <210> 128 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 128 gctctagatt attctgtgca ccccctgatc ttt 33 <210> 129 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 129 catgccatgg ggatgacaat gccttatgta aagaaca 37 <210> 130 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 130 gctctagatt acgcctttcc gctggatccg aat 33 <210> 131 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 131 catgccatgg ggatgaggag tacagacagg ttactgt 37 <210> 132 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 132 gctctagatt acttctgacc gtacttggtg tgg 33 <210> 133 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 133 catgccatgg ggatgaagat ctttctggac acagcaa 37 <210> 134 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 134 gctctagatt atttcttcag gttctccaaa tac 33 <210> 135 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 135 catgccatgg ggatgatagt cgttttgaaa cccggtt 37 <210> 136 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 136 gctctagatt aattcacctt cacccccagg gca 33 <210> 137 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 137 catgccatgg ggatgtggaa gcatgtaaaa caggttg 37 <210> 138 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 138 gctctagatt atatttccac cccttcgatc ttg 33 <210> 139 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 139 catgccatgg ggatgagaga gacgataaga gagattc 37 <210> 140 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 140 gctctagatt acagccatcc ctccggaaca ccc 33 <210> 141 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 141 catgccatgg tcaaggtcct gatcctcggt c 31 <210> 142 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 142 gctctagatt acagccactt cggtttcaat ccc 33 <210> 143 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 143 catgccatgg ggatgttcag aggagtagga actgcta 37 <210> 144 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 144 gctctagatt atagcaatcc actctccttg aga 33 <210> 145 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 145 catgccatgg ggatgataga gtacaggatt gaggagg 37 <210> 146 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 146 gctctagatt aacctccata tctctcttct ccc 33 <210> 147 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 147 catgccatgg ggatgatcga tctcaggtcc gacaccg 37 <210> 148 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 148 gctctagatt aggagaattt tctgaagagt ttt 33 <210> 149 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 149 catgccatgg ggatggcaga tttagacgat attaaag 37 <210> 150 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 150 ctgaaaataa ccgtggtcaa aagcc 25 <210> 151 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 151 ggcttttgac cacggttatt ttcag 25 <210> 152 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 152 cagtcacggc catcgtcggc attccc 26 <210> 153 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 153 gggaatgccg acgatggccg tgactg 26 <210> 154 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 154 gctctagatt actgtttttc actcagatag 30 <210> 155 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 155 catgccatgg ggatgtacgt ggtatcgaca aag 33 <210> 156 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 156 gttctccagt ctcgaaaaat caagc 25 <210> 157 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 157 gcttgatttt tcgagactgg agaac 25 <210> 158 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 158 gctctagatt atgccctgcc ctcgcagc 28 <210> 159 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 159 catgccatgg ggatgaataa gtacaccatc aac 33 <210> 160 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 160 gaggatcacc cacggcatat tgatatg 27 <210> 161 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 161 catatcaata tgccgtgggt gatcctc 27 <210> 162 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 162 gctctagatt agcggcgttt agccatc 27 <210> 163 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 163 catgccatgg ggatgacgga caaattgacc tc 32 <210> 164 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 164 gctctagatt acagcagatc gccgatc 27 <210> 165 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 165 catgccatgg ggatggaact gtatctggat ac 32 <210> 166 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 166 gctctagatt aaatcgacgt tctgccaaac 30 <210> 167 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 167 catgccatgg ggatgattga tttacgcagt gatac 35 <210> 168 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 168 gctctagatt aacgcgccag gaatgcac 28 <210> 169 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 169 catgccatgg ggatggcaga tttagacgat attaaag 37 <210> 170 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 170 gctctagatt actgtttttc actcagatag 30 <210> 171 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 171 catgccatgg ggatgaaaaa ctggaaaaca ag 32 <210> 172 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 172 gctctagatt acagcttagc gccttctac 29 <210> 173 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 173 catgccatgg ggatgtacgt ggtatcgaca aag 33 <210> 174 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 174 gctctagatt atgccctgcc ctcgcagc 28 <210> 175 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 175 catgccatgg ggatgacaga tattgcgcag ttg 33 <210> 176 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 176 gctctagatc aggcgatagt aattttgc 28 <210> 177 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 177 catgccatgg ggatggcaca acctgccgct attattc 37 <210> 178 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 178 gctctagatt aacgctgcca gcttaagg 28 <210> 179 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 179 catgccatgg ggatgaacga gttagacggc atc 33 <210> 180 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 180 gctctagatt atagtttggc ggcaagaag 29 <210> 181 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 181 catgccatgg ggatggaacg aaataaactt gc 32 <210> 182 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 182 gctctagatt actcttcaat tcgtaacc 28 <210> 183 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 183 catgccatgg ggatgtctaa gatttttgat ttc 33 <210> 184 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 184 gctctagatt acagaacgtc gatcgcgttc 30 <210> 185 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 185 catgccatgg ggatggatat tgtatttata gag 33 <210> 186 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 186 gctctagatt aattattttc tttcagatta ttg 33 <210> 187 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 187 catgccatgg ggatgaataa cgatgttttc cc 32 <210> 188 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 188 gctctagatt attttttaaa ggtatcag 28 <210> 189 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 189 catgccatgg ggatgaaaca tctgacagaa atg 33 <210> 190 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 190 gctcatatat atatcctcct ttattggcct tcacaggctg tg 42 <210> 191 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 191 caataaagga ggatatatat atgagcatta tctccactaa atatc 45 <210> 192 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 192 gctctagatt atgctgaaat tcgattcg 28 <210> 193 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 193 catgccatgg ggatgaataa gtacaccatc aac 33 <210> 194 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 194 gctctagatt agcggcgttt agccatc 27 <210> 195 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 195 catgccatgg ggatgcaaaa cattactcag tc 32 <210> 196 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 196 gctctagatt acagcgccag cgcactgg 28 <210> 197 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 197 catgccatgg ggatggaact gtatctggac ac 32 <210> 198 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 198 gctctagatt agagatgagt agtgccaaat g 31 <210> 199 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 199 catgccatgg ggatgactga tctgaaagca ag 32 <210> 200 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 200 gctctagatt agtagctgct ggcgctc 27 <210> 201 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 201 cccgagctct taggaggatt agtcatggaa c 31 <210> 202 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 202 gctctagatt attttgaata atcgtagaaa cc 32 <210> 203 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 203 gctctagagg aggatatata tatgaaaaat tgtgtcatcg tc 42 <210> 204 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 204 aactgcagtt aattcaaccg ttcaatcacc 30 <210> 205 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 205 cgagctcagg aggatatata tatgaaaaat tgtgtcatcg tcagtg 46 <210> 206 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 206 ggttgaatta aggaggatat atatatgaat aaagacacac taatacctac 50 <210> 207 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 207 gtctttattc atatatatat cctccttaat tcaaccgttc aatcaccatc 50 <210> 208 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 208 cccaagctta gccggcaagt acacatcttc 30 <210> 209 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 209 cgagctcagg aggatatata tatgaaaaat tgtgtcatcg tcagtg 46 <210> 210 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 210 cccaagctta gccggcaagt acacatcttc 30 <210> 211 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 211 aaggaaaaaa gcggccgccc ctgaaccgac gaccgggtcg 40 <210> 212 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 212 cggggtacca cttttcatac tcccgccatt cag 33 <210> 213 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 213 cggggtaccg cggatacata tttgaatgta tttag 35 <210> 214 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 214 aaggaaaaaa gcggccgcgc ggatacatat ttgaatgtat ttag 44 <210> 215 <211> 1248 <212> DNA <213> Cuphea hookeriana <400> 215 atggtggctg ctgcagcaag ttccgcattc ttccctgttc cagccccggg agcctcccct 60 aaacccggga agttcggaaa ttggccctcg agcttgagcc cttccttcaa gcccaagtca 120 atccccaatg gcggatttca ggttaaggca aatgacagcg cccatccaaa ggctaacggt 180 tctgcagtta gtctaaagtc tggcagcctc aacactcagg aggacacttc gtcgtcccct 240 cctcctcgga ctttccttca ccagttgcct gattggagta ggcttctgac tgcaatcacg 300 accgtgttcg tgaaatctaa gaggcctgac atgcatgatc ggaaatccaa gaggcctgac 360 atgctggtgg actcgtttgg gttggagagt actgttcagg atgggctcgt gttccgacag 420 agtttttcga ttaggtctta tgaaataggc actgatcgaa cggcctctat agagacactt 480 atgaaccact tgcaggaaac atctctcaat cattgtaaga gtaccggtat tctccttgac 540 ggcttcggtc gtactcttga gatgtgtaaa agggacctca tttgggtggt aataaaaatg 600 cagatcaagg tgaatcgcta tccagcttgg ggcgatactg tcgagatcaa tacccggttc 660 tcccggttgg ggaaaatcgg tatgggtcgc gattggctaa taagtgattg caacacagga 720 gaaattcttg taagagctac gagcgcgtat gccatgatga atcaaaagac gagaagactc 780 tcaaaacttc catacgaggt tcaccaggag atagtgcctc tttttgtcga ctctcctgtc 840 attgaagaca gtgatctgaa agtgcataag tttaaagtga agactggtga ttccattcaa 900 aagggtctaa ctccggggtg gaatgacttg gatgtcaatc agcacgtaag caacgtgaag 960 tacattgggt ggattctcga gagtatgcca acagaagttt tggagaccca ggagctatgc 1020 tctctcgccc ttgaatatag gcgggaatgc ggaagggaca gtgtgctgga gtccgtgacc 1080 gctatggatc cctcaaaagt tggagtccgt tctcagtacc agcaccttct gcggcttgag 1140 gatgggactg ctatcgtgaa cggtgcaact gagtggcggc cgaagaatgc aggagctaac 1200 ggggcgatat caacgggaaa gacttcaaat ggaaactcgg tctcttag 1248 <210> 216 <211> 1260 <212> DNA <213> Cuphea lanceolata <400> 216 atggtggctg ctgcagcaac ttctgcattc ttccccgttc cagccccggg aacctcccct 60 aaacccggga agtccggcaa ctggccatcg agcttgagcc ctaccttcaa gcccaagtca 120 atccccaatg ctggatttca ggttaaggca aatgccagtg cccatcctaa ggctaacggt 180 tctgcagtaa atctaaagtc tggcagcctc aacactcagg aggacacttc gtcgtcccct 240 cctccccggg ctttccttaa ccagttgcct gattggagta tgcttctgac tgcaatcacg 300 accgtcttcg tggcggcaga gaagcagtgg actatgcttg ataggaaatc taagaggcct 360 gacatgctcg tggactcggt tgggttgaag agtattgttc gggatgggct cgtgtccaga 420 cagagttttt tgattagatc ttatgaaata ggcgctgatc gaacagcctc tatagagacg 480 ctgatgaacc acttgcagga aacatctatc aatcattgta agagtttggg tcttctcaat 540 gacggctttg gtcgtactcc tgggatgtgt aaaaacgacc tcatttgggt gcttacaaaa 600 atgcagatca tggtgaatcg ctacccaact tggggcgata ctgttgagat caatacctgg 660 ttctctcagt cggggaaaat cggtatggct agcgattggc taataagtga ttgcaacaca 720 ggagaaattc ttataagagc aacgagcgtg tgggctatga tgaatcaaaa gacgagaaga 780 ttctcaagac ttccatacga ggttcgccag gagttaacac ctcattttgt ggactctcct 840 catgtcattg aagacaatga tcagaaattg cataagtttg atgtgaagac tggtgattcc 900 attcgcaagg gtctaactcc gaggtggaat gacttggatg tgaatcagca cgtaagcaac 960 gtgaagtaca ttgggtggat tctcgagagt atgccaatag aagttttgga gacccaggag 1020 ctatgctctc tcaccgttga atataggcgg gaatgcggaa tggacagtgt gctggagtcc 1080 gtgactgctg tggatccctc agaaaatgga ggccggtctc agtacaagca ccttttgcgg 1140 cttgaggatg ggactgatat cgtgaagagc agaactgagt ggcgaccgaa gaatgcagga 1200 actaacgggg cgatatcaac atcaacagca aagacttcaa atggaaactc ggcctcttag 1260 1260 <210> 217 <211> 1617 <212> DNA <213> Cuphea lanceolata <400> 217 atggcggcgg cctcttccat ggctgcgtca ccgttctgta cgtggctcgt agctgcttgc 60 atgtccactt ccttcgaaaa caacccacgt tcgccctcca tcaagcgtct cccccgccgg 120 aggagggttc tctcccattg ctccctccgt ggatccacct tccaatgcct cgtcacctca 180 cacatcgacc cttgcaatca gaactgctcc tccgactccc ttagcttcat cggggttaac 240 ggattcggat ccaagccatt ccggtccaat cgcggccacc ggaggctcgg ccgtgcttcc 300 cattccgggg aggccatggc tgtggctctg caacctgcac aggaagtcgc cacgaagaag 360 aaacctgcta tcaagcaaag gcgagtagtt gttacaggaa tgggtgtggt gactcctcta 420 ggccatgaac ctgatgtttt ctacaacaat ctcctagatg gagtaagcgg cataagtgag 480 atagagaact tcgacagcac tcagtttccc acgagaattg ccggagagat caagtctttt 540 tccacagatg gctgggtggc cccaaagctc tccaagagga tggacaagct catgctttac 600 ttgttgactg ctggcaagaa agcattagca gatgctggaa tcaccgatga tgtgatgaaa 660 gagcttgata aaagaaagtg tggagttctc attggctccg gaatgggcgg catgaagttg 720 ttctacgatg cgcttgaagc cctgaaaatc tcttacagga agatgaaccc tttttgtgta 780 ccttttgcca ccacaaatat gggatcagct atgcttgcaa tggatctggg atggatgggt 840 ccaaactact ctatttcaac tgcctgtgca acaagtaatt tctgtatact gaatgctgca 900 aaccacataa tcagaggcga agctgacatg atgctttgtg gtggctcgga tgcggtcatt 960 atacctatcg gtttgggagg ttttgtggcg tgccgagctt tgtcacagag gaataatgac 1020 cctaccaaag cttcgagacc atgggatagt aatcgtgatg gatttgtaat gggcgaagga 1080 gctggagtgt tacttctcga ggagttagag catgcaaaga aaagaggtgc aaccatttat 1140 gcagaatttt tagggggcag tttcacttgc gatgcctacc acatgaccga gcctcaccct 1200 gaaggagctg gagtgatcct ctgcatagag aaggccatgg ctcaggccgg agtctctaga 1260 gaagatgtaa attacataaa tgcccatgca acttccactc ctgctggaga tatcaaagaa 1320 taccaagctc tcgcccactg tttcggccaa aacagcgagc tgagagtgaa ttccactaaa 1380 tcgatgatcg gtcatcttct tggagcagct ggtggcgtag aagcagttac tgtaattcag 1440 gcgataagga ctgggtggat ccatccaaat cttaatttgg aagacccgga caaagccgtg 1500 gatgcaaaat ttctcgtggg acctgagaag gagagactga atgtcaaggt cggtttgtcc 1560 aattcatttg ggttcggtgg gcataactcg tctatactct tcgcccctta caattag 1617 <210> 218 <211> 1641 <212> DNA <213> Cuphea lanceolata <400> 218 atgcctgccg cctcttccct gctcgcttcc cctctctgta cgtggctcct tgccgcctgc 60 atgtctacct ccttccaccc ctccgaccct cttccgcctt ccatctcctc tcctcgccga 120 cgcctctccc gccgccggat tctctcccaa tgcgccccac taccttctgc ttcctccgcc 180 ctccgcggat ccagtttcca taccctcgtc acctcttacc tcgcctgctt cgagccctgc 240 catgactact atacatccgc atccttgttc ggatccagac ccattcgcac cacccgcagg 300 caccggaggc tcaatcgagc ttccccttcc agggaggcaa tggccgtggc tctgcaacct 360 gaacaggaag ttaccacaaa gaagaagcca agtatcaaac agcggcgagt agttgtgact 420 ggaatgggtg tggtgactcc tctaggccat gaccctgatg ttttctacaa taatctgctt 480 gatggaacga gtggcataag cgagatagag acctttgatt gtgctcaatt tcctacgaga 540 attgctggag agatcaagtc tttctccaca gatggttggg tggccccgaa gctctctaag 600 aggatggaca agttcatgct atacatgctg accgctggca agaaagcatt aacagatggt 660 ggaatcaccg aagatgtgat gaaagagcta gataaaagaa aatgcggagt tctcattggc 720 tcagcaatgg gtggaatgaa ggtattcaat gatgccattg aagccctaag gatttcatat 780 aagaagatga atcccttttg tgtacctttc gctaccacaa atatgggatc agctatgctt 840 gcaatggact tgggatggat ggggcccaac tactcgatat ctactgcttg tgcaacgagt 900 aacttttgta taatgaatgc tgcgaaccat ataatcagag gcgaagcaga tgtgatgctt 960 tgcgggggct cagatgcggt aatcatacct attggtatgg gaggttttgt tgcatgccga 1020 gctttgtccc agagaaattc cgaccctact aaagcttcaa gaccatggga cagtaatcgt 1080 gatggatttg ttatggggga aggagctgga gtgctactac tagaggagtt ggagcatgca 1140 aagaaaagag gtgcgactat ttacgcagaa tttctaggtg ggagtttcac ttgcgatgcc 1200 taccacatga ccgagcctca ccctgatgga gctggagtga ttctctgcat agagaaggct 1260 ttggctcagt caggagtctc tagggaagac gtaaattaca taaatgccca tgccacatcc 1320 actccggctg gagatatcaa agagtaccaa gctcttatcc actgtttcgg ccaaaacaga 1380 gagttaaaag ttaattcaac caaatcaatg attggtcacc ttctcggagc agccggtggt 1440 gtggaagcag tttcagtagt tcaggcaata aggactgggt ggatccatcc gaatattaat 1500 ttggaaaacc cagatgaagg cgtggataca aaattgctcg tgggtcctaa gaaggagaga 1560 ctgaacgtta aggtcggttt gtctaattca tttgggtttg gtgggcacaa ctcgtccata 1620 ctcttcgccc cttacatcta g 1641 <210> 219 <211> 414 <212> DNA <213> Cuphea lanceolata <400> 219 atggcgtccg cagctcccgc ttcttcgatc tgcatcaaat ccgcctcctg ctcggctctg 60 gcgccgggta gaatctcgag cttgagatca gtctcactac ctgtcagtcg gaaaagcttc 120 ttctctcgca ggggttcgtt ctccctccga gtcaactgtc aggctaaacc agaaaccgtg 180 acaaaggtct gcaatatagt gaagaagcag ttggccttac cagacgactc tgatgtttcc 240 ggagtgtcca agttcagtgc tcttggagca gattctttgg acacggtgga gattgtcatg 300 ggactagagg aggagtttgg gatcagtgtg gaggaagaaa gtgcacagag catccagacc 360 gtccaagatg ccgccgatct catcgagaag ctcatggaga agaagggcca ttga 414 <210> 220 <211> 432 <212> DNA <213> Cuphea lanceolata <400> 220 atggctaccg ccgccgccgg atcttccctc atctgcatca agtccgcttc ctgctccctt 60 aaccgggctc aggtaccaag tggactttca agcctgagat ctgtctcgct acctatcagt 120 ggcaaaatct ttccctctct caggtcatcc aggggacctt tgagcttccg cgtctgctgt 180 caggctaagc aagaaaccgt aacgagggtc tgcgaaatag tcaagaagca gttggccttg 240 ccagaggact ctgaggttaa cggactgtca aagttctctg ctctcggtgc agactctttg 300 gacacggtgg agattgtcat gggactagag gaagagtttg ggatcagtgt ggaggaagag 360 agtgctcaga gcatccaaac cgtccaagac gctgcagatc tcatcgagaa gctcgttggg 420 aataagaaat aa 432 <210> 221 <211> 423 <212> DNA <213> Cuphea lanceolata <400> 221 atggcttccg cagctgccgg tgcttccatc tgcatcaagt ccgcctcctt ctcgcctctg 60 gcaccgggta gaatttcaag cttgagatct gtctcattac ctgtgagtcg gaaaagcttt 120 ccctctctca agtcatccaa gagttcgttc gctctccggg tcagctgtca ggctaaacca 180 gaaaccgtgg cgaaggtctg cggcatagtg aagaaacaat tggccttacc agacgactct 240 gaggttaatg gactatccaa gtttagtgct ctcggagcag attctctcga cacggtggag 300 attgtcatgg gactagagga ggaatttggg atcagcgtgg aggaagaaag tgcacagagc 360 atccagaccg tccaagatgc tgccgatctc atcgagaagc tcatggagaa gaagggccat 420 tga 423 <210> 222 <211> 420 <212> DNA <213> Cuphea lanceolata <400> 222 atggcttccg cagctgccgg tgcttccatc tgcatcaagt ccgcctcctg ctcgcctctg 60 gcaccgggta gaatttcaag cttgagatca gtctcattac ctgtgagtcg gaaaagcttt 120 ccctctctca ggtcatccaa gggttcgttt gcccgggtca gctgtcaggc taaaccagaa 180 accgtggcga aggtctgccg catagtgaag aaacaattgg ccttaccaga cgactctgag 240 gttaatggac tatccaagtt tagtgctctc ggagcagatt ctctcgacac ggtggagatt 300 gtcatgggac tagaggagga atttgggatc agcgtggagg aagaaagtgc acagagcatc 360 cagaccgtcc aagatgctgc cgatctcatc gagaagctca tggagaagaa gggccattga 420 420 <210> 223 <211> 8 <212> PRT <213> Eschericia coli DH10B <220> <221> VARIANT <222> (1) <223> Xaa = Asp, Gly, or His <220> <221> VARIANT <222> (2) <223> Xaa = Ile, Val, Ser, Ala, or Cys <220> <221> VARIANT <222> (4) <223> Xaa = Ser or Thr <220> <221> VARIANT <222> (7) <223> Xaa = Ser, Thr, or Ala <220> <221> VARIANT <222> (8) <223> Xaa = Leu, Ile, Val, Met, or Phe <400> 223 Xaa Xaa Thr Xaa Asn Pro Xaa Xaa 1 5 <210> 224 <211> 18 <212> PRT <213> Eschericia coli DH10B <220> <221> VARIANT <222> (1) <223> Xaa = Leu, Ile, Val, Met, or Ala <220> <221> VARIANT <222> (2) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (3) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (5) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (6) <223> Xaa = Pro, Ala, or Ser <220> <221> VARIANT <222> (7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Ser, Thr, or Cys <220> <221> VARIANT <222> (9) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (10) <223> Xaa = Asp, Glu, Asn, Gln, Pro, Ala, or Ser <220> <221> VARIANT <222> (11) <223> Xaa = Gly or Cys <220> <221> VARIANT <222> (12) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (13) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (14) <223> Xaa = Ala, Gly, or Val <220> <221> VARIANT <222> (15) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (16) <223> Xaa = Gln, Glu, Lys, Arg, Ser, Thr, or His <220> <221> VARIANT <222> (17) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (18) <223> Xaa = Leu, Ile, Val, Met, or Phe <400> 224 Xaa Xaa Xaa Lys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa <210> 225 <211> 10 <212> PRT <213> Escherichia coli DH10B <220> <221> VARIANT <222> (2) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (3)..(5) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (7) <223> Xaa = Leu, Ile, or Val <220> <221> VARIANT <222> (9) <223> Xaa = Leu or Phe <400> 225 Gly Xaa Xaa Xaa Xaa Glu Xaa Thr Xaa Arg 1 5 10 <210> 226 <211> 14 <212> PRT <213> Escherichia coli DH10B <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (5) <223> Xaa = Leu, Ile, Val, Met, or Phe <220> <221> VARIANT <222> (7) <223> Xaa = Leu or Phe <220> <221> VARIANT <222> (10) <223> Xaa = Ser or Ala <220> <221> VARIANT <222> (11)..(13) <223> Xaa = Any amino acid <400> 226 Gly Xaa Xaa Xaa Xaa Lys Xaa Phe Pro Xaa Xaa Xaa Xaa Gly 1 5 10 <210> 227 <211> 12 <212> PRT <213> Escherichia coli <220> <221> VARIANT <222> (1) <223> Xaa = Phe, Tyr, Val, Met, or Thr <220> <221> VARIANT <222> (2) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (3) <223> Xaa = Leu, Ile, Val, Met, or His <220> <221> VARIANT <222> (4) <223> Xaa = Ala, Pro, Asn, or Thr <220> <221> VARIANT <222> (5) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (6) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (7) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (9) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (12) <223> Xaa = Gly, Ala, Cys, or His <400> 227 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa 1 5 10 <210> 228 <211> 12 <212> PRT <213> Escherichia coli DH10B <220> <221> VARIANT <222> (1) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (3) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (5) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (9) <223> Xaa = Gly or Met <220> <221> VARIANT <222> (10) <223> Xaa = Gly, Ser, Thr, or Ala <220> <221> VARIANT <222> (11) <223> Xaa = Any amino acid <400> 228 Xaa Glu Xaa Glu Xaa Gly Xaa Xaa Xaa Xaa Xaa Glu 1 5 10 <210> 229 <211> 9 <212> PRT <213> Escherichia coli DH10B <400> 229 Asp Ala Thr Thr Asn Pro Ser Leu Ile 1 5 <210> 230 <211> 18 <212> PRT <213> Escherichia coli DH10B <400> 230 Ile Leu Ile Lys Leu Ala Ser Thr Trp Gln Gly Ile Arg Ala Ala Glu 1 5 10 15 Gln Leu <210> 231 <211> 9 <212> PRT <213> Escherichia coli DH10B <400> 231 Gly Val Thr Thr Asn Pro Ser Ile Ile 1 5 <210> 232 <211> 17 <212> PRT <213> Escherichia coli DH10B <400> 232 Ile Val Val Lys Val Pro Val Thr Ala Glu Gly Leu Ala Ala Ile Lys 1 5 10 15 Met <210> 233 <211> 9 <212> PRT <213> Escherichia coli DH10B <400> 233 Asp Ala Thr Thr Asn Pro Ser Leu Leu 1 5 <210> 234 <211> 18 <212> PRT <213> Escherichia coli DH10B <400> 234 Ile Leu Ile Lys Leu Ala Ser Thr Trp Glu Gly Ile Arg Ala Ala Glu 1 5 10 15 Glu Leu <210> 235 <211> 9 <212> PRT <213> Escherichia coli DH10B <400> 235 Gly Val Thr Thr Asn Pro Ser Ile Ile 1 5 <210> 236 <211> 17 <212> PRT <213> Escherichia coli DH10B <400> 236 Ile Val Val Lys Ile Pro Val Thr Ser Glu Gly Leu Ala Ala Ile Lys 1 5 10 15 Ile <210> 237 <211> 10 <212> PRT <213> Escherichia coli DH10B <400> 237 Gly Val Arg Val Leu Glu Val Thr Leu Arg 1 5 10 <210> 238 <211> 14 <212> PRT <213> Escherichia coli DH10B <400> 238 Gly Leu Lys Glu Phe Lys Phe Phe Pro Ala Glu Ala Asn Gly 1 5 10 <210> 239 <211> 12 <212> PRT <213> Escherichia coli DH10B <400> 239 Tyr His His Pro Leu Ala Ile His Leu Asp His His 1 5 10 <210> 240 <211> 12 <212> PRT <213> Escherichia coli DH10B <400> 240 Val Glu Ala Glu Leu Gly Gln Leu Gly Gly Gln Glu 1 5 10 <210> 241 <211> 12 <212> PRT <213> Escherichia coli DH10B <400> 241 Tyr Gly Val Pro Val Ile Leu His Thr Asp His Cys 1 5 10 <210> 242 <211> 11 <212> PRT <213> Escherichia coli DH10B <400> 242 Leu Glu Ile Glu Leu Gly Cys Thr Gly Gly Glu 1 5 10 <210> 243 <211> 14 <212> PRT <213> Escherichia coli DH10B <400> 243 Thr Thr Tyr Asn Met Pro Leu Ala Leu His Leu Asp His His 1 5 10 <210> 244 <211> 12 <212> PRT <213> Escherichia coli DH10B <400> 244 Val Glu Ala Glu Leu Gly Arg Leu Gly Gly Val Glu 1 5 10 <210> 245 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (5) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (6) <223> Xaa = Ala, Gly, or Ser <400> 245 Xaa Xaa Gly Gly Xaa Xaa 1 5 <210> 246 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (6) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (7) <223> Xaa = Ala, Gly, or Ser <400> 246 Xaa Xaa Xaa Gly Gly Xaa Xaa 1 5 <210> 247 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Ala, Gly, or Ser <400> 247 Xaa Xaa Xaa Xaa Gly Gly Xaa Xaa 1 5 <210> 248 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (4) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (5) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (6) <223> Xaa = Ala, Gly, or Ser <400> 248 Xaa Xaa Gly Xaa Xaa Xaa 1 5 <210> 249 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (6) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Ala, Gly, or Ser <400> 249 Xaa Xaa Xaa Gly Gly Xaa Xaa Xaa 1 5 <210> 250 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (6)..(7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Ala, Gly, or Ser <400> 250 Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa 1 5 <210> 251 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (4) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (5) <223> Xaa = Ala, Gly, or Ser <400> 251 Xaa Xaa Gly Xaa Xaa 1 5 <210> 252 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (5) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (6) <223> Xaa = Ala, Gly, or Ser <400> 252 Xaa Xaa Xaa Gly Xaa Xaa 1 5 <210> 253 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (6) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (7) <223> Xaa = Ala, Gly, or Ser <400> 253 Xaa Xaa Xaa Xaa Gly Xaa Xaa 1 5 <210> 254 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(5) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Ala, Gly, or Ser <400> 254 Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa 1 5 <210> 255 <211> 17 <212> PRT <213> Escherichia coli DH10B <220> <221> VARIANT <222> (1) <223> Xaa = Leu, Ile, Val, Met, or Ala <220> <221> VARIANT <222> (2) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (3) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (5) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (6) <223> Xaa = Pro, Ala, or Ser <220> <221> VARIANT <222> (7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Ser, Thr, or Cys <220> <221> VARIANT <222> (9) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (10) <223> Xaa = Asp, Glu, Asn, Gln, Pro, Ala, or Ser <220> <221> VARIANT <222> (11) <223> Xaa = Gly or Cys <220> <221> VARIANT <222> (12) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (13) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (14) <223> Xaa = Ala, Gly, or Val <220> <221> VARIANT <222> (15) <223> Xaa = Gln, Glu, Lys, Arg, Ser, Thr, or His <220> <221> VARIANT <222> (16) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (17) <223> Xaa = Leu, Ile, Val, Met, or Phe <400> 255 Xaa Xaa Xaa Lys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa <210> 256 <211> 13 <212> PRT <213> Escherichia coli <220> <221> VARIANT <222> (1) <223> Xaa = Phe, Tyr, Val, Met, or Thr <220> <221> VARIANT <222> (2) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (3) <223> Xaa = Leu, Ile, Val, Met, or His <220> <221> VARIANT <222> (4) <223> Xaa = Ala, Pro, Asn, or Thr <220> <221> VARIANT <222> (5) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (6)..(7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (10) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (13) <223> Xaa = Gly, Ala, Cys, or His <400> 256 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa 1 5 10 <210> 257 <211> 13 <212> PRT <213> Escherichia coli <220> <221> VARIANT <222> (1) <223> Xaa = Phe, Tyr, Val, Met, or Thr <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (4) <223> Xaa = Leu, Ile, Val, Met, or His <220> <221> VARIANT <222> (5) <223> Xaa = Ala, Pro, Asn, or Thr <220> <221> VARIANT <222> (6) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (7) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (8) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (10) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (13) <223> Xaa = Gly, Ala, Cys, or His <400> 257 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa 1 5 10 <210> 258 <211> 14 <212> PRT <213> Escherichia coli <220> <221> VARIANT <222> (1) <223> Xaa = Phe, Tyr, Val, Met, or Thr <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (4) <223> Xaa = Leu, Ile, Val, Met, or His <220> <221> VARIANT <222> (5) <223> Xaa = Ala, Pro, Asn, or Thr <220> <221> VARIANT <222> (6) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (7)..(8) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (9) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (11) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (14) <223> Xaa = Gly, Ala, Cys, or His <400> 258 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa 1 5 10 <210> 259 <211> 14 <212> PRT <213> Escherichia coli <220> <221> VARIANT <222> (1) <223> Xaa = Phe, Tyr, Val, Met, or Thr <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (5) <223> Xaa = Leu, Ile, Val, Met, or His <220> <221> VARIANT <222> (6) <223> Xaa = Ala, Pro, Asn, or Thr <220> <221> VARIANT <222> (7) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (8) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (9) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (11) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (14) <223> Xaa = Gly, Ala, Cys, or His <400> 259 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa 1 5 10 <210> 260 <211> 15 <212> PRT <213> Escherichia coli <220> <221> VARIANT <222> (1) <223> Xaa = Phe, Tyr, Val, Met, or Thr <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (5) <223> Xaa = Leu, Ile, Val, Met, or His <220> <221> VARIANT <222> (6) <223> Xaa = Ala, Pro, Asn, or Thr <220> <221> VARIANT <222> (7) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (8)..(9) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (10) <223> Xaa = Leu, Ile, Val, or Met <220> <221> VARIANT <222> (12) <223> Xaa = Any amino acid <220> <221> VARIANT <222> (15) <223> Xaa = Gly, Ala, Cys, or His <400> 260 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Asp His Xaa 1 5 10 15

Claims (49)

  1. 알데히드, 케톤 또는 둘 다의 근원을 가진 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생산하는 방법이며, 상기 재조합 미생물이 (i) 알돌라제 활성을 갖는 폴리펩티드를 인코딩하고 발현하는 적어도 하나의 폴리뉴클레오티드; 및 (ii)알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩하고 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하고, 상기 폴리뉴클레오티드의 적어도 하나는 외인성이어서 범용화학제품 또는 그의 중 간체를 생성하는 방법.
  2. 제 1항에 있어서, 범용화학제품 또는 그의 중간체가 하기의 화학식으로부터 선택되는 방법:
    Figure pct00016

    상기 식에서, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고; 또한
    R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
    n은 0 내지 30이다.
  3. 제 1항에 있어서, 범용화학제품은 추가로 효소학적 또는 화학적으로 그의 상응하는 알칸으로 전환되는 방법.
  4. 제 1항에 있어서, 범용화학제품이 3-하이드록시-2,2,4 트리메틸펜타날 및 2,2,4-트리메틸-1,3-펜탄디올로 이루어진 그룹으로부터 선택되는 방법.
  5. 제 4항에 있어서, 상기의 2,2,4-트리메틸-1,3-펜탄디올이 추가로 효소학적으로 또는 화학적으로 2,2,4-트리메틸펜탄으로 전환되는 방법.
  6. 제 1항에 있어서, 범용화학제품이 3-하이드록시-2-에틸헥사날, 2-에틸-2-헥센-1-알, 2-에틸헥사날, 및 2-에틸헥사놀로 이루어진 그룹으로부터 선택되는 방법.
  7. 제 6항에 있어서, 2-에틸헥사놀이 추가로 효소학적으로 또는 화학적으로 2-에틸헥산으로 전환되는 방법.
  8. 제 1항에 있어서, 범용화학제품이 3-하이드록시-2-부틸-1-옥타놀, 2-부틸-2- 옥텐-1-알, 2-부틸-옥타날, 및 2-부틸-옥타놀로 이루어진 그룹으로부터 선택되는 방법.
  9. 제 8항에 있어서, 2-부틸-옥타놀이 추가로 효소학적으로 또는 화학적으로 2-부틸-옥탄으로 전환되는 방법.
  10. 제 1항에 있어서, 알데히드, 케톤 또는 둘 다의 근원이 재조합 미생물이고 이들 미생물이 아세토알데히드, 프로피온안데히드, 글루타르알데히드, 부틸알데히드, 이소부틸알데히드, 2-메틸-부틸알데히드, 3-메틸-부틸알데히드, 4-메틸펜타알데히드, 헥사나알데히드, 옥타나알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드로 부터 선택되는 알데히드 및/또는 케톤 생합성 경로 및 숙시네이트 4-하이드록시페닐 아세트알데히드 생합성 경로 및 그의 조합을 포함하는 방법.
  11. 제 10항에 있어서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물이 제 1항의 재조합 미생물과 동일한 것인 방법.
  12. 제 10항에 있어서, 알데히드 및/또는 케톤 생합성 경로를 포함하는 재조합 미생물이 제 1항의 재조합 미생물과 상이한 것인 방법.
  13. 제 10항에 있어서, 알데히드 및/또는 케톤 생합성 경로가 이소부틸알데히드 생합성 경로를 포함하고, 여기서 상기 알데히드가 이소부틸알데히드인 방법.
  14. 제 10항에 있어서, 알데히드 및/또는 케톤 생합성 경로가 부틸알데히드 생합성 경로를 포함하고, 여기서 상기 알데히드가 부틸알데히드인 방법.
  15. 제 1항에 있어서, 알돌라제 활성을 가지는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i) SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열 또는 (ii)중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 방법.
  16. 제 1항에 있어서, 알돌라제 활성을 갖는 폴리펩티드가 SEQ ID NOS:223-244, 255-260으로 나타낸 아미노산 서열로부터 선택되는 적어도 하나의 생물학적으로 활성이 있는 모티프를 포함하는 방법.
  17. 제 1항에 있어서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딘 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i) SEQ ID NOS: 1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 방법.
  18. 제 1항에 있어서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드가 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드 (NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NADP+), 또는 NADPH 결합 모티프를 포함하는 방법.
  19. 제 18항에 있어서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프가 Y-X- G-G-X-Y (SEQ ID NO:245), Y-X-X-G-G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X- Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X-G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y-X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X- X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택되고; 여기서 Y는 알라닌, 글리신, 및 세린으로부터 독립적으로 선택되고, 여기서 G는 글리신이고, 또한 X는 유전적으로 인코딩된 아미노산으로부터 독립적으로 선택되는 방법.
  20. 제 1항에 있어서, 상기 재조합 미생물은 추가로 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하는 방법.
  21. 제 20항에 있어서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i)SEQ ID NOS:35-50으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii)중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:35-50으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 방법.
  22. (i)알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및 (ii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하는 재조합 미생물.
  23. 제 22항에 있어서, 상기 미생물이 알데히드, 케톤 또는 둘 다의 근원을 범용화학제품 또는 그의 중간체로 전환시킬 수 있으며, 여기서 상기 범용화학제품 또는 그의 중간체는 하기의 화학식으로부터 선택되는 재조합 미생물:
    Figure pct00017

    상기 식에서, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
    R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
    n은 0 내지 30이다.
  24. 제 22항에 있어서, (iii)알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함하는 재조합 미생물.
  25. 제 24항에 있어서, 상기 미생물이 적합한 단당류 또는 적합한 올리고당을 범용화학제품 또는 그의 중간체로 전환시킬 수 있으며, 여기서 범용화학제품 또는 그의 중간체는 하기의 화학식으로부터 선택되는 방법:
    Figure pct00018

    상기 식에서, R1은 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, 및 CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고;
    R2는 H, CH3, CH3CH2, CH3CH(CH3), CH3(CH2)nCH2, CH3CH(CH3)(CH2)nCH2, CH3CH2CH(CH3)(CH2)nCH2로 이루어진 그룹으로부터 선택되고, 또한
    n은 0 내지 30이다.
  26. 제 22항에 있어서, 알데히드 및/또는 케톤 생합성 경로를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드는 아세토알데히드, 프로피온알데히드, 글루타르알데히드, 부티르알데히드, 이소부티르알데히드, 2-메틸-부티르알데히드, 3-메틸-부타르알데히드, 4-메틸펜타알데히드, 헥산알데히드, 옥탄알데히드, 페닐아세토알데히드, 2-페닐 아세토알데히드, 2-(4-하이드록시페닐) 아세토알데히드, 2-인돌-3-아세토알데히드, 5-아미노-펜타알데히드, 숙시네이트 세미알데히드로부터 선택되는 경로 및 숙시네이트 4-하이드록시페닐 아세트알데히드 생합성 경로, 및 그의 조합으로부터 선택된 경로를 포함하는 재조합 미생물.
  27. 제 26항에 있어서, 알데히드 및/또는 케톤 생합성 경로는 이소부틸알데히드 생합성 경로를 포함하고 여기서 알데히드는 이소부틸알데히드인 재조합 미생물.
  28. 제 6항에 있어서, 알데히드 및/또는 케톤 생합성 경로는 부틸알데히드 생합성 경로를 포함하고 여기서 알데히드는 부틸알데히드인 재조합 미생물.
  29. 제 6항에 있어서, 알데히드 및/또는 케톤 생합성 경로는 헥산알데히드 생합성 경로를 포함하고 여기서 알데히드는 헥산알데히드인 재조합 미생물.
  30. 제 22항에 있어서, 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i)SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii)중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:51-82로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체을 포함하는 재조합 미생물.
  31. 제 22항에 있어서, 알돌라제 활성을 갖는 폴리펩티드가 SEQ ID NOS:223-244, 255-260으로 나타낸 아미노산 서열로부터 선택된 적어도 하나의 생물학적으로 활성이 있는 모티프를 포함하는 재조합 미생물.
  32. 제 22항에 있어서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i) SEQ ID NOS: 1 , 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:1, 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 30, 31 , 33, 또는 83-96으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 재조합 미생물.
  33. 제 22항에 있어서, 알코올 디하이드로게나제 활성을 갖는 폴리펩티드가 적어도 하나의 니코틴아미드 아데닌 디뉴클레오티드 (NAD+), NADH, 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NADP+), 또는 NADPH 결합 모티프를 포함하는 재조합 미생물.
  34. 제 33항에 있어서, NAD+, NADH, NADP+, 또는 NADPH 결합 모티프가 Y-X-G-G-X-Y (SEQ ID NO:245), Y-X-X-G-G-X-Y (SEQ ID NO:246), Y-X-X-X-G-G-X-Y (SEQ ID NO:247), Y-X-G-X-X-Y (SEQ ID NO:248), Y-X-X-G-G-X-X-Y (SEQ ID NO:249), Y-X-X-X-G-X-X-Y (SEQ ID NO:250), Y-X- G-X-Y (SEQ ID NO:251 ), Y-X-X-G-X-Y (SEQ ID NO:252), Y-X-X-X-G-X-Y (SEQ ID NO:253), and Y-X-X-X-X-G-X-Y (SEQ ID NO:254)로 이루어진 그룹으로부터 선택되고;
    여기서, Y는 알라닌, 글리신, 및 세린으로부터 독립적으로 선택되고,
    G는 글리신이고 또한
    X는 유전학적으로 인코딩된 아미노산으로부터 독립적으로 선택되는 재조합 미생물.
  35. 제 22항에 있어서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드 및/또는 디하이드라타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함하는 재조합 미생물.
  36. 제 35항에 있어서, 이중 결합 리덕타제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드가 (i) SEQ ID NOS:35-50으로 나타낸 뉴클레오티드 서열에 적어도 80%, 90%, 95%, 98%, 또는 99% 동일한 뉴클레오티드 서열, 또는 (ii) 중간 스트린전시(stringency)의 조건하에서 SEQ ID NOS:35-50으로 나타낸 적어도 하나의 뉴클레오티드 서열과 혼성화하는 뉴클레오티드 서열, 또는 그의 보체를 포함하는 재조합 미생물.
  37. 적합한 단당류 또는 올리고당 근원을 가지는 첫 번째 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생성하는 방법이며, 상기 첫 번째 재조합 미생물이 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드, 및 (iii) 상기 폴리뉴클레오티드의 적어도 하나가 외인성이어서 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하고 여기서 즉, 범용화학제품 또는 그의 중간체를 생산하는 방법.
  38. 제 37항에 있어서, 적합한 단당류 또는 올리고당의 근원이 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있는 두 번째 재조합 미생물을 포함하는 방법.
  39. 제 37항에 있어서, 바이오매스-유래 다당류가 알지네이트 및 펙틴으로부터 선택되는 방법.
  40. 바이오매스-유래 다당류로 재조합 미생물을 성장시킴을 포함하는 범용화학제품 또는 그의 중간체를 생성하는 방법이며, 여기서, 재조합 미생물은 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있고, 또한 상기 재조합 미생물은 (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드; 및 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하며, 상기 폴리뉴클레오티드의 적어도 하나가 외인성이어서 범용화학제품 또는 그의 중간체를 생성하는 방법.
  41. 제 40항에 있어서, 바이오매스-유래 다당류는 알지네이트 및 펙틴으로부터 선택되는 방법.
  42. (i) 알데히드 또는 케톤 생합성 경로, (ii) 알돌라제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드; 또한 (iii) 알코올 디하이드로게나제 활성을 갖는 폴리펩티드를 인코딩 및 발현하는 적어도 하나의 폴리뉴클레오티드를 포함하는 재조합 미생물.
  43. 제 42항에 있어서, 탄소의 유일한 근원으로서 바이오매스-유래 다당류에서 성장할 수 있는 재조합 미생물.
  44. 제 1항 내지 제 40항 중 어느 하나에 있어서, 아세토박터 아세티, 아크로모박터, 아시디필리움, 아시네토박터, 악티노마두라, 악티노플래인, 애로피룸 퍼닉스, 아그로박테리움, 알칼리진, 아나나스 코모수스(M), 아스로박터, 아스파질러스 니거, 아스파질러스 오리제, 아스파질러스 멜레우스, 아스파질러스 퍼브루엔투스, 아스파질러스 사이토이, 아스파질러스 소지, 아스파질러스 우사이이, 바실러스 알칼로필러스, 바실러스 아밀로리퀘파시엔스, 바실러스 브레비스, 바실러스 설쿠란스, 바실러스 클로시이, 바실러스 렌터스, 바실러스 리첸니포미스, 바실러스 마세란스, 바실러스 스티아로설모필러스, 바실러스 서브티리스, 비피도박테리움, 브레비바실러스 브레비스, 버크홀데리아 세파시아, 캔디다 실린드라세아, 캔디다 루고사, 칼리카 파파야 (L), 셀룰로시미크로비움, 세팔로스포리움, 채토미움 에라티쿰, 채토미움 그라사일, 클로스트리디움, 클로스트리디움 브티리쿰, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 설모셀룸, 코리네박테히움 (글루타미쿰), 코리네박테리움 에피시엔스, 이스체리키아 콜라이, 엔테로카쿠스, 어위나 크리산테미, 글리코노박터, 글루콘아세토박터, 할로아큘라, 휴미콜라 인솔엔스, 휴미콜라 엔솔렌스, 키타사토스포라 세태, 클렙실라, 클렙실라 옥시토카, 클루이브로마이세스, 클루이브로마이세스 플래길리스, 클루이브로마이세스 락티스, 코쿠리아, 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 세이크, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸오시티스, 메탄노로버스 시실리애, 메탄노게니움 오가노필룸, 메탄노박테리움 브라이언타이, 마이크로박테리움 임페리얼리, 마이크로코쿠스 라이소 데익티쿠스, 마이크로루나투스, 뮤콜자바니쿠스, 마이코박터, 마이로테시움, 나이트로박터, 나미트로소모나스, 노카디아, 파파야 카리카, 페디오코쿠스, 페디오코구스 할로필러스, 페니실리움, 페니실리움 카멤버티, 페니실리움 시트리넘, 페니실리움 에머소나이, 페니실리움 로퀘포티, 페니실리움 릴락티눔, 페니실리움 멀티컬러, 파라코쿠스 판토트로퍼스, 프로피온니박테리움, 수도모나스, 수도모나스 플루오레센스, 수도모나스 데니트리피칸스, 필오코쿠스, 필오코쿠스 퓨리오서스, 필오코쿠스 호리코사이, 리조비움, 리조뮤콜 미헤이, 리조뮤콜 퓨실루스 린트, 리조퍼스, 리조퍼스 델레마, 리조퍼스 자폰이쿠스, 리조퍼스 니비우스, 리조퍼스 오리재, 리조퍼스 올리고스포러스, 로도코쿠스, 사카로마이시스 세레비지애, 스클레로티나 리버티나, 스핑고박테리움 멀티보룸, 스핑고비움, 그핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이시스, 스트렙토마이시스 그리세우스, 스트렙토마이시스 리비단스, 스트렙토마이시스 무리누스, 스트렙토마이시스 루비기노수스, 스트렙토마이시스 바이오라세오루버, 스트렙토버티실리움 모바랜스, 테트라제노코쿠스, 서머스, 티오스패라 판토트로파, 트라미테스, 트리초더마, 트리초더마 롱지브라키아툼, 트리초더마 리에시이, 트리초더마 비리데, 트리초스포론 페니실라툼, 비브리오 알지노리티쿠스, 잔소모나스, 이스트, 자이고사카로마이시스 룩사이, 자이모모나스, 및 자이모모누스 모빌리스로부터 선택되는 재조합 미생물.
  45. 제 1항, 제 37항 또는 제 40항 중 어느 하나의 방법에 의하여 생산되는 범용화학제품.
  46. 제 45항의 범용화학제품 및 정제소에서 생성된 석유 산물을 포함하는 혼합된 범용화학제품.
  47. 제 46항에 있어서, 범용화학제품이 이소옥탄, 2-에틸헥산, 및 2-부틸-옥탄으로부터 선택되는 혼합된 범용화학제품.
  48. 제 46항에 있어서, 정제소에서 생성된 석유 산물이 가솔린, 제트 연료, 및 디젤 연료로부터 선택되는 혼합된 범용화학제품.
  49. (a)제 1항, 제 37항 또는 제 40항 중 어느 하나의 방법에 의하여 정제소에서 생산된 석유 산물을 범용화학제품과 혼합 및 정제소에서 생산된 석유 산물로 농축된 범용화학제품을 생산함을 포함하는 정제소에서 생산된 석유 산물로 강화된 범용화학제품을 생성하는 방법.


KR1020117015344A 2008-12-11 2009-12-11 범용화학제품의 생합성 KR20110098936A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12186908P 2008-12-11 2008-12-11
US61/121,869 2008-12-11

Publications (1)

Publication Number Publication Date
KR20110098936A true KR20110098936A (ko) 2011-09-02

Family

ID=42243347

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117015344A KR20110098936A (ko) 2008-12-11 2009-12-11 범용화학제품의 생합성

Country Status (12)

Country Link
US (3) US8003365B2 (ko)
EP (1) EP2361310A2 (ko)
JP (1) JP2012511908A (ko)
KR (1) KR20110098936A (ko)
CN (1) CN102245779A (ko)
AU (1) AU2009324462A1 (ko)
BR (1) BRPI0922437A2 (ko)
CA (1) CA2745220A1 (ko)
CL (1) CL2011001414A1 (ko)
MX (1) MX2011006081A (ko)
SG (1) SG172076A1 (ko)
WO (1) WO2010068921A2 (ko)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100242345A1 (en) 2006-05-19 2010-09-30 LS9, Inc Production of fatty acids & derivatives thereof
US8110670B2 (en) 2006-05-19 2012-02-07 Ls9, Inc. Enhanced production of fatty acid derivatives
US8110093B2 (en) * 2007-03-14 2012-02-07 Ls9, Inc. Process for producing low molecular weight hydrocarbons from renewable resources
US20090004715A1 (en) 2007-06-01 2009-01-01 Solazyme, Inc. Glycerol Feedstock Utilization for Oil-Based Fuel Manufacturing
CL2008002960A1 (es) 2007-10-04 2009-05-08 Bio Arch Lab Inc Método para producir 2-ceto-3-desoxi d-gluconato (kdg), basado en proporciopnar acido-desoxi l-eritro hexocelulosa uronico (dehu), y contactar dicha molecula con un microorganismo recombinante que codofica una dehu-hidrogenasa.
EP2415860A4 (en) * 2009-03-30 2012-09-05 Res Inst Innovative Tech Earth CORNEFORMED BACTERIUM TRANSFORMANT, AND METHOD FOR PRODUCING ISOBUTANOL USING THE SAME
EP2425007A4 (en) 2009-04-27 2013-01-02 Ls9 Inc PREPARATION OF FATTY ACID ESTERS
CA2801057C (en) 2010-05-28 2019-06-18 Solazyme, Inc. Tailored oils produced from recombinant heterotrophic microorganisms
FI122886B (fi) 2010-06-24 2012-08-31 Valtion Teknillinen Geneettisesti muokattuja sieniä ja niiden käyttö lipidituotannossa
CA3024641A1 (en) 2010-11-03 2012-05-10 Corbion Biotech, Inc. Microbial oils with lowered pour points, dielectric fluids produced therefrom, and related methods
MX351063B (es) 2011-02-02 2017-09-29 Terravia Holdings Inc Aceites adaptados producidos a partir de microorganismos oleaginosos recombinantes.
ES2744868T3 (es) 2012-04-18 2020-02-26 Corbion Biotech Inc Aceites hechos a medida
EP3052636A2 (en) 2013-10-04 2016-08-10 Solazyme, Inc. Tailored oils
ES2764273T3 (es) * 2014-07-10 2020-06-02 Corbion Biotech Inc Nuevos genes de cetoacil ACP sintasa y uso de los mismos
US11191519B2 (en) * 2014-08-05 2021-12-07 HABICO, Inc. Device, system, and method for hemispheric breast imaging
EP3180437A2 (en) * 2014-08-14 2017-06-21 Repsol, S.A. Process for production of branched chain alcohols
CA3025584A1 (en) * 2016-06-30 2018-01-04 Ardra Bio Inc. Methods and microorganisms for producing flavors and fragrance chemicals
CN110387360B (zh) * 2019-06-18 2021-12-28 华东理工大学 羟基类固醇脱氢酶及其在合成熊去氧胆酸前体中的应用
CN110423793B (zh) * 2019-08-28 2021-09-03 精晶药业股份有限公司 一种2-羟基-3-甲基-3-甲酰基丁酸的生物合成方法
WO2022057854A1 (zh) * 2020-09-16 2022-03-24 南京迈西可生物科技有限公司 病原体特异性核酸片段及其应用
CN114084957B (zh) * 2021-10-18 2023-10-20 暨南大学 一种提高异养硝化-好氧反硝化菌脱氮的方法
CN116376989B (zh) * 2022-04-11 2023-10-24 元素驱动(杭州)生物科技有限公司 一种制备酮酸的方法及该方法在制备氨基酸或氨基酸衍生物中的应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US5344771A (en) 1990-04-26 1994-09-06 Calgene, Inc. Plant thiosterases
US5298421A (en) 1990-04-26 1994-03-29 Calgene, Inc. Plant medium-chain-preferring acyl-ACP thioesterases and related methods
US5455167A (en) 1991-05-21 1995-10-03 Calgene Inc. Medium-chain thioesterases in plants
AU2002306849A1 (en) * 2001-03-21 2002-10-08 Elitra Pharmaceuticals, Inc. Identification of essential genes in microorganisms

Also Published As

Publication number Publication date
CN102245779A (zh) 2011-11-16
US20100185017A1 (en) 2010-07-22
WO2010068921A3 (en) 2010-10-14
US8137949B2 (en) 2012-03-20
CA2745220A1 (en) 2010-06-17
BRPI0922437A2 (pt) 2019-09-24
SG172076A1 (en) 2011-07-28
CL2011001414A1 (es) 2012-01-20
US20110287521A1 (en) 2011-11-24
MX2011006081A (es) 2011-06-24
US8003365B2 (en) 2011-08-23
EP2361310A2 (en) 2011-08-31
JP2012511908A (ja) 2012-05-31
US20120142081A1 (en) 2012-06-07
AU2009324462A1 (en) 2010-06-17
WO2010068921A2 (en) 2010-06-17

Similar Documents

Publication Publication Date Title
KR20110098936A (ko) 범용화학제품의 생합성
KR20100091162A (ko) 바이오연료 생산
KR20100119877A (ko) 단리된 알코올 디하이드로게나제 효소 및 이의 용도
CN102459570A (zh) 具有改善的阿拉伯糖利用率的发酵单胞菌属细菌
CN101680007A (zh) 使用高活性酮醇酸还原异构酶来发酵生产异丁醇
CN106795483A (zh) 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法
CN107771214A (zh) 用于具有增加的2,4‑二羟基丁酸外排物的优化的2,4‑二羟基丁酸产生的修饰的微生物
CN113710798A (zh) 戊糖和己糖的降解途径
CN101748069B (zh) 一种重组蓝藻
JP5243748B2 (ja) ブタノール生産能を有する形質転換体
CN117693588A (zh) 用于改进乙二醇的生物产生的微生物和方法
KR20240015166A (ko) 에틸렌 글리콜의 생물학적 생성을 개선하기 위한 미생물 및 방법
KR20240046579A (ko) 이소프레노이드 알코올 및 유도체의 생성을 위한 미생물 발효

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid