KR20100119877A - 단리된 알코올 디하이드로게나제 효소 및 이의 용도 - Google Patents

단리된 알코올 디하이드로게나제 효소 및 이의 용도 Download PDF

Info

Publication number
KR20100119877A
KR20100119877A KR1020107018703A KR20107018703A KR20100119877A KR 20100119877 A KR20100119877 A KR 20100119877A KR 1020107018703 A KR1020107018703 A KR 1020107018703A KR 20107018703 A KR20107018703 A KR 20107018703A KR 20100119877 A KR20100119877 A KR 20100119877A
Authority
KR
South Korea
Prior art keywords
ala
gly
val
leu
seq
Prior art date
Application number
KR1020107018703A
Other languages
English (en)
Inventor
유키 카시야마
Original Assignee
바이오 아키텍쳐 랩, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이오 아키텍쳐 랩, 인크. filed Critical 바이오 아키텍쳐 랩, 인크.
Publication of KR20100119877A publication Critical patent/KR20100119877A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/58Aldonic, ketoaldonic or saccharic acids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T50/00Aeronautics or air transport
    • Y02T50/60Efficient propulsion technologies, e.g. for aircraft
    • Y02T50/678Aviation using fuels of non-fossil origin

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 알코올 디하이드로게나제(ADH) 활성, 우로네이트, 4-데옥시-L-에리스로-5-헥소세울로스 우로네이트(DEHU) ((4S, 5S)-4,5 디하이드록시-2,6 디옥소헥사노에이트)하이드로게나제 활성, 2-케토-3-데옥시-D-글루코네이트 디하이드로게나제 활성, D-만누로네이트 하이드로게나제 활성, 및 /또는 D-만누로네이트 디하이드로게나제 활성과 같은 디하이드로게나제 활성을 갖는 폴리펩타이드인 박테리아 폴리뉴클레오타이드 및 폴리펩타이드를 제공한다. 본 발명은 또한, 바이오매스로부터 유도된 것과 같은 다당류를 적합한 단당류 또는 올리고당류로 전환하고, 상기 적합한 단당류 또는 올리고당류를 바이오연료와 같은 상업적 화학제품으로 전환하기 위한 방법, 효소, 재조합 미생물, 및 미생물 시스템을 제공한다. 더 나아가, 본 발명은 본원에 기술된 방법에 의해 생산된 상업적 화학제품을 또한 제공한다.

Description

단리된 알코올 디하이드로게나제 효소 및 이의 용도 {Isolated alcohol dehydrogenase enzymes and uses thereof}
우선권
본 출원은 그 전체로서 여기에 참조로서 포함되는, 2008년 1월 28일자 출원된 미국 가특허출원 제61/024,160호의 35 U.S.C. § 119(e) 하의 우선권을 주장한다.
서열목록에 대한 진술
본 출원과 관련된 서열목록은 서면 카피 대신에 텍스트 형식으로 제공되었고, 여기에 명세서로 참조로서 포함되었다. 서열목록이 포함된 텍스트 파일의 이름은 150097_402PC_SEQUENCE_LISTING.txt이다. 상기 텍스트 파일은 92 KB이며, 2009년 1월 28일에 작성되었고, EFS-Web을 통해 전자출원되었다.
기술분야
본 발명의 구현예들은, 일반적으로, 알코올 디하이드로게나제(ADH)활성, 우로네이트(uronate), 4-데옥시-L-에리스로-5-헥소세울로스 우로네이트(DEHU), ((4S,5S)-4,5 디하이드록시-2,6-디옥소헥사노에이트) 하이드로게나제 활성, 2-케토-3-디옥시-D-글루코네이트 디하이드로게나제 활성, D-만누로네이트(D-mannuronate) 하이드로게나제 활성 및/또는 D-만누로네이트 디하이드로게나제 활성과 같은 디하이드로게나제 활성(dehydrogenase activity)을 갖는, 단리된 폴리펩타이드(isolated polypeptide) 및 이것을 코딩하는 폴리뉴클레오타이드에 관한 것이며, 또한 이러한 폴리뉴클레오타이드 및 폴리펩타이드를 포함하여 바이오매스를 바이오연료 등의 상업적 화학물질로 전환하는 화학적 시스템, 재조합 미생물 및 미생물 시스템의 용도에 관한 것이다.
바이오매스를 바이오연료로 전환하는 최근의 방법은 리그노셀룰로릭(lignocellulolic) 바이오연료의 사용에 초점이 있으며 또한 이 방법의 사용과 관련하여 많은 문제점들이 있다. 리그노셀룰로릭 바이오연료의 대규모 배양은 상당량의 배양 면적을 필요로 하는데, 이는 식품작물 생산을 에너지작물 생산 및 삼림파괴(deforrestation)로 대체함으로써 또한 현재 미배양된 배양지(land)를 재배양함으로써 달성할 수 있을 뿐이다. 다른 문제점들에는 물 이용가용성 및 질의 저하 그리고 살충제 및 비료의 사용의 증가가 포함된다.
생물학적 시스템을 사용하는 리그노셀룰로릭(lignocellulolic) 바이오매스의 분해는 바이오매스의 상당한 기계적인 힘 및 복잡한 화학적 구성요소로 인해 매우 어려운 도전이다. 리그노셀룰로오스(lignocellulose)를 단당류로 완전히 전환하는데는 대략 30개의 다른 효소들이 필요하다. 이러한 복잡한 처리방법의 이용가능한 대안에는 상당량의 열, 압력,및 강한 산이 필요하다. 따라서 본 기술에는 바이오연료 또는 바이오페트롤(biopetrols)로 사용되는 탄화수소로 바이오매스를 전환하는 경제적이고 기술적으로 단순한 공정이 필요하다.
상기 공정의 첫번째 단계로, 알코올 디하이드로게나제 활성을 가진 효소는 바이오매스로부터의 다당류를 올리고당류 또는 단당류로 전환하는데 유용한데, 이는 후에 다양한 바이오연료로 전환될 수 있다. 우로네이트(uronate), 4-데옥시-L-에리스로-6-헥소세울로스 우로네이트(DEHU) 및/또는 D-만누로네이트 하이드로게나제 활성과 같은 알코올 디하드로게나제 활성을 갖는 효소는 알지네이트 물질대사 박테리아로부터 미리 정제되었지만, DEHU 또는 D-만누로네이트 하이드로게나제를 코딩하는 유전자는 클로닝되거나 특성화되지 않았다.
본 출원은 DEHU 및/또는 D-만누로네이트 하이드로게나제 활성을 가지는 알코올 디하이드로게나제를 코딩하는 유전자들을 제공하며, 또한 바이오연료와 같은 상업적 화학물질을 생산함에 있어 이들의 용도와 관련된 방법들을 제공한다.
본 발명의 구현예들은 하기 (a) 내지 (f)로부터 선택된 단리된 폴리뉴클레오타이드 및 그의 단편 또는 그것의 변이체를 포함하며,
(a) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 80% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(b) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 90% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(c) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 95% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(d) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 97% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(e) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 99% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드; 및
(f) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드,
여기서 상기 단리된 뉴클레오타이드는 디하이드로게나제 활성을 가지는 폴리펩타이드를 코딩한다. 다른 구현예에서는 상기 폴리펩타이드는 알코올 디하이드로게나제 활성을 가진다. 특정한 구현예에서는 상기 폴리펩타이드는 DEHU 하이드로게나제 활성 및/또는 D-만누로네이트 하이드로게나제 활성을 가진다.
추가적인 구현예들은 다당류를 미생물 시스템과 접촉시키는 것을 포함하는, 다당류를 적합한 단당류 또는 올리고당류로 전환하는 방법을 포함하며, 여기서 상기 미생물 시스템은 재조합 미생물을 포함하며, 상기 재조합 미생물은 본원 기술 내용에 따른 폴리뉴클레오타이드를 포함하며, 또한 상기 폴리뉴클레오타이드는 알코올 하이드로게나제 활성, DEHU 하이드로게나제 활성 및/또는 D-만누로네이트 하이드로게나제 활성과 같은 하이드로게나제 활성을 가지는 폴리펩타이드를 코딩한다.
추가적인 구현예들은 D-만누로네이트를 미생물 시스템과 접촉시키는 것을 포함하는, D-만누로네이트의 환원(수소화)를 촉매하는 방법을 포함하며, 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 본원 기술내용에 따른 폴리뉴클레오타이드를 포함한다.
추가적인 구현예들은 DEHU를 미생물 시스템과 접촉시키는 것을 포함하는, DEHU의 환원(수소화)를 촉매하는 방법을 포함하며, 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 본 발명 기술내용에 따른 폴리뉴클레오타이드를 포함한다.
추가적인 구현예들은 단리된 폴리뉴클레오타이드 또는 본원 기술내용을 포함하는 벡터를 포함하며, 또한 상기 단리된 폴리뉴클레오타이드가 발현 조절 영역에 작동 가능하게 연결된 벡터를 추가로 포함할 수 있으며, 여기서 상기 폴리펩타이드는 알코올 하이드로게나제 활성, DEHU 하이드로게나제 활성, 및/또는 D-만누로네이트 하이드로게나제 활성과 같은 하이드로게나제 활성을 가지는 폴리펩타이드를 코딩한다.
추가적인 구현예들은 재조합 미생물 또는 재조합 미생물을 포함하는 미생물 시스템을 포함하며, 여기서 상기 재조합 미생물은 본원에서 설명되는 폴리뉴클레오타이드 또는 폴리펩타이드를 포함한다. 특정 구현예들에 있어서 상기 재조합 미생물은 아세토박터 아세티, 아크로모박터, 애시디필리움, 아시네토박터, 악티노마두라(Actinomadura), 악티노플라네스(Actinoplanes), 에어로파이룸 퍼닉스(Aeropyrum pernix), 아그로박테리움, 알카리제네스(Alcaligenes), 아나나스 코모수스(M), 아스로박터, 아스퍼질러스 니거(Aspargillus niger), 아스퍼질러스 오리재(Aspargillus oryze), 아스퍼질러스 멜레우스(Aspergillus melleus), 아스퍼질러스 풀베루렌투스(Aspergillus pulverulentus), 아스퍼질러스 사이토이(Aspergillus saitoi), 아스퍼질러스 소재(Aspergillus sojea), 아스퍼질러스 우사미(Aspergillus usamii), 바실러스 알칼로필루스(Bacillus alcalophilus), 바실러스 아밀로리퀴파시언스(Bacillus amyloliquefaciens), 바실러스 브레비스(Bacillus brevis), 바실러스 서큐란스(Bacillus circulans), 바실러스 클라우시(Bacillus clausii), 바실러스 렌투스(Bacillus lentus), 바실러스 리케니포르미스(Bacillus licheniformis), 바실러스 마세란스(Bacillus macerans), 바실러스 스테아로서모필루스(Bacillus stearothermophilus), 바실러스 섭틸리스, 비피도박테리움, 브레비바실러스 브레비스(Brevibacillus brevis), 버크홀데리아 세파시아(Burkholderia cepacia), 칸디다 실린드라세아(Candida cylindracea), 칸디다 루고사, 카리카 파파야(L), 셀룰로시미크로비움(Cellulosimicrobium), 세팔로스포리움, 케토미움 에라티쿰(Chaetomium erraticum), 케토미움 그라실레(Chaetomium gracile), 클로스트리디움, 클로스트리디움 부티리쿰(Clostridium butyricum), 클로스트리디움 아세토부티리쿰(Clostridium acetobutylicum), 클로스트리디움 서모셀럼(Clostridium thermocellum), 코리네박테리움(글루타미쿰), 코리네박테리움 에피시엔스, 에스케리치아 콜라이, 엔테로코커스, 어위니아 크리산세미(Erwina chrysanthemi), 글리코노박터, 글루콘아세토박터, 할로아르쿨라(Haloarcula), 후미콜라 인솔렌스(Humicola insolens), 후미콜라 엔솔렌스(Humicola nsolens), 키타사토스포라 세타에(Kitasatospora setae), 클렙시엘라, 클렙시엘라 옥시토카(Klebsiella oxytoca), 클루이베로마이세스, 클루이베로마이세스 프라질리스(Kluyveromyces fragilis), 클루이베로마이세스 락티스, 코쿠리아(Kocuria), 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 사케, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸로시스티스, 메타놀로부스 시실리애(Methanolobus siciliae), 메타노제니움 오르가노필룸(Methanogenium organophilum), 메타노박테리움 브리아티(Methanobacterium bryantii), 마이크로박테리움 임페리얼, 마이크로코쿠스 리소데익티쿠스(Micrococcus lysodeikticus), 마이크로루나투스, 뮤코 자바니쿠스(Mucor javanicus), 마이코박테리움, 마이로세시움, 나이트로박터, 나이트로소모나스(Nitrosomonas), 노카디아, 파파야 카리카(Papaya carica), 페디오코쿠스, 페디오코쿠스 할로필루스(Pediococcus halophilus), 페니실리움, 페니실리움 카멤베르티(Penicillium camemberti), 페니실리움 시트리눔(Penicillium citrinum), 페니실리움 에메르소니(Penicillium emersonii), 페니실리움 로케포르티(Penicillium roqueforti), 페니실리움 리락티눔(Penicillum lilactinum), 페니실리움 멀티칼라, 파라코쿠스 판토트로푸스(Paracoccus pantotrophus), 프로피오니박테리움(Propionibacterium), 슈도모나스, 슈도모나스 플루오레슨스, 슈도모나스 데니프리피칸스(Pseudomonas denitrificans), 파이로코쿠스, 파이로코쿠스 퓨리오서스(Pyrococcus furiosus), 파이로코쿠스 호리코시(Pyrococcus horikoshii), 라이조비움, 리조무코어 미에헤이(Rhizomucor miehei), 리조무코어 푸실러스 린트(Rhizomucor pusillus Lindt), 라이조푸스, 라이조푸스 델레마(Rhizopus delemar), 라이조푸스 자포니쿠스(Rhizopus japonicus), 라이조푸스 니비우스(Rhizopus niveus), 라이조푸스 오리자에(Rhizopus oryzae), 라이조푸스 올리고스포루스(Rhizopus oligosporus), 로도코쿠스, 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 스클레로티나 리베르티나(Sclerotina libertina), 스핑고박테리움 멀티보룸(Sphingobacterium multivorum), 스핑고비움, 스핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이세스, 스트렙토마이세스 그리세우스(Streptomyces griseus), 스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 뮤리누스(Streptomyces murinus), 스트렙토마이세스 루비기노수스(Streptomyces rubiginosus), 스트렙토마이세스 비올라세오루버(Streptomyces violaceoruber), 스트렙토베르티실리움 모바라엔스(Streptoverticillium mobaraense), 테트라게노쿠스, 서머스, 티오스파에라 판토트로파(Thiosphaera pantotropha), 트라메테스, 트리코데르마, 트리코데르마 롱기브라키아툼(Trichoderma longibrachiatum), 트리코데르마 리세이(Trichoderma reesei), 트리코데르마 비리드(Trichoderma viride), 트리코스포론 페니실라툼(Trichosporon penicillatum), 비브리오 알지노리티쿠스(Vibrio alginolyticus), 잔토모나스(Xanthomonas), 이스트, 자이고사카로마이세스 룩시이(Zygosaccharomyces rouxii), 자이모모나스, 및 자이모모나스 모빌리스로부터 선택되는 것이다.
추가적인 구현예들은 하기(a) 내지 (f)로부터 선택된 단리된 폴리펩타이드 및 그의 변이체 또는 그의 단편을 포함하며,
(a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(b) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(c) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(d) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(e) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드; 및
(f) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열을 포함하는 단리된 폴리펩타이드,
여기서 상기 단리된 폴리펩타이드는 알코올 디하이드로게나제 활성, DEHU 하이드로게나제 활성, 및/또는 D-만누로네이트 하이드로게나제 활성과 같은 하이드로게나제 활성을 가진다.
추가적인 구현예들은 재조합 미생물을 다당류와 접촉하는 것을 포함하는, 다당류를 적합한 단당류 또는 올리고당류로 전환하는 방법을 포함하며, 상기 재조합 미생물은 본원 기술내용에 따른 ADH 폴리뉴클레오타이드 또는 폴리펩타이드를 포함한다.
추가적인 구현예들은 재조합 미생물을 D-만누로네이트과 접촉하는 것을 포함하는, D-만누로네이트의 환원(수소화)를 촉매하는 방법을 포함하며, 상기 재조합 미생물은 본 기술내용에 따른 ADH 폴리뉴클레오타이드 또는 폴리펩타이들를 포함한다.
추가적인 구현예들은 재조합 미생물을 DEHU와 접촉하는 것을 포함하는, 우로네이트, 4-데옥시-L-에리스로-5-헥소세울로스 우로네이트(DEHU)의 환원(수소화)를 촉매하는 방법을 포함하며, 상기 재조합 미생물은 본원 기술내용에 따른 ADH 폴리뉴클레오타이드 또는 폴리펩타이드를 포함한다.
추가적인 구현예들은 다당류를 적합한 단당류 또는 올리고당류로 전환하는 미생물 시스템을 포함하며, 상기 미생물 시스템은 재조합 미생물을 포함하고, 또한 상기 재조합 미생물은 하기(a) 내지 (f)로부터 선택된 단리된 폴리뉴클레오타이드를 포함한다.
(a) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 80% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(b) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 90% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(c) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 95% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(d) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 97% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(e) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열과 적어도 99% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드; 및
(f) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37로 나타내는 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드.
추가적인 구현예들은 다당류를 적합한 단당류 또는 올리고당류로 전환하는 미생물 시스템을 포함하며, 상기 미생물 시스템은 재조합 미생물을 포함하고, 상기 재조합 미생물은 하기(a) 내지 (e)로부터 선택된 단리된 폴리펩타이드를 포함한다.
(a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(b) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(c) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(d) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(e) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드; 및
(f) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 아미노산 서열을 포함하는 단리된 폴리펩타이드.
추가적인 구현예들에서 본원에 기재된 단리된 폴리뉴클레오타이드는 니코틴아미드 아데닌 다이뉴클레오타이드(NAD+), NADH, 니코틴아미드 아데닌 다이뉴클레오타이드 포스페이트(NADP+), 또는 NADPH 결합 모티프의 적어도 하나를 포함하는 폴리펩타이드를 코딩할 수 있다. 다른 구현예들에서는 단리된 ADH 폴리펩타이드, 또는 그의 단편, 변이체 또는 유도체를 포함할 수 있으며, 상기 폴리펩타이드는 니코틴아미드 아데닌 다이뉴클레오타이드(NAD+), NADH, 니코틴아미드 아데닌 다이뉴클레오타이드 포스페이트(NADP+), 또는 NADPH 결합 모티프의 적어도 하나를 포함한다. 특정 구현예들에서는, NDH+, NADH, NADP+, 또는 NADPH 결합 모티프가 Y-X-G-G-X-Y(서열번호 67), Y-X-X-G-G-X-Y(서열번호 68), Y-X-X-X-G-G-X-Y(서열번호 69), Y-X-G-X-X-Y(서열번호 70), Y-X-X-G-G-X-X-Y(서열번호 71), Y-X-X-X-G-X-X-Y(서열번호 72), Y-X-G-X-Y (서열번호 73), Y-X-X-G-X-Y(서열번호 74), Y-X-X-X-G-X-Y(서열번호 75), 및 Y-X-X-X-X-G-X-Y(서열번호 76)로 이루어진 그룹으로부터 선택된다. 상기 Y 는 알라닌, 글라이신, 및 세린으로부터 각각 선택되고, 상기 G 는 글라이신이고, 상기 X 는 유전적으로 코딩된 아미노산으로부터 각각 독립적으로 선택된다.
특정한 구현예들은 다당류를 재조합 미생물과 접촉시키는 것을 포함하는, 다당류를 에탄올로 전환하는 방법에 관한 것으로, 여기서 상기 재조합 미생물은 유일한 탄소원으로서 다당류에서 성장할 수 있다. 특정한 구현예들에서, 상기 재조합 미생물은 적어도 하나의 피루베이트 디카르복실라제를 코딩하는 적어도 하나의 폴리뉴클레오타이드, 그리고 알코올 디하이드로게나제를 코딩하는 적어도 하나의 폴리뉴클레오타이드를 포함한다. 특정한 구현예들에서, 상기 다당류는 알지네이트이다. 특정한 구현예들에서는 상기 재조합 미생물은 비브로 스플렌디두스(Vibro splendidus)의 V12B01_24189 및 V12B01_24249 사이의 게놈 영역을 포함하는 하나 또는 그 이상의 폴리뉴클레오타이드를 포함한다. 특정 구현예들에서, 적어도 하나의 피루베이트 디카르복실라제는 자이모모나스 모빌리스로(Zymomonas mobilis)부터 유래한 것이다. 특정 구현예들에서, 적어도 하나의 알코올 디하이드로게나제는 자이모모나스 모빌리스로부터 유래한 것이다. 특정 구현예들에서, 상기 재조합 미생물은 E. coli이다.
상세한 설명
정의
별도로 정의되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어들은 발명이 속하는 분야에서 통상의 기술자들에게 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원에 기재된 것들과 비슷한 또는 동등한 임의의 방법들 및 재료들이 본 발명의 실시 또는 시험에 사용될 수 있더라도, 바람직한 방법들과 재료들이 기재된다. 본 발명의 목적을 위해, 다음의 용어들은 아래에 정의된다.
여기서 사용된 관사들 "a" 및 "an"은 관사의 문법적 목적의 하나 또는 하나 이상(예, 적어도 하나)을 나타낸다. 예로서, " 하나의 요소" 는 하나의 요소 또는 하나 이상의 요소를 의미한다.
"약"은 수량, 레벨, 농도, 값, 숫자, 빈도, 퍼센트, 치수, 크기, 양, 무게, 또는 길이를 의미하는데, 참조 수량, 농도, 값, 숫자, 빈도, 퍼센트, 치수, 크기,사이즈, 양, 무게, 또는 길이에 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1 % 만큼 다양하다.
"바이오매스"(biomass)의 예들은 수용성 또는 해양 바이오매스, 과일 찌꺼기와 같은 과일-기반의 바이오매스, 채소 찌꺼기와 같은 채소-기반의 바이오매스, 외의 다른 것들을 포함한다. 수용성 또는 해양 바이오매스의 예들은 켈프(kelp), 거대 켈프(giant kelp), 해초, 조류, 및 해양 미소식물, 미소조류, 바다식물, 등을 포함하지만, 이들로 한정되는 것은 아니다. 어떤 측면에서, 바이오매스는 지각의 꼭대기층 내에서 일반적으로 발견되는 탄화수소와 같은 화석화된 탄소원을 포함하지 않는다(예를 들어, 천연가스, 무연탄같이 거의 순수한 탄소로 구성된 비휘발성 물질, 등).
"수용성 바이오매스" 또는 "해양 바이오매스"의 예들은 켈프, 거대켈프, 사르가소(sargasso), 해초, 조류, 해양 미소식물, 미소조류, 및 바다식물, 및 기타 같은 종류의 것을 포함하지만, 이들로 한정되는 것은 아니다.
과일 및/또는 채소 바이오매스의 예들은, 다른 것들 중에서, 감귤류, 오렌지,그레이프프루트(grapefruit), 감자, 토마토, 포도, 망고, 구스베리(gooseberry), 당근, 사탕무, 및 사과 등을 포함하는 식물 껍질 및 찌꺼기 같은 어떠한 펙틴의 원들을 포함하지만, 이들로 한정되는 것은 아니다.
다당류, 올리고당류, 단당류, 또는 바이오매스의 다른 설탕 구성성분들의 예들은 알지네이트, 한천, 카라기난, 푸코이단, 펙틴, 글루로네이트(gluronate), 만누로네이트, 마니톨, 릭소스, 셀룰로오스, 헤미셀룰로오스, 글리세롤, 자일리톨, 글루코스, 만노오스, 갈락토스, 자일로스, 자일렌, 만난, 아라비난, 아라비노스, 글루쿠론산염, 갈락투로네이트(디 및 트리-갈락투로네이트를 포함), 람노오스 등을 포함하지만, 이들로 한정되는 것은 아니다.
알지네이트-유래의 다당류의 특정한 예들은 β-D-만누로네이트, α-L-글루로네이트, 디알지네이트, 트리알지네이트, 펜타알지네이트, 헥사알지네이트, 헵타알지네이트, 옥타알지네이트, 노나알지네이트, 데카알지네이트, 운데카알지네이트, 도데카알지네이트 및 폴리알지네이트와 같은 포화된 다당류를 포함할 뿐만 아니라, 4-데옥시-L-에스로-5-헥소세울로스 우로네이트, 4-(4-데옥시-베타-D-만-4- 유로노실)-D-만누로네이트 또는 L-구루로네이트, 4-(4-데옥시-베타-D-만-4-유로노실)-디알지네이트, 4-(4-데옥시-베타-D-만-4-유로노실)-트리알지네이트, 4-(4-데옥시-베타-D-만-4-유로노실)-테트라알지네이트, 4-(4-데옥시-베타-D-만-4-유로노실)-펜타알지네이트, 4-(4-데옥시-베타-D-만-4-유로노실)-헥사알지네이트, 4-(4-데옥시-베타-D-만-4-유로노실)-헵타알지네이트, 4-(4-데옥시-베타-D-만-4-유로노실)-옥타알지네이트, 4-(4-데옥시-베타-D-만-4-유로노실)-노나알지네이트, 4-(4- 데옥시-베타-D-만-4-유로노실)-운데카알지네이트, 및 4-(4-데옥시-베타-D-만-4-유로노실)-도데카알지네이트과 같은 비포화된 다당류를 포함한다.
펙틴-유래의 다당류의 특정한 예들은 갈락투로네이트, 디갈락투로네이트, 트리갈락투로네이트, 테트라갈락투로네이트, 펜타갈락투로네이트, 헥사갈락투로네이트, 헵타갈락투로네이트, 옥타갈락투로네이트, 노나갈락투로네이트, 데카갈락투로네이트, 도데카갈락투로네이트, 폴리갈락투로네이트, 및 람노폴리갈락투로네이트 같은 포화된 다당류를 포함할 뿐만 아니라, 4-데옥시-L-트레오-5-헥소술로스 우로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-갈락투로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-디갈락투로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-트리갈락투로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-테트라갈락투로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-펜타갈락투로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-헥사갈락투로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-헵타갈락투로네이트, 4- (4-데옥시-알파-D-글룩-4-유로노실)-D-옥타갈락투로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-노나갈락투로네이트, 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-데카갈락투로네이트, 및 4-(4-데옥시-알파-D-글룩-4-유로노실)-D-도데카갈락투로네이트와 같은 포화된 다당류를 포함한다.
이러한 다당류 또는 올리고당류 구성요소들은 탄소의 원(예: 유일한 탄소원)으로서 다당류 또는 다른 설탕 구성요소들에서 성장할 수 있는 본원에 기재된 상기 미생물에 의해서 "적합한 단당류" 또는 "적합한 올리고당류" 등의 다른 "적합한 당류"로 전환될 수 있다.
"단당류", "적합한 단당류" 또는 "적합한 당류"는 일반적으로 특정의 근원(source) 또는 유일한 탄소원으로서 펙틴, 알지네이트, 또는 다른 당류(예: 갈락투로네이트, 셀룰로오스, 헤미-셀룰로오스 등)에서 성장할 수 있는 재조합미생물에 의해서 만들어질 수도 있는 어떠한 당류를 나타낸다. 또한 이들은 본 발명의 바이오연료 생합성 경로에서 이용하여 바이오 연로 또는 바이오페트롤 등의 탄화수소를 생산할 수 있는 임의의 당류를 나타낸다. 적합한 단당류 또는 올리고당류의 예들은 2-케토-3-데옥시 D-글루코네이트(KDG), D-마니톨, 글루로네이트, 만누로네이트, 마니톨, 릭소스, 글리세롤, 자일리톨, 글루코스, 만노오스, 갈락토스, 자일로스, 아라비노스, 글루쿠론산염, 갈락투로네이츠, 및 람노오스 등을 포함하지만, 이들로 한정되는 것은 아니다. 여기서 지적하는 바와 같이, 본원에서 사용된 "적합한 단당류" 또는 "적합한 당류"는 본 발명의 조작된 또는 재조합된 미생물에 의해서 제조할 수 있거나, 또는 상업적으로 입수 가능한 원들로부터 얻을 수도 있다.
본원 사용된 용어 "상업적 화학 제품"(commodity chemical)은 바이오연료 및/또는 바이오페트롤을 포함하며, 본원에서 제공된 방법으로 직접적으로 또는 부산물로서 제조할 수 있는 임의의 시장성이 있거나 시판 가능한 화학물질을 포함할 수 있다. "상업적 화학 제품"의 일반적인 예들은 바이오 연료, 미네랄, 폴리머 전구체, 지방 알코올, 계면활성제, 가소제, 및 용매를 포함하지만, 이들로 한정되는 것은 아니다. 본원에 사용된 용어 "바이오연료"(biofuel)는 재조합 미생물과 같은 생물학적 근원으로부터 적어도 부분적으로 유래한 고체, 액체, 또는 가스 연료를 포함한다.
상업적 화학 제품의 예들은 메탄, 메탄올, 에탄, 에텐, 에탄올, n-프로판, 1-프로펜, 1-프로판올, 프로판알, 아세톤, 프로피오네이트, n-부탄, 1-부텐, 1-부탄올, 부탄알, 부타노에이트, 이소부탄알, 이소부탄올, 2-메틸부탄알, 2-메틸부탄올, 3-메틸부탄알, 3-메틸부탄올, 2-부텐, 2-부탄올, 2-부타논, 2,3-부탄디올, 3-하이드록시-2-부탄온, 2,3-부탄디온, 에틸벤젠, 에텐일벤젠, 2-페닐에탄올, 페닐아세트알데히드, 1-페닐부탄, 4-페닐-1-부텐, 4-페닐-2-부텐, 1-페닐-2-부텐, 1-페닐-2-부탄올, 4-페닐-2-부탄올, 1-페닐-2-부타논, A-페닐-2-부타논, l-페닐-2,3-부탄디올, l-페닐-3-하이드록시-2-부타논, A-페닐-3-하이드록시-2-부타논, l-페닐-2,3-부탄디온, n-펜탄, 에틸페놀, 에테닐페놀, 2-(4-하이드록시페닐)에탄올, 4-하이드록시페닐아세트알데히드, l-(4-하이드록시페닐)부탄, 4-(4-하이드록시페닐)-1-부텐, 4-(4-하이드록시페닐)-2-부텐, 1-(4-하이드록시페닐)-1-부텐, 1-(4-하이드록시페닐)-2-부탄올, 4-(4-하이드록시페닐)-2-부탄올, 1-(4-하이드록시페닐)-2-부타논, 4-(4-하이드록시페닐)-2-부타논, 1-(4-하이드록시페닐)-2,3-부탄디올, 1-(4-하이드록시페닐)-3-하이드록시-2-부타논, 4-(4-하이드록시페닐)-3-하이드록시-2-부타논, 1-(4-하이드록시페닐)-2,3- 부타논디온, 인돌일에탄, 인돌일에텐, 2-(인돌-3-)에탄올, n-펜탄,l-펜텐, 1-펜탄올, 펜탄알, 펜타노에이트, 2-펜텐, 2-펜탄올, 3-펜탄올, 2- 펜타논, 3-펜타논, 4-메틸펜탄알, 4-메틸펜탄올, 2,3-펜탄디올, 2- 하이드록시-3-펜타논, 3-하이드록시-2-펜타논, 2,3-펜탄디온, 2-메틸펜탄, 4- 메틸-1-펜텐, 4-메틸-2-펜텐, 4-메틸-3-펜텐, 4-메틸-2-펜탄올, 2-메틸-3-펜탄올, 4-메틸-2-펜타논, 2-메틸-3-펜타논, 4-메틸-2,3-펜탄디올, 4-메틸-2-하이드록시-3-펜타논, 4-메틸-3-하이드록시-2-펜타논, 4-메틸-2,3-펜탄디온, 1-페닐펜탄, 1-페닐-1-펜텐, 1-페닐-2-펜텐, l-페닐-3-펜텐, l-페닐-2-펜탄올, l-페닐-3-펜탄올, l-페닐-2-펜타논, l-페닐-3-펜타논, l-페닐-2,3-펜탄디올, l-페닐-2-하이드록시-3-펜타논, l-페닐-3-하이드록시-2-펜타논, l-페닐-2,3-펜탄디온, 4-메틸-l-페닐펜탄, 4-메틸-l-페닐-1-펜텐, 4-메틸-l-페닐-2-펜텐, 4-메틸-1-페닐-3-펜텐, 4-메틸-l-페닐-3-펜탄올, 4-메틸-l-페닐-2-펜탄올, 4-메틸-l-페닐-3-펜타논, 4-메틸-l-페닐-2-펜타논, 4-메틸- l-페닐-2,3-펜탄디올, 4-메틸-l-페닐-2,3-펜탄디온 , 4-메틸-l-페닐-3-하이드록시-2-펜타논, 4-메틸-l-페닐-2-하이드록시-3-펜타논, 1-(4-하이드록시페닐) 펜탄, l-(4-하이드록시페닐)-1-펜텐, 1-(4-하이드록시페닐)-2-펜텐, l-(4-하이드록시페닐)-3-펜텐, l-(4-하이드록시페닐)-2-펜탄올, l-(4-하이드록시페닐)-3-펜탄올, 1-(4-하이드록시페닐)-2-펜타논, 1-(4-하이드록시페닐)-3-펜타논, l-(4-하이드록시페닐)-2,3-펜탄디올, l-(4-하이드록시페닐)-2-하이드록시-3-펜타논, 1-(4-하이드록시페닐)-3-하이드록시-2-펜타논, 1-(4-하이드록시페닐)-2,3-펜탄디온, 4-메틸-l-(4-하이드록시페닐)펜탄, 4-메틸-l-(4-하이드록시페닐)-2-펜텐, 4-메틸-1-(4-하이드록시페닐)-3-펜텐, 4-메틸-1-(4-하이드록시페닐)-l-펜텐, 4-메틸-1-(4-하이드록시페닐)-3-펜탄올, 4-메틸-1-(4-하이드록시페닐)-2-펜탄올, 4-메틸-l-(4-하이드록시페닐)-3-펜타논, 4-메틸-1-(4-하이드록시페닐)-2-펜타논, 4-메틸-l-(4-하이드록시페닐)-2,3-펜탄디올, 4-메틸-l-(4-하이드록시페닐)-2,3-펜탄디온, 4-메틸-l-(4-하이드록시페닐)-3-하이드록시-2-펜타논, 4-메틸-l-(4-하이드록시페닐)-2-하이드록시-3-펜타논, 1-인돌-3-펜탄, l-(인돌-3)-1-펜텐, l-(인돌-3)-2-펜텐, l-(인돌-3)-3-펜텐, l-(인돌-3)-2-펜탄올, l-(인돌-3)-3-펜탄올, 1-(인돌-3)-2-펜타논, 1-(인돌-3)-3-펜타논, 1-(인돌-3)-2,3-펜탄디올, 1-(인돌-3)-2-하이드록시-3-펜타논, l-(인돌-3)-3-하이드록시-2-펜타논, l-(인돌-3)-2,3-펜탄디온, 4-메틸-1-(인돌-3-)펜탄, 4-메틸-1-(인돌-3)-2-펜텐, 4-메틸-1-(인돌-3)-3-펜텐, 4-메틸-l-(인돌-3)-l-펜텐, 4-메틸-2-(인돌-3)-3-펜탄올, 4-메틸-l-(인돌-3)-2-펜탄올, 4-메틸-l-(인돌-3)-3-펜타논, 4-메틸-l-(인돌-3)-2-펜타논, 4-메틸-l-(인돌-3)-2,3-펜탄디올, 4-메틸-l-(인돌-3)-2,3-펜탄디온, 4-메틸-l-(인돌-3)-3-하이드록시-2-펜타논, 4-메틸-l-(인돌-3)-2-하이드록시-3-펜타논, n-헥산, 1-헥센, 1-헥산올, 헥산알, 헥사노에이트, 2-헥센, 3-헥센, 2-헥산올, 3-헥산올, 2-헥사논, 3-헥사논, 2,3-헥산디올, 2,3-헥산디온, 3,4-헥산디올, 3,4-헥산디온, 2-하이드록시-3-헥사논, 3-하이드록시-2-헥사논, 3-하이드록시-4-헥사논, 4-하이드록시-3-헥사논, 2- 메틸헥산, 3-메틸헥산, 2-메틸-2-헥센, 2-메틸-3-헥센, 5-메틸-l-헥센, 5-메틸-2-헥센, 4-메틸-1-헥센, 4-메틸-2-헥센, 3-메틸-3- 헥센, 3-메틸-2-헥센, 3-메틸-1-헥센, 2-메틸-3-헥산올, 5-메틸-2-헥산올, 5-메틸-3-헥산올, 2-메틸-3-헥사논, 5-메틸-2-헥사논, 5-메틸-3-헥사논, 2-메틸-3,4-헥산디올, 2-메틸-3,4-헥산디온 , 5-메틸-2,3-헥산디올, 5-메틸-2,3-헥산디온, 4-메틸-2,3-헥산디올, 4-메틸-2,3-헥산디온, 2-메틸-3-하이드록시-4-헥사논, 2-메틸-4-하이드록시-3-헥사논, 5-메틸-2-하이드록시-3-헥사논, 5-메틸-3-하이드록시-2-헥사논, 4-메틸-2-하이드록시-3-헥사논, 4-메틸-3-하이드록시-2-헥사논, 2,5-디메틸헥산, 2,5-디메틸-2-헥센, 2,5-디메틸-3-헥센, 2,5-디메틸-3-헥산올, 2,5-디메틸-3-헥사논, 2,5-디메틸-3,4-헥산디올, 2,5-디메틸-3,4-헥산디온, 2,5-디메틸-3-하이드록시-4-헥사논, 5-메틸-l-페닐헥산, 4-메틸-l-페닐헥산, 5-메틸-1-페닐-1-헥센, 5-메틸-1-페닐-2-헥센, 5-메틸-1-페닐-3-헥센, 4-메틸-l-페닐-1-헥센, 4-메틸-l-페닐-2-헥센, 4-메틸-1-페닐-3-헥센, 5-메틸-1-페닐-2-헥산올, 5-메틸-l-페닐-3-헥산올, 4-메틸-l-페닐-2-헥산올, 4-메틸-l-페닐-3-헥산올, 5-메틸-l-페닐-2-헥사논, 5-메틸-l-페닐-3-헥사논, 4-메틸-l-페닐-2-헥사논, 4-메틸-1-페닐-3-헥사논, 5-메틸-l-페닐-2,3-헥산디올, 4-메틸-1-페닐-2,3-헥산디올, 5-메틸-l-페닐-3-하이드록시-2-헥사논, 5-메틸-l-페닐-2-하이드록시-3-헥사논, 4-메틸-l-페닐-3-하이드록시-2-헥사논, 4-메틸-l-페닐-2-하이드록시-3-헥사논, 5-메틸-l-페닐-2,3-헥산디온, 4-메틸-l-페닐-2,3- 헥산디온, 4-메틸-1-(4-하이드록시페닐)헥산, 5-메틸-1-(4-하이드록시페닐)-1-헥센, 5-메틸-1-(4-하이드록시페닐)-2-헥센, 5-메틸-1-(4-하이드록시페닐)-3-헥센, 4-메틸-1-(4-하이드록시페닐)-1-헥센, 4-메틸-1-(4-하이드록시페닐)-2-헥센, 4-메틸-1-(4-하이드록시페닐)-3-헥센, 5-메틸-1-(4-하이드록시페닐)-2-헥산올, 5-메틸-1-(4-하이드록시페닐)-3-헥산올, 4-메틸-1-(4-하이드록시페닐)-2-헥산올, 4-메틸-l-(4-하이드록시페닐)-3-헥산올, 5-메틸- l-(4-하이드록시페닐)-2-헥사논, 5-메틸-l-(4-하이드록시페닐)-3-헥사논, 4-메틸-l-(4- 하이드록시페닐)-2-헥사논, 4-메틸-l-(4-하이드록시페닐)-3-헥사논, 5-메틸-l-(4-하이드록시페닐)-2,3-헥산디올, 4-메틸-l-(4-하이드록시페닐)-2,3-헥산디올, 5-메틸-1-(4-하이드록시페닐)-3-하이드록시-2-헥사논, 5-메틸-1-(4-하이드록시페닐)-2-하이드록시-3-헥사논, 4-메틸-l-(4-하이드록시페닐)-3-하이드록시-2-헥사논, A-메틸-1-(4-하이드록시페닐)-2-하이드록시-3-헥사논, 5-메틸-1-(4-하이드록시페닐)-2,3-헥산디온, 4-메틸-l-(4-하이드록시페닐)-2,3-헥산디온, 4-메틸-l-(인돌-3-)헥산, 5-메틸-l-(인돌-3)-l-헥센, 5-메틸-l-(인돌-3)-2-헥센, 5-메틸-l-(인돌-3)-3-헥센, 4-메틸-l-(인돌-3)-l-헥센, 4-메틸-l-(인돌-3)-2-헥센, 4-메틸-l-(인돌-3)-3-헥센, 5-메틸-l-(인돌-3)-2-헥산올, 5-메틸-1-(인돌-3)-3-헥산올, 4-메틸-l-(인돌-3)-2-헥산올, 4-메틸-l-(인돌-3)-3-헥산올, 5-메틸-l-(인돌-3)-2-헥사논, 5-메틸-l-(인돌-3)-3-헥사논, 4-메틸-l-(인돌-3)-2-헥사논, 4-메틸-l-(인돌-3)-3-헥사논, 5-메틸-l-(인돌-3)-2,3-헥산디올, 4-메틸-l-(인돌-3)-2,3-헥산디올, 5-메틸-l-(인돌-3)-3-하이드록시-2-헥사논, 5-메틸-l-(인돌-3)-2-하이드록시-3-헥사논, 4-메틸-l-(인돌-3)-3-하이드록시-2-헥사논, 4-메틸-l-(인돌-3)-2-하이드록시-3-헥사논, 5-메틸-l-(인돌-3)-2,3-헥산디온, 4-메틸-l-(인돌-3)-2,3-헥산디온, n-헵탄, 1-헵텐, 1-헵탄올, 헵탄알, 헵타노에이트, 2-헵텐, 3-헵텐, 2-헵탄올, 3-헵탄올, 4-헵탄올, 2-헵타논, 3-헵타논, 4-헵타논, 2,3-헵탄디올, 2,3-헵탄디온, 3,4-헵탄디올, 3,4-헵탄디온, 2-하이드록시-3-헵타논, 3-하이드록시-2-헵타논, 3-하이드록시-4-헵타논, 4-하이드록시-3-헵타논, 2-메틸헵탄, 3-메틸헵탄, 6-메틸-2-헵텐, 6-메틸-3-헵텐, 2-메틸-3-헵텐, 2-메틸-2-헵텐, 5-메틸-2-헵텐, 5-메틸-3-헵텐, 3- 메틸-3-헵텐, 2-메틸-3-헵탄올, 2-메틸-4-헵탄올, 6-메틸-3-헵탄올, 5- 메틸-3-헵탄올, 3-메틸-4-헵탄올, 2-메틸-3-헵타논, 2-메틸-4- 헵타논, 6-메틸-3-헵타논, 5-메틸-3-헵타논, 3-메틸-4-헵타논, 2- 메틸-3,4-헵탄디올, 2-메틸-3,4-헵탄디온, 6-메틸-3,4-헵탄디올, 6-메틸-3,4-헵탄디온, 5-메틸-3,4-헵탄디올, 5-메틸-3,4-헵탄디온, 2-메틸-3-하이드록시-4-헵타논, 2-메틸-4-하이드록시-3-헵타논, 6-메틸-3- 하이드록시-4-헵타논, 6-메틸-4-하이드록시-3-헵타논, 5-메틸-3-하이드록시-4-헵타논, 5-메틸-4-하이드록시-3-헵타논, 2,6-디메틸헵탄, 2,5-디메틸헵탄, 2,6-디메틸-2-헵텐, 2,6-디메틸-3-헵텐, 2,5-디메틸-2-헵텐, 2,5-디메틸-3-헵텐, 3,6-디메틸-3-헵텐, 2,6-디메틸-3-헵탄올, 2,6-디메틸-4-헵탄올, 2,5-디메틸-3-헵탄올, 2,5-디메틸-4-헵탄올, 2,6- 디메틸-3,4-헵탄디올, 2,6-디메틸-3,4-헵탄디온, 2,5-디메틸-3,4-헵탄디올, 2,5-디메틸-3,4-헵탄디온, 2,6-디메틸-3-하이드록시-4-헵타논, 2,6-디메틸-4-하이드록시-3-헵타논, 2,5-디메틸-3-하이드록시-4-헵타논, 2,5-디메틸-4-하이드록시-3-헵타논, n-옥탄, 1-옥텐, 2-옥텐, 1-옥탄올, 옥탄알, 옥타노에이트, 3-옥텐, 4-옥텐, 4-옥탄올, 4-옥타논, 4,5-옥탄디올, 4,5-옥탄디온, 4-하이드록시-5-옥타논, 2-메틸옥탄, 2-메틸-3-옥텐, 2-메틸-4-옥텐, 7-메틸-3-옥텐, 3-메틸-3-옥텐, 3-메틸-4-옥텐, 6-메틸-3-옥텐, 2-메틸-4-옥탄올, 7-메틸-4-옥탄올, 3-메틸-4-옥탄올, 6-메틸-4-옥탄올, 2-메틸-4-옥타논, 7-메틸-4-옥타논, 3-메틸-4-옥타논, 6-메틸-4-옥타논, 2-메틸-4,5-옥탄디올, 2-메틸-4,5-옥탄디온, 3-메틸-4,5-옥탄디올, 3-메틸-4,5-옥탄디온, 2-메틸-4-하이드록시-5-옥타논, 2-메틸-5-하이드록시-4-옥타논, 3-메틸-4-하이드록시-5-옥타논, 3-메틸-5-하이드록시-4-옥타논, 2,7-디메틸옥탄, 2,7-디메틸-3-옥텐, 2,7-디메틸-4-옥텐, 2,7-디메틸-4-옥탄올, 2,7-디메틸-4-옥타논, 2,7-디메틸-4,5-옥탄디올, 2,7-디메틸-4,5-옥탄디온, 2,7-디메틸-4-하이드록시-5-옥타논, 2,6-디메틸옥탄, 2,6-디메틸-3-옥텐, 2,6-디메틸-4-옥텐, 3,7-디메틸-3-옥텐, 2,6-디메틸-4-옥탄올, 3,7-디메틸-4-옥탄올, 2,6-디메틸-4-옥타논, 3,7-디메틸-4-옥타논, 2,6-디메틸-4,5-옥탄디올, 2,6-디메틸-4,5-옥탄디온, 2,6-디메틸-4-하이드록시-5-옥타논, 2,6-디메틸-5-하이드록시-4-옥타논, 3,6-디메틸옥탄, 3,6-디메틸-3-옥텐, 3,6-디메틸-4-옥텐, 3,6-디메틸-4-옥탄올, 3,6-디메틸-4-옥타논, 3,6-디메틸-4,5-옥탄디올, 3,6-디메틸-4,5-옥탄디온, 3,6-디메틸-4-하이드록시-5-옥타논, n-노난, 1-노넨, 1-노난올, 노난알, 노나노에이트, 2-메틸노난, 2-메틸-4-노넨, 2-메틸-5-노넨, 8-메틸-4-노넨, 2-메틸-5-노난올, 8-메틸-4-노난올, 2-메틸-5-노나논, 8-메틸-4-노나논, 8-메틸-4,5-노난디올, 8-메틸-4,5-노난디온, 8-메틸-4-하이드록시-5-노나논, 8-메틸-5-하이드록시-4-노나논, 2,8-디메틸노난, 2,8-디메틸-3-노넨, 2,8-디메틸-4-노넨, 2,8-디메틸-5-노넨, 2,8-디메틸-4-노난올, 2,8-디메틸-5-노난올, 2,8-디메틸-4-노나논, 2,8-디메틸-5-노나논, 2,8-디메틸-4,5-노난디올, 2,8-디메틸-4,5-노난디온, 2,8-디메틸-4-하이드록시-5-노나논, 2,8-디메틸-5-하이드록시-4-노나논, 2,7-디메틸노난, 3,8-디메틸-3-노넨, 3,8-디메틸-4-노넨, 3,8-디메틸-5-노넨, 3,8-디메틸-4-노난올, 3,8-디메틸-5-노난올, 3,8-디메틸-4- 노나논, 3,8-디메틸-5-노나논, 3,8-디메틸-4,5-노난디올, 3,8-디메틸-4,5-노난디온, 3,8-디메틸-4-하이드록시-5-노나논, 3,8-디메틸-5-하이드록시-4-노나논, n-데칸, 1-데켄, 1-데칸올, 데카노에이트, 2,9-디메틸데칸, 2,9-디메틸-3-데켄, 2,9-디메틸-4-데켄, 2,9-디메틸-5-데칸올, 2,9-디메틸-5-데카논, 2,9-디메틸-5,6-데칸디올, 2,9-디메틸-6-하이드록시-5-데카논, 2,9-디메틸-5,6-데칸디오넨-언데칸, 1-언데켄, 1-언데칸올, 언데칸알. 언데카노에이트, n-도데칸, 1-도데켄, 1-도데칸올, 도데칸알, 도데카노에이트, n-도데칸, 1 -데카데켄, 1-도데칸올, 도데칸알, 도데카노에이트, n-트리데칸, 1-트리데켄, 1-트리데칸올, 트리데칸알, 트리데카노에이트, n-테트라데칸, 1-테트라데켄, 1-테트라데칸올, 테트라데칸알, 테트라데카노에이트, n-펜타데칸, 1-펜타데켄, 1-펜타데칸올, 펜타데칸알, 펜타데카노에이트, n-헥사데칸, 1-헥사데켄, 1-헥사데칸올, 헥사데칸알, 헥사데카노에이트, n-헵타데칸, 1-헵타데켄, 1-헵타데칸올, 헵타데칸알, 헵타데카노에이트, n-옥타데칸, 1-옥타데켄, 1- 옥타데칸올, 옥타데칸알, 옥타데카노에이트, n-노나데칸, 1-노나데켄, 1-노나데칸올, 노나데칸알, 노나데카노에이트, 에이코산, 1-에이코센, 1-에이코산올, 에이코산알, 에이코사노에이트, 3-하이드록시 프로판알, 1,3-프로판디올, 4-하이드록시부탄알, 1,4-부탄디올, 3-하이드록시-2-부타논, 2,3-부탄디올, 1,5-펜탄 디올, 호모시트레이트, 호모이소시트레이트, b-하이드록시 아디페이트, 글루타레이트, 글루타세미알데하이드, 글루타알데하이드, 2-하이드록시-1-사이클로펜타논, 1,2-사이클로펜탄디올, 사이클로펜타논, 사이클로펜탄올, (S)-2-아세토락테이트, (R)-2,3-디하이드록시-이소발레레이트, 2-옥소이소발레레이트, 이소부티릴-CoA, 이소부티레이트, 이소부티르알데하이드, 5-아미노 펜타알데하이드, 1,10-디아미노데칸, 1,10-디아미노-5-데켄, l,10-디아미노-5-하이드록시데칸, l,10-디아미노-5-데카논, 1,10-디아미노-5,6-데칸디올, l,10-디아미노-6-하이드록시-5-데카논, 페닐 아세토 알데하이드, 1,4-디페닐부탄, 1,4-디페닐-l-부텐, 1,4-디페닐-2-부텐, 1,4-디페닐-2-부탄올, 1,4-디페닐-2-부타논, 1,4-디페닐-2,3-부탄디올, l,4-디페닐-3-하이드록시-2-부타논, 1-(4-하이데옥시페닐)-4-페닐부탄, 1-(4-하이데옥시페닐)-4- 페닐-1 -부텐, 1-(4-하이데옥시페닐)-4-페닐-2-부텐, 1-(4-하이데옥시페닐)-4-페닐-2-부탄올, 1-(4-하이데옥시페닐)-4-페닐-2-부타논, 1-(4-하이데옥시페닐)-4-페닐-2,3-부탄디올, 1-(4-하이데옥시페닐)-4-페닐-3-하이드록시-2-부타논, 1-(인돌-3)-4-페닐부탄, 1-(인돌-3)-4-페닐-1-부텐, 1-(인돌-3)-4-페닐-2-부텐, l-(인돌-3)-4-페닐-2-부탄올, l-(인돌-3)-4-페닐-2-부타논, l-(인돌-3)-4-페닐-2,3-부탄디올, 1-(인돌-3)-4-페닐-3-하이드록시-2-부타논, 4-하이드록시페닐아세토알데하이드, 1,4-디(4-하이드록시페닐)부탄, 1,4-디(4-하이드록시페닐)-1-부텐, 1,4-디(4-하이드록시페닐)-2-부텐, 1,4-디(4-하이드록시페닐)-2-부탄올, 1,4-디(4-하이드록시페닐)-2-부타논, 1,4-디(4-하이드록시페닐)-2,3-부탄디올, 1,4-디(4-하이드록시페닐)-3-하이드록시-2-부타논, 1-(4-하이드록시페닐)-4-(인돌-3-)부탄, 1-(4-하이드록시페닐)-4-(인돌-3)-1-부텐, 1-디(4-하이드록시페닐)-4-(인돌-3)-2-부텐, 1-(4-하이드록시페닐)-4-(인돌-3)-2-부탄올, 1-(4-하이드록시페닐)-4-(인돌-3)-2-부타논, 1-(4-하이드록시페닐)-4-(인돌-3)-2,3-부탄디올, l-(4-하이드록시페닐하이드록시페닐-3-하이드록시-2-부타논, 인돌-3-아세토알데하이드, l,4-디(인돌-3-)부탄, l,4-디(인돌-3)-l-부텐, 1,4-디(인돌-3)-2-부텐, l,4-디(인돌-3)-2-부탄올, 1,4-디(인돌-3)-2-부타논, 1,4-디(인돌-3)-2,3-부탄디올, 1,4-디(인돌-3)-3-하이드록시-2-부타논, 숙시네이트 세미알데하이드, 헥산-l,8-디카르복실 에시드, 3-헥센-l,8-디카르복실 에시드, 3-하이드록시-헥산-l,8-디카르복실 에시드, 3-헥사논-l,8-디카르복실 에시드, 3,4- 헥산디올-l,8-디카르복실 에시드, 4-하이드록시-3-헥사논-l,8-디카르복실 에시드, 푸코이단, 이오딘, 클로로필, 카로티노이드, 칼슘, 마그네슘, 철, 나트륨, 칼륨, 인산염 등을 포함하지만, 이들로 한정되는 것은 아니다.
용어 "생물학적으로 활성인 단편"은 참조의 단편 또는 전체-길이 폴리뉴클레오타이드 또는 폴리펩타이드 서열에 적용되는 바와 같이 참조 서열의 활성의 적어도 약 0.1, 0.5, 1, 2, 5, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99%를 가지는 단편을 나타낸다. 참조 폴리뉴클레오타이드 또는 폴리펩타이드의 활성을 포함하거나 코딩하며, 길이가 적어도 약 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 또는 그 이상인 뉴클레오타이드 또는 잔기의 생물학적으로 활성인 단편들도 본 발명의 범위 내에서 포함된다. 대표적인 생물학적으로 활성인 단편들은 일반적으로 상호 작용, 예를 들면 분자내 또는 분자간 상호작용에 관여한다. 분자간 상호작용은 특정한 결합 상호작용 또는 효소적인 상호작용이 될 수 있다. 분자간 상호작용은 니코틴아미드 아데닌 다이튜클레오타이드(NAD+), NADH, 니코틴아미드 아데닌 다이뉴클레오타이트 포스페이트(NADP+), 또는 NADPH 분자들과 같은 ADH 폴리펩타이드와 보조인자 분자 사이의 상호작용이 될 수 있다. ADH 폴리펩타이드의 생물학적으로 활성인 부분들은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78중 어느 하나의 아미노산 서열들로부터 유래한 것과 충분한 유사성 또는 동일성을 가진 아미노산 서열을 포함하는 펩타이드를 포함한다.
"코딩 서열"은 유전자의 폴리펩타이드 생산을 위한 코드에 기여하는 임의의 핵산 서열을 의미한다. 반면, 용어 "비-코딩 서열"은 유전자의 폴리펩타이드 생산을 위한 코드에 기여하지 않는 임의의 염기 서열을 나타낸다.
본 명세서를 통해서, 문맥이 달리 요구하지 않는 한, 단어 "~들을 포함하다"(comprise), "~를 포함하다"(comprises), 및 "포함하는"(comprising)은 언급된 단계 또는 구성요소 또는 단계의 그룹 또는 구성요소들을 포함하지만, 어떠한 다른 단계 또는 구성요소 또는 단계의 그룹 또는 구성요소들을 제외하지 않는다는 것을 의미하는 것으로 해석된다. "~으로 구성된"(consisting of)은 포함하는 것을 의미하고, 어떠한 것이든 상기구절 "~으로 구성된"를 따르는 것들로 제한된다. 따라서 상기구절 "~으로 구성된"은 상기 기재된 구성요소들이 필요적 또는 의무적인 것을 나타내고, 어떤 다른 구성요소들이 존재할 수 없다는 것을 나타낸다. "필수적으로 구성된"은 상기구절 이후에 기재된 모든 구성요소들을 포함하는 것을 의미하고, 상기 기재된 구성요소들에 대해 본원 기술내용에서 언급된 활성이나 작용에 기여하거나 이를 방해하지 않는 다른 구성요소들로 제한된 것을 의미한다. 따라서 상기 구절 "필수적으로 구성된"은 상기 기재된 구성요소들이 필수적 또는 의무적인 것인 것을 나타내지만, 어떠한 다른 구성요소들도 임의적인 것이 아니며, 다른 구성요소들이 상기 기재된 구성요소들의 활성 또는 작용에 영향을 미치는지 여부에 따라서 존재하거나 존재하지 않을 수도 있다.
용어들 "상보적(complementary)" 및 "상보성(complementarity)"은 염기 짝짓기 법칙에 관련된 폴리뉴클레오타이드(예, 뉴클레오타이드의 서열)를 나타낸다. 예를 들어, 서열 "A-G-T"는 서열 "T-C-A"와 상보적이다. 상보성은 "부분적"일 수도 있는데, 단지 핵산 염기의 일부분만이 염기 짝짓기 법칙에 따라서 매치되는 것이다. 또는, 핵산 사이에 "완전한" 또는 "전체의" 상보성이 있을 수 있다. 핵산 가닥 사이에 상보성의 정도는 핵산 가닥들 사이의 혼성화의 효율성 및 세기에 중요하게 영향을 미친다.
"~에 상응하다"(corresponds to) 또는 "~에 상응하는"(corresponding to)은 (a) 펩타이드 또는 단백질에서 아미노산 서열과 동일한 아미노산 서열을 코딩하는 것, 또는 참조 뉴클레오타이드 서열의 전부 또는 일부에 실질적으로 동일하거나 또는 상보적인 뉴클레오타이드 서열을 가지는 폴리뉴클레오타이드, 또는 (b)참조 펩타이드 또는 단백질에서 아미노산의 서열과 실질적으로 동일한 아미노산 서열을 가지는 펩타이드 또는 폴리펩타이드를 의미한다.
"유도체"는 변이에 의해, 예를 들면 다른 화학적 부분과 결합 또는 합성에 의해 또는 본 기술분야에서 이해되는 바와 같은 번역후 변이 기술에 의해, 기본 서열로부터 유래한 폴리펩타이드를 의미한다. 상기 용어 "유도체"는 또한 기능적 균등 분자에 제공되는 부가 또는 삭제를 포함하는 친 서열(parent sequence)에 대해 이루어진 변화를 그 범위 내에 포함한다.
본원에 사용된, 용어들 "기능" 및 "기능적" 등은 생물학적, 효소적, 또는 치료적 기능을 나타낸다.
용어 "외인성의"(exogenous)는 일반적으로 야생형 세포 또는 유기체에서 자연적으로 발생하지 않는 폴리뉴클레오타이드 서열 또는 폴리펩타이드를 언급하지만, 보통 분자 생물학적 기술에 의해 세포 내로 도입되어 재조합 미생물을 생산한다. "외인성의" 폴리뉴클레오타이드의 예들은 벡터, 플라스미드, 및/또는 목적한 단백질이나 효소를 코딩하는 인공의 핵산구조를 포함한다. 용어 "내인성의"는 일반적으로 자연적으로 발생하는 폴리뉴클레오타이드 서열 또는 폴리펩타이드를 나타내는데, 이는 소정의 야생형 세포 또는 유기체에서 발견될 수 있다. 예를 들어, 특정의 자연적으로 발생하는 박테리아 또는 효모 종들은 일반적으로 벤조알데하이드 리아제 유전자(benzaldehyde lyase gene)를 포함하지 않으므로, 벤조알데하이드 리아제를 코딩하는 "내인성의" 폴리뉴클레오타이드 서열을 포함하지 않는다. 이와 관련하여, 유기체가 소정의 폴리뉴클레오타이드 서열이나 유전자의 내인성의 카피를 포함한다고 할지라도, 과발현하거나 또는 코딩된 단백질의 발현을 다르게 조절하는 것처럼, 서열을 코딩하는 플라스미드 또는 벡터로의 도입은, 그 유전자 또는 폴리뉴클레오타이드 서열의 "외인성의" 카피를 나타내는 것으로 또한 주지되어 있다. 본원에 기재된 경로들, 유전자, 또는 효소들 중 어느 것이나 "내인성의" 서열을 활용하거나 이에 의존할 수 있고, 또는 하나 이상의 "외인성의" 폴리뉴클레오타이드 서열로서 제공될 수 있고, 및/또는 소정의 미생물 내에 이미 포함된 내인성의 서열에 따라 이용할 수 있다.
"재조합" 미생물은 플라스미드 또는 벡터와 같은 하나 이상의 외인성 핵산 서열을 포함한다.
"미생물 시스템"(microbial system)은 일반적으로 배양기 또는 다른 타입의 미생물 배양 플라스크/장비/웰 안에 포함된 것, 또는 배양 접시(dish) 또는 플레이트에서 성장하는 것으로 발견된 것(예: 아가로스 포함 페트리 접시)과 같은 재조합 미생물의 개체군에 관한 것이다.
"유전자"는 염색체상에 특정한 유전자자리를 차지하는 유전 유닛을 의미하고, 또한 전사적 및/또는 번역적 조절 서열 및/또는 코딩 영역 및/또는 비해독 서열(예: 인트론, 5' 및 3' 비해독 서열)로 구성된다.
"상동성"은 동일하거나 또는 보존적 치환을 구성하는 핵산 또는 아미노산의 퍼센트 숫자를 나타낸다. 상동성은 참조로서 본원에 포함된 GAP (Deveraux et al., 1984, Nucleic Acids Research 12, 387-395)과 같은 서열 비교 프로그램을 사용하여 결정할 수 있다. 이런 방법으로 본원에 언급된 서열들과 유사하거나 또는 실질적으로 상이한 길이의 서열들은 상기 배열 내에 갭들(gaps)을 삽입하여 비교할 수 있는데, 그러한 갭들은 예를 들어 GAP을 사용한 비교 알고리즘에 의해 결정된다.
용어 "숙주세포"는 본 발명의 단리된 폴리뉴클레오타이드 또는 임의의 재조합 벡터(들)의 수용자가 될 수 있거나 수용자이었던 개별세포 또는 세포배양을 포함한다. 숙주세포들은 단일 숙주세포의 자손을 포함하며, 상기 자손은 자연적, 우연적, 또는 고의적 변이 및/또는 변화에 기인하여 본래의 친 세포와 (형태학 또는 전체 DNA 구성요소에서) 필수적으로 완전하게 동일할 수는 없다. 숙주세포는 재조합 벡터 또는 본 발명의 폴리뉴클레오타이드와 함께 생체내(in vivo ) 또는 시험관내(in vitro ) 이입된 또는 감염된 세포들을 포함한다. 본 발명의 재조합 벡터를 포함하는 숙주세포는 재조합 숙주세포이다.
"단리된"(isolated)은 보통 자연적 상태에서 그 자체를 동반하는 구성요소들이 실질적으로 또는 필수적으로 없는 물질을 의미한다. 예를 들어, 본원에서 사용된 "단리된 폴리뉴클레오타이드"는 폴리뉴클레오타이드를 나타내는데, 이는 자연적으로 발생하는 상태에서 폴리뉴클레오타이드의 옆에 배치되는 서열들로부터 정제된 것으로, 보통 단편에 인접해 있는 서열들로부터 제거된 DNA 단편을 예로 들 수 있다. 대안적으로, 본원에서 사용된 "단리된 펩타이드" 또는 "단리된 폴리펩타이드" 등은 자연적 세포 환경으로부터 및 세포의 다른 구성요소들과의 연합으로부터 펩타이드 또는 폴리펩타이드 분자의 시험관내 단리 및/또는 정제를 나타내는데, 예를 들어, 이는 생체내 물질과 연합되지 않는 것이다.
본원에서 사용된 용어로서, "다당류", "적합한 단당류" 또는 "적합한 올리고당류"는 미생물에서 에너지 및 탄소원으로서 사용될 수 있으며, 바이오연료 또는 바이오페트롤과 같은 탄화수소를 생산하는 바이오연료 생합성 경로에 사용하는데 적합할 수 있. 다당류, 적합한 단당류, 및 적합한 올리고당류의 예들은 알지네이트, 한천, 푸코이단(fucoidan), 펙틴, 글루로네이트(gluronate), 만누로네이트, 만니톨, 릭소스, 글리세롤, 자일리톨, 글루코스, 만노스, 갈락토스, 자일로스, 아라비노스, 글루쿠론산염, 갈락토루네이트, 람노오스, 및 2-케토-3-데옥시 D-글루코네이트-6-포스페이트(KDG) 등을 포함하지만, 이들로 한정되는 것은 아니다.
"로부터 얻어진"(obtained from)은 예를 들어 특정한 대상의 근원으로부터 유도된 또는 단리된 폴리뉴클레오타이드 추출물 또는 폴리펩타이드 추출물과 같은 샘플을 의미한다. 예를 들어, 상기 추출물은 대상으로부터 직접적으로 단리된 조직 또는 생물학적 체액으로부터 얻어질 수 있다.
본원에서 사용된 용어 "올리고당류"는 포스포다이에스터 결합(또는 연관된 구조적인 변이체 또는 그의 합성 아날로그)을 통해서 결합된 다수개의 뉴클레오타이드 잔기(데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 또는 연관된 구조학적 변이체 또는 그의 합성 아날로그)로 구성된 폴리머를 나타낸다. 따라서 상기 용어 "올리고당류"가 일반적으로 뉴클레오타이드 잔기들과 그들 사이의 결합 자연적으로 일어나는 뉴클레오타이드 폴리머를 나타내는데 반해, 상기 용어는 또한 펩타이드 핵산(PNAs), 포스포르아미데이트, 포스포로티오에이들, 메틸 포스페이트, 2-O-메틸 리보핵산 등을 포함하지만, 이들로 한정되는 것은 아니며, 그 범위 내에서 다양한 아날로그를 포함하는 것으로 이해될 것이다. 상기 분자의 정확한 사이즈는 특정 적용방법에 따라 다양할 수 있다. 올리고당류는 보통 길이가 다소 짧고, 일반적으로 약 10 내지 30개의 뉴클레오타이드 잔기이지만, 용어 "폴리뉴클레오타이드" 또는 "핵산"이 전형적으로 큰 올리고당류에 사용되고 있다고 할지라도, 상기 용어는 어떠한 길이의 분자들이나 나타낼 수 있다.
본원에서 사용된 용어 "작동가능하게 연결"은 프로모터의 제어성 조절하에 구조적 유전자를 배치한 다음 유전자의 전사 및 부가적인 번역을 조절하는 것을 의미한다. 이종프로모터/구조적 유전자 조합의 구조에서는, 자연적 상태에서 유전적 서열 또는 프로모터와 그것을 조절하는 유전자, 즉 유전자 서열 또는 프로모터로부터 유도되는 유전자, 사이의 거리와 대략 같은 거리인, 유전자 전사 시작 지점으로부터 일정한 거리에 유전자 서열 또는 프로모터를 배치하는 것이 일반적으로 바람직하다. 본 기술 분야에서 알려진 것과 같이, 이러한 거리에서의 일부 변화는 기능의 손실 없이 수행할 수 있다. 비슷하게, 조절하에 이종유전자를 배치하는 것에 관련하는 조절 서열 요소의 바람직한 배치는, 자연적인 상태에서 상기 요소, 그것이 유래하는 유전자들을 배치하는 것에 의해 정의된다.
본원에서 사용된 용어 경로, "최적화(optimized)"는 유전자, 폴리펩타이드, 효소, 또는 변화된 생물학적 활성을 가지는 다른 분자를 나타내는데, 예를 들어 폴리펩타이드의 아미노산 서열의 유전적 변화에 의해서 또는 폴리펩타이드 주위의 세포 환경의 변형/개질에 의해서, 원래 분자 또는 원래 세포 환경(예: 소정의 펩타이드의 야생형 서열 또는 야생형 미생물)에 대하여 그 기능적 특성을 향상시키는 것이다. 본원에서 기술된 폴리펩타이드 또는 효소의 어느 것이나 임의로 " 최적화" " 될 수 있으며, 또한 본원에서 기술된 유전자 또는 뉴클레오타이드 서열의 어느 것이나 임의로 최적화 폴리펩타이드 또는 효소를 코딩할 수 있다. 본원에서 기재된 경로중 어느 것이나 임의로 하나 이상의 "최적화" 효소, 또는 최적화 효소 또는 폴리펩타이드를 코딩하는 하나 이상의 뉴클레오타이드 서열을 포함할 수 있다.
전형적으로, 폴리펩타이드, 효소, 또는 다른 분자의 개선된 기능적 특성들은, 단당류 또는 올리고당류를 바이오연료로 전환하기 위한 생물학적 경로(예: 생합성 경로, C-C연결경로)에서 사용하기 위한 폴리펩타이드 또는 다른 분자의 적합성과 관련이 있다. 그러므로 특정 구현예들에서, "최적화" 생물학적 경로의 사용이 예상된다. 대표적인 "최적화" 폴리펩타이드는 그의 아미노산 코딩 서열(예, 점변이, 결실, 이종서열의 첨가)상에 하나 이상의 변형 또는 변이를 포함할 수 있으며, 이는 소정의 미생물 시스템 또는 미생물에서 개선된 발현 및/또는 안정성을 촉진하며, 원하는 기질(예, 유발적 또는 억제적인 활성)과 관련하여 폴리펩타이드 활성을 조절하게 하며, 세포(예, 세포내 국소화, 세포외 분비)내에서 폴리펩타이드의 국소화를 조정하며 및/또는 원하는 기질(예, 효소적 활성의 감소 또는 증가)과 관련하여 폴리펩타이드의 전체 활성 레벨에 영향을 미친다. 폴리펩타이드 또는 다른 분자는 또한 "최적화" 펩타이드 또는 다른 분자의 발현(예, 상향조절), 국소화 및/또는 활성을 조절하는 경로를 변형함으로써, 또는 다른 변형들 사이에서, 바라지 않는 부산물들의 생성을 최소화하는 경로를 변형함으로써, 그 시스템 또는 유기체 내에서 하나 이상의 경로들의 변형에 의해서 소정의 미생물 시스템 또는 미생물과 함께 사용하기 위해 "최적화" 될 수 있다. 이런 방법으로, 폴리펩타이드 또는 다른 분자는 그의 야생형 아미노산 서열 또는 본래의 화학적 구조의 변형이나 변형이 없이 "최적화" 될 수 있다.
특정 양태에서, "최적화" 유전자 또는 폴리펩타이드는 본원에 기술된 참조(예,야생형)유전자 또는 폴리펩타이드의 뉴클레오타이드 또는 아미노산 서열과 50%내지 99%(이들 사이의 모든 정수를 포함) 동일한 뉴클레오타이드 코딩 서열 또는 아미노산 서열을 포함할 수 있다. 특정 양태에서는, "최적화" 폴리펩타이드 또는 효소는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 100(이들 사이의 모든 정수 및 소수점을 포함,예, 1.2, 1.3, 1.4, 1.5, 5.5, 5.6, 5.7, 60, 70 등) 또는 그 이상의 배수의 참조 폴리펩타이드의 생물학적 활성을 가질 수 있다.
본원에서 사용된 용어 "폴리뉴클레오타이드" 또는 "핵산"은 mRNA, RNA, cRNA, cDNA 또는 DNA를 지칭한다. 상기 용어는 전형적으로 리보뉴클레오타이드 도는 데옥시뉴클레오타이드 중 하나이거나, 또는 두 타입의 뉴클레오타이드의 변이된 형태인, 길이가 적어도 10 염기인 뉴클레오타이드의 중합형태를 나타낸다. 상기용어는 DNA의 단일 및 이중 가닥 형태를 포함한다.
용어 "폴리뉴클레오타이드 변이체" 및 "변이체" 등은 참조 폴리뉴클레오타이드 서열 또는 하기에서 정의된 엄중조건 하에서 참조 서열과 혼성화된 폴리뉴클레오타이드와 동일한 실질적인 서열을 표시하는 폴리뉴클레오타드들을 나타낸다. 이러한 용어들은 또한 적어도 하나의 뉴클레오타이드의 첨가, 결실, 또는 치환에 의해서 참조 폴리뉴클레오타이드와 구별되는 폴리뉴클레오타이드를 포함한다. 따라서, 상기 용어 "폴리뉴클레오타이드 변이체" 및 "변이체"는 하나 이상의 뉴클레오타이드들이 첨가되거나 결실되거나 또는 다른 뉴클레오타이드로 치환된 폴리뉴클레오타이드를 포함한다. 이점에 있어서, 변이, 첨가, 결실, 및 치환을 포함하는 특정 변형들은, 변형된 폴리뉴클레오타이드가 참조 폴리뉴클레오타이드의 생물학적 기능 또는 활성을 유지하는 참조 폴리뉴클레오타이드로 만들어질 수 있다는 것은 본 기술 분야에서 잘 이해되고 있다. 폴리뉴클레오타이드 변이체들은 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 또는 37 중 어느 하나로 나타내는 서열과 적어도 50%(및 적어도 51% 내지 적어도 99% 및 이들 사이의 모든 정수 퍼센트) 서열 동일성을 가지는 폴리뉴클오타이드들을 포함한다. 상기 용어 "폴리뉴클레오타이드 변이체" 및 "변이체"는 또한 자연적으로 발생하는 대립 변이체들을 포함한다.
본원에서 상호교환적으로 사용된 "폴리펩타이드", "펩타이드" 및 "단백질"은 아미노산 잔기의 폴리머 및 변이체 그리고 그의 합성 아날로그를 나타낸다. 따라서, 이러한 용어들은 자연적으로 발생하는 아미노산들의 상응하는 화학적 아날로그들인 하나 이상의 아미노산 잔기들이 합성적 비자연적으로 발생하는 아미노산, 예를 들어 아미노산 폴리머에 적용될 수 있고, 또한 자연적으로 생긴 아미노산 폴리머에도 또한 적용될 수 있다.
본원에서 사용된 용어 "ADH 폴리펩타이드" 또는 "그의 변이체"는 제한없이 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78중 어느 하나로 나타내는 서열과 적어도 50% (및 적어도 51%내지 적어도 99%까지 그리고 이들 사이의 모든 정수 퍼센트)서열 동일성을 공유하는 아미노산 서열을 가지는 폴리펩타이드들을 포함한다. 이러한 용어들은 하나의 박테리아 종으로부터 또 다른 종에까지 존재하거나 생길 수도 있는 ADH 폴리펩타이드의 자연적 대립 변이체들을 추가로 포함한다.
ADH 폴리펩타이드, 및 그의 변이체들은 야생형 ADH 폴리펩타이드들의 특이적 활성을 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 110%, 120%, 및 130%를 나타내는 폴리펩타이드들을 포함한다(예, DEHU 하이드로게나제 활성 및/또는 D-만누로네이트 하이드로게나제 활성을 포함하며, 알코올 디하이드로게나제 활성을 가짐). 야생형 ADH 폴리펩타이드들과 비교하여 실질적으로 동일하거나 개선된 생물학적 활성을 가지는 ADH 폴립펩타이드 및 그의 변이체들은, 야생의 폴리펩타이드들의 특이적 생물학적 활성을 적어도 약 25%, 50%, 75%, 100%, 110%, 120% 또는 130% 나타내는 폴리펩타이드들을 포함한다. 본 출원의 목적을 위해, ADH 관련의 생물학적 활성은, 예를 들어 ADH 폴리펩타이드 또는 그의 변이체의 능력을 측정하여, 기질로서 DEHU 또는 D-만누로네이트을 사용하여 NADPH를 소비하는 것으로 정량화할 수도 있다(예, 실시예 2 참고). 야생형 ADH와 비교하여 실질적으로 저하된 생물학적 활성을 갖는 ADH 폴리펩타이드 및 그의 변이체들은 야생형 ADH의 특이적 활성의 약 25%, 10%, 5% 또는 1% 미만을 나타내는 것들이다.
상기 인용된 폴리펩타이드 "변이체"는 적어도 하나의 아미노산 잔기의 첨가, 결실, 또는 치환에 의해서 참조 폴리펩타이드와 구별되는 폴리펩타이드들을 나타낸다. 특정 구현예들에서, 폴리펩타이드 변이체는 하나 이상의 치환에 의해서 참조 폴리펩타이드와 구별되는데, 이는 보존적 또는 비보존적일 수 있다. 특정 구현예들에서, 상기 폴리펩타이드 변이체는 보존적인 치환들을 포함하고, 이점과 관련하여 일부 아미노산들이 상기 폴리펩타이드의 자연적 활성의 변화없이 넓게 유사한 성질을 갖는 다른 것들로 바뀔 수 있다는 것은 본 기술분야에서 잘 이해되고 있다. 또한 폴리펩타이드 변이체들은 하나 이상의 아미노산이 첨가되거나 결실, 또는 다른 아미노산 잔기들로 치환된 폴리펩타이드들을 포함한다.
본 발명은 전체-길이 ADH 서열들과 그들의 생물학적으로 활성인 단편들의 본 출원의 방법 및 미생물 시스템에서의 사용을 고려한다. 전형적으로, 전체-길이 ADH 폴리펩타이드의 생물학적으로 활성인 단편들은 분자 내 또는 분자 사이의 상호작용과 같은 상호작용에 관여할 수 있다. 분자 사이에 상호작용은 특이적 결합 상호작용 또는 효소적 상호작용일 수 있다(예, 상호작용은 일시적일 수 있고 또한 공유결합은 형성되거나 깨질 수 있다). 전체-길이 ADH 폴리펩타이드의 생물학적으로 활성인 단편들은, (추정의) 전체-길이 ADH의 아미노산 서열들과 충분히 유사하거나 이들로부터 유래한 아미노산 서열을 포함하는 펩타이드들을 포함한다. 전형적으로, 생물학적으로 활성인 단편들은 전체-길이 ADH 폴리펩타이드의 적어도 하나의 활성을 가지는 도메인 또는 모티프를 포함하며, 하나 이상(및 일부 경우 전부)의 다양한 활성 도메인들을 포함할 수 있다. 그리고 알코올 디하이드로게나제 활성, DEHU 하이드로게나제 활성, 및/또는 D-만누로네이트 하이드로게나제 활성과 같은, 하이드로게나제 활성을 가진 단편들을 가지는 단편들을 포함한다. 전체-길이 ADH 폴리펩타이드의 생물학적으로 활성인 단편은 폴리펩타이드일 수 있는데, 예를 들어, 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 어느 하나의 아미노산 서열들의 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 120, 150, 또는 그 이상의 인접한 아미노산들이다. 특정 구현예들에서, 생물학적으로 활성인 단편들은 본원에서 기재된 NAD+, NADH, NADP+, 또는 NADPH 결합 모티프를 포함한다. 적합하게는, 상기 생물학적으로 활성인 단편은 그것이 유래한 전체-길이 폴리펩타이드의 활성의 약 1%, 10%, 25% 50% 만큼을 가진다.
본원에서 사용된 용어들, 예를 들어 "50% 동일한 서열"을 포함하는, "서열 동일성"은 비교 윈도우상에서 핵산 대 핵산 기본 또는 아미노산 대 아미노산 기본으로 서열들이 동일한 정도를 나타낸다. 따라서, "서열 동일성의 퍼센트"는 비교 윈도우 상에서 두 개의 최적으로 정렬된 서열들을 비교하고, 동일한 핵산 염기(예, A, T, C, G, I) 또는 동일한 아미노산 잔기(예, Ala, Pro, Ser, Thr, GIy, VaI, Leu, He, Phe, Tyr, Tip, Lys, Arg, His, Asp, GIu, Asn, GIn, Cys 및 Met)가 두 개의 서열에서 발생하여 부합되는 부분들의 숫자를 산출하는 부분들의 숫자를 결정하고, 상기 부합된 부분들의 숫자를 비교의 윈도우(예, 윈도우 사이즈)에서 전체 부분들의 숫자로 나눈 후, 그 결과를 100으로 곱하여 서열 동일성의 퍼센트를 산출함으로써 계산된다.
두 개 이상의 폴리뉴클레오타이드 또는 폴리펩타이드 사이의 서열 관계들을 기술하는데 사용된 용어들은 "참조 서열", "비교 윈도우", "서열 동일성", "서열 동일성의 퍼센트", 및 "상당한 동일성"을 포함한다. "참조 서열"은 뉴클레오타이드 및 아미노산 잔기들을 포함하는, 길이가 적어도 12 그러나 자주 15내지 18 및 종종 적어도 25개인 모노머 유닛들이다. 두 개의 폴리펩타이드는 각각 (1) 두 개의 폴리펩타이드들 사이에서 유사한 서열(즉, 완전한 폴리뉴클레오타이드 서열의 일부), 및 (2) 두 개의 폴리펩타이드들 사이에서 분기하는 서열을 포함하고 있기 때문에, 두 개(또는 그 이상)의 폴리뉴클레오타이드 사이에서 서열 비교들은 일반적으로 서열 유사성의 국소 지역들을 확인 및 비교하기 위해 "비교 윈도우"를 통해 두 개의 폴리펩타이드의 서열들을 비교함으로써 수행됐다. "비교 윈도우"는 두 개의 서열들이 최적으로 정렬된 후에, 서열을 인접 부분들의 같은 숫자의 참조 서열과 비교할 때 적어도 6개의 인접 부분들, 일반적으로 약 50내지 약 100, 더욱 일반적으로는 약 100내지 150의 컨셉적인 단편(conceptual segment)을 나타낸다. 상기 비교 윈도우는 두 개의 서열들의 최상의 정렬을 위해 참조 서열(첨가 또는 결실을 포함하지 않음)과 비교할 때, 약 20% 또는 그 미만의 첨가 또는 결실(예, 갭들)을 포함할 수도 있다. 비교 윈도우를 정렬하기 위한 서열들의 최적의 정렬은 알고리즘의 컴퓨터화된 실행(GAP, BESTFIT, FASTA, 및 TFASTA in the Wisconsin Genetics Software Package Release 7.0, Genetics Computer Group, 575 Science Drive Madison, WI, USA)을 통해서 또는 검사를 통해서 수행할 수 있다. 그리고 최상의 정렬(예, 비교 윈도우상에서 가장 높은 퍼센트 상동성을 야기하는 것)은 선택된 여러가지 방법들 중 하나에 의해서 만들어질 수도 있다. 예를 들면 Altschul et al., 1997, Nucl . Acids Res . 25:3389에 기재된 프로그램들의 BLAST 패밀리를 참조할 수 있다. 서열분석의 상세한 논의는 Ausubel et al, "Current Protocols in Molecular Biology", John Wiley & Sons Inc, 1994-1998, Chapter 15의 Unit 19.3에서 찾을 수 있다.
"벡터"는 폴리뉴클레오타이드 분자를 의미하는 것으로, 바람직하게는 플라스미드, 박테리오파지, 효모, 또는 바이러스로부터 유래한 DNA분자인 것이며, 폴리펩타이드로 삽입되거나 클로닝될 수 있다. 벡터는 바람직하게는 하나 이상의 특정 제한 부위들을 포함하며, 또한 표적세포, 또는 조직, 또는 전구세포, 또는 그들의 조직을 포함하는, 소정의 숙주 세포에서 자율 복제를 할 수 있거나, 또는 클로닝 된 서열이 재생가능하도록 소정의 숙주세포의 게놈으로 통합될 수 있는 것이다. 따라서, 상기 벡터는 추가의-염색체적 독립체로서 존재하는 벡터와 같은 자율적으로 복제되는 벡터일 수 있고, 그의 복제는, 예를 들어 선형 또는 닫힌 원형 플라스미드, 추가의-염색체적 요소, 미니-염색체, 또는 인공적인 염색체 같은 염색체 복제에 독립적이다.상기 벡터는 자가복제를 보장하는 임의의 수단들을 포함할 수 있다. 대안적으로, 상기 벡터는 숙주세포 내로 도입될 때, 게놈으로 통합되고 그리고 통합된 염색체(들)과 함께 복제될 수 있다. 벡터 시스템은 단일 벡터 또는 플라스미드, 두개 이상의 벡터들 또는 플라스미드들을 포함할 수 있고, 이는 숙주 세포의 게놈, 또는 트랜스포슨으로 도입되기 위해 전체 DNA를 함께 포함할 수 있다. 상기 벡터의 선택은 전형적으로 벡터가 도입되어 지는 숙주세포와 벡터의 상용성에 의존할 것이다. 본 경우에는, 상기 벡터는 박테리아 세포에서 작동가능하게 기능적인 것이 바람직하다. 상기 벡터는 또한 적합한 형질전환체들의 선별에 이용가능한 항생제 내성 유전자와 같은 선별 마커를 포함할 수 있다.
용어 "야생형" 및 "자연적으로 발생하는"은 여기서 상호교환적으로 사용되는데, 자연적으로 발생하는 근원으부터 단리될 때의 유전자 또는 유전자 산물의 특징을 가지는 유전자 또는 유전자 산물을 나타낸다. 야생형 유전자 또는 유전자 산물(예: 폴리펩타이드)은 개체군에서 가장 흔하게 관찰되므로 유전자의 "정상" 또는 "야생형" 형태로 임의적으로 고안된다.
본 발명의 구현예들은 박테리아 디하이드로게나제 유전자의 단리 및 특성화에 관한 것이며, 이러한 유전자들에 의해서 코딩된 폴리펩타이드에 관한 것이다. 특정 구현예들은 알코올 디하이드로게나제 활성을 가지는 단리된 디하이드로게나제 폴리펩타이드들을 포함할 수 있는데, 이는 알코올 디하이드로게나제(ADH) 폴리펩타이드들로 언급할 수 있다. 본 출원에 따른 ADH 폴리펩타이드는 DEHU 하이드로게나제 활성, D-만누로네이트 활성, 또는 DEHU 하이드로게나제와 D-만누로네이트 활성을 가질 수 있다. 다른 구현예들은 이러한 폴리펩타이드를 코딩하는 폴리뉴클레오타이드를 포함할 수도 있다. 예를 들어, 본 출원의 분자들은 하기 (a) 내지 (f)로부터 선택된 단리된 폴리뉴클레오타이드, 및 그의 단편 또는 변이체들을 포함할 수 있는데,
(a) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 80% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(b) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 90% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(c) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 95% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(d) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 97% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(e) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 99% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드; 및
(f) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드,
여기서 상기 단리된 뉴클레오타이드는 디하이드로게나제 활성을 가지는 폴리펩타이드를 코딩한다. 특정 구현예들에서, 상기 폴리펩타이드는 DEHU 하이드로게나제 활성 및/또는 D-만누로네이트 하이드로게나제 활성과 같은 알코올 하이드로게나제 활성을 가진다.
본 발명의 분자들은 또한 단리된 ADH 폴리펩타이드, 또는 그의 변이체, 단편, 또는 유도체를 포함할 수도 있는데, 그 구현예들은 하기 (a)에서 (f)로부터 선택되며,
(a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(b) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(c) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(d) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(e) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드; 및
(f) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열을 포함하는 단리된 폴리펩타이드,
여기서 상기 단리된 폴리펩타이드는 디하이드로게나제 활성을 갖는다. 특정 구현예들에서, 상기 폴리펩타이드는 DEHU 하이드로게나제 활성 및/또는 D-만누로네이트 하이드로게나제 활성과 같은, 알코올 하이드로게나제 활성을 가진다.
추가적인 구현예들에서, 본원에 기재된 단리된 폴리뉴클레오타이드는 니코틴아미드 아데닌 다이뉴클레오타이드(NAD+), NADH, 니코틴아미드 아데닌 다이뉴클레오타이드 포스페이트(NADP+), 또는 NADPH 결합 모티프의 적어도 하나를 포함하는 폴리펩타이드를 코딩한다. 다른 구현예들은 본원에 기재된 바와 같이 단리된 ADH 폴리펩타이드, 그의 변이체, 단편, 또는 유도체를 포함하는데, 여기서 상기 폴리펩타이드는 NAD+, NADH, NADP+, 또는 NADPH 결합 모티프의 적어도 하나를 포함한다. 특정 구현예들에서, 상기 결합 모티프는 Y-X-G-G-X-Y(서열번호 67), Y-X-X-G-G-X-Y(서열번호 68), Y-X-X-X-G-G-X-Y(서열번호 69), Y-X-G-X-X-Y(서열번호 70), Y-X-X-G-G-X-X-Y(서열번호 71), Y-X-X-X-G-X-X-Y(서열번호 72), Y-X-G-X-Y (서열번호 73), Y-X-X-G-X-Y(서열번호 74), Y-X-X-X-G-X-Y(서열번호 75), 및 Y-X-X-X-X-G-X-Y(서열번호 76)로 이루어진 그룹으로부터 선택되며, 여기서 상기 Y 는 알라닌, 글라이신, 및 세린으로부터 독립적으로 선택되고, G 는 글라이신이고, X 는 유전적으로 코딩된 아미노산으로부터 독립적으로 선택된다. 특정 이론에 의해 구속됨이 없이, NAD+ 및 연관된 분자들은 디하이드로게나제 반응에서 보조인자로서 작용을 하고, 이러한 결합 모티프들은 일반적으로 알코올 디하이드로게나제에서 보존되고 NAD+, NADH, NADP+, 또는 NADPH 결합에 중요한 역할을 한다.
본 출원에 포함된 변이 단백질들은 생물학적으로 활성을 가진다. 즉, 이들은 천연 단백질의 원하는 생물학적 활성을 가지는 것을 지속하는 것이다. 이러한 변이체들은 유전적 다형성 또는 인간 조작의 결과일 수 있다. 천연 또는 야생형 ADH 폴리펩타이드의 생물학적으로 활성인 변이체들은, 본원의 다른 부분에서 기술된 디폴트 파라미터들(default parameters)을 사용하여 서열 정열 프로그램에 의해 결정하는 경우, 적어도 40%, 50%, 60%, 70%, 일반적으로 적어도 75%, 80%, 85%, 통상적으로 약 90% 내지 95% 또는 그 이상, 및 전형적으로 약 98% 또는 그 이상, 천연 단백질의 아미노산 서열과 서열 유사성이나 동일성을 가질 것이다. 야생형 ADH 폴리펩타이드의 생물학적으로 활성인 변이체는, 일반적으로 200, 100, 50 또는 20 만큼의 아미노산 잔기들, 또는 적합하게 겨우 1-15개의 아미노산 잔기들, 1-10, 6-10, 5, 4, 3, 2개의 아미노산 잔기들 또는 단 하나의 아미노산 잔기만큼 단백질과 다를 수 있다. 일부 구현예들에서, ADH 폴리펩타이드는 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 에서 상응하는 서열들과 적어도 하나 그러나 15, 10, 또는 5개의 아미노산 잔기들 미만으로 다르다. 다른 구현예들에서, ADH 폴리펩타이드는 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는78에서 상응하는 서열들과 적어도 하나의 잔기 그러나 잔기들의 20%, 15%, 10% 또는 5% 미만이 다르다.
ADH 폴리펩타이드는 아미노산 치환, 결실, 절단, 및 삽입을 포함하는 여러 가지 방법으로 변형될 수 있다. 그러한 조작의 방법은 본 기술분야에서 일반적으로 알려진 것이다. 예를 들어, ADH 폴리펩타이드의 아미노산 서열 변이체들은 DNA내에서 변이(mutations)에 의해서 제조할 수 있다. 돌연변이 유발 및 뉴클레오타이드 서열 변형의 방법들은 본 기술분야에서 잘 알려진 것이다. 예를 들어, Kunkel (1985, Proc . Natl . Acad . ScL USA . 82: 488-492), Kunkel et al, (1987, Methods in Enzymol, 154: 367-382), U.S. Pat. No. 4,873,192, Watson, J. D. et al, ("Molecular Biology of the Gene", Fourth Edition, Benjamin/Cummings, Menlo Park, Calif, 1987) 및 여기에 기재된 문헌들을 참조하라. 관심(interest) 단백질의 생물학적 활성에 영향을 주지않는 적절한 아미노산 치환에 대한 가이드라인은 Dayhoff et al.,(1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.)의 모델에서 찾을 수 있다. 점변이 또는 결실에 의해 만들어진 조합적인 라이브러리의 유전자 산물의 스크리닝 방법, 및 선택된 성질을 가지는 유전자 산물에 대한 cDNA 라이브러리를 스크리닝하는 방법은 본 기술분야에 알려져 있다. 그러한 방법들은 ADH 폴리펩타이드들의 조합적인 돌연변이 유발에 의해 만들어진 유전자 라이브러리의 빠른 스크리닝에 적합할 수 있다. 라이브러리 내에서 기능적 변이체의 빈도를 높이는 기술인, Recursive ensemble mutagenesis (REM)은 ADH 폴리펩타이드 변이체들을 확인하기 위한 스크리닝 분석과 조합하여 사용될 수 있다(Arkin and Yourvan (1992) Proc . Natl . Acad . Sci. USA 89: 7811- 7815; Delgrave et al., (1993) Protein Engineering, 6: 327-331). 하나의 아미노산을 비슷한 성질을 가진 다른 것과 교환하는 것과 같은 보존적인 치환들은, 이하에서 더욱 상세하게 논의되는 바와 같이 바람직할 수 있다.
변이 ADH 폴리펩타이드는 친 ADH 아미노산 서열과 비교할 때, 그들의 서열에 따르는 다양한 위치들에서 보존적인 아미노산 치환을 포함할 수 있다. "보존적인 아미노산 치환"은 아미노산 잔기가 유사한 곁사슬을 가지는 아미노산 잔기로 대체되는 것이다. 유사한 곁사슬을 가지는 아미노산 잔기군은 본 기술분야에 정의되었고, 일반적으로 아래와 같이 하위분류될 수 있다:
산성: 잔기가 생리학적 pH상태에서 수소 이온을 잃어서 음전하를 가지며, 또한 잔기는 펩타이드가 생리학적 pH상태에서 수용성 매체에 있을 때 포함되는 펩타이드의 형성에서 표면 자리를 찾도록 수용성에 의해서 끌어당겨 진다. 산성 곁사슬을 가지는 아미노산은 글루탐산 및 아스파르트산을 포함한다.
염기성: 잔기가 생리학적 pH상태 또는 그들의 하나 또는 두 개의 pH 유닛(예: 히스티딘) 내에서 수소 이온과 작용하여 양전하를 가지며, 또한 잔기는 펩타이드가 생리학적 pH 상태에서 수용성 매체에 있을 때 포함되는 펩타이드의 형성에서 표면 자리를 찾도록 수용성에 의해서 끌어당겨 진다. 염기성 곁사슬을 가지는 아미노산은 아르기닌, 라이신, 및 히스티딘을 포함한다.
충전된(Charged): 잔기들이 생리학적 pH상태에서 충전되고, 따라서 산성 또는 염기성 곁사슬을 가지는 아미노산을 포함한다(예, 글루탐산, 아스파르트산, 아르기닌, 라이신 및 히스티딘).
소수성: 잔기는 생리학적 pH에서 충전되지 않으며, 또한 잔기는 펩타이드가 수용성 매체에 있을 때 포함되는 펩타이드의 형성에서 내부 자리를 찾도록 수용성에 의해서 반발한다. 소수성 곁사슬을 가지는 아미노산은 티로신, 발린, 이소류신, 류신, 메티오닌, 페닐알라닌, 및 트립토판을 포함한다.
중성/극성: 잔기들은 생리학적 pH에서 충전되지 않으나, 잔기는 수용성에 의해서 충분히 반발하지 않는다. 따라서 잔기는 펩타이드가 수용성 매체에 있을 때 포함되는 펩타이드의 형성에서 내부 자리를 찾으려한다. 중성/극성 곁사슬을 가지는 아미노산은 아스파라긴, 글루타민, 시스테인, 히스티딘, 세린, 및 트레오닌을 포함한다.
이 설명은 또한 아미노산들의 곁사슬이 소수성이 되기에 충분히 크지 않기 때문에, 극성 그룹이 빠져있다 할지라도, 특정 아미노산을 "작은"으로 특성화한다. 프롤린을 제외하고, "작은" 아미노산들은 적어도 하나의 극성 그룹이 곁사슬에 있을 때 4개나 그 미만의 탄소를 가지는 것 및 극성 그룹이 없을 때 세 개나 그 미만의 탄소를 가지는 것이다. 작은 곁사슬을 가지는 아미노산들은 글라이신, 세린, 알라닌, 및 트레오닌을 포함한다. 유전자-코딩 이차적 아미노산 프롤린은 펩타이드 사슬들의 형성에서 잘 알려진 효과 때문에 특별한 경우이다. 프롤린의 구조는 그 잔기가 α-아미노 그룹 및 α- 탄소의 질소에 결합한다는 점에서 모든 다른 자연적으로 발생하는 아미노산과 다르다. 그러나 여러 개의 아미노산 유사성 매트릭스들[예, Dayhoff et al., (1978)에 예로써 기재된 바와 같은 PAMl20 matrix 및 PAM250 matrix, A model of evolutionary change in proteins. M. O. Dayhoff, (ed.), Atlas of protein sequence and structure, Vol. 5, pp. 345-358, National Biomedical Research Foundation, Washington DC; and by Gonnet et al., (1992, Science, 256(5062): 14430-1445)에서 거리 관계들을 결정하기 위한 매트릭스들]은, 글라이신, 세린, 알라닌, 및 트레오닌과 같은 그룹에서 프롤린을 포함한다. 따라서, 본 발명의 목적으로, 프롤린은 "작은" 아미노산으로서 분류된다.
극성 또는 비극성의 분류를 위한 끌림 또는 반발의 정도는 임의적인 것이므로, 본 발명에 의해 구체적으로 고려된 아미노산들은 극성 또는 비극성으로 분류되어 졌다. 구체적으로 명명되지 않은 대부분의 아미노산들은 알려진 거동(behaviour)에 기초하여 분류될 수 있다.
아미노산 잔기들은 추가로 환상 또는 비환상, 및 방향성 또는 비방향성, 잔기들의 곁사슬 치환 그룹들에 관한 자명한 분류들, 및 작은 또는 큰과 같이 하위 분류될 수 있다. 만약 잔기가, 추가적인 극성 치환이 존재한다는 조건하에, 카르복실 탄소를 포함하며, 총 4개 또는 그 미만의 탄소 원자를 가지면, 그 잔기는 작은 것으로 간주된다; 그렇지 않은 경우는 세 개 또는 그 미만이다. 물론 작은 잔기들은 항상 비방향성이다. 잔기들의 구조적인 성질에 따라, 아미노산 잔기들을 둘 또는 그 이상의 클래스로 나눌 수 있다. 자연적으로 발생하는 단백질 아미노산의 경우, 이 체계에 따른 하위 분류는 표 A에서 나타내었다.
[표 A]
Figure pct00001
보존적인 아미노산 치환은 또한 곁사슬에 기초한 그룹들을 포함한다. 예를 들어, 지방족 곁사슬을 가지는 아미노산 그룹은 글라이신, 알라닌, 발린, 류신, 및 이소류신이다; 지방족-하이드록실 곁사슬을 가지는 아미노산 그룹은 세린, 트레오닌이다; 아미드-함유 곁사슬을 가지는 아미노산 그룹은 아스파라긴 및 글루타민이다; 방향족 곁사슬을 가지는 아미노산 그룹은 페닐알라닌, 티로신, 및 트립토판이다; 염기성 곁사슬을 가지는 아미노산 그룹은 라이신, 아르기닌, 및 히스티딘이다; 그리고 황-함유 곁사슬을 가지는 아미노산 그룹은 시스테인 및 메티오닌이다.예를 들어, 류신을 이소류신이나 발린으로, 아스파르테이트를 글루타메이트로, 트레오닌을 세린으로의 대체, 또는 아미노산을 구조적으로 연관된 아미노산으로 유사한 대체는 수득된 변이 폴리펩타이드의 영역들에 중대한 영향을 미치지 않을 것이라고 기대되는 것이 타당하다. 아미노산 변화가 기능적 ADH 폴리펩타이드를 일으키는지 여부는 본원에 기술된 것처럼 그의 활성의 분석에 의해서 쉽게 결정될 수 있다(예, 실시예 2 참고). 보존적인 치환들은 예시적인 치환의 항목 밑에 표 B에서 나타낸다. 본 발명의 범위에 포함되는 아미노산 치환은, 일반적으로, (a) 치환지역에서 펩타이드 백본의 구조, (b) 표적 부위에서 분자의 충전되거나 수소성, 또는 (c) 곁사슬의 벌크를 유지하는데 있어서 효과면에서 현저하게 다르지 않는 치환을 선택함으로써 이루어진다. 치환이 도입된 후에, 변이체들은 생물학적 활성을 위해 스크리닝 된다.
[표 2]
예시적인 아미노산 치환들
Figure pct00002
대안적으로, 보존적인 치환들을 만들기 위한 유사한 아미노산은 곁사슬들의 동일성에 기초하여 3가지 카테고리로 분류할 수 있다. 첫 번째 그룹은 글루탐산, 아스파르트산, 아르기닌, 라이신, 히스티딘을 포함하고, 이들 모두가 충전된 곁사슬을 가진다; 두 번째 그룹은 글라이신, 세린, 트레오닌, 시스테인, 티로신, 글루타민, 아스파라긴을 포함한다; 그리고 세 번째 그룹은 Zubay, G., Biochemistry, third edition, Wm. C. Brown Publishers (1993)에 기술되어 있는 바와 같이 류신, 이소류신, 발린, 알라닌, 프롤린, 페닐알라닌, 트립토판, 메티오닌을 포함한다.
따라서, ADH 폴리펩타이드에서 예상되는 비필수적 아미노산 잔기는 전형적으로 같은 사슬 패밀리로부터의 다른 아미노산 잔기로 대체된다. 대안적으로, 예를 들면 변이들은 포화 돌연변이 유발에 의해 ADH 코딩 서열의 전부 또는 일부를 따라 불규칙적으로 도입될 수 있다. 또한 수득된 돌연변이는 전부 그 활성을 유지하는 돌연변이들을 확인하기 위해 친 폴리펩타이드(parental polypeptide)의 활성을 스크리닝 할 수 있다. 코딩하는 서열들의 돌연변이 유발 후에, 상기 코딩된 펩타이드는 재조합에 의해 발현될 수 있고 펩타이드의 활성이 결정될 수 있다. "비필수적인" 아미노산 잔기는 그의 활성들의 하나 이상을 파괴하거나 실질적으로 변형하지 않고, 실시예 폴리펩타이드의 야생형 서열로부터 변형될 수 있는 잔기이다. 적합하게는, 상기 변형은 예를 들면 이러한 활성들의 하나를 실질적으로 변형하지 않으며, 그 활성은 야생형의 적어도 20%, 40%, 60%, 70% 또는 80%이다. 예시하는 비필수적인 아미노산 잔기들은 도 2-21에서 나타낸 야생형 ADH 폴리펩타이드들 사이에서 같은 부분에서 다른 어떤 하나나 그 이상의 아미노산 잔기들을 포함한다. "필수적인" 아미노산 잔기는, 참조 ADH 폴리펩타이드의 야생형 서열로부터 변형될 때, 야생형 활성의 20% 미만이 존재하는 부모 분자의 활성의 파괴를 야기하는 잔기이다. 예를 들어, 그러한 필수적인 아미노산 잔기들은 다른 종들 전체에 걸친 ADH 폴리펩타이드에서 보전된 것들로, 예로는 여러가지 박테리아 원으로부터의 ADH 폴리펩타이드의 NADH 결합 자리에서 보전된 G-X-G-G-X-G(서열번호:77)가 있다.
따라서, 본 발명의 구현예들은 또한 ADH 폴리펩타이로서 자연적으로 발생하는 ADH 폴리펩타이드 서열들의 변이체들 또는 그들의 생물학적으로 활성인 단편들을 고려하는데, 여기서 상기 변이체들은 하나 이상의 아미노산 잔기의 첨가, 결실, 또는 치환에 의해서 자연적으로 발생하는 서열과 구분된다. 일반적으로, 변이체들은 예를 들면 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 바와 같은 친 ADH 폴리펩타이드 서열에 대해 적어도 약 30, 40, 50, 55, 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%의 유사성을 나타낼 것이다. 특정 변이체들은 예를 들면 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 바와 같은 친 ADH 폴리펩타이드 서열에 대해, 적어도 30, 40, 50, 55, 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99%의 서열 동일성을 가질 것이다. 더욱이, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60 ,70, 80, 90, 100 또는 그 이상의 아미노산들의 첨가, 결실, 또는 치환에 의해 천연 또는 친 서열들과 상이하지만 친 ADH 폴리펩타이드의 성질을 유지하는 서열들이 고려된다.
일부 구현예들에서는, 변이 폴리펩타이드는 참조 ADH 서열과 적어도 하나 그러나 50, 40, 30, 20, 15, 10, 8, 6, 5, 4, 3 또는 2 미만의 아미노산 잔기(들)과 다르다. 다른 구현예들에서, 변이 폴리펩타이드들은, 서열번호 2, 4, 6, 8, 10 및 12의 상응하는 서열들과 적어도 1% 다르지만 20%, 15%, 10% 또는 5% 미만의 잔기들이 다르다. (이러한 비교가 정렬을 요구하는 경우, 그 서열들은 최대 유사성으로 정렬되어야만 한다. 결실 또는 삽입, 또는 미스매치로부터 "고리가 달려(Looped)" 빠진 서열들은 차이점이 있는 것으로 고려된다). 상기 차이점은 적합하게는, 비필수적인 잔기 또는 보존적인 치환에서의 변화 또는 차이이다.
특정한 구현들예에서는, 변이 폴리펩타이드는 예를 들어 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 바와 같은 ADH 폴리펩타이드의 상응하는 서열에 대하여 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94% 95%, 96%, 97%, 98%, 또는 그 이상의 유사성을 가지는 아미노산 서열을 포함하며 또한 ADH 폴리펩타이드의 활성을 가진다
서열들 사이에 서열 유사성 또는 서열 동일성(본원에서 상기 용어들은 상호교환적으로 사용됨)의 계산은 아래와 같이 수행된다.
두 개의 아미노산 서열들 또는 두개의 핵산 서열들의 퍼센트 동일성을 결정하기 위해, 서열들을 최적의 비교목적으로 정렬한다(예, 갭들은 첫 번째와 두번째 아미노산의 하나 또는 두 개 모두에 도입될 수 있으며 최적 정렬용 핵산 서열, 및 비 상동성 서열은 비교목적으로 무시될 수 있다). 특정 구현예들에서, 비교목적으로 정렬된 참조 서열 길이의 적어도 30%, 바람직하게는 적어도 40%, 더욱 바람직하게는 적어도 50% 및 60%, 그리고 더더욱 바람직하게는 참조서열의 길이에 적어도 70%, 80%, 90%이다. 다음에 상응하는 아미노산 부위들 또는 뉴클레오타이드 부위에서 상응한 아미노산 잔기 또는 뉴클레오타이드를 비교한다. 첫번째 서열의 한 부분이 두번째 서열에서의 상응하는 부분과 같은 아미노산 잔기 또는 뉴클레오타이드로 차지하는 경우, 그 분자들은 그 부분에서 동일하다.
두 개의 서열들 사이의 퍼센트 동일성은 갭들의 숫자 및 각 갭의 길이를 고려하여, 서열에 의해 공유되는 동일 부위들의 숫자의 관수이며, 이것은 두 개의 서열들의 최적 정렬을 위해 도입할 필요가 있다.
두 개의 서열들 사이의 서열들의 비교 및 퍼센트 동일성의 결정은 수학적인 알고리즘을 이용해서 수행할 수 있다. 바람직한 구현예에서, 두 아미노산 서열들 사이의 퍼센트 동일성은 GCG 소프트웨어 패키지(http://www.gcg.com에서 확인가능)에 GAP 프로그램으로 포함된 Needleman 및 Wunsch, (1970, J. Mol . Biol. 48: 444-453) 알고리즘, Blossum 62 매트릭스 또는 PAM250 매트릭스(matrix), 및 16, 14, 12, 10, 8, 6, 또는 4의 갭 무게 그리고 1, 2, 3, 4, 5, 또는 6의 길이 무게를 사용해서 결정된다. 그러나 다른 바람직한 구현예에서, 두개의 뉴클레오타이드들 사이의 퍼센트 동일성은 GCG 소프트웨어 패키지(http://www.gcg.com에서 확인가능)에 GAP 프로그램, NWSgapdna. CMP 매트릭스 및 40, 50, 60, 70, 또는 80의 갭 무게 그리고 1, 2, 3, 4, 5, 또는 6의 길이 무게를 사용하여 결정된다. 특별히 바람직한 파마미터들(및 달리 정의되지 않는 한 반드시 사용되어 지는 것)의 세트는 12의 갭 페널티, 4의 확장된 갭 페널티, 및 5의 틀이동(frameshift) 갭 페널티를 가진 Blossum 62 스코어링(scoring) 매트릭스이다.
두 아미노산 또는 핵산 서열들 사이의 퍼센트 동일성은 ALIGN 프로그램 (버전 2.0)에 포함된 E. Meyers and W. Miller (1989, Cabios, 4: 11-17)의 알고리즘을 이용하여, 그리고 PAM 120 무게 잔기 테이블(weight residue table), 12의 갭 길이 페널티 및 4의 갭 페널티를 이용하여 결정될 수 있다.
본원에 기술된 핵산 및 단백질 서열들은 퍼블릭 데이터베이스에 대한 조사를 수행하며, "쿼리 서열(query sequence)"로서 사용하여, 예를 들어, 다른 패밀리 멤버 또는 관련된 서열들을 확인하는 것이다. 그러한 조사들은 Altschul, et al., (1990, J. Mol . Biol, 215: 403-10)의 NBLAST 및 XBLAST 프로그램(버전 2.0)을 사용하여 수행할 수 있다. BLAST 뉴클레어타이드 조사들은 본 발명의 53010 핵산분자들에 대해 뉴클레오타이드 서열 상동성을 획득하기 위해서 NBLAST 프로그램, 스코어 = 100, wordlength = 12를 사용하여 수행할 수 있다. 비교목적으로 틈이 많은 정렬들을 획득하기 위해, Altschul et al., (1997, Nucleic Acids Res, 25: 3389- 3402)에서 설명된 Gapped BLAST를 활용할 수 있다. BLAST 및 Gapped BLAST program을 활용할 때, 각각의 프로그램들(예, XBLAST 및 NBLAST)의 디폴트 파라미터들이 사용될 수 있다.
ADH 폴리펩타이드의 변이체들은 ADH의 절단 돌연변이와 같은 돌연변이들의 조합적인 라이브러리를 스크리닝함으로서 확인할 수 있다. ADH 단백질 코딩 서열의 N 말단, C 말단과 같은 단편들 또는 내부 단편들의 라이브러리들은 ADH 폴리펩타이드 변이체들의 스크리닝 및 차후 선별을 위한 단편들의 다양한 개체군을 만들기 위해서 사용될 수 있다.
점 돌연변이 또는 결실에 의해 만들어진 결합적 라이브러리의 유전자 산물들의 스크리닝, 및 선별된 성질을 가지는 유전자 산물들의 cDNA 라이브러리의 스크리닝을 위한 방법들은 본 기술 분야에 알려져 있다. 그러한 방법들은 ADH 폴리펩타이드의 결합적인 돌연변이에 의해서 만들어진 유전자 라이브러리의 빠른 스크리닝을 위해서 적용할 수 있다.
본 출원의 ADH 폴리펩타이드들은 본 기술분야에서 숙련된 사람들에게 알려진 어떠한 적합한 방법, 예를 들면 재조합 기술에 의해 제조할 수 있다. 예를 들어, ADH 폴리펩타이드들은 다음의 단계들을 포함하는 방법으로 제조할 수 있다: (a) 조절요소에 작동가능하게 연결된 ADH 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 구조물을 제조; (b) 숙주세포로 상기 구조물을 도입; (c) 상기 숙주 세포를 배양하여 ADH 폴리펩타이드 발현; (d) 상기 숙주세포로부터 상기 ADH 폴리펩타이드를 단리. 예시적인 실시예에서, 뉴클레오타이드 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78로 나타내는 서열 또는 그의 변이체의 적어도 생물학적으로 활성인 부분을 코딩한다. 재조합 ADH 폴리펩타이드들은 예를 들면 Sambrook, et al ., (1989, supra), 특히 챕터 16과 17; Ausubel et al.,(1994, supra), 특히 챕터 10과 16; 및 Coligan et al., Current Protocls in Protein Science(John Wiley & Sons, Inc. 1995-1997)의 특히 1, 5, 및 6 챕터에서 기술된 바와 같은 표준 프로토콜을 사용하여 편리하게 제조할 수 있다.
본 출원의 ADH 폴리펩타이드들을 코딩하는 예시적인 뉴클레오타이드 서열은 전체-길이 ADH 유전자들뿐만 아니라 전체-길이의 부분들, 또는 ADH 유전자들의 실질적인 전체-길이 뉴클레오타이드 서열들, 또는 이들의 전사체들, 또는 이들 전사체의 DNA 카피를 포함한다. ADH 뉴클레오타이드 서열의 부분들은 천연 폴리펩타이드의 생물학적 활성을 유지하는 폴리펩타이드 부분 또는 세그먼트를 코딩할 수 있다. ADH 폴리펩타이드의 생물학적으로 활성인 단편을 코딩하는 ADH 뉴클레오타이드 서열의 일부는 전체-길이 ADH 폴리펩타이드에 존재하는 적어도 약 20, 21, 22, 23, 24, 25, 30, 40, 50, 60, 70, 80, 90, 100, 120, 150, 300 또는 400의 인접한 아미노산 잔기, 또는 거의 아미노산의 전체 숫자까지 코딩할 수 있다.
본 발명은 또한 ADH 뉴클레오타이드 서열의 변이체들을 고려한다. 핵산 변이체들은 대립 변이체(같은 자리), 호모로그스(다른 자리), 및 오르쏘로그스(다른 유기체)와 같이 자연적으로 발생할 수 있거나, 또는 비자연적으로 발생할 수 있다. 이러한 자연적으로 발생하는 변이체들은 예를 들면 본 기술 분야에 알려진 중합요소 연쇄 반응(PCR) 및 혼성화 테크닉과 같은 공지된 분자 생물학 테크닉들을 사용하여 확인할 수 있다. 비자연적으로 발생하는 변이체들은 폴리뉴클레오타이드, 세포, 또는 유기체에 적용 될 수 있는 테크닉들을 포함하여, 돌연변이 테크닉에 의해서 만들어질 수 있다. 상기 변이체들은 뉴클레오타이드 치환, 결실, 역전, 및 삽입을 포함할 수 있다. 변이는 코딩 및 비코딩 지역의 둘다 또는 어느 한곳에서 발생할 수 있다. 상기 변이들은 (코딩된 산물에서 비교하였듯이) 보존적 및 비보존적 아미노산 치환을 둘 다 생성할 수 있다. 뉴클레오타이드 서열의 경우, 보전적 변이체들은, 유전적 코드의 퇴화 때문에, 참조 ADH 폴리펩타이드의 아미노산 서열을 코딩하는 서열들을 포함한다. 변이 뉴클레오타이드 서열들은 또한 자리-지향적 돌연변이를 이용해 만들어졌으나 여전히 ADH 폴리펩타이드를 코딩하는 서열들과 같이, 합성적으로 유도된 뉴클레오타이드 서열들을 포함한다. 일반적으로, 특정 ADH 뉴클레오타이드 서열의 변이체들은 디폴트 파라미터들을 사용하여 본원의 어딘가에서 기술된 서열 정렬 프로그램에 의해서 결정하는 경우 특정 뉴클레오타이드 서열에 대해 적어도 약 30%, 40% 50%, 55%, 60%, 65%, 70%, 일반적으로 적어도 약 75%, 80%, 85%, 바람직하게는 약 90% 내지 95% 또는 그 이상, 및 더욱 적합하게는 약 98% 또는 그 이상의 서열 동일성을 가질 것이다.
ADH 뉴클레오타이드 서열들은 다른 유기체로부터, 특히 다른 미생물로부터, 상응하는 서열 및 대립유전자를 단리하기 위하여 사용될 수 있다. 핵산 서열들을 혼성화하기 위한 방법들은 본 기술분야에서 이미 이용가능하다. 다른 유기체들로부터 코딩된 서열들은 본원에 설명된 코딩 서열들과 그들의 서열 동일성에 기초하여 잘 알려진 테크닉에 따라 단리할 수 있다. 이들 테크닉에서 공지된 코딩 서열의 전부 또는 일부는 선택된 유기체(예, 뱀)로부터의 클로닝된 게놈 DNA 단편 또는 cDNA 단편(예, 게놈 또는 cDNA 라이브러리)의 개체군에 존재하는 다른 ADH 코딩 서열들과 선택적으로 혼성화하는 지표로서 사용된다. 따라서, 본 발명은 또한 아래에 설명된 엄중 조건(stringency conditions)에서 참조 ADH 뉴클레오타이드 서열, 또는 그들의 보충물과 혼성화하는 폴리뉴클레오타이드들을 고려한다. 본원에 사용된 용어 "낮은 엄중(low stringency), 중간 엄중(medium stringency), 높은 엄중(high stringency), 또는 아주 높은 엄중(very high stringency) 조건 하에서 혼성화하다" 는 혼성화 및 세정에 대한 조건을 설명하는 것이다. 혼성화 반응을 수행하는 가이드라인은 Ausubel et al ., (1998, supra)의 섹션 6.3.1-6.3.6에서 찾을 수 있다. 수용성 및 비수용성 방법들은 상기문헌에 기술되어 있고 둘 중 어느 것이나 사용가능하다. 낮은 엄중 조건에 대한 언급은, 혼성화를 위해 42℃에서 적어도 약 1% v/v내지 적어도 약 15% v/v 포름아미드 및 적어도 약 1 M내지 적어도 약 2 M 염을 포함한다. 그리고 42℃에서 세정을 위해 적어도 약 1 M내지 적어도 약 2 M의 염을 포함한다. 낮은 엄중 조건은 또한 65℃에서 혼성화를 위해 1% 소혈청알부민 (BSA), 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS, 및 실온에서 세정을 위해 (i) 2 x SSC, 0.1% SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 5% SDS를 포함할 수 있다. 낮은 엄중 조건의 한 구현예는 약 45℃의 6 x 염화나트륨/구연산나트륨(SSC)에서 혼성화, 이어서 적어도 50℃ (낮은 엄중 조건의 경우 세정온도는 55℃로 증가할 수 있음)의 0.2 x SSC, 0.1% SDS에서 두 번 세정을 포함한다. 중간 엄중 조건은 42℃에서 혼성화를 위해 적어도 약 16% v/v 내지 적어도 약 30% v/v 포름아미드 및 적어도 약 0.5 M 내지 적어도 약 0.9 M 염을 포함하고, 55℃에서 세정을 위해 적어도 약 0.1 M 내지 적어도 약 0.2 M 염을 포함한다. 중간 엄중 조건은 또한 65℃에서 혼성화를 위해 1% 소혈청알부민(BSA), 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS , 및 60-65℃에서 세정을 위해 (i) 2 x SSC, 0.1% SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 5% SDS 을 포함할 수 있다. 중간 엄중 조건의 한 구현예는 약 45℃의 6 x SSC에서 혼성화, 이어서 60℃의 0.2 x SSC, 0.1% SDS에서 한번 이상의 세정을 포함한다. 높은 엄중 조건은 42℃에서 혼성화를 위해 적어도 약 31%v/v 내지 적어도 약 50% v/v 포름아미드 및 적어도 약 0.01 M 내지 적어도 약 0.15 M 염을 포함하고, 55℃에서 세정을 위해 적어도 약 0.01 M 내지 적어도 약 0.02 M 소금을 포함한다. 높은 엄중 조건은 또한 65℃에서 혼성화를 위해 1% BSA, 1 mM EDTA, 0.5 M NaHPO4 (pH 7.2), 7% SDS , 및 65℃ 초과의 온도에서 세정을 위해 (i) 0.2 x SSC, 0.1% SDS; 또는 (ii) 0.5% BSA, 1 mM EDTA, 40 mM NaHPO4 (pH 7.2), 1% SDS 을 포함할 수도 있다. 높은 엄중 조건의 한 구현예는 약 45℃의 6 x SSC에서 혼성화, 이어서 65℃의 0.2 x SSC, 0.1% SDS에서 한번 이상의 세정을 포함한다.
특정 구현예들에서는, ADH 폴리펩타이드는 높은 엄중 조건 하에서 상기 기재된 뉴클레오타이드 서열과 혼성화하는 폴리뉴클레오타이드에 의해서 코딩된다. 높은 엄중 조건의 한 구현예는 65℃에서 0.5 M 인산나트륨, 7% SDS 혼성화, 이어서 65℃에서 한번 이상의 0.2 x SSC, 1% SDS 세정을 포함한다.
다른 엄중 조건은 본 기술분야에서 잘 알려져 있으며 또한 숙달된 기술자들은 다양한 요소들이 혼성화의 특이성을 최적화시키기 위해 조정할 수 있다는 것을 인식할 것이다. 최종 세정에서 엄중함의 최적화는 높은 혼성화 정도를 보장할 수 있다. 자세한 예들은, Ausubel et al ., supra의 페이지 2.10.1부터 2.10.16 및 Sambrook et al., (1989, supra)의 섹션 1.101 부터 1.104를 참고한다.
엄중 세정이 일반적으로 약 42℃부터 68℃사이의 온도에서 수행되는 반면에, 본 기술 분야의 숙련된 사람은 다른 온도들이 엄중 조건에 적합할 수 있다는 것을 인식할 것이다. 최대 혼성화율은 전형적으로 DNA-DNA 혼성체의 형성을 위해 Tm 보다 낮은 약 20℃내지 25℃ 사이에서 일어난다. Tm은 용융 온도, 또는 두개의 상보적인 폴리뉴클레오타이드 서열이 분리될 때의 온도라는 것은 본 기술분야에서 잘 알려져 있다. Tm을 측정하는 방법은 본 기술분야에서 잘 알려져 있다(Ausubel et al., supra의 페이지 2.10.8 참고). 일반적으로, DNA의 완벽하게 결합된 두가닥의 Tm은 하기 수식에 따른 접근으로서 측정할 수 있다:
Tm = 81.5 + 16.6 (log10 M) + 0.41 (%G+C) - 0.63 (% 포름아미드) - (600/길이)
상기식에서: M은 바람직하게는 0.01 몰내지 0.4 몰 범위의 Na+의 농도이며; %G+C는 30% 내지 75% G+C 사이의 범위내에, 염기의 전체 수의 퍼센트로서의 구아노신(guanosine)과 사이토신(cytosine)염기들의 합이다; % 포름아미드(formamide)는 부피에 대한 포름아미드의 퍼센트이다; 길이는 두 가닥 DNA에서 염기 쌍들의 숫자이다. 두 가닥 DNA의 Tm은 불규칙적으로 미스매치된 염기 쌍들의 숫자에서 매 1%증가시마다 약 1℃ 감소한다. 세정은 일반적으로 높은 엄중에는 Tm - 15℃에서, 또는 중간 엄중에는 Tm - 30℃에서 수행한다.
혼성화 절차의 한 예로, 고정된 DNA를 포함하는 막(예, 니트로셀룰로스 막 또는 나일론 막)은 42℃에서 표지된 프로브를 포함하는, 혼성화 버퍼(50% 비이온화된 포름아미드, 5 x SSC, 5 x Denhardt's 용액 (0.1% 피콜, 0.1% 폴리비닐피롤리딘 및 0.1% 소혈청알부민), 0.1% SDS 및 200 mg/mL 변성된 연어 정자 DNA)에서 밤새 혼성화한다. 다음에 상기 막에 두 번의 순차적인 중간 엄중 세정(예, 2 x SSC, 0.1% SDS , 45℃에서 15분간, 이어서 2 x SSC, 0.1% SDS, 50℃에서, 15분간)을 수행하고, 이어서 두 번의 순차적인 높은 엄중 세정(즉, 0.2 x SSC, 0.1% SDS, 55℃에서 12분간, 이어서 0.2 x SSC 및 0.1% SDS 용액, 65-68℃에서 12분간)을 수행한다.
본 발명의 구현예들은 또한 다당류를 적합한 단당류 또는 적합한 올리고당류로 전환하기 위한 ADH 키메라 또는 융합 단백질들의 사용을 포함한다. 본원에서 사용된 ADH "키메라 단백질" 또는 "융합 단백질"은 비-ADH 폴리펩타이드와 결합된 ADH 폴리펩타이드를 포함한다. "비-ADH 폴리펩타이드"은 ADH 단백질과 다르며 같은 또는 다른 유기체로부터 유래한 단백질에 상응하는 아미노산 서열을 가진 폴리펩타이드를 언급한다. 상기 융합 단백질의 ADH 폴리펩타이드는 ADH 아미노산 서열의 본원에 기술된 단편과 같이, 전부 또는 일부에 상응할 수 있다. 바람직한 구현예에서, ADH 융합 단백질은 ADH 단백질의 적어도 하나(또는 두 개)의 생물학적으로 활성 부분을 포함한다. 상기 비-ADH 폴리펩타이드는 ADH 폴리펩타이드의 N-말단 또는 C-말단에 융합될 수 있다.
상기 융합 단백질은 리간드에 대해 높은 친화력을 갖는 부위를 포함한다. 예를 들어, 상기 융합 단백질은 ADH 서열들이 GST 서열의 C-말단에 융합된 GST-ADH 융합 단백질일 수 있다. 이러한 융합 단백질들은 재조합 ADH 폴리펩타이드의 정제를 촉진할 수 있다. 대안적으로, 상기 융합 단백질은 그의 N-말단에 이종 신호 서열을 가지는 ADH 단백질이 될 수 있다. 특정한 숙주 세포들에서, ADH 단백질들의 발현 및/또는 분비는 이종 신호 서열의 사용을 통해서 증가될 수 있다.
특정한 구현예들에서, 본 발명의 ADH 분자들은 알지네이트와 같은 바이오매스로부터 다당류들 및 올리고당류를, 적합한 단당류 또는 2-케토-3-데옥시-D- 글루코네이트-6-포스페이트 (KDG)와 같은 적합한 올리고당류로 전환하기 위한 미생물 시스템 또는 단리된/재조합 미생물에서 고용될 수도 있으며, 다음에 바이오연료들과 같은 화학 제품들로 전환될 수도 있다.
배경기술에 의하면, 대규모 수용성- 농업은 식품작물 생산을 에너지 작물 생산, 삼림파괴로 대체하는 것, 및 현재 미배양된 배양지를 재배양하지 않고, 아직 손대지 않고 남아있는 해양들, 강들, 및 호수들을 포함하는 대부분의 수권 같이, 상당한 양의 바이오매스를 생산할 수 있다. 하나의 예로서, 북아메리카의 태평양 해안은 대규모 수용성- 농업에 필요한 미네랄들이 풍부하다. 이 지역에서 자라는 거대 켈프, 하루에 1m만큼 빠르게 자라는데, 지구상의 식물들 중 가장 빠르며 50m까지 자란다. 부가적으로, 수용성-농업은 적조 발생의 예방 및 어류-친화적인 환경 조성을 포함하는 다른 이점들을 가진다.
리그로셀룰로릭 바이오매스와 대조적으로, 수용성 바이오매스는 분해되기 쉽다. 수생 바이오매스는 리그닌이 부족하고 리그로셀룰로릭 바이오매스보다 상당히 더 취약하기 때문에, 효소 또는 화학 촉매제(예, 포름산)을 사용하여 쉽게 분해될 수 있다. 해초는 리그노셀룰로스(글루코스: 24.1-39%, 만노오스: 0.2-4.6%, 갈락토스: 0.5- 2.4%, 자일로스: 0.4-22.1%, 아리비노스 1.5-2.8%, 및 우로네이트: 1.2-20.7%, 및 전체 설탕 성분들은 건조 중량의 36.5-70%와 동일하다)와 비교할 때, 상당히 더 단순한 주요 설탕 구성요소(알지네이트: 30%, 만니톨: 15%)을 가지고 있기 때문에, 효소 또는 화학 촉매제를 이용하여 쉽게 단당류로 전환될 수 있다. 해초같은 수생 바이오매스를 이용한 사카린화 및 발효는 리그로셀룰로스를 이용하는 것보다 휠씬 쉽다.
예를 들어, n-알칸은 가솔린, 디젤, 등유, 및 중유를 포함하는 모든 오일 산물들의 주 구성요소들이다. 미생물 시스템 및 재조합 미생물은 C7부터 C20 넘는 것과 같이 다른 탄소 길이들 범위를 가지는 n-알칸을 생산하는데 사용될 수 있다: 예를 들면 가솔린에는 C7 (예, 자동차), 디젤에는 ClO-Cl5 (예, 자동차, 기차 및 배), 및 등유 그리고 모든 중유에는 C8-C16(예, 항공기 및 배).
중(medium) 및 환상 알코올은 또한 가솔린과 디젤을 대체할 수 있다. 예를 들어, 중 및 환상 알코올은 일산화탄소 방출을 줄이는 더 높은 산소 함량을 가지며, 이들은 엔진 노크를 줄이는 더 높은 옥탄가를 가지며, 많은 낮은 등급의 미국산 미가공 오일 산물들의 질을 향상시키며, 유해한 방향족 옥탄 인헨서(예, 벤젠)들을 대체하며, 그들은 가솔린과 비교될 정도의 에너지 밀도를 가지며, 그들의 불혼화성은 캐피탈 소비를 상당히 감소시키고, 낮은 잠재적인 증발열은 저온 시동에 유리하며, 또한 4-옥탄올은 에탄올 및 부탄올과 비교할 때 현저하게 독성이 적다.
해양성 바이오매스를 바이오연료 등의 상업적 화학 제품으로 전환하는 초기 스텝으로서, 탄소 및 에너지원으로서 다당류(예,알지네이트)를 이용하여 성장할 수 있는 재조합 미생물 또는 미생물 시스템이 사용될 수도 있다. 단지 설명을 위하여, 해초 건조 중량의 약 50%는 다양한 설탕 성분을 포함하는데, 그 중 알지네이트와 만니톨은 각각 해초 건조 중량의 각 30% 및 15%에 상응하는 주요 성분이다. E. coli 등의 미생물이 일반적으로 합성 생물학에서 숙주세포로서 인정되고 있음에도 불구하고, 그런 미생물은 만니톨을 대사할 수 있으나, 알지네이트를 분해 및 대사 하는 능력이 절대적으로 부족하다. 본 출원의 구현예들에서는 E. coli 등의 미생물들을 포함하며, 이들 미생물은 본 출원의 ADH 분자들을 포함하는 미생물들을 포함하고, 그것은 탄소 및 에너지원으로서 알지네이트 등의 다당류를 사용할 수 있다.
알지네이트(수생 또는 해양성-영역 바이오매스의 주성분)를 분해하거나 저분자화시킬 있고, 탄소 및 에너지원으로서 그것을 사용할 수 있는 미생물 시스템은 수생 또는 해양성 바이오매스-분해 효소들(예,알지네이트 리아제(ALs) 등의 효소들을 분해 또는 저분자화하는 다당류)의 세트를 포함할 수 있다. 단지 설명을 위하여, 알지네이트는 β-D-만누로네이트 (M) 및 α-D-글루로네이트 (G)(M 및 G는 C5-카르복실 그룹에 대해 에피머체(epimeric)이다)의 코-폴리머 블럭이다. 각 알지네이트 폴리머는 모든 M (폴리M), 모든 G (폴리G), 및/또는 M 과 G의 혼합물(폴리MG) 영들을 포함한다. ALs는 주로 이들의 촉매작용에 따라 두 개의 독특한 하부패밀리들로 분류될 수 있다: 엔도- (EC 4.2.2.3) 및 엑소-작용 (EC 4.2.2.-) ALs. 엔도- 작용 ALs는 그들의 촉매적인 특이성에 기초하여 더욱 분류된다; M 특이적 및 G 특이적 ALs. 상기 엔도-작용 ALs는 β-제거 메커니즘을 통해서 무질서하게 알지네이트를 절단하며 주로 알지네이트를 디-, 트리-, 및 테트라당류들로 분해시킨다. 각각의 올리고당의 비-감소 말단에서 우로네이트는 불포화된 설탕 우로네이트, 4-데옥시-L-에리스로-헥스-4-엔 피라노실 우로네이트로 전환된다. 상기 엑소-작용 ALs는 나아가 이러한 올리고당류들의 분해를 촉진하고, 불포화된 단당류들을 방출하는데, 이는 우로네이트, 4- 데옥시-L-에리스로-5-헥소세울로스 우로네이트 (DEHU)을 포함하는, 비-효소적으로 단당류들로 전환될 수 있다. 미생물 시스템 또는 단리된 미생물의 특정한 구현예들은 알지네이트 등의 같은 수생 또는 해양성-바이오매스 다당류를 DEHU 등의 단당류로 분해하거나 저분자화시키기 위해 엔도M-, 엔도G- 및 엑소- 작용 ALs을 포함할 수 있다.
알지네이트 리아제는 사이토졸에서 알지네이트를 단당류들(예, DEGU)로 분해할 수 있거나, 또는 배지에서 알지네이트를 분해하도록 분비될 수 있다. 알지네이트가 배지에서 분해될 때, 특정 구현예들에는 탄소 및 에너지원으로서 이들 단당류를 효과적으로 사용하기 위해 배지로부터 사이토졸로 단당류(예, DEGU)를 수송할 수 있는 미생물 시스템 또는 단리된 미생물을 포함할 수 있다. 단지 하나의 예로서, DEHU 투과효소 등의 단당류 투과효소를 코딩하는 유전자들은 탄소 및 에너지원으로서 알지네이트 등의 다당류들에서 성장하는 박테리아로부터 단리될 수 있으며,또한 본원 미생물 시스템 또는 단리된 미생물의 구현예들로 통합될 수 있다. 추가적인 예로서, 구현예들은 또한 단당류(예, DEGU) 수송에 대해 변형된 특이성을 가진 재고안된 자연의 투과효소를 포함할 수도 있다.
미생물 시스템 또는 단리된 미생물의 특정 구현예들은 본원에 나타낸 ADH 폴리펩타이드, 또는 그의 변이체들을 코딩하는 유전자들을 통합할 수 있는데, 상기 미생물 시스템 또는 미생물들은 탄소 및 에너지원으로서 알지네이트 등의 다당류에서 성장할 수 있다. 특정 구현예들은 DEHU 디하이드로게나제 활성을 가지는 ADH 폴리펩타이드 등의 ADH 폴리펩타이드들을 포함하는 미생물 시스템 또는 단리된 미생물을 포함하며, 여기서 다양한 단당류, 예를 들어 DEHU는 2-케토-3- 데옥시-D-글루코네이트-6-포스페이트 (KDG) 또는 D-만니톨과 같은 바이오연료 생합성에 적합한 단당류로 환원될 수 있다.
다른 구현예들에서, 알지네이트와 같은 수생 또는 해양성-바이오매스 다당류들은 산과 같은 화학적 촉매제를 사용하여 화학적으로 분해될 수 있다. 단지 설명을 위하여, 화학적 촉매에 의해 촉진된 반응은 효소적 촉매제들에 의해 촉진된 β-제거(elimination)라기보다는 가수분해이다. 산 촉매는 가수분해를 통해 글라이코사이드 결합을 절단하며, 올리고당류들을 방출하며, 또한 이러한 올리고당류들을 불포화된 단당류로 저분자화하는데, 이는 종종 D-만누로네이트으로 전환된다. 특정 구현예들은 알지네이트를 강한 미네랄 산과 끓이는 것을 포함하는데, 이는 D-만누로네이트으로부터 이산화탄소를 유리시킬 수도 있고 많은 미생물에 의해 사용되는 통상의 설탕인 D-릭소스를 형성할 수 있다. 특정 구현예들은, 예를 들어, 포르메이트, 염산, 황산 및 본 기술분야에 알려진 다른 적합한 산들을 화학적 촉매로서 사용할 수 있다.
특정 구현예들에서는 수생 또는 해양성- 바이오매스 관련 다당류와 함께 사용하기에 적합한 화학적 촉매작용의 재고안 또는 개선된 방법들을 포함하여, 본 기술분야에 숙련에 사람에게 알려지거나 본원에 기술된 것들과 유사한 화학적 촉매작용의 변형들을 이용할 수 있다. 특정 구현예들은 상기 수득된 단당류 우로네이트가 D-만누로네이트인 것을 포함한다.
본 발명의 특정 구현예들에 따른 미생물 시스템 또는 단리된 미생물은 또한 배지로부터 미생물 시스템으로 단당류(예, D-만누로네이트 및 D-릭소스)의 수송을 촉매할 수 있는 투과효소를 포함할 수 있다. 단지 예로서, 소일 에어로모나스(Soil Aeromonas)에서 D-만누로네이트의 투과효소를 코딩하는 유전자들은 본에원 기술된 미생물 시스템으로 통합될 수 있다.
하나의 대안적인 예로서, 미생물 시스템 또는 미생물은 D-만누로네이트 및 D-릭소스 수송과 같은 효율적인 단당류 수송을 위한 그들의 특이성을 변화시키기 위해서 재고안된 자연의 투과효소들을 포함할 수 있다. 예를 들어, E. coli는 2-케토-3-데옥시-D-글루코네이트 (KDG) 수송체에 대한 KdgT, D-갈락토루네이트 및 D-글루쿠로네이트 수송체와 같은 알도헥수로네이트들에 대한 ExuT, 글루코네이트/푸룩투로네이트 수송체에 대한 GntPTU, 글루쿠로나이드 수송체에 대한 uidB, L- 푸코오스 수송체에 대한 fucP, 갈락토스 수송체에 대한 galP, 글라이코레이트 수송체에 대한 yghK, D-갈락토네이트 수송체에 대한 dgoT , 헥소스 포스페이트 수송체에 대한 uhpT, 오로테이트/시트레이트 수송체에 대한 dctA, 글루코네이트 수송체에 대한 gntUT , 말토스 수송체에 대한 malEGF: D-알로스 수송체에 대한 alsABC, L-이도네이트/D-글루코네이트 수송체에 대한 idnT, 프로톤-드리븐 α-케토글루타레이트 수송체에 대한 KgtP, 락토오스/갈락토스 수송체에 대한 lacY , D-xylose 수송체에 대한 xylEFGH , L- 아라비노스 수송체에 대한 araEFGH, 및 D-리보스 수송체에 대한 rbsABC를 포함하며, D-만누로네이트 및 D-릭소스 같은 단당류 또는 설탕들을 수송할 수 있는 여러 개의 투과효소를 포함한다. 특정 구현예들에서, 미생물 시스템 또는 단리된 미생물은 D-만누로네이트 및 D-릭소스와 같은 특정 단당류들을 수송하기 위해 재고안된 상기 기술한 투과효소들을 포함할 수 있다. 특정 구현예에서, 미생물 시스템 또는 단리된 미생물은 D- 만누로네이트 및 D-릭소스와 같은 특정 단당류들 수송을 위해 재고안된 위에서 기술된 투과효소들을 포함한다.
특정 구현예들은 탄소 및 에너지원으로서 D-만누로네이트 또는D- 릭소스와 같은 단당류에서 효과적으로 성장하는 미생물 시스템 또는 단리된 미생물을 포함할 수 있고, 또한 D-만누로네이트 디하이드로게나제 활성을 갖는 ADH 폴리펩타이드를 포함하며, 본 출원의 ADH 분자들을 포함하는 미생물 시스템들 또는 미생물들을 포함한다.
특정 구현예들은 DEHU, D-만누로네이트 및 D-자일룰로스와 같은 단당류를 KDG와 같은 바이오연료 생합성 경로에 적합한 단당류로 전환하기 위해 효율성이 강화된 미생물 시스템 또는 단리된 미생물을 포함할 수 있다. 단지 설명을 위하여, D-만누로네이트 및 D-자일룰로스는 E. coli와 같은 미생물에서 물질대사 된다. D-만누로네이트는 D-만누로네이트 디하이드라테이스에 의해서 KDG로 전환된다. D-자일룰로스는 펜토스 포스페이트 경로로 들어간다. 특정 구현예들에서, D-만누로네이트 디하이드라테이스 (uxuA)는 과발현될 수 있다. 다른 구현예들에서, kgdK, nad, 및 kdgA와 같은 적합한 유전자들 또한 과발현될 수 있다.
본 발명의 특정 구현예들은 또한 다당류를 미생물 시스템과 접촉하는 것을 포함하여, 다당류를 적합한 단당류 또는 올리고당류로 전환하는 방법을 포함할 수 있는데, 여기서 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 본 기술내용에 따른 ADH 폴리뉴클레오타이드를 포함하며, 상기 ADH 폴리뉴클레오타이드는 알코올 디하이드로게나제 활성, DEHU 하이드로게나제 활성, 및/또는 D-만누로네이트 하이드로게나제 활성과 같은 하이드로게나제 활성을 갖는 ADH 폴리펩타이드를 코딩한다.
추가적인 구현예들들은 D-만누로네이트을 미생물 시스템과 접촉하는 것을 포함하여, D-만누로네이트의 환원(수소화)을 촉매하는 방법을 포함하는데, 여기서 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 본 기술내용에 따른 ADH 폴리뉴클레오타이드를 포함한다.
추가적인 구현예들은 DEHU를 미생물 시스템과 접촉시키는 것을 포함하며, DEHU의 환원(수소화)을 촉매하는 방법을 포함하는데, 여기서 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 본 기술내용에 따른 ADH 폴리뉴클레오타이드를 포함한다.
추가적인 구현예들은 단리된 폴리뉴클레오타이드를 포함하는 벡터를 포함하고, 또한 상기 단리된 폴리뉴클레오타이드가 발현 조절 영역에 작동가능하게 연결된 벡터를 포함할 수 있으며, 또한 상기 폴리뉴클레오타이드는 알코올 디하이드로게나제 활성, DEHU 하이드로게나제 활성, 및/또는 D-만누로네이트 하이드로게나제 활성과 같은 하이드로게나제 활성을 갖는 ADH 폴리펩타이드를 코딩한다.
추가적인 구현예들은 다당류를 미생물 시스템과 접촉시키는 것을 포함하는, 다당류를 적합한 단당류 또는 올리고당류로 전환하는 방법을 포함하며, 여기서 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 본 기술내용에 따른 ADH 폴리펩타이드를 포함한다.
추가적인 구현예들은 D-만누로네이트을 미생물 시스템에 접촉시키는 것을 포함하는, D-만누로네이트의 환원(수소화)을 촉매하는 방법을 포함하며, 여기서 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 본 기술내용에 따른 ADH 폴리펩타이드를 포함한다.
추가적인 구현예들은 DEHU를 미생물 시스템에 접촉시키는 것을 포함하는, 우로네이트, 4-데옥시-L-에리스로-5-헥소세울로스 우로네이트 (DEHU)의 환원(수소화)을 촉매하는 방법을 포함하며, 여기서 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 본 기술내용에 따른 ADH 폴리펩타이드를 포함한다.
추가적인 구현예들은 다당류를 적합한 단당류 또는 올리고당류로 전환하는 미생물 시스템을 포함하는데, 여기서 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 하기 (a) 내지 (f)로부터 선택된 단리된 폴리뉴클레오타이드를 포함한다.
(a) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 80% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(b) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 90% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(c) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 95% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(d) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 97% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
(e) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 99% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드; 및
(f) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드.
추가적인 구현예들은 다당류를 적합한 단당류 또는 올리고당류로 전환하는 미생물 시스템을 포함하는데, 여기서 상기 미생물 시스템은 미생물을 포함하고, 또한 상기 미생물은 하기 (a) 내지 (f)로부터 선택된 단리된 폴리뉴클레오타이드를 포함한다.
(a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(b) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(c) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(d) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
(e) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드; 및
(f) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열을 포함하는 단리된 폴리펩타이드.
특정 구현예들에서는, 미생물 시스템은 재조합 미생물을 포함하는데, 상기 재조합 미생물은 본원에 기술된 벡터, 폴리뉴클레오타이드, 및/또는 폴리펩타이드를 포함한다. 이종단백질들을 생산하는데 있어서, 알지네이트와 같은 다당류의 분해, 또는 바이오연료들의 형성 및 생합성이든 아니든, E. coli의 능력 및, 그의 빠른 성장률, 잘 알려진 유전학, 사용가능한 다양한 유전학 도구들이 주어진다면, 유전학적으로 변형된 E. coli를 본원에 기술된 미생물 시스템의 특정 구현예들에서 사용될 수 있다. 다른 미생물들은 숙주 유기체에 대한 효소 및 대사산물의 적합성에 부분적으로 기초하여, 본원의 기재된 내용에 따라 사용될 수 있다.
예를 들어, 아세토박터 아세티, 아크로모박터, 애시디필리움, 아시네토박터, 악티노마두라, 악티노플라네스, 에어로파이룸 퍼닉스, 아그로박테리움, 알카리제네스, 아나나스 코모수스(M), 아스로박터, 아스퍼질러스 니거, 아스퍼질러스 오리재, 아스퍼질러스 멜레우스, 아스퍼질러스 풀베루렌투스, 아스퍼질러스 사이토이, 아스퍼질러스 소재, 아스퍼질러스 우사미, 바실러스 알칼로필루스, 바실러스 아밀로리퀴파시언스, 바실러스 브레비스, 바실러스 서큐란스, 바실러스 클라우시, 바실러스 렌투스, 바실러스 리케니포르미스, 바실러스 마세란스, 바실러스 스테아로서모필루스, 바실러스 섭틸리스, 비피도박테리움, 브레비바실러스 브레비스, 버크홀데리아 세파시아, 칸디다 실린드라세아, 칸디다 루고사, 카리카 파파야(L), 셀룰로시미크로비움, 세팔로스포리움, 케토미움 에라티쿰, 케토미움 그라실레, 클로스트리디움, 클로스트리디움 부티리쿰, 클로스트리디움 아세토부티리쿰, 클로스트리디움 서모셀럼, 코리네박테리움 (글루타미쿰), 코리네박테리움 에피시엔스, 에스케리치아 콜라이, 엔테로코커스, 어위니아 크리산세미, 글리코노박터, 글루콘아세토박터, 할로아르쿨라, 후미콜라 인솔렌스, 후미콜라 엔솔렌스, 키타사토스포라 세타에, 클렙시엘라, 클렙시엘라 옥시토카, 클루이베로마이세스, 클루이베로마이세스 프라질리스, 클루이베로마이세스 락티스, 코쿠리아, 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 사케, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸로시스티스, 메타놀로부스 시실리애, 메타노제니움 오르가노필룸, 메타노박테리움 브리아티, 마이크로박테리움 임페리얼, 마이크로코쿠스 리소데익티쿠스, 마이크로루나투스, 뮤코 자바니쿠스, 마이코박테리움, 마이로세시움, 나이트로박터, 나이트로소모나스, 노카디아, 파파야 카리카, 페디오코쿠스, 페디오코쿠스 할로필루스, 페니실리움, 페니실리움 카멤베르티, 페니실리움 시트리눔, 페니실리움 에메르소니, 페니실리움 로케포르티, 페니실리움 리락티눔, 페니실리움 멀티칼라, 파라코쿠스 판토트로푸스, 프로피오니박테리움, 슈도모나스, 슈도모나스 플루오레슨스, 슈도모나스 데니프리피칸스, 파이로코쿠스, 파이로코쿠스 퓨리오서스, 파이로코쿠스 호리코시, 라이조비움, 리조무코어 미에헤이, 리조무코어 푸실러스 린트, 라이조푸스, 라이조푸스 델레마, 라이조푸스 자포니쿠스, 라이조푸스 니비우스, 라이조푸스 오리자에, 라이조푸스 올리고스포루스, 로도코쿠스, 사카로마이세스 세레비지애, 스클레로티나 리베르티나, 스핑고박테리움 멀티보룸, 스핑고비움, 스핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이세스, 스트렙토마이세스 그리세우스, 스트렙토마이세스 리비단스, 스트렙토마이세스 뮤리누스, 스트렙토마이세스 루비기노수스, 스트렙토마이세스 비올라세오루버, 스트렙토베르티실리움 모바라엔스, 테트라게노쿠스, 서머스, 티오스파에라 판토트로파, 트라메테스, 트리코데르마, 트리코데르마 롱기브라키아툼, 트리코데르마 리세이, 트리코데르마 비리드, 트리코스포론 페니실라툼, 비브리오 알지노리티쿠스, 잔토모나스, 이스트, 자이고사카로마이세스 룩시이, 자이모모나스, 및 자이모모나스 모빌리스, 및 등과 같은 다른 재조합 미생물들이 본 발명에 따라 사용될 수 있다.
본 발명에 따르면, 알코올 디하이드로게나제(ADH)활성, 우로네이트(uronate), 4-데옥시-L-에리스로-5-헥소세울로스 우로네이트(DEHU), ((4S,5S)-4,5 디하이드록시-2,6-디옥소헥사노에이트) 하이드로게나제 활성, 2-케토-3-디옥시-D-글루코네이트 디하이드로게나제 활성, D-만누로네이트(D-mannuronate) 하이드로게나제 활성 및/또는 D-만누로네이트 디하이드로게나제 활성과 같은 디하이드로게나제 활성(dehydrogenase activity)을 갖는, 단리된 폴리펩타이드(isolated polypeptide) 및 이것을 코딩하는 폴리뉴클레오타이드를 제공하며, 또한 이러한 폴리뉴클레오타이드 및 폴리펩타이드를 포함하여 바이오매스를 바이오연료 등의 상업적 화학물질로 전환하는 화학적 시스템, 재조합 미생물 및 미생물 시스템의 용도를 제공한다.
도 1은 실시예 2에 따라 수행되는 바와 같이, 기질로서 DEHU를 사용하는 단리된 알코올 디하이드로게나제(ADH)효소들의 NADPH 소비를 나타낸다.
도 2는 실시예 2에서 수행되는 바와 같이, 기질로서 D- 만누로네이트을 사용하는 단리된 ADH 효소의 NADPH 소비를 나타낸다
도 3은 ADH1의 뉴클레오타이드(서열번호 1) 및 아미노산(서열번호 2) 서열들을 나타낸다.
도 4는 ADH2의 뉴클레오타이드(서열번호 3) 및 아미노산(서열번호 4) 서열들을 나타낸다.
도 5는 ADH3의 뉴클레오타이드(서열번호 5) 및 아미노산(서열번호 6) 서열들을 나타낸다.
도 6은 ADH4의 뉴클레오타이드(서열번호 7) 및 아미노산(서열번호 8) 서열들을 나타낸다.
도 7은 ADH5의 뉴클레오타이드(서열번호 9) 및 아미노산(서열번호 10) 서열들을 나타낸다.
도 8은 ADH6의 뉴클레오타이드(서열번호 11) 및 아미노산(서열번호 12) 서열들을 나타낸다.
도 9는 ADH7의 뉴클레오타이드(서열번호 13) 및 아미노산(서열번호 14) 서열들을 나타낸다.
도 10은 ADH8의 뉴클레오타이드(서열번호 15) 및 아미노산(서열번호 16) 서열들을 나타낸다.
도 11은 ADH9의 뉴클레오타이드(서열번호 17) 및 아미노산(서열번호 18) 서열들을 나타낸다.
도 12는 ADH10의 뉴클레오타이드(서열번호 19) 및 아미노산(서열번호 20) 서열들을 나타낸다.
도 13은 ADH11의 뉴클레오타이드(서열번호 21) 및 아미노산(서열번호 22) 서열들을 나타낸다.
도 14는 ADH12의 뉴클레오타이드(서열번호 23) 및 아미노산(서열번호 24) 서열들을 나타낸다.
도 15는 ADH13의 뉴클레오타이드(서열번호 25) 및 아미노산(서열번호 26) 서열들을 나타낸다.
도 16은 ADH14의 뉴클레오타이드(서열번호 27) 및 아미노산(서열번호 28) 서열들을 나타낸다.
도 17은 ADH15의 뉴클레오타이드(서열번호 29) 및 아미노산(서열번호 30) 서열들을 나타낸다.
도 18은 ADH16의 뉴클레오타이드(서열번호 31) 및 아미노산(서열번호 32) 서열들을 나타낸다.
도 19는 ADH17의 뉴클레오타이드(서열번호 33) 및 아미노산(서열번호 34) 서열들을 보여준다.
도 20은 ADH18의 뉴클레오타이드(서열번호 35) 및 아미노산(서열번호 36) 서열들을 나타낸다.
도 21은 ADH19의 뉴클레오타이드(서열번호 37) 및 아미노산(서열번호 38) 서열들을 나타낸다.
도 22는 실시예 3에 기술된 바와 같이, 유일한 탄소원으로서 알지네이트에서 성장하는 조작된 또는 재조합된 E. coli의 결과를 나타낸다(solid circles 참조). 아그로박테리움 튜메파시엔스(Agrobacterium tumefaciens)세포는 양성조절을 제공한다(닫힌 원들 참고). A. 튜메파시엔스 양성조절의 바로 왼쪽의 웰은 DHlOB E. coli 세포들을 포함하는데, 이는 음성조절을 제공한다.
도 23은 실시예 4에 기술된 바와 같이 유일한 탄소원으로서 알지네이트에서 성장하는 E. coli에 의한 알코올 생성을 나타낸다. E. coli는 pBBRPdc-AdhA/B 또는 pBBRPdc-AdhA/B + 1.5 FOS로 형질전환시키고, 또한 알지네이트가 포함된 m9 배지에서 자라도록 하였다.
도 24는 ADHl 1 및 ADH20의 DEHU 하이드로게나제 활성을 나타낸다. ADH20은 비브로 스플렌디두스 12B01(아미노산 서열에 대한 서열번호 78번 참고)로부터 단리된 타르트로네이트 세미알데하이드 환원효소 (TSAR) 유전자이며, 그리고 특히 NADH와 함께 중요한 DEHU 하이드로게나제 활성을 입증한다.
본 발명을 쉽게 이해하고 실질적으로 실행하기 위해, 특히 바람직한 구현예들은 하기의 비제한적인 실시예들의 형태로 여기에 기술될 것이다.
실시예 1
알코올 디하이드로게나제 클로닝
모든 화학물 및 효소들은 달리 언급되지 않는 한, Sigma-Aldrich, Co.와 New England Biolabs, Inc.로부터 각각 구입하였다. 만니톨 1 -디하이드로게나제 (MTDH)가 DEHU 하이드로게나제와 비슷한 작용으로 촉매작용을 하기 때문에, 아미노산 서열들로 사용하기 위해 고안된 프라이머들은 아피움 그라베오렌스(Apium graveolens) 및 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터 유래한 MTDHs이다. 이들 프라이머를 쿼리들(표 1 참조)로서 사용하기 위해, 동질 유전자 서열들을 아그로박테리움 튜메파시엔스 C58의 서열에서 조사하였다. 아연-의존적인 알코올 디하이드로게나제를 코딩하는 대략 16개 유전자들을 발현하였다. 이들 유전자들 가운데, 높은 E-값을 가진 상위 10개 유전자 서열을 PCR로 증폭했다 : 98℃에서 10초 동안, 55℃에서 15초 동안, 및 72℃에서 60초 동안, 30회 반복했다. 상기 반응 혼합물은 전체 부피 100 μl에서 1 x Phusion 버퍼, 2 mM dNTP, 0.5 μM 포워드 및 리버스 프라이머(표 1에 기재), 2.5 U Phusion DNA 폴리머라아제(Finezyme), 및 주형으로서의 아그로박테리움 튜메파시엔스 C58 세포들의 일정부분을 포함했다. ADHl 및 ADH4가 내부적 Ndel 부위를, ADH3가 BamHI 부위를 갖기 때문에, 이러한 유전자들은 아래의 PCR 프로토콜을 사용한 오버랩 PCR 방법을 이용해 증폭했다. 포워드 (5'-GCGGCCTCGGCCACATGGCCGTCAAGC-3') (서열번호:39) 및 리버스(5'- GCTTGACGGCCATGTGGCCGAGGCCGC-3') (서열번호:40) 프라이머들은 ADHl로부터 Ndel 사이트를 제거하는데 사용했다. 포워드 (5'- TGGCAATACCGGACCCCGGCCCCGGTG -3') (서열번호:41) 및 리버스 (5'- CACCGGGGCCGGGGTCCGGTATTGCCA -3') (서열번호:42) 프라이머들은 ADH3로부터 BamHI 부위를 제거하는데 사용했다. 포워드(5'- AGGCAACCGAGGCGTATGAGCGGCTAT -3') (서열번호:43) 및 리버스(5'- ATAGCCGCTCATACGCCTCGGTTGCCT -3') (서열번호:44) 프라이머들은 ADH4로부터 Ndel 부위를 제거하는데 사용했다. 이러한 증폭된 단편들은 Ndel 및 BamHI와 함께 분해(digested)되고 pETADHlO를 통해, 10개의 다른 플라스미드, pETADHl을 형성하기 위해 T4 DNA 리가제를 사용하여 같은 효소들로 미리-분해된 pET29로 묶였다. 구성된 플라스미들들은 서열분석했고(Elim Biophamaceuticals) 이러한 삽입체들의 DNA 서열들을 확인했다.
모든 플라스미드들은 Escherichia coli 균주 BL21(DE3)로 형질전환시켰다. 각각의 알코올 디하이드로게나제(ADH) 유전자들 포함하는 BL21(DE3)의 단일 콜로니들을 50 μg/ml 카나마이신 (Km50) 포함 50 ml의 LB 배지에 성장시켰다. 이러한 균주들은 37℃에서 200rpm으로 오비탈 쉐이커에서 성장시켰다. OD600nm가 0.6에 도달했을 때, 0.2 mM IPTG를 각 배양액에 첨가하고, 상기 접종된 배양액을 20℃에 200 rpm으로 오비탈 쉐이커에서 키웠다. 접종 24시간 후, 상기 세포들을 10분 동안 4,000 rpm x g에서 원심분리해서 수집하고, 상기 팔레트는 10 μl의 Lysonase™ Bioprocessing Reagent (Novagen)를 포함한 2 ml의 Bugbuster (Novagen)로 10분간 재현탁했다. 상기 용액은 다시 10분 동안 4,000 rpm x g에서 원심분리했고, 상청액을 얻었다.
표 1. ADH 의 증폭을 위해 사용된 프라이머
Figure pct00003
Figure pct00004

실시예2
알코올 디하이드로게나제의 특성화
아그로박테리움 튜메파시엔스 C58 로부터 유래한 올리고알지네이트 리아제 Atu3025의 준비. pETAtu3025는 pET29 플라스미드 백본(backbone)(Novagen)에 기초하여 구성하였다. 올리고알지네이트 리아제 Atu3025를 PCR에 의해 증폭시켰다: 98℃에서 10초 동안, 55℃에서 15초 동안, 및 72℃에서 60초 동안, 30번 반복하였다. 상기 반응 혼합물은 전체 부피 100 μl에서 1 x Phusion 버퍼, 2 mM dNTP, 0.5 μM 포워드 (5'- GGAATTCCATATGCGTCCCTCTGCCCCGGCC-3') (서열번호:45) 및 리버스 (5'- CGGGATCCTTAGAACTGCTTGGGAAGGGAG-S') (서열번호:46) 프라이머들, 2.5 U Phusion DNA 폴리머라아제(Finezyme), 및 주형으로서의 아그로박테리움 튜메파시엔스 C58(Profess또는Eugene Nester, University of Washington로부터의 선물) 세포들의 일정부분을 포함했다. 상기 증폭된 단편은 Ndel 및 BamHI와 함께 분해(digested)되고 pETAtu3025를 형성하기 위해서 T4 DNA 리가제를 사용하여 같은 효소들로 미리-분해된 pET29로 묶였다. 구성된 플라스미드는 서열분석했고(Elim Biophamaceuticals) 상기 삽입체의 DNA 서열들을 확인했다.
상기 pETAtu3025는 Escherichia coli 균주 BL21(DE3)로 형질전환시켰다. pETAtu3025를 포함하는 BL21(DE3)의 단일 콜로니를 50 μg/ml 카나마이신 (Km50) 포함 50 ml의 LB 배지에 접종했다. 이 균주를 37℃에서 200rpm으로 오비탈 쉐이커에서 키웠다. OD600nm가 0.6에 도달했을 때, 0.2 mM IPTG를 상기 배양액에 첨가하고, 상기 접종된 배양액을 20℃에 200 rpm으로 오비탈 쉐이커에서 성장시켰다. 접종 24시간 후, 상기 세포들을 10분 동안 4,000 rpm x g에서 원심분리해서 수집하고, 상기 팔레트는 10 μl의 Lysonase™ Bioprocessing Reagent (Novagen)을 포함한 2 ml의 Bugbuster (Novagen)로 10분간 재현탁했다. 상기 용액은 다시 10분 동안 4,000 rpm x g에서 원심분리했고, 상청액을 얻었다.
~2% DEHU 용액의 제조. DEHU 용액은 효소적으로 제조했다. 2 % 알지네이트 용액은 10 g의 낮은 점성 알지네이트를 20 mM Tris-HCl (pH7.5)용액 500 ml에 첨가해서 제조했다. Flavobacterium sp . (Sigma-aldrich로부터 구입)으로부터 유래한 대략 10 mg의 알지네이트 리아제를 알지네이트 용액에 첨가했다. 그후 이 용액 250 다른 병에 옮기고 상기 섹션에서 준비한 Atu3025 포함 E. coli 세포 용해물을 첨가했다. 알지네이트 분해는 실온에서 밤새 수행했다. 수득된 산물은 박층크로마토그래피(thin layer chromatography)에 의해 분석했고, DEHU 형성이 확인되었다.
D- 만누로네이트 용액의 제조. D-만누로네이트 용액은 Spoehr (Archive of Biochemistry, 14: ppl53-155)에 이전에 기술된 프로토콜에 기초하여 화학적으로 제조했다. 50 밀리그램의 알지네이트을 90퍼센트 포메이트 800 μL로 용해했다. 상기 용액을 밤새 100℃에서 배양했다. 그 후 포메이트는 증발시키고 잔여 물질들을 순수 에탄올로 두 번 세정했다. 상기 잔여 물질은 다시 순수 에탄올로 용해하고 여과했다. 에탄올을 증발시키고 잔여 물질들을 20 mL의 20 mM Tris-HCl (pH 8.0)로 재현탁하고 상기 용액은 여과하여 D-만누로네이트 용액을 만들었다. 상기 D-만누로네이트 용액을 5배 희석하고 분석을 위해 사용했다.
DEHU 하이드로게나제 분석. DEHU 하이드로게나제를 확인하기 위해서, 본 발명자들은 NADPH 의존적 DEHU 수소화분석을 수행했다. 각각 ADH가 포함된 준비된 세포 용해물 20μl를 상기 섹션에서 제조된 20배 희석된 DEHU 용액 160μl에 첨가했다. C58의 세포 용해물을 이용한 이전의 연구에서 DEHU 수소화에 보조인자로서 NADPH를 필요로 한다는 것을 보이기 때문에, 2.5 mg/ml NADPH 용액(20 mM Tris- HCl, pH 8.0) 20μl를 수소화반응을 일으키기 위해서 첨가했다. NADPH의 소비는 ThermoMAX 96 웰 플레이트 리더(분자 장치)의 키네틱모드를 사용해 흡광도 340nm에서 30분 동안 모니터했다. N-말단 도메인의 알코올 디하이드로게나제 (ADH) 10 부족 부분을 포함하는 E. coli 세포 용해물을 컨트롤 반응 혼합물에 사용했다.
D- 만누로네이트 하이드로게나제 분석. D-만누로네이트 하이드로게나제를 확인하기 위해, 본 발명자들은 NADPH 의존적 D-만누로네이트 수소화분석을 수행했다. 각각 ADH가 포함된 준비된 세포 용해물 20μl를 상기 섹션에서 준비된 D-만누로네이트 용액 160μl에 첨가했다. 2.5 mg/ml NADPH 용액(20 mM Tris- HCl, pH 8.0) 20μl를 수소화반응을 일으키기 위해서 첨가했다. 상기 NADPH의 소비는 ThermoMAX 96 웰 플레이트 리더(분자 장치)의 키네틱모드를 사용해 흡광도 340nm에서 30분동안 모니터했다. N-말단 도메인의 알코올 디하이드로게나제 (ADH) 10 부족 부분을 포함하는 E. coli 세포 용해물을 컨트롤 반응 혼합물에 사용했다
결과들은 도1, 도2, 및 도24에 나타낸다. ADH1 및 ADH2는 다른 하이드로게나제들과 비교하여 현저하게 높은 DEHU 수소화 활성을 나타냈다(도 1). 그 외에, ADH3, ADH4, 및 ADH9는 다른 하이드로게나제들과 비교하여 현저하게 높은 D-만누로네이트 수소화 활성을 나타내다(도 2). ADH11 및 ADH 20은 또한 상당한 DEHU 수소화 활성을 나타냈다(도 24).

실시예 3
유일한 탄소원으로서 알지네이트에서 성장할 수 있는 조작된 E. COLI
야생형 E. coli는 그의 유일 탄소원으로서 알지네이트 폴리머 또는 분해된 알지네이트를 사용할 수 없다(도 4 참조). 그러나, 비브로스플렌디두스는 성장을 유지할 수 있도록 알지네이트를 물질대사 한다고 알려져 있다. 유일한 탄소원으로 분해된 알지네이트를 사용하는 재조합 E. coli를 생산하기 위해서 비브로스플렌디두스 포스미드 라이브러리를 구성하였고 E. coli로 클로닝했다 (참고, 예를 들면 미국 출원번호. 12/245,537, 그 전체로서 참조로서 포함된다).
비브로스플렌디두스 포스미드 라이브러리를 제조하기 위해서, DNeasy Blood 및 Tissue Kit (Qiagen, Valencia, CA)을 사용하여 비브로스플렌디두스 BOl ( Dr. Martin PoIz, MIT로부터의 선물)로부터 게놈 DNA를 단리했다. 포스미드 라이브러리는 그후 Copy Control Fosmid Library Production Kit (Epicentre, Madison, WI)을 사용해 구성했다. 이 라이브러리는 약 40kb의 임의의 게놈 단편들로 구성된 것으로 벡터 pCC1FOS(Epicentre, Madison, WI)으로 삽입되었다.
상기 포스미드 라이브러리는 파지로 포장되고, pDONR221 플라스미드(Invitrogen, Carlsbad, CA)를 품고 특정 비브로스플렌디두스 유전자(V12B01_02425 to V12B01_02480; type II 분비기관 코딩)를 운반하는 E. coli DHlOB 세포들은 파지 라이브러리로 감염되었다. 이 분비 지역은 비브로스플렌디두스로부터 유래한 타입 II 분비기관을 코딩하는데, 이는 pDONR221 플라스미드로 클로닝되고 E. coli 균주 DHlOB로 도입되었다.
형질전환주를 클로로암페니콜 내성을 위해 선별하고, 그 후 분해된 알지네이트에서 성장할 수 있는 형질전환주들의 능력을 스크리닝하였다. 결과의 형질전환주는 분해된 알지네이트 배지에서 성장을 위해 스크리닝하였다. 분해된 알지네이트 배지는 2% 알지네이트 (Sigma- Aldrich, St. Louis, MO) 10 mM 나트륨- 포스페이트 버퍼, 50 mM KCl, 400 mM NaCl과 Flavobacterium sp.(Sigma-Aldrich, St. Louis, MO)로부터의 알지네이트 용해물을 함께 실온에서 최소 일주일 동안 배양하여 준비하였다. 이 분해된 알지네이트는 최종농도 IX M9 소금, 2 mM MgSO4, 100 μM CaC12, 0.007% 류신, 0.01% 카사미노산, 1.5% NaCl (나트륨의 모든 소스들을 포함한다: M9, 희석된 알지네이트 및 NaCl 첨가)를 가진 성장배지를 만들기 위해서 0.8% 농도로 희석했다.
이 배지에서 잘 성장하는 하나의 포스미드-포함 E. coli 클론을 단리하였다. 이 클론으로부터 상기 포스미드 DNA를 단리하고 FosmidMAX DNA Purification Kit (Epicentre, Madison, WI)을 사용해 준비하였다. 상기 단리된 포스미드는 다시 DH10B 세포들로 전달하였고 이러한 세포들은 알지네이트에서 성장할수 있는 능력을 위해 테스트하였다.
결과들은 도22에서 예시되어있는데, 특정 포스미드-포함 E. coli 클론들은 유일한 탄소원으로서 알지네이트에서 성장할 수 있다는 것을 보여준다. 아그로박테리움 튜메파시엔스은 양성조절을 제공한다{참고, 막힌 원들). 음성조절로서, E. coli DHlOB 세포들은 알지네이트에서 성장할 수 없다(참고, 양성조절의 바로 옆).
이러한 결과들은 또한 이 비브로스플렌디두스 유래 포스미드 클론내에 포함된 서열들이 유일한 탄소원으로서 분해된 알지네이트에서 성장할 수 있는 능력을 충분히 E. coli에 준다는 것을 증명한다. 따라서 pDONR221 벡터내에 포함된 타입 II 분리 기관 서열들은 본래의 DHlOB 세포들에 의해 품은 것으로, 분해된 알지네이트에서의 성장에 필요하지 않았다.
유일한 탄소원으로 알지네이트에 성장을 수여하기에 충분한 단리된 포스미드는 Elim Biopharmaceuticals (Hayward, CA)에 의해 서열화하였다. 서열분석은 전체-길이 유전자들 V12B01_24189부터 V12B01_24249까지를 포함한 게놈 DNA 부분을 가진 벡터를 보여준다. 이 서열에서, 포스미드 클론에서 잘린 Vl 2B01 24189전에는 큰 유전자가 있다. 큰 유전자 V12B01 24184는 자동전달체들과 비슷한 추정 단백질이며 헴 활용 또는 부착과 연관된 큰 엑소단백질들을 포함하는 오르쏘로고스(orthologous) 단백질들의 덩어리인 COG3210에 속한다. 상기 포스미드 큰론에서 V12B01_24184은 N-말단적으로 잘린 것으로, 예상되는 열린 해독틀(전체에서 22889 bp를 포함하는 것으로 예상되는 것)로부터 그 첫 5893 bp가빠져 있는 것이다.
실시예 4
알지네이트로부터 알코올의 생산
유일한 탄소원으로서 알지네이트에서 성장함으로써 알코올을 생성하는 재조합 E. coli의 능력을 테스트하였다. 재조합 E. coli 만들기 위해, 피루베이트 디카르복실라제(pdc)를 코딩하는 DNA서열들, 및 자이모모나스 모빌리스의 두 개의 알코올 디하이드로게나제(adhA 및 adhB)를 중합효소연쇄반응(PCR)로 증폭하였다. Z. 모빌리스로부터의 예시적인 pdc서열은, 이러한 서열들에 대한 정보를 위해 참고로여기에 포함되는 미국특허 제 U.S. Patent No. 7,189,545호를 참조하라. Z. 모빌리스로부터의 예시적인 adhA 및 adhB 서열들은, 이러한 서열들에 대한 정보를 참조하라. 참고로 여기서 포함하는 Keshav et al., J Bacteriol. 172:2491-2497, 1990,를 참조하라.
이러한 증폭된 단편들은 겔 영동하였고 또 한번의 PCR을 통해서 함께 접합하였다. 최종 증폭된 DNA 단편은 BamHI 및 Xbal과 함께 분해되고 같은 제한 효소들로 미리-분해된 클로닝 벡터 pBBR1MCS-2로 묶였다. 수득된 플라스미드는 pBBRPdc-AdhA/B로서 언급된다.
E. coli는 pBBRPdc-AdhA/B 또는 pBBRPdc- AdhA/B + 1.5 Fos (Vl 2B01 24189 와 V12B01 24249 사이의 게놈 지역을 포함하는 포스미드 클론; 이러한 서열들은 유일한 탄소원으로서 알지네이트를 이용할 수 있는 E. coli의 능력을 나타냄, 실시예 3 참고)와 함께 형질전환시켰다. 그리고 알지네이트 포함 m9 배지에서 키우고, 에탄올의 생성을 테스트하였다. 결과들은 도 23에 나타냈는데, pBBRPdc-AdhA/B + 1.5 FOS를 품은 균주가 알지네이트에서 성장할 때 눈에 띄게 높은 에탄올 생성을 보인다는 것이 증명되었다. 이러한 결과들은 pBBRPdc-AdhA/B + 1.5 FOS가 에탄올의 생성에서 유일한 탄소원으로서 알지네이트를 이용할 수 있었다는 것을 보여준다.
<110> Bio Architecture Lab Inc. <120> ISOLATED ALCOHOL DEHYDROGENASE ENZYMES AND USES THEREOF <130> IPA100434 <150> US61/024,160 <151> 2008-01-28 <160> 78 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 1068 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 1 atgttcacaa cgtccgccta tgcctgcgat gacggctctt cgccgatgaa gctcgcgacc 60 atcaggcgcc gcgatcccgg tccgcgcgat gtcgaaatcg agatagaatt ctgtggcgtc 120 tgccactcgg acatccatac ggcccgcagc gaatggccgg gctccctcta cccttgcgtc 180 cccggccacg aaatcgtcgg ccgtgtcggt cgggtgggcg cgcaagtcac ccggttcaag 240 acgggtgacc gcgtcggtgt cggctgtatc gtcgatagct gccgcgaatg cgcaagctgc 300 gccgaagggc tggagcaata ttgcgaaaac ggcatgaccg gcacctataa ctcccctgac 360 aaggcgatgg gcggcggcgc gcatacgctt ggcggctatt ccgcccatgt ggtggtggat 420 gaccgctatg tgctcaatat tcccgaaggg ctcgatccgg cggcagcagc accgctactc 480 tgcgctggta tcaccaccta ctcgccgctg cgccactgga atgccggccc cggcaaacgc 540 gtcggcgtcg tcggtctggg cggcctcggc catatggccg tcaagctcgc caatgccatg 600 ggtgcgactg tcgtgatgat caccacctcg cccggcaagg cggaggatgc caaaaaactc 660 ggcgcacacg aggtgatcat ctcccgcgat gcggagcaga tgaagaaggc tacctcgagc 720 ctcgatctca tcatcgatgc tgtcgccgcc gaccacgaca tcgacgccta tctggcgctg 780 ctgaaacgcg atggcgcgct ggtgcaggtg ggcgcgccgg aaaagccact ttcggtgatg 840 gccttcagcc tcatccccgg ccgcaagacc tttgccggct cgatgatcgg cggtattccc 900 gagactcagg aaatgctgga tttctgcgcc gaaaaaggca tcgccggcga aatcgagatg 960 atcgatatcg atcagatcaa tgacgcttat gaacgcatga taaaaagcga tgtgcgttat 1020 cgtttcgtca ttgatatgaa gagcctgccg cgccagaagg ccgcctga 1068 <210> 2 <211> 355 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 2 Met Phe Thr Thr Ser Ala Tyr Ala Cys Asp Asp Gly Ser Ser Pro Met 1 5 10 15 Lys Leu Ala Thr Ile Arg Arg Arg Asp Pro Gly Pro Arg Asp Val Glu 20 25 30 Ile Glu Ile Glu Phe Cys Gly Val Cys His Ser Asp Ile His Thr Ala 35 40 45 Arg Ser Glu Trp Pro Gly Ser Leu Tyr Pro Cys Val Pro Gly His Glu 50 55 60 Ile Val Gly Arg Val Gly Arg Val Gly Ala Gln Val Thr Arg Phe Lys 65 70 75 80 Thr Gly Asp Arg Val Gly Val Gly Cys Ile Val Asp Ser Cys Arg Glu 85 90 95 Cys Ala Ser Cys Ala Glu Gly Leu Glu Gln Tyr Cys Glu Asn Gly Met 100 105 110 Thr Gly Thr Tyr Asn Ser Pro Asp Lys Ala Met Gly Gly Gly Ala His 115 120 125 Thr Leu Gly Gly Tyr Ser Ala His Val Val Val Asp Asp Arg Tyr Val 130 135 140 Leu Asn Ile Pro Glu Gly Leu Asp Pro Ala Ala Ala Ala Pro Leu Leu 145 150 155 160 Cys Ala Gly Ile Thr Thr Tyr Ser Pro Leu Arg His Trp Asn Ala Gly 165 170 175 Pro Gly Lys Arg Val Gly Val Val Gly Leu Gly Gly Leu Gly His Met 180 185 190 Ala Val Lys Leu Ala Asn Ala Met Gly Ala Thr Val Val Met Ile Thr 195 200 205 Thr Ser Pro Gly Lys Ala Glu Asp Ala Lys Lys Leu Gly Ala His Glu 210 215 220 Val Ile Ile Ser Arg Asp Ala Glu Gln Met Lys Lys Ala Thr Ser Ser 225 230 235 240 Leu Asp Leu Ile Ile Asp Ala Val Ala Ala Asp His Asp Ile Asp Ala 245 250 255 Tyr Leu Ala Leu Leu Lys Arg Asp Gly Ala Leu Val Gln Val Gly Ala 260 265 270 Pro Glu Lys Pro Leu Ser Val Met Ala Phe Ser Leu Ile Pro Gly Arg 275 280 285 Lys Thr Phe Ala Gly Ser Met Ile Gly Gly Ile Pro Glu Thr Gln Glu 290 295 300 Met Leu Asp Phe Cys Ala Glu Lys Gly Ile Ala Gly Glu Ile Glu Met 305 310 315 320 Ile Asp Ile Asp Gln Ile Asn Asp Ala Tyr Glu Arg Met Ile Lys Ser 325 330 335 Asp Val Arg Tyr Arg Phe Val Ile Asp Met Lys Ser Leu Pro Arg Gln 340 345 350 Lys Ala Ala 355 <210> 3 <211> 1047 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 3 atggctattg caagaggtta tgctgcgacc gacgcgtcga agccgcttac cccgttcacc 60 ttcgaacgcc gcgagccgaa tgatgacgac gtcgtcatcg atatcaaata tgccggcatc 120 tgccactcgg acatccacac cgtccgcaac gaatggcaca atgccgttta cccgatcgtt 180 ccgggccacg aaatcgccgg tgtcgtgcgg gccgttggtt ccaaggtcac gcggttcaag 240 gtcggcgacc atgtcggcgt cggctgcttt gtcgattcct gcgttggctg cgccacccgc 300 gatgtcgaca atgagcagta tatgccgggt ctcgtgcaga cctacaattc cgttgaacgg 360 gacggcaaga gcgcgaccca gggcggttat tccgaccata tcgtggtcag ggaagactac 420 gtcctgtcca tcccggacaa cctgccgctc gatgcctccg cgccgcttct ctgcgccggc 480 atcacgctct attcgccgct gcagcactgg aatgcaggcc ccggcaagaa agtggctatc 540 gtcggcatgg gtggccttgg ccacatgggc gtgaagatcg gctcggccat gggcgctgat 600 atcaccgttc tctcgcagac gctgtcgaag aaggaagacg gcctcaagct cggcgcgaag 660 gaatattacg ccaccagcga cgcctcgacc tttgagaaac tcgccggcac cttcgacctg 720 atcctgtgca cagtctcggc cgaaatcgac tggaacgcct acctcaacct gctcaaggtc 780 aacggcacga tggttctgct cggcgtgccg gaacatgcga tcccggtgca cgcattctcg 840 gtcattcccg cccgccgttc gctcgccggt tcgatgatcg gctcgatcaa ggaaacccag 900 gaaatgctgg atttctgcgg caagcacgac atcgtttcgg aaatcgaaac gatcggcatc 960 aaggacgtca acgaagccta tgagcgcgtg ctgaagagcg acgtgcgtta ccgcttcgtc 1020 atcgacatgg cctcgctcga cgcttga 1047 <210> 4 <211> 348 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 4 Met Ala Ile Ala Arg Gly Tyr Ala Ala Thr Asp Ala Ser Lys Pro Leu 1 5 10 15 Thr Pro Phe Thr Phe Glu Arg Arg Glu Pro Asn Asp Asp Asp Val Val 20 25 30 Ile Asp Ile Lys Tyr Ala Gly Ile Cys His Ser Asp Ile His Thr Val 35 40 45 Arg Asn Glu Trp His Asn Ala Val Tyr Pro Ile Val Pro Gly His Glu 50 55 60 Ile Ala Gly Val Val Arg Ala Val Gly Ser Lys Val Thr Arg Phe Lys 65 70 75 80 Val Gly Asp His Val Gly Val Gly Cys Phe Val Asp Ser Cys Val Gly 85 90 95 Cys Ala Thr Arg Asp Val Asp Asn Glu Gln Tyr Met Pro Gly Leu Val 100 105 110 Gln Thr Tyr Asn Ser Val Glu Arg Asp Gly Lys Ser Ala Thr Gln Gly 115 120 125 Gly Tyr Ser Asp His Ile Val Val Arg Glu Asp Tyr Val Leu Ser Ile 130 135 140 Pro Asp Asn Leu Pro Leu Asp Ala Ser Ala Pro Leu Leu Cys Ala Gly 145 150 155 160 Ile Thr Leu Tyr Ser Pro Leu Gln His Trp Asn Ala Gly Pro Gly Lys 165 170 175 Lys Val Ala Ile Val Gly Met Gly Gly Leu Gly His Met Gly Val Lys 180 185 190 Ile Gly Ser Ala Met Gly Ala Asp Ile Thr Val Leu Ser Gln Thr Leu 195 200 205 Ser Lys Lys Glu Asp Gly Leu Lys Leu Gly Ala Lys Glu Tyr Tyr Ala 210 215 220 Thr Ser Asp Ala Ser Thr Phe Glu Lys Leu Ala Gly Thr Phe Asp Leu 225 230 235 240 Ile Leu Cys Thr Val Ser Ala Glu Ile Asp Trp Asn Ala Tyr Leu Asn 245 250 255 Leu Leu Lys Val Asn Gly Thr Met Val Leu Leu Gly Val Pro Glu His 260 265 270 Ala Ile Pro Val His Ala Phe Ser Val Ile Pro Ala Arg Arg Ser Leu 275 280 285 Ala Gly Ser Met Ile Gly Ser Ile Lys Glu Thr Gln Glu Met Leu Asp 290 295 300 Phe Cys Gly Lys His Asp Ile Val Ser Glu Ile Glu Thr Ile Gly Ile 305 310 315 320 Lys Asp Val Asn Glu Ala Tyr Glu Arg Val Leu Lys Ser Asp Val Arg 325 330 335 Tyr Arg Phe Val Ile Asp Met Ala Ser Leu Asp Ala 340 345 <210> 5 <211> 1029 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 5 atgactaaaa caatgaaggc ggcggttgtc cgcgcatttg gaaaaccgct gaccatcgag 60 gaagtggcaa taccggatcc cggccccggt gaaattctca tcaactacaa ggcgacgggc 120 gtttgccaca ccgacctgca cgccgcaacg ggggattggc cggtcaagcc caacccgccc 180 ttcattcccg gacatgaagg tgcaggttac gtcgccaaga tcggcgctgg cgtcaccggc 240 atcaaggagg gcgaccgcgc cggcacgccc tggctctaca ccgcctgcgg atgctgcatt 300 ccctgccgta ccggctggga aaccctgtgc ccgagccaga agaactcagg ttattccgtc 360 aacggcagct ttgccgaata tggccttgcc gatccgaaat tcgtcggccg cctgcctgac 420 aatctcgatt tcggcccagc cgcacccgtg ctctgcgccg gcgttacagt ctataagggc 480 ctgaaggaaa ccgaagtcag gcccggtgaa tgggtggtca tttcaggcat tggcgggctt 540 ggccacatgg ccgtgcaata tgcgaaagcc atgggcatgc atgtggttgc cgccgatatt 600 ttcgacgaca agctggcgct tgccaaaaag ctcggagccg acgtcgtcgt caacggccgc 660 gcgcctgacg cggtggagca agtgcaaaag gcaaccggcg gcgtccatgg cgcgctggtg 720 acggcggttt caccgaaggc catggagcag gcttatggct tcctgcgctc caagggcacg 780 atggcgcttg tcggtctgcc gccgggcttc atctccattc cggtgttcga cacggtgctg 840 aagcgcatca cggtgcgtgg ctccatcgtc ggcacgcggc aggatctgga ggaggcgttg 900 accttcgccg gtgaaggcaa ggtggccgcc cacttctcgt gggacaagct cgaaaacatc 960 aatgatatct tccatcgcat ggaagagggc aagatcgacg gccgtatcgt cgtggatctc 1020 gccgcctga 1029 <210> 6 <211> 342 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 6 Met Thr Lys Thr Met Lys Ala Ala Val Val Arg Ala Phe Gly Lys Pro 1 5 10 15 Leu Thr Ile Glu Glu Val Ala Ile Pro Asp Pro Gly Pro Gly Glu Ile 20 25 30 Leu Ile Asn Tyr Lys Ala Thr Gly Val Cys His Thr Asp Leu His Ala 35 40 45 Ala Thr Gly Asp Trp Pro Val Lys Pro Asn Pro Pro Phe Ile Pro Gly 50 55 60 His Glu Gly Ala Gly Tyr Val Ala Lys Ile Gly Ala Gly Val Thr Gly 65 70 75 80 Ile Lys Glu Gly Asp Arg Ala Gly Thr Pro Trp Leu Tyr Thr Ala Cys 85 90 95 Gly Cys Cys Ile Pro Cys Arg Thr Gly Trp Glu Thr Leu Cys Pro Ser 100 105 110 Gln Lys Asn Ser Gly Tyr Ser Val Asn Gly Ser Phe Ala Glu Tyr Gly 115 120 125 Leu Ala Asp Pro Lys Phe Val Gly Arg Leu Pro Asp Asn Leu Asp Phe 130 135 140 Gly Pro Ala Ala Pro Val Leu Cys Ala Gly Val Thr Val Tyr Lys Gly 145 150 155 160 Leu Lys Glu Thr Glu Val Arg Pro Gly Glu Trp Val Val Ile Ser Gly 165 170 175 Ile Gly Gly Leu Gly His Met Ala Val Gln Tyr Ala Lys Ala Met Gly 180 185 190 Met His Val Val Ala Ala Asp Ile Phe Asp Asp Lys Leu Ala Leu Ala 195 200 205 Lys Lys Leu Gly Ala Asp Val Val Val Asn Gly Arg Ala Pro Asp Ala 210 215 220 Val Glu Gln Val Gln Lys Ala Thr Gly Gly Val His Gly Ala Leu Val 225 230 235 240 Thr Ala Val Ser Pro Lys Ala Met Glu Gln Ala Tyr Gly Phe Leu Arg 245 250 255 Ser Lys Gly Thr Met Ala Leu Val Gly Leu Pro Pro Gly Phe Ile Ser 260 265 270 Ile Pro Val Phe Asp Thr Val Leu Lys Arg Ile Thr Val Arg Gly Ser 275 280 285 Ile Val Gly Thr Arg Gln Asp Leu Glu Glu Ala Leu Thr Phe Ala Gly 290 295 300 Glu Gly Lys Val Ala Ala His Phe Ser Trp Asp Lys Leu Glu Asn Ile 305 310 315 320 Asn Asp Ile Phe His Arg Met Glu Glu Gly Lys Ile Asp Gly Arg Ile 325 330 335 Val Val Asp Leu Ala Ala 340 <210> 7 <211> 1008 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 7 atgaccgggg cgaaccagcc ttgggaggtt caagaggttc ccgttccgaa ggcagagcca 60 ggacttgtcc ttgttaaaat ccacgcctcc ggcatgtgct acacggacgt gtgggcgacg 120 cagggtgccg gtggcgacat ctatccgcag acccccggcc atgaggttgt cggcgagatc 180 atcgaggtcg gcgcgggcgt tcatacgcgc aaggtgggag accgggtcgg caccacctgg 240 gtgcagtcct cttgtggacg atgctcctac tgccgccaga accgtccgtt gaccggccag 300 acagccatga actgcgattc acccaggaca acggggttcg cgacgcaagg cgggcacgca 360 gagtacatcg cgatctctgc tgaaggcaca gtgttattac ccgacgggct cgactacacg 420 gatgccgcac ccatgatgtg cgcaggctac acgacctgga gcggcttgcg cgacgccgag 480 cccaaacctg gtgacagaat tgcggtactt ggcatcggcg ggctggggca cgtcgccgtg 540 cagttctcca aagccttggg gtttgagacc atcgcgatca cgcattcacc cgacaagcac 600 aagttggcca ccgatcttgg tgcagacatc gtcgtcgccg atggcaaaga gttattggag 660 gccggcggtg cggacgttct tctggttacg accaacgact tcgacaccgc cgaaaaagcg 720 atggcgggcg taaggcctga cgggcgcatc gttctttgcg cgctcgactt cagcaagccg 780 ttctcgatcc cgtccgacgg caagccgttc cacatgatgc gccaacgcgt ggttgggtcc 840 acgcatggcg gacagcacta tctcgccgaa atcctcgatc tcgccgccaa gggcaaggtc 900 aagccgattg tcgagacctt cgccctcgag caggcaaccg aggcatatga gcggctatcc 960 accgggaaga tgcgcttccg gggcgtgttc cttccgcacg gcgcttga 1008 <210> 8 <211> 335 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 8 Met Thr Gly Ala Asn Gln Pro Trp Glu Val Gln Glu Val Pro Val Pro 1 5 10 15 Lys Ala Glu Pro Gly Leu Val Leu Val Lys Ile His Ala Ser Gly Met 20 25 30 Cys Tyr Thr Asp Val Trp Ala Thr Gln Gly Ala Gly Gly Asp Ile Tyr 35 40 45 Pro Gln Thr Pro Gly His Glu Val Val Gly Glu Ile Ile Glu Val Gly 50 55 60 Ala Gly Val His Thr Arg Lys Val Gly Asp Arg Val Gly Thr Thr Trp 65 70 75 80 Val Gln Ser Ser Cys Gly Arg Cys Ser Tyr Cys Arg Gln Asn Arg Pro 85 90 95 Leu Thr Gly Gln Thr Ala Met Asn Cys Asp Ser Pro Arg Thr Thr Gly 100 105 110 Phe Ala Thr Gln Gly Gly His Ala Glu Tyr Ile Ala Ile Ser Ala Glu 115 120 125 Gly Thr Val Leu Leu Pro Asp Gly Leu Asp Tyr Thr Asp Ala Ala Pro 130 135 140 Met Met Cys Ala Gly Tyr Thr Thr Trp Ser Gly Leu Arg Asp Ala Glu 145 150 155 160 Pro Lys Pro Gly Asp Arg Ile Ala Val Leu Gly Ile Gly Gly Leu Gly 165 170 175 His Val Ala Val Gln Phe Ser Lys Ala Leu Gly Phe Glu Thr Ile Ala 180 185 190 Ile Thr His Ser Pro Asp Lys His Lys Leu Ala Thr Asp Leu Gly Ala 195 200 205 Asp Ile Val Val Ala Asp Gly Lys Glu Leu Leu Glu Ala Gly Gly Ala 210 215 220 Asp Val Leu Leu Val Thr Thr Asn Asp Phe Asp Thr Ala Glu Lys Ala 225 230 235 240 Met Ala Gly Val Arg Pro Asp Gly Arg Ile Val Leu Cys Ala Leu Asp 245 250 255 Phe Ser Lys Pro Phe Ser Ile Pro Ser Asp Gly Lys Pro Phe His Met 260 265 270 Met Arg Gln Arg Val Val Gly Ser Thr His Gly Gly Gln His Tyr Leu 275 280 285 Ala Glu Ile Leu Asp Leu Ala Ala Lys Gly Lys Val Lys Pro Ile Val 290 295 300 Glu Thr Phe Ala Leu Glu Gln Ala Thr Glu Ala Tyr Glu Arg Leu Ser 305 310 315 320 Thr Gly Lys Met Arg Phe Arg Gly Val Phe Leu Pro His Gly Ala 325 330 335 <210> 9 <211> 1017 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 9 atgaccatgc atgccattca attcgtcgag aagggacgcg ccgtgctggc ggaactcccc 60 gtcgccgatc tgccgccggg ccatgcgctc gtgcgggtca aggcttcggg gctttgccat 120 accgatatcg acgtgctgca tgcgcgttat ggcgacggtg cgttccccgt cattccgggg 180 catgaatatg ctggcgaagt cgcagccgtg gcttccgatg tgacagtctt caaggctggc 240 gaccgggttg tcgtcgatcc caatctgccc tgtggcacct gcgccagctg caggaaaggg 300 ctgaccaacc tttgcagcac attgaaagct tacggcgttt cccacaatgg cggctttgcg 360 gagttcagtg tggtgcgtgc cgatcacctg cacggtatcg gttcgatgcc ctatcacgtc 420 gcggcgctgg ctgagccgct tgcctgtgtt gtcaatggca tgcagagtgc gggtattggc 480 gagagtggcg tggtgccgga gaatgcgctt gttttcggtg ctgggcccat cggcctgctg 540 cttgccctgt cgctgaaatc acgcggcatt gcgacggtga cgatggccga tatcaatgaa 600 agcaggctgg cctttgccca ggacctcggg cttcagacgg cggtatccgg ctcggaagcg 660 ctctcgcggc agcggaagga gttcgatttc gtggccgatg cgacgggtat tgccccggtc 720 gccgaggcga tgatcccgct ggttgcggat ggcggcacgg cgctattctt cggcgtctgc 780 gcgccggatg cccgtatttc ggtggcaccg tttgaaatct tccggcgcca gctgaaactt 840 gtcggctcgc attcgctgaa ccgcaacata ccgcaggcgc ttgccattct ggagacggat 900 ggcgaggtca tggcgcggct cgtttcgcac cgcttgccgc tttcggagat gctgccgttc 960 tttacgaaaa aaccgtctga tccggcgacg atgaaagtgc aatttgcagc cgaatga 1017 <210> 10 <211> 338 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 10 Met Thr Met His Ala Ile Gln Phe Val Glu Lys Gly Arg Ala Val Leu 1 5 10 15 Ala Glu Leu Pro Val Ala Asp Leu Pro Pro Gly His Ala Leu Val Arg 20 25 30 Val Lys Ala Ser Gly Leu Cys His Thr Asp Ile Asp Val Leu His Ala 35 40 45 Arg Tyr Gly Asp Gly Ala Phe Pro Val Ile Pro Gly His Glu Tyr Ala 50 55 60 Gly Glu Val Ala Ala Val Ala Ser Asp Val Thr Val Phe Lys Ala Gly 65 70 75 80 Asp Arg Val Val Val Asp Pro Asn Leu Pro Cys Gly Thr Cys Ala Ser 85 90 95 Cys Arg Lys Gly Leu Thr Asn Leu Cys Ser Thr Leu Lys Ala Tyr Gly 100 105 110 Val Ser His Asn Gly Gly Phe Ala Glu Phe Ser Val Val Arg Ala Asp 115 120 125 His Leu His Gly Ile Gly Ser Met Pro Tyr His Val Ala Ala Leu Ala 130 135 140 Glu Pro Leu Ala Cys Val Val Asn Gly Met Gln Ser Ala Gly Ile Gly 145 150 155 160 Glu Ser Gly Val Val Pro Glu Asn Ala Leu Val Phe Gly Ala Gly Pro 165 170 175 Ile Gly Leu Leu Leu Ala Leu Ser Leu Lys Ser Arg Gly Ile Ala Thr 180 185 190 Val Thr Met Ala Asp Ile Asn Glu Ser Arg Leu Ala Phe Ala Gln Asp 195 200 205 Leu Gly Leu Gln Thr Ala Val Ser Gly Ser Glu Ala Leu Ser Arg Gln 210 215 220 Arg Lys Glu Phe Asp Phe Val Ala Asp Ala Thr Gly Ile Ala Pro Val 225 230 235 240 Ala Glu Ala Met Ile Pro Leu Val Ala Asp Gly Gly Thr Ala Leu Phe 245 250 255 Phe Gly Val Cys Ala Pro Asp Ala Arg Ile Ser Val Ala Pro Phe Glu 260 265 270 Ile Phe Arg Arg Gln Leu Lys Leu Val Gly Ser His Ser Leu Asn Arg 275 280 285 Asn Ile Pro Gln Ala Leu Ala Ile Leu Glu Thr Asp Gly Glu Val Met 290 295 300 Ala Arg Leu Val Ser His Arg Leu Pro Leu Ser Glu Met Leu Pro Phe 305 310 315 320 Phe Thr Lys Lys Pro Ser Asp Pro Ala Thr Met Lys Val Gln Phe Ala 325 330 335 Ala Glu <210> 11 <211> 1044 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 11 atgcgcgcgc tttattacga acgattcggc gagacccctg tagtcgcgtc cctgcctgat 60 ccggcaccga gcgatggcgg cgtggtgatt gcggtgaagg caaccggcct ctgccgcagc 120 gactggcatg gctggatggg acatgacacg gatatccgtc tgccgcatgt gcccggccac 180 gagttcgccg gcgtcatctc cgcagtcggc agaaacgtca cccgcttcaa gacgggtgat 240 cgcgttaccg tgcctttcgt ctccggctgc ggccattgcc atgagtgccg ctccggcaat 300 cagcaggtct gcgaaacgca gttccagccc ggcttcaccc attggggttc cttcgccgaa 360 tatgtcgcca tcgactatgc cgatcagaac ctcgtgcacc tgccggaatc gatgagttac 420 gccaccgccg ccggcctcgg ttgccgtttc gccacctcct tccgggcggt gacggatcag 480 ggacgcctga agggcggcga atggctggct gtccatggct gcggcggtgt cggtctctcc 540 gccatcatga tcggcgccgg cctcggcgca caggtcgtcg ccatcgatat tgccgaagac 600 aagctcgaac tcgcccggca actgggtgca accgcaacca tcaacagccg ctccgttgcc 660 gatgtcgccg aagcggtgcg cgacatcacc ggtggcggcg cgcatgtgtc ggtggatgcg 720 cttggccatc cgcagacctg ctgcaattcc atcagcaacc tgcgccggcg cggacgccat 780 gtgcaggtgg ggctgatgct ggcagaccat gccatgccgg ccattcccat ggcccgggtg 840 atcgctcatg agctggagat ctatggcagc cacggcatgc aggcatggcg ttacgaggac 900 atgctggcca tgatcgaaag cggcaggctt gcgccggaaa agctgattgg ccgccatatc 960 tcgctgaccg aagcggccgt cgccctgccc ggaatggata ggttccagga gagcggcatc 1020 agcatcatcg accggttcga atag 1044 <210> 12 <211> 357 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 12 Met Asn Leu Arg Thr Asn Asp Glu Ala Met Met Arg Ala Leu Tyr Tyr 1 5 10 15 Glu Arg Phe Gly Glu Thr Pro Val Val Ala Ser Leu Pro Asp Pro Ala 20 25 30 Pro Ser Asp Gly Gly Val Val Ile Ala Val Lys Ala Thr Gly Leu Cys 35 40 45 Arg Ser Asp Trp His Gly Trp Met Gly His Asp Thr Asp Ile Arg Leu 50 55 60 Pro His Val Pro Gly His Glu Phe Ala Gly Val Ile Ser Ala Val Gly 65 70 75 80 Arg Asn Val Thr Arg Phe Lys Thr Gly Asp Arg Val Thr Val Pro Phe 85 90 95 Val Ser Gly Cys Gly His Cys His Glu Cys Arg Ser Gly Asn Gln Gln 100 105 110 Val Cys Glu Thr Gln Phe Gln Pro Gly Phe Thr His Trp Gly Ser Phe 115 120 125 Ala Glu Tyr Val Ala Ile Asp Tyr Ala Asp Gln Asn Leu Val His Leu 130 135 140 Pro Glu Ser Met Ser Tyr Ala Thr Ala Ala Gly Leu Gly Cys Arg Phe 145 150 155 160 Ala Thr Ser Phe Arg Ala Val Thr Asp Gln Gly Arg Leu Lys Gly Gly 165 170 175 Glu Trp Leu Ala Val His Gly Cys Gly Gly Val Gly Leu Ser Ala Ile 180 185 190 Met Ile Gly Ala Gly Leu Gly Ala Gln Val Val Ala Ile Asp Ile Ala 195 200 205 Glu Asp Lys Leu Glu Leu Ala Arg Gln Leu Gly Ala Thr Ala Thr Ile 210 215 220 Asn Ser Arg Ser Val Ala Asp Val Ala Glu Ala Val Arg Asp Ile Thr 225 230 235 240 Gly Gly Gly Ala His Val Ser Val Asp Ala Leu Gly His Pro Gln Thr 245 250 255 Cys Cys Asn Ser Ile Ser Asn Leu Arg Arg Arg Gly Arg His Val Gln 260 265 270 Val Gly Leu Met Leu Ala Asp His Ala Met Pro Ala Ile Pro Met Ala 275 280 285 Arg Val Ile Ala His Glu Leu Glu Ile Tyr Gly Ser His Gly Met Gln 290 295 300 Ala Trp Arg Tyr Glu Asp Met Leu Ala Met Ile Glu Ser Gly Arg Leu 305 310 315 320 Ala Pro Glu Lys Leu Ile Gly Arg His Ile Ser Leu Thr Glu Ala Ala 325 330 335 Val Ala Leu Pro Gly Met Asp Arg Phe Gln Glu Ser Gly Ile Ser Ile 340 345 350 Ile Asp Arg Phe Glu 355 <210> 13 <211> 1011 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 13 atgctggcga ttttctgtga cactcccggt caattaaccg ccaaggatct gccgaacccc 60 gtgcgcggcg aaggtgaagt cctggtacgt attcgccgga ttggcgtttg cggcacggat 120 ctgcacatct ttaccggcaa ccagccctat ctttcctatc cgcggatcat gggtcacgaa 180 ctttccggca cggttgagga ggcacccgct ggcagccacc tttccgctgg cgatgtggtg 240 accataattc cctatatgtc ctgcgggaaa tgcaatgcct gcctgaaggg taagagcaat 300 tgctgccgca atatcggtgt gcttggcgtt catcgcgatg gcggcatggt ggaatatctg 360 agcgtgccgc agcaattcgt gctgaaggcg gaggggctga gcctcgacca ggcagccatg 420 acggaatttc tggcgatcgg tgcccatgcg gtgcgtcgcg gtgccgtcga aaaagggcaa 480 aaggtcctga tcgtcggtgc cggcccgatc ggcatggcgg ttgctgtctt tgcggttctc 540 gatggcacgg aagtgacgat gatcgacggt cgcaccgacc ggctggattt ctgcaaggac 600 cacctcggtg tcgctcatac agtcgccctc ggcgacggtg acaaagatcg tctgtccgac 660 attaccggtg gcaatttctt cgatgcggtg tttgatgcga ccggcaatcc gaaagccatg 720 gagcgcggtt tctccttcgt cggtcacggc ggctcctatg ttctggtgtc catcgtcgcc 780 agcgatatca gcttcaacga cccggaattt cacaagcgtg agacgacgct gctcggcagc 840 cgcaacgcga cggctgatga tttcgagcgg gtgcttcgcg ccttgcgcga agggaaagtg 900 ccggaggcac taatcaccca tcgcatgaca cttgccgatg ttccctcgaa gttcgccggc 960 ctgaccgatc cgaaagccgg agtcatcaag ggcatggtgg aggtcgcatg a 1011 <210> 14 <211> 336 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 14 Met Leu Ala Ile Phe Cys Asp Thr Pro Gly Gln Leu Thr Ala Lys Asp 1 5 10 15 Leu Pro Asn Pro Val Arg Gly Glu Gly Glu Val Leu Val Arg Ile Arg 20 25 30 Arg Ile Gly Val Cys Gly Thr Asp Leu His Ile Phe Thr Gly Asn Gln 35 40 45 Pro Tyr Leu Ser Tyr Pro Arg Ile Met Gly His Glu Leu Ser Gly Thr 50 55 60 Val Glu Glu Ala Pro Ala Gly Ser His Leu Ser Ala Gly Asp Val Val 65 70 75 80 Thr Ile Ile Pro Tyr Met Ser Cys Gly Lys Cys Asn Ala Cys Leu Lys 85 90 95 Gly Lys Ser Asn Cys Cys Arg Asn Ile Gly Val Leu Gly Val His Arg 100 105 110 Asp Gly Gly Met Val Glu Tyr Leu Ser Val Pro Gln Gln Phe Val Leu 115 120 125 Lys Ala Glu Gly Leu Ser Leu Asp Gln Ala Ala Met Thr Glu Phe Leu 130 135 140 Ala Ile Gly Ala His Ala Val Arg Arg Gly Ala Val Glu Lys Gly Gln 145 150 155 160 Lys Val Leu Ile Val Gly Ala Gly Pro Ile Gly Met Ala Val Ala Val 165 170 175 Phe Ala Val Leu Asp Gly Thr Glu Val Thr Met Ile Asp Gly Arg Thr 180 185 190 Asp Arg Leu Asp Phe Cys Lys Asp His Leu Gly Val Ala His Thr Val 195 200 205 Ala Leu Gly Asp Gly Asp Lys Asp Arg Leu Ser Asp Ile Thr Gly Gly 210 215 220 Asn Phe Phe Asp Ala Val Phe Asp Ala Thr Gly Asn Pro Lys Ala Met 225 230 235 240 Glu Arg Gly Phe Ser Phe Val Gly His Gly Gly Ser Tyr Val Leu Val 245 250 255 Ser Ile Val Ala Ser Asp Ile Ser Phe Asn Asp Pro Glu Phe His Lys 260 265 270 Arg Glu Thr Thr Leu Leu Gly Ser Arg Asn Ala Thr Ala Asp Asp Phe 275 280 285 Glu Arg Val Leu Arg Ala Leu Arg Glu Gly Lys Val Pro Glu Ala Leu 290 295 300 Ile Thr His Arg Met Thr Leu Ala Asp Val Pro Ser Lys Phe Ala Gly 305 310 315 320 Leu Thr Asp Pro Lys Ala Gly Val Ile Lys Gly Met Val Glu Val Ala 325 330 335 <210> 15 <211> 1005 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 15 gtgaaagcct tcgtcgtcga caagtacaag aagaagggcc cgctgcgtct ggccgacatg 60 cccaatccgg tcatcggcgc caatgatgtg ctggttcgca tccatgccac tgccatcaat 120 cttctcgact ccaaggtgcg cgacggggaa ttcaagctgt tcctgcccta tcgtcctccc 180 ttcattctcg gtcatgatct ggccggaacg gtcatccgcg tcggcgcgaa tgtacggcag 240 ttcaagacag gcgacgaggt tttcgctcgc ccgcgtgatc accgggtcgg aaccttcgca 300 gaaatgattg cggtcgatgc cgcagacctt gcgctgaagc caacgagcct gtccatggag 360 caggcagcgt cgatcccgct cgtcggactg actgcctggc aggcgcttat cgaggttggc 420 aaggtcaagt ccggccagaa ggttttcatc caggccggtt ccggcggtgt cggcaccttc 480 gccatccagc ttgccaagca tctcggcgct accgtggcca cgaccaccag cgccgcgaat 540 gccgaactgg tcaaaagcct cggcgcagat gtggtgatcg actacaagac gcaggacttc 600 gaacaggtgc tgtccggcta cgatctcgtc ctgaacagcc aggatgccaa gacgctggaa 660 aagtcgttga acgtgctgag accgggcgga aagctcattt cgatctccgg tccgccggat 720 gttgcctttg ccagatcgtt gaaactgaat ccgctcctgc gttttgtcgt cagaatgctg 780 agccgtggtg tcctgaaaaa ggcaagcaga cgcggtgtcg attactcttt cctgttcatg 840 cgcgccgaag gtcagcaatt gcatgagatc gccgaactga tcgatgccgg caccatccgt 900 ccggtcgtcg acaaggtgtt tcaatttgcg cagacgcccg acgccctggc ctatgtcgag 960 accggacggg caaggggcaa ggttgtggtt acatacgcat cctag 1005 <210> 16 <211> 359 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 16 Met Pro Ser Leu Cys Arg Lys Pro Trp Leu Ser Ser Leu Pro Asp Leu 1 5 10 15 Ile Asn Val Ser His Trp Arg Lys Pro Val Lys Ala Phe Val Val Asp 20 25 30 Lys Tyr Lys Lys Lys Gly Pro Leu Arg Leu Ala Asp Met Pro Asn Pro 35 40 45 Val Ile Gly Ala Asn Asp Val Leu Val Arg Ile His Ala Thr Ala Ile 50 55 60 Asn Leu Leu Asp Ser Lys Val Arg Asp Gly Glu Phe Lys Leu Phe Leu 65 70 75 80 Pro Tyr Arg Pro Pro Phe Ile Leu Gly His Asp Leu Ala Gly Thr Val 85 90 95 Ile Arg Val Gly Ala Asn Val Arg Gln Phe Lys Thr Gly Asp Glu Val 100 105 110 Phe Ala Arg Pro Arg Asp His Arg Val Gly Thr Phe Ala Glu Met Ile 115 120 125 Ala Val Asp Ala Ala Asp Leu Ala Leu Lys Pro Thr Ser Leu Ser Met 130 135 140 Glu Gln Ala Ala Ser Ile Pro Leu Val Gly Leu Thr Ala Trp Gln Ala 145 150 155 160 Leu Ile Glu Val Gly Lys Val Lys Ser Gly Gln Lys Val Phe Ile Gln 165 170 175 Ala Gly Ser Gly Gly Val Gly Thr Phe Ala Ile Gln Leu Ala Lys His 180 185 190 Leu Gly Ala Thr Val Ala Thr Thr Thr Ser Ala Ala Asn Ala Glu Leu 195 200 205 Val Lys Ser Leu Gly Ala Asp Val Val Ile Asp Tyr Lys Thr Gln Asp 210 215 220 Phe Glu Gln Val Leu Ser Gly Tyr Asp Leu Val Leu Asn Ser Gln Asp 225 230 235 240 Ala Lys Thr Leu Glu Lys Ser Leu Asn Val Leu Arg Pro Gly Gly Lys 245 250 255 Leu Ile Ser Ile Ser Gly Pro Pro Asp Val Ala Phe Ala Arg Ser Leu 260 265 270 Lys Leu Asn Pro Leu Leu Arg Phe Val Val Arg Met Leu Ser Arg Gly 275 280 285 Val Leu Lys Lys Ala Ser Arg Arg Gly Val Asp Tyr Ser Phe Leu Phe 290 295 300 Met Arg Ala Glu Gly Gln Gln Leu His Glu Ile Ala Glu Leu Ile Asp 305 310 315 320 Ala Gly Thr Ile Arg Pro Val Val Asp Lys Val Phe Gln Phe Ala Gln 325 330 335 Thr Pro Asp Ala Leu Ala Tyr Val Glu Thr Gly Arg Ala Arg Gly Lys 340 345 350 Val Val Val Thr Tyr Ala Ser 355 <210> 17 <211> 1032 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 17 atgaaagcga ttgtcgccca cggggcaaag gatgtgcgca tcgaagaccg gccggaggaa 60 aagccgggtc cgggcgaggt gcggctccgt ctggcgaggg gcgggatctg cggcagtgat 120 ctgcattatt acaatcatgg cggtttcggc gccgtgcggc ttcgtgaacc catggtgctg 180 ggccatgagg tttccgccgt catcgaggaa ctgggcgaag gcgttgaggg gctgaagatc 240 ggcggtctgg tggcggtttc gccgtcgcgc ccatgccgaa cctgccgctt ctgccaggag 300 ggtctgcaca atcagtgcct caacatgcgg ttttatggca gcgccatgcc tttcccgcat 360 attcagggcg cgttccggga aattctggtg gcggacgccc tgcaatgcgt gccggccgat 420 ggtctcagcg ccggggaagc cgccatggcg gaaccgctgg cggtgacgct gcatgccaca 480 cgccgggccg gcgatttgct gggaaaacgt gtgctcgtca cgggttgcgg ccccatcggc 540 attctctcca ttctggctgc gcgccgggcg ggtgctgctg aaatcgtcgc caccgacctt 600 tccgatttca cgctcggcaa ggcgcgtgaa gcgggggcgg accgtgtcat caacagcaag 660 gatgagcccg atgcgctcgc cgcttatggt gcaaacaagg gaaccttcga cattctctat 720 gaatgctcgg gtgcggccgt ggcgcttgcc ggcggcatta cggcactgcg gccgcgcggc 780 atcatcgtcc agctcgggct cggcggcgat atgagcctgc cgatgatggc gatcacagcc 840 aaggaactcg acctgcgtgg ttcctttcgc ttccacgagg aattcgccac cggcgtcgag 900 ctgatgcgca agggcctgat cgacgtcaaa cccttcatca cccagaccgt cgatcttgcc 960 gacgccatct cggccttcga attcgcctcg gatcgcagcc gcgccatgaa ggtgcagatc 1020 gccttttcct aa 1032 <210> 18 <211> 343 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 18 Met Lys Ala Ile Val Ala His Gly Ala Lys Asp Val Arg Ile Glu Asp 1 5 10 15 Arg Pro Glu Glu Lys Pro Gly Pro Gly Glu Val Arg Leu Arg Leu Ala 20 25 30 Arg Gly Gly Ile Cys Gly Ser Asp Leu His Tyr Tyr Asn His Gly Gly 35 40 45 Phe Gly Ala Val Arg Leu Arg Glu Pro Met Val Leu Gly His Glu Val 50 55 60 Ser Ala Val Ile Glu Glu Leu Gly Glu Gly Val Glu Gly Leu Lys Ile 65 70 75 80 Gly Gly Leu Val Ala Val Ser Pro Ser Arg Pro Cys Arg Thr Cys Arg 85 90 95 Phe Cys Gln Glu Gly Leu His Asn Gln Cys Leu Asn Met Arg Phe Tyr 100 105 110 Gly Ser Ala Met Pro Phe Pro His Ile Gln Gly Ala Phe Arg Glu Ile 115 120 125 Leu Val Ala Asp Ala Leu Gln Cys Val Pro Ala Asp Gly Leu Ser Ala 130 135 140 Gly Glu Ala Ala Met Ala Glu Pro Leu Ala Val Thr Leu His Ala Thr 145 150 155 160 Arg Arg Ala Gly Asp Leu Leu Gly Lys Arg Val Leu Val Thr Gly Cys 165 170 175 Gly Pro Ile Gly Ile Leu Ser Ile Leu Ala Ala Arg Arg Ala Gly Ala 180 185 190 Ala Glu Ile Val Ala Thr Asp Leu Ser Asp Phe Thr Leu Gly Lys Ala 195 200 205 Arg Glu Ala Gly Ala Asp Arg Val Ile Asn Ser Lys Asp Glu Pro Asp 210 215 220 Ala Leu Ala Ala Tyr Gly Ala Asn Lys Gly Thr Phe Asp Ile Leu Tyr 225 230 235 240 Glu Cys Ser Gly Ala Ala Val Ala Leu Ala Gly Gly Ile Thr Ala Leu 245 250 255 Arg Pro Arg Gly Ile Ile Val Gln Leu Gly Leu Gly Gly Asp Met Ser 260 265 270 Leu Pro Met Met Ala Ile Thr Ala Lys Glu Leu Asp Leu Arg Gly Ser 275 280 285 Phe Arg Phe His Glu Glu Phe Ala Thr Gly Val Glu Leu Met Arg Lys 290 295 300 Gly Leu Ile Asp Val Lys Pro Phe Ile Thr Gln Thr Val Asp Leu Ala 305 310 315 320 Asp Ala Ile Ser Ala Phe Glu Phe Ala Ser Asp Arg Ser Arg Ala Met 325 330 335 Lys Val Gln Ile Ala Phe Ser 340 <210> 19 <211> 939 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 19 atgccgatgg cgctcgggca cgaagcggcg ggcgtcgtcg aggcattggg cgaaggcgtg 60 cgcgatcttg agcccggcga tcatgtggtc atggtcttca tgcccagttg cggacattgc 120 ctgccctgtg cggaaggcag gcccgctctg tgcgagccgg gcgccgccgc caatgcagca 180 ggcaggctgt tgggtggcgc cacccgcctg aactatcatg gcgaggtcgt ccatcatcac 240 cttggtgtgt cggcctttgc cgaatatgcc gtggtgtcgc gcaattcgct ggtcaagatc 300 gaccgcgatc ttccatttgt cgaggcggca ctcttcggct gcgcggttct caccggcgtc 360 ggcgccgtcg tgaatacggc aagggtcagg accggctcga ctgcggtcgt catcggactt 420 ggcggtgtgg gccttgccgc ggttctcgga gcccgggcgg ccggtgccag caagatcgtc 480 gccgtcgacc tttcgcagga aaagcttgca ctcgccagcg aactgggcgc gaccgccatc 540 gtgaacggac gcgatgagga tgccgtcgag caggtccgcg agctcacttc cggcggtgcc 600 gattatgcct tcgagatggc agggtctatt cgcgccctcg aaaacgcctt caggatgacc 660 aaacgtggcg gcaccaccgt taccgccggt ctgccaccgc cgggtgcggc cctgccgctc 720 aacgtcgtgc agctcgtcgg cgaggagcgg acactcaagg gcagctatat cggcacctgt 780 gtgcctctcc gggatattcc gcgcttcatc gccctttatc gcgacggccg gttgccggtg 840 aaccgccttc tgagcggaag gctgaagcta gaagacatca atgaagggtt cgaccgcctg 900 cacgacggaa gcgccgttcg gcaagtcatc gaattctga 939 <210> 20 <211> 312 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 20 Met Pro Met Ala Leu Gly His Glu Ala Ala Gly Val Val Glu Ala Leu 1 5 10 15 Gly Glu Gly Val Arg Asp Leu Glu Pro Gly Asp His Val Val Met Val 20 25 30 Phe Met Pro Ser Cys Gly His Cys Leu Pro Cys Ala Glu Gly Arg Pro 35 40 45 Ala Leu Cys Glu Pro Gly Ala Ala Ala Asn Ala Ala Gly Arg Leu Leu 50 55 60 Gly Gly Ala Thr Arg Leu Asn Tyr His Gly Glu Val Val His His His 65 70 75 80 Leu Gly Val Ser Ala Phe Ala Glu Tyr Ala Val Val Ser Arg Asn Ser 85 90 95 Leu Val Lys Ile Asp Arg Asp Leu Pro Phe Val Glu Ala Ala Leu Phe 100 105 110 Gly Cys Ala Val Leu Thr Gly Val Gly Ala Val Val Asn Thr Ala Arg 115 120 125 Val Arg Thr Gly Ser Thr Ala Val Val Ile Gly Leu Gly Gly Val Gly 130 135 140 Leu Ala Ala Val Leu Gly Ala Arg Ala Ala Gly Ala Ser Lys Ile Val 145 150 155 160 Ala Val Asp Leu Ser Gln Glu Lys Leu Ala Leu Ala Ser Glu Leu Gly 165 170 175 Ala Thr Ala Ile Val Asn Gly Arg Asp Glu Asp Ala Val Glu Gln Val 180 185 190 Arg Glu Leu Thr Ser Gly Gly Ala Asp Tyr Ala Phe Glu Met Ala Gly 195 200 205 Ser Ile Arg Ala Leu Glu Asn Ala Phe Arg Met Thr Lys Arg Gly Gly 210 215 220 Thr Thr Val Thr Ala Gly Leu Pro Pro Pro Gly Ala Ala Leu Pro Leu 225 230 235 240 Asn Val Val Gln Leu Val Gly Glu Glu Arg Thr Leu Lys Gly Ser Tyr 245 250 255 Ile Gly Thr Cys Val Pro Leu Arg Asp Ile Pro Arg Phe Ile Ala Leu 260 265 270 Tyr Arg Asp Gly Arg Leu Pro Val Asn Arg Leu Leu Ser Gly Arg Leu 275 280 285 Lys Leu Glu Asp Ile Asn Glu Gly Phe Asp Arg Leu His Asp Gly Ser 290 295 300 Ala Val Arg Gln Val Ile Glu Phe 305 310 <210> 21 <211> 1119 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 21 atgacccaac ccgccaccgc agccgtactg gaagaaaaaa acggccgttt cattcttcgt 60 gaagtgaagc ttgaggcgcc gcgccccgac gaagtgctga ttcgcatggt tgctacgggt 120 atttgcgcga ccgatgctca tgtcaggcaa cagctcatgc caactccgct gccggcgatc 180 ttgggccatg aaggcgccgg catcgtcgaa cgcgttggat cgaccgtatc gcatctcaag 240 cccggcgatc atgtcgttct ttcctatcac tcctgcggcc actgcaagcc ctgcatgtct 300 tcccatgcgg cctactgcga ccacgtctgg gaaacgaatt tcgcaggcgc caggctcgat 360 ggaacgatcg gcgttgcggc gcctgatggg aacacgctcc atgcgcactt ctttggtcag 420 tcttcattct ccacctatgc gctcgctcat cagcgcaatg ccgtcaaggt cccggacgat 480 gttccgctcg agctcctcgg accgctcggt tgcgggttcc agaccggagc cggctcggtc 540 ttgaacgcgc tcaaagtgcc ggtaggcgcc tctatcgcca ttttcggggt aggggcagtg 600 gggttgtcgg cgatcatggc tgccaaggtc gccgatgccg ccgtcattat cgccattgat 660 gtcaataccg aacggctgaa gctcgcttcc gagctcggcg cgacgcattg cgtcaacccg 720 cgtgaacaag ccgatgttgc ctcggcgatc agggatatcg cgcctcgcgg cgtcgaatac 780 gttctcgaca cgagcggtcg gaaggagaac ctcgacggcg gcatcggcgc tcttgctccg 840 atggggcagt tcggttttgt cgccttcaac gaccattcgg gcgcggttgt cgatgcctcc 900 cggctcacgg tagggcaaag cctcatcggg attatccagg gcgatgccat ttccggcctg 960 atgattccgg aactggtcgg tctctatcga agcggccgtt tcccgttcga caggctgctc 1020 accttctacg acttcgccga catcaatgag gcatttgacg atgtcgcggc aggacgggtg 1080 atcaaggccg tcctgcgctt tcccccgcaa gctgcttaa 1119 <210> 22 <211> 389 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 22 Met Ser Arg Ile Thr Arg Pro Gly Met Arg Asn Gln Pro Leu Glu Glu 1 5 10 15 Lys Met Thr Gln Pro Ala Thr Ala Ala Val Leu Glu Glu Lys Asn Gly 20 25 30 Arg Phe Ile Leu Arg Glu Val Lys Leu Glu Ala Pro Arg Pro Asp Glu 35 40 45 Val Leu Ile Arg Met Val Ala Thr Gly Ile Cys Ala Thr Asp Ala His 50 55 60 Val Arg Gln Gln Leu Met Pro Thr Pro Leu Pro Ala Ile Leu Gly His 65 70 75 80 Glu Gly Ala Gly Ile Val Glu Arg Val Gly Ser Thr Val Ser His Leu 85 90 95 Lys Pro Gly Asp His Val Val Leu Ser Tyr His Ser Cys Gly His Cys 100 105 110 Lys Pro Cys Met Ser Ser His Ala Ala Tyr Cys Asp His Val Trp Glu 115 120 125 Thr Asn Phe Ala Gly Ala Arg Leu Asp Gly Thr Ile Gly Val Ala Ala 130 135 140 Pro Asp Gly Asn Thr Leu His Ala His Phe Phe Gly Gln Ser Ser Phe 145 150 155 160 Ser Thr Tyr Ala Leu Ala His Gln Arg Asn Ala Val Lys Val Pro Asp 165 170 175 Asp Val Pro Leu Glu Leu Leu Gly Pro Leu Gly Cys Gly Phe Gln Thr 180 185 190 Gly Ala Gly Ser Val Leu Asn Ala Leu Lys Val Pro Val Gly Ala Ser 195 200 205 Ile Ala Ile Phe Gly Val Gly Ala Val Gly Leu Ser Ala Ile Met Ala 210 215 220 Ala Lys Val Ala Asp Ala Ala Val Ile Ile Ala Ile Asp Val Asn Thr 225 230 235 240 Glu Arg Leu Lys Leu Ala Ser Glu Leu Gly Ala Thr His Cys Val Asn 245 250 255 Pro Arg Glu Gln Ala Asp Val Ala Ser Ala Ile Arg Asp Ile Ala Pro 260 265 270 Arg Gly Val Glu Tyr Val Leu Asp Thr Ser Gly Arg Lys Glu Asn Leu 275 280 285 Asp Gly Gly Ile Gly Ala Leu Ala Pro Met Gly Gln Phe Gly Phe Val 290 295 300 Ala Phe Asn Asp His Ser Gly Ala Val Val Asp Ala Ser Arg Leu Thr 305 310 315 320 Val Gly Gln Ser Leu Ile Gly Ile Ile Gln Gly Asp Ala Ile Ser Gly 325 330 335 Leu Met Ile Pro Glu Leu Val Gly Leu Tyr Arg Ser Gly Arg Phe Pro 340 345 350 Phe Asp Arg Leu Leu Thr Phe Tyr Asp Phe Ala Asp Ile Asn Glu Ala 355 360 365 Phe Asp Asp Val Ala Ala Gly Arg Val Ile Lys Ala Val Leu Arg Phe 370 375 380 Pro Pro Gln Ala Ala 385 <210> 23 <211> 1044 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 23 atgcgcggag tcgtcattca tgcagcaaaa gacctgcggg tagaggacgt tgctggccag 60 ccacttgccg cggacgaggt gcgggtggcc gttgccgtcg gcggaatttg cggctcggat 120 ctgcattatt ataaccatgg cggcttcggc acggtgcgcg tgcgcgagcc gatggcgctc 180 ggtcatgagt ttgccggtac ggtggttgag gtgggcagtt cggtctcgca tctcgtgccc 240 ggcatgcgcg tggccgtcaa tccgagcctg ccttgcggca cctgccgcta ttgcgctcag 300 ggcaggcaga atcagtgcct ggacatgcgc ttcatgggca gcgccatgcg ctccccccat 360 gttcagggcg gtttccgtga agtcgtgacc gtccattcaa cgcaaccggt acagatcgcc 420 gacggacttt ccatgggtga ggcagccatg gccgagcctt tggccgtgtg cctccatgcc 480 gcgcgtcagg cgggatcgct tctgggcaag acggtgctga taaccggtgc cgggccgatc 540 ggcatgctta gcctgctggt tgcccgtctt gccggcgcgg cgcatatcgt cgttaccgat 600 gtcgccgatg caccgctcga tctggcgcga cgtatcggcg cggatgaagc cgtcaacatc 660 ctgcgcgatg ccgacatgct tgaaaaatac cgatttgaaa aaggcgtctt cgacgtcctg 720 ttcgaagcct ccggcaatca ggcggcactt ctcccggcgc tggatctgct ccggccgggc 780 ggtattatcg tccagctcgg tcttggcgga gacttcacca ttccgatgaa cctcatcgtt 840 gccaaagagc tgcagctgcg cggaacgttc cgcttccacg aggaatttgc ccaggcggtg 900 aatatgatgg gacgtggcct gatcgacgtt aagcctttga tcagcgccac attgccgttc 960 gatcaggccc gcgaggcttt cgatcttgcc ggtgaccgcg caaaaagcat gaaagtgcag 1020 cttgccttca gcggagcagc ctga 1044 <210> 24 <211> 371 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 24 Met Glu Cys Cys Arg Phe Ser Arg Thr Ala Ala Ile Leu Asp Ala Asn 1 5 10 15 Arg Asn Trp Arg Glu Glu Thr Arg Met Arg Gly Val Val Ile His Ala 20 25 30 Ala Lys Asp Leu Arg Val Glu Asp Val Ala Gly Gln Pro Leu Ala Ala 35 40 45 Asp Glu Val Arg Val Ala Val Ala Val Gly Gly Ile Cys Gly Ser Asp 50 55 60 Leu His Tyr Tyr Asn His Gly Gly Phe Gly Thr Val Arg Val Arg Glu 65 70 75 80 Pro Met Ala Leu Gly His Glu Phe Ala Gly Thr Val Val Glu Val Gly 85 90 95 Ser Ser Val Ser His Leu Val Pro Gly Met Arg Val Ala Val Asn Pro 100 105 110 Ser Leu Pro Cys Gly Thr Cys Arg Tyr Cys Ala Gln Gly Arg Gln Asn 115 120 125 Gln Cys Leu Asp Met Arg Phe Met Gly Ser Ala Met Arg Ser Pro His 130 135 140 Val Gln Gly Gly Phe Arg Glu Val Val Thr Val His Ser Thr Gln Pro 145 150 155 160 Val Gln Ile Ala Asp Gly Leu Ser Met Gly Glu Ala Ala Met Ala Glu 165 170 175 Pro Leu Ala Val Cys Leu His Ala Ala Arg Gln Ala Gly Ser Leu Leu 180 185 190 Gly Lys Thr Val Leu Ile Thr Gly Ala Gly Pro Ile Gly Met Leu Ser 195 200 205 Leu Leu Val Ala Arg Leu Ala Gly Ala Ala His Ile Val Val Thr Asp 210 215 220 Val Ala Asp Ala Pro Leu Asp Leu Ala Arg Arg Ile Gly Ala Asp Glu 225 230 235 240 Ala Val Asn Ile Leu Arg Asp Ala Asp Met Leu Glu Lys Tyr Arg Phe 245 250 255 Glu Lys Gly Val Phe Asp Val Leu Phe Glu Ala Ser Gly Asn Gln Ala 260 265 270 Ala Leu Leu Pro Ala Leu Asp Leu Leu Arg Pro Gly Gly Ile Ile Val 275 280 285 Gln Leu Gly Leu Gly Gly Asp Phe Thr Ile Pro Met Asn Leu Ile Val 290 295 300 Ala Lys Glu Leu Gln Leu Arg Gly Thr Phe Arg Phe His Glu Glu Phe 305 310 315 320 Ala Gln Ala Val Asn Met Met Gly Arg Gly Leu Ile Asp Val Lys Pro 325 330 335 Leu Ile Ser Ala Thr Leu Pro Phe Asp Gln Ala Arg Glu Ala Phe Asp 340 345 350 Leu Ala Gly Asp Arg Ala Lys Ser Met Lys Val Gln Leu Ala Phe Ser 355 360 365 Gly Ala Ala 370 <210> 25 <211> 960 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 25 atgaaggcag ccgtttacga tcaagcagga cctccggatg ttttgacgta cagggacgtc 60 gccgacccga ttgtaggtcc ggatgatgtc ctcatcgcag tggaagccat ttcgattgaa 120 ggaggagact tgatcaatcg tcgatccacg ccgcctcctg gccgcccgtg gatagtcggc 180 tatgcagcat ctgggcgcgt cgtgggggcc ggtgcgaacg tgagggaccg caaagtcgga 240 gacagggtta ctgcctttga catgcagggt tcgcacgccg aactctgggc cgtgccagcg 300 atccgaacgt ggcttttgcc atccggcgtg gatgcagcgt cggctgccgc tttgccgata 360 tcgtttggta ctgcccacca ttgtcttttt gccagaggtg gccttctgcg caaccagacg 420 gttcttgtac aggcagcggc gggtggagtt ggcctcgccg cagttcagct cgcggctcaa 480 gccggcgcaa ccgtcatcgc cgtctcaagt ggagaaagcc ggctgcaaag gatatcttcc 540 cttggggctg atcacgttgt cgatcggtcg atggggaacg ttgtcgaggc tgtcagacag 600 aacacgggag gcaaaggagt cgatctcgtg attgatcctg tcggtgtcac cttgtccgct 660 tctctgactc tcctggcacc agaaggacgt cttgtgtttg tgggaaacgc tgggggcgga 720 agcctgacca tcgatctgtg gccagccatg cagtcaaatc agactttgct cggagttttc 780 atgggcccgc tattagagag acctcaggtt cgtgcgacgg tagatgagat gcttcaaatg 840 ctcgatcgtc gcgaaatccg tgtgatgatc gaaaagacgt ttccgctctc ggaagcggca 900 gccgctcatg attttgcaga aaatgcgaaa ccgcttggcc gggtgattat ggagccgtga 960 960 <210> 26 <211> 319 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 26 Met Lys Ala Ala Val Tyr Asp Gln Ala Gly Pro Pro Asp Val Leu Thr 1 5 10 15 Tyr Arg Asp Val Ala Asp Pro Ile Val Gly Pro Asp Asp Val Leu Ile 20 25 30 Ala Val Glu Ala Ile Ser Ile Glu Gly Gly Asp Leu Ile Asn Arg Arg 35 40 45 Ser Thr Pro Pro Pro Gly Arg Pro Trp Ile Val Gly Tyr Ala Ala Ser 50 55 60 Gly Arg Val Val Gly Ala Gly Ala Asn Val Arg Asp Arg Lys Val Gly 65 70 75 80 Asp Arg Val Thr Ala Phe Asp Met Gln Gly Ser His Ala Glu Leu Trp 85 90 95 Ala Val Pro Ala Ile Arg Thr Trp Leu Leu Pro Ser Gly Val Asp Ala 100 105 110 Ala Ser Ala Ala Ala Leu Pro Ile Ser Phe Gly Thr Ala His His Cys 115 120 125 Leu Phe Ala Arg Gly Gly Leu Leu Arg Asn Gln Thr Val Leu Val Gln 130 135 140 Ala Ala Ala Gly Gly Val Gly Leu Ala Ala Val Gln Leu Ala Ala Gln 145 150 155 160 Ala Gly Ala Thr Val Ile Ala Val Ser Ser Gly Glu Ser Arg Leu Gln 165 170 175 Arg Ile Ser Ser Leu Gly Ala Asp His Val Val Asp Arg Ser Met Gly 180 185 190 Asn Val Val Glu Ala Val Arg Gln Asn Thr Gly Gly Lys Gly Val Asp 195 200 205 Leu Val Ile Asp Pro Val Gly Val Thr Leu Ser Ala Ser Leu Thr Leu 210 215 220 Leu Ala Pro Glu Gly Arg Leu Val Phe Val Gly Asn Ala Gly Gly Gly 225 230 235 240 Ser Leu Thr Ile Asp Leu Trp Pro Ala Met Gln Ser Asn Gln Thr Leu 245 250 255 Leu Gly Val Phe Met Gly Pro Leu Leu Glu Arg Pro Gln Val Arg Ala 260 265 270 Thr Val Asp Glu Met Leu Gln Met Leu Asp Arg Arg Glu Ile Arg Val 275 280 285 Met Ile Glu Lys Thr Phe Pro Leu Ser Glu Ala Ala Ala Ala His Asp 290 295 300 Phe Ala Glu Asn Ala Lys Pro Leu Gly Arg Val Ile Met Glu Pro 305 310 315 <210> 27 <211> 1128 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 27 atggacgttc gcgccgccgt tgccattcag gcaggaaaac cgctcgaggt catgaccgtt 60 cagcttgaag gtccccgcgc cggtgaagtg ctgatcgaag tcaaggcgac cggcatctgc 120 cacaccgacg atttcaccct ctctggcgct gacccggaag gcctgttccc ggcaatcctc 180 ggccatgaag gtgcgggcat cgtcgtggat gtcggccccg gcgtcacctc ggtcaagaag 240 ggcgaccacg tcattccgct ctacacgccg gaatgccgcg aatgctactc ctgcacctcg 300 cgcaagacca atctctgcac ctccatccgc gccacccagg gccagggcgt gatgcctgac 360 ggcacctcgc gcttctcgat cggcaaggac aagattcacc actatatggg ttgctcgacc 420 ttctcgaatt tcaccgtcct gccggaaatc gcgctggcca agatcaaccc ggacgcgccc 480 ttcgacaagg tctgctacat cggctgcggc gtcacgaccg gtatcggcgc cgtcatcaac 540 accgccaagg tcgagattgg ctccacggcg atcgtcttcg gtctcggcgg catcggtctc 600 aacgtgctgc agggcctgcg tcttgccggt gcggacatga tcatcggcgt cgatatcaac 660 aacgaccgca aggcctgggg cgaaaaattc ggcatgaccc acttcgtcaa tccgaaggaa 720 gtcggcgacg acatcgtgcc ctatctcgtc aacatgacga agcgtaatgg cgacctcatc 780 ggcggcgcag actatacgtt cgactgcacc ggcaatacca aggtcatgcg ccaggcgctg 840 gaagcctcgc atcgcggttg gggcaagtcg gtcatcatcg gcgtcgccgg cgccggccag 900 gaaatctcca cccgtccgtt ccagctggtc accggccgta actggatggg caccgccttc 960 ggcggcgcgc gcggccgcac cgatgtgccg aagattgtcg actggtacat ggaaggcaag 1020 atccagatcg acccgatgat cacccacacc atgccgctcg aagacatcaa caagggcttc 1080 gagctgatgc acaagggtga atcgatccgc ggcgtcgttg tttattga 1128 <210> 28 <211> 375 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 28 Met Asp Val Arg Ala Ala Val Ala Ile Gln Ala Gly Lys Pro Leu Glu 1 5 10 15 Val Met Thr Val Gln Leu Glu Gly Pro Arg Ala Gly Glu Val Leu Ile 20 25 30 Glu Val Lys Ala Thr Gly Ile Cys His Thr Asp Asp Phe Thr Leu Ser 35 40 45 Gly Ala Asp Pro Glu Gly Leu Phe Pro Ala Ile Leu Gly His Glu Gly 50 55 60 Ala Gly Ile Val Val Asp Val Gly Pro Gly Val Thr Ser Val Lys Lys 65 70 75 80 Gly Asp His Val Ile Pro Leu Tyr Thr Pro Glu Cys Arg Glu Cys Tyr 85 90 95 Ser Cys Thr Ser Arg Lys Thr Asn Leu Cys Thr Ser Ile Arg Ala Thr 100 105 110 Gln Gly Gln Gly Val Met Pro Asp Gly Thr Ser Arg Phe Ser Ile Gly 115 120 125 Lys Asp Lys Ile His His Tyr Met Gly Cys Ser Thr Phe Ser Asn Phe 130 135 140 Thr Val Leu Pro Glu Ile Ala Leu Ala Lys Ile Asn Pro Asp Ala Pro 145 150 155 160 Phe Asp Lys Val Cys Tyr Ile Gly Cys Gly Val Thr Thr Gly Ile Gly 165 170 175 Ala Val Ile Asn Thr Ala Lys Val Glu Ile Gly Ser Thr Ala Ile Val 180 185 190 Phe Gly Leu Gly Gly Ile Gly Leu Asn Val Leu Gln Gly Leu Arg Leu 195 200 205 Ala Gly Ala Asp Met Ile Ile Gly Val Asp Ile Asn Asn Asp Arg Lys 210 215 220 Ala Trp Gly Glu Lys Phe Gly Met Thr His Phe Val Asn Pro Lys Glu 225 230 235 240 Val Gly Asp Asp Ile Val Pro Tyr Leu Val Asn Met Thr Lys Arg Asn 245 250 255 Gly Asp Leu Ile Gly Gly Ala Asp Tyr Thr Phe Asp Cys Thr Gly Asn 260 265 270 Thr Lys Val Met Arg Gln Ala Leu Glu Ala Ser His Arg Gly Trp Gly 275 280 285 Lys Ser Val Ile Ile Gly Val Ala Gly Ala Gly Gln Glu Ile Ser Thr 290 295 300 Arg Pro Phe Gln Leu Val Thr Gly Arg Asn Trp Met Gly Thr Ala Phe 305 310 315 320 Gly Gly Ala Arg Gly Arg Thr Asp Val Pro Lys Ile Val Asp Trp Tyr 325 330 335 Met Glu Gly Lys Ile Gln Ile Asp Pro Met Ile Thr His Thr Met Pro 340 345 350 Leu Glu Asp Ile Asn Lys Gly Phe Glu Leu Met His Lys Gly Glu Ser 355 360 365 Ile Arg Gly Val Val Val Tyr 370 375 <210> 29 <211> 987 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 29 atgaaagcga tgtcactcaa atcctttggc ggcccagaag cctttgatct tgtcgaagtt 60 ccaaagcctc ttccgaaggc ggggcaggtt ttggtacggg tccatgccac atcgatcaat 120 cccctcgact accaagttcg gcgaggcgat tatcgcgacc tggtgccgtt gccggcaatt 180 accggccatg acgtatcggg cgttgtcgaa gctaccggtc cgggggtaac aatgttcgct 240 ccaggagacg aggtctggta cacgccacag atcttcgacg ggccaggcag ttatgccgaa 300 taccacgttg cgaacgaaaa tatcatcgga cgcaaaccca gctcgctgac ccatcttgag 360 gctgcgagcc ttagcctggt tggaggaacc gcctgggaag cgcttgtctc gcgtgctgcc 420 ctgagggttg gtgaaagcat attgatccat ggcggcgctg gaggggtagg gcacgtcgct 480 atccaagttg cgaaagccat cggagcaaag gtctacacga ccgtccgtga agaaaacttc 540 gagtttgcgc gaagtgtcgg agctgacgtc gtcattgatt acagaaaaga ggattatgtc 600 gccgccatca tgcgggagac tgaaggcctc ggagtagacg tcgtgttcga cactctcggc 660 ggcgaaacat tgtcccacag cccgaaggtg cttgcacaat tcggtcgtgt cgtctcgatc 720 gtggacatcg cccggccgca aaatctcatt gaggcatggg gcaggaacgc gagttaccac 780 ttcgtcttca caaggcagaa ccaaggcaag ctcaacgagc tgaacgtttt ggtggaacgt 840 ggtcagctga ggccgcacgt gggcgccgtc tattcgctcg ccgaccttcc gcttgcccat 900 gcgctgctcg agaaaccaaa caacggtttg cgcggtaaga tcgcgattgc cattgacccg 960 caggctgaga caaaggtgca atcatga 987 <210> 30 <211> 358 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 30 Met Arg Pro Ala Met Leu Gln Arg Arg Ser Met Phe Leu Val Arg Arg 1 5 10 15 Arg Arg Pro Glu Ser Leu Pro Ser Ile Glu Gln Glu Pro Glu Met Lys 20 25 30 Ala Met Ser Leu Lys Ser Phe Gly Gly Pro Glu Ala Phe Asp Leu Val 35 40 45 Glu Val Pro Lys Pro Leu Pro Lys Ala Gly Gln Val Leu Val Arg Val 50 55 60 His Ala Thr Ser Ile Asn Pro Leu Asp Tyr Gln Val Arg Arg Gly Asp 65 70 75 80 Tyr Arg Asp Leu Val Pro Leu Pro Ala Ile Thr Gly His Asp Val Ser 85 90 95 Gly Val Val Glu Ala Thr Gly Pro Gly Val Thr Met Phe Ala Pro Gly 100 105 110 Asp Glu Val Trp Tyr Thr Pro Gln Ile Phe Asp Gly Pro Gly Ser Tyr 115 120 125 Ala Glu Tyr His Val Ala Asn Glu Asn Ile Ile Gly Arg Lys Pro Ser 130 135 140 Ser Leu Thr His Leu Glu Ala Ala Ser Leu Ser Leu Val Gly Gly Thr 145 150 155 160 Ala Trp Glu Ala Leu Val Ser Arg Ala Ala Leu Arg Val Gly Glu Ser 165 170 175 Ile Leu Ile His Gly Gly Ala Gly Gly Val Gly His Val Ala Ile Gln 180 185 190 Val Ala Lys Ala Ile Gly Ala Lys Val Tyr Thr Thr Val Arg Glu Glu 195 200 205 Asn Phe Glu Phe Ala Arg Ser Val Gly Ala Asp Val Val Ile Asp Tyr 210 215 220 Arg Lys Glu Asp Tyr Val Ala Ala Ile Met Arg Glu Thr Glu Gly Leu 225 230 235 240 Gly Val Asp Val Val Phe Asp Thr Leu Gly Gly Glu Thr Leu Ser His 245 250 255 Ser Pro Lys Val Leu Ala Gln Phe Gly Arg Val Val Ser Ile Val Asp 260 265 270 Ile Ala Arg Pro Gln Asn Leu Ile Glu Ala Trp Gly Arg Asn Ala Ser 275 280 285 Tyr His Phe Val Phe Thr Arg Gln Asn Gln Gly Lys Leu Asn Glu Leu 290 295 300 Asn Val Leu Val Glu Arg Gly Gln Leu Arg Pro His Val Gly Ala Val 305 310 315 320 Tyr Ser Leu Ala Asp Leu Pro Leu Ala His Ala Leu Leu Glu Lys Pro 325 330 335 Asn Asn Gly Leu Arg Gly Lys Ile Ala Ile Ala Ile Asp Pro Gln Ala 340 345 350 Glu Thr Lys Val Gln Ser 355 <210> 31 <211> 1197 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 31 atggatatga gcaggaacag aggcgtcgtt tacctgaaac caggccaggt cgaagtccgc 60 gacatcgacg acccgaagct tgaggcgccg gatggccgcc gcatcgagca cggcgtcatt 120 ctcaaggtga tttccacgaa tatctgcggc tccgaccagc acatggtgcg cggccgcacc 180 accgcgatgc cgggcctcgt ccttggccat gaaatcaccg gcgaagtcat cgaaaaaggc 240 atcgacgtcg aaatgctgca ggtcggcgac atcgtctccg tgccgttcaa cgtcgcctgc 300 ggccgttgcc gctgctgcaa gtcgcaggat accggcgtct gcctgacggt gaacccgtca 360 cgcgccggcg gcgcttacgg ttatgtcgat atgggcggct ggatcggcgg acaggcccgt 420 tatgtcacga tcccttatgc cgatttcaac cttctgaaat tccccgatcg cgacaaggcg 480 atgtcgaaga tccgcgacct taccatgcta tcagacattc tgccgaccgg cttccatggc 540 gcggtcaagg caggcgtcgg cgtcggctcc acggtttatg tcgccggcgc cggcccggtc 600 ggtcttgccg ccgccgcctc cgcccgcatt ctgggtgcgg ccgttgtcat ggtcggcgat 660 ttcaacaagg atcgtctcgc ccatgcggca agagtcggtt ttgaacccgt cgatctttcc 720 aagggcgacc ggctgggcga catgatcgct gagatcgtcg gcaccaatga ggtggacagc 780 gccatcgacg ccgtcggctt cgaagcccgc ggccattccg gcggcgaaca gccggccatc 840 gttcttaacc agatgatgga gattacccgc gccgccggct ccatcggcat tcccggtctc 900 tacgtcaccg aagaccccgg cgcggttgac aatgcggcaa agcagggcgc cctgtcgctg 960 cgcttcggcc ttggctgggc gaaggcgcaa tccttccaca ccggccagac accggtgctg 1020 aaatataatc gtcagctgat gcaggccatc ctgcacgacc gcctgccgat tgccgatatc 1080 gtcaacgcca agatcatcgc ccttgatgat gccgtgcagg gatatgaaag ctttgatcag 1140 ggcgcggcca ccaagttcgt gcttgatccg catggcgatc tgctgaaggc agcctga 1197 <210> 32 <211> 420 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 32 Met His Phe Asp Lys Ile Met Pro Ala Glu Glu Arg Ala Gly Ile Asp 1 5 10 15 Val Gln Thr Thr Glu Glu Met Asp Met Ser Arg Asn Arg Gly Val Val 20 25 30 Tyr Leu Lys Pro Gly Gln Val Glu Val Arg Asp Ile Asp Asp Pro Lys 35 40 45 Leu Glu Ala Pro Asp Gly Arg Arg Ile Glu His Gly Val Ile Leu Lys 50 55 60 Val Ile Ser Thr Asn Ile Cys Gly Ser Asp Gln His Met Val Arg Gly 65 70 75 80 Arg Thr Thr Ala Met Pro Gly Leu Val Leu Gly His Glu Ile Thr Gly 85 90 95 Glu Val Ile Glu Lys Gly Ile Asp Val Glu Met Leu Gln Val Gly Asp 100 105 110 Ile Val Ser Val Pro Phe Asn Val Ala Cys Gly Arg Cys Arg Cys Cys 115 120 125 Lys Ser Gln Asp Thr Gly Val Cys Leu Thr Val Asn Pro Ser Arg Ala 130 135 140 Gly Gly Ala Tyr Gly Tyr Val Asp Met Gly Gly Trp Ile Gly Gly Gln 145 150 155 160 Ala Arg Tyr Val Thr Ile Pro Tyr Ala Asp Phe Asn Leu Leu Lys Phe 165 170 175 Pro Asp Arg Asp Lys Ala Met Ser Lys Ile Arg Asp Leu Thr Met Leu 180 185 190 Ser Asp Ile Leu Pro Thr Gly Phe His Gly Ala Val Lys Ala Gly Val 195 200 205 Gly Val Gly Ser Thr Val Tyr Val Ala Gly Ala Gly Pro Val Gly Leu 210 215 220 Ala Ala Ala Ala Ser Ala Arg Ile Leu Gly Ala Ala Val Val Met Val 225 230 235 240 Gly Asp Phe Asn Lys Asp Arg Leu Ala His Ala Ala Arg Val Gly Phe 245 250 255 Glu Pro Val Asp Leu Ser Lys Gly Asp Arg Leu Gly Asp Met Ile Ala 260 265 270 Glu Ile Val Gly Thr Asn Glu Val Asp Ser Ala Ile Asp Ala Val Gly 275 280 285 Phe Glu Ala Arg Gly His Ser Gly Gly Glu Gln Pro Ala Ile Val Leu 290 295 300 Asn Gln Met Met Glu Ile Thr Arg Ala Ala Gly Ser Ile Gly Ile Pro 305 310 315 320 Gly Leu Tyr Val Thr Glu Asp Pro Gly Ala Val Asp Asn Ala Ala Lys 325 330 335 Gln Gly Ala Leu Ser Leu Arg Phe Gly Leu Gly Trp Ala Lys Ala Gln 340 345 350 Ser Phe His Thr Gly Gln Thr Pro Val Leu Lys Tyr Asn Arg Gln Leu 355 360 365 Met Gln Ala Ile Leu His Asp Arg Leu Pro Ile Ala Asp Ile Val Asn 370 375 380 Ala Lys Ile Ile Ala Leu Asp Asp Ala Val Gln Gly Tyr Glu Ser Phe 385 390 395 400 Asp Gln Gly Ala Ala Thr Lys Phe Val Leu Asp Pro His Gly Asp Leu 405 410 415 Leu Lys Ala Ala 420 <210> 33 <211> 1053 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 33 atgaaggcac tggtgctgga agaaaaaggc aaactctcgc tcagggattt tgacattccc 60 ggaggcgccg ggtccggtga actcggaccg aaggatgtgc gcattcgcac ccatacggtc 120 ggcatctgcg gctcggacgt tcattattat acccatggca agatcggcca cttcgtcgtc 180 aacgcaccca tggtgctcgg ccatgaagcc tccggtacgg tgatcgaaac cggttccgac 240 gtcacccatc tgaagatcgg tgaccgcgtc tgcatggagc ctggtatccc cgatcccaca 300 tcgcgggcct cgaaactcgg catctataat gtcgatcccg ctgtccgctt ctgggcaaca 360 ccgccgatcc atggctgcct gacgcctgag gtcatccacc ccgcggcctt cacctacaag 420 ctgccggata acgtctcctt tgccgaaggg gcgatggtcg aacccttcgc catcggcatg 480 caggcggcac tgcgggcgcg catccagccc ggcgatatcg ccgtcgtcac cggtgccggt 540 cctatcggca tgatggtggc gcttgccgca ttggcgggcg gttgcgccaa ggtcatcgtt 600 gccgatctcg ctcagccgaa gcttgatatc atcgccgctt atgacggcat cgagaccatc 660 aatatccgcg agcgcaacct tgccgaagcg gtttcggccg ccacggatgg ctggggttgc 720 gatatcgtct tcgaatgctc aggtgcggca cccgccatac tcggcatggc gaaactggcg 780 cgaccgggcg gtgccatcgt gctcgttggc atgccggttg acccggttcc ggtcgatatc 840 gtcggccttc aggccaaaga gctgcgggtg gaaacggtat tccgttacgc caacgtctat 900 gaccgcgcgg tggccctcat cgcctccggc aaggttgatc tcaagccatt gatttcggcc 960 accattccct tcgaagacag tatcgccggt ttcgaccgtg cggtggaagc gcgggaaacg 1020 gatgtgaagt tgcagatcgt catgccgcaa taa 1053 <210> 34 <211> 350 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 34 Met Lys Ala Leu Val Leu Glu Glu Lys Gly Lys Leu Ser Leu Arg Asp 1 5 10 15 Phe Asp Ile Pro Gly Gly Ala Gly Ser Gly Glu Leu Gly Pro Lys Asp 20 25 30 Val Arg Ile Arg Thr His Thr Val Gly Ile Cys Gly Ser Asp Val His 35 40 45 Tyr Tyr Thr His Gly Lys Ile Gly His Phe Val Val Asn Ala Pro Met 50 55 60 Val Leu Gly His Glu Ala Ser Gly Thr Val Ile Glu Thr Gly Ser Asp 65 70 75 80 Val Thr His Leu Lys Ile Gly Asp Arg Val Cys Met Glu Pro Gly Ile 85 90 95 Pro Asp Pro Thr Ser Arg Ala Ser Lys Leu Gly Ile Tyr Asn Val Asp 100 105 110 Pro Ala Val Arg Phe Trp Ala Thr Pro Pro Ile His Gly Cys Leu Thr 115 120 125 Pro Glu Val Ile His Pro Ala Ala Phe Thr Tyr Lys Leu Pro Asp Asn 130 135 140 Val Ser Phe Ala Glu Gly Ala Met Val Glu Pro Phe Ala Ile Gly Met 145 150 155 160 Gln Ala Ala Leu Arg Ala Arg Ile Gln Pro Gly Asp Ile Ala Val Val 165 170 175 Thr Gly Ala Gly Pro Ile Gly Met Met Val Ala Leu Ala Ala Leu Ala 180 185 190 Gly Gly Cys Ala Lys Val Ile Val Ala Asp Leu Ala Gln Pro Lys Leu 195 200 205 Asp Ile Ile Ala Ala Tyr Asp Gly Ile Glu Thr Ile Asn Ile Arg Glu 210 215 220 Arg Asn Leu Ala Glu Ala Val Ser Ala Ala Thr Asp Gly Trp Gly Cys 225 230 235 240 Asp Ile Val Phe Glu Cys Ser Gly Ala Ala Pro Ala Ile Leu Gly Met 245 250 255 Ala Lys Leu Ala Arg Pro Gly Gly Ala Ile Val Leu Val Gly Met Pro 260 265 270 Val Asp Pro Val Pro Val Asp Ile Val Gly Leu Gln Ala Lys Glu Leu 275 280 285 Arg Val Glu Thr Val Phe Arg Tyr Ala Asn Val Tyr Asp Arg Ala Val 290 295 300 Ala Leu Ile Ala Ser Gly Lys Val Asp Leu Lys Pro Leu Ile Ser Ala 305 310 315 320 Thr Ile Pro Phe Glu Asp Ser Ile Ala Gly Phe Asp Arg Ala Val Glu 325 330 335 Ala Arg Glu Thr Asp Val Lys Leu Gln Ile Val Met Pro Gln 340 345 350 <210> 35 <211> 987 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 35 atgtcaaaac ggatcgtttt tcacggcgaa aatgccgcct gtttcagcga tgacttcaaa 60 aacctggtgg agggcggcgc ggaaatcgct ctgctgccgg atcaactcgt caccgaggaa 120 gaccgcaacg cctatcgcaa agccgatatc atcgttggcg tcaaatttga tgcatcgttg 180 ccgacgcctg aaagactgac gctgtttcat gtgcccggcg ccggttatga cgccgtcaat 240 ctcgacctgc tgccgaaaag cgcggtcgtg tgcaactgct ttggccatga tcccgcaatt 300 gccgaatatg tgttttcagc cattctcaac cgtcatgttc cgttgcgcga tgccgacaac 360 aaattgcgcg ccggccagtg ggcctactgg tccggttcga ccgagcgcct gcacgacgaa 420 atgtccggaa aaaccatcgg tcttctcggc ttcggccata tcgggaaggc cattgcggtc 480 cgcgcgaagg cgttcggaat gcaggtcagc gtcgccaatc gcagccgcgt ggaaacgtcg 540 gatctggtag accgctcctt cacactggat cagctcaacg aattctggcc gaccgcagat 600 ttcatcgtcg tctccgtacc actaacggac acgacacgcg ggatcgtcga tgcggaggct 660 ttcgcagcga tgaaatccgg tgccgtcatc atcaatgtcg ggcgcggccc gaccatagac 720 gagcaggcgc tttatgacgc gctgaaaagc ggaaccatcg gcggtgcggt catcgatacc 780 tggtacgcct atccgtcacc cgacgcgccg acgagacaac cgtccgcact gccattcaat 840 caactcgaga acatcatcat gacgccgcac atgtccggct ggaccagtgg aacggtgcgg 900 cggcggcagc agacgatcgc ggaaaacatc aatcggcggc tgaaggggca agactgcatc 960 aacatcgtcc gcaccgcgtc tgaatag 987 <210> 36 <211> 328 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 36 Met Ser Lys Arg Ile Val Phe His Gly Glu Asn Ala Ala Cys Phe Ser 1 5 10 15 Asp Asp Phe Lys Asn Leu Val Glu Gly Gly Ala Glu Ile Ala Leu Leu 20 25 30 Pro Asp Gln Leu Val Thr Glu Glu Asp Arg Asn Ala Tyr Arg Lys Ala 35 40 45 Asp Ile Ile Val Gly Val Lys Phe Asp Ala Ser Leu Pro Thr Pro Glu 50 55 60 Arg Leu Thr Leu Phe His Val Pro Gly Ala Gly Tyr Asp Ala Val Asn 65 70 75 80 Leu Asp Leu Leu Pro Lys Ser Ala Val Val Cys Asn Cys Phe Gly His 85 90 95 Asp Pro Ala Ile Ala Glu Tyr Val Phe Ser Ala Ile Leu Asn Arg His 100 105 110 Val Pro Leu Arg Asp Ala Asp Asn Lys Leu Arg Ala Gly Gln Trp Ala 115 120 125 Tyr Trp Ser Gly Ser Thr Glu Arg Leu His Asp Glu Met Ser Gly Lys 130 135 140 Thr Ile Gly Leu Leu Gly Phe Gly His Ile Gly Lys Ala Ile Ala Val 145 150 155 160 Arg Ala Lys Ala Phe Gly Met Gln Val Ser Val Ala Asn Arg Ser Arg 165 170 175 Val Glu Thr Ser Asp Leu Val Asp Arg Ser Phe Thr Leu Asp Gln Leu 180 185 190 Asn Glu Phe Trp Pro Thr Ala Asp Phe Ile Val Val Ser Val Pro Leu 195 200 205 Thr Asp Thr Thr Arg Gly Ile Val Asp Ala Glu Ala Phe Ala Ala Met 210 215 220 Lys Ser Gly Ala Val Ile Ile Asn Val Gly Arg Gly Pro Thr Ile Asp 225 230 235 240 Glu Gln Ala Leu Tyr Asp Ala Leu Lys Ser Gly Thr Ile Gly Gly Ala 245 250 255 Val Ile Asp Thr Trp Tyr Ala Tyr Pro Ser Pro Asp Ala Pro Thr Arg 260 265 270 Gln Pro Ser Ala Leu Pro Phe Asn Gln Leu Glu Asn Ile Ile Met Thr 275 280 285 Pro His Met Ser Gly Trp Thr Ser Gly Thr Val Arg Arg Arg Gln Gln 290 295 300 Thr Ile Ala Glu Asn Ile Asn Arg Arg Leu Lys Gly Gln Asp Cys Ile 305 310 315 320 Asn Ile Val Arg Thr Ala Ser Glu 325 <210> 37 <211> 984 <212> DNA <213> Agrobacterium tumefaciens str. C58 <400> 37 atgcgcttca tcgatcttcc gtcccatggt ggcccggaag tgatgcagtc ttcaaaagca 60 cctttgccga aacccgcccg cggggagatt ctcgttaagg tcgaggcggc gggggttaac 120 cgtccagacg tcgcgcagag acagggcatc tatccgccac ccaaaggtgc aagccccatc 180 ctcgggctgg aaatcgccgg cgaggtcgtt gcactcggag agggcgtcga tgagttcaag 240 ctcggcgaca aggtctgtgc gctcgccaat ggcggcggtt acgcggaata ttgcgccgtt 300 cccgccgggc aggccctgcc cttccccaaa ggttacgacg ccgtcaaagc tgccgcactg 360 ccggaaacct tcttcaccgt ctgggccaat ctcttccaga tggctggcct gacggaaggt 420 gagaccgtgc tcatccacgg cggcaccagc ggcatcggca caacggcgat ccagcttgcg 480 aaagcctttg gcgctgaggt ttatgccacg gcgggctcgg cggaaaaatg cgaggcctgc 540 gtgaagctcg gcactaagcg cgcgatcaac taccgcgagg aggatttcgc cgaaatcgtg 600 aaatccgaaa ccggcggcaa gggcgtcgat gtcgttctcg acatgatcgg tgcggcctat 660 ttcgaaaaga accttgcggc cctcgccaag gatggctgcc tttccatcat cgcctttctg 720 ggtggtgcga cagccgagaa ggtcgacctg cggccgatca tggtcaaacg cctcaccgtc 780 accggctcca ccatgcgccc ccgaacggcc gacgagaagc gcgccatccg cgatgagctt 840 gtcgagcagg tctggccgct catcgaaagc ggcaaggtcg cgcctgtgat caaccgggtg 900 ttcacgctgg aagaggtcgt ggacgcgcac cggttgatgg aaagcagcaa tcatatcggc 960 aagatcgtga tgaaggtgtc gtga 984 <210> 38 <211> 348 <212> PRT <213> Agrobacterium tumefaciens str. C58 <400> 38 Met Thr Pro Thr Ser Glu Glu Leu Pro Leu Pro Met Ser Asp Thr Lys 1 5 10 15 Thr Leu Pro Glu Thr Met Arg Phe Ile Asp Leu Pro Ser His Gly Gly 20 25 30 Pro Glu Val Met Gln Ser Ser Lys Ala Pro Leu Pro Lys Pro Ala Arg 35 40 45 Gly Glu Ile Leu Val Lys Val Glu Ala Ala Gly Val Asn Arg Pro Asp 50 55 60 Val Ala Gln Arg Gln Gly Ile Tyr Pro Pro Pro Lys Gly Ala Ser Pro 65 70 75 80 Ile Leu Gly Leu Glu Ile Ala Gly Glu Val Val Ala Leu Gly Glu Gly 85 90 95 Val Asp Glu Phe Lys Leu Gly Asp Lys Val Cys Ala Leu Ala Asn Gly 100 105 110 Gly Gly Tyr Ala Glu Tyr Cys Ala Val Pro Ala Gly Gln Ala Leu Pro 115 120 125 Phe Pro Lys Gly Tyr Asp Ala Val Lys Ala Ala Ala Leu Pro Glu Thr 130 135 140 Phe Phe Thr Val Trp Ala Asn Leu Phe Gln Met Ala Gly Leu Thr Glu 145 150 155 160 Gly Glu Thr Val Leu Ile His Gly Gly Thr Ser Gly Ile Gly Thr Thr 165 170 175 Ala Ile Gln Leu Ala Lys Ala Phe Gly Ala Glu Val Tyr Ala Thr Ala 180 185 190 Gly Ser Ala Glu Lys Cys Glu Ala Cys Val Lys Leu Gly Thr Lys Arg 195 200 205 Ala Ile Asn Tyr Arg Glu Glu Asp Phe Ala Glu Ile Val Lys Ser Glu 210 215 220 Thr Gly Gly Lys Gly Val Asp Val Val Leu Asp Met Ile Gly Ala Ala 225 230 235 240 Tyr Phe Glu Lys Asn Leu Ala Ala Leu Ala Lys Asp Gly Cys Leu Ser 245 250 255 Ile Ile Ala Phe Leu Gly Gly Ala Thr Ala Glu Lys Val Asp Leu Arg 260 265 270 Pro Ile Met Val Lys Arg Leu Thr Val Thr Gly Ser Thr Met Arg Pro 275 280 285 Arg Thr Ala Asp Glu Lys Arg Ala Ile Arg Asp Glu Leu Val Glu Gln 290 295 300 Val Trp Pro Leu Ile Glu Ser Gly Lys Val Ala Pro Val Ile Asn Arg 305 310 315 320 Val Phe Thr Leu Glu Glu Val Val Asp Ala His Arg Leu Met Glu Ser 325 330 335 Ser Asn His Ile Gly Lys Ile Val Met Lys Val Ser 340 345 <210> 39 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 39 gcggcctcgg ccacatggcc gtcaagc 27 <210> 40 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 40 gcttgacggc catgtggccg aggccgc 27 <210> 41 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 41 tggcaatacc ggaccccggc cccggtg 27 <210> 42 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 42 caccggggcc ggggtccggt attgcca 27 <210> 43 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 43 aggcaaccga ggcgtatgag cggctat 27 <210> 44 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 44 atagccgctc atacgcctcg gttgcct 27 <210> 45 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 45 ggaattccat atgcgtccct ctgccccggc c 31 <210> 46 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 46 cgggatcctt agaactgctt gggaagggag 30 <210> 47 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 47 ggaattccat atgttcacaa cgtccgccta 30 <210> 48 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 48 cgggatcctt aggcggcctt ctggcgcg 28 <210> 49 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 49 ggaattccat atggctattg caagaggtta 30 <210> 50 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 50 cgggatcctt aagcgtcgag cgaggcca 28 <210> 51 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 51 ggaattccat atgactaaaa caatgaaggc 30 <210> 52 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 52 cgggatcctt aggcggcgag atccacga 28 <210> 53 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 53 ggaattccat atgaccgggg cgaaccagcc 30 <210> 54 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 54 cgggatcctt aagcgccgtg cggaagga 28 <210> 55 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 55 ggaattccat atgaccatgc atgccattca 30 <210> 56 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 56 cgggatcctt attcggctgc aaattgca 28 <210> 57 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 57 ggaattccat atgcgcgcgc tttattacga 30 <210> 58 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 58 cgggatcctt attcgaaccg gtcgatga 28 <210> 59 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 59 ggaattccat atgctggcga ttttctgtga 30 <210> 60 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 60 cgggatcctt atgcgacctc caccatgc 28 <210> 61 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 61 ggaattccat atgaaagcct tcgtcgtcga 30 <210> 62 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 62 cgggatcctt aggatgcgta tgtaacca 28 <210> 63 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 63 ggaattccat atgaaagcga ttgtcgccca 30 <210> 64 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 64 cgggatcctt aggaaaaggc gatctgca 28 <210> 65 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 65 ggaattccat atgccgatgg cgctcgggca 30 <210> 66 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 66 cgggatcctt agaattcgat gacttgcc 28 <210> 67 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(6) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(5) <223> Xaa = Any amino acid <400> 67 Xaa Xaa Gly Gly Xaa Xaa 1 5 <210> 68 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(7) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <400> 68 Xaa Xaa Xaa Gly Gly Xaa Xaa 1 5 <210> 69 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(8) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <400> 69 Xaa Xaa Xaa Xaa Gly Gly Xaa Xaa 1 5 <210> 70 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(6) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <400> 70 Xaa Xaa Gly Xaa Xaa Xaa 1 5 <210> 71 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(8) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <400> 71 Xaa Xaa Xaa Gly Gly Xaa Xaa Xaa 1 5 <210> 72 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(8) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <400> 72 Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa 1 5 <210> 73 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(5) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <400> 73 Xaa Xaa Gly Xaa Xaa 1 5 <210> 74 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(6) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(3) <223> Xaa = Any amino acid <400> 74 Xaa Xaa Xaa Gly Xaa Xaa 1 5 <210> 75 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(7) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(4) <223> Xaa = Any amino acid <400> 75 Xaa Xaa Xaa Xaa Gly Xaa Xaa 1 5 <210> 76 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, or NADPH binding motif. <220> <221> VARIANT <222> (1)..(8) <223> Xaa = Ala, Gly, or Ser <220> <221> VARIANT <222> (2)..(5) <223> Xaa = Any amino acid <400> 76 Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa 1 5 <210> 77 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Example sequence of a possible NAD+, NADH, NADP+, Or NADPH binding motif. <220> <221> VARIANT <222> (2)..(5) <223> Xaa = Any amino acid <400> 77 Gly Xaa Gly Gly Xaa Gly 1 5 <210> 78 <211> 293 <212> PRT <213> Vibrio splendidus 12B01 <400> 78 Met Thr Lys Pro Val Ile Gly Phe Ile Gly Leu Gly Leu Met Gly Gly 1 5 10 15 Asn Met Val Glu Asn Leu Gln Lys Arg Gly Tyr His Val Asn Val Met 20 25 30 Asp Leu Ser Ala Glu Ala Val Ala Arg Val Thr Asp Arg Gly Asn Ala 35 40 45 Thr Ala Phe Thr Ser Ala Lys Glu Leu Ala Ala Ala Ser Asp Ile Val 50 55 60 Gln Phe Cys Leu Thr Thr Ser Ala Val Val Glu Lys Ile Val Tyr Gly 65 70 75 80 Glu Asp Gly Val Leu Ala Gly Ile Lys Glu Gly Ala Val Leu Val Asp 85 90 95 Phe Gly Thr Ser Ile Pro Ala Ser Thr Lys Lys Ile Gly Ala Ala Leu 100 105 110 Ala Glu Lys Gly Ala Gly Met Ile Asp Ala Pro Leu Gly Arg Thr Pro 115 120 125 Ala His Ala Lys Asp Gly Leu Leu Asn Ile Met Ala Ala Gly Asp Met 130 135 140 Glu Thr Phe Asn Lys Val Lys Pro Val Leu Glu Glu Gln Gly Glu Asn 145 150 155 160 Val Phe His Leu Gly Ala Leu Gly Ser Gly His Val Thr Lys Leu Val 165 170 175 Asn Asn Phe Met Gly Met Thr Thr Val Ala Thr Met Ser Gln Ala Phe 180 185 190 Ala Val Ala Gln Arg Ala Gly Val Asp Gly Gln Gln Leu Phe Asp Ile 195 200 205 Met Ser Ala Gly Pro Ser Asn Ser Pro Phe Met Gln Phe Cys Lys Phe 210 215 220 Tyr Ala Val Asp Gly Glu Glu Lys Leu Gly Phe Ser Val Ala Asn Ala 225 230 235 240 Asn Lys Asp Leu Gly Tyr Phe Leu Ala Leu Cys Glu Glu Leu Gly Thr 245 250 255 Glu Ser Leu Ile Ala Gln Gly Thr Ala Thr Ser Leu Gln Ala Ala Val 260 265 270 Asp Ala Gly Met Gly Asn Asn Asp Val Pro Val Ile Phe Asp Tyr Phe 275 280 285 Ala Lys Leu Glu Lys 290

Claims (25)

  1. (a) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 80% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
    (b) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 90% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
    (c) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 95% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
    (d) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 97% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
    (e) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 99% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드; 및
    (f) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드로부터 선택되며,
    상기 단리된 뉴클레오타이드는 디하이드로게나제 활성을 가지는 폴리펩타이드를 코딩하는 것인 단리된 뉴클레오타이드.
  2. 다당류를 재조합 미생물과 접촉시키는 것을 포함하며, 상기 재조합 미생물은 제1항에 따른 폴리뉴클레오타이드를 포함하는 것인, 다당류를 단당류 또는 올리고당류로 전환하는 방법.
  3. 우로네이트(uronate), D-만누로네이트(D-mannuronate)을 재조합 미생물과 접촉시키는 것을 포함하며, 상기 재조합 미생물은 제1항에 따른 폴리뉴클레오타이드를 포함하는 것인, 우로네이트, D-만누로네이트의 환원(수소화)을 촉매하는 방법.
  4. 4-데옥시-L-에리스로-5-헥소세울로스 우로네이트(DEHU)을 재조합 미생물과 접촉시키는 것을 포함하며, 상기 재조합 미생물은 제1항에 따른 폴리뉴클레오타이드를 포함하는 것인, 우로네이트, 4-데옥시-L-에리스로-5-헥소세울로스 우로네이트의 환원(수소화)을 촉매하는 방법.
  5. 제1항에 따른 단리된 폴리뉴클레오타이드를 포함하는 벡터.
  6. 제5항에 있어서, 상기 단리된 폴리뉴클레오타이드는 발현 조절 영역에 작동가능하게 연결된 것인 벡터.
  7. 재조합 미생물을 포함하며, 상기 재조합 미생물이 제5항에 따른 벡터를 포함하는 것인, 미생물 시스템.
  8. 제조합 미생물을 포함하며, 상기 재조합 미생물이 제1항에 따른 폴리뉴클레오타이드를 포함하고, 또한 상기 폴리뉴클레오타이드가 재조합 미생물의 게놈 안에 통합된 것인, 미생물 시스템.
  9. 제8항에 있어서, 상기 단리된 폴리뉴클레오타이드는 발현 조절 영역에 작동가능하게 연결된 것인 미생물 시스템.
  10. 제7항 또는 제8항에 따른 재조합 미생물에 있어서, 상기 미생물이 아세토박터 아세티, 아크로모박터, 애시디필리움, 아시네토박터, 악티노마두라, 악티노플라네스, 에어로파이룸 퍼닉스, 아그로박테리움, 알카리제네스, 아나나스 코모수스(M), 아스로박터, 아스퍼질러스 니거, 아스퍼질러스 오리재, 아스퍼질러스 멜레우스, 아스퍼질러스 풀베루렌투스, 아스퍼질러스 사이토이, 아스퍼질러스 소재, 아스퍼질러스 우사미, 바실러스 알칼로필루스, 바실러스 아밀로리퀴파시언스, 바실러스 브레비스, 바실러스 서큐란스, 바실러스 클라우시, 바실러스 렌투스, 바실러스 리케니포르미스, 바실러스 마세란스, 바실러스 스테아로서모필루스, 바실러스 섭틸리스, 비피도박테리움, 브레비바실러스 브레비스, 버크홀데리아 세파시아, 칸디다 실린드라세아, 칸디다 루고사, 카리카 파파야(L), 셀룰로시미크로비움, 세팔로스포리움, 케토미움 에라티쿰, 케토미움 그라실레, 클로스트리디움, 클로스트리디움 부티리쿰, 클로스트리디움 아세토부티리쿰, 클로스트리디움 서모셀럼, 코리네박테리움 (글루타미쿰), 코리네박테리움 에피시엔스, 에스케리치아 콜라이, 엔테로코커스, 어위니아 크리산세미, 글리코노박터, 글루콘아세토박터, 할로아르쿨라, 후미콜라 인솔렌스, 후미콜라 엔솔렌스, 키타사토스포라 세타에, 클렙시엘라, 클렙시엘라 옥시토카, 클루이베로마이세스, 클루이베로마이세스 프라질리스, 클루이베로마이세스 락티스, 코쿠리아, 락트락티스, 락토바실러스, 락토바실러스 퍼멘툼, 락토바실러스 사케, 락토코쿠스, 락토코쿠스 락티스, 류코노스톡, 메틸로시스티스, 메타놀로부스 시실리애, 메타노제니움 오르가노필룸, 메타노박테리움 브리아티, 마이크로박테리움 임페리얼, 마이크로코쿠스 리소데익티쿠스, 마이크로루나투스, 뮤코 자바니쿠스, 마이코박테리움, 마이로세시움, 나이트로박터, 나이트로소모나스, 노카디아, 파파야 카리카, 페디오코쿠스, 페디오코쿠스 할로필루스, 페니실리움, 페니실리움 카멤베르티, 페니실리움 시트리눔, 페니실리움 에메르소니, 페니실리움 로케포르티, 페니실리움 리락티눔, 페니실리움 멀티칼라, 파라코쿠스 판토트로푸스, 프로피오니박테리움, 슈도모나스, 슈도모나스 플루오레슨스, 슈도모나스 데니프리피칸스, 파이로코쿠스, 파이로코쿠스 퓨리오서스, 파이로코쿠스 호리코시, 라이조비움, 리조무코어 미에헤이, 리조무코어 푸실러스 린트, 라이조푸스, 라이조푸스 델레마, 라이조푸스 자포니쿠스, 라이조푸스 니비우스, 라이조푸스 오리자에, 라이조푸스 올리고스포루스, 로도코쿠스, 사카로마이세스 세레비지애, 스클레로티나 리베르티나, 스핑고박테리움 멀티보룸, 스핑고비움, 스핑고모나스, 스트렙토코쿠스, 스트렙토코쿠스 서모필루스 Y-1, 스트렙토마이세스, 스트렙토마이세스 그리세우스, 스트렙토마이세스 리비단스, 스트렙토마이세스 뮤리누스, 스트렙토마이세스 루비기노수스, 스트렙토마이세스 비올라세오루버, 스트렙토베르티실리움 모바라엔스, 테트라게노쿠스, 서머스, 티오스파에라 판토트로파, 트라메테스, 트리코데르마, 트리코데르마 롱기브라키아툼, 트리코데르마 리세이, 트리코데르마 비리드, 트리코스포론 페니실라툼, 비브리오 알지노리티쿠스, 잔토모나스, 이스트, 자이고사카로마이세스 룩시이, 자이모모나스, 및 자이모모나스 모빌리스로부터 선택되는 것인 재조합 미생물.
  11. (a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
    (b) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
    (c) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
    (d) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
    (e) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드; 및
    (f) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열을 포함하는 단리된 폴리펩타이드로부터 선택되며,
    상기 단리된 폴리펩타이드가 디하이드로게나제 활성을 가지는 것인 단리된 폴리펩타이드.
  12. 다당류를 재조합 미생물과 접촉시키는 것을 포함하며, 상기 재조합 미생물은 제11항에 따른 폴리펩타이드를 포함하는 것인, 다당류를 단당류 또는 올리고당류로 전환하는 방법.
  13. 우로네이트, D-만누로네이트을 재조합 미생물과 접촉시키는 것을 포함하며, 상기 재조합 미생물은 제11항에 따른 폴리펩타이드를 포함하는 것인, 우로네이트, D-만누로네이트의 환원(수소화)을 촉매하는 방법.
  14. 4-데옥시-L-에리스로-5-헥소세울로스 우로네이트(DEHU)을 재조합 미생물과 접촉시키는 것을 포함하며, 상기 재조합 미생물은 제11항에 따른 폴리뉴클레오타이드를 포함하는 것인, 우로네이트, 4-데옥시-L-에리스로-5-헥소세울로스 헥소세울로스 환원(수소화)을 촉매하는 방법.
  15. 다당류를 단당류 또는 올리고당류로 전환하기 위한 미생물 시스템으로서, 상기 미생물 시스템은 재조합 미생물을 포함하고, 및 상기 재조합 미생물은
    (a) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 80% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
    (b) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 90% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
    (c) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 95% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
    (d) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 97% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드;
    (e) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열과 적어도 99% 동일한 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드; 및
    (f) 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 또는 37 로 나타내는 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드로부터 선택되는 단리된 폴리뉴클레오타이드를 포함하는 것인 미생물 시스템.
  16. 다당류를 단당류 또는 올리고당류로 전환하기 위한 미생물 시스템으로서, 상기 미생물 시스템은 재조합 미생물을 포함하고, 및 상기 재조합 미생물은
    (a) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 80% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
    (b) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 90% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
    (c) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 95% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
    (d) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 97% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드;
    (e) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열과 적어도 99% 동일한 아미노산 서열을 포함하는 단리된 폴리펩타이드; 및
    (f) 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 78 로 나타내는 아미노산 서열을 포함하는 단리된 폴리펩타이드로부터 선택된 단리된 폴리펩타이드를 포함하는 것인 미생물 시스템.
  17. 제1항 또는 제15항의 단리된 폴리뉴클레오타이드에서, 상기 폴리뉴클레오타티드는 니코틴아미드 아데닌 다이뉴클레오타이드(NAD+), NADH, 니코틴아미드 아데닌 다이뉴클레오타이드 포스페이트(NADP+), 또는 Y-X-G-G-X-Y(서열번호 67), Y-X-X-G-G-X-Y(서열번호 68), Y-X-X-X-G-G-X-Y(서열번호 69), Y-X-G-X-X-Y(서열번호 70), Y-X-X-G-G-X-X-Y(서열번호 71), Y-X-X-X-G-X-X-Y(서열번호 72), Y-X-G-X-Y (서열번호 73), Y-X-X-G-X-Y(서열번호 74), Y-X-X-X-G-X-Y(서열번호 75), 및 Y-X-X-X-X-G-X-Y(서열번호 76)로 이루어진 그룹으로부터 선택되는 NADPH 결합 모티프의 적어도 하나를 포함하고; 상기 Y 는 알라닌, 글라이신, 및 세린으로부터 각각 선택되고, 상기 G 는 글라이신이고, 및 상기 X 는 유전적으로 코딩된 아미노산으로부터 각각 선택되는 단리된 폴리뉴클레오타이드.
  18. 제11항 또는 제16항에 따른 단리된 폴리펩타이드에서, 상기 폴리펩타이드는 니코틴아미드 아데닌 다이뉴클레오타이드(NAD+), NADH, 니코틴아미드 아데닌 다이뉴클레오타이드 포스페이트(NADP+), 또는 Y-X-G-G-X-Y(서열번호 67), Y-X-X-G-G-X-Y(서열번호 68), Y-X-X-X-G-G-X-Y(서열번호 69), Y-X-G-X-X-Y(서열번호 70), Y-X-X-G-G-X-X-Y(서열번호 71), Y-X-X-X-G-X-X-Y(서열번호 72), Y-X-G-X-Y (서열번호 73), Y-X-X-G-X-Y(서열번호 74), Y-X-X-X-G-X-Y(서열번호 75), 및 Y-X-X-X-X-G-X-Y(서열번호 76)로 이루어진 그룹으로부터 선택되는 NADPH 결합 모티프의 적어도 하나를 포함하고; 상기 Y 는 알라닌, 글라이신, 및 세린으로부터 각각 선택되고, 상기 G 는 글라이신이고, 및 상기 X 는 유전적으로 코딩된 아미노산으로부터 각각 선택되는 단리된 폴리펩타이드.
  19. 다당류를 재조합 미생물과 접촉시키는 것을 포함하며, 상기 재조합 미생물을 유일한 탄소원으로서 다당류에서 성장할 수 있는 것인, 다당류를 에탄올로 전환하는 방법.
  20. 제19항에 있어서, 상기 재조합 미생물을 적어도 하나의 피루베이트 디카르복실라제를 코딩하는 적어도 하나의 폴리뉴클레오타이드, 및 알코올 디하이드로게나제를 코딩하는 적어도 하나의 폴리뉴클레오타이드를 포함하는 것인 방법.
  21. 제19항에 있어서, 상기 다당류는 알지네이트인 방법.
  22. 제19항에 있어서, 상기 재조합 미생물은 비브로 스플렌디두스의 V12B01_24249 및 V12B01_24189 사이의 게놈 영역을 포함하는 하나 또는 그 이상의 폴리뉴클레오타이드를 포함하는 것인 방법.
  23. 제19항에 있어서, 상기 적어도 하나의 피루베이트 디카르복실라제는 자이모모나스 모빌리스로부터 유래한 것인 방법.
  24. 제19항에 있어서, 상기 적어도 하나의 알코올 디하이드로게나제는 자이모모나스 모빌리스로부터 유래한 것인 방법.
  25. 제19항에 있어서, 상기 미생물은 E. coli 인 방법.

KR1020107018703A 2008-01-28 2009-01-28 단리된 알코올 디하이드로게나제 효소 및 이의 용도 KR20100119877A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US2416008P 2008-01-28 2008-01-28
US61/024,160 2008-01-28

Publications (1)

Publication Number Publication Date
KR20100119877A true KR20100119877A (ko) 2010-11-11

Family

ID=40445263

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107018703A KR20100119877A (ko) 2008-01-28 2009-01-28 단리된 알코올 디하이드로게나제 효소 및 이의 용도

Country Status (12)

Country Link
US (1) US20090203089A1 (ko)
EP (2) EP2463374A3 (ko)
JP (1) JP2011510634A (ko)
KR (1) KR20100119877A (ko)
CN (1) CN101970665A (ko)
AU (1) AU2009209184A1 (ko)
BR (1) BRPI0906682A2 (ko)
CA (1) CA2712722A1 (ko)
CL (1) CL2009000182A1 (ko)
MX (1) MX2010008023A (ko)
WO (1) WO2009097346A2 (ko)
ZA (1) ZA201005292B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120113400A (ko) * 2011-04-05 2012-10-15 바이오스트림테크놀러지스(주) 신규미생물 비브리오 스플린디더스 bst398 및 이를 이용한 저분자 히알루론산의 제조방법

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010539988A (ja) 2007-10-04 2010-12-24 ビオ アルチテクトウレ ラブ インコーポレイテッド 生物燃料製品
EP2424975B1 (en) 2009-04-30 2016-07-06 Genomatica, Inc. Organisms for the production of 1,3-butanediol
KR20120120493A (ko) * 2009-12-10 2012-11-01 게노마티카 인코포레이티드 합성 가스 또는 기타 가스상 탄소원 및 메탄올을 1,3-부탄디올로 변환하는 방법 및 변환용 유기체
US9023627B2 (en) 2010-09-15 2015-05-05 University Of Washington Through Its Center For Commercialization Systems and methods for biotransformation of carbon dioxide into higher carbon compounds
CN102206615B (zh) * 2011-04-27 2013-06-12 珠海市御品堂生物科技有限公司 一种用酶解法制备乙醇脱氢酶的工艺
EP2785827A4 (en) * 2011-11-29 2015-09-23 Codexis Inc OVEREXPRESSION OF GENES ENHANCING YEAST FERMENTATION USING CELLULOSIC SUBSTRATES
US9175316B2 (en) * 2012-12-12 2015-11-03 Ebio, Llc Efficient production of biofuels from cells carrying a metabolic-bypass gene cassette
WO2013115959A1 (en) * 2012-02-02 2013-08-08 Bio Architecture Lab, Inc. Methods and compositions for growth of yeast on alginate
DE102012212281B3 (de) 2012-07-13 2013-10-31 Schülke & Mayr GmbH Mischung von natürlichen bzw. naturidentischen Alkoholen mit verbesserter Wirksamkeit
CN109136124A (zh) * 2018-08-17 2019-01-04 西南科技大学 一种超富集植物体快速减容减量处理复合菌剂及其制备方法
GB202011259D0 (en) * 2020-07-21 2020-09-02 Givaudan Sa Method for the production of musk fragrance ingredient

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US5162516A (en) * 1988-05-31 1992-11-10 University Of Florida Cloning and sequencing of the alcohol dehydrogenase II gene from Zymomonas mobilis
US5028539A (en) * 1988-08-31 1991-07-02 The University Of Florida Ethanol production using engineered mutant E. coli
US5821093A (en) * 1988-08-31 1998-10-13 University Of Florida Research Foundation, Inc. Recombinant cells that highly express chromosomally-integrated heterologous genes
US5487989A (en) * 1988-08-31 1996-01-30 Bioenergy International, L.C. Ethanol production by recombinant hosts
US5000000A (en) * 1988-08-31 1991-03-19 University Of Florida Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes
US5554520A (en) * 1988-08-31 1996-09-10 Bioenergy International, L.C. Ethanol production by recombinant hosts
US5424202A (en) * 1988-08-31 1995-06-13 The University Of Florida Ethanol production by recombinant hosts
US5482846A (en) * 1988-08-31 1996-01-09 University Of Florida Ethanol production in Gram-positive microbes
US5298421A (en) * 1990-04-26 1994-03-29 Calgene, Inc. Plant medium-chain-preferring acyl-ACP thioesterases and related methods
US5344771A (en) * 1990-04-26 1994-09-06 Calgene, Inc. Plant thiosterases
US5455167A (en) * 1991-05-21 1995-10-03 Calgene Inc. Medium-chain thioesterases in plants
US6102690A (en) * 1997-04-07 2000-08-15 Univ. Of Florida Research Foundation, Inc. Recombinant organisms capable of fermenting cellobiose
US6280986B1 (en) * 1997-12-01 2001-08-28 The United States Of America As Represented By The Secretary Of Agriculture Stabilization of pet operon plasmids and ethanol production in bacterial strains lacking lactate dehydrogenase and pyruvate formate lyase activities
GB9726398D0 (en) * 1997-12-12 1998-02-11 Isis Innovation Polypeptide and coding sequences
DE10142467A1 (de) 2001-08-31 2003-03-20 Basf Ag Neue Pyruvatdecarboxylase, ihre Herstellung und Verwendung
AU2005321630A1 (en) * 2004-07-02 2006-07-06 Metanomics Gmbh Process for the production of fine chemicals
JP2010539988A (ja) * 2007-10-04 2010-12-24 ビオ アルチテクトウレ ラブ インコーポレイテッド 生物燃料製品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120113400A (ko) * 2011-04-05 2012-10-15 바이오스트림테크놀러지스(주) 신규미생물 비브리오 스플린디더스 bst398 및 이를 이용한 저분자 히알루론산의 제조방법

Also Published As

Publication number Publication date
EP2463374A3 (en) 2012-12-26
WO2009097346A2 (en) 2009-08-06
EP2463374A2 (en) 2012-06-13
BRPI0906682A2 (pt) 2019-09-24
MX2010008023A (es) 2010-08-04
EP2245162A2 (en) 2010-11-03
CL2009000182A1 (es) 2010-01-04
JP2011510634A (ja) 2011-04-07
AU2009209184A1 (en) 2009-08-06
ZA201005292B (en) 2011-05-25
US20090203089A1 (en) 2009-08-13
WO2009097346A3 (en) 2009-09-24
CA2712722A1 (en) 2009-08-06
CN101970665A (zh) 2011-02-09

Similar Documents

Publication Publication Date Title
KR20100119877A (ko) 단리된 알코올 디하이드로게나제 효소 및 이의 용도
US8003365B2 (en) Biosynthesis of commodity chemicals
US8211689B2 (en) Biofuel production
US20110189743A1 (en) Microbial systems for producing commodity chemicals
RU2620982C2 (ru) Биотехнологический способ получения бутанола и масляной кислоты
EP2304040A2 (fr) Production d&#39;alcenes par decarboxylation enzymatique d&#39;acides 3-hydroxy-alcanoïques
AU780433B2 (en) Novel enzymes which dehydrate glycerol
JP2009539407A (ja) 溶媒耐性微生物および単離方法
US20110230682A1 (en) Microorganisms with inactivated lactate dehydrogenase gene (ldh) for chemical production
EP3259359B1 (en) L-arabinose assimilation pathway and uses thereof
KR20160111732A (ko) 탄소질 원료를 가스화하여 생촉매를 제조하는 방법

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination