KR20140091742A

KR20140091742A - 발효법에 의한 목적 물질의 제조법

Info

Publication number: KR20140091742A
Application number: KR1020147015776A
Authority: KR
Inventors: 유스케 니시오; 유코 야마모토; 가즈테루 야마다; 고스케 요코타
Original assignee: 아지노모토 가부시키가이샤
Priority date: 2011-11-11
Filing date: 2012-11-06
Publication date: 2014-07-22
Also published as: BR112013016373A2; WO2013069634A1; EP2778228B1; US20130295621A1; PE20141569A1; BR112013016373B1; EP2778228A1; JPWO2013069634A1; MY173771A; US9045789B2; EP2778228A4; CN103930557A

Abstract

목적 물질인 2-케토글루타르산 또는 이의 유도체를 생산하는 능력을 갖고, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여 목적 물질을 당해 배지 중에 생성 축적시키고, 당해 배지로부터 목적 물질을 채취함으로써 목적 물질을 제조한다.

Description

발효법에 의한 목적 물질의 제조법{METHOD FOR PRODUCING TARGET SUBSTANCE BY FERMENTATION}

본 발명은, 미생물을 사용한 발효법에 의한 L-아미노산 등의 목적 물질의 제조법에 관한 것으로서, 상세하게는 크실로스를 원료로 하여 발효법에 의해 목적 물질을 제조하는 방법에 관한 것이다.

세균을 사용한 발효법에 의해 L-아미노산 등의 목적 물질을 제조하기 위해서는, 야생형 세균(야생주)을 사용하는 방법, 야생주로부터 유도된 영양 요구주를 사용하는 방법, 야생주로부터 여러가지 약제 내성 변이주로서 유도된 대사 조절 변이주를 사용하는 방법, 영양 요구주와 대사 조절 변이주의 양쪽의 성질을 가진 주를 사용하는 방법 등이 있다.

예를 들면, L-글루탐산은 주로 브레비박테리움속, 코리네박테리움속, 마이크로박테리움속에 속하는 소위 코리네형 세균의 L-글루탐산 생산균 또는 이들 변이주를 사용한 발효법에 의해 제조되고 있다(예를 들면, 비특허문헌 1참조). 그 밖의 균주를 사용한 발효법에 의한 L-글루탐산의 제조법으로서는, 바실루스속, 스트렙토마이세스속, 페니실리움속 등의 미생물을 사용하는 방법(예를 들면, 특허문헌 1 참조), 슈도모나스속, 아스로박터속, 세라티아속, 칸디다속 등의 미생물을 사용하는 방법(예를 들면, 특허문헌 2 참조), 바실루스속, 아에로박터·아에로게네스(현 엔테로박터·아에로게네스) 등의 미생물을 사용하는 방법(예를 들면, 특허문헌 3 참조), 에스케리키아·콜라이의 변이주를 사용하는 방법(예를 들면, 특허문헌 4 참조) 등이 알려져 있다. 또한, 클렙시엘라속, 에르위니아속 또는 판토에아속, 엔테로박터속에 속하는 미생물을 사용한 L-글루탐산의 제조법도 개시되어 있다(예를 들면, 특허문헌 5 내지 7 참조).

최근, 목적 물질의 발효 생산에 재조합 DNA 기술을 이용하는 것이 실시되고 있다. 예를 들면, L-아미노산 생합성계 효소를 코드화하는 유전자의 발현을 증강하고(특허문헌 8, 특허문헌 9), 또는 L-아미노산 생합성계로의 탄소원의 유입을 증강함(특허문헌 10)으로써 세균의 L-아미노산 생산성을 향상시키는 것이 실시되고 있다.

종래, 발효법에 의한 물질의 공업 생산에 있어서는, 탄소원으로서 당류, 즉, 글루코스, 프룩토스, 슈크로스, 폐당밀(blackstrap molasses), 전분 가수분해물 등이 사용되었지만, 다소 고가라서 최근에는 식물 유래의 바이오매스 원료 등의 사용도 진행되고 있다.

이러한 바이오매스 원료로서 현재는 스타치(starch), 유지 등의 가식부(可食部) 원료의 사용이 주이지만, 장래적으로는 비가식부 원료, 구체적으로는 셀룰로스·헤미셀룰로스, 리그닌 등으로의 이행이 필요하다. 비가식부 바이오매스의 셀룰로스·헤미셀룰로스는 열이나 산 등을 사용하는 전(前)처리 행정, 셀룰라제 효소에 의한 당화 처리 행정 등을 거쳐 5탄당, 6탄당의 당으로 변환되어 발효의 원료로서 사용할 수 있다(특허문헌 11, 12). 이러한 5탄당, 6탄당의 혼합당을 아미노산 발효 등의 원료로 한 경우, 에스케리키아·콜라이는 글루코스를 우선적으로 자화(資化)하는 것이 알려져 있고, 결과적으로, 2단계 증식(디옥시)을 나타내거나 생육이 지연되는 현상이 확인되고 있다(비특허문헌 2, 3).

에스케리키아·콜라이에 있어서는, xylA 유전자가 코드화하는 크실로스이소머라제, xylB 유전자가 코드화하는 크실룰로키나제에 의한 크실로스 자화 경로가 알려져 있고, 에스케리키아·콜라이, 코리네박테리움·글루타미쿰에 도입하여, 크실로스로부터 L-아미노산을 생산할 수 있는 것이 알려져 있다(비특허문헌 5, 특허문헌 13, 비특허문헌 7).

한편, 이러한 종래 알려져 있는 경로를 경유하지 않고 크실로스로부터 크실론산을 경유하여, 2-케토글루타르산에 5단계로 이르는 경로가 카울로박터·크레센투스(Caulobacter crescentus)나 할로페락스·볼카니(Haloferax volcanii)에 존재하는 것이 보고되어 있다(비특허문헌 6). 또한, 당해 경로를 에스케리키아·콜라이로 발현시킨 예가 알려져 있다(비특허문헌 8, 특허문헌 14).

특허문헌 1: 미국 특허 제3,220,929호 명세서 특허문헌 2: 미국 특허 제3,563,857호 명세서 특허문헌 3: 일본 특허 특공소32-9393호 공보 특허문헌 4: 일본 공개특허 특개평 5-244970호 공보 특허문헌 5: 일본 공개특허 특개2000-106869호 공보 특허문헌 6: 일본 공개특허 특개2000-189169호 공보 특허문헌 7: 일본 공개특허 특개2000-189175호 공보 특허문헌 8: 미국 특허 제5,168,056호 명세서 특허문헌 9: 미국 특허 제5,776,736호 명세서 특허문헌 10: 미국 특허 제5,906,925호 명세서 특허문헌 11: 일본 공표특허 특표평9-507386호 공보 특허문헌 12: 일본 공표특허 특표평11-506934호 공보 특허문헌 13: 유럽 특허 제1577396호 명세서 특허문헌 14: 미국 특허 제7,923,226호 명세서

비특허문헌 1: 아카시 쿠니히코 등 저서, 아미노산 발효, 학회출판센터, 195-215페이지, 1986년 비특허문헌 2: Nichols N.N. et al., Appl. Microbiol. Biotechnol. 2001 Jul; 56(1-2): 120-125 비특허문헌 3: Gonzalez, R., Biotechnol. Prog. 2002 Jan-Feb; 18(1): 6-20 비특허문헌 4: Song S. et al., J. Bacteriol. 1997 Nov; 179(22): 7025-7032 비특허문헌 5: Tao H., et al., J. Bacteriol. 2001 May; 183(10): 2979-2988 비특허문헌 6: Stephens, C. et al., J. Bacteriol.2007 Mar; 189(5): 2181-2185 비특허문헌 7: Gopinath, V. et al., Appl. Microbiol. Biotechnol. 2011 Jul 28 비특허문헌 8: Huaiwei, L et al., Bioresour Technol. 2011 Aug 22

본 발명은, 크실로스를 함유하는 배지에서 효율적으로 L-글루탐산 등의 목적 물질을 생산할 수 있는 미생물, 및 이를 사용한 목적 물질의 제조법을 제공하는 것을 목적으로 한다.

본 발명자들은, 5탄당, 6탄당 자화능을 갖는 아미노산 생산균의 육종 개발을 목적으로 하고, 크실로스로부터 크실론산을 경유하여, 2-케토글루타르산에 이르는 경로를 이용하여, 미생물의 육종 개발에 대하여 검토하였다. 그 결과, 본 경로를 발현시킨 미생물이 효율적으로 크실로스를 자화할 수 있는 것을 찾아내어 본 발명을 완성하기에 이르렀다.

즉, 본 발명은 이하와 같다.

(1) 목적 물질을 생산하는 능력을 갖는 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여, 목적 물질을 당해 배지 중에 생성 축적시키고, 당해 배지로부터 목적 물질을 채취하는, 목적 물질의 제조 방법으로서,

상기 목적 물질은 2-케토글루타르산 또는 이의 유도체이고,

상기 세균은, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 것을 특징으로 하는, 방법.

(2) 상기 세균은, 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제를 각각 코드화하는 유전자가 발현 가능한 형태로 도입됨으로써, 이들 효소 활성이 부여 또는 증강된 것을 특징으로 하는, 상기 방법.

(3) 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제의 각각을 코드화하는 유전자가 카울로박터(Caulobacter)속, 에스케리키아(Escherichia)속, 아그로박테리움(Agrobacterium)속, 헤르바스피릴룸(Herbaspirillum)속, 악티노플라네스(Actinoplanes)속, 쿠프리아비두스(Cupriavidus)속, 슈도모나스(Pseudomonas)속, 조벨리아(Zobellia), 써모바실루스(Thermobacillus)속, 아스로박터(Arthrobacter)속, 아조스피릴리움(Azospirillum)속, 할로모나스(Halomonas)속, 바실루스(Bacillus)속, 또는 아스페르길루스(Aspergillus)속에 속하는 미생물 유래인, 상기 방법.

(4) 상기 세균은, 하기 중 어느 하나에 의해 크실로스로부터 크실론산을 생성할 수 있는 것을 특징으로 하는, 상기 방법:

(A) 크실로스데히드로게나제 활성, 또는 크실로스데히드로게나제 및 크실로노락토나제 활성을 부여 또는 증강시킴, 또는,

(B) 크실로스로부터 크실론산을 생성하는 반응을 촉매할 수 있는 글루코스데히드로게나제 활성을 가짐.

(5) 상기 글루코스데히드로게나제는 피롤로퀴놀린퀴논을 조효소로 하고, 또한, 상기 세균은, 피롤로퀴놀린퀴논 생산능을 갖거나, 또는 피롤로퀴놀린퀴논을 함유하는 배지에서 배양됨으로써 글루코스데히드로게나제 활성을 갖는, 상기 방법.

(6) 상기 세균은, 크실로스데히드로게나제, 또는 크실로스데히드로게나제 및 크실로노락토나제를 각각 코드화하는 유전자가 발현 가능한 형태로 도입됨으로써, 크실로스로부터 크실론산을 생성할 수 있는, 상기 방법.

(7) 상기 세균은, 2-케토글루타르산데히드로게나제의 활성이 저하되도록 추가로 개변(改變)된 것을 특징으로 하는, 상기 방법.

(8) 상기 세균은, 석신산데히드로게나제의 활성이 저하되도록 추가로 개변된 것을 특징으로 하는, 상기 방법.

(9) 상기 세균이 장내 세균 또는 코리네형(coryneform) 세균인 것을 특징으로 하는, 상기 방법.

(10) 상기 세균이 판토에아(Pantoea)속 세균인 것을 특징으로 하는, 상기 방법.

(11) 상기 세균이 판토에아·아나나티스(Pantoea ananatis)인 것을 특징으로 하는, 상기 방법.

(12) 상기 세균이 에스케리키아(Escherichia)속 세균인 것을 특징으로 하는, 상기 방법.

(13) 상기 세균이 에스케리키아·콜라이(Escherichia coli)인 것을 특징으로 하는, 상기 방법.

(14) 상기 세균이 코리네박테리움(Corynebacterium)속 세균인 것을 특징으로 하는, 상기 방법.

(15) 상기 세균이 코리네박테리움·글루타미쿰(Corynebacterium glutamicum)인 것을 특징으로 하는, 상기 방법.

(16) 상기 2-케토글루타르산 유도체가, L-글루탐산, L-글루타민, L-아르기닌, L-시트룰린, L-오르니틴, L-프롤린, 푸트레신, 및 γ-아미노부티르산으로 이루어지는 그룹으로부터 선택되는 물질인, 상기 방법.

도 1은, icd 유전자 결손주를 이용한 씨. 크레센투스(C. crescentus) 유래 NXA 오페론 발현주 생육 상보 시험의 결과를 도시한 도면이다. E1-αKG, M9-αKG, M9-Xyl, E1-Xyl은 각각 2-케토글루타르산 또는 크실로스를 단일 탄소원으로서 포함하는 M9 최소 배지 및 E1 합성 배지를 나타낸다.
도 2는, E.coli ccrNXA 오페론을 발현시키는 이. 콜라이(E. coli) L-글루탐산 생산균의 L-글루탐산 생산 배양 결과를 도시한 도면이다.
도 3은, 이. 콜라이(E. coli) 고유의 크실로스 자화 경로 결손주를 숙주로 한 ccrNXA 오페론 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다.
도 4는, 중카피(medium copy)형 벡터를 사용한 ccrNXA 오페론 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다.
도 5는, 각종 미생물 유래의 xylD 호모로그 유전자 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다. Atu, Hse, Amis, Aor은 각각 Agrobacterium tumefaciens, Herbaspirillum seropedicae, Actinoplanes missouriensis, Aspergillus oryzae를 나타낸다.
도 6은, 각종 미생물 유래의 xylX 호모로그 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다. Art, Atu, Cne, Zga, Tco, Selo는 각각 Arthrobacter globiformis, Agrobacterium tumefaciens, Cupriavidus necator, Zobellia galactanivorans, Thermobacillus composti, Pseudomonas elodea를 나타낸다.
도 7은, 각종 미생물 유래의 xylA 호모로그 발현주에 의한 L-글루탐산 생산 배양 결과를 도시한 도면이다. Hbo, Abr는 각각 Halomonas boliviensis, Azospirillum brasilense를 나타낸다.

본 발명은, 목적 물질을 생산하는 능력을 갖는 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여 목적 물질을 당해 배지 중에 생성 축적시키고, 당해 배지로부터 목적 물질을 채취하는 목적 물질의 제조 방법으로서,

상기 목적 물질은 2-케토글루타르산 또는 이의 유도체이고,

상기 세균은, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트-2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 것을 특징으로 하는, 방법이다.

목적 물질은 2-케토글루타르산(α-케토글루타르산, αKG) 또는 이의 유도체이다. 2-케토글루타르산의 유도체로서는 L-글루탐산, L-글루타민, L-아르기닌, L-시트룰린, L-오르니틴, L-프롤린, 푸트레신, 및 γ-아미노부티르산이 열거된다.

「목적 물질 생산능」이란, 본 발명에 사용하는 세균을 배지에서 배양하였을 때에, 상기 목적 물질을 세포 또는 배지로부터 회수할 수 있는 정도로 생산하는 능력을 갖는 것을 말한다. 바람직하게는, 동일한 조건에서 배양된 야생주 또는 비개변주보다 다량의 목적 물질을 생산하는 능력을 갖는 것을 말한다. 세균은, 2종류 이상의 목적 물질의 생산능을 갖는 것이라도 좋다.

또한, 상기 목적 물질은, 프리체(free form) 및/또는 이의 염, 예를 들면 황산염, 염산염, 탄산염, 암모늄염, 나트륨염, 칼륨염을 포함한다.

<1> 본 발명의 세균

본 발명의 세균은, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 세균이다.

본 발명의 세균은, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성을 본래 갖지 않지만 이들 효소 활성이 부여된 세균이어도 좋고, 이들 효소 활성을 본래 갖고 있지만 이들 효소 활성이 증강된 세균이어도 좋다.

크실로스로부터 크실론산을 생성하는 능력은, 예를 들면,

1) 크실로스데히드로게나제 활성을 부여 또는 증강하는 것, 또는

2) 크실로스로부터 크실론산을 생성하는 반응을 촉매할 수 있는 글루코스데히드로게나제 활성을 갖는 것,

중 어느 하나 또는 양쪽에 의해 달성된다.

1)에 해당하는 미생물로서는 에스케리키아속 세균, 코리네형 세균이, 2)에 해당하는 미생물로서는 판토에아속 세균 등이 열거된다.

1)에 관해서는 크실로스데히드로게나제 활성에 추가하여 크실로노락토나제를 더욱 강화하여도 좋다.

각 속에 속하는 세균에 대해서는 후술한다.

크실로스로부터 생성되는 크실론산은 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제에 의해 2-케토글루타르산으로 변환된다. 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제에 의해, 2-케토글루타르산에 이르는 경로는 Weimberg pathway라고도 불리고 있다(J. Biol. Chem., 236: 629-636). 본 명세서에서는 Weimberg pathway, 및 Weimberg pathway에 추가하여, 크실로스데히드로게나제 및/또는 크실로노락토나제에 의해 크실로스로부터 크실론산에 이르는 경로를 포함하여, NXA(Novel Xylose Assimilation) 경로라고 기재하는 경우가 있다.

세균이 Weimberg pathway를 갖고 있는지, 또는 동일 경로가 도입되었는지의 여부는 세균 추출물의 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제의 효소 활성을 측정하거나, 또는 Weimberg pathway를 보지하지 않은 주에서는 축적되는 크실론산을 자화하고 있는 것을 확인함으로써 결정할 수 있다. 또한, 세균이 NXA 경로를 보지하는지, 또는 동일 경로가 도입되었는지의 여부는 상기 각 효소에 추가하여, 크실로스데히드로게나제, 및/또는 크실로노락토나제의 효소 활성을 측정함으로써 결정할 수 있다. 또한, 이러한 효소 활성은 크실로스로부터 생성되는 크실론산을 측정함으로써도 결정할 수 있다.

본 발명에 있어서, 크실로네이트데히드라타제(xylonate dehydratase)는 다음 반응을 가역적으로 촉매하는 효소이며(EC4.2.1.82), D-크실로-알도네이트 데히드라타제(D-xylo-aldonate dehydratase), D-크실로네이트 데히드라타제(D-xylonate dehydratase), 및 D-크실로네이트 히드로-리아제(D-xylonate hydro-lyase)라고도 불린다.

D-크실론산→2-데하이드로-3-데옥시-D-크실로네이트+H₂O

크실로네이트데히드라타제 활성은, 예를 들면, D-크실론산 용액과 피검시료를 혼합하여 반응시킨 후, 1% 세미카르바지드 염산염(semicarbazide hydrochloride) 수용액과 1.5% 아세트산 나트륨 수용액으로 이루어지는 반응 정지 액을 가하여 반응을 정지시키고, 희석액 250nm에서의 흡수를 측정함으로써 측정할 수 있다(Dahms, A.S., et al., Methods Enzymol. 1982; 90 Pt E: 302-5).

본 발명에 있어서, 2-케토-3-데옥시크실로네이트데히드라타제(2-케토-3-데옥시-xylonate dehydratase)는 이하의 반응을 가역적으로 촉매하는 효소이다(EC4.2.1.-).

2-데하이드로-3-데옥시-D-크실로네이트 →

2-옥소글루타르산 세미알데히드 + H₂O

2-케토-3-데옥시크실로네이트데히드라타제 활성은, 예를 들면, 기질인 2-케토-3-데옥시크실론산 용액과 피검시료를 혼합하여 반응시킨 후, 2-케토-3-데옥시크실론산의 감소를 측정함으로써 측정할 수 있다.

본 발명에 있어서, 2-케토글루타르산 세미알데히드데히드로게나제(2-케토glutaric semialdehyde dehydrogenase)는 이하의 반응을 가역적으로 촉매하는 산화환원 효소이다(EC1.2.1.26).

2-옥소글루타르산 세미알데히드+NAD(P)→2-옥소글루타르산+NAD(P)H

2-케토글루타르산 세미알데히드데히드로게나제 활성은, 예를 들면, NAD(P)의 환원을 측정함으로써 활성 측정이 가능하다. 예를 들면, 피로인산(pH8.5), NAD(P)와 피검시료의 혼합액에 2-케토글루타르산 세미알데히드를 가하여 340nm에서의 흡수를 측정함으로써 이 효소의 활성을 측정할 수 있다(Adams, E., et al,(1967) J. Biol. Chem. 242, 1802-1814).

크실로스데히드로게나제(D-크실로스-1-데히드로게나제, D-xylose 1-dehydrogenase)는 펜토스와 글루쿠론산의 상호 변환 효소의 하나이며, 다음 반응을 가역적으로 촉매하는 산화환원 효소이다(EC1.1.1.175).

D-크실로스+NAD(P)+→D-크실로노락톤+NAD(P)H+H⁺

D-크실로스-1-데히드로게나제 활성은, 예를 들면, 크실로스, 피검시료, 및 NAD(P)를 혼합하여 반응시켜 340nm에서의 흡수를 측정함으로써 측정할 수 있다(Stephens, C. et al., J. Bacteriol., 2007, 189(5): 181-2185).

또한, 카울로박터·크레센투스의 크실로스데히드로게나제는, D-크실로스→크실론산의 활성을 촉매하는 경우가 있다.

본 발명에 있어서, 크실로노락토나제(xylonolactonase)는 이하의 반응을 가역적으로 촉매하는 효소이다(EC3.1.1.68).

D-크실로노락톤→D-크실론산

크실로노락토나제 활성은, 예를 들면, 크실로노락톤과 피검시료를 혼합하여 반응시켜 잔존하는 크실로노락톤을 하이드록사메이트법에 의해 정량함으로써 측정할 수 있다(Appl. Microbiol. Biotechnol., 29: 375-379, 1988; Appl. Microbiol., Biotechnol., 27:333-336, 1988).

크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제의 각 효소를 코드화하는 유전자는 Weimberg pathway를 갖는 미생물이면 어느 것이어도 좋지만, 예를 들면, 카울로박터(Caulobacter)속, 에스케리키아(Escherichia)속, 아그로박테리움(Agrobacterium)속, 헤르바스피릴룸(Herbaspirillum)속, 악티노플라네스(Actinoplanes)속, 쿠프리아비두스(Cupriavidus)속, 슈도모나스(Pseudomonas)속, 조벨리아(Zobellia)속, 써모바실루스(Thermobacillus)속, 아스로박터(Arthrobacter)속, 아조스피릴리움(Azospirillum)속, 할로모나스(Halomonas)속, 바실루스(Bacillus)속 등에 속하는 세균, 또는 아스페르길루스(Aspergillus)속에 속하는 사상균 등의 미생물 유래의 유전자가 열거된다.

카울로박터속 세균으로서는 카울로박터·크레센투스가 열거된다.

카울로박터·크레센투스로서는 CB-15주, CB-13주가 알려져 있고, 각각 ATCC 19089, ATCC33532로서 아메리칸·타입·컬처·콜렉션(주소 P. O. Box 1549 Manassas, VA 20108, United States of America)에 보존되어 있다. 또한, NA-1000주(J. Bacteriol., 192: 3678-88(2010)), K31주도 사용하는 것이 가능하다.

카울로박터·크레센투스 CB15주, NA1000주, K31주의 게놈 서열은 각각 GenBank Accession Nos. AE005673, CP001340, CP000927로 등록되어 있다.

카울로박터·크레센투스 CB15주, NA1000주, 및 K31주 유래의 각 효소의 유전자는 GenBank에 하기의 Gene symbol로 등록되어 있다.

또한, 카울로박터·크레센투스 유래의 크실로스데히드로게나제 유전자, 및 2-케토글루타릭 세미알데히드데히드로게나제 유전자는 각각 ccrxylB, ccrxylA라고 기재하는 경우가 있다.

또한, NXA 경로(Novel Xylose Assimilation)의 효소로서는 카울로박터속 이외에, 예를 들면, 하이포크레아 제코리나(트리코더마 레쎄이)[Hypocrea jecorina(Trichoderma ressei)]의 크실로스 데히드로게나제(xylose dehydrogenase)(FEMS Microbiol Lett. 277, 249-254(2007)); 바실루스 서브틸리스(Bacillus subtilis)의 ycbD(2-케토글루타릭 세미알데히드 데히드로게나제(2-ketoglutaric Semialdehyde Dehydrogenase), III형); 슈도모나스 푸티다(Pseudomonas putida)의 2-케토글루타릭 세미알데히드 데히드로게나제(2-ketoglutaric Semialdehyde Dehydrogenase), II형), 아조스피릴룸 브라실렌세(Azospirillum brasilense)의 2-케토글루타릭 세미알데히드 데히드로게나제(2-ketoglutaric Semialdehyde Dehydrogenase), I형, II형, III형(이상, J. Bac. Chem., 282, 6685-6695, 2007), 및 이들 호모로그가 열거된다.

특히, 크실로네이트데히드라타제에 관해서는 에스케리키아속 세균, 예를 들면, 에스케리키아·콜라이의 yjhG 유전자, yagF 유전자를 사용하여도 좋다. 에스케리키아·콜라이의 yjhG 유전자는 서열번호 34에, yagF 유전자는 서열번호 36에 나타낸다. 또한, 크실로네이트데히드라타제에 관해서는 아그로박테리움속, 헤르바스피릴룸속, 악티노플라네스속, 아스페르길루스속에 속하는 미생물, 예를 들면, 아그로박테리움 투메파시엔스(Arobacterium tumefaciens), 헤르바스피릴룸 세로페디카에(Herbaspirillum seropedicae), 악티로플라네스 미쏘우리엔시스(Actinoplanes missouriensis), 아스페르길루스 오리자에(Aspergillus oryzae)의 xylD 유전자 호모로그를 사용하여도 좋다.

또한, 2-케토-3-데옥시크실로네이트데히드라타제에 관해서는 아그로박테리움속, 슈도모나스속, 조벨리아속, 써모바실루스속, 아스로박터속에 속하는 세균, 예를 들면, 아그로박테리움 투메파시엔스 A(Agrobacterium tumefaciensA), 쿠프리아비두스 네카토르(Cupriavidus necator), 슈도모나스 엘로데아(Pseudomonas elodea), 조벨리아 갈락타니보란스(Zobellia galactanivorans), 써모바실루스 콤포스티(Thermobacillus composti), 아스로박터 글로비포르미스(Arthrobacter globiformis)의 xylX 유전자 호모로그를 사용하여도 좋다.

또한, 2-케토글루타릭 세미알데히드데히드로게나제에 관해서는 아조스피릴리움속, 할로모나스속, 바실루스속에 속하는 세균의 유전자, 예를 들면, 아조스피릴룸 브라실렌세(Azospirillum brasilense), 할로모나스 볼리비엔시스(Halomonas boliviensis)의 xylA 유전자 호모로그, 또는 바실루스 서브틸리스(Bacillus subtilis)의 ycbD를 사용하여도 좋다.

상기의 각 유전자의 염기서열 및 이들이 코드화하는 아미노산 서열은 표 11에 기재한다.

후술하는 바와 같이, 카울로박터·크레센투스에서는 NXA 경로의 5개 효소의 유전자는 오페론 구조를 갖는다. 이 오페론의 염기서열은 GenBank에 AAK22808_Caulobacter_crescentus의 accession No.로 등록되어 있다. 서열번호 23에 이 오페론의 염기서열을 나타낸다. 이 오페론에 의해 코드화되는 2-케토-3-데옥시크실로네이트데히드라타제, 2-케토글루타릭 세미알데히드데히드로게나제, 크실로스데히드로게나제, 및 크실로노락토나제의 아미노산 서열을 각각 서열번호 24 내지 27에 나타낸다. 또한, 이 오페론 중의 xylD 유전자 염기서열 및 이에 의해 코드화되는 크실로네이트데히드라타제의 아미노산 서열을 각각 서열번호 28 및 29에 나타낸다. 서열번호 28의 염기서열은 서열번호 23의 5509 내지 7296 위치에 상당한다.

또한, xylX의 개시 코돈으로서 2개소(箇所)가 제안되어 있지만, 서열번호 23에서는 1175 내지 1177 위치를 개시 코돈으로서 기재하였다. xylD의 개시 코돈도 2개소가 제안되어 있고, 서열번호 28의 1 내지 3 위치, 또는 13 내지 15 위치를 개시 코돈으로서 사용하여도 좋다. 13 내지 15 위치가 개시 코돈인 경우에는 서열번호 29의 크실로네이트데히드라타제의 아미노산 서열은 5 위치의 Leu으로부터 시작된다.

글루코스데히드로게나제는 본래 이하의 반응을 가역적으로 촉매하는 효소이지만(EC1.1.1.119), 「크실로스로부터 크실론산을 생성하는 반응을 촉매할 수 있는 글루코스데히드로게나제」란, 피롤로퀴놀린퀴논을 조효소로 함으로써 D-크실로스를 D-크실로노락톤으로 변환할 수 있는 효소를 의미한다.

β-D-글루코스+NADP→D-글루코노-1,5-락톤+NADPH+H⁺

피롤로퀴놀린퀴논은 미생물이 원래 지닌 능력에 의해 생산되어도 좋고, 배지 중에 첨가되어도 좋다(Appl Environ Microbiol. 2009 May; 75(9) 2784-2791).

본 발명에서는, 2-케토글루타르산 또는 이의 유도체를 생산하는 세균으로서, 2-케토글루타르산의 분해 경로를 약화 또는 소실시키는 것이 바람직하다. 2-케토글루타르산의 분해 경로의 약화 또는 소실로서는, α-케토글루타르산데히드로게나제 및/또는 석신산데히드로게나제의 활성을 약화 또는 소실시키는 것이 바람직하다. 본 발명에 있어서, α-케토글루타르산데히드로게나제(이하, 「α-KGDH」라고 하는 경우가 있다) 활성이란, α-케토글루타르산(2-옥소글루타르산)을 산화적으로 탈탄산하고, 석시닐-CoA(succinyl-CoA)을 생성하는 반응을 촉매하는 활성을 의미한다. 상기 반응은 α-KGDH(E1o: α-케토글루타레이트 데히드로게나제(α-ketoglutarate dehydrogenase), EC:1.2.4.2), 디하이드로리포아미드 S-석시닐트랜스퍼라제(E2o: 디히드로리포아미드-S-석시닐트랜스퍼라제(dihydrolipoamide-S-succinyltransferase); EC:2.3.1.61), 디하이드로리포아미드 데히드로게나제(E3: 디히드로리포아미드 데히드로게나제(dihydrolipoamide dehydrogenase); EC:1.8.1.4)의 3종의 효소에 의해 촉매된다. 즉, 이들 3종류의 서브유니트는 각각 이하의 반응을 촉매하고, 이들 3개의 반응을 합한 반응을 촉매하는 활성을 α-KGDH 활성이라고 한다. α-KGDH 활성의 확인은, Shiio 등의 방법(Isamu Shiio and Kyoko Ujigawa-Takeda, Agric. Biol. Chem., 44(8), 1897-1904, 1980)에 따라 측정할 수 있다.

E1o: 2-옥소글루타레이트+[디히드로리포일리신-잔기 석시닐트랜스퍼라제]리포일리신=[디히드로리포일리신-잔기 석시닐트랜스퍼라제]S-석시닐디히드로리포일리신+CO₂ {2-oxoglutarate+[dihydrolipoyllysine-residue succinyltransferase] lipoyllysine=[dihydrolipoyllysine-residue succinyltransferase]S-succinyldihydrolipoyllysine+CO₂}

E2o: CoA+ 엔자임 N6-(S-석시닐디히드로리포일)리신=석시닐-CoA+엔자임 N6-(디히드로리포일)리신 {CoA+enzyme N6-(S-succinyldihydrolipoyl)lysine=succinyl-CoA+enzyme N6-(dihydrolipoyl)lysine}

E3: 단백질 N6-(디히드로리포일)리신+NAD⁺=단백질 N6-(리포일)리신+NADH+H⁺ {protein N6-(dihydrolipoyl)lysine+NAD⁺=protein N6-(lipoyl)lysine+NADH+H⁺}

또한, α-KGDH는 옥소글루타르산데히드로게나제(oxoglutarate dehydrogenase), 2-옥소글루타르산데히드로게나제(2-oxoglutarate dehydrogenase)이라고도 불린다.

장내 세균과(科), 예를 들면, 판토에아·아나나티스에서는 이의 3종 각각의 효소 활성을 갖는 서브유니트 단백질이 복합체를 형성하고 있다. 그리고, 각 서브유니트는 각각 sucA, sucB 및 lpd에 의해 코드화되고, sucA , sucB 유전자는, 석시네이트데히드로게나제 철-황단백질 유전자(sdhB)의 하류에 존재한다(미국 특허 제6,331,419호). 또한, 이 특허에는 이들 유전자는 엔테로박터·아글로메란스 AJ13355의 유전자로서 기재되어 있지만, 이 균주는 나중에 판토에아·아나나티스로 재분류된다.

장내 세균의 α-KGDH를 코드화하는 유전자로서, 판토에아·아나나티스의 sucA, sucB 및 하류에 존재하는 sucC 유전자의 염기서열 및 각 서브유니트의 아미노산 서열은 EP2100957A1에 개시되어 있다. 또한, 에스케리키아·콜라이의 α-KGDH를 코드화하는 sucA, sucB 및 sucC 유전자는 각각 Genbank NP_415254, NP_415255에 개시되어 있다.

또한, 코리네형 세균에서는, E1o 서브유니트는 odhA 유전자(sucA 유전자라고도 불리는 GenBank Accession No. NC_003450의 NCgl1084로서 등록되어 있다)에 의해 코드화되고, E3 서브유니트는 lpd 유전자(GenBank Accession No. Y16642)에 의해 코드화되어 있다. 한편, E2o 서브유니트는 E1o 서브유니트와 함께 2기능성 단백질로서 odhA 유전자에 코드화되거나(Usuda et al., Microbiology 1996 142, 3347-3354 참조), 또는 odhA 유전자와는 별도의 GenBank Accession No. NC_003450의 NCgl2126으로서 등록되어 있는 유전자에 의해 코드화된다고 추측되고 있다. 따라서, 본 발명에 있어서는 odhA 유전자는 E1o 서브유니트를 코드화하는 유전자이지만, 아울러 E2o를 코드화하여도 좋다.

브레비박테리움·락토페르멘툼의 odhA 유전자의 염기서열 및 E1o 서브유니트의 아미노산 서열(WO2006/028298), 상기 GenBank Accession No. NC_003450의 NCgl2126의 염기서열 및 이 서열에 의해 코드화되는 E2o 서브유니트의 아미노산 서열, 및 상기 GenBank Accession No. NC_003450의 NCgl1084의 염기서열 및 이 서열에 의해 코드화되는 E1o 서브유니트의 서열은 EP2100957A1에 개시되어 있다.

본 발명에서는, α-KGDH 서브유니트의 각각을 코드화하는 유전자 및 이들을 포함하는 유전자 클러스터를 총칭하여 「α-KGDH 코드화하는 유전자」라고 하는 경우가 있다.

석신산데히드로게나제(이하, 「SDH」라고 기재하는 경우가 있다)는 EC:1.3.99.1 이하의 반응을 가역적으로 촉매하는 효소이다. 본 발명에 있어서, SDH 활성이란 이 반응을 촉매하는 활성을 의미한다.

석신산+FAD→푸마르산+FADH₂

SDH는 미생물종에 따라 3개 또는 4개의 서브유니트 구조로 구성되며, 이들 중 적어도 1종의 단백질을 정상적으로 기능하지 않도록 개변함으로써 활성을 저하 또는 결실시킬 수 있다. 구체적으로는, SDH는 이하의 서브유니트(괄호 안은 서브유니트를 코드화하는 유전자명)로 구성되어 있고, 종류에 따라서는 membrane anchor protein을 sdhC 단독으로, 또는 sdhC와 sdhD로 코드화되는 것이 있다.

SDHA: 플라보프로테인 서브유니트(flavoprotein subunit)(sdhA)

SDHB: Fe-S 프로테인 서브유니트(Fe-S protein subunit)(sdhB)

SDHC: 멤브레인 앵커 프로테인(membrane anchor protein)(sdhC)

SDHD: 멤브레인 앵커 프로테인(membrane anchor protein)(sdhD)

또한, SDH 서브유니트 복합체는 SDH와 푸마르산리덕타제의 양쪽 활성을 갖는 경우가 있다. 예를 들면, 코리네형 세균의 SDH 서브유니트 복합체는 SDH와 푸마르산리덕타제의 양쪽 활성을 갖는다(WO2005/021770).

SDH 활성의 확인은 2,6-디클로로인도페놀(2,6-dichloroindophenol)(DCIP)의 환원을 지표로서 측정함으로써 실시할 수 있다. 구체적인 방법은 Tatsuki Kurokawa and Junshi Sakamoto, Arch Microbiol (2005) 183:317-324에 기재되어 있다.

본 발명에 있어서는, SDH 서브유니트의 각각을 코드화하는 유전자, 및 이들을 포함하는 오페론을 총칭하여 「SDH를 코드화하는 유전자」라고 하는 경우가 있다.

장내 세균의 SDH를 코드화하는 유전자로서, 판토에아·아나나티스의 유전자의 염기서열 및 각 서브유니트는 WO2008/075483에 개시되어 있다.

코리네형 세균의 SDH를 코드화하는 유전자로서는, 예를 들면, 코리네박테리움·글루타미쿰의 sdh 오페론(GenBank accession No.NCgl0359(sdhC） NCgl0360(sdhA) NCgl0361(sdhB)), 및 브레비박테리움·플라붐의 sdh 오페론(일본 공개특허 특개2005-095169호, EP1672077A1, WO2008/075483)의 서열이 개시되어 있다.

α-KGDH, SDH의 활성을 저하 또는 결손시키기 위해서는, 후술하는 L-글루탐산의 생합성 경로로부터 분기하여 다른 화합물을 생성하는 반응을 촉매하는 효소의 활성 저하에 대하여 기재한 방법을 적용할 수 있다.

또한, 본 발명의 미생물로서는, 크실로스를 세포 내에 흡수하는 효소의 활성이 강화되어도 좋다.

크실로스를 세포 내에 흡수하는 효소로서는 D-크실로스퍼미아제가 열거되고, D-크실로스퍼미아제를 코드화하는 유전자로서는 xylE 유전자가 열거된다. D-크실로스퍼미아제를 코드화하는 에스케리키아·콜라이 유래의 xylE 유전자의 염기서열, 및 이 유전자가 코드화하는 아미노산 서열을 각각 서열번호 30, 31에 나타낸다.

또한, 본 발명의 미생물로서는, 크실로스 이소머라제(xylA) 및 또는 크실룰로스키나제(xylB)를 약화시키는 것이 바람직하다. 또한, 에스케리키아·콜라이의 크실로스 이소머라제(xylA), 크실룰로스키나제(xylB) 유전자는 NC000913.1 gi: 16131436, 16131435에 각각 개시되어 있다.

또한, 본 발명에 있어서는, 크실론산이 배지 중에 축적하는 경우가 있고, 특히 에스케리키아·콜라이에서는 크실로네이트데히드라타제의 활성을 더욱 강화하는 것이 바람직하다. 예를 들면, 활성으로서 10㎛ol/min/mg-protein 이상, 바람직하게는 15㎛ol/min/mg-protein 이상, 더욱 바람직하게는 17㎛ol/min/mg-protein 이상 강화되는 것이 바람직하다.

다음에, 미생물에 목적 효소의 활성을 부여하거나 미생물의 목적 효소의 활성을 증대시키는 방법을 설명한다.

미생물이 원래 목적 효소의 활성을 갖지 않는 경우에는, 이 효소를 코드화하는 유전자를 이 미생물에 도입함으로써 이 효소 활성을 부여할 수 있다. 또한, 미생물이 목적 효소의 활성을 갖는 경우에는 목적 효소를 코드화하는 외래 유전자를 도입하거나, 목적 효소를 코드화하는 내인성의 유전자의 카피수를 증대시키거나, 또는 목적 효소 유전자의 프로모터 등의 발현 제어 서열을 개변하는 등을 하여, 이 유전자의 발현량을 증대시킴으로써 목적 효소 활성을 증대시킬 수 있다. 본 발명에 있어서, 「목적 효소 유전자를 도입한다」란, 원래 목적 효소 활성을 갖지 않는 미생물에 목적 효소 유전자를 도입할 뿐만 아니라, 당해 효소 활성을 갖는 미생물에 외래 유전자를 도입하는 것, 및 목적 효소 활성을 갖는 미생물에 내인성 유전자를 도입하여, 내인성의 목적 효소 유전자의 발현량을 증대시키는 것도 포함한다.

목적 효소 유전자를 도입하기 위해서는, 예를 들면, 이 유전자를 적당한 벡터 상에 클로닝하고, 수득된 벡터를 사용하여 숙주 미생물을 형질 전환한다.

형질 전환에 사용하는 벡터로서는, 사용하는 미생물로 자율 복제 가능한 플라스미드가 열거된다. 예를 들면, 장내 세균군에 속하는 미생물 중에서 자율 복제 가능한 플라스미드로서 pUC19, pUC18, pBR322, RSF1010, pHSG299, pHSG298, pHSG399, pHSG398, pSTV28, pSTV29, pTWV228, pTWV229(pHSG, pSTV, pTWV는 다카라바이오사에서 입수 가능), pMW119, pMW118, pMW219, pMW218(pMW는 니혼진사에서 입수 가능) 등이 열거된다. 또한, 코리네형 세균용의 플라스미드로서는 pAM330(일본 공개특허 특개소58-67699호 공보), pHM1519(일본 공개특허 특개소58-77895호 공보), pSFK6(일본 공개특허 특개2000-262288호 공보 참조), pVK7(미국 특허출원공개 명세서 2003-0175912), pAJ655, pAJ611, pAJ1844(일본 공개특허 특개소58-192900호 공보), pCG1(일본 공개특허 특개소57-134500호 공보), pCG2(일본 공개특허 특개소58-35197호 공보), pCG4, pCG11(일본 공개특허 특개소57-183799호 공보), pHK4(일본 공개특허 특개평5-7491호 공보) 등이 열거된다.

형질 전환법으로서는, 예를 들면, 에스케리키아·콜라이 K-12에 대하여 보고되어 있는 수용균 세포를 염화 칼슘으로 처리하여 DNA의 투과성을 증대시키는 방법(Mandel, M. and Higa, A., J. Mol. Biol. 1970, 53, 159-162), 바실루스·서브틸리스에 대하여 보고되어 있는 증식 단계의 세포로부터 컴피턴트 셀을 조제하여 DNA를 도입하는 방법(Duncan, C. H., Wilson, G. A. and Young, F. E.., 1997. Gene 1: 153-167) 등이 열거된다. 또는, 바실루스·서브틸리스, 방선균류 및 효모에 대하여 알려져 있는 DNA 수용균의 세포를, 재조합 DNA를 용이하게 흡수하는 프로토플라스트 또는 스페로플라스트의 상태로 하여 재조합 DNA를 DNA 수용균에 도입하는 방법(Chang, S. and Choen, S.N., 1979. Mol. Gen. Genet. 168: 111-115; Bibb, M. J., Ward, J. M. and Hopwood, O. A. 1978. Nature 274: 398-400; Hinnen, A., Hicks, J. B. and Fink, G. R. 1978. Proc. Natl. Acad. Sci. USA 75: 1929-1933）도 응용할 수 있다. 또한, 전기 펄스법(일본 공개특허 특개평2-207791호 공보)에 의해서도 미생물의 형질 전환을 실시할 수도 있다.

또한, 목적 효소 유전자의 도입은 숙주 미생물의 염색체 상에의 도입에 의해서 달성할 수 있다. 미생물의 염색체 상에 목적 효소 유전자를 도입하기 위해서는, 트랜스포손이나 Mini-Mu를 사용하여 염색체 상에 랜덤으로 도입하는 방법(일본 공개특허 특개평2-109985호 공보, US5,882,888, EP805867B1)이나, 염색체 DNA 상에 다중 카피(multiple copy) 존재하는 서열을 표적으로 이용하여 상동 재조합에 의해 실시하는 것도 가능하다. 염색체 DNA 상에 다카피 존재하는 서열로서는 반복성 DNA, 전이 인자의 단부에 존재하는 역반복(inverted repeat)을 이용할 수 있다. 또는, Red 드리븐 인테그레이션법(WO2005/010175)을 사용함으로써 목적 유전자를 염색체 상에 도입하는 것도 가능하다. 또한, P1 파지 등의 파지를 사용한 트랜스덕션(transduction)이나, 접합 전달 벡터에 의한 염색체 상에의 목적 유전자의 도입도 가능하다. 또한, WO03/040373에 기재되어 있는 바와 같이, 목적 물질 생산에 불필요한 유전자를 표적으로 하여 목적 효소 유전자를 도입하는 것도 가능하다. 이러한 방법으로 표적서열에 목적 효소 유전자를 1카피 또는 다카피 도입할 수 있다.

염색체 상에 이들 유전자가 전이된 것의 확인은 목적 유전자 또는 이의 일부와 상보적인 서열을 갖는 프로브를 사용하여 서던 하이브리다이제이션을 실시함으로써 확인할 수 있다.

목적 유전자가 도입되는 카피수는 1카피 이상이면 어느 것이라도 좋지만, 2카피 이상, 보다 바람직하게는 3카피 이상, 더 바람직하게는 5카피 이상인 것이 바람직하다. 목적 유전자 중에서도 특히 크실로네이트데히드라타제 유전자는 2카피 이상 도입되는 것이 바람직하다.

또한, 목적 효소 유전자는 하기에 설명하는 바와 같이, 프로모터 등의 발현 조절 서열의 치환, 변이와 조합함으로써 활성을 최적화하는 것이 가능하다. 특히, 크실로네이트데히드라타제 유전자는 상기의 다카피화 대신에, 또는 다카피화와 더불어 발현 조절 서열의 치환, 변이에 의해 고발현시키는 것이 바람직하다.

목적 효소 유전자의 발현량을 증대시키는 방법으로서는 염색체 DNA 상 또는 플라스미드 상에서, 목적 효소 유전자의 프로모터 등의 발현 조절 서열을 적절한 강도로 치환함으로써 이 유전자의 발현을 증강시키는 방법이 열거된다. 예를 들면, thr 프로모터, lac 프로모터, trp 프로모터, trc 프로모터, pL 프로모터, tac 프로모터 등이 자주 사용되는 프로모터로서 알려져 있다. 또한, 후술하는 실시예에서 사용하고 있는 tac 프로모터의 베리언트(PtacA 프로모터, PtacB 프로모터)도 사용할 수 있다. 프로모터 강도의 평가법 및 강력한 프로모터의 예는 Goldstein과 Doi의 논문(Goldstein, M. A. and Doi R. H. 1995. Prokaryotic promoters in biotechnology. Biotechnol. Annu. Rev., 1, 105-128) 등에 기재되어 있다.

또한, 국제공개 WO00/18935에 개시되어 있는 바와 같이, 유전자의 프로모터영역에 수염기의 염기 치환을 도입하여 적절한 강도로 개변하는 것도 가능하다. 발현 조절 서열의 치환은, 예를 들면, 온도 감수성 플라스미드를 사용한 유전자 치환과 동일하게 하여 실시할 수 있다. 에스케리키아·콜라이나, 판토에아·아나나티스에 사용할 수 있는 온도 감수성 복제 기점을 갖는 벡터로서는, 예를 들면, WO 99/03988호 국제공개팜플렛에 기재된 온도 감수성 플라스미드 pMAN997이나 이의 유도체 등이 열거된다. 또한, λ파지의 레드 리콤비나제(Red recombinase)를 이용한 「Red 드리븐 인테그레이션법(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A. and Wanner, B. L., 2000. Proc. Natl. Acad. Sci. USA. 97: 6640-6645)이나, Red 드리븐 인테그레이션법과 λ파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203(2002))을 조합한 방법(WO2005/010175호 참조) 등의 직쇄상 DNA를 사용하는 방법에 의해서도 발현 조절 서열의 치환을 실시할 수 있다. 또한, 발현 조절 서열의 개변은 상술한 바와 같은 유전자의 카피수를 높이는 방법과 조합하여도 좋다.

또한, 리보솜 결합 부위(RBS)와 개시 코돈 사이의 스페이서, 특히, 개시 코돈의 바로 상류의 서열에서의 여러 개의 뉴클레오티드의 치환이 mRNA의 번역 효율에 상당히 영향을 미치는 것이 알려져 있고, 이들을 개변함으로써 번역량을 향상시키는 것이 가능하다.

상기 증폭 플라스미드 또는 염색체 상에 목적 유전자를 도입하는 경우, 이들 유전자를 발현시키기 위한 프로모터는 사용하는 미생물에서 기능하는 것이면 어느 프로모터이어도 좋고, 사용하는 유전자 자신의 프로모터이어도 좋고, 개변한 것이라도 좋다. 사용하는 미생물로 강력하게 기능하는 프로모터를 적절히 선택하거나, 프로모터의 -35, -10 영역을 콘센서스 서열에 가까이함으로써도 유전자 발현량의 조절이 가능하다.

목적 효소의 활성이 증강되었는지 여부의 확인은 개변주와 친주(親株) 또는 비개변주의 목적 효소의 활성을 비교함으로써 실시할 수 있다. 개변주의 효소 활성이 친주 또는 비개변주보다 상승하고 있으면 이 효소의 활성이 증강된다. 또한, 친주가 목적 효소의 활성을 갖지 않는 경우에는, 개변주로 목적 효소의 활성을 검출할 수 있으면 이 효소의 활성이 증강된다.

목적 효소 유전자는, 상기의 서열 정보, 또는 이의 미생물에 있어서 공지된 유전자 또는 단백질의 서열 정보에 기초하여 제작된 올리고뉴클레오티드를 프라이머로 하는 PCR법, 또는 상기 서열 정보에 기초하여 제작된 올리고뉴클레오티드를 프로브로 하는 하이브리디제이션법에 의해, 목적 효소를 유지하는 미생물의 염색체 DNA 또는 염색체 DNA 라이브러리로부터 취득할 수 있다.

또한, 목적 효소, 및 이를 코드화하는 유전자는, 효소 활성을 유지하고 있는 한, 이들 호모로그나 인위적 개변체 등, 또는 보존적 변이를 갖는 단백질 또는 이를 코드화하는 것이면 좋다.

상기와 같은 호모로그, 인위적 개변체 또는 보존적 변이를 갖는 단백질 또는 이들을 코드화하는 유전자를 보존적 베리언트라고 기재한다.

목적 효소의 보존적 베리언트로서는, 예를 들면, 상기 각 효소의 아미노산 서열에 있어서 1 또는 여러 개의 위치에서의 1 또는 여러 개의 아미노산의 치환, 결실, 삽입 또는 부가 등을 포함하는 서열을 갖는 단백질이어도 좋다.

「1 또는 여러 개」란, 아미노산 잔기의 단백질의 입체 구조에서의 위치나 아미노산 잔기의 종류에 따라서도 다르지만, 구체적으로 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더 바람직하게는 1 내지 5개를 의미한다. 또한, 보존적 변이의 대표적인 것은 보존적 치환이다. 보존적 치환이란, 치환 부위가 방향족 아미노산인 경우에는 Phe, Trp, Tyr 사이에서, 치환 부위가 소수성 아미노산인 경우에는 Leu, Ile, Val 사이에서, 극성 아미노산인 경우에는 Gln, Asn 사이에서, 염기성 아미노산인 경우에는 Lys, Arg, His 사이에서, 산성 아미노산인 경우에는 Asp, Glu 사이에서, 하이드록실기를 갖는 아미노산인 경우에는 Ser, Thr 사이에서 서로 치환하는 변이이다. 보존적 치환이라고 간주되는 치환으로서는, 구체적으로는 Ala로부터 Ser 또는 Thr으로의 치환, Arg로부터 Gln, His 또는 Lys로의 치환, Asn으로부터 Glu, Gln, Lys, His 또는 Asp로의 치환, Asp로부터 Asn, Glu 또는 Gln으로의 치환, Cys로부터 Ser 또는 Ala로의 치환, Gln으로부터 Asn, Glu, Lys, His, Asp 또는 Arg로의 치환, Glu로부터 Gly, Asn, Gln, Lys 또는 Asp로의 치환, Gly로부터 Pro로의 치환, His로부터 Asn, Lys, Gln, Arg 또는 Tyr로의 치환, Ile로부터 Leu, Met, Val 또는 Phe로의 치환, Leu로부터 Ile, Met, Val 또는 Phe로의 치환, Lys로부터 Asn, Glu, Gln, His 또는 Arg로의 치환, Met로부터 Ile, Leu, Val 또는 Phe로의 치환, Phe로부터 Trp, Tyr, Met, Ile 또는 Leu로의 치환, Ser로부터 Thr 또는 Ala로의 치환, Thr로부터 Ser 또는 Ala로의 치환, Trp로부터 Phe 또는 Tyr로의 치환, Tyr로부터 His, Phe 또는 Trp로의 치환, 및 Val로부터 Met, Ile 또는 Leu로의 치환이 열거된다. 또한, 상기한 바와 같은 아미노산의 치환, 결실, 삽입, 부가, 또는 역위 등에는 유전자가 유래하는 미생물의 개체 차이, 종류의 차이에 근거하는 경우 등 천연에서 발생하는 변이(mutant 또는 variant)에 의해 발생하는 것도 포함된다. 이러한 단백질은, 예를 들면, 부위 특이적 변이법에 의해 코드화되는 단백질의 특정한 부위의 아미노산 잔기가 치환, 결실, 삽입 또는 부가를 포함하도록 야생형 유전자의 염기서열을 개변함으로써 취득할 수 있다.

또한, 상기와 같은 보존적 변이를 갖는 단백질은 아미노산 서열 전체에 대하여, 예를 들면, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 보다 바람직하게는 97% 이상, 보다 바람직하게는 98% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖고, 또한, 야생형 단백질과 동등한 기능을 갖는 단백질이어도 좋다. 또한, 본 명세서에 있어서 「상동성」 (homology)」은 「동일성」 (identity)을 가리키는 경우가 있다.

야생형의 목적 효소 유전자는 상기와 같은 아미노산 서열을 코드화하는 것이면, 카울로박터·크레센투스나 할로페락스·볼카니 등의 유전자에 한정되지 않고, 임의의 코돈을 그것과 등가의 코돈으로 치환한 것이어도 좋다.

또한, 야생형 유전자는 상기의 각 효소 유전자의 상보 서열 또는 이 상보 서열로부터 조제될 수 있는 프로브와 엄격한 조건 하에서 하이브리다이즈하고, 야생형의 목적 효소와 동등한 기능을 갖는 단백질을 코드화하는 DNA라도 좋다. 여기에서, 「엄격한 조건」이란, 소위 특이적인 하이브리드가 형성되고, 비특이적인 하이브리드가 형성되지 않는 조건을 말한다. 일례를 나타내면, 상동성이 높은 DNA끼리, 예를 들면, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 보다 바람직하게는 97% 이상, 보다 바람직하게는 98% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖는 DNA끼리 하이브리다이즈하고, 이보다 상동성이 낮은 DNA끼리 하이브리다이즈하지 않는 조건, 또는 통상의 서던 하이브리다이제이션의 세정 조건인 60℃, 1×SSC, 0.1% SDS, 바람직하게는 0.1×SSC, 0.1% SDS, 더 바람직하게는 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도, 온도로 1회, 보다 바람직하게는 2 내지 3회 세정하는 조건을 들 수 있다.

프로브로서는 각 유전자의 상보 서열의 일부를 사용할 수도 있다. 이러한 프로브는 공지된 유전자 서열에 기초하여 제작된 올리고뉴클레오티드를 프라이머로 하고, 이들 염기서열을 포함하는 DNA 단편을 주형으로 하는 PCR에 의해 제작할 수 있다. 예를 들면, 프로브로서 300bp 정도 길이의 DNA 단편을 사용하는 경우에는, 하이브리다이제이션의 세정 조건은 50℃, 2×SSC, 0.1% SDS가 열거된다.

상기한 각 단백질의 보존적 베리언트 및 이를 코드화하는 유전자에 관한 기재는, 후술하는 목적 물질 생산균에 대하여 기재한 것 이외의 유전자에 대해서도 마찬가지로 적용된다.

본 발명에 사용하는 미생물은, 본래 목적 물질 생산능을 갖는 것이어도 좋고, 변이법이나 재조합 DNA 기술 등을 이용한 육종에 의해 목적 물질 생산능을 부여받은 것이어도 좋다.

본 발명에 사용되는 미생물로서는, 세균, 예를 들면, 에스케리키아속, 판토에아속, 엔테로박터속 등의 장내 세균과에 속하는 미생물이나, 코리네박테리움·글루타미쿰, 브레비박테리움·락토페르멘툼 등의 코리네형 세균, 바실루스·서브틸리스 등의 바실루스속 세균이 열거되지만 이들에 제한되지 않는다.

본 발명에 있어서, 「코리네형 세균」이란, 종래 브레비박테리움속으로 분류되었지만, 현재 코리네박테리움속으로 분류되는 세균도 포함하며(Int. J. Syst. Bacteriol., 41, 255(1991)), 또한, 코리네박테리움속과 매우 근연(近緣)한 브레비박테리움속 세균을 포함한다. 이러한 코리네형 세균의 예로서 이하의 것이 열거된다.

코리네박테리움·아세토아시도필룸

코리네박테리움·아세토글루타미쿰

코리네박테리움·알카노리티쿰

코리네박테리움·칼루나에

코리네박테리움·글루타미쿰

코리네박테리움·릴리움

코리네박테리움·멜라쎄콜라

코리네박테리움·써모아미노게네스(코리네박테리움·에피시엔스)

코리네박테리움·헤르큘리스

브레비박테리움·디바리카툼

브레비박테리움·플라붐

브레비박테리움·임마리오필룸

브레비박테리움·락토페르멘툼(코리네박테리움·글루타미쿰)

브레비박테리움·로세움

브레비박테리움·사카롤리티쿰

브레비박테리움·티오게니탈리스

코리네박테리움·암모니아게네스

브레비박테리움·알붐

브레비박테리움·세리눔

마이크로 박테리움·암모니아필룸

구체적으로는 하기와 같은 균주를 예시할 수 있다.

코리네박테리움·아세토아시도필룸 ATCC13870

코리네박테리움·아세토글루타미쿰 ATCC15806

코리네박테리움·알카노리티쿰 ATCC21511

코리네박테리움·칼루나에 ATCC15991

코리네박테리움·글루타미쿰 ATCC13020, ATCC13032, ATCC13060

코리네박테리움·릴리움 ATCC15990

코리네박테리움·멜라쎄콜라 ATCC17965

코리네박테리움·써모아미노게네스 AJ12340(FERM BP-1539)

코리네박테리움·헤르큘리스 ATCC13868

브레비박테리움·디바리카툼 ATCC14020

브레비박테리움·플라붐 ATCC13826, ATCC14067

브레비박테리움·임마리오필룸 ATCC14068

브레비박테리움·락토페르멘툼 ATCC13869(코리네박테리움·글루타미쿰 ATCC13869)

브레비박테리움·로세움 ATCC13825

브레비박테리움·사카롤리티쿰 ATCC14066

브레비박테리움·티오게니탈리스 ATCC19240

코리네박테리움·암모니아게네스 ATCC6871, ATCC6872

브레비박테리움·알붐 ATCC15111

브레비박테리움·세리눔 ATCC15112

미크로 박테리움·암모니아필룸 ATCC15354

이들을 입수하기 위해서는, 예를 들면, 아메리칸·타입·컬처·콜렉션(ATCC: 주소 P.O. Box 1549, Manassas, VA 20108, 1, United States of America)에서 분양을 받을 수 있다. 즉, 각 균주마다 대응하는 등록 번호가 부여되어 있고, 이 등록 번호를 이용하여 분양을 받을 수 있다(http://www.atcc.org/). 각 균주에 대응하는 등록 번호는 아메리칸·타입·컬처·콜렉션의 카탈로그에 기재되어 있다. 또한, AJ12340주는 1987년 10월 27일자로 통상성 공업 기술원 생명 공학 공업 기술 연구소(현 독립 행정 법인 제품 평가 기술 기반 기구 특허 생물 기탁 센터, 주소 우편 번호 305-5466 일본 이바라키현 쯔꾸바시 히가시 1쵸메 1반찌 1 쥬오 다이6)에 FERM BP-1539의 수탁 번호로 부다페스트 조약에 기초하여 기탁되어 있다.

장내 세균과에 속하는 미생물로서는, 에스케리키아속, 엔테로박터속, 판토에아속, 클렙시엘라속, 세라티아속, 에르위니아속, 살모네라균속, 모르가넬라속 등에 속하고, 목적 물질을 생산하는 능력을 갖는 것이면 특별히 한정되지 않는다. 구체적으로는 NCBI(National Center for Biotechnology Information) 데이터 베이스에 기재되어 있는 분류에 의해 장내 세균과에 속하는 것을 이용할 수 있다(http://www.ncbi.nlm.nih.gov/htbin-post/Taxonomy/wgetorg?mode=Tree&id=1236&lvl=3&keep=1&srchmode=1&unlock). 장내 세균과의 친주로서는, 그 중에서도 에스케리키아속 세균, 엔테로박터속 세균, 판토에아속 세균을 사용하는 것이 바람직하다.

에스케리키아속 세균의 친주로서는, 특별히 한정되지 않지만, 구체적으로는 나이트하르트 등의 저서(Neidhardt, F.C. et al., Escherichia coli and Salmonella Typhimurium, American Society for Microbiology, Washington D.C., 1029 table 1)에 열거된 것을 이용할 수 있다. 그 중에서는, 예를 들면, 에스케리키아·콜라이가 열거된다. 에스케리키아·콜라이로서는 구체적으로는, 프로토타입의 야생주 K12주 유래의 에스케리키아·콜라이 W3110(ATCC 27325), 에스케리키아·콜라이 MG1655(ATCC 47076) 등이 열거된다.

특히, 판토에아속 세균, 에르위니아속 세균, 엔테로박터속 세균은, γ-프로테오박테리아로 분류되는 세균이며, 분류학적으로 대단히 근연하다(J Gen Appl Microbiol 1997 Dec;43(6) 355-361, International Journal of Systematic Bacteriology, Oct. 1997, p1061-1067). 최근, DNA-DNA 하이브리다이제이션 실험 등에 의해, 엔테로박터속에 속하는 세균에는, 판토에아·아글로메란스(Pantoea agglomerans) 또는 판토에아·디스페르사(Pantoea dispersa) 등으로 재분류되어 있는 것이 있다(International Journal of Systematic Bacteriology, July 1989; 39(3). p. 337-345), 또한, 에르위니아속에 속하는 세균에는 판토에아·아나나스(Pantoea ananas), 판토에아·스테와르티로 재분류되어 있는 것이 있다(International Journal of Systematic Bacteriology, Jan 1993; 43(1). p.162-173 참조). 또한, 판토에아·아나나스는 후에 추가로 판토에아·아나나티스로 재분류된다.

엔테로박터속 세균으로서는, 엔테로박터·아글로메란스(Enterobacter agglomerans)(현재는 판토에아·아나나티스 등으로 재분류되어 있다), 엔테로박터·아에로게네스(Enterobacter aerogenes) 등이 열거된다. 구체적으로는 유럽 특허출원공개 952221호 명세서에 예시된 균주를 사용할 수 있다. 엔테로박터속의 대표적인 주로서 엔테로박터·아글로메란스 ATCC12287주(현재는 판토에아·아나나티스로 재분류되어 있다)가 열거된다.

판토에아속 세균의 대표적인 균주로서 판토에아·아나나티스(Pantoea ananatis), 판토에아 스테와르티(Pantoea stewartii), 판토에아·아글로메란스, 판토에아·시트레아(Pantoea citrea)가 열거된다. 구체적으로는 하기의 균주가 열거된다.

판토에아·아나나티스 AJ13355주(FERM BP-6614)(유럽 특허출원공개 0952221호 명세서)

판토에아·아나나티스 AJ13356주(FERM BP-6615)(유럽 특허출원공개 0952221호 명세서)

또한, 이들 균주는 유럽 특허출원공개 0952221호 명세서에는 엔테로박터·아글로메란스로서 기재되어 있지만, 현재는 상기한 바와 같이 16S rRNA의 염기서열 해석 등에 의해 판토에아·아나나티스로 재분류되어 있다.

판토에아·아나나티스 AJ13355주는 시즈오카현 이와타시의 토양에서, 저pH로서 L-글루탐산 및 탄소원을 포함하는 배지에서 증식할 수 있는 주로서 분리된 주이다. 또한, 이 주로부터 점성 물질 저생산 변이주로서 선택된 주가 SC17주이다(미국 특허 제6,596,517호). AJ13355주는 평성 10년 2월 19일에, 통산성 공업 기술원 생명 공학 공업 기술 연구소(현 명칭, 독립 행정 법인 제품 평가 기술 기반 기구 특허 생물 기탁 센터, 주소 우편번호 305-8566 일본 이바라키현 쯔꾸바시 히가시 1쵸메 1반찌 1 쥬오 다이6)에 수탁 번호 FERM P-16644로서 기탁되어, 평성 11년 1월 11일에 부다페스트 조약에 근거하는 국제 기탁에 이관되고, 수탁 번호 FERM BP-6614가 부여되어 있다. 또한, SC17주는 프라이빗 번호 AJ416이 부여되어, 평성 21년 2월 4일에 산업 기술 종합 연구소 특허 생물 기탁 센터(현 독립 행정 법인 제품 평가 기술 기반 기구 특허 생물 기탁 센터 주소 우편번호 305-8566 일본 이바라키현 쯔꾸바시 히가시 1쵸메 1반찌 1 쥬오 다이6)에 국제 기탁되어, 수탁 번호 FERM BP-11091이 부여되어 있다.

또한, 판토에아·아나나티스의 L-글루탐산 생산균으로서 SC17sucA/RSFCPG+pSTVCB주, AJ13601주, NP106주, 및 NA1주가 열거된다. SC17sucA/RSFCPG+pSTVCB주는 SC17주 유래의 sucA 유전자 결손주인 SC17sucA주(미국 특허 제6,596,517호)에, 에스케리키아·콜라이 유래의 시트르산 신타제 유전자(gltA), 포스포엔올피루브산 카복실라제 유전자(prpC), 및 글루타메이트 데히드로게나제 유전자(gdhA)를 포함하는 플라스미드 RSFCPG, 및 브레비박테리움·락토페르멘툼 유래의 시트르산 신타제 유전자(gltA)를 포함하는 플라스미드 pSTVCB를 도입하여 수득한 주이다. AJ13601주는 이 SC17sucA/RSFCPG+pSTVCB주로부터 저pH 하에서 고농도의 L-글루탐산에 내성을 나타내는 주로서 선택된 주이다. 또한, NP106주는 AJ13601주로부터 플라스미드 RSFCPG+pSTVCB를 탈락시킨 주이다(WO2010/027045). AJ13601주는 1999년 8월 18일에, 통산성 공업 기술원 생명 공학 공업 기술 연구소(현 명칭, 독립 행정 법인 제품 평가 기술 기반 기구 특허 생물 기탁 센터 주소 우편번호 305-8566 일본 이바라키현 쯔꾸바시 히가시 1쵸메 1반찌 1 쥬오 다이6)에 수탁 번호 FERM P-17516으로 기탁되어, 2000년 7월 6일에 부다페스트 조약에 근거하는 국제 기탁에 이관되고, 수탁 번호 FERM BP-7207이 부여되어 있다. 이 주는 분리된 당시에는 엔테로박터·아글로메란스로 동정되어, 엔테로박터·아글로메란스로서 기탁되었지만, 16S rRNA의 염기서열 해석 등에 의해 판토에아·아나나티스로 재분류되어 있다.

NA1주는 상기 RSFCPG의 gltA 유전자를 메틸시트르산 신타제 유전자(prpC)로 치환하는 구조를 갖는 RSFPPG(WO2008/020654)를 갖는 NP106주에 상당하는 주이다(WO2010/027045).

에르위니아속 세균으로서는, 에르위니아·아밀로보라, 에르위니아·카로토보라가 열거되고, 클렙시엘라속 세균으로서는 클렙시엘라·플란티콜라가 열거된다. 구체적으로는 하기의 균주가 열거된다.

에르위니아·아밀로보라 ATCC15580주

에르위니아·카로토보라 ATCC15713주

클렙시엘라·플란티콜라 AJ13399주(FERM BP-6600)(유럽 특허출원공개 955368호 명세서)

클렙시엘라·플란티콜라 AJ13410주(FERM BP-6617)(유럽 특허출원공개 955368호 명세서)

이하, 상기와 같은 미생물에 목적 물질 생산능을 부여하는 방법, 또는 상기와 같은 미생물의 목적 물질 생산능을 증강하는 방법에 대하여 설명한다.

목적 물질 생산능을 부여하기 위해서는, 영양 요구성 변이주, 목적 물질의 아날로그 내성주 또는 대사 제어 변이주의 취득이나, 목적 물질의 생합성계 효소의 발현이 증강된 재조합주의 창제 등, 종래, 코리네형 세균 또는 에스케리키아속 세균 등의 아미노산 생산균의 육종에 채용된 방법을 적용할 수 있다(아미노산 발효, (주) 학회 출판 센터, 1986년 5월 30일 초판 발행, 제 77 내지 100페이지 참조). 여기에서, 목적 물질 생산균의 육종에 있어서, 부여되는 영양 요구성, 아날로그 내성, 대사 제어 변이 등의 성질은 단독이어도 좋고, 2종 또는 3종 이상이어도 좋다. 또한, 발현이 증강되는 목적 물질 생합성계 효소도 단독이어도 좋고, 2종 또는 3종 이상이어도 좋다. 또한, 영양 요구성, 아날로그 내성, 대사 제어 변이 등의 성질의 부여와 생합성계 효소의 증강이 조합되어도 좋다.

목적 물질 생산능을 갖는 영양 요구성 변이주, 아날로그 내성주, 또는 대사 제어 변이주를 취득하기 위해서는, 친주 또는 야생주를 통상의 변이 처리, 즉, X선이나 자외선의 조사, 또는 N-메틸-N'-니트로-N-니트로소구아니딘 등의 변이제 처리 등에 의해 처리하고, 수득된 변이주 중에서 영양 요구성, 아날로그 내성, 또는 대사 제어 변이를 나타내고, 또한, 목적 물질 생산능을 갖는 것을 선택함으로써 수득할 수 있다. 또한, 목적 물질 생산균은 유전자 재조합에 의해 목적 물질의 생합성계 효소의 효소 활성을 증강함으로써도 실시할 수 있다.

이하, 목적 물질 생산능을 부여하는 방법, 및 목적 물질 생산능이 부여된 미생물에 대하여 예시한다.

육종에 의해 목적 물질 생산능을 부여 또는 증강하기 위한 방법으로서는, 예를 들면, 목적 물질 생합성에 관여하는 효소를 코드화하는 유전자의 발현이 증강되도록 개변하는 방법을 들 수 있다. 예를 들면, L-글루탐산 생합성에 관여하는 효소로서는, 예를 들면, 글루탐산데히드로게나제(gdhA), 글루타민신테타제(glnA), 글루탐산신타제(gltBD), 아코니티산히드라타제(acnA, acnB), 시트르산신타제(gltA), 포스포엔올피루브산카복실라제(ppc), 피루브산카복실라제, 피루브산데히드로게나제(aceEF, lpdA), 피루브산키나제(pykA, pykF), 포스포엔올피루브산신타제(ppsA), 엔올라제(eno), 포스포글리세로뮤타제(pgmA, pgmI), 포스포글리세린산키아나제(pgk), 글리세르알데히드-3-인산데히드로게나제(gapA), 트리오스인산 이소머라제(tpiA), 프룩토스비스인산알돌라제(fbp), 포스포프룩토키나제(pfkA, pfkB), 글루코스인산이소머라제(pgi), 메틸시트르산 신타제(prpC) 등이 열거된다. 또한, 효소명 뒤의 괄호안은 유전자명이다(이하의 기재에 있어서도 같음).

상기한 유전자 발현의 증강은 상술한 NXA 경로의 효소 활성 증강에 대하여 기재한 방법에 의해 실시할 수 있다.

상기 효소 유전자 중, 시트르산신타제 유전자, 피루브산데히드로게나제 유전자, 및/또는 글루탐산데히드로게나제 유전자의 발현이 증강하도록 개변된 미생물로서는 WO00/18935호 팜플렛, 유럽 특허출원공개 1010755호 명세서 등에 기재된 미생물을 예시할 수 있다.

L-글루탐산 생산능을 부여하기 위한 개변은, L-글루탐산의 생합성 경로로부터 분기되어 다른 화합물을 생성하는 반응을 촉매하는 효소의 활성을 저하 또는 결손시킴으로써 실시하여도 좋다. L-글루탐산의 생합성 경로로부터 분기되어 L-글루탐산 이외의 화합물을 생성하는 반응을 촉매하는 효소로서는 2-옥소케토글루타르산 데히드로게나제, 석신산 데히드로게나제, 이소시트르산 리아제, 아세토하이드록시산신타제, 아세토락트산 신타제, 포름산아세틸 트랜스퍼라제, 락트산 데히드로게나제, 글루탐산 데카복실라제, 1-피롤린 데히드로게나제, 아세틸-CoA 하이드라제(WO2006/057450) 등이 열거된다.

목적 효소의 활성을 저하 또는 결손시키는 방법으로서는, 통상의 변이 처리법 또는 유전자 재조합 기술에 의해, 게놈 상의 상기 효소의 유전자에 세포 중의 당해 효소의 활성이 저하 또는 결손되도록 하는 변이를 도입하면 좋다. 이러한 변이의 도입은, 예를 들면, 유전자 재조합에 의해, 게놈 상의 효소를 코드화하는 유전자를 결손시키거나, 프로모터나 샤인-달가르노(SD) 서열 등의 발현 조절 서열을 개변하거나 하는 등에 의해 달성된다. 또한, 게놈 상의 효소를 코드화하는 영역에 아미노산 치환(미스센스 변이)을 도입하는 것, 또한 시종 코돈을 도입하는 것(논센스 변이), 1 내지 2염기 부가·결실하는 프레임 시프트 변이를 도입하는 것, 유전자의 일부분, 또는 모든 영역을 결실시킴으로써도 달성할 수 있다(J. Biol. Chem. 272: 8611-8617 (1997)). 또한, 코드화 영역의 전체 또는 일부가 결실된 변이 효소를 코드화하는 유전자를 구축하여, 상동 재조합 등에 의해 당해 유전자로 게놈 상의 정상 유전자를 치환하는 것, 또는 트랜스포손, IS 인자를 당해 유전자에 도입함으로써도 효소 활성을 저하 또는 결손시킬 수 있다.

예를 들면, 상기한 효소의 활성을 저하 또는 결손시키는 변이를 유전자 재조합에 의해 도입하기 위해서는 이하와 같은 방법이 사용된다. 목적 유전자의 부분 서열을 개변하여 정상적으로 기능하는 효소를 생산하지 않도록 한 변이형 유전자를 제작하고, 당해 유전자를 포함하는 DNA로 장내 세균과에 속하는 세균으로 형질 전환하여, 변이형 유전자와 게놈 상의 유전자로 재조합을 일으키게 함으로써 게놈 상의 목적 유전자를 변이형으로 치환할 수 있다. 이러한 상동 재조합을 이용한 유전자 치환은, 「Red 드리븐 인테그레이션법(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97:6640-6645 (2000)), Red 드리븐 인테그레이션법과 λ파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203 (2002))을 조합한 방법(WO2005/010175호, 러시아 출원 2006134574호 참조) 등의 직쇄상 DNA를 사용하는 방법이나, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법 등이 있다(미국 특허 제6303383호; 일본 공개특허 특개평05-007491호 공보). 또한, 상술한 바와 같은 상동 재조합을 이용한 유전자 치환에 의한 부위 특이적 변이 도입은, 숙주 상에서 복제 능력을 갖지 않는 플라스미드를 사용하여도 실시할 수 있다.

또한, 코리네형 세균에 있어서 L-글루탐산 생산능을 부여하는 방법으로서 yggB 유전자(NCgl 1221; NP_600492. Reports small-conductance...[gi: 19552490])를 증폭하는 방법, 코드화 영역 내에 변이를 도입한 변이형 yggB 유전자를 도입하는 방법을 사용하는 것도 가능하다(WO2006/070944).

또한, L-글루탐산 생산능을 향상시키는 방법으로서, D-크실로스-5-인산포스포케톨라제(D-xylulose-5-phosphate phosphoketolase）및/또는 프룩토스-6-인산포스포케톨라제(fructose-6-phosphate phosphoketolase)를 코드화하는 유전자(이들을 합쳐서 포스포케톨라제라고 부른다)를 도입하는 방법이 열거된다. 예를 들면, 포스포케톨라제 활성이 상승된 미생물로서는 이하의 미생물이 열거된다(WO2006/016705).

브레비박테리움·락토페르멘툼 ATCC13869ΔsucA(pVK9-xfp),

브레비박테리움·락토페르멘툼 ATCC13869ΔsucA(pVK9-PS2_xpkA)

L-글루탐산 생산능은, 6-포스포글루콘산데히드라타제 활성 또는 2-케토-3-데옥시-6-포스포글루콘산알돌라제 활성, 또는 이들 양쪽의 활성을 증강시킴으로써도 부여할 수 있다. 6-포스포글루콘산데히드라타제 활성, 2-케토-3-데옥시-6-포스포글루콘산알돌라제 활성을 상승시킨 미생물로서는, 일본 공개특허 특개2003-274988에 개시된 미생물을 들 수 있다. 또한, L-글루탐산 생산능은, L-글루탐산 배출 유전자인 yhfK, ybjL 유전자를 증폭함으로써도 부여할 수 있다(WO2005/085419, WO2008/133161).

또한, 본 발명에 사용하는 L-글루탐산 생산 미생물로서는, 산성 조건 하에서 배양하였을 때에 액체 배지 중에 L-글루탐산의 포화 농도를 초과하는 양의 L-글루탐산을 축적하는 능력(이하, 산성 조건 하에서의 L-글루탐산 축적능이라고 하는 경우가 있다)을 갖는 미생물을 사용할 수 있다. 예를 들면, 유럽 공개공보 1078989호 기재의 방법에 의해, 저pH 환경 하에서 L-글루탐산에 대한 내성이 향상된 균주를 취득함으로써, 포화 농도를 초과하는 양의 L-글루탐산을 축적하는 능력을 부여할 수 있다.

L-글루탐산 생산능을 부여 또는 증강시키는 다른 방법으로서, 유기산 아날로그나 호흡 저해제 등에 대한 내성을 부여하는 방법이나, 세포벽 합성 저해제에 대한 감수성을 부여하는 방법도 열거된다. 예를 들면, 모노플루오로아세트산 내성을 부여하는 방법(일본 공개특허 특개소50-113209), 아데닌 내성 또는 티민 내성을 부여하는 방법(일본 공개특허 특개소57-065198), 우레아제를 약화시키는 방법(일본 공개특허 특개소52-038088), 말론산 내성을 부여하는 방법(일본 공개특허 특개소52-038088), 벤조피론 또는 나프토퀴논류에 대한 내성을 부여하는 방법(일본 공개특허 특개소56-1889), HOQNO 내성을 부여하는 방법(일본 공개특허 특개소56-140895), α-케토말론산 내성을 부여하는 방법(일본 공개특허 특개소57-2689), 구아니딘 내성을 부여하는 방법(일본 공개특허 특개소56-35981), 페니실린에 대한 감수성을 부여하는 방법(일본 공개특허 특개평4-88994) 등이 열거된다.

이러한 내성균의 구체예로서는 하기와 같은 균주가 열거된다.

브레비박테리움·플라붐 AJ3949(FERMBP-2632; 일본 공개특허 특개소50-113209호 참조)

코리네박테리움·글루타미쿰 AJ11628(FERM P-5736; 일본 공개특허 특개소57-065198호 참조)

브레비박테리움·플라붐 AJ11355(FERM P-5007; 일본 공개특허 특개소56-1889호 공보 참조)

코리네박테리움·글루타미쿰 AJ11368(FERM P-5020; 일본 공개특허 특개소56-1889호 공보 참조)

브레비박테리움·플라붐 AJ11217(FERM P-4318; 일본 공개특허 특개소57-2689호 공보 참조)

코리네박테리움·글루타미쿰 AJ11218(FERM P-4319; 일본 공개특허 특개소57-2689호 공보 참조)

브레비박테리움·플라붐 AJ11564(FERM P-5472; 일본 공개특허 특개소56-140895 공보 참조)

브레비박테리움·플라붐 AJ11439(FERM P-5136; 일본 공개특허 특개소56-35981호 공보 참조)

코리네박테리움·글루타미쿰 H7684(FERM BP-3004; 일본 공개특허 특개평04-88994호 공보 참조)

브레비박테리움·락토페르멘툼 AJ11426(FERM P-5123; 일본 공개특허 특개평56-048890호 공보 참조)

코리네박테리움·글루타미쿰 AJ11440(FERM P-5137; 일본 공개특허 특개평56-048890호 공보 참조)

브레비박테리움·락토페르멘툼 AJ11796(FERM P-6402; 일본 공개특허 특개평58-158192호 공보 참조)

L-글루타민 생산능을 갖는 미생물로서 바람직한 예는 글루탐산데히드로게나제 활성을 강화한 세균, 글루타민 신세타제(glnA) 활성을 강화한 세균, 글루타미나제 유전자를 파괴한 세균이다(유럽 특허출원공개 1229121호, 1424398호 명세서). 글루타민 신세타제의 활성 증강은 글루타민아데니닐 트랜스퍼라제(glnE)의 파괴, PII 제어 단백질(glnB)의 파괴에 의해서도 달성할 수 있다. 또한, 에스케리키아속에 속하고, 글루타민 신세타제의 397 위치의 티로신 잔기가 다른 아미노산 잔기로 치환된 변이형 글루타민 신세타제를 갖는 균주도 적합한 L-글루타민 생산균으로서 예시할 수 있다(미국 특허출원공개 제2003-0148474호 명세서).

L-글루타민 생산능을 부여 또는 증강하는 다른 방법으로서, 6-디아조-5-옥소-노르류신 내성을 부여하는 방법(일본 공개특허 특개평3-232497), 퓨린 아날로그 내성 및 메티오닌설폭시드 내성을 부여하는 방법(일본 공개특허 특개소61-202694), α-케토말레인산 내성을 부여하는 방법(일본 공개특허 특개소56-151495) 등이 열거된다. L-글루타민 생산능을 갖는 코리네형 세균의 구체예로서 이하의 미생물이 열거된다.

브레비박테리움·플라붐 AJ11573(FERM P-5492; 일본 공개특허 특개소56-161495)

브레비박테리움·플라붐 AJ11576(FERM BP-10381; 일본 공개특허 특개소56-161495)

브레비박테리움·플라붐 AJ12212(FERM P-8123; 일본 공개특허 특개소61-202694)

L-프롤린 생산능을 갖는 미생물로서는, 예를 들면, L-프롤린에 의한 피드백 저해가 해제된 γ-글루타밀 키나제를 유지하는 세균이나 L-프롤린 분해계가 약화된 세균이 열거된다. L-프롤린에 의한 피드백 저해가 해제된 γ-글루타밀키나제를 코드화하는 DNA를 사용하여 세균을 개변하는 방법은 Dandekar, A. M., Uratsu, S.L., J. Bacteriol., 170, 12, 5943-5 (1988)에 개시되어 있다. 또한, L-프롤린 분해계가 약화된 세균을 수득하는는 방법으로서는, 예를 들면, 프롤린 데히드로게나제 유전자에 효소 활성을 저하시키는 변이를 도입하는 방법이 열거된다. L-프롤린 생산능을 갖는 세균의 예로서는, 에스케리키아·콜라이 NRRL B-12403주 및 NRRL B-12404주(영국 특허 2075056), VKPM B-8012주(미국 특허공개 2002-0058315), 및 독일 특허 3127361호에 개시된 플라스미드 돌연 변이체나 Bloom F.R. 등의 문헌(The 15th Miami winter symposium, 1983, p. 34)에 개시된 플라스미드 변이체를 유지하는 균주 등이 열거된다.

또한, L-프롤린 생산능을 갖는 미생물로서 바람직한 것은 3,4-데하이드록시프롤린, 및 아자티딘-2-카르복실레이트에 내성인 주인 에스케리키아·콜라이 702주(VKPMB-8011)나, 702주의 ilvA 결손주인 702ilvA주(VKPMB-8012주)나, b2682 및 b2683, b1242 또는 b3434 유전자에 코드화되는 단백질의 활성을 증강한 에스케리키아·콜라이 등도 열거된다(일본 공개특허 특개2002-300874호 공보).

코리네형 세균의 L-프롤린 생산균으로서는 ＤL-3,4-데하이드로프롤린 내성주(FERM BP-1219. 미국 특허 4224409호 공보), 시트르산 합성 효소 활성이 이의 친주의 1.4배 이상으로 상승한 주(FERM P-5332, FERM P-5333, FERM P-5342, FERMP-5343 특허 1426823호), 아세트산 요구성이 부여된 주(FERM P-5931)가 열거된다.

L-아르기닌 생산능을 갖는 미생물로서는 α-메틸메티오닌, p-플루오로페닐알라닌, D-아르기닌, 아르기닌하이드록사믹산, AEC(S-(2-아미노에틸)-시스테인), α-메틸세린, β-2-티에닐알라닌, 또는 설파구아니딘에 내성을 갖는 에스케리키아·콜라이 변이주(일본 공개특허 특개소56-106598호 공보 참조) 등이 열거된다. 또한, L-아르기닌에 의한 피드백 저해에 내성 변이를 갖고, 또한, 높은 활성을 갖는 N-아세틸글루탐산 신타제를 유지하는 L-아르기닌 생산균인, 에스케리키아·콜라이 237주(러시아 특허출원 제2000117677호)도 적합한 L-아르기닌 생산주이다. 이 주는 2000년 4월 10일에 러시안·내셔널·콜렉션·오브·인더스트리얼·마이크로오거니즘(Russian National Collection of Industrial Microorganisms(VKPM), GNII Genetika)에 VKPM B-7925의 수탁 번호로 기탁되어, 2001년 5월 18일에 부다페스트 조약에 기초하는 국제 기탁에 이관되었다. 237주의 유도체로, 아세트산 자화능을 향상시킨 L-아르기닌 생산균인 에스케리키아·콜라이 382주(일본 공개특허 특개2002-017342호 공보)를 사용할 수도 있다. 에스케리키아·콜라이 382주는 2000년 4월 10일 Russian National Collection of Industrial Microorganisms(VKPM)에 VKPM B-7926의 수탁 번호로 기탁되어 있다.

또한, L-아르기닌 생산능을 갖는 미생물로서 L-아르기닌 생합성에 관여하는 효소를 코드화하는 유전자의 발현량을 향상시킨 미생물을 사용할 수 있다. 예를 들면, L-아르기닌 생합성계 효소로서는 N-아세틸글루탐산 신타제(argA), N-아세틸글루타밀인산 리덕타제(argC), 오르니틴아세틸 트랜스퍼라제(argJ), N-아세틸글루탐산키나제(argB), 아세틸오르니틴 트랜스아미나제(argD), 아세틸오르니틴디아세틸라제(argE), 오르니틴카르바모일 트랜스퍼라제(argF), 아르기니노석신산 신타제(argG), 아르기니노석신산 리아제(argH) 카르바모일인산 신타제(carAB)로부터 선택되는 1종 또는 2종 이상이 열거된다. N-아세틸글루탐산 신타제(argA)는, 야생형의 15위치 내지 19위치에 상당하는 아미노산 서열이 치환된 L-아르기닌에 의한 피드백 저해가 해제된 변이형의 유전자를 사용하면 보다 적합하다(유럽 출원공개 1170361호 명세서).

코리네형 세균의 L-아르기닌 생산균으로서는 L-아르기닌 생산능을 갖는 것이면 특별히 제한되지 않지만, 코리네형 세균 야생주; 설파제, 2-티아졸알라닌 또는α-아미노-β-하이드록시발레르산 등의 약제에 내성을 갖는 코리네형 세균; 2-티아졸알라닌 내성에 추가하여, L-히스티딘, L-프롤린, L-트레오닌, L-이소류신, L-메티오닌 또는 L-트립토판 요구성을 갖는 코리네형 세균(일본 공개특허 특개소54-44096호); 케토말론산, 플루오로말론산 또는 모노플루오로아세트산에 내성을 갖는 코리네형 세균(일본 공개특허 특개소57-18989호); 아르기니놀에 내성을 갖는 코리네형 세균(일본 공개특허 특개소 62-24075호); 또는 X-구아니딘(X는 지방산 또는 지방쇄의 유도체)에 내성을 갖는 코리네형 세균(일본 공개특허 특개평2-186995호) 등이 열거된다.

또한, L-아르기닌 생산능을 갖는 코리네형 세균은 5-아자우라실, 6-아자우라실, 2-티오우라실, 5-플루오로우라실, 5-브로모우라실, 5-아자시토신, 6-아자시토신 등에 내성인 변이주; 아르기닌하이드록사메이트, 2-티오우라실에 내성인 변이주, 아르기닌하이드록사메이트 및 6-아자우라실에 내성인 변이주(일본 공개특허 특개소49-126819호); 히스티딘아날로그 또는 트립토판아날로그에 내성인 변이주(일본 공개특허 특개소52-114092호); 메티오닌, 히스티딘, 트레오닌, 프롤린, 이소류신, 리신, 아데닌, 구아닌 또는 우라실(또는 우라실 전구체)의 적어도 하나에 요구성을 갖는 변이주(일본 공개특허 특개소52-99289호 참조); 아르기닌하이드록사메이트에 내성인 변이주(일본국 특허 특공소51-6754호); 석신산 요구성 또는 핵산 염기아날로그에 내성인 변이주(일본 공개특허 특개소58-9692호); 아르기닌 분해능이 결손ㄷ되, 아르기닌의 안타고니스트 및 카나바닌에 내성을 갖고, 리신을 요구하는 변이주(일본 공개특허 특개소52-8729호); 아르기닌, 아르기닌하이드록사메이트, 호모아르기닌, D-아르기닌, 카나바닌 내성, 아르기닌하이드록사메이트 및 6-아자우라실 내성의 변이주(일본 공개특허 특개소53-143288호); 및 카나바닌 내성의 변이주(일본 공개특허 특개소53-3586호) 등으로서 육종할 수 있다.

L-아르기닌 생산능을 갖는 코리네형 세균의 구체예로서는 하기와 같은 균주가 열거된다.

브레비박테리움·플라붐 AJ11169(FERM P-4161)

브레비박테리움·락토페르멘툼 AJ12092(FERM P-7273)

브레비박테리움·플라붐 AJ11336(FERM P-4939)

브레비박테리움·플라붐 AJ11345(FERM P-4948)

브레비박테리움·락토페르멘툼 AJ12430(FERM BP-2228)

또한, 아르기닌 리프레서인 ArgR을 결손된 주(미국 특허출원공개 2002-0045223호, 세포 내의 글루타민 신테타제 활성을 상승시킨 주(미국 특허출원공개 2005-0014236호 공보)를 사용할 수 있다.

L-시트룰린, L-오르니틴도 L-아르기닌과 생합성 경로가 공통되고, N-아세틸글루탐산 신타제(argA), N-아세틸글루타밀인산 리덕타제(argC), 오르니틴아세틸 트랜스퍼라제(argJ), N-아세틸글루탐산 키나제(argB), 아세틸오르니틴 트랜스아미나제(argD), 아세틸오르니틴 데아세틸라제(argE)의 효소 활성을 상승시킴으로써 이들의 생산능을 부여할 수 있다(국제공개 2006-35831호 팜플렛).

γ-아미노부티르산(GABA; gamma-aminobutiric acid) 생산균으로서는 글루탐산 데카복실라제의 활성을 증강시킨 주(Microb Cell Fact. 2010 Nov 12; 9:85. Amino Acids. 2010 Nov; 39(5): 1107-16 US20100324258호 공보)를 사용할 수 있다.

푸트레신 생산균으로서는 4-히드록시부티레이트 리덕타제(4-hydroxybutyrate reductase); 석시닐-CoA 리덕타제(알데히드 형성)(succinyl-CoA reductase(aldehyde forming)); 및 4-히드록시부티레이트 데히드로게나제(4-hydroxybutyrate dehydrogenase)를 강화한 주(WO2011047101호 공보), 감마-아미노부티르알데히드 데히드로게나제(gamma-aminobutyraldehyde dehydrogenase)를 강화한 주(FEBS Lett. 2005 Aug 1; 579(19): 4107-12.)를 사용할 수 있다.

<2> 목적 물질의 제조 방법

상기와 같은 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여, 목적 물질을 당해 배지 중에서 생성 축적시키고, 당해 배지로부터 목적 물질을 채취함으로써 목적 물질을 제조할 수 있다.

배양에 사용하는 배지는, 탄소원, 질소원, 무기염류, 그 이외에 필요에 따라 아미노산, 비타민 등의 유기 미량 영양소를 함유하는 통상의 배지를 사용할 수 있다. 합성 배지 또는 천연 배지 모두 사용할 수 있다.

탄소원으로서는 크실로스를 포함하는 한, 다른 탄소원, 예를 들면, 글루코스, 글리세롤, 프룩토스, 슈크로스, 말토스, 만노스, 갈락토스, 아라비노스, 전분 가수분해물, 당밀 등의 당류를 사용할 수 있고, 그 이외에 아세트산, 시트르산 등의 유기산, 에탄올 등의 알코올류도 단독 또는 다른 탄소원과 병용하여 사용할 수 있다.

크실로스와 다른 탄소원의 혼합 비율은 어느 것이어도 좋지만, 크실로스: 다른 탄소원(중량비)은 바람직하게는 1:0.1 내지 100, 보다 바람직하게는 1:0.1 내지 10, 보다 바람직하게는 1:0.1 내지 5, 보다 바람직하게는 1:1 내지 5, 더 바람직하게는 1:1 내지 3이다.

배지 중의 탄소원의 농도로서는, 목적 물질을 제조하는데 적합한 농도이면 어떤 농도로 사용하여도 좋다. 배지 중의 탄소원 농도로서는, 바람직하게는 0.1w/v% 내지 50w/v% 정도, 보다 바람직하게는 0.5w/v% 내지 40w/v% 정도, 특히 바람직하게는 1w/v% 내지 30w/v% 정도이다.

크실로스, 또는 크실로스와 글루코스와 같은 6탄당의 혼합물은 바이오매스가 충분히 이용되지 않은 공급원으로부터 수득할 수 있다. 이들 5탄당, 6탄당은 증기 및/또는 농산 가수분해, 희산 가수분해, 셀룰라제와 같은 효소를 사용하여 가수분해, 또는 알칼리 처리에 의해 식물 바이오매스로부터 유리될 수 있다. 기질이 셀룰로스계 재료인 경우, 셀룰로스는 동시에 또는 개별적으로 당에 가수분해되어 목적 물질의 생산에 사용할 수 있다. 헤미셀룰로스는 일반적으로 셀룰로스보다도 당에 가수분해되기 쉽기 때문에 셀룰로스계 재료를 미리 가수분해하여 5탄당을 분리하고, 계속해서 증기, 산, 알칼리, 셀룰라제 또는 이들 조합에 의한 처리에 의해 셀룰로스를 가수분해하여 6탄당을 생성시키는 것이 바람직하다.

또한, 본 발명에서의 배지 중에 포함되는 크실로스는, 미생물에 글루코스, 갈락토스, 아라비노스로부터의 변환 경로를 보유시켜 각 헥소스로부터 크실로스(D-크실로스)로 변환시킴으로써 공급하여도 좋다.

질소원으로서는 암모니아, 우레아, 황산암모늄, 탄산암모늄, 염화암모늄, 인산암모늄, 아세트산암모늄 등의 암모늄염 또는 질산염 등을 사용할 수 있다. 유기 미량 영양소로서는 아미노산, 비타민, 지방산, 핵산, 또는 이들을 함유하는 펩톤, 카자미노산, 효모 엑기스, 대두 단백 분해물 등을 사용할 수 있고, 생육에 아미노산 등을 요구하는 영양 요구성 변이주를 사용하는 경우에는 요구되는 영양소를 보충하는 것이 바람직하다. 무기염류로서는 인산염, 마그네슘염, 칼슘염, 철염, 망간염 등을 사용할 수 있다.

배양은, 바람직하게는, 발효 온도 20 내지 45℃, pH를 3 내지 9로 제어하고, 통풍 배양을 실시한다. 또한, pH 조정에는 무기 또는 유기의 산성 또는 알칼리성 물질, 또는 암모니아 가스 등을 사용할 수 있다. 이러한 조건 하에서, 바람직하게는 10시간 내지 120시간 정도 배양함으로써 배양액 중 또는 균체 내에 목적 물질이 축적된다.

또한, 목적 물질이 L-글루탐산인 경우, L-글루탐산이 석출되는 조건으로 조정된 액체 배지를 사용하여 배지 중에서 L-글루탐산을 석출시키면서 생성, 축적시키도록 배양을 실시할 수도 있다. L-글루탐산이 석출되는 조건으로서는, 예를 들면, pH 5.0 내지 4.0, 바람직하게는 pH 4.5 내지 4.0, 더 바람직하게는 pH 4.3 내지 4.0, 특히 바람직하게는 pH 4.0을 들 수 있다. 또한, 산성 조건 하에서의 생육의 향상, 및 효율적인 L-글루탐산의 석출을 양립하기 위해서는, pH는 바람직하게는 5.0 내지 4.0, 보다 바람직하게는 4.5 내지 4.0, 더 바람직하게는 4.3 내지 4.0인 것이 바람직하다. 또한, 상기 pH에서의 배양은 배양의 전체 기간이어도 좋고, 일부 기간이어도 좋다.

채취되는 목적 물질은 목적 물질 이외에 미생물 균체, 배지 성분, 수분 및 미생물의 대사 부산물을 포함하여도 좋다. 채취된 목적 물질의 순도는 50% 이상, 바람직하게는 85% 이상, 특히 바람직하게는 95% 이상이다(JP1214636B, USP 5,431,933, 4,956,471, 4,777,051, 4946654, 5,840,358, 6,238,714, US2005/0025878)).

배양 종료 후의 배양액으로부터 목적 물질을 채취하는 방법은 공지된 회수 방법에 따라서 실시하면 좋다. 예를 들면, 종래부터 주지되어 있는 이온 교환 수지법(Nagai, H. et al.: Separation Science and Technology, 39(16), 3691-3710), 막 분리법(일본 공개특허 특개평9-164323호, 일본 공개특허 특개평9-173792호), 정석법(WO2008/078448, WO2008/078646), 그 밖의 방법을 조합함으로써 목적 물질을 채취할 수 있다.

또한, 목적 물질이 배지 중에 석출되는 경우에는, 원심 분리 또는 여과 등에 의해 회수할 수 있다. 또한, 배지 중에 석출된 목적 물질은 배지 중에 용해되어 있는 목적 물질을 정석(晶析)한 후에 함께 단리하여도 좋다.

실시예

이하, 본 발명을 실시예에 의해 보다 더 구체적으로 설명한다.

이하의 실시예에서 사용한 배지 조성을 이하에 나타낸다.

〔LB 배지〕

박토트립톤 10g/L, 효모 엑기스 5g/L, NaCl 5g/L, pH 7.0

〔LBGM9〕

LB 배지에, 최소 배양 성분(글루코스 5g/L, 황산마그네슘 2mM, 인산칼륨 3g/L, 염화나트륨 0.5g/L, 염화암모늄 1g/L, 인산2나트륨 6g/L)을 첨가한 것

〔MSII-Glucose 배지〕

A구

글루코스 40g/L

MgSO₄·7H₂O 0.5g/L

B구

(NH₄)₂SO₄ 20g/L

KH₂PO₄ 2g/L

NaCl 0.5g/L

효모 엑기스 2g/L

CaCl₂·7H₂O 0.25g/L

FeSO₄·7H₂O 20mg/L

MnSO₄·nH₂O 20mg/L

Trace element^※ 4ml/l

L-Lys 200mg/L

DL-Met 200mg/L

DAP 200mg/L

A구, B구를 각각 120℃, 20분 오토클레이브한 후 혼합한다.

^※Trace element

CaCl₂·2H₂O 0.66g/L

ZnSO₄·7H₂O 0.18g/L

CuSO₄·5H₂O 0.16g/L

MnSO₄·4H₂O 0.15g/L

CoCl₂·6H₂O 0.18g/L

H₃BO₃ 0.10g/L

Na₂MoO₄ 0.30g/L

〔MSII-Xylose 배지〕

MSII-Glucose 배지의 글루코스(40g/L)를 크실로스(40g/L)로 치환한 것.

〔MSII-GX 배지〕

MSII-Glucose 배지의 글루코스(40g/L)를 글루코스(20g/L)와 크실로스(20g/L)의 혼합물로 치환한 것.

〔MSII-SX 배지〕

MSII-Glucose 배지의 글루코스(40g/L)를 슈크로스(20g/L)와 크실로스(20g/L)의 혼합물로 치환한 것.

〔E1 합성 배지〕

A구

NH₄Cl 20mM

MgSO₄·7H₂O 2mM

Na₂HPO₄ 40mM

KH₂PO₄ 30mM

CaCl₂ 0.01mM

FeSO₄·7H₂O 0.01mM

MnSO₄·4-5H₂O 0.01mM

Citrate 5mM

pH Free

필터 멸균

B-1구

탄소원 50(또는 100)mM

필터 멸균

B-2구

티아민-HCl 1mM

필터(0.22㎛) 멸균 후, B-1에 첨가

C구

MES-NaOH(pH6.8) 50mM

필터(0.22㎛) 멸균

A 내지 C구는 모두 5배 농도의 용액을 조제하고, 스톡 솔루션(Stock solution)으로 한다.

〔CM-Dex 배지〕

폴리펩톤 10g/L

효모 엑기스 10g/L

글루코스 5g/L

KH₂PO₄ 1g/L

요소 3g/L

MgSO₄·7H₂O 0.4g/L

FeSO₄·7H₂O 0.01g/L

MnSO₄·5H₂O 0.01g/L

콩 여액(대두 가수분해물) 1.2g/L(T-N)

KOH를 사용하여 pH7.5로 조정.

〔Glc 배지〕

글루코스 80g/L

(NH₄)₂SO₄ 30g/L

KH₂PO₄ 1g/L

MgSO₄·7H₂O 0.4g/L

FeSO₄·7H₂O 0.01g/L

MnSO₄·5H₂O 0.01g/L

비타민B1 200㎍/L

비오틴 60㎍/L

콩 여액(대두 가수분해물) 0.48g/L(T-N)

KOH를 사용하여 pH8.0으로 조정.

〔Xyl 배지(비오틴 제한)〕

Glc 배지의 글루코스(80g/L)를 크실로스(80g/L)로 치환하고, 또한 비오틴을 제외한 것.

〔MS 배지〕

A구

글루코스 또는 크실로스 40g/L

글루코스와 크실로스(1:1) 40g/L

MgSO₄·7H₂O 1g/L

B구

(NH₄)₂SO₄ 20g/L

KH₂PO₄ 1g/L

효모 엑기스 2g/L

FeSO₄·7H₂O 10mg/L

MnSO₄·nH₂O 10mg/L

A구, B구를 각각 120℃, 20분 오토클레이브한 후 혼합하고, 약전 탄산칼슘 50g/L을 가한다.

〔실시예 1〕판토에아·아나나티스로의 NXA 경로의 도입

(1) NXA 경로 도입용 플라스미드 pTWV228Ptac_ccrNXA의 구축

NXA 경로가 보고되어 있는 공지의 세균으로서 씨. 크레센투스(C. crescentus)(Stephens, C. et al., J. Bacteriol. 2007, 189(5): 181-2185)가 알려져 있다. 씨. 크레센투스(C. crescentus)의 NXA 경로의 각 효소를 코드화하는 유전자의 취득에 있어서 이하의 방법을 채용하였다.

씨. 크레센투스(C. crescentus)의 게놈은 약 4Mb이며, 5개의 유전자가 오페론 구조를 이루고 있다(Journal of Bacteriology, 189: 2181-2185, 2007). 씨. 크레센투스(C. crescentus)에서, 게놈 공개 균주(CB-15(ATCC19089). ATCC로부터 입수 가능)로부터 게놈을 추출하고, 각 유전자의 클로닝과 발현 벡터 구축을 시험해 보았다.

클론테크 인-퓨전 클로닝 키트(Clontech In-Fusion Cloning Kit)를 이용하여 발현 벡터의 구축을 실시하였다.

이하 4개의 DNA 단편을 i), ii), iii)에 대해서는 씨. 크레센투스(C. crescentus) CB-15(ATCC19089)의 염색체 DNA를 주형으로서, iv)에 대해서는 pMW119를 주형으로서, PCR로 증폭시켰다. 괄호 안은 PCR에 사용한 프라이머를 나타낸다.

i) tac 프로모터 서열(이하, 「Ptac」라고 기재한다)(PtwvPtacf: 서열번호 1, 0823Ptacr: 서열번호 2)

ii) xylX, ccrxylA, ccrxylB, 및 xylC를 포함하는 단편(Ptac0823f: 서열번호 3, 0819r: 서열번호 4)

iii) xylD와 이의 하류 약 120bp 영역(0819f: 서열번호 5, 219cc0819r: 서열번호 6)

iv) pMW119/SmaI(219f: 서열번호 7, 219r: 서열번호 8)

계속해서, 정제한 i), ii)의 PCR 산물을 주형으로 하고, PtwvPtacf 및 0819r을 프라이머로 하여 이들 PCR 산물이 결합한 단편 Ptac_xylXccrAccrBC를 PCR로 증폭시켰다. 수득된 Ptac_xylXccrAccrBC와, 상기 iii) 및 iv)의 PCR 산물의 3가지를, 클론테크 인-퓨전 클로닝 키트(Clontech In-Fusion Cloning Kit)를 사용하여 인-퓨전(In-Fusion) 반응하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체로부터 목적의 플라스미드 pMW119Ptac_ccrNXA를 취득하였다.

다음에, pMW119Ptac_ccrNXA를 주형에, PtwvPtacf 및 219CC0819r를 프라이머로 하여 Ptac을 포함하는 ccrNXA 오페론을 증폭시켰다. 수득된 증폭 산물과, SmaI로 소화(消化)한 pTWV228을 인-퓨전(In-Fusion) 반응하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체로부터 목적의 플라스미드 pTWV228Ptac_ccrNXA를 취득하였다.

(2) pUT399에 카나마이신 내성 Mini-Mu를 탑재한 플라스미드 pUT-MuKm의 구축

pUT399는 R6K의 복제 기점을 갖고, 접합 전달에 필요한 mob 영역을 포함하고 있고, pir 유전자를 갖지 않는 균주에서는 복제할 수 없는 플라스미드이다(Biomedal사에서 입수 가능: R. Simon., et al., BIO/TECHNOLOGY NOVEMBER 1983, 784-791 참조, 미국 특허 제7090998호).

pCE1134(일본 공개특허 특개평2-109985호 공보)는 MudII1734를 포함하는 플라스미드이며, Mini-Mu 유닛 내에 Km 내성 유전자와 lacXYZ 유전자를 탑재하고 있다. 이하의 방법에 의해, pCE1134의 Mini-Mu 유닛 내에서 lacXYZ 영역을 결실한 DNA 단편을 조제하여, pUT399에 클로닝하였다.

pCE1134를 주형으로서, 프라이머 attL-F(서열번호 9)와 nptII-R(서열번호 10)을 사용하여, left end와 트랜스포사제를 코드화하는 MuAB 유전자의 리프레서인 MuCts, Km 내성 유전자를 포함하는 단편을 PCR에 의해 취득하였다. 또한, 마찬가지로 pCE1134를 주형으로서, 프라이머 attR-F(서열번호 11)와 attR-R(서열번호 12)을 사용하여 right end를 포함하는 단편을 취득하였다. 이들 2단편을 주형으로서, 프라이머 attL-F와 attR-R를 사용하여 크로스 오버 PCR(cross over PCR)을 실시하고, 수득된 약 2.3kb의 단편을 pUT399의 SmaI 사이트에 도입하였다. 이렇게 하여 플라스미드 pUT-MuKm을 수득하였다.

상기와 같이 하여 구축한 Mini-Mu 유닛은, 전이 유닛 내에 Km 내성 유전자와 클로닝 사이트로서 8염기 인식의 NotI 사이트를 갖기 때문에, 각종 유전자가 클로닝 가능하다.

(3) pTWV228Ptac_ccrNXA의 약제 내성 유전자의 치환

pTWV228Ptac_ccrNXA의 암피실린 내성 유전자를 λRed법에 의해 카나마이신 내성 유전자로 치환하였다.

pUT_MuKm을 주형으로서, 프라이머 Ap-Km-fw(서열번호 13)와 Ap-Km-rv(서열번호 14)를 사용하여, 카나마이신 내성 유전자를 포함하는 서열(ntpII 단편)을 증폭시켰다.

PCR 반응은 프라임스타 HS 폴리머라제(PrimeSTAR HS polymerase)(다카라바이오)를 사용하고, 이 효소에 부속의 프로토콜에 따라 실시하였다.

pTWV228Ptac_ccrNXA를 갖는 이. 콜라이(E. coli) JM109에, 헬퍼 플라스미드인 RSF_Red_TER(US20090286290A1, WO2008/075483)를 도입하고, 50ml LB(1mM IPTG, 100mg/L 암피실린, 25mg/L 클로람페니콜을 포함한다) 배지에서 37℃로 OD660값이 0.4가 될 때까지 배양하였다.

상기 RSF_Red_TER은 λ-의존적 인테그레이션(Red-driven integration)을 일으키기(λRed법) 위한 헬퍼 플라스미드이며, lacI 유전자에 의해 λ의 gam, bet 및 exo의 각 유전자의 발현을 유도할 수 있다. 또한, 이 플라스미드는 레반스크라제 유전자(sacB)를 포함하고 있고, 이 유전자에 의해, 슈크로스를 포함하는 배지에서 세포로부터 플라스미드를 탈락시킬 수 있다. 또한, 클로람페니콜 내성 유전자를 포함하고 있다.

상기한 바와 같이 하여 배양한 균체를 집균한 후, 10% 글리세롤 용액으로 2회 원심 세정하고, 1mL 10% 글리세롤 용액에 현탁하였다. 그 후에 상기에서 수득된 ntpII 단편으로 일렉트로포레이션법에 의해 형질 전환하고, 40mg/L의 카나마이신을 포함한 LB 한천 배지에서 형질 전환체를 선발하였다. 수득된 형질 전환체를 LB(1mM IPTG, 10% 슈크로스, 40mg/L 카나마이신을 포함한다) 한천 배지에 식종계대하고, 37℃에서 하룻밤 배양하여 단일 클론을 취득하였다. 수득된 형질 전환체가 100mg/L인 암피실린을 포함한 LB 한천 배지 상에서 생육 불가능한 것을 확인하고, pTWV228Ptac_ccrNXA의 암피실린 내성 유전자가 카나마이신 내성 유전자로 치환된 것을 확인하였다. 수득된 플라스미드를 pTWVPtac_ccrNXA_Km으로 하였다.

(4) xylD를 포함하는 플라스미드의 구축

클론테크 인-퓨전 클로닝 키트(Clontech In-Fusion Cloning Kit)를 이용하여 구축을 실시하였다.

우선, 각각의 유전자를 pUC18에 클로닝한 플라스미드를 주형으로 하고, xylD_IFS_5742-10-5(서열번호 15)와 xylD_IFS_5742-10-6(서열번호 16)을 프라이머로 하여 xylD를 포함하는 DNA 단편을 PCR로 증폭시켰다. 구체적으로는 이하의 방법으로 SfiI 사이트를 제거한 pUC18에 클로닝하였다.

씨. 크레센투스(C. crescentus) CB-15주의 게놈 DNA를 주형으로 하고, CC0819-01F_4691-88-7 (서열번호 17) 및 CC0819-01R_5659-9-1(서열번호 18), 및 CC0819-02F_5659-9-2(서열번호 19) 및 CC0819-02R_4691-88-10(서열번호 20)을 프라이머로 하는 PCR에 의해, 각각 1130 bp 및 653 bp의 단편을 증폭시켰다. 계속해서, 인비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345, 2009)으로, SmaI로 소화한 pUC18과, 상기 2개의 증폭 단편을 어셈블함으로써 SfiI 사이트가 제거되어, xylD 유전자가 삽입된 pUC18-xylD를 수득하였다.

한편, pSTV28-Ptac-Ttrp을 상법에 따라 SmaI로 소화하였다. xylD 유전자의 DNA 단편과 벡터 DNA 단편을 인-퓨전(In-Fusion) 반응하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체로부터 목적의 플라스미드, pSTVPtac_xylD_Ttrp을 취득하였다.

pSTV28-Ptac-Ttrp은 이하와 같이 하여 구축하였다.

서열번호 32의 서열을 갖는 tac 프로모터 및 trp 터미네이터의 서열을 갖는 DNA 단편(PtacTtrp)을 합성하고, pMW219 벡터의 KpnI-BamHI 사이에 연결함으로써 pMW219-Ptac-Ttrp을 수득하였다. KpnI 및 BamHI로 각각 소화한 pSTV28과 pMW219-Ptac-Ttrp을 등량 혼합하고, 라이게이션 반응 후 JM109를 형질 전환하여, Cm 내성이 나타난 콜로니로부터 플라스미드를 추출하였다. 수득된 플라스미드에 대하여, KpnI와 BamHI에 의한 더블 다이제스쳔(double digestion)에 의해 상정되는 단편 길이 약 400bp와 3 kb(정확하게는 389bp와 2994bp)에 1개씩 밴드가 있는 것을 확인하고, pSTV28-Ptac-Ttrp을 수득하였다.

(4) NXA 경로가 도입된 판토에아·아나나티스에 의한 L-글루탐산 생산

상기 pTWVPtac_ccrNXA_Km으로, 일렉트로포레이션법(미국 특허 6682912호 참조)에 의해 피. 아나나티스(P. ananatis) NA1주를 형질 전환하였다. pTWVPtac_ccrNXA_Km을 도입한 주는 LBGM9에 카나마이신을 최종 농도 40mg/L이 되도록 첨가한 플레이트 배지를 사용하였다.

약제를 첨가한 LBGM9 플레이트에, 34℃에서 하룻밤 배양한 피. 아나나티스(P. ananatis) NA1주, 및 각 형질 전환주의 균체를 1/6 플레이트만큼 긁어내어, MSII-Xylose, 또는 MSII-GX 배지 5ml를 포함한 큰 시험관에 식균하고, 34℃, 120rpm에서 48시간 배양하여, 잔당, L-글루탐산(Glu) 및 크실론산의 축적량을 측정하였다. 결과를 표 2, 표 3에 나타낸다.

피. 아나나티스(P. ananatis) NA1주를 글루코스와 크실로스의 혼합 탄소원(MSII-GX 배지)으로 배양하였을 때에는 글루탐산 수율은 25.7%이었다(표 2). 이 때, 크실론산의 축적이 관찰되고, 크실로스는 대부분 크실론산으로 변환되는 것이 시사되었다. 피. 아나나티스(P. ananatis) NA1주에서 크실론산의 축적이 관찰된 것은 피. 아나나티스(P. ananatis)의 글루코스데히드로게나제의 활성에 의한 것이라고 추측된다.

한편, 피. 아나나티스(P. ananatis) NA1주에 pTWVPtac_ccrNXA_Km을 도입한 주에서는, 글루코스와 크실로스의 혼합 탄소원(MSII-GX 배지)에서 배양하였을 때에, 친주와 비교하여 매우 높은 글루탐산 수율을 나타내었다(수율 69.9%). 친주에 있어서, 크실로스로부터 글루탐산이 거의 생성되지 않은 것을 고려하여, pTWVPtac_ccrNXA_Km 도입주의 글루코스로부터의 글루탐산 수율이 친주와 동등하다고 가정하면, 크실로스로부터 NXA 경로를 통한 글루탐산 수율은 86% 정도라고 어림잡을 수 있다. 실제로, 크실로스를 단일 탄소원으로서 배양하였을 때에는 (MSII-Xylose), pTWVPtac_ccrNXA_Km 도입주는 수율 80%로 Glu를 생성하였다(표 3).

〔실시예 2〕에스케리키아·콜라이로의 NXA 경로의 도입

(1) 이. 콜라이(E. coli)에서의 NXA 경로 발현

TCA 사이클 중의 효소이고, 이소시트르산으로부터 αKG를 생성하는 이소시트르산데히드로게나제의 결손주(Δicd)를 사용하여, 크실로스를 단일 탄소원으로 한 최소 배지에서의 생육 상보에 의한 NXA 경로의 발현을 시험하였다. icd 유전자 결손주는 αKG를 생성할 수 없기 때문에 크실로스를 단일 탄소원으로 한 최소 배지에서는 생육할 수 없지만, NXA 경로의 도입에 의해 크실로스로부터 αKG를 생성할 수 있으면, 이 배지에서 생육 가능하다.

구체적으로는 케이오 콜렉션(Keio Collection)주의 icd 유전자 결손주인 JW1122주(http://cgsc.biology.yale.edu/Person.php?ID=99553, E. coli Genetic Resource Center at Yale CGSC, The Coli Genetic Stock Center로부터 입수 가능)를 숙주 균주로 하고, 플라스미드에 의해 NXA 경로를 도입, 발현시킴으로써 NXA 경로가 이. 콜라이(E. coli)에서도 기능할 수 있는지 여부를 검토하였다.

표 4에 구축한 플라스미드와 icd 유전자 결손주에서의 생육 상보의 결과를 기재하였다. 씨. 크레센투스(C. crescentus) 유래의 NXA 경로 오페론(xylX, ccrxylA, ccrxylB, xylC, xylD)과 tac프로모터(tacpromoter)를 조합한 플라스미드 pMW119Ptac_ccrNXA(실시예 1에서 작제)를 도입한 균주가, 크실로스를 단일 탄소원으로 한 M9 최소 배지(플레이트)(Sambrook, J. et al., Molecular Cloning, Cold Spring Harbor Laboratory Press (1989))에서 생육하는 것을 확인하였다.

같은 검토를 액체 배양에서도 실시하였다. 36련(連) 배양 장치를 사용하고, 경시적으로 크실로스 또는 αKG를 단일 탄소원으로서 포함하는 M9 최소 배지 및 E1 합성 배지에서의 생육(O.D.)을 측정하였다. 결과를 도 1에 도시하였다. 플레이트에서의 배양과 마찬가지로, 벡터 컨트롤주가 크실로스 단일 탄소원의 M9나 E1 배지에서 생육되지 않는 것에 반해, NXA 경로 도입주에서는 양호하게 생육되었다. 이들 결과는 본 균주가 크실로스를 NXA 경로 유래로 자화함으로써 생육된 것, 즉, 씨. 크레센투스(C. crescentus) 유래 NXA 경로가 이. 콜라이(E. coli)에서도 기능한 것이라고 생각되었다.

(2) 이. 콜라이(E. coli) L-글루탐산 생산주에서의 NXA 경로 발현

이. 콜라이(E. coli) L-글루탐산 생산균주로서 αKGDH 결손주인 MG1655ΔsucA(미국 특허출원공개 제20050106688호)를 사용하였다. 이 균주에, pMW119Ptac_ccrNXA 또는 컨트롤로서 pMW119를 도입하여, MG1655ΔsucA/pMW119Ptac_ccrNXA 및 MG1655ΔsucA/pMW119를 수득하였다. 이들 균주를 탄소원으로서 글루코스(40g/L), 크실로스(40g/L), 또는 글루코스 및 크실로스(각 20g/L)를 첨가한 MS 배지에서 플라스크 배양하였다. 탄소원으로서 글루코스만을 포함하는 배지에서는 24시간, 다른 배지에서는 48시간 배양하였다. 결과를 도 2에 도시하였다. 도면에 기재된 균주명에 붙인 325, 425 및 513은 클론 번호를 나타낸다.

탄소원을 글루코스 및 크실로스의 혼합계로 하였을 경우, 컨트롤 균주(MG1655ΔsucA/pMW119)가 L-글루탐산을 15 내지 16g/L 축적하는 것에 반해, ccrNXA 오페론 발현주(MG1655ΔsucA/pMW119Ptac_ccrNXA)에서의 L-글루탐산 축적은 12g/L 전후가 되고, L-글루탐산의 축적, 수율은 저하되는 경향을 보였다. 탄소원으로서 크실로스 단독의 경우도 같았다. 부생물에 대하여, 유기산류 및 크실론산에 대하여 분석하였다. 그 결과, 주로 아세트산과 크실론산이 축적되는 것을 알 수 있었다.

(3) 이. 콜라이(E. coli)에서의 NXA 경로의 율속점(律速点) 해석

상기한 바와 같이, 이. 콜라이(E. coli) L-글루탐산 생산주에서는 ccrNXA 오페론 발현주의 배양 상청액 중에 NXA 경로의 중간체인 크실론산이 검출된 사실로부터, 흡수된 크실로스의 일부가 NXA 경로를 경유할 가능성이 높다고 생각되었다. 또한, 이하의 과제가 추측되었다.

i) 균체 내에 흡수된 크실로스는 이. 콜라이(E. coli) 고유의 크실로스 자화계와 NXA 경로 양쪽이 이용 가능하지만, 고유계 최초의 효소인 크실로스 이소머라제(XylA)와 NXA 경로 최초의 효소인 크실로스데히드로게나제(XDH)의 활성 또는 기질 특이성의 차이로, 일정량이 고유계에 이용되고, NXA 경로를 경유하는 대사 플럭스의 유량이 적다고 하는 가능성.

ii) NXA 경로 상에 율속점 또는 미분류의 바이패스 경로가 있고, αKG가 생성되지 않을 가능성.

i)에 대하여는, ccrNXA 오페론 발현 벡터를 저카피형(pMW119)에서 중카피형(pTWV228)으로 변경함으로써 NXA 경로의 각 효소량을 증가시키고, NXA 경로로의 기질의 인입량을 증가시킴으로써 개선할 수 있는 가능성이 생각되었다.

ii)에 대하여는, 율속점의 해석과 그 결과를 기초로 한 육종 개량을 실시함으로써 개선할 수 있는 가능성이 고려되었다.

이상의 사실로부터,

a) 이. 콜라이(E. coli) 고유 크실로스 자화 경로 결손주(ΔsucAΔxylA)를 숙주로 하고, 또한 ccrNXA 오페론을 발현시켜 강제적으로 탄소 플럭스가 NXA 경로를 경유하는 균주의 구축과 배양 평가, 및 b) 중카피형 벡터를 사용한 ccrNXA 오페론 발현 벡터의 구축과 그 발현 벡터를 사용한 균주의 구축 및 배양 평가, 및 c) 율속점의 해석을 실시하였다.

프라이머 xylA-H1P1-5742-5-1(서열번호 21) 및 xylA-H2P2-5742-5-2(서열번호 22)를 사용하여 MG1655ΔsucA로부터, λ-Red법에 의해 이. 콜라이(E. coli) 고유 크실로스 자화 유전자 xylA를 결손시켜 MG1655ΔsucAΔxylA주를 수득하였다. 이 균주에 pMW119Ptac_ccrNXA를 도입하여 xylA를 결손한 ccrNXA 오페론 발현주를 수득하였다.

도 3에, xylA를 결손한 ccrNXA 오페론 발현주를 (3)과 동일하게 하여 배양하였을 때의 L-글루탐산 배양 결과를 도시하였다. 도 3 중, 「ccrNXA」는 pMW119Ptac_ccrNXA를 나타내고, 거기에 계속되는 숫자는 클론 번호를 나타낸다.

ΔsucAΔxylA주의 벡터 컨트롤주가 크실로스를 자화할 수 없고, 글루코스로부터만 균체 형성과 L-글루탐산 생산을 할 수 있는 것에 반해, ccrNXA 오페론 발현주에서는, 크실로스의 소비와 크실로스 유래라고 생각되는 L-글루탐산 생산이 보였다. 한편, L-글루탐산 축적량은 모델 균주(ΔsucA주)에는 미치지 않는 것, 및 NXA 경로의 대사 중간체인 크실론산이 축적되는 것을 알 수 있었다. 이 결과로부터, NXA 경로 전체의 대사 플럭스량이 부족할 가능성이 시사되었다. 또한, αKG의 부생이 보이지 않은 사실로부터, GDH의 활성 발현에 필요한 NADPH의 공급은 이 단계에서는 문제가 되지 않고 있는 것을 생각할 수 있었다.

계속해서, 중카피형 벡터를 사용하여 ccrNXA 오페론 발현 벡터를 구축하였다. pMW119Ptac_ccrNXA를 주형으로 하고, PtwvPtacf(서열번호 1)와 0819r(서열번호 4)을 프라이머로 하여, tac 프로모터 영역을 포함하는 ccrNXA 오페론을 증폭시켰다. pTWV228을 SmaI로 소화하고, tac 프로모터 영역을 포함하는 ccrNXA 오페론의 PCR 단편과 함께 인-퓨전(In-Fusion) 반응을 실시하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체로부터 목적의 플라스미드 pTWVPtac_ccrNXA를 취득하였다. 이 플라스미드를 MG1655ΔsucA주에 도입하고, 수득된 주를 (3)과 같이 하여 배양을 실시하였다. 결과를 도 4에 도시하였다. 도면 중, 「ΔsucA」는 MG1655ΔsucA주를, 「/pTWV」 및 「/v」는 pTWV228을 유지하고 있는 것을 각각 나타낸다. 또한, pTWV110 내지 pTWV119는 pTWV228Ptac_ccrNXA의 클론 번호를 나타낸다.

글루코스만을 탄소원으로 하였을 경우에는, 중카피형 ccrNXA 오페론 발현주는 컨트롤주와 거의 동등한 L-글루탐산을 축적한 한편, 글루코스 및 크실로스의 혼합 배양계에서는 L-글루탐산 축적은 오히려 저하되는 경향을 보였다. 또한, 형제주 사이에서의 성적에도 편차가 보였다. 고려되는 이유의 하나로 중카피형 발현 벡터의 탈락을 생각할 수 있었다. 또한, 지금까지의 균주와 마찬가지로 크실론산의 축적이 관찰되었다.

ccrNXA 오페론의 카피수 증가에 의해, NXA 경로의 각 효소의 활성이 증가하는지를 확인하기 위해서, NXA 경로의 최초의 효소인 XDH 활성을 측정하였다. 결과를 표 5에 기재하였다. 표 5에 기재된 균주의 「7513」 및 「1110」은 각각 클론 번호를 나타낸다.

중카피 발현 벡터 도입주에서는 저카피 발현 벡터 도입주에 비해 XDH 활성이 약 7배로 상승하였다. 이. 콜라이(E. coli) 고유의 크실로스 이소머라제(XylA)와 XDH의 분기점에서 실제의 균체 내에서 어떻게 크실로스가 분배되는지에 대해서는 확인할 수 없고, 여전히 NXA 경로의 최초 효소인 XDH 활성이 부족할 가능성도 생각되었다. 그러나, XDH 활성이 상승하여도 L-글루탐산 축적 향상 등의 효과를 찾아낼 수 없는 점이나, 크실론산의 축적 등으로 NXA 경로 중 어느 하나 또는 복수의 효소가 율속이 될 가능성이 생각되었다.

그래서, NXA 경로의 율속점에 대한 해석을 실시하였다. 대사 중간체로서 크실론산이 축적된 점에서, 적어도 크실로스로부터 크실론산에 이르기까지의 대사 경로보다도, 크실론산으로부터 αKG에 이르는 경로에 율속점이 있다고 생각하였다. 또한, ccrNXA 오페론의 구조상, 크실로스로부터 크실론산에 이르는 경로는 오페론의 3번째와 4번째에 위치하는 유전자에 의해 코드화되어 있는 것에 반해, 크실론산으로부터 αKG에 이르는 경로는 오페론의 1번째, 2번째, 5번째에 위치하는 유전자에 의해 코드화되어 있다. XDH는 오페론의 3번째에 위치하고, 그 활성은 인 비트로(in vitro)에서 검출할 수 있지만, 오페론의 5번째에 위치하는 유전자에 의해 코드화되는 효소(XylD)의 활성을 검출할 수 있으면, NXA 오페론 전체가 전사, 번역되어 있는 것의 방증도 된다고 생각하였다. 그래서, 크실론산으로부터 αKG에 이르는 3개의 반응 중 어느 하나가 율속점이라고 추측하고, 이하와 같은 실험을 실시하였다.

xylD, xylX 및 ccrxylA 유전자를 각각 단독 발현하는 플라스미드 pSTVPtac_xylD_Ttrp, pSTVPtac_xylX_Ttrp, 및 pSTVPtac_ccrxylA_Ttrp을 이하와 같이 하여 작제하였다.

pSTV28-Ptac-xylX-Ttrp은 SfiI 사이트를 제외한 xylX를 pUC18에 클로닝한 플라스미드인 pUC18-xylX를 주형으로 하고, xylX-IFS-5742-10-1(서열번호 38) 및xylX-IFA-5742-10-2(서열번호 39)를 프라이머에 사용한 PCR에 의해 xylX 단편을 작제하고, SmaI로 소화한 pSTV28-Ptac-Ttrp에 인-퓨전 클로닝(in-fusion cloning)법으로 클로닝함으로써 작제하였다.

pSTV28-Ptac-ccrxylA-Ttrp은 SfiI 사이트를 제외한 ccrxylA를 pUC18에 클로닝한 플라스미드인 pUC18-ccrxylA를 주형으로 하고, xylA_IFS_5742-10-3(서열번호 40) 및 xylA_IFA_5742-10-4(서열번호 41)를 프라이머에 사용한 PCR에 의해 ccrxylA 단편을 작제하고, SmaI로 소화한 pSTV28-Ptac-Ttrp에 인-퓨전 클로닝(in-fusion cloning)법으로 클로닝함으로써 작제하였다.

STV28-Ptac-xylD-Ttrp은 SfiI 사이트를 제외한 xylD를 pUC18에 클로닝한 플라스미드인 pUC18-xylD를 주형으로 하고, xylD_IFS_5742-10-5(서열번호 42), xylD_IFA_5742-10-6(서열번호 43)을 프라이머에 사용한 PCR에 의해 xylD 단편을 작제하고, SmaI로 소화한 pSTV28-Ptac-Ttrp에 인-퓨전 클로닝(in-fusion cloning)법으로 클로닝함으로써 작제하였다.

상기 플라스미드 pUC18-xylX, pUC18-ccrxylA, pUC18-xylD는 각각 이하와 같이 하여 작제하였다.

씨. 크레센투스(C. crescentus) CB-15주의 게놈 DNA를 주형으로 하고, CC0823-01F_4691-87-1 (서열번호 44) 및 CC0823-01R_4691-87-2(서열번호 45), 및 CC0823-02F_4691-87-3(서열번호 46) 및 CC0823-02R_4691-87-4(서열번호 47)를 프라이머로 하는 PCR에 의해 각각 900bp 및 280bp의 단편을 증폭시켰다. 계속해서, 인 비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345, 2009)으로, SmaI로 소화한 pUC18과, 상기 2개의 증폭 단편을 어셈블함으로써 SfiI 사이트가 제거되어, xylX 유전자가 삽입된 pUC18-xylX를 수득하였다.

씨. 크레센투스(C. crescentus) CB-15주의 게놈 DNA를 주형으로 하고, CC0822-01F_4691-87-5 (서열번호 48) 및 CC 480822-01R_5659-8-7(서열번호 49), CC0822-02F_5659-8-8(서열번호 50) 및 CC0822-02R_5659-8-9(서열번호 51), CC0822-03F_5659-8-10(서열번호 52) 및 CC0822-03R_5659-8-11(서열번호 53), CC0822-04F_5659-8-12(서열번호 54) 및 CC0822-04R_5659-8-13(서열번호 55), 및 CC0822-05F_5659-8-14(서열번호 56) 및 CC0822-05R_4691-87-14(서열번호 57)를 프라이머로 하는 PCR에 의해, 각각 11v02(175 bp), 12v02(325 bp), 13v02(260 bp), 14v02(193 bp) 및 15v02(544 bp)의 5개의 단편을 증폭시켰다. 다음에, 11v02 및 12v02의 2단편을 주형으로 하고, CC0822-01F_4691-87-5 및 CC0822-02R_5659-8-9를 프라이머로 하는 크로스오버 PCR에 의해 이들 2단편을 연결하였다. 마찬가지로, 13v02 및 14v02의 2단편을 주형으로 하고, CC0822-03F_5659-8-12 및 CC0822-04R_5659-8-13을 프라이머로 하는 크로스오버 PCR에 의해 이들 2단편을 연결하였다. 이들 2단편과, 상기 15v02 단편을 인 비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345,2009)으로 연결하였다. 수득된 연결 단편을 주형으로 하고, CC0822-01F_4691-87-5 및 CC0822-05R_4691-87-14를 프라이머에 사용한 PCR에 의해 연결 단편을 증폭시켰다. 계속해서, 인 비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345, 2009)으로, SmaI로 소화한 pUC18과, 상기 연결 단편을 어셈블함으로써 SfiI 사이트가 제거되어, ccrxylA 유전자가 삽입된 pUC18-ccrxylA를 수득하였다.

씨. 크레센투스(C. crescentus) CB-15주의 게놈 DNA를 주형으로 하고, CC0819-01F_4691-88-7 (서열번호 17) 및 CC0819-01R_5659-9-1(서열번호 18), 및 CC0819-02F_5659-9-2(서열번호 19) 및 CC0819-02R_4691-88-10(서열번호 20)을 프라이머로 하는 PCR에 의해 각각 1130bp 및 653bp의 단편을 증폭시켰다. 계속해서, 인 비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345, 2009)으로, SmaI로 소화한 pUC18과, 상기 2개의 증폭 단편을 어셈블함으로써 SfiI 사이트가 제거되어, xylD 유전자가 삽입된 pUC18-xylD를 수득하였다.

ccrNXA 오페론 발현주(MG1655ΔsucA/pTWV228Ptac_ccrNXA)와, 상기 xylD, xylX, ccrxylA 유전자를 각각 단독 발현하는 플라스미드를 유지하는 주(MG1655ΔsucA/pSTVPtac_xylD_Ttrp, MG1655ΔsucA/pSTVPtac_xylX_Ttrp 및 MG1655ΔsucA/pSTVPtac_ccrxylA_Ttrp)로부터 조효소(粗酵素) 추출액을 조제하고, ccrNXA 오페론 발현주 유래의 조효소 추출액에 벡터 유지주, 또는 xylD, xylX, ccrxylA의 각 유전자의 단독 발현주 유래의 조효소 추출액을 각각 첨가하여, 크실론산으로부터의 αKG 생성 활성을 측정하였다. 결과를 표 6에 기재하였다. 표 6 중, 균주명에 붙인 「1110」은 클론 번호를 나타낸다.

xylD 유전자 단독 발현주의 조효소 추출액을 첨가한 계에 있어서, αKG 생성 활성의 상승이 관찰되었다. 이 결과로, xyld 유전자가 코드화하는 크실로네이트데히드라타제(XylD)가 이. 콜라이(E. coli)로 이종 발현에 의해 구축한 NXA 경로 상의 율속점일 가능성이 시사되었다.

효소 활성의 측정으로부터, ccrNXA 오페론 발현주에서, xyld 유전자의 발현을 더욱 강화함으로써 경로 전체의 대사 플럭스가 개선될 가능성이 있는 사실로부터, xyld 유전자 발현 벡터를 ccrNXA 오페론 발현주에 도입함으로써 xyld 유전자 발현 강화주를 구축하고, 글루코스 및 크실로스를 탄소원으로 한 L-글루탐산 생산 배양 평가를 실시하였다. ccrNXA 오페론 발현주로서는 MG1655ΔsucA/pMW119Ptac_ccrNXA와 MG1655ΔsucA/pTWV228Ptac_ccrNXA를 사용하였다.

배양은 (3)과 동일하게 하여 실시하였다.

결과를 표 7에 나타낸다. xylD 유전자 발현 강화주에서 L-글루탐산 축적 및 수율이 대폭 향상되고, L-글루탐산 축적은 컨트롤주 15 내지 16g/L에 대하여 23 내지 25g/L, 대(對) 소비당(糖) 수율은 컨트롤주 37 내지 40%에 대하여 57 내지 60%에 달하였다. 또한, 대사 중간체인 크실론산은 xyld 유전자 발현 강화주에서는 보이지 않았다. 한편, xyld 유전자 발현 강화의 효과는 중카피형의 ccrNXA 오페론 발현 벡터를 탑재한 발현주에서만 보이고, 저카피형 벡터에 의한 발현주에서는 보이지 않았다. 이들 결과로부터, 벡터의 카피수 증가에 의한 NXA 경로 전체의 활성 증가와 xyld 유전자 발현 재강화에 의한 본 경로의 율속점의 해소가, L-글루탐산 생성량의 향상에 관련되었다고 생각되었다. 또한, xyld 유전자 발현 강화주의 크실론산으로부터의 αKG 생성 활성을 측정한 바, 강화 전에 비해 약 10배 상승하였다(표 8). 표 7, 표 8에 기재된 균주명에 붙여진 「1110」, 「17」, 「19」는 각각 클론 번호를 나타낸다.

〔실시예 3〕코리네박테리움·글루타미쿰에 대한 NXA 경로의 도입

(1) NXA 경로 도입용 플라스미드 pVK9Peftu_ccrNXA의 구축

신장 인자 Tu(EF-Tu) 유전자 tuf의 프로모터 서열(WO2008114721, 서열번호 33, 이하, 「Peftu」라고 기재한다)의 하류에 xylD를 연결한 서열을 갖는 플라스미드를, 클론테크 인-퓨전 클로닝 HD 키트(Clontech In-Fusion Cloning HD Kit)(Clontech사)를 이용하여 구축하였다. 우선, 씨. 글루타미쿰(C. glutamicum) ATCC13869주의 염색체 DNA를 주형으로, 프라이머Peftu(Pst)(서열번호 58)와 Peftu_Rv(서열번호 59)를 사용하여 PCR을 실시하여 Peftu 서열을 포함하는 단편을 수득하였다. PCR 반응은 프라임스타 HS 폴리머라제(PrimeSTAR HS polymerase)를 사용하고, 이 효소에 부속의 프로토콜에 따라 실시하였다.

또한, pTWV228Ptac_ccrNXA를 주형으로서, 프라이머 Peftu_xylXABCD_fw(서열번호 60)와 Peftu_xylXABCD_rv(서열번호 61)를 사용하여 PCR를 실시하여, 씨. 크레센투스(C. crescentus)의 xylXABCD 서열을 포함하는 단편을 수득하였다. PCR 반응에는 프라임스타 GXL 폴리머라제(PrimeSTAR GXL polymerase)를 사용하고, 이 효소에 부속의 프로토콜에 따라 PCR 반응을 실시하였다.

계속해서, 상기에서 수득된 Peftu 단편과 xylXABCD를 포함하는 단편을, PstI와 BamHI로 처리한 pVK9와 혼합하여, 클론테크 인-퓨전 HD 클로닝 키트(Clontech In-fusion HD Cloning Kit)의 프로토콜에 따라 인-퓨전(in-fusion) 반응을 실시하였다. pVK9는, pHSG299(다카라바이오)의 AvaII 부위를 평활 말단화하고, pHK4(일본 공개특허 특개평05-007491)에 포함되는 코리네형 세균 내에서 자율 복제 가능한 영역을 BamHI 및 KpnI로 잘라 평활 말단화된 단편을 삽입한 셔틀 벡터이다(일본 공개특허 특개2007-97573호, 미국 특허출원공개 20050196846호). 상기 인-퓨전(in-fusion) 반응액으로 이. 콜라이(E. coli) JM109를 형질 전환하였다. 형질 전환체는 LB 배지에 카나마이신을 최종 농도 50mg/L이 되도록 첨가한 한천 배지에서 선발하였다. 수득된 형질 전환체로부터 목적의 플라스미드 pVK9Peftu_ccrNXA를 취득하였다.

(2) NXA 경로가 도입된 코리네박테리움·글루타미쿰에 의한 L-글루탐산 생산

상기 pVK9Peftu_ccrNXA로, 전기 펄스법(일본 공개특허 특개평2-207791)에 의해 씨. 글루타미쿰(C. glutamicum) ATCC13869주를 형질 전환하였다. pVK9Peftu_ccrNXA를 도입한 주는, CM-Dex 배지에 카나마이신을 최종 농도 25mg/L이 되도록 첨가한 한천 배지를 사용하여 선발하였다. 또한, 대조주로서 pVK9로 씨. 글루타미쿰(C. glutamicum) ATCC13869주를 형질 전환한 주도 같은 방법에 의해 선발하였다.

수득된 형질 전환주의 크실로스 자화 능력 및 L-글루탐산 생산능을, 사카구치(坂口) 플라스크를 사용한 배양을 실시함으로써 검증하였다. 카나마이신을 최종 농도 25mg/L이 되도록 첨가한 CM-Dex 한천 배지에서, 31.5℃에서 하루 낮밤 배양한 형질 전환주의 균체를 1/6 플레이트 만큼 긁어내어, Glc 배지 20ml를 포함하는 사카구치 플라스크에 식균하고, 미리 건열 멸균해 둔 탄산칼슘 1g을 첨가한 후, 31.5℃, 120rpm에서 24시간 진탕 배양하였다. 수득된 배양액 1ml를, Xyl 배지(비오틴 제한) 20ml를 포함하는 사카구치 플라스크에 식균하고, 미리 건열 멸균해 둔 탄산칼슘 1g을 첨가한 후, 31.5℃, 120 rpm에서 73시간 진탕 배양을 실시하였다. 결과를 표 9에 나타냈다.

씨. 글루타미쿰(C. glutamicum) ATCC13869주에 pVK9를 도입한 주는 Xyl 배지에서 거의 증식하지 않고, L-글루탐산 생산도 관찰되지 않았다. 한편, 씨. 글루타미쿰(C. glutamicum) ATCC13869주에 pVK9Peftu_ccrNXA를 도입한 주는 Xyl 배지에서 증식하고, L-글루탐산을 축적하였다. 이 결과로부터, 코리네형 세균에 NXA 경로를 도입함으로써 크실로스 자화 능력이 향상되고, 또한 크실로스로부터 L-글루탐산이 생성되는 것을 발견하였다.

(3) xyld 유전자 발현 재강화주의 구축

pVK9Peftu_ccrNXA를 유지하는 씨. 글루타미쿰(C. glutamicum) ATCC13869주에서는 크실론산이 축적된 것으로부터, xyld 유전자 산물의 활성이 부족하다는 것이 추찰되었다. 그래서, pVK9Peftu_ccrNXA 플라스미드 상에 xyld 유전자를 1카피 추가로 도입함으로써, xyld 유전자가 재강화된 NXA 경로 발현용 플라스미드를 구축하기로 하였다.

(4) xyld 유전자 발현용 플라스미드 pVS7PmsrA_xylD의 구축

msrA(펩티드 메티오닌 설폭시드 리덕타제 A(peptide methionine sulfoxide reductase A)) 유전자의 프로모터 서열(이하, 「PmsrA」라고 기재한다)의 하류에 씨. 크레센투스(C. crescentus)의 xyld 유전자를 연결한 서열을 갖는 플라스미드를, 클론테크 인-퓨전 클로닝 HD 키트(Clontech In-Fusion Cloning HD Kit)를 이용하여 구축하였다.

우선, 씨. 글루타미쿰(C. glutamicum) ATCC13869주의 염색체 DNA를 주형에, 프라이머PmsrA(Pst)(서열번호 62)와 PmsrAR(서열번호 63)을 사용하여 PCR를 실시하여, PmsrA 서열을 포함하는 단편을 수득하였다. 또한, pTWV228Ptac_ccrNXA를 주형으로서, 프라이머 PmsrA_xylD_fw(서열번호 64)와 Peftu_xylXABCD_rv를 사용하여 PCR를 실시하여, 씨. 크레센투스(C. crescentus)의 xyld 유전자 서열을 포함하는 단편을 수득하였다. PCR 반응은 프라임스타 HS 폴리머라제(PrimeSTAR HS polymerase)를 사용하고, 이 효소에 부속의 프로토콜에 따라 실시하였다.

계속해서, 상기에서 수득된 PmsrA 단편과 xyld 유전자를 포함하는 단편을 PstI와 BamHI로 처리한 셔틀 벡터 pVS7(구축 방법은 이하에 나타낸다)과 혼합하여, 클론테크 인-퓨전 HD 클로닝 키트(Clontech In-fusion HD Cloning Kit)의 프로토콜에 따라 인-퓨전(in-fusion) 반응을 실시한 후, 이 반응액으로 이. 콜라이(E. coli) JM109를 형질 전환하였다. 형질 전환체는 LB 배지에 스펙티노마이신을 최종 농도 25mg/L이 되도록 첨가한 한천 배지에서 선발하였다. 수득된 형질 전환체로부터 목적의 플라스미드 pVS7PmsrA_xylD를 취득하였다.

pVS7은 pVC7(일본 공개특허 특개2000-201692, EP1004671)의 클로람페니콜 내성 유전자가 스펙티노마이신 내성 유전자로 치환된 플라스미드이다. 스펙티노마이신 내성 유전자는 바실러스 제네틱 스톡 센터(BGSC)에서 시판되고 있는 에스케리키아·콜라이 ECE101E주로부터, 플라스미드 pDG1726을 조제하고, 당해 플라스미드로부터 카세트로 취출함으로써 취득할 수 있다. pDG1726을 주형으로서, 프라이머SpcR-F(서열번호 65)와 SpcR-R(서열번호 66)을 사용하여 PCR에 의해 스펙티노마이신 내성 유전자를 증폭시켰다. 수득된 유전자 단편을, SmaI 처리한 pVC7과 혼합하여, 다카라바이오 주식회사의 라이게이션 믹스(Ligation Mix) <마이티 믹스(Mighty Mix)>의 프로토콜에 따라 라이게이션 반응을 실시하고, 이 반응액으로 이. 콜라이(E. coli) JM109를 형질 전환하였다. 형질 전환체는 LB 배지에 스펙티노마이신을 최종 농도 25mg/L가 되도록 첨가한 한천 배지에서 선발하였다. 수득된 형질 전환체로부터 pVC7에 스펙티노마이신 내성 유전자가 삽입된 pVC7-spc를 취득하였다. 또한, pVC7-spc를 주형으로서, 프라이머 spc(GTG start)-F(서열번호 67)와 spc(stop)-R(서열번호 68)을 사용하여 PCR를 실시하여, 스펙티노마이신 내성 유전자를 증폭시켰다.

한편, pVC7을 주형으로서, 프라이머 Spc-pVC7-Cm-F(서열번호 69)와 Spc-pVC7-Cm-R(서열번호 70)를 사용하여 PCR를 실시하여, pVC7로부터 클로람페니콜 내성 유전자가 제거된 DNA 단편을 수득하였다. 당해 DNA 단편과, 상기에서 pVC7-spc으로부터 조제된 스펙티노마이신 내성 유전자의 DNA 단편을 혼합하여, 클론테크 인-퓨전 HD 클로닝 키트(Clontech In-fusion HD Cloning Kit)의 프로토콜에 따라 인-퓨전(in-fusion) 반응을 실시한 후, 이 반응액으로 이. 콜라이(E. coli) JM109를 형질 전환하였다. 형질 전환체는 LB 배지에 스펙티노마이신을 최종 농도 25mg/L가 되도록 첨가한 한천 배지에서 선발하였다. 수득된 형질 전환체로부터 pVS7을 취득하였다.

(5) xyld 유전자 재강화 플라스미드 pVK9Peftu_ccrNXA^+D의 구축

pVS7PmsrA_xylD를 주형으로서, 프라이머 ME_Spc_fw(서열번호 71)와 ME_Peftu_xylXABCD_rv(서열번호 72)를 사용하여, 스펙티노마이신 내성 유전자(Spc)와 PmsrA_xylD를 포함하는 DNA 단편을 증폭시켰다. 수득된 DNA 단편을, 에피센트레(Epicentre)사의 Ez-Tn5^TM 커스텀 트랜스포솜 컨스트럭션 키트(Custom Transposome Construction Kit)의 프로토콜에 따라, 인 비트로(in vitro)에서 pVK9Peftu_ccrNXA에 삽입하여 이. 콜라이(E. coli) DH5α를 형질 전환하였다. 형질 전환체는 카나마이신과 스펙티노마이신을 최종 농도로 각각 50mg/L, 25mg/L이 되도록 첨가한 LB한천 배지에서 선발하였다. 수득된 형질 전환체로부터 플라스미드를 추출하고, 플라스미드 상의 Spc-PmsrA_xylD 서열 주변의 염기서열을 확인함으로써, Spc-PmsrA_xylD 서열의 삽입 개소가 Peftu_ccrNXA 서열 상에서는 없는 것이 확인된 플라스미드를 pVK9Peftu_ccrNXA^+D로 하였다.

(6) xyld 유전자가 재강화된 NXA 경로 도입주의 L-글루탐산 생산

전기 펄스법으로 씨. 글루타미쿰(C. glutamicum) ATCC13869주에 pVK9Peftu_ccrNXA^+D를 도입하고, 카나마이신 25mg/L를 포함하는 CMDex 한천 배지에 도포하였다. 31.5℃에서 배양 후 생육한 주에 대하여, (2)와 같은 방법으로 L-글루탐산 생산능을 검증하였다. 그 결과를 표 10에 나타냈다.

pVK9Peftu_ccrNXA^+D를 유지하는 주에서는, pVK9Peftu_ccrNXA를 유지하는 주와 비교하여 D-크실론산의 축적량이 적고, 한편, 보다 많은 L-글루탐산이 축적되었다. 이로써, xyld 유전자를 재강화함으로써 보다 효율적으로 NXA 경로를 통하여 D-크실로스로부터 L-글루탐산을 생산시킬 수 있는 것이 나타났다.

〔실시예 4〕

(1) NXA 경로 유전자의 대체

이상의 실시예에서는, NXA 경로가 보고되어 있는 공지된 세균 씨. 크레센투스(C. crescentus)의 유전자 xylX, ccrxylA, ccrxylB, xylC, xylD를 이용하여, NXA 경로를 통하여 크실로스로부터 글루탐산을 생성할 수 있는 것을 나타내었다. 이하의 실시예에서는 씨. 크레센투스(C. crescentus) 이외의 생물종으로부터 xylD, xylX, ccrxylA의 호모로그 유전자를 취득하고, 씨. 크레센투스(C. crescentus)의 유전자와 대체 가능한지 여부를 검증하였다. 유전자원으로서 표 11에 나타낸 생물종을 선택하였다. 아울러 각 유전자의 Gene symbol(GenBank)을 나타냈다. 또한, 표 12에 각 유전자의 염기서열 및 이것에 코드화되는 아미노산 서열의 서열표에서의 서열번호를 나타냈다. 표 12 중 「오리지널」은 천연형 유전자의 염기서열을, 「최적화 후」는 이. 콜라이(E. coli)의 코돈 출현 빈도(codon usage)에 맞춰서 코돈을 최적화한 염기서열을 각각 나타낸다.

또한, 이하의 기재에 있어서, xylD, xylX 및 xylA의 각 유전자 호모로그가 코드화하는 효소를 각각 XylD, XylX, XylA라고 기재하는 경우가 있다.

(2) XylD, XylX, XylA 활성 검출용 플라스미드 pTWVPtac_ccrNXA_ΔxylD_Km, pTWVPtac_ccrNXA_ΔxylX_Km, pTWVPtac_ccrNXA_ΔccrxylA_Km의 구축

우선, pTWVPtac_ccrNXA_Km을 주형으로 하고, Ptac_xylXABC_F(서열번호 111)와 Ptac_xylXABC_R(서열번호 112)을 프라이머로 하여, xylD를 제외한 DNA 단편을 PCR로 증폭시켰다. PCR 산물을 클론테크 인-퓨전 HD 클로닝 키트(Clontech In-fusion HD Cloning Kit)의 프로토콜에 따라 인-퓨전(In-Fusion) 반응하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체으로부터 목적의 플라스미드 pTWVPtac_ccrNXA_ΔxylD_Km을 취득하였다.

pTWVPtac_ccrNXA_ΔxylX_Km은 Ptac_xylABCD_F(서열번호 113)와 Ptac_xylABCD_R(서열번호 114)을, pTWVPtac_ccrNXA_ΔccrxylA_Km은 Ptac_xylXBCD_F(서열번호 115)와 Ptac_xylXBCD_R(서열번호 116)을 프라이머로서, 상기와 같은 방법에 의해 구축하였다.

(3) XylD, XylX, XylA 활성 검출용 판토에아·아나나티스의 구축

상기 pTWVPtac_ccrNXA_ΔxylD_Km으로, 일렉트로포레이션법에 의해 피. 아나나티스(P. ananatis) NA1주를 형질 전환하였다. 구축한 주를 피. 아나나티스(P. ananatis) NA2 ΔxylD로 하였다. 피. 아나나티스(P. ananatis) NA2 ΔxylD의 배양에는 LBGM9에 카나마이신을 최종 농도 40mg/L, 테트라사이클린을 최종 농도 12.5 mg/L가 되도록 첨가한 플레이트 배지를 사용하였다.

마찬가지로 pTWVPtac_ccrNXA_ΔxylX_Km 또는 pTWVPtac_ccrNXA_ΔccrxylA_Km으로 피. 아나나티스(P. ananatis) NA1주를 형질 전환하여 피. 아나나티스(P. ananatis) NA2 ΔxylX주, 피. 아나나티스(P. ananatis) NA2 ΔccrxylA주를 구축하였다.

(4) xylD, xylX, xylA 호모로그 발현 플라스미드의 구축

yjhG, yagF 발현용 플라스미드 pSTV28-Ptac-yjhG-Ttrp, pSTV28-Ptac-yagF-Ttrp은 이하와 같이 하여 작제하였다.

pSTV28-Ptac-yjhG-Ttrp은 이. 콜라이(E. coli) MG1655주의 게놈 DNA를 주형으로 하고, yjhG_F(서열번호 117) 및 yjhG_R(서열번호 118)을 프라이머로 사용한 PCR에 의해 yjhG 단편을 증폭시키고, SmaI로 소화한 pSTV28-Ptac-Ttrp에 인-퓨전 클로닝(In-Fusion cloning)법으로 클로닝함으로써 작제하였다.

pSTV28-Ptac-yagF-Ttrp은 yagF_F(서열번호 119) 및 yagF_R(서열번호 120)를 프라이머고 사용하여 상기와 같은 방법에 의해 작제하였다.

xylD(Hse) 발현용 플라스미드 pSTV28-Ptac-xylD(Hse)-Ttrp은 이하와 같이 하여 작제하였다. tac 프로모터, xylD(Hse) 및 trp 터미네이터의 서열을 갖는 DNA 단편(Ptac-xylD(Hse)-Ttrp)을 합성하여, EcoRV로 소화한 pUC57 벡터(써모피셔사이언티픽사에서 구입)에 연결함으로써 pUC57-Ptac-xylD(Hse)-Ttrp을 수득하였다. DNA 단편을 합성할 때에 이. 콜라이(E. coli)에서의 발현에 적합하도록 코돈 최적화를 실시하였다. EcoRI와 KpnI로 각각 소화한 pSTV28과 pUC57-Ptac-xylD(Hse)-Ttrp을 등량 혼합하여 라이게이션 반응 후 JM109를 형질 전환하고, Cm 내성이 나타난 콜로니로부터 플라스미드를 추출하여 pSTV28-Ptac-xylD(Hse)-Ttrp을 수득하였다.

xylD (Amis), xylD(Aor), xylX(Cne), xylX(Zga), xylX(Tco), xylA(Abr), ycbD의 각각을 발현하는 플라스미드 pSTV28-Ptac-xylD(Amis)-Ttrp, pSTV28-Ptac-xylD(Aor)-Ttrp, pSTV28-Ptac-xylX(Cne)-Ttrp, pSTV28-Ptac-xylX(Zga)-Ttrp, pSTV28-Ptac-xylX(Tco)-Ttrp, pSTV28-Ptac-xylA(Abr)-Ttrp, pSTV28-Ptac-ycbD-Ttrp도 같은 방법으로 작제하였다. 단, YcbD에 대해서는 코돈 최적화를 실시하지 않았다.

xylD(Atu) 발현용 플라스미드 pSTV28-Ptac-xylD(Atu)-Ttrp은 이하와 같이 하여 작제하였다. tac 프로모터, xylD(Atu) 및 trp 터미네이터의 서열을 갖는 DNA 단편(Ptac-xylD(Atu)-Ttrp)을 합성하여, EcoRV로 소화한 pJET1.2 벡터(써모피셔사이언티픽사에서 구입)에 연결함으로써 pJET1.2-Ptac-xylD(Atu)-Ttrp을 수득하였다. DNA 단편을 합성할 때에 이. 콜라이(E. coli)에서의 발현에 적합하도록 코돈 최적화를 실시하였다. EcoRI와 KpnI로 각각 소화한 pSTV28과 pJET1.2-Ptac-xylD(Atu)-Ttrp을 등량 혼합하여, 라이게이션 반응 후 JM109를 형질 전환하고, Cm 내성이 나타난 콜로니로부터 플라스미드를 추출하여 pSTV28-Ptac-xylD(Atu)-Ttrp을 수득하였다.

xylX(Atu), xylA(Hbo)의 각각을 발현하는 플라스미드 pSTV28-Ptac-xylX(Atu)-Ttrp, pSTV28-Ptac-xylA(Hbo)-Ttrp도 같은 방법으로 작제하였다.

xylX(Art) 발현용 플라스미드 pSTV28-Ptac-xylX(Art)-Ttrp은 이하와 같이 하여 제작하였다. tac 프로모터, xylX(Art) 및 trp 터미네이터의 서열을 갖는 DNA 단편(Ptac-xylX(Art)-Ttrp)을 합성하여, EcoRV로 소화한 pCC1 벡터(에피센트레(Epicentre)사에서 구입)에 연결함으로써 pCC1-Ptac-xylX(Art)-Ttrp을 수득하였다. DNA 단편을 합성할 때에 이. 콜라이(E. coli)에서의 발현에 적합하도록 코돈 최적화를 실시하였다. EcoRI와 KpnI로 각각 소화한 pSTV28과 pCC1-Ptac-xylX(Art)-Ttrp을 등량 혼합하여, 라이게이션 반응 후 JM109를 형질 전환하고, Cm 내성이 나타난 콜로니로부터 플라스미드를 추출하여 pSTV28-Ptac-xylX(Art)-Ttrp을 수득하였다.

(5) xylD 호모로그의 활성 검출

pSTV28-Ptac-Ttrp, pSTV28-Ptac-xylD-Ttrp, pSTV28-Ptac-xylD(Atu)-Ttrp, pSTV28-Ptac-xylD(Hse)-Ttrp, pSTV28-Ptac-yjhG-Ttrp, pSTV28-Ptac-yagF-Ttrp, pSTV28-Ptac-xylD(Amis)-Ttrp 또는 pSTV28-Ptac-xylD(Aor)-Ttrp으로, 일렉트로포레이션법(미국 특허 6682912호 참조)에 의해 피. 아나나티스(P. ananatis) NA2 ΔxylD주를 형질 전환하였다. 각 형질 전환주의 배양에는 LBGM9에 카나마이신을 최종 농도 40mg/L, 테트라사이클린을 최종 농도 12.5 mg/L, 클로람페니콜을 최종 농도 25mg/L가 되도록 첨가한 플레이트 배지를 사용하였다.

약제를 첨가한 LBGM9 플레이트에, 34℃에서 하룻밤 배양한 각 형질 전환주의 균체를 1/6 플레이트만큼 긁어내어, MSII-SX 배지 5ml를 포함하는 큰 시험관에 식균하고, 34℃, 120rpm에서 48시간 배양하여 L-글루탐산(Glu)의 축적량을 측정하였다. 결과를 도 5에 나타낸다.

피. 아나나티스(P. ananatis) NA2 ΔxylD에 pSTV28-Ptac-Ttrp을 도입한 주에서는 L-글루탐산 축적량은 6.9 g/L이었는데 반해, 다른 형질 전환주에서는 11.1g/L 내지 23.1g/L의 L-글루탐산이 축적되었다. pSTV28-Ptac-Ttrp을 도입한 주에서는 크실로스로부터 L-글루탐산이 거의 생성되지 않고, 다른 형질 전환주에서는 NXA 경로를 통하여 크실로스로부터 L-글루탐산이 생성되었다고 생각된다. 즉, xylD는 씨. 크레센투스(C. crescentus) 이외의 어떤 생물종 유래의 xylD 호모로그로도 대체 가능한 것이 나타났다.

(6) xylX 호모로그의 활성 검출

pSTV28-Ptac-Ttrp, pSTV28-Ptac-xylX-Ttrp, pSTV28-Ptac-xylX(Art)-Ttrp, pSTV28-Ptac-xylX(Atu)-Ttrp, pSTV28-Ptac-xylX(Cne)-Ttrp, pSTV28-Ptac-xylX(Zga)-Ttrp, pSTV28-Ptac-xylX(Tco)-Ttrp 또는 pSTV28-Ptac-xylX(Selo)-Ttrp으로, 일렉트로포레이션법에 의해 피. 아나나티스(P. ananatis) NA2 ΔxylX주를 형질 전환하였다. 각 형질 전환주의 배양에는 LBGM9에 카나마이신을 최종 농도 40mg/L, 테트라사이클린을 최종 농도 12.5 mg/L, 클로람페니콜을 최종 농도 25mg/L가 되도록 첨가한 플레이트 배지를 사용하였다.

약제를 첨가한 LBGM9 플레이트에, 34℃에서 하룻밤 배양한 각 형질 전환주의 균체를 1/6 플레이트만큼 긁어내어, MSII-SX 배지 5ml를 포함하는 큰 시험관에 식균하고, 34℃, 120rpm에서 48시간 배양하여 L-글루탐산(Glu)의 축적량을 측정하였다. 결과를 도 6에 나타낸다.

피. 아나나티스(P. ananatis) NA2 ΔxylX에 pSTV28-Ptac-Ttrp을 도입한 주에서는 L-글루탐산 축적량은 8.7 g/L이었는데 반해, 다른 형질 전환주에서는 20.5g/L 내지 27.8g/L의 L-글루탐산이 축적되었다. pSTV28-Ptac-Ttrp을 도입한 주에서는 크실로스로부터 L-글루탐산이 거의 생성되지 않고, 다른 형질 전환주에서는 NXA 경로를 통하여 크실로스로부터 L-글루탐산이 생성되었다고 생각되었다. 즉, xylX는 씨. 크레센투스(C. crescentus) 이외의 어떤 생물종 유래의 xylX 호모로그로도 대체 가능한 것이 나타났다.

(7) xylA 호모로그의 활성 검출

pSTV28-Ptac-Ttrp, pSTV28-Ptac-ccrxylA-Ttrp, pSTV28-Ptac-ycbD-Ttrp, pSTV28-Ptac-xylA(Hbo)-Ttrp 또는 pSTV28-Ptac-xylA(Abr)-Ttrp으로, 일렉트로포레이션법에 의해 피. 아나나티스(P. ananatis) NA2ΔccrxylA주를 형질 전환하였다. 각 형질 전환주의 배양에는 LBGM9에 카나마이신을 최종 농도 40mg/L, 테트라사이클린을 최종 농도 12.5 mg/L, 클로람페니콜을 최종 농도 25mg/L이 되도록 첨가한 플레이트 배지를 사용하였다.

약제를 첨가한 LBGM9 플레이트에, 34℃에서 하룻밤 배양한 각 형질 전환주의 균체를 1/6 플레이트만큼 긁어내어, MSII-SX 배지 5ml를 포함한 큰 시험관에 식균하고, 34℃, 120rpm에서 48시간 배양하여 L-글루탐산(Glu)의 축적량을 측정하였다. 결과를 도 7에 도시하였다.

피. 아나나티스(P. ananatis) ΔccrxylA에 pSTV28-Ptac-Ttrp을 도입한 주에서는 L-글루탐산 축적량은 1.0g/L이었는데 반해, 다른 형질 전환주에서는 18.1g/L 내지 30.7 g/L의 L-글루탐산이 축적되었다. pSTV28-Ptac-Ttrp을 도입한 주에서는 크실로스로부터 L-글루탐산이 거의 생성되지 않고, 다른 형질 전환주에서는 NXA 경로를 통하여 크실로스로부터 L-글루탐산이 생성되었다고 생각되었다. 즉, xylA는 씨. 크레센투스(C. crescentus) 이외의 어떤 생물종 유래의 ccrxylA 호모로그로도 대체 가능한 것이 나타났다.

[산업상의 이용 가능성]

본 발명에 의해, 크실로스 원료를 사용하여, 발효법에 의해 목적 물질을 효율적으로 제조할 수 있다.

통상 산업성 공업 기술원 생명공학공업 기술 연구소

FERMBP-7207

19990818

SEQUENCE LISTING <110> AJINOMOTO CO., INC. <120> METHOD FOR PRODUCING TARGET SUBSTANCE BY FERMENTATION <130> D313-11346 <150> JP 2011-247031 <151> 2011-11-11 <150> US 61/558,685 <151> 2011-11-11 <160> 120 <170> KopatentIn 1.71 <210> 1 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer PtwvPtacf <400> 1 gaattcgagc tcggtaccca gatctccctg ttgacaatta 40 <210> 2 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer 0823Ptacr <400> 2 aggaattcac tcacgcccac cctcctgtgt gaaattgtta 40 <210> 3 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer Ptac0823f <400> 3 taacaatttc acacaggagg gtgggcgtga gtgaattcc 39 <210> 4 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer 0819r <400> 4 gcggggcgtg cggttagaca tggcggacct catgctgggg 40 <210> 5 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer 0819f <400> 5 ccccagcatg aggtccgcca tgtctaaccg cacgccccgc 40 <210> 6 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer 219cc0819r <400> 6 ctctagagga tccccttcag cgtttggcga cggaga 36 <210> 7 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer 219f <400> 7 ggggatcctc tagagtcgac c 21 <210> 8 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer 219r <400> 8 gggtaccgag ctcgaattca c 21 <210> 9 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer attL-F <400> 9 tatattgatt cacttgaagt acgaaaaaaa ccggg 35 <210> 10 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer ntpII-R <400> 10 cctgcaggcg gccgctcata gaaggcggcg gtggaatcga aatct 45 <210> 11 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer attR-F <400> 11 gcggccgcct gcaggcccat gtaatgaata aaaagcagta attaa 45 <210> 12 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer attR-R <400> 12 tgaagcggcg cacgaaaaac gcgaaagcgt 30 <210> 13 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> primer Ap-Km-fw <400> 13 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc aagcttcacg 60 ctgccgcaag cactcagggc 80 <210> 14 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> primer Ap-Km-rv <400> 14 atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt cgctcataga 60 aggcggcggt ggaatcgaaa 80 <210> 15 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer xylD_IFS_5742-10-5 <400> 15 acacaaggag actcccatgt ctaaccgcac gccccgccgg 40 <210> 16 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer xylD_IFS_5742-10-6 <400> 16 ggaactggcg gctccctcag tggttgtggc ggggcagctt 40 <210> 17 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer CC0819-01F_4691-88-7 <400> 17 gtcgactcta gaggatcccc atgtctaacc gcacgccccg ccggt 45 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0819-01R_5659-9-1 <400> 18 aaccaggaac ccggccttct ctgc 24 <210> 19 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0819-02F_5659-9-2 <400> 19 tcccgtacca cgagccgctg gcag 24 <210> 20 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> primer CC0819-02R_4691-88-10 <400> 20 cgaattcgag ctcggtaccc tcagtggttg tggcggggca gctt 44 <210> 21 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> primer xylA-H1P1-5742-5-1 <400> 21 acgacatcat ccatcacccg cggcattacc tgattatgga gttcaatatg tgaagcctgc 60 ttttttat 68 <210> 22 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> primer xylA-H2P2-5742-5-2 <400> 22 atcgggccaa cggactgcac agttagccgt tatttgtcga acagataatg cgctcaagtt 60 agtataaa 68 <210> 23 <211> 8296 <212> DNA <213> Caulobacter crescentus <220> <221> CDS <222> (1175)..(2329) <220> <221> CDS <222> (2346)..(3782) <220> <221> CDS <222> (3788)..(4534) <220> <221> CDS <222> (4659)..(5528) <400> 23 caggacttca gacccgcgag gctgtagggg tcgtcaaagg ccttggccag gaccggcggc 60 acctcgcgct tggacaggcc gacgtcgcgc accggctggg tgccgatgtc gacggccttc 120 ttgcccgcct cgccccagcg gccggacggt tcctcgggct tggccggcgg cttgacctgg 180 gcgtgggcgc tggaggccag cagcacggcg gcggctccgg ccatgatcag cagcttgttc 240 ggcatcaaaa gcgccctccc gacaaaacac gccacgggaa cggcaagcct cgccgccggt 300 tcccgcccgc aagtccctcg gcacgaactc taaggcctgc gcacgatcca tcgccaccac 360 aaagcgtgtc atcccggccg aagcgcagcg gagagccggg acccagggcc acaagcacgg 420 cgcttcgtca ccccctgggt cccggatagc gctccgcgct tccgggatga cacgggttta 480 agcacttggg tgagaagccc tagttcggcg cgccgcccgc ttccaggtcg aacgcggcgt 540 cgaaggcgtc gtcgccagga accgtccctt ccagggcggc gtcgaacagg tcttcgagcg 600 atgaccagat gaaggccatc tgctccatga tcgtcgggac gctggccgga tcgaagccgg 660 ggtagaggtc ttccaccagc cacaggcccg tgccgggatc gaaggcgaag cggcagccga 720 tcaggcggaa ctgggcgcgg gccatggtct cgaacagggc cgtcaggtcg cgggcggcgt 780 ccaggtcgtc gtggtccagc accaggcagc ggatctgcag ccagccgtgg tcgggcagca 840 ggtagaaggc gccctcgtcc tgatcctcgc ccgaaacctc cagcccccgg tcgatggctt 900 cgacgacata gccggccgcg cggcaggtgt cggtgagcgc ggccagcagg gcggcttcct 960 ggtcaggggt caggtcggtc atgggcaaga ggtccaggtc gtggtttgtc ggcggcttct 1020 agcatggacc gcccgcgccc gtgaggccga ggatttcgcg ctggtcagac aacctacttg 1080 ccgtccccac atgttagcgc taccaagtgc cgacgaacgc gcgccgccga cggtgtcggc 1140 gcttcagacg ctcgagtttt ggggagacga cgcc gtg ggc gtg agt gaa ttc ctg 1195 Val Gly Val Ser Glu Phe Leu 1 5 ccg gaa gat tgg aaa gcc gcg acc ctg ctg ggg cgc atc gac ttt ggc 1243 Pro Glu Asp Trp Lys Ala Ala Thr Leu Leu Gly Arg Ile Asp Phe Gly 10 15 20 gaa ggc ccg acg ccg gtg ctg gtg cgc ggc ggc cgc gtc gag gac gtc 1291 Glu Gly Pro Thr Pro Val Leu Val Arg Gly Gly Arg Val Glu Asp Val 25 30 35 tcg aag atc gcc ccc acc gtc gct gac ctg atg aac gcc ttc cag ccc 1339 Ser Lys Ile Ala Pro Thr Val Ala Asp Leu Met Asn Ala Phe Gln Pro 40 45 50 55 ggc gcg gtg atc ccg cgc ggc gag gac aag ggt ccg ctg gaa gcc ctc 1387 Gly Ala Val Ile Pro Arg Gly Glu Asp Lys Gly Pro Leu Glu Ala Leu 60 65 70 gac atc cgc cca gtc tgg gaa gac ccg gac ggc gcc gcg ccg gtc aag 1435 Asp Ile Arg Pro Val Trp Glu Asp Pro Asp Gly Ala Ala Pro Val Lys 75 80 85 ctg ttg gcc ccc gtc gac ctg caa tgc ctg aag gcc gcc ggc gtg acc 1483 Leu Leu Ala Pro Val Asp Leu Gln Cys Leu Lys Ala Ala Gly Val Thr 90 95 100 ttc gcg gtc tcg acc ctt gag cgg gtc atc gag gag cgc gcg cgc ggc 1531 Phe Ala Val Ser Thr Leu Glu Arg Val Ile Glu Glu Arg Ala Arg Gly 105 110 115 gac gcc ggc gag gcg ctg aag atc cgc acc ctg ctg gcc gaa cgc atg 1579 Asp Ala Gly Glu Ala Leu Lys Ile Arg Thr Leu Leu Ala Glu Arg Met 120 125 130 135 ggc ggc gac ctc aag agc gtc gag ccg ggc tcg cag ggc gcc cag cgc 1627 Gly Gly Asp Leu Lys Ser Val Glu Pro Gly Ser Gln Gly Ala Gln Arg 140 145 150 ctg aag gac gcc ctg atc gcc gac ggc ctg tgg tcg cag tat ctg gaa 1675 Leu Lys Asp Ala Leu Ile Ala Asp Gly Leu Trp Ser Gln Tyr Leu Glu 155 160 165 gtg gcg atc ggc ccg gac gcc gag atc ttc acc aag ggc ccg acc ctg 1723 Val Ala Ile Gly Pro Asp Ala Glu Ile Phe Thr Lys Gly Pro Thr Leu 170 175 180 tcc tcg atg ggc tgg ggc gac cag gtc ggc gtc cgc tat gac agc cac 1771 Ser Ser Met Gly Trp Gly Asp Gln Val Gly Val Arg Tyr Asp Ser His 185 190 195 tgg aac aat ccc gag ccg gaa gtc gtg ctg ctg tgc gac ggt tcg ggc 1819 Trp Asn Asn Pro Glu Pro Glu Val Val Leu Leu Cys Asp Gly Ser Gly 200 205 210 215 ctg atc cgc ggc gcg gcg ctg ggc aac gac gtc aat ctg cgc gac ttc 1867 Leu Ile Arg Gly Ala Ala Leu Gly Asn Asp Val Asn Leu Arg Asp Phe 220 225 230 gaa ggt cgt tcg gcc ctg ctg ctc agc aag gcc aag gac aac aac gcc 1915 Glu Gly Arg Ser Ala Leu Leu Leu Ser Lys Ala Lys Asp Asn Asn Ala 235 240 245 agc tgc gcc atc ggt ccg ttc ttc cgc ctg ttc gac gag acc ttc ggc 1963 Ser Cys Ala Ile Gly Pro Phe Phe Arg Leu Phe Asp Glu Thr Phe Gly 250 255 260 ctg gac gac gtc cgt tcg gcc gag gtc gag ctg aag atc acc ggc cgc 2011 Leu Asp Asp Val Arg Ser Ala Glu Val Glu Leu Lys Ile Thr Gly Arg 265 270 275 gac aac ttc gtg ctc gac ggc aag tcg aac atg agc ctg atc agc cgc 2059 Asp Asn Phe Val Leu Asp Gly Lys Ser Asn Met Ser Leu Ile Ser Arg 280 285 290 295 gac ccg gcc gtg ctg gcc gga cag gcc tat ggc aag cag cac cag tat 2107 Asp Pro Ala Val Leu Ala Gly Gln Ala Tyr Gly Lys Gln His Gln Tyr 300 305 310 ccg gac ggc ttt gct ttg ttc ctg ggc acc atg ttc gcc ccg atc cag 2155 Pro Asp Gly Phe Ala Leu Phe Leu Gly Thr Met Phe Ala Pro Ile Gln 315 320 325 gac cgc gac acc ccc ggc cag ggt ttc acc cac aag gtc ggc gac cgc 2203 Asp Arg Asp Thr Pro Gly Gln Gly Phe Thr His Lys Val Gly Asp Arg 330 335 340 gtg cgt gtc tcg acg ccg aag ctg ggc gtg ctc gag aac gaa gtc acc 2251 Val Arg Val Ser Thr Pro Lys Leu Gly Val Leu Glu Asn Glu Val Thr 345 350 355 acc tgc gac aag gcc aag ccg tgg acg ttc ggc atc tcg gcc ctg atc 2299 Thr Cys Asp Lys Ala Lys Pro Trp Thr Phe Gly Ile Ser Ala Leu Ile 360 365 370 375 cgc aac ctg gcc ggc cgc ggc ctc ctc taa tcgaaagctt cccgcg atg acc 2351 Arg Asn Leu Ala Gly Arg Gly Leu Leu Met Thr 380 385 gac acc ctg cgc cat tac atc ggc ggc gaa cgc gtc gcg gcc gac gcc 2399 Asp Thr Leu Arg His Tyr Ile Gly Gly Glu Arg Val Ala Ala Asp Ala 390 395 400 ccg gcc gag agc ctg aac ccg tcc aac acc aac gac gtc gtc gcc aag 2447 Pro Ala Glu Ser Leu Asn Pro Ser Asn Thr Asn Asp Val Val Ala Lys 405 410 415 gtc ccg atg ggc ggc cag gcc gag gtc gac gcc gcc gtc gac gcc gcg 2495 Val Pro Met Gly Gly Gln Ala Glu Val Asp Ala Ala Val Asp Ala Ala 420 425 430 cgc aag gcc ttc ccg gcc tgg gcc gac gcc tcg ccg gag gtc cgc tcg 2543 Arg Lys Ala Phe Pro Ala Trp Ala Asp Ala Ser Pro Glu Val Arg Ser 435 440 445 450 gac ctc ttg gac aag gtc ggt tcg acc atc atc gcc cgc agc gcc gac 2591 Asp Leu Leu Asp Lys Val Gly Ser Thr Ile Ile Ala Arg Ser Ala Asp 455 460 465 atc ggc cgc ctg ctg gcc cgc gaa gag ggc aag acc ctg gcg gaa ggc 2639 Ile Gly Arg Leu Leu Ala Arg Glu Glu Gly Lys Thr Leu Ala Glu Gly 470 475 480 atc ggc gag acc gtc cgc gcc ggc cgc atc ttc aag tac ttc gcc ggt 2687 Ile Gly Glu Thr Val Arg Ala Gly Arg Ile Phe Lys Tyr Phe Ala Gly 485 490 495 gaa gcc ctg cgc cgt cac ggc cag aac ctg gaa agc acc cgt ccg ggc 2735 Glu Ala Leu Arg Arg His Gly Gln Asn Leu Glu Ser Thr Arg Pro Gly 500 505 510 gtc gag atc cag acc tat cgt cag gcc gtg ggc gtc tat ggc ctg atc 2783 Val Glu Ile Gln Thr Tyr Arg Gln Ala Val Gly Val Tyr Gly Leu Ile 515 520 525 530 acg ccc tgg aac ttc ccg atc gcc atc ccg gcc tgg aag gcc gcc ccg 2831 Thr Pro Trp Asn Phe Pro Ile Ala Ile Pro Ala Trp Lys Ala Ala Pro 535 540 545 gcg ctc gcc ttc ggc aac acc gtg gtg atc aag ccg gcc ggc ccg acg 2879 Ala Leu Ala Phe Gly Asn Thr Val Val Ile Lys Pro Ala Gly Pro Thr 550 555 560 ccc gcc acc gcc aac gtg ctg gcc gac atc atg gcc gag tgc ggc gcc 2927 Pro Ala Thr Ala Asn Val Leu Ala Asp Ile Met Ala Glu Cys Gly Ala 565 570 575 ccg gcc ggc gtg ttc aac atg ctg ttt ggt cgc ggc tcg atg ggc gat 2975 Pro Ala Gly Val Phe Asn Met Leu Phe Gly Arg Gly Ser Met Gly Asp 580 585 590 gcg ctg atc aag cac aag gac gtg gac ggc gtc tcg ttc acc ggc tcg 3023 Ala Leu Ile Lys His Lys Asp Val Asp Gly Val Ser Phe Thr Gly Ser 595 600 605 610 cag ggc gtg ggc gcg cag gtc gcc gcc gcc gcc gtg gcc cgt cag gcc 3071 Gln Gly Val Gly Ala Gln Val Ala Ala Ala Ala Val Ala Arg Gln Ala 615 620 625 cgc gtg cag ctg gag atg ggc ggc aag aac ccg ctg atc gtg ctg gac 3119 Arg Val Gln Leu Glu Met Gly Gly Lys Asn Pro Leu Ile Val Leu Asp 630 635 640 gac gcc gac ctg gag cgc gcg gtc gcc atc gcc ctg gac ggc tcg ttc 3167 Asp Ala Asp Leu Glu Arg Ala Val Ala Ile Ala Leu Asp Gly Ser Phe 645 650 655 ttc gcc acc ggc cag cgc tgc acc gcc agc tcg cgc ctg atc gtc cag 3215 Phe Ala Thr Gly Gln Arg Cys Thr Ala Ser Ser Arg Leu Ile Val Gln 660 665 670 gac ggg att cac gac aag ttc gtg gcc ctg ctg gcc gag aag gtc gcc 3263 Asp Gly Ile His Asp Lys Phe Val Ala Leu Leu Ala Glu Lys Val Ala 675 680 685 690 gcc ctg cgc gtg ggc gac gct ctg gac ccc aac acc cag atc ggc ccg 3311 Ala Leu Arg Val Gly Asp Ala Leu Asp Pro Asn Thr Gln Ile Gly Pro 695 700 705 gcc gtc tcc gaa gac cag atg gag act tcg tac cgc tat atc gac atc 3359 Ala Val Ser Glu Asp Gln Met Glu Thr Ser Tyr Arg Tyr Ile Asp Ile 710 715 720 gct gcc tcc gaa ggc ggc cgc gtg gtc acc ggc ggc gac cgc atc aag 3407 Ala Ala Ser Glu Gly Gly Arg Val Val Thr Gly Gly Asp Arg Ile Lys 725 730 735 ctc gac aat ccg ggc tgg tac gtg cgt ccg acc ctg atc gcc gac acg 3455 Leu Asp Asn Pro Gly Trp Tyr Val Arg Pro Thr Leu Ile Ala Asp Thr 740 745 750 caa gcc ggc atg cgg atc aac aac gag gag gtc ttc ggc ccc gtc gcc 3503 Gln Ala Gly Met Arg Ile Asn Asn Glu Glu Val Phe Gly Pro Val Ala 755 760 765 770 tcg acc atc cgc gtc aag agc tac gaa gag gcg ctg gag atc gcc aac 3551 Ser Thr Ile Arg Val Lys Ser Tyr Glu Glu Ala Leu Glu Ile Ala Asn 775 780 785 ggc gtc gag ttc ggc ctt tcg gcc ggc atc gcc acc acc tcg ctc aag 3599 Gly Val Glu Phe Gly Leu Ser Ala Gly Ile Ala Thr Thr Ser Leu Lys 790 795 800 cac gcc cgc cac ttc cag cgc tat gcc cgc gcg ggc atg acc atg gtc 3647 His Ala Arg His Phe Gln Arg Tyr Ala Arg Ala Gly Met Thr Met Val 805 810 815 aat ctg gcc acg gcc ggc gtc gac tat cac gtg ccg ttc ggc ggc acg 3695 Asn Leu Ala Thr Ala Gly Val Asp Tyr His Val Pro Phe Gly Gly Thr 820 825 830 aag agc agc tcg tac ggc gcc cgc gag cag ggc ttc gcg gcg gtc gag 3743 Lys Ser Ser Ser Tyr Gly Ala Arg Glu Gln Gly Phe Ala Ala Val Glu 835 840 845 850 ttc ttc acc cag acc aaa acc tcc tac tcg tgg tcg taa gcagc atg tcc 3793 Phe Phe Thr Gln Thr Lys Thr Ser Tyr Ser Trp Ser Met Ser 855 860 tca gcc atc tat ccc agc ctg aag ggc aag cgc gtc gtc atc acc ggc 3841 Ser Ala Ile Tyr Pro Ser Leu Lys Gly Lys Arg Val Val Ile Thr Gly 865 870 875 880 ggc ggc tcg ggc atc ggg gcc ggc ctc acc gcc ggc ttc gcc cgt cag 3889 Gly Gly Ser Gly Ile Gly Ala Gly Leu Thr Ala Gly Phe Ala Arg Gln 885 890 895 ggc gcg gag gtg atc ttc ctc gac atc gcc gac gag gac tcc agg gct 3937 Gly Ala Glu Val Ile Phe Leu Asp Ile Ala Asp Glu Asp Ser Arg Ala 900 905 910 ctt gag gcc gag ctg gcc ggc tcg ccg atc ccg ccg gtc tac aag cgc 3985 Leu Glu Ala Glu Leu Ala Gly Ser Pro Ile Pro Pro Val Tyr Lys Arg 915 920 925 tgc gac ctg atg aac ctc gag gcg atc aag gcg gtc ttc gcc gag atc 4033 Cys Asp Leu Met Asn Leu Glu Ala Ile Lys Ala Val Phe Ala Glu Ile 930 935 940 ggc gac gtc gac gtg ctg gtc aac aac gcc ggc aat gac gac cgc cac 4081 Gly Asp Val Asp Val Leu Val Asn Asn Ala Gly Asn Asp Asp Arg His 945 950 955 960 aag ctg gcc gac gtg acc ggc gcc tat tgg gac gag cgg atc aac gtc 4129 Lys Leu Ala Asp Val Thr Gly Ala Tyr Trp Asp Glu Arg Ile Asn Val 965 970 975 aac ctg cgc cac atg ctg ttc tgc acc cag gcc gtc gcg ccg ggc atg 4177 Asn Leu Arg His Met Leu Phe Cys Thr Gln Ala Val Ala Pro Gly Met 980 985 990 aag aag cgt ggc ggc ggg gcg gtg atc aac ttc ggt tcg atc agc tgg 4225 Lys Lys Arg Gly Gly Gly Ala Val Ile Asn Phe Gly Ser Ile Ser Trp 995 1000 1005 cac ctg ggg ctt gag gac ctc gtc ctc tac gaa acc gcc aag gcc 4270 His Leu Gly Leu Glu Asp Leu Val Leu Tyr Glu Thr Ala Lys Ala 1010 1015 1020 ggc atc gaa ggc atg acc cgc gcg ctg gcc cgg gag ctg ggt ccc 4315 Gly Ile Glu Gly Met Thr Arg Ala Leu Ala Arg Glu Leu Gly Pro 1025 1030 1035 gac gac atc cgc gtc acc tgc gtg gtg ccg ggc aac gtc aag acc 4360 Asp Asp Ile Arg Val Thr Cys Val Val Pro Gly Asn Val Lys Thr 1040 1045 1050 aag cgc cag gag aag tgg tac acg ccc gaa ggc gag gcc cag atc 4405 Lys Arg Gln Glu Lys Trp Tyr Thr Pro Glu Gly Glu Ala Gln Ile 1055 1060 1065 gtg gcg gcc caa tgc ctg aag ggc cgc atc gtc ccg gag aac gtc 4450 Val Ala Ala Gln Cys Leu Lys Gly Arg Ile Val Pro Glu Asn Val 1070 1075 1080 gcc gcg ctg gtg ctg ttc ctg gcc tcg gat gac gcg tcg ctc tgc 4495 Ala Ala Leu Val Leu Phe Leu Ala Ser Asp Asp Ala Ser Leu Cys 1085 1090 1095 acc ggc cac gaa tac tgg atc gac gcc ggc tgg cgt tga cctaagaaaa 4544 Thr Gly His Glu Tyr Trp Ile Asp Ala Gly Trp Arg 1100 1105 1110 ctgtcatccc ggcccagcgt gaagcgcgcc gagccgggac cacggcaagc gccacgcgtc 4604 cggaggtccc ggctctccgc tgtgctacgg ccgggatgac agaggaatga ttgt atg 4661 Met acc gct caa gtc act tgc gta tgg gat ctg aag gcc acg ttg ggc 4706 Thr Ala Gln Val Thr Cys Val Trp Asp Leu Lys Ala Thr Leu Gly 1115 1120 1125 gaa ggc ccg atc tgg cat ggc gac acc ctg tgg ttc gtc gac atc 4751 Glu Gly Pro Ile Trp His Gly Asp Thr Leu Trp Phe Val Asp Ile 1130 1135 1140 aag cag cgt aaa atc cac aac tac cac ccc gcc acc ggc gag cgc 4796 Lys Gln Arg Lys Ile His Asn Tyr His Pro Ala Thr Gly Glu Arg 1145 1150 1155 ttc agc ttc gac gcg ccg gat cag gtg acc ttc ctc gcg ccg atc 4841 Phe Ser Phe Asp Ala Pro Asp Gln Val Thr Phe Leu Ala Pro Ile 1160 1165 1170 gtc ggc gcg acc ggc ttt gtc gtc ggt ctg aag acc ggg att cac 4886 Val Gly Ala Thr Gly Phe Val Val Gly Leu Lys Thr Gly Ile His 1175 1180 1185 cgc ttc cac ccg gcc acg ggc ttc agc ctg ctg ctc gag gtc gag 4931 Arg Phe His Pro Ala Thr Gly Phe Ser Leu Leu Leu Glu Val Glu 1190 1195 1200 gac gcg gcg ctg aac aac cgc ccc aac gac gcc acg gtc gac gcg 4976 Asp Ala Ala Leu Asn Asn Arg Pro Asn Asp Ala Thr Val Asp Ala 1205 1210 1215 caa ggc cgt ctg tgg ttc ggc acc atg cac gac ggg gaa gag aac 5021 Gln Gly Arg Leu Trp Phe Gly Thr Met His Asp Gly Glu Glu Asn 1220 1225 1230 aat agc ggc tcg ctc tat cgg atg gac ctc acc ggc gtc gcc cgg 5066 Asn Ser Gly Ser Leu Tyr Arg Met Asp Leu Thr Gly Val Ala Arg 1235 1240 1245 atg gac cgc gac atc tgc atc acc aac ggc ccg tgc gtc tcg ccc 5111 Met Asp Arg Asp Ile Cys Ile Thr Asn Gly Pro Cys Val Ser Pro 1250 1255 1260 gac ggc aag acc ttc tac cac acc gac acc ctg gaa aag acg atc 5156 Asp Gly Lys Thr Phe Tyr His Thr Asp Thr Leu Glu Lys Thr Ile 1265 1270 1275 tac gcc ttc gac ctg gcc gag gac ggc ctg ctg tcg aac aag cgc 5201 Tyr Ala Phe Asp Leu Ala Glu Asp Gly Leu Leu Ser Asn Lys Arg 1280 1285 1290 gtc ttc gtg cag ttc gcc ctg ggc gac gat gtc tat ccg gac ggt 5246 Val Phe Val Gln Phe Ala Leu Gly Asp Asp Val Tyr Pro Asp Gly 1295 1300 1305 tcg gtc gtc gat tcc gaa ggc tat ctg tgg acc gcc ctg tgg ggc 5291 Ser Val Val Asp Ser Glu Gly Tyr Leu Trp Thr Ala Leu Trp Gly 1310 1315 1320 ggt ttc ggc gcg gtc cgc ttc tcg ccg caa ggc gac gcc gtg acg 5336 Gly Phe Gly Ala Val Arg Phe Ser Pro Gln Gly Asp Ala Val Thr 1325 1330 1335 cgc atc gaa ctg ccc gcc ccc aac gtc acc aag ccc tgc ttc ggc 5381 Arg Ile Glu Leu Pro Ala Pro Asn Val Thr Lys Pro Cys Phe Gly 1340 1345 1350 ggg cct gac ctg aag acc ctc tat ttc acc acc gcc cgc aag ggc 5426 Gly Pro Asp Leu Lys Thr Leu Tyr Phe Thr Thr Ala Arg Lys Gly 1355 1360 1365 ctg agc gac gag acc ctg gcc cag tac ccg ctg gcc ggc ggt gtg 5471 Leu Ser Asp Glu Thr Leu Ala Gln Tyr Pro Leu Ala Gly Gly Val 1370 1375 1380 ttc gcc gtt ccg gtc gat gtg gcc ggc caa ccc cag cat gag gtc 5516 Phe Ala Val Pro Val Asp Val Ala Gly Gln Pro Gln His Glu Val 1385 1390 1395 cgc ctt gtc taa ccgcacgccc cgccggttcc ggtcccgcga ttggttcgat 5568 Arg Leu Val aaccccgacc atatcgacat gaccgcgctc tatctggagc gcttcatgaa ctacgggatc 5628 acgccggagg agctgcgcag cggcaagccg atcatcggca tcgcccagac cggcagcgac 5688 atctcgccct gcaaccgcat ccacctggac ctggtccagc gggtgcggga cgggatccgc 5748 gacgccgggg gcatccccat ggagttcccg gtccatccga tcttcgagaa ctgccgtcgc 5808 ccgacggcgg cgctggaccg gaacctctcg tacctgggtc tcgtcgagac cctgcacggc 5868 tatccgatcg acgccgtggt tctgaccacc ggctgcgaca agaccacccc ggccgggatc 5928 atggccgcca ccacggtcaa tatcccggcc atcgtgctgt cgggcggccc gatgctggac 5988 ggctggcacg agaacgagct cgtgggctcg ggcaccgtga tctggcgctc gcgccgcaag 6048 ctggcggccg gcgagatcac cgaggaagag ttcatcgacc gcgccgccag ctcggcgccg 6108 tcggcgggcc actgcaacac catgggcacg gcctcgacca tgaacgccgt ggccgaggcg 6168 ctgggcctgt cgctgaccgg ctgcgcggcc atccccgccc cctaccgcga gcgcggccag 6228 atggcctaca agaccggcca gcgcatcgtc gatctggcct atgacgacgt caaaccgctc 6288 gacatcctga ccaagcaagc cttcgagaac gccatcgccc tggtggcggc ggccggcggc 6348 tcgaccaacg cccagccgca catcgtggcc atggcccgtc acgccggcgt cgagatcacc 6408 gccgacgact ggcgcgcggc ctatgacatc ccgctgatcg tcaacatgca gccggccggc 6468 aagtatctgg gcgagcgctt ccaccgagcc ggcggcgcgc cggcggtgct gtgggagctg 6528 ttgcagcaag gccgcctgca cggcgacgtg ctgaccgtca ccggcaagac gatgagcgag 6588 aacctgcaag gccgcgaaac cagcgaccgc gaggtgatct tcccgtacca cgagccgctg 6648 gccgagaagg ccgggttcct ggttctcaag ggcaacctct tcgacttcgc gatcatgaag 6708 tccagcgtga tcggcgagga gttccgcaag cgctacctgt cgcagcccgg ccaggaaggc 6768 gtgttcgaag cccgcgccat cgtgttcgac ggctcggacg actatcacaa gcggatcaac 6828 gatccggccc tggagatcga cgagcgctgc atcctggtga tccgcggcgc gggtccgatc 6888 ggctggcccg gctcggccga ggtcgtcaac atgcagccgc cggatcacct tctgaagaag 6948 gggatcatga gcctgcccac cctgggcgat ggccgtcagt cgggcaccgc cgacagcccc 7008 tcgatcctga acgcctcgcc cgaaagcgcg atcggcggcg gcctgtcgtg gctgcgcacc 7068 ggcgacacca tccgcatcga cctcaacacc ggccgctgcg acgccctggt cgacgaggcg 7128 acgatcgccg cgcgcaagca ggacggcatc ccggcggttc ccgccaccat gacgccctgg 7188 caggaaatct accgcgccca cgccagtcag ctcgacaccg gcggcgtgct ggagttcgcg 7248 gtcaagtacc aggacctggc ggccaagctg ccccgccaca accactgatg cgaagggcct 7308 tcggagcgat ccggaggccc ttttctttgc gccccccgga tcgcccgccc ccgcttcaca 7368 acacccagcc gaatcgcatt ttctccgtcg ccaaacgctg aaatgcgaag gggctggggg 7428 ggcgccatgg aactcaagga atactttctg ggcctgttgg ccatcatcac cggcctggcg 7488 atcaccgaca tgatcctgag cgtgcacggc ctgctacggc gcgtcagccg cgtacgatgg 7548 gattggctgc cgctcacggc cgccgccctg gttttcgtcg tcatcgtccg cagctggtgg 7608 atcgcctggg agcccgactg gatcaacacg ccgatgtggc agttcctgtt gatcctgatc 7668 cagctgacct gcctgttcct ggccgccaag tctgtgttgc cggacgacag cgacgccgaa 7728 gaggtcgacc tgatggctca ctactggtcg cagaaccggt tcgtctgggc gtccctgatc 7788 ggcatgatca cggcgttcgc cgccgcctcg gtcttcctgc gcatcaacga tccggcgagc 7848 ctgtcggcat ggttctggac gttcggttgg gagctgccgg tctactgctt gccgctggtg 7908 gtcctgatcc tcctgcagcg accgatcgtg catcgcgcgc tggttcccgc gctcctgctc 7968 gcctggctgg tcctgaacgg gacggacgtg atgcactaca gctagggctc ggcggctctg 8028 gtaaacaacc caaccccgat caacgaaggt ttagaaagct ttaagagaaa cgttgcgaat 8088 tgtaaaattc ttctctgggt tgaaacccat ttcgggtgta tcgatgaggt gtcgggccat 8148 ttattgagcg cggacaggat gttgtcagtg agccgagccc ttgatcaacg accggagtcg 8208 cccagcctgg tgatcgccac cacgatcctc cagcttggcc tcgttgttgt ggtttggctg 8268 gtggcgctga tccccgccgc gctggcgg 8296 <210> 24 <211> 384 <212> PRT <213> Caulobacter crescentus <400> 24 Val Gly Val Ser Glu Phe Leu Pro Glu Asp Trp Lys Ala Ala Thr Leu 1 5 10 15 Leu Gly Arg Ile Asp Phe Gly Glu Gly Pro Thr Pro Val Leu Val Arg 20 25 30 Gly Gly Arg Val Glu Asp Val Ser Lys Ile Ala Pro Thr Val Ala Asp 35 40 45 Leu Met Asn Ala Phe Gln Pro Gly Ala Val Ile Pro Arg Gly Glu Asp 50 55 60 Lys Gly Pro Leu Glu Ala Leu Asp Ile Arg Pro Val Trp Glu Asp Pro 65 70 75 80 Asp Gly Ala Ala Pro Val Lys Leu Leu Ala Pro Val Asp Leu Gln Cys 85 90 95 Leu Lys Ala Ala Gly Val Thr Phe Ala Val Ser Thr Leu Glu Arg Val 100 105 110 Ile Glu Glu Arg Ala Arg Gly Asp Ala Gly Glu Ala Leu Lys Ile Arg 115 120 125 Thr Leu Leu Ala Glu Arg Met Gly Gly Asp Leu Lys Ser Val Glu Pro 130 135 140 Gly Ser Gln Gly Ala Gln Arg Leu Lys Asp Ala Leu Ile Ala Asp Gly 145 150 155 160 Leu Trp Ser Gln Tyr Leu Glu Val Ala Ile Gly Pro Asp Ala Glu Ile 165 170 175 Phe Thr Lys Gly Pro Thr Leu Ser Ser Met Gly Trp Gly Asp Gln Val 180 185 190 Gly Val Arg Tyr Asp Ser His Trp Asn Asn Pro Glu Pro Glu Val Val 195 200 205 Leu Leu Cys Asp Gly Ser Gly Leu Ile Arg Gly Ala Ala Leu Gly Asn 210 215 220 Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Ser 225 230 235 240 Lys Ala Lys Asp Asn Asn Ala Ser Cys Ala Ile Gly Pro Phe Phe Arg 245 250 255 Leu Phe Asp Glu Thr Phe Gly Leu Asp Asp Val Arg Ser Ala Glu Val 260 265 270 Glu Leu Lys Ile Thr Gly Arg Asp Asn Phe Val Leu Asp Gly Lys Ser 275 280 285 Asn Met Ser Leu Ile Ser Arg Asp Pro Ala Val Leu Ala Gly Gln Ala 290 295 300 Tyr Gly Lys Gln His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Leu Gly 305 310 315 320 Thr Met Phe Ala Pro Ile Gln Asp Arg Asp Thr Pro Gly Gln Gly Phe 325 330 335 Thr His Lys Val Gly Asp Arg Val Arg Val Ser Thr Pro Lys Leu Gly 340 345 350 Val Leu Glu Asn Glu Val Thr Thr Cys Asp Lys Ala Lys Pro Trp Thr 355 360 365 Phe Gly Ile Ser Ala Leu Ile Arg Asn Leu Ala Gly Arg Gly Leu Leu 370 375 380 <210> 25 <211> 478 <212> PRT <213> Caulobacter crescentus <400> 25 Met Thr Asp Thr Leu Arg His Tyr Ile Gly Gly Glu Arg Val Ala Ala 1 5 10 15 Asp Ala Pro Ala Glu Ser Leu Asn Pro Ser Asn Thr Asn Asp Val Val 20 25 30 Ala Lys Val Pro Met Gly Gly Gln Ala Glu Val Asp Ala Ala Val Asp 35 40 45 Ala Ala Arg Lys Ala Phe Pro Ala Trp Ala Asp Ala Ser Pro Glu Val 50 55 60 Arg Ser Asp Leu Leu Asp Lys Val Gly Ser Thr Ile Ile Ala Arg Ser 65 70 75 80 Ala Asp Ile Gly Arg Leu Leu Ala Arg Glu Glu Gly Lys Thr Leu Ala 85 90 95 Glu Gly Ile Gly Glu Thr Val Arg Ala Gly Arg Ile Phe Lys Tyr Phe 100 105 110 Ala Gly Glu Ala Leu Arg Arg His Gly Gln Asn Leu Glu Ser Thr Arg 115 120 125 Pro Gly Val Glu Ile Gln Thr Tyr Arg Gln Ala Val Gly Val Tyr Gly 130 135 140 Leu Ile Thr Pro Trp Asn Phe Pro Ile Ala Ile Pro Ala Trp Lys Ala 145 150 155 160 Ala Pro Ala Leu Ala Phe Gly Asn Thr Val Val Ile Lys Pro Ala Gly 165 170 175 Pro Thr Pro Ala Thr Ala Asn Val Leu Ala Asp Ile Met Ala Glu Cys 180 185 190 Gly Ala Pro Ala Gly Val Phe Asn Met Leu Phe Gly Arg Gly Ser Met 195 200 205 Gly Asp Ala Leu Ile Lys His Lys Asp Val Asp Gly Val Ser Phe Thr 210 215 220 Gly Ser Gln Gly Val Gly Ala Gln Val Ala Ala Ala Ala Val Ala Arg 225 230 235 240 Gln Ala Arg Val Gln Leu Glu Met Gly Gly Lys Asn Pro Leu Ile Val 245 250 255 Leu Asp Asp Ala Asp Leu Glu Arg Ala Val Ala Ile Ala Leu Asp Gly 260 265 270 Ser Phe Phe Ala Thr Gly Gln Arg Cys Thr Ala Ser Ser Arg Leu Ile 275 280 285 Val Gln Asp Gly Ile His Asp Lys Phe Val Ala Leu Leu Ala Glu Lys 290 295 300 Val Ala Ala Leu Arg Val Gly Asp Ala Leu Asp Pro Asn Thr Gln Ile 305 310 315 320 Gly Pro Ala Val Ser Glu Asp Gln Met Glu Thr Ser Tyr Arg Tyr Ile 325 330 335 Asp Ile Ala Ala Ser Glu Gly Gly Arg Val Val Thr Gly Gly Asp Arg 340 345 350 Ile Lys Leu Asp Asn Pro Gly Trp Tyr Val Arg Pro Thr Leu Ile Ala 355 360 365 Asp Thr Gln Ala Gly Met Arg Ile Asn Asn Glu Glu Val Phe Gly Pro 370 375 380 Val Ala Ser Thr Ile Arg Val Lys Ser Tyr Glu Glu Ala Leu Glu Ile 385 390 395 400 Ala Asn Gly Val Glu Phe Gly Leu Ser Ala Gly Ile Ala Thr Thr Ser 405 410 415 Leu Lys His Ala Arg His Phe Gln Arg Tyr Ala Arg Ala Gly Met Thr 420 425 430 Met Val Asn Leu Ala Thr Ala Gly Val Asp Tyr His Val Pro Phe Gly 435 440 445 Gly Thr Lys Ser Ser Ser Tyr Gly Ala Arg Glu Gln Gly Phe Ala Ala 450 455 460 Val Glu Phe Phe Thr Gln Thr Lys Thr Ser Tyr Ser Trp Ser 465 470 475 <210> 26 <211> 248 <212> PRT <213> Caulobacter crescentus <400> 26 Met Ser Ser Ala Ile Tyr Pro Ser Leu Lys Gly Lys Arg Val Val Ile 1 5 10 15 Thr Gly Gly Gly Ser Gly Ile Gly Ala Gly Leu Thr Ala Gly Phe Ala 20 25 30 Arg Gln Gly Ala Glu Val Ile Phe Leu Asp Ile Ala Asp Glu Asp Ser 35 40 45 Arg Ala Leu Glu Ala Glu Leu Ala Gly Ser Pro Ile Pro Pro Val Tyr 50 55 60 Lys Arg Cys Asp Leu Met Asn Leu Glu Ala Ile Lys Ala Val Phe Ala 65 70 75 80 Glu Ile Gly Asp Val Asp Val Leu Val Asn Asn Ala Gly Asn Asp Asp 85 90 95 Arg His Lys Leu Ala Asp Val Thr Gly Ala Tyr Trp Asp Glu Arg Ile 100 105 110 Asn Val Asn Leu Arg His Met Leu Phe Cys Thr Gln Ala Val Ala Pro 115 120 125 Gly Met Lys Lys Arg Gly Gly Gly Ala Val Ile Asn Phe Gly Ser Ile 130 135 140 Ser Trp His Leu Gly Leu Glu Asp Leu Val Leu Tyr Glu Thr Ala Lys 145 150 155 160 Ala Gly Ile Glu Gly Met Thr Arg Ala Leu Ala Arg Glu Leu Gly Pro 165 170 175 Asp Asp Ile Arg Val Thr Cys Val Val Pro Gly Asn Val Lys Thr Lys 180 185 190 Arg Gln Glu Lys Trp Tyr Thr Pro Glu Gly Glu Ala Gln Ile Val Ala 195 200 205 Ala Gln Cys Leu Lys Gly Arg Ile Val Pro Glu Asn Val Ala Ala Leu 210 215 220 Val Leu Phe Leu Ala Ser Asp Asp Ala Ser Leu Cys Thr Gly His Glu 225 230 235 240 Tyr Trp Ile Asp Ala Gly Trp Arg 245 <210> 27 <211> 289 <212> PRT <213> Caulobacter crescentus <400> 27 Met Thr Ala Gln Val Thr Cys Val Trp Asp Leu Lys Ala Thr Leu Gly 1 5 10 15 Glu Gly Pro Ile Trp His Gly Asp Thr Leu Trp Phe Val Asp Ile Lys 20 25 30 Gln Arg Lys Ile His Asn Tyr His Pro Ala Thr Gly Glu Arg Phe Ser 35 40 45 Phe Asp Ala Pro Asp Gln Val Thr Phe Leu Ala Pro Ile Val Gly Ala 50 55 60 Thr Gly Phe Val Val Gly Leu Lys Thr Gly Ile His Arg Phe His Pro 65 70 75 80 Ala Thr Gly Phe Ser Leu Leu Leu Glu Val Glu Asp Ala Ala Leu Asn 85 90 95 Asn Arg Pro Asn Asp Ala Thr Val Asp Ala Gln Gly Arg Leu Trp Phe 100 105 110 Gly Thr Met His Asp Gly Glu Glu Asn Asn Ser Gly Ser Leu Tyr Arg 115 120 125 Met Asp Leu Thr Gly Val Ala Arg Met Asp Arg Asp Ile Cys Ile Thr 130 135 140 Asn Gly Pro Cys Val Ser Pro Asp Gly Lys Thr Phe Tyr His Thr Asp 145 150 155 160 Thr Leu Glu Lys Thr Ile Tyr Ala Phe Asp Leu Ala Glu Asp Gly Leu 165 170 175 Leu Ser Asn Lys Arg Val Phe Val Gln Phe Ala Leu Gly Asp Asp Val 180 185 190 Tyr Pro Asp Gly Ser Val Val Asp Ser Glu Gly Tyr Leu Trp Thr Ala 195 200 205 Leu Trp Gly Gly Phe Gly Ala Val Arg Phe Ser Pro Gln Gly Asp Ala 210 215 220 Val Thr Arg Ile Glu Leu Pro Ala Pro Asn Val Thr Lys Pro Cys Phe 225 230 235 240 Gly Gly Pro Asp Leu Lys Thr Leu Tyr Phe Thr Thr Ala Arg Lys Gly 245 250 255 Leu Ser Asp Glu Thr Leu Ala Gln Tyr Pro Leu Ala Gly Gly Val Phe 260 265 270 Ala Val Pro Val Asp Val Ala Gly Gln Pro Gln His Glu Val Arg Leu 275 280 285 Val <210> 28 <211> 1788 <212> DNA <213> Caulobacter crescentus <220> <221> CDS <222> (1)..(1788) <400> 28 atg agg tcc gcc ttg tct aac cgc acg ccc cgc cgg ttc cgg tcc cgc 48 Met Arg Ser Ala Leu Ser Asn Arg Thr Pro Arg Arg Phe Arg Ser Arg 1 5 10 15 gat tgg ttc gat aac ccc gac cat atc gac atg acc gcg ctc tat ctg 96 Asp Trp Phe Asp Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu 20 25 30 gag cgc ttc atg aac tac ggg atc acg ccg gag gag ctg cgc agc ggc 144 Glu Arg Phe Met Asn Tyr Gly Ile Thr Pro Glu Glu Leu Arg Ser Gly 35 40 45 aag ccg atc atc ggc atc gcc cag acc ggc agc gac atc tcg ccc tgc 192 Lys Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Ile Ser Pro Cys 50 55 60 aac cgc atc cac ctg gac ctg gtc cag cgg gtg cgg gac ggg atc cgc 240 Asn Arg Ile His Leu Asp Leu Val Gln Arg Val Arg Asp Gly Ile Arg 65 70 75 80 gac gcc ggg ggc atc ccc atg gag ttc ccg gtc cat ccg atc ttc gag 288 Asp Ala Gly Gly Ile Pro Met Glu Phe Pro Val His Pro Ile Phe Glu 85 90 95 aac tgc cgt cgc ccg acg gcg gcg ctg gac cgg aac ctc tcg tac ctg 336 Asn Cys Arg Arg Pro Thr Ala Ala Leu Asp Arg Asn Leu Ser Tyr Leu 100 105 110 ggt ctc gtc gag acc ctg cac ggc tat ccg atc gac gcc gtg gtt ctg 384 Gly Leu Val Glu Thr Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu 115 120 125 acc acc ggc tgc gac aag acc acc ccg gcc ggg atc atg gcc gcc acc 432 Thr Thr Gly Cys Asp Lys Thr Thr Pro Ala Gly Ile Met Ala Ala Thr 130 135 140 acg gtc aat atc ccg gcc atc gtg ctg tcg ggc ggc ccg atg ctg gac 480 Thr Val Asn Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp 145 150 155 160 ggc tgg cac gag aac gag ctc gtg ggc tcg ggc acc gtg atc tgg cgc 528 Gly Trp His Glu Asn Glu Leu Val Gly Ser Gly Thr Val Ile Trp Arg 165 170 175 tcg cgc cgc aag ctg gcg gcc ggc gag atc acc gag gaa gag ttc atc 576 Ser Arg Arg Lys Leu Ala Ala Gly Glu Ile Thr Glu Glu Glu Phe Ile 180 185 190 gac cgc gcc gcc agc tcg gcg ccg tcg gcg ggc cac tgc aac acc atg 624 Asp Arg Ala Ala Ser Ser Ala Pro Ser Ala Gly His Cys Asn Thr Met 195 200 205 ggc acg gcc tcg acc atg aac gcc gtg gcc gag gcg ctg ggc ctg tcg 672 Gly Thr Ala Ser Thr Met Asn Ala Val Ala Glu Ala Leu Gly Leu Ser 210 215 220 ctg acc ggc tgc gcg gcc atc ccc gcc ccc tac cgc gag cgc ggc cag 720 Leu Thr Gly Cys Ala Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln 225 230 235 240 atg gcc tac aag acc ggc cag cgc atc gtc gat ctg gcc tat gac gac 768 Met Ala Tyr Lys Thr Gly Gln Arg Ile Val Asp Leu Ala Tyr Asp Asp 245 250 255 gtc aaa ccg ctc gac atc ctg acc aag caa gcc ttc gag aac gcc atc 816 Val Lys Pro Leu Asp Ile Leu Thr Lys Gln Ala Phe Glu Asn Ala Ile 260 265 270 gcc ctg gtg gcg gcg gcc ggc ggc tcg acc aac gcc cag ccg cac atc 864 Ala Leu Val Ala Ala Ala Gly Gly Ser Thr Asn Ala Gln Pro His Ile 275 280 285 gtg gcc atg gcc cgt cac gcc ggc gtc gag atc acc gcc gac gac tgg 912 Val Ala Met Ala Arg His Ala Gly Val Glu Ile Thr Ala Asp Asp Trp 290 295 300 cgc gcg gcc tat gac atc ccg ctg atc gtc aac atg cag ccg gcc ggc 960 Arg Ala Ala Tyr Asp Ile Pro Leu Ile Val Asn Met Gln Pro Ala Gly 305 310 315 320 aag tat ctg ggc gag cgc ttc cac cga gcc ggc ggc gcg ccg gcg gtg 1008 Lys Tyr Leu Gly Glu Arg Phe His Arg Ala Gly Gly Ala Pro Ala Val 325 330 335 ctg tgg gag ctg ttg cag caa ggc cgc ctg cac ggc gac gtg ctg acc 1056 Leu Trp Glu Leu Leu Gln Gln Gly Arg Leu His Gly Asp Val Leu Thr 340 345 350 gtc acc ggc aag acg atg agc gag aac ctg caa ggc cgc gaa acc agc 1104 Val Thr Gly Lys Thr Met Ser Glu Asn Leu Gln Gly Arg Glu Thr Ser 355 360 365 gac cgc gag gtg atc ttc ccg tac cac gag ccg ctg gcc gag aag gcc 1152 Asp Arg Glu Val Ile Phe Pro Tyr His Glu Pro Leu Ala Glu Lys Ala 370 375 380 ggg ttc ctg gtt ctc aag ggc aac ctc ttc gac ttc gcg atc atg aag 1200 Gly Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys 385 390 395 400 tcc agc gtg atc ggc gag gag ttc cgc aag cgc tac ctg tcg cag ccc 1248 Ser Ser Val Ile Gly Glu Glu Phe Arg Lys Arg Tyr Leu Ser Gln Pro 405 410 415 ggc cag gaa ggc gtg ttc gaa gcc cgc gcc atc gtg ttc gac ggc tcg 1296 Gly Gln Glu Gly Val Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Ser 420 425 430 gac gac tat cac aag cgg atc aac gat ccg gcc ctg gag atc gac gag 1344 Asp Asp Tyr His Lys Arg Ile Asn Asp Pro Ala Leu Glu Ile Asp Glu 435 440 445 cgc tgc atc ctg gtg atc cgc ggc gcg ggt ccg atc ggc tgg ccc ggc 1392 Arg Cys Ile Leu Val Ile Arg Gly Ala Gly Pro Ile Gly Trp Pro Gly 450 455 460 tcg gcc gag gtc gtc aac atg cag ccg ccg gat cac ctt ctg aag aag 1440 Ser Ala Glu Val Val Asn Met Gln Pro Pro Asp His Leu Leu Lys Lys 465 470 475 480 ggg atc atg agc ctg ccc acc ctg ggc gat ggc cgt cag tcg ggc acc 1488 Gly Ile Met Ser Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr 485 490 495 gcc gac agc ccc tcg atc ctg aac gcc tcg ccc gaa agc gcg atc ggc 1536 Ala Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ile Gly 500 505 510 ggc ggc ctg tcg tgg ctg cgc acc ggc gac acc atc cgc atc gac ctc 1584 Gly Gly Leu Ser Trp Leu Arg Thr Gly Asp Thr Ile Arg Ile Asp Leu 515 520 525 aac acc ggc cgc tgc gac gcc ctg gtc gac gag gcg acg atc gcc gcg 1632 Asn Thr Gly Arg Cys Asp Ala Leu Val Asp Glu Ala Thr Ile Ala Ala 530 535 540 cgc aag cag gac ggc atc ccg gcg gtt ccc gcc acc atg acg ccc tgg 1680 Arg Lys Gln Asp Gly Ile Pro Ala Val Pro Ala Thr Met Thr Pro Trp 545 550 555 560 cag gaa atc tac cgc gcc cac gcc agt cag ctc gac acc ggc ggc gtg 1728 Gln Glu Ile Tyr Arg Ala His Ala Ser Gln Leu Asp Thr Gly Gly Val 565 570 575 ctg gag ttc gcg gtc aag tac cag gac ctg gcg gcc aag ctg ccc cgc 1776 Leu Glu Phe Ala Val Lys Tyr Gln Asp Leu Ala Ala Lys Leu Pro Arg 580 585 590 cac aac cac tga 1788 His Asn His 595 <210> 29 <211> 595 <212> PRT <213> Caulobacter crescentus <400> 29 Met Arg Ser Ala Leu Ser Asn Arg Thr Pro Arg Arg Phe Arg Ser Arg 1 5 10 15 Asp Trp Phe Asp Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu 20 25 30 Glu Arg Phe Met Asn Tyr Gly Ile Thr Pro Glu Glu Leu Arg Ser Gly 35 40 45 Lys Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Ile Ser Pro Cys 50 55 60 Asn Arg Ile His Leu Asp Leu Val Gln Arg Val Arg Asp Gly Ile Arg 65 70 75 80 Asp Ala Gly Gly Ile Pro Met Glu Phe Pro Val His Pro Ile Phe Glu 85 90 95 Asn Cys Arg Arg Pro Thr Ala Ala Leu Asp Arg Asn Leu Ser Tyr Leu 100 105 110 Gly Leu Val Glu Thr Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu 115 120 125 Thr Thr Gly Cys Asp Lys Thr Thr Pro Ala Gly Ile Met Ala Ala Thr 130 135 140 Thr Val Asn Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp 145 150 155 160 Gly Trp His Glu Asn Glu Leu Val Gly Ser Gly Thr Val Ile Trp Arg 165 170 175 Ser Arg Arg Lys Leu Ala Ala Gly Glu Ile Thr Glu Glu Glu Phe Ile 180 185 190 Asp Arg Ala Ala Ser Ser Ala Pro Ser Ala Gly His Cys Asn Thr Met 195 200 205 Gly Thr Ala Ser Thr Met Asn Ala Val Ala Glu Ala Leu Gly Leu Ser 210 215 220 Leu Thr Gly Cys Ala Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln 225 230 235 240 Met Ala Tyr Lys Thr Gly Gln Arg Ile Val Asp Leu Ala Tyr Asp Asp 245 250 255 Val Lys Pro Leu Asp Ile Leu Thr Lys Gln Ala Phe Glu Asn Ala Ile 260 265 270 Ala Leu Val Ala Ala Ala Gly Gly Ser Thr Asn Ala Gln Pro His Ile 275 280 285 Val Ala Met Ala Arg His Ala Gly Val Glu Ile Thr Ala Asp Asp Trp 290 295 300 Arg Ala Ala Tyr Asp Ile Pro Leu Ile Val Asn Met Gln Pro Ala Gly 305 310 315 320 Lys Tyr Leu Gly Glu Arg Phe His Arg Ala Gly Gly Ala Pro Ala Val 325 330 335 Leu Trp Glu Leu Leu Gln Gln Gly Arg Leu His Gly Asp Val Leu Thr 340 345 350 Val Thr Gly Lys Thr Met Ser Glu Asn Leu Gln Gly Arg Glu Thr Ser 355 360 365 Asp Arg Glu Val Ile Phe Pro Tyr His Glu Pro Leu Ala Glu Lys Ala 370 375 380 Gly Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys 385 390 395 400 Ser Ser Val Ile Gly Glu Glu Phe Arg Lys Arg Tyr Leu Ser Gln Pro 405 410 415 Gly Gln Glu Gly Val Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Ser 420 425 430 Asp Asp Tyr His Lys Arg Ile Asn Asp Pro Ala Leu Glu Ile Asp Glu 435 440 445 Arg Cys Ile Leu Val Ile Arg Gly Ala Gly Pro Ile Gly Trp Pro Gly 450 455 460 Ser Ala Glu Val Val Asn Met Gln Pro Pro Asp His Leu Leu Lys Lys 465 470 475 480 Gly Ile Met Ser Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr 485 490 495 Ala Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ile Gly 500 505 510 Gly Gly Leu Ser Trp Leu Arg Thr Gly Asp Thr Ile Arg Ile Asp Leu 515 520 525 Asn Thr Gly Arg Cys Asp Ala Leu Val Asp Glu Ala Thr Ile Ala Ala 530 535 540 Arg Lys Gln Asp Gly Ile Pro Ala Val Pro Ala Thr Met Thr Pro Trp 545 550 555 560 Gln Glu Ile Tyr Arg Ala His Ala Ser Gln Leu Asp Thr Gly Gly Val 565 570 575 Leu Glu Phe Ala Val Lys Tyr Gln Asp Leu Ala Ala Lys Leu Pro Arg 580 585 590 His Asn His 595 <210> 30 <211> 1476 <212> DNA <213> Escherichia coli <220> <221> CDS <222> (1)..(1476) <400> 30 atg aat acc cag tat aat tcc agt tat ata ttt tcg att acc tta gtc 48 Met Asn Thr Gln Tyr Asn Ser Ser Tyr Ile Phe Ser Ile Thr Leu Val 1 5 10 15 gct aca tta ggt ggt tta tta ttt ggc tac gac acc gcc gtt att tcc 96 Ala Thr Leu Gly Gly Leu Leu Phe Gly Tyr Asp Thr Ala Val Ile Ser 20 25 30 ggt act gtt gag tca ctc aat acc gtc ttt gtt gct cca caa aac tta 144 Gly Thr Val Glu Ser Leu Asn Thr Val Phe Val Ala Pro Gln Asn Leu 35 40 45 agt gaa tcc gct gcc aac tcc ctg tta ggg ttt tgc gtg gcc agc gct 192 Ser Glu Ser Ala Ala Asn Ser Leu Leu Gly Phe Cys Val Ala Ser Ala 50 55 60 ctg att ggt tgc atc atc ggc ggt gcc ctc ggt ggt tat tgc agt aac 240 Leu Ile Gly Cys Ile Ile Gly Gly Ala Leu Gly Gly Tyr Cys Ser Asn 65 70 75 80 cgc ttc ggt cgt cgt gat tca ctt aag att gct gct gtc ctg ttt ttt 288 Arg Phe Gly Arg Arg Asp Ser Leu Lys Ile Ala Ala Val Leu Phe Phe 85 90 95 att tct ggt gta ggt tct gcc tgg cca gaa ctt ggt ttt acc tct ata 336 Ile Ser Gly Val Gly Ser Ala Trp Pro Glu Leu Gly Phe Thr Ser Ile 100 105 110 aac ccg gac aac act gtg cct gtt tat ctg gca ggt tat gtc ccg gaa 384 Asn Pro Asp Asn Thr Val Pro Val Tyr Leu Ala Gly Tyr Val Pro Glu 115 120 125 ttt gtt att tat cgc att att ggc ggt att ggc gtt ggt tta gcc tca 432 Phe Val Ile Tyr Arg Ile Ile Gly Gly Ile Gly Val Gly Leu Ala Ser 130 135 140 atg ctc tcg cca atg tat att gcg gaa ctg gct cca gct cat att cgc 480 Met Leu Ser Pro Met Tyr Ile Ala Glu Leu Ala Pro Ala His Ile Arg 145 150 155 160 ggg aaa ctg gtc tct ttt aac cag ttt gcg att att ttc ggg caa ctt 528 Gly Lys Leu Val Ser Phe Asn Gln Phe Ala Ile Ile Phe Gly Gln Leu 165 170 175 tta gtt tac tgc gta aac tat ttt att gcc cgt tcc ggt gat gcc agc 576 Leu Val Tyr Cys Val Asn Tyr Phe Ile Ala Arg Ser Gly Asp Ala Ser 180 185 190 tgg ctg aat act gac ggc tgg cgt tat atg ttt gcc tcg gaa tgt atc 624 Trp Leu Asn Thr Asp Gly Trp Arg Tyr Met Phe Ala Ser Glu Cys Ile 195 200 205 cct gca ctg ctg ttc tta atg ctg ctg tat acc gtg cca gaa agt cct 672 Pro Ala Leu Leu Phe Leu Met Leu Leu Tyr Thr Val Pro Glu Ser Pro 210 215 220 cgc tgg ctg atg tcg cgc ggc aag caa gaa cag gcg gaa ggt atc ctg 720 Arg Trp Leu Met Ser Arg Gly Lys Gln Glu Gln Ala Glu Gly Ile Leu 225 230 235 240 cgc aaa att atg ggc aac acg ctt gca act cag gca gta cag gaa att 768 Arg Lys Ile Met Gly Asn Thr Leu Ala Thr Gln Ala Val Gln Glu Ile 245 250 255 aaa cac tcc ctg gat cat ggc cgc aaa acc ggt ggt cgt ctg ctg atg 816 Lys His Ser Leu Asp His Gly Arg Lys Thr Gly Gly Arg Leu Leu Met 260 265 270 ttt ggc gtg ggc gtg att gta atc ggc gta atg ctc tcc atc ttc cag 864 Phe Gly Val Gly Val Ile Val Ile Gly Val Met Leu Ser Ile Phe Gln 275 280 285 caa ttt gtc ggc atc aat gtg gtg ctg tac tac gcg ccg gaa gtg ttc 912 Gln Phe Val Gly Ile Asn Val Val Leu Tyr Tyr Ala Pro Glu Val Phe 290 295 300 aaa acg ctg ggg gcc agc acg gat atc gcg ctg ttg cag acc att att 960 Lys Thr Leu Gly Ala Ser Thr Asp Ile Ala Leu Leu Gln Thr Ile Ile 305 310 315 320 gtc gga gtt atc aac ctc acc ttc acc gtt ctg gca att atg acg gtg 1008 Val Gly Val Ile Asn Leu Thr Phe Thr Val Leu Ala Ile Met Thr Val 325 330 335 gat aaa ttt ggt cgt aag cca ctg caa att atc ggc gca ctc gga atg 1056 Asp Lys Phe Gly Arg Lys Pro Leu Gln Ile Ile Gly Ala Leu Gly Met 340 345 350 gca atc ggt atg ttt agc ctc ggt acc gcg ttt tac act cag gca ccg 1104 Ala Ile Gly Met Phe Ser Leu Gly Thr Ala Phe Tyr Thr Gln Ala Pro 355 360 365 ggt att gtg gcg cta ctg tcg atg ctg ttc tat gtt gcc gcc ttt gcc 1152 Gly Ile Val Ala Leu Leu Ser Met Leu Phe Tyr Val Ala Ala Phe Ala 370 375 380 atg tcc tgg ggt ccg gta tgc tgg gta ctg ctg tcg gaa atc ttc ccg 1200 Met Ser Trp Gly Pro Val Cys Trp Val Leu Leu Ser Glu Ile Phe Pro 385 390 395 400 aat gct att cgt ggt aaa gcg ctg gca atc gcg gtg gcg gcc cag tgg 1248 Asn Ala Ile Arg Gly Lys Ala Leu Ala Ile Ala Val Ala Ala Gln Trp 405 410 415 ctg gcg aac tac ttc gtc tcc tgg acc ttc ccg atg atg gac aaa aac 1296 Leu Ala Asn Tyr Phe Val Ser Trp Thr Phe Pro Met Met Asp Lys Asn 420 425 430 tcc tgg ctg gtg gcc cat ttc cac aac ggt ttc tcc tac tgg att tac 1344 Ser Trp Leu Val Ala His Phe His Asn Gly Phe Ser Tyr Trp Ile Tyr 435 440 445 ggt tgt atg ggc gtt ctg gca gca ctg ttt atg tgg aaa ttt gtc ccg 1392 Gly Cys Met Gly Val Leu Ala Ala Leu Phe Met Trp Lys Phe Val Pro 450 455 460 gaa acc aaa ggt aaa acc ctt gag gag ctg gaa gcg ctc tgg gaa ccg 1440 Glu Thr Lys Gly Lys Thr Leu Glu Glu Leu Glu Ala Leu Trp Glu Pro 465 470 475 480 gaa acg aag aaa aca caa caa act gct acg ctg taa 1476 Glu Thr Lys Lys Thr Gln Gln Thr Ala Thr Leu 485 490 <210> 31 <211> 491 <212> PRT <213> Escherichia coli <400> 31 Met Asn Thr Gln Tyr Asn Ser Ser Tyr Ile Phe Ser Ile Thr Leu Val 1 5 10 15 Ala Thr Leu Gly Gly Leu Leu Phe Gly Tyr Asp Thr Ala Val Ile Ser 20 25 30 Gly Thr Val Glu Ser Leu Asn Thr Val Phe Val Ala Pro Gln Asn Leu 35 40 45 Ser Glu Ser Ala Ala Asn Ser Leu Leu Gly Phe Cys Val Ala Ser Ala 50 55 60 Leu Ile Gly Cys Ile Ile Gly Gly Ala Leu Gly Gly Tyr Cys Ser Asn 65 70 75 80 Arg Phe Gly Arg Arg Asp Ser Leu Lys Ile Ala Ala Val Leu Phe Phe 85 90 95 Ile Ser Gly Val Gly Ser Ala Trp Pro Glu Leu Gly Phe Thr Ser Ile 100 105 110 Asn Pro Asp Asn Thr Val Pro Val Tyr Leu Ala Gly Tyr Val Pro Glu 115 120 125 Phe Val Ile Tyr Arg Ile Ile Gly Gly Ile Gly Val Gly Leu Ala Ser 130 135 140 Met Leu Ser Pro Met Tyr Ile Ala Glu Leu Ala Pro Ala His Ile Arg 145 150 155 160 Gly Lys Leu Val Ser Phe Asn Gln Phe Ala Ile Ile Phe Gly Gln Leu 165 170 175 Leu Val Tyr Cys Val Asn Tyr Phe Ile Ala Arg Ser Gly Asp Ala Ser 180 185 190 Trp Leu Asn Thr Asp Gly Trp Arg Tyr Met Phe Ala Ser Glu Cys Ile 195 200 205 Pro Ala Leu Leu Phe Leu Met Leu Leu Tyr Thr Val Pro Glu Ser Pro 210 215 220 Arg Trp Leu Met Ser Arg Gly Lys Gln Glu Gln Ala Glu Gly Ile Leu 225 230 235 240 Arg Lys Ile Met Gly Asn Thr Leu Ala Thr Gln Ala Val Gln Glu Ile 245 250 255 Lys His Ser Leu Asp His Gly Arg Lys Thr Gly Gly Arg Leu Leu Met 260 265 270 Phe Gly Val Gly Val Ile Val Ile Gly Val Met Leu Ser Ile Phe Gln 275 280 285 Gln Phe Val Gly Ile Asn Val Val Leu Tyr Tyr Ala Pro Glu Val Phe 290 295 300 Lys Thr Leu Gly Ala Ser Thr Asp Ile Ala Leu Leu Gln Thr Ile Ile 305 310 315 320 Val Gly Val Ile Asn Leu Thr Phe Thr Val Leu Ala Ile Met Thr Val 325 330 335 Asp Lys Phe Gly Arg Lys Pro Leu Gln Ile Ile Gly Ala Leu Gly Met 340 345 350 Ala Ile Gly Met Phe Ser Leu Gly Thr Ala Phe Tyr Thr Gln Ala Pro 355 360 365 Gly Ile Val Ala Leu Leu Ser Met Leu Phe Tyr Val Ala Ala Phe Ala 370 375 380 Met Ser Trp Gly Pro Val Cys Trp Val Leu Leu Ser Glu Ile Phe Pro 385 390 395 400 Asn Ala Ile Arg Gly Lys Ala Leu Ala Ile Ala Val Ala Ala Gln Trp 405 410 415 Leu Ala Asn Tyr Phe Val Ser Trp Thr Phe Pro Met Met Asp Lys Asn 420 425 430 Ser Trp Leu Val Ala His Phe His Asn Gly Phe Ser Tyr Trp Ile Tyr 435 440 445 Gly Cys Met Gly Val Leu Ala Ala Leu Phe Met Trp Lys Phe Val Pro 450 455 460 Glu Thr Lys Gly Lys Thr Leu Glu Glu Leu Glu Ala Leu Trp Glu Pro 465 470 475 480 Glu Thr Lys Lys Thr Gln Gln Thr Ala Thr Leu 485 490 <210> 32 <211> 399 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA PtacTtrp <400> 32 ggtaccagat ctccctgttg acaattaatc atcggctcta taatgtgtgg aatcgtgagc 60 ggataacaat ttcacacaag gagactcccg ggagccgcca gttccgctgg cggcatttta 120 actttcttta atgaagccgg aaaaatccta aattcattta atatttatct ttttaccgtt 180 tcgcttaccc cggtcgaacg tcaacttacg tcatttttcc gcccaacagt aatataatca 240 aacaaattaa tcccgcaaca taacaccagt aaaatcaata attttctcta agtcacttat 300 tcctcaggta attgttaata tatccagaat gttcctcaaa atatattttc cctctatctt 360 ctcgttgcgc ttaatttgac taattctcat tagggatcc 399 <210> 33 <211> 362 <212> DNA <213> Brevibacterium flavum <400> 33 agatcgttta gatccgaagg aaaacgtcga aaagcaattt gcttttcgac gccccacccc 60 gcgcgtttta gcgtgtcagt aggcgcgtag ggtaagtggg gtagcggctt gttagatatc 120 ttgaaatcgg ctttcaacag cattgatttc gatgtattta gctggccgtt accctgcgaa 180 tgtccacagg gtagctggta gtttgaaaat caacgccgtt gcccttagga ttcagtaact 240 ggcacatttt gtaatgcgct agatctgtgt gctcagtctt ccaggctgct tatcacagtg 300 aaagcaaaac caattcgtgg ctgcgaaagt cgtagccacc acgaagtcca ggaggacata 360 ca 362 <210> 34 <211> 1968 <212> DNA <213> Escherichia coli <220> <221> CDS <222> (1)..(1968) <400> 34 atg tct gtt cgc aat att ttt gct gac gag agc cac gat att tac acc 48 Met Ser Val Arg Asn Ile Phe Ala Asp Glu Ser His Asp Ile Tyr Thr 1 5 10 15 gtc aga acg cac gcc gat ggc ccg gac ggc gaa ctc cca tta acc gca 96 Val Arg Thr His Ala Asp Gly Pro Asp Gly Glu Leu Pro Leu Thr Ala 20 25 30 gag atg ctt atc aac cgc ccg agc ggg gat ctg ttc ggt atg acc atg 144 Glu Met Leu Ile Asn Arg Pro Ser Gly Asp Leu Phe Gly Met Thr Met 35 40 45 aat gcc gga atg ggt tgg tct ccg gac gag ctg gat cgg gac ggt att 192 Asn Ala Gly Met Gly Trp Ser Pro Asp Glu Leu Asp Arg Asp Gly Ile 50 55 60 tta ctg ctc agt aca ctc ggt ggc tta cgc ggc gca gac ggt aaa ccc 240 Leu Leu Leu Ser Thr Leu Gly Gly Leu Arg Gly Ala Asp Gly Lys Pro 65 70 75 80 gtg gcg ctg gcg ttg cac cag ggg cat tac gaa ctg gac atc cag atg 288 Val Ala Leu Ala Leu His Gln Gly His Tyr Glu Leu Asp Ile Gln Met 85 90 95 aaa gcg gcg gcc gag gtt att aaa gcc aac cat gcc ctg ccc tat gcc 336 Lys Ala Ala Ala Glu Val Ile Lys Ala Asn His Ala Leu Pro Tyr Ala 100 105 110 gtg tac gtc tcc gat cct tgt gac ggg cgt act cag ggt aca acg ggg 384 Val Tyr Val Ser Asp Pro Cys Asp Gly Arg Thr Gln Gly Thr Thr Gly 115 120 125 atg ttt gat tcg cta cca tac cga aat gac gca tcg atg gta atg cgc 432 Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ser Met Val Met Arg 130 135 140 cgc ctt att cgc tct ctg ccc gac gcg aaa gca gtt att ggt gtg gcg 480 Arg Leu Ile Arg Ser Leu Pro Asp Ala Lys Ala Val Ile Gly Val Ala 145 150 155 160 agt tgc gat aag ggg ctt ccg gcc acc atg atg gca ctc gcc gcg cag 528 Ser Cys Asp Lys Gly Leu Pro Ala Thr Met Met Ala Leu Ala Ala Gln 165 170 175 cac aac atc gca acc gtg ctg gtc ccc ggc ggc gcg acg ctg ccc gca 576 His Asn Ile Ala Thr Val Leu Val Pro Gly Gly Ala Thr Leu Pro Ala 180 185 190 aag gat gga gaa gac aac ggc aag gtg caa acc att ggc gca cgc ttc 624 Lys Asp Gly Glu Asp Asn Gly Lys Val Gln Thr Ile Gly Ala Arg Phe 195 200 205 gcc aat ggc gaa tta tct cta cag gac gca cgc cgt gcg ggc tgt aaa 672 Ala Asn Gly Glu Leu Ser Leu Gln Asp Ala Arg Arg Ala Gly Cys Lys 210 215 220 gcc tgt gcc tct tcc ggc ggc ggc tgt caa ttt ttg ggc act gcc ggg 720 Ala Cys Ala Ser Ser Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly 225 230 235 240 aca tct cag gtg gtg gcc gaa gga ttg gga ctg gca atc cca cat tca 768 Thr Ser Gln Val Val Ala Glu Gly Leu Gly Leu Ala Ile Pro His Ser 245 250 255 gcc ctg gcc cct tcc ggt gag cct gtg tgg cgg gag atc gcc aga gct 816 Ala Leu Ala Pro Ser Gly Glu Pro Val Trp Arg Glu Ile Ala Arg Ala 260 265 270 tcc gcg cga gct gcg ctg aac ctg agt caa aaa ggc atc acc acc cgg 864 Ser Ala Arg Ala Ala Leu Asn Leu Ser Gln Lys Gly Ile Thr Thr Arg 275 280 285 gaa att ctc acc gat aaa gcg ata gag aat gcg atg acg gtc cat gcc 912 Glu Ile Leu Thr Asp Lys Ala Ile Glu Asn Ala Met Thr Val His Ala 290 295 300 gcg ttc ggt ggt tca aca aac ctg ctg tta cac atc ccg gca att gct 960 Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala 305 310 315 320 cac cag gca ggt tgc cat atc ccg acc gtt gat gac tgg atc cgc atc 1008 His Gln Ala Gly Cys His Ile Pro Thr Val Asp Asp Trp Ile Arg Ile 325 330 335 aac aag cgc gtg ccc cga ctg gtg agc gta ctg cct aat ggc ccg gtt 1056 Asn Lys Arg Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Val 340 345 350 tat cat cca acg gtc aat gcc ttt atg gca ggt ggt gtg ccg gaa gtc 1104 Tyr His Pro Thr Val Asn Ala Phe Met Ala Gly Gly Val Pro Glu Val 355 360 365 atg ttg cat ctg cgc agc ctc gga ttg ttg cat gaa gac gtt atg acg 1152 Met Leu His Leu Arg Ser Leu Gly Leu Leu His Glu Asp Val Met Thr 370 375 380 gtt acc ggc agc acg ctg aaa gaa aac ctc gac tgg tgg gag cac tcc 1200 Val Thr Gly Ser Thr Leu Lys Glu Asn Leu Asp Trp Trp Glu His Ser 385 390 395 400 gaa cgg cgt cag cgg ttc aag caa ctc ctg ctc gat cag gaa caa atc 1248 Glu Arg Arg Gln Arg Phe Lys Gln Leu Leu Leu Asp Gln Glu Gln Ile 405 410 415 aac gct gac gaa gtg atc atg tct ccg cag caa gca aaa gcg cgc gga 1296 Asn Ala Asp Glu Val Ile Met Ser Pro Gln Gln Ala Lys Ala Arg Gly 420 425 430 tta acc tca act atc acc ttc ccg gtg ggc aat att gcg cca gaa ggt 1344 Leu Thr Ser Thr Ile Thr Phe Pro Val Gly Asn Ile Ala Pro Glu Gly 435 440 445 tcg gtg atc aaa tcc acc gcc att gac ccc tcg atg att gat gag caa 1392 Ser Val Ile Lys Ser Thr Ala Ile Asp Pro Ser Met Ile Asp Glu Gln 450 455 460 ggt atc tat tac cat aaa ggt gtg gcg aag gtt tat ctg tcc gag aaa 1440 Gly Ile Tyr Tyr His Lys Gly Val Ala Lys Val Tyr Leu Ser Glu Lys 465 470 475 480 agt gcg att tac gat atc aaa cat gac aag atc aag gcg ggc gat att 1488 Ser Ala Ile Tyr Asp Ile Lys His Asp Lys Ile Lys Ala Gly Asp Ile 485 490 495 ctg gtc att att ggc gtt gga cct tca ggt aca ggg atg gaa gaa acc 1536 Leu Val Ile Ile Gly Val Gly Pro Ser Gly Thr Gly Met Glu Glu Thr 500 505 510 tac cag gtt acc agt gcc ctg aag cat ctg tca tac ggt aag cat gtt 1584 Tyr Gln Val Thr Ser Ala Leu Lys His Leu Ser Tyr Gly Lys His Val 515 520 525 tcg tta atc acc gat gca cgt ttc tcg ggc gtt tct act ggc gcg tgc 1632 Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys 530 535 540 atc ggc cat gtg ggg cca gaa gcg ctg gcc gga ggc ccc atc ggt aaa 1680 Ile Gly His Val Gly Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys 545 550 555 560 tta cgc acc ggg gat tta att gaa att aaa att gat tgt cgc gag ctt 1728 Leu Arg Thr Gly Asp Leu Ile Glu Ile Lys Ile Asp Cys Arg Glu Leu 565 570 575 cac ggc gaa gtc aat ttc ctc gga acc cgt agc gat gaa caa tta cct 1776 His Gly Glu Val Asn Phe Leu Gly Thr Arg Ser Asp Glu Gln Leu Pro 580 585 590 tca cag gag gag gca act gca ata tta aat gcc aga ccc agc cat cag 1824 Ser Gln Glu Glu Ala Thr Ala Ile Leu Asn Ala Arg Pro Ser His Gln 595 600 605 gat tta ctt ccc gat cct gaa ttg cca gat gat acc cgg cta tgg gca 1872 Asp Leu Leu Pro Asp Pro Glu Leu Pro Asp Asp Thr Arg Leu Trp Ala 610 615 620 atg ctt cag gcc gtg agt ggt ggg aca tgg acc ggt tgt att tat gat 1920 Met Leu Gln Ala Val Ser Gly Gly Thr Trp Thr Gly Cys Ile Tyr Asp 625 630 635 640 gta aac aaa att ggc gcg gct ttg cgc gat ttt atg aat aaa aac tga 1968 Val Asn Lys Ile Gly Ala Ala Leu Arg Asp Phe Met Asn Lys Asn 645 650 655 <210> 35 <211> 655 <212> PRT <213> Escherichia coli <400> 35 Met Ser Val Arg Asn Ile Phe Ala Asp Glu Ser His Asp Ile Tyr Thr 1 5 10 15 Val Arg Thr His Ala Asp Gly Pro Asp Gly Glu Leu Pro Leu Thr Ala 20 25 30 Glu Met Leu Ile Asn Arg Pro Ser Gly Asp Leu Phe Gly Met Thr Met 35 40 45 Asn Ala Gly Met Gly Trp Ser Pro Asp Glu Leu Asp Arg Asp Gly Ile 50 55 60 Leu Leu Leu Ser Thr Leu Gly Gly Leu Arg Gly Ala Asp Gly Lys Pro 65 70 75 80 Val Ala Leu Ala Leu His Gln Gly His Tyr Glu Leu Asp Ile Gln Met 85 90 95 Lys Ala Ala Ala Glu Val Ile Lys Ala Asn His Ala Leu Pro Tyr Ala 100 105 110 Val Tyr Val Ser Asp Pro Cys Asp Gly Arg Thr Gln Gly Thr Thr Gly 115 120 125 Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ser Met Val Met Arg 130 135 140 Arg Leu Ile Arg Ser Leu Pro Asp Ala Lys Ala Val Ile Gly Val Ala 145 150 155 160 Ser Cys Asp Lys Gly Leu Pro Ala Thr Met Met Ala Leu Ala Ala Gln 165 170 175 His Asn Ile Ala Thr Val Leu Val Pro Gly Gly Ala Thr Leu Pro Ala 180 185 190 Lys Asp Gly Glu Asp Asn Gly Lys Val Gln Thr Ile Gly Ala Arg Phe 195 200 205 Ala Asn Gly Glu Leu Ser Leu Gln Asp Ala Arg Arg Ala Gly Cys Lys 210 215 220 Ala Cys Ala Ser Ser Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly 225 230 235 240 Thr Ser Gln Val Val Ala Glu Gly Leu Gly Leu Ala Ile Pro His Ser 245 250 255 Ala Leu Ala Pro Ser Gly Glu Pro Val Trp Arg Glu Ile Ala Arg Ala 260 265 270 Ser Ala Arg Ala Ala Leu Asn Leu Ser Gln Lys Gly Ile Thr Thr Arg 275 280 285 Glu Ile Leu Thr Asp Lys Ala Ile Glu Asn Ala Met Thr Val His Ala 290 295 300 Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala 305 310 315 320 His Gln Ala Gly Cys His Ile Pro Thr Val Asp Asp Trp Ile Arg Ile 325 330 335 Asn Lys Arg Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Val 340 345 350 Tyr His Pro Thr Val Asn Ala Phe Met Ala Gly Gly Val Pro Glu Val 355 360 365 Met Leu His Leu Arg Ser Leu Gly Leu Leu His Glu Asp Val Met Thr 370 375 380 Val Thr Gly Ser Thr Leu Lys Glu Asn Leu Asp Trp Trp Glu His Ser 385 390 395 400 Glu Arg Arg Gln Arg Phe Lys Gln Leu Leu Leu Asp Gln Glu Gln Ile 405 410 415 Asn Ala Asp Glu Val Ile Met Ser Pro Gln Gln Ala Lys Ala Arg Gly 420 425 430 Leu Thr Ser Thr Ile Thr Phe Pro Val Gly Asn Ile Ala Pro Glu Gly 435 440 445 Ser Val Ile Lys Ser Thr Ala Ile Asp Pro Ser Met Ile Asp Glu Gln 450 455 460 Gly Ile Tyr Tyr His Lys Gly Val Ala Lys Val Tyr Leu Ser Glu Lys 465 470 475 480 Ser Ala Ile Tyr Asp Ile Lys His Asp Lys Ile Lys Ala Gly Asp Ile 485 490 495 Leu Val Ile Ile Gly Val Gly Pro Ser Gly Thr Gly Met Glu Glu Thr 500 505 510 Tyr Gln Val Thr Ser Ala Leu Lys His Leu Ser Tyr Gly Lys His Val 515 520 525 Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys 530 535 540 Ile Gly His Val Gly Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys 545 550 555 560 Leu Arg Thr Gly Asp Leu Ile Glu Ile Lys Ile Asp Cys Arg Glu Leu 565 570 575 His Gly Glu Val Asn Phe Leu Gly Thr Arg Ser Asp Glu Gln Leu Pro 580 585 590 Ser Gln Glu Glu Ala Thr Ala Ile Leu Asn Ala Arg Pro Ser His Gln 595 600 605 Asp Leu Leu Pro Asp Pro Glu Leu Pro Asp Asp Thr Arg Leu Trp Ala 610 615 620 Met Leu Gln Ala Val Ser Gly Gly Thr Trp Thr Gly Cys Ile Tyr Asp 625 630 635 640 Val Asn Lys Ile Gly Ala Ala Leu Arg Asp Phe Met Asn Lys Asn 645 650 655 <210> 36 <211> 1968 <212> DNA <213> Escherichia coli <220> <221> CDS <222> (1)..(1968) <400> 36 atg acc att gag aaa att ttc acc ccg cag gac gac gcg ttt tat gcg 48 Met Thr Ile Glu Lys Ile Phe Thr Pro Gln Asp Asp Ala Phe Tyr Ala 1 5 10 15 gtg atc acc cac gcg gcg ggg ccg cag ggc gct ctg ccg ctg acc ccg 96 Val Ile Thr His Ala Ala Gly Pro Gln Gly Ala Leu Pro Leu Thr Pro 20 25 30 cag atg ctg atg gaa tct ccc agc ggc aac ctg ttc ggc atg acg cag 144 Gln Met Leu Met Glu Ser Pro Ser Gly Asn Leu Phe Gly Met Thr Gln 35 40 45 aac gcc ggg atg ggc tgg gac gcc aac aag ctc acc ggc aaa gag gtg 192 Asn Ala Gly Met Gly Trp Asp Ala Asn Lys Leu Thr Gly Lys Glu Val 50 55 60 ctg att atc ggc act cag ggc ggc atc cgc gcc gga gac gga cgc cca 240 Leu Ile Ile Gly Thr Gln Gly Gly Ile Arg Ala Gly Asp Gly Arg Pro 65 70 75 80 atc gcg ctg ggc tac cac acc ggg cat tgg gag atc ggc atg cag atg 288 Ile Ala Leu Gly Tyr His Thr Gly His Trp Glu Ile Gly Met Gln Met 85 90 95 cag gcg gcg gcg aag gag atc acc cgc aat ggc ggg atc ccg ttc gcg 336 Gln Ala Ala Ala Lys Glu Ile Thr Arg Asn Gly Gly Ile Pro Phe Ala 100 105 110 gcc ttc gtc agc gat ccg tgc gac ggg cgc tcg cag ggc acg cac ggt 384 Ala Phe Val Ser Asp Pro Cys Asp Gly Arg Ser Gln Gly Thr His Gly 115 120 125 atg ttc gat tcc ctg ccg tac cgc aac gac gcg gcg atc gtg ttt cgc 432 Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ala Ile Val Phe Arg 130 135 140 cgc ctg atc cgc tcc ctg ccg acg cgg cgg gcg gtg atc ggc gta gcg 480 Arg Leu Ile Arg Ser Leu Pro Thr Arg Arg Ala Val Ile Gly Val Ala 145 150 155 160 acc tgc gat aaa ggg ctg ccc gcc acc atg att gcg ctg gcc gcg atg 528 Thr Cys Asp Lys Gly Leu Pro Ala Thr Met Ile Ala Leu Ala Ala Met 165 170 175 cac gac ctg ccg act att ctg gtg ccg ggc ggg gcg acg ctg ccg ccg 576 His Asp Leu Pro Thr Ile Leu Val Pro Gly Gly Ala Thr Leu Pro Pro 180 185 190 acc gtc ggg gaa gac gcg ggc aag gtg cag acc atc ggc gcg cgt ttc 624 Thr Val Gly Glu Asp Ala Gly Lys Val Gln Thr Ile Gly Ala Arg Phe 195 200 205 gcc aac cac gaa ctc tcc ctg cag gag gcc gcc gaa ctg ggc tgt cgc 672 Ala Asn His Glu Leu Ser Leu Gln Glu Ala Ala Glu Leu Gly Cys Arg 210 215 220 gcc tgc gcc tcg ccg ggc ggc ggg tgt cag ttc ctc ggc acg gcg ggc 720 Ala Cys Ala Ser Pro Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly 225 230 235 240 acc tcg cag gtg gtc gcg gag gcg ctg ggt ctg gcg ctg ccg cac tcc 768 Thr Ser Gln Val Val Ala Glu Ala Leu Gly Leu Ala Leu Pro His Ser 245 250 255 gcg ctg gcg ccg tcc ggg cag gcg gtg tgg ctg gag atc gcc cgc cag 816 Ala Leu Ala Pro Ser Gly Gln Ala Val Trp Leu Glu Ile Ala Arg Gln 260 265 270 tcg gcg cgc gcg gtc agc gag ctg gat agc cgc ggc atc acc acg cgg 864 Ser Ala Arg Ala Val Ser Glu Leu Asp Ser Arg Gly Ile Thr Thr Arg 275 280 285 gat atc ctc tcc gat aaa gcc atc gaa aac gcg atg gtg atc cac gcg 912 Asp Ile Leu Ser Asp Lys Ala Ile Glu Asn Ala Met Val Ile His Ala 290 295 300 gcg ttc ggc ggc tcc acc aat tta ctg ctg cac att ccg gcc atc gcc 960 Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala 305 310 315 320 cac gcg gcg ggc tgc acg atc ccg gac gtt gag cac tgg acg cgc atc 1008 His Ala Ala Gly Cys Thr Ile Pro Asp Val Glu His Trp Thr Arg Ile 325 330 335 aac cgt aaa gtg ccg cgt ctg gtg agc gtg ctg ccc aac ggc ccg gac 1056 Asn Arg Lys Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Asp 340 345 350 tat cac ccg acc gtg cgc gcc ttc ctc gcg ggc ggc gtg ccg gag gtg 1104 Tyr His Pro Thr Val Arg Ala Phe Leu Ala Gly Gly Val Pro Glu Val 355 360 365 atg ctc cac ctg cgc gac ctc ggc ctg ctg cat ctg gac gcc atg acc 1152 Met Leu His Leu Arg Asp Leu Gly Leu Leu His Leu Asp Ala Met Thr 370 375 380 gtg acc ggc cag acg gtg ggc gag aac ctt gaa tgg tgg cag gcg tcc 1200 Val Thr Gly Gln Thr Val Gly Glu Asn Leu Glu Trp Trp Gln Ala Ser 385 390 395 400 gag cgc cgg gcg cgc ttc cgc cag tgc ctg cgc gag cag gac ggc gta 1248 Glu Arg Arg Ala Arg Phe Arg Gln Cys Leu Arg Glu Gln Asp Gly Val 405 410 415 gag ccg gat gac gtg atc ctg ccg ccg gag aag gca aaa gcg aaa ggg 1296 Glu Pro Asp Asp Val Ile Leu Pro Pro Glu Lys Ala Lys Ala Lys Gly 420 425 430 ctg acc tcg acg gtc tgc ttc ccg acg ggc aac atc gct ccg gaa ggt 1344 Leu Thr Ser Thr Val Cys Phe Pro Thr Gly Asn Ile Ala Pro Glu Gly 435 440 445 tcg gtg atc aag gcc acg gcg atc gac ccg tcg gtg gtg ggc gaa gat 1392 Ser Val Ile Lys Ala Thr Ala Ile Asp Pro Ser Val Val Gly Glu Asp 450 455 460 ggc gta tac cac cac acc ggc cgg gtg cgg gtg ttt gtc tcg gaa gcg 1440 Gly Val Tyr His His Thr Gly Arg Val Arg Val Phe Val Ser Glu Ala 465 470 475 480 cag gcg atc aag gcg atc aag cgg gaa gag att gtg cag ggc gat atc 1488 Gln Ala Ile Lys Ala Ile Lys Arg Glu Glu Ile Val Gln Gly Asp Ile 485 490 495 atg gtg gtg atc ggc ggc ggg ccg tcc ggc acc ggc atg gaa gag acc 1536 Met Val Val Ile Gly Gly Gly Pro Ser Gly Thr Gly Met Glu Glu Thr 500 505 510 tac cag ctc acc tcc gcg cta aag cat atc tcg tgg ggc aag acg gtg 1584 Tyr Gln Leu Thr Ser Ala Leu Lys His Ile Ser Trp Gly Lys Thr Val 515 520 525 tcg ctc atc acc gat gcg cgc ttc tcg ggc gtg tcg acg ggc gcc tgc 1632 Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys 530 535 540 ttc ggc cac gtg tcg ccg gag gcg ctg gcg ggc ggg ccg att ggc aag 1680 Phe Gly His Val Ser Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys 545 550 555 560 ctg cgc gat aac gac atc atc gag att gcc gtg gat cgt ctg acg tta 1728 Leu Arg Asp Asn Asp Ile Ile Glu Ile Ala Val Asp Arg Leu Thr Leu 565 570 575 act ggc agc gtg aac ttc atc ggc acc gcg gac aac ccg ctg acg ccg 1776 Thr Gly Ser Val Asn Phe Ile Gly Thr Ala Asp Asn Pro Leu Thr Pro 580 585 590 gaa gag ggc gcg cgc gag ctg gcg cgg cgg cag acg cac ccg gac ctg 1824 Glu Glu Gly Ala Arg Glu Leu Ala Arg Arg Gln Thr His Pro Asp Leu 595 600 605 cac gcc cac gac ttt ttg ccg gac gac acc cgg ctg tgg gcg gca ctg 1872 His Ala His Asp Phe Leu Pro Asp Asp Thr Arg Leu Trp Ala Ala Leu 610 615 620 cag tcg gtg agc ggc ggc acc tgg aaa ggc tgt att tat gac acc gat 1920 Gln Ser Val Ser Gly Gly Thr Trp Lys Gly Cys Ile Tyr Asp Thr Asp 625 630 635 640 aaa att atc gag gta att aac gcc ggt aaa aaa gcg ctc gga att taa 1968 Lys Ile Ile Glu Val Ile Asn Ala Gly Lys Lys Ala Leu Gly Ile 645 650 655 <210> 37 <211> 655 <212> PRT <213> Escherichia coli <400> 37 Met Thr Ile Glu Lys Ile Phe Thr Pro Gln Asp Asp Ala Phe Tyr Ala 1 5 10 15 Val Ile Thr His Ala Ala Gly Pro Gln Gly Ala Leu Pro Leu Thr Pro 20 25 30 Gln Met Leu Met Glu Ser Pro Ser Gly Asn Leu Phe Gly Met Thr Gln 35 40 45 Asn Ala Gly Met Gly Trp Asp Ala Asn Lys Leu Thr Gly Lys Glu Val 50 55 60 Leu Ile Ile Gly Thr Gln Gly Gly Ile Arg Ala Gly Asp Gly Arg Pro 65 70 75 80 Ile Ala Leu Gly Tyr His Thr Gly His Trp Glu Ile Gly Met Gln Met 85 90 95 Gln Ala Ala Ala Lys Glu Ile Thr Arg Asn Gly Gly Ile Pro Phe Ala 100 105 110 Ala Phe Val Ser Asp Pro Cys Asp Gly Arg Ser Gln Gly Thr His Gly 115 120 125 Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ala Ile Val Phe Arg 130 135 140 Arg Leu Ile Arg Ser Leu Pro Thr Arg Arg Ala Val Ile Gly Val Ala 145 150 155 160 Thr Cys Asp Lys Gly Leu Pro Ala Thr Met Ile Ala Leu Ala Ala Met 165 170 175 His Asp Leu Pro Thr Ile Leu Val Pro Gly Gly Ala Thr Leu Pro Pro 180 185 190 Thr Val Gly Glu Asp Ala Gly Lys Val Gln Thr Ile Gly Ala Arg Phe 195 200 205 Ala Asn His Glu Leu Ser Leu Gln Glu Ala Ala Glu Leu Gly Cys Arg 210 215 220 Ala Cys Ala Ser Pro Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly 225 230 235 240 Thr Ser Gln Val Val Ala Glu Ala Leu Gly Leu Ala Leu Pro His Ser 245 250 255 Ala Leu Ala Pro Ser Gly Gln Ala Val Trp Leu Glu Ile Ala Arg Gln 260 265 270 Ser Ala Arg Ala Val Ser Glu Leu Asp Ser Arg Gly Ile Thr Thr Arg 275 280 285 Asp Ile Leu Ser Asp Lys Ala Ile Glu Asn Ala Met Val Ile His Ala 290 295 300 Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala 305 310 315 320 His Ala Ala Gly Cys Thr Ile Pro Asp Val Glu His Trp Thr Arg Ile 325 330 335 Asn Arg Lys Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Asp 340 345 350 Tyr His Pro Thr Val Arg Ala Phe Leu Ala Gly Gly Val Pro Glu Val 355 360 365 Met Leu His Leu Arg Asp Leu Gly Leu Leu His Leu Asp Ala Met Thr 370 375 380 Val Thr Gly Gln Thr Val Gly Glu Asn Leu Glu Trp Trp Gln Ala Ser 385 390 395 400 Glu Arg Arg Ala Arg Phe Arg Gln Cys Leu Arg Glu Gln Asp Gly Val 405 410 415 Glu Pro Asp Asp Val Ile Leu Pro Pro Glu Lys Ala Lys Ala Lys Gly 420 425 430 Leu Thr Ser Thr Val Cys Phe Pro Thr Gly Asn Ile Ala Pro Glu Gly 435 440 445 Ser Val Ile Lys Ala Thr Ala Ile Asp Pro Ser Val Val Gly Glu Asp 450 455 460 Gly Val Tyr His His Thr Gly Arg Val Arg Val Phe Val Ser Glu Ala 465 470 475 480 Gln Ala Ile Lys Ala Ile Lys Arg Glu Glu Ile Val Gln Gly Asp Ile 485 490 495 Met Val Val Ile Gly Gly Gly Pro Ser Gly Thr Gly Met Glu Glu Thr 500 505 510 Tyr Gln Leu Thr Ser Ala Leu Lys His Ile Ser Trp Gly Lys Thr Val 515 520 525 Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys 530 535 540 Phe Gly His Val Ser Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys 545 550 555 560 Leu Arg Asp Asn Asp Ile Ile Glu Ile Ala Val Asp Arg Leu Thr Leu 565 570 575 Thr Gly Ser Val Asn Phe Ile Gly Thr Ala Asp Asn Pro Leu Thr Pro 580 585 590 Glu Glu Gly Ala Arg Glu Leu Ala Arg Arg Gln Thr His Pro Asp Leu 595 600 605 His Ala His Asp Phe Leu Pro Asp Asp Thr Arg Leu Trp Ala Ala Leu 610 615 620 Gln Ser Val Ser Gly Gly Thr Trp Lys Gly Cys Ile Tyr Asp Thr Asp 625 630 635 640 Lys Ile Ile Glu Val Ile Asn Ala Gly Lys Lys Ala Leu Gly Ile 645 650 655 <210> 38 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer xylX_IFS_5742-10-1 <400> 38 acacaaggag actcccatgg gcgtgagtga attcctgccg 40 <210> 39 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer xylX_IFA_5742-10-2 <400> 39 ggaactggcg gctcccttag aggaggccgc ggccggccag 40 <210> 40 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer xylA_IFS_5742-10-3 <400> 40 acacaaggag actcccatga ccgacaccct gcgccattac 40 <210> 41 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer xylA_IFA_5742-10-4 <400> 41 ggaactggcg gctcccttac gaccacgagt aggaggtttt 40 <210> 42 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer xylD_IFS_5742-10-5 <400> 42 acacaaggag actcccatgt ctaaccgcac gccccgccgg 40 <210> 43 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer xylD-IFA_5742-10-6 <400> 43 ggaactggcg gctccctcag tggttgtggc ggggcagctt 40 <210> 44 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> primer CC0823-01F_4691-87-1 <400> 44 gtcgactcta gaggatcccc gtgggcgtga gtgaattcct gccg 44 <210> 45 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0823-01R_4691-87-2 <400> 45 tatgcctgtc ctgccagcac tgcc 24 <210> 46 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0823-02F_4691-87-3 <400> 46 ggcagtgctg gcaggacagg cata 24 <210> 47 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> primer CC0823-02R_4691-87-4 <400> 47 cgaattcgag ctcggtaccc ttagaggagg ccgcggccgg ccag 44 <210> 48 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-01F_4691-87-5 <400> 48 gtcgactcta gaggatcccc atgaccgaca ccctgcgcca ttac 44 <210> 49 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-01R_5659-8-7 <400> 49 gcgtcggccc aggccgggaa tgcc 24 <210> 50 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-02F_5659-8-8 <400> 50 gtcgacgccg cgcgcaaggc attc 24 <210> 51 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-02R_5659-8-9 <400> 51 gagcgccggg gcggccttcc atgc 24 <210> 52 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-03F_5659-8-10 <400> 52 cttcccgatc gccatcccgg catg 24 <210> 53 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-03R_5659-8-11 <400> 53 cagctgcacg cgggcctgac gtgc 24 <210> 54 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-04F_5659-8-12 <400> 54 ggtcgccgcc gccgccgtgg cacg 24 <210> 55 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-04R_5659-8-13 <400> 55 ggcgaccttc tcggccagca gtgc 24 <210> 56 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-05F_5659-8-14 <400> 56 ggattcacga caagttcgtg gcac 24 <210> 57 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> primer CC0822-05R_4691-87-14 <400> 57 cgaattcgag ctcggtaccc ttacgaccac gagtaggagg tttt 44 <210> 58 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer Peftu(Pst) <400> 58 ccaagcttgc atgccagatc gtttagatcc gaagg 35 <210> 59 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer Peftu_Rv <400> 59 tgtatgtcct cctggacttc gt 22 <210> 60 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> primer Peftu_xylXABCD_fw <400> 60 ccaggaggac atacaatggg cgtgagtgaa ttcctgccgg aagattggaa ag 52 <210> 61 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer eftu_xylXABCD_rv <400> 61 cggtacccgg ggatctcagt ggttgtggcg gggcagctt 39 <210> 62 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer PmsrA(Pst) <400> 62 ccaagcttgc atgccatttg cgcctgcaac gtaggttg 38 <210> 63 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer PmsrAR <400> 63 aacaggaatg ttcctttcga aaa 23 <210> 64 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> primer PmsrA_xylD_fw <400> 64 aggaacattc ctgttatgtc taaccgcacg ccccgccggt t 41 <210> 65 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer SpcR-F <400> 65 ctaataacgt aacgtgactg gcaag 25 <210> 66 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer SpcR-R <400> 66 ataagtaaga ttaaccatta gtc 23 <210> 67 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer spc(GTG start)-F <400> 67 gtgaggagga tatatttgaa tacatacgaa 30 <210> 68 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer spc(stop)-R <400> 68 taattttttt aatctgttat ttaaatagtt tatag 35 <210> 69 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> primer Spc-pVC7-Cm-F <400> 69 atatatcctc ctcactttag cttccttagc tcctgaaaat ct 42 <210> 70 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer Spc-pVC7-Cm-R <400> 70 agattaaaaa aattataatt tttttaaggc agttattggt gccct 45 <210> 71 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> primer ME_Spc_fw <400> 71 ctgtctctta tacacatctc caagcttgca tgccgcggcc tggttggttg ggtt 54 <210> 72 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> primer ME_Peftu_xylXABCD_rv <400> 72 ctgtctctta tacacatctc ggtacccggg gatctcagtg gttgtggcgg ggcagctt 58 <210> 73 <211> 1785 <212> DNA <213> Agrobacterium tumefaciens <220> <221> CDS <222> (1)..(1785) <400> 73 atg agc gac gac aag aca ccc gtg cgg cgg ctg cga tcc cag gac tgg 48 Met Ser Asp Asp Lys Thr Pro Val Arg Arg Leu Arg Ser Gln Asp Trp 1 5 10 15 ttc gac aac cct gac cat ctc gac atg acg gcg ctc tat ctg gag cgc 96 Phe Asp Asn Pro Asp His Leu Asp Met Thr Ala Leu Tyr Leu Glu Arg 20 25 30 ttc atg aat tat ggc gtg acg ccg gaa gag ctg cgt tcc ggc aag ccg 144 Phe Met Asn Tyr Gly Val Thr Pro Glu Glu Leu Arg Ser Gly Lys Pro 35 40 45 gtc atc ggc atc gcg cag agc ggc agc gac ctg acg ccc tgc aac cgc 192 Val Ile Gly Ile Ala Gln Ser Gly Ser Asp Leu Thr Pro Cys Asn Arg 50 55 60 gtc cat gtc gaa ctg gtc aag cgg gtg cgc gat ggt atc cgt gat gcg 240 Val His Val Glu Leu Val Lys Arg Val Arg Asp Gly Ile Arg Asp Ala 65 70 75 80 ggc ggc atc ccc atc gag ttt ccg acc cat ccg atg ttc gaa aac tgc 288 Gly Gly Ile Pro Ile Glu Phe Pro Thr His Pro Met Phe Glu Asn Cys 85 90 95 aag cga ccg aca gcg gcg ctt gac cgc aat ctt gcc tat ctc agc ctg 336 Lys Arg Pro Thr Ala Ala Leu Asp Arg Asn Leu Ala Tyr Leu Ser Leu 100 105 110 gtg gaa gtg ctt tac ggt tat cca ctc gat ggc gtc gtg ttg acc acg 384 Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val Leu Thr Thr 115 120 125 ggc tgc gac aag acc acg cct tcg gcg ctg atg gcg gca agc acg gtt 432 Gly Cys Asp Lys Thr Thr Pro Ser Ala Leu Met Ala Ala Ser Thr Val 130 135 140 gat att ccg gct atc gtc tta tcc ggc ggg ccg atg ctc gac gga tat 480 Asp Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Tyr 145 150 155 160 cat gac ggc gat ctg gtt ggt tcc ggc acg gtc atc tgg cgc atg cgc 528 His Asp Gly Asp Leu Val Gly Ser Gly Thr Val Ile Trp Arg Met Arg 165 170 175 cgc aaa tac ggc gcc ggc gaa atc acc cgc gag gaa ttc ctg cag gcg 576 Arg Lys Tyr Gly Ala Gly Glu Ile Thr Arg Glu Glu Phe Leu Gln Ala 180 185 190 gcg ctc gaa tcc gct cct tcg gtc ggt cac tgc aac acc atg ggc acg 624 Ala Leu Glu Ser Ala Pro Ser Val Gly His Cys Asn Thr Met Gly Thr 195 200 205 gcc tct acc atg aat gcc att gcc gaa gcg ctc ggc atg tcg ctg acc 672 Ala Ser Thr Met Asn Ala Ile Ala Glu Ala Leu Gly Met Ser Leu Thr 210 215 220 ggc tgc ggc gca atc ccg gcc gct tac cgc gaa cgc ggc cag atg gcc 720 Gly Cys Gly Ala Ile Pro Ala Ala Tyr Arg Glu Arg Gly Gln Met Ala 225 230 235 240 tat cgc acc ggc cgc cgc gcc gtc gaa ctg gtt gtc gag aat atc aag 768 Tyr Arg Thr Gly Arg Arg Ala Val Glu Leu Val Val Glu Asn Ile Lys 245 250 255 cct tcg gat atc atg acg cgc gag gcg ttt ttg aac gcg atc cgc gtc 816 Pro Ser Asp Ile Met Thr Arg Glu Ala Phe Leu Asn Ala Ile Arg Val 260 265 270 aat tcg gca atc ggc ggt tcg aca aat gcc cag ccg cat ctg gcg gcg 864 Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Gln Pro His Leu Ala Ala 275 280 285 atg gcg aaa cat gcg ggc gtc gaa ctt cgc gag gaa gac tgg cag gtt 912 Met Ala Lys His Ala Gly Val Glu Leu Arg Glu Glu Asp Trp Gln Val 290 295 300 cac ggt tat gac att ccg ctc atc gcc aat gtc cag ccc gcc gga aaa 960 His Gly Tyr Asp Ile Pro Leu Ile Ala Asn Val Gln Pro Ala Gly Lys 305 310 315 320 tgg ctg ggc gag aaa tat cac cgt gcc ggc ggt acg ccc gcc atc atg 1008 Trp Leu Gly Glu Lys Tyr His Arg Ala Gly Gly Thr Pro Ala Ile Met 325 330 335 tgg gag ctt ctg aag gca ggc aag ctt gat ggg agc tgt ccg acc gtg 1056 Trp Glu Leu Leu Lys Ala Gly Lys Leu Asp Gly Ser Cys Pro Thr Val 340 345 350 acc ggc aag acc gtg gcg gaa aat ctg gac ggg cgg gaa tcg acc gac 1104 Thr Gly Lys Thr Val Ala Glu Asn Leu Asp Gly Arg Glu Ser Thr Asp 355 360 365 cgc gac gtg atc ctt cct tac gat aag ccg ctc aag gaa cgg gcc ggt 1152 Arg Asp Val Ile Leu Pro Tyr Asp Lys Pro Leu Lys Glu Arg Ala Gly 370 375 380 ttc ctc gtc ctc aag ggc aat ctg ttc gat ttc gcc atc atg aag acg 1200 Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Thr 385 390 395 400 agt gtg atc tcg gcg gaa ttc cgg cag cgt tat ctg agt gag ccg ggt 1248 Ser Val Ile Ser Ala Glu Phe Arg Gln Arg Tyr Leu Ser Glu Pro Gly 405 410 415 cga gag ggg att ttc gag ggc aaa tgt gtg gtt ttc gat ggt tcg gaa 1296 Arg Glu Gly Ile Phe Glu Gly Lys Cys Val Val Phe Asp Gly Ser Glu 420 425 430 gac tat cac gcc cgt atc aac gat ccg tct ctc gat atc gat gag cgc 1344 Asp Tyr His Ala Arg Ile Asn Asp Pro Ser Leu Asp Ile Asp Glu Arg 435 440 445 acc att ctc gtc att cgc ggg gcc gga ccg ctc ggc tgg ccg ggt tcg 1392 Thr Ile Leu Val Ile Arg Gly Ala Gly Pro Leu Gly Trp Pro Gly Ser 450 455 460 gct gag gtc gtc aac atg cag ccg ccg gac gcg ctg ttg aaa aaa ggc 1440 Ala Glu Val Val Asn Met Gln Pro Pro Asp Ala Leu Leu Lys Lys Gly 465 470 475 480 ata acc agc ctg ccg aca atc ggc gac ggc cgg caa tcg gga acc gcg 1488 Ile Thr Ser Leu Pro Thr Ile Gly Asp Gly Arg Gln Ser Gly Thr Ala 485 490 495 gac agc ccg tcg atc ctc aat gcc tcg cca gaa agt gcc gcc ggt gga 1536 Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ala Gly Gly 500 505 510 gga ctg gca tgg ctt cgc acg ggt gat gta atc cgc atc gac ttc aat 1584 Gly Leu Ala Trp Leu Arg Thr Gly Asp Val Ile Arg Ile Asp Phe Asn 515 520 525 cag ggc aag tgc gac gcg ttg gta ccg gat gca gag ctt gct gcc cga 1632 Gln Gly Lys Cys Asp Ala Leu Val Pro Asp Ala Glu Leu Ala Ala Arg 530 535 540 aag gcc gat ggc att cct gcg gtg cct gcg gat gcc acg ccc tgg cag 1680 Lys Ala Asp Gly Ile Pro Ala Val Pro Ala Asp Ala Thr Pro Trp Gln 545 550 555 560 cgc atc tat cgt caa tcg gtg acc cag ctt tcg gac ggt gcg gtt ctg 1728 Arg Ile Tyr Arg Gln Ser Val Thr Gln Leu Ser Asp Gly Ala Val Leu 565 570 575 gaa ggg gcc gcg gat ttc cgc cgg att gcc gag aag atg ccc cgg cac 1776 Glu Gly Ala Ala Asp Phe Arg Arg Ile Ala Glu Lys Met Pro Arg His 580 585 590 aac cat tga 1785 Asn His <210> 74 <211> 594 <212> PRT <213> Agrobacterium tumefaciens <400> 74 Met Ser Asp Asp Lys Thr Pro Val Arg Arg Leu Arg Ser Gln Asp Trp 1 5 10 15 Phe Asp Asn Pro Asp His Leu Asp Met Thr Ala Leu Tyr Leu Glu Arg 20 25 30 Phe Met Asn Tyr Gly Val Thr Pro Glu Glu Leu Arg Ser Gly Lys Pro 35 40 45 Val Ile Gly Ile Ala Gln Ser Gly Ser Asp Leu Thr Pro Cys Asn Arg 50 55 60 Val His Val Glu Leu Val Lys Arg Val Arg Asp Gly Ile Arg Asp Ala 65 70 75 80 Gly Gly Ile Pro Ile Glu Phe Pro Thr His Pro Met Phe Glu Asn Cys 85 90 95 Lys Arg Pro Thr Ala Ala Leu Asp Arg Asn Leu Ala Tyr Leu Ser Leu 100 105 110 Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val Leu Thr Thr 115 120 125 Gly Cys Asp Lys Thr Thr Pro Ser Ala Leu Met Ala Ala Ser Thr Val 130 135 140 Asp Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Tyr 145 150 155 160 His Asp Gly Asp Leu Val Gly Ser Gly Thr Val Ile Trp Arg Met Arg 165 170 175 Arg Lys Tyr Gly Ala Gly Glu Ile Thr Arg Glu Glu Phe Leu Gln Ala 180 185 190 Ala Leu Glu Ser Ala Pro Ser Val Gly His Cys Asn Thr Met Gly Thr 195 200 205 Ala Ser Thr Met Asn Ala Ile Ala Glu Ala Leu Gly Met Ser Leu Thr 210 215 220 Gly Cys Gly Ala Ile Pro Ala Ala Tyr Arg Glu Arg Gly Gln Met Ala 225 230 235 240 Tyr Arg Thr Gly Arg Arg Ala Val Glu Leu Val Val Glu Asn Ile Lys 245 250 255 Pro Ser Asp Ile Met Thr Arg Glu Ala Phe Leu Asn Ala Ile Arg Val 260 265 270 Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Gln Pro His Leu Ala Ala 275 280 285 Met Ala Lys His Ala Gly Val Glu Leu Arg Glu Glu Asp Trp Gln Val 290 295 300 His Gly Tyr Asp Ile Pro Leu Ile Ala Asn Val Gln Pro Ala Gly Lys 305 310 315 320 Trp Leu Gly Glu Lys Tyr His Arg Ala Gly Gly Thr Pro Ala Ile Met 325 330 335 Trp Glu Leu Leu Lys Ala Gly Lys Leu Asp Gly Ser Cys Pro Thr Val 340 345 350 Thr Gly Lys Thr Val Ala Glu Asn Leu Asp Gly Arg Glu Ser Thr Asp 355 360 365 Arg Asp Val Ile Leu Pro Tyr Asp Lys Pro Leu Lys Glu Arg Ala Gly 370 375 380 Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Thr 385 390 395 400 Ser Val Ile Ser Ala Glu Phe Arg Gln Arg Tyr Leu Ser Glu Pro Gly 405 410 415 Arg Glu Gly Ile Phe Glu Gly Lys Cys Val Val Phe Asp Gly Ser Glu 420 425 430 Asp Tyr His Ala Arg Ile Asn Asp Pro Ser Leu Asp Ile Asp Glu Arg 435 440 445 Thr Ile Leu Val Ile Arg Gly Ala Gly Pro Leu Gly Trp Pro Gly Ser 450 455 460 Ala Glu Val Val Asn Met Gln Pro Pro Asp Ala Leu Leu Lys Lys Gly 465 470 475 480 Ile Thr Ser Leu Pro Thr Ile Gly Asp Gly Arg Gln Ser Gly Thr Ala 485 490 495 Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ala Gly Gly 500 505 510 Gly Leu Ala Trp Leu Arg Thr Gly Asp Val Ile Arg Ile Asp Phe Asn 515 520 525 Gln Gly Lys Cys Asp Ala Leu Val Pro Asp Ala Glu Leu Ala Ala Arg 530 535 540 Lys Ala Asp Gly Ile Pro Ala Val Pro Ala Asp Ala Thr Pro Trp Gln 545 550 555 560 Arg Ile Tyr Arg Gln Ser Val Thr Gln Leu Ser Asp Gly Ala Val Leu 565 570 575 Glu Gly Ala Ala Asp Phe Arg Arg Ile Ala Glu Lys Met Pro Arg His 580 585 590 Asn His <210> 75 <211> 1785 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 75 atgagcgatg ataaaacccc ggtgcgtcgc ctgcgttctc aggattggtt tgataacccg 60 gatcatctgg atatgacggc gctgtatctg gaacgcttta tgaattatgg tgtgaccccg 120 gaagaactgc gcagcggtaa accggttatt ggcatcgccc agagcggttc tgatctgacc 180 ccgtgcaacc gtgtgcatgt tgaactggtg aaacgtgttc gcgatggtat tcgcgatgca 240 ggcggtattc cgatcgaatt tccgacgcac ccgatgttcg aaaactgtaa acgtccgacc 300 gcggccctgg atcgtaatct ggcctatctg agcctggtgg aagttctgta tggctacccg 360 ctggatggtg tggttctgac cacgggctgc gataaaacca ccccgagtgc cctgatggca 420 gccagcaccg tggatattcc ggcaatcgtt ctgagcggcg gtccgatgct ggatggttat 480 catgatggcg atctggtggg ttctggcacg gttatttggc gtatgcgtcg caaatacggt 540 gccggcgaaa tcacccgcga agaatttctg caggccgcac tggaatctgc gccgagtgtg 600 ggccactgca acaccatggg tacggcctct accatgaatg ccattgcaga agccctgggt 660 atgagtctga ccggttgtgg tgccatcccg gccgcatatc gtgaacgtgg ccagatggcc 720 tatcgcaccg gtcgtcgcgc ggtggaactg gtggttgaaa acattaaacc gagcgatatc 780 atgacgcgtg aagcatttct gaacgcgatt cgcgttaatt ctgcaatcgg cggtagtacc 840 aatgcgcagc cgcatctggc agcgatggcg aaacacgccg gcgtggaact gcgtgaagaa 900 gattggcagg ttcatggtta tgatattccg ctgatcgcca atgtgcagcc ggccggtaaa 960 tggctgggcg aaaaatatca ccgtgcgggc ggcaccccgg caattatgtg ggaactgctg 1020 aaagccggta aactggatgg cagttgtccg accgtgacgg gcaaaacggt tgcagaaaac 1080 ctggatggtc gtgaaagcac cgatcgcgat gttatcctgc cgtatgataa accgctgaaa 1140 gaacgtgcgg gctttctggt gctgaaaggt aatctgtttg atttcgcgat tatgaaaacc 1200 agcgttatct ctgccgaatt tcgtcagcgt tatctgtctg aaccgggtcg tgaaggcatt 1260 tttgaaggca aatgcgtggt tttcgatggt agtgaagatt accacgcccg cattaacgat 1320 ccgagcctgg atatcgatga acgtaccatt ctggtgattc gcggtgcagg tccgctgggt 1380 tggccgggca gcgcggaagt ggttaatatg cagccgccag atgcgctgct gaaaaaaggc 1440 attacgtctc tgccgaccat cggtgatggc cgccagagtg gtacggccga tagtccgagc 1500 atcctgaatg caagtccgga aagcgccgca ggcggtggcc tggcctggct gcgtaccggt 1560 gatgtgattc gcatcgattt taatcagggt aaatgtgatg cactggttcc ggatgcggaa 1620 ctggcggccc gtaaagccga tggcattccg gcagttccgg cggatgcaac cccgtggcag 1680 cgtatctacc gccagagcgt gacccagctg tctgatggcg cagttctgga aggtgcagcg 1740 gatttccgtc gcattgcgga aaaaatgccg cgccataacc actga 1785 <210> 76 <211> 1785 <212> DNA <213> Herbaspirillum seropedicae <220> <221> CDS <222> (1)..(1785) <400> 76 atg aac aag cca aac gcc acc ccc cgt cgc ttc cgc tcc cag gac tgg 48 Met Asn Lys Pro Asn Ala Thr Pro Arg Arg Phe Arg Ser Gln Asp Trp 1 5 10 15 ttc gac aac ccg gac cac atc gac atg acc gcg ctc tac ctg gag cgc 96 Phe Asp Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu Glu Arg 20 25 30 ttc atg aac tac ggc atc acg gcc gag gag ctg cgc tcg gga cgt ccc 144 Phe Met Asn Tyr Gly Ile Thr Ala Glu Glu Leu Arg Ser Gly Arg Pro 35 40 45 atc atc ggc atc gcc cag agc ggc agc gac atc agc ccc tgc aac cgc 192 Ile Ile Gly Ile Ala Gln Ser Gly Ser Asp Ile Ser Pro Cys Asn Arg 50 55 60 atc cac ctg gag ctg gcc aag cgg gtg cgc gat ggc atc cgc gat gcc 240 Ile His Leu Glu Leu Ala Lys Arg Val Arg Asp Gly Ile Arg Asp Ala 65 70 75 80 ggc ggc att ccc atg gaa ttc ccg ctg cat ccc atc ttc gag aac tgc 288 Gly Gly Ile Pro Met Glu Phe Pro Leu His Pro Ile Phe Glu Asn Cys 85 90 95 cgc cgc ccc acc gcc gcc atc gac cgc aac ctg gcc tac ctg ggc ctg 336 Arg Arg Pro Thr Ala Ala Ile Asp Arg Asn Leu Ala Tyr Leu Gly Leu 100 105 110 gtg gaa atc ctg cac ggc tat ccc atc gac gcc gtg gtg ctc acc acc 384 Val Glu Ile Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu Thr Thr 115 120 125 ggc tgc gac aag acc acg ccc tcg cag atc atg gcc gca gcc acc gtc 432 Gly Cys Asp Lys Thr Thr Pro Ser Gln Ile Met Ala Ala Ala Thr Val 130 135 140 gat atc ccc gcc atc gtg ctc tcc ggc ggc ccc atg ctg gac ggc tgg 480 Asp Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp 145 150 155 160 atg gat ggc gaa ctg gtc ggc tcc ggc tcg gcc atc tgg aag ggc cgc 528 Met Asp Gly Glu Leu Val Gly Ser Gly Ser Ala Ile Trp Lys Gly Arg 165 170 175 aag ctg ctc tcg gca ggc agc atc gac aac gag aaa ttc ctg gag atc 576 Lys Leu Leu Ser Ala Gly Ser Ile Asp Asn Glu Lys Phe Leu Glu Ile 180 185 190 gcg gcg gcc tcc gcg ccc tcg tcc ggc cac tgc aac acc atg ggc acc 624 Ala Ala Ala Ser Ala Pro Ser Ser Gly His Cys Asn Thr Met Gly Thr 195 200 205 gcc tcc acc atg aac gcc atg gcc gag gcc ctg ggc atg tcg ctg acc 672 Ala Ser Thr Met Asn Ala Met Ala Glu Ala Leu Gly Met Ser Leu Thr 210 215 220 ggc tgc tcg gcc att ccc gcg ccc tac cgc gaa cgc ggc cag atg gcc 720 Gly Cys Ser Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln Met Ala 225 230 235 240 tat gag acg ggc cgg cgc atc gtc ggc atg gcc tac gaa gac ctg cgt 768 Tyr Glu Thr Gly Arg Arg Ile Val Gly Met Ala Tyr Glu Asp Leu Arg 245 250 255 cct tcc gcc atc ctc acg cgc gac gcc ttc ctc gac gcc atc gtg gtc 816 Pro Ser Ala Ile Leu Thr Arg Asp Ala Phe Leu Asp Ala Ile Val Val 260 265 270 aat gcc gcc atc ggc ggc tcc acc aat gcc cag ccg cac atc atg gcc 864 Asn Ala Ala Ile Gly Gly Ser Thr Asn Ala Gln Pro His Ile Met Ala 275 280 285 atg gcg cgc cat gcg ggc gtg gaa ctg cag tcg gaa gac tgg atg aag 912 Met Ala Arg His Ala Gly Val Glu Leu Gln Ser Glu Asp Trp Met Lys 290 295 300 tac ggc tac gac gtg cca ctg ctg ctg aac atg cag ccg gcc ggc aag 960 Tyr Gly Tyr Asp Val Pro Leu Leu Leu Asn Met Gln Pro Ala Gly Lys 305 310 315 320 tac ctg ggc gaa cgc ttc cac cgc gcc ggc ggc gtg ccg gcc atc atg 1008 Tyr Leu Gly Glu Arg Phe His Arg Ala Gly Gly Val Pro Ala Ile Met 325 330 335 tgg gaa ctg cag cag gcc ggc aag ctg cgc gcc gag cgc atc acc gct 1056 Trp Glu Leu Gln Gln Ala Gly Lys Leu Arg Ala Glu Arg Ile Thr Ala 340 345 350 acc ggc aag acc atg gcc gag aac ctg cag ggc cgg gca tcg aac gac 1104 Thr Gly Lys Thr Met Ala Glu Asn Leu Gln Gly Arg Ala Ser Asn Asp 355 360 365 cgg gaa atg att tac cca ttt gcc gcc ccg ctg cgc gag cgc gcc ggc 1152 Arg Glu Met Ile Tyr Pro Phe Ala Ala Pro Leu Arg Glu Arg Ala Gly 370 375 380 ttc ctg gtg ttg aag ggc aac ctg ttc gac ttc gcc atc atg aag acc 1200 Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Thr 385 390 395 400 agc gtc atc tcg gaa acc ttc cgc gaa cgc tat ctc agc acg ccc ggc 1248 Ser Val Ile Ser Glu Thr Phe Arg Glu Arg Tyr Leu Ser Thr Pro Gly 405 410 415 cag gag aac atc ttc gaa tgc cgc gcc gtg gtc ttc gat ggt tcg gac 1296 Gln Glu Asn Ile Phe Glu Cys Arg Ala Val Val Phe Asp Gly Ser Asp 420 425 430 gac tat cac gcc cgc atc aac gac ccg gcg ctc aag atc gac gag aac 1344 Asp Tyr His Ala Arg Ile Asn Asp Pro Ala Leu Lys Ile Asp Glu Asn 435 440 445 acc ctg ctg gcc atc cgt ggc gcc ggc ccg gtg ggc tgg ccc ggt tcg 1392 Thr Leu Leu Ala Ile Arg Gly Ala Gly Pro Val Gly Trp Pro Gly Ser 450 455 460 gcc gag gta gtc aac atg caa ccg ccc gac gcc ctg atc aag cgc ggt 1440 Ala Glu Val Val Asn Met Gln Pro Pro Asp Ala Leu Ile Lys Arg Gly 465 470 475 480 gta tcg acc ctg ccg acg ctg ggc gat ggc cgc cag tcg ggc acc tcc 1488 Val Ser Thr Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ser 485 490 495 gac agc ccc tcc atc ctc aac gcc tcc ccc gag agc gcc gtc ggt ggc 1536 Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Val Gly Gly 500 505 510 ggc ctg gcc tac ctg cgc gat ggc gac cgc gtg cgc atc gac ctc aac 1584 Gly Leu Ala Tyr Leu Arg Asp Gly Asp Arg Val Arg Ile Asp Leu Asn 515 520 525 acc ggc gag tgc aac atg ctg gtc agc gag gaa gag ctg gcg cgc cgc 1632 Thr Gly Glu Cys Asn Met Leu Val Ser Glu Glu Glu Leu Ala Arg Arg 530 535 540 aag agc gag ggc atc ccg ccg gtg ccg ccc agc cag acg ccc tgg cag 1680 Lys Ser Glu Gly Ile Pro Pro Val Pro Pro Ser Gln Thr Pro Trp Gln 545 550 555 560 gaa atc tat cgc agc acg gtc ggc cag ctg gag acc ggc gcc tgc atg 1728 Glu Ile Tyr Arg Ser Thr Val Gly Gln Leu Glu Thr Gly Ala Cys Met 565 570 575 gaa ctg gcc ttg aag tac cag ggt gtg gcc cag acc ctg ccc cgg cac 1776 Glu Leu Ala Leu Lys Tyr Gln Gly Val Ala Gln Thr Leu Pro Arg His 580 585 590 aat cac tga 1785 Asn His <210> 77 <211> 594 <212> PRT <213> Herbaspirillum seropedicae <400> 77 Met Asn Lys Pro Asn Ala Thr Pro Arg Arg Phe Arg Ser Gln Asp Trp 1 5 10 15 Phe Asp Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu Glu Arg 20 25 30 Phe Met Asn Tyr Gly Ile Thr Ala Glu Glu Leu Arg Ser Gly Arg Pro 35 40 45 Ile Ile Gly Ile Ala Gln Ser Gly Ser Asp Ile Ser Pro Cys Asn Arg 50 55 60 Ile His Leu Glu Leu Ala Lys Arg Val Arg Asp Gly Ile Arg Asp Ala 65 70 75 80 Gly Gly Ile Pro Met Glu Phe Pro Leu His Pro Ile Phe Glu Asn Cys 85 90 95 Arg Arg Pro Thr Ala Ala Ile Asp Arg Asn Leu Ala Tyr Leu Gly Leu 100 105 110 Val Glu Ile Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu Thr Thr 115 120 125 Gly Cys Asp Lys Thr Thr Pro Ser Gln Ile Met Ala Ala Ala Thr Val 130 135 140 Asp Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp 145 150 155 160 Met Asp Gly Glu Leu Val Gly Ser Gly Ser Ala Ile Trp Lys Gly Arg 165 170 175 Lys Leu Leu Ser Ala Gly Ser Ile Asp Asn Glu Lys Phe Leu Glu Ile 180 185 190 Ala Ala Ala Ser Ala Pro Ser Ser Gly His Cys Asn Thr Met Gly Thr 195 200 205 Ala Ser Thr Met Asn Ala Met Ala Glu Ala Leu Gly Met Ser Leu Thr 210 215 220 Gly Cys Ser Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln Met Ala 225 230 235 240 Tyr Glu Thr Gly Arg Arg Ile Val Gly Met Ala Tyr Glu Asp Leu Arg 245 250 255 Pro Ser Ala Ile Leu Thr Arg Asp Ala Phe Leu Asp Ala Ile Val Val 260 265 270 Asn Ala Ala Ile Gly Gly Ser Thr Asn Ala Gln Pro His Ile Met Ala 275 280 285 Met Ala Arg His Ala Gly Val Glu Leu Gln Ser Glu Asp Trp Met Lys 290 295 300 Tyr Gly Tyr Asp Val Pro Leu Leu Leu Asn Met Gln Pro Ala Gly Lys 305 310 315 320 Tyr Leu Gly Glu Arg Phe His Arg Ala Gly Gly Val Pro Ala Ile Met 325 330 335 Trp Glu Leu Gln Gln Ala Gly Lys Leu Arg Ala Glu Arg Ile Thr Ala 340 345 350 Thr Gly Lys Thr Met Ala Glu Asn Leu Gln Gly Arg Ala Ser Asn Asp 355 360 365 Arg Glu Met Ile Tyr Pro Phe Ala Ala Pro Leu Arg Glu Arg Ala Gly 370 375 380 Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Thr 385 390 395 400 Ser Val Ile Ser Glu Thr Phe Arg Glu Arg Tyr Leu Ser Thr Pro Gly 405 410 415 Gln Glu Asn Ile Phe Glu Cys Arg Ala Val Val Phe Asp Gly Ser Asp 420 425 430 Asp Tyr His Ala Arg Ile Asn Asp Pro Ala Leu Lys Ile Asp Glu Asn 435 440 445 Thr Leu Leu Ala Ile Arg Gly Ala Gly Pro Val Gly Trp Pro Gly Ser 450 455 460 Ala Glu Val Val Asn Met Gln Pro Pro Asp Ala Leu Ile Lys Arg Gly 465 470 475 480 Val Ser Thr Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ser 485 490 495 Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Val Gly Gly 500 505 510 Gly Leu Ala Tyr Leu Arg Asp Gly Asp Arg Val Arg Ile Asp Leu Asn 515 520 525 Thr Gly Glu Cys Asn Met Leu Val Ser Glu Glu Glu Leu Ala Arg Arg 530 535 540 Lys Ser Glu Gly Ile Pro Pro Val Pro Pro Ser Gln Thr Pro Trp Gln 545 550 555 560 Glu Ile Tyr Arg Ser Thr Val Gly Gln Leu Glu Thr Gly Ala Cys Met 565 570 575 Glu Leu Ala Leu Lys Tyr Gln Gly Val Ala Gln Thr Leu Pro Arg His 580 585 590 Asn His <210> 78 <211> 1785 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 78 atgaacaaac cgaatgccac cccgcgtcgc tttcgtagcc aggattggtt cgataacccg 60 gatcatattg atatgacggc gctgtatctg gaacgcttta tgaattacgg cattaccgcc 120 gaagaactgc gtagcggtcg cccgattatc ggcatcgcac agagtggtag cgatatttct 180 ccgtgcaacc gtatccatct ggaactggca aaacgtgttc gcgatggtat tcgcgatgcg 240 ggcggtatcc cgatggaatt tccgctgcac ccgattttcg aaaattgccg tcgcccgacc 300 gccgcaattg atcgtaatct ggcatatctg ggcctggtgg aaattctgca tggttacccg 360 atcgatgcgg tggttctgac cacgggctgc gataaaacca cgccgagtca gattatggca 420 gcggccaccg tggatattcc ggcgatcgtt ctgagcggcg gtccgatgct ggatggttgg 480 atggatggcg aactggttgg ttctggcagt gccatctgga aaggccgcaa actgctgagc 540 gcaggttcta tcgataacga aaagttcctg gaaattgcag ccgcatctgc cccgagctct 600 ggtcactgca acaccatggg tacggcaagt accatgaatg cgatggccga agcactgggc 660 atgagcctga cgggttgttc tgcaattccg gcgccgtatc gtgaacgcgg ccagatggcc 720 tacgaaaccg gccgtcgcat tgtgggtatg gcgtatgaag atctgcgccc gagcgccatc 780 ctgacccgtg atgcctttct ggatgcaatt gtggttaacg cagcgatcgg cggtagcacc 840 aatgcacagc cgcatattat ggcgatggcc cgtcacgcgg gcgttgaact gcagtctgaa 900 gattggatga aatatggtta cgatgtgccg ctgctgctga acatgcagcc ggccggtaaa 960 tatctgggcg aacgctttca tcgcgcaggc ggtgttccgg cgattatgtg ggaactgcag 1020 caggccggta aactgcgtgc agaacgcatc accgcgacgg gcaaaaccat ggccgaaaac 1080 ctgcagggtc gtgcaagcaa tgatcgcgaa atgatttacc cgtttgccgc accgctgcgt 1140 gaacgtgccg gcttcctggt tctgaaaggt aacctgtttg atttcgccat tatgaaaacg 1200 agtgtgatca gcgaaacctt tcgtgaacgc tatctgtcta cgccgggcca ggaaaatatc 1260 tttgaatgtc gtgcggtggt tttcgatggt agtgatgatt accacgcacg cattaacgat 1320 ccggcgctga aaatcgatga aaataccctg ctggccattc gtggtgccgg tccggttggt 1380 tggccgggta gcgcggaagt ggttaacatg cagccgccag atgccctgat caaacgtggc 1440 gtgagtacgc tgccgaccct gggtgatggc cgccagagcg gcaccagcga ttctccgagt 1500 attctgaatg cctctccgga aagtgcagtg ggcggtggcc tggcatatct gcgtgatggc 1560 gatcgtgttc gcatcgatct gaacacgggt gaatgtaata tgctggtgag tgaagaagaa 1620 ctggcgcgtc gcaaaagcga aggcattccg ccggttccgc cgtctcagac cccgtggcag 1680 gaaatctatc gtagcacggt gggccagctg gaaaccggtg cgtgcatgga actggccctg 1740 aaatatcagg gtgtggccca gaccctgccg cgtcataatc actga 1785 <210> 79 <211> 1755 <212> DNA <213> Actinoplanes missouriensis <220> <221> CDS <222> (1)..(1755) <400> 79 atg gac cta cac agg ccc cgg aag tta cga agg agg ctg gcg atg cag 48 Met Asp Leu His Arg Pro Arg Lys Leu Arg Arg Arg Leu Ala Met Gln 1 5 10 15 cga cgc agt gca cag tgg tac gcc ggt gac gac cgg aac agc tac atc 96 Arg Arg Ser Ala Gln Trp Tyr Ala Gly Asp Asp Arg Asn Ser Tyr Ile 20 25 30 cac cgc gcc tgg atg cgc cgg ggc ctg ccg gcc gac gcg ttc gac ggg 144 His Arg Ala Trp Met Arg Arg Gly Leu Pro Ala Asp Ala Phe Asp Gly 35 40 45 cgc ccg cac atc gcc atc gcc aac acc gcc tcg gac ctg acc ccg tgc 192 Arg Pro His Ile Ala Ile Ala Asn Thr Ala Ser Asp Leu Thr Pro Cys 50 55 60 aac gcc cac ttc gac gag gtc gcc cgc agc gtc gcc gac ggc atc cac 240 Asn Ala His Phe Asp Glu Val Ala Arg Ser Val Ala Asp Gly Ile His 65 70 75 80 cgg gcg ggc ggc gtc gcg ctg aac ctg ccc gtc gtg tcg atc ggc gag 288 Arg Ala Gly Gly Val Ala Leu Asn Leu Pro Val Val Ser Ile Gly Glu 85 90 95 acc cag gtc cgg ccc acc gcg atg ctg tgg cga aac atg gcc gcg atg 336 Thr Gln Val Arg Pro Thr Ala Met Leu Trp Arg Asn Met Ala Ala Met 100 105 110 gcg atc gag gag atg ctg cgc gcc aac ccg atc gac ggc gtc gtc ctg 384 Ala Ile Glu Glu Met Leu Arg Ala Asn Pro Ile Asp Gly Val Val Leu 115 120 125 ctc ggc ggc tgc gac aag acc atc ccc gcg ctg ctc atg ggc gcc gcc 432 Leu Gly Gly Cys Asp Lys Thr Ile Pro Ala Leu Leu Met Gly Ala Ala 130 135 140 tcg gtc gac ctg ccg gcc gtc gtg atg ccc ggc ggc ccg atg ctg acc 480 Ser Val Asp Leu Pro Ala Val Val Met Pro Gly Gly Pro Met Leu Thr 145 150 155 160 ggc acc ttc cgg ggc gtg ccg ctc ggc tgc ggc acc gac gtg tgg aag 528 Gly Thr Phe Arg Gly Val Pro Leu Gly Cys Gly Thr Asp Val Trp Lys 165 170 175 ctg agc gag gag gtc cgg gcc ggc acc ctg agc gcc gcc gag ttc acc 576 Leu Ser Glu Glu Val Arg Ala Gly Thr Leu Ser Ala Ala Glu Phe Thr 180 185 190 cgc tcc gag tca tcg atg atc agg agc aag ggc cac tgc aac acc atg 624 Arg Ser Glu Ser Ser Met Ile Arg Ser Lys Gly His Cys Asn Thr Met 195 200 205 ggt acg gcg tcg acc atg ggc ctg ctc gcc gaa gtg ctc ggc atg acc 672 Gly Thr Ala Ser Thr Met Gly Leu Leu Ala Glu Val Leu Gly Met Thr 210 215 220 ctg ccg ggg gtg gcc ggc acg ccc gcc ccg gac agc cgg ctg ctg gag 720 Leu Pro Gly Val Ala Gly Thr Pro Ala Pro Asp Ser Arg Leu Leu Glu 225 230 235 240 gcc gcc cac gcg acc ggg gtg ctc gcc gtc ggc ctg gtc gac gcg gac 768 Ala Ala His Ala Thr Gly Val Leu Ala Val Gly Leu Val Asp Ala Asp 245 250 255 cgc cgc ccg agc cag gtg atg acc cgc ggc tcg ttc ctc aac gcg atc 816 Arg Arg Pro Ser Gln Val Met Thr Arg Gly Ser Phe Leu Asn Ala Ile 260 265 270 gtc gcg ctc gcc gcc ctg ggc ggc tcc acc aac gcc gtc gtg cac ctg 864 Val Ala Leu Ala Ala Leu Gly Gly Ser Thr Asn Ala Val Val His Leu 275 280 285 ctg gcc atc gcc ggc cgg ctc ggc gtg ccg ctg tcc cag gac gac ttc 912 Leu Ala Ile Ala Gly Arg Leu Gly Val Pro Leu Ser Gln Asp Asp Phe 290 295 300 gac acc acc ggc gcc gac gtt ccg ctg ctg gtc gac ctg ctc ccg gcc 960 Asp Thr Thr Gly Ala Asp Val Pro Leu Leu Val Asp Leu Leu Pro Ala 305 310 315 320 ggc cgc ttc ctg atg gac gac ctc tac cgc gcc ggc ggt ctg cac gcc 1008 Gly Arg Phe Leu Met Asp Asp Leu Tyr Arg Ala Gly Gly Leu His Ala 325 330 335 gtc ctc gcc gag gtc cgt gac ctg ctc gac ccg tcc gcg atc acg gtc 1056 Val Leu Ala Glu Val Arg Asp Leu Leu Asp Pro Ser Ala Ile Thr Val 340 345 350 acc ggc cgg ccg ctg acc gag cac ctc ggc gac gcc cgc gtc cac gac 1104 Thr Gly Arg Pro Leu Thr Glu His Leu Gly Asp Ala Arg Val His Asp 355 360 365 cgc gag gtg atc cgg ccg cgg gcc gaa ccg ttg ctg ccg cac gcc ggg 1152 Arg Glu Val Ile Arg Pro Arg Ala Glu Pro Leu Leu Pro His Ala Gly 370 375 380 atc gcg gtc ctc tac ggc aac ctg gcg ccg gac ggc gcg gtc gtc aaa 1200 Ile Ala Val Leu Tyr Gly Asn Leu Ala Pro Asp Gly Ala Val Val Lys 385 390 395 400 ccg gcc gcc gcg tcc gag cac ttg ctg cgc cac cgg ggt ccg gcc gtg 1248 Pro Ala Ala Ala Ser Glu His Leu Leu Arg His Arg Gly Pro Ala Val 405 410 415 gtc ttc gac tcc gtc gag gac ctg cac gcc cgg ctc gac gac ccg gac 1296 Val Phe Asp Ser Val Glu Asp Leu His Ala Arg Leu Asp Asp Pro Asp 420 425 430 ctg gac gtc acc gcc gac tcg gtg ctg gtg ctg cgc ggc tgc ggt ccc 1344 Leu Asp Val Thr Ala Asp Ser Val Leu Val Leu Arg Gly Cys Gly Pro 435 440 445 aag ggc tat ccg ggc atg ccg gag gtg tcc aac atg ccg ctg ccg gcg 1392 Lys Gly Tyr Pro Gly Met Pro Glu Val Ser Asn Met Pro Leu Pro Ala 450 455 460 aaa ctc ctc gaa cag ggg gtc cgc gac atg gtc cgg gtc tgc gac ggg 1440 Lys Leu Leu Glu Gln Gly Val Arg Asp Met Val Arg Val Cys Asp Gly 465 470 475 480 cgg atg tcg ggt acg gcg tac ggc acg gtg gtc ctg cac gtc gcc ccg 1488 Arg Met Ser Gly Thr Ala Tyr Gly Thr Val Val Leu His Val Ala Pro 485 490 495 gaa gcc gcg gcg ggc ggg ccg ctc gcc cgg gtc cgc acc ggc gac atg 1536 Glu Ala Ala Ala Gly Gly Pro Leu Ala Arg Val Arg Thr Gly Asp Met 500 505 510 atc atc ctc gac gtc gcg aac cgg cgc ctc gac gcc gac gtc ccg gcc 1584 Ile Ile Leu Asp Val Ala Asn Arg Arg Leu Asp Ala Asp Val Pro Ala 515 520 525 gag gag tgg gcc gcc cgc gag ccg tca ccg gag gcg gcg aaa gcc tac 1632 Glu Glu Trp Ala Ala Arg Glu Pro Ser Pro Glu Ala Ala Lys Ala Tyr 530 535 540 gcg gcg ccg tcc cgc ggc tgg gag cgt ctc tac gtc gac acc gtc ggc 1680 Ala Ala Pro Ser Arg Gly Trp Glu Arg Leu Tyr Val Asp Thr Val Gly 545 550 555 560 cag gcc gac acc ggc gcc gac tgc gac ttc ctg cgc ggc gcg agc ggc 1728 Gln Ala Asp Thr Gly Ala Asp Cys Asp Phe Leu Arg Gly Ala Ser Gly 565 570 575 gac cgc gtc tcc cgc gag tcc cac tga 1755 Asp Arg Val Ser Arg Glu Ser His 580 <210> 80 <211> 584 <212> PRT <213> Actinoplanes missouriensis <400> 80 Met Asp Leu His Arg Pro Arg Lys Leu Arg Arg Arg Leu Ala Met Gln 1 5 10 15 Arg Arg Ser Ala Gln Trp Tyr Ala Gly Asp Asp Arg Asn Ser Tyr Ile 20 25 30 His Arg Ala Trp Met Arg Arg Gly Leu Pro Ala Asp Ala Phe Asp Gly 35 40 45 Arg Pro His Ile Ala Ile Ala Asn Thr Ala Ser Asp Leu Thr Pro Cys 50 55 60 Asn Ala His Phe Asp Glu Val Ala Arg Ser Val Ala Asp Gly Ile His 65 70 75 80 Arg Ala Gly Gly Val Ala Leu Asn Leu Pro Val Val Ser Ile Gly Glu 85 90 95 Thr Gln Val Arg Pro Thr Ala Met Leu Trp Arg Asn Met Ala Ala Met 100 105 110 Ala Ile Glu Glu Met Leu Arg Ala Asn Pro Ile Asp Gly Val Val Leu 115 120 125 Leu Gly Gly Cys Asp Lys Thr Ile Pro Ala Leu Leu Met Gly Ala Ala 130 135 140 Ser Val Asp Leu Pro Ala Val Val Met Pro Gly Gly Pro Met Leu Thr 145 150 155 160 Gly Thr Phe Arg Gly Val Pro Leu Gly Cys Gly Thr Asp Val Trp Lys 165 170 175 Leu Ser Glu Glu Val Arg Ala Gly Thr Leu Ser Ala Ala Glu Phe Thr 180 185 190 Arg Ser Glu Ser Ser Met Ile Arg Ser Lys Gly His Cys Asn Thr Met 195 200 205 Gly Thr Ala Ser Thr Met Gly Leu Leu Ala Glu Val Leu Gly Met Thr 210 215 220 Leu Pro Gly Val Ala Gly Thr Pro Ala Pro Asp Ser Arg Leu Leu Glu 225 230 235 240 Ala Ala His Ala Thr Gly Val Leu Ala Val Gly Leu Val Asp Ala Asp 245 250 255 Arg Arg Pro Ser Gln Val Met Thr Arg Gly Ser Phe Leu Asn Ala Ile 260 265 270 Val Ala Leu Ala Ala Leu Gly Gly Ser Thr Asn Ala Val Val His Leu 275 280 285 Leu Ala Ile Ala Gly Arg Leu Gly Val Pro Leu Ser Gln Asp Asp Phe 290 295 300 Asp Thr Thr Gly Ala Asp Val Pro Leu Leu Val Asp Leu Leu Pro Ala 305 310 315 320 Gly Arg Phe Leu Met Asp Asp Leu Tyr Arg Ala Gly Gly Leu His Ala 325 330 335 Val Leu Ala Glu Val Arg Asp Leu Leu Asp Pro Ser Ala Ile Thr Val 340 345 350 Thr Gly Arg Pro Leu Thr Glu His Leu Gly Asp Ala Arg Val His Asp 355 360 365 Arg Glu Val Ile Arg Pro Arg Ala Glu Pro Leu Leu Pro His Ala Gly 370 375 380 Ile Ala Val Leu Tyr Gly Asn Leu Ala Pro Asp Gly Ala Val Val Lys 385 390 395 400 Pro Ala Ala Ala Ser Glu His Leu Leu Arg His Arg Gly Pro Ala Val 405 410 415 Val Phe Asp Ser Val Glu Asp Leu His Ala Arg Leu Asp Asp Pro Asp 420 425 430 Leu Asp Val Thr Ala Asp Ser Val Leu Val Leu Arg Gly Cys Gly Pro 435 440 445 Lys Gly Tyr Pro Gly Met Pro Glu Val Ser Asn Met Pro Leu Pro Ala 450 455 460 Lys Leu Leu Glu Gln Gly Val Arg Asp Met Val Arg Val Cys Asp Gly 465 470 475 480 Arg Met Ser Gly Thr Ala Tyr Gly Thr Val Val Leu His Val Ala Pro 485 490 495 Glu Ala Ala Ala Gly Gly Pro Leu Ala Arg Val Arg Thr Gly Asp Met 500 505 510 Ile Ile Leu Asp Val Ala Asn Arg Arg Leu Asp Ala Asp Val Pro Ala 515 520 525 Glu Glu Trp Ala Ala Arg Glu Pro Ser Pro Glu Ala Ala Lys Ala Tyr 530 535 540 Ala Ala Pro Ser Arg Gly Trp Glu Arg Leu Tyr Val Asp Thr Val Gly 545 550 555 560 Gln Ala Asp Thr Gly Ala Asp Cys Asp Phe Leu Arg Gly Ala Ser Gly 565 570 575 Asp Arg Val Ser Arg Glu Ser His 580 <210> 81 <211> 1755 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 81 atggatctgc atcgtccgcg taaactgcgt cgccgtctgg ccatgcagcg ccgtagcgcc 60 cagtggtatg caggcgatga tcgcaactct tacattcatc gtgcatggat gcgccgtggt 120 ctgccggcag atgcatttga tggccgtccg cacattgcga tcgccaacac ggcgtctgat 180 ctgaccccgt gcaatgccca tttcgatgaa gttgcgcgca gtgtggccga tggtattcac 240 cgtgcaggcg gtgttgcgct gaatctgccg gtggttagca ttggtgaaac ccaagtgcgt 300 ccgaccgcca tgctgtggcg taacatggcg gccatggcaa ttgaagaaat gctgcgtgcg 360 aatccgatcg atggtgtggt tctgctgggc ggttgtgata aaacgattcc ggccctgctg 420 atgggcgcag cgagtgttga tctgccggca gtggttatgc cgggcggtcc gatgctgacc 480 ggcacgtttc gcggtgtgcc gctgggttgt ggcaccgatg tttggaaact gagcgaagaa 540 gtgcgtgcgg gtacgctgtc tgccgcagaa tttacccgca gtgaaagctc tatgatccgt 600 agcaaaggtc attgtaacac catgggcacg gcaagcacca tgggtctgct ggcagaagtt 660 ctgggcatga cgctgccggg tgtggcgggc accccggcac cggattctcg tctgctggaa 720 gccgcacatg ccaccggtgt gctggcggtt ggcctggtgg atgccgatcg ccgtccgtct 780 caggttatga cgcgtggcag ttttctgaat gcaattgtgg cactggcggc gctgggcggc 840 agtaccaatg cagtggttca tctgctggca attgccggcc gcctgggtgt gccgctgagc 900 caggatgatt ttgataccac gggtgccgat gttccgctgc tggttgatct gctgccggca 960 ggccgcttcc tgatggatga tctgtatcgt gcgggcggtc tgcatgcggt tctggcagaa 1020 gtgcgcgatc tgctggatcc gagcgcgatc accgtgaccg gtcgtccgct gaccgaacat 1080 ctgggcgatg cgcgcgttca cgatcgtgaa gtgattcgtc cgcgtgcgga accgctgctg 1140 ccgcatgcag gtattgcggt gctgtacggt aatctggccc cggatggtgc ggtggttaaa 1200 ccggcggcag ccagcgaaca tctgctgcgt caccgtggtc cggcggtggt tttcgattct 1260 gttgaagatc tgcacgcacg cctggatgat ccggatctgg atgtgaccgc ggattctgtg 1320 ctggttctgc gtggctgcgg tccgaaaggc tatccgggta tgccggaagt tagtaacatg 1380 ccgctgccgg cgaaactgct ggaacagggt gtgcgcgata tggtgcgtgt ttgtgatggc 1440 cgtatgtctg gtacggcata cggcaccgtg gttctgcatg ttgccccgga agcggcagcg 1500 ggcggtccgc tggcacgcgt gcgtaccggc gatatgatta tcctggatgt tgccaatcgc 1560 cgtctggatg cagatgtgcc ggccgaagaa tgggcggcac gtgaaccgag tccggaagcc 1620 gcaaaagcct atgcggcccc gagccgtggt tgggaacgtc tgtacgttga tacggtgggt 1680 caggccgata ccggcgcaga ttgcgatttt ctgcgtggcg cgagcggtga tcgcgtgagt 1740 cgtgaaagcc actga 1755 <210> 82 <211> 1962 <212> DNA <213> Aspergillus oryzae <220> <221> CDS <222> (1)..(1962) <400> 82 atg tcg tgt cag tca cgc acc tcg tgt gaa ggc tgc tcc tgc agt gac 48 Met Ser Cys Gln Ser Arg Thr Ser Cys Glu Gly Cys Ser Cys Ser Asp 1 5 10 15 ggg ggc agc cgg cca cca gtg aac atc gag gac tgt gag agc gaa ctg 96 Gly Gly Ser Arg Pro Pro Val Asn Ile Glu Asp Cys Glu Ser Glu Leu 20 25 30 ctt gcc ctt cgg agg cgt aca gtg gag ctc gag aaa act cta gca tca 144 Leu Ala Leu Arg Arg Arg Thr Val Glu Leu Glu Lys Thr Leu Ala Ser 35 40 45 atg caa gat ggc cgg cca cat gct aat gca tca agg gcc cgg aag tta 192 Met Gln Asp Gly Arg Pro His Ala Asn Ala Ser Arg Ala Arg Lys Leu 50 55 60 cgg tcg gcc aac tgg ttc aac tgc gag agc gat ccg ggc atg atg gcc 240 Arg Ser Ala Asn Trp Phe Asn Cys Glu Ser Asp Pro Gly Met Met Ala 65 70 75 80 ctc tac att gag cgg tac ctc aac tat ggt atc acc cgg gaa gaa ctg 288 Leu Tyr Ile Glu Arg Tyr Leu Asn Tyr Gly Ile Thr Arg Glu Glu Leu 85 90 95 atg tct ggt aaa cca ata atc gga ata gca cag tcc ggg tcc gac ttg 336 Met Ser Gly Lys Pro Ile Ile Gly Ile Ala Gln Ser Gly Ser Asp Leu 100 105 110 tct cca tgc aac cgc cat cac ctc gag ttg gcg aaa cgg gtt cga gaa 384 Ser Pro Cys Asn Arg His His Leu Glu Leu Ala Lys Arg Val Arg Glu 115 120 125 ggt atc agg tcc gcc gga ggg atc gcc ttt gaa ttc ccc acg cat cct 432 Gly Ile Arg Ser Ala Gly Gly Ile Ala Phe Glu Phe Pro Thr His Pro 130 135 140 att cag gag act agc agg aga ccc act gct tgt att gac cga aat cta 480 Ile Gln Glu Thr Ser Arg Arg Pro Thr Ala Cys Ile Asp Arg Asn Leu 145 150 155 160 tcg tat ctg ggc ctg gta gaa att ctc ttc gga tat ccc ttg gac ggt 528 Ser Tyr Leu Gly Leu Val Glu Ile Leu Phe Gly Tyr Pro Leu Asp Gly 165 170 175 gta gtc ctc ctg acg ggc tgc gac aag act act ccc gcc gct ctg atg 576 Val Val Leu Leu Thr Gly Cys Asp Lys Thr Thr Pro Ala Ala Leu Met 180 185 190 gcc gcg gct aca gtg aat atc cca gca ata tgc ttg aat gtc ggc cca 624 Ala Ala Ala Thr Val Asn Ile Pro Ala Ile Cys Leu Asn Val Gly Pro 195 200 205 atg ctt aac ggt tac gtg aag aag gac ctg gcg ggg tcc gga atg gta 672 Met Leu Asn Gly Tyr Val Lys Lys Asp Leu Ala Gly Ser Gly Met Val 210 215 220 ttg tgg acg ggt aga gag atg tat gcg gca ggt gag atc aac aag gag 720 Leu Trp Thr Gly Arg Glu Met Tyr Ala Ala Gly Glu Ile Asn Lys Glu 225 230 235 240 gaa ttc att gac tat gtg tcc aaa ggt aca cca tca gtg gga cat tgt 768 Glu Phe Ile Asp Tyr Val Ser Lys Gly Thr Pro Ser Val Gly His Cys 245 250 255 aac acg atg gga aca gca tca act atg aat gct ttg gca gaa gcg ctt 816 Asn Thr Met Gly Thr Ala Ser Thr Met Asn Ala Leu Ala Glu Ala Leu 260 265 270 gga atg gcc cta cct ggg tcg gct gcc ata ccg gct ccg tat cgt gaa 864 Gly Met Ala Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Glu 275 280 285 cgt ggc caa tgt gct tac gaa aca ggt ttg cgt att gtc gaa atg gtt 912 Arg Gly Gln Cys Ala Tyr Glu Thr Gly Leu Arg Ile Val Glu Met Val 290 295 300 cat tcc gat cgg aag ccc agc gat att atg act cga gag gct ttc gag 960 His Ser Asp Arg Lys Pro Ser Asp Ile Met Thr Arg Glu Ala Phe Glu 305 310 315 320 aat gtt att gta gtt aat act gct atc ggc ggc agt acc aat gcc cct 1008 Asn Val Ile Val Val Asn Thr Ala Ile Gly Gly Ser Thr Asn Ala Pro 325 330 335 att cat atc aac gcc att gcc aaa cat att ggg gtt gag gtt tca ctg 1056 Ile His Ile Asn Ala Ile Ala Lys His Ile Gly Val Glu Val Ser Leu 340 345 350 gat gac tgg gac cga ctt gga ttt cat att cca cta ctg cta aac atg 1104 Asp Asp Trp Asp Arg Leu Gly Phe His Ile Pro Leu Leu Leu Asn Met 355 360 365 caa cca gcc ggt gaa ctg ctg gga gag gaa tac tat cgg gcg ggc ggg 1152 Gln Pro Ala Gly Glu Leu Leu Gly Glu Glu Tyr Tyr Arg Ala Gly Gly 370 375 380 cta ccc gcg att atg gcg gag ctg cta gat gct agg aag ctg aac ccg 1200 Leu Pro Ala Ile Met Ala Glu Leu Leu Asp Ala Arg Lys Leu Asn Pro 385 390 395 400 gat gct tta aca tgc aat ggt tac aca gta gcc gag aat gtc cgg gac 1248 Asp Ala Leu Thr Cys Asn Gly Tyr Thr Val Ala Glu Asn Val Arg Asp 405 410 415 aaa cat acc tgg gac cgt cga atg atc aag ccg tac aat gag cca ctt 1296 Lys His Thr Trp Asp Arg Arg Met Ile Lys Pro Tyr Asn Glu Pro Leu 420 425 430 ctg gaa gat gcc ggt ttt ctc cat ctt caa ggc agt ctg ttc cgg tct 1344 Leu Glu Asp Ala Gly Phe Leu His Leu Gln Gly Ser Leu Phe Arg Ser 435 440 445 gct atc atg aag aca tgt gtg ata tcg gag cct ttc cga caa aag ttc 1392 Ala Ile Met Lys Thr Cys Val Ile Ser Glu Pro Phe Arg Gln Lys Phe 450 455 460 ttg gag aat ccc aag gac ccg aat gca ttt gaa ggt acg gtt gta gta 1440 Leu Glu Asn Pro Lys Asp Pro Asn Ala Phe Glu Gly Thr Val Val Val 465 470 475 480 ttt gat gga ccg gag gat tat cat cac cga ctt gag gac cct tcc acc 1488 Phe Asp Gly Pro Glu Asp Tyr His His Arg Leu Glu Asp Pro Ser Thr 485 490 495 ccc atc gac gac aga agt atc ctg gtg atg cgc ggt gct ggc cca ttg 1536 Pro Ile Asp Asp Arg Ser Ile Leu Val Met Arg Gly Ala Gly Pro Leu 500 505 510 gga tat cca ggt gcc gcc gag gtc gtc aac atg cac cca cct gga cgg 1584 Gly Tyr Pro Gly Ala Ala Glu Val Val Asn Met His Pro Pro Gly Arg 515 520 525 ctt tta cga caa ggg gtc aaa tcg ctt ccg tgc att gga gac ggg cga 1632 Leu Leu Arg Gln Gly Val Lys Ser Leu Pro Cys Ile Gly Asp Gly Arg 530 535 540 caa tcg gga act tcc ggc tca cca tca atc ctc aat gct agt ccc gag 1680 Gln Ser Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu 545 550 555 560 gca gcg gcg ggt ggt aat cta gcc ctt ctt caa gat ggg gac aga ctc 1728 Ala Ala Ala Gly Gly Asn Leu Ala Leu Leu Gln Asp Gly Asp Arg Leu 565 570 575 cgt gtt gat cta aat aaa cgg cgc gtt gac atc ctt gtt tcc acg gag 1776 Arg Val Asp Leu Asn Lys Arg Arg Val Asp Ile Leu Val Ser Thr Glu 580 585 590 gaa ctg gaa aag cgg aga aag aca cta gaa gcc caa gga ggt tat gat 1824 Glu Leu Glu Lys Arg Arg Lys Thr Leu Glu Ala Gln Gly Gly Tyr Asp 595 600 605 gtg ccg gaa agt caa act cca tgg cag gaa ctg ttc agg agg gag acg 1872 Val Pro Glu Ser Gln Thr Pro Trp Gln Glu Leu Phe Arg Arg Glu Thr 610 615 620 aca cag ttg agt gat ggt atg gtc ctc cga gac gcg gta aaa tac caa 1920 Thr Gln Leu Ser Asp Gly Met Val Leu Arg Asp Ala Val Lys Tyr Gln 625 630 635 640 cga ctt gcc cag cga tat gag aac ccc cgg cac aat cat tga 1962 Arg Leu Ala Gln Arg Tyr Glu Asn Pro Arg His Asn His 645 650 <210> 83 <211> 653 <212> PRT <213> Aspergillus oryzae <400> 83 Met Ser Cys Gln Ser Arg Thr Ser Cys Glu Gly Cys Ser Cys Ser Asp 1 5 10 15 Gly Gly Ser Arg Pro Pro Val Asn Ile Glu Asp Cys Glu Ser Glu Leu 20 25 30 Leu Ala Leu Arg Arg Arg Thr Val Glu Leu Glu Lys Thr Leu Ala Ser 35 40 45 Met Gln Asp Gly Arg Pro His Ala Asn Ala Ser Arg Ala Arg Lys Leu 50 55 60 Arg Ser Ala Asn Trp Phe Asn Cys Glu Ser Asp Pro Gly Met Met Ala 65 70 75 80 Leu Tyr Ile Glu Arg Tyr Leu Asn Tyr Gly Ile Thr Arg Glu Glu Leu 85 90 95 Met Ser Gly Lys Pro Ile Ile Gly Ile Ala Gln Ser Gly Ser Asp Leu 100 105 110 Ser Pro Cys Asn Arg His His Leu Glu Leu Ala Lys Arg Val Arg Glu 115 120 125 Gly Ile Arg Ser Ala Gly Gly Ile Ala Phe Glu Phe Pro Thr His Pro 130 135 140 Ile Gln Glu Thr Ser Arg Arg Pro Thr Ala Cys Ile Asp Arg Asn Leu 145 150 155 160 Ser Tyr Leu Gly Leu Val Glu Ile Leu Phe Gly Tyr Pro Leu Asp Gly 165 170 175 Val Val Leu Leu Thr Gly Cys Asp Lys Thr Thr Pro Ala Ala Leu Met 180 185 190 Ala Ala Ala Thr Val Asn Ile Pro Ala Ile Cys Leu Asn Val Gly Pro 195 200 205 Met Leu Asn Gly Tyr Val Lys Lys Asp Leu Ala Gly Ser Gly Met Val 210 215 220 Leu Trp Thr Gly Arg Glu Met Tyr Ala Ala Gly Glu Ile Asn Lys Glu 225 230 235 240 Glu Phe Ile Asp Tyr Val Ser Lys Gly Thr Pro Ser Val Gly His Cys 245 250 255 Asn Thr Met Gly Thr Ala Ser Thr Met Asn Ala Leu Ala Glu Ala Leu 260 265 270 Gly Met Ala Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Glu 275 280 285 Arg Gly Gln Cys Ala Tyr Glu Thr Gly Leu Arg Ile Val Glu Met Val 290 295 300 His Ser Asp Arg Lys Pro Ser Asp Ile Met Thr Arg Glu Ala Phe Glu 305 310 315 320 Asn Val Ile Val Val Asn Thr Ala Ile Gly Gly Ser Thr Asn Ala Pro 325 330 335 Ile His Ile Asn Ala Ile Ala Lys His Ile Gly Val Glu Val Ser Leu 340 345 350 Asp Asp Trp Asp Arg Leu Gly Phe His Ile Pro Leu Leu Leu Asn Met 355 360 365 Gln Pro Ala Gly Glu Leu Leu Gly Glu Glu Tyr Tyr Arg Ala Gly Gly 370 375 380 Leu Pro Ala Ile Met Ala Glu Leu Leu Asp Ala Arg Lys Leu Asn Pro 385 390 395 400 Asp Ala Leu Thr Cys Asn Gly Tyr Thr Val Ala Glu Asn Val Arg Asp 405 410 415 Lys His Thr Trp Asp Arg Arg Met Ile Lys Pro Tyr Asn Glu Pro Leu 420 425 430 Leu Glu Asp Ala Gly Phe Leu His Leu Gln Gly Ser Leu Phe Arg Ser 435 440 445 Ala Ile Met Lys Thr Cys Val Ile Ser Glu Pro Phe Arg Gln Lys Phe 450 455 460 Leu Glu Asn Pro Lys Asp Pro Asn Ala Phe Glu Gly Thr Val Val Val 465 470 475 480 Phe Asp Gly Pro Glu Asp Tyr His His Arg Leu Glu Asp Pro Ser Thr 485 490 495 Pro Ile Asp Asp Arg Ser Ile Leu Val Met Arg Gly Ala Gly Pro Leu 500 505 510 Gly Tyr Pro Gly Ala Ala Glu Val Val Asn Met His Pro Pro Gly Arg 515 520 525 Leu Leu Arg Gln Gly Val Lys Ser Leu Pro Cys Ile Gly Asp Gly Arg 530 535 540 Gln Ser Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu 545 550 555 560 Ala Ala Ala Gly Gly Asn Leu Ala Leu Leu Gln Asp Gly Asp Arg Leu 565 570 575 Arg Val Asp Leu Asn Lys Arg Arg Val Asp Ile Leu Val Ser Thr Glu 580 585 590 Glu Leu Glu Lys Arg Arg Lys Thr Leu Glu Ala Gln Gly Gly Tyr Asp 595 600 605 Val Pro Glu Ser Gln Thr Pro Trp Gln Glu Leu Phe Arg Arg Glu Thr 610 615 620 Thr Gln Leu Ser Asp Gly Met Val Leu Arg Asp Ala Val Lys Tyr Gln 625 630 635 640 Arg Leu Ala Gln Arg Tyr Glu Asn Pro Arg His Asn His 645 650 <210> 84 <211> 1962 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 84 atgtcttgcc agagtcgcac cagctgtgaa ggttgcagct gttctgatgg cggttctcgt 60 ccgccggtta atattgaaga ttgcgaaagt gaactgctgg ccctgcgtcg ccgtacggtg 120 gaactggaaa aaaccctggc atctatgcag gatggccgtc cgcatgcaaa tgcctctcgt 180 gcacgtaaac tgcgtagtgc aaactggttt aattgtgaaa gtgatccggg tatgatggcg 240 ctgtatattg aacgctatct gaattacggc atcacccgtg aagaactgat gagtggcaaa 300 ccgattatcg gtattgcaca gagtggcagc gatctgagcc cgtgcaaccg ccatcacctg 360 gaactggcga aacgtgtgcg tgaaggtatt cgtagcgcag gcggtatcgc gtttgaattt 420 ccgacccacc cgattcagga aacgagccgc cgtccgaccg cgtgtatcga tcgtaatctg 480 tcttatctgg gtctggtgga aatcctgttt ggttacccgc tggatggcgt ggttctgctg 540 accggttgtg ataaaaccac cccggcggcc ctgatggcag ccgcaaccgt taacattccg 600 gccatctgtc tgaacgtggg tccgatgctg aatggctatg tgaaaaaaga tctggcaggc 660 agcggtatgg tgctgtggac gggtcgcgaa atgtatgcag cgggcgaaat caacaaagaa 720 gaatttatcg attacgttag caaaggcacc ccgtctgtgg gccattgcaa taccatgggc 780 acggcgtcta ccatgaacgc cctggcagaa gccctgggta tggccctgcc gggtagtgcc 840 gcaattccgg ccccgtatcg cgaacgtggc cagtgtgcat acgaaacggg cctgcgcatt 900 gttgaaatgg tgcacagtga tcgcaaaccg agcgatatca tgacccgtga agcctttgaa 960 aacgtgattg tggttaatac ggcgatcggc ggtagtacca acgccccgat tcatatcaat 1020 gccattgcaa aacacatcgg tgttgaagtg agcctggatg attgggatcg tctgggcttc 1080 catattccgc tgctgctgaa tatgcagccg gcgggcgaac tgctgggtga agaatattat 1140 cgtgccggcg gtctgccggc catcatggcc gaactgctgg atgcacgtaa actgaacccg 1200 gatgcgctga cgtgcaatgg ttataccgtt gcggaaaacg tgcgcgataa acatacgtgg 1260 gatcgccgta tgatcaaacc gtacaacgaa ccgctgctgg aagatgcggg ttttctgcac 1320 ctgcagggct ctctgttccg cagtgccatt atgaaaacct gcgtgatcag cgaaccgttt 1380 cgtcagaaat tcctggaaaa cccgaaagat ccgaatgcgt ttgaaggtac ggtggtggtg 1440 tttgatggcc cggaagatta tcatcaccgc ctggaagatc cgagcacccc gattgatgat 1500 cgctctattc tggttatgcg tggcgccggt ccgctgggct acccgggtgc ggccgaagtt 1560 gtgaatatgc atccgccggg tcgcctgctg cgtcagggtg tgaaaagtct gccgtgcatt 1620 ggcgatggtc gtcagagcgg cacctctggt agtccgagca tcctgaacgc gagcccggaa 1680 gcagccgccg gcggtaacct ggcgctgctg caggatggtg atcgcctgcg tgttgatctg 1740 aacaaacgcc gtgttgatat tctggtgtct acggaagaac tggaaaaacg ccgtaaaacc 1800 ctggaagcgc agggcggtta tgatgtgccg gaaagccaga ccccgtggca ggaactgttt 1860 cgccgtgaaa ccacgcagct gtctgatggc atggttctgc gcgatgccgt gaaatatcag 1920 cgcctggcac agcgttacga aaacccgcgt cataatcact ga 1962 <210> 85 <211> 1161 <212> DNA <213> Agrobacterium tumefaciens <220> <221> CDS <222> (1)..(1161) <400> 85 atg acc ggc tca agg tcc atc gac gct acc gct att ttg cct gaa gac 48 Met Thr Gly Ser Arg Ser Ile Asp Ala Thr Ala Ile Leu Pro Glu Asp 1 5 10 15 ttt gaa aac gcc ctg ctc gtc ggc cgc gta tgg tcg aaa agc gaa ggc 96 Phe Glu Asn Ala Leu Leu Val Gly Arg Val Trp Ser Lys Ser Glu Gly 20 25 30 ggc ccc tgc ccc gtt ctg cta aaa ggc ggc gtg ctt tac gac ctc acc 144 Gly Pro Cys Pro Val Leu Leu Lys Gly Gly Val Leu Tyr Asp Leu Thr 35 40 45 tct att tcg ccg acc atg tct gaa ctt ctg gaa aag acg gat ctg gtg 192 Ser Ile Ser Pro Thr Met Ser Glu Leu Leu Glu Lys Thr Asp Leu Val 50 55 60 gag ctg ctt gca gac acc ggc aca ttc gtg gcg ctt ggc gcg ctc gag 240 Glu Leu Leu Ala Asp Thr Gly Thr Phe Val Ala Leu Gly Ala Leu Glu 65 70 75 80 gcc ttt ctg gat ggc tcc gct ggt gaa ctt ctc gcc ccc aac gat att 288 Ala Phe Leu Asp Gly Ser Ala Gly Glu Leu Leu Ala Pro Asn Asp Ile 85 90 95 cag gcc gtg aag gct gca ggc gtg acc ttc gcc gac agc atg ctg gaa 336 Gln Ala Val Lys Ala Ala Gly Val Thr Phe Ala Asp Ser Met Leu Glu 100 105 110 cgc gtg atc gag gag cag gcc aag ggc gat cca ctt cgc gcg cag gaa 384 Arg Val Ile Glu Glu Gln Ala Lys Gly Asp Pro Leu Arg Ala Gln Glu 115 120 125 ata cgc gga cgg ctg gcg ccg gtt ctc ggc gac aat ctc aag gga ctt 432 Ile Arg Gly Arg Leu Ala Pro Val Leu Gly Asp Asn Leu Lys Gly Leu 130 135 140 gag gcc ggt tcg gaa aaa gca gcc gaa gtg aag aaa ctg ctg cag gaa 480 Glu Ala Gly Ser Glu Lys Ala Ala Glu Val Lys Lys Leu Leu Gln Glu 145 150 155 160 atg ggc ctg tgg tcg caa tat ctg gaa gtt ggc atc ggt ccg gat gcg 528 Met Gly Leu Trp Ser Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Ala 165 170 175 gag ata ttc tcc aag gcg cag gcc atg gcc tcc gtc ggc tgc ggc gcg 576 Glu Ile Phe Ser Lys Ala Gln Ala Met Ala Ser Val Gly Cys Gly Ala 180 185 190 ctg atc ggc gtt cac ccg aaa tcg cag tgg aac aac ccg gag ccg gaa 624 Leu Ile Gly Val His Pro Lys Ser Gln Trp Asn Asn Pro Glu Pro Glu 195 200 205 gtg gtg ctg gcc att gcc tcc gac ggc cgt atc gtt ggc gcg acg ctt 672 Val Val Leu Ala Ile Ala Ser Asp Gly Arg Ile Val Gly Ala Thr Leu 210 215 220 ggc aac gac gtc aac ctg cgt gac ttc gag ggc cgc tcc gcc ctc ctg 720 Gly Asn Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu 225 230 235 240 ctc agc aag gca aaa gac aac aac gca tcc tgc gca atc ggt ccc ttc 768 Leu Ser Lys Ala Lys Asp Asn Asn Ala Ser Cys Ala Ile Gly Pro Phe 245 250 255 atc cgc ctg ttt gat gga cgc ttt acc atc gaa gac gtg aag aag gcg 816 Ile Arg Leu Phe Asp Gly Arg Phe Thr Ile Glu Asp Val Lys Lys Ala 260 265 270 cag ata tcg ctt ctg gtc gaa ggc gag gac ggc ttc acc atg acc ggt 864 Gln Ile Ser Leu Leu Val Glu Gly Glu Asp Gly Phe Thr Met Thr Gly 275 280 285 gca agc gca atg cag gcg atc agc cgc acg ccg gaa aac ctc gct tcc 912 Ala Ser Ala Met Gln Ala Ile Ser Arg Thr Pro Glu Asn Leu Ala Ser 290 295 300 cag ctc ttg aac cgc aac cat cag tat cct gac ggc gcc gtc ttt ttc 960 Gln Leu Leu Asn Arg Asn His Gln Tyr Pro Asp Gly Ala Val Phe Phe 305 310 315 320 ctt ggt acg atg ttc gcg ccg gta aag gac cgc cat ggc ccg ggt ctc 1008 Leu Gly Thr Met Phe Ala Pro Val Lys Asp Arg His Gly Pro Gly Leu 325 330 335 ggc ttc acc cac tcc aag ggc gac cgt gtc gaa atc tcc acg ccc aag 1056 Gly Phe Thr His Ser Lys Gly Asp Arg Val Glu Ile Ser Thr Pro Lys 340 345 350 ctc ggc aag ctg atc aac tgg gtc acg acg aca gac gaa tgc ccg gaa 1104 Leu Gly Lys Leu Ile Asn Trp Val Thr Thr Thr Asp Glu Cys Pro Glu 355 360 365 tgg aca ttc ggc acc gcg gcc ctc atg cgc aac ctg gcg aaa cgc ggg 1152 Trp Thr Phe Gly Thr Ala Ala Leu Met Arg Asn Leu Ala Lys Arg Gly 370 375 380 ctg ctc tag 1161 Leu Leu 385 <210> 86 <211> 386 <212> PRT <213> Agrobacterium tumefaciens <400> 86 Met Thr Gly Ser Arg Ser Ile Asp Ala Thr Ala Ile Leu Pro Glu Asp 1 5 10 15 Phe Glu Asn Ala Leu Leu Val Gly Arg Val Trp Ser Lys Ser Glu Gly 20 25 30 Gly Pro Cys Pro Val Leu Leu Lys Gly Gly Val Leu Tyr Asp Leu Thr 35 40 45 Ser Ile Ser Pro Thr Met Ser Glu Leu Leu Glu Lys Thr Asp Leu Val 50 55 60 Glu Leu Leu Ala Asp Thr Gly Thr Phe Val Ala Leu Gly Ala Leu Glu 65 70 75 80 Ala Phe Leu Asp Gly Ser Ala Gly Glu Leu Leu Ala Pro Asn Asp Ile 85 90 95 Gln Ala Val Lys Ala Ala Gly Val Thr Phe Ala Asp Ser Met Leu Glu 100 105 110 Arg Val Ile Glu Glu Gln Ala Lys Gly Asp Pro Leu Arg Ala Gln Glu 115 120 125 Ile Arg Gly Arg Leu Ala Pro Val Leu Gly Asp Asn Leu Lys Gly Leu 130 135 140 Glu Ala Gly Ser Glu Lys Ala Ala Glu Val Lys Lys Leu Leu Gln Glu 145 150 155 160 Met Gly Leu Trp Ser Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Ala 165 170 175 Glu Ile Phe Ser Lys Ala Gln Ala Met Ala Ser Val Gly Cys Gly Ala 180 185 190 Leu Ile Gly Val His Pro Lys Ser Gln Trp Asn Asn Pro Glu Pro Glu 195 200 205 Val Val Leu Ala Ile Ala Ser Asp Gly Arg Ile Val Gly Ala Thr Leu 210 215 220 Gly Asn Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu 225 230 235 240 Leu Ser Lys Ala Lys Asp Asn Asn Ala Ser Cys Ala Ile Gly Pro Phe 245 250 255 Ile Arg Leu Phe Asp Gly Arg Phe Thr Ile Glu Asp Val Lys Lys Ala 260 265 270 Gln Ile Ser Leu Leu Val Glu Gly Glu Asp Gly Phe Thr Met Thr Gly 275 280 285 Ala Ser Ala Met Gln Ala Ile Ser Arg Thr Pro Glu Asn Leu Ala Ser 290 295 300 Gln Leu Leu Asn Arg Asn His Gln Tyr Pro Asp Gly Ala Val Phe Phe 305 310 315 320 Leu Gly Thr Met Phe Ala Pro Val Lys Asp Arg His Gly Pro Gly Leu 325 330 335 Gly Phe Thr His Ser Lys Gly Asp Arg Val Glu Ile Ser Thr Pro Lys 340 345 350 Leu Gly Lys Leu Ile Asn Trp Val Thr Thr Thr Asp Glu Cys Pro Glu 355 360 365 Trp Thr Phe Gly Thr Ala Ala Leu Met Arg Asn Leu Ala Lys Arg Gly 370 375 380 Leu Leu 385 <210> 87 <211> 1161 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 87 atgacgggca gccgttctat tgatgcgacc gccatcctgc cggaagattt cgaaaacgcg 60 ctgctggttg gccgcgtttg gagtaaaagc gaaggcggtc cgtgcccggt gctgctgaaa 120 ggcggtgttc tgtatgatct gaccagcatt agtccgacca tgagcgaact gctggaaaaa 180 accgatctgg tggaactgct ggccgatacc ggcaccttcg ttgcgctggg tgccctggaa 240 gcatttctgg atggtagcgc aggcgaactg ctggcgccga acgatatcca ggcagtgaaa 300 gcggccggcg ttaccttcgc ggattctatg ctggaacgtg tgattgaaga acaggcgaaa 360 ggtgatccgc tgcgtgcaca ggaaattcgc ggccgcctgg caccggtgct gggtgataat 420 ctgaaaggtc tggaagcggg ctctgaaaaa gcagcggaag tgaaaaaact gctgcaggaa 480 atgggcctgt ggagtcagta cctggaagtt ggcattggtc cggatgccga aatcttttct 540 aaagcacagg cgatggccag tgtgggctgc ggtgcactga ttggtgttca tccgaaaagt 600 cagtggaaca atccggaacc ggaagtggtt ctggcaattg cgagcgatgg tcgtatcgtg 660 ggcgcgacgc tgggtaacga tgttaatctg cgtgatttcg aaggccgcag cgccctgctg 720 ctgtctaaag caaaagataa caatgcgagt tgtgccattg gcccgtttat ccgtctgttc 780 gatggtcgct ttaccattga agatgtgaaa aaagcccaga tctctctgct ggttgaaggt 840 gaagatggct ttacgatgac cggtgccagt gcaatgcagg ccattagccg tacgccggaa 900 aatctggcaa gccagctgct gaaccgcaat caccagtatc cggatggcgc ggtgtttttc 960 ctgggcacca tgttcgcccc ggttaaagat cgtcatggcc cgggtctggg ctttacgcac 1020 agcaaaggcg atcgcgtgga aatttctacc ccgaaactgg gtaaactgat caactgggtt 1080 accacgaccg atgaatgtcc ggaatggacc tttggcaccg ccgcactgat gcgtaatctg 1140 gcgaaacgcg gtctgctgta g 1161 <210> 88 <211> 1200 <212> DNA <213> Cupriavidus necator <220> <221> CDS <222> (1)..(1200) <400> 88 atg gca ttg ccg ctc acg ctc agc gct acg caa acg ctt cct gcc gac 48 Met Ala Leu Pro Leu Thr Leu Ser Ala Thr Gln Thr Leu Pro Ala Asp 1 5 10 15 ggg ctg gcg ggg acg ctg gtc ggc cgc gca tgg atc ccg gcc ggt gac 96 Gly Leu Ala Gly Thr Leu Val Gly Arg Ala Trp Ile Pro Ala Gly Asp 20 25 30 ggc gtt ccg gcc ggc ccg gct gtc gtg gtc ttg cgg ccg gat ggt gta 144 Gly Val Pro Ala Gly Pro Ala Val Val Val Leu Arg Pro Asp Gly Val 35 40 45 ttc gac att tcc gat gtc gcc ccg acc atg agc acc ctg ctc gaa cag 192 Phe Asp Ile Ser Asp Val Ala Pro Thr Met Ser Thr Leu Leu Glu Gln 50 55 60 gac gac ccg ctc acg gtg gtg cac aat gcg ccc ggg cgc tgg atc ggc 240 Asp Asp Pro Leu Thr Val Val His Asn Ala Pro Gly Arg Trp Ile Gly 65 70 75 80 aag ctg gac gac ctg ctg gcc aac acg gcc gat ccg cac ggc agc aac 288 Lys Leu Asp Asp Leu Leu Ala Asn Thr Ala Asp Pro His Gly Ser Asn 85 90 95 ggc gtg gcc cgc ctg ctg gcg cca tgc gac ctg cag gtg atc aag gcg 336 Gly Val Ala Arg Leu Leu Ala Pro Cys Asp Leu Gln Val Ile Lys Ala 100 105 110 gca ggc gtg acc ttt gcc ggc agc ctg gtc gag cgt gtc atc gaa gag 384 Ala Gly Val Thr Phe Ala Gly Ser Leu Val Glu Arg Val Ile Glu Glu 115 120 125 cag acc aag ggc gac ccg caa ggc gcc gcc gag gtc cgc aac cgg atc 432 Gln Thr Lys Gly Asp Pro Gln Gly Ala Ala Glu Val Arg Asn Arg Ile 130 135 140 cag gcg ctg gtg ggc gag cgc ctg tcc cgg atc cgg ccg ggt tcc cgc 480 Gln Ala Leu Val Gly Glu Arg Leu Ser Arg Ile Arg Pro Gly Ser Arg 145 150 155 160 gag gcg ggc gaa ctc aag gcc ttg ctg atc gag cat ggc atg tgg tcg 528 Glu Ala Gly Glu Leu Lys Ala Leu Leu Ile Glu His Gly Met Trp Ser 165 170 175 caa tac ctt gag gtg ggc atc ggc ccg gac gcc gag atc ttc acc aag 576 Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Ala Glu Ile Phe Thr Lys 180 185 190 gca ccg ctg ctt tcc gcg ctt ggc acc ggt acg gaa atc gga ctg cat 624 Ala Pro Leu Leu Ser Ala Leu Gly Thr Gly Thr Glu Ile Gly Leu His 195 200 205 ccc ggc tcg gca tgg aac aat ccg gaa ccc gag atc gtg ctg gcc atc 672 Pro Gly Ser Ala Trp Asn Asn Pro Glu Pro Glu Ile Val Leu Ala Ile 210 215 220 aac agc cgc ggt gat gtg ctc ggc gcc acg ctg ggt aat gac gtc aac 720 Asn Ser Arg Gly Asp Val Leu Gly Ala Thr Leu Gly Asn Asp Val Asn 225 230 235 240 ctg cgc gac ttc gag ggc cgc agt gcg ttg ctg ctg ggc aag gcc aag 768 Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Gly Lys Ala Lys 245 250 255 gac aat aac ggc tcc tgc gcg atc ggt ccg ttc ctg cgc ctg ttc gac 816 Asp Asn Asn Gly Ser Cys Ala Ile Gly Pro Phe Leu Arg Leu Phe Asp 260 265 270 cag agt ttc tcg ctc gac gac gtg cgg cgg gcg acg gtg gat ctg cgt 864 Gln Ser Phe Ser Leu Asp Asp Val Arg Arg Ala Thr Val Asp Leu Arg 275 280 285 gtc gat ggc ctg gac ggc ttc gtg ttg tcc ggc acc agc tcg atg gac 912 Val Asp Gly Leu Asp Gly Phe Val Leu Ser Gly Thr Ser Ser Met Asp 290 295 300 cag atc acg cgc gac ccg ctg gag ctg gcc gag cag gca atg ggg gcg 960 Gln Ile Thr Arg Asp Pro Leu Glu Leu Ala Glu Gln Ala Met Gly Ala 305 310 315 320 acc cac cag tat ccc gat ggc gcc atg ctg ttc ctc ggc acg ctg ttc 1008 Thr His Gln Tyr Pro Asp Gly Ala Met Leu Phe Leu Gly Thr Leu Phe 325 330 335 gcg ccg gtg gaa gac cgc gac acc gcg ggc ggc ggc ttc acc cac aag 1056 Ala Pro Val Glu Asp Arg Asp Thr Ala Gly Gly Gly Phe Thr His Lys 340 345 350 ggt ggt gat ctt gtc acc atc tcc agc cgc cag ctc ggc agc ctg gtc 1104 Gly Gly Asp Leu Val Thr Ile Ser Ser Arg Gln Leu Gly Ser Leu Val 355 360 365 aac cgc gtg ggc cgc agc gac cgt atc gct ccg tgg acg ttc ggc gta 1152 Asn Arg Val Gly Arg Ser Asp Arg Ile Ala Pro Trp Thr Phe Gly Val 370 375 380 cgc gcc ctg atg gcc aac ctg gcc gca cgt ggc cac acc act ttc tga 1200 Arg Ala Leu Met Ala Asn Leu Ala Ala Arg Gly His Thr Thr Phe 385 390 395 <210> 89 <211> 399 <212> PRT <213> Cupriavidus necator <400> 89 Met Ala Leu Pro Leu Thr Leu Ser Ala Thr Gln Thr Leu Pro Ala Asp 1 5 10 15 Gly Leu Ala Gly Thr Leu Val Gly Arg Ala Trp Ile Pro Ala Gly Asp 20 25 30 Gly Val Pro Ala Gly Pro Ala Val Val Val Leu Arg Pro Asp Gly Val 35 40 45 Phe Asp Ile Ser Asp Val Ala Pro Thr Met Ser Thr Leu Leu Glu Gln 50 55 60 Asp Asp Pro Leu Thr Val Val His Asn Ala Pro Gly Arg Trp Ile Gly 65 70 75 80 Lys Leu Asp Asp Leu Leu Ala Asn Thr Ala Asp Pro His Gly Ser Asn 85 90 95 Gly Val Ala Arg Leu Leu Ala Pro Cys Asp Leu Gln Val Ile Lys Ala 100 105 110 Ala Gly Val Thr Phe Ala Gly Ser Leu Val Glu Arg Val Ile Glu Glu 115 120 125 Gln Thr Lys Gly Asp Pro Gln Gly Ala Ala Glu Val Arg Asn Arg Ile 130 135 140 Gln Ala Leu Val Gly Glu Arg Leu Ser Arg Ile Arg Pro Gly Ser Arg 145 150 155 160 Glu Ala Gly Glu Leu Lys Ala Leu Leu Ile Glu His Gly Met Trp Ser 165 170 175 Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Ala Glu Ile Phe Thr Lys 180 185 190 Ala Pro Leu Leu Ser Ala Leu Gly Thr Gly Thr Glu Ile Gly Leu His 195 200 205 Pro Gly Ser Ala Trp Asn Asn Pro Glu Pro Glu Ile Val Leu Ala Ile 210 215 220 Asn Ser Arg Gly Asp Val Leu Gly Ala Thr Leu Gly Asn Asp Val Asn 225 230 235 240 Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Gly Lys Ala Lys 245 250 255 Asp Asn Asn Gly Ser Cys Ala Ile Gly Pro Phe Leu Arg Leu Phe Asp 260 265 270 Gln Ser Phe Ser Leu Asp Asp Val Arg Arg Ala Thr Val Asp Leu Arg 275 280 285 Val Asp Gly Leu Asp Gly Phe Val Leu Ser Gly Thr Ser Ser Met Asp 290 295 300 Gln Ile Thr Arg Asp Pro Leu Glu Leu Ala Glu Gln Ala Met Gly Ala 305 310 315 320 Thr His Gln Tyr Pro Asp Gly Ala Met Leu Phe Leu Gly Thr Leu Phe 325 330 335 Ala Pro Val Glu Asp Arg Asp Thr Ala Gly Gly Gly Phe Thr His Lys 340 345 350 Gly Gly Asp Leu Val Thr Ile Ser Ser Arg Gln Leu Gly Ser Leu Val 355 360 365 Asn Arg Val Gly Arg Ser Asp Arg Ile Ala Pro Trp Thr Phe Gly Val 370 375 380 Arg Ala Leu Met Ala Asn Leu Ala Ala Arg Gly His Thr Thr Phe 385 390 395 <210> 90 <211> 1200 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 90 atggcgctgc cgctgaccct gagcgccacc cagacgctgc cggccgatgg tctggccggc 60 accctggtgg gccgtgcatg gattccggcc ggtgatggcg ttccggccgg tccggccgtg 120 gttgtgctgc gtccggatgg tgttttcgat atcagtgatg tggcgccgac catgagcacg 180 ctgctggaac aggatgatcc gctgaccgtt gtgcataacg ccccgggtcg ctggattggc 240 aaactggatg atctgctggc aaacacggcg gatccgcacg gttctaatgg tgtggcacgt 300 ctgctggcac cgtgcgatct gcaggttatt aaagcggccg gcgtgacctt tgccggtagt 360 ctggttgaac gcgtgatcga agaacagacg aaaggtgatc cgcagggcgc agcggaagtt 420 cgtaatcgta ttcaggcgct ggttggcgaa cgcctgagcc gtatccgccc gggttctcgt 480 gaagccggtg aactgaaagc cctgctgatt gaacatggca tgtggagcca gtatctggaa 540 gtgggtattg gcccggatgc cgaaatcttc accaaagcac cgctgctgag tgcgctgggc 600 accggcacgg aaatcggtct gcacccgggc agcgcatgga acaatccgga accggaaatt 660 gttctggcca tcaactctcg cggtgatgtg ctgggcgcaa ccctgggtaa cgatgttaat 720 ctgcgcgatt tcgaaggccg tagcgccctg ctgctgggta aagcaaaaga taacaatggc 780 tcttgtgcaa ttggtccgtt tctgcgcctg ttcgatcagt cttttagtct ggatgatgtg 840 cgtcgcgcga ccgttgatct gcgtgtggat ggtctggatg gctttgttct gagcggcacc 900 agctctatgg atcagatcac gcgtgatccg ctggaactgg ccgaacaggc aatgggtgcg 960 acccatcagt acccggatgg cgcgatgctg ttcctgggta cgctgtttgc accggtggaa 1020 gatcgcgata ccgcgggcgg tggctttacg cacaaaggtg gcgatctggt taccattagt 1080 agccgtcagc tgggctctct ggttaaccgt gtgggtcgca gtgatcgtat tgccccgtgg 1140 accttcggcg tgcgcgccct gatggcaaat ctggccgcac gtggtcatac cacgttttga 1200 <210> 91 <211> 1113 <212> DNA <213> Pseudomonas elodea <220> <221> CDS <222> (1)..(1113) <400> 91 atg ctg cct gcc gat cat gcg cag gcg att ctg gtc ggc cgt gtg cag 48 Met Leu Pro Ala Asp His Ala Gln Ala Ile Leu Val Gly Arg Val Gln 1 5 10 15 acc ccg gcg ggc ccg agc ccc gtt ctc ctc cgc gat ggc cag gtg atc 96 Thr Pro Ala Gly Pro Ser Pro Val Leu Leu Arg Asp Gly Gln Val Ile 20 25 30 gac gtt tcg gcg atc gcg ccg acc gtc gcc gac ctg ctg gaa cgc gac 144 Asp Val Ser Ala Ile Ala Pro Thr Val Ala Asp Leu Leu Glu Arg Asp 35 40 45 gac atc gcg acg ctg agc ggc acg gtg ctg tgc agc gtc gac gcg ctc 192 Asp Ile Ala Thr Leu Ser Gly Thr Val Leu Cys Ser Val Asp Ala Leu 50 55 60 ggc acc gag tcg gcg ccg cag gtg ctg gct ccg gtc gac ctg cag tgc 240 Gly Thr Glu Ser Ala Pro Gln Val Leu Ala Pro Val Asp Leu Gln Cys 65 70 75 80 gtg aag gcc gcc ggc gtc acc ttc gcc gtc tcg gcg ctg gag cgc gtg 288 Val Lys Ala Ala Gly Val Thr Phe Ala Val Ser Ala Leu Glu Arg Val 85 90 95 atc gag gaa cgc gcc cgc ggc gat tcc gcc aag gcc gcc gag att cgc 336 Ile Glu Glu Arg Ala Arg Gly Asp Ser Ala Lys Ala Ala Glu Ile Arg 100 105 110 ggc gac ctc gaa gcc aag gtg ggt tcg ggc atc cgc tcg gtc gtc ccc 384 Gly Asp Leu Glu Ala Lys Val Gly Ser Gly Ile Arg Ser Val Val Pro 115 120 125 ggt acc gcc gag gcc gcg gcg ctc aag gcc gcg ctg atc gag gcg ggc 432 Gly Thr Ala Glu Ala Ala Ala Leu Lys Ala Ala Leu Ile Glu Ala Gly 130 135 140 atg tgg tcg caa tat ctc gaa gtg gcg atc ggg ccg gac gcg gag gtg 480 Met Trp Ser Gln Tyr Leu Glu Val Ala Ile Gly Pro Asp Ala Glu Val 145 150 155 160 ttc acc aag gcg ccg gtt ctg tcg gcg atg ggc tgg ggc gcc gag atc 528 Phe Thr Lys Ala Pro Val Leu Ser Ala Met Gly Trp Gly Ala Glu Ile 165 170 175 ggc atc cgc tcg gac agc gac tgg aac aat ccg gag ccg gaa gtg gtg 576 Gly Ile Arg Ser Asp Ser Asp Trp Asn Asn Pro Glu Pro Glu Val Val 180 185 190 ctg gtg gtc gac cgg aat ggt gcg atc aag ggc gcg acg ctc ggc aac 624 Leu Val Val Asp Arg Asn Gly Ala Ile Lys Gly Ala Thr Leu Gly Asn 195 200 205 gac gtc aac ctg cgc gac ttc gag ggc cgc agc gcg ctg ctg ctg ggc 672 Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Gly 210 215 220 aag gcg aag gac aac aat gcc tct acc gcg atc ggc ccg ttc atc cgc 720 Lys Ala Lys Asp Asn Asn Ala Ser Thr Ala Ile Gly Pro Phe Ile Arg 225 230 235 240 ctg ttc gat gac ggc ttc acg atg gac gac gtg cgt agc gcg gtg gtc 768 Leu Phe Asp Asp Gly Phe Thr Met Asp Asp Val Arg Ser Ala Val Val 245 250 255 gac ctc acc atc gac ggg ccg gag ggc tat cgc ctc tcg ggc acc aac 816 Asp Leu Thr Ile Asp Gly Pro Glu Gly Tyr Arg Leu Ser Gly Thr Asn 260 265 270 aag atg agc gag atc agc cga gat ccg acc gag ctc gtg cgc cag acg 864 Lys Met Ser Glu Ile Ser Arg Asp Pro Thr Glu Leu Val Arg Gln Thr 275 280 285 ctg agc gag cac cag tat ccg gac ggc ttc gcg ctg ttc ctc ggc acg 912 Leu Ser Glu His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Leu Gly Thr 290 295 300 ctg ttc gcg ccg gtg cag gat cgc gac cat ccc ggc cgc ggc ttc act 960 Leu Phe Ala Pro Val Gln Asp Arg Asp His Pro Gly Arg Gly Phe Thr 305 310 315 320 cac aag ccc ggc gat att gtc cgc att tcc acg ccg aag ctc ggc acg 1008 His Lys Pro Gly Asp Ile Val Arg Ile Ser Thr Pro Lys Leu Gly Thr 325 330 335 ctc gtc aac cgc gtc acc acg tcc aag gcc gcc gcg ccc tgg acg ttc 1056 Leu Val Asn Arg Val Thr Thr Ser Lys Ala Ala Ala Pro Trp Thr Phe 340 345 350 ggc atc cgc gat ctg atg cgc aat ctc gcc gcc cgc ggc ctt ctc tcg 1104 Gly Ile Arg Asp Leu Met Arg Asn Leu Ala Ala Arg Gly Leu Leu Ser 355 360 365 cat tcc taa 1113 His Ser 370 <210> 92 <211> 370 <212> PRT <213> Pseudomonas elodea <400> 92 Met Leu Pro Ala Asp His Ala Gln Ala Ile Leu Val Gly Arg Val Gln 1 5 10 15 Thr Pro Ala Gly Pro Ser Pro Val Leu Leu Arg Asp Gly Gln Val Ile 20 25 30 Asp Val Ser Ala Ile Ala Pro Thr Val Ala Asp Leu Leu Glu Arg Asp 35 40 45 Asp Ile Ala Thr Leu Ser Gly Thr Val Leu Cys Ser Val Asp Ala Leu 50 55 60 Gly Thr Glu Ser Ala Pro Gln Val Leu Ala Pro Val Asp Leu Gln Cys 65 70 75 80 Val Lys Ala Ala Gly Val Thr Phe Ala Val Ser Ala Leu Glu Arg Val 85 90 95 Ile Glu Glu Arg Ala Arg Gly Asp Ser Ala Lys Ala Ala Glu Ile Arg 100 105 110 Gly Asp Leu Glu Ala Lys Val Gly Ser Gly Ile Arg Ser Val Val Pro 115 120 125 Gly Thr Ala Glu Ala Ala Ala Leu Lys Ala Ala Leu Ile Glu Ala Gly 130 135 140 Met Trp Ser Gln Tyr Leu Glu Val Ala Ile Gly Pro Asp Ala Glu Val 145 150 155 160 Phe Thr Lys Ala Pro Val Leu Ser Ala Met Gly Trp Gly Ala Glu Ile 165 170 175 Gly Ile Arg Ser Asp Ser Asp Trp Asn Asn Pro Glu Pro Glu Val Val 180 185 190 Leu Val Val Asp Arg Asn Gly Ala Ile Lys Gly Ala Thr Leu Gly Asn 195 200 205 Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Gly 210 215 220 Lys Ala Lys Asp Asn Asn Ala Ser Thr Ala Ile Gly Pro Phe Ile Arg 225 230 235 240 Leu Phe Asp Asp Gly Phe Thr Met Asp Asp Val Arg Ser Ala Val Val 245 250 255 Asp Leu Thr Ile Asp Gly Pro Glu Gly Tyr Arg Leu Ser Gly Thr Asn 260 265 270 Lys Met Ser Glu Ile Ser Arg Asp Pro Thr Glu Leu Val Arg Gln Thr 275 280 285 Leu Ser Glu His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Leu Gly Thr 290 295 300 Leu Phe Ala Pro Val Gln Asp Arg Asp His Pro Gly Arg Gly Phe Thr 305 310 315 320 His Lys Pro Gly Asp Ile Val Arg Ile Ser Thr Pro Lys Leu Gly Thr 325 330 335 Leu Val Asn Arg Val Thr Thr Ser Lys Ala Ala Ala Pro Trp Thr Phe 340 345 350 Gly Ile Arg Asp Leu Met Arg Asn Leu Ala Ala Arg Gly Leu Leu Ser 355 360 365 His Ser 370 <210> 93 <211> 1113 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 93 atgctgccgg cggatcatgc ccaagcaatc ctggtcggtc gcgtccaaac cccggctggc 60 ccgtccccgg tcctgctgcg tgatggtcag gtcattgatg tgtccgcaat cgcaccgacc 120 gtggcagacc tgctggaacg tgatgacatt gccaccctga gcggtacggt gctgtgctct 180 gttgatgccc tgggcacgga aagcgcaccg caggtcctgg caccggtgga cctgcaatgt 240 gtcaaagcgg ccggtgttac cttcgcagtc tcagctctgg aacgcgtgat cgaagaacgt 300 gcacgcggtg attcggctaa agcagctgaa attcgtggcg acctggaagc gaaagtgggc 360 tcaggtatcc gctcggtggt tccgggcacg gcagaagcgg ccgcactgaa agctgcgctg 420 attgaagcgg gcatgtggtc acagtatctg gaagttgcga tcggcccgga tgccgaagtg 480 ttcaccaagg caccggttct gtcggctatg ggctggggtg cggaaattgg tatccgtagc 540 gattctgact ggaacaatcc ggaaccggaa gtcgtgctgg ttgtcgatcg caacggcgca 600 attaaaggtg ctacgctggg caacgatgtt aatctgcgtg actttgaagg tcgcagtgcc 660 ctgctgctgg gcaaagcaaa ggataacaat gcgtccaccg ccattggtcc gtttatccgt 720 ctgttcgatg acggctttac catggatgac gtgcgcagtg ccgtggttga tctgacgatt 780 gacggcccgg aaggttatcg tctgtccggc accaacaaga tgagtgaaat ctcccgtgat 840 ccgaccgaac tggttcgcca gacgctgagc gaacatcaat acccggatgg ttttgctctg 900 ttcctgggca cgctgttcgc accggttcaa gatcgtgacc atccgggccg cggttttacc 960 cacaaaccgg gtgatattgt ccgtatcagc accccgaagc tgggcacgct ggttaatcgc 1020 gtcaccacgt ctaaagccgc agctccgtgg accttcggta ttcgtgacct gatgcgtaat 1080 ctggcggctc gtggcctgct gtctcattcg tga 1113 <210> 94 <211> 1194 <212> DNA <213> Zobellia galactanivorans <220> <221> CDS <222> (1)..(1194) <400> 94 atg aat tat atc gat tta aac cgc ctc ata ccg gaa tta gcg gaa aca 48 Met Asn Tyr Ile Asp Leu Asn Arg Leu Ile Pro Glu Leu Ala Glu Thr 1 5 10 15 ggc aca tgg ata ggc agg tgc atg gta ccg gca caa aaa gcg tac aat 96 Gly Thr Trp Ile Gly Arg Cys Met Val Pro Ala Gln Lys Ala Tyr Asn 20 25 30 ggt ata gct ggg ccc cac gtg gtg atg gcc cgc aaa gga aaa atc tac 144 Gly Ile Ala Gly Pro His Val Val Met Ala Arg Lys Gly Lys Ile Tyr 35 40 45 gac cta tcg gcc cac ttc aac tcc aca agt gag cta ttc aac tgt aag 192 Asp Leu Ser Ala His Phe Asn Ser Thr Ser Glu Leu Phe Asn Cys Lys 50 55 60 aac ccg gtt tcc cgc tta aaa gcc tta aac gat tta ccg gaa cta ggc 240 Asn Pro Val Ser Arg Leu Lys Ala Leu Asn Asp Leu Pro Glu Leu Gly 65 70 75 80 agc ctg aaa gat gcc ttg aaa aac gcc cta tac ttc aat cag aat cca 288 Ser Leu Lys Asp Ala Leu Lys Asn Ala Leu Tyr Phe Asn Gln Asn Pro 85 90 95 cta ctc ccc tac atc ata gcg cca aac gat ata caa gcc gta aaa gcc 336 Leu Leu Pro Tyr Ile Ile Ala Pro Asn Asp Ile Gln Ala Val Lys Ala 100 105 110 tgt ggt gta act ttt atc aaa agc ttg ctc gag agg gtc att gaa gaa 384 Cys Gly Val Thr Phe Ile Lys Ser Leu Leu Glu Arg Val Ile Glu Glu 115 120 125 aaa gca aaa ggc gat gcc cta gta gcg aac gac ata cgt caa acc att 432 Lys Ala Lys Gly Asp Ala Leu Val Ala Asn Asp Ile Arg Gln Thr Ile 130 135 140 tac gat acc tta ggc aac gac ttg agc aag gtt acc ccc ggt tca ccg 480 Tyr Asp Thr Leu Gly Asn Asp Leu Ser Lys Val Thr Pro Gly Ser Pro 145 150 155 160 gaa acc gaa aag ctc aag gag gaa tta cag aaa aaa ggc cta tgg tcg 528 Glu Thr Glu Lys Leu Lys Glu Glu Leu Gln Lys Lys Gly Leu Trp Ser 165 170 175 caa tac ctc gaa gtg ggc att ggc aag gat gcc gag gtt ttc acc aag 576 Gln Tyr Leu Glu Val Gly Ile Gly Lys Asp Ala Glu Val Phe Thr Lys 180 185 190 gcc caa ccc ttg tct gcc gtt ggt ttc gga gcg gag ata ggc gtt cta 624 Ala Gln Pro Leu Ser Ala Val Gly Phe Gly Ala Glu Ile Gly Val Leu 195 200 205 aag agt tcc aaa tgg aac aat ccg gaa cct gaa atc gtg ctc gcc gta 672 Lys Ser Ser Lys Trp Asn Asn Pro Glu Pro Glu Ile Val Leu Ala Val 210 215 220 tcc tcc tcg gga aaa atc gtc ggg gcc aca ctc ggc aac gac gta aac 720 Ser Ser Ser Gly Lys Ile Val Gly Ala Thr Leu Gly Asn Asp Val Asn 225 230 235 240 ctt cgc gat tac gaa ggt cgc agc gcc cta ttg ctc ggt gag gcg aaa 768 Leu Arg Asp Tyr Glu Gly Arg Ser Ala Leu Leu Leu Gly Glu Ala Lys 245 250 255 gac caa aac gga tct tgt gcc att ggc ccc ttg ttt cgc ttg ttc gat 816 Asp Gln Asn Gly Ser Cys Ala Ile Gly Pro Leu Phe Arg Leu Phe Asp 260 265 270 gag act ttt tcc cta gat gac gta aag gat tgc gat gta atg ttt tct 864 Glu Thr Phe Ser Leu Asp Asp Val Lys Asp Cys Asp Val Met Phe Ser 275 280 285 atg aag ggg aag gac aat ttc gcc act tcc gga agc aat aag atg aaa 912 Met Lys Gly Lys Asp Asn Phe Ala Thr Ser Gly Ser Asn Lys Met Lys 290 295 300 gag att agc cgt agt cct gaa aat tta gtg gcc cag gtc ata gga aaa 960 Glu Ile Ser Arg Ser Pro Glu Asn Leu Val Ala Gln Val Ile Gly Lys 305 310 315 320 aac cat caa tac cca gac ggg ctc gtg ctt ttc tta ggt act atg ttc 1008 Asn His Gln Tyr Pro Asp Gly Leu Val Leu Phe Leu Gly Thr Met Phe 325 330 335 gcc cct acg gaa gac cgc aat gga aaa ggt ttg ggt ttc acc cac aaa 1056 Ala Pro Thr Glu Asp Arg Asn Gly Lys Gly Leu Gly Phe Thr His Lys 340 345 350 aag gga gat caa gtc aac atc tct tct tcg cat ttg ggc aca ctc atc 1104 Lys Gly Asp Gln Val Asn Ile Ser Ser Ser His Leu Gly Thr Leu Ile 355 360 365 aat tgg gtg aac act tgt gac caa ata cca aag tgg gaa ttc ggc att 1152 Asn Trp Val Asn Thr Cys Asp Gln Ile Pro Lys Trp Glu Phe Gly Ile 370 375 380 ggt gct ttt acg aac tat att gta aaa cgg aat tta aaa tag 1194 Gly Ala Phe Thr Asn Tyr Ile Val Lys Arg Asn Leu Lys 385 390 395 <210> 95 <211> 397 <212> PRT <213> Zobellia galactanivorans <400> 95 Met Asn Tyr Ile Asp Leu Asn Arg Leu Ile Pro Glu Leu Ala Glu Thr 1 5 10 15 Gly Thr Trp Ile Gly Arg Cys Met Val Pro Ala Gln Lys Ala Tyr Asn 20 25 30 Gly Ile Ala Gly Pro His Val Val Met Ala Arg Lys Gly Lys Ile Tyr 35 40 45 Asp Leu Ser Ala His Phe Asn Ser Thr Ser Glu Leu Phe Asn Cys Lys 50 55 60 Asn Pro Val Ser Arg Leu Lys Ala Leu Asn Asp Leu Pro Glu Leu Gly 65 70 75 80 Ser Leu Lys Asp Ala Leu Lys Asn Ala Leu Tyr Phe Asn Gln Asn Pro 85 90 95 Leu Leu Pro Tyr Ile Ile Ala Pro Asn Asp Ile Gln Ala Val Lys Ala 100 105 110 Cys Gly Val Thr Phe Ile Lys Ser Leu Leu Glu Arg Val Ile Glu Glu 115 120 125 Lys Ala Lys Gly Asp Ala Leu Val Ala Asn Asp Ile Arg Gln Thr Ile 130 135 140 Tyr Asp Thr Leu Gly Asn Asp Leu Ser Lys Val Thr Pro Gly Ser Pro 145 150 155 160 Glu Thr Glu Lys Leu Lys Glu Glu Leu Gln Lys Lys Gly Leu Trp Ser 165 170 175 Gln Tyr Leu Glu Val Gly Ile Gly Lys Asp Ala Glu Val Phe Thr Lys 180 185 190 Ala Gln Pro Leu Ser Ala Val Gly Phe Gly Ala Glu Ile Gly Val Leu 195 200 205 Lys Ser Ser Lys Trp Asn Asn Pro Glu Pro Glu Ile Val Leu Ala Val 210 215 220 Ser Ser Ser Gly Lys Ile Val Gly Ala Thr Leu Gly Asn Asp Val Asn 225 230 235 240 Leu Arg Asp Tyr Glu Gly Arg Ser Ala Leu Leu Leu Gly Glu Ala Lys 245 250 255 Asp Gln Asn Gly Ser Cys Ala Ile Gly Pro Leu Phe Arg Leu Phe Asp 260 265 270 Glu Thr Phe Ser Leu Asp Asp Val Lys Asp Cys Asp Val Met Phe Ser 275 280 285 Met Lys Gly Lys Asp Asn Phe Ala Thr Ser Gly Ser Asn Lys Met Lys 290 295 300 Glu Ile Ser Arg Ser Pro Glu Asn Leu Val Ala Gln Val Ile Gly Lys 305 310 315 320 Asn His Gln Tyr Pro Asp Gly Leu Val Leu Phe Leu Gly Thr Met Phe 325 330 335 Ala Pro Thr Glu Asp Arg Asn Gly Lys Gly Leu Gly Phe Thr His Lys 340 345 350 Lys Gly Asp Gln Val Asn Ile Ser Ser Ser His Leu Gly Thr Leu Ile 355 360 365 Asn Trp Val Asn Thr Cys Asp Gln Ile Pro Lys Trp Glu Phe Gly Ile 370 375 380 Gly Ala Phe Thr Asn Tyr Ile Val Lys Arg Asn Leu Lys 385 390 395 <210> 96 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 96 atgaactata ttgatctgaa tcgtctgatc ccggaactgg cggaaaccgg tacgtggatt 60 ggccgctgca tggtgccggc ccagaaagcc tataacggta tcgccggccc gcatgtggtt 120 atggcacgta aaggcaaaat ttacgatctg agcgcccact ttaatagtac cagcgaactg 180 ttcaactgta aaaatccggt tagccgcctg aaagcactga acgatctgcc ggaactgggt 240 tctctgaaag atgcgctgaa aaatgccctg tattttaacc agaatccgct gctgccgtac 300 attatcgcgc cgaacgatat tcaggcagtg aaagcgtgcg gcgttacctt catcaaaagc 360 ctgctggaac gtgtgattga agaaaaagcc aaaggtgatg ccctggttgc aaacgatatt 420 cgccagacca tctatgatac gctgggcaat gatctgagta aagtgacccc gggtagcccg 480 gaaacggaaa aactgaaaga agaactgcag aaaaaaggcc tgtggtctca gtacctggaa 540 gtgggcatcg gtaaagatgc cgaagttttt accaaagcac agccgctgag cgcggtgggt 600 tttggtgcag aaattggtgt tctgaaaagc tctaaatgga acaatccgga accggaaatc 660 gtgctggcgg ttagtagctc tggtaaaatt gtgggcgcca ccctgggtaa cgatgttaat 720 ctgcgtgatt acgaaggccg cagtgcactg ctgctgggtg aagcgaaaga tcagaatggc 780 agctgcgcga ttggtccgct gtttcgtctg ttcgatgaaa ccttttctct ggatgatgtg 840 aaggattgtg atgttatgtt cagtatgaag ggcaaggata acttcgcaac gtctggtagt 900 aacaagatga aggaaatcag ccgttctccg gaaaacctgg tggcgcaggt tattggcaaa 960 aatcatcagt atccggatgg cctggtgctg tttctgggca ccatgttcgc accgacggaa 1020 gatcgcaacg gcaaaggtct gggctttacc cataaaaaag gcgatcaagt gaatatcagt 1080 agctctcacc tgggcaccct gattaactgg gttaatacgt gtgatcagat tccgaaatgg 1140 gaatttggta tcggcgcgtt cacgaactac attgttaaac gcaatctgaa atag 1194 <210> 97 <211> 897 <212> DNA <213> Thermobacillus composti <220> <221> CDS <222> (1)..(897) <400> 97 atg cgc att att cgt tac atc ggg gac gac gga gct gcg cgc ctc gcg 48 Met Arg Ile Ile Arg Tyr Ile Gly Asp Asp Gly Ala Ala Arg Leu Ala 1 5 10 15 gcg gtg acc gac gag gag cag gct ttc ccg ctc cgg tcg ccg gat ttc 96 Ala Val Thr Asp Glu Glu Gln Ala Phe Pro Leu Arg Ser Pro Asp Phe 20 25 30 atg gcg ctg gtg cgg gaa gcg gac gag gcg ggg atc acg ccg ctg gaa 144 Met Ala Leu Val Arg Glu Ala Asp Glu Ala Gly Ile Thr Pro Leu Glu 35 40 45 gcg gtg cgc cgt cag atc gcg ggc gca cag ccg ctg ccc ggc gac tgg 192 Ala Val Arg Arg Gln Ile Ala Gly Ala Gln Pro Leu Pro Gly Asp Trp 50 55 60 cgc gag ttg aac ctg ctg acg ccg gtg gat gcg ccc gag gtg tgg gcg 240 Arg Glu Leu Asn Leu Leu Thr Pro Val Asp Ala Pro Glu Val Trp Ala 65 70 75 80 gcc ggc gtc act tat gag cgc agc aaa gaa gcg cgc aac gag gag tcg 288 Ala Gly Val Thr Tyr Glu Arg Ser Lys Glu Ala Arg Asn Glu Glu Ser 85 90 95 aag ggc gcc gca acc ggc gac gaa acg ttc tac gac aag gtg tac cgg 336 Lys Gly Ala Ala Thr Gly Asp Glu Thr Phe Tyr Asp Lys Val Tyr Arg 100 105 110 gcc gag cgg ccg gag att ttc ttc aag tcg acg agc gcc cgc acg gcg 384 Ala Glu Arg Pro Glu Ile Phe Phe Lys Ser Thr Ser Ala Arg Thr Ala 115 120 125 cgg ccg ggc aca ccc gtc tgc atc cgc agc gac tcg gac tgg cag gtg 432 Arg Pro Gly Thr Pro Val Cys Ile Arg Ser Asp Ser Asp Trp Gln Val 130 135 140 ccc gag ccg gaa ctc ggc atc gtg ctg gac cgc ggc ggc cgc atc ctc 480 Pro Glu Pro Glu Leu Gly Ile Val Leu Asp Arg Gly Gly Arg Ile Leu 145 150 155 160 ggc tac acg gtc ggc aac gac atg agc tgc cgc gac atc gag ggc gag 528 Gly Tyr Thr Val Gly Asn Asp Met Ser Cys Arg Asp Ile Glu Gly Glu 165 170 175 aac ccg ctc tat ctg ccg cag gcg aaa atc tgg cgc cgc tcc tgt tcc 576 Asn Pro Leu Tyr Leu Pro Gln Ala Lys Ile Trp Arg Arg Ser Cys Ser 180 185 190 atc ggt ccg gcg atc cgg ctg gcc gaa acc gtg ccg aat ccg tat gac 624 Ile Gly Pro Ala Ile Arg Leu Ala Glu Thr Val Pro Asn Pro Tyr Asp 195 200 205 ctg acg atc acc tgc cgc atc tat cgg gac ggt caa ttg gcg gtg aac 672 Leu Thr Ile Thr Cys Arg Ile Tyr Arg Asp Gly Gln Leu Ala Val Asn 210 215 220 gag acg gcc aat acg ggg cag ctc cgg cgg aag ctg gac gaa ctg gcg 720 Glu Thr Ala Asn Thr Gly Gln Leu Arg Arg Lys Leu Asp Glu Leu Ala 225 230 235 240 tcc ttc ctc gtg cgg gac aac gtc gtg ttc gac ggc acc gtg ctg ctg 768 Ser Phe Leu Val Arg Asp Asn Val Val Phe Asp Gly Thr Val Leu Leu 245 250 255 acc ggc acc tgc atc gtg ccg ccc gac cgg ttc acg ctg cag ccc ggc 816 Thr Gly Thr Cys Ile Val Pro Pro Asp Arg Phe Thr Leu Gln Pro Gly 260 265 270 gac cgc atc gag atc gac att tcc ggc atc ggc acc ctg atc aac cct 864 Asp Arg Ile Glu Ile Asp Ile Ser Gly Ile Gly Thr Leu Ile Asn Pro 275 280 285 gtc gcg gcg gcg gac gcc gca atc cag gat taa 897 Val Ala Ala Ala Asp Ala Ala Ile Gln Asp 290 295 <210> 98 <211> 298 <212> PRT <213> Thermobacillus composti <400> 98 Met Arg Ile Ile Arg Tyr Ile Gly Asp Asp Gly Ala Ala Arg Leu Ala 1 5 10 15 Ala Val Thr Asp Glu Glu Gln Ala Phe Pro Leu Arg Ser Pro Asp Phe 20 25 30 Met Ala Leu Val Arg Glu Ala Asp Glu Ala Gly Ile Thr Pro Leu Glu 35 40 45 Ala Val Arg Arg Gln Ile Ala Gly Ala Gln Pro Leu Pro Gly Asp Trp 50 55 60 Arg Glu Leu Asn Leu Leu Thr Pro Val Asp Ala Pro Glu Val Trp Ala 65 70 75 80 Ala Gly Val Thr Tyr Glu Arg Ser Lys Glu Ala Arg Asn Glu Glu Ser 85 90 95 Lys Gly Ala Ala Thr Gly Asp Glu Thr Phe Tyr Asp Lys Val Tyr Arg 100 105 110 Ala Glu Arg Pro Glu Ile Phe Phe Lys Ser Thr Ser Ala Arg Thr Ala 115 120 125 Arg Pro Gly Thr Pro Val Cys Ile Arg Ser Asp Ser Asp Trp Gln Val 130 135 140 Pro Glu Pro Glu Leu Gly Ile Val Leu Asp Arg Gly Gly Arg Ile Leu 145 150 155 160 Gly Tyr Thr Val Gly Asn Asp Met Ser Cys Arg Asp Ile Glu Gly Glu 165 170 175 Asn Pro Leu Tyr Leu Pro Gln Ala Lys Ile Trp Arg Arg Ser Cys Ser 180 185 190 Ile Gly Pro Ala Ile Arg Leu Ala Glu Thr Val Pro Asn Pro Tyr Asp 195 200 205 Leu Thr Ile Thr Cys Arg Ile Tyr Arg Asp Gly Gln Leu Ala Val Asn 210 215 220 Glu Thr Ala Asn Thr Gly Gln Leu Arg Arg Lys Leu Asp Glu Leu Ala 225 230 235 240 Ser Phe Leu Val Arg Asp Asn Val Val Phe Asp Gly Thr Val Leu Leu 245 250 255 Thr Gly Thr Cys Ile Val Pro Pro Asp Arg Phe Thr Leu Gln Pro Gly 260 265 270 Asp Arg Ile Glu Ile Asp Ile Ser Gly Ile Gly Thr Leu Ile Asn Pro 275 280 285 Val Ala Ala Ala Asp Ala Ala Ile Gln Asp 290 295 <210> 99 <211> 897 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 99 atgcgtatta tccgctatat tggtgatgat ggtgccgcac gtctggcagc cgttaccgat 60 gaagaacagg catttccgct gcgttctccg gatttcatgg cgctggttcg cgaagcggat 120 gaagcgggta tcacgccgct ggaagcggtg cgtcgccaga ttgcgggtgc acagccgctg 180 ccgggtgatt ggcgcgaact gaacctgctg accccggtgg atgcaccgga agtttgggca 240 gcaggtgtga cgtacgaacg tagcaaagaa gcacgcaatg aagaatctaa aggcgcggcc 300 accggtgatg aaacctttta tgataaagtt taccgtgcgg aacgcccgga aatctttttc 360 aaaagcacct ctgcacgtac cgcccgtccg ggcaccccgg tgtgcattcg tagtgatagc 420 gattggcagg ttccggaacc ggaactgggt atcgtgctgg atcgtggcgg tcgcattctg 480 ggctataccg tgggtaacga tatgagctgc cgtgatatcg aaggcgaaaa tccgctgtac 540 ctgccgcagg ccaaaatttg gcgtcgctct tgtagtatcg gtccggccat tcgcctggca 600 gaaaccgttc cgaacccgta tgatctgacc atcacgtgcc gtatttaccg cgatggccag 660 ctggcggtga acgaaaccgc caatacgggt cagctgcgtc gcaaactgga tgaactggcg 720 agttttctgg ttcgcgataa cgtggttttc gatggcaccg ttctgctgac cggtacgtgc 780 atcgtgccgc cggatcgttt caccctgcag ccgggcgatc gcattgaaat cgatattagc 840 ggcatcggca ccctgattaa tccggtggca gcggccgatg cagcgattca ggattaa 897 <210> 100 <211> 1227 <212> DNA <213> Arthrobacter globiformis <220> <221> CDS <222> (1)..(1227) <400> 100 gtg acc gcg ccg ccg att ccc ggg agt tcc gtt cct ccg gta acc tct 48 Val Thr Ala Pro Pro Ile Pro Gly Ser Ser Val Pro Pro Val Thr Ser 1 5 10 15 gtc ctt ccg gat gac gct ggc cag gcg ctg ctg gtt ggc cgg atc tgg 96 Val Leu Pro Asp Asp Ala Gly Gln Ala Leu Leu Val Gly Arg Ile Trp 20 25 30 gac ccc gcc acc ggc ggt ccc cgg gtg gtg gct ctc agc ggg gac tcc 144 Asp Pro Ala Thr Gly Gly Pro Arg Val Val Ala Leu Ser Gly Asp Ser 35 40 45 gcc gtc gac ctg acg cgc ctg gcc gga acc gtc tcg gaa ctg ctc gaa 192 Ala Val Asp Leu Thr Arg Leu Ala Gly Thr Val Ser Glu Leu Leu Glu 50 55 60 ctg cct gat cca gcc gcg gca gtc cgt gcg gcg ctc ctt gac ccg gca 240 Leu Pro Asp Pro Ala Ala Ala Val Arg Ala Ala Leu Leu Asp Pro Ala 65 70 75 80 ctg ggg gta cag cgg tgg gcg acg gcc gac gtc gtc gcc gcc tcg ctg 288 Leu Gly Val Gln Arg Trp Ala Thr Ala Asp Val Val Ala Ala Ser Leu 85 90 95 gcc ggt gac gca gca cgc ccg cac ctg ctc gca ccg gtt gac ctg cag 336 Ala Gly Asp Ala Ala Arg Pro His Leu Leu Ala Pro Val Asp Leu Gln 100 105 110 gtc atc aag gcc tgc ggc gtg acg ttt gtg gac agc atg atc gaa cgg 384 Val Ile Lys Ala Cys Gly Val Thr Phe Val Asp Ser Met Ile Glu Arg 115 120 125 gtg atc gag gaa agg tgc gcc ggc gac gcc gct cgg gcg gcc gag atg 432 Val Ile Glu Glu Arg Cys Ala Gly Asp Ala Ala Arg Ala Ala Glu Met 130 135 140 cgc gag ctt gtc ggg aag gcg ctc ggc gga agc atc gcc acg gtc cgg 480 Arg Glu Leu Val Gly Lys Ala Leu Gly Gly Ser Ile Ala Thr Val Arg 145 150 155 160 ccg ggg tcc ccg gag gcg gcc gag gcc aag cgc gtc ctg att gcc gag 528 Pro Gly Ser Pro Glu Ala Ala Glu Ala Lys Arg Val Leu Ile Ala Glu 165 170 175 ggg ctc tgg tcg cag tat ctc gag gtg ggc atc ggg ccg gac ccg gag 576 Gly Leu Trp Ser Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Pro Glu 180 185 190 gtg ttc acg aag gcg ccg gtg ctg tcc tcg gtg ggc ctg ggc gcg ggc 624 Val Phe Thr Lys Ala Pro Val Leu Ser Ser Val Gly Leu Gly Ala Gly 195 200 205 atc ggg att ccg cgg ttc tcc tcc tgg aac aac ccg gag ccg gaa ctg 672 Ile Gly Ile Pro Arg Phe Ser Ser Trp Asn Asn Pro Glu Pro Glu Leu 210 215 220 gtg ctg atc gtg acg tcc cgc ggc gag gtg gtg ggc gcc act ctg ggc 720 Val Leu Ile Val Thr Ser Arg Gly Glu Val Val Gly Ala Thr Leu Gly 225 230 235 240 aac gac gtc aac ctg cgc gac gtt gag ggc cgc agc gcc ctg ctg ctg 768 Asn Asp Val Asn Leu Arg Asp Val Glu Gly Arg Ser Ala Leu Leu Leu 245 250 255 ggc aag gcc aag gac aac aac gcg tcc agt gcc ctc gga cca ctg atc 816 Gly Lys Ala Lys Asp Asn Asn Ala Ser Ser Ala Leu Gly Pro Leu Ile 260 265 270 agg ctc ttc gac ggc agc ttc acg gtg gac acc ctc cgt gag gag gag 864 Arg Leu Phe Asp Gly Ser Phe Thr Val Asp Thr Leu Arg Glu Glu Glu 275 280 285 atc ctg ctg cgt gtc gaa ggc ctg gac ggc tac ctg ctg gag ggg cgg 912 Ile Leu Leu Arg Val Glu Gly Leu Asp Gly Tyr Leu Leu Glu Gly Arg 290 295 300 aac acg ctg gcg agg atc agc agg ccc ttc gag gag ctc gtg gcg gcc 960 Asn Thr Leu Ala Arg Ile Ser Arg Pro Phe Glu Glu Leu Val Ala Ala 305 310 315 320 acc cgc ggc agg cac cac cag tat ccg gac ggc ttc gca ctg ttc acc 1008 Thr Arg Gly Arg His His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Thr 325 330 335 ggc acg ctt ttc gca ccg acc cag gac cgc gac gag ccg ggg cag ggg 1056 Gly Thr Leu Phe Ala Pro Thr Gln Asp Arg Asp Glu Pro Gly Gln Gly 340 345 350 ttc acg cac aag cac ggg gat gtt gtg acc atc cgg agc cgc cac ctc 1104 Phe Thr His Lys His Gly Asp Val Val Thr Ile Arg Ser Arg His Leu 355 360 365 ggt gcc ctc atc aac cgg gtg ggc acg gca gag gag ctc ccg gag tgg 1152 Gly Ala Leu Ile Asn Arg Val Gly Thr Ala Glu Glu Leu Pro Glu Trp 370 375 380 acc ttc ggc ctg cgg cag ctg ttc ggc tac ctc gcg gag cag cgg cag 1200 Thr Phe Gly Leu Arg Gln Leu Phe Gly Tyr Leu Ala Glu Gln Arg Gln 385 390 395 400 gcg gag cta gct cag atg cag gag tag 1227 Ala Glu Leu Ala Gln Met Gln Glu 405 <210> 101 <211> 408 <212> PRT <213> Arthrobacter globiformis <400> 101 Val Thr Ala Pro Pro Ile Pro Gly Ser Ser Val Pro Pro Val Thr Ser 1 5 10 15 Val Leu Pro Asp Asp Ala Gly Gln Ala Leu Leu Val Gly Arg Ile Trp 20 25 30 Asp Pro Ala Thr Gly Gly Pro Arg Val Val Ala Leu Ser Gly Asp Ser 35 40 45 Ala Val Asp Leu Thr Arg Leu Ala Gly Thr Val Ser Glu Leu Leu Glu 50 55 60 Leu Pro Asp Pro Ala Ala Ala Val Arg Ala Ala Leu Leu Asp Pro Ala 65 70 75 80 Leu Gly Val Gln Arg Trp Ala Thr Ala Asp Val Val Ala Ala Ser Leu 85 90 95 Ala Gly Asp Ala Ala Arg Pro His Leu Leu Ala Pro Val Asp Leu Gln 100 105 110 Val Ile Lys Ala Cys Gly Val Thr Phe Val Asp Ser Met Ile Glu Arg 115 120 125 Val Ile Glu Glu Arg Cys Ala Gly Asp Ala Ala Arg Ala Ala Glu Met 130 135 140 Arg Glu Leu Val Gly Lys Ala Leu Gly Gly Ser Ile Ala Thr Val Arg 145 150 155 160 Pro Gly Ser Pro Glu Ala Ala Glu Ala Lys Arg Val Leu Ile Ala Glu 165 170 175 Gly Leu Trp Ser Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Pro Glu 180 185 190 Val Phe Thr Lys Ala Pro Val Leu Ser Ser Val Gly Leu Gly Ala Gly 195 200 205 Ile Gly Ile Pro Arg Phe Ser Ser Trp Asn Asn Pro Glu Pro Glu Leu 210 215 220 Val Leu Ile Val Thr Ser Arg Gly Glu Val Val Gly Ala Thr Leu Gly 225 230 235 240 Asn Asp Val Asn Leu Arg Asp Val Glu Gly Arg Ser Ala Leu Leu Leu 245 250 255 Gly Lys Ala Lys Asp Asn Asn Ala Ser Ser Ala Leu Gly Pro Leu Ile 260 265 270 Arg Leu Phe Asp Gly Ser Phe Thr Val Asp Thr Leu Arg Glu Glu Glu 275 280 285 Ile Leu Leu Arg Val Glu Gly Leu Asp Gly Tyr Leu Leu Glu Gly Arg 290 295 300 Asn Thr Leu Ala Arg Ile Ser Arg Pro Phe Glu Glu Leu Val Ala Ala 305 310 315 320 Thr Arg Gly Arg His His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Thr 325 330 335 Gly Thr Leu Phe Ala Pro Thr Gln Asp Arg Asp Glu Pro Gly Gln Gly 340 345 350 Phe Thr His Lys His Gly Asp Val Val Thr Ile Arg Ser Arg His Leu 355 360 365 Gly Ala Leu Ile Asn Arg Val Gly Thr Ala Glu Glu Leu Pro Glu Trp 370 375 380 Thr Phe Gly Leu Arg Gln Leu Phe Gly Tyr Leu Ala Glu Gln Arg Gln 385 390 395 400 Ala Glu Leu Ala Gln Met Gln Glu 405 <210> 102 <211> 1227 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 102 atgaccgccc cgccgatccc gggttcgtcc gtgccgccgg tgacctctgt tctgccggat 60 gatgctggcc aagctctgct ggttggtcgt atttgggacc cggcaaccgg cggtccgcgt 120 gtggttgccc tgagcggtga tagcgcggtg gacctgaccc gtctggcagg cacggtgtct 180 gaactgctgg aactgccgga cccggcggcg gcggtgcgtg ctgcgctgct ggacccggcc 240 ctgggcgtcc agcgttgggc aaccgcagat gtcgtggcag caagcctggc aggtgacgct 300 gcacgtccgc atctgctggc accggtggat ctgcaagtta ttaaagcgtg cggcgtcacg 360 tttgtggact ctatgattga acgtgtgatc gaagaacgtt gtgcaggtga tgcagcacgt 420 gctgcggaaa tgcgcgaact ggtgggcaaa gctctgggcg gtagtatcgc aaccgttcgt 480 ccgggttccc cggaagccgc agaagcaaaa cgcgttctga ttgcagaagg tctgtggagc 540 cagtatctgg aagtgggcat cggtccggac ccggaagttt ttaccaaagc tccggtcctg 600 agctctgtgg gtctgggtgc aggtattggt atcccgcgtt tcagttcctg gaacaatccg 660 gaaccggaac tggttctgat tgtcacctca cgcggcgaag ttgtcggtgc aacgctgggc 720 aacgatgtta atctgcgtga cgtcgaaggt cgctcggctc tgctgctggg caaagcgaaa 780 gataacaatg cttcatcggc gctgggtccg ctgattcgtc tgtttgatgg cagtttcacc 840 gtggacacgc tgcgtgaaga agaaatcctg ctgcgcgttg aaggcctgga tggttatctg 900 ctggaaggtc gtaacaccct ggcacgtatc tcccgcccgt ttgaagaact ggtggctgcg 960 acgcgtggtc gccatcacca atacccggat ggttttgccc tgttcaccgg cacgctgttt 1020 gcaccgaccc aggatcgtga cgaaccgggc caaggtttca cccataaaca cggcgacgtg 1080 gttacgattc gtagtcgcca cctgggtgct ctgatcaatc gtgtgggcac cgcggaagaa 1140 ctgccggaat ggacgttcgg tctgcgccaa ctgtttggtt atctggcgga acaacgtcaa 1200 gcggaactgg ctcaaatgca ggaatga 1227 <210> 103 <211> 1446 <212> DNA <213> Azospirillum brasilense <220> <221> CDS <222> (1)..(1446) <400> 103 atg gct aac gtg act tat acg gat acg caa ctg ctg atc gac ggc gag 48 Met Ala Asn Val Thr Tyr Thr Asp Thr Gln Leu Leu Ile Asp Gly Glu 1 5 10 15 tgg gtc gac gcc gcg agc ggc aag acg atc gac gtc gtg aac ccg gcg 96 Trp Val Asp Ala Ala Ser Gly Lys Thr Ile Asp Val Val Asn Pro Ala 20 25 30 acc ggc aag ccg atc ggc agg gtg gcc cat gcg ggc atc gcc gat ctc 144 Thr Gly Lys Pro Ile Gly Arg Val Ala His Ala Gly Ile Ala Asp Leu 35 40 45 gac cgt gcg ctc gcc gcc gcg caa agc ggc ttc gag gca tgg cgc aag 192 Asp Arg Ala Leu Ala Ala Ala Gln Ser Gly Phe Glu Ala Trp Arg Lys 50 55 60 gtg ccc gcg cac gag cgc gcg gcg acg atg cgc aag gcg gcc gcg ctg 240 Val Pro Ala His Glu Arg Ala Ala Thr Met Arg Lys Ala Ala Ala Leu 65 70 75 80 gtg cgt gaa cgc gcc gac gcg atc gcg cag ctg atg acg cag gag cag 288 Val Arg Glu Arg Ala Asp Ala Ile Ala Gln Leu Met Thr Gln Glu Gln 85 90 95 ggc aag ccg ctc acc gaa gcg cgc gtc gaa gtg ctg tcg gcg gcg gac 336 Gly Lys Pro Leu Thr Glu Ala Arg Val Glu Val Leu Ser Ala Ala Asp 100 105 110 atc atc gaa tgg ttc gcg gac gaa ggc cgc cgc gtg tac ggc cgg atc 384 Ile Ile Glu Trp Phe Ala Asp Glu Gly Arg Arg Val Tyr Gly Arg Ile 115 120 125 gtg ccg ccg cgc aac ctc ggc gca cag cag acg gtc gtg aag gag ccg 432 Val Pro Pro Arg Asn Leu Gly Ala Gln Gln Thr Val Val Lys Glu Pro 130 135 140 gtc ggc ccg gtc gcc gcg ttc acg ccg tgg aat ttc ccg gtc aac cag 480 Val Gly Pro Val Ala Ala Phe Thr Pro Trp Asn Phe Pro Val Asn Gln 145 150 155 160 gtc gtg cgc aag ctg agc gcc gcg ctg gca acc ggc tgt tcg ttc ctc 528 Val Val Arg Lys Leu Ser Ala Ala Leu Ala Thr Gly Cys Ser Phe Leu 165 170 175 gtg aaa gcg ccg gaa gaa acc ccc gcg tcg ccg gcc gcg ctg ctg cgc 576 Val Lys Ala Pro Glu Glu Thr Pro Ala Ser Pro Ala Ala Leu Leu Arg 180 185 190 gcc ttc gtc gac gca ggc gtg ccg gcc ggc gtg atc ggc ctc gtg tac 624 Ala Phe Val Asp Ala Gly Val Pro Ala Gly Val Ile Gly Leu Val Tyr 195 200 205 ggc gat ccg gcc gaa atc tcg tcg tac ctg atc ccg cac ccg gtg atc 672 Gly Asp Pro Ala Glu Ile Ser Ser Tyr Leu Ile Pro His Pro Val Ile 210 215 220 cgc aag gtc acg ttc acg ggt tcg acg ccg gtc ggc aag cag ctc gcc 720 Arg Lys Val Thr Phe Thr Gly Ser Thr Pro Val Gly Lys Gln Leu Ala 225 230 235 240 tcg ctg gcg ggc ctg cac atg aag cgc gcg acg atg gag ctg ggc ggg 768 Ser Leu Ala Gly Leu His Met Lys Arg Ala Thr Met Glu Leu Gly Gly 245 250 255 cac gca ccg gtg atc gtg gcc gaa gac gcc gac gtt gcg ctc gcg gtg 816 His Ala Pro Val Ile Val Ala Glu Asp Ala Asp Val Ala Leu Ala Val 260 265 270 aaa gcg gcc ggc ggc gcg aag ttc cgc aac gcg ggg cag gtc tgc atc 864 Lys Ala Ala Gly Gly Ala Lys Phe Arg Asn Ala Gly Gln Val Cys Ile 275 280 285 tcg ccg acg cgc ttc ctc gtg cac aac agc atc cgc gac gaa ttc acg 912 Ser Pro Thr Arg Phe Leu Val His Asn Ser Ile Arg Asp Glu Phe Thr 290 295 300 cgc gcg ctg gtc aag cat gcc gaa ggg ctg aag gtc ggc aac ggc ctc 960 Arg Ala Leu Val Lys His Ala Glu Gly Leu Lys Val Gly Asn Gly Leu 305 310 315 320 gag gaa ggc acg acg ctc ggc gcg ctc gcg aac ccg cgc cgg ctg acc 1008 Glu Glu Gly Thr Thr Leu Gly Ala Leu Ala Asn Pro Arg Arg Leu Thr 325 330 335 gcg atg gcg tcg gtc atc gac aac gcg cgc aag gtc ggt gcg agc atc 1056 Ala Met Ala Ser Val Ile Asp Asn Ala Arg Lys Val Gly Ala Ser Ile 340 345 350 gaa acc ggc ggc gag cgg atc ggc tcg gaa ggc aac ttc ttc gcg ccg 1104 Glu Thr Gly Gly Glu Arg Ile Gly Ser Glu Gly Asn Phe Phe Ala Pro 355 360 365 acc gtg atc gcg aac gtg ccg ctc gat gcg gac gtg ttc aac aac gag 1152 Thr Val Ile Ala Asn Val Pro Leu Asp Ala Asp Val Phe Asn Asn Glu 370 375 380 ccg ttc ggc ccg gtc gcg gcg att cgc ggt ttc gac aag ctc gaa gag 1200 Pro Phe Gly Pro Val Ala Ala Ile Arg Gly Phe Asp Lys Leu Glu Glu 385 390 395 400 gcg atc gcg gaa gcg aac cgt ttg ccg ttc ggt ctt gcc ggc tac gcg 1248 Ala Ile Ala Glu Ala Asn Arg Leu Pro Phe Gly Leu Ala Gly Tyr Ala 405 410 415 ttc acg cgt tcg ttc gcg aac gtg cac ctg ctc acg cag cgc ctc gaa 1296 Phe Thr Arg Ser Phe Ala Asn Val His Leu Leu Thr Gln Arg Leu Glu 420 425 430 gtc ggg atg ctg tgg atc aac cag ccg gcg acg ccg tgg ccg gaa atg 1344 Val Gly Met Leu Trp Ile Asn Gln Pro Ala Thr Pro Trp Pro Glu Met 435 440 445 ccg ttc ggc ggc gtg aag gac tcg ggc tac ggt tcg gaa ggc ggc ccg 1392 Pro Phe Gly Gly Val Lys Asp Ser Gly Tyr Gly Ser Glu Gly Gly Pro 450 455 460 gaa gcg ctc gag ccg tac ctg gtc acg aag tcg gtg acg gtg atg gcc 1440 Glu Ala Leu Glu Pro Tyr Leu Val Thr Lys Ser Val Thr Val Met Ala 465 470 475 480 gtc tga 1446 Val <210> 104 <211> 481 <212> PRT <213> Azospirillum brasilense <400> 104 Met Ala Asn Val Thr Tyr Thr Asp Thr Gln Leu Leu Ile Asp Gly Glu 1 5 10 15 Trp Val Asp Ala Ala Ser Gly Lys Thr Ile Asp Val Val Asn Pro Ala 20 25 30 Thr Gly Lys Pro Ile Gly Arg Val Ala His Ala Gly Ile Ala Asp Leu 35 40 45 Asp Arg Ala Leu Ala Ala Ala Gln Ser Gly Phe Glu Ala Trp Arg Lys 50 55 60 Val Pro Ala His Glu Arg Ala Ala Thr Met Arg Lys Ala Ala Ala Leu 65 70 75 80 Val Arg Glu Arg Ala Asp Ala Ile Ala Gln Leu Met Thr Gln Glu Gln 85 90 95 Gly Lys Pro Leu Thr Glu Ala Arg Val Glu Val Leu Ser Ala Ala Asp 100 105 110 Ile Ile Glu Trp Phe Ala Asp Glu Gly Arg Arg Val Tyr Gly Arg Ile 115 120 125 Val Pro Pro Arg Asn Leu Gly Ala Gln Gln Thr Val Val Lys Glu Pro 130 135 140 Val Gly Pro Val Ala Ala Phe Thr Pro Trp Asn Phe Pro Val Asn Gln 145 150 155 160 Val Val Arg Lys Leu Ser Ala Ala Leu Ala Thr Gly Cys Ser Phe Leu 165 170 175 Val Lys Ala Pro Glu Glu Thr Pro Ala Ser Pro Ala Ala Leu Leu Arg 180 185 190 Ala Phe Val Asp Ala Gly Val Pro Ala Gly Val Ile Gly Leu Val Tyr 195 200 205 Gly Asp Pro Ala Glu Ile Ser Ser Tyr Leu Ile Pro His Pro Val Ile 210 215 220 Arg Lys Val Thr Phe Thr Gly Ser Thr Pro Val Gly Lys Gln Leu Ala 225 230 235 240 Ser Leu Ala Gly Leu His Met Lys Arg Ala Thr Met Glu Leu Gly Gly 245 250 255 His Ala Pro Val Ile Val Ala Glu Asp Ala Asp Val Ala Leu Ala Val 260 265 270 Lys Ala Ala Gly Gly Ala Lys Phe Arg Asn Ala Gly Gln Val Cys Ile 275 280 285 Ser Pro Thr Arg Phe Leu Val His Asn Ser Ile Arg Asp Glu Phe Thr 290 295 300 Arg Ala Leu Val Lys His Ala Glu Gly Leu Lys Val Gly Asn Gly Leu 305 310 315 320 Glu Glu Gly Thr Thr Leu Gly Ala Leu Ala Asn Pro Arg Arg Leu Thr 325 330 335 Ala Met Ala Ser Val Ile Asp Asn Ala Arg Lys Val Gly Ala Ser Ile 340 345 350 Glu Thr Gly Gly Glu Arg Ile Gly Ser Glu Gly Asn Phe Phe Ala Pro 355 360 365 Thr Val Ile Ala Asn Val Pro Leu Asp Ala Asp Val Phe Asn Asn Glu 370 375 380 Pro Phe Gly Pro Val Ala Ala Ile Arg Gly Phe Asp Lys Leu Glu Glu 385 390 395 400 Ala Ile Ala Glu Ala Asn Arg Leu Pro Phe Gly Leu Ala Gly Tyr Ala 405 410 415 Phe Thr Arg Ser Phe Ala Asn Val His Leu Leu Thr Gln Arg Leu Glu 420 425 430 Val Gly Met Leu Trp Ile Asn Gln Pro Ala Thr Pro Trp Pro Glu Met 435 440 445 Pro Phe Gly Gly Val Lys Asp Ser Gly Tyr Gly Ser Glu Gly Gly Pro 450 455 460 Glu Ala Leu Glu Pro Tyr Leu Val Thr Lys Ser Val Thr Val Met Ala 465 470 475 480 Val <210> 105 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 105 atggccaatg tgacctatac ggatacccag ctgctgatcg atggcgaatg ggttgatgcg 60 gccagcggta aaacgattga tgtggttaac ccggcgaccg gcaaaccgat cggtcgtgtg 120 gcccatgcag gcattgccga tctggatcgc gccctggcag ccgcacagtc tggttttgaa 180 gcctggcgta aagtgccggc acacgaacgt gcggccacca tgcgtaaagc ggcggcgctg 240 gtgcgtgaac gtgccgatgc catcgcacag ctgatgacgc aggaacaggg caaaccgctg 300 accgaagccc gcgtggaagt tctgtctgcc gcagatatta tcgaatggtt tgcggatgaa 360 ggccgtcgcg tgtacggtcg tattgttccg ccgcgcaatc tgggtgccca gcagaccgtg 420 gttaaagaac cggtgggtcc ggttgccgca tttaccccgt ggaacttccc ggtgaatcag 480 gtggttcgta aactgagcgc ggcgctggcc accggttgca gttttctggt taaagcgccg 540 gaagaaaccc cggcaagccc ggccgcactg ctgcgcgcgt ttgtggatgc gggcgttccg 600 gcaggtgtga ttggtctggt ttatggtgat ccggcggaaa ttagctctta cctgatcccg 660 catccggtga ttcgtaaagt tacgtttacc ggcagcaccc cggtgggtaa acagctggcg 720 tctctggccg gtctgcatat gaaacgcgca accatggaac tgggcggtca cgcgccggtg 780 attgttgcag aagatgcgga tgtggcgctg gcggttaaag ccgccggcgg tgcaaaattc 840 cgtaatgccg gtcaggtgtg catcagtccg acccgctttc tggttcataa cagcattcgt 900 gatgaattta cccgcgccct ggtgaaacac gcagaaggtc tgaaagttgg caacggtctg 960 gaagaaggca ccacgctggg tgcactggcc aatccgcgtc gcctgaccgc aatggcaagc 1020 gtgatcgata acgcgcgtaa agttggcgcc tctatcgaaa cgggcggtga acgcattggc 1080 agtgagggta actttttcgc accgaccgtg attgcgaatg ttccgctgga tgcggatgtt 1140 tttaacaatg aaccgtttgg cccggttgca gcgatccgtg gttttgataa actggaagaa 1200 gcgattgccg aagcaaaccg cctgccgttt ggcctggccg gttatgcatt tacgcgtagt 1260 ttcgccaatg tgcacctgct gacccagcgc ctggaagttg gtatgctgtg gatcaatcag 1320 ccggccaccc cgtggccgga aatgccgttt ggcggtgtga aagatagtgg ctatggtagc 1380 gaaggcggtc cggaagccct ggaaccgtac ctggtgacga aaagcgtgac cgttatggca 1440 gtttga 1446 <210> 106 <211> 1440 <212> DNA <213> Halomonas boliviensis <220> <221> CDS <222> (1)..(1440) <400> 106 atg ggc gaa atg aac aac aat tta atc ggt ggc gta tgg cgc gag gcc 48 Met Gly Glu Met Asn Asn Asn Leu Ile Gly Gly Val Trp Arg Glu Ala 1 5 10 15 gat gat gtc tca gaa aac act aac ccc tcc gat gtg acg gat ctg atc 96 Asp Asp Val Ser Glu Asn Thr Asn Pro Ser Asp Val Thr Asp Leu Ile 20 25 30 ggg ctt tat gcc cgc ggc ggt gcc cag gat gtg acc gat gcc gcc gaa 144 Gly Leu Tyr Ala Arg Gly Gly Ala Gln Asp Val Thr Asp Ala Ala Glu 35 40 45 gcg gca gag gtc gca atg ccc gcc tgg gcc ggc gcg acc cct cag ctg 192 Ala Ala Glu Val Ala Met Pro Ala Trp Ala Gly Ala Thr Pro Gln Leu 50 55 60 cgc gct gat ctg ctg gac cgc gtg gcc gca gag atc acc cgc cgc gaa 240 Arg Ala Asp Leu Leu Asp Arg Val Ala Ala Glu Ile Thr Arg Arg Glu 65 70 75 80 gat gag att gcg acg atg ctg gcc tgc gaa gag ggt aag gtt ctg tta 288 Asp Glu Ile Ala Thr Met Leu Ala Cys Glu Glu Gly Lys Val Leu Leu 85 90 95 gaa gcg ctg gga gaa gtt cgc cgc gcc gcg cat gtg ttt cgt ttt ttc 336 Glu Ala Leu Gly Glu Val Arg Arg Ala Ala His Val Phe Arg Phe Phe 100 105 110 gcc gga gag gcg cta cgt ctg acg ggg gat gcc ctg gcc tcg gtg cga 384 Ala Gly Glu Ala Leu Arg Leu Thr Gly Asp Ala Leu Ala Ser Val Arg 115 120 125 ccc ggc gtg gat gtg gag gtg acc cgc gag ccg tta ggc att gtc ggt 432 Pro Gly Val Asp Val Glu Val Thr Arg Glu Pro Leu Gly Ile Val Gly 130 135 140 atc atc acc ccg tgg aac ttc ccc atc gcg att cct gcg tgg aaa att 480 Ile Ile Thr Pro Trp Asn Phe Pro Ile Ala Ile Pro Ala Trp Lys Ile 145 150 155 160 gcc cct gcc tta gct tat ggc aac tgc gtg atc ttt aag cca gcg gaa 528 Ala Pro Ala Leu Ala Tyr Gly Asn Cys Val Ile Phe Lys Pro Ala Glu 165 170 175 cag acg ccg ggc tca gcc cac ata ttg acc cag att att cat gag gcg 576 Gln Thr Pro Gly Ser Ala His Ile Leu Thr Gln Ile Ile His Glu Ala 180 185 190 ggc tgc ccg gcg ggt gtt ttc aat ctc gtt atg ggg cgt ggc tcc gtc 624 Gly Cys Pro Ala Gly Val Phe Asn Leu Val Met Gly Arg Gly Ser Val 195 200 205 gtc ggt gag gcg atg acc acg gat ccg cgc atc tcg gga att tcc ttt 672 Val Gly Glu Ala Met Thr Thr Asp Pro Arg Ile Ser Gly Ile Ser Phe 210 215 220 acc ggg tcg gtg cag gta ggg cgg cag ctg gct ggc gcc tgc gcg gcg 720 Thr Gly Ser Val Gln Val Gly Arg Gln Leu Ala Gly Ala Cys Ala Ala 225 230 235 240 aac atg aaa aaa ctt cag cta gag atg ggc ggt aag aac ccg gtg atc 768 Asn Met Lys Lys Leu Gln Leu Glu Met Gly Gly Lys Asn Pro Val Ile 245 250 255 gtg atg gac gac gcc gat ctg gaa acc gct gtt tct gtc tgt ctc aac 816 Val Met Asp Asp Ala Asp Leu Glu Thr Ala Val Ser Val Cys Leu Asn 260 265 270 ggt gcc ttt tac cag acg ggg cag cgc tgt acc gca tcg tcg cgt cta 864 Gly Ala Phe Tyr Gln Thr Gly Gln Arg Cys Thr Ala Ser Ser Arg Leu 275 280 285 atc gta cag tcg ggc atc cat gat gcc ttt atc gcg gaa ctc agt cgc 912 Ile Val Gln Ser Gly Ile His Asp Ala Phe Ile Ala Glu Leu Ser Arg 290 295 300 cag atg cag gcg ctc aag gtg ggg cat gcg ctc gcc gag ggg atg cag 960 Gln Met Gln Ala Leu Lys Val Gly His Ala Leu Ala Glu Gly Met Gln 305 310 315 320 att ggc ccc gtc gcc gcc cgg agt cag ctc gaa agc aat ctt tac tac 1008 Ile Gly Pro Val Ala Ala Arg Ser Gln Leu Glu Ser Asn Leu Tyr Tyr 325 330 335 gtg gcg ctc gcc gct gaa gag ggc tgc gat gta ttg ggt gga gag cag 1056 Val Ala Leu Ala Ala Glu Glu Gly Cys Asp Val Leu Gly Gly Glu Gln 340 345 350 ctc aca cgc gac act gaa ggg tat ttc cag gca ccc gca ctt ttc ctt 1104 Leu Thr Arg Asp Thr Glu Gly Tyr Phe Gln Ala Pro Ala Leu Phe Leu 355 360 365 ggg gcg agt aat gcc atg cgt agc gcc cgt gaa gag atc ttc ggc ccc 1152 Gly Ala Ser Asn Ala Met Arg Ser Ala Arg Glu Glu Ile Phe Gly Pro 370 375 380 tgt gcc agc gtg att cgt gtc gat gac ttt gaa gaa gca gta gcg ctg 1200 Cys Ala Ser Val Ile Arg Val Asp Asp Phe Glu Glu Ala Val Ala Leu 385 390 395 400 gcc aat gac acc cag ttc ggt ctg tcg tcg ggg att tgt acc acc aat 1248 Ala Asn Asp Thr Gln Phe Gly Leu Ser Ser Gly Ile Cys Thr Thr Asn 405 410 415 cta cgc tat gcg cgg gag ttc aag cgc cgt tct gcc gct ggc atg gtg 1296 Leu Arg Tyr Ala Arg Glu Phe Lys Arg Arg Ser Ala Ala Gly Met Val 420 425 430 atg ctc aac ttg ccg acc gcg ggc gtg gat tat cac gtg ccc ttt ggc 1344 Met Leu Asn Leu Pro Thr Ala Gly Val Asp Tyr His Val Pro Phe Gly 435 440 445 ggg cgt aaa gcg tcg agc ttc ggg tca cgt gag cag ggt agc tat gca 1392 Gly Arg Lys Ala Ser Ser Phe Gly Ser Arg Glu Gln Gly Ser Tyr Ala 450 455 460 gcc gaa ttc tat aca tcg gtg aaa acc gcc tat acg tat gcc ggt taa 1440 Ala Glu Phe Tyr Thr Ser Val Lys Thr Ala Tyr Thr Tyr Ala Gly 465 470 475 <210> 107 <211> 479 <212> PRT <213> Halomonas boliviensis <400> 107 Met Gly Glu Met Asn Asn Asn Leu Ile Gly Gly Val Trp Arg Glu Ala 1 5 10 15 Asp Asp Val Ser Glu Asn Thr Asn Pro Ser Asp Val Thr Asp Leu Ile 20 25 30 Gly Leu Tyr Ala Arg Gly Gly Ala Gln Asp Val Thr Asp Ala Ala Glu 35 40 45 Ala Ala Glu Val Ala Met Pro Ala Trp Ala Gly Ala Thr Pro Gln Leu 50 55 60 Arg Ala Asp Leu Leu Asp Arg Val Ala Ala Glu Ile Thr Arg Arg Glu 65 70 75 80 Asp Glu Ile Ala Thr Met Leu Ala Cys Glu Glu Gly Lys Val Leu Leu 85 90 95 Glu Ala Leu Gly Glu Val Arg Arg Ala Ala His Val Phe Arg Phe Phe 100 105 110 Ala Gly Glu Ala Leu Arg Leu Thr Gly Asp Ala Leu Ala Ser Val Arg 115 120 125 Pro Gly Val Asp Val Glu Val Thr Arg Glu Pro Leu Gly Ile Val Gly 130 135 140 Ile Ile Thr Pro Trp Asn Phe Pro Ile Ala Ile Pro Ala Trp Lys Ile 145 150 155 160 Ala Pro Ala Leu Ala Tyr Gly Asn Cys Val Ile Phe Lys Pro Ala Glu 165 170 175 Gln Thr Pro Gly Ser Ala His Ile Leu Thr Gln Ile Ile His Glu Ala 180 185 190 Gly Cys Pro Ala Gly Val Phe Asn Leu Val Met Gly Arg Gly Ser Val 195 200 205 Val Gly Glu Ala Met Thr Thr Asp Pro Arg Ile Ser Gly Ile Ser Phe 210 215 220 Thr Gly Ser Val Gln Val Gly Arg Gln Leu Ala Gly Ala Cys Ala Ala 225 230 235 240 Asn Met Lys Lys Leu Gln Leu Glu Met Gly Gly Lys Asn Pro Val Ile 245 250 255 Val Met Asp Asp Ala Asp Leu Glu Thr Ala Val Ser Val Cys Leu Asn 260 265 270 Gly Ala Phe Tyr Gln Thr Gly Gln Arg Cys Thr Ala Ser Ser Arg Leu 275 280 285 Ile Val Gln Ser Gly Ile His Asp Ala Phe Ile Ala Glu Leu Ser Arg 290 295 300 Gln Met Gln Ala Leu Lys Val Gly His Ala Leu Ala Glu Gly Met Gln 305 310 315 320 Ile Gly Pro Val Ala Ala Arg Ser Gln Leu Glu Ser Asn Leu Tyr Tyr 325 330 335 Val Ala Leu Ala Ala Glu Glu Gly Cys Asp Val Leu Gly Gly Glu Gln 340 345 350 Leu Thr Arg Asp Thr Glu Gly Tyr Phe Gln Ala Pro Ala Leu Phe Leu 355 360 365 Gly Ala Ser Asn Ala Met Arg Ser Ala Arg Glu Glu Ile Phe Gly Pro 370 375 380 Cys Ala Ser Val Ile Arg Val Asp Asp Phe Glu Glu Ala Val Ala Leu 385 390 395 400 Ala Asn Asp Thr Gln Phe Gly Leu Ser Ser Gly Ile Cys Thr Thr Asn 405 410 415 Leu Arg Tyr Ala Arg Glu Phe Lys Arg Arg Ser Ala Ala Gly Met Val 420 425 430 Met Leu Asn Leu Pro Thr Ala Gly Val Asp Tyr His Val Pro Phe Gly 435 440 445 Gly Arg Lys Ala Ser Ser Phe Gly Ser Arg Glu Gln Gly Ser Tyr Ala 450 455 460 Ala Glu Phe Tyr Thr Ser Val Lys Thr Ala Tyr Thr Tyr Ala Gly 465 470 475 <210> 108 <211> 1440 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 108 atgggcgaaa tgaacaataa cctgatcggc ggtgtttggc gtgaagccga tgatgtgagt 60 gaaaatacca acccgagcga tgtgacggat ctgattggcc tgtatgcccg cggcggtgca 120 caggatgtta ccgatgcggc cgaagcggcc gaagtggcaa tgccggcctg ggcaggtgca 180 acgccgcagc tgcgtgcgga tctgctggat cgcgttgccg cagaaatcac ccgtcgcgaa 240 gatgaaattg cgacgatgct ggcctgcgaa gaaggcaaag tgctgctgga agccctgggt 300 gaagttcgtc gcgcggccca tgtttttcgt ttctttgcag gtgaagccct gcgtctgacc 360 ggtgatgccc tggcatctgt tcgtccgggc gtggatgttg aagtgacccg cgaaccgctg 420 ggcatcgtgg gtattatcac gccgtggaat ttcccgattg ccatcccggc atggaaaatc 480 gcaccggcgc tggcctatgg caactgcgtt atttttaaac cggcagaaca gaccccgggt 540 agcgcgcata ttctgacgca gattatccac gaagcaggct gtccggcggg tgttttcaat 600 ctggtgatgg gccgtggtag cgtggttggt gaagcgatga ccacggatcc gcgcattagc 660 ggcatctctt ttaccggttc tgttcaagtg ggccgtcagc tggcaggtgc ctgcgcagcg 720 aatatgaaaa aactgcagct ggaaatgggc ggtaaaaacc cggttatcgt gatggatgat 780 gcggatctgg aaaccgccgt tagcgtgtgc ctgaacggcg cgttctatca gaccggtcag 840 cgttgtacgg ccagctctcg cctgattgtg cagtctggca tccatgatgc gtttattgcc 900 gaactgagtc gtcagatgca ggccctgaaa gttggtcacg ccctggcaga aggcatgcag 960 attggtccgg tggccgcacg cagtcagctg gaaagcaatc tgtattacgt tgcgctggcg 1020 gccgaagaag gctgtgatgt gctgggcggt gaacagctga cccgtgatac ggaaggctac 1080 tttcaggcgc cggccctgtt cctgggtgca tctaacgcga tgcgtagtgc ccgcgaagaa 1140 atctttggtc cgtgcgcaag tgttattcgc gtggatgatt tcgaagaagc agttgcgctg 1200 gccaatgata cccagtttgg cctgagtagc ggtatttgta ccacgaacct gcgttatgcg 1260 cgcgaattta aacgtcgcag cgcagcgggc atggtgatgc tgaatctgcc gaccgccggt 1320 gttgattacc acgtgccgtt tggcggtcgt aaagcgtcta gtttcggcag ccgcgaacag 1380 ggttcttatg ccgcagaatt ttacaccagc gtgaaaaccg cctatacgta cgcaggttaa 1440 <210> 109 <211> 1467 <212> DNA <213> Bacillus subtilis <220> <221> CDS <222> (1)..(1467) <400> 109 atg tct gtg atc acg gaa caa aac acg tac ctc aac ttt att aac gga 48 Met Ser Val Ile Thr Glu Gln Asn Thr Tyr Leu Asn Phe Ile Asn Gly 1 5 10 15 gag tgg gtt aag tct caa tca ggc gat atg gtc aaa gtc gaa aac cct 96 Glu Trp Val Lys Ser Gln Ser Gly Asp Met Val Lys Val Glu Asn Pro 20 25 30 gcc gat gtg aat gat att gtc gga tat gta cag aat tca acg gct gaa 144 Ala Asp Val Asn Asp Ile Val Gly Tyr Val Gln Asn Ser Thr Ala Glu 35 40 45 gat gtg gaa cgt gcc gtc acc gcc gcc aat gaa gcc aaa acg gct tgg 192 Asp Val Glu Arg Ala Val Thr Ala Ala Asn Glu Ala Lys Thr Ala Trp 50 55 60 aga aag ctg acg ggt gcc gag cgc ggc caa tac tta tac aaa aca gcg 240 Arg Lys Leu Thr Gly Ala Glu Arg Gly Gln Tyr Leu Tyr Lys Thr Ala 65 70 75 80 gat atc atg gag cag cgc ttg gag gaa atc gcc gcc tgt gca acg cgt 288 Asp Ile Met Glu Gln Arg Leu Glu Glu Ile Ala Ala Cys Ala Thr Arg 85 90 95 gaa atg ggt aaa aca ttg ccg gaa gcg aag gga gaa aca gcc cgg ggg 336 Glu Met Gly Lys Thr Leu Pro Glu Ala Lys Gly Glu Thr Ala Arg Gly 100 105 110 att gcc att ctg cgc tat tac gcc gga gag ggc atg cga aaa acg ggt 384 Ile Ala Ile Leu Arg Tyr Tyr Ala Gly Glu Gly Met Arg Lys Thr Gly 115 120 125 gac gtc att ccg tct act gac aaa gac gcg ctc atg ttt acc acc cgt 432 Asp Val Ile Pro Ser Thr Asp Lys Asp Ala Leu Met Phe Thr Thr Arg 130 135 140 gtt ccg ctc ggt gtg gtc ggt gtg att tct ccg tgg aac ttc cca gtg 480 Val Pro Leu Gly Val Val Gly Val Ile Ser Pro Trp Asn Phe Pro Val 145 150 155 160 gcg att ccg att tgg aaa atg gcg ccg gca ttg gta tac ggc aat acc 528 Ala Ile Pro Ile Trp Lys Met Ala Pro Ala Leu Val Tyr Gly Asn Thr 165 170 175 gtt gtc atc aaa ccg gcg aca gaa aca gct gtg aca tgc gcg aag atc 576 Val Val Ile Lys Pro Ala Thr Glu Thr Ala Val Thr Cys Ala Lys Ile 180 185 190 att gcc tgc ttt gag gaa gcg ggg ctc ccg gca ggg gtc atc aat ttg 624 Ile Ala Cys Phe Glu Glu Ala Gly Leu Pro Ala Gly Val Ile Asn Leu 195 200 205 gtg aca ggc ccg ggt tct gtt gtc ggg cag ggg ctt gct gag cat gac 672 Val Thr Gly Pro Gly Ser Val Val Gly Gln Gly Leu Ala Glu His Asp 210 215 220 ggt gta aac gcc gtt acg ttt acc ggt tca aat caa gtc gga aaa atc 720 Gly Val Asn Ala Val Thr Phe Thr Gly Ser Asn Gln Val Gly Lys Ile 225 230 235 240 atc ggg caa gcc gct tta gcg agg gga gcc aaa tat cag ctt gag atg 768 Ile Gly Gln Ala Ala Leu Ala Arg Gly Ala Lys Tyr Gln Leu Glu Met 245 250 255 ggc ggc aaa aac cct gtc atc gta gct gat gac gct gac ctt gaa gct 816 Gly Gly Lys Asn Pro Val Ile Val Ala Asp Asp Ala Asp Leu Glu Ala 260 265 270 gcg gca gaa gct gtc ata acg ggg gcc ttc cgt tca acc ggc cag aaa 864 Ala Ala Glu Ala Val Ile Thr Gly Ala Phe Arg Ser Thr Gly Gln Lys 275 280 285 tgc acc gcg aca agc cgt gtc atc gta caa agc gga att tac gag cgc 912 Cys Thr Ala Thr Ser Arg Val Ile Val Gln Ser Gly Ile Tyr Glu Arg 290 295 300 ttt aaa gaa aaa ctg ctc cag cgc aca aaa gat att aca atc gga gac 960 Phe Lys Glu Lys Leu Leu Gln Arg Thr Lys Asp Ile Thr Ile Gly Asp 305 310 315 320 agc tta aaa gag gat gtc tgg atg gga ccg ata gcc agc aag aat cag 1008 Ser Leu Lys Glu Asp Val Trp Met Gly Pro Ile Ala Ser Lys Asn Gln 325 330 335 ctt gat aac tgc ctg tca tac att gag aaa ggc aaa cag gag ggc gct 1056 Leu Asp Asn Cys Leu Ser Tyr Ile Glu Lys Gly Lys Gln Glu Gly Ala 340 345 350 tcc ctt tta ata gga gga gaa aag ctg gag aac gga aag tat caa aac 1104 Ser Leu Leu Ile Gly Gly Glu Lys Leu Glu Asn Gly Lys Tyr Gln Asn 355 360 365 ggc tat tat gtt cag cct gcc atc ttt gac aat gtg aca tct gag atg 1152 Gly Tyr Tyr Val Gln Pro Ala Ile Phe Asp Asn Val Thr Ser Glu Met 370 375 380 aca att gcc cag gag gaa att ttc ggt ccg gtg atc gcc ttg atc aag 1200 Thr Ile Ala Gln Glu Glu Ile Phe Gly Pro Val Ile Ala Leu Ile Lys 385 390 395 400 gtg gac tcg ata gag gag gcg ctg aac atc gcc aat gat gtg aag ttc 1248 Val Asp Ser Ile Glu Glu Ala Leu Asn Ile Ala Asn Asp Val Lys Phe 405 410 415 ggt tta agt gca tcc atc ttc acg gaa aac atc ggc cga atg ctt tct 1296 Gly Leu Ser Ala Ser Ile Phe Thr Glu Asn Ile Gly Arg Met Leu Ser 420 425 430 ttc att gat gaa atc gat gcc ggg ctg gtt cgg atc aat gca gaa agc 1344 Phe Ile Asp Glu Ile Asp Ala Gly Leu Val Arg Ile Asn Ala Glu Ser 435 440 445 gca ggt gtt gag ctg cag gcg cct ttt ggc ggc atg aag cag tcg agc 1392 Ala Gly Val Glu Leu Gln Ala Pro Phe Gly Gly Met Lys Gln Ser Ser 450 455 460 tcc cac tcc cga gaa cag ggt gag gca gcg aag gac ttt ttc aca gcg 1440 Ser His Ser Arg Glu Gln Gly Glu Ala Ala Lys Asp Phe Phe Thr Ala 465 470 475 480 atc aaa act gtt ttt gtg aag ccg taa 1467 Ile Lys Thr Val Phe Val Lys Pro 485 <210> 110 <211> 488 <212> PRT <213> Bacillus subtilis <400> 110 Met Ser Val Ile Thr Glu Gln Asn Thr Tyr Leu Asn Phe Ile Asn Gly 1 5 10 15 Glu Trp Val Lys Ser Gln Ser Gly Asp Met Val Lys Val Glu Asn Pro 20 25 30 Ala Asp Val Asn Asp Ile Val Gly Tyr Val Gln Asn Ser Thr Ala Glu 35 40 45 Asp Val Glu Arg Ala Val Thr Ala Ala Asn Glu Ala Lys Thr Ala Trp 50 55 60 Arg Lys Leu Thr Gly Ala Glu Arg Gly Gln Tyr Leu Tyr Lys Thr Ala 65 70 75 80 Asp Ile Met Glu Gln Arg Leu Glu Glu Ile Ala Ala Cys Ala Thr Arg 85 90 95 Glu Met Gly Lys Thr Leu Pro Glu Ala Lys Gly Glu Thr Ala Arg Gly 100 105 110 Ile Ala Ile Leu Arg Tyr Tyr Ala Gly Glu Gly Met Arg Lys Thr Gly 115 120 125 Asp Val Ile Pro Ser Thr Asp Lys Asp Ala Leu Met Phe Thr Thr Arg 130 135 140 Val Pro Leu Gly Val Val Gly Val Ile Ser Pro Trp Asn Phe Pro Val 145 150 155 160 Ala Ile Pro Ile Trp Lys Met Ala Pro Ala Leu Val Tyr Gly Asn Thr 165 170 175 Val Val Ile Lys Pro Ala Thr Glu Thr Ala Val Thr Cys Ala Lys Ile 180 185 190 Ile Ala Cys Phe Glu Glu Ala Gly Leu Pro Ala Gly Val Ile Asn Leu 195 200 205 Val Thr Gly Pro Gly Ser Val Val Gly Gln Gly Leu Ala Glu His Asp 210 215 220 Gly Val Asn Ala Val Thr Phe Thr Gly Ser Asn Gln Val Gly Lys Ile 225 230 235 240 Ile Gly Gln Ala Ala Leu Ala Arg Gly Ala Lys Tyr Gln Leu Glu Met 245 250 255 Gly Gly Lys Asn Pro Val Ile Val Ala Asp Asp Ala Asp Leu Glu Ala 260 265 270 Ala Ala Glu Ala Val Ile Thr Gly Ala Phe Arg Ser Thr Gly Gln Lys 275 280 285 Cys Thr Ala Thr Ser Arg Val Ile Val Gln Ser Gly Ile Tyr Glu Arg 290 295 300 Phe Lys Glu Lys Leu Leu Gln Arg Thr Lys Asp Ile Thr Ile Gly Asp 305 310 315 320 Ser Leu Lys Glu Asp Val Trp Met Gly Pro Ile Ala Ser Lys Asn Gln 325 330 335 Leu Asp Asn Cys Leu Ser Tyr Ile Glu Lys Gly Lys Gln Glu Gly Ala 340 345 350 Ser Leu Leu Ile Gly Gly Glu Lys Leu Glu Asn Gly Lys Tyr Gln Asn 355 360 365 Gly Tyr Tyr Val Gln Pro Ala Ile Phe Asp Asn Val Thr Ser Glu Met 370 375 380 Thr Ile Ala Gln Glu Glu Ile Phe Gly Pro Val Ile Ala Leu Ile Lys 385 390 395 400 Val Asp Ser Ile Glu Glu Ala Leu Asn Ile Ala Asn Asp Val Lys Phe 405 410 415 Gly Leu Ser Ala Ser Ile Phe Thr Glu Asn Ile Gly Arg Met Leu Ser 420 425 430 Phe Ile Asp Glu Ile Asp Ala Gly Leu Val Arg Ile Asn Ala Glu Ser 435 440 445 Ala Gly Val Glu Leu Gln Ala Pro Phe Gly Gly Met Lys Gln Ser Ser 450 455 460 Ser His Ser Arg Glu Gln Gly Glu Ala Ala Lys Asp Phe Phe Thr Ala 465 470 475 480 Ile Lys Thr Val Phe Val Lys Pro 485 <210> 111 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer Ptac_xylXABC_F <400> 111 tgcgaagggc cttcggagcg atccggaggc 30 <210> 112 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer Ptac_xylXABC_R <400> 112 cgaaggccct tcgcattaga catggcggac ctcatg 36 <210> 113 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer Ptac_xylABCD_F <400> 113 caatttcaca caggaggatg accgacaccc tgcgcc 36 <210> 114 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer Ptac_xylABCD_R <400> 114 cctcctgtgt gaaattgtta tccgctcacg 30 <210> 115 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer Ptac_xylXBCD_F <400> 115 cgaaagcttc ccgcgatgtc ctcagccatc tatcc 35 <210> 116 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer Ptac_xylXBCD_R <400> 116 cgcgggaagc tttcgattag aggaggccgc 30 <210> 117 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer yjhG_F <400> 117 cacaaggaga ctcccatgtc tgttcgcaat atttttg 37 <210> 118 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer yjhG_R <400> 118 gaactggcgg ctccctcagt ttttattcat aaaatc 36 <210> 119 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer yagF_F <400> 119 cacaaggaga ctcccatgac cattgagaaa attttc 36 <210> 120 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer yagF_R <400> 120 gaactggcgg ctcccttaaa ttccgagcgc ttttttac 38

Claims

목적 물질을 생산하는 능력을 갖는 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여, 목적 물질을 당해 배지 중에 생성 축적시키고, 당해 배지로부터 목적 물질을 채취하는, 목적 물질의 제조 방법으로서,
상기 목적 물질은 2-케토글루타르산 또는 이의 유도체이고,
상기 세균은, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 것을 특징으로 하는 방법.
제1항에 있어서, 상기 세균은, 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제를 각각 코드화하는 유전자가 발현 가능한 형태로 도입됨으로써, 이들 효소 활성이 부여 또는 증강된 것을 특징으로 하는, 방법.
제1항 또는 제2항에 있어서, 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제를 코드화하는 유전자가 카울로박터(Caulobacter)속, 에스케리키아(Escherichia)속, 아그로박테리움(Agrobacterium)속, 헤르바스피릴룸(Herbaspirillum)속, 악티노플라네스(Actinoplanes)속, 쿠프리아비두스(Cupriavidus)속, 슈도모나스(Pseudomonas)속, 조벨리아(Zobellia), 써모바실루스(Thermobacillus)속, 아스로박터(Arthrobacter)속, 아조스피릴리움(Azospirillum)속, 할로모나스(Halomonas)속, 바실루스(Bacillus)속, 또는 아스페르길루스(Aspergillus)속에 속하는 미생물 유래인, 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 세균은, 하기 중 어느 하나에 의해 크실로스로부터 크실론산을 생성할 수 있는 것을 특징으로 하는, 방법:
(A) 크실로스데히드로게나제 활성, 또는 크실로스데히드로게나제 및 크실로노락토나제 활성을 부여 또는 증강시킴, 또는,
(B) 크실로스로부터 크실론산을 생성하는 반응을 촉매할 수 있는 글루코스데히드로게나제 활성을 가짐.
제4항에 있어서, 상기 글루코스데히드로게나제는 피롤로퀴놀린퀴논을 조효소로 하고, 또한, 상기 세균은, 피롤로퀴놀린퀴논 생산능을 갖거나, 또는 피롤로퀴놀린퀴논을 함유하는 배지에서 배양됨으로써 글루코스데히드로게나제 활성을 갖는, 방법.
제4항에 있어서, 상기 세균은, 크실로스데히드로게나제, 또는 크실로스데히드로게나제 및 크실로노락토나제를 각각 코드화하는 유전자가 발현 가능한 형태로 도입됨으로써, 크실로스로부터 크실론산을 생성할 수 있는, 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 세균은, 2-케토글루타르산데히드로게나제의 활성이 저하되도록 추가로 개변(改變)된 것을 특징으로 하는, 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 세균은, 석신산데히드로게나제의 활성이 저하되도록 추가로 개변된 것을 특징으로 하는, 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 세균이 장내 세균 또는 코리네형(coryneform) 세균인 것을 특징으로 하는, 방법.
제9항에 있어서, 상기 세균이 판토에아(Pantoea)속 세균인 것을 특징으로 하는, 방법.
제10항에 있어서, 상기 세균이 판토에아·아나나티스(Pantoea ananatis)인 것을 특징으로 하는, 방법.
제9항에 있어서, 상기 세균이 에스케리키아(Escherichia)속 세균인 것을 특징으로 하는, 방법.
제12항에 있어서, 상기 세균이 에스케리키아·콜라이(Escherichia coli)인 것을 특징으로 하는, 방법.
제9항에 있어서, 상기 세균이 코리네박테리움(Corynebacterium)속 세균인 것을 특징으로 하는, 방법.
제14항에 있어서, 상기 세균이 코리네박테리움·글루타미쿰(Corynebacterium glutamicum)인 것을 특징으로 하는, 방법.
제1항 내지 제15항 중 어느 한 항에 있어서, 상기 2-케토글루타르산 유도체가, L-글루탐산, L-글루타민, L-아르기닌, L-시트룰린, L-오르니틴, L-프롤린, 푸트레신, 및 γ-아미노부티르산으로 이루어지는 그룹으로부터 선택되는 물질인, 방법.