KR100704072B1

KR100704072B1 - 개선된 이소프레노이드 제조 방법

Info

Publication number: KR100704072B1
Application number: KR1020037015938A
Authority: KR
Inventors: 베리알란; 브레첼베르너; 후엠벨린마르쿠스; 로페즈-울리바리루알; 메이어앤프랑코이제; 옐리시브알렉세이
Original assignee: 디에스엠 아이피 어셋츠 비.브이.
Priority date: 2001-06-06
Filing date: 2002-06-05
Publication date: 2007-04-05
Also published as: EP1392824A2; CA2449885A1; KR20040010683A; WO2002099095A2; EP1392824B1; JP4280627B2; JP2004527265A; US6989257B2; US7232679B2; US20030148416A1; CN1630718A; AU2002316966B2; ATE405638T1; ES2311613T3; WO2002099095A3; US20050266518A1; DE60228439D1

Abstract

카로티노이드, 예를 들면, 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논 및 아도니루빈과 같은 이소프레노이드 화합물을 재조합에 의해 생산하는데 유용한, 메발로네이트 경로에 관여하는 효소들, 예를 들면, 하이드록시메틸글루타릴-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, 하이드록시메틸글루타릴-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는 폴리펩타이드를 암호화하는 단리된 폴리뉴클레오타이드를 제공한다. 이소프레노이드 화합물을 제조하기 위한 발현 벡터, 배양 세포 및 방법도 또한 제공한다.

Description

개선된 이소프레노이드 제조 방법{IMPROVED ISOPRENOID PRODUCTION}

본 발명은 이소프레노이드 생합성 경로에 유용한 신규 폴리뉴클레오타이드 및 폴리펩타이드 서열에 관한 것이다. 보다 특히, 본 발명은 개선된 제아잔틴 생성을 나타내는, 재조합에 의해 제조된 세포를 제공한다. 상기 세포계를 제조하고 이용하는 방법도 또한 제공한다.

카로티노이드는 인간을 위한 영양 보충제, 의약품 및 식용 착색제로 사용되며 동물 사료용 안료로 사용되는 상업적으로 중요한 C-40 이소프레노이드 화합물이다. 현재 산업적으로 중요한 카로티노이드는 주로 화학 합성(β-카로틴, 칸타잔틴 및 아스타잔틴)에 의해 또는 천연 공급원으로부터 추출(매리골드로부터 루테인 및 파프리카로부터 캡산틴)함으로써 생산된다. 그러나, 일부 경우에서는 미생물을 이용하여 카로티노이드를 생산하였다. 예를 들면, 진균인 블라케슬레아 트리스포라(Blakeslea trispora)를 이용한 발효(US 5,328,845), 또는 내염성(halotolerant) 조류인 듀날리엘라 살리나(Dunaliella salina)를 이용한 지중 배양(pond culture)[Borowitzka, J. Biotechnol., 70:313-321, 1999]에 의해 β-카로틴을 제조한다. 블라케슬레아 트리스포라에서 라이코펜을 제조하는 방법도 또한 보고되었다(WO 00/77234). 아스타잔틴은 효모[파피아 로도지마(Phaffia rhodozyma), 최근에 잔토필로마이세스 덴도로우스(Xanthophyllomyces dendorous)로 개명됨)]를 이용한 발효(US 6,015,684)에 의해, 또는 광생물반응기에서, 또는 조류인 헤마토코커스 플루비알리스(Haematococcus pluvialis)를 이용한 개방된 지중 배양[Lorenz and Cysewski, Trends Biotechnol., 18:160-167, 1999; Olaizola, J. Appl. Phycol., 12:499-506, 2000]에 의해 제조한다. 그러나, 상기 미생물 생산 시스템은 경제적인 산업 규모 생산에 충분한 양의 카로티노이드를 생산하지 못한다.

1960년대 중반에, 호프만-라 로슈(Hoffmann-La Roche)의 과학자들은, 가금류의 착색 및 인간에서 노화-관련 변성 반점의 예방에 용도를 갖는 황색 카로티노이드 제아잔틴을 생성하는 여러 해양 세균을 단리하였다. 유망한 제아잔틴 생성 수준을 나타낸 한 세균은 R-1512의 균주 호칭을 받았으며, 미국 종균 협회(American Type Culture Collection, ATCC, 미국 버지니아주 매너새스 소재)에 균주 ATCC 21588로 기탁되었다(US 3,891,504). 그 당시의 승인된 분류 기준(아이드게뇌시쉬 테크니쉬 호크슐레(Eidgenossische Technische Hochschule; 취리히 소재) 및 더 내셔날 콜렉션 오브 인더스트리얼 박테리아, 토리 리서치 스테이션(the National Collection of Industrial Bacteria, Torry Research Station; 스코틀랜드 에버딘 소재)에 의해 수행된 분류법)을 이용하여, 제아잔틴-생성 유기체는 플라보박테리움(Flavobacterium) 속의 일원으로 분류되었으나, 종의 명칭은 지정되 지 않았다.

광범위한 돌연변이유발 및 선별 프로그램을 연속하여 수행하여 더 높은 제아잔틴 생산성을 갖는 R-1512의 돌연변이체를 단리하였다. 현재 기술한 연구와 관련하여, 두 개의 상기 돌연변이체가 중요하다. 이들 돌연변이체는 제아잔틴 생산성 순서로 나열하자면 R1534 및 R114이다. 다양한 다른 돌연변이체들도 수년동안 카로티노이드 생합성의 생화학적 연구에 이용되었다[Goodwin, Biochem. Soc. Symp., 35:233-244, 1972; McDermott et al., Biochem. J., 134:1115-1117, 1973; Britton et al., Arch. Microbiol., 113:33-37, 1977; Mohanty et al., Helvetica Chimica Acta, 83:2036-2053, 2000].

균주 R-1512의 고전적으로 유도된 돌연변이체를 이용하여 제아잔틴을 생산하는 상업적으로 존속가능한 발효 방법을 개발하기 위한 초기 시도는 성공적이지 못했다. 그러나, 분자 생물학의 출현으로, 더 높은 제아잔틴-생산 균주를 개발할 수 있는 가능성이 생겼다. 상기 방법에서의 첫 단계는 균주 R1534(US 6,087,152 호; 본원에 전체로 인용되듯이 여기에 참고로 인용됨)로부터 카로티노이드 유전자 집단을 클로닝하고 서열분석함으로써 이루어졌다. US 6,087,152 호는 카로티노이드 유전자가 에스케리키아 콜라이(Escherichia coli) 및 바실러스 서브틸리스(Bacillus subtilis)에서 기능적으로 발현되어 상기 숙주들에서 제아잔틴 생산을 야기하였음을 개시하고 있다. US 6,087,152 호는 또한 카로티노이드 유전자 집단을 변형시키거나 또는 아스타잔틴 생성 세균으로부터 얻은 유전자를 부가함으로써 제아잔틴 이외의 다른 카로티노이드를 생산하는 것이 가능하였음을 개시하고 있다(EP 872,554). 게다가, EP 872,554 호는 다중-복제 플라스미드상에 클로닝된 카로티노이드 유전자 집단을 도입함으로써 균주 R1534에서 카로티노이드 생산이 증가되었음을 개시하고 있다.

이소프레노이드 화합물의 많은 구조적 다양성에도 불구하고, 상기 화합물은 모두 공통적인 C-5 전구체, 이소펜테닐 피로포스페이트(IPP)로부터 생합성된다. 1990년대 초기까지, 일부 실험 결과가 메발로이트 경로라고 하는 생물기원적 체계와 일치하지 않을지라도 IPP는 상기 메발로네이트 경로를 통해 모든 유기체에서 합성되는 것으로 일반적으로 용인되었다[Eisenreich et al., Chemistry and Biology, 5:R221-R233, 1998].

메발로네이트 경로:

상기 불일치는 그 이래로 IPP 생합성의 대체 경로인 데옥시자일룰로즈(DXP) 경로의 발견에 의해 조정되어 왔다(주: IPP 생합성의 대체 경로는 과학 문헌에서 다양한 명칭으로 지칭되어 왔다(DXP 경로, DOXP 경로, MEP 경로, GAP/피루베이트 경로 및 비-메발로네이트 경로). 본 발명자들은 본원에서 오직 간단히 하기 위해 DXP 경로란 명칭을 사용한다). DXP 경로의 처음 다섯가지 반응은 확인되었으나[Herz et al., Proc. Nat. Acad. Sci., 97:2486-2490, 2000], IPP의 생성을 유도하는 후속 단계들은 아직 밝혀지지 않았다.

DXP 경로:

맥더모트(McDermott) 등[Biochem. J., 134:1115-1117, 1973] 및 브리튼(Britton) 등[J. Chem. Soc. Chem. Comm., p.27, 1979]은 원래의 로슈 단리 균주로부터 유도된 제아잔틴 생성 돌연변이 균주의 조 추출물이 표지된 메발로네이트를 제아잔틴에 혼입시켰음을 밝혔다. 메발로네이트 경로를 통한 IPP 생합성에 대한 상기 증거를 문제삼을 이유는 없지만, 상기 연구는 DXP 경로를 발견하기 이전에 수행되었으며, 일부 세균(스트렙토마이세스(Streptomyces) 종)은 IPP 생합성에 두 경로를 모두 이용하며 상기 경로들의 발현은 일시적으로 조절되는 것으로 보고되었다[Seto et al., Tetrahedron Lett., 37:7979-7982, 1996; Dairi et al., Mol. Gen. Genet., 262:957-964, 2000]. 또한, 현재 단지 소수의 진성세균만이 IPP 합성을 위한 메발로네이트 경로를 갖는 것으로 밝혀졌다. 메발로네이트 경로의 효소들을 암호화하는 유전자는 일부 상기 세균들로부터 클로닝하고 서열분석하였다[Wilding et al., J. Bacteriol., 182:4319-4327, 2000; Takagi et al., J. Bacteriol., 182:4153-4157, 2000].

미생물에서의 카로티노이드 생산을 변화시키거나 개선시키는데 대사 공학을 적용하여 성공한 여러 예들이 존재한다[Lagarde et al., Appl. Env. Microbiol., 66:64-72, 2000; Wang et al., Biotechnol. Bioeng., 62:235-241, 1999; Wang et al., Biotechnol. Prog., 16:922-926, 2000(및 상기 문헌중의 참조문헌들); Sandmann et al., Trends Biotechnol., 17:233-237, 2000; Misawa and Shimada, J. Biotechnol., 59:169-181, 1998; Matthews and Wurtzel, Appl. Microbiol. Biotechnol., 53:396-400, 2000; Albrecht et al., Nature Biotechnol., 18:843-846, 2000; Schmidt-Dannert et al., Nature Biotechnol., 18:750-753, 2000]. 예를 들면, 비-카로티노겐(non-carotenogenic) 세균인 이. 콜라이(E. coli)를 공학처리하여 세균인 아그로박테리움 오란티아컴(Agrobacterium aurantiacum), 에르위니아 허비콜라(Erwinia herbicola) 또는 에르위니아 우레도보라(Erwinia uredovora)로부터 클로닝된 카로티노이드(crt) 유전자를 도입하여 카로티노이드를 생산할 수 있다[Misawa and Shimada, J. Biotechnol., 59:169-181, 1998]. 하커와 브램리(Harker and Bramley)[FEBS Lett., 448:115-119, 1999] 및 매튜와 우르첼(Matthews and Wurtzel)[J. Biotechnol., 59:169-181, 1998]은 상기 공학처리된 이. 콜라이 균주에서의 카로티노이드 생산이 DXP 경로(이. 콜라이는 이소프레노이드 생합성에 DXP 경로만을 이용하며 메발로네이트 경로는 이용하지 않는다[Lange et al., Proc. Nat. Acad. Sci., 97:13172-13177, 2000])의 첫 번째 효소인 1-데옥시-D-자일룰로즈 5-포스페이트 신타제(DXPS)를 암호화하는 유전자를 과발현시킴으로써 증가될 수 있음을 개시하였다. 하커 및 브램리[FEBS Lett., 448:115-119, 1999]는 또한 DXPS를 과생산하는 세포에서 이소프레노이드 화합물인 유비퀴논-8의 증가를 개시하였다. 이러한 결과들은 DXPS의 불충분한 생체내 활성으로부터 비롯된 IPP의 제한된 유용성이 공학처리된 균주에서의 카로티노이드 및 다른 이소프레노이드 화합물의 생산을 제한한다는 가설을 뒷받침하였다. 킴 및 키즐링(Kim and Keasling)[Biotechnol. Bioeng., 72:408-415, 2001]은, 유사한 이. 콜라이 시스템을 이용하여, DXPS 및 DXP 경로의 두 번째 효소인 DXP 리덕토이소머라제(1-데옥시-D-자일룰로즈-5-포스페이트 리덕토이소머라제)를 암호화하는 유전자들의 과발현이 합쳐져 DXPS를 암호화하는 유전자만의 과발현보다 더 많은 카로티노이드를 생산하였음을 개시하였다.

상기 연구들은 모두 카로티노이드를 생산하도록 공학처리된 이. 콜라이에서 수행하였다. 따라서, 상기 연구들의 한가지 단점은 상기 재조합 이. 콜라이 균주들에 의해 생산된 카로티노이드의 양이 카로티노이드의 산업적 생산에 사용된 비-재조합 미생물에 의해 생산된 양에 비해 매우 적다는 것이다. 또한, IPP 생합성 경로의 유전 공학처리에 의한 세균에서의 개선된 카로티노이드 생산은 IPP 생성에 DXP 경로를 이용하는 유기체에서만 나타났다. 메발로네이트 경로를 통해 IPP를 생성하는 세균에 대해서는 유사한 연구가 보고된 바가 없다.

효모에서 이소프레노이드 화합물의 생산을 개선하기 위해 메발로네이트 경로를 대사 공학처리한 것이 보고된 바 있다. 예를 들면, WO 00/01649 호는 3-하이드록시-3-메틸글루타릴 조효소 A 리덕타제(HMG-CoA 리덕타제)를 암호화하는 유전자가 과발현되는 경우 사카로마이세스 세레비지에(Saccharomyces cerevisiae)에서 이소프레노이드 화합물의 생산이 증가됨을 개시하였다. 그러나, 상기 방법이 세균에서의 이소프레노이드 생산을 개선하는지는 밝히지 않았으며, 특히, 메발로네이트 경로에 유전자들의 발현을 증폭시킴으로써 세균에서의 카로티노이드 생산이 향상될 수 있는지는 밝히지 않았다. 진핵생물로부터[Campos et al., Biochem. J., 353:59-67, 2001] 및 세균 스트렙토마이세스속 균주 CL190으로부터[Takagi et al., J. Bacteriol., 182:4153-4157, 2000] 몇몇 메발로네이트 경로 유전자들을 이. 콜라이에서 발현시킬 수 있음은 밝혔지만, 균주들에서 이소프레노이드 생산의 증가는 기록하지 않았다.

IPP를 생성하는 반응(DXP 또는 메발로네이트 경로를 통해) 및 파네실 피로포스페이트(FPP)를 다양한 다른 이소프레노이드(예를 들면, 카로티노이드, 퀴논)로 전환시키는 반응 이외에, 다른 두 반응이 이소프레노이드 생합성에 수반되는 것으로 알려져 있다. IPP 이소머라제는 IPP와 그의 이성체인 디메틸알릴 피로포스페이트(DMAPP)를 상호전환시킨다. 두 형태의 IPP 이소머라제가 존재하는데, 1형 효소 는 진핵생물 및 일부 세균에서 공지되어 있고 새로 동정된 2형 효소는 FMN- 및 NADP(H)-의존성이다[Kaneda et al., Proc. Nat. Acad. Sci., 98:932-937, 2001].

여러 보고서들이 카로티노이드를 생산하도록 공학처리된 이. 콜라이에서 천연 또는 이종 1형 IPP 이소머라제(idi) 유전자를 증폭시키면 카로티노이드 생산이 자극됨을 개시하고 있다[Kajiwara et al., Biochem. J., 324:421-426, 1997; Verdoes and van Ooyen, Acta Bot. Gallica, 146:43-53, 1999; Wang et al., Biotechnol. Bioeng., 62:235-241, 1999]. 한 보고서[Wang et al., Biotechnol. Bioeng., 62:235-241, 1999]에서는, FPP 신타제(파네실 디포스페이트 신타제)를 암호화하는 ispA 유전자의 과발현이 idi 및 crtE(GGPP 신타제/제라닐-제라닐 디포스페이트 신타제) 유전자의 과발현과 결합될 경우 이. 콜라이의 공학처리된 카로티노겐(crotenogenic) 균주에서 카로티노이드 생산을 증가시켰음을 또한 개시하였다. 그러나, IPP 생합성 경로의 경우와 같이, IPP 이소머라제 또는 PFF 신타제를 암호화하는 유전자의 과발현이 천연 카로티노겐 미생물에서 카로티노이드의 생산을 향상시키는 지는 나타내지 않았다. 또한, 전술한 이. 콜라이 균주에서 생산된 카로티노이드의 수준은 매우 낮고, 상기 방법이 카로티노이드 생산량이 이미 높은 산업적 미생물에서 잘 적용되는지는 나타내지 않았다.

요컨대, 메발로네이트 경로의 효소들을 암호화하는 유전자(들)의 증가된 발현이 천연 카로티노겐 세균 또는 카로티노겐성이 되도록 공학처리된 천연 비-카로티노겐 세균에서 카로티노이드의 생산을 개선시킬 수 있다는 증거가 이전에는 없었다.

본 발명의 한 태양은 다음 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드이다:

(a) 서열번호: 43의 잔기 1 내지 340으로 나타낸 아미노산 서열;

(b) 서열번호: 45의 잔기 1 내지 349로 나타낸 아미노산 서열;

(c) 서열번호: 47의 잔기 1 내지 388로 나타낸 아미노산 서열;

(d) 서열번호: 49의 잔기 1 내지 378로 나타낸 아미노산 서열;

(e) 서열번호: 51의 잔기 1 내지 305로 나타낸 아미노산 서열;

(f) 서열번호: 53의 잔기 1 내지 332로 나타낸 아미노산 서열;

(g) 30개 이상의 인접 아미노산 잔기를 갖는, 서열번호: 43, 45, 47, 49, 51 및 53으로 이루어진 그룹에서 선택된 아미노산 서열의 단편;

(h) HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, 하이드록시메틸글루타릴-CoA 신타제(HMG-CoA 신타제), 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제 활성을 갖는, 서열번호: 43, 45, 47, 49, 51 및 53으로 이루어진 그룹에서 선택된 폴리펩타이드 단편의 아미노산 서열;

(i) 엄격한 조건하에서 서열번호: 42 또는 서열번호: 42의 보체의 30개 이상의 연속 뉴클레오타이드를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화되는, HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는 폴리펩타이드의 아미노산 서열; 및

(j) 서열번호: 43, 45, 47, 49, 51 또는 53의 보존적으로 변형된 변이체.

상기에서 지적한 바와 같이, 본 발명은 메발로네이트 경로에 관여하는 하기 효소들 각각에 상응하는 폴리펩타이드 서열들인 서열번호: 43, 45, 47, 49, 51 및 53을 포함한다: 하이드록시메틸 글루타릴 CoA(HMG-CoA) 리덕타제, 이소펜테닐 디포스페이트(IPP) 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제. 본 발명은 또한 생물학적으로 활성인 분자를 정의하기 위한 각각의 동정된 서열의 30개 이상의 인접 아미노산 또는 충분한 수의 인접 아미노산을 포함한다.

본 발명은 또한 서열번호: 43, 45, 47, 49, 51 및 53으로부터 선택된 폴리펩타이드의 단편을 포함한다. 상기 단편은 길이가 약 30개 아미노산 이상이어야 하지만, 동정된 폴리펩타이드의 활성을 가져야 한다, 예를 들면, 서열번호: 43의 경우 본 발명의 범위에 속하는 그 단편은 HMG-CoA 리덕타제의 활성을 갖는다. 본원에서 사용된 바와 같이, 각각의 단편들의 활성 측정법을 실시예 1에 나타내었다. 실시예 1에 나타낸 분석에서 백그라운드보다 높은 활성을 갖는 단편을 생물학적으로 활성이며 본 발명의 범위에 속하는 것으로 간주한다.

본 발명은 또한 상기 정의한 바와 같이 엄격한 조건하에서 서열번호: 42(즉, 메발로네이트 오페론) 또는 서열번호: 42의 보체의 30개 이상의 인접 뉴클레오타이드를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화되는 폴리펩타이드의 아미노산 서열을 포함한다. 상기 폴리뉴클레오타이 드는 메발로네이트 경로에 관여하는 효소들 중 적어도 하나를 암호화해야 한다. 본 발명에 있어서, "하이브리드화 프로브"는 서열번호: 42의 약 10 내지 9066 뉴클레오타이드를 함유하는 폴리뉴클레오타이드 서열이다.

상기 태양에서, 단리된 폴리펩타이드는 서열번호: 43, 서열번호: 45, 서열번호: 47, 서열번호: 49, 서열번호: 51 또는 서열번호: 53의 아미노산 서열을 가질 수 있다. 또는, 단리된 폴리펩타이드는 다른 종으로부터 유래된 동일한 기능을 갖는 효소와 비교할 때 최소한의 동일성을 갖는 각각의 아미노산 서열들의 영역으로부터 선택된 약 30개의 인접 아미노산을 함유할 수 있다. 따라서, 예를 들면, 본 발명의 폴리펩타이드는 서열번호: 43의 68 내지 97번 아미노산, 서열번호: 45의 1 내지 30번 아미노산, 서열번호: 47의 269 내지 298번 아미노산, 서열번호: 49의 109 내지 138번 아미노산, 서열번호: 51의 198 내지 227번 아미노산 또는 서열번호: 53의 81 내지 110번 아미노산을 포함할 수 있다.

본 발명의 또 다른 태양은 다음에서 선택된 아미노산 서열을 갖는 단리된 폴리펩타이드이다: (a) 서열번호: 159의 잔기 1 내지 287로 나타낸 아미노산 서열; (b) 서열번호: 159의 30개 이상의 인접 아미노산 잔기; (c) 파네실-디포스페이트 신타제(FPP 신타제)의 활성을 갖는 서열번호: 159의 단편의 아미노산 서열; (d) 엄격한 조건하에서 ispA 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 157의 295 내지 1158 위치의 뉴클레오타이드) 또는 그의 보체를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된 폴리펩타이드의 아미노산 서열; 및 (e) 서열번호: 159의 보존적으로 변형된 변이체.

따라서, 상기 태양에서, 아미노산은 FPP 신타제를 암호화하는 전체 개방 해독틀, 즉, 서열번호: 159의 1 내지 287 잔기, 그의 30개 이상의 인접 잔기, 또는 실시예 1에 나타낸 분석법으로 측정할 때 FPP 신타제 활성을 갖는 서열번호: 159의 단편에 의해 암호화될 수 있다. 또한, 본 발명의 상기 태양은 상기 정의한 바와 같은 엄격한 조건하에서 ispA 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 157의 295 내지 1158 위치의 뉴클레오타이드) 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드(들)에 의해 암호화되는 아미노산 서열(들)을 또한 포함한다(이때, 상기 폴리펩타이드는 상기 정의한 바와 같은 FPP 신타제 활성을 갖는다).

바람직한 태양에서, 상기 폴리펩타이드는 서열번호: 159의 아미노산 서열을 갖는다.

본 발명의 또 다른 태양은 다음 그룹에서 선택된 아미노산 서열을 갖는 단리된 폴리펩타이드이다: (a) 서열번호: 160의 잔기 1 내지 142로 나타낸 아미노산 서열; (b) 서열번호: 160의 30개 이상의 인접 아미노산 잔기; (c) 1-데옥시자일룰로즈-5-포스페이트 신타제(DXPS)의 활성을 갖는 서열번호: 160의 단편의 아미노산 서열; (d) 엄격한 조건하에서 서열번호: 157의 1185 내지 1610 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, DXPS의 활성을 갖는 폴리펩타이드의 아미노산 서열; 및 (e) 서열번호: 160의 보존적으로 변형된 변이체.

따라서, 상기 태양에서, 아미노산은 DXPS를 암호화하는 전체 개방 해독틀, 즉, 서열번호: 160의 1 내지 142 잔기, 그의 30개 이상의 인접 잔기, 또는 실시예 1에 나타낸 분석법으로 측정할 때 DXPS 활성을 갖는 서열번호: 160의 단편에 의해 암호화될 수 있다. 또한, 본 발명의 상기 태양은 상기 정의한 바와 같은 엄격한 조건하에서 DXPS 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 157의 1185 내지 1610 위치의 뉴클레오타이드) 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드(들)에 의해 암호화되는 아미노산 서열(들)을 또한 포함한다(이때, 상기 폴리펩타이드는 상기 정의한 바와 같은 DXPS 활성을 갖는다).

바람직한 태양에서, 상기 폴리펩타이드는 서열번호: 160의 아미노산 서열을 갖는다.

본 발명의 또 다른 태양은 다음 그룹에서 선택된 아미노산 서열을 갖는 단리된 폴리펩타이드이다: (a) 서열번호: 178의 잔기 1 내지 390으로 나타낸 아미노산 서열; (b) 서열번호: 178의 30개 이상의 인접 아미노산 잔기; (c) 아세틸-CoA 아세틸트랜스퍼라제의 활성을 갖는 서열번호: 178의 단편의 아미노산 서열; (d) 엄격한 조건하에서 phaA 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 177의 1 내지 1179 위치의 뉴클레오타이드) 또는 그의 보체를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화되는, 아세틸-CoA 아세틸트랜스퍼라제의 활성을 갖는 폴리펩타이드의 아미노산 서열; 및 (e) 서열번호: 178의 보존적으로 변형된 변이체.

따라서, 상기 태양에서, 아미노산은 아세틸-CoA 아세틸트랜스퍼라제를 암호 화하는 전체 개방 해독틀, 즉, 서열번호: 178의 1 내지 143 잔기, 그의 30개 이상의 인접 잔기, 또는 실시예 1에 나타낸 분석법으로 측정할 때 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 서열번호: 178의 단편에 의해 암호화될 수 있다. 또한, 본 발명의 상기 태양은 상기 정의한 바와 같은 엄격한 조건하에서 phaA 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 177의 1 내지 1170 위치의 뉴클레오타이드) 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드(들)에 의해 암호화되는 아미노산 서열(들)을 또한 포함한다(이때, 상기 폴리펩타이드는 상기 정의한 바와 같은 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는다).

바람직한 태양에서, 상기 폴리펩타이드는 서열번호: 178의 아미노산 서열을 갖는다.

본 발명의 또 다른 태양은 다음에서 선택된 아미노산 서열을 갖는 단리된 폴리펩타이드이다: (a) 서열번호: 179의 잔기 1 내지 240으로 나타낸 아미노산 서열; (b) 서열번호: 179의 30개 이상의 인접 아미노산 잔기; (c) 아세토아세틸-CoA 리덕타제의 활성을 갖는 서열번호: 179의 폴리펩타이드 단편의 아미노산 서열; (d) 엄격한 조건하에서 phaB 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 177의 1258 내지 1980 위치의 뉴클레오타이드) 또는 그의 보체를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화되는, 아세토아세틸-CoA 리덕타제의 활성을 갖는 폴리펩타이드의 아미노산 서열; 및 (e) 서열번호: 179의 보존적으로 변형된 변이체.

따라서, 상기 태양에서, 아미노산은 아세토아세틸-CoA 리덕타제를 암호화하는 전체 개방 해독틀, 즉, 서열번호: 179의 1 내지 240 잔기, 그의 30개 이상의 인접 잔기, 또는 실시예 1에 나타낸 분석법으로 측정할 때 아세토아세틸-CoA 리덕타제 활성을 갖는 서열번호: 179의 단편에 의해 암호화될 수 있다. 또한, 본 발명의 상기 태양은 상기 정의한 바와 같은 엄격한 조건하에서 phaB 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 177의 1258 내지 1980 위치의 뉴클레오타이드) 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드(들)에 의해 암호화되는 아미노산 서열(들)을 또한 포함한다(이때, 상기 폴리펩타이드는 상기 정의한 바와 같은 아세토아세틸-CoA 리덕타제 활성을 갖는다).

바람직한 태양에서, 상기 폴리펩타이드는 서열번호: 179의 아미노산 서열을 갖는다.

용어 "폴리펩타이드", "폴리펩타이드 서열", "아미노산" 및 "아미노산 서열"은 본원에서 상호교환가능하게 사용되며, 올리고펩타이드, 펩타이드, 폴리펩타이드 또는 단백질 서열, 또는 이들 중 어느 하나의 단편, 및 천연 또는 합성 분자들을 의미한다. 이와 관련하여, "단편", "면역원 단편" 또는 "항원 단편"은 길이가 약 30개 아미노산 이상이고 해당 폴리펩타이드의 일부 생물 활성 또는 면역 활성을 보유하는, 본원에 정의된 임의의 폴리펩타이드의 단편을 말한다. 본원에서 "아미노산 서열"이 천연 단백질 분자의 아미노산 서열을 지칭하기 위해 인용되는 경우, "아미노산 서열" 및 유사 용어들은 아미노산 서열을 인용된 단백질 분자와 관련된 완전 천연 아미노산 서열로 한정하지 않는다.

폴리펩타이드와 관련하여, "단리된"이란 용어는 그의 천연 상태에서 그에 수반되는 성분들로부터 분리된 단백질 또는 폴리펩타이드를 의미한다. 단량체 단백질은 샘플의 약 60 내지 75% 이상이 단일 폴리펩타이드 서열을 나타낼 때 단리된 것이다. 단리된 단백질은 전형적으로 단백질 샘플의 약 60 내지 90%(w/w), 보다 통상적으로는 약 95%를 차지할 것이며, 바람직하게는 약 99% 순도를 초과할 것이다. 단백질 순도 또는 동종성은 당해 분야에 공지된 많은 방법들에 의해, 예를 들면, 단백질 샘플을 폴리아크릴아미드 겔 전기영동한 후, 겔 염색시 단일 폴리펩타이드 띠를 가시화시킴으로써 나타낼 수 있다. 특정 목적으로, HPLC 또는 당해 분야에 공지된 다른 방법을 이용하면 정제에 더 높은 분리능을 제공할 수 있다.

본원에서 사용한 바와 같이, "생물학적으로 활성인"이란 용어는 천연 분자의 구조, 조절 또는 생화학 기능을 갖는 단백질을 말한다. 마찬가지로, "면역적으로 활성인"이란 적절한 동물 또는 세포에서 특이적 면역 반응을 유도하고 특정 항체와 결합하는, 천연, 재조합 또는 합성 폴리펩타이드 또는 그의 임의의 올리고펩타이드의 능력을 말한다.

본 발명의 또 다른 태양은 메발로네이트 오페론의 뉴클레오타이드 서열(서열번호: 42), 파라코커스속(Paracoccus sp.) 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 42의 변이체 또는 서열번호: 42의 단편을 갖는 단리된 폴리뉴클레오타이드 서열이다. 서열번호: 42의 변이체 및 단편은 HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제 활성, 하이드록시메틸글루타릴-CoA 신타제(HMG-CoA 신타제), 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로부터 선택된 활성을 갖는 폴리펩타이드를 암호화해야 한다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 42의 약 10 내지 약 9066 뉴클레오타이드, 바람직하게는 서열번호: 42의 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로부터 선택된 활성을 갖는 폴리펩타이드를 암호화한다.

상기 태양은 또한, 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기에 존재하는 단리된 폴리뉴클레오타이드 서열을 포함한다. 상기 서열들의 단편들은 또한 이들이 HMG-CoA 리덕타제 활성, 이소펜테닐 디포스페이트 이소머라제 활성, HMG-CoA 신타제 활성, 메발로네이트 키나제 활성, 포스포메발로네이트 키나제 활성 및 디포스포메발로네이트 데카복실라제 활성 각각을 갖는 폴리펩타이드를 암호화하는 한 본 발명의 범위에 속한다.

상기 태양은 또한 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기의 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 뉴클레오타이드 서열로부터 선택된 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되 는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 HMG-CoA 리덕타제 활성, 이소펜테닐 디포스페이트 이소머라제 활성, HMG-CoA 신타제 활성, 메발로네이트 키나제 활성, 포스포메발로네이트 키나제 활성 또는 디포스포메발로네이트 데카복실라제 활성을 각각 갖는 폴리펩타이드를 암호화한다.

바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 뉴클레오타이드로 이루어진다.

본 발명의 또 다른 태양은 서열번호: 157의 뉴클레오타이드 서열, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 변이체, 또는 FPP 신타제 활성, 1-데옥시-D-자일룰로즈-5-포스페이트 신타제 활성 또는 XseB 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 단편을 갖는 단리된 폴리뉴클레오타이드 서열이다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 157의 30개 이상의 인접 뉴클레오타이드 또는 서열번호: 157의 보체로 이루어진 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 FPP 신타제 활성, 1-데옥시-D-자일룰로즈-5-포스페이트 신타제 활성 또는 XseB의 활성을 갖는 폴리펩타이드를 암호화한다.

바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 157의 59 내지 292, 295 내지 1158 또는 1185 내지 1610 뉴클레오타이드로 이루어진다.

다음 그룹에서 선택된 뉴클레오타이드 서열을 갖는 단리된 폴리뉴클레오타이 드 서열도 또한 제공된다: 서열번호: 157의 59 내지 292 위치에 존재하는 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 위치들에 존재하는 뉴클레오타이드 서열의 변이체; XseB의 기능을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 59 내지 292 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서 뉴클레오타이드 서열이 서열번호: 157의 59 내지 292 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드 서열(상기 폴리뉴클레오타이드는 XseB의 기능을 갖는 폴리펩타이드를 암호화한다).

바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 157의 59 내지 292 뉴클레오타이드로 이루어진다.

다음 그룹에서 선택된 뉴클레오타이드 서열을 갖는 단리된 폴리뉴클레오타이드 서열도 또한 제공된다: 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열의 변이체; FPP 신타제 활성을 암호화하는 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서 뉴클레오타이드 서열이 서열번호: 157의 295 내지 1158 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드 서열(상기 폴리뉴클레오타이드는 FPP 신타제 활성을 갖는 폴리 펩타이드를 암호화한다).

바람직하게, 상기 단리된 뉴클레오타이드 서열은 서열번호: 157의 295 내지 1158 뉴클레오타이드로 이루어진다.

본 발명의 또 다른 태양은 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열의 변이체, 또는 1-데옥시자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열의 단편을 갖는 단리된 폴리뉴클레오타이드 서열이다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 157의 1185 내지 1610 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 1-데옥시자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드를 암호화한다.

바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 157의 1185 내지 1610 뉴클레오타이드로 이루어진다.

본 발명의 또 다른 태양은 서열번호: 177의 뉴클레오타이드 서열, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체, 또는 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제로부터 선택된 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편을 갖는 단리된 폴리뉴클레오타이드 서열이다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 177의 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화한다.

상기 태양에서, 단리된 폴리뉴클레오타이드 서열은 서열번호: 177의 1 내지 1170 뉴클레오타이드, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체, 또는 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편을 포함할 수 있다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 177의 1 내지 1170 뉴클레오타이드의 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드를 암호화한다.

바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 177의 1 내지 1170 뉴클레오타이드로 이루어진다.

상기 태양에서, 단리된 폴리뉴클레오타이드 서열은 대안적으로 서열번호: 177의 1258 내지 1980 뉴클레오타이드, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체, 또는 아세 토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편일 수 있다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 177의 1258 내지 1980 뉴클레오타이드의 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화한다.

바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 177의 1258 내지 1980 뉴클레오타이드로 이루어진다.

본 발명의 또 다른 태양에서, 단리된 폴리뉴클레오타이드 서열은 서열번호: 42, 서열번호: 157, 서열번호: 177 및 그의 조합으로부터 선택된 뉴클레오타이드 서열을 갖는다. 본원에서 사용한 바와 같이, "및 그의 조합"이란 어구는 뉴클레오타이드 서열과 관련하여 사용될 때 인용된 서열들의 임의의 조합이 함께 단리된 폴리뉴클레오타이드 서열을 이룰 수 있음을 의미한다. 또한, 본 발명에서는, 동일한 서열의 다중 복제물, 즉, 콘카타머(concatamer)도 사용할 수 있다. 마찬가지로, 하기에 보다 상세히 나타낸 바와 같이, 동일한 폴리뉴클레오타이드 서열을 함유하는 플라스미드의 다중 복제물을 적합한 숙주 세포에 전달할 수 있다.

본원에서 사용한 바와 같이, "단리된" 폴리뉴클레오타이드(예를 들면, RNA, DNA 또는 혼합 중합체)는 실질적으로 천연 서열 또는 폴리펩타이드에 천연적으로 수반되는 다른 세포 성분, 예를 들면, 리보솜, 폴리머라제, 많은 다른 게놈 서열 및 단백질로부터 분리된 폴리뉴클레오타이드이다. 상기 용어는 그의 천연 환경에 서 제거된 폴리뉴클레오타이드를 포함하며, 재조합체 또는 클로닝된 DNA 단리물 및 화학 합성된 유사체 또는 이종 시스템에 의해 생물학적으로 합성된 유사체를 포함한다.

"핵산 서열"이란 어구는 5' 말단에서 3' 말단으로 해독된 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 염기의 단일 또는 이중-가닥 중합체를 말한다. 상기 어구는 염색체 DNA, 자가-복제 플라스미드, DNA 또는 RNA의 감염성 중합체 및 1차 구조적 역할을 수행하는 DNA 또는 RNA를 포함한다.

"발현 조절 서열"은 작용가능하게 연결된 핵산의 전사를 지배하는 핵산 조절 서열의 배열로 정의된다. 상기 발현 조절 서열의 한 예는 "프로모터"이다. 프로모터는 전사 개시 부위 부근에 필수 핵산 서열을 포함한다. 프로모터는 또한 임의로 전사 개시 부위로부터 수천개 염기쌍만큼 많이 위치할 수 있는 원위성 증강제 또는 억제제 요소를 포함한다. "구성성" 프로모터는 대부분의 환경 및 생육 조건하에서 활성인 프로모터이다. "유도성" 프로모터는 환경 또는 생육 조절하에서 활성인 프로모터이다. "작용가능하에 연결된"이란 용어는 핵산 발현 조절 서열(예를 들면, 프로모터, 또는 전사 인자 결합 부위의 배열) 및 제 2 핵산 서열간의 기능적 결합을 말하는 것으로, 이때 발현 조절 서열은 제 2 서열에 상응하는 핵산의 전사를 지배한다.

폴리뉴클레오타이드 서열은 상기 폴리뉴클레오타이드 서열이 외래 종으로부터 유래된 경우 유기체 또는 제 2 폴리뉴클레오타이드에 "이종"이거나, 또는 동일한 종으로부터 유래된 경우 상기 폴리뉴클레오타이드 서열은 그의 원래 형태로부터 변형된다. 예를 들면, 이종 암호화 서열에 작용가능하게 연결된 프로모터는 그로부터 프로모터가 유도되는 서열과 상이한 종으로부터 유래된 암호화 서열을 말하거나, 또는 동일한 종으로부터 유래한 경우, 임의의 천연 대립유전자 변이체와 상이한 암호화 서열을 말한다.

변형유전자(transgene)의 발현 및 내인성 유전자의 억제(예를 들면, 안티센스 또는 센스 억제에 의한) 두 가지 경우 모두에서, 숙련된 자라면 삽입된 폴리뉴클레오타이드 서열이 동일할 필요는 없지만, 단지 그로부터 서열이 유래되는 유전자의 서열에 "실질적으로 동일할" 수 있음을 인지할 것이다.

삽입된 폴리뉴클레오타이드 서열이 전사 및 번역되어 작용성 폴리펩타이드를 생산하는 경우, 숙련된 자라면 코돈 변성으로 인해 많은 폴리뉴클레오타이드 서열이 동일한 폴리펩타이드를 암호화할 것임을 인지할 것이다. 이러한 변이체들은 특히 본 발명의 범위 안에 든다. 또한, 본 발명은 특히 서로 실질적으로 동일하고(하기에 기술하는 바와 같이 측정), 야생형 폴리펩타이드의 돌연변이체이거나 폴리펩타이드의 기능을 보유(예를 들면, 폴리펩타이드 중 아미노산의 보존적 치환으로부터 비롯되는)하는 폴리펩타이드를 암호화하는 서열을 포함한다. 게다가, 변이체들은 하기에 기술하는 바와 같은 우세한 음성 돌연변이체를 암호화하는 것들일 수 있다.

두 핵산 서열 또는 폴리펩타이드는, 하기에 기술하는 바와 같이 최대 상응성에 대해 정렬될 때 두 서열들에서 뉴클레오타이드 또는 아미노산 잔기 각각의 서열이 동일한 경우 "동일"하다고 한다. 두 개 이상의 핵산 또는 폴리펩타이드 서열과 관련하여 "동일한" 또는 "동일성" 퍼센트란 용어는, 하기의 서열 비교 알고리듬중 하나를 이용하거나 또는 수동식 정렬 및 육안 검사에 의해 측정할 때, 비교창을 통해 최대 상응성에 대해 비교 및 정렬되는 경우, 동일하거나, 또는 특정 비율의 동일한 아미노산 잔기 또는 뉴클레오타이드를 갖는 둘 이상의 서열 또는 부분서열을 말한다. 서열 동일성 비율을 단백질 또는 펩타이드와 관련하여 사용하는 경우, 동일하지 않은 잔기 위치들은 종종 보존적 아미노산 치환에 의해 달라지는 것으로 인지되는데, 이때 상기 보존적 아미노산 치환에서는 아미노산 잔기들이 유사한 화학 성질(예를 들면, 전하 또는 소수성)을 갖는 다른 아미노산 잔기들로 치환되므로 분자의 작용성을 변화시키지 않는다. 서열들이 보존적 치환에서 상이한 경우, 서열 동일성 퍼센트는 치환의 보존성을 보정하기 위해 상향 조정될 수 있다. 상기 조정을 수행하는 방법은 당해 분야에 숙련된 자에게 공지되어 있다. 전형적으로, 상기 방법은 보존적 치환을 전체적으로 불일치시키기 보다는 부분적으로만 불일치하게 함으로써 서열 동일성 퍼센트를 증가시킴을 포함한다. 따라서, 예를 들면, 동일한 아미노산을 1의 스코어로 나타내고 비-보존성 치환을 제로(0)의 스코어로 나타내는 경우, 보존적 치환은 0 내지 1의 스코어로 나타낸다. 보존적 치환의 스코어는, 예를 들면, 문헌 [Meyers & Miller, Computer Applic. Biol. Sci., 4:11-17, 1988]의 알고리듬에 따라서, 예를 들면, 프로그램 PC/GENE(미국 캘리포니아주 마운틴 뷰 소재의 인텔리제네틱스(Intelligenetics))에서 실행된 바와 같이 계산한다.

두 개의 핵산 또는 폴리펩타이드와 관련하여, "실질적으로 동일한"이란 어구는 하기의 서열 비교 알고리듬중 하나를 이용하거나 또는 수동식 정렬 및 육안 검 사로 측정할 때 비교 창을 통해 최대 상응성에 대해 정렬되는 경우 60% 이상, 바람직하게는 80%, 가장 바람직하게는 90 내지 95%의 뉴클레오타이드 또는 아미노산 잔기 동일성을 갖는 서열 또는 부분서열을 말한다. 상기 정의는 또한 그 서열의 보체가 시험 서열에 하이브리드화되는 서열을 말한다.

서열 비교시, 전형적으로 하나의 서열은 그에 대해 시험 서열을 비교하는 기준 서열로 작용한다. 서열 비교 알고리듬을 이용하여 시험 및 기준 서열을 컴퓨터에 입력하는 경우, 필요하다면 부분서열 좌표를 표시하고 서열 알고리듬 프로그램 파라미터들을 지정한다. 디폴트(default) 프로그램 파라미터를 이용하거나 또는 대체 파라미터를 지정할 수 있다. 그 다음, 서열 비교 알고리듬은 프로그램 파라미터를 근거로 기준 서열에 대한 시험 서열의 서열 동일성 퍼센트를 계산한다.

본원에서 사용한 바와 같이, "비교창"은 20 내지 600, 통상적으로는 약 50 내지 약 200, 보다 통상적으로는 약 100 내지 약 150으로 이루어진 그룹에서 선택된 인접 위치들의 번호 중 어느 하나의 분절을 말하는 것으로, 여기서 서열은 두 서열들을 최적으로 정렬한 후 동일한 번호의 인접 위치들의 기준 서열에 비교할 수 있다. 비교를 위한 서열들의 정렬 방법은 당해 분야에 공지되어 있다. 비교를 위한 서열의 최적 정렬은, 예를 들면, 스미스 및 워터만(Smith and Waterman)의 국소적 상동성 알고리듬[Smith and Waterman, Adv. Appl. Math., 2:482, 1981]에 의해, 니들만 및 운쉬(Needleman and Wunsch)의 상동성 정렬 알고리듬[Needleman and Wunsch, J. Mol. Biol., 48:443, 1970]에 의해, 피어슨 및 립맨(Pearson and Lipman)의 유사성 방법에 대한 연구[Pearson and Lipman, Proc. Nat'l. Acad. Sci. USA, 85:2444, 1988]에 의해, 상기 알고리듬들의 컴퓨터 실행 프로그램(위스콘신주 매디슨 소재의 제네틱스 컴퓨터 그룹, 575 사이언스 닥터(Genetics Computer Group, 575 Science Dr.), 위스콘신 제네틱스 소프트웨어 패키지(Wisconsin Genetics Software Package)의 GAP, BESTFIT, FASTA 및 TFASTA)에 의해, 또는 수동식 정렬 및 육안 검사에 의해 수행할 수 있다.

유용한 알고리듬의 한 예는 파일업(PILEUP)이다. 파일업은 관계 및 서열 동일성 퍼센트를 보여주기 위해 점진적 쌍 정렬법을 이용하여 관련된 서열들의 그룹으로부터 다중 서열 정렬을 달성한다. 파일업은 또한 정렬을 달성하는데 이용된 집단화 관계를 보여주는 수형도 또는 수상도를 작성한다. 파일업은 펭 및 두리틀(Feng and Doolittle)의 점진적 정렬 방법의 단순화 방법을 이용한다[Feng and Doolittle, J. Mol. Evol., 35:351-360, 1987]. 사용된 방법은 히긴스와 샤프(Higgins and Sharp)가 기술한 방법과 유사하다[Higgins and Sharp, CABIOS 5:151-153, 1989]. 프로그램은 각각 5,000 뉴클레오타이드 또는 아미노산의 최대 길이를 갖는 300개 이하의 서열들을 정렬시킬 수 있다. 다중 정렬 방법은 두 개의 가장 유사한 서열의 쌍 정렬로 시작하여 정렬된 두 서열의 집단을 제공한다. 이어서, 상기 집단을 다음의 가장 연관된 서열 또는 정렬된 서열의 집단으로 정렬시킨다. 서열들의 두 집단은 두 개의 개별적 서열들의 쌍 정렬의 단순한 확장에 의해 정렬시킨다. 최종 정렬은 일련의 점진적인 쌍 정렬에 의해 달성된다. 프로그램은 서열 비교 영역들을 위한 특정 서열 및 그의 아미노산 또는 뉴클레오타이드 좌표를 표시하고 프로그램 파라미터를 지정함으로서 실행된다. 예를 들면, 다음의 파라미 터들을 이용하여 서열 동일성 퍼센트 관계를 측정할 다른 시험 서열과 기준 서열을 비교할 수 있다: 디폴트 간격 가중치(3.00), 디폴트 간격 길이 가중치(0.10) 및 가중된 말단 간격.

서열 동일성 퍼센트 및 서열 유사성을 측정하는데 적합한 알고리듬의 또 다른 예는 블라스트(BLAST) 알고리듬[Altschul et al., J. Mol. Biol., 215:403-410, 1990]이다. 블라스트 분석을 수행하기 위한 소프트웨어는 국립 바이오테크놀로지 정보 센터(National Center for Biotechnology Information; http://www.ncbi.nlm.nih. gov/)를 통해 공적으로 입수가능하다. 상기 알고리듬은 먼저, 데이터베이스 서열 중 동일 길이의 워드와 함께 정렬될 때 일치되거나 일부 양의 값의 임계치 스코어 T를 만족시키는 조회 서열 중 길이 W의 짧은 워드를 확인함으로써 높은 스코어 서열 쌍(HSP)을 확인함을 포함한다. T는 주위 워드 스코어 임계치로 지칭된다[Altschul et al., J. Mol. Biol., 215:403-410, 1990]. 상기 초기 주위 워드 히트는 이들을 포함하는 더 긴 HSP를 찾기 위한 탐색을 개시하기 위한 시드로 작용한다. 워드 히트는 누적 정렬 스코어가 증가될 수 있는 한 각각의 서열을 따라 양 방향으로 확장된다. 각 방향으로의 워드 히트의 확장은 다음과 같은 경우에 정지된다: 누적 정렬 스코어가 그 최대 달성값으로부터 X의 양만큼 떨어지는 경우; 누적 스코어가 하나 이상의 음의 스코어를 갖는 잔기 정렬의 누적으로 인해 0 이하가 되는 경우; 또는 어느 한 서열의 말단에 이르는 경우. 블라스트 알고리듬 파라미터 W, T 및 X는 정렬의 민감도 및 속도를 결정한다. 블라스트 프로그램은 디폴트로서 11의 워드길이(W), 50의 블로섬(BLOSUM)62 스코어 매트릭스( 문헌 [Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA, 89:10915, 1989] 참조) 정렬(B), 10의 기대값(E), M=5, N=-4 및 두 가닥의 비교를 이용한다.

블라스트 알고리듬은 또한 두 서열간의 유사성의 통계 분석을 수행한다(예를 들면, 문헌 [Karlin and Altschul, Proc. Nat'l. Acad. Sci. USA, 90:5873-5877, 1993] 참조). 블라스트 알고리듬에 의해 제공된 유사성의 한 측정법은 최소 합 확률(P(N))로서, 이것은 두 뉴클레오타이드 또는 아미노산 서열간의 일치가 우연히 일어날 확률의 지표를 제공한다. 예를 들면, 기준 핵산에 대한 시험 핵산의 비교시 최소 합 확률이 약 0.2 미만, 보다 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만인 경우, 핵산을 기준 서열과 유사한 것으로 간주한다.

"보존적으로 변형된 변이체"는 아미노산 및 핵산 서열 둘 다에 적용된다. 특정 핵산 서열과 관련하여, 보존적으로 변형된 변이체는 동일하거나 본질적으로 동일한 아미노산 서열을 암호화하는 핵산을 말하거나, 또는 핵산이 아미노산 서열을 암호화하지 않는 경우에는 필수적으로 동일한 서열을 말한다. 유전자 코드의 변성으로 인해, 많은 수의 기능상 동일한 핵산 코돈이 임의의 해당 단백질을 암호화한다. 예를 들면, 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산 알라닌을 암호화한다. 따라서, 코돈에 의해 알라닌이 규정되는 모든 위치에서, 코돈은 암호화된 폴리펩타이드를 변화시키지 않고 기술한 상응하는 코돈들 중 임의의 코돈으로 변형될 수 있다. 상기 핵산 변이는 보존적으로 변형된 변이의 한 종류인 "잠재성 변이"이다. 본원에서 폴리펩타이드를 암호화하는 모든 핵산 서열은 또한 핵산의 모든 가능한 잠재성 변이를 나타낸다. 숙련된 자라면 핵산의 각각의 코돈(AUG 제외, AUG 코돈은 통상적으로 메티오닌에 대한 유일한 코돈이다)이 변형되어 기능상 동일한 분자를 제공할 수 있음을 인지할 것이다. 따라서, 폴리펩타이드를 암호화하는 핵산의 각각의 잠재성 변이는 각각의 나타낸 서열에 내재한다.

아미노산 서열과 관련하여, 숙련된 자라면 핵산에 대한 개별적인 치환, 결실 또는 부가, 또는 암호화된 서열에서 단일 아미노산 또는 낮은 비율의 아미노산(즉, 20% 미만, 예를 들면, 15%, 10%, 5%, 4%, 3%, 2% 또는 1%)을 변형시키는 펩타이드, 폴리펩타이드 또는 단백질 서열에 대한 치환이, 변형에 의해 아미노산이 화학적으로 유사한 아미노산으로 치환되는 "보존적으로 변형된 변이"임을 인지할 것이다. 기능상 유사한 아미노산을 제공하는 보존적 치환 목록은 당해 분야에 공지되어 있다.

하기의 6개 그룹은 각각 서로 보존적 치환체인 아미노산들을 포함한다: 알라닌(A), 세린(S), 트레오닌(T); 아스파트산(D), 글루탐산(E); 아스파라진(N), 글루타민(Q); 아르기닌(R), 라이신(K); 이소류신(I), 류신(L), 메티오닌(M), 발린(V); 및 페닐알라닌(F), 티로신(Y), 트립토판(W)(예를 들면, 문헌 [Creighton, Proteins, 1984] 참조).

두 핵산 서열 또는 폴리펩타이드가 실질적으로 동일하다는 지적은 첫 번째 핵산에 의해 암호화된 폴리펩타이드가 제 2의 핵산에 의해 암호화된 폴리펩타이드에 대해 발생된 항체와 면역적으로 교차 반응성이라는 것이다. 따라서, 폴리펩타이드는 전형적으로, 예를 들면, 두 펩타이드가 보존적 치환에 의해서만 차이나는 경우, 실질적으로 제 2의 폴리펩타이드와 동일하다. 두 핵산 서열이 실질적으로 동일하다는 또 다른 지적은 두 분자 또는 그의 보체가 하기에 기술하는 바와 같은 엄격한 조건하에서 서로 하이브리드화된다는 것이다.

"특이적으로 하이브리드화된다"라는 어구는 서열이 복합 혼합물로 존재하는 경우(예를 들면, 전체 세포 또는 라이브러리 DNA 또는 RNA) 엄격한 하이브리드화 조건하에서 특정 뉴클레오타이드 서열에만 분자가 결합, 이중화 또는 하이브리드화되는 것을 말한다.

"엄격한 하이브리드화 조건"이란 어구는 프로브가 전형적으로 핵산 서열들의 복합 혼합물 중 그 표적 서열에는 하이브리드화되지만 다른 서열에는 하이브리화되지 않는 조건을 말한다. 엄격한 조건은 서열-의존성이며 다른 상황에서는 달라질 것이다. 더 긴 서열은 특이적으로 더 높은 온도에서 하이브리드화된다. 핵산의 하이브리드화에 대한 광범위한 지침을 문헌 [Tijssen, Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Probes, "Overview of Principles of Hybridization and the Strategy of Nucleic Acid Assays", 1993]에서 찾을 수 있다. 일반적으로, 매우 엄격한 조건은 한정된 이온 강도 및 pH에서 특정 서열에 대한 열용융 온도(T_m)보다 약 5 내지 10 ℃ 더 낮도록 선택된다. 엄격성이 낮은 조건은 일반적으로 T_m보다 약 15 내지 30 ℃ 낮도록 선택된다. T_m은 표적에 상보성인 프로브의 50%가 평형에서(표적 서열이 T_m에서 과량으로 존재하기 때문에 프로브의 50%가 평형에서 점유된다) 표적 서열에 하이브리드화되는 온도(한정된 이온 강도, pH 및 핵산 농도하에)이다. 엄격한 조건은 pH 7.0 내지 8.3에서 염 농도가 약 1.0M 미만의 나트륨 이온, 전형적으로 약 0.01 내지 1.0 M 나트륨 이온 농도(또는 다른 염)이고, 온도가 단프로브(약, 10 내지 50개 뉴클레오타이드)의 경우 약 30 ℃ 이상, 장프로브(예를 들면, 50개보다 많은 뉴클레오타이드)의 경우 약 60 ℃ 이상인 조건일 것이다. 엄격한 조건은 또한 포름아미드와 같은 탈안정화제의 첨가에 의해 달성될 수도 있다. 선택적 또는 특이적 하이브리드화의 경우, 양의 신호는 백그라운드의 적어도 2배, 바람직하게는 백그라운드 하이브리드화의 10배이다.

엄격한 조건하에서 서로에 하이브리드화되지 않는 핵산은 이들이 암호화하는 폴리펩타이드가 실질적으로 동일하다면 여전히 실질적으로 동일하다. 이러한 경우는, 예를 들면, 핵산의 복사가 유전자 코드에 의해 허용되는 최대 코돈 변성을 이용하여 이루어질 때 발생한다. 그러한 경우, 핵산은 전형적으로 중간 정도로 엄격한 하이브리드화 조건하에서 하이브리드화된다.

본 발명에 있어서, 본 발명의 핵산을 함유하는 게놈 DNA 또는 cDNA는 본원에 개시된 핵산 서열을 이용하여 엄격한 조건하에서 표준 서던 블롯법(Southern blots)으로 동정할 수 있다. 상기 개시내용에 있어서, 상기 하이브리드화에 적합한 엄격한 조건은 37 ℃에서 40% 포름아미드, 1M NaCl, 1% 나트륨 도데실 설페이트(SDS)의 완충액 중에서 하이브리드화시키고, 약 50 ℃ 이상, 통상적으로 약 55 내지 약 60 ℃의 온도에서 약 20 분간 0.2xSSC로 1회 이상 세척함을 포함하는 조건, 또는 등가의 조건이다. 양성 하이브리드화는 백그라운드의 적어도 2배이다. 통상적인 기술을 가진 자라면 대안적인 하이브리드화 및 세척 조건을 이용하 여 유사한 엄격한 조건을 제공할 수 있음을 쉽게 인지할 것이다.

두 폴리뉴클레오타이드가 실질적으로 동일하다는 또 다른 지적은, 한 쌍의 올리고뉴클레오타이드 프라이머에 의해 증폭된 기준 서열을 이어서 엄격한 하이브리드화 조건하에서 프로브로 사용하여 cDNA 또는 게놈 라이브러리로부터 시험 서열을 단리하거나, 또는 예를 들면, 노던 또는 서던 블롯법으로 시험 서열을 동정할 수 있다는 것이다.

본 발명은 또한 상기 정의한 바와 같은 발현 벡터를 포함한다. 발현 벡터는 상기에 나타낸 폴리뉴클레오타이드 서열들 각각의 하나 이상의 복사체를 포함한다. 본 발명의 발현 벡터는, 예를 들면, 서열번호: 42, 또는 서열번호: 42의 다음 잔기들: 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 뿐 아니라, 서열번호: 157의 59 내지 292, 295 내지 1158 또는 1185 내지 1610 잔기, 및 서열번호: 177의 1 내지 1170 또는 1258 내지 1980 잔기와 같은, 본원에 정의된 폴리뉴클레오타이드 서열들 중 어느 것이라도 함유할 수 있다. 발현 벡터는, 예를 들면, 서열번호: 42, 서열번호: 157 및 서열번호: 177과 같은, 본 발명에서 동정된 폴리뉴클레오타이드 서열의 조합을 함유할 수도 있다.

발현 벡터내의 폴리뉴클레오타이드 서열은 임의로 상기 정의되고 실시예에 예시된 바와 같은 발현 조절 서열에 작용가능하게 연결될 수 있다.

본 발명은 또한, 예를 들면, 하기 발현 벡터들을 포함한다: pBBR-K-mev-op16-1, pBBR-K-mev-op16-2, pDS-mvaA, pDS-idi, pDS-hcs, pDS-mvk, pDS-pmk , pDS-mvd, pDS-His-mvaA, pDS-His-idi, pDS-His-hcs, pDS-His-mvk, pDS-His- pmk, pDS- His-mvd, pBBR-K-Zea4, pBBR-K-Zea4-up, pBBR-K-Zea4-down, pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk , pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd, pBBR-K-PcrtE-mvaA-crtE-3, pDS-His-phaA , pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ, pBBR-K-PcrtE-crtZW, 및 그의 조합. 이들 발현 벡터들은 하기의 실시예에서 더 상세히 정의한다. 더욱이, 본 발명은 또한 본원에 정의된 서열들 중 하나를 함유하는 임의의 발현 벡터를 포함하는데, 상기 발현 벡터는 적합한 숙주 세포에서 카로티노이드, 바람직하게는 제아잔틴과 같은 이소프레노이드 화합물을 발현시키는데 이용된다.

본원에서 사용한 바와 같이, "발현 벡터"란 어구는 본원에 나타낸 폴리뉴클레오타이드 서열을 암호화하는 DNA 서열을 지니며, 상기 DNA 서열의 발현을 매개할 수 있는 복제가능한 비히클이다.

이와 관련하여, "복제가능한"이란 용어는 벡터가 도입된 해당 유형의 숙주 세포에서 벡터가 복제될 수 있음을 의미한다. 문제의 폴리뉴클레오타이드 서열(들)의 바로 위쪽에, 신호 펩타이드를 암호화하는 서열이 제공될 수 있는데, 상기 서열의 존재로 인해 벡터를 지닌 숙주 세포에 의해 발현된 암호화된 폴리펩타이드의 분비가 확실해진다. 신호 서열은 선별된 폴리뉴클레오타이드 서열과 천연적으로 결합된 것이거나 또는 또 다른 기원에서 유래된 것일 수 있다.

벡터는 편리하게 재조합 DNA 절차에 적용될 수 있는 임의의 벡터일 수 있으며, 벡터의 선택은 종종 벡터가 도입되는 숙주 세포에 따라 달라질 것이다. 따라서, 벡터는 자발적으로 복제되는 벡터, 즉, 그 복제가 염색체 복제와 무관한 염색 체외 구성요소로서 존재하는 벡터일 수 있으며; 상기 벡터의 예는 플라스미드, 파지, 코스미드 또는 소(小)염색체(minichromosome)이다. 또는, 벡터는, 숙주 세포에 도입될 때 숙주 세포 게놈에 통합되고 그것이 통합되는 염색체(들)과 함께 복제되는 것일 수 있다. 적합한 벡터의 예는 실시예에 나타내었다. 본 발명의 발현 벡터는 하기에서 정의하는 바와 같은 본 발명의 DNA 서열들 중 어느 것이라도 지닐 수 있으며, 하기에 정의하는 본 발명의 폴리펩타이드들 중 임의의 폴리펩타이드의 발현에 사용될 수 있다.

본 발명은 또한 본원에 개시된 하나 이상의 폴리뉴클레오타이드 서열 및/또는 하나 이상의 발현 벡터를 함유하는 배양 세포를 포함한다. 본원에서 사용한 바와 같이, "배양된 세포"는 한정된 조건하에서 성장하고 본 발명의 폴리뉴클레오타이드에 의해 암호화된 하나 이상의 폴리펩타이드를 발현시킬 수 있는 임의의 세포를 포함한다. 바람직하게는, 배양 세포는 효모, 진균, 세균 또는 조류이다. 보다 바람직하게는, 배양 세포는 파라코커스(Paracoccus), 플라보박테리움(Flavobacterium), 아그로박테리움(Agrobacterium), 알칼리제네스(Alcaligenes), 에르위니아(Erwinia), 이. 콜라이(E. coli) 또는 바실러스 서브틸리스(B. subtilis)이다. 훨씬 더 바람직하게는, 세포는, 예를 들면, R-1506, R-1512, R1534 또는 R114와 같은 파라코커스이다. 본 발명은 또한 본원에 개시된 폴리펩타이드를 발현시키는, 본 발명에서 동정된 세포들 중 임의 세포의 자손을 포함한다. 본 발명에서, 세포의 AFLP DNA 지문이 실시예 2에 나타낸 조건을 이용하여 추정상의 모세포의 지문과 구별할 수 없는 경우 상기 세포는 또 다른 세 포의 자손이다.

따라서, 본 발명에 따른 배양 세포는, 예를 들면, 서열번호: 42, 또는 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기, 및 서열번호: 157의 59 내지 292, 295 내지 1158 또는 1185 내지 1610 잔기 및 서열번호: 177의 1 내지 1170 또는 1258 내지 1980 잔기를 포함할 수 있다. 상기 서열들은 단독으로 또는 발현 벡터의 일부로서 세포에 전달될 수 있다. 상기 서열들은 또한 임의로 발현 조절 서열(들)에 작용가능하게 연결될 수 있다. 배양 세포는 또한, 예를 들면, 서열번호: 42, 서열번호: 157 및 서열번호: 177과 같은 본 발명에서 동정된 폴리뉴클레오타이드 서열들의 조합을 포함할 수도 있다.

본 발명에 따른 배양 세포는 카로티노이드 생합성 경로에 관여하는 하나 이상의 효소를 암호화하는 폴리뉴클레오타이드를 또한 함유할 수 있다. 예를 들면, 본 발명에 따른 배양 세포는 서열번호: 180, 182 및 184의 하나 이상의 복사체를 단독으로 또는 본원에서 동정된 폴리뉴클레오타이드 서열 중 임의의 서열과 함께 함유할 수 있다. 따라서, 본원에 개시된 폴리뉴클레오타이드 서열은 배양 세포 중에 단독으로 전달되거나 또는 목표 이소프레노이드 화합물, 예를 들면, 제아잔틴 또는 아스타잔틴과 같은 카로티노이드의 증대된 생산을 제공하는 또 다른 폴리뉴클레오타이드 서열과 함께 전달될 수 있다. 이와 관련하여, 본 발명은, 예를 들면, GGPP 신타제, β-카로틴-β4-옥시게나제(케톨라제) 및/또는 β-카로틴 하이드록실라제와 같은 카로티노이드 생합성에 수반되는 폴리펩타이드를 암호화하는 임의의 폴리뉴클레오타이드의 사용을 포함한다. 또한, 카로티노이드 생합성에 수반되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드들의 조합은 같거나 다른 발현 벡터상에 본 발명에서 동정된 하나 이상의 폴리뉴클레오타이드와 함께 사용될 수 있다. 상기 구성물은 본 발명에 따라 배양 세포로 전달되어 문제의 이소프레노이드를 발현하는 세포를 제공할 수 있다.

예를 들면, 본 발명에 따른 배양 세포는 다음 발현 벡터들 중 하나 이상을 함유할 수 있다: pBBR-K-mev-op16-1, pBBR-K-mev-op16-2, pDS-mvaA, pDS-idi, pDS-hcs, pDS-mvk, pDS-pmk, pDS-mvd, pDS-His-mvaA, pDS-His-idi, pDS-His-hcs, pDS-His-mvk, pDS-His-pmk, pDS-His-mvd, pBBR-K-Zea4, pBBR-K-Zea4-up, pBBR-K-Zea4-down, pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk, pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd, pBBR-K-PcrtE-mvaA-crtE-3, pDS-His-phaA, pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ, pBBR-K-PcrtE-crtZW, 및 그의 조합.

본 발명의 또 다른 태양은 카로티노이드의 제조 방법이다. 본 방법에서는, 상기 정의한 바와 같은 배양 세포를 상기 정의한 바와 같은 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드의 발현을 허용하는 조건하에서 배양한다. 폴리펩타이드의 발현을 허용하는 배양 조건은 하기 실시예에 나타내었으며, 필요한 경우, 목적하는 특정 용도에 적합하게 수정될 수 있다. 그 다음, 카로티노이드를 세포로부터, 또는 분비된 경우 세포 배지로부터 단리한다.

본 발명에서, "카로티노이드"에는 다음 화합물들이 포함된다: 피토엔, 라이 코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 혼합물. 바람직하게는, 카로티노이드는 제아잔틴이다.

본 발명의 또 다른 태양은 카로티노이드-생산 세포를 제조하는 방법이다. 이 방법은 (a) 세포에서 발현되는, 메발로네이트 경로에 관여하는 효소를 암호화하는 폴리뉴클레오타이드 서열을 세포에 도입하고; (b) 폴리뉴클레오타이드 서열 도입 전에 세포에 의해 생산된 카로티노이드 수준보다 약 1.1 내지 1,000배의 수준으로 카로티노이드를 생산하는, 단계 (a)의 폴리뉴클레오타이드 서열을 함유하는 세포를 선별함을 포함한다.

본원에서 사용한 바와 같이, "메발로네이트 경로에 관여하는 효소"란 어구는 IPP 생합성을 위한 메발로네이트 경로에 수반되고 atoB 또는 phaA, hcs, mvaA, mvk, pmk 및 mvd 유전자에 의해 암호화되는 효소를 의미한다. 본 발명에 있어서, 효소는 실시예 1에 나타낸 활성 분석법 중 어느 하나를 이용하여 검출되는 경우 "세포에서 발현된" 것이다. 카로티노이드의 생성을 검출하는 분석법은 당해 분야에 공지되어 있다. 실시예 1, 11 및 12는 제아잔틴, 라이코펜 및 아스타잔틴 각각의 존재를 확인하기 위한 대표적인 분석 절차를 나타낸 것이다. 유사한 방법으로, 다른 카로티노이드에 대한 분석법을 이용하여, 예를 들면, 피토엔, 칸타잔틴, 아도니잔틴, 크립토잔틴, 에키네논 및 아도니루빈의 세포 또는 배지중의 존재를 검출할 수 있다.

따라서, 상기 방법을 이용하여 다음의 대표적인 카로티노이드를 제조할 수 있다: 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔 틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 혼합물. 상기 방법에 있어, 제아잔틴이 바람직한 카로티노이드이다.

상기 방법은 폴리뉴클레오타이드 서열 도입 전에 세포에 의해 생산된 카로티노이드 수준의 약 1.1 내지 1,000배, 바람직하게는 약 1.5 내지 500배, 예를 들면, 약 100배 또는 적어도 10배의 수준으로 카로티노이드를 생산할 수 있는 세포를 제조함을 포함한다.

상기 방법에 있어, 세포는 약 1 mg/L 내지 약 10 g/L의 카로티노이드를 생성한다. 세포는 약 100 mg/L 내지 약 9 g/L, 예를 들면, 약 500 mg/L 내지 약 8 g/L 또는 약 1 g/L 내지 약 5 g/L의 카로티노이드를 생성하는 것이 바람직하다.

상기 방법에서, 세포는 효모, 진균, 세균 및 조류에서 선택할 수 있다. 바람직하게는, 세포는 파라코커스, 플라보박테리움, 아그로박테리움, 알칼리제네스 , 에르위니아, 이. 콜라이 및 바실러스 서브틸리스로부터 선택된 세균이다. 가장 바람직하게는, 세균은 파라코커스이다.

상기 방법에서, 세포는 돌연변이 세포일 수 있다. 본원에서 사용한 바와 같이, "돌연변이 세포"는 비-천연 폴리뉴클레오타이드 서열, 또는 그 천연 형태로부터 변형된(예를 들면, 1 내지 100개, 바람직하게는 20 내지 50개, 보다 바람직하게는 10개 미만의 뉴클레오타이드의 재배열 또는 결실 또는 치환에 의해) 폴리뉴클레오타이드 서열을 포함하는 임의의 세포이다. 상기 비-천연 서열은 무작위 돌연변이유발, 화학적 돌연변이유발, UV-조사 등에 의해 수득할 수 있다. 바람직하게, 돌연변이는 메발로네이트 경로에 수반되는 하나 이상의 유전자들의 발현을 증가시 켜 제아잔틴과 같은 카로티노이드의 생산을 증가시킨다. 상기 돌연변이 세포를 제조하고, 선별하고, 동정하는 방법은 당해 분야에 공지되어 있으며, 하기 실시예에 예시되어 있다. 상기 돌연변이체의 예는 R114 또는 R1534이다. 바람직하게는 돌연변이 세포는 R114이다.

상기 방법에서, 폴리뉴클레오타이드 서열은 서열번호: 42, 또는 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기, 및 서열번호: 157의 59 내지 292, 295 내지 1158 또는 1185 내지 1610 잔기 및 서열번호: 177의 1 내지 1170 또는 1258 내지 1980 잔기이다. 상기 서열들은 상기 방법에 단독으로 또는 발현 벡터의 일부로 사용될 수 있다. 상기 서열들은 또한 임의로 발현 조절 서열(들)에 작용가능하게 연결될 수 있다. 상기 방법에서는, 예를 들면, 서열번호: 42, 서열번호: 157 및 서열번호: 177과 같은 본 발명에서 동정된 폴리뉴클레오타이드 서열들의 조합을 사용할 수도 있다.

상기 방법에 사용하기 위해 선택할 수 있는 발현 벡터의 예로는 pBBR-K-mev-op16-1, pBBR-K-mev-op16-2, pDS-mvaA, pDS-idi, pDS-hcs, pDS-mvk, pDS-pmk , pDS-mvd, pDS-His-mvaA, pDS-His-idi, pDS-His-hcs, pDS-His-mvk, pDS-His- pmk, pDS-His-mvd, pBBR-K-Zea4, pBBR-K-Zea4-up, pBBR-K-Zea4-down, pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk , pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd, pBBR-K-PcrtE-mvaA-crtE-3, pDS-His-phaA , pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ, pBBR-K-PcrtE-crtZW, 및 그의 조합.

상기 방법에서, 폴리뉴클레오타이드 서열은 임의의 통상적인 방법을 이용하여 세포내에 도입한다. 폴리뉴클레오타이드 서열을 세포에 도입하기 위한 적합한 방법의 예로는 형질전환, 형질도입, 형질감염, 리포펙션(lipofection), 전기천공(electroporation)(예를 들면, 문헌 [Shigekawa and Dower, Biotechniques, 6:742-751, 1988] 참조), 접합(예를 들면, 문헌 [Koehler and Thorne, Journal of Bacteriology, 169:5771-5278, 1987] 참조) 및 유전자총(biolistics)을 포함한다.

접합을 이용하여 폴리뉴클레오타이드 서열을, 예를 들어, 발현 벡터 형태로 수용체 세균에 전달하는 방법이 일반적으로 효과적이며 공지되어 있는 절차이다(예를 들면, US 5,985,623 호). 세균 균주에 따라서, 정제된 DNA로 수용 세포를 형질전환시키는 방법을 이용하는 것이 더 보편적일 수 있다.

알려져 있는 전기천공 기술(시험관내 및 생체내 둘 다)은 처리 영역 주위에 배치된 전극에 짧은 고전압 펄스를 적용함으로써 작용한다(예를 들면, US 6,208,893 호). 전극들 사이에 생성된 전기장은 세포막을 일시적으로 다공성이 되게 하는데, 이때 이식제 분자가 세포에 유입된다. 공지된 전기천공 방법에서, 상기 전기장은 약 100 μs 기간의 대략 1000 V/cm의 단일 네모파 펄스를 포함한다. 상기 펄스는, 예를 들면, 비티엑스 디비젼 오브 제네트로닉스, 인코포레이티드(BTX Division of Genetronics, Inc.)에서 제조한 일렉트로 스퀘어 포레이터(Electro Square Porator) T820의 공지된 적용에 의해 발생될 수 있다.

유전자총은 미세발사체 충격 기술을 이용하여 표적 세포에 폴리뉴클레오타이 드를 전달하는 시스템이다. 가속에 의해 표적 세포에 폴리뉴클레오타이드를 전달하는 방법의 예시적인 태양은 바이오리스틱스 파티클 딜리버리 시스템(Biolistics Particle Delivery System)으로, 이 시스템을 이용하여 배양된 표적 세포로 덮인 필터 표면 위로 스테인리스 스틸 또는 나이텍스(Nytex) 체와 같은 체를 통해 DNA 또는 세포로 피복된 입자를 추진시킬 수 있다. 체는 입자들을 분산시켜 입자들이 표적 세포에 거대 응집체로 전달되지 않는다. 발사 장치 및 충격받을 세포 사이에 놓인 체는 발사 응집체의 크기를 감소시키고, 너무 큰 발사체에 의한 수용체 세포 상에 가해진 손상을 감소시킴으로써 보다 많은 빈도의 형질전환에 기여할 수 있는 것으로 생각된다.

충격시, 현탁액 중의 세포는 필터 또는 고체 배지상에 농축되는 것이 바람직하다. 또는, 다른 표적 세포가 고체 배지상에 배열될 수도 있다. 충격받을 세포는 미세발사 정지판 아래의 적절한 거리에 배치된다. 경우에 따라, 가속 장치와 충격받을 세포 사이에 하나 이상의 체가 또한 배치된다. 상기 공지된 기술을 사용하여, 일시적으로 표지 유전자를 발현시키는 세포를 1000 포커스 이상까지 수득할 수 있다. 외인성 유전자를 발현시키는 세포 수(포커스)에 충격후 48 시간을 곱한 값은 흔히 1 내지 10의 범위이며 평균 1 내지 3이다.

충격 형질전환 방법에서, 충격전 배양 조건 및 충격 파라미터를 최적화하여 최대수의 안정한 형질전환체를 수득할 수 있다. 충격에 대한 물리적 및 생물학적 파라미터는 둘 다 상기 기술에 중요하다. 물리적 인자는 폴리뉴클레오타이드/미세발사체 침전물을 처리하는 것을 수반하는 인자 또는 거대- 또는 미세발사체의 비행 및 속도에 영향을 미치는 인자이다. 생물학적 인자로는 충격 전 및 직후의 세포 처리에 수반되는 모든 단계, 충격과 관련된 손상을 경감시키기 위한 표적 세포의 삼투압 조절, 및 또한 선형화 DNA 또는 비손상 고차코일 플라스미드와 같은 형질전환 DNA의 성질이 포함된다.

따라서, 소규모 연구에서 다양한 충격 파라미터를 조정하여 조건을 완전히 최적화하고자 할 수 있을 것으로 생각된다. 특히, 간격 거리, 비행 거리, 조직 거리 및 헬륨 압력과 같은 물리적 파라미터를 조정하고자 할 수 있다. 또한, 수용체 세포의 생리학적 상태에 영향을 미치며 따라서 형질전환 및 통합 효율에 영향을 미칠 수 있는 조건을 변화시킴으로써 손상 감소 인자(TRF)를 최소화할 수 있다. 예를 들면, 삼투 상태, 조직 수화도, 및 수용체 세포의 계대배양 단계 또는 세포 주기를 최적 형질전환을 위해 조정할 수 있다. 다른 통상적인 조정을 수행하는 방법은 본원 개시내용에 견주어 당해 분야의 기술을 가진 자라면 알 것이다.

입자-매개 형질전환 방법은 당해 분야에 숙련된 자에게 공지되어 있다. 예를 들면, US 5,015,580 호(본원에 구체적으로 참고로 인용됨)는 상기 기술을 이용한 대두의 형질전환을 기술하고 있다.

본 발명의 또 다른 태양은 이소프레노이드 화합물을 생산하도록 세균을 공학처리하는 방법이다. 상기 세균은, (a) 이소프레노이드의 발현을 허용하는 조건하에 배지에서 모(母) 세균을 배양하고, 모 세균보다 약 1.1 내지 1,000배 더 많은 이소프레노이드를 생산하는 배지로부터 돌연변이 세균을 선별하고; (b) 발현 조절 서열에 작용가능하게 연결된 서열번호: 42로 나타낸 폴리뉴클레오타이드 서열을 함 유하는 발현 벡터를 돌연변이 세균에 도입하고; (c) 발현 벡터를 함유하고 단계 (a)의 돌연변이보다 적어도 약 1.1배 더 많은 이소프레노이드를 생산하는 세균을 선별함으로써 제조된다.

상기 태양에서, 이소프레노이드 화합물은 구조적으로 하기 화학식의 이소펜테닐 디포스페이트(IPP)를 기본으로 하는 화합물을 의미한다:

상기 화합물로는 헤미테르펜, 모노테르펜, 세스퀴테르펜, 디테르펜, 트리테르펜(예를 들면, 피토스테롤, 피토에스트로겐, 피토에크디손, 에스트로겐), 테트라테르펜(카로티노이드) 및 폴리테르펜이 포함된다. 바람직하게는, 이소프레노이드는, 예를 들면, 상기에서 정의한 카로티노이드들 중 하나와 같은 카로티노이드이며, 특히 제아잔틴이다.

세균은 본원에 개시된 방법들을 이용하여 이소프레노이드 화합물을 생산할 수 있는 임의의 세균일 수 있다. 바람직하게는, 세균은 파라코커스, 플라보박테리움, 아그로박테리움, 알칼리제네스, 에르위니아, 이. 콜라이 또는 바실러스 서브틸리스이다. 세균은 파라코커스인 것이 훨씬 더 바람직하다. 바람직하게, 모 세균은 R-1506 또는 R1512이고, 돌연변이 세균은 R1534 또는 R114이고, 바람직하게는 R114이다.

세균은 이소프레노이드의 생산에 최적화된 배지 및 조건하에서 배양한다. 배지 및 배양 조건의 선택은 당해 분야의 기술에 속하는 것이다. 실시예 1, 11 및 12에 나타낸 분석법들은 배지 중 특정 카로티노이드의 존재를 측정하기 위한 대표적인 방법들을 제공한 것이다. 배양 조건을 최적화하고 목표 이소프레노이드의 생산을 측정함으로써, 본원에 인용된 특정 생산 파라미터를 충족시키는 돌연변이체의 배양 및 선별이 달성될 수 있다. 이러한 방식으로, 모 세균보다 약 1.1 내지 1,000배 더 많은 이소프레노이드를 생산하는 돌연변이 세균을 선별할 수 있다. 바람직하게는, 돌연변이 세균은 모 세균보다 약 1.5 내지 500배 더 많은 이소프레노이드, 예를 들면, 모 세균보다 적어도 약 100배 또는 적어도 약 10배 더 많은 이소프레노이드를 생산한다. 그 다음, 상기 세균을 배양하고 후속 단계에 이용한다.

목적하는 수준의 이소프레노이드를 생산하는 돌연변이 세균을 선별한 후에, 상기에 나타내거나 실시예에 기술된 방법들 중 임의의 방법을 이용하여 발현 벡터를 세균내에 도입한다. 본원에 정의된 발현 벡터들 중 어느 것이라도 돌연변이 세포에 도입할 수 있다. 바람직하게는, 발현 벡터는 서열번호: 42를 함유한다.

일단 발현 벡터를 돌연변이 세균에 도입하면, 형질전환되지 않은 돌연변이체보다 적어도 약 1.1배, 예를 들면, 약 5 내지 약 20배 더 많은 이소프레노이드를 생산하는 안정한 형질전환체를 선별한다. 이어서, 선별된 형질전환체를 이소프레노이드 생산에 적합한 조건하에서 배양한 다음, 세포 또는 배지로부터 이소프레노이드를 단리한다.

상기 방법에서의 추가 단계는 세균에 의한 이소프레노이드 화합물의 생산을 증가시키는 돌연변이 세균에 돌연변이를 도입하는 것이다. 돌연변이는 다음 중 하나 이상으로부터 선택할 수 있다: 폴리하이드록시알카노에이트(PHA) 경로의 불활성 화, 아세틸-CoA 아세틸트랜스퍼라제의 발현 증가, FPP 신타제의 발현 증가, 카로티노이드 생합성 경로에 수반되는 효소의 발현 증가, 및 이소펜테닐 디포스페이트(IPP)를 디메틸알릴 디포스페이트(DMAPP)로 전환시키는 효소의 발현 증가.

PHA 경로의 불활성화는, phaB(서열번호: 177의 뉴클레오타이드 위치 1258 내지 1980)에 의해 암호화되는 폴리펩타이드를 발현하지 않는 돌연변이 세균을 선별하거나, 또는 서열번호: 177 또는 그의 단편을 사용하여 동종 재조합에 의해 야생형 phaB 유전자의 발현을 중단시킴으로써 수행할 수 있다.

상기 방법에서, 아세틸-CoA 아세틸트랜스퍼라제의 발현을 증가시키는 것은 서열번호: 175 또는 발현 조절 서열에 작용가능하게 연결된 서열번호: 177의 뉴클레오타이드 위치 1 내지 1170으로 나타낸 폴리뉴클레오타이드 서열을 함유하는 벡터를 돌연변이 세균에 도입함으로써 달성될 수 있다. 상기 방법에서, FPP 신타제의 발현을 증가시키는 것은 발현 조절 서열에 작용가능하게 연결된 서열번호: 157의 뉴클레오타이드 295 내지 1158로 나타낸 폴리뉴클레오타이드 서열을 함유하는 벡터를 돌연변이 세균에 도입함으로써 이루어질 수 있다. 상기 방법에서, 카로티노이드 유전자의 발현은 카로티노이드 생합성 경로에 관여하는 하나 이상의 효소를 암호화하는 폴리뉴클레오타이드 서열, 예를 들면, 발현 조절 서열에 작용가능하게 연결된 서열번호: 180, 182 및 184로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 벡터를 돌연변이 세균에 도입시킴으로써 증가시킬 수 있다.

상기 방법에서, 이소프레노이드 화합물은 이소펜테닐 디포스페이트(IPP)인 것이 바람직하다. 이소프레노이드 화합물은, 예를 들면, 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 혼합물과 같은 카로티노이드인 것도 또한 바람직하다.

본 발명의 또 다른 태양은 하기 특성을 갖는 파라코커스 속 미생물이다: (a) 0%의 간격 페널티를 갖는 진콤파르(GeneCompar) v. 2.0 소프트웨어를 사용한 상동성 계산으로부터 수득된 유사성 매트릭스를 이용하여 97%보다 높은 서열번호: 12에 대한 서열 유사성; (b) 81.5 ℃에서 DNA:DNA 하이브리드화를 이용하여 70%보다 높은 R-1512, R1534, R114 또는 R-1506에 대한 상동성; (c) R114, R-1512, R1534 및 R-1506의 게놈 DNA의 G+C 함량으로부터 1% 미만으로 변하는 게놈 DNA의 G+C 함량; 및 (d) 실시예 2의 AFLP 절차를 이용하여 균주 R-1512, R1534, R114 및 R-1506에 대해 약 58% 유사성에 밀집되는 평균 DNA 지문, 단, 미생물은 파라코커스(MBIC3966)이 아니다.

각각의 상기 특성들을 측정하는 방법은 실시예 2에 상세히 나타내었으며, 이들 방법을 이용하는 경우 상기 기준을 충족시키는 미생물을 쉽게 동정할 수 있을 것으로 생각된다. 본 발명의 미생물은 상기에 나타낸 각각의 특성(즉, (a) 내지 (d))을 갖는 것이 바람직하다. 그러나, 파라코커스속 (MBIC3966)을 제외하고 R114, R-1512, R1534 및 R-1506과 동일한 종에 속하는 미생물을 분류학적으로 타당하게 기술하기에 충분한 정보를 제공하는, 특성 (a) 내지 (d)의 임의의 조합도 또한 본 발명의 범위에 속한다.

본 발명의 또 다른 태양은 하기 특성들을 갖는 파라코커스 속의 미생물이다: (a) 세포막의 전체 지방산의 약 75% 이상을 차지하는 18:1w7c; (b) 성장을 위한 탄소 공급원으로 아도니톨, i-에리트리톨, 젠티오바이오스, β-메틸글루코사이드, D-솔비톨, 자일리톨 및 퀸산을 사용할 수 없음; 및 (c) 성장을 위한 탄소 공급원으로 L-아스파라긴 및 L-아스파트산을 사용하는 능력, 단, 미생물은 파라코커스속 (MBIC3966)이 아니다.

각각의 상기 특성들을 측정하는 방법은 또한 실시예 2에 상세히 나와 있으며, 이들 방법을 이용하는 경우 상기 기준을 충족시키는 미생물을 용이하게 확인할 수 있을 것으로 생각된다. 본 발명의 미생물은 상기에 나타낸 각각의 특성(즉, (a) 내지 (c))을 갖는 것이 바람직하다. 그러나, 파라코커스속 (MBIC3966)을 제외하고 R114, R-1512, R1534 및 R-1506과 동일한 종에 속하는 미생물을 분류학적으로 타당하게 기술하기에 충분한 정보를 제공하는, 특성 (a) 내지 (c)의 임의의 조합도 또한 본 발명의 범위에 속한다.

본 발명의 또 다른 태양은 다음 특성들을 갖는 파라코커스 속의 미생물이다: (a) 40 ℃에서 성장하는 능력; (b) 8% NaCl을 포함하는 배지에서 성장하는 능력; (c) 9.1의 pH를 갖는 배지에서 성장하는 능력; 및 (d) 황색-오렌지색 콜로니 착색, 단, 미생물은 파라코커스속 (MBIC 3966)이 아니다.

각각의 상기 특성들을 측정하는 방법은 또한 실시예 2에 상세히 나타내었으며, 이들 방법을 이용하는 경우 상기 기준을 충족시키는 미생물을 쉽게 동정할 수 있을 것으로 생각된다. 본 발명의 미생물은 상기에 나타낸 각각의 특성(즉, (a) 내지 (d))을 갖는 것이 바람직하다. 그러나, 파라코커스속 (MBIC3966)을 제외하고 R114, R-1512, R1534 및 R-1506과 동일한 종에 속하는 미생물을 분류학적으로 타당하게 기술하기에 충분한 정보를 제공하는, 특성 (a) 내지 (d)의 임의의 조합도 또한 본 발명의 범위에 속한다.

본 발명의 미생물은 또한 파라코커스속 (MBIC3966)을 제외하고 R114, R-1512, R1534 및 R-1506과 동일한 종에 속하는 미생물을 분류학적으로 타당하게 기술하기에 충분한 정보를 제공하는, 상기에 나타낸 11개 특성들의 임의의 조합을 이용하여 동정할 수 있다.

상기 설명에 따르면, 본 발명은 다음을 제공한다:

(1) 하기 (a) 내지 (j)로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:

(a) 서열번호: 43의 잔기 1 내지 340으로 나타낸 아미노산 서열, 특히 서열번호: 43의 68 내지 97 위치에 상응하는 아미노산 서열;

(b) 서열번호: 45의 잔기 1 내지 349로 나타낸 아미노산 서열, 특히 서열번호: 45의 1 내지 30 위치에 상응하는 아미노산 서열;

(c) 서열번호: 47의 잔기 1 내지 388로 나타낸 아미노산 서열, 특히 서열번호: 47의 269 내지 298 위치에 상응하는 아미노산 서열;

(d) 서열번호: 49의 잔기 1 내지 378로 나타낸 아미노산 서열, 특히 서열번호: 49의 109 내지 138 위치에 상응하는 아미노산 서열;

(e) 서열번호: 51의 잔기 1 내지 305로 나타낸 아미노산 서열, 특히 서열번호: 51의 198 내지 227 위치에 상응하는 아미노산 서열;

(f) 서열번호: 53의 잔기 1 내지 332로 나타낸 아미노산 서열, 특히 서열번호: 53의 81 내지 110 위치에 상응하는 아미노산 서열;

(h) 하이드록시메틸글루타릴-CoA 리덕타제(HMG-CoA 리덕타제), 이소펜테닐 디포스페이트 이소머라제, 하이드록시메틸글루타릴-CoA 신타제(HMG-CoA 신타제), 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는, 서열번호: 43, 45, 47, 49, 51 및 53으로 이루어진 그룹에서 선택된 폴리펩타이드 단편의 아미노산 서열;

(i) 엄격한 조건하에서 서열번호: 42 또는 서열번호: 42의 보체의 30개 이상의 연속 뉴클레오타이드를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는 폴리펩타이드의 아미노산 서열;

(2) 다음으로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:

(a) 서열번호: 159의 잔기 1 내지 287로 나타낸 아미노산 서열;

(b) 서열번호: 159의 30개 이상의 인접 아미노산 잔기;

(c) 서열번호: 159의, 파네실 디포스페이트 신타제(FPP 신타제) 활성을 갖는 단편 의 아미노산 서열;

(d) 엄격한 조건하에서 서열번호: 157의 295 내지 1158 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, FPP 신타제 활성을 갖는 폴리펩타이드의 아미노산 서열;

(e) 서열번호: 159의 보존적으로 변형된 변이체.

(3) 다음으로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:

(a) 서열번호: 160의 잔기 1 내지 142로 나타낸 아미노산 서열;

(b) 서열번호: 160의 30개 이상의 인접 아미노산 잔기;

(c) 서열번호: 160의, 1-데옥시자일룰로즈-5-포스페이트 신타제(DXPS) 활성을 갖는 단편의 아미노산 서열;

(d) 엄격한 조건하에서 서열번호: 157의 1185 내지 1610 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, DXPS 활성을 갖는 폴리펩타이드의 아미노산 서열;

(e) 서열번호: 160의 보존적으로 변형된 변이체.

(4) 다음으로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:

(a) 서열번호: 178의 잔기 1 내지 390으로 나타낸 아미노산 서열;

(b) 서열번호: 178의 30개 이상의 인접 아미노산 잔기;

(c) 서열번호: 178의, 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드 단편의 아미노산 서열;

(d) 엄격한 조건하에서 서열번호: 177의 1 내지 1170 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드의 아미노산 서열;

(e) 서열번호: 178의 보존적으로 변형된 변이체.

(5) 다음으로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:

(a) 서열번호: 179의 잔기 1 내지 240으로 나타낸 아미노산 서열;

(b) 서열번호: 179의 30개 이상의 인접 아미노산 잔기;

(c) 서열번호: 179의 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드 단편의 아미노산 서열;

(d) 엄격한 조건하에서 서열번호: 177의 1258 내지 1980 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드의 아미노산 서열;

(e) 서열번호: 179의 보존적으로 변형된 변이체.

(6) 서열번호: 42; 파라코커스 속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 42의 변이체; 하이드록시메틸글루타릴-CoA 리덕타제(HMG-CoA 리덕타제), 이소펜테닐 디포스페이트 이소머라제, 하이드록시메틸글루타릴-CoA 신타제(HMG-CoA 신타제), 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서 뉴클레오타이드 서열이 서열번호: 42 또는 서열번호: 42의 보체의 30개 이상의 인접 뉴클레오타이드로 이루어진 하이브리드화 프로브에 하이브리드화되는, HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 특히

(a) 서열번호: 42의 2622 내지 3644 뉴클레오타이드; HMG-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 그의 단편; 및 뉴클레오타이드 서열이 서열 번호: 42의 2622 내지 3644 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 엄격한 조건하에서 하이브리드화되는, HMG-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 2622 내지 3644 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열;

(b) 서열번호: 42의 3641 내지 4690 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; 이소펜테닐 디포스페이트 이소머라제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 3641 내지 4690 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 이소펜테닐 디포스페이트 이소머라제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열;

(c) 서열번호: 42의 4687 내지 5853 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; HMG-CoA 신타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 4687 내지 5853 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, HMG-CoA 신타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열;

(d) 서열번호: 42의 5834 내지 6970 뉴클레오타이드; 파라코커스속 균주 R1534 코 돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; 메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 5834 내지 6970 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열;

(e) 서열번호: 42의 6970 내지 7887 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; 포스포메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 6970 내지 7887 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 포스포메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열; 또는

(f) 서열번호: 42의 7880 내지 8878 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; 디포스포메 발로네이트 데카복실라제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 7880 내지 8878 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 디포스포메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 7880 내지 8878 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드 서열, 보다 특히 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열.

(7) 서열번호: 157의 뉴클레오타이드 서열; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 변이체; 파네실 디포스페이트(FPP) 신타제 활성, 1-데옥시-D-자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드 또는 XseB 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 157 또는 서열번호: 157의 보체의 30개 이상의 인접 뉴클레오타이드로 이루어진 하이브리드화 프로브에 하이브리드화되는, FPP 신타제 활성, 1-데옥시-D-자일룰로즈-5-포스페이트 신타제 활성 및 XseB 활성으로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 특히

(a) 서열번호: 157의 59 내지 292 위치에 존재하는 뉴클레오타이드 서열; 파라코커 스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; XseB의 기능을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 59 내지 292 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 157의 59 내지 292 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, XseB의 기능을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 157의 59 내지 292 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드;

(b) 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는, 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열의 변이체; FPP 신타제 활성을 암호화하는 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 157의 295 내지 1158 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, FPP 신타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 157의 295 내지 1158 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드;

(c) 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는, 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열의 변이체; 1-데옥시자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 157의 1185 내지 1610 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 1-데옥시자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 157의 1185 내지 1610 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드.

(8) 서열번호: 177의 뉴클레오타이드 서열; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체; 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 177의 30개 이상의 인접 뉴클레오타이드 또는 서열번호: 177의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열 로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 특히

(a) 서열번호: 177의 1 내지 1170 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체; 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 177의 1 내지 1170 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 177의 1 내지 1170 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드 서열;

(b) 서열번호: 177의 1258 내지 1980 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체; 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 177의 1258 내지 1980 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 177의 1258 내지 1980 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드 서열;

(9) 서열번호: 42, 서열번호: 157, 서열번호: 177 및 그의 조합으로 이루어진 그룹에서 선택된 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열.

(10) (6)(a) 내지 (6)(f), (7)(a) 내지 (7)(c), (8)(a), (8)(b) 또는 (9) 중 어느 하나의 폴리뉴클레오타이드 서열을 포함하는 발현 벡터, 특히, 폴리뉴클레오타이드 서열이 발현 조절 서열에 작용가능하게 연결된 발현 벡터, 예를 들면, 카로티노이드 생합성 경로에 수반되는 효소를 암호화하는 폴리뉴클레오타이드 서열을 추가로 포함하는 발현 벡터, 보다 특히는, 폴리뉴클레오타이드 서열이 발현 조절 서열에 작용가능하게 연결된 서열번호: 180, 서열번호: 182, 서열번호: 184 및 그의 조합으로 이루어진 그룹에서 선택된 발현 벡터.

(11) pBBR-K-mev-op16-1, pBBR-K-mev-op16-2, pDS-mvaA, pDS-idi, pDS-hcs, pDS-mvk, pDS-pmk, pDS-mvd, pDS-His-mvaA, pDS-His-idi, pDS-His-hcs , pDS-His-mvk, pDS-His-pmk, pDS-His-mvd, pBBR-K-Zea4, pBBR-K-Zea4-up, pBBR-K-Zea4-down, pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk, pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd, pBBR-K-PcrtE-mvaA-crtE-3, pDS-His-phaA, pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ, pBBR-K-PcrtE-crtZW, 및 그의 조합으로 이루어진 그룹에서 선택된 발현 벡터, 특히

(a) pBBR-K-mev-op16-1 및 pBBR-K-mev-op16-2로 이루어진 그룹에서 선택된 발현 벡 터;

(b) pBBR-K-Zea4, pBBR-K-Zea4-up 및 pBBR-K-Zea4-down으로 이루어진 그룹에서 선택된 발현 벡터;

(c) pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk, pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd 및 그의 조합으로 이루어진 그룹에서 선택된 발현 벡터;

(d) 발현 벡터 pBBR-K-PcrtE-mvaA-crtE-3;

(e) 발현 벡터 pDS-His-phaA; 또는

(f) pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ 및 pBBR-K-PcrtE-crtZW로 이루어진 그룹에서 선택된 발현 벡터.

(12) (6)(a) 내지 (f), (7)(a) 내지 (c), (8)(a), (8)(b) 또는 (9) 중 어느 하나의 폴리뉴클레오타이드 서열, 또는 (10) 또는 (11)의 발현 벡터를 포함하는, 상기 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드를 발현시키는 배양 세포, 또는 세포 자손, 특히, 다음에서 선택된 특징에 의해 더욱 특성화되는 세포:

(a) 카로티노이드 생합성 경로의 효소를 암호화하는 폴리뉴클레오타이드 서열을 추가로 포함하는 세포, 보다 특히는 카로티노이드 생합성 경로의 효소를 암호화하는 폴리뉴클레오타이드 서열이 서열번호: 180, 182 및 184로 이루어진 그룹에서 선택되는, 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드를 발현시키는 배양 세포, 또는 세포 자손; 및

(b) 효모, 진균, 세균 및 조류로부터 선택된 그룹의 일원인 세포, 특히 파라코커 스, 플라보박테리움, 아그로박테리움, 알칼리제네스, 에르위니아, 이. 콜라이 및 바실러스 서브틸리스로 이루어진 그룹에서 선택된 세균, 보다 특히는 파라코커스, 보다 특히는 R-1506, R-1512, R1534 및 R114로 이루어진 그룹에서 선택된 파라코커스.

(13) 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드의 발현을 가능하게 하는 조건하에서 (12)의 세포를 배양하고 세포 또는 세포 배지로부터 카로티노이드를 단리함을 포함하는, 카로티노이드의 제조 방법.

(14) 다음을 포함하는, 카로티노이드-생산 세포의 제조 방법:

(a) 세포에서 발현되는 메발로네이트 경로의 효소를 암호화하는 폴리뉴클레오타이드 서열을 세포내에 도입하는 단계; 및

(b) 폴리뉴클레오타이드 서열 도입 전에 세포에 의해 생산된 카로티노이드의 수준보다 약 1.1 내지 1,000배 더 높은 수준으로 카로티노이드를 생산하는, 단계 (a)의 폴리뉴클레오타이드 서열을 함유하는 세포를 선별하는 단계,

특히, 다음에서 선택된 특징에 의해 특성화되는 방법으로부터 선택된 방법:

(i) 상기 선별 단계는 폴리뉴클레오타이드 서열의 도입 전에 세포에 의해 생산된 카로티노이드 수준보다 약 1.5 내지 500배, 특히 약 100배, 또는 적어도 약 10배 더 높은 수준으로 카로티노이드를 생산하는 단계 (a)의 폴리뉴클레오타이드 서열을 함유하는 세포를 선별함을 포함한다;

(ii) 상기 세포는 약 1 mg/L 내지 약 10 g/L의 카로티노이드를 생산한다;

(iii) 상기 세포는 효모, 진균, 세균 및 조류로부터 선택되고, 특히 파라코커스, 플라보박테리움, 아그로박테리움, 알칼리제네스, 에르위니아, 이. 콜라이 및 바실러스 서브틸리스로 이루어진 그룹에서 선택되며, 보다 특히는 파라코커스에서 선택된다;

(iv) 단계 (a)의 세포는 돌연변이 세포이며, 특히 R114 및 R1534로 이루어진 그룹에서 선택되고, 특히는 상기 돌연변이 세포는 비-돌연변이 세포에 비해 약 1.1 내지 1,000배, 특히 약 1.5 내지 500배, 보다 특히 적어도 약 100배 이상 또는 적어도 약 10배 이상의 수준의 카로티노이드를 생산한다;

(v) 폴리뉴클레오타이드 서열은 (6)(a) 내지 (f), (7)(a) 내지 (c), (8)(a), (8)(b) 및 (9)의 폴리뉴클레오타이드 서열로부터 선택되며, 특히 이때 폴리뉴클레오타이드 서열은 발현 조절 서열에 작용가능하게 연결된다;

(vi) 폴리뉴클레오타이드 서열은 (10) 또는 (11)의 발현 벡터이다;

(vii) 도입 단계는 형질전환, 형질도입, 형질감염, 리포펙션, 전기천공, 접합 및 유전자총으로 이루어진 그룹에서 선택된다;

(viii) 카로티노이드는 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 조합으로부터 선택되며, 특히 카로티노이드는 제아잔틴이다.

(15) 하기 단계를 포함하는, 이소프레노이드 화합물을 생산하도록 세균을 공학처리하는 방법:

(a) 이소프레노이드 화합물의 발현을 허용하는 조건하에 배지에서 모 세균을 배양하고, 모 세균보다 약 1.1 내지 1,000배 더 많은 이소프레노이드 화합물을 생산하 는 돌연변이 세균을 배지로부터 선별하는 단계;

(b) 발현 조절 서열에 작용가능하게 연결된 서열번호: 42로 나타낸 폴리뉴클레오타이드 서열을 포함하는 발현 벡터를 돌연변이 세균에 도입하는 단계; 및

(c) 발현 벡터를 함유하며 단계 (a)의 돌연변이체보다 적어도 약 1.1배 더 많은 이소프레노이드 화합물을 생산하는 세균을 선별하는 단계; 특히,

(i) 돌연변이 세균에 돌연변이를 도입함을 추가로 포함하는 방법, 보다 특히는,

돌연변이가 다음 중 하나 이상에서 선택된 결과를 야기하는 방법: 폴리하이드록시알카노에이트(PHA) 경로의 불활성화, 아세틸-CoA 아세틸트랜스퍼라제의 발현 증가, 파네실 디포스페이트(FPP) 신타제의 발현 증가, 카로티노이드 경로에 수반되는 효소의 발현 증가, 이소펜테닐 디포스페이트(IPP)를 디메틸알릴 디포스페이트(DMAPP)로 전환시키는 효소의 발현 증가, 보다 특히는,

PHA 경로의 불활성화가 phaB(서열번호: 177의 1258 내지 1980 위치의 뉴클레오타이드)에 의해 암호화되는 폴리펩타이드를 발현시키지 않는 돌연변이 세균을 선별하거나, 또는 서열번호: 177 또는 그의 단편을 이용하여 동종 재조합에 의해 야생형 phaB 유전자의 발현을 방해함을 포함하는 방법, 또는

아세틸-CoA 아세틸트랜스퍼라제의 발현을 증가시키는 것이 발현 조절 서열에 작용가능하게 연결된 서열번호: 175로 나타낸 폴리뉴클레오타이드 서열 또는 서열번호: 177의 1 내지 1170 위치의 뉴클레오타이드를 포함하는 벡터를 돌연변이 세균에 도입함을 포함하는 방법, 또는

FPP 신타제의 발현을 증가시키는 것이 발현 조절 서열에 작용가능하게 연결된 서열 번호: 157의 295 내지 1158 뉴클레오타이드로 나타낸 폴리뉴클레오타이드 서열을 포함하는 벡터를 돌연변이 세균에 도입함을 포함하는 방법, 또는

카로티노이드 경로에 수반되는 효소의 발현을 증가시키는 것이 발현 조절 서열에 작용가능하게 연결된 서열번호: 180, 182 및 184로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 벡터를 돌연변이 세균에 도입함을 포함하는 방법;

(b) 이소프레노이드가 이소펜테닐 디포스페이트(IPP)인 방법;

(c) 이소프레노이드가 카로티노이드인 방법, 특히 카로티노이드가 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 조합으로 이루어진 그룹에서 선택되는 방법;

(d) 모 세균이 파라코커스, 특히 R-1512 또는 R-1506 또는 R1534 또는 R114인 방법, 특히 돌연변이체가 R114인 방법.

(16) 하기 특성을 갖는, 파라코커스 속 미생물:

(i) 0%의 간격 페널티를 갖는 진콤파르 v. 2.0 소프트웨어를 사용한 상동성 계산으로부터 수득된 유사성 매트릭스를 이용하여 97%보다 높은 서열번호: 12에 대한 서열 유사성;

81.5 ℃에서 DNA:DNA 하이브리드화를 이용하여 70%보다 높은 균주 R-1512, R1534, R114 또는 R-1506에 대한 상동성;

R114, R-1512, R1534 및 R-1506의 게놈 DNA의 G+C 함량으로부터 1% 미만으로 변하는 게놈 DNA의 G+C 함량; 및

실시예 2의 AFLP 절차를 이용하여 균주 R-1512, R1534, R114 및 R-1506에 대해 약 58% 유사성에 밀집되는 평균 DNA 지문(단, 미생물은 파라코커스속 (MBIC3966)이 아님);

(ii) 세포막의 전체 지방산의 약 75% 이상을 차지하는 18:1w7c;

성장을 위한 탄소 공급원으로 아도니톨, i-에리트리톨, 젠티오바이오스, β-메틸글루코사이드, D-솔비톨, 자일리톨 및 퀸산을 사용할 수 없음; 및

성장을 위한 탄소 공급원으로 L-아스파라긴 및 L-아스파트산을 사용하는 능력(단, 미생물은 파라코커스속 (MBIC3966)이 아님); 또는

(iii) 40 ℃에서 성장하는 능력;

8% NaCl을 포함하는 배지에서 성장하는 능력;

9.1의 pH를 갖는 배지에서 성장하는 능력; 및

황색-오렌지색 콜로니 착색(단, 미생물은 파라코커스속 (MBIC 3966)이 아니다).

하기의 실시예는 본 발명의 특정 태양을 더 예시하기 위해 나타낸 것이다. 이들 실시예는 예시일 뿐이며 어떤 식으로든 본 발명의 범위를 제한하는 것이 아니다.

실시예 1: 분석 및 생화학적 방법

(a) 카로티노이드의 분석

샘플 제조. 먼저 1:1 디메틸설폭사이드(DMSO) 및 테트라하이드로푸란(THF)의 용매 혼합물을 제조하였다. 부틸화 하이드록시톨루엔(BHT, 5 g/l 용매 혼합물) 을 첨가하여 상기 용매 혼합물을 안정화시켰다. 4 ml의 안정화된 DMSO/THF 혼합물을 일회용 15-ml 폴리프로필렌 원심분리 튜브 중의 0.4 ml의 세균 배양액에 가하였다(1/11의 최종 희석률). 튜브에 뚜껑을 덮고 볼텍스(Vortex) 혼합기를 사용하여 각각 10 초간 혼합하였다. 이어서, 샘플을 20 분간 브링크만 비브라믹스(Brinkmann Vibramix) 진탕기 위에 두었다. 튜브를 실온에서 4000 rpm으로 4 분간 원심분리하고, 맑은 황색/오렌지색 상등액의 분취량들을 고성능 액체 크로마토그래피(High Performance Liquid Chromatography, HPLC)로 분석하기 위해 갈색 유리병으로 옮겼다.

HPLC. 아스타잔틴, 제아잔틴, 칸타잔틴, β-카로틴 및 라이코펜을 동시에 측정하기 위해 역상 HPLC 방법을 진행하였다. 상기 방법은 또한 제아잔틴의 주 시스-이성체를 분리할 수 있었다. 항온 자동시료채취장치 및 다이오드 배열 검출기가 장착된 에이질런트(Agilent) 1100 HPLC 시스템을 이용하여 수행하였다. 상기 방법의 파라미터들은 다음과 같았다:

컬럼: YMC 카로티노이드 C30 컬럼, 입자 크기 5 μ, 250x4.6 mm 내경, 스틸(YMC, 부품 번호 CT99S052546WT);

가드 컬럼: 펠리가드(Pelliguard) LC-18 카트리지, 20 mm(슈펠코(SUPELCO), 부품 번호 59654);

이동상: 메탄올(MeOH)/메틸 3급-부틸 에테르(TBME) 구배

실행 시간: 28 분; 전형적인 컬럼 압력: 개시때 90 바; 유량: 1.0 ml/분; 검출: 450 nm에서 UV; 주입 부피: 10 μl; 컬럼 온도: 15 ℃.

시약. 메탄올 및 TBME는 HPLC용 등급이며, 각각 이엠 사이언스(EM Science) 및 제이.티. 베이커(J.T. Baker)에서 입수하였다. DMSO(옴니솔브(Omnisolve))는 이엠 사이언스에서 구입하였다. THF(HPLC 용매)는 버딕(Burdick) 및 잭슨(Jackson)에서 입수하였다.

계산. 정량 분석은 외부 표준물(스위스 바셀 소재의 호프만-라 로슈(Hoffmann-La Roche)에서 제공)을 이용하여 2 단계 보정하에 행하였다. 계산은 피크 면적을 기준으로 하였다.

선택도. 방법의 선택도는 적절한 카로티노이드 기준 화합물의 표준 용액을 주입하여 입증하였다. 목표 화합물(완전-트랜스-카로티노이드)은 완전히 분리되었으며 간섭을 나타내지 않았다. 일부 소량의 시스 이성체가 함께 용출될 수 있지만, 이들 잠재적으로 간섭하는 이성체들은 드물며 통상적인 분석에서는 고려할 필요가 없다. 화합물의 체류 시간을 표 1에 열거하였다.

선형성. 25 mg의 완전-트랜스-제아잔틴을 50 ml의 DMSO/THF 혼합물에 용해시켰다(500 μg/ml의 최종 제아잔틴 농도 제공). 희석 시리즈를 제조하고(250, 100, 50, 10, 5, 1 및 0.1 μg/ml의 최종 제아잔틴 농도) 전술한 HPLC 방법으로 분석하였다. 선형 범위는 0.1 내지 250 μg/ml로 나타났다. 보정 계수는 0.9998이었다.

검출 한계. 상기 방법에 의한 제아잔틴에 대한 검출의 하한치는 60 μg/l인 것으로 측정되었다. 보다 큰 주입 부피 및 통합 파라미터의 최적화에 의해 검출 한계를 약 5 μg/l로 저하시키는 것이 가능하였다.

재현성. 완전-트랜스-제아잔틴에 대한 체류 시간은 매우 안정하였다(상대 표준 편차(RSD), 0.2%). 동일한 배양액 샘플의 10회 반복 분석을 기준으로, 피크 면적 재현성은 완전 트랜스-제아잔틴에 대해 0.17% RSD 및 크립토잔틴에 대해 1.0%인 것으로 측정되었다.

(b) 조 추출물의 제조 및 효소 분석 방법

조 추출물의 제조. 1 ml의 추출 완충액(사용된 완충액은 분석되는 효소에 따라 달라짐-조성은 하기에 기술하는 각각의 효소 분석 절차에 따라 규정된다)에 세척한 세포 펠릿을 재현탁하여 파라코커스 및 이. 콜라이의 조 추출물을 제조하였다. 세포 현탁액을 2 ml의 플라스틱 병에 넣고 미니 비드 비터 8(Mini Bead Beater 8; 미국 오클랜드주 바트레스빌 소재의 바이오스펙 프로덕츠(Biospec Products))을 사용하여 유리 비드로 교반시켜 파괴하였다. 파괴는 4 ℃에서 배지 교반 세팅을 이용하여 수행하였다. 파괴된 제제를 4 ℃에서 21,000xg로 20 분간 원심분리하여 세포 파편을 침강시키고, 상등액을 직접 효소 분석에 이용하였다.

단백질 측정. 조 추출물 중 단백질 농도는 바이오-래드(Bio-Rad) 단백질 분석용 시약(미국 캘리포니아주 헤르큘레스 소재의 바이오-래드)을 이용하여 브래드포드(Bradford)의 방법[Anal. Biochem., 72:248-254, 1976]에 의해 측정하였다. 표준 곡선 제작을 위한 기준 단백질로서 소 혈청 알부민을 사용하였다.

아세틸-CoA 아세틸트랜스퍼라제 분석. 150mM EPPS(N-[2-하이드록시에틸]피페리진-N'-[3-프로판설폰산]) 완충액(pH 8.0) 중에서 조 추출물을 제조하였다. 분석은 슬래터(Slater) 등이 기술한 방법[J. Bacteriol., 180:1979-1987, 1998]에 따라 가티올분해(thiolysis) 방법으로 수행하였다. 상기 분석은 304 nm에서 분광측정법에 의해 아세토아세틸-CoA의 소실을 측정한다. 반응 혼합물은 150mM EPPS 완충액(pH 8.0), 50mM MgCl₂, 100μM CoA, 40μM 아세토아세틸-CoA 및 조 추출물을 함유하였다. 반응은 30 ℃에서 수행하였으며 조 추출물을 첨가하여 개시하였다. 304 nm에서 아세토아세틸-CoA의 소실은 스펙트라맥스 플러스(SpectraMAX Plus) 플레이트 판독기(미국 캘리포니아주 서니베일 소재의 몰레큘라 디바이스 코포레이션(Molecular Devices Corp.)) 및 석영 마이크로 플레이트(microtiter plate)를 이용하여 관찰하였다(임의의 표준 분광광도계도 또한 사용할 수 있다). 활성(U/mg 단백질로 표시)은 아세토아세틸-CoA를 사용하여 제작된 표준 곡선을 이용하여 계산하였다(1 유니트의 활성 = 1 μ몰의 소비된 아세토아세틸-CoA/분). 아세틸-CoA 아세틸트랜스퍼라제 활성의 검출 하한치는 0.006 U/mg이었다.

HMG-CoA 신타제 분석. HMG-CoA 신타제는 혼다(Honda) 등의 방법[Hepatology, 27:154-159, 1998]에 따라 분석하였다. 상기 분석에서, 아세틸-CoA 및 아세토아세틸-CoA로부터 HMG-CoA의 생성은 HPLC에 의해 반응 생성물 및 기질을 분리함으로써 직접 측정한다. 조 추출물은 50mM 트리스-HCl 완충액(pH 8.0) 중에서 제조하였다. 반응 혼합물(0.1 ml)은 50mM 트리스-HCl 완충액(pH 8.0), 0.1mM EDTA, 20mM MgCl₂, 0.1mM 아세토아세틸-CoA, 0.8mM 아세틸-CoA 및 조 추출물을 함유하였다. 반응물을 30 ℃에서 2 분간 예비배양한 다음 조 추출물을 가하였다. 30 ℃에서 5 분간 반응시킨 후에, 0.2 ml의 200mM 테트라-부틸 암모늄 포스페이트(TBAP, 메탄올-물(3:2, 최종 pH는 5.5였음)에 용해시켰으며 내부 회수 기준으로 0.2mM 프로피오닐-CoA를 함유함)를 가하여 반응을 중지시켰다. 이어서, 혼합물을 4 ℃에서 21,000xg로 3 분간 원심분리하고 계속하여 역상 이온-쌍 HPLC로 분석할 때까지 얼음 위에 두었다. HMG-CoA 및 프로피오닐-CoA를 노바-팩(Nova-Pak) C18 컬럼(3.9 x 150 mm, 미국 매사추세츠주 밀리포드 소재의 워터스 코포레이션(Waters Corporation))을 사용하여 아세틸-CoA 및 아세토아세틸-CoA로부 터 분리하였다. 주입 부피는 20 μl이고, 이동상은 메탄올-물(1:1, 최종 pH: 5.5)에 용해시킨 50 mM TBAP였으며, 유량은 1.0 ml/분이었다. HMG-CoA 및 프로피오닐-CoA는 254 nm에서의 흡광도로 측정하였다. 반응에서 생성된 HMG-CoA는 인증된 HMG-CoA를 사용하여 제작된 표준 곡선과 비교하여 정량하였다. 활성은 U/mg 단백질로 정의하였다. 활성 1 유니트는 생성된 1 나노몰 HMG-CoA/분이다. HMG-CoA 신타제의 검출 하한치는 약 1 U/mg이었다.

HMG-CoA 리덕타제 분석. 50 mM KCl, 1 mM EDTA 및 프로테아제 억제제 칵테일(미국 미저리주 세인트 루이스 소재의 시그마 케미칼 캄파니(Sigma Chemical Co.), 카탈로그 #P-2714)을 함유하는 25mM 인산 칼륨 완충액(pH 7.2) 중에서 조 추출물을 제조하였다. 분석은 타카하시(Takahashi) 등의 방법[J. Bcateriol., 181:1256-1263, 1999]에 따라 수행하였다. 상기 분석은 340 nm에서 NADPH의 HMG-CoA 의존성 산화를 분광측정법에 의해 측정한다. 반응 혼합물은 25mM 인산 칼륨 완충액(pH 7.2), 50mM KCl, 1mM EDTA, 5mM 디티오트레이톨, 0.3mM NADPH, 0.3mM R,S-HMG-CoA 및 조 추출물을 함유하였다. 반응은 30 ℃에서 수행하였으며 HMG-CoA를 첨가하여 개시하였다. 340 nm에서 NADPH의 HMG-CoA 의존성 산화를 스펙트라맥스 플러스 플레이트 판독기(미국 캘리포니아주 서니베일 소재의 몰레큘라 디바이스 코포레이션) 및 석영 마이크로 플레이트를 이용하여 관찰하였다(임의의 표준 분광광도계도 또한 사용할 수 있다). 활성(U/mg 단백질로 표시)은 NADPH를 사용하여 제작된 표준 곡선을 이용하여 계산하였다(1 유니트의 활성 = 1 μ몰의 산화된 NADPH). HMG-CoA 리덕타제 활성의 검출 하한치는 0.03 U/mg이었다.

메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 디포스페이트 데카복실라제 분석. 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 디포스페이트 데카복실라제에 대한 기질 제조 및 분석 절차는 팝잭(Popjak)의 문헌 [Methods Enzymol., 15:393-425, 1969]에 상세히 기술되어 있다. 모든 분석에 있어, 1 유니트의 효소 활성은 생성된 생성물 1 μ몰/분으로 정의한다. 상기 분광측정 및 방사성크로마토그래피 분석 이외에, 예를 들면, 반응 기질과 생성물의 HPLC 분리를 이용하는 대체 방법도 이용할 수 있다. 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 디포스페이트 데카복실라제의 검출 하한치는 전형적으로 약 0.001 U/mg 단백질이다.

IPP 이소머라제 분석. 50 mM 트리스-HCl 완충액(pH 7.5) 중에서 조 추출물을 제조하였다. 분석은 스퍼전(Spurgeon) 등의 방법[Arch. Biochem. Biophys., 230:445-454, 1984]에 따라 수행하였다. 상기 분석은 IPP와 DMAPP의 산-불안정성의 차이를 기초로 한다. 반응 혼합물(최종 부피 0.1 ml)은 50mM 트리스-HCl 완충액(pH 7.5), 2mM 디티오트레이톨, 5mM MgCl₂, 20μM [1-¹⁴C]-IPP 및 조 추출물을 함유하였다. 반응은 30 ℃에서 15 분간 수행하였으며 0.3 ml의 진한 HCl:메탄올(4:1) 혼합물을 가하고 37 ℃에서 20 분간 더 배양함으로써 종료하였다. 헥산(0.9 ml)을 가하고 튜브를 혼합하였다(볼텍스 혼합기를 사용하여 10 초간 4회). 원심분리(21,000xg, 5 분) 후에, 0.6 ml의 헥산층을 섬광 병으로 옮기고, 섬광 유체를 가하고 방사능을 계수하였다. 활성은 U/mg 단백질로 나타낸다. 1 유 니트의 활성은 산 불안정 생성물에 혼입된 1 p몰 [1-¹⁴C]-IPP/분이다. IPP 이소머라제 활성의 검출 하한치는 1 U/mg이었다.

FPP 신타제 분석. 50mM 트리스-HCl 완충액(pH 8.0) 중에서 조 추출물을 제조하였다. FPP 신타제 분석 절차는 IPP와 FPP의 산 불안정성의 차이를 기초로 하여 전술한 IPP 이소머라제 분석법과 유사하다[Spurgeon et al., Arch. Biochem.Biophys., 230:445-454, 1984]. 반응 혼합물(최종 부피 0.1 ml)은 50mM 트리스-HCl 완충액(pH 8.0), 2mM 디티오트레이톨, 5mM MgCl₂, 20μM [1-¹⁴C]-IPP, 25μM GPP(제라닐 피로포스페이트) 및 조 추출물을 함유하였다. 반응은 30 ℃에서 15 분간 수행하였으며 0.3 ml의 진한 HCl:메탄올(4:1) 혼합물을 가하고 37 ℃에서 20 분간 더 배양함으로써 종료하였다. 헥산(0.9 ml)을 가하고 튜브를 혼합하였다(볼텍스 혼합기를 사용하여 10 초간 4회). 원심분리(21,000xg, 5 분) 후에, 0.6 ml의 헥산층을 섬광 병으로 옮기고, 섬광 유체를 가하고 방사능을 계수하였다. 효소 활성 단위 및 검출 하한치는 IPP 이소머라제에 대해 상기에서 정의한 바와 동일하였다. 높은 IPP 이소머라제 활성으로 인해 FPP 신타제 활성 측정이 방해를 받는 경우, 조 추출물을 5mM 요오도아세트아미드의 존재하에 5 분간 예비배양하여 IPP 이소머라제 활성을 억제할 수 있다.

GGPP 신타제 분석. 2 mM 디티오트레이톨을 함유하는 50 mM 트리스-HCl 완충액(pH 8.0) 중에서 조 추출물을 제조하였다. GGPP 신타제는 쿠즈구치(Kuzuguchi) 등의 절차[J. Biol. Chem., 274:5888-5894, 1999]에 따라 분석하였다. 이 분석은 FPP 신타제에 대해 전술한 바와 동일한 원리를 기초로 한다. 반응 혼합물(최종 부피 0.1 ml)은 50mM 트리스-HCl 완충액(pH 8.0), 2mM 디티오트레이톨, 5mM MgCl₂, 20μM [1-¹⁴C]-IPP, 25μM FPP 및 조 추출물을 함유하였다. 모든 반응 조건 및 섬광 계수용 샘플의 후속 처리는 FPP 신타제에 대해 전술한 바와 동일하였다. IPP 이소머라제 활성을 억제하기 위해 추출물을 요오도아세트아미드로 처리하는 방법도 또한 상기에서와 같이 이용할 수 있다. 효소 활성 단위 및 검출 하한치는 IPP 이소머라제에 대해 상기에서 정의한 바와 동일하였다.

아세토아세틸-CoA 리덕타제 분석. 50mM KCl 및 5mM 디티오트레이톨을 함유하는 50mM 트리스-HCl 완충액(pH 7.5) 중에서 조 추출물을 제조하였다. 아세토아세틸-CoA 리덕타제는 조한과 코펠런드(Chohan and Copeland)의 절차[Appl. Environ. Microbiol., 64:2859-2863, 1998]에 따라 분석하였다. 상기 분석은 340 nm에서 NADPH의 아세토아세틸-CoA-의존성 산화를 분광측정법에 의해 측정한다. 반응 혼합물(1 ml)은 50mM 트리스-HCl 완충액(pH 8.5), 15mM MgCl₂, 250μM NADPH 및 100μM 아세토아세틸-CoA를 함유하였다. 반응은 30 ℃에서 석영 큐벳에서 수행하며 아세토아세틸-CoA의 첨가에 의해 개시된다. 활성(U/mg 단백질로 표시)은 NADPH를 사용하여 제작한 표준 곡선을 이용하여 계산하였다(1 유니트의 활성 = 1 μ몰의 산화된 NADPH/분). 아세토아세틸-CoA 리덕타제 활성의 검출 하한치는 약 0.01 U/mg이었다.

실시예 2: 파라코커스 로서 플라보박테리움 속의 분류학적 재분류

본 실시예는 제아잔틴-생산 세균으로 이전에 지정된 플라보박테리움속 균주 R-1512(ATCC 21588)를 파라코커스속 균주 R-1512(ATCC 21588)로 분류학적으로 재분류하는 과정을 기술한다. 포괄적인 게놈 및 생화학적/생리학적 분석은 세균 분류를 위한 과학적 기준으로 현재 용인되어 있는 최첨단 기술의 방법을 이용하여, 벨지안 코오디네이티드 콜렉션즈 오브 마이크로오거니즘스/래보러토리움 부어 마이크로바이올로지, 유니버시타이트 젠트(Belgian Coordinated Collections of Microorganisms/Laboratorium voor Microbiologie, Universiteit Gent; BCCM(등록상표)/LMG)에 의해 수행하였다. 파라코커스속 균주 R-1512 이외에, 파라코커스 속에 속하는 여러 다른 세균들도 연구에 포함되었다(표 2에 요약되어 있음).

균주 R1534 및 R114는 고전적 돌연변이유발 및 개선된 제아잔틴 생산에 대한 선별에 의해 균주 R-1512로부터 유도된 돌연변이체이다. 1차 선별은 최고 색도 생성 콜로니를 선별함으로써 달성하였다. 2차 선별은 실시예 1에 따른 HPLC 방법에 의해 액체 배지에서 수행하였다.

균주 R-1506은 균주 R-1512를 제공한 주변 미생물의 동일한 초기 선별로부터 수득된 독립적인 단리물이다. 균주 MBIC3024, MBIC3966, MBIC4017 및 MBIC4020은 그의 16S rDNA 유전자의 뉴클레오타이드 서열(DNA 서열은 공공 EMBL 데이터베이스에 기탁되었다, 표 5 참조)에 의해 파라코커스 속의 일원으로 확인되었다. 파라코커스 마르쿠시(Paracoccus marcusii) DSM 11574^T 및 파라코커스 카로티니파시엔스(Paracoccus carotinifaciences) E-396^T는 카로티노이드-생산 세균의 최근 기재된 기준 균주이다[Harker et al., Int. J. Syst. Bacteriol., 48:543-548, 1998; Tsubokura et al., Int. J. Syst. Bacteriol., 49:277-282, 1999]. 파라코커스 솔벤티보란스(Paracoccus solventivorans) DSM 6637^T는 파라코커스 속의 일원이지만 사용된 다른 세균과는 관련이 적은 "대조" 균주로서 포함되었다.

예비 실험 결과 다음의 결론을 얻었다. 본원에 나타낸 각각의 방법은 유기체들 간의 분류학적 연관성 또는 상대적 유사도를 정의하는 공지된 능력을 갖는다. 세균 분류군을 서술하는 방법 및 그 용도가 문헌 [Van Damme et al., Microbiological Review, 60:407-438, 1996; and Janssen et al., Microbiology, 142:1881-1893, 1996]에 기술되어 있으며 상세히 비교되어 있다.

(1) 균주 R1534 및 R114의 세포막의 지방산 분석 결과 두 균주는 매우 유사한 것으 로 나타났으며 이들 균주들이 파라코커스 데니트리피칸스(P. denitrificans) 및 로도박터 캡슐라터스(Rhodobacter capsulatus)에 분류학적으로 관련되는 것으로 나타났다.

(2) 세포 단백질의 1차원 겔 전기영동 결과 R1534와 R114간에 높은 유사성(즉, 종내(intraspecific) 수준의 연관성)을 나타내었으나, 프로필은 이들 균주가 로도박터 캡슐라터스 또는 파라코커스 데니트리피칸스로 지정됨을 입증하지는 못했다.

(3) 균주 R1534 및 로도박터 캡슐라터스 LMG2962^T 및 파라코커스 데니트리피칸스 LMG4218^T 사이의 DNA:DNA 하이브리드화에 의해 균주 R1534가 로도박터 캡슐라터스도 아니며 파라코커스 데니트리피칸스도 아닌 것으로 확인되었다.

(4) 균주 R1534 및 R114로부터 16S rDNA 유전자의 서열분석 결과 이들 유기체가 파라코커스 속에 속하지만 새로운 종을 나타내는 것으로 밝혀졌다. 가장 높은 서열 유사도는 파라코커스속 균주 MBIC3966, MBIC4020 및 MBIC3024의 16S rDNA 유전자에서 관찰되었다.

(5) 증폭 단편 길이 다형현상(Amplified Fragment Length Polymorphism, AFLP(등록상표))을 이용한 균주 R1534 및 R-1512의 DNA 지문법은 두 균주들로부터의 게놈 DNA의 높은 전체 유사성을 보여 종내 연관성을 나타내었다(즉, AFLP(등록상표)는 동일 종의 두 구성원 사이에서 구별될 수 있다).

하단에, 파라코커스속 균주 R-1512(및 그의 돌연변이 유도체 R1534 및 R114)에 대한 본 발명의 포괄적 분류학 연구의 결과 및 결론을 나타내었다.

16S rDNA 서열분석 및 계통발생적 연구. 표 2에 나타낸 세균은 LMG 배지 185(필요한 경우 1.5% 딥코 박토 아가(Difco Bacto agar)를 보충한 (TSA) BBL 11768)에서 성장시켰다. 게놈 DNA는 니만(Niemann) 등의 프로토콜[J. Appl. Microbiol., 82:477-484, 1997]에 따라 제조하였다. 16S rDNA를 암호화하는 유전자는 표 3에 나타낸 프라이머를 사용하여 중합효소 연쇄반응(PCR)에 의해 균주 R-1512, R1534, R114 및 R-1506으로부터 얻은 게놈 DNA로부터 증폭시켰다.

PCR-증폭 DNA는 키아퀵 PCR 정제 키트(Qiaquick PCR Purification Kit; 독일 힐덴 소재의 키아겐 게엠베하(Qiagen GmbH))를 사용하여 정제하였다. 완전한 서열분석은 "아비 프리즘(ABI PRISM, 등록상표) 빅 다이(Big Dye, 등록상표) 터미네이터 주기 서열분석 예비 반응 키트(Terminator Cycle Sequencing Ready Reaction Kit; 앰플리태크(AmpliTaq, 등록상표) DNA 폴리머라제, Fs 사용)를 사용하여 어플라이드 바이오시스템즈, 인코포레이티드(Applied Biosystems, Inc.) 377 DNA 서열분석기 및 제조업자(미국 캘리포니아주 포스터 시티 소재의 퍼킨-엘머, 어플라이드 바이오시스템즈 디비젼(Perkin-Elmer, Applied Biosystems Division))의 프로토콜을 이용하여 수행하였다. DNA 서열분석에 사용된 프라이머는 표 4에 나타내었다.

5개의 전진 프라이머와 3개의 역방향 프라이머를 사용하여 매우 믿을 수 있는 구성된 서열 데이터를 보장하는 서열들의 부분 겹침을 수득하였다. 서열 구성은 프로그램 오토어셈블러(AutoAssembler)(미국 캘리포니아주 포스터 시티 소재의 퍼킨-엘머, 어플라이드 바이오시스템즈 디비젼)를 이용하여 수행하였다. 계통발생적 분석은 국제 뉴클레오타이드 서열 라이브러리 EMBL로부터 수집한 소 리보솜 소단위 서열의 정렬에 공통 서열(균주 R-1512, R1534, R114 및 R-1506으로부터)을 혼입시킨 후 소프트웨어 패키지 진콤파르(GeneCompar, 등록상표)(v. 2.0, 어플라이드 매쓰(Applied Maths) B.V.B.A., 벨기에 코트릿크 소재)를 이용하여 수행하였다. 상기 정렬은 100%의 개방 간격 페널티 및 0%의 단위 간격 페널티를 이용하여 쌍으로 계산하였다. 유사성 매트릭스는 0%의 간격 페널티를 사용하여 미지의 기본값은 폐기한 후 상동성 계산에 의해 작성하였다. 작성된 수형도는 옆자리-결합 방법을 이용하여 구성하였다.

파라코커스속 균주 R-1512로부터의 16S rDNA 유전자의 뉴클레오타이드 서열은 서열번호: 12로 나타내었다. 균주 R-1512와 그의 가장 근접한 관련 균주간의, 16S rDNA 서열 유사성 퍼센트로 나타낸 차이 매트릭스를 표 5에 나타내었다. 균주 R-1512와 그의 돌연변이 유도체 R1534 및 R114로부터의 서열들은 동일하였다. R-1506의 서열은 R1534 및 R114의 서열과 하나의 뉴클레오타이드만이 상이하였다. 이로써 균주 R-1512와 R-1506이 계통발생적으로 매우 연관되며 동일 종에 속할 가능성이 있음(DNA:DNA 하이브리드화에 의해 확인, 하기 참조)이 입증되었다. R-1512 및 R-1506 서열과 EMBL 라이브러리에서 공적으로 입수가능한 서열들의 비교 결과 R-1512 및 R-1506은 파라코커스 속에 속하였다. 그러나, 현재 분류학적으로 타당하게 기재된 모든 파라코커스 종에서 관찰된 서열 유사성은, 일반적으로 종 수준에서 가능한 연관성에 대한 한계로 인정되는 값인 97% 미만이었다[Stackebrandt and Goebel, Int. J. Syst. Bacteriol., 44:846-849, 1994]. 이것은 균주 R-1512(및 그의 돌연변이 유도체) 및 R-1506이 하나 또는 두 개의 새로운 파라코커스 종에 속함을 입증하였다. 97%(종 수준에서 가능한 관계에 대해 의미있는 값)보다 높은 서열 유사성은 4개의 지칭되지 않은 파라코커스 균주와 균주 R-1512, R1534, R114 및 R-1506 간에서 관찰되어, 하나 이상의 지칭되지 않은(MBIC) 균주들이 종 수준에 서 균주 R-1512 및 R-1506과 관련될 수 있음을 시사하였다. 집단 분석(파라코커스속 균주 R-1512, R1534, R114, R-1506, MBIC3966과, 파라코커스 속의 다른 구성원들 간의 계통발생적 연관성을 나타내는 계통발생 수형도)을 근거로, 균주 R-1512, R1534, R114, R-1506 및 4개의 지칭되지 않은 파라코커스 균주(MBIC3024, MBIC3966, MBIC4017 및 MBIC4020)를 종 연관성을 분석하기 위한 DNA:DNA 하이브리드화 실험을 위해 선택하였다.

DNA:DNA 하이브리드화 및 G+C 함량 측정. 표 5에 나타낸 세균을 LMG 배지 185에서 성장시켰다. 게놈 DNA는 윌슨(Wilson)의 프로토콜[In Ausabel et al.(eds.), Current Protocols in Molecular Biology, Greene Publishing and Wiley Interscience, New York, 2.4.1-2.4.5, 1987]에 따라 제조하였다. DNA의 G+C 함량은 로간(Logan) 등[Int. J. Syst. Evol. Microbiol., 50:1741-1753, 2000]에 의해 수정된 메스바흐(Mesbach) 등의 방법[Int. J. Syst. Bacteriol., 39:159-167, 1989]에 따라 HPLC로 측정하였다. 기록된 값은 동일한 DNA 샘플에 대한 상기 측정치들의 평균이다. DNA:DNA 하이브리드화는 드 레이(De Ley) 등이 기술한 바와 같은 초기 복원율 방법[Eur. J. Biochem., 12:133-142, 1970]을 이용하여 수행하였다. 하이브리드화 온도는 81.5 ℃이었다. 상기 방법에 대해, 보테린(Vauterin) 등에 의해 ＋/-5.8%의 평균 편차가 보고된 바 있다[Int. J. Syst. Bacteriol., 45:472-489, 1995]. 세균 DNA의 G+C 함량 및 DNA 하이브리드화 실험의 결과는 표 6에 요약하였다.

균주 R-1512, R1534, R114, R-1506 및 MBIC3966은 70%(종 서술에 일반적으로 허용되는 한계[Wayne et al., Int. J. Syst. Bacteriol., 37:463-464, 1987])보다 높은 DNA 상동성을 나타내었으므로, 파라코커스 속 내의 동일한 종에 속한다. 상 기 다섯 균주들의 G+C 함량은 66.9 내지 67.7%로 달라졌으므로, 명확히 정의된 종에 대한 특성인 1% 이내에 속한다. 다른 한편으로, 균주 MBIC3024, MBIC4017 및 MBIC4020과 균주 R-1512, R1534, R114, R-1506 및 MBIC3966 간의 낮은 DNA 상동성은 MBIC3024, MBIC4017 및 MBIC4020이 각각 파라코커스 속과 상이한 게놈 종에 속함을 나타내었다.

AFLP를 이용한 DNA 지문법. AFLP(등록상표)는 제한효소 단편의 선택적 증폭 및 선택적 가시화를 통한 전체 게놈 DNA 지문법에 대한 PCR을 기본으로 하는 기술이다[Vos et al., Nucleic Acids Research, 23:4407-4414, 1995; Janssen et al., Microbiology, 142:1881-1893, 1996]. 상기 분석에서는, 파라코커스속 균주 R-1512, R1534, R114, R-1506, MBIC3966 및 파라코커스 마르쿠시 DSM 11574^T를 종내 연관성을 평가하기 위해 비교하였다. 이들 세균은 LMG 배지 185에서 성장시켰다. 이들 세균 각각으로부터 취한 게놈 DNA는 윌슨의 프로토콜에 따라 제조하였다(윌슨의 상기 문헌 참조). 정제된 DNA를 두 개의 제한 효소, 4-염기 절단효소 및 6-염기 절단효소로 절단하였다. 이렇게, 2개의 상이한 말단을 가지며 효과적인 PCR에 적합한 크기를 갖는 한정된 수의 단편들이 수득되었다. 하나의 양립가능한 말단을 함유하는 어댑터(15 내지 20 염기쌍의 소(小) 이중-가닥 DNA 분자)를 제한효소 단편의 적절한 "점착성" 말단에 접합시켰다. 두 어댑터 모두 제한효소 반자리(halfsite)-특이적이며 상이한 서열을 갖는다. 이들 어댑터는 PCR 프라이머에 대해 결합 부위로 작용한다. 이때, 사용된 제한 효소는 ApaI(6염기절단효소(hexacutter), 인지 서열 GGGCC/C) 및 TaqI(4염기절단효소(tetracutter), 인지 서열 T/GCA)이었다. 제한 효소에 의한 절단에 의해 생성된 점착성 말단에 접합된 어댑터의 서열은 표 7에 나타내었다(서열번호: 13 내지 22). 제한효소 단편의 선택적 증폭에 PCR을 사용하였다. PCR 프라이머는 제한효소 단편의 어댑터 말단과 특이적으로 어닐링된다. 프라이머는 제한효소 부위를 지나 단편으로 연장되는 소위 "선택성 염기" 하나를 그 3' 말단에 포함하기 때문에, 제한효소 부위에 인접한 적절한 상보성 서열을 갖는 제한효소 단편들만을 증폭시켰다. 사용된 6개의 PCR 프라이머 조합의 서열도 또한 표 7에 나타내었다.

증폭 후에, PCR 산물을 DNA 서열분석기(ABI 377)를 사용하여 고분해 폴리아크릴아미드 겔 상에서 그 길이에 따라 분리하였다. 6-염기쌍 절단효소에 의해 형 성된 제한효소 반자리에 특이적인 어댑터를 함유하는 단편들을, 상응하는 프라이머를 ³²P로 표지한 5'-말단에 기인한 자동방사선사진법으로 가시화하였다. 전기영동 패턴은 겔콤파르(GelCompar, 등록상표) 4.2 소프트웨어(벨기에 코트릿크 소재의 어플라이드 매쓰, B.V.B.A.)를 사용하여 스캐닝하고 수적으로 분석하고, 피어슨(Pearson) 곡선 정합 계수를 이용하여 집단화하였으며, 비가중된 쌍 그룹은 연결을 평균한 것이다(집단화 방법은 스니쓰(Sneath) 및 소칼(Sokal)이 문헌 [Numerical Txsonomy, Freeman & Son, San Francisco, 1973]에서 고찰하였다).

모든 6개의 프라이머 조합(PC A-H, 표 7)에서, 파라코커스속 균주 R-1512, R1534 및 R114의 DNA 지문은 동일하지 않은 경우 매우 유사하였다. 미세한 차이가 관찰된 경우, 재현성은 평가하지 않았다. 균주 R1534 및 R114가 균주 R-1512에서 유도되었기 때문에 세 균주들 간에 높은 유사성 또는 동일성이 예상되었다. 모든 프라이머 조합에 있어, 균주 R-1512, R1534 및 R114는 똑같이 새로운 파라코커스 종에 속하는 두 균주 R-1506 및 MBIC3966과 명백히 구별되었다. 그러나, 지문은 균주 R-1512, R1534 및 R114가 R-1506 또는 MBIC3966과 더 관련됨을 명백히 보여주지는 못한다. 사용된 조건하에서, 새로운 종의 5개 균주가 약 58% 유사성(이 값은 6회의 AFLP(등록상표) 실험(6개의 프라이머 조합)에서 새로운 종들의 분기점의 6개 값의 평균이다)의 평균 수준에 밀집되고, 상기 집단은 계통발생적으로 관련된 카로티노이드-생성 파라코커스 종의 기준 균주인 파라코커스 마르쿠시 DSM 11574^T의 프로필과 명백히 차별될 수 있다. 파라코커스 마르쿠시 DSM 11574^T의 6개 분기점들과 새로운 종들의 평균 유사성 값은 약 11%이었다.

지방산 분석. 파라코커스속 균주 R-1512, R1534, R114, R-1506, MBIC3966의 세포막의 지방산 조성을 기준 균주 파라코커스 마르쿠시 DSM 11574^T, 파라코커스 카로티니파시엔스 E-396^T 및 파라코커스 솔벤티보란스 DSM 6637^T와 비교하였다. 세균은 28 ℃에서 LMG 배지 185중에서 24 시간동안 성장시켰다. 지방산 조성은 상업적 시스템 MIDI(미국 델라웨어주, 마이크로바이알 아이덴티피케이션 시스템, 인코포레이티드(Microbial Identification System, Inc.))를 이용하여 기체 크로마토그래피로 측정하였다. 지방산의 추출 및 분석은 MIDI 시스템의 지시에 따라 수행하였다. 표 8은 시험한 모든 균주에 대한 결과를 요약한 것이다. 새로운 파라코커스 종의 다섯 균주(R-1512, R1534, R114, R-1506, MBIC3966)에 대해, 평균 프로필을 산출하였다. 8개 유기체는 모두 주 화합물로서 18:1w7c를 가지면서, 세포막의 필적할만한 지방산 조성을 나타내었다. 새로운 파라코커스 종과 세가지 기준 균주 사이에 지방산 조성에 있어 미세한 차이만이 관찰되었다.

성장을 위한 탄소 공급원의 이용. 탄소 공급원의 호기성 이용을 시험하기 위해, 95개의 기질을 함유하는 바이오로그(BIOLOG)-SF-N 마이크로플레이트(Microplate) 마이크로 플레이트(미국 캘리포니아주 헤이워드 소재의 바이오로그 인코포레이티드(Biolog Inc.))를 사용하였으나, 단 웰 E6의 기질은 D,L-락트산의 통상적인 나트륨염 대신 D,L-락트산 메틸 에스테르였다. 표 9에 동정된 균주들 각각의 세포는 28 ℃에서 LMG 배지 12(마린 아가(Marine Agar), 딥 코 0979)에서 24 시간동안 성장시켰다. 0.5 맥파랜드(McFarland) 유니트에 해당하는 밀도를 갖는 세포 현탁액을 멸균 증류수에 제조하였다. 상기 현탁액으로부터 18 방울을 21 ml의 AUX 배지(API 20NE, 프랑스 소재의 바이오메리위(bioMerieux))로 옮기고 부드럽게 혼합하였다. 0.1 ml의 현탁액을 바이오로그 마이크로플레이트의 각 웰로 옮기고, 플레이트를 30 ℃에서 배양하였다. 48 시간후 및 6 일후에 성장을 육안으로 검사하였다. 또한, 6 일째에 바이오로그 플레이트 판독기를 사용하여 마이크로 플레이트를 판독함으로써 시각적 스코어를 확인하였다.

바이오로그 분석의 결과는 표 9에 나타내었다. 성장(양성 반응)은 기질이 없는 기준 웰에 비해 증가된 혼탁도로서 측정하였다. 양호한 성장(＋), 약한 성장(±) 및 성장 없음(-) 간에 구분을 하였다. 괄호 안의 결과는 48 시간후에 수득한 결과와 상이한 경우 6 일 후에 얻은 결과이다. 물음표는 6 일째의 명확하지 않은 결과를 나타낸 것이다. 새로운 파라코커스 종(R-1512, R1534, R114, R-1506 및 MBIC3966)을 이루는 다섯 개 균주 모두에 의한 성장에, 시험한 95가지 탄소 공급원 중에서 12가지는 사용될 수 있고, 47가지는 사용될 수 없었다. 새로운 파라코커스 종은 7가지 탄소 공급원(아도니톨, i-에리트리톨, 젠티오바이어스, β-메틸글루코사이드, D-솔비톨, 자일리톨 및 퀸산)을 사용할 수 없는 그 특성에 의해, 2개의 다른 카로티노이드-생성 세균(파라코커스 마르쿠시 DSM 11574^T 및 파라코커스 카로티니파시엔스 E-396^T)과 구분될 수 있다. 새로운 파라코커스 종의 5가지 구성원 모두에 의해 이용된 2개의 탄소 공급원(L-아스파라긴 및 L-아스파트산)은 파라 코커스 마르쿠시 DSM 11574^T에 의한 성장에는 사용되지 않았다.

생화학 시험. 선택된 생화학적 특징들을 API 20NE 스트립(프랑스, 바이오메리위)을 사용하여 시험하였다. 표 10에 동정되어 있는 세균 균주들 각각의 세포를 28 ℃에서 LMG 배지 12 상에서 24 시간동안 성장시켰다. 세포 현탁액을 제조하고 제조업자의 지시에 따라 스트립을 접종하였다. 스트립을 28 ℃에서 배양하고 결과는 24 시간 및 48 시간후에 측정하였다. 결과는 표 10에 요약되어 있다. 시험한 9가지 특징들 중에서, 한가지(우레아제 활성)만이 새로운 파라코커스 종의 5개 균주들간에 가변적 반응을 제공하였다. 상기 9가지 시험은 새로운 파라코커스 종들과 파라코커스 마르쿠시 DSM 11574^T 및 파라코커스 카로티니파시엔스 E-396^T 사이에서 차별되지 않았다.

생리학적 시험. 파라코커스 마르쿠시 DSM 11574^T, 파라코커스 카로티니파시엔스 E-396^T 및 파라코커스 솔벤티보란스 DSM 6637^T와 함께, 새로운 파라코커스 종 의 다섯 균주들에 대해 여러 생리학적 및 형태학적 시험을 수행하였다. 각 시험에 이용된 방법들은 다음과 같았다.

성장을 위한 온도 범위. 세포는 28 ℃에서 LMG 배지 12에서 24 시간동안 성장시켰다. 1 내지 2 맥파랜드 유니트의 밀도를 갖는 세포 현탁액을 멸균 증류수로 제조하였다. 상기 현탁액으로부터, 3 방울을 LMG 배지 12의 아가 표면위로 옮겼다. 한 방울을 도말하여 희석하고, 나머지 두 방울은 휘젓지 않고 방치하였다. 플레이트를 10 ℃, 25 ℃, 30 ℃, 33 ℃, 37 ℃ 및 40 ℃에서 호기성 조건하에 배양하고, 24 시간, 48 시간 및 5 일 후에 성장을 조사하였다. 성장은 30 ℃에서의 성장(즉, "대조군")에 대해 시각적 성장(방울들에서의 융합성, 및 희석된 접종원의 도말선에서의 콜로니로서)으로 측정하였다. 스코어는 (대조 플레이트에 대해) 다음과 같이 매겼다; 우수한 성장(＋＋), 양호한(대조군과 동등한) 성장(＋), 약한 성장(±), 불량한 성장(＋--), 및 성장 없음(-). 괄호안의 결과는 휘젓지 않은 방울들에서의 융합성 성장과 상이한 경우 도말선에서 관찰된 결과들이다.

내염성(salt tolerance). 세포를 28 ℃에서 LMG 배지 12에서 24 시간동안 성장시켰다. 1 내지 2 맥파랜드 유니트의 밀도를 갖는 세포 현탁액을 멸균 증류수로 제조하였다. 상기 현탁액으로부터, 3 방울을 3%, 6% 및 8%의 최종 농도에 이르도록 NaCl을 보충한 LMG 배지 12의 아가 표면위로 옮겼다. 한 방울은 도말하여 희석하고, 나머지 두 방울은 휘젓지 않고 방치하였다. 플레이트를 28 ℃에서 호기성 조건하에 배양하고, 24 시간, 48 시간 및 5 일 후에 성장을 조사하였다. 성장은 NaCl을 첨가하지 않은 성장(대조군)에 대해 시각적 성장(방울들에서의 융합성, 및 희석된 접종원의 도말선에서의 콜로니로서)으로 측정하였다. 스코어는 (대조 플레이트에 대해) 다음과 같이 매겼다; 우수한 성장(＋＋), 양호한(대조군과 동등한) 성장(＋), 약한 성장(±), 불량한 성장(＋--), 및 성장 없음(-). 괄호안의 결과는 휘젓지 않은 방울들에서의 융합성 성장과 상이한 경우 도말선에서 관찰된 결과들이다.

성장을 위한 pH 범위. 세포를 28 ℃에서 LMG 배지 12에서 24 시간동안 성장시켰다. 1 내지 2 맥파랜드 유니트의 밀도를 갖는 세포 현탁액을 멸균 증류수로 제조하였다. 상기 현탁액으로부터, 3 방울을 가압멸균(autoclaving) 후 pH 6.1, pH 6.3, pH 7.0, pH 7.7, pH 8.1 및 pH 9.1의 최종 pH를 제공하도록 조절된 pH를 갖는 10 ml의 액체 LMG 배지 12를 함유하는 튜브로 옮겼다. 배양액을 28 ℃에서 호기적으로(진탕하에) 배양하였다. 24 시간, 48 시간, 3 일 및 6 일째에 성장을 조사하였다. 성장은 pH 7.0에서의 성장(대조군)에 대해 증가된 혼탁도(바이오로그 탁도계를 사용하여 투과율(%)로 측정)로 측정하였다. 스코어는 (대조군에 대해) 다음과 같이 매겼다; 우수한 성장(＋＋), 양호한(대조군과 동등한) 성장(＋), 약한 성장(±), 불량한 성장(＋--), 및 성장 없음(-).

전분 가수분해. 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 한번의 도말로서 0.2% 가용성 전분을 보충한 LMG 배지 12의 아가 표면위로 옮겼다. 이어서, 플레이트를 28 ℃에서 호기성 조건하에 배양하였다. 균주들이 양호한 성장을 나타내면(48 시간후), 플레이트 를 루골(lugol) 용액(증류수 중 0.5% I₂ 및 1% KI)으로 넘쳐흐르게 했다. 가수분해는 성장에 따른 투명 대역(전분이 가수분해되지 않은 아가의 청색에 대비하여)으로 측정하였다.

탈질소반응. 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 1% KNO₃를 보충한 반고체(0.1% 아가) LMG 배지 12를 함유하는 튜브내로 천자배양(stab)하였다. 플레이트를 28 ℃에서 5 일간 배양하였다. 탈질소반응(니트레이트로부터 N₂)은 천자배양에 따른 기체 발생으로 측정하였다.

전자 수용체를 첨가하지 않고 혐기성조건에서의 성장. 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 LMG 배지 12의 아가 표면위에 도말하였다. 아가 플레이트를 30 ℃에서 혐기성 조건(약 10% CO₂ + 약 90% N₂)하에 배양하였다. 플레이트는 24 시간 및 5 일 후에 성장을 조사하였다. 성장은 호기성(대조군) 조건에 대해 육안으로 측정하였다. 스코어는 (대조군에 대해) 다음과 같이 매겼다; 우수한 성장(＋＋), 양호한(대조군과 동등한) 성장(＋), 약한 성장(±), 불량한 성장(＋--), 및 성장 없음(-).

글루코스를 첨가하여 혐기성 조건하에서의 성장(발효). 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 휴와 레이프슨(Hugh and Leifson)[J. Bacteriol., 66:24-26, 1953]의 기본 아가 배지를 함유하는 튜브내에 천자배양하였다. 배지 상부에 파라핀 오일을 첨가하고, 튜브를 30 ℃에서 배양하였다. 튜브는 48 시간 및 5 일 후에 성장 및 산 생성에 대해 조사하였다. 성장은 육안으로 측정하였다. 스코어는 다음과 같이 매겼다; 양호한 성장(＋), 불량한 성장(＋--), 및 성장 없음(-).

전자 수용체로서 KNO₃를 첨가한 혐기성 조건에서의 성장. 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 0.1% KNO₃를 보충한 LMG 배지 12의 아가 표면위에 도말하였다. 플레이트를 30 ℃에서 혐기성 조건(약 10% CO₂ + 약 90% N₂)하에 배양하고, 3 일 후에 성장을 조사하였다. 성장은 호기성(대조군) 조건에 대해 시각적 성장으로 측정하였다. 스코어는 (대조군에 대해) 다음과 같이 매겼다; 우수한 성장(＋＋), 양호한(대조군과 동등한) 성장(＋), 약한 성장(±), 불량한 성장(＋--), 및 성장 없음(-).

카탈라제 및 옥시다제 반응. 세포를 28 ℃에서 LMG 배지 12 플레이트상에서 24 시간동안 성장시켰다. 카탈라제 활성에 대한 양성 결과는 콜로니를 1 방울의 10% H₂O₂에 현탁시킨 후 기포의 생성이었다. 옥시다제 활성에 대한 양성 결과는 콜로니를 1% 테트라메틸파라페닐렌에 침지시킨 여과지 상에 문지른 후 자주-적색의 발색이었다.

콜로니 착색. 세포를 28 ℃에서 LMG 배지 12 상에서 24 시간동안 성장시켰다. 세포 현탁액은 멸균 식염수로 제조하였다. 세포 형태학 및 운동성은 위상차 광학렌즈(1000x 배율)가 장착된 올림퍼스(Olympus) 광학 현미경을 사용하여 현미경으로 관찰하였다.

생리학적 및 형태학적 시험들의 결과는 표 11에 요약되어 있다. 새로운 파라코커스 종의 다섯 균주는 수행된 모든 생리학적 및 형태학적 시험들에서 본질적으로 동일하게 반응하였다. 새로운 파라코커스 종의 다섯 균주 모두에 대해 동일한 반응을 야기하고, 파라코커스 마르쿠시 DSM 11574^T 및/또는 파라코커스 카로티니파시엔스 E-396^T과 상기 유기체들을 구별짓는 시험은 40 ℃에서의 성장, 8% NaCl하에서의 성장, pH 9.1에서의 성장 및 콜로니 착색이었다.

균주 R-1512, R1534, R114 및 R-1506에서의 제아잔틴 생성. 균주 R-1512, R1534, R114 및 R-1506을, (증류수 1 리터당) 5 g 글루코스, 10 g 효모 추출물, 10 g 트립톤, 30 g NaCl 및 5 g MgSO₄·7H₂O를 함유하는 ME 배지에서 성장시켰다. 배지의 pH는 가압멸균으로 살균하기 전에 5N NaOH를 사용하여 7.2로 조정하였다. 모든 배양액(플라스틱 뚜껑이 달린 250-ml 배플 엘렌메이어(Erlenmeyer) 플라스크 중에 25 ml의 부피)을 200 rpm으로 진탕시키면서 28 ℃에서 성장시켰다. 종균 배양액은 냉동 글리세롤화 원종으로부터 접종시키고 밤새 성장시켰다. 분취량을 실험용 플라스크로 옮겨 0.16의 660 nm에서의 초기 흡광도(OD₆₆₀)를 달성하였다. 이어서, 배양액을 28 ℃에서 200 rpm으로 진탕하면서 성장시켰다. 배양 전체에 걸쳐 성장을 조사하고, 6, 10(또는 R114 균주의 경우 15) 및 24 시간째에 실시예 1에 기술한 방법으로 카로티노이드를 분석하기 위해 배양액 분취량을 취하였다.

상기 조건하에서 균주 R-1512, R1534 및 R-1506의 배가 시간은 각각 0.85 시 간, 1.15 시간 및 1.05 시간이었다. 균주 R114는 재현가능하게 2-상 성장 프로필을 나타내었으며; 초기 상에서 균주 R114의 배가 시간은 1.4 시간이었던 반면, 두 번째 상에서의 배가 시간은 3.2 시간이었다.

표 12는 ME 배지에서의 파라코커스속 균주들에 의한 제아잔틴 생성 및 비생성율(Specific Formation)(OD₆₆₀으로 표준화된 제아잔틴 생산율)을 나타낸 것이다. 데이터는 4가지의 독립적 실험들의 평균이며, 각각의 실험내에서 각각의 균주는 한 쌍의 플라스크에서 시험하였다. 모 균주 R-1512에 비해 고전적으로 유도된 돌연변이 균주 R1534 및 R114에서 향상된 제아잔틴 생산을 명백히 볼 수 있다. 균주 R-1506에 의한 제아잔틴 생산은 대략 균주 R-1512와 동일하였다. 어떤 배양액에서도 다른 카로티노이드는 검출되지 않았다.

실시예 3: 제아잔틴-생산 파라코커스 속 균주 R114에서 메발로네이트 경로를 통한 IPP 생합성

파라코커스속 균주 R114에서의 이소프레노이드 전구체의 생합성 유래(즉, 메발로네이트 또는 DXP 경로)를 결정하기 위해, "역생합성(retrobiosynthesis)" 접근방법[Eisenreich and Bacher, In: Setlow(ed.), Genetic Engineering, Principles and Methods, Kluwer Academic/Plenum Publishers, New York, 22:121-153, 2000]을 택하였다. 데이터 분석을 위한 상기 예측 접근방법에 의해 단일 하위 천연 생성물의 분석으로부터 글루코스 분해대사의 명확한 평가가 가능하다. 본 연구에서, 상기 방법은 표지되지 않은 글루코스 및 특정 ¹³C-표지된 글루코스의 다양한 이성분 혼합물을 함유하는 배지에서의 세균의 성장에 이어, 생산된 제아잔틴의 정제 및 NMR 분광법에 의해 표지 패턴의 분석을 포함한다. 사용된 방법의 세부 사항 및 실험 결과는 하기에 나타내었다.

¹³ C 표지 실험을 위한 파라코커스 속 균주 R114의 성장. 표지되지 않은 D-글루코스 모노하이드레이트는 플루카(Fluka, 미국 위스콘신주 밀워키 소재)에서 구입하였다. [U-¹³C₆]-D-글루코스는 아이소텍(Isotec, 미국 오하이오주 마이애미스버그 소재)에서 구입한 반면, [1-¹³C₁]-D-글루코스, [2-¹³C₁]-D-글루코스 및 [6-¹³C₁] D-글루코스는 캠브리지 아이소토프 래버러토리즈(Cambridge Isotope Laboratories, 미국 매사추세츠주 앤도버 소재)에서 구입하였다. 효모 추출물 및 펩톤(카제인으로부터, 췌액에 의해 소화된 상태)은 이엠 사이언스(EM Science, 미국 뉴저지주 깁스타운 소재)에서 구입하였다. 다른 염 및 용매들은 모두 분석용 등급이었으며 표준 화학물질 공급처로부터 구입하였다.

모든 배양은 냉동 세포 현탁액(12 OD₆₆₀ 단위의 세포 밀도, 25% 글리세롤, -70 ℃에서 저장)으로부터 개시하였다. 1 ml의 해동된 세포 현탁액을 사용하여 하기 조성을 갖는 362F/2 배지 100 ml를 함유하는 예비배양액(500-ml 배플 진탕 플라스크)을 접종하였다: 30 g/l D-글루코스, 10 g/l 효모 추출물, 10 g/l 펩톤, 5 g/l NaCl, 2.5 g/l MgSO₄·7H₂O, 0.75 g/l (NH₄)₂HPO₄, 0.625 g/l K₂HPO₄, 187.5 mg/l CaCl₂·2H₂O, 0.2 g/l (NH₄)₂Fe(SO₄)₂·6H ₂O, 15 mg/l ZnSO₄·7H₂O, 12.5 mg/l FeCl₃·6H₂O, 5 mg/l MnSO₄·H₂O, 0.5 mg/l NiSO₄·6H ₂O, 15 mg/l Na-EDTA 및 9.375 μl/l HCl(37% 원액). 배지의 초기 pH는 7.2이었다.

예비배양액을 28 ℃에서 200 rpm으로 진탕하면서 24 시간동안 배양한 후, OD₆₆₀은 약 22 흡광도 단위였다. 주 배양액은 하기 조성을 갖는 362F/2 배지를 함유하는 바이오플로(Bioflo) 3000 생물반응기(뉴 브런스윅 사이언티픽(New Brunswick Scientific), 미국 뉴저지주 에디슨 소재)에서 성장시켰다: 30 g/l의 총 D-글루코스(¹³C-표지 글루코스:비표지 글루코스의 비에 대해서는 하기를 참조하시오), 20 g/l 효모 추출물, 10 g/l 펩톤, 10 g/l NaCl, 5 g/l MgSO₄·7H₂O, 1.5 g/l (NH₄)₂HPO₄, 1.25 g/l K₂HPO₄, 0.4 g/l (NH₄)₂Fe(SO₄)₂·6H₂O, 375 mg/l CaCl₂·2H₂O, 30 mg/l ZnSO₄·7H₂O, 25 mg/l FeCl₃·6H₂O, 10 mg/l MnSO₄·H₂O, 1 mg/l NiSO₄·6H₂O, 30 mg/l Na-EDTA 및 18.75 μl/l HCl(37% 원액). 별도의 네가지 실험에서 사용된 각각의 ¹³C-표지된 글루코스의 양(배지중 총 30 g/l 글루코스의 퍼센트로 나타냄)은 다음과 같았다: 조건 1, 4% [U-¹³C₆] D-글루코스; 조건 2, 50% [1-¹³C₁] D-글루코스; 조건 3, 25% [2-¹³C₁] D-글루코스 + 1% [U-¹³C₆] D-글루코스; 조건 4, 25% [6-¹³C₁] D-글루코스 + 1% [U-¹³C₆] D-글루코스. 표지되지 않은 글루코스만을 포함하는 대조군도 또한 포함되었다. 조건 1 및 2 (및 표지되지 않은 대조군)의 경우, 배양 부피는 2 l인 반면, 조건 3 및 4에 대한 배양 부피는 1 l이었다. 생물배양기에 예비-배양액(20 ml/l 초기 부피)을 접종하고 22 내지 24 시간동안 배양을 진행했으며, 이동안 배지중에는 글루코스가 남지 않았다. 배양 조건은 다음과 같았다: 28 ℃, pH 7.2(25% H₃PO₄ 및 28% NH₄OH로 조절), 최소 40%로 조절된(교반하에 다단계로) 용존 산소, 각각 300 rpm(최소) 및 1 vvm의 교반속도 및 통기속도.

제아잔틴의 정제. 배양 말기에, 배양액을 15 ℃로 냉각하였다. 배양액 1 리터당 500 ml의 무수 에탄올을 가하고 100 rpm으로 20 분간 계속 교반하였다. 처리된 배양액을 5000xg에서 20 분간 원심분리하고 상등액을 폐기하였다. 이어서, 습윤 펠릿을 교반하면서 5 부피의 THF로 20 분간 추출하였다. 추출한 혼합물을 원심분리하고, 상등액을 저장하고, 생성된 펠릿을 동일한 조건하에서 1 부피의 THF로 두 번째 추출을 하고 다시 원심분리하였다. 상등액(추출물)을 합하고 회전 증발에 의해 50 ml로 농축하였다. 5 ml의 헥산을 농축된 THF 용액에 가하였다. 혼합한 후, 시스템은 유화액을 형성하였으며, 상기 유화액은 원심분리로 분리할 수 있었다. 수성상을 회수하고 동 부피의 포화 NaCl 용액으로 희석하고 디클로로메탄으로 재-추출하였다. 디클로로메탄 상을 회수하여 THF/헥산 상과 합하였다. 유기 추출물의 혼합물을 회전 증발기에서 다시 농축하여 디클로로메탄을 제거하였다. 이어서, 용액을 실리카겔 컬럼에 적용하고 n-헥산 및 에테르의 혼합물(1:1)로 용출시켰 다. 먼저 용출된 소량의 연황색 띠는 폐기하였다. 제아잔틴 주 생성물은 컬럼에서 서서히 이동하는 광범위한 띠로 용출되었다. 상기 주 생성물 띠를 완전히 용출시키기 위해 약 2 리터의 용매가 필요하였다. 용출액을 환저 플라스크에 수거하고 용매를 40 ℃에서 회전 증발로 제거하였다. 잔사를 40 ℃에서 소량의 디클로로메탄에 용해시킨 다음 용액을 서서히 냉각하였다. 혼탁도가 관찰될 때까지 헥산을 혼합물에 적가하였다. 결정화는 4 ℃에서 48 시간내에 완료되었다. 결정을 종이 필터 상에 회수하고 차가운 메탄올로 세척하고 진공하에 건조시켰다.

NMR 연구. 제아잔틴은 NMR 분광법으로 분석하였다. 참조로, 제아잔틴의 화학 구조는 하기 화학식으로 예시된다:

¹H-NMR 및 ¹³C-NMR 스펙트럼은 브루커(Bruker) DRX 500 분광계를 사용하여 각각 500.13 MHz 및 125.6 MHz에서 기록하였다. 1차원 실험 및 2차원 이네이드퀘이트(INADEQUATE) 실험을 위한 수집 및 공정 파라미터는 표준 브루커 소프트웨어(XWINNMR)에 따랐다. 용매는 중수소화 클로로포름이었다. 화학적 이동은 용매 신호를 참조로 하였다.

천연 ¹³C 존재비에서 동위원소 표지된 제아잔틴 샘플 및 제아잔틴 샘플의 ¹³C NMR 스펙트럼을 동일한 실험 조건하에서 기록하였다. 적분치는 모든 ¹³C NMR 신호 에 대해 측정하였으며, 표지된 화합물에서 각각의 탄소 원자에 대한 신호 적분은 천연의 풍부한 물질의 상기 적분을 참조로 하여 표지된 분자 종에서 각 위치에 대한 상대적 ¹³C 존재비를 수득하였다. 이어서, 상대 존재비를, 1.71 ppm에서 H-18의 ¹H NMR 신호 중 ¹³C 커플링 부수신호로부터 절대 존재비로 전환시켰다. 다중-표지된 제아잔틴 샘플의 ¹³C NMR 스펙트럼에서, 각각의 부수신호를 별도로 적분하였다. 그 다음, 각각의 부수신호 쌍의 적분은 주어진 탄소원자의 전체 신호 적분을 참조로 하였다. 제아잔틴은 총 8개의 이소프레노이드 잔기(2개의 DMAPP 단위 및 6개의 IPP 단위)를 포함하며; 화학적 이동 퇴행으로 인해 20개의 ¹³C NMR 신호만이 관찰되었다.

[U-¹³C₆] 글루코스와 비표지 글루코스의 혼합물(1:7.5, w/w)을 이용한 실험에서는, 제아잔틴의 모든 탄소원자를 표지하고 ¹³C¹³C 커플링에 기인하는 부수신호를 나타내었다(표 13). 4개 탄소원자의 신호는 ¹³C¹³C 커플링에 기인하는 강한 부수신호를 갖는다(주어진 원자의 포괄적인 NMR 신호 강도에서 61.2 ± 0.6%, 표 13). 메틸 원자 C-17/C-17'에 기인한 신호는 6%의 상대 강도에서 약한 ¹³C-커플링된 부수신호 만을 나타내었다. 중심 신호는 비표지 글루코스로부터 유도된 물질을 나타낸다. 신호에서는 장거리 커플링에 대한 증거를 볼 수 없었다. 탄소 연결성은 ¹³C¹³C 커플링 상수(표 13) 및 2차원 이네이드퀘이트 실험으로부터 용이하게 얻을 수 있었다.

3개의 탄소원자가 [6-¹³C₁] 글루코스로부터 표지를 차지하였다. 나머지 두 개 탄소는 [2-¹³C₁] 글루코스로부터 표지화되었다. [1-¹³C₁] 글루코스에 의해서는 제아잔틴에 별로 많은 양의 표지가 이루어지지 않았다.

모든 비-등시성 탄소원자에 대한 ¹³C 존재비는 비표지 제아잔틴의 스펙트럼과 비교하고 ¹H NMR 스펙트럼에서의 ¹H¹³C 커플링 부수신호를 평가하여 측정하였다(표 13). [U-¹³C₆] 글루코스를 이용한 실험에서 공동으로 전달된 탄소원자 쌍의 분획은 커플링 부수신호를 적분하여 측정하였다.

IPP 구성 블록의 표지 패턴은 재구성된 IPP 전구체에 대해 밝혀진 표준 편차에 의해 나타낸 바와 같이 정확하게 재구성될 수 있다. DMAPP 및 IPP의 재구성된 표지 패턴은 실험 한계 내에서 동일하였다.

상기에서 측정한 실험상의 표지 패턴은 이소프레노이드 생합성에 대한 메발로네이트 경로 대 DXP 경로 뿐 아니라 글루코스 대사의 상이한 경로도 고려하여, 다양한 예상치들과 비교할 수 있다. 진성세균은 전형적으로 당분해 경로 또는 엔트너-다우도로프(Entner-Doudoroff) 경로를 통해 주로 글루코스를 사용한다. 당분 해는 글루코스로부터 두 개의 트리오스 포스페이트 분자를 생성한다. 글루코스 C-1 및 C-6은 둘 다 당분해중에 생성된 트리오스 포스페이트의 3-위치로 옮겨진다. 다른 한편으로, 엔트너-다우도로프 경로에서, 글루코스는 글리세르알데하이드 3-포스페이트와 피루베이트의 혼합물로 전환된다. 글루코스의 C-1은 오직 피루베이트의 C-1으로 전환되며, 글루코스의 C-6은 오직 글리세르알데하이드 3-포스페이트의 C-3으로 전환된다.

당분해 및 엔트너-다우도로프 경로의 중간체 및 생성물은 두 이소프레노이드 생합성 경로 모두에 출발 물질로 작용한다. 메발로네이트 경로와 관련하여, 피루베이트 및 트리오스 포스페이트는 전구체 아세틸-CoA로 전환될 수 있다. 당분해 경로를 통한 글루코스 분해대사는 글루코스의 C-1 뿐 아니라 C-6로부터의 표지를 아세틸-CoA의 메틸 그룹으로 옮긴다. 엔트너-다우도로프 경로를 통한 글루코스 분해대사는 피루베이트가 아세틸-CoA로 전환되는 동안 글루코스로부터 C-1을 손실시킨다.

파라코커스속 균주 R114에 의해 생산된 제아잔틴의 실험에 의해 관찰된 풍부함 및 ¹³C¹³C 커플링 패턴은 엔트너-다우도로프 경로 및 메발로네이트 경로의 조합에 의해 제아잔틴 생합성에 필요한 표지 패턴과 완전히 일치되었다. 당분해 및 엔트너-다우도로프 경로가 사용된 실험 조건하에서 동시에 작용가능한 경우, [1-¹³C₁] 글루코스로부터의 적어도 일부의 표지가 제아잔틴에 사용되어야 한다. 또한, 메발로네이트 경로는 많아야 두 탄소원자의 블록을 테르페노이드에 전달할 수 있는 반 면, DXP 경로에서는 3개의 탄소 단위가 트리오스 포스페이트 전구체를 통해 이소프레노이드로 전달될 수 있다. 상기 3개의 탄소 블록은 DXP 경로에 수반되는 재배열에 의해 분리되지만, 3개의 표지된 탄소원자의 블록은 여전히 장거리 커플링에 의해 인지될 수 있다. 상응하는 ¹³C-¹³C 장거리 커플링은 배양된 식물 세포(칸타란터스 로제우스(Cantharantus roseus))에 의한 [2,3,4,5-¹³C₄] 1-데옥시-D-자일룰로즈로부터 카로티노이드 루테인의 생합성에서 관찰되었다[Arigoni et al., Proc. Nat. Acad. Sci., 94:10600-10605, 1997]. 파라코커스속 균주 R114에 의해 생산된 제아잔틴을 사용한 본 발명의 실험에서는 상기 장거리 커플링은 관찰되지 않았다.

본원에 나타낸 결과들은 파라코커스속 균주 R114에서 메발로네이트 경로를 통한 이소프레노이드의 생산을 확인시키며, 사용된 성장 조건하에서 당분해를 통한 글루코스 대사가 거의 또는 전혀 없었음을 시사하지만, 엔트너-다우도르프 경로 이외에 펜토스 포스페이트 경로를 통한 글루코스의 일부 대사의 가능성도 배제하지 않음을 주목해야 한다. 상기 당분해 및 엔트너-다우도르프 두 경로를 통한 글루코스 대사의 정량적 측정은 (파라코커스 데니트리피칸스에 대해 수행한 바와 같이) 피루베이트-유래 아미노산 표지 패턴의 분석에 의해 달성할 수 있었다[Dunstan et al., Biomedical and Environ. Mass Spectrometry, 19:369-381, 1990].

실시예 4: 파라코커스 속 균주 R114로부터 IPP 이소머라제 및 메발로네이트 경로의 효소들을 암호화하는 유전자의 클로닝 및 서열분석

배양 조건. 파라코커스속 균주 R114를 28 ℃에서 F-배지(10 g/l 트립톤, 10 g/l 효모 추출물, 30 g/l NaCl, 10 g/l D-글루코스, 5 g/l MgSO₄·7H₂O, pH 7.0) 또는 상기 실시예 3에서 기술한 예비-배양 배지에서 성장시켰다. 배양액을 회전 진탕기에서 200 rpm으로 성장시켰다.

게놈 DNA의 단리. 600 ml의 파라코커스속 균주 R114 배양액을 4 ℃에서 10,000xg로 10 분간 원심분리하고, 펠릿을 200 ml의 용균 완충액(0.1M NaCl, 50mM EDTA, 10mM 트리스-HCl, pH 7.5)으로 1회 및 100 ml 용균 완충액으로 1회 세척하였다. 최종 펠릿을 50 mg의 라이소자임 및 1 mg의 RNase A(DNase 비함유)를 함유하는 20 ml의 용균 완충액에 재현탁시켰다. 37 ℃에서 15 분간 배양한 후, 1.5 ml의 20% 나트륨 N-라우로일-사르코시네이트 및 2.25 mg의 프로테이나제 K를 가하였다. 50 ℃에서 30 내지 60 분간 배양한 후, 용균액을 1 부피의 완충액-포화 페놀(pH 7.5 내지 7.8)(라이프테크놀로지(LifeTechnologies), 미국 메릴랜드주 로크빌 소재)로 부드럽게 완전히 혼합함으로써 추출하였다. 유화액을 30,000xg에서 20 분간 원심분리하고 수성상을 페놀로 재추출하였다. 상을 앞에서와 같이 분리하고, 수성상을 1 부피의 페놀:클로로포름(1:1)으로 2회 추출하였다. 이 단계에서, 날개 회전자에서 3,200xg로 20 분간 원심분리하면 만족스러운 상 분리를 이루기에 충분하였다. 1 부피의 클로로포름으로 최종 추출한 후, 0.1 부피의 3M 나트륨-아세테이트(pH 5.2)를 가하고 용액 위에 2 부피의 얼음 냉각 에탄올을 부었다. 침전된 DNA를 유리 막대로 스풀링(spooling)하고, 70% 에탄올에 5 분간 침지시키고, 클로로포름으로 헹군 다음 5 내지 10 분간 공기 건조시켰다. DNA를 5 ml TE(10mM 트리스- HCl, pH 7.5, 1mM EDTA)에 밤새 재현탁시켰다. 용액이 제아잔틴의 흔적으로 인해 황색이었으므로, 유기 추출 및 스풀링을 상기에서와 같이 반복하여 투명 제제를 수득하였다.

λ-DNA의 단리: 키아겐(등록상표) 람다 키트(키아겐, 독일 힐덴 소재)를 제조업자의 지시에 따라 사용하였다.

중합효소 연쇄 반응(PCR): 올리고뉴클레오타이드는 라이프테크놀로지(미국 메릴랜드주 로크빌 소재)로부터 구입하였다. PCR은 제조업자의 지시에 따라 GC가 풍부한 PCR 시스템(로슈 몰레큘라 바이오케미칼스(Roche Molecular Biochemicals), 독일 만하임 소재)을 이용하여 진앰프(GeneAmp, 등록상표) PCR 시스템 9700(피이 어플라이드 바이오시스템즈(PE Applied Biosystems), 미국 캘리포니아주 포스터 시티 소재)에서 수행하였다. 전형적으로, 사용된 MgCl₂ 농도는 1.5mM이었으며, 분리 용액은 1M의 최종 농도로 가하였다.

DNA 표지 및 검출: PCR 디그(DIG) 프로브 합성 키트 및 디그 발광 검출 키트를 DNA 표지 및 검출에 각각 사용하였다(둘 다 독일 만하임 소재의 로슈 몰레큘라 바이오케미칼스에서 입수).

DNA 서열분석: 서열분석 반응은 제조업자의 지시에 따라 빅다이(BigDye, 등록상표) DNA 서열분석 키트(피이 어플라이드 바이오시스템즈, 미국 캘리포니아주 포스터 시티 소재)를 사용하여 수행하였다. 서열분석 반응물은 다이엑스(DyeEx, 등록상표) 회전 컬럼(키아겐, 독일 힐덴 소재) 상에서 정제하였으며, 단편 분리 및 검출은 아비 프리즘(ABI Prism, 등록상표) 310 유전자 분석기(피이 어플라이드 바이오시스템즈, 미국 캘리포니아주 포스터 시티 소재)를 사용하여 수행하였다.

λ-라이브러리: 람다 픽스(FIX, 등록상표) II에서 Sau3AI로 부분 절단된 파라코커스속 균주 R114 DNA를 갖는 맞춤 라이브러리는 스트라타진(Stratagene, 미국 캘리포니아주 라 졸라 소재)에서 구입하였다.

파라코커스 속 균주 R114로부터 메발로네이트 경로 유전자 집단의 클로닝, 서열분석 및 특성화. 메발로네이트 경로의 효소들 중 하나인 메발로네이트 디포스페이트 데카복실라제는 여러 아미노산에 걸쳐 있는 매우 보존성인 영역을 함유한다. 3개의 상기 영역들은 모든 이용가능한 진성세균의 메발로네이트 디포스페이트 데카복실라제의 배열에서 선택하였으며, 올리고뉴클레오타이드는 파라코커스속 균주 R1534의 카로티노이드 유전자 집단에서 발견된 바람직한 코돈 사용법을 이용하여 설계하였다(표 14).

두 상동성 영역으로부터 설계된 올리고뉴클레오타이드는 표 15에 나타내었다. 변성도를 감소시키기 위해, 올리고뉴클레오타이드 조합들을 각각의 펩타이드로부터 설계하였다. 예를 들면, 올리고뉴클레오타이드 mvd-103a-d는 3' 말단으로부터 세 번째 뉴클레오타이드에서만 상이하며, 이 둘은 각각 글리신에 대한 하나의 가능한 코돈을 나타낸다(GGA는 거의 사용되지 않지만 3' 말단에 대한 밀접한 근접성으로 인해 포함시켰다). 두 잔기 모두에 대한 올리고뉴클레오타이드를 설계함으로써 대체 아미노산을 고려하였다, 예를 들면, 올리고뉴클레오타이드 mvd-101a 및 mvd-101b는 펩타이드 1의 두 번째 위치에서 각각 류신 또는 이소류신에 특이적이다(표 15). 주형으로 파라코커스속 균주 R114 DNA를 사용하여 올리고뉴클레오타이드 mvd-101 및 mvd-104 또는 mvd-106을 이용하여 PCR을 행한 결과 예상된 크기의 생성물이 수득되었다. PCR 산물은 벡터 pCR(등록상표) 2.1-토포(TOPO)(인비트로겐(Invitrogen), 미국 캘리포니아주 칼스배드 소재)에 클로닝하고 서열분석하였다. 클로닝된 단편을 파라코커스속 균주 R114 DNA의 서던 분석에 프로브로 사용하였으며 약 950 bp의 BamHI-SalI 단편에 하이브리드화된 것으로 나타났다. 파라코커스속 균주 R114 DNA는 BamHI 및 SalI으로 절단하였으며 단편들은 아가로스 겔 전기영동으로 분리하였다. 950 bp 부근의 영역을 단리하여 벡터 pUC19에 클로닝하였다. 그 다음, 상기 부분 라이브러리를 mvd-PCR 단편을 프로브로 사용하여 검색하고 양성 클론의 삽입물을 서열분석하였다.

동시에, 파라코커스속 균주 R114 DNA로부터 제조된 λ-라이브러리는 프로브로서 mvd-PCR 단편을 이용하여 검색하였다. DNA를 2개의 양성 λ-클론으로부터 단리하고 BamHI 및 SalI 또는 EcoRI 및 SalI으로 절단하였다. 다수의 제한효소 단편들을 단리하고 벡터 pUC19에 클로닝하였다. 단편들 중 여러개가 메발로네이트 경로의 단백질을 암호화하는 유전자에 상동성인 서열들을 포함하였다. 상기 개개의 서열들을 연결하는 클론은, 주형으로 λ-클론의 DNA를 사용하여 클로닝된 제한효소 단편들의 서열들로부터 유도된 프라이머를 사용하여 PCR에 의해 수득하였다. 모든 단편들로부터 구성된 서열(서열번호: 42, 44, 46, 48, 50 및 52) 및 암호화된 단백질들의 서열을 서열 목록표에 나타내었다(서열번호: 43, 45, 47, 49, 51 및 53). 페이턴트인 프로그램(PatentIn Program)의 제한으로 인해, 중복 유전자를 갖는 오 페론은 단일 서열로 나타낼 수 없다. 따라서, 메발로네이트 오페론 중의 각각의 유전자에 대해, 오페론의 전체 뉴클레오타이드 서열을 각 유전자에 대해 반복한다. 따라서, 서열번호: 42, 44, 46, 48, 50 및 52는 동일하다. 본 발명에 있어서는, 메발로네이트 오페론의 뉴클레오타이드 서열을 언급하는데 서열번호: 42를 사용한다.

파라코커스속 균주 R114에서 메발로네이트 경로 유전자들의 배열은 다른 세균의 공지된 메발로네이트 유전자 집단들에 비해 독특하다. 파라코커스속 균주 R114 이외에, 보렐리아 버그도르페리(Borrelia burgdorferi) 및 스트렙토마이세스속(Streptomyces sp.) 균주 CL190[Takagi et al., J. Bacteriol., 182:4153-4157, 2000]은 단일 오페론에 모든 메발로네이트 유전자를 갖는다[Wilding et al., J. Bacteriol., 182:4319-4327, 2000]. 스트렙토코커스 피로제네스(Streptococcus pyrogenes)에서는, 모든 메발로네이트 유전자는 단일 좌위에 무리를 이루지만 이들은 두개의 오페론에서 무리를 이룬다. 다른 종들은 모두 2개의 키나제 및 하나의 오페론에서 무리를 이루는 메발로네이트 디포스페이트 데카복실라제를 갖는 2개의 좌위, 및 오페론(스트렙토코커스 뉴모니에(Streptococcus pneumoniae)에서)을 형성하거나 또는 별도의 전사 단위로서 두 번째 좌위 상의 HMG-CoA 신타제 및 HMG-CoA 리덕타제를 갖는다. 스태필로코커스(Staphylococcus)의 구성원을 제외한 모든 종은, 최근에 IPP 이소머라제로 동정된, 메발로네이트 유전자집단과 연결된 추가의 유전자를 갖는다(스트렙토마이세스속 균주 CL190에서의 idi 유전자)[Kaneda et al., Proc. Nat. Acad. Sci., 98:932-937, 2001]. 두 엔테로코커스(Enterococcus) 종 및 스태필로코커스 헤모라이티커스(Staphylococcus haemolyticus)는 HMG-CoA 리덕타제 유전자와 연결된 아세틸-CoA 아세틸트랜스퍼라제 유전자를 갖는다. 엔테로코커스 종에서는, 후자의 두 유전자가 융합된다.

파라코커스속 균주 R114로부터 취한 메발로네이트 오페론의 유전자들은 일반적인 데이터베이스에서 단백질에 대한 유전자 산물의 상동성으로 동정하였다. 파라코커스속 균주 R114로부터의 HMG-CoA 리덕타제의 아미노산 정렬(서열번호: 43)은 스트렙토마이세스속 균주 CL190(서열번호: 54), 스트렙토마이세스 그리세올로스포레우스(S. griseolosporeus)(서열번호: 55) 및 스트렙토마이세스속 균주 KO-3899(서열번호: 56)의 세균 부류 I HMG-CoA 리덕타제를 사용하여 수행하였다. EMBL/진뱅크(GenBank)/DDBJ 데이터베이스 접수 번호는 스트렙토마이세스속 균주 CL190은 q9z9n4, 스트렙토마이세스 그리세올로스포레우스는 q9znh1, 및 스트렙토마이세스속 균주 KO-3899는 q9znh0이다. 두 부류의 HMG-CoA 리덕타제가 존재한다[Bochar et al., Mol. Genet. Metab., 66:122-127, 1999; Boucher et al., Mol. Microbiol., 37:703-716, 2000]. 진성세균 HMG-CoA 리덕타제는 일반적으로 부류 II에 속하는 반면 부류 I의 효소들은 진핵생물 및 원시세포에서 발견된다. 스트렙토마이세스 및 파라코커스 HMG-CoA 리덕타제는 비브리오 콜레라(Vibrio cholerae) 유래 효소들과 함께 지금까지 알려진 부류 I의 유일한 진성세균성 HMG-CoA 리덕타제이다.

파라코커스속 균주 R114로부터의 이소펜테닐 디포스페이트 이소머라제(IPP 이소머라제)(idi)의 아미노산 정렬(서열번호: 45)은 EMBL 데이터베이스에서 밝혀진 밀접한 동족체, 즉, 에르위니아 허비콜라(Q01335)(서열번호: 57), 보렐리아 버그도르페리(O51627)(서열번호: 58), 시네코사이스티스속(Synechocystis sp.) PCC 6803(P74287)(서열번호: 59), 스트렙토마이세스속 CL190(Q9KWG2)(서열번호: 60), 스트렙토마이세스 그리세올로스포레우스(Q9KWF6)(서열번호: 61), 설포로버스 솔파타리커스(Sulfolobus solfataricus)(P95997)(서열번호: 62), 리켓치아 프로바제키(Rickettsia prowazekii)(Q9ZD90)(서열번호: 63), 데이노코커스 라디오듀란스(Deinococcus radiodurans)(Q9RVE2)(서열번호: 64), 에어로피럼 페르닉스(Aeropyrum pernix)(Q9YB30)(서열번호: 65), 할로박테리움속(Halobacterium sp.) NRC-1(O54623)(서열번호: 66), 아르케오글로버스 풀기더스(Archaeoglobus fulgidus)(O27997)(서열번호: 67), 피로코커스 아비씨(Pyrococcus abyssi)(Q9UZS9)(서열번호: 68), 피로코커스 호리코시(Pyrococcus horikoshii)(O58893)(서열번호: 69), 메타노박테리움 터모오토트로피컴(Methanobacterium thermoautotrophicum) (O26154)(서열번호: 70), 메타노코커스 야나시(Methanococcus jannaschii)(Q58272)(서열번호: 71), 터모플라스마 아시도필럼(Thermoplasma acidophilum)(CAC11250)(서열번호: 72) 및 레이쉬마니아 메이저(Leishmania major)(Q9NDJ5)(서열번호: 73)를 사용하여 수행하였다. EMBL/진뱅크/DDBJ 데이터베이스 접수 번호는 유기체 명칭 뒤에 괄호안에 나타내었다. 앞의 9개 서열은 진성세균에서 유래된 것이고 다음 8개 서열들은 원시세포에서 유래한 것이다. 흥미롭게, 하나의 진핵생물 종인 원생동물 기생체인 레이쉬마니아 메이저(서열번호: 73)도 또한 매우 상동성인 단백질을 갖는다. 이것은 다른 진핵생물은 1형[Kaneda et al., Proc. Nat. Acad. Sci., 98:932-937, 2001]으로 지정된 상이한 idi를 갖기 때문에 예상치 못한 것이다. 바실러스 서브틸리스로부터 유래된 보존성 가상 단백질 YpgA도 또한 충분한 상동성을 갖지만 2형 idi보다 상당히 작다.

파라코커스속 균주 R114로부터 세균성 HMG-CoA 신타제의 아미노산 정렬(서열번호: 47)은 EMBL 데이터베이스에서 밝혀진 밀접한 동족체, 즉, 스트렙토코커스 뉴모니에(AAG02453)(서열번호: 74), 스트렙토코커스 피로제네스(AAG02448)(서열번호: 75), 엔테로코커스 페칼리스(Enterococcus faecalis)(AAG02438)(서열번호: 76), 엔테로코커스 페시움(Enterococcus faecium)(AAG02443)(서열번호: 77), 스태필로코커스 헤모라이티커스(AAG02427)(서열번호: 78), 스태필로코커스 에피더미스(Staphylococcus epidermis)(AAG02433)(서열번호: 79), 스태필로코커스 오레우스(Staphylococcus aureus)(AAG02422)(서열번호: 80), 스태필로코커스 카노서스(Staphylolcoccus carnosus)(Q9ZB67)(서열번호: 81), 스트렙토마이세스속 CL190 (Q9KWG1)(서열번호: 82), 스트렙토마이세스 그리세올로스포레우스(Q9WF5)(서열번호: 83) 및 보렐리아 버그도르페리(051626)(서열번호: 84)를 이용하여 수행하였다. EMBL/진뱅크/DDBJ 데이터베이스 접수 번호는 각 유기체의 명칭 뒤에 괄호안에 나타내었다. 스트렙토마이세스 그리세올로스포레우스 유래 서열의 처음 43개 아미노산은 데이터베이스 변이체에서는 빠져 있다.

파라코커스속 균주 R114로부터의 세균성 메발로네이트 디포스페이트 데카복실라제의 아미노산 정렬(서열번호: 53)은 다른 세균, 즉, 스트렙토코커스 뉴모니에(AAG02456)(서열번호: 85), 스트렙토코커스 피로제네스(AAG02451)(서열번호: 86), 엔테로코커스 페칼리스(AAG02441)(서열번호: 87), 엔테로코커스 페시움(AAG02446)(서열번호: 88), 스태필로코커스 헤모라이티커스(AAG02431)(서열번호: 89), 스태필로코커스 에피더미스(AAG02436)(서열번호: 90), 스태필로코커스 오레우스(AAG02425)(서열번호: 91), 스트렙토마이세스속 CL190(Q9KWG4)(서열번호: 92), 스트렙토마이세스 그리세올로스포레우스(Q9WF8)(서열번호: 93) 및 보렐리아 버그도르페리(051629)(서열번호: 94) 유래의 오르토로고스(orthologous) 단백질을 이용하여 수행하였다. EMBL/진뱅크/DDBJ 데이터베이스 접수 번호는 각 유기체 명칭 뒤에 괄호안에 나타내었다.

마이조코커스 잔터스(Myxococcus xanthus) 유래의 두 단백질, Tac 및 Taf(데이터베이스 접수 번호 각각 q9xb06 및 q9xb03) 및 추정상의 폴리케타이드(polyketide) 생합성 단백질인 바실러스 서브틸리스 유래 단백질 PksG(데이터베이스 접수 번호 p40830)는 파라코커스속 균주 R114 HMG-CoA 신타제에 대해 충분한 상동성을 갖는다. 파라코커스속 균주 R114 HMG-CoA 신타제와 마이조코커스 잔터스의 Tac 및 Taf 단백질간의 상동성은 파라코커스속 균주 R114 및 진핵생물로부터의 HMG-CoA 신타제들간의 상동성보다 크다. 세균성 HMG-CoA 신타제 및 세균성 메발로네이트 디포스페이트 데카복실라제는 그들의 진핵생물 오르토로그(ortholog)와 충분한 상동성을 공유한다. 원시세포의 HMG-CoA 신타제는 더 관련이 적은 그룹의 효소들을 생성하며[Wilding et al., J. Bacteriol., 182:4319-4327, 2000], 원시세포에서 메발로네이트 디포스페이트 데카복실라제 오르토로그는 발견되지 않는다[Smit and Mushegian, Genome Res., 10:1468-1484, 2000].

파라코커스속 균주 R114로부터의 메발로네이트 키나제(Mvk)(서열번호: 49) 및 포스포메발로네이트 키나제(Pmk)(서열번호: 51)의 정렬은 다른 세균, 즉, 스트렙토코커스 뉴모니에(AAG02455)(서열번호: 95), 스트렙토코커스 피로제네스(AAG02450)(서열번호: 96), 엔테로코커스 페칼리스(AAG02440)(서열번호: 97), 엔테로코커스 페시움(AAG02445)(서열번호: 98), 스태필로코커스 헤모라이티커 스(AAG02430)(서열번호: 99), 스태필로코커스 에피더미스(AAG02435)(서열번호: 100), 스태필로코커스 오레우스(AAG02424)(서열번호: 101), 스트렙토마이세스속 CL190(Q9KWG5)(서열번호: 102), 스트렙토마이세스 그리세올로스포레우스(Q9KWF9)(서열번호: 103) 및 보렐리아 버그도르페리(051631)(서열번호: 104)(Mvk); 및 스트렙토코커스 뉴모니에(AAG02457)(서열번호: 105), 스트렙토코커스 피로제네스(AAG02452)(서열번호: 106), 엔테로코커스 페칼리스(AAG02442)(서열번호: 107), 엔테로코커스 페시움(AAG02447)(서열번호: 108), 스태필로코커스 헤모라이티커스(AAG02432)(서열번호: 109), 스태필로코커스 에피더미스(AAG02437)(서열번호: 110), 스태필로코커스 오레우스(AAG02426)(서열번호: 111), 스트렙토마이세스속 CL190(Q9KWG3)(서열번호: 112), 스트렙토마이세스 그리세올로스포레우스(Q9KWF7)(서열번호: 113) 및 보렐리아 버그도르페리(051630)(서열번호: 114)(Pmk) 유래의 오르토로고스 단백질에 대해 수행하였다. EMBL/진뱅크/DDBJ 데이터베이스 접수 번호는 각 유기체 명칭 뒤에 괄호안에 나타내었다.

메발로네이트 경로의 다른 효소들의 세균성 오르토로그 중에서보다 세균성 키나제들 사이에서의 상동성이 훨씬 낮다. 파라코커스속 균주 R114(서열번호: 49)로부터의 메발로네이트 키나제는 다른 메발로네이트 키나제가 결여되어 있는 아미노-말단 영역에 37 아미노산 삽입물을 갖는다. 세균성 Mvk의 몇몇 원시세포 효소와 함께, 예를 들면, 아르케오글로버스 풀기더스, 메타노박테리움 터모오토트로피컴 및 피로코커스 아비시로부터의 효소들은 파라코커스속 균주 R114로부터의 Mvk에 대해 가장 우수한 상동성을 갖는다. 세균성 포스포메발로네이트 키나제 사이에서 의 상동성은 세균성 메발로네이트 키나제 사이에서의 상동성보다 훨씬 약하다. 파라코커스속 균주 R114 유래 Pmk(서열번호: 51)에 가장 우수한 상동성을 갖는 단백질은 원시세포, 예를 들면, 에어로피럼 페르닉스, 피로코커스 호리코시, 메타노박테리움 터모오토트로피컴, 피로코커스 아비시 및 아르케오글로버스 풀기더스로부터 유래된 Mvk이다. 원시세포에서는 Pmk가 발견되지 않으므로[Smit and Mushegian, Genome Res., 10:1468-1484, 2000], 이것은 동일한 키나제가 두 인산화반응을 모두 수행할 수도 있음을 시사한다.

실시예 5: 이. 콜라이 에서 파라코커스 속 균주 R114로부터의 메발로네이트 경로 유전자 및 idi 유전자의 과발현

이. 콜라이 에서 메발로네이트 오페론의 클로닝 및 발현. 클론 16으로 지정된, 파라코커스속 균주 R114 λ 라이브러리(실시예 4 참조)로부터의 λ 클론을 전체 메발로네이트 오페론의 PCR 증폭에 주형으로 사용하였다. 프라이머 Mevop-2020 및 Mevop-9027(표 16)을 PCR에 이용하였다.

생성된 PCR 산물은 TOPO-XL(미국 캘리포니아주 칼스배드 소재의 인비트로겐)에 클로닝시켜 플라스미드 TOPO-XL-mev-op16을 수득하였다. 메발로네이트 오페론을 갖는 삽입물을 HindIII 및 SacI으로 절단하고 HindIII-SacI 절단 벡터 pBBR1MCS2[Kovach et al., Gene, 166:175-176, 1995]에 클로닝하여 플라스미드 pBBR-K-mev-op16을 수득하였다. 플라스미드 pBBR-K-mev-op16을 사용하여 전기천공-수용성 이.콜라이 균주 TG1(캘리포니아주 라 졸라 소재의 스트라타진; 문헌 [Sambrook et al., In: Nolan, C.(ed.), Molecular Cloning: A Laboratory Manual(Second Edition), p.A.12, 1989] 참조)을 형질전환시켰다. 2개의 대표적인 양성 형질전환체(이. 콜라이 TG1/pBBR-K-mev-op16-1 및 이. 콜라이 TG1/ pBBR-K-mev-op16-2)를 50 mg/l의 카나마이신을 함유하는 루리아 브로쓰(Luria Broth, LB; 깁코비알엘(GibcoBRL), 라이프 테크놀로지)에서 성장시키고, 실시예 1에 기술된 방법을 이용하여 HMG-CoA 리덕타제 활성(파라코커스속 균주 R114 mvaA 유전자에 의해 암호화된)에 대해 시험하였다. 이. 콜라이는 효소 HMG-CoA 리덕타제를 암호화하는 유전자를 갖지 않으므로 검출가능한 활성이 없었다. 이. 콜라이 TG1/pBBR-K-mev-op16의 대표적인 형질전환체 둘 다의 조 추출물은 용이하게 측정할 수 있는 HMG-CoA 리덕타제 활성을 가져, 클로닝된 mvaA 유전자의 이종 발현을 입증하였다.

이. 콜라이 에서 파라코커스 속 균주 R114로부터 idi 유전자 및 개개의 메발로네이트 경로 유전자들의 클로닝 및 발현. 파라코커스속 균주 R114로부터 얻은 메 발로네이트 오페론 유전자의 암호와 영역들을 표 18에 나타낸 프라이머를 사용하여 PCR로 증폭시켰다. 프라이머는, NdeI 부위(절단 인식 부위 CATATG)의 두 번째 절반을 구성하는 ATG 개시 코돈, 및 BamHI 부위(GGATCC)들이 정지 코돈 바로 다음에 도입되도록 설계되었다. 모든 PCR 산물을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하였다. 생성된 벡터의 명칭은 표 19에 나열되어 있다. 메발로네이트 키나제 유전자를 제외하고, 모든 유전자는 BamHI, NdeI 또는 EcoRI에 대한 제한효소 부위를 포함하였는데, 상기 부위는 후속 클로닝 단계를 촉진하기 위해 제거되어야 한다. 상기 부위들은 퀵체인지(QuikChange, 등록상표) 부위-지향 돌연변이유발 키트(미국 캘리포니아주 라 졸라 소재의 스트라타진) 및 표 20에 나타낸 올리고뉴클레오타이드를 사용하여 잠재성 돌연변이를 도입함으로써 제거하였다. 돌연변이유발된 암호화 영역들은 BamHI 및 NdeI에 의해 TOPO-플라스미드로부터 절단하고 BamHI-NdeI 절단된 발현 벡터 pDS-His 및 pDS와 접합시켰다. 이들 발현 벡터는, EP 821,063 호의 실시예 2에 기술되어 있는 pDSNdeHis로부터 유도되었다. 플라스미드 pDS-His는 pDSNdeHis로부터 잠재성 클로람페니콜 아세틸트랜스퍼라제 유전자를 갖는 857 bp의 NheI 및 XbaI 단편을 결실시켜 구성하였다. 플라스미드 pDS는 pDS-His로부터 작은 EcoRI-BamHI 단편을 어닐링된 프라이머 S/D-1(5'-AATTAAAGGAGGGTTTCATATGAATTCG)(서열번호: 117) 및 S/D-2(5'-GATCCGAATTCATATGAAACCCTCCTTT)(서열번호: 118)로 치환시켜 구성하였다.

lacI(lac 억제제)-함유 플라스미드 pREP4(EMBL/진뱅크 접수 번호 A25856)를 갖는 이. 콜라이 균주 M15[Villarejo and Zabin, J. Bacteriol., 120:466-474, 1974]를 접합 혼합물을 사용하여 형질전환시키고, 재조합 세포를 100 mg/l 암피실린 및 25 mg/l 카나마이신을 보충한 LB-아가 플레이트상에서 성장시킴으로써 선별하였다. 정확한 메발로네이트 오페론 유전자 삽입물을 함유하는 양성 클론은 PCR로 확인하였다.

삽입된 유전자의 발현을 위해, 각각의 이. 콜라이 균주들을 37 ℃, 25 mg/l 카나마이신 및 100 mg/l 암피실린을 함유하는 LB 배지에서 밤새 성장시켰다. 다음날, 25 ml의 새로운 배지에 밤새 배양한 배양액 0.5 ml를 접종하고 새로운 배양액을 37 ℃에서 성장시켰다. 배양액의 OD₆₀₀이 0.4에 도달하면, 이소프로필-β-D-티오갈락토피라노사이드(IPTG)를 1 mM의 최종 농도로 가하여 클로닝된 유전자의 발현을 유도하고, 배양액을 (진탕하면서) 4 시간동안 계속 배양한 후 원심분리에 의해 세포를 회수하였다.

조 추출물 제조, HMG-CoA 리덕타제 분석 및 IPP 이소머라제 분석은 실시예 1에 기술된 바와 같이 수행하였다. 표 21 및 22는 각각 재조합 이. 콜라이 균주에서의 HMG-CoA 리덕타제 및 IPP 이소머라제 활성을 나타낸 것이다. IPTG 유도시, 균주 M15/pDS-mvaA 및 M15/pDS- idi 는 각각 높은 수준의 HMG-CoA 리덕타제 및 IPP 이소머라제 활성을 가졌다. 이것은 이. 콜라이에서 파라코커스속 균주 R114로부터 메발로네이트 경로 유전자들을 과발현시키는(그리고 활성 형태의 그의 동원(同源) 유전자 산물을 과잉생산하는) 능력을 예시하는 것이다.

효소 분석에 사용된 조 추출물은 나트륨 도데실설페이트-폴리아크릴아미드 겔 전기영동(SDS-PAGE)으로 분석하였다. 균주 이. 콜라이 M15/pDS-mvaA 및 이. 콜라이 M15/pDS-His-mvaA에 대해, 예상된 분자 질량(36.3 kD)을 갖는 고도로 발현된 단백질의 존재 또는 부재가 추출물에서 측정된 HMG-CoA 리덕타제 활성과 상관되었다(표 21). His-부가된 단백질의 부재는 mRNA 또는 단백질의 불안정성에 의해 전사 또는 번역 단계에서 감소된 발현으로 설명될 수 있다. 이. 콜라이 M15/pDS-idi 및 이. 콜라이 M15/pDS-His-idi의 조 추출물들은 둘 다 각각 37.3 kD 및 39.0 kD의 예상 분자 질량을 갖는 고도로 발현된 단백질을 나타내었다. 그러나, 이. 콜라이 M15/pDS-idi의 추출물만이 증가된 IPP 이소머라제 활성을 가져(표 22), 효소의 히스티딘-부가 형태는 상기 조건하에서 작용할 수 없음을 나타내었다.

파라코커스속 균주 R114 메발로네이트 오페론(hcs, pmk, mvk 및 mvd, 표 19 참조)의 다른 4개 유전자를 과발현하는 이. 콜라이 균주의 조 추출물의 SDS-PAGE 분석에 의해, 약간의 발현을 배제할 수는 없지만 IPTG 유도시 천연형 효소의 고발현은 검출되지 않았다. 다른 한편으로, 고발현은 4개 단백질 모두의 His-부가 형 태에서 관찰되었다.

실시예 6: crt E 유전자의 과발현에 의한 파라코커스 속 균주 R114에서의 향상된 제아잔틴 생산

파라코커스 속 균주 R114에서 pBBR-K-Zea4, pBBR-K-Zea4-up 및 pBBR-K-Zea4-down의 구성 및 제아잔틴 생산에 대한 상기 플라스미드들의 영향. 파라코커스속 균주 R1534의 카로티노이드(crt) 유전자 집단을 플라스미드 pZea-4[Pasamontes et al., Gene, 185:35-41, 1997]로부터 8.3 kb의 BamHI-EcoRI 단편으로 절단하였다. crt 유전자 집단을 함유하는 상기 단편은 BamHI 및 EcoRI-절단 벡터 pBBR1MCS-2(진뱅크 접수 번호 #U23751)내에 접합시켜 pBBR-K-Zea4를 수득하였다. 개선된 제아잔틴 생산에 대해 시험하기 위해 플라스미드 pBBR-K-Zea4를 접합에 의해 파라코커스속 균주 R114에 도입하였다. 대조 균주 R114 및 균주 R114/pBBR-K-Zea4의 독립적인 두 단리물을 진탕 플라스크 배양액(배지 362F/2 사용, 실시예 11 참조) 중에서의 제아잔틴 생산에 대해 시험하였다. 표 23의 데이터는 플라스미드 pBBR-K-Zea4를 갖는 두 재조합 균주 모두 R114보다 상당히 높은 수준의 제아잔틴을 생산하며 더 높은 생산 비속도(mg 제아잔틴/OD₆₆₀)를 나타냄을 보여준다. 이것은 pBBR-K-Zea4중의 클로닝된 삽입물 내의 하나 이상의 유전자들이 파라코커스속 균주 R114에서 제아잔틴 생산을 제한하는 효소(들)을 암호화함을 시사한다.

적극적인 효과의 위치를 정하기 위해, pBBR-K-Zea4에 존재하는 클로닝된 삽입물의 서브클로닝된 영역을 함유하는 두 플라스미드 유도체를 제조하였다. ORF 5 및 유전자 atoB 및 crtE를 포함하는, pBBR-K-Zea4 삽입물의 "상위" 영역[Pasamontes et al., Gene, 185:35-41, 1997]을 제한 효소 XbaI 및 AvrII에 대한 유일한 부위와 측면을 접하게 한다. 플라스미드 pBBR-K-Zea4-down은 상기 두 효소들로 pBBR-K-Zea4를 절단하고 "상위" 영역을 결실시켜 제작하였다. 유사하게, 플라스미드 pBBR-K-Zea4-up은 제한 효소 EcoRV 및 StuI를 이용하여, pBBR-K-Zea4에 클로닝된 삽입물 내의 "하위" 영역을 결실시켜 제작하였다. 새로운 두 플라스미드를 접합에 의해 파라코커스속 균주 R114에 전이시켰다. 균주 R114(숙주 대조군), R114/pBBR-K(빈 벡터 대조군), R114/pBBR-K-Zea4-down 및 R114/pBBR-K-Zea4-up에서 제아잔틴 생산을 비교하였다(진탕 플라스크 배양액, 전술한 바와 동일한 조건)(표 24). 데이터는 제아잔틴 생산에 대한 적극적인 효과가 ORF5, atoB 및 crtE를 함유하는 클로닝된 분절의 다중 복사체내의 존재, 즉, 플라스미드 pBBR-K-Zea4-up에 존재하는 삽입물내의 상기 분절의 존재의 결과였음을 명확히 보여주었다. pBBR-K-Zea4-up로부터 일련의 결실 플라스미드를 구축하였다. 이들 플라스미드를 각각 균 주 R114에 도입하고 제아잔틴 생산을 시험함으로써, 균주 R114/pBBR-K-Zea4 및 pBBR-K-Zea4-up에서의 향상된 제아잔틴 생산을 제공하는 것은 crtE 유전자의 과발현인 것으로 밝혀졌다. 이 결과는 파라코커스속 균주 R114에서 제아잔틴 생성을 제한하는 GGPP 신타제(crtE에 의해 암호화됨)의 활성과 일치한다. 실시예 1에 기술된 방법을 이용하여, 균주 R114/pBBR-K-Zea4-up의 조 추출물이 R114보다 2.6배 더 높은 GGPP 신타제 활성을 갖는 것으로 밝혀졌다. 이것을 직접 입증하기 위해, crtE 유전자만을 과발현시키는 새로운 플라스미드를 하기의 두 파트에서 기술하는 바와 같이 구축하였다.

발현 벡터 pBBR-K-P crtE 및 pBBR-tK-P crtE 의 제작. 벡터 pBBR1MCS-2를 BstXI 및 Bsu36I로 절단하고 더 큰 단편을 어닐링된 올리고뉴클레오타이드 MCS-2 up(5'-TCAGAATTCGGTACCATATGAAGCTTGGATCCGGGG-3')(서열번호: 145) 및 MCS-2 down(5'-GGATCCAAGCTTCATATGGTACCGAATTC-3')(서열번호: 146)과 접합시켜 벡터 pBBR-K-Nde를 수득하였다. 리보솜 결합 부위 및 crtE 개시 코돈[Pasamontes et al., Gene, 185:35-41, 1997]을 포함하는 추정상의 crtE 프로모터(PcrtE)를 함유하 는, 파라코커스속 균주 R114로부터의 카로티노이드 유전자 집단에서 crtE 유전자의 상위 270 bp 영역을, 프라이머 crtE-up(5'-GGAATTCGCTGCTGAACGCGATGGCG-3')(서열번호: 147) 및 crtE-down(5'-GGGGTACCATATGTGCCTTCGTTGCGTCAGTC-3')(서열번호:148)을 사용한 PCR에 의해 파라코커스속 균주 R114 DNA로부터 증폭시켰다. PCR 산물을 EcoRI 및 NdeI으로 절단하고 pBBR-K-Nde의 EcoRI-NdeI 절단 주쇄에 삽입하여 플라스미드 pBBR-K-PcrtE를 수득하였다. crtE의 ATG 개시 코돈을 포함하는 NdeI 부위는 프라이머 crtE-down에 포함되었다. 따라서, NdeI 부위에 포함된 개시 코돈과 함께 도입된 임의의 암호화 영역은 crtE의 리보솜 결합 부위를 사용하여 발현시켜야 한다. 플라스미드 pBBR-K-PcrtE를 BamHI로 절단하고, 어닐링된 올리고뉴클레오타이드 pha-t-up

(5'-GATCCGGCGTGTGCGCAATTTAATTGCGCACACGCCCCCTGCGTTTAAAC-3')(서열번호: 149) 및 pha-t-down

(5'-GATCGTTTAAACGCAGGGGGCGTGTGCGCAATTAAATTGCGCACACGCCG-3')(서열번호: 150)을 삽입시켰다. 삽입은 서열분석에 의해 확인하였으며, PcrtE 프로모터에 더 근접한 BamHI 부위를 재구성하는 배향으로 삽입된 올리고뉴클레오타이드를 갖는 플라스미드 변이체를 pBBR-tK-PcrtE로 칭하였다. 삽입된 서열은 파라코커스속 균주 R114 phaA 및 phaB 유전자(실시예 10 참조) 사이에서 발견된 추정상의 전사 터미네이터를 가지므로, PcrtE 프로모터로부터 개시된 전사의 적절한 종료를 확실히 해야 한다.

플라스미드 pBBR-K-P crtE-crtE -3의 구축. 파라코커스속 균주 R114 숙주에서 crtE 유전자의 발현 증가를 위한 다중복제 플라스미드를 구축하기 위해, 프라이머 crtE-Nde(5'-AAGGCCTCATATGACGCCCAAGCAGCAATT-3')(서열번호: 151) 및 crtE-Bam(5'-CGGGATCCTAGGCGCTGCGGCGGATG-3')(서열번호: 152)을 사용하여 PCR에 의해 플라스미드 p59-2[Pasamontes et al., Gene, 185:35-41, 1997]로부터 crtE 유전자를 증폭시켰다. 증폭된 단편을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하여 플라스미드 TOPO-crtE를 수득하였다. TOPO-crtE로부터 NdeI-BamHI 단편을 NdeI- BamHI-절단된 플라스미드 pBBR-K-PcrtE에 서브클로닝하여 pBBR-K-PcrtE-crtE를 수득하였다. 최종적으로, pBBR-K-PcrtE-crtE로부터 더 작은 BglII 단편을 pBBR-K-Zea4-up로부터 더 작은 BglII 단편으로 치환시켜 pBBR-K-PcrtE-crtE-3을 구축하였다. 전기천공에 의해 플라스미드 pBBR-K-PcrtE-crtE-3을 파라코커스속 균주 R114로 전이시켰다. 실시예 1에 기술된 방법을 이용하여, 조 추출물 중의 GGPP 신타제 활성은 균주 R114에서보다 균주 R114/pBBR-K-PcrtE-crtE-3에서 2.9배 더 높은 것으로 나타났다. 상기 활성의 상승정도는 R114/pBBR-K-Zea4-up에서 관찰된 것과 유사하였다. 표 25는 균주 R114/pBBR-K-PcrtE-crtE-3에 의한 제아잔틴 생산이 균주 R114/pBBR-K-Zea4-up와 본질적으로 동일함을 보여준다.

실시예 7: 천연 숙주 파라코커스 속 균주 R114에서 파라코커스 속 균주 R114 메발로네이트 오페론의 개개 유전자들의 발현

파라코커스 속 균주 R114 숙주에서 파라코커스 속 균주 R114 메발로네이트 오페론의 클로닝된 개개 유전자들의 발현. TOPO-플라스미드(실시예 5 참조)에서 메발로네이트 오페론 유전자의 돌연변이유발된 암호화 영역을 BamHI 및 NdeI으로 절단하고 BamHI-NdeI 절단된 벡터 pBBR-tK-PcrtE(실시예 6 참조)와 접합시켰다. 생성된 플라스미드 pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk, pBBR-tK-PcrtE-pmk 및 pBBR-tK-PcrtE-mvd를 전기천공에 의해 파라코커스속 균주 R114에 도입하였다. 형질전환체는 50 mg/l 카나마이신을 함유하는 아가 배지상에서 선별하였으며 PCR로 확인하였다.

플라스미드에 함유된 메발로네이트 경로 유전자들이 천연 숙주 파라코커스속 균주 R114에서 발현될 수 있음을 예시하기 위해, HMG-CoA 리덕타제 활성을 균주 R114/pBBR-K(대조군) 및 R114/pBBR-tK-PcrtE-mvaA의 조 추출물에서 비교하였다(사 용된 방법은 실시예 1에 나타내었다). 균주 R114/pBBR-K 및 R114/pBBR-tK-PcrtE-mvaA에서의 HMG-CoA 리덕타제의 비활성은 각각 2.37 U/mg 및 6.0 U/mg이었다. 따라서, 다중복제 플라스미드 상의(그리고 PcrtE 프로모터로부터 발현된) mvaA 유전자의 존재는 빈 벡터 pBBR-K를 갖는 R114의 기본(즉, 염색체에 의해 암호화된) 활성에 비해 HMG-CoA 리덕타제 활성에 있어 2.5배 증가를 야기하였다.

실시예 8: 파라코커스 속 균주 R114 crtE 유전자로 클로닝된 메발로네이트 경로 유전자의 동시 과발현을 위한 "미니-오페론"의 제작

플라스미드 제작. 실시예 6에서 보았듯이, 파라코커스속 균주 R114에 플라스미드 pBBR-K-PcrtE-crtE-3을 도입한 결과 제아잔틴의 생산이 증가되어, GGPP 신타제 활성이 균주 R114에서의 제아잔틴 생합성에 대해 속도를 제한함을 알 수 있었다. 실시예 7은 또한 메발로네이트 경로의 효소를 암호화하는 유전자가 천연 숙주 파라코커스속 균주 R114에서 과발현될 수 있으며 암호화된 효소의 활성을 증가시킴을 보여주었다. 그러나, 메발로네이트 오페론의 각각의 개별 유전자를 함유하는 플라스미드를 갖는 파라코커스속 균주 R114의 재조합 균주는 어느 것도 균주 R114에 비해 증가된 제아잔틴 생산을 나타내지 못했다. 파라코커스속 균주 R114에서의 메발로네이트 오페론 유전자들의 과발현의 이점이 제아잔틴 경로(GGPP 신타제)에서 하위 "보틀넥 현상(bottleneck)"에 의해 가려질 수 있을 수도 있다. crtE와 함께 각각의 메발로네이트 경로 유전자(또는 아마도 이들 유전자의 조합)를 동시 과발현시키는 플라스미드를 제작하여 전체적인 제아잔틴 생합성 경로에서의 모든 속도 제한을 해결함으로써 제아잔틴 생산을 향상시킬 수 있었다. 다음 파트는 crtE 및 메 발로네이트 경로의 다섯 개 효소를 암호화하는 유전자 각각을 동시-과발현시키도록 설계된 "미니-오페론"의 제작을 설명한다.

crtE, mvaA, idi 및 mvk 유전자들을 BamHI 및 NdeI으로 각각의 TOPO-플라스미드(실시예 5 및 6에 기술됨)로부터 절단하여 BamHI-NdeI-절단 벡터 pOCV-1(실시예 12에 기술되어 있음)과 접합시켰다. crtE 유전자는 암호화 영역의 마지막 뉴클레오타이드로서 아데닌을 갖지 않으며, 또한 TGA 정지 코돈 이외의 다른 TAG 및 정지 코돈과 BamHI 부위 사이에 부적합한 거리를 갖는다. 그러므로, crtE의 말단은 오페론 제작 벡터(실시예 12 참조)의 필요조건을 충족시키며, crtE는 pOCV-1-crtE에 의해 제작된 임의 오페론에서 마지막 유전자이어야 한다. 두 번째 코돈의 첫 번째 뉴클레오타이드 및 마지막 코돈의 마지막 뉴클레오타이드로서 아데닌에 대한 필요조건을 충족시키기 위해, 돌연변이는 메발로네이트 오페론의 세 개 유전자에 도입되어야 한다. Asp를 암호화하는 pmk의 두 번째 코돈 GAT는 Asn을 암호화하는 AAT로 변화되었다. mvd의 마지막 코돈은 T로 끝나고, pmk 및 hcs의 마지막 코돈은 C로 끝난다. 이들 뉴클레오타이드를 A로 변화시키면 마지막 아미노산이 Asp에서 Glu로 변화된 pmk를 제외하고 잠재성 돌연변이가 야기된다. 올리고뉴클레오타이드는 PCR에 의해 필요한 변화를 도입하도록 설계되었다. 상기 PCR 반응에 사용된 올리고뉴클레오타이드 및 주형의 서열은 표 26에 나타내었다. 모든 PCR 산물을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하여 플라스미드 TOPO-mvd ^OCV, TOPO-pmk ^OCV 및 TOPO-hcs ^OCV를 수득하였다. 삽입물을 NdeI 및 BamHI으로 절단하고 pOCV-2(실시예 12 참조)의 NdeI-BamHI 절단 주쇄와 접합시켰다. 각각의 "미니-오페론"을 구성하기 위한 최종 클로닝 단계는 유사하였으며, pBBR-K-PcrtE-mvaA-crtE-3의 제작을 위한 대표적인 도식으로 예시된다.

실시예 9: 파라코커스 속 균주 R114로부터 FPP 신타제를 암호화하는 ispA 유전자의 클로닝 및 서열분석

FPP 신타제는 파라코커스속 균주 R114에서의 제아잔틴 생합성의 중심 경로에 수반되므로, ispA 유전자의 용량을 증가시켜 상기 효소의 활성을 증가시키는 것은 제아잔틴 생산을 향상시킬 가능성을 갖는다. 이러한 이유로, 파라코커스속 균주 R114로부터 ispA 유전자를 다음과 같이 클로닝하고 서열분석하였다. 6개의 세균성 FPP 신타제의 아미노산 서열은 공중 데이터베이스로부터 수득하였다. 이들 서열은 여러개의 매우 보존성인 영역들을 갖는다. 2개의 상기 영역, 및 PCR에 사용된 올리고뉴클레오타이드는 표 27에 나타내었다. 주형으로 파라코커스속 균주 R114 DNA 를 사용하여 올리고뉴클레오타이드 GTT-1 및 GTT-2를 이용한 PCR 결과 예상된 크기의 산물이 수득되었다. PCR 산물은 벡터 pCR(등록상표) 2.1-TOPO에 클로닝하고 서열분석하였다. 클로닝된 단편은 파라코커스속 균주 R114 DNA의 서던 분석에 프로브로서 사용하였으며 약 1.9 kb의 BamHI-NcoI 단편에 하이브리드화되는 것으로 밝혀졌다. 파라코커스속 균주 R114 DNA는 BamHI 및 NcoI으로 절단하고 단편들은 아가로스 겔 전기영동으로 분리하였다. 1.5 내지 2.1 kb 사이의 영역을 단리하고 클로닝 벡터의 BamHI 및 NcoI 부위에 클로닝하였다. 이어서, 프로브로서 ispA-PCR 단편을 사용하여 상기 부분 라이브러리를 검색하고, 두 개의 양성 클론을 단리하였다. 서열분석 결과 두 클론의 플라스미드 모두 ispA 유전자를 함유한 것으로 확인되었다. ispA의 상위(서열번호: 159)는 엑소뉴클레아제 VII, XseB(서열번호: 158)의 작은 소단위에 대한 유전자이고, 하위는 1-데옥시자일룰로즈-5-포스페이트 신타제를 암호화하는 dxs 유전자(서열번호: 160)이다. 이것은 이. 콜라이에서 발견된 것과 동일한 유전자 배열이다. NcoI-BamHI의 서열은 서열번호: 157로 예시되어 있으며, XseB, IspA 및 Dxs의 아미노산 서열은 각각 서열번호: 158, 서열번호: 159 및 서열번호: 160으로 나타내었다. ispA의 개시 코돈은 천연 IspA의 아미노-말단에서 각각 2 또는 1개의 메티오닌 잔기를 야기하는 GTG 또는 ATG일 수 있다.

실시예 5 내지 7에 기술된 동일한 일반 클로닝 방법을 이용하여, 천연 숙주 파라코커스속 균주 R114에서 ispA 유전자를 과발현시키도록 새로운 플라스미드 pBBR-tK-PcrtE-ispA-2를 구축하였다. 플라스미드는 전기천공에 의해 균주 R114에 도입하였으며, 형질전환체는 PCR로 확인하였다. 3개의 대표적인 형질전환체 및 대 조 균주(R114/pBBR-K)를 362F/2 배지(실시예 11)에서 성장시키고, 조 추출물을 제조하고 실시예 1에 기술된 방법에 따라 ispA 유전자 산물인 FPP 신타제의 활성을 분석하였다. R114/pBBR-K에서의 기본(염색체에 의해 암호화된) FPP 신타제 비활성은 62.6 U/mg이었다. 3개 형질전환체에서의 FPP 신타제 활성은 108.3 U/mg(73% 증가), 98.5 U/mg(57% 증가) 및 83.8 U/mg(34% 증가)로서, 파라코커스속 균주 R114에서 ispA 유전자의 과발현 및 활성 형태의 그의 산물인 FPP 신타제의 과발현을 입증하였다.

실시예 10: 파라코커스 속 균주 R114로부터 아세틸-CoA 아세틸트랜스퍼라제를 암호화하는 유전자의 클로닝 및 서열분석

IPP 생합성에서 첫 번째 수행 단계는 아세틸-CoA 및 아세토아세틸-CoA를 HMG-CoA 신타제에 의해 하이드록시메틸글루타릴-CoA(HMG-CoA)로 축합시키는 것이다. 기질 아세토아세틸-CoA는 효소 아세틸-CoA 아세틸트랜스퍼라제(아세토아세틸-CoA 티올라제 또는 β-케토티올라제로도 알려져 있음)에 의해 두 분자의 아세틸-CoA의 축합에 의해 생성된다. 상기 반응은 중심 대사(아세틸-CoA에서)를 메발로네이트 경로를 통한 이소프레노이드 생합성으로 연결시키기 때문에, 유전자 증폭에 의한 아세틸-CoA 아세틸트랜스퍼라제의 활성 증가는 생체내에서 카로티노이드 및 기타 이소프레노이드로의 탄소 흐름을 증가시킬 가능성을 갖는다. 파라코커스속 균주 R114에는, 아세틸-CoA 아세틸트랜스퍼라제를 암호화하는 2개 이상의 유전자, atoB 및 phaA가 존재한다. atoB 유전자의 말단은 파라코커스속 균주 R1534(US 6,087,152) 및 R114(본 발명)에서 crtE의 개시부의 165개 뉴클레오타이드 상위이다. atoB 유전자의 뉴클레오타이드 서열 및 파라코커스속 균주 R1534로부터 암호화된 아세틸-CoA 아세틸트랜스퍼라제의 상응하는 아미노산 서열은 각각 서열번호: 175 및 서열번호: 176으로 예시되었다.

실시예 5에 기술된 바와 동일한 일반적 방법을 이용하여, atoB 유전자를 플라스미드 pDS 및 pDS-His에 클로닝하였다. 새로운 플라스미드 pDS-atoB 및 pDS-His-atoB를 이. 콜라이 균주 M15에 도입하였다. 생성된 균주 M15/pDS-atoB 및 M15/pDS-His-atoB를 IPTG 유도하에 및 부재하에(실시예 5에 기술된 바와 같이) 성장시키고, 아세틸-CoA 아세틸트랜스퍼라제 분석(사용된 방법은 실시예 1에서 기술하였다) 및 SDS-PAGE 분석을 위해 조 추출물을 제조하였다. M15/pDS-atoB 및 M15/pDS-His-atoB(IPTG 유도하에)의 추출물중 아세틸-CoA 아세틸트랜스퍼라제 비활 성은 각각 0.2 U/mg 및 13.52 U/mg이었다. 플라스미드를 함유하지 않은 이. 콜라이에서 측정된 기본 활성은 0.006 U/mg이었다. IPTG 유도시, atoB 유전자 산물인 아세틸-CoA 아세틸트랜스퍼라제는 이. 콜라이 M15에서 과생산된다. 천연 (M15/pDS-atoB) 및 His-부가된 (M15/pDS/his-atoB) 형태 둘 다 과생산되었다. 과생산 정도는 M15/pDS-His-atoB에서 훨씬 더 높아, 두 균주의 (유도된) 추출물에서 측정된 아세틸-CoA 아세틸트랜스퍼라제 활성과 일치하였다.

아세토아세틸-CoA는 또한 폴리하이드록시알카노에이트(PHA) 생합성에서 첫 번째 수행 단계의 기질이다. 많은 세균에서, PHA 생합성에 수반되는 유전자들은 오페론에서 무리를 이룬다[Madison and Huisman, Microbiol. Mol. Biol. Rev., 63:21-53, 1999]. 파라코커스 데니트리피칸스에서, 각각 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제를 암호화하는 phaA 및 phaB 유전자는 오페론에서 집단화되는 반면[Yabutani et al., FEMS Microbiol. Lett., 133:85-90, 1995], 상기 경로의 마지막 효소 폴리(3-하이드록시알카노에이트) 신타제를 암호화하는 유전자 phaC는 상기 오페론의 일부가 아니다[Ueda et al., J. Bacteriol., 178:774-779, 1995]. 파라코커스속 균주 R1534로부터의 phaA 및 파라코커스속 균주 R114로부터의 phaC의 일부를 함유하는 PCR 단편들을 파라코커스 데니트리피칸스 phaA 및 phaC 유전자 서열을 기초로 하는 프라이머를 사용하여 수득하였다. 이어서, PCR 단편들을 파라코커스속 균주 R114 λ-라이브러리(실시예 4 참조)를 검색하기 위한 프로브로 사용하였다. phaA 및 phaC 프로브와 하이브리드화되는 여러개의 λ-클론을 단리하고, 삽입물 중 phaA 및 phaC 유전자의 존재를 서열 분석에 의해 확인하였다. 서브클로닝 및 서열분석에 의해 3개의 phaA λ-클론을 추가로 분석하였는데, 이때 phaB는 phaA의 하위에서 발견되었다. 그러므로, 파라코커스 데니트리피칸스의 경우에서와 같이, phaA 및 phaB 유전자는 무리를 이루는 반면, phaC 유전자는 게놈의 어느 곳에나 위치한다. 파라코커스속 균주 R114로부터의 phaAB 유전자집단의 뉴클레오타이드 서열 및 아세틸-CoA 아세틸트랜스퍼라제(PhaA)의 추정 아미노산 서열은 각각 서열번호: 177 및 서열번호: 178 및 179로 나타내었다. 오페론에서 PHA 생합성에 수반되는 유전자들의 집단화는, 세포가 폴리(3-하이드록시알카노에이트)를 생산하는 경우 적어도 phaA 및 phaB가 함께 발현됨을 시사한다. 다른 한편으로, 추정 전사 정지 신호는 파라코커스 데니트리피칸스 phaAB 오페론에서는 존재하지 않는, 파라코커스속 균주 R114로부터의 phaA 및 phaB 유전자 사이에서 발견된다[Yabutani et al., FEMS Microbiol. Lett., 133:85-90, 1995]. 따라서, 두 유전자의 발현은 파라코커스속 균주 R114에서는 연계되지 않을 수도 있다.

실시예 5에서 기술한 바와 동일한 일반적 방법을 이용하여, phaA 유전자를 플라스미드 pDS-His에 클로닝하였다. 새로운 플라스미드 pDS-His-phaA를 이. 콜라이 균주 M15에 도입하였다. 생성된 균주 M15/pDS-His-phaA를 IPTG 유도하에 및 부재하에 성장시키고(실시예 5에 기술된 바와 같이), SDS-PAGE 분석을 위해 조 추출물을 제조하였다. 클로닝된 His-부가된 파라코커스속 균주 R114 PhaA(아세틸-CoA 아세틸트랜스퍼라제)는 이. 콜라이 M15 숙주에서 IPTG 유도시 과생산된다.

제아잔틴 생산에 대한, 아세틸-CoA 아세틸트랜스퍼라제를 암호화하는 atoB 또는 phaA 유전자를 증폭시키는 잠재적인 이점을 상기에서 언급하였다. 또한, 생 체내에서 형성된 아세토아세틸-CoA의 일부가 PHA 경로로 전환되는 것을 배제하기 위해 아세토아세틸-CoA 리덕타제(phaB 유전자 산물)의 활성을 감소 또는 제거시키는 것이 제아잔틴 생산에 유리할 수 있다. phaB 활성이 결여된 파라코커스속 균주 R114의 돌연변이체는 유전자 치환 기술(구체적으로 염색체 중의 야생형 phaB 유전자를 상기 유전자의 불활성 형태로 치환시킴) 또는 고전적인 돌연변이유발 및 선별에 의해 수득할 수 있다.

실시예 11: 파라코커스 속 균주 R114로부터 유도된 돌연변이체를 이용한 라이코펜의 산업적 생산 방법

라이코펜은 균주 R-1512 및 그의 돌연변이 유도체 R1534 및 R114로 나타내는 새로운 파라코커스 종에서 제아잔틴 생합성의 중간체인 적색 카로티노이드이다. 라이코펜 자체로 상당한 상업적 잠재성을 가지기 때문에, 산업적 발효에 의해 라이코펜을 생산하는 새로운 파라코커스 종의 잠재력을 시험하는 것이 관건이었다. 라이코펜을 축적하는 제아잔틴 생합성이 차단된 돌연변이체를 수득하기 위해, 파라코커스속 균주 R114를 자외선(UV)으로 돌연변이유발한 후 적색 콜로니를 선별하였다. UV 돌연변이유발은 다음과 같이 수행하였다. 균주 R114를 밤새 배양한 배양액을 ME 배지(실시예 2 참조)에서 성장시켰다. 밤새 배양한 배양액을 새로운 ME 배지에 계대배양(초기 OD₆₁₀=0.1)시키고 28 ℃에서 3 시간동안 배양하였다. 상기 배양액 분취량을 원심분리하고 펠릿을 20 mM 인산 칼륨 완충액(pH 7.2)으로 세척하였다. 두 번째 원심분리 후에, 펠릿을 0.1의 최종 OD₆₁₀으로 재현탁시켰다. 세포 현탁액 의 10 ml 분취량을 멸균 100-ml 유리 비커에 넣었다. 세포 현탁액의 박층에 예정된 최적 시간동안 1450 μW/cm²의 플럭스로 UV 광선을 조사하였다. 조사하는 동안 비이커내에 종이 클립 및 자기 교반기를 사용하여 세포 현탁액을 혼합하였다. 돌연변이유발된 세포 현탁액(및 돌연변이유발되지 않은 대조군)을 362/F2 아가 배지(표 28) 위에 놓았다. 돌연변이유발 전후에 삼중의 생존 플레이트 계수(침침한 실내 불빛에서)를 행하였다. 플레이트를 28 ℃에서 4 내지 5 일간 배양하고 콜로니의 스코어를 매겼다. 여러 적색 콜로니(추정상의 라이코펜 생산체)를 확인하고 재-도말에 의해 정제하였다. UV7-1로 지정된 하나의 돌연변이체를 라이코펜 생산에 대해 더 평가하였다.

표 29는 대조 균주 R114 및 그의 돌연변이 유도체 UV7-1에 의한 제아잔틴 생산 및 라이코펜 생산을 나타낸 것이다. 균주 R114는 제아잔틴 만을 생산하였다. 돌연변이체 UV7-1은 주로 라이코펜을 생산하였지만, 잔류량의 제아잔틴도 또한 생산하여 UV7-1에서(추정상 crtY 유전자에서) 돌연변이가능한 블록이 완전하지 못함을 시사한다. 이러한 결과는 파라코커스속 균주 R114로부터 라이코펜 생성 균주를 유도할 수 있음을 보여준다.

실시예 12: 파라코커스 속 균주 R114로부터 유도된 균주를 이용한 발효에 의한 아스타잔틴의 산업적 생산 모델

아스타잔틴은 수중배양 산업에서 주로 이용되는 상업적으로 중요한 카로티노이드이다. EP 872,554 호는 파라코커스속 균주 R1534 및 파라코커스 카로티니파시엔스 E-396^T로부터 클로닝된 카로티노이드(crt) 유전자들의 조합을 함유하는 플라스미드를 도입함으로써 이. 콜라이에서 아스타잔틴을 생산할 수 있었음을 밝혔다. 클로닝된 crt 유전자(crtEBIYZ) 및 crtW(β-카로틴 β-4 옥시게나제)는 함께 FPP로부터 제아잔틴을 통해 아스타잔틴으로의 전체 생합성 경로를 암호화하였다. 파라코커스 카로티니파시엔스 E-396 crtW, 파라코커스속 R1534 crtZ 및 파라코커스속 R1534 crtE 유전자의 서열 및 암호화된 폴리펩타이드를 서열번호: 180 및 181(crtW); 182 및 184(crtZ); 및 184 및 185(crtE)로 나타내었다. 그러나, 파라코커스속 균주 R114 숙주 부류에서 아스타잔틴을 생산할 수 있었는지는 밝히지 않았다. 아스타잔틴 생산에 대한 균주 R114로부터 유도된 재조합 균주의 유용성을 입증하기 위해, 클로닝된 crtW 유전자(서열번호: 180)를 다음과 같이 균주 R114에 도입하였다.

프라이머 crtW-Nde 및 crtW-Bam(표 30)을 이용하여 파라코커스 카로티니파시엔스 균주 E-396^T(문헌 [Tsubokura et al., Int. J. Syst. Bacteriol., 49:277-282, 1999]; EP 872,554 호)의 클로닝된 crt 유전자집단으로부터 PCR에 의해 crtW 유전자를 증폭시켰다. 프라이머는, ATG 개시 코돈이 NdeI 부위(절단 인지 부위 CATATG)의 두 번째 절반을 구성하고 BamHI 부위(GGATCC)가 정지 코돈 바로 다음에 도입되도록 설계한다. PCR 산물을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하여 플라스미드 TOPO-crtW를 수득하였다. crtW 유전자를 NdeI 및 BamHI으로 절단하고 NdeI-BamHI 절단 벡터 pBBR-K-PcrtE(실시예 6에서 기술)에 서브클로닝하여 플라스미드 pBBR-K-PcrtE-crtW를 생성하였다.

플라스미드 pBBR-K-PcrtE-crtW를 표준 세균 접합 절차를 이용하여 파라코커스속 균주 R114로 전이시켰다(이. 콜라이 균주 S17[Priefer et al., J. Bacteriol., 163:324-330, 1985]이 공여 유기체였다). 50 mg/l 카나마이신을 함유하는 배지 362F/2 아가(표 28) 상에서 접합완료체를 선별하고 동일 배지상에 재도말하여 정제하였다. 균주내에 플라스미드 pBBR-K-PcrtE-crtW의 존재는 PCR로 확인하였다. 균주 R114(숙주 대조군), R114/pBBR-K(빈 벡터 대조군) 및 R114/pBBR-K-PcrtE-crtW에 의한 카로티노이드 생산은 ME 배지 대신 액체 362F/2 배지를 사용하는 것을 제외하고 실시예 1 및 2에 기술된 바와 같이 진탕 플라스크 배양액 중에서 측정하였다. 이 결과를 표 31에 나타내었다. 대조 균주 R114 및 R114/pBBR-K는 제아잔틴 만을 생산하였다. 균주 R114/pBBR-K-PcrtE-crtW에서, 제아잔틴은 플라스 미드-암호화된 β-카로틴 β-4 옥시게나제에 의해 완전히 소비되었다. 그러나, 아스타잔틴이 생산되었음에도 불구하고, 다른 두 케토카로티노이드, 아도니잔틴 및 칸타잔틴이 높은 수준으로 축적되었다. 이것은 β-카로틴 하이드록실라제(균주 R114에서 염색체 crtZ 유전자에 의해 암호화됨) 및 클로닝된 β 카로틴 β-4-옥시게나제(CrtW)의 생체내 불균형을 보여준다.

상기 가설을 시험하기 위해, crtZ 및 crtW 유전자를 미니-오페론에 함께 함유하는 두 개의 새로운 플라스미드를 제작하였다. crtZ 및 crtW 유전자의 발현 비를 상이하게 하기 위해 두 구성물(즉, crtZ-crtW 및 crtW-crtZ)에서 유전자의 순서를 상이하게 하였다. 새로운 플라스미드 제작에는 다음과 같이 특정 클로닝 벡터 조합의 구성이 필요하였다. 유전자들(이 경우에는, crtZ 및 crtW)을 오페론으로 구성하는 것을 촉진하기 위해 일련의 오페론 구성 벡터(벡터 pCR(등록상표) 2.1-TOPO를 기초로 함)를 설계하였다. 해당 유전자는 NdeI 부위(CATATG)에 포함된 ATG 개시 코돈, 및 TGA 정지 코돈 바로 다음에 BamHI 부위를 가져야 한다.

또한, 개시 코돈 다음의 첫 번째 뉴클레오타이드와 정지 코돈 이전의 마지막 뉴클레오타이드는 아데닌이어야 하며, 유전자는 효소 BsgI, BseMII, BseRI 및 Gsu I 중 하나 이상에 대한 부위가 결여되어야 한다. 그들의 폴리링커 서열(서열번호: 190 내지 197)의 배열이 상이한 4개의 오페론 구성 벡터를 구축하였다. 첫 번째 두 효소의 절단 부위는 NdeI 부위 내에 존재한다. 마지막 두 효소의 절단 부위는 BamHI 부위 앞에 존재한다. pOCV-1 및 pOCV-4에서의 BseRI 부위는 유일하지 않으 며 오페론 구성에 사용할 수 없다.

오페론으로 구성될 유전자는 먼저 적절한 오페론 구성 벡터의 NdeI 및BamHI 부위 사이에 개별적으로 삽입한다. 이어서, 계획된 오페론의 상위 유전자를 갖는 생성된 플라스미드를 폴리링커의 말단에 있는 두 효소들 중 한 효소 및 벡터 주쇄내에 특정 부위를 갖는 효소로 절단한다. 계획된 오페론의 하위 유전자를 함유하는 플라스미드는 폴리링커의 처음 두 효소중 한 효소 및 첫 번째 플라스미드(목적하는 상위 유전자 함유)에 사용된 것과 동일한 효소(벡터 주쇄에 특정 부위를 가짐)로 절단한다. 유전자를 갖는 단편들을 단리하고 접합하여 NdeI과 BamHI 부위 사이에 두 유전자를 모두 갖는 pOCV 플라스미드를 수득한다. 더 많은 유전자를 유사한 방식으로 부가할 수 있다. 구성된 유전자는 상위 유전자의 TGA 정지 코돈의 처음 두 뉴클레오타이드 TG가 하위 유전자의 ATG 개시 코돈의 마지막 두 뉴클레오타이드와 일치하도록 중복된다. 동일한 중복은 파라코커스속 균주 R1534에서의 카로티노이드(crt) 오페론(crtZYIB) 내의 모든 유전자 사이에서 발견된다[Pasamontes et al., Gene, 185:35-41, 1997].

pOCV 주쇄는 pCR(등록상표) 2.1-TOPO로부터 유도된다. ColE1 기점의 상위의, 복제에 필수적인 영역에서의 BseMII 부위를, 상기 부위를 CTCAC를 CACAG로 변화시키는 부위 지향 돌연변이유발에 의해 제거하였다. 남은 3개의 BseMII 부위 및 하나의 GsuI 부위는 0.8 kb DdeI-Asp700 단편을 제거함으로써 배제시켰다. 남은 벡터는 DdeI 오목한 말단의 삽입 다음에 평활-말단 접합되었다. 폴리링커는 적절한 5' 돌출부를 갖는 어닐링된 올리고뉴클레오타이드를 사용하여 BamHI과 XbaI 부 위 사이에 삽입시켰다.

플라스미드 pBBR-K-PcrtE-crtZW는 다음과 같이 오페론 구성 벡터 pOCV-2를 이용하여 제작하였다. 프라이머 crtZ-Nde 및 crtZ-Bam(표 30)을 이용하여 파라코커스속 균주 R114로부터 PCR에 의해 crtZ 유전자를 증폭시켰다. 프라이머는, ATG 개시 코돈이 NdeI 부위(절단 인지 부위 CATATG)의 두 번째 절반을 구성하고 BamHI 부위(GGATCC)가 정지 코돈 바로 다음에 도입되도록 설계하였다. PCR 산물을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하여 플라스미드 TOPO-crtZ를 수득하였다. 미니-오페론에 두 유전자를 구성하기 위해, 두 유전자 crtZ 및 crtW를 모두 플라스미드 TOPO-crtZ 및 TOPO-crtW로부터 NdeI 및 BamHI로 절단하고, NdeI- BamHI 절단 벡터 pOCV-2에 서브클로닝하여 플라스미드 pOCV-2-crtZ 및 pOCV-2-crtW를 제조하였다. 플라스미드 pOCV-2-crtZ를 BseMII 및 PstI(카나마이신 내성 유전자에는 특이적 PstI 부위가 존재한다)으로 절단하고, 2.4 kb 단편(crtZ 함유)을 pOCV-2-crtW로부터 crtW-함유 1876 bp BseRI-PstI 단편과 접합시켰다. 생성된 플라스미드 pOCV-2-crtZW를 NdeI 및 BamHI으로 절단하고, crtZW 단편을 pBBR-K-PcrtE의 NdeI-BamHI 주쇄와 접합하여 pBBR-K-PcrtE-crtZW를 수득하였다. 플라스미드 pBBR-K-PcrtE-crtWZ를 유사한 방식으로 제작하였다.

표 31의 데이터는 아도니잔틴, 칸타잔틴 및 아스타잔틴의 비가 균주 pBBR-K-PcrtE-crtW에 비해 균주 R114/pBBR-K-PcrtE-crtWZ에서 감지할 수 있을 정도로 변하지 않았음을 보여준다. 그러나, 균주 pBBR-K-PcrtE-crtWZ에서, 케토카로티노이드의 생산은 아스타잔틴에 유리하게 변화되었다. 이 결과는 발현 수준이 미니-오페 론 내의 유전자 위치에 따라 달라짐을 나타내며, β-카로틴 하이드록실라제 활성의 생체내 수준을 증가시키면 상기 효소와 제아잔티을 아스타잔틴으로 완전히 전환시키는데 보다 유리한 β-카로틴 β-4 옥시게나제의 활성간에 균형이 이루어짐을 시사한다.

본 실시예에 기술된 결과는 또한 적절한 유전 공학처리를 통해 아스타잔틴 뿐 아니라 파라코커스속 균주 R114 또는 그의 관련 균주에서 상업적으로 중요한 다른 케토카로티노이드를 생산하는 것이 가능함을 보여준다. 예를 들면, 균주 R114(β-카로틴 하이드록실라제 활성이 결여됨)의 crtZ 돌연변이체 중의 β-카로틴 β-4 옥시게나제를 암호화하는 유전자의 발현은 하이드록실화 카로티노이드를 동시-생산하지 않으면서 오직 케토카로티노이드, 예를 들어, 에키네논 또는 칸타잔틴의 생성을 제공한다. 본 실시예 및 실시예 11에 나타낸 결과들은 함께 산업적으로 중요한 카로티노이드를 생성하는 파라코커스속 균주 R114 및 그의 관련 균주의 광범위한 유용성을 보여준다.

실시예 13: 메발로네이트 경로의 유전자를 과발현하는 파라코커스 속 균주 R114의 배양액 중 메발로네이트의 축적

파라코커스속 균주 R114에서 메발로네이트 경로의 유전자들의 과발현은 메발로네이트 경로를 통한 증가된 탄소 흐름을 유도한다. 플라스미드 pBBR-K-mev-op16-2의 제작은 실시예 5에서 기술하였다. 플라스미드 pBBR-K-mev-op-up-4는 다음과 같이 제작하였다. 파라코커스속 균주 R114 메발로네이트 오페론을 함유하는 λ-클론(실시예 4 참조)의 부분 절단 후에 3.1 kb SmaI-SalI 단편 상에 mvaA 유전 자의 대부분 및 전체 idi 및 hcs 유전자를 함유하는 DNA 단편을 수득하였다. 상기 단편을 pUC19에 서브클로닝하여 플라스미드 pUC19mev-op-up'를 수득하였다. 서브클로닝을 촉진하기 위해, 메발로네이트 유전자를 함유하는 pUC19mev-op-up'의 KpnI-HindIII 단편을 벡터 pBluescriptKS^＋에 재클로닝하여 플라스미드 pBluKSp-mev-op-up'를 수득하였다. 이어서, pUC19mev-op-up'로부터 1.7 kb의 SalI 단편을, 파라코커스속 균주 R114로부터 클로닝된 SalI-EcoRI 단편을 함유하는 pUC19-유래 플라스미드(실시예 4 참조)인 플라스미드 2ES2-1의 SalI 부위에 클로닝하였다. 이로써 플라스미드 pUC19mev-op-up-2가 생성되었다. 이어서, 메발로네이트 오페론의 개시부를 갖는 pUC19mev-op-up-2로부터의 BbsI-BsaI 단편을 idi 및 hcs를 함유하는 pBluKSp-mev-op-up'로부터의 BbsI-BsaI 단편과 결합시켜 플라스미드 pUC-mev-op-up-3을 수득하였다. 별도로, MluI 제한효소 부위를 함유하는 어닐링된 프라이머를 삽입함으로써 벡터 pBBR1MCS-2(실시예 5 참조)의 NsiI 및 KpnI 부위 사이에 단일 MluI 부위를 도입하였다. 생성된 새로운 클로닝 벡터 pBBR-K-Mlu를 MluI 및 KpnI으로 절단하고, 메발로네이트 오페론의 처음 3개 유전자를 함유하는 pUCmev-op-up-3으로부터의 MluI-KpnI 단편을 삽입하여 플라스미드 pBBR-K-mev-op-up-3을 수득하였다. 그 다음, mvk 유전자의 대부분 및 pmk의 5' 말단을 함유하는 플라스미드 16SB3(플라스미드 16SB3은 파라코커스속 균주 R114 SalI-BamHI 단편 A를 함유하는 pUC19-유래 플라스미드이다; 실시예 4 참조)으로부터의 SmaI 단편을 삽입하여 플라스미드 pBBR-K-mev-op-up-4를 제작하였다. 플라스미드 pBBR-K-mev-op-up-4의 삽입 물은 추정 메발로네이트 오페론 프로모터 영역, 메발로네이트 오페론의 처음 4개 유전자 및 pmk의 5' 말단을 함유한다.

플라스미드 pBBR-K-mev-op16-2 및 pBBR-K-mev-op-up-4를 각각 전기천공에 의해 파라코커스속 균주 R114에 도입하였다. 새로운 균주에 의한 제아잔틴 및 메발로네이트의 생산을 대조 균주 R114와 비교하였다. 균주는 액체 배지 362F/2(실시예 11 참조)에서 배플 진탕 플라스크에서 72 시간동안 성장시켰다. 균주 R114/pBBR-K-mev-op16-2 및 R114/pBBR-K-mev-op-up-4의 경우, 카나마이신(50 mg/l)을 또한 배양액에 가하였다. 배양 온도는 28 ℃이었고, 진탕은 200 rpm으로 수행하였다. 제아잔틴은 실시예 1에 나타낸 방법으로 측정한 반면, 배양 상등액 중의 메발로네이트는 다음과 같이 측정하였다: 0.6 ml의 배양액 샘플을 13,000xg에서 4 분간 원심분리하였다. 400 μl의 상등액을 400 μl의 메탄올에 가하고 1 분간 볼텍싱하여 혼합하였다. 혼합물을 13,000xg에서 4 분간 원심분리하였다. 그 다음, 생성된 상등액을 린드만(Lindemann) 등의 방법[J. Pharm. Biomed. Anal., 9:311-316, 1991]을 이용하여 다음과 같은 약간의 변형하에 기체 크로마토그래피(GC)로 직접 분석하였다. GC는 쿨-온-컬럼 주입기 및 화염 이온화 검출기가 장착된 휴렛-팩커드(Hewlett-Packard) 6890플러스 기기(미국 펜실바니아주 에이븐데일 소재의 휴렛-팩커드)이었다. 전술한 바와 같이 제조된 1 μl의 샘플을 가교결합된 변형 폴리에틸렌 글리콜(HP-FFAP, 미국 에이질런트 테크놀로지(Agilent Technologies))의 0.52 μ 필름으로 코팅된 융합 실리카 모세관 컬럼(15 m 길이 x 0.32 mm 내경) 위에 주입하였다. 0.6 바의 유입 압력에서 운반 기체로 헬륨을 사용하였다. 프로 그램가능 주입기의 온도는 30 ℃/분의 속도로 82 ℃에서 250 ℃로 상승시켰다. 컬럼 온도 프로필은 0.5 분간 80 ℃에 이어, 15 ℃/분에서 선형 온도 구배로 250 ℃로 상승시키고 최종적으로 250 ℃에서 5 분간 유지하였다. 검출기 온도는 320 ℃로 유지하였다.

첫 번째 실험에서, 제아잔틴 및 메발로네이트 생성은 균주 R114 및 R114/pBBR-K-mev-op16-2(표 32)에서 측정하였다. 두 균주 모두 유사한 양의 제아잔틴을 생산하였지만, 균주 R114/pBBR-K-mev-op16-2는 4배 더 높은 수준의 메발로네이트를 생산하였다. 이러한 결과는 파라코커스속 균주 R114에서 메발로네이트 경로의 유전자들의 과발현이 메발로네이트 경로를 통한 증가된 탄소 흐름을 야기함을 보여준다. 균주 R114/pBBR-K-mev-op16-2는 과발현된 crtE 유전자를 갖지 않으므로 메발로네이트의 축적은 예상되었으며, crtE 유전자 산물(GGPP 신타제)은 파라코커스속 균주 R114에서의 제아잔틴 생산에 있어 제한 단계인 것으로 알려져 있다(실시예 6 및 8 참조). 제한된 양의 GGPP 신타제를 갖는 세포는, 메발로네이트 경로의 효소들의 과잉생산시, FPP를 축적할 것으로 예상되며, FPP는 메발로네이트 키나제의 유효한 억제제인 것으로 공지되어 있다[Dorsey and Porter, J. Biol. Chem., 243:4667-4670, 1968; Gray and Kekwick, BBA, 279:290-296, 1972; Hinson et al., J. Lipids Res., 38:2216-2223, 1997]. 그러므로, 메발로네이트 경로의 유전자들의 과발현에서 비롯되는 FPP의 축적은 메발로네이트 키나제의 저해를 야기하고, 이것은 차례로 배양액 중 메발로네이트 축적으로 나타난다.

두 번째 실험에서는, 제아잔틴 및 메발로네이트 생성을 균주 R114 및 R114/pBBR-K-mev-op-up-4의 두 개의 독립적인 단리물에서 측정하였다(표 33). 이 결과는 또한 메발로네이트 경로 유전자의 과발현이 메발로네이트 경로를 통한 탄소 흐름을 증가시킴을 보여준다.

하기의 생물 물질은 미국 버지니아주 매너새스 10801 유니버시티 블러바드 소재의 미국 종균 협회(American Type Culture Collection, ATCC)에 부다페스트 조약(Budapest Treaty)에 의거하여 기탁하였으며 하기의 기탁 번호를 지정받았다:

상기에서 인용된 모든 특허, 특허출원 및 출판물은 본원에 전체로 인용되듯이 그 전체가 본원에 참고로 인용된다.

본 발명을 상기와 같이 기술하였지만, 본 발명은 많은 방식으로 변형될 수 있음은 명백할 것이다. 상기 변형은 본 발명의 진의 및 범위를 벗어나는 것으로 간주하지 않으며 상기 모든 변형은 하기의 청구의 범위의 범주내에 포함되는 것이다.

<110> Roche Vitamins AG <120> Improved Isoprenoid Production <130> 20918 <140> 10-2004-7015938 <141> 2003-12-06 <160> 197 <170> KopatentIn version 1.71 <210> 1 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(20) <223> primer <400> 1 agagtttgat cctggctcag 20 <210> 2 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (12) <223> n means C or T <220> <221> misc_feature <222> (1)..(20) <223> primer <400> 2 ctggctcagg angaacgctg 20 <210> 3 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(20) <223> primer <400> 3 aaggaggtga tccagccgca 20 <210> 4 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(20) <223> primer <400> 4 ctcctacggg aggcagcagt 20 <210> 5 <211> 18 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(18) <223> primer <400> 5 cagcagccgc ggtaatac 18 <210> 6 <211> 19 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(19) <223> primer <400> 6 aactcaaagg aattgacgg 19 <210> 7 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(20) <223> primer <400> 7 agtcccgcaa cgagcgcaac 20 <210> 8 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(20) <223> primer <400> 8 gctacacacg tgctacaatg 20 <210> 9 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(20) <223> primer <400> 9 actgctgcct cccgtaggag 20 <210> 10 <211> 18 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(18) <223> primer <400> 10 gtattaccgc ggctgctg 18 <210> 11 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(20) <223> primer <400> 11 gttgcgctcg ttgcgggact 20 <210> 12 <211> 1404 <212> DNA <213> Paracoccus sp. <400> 12 gcggcaggct taacacatgc aagtcgagcg aggtcttcgg acctagcggc ggacgggtga 60 gtaacgcgtg ggaacgtgcc ctttgctacg gaatagtccc gggaaactgg gtttaatacc 120 gtatgtgccc tacgggggaa agatttatcg gcaaaggatc ggcccgcgtt ggattaggta 180 gttggtgggg taatggccta ccaagccgac gatccatagc tggtttgaga ggatgatcag 240 ccacactggg actgagacac ggcccagact cctacgggag gcagcagtgg ggaatcttag 300 acaatggggg caaccctgat ctagccatgc cgcgtgagtg atgaaggccc tagggttgta 360 aagctctttc agctgggaag ataatgacgg taccagcaga agaagccccg gctaactccg 420 tgccagcagc cgcggtaata cggagggggc tagcgttgtt cggaattact gggcgtaaag 480 cgcacgtagg cggactggaa agttgggggt gaaatcccgg ggctcaacct cggaactgcc 540 tccaaaacta tcagtctgga gttcgagaga ggtgagtgga ataccgagtg tagaggtgaa 600 attcgtagat attcggtgga acaccagtgg cgaaggcggc tcactggctc gatactgacg 660 ctgaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 720 acgatgaatg ccagtcgtcg ggttgcatgc aattcggtga cacacctaac ggattaagca 780 ttccgcctgg ggagtacggt cgcaagatta aaactcaaag gaattgacgg gggcccgcac 840 aagcggtgga gcatgtggtt taattcgaag caacgcgcag aaccttacca acccttgaca 900 tccctggaca tcccgagaga tcgggctttc acttcggtga ccaggagaca ggtgctgcat 960 ggctgtcgtc agctcgtgtc gtgagatgtt cggttaagtc cggcaacgag cgcaacccac 1020 gtccctagtt gccagcattc agttgggcac tctatggaaa ctgccgatga taagtcggag 1080 gaaggtgtgg atgacgtcaa gtcctcatgg cccttacggg ttgggctaca cacgtgctac 1140 aatggtggtg acagtgggtt aatccccaaa agccatctca gttcggattg tcctctgcaa 1200 ctcgagggca tgaagttgga atcgctagta atcgcggaac agcatgccgc ggtgaatacg 1260 ttcccgggcc ttgtacacac cgcccgtcac accatgggag ttggttctac ccgacgacgc 1320 tgcgctaacc cttcggggag gcaggcggcc acggtaggat cagcgactgg ggtgaagtcg 1380 taacaaggta gccgtagggg aacc 1404 <210> 13 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(20) <223> adaptor <400> 13 tcgtagactg cgtacaggcc 20 <210> 14 <211> 14 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(14) <223> adaptor <400> 14 catctgacgc atgt 14 <210> 15 <211> 16 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(16) <223> adaptor <400> 15 gacgatgagt cctgac 16 <210> 16 <211> 14 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(14) <223> adaptor <400> 16 tactcaggac tggc 14 <210> 17 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(17) <223> primer <400> 17 gactgcgtac aggccca 17 <210> 18 <211> 18 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(18) <223> primer <400> 18 cgatgagtcc tgaccgaa 18 <210> 19 <211> 18 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(18) <223> primer <400> 19 cgatgagtcc tgaccgac 18 <210> 20 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(17) <223> primer <400> 20 gactgcgtac aggcccc 17 <210> 21 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(17) <223> primer <400> 21 gactgcgtac aggcccg 17 <210> 22 <211> 18 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(18) <223> primer <400> 22 cgatgagtcc tgaccgag 18 <210> 23 <211> 8 <212> PRT <213> Artificial <220> <221> PEPTIDE <222> (2) <223> Xaa means Leu or Ile <220> <221> PEPTIDE <222> (1)..(8) <223> peptide 1 <400> 23 Ala Xaa Ile Lys Tyr Trp Gly Lys 1 5 <210> 24 <211> 27 <212> DNA <213> Artificial <220> <221> misc_feature <222> (3) <223> n means C or G <220> <221> misc_feature <222> (12) <223> n means A or G <220> <221> misc_feature <222> (15) <223> n means C or T <220> <221> misc_feature <222> (21) <223> n means C or G or T <220> <221> misc_feature <222> (24) <223> n means A or G <220> <221> misc_feature <222> (1)..(27) <223> oligonucleotide <400> 24 ccnctgatca antantgggg naanatc 27 <210> 25 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (3) <223> n means C or G <220> <221> misc_feature <222> (12) <223> n means A or G <220> <221> misc_feature <222> (15) <223> n means C or T <220> <221> misc_feature <222> (1)..(20) <223> oligonucleotide <400> 25 gcnctgatca antantgggg 20 <210> 26 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (3) <223> n means C or G <220> <221> misc_feature <222> (12) <223> n means A or G <220> <221> misc_feature <222> (15) <223> n means C or T <220> <221> misc_feature <222> (1)..(20) <223> oligonucleotide <400> 26 gcnatcatca antantgggg 20 <210> 27 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (6) <223> n means A or G <220> <221> misc_feature <222> (9) <223> n means C or T <220> <221> misc_feature <222> (1)..(17) <223> oligonucleotide <400> 27 atcaantant ggggtaa 17 <210> 28 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (6) <223> n means A or G <220> <221> misc_feature <222> (9) <223> n means C or T <220> <221> misc_feature <222> (1)..(17) <223> oligonucleotide <400> 28 atcaantant ggggcaa 17 <210> 29 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (6) <223> n means A or G <220> <221> misc_feature <222> (9) <223> n means C or T <220> <221> misc_feature <222> (1)..(17) <223> oligonucleotide <400> 29 atcaantant gggggaa 17 <210> 30 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (6) <223> n means A or G <220> <221> misc_feature <222> (9) <223> n means C or T <220> <221> misc_feature <222> (1)..(17) <223> oligonucleotide <400> 30 atcaantant ggggaaa 17 <210> 31 <211> 8 <212> PRT <213> Artificial <220> <221> (null) <222> (7) <223> Xaa means Asn or Gln <220> <221> (null) <222> (1)..(8) <223> peptide 2 <400> 31 Thr Met Asp Ala Gly Pro Xaa Val 1 5 <210> 32 <211> 24 <212> DNA <213> Artificial <220> <221> misc_feature <222> (3) <223> n means C or G <220> <221> misc_feature <222> (9) <223> n means C or T <220> <221> misc_feature <222> (12) <223> n means C or G <220> <221> misc_feature <222> (15) <223> n means C or G or T <220> <221> misc_feature <222> (18) <223> n means C or G <220> <221> misc_feature <222> (21) <223> n means C or T <220> <221> misc_feature <222> (24) <223> n means C or G <220> <221> misc_feature <222> (1)..(24) <223> oligonucleotide <400> 32 acnatggang cnggnccnaa ngtn 24 <210> 33 <211> 24 <212> DNA <213> Artificial <220> <221> misc_feature <222> (3) <223> n means C or G <220> <221> misc_feature <222> (9) <223> n means A or G <220> <221> misc_feature <222> (12) <223> n means A or G <220> <221> misc_feature <222> (12) <223> n means C or G <220> <221> misc_feature <222> (15) <223> n means A or C or G <220> <221> misc_feature <222> (18) <223> n means C or G <220> <221> misc_feature <222> (21) <223> n means A or G <220> <221> misc_feature <222> (24) <223> n means C or G <220> <221> misc_feature <222> (1)..(24) <223> oligonucleotide <400> 33 tgntacctnc gnccnggntt ncan 24 <210> 34 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (12) <223> n means C or G <220> <221> misc_feature <222> (15) <223> n means A or C or G <220> <221> misc_feature <222> (1)..(17) <223> oligonucleotide <400> 34 tggtacctac gnccngg 17 <210> 35 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (12) <223> n means C or G <220> <221> misc_feature <222> (15) <223> n means A or C or G <220> <221> misc_feature <222> (1)..(17) <223> oligonucleotide <400> 35 tggtacctgc gnccngg 17 <210> 36 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (12) <223> n means C or G <220> <221> misc_feature <222> (1)..(17) <223> oligonucleotide <220> <221> misc_feature <222> (15) <223> n means A or C or G <400> 36 tgctacctac gnccngg 17 <210> 37 <211> 17 <212> DNA <213> Artificial <220> <221> misc_feature <222> (12) <223> n means C or G <220> <221> misc_feature <222> (15) <223> n means A or C or G <220> <221> misc_feature <222> (1)..(17) <223> oligonucleotide <400> 37 tgctacctgc gnccngg 17 <210> 38 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (9) <223> n means C or G <220> <221> misc_feature <222> (12) <223> n means A or C or G <220> <221> misc_feature <222> (15) <223> n means C or G <220> <221> misc_feature <222> (18) <223> n means A or G <220> <221> misc_feature <222> (1)..(20) <223> oligonucleotide <400> 38 tacctacgnc cnggnttnca 20 <210> 39 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (9) <223> n means C or G <220> <221> misc_feature <222> (12) <223> n means A or C or G <220> <221> misc_feature <222> (15) <223> n means C or G <220> <221> misc_feature <222> (18) <223> n means A or G <220> <221> misc_feature <222> (1)..(20) <223> oligonucleotide <400> 39 tacctgcgnc cnggnttnca 20 <210> 40 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (9) <223> n means C or G <220> <221> misc_feature <222> (12) <223> n means A or C or G <220> <221> misc_feature <222> (15) <223> n means C or G <220> <221> misc_feature <222> (18) <223> n means C or T <220> <221> misc_feature <222> (1)..(20) <223> oligonucleotide <400> 40 tacctacgnc cnggngtnca 20 <210> 41 <211> 20 <212> DNA <213> Artificial <220> <221> misc_feature <222> (9) <223> n means C or G <220> <221> misc_feature <222> (12) <223> n means A or C or G <220> <221> misc_feature <222> (15) <223> n means C or G <220> <221> misc_feature <222> (18) <223> n means C or T <220> <221> misc_feature <222> (1)..(20) <223> oligonucleotide <400> 41 tacctgcgnc cnggngtnca 20 <210> 42 <211> 9066 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (2622)..(3641) <400> 42 ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60 cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120 cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180 acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240 tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300 cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360 tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420 tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480 attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540 atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600 cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660 atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720 gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780 tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840 cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900 tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960 catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020 tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080 cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140 gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200 gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260 ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320 gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380 atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440 gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500 atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560 catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620 cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680 tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740 gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800 gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860 ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920 acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980 acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040 cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100 tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160 ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220 acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280 gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340 ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400 acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460 tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520 gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580 tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca g atg att tcc 2630 Met Ile Ser 1 cat acc ccg gtg ccc acg caa tgg gtc ggc ccg atc ctg ttc cgc ggc 2678 His Thr Pro Val Pro Thr Gln Trp Val Gly Pro Ile Leu Phe Arg Gly 5 10 15 ccc gtc gtc gag ggc ccg atc agc gcg ccg ctg gcc acc tac gag acg 2726 Pro Val Val Glu Gly Pro Ile Ser Ala Pro Leu Ala Thr Tyr Glu Thr 20 25 30 35 ccg ctc tgg ccc tcg acc gcg cgg ggg gca ggg gtt tcc cgg cat tcg 2774 Pro Leu Trp Pro Ser Thr Ala Arg Gly Ala Gly Val Ser Arg His Ser 40 45 50 ggc ggg atc cag gtc tcg ctg gtc gac gaa cgc atg agc cgc tcg atc 2822 Gly Gly Ile Gln Val Ser Leu Val Asp Glu Arg Met Ser Arg Ser Ile 55 60 65 gcg ctg cgg gcg cat gac ggg gcg gcg gcg acc gcc gcc tgg cag tcg 2870 Ala Leu Arg Ala His Asp Gly Ala Ala Ala Thr Ala Ala Trp Gln Ser 70 75 80 atc aag gcc cgc cag gaa gag gtc gcg gcc gtg gtc gcc acc acc agc 2918 Ile Lys Ala Arg Gln Glu Glu Val Ala Ala Val Val Ala Thr Thr Ser 85 90 95 cgc ttc gcc cgc ctt gtc gag ctg aat cgc cag atc gtg ggc aac ctg 2966 Arg Phe Ala Arg Leu Val Glu Leu Asn Arg Gln Ile Val Gly Asn Leu 100 105 110 115 ctt tac atc cgc atc gaa tgc gtg acg ggc gac gcc tcg ggt cac aac 3014 Leu Tyr Ile Arg Ile Glu Cys Val Thr Gly Asp Ala Ser Gly His Asn 120 125 130 atg gtc acc aag gcc gcc gag gcc gtg cag ggc tgg atc ctg tcg gaa 3062 Met Val Thr Lys Ala Ala Glu Ala Val Gln Gly Trp Ile Leu Ser Glu 135 140 145 tac ccg atg ctg gcc tat tcc acg atc tcg ggg aac ctg tgc acc gac 3110 Tyr Pro Met Leu Ala Tyr Ser Thr Ile Ser Gly Asn Leu Cys Thr Asp 150 155 160 aag aag gcg tcg gcg gtc aac ggc atc ctg ggc cgc ggc aaa tac gcc 3158 Lys Lys Ala Ser Ala Val Asn Gly Ile Leu Gly Arg Gly Lys Tyr Ala 165 170 175 gtc gcc gag gtc gag atc ccg cgc aag atc ctg acc cgc gtg ctg cgc 3206 Val Ala Glu Val Glu Ile Pro Arg Lys Ile Leu Thr Arg Val Leu Arg 180 185 190 195 acc agc gcc gag aag atg gtc cgc ctg aac tac gag aag aac tat gtc 3254 Thr Ser Ala Glu Lys Met Val Arg Leu Asn Tyr Glu Lys Asn Tyr Val 200 205 210 ggg ggt acg ctg gcg ggg tcg ctg cgc agt gcg aac gcg cat ttc gcc 3302 Gly Gly Thr Leu Ala Gly Ser Leu Arg Ser Ala Asn Ala His Phe Ala 215 220 225 aac atg ctg ctg ggc ttc tac ctg gcg acg ggg cag gac gcg gcc aac 3350 Asn Met Leu Leu Gly Phe Tyr Leu Ala Thr Gly Gln Asp Ala Ala Asn 230 235 240 atc atc gag gcc agc cag ggc ttc gtc cat tgc gag gcc cgc ggc gag 3398 Ile Ile Glu Ala Ser Gln Gly Phe Val His Cys Glu Ala Arg Gly Glu 245 250 255 gat ctg tat ttc tcg tgc acg ctg ccc aac ctc atc atg ggc tcg gtc 3446 Asp Leu Tyr Phe Ser Cys Thr Leu Pro Asn Leu Ile Met Gly Ser Val 260 265 270 275 ggt gcc ggc aag ggc atc ccc tcg atc gag gag aac ctg tcg cgg atg 3494 Gly Ala Gly Lys Gly Ile Pro Ser Ile Glu Glu Asn Leu Ser Arg Met 280 285 290 ggc tgc cgc cag ccg ggc gaa ccc ggc gac aac gcg cgc cgt ctt gcg 3542 Gly Cys Arg Gln Pro Gly Glu Pro Gly Asp Asn Ala Arg Arg Leu Ala 295 300 305 gcg atc tgc gcg ggc gtc gtg ctg tgt ggt gaa ttg tcg ctg ctt gcg 3590 Ala Ile Cys Ala Gly Val Val Leu Cys Gly Glu Leu Ser Leu Leu Ala 310 315 320 gcc cag acc aac ccc gga gag ttg gtc cgc acc cac atg gag atg gag 3638 Ala Gln Thr Asn Pro Gly Glu Leu Val Arg Thr His Met Glu Met Glu 325 330 335 cga tgaccgaca gcaaggatca ccatgtcgcg gggcgcaagc tggaccatct 3690 Arg 340 gcgtgcattg gacgacgatg cggatatcga ccggggcgac agcggcttcg accgcatcgc 3750 gctgacccat cgcgccctgc ccgaggtgga tttcgacgcc atcgacacgg cgaccagctt 3810 cctgggccgt gaactgtcct tcccgctgct gatctcgtcc atgaccggcg gcaccggcga 3870 ggagatcgag cgcatcaacc gcaacctggc cgctggtgcc gaggaggccc gcgtcgccat 3930 ggcggtgggc tcgcagcgcg tgatgttcac cgacccctcg gcgcgggcca gcttcgacct 3990 gcgcgcccat gcgcccaccg tgccgctgct ggccaatatc ggcgcggtgc agctgaacat 4050 ggggctgggg ctgaaggaat gcctggccgc gatcgaggtg ctgcaggcgg acggcctgta 4110 tctgcacctg aaccccctgc aagaggccgt ccagcccgag ggggatcgcg actttgccga 4170 tctgggcagc aagatcgcgg ccatcgcccg cgacgttccc gtgcccgtcc tgctgaagga 4230 ggtgggctgc ggcctgtcgg cggccgatat cgccatcggg ctgcgcgccg ggatccggca 4290 tttcgacgtg gccggtcgcg gcggcacatc ctggagccgg atcgagtatc gccgccgcca 4350 gcgggccgat gacgacctgg gcctggtctt ccaggactgg ggcctgcaga ccgtggacgc 4410 cctgcgcgag gcgcggcccg cgcttgcggc ccatgatgga accagcgtgc tgatcgccag 4470 cggcggcatc cgcaacggtg tcgacatggc gaaatgcgtc atcctggggg ccgacatgtg 4530 cggggtcgcc gcgcccctgc tgaaagcggc ccaaaactcg cgcgaggcgg ttgtatccgc 4590 catccggaaa ctgcatctgg agttccggac agccatgttc ctcctgggtt gcggcacgct 4650 tgccgacctg aaggacaatt cctcgcttat ccgtcaatga aagtgcctaa gatgaccgtg 4710 acaggaatcg aagcgatcag cttctacacc ccccagaact acgtgggact ggatatcctt 4770 gccgcgcatc acgggatcga ccccgagaag ttctcgaagg ggatcgggca ggagaaaatc 4830 gcactgcccg gccatgacga ggatatcgtg accatggccg ccgaggccgc gctgccgatc 4890 atcgaacgcg cgggcacgca gggcatcgac acggttctgt tcgccaccga gagcgggatc 4950 gaccagtcga aggccgccgc catctatctg cgccgcctgc tggacctgtc gcccaactgc 5010 cgttgcgtcg agctgaagca ggcctgctat tccgcgacgg cggcgctgca gatggcctgc 5070 gcgcatgtcg cccgcaagcc cgaccgcaag gtgctggtga tcgcgtccga tgtcgcgcgc 5130 tatgaccgcg aaagctcggg cgaggcgacg cagggtgcgg gcgccgtcgc catccttgtc 5190 agcgccgatc ccaaggtggc cgagatcggc accgtctcgg ggctgttcac cgaggatatc 5250 atggatttct ggcggccgaa ccaccgccgc acgcccctgt tcgacggcaa ggcatcgacg 5310 ctgcgctatc tgaacgcgct ggtcgaggcg tggaacgact atcgcgcgaa tggcggccac 5370 gagttcgccg atttcgcgca tttctgctat cacgtgccgt tctcgcggat gggcgagaag 5430 gcgaacagcc acctggccaa ggcgaacaag acgccggtgg acatggggca ggtgcagacg 5490 ggcctgatct acaaccggca ggtcgggaac tgctataccg ggtcgatcta cctggcattc 5550 gcctcgctgc tggagaacgc tcaggaggac ctgaccggcg cgctggtcgg tctgttcagc 5610 tatggctcgg gtgcgacggg cgaattcttc gatgcgcgga tcgcgcccgg ttaccgcgac 5670 cacctgttcg cggaacgcca tcgcgaattg ctgcaggatc gcacgcccgt cacatatgac 5730 gaatacgttg ccctgtggga cgagatcgac ctgacgcagg gcgcgcccga caaggcgcgc 5790 ggtcgtttca ggctggcagg tatcgaggac gagaagcgca tctatgtcga ccggcaggcc 5850 tgaagcaggc gcccatgccc cgggcaagct gatcctgtcc ggggaacatt ccgtgctcta 5910 tggtgcgccc gcgcttgcca tggccatcgc ccgctatacc gaggtgtggt tcacgccgct 5970 tggcattggc gaggggatac gcacgacatt cgccaatctc tcgggcgggg cgacctattc 6030 gctgaagctg ctgtcggggt tcaagtcgcg gctggaccgc cggttcgagc agttcctgaa 6090 cggcgaccta aaggtgcaca aggtcctgac ccatcccgac gatctggcgg tctatgcgct 6150 ggcgtcgctt ctgcacgaca agccgccggg gaccgccgcg atgccgggca tcggcgcgat 6210 gcaccacctg ccgcgaccgg gtgagctggg cagccggacg gagctgccca tcggcgcggg 6270 catggggtcg tctgcggcca tcgtcgcggc caccacggtc ctgttcgaga cgctgctgga 6330 ccggcccaag acgcccgaac agcgcttcga ccgcgtccgc ttctgcgagc ggttgaagca 6390 cggcaaggcc ggtcccatcg acgcggccag cgtcgtgcgc ggcgggcttg tccgcgtggg 6450 cgggaacggg ccgggttcga tcagcagctt cgatttgccc gaggatcacg accttgtcgc 6510 gggacgcggc tggtactggg tactgcacgg gcgccccgtc agcgggaccg gcgaatgcgt 6570 cagcgcggtc gcggcggcgc atggtcgcga tgcggcgctg tgggacgcct tcgcagtctg 6630 cacccgcgcg ttggaggccg cgctgctgtc tgggggcagc cccgacgccg ccatcaccga 6690 gaaccagcgc ctgctggaac gcatcggcgt cgtgccggca gcgacgcagg ccctcgtggc 6750 ccagatcgag gaggcgggtg gcgcggccaa gatctgcggc gcaggttccg tgcggggcga 6810 tcacggcggg gcggtcctcg tgcggattga cgacgcgcag gcgatggctt cggtcatggc 6870 gcgccatccc gacctcgact gggcgcccct gcgcatgtcg cgcacggggg cggcacccgg 6930 ccccgcgccg cgtgcgcaac cgctgccggg gcagggctga tggatcaggt catccgcgcc 6990 agcgcgccgg gttcggtcat gatcacgggc gaacatgccg tggtctatgg acaccgcgcc 7050 atcgtcgccg ggatcgagca gcgcgcccat gtgacgatcg tcccgcgtgc cgaccgcatg 7110 tttcgcatca cctcgcagat cggggcgccg cagcaggggt cgctggacga tctgcctgcg 7170 ggcgggacct atcgcttcgt gctggccgcc atcgcgcgac acgcgccgga cctgccttgc 7230 gggttcgaca tggacatcac ctcggggatc gatccgaggc tcgggcttgg atcctcggcg 7290 gcggtgacgg tcgcctgcct cggcgcgctg tcgcggctgg cggggcgggg gaccgagggg 7350 ctgcatgacg acgcgctgcg catcgtccgc gccatccagg gcaggggcag cggggccgat 7410 ctggcggcca gcctgcatgg cggcttcgtc gcctatcgcg cgcccgatgg cggtgccgcg 7470 cagatcgagg cgcttccggt gccgccgggg ccgttcggcc tgcgctatgc gggctacaag 7530 accccgacag ccgaggtgct gcgccttgtg gccgatcgga tggcgggcaa cgaggccgct 7590 ttcgacgcgc tctactcccg gatgggcgca agcgcagatg ccgcgatccg cgcggcgcaa 7650 gggctggact gggctgcatt ccacgacgcg ctgaacgaat accagcgcct gatggagcag 7710 ctgggcgtgt ccgacgacac gctggacgcg atcatccgcg aggcgcgcga cgcgggcgcc 7770 gcagtcgcca agatctccgg ctcggggctg ggggattgcg tgctggcact gggcgaccag 7830 cccaagggtt tcgtgcccgc aagcattgcc gagaagggac ttgttttcga tgactgatgc 7890 cgtccgcgac atgatcgccc gtgccatggc gggcgcgacc gacatccgag cagccgaggc 7950 ttatgcgccc agcaacatcg cgctgtcgaa atactggggc aagcgcgacg ccgcgcggaa 8010 ccttccgctg aacagctccg tctcgatctc gttggcgaac tggggctctc atacgcgggt 8070 cgaggggtcc ggcacgggcc acgacgaggt gcatcacaac ggcacgctgc tggatccggg 8130 cgacgccttc gcgcgccgcg cgttggcatt cgctgacctg ttccgggggg ggaggcacct 8190 gccgctgcgg atcacgacgc agaactcgat cccgacggcg gcggggcttg cctcgtcggc 8250 ctcggggttc gcggcgctga cccgtgcgct ggcgggggcg ttcgggctgg atctggacga 8310 cacggatctg agccgcatcg cccggatcgg cagtggcagc gccgcccgct cgatctggca 8370 cggcttcgtc cgctggaacc ggggcgaggc cgaggatggg catgacagcc acggcgtccc 8430 gctggacctg cgctggcccg gcttccgcat cgcgatcgtg gccgtggaca aggggcccaa 8490 gcctttcagt tcgcgcgacg gcatgaacca cacggtcgag accagcccgc tgttcccgcc 8550 ctggcctgcg caggcggaag cggattgccg cgtcatcgag gatgcgatcg ccgcccgcga 8610 catggccgcc ctgggtccgc gggtcgaggc gaacgccctt gcgatgcacg ccacgatgat 8670 ggccgcgcgc ccgccgctct gctacctgac gggcggcagc tggcaggtgc tggaacgcct 8730 gtggcaggcc cgcgcggacg ggcttgcggc ctttgcgacg atggatgccg gcccgaacgt 8790 caagctgatc ttcgaggaaa gcagcgccgc cgacgtgctg tacctgttcc ccgacgccag 8850 cctgatcgcg ccgttcgagg ggcgttgaac gcgtaagacg accactgggt aaggttctgc 8910 cgcgcgtggt ctcgactgcc tgcaaagagg tgcttgagtt gctgcgtgac tgcggcggcc 8970 gacttcgtgg gacttgcccg ccacgctgac gcgctggaaa cgcgcccgcg gattacgacc 9030 gcgtcattgc cctgaaccaa tttcccgtcg gtcgac 9066 <210> 43 <211> 340 <212> PRT <213> Paracoccus sp. <400> 43 Met Ile Ser His Thr Pro Val Pro Thr Gln Trp Val Gly Pro Ile Leu 1 5 10 15 Phe Arg Gly Pro Val Val Glu Gly Pro Ile Ser Ala Pro Leu Ala Thr 20 25 30 Tyr Glu Thr Pro Leu Trp Pro Ser Thr Ala Arg Gly Ala Gly Val Ser 35 40 45 Arg His Ser Gly Gly Ile Gln Val Ser Leu Val Asp Glu Arg Met Ser 50 55 60 Arg Ser Ile Ala Leu Arg Ala His Asp Gly Ala Ala Ala Thr Ala Ala 65 70 75 80 Trp Gln Ser Ile Lys Ala Arg Gln Glu Glu Val Ala Ala Val Val Ala 85 90 95 Thr Thr Ser Arg Phe Ala Arg Leu Val Glu Leu Asn Arg Gln Ile Val 100 105 110 Gly Asn Leu Leu Tyr Ile Arg Ile Glu Cys Val Thr Gly Asp Ala Ser 115 120 125 Gly His Asn Met Val Thr Lys Ala Ala Glu Ala Val Gln Gly Trp Ile 130 135 140 Leu Ser Glu Tyr Pro Met Leu Ala Tyr Ser Thr Ile Ser Gly Asn Leu 145 150 155 160 Cys Thr Asp Lys Lys Ala Ser Ala Val Asn Gly Ile Leu Gly Arg Gly 165 170 175 Lys Tyr Ala Val Ala Glu Val Glu Ile Pro Arg Lys Ile Leu Thr Arg 180 185 190 Val Leu Arg Thr Ser Ala Glu Lys Met Val Arg Leu Asn Tyr Glu Lys 195 200 205 Asn Tyr Val Gly Gly Thr Leu Ala Gly Ser Leu Arg Ser Ala Asn Ala 210 215 220 His Phe Ala Asn Met Leu Leu Gly Phe Tyr Leu Ala Thr Gly Gln Asp 225 230 235 240 Ala Ala Asn Ile Ile Glu Ala Ser Gln Gly Phe Val His Cys Glu Ala 245 250 255 Arg Gly Glu Asp Leu Tyr Phe Ser Cys Thr Leu Pro Asn Leu Ile Met 260 265 270 Gly Ser Val Gly Ala Gly Lys Gly Ile Pro Ser Ile Glu Glu Asn Leu 275 280 285 Ser Arg Met Gly Cys Arg Gln Pro Gly Glu Pro Gly Asp Asn Ala Arg 290 295 300 Arg Leu Ala Ala Ile Cys Ala Gly Val Val Leu Cys Gly Glu Leu Ser 305 310 315 320 Leu Leu Ala Ala Gln Thr Asn Pro Gly Glu Leu Val Arg Thr His Met 325 330 335 Glu Met Glu Arg 340 <210> 44 <211> 9066 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (3641)..(4687) <400> 44 ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60 cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120 cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180 acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240 tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300 cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360 tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420 tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480 attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540 atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600 cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660 atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720 gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780 tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840 cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900 tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960 catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020 tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080 cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140 gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200 gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260 ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320 gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380 atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440 gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500 atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560 catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620 cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680 tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740 gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800 gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860 ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920 acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980 acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040 cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100 tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160 ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220 acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280 gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340 ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400 acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460 tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520 gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580 tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640 tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700 gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760 tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820 tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880 gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940 tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000 cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060 aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120 cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180 gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240 agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300 ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360 ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420 tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480 acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540 cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600 accccggaga gttggtccgc acccacatgg agatggagcg atg acc gac agc aag 3655 Met Thr Asp Ser Lys 1 5 gat cac cat gtc gcg ggg cgc aag ctg gac cat ctg cgt gca ttg gac 3703 Asp His His Val Ala Gly Arg Lys Leu Asp His Leu Arg Ala Leu Asp 10 15 20 gac gat gcg gat atc gac cgg ggc gac agc ggc ttc gac cgc atc gcg 3751 Asp Asp Ala Asp Ile Asp Arg Gly Asp Ser Gly Phe Asp Arg Ile Ala 25 30 35 ctg acc cat cgc gcc ctg ccc gag gtg gat ttc gac gcc atc gac acg 3799 Leu Thr His Arg Ala Leu Pro Glu Val Asp Phe Asp Ala Ile Asp Thr 40 45 50 gcg acc agc ttc ctg ggc cgt gaa ctg tcc ttc ccg ctg ctg atc tcg 3847 Ala Thr Ser Phe Leu Gly Arg Glu Leu Ser Phe Pro Leu Leu Ile Ser 55 60 65 tcc atg acc ggc ggc acc ggc gag gag atc gag cgc atc aac cgc aac 3895 Ser Met Thr Gly Gly Thr Gly Glu Glu Ile Glu Arg Ile Asn Arg Asn 70 75 80 85 ctg gcc gct ggt gcc gag gag gcc cgc gtc gcc atg gcg gtg ggc tcg 3943 Leu Ala Ala Gly Ala Glu Glu Ala Arg Val Ala Met Ala Val Gly Ser 90 95 100 cag cgc gtg atg ttc acc gac ccc tcg gcg cgg gcc agc ttc gac ctg 3991 Gln Arg Val Met Phe Thr Asp Pro Ser Ala Arg Ala Ser Phe Asp Leu 105 110 115 cgc gcc cat gcg ccc acc gtg ccg ctg ctg gcc aat atc ggc gcg gtg 4039 Arg Ala His Ala Pro Thr Val Pro Leu Leu Ala Asn Ile Gly Ala Val 120 125 130 cag ctg aac atg ggg ctg ggg ctg aag gaa tgc ctg gcc gcg atc gag 4087 Gln Leu Asn Met Gly Leu Gly Leu Lys Glu Cys Leu Ala Ala Ile Glu 135 140 145 gtg ctg cag gcg gac ggc ctg tat ctg cac ctg aac ccc ctg caa gag 4135 Val Leu Gln Ala Asp Gly Leu Tyr Leu His Leu Asn Pro Leu Gln Glu 150 155 160 165 gcc gtc cag ccc gag ggg gat cgc gac ttt gcc gat ctg ggc agc aag 4183 Ala Val Gln Pro Glu Gly Asp Arg Asp Phe Ala Asp Leu Gly Ser Lys 170 175 180 atc gcg gcc atc gcc cgc gac gtt ccc gtg ccc gtc ctg ctg aag gag 4231 Ile Ala Ala Ile Ala Arg Asp Val Pro Val Pro Val Leu Leu Lys Glu 185 190 195 gtg ggc tgc ggc ctg tcg gcg gcc gat atc gcc atc ggg ctg cgc gcc 4279 Val Gly Cys Gly Leu Ser Ala Ala Asp Ile Ala Ile Gly Leu Arg Ala 200 205 210 ggg atc cgg cat ttc gac gtg gcc ggt cgc ggc ggc aca tcc tgg agc 4327 Gly Ile Arg His Phe Asp Val Ala Gly Arg Gly Gly Thr Ser Trp Ser 215 220 225 cgg atc gag tat cgc cgc cgc cag cgg gcc gat gac gac ctg ggc ctg 4375 Arg Ile Glu Tyr Arg Arg Arg Gln Arg Ala Asp Asp Asp Leu Gly Leu 230 235 240 245 gtc ttc cag gac tgg ggc ctg cag acc gtg gac gcc ctg cgc gag gcg 4423 Val Phe Gln Asp Trp Gly Leu Gln Thr Val Asp Ala Leu Arg Glu Ala 250 255 260 cgg ccc gcg ctt gcg gcc cat gat gga acc agc gtg ctg atc gcc agc 4471 Arg Pro Ala Leu Ala Ala His Asp Gly Thr Ser Val Leu Ile Ala Ser 265 270 275 ggc ggc atc cgc aac ggt gtc gac atg gcg aaa tgc gtc atc ctg ggg 4519 Gly Gly Ile Arg Asn Gly Val Asp Met Ala Lys Cys Val Ile Leu Gly 280 285 290 gcc gac atg tgc ggg gtc gcc gcg ccc ctg ctg aaa gcg gcc caa aac 4567 Ala Asp Met Cys Gly Val Ala Ala Pro Leu Leu Lys Ala Ala Gln Asn 295 300 305 tcg cgc gag gcg gtt gta tcc gcc atc cgg aaa ctg cat ctg gag ttc 4615 Ser Arg Glu Ala Val Val Ser Ala Ile Arg Lys Leu His Leu Glu Phe 310 315 320 325 cgg aca gcc atg ttc ctc ctg ggt tgc ggc acg ctt gcc gac ctg aag 4663 Arg Thr Ala Met Phe Leu Leu Gly Cys Gly Thr Leu Ala Asp Leu Lys 330 335 340 gac aat tcc tcg ctt atc cgt caa tga aagtgcctaa gatgaccgtg 4710 Asp Asn Ser Ser Leu Ile Arg Gln 345 acaggaatcg aagcgatcag cttctacacc ccccagaact acgtgggact ggatatcctt 4770 gccgcgcatc acgggatcga ccccgagaag ttctcgaagg ggatcgggca ggagaaaatc 4830 gcactgcccg gccatgacga ggatatcgtg accatggccg ccgaggccgc gctgccgatc 4890 atcgaacgcg cgggcacgca gggcatcgac acggttctgt tcgccaccga gagcgggatc 4950 gaccagtcga aggccgccgc catctatctg cgccgcctgc tggacctgtc gcccaactgc 5010 cgttgcgtcg agctgaagca ggcctgctat tccgcgacgg cggcgctgca gatggcctgc 5070 gcgcatgtcg cccgcaagcc cgaccgcaag gtgctggtga tcgcgtccga tgtcgcgcgc 5130 tatgaccgcg aaagctcggg cgaggcgacg cagggtgcgg gcgccgtcgc catccttgtc 5190 agcgccgatc ccaaggtggc cgagatcggc accgtctcgg ggctgttcac cgaggatatc 5250 atggatttct ggcggccgaa ccaccgccgc acgcccctgt tcgacggcaa ggcatcgacg 5310 ctgcgctatc tgaacgcgct ggtcgaggcg tggaacgact atcgcgcgaa tggcggccac 5370 gagttcgccg atttcgcgca tttctgctat cacgtgccgt tctcgcggat gggcgagaag 5430 gcgaacagcc acctggccaa ggcgaacaag acgccggtgg acatggggca ggtgcagacg 5490 ggcctgatct acaaccggca ggtcgggaac tgctataccg ggtcgatcta cctggcattc 5550 gcctcgctgc tggagaacgc tcaggaggac ctgaccggcg cgctggtcgg tctgttcagc 5610 tatggctcgg gtgcgacggg cgaattcttc gatgcgcgga tcgcgcccgg ttaccgcgac 5670 cacctgttcg cggaacgcca tcgcgaattg ctgcaggatc gcacgcccgt cacatatgac 5730 gaatacgttg ccctgtggga cgagatcgac ctgacgcagg gcgcgcccga caaggcgcgc 5790 ggtcgtttca ggctggcagg tatcgaggac gagaagcgca tctatgtcga ccggcaggcc 5850 tgaagcaggc gcccatgccc cgggcaagct gatcctgtcc ggggaacatt ccgtgctcta 5910 tggtgcgccc gcgcttgcca tggccatcgc ccgctatacc gaggtgtggt tcacgccgct 5970 tggcattggc gaggggatac gcacgacatt cgccaatctc tcgggcgggg cgacctattc 6030 gctgaagctg ctgtcggggt tcaagtcgcg gctggaccgc cggttcgagc agttcctgaa 6090 cggcgaccta aaggtgcaca aggtcctgac ccatcccgac gatctggcgg tctatgcgct 6150 ggcgtcgctt ctgcacgaca agccgccggg gaccgccgcg atgccgggca tcggcgcgat 6210 gcaccacctg ccgcgaccgg gtgagctggg cagccggacg gagctgccca tcggcgcggg 6270 catggggtcg tctgcggcca tcgtcgcggc caccacggtc ctgttcgaga cgctgctgga 6330 ccggcccaag acgcccgaac agcgcttcga ccgcgtccgc ttctgcgagc ggttgaagca 6390 cggcaaggcc ggtcccatcg acgcggccag cgtcgtgcgc ggcgggcttg tccgcgtggg 6450 cgggaacggg ccgggttcga tcagcagctt cgatttgccc gaggatcacg accttgtcgc 6510 gggacgcggc tggtactggg tactgcacgg gcgccccgtc agcgggaccg gcgaatgcgt 6570 cagcgcggtc gcggcggcgc atggtcgcga tgcggcgctg tgggacgcct tcgcagtctg 6630 cacccgcgcg ttggaggccg cgctgctgtc tgggggcagc cccgacgccg ccatcaccga 6690 gaaccagcgc ctgctggaac gcatcggcgt cgtgccggca gcgacgcagg ccctcgtggc 6750 ccagatcgag gaggcgggtg gcgcggccaa gatctgcggc gcaggttccg tgcggggcga 6810 tcacggcggg gcggtcctcg tgcggattga cgacgcgcag gcgatggctt cggtcatggc 6870 gcgccatccc gacctcgact gggcgcccct gcgcatgtcg cgcacggggg cggcacccgg 6930 ccccgcgccg cgtgcgcaac cgctgccggg gcagggctga tggatcaggt catccgcgcc 6990 agcgcgccgg gttcggtcat gatcacgggc gaacatgccg tggtctatgg acaccgcgcc 7050 atcgtcgccg ggatcgagca gcgcgcccat gtgacgatcg tcccgcgtgc cgaccgcatg 7110 tttcgcatca cctcgcagat cggggcgccg cagcaggggt cgctggacga tctgcctgcg 7170 ggcgggacct atcgcttcgt gctggccgcc atcgcgcgac acgcgccgga cctgccttgc 7230 gggttcgaca tggacatcac ctcggggatc gatccgaggc tcgggcttgg atcctcggcg 7290 gcggtgacgg tcgcctgcct cggcgcgctg tcgcggctgg cggggcgggg gaccgagggg 7350 ctgcatgacg acgcgctgcg catcgtccgc gccatccagg gcaggggcag cggggccgat 7410 ctggcggcca gcctgcatgg cggcttcgtc gcctatcgcg cgcccgatgg cggtgccgcg 7470 cagatcgagg cgcttccggt gccgccgggg ccgttcggcc tgcgctatgc gggctacaag 7530 accccgacag ccgaggtgct gcgccttgtg gccgatcgga tggcgggcaa cgaggccgct 7590 ttcgacgcgc tctactcccg gatgggcgca agcgcagatg ccgcgatccg cgcggcgcaa 7650 gggctggact gggctgcatt ccacgacgcg ctgaacgaat accagcgcct gatggagcag 7710 ctgggcgtgt ccgacgacac gctggacgcg atcatccgcg aggcgcgcga cgcgggcgcc 7770 gcagtcgcca agatctccgg ctcggggctg ggggattgcg tgctggcact gggcgaccag 7830 cccaagggtt tcgtgcccgc aagcattgcc gagaagggac ttgttttcga tgactgatgc 7890 cgtccgcgac atgatcgccc gtgccatggc gggcgcgacc gacatccgag cagccgaggc 7950 ttatgcgccc agcaacatcg cgctgtcgaa atactggggc aagcgcgacg ccgcgcggaa 8010 ccttccgctg aacagctccg tctcgatctc gttggcgaac tggggctctc atacgcgggt 8070 cgaggggtcc ggcacgggcc acgacgaggt gcatcacaac ggcacgctgc tggatccggg 8130 cgacgccttc gcgcgccgcg cgttggcatt cgctgacctg ttccgggggg ggaggcacct 8190 gccgctgcgg atcacgacgc agaactcgat cccgacggcg gcggggcttg cctcgtcggc 8250 ctcggggttc gcggcgctga cccgtgcgct ggcgggggcg ttcgggctgg atctggacga 8310 cacggatctg agccgcatcg cccggatcgg cagtggcagc gccgcccgct cgatctggca 8370 cggcttcgtc cgctggaacc ggggcgaggc cgaggatggg catgacagcc acggcgtccc 8430 gctggacctg cgctggcccg gcttccgcat cgcgatcgtg gccgtggaca aggggcccaa 8490 gcctttcagt tcgcgcgacg gcatgaacca cacggtcgag accagcccgc tgttcccgcc 8550 ctggcctgcg caggcggaag cggattgccg cgtcatcgag gatgcgatcg ccgcccgcga 8610 catggccgcc ctgggtccgc gggtcgaggc gaacgccctt gcgatgcacg ccacgatgat 8670 ggccgcgcgc ccgccgctct gctacctgac gggcggcagc tggcaggtgc tggaacgcct 8730 gtggcaggcc cgcgcggacg ggcttgcggc ctttgcgacg atggatgccg gcccgaacgt 8790 caagctgatc ttcgaggaaa gcagcgccgc cgacgtgctg tacctgttcc ccgacgccag 8850 cctgatcgcg ccgttcgagg ggcgttgaac gcgtaagacg accactgggt aaggttctgc 8910 cgcgcgtggt ctcgactgcc tgcaaagagg tgcttgagtt gctgcgtgac tgcggcggcc 8970 gacttcgtgg gacttgcccg ccacgctgac gcgctggaaa cgcgcccgcg gattacgacc 9030 gcgtcattgc cctgaaccaa tttcccgtcg gtcgac 9066 <210> 45 <211> 349 <212> PRT <213> Paracoccus sp. <400> 45 Met Thr Asp Ser Lys Asp His His Val Ala Gly Arg Lys Leu Asp His 1 5 10 15 Leu Arg Ala Leu Asp Asp Asp Ala Asp Ile Asp Arg Gly Asp Ser Gly 20 25 30 Phe Asp Arg Ile Ala Leu Thr His Arg Ala Leu Pro Glu Val Asp Phe 35 40 45 Asp Ala Ile Asp Thr Ala Thr Ser Phe Leu Gly Arg Glu Leu Ser Phe 50 55 60 Pro Leu Leu Ile Ser Ser Met Thr Gly Gly Thr Gly Glu Glu Ile Glu 65 70 75 80 Arg Ile Asn Arg Asn Leu Ala Ala Gly Ala Glu Glu Ala Arg Val Ala 85 90 95 Met Ala Val Gly Ser Gln Arg Val Met Phe Thr Asp Pro Ser Ala Arg 100 105 110 Ala Ser Phe Asp Leu Arg Ala His Ala Pro Thr Val Pro Leu Leu Ala 115 120 125 Asn Ile Gly Ala Val Gln Leu Asn Met Gly Leu Gly Leu Lys Glu Cys 130 135 140 Leu Ala Ala Ile Glu Val Leu Gln Ala Asp Gly Leu Tyr Leu His Leu 145 150 155 160 Asn Pro Leu Gln Glu Ala Val Gln Pro Glu Gly Asp Arg Asp Phe Ala 165 170 175 Asp Leu Gly Ser Lys Ile Ala Ala Ile Ala Arg Asp Val Pro Val Pro 180 185 190 Val Leu Leu Lys Glu Val Gly Cys Gly Leu Ser Ala Ala Asp Ile Ala 195 200 205 Ile Gly Leu Arg Ala Gly Ile Arg His Phe Asp Val Ala Gly Arg Gly 210 215 220 Gly Thr Ser Trp Ser Arg Ile Glu Tyr Arg Arg Arg Gln Arg Ala Asp 225 230 235 240 Asp Asp Leu Gly Leu Val Phe Gln Asp Trp Gly Leu Gln Thr Val Asp 245 250 255 Ala Leu Arg Glu Ala Arg Pro Ala Leu Ala Ala His Asp Gly Thr Ser 260 265 270 Val Leu Ile Ala Ser Gly Gly Ile Arg Asn Gly Val Asp Met Ala Lys 275 280 285 Cys Val Ile Leu Gly Ala Asp Met Cys Gly Val Ala Ala Pro Leu Leu 290 295 300 Lys Ala Ala Gln Asn Ser Arg Glu Ala Val Val Ser Ala Ile Arg Lys 305 310 315 320 Leu His Leu Glu Phe Arg Thr Ala Met Phe Leu Leu Gly Cys Gly Thr 325 330 335 Leu Ala Asp Leu Lys Asp Asn Ser Ser Leu Ile Arg Gln 340 345 <210> 46 <211> 9066 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (4687)..(5850) <400> 46 ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60 cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120 cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180 acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240 tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300 cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360 tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420 tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480 attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540 atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600 cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660 atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720 gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780 tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840 cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900 tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960 catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020 tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080 cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140 gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200 gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260 ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320 gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380 atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440 gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500 atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560 catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620 cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680 tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740 gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800 gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860 ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920 acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980 acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040 cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100 tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160 ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220 acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280 gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340 ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400 acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460 tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520 gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580 tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640 tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700 gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760 tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820 tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880 gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940 tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000 cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060 aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120 cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180 gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240 agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300 ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360 ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420 tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480 acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540 cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600 accccggaga gttggtccgc acccacatgg agatggagcg atgaccgaca gcaaggatca 3660 ccatgtcgcg gggcgcaagc tggaccatct gcgtgcattg gacgacgatg cggatatcga 3720 ccggggcgac agcggcttcg accgcatcgc gctgacccat cgcgccctgc ccgaggtgga 3780 tttcgacgcc atcgacacgg cgaccagctt cctgggccgt gaactgtcct tcccgctgct 3840 gatctcgtcc atgaccggcg gcaccggcga ggagatcgag cgcatcaacc gcaacctggc 3900 cgctggtgcc gaggaggccc gcgtcgccat ggcggtgggc tcgcagcgcg tgatgttcac 3960 cgacccctcg gcgcgggcca gcttcgacct gcgcgcccat gcgcccaccg tgccgctgct 4020 ggccaatatc ggcgcggtgc agctgaacat ggggctgggg ctgaaggaat gcctggccgc 4080 gatcgaggtg ctgcaggcgg acggcctgta tctgcacctg aaccccctgc aagaggccgt 4140 ccagcccgag ggggatcgcg actttgccga tctgggcagc aagatcgcgg ccatcgcccg 4200 cgacgttccc gtgcccgtcc tgctgaagga ggtgggctgc ggcctgtcgg cggccgatat 4260 cgccatcggg ctgcgcgccg ggatccggca tttcgacgtg gccggtcgcg gcggcacatc 4320 ctggagccgg atcgagtatc gccgccgcca gcgggccgat gacgacctgg gcctggtctt 4380 ccaggactgg ggcctgcaga ccgtggacgc cctgcgcgag gcgcggcccg cgcttgcggc 4440 ccatgatgga accagcgtgc tgatcgccag cggcggcatc cgcaacggtg tcgacatggc 4500 gaaatgcgtc atcctggggg ccgacatgtg cggggtcgcc gcgcccctgc tgaaagcggc 4560 ccaaaactcg cgcgaggcgg ttgtatccgc catccggaaa ctgcatctgg agttccggac 4620 agccatgttc ctcctgggtt gcggcacgct tgccgacctg aaggacaatt cctcgcttat 4680 ccgtca atg aaa gtg cct aag atg acc gtg aca gga atc gaa gcg atc 4728 Met Lys Val Pro Lys Met Thr Val Thr Gly Ile Glu Ala Ile 1 5 10 agc ttc tac acc ccc cag aac tac gtg gga ctg gat atc ctt gcc gcg 4776 Ser Phe Tyr Thr Pro Gln Asn Tyr Val Gly Leu Asp Ile Leu Ala Ala 15 20 25 30 cat cac ggg atc gac ccc gag aag ttc tcg aag ggg atc ggg cag gag 4824 His His Gly Ile Asp Pro Glu Lys Phe Ser Lys Gly Ile Gly Gln Glu 35 40 45 aaa atc gca ctg ccc ggc cat gac gag gat atc gtg acc atg gcc gcc 4872 Lys Ile Ala Leu Pro Gly His Asp Glu Asp Ile Val Thr Met Ala Ala 50 55 60 gag gcc gcg ctg ccg atc atc gaa cgc gcg ggc acg cag ggc atc gac 4920 Glu Ala Ala Leu Pro Ile Ile Glu Arg Ala Gly Thr Gln Gly Ile Asp 65 70 75 acg gtt ctg ttc gcc acc gag agc ggg atc gac cag tcg aag gcc gcc 4968 Thr Val Leu Phe Ala Thr Glu Ser Gly Ile Asp Gln Ser Lys Ala Ala 80 85 90 gcc atc tat ctg cgc cgc ctg ctg gac ctg tcg ccc aac tgc cgt tgc 5016 Ala Ile Tyr Leu Arg Arg Leu Leu Asp Leu Ser Pro Asn Cys Arg Cys 95 100 105 110 gtc gag ctg aag cag gcc tgc tat tcc gcg acg gcg gcg ctg cag atg 5064 Val Glu Leu Lys Gln Ala Cys Tyr Ser Ala Thr Ala Ala Leu Gln Met 115 120 125 gcc tgc gcg cat gtc gcc cgc aag ccc gac cgc aag gtg ctg gtg atc 5112 Ala Cys Ala His Val Ala Arg Lys Pro Asp Arg Lys Val Leu Val Ile 130 135 140 gcg tcc gat gtc gcg cgc tat gac cgc gaa agc tcg ggc gag gcg acg 5160 Ala Ser Asp Val Ala Arg Tyr Asp Arg Glu Ser Ser Gly Glu Ala Thr 145 150 155 cag ggt gcg ggc gcc gtc gcc atc ctt gtc agc gcc gat ccc aag gtg 5208 Gln Gly Ala Gly Ala Val Ala Ile Leu Val Ser Ala Asp Pro Lys Val 160 165 170 gcc gag atc ggc acc gtc tcg ggg ctg ttc acc gag gat atc atg gat 5256 Ala Glu Ile Gly Thr Val Ser Gly Leu Phe Thr Glu Asp Ile Met Asp 175 180 185 190 ttc tgg cgg ccg aac cac cgc cgc acg ccc ctg ttc gac ggc aag gca 5304 Phe Trp Arg Pro Asn His Arg Arg Thr Pro Leu Phe Asp Gly Lys Ala 195 200 205 tcg acg ctg cgc tat ctg aac gcg ctg gtc gag gcg tgg aac gac tat 5352 Ser Thr Leu Arg Tyr Leu Asn Ala Leu Val Glu Ala Trp Asn Asp Tyr 210 215 220 cgc gcg aat ggc ggc cac gag ttc gcc gat ttc gcg cat ttc tgc tat 5400 Arg Ala Asn Gly Gly His Glu Phe Ala Asp Phe Ala His Phe Cys Tyr 225 230 235 cac gtg ccg ttc tcg cgg atg ggc gag aag gcg aac agc cac ctg gcc 5448 His Val Pro Phe Ser Arg Met Gly Glu Lys Ala Asn Ser His Leu Ala 240 245 250 aag gcg aac aag acg ccg gtg gac atg ggg cag gtg cag acg ggc ctg 5496 Lys Ala Asn Lys Thr Pro Val Asp Met Gly Gln Val Gln Thr Gly Leu 255 260 265 270 atc tac aac cgg cag gtc ggg aac tgc tat acc ggg tcg atc tac ctg 5544 Ile Tyr Asn Arg Gln Val Gly Asn Cys Tyr Thr Gly Ser Ile Tyr Leu 275 280 285 gca ttc gcc tcg ctg ctg gag aac gct cag gag gac ctg acc ggc gcg 5592 Ala Phe Ala Ser Leu Leu Glu Asn Ala Gln Glu Asp Leu Thr Gly Ala 290 295 300 ctg gtc ggt ctg ttc agc tat ggc tcg ggt gcg acg ggc gaa ttc ttc 5640 Leu Val Gly Leu Phe Ser Tyr Gly Ser Gly Ala Thr Gly Glu Phe Phe 305 310 315 gat gcg cgg atc gcg ccc ggt tac cgc gac cac ctg ttc gcg gaa cgc 5688 Asp Ala Arg Ile Ala Pro Gly Tyr Arg Asp His Leu Phe Ala Glu Arg 320 325 330 cat cgc gaa ttg ctg cag gat cgc acg ccc gtc aca tat gac gaa tac 5736 His Arg Glu Leu Leu Gln Asp Arg Thr Pro Val Thr Tyr Asp Glu Tyr 335 340 345 350 gtt gcc ctg tgg gac gag atc gac ctg acg cag ggc gcg ccc gac aag 5784 Val Ala Leu Trp Asp Glu Ile Asp Leu Thr Gln Gly Ala Pro Asp Lys 355 360 365 gcg cgc ggt cgt ttc agg ctg gca ggt atc gag gac gag aag cgc atc 5832 Ala Arg Gly Arg Phe Arg Leu Ala Gly Ile Glu Asp Glu Lys Arg Ile 370 375 380 tat gtc gac cgg cag gcc tgaagcaggc gcccatgccc cgggcaagct 5880 Tyr Val Asp Arg Gln Ala 385 gatcctgtcc ggggaacatt ccgtgctcta tggtgcgccc gcgcttgcca tggccatcgc 5940 ccgctatacc gaggtgtggt tcacgccgct tggcattggc gaggggatac gcacgacatt 6000 cgccaatctc tcgggcgggg cgacctattc gctgaagctg ctgtcggggt tcaagtcgcg 6060 gctggaccgc cggttcgagc agttcctgaa cggcgaccta aaggtgcaca aggtcctgac 6120 ccatcccgac gatctggcgg tctatgcgct ggcgtcgctt ctgcacgaca agccgccggg 6180 gaccgccgcg atgccgggca tcggcgcgat gcaccacctg ccgcgaccgg gtgagctggg 6240 cagccggacg gagctgccca tcggcgcggg catggggtcg tctgcggcca tcgtcgcggc 6300 caccacggtc ctgttcgaga cgctgctgga ccggcccaag acgcccgaac agcgcttcga 6360 ccgcgtccgc ttctgcgagc ggttgaagca cggcaaggcc ggtcccatcg acgcggccag 6420 cgtcgtgcgc ggcgggcttg tccgcgtggg cgggaacggg ccgggttcga tcagcagctt 6480 cgatttgccc gaggatcacg accttgtcgc gggacgcggc tggtactggg tactgcacgg 6540 gcgccccgtc agcgggaccg gcgaatgcgt cagcgcggtc gcggcggcgc atggtcgcga 6600 tgcggcgctg tgggacgcct tcgcagtctg cacccgcgcg ttggaggccg cgctgctgtc 6660 tgggggcagc cccgacgccg ccatcaccga gaaccagcgc ctgctggaac gcatcggcgt 6720 cgtgccggca gcgacgcagg ccctcgtggc ccagatcgag gaggcgggtg gcgcggccaa 6780 gatctgcggc gcaggttccg tgcggggcga tcacggcggg gcggtcctcg tgcggattga 6840 cgacgcgcag gcgatggctt cggtcatggc gcgccatccc gacctcgact gggcgcccct 6900 gcgcatgtcg cgcacggggg cggcacccgg ccccgcgccg cgtgcgcaac cgctgccggg 6960 gcagggctga tggatcaggt catccgcgcc agcgcgccgg gttcggtcat gatcacgggc 7020 gaacatgccg tggtctatgg acaccgcgcc atcgtcgccg ggatcgagca gcgcgcccat 7080 gtgacgatcg tcccgcgtgc cgaccgcatg tttcgcatca cctcgcagat cggggcgccg 7140 cagcaggggt cgctggacga tctgcctgcg ggcgggacct atcgcttcgt gctggccgcc 7200 atcgcgcgac acgcgccgga cctgccttgc gggttcgaca tggacatcac ctcggggatc 7260 gatccgaggc tcgggcttgg atcctcggcg gcggtgacgg tcgcctgcct cggcgcgctg 7320 tcgcggctgg cggggcgggg gaccgagggg ctgcatgacg acgcgctgcg catcgtccgc 7380 gccatccagg gcaggggcag cggggccgat ctggcggcca gcctgcatgg cggcttcgtc 7440 gcctatcgcg cgcccgatgg cggtgccgcg cagatcgagg cgcttccggt gccgccgggg 7500 ccgttcggcc tgcgctatgc gggctacaag accccgacag ccgaggtgct gcgccttgtg 7560 gccgatcgga tggcgggcaa cgaggccgct ttcgacgcgc tctactcccg gatgggcgca 7620 agcgcagatg ccgcgatccg cgcggcgcaa gggctggact gggctgcatt ccacgacgcg 7680 ctgaacgaat accagcgcct gatggagcag ctgggcgtgt ccgacgacac gctggacgcg 7740 atcatccgcg aggcgcgcga cgcgggcgcc gcagtcgcca agatctccgg ctcggggctg 7800 ggggattgcg tgctggcact gggcgaccag cccaagggtt tcgtgcccgc aagcattgcc 7860 gagaagggac ttgttttcga tgactgatgc cgtccgcgac atgatcgccc gtgccatggc 7920 gggcgcgacc gacatccgag cagccgaggc ttatgcgccc agcaacatcg cgctgtcgaa 7980 atactggggc aagcgcgacg ccgcgcggaa ccttccgctg aacagctccg tctcgatctc 8040 gttggcgaac tggggctctc atacgcgggt cgaggggtcc ggcacgggcc acgacgaggt 8100 gcatcacaac ggcacgctgc tggatccggg cgacgccttc gcgcgccgcg cgttggcatt 8160 cgctgacctg ttccgggggg ggaggcacct gccgctgcgg atcacgacgc agaactcgat 8220 cccgacggcg gcggggcttg cctcgtcggc ctcggggttc gcggcgctga cccgtgcgct 8280 ggcgggggcg ttcgggctgg atctggacga cacggatctg agccgcatcg cccggatcgg 8340 cagtggcagc gccgcccgct cgatctggca cggcttcgtc cgctggaacc ggggcgaggc 8400 cgaggatggg catgacagcc acggcgtccc gctggacctg cgctggcccg gcttccgcat 8460 cgcgatcgtg gccgtggaca aggggcccaa gcctttcagt tcgcgcgacg gcatgaacca 8520 cacggtcgag accagcccgc tgttcccgcc ctggcctgcg caggcggaag cggattgccg 8580 cgtcatcgag gatgcgatcg ccgcccgcga catggccgcc ctgggtccgc gggtcgaggc 8640 gaacgccctt gcgatgcacg ccacgatgat ggccgcgcgc ccgccgctct gctacctgac 8700 gggcggcagc tggcaggtgc tggaacgcct gtggcaggcc cgcgcggacg ggcttgcggc 8760 ctttgcgacg atggatgccg gcccgaacgt caagctgatc ttcgaggaaa gcagcgccgc 8820 cgacgtgctg tacctgttcc ccgacgccag cctgatcgcg ccgttcgagg ggcgttgaac 8880 gcgtaagacg accactgggt aaggttctgc cgcgcgtggt ctcgactgcc tgcaaagagg 8940 tgcttgagtt gctgcgtgac tgcggcggcc gacttcgtgg gacttgcccg ccacgctgac 9000 gcgctggaaa cgcgcccgcg gattacgacc gcgtcattgc cctgaaccaa tttcccgtcg 9060 gtcgac 9066 <210> 47 <211> 388 <212> PRT <213> Paracoccus sp. <400> 47 Met Lys Val Pro Lys Met Thr Val Thr Gly Ile Glu Ala Ile Ser Phe 1 5 10 15 Tyr Thr Pro Gln Asn Tyr Val Gly Leu Asp Ile Leu Ala Ala His His 20 25 30 Gly Ile Asp Pro Glu Lys Phe Ser Lys Gly Ile Gly Gln Glu Lys Ile 35 40 45 Ala Leu Pro Gly His Asp Glu Asp Ile Val Thr Met Ala Ala Glu Ala 50 55 60 Ala Leu Pro Ile Ile Glu Arg Ala Gly Thr Gln Gly Ile Asp Thr Val 65 70 75 80 Leu Phe Ala Thr Glu Ser Gly Ile Asp Gln Ser Lys Ala Ala Ala Ile 85 90 95 Tyr Leu Arg Arg Leu Leu Asp Leu Ser Pro Asn Cys Arg Cys Val Glu 100 105 110 Leu Lys Gln Ala Cys Tyr Ser Ala Thr Ala Ala Leu Gln Met Ala Cys 115 120 125 Ala His Val Ala Arg Lys Pro Asp Arg Lys Val Leu Val Ile Ala Ser 130 135 140 Asp Val Ala Arg Tyr Asp Arg Glu Ser Ser Gly Glu Ala Thr Gln Gly 145 150 155 160 Ala Gly Ala Val Ala Ile Leu Val Ser Ala Asp Pro Lys Val Ala Glu 165 170 175 Ile Gly Thr Val Ser Gly Leu Phe Thr Glu Asp Ile Met Asp Phe Trp 180 185 190 Arg Pro Asn His Arg Arg Thr Pro Leu Phe Asp Gly Lys Ala Ser Thr 195 200 205 Leu Arg Tyr Leu Asn Ala Leu Val Glu Ala Trp Asn Asp Tyr Arg Ala 210 215 220 Asn Gly Gly His Glu Phe Ala Asp Phe Ala His Phe Cys Tyr His Val 225 230 235 240 Pro Phe Ser Arg Met Gly Glu Lys Ala Asn Ser His Leu Ala Lys Ala 245 250 255 Asn Lys Thr Pro Val Asp Met Gly Gln Val Gln Thr Gly Leu Ile Tyr 260 265 270 Asn Arg Gln Val Gly Asn Cys Tyr Thr Gly Ser Ile Tyr Leu Ala Phe 275 280 285 Ala Ser Leu Leu Glu Asn Ala Gln Glu Asp Leu Thr Gly Ala Leu Val 290 295 300 Gly Leu Phe Ser Tyr Gly Ser Gly Ala Thr Gly Glu Phe Phe Asp Ala 305 310 315 320 Arg Ile Ala Pro Gly Tyr Arg Asp His Leu Phe Ala Glu Arg His Arg 325 330 335 Glu Leu Leu Gln Asp Arg Thr Pro Val Thr Tyr Asp Glu Tyr Val Ala 340 345 350 Leu Trp Asp Glu Ile Asp Leu Thr Gln Gly Ala Pro Asp Lys Ala Arg 355 360 365 Gly Arg Phe Arg Leu Ala Gly Ile Glu Asp Glu Lys Arg Ile Tyr Val 370 375 380 Asp Arg Gln Ala 385 <210> 48 <211> 9066 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (5834)..(6967) <400> 48 ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60 cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120 cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180 acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240 tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300 cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360 tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420 tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480 attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540 atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600 cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660 atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720 gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780 tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840 cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900 tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960 catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020 tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080 cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140 gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200 gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260 ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320 gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380 atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440 gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500 atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560 catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620 cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680 tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740 gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800 gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860 ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920 acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980 acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040 cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100 tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160 ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220 acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280 gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340 ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400 acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460 tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520 gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580 tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640 tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700 gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760 tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820 tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880 gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940 tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000 cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060 aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120 cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180 gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240 agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300 ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360 ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420 tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480 acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540 cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600 accccggaga gttggtccgc acccacatgg agatggagcg atgaccgaca gcaaggatca 3660 ccatgtcgcg gggcgcaagc tggaccatct gcgtgcattg gacgacgatg cggatatcga 3720 ccggggcgac agcggcttcg accgcatcgc gctgacccat cgcgccctgc ccgaggtgga 3780 tttcgacgcc atcgacacgg cgaccagctt cctgggccgt gaactgtcct tcccgctgct 3840 gatctcgtcc atgaccggcg gcaccggcga ggagatcgag cgcatcaacc gcaacctggc 3900 cgctggtgcc gaggaggccc gcgtcgccat ggcggtgggc tcgcagcgcg tgatgttcac 3960 cgacccctcg gcgcgggcca gcttcgacct gcgcgcccat gcgcccaccg tgccgctgct 4020 ggccaatatc ggcgcggtgc agctgaacat ggggctgggg ctgaaggaat gcctggccgc 4080 gatcgaggtg ctgcaggcgg acggcctgta tctgcacctg aaccccctgc aagaggccgt 4140 ccagcccgag ggggatcgcg actttgccga tctgggcagc aagatcgcgg ccatcgcccg 4200 cgacgttccc gtgcccgtcc tgctgaagga ggtgggctgc ggcctgtcgg cggccgatat 4260 cgccatcggg ctgcgcgccg ggatccggca tttcgacgtg gccggtcgcg gcggcacatc 4320 ctggagccgg atcgagtatc gccgccgcca gcgggccgat gacgacctgg gcctggtctt 4380 ccaggactgg ggcctgcaga ccgtggacgc cctgcgcgag gcgcggcccg cgcttgcggc 4440 ccatgatgga accagcgtgc tgatcgccag cggcggcatc cgcaacggtg tcgacatggc 4500 gaaatgcgtc atcctggggg ccgacatgtg cggggtcgcc gcgcccctgc tgaaagcggc 4560 ccaaaactcg cgcgaggcgg ttgtatccgc catccggaaa ctgcatctgg agttccggac 4620 agccatgttc ctcctgggtt gcggcacgct tgccgacctg aaggacaatt cctcgcttat 4680 ccgtcaatga aagtgcctaa gatgaccgtg acaggaatcg aagcgatcag cttctacacc 4740 ccccagaact acgtgggact ggatatcctt gccgcgcatc acgggatcga ccccgagaag 4800 ttctcgaagg ggatcgggca ggagaaaatc gcactgcccg gccatgacga ggatatcgtg 4860 accatggccg ccgaggccgc gctgccgatc atcgaacgcg cgggcacgca gggcatcgac 4920 acggttctgt tcgccaccga gagcgggatc gaccagtcga aggccgccgc catctatctg 4980 cgccgcctgc tggacctgtc gcccaactgc cgttgcgtcg agctgaagca ggcctgctat 5040 tccgcgacgg cggcgctgca gatggcctgc gcgcatgtcg cccgcaagcc cgaccgcaag 5100 gtgctggtga tcgcgtccga tgtcgcgcgc tatgaccgcg aaagctcggg cgaggcgacg 5160 cagggtgcgg gcgccgtcgc catccttgtc agcgccgatc ccaaggtggc cgagatcggc 5220 accgtctcgg ggctgttcac cgaggatatc atggatttct ggcggccgaa ccaccgccgc 5280 acgcccctgt tcgacggcaa ggcatcgacg ctgcgctatc tgaacgcgct ggtcgaggcg 5340 tggaacgact atcgcgcgaa tggcggccac gagttcgccg atttcgcgca tttctgctat 5400 cacgtgccgt tctcgcggat gggcgagaag gcgaacagcc acctggccaa ggcgaacaag 5460 acgccggtgg acatggggca ggtgcagacg ggcctgatct acaaccggca ggtcgggaac 5520 tgctataccg ggtcgatcta cctggcattc gcctcgctgc tggagaacgc tcaggaggac 5580 ctgaccggcg cgctggtcgg tctgttcagc tatggctcgg gtgcgacggg cgaattcttc 5640 gatgcgcgga tcgcgcccgg ttaccgcgac cacctgttcg cggaacgcca tcgcgaattg 5700 ctgcaggatc gcacgcccgt cacatatgac gaatacgttg ccctgtggga cgagatcgac 5760 ctgacgcagg gcgcgcccga caaggcgcgc ggtcgtttca ggctggcagg tatcgaggac 5820 gagaagcgca tct atg tcg acc ggc agg cct gaa gca ggc gcc cat 5866 Met Ser Thr Gly Arg Pro Glu Ala Gly Ala His 1 5 10 gcc ccg ggc aag ctg atc ctg tcc ggg gaa cat tcc gtg ctc tat ggt 5914 Ala Pro Gly Lys Leu Ile Leu Ser Gly Glu His Ser Val Leu Tyr Gly 15 20 25 gcg ccc gcg ctt gcc atg gcc atc gcc cgc tat acc gag gtg tgg ttc 5962 Ala Pro Ala Leu Ala Met Ala Ile Ala Arg Tyr Thr Glu Val Trp Phe 30 35 40 acg ccg ctt ggc att ggc gag ggg ata cgc acg aca ttc gcc aat ctc 6010 Thr Pro Leu Gly Ile Gly Glu Gly Ile Arg Thr Thr Phe Ala Asn Leu 45 50 55 tcg ggc ggg gcg acc tat tcg ctg aag ctg ctg tcg ggg ttc aag tcg 6058 Ser Gly Gly Ala Thr Tyr Ser Leu Lys Leu Leu Ser Gly Phe Lys Ser 60 65 70 75 cgg ctg gac cgc cgg ttc gag cag ttc ctg aac ggc gac cta aag gtg 6106 Arg Leu Asp Arg Arg Phe Glu Gln Phe Leu Asn Gly Asp Leu Lys Val 80 85 90 cac aag gtc ctg acc cat ccc gac gat ctg gcg gtc tat gcg ctg gcg 6154 His Lys Val Leu Thr His Pro Asp Asp Leu Ala Val Tyr Ala Leu Ala 95 100 105 tcg ctt ctg cac gac aag ccg ccg ggg acc gcc gcg atg ccg ggc atc 6202 Ser Leu Leu His Asp Lys Pro Pro Gly Thr Ala Ala Met Pro Gly Ile 110 115 120 ggc gcg atg cac cac ctg ccg cga ccg ggt gag ctg ggc agc cgg acg 6250 Gly Ala Met His His Leu Pro Arg Pro Gly Glu Leu Gly Ser Arg Thr 125 130 135 gag ctg ccc atc ggc gcg ggc atg ggg tcg tct gcg gcc atc gtc gcg 6298 Glu Leu Pro Ile Gly Ala Gly Met Gly Ser Ser Ala Ala Ile Val Ala 140 145 150 155 gcc acc acg gtc ctg ttc gag acg ctg ctg gac cgg ccc aag acg ccc 6346 Ala Thr Thr Val Leu Phe Glu Thr Leu Leu Asp Arg Pro Lys Thr Pro 160 165 170 gaa cag cgc ttc gac cgc gtc cgc ttc tgc gag cgg ttg aag cac ggc 6394 Glu Gln Arg Phe Asp Arg Val Arg Phe Cys Glu Arg Leu Lys His Gly 175 180 185 aag gcc ggt ccc atc gac gcg gcc agc gtc gtg cgc ggc ggg ctt gtc 6442 Lys Ala Gly Pro Ile Asp Ala Ala Ser Val Val Arg Gly Gly Leu Val 190 195 200 cgc gtg ggc ggg aac ggg ccg ggt tcg atc agc agc ttc gat ttg ccc 6490 Arg Val Gly Gly Asn Gly Pro Gly Ser Ile Ser Ser Phe Asp Leu Pro 205 210 215 gag gat cac gac ctt gtc gcg gga cgc ggc tgg tac tgg gta ctg cac 6538 Glu Asp His Asp Leu Val Ala Gly Arg Gly Trp Tyr Trp Val Leu His 220 225 230 235 ggg cgc ccc gtc agc ggg acc ggc gaa tgc gtc agc gcg gtc gcg gcg 6586 Gly Arg Pro Val Ser Gly Thr Gly Glu Cys Val Ser Ala Val Ala Ala 240 245 250 gcg cat ggt cgc gat gcg gcg ctg tgg gac gcc ttc gca gtc tgc acc 6634 Ala His Gly Arg Asp Ala Ala Leu Trp Asp Ala Phe Ala Val Cys Thr 255 260 265 cgc gcg ttg gag gcc gcg ctg ctg tct ggg ggc agc ccc gac gcc gcc 6682 Arg Ala Leu Glu Ala Ala Leu Leu Ser Gly Gly Ser Pro Asp Ala Ala 270 275 280 atc acc gag aac cag cgc ctg ctg gaa cgc atc ggc gtc gtg ccg gca 6730 Ile Thr Glu Asn Gln Arg Leu Leu Glu Arg Ile Gly Val Val Pro Ala 285 290 295 gcg acg cag gcc ctc gtg gcc cag atc gag gag gcg ggt ggc gcg gcc 6778 Ala Thr Gln Ala Leu Val Ala Gln Ile Glu Glu Ala Gly Gly Ala Ala 300 305 310 315 aag atc tgc ggc gca ggt tcc gtg cgg ggc gat cac ggc ggg gcg gtc 6826 Lys Ile Cys Gly Ala Gly Ser Val Arg Gly Asp His Gly Gly Ala Val 320 325 330 ctc gtg cgg att gac gac gcg cag gcg atg gct tcg gtc atg gcg cgc 6874 Leu Val Arg Ile Asp Asp Ala Gln Ala Met Ala Ser Val Met Ala Arg 335 340 345 cat ccc gac ctc gac tgg gcg ccc ctg cgc atg tcg cgc acg ggg gcg 6922 His Pro Asp Leu Asp Trp Ala Pro Leu Arg Met Ser Arg Thr Gly Ala 350 355 360 gca ccc ggc ccc gcg ccg cgt gcg caa ccg ctg ccg ggg cag ggc tga 6970 Ala Pro Gly Pro Ala Pro Arg Ala Gln Pro Leu Pro Gly Gln Gly 365 370 375 tggatcaggt catccgcgcc agcgcgccgg gttcggtcat gatcacgggc gaacatgccg 7030 tggtctatgg acaccgcgcc atcgtcgccg ggatcgagca gcgcgcccat gtgacgatcg 7090 tcccgcgtgc cgaccgcatg tttcgcatca cctcgcagat cggggcgccg cagcaggggt 7150 cgctggacga tctgcctgcg ggcgggacct atcgcttcgt gctggccgcc atcgcgcgac 7210 acgcgccgga cctgccttgc gggttcgaca tggacatcac ctcggggatc gatccgaggc 7270 tcgggcttgg atcctcggcg gcggtgacgg tcgcctgcct cggcgcgctg tcgcggctgg 7330 cggggcgggg gaccgagggg ctgcatgacg acgcgctgcg catcgtccgc gccatccagg 7390 gcaggggcag cggggccgat ctggcggcca gcctgcatgg cggcttcgtc gcctatcgcg 7450 cgcccgatgg cggtgccgcg cagatcgagg cgcttccggt gccgccgggg ccgttcggcc 7510 tgcgctatgc gggctacaag accccgacag ccgaggtgct gcgccttgtg gccgatcgga 7570 tggcgggcaa cgaggccgct ttcgacgcgc tctactcccg gatgggcgca agcgcagatg 7630 ccgcgatccg cgcggcgcaa gggctggact gggctgcatt ccacgacgcg ctgaacgaat 7690 accagcgcct gatggagcag ctgggcgtgt ccgacgacac gctggacgcg atcatccgcg 7750 aggcgcgcga cgcgggcgcc gcagtcgcca agatctccgg ctcggggctg ggggattgcg 7810 tgctggcact gggcgaccag cccaagggtt tcgtgcccgc aagcattgcc gagaagggac 7870 ttgttttcga tgactgatgc cgtccgcgac atgatcgccc gtgccatggc gggcgcgacc 7930 gacatccgag cagccgaggc ttatgcgccc agcaacatcg cgctgtcgaa atactggggc 7990 aagcgcgacg ccgcgcggaa ccttccgctg aacagctccg tctcgatctc gttggcgaac 8050 tggggctctc atacgcgggt cgaggggtcc ggcacgggcc acgacgaggt gcatcacaac 8110 ggcacgctgc tggatccggg cgacgccttc gcgcgccgcg cgttggcatt cgctgacctg 8170 ttccgggggg ggaggcacct gccgctgcgg atcacgacgc agaactcgat cccgacggcg 8230 gcggggcttg cctcgtcggc ctcggggttc gcggcgctga cccgtgcgct ggcgggggcg 8290 ttcgggctgg atctggacga cacggatctg agccgcatcg cccggatcgg cagtggcagc 8350 gccgcccgct cgatctggca cggcttcgtc cgctggaacc ggggcgaggc cgaggatggg 8410 catgacagcc acggcgtccc gctggacctg cgctggcccg gcttccgcat cgcgatcgtg 8470 gccgtggaca aggggcccaa gcctttcagt tcgcgcgacg gcatgaacca cacggtcgag 8530 accagcccgc tgttcccgcc ctggcctgcg caggcggaag cggattgccg cgtcatcgag 8590 gatgcgatcg ccgcccgcga catggccgcc ctgggtccgc gggtcgaggc gaacgccctt 8650 gcgatgcacg ccacgatgat ggccgcgcgc ccgccgctct gctacctgac gggcggcagc 8710 tggcaggtgc tggaacgcct gtggcaggcc cgcgcggacg ggcttgcggc ctttgcgacg 8770 atggatgccg gcccgaacgt caagctgatc ttcgaggaaa gcagcgccgc cgacgtgctg 8830 tacctgttcc ccgacgccag cctgatcgcg ccgttcgagg ggcgttgaac gcgtaagacg 8890 accactgggt aaggttctgc cgcgcgtggt ctcgactgcc tgcaaagagg tgcttgagtt 8950 gctgcgtgac tgcggcggcc gacttcgtgg gacttgcccg ccacgctgac gcgctggaaa 9010 cgcgcccgcg gattacgacc gcgtcattgc cctgaaccaa tttcccgtcg gtcgac 9066 <210> 49 <211> 378 <212> PRT <213> Paracoccus sp. <400> 49 Met Ser Thr Gly Arg Pro Glu Ala Gly Ala His Ala Pro Gly Lys Leu 1 5 10 15 Ile Leu Ser Gly Glu His Ser Val Leu Tyr Gly Ala Pro Ala Leu Ala 20 25 30 Met Ala Ile Ala Arg Tyr Thr Glu Val Trp Phe Thr Pro Leu Gly Ile 35 40 45 Gly Glu Gly Ile Arg Thr Thr Phe Ala Asn Leu Ser Gly Gly Ala Thr 50 55 60 Tyr Ser Leu Lys Leu Leu Ser Gly Phe Lys Ser Arg Leu Asp Arg Arg 65 70 75 80 Phe Glu Gln Phe Leu Asn Gly Asp Leu Lys Val His Lys Val Leu Thr 85 90 95 His Pro Asp Asp Leu Ala Val Tyr Ala Leu Ala Ser Leu Leu His Asp 100 105 110 Lys Pro Pro Gly Thr Ala Ala Met Pro Gly Ile Gly Ala Met His His 115 120 125 Leu Pro Arg Pro Gly Glu Leu Gly Ser Arg Thr Glu Leu Pro Ile Gly 130 135 140 Ala Gly Met Gly Ser Ser Ala Ala Ile Val Ala Ala Thr Thr Val Leu 145 150 155 160 Phe Glu Thr Leu Leu Asp Arg Pro Lys Thr Pro Glu Gln Arg Phe Asp 165 170 175 Arg Val Arg Phe Cys Glu Arg Leu Lys His Gly Lys Ala Gly Pro Ile 180 185 190 Asp Ala Ala Ser Val Val Arg Gly Gly Leu Val Arg Val Gly Gly Asn 195 200 205 Gly Pro Gly Ser Ile Ser Ser Phe Asp Leu Pro Glu Asp His Asp Leu 210 215 220 Val Ala Gly Arg Gly Trp Tyr Trp Val Leu His Gly Arg Pro Val Ser 225 230 235 240 Gly Thr Gly Glu Cys Val Ser Ala Val Ala Ala Ala His Gly Arg Asp 245 250 255 Ala Ala Leu Trp Asp Ala Phe Ala Val Cys Thr Arg Ala Leu Glu Ala 260 265 270 Ala Leu Leu Ser Gly Gly Ser Pro Asp Ala Ala Ile Thr Glu Asn Gln 275 280 285 Arg Leu Leu Glu Arg Ile Gly Val Val Pro Ala Ala Thr Gln Ala Leu 290 295 300 Val Ala Gln Ile Glu Glu Ala Gly Gly Ala Ala Lys Ile Cys Gly Ala 305 310 315 320 Gly Ser Val Arg Gly Asp His Gly Gly Ala Val Leu Val Arg Ile Asp 325 330 335 Asp Ala Gln Ala Met Ala Ser Val Met Ala Arg His Pro Asp Leu Asp 340 345 350 Trp Ala Pro Leu Arg Met Ser Arg Thr Gly Ala Ala Pro Gly Pro Ala 355 360 365 Pro Arg Ala Gln Pro Leu Pro Gly Gln Gly 370 375 <210> 50 <211> 9066 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (6970)..(7884) <400> 50 ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60 cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120 cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180 acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240 tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300 cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360 tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420 tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480 attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540 atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600 cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660 atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720 gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780 tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840 cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900 tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960 catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020 tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080 cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140 gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200 gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260 ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320 gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380 atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440 gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500 atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560 catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620 cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680 tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740 gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800 gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860 ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920 acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980 acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040 cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100 tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160 ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220 acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280 gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340 ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400 acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460 tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520 gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580 tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640 tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700 gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760 tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820 tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880 gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940 tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000 cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060 aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120 cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180 gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240 agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300 ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360 ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420 tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480 acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540 cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600 accccggaga gttggtccgc acccacatgg agatggagcg atgaccgaca gcaaggatca 3660 ccatgtcgcg gggcgcaagc tggaccatct gcgtgcattg gacgacgatg cggatatcga 3720 ccggggcgac agcggcttcg accgcatcgc gctgacccat cgcgccctgc ccgaggtgga 3780 tttcgacgcc atcgacacgg cgaccagctt cctgggccgt gaactgtcct tcccgctgct 3840 gatctcgtcc atgaccggcg gcaccggcga ggagatcgag cgcatcaacc gcaacctggc 3900 cgctggtgcc gaggaggccc gcgtcgccat ggcggtgggc tcgcagcgcg tgatgttcac 3960 cgacccctcg gcgcgggcca gcttcgacct gcgcgcccat gcgcccaccg tgccgctgct 4020 ggccaatatc ggcgcggtgc agctgaacat ggggctgggg ctgaaggaat gcctggccgc 4080 gatcgaggtg ctgcaggcgg acggcctgta tctgcacctg aaccccctgc aagaggccgt 4140 ccagcccgag ggggatcgcg actttgccga tctgggcagc aagatcgcgg ccatcgcccg 4200 cgacgttccc gtgcccgtcc tgctgaagga ggtgggctgc ggcctgtcgg cggccgatat 4260 cgccatcggg ctgcgcgccg ggatccggca tttcgacgtg gccggtcgcg gcggcacatc 4320 ctggagccgg atcgagtatc gccgccgcca gcgggccgat gacgacctgg gcctggtctt 4380 ccaggactgg ggcctgcaga ccgtggacgc cctgcgcgag gcgcggcccg cgcttgcggc 4440 ccatgatgga accagcgtgc tgatcgccag cggcggcatc cgcaacggtg tcgacatggc 4500 gaaatgcgtc atcctggggg ccgacatgtg cggggtcgcc gcgcccctgc tgaaagcggc 4560 ccaaaactcg cgcgaggcgg ttgtatccgc catccggaaa ctgcatctgg agttccggac 4620 agccatgttc ctcctgggtt gcggcacgct tgccgacctg aaggacaatt cctcgcttat 4680 ccgtcaatga aagtgcctaa gatgaccgtg acaggaatcg aagcgatcag cttctacacc 4740 ccccagaact acgtgggact ggatatcctt gccgcgcatc acgggatcga ccccgagaag 4800 ttctcgaagg ggatcgggca ggagaaaatc gcactgcccg gccatgacga ggatatcgtg 4860 accatggccg ccgaggccgc gctgccgatc atcgaacgcg cgggcacgca gggcatcgac 4920 acggttctgt tcgccaccga gagcgggatc gaccagtcga aggccgccgc catctatctg 4980 cgccgcctgc tggacctgtc gcccaactgc cgttgcgtcg agctgaagca ggcctgctat 5040 tccgcgacgg cggcgctgca gatggcctgc gcgcatgtcg cccgcaagcc cgaccgcaag 5100 gtgctggtga tcgcgtccga tgtcgcgcgc tatgaccgcg aaagctcggg cgaggcgacg 5160 cagggtgcgg gcgccgtcgc catccttgtc agcgccgatc ccaaggtggc cgagatcggc 5220 accgtctcgg ggctgttcac cgaggatatc atggatttct ggcggccgaa ccaccgccgc 5280 acgcccctgt tcgacggcaa ggcatcgacg ctgcgctatc tgaacgcgct ggtcgaggcg 5340 tggaacgact atcgcgcgaa tggcggccac gagttcgccg atttcgcgca tttctgctat 5400 cacgtgccgt tctcgcggat gggcgagaag gcgaacagcc acctggccaa ggcgaacaag 5460 acgccggtgg acatggggca ggtgcagacg ggcctgatct acaaccggca ggtcgggaac 5520 tgctataccg ggtcgatcta cctggcattc gcctcgctgc tggagaacgc tcaggaggac 5580 ctgaccggcg cgctggtcgg tctgttcagc tatggctcgg gtgcgacggg cgaattcttc 5640 gatgcgcgga tcgcgcccgg ttaccgcgac cacctgttcg cggaacgcca tcgcgaattg 5700 ctgcaggatc gcacgcccgt cacatatgac gaatacgttg ccctgtggga cgagatcgac 5760 ctgacgcagg gcgcgcccga caaggcgcgc ggtcgtttca ggctggcagg tatcgaggac 5820 gagaagcgca tctatgtcga ccggcaggcc tgaagcaggc gcccatgccc cgggcaagct 5880 gatcctgtcc ggggaacatt ccgtgctcta tggtgcgccc gcgcttgcca tggccatcgc 5940 ccgctatacc gaggtgtggt tcacgccgct tggcattggc gaggggatac gcacgacatt 6000 cgccaatctc tcgggcgggg cgacctattc gctgaagctg ctgtcggggt tcaagtcgcg 6060 gctggaccgc cggttcgagc agttcctgaa cggcgaccta aaggtgcaca aggtcctgac 6120 ccatcccgac gatctggcgg tctatgcgct ggcgtcgctt ctgcacgaca agccgccggg 6180 gaccgccgcg atgccgggca tcggcgcgat gcaccacctg ccgcgaccgg gtgagctggg 6240 cagccggacg gagctgccca tcggcgcggg catggggtcg tctgcggcca tcgtcgcggc 6300 caccacggtc ctgttcgaga cgctgctgga ccggcccaag acgcccgaac agcgcttcga 6360 ccgcgtccgc ttctgcgagc ggttgaagca cggcaaggcc ggtcccatcg acgcggccag 6420 cgtcgtgcgc ggcgggcttg tccgcgtggg cgggaacggg ccgggttcga tcagcagctt 6480 cgatttgccc gaggatcacg accttgtcgc gggacgcggc tggtactggg tactgcacgg 6540 gcgccccgtc agcgggaccg gcgaatgcgt cagcgcggtc gcggcggcgc atggtcgcga 6600 tgcggcgctg tgggacgcct tcgcagtctg cacccgcgcg ttggaggccg cgctgctgtc 6660 tgggggcagc cccgacgccg ccatcaccga gaaccagcgc ctgctggaac gcatcggcgt 6720 cgtgccggca gcgacgcagg ccctcgtggc ccagatcgag gaggcgggtg gcgcggccaa 6780 gatctgcggc gcaggttccg tgcggggcga tcacggcggg gcggtcctcg tgcggattga 6840 cgacgcgcag gcgatggctt cggtcatggc gcgccatccc gacctcgact gggcgcccct 6900 gcgcatgtcg cgcacggggg cggcacccgg ccccgcgccg cgtgcgcaac cgctgccggg 6960 gcagggctg atg gat cag gtc atc cgc gcc agc gcg ccg ggt tcg gtc atg 7011 Met Asp Gln Val Ile Arg Ala Ser Ala Pro Gly Ser Val Met 1 5 10 atc acg ggc gaa cat gcc gtg gtc tat gga cac cgc gcc atc gtc gcc 7059 Ile Thr Gly Glu His Ala Val Val Tyr Gly His Arg Ala Ile Val Ala 15 20 25 30 ggg atc gag cag cgc gcc cat gtg acg atc gtc ccg cgt gcc gac cgc 7107 Gly Ile Glu Gln Arg Ala His Val Thr Ile Val Pro Arg Ala Asp Arg 35 40 45 atg ttt cgc atc acc tcg cag atc ggg gcg ccg cag cag ggg tcg ctg 7155 Met Phe Arg Ile Thr Ser Gln Ile Gly Ala Pro Gln Gln Gly Ser Leu 50 55 60 gac gat ctg cct gcg ggc ggg acc tat cgc ttc gtg ctg gcc gcc atc 7203 Asp Asp Leu Pro Ala Gly Gly Thr Tyr Arg Phe Val Leu Ala Ala Ile 65 70 75 gcg cga cac gcg ccg gac ctg cct tgc ggg ttc gac atg gac atc acc 7251 Ala Arg His Ala Pro Asp Leu Pro Cys Gly Phe Asp Met Asp Ile Thr 80 85 90 tcg ggg atc gat ccg agg ctc ggg ctt gga tcc tcg gcg gcg gtg acg 7299 Ser Gly Ile Asp Pro Arg Leu Gly Leu Gly Ser Ser Ala Ala Val Thr 95 100 105 110 gtc gcc tgc ctc ggc gcg ctg tcg cgg ctg gcg ggg cgg ggg acc gag 7347 Val Ala Cys Leu Gly Ala Leu Ser Arg Leu Ala Gly Arg Gly Thr Glu 115 120 125 ggg ctg cat gac gac gcg ctg cgc atc gtc cgc gcc atc cag ggc agg 7395 Gly Leu His Asp Asp Ala Leu Arg Ile Val Arg Ala Ile Gln Gly Arg 130 135 140 ggc agc ggg gcc gat ctg gcg gcc agc ctg cat ggc ggc ttc gtc gcc 7443 Gly Ser Gly Ala Asp Leu Ala Ala Ser Leu His Gly Gly Phe Val Ala 145 150 155 tat cgc gcg ccc gat ggc ggt gcc gcg cag atc gag gcg ctt ccg gtg 7491 Tyr Arg Ala Pro Asp Gly Gly Ala Ala Gln Ile Glu Ala Leu Pro Val 160 165 170 ccg ccg ggg ccg ttc ggc ctg cgc tat gcg ggc tac aag acc ccg aca 7539 Pro Pro Gly Pro Phe Gly Leu Arg Tyr Ala Gly Tyr Lys Thr Pro Thr 175 180 185 190 gcc gag gtg ctg cgc ctt gtg gcc gat cgg atg gcg ggc aac gag gcc 7587 Ala Glu Val Leu Arg Leu Val Ala Asp Arg Met Ala Gly Asn Glu Ala 195 200 205 gct ttc gac gcg ctc tac tcc cgg atg ggc gca agc gca gat gcc gcg 7635 Ala Phe Asp Ala Leu Tyr Ser Arg Met Gly Ala Ser Ala Asp Ala Ala 210 215 220 atc cgc gcg gcg caa ggg ctg gac tgg gct gca ttc cac gac gcg ctg 7683 Ile Arg Ala Ala Gln Gly Leu Asp Trp Ala Ala Phe His Asp Ala Leu 225 230 235 aac gaa tac cag cgc ctg atg gag cag ctg ggc gtg tcc gac gac acg 7731 Asn Glu Tyr Gln Arg Leu Met Glu Gln Leu Gly Val Ser Asp Asp Thr 240 245 250 ctg gac gcg atc atc cgc gag gcg cgc gac gcg ggc gcc gca gtc gcc 7779 Leu Asp Ala Ile Ile Arg Glu Ala Arg Asp Ala Gly Ala Ala Val Ala 255 260 265 270 aag atc tcc ggc tcg ggg ctg ggg gat tgc gtg ctg gca ctg ggc gac 7827 Lys Ile Ser Gly Ser Gly Leu Gly Asp Cys Val Leu Ala Leu Gly Asp 275 280 285 cag ccc aag ggt ttc gtg ccc gca agc att gcc gag aag gga ctt gtt 7875 Gln Pro Lys Gly Phe Val Pro Ala Ser Ile Ala Glu Lys Gly Leu Val 290 295 300 ttc gat gac tgatgc cgtccgcgac atgatcgccc gtgccatggc gggcgcgacc 7930 Phe Asp Asp 305 gacatccgag cagccgaggc ttatgcgccc agcaacatcg cgctgtcgaa atactggggc 7990 aagcgcgacg ccgcgcggaa ccttccgctg aacagctccg tctcgatctc gttggcgaac 8050 tggggctctc atacgcgggt cgaggggtcc ggcacgggcc acgacgaggt gcatcacaac 8110 ggcacgctgc tggatccggg cgacgccttc gcgcgccgcg cgttggcatt cgctgacctg 8170 ttccgggggg ggaggcacct gccgctgcgg atcacgacgc agaactcgat cccgacggcg 8230 gcggggcttg cctcgtcggc ctcggggttc gcggcgctga cccgtgcgct ggcgggggcg 8290 ttcgggctgg atctggacga cacggatctg agccgcatcg cccggatcgg cagtggcagc 8350 gccgcccgct cgatctggca cggcttcgtc cgctggaacc ggggcgaggc cgaggatggg 8410 catgacagcc acggcgtccc gctggacctg cgctggcccg gcttccgcat cgcgatcgtg 8470 gccgtggaca aggggcccaa gcctttcagt tcgcgcgacg gcatgaacca cacggtcgag 8530 accagcccgc tgttcccgcc ctggcctgcg caggcggaag cggattgccg cgtcatcgag 8590 gatgcgatcg ccgcccgcga catggccgcc ctgggtccgc gggtcgaggc gaacgccctt 8650 gcgatgcacg ccacgatgat ggccgcgcgc ccgccgctct gctacctgac gggcggcagc 8710 tggcaggtgc tggaacgcct gtggcaggcc cgcgcggacg ggcttgcggc ctttgcgacg 8770 atggatgccg gcccgaacgt caagctgatc ttcgaggaaa gcagcgccgc cgacgtgctg 8830 tacctgttcc ccgacgccag cctgatcgcg ccgttcgagg ggcgttgaac gcgtaagacg 8890 accactgggt aaggttctgc cgcgcgtggt ctcgactgcc tgcaaagagg tgcttgagtt 8950 gctgcgtgac tgcggcggcc gacttcgtgg gacttgcccg ccacgctgac gcgctggaaa 9010 cgcgcccgcg gattacgacc gcgtcattgc cctgaaccaa tttcccgtcg gtcgac 9066 <210> 51 <211> 305 <212> PRT <213> Paracoccus sp. <400> 51 Met Asp Gln Val Ile Arg Ala Ser Ala Pro Gly Ser Val Met Ile Thr 1 5 10 15 Gly Glu His Ala Val Val Tyr Gly His Arg Ala Ile Val Ala Gly Ile 20 25 30 Glu Gln Arg Ala His Val Thr Ile Val Pro Arg Ala Asp Arg Met Phe 35 40 45 Arg Ile Thr Ser Gln Ile Gly Ala Pro Gln Gln Gly Ser Leu Asp Asp 50 55 60 Leu Pro Ala Gly Gly Thr Tyr Arg Phe Val Leu Ala Ala Ile Ala Arg 65 70 75 80 His Ala Pro Asp Leu Pro Cys Gly Phe Asp Met Asp Ile Thr Ser Gly 85 90 95 Ile Asp Pro Arg Leu Gly Leu Gly Ser Ser Ala Ala Val Thr Val Ala 100 105 110 Cys Leu Gly Ala Leu Ser Arg Leu Ala Gly Arg Gly Thr Glu Gly Leu 115 120 125 His Asp Asp Ala Leu Arg Ile Val Arg Ala Ile Gln Gly Arg Gly Ser 130 135 140 Gly Ala Asp Leu Ala Ala Ser Leu His Gly Gly Phe Val Ala Tyr Arg 145 150 155 160 Ala Pro Asp Gly Gly Ala Ala Gln Ile Glu Ala Leu Pro Val Pro Pro 165 170 175 Gly Pro Phe Gly Leu Arg Tyr Ala Gly Tyr Lys Thr Pro Thr Ala Glu 180 185 190 Val Leu Arg Leu Val Ala Asp Arg Met Ala Gly Asn Glu Ala Ala Phe 195 200 205 Asp Ala Leu Tyr Ser Arg Met Gly Ala Ser Ala Asp Ala Ala Ile Arg 210 215 220 Ala Ala Gln Gly Leu Asp Trp Ala Ala Phe His Asp Ala Leu Asn Glu 225 230 235 240 Tyr Gln Arg Leu Met Glu Gln Leu Gly Val Ser Asp Asp Thr Leu Asp 245 250 255 Ala Ile Ile Arg Glu Ala Arg Asp Ala Gly Ala Ala Val Ala Lys Ile 260 265 270 Ser Gly Ser Gly Leu Gly Asp Cys Val Leu Ala Leu Gly Asp Gln Pro 275 280 285 Lys Gly Phe Val Pro Ala Ser Ile Ala Glu Lys Gly Leu Val Phe Asp 290 295 300 Asp 305 <210> 52 <211> 9066 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (7880)..(8875) <400> 52 ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60 cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120 cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180 acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240 tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300 cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360 tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420 tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480 attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540 atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600 cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660 atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720 gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780 tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840 cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900 tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960 catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020 tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080 cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140 gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200 gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260 ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320 gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380 atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440 gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500 atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560 catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620 cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680 tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740 gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800 gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860 ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920 acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980 acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040 cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100 tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160 ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220 acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280 gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340 ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400 acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460 tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520 gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580 tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640 tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700 gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760 tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820 tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880 gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940 tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000 cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060 aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120 cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180 gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240 agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300 ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360 ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420 tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480 acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540 cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600 accccggaga gttggtccgc acccacatgg agatggagcg atgaccgaca gcaaggatca 3660 ccatgtcgcg gggcgcaagc tggaccatct gcgtgcattg gacgacgatg cggatatcga 3720 ccggggcgac agcggcttcg accgcatcgc gctgacccat cgcgccctgc ccgaggtgga 3780 tttcgacgcc atcgacacgg cgaccagctt cctgggccgt gaactgtcct tcccgctgct 3840 gatctcgtcc atgaccggcg gcaccggcga ggagatcgag cgcatcaacc gcaacctggc 3900 cgctggtgcc gaggaggccc gcgtcgccat ggcggtgggc tcgcagcgcg tgatgttcac 3960 cgacccctcg gcgcgggcca gcttcgacct gcgcgcccat gcgcccaccg tgccgctgct 4020 ggccaatatc ggcgcggtgc agctgaacat ggggctgggg ctgaaggaat gcctggccgc 4080 gatcgaggtg ctgcaggcgg acggcctgta tctgcacctg aaccccctgc aagaggccgt 4140 ccagcccgag ggggatcgcg actttgccga tctgggcagc aagatcgcgg ccatcgcccg 4200 cgacgttccc gtgcccgtcc tgctgaagga ggtgggctgc ggcctgtcgg cggccgatat 4260 cgccatcggg ctgcgcgccg ggatccggca tttcgacgtg gccggtcgcg gcggcacatc 4320 ctggagccgg atcgagtatc gccgccgcca gcgggccgat gacgacctgg gcctggtctt 4380 ccaggactgg ggcctgcaga ccgtggacgc cctgcgcgag gcgcggcccg cgcttgcggc 4440 ccatgatgga accagcgtgc tgatcgccag cggcggcatc cgcaacggtg tcgacatggc 4500 gaaatgcgtc atcctggggg ccgacatgtg cggggtcgcc gcgcccctgc tgaaagcggc 4560 ccaaaactcg cgcgaggcgg ttgtatccgc catccggaaa ctgcatctgg agttccggac 4620 agccatgttc ctcctgggtt gcggcacgct tgccgacctg aaggacaatt cctcgcttat 4680 ccgtcaatga aagtgcctaa gatgaccgtg acaggaatcg aagcgatcag cttctacacc 4740 ccccagaact acgtgggact ggatatcctt gccgcgcatc acgggatcga ccccgagaag 4800 ttctcgaagg ggatcgggca ggagaaaatc gcactgcccg gccatgacga ggatatcgtg 4860 accatggccg ccgaggccgc gctgccgatc atcgaacgcg cgggcacgca gggcatcgac 4920 acggttctgt tcgccaccga gagcgggatc gaccagtcga aggccgccgc catctatctg 4980 cgccgcctgc tggacctgtc gcccaactgc cgttgcgtcg agctgaagca ggcctgctat 5040 tccgcgacgg cggcgctgca gatggcctgc gcgcatgtcg cccgcaagcc cgaccgcaag 5100 gtgctggtga tcgcgtccga tgtcgcgcgc tatgaccgcg aaagctcggg cgaggcgacg 5160 cagggtgcgg gcgccgtcgc catccttgtc agcgccgatc ccaaggtggc cgagatcggc 5220 accgtctcgg ggctgttcac cgaggatatc atggatttct ggcggccgaa ccaccgccgc 5280 acgcccctgt tcgacggcaa ggcatcgacg ctgcgctatc tgaacgcgct ggtcgaggcg 5340 tggaacgact atcgcgcgaa tggcggccac gagttcgccg atttcgcgca tttctgctat 5400 cacgtgccgt tctcgcggat gggcgagaag gcgaacagcc acctggccaa ggcgaacaag 5460 acgccggtgg acatggggca ggtgcagacg ggcctgatct acaaccggca ggtcgggaac 5520 tgctataccg ggtcgatcta cctggcattc gcctcgctgc tggagaacgc tcaggaggac 5580 ctgaccggcg cgctggtcgg tctgttcagc tatggctcgg gtgcgacggg cgaattcttc 5640 gatgcgcgga tcgcgcccgg ttaccgcgac cacctgttcg cggaacgcca tcgcgaattg 5700 ctgcaggatc gcacgcccgt cacatatgac gaatacgttg ccctgtggga cgagatcgac 5760 ctgacgcagg gcgcgcccga caaggcgcgc ggtcgtttca ggctggcagg tatcgaggac 5820 gagaagcgca tctatgtcga ccggcaggcc tgaagcaggc gcccatgccc cgggcaagct 5880 gatcctgtcc ggggaacatt ccgtgctcta tggtgcgccc gcgcttgcca tggccatcgc 5940 ccgctatacc gaggtgtggt tcacgccgct tggcattggc gaggggatac gcacgacatt 6000 cgccaatctc tcgggcgggg cgacctattc gctgaagctg ctgtcggggt tcaagtcgcg 6060 gctggaccgc cggttcgagc agttcctgaa cggcgaccta aaggtgcaca aggtcctgac 6120 ccatcccgac gatctggcgg tctatgcgct ggcgtcgctt ctgcacgaca agccgccggg 6180 gaccgccgcg atgccgggca tcggcgcgat gcaccacctg ccgcgaccgg gtgagctggg 6240 cagccggacg gagctgccca tcggcgcggg catggggtcg tctgcggcca tcgtcgcggc 6300 caccacggtc ctgttcgaga cgctgctgga ccggcccaag acgcccgaac agcgcttcga 6360 ccgcgtccgc ttctgcgagc ggttgaagca cggcaaggcc ggtcccatcg acgcggccag 6420 cgtcgtgcgc ggcgggcttg tccgcgtggg cgggaacggg ccgggttcga tcagcagctt 6480 cgatttgccc gaggatcacg accttgtcgc gggacgcggc tggtactggg tactgcacgg 6540 gcgccccgtc agcgggaccg gcgaatgcgt cagcgcggtc gcggcggcgc atggtcgcga 6600 tgcggcgctg tgggacgcct tcgcagtctg cacccgcgcg ttggaggccg cgctgctgtc 6660 tgggggcagc cccgacgccg ccatcaccga gaaccagcgc ctgctggaac gcatcggcgt 6720 cgtgccggca gcgacgcagg ccctcgtggc ccagatcgag gaggcgggtg gcgcggccaa 6780 gatctgcggc gcaggttccg tgcggggcga tcacggcggg gcggtcctcg tgcggattga 6840 cgacgcgcag gcgatggctt cggtcatggc gcgccatccc gacctcgact gggcgcccct 6900 gcgcatgtcg cgcacggggg cggcacccgg ccccgcgccg cgtgcgcaac cgctgccggg 6960 gcagggctga tggatcaggt catccgcgcc agcgcgccgg gttcggtcat gatcacgggc 7020 gaacatgccg tggtctatgg acaccgcgcc atcgtcgccg ggatcgagca gcgcgcccat 7080 gtgacgatcg tcccgcgtgc cgaccgcatg tttcgcatca cctcgcagat cggggcgccg 7140 cagcaggggt cgctggacga tctgcctgcg ggcgggacct atcgcttcgt gctggccgcc 7200 atcgcgcgac acgcgccgga cctgccttgc gggttcgaca tggacatcac ctcggggatc 7260 gatccgaggc tcgggcttgg atcctcggcg gcggtgacgg tcgcctgcct cggcgcgctg 7320 tcgcggctgg cggggcgggg gaccgagggg ctgcatgacg acgcgctgcg catcgtccgc 7380 gccatccagg gcaggggcag cggggccgat ctggcggcca gcctgcatgg cggcttcgtc 7440 gcctatcgcg cgcccgatgg cggtgccgcg cagatcgagg cgcttccggt gccgccgggg 7500 ccgttcggcc tgcgctatgc gggctacaag accccgacag ccgaggtgct gcgccttgtg 7560 gccgatcgga tggcgggcaa cgaggccgct ttcgacgcgc tctactcccg gatgggcgca 7620 agcgcagatg ccgcgatccg cgcggcgcaa gggctggact gggctgcatt ccacgacgcg 7680 ctgaacgaat accagcgcct gatggagcag ctgggcgtgt ccgacgacac gctggacgcg 7740 atcatccgcg aggcgcgcga cgcgggcgcc gcagtcgcca agatctccgg ctcggggctg 7800 ggggattgcg tgctggcact gggcgaccag cccaagggtt tcgtgcccgc aagcattgcc 7860 gagaagggac ttgttttcg atg act gat gcc gtc cgc gac atg atc gcc cgt 7912 Met Thr Asp Ala Val Arg Asp Met Ile Ala Arg 1 5 10 gcc atg gcg ggc gcg acc gac atc cga gca gcc gag gct tat gcg ccc 7960 Ala Met Ala Gly Ala Thr Asp Ile Arg Ala Ala Glu Ala Tyr Ala Pro 15 20 25 agc aac atc gcg ctg tcg aaa tac tgg ggc aag cgc gac gcc gcg cgg 8008 Ser Asn Ile Ala Leu Ser Lys Tyr Trp Gly Lys Arg Asp Ala Ala Arg 30 35 40 aac ctt ccg ctg aac agc tcc gtc tcg atc tcg ttg gcg aac tgg ggc 8056 Asn Leu Pro Leu Asn Ser Ser Val Ser Ile Ser Leu Ala Asn Trp Gly 45 50 55 tct cat acg cgg gtc gag ggg tcc ggc acg ggc cac gac gag gtg cat 8104 Ser His Thr Arg Val Glu Gly Ser Gly Thr Gly His Asp Glu Val His 60 65 70 75 cac aac ggc acg ctg ctg gat ccg ggc gac gcc ttc gcg cgc cgc gcg 8152 His Asn Gly Thr Leu Leu Asp Pro Gly Asp Ala Phe Ala Arg Arg Ala 80 85 90 ttg gca ttc gct gac ctg ttc cgg ggg ggg agg cac ctg ccg ctg cgg 8200 Leu Ala Phe Ala Asp Leu Phe Arg Gly Gly Arg His Leu Pro Leu Arg 95 100 105 atc acg acg cag aac tcg atc ccg acg gcg gcg ggg ctt gcc tcg tcg 8248 Ile Thr Thr Gln Asn Ser Ile Pro Thr Ala Ala Gly Leu Ala Ser Ser 110 115 120 gcc tcg ggg ttc gcg gcg ctg acc cgt gcg ctg gcg ggg gcg ttc ggg 8296 Ala Ser Gly Phe Ala Ala Leu Thr Arg Ala Leu Ala Gly Ala Phe Gly 125 130 135 ctg gat ctg gac gac acg gat ctg agc cgc atc gcc cgg atc ggc agt 8344 Leu Asp Leu Asp Asp Thr Asp Leu Ser Arg Ile Ala Arg Ile Gly Ser 140 145 150 155 ggc agc gcc gcc cgc tcg atc tgg cac ggc ttc gtc cgc tgg aac cgg 8392 Gly Ser Ala Ala Arg Ser Ile Trp His Gly Phe Val Arg Trp Asn Arg 160 165 170 ggc gag gcc gag gat ggg cat gac agc cac ggc gtc ccg ctg gac ctg 8440 Gly Glu Ala Glu Asp Gly His Asp Ser His Gly Val Pro Leu Asp Leu 175 180 185 cgc tgg ccc ggc ttc cgc atc gcg atc gtg gcc gtg gac aag ggg ccc 8488 Arg Trp Pro Gly Phe Arg Ile Ala Ile Val Ala Val Asp Lys Gly Pro 190 195 200 aag cct ttc agt tcg cgc gac ggc atg aac cac acg gtc gag acc agc 8536 Lys Pro Phe Ser Ser Arg Asp Gly Met Asn His Thr Val Glu Thr Ser 205 210 215 ccg ctg ttc ccg ccc tgg cct gcg cag gcg gaa gcg gat tgc cgc gtc 8584 Pro Leu Phe Pro Pro Trp Pro Ala Gln Ala Glu Ala Asp Cys Arg Val 220 225 230 235 atc gag gat gcg atc gcc gcc cgc gac atg gcc gcc ctg ggt ccg cgg 8632 Ile Glu Asp Ala Ile Ala Ala Arg Asp Met Ala Ala Leu Gly Pro Arg 240 245 250 gtc gag gcg aac gcc ctt gcg atg cac gcc acg atg atg gcc gcg cgc 8680 Val Glu Ala Asn Ala Leu Ala Met His Ala Thr Met Met Ala Ala Arg 255 260 265 ccg ccg ctc tgc tac ctg acg ggc ggc agc tgg cag gtg ctg gaa cgc 8728 Pro Pro Leu Cys Tyr Leu Thr Gly Gly Ser Trp Gln Val Leu Glu Arg 270 275 280 ctg tgg cag gcc cgc gcg gac ggg ctt gcg gcc ttt gcg acg atg gat 8776 Leu Trp Gln Ala Arg Ala Asp Gly Leu Ala Ala Phe Ala Thr Met Asp 285 290 295 gcc ggc ccg aac gtc aag ctg atc ttc gag gaa agc agc gcc gcc gac 8824 Ala Gly Pro Asn Val Lys Leu Ile Phe Glu Glu Ser Ser Ala Ala Asp 300 305 310 315 gtg ctg tac ctg ttc ccc gac gcc agc ctg atc gcg ccg ttc gag ggg 8872 Val Leu Tyr Leu Phe Pro Asp Ala Ser Leu Ile Ala Pro Phe Glu Gly 320 325 330 cgt tgaac gcgtaagacg accactgggt aaggttctgc cgcgcgtggt ctcgactgcc 8930 Arg tgcaaagagg tgcttgagtt gctgcgtgac tgcggcggcc gacttcgtgg gacttgcccg 8990 ccacgctgac gcgctggaaa cgcgcccgcg gattacgacc gcgtcattgc cctgaaccaa 9050 tttcccgtcg gtcgac 9066 <210> 53 <211> 332 <212> PRT <213> Paracoccus sp. <400> 53 Met Thr Asp Ala Val Arg Asp Met Ile Ala Arg Ala Met Ala Gly Ala 1 5 10 15 Thr Asp Ile Arg Ala Ala Glu Ala Tyr Ala Pro Ser Asn Ile Ala Leu 20 25 30 Ser Lys Tyr Trp Gly Lys Arg Asp Ala Ala Arg Asn Leu Pro Leu Asn 35 40 45 Ser Ser Val Ser Ile Ser Leu Ala Asn Trp Gly Ser His Thr Arg Val 50 55 60 Glu Gly Ser Gly Thr Gly His Asp Glu Val His His Asn Gly Thr Leu 65 70 75 80 Leu Asp Pro Gly Asp Ala Phe Ala Arg Arg Ala Leu Ala Phe Ala Asp 85 90 95 Leu Phe Arg Gly Gly Arg His Leu Pro Leu Arg Ile Thr Thr Gln Asn 100 105 110 Ser Ile Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Gly Phe Ala 115 120 125 Ala Leu Thr Arg Ala Leu Ala Gly Ala Phe Gly Leu Asp Leu Asp Asp 130 135 140 Thr Asp Leu Ser Arg Ile Ala Arg Ile Gly Ser Gly Ser Ala Ala Arg 145 150 155 160 Ser Ile Trp His Gly Phe Val Arg Trp Asn Arg Gly Glu Ala Glu Asp 165 170 175 Gly His Asp Ser His Gly Val Pro Leu Asp Leu Arg Trp Pro Gly Phe 180 185 190 Arg Ile Ala Ile Val Ala Val Asp Lys Gly Pro Lys Pro Phe Ser Ser 195 200 205 Arg Asp Gly Met Asn His Thr Val Glu Thr Ser Pro Leu Phe Pro Pro 210 215 220 Trp Pro Ala Gln Ala Glu Ala Asp Cys Arg Val Ile Glu Asp Ala Ile 225 230 235 240 Ala Ala Arg Asp Met Ala Ala Leu Gly Pro Arg Val Glu Ala Asn Ala 245 250 255 Leu Ala Met His Ala Thr Met Met Ala Ala Arg Pro Pro Leu Cys Tyr 260 265 270 Leu Thr Gly Gly Ser Trp Gln Val Leu Glu Arg Leu Trp Gln Ala Arg 275 280 285 Ala Asp Gly Leu Ala Ala Phe Ala Thr Met Asp Ala Gly Pro Asn Val 290 295 300 Lys Leu Ile Phe Glu Glu Ser Ser Ala Ala Asp Val Leu Tyr Leu Phe 305 310 315 320 Pro Asp Ala Ser Leu Ile Ala Pro Phe Glu Gly Arg 325 330 <210> 54 <211> 353 <212> PRT <213> Streptomyces sp. <400> 54 Met Thr Glu Thr His Ala Ile Ala Gly Val Pro Met Arg Trp Val Gly 1 5 10 15 Pro Leu Arg Ile Ser Gly Asn Val Ala Glu Thr Glu Thr Gln Val Pro 20 25 30 Leu Ala Thr Tyr Glu Ser Pro Leu Trp Pro Ser Val Gly Arg Gly Ala 35 40 45 Lys Val Ser Arg Leu Thr Glu Lys Gly Ile Val Ala Thr Leu Val Asp 50 55 60 Glu Arg Met Thr Arg Ser Val Ile Val Glu Ala Thr Asp Ala Gln Thr 65 70 75 80 Ala Tyr Met Ala Ala Gln Thr Ile His Ala Arg Ile Asp Glu Leu Arg 85 90 95 Glu Val Val Arg Gly Cys Ser Arg Phe Ala Gln Leu Ile Asn Ile Lys 100 105 110 His Glu Ile Asn Ala Asn Leu Leu Phe Ile Arg Phe Glu Phe Thr Thr 115 120 125 Gly Asp Ala Ser Gly His Asn Met Ala Thr Leu Ala Ser Asp Val Leu 130 135 140 Leu Gly His Leu Leu Glu Thr Ile Pro Gly Ile Ser Tyr Gly Ser Ile 145 150 155 160 Ser Gly Asn Tyr Cys Thr Asp Lys Lys Ala Thr Ala Ile Asn Gly Ile 165 170 175 Leu Gly Arg Gly Lys Asn Val Ile Thr Glu Leu Leu Val Pro Arg Asp 180 185 190 Val Val Glu Asn Asn Leu His Thr Thr Ala Ala Lys Ile Val Glu Leu 195 200 205 Asn Ile Arg Lys Asn Leu Leu Gly Thr Leu Leu Ala Gly Gly Ile Arg 210 215 220 Ser Ala Asn Ala His Phe Ala Asn Met Leu Leu Gly Phe Tyr Leu Ala 225 230 235 240 Thr Gly Gln Asp Ala Ala Asn Ile Val Glu Gly Ser Gln Gly Val Val 245 250 255 Met Ala Glu Asp Arg Asp Gly Asp Leu Tyr Phe Ala Cys Thr Leu Pro 260 265 270 Asn Leu Ile Val Gly Thr Val Gly Asn Gly Lys Gly Leu Gly Phe Val 275 280 285 Glu Thr Asn Leu Ala Arg Leu Gly Cys Arg Ala Asp Arg Glu Pro Gly 290 295 300 Glu Asn Ala Arg Arg Leu Ala Val Ile Ala Ala Ala Thr Val Leu Cys 305 310 315 320 Gly Glu Leu Ser Leu Leu Ala Ala Gln Thr Asn Pro Gly Glu Leu Met 325 330 335 Arg Ala His Val Gln Leu Glu Arg Asp Asn Lys Thr Ala Lys Val Gly 340 345 350 Ala <210> 55 <211> 353 <212> PRT <213> Streptomyces griseosporeus <400> 55 Met Thr Glu Ala His Ala Thr Ala Gly Val Pro Met Arg Trp Val Gly 1 5 10 15 Pro Val Arg Ile Ser Gly Asn Val Ala Thr Ile Glu Thr Gln Val Pro 20 25 30 Leu Ala Thr Tyr Glu Ser Pro Leu Trp Pro Ser Val Gly Arg Gly Ala 35 40 45 Lys Val Ser Arg Leu Thr Glu Lys Gly Ile Val Ala Thr Leu Val Asp 50 55 60 Glu Arg Met Thr Arg Ser Val Leu Val Glu Ala Thr Asp Ala Leu Thr 65 70 75 80 Ala Leu Ser Ala Ala Arg Thr Ile Glu Ala Arg Ile Asp Glu Leu Arg 85 90 95 Glu Leu Val Arg Gly Cys Ser Arg Phe Ala Gln Leu Ile Gly Ile Arg 100 105 110 His Glu Ile Thr Gly Asn Leu Leu Phe Val Arg Phe Glu Phe Ser Thr 115 120 125 Gly Asp Ala Ser Gly His Asn Met Ala Thr Leu Ala Ser Asp Val Leu 130 135 140 Leu Gln His Leu Leu Glu Thr Val Pro Gly Ile Ser Tyr Gly Ser Ile 145 150 155 160 Ser Gly Asn Tyr Cys Thr Asp Lys Lys Ala Thr Ala Ile Asn Gly Ile 165 170 175 Leu Gly Arg Gly Lys Asn Val Val Thr Glu Leu Leu Val Pro Arg Asp 180 185 190 Val Val Ala Asp Val Leu Asn Thr Thr Ala Ala Lys Ile Ala Glu Leu 195 200 205 Asn Leu Arg Lys Asn Leu Leu Gly Thr Leu Leu Ala Gly Gly Ile Arg 210 215 220 Ser Ala Asn Ala His Tyr Ala Asn Met Leu Leu Ala Phe Tyr Leu Ala 225 230 235 240 Thr Gly Gln Asp Ala Ala Asn Ile Val Glu Gly Ser Gln Gly Val Val 245 250 255 Thr Ala Glu Asp Arg Asp Gly Asp Leu Tyr Leu Ala Cys Thr Leu Pro 260 265 270 Asn Leu Ile Val Gly Thr Val Gly Asn Gly Lys Gly Leu Gly Phe Val 275 280 285 Glu Thr Asn Leu Asn Arg Leu Gly Cys Arg Ala Asp Arg Glu Pro Gly 290 295 300 Glu Asn Ala Arg Arg Leu Ala Val Ile Ala Ala Ala Thr Val Leu Cys 305 310 315 320 Gly Glu Leu Ser Leu Leu Ala Ala Gln Thr Asn Pro Gly Glu Leu Met 325 330 335 Arg Ala His Val Gln Leu Glu Arg Gly His Thr Thr Ala Lys Ala Gly 340 345 350 Val <210> 56 <211> 353 <212> PRT <213> Streptomyces sp. <400> 56 Met Thr Asp Thr His Ala Ile Ala Met Val Pro Met Lys Trp Val Gly 1 5 10 15 Pro Leu Arg Ile Ser Gly Asn Val Ala Thr Thr Glu Thr His Val Pro 20 25 30 Leu Ala Thr Tyr Glu Thr Pro Leu Trp Pro Ser Val Gly Arg Gly Ala 35 40 45 Lys Val Ser Met Leu Ser Glu Arg Gly Ile Ala Ala Thr Leu Val Asp 50 55 60 Glu Arg Met Thr Arg Ser Val Leu Val Glu Ala Thr Asp Ala Gln Thr 65 70 75 80 Ala Tyr Thr Ala Ala Arg Ala Ile Glu Ala Arg Ile Glu Glu Leu Arg 85 90 95 Ala Val Val Arg Thr Cys Ser Arg Phe Ala Glu Leu Leu Gln Val Arg 100 105 110 His Glu Ile Ala Gly Asn Leu Leu Phe Val Arg Phe Glu Phe Ser Thr 115 120 125 Arg Arg Pro Ser Gly His Asn Met Ala Thr Leu Ala Ser Asp Ala Leu 130 135 140 Leu Ala His Leu Leu Gln Thr Ile Pro Gly Ile Ser Tyr Gly Ser Ile 145 150 155 160 Ser Gly Asn Tyr Cys Thr Asp Lys Lys Ala Thr Ala Ile Asn Gly Ile 165 170 175 Leu Gly Arg Gly Lys Asn Val Val Thr Glu Leu Val Val Pro Arg Glu 180 185 190 Val Val Glu Arg Val Leu His Thr Thr Ala Ala Lys Ile Val Glu Leu 195 200 205 Asn Ile Arg Lys Asn Leu Leu Gly Thr Leu Leu Ala Gly Gly Ile Arg 210 215 220 Ser Ala Asn Ala His Tyr Ala Asn Met Leu Leu Gly Phe Tyr Leu Ala 225 230 235 240 Thr Gly Gln Asp Ala Ala Asn Ile Val Glu Gly Ser Gln Gly Val Thr 245 250 255 Leu Ala Glu Asp Arg Asp Gly Asp Leu Tyr Phe Ser Cys Asn Leu Pro 260 265 270 Asn Leu Ile Val Gly Thr Val Gly Asn Gly Lys Gly Leu Glu Phe Val 275 280 285 Glu Thr Asn Leu Asn Arg Leu Gly Cys Arg Glu Asp Arg Ala Pro Gly 290 295 300 Glu Asn Ala Arg Arg Leu Ala Val Ile Ala Ala Ala Thr Val Leu Cys 305 310 315 320 Gly Glu Leu Ser Leu Leu Ala Ala Gln Thr Asn Pro Gly Glu Leu Met 325 330 335 Arg Ala His Val Glu Leu Glu Arg Asp Asn Thr Thr Ala Glu Val Gly 340 345 350 Val <210> 57 <211> 347 <212> PRT <213> Erwinia herbicola <400> 57 Met Lys Asp Glu Arg Leu Val Gln Arg Lys Asn Asp His Leu Asp Ile 1 5 10 15 Val Leu Asp Pro Arg Arg Ala Val Thr Gln Ala Ser Ala Gly Phe Glu 20 25 30 Arg Trp Arg Phe Thr His Cys Ala Leu Pro Glu Leu Asn Phe Ser Asp 35 40 45 Ile Thr Leu Glu Thr Thr Phe Leu Asn Arg Gln Leu Gln Ala Pro Leu 50 55 60 Leu Ile Ser Ser Met Thr Gly Gly Val Glu Arg Ser Arg His Ile Asn 65 70 75 80 Arg His Leu Ala Glu Ala Ala Gln Val Leu Lys Ile Ala Met Gly Val 85 90 95 Gly Ser Gln Arg Val Ala Ile Glu Ser Asp Ala Gly Leu Gly Leu Asp 100 105 110 Lys Thr Leu Arg Gln Leu Ala Pro Asp Val Pro Leu Leu Ala Asn Leu 115 120 125 Gly Ala Ala Gln Leu Thr Gly Arg Lys Gly Ile Asp Tyr Ala Arg Arg 130 135 140 Ala Val Glu Met Ile Glu Ala Asp Ala Leu Ile Val His Leu Asn Pro 145 150 155 160 Leu Gln Glu Ala Leu Gln Pro Gly Gly Asp Arg Asp Trp Arg Gly Arg 165 170 175 Leu Ala Ala Ile Glu Thr Leu Val Arg Glu Leu Pro Val Pro Leu Val 180 185 190 Val Lys Glu Val Gly Ala Gly Ile Ser Arg Thr Val Ala Gly Gln Leu 195 200 205 Ile Asp Ala Gly Val Thr Val Ile Asp Val Ala Gly Ala Gly Gly Thr 210 215 220 Ser Trp Ala Ala Val Glu Gly Glu Arg Ala Ala Thr Glu Gln Gln Arg 225 230 235 240 Ser Val Ala Asn Val Phe Ala Asp Trp Gly Ile Pro Thr Ala Glu Ala 245 250 255 Leu Val Asp Ile Ala Glu Ala Trp Pro Gln Met Pro Leu Ile Ala Ser 260 265 270 Gly Gly Ile Lys Asn Gly Val Asp Ala Ala Lys Ala Leu Arg Leu Gly 275 280 285 Ala Cys Met Val Gly Gln Ala Ala Ala Val Leu Gly Ser Ala Gly Val 290 295 300 Ser Thr Glu Lys Val Ile Asp His Phe Asn Val Ile Ile Glu Gln Leu 305 310 315 320 Arg Val Ala Cys Phe Cys Thr Gly Ser Arg Ser Leu Ser Asp Leu Lys 325 330 335 Gln Ala Asp Ile Arg Tyr Val Arg Asp Thr Pro 340 345 <210> 58 <211> 360 <212> PRT <213> Borrelia burgdorferi <400> 58 Met Met Asp Thr Glu Phe Met Gly Ile Glu Pro Asn Ile Leu Glu Asn 1 5 10 15 Lys Lys Arg His Ile Glu Ile Cys Leu Asn Lys Asn Asp Val Lys Gly 20 25 30 Gly Cys Asn Phe Leu Lys Phe Ile Lys Leu Lys His Asn Ala Leu Ser 35 40 45 Asp Phe Asn Phe Ser Glu Ile Asn Ile Lys Glu Glu Ile Phe Gly Tyr 50 55 60 Asn Ile Ser Met Pro Val Phe Ile Ser Ser Met Thr Gly Gly Ser Lys 65 70 75 80 Glu Gly Asn Asp Phe Asn Lys Ser Leu Val Arg Ile Ala Asn Tyr Leu 85 90 95 Lys Ile Pro Ile Gly Leu Gly Ser Phe Lys Leu Leu Phe Lys Tyr Pro 100 105 110 Glu Tyr Ile Arg Asp Phe Thr Leu Lys Arg Tyr Ala His Asn Ile Pro 115 120 125 Leu Phe Ala Asn Val Gly Ala Val Gln Ile Val Glu Phe Gly Ile Ser 130 135 140 Lys Ile Ala Glu Met Ile Lys Arg Leu Glu Val Asp Ala Ile Ile Val 145 150 155 160 His Leu Asn Ala Gly Gln Glu Leu Met Lys Val Asp Gly Asp Arg Asn 165 170 175 Phe Lys Gly Ile Arg Glu Ser Ile Ala Lys Leu Ser Asp Phe Leu Ser 180 185 190 Val Pro Leu Ile Val Lys Glu Thr Gly Phe Gly Ile Ser Pro Lys Asp 195 200 205 Val Lys Glu Leu Phe Ser Leu Gly Ala Ser Tyr Val Asp Leu Ala Gly 210 215 220 Ser Gly Gly Thr Asn Trp Ile Leu Val Glu Gly Met Lys Ser Asn Asn 225 230 235 240 Leu Asn Ile Ala Ser Cys Phe Ser Asp Trp Gly Ile Pro Ser Val Phe 245 250 255 Thr Leu Leu Ser Ile Asp Asp Ser Leu Lys Ala Asn Ile Phe Ala Ser 260 265 270 Gly Gly Tyr Glu Thr Gly Met Asp Ile Ala Lys Gly Ile Ala Leu Gly 275 280 285 Ala Arg Leu Ile Gly Val Ala Ala Val Val Leu Arg Ala Phe Tyr Asp 290 295 300 Ser Gly Glu Asp Ala Val Phe Gly Leu Phe Ser Asp Tyr Glu His Ile 305 310 315 320 Leu Lys Met Ser Met Phe Leu Ser Gly Ser Lys Ser Leu Leu Glu Phe 325 330 335 Arg Asn Asn Lys Tyr Phe Leu Ser Ser Tyr Leu Leu Asp Glu Leu Gly 340 345 350 Val Phe Lys Gln Phe Tyr Gly Thr 355 360 <210> 59 <211> 349 <212> PRT <213> Synechocystis sp. <400> 59 Met Asp Ser Thr Pro His Arg Lys Ser Asp His Ile Arg Ile Val Leu 1 5 10 15 Glu Glu Asp Val Val Gly Lys Gly Ile Ser Thr Gly Phe Glu Arg Leu 20 25 30 Met Leu Glu His Cys Ala Leu Pro Ala Val Asp Leu Asp Ala Val Asp 35 40 45 Leu Gly Leu Thr Leu Trp Gly Lys Ser Leu Thr Tyr Pro Trp Leu Ile 50 55 60 Ser Ser Met Thr Gly Gly Thr Pro Glu Ala Lys Gln Ile Asn Leu Phe 65 70 75 80 Leu Ala Glu Val Ala Gln Ala Leu Gly Ile Ala Met Gly Leu Gly Ser 85 90 95 Gln Arg Ala Ala Ile Glu Asn Pro Asp Leu Ala Phe Thr Tyr Gln Val 100 105 110 Arg Ser Val Ala Pro Asp Ile Leu Leu Phe Ala Asn Leu Gly Leu Val 115 120 125 Gln Leu Asn Tyr Gly Tyr Gly Leu Glu Gln Ala Gln Arg Ala Val Asp 130 135 140 Met Ile Glu Ala Asp Ala Leu Ile Leu His Leu Asn Pro Leu Gln Glu 145 150 155 160 Ala Val Gln Pro Asp Gly Asp Arg Leu Trp Ser Gly Leu Trp Ser Lys 165 170 175 Leu Glu Ala Leu Val Glu Ala Leu Glu Val Pro Val Ile Val Lys Glu 180 185 190 Val Gly Asn Gly Ile Ser Gly Pro Val Ala Lys Arg Leu Gln Glu Cys 195 200 205 Gly Val Gly Ala Ile Asp Val Ala Gly Ala Gly Gly Thr Ser Trp Ser 210 215 220 Glu Val Glu Ala His Arg Gln Thr Asp Arg Gln Ala Lys Glu Val Ala 225 230 235 240 His Asn Phe Ala Asp Trp Gly Leu Pro Thr Ala Trp Ser Leu Gln Gln 245 250 255 Val Val Gln Asn Thr Glu Gln Ile Leu Val Phe Ala Ser Gly Gly Ile 260 265 270 Arg Ser Gly Ile Asp Gly Ala Lys Ala Ile Ala Leu Gly Ala Thr Leu 275 280 285 Val Gly Ser Ala Ala Pro Val Leu Ala Glu Ala Lys Ile Asn Ala Gln 290 295 300 Arg Val Tyr Asp His Tyr Gln Ala Arg Leu Arg Glu Leu Gln Ile Ala 305 310 315 320 Ala Phe Cys Cys Asp Ala Ala Asn Leu Thr Gln Leu Ala Gln Val Pro 325 330 335 Leu Trp Asp Arg Gln Ser Gly Gln Arg Leu Thr Lys Pro 340 345 <210> 60 <211> 361 <212> PRT <213> Streptomyces sp. <400> 60 Met Thr Ser Ala Gln Arg Lys Asp Asp His Val Arg Leu Ala Ile Glu 1 5 10 15 Gln His Asn Ala His Ser Gly Arg Asn Gln Asp Asp Val Ser Phe Val 20 25 30 His His Ala Leu Ala Gly Ile Asp Arg Pro Asp Val Ser Leu Ala Thr 35 40 45 Ser Phe Ala Gly Ile Ser Trp Gln Val Pro Ile Tyr Ile Asn Ala Met 50 55 60 Thr Gly Gly Ser Glu Lys Thr Gly Leu Ile Asn Arg Asp Leu Ala Thr 65 70 75 80 Ala Ala Arg Glu Thr Gly Val Pro Ile Ala Ser Gly Ser Met Asn Ala 85 90 95 Tyr Ile Lys Asp Pro Cys Ala Asp Thr Phe Arg Val Leu Arg Asp Glu 100 105 110 Asn Pro Asn Gly Phe Val Ile Ala Asn Ile Asn Ala Thr Thr Thr Val 115 120 125 Asp Asn Ala Gln Arg Ala Ile Asp Leu Ile Glu Ala Asn Ala Leu Gln 130 135 140 Ile His Ile Asn Thr Ala Gln Glu Thr Pro Met Pro Glu Gly Asp Arg 145 150 155 160 Ser Phe Ala Ser Trp Val Pro Gln Ile Glu Lys Ile Ala Ala Ala Val 165 170 175 Asp Ile Pro Val Ile Val Lys Glu Val Gly Asn Gly Leu Ser Arg Gln 180 185 190 Thr Ile Leu Leu Leu Ala Asp Leu Gly Val Gln Ala Ala Asp Val Ser 195 200 205 Gly Arg Gly Gly Thr Asp Phe Ala Arg Ile Glu Asn Gly Arg Arg Glu 210 215 220 Leu Gly Asp Tyr Ala Phe Leu His Gly Trp Gly Gln Ser Thr Ala Ala 225 230 235 240 Cys Leu Leu Asp Ala Gln Asp Ile Ser Leu Pro Val Leu Ala Ser Gly 245 250 255 Gly Val Arg His Pro Leu Asp Val Val Arg Ala Leu Ala Leu Gly Ala 260 265 270 Arg Ala Val Gly Ser Ser Ala Gly Phe Leu Arg Thr Leu Met Asp Asp 275 280 285 Gly Val Asp Ala Leu Ile Thr Lys Leu Thr Thr Trp Leu Asp Gln Leu 290 295 300 Ala Ala Leu Gln Thr Met Leu Gly Ala Arg Thr Pro Ala Asp Leu Thr 305 310 315 320 Arg Cys Asp Val Leu Leu His Gly Glu Leu Arg Asp Phe Cys Ala Asp 325 330 335 Arg Gly Ile Asp Thr Arg Arg Leu Ala Gln Arg Ser Ser Ser Ile Glu 340 345 350 Ala Leu Gln Thr Thr Gly Ser Thr Arg 355 360 <210> 61 <211> 364 <212> PRT <213> Streptomyces griseosporeus <400> 61 Met Ser Ser Ala Gln Arg Lys Asp Asp His Val Arg Leu Ala Thr Glu 1 5 10 15 Gln Gln Arg Ala His Ser Gly Arg Asn Gln Phe Asp Asp Val Ser Phe 20 25 30 Val His His Ala Leu Ala Gly Ile Asp Arg Pro Asp Val Arg Leu Ala 35 40 45 Thr Thr Phe Ala Gly Ile Thr Trp Arg Leu Pro Leu Tyr Ile Asn Ala 50 55 60 Met Thr Gly Gly Ser Ala Lys Thr Gly Ala Ile Asn Arg Asp Leu Ala 65 70 75 80 Val Ala Ala Arg Glu Thr Gly Ala Ala Ile Ala Ser Gly Ser Met His 85 90 95 Ala Phe Phe Arg Asp Pro Ser Cys Ala Asp Thr Phe Arg Val Leu Arg 100 105 110 Thr Glu Asn Pro Asp Gly Phe Val Met Ala Asn Val Asn Ala Thr Ala 115 120 125 Ser Val Asp Asn Ala Arg Arg Ala Val Asp Leu Ile Glu Ala Asn Ala 130 135 140 Leu Gln Ile His Leu Asn Thr Ala Gln Glu Thr Pro Met Pro Glu Gly 145 150 155 160 Asp Arg Ser Phe Gly Ser Trp Pro Ala Gln Ile Ala Lys Ile Thr Ala 165 170 175 Ala Val Asp Val Pro Val Ile Val Lys Glu Val Gly Asn Gly Leu Ser 180 185 190 Arg Gln Thr Leu Leu Ala Leu Pro Asp Leu Gly Val Arg Val Ala Asp 195 200 205 Val Ser Gly Arg Gly Gly Thr Asp Phe Ala Arg Ile Glu Asn Ser Arg 210 215 220 Arg Pro Leu Gly Asp Tyr Ala Phe Leu His Gly Trp Gly Gln Ser Thr 225 230 235 240 Pro Ala Cys Leu Leu Asp Ala Gln Asp Val Gly Phe Pro Leu Leu Ala 245 250 255 Ser Gly Gly Ile Arg Asn Pro Leu Asp Val Ala Arg Ala Leu Ala Leu 260 265 270 Gly Ala Gly Ala Val Gly Ser Ser Gly Val Phe Leu Arg Thr Leu Ile 275 280 285 Asp Gly Gly Val Ser Ala Leu Val Ala Gln Ile Ser Thr Trp Leu Asp 290 295 300 Gln Leu Ala Ala Leu Gln Thr Met Leu Gly Ala Arg Thr Pro Ala Asp 305 310 315 320 Leu Thr Arg Cys Asp Val Leu Ile His Gly Pro Leu Arg Ser Phe Cys 325 330 335 Thr Asp Arg Gly Ile Asp Ile Gly Arg Phe Ala Arg Arg Ser Ser Ser 340 345 350 Ala Asp Ile Arg Ser Glu Met Thr Gly Ser Thr Arg 355 360 <210> 62 <211> 368 <212> PRT <213> Sulfolobus solfataricus <400> 62 Met Pro Asp Ile Val Asn Arg Lys Val Glu His Val Glu Ile Ala Ala 1 5 10 15 Phe Glu Asn Val Asp Gly Leu Ser Ser Ser Thr Phe Leu Asn Asp Val 20 25 30 Ile Leu Val His Gln Gly Phe Pro Gly Ile Ser Phe Ser Glu Ile Asn 35 40 45 Thr Lys Thr Lys Phe Phe Arg Lys Glu Ile Ser Ala Pro Ile Met Val 50 55 60 Thr Gly Met Thr Gly Gly Arg Asn Glu Leu Gly Arg Ile Asn Arg Ile 65 70 75 80 Ile Ala Glu Val Ala Glu Lys Phe Gly Ile Pro Met Gly Val Gly Ser 85 90 95 Gln Arg Val Ala Ile Glu Lys Ala Glu Ala Arg Glu Ser Phe Thr Ile 100 105 110 Val Arg Lys Val Ala Pro Thr Ile Pro Ile Ile Ala Asn Leu Gly Met 115 120 125 Pro Gln Leu Val Lys Gly Tyr Gly Leu Lys Glu Phe Gln Asp Ala Ile 130 135 140 Gln Met Ile Glu Ala Asp Ala Ile Ala Val His Leu Asn Pro Ala Gln 145 150 155 160 Glu Val Phe Gln Pro Glu Gly Glu Pro Glu Tyr Gln Ile Tyr Ala Leu 165 170 175 Glu Arg Leu Arg Asp Ile Ser Lys Glu Leu Ser Val Pro Ile Ile Val 180 185 190 Lys Glu Ser Gly Asn Gly Ile Ser Met Glu Thr Ala Lys Leu Leu Tyr 195 200 205 Ser Tyr Gly Ile Lys Asn Phe Asp Thr Ser Gly Gln Gly Gly Thr Asn 210 215 220 Trp Ile Ala Ile Glu Met Ile Arg Asp Ile Arg Arg Gly Asn Trp Lys 225 230 235 240 Ala Glu Ser Ala Lys Asn Phe Leu Asp Trp Gly Val Pro Thr Ala Ala 245 250 255 Ser Ile Ile Glu Val Arg Tyr Ser Ile Pro Asp Ala Phe Leu Val Gly 260 265 270 Ser Gly Gly Ile Arg Ser Gly Leu Asp Ala Ala Lys Ala Ile Ala Leu 275 280 285 Gly Ala Asp Ile Ala Gly Met Ala Leu Pro Val Leu Lys Ser Ala Ile 290 295 300 Glu Gly Lys Glu Ser Leu Glu Gln Phe Phe Arg Lys Ile Ile Phe Glu 305 310 315 320 Leu Lys Ala Thr Met Met Leu Thr Gly Ser Lys Asn Val Glu Ala Leu 325 330 335 Lys Arg Ser Ser Ile Val Ile Leu Gly Lys Leu Lys Glu Trp Ala Glu 340 345 350 Tyr Arg Gly Ile Asn Leu Ser Ile Tyr Glu Lys Val Arg Lys Arg Glu 355 360 365 <210> 63 <211> 342 <212> PRT <213> Rickettsia prowazekii <400> 63 Met Pro Lys Glu Gln Asn Leu Asp Ile Glu Arg Lys Gln Glu His Ile 1 5 10 15 Glu Ile Asn Leu Lys Gln Asn Val Asn Ser Thr Leu Lys Ser Gly Leu 20 25 30 Glu Ser Ile Lys Phe Ile His Asn Ala Leu Pro Glu Ile Asn Tyr Asp 35 40 45 Ser Ile Asp Thr Thr Thr Thr Phe Leu Gly Lys Asp Met Lys Ala Pro 50 55 60 Ile Leu Ile Ser Ser Met Thr Gly Gly Thr Ala Arg Ala Arg Asp Ile 65 70 75 80 Asn Tyr Arg Leu Ala Gln Ala Ala Gln Lys Ser Gly Ile Ala Met Gly 85 90 95 Leu Gly Ser Met Arg Ile Leu Leu Thr Lys Pro Asp Thr Ile Lys Thr 100 105 110 Phe Thr Val Arg His Val Ala Pro Asp Ile Pro Leu Leu Ala Asn Ile 115 120 125 Gly Ala Val Gln Leu Asn Tyr Gly Val Thr Pro Lys Glu Cys Gln Tyr 130 135 140 Leu Ile Asp Thr Ile Lys Ala Asp Ala Leu Ile Leu His Leu Asn Val 145 150 155 160 Leu His Glu Leu Thr Gln Pro Glu Gly Asn Lys Asn Trp Glu Asn Leu 165 170 175 Leu Pro Lys Ile Lys Glu Val Ile Asn Tyr Leu Ser Val Pro Val Ile 180 185 190 Val Lys Glu Val Gly Tyr Gly Leu Ser Lys Gln Val Ala Lys Lys Leu 195 200 205 Ile Lys Ala Gly Val Lys Val Leu Asp Ile Ala Gly Ser Gly Gly Thr 210 215 220 Ser Trp Ser Gln Val Glu Ala Tyr Arg Ala Lys Asn Ser Met Gln Asn 225 230 235 240 Arg Ile Ala Ser Ser Phe Ile Asn Trp Gly Ile Thr Thr Leu Asp Ser 245 250 255 Leu Lys Met Leu Gln Glu Ile Ser Lys Asp Ile Thr Ile Ile Ala Ser 260 265 270 Gly Gly Leu Gln Ser Gly Ile Asp Gly Ala Lys Ala Ile Arg Met Gly 275 280 285 Ala Asn Ile Phe Gly Leu Ala Gly Lys Leu Leu Lys Ala Ala Asp Ile 290 295 300 Ala Glu Ser Leu Val Leu Glu Glu Ile Gln Val Ile Ile Glu Gln Leu 305 310 315 320 Lys Ile Thr Met Leu Cys Thr Gly Ser Cys Thr Leu Lys Asp Leu Ala 325 330 335 Lys Ala Glu Ile Met Trp 340 <210> 64 <211> 286 <212> PRT <213> Deinococcus radiodurans <400> 64 Met Arg Leu Asp Thr Val Phe Leu Gly Arg Arg Leu Lys Ala Pro Val 1 5 10 15 Leu Ile Gly Ala Met Thr Gly Gly Ala Glu Lys Ala Gly Val Ile Asn 20 25 30 Arg Asn Leu Ala Thr Ala Ala Arg Asn Leu Gly Leu Gly Met Met Leu 35 40 45 Gly Ser Gln Arg Val Met Leu Glu His Pro Asp Ala Trp Glu Ser Phe 50 55 60 Asn Val Arg Glu Val Ala Pro Glu Ile Leu Leu Ile Gly Asn Leu Gly 65 70 75 80 Ala Ala Gln Phe Met Leu Gly Tyr Gly Ala Glu Gln Ala Arg Arg Ala 85 90 95 Val Asp Glu Val Met Ala Asp Ala Leu Ala Ile His Leu Asn Pro Leu 100 105 110 Gln Glu Ala Leu Gln Arg Gly Gly Asp Thr Arg Trp Gln Gly Val Thr 115 120 125 Tyr Arg Leu Lys Gln Val Ala Arg Glu Leu Asp Phe Pro Val Ile Ile 130 135 140 Lys Glu Val Gly His Gly Leu Asp Ala Ala Thr Leu Arg Ala Leu Ala 145 150 155 160 Asp Gly Pro Phe Ala Ala Tyr Asp Val Ala Gly Ala Gly Gly Thr Ser 165 170 175 Trp Ala Arg Val Glu Gln Leu Val Ala His Gly Gln Val His Ser Pro 180 185 190 Asp Leu Cys Glu Leu Gly Val Pro Thr Ala Gln Ala Leu Arg Gln Ala 195 200 205 Arg Lys Thr Leu Pro Gly Ala Gln Leu Ile Ala Ser Gly Gly Ile Arg 210 215 220 Ser Gly Leu Asp Ala Ala Arg Ala Leu Ser Leu Gly Ala Glu Val Val 225 230 235 240 Ala Val Ala Arg Pro Leu Leu Glu Pro Ala Leu Asp Ser Ser Glu Ala 245 250 255 Ala Glu Ala Trp Leu Arg Asn Phe Ile Gln Glu Leu Arg Val Ala Leu 260 265 270 Phe Val Gly Gly Tyr Arg Asp Val Arg Glu Val Arg Gly Gly 275 280 285 <210> 65 <211> 361 <212> PRT <213> Aeropyrum pernix <400> 65 Met Ile Val Ser Ser Lys Val Glu Ser Arg Glu Ser Thr Leu Leu Glu 1 5 10 15 Tyr Val Arg Ile Val His Asn Pro Thr Pro Glu Val Asn Leu Gly Asp 20 25 30 Val Ser Leu Glu Ile Asp Phe Cys Gly Gly Arg Leu Arg Ala Pro Leu 35 40 45 Val Ile Thr Gly Met Thr Gly Gly His Pro Asp Val Glu Trp Ile Asn 50 55 60 Arg Glu Leu Ala Ser Val Ala Glu Glu Leu Gly Ile Ala Ile Gly Val 65 70 75 80 Gly Ser Gln Arg Ala Ala Ile Glu Asp Pro Ser Leu Ala Arg Thr Phe 85 90 95 Arg Ala Ala Arg Glu Ala Ala Pro Asn Ala Phe Leu Ile Ala Asn Leu 100 105 110 Gly Ala Pro Gln Leu Ser Leu Gly Tyr Ser Val Arg Glu Val Arg Met 115 120 125 Ala Val Glu Met Ile Asp Ala Asp Ala Ile Ala Ile His Leu Asn Pro 130 135 140 Gly Gln Glu Ala Tyr Gln Pro Glu Gly Asp Pro Phe Tyr Arg Gly Val 145 150 155 160 Val Gly Lys Ile Ala Glu Ala Ala Glu Ala Ala Gly Val Pro Val Ile 165 170 175 Val Lys Glu Thr Gly Asn Gly Leu Ser Arg Glu Ala Val Ala Gln Leu 180 185 190 Arg Ala Leu Gly Val Arg Cys Phe Asp Val Ala Gly Leu Gly Gly Thr 195 200 205 Asn Trp Ile Lys Ile Glu Val Leu Arg Gly Arg Lys Ala Gly Ser Pro 210 215 220 Leu Glu Ala Gly Pro Leu Gln Asp Phe Trp Gly Asn Pro Thr Ala Ala 225 230 235 240 Ala Leu Met Glu Ala Arg Thr Ala Ala Pro Asp Ala Tyr Ile Ile Ala 245 250 255 Ser Gly Gly Val Arg Asn Gly Leu Asp Ala Ala Arg Ala Ile Ala Leu 260 265 270 Gly Ala Asp Ala Ala Gly Val Ala Leu Pro Ala Ile Arg Ser Leu Leu 275 280 285 Ser Gly Gly Arg Gln Ala Thr Leu Lys Leu Leu Lys Ala Ile Glu Tyr 290 295 300 Gln Leu Lys Thr Ala Val Tyr Met Val Gly Glu Thr Arg Val Arg Gly 305 310 315 320 Leu Trp Arg Ala Pro Ile Val Val Trp Gly Arg Leu Ala Glu Glu Ala 325 330 335 Glu Ala Arg Gly Ile Asp Pro Arg Trp Tyr Thr Asn Thr Leu Arg Leu 340 345 350 Glu Ala Leu Val Tyr Lys Asp Val Lys 355 360 <210> 66 <211> 379 <212> PRT <213> Halobacterium sp. <400> 66 Met Gly Glu Ser Arg Tyr Asn Ser Ile Val Phe Pro Ser Leu Val Gln 1 5 10 15 Thr Arg Leu Met Thr Ala Gln Asp Ser Thr Gln Thr Glu Asp Arg Lys 20 25 30 Asp Asp His Leu Gln Ile Val Gln Glu Arg Asp Val Glu Thr Thr Gly 35 40 45 Thr Gly Phe Asp Asp Val His Leu Val His Asn Ala Leu Pro Glu Leu 50 55 60 Asp Tyr Asp Ala Ile Asp Pro Ser Ile Asp Phe Leu Gly His Asp Leu 65 70 75 80 Ser Ala Pro Ile Phe Ile Glu Ser Met Thr Gly Gly His His Asn Thr 85 90 95 Thr Glu Ile Asn Arg Ala Leu Ala Arg Ala Ala Ser Glu Thr Gly Ile 100 105 110 Ala Met Gly Leu Gly Ser Gln Arg Ala Gly Leu Glu Leu Asp Asp Glu 115 120 125 Arg Val Leu Glu Ser Tyr Thr Val Val Arg Asp Ala Ala Pro Asp Ala 130 135 140 Phe Ile Tyr Gly Asn Leu Gly Ala Ala Gln Leu Arg Glu Tyr Asp Ile 145 150 155 160 Glu Met Val Glu Gln Ala Val Glu Met Ile Asp Ala Asp Ala Leu Ala 165 170 175 Val His Leu Asn Phe Leu Gln Glu Ala Thr Gln Pro Glu Gly Asp Val 180 185 190 Asp Gly Arg Asn Cys Val Ala Ala Ile Glu Arg Val Ser Glu Ala Leu 195 200 205 Ser Val Pro Ile Ile Val Lys Glu Thr Gly Asn Gly Ile Ser Gly Glu 210 215 220 Thr Ala Arg Glu Leu Thr Ala Ala Gly Val Asp Ala Leu Asp Val Ala 225 230 235 240 Gly Lys Gly Gly Thr Thr Trp Ser Gly Ile Glu Ala Tyr Arg Ala Ala 245 250 255 Ala Ala Asn Ala Pro Arg Gln Lys Gln Ile Gly Thr Leu Phe Arg Glu 260 265 270 Trp Gly Ile Pro Thr Ala Ala Ser Thr Ile Glu Cys Val Ala Glu His 275 280 285 Asp Cys Val Ile Ala Ser Gly Gly Val Arg Thr Gly Leu Asp Val Ala 290 295 300 Lys Ala Ile Ala Leu Gly Ala Arg Ala Gly Gly Leu Ala Lys Pro Phe 305 310 315 320 Leu Lys Pro Ala Thr Asp Gly Pro Asp Ala Val Ile Glu Arg Val Gly 325 330 335 Asp Leu Ile Ala Glu Leu Arg Thr Ala Met Phe Val Thr Gly Ser Gly 340 345 350 Ser Ile Asp Glu Leu Gln Gln Val Glu Tyr Val Leu His Gly Lys Thr 355 360 365 Arg Glu Tyr Val Glu Gln Arg Thr Ser Ser Glu 370 375 <210> 67 <211> 317 <212> PRT <213> Archaeoglobus fulgidus <400> 67 Met Met Leu Ile His Lys Ala Leu Pro Glu Val Asp Tyr Trp Lys Ile 1 5 10 15 Asp Thr Glu Ile Glu Phe Phe Gly Lys Lys Leu Ser Phe Pro Leu Leu 20 25 30 Ile Ala Ser Met Thr Gly Gly His Pro Glu Thr Lys Glu Ile Asn Ala 35 40 45 Arg Leu Gly Glu Ala Val Glu Glu Ala Gly Ile Gly Met Gly Val Gly 50 55 60 Ser Gln Arg Ala Ala Ile Glu Asp Glu Ser Leu Ala Asp Ser Phe Thr 65 70 75 80 Val Val Arg Glu Lys Ala Pro Asn Ala Phe Val Tyr Ala Asn Ile Gly 85 90 95 Met Pro Gln Val Ile Glu Arg Gly Val Glu Ile Val Asp Arg Ala Val 100 105 110 Glu Met Ile Asp Ala Asp Ala Val Ala Ile His Leu Asn Tyr Leu Gln 115 120 125 Glu Ala Ile Gln Pro Glu Gly Asp Leu Asn Ala Glu Lys Gly Leu Glu 130 135 140 Val Leu Glu Glu Val Cys Arg Ser Val Lys Val Pro Val Ile Ala Lys 145 150 155 160 Glu Thr Gly Ala Gly Ile Ser Arg Glu Val Ala Val Met Leu Lys Arg 165 170 175 Ala Gly Val Ser Ala Ile Asp Val Gly Gly Lys Gly Gly Thr Thr Phe 180 185 190 Ser Gly Val Glu Val Tyr Arg Val Asn Asp Glu Val Ser Lys Ser Val 195 200 205 Gly Ile Asp Phe Trp Asp Trp Gly Leu Pro Thr Ala Phe Ser Ile Val 210 215 220 Asp Cys Arg Gly Ile Leu Pro Val Ile Ala Thr Gly Gly Leu Arg Ser 225 230 235 240 Gly Leu Asp Val Ala Lys Ser Ile Ala Ile Gly Ala Glu Leu Gly Ser 245 250 255 Ala Ala Leu Pro Phe Leu Arg Ala Ala Val Glu Ser Ala Glu Lys Val 260 265 270 Arg Glu Glu Ile Glu Tyr Phe Arg Arg Gly Leu Lys Thr Ala Met Phe 275 280 285 Leu Thr Gly Cys Lys Asn Val Glu Glu Leu Lys Gly Leu Lys Val Phe 290 295 300 Val Ser Gly Arg Leu Lys Glu Trp Ile Asp Phe Arg Gly 305 310 315 <210> 68 <211> 370 <212> PRT <213> Pyrococcus abyssi <400> 68 Met Glu Glu Gln Thr Ile Leu Arg Lys Phe Glu His Ile Lys His Cys 1 5 10 15 Leu Thr Lys Asn Val Glu Ala His Val Thr Asn Gly Phe Glu Asp Val 20 25 30 His Leu Ile His Lys Ser Leu Pro Glu Ile Asp Lys Asp Glu Ile Asp 35 40 45 Leu Ser Val Lys Phe Leu Gly Arg Lys Phe Asp Tyr Pro Ile Met Ile 50 55 60 Thr Gly Met Thr Gly Gly Thr Arg Lys Gly Glu Ile Ala Trp Arg Ile 65 70 75 80 Asn Arg Thr Leu Ala Gln Ala Ala Gln Glu Leu Asn Ile Pro Leu Gly 85 90 95 Leu Gly Ser Gln Arg Ala Met Ile Glu Lys Pro Glu Thr Trp Glu Ser 100 105 110 Tyr Tyr Val Arg Asp Val Ala Pro Asp Val Phe Leu Val Gly Asn Leu 115 120 125 Gly Ala Pro Gln Phe Gly Arg Asn Ala Lys Lys Arg Tyr Ser Val Asp 130 135 140 Glu Val Leu Tyr Ala Ile Glu Lys Ile Glu Ala Asp Ala Ile Ala Ile 145 150 155 160 His Met Asn Pro Leu Gln Glu Ser Ile Gln Pro Glu Gly Asp Thr Thr 165 170 175 Phe Ser Gly Val Leu Glu Ala Leu Ala Glu Ile Thr Ser Thr Ile Asp 180 185 190 Tyr Pro Val Ile Ala Lys Glu Thr Gly Ala Gly Val Ser Lys Glu Val 195 200 205 Ala Val Glu Leu Glu Ala Val Gly Val Asp Ala Ile Asp Ile Ser Gly 210 215 220 Leu Gly Gly Thr Ser Trp Ser Ala Val Glu Tyr Tyr Arg Thr Lys Asp 225 230 235 240 Gly Glu Lys Arg Asn Leu Ala Leu Lys Phe Trp Asp Trp Gly Ile Lys 245 250 255 Thr Ala Ile Ser Leu Ala Glu Val Arg Trp Ala Thr Asn Leu Pro Ile 260 265 270 Ile Ala Ser Gly Gly Met Arg Asp Gly Ile Thr Met Ala Lys Ala Leu 275 280 285 Ala Met Gly Ala Ser Met Val Gly Ile Ala Leu Pro Val Leu Arg Pro 290 295 300 Ala Ala Lys Gly Asp Val Glu Gly Val Ile Arg Ile Ile Lys Gly Tyr 305 310 315 320 Ala Glu Glu Ile Arg Asn Val Met Phe Leu Val Gly Ala Arg Asn Ile 325 330 335 Lys Glu Leu Arg Lys Val Pro Leu Val Ile Thr Gly Phe Val Arg Glu 340 345 350 Trp Leu Leu Gln Arg Ile Asp Leu Asn Ser Tyr Leu Arg Ala Arg Phe 355 360 365 Lys Met 370 <210> 69 <211> 371 <212> PRT <213> Pyrococcus horikoshii <400> 69 Met Lys Glu Glu Leu Thr Ile Leu Arg Lys Phe Glu His Ile Glu His 1 5 10 15 Cys Leu Lys Arg Asn Val Glu Ala His Val Ser Asn Gly Phe Glu Asp 20 25 30 Val Tyr Phe Val His Lys Ser Leu Pro Glu Ile Asp Lys Asp Glu Ile 35 40 45 Asp Leu Thr Val Glu Phe Leu Gly Arg Lys Phe Asp Tyr Pro Ile Met 50 55 60 Ile Thr Gly Met Thr Gly Gly Thr Arg Arg Glu Glu Ile Ala Gly Lys 65 70 75 80 Ile Asn Arg Thr Leu Ala Met Ala Ala Glu Glu Leu Asn Ile Pro Phe 85 90 95 Gly Val Gly Ser Gln Arg Ala Met Ile Glu Lys Pro Glu Thr Trp Glu 100 105 110 Ser Tyr Tyr Val Arg Asp Val Ala Pro Asp Ile Phe Leu Ile Gly Asn 115 120 125 Leu Gly Ala Pro Gln Phe Gly Lys Asn Ala Lys Lys Arg Tyr Ser Val 130 135 140 Lys Glu Val Leu Tyr Ala Ile Glu Lys Ile Glu Ala Asp Ala Ile Ala 145 150 155 160 Ile His Met Asn Pro Leu Gln Glu Ser Val Gln Pro Glu Gly Asp Thr 165 170 175 Thr Tyr Ala Gly Val Leu Glu Ala Leu Ala Glu Ile Lys Ser Ser Ile 180 185 190 Asn Tyr Pro Val Ile Ala Lys Glu Thr Gly Ala Gly Val Ser Lys Glu 195 200 205 Val Ala Ile Glu Leu Glu Ser Val Gly Ile Asp Ala Ile Asp Ile Ser 210 215 220 Gly Leu Gly Gly Thr Ser Trp Ser Ala Val Glu Tyr Tyr Arg Ala Lys 225 230 235 240 Asp Ser Glu Lys Arg Lys Ile Ala Leu Lys Phe Trp Asp Trp Gly Ile 245 250 255 Lys Thr Ala Ile Ser Leu Ala Glu Val Arg Trp Ala Thr Asn Leu Pro 260 265 270 Ile Ile Ala Ser Gly Gly Met Arg Asp Gly Val Met Met Ala Lys Ala 275 280 285 Leu Ala Met Gly Ala Ser Leu Val Gly Ile Ala Leu Pro Val Leu Arg 290 295 300 Pro Ala Ala Arg Gly Asp Val Glu Gly Val Val Arg Ile Ile Arg Gly 305 310 315 320 Tyr Ala Glu Glu Ile Lys Asn Val Met Phe Leu Val Gly Ala Arg Asn 325 330 335 Ile Arg Glu Leu Arg Arg Val Pro Leu Val Ile Thr Gly Phe Val Arg 340 345 350 Glu Trp Leu Leu Gln Arg Ile Asp Leu Asn Ser Tyr Leu Arg Ser Arg 355 360 365 Phe Lys His 370 <210> 70 <211> 349 <212> PRT <213> Methanobacterium thermoautotrophicum <400> 70 Met Ile Ser Asp Arg Lys Leu Glu His Leu Ile Leu Cys Ala Ser Cys 1 5 10 15 Asp Val Glu Tyr Arg Lys Lys Thr Gly Phe Glu Asp Ile Glu Ile Val 20 25 30 His Arg Ala Ile Pro Glu Ile Asn Lys Glu Lys Ile Asp Ile Ser Leu 35 40 45 Asp Phe Leu Gly Arg Glu Leu Ser Ser Pro Val Met Ile Ser Ala Ile 50 55 60 Thr Gly Gly His Pro Ala Ser Met Lys Ile Asn Arg Glu Leu Ala Arg 65 70 75 80 Ala Ala Glu Lys Leu Gly Ile Ala Leu Gly Leu Gly Ser Gln Arg Ala 85 90 95 Gly Val Glu His Pro Glu Leu Glu Gly Thr Tyr Thr Ile Ala Arg Glu 100 105 110 Glu Ala Pro Ser Ala Met Leu Ile Gly Asn Ile Gly Ser Ser His Ile 115 120 125 Glu Tyr Ala Glu Arg Ala Val Glu Met Ile Asp Ala Asp Ala Leu Ala 130 135 140 Val His Leu Asn Pro Leu Gln Glu Ser Ile Gln Pro Gly Gly Asp Val 145 150 155 160 Asp Ser Ser Gly Ala Leu Glu Ser Ile Ser Ala Ile Val Glu Ser Val 165 170 175 Asp Val Pro Val Met Val Lys Glu Thr Gly Ala Gly Ile Cys Ser Glu 180 185 190 Asp Ala Ile Glu Leu Glu Ser Cys Gly Val Ser Ala Ile Asp Val Ala 195 200 205 Gly Ala Gly Gly Thr Ser Trp Ala Ala Val Glu Thr Tyr Arg Ala Asp 210 215 220 Asp Arg Tyr Leu Gly Glu Leu Phe Trp Asp Trp Gly Ile Pro Thr Ala 225 230 235 240 Ala Ser Thr Val Glu Val Val Glu Ser Val Ser Ile Pro Val Ile Ala 245 250 255 Ser Gly Gly Ile Arg Ser Gly Ile Asp Ala Ala Lys Ala Ile Ser Leu 260 265 270 Gly Ala Glu Met Val Gly Ile Ala Leu Pro Val Leu Glu Ala Ala Gly 275 280 285 His Gly Tyr Arg Glu Val Ile Lys Val Ile Glu Gly Phe Asn Glu Ala 290 295 300 Leu Arg Thr Ala Met Tyr Leu Ala Gly Ala Glu Thr Leu Asp Asp Leu 305 310 315 320 Lys Lys Ser Pro Val Ile Ile Thr Gly His Thr Gly Glu Trp Leu Asn 325 330 335 Gln Arg Gly Phe Glu Thr Lys Lys Tyr Ala Arg Arg Ser 340 345 <210> 71 <211> 359 <212> PRT <213> Methanococcus jannaschii <400> 71 Met Val Asn Asn Arg Asn Glu Ile Glu Val Arg Lys Leu Glu His Ile 1 5 10 15 Phe Leu Cys Ser Tyr Cys Asn Val Glu Tyr Glu Lys Thr Thr Leu Leu 20 25 30 Glu Asp Ile Glu Leu Ile His Lys Gly Thr Cys Gly Ile Asn Phe Asn 35 40 45 Asp Ile Glu Thr Glu Ile Glu Leu Phe Gly Lys Lys Leu Ser Ala Pro 50 55 60 Ile Ile Val Ser Gly Met Thr Gly Gly His Ser Lys Ala Lys Glu Ile 65 70 75 80 Asn Lys Asn Ile Ala Lys Ala Val Glu Glu Leu Gly Leu Gly Met Gly 85 90 95 Val Gly Ser Gln Arg Ala Ala Ile Val Asn Asp Glu Leu Ile Asp Thr 100 105 110 Tyr Ser Ile Val Arg Asp Tyr Thr Asn Asn Leu Val Ile Gly Asn Leu 115 120 125 Gly Ala Val Asn Phe Ile Val Asp Asp Trp Asp Glu Glu Ile Ile Asp 130 135 140 Lys Ala Ile Glu Met Ile Asp Ala Asp Ala Ile Ala Ile His Phe Asn 145 150 155 160 Pro Leu Gln Glu Ile Ile Gln Pro Glu Gly Asp Leu Asn Phe Lys Asn 165 170 175 Leu Tyr Lys Leu Lys Glu Ile Ile Ser Asn Tyr Lys Lys Ser Tyr Lys 180 185 190 Asn Ile Pro Phe Ile Ala Lys Gln Val Gly Glu Gly Phe Ser Lys Glu 195 200 205 Asp Ala Leu Ile Leu Lys Asp Ile Gly Phe Asp Ala Ile Asp Val Gln 210 215 220 Gly Ser Gly Gly Thr Ser Trp Ala Lys Val Glu Ile Tyr Arg Val Lys 225 230 235 240 Glu Glu Glu Ile Lys Arg Leu Ala Glu Lys Phe Ala Asn Trp Gly Ile 245 250 255 Pro Thr Ala Ala Ser Ile Phe Glu Val Lys Ser Val Tyr Asp Gly Ile 260 265 270 Val Ile Gly Ser Gly Gly Ile Arg Gly Gly Leu Asp Ile Ala Lys Cys 275 280 285 Ile Ala Ile Gly Cys Asp Cys Cys Ser Val Ala Leu Pro Ile Leu Lys 290 295 300 Ala Ser Leu Lys Gly Trp Glu Glu Val Val Lys Val Leu Glu Ser Tyr 305 310 315 320 Ile Lys Glu Leu Lys Ile Ala Met Phe Leu Val Gly Ala Glu Asn Ile 325 330 335 Glu Glu Leu Lys Lys Thr Ser Tyr Ile Val Lys Gly Thr Leu Lys Glu 340 345 350 Trp Ile Ser Gln Arg Leu Lys 355 <210> 72 <211> 348 <212> PRT <213> Thermoplasma acidophilum <400> 72 Met Ile Gly Lys Arg Lys Glu Glu His Ile Arg Ile Ala Glu Asn Glu 1 5 10 15 Asp Val Ser Ser Phe His Asn Phe Trp Asp Asp Ile Ser Leu Met His 20 25 30 Glu Ala Asp Pro Glu Val Asn Tyr Asp Glu Ile Asp Thr Ser Val Asp 35 40 45 Phe Leu Gly Lys Lys Leu Lys Phe Pro Met Ile Ile Ser Ser Met Thr 50 55 60 Gly Gly Ala Glu Ile Ala Lys Asn Ile Asn Arg Asn Leu Ala Val Ala 65 70 75 80 Ala Glu Arg Phe Gly Ile Gly Met Gly Val Gly Ser Met Arg Ala Ala 85 90 95 Ile Val Asp Arg Ser Ile Glu Asp Thr Tyr Ser Val Ile Asn Glu Ser 100 105 110 His Val Pro Leu Lys Ile Ala Asn Ile Gly Ala Pro Gln Leu Val Arg 115 120 125 Gln Asp Lys Asp Ala Val Ser Asn Arg Asp Ile Ala Tyr Ile Tyr Asp 130 135 140 Leu Ile Lys Ala Asp Phe Leu Ala Val His Phe Asn Phe Leu Gln Glu 145 150 155 160 Met Val Gln Pro Glu Gly Asp Arg Asn Ser Lys Gly Val Ile Asp Arg 165 170 175 Ile Lys Asp Leu Ser Gly Ser Phe Asn Ile Ile Ala Lys Glu Thr Gly 180 185 190 Ser Gly Phe Ser Arg Arg Thr Ala Glu Arg Leu Ile Asp Ala Gly Val 195 200 205 Lys Ala Ile Glu Val Ser Gly Val Ser Gly Thr Thr Phe Ala Ala Val 210 215 220 Glu Tyr Tyr Arg Ala Arg Lys Glu Asn Asn Leu Glu Lys Met Arg Ile 225 230 235 240 Gly Glu Thr Phe Trp Asn Trp Gly Ile Pro Ser Pro Ala Ser Val Tyr 245 250 255 Tyr Cys Ser Asp Leu Ala Pro Val Ile Gly Ser Gly Gly Leu Arg Asn 260 265 270 Gly Leu Asp Leu Ala Lys Ala Ile Ala Met Gly Ala Thr Ala Gly Gly 275 280 285 Phe Ala Arg Ser Leu Leu Lys Asp Ala Asp Thr Asp Pro Glu Met Leu 290 295 300 Met Lys Asn Ile Glu Leu Ile Gln Arg Glu Phe Arg Val Ala Leu Phe 305 310 315 320 Leu Thr Gly Asn Lys Asn Val Tyr Glu Leu Lys Phe Thr Lys Lys Val 325 330 335 Ile Val Asp Pro Leu Arg Ser Trp Leu Glu Ala Lys 340 345 <210> 73 <211> 357 <212> PRT <213> Leishmania major <400> 73 Met Ser Ser Arg Asp Cys Thr Val Asp Arg Glu Ala Ala Val Gln Lys 1 5 10 15 Arg Lys Lys Asp His Ile Asp Ile Cys Leu His Gln Asp Val Glu Pro 20 25 30 His Lys Arg Arg Thr Ser Ile Trp Asn Lys Tyr Thr Leu Pro Tyr Lys 35 40 45 Ala Leu Pro Glu Val Asp Leu Gln Lys Ile Asp Thr Ser Cys Glu Phe 50 55 60 Met Gly Lys Arg Ile Ser Phe Pro Phe Phe Ile Ser Ser Met Thr Gly 65 70 75 80 Gly Glu Ala His Gly Arg Val Ile Asn Glu Asn Leu Ala Lys Ala Cys 85 90 95 Glu Ala Glu Lys Ile Pro Phe Gly Leu Gly Ser Met Arg Ile Ile Asn 100 105 110 Arg Tyr Ala Ser Ala Val His Thr Phe Asn Val Lys Glu Phe Cys Pro 115 120 125 Ser Val Pro Met Leu Ala Asn Ile Gly Leu Val Gln Leu Asn Tyr Gly 130 135 140 Phe Gly Pro Lys Glu Val Asn Asn Leu Val Asn Ser Val Arg Ala Asp 145 150 155 160 Gly Leu Cys Ile His Leu Asn His Thr Gln Glu Val Cys Gln Pro Glu 165 170 175 Gly Asp Thr Asn Phe Glu Gly Leu Ile Glu Lys Leu Arg Gln Leu Leu 180 185 190 Pro His Ile Lys Val Pro Val Leu Val Lys Gly Val Gly His Gly Ile 195 200 205 Asp Tyr Glu Ser Met Val Ala Ile Lys Ala Ser Gly Val Lys Tyr Val 210 215 220 Asp Val Ser Gly Cys Gly Gly Thr Ser Trp Ala Trp Ile Glu Gly Arg 225 230 235 240 Arg Gln Pro Tyr Lys Ala Glu Glu Glu Asn Ile Gly Tyr Leu Leu Arg 245 250 255 Asp Ile Gly Val Pro Thr Asp Val Cys Leu Arg Glu Ser Ala Pro Leu 260 265 270 Thr Val Asn Gly Asp Leu His Leu Ile Ala Gly Gly Gly Ile Arg Asn 275 280 285 Gly Met Asp Val Ala Lys Ala Leu Met Met Gly Ala Glu Tyr Ala Thr 290 295 300 Ala Ala Met Pro Phe Leu Ala Ala Ala Leu Glu Ser Ser Glu Ala Val 305 310 315 320 Arg Ala Val Ile Gln Arg Met Arg Gln Glu Leu Arg Val Ser Met Phe 325 330 335 Thr Cys Gly Ala Arg Asn Ile Glu Glu Leu Arg Arg Met Lys Val Ile 340 345 350 Glu Leu Gly His Leu 355 <210> 74 <211> 398 <212> PRT <213> Streptococcus pneumoniae <400> 74 Met Asn Asp Lys Thr Glu Val Asn Met Thr Ile Gly Ile Asp Lys Ile 1 5 10 15 Gly Phe Ala Thr Ser Gln Tyr Val Leu Lys Leu Gln Asp Leu Ala Glu 20 25 30 Ala Arg Gly Ile Asp Pro Glu Lys Leu Ser Lys Gly Leu Leu Leu Lys 35 40 45 Glu Leu Ser Ile Ala Pro Leu Thr Glu Asp Ile Val Thr Leu Ala Ala 50 55 60 Ser Ala Ser Asp Ser Ile Leu Thr Glu Gln Glu Arg Gln Glu Val Asp 65 70 75 80 Met Val Ile Val Ala Thr Glu Ser Gly Ile Asp Gln Ser Lys Ala Ala 85 90 95 Ala Val Phe Val His Gly Leu Leu Gly Ile Gln Pro Phe Ala Arg Ser 100 105 110 Phe Glu Ile Lys Glu Ala Cys Tyr Gly Ala Thr Ala Ala Leu His Tyr 115 120 125 Ala Lys Leu His Val Glu Asn Ser Pro Glu Ser Lys Val Leu Val Ile 130 135 140 Ala Ser Asp Ile Ala Lys Tyr Gly Ile Glu Thr Pro Gly Glu Pro Thr 145 150 155 160 Gln Gly Ala Gly Ser Val Ala Met Leu Ile Thr Gln Asn Pro Arg Met 165 170 175 Met Ala Phe Asn Asn Asp Asn Val Ala Gln Thr Arg Asp Ile Met Asp 180 185 190 Phe Trp Arg Pro Asn Tyr Ser Thr Thr Pro Tyr Val Asn Gly Val Tyr 195 200 205 Ser Thr Gln Gln Tyr Leu Asp Ser Leu Lys Thr Thr Trp Leu Glu Tyr 210 215 220 Gln Lys Arg Tyr Gln Leu Thr Leu Asp Asp Phe Ala Ala Val Cys Phe 225 230 235 240 His Leu Pro Tyr Pro Lys Leu Ala Leu Lys Gly Leu Lys Lys Ile Met 245 250 255 Asp Lys Asn Leu Pro Gln Glu Lys Lys Asp Leu Leu Gln Lys His Phe 260 265 270 Asp Gln Ser Ile Leu Tyr Ser Gln Lys Val Gly Asn Ile Tyr Thr Gly 275 280 285 Ser Leu Phe Leu Gly Leu Leu Ser Leu Leu Glu Asn Thr Asp Ser Leu 290 295 300 Lys Ala Gly Asp Lys Ile Ala Leu Tyr Ser Tyr Gly Ser Gly Ala Val 305 310 315 320 Ala Glu Phe Phe Ser Gly Glu Leu Val Glu Gly Tyr Glu Ala Tyr Leu 325 330 335 Asp Lys Asp Arg Leu Asn Lys Leu Asn Gln Arg Thr Ala Leu Ser Val 340 345 350 Ala Asp Tyr Glu Lys Val Phe Phe Glu Glu Val Asn Leu Asp Glu Thr 355 360 365 Asn Ser Ala Gln Phe Ala Gly Tyr Glu Asn Gln Asp Phe Ala Leu Val 370 375 380 Glu Ile Leu Asp His Gln Arg Arg Tyr Ser Lys Val Glu Lys 385 390 395 <210> 75 <211> 391 <212> PRT <213> Streptococcus pyogenes <400> 75 Met Thr Ile Gly Ile Asp Lys Ile Gly Phe Ala Thr Ser Gln Tyr Val 1 5 10 15 Leu Lys Leu Glu Asp Leu Ala Leu Ala Arg Gln Val Asp Pro Ala Lys 20 25 30 Phe Ser Gln Gly Leu Leu Ile Glu Ser Phe Ser Val Ala Pro Ile Thr 35 40 45 Glu Asp Ile Ile Thr Leu Ala Ala Ser Ala Ala Asp Gln Ile Leu Thr 50 55 60 Asp Glu Asp Arg Ala Lys Ile Asp Met Val Ile Leu Ala Thr Glu Ser 65 70 75 80 Ser Thr Asp Gln Ser Lys Ala Ser Ala Ile Tyr Val His His Leu Val 85 90 95 Gly Ile Gln Pro Phe Ala Arg Ser Phe Glu Val Lys Gln Ala Cys Tyr 100 105 110 Ser Ala Thr Ala Ala Leu Asp Tyr Ala Lys Leu His Val Ala Ser Lys 115 120 125 Pro Asp Ser Arg Val Leu Val Ile Ala Ser Asp Ile Ala Arg Tyr Gly 130 135 140 Val Gly Ser Pro Gly Glu Ser Thr Gln Gly Ser Gly Ser Ile Ala Leu 145 150 155 160 Leu Val Thr Ala Asp Pro Arg Ile Leu Ala Leu Asn Glu Asp Asn Val 165 170 175 Ala Gln Thr Arg Asp Ile Met Asp Phe Trp Arg Pro Asn Tyr Ser Phe 180 185 190 Thr Pro Tyr Val Asp Gly Ile Tyr Ser Thr Lys Gln Tyr Leu Asn Cys 195 200 205 Leu Glu Thr Thr Trp Gln Ala Tyr Gln Lys Arg Glu Asn Leu Gln Leu 210 215 220 Ser Asp Phe Ala Ala Val Cys Phe His Ile Pro Phe Pro Lys Leu Ala 225 230 235 240 Leu Lys Gly Leu Asn Asn Ile Met Asp Asn Thr Val Pro Pro Glu His 245 250 255 Arg Glu Lys Leu Ile Glu Ala Phe Gln Ala Ser Ile Thr Tyr Ser Lys 260 265 270 Gln Ile Gly Asn Ile Tyr Thr Gly Ser Leu Tyr Leu Gly Leu Leu Ser 275 280 285 Leu Leu Glu Asn Ser Lys Val Leu Gln Ser Gly Asp Lys Ile Gly Phe 290 295 300 Phe Ser Tyr Gly Ser Gly Ala Val Ser Glu Phe Tyr Ser Gly Gln Leu 305 310 315 320 Val Ala Gly Tyr Asp Lys Met Leu Met Thr Asn Arg Gln Ala Leu Leu 325 330 335 Asp Gln Arg Thr Arg Leu Ser Val Ser Lys Tyr Glu Asp Leu Phe Tyr 340 345 350 Glu Gln Val Gln Leu Asp Asp Asn Gly Asn Ala Asn Phe Asp Ile Tyr 355 360 365 Leu Thr Gly Lys Phe Ala Leu Thr Ala Ile Lys Glu His Gln Arg Ile 370 375 380 Tyr His Thr Asn Asp Lys Asn 385 390 <210> 76 <211> 383 <212> PRT <213> Enterococcus faecalis <400> 76 Met Thr Ile Gly Ile Asp Lys Ile Ser Phe Phe Val Pro Pro Tyr Tyr 1 5 10 15 Ile Asp Met Thr Ala Leu Ala Glu Ala Arg Asn Val Asp Pro Gly Lys 20 25 30 Phe His Ile Gly Ile Gly Gln Asp Gln Met Ala Val Asn Pro Ile Ser 35 40 45 Gln Asp Ile Val Thr Phe Ala Ala Asn Ala Ala Glu Ala Ile Leu Thr 50 55 60 Lys Glu Asp Lys Glu Ala Ile Asp Met Val Ile Val Gly Thr Glu Ser 65 70 75 80 Ser Ile Asp Glu Ser Lys Ala Ala Ala Val Val Leu His Arg Leu Met 85 90 95 Gly Ile Gln Pro Phe Ala Arg Ser Phe Glu Ile Lys Glu Ala Cys Tyr 100 105 110 Gly Ala Thr Ala Gly Leu Gln Leu Ala Lys Asn His Val Ala Leu His 115 120 125 Pro Asp Lys Lys Val Leu Val Val Ala Ala Asp Ile Ala Lys Tyr Gly 130 135 140 Leu Asn Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met 145 150 155 160 Leu Val Ala Ser Glu Pro Arg Ile Leu Ala Leu Lys Glu Asp Asn Val 165 170 175 Met Leu Thr Gln Asp Ile Tyr Asp Phe Trp Arg Pro Thr Gly His Pro 180 185 190 Tyr Pro Met Val Asp Gly Pro Leu Ser Asn Glu Thr Tyr Ile Gln Ser 195 200 205 Phe Ala Gln Val Trp Asp Glu His Lys Lys Arg Thr Gly Leu Asp Phe 210 215 220 Ala Asp Tyr Asp Ala Leu Ala Phe His Ile Pro Tyr Thr Lys Met Gly 225 230 235 240 Lys Lys Ala Leu Leu Ala Lys Ile Ser Asp Gln Thr Glu Ala Glu Gln 245 250 255 Glu Arg Ile Leu Ala Arg Tyr Glu Glu Ser Ile Ile Tyr Ser Arg Arg 260 265 270 Val Gly Asn Leu Tyr Thr Gly Ser Leu Tyr Leu Gly Leu Ile Ser Leu 275 280 285 Leu Glu Asn Ala Thr Thr Leu Thr Ala Gly Asn Gln Ile Gly Leu Phe 290 295 300 Ser Tyr Gly Ser Gly Ala Val Ala Glu Phe Phe Thr Gly Glu Leu Val 305 310 315 320 Ala Gly Tyr Gln Asn His Leu Gln Lys Glu Thr His Leu Ala Leu Leu 325 330 335 Asp Asn Arg Thr Glu Leu Ser Ile Ala Glu Tyr Glu Ala Met Phe Ala 340 345 350 Glu Thr Leu Asp Thr Asp Ile Asp Gln Thr Leu Glu Asp Glu Leu Lys 355 360 365 Tyr Ser Ile Ser Ala Ile Asn Asn Thr Val Arg Ser Tyr Arg Asn 370 375 380 <210> 77 <211> 384 <212> PRT <213> Enterococcus faecium <400> 77 Met Lys Ile Gly Ile Asp Arg Leu Ser Phe Phe Ile Pro Asn Leu Tyr 1 5 10 15 Leu Asp Met Thr Glu Leu Ala Glu Ser Arg Gly Asp Asp Pro Ala Lys 20 25 30 Tyr His Ile Gly Ile Gly Gln Asp Gln Met Ala Val Asn Arg Ala Asn 35 40 45 Glu Asp Ile Ile Thr Leu Gly Ala Asn Ala Ala Ser Lys Ile Val Thr 50 55 60 Glu Lys Asp Arg Glu Leu Ile Asp Met Val Ile Val Gly Thr Glu Ser 65 70 75 80 Gly Ile Asp His Ser Lys Ala Ser Ala Val Ile Ile His His Leu Leu 85 90 95 Lys Ile Gln Ser Phe Ala Arg Ser Phe Glu Val Lys Glu Ala Cys Tyr 100 105 110 Gly Gly Thr Ala Ala Leu His Met Ala Lys Glu Tyr Val Lys Asn His 115 120 125 Pro Glu Arg Lys Val Leu Val Ile Ala Ser Asp Ile Ala Arg Tyr Gly 130 135 140 Leu Ala Ser Gly Gly Glu Val Thr Gln Gly Val Gly Ala Val Ala Met 145 150 155 160 Met Ile Thr Gln Asn Pro Arg Ile Leu Ser Ile Glu Asp Asp Ser Val 165 170 175 Phe Leu Thr Glu Asp Ile Tyr Asp Phe Trp Arg Pro Asp Tyr Ser Glu 180 185 190 Phe Pro Val Val Asp Gly Pro Leu Ser Asn Ser Thr Tyr Ile Glu Ser 195 200 205 Phe Gln Lys Val Trp Asn Arg His Lys Glu Leu Ser Gly Arg Gly Leu 210 215 220 Glu Asp Tyr Gln Ala Ile Ala Phe His Ile Pro Tyr Thr Lys Met Gly 225 230 235 240 Lys Lys Ala Leu Gln Ser Val Leu Asp Gln Thr Asp Glu Asp Asn Gln 245 250 255 Glu Arg Leu Met Ala Arg Tyr Glu Glu Ser Ile Arg Tyr Ser Arg Arg 260 265 270 Ile Gly Asn Leu Tyr Thr Gly Ser Leu Tyr Leu Gly Leu Thr Ser Leu 275 280 285 Leu Glu Asn Ser Lys Ser Leu Gln Pro Gly Asp Arg Ile Gly Leu Phe 290 295 300 Ser Tyr Gly Ser Gly Ala Val Ser Glu Phe Phe Thr Gly Tyr Leu Glu 305 310 315 320 Glu Asn Tyr Gln Glu Tyr Leu Phe Ala Gln Ser His Gln Glu Met Leu 325 330 335 Asp Ser Arg Thr Arg Ile Thr Val Asp Glu Tyr Glu Thr Ile Phe Ser 340 345 350 Glu Thr Leu Pro Glu His Gly Glu Cys Ala Glu Tyr Thr Ser Asp Val 355 360 365 Pro Phe Ser Ile Thr Lys Ile Glu Asn Asp Ile Arg Tyr Tyr Lys Ile 370 375 380 <210> 78 <211> 388 <212> PRT <213> Staphylococcus haemolyticus <400> 78 Met Ser Ile Gly Ile Asp Lys Ile Asn Phe Tyr Val Pro Lys Tyr Tyr 1 5 10 15 Val Asp Met Ala Lys Leu Ala Glu Ala Arg Gln Val Asp Pro Asn Lys 20 25 30 Phe Leu Ile Gly Ile Gly Gln Thr Gln Met Ala Val Ser Pro Val Ser 35 40 45 Gln Asp Ile Val Ser Met Gly Ala Asn Ala Ala Lys Asp Ile Ile Thr 50 55 60 Asp Asp Asp Lys Lys His Ile Gly Met Val Ile Val Ala Thr Glu Ser 65 70 75 80 Ala Ile Asp Asn Ala Lys Ala Ala Ala Val Gln Ile His Asn Leu Leu 85 90 95 Gly Val Gln Pro Phe Ala Arg Cys Phe Glu Met Lys Glu Ala Cys Tyr 100 105 110 Ala Ala Thr Pro Ala Ile Gln Leu Ala Lys Asp Tyr Ile Glu Lys Arg 115 120 125 Pro Asn Glu Lys Val Leu Val Ile Ala Ser Asp Thr Ala Arg Tyr Gly 130 135 140 Ile Gln Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met 145 150 155 160 Leu Ile Ser Asn Asn Pro Ser Ile Leu Glu Leu Asn Asp Asp Ala Val 165 170 175 Ala Tyr Thr Glu Asp Val Tyr Asp Phe Trp Arg Pro Thr Gly His Lys 180 185 190 Tyr Pro Leu Val Ala Gly Ala Leu Ser Lys Asp Ala Tyr Ile Lys Ser 195 200 205 Phe Gln Glu Ser Trp Asn Glu Tyr Ala Arg Arg Glu Asp Lys Thr Leu 210 215 220 Ser Asp Phe Glu Ser Leu Cys Phe His Val Pro Phe Thr Lys Met Gly 225 230 235 240 Lys Lys Ala Leu Asp Ser Ile Ile Asn Asp Ala Asp Glu Thr Thr Gln 245 250 255 Glu Arg Leu Thr Ser Gly Tyr Glu Asp Ala Val Tyr Tyr Asn Arg Tyr 260 265 270 Val Gly Asn Ile Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Ile Ser Leu 275 280 285 Leu Glu Asn Arg Ser Leu Lys Gly Gly Gln Thr Ile Gly Leu Phe Ser 290 295 300 Tyr Gly Ser Gly Ser Val Gly Glu Phe Phe Ser Ala Thr Leu Val Glu 305 310 315 320 Gly Tyr Glu Lys Gln Leu Asp Ile Glu Gly His Lys Ala Leu Leu Asn 325 330 335 Glu Arg Gln Glu Val Ser Val Glu Asp Tyr Glu Ser Phe Phe Lys Arg 340 345 350 Phe Asp Asp Leu Glu Phe Asp His Ala Thr Glu Gln Thr Asp Asp Asp 355 360 365 Lys Ser Ile Tyr Tyr Leu Glu Asn Ile Gln Asp Asp Ile Arg Gln Tyr 370 375 380 His Ile Pro Lys 385 <210> 79 <211> 388 <212> PRT <213> Staphylococcus epidermidis <400> 79 Met Asn Ile Gly Ile Asp Lys Ile Ser Phe Tyr Val Pro Lys Tyr Tyr 1 5 10 15 Val Asp Met Ala Lys Leu Ala Glu Ala Arg Gln Val Asp Pro Asn Lys 20 25 30 Phe Leu Ile Gly Ile Gly Gln Thr Glu Met Thr Val Ser Pro Val Asn 35 40 45 Gln Asp Ile Val Ser Met Gly Ala Asn Ala Ala Lys Asp Ile Ile Thr 50 55 60 Glu Glu Asp Lys Lys Asn Ile Gly Met Val Ile Val Ala Thr Glu Ser 65 70 75 80 Ala Ile Asp Asn Ala Lys Ala Ala Ala Val Gln Ile His His Leu Leu 85 90 95 Gly Ile Gln Pro Phe Ala Arg Cys Phe Glu Met Lys Glu Ala Cys Tyr 100 105 110 Ala Ala Thr Pro Ala Ile Gln Leu Ala Lys Asp Tyr Leu Ala Gln Arg 115 120 125 Pro Asn Glu Lys Val Leu Val Ile Ala Ser Asp Thr Ala Arg Tyr Gly 130 135 140 Ile His Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met 145 150 155 160 Met Ile Ser His Asp Pro Ser Ile Leu Lys Leu Asn Asp Asp Ala Val 165 170 175 Ala Tyr Thr Glu Asp Val Tyr Asp Phe Trp Arg Pro Thr Gly His Gln 180 185 190 Tyr Pro Leu Val Ala Gly Ala Leu Ser Lys Asp Ala Tyr Ile Lys Ser 195 200 205 Phe Gln Glu Ser Trp Asn Glu Tyr Ala Arg Arg His Asn Lys Thr Leu 210 215 220 Ala Asp Phe Ala Ser Leu Cys Phe His Val Pro Phe Thr Lys Met Gly 225 230 235 240 Gln Lys Ala Leu Asp Ser Ile Ile Asn His Ala Asp Glu Thr Thr Gln 245 250 255 Asp Arg Leu Asn Ser Ser Tyr Gln Asp Ala Val Asp Tyr Asn Arg Tyr 260 265 270 Val Gly Asn Ile Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Ile Ser Leu 275 280 285 Leu Glu Thr Arg Asp Leu Lys Gly Gly Gln Thr Ile Gly Leu Phe Ser 290 295 300 Tyr Gly Ser Gly Ser Val Gly Glu Phe Phe Ser Gly Thr Leu Val Asp 305 310 315 320 Gly Phe Lys Glu Gln Leu Asp Val Glu Arg His Lys Ser Leu Leu Asn 325 330 335 Asn Arg Ile Glu Val Ser Val Asp Glu Tyr Glu His Phe Phe Lys Arg 340 345 350 Phe Asp Gln Leu Glu Leu Asn His Glu Leu Glu Lys Ser Asn Ala Asp 355 360 365 Arg Asp Ile Phe Tyr Leu Lys Ser Ile Asp Asn Asn Ile Arg Glu Tyr 370 375 380 His Ile Ala Glu 385 <210> 80 <211> 388 <212> PRT <213> Staphylococcus aureus <400> 80 Met Thr Ile Gly Ile Asp Lys Ile Asn Phe Tyr Val Pro Lys Tyr Tyr 1 5 10 15 Val Asp Met Ala Lys Leu Ala Glu Ala Arg Gln Val Asp Pro Asn Lys 20 25 30 Phe Leu Ile Gly Ile Gly Gln Thr Glu Met Ala Val Ser Pro Val Asn 35 40 45 Gln Asp Ile Val Ser Met Gly Ala Asn Ala Ala Lys Asp Ile Ile Thr 50 55 60 Asp Glu Asp Lys Lys Lys Ile Gly Met Val Ile Val Ala Thr Glu Ser 65 70 75 80 Ala Val Asp Ala Ala Lys Ala Ala Ala Val Gln Ile His Asn Leu Leu 85 90 95 Gly Ile Gln Pro Phe Ala Arg Cys Phe Glu Met Lys Glu Ala Cys Tyr 100 105 110 Ala Ala Thr Pro Ala Ile Gln Leu Ala Lys Asp Tyr Leu Ala Thr Arg 115 120 125 Pro Asn Glu Lys Val Leu Val Ile Ala Thr Asp Thr Ala Arg Tyr Gly 130 135 140 Leu Asn Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met 145 150 155 160 Val Ile Ala His Asn Pro Ser Ile Leu Ala Leu Asn Glu Asp Ala Val 165 170 175 Ala Tyr Thr Glu Asp Val Tyr Asp Phe Trp Arg Pro Thr Gly His Lys 180 185 190 Tyr Pro Leu Val Asp Gly Ala Leu Ser Lys Asp Ala Tyr Ile Arg Ser 195 200 205 Phe Gln Gln Ser Trp Asn Glu Tyr Ala Lys Arg Gln Gly Lys Ser Leu 210 215 220 Ala Asp Phe Ala Ser Leu Cys Phe His Val Pro Phe Thr Lys Met Gly 225 230 235 240 Lys Lys Ala Leu Glu Ser Ile Ile Asp Asn Ala Asp Glu Thr Thr Gln 245 250 255 Glu Arg Leu Arg Ser Gly Tyr Glu Asp Ala Val Asp Tyr Asn Arg Tyr 260 265 270 Val Gly Asn Ile Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Ile Ser Leu 275 280 285 Leu Glu Asn Arg Asp Leu Gln Ala Gly Glu Thr Ile Gly Leu Phe Ser 290 295 300 Tyr Gly Ser Gly Ser Val Val Glu Phe Tyr Ser Ala Thr Leu Val Val 305 310 315 320 Gly Tyr Lys Asp His Leu Asp Gln Ala Ala His Lys Ala Leu Leu Asn 325 330 335 Asn Arg Thr Glu Val Ser Val Asp Ala Tyr Glu Thr Phe Phe Lys Arg 340 345 350 Phe Asp Asp Val Glu Phe Asp Glu Glu Gln Asp Ala Val His Glu Asp 355 360 365 Arg His Ile Phe Tyr Leu Ser Asn Ile Glu Asn Asn Val Arg Glu Tyr 370 375 380 His Arg Pro Glu 385 <210> 81 <211> 389 <212> PRT <213> Staphylococcus carnosus <400> 81 Met Thr Ile Gly Ile Asp Gln Leu Asn Phe Tyr Ile Pro Asn Phe Tyr 1 5 10 15 Val Asp Met Ala Glu Leu Ala Glu Ala Arg Gly Val Asp Pro Asn Lys 20 25 30 Phe Leu Ile Gly Ile Gly Gln Ser Gln Met Ala Val Ser Pro Val Ser 35 40 45 Gln Asp Ile Val Ser Met Gly Ala Asn Ala Ala Gln Pro Ile Leu Ser 50 55 60 Glu Gln Asp Lys Lys Asp Ile Thr Met Val Ile Val Ala Thr Glu Ser 65 70 75 80 Ala Ile Asp Ser Ala Lys Ala Ser Ala Val Gln Ile His His Leu Leu 85 90 95 Gly Ile Gln Pro Phe Ala Arg Cys Phe Glu Met Lys Glu Ala Cys Tyr 100 105 110 Ala Ala Thr Pro Ala Ile Gln Leu Ala Lys Asp Tyr Leu Val Pro Arg 115 120 125 Pro Lys Glu Lys Val Leu Val Ile Ala Ser Asp Thr Ala Arg Tyr Gly 130 135 140 Leu Asn Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met 145 150 155 160 Val Ile Ser His Asn Pro Ser Ile Leu Glu Leu His Asp Asp Ser Val 165 170 175 Ala Tyr Thr Glu Asp Val Tyr Asp Phe Trp Arg Pro Ser Gly Glu Ile 180 185 190 Tyr Pro Leu Val Ala Gly Lys Leu Ser Lys Asp Ala Tyr Ile Lys Ser 195 200 205 Phe Gln Glu Ser Trp Asn Glu Tyr Ala Lys Arg His His Lys Ser Leu 210 215 220 Ser Asp Phe Ala Ala Leu Cys Phe His Val Pro Phe Thr Lys Met Gly 225 230 235 240 Gln Lys Ala Leu Asp Ser Ile Leu Thr Asp Ser Ala Ser Glu Asp Thr 245 250 255 Gln Ala Arg Leu Asn Glu Gly Tyr Lys Ser Ala Thr Asp Tyr Asn Arg 260 265 270 Tyr Val Gly Asn Val Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Ile Ser 275 280 285 Leu Leu Glu Asn His Lys Leu Asn Gly Gly Asp Asn Ile Gly Leu Phe 290 295 300 Ser Tyr Gly Ser Gly Ser Val Gly Glu Phe Phe Ser Ala Thr Leu Val 305 310 315 320 Asp Asn Tyr Gln Asp His Leu Asp Val Lys Ala His Lys Ala Met Leu 325 330 335 Asp Asn Arg Lys Ala Leu Ser Val Glu Glu Tyr Glu Lys Phe Phe Asn 340 345 350 Arg Phe Asp Asn Leu Glu Phe Asp Thr Glu Thr Glu Leu Glu Val Glu 355 360 365 Pro Lys Gly Asn Phe Tyr Leu Lys Glu Ile Ser Asp Asn Ile Arg Tyr 370 375 380 Tyr Asp Thr Val Lys 385 <210> 82 <211> 389 <212> PRT <213> Streptomyces sp. <400> 82 Met Ser Ile Ser Ile Gly Ile His Asp Leu Ser Phe Ala Thr Thr Glu 1 5 10 15 Phe Val Leu Pro His Thr Ala Leu Ala Glu Tyr Asn Gly Thr Glu Ile 20 25 30 Gly Lys Tyr His Val Gly Ile Gly Gln Gln Ser Met Ser Val Pro Ala 35 40 45 Ala Asp Glu Asp Ile Val Thr Met Ala Ala Thr Ala Ala Arg Pro Ile 50 55 60 Ile Glu Arg Asn Gly Lys Ser Arg Ile Arg Thr Val Val Phe Ala Thr 65 70 75 80 Glu Ser Ser Ile Asp Gln Ala Lys Ala Gly Gly Val Tyr Val His Ser 85 90 95 Leu Leu Gly Leu Glu Ser Ala Cys Arg Val Val Glu Leu Lys Gln Ala 100 105 110 Cys Tyr Gly Ala Thr Ala Ala Leu Gln Phe Ala Ile Gly Leu Val Arg 115 120 125 Arg Asp Pro Ala Gln Gln Val Leu Val Ile Ala Ser Asp Val Ser Lys 130 135 140 Tyr Glu Leu Asp Ser Pro Gly Glu Ala Thr Gln Gly Ala Ala Ala Val 145 150 155 160 Ala Met Leu Val Gly Ala Asp Pro Ala Leu Leu Arg Ile Glu Glu Pro 165 170 175 Ser Gly Leu Phe Thr Ala Asp Val Met Asp Phe Trp Arg Pro Asn Tyr 180 185 190 Leu Thr Thr Ala Leu Val Asp Gly Gln Glu Ser Ile Asn Ala Tyr Leu 195 200 205 Gln Ala Val Glu Gly Ala Trp Lys Asp Tyr Ala Glu Gln Asp Gly Arg 210 215 220 Ser Leu Glu Glu Phe Ala Ala Phe Val Tyr His Gln Pro Phe Thr Lys 225 230 235 240 Met Ala Tyr Lys Ala His Arg His Leu Leu Asn Phe Asn Gly Tyr Asp 245 250 255 Thr Asp Lys Asp Ala Ile Glu Gly Ala Leu Gly Gln Thr Thr Ala Tyr 260 265 270 Asn Asn Val Ile Gly Asn Ser Tyr Thr Ala Ser Val Tyr Leu Gly Leu 275 280 285 Ala Ala Leu Leu Asp Gln Ala Asp Asp Leu Thr Gly Arg Ser Ile Gly 290 295 300 Phe Leu Ser Tyr Gly Ser Gly Ser Val Ala Glu Phe Phe Ser Gly Thr 305 310 315 320 Val Val Ala Gly Tyr Arg Glu Arg Leu Arg Thr Glu Ala Asn Gln Glu 325 330 335 Ala Ile Ala Arg Arg Lys Ser Val Asp Tyr Ala Thr Tyr Arg Glu Leu 340 345 350 His Glu Tyr Thr Leu Pro Ser Asp Gly Gly Asp His Ala Thr Pro Val 355 360 365 Gln Thr Thr Gly Pro Phe Arg Leu Ala Gly Ile Asn Asp His Lys Arg 370 375 380 Ile Tyr Glu Ala Arg 385 <210> 83 <211> 389 <212> PRT <213> Streptomyces griseosporeus <400> 83 Met Pro Leu Ala Ile Gly Ile His Asp Leu Ser Phe Ala Thr Gly Glu 1 5 10 15 Phe Val Leu Pro His Thr Ala Leu Ala Ala His Asn Gly Thr Glu Ile 20 25 30 Gly Lys Tyr His Ala Gly Ile Gly Gln Glu Ser Met Ser Val Pro Ala 35 40 45 Ala Asp Glu Asp Ile Val Thr Leu Ala Ala Thr Ala Ala Ala Pro Ile 50 55 60 Val Ala Arg His Gly Ser Asp Arg Ile Arg Thr Val Val Leu Ala Thr 65 70 75 80 Glu Ser Ser Ile Asp Gln Ala Lys Ser Ala Gly Val Tyr Val His Ser 85 90 95 Leu Leu Gly Leu Pro Ser Ala Thr Arg Val Val Glu Leu Lys Gln Ala 100 105 110 Cys Tyr Gly Ala Thr Ala Gly Leu Gln Phe Ala Ile Gly Leu Val Gln 115 120 125 Arg Asp Pro Ala Gln Gln Val Leu Val Ile Ala Ser Asp Val Ser Lys 130 135 140 Tyr Asp Leu Asp Ser Pro Gly Glu Ala Thr Gln Gly Ala Ala Ala Val 145 150 155 160 Ala Met Leu Val Gly Ala Asp Pro Gly Leu Val Arg Ile Glu Asp Pro 165 170 175 Ser Gly Leu Phe Thr Val Asp Val Met Asp Phe Trp Arg Pro Asn Tyr 180 185 190 Arg Thr Thr Ala Leu Val Asp Gly Gln Glu Ser Ile Gly Ala Tyr Leu 195 200 205 Gln Ala Val Glu Gly Ala Trp Lys Asp Tyr Ser Glu Arg Gly Gly His 210 215 220 Ser Leu Glu Gln Phe Ala Ala Phe Cys Tyr His Gln Pro Phe Thr Lys 225 230 235 240 Met Ala His Lys Ala His Arg His Leu Leu Asn Tyr Cys Ser His Asp 245 250 255 Ile His His Asp Asp Val Thr Arg Ala Val Gly Arg Thr Thr Ala Tyr 260 265 270 Asn Arg Val Ile Gly Asn Ser Tyr Thr Ala Ser Val Tyr Leu Gly Leu 275 280 285 Ala Ala Leu Leu Asp Gln Ala Asp Asp Leu Thr Gly Glu Arg Ile Gly 290 295 300 Phe Leu Ser Tyr Gly Ser Gly Ser Val Ala Glu Phe Phe Gly Gly Ile 305 310 315 320 Val Val Ala Gly Tyr Arg Asp Arg Leu Arg Thr Ala Ala Asn Ile Glu 325 330 335 Ala Val Ser Arg Arg Arg Pro Ile Asp Tyr Ala Gly Tyr Arg Glu Leu 340 345 350 His Glu Trp Ala Phe Pro Ala Arg Arg Gly Ala His Ser Thr Pro Gln 355 360 365 Gln Thr Thr Gly Pro Phe Arg Leu Ser Gly Ile Ser Gly His Lys Arg 370 375 380 Leu Tyr Arg Ala Cys 385 <210> 84 <211> 407 <212> PRT <213> Borrelia burgdorferi <400> 84 Met Arg Ile Gly Ile Ser Asp Ile Arg Ile Phe Leu Pro Leu Asn Tyr 1 5 10 15 Leu Asp Phe Ser Val Leu Leu Glu Asn Pro Leu Tyr Phe Ser Asn Glu 20 25 30 Val Phe Phe Lys Lys Ile Asn Arg Ala Ile Asp Ala Thr Leu Gln Lys 35 40 45 Gly Phe Arg Phe Thr Ser Pro Asn Glu Asp Ser Val Thr Met Ala Ser 50 55 60 Ser Ala Val Lys Leu Ile Phe Asp Asn Asn Asn Leu Asp Leu Ser Lys 65 70 75 80 Ile Arg Ile Leu Leu Gly Gly Thr Glu Thr Gly Val Asp His Ser Lys 85 90 95 Ala Ile Ser Ser Tyr Val Phe Gly Ala Leu Lys Gln Ser Gly Ile Cys 100 105 110 Leu Gly Asn Asn Phe Leu Thr Phe Gln Val Gln His Ala Cys Ala Gly 115 120 125 Ala Ala Met Ser Leu His Thr Val Ala Ser Val Leu Ser His Ser Asn 130 135 140 Asn Ser Glu Tyr Gly Ile Val Phe Ser Ser Asp Ile Ala His Tyr Ser 145 150 155 160 Asn Leu Thr Thr Ala Glu Ile Thr Gln Gly Ala Gly Ala Thr Ala Ile 165 170 175 Leu Ile Glu Lys Asn Pro Lys Ile Leu Ser Ile Asn Leu Ser Glu Phe 180 185 190 Gly Val Tyr Thr Asp Asp Val Asp Asp Phe Phe Arg Pro Phe Gly Ser 195 200 205 Val Glu Ala Lys Val Arg Gly Gln Tyr Ser Val Glu Cys Tyr Asn Asn 210 215 220 Ala Asn Glu Asn Ala Leu Arg Asp Phe Ala Phe Lys Lys Gln Leu Ser 225 230 235 240 Met Lys Asp Leu Phe Ser Asn Tyr Arg Phe Val Leu His Val Pro Phe 245 250 255 Ala Lys Met Pro Ile Asp Ser Met His Tyr Ile Leu Lys Lys Tyr Tyr 260 265 270 Ser Asp Asp Glu Ser Val Arg Asn Ala Tyr Leu Glu Ser Ile Asp Phe 275 280 285 Tyr Asp Gly Val Glu Ala Ala Met Glu Val Gly Asn Leu Tyr Thr Gly 290 295 300 Ser Ile Phe Leu Ser Leu Ala Phe Tyr Leu Lys Arg Val Phe Ser Lys 305 310 315 320 Lys Asp Ile Thr Gly Glu Lys Ile Leu Phe Cys Ser Tyr Gly Ser Gly 325 330 335 Asn Ile Met Ile Ile Tyr Glu Leu Thr Ile Glu Lys Ser Ala Phe Asp 340 345 350 Val Ile Lys Leu Trp Asp Leu Glu Gly Leu Ile Lys Asn Arg Asn Asn 355 360 365 Ala Asn Phe Glu Glu Tyr Lys Asp Phe Phe Gln Asn Lys Ile Ile Pro 370 375 380 Gly Glu Ser Arg Gly Phe Tyr Leu Lys Glu Leu Arg Asn Asp Gly Tyr 385 390 395 400 Arg Val Tyr Gly Tyr Arg Ala 405 <210> 85 <211> 317 <212> PRT <213> Streptococcus pneumoniae <400> 85 Met Asp Arg Glu Pro Val Thr Val Arg Ser Tyr Ala Asn Ile Ala Ile 1 5 10 15 Ile Lys Tyr Trp Gly Lys Lys Lys Glu Lys Glu Met Val Pro Ala Thr 20 25 30 Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Tyr Thr Glu Thr Thr Leu 35 40 45 Ser Pro Leu Pro Ala Asn Val Thr Ala Asp Glu Phe Tyr Ile Asn Gly 50 55 60 Gln Leu Gln Asn Glu Val Glu His Ala Lys Met Ser Lys Ile Ile Asp 65 70 75 80 Arg Tyr Arg Pro Ala Gly Glu Gly Phe Val Arg Ile Asp Thr Gln Asn 85 90 95 Asn Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser 100 105 110 Ala Leu Val Lys Ala Cys Asn Ala Tyr Phe Lys Leu Gly Leu Asp Arg 115 120 125 Ser Gln Leu Ala Gln Glu Ala Lys Phe Ala Ser Gly Ser Ser Ser Arg 130 135 140 Ser Phe Tyr Gly Pro Leu Gly Ala Trp Asp Lys Asp Ser Gly Glu Ile 145 150 155 160 Tyr Pro Val Glu Thr Asp Leu Lys Leu Ala Met Ile Met Leu Val Leu 165 170 175 Glu Asp Lys Lys Lys Pro Ile Ser Ser Arg Asp Gly Met Lys Leu Cys 180 185 190 Val Glu Thr Ser Thr Thr Phe Asp Asp Trp Val Arg Gln Ser Glu Lys 195 200 205 Asp Tyr Gln Asp Met Leu Ile Tyr Leu Lys Glu Asn Asp Phe Ala Lys 210 215 220 Ile Gly Glu Leu Thr Glu Lys Asn Ala Leu Ala Met His Ala Thr Thr 225 230 235 240 Lys Thr Ala Ser Pro Ala Phe Ser Tyr Leu Thr Asp Ala Ser Tyr Glu 245 250 255 Ala Met Ala Phe Val Arg Gln Leu Arg Glu Lys Gly Glu Ala Cys Tyr 260 265 270 Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Phe Cys Gln Glu Lys 275 280 285 Asp Leu Glu His Leu Ser Glu Ile Phe Gly Gln Arg Tyr Arg Leu Ile 290 295 300 Val Ser Lys Thr Lys Asp Leu Ser Gln Asp Asp Cys Cys 305 310 315 <210> 86 <211> 314 <212> PRT <213> Streptococcus pyogenes <400> 86 Met Asp Pro Asn Val Ile Thr Val Thr Ser Tyr Ala Asn Ile Ala Ile 1 5 10 15 Ile Lys Tyr Trp Gly Lys Glu Asn Gln Ala Lys Met Ile Pro Ser Thr 20 25 30 Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Phe Thr Thr Thr Ser Val 35 40 45 Ser Phe Leu Pro Asp Thr Ala Thr Ser Asp Gln Phe Tyr Ile Asn Gly 50 55 60 Val Leu Gln Asn Asp Glu Glu His Thr Lys Ile Ser Thr Ile Ile Asp 65 70 75 80 Gln Phe Arg Gln Pro Gly Gln Ala Phe Val Lys Met Glu Thr Gln Asn 85 90 95 Asn Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser 100 105 110 Ala Leu Val Lys Ala Cys Asp Gln Leu Phe Asp Thr Gln Leu Asp Gln 115 120 125 Lys Ala Leu Ala Gln Lys Ala Lys Phe Ala Ser Gly Ser Ser Ser Arg 130 135 140 Ser Phe Phe Gly Pro Val Ala Ala Trp Asp Lys Asp Ser Gly Ala Ile 145 150 155 160 Tyr Lys Val Glu Thr Asp Leu Lys Met Ala Met Ile Met Leu Val Leu 165 170 175 Asn Ala Ala Lys Lys Pro Ile Ser Ser Arg Glu Gly Met Lys Leu Cys 180 185 190 Arg Asp Thr Ser Thr Thr Phe Asp Glu Trp Val Glu Gln Ser Ala Ile 195 200 205 Asp Tyr Gln His Met Leu Thr Tyr Leu Lys Thr Asn Asn Phe Glu Lys 210 215 220 Val Gly Gln Leu Thr Glu Ala Asn Ala Leu Ala Met His Ala Thr Thr 225 230 235 240 Lys Thr Ala Asn Pro Pro Phe Ser Tyr Leu Thr Lys Glu Ser Tyr Gln 245 250 255 Ala Met Glu Ala Val Lys Glu Leu Arg Gln Glu Gly Phe Ala Cys Tyr 260 265 270 Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Leu Cys Leu Glu Lys 275 280 285 Asp Leu Ala Gln Leu Ala Glu Arg Leu Gly Lys Asn Tyr Arg Ile Ile 290 295 300 Val Ser Lys Thr Lys Asp Leu Pro Asp Val 305 310 <210> 87 <211> 331 <212> PRT <213> Enterococcus faecalis <400> 87 Met Leu Ser Gly Lys Ala Arg Ala His Thr Asn Ile Ala Leu Ile Lys 1 5 10 15 Tyr Trp Gly Lys Ala Asn Glu Glu Tyr Ile Leu Pro Met Asn Ser Ser 20 25 30 Leu Ser Leu Thr Leu Asp Ala Phe Tyr Thr Glu Thr Thr Val Thr Phe 35 40 45 Asp Ala His Tyr Ser Glu Asp Val Phe Ile Leu Asn Gly Ile Leu Gln 50 55 60 Asn Glu Lys Gln Thr Lys Lys Val Lys Glu Phe Leu Asn Leu Val Arg 65 70 75 80 Gln Gln Ala Asp Cys Thr Trp Phe Ala Lys Val Glu Ser Gln Asn Phe 85 90 95 Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Gly Leu Ala Ala 100 105 110 Leu Ala Gly Ala Cys Asn Val Ala Leu Gly Leu Asn Leu Ser Ala Lys 115 120 125 Asp Leu Ser Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Cys Arg Ser 130 135 140 Ile Phe Gly Gly Phe Ala Gln Trp Asn Lys Gly His Ser Asp Glu Thr 145 150 155 160 Ser Phe Ala Glu Asn Ile Pro Ala Asn Asn Trp Glu Asn Glu Leu Ala 165 170 175 Met Leu Phe Ile Leu Ile Asn Asp Gly Glu Lys Asp Val Ser Ser Arg 180 185 190 Asp Gly Met Lys Arg Thr Val Glu Thr Ser Ser Phe Tyr Gln Gly Trp 195 200 205 Leu Asp Asn Val Glu Lys Asp Leu Ser Gln Val His Glu Ala Ile Lys 210 215 220 Thr Lys Asp Phe Pro Arg Leu Gly Glu Ile Ile Glu Ala Asn Gly Leu 225 230 235 240 Arg Met His Gly Thr Thr Leu Gly Ala Val Pro Pro Phe Thr Tyr Trp 245 250 255 Ser Pro Gly Ser Leu Gln Ala Met Ala Leu Val Arg Gln Ala Arg Ala 260 265 270 Lys Gly Ile Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val Lys 275 280 285 Val Leu Val Glu Lys Lys Asn Leu Glu Ala Leu Lys Thr Phe Leu Ser 290 295 300 Glu His Phe Ser Lys Glu Gln Leu Val Pro Ala Phe Ala Gly Pro Gly 305 310 315 320 Ile Glu Leu Phe Glu Thr Lys Gly Met Asp Lys 325 330 <210> 88 <211> 325 <212> PRT <213> Enterococcus faecium <400> 88 Met Phe Lys Gly Lys Ala Arg Ala Tyr Thr Asn Ile Ala Leu Ile Lys 1 5 10 15 Tyr Trp Gly Lys Lys Asn Glu Glu Leu Ile Leu Pro Met Asn Asn Ser 20 25 30 Leu Ser Leu Thr Leu Asp Ala Phe Tyr Thr Glu Thr Glu Val Ile Phe 35 40 45 Ser Asp Ser Tyr Met Val Asp Glu Phe Tyr Leu Asp Gly Thr Leu Gln 50 55 60 Asp Glu Lys Ala Thr Lys Lys Val Ser Gln Phe Leu Asp Leu Phe Arg 65 70 75 80 Lys Glu Ala Gly Leu Ser Leu Lys Ala Ser Val Ile Ser Gln Asn Phe 85 90 95 Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Gly Leu Ala Ala 100 105 110 Leu Ala Gly Ala Cys Asn Thr Ala Leu Lys Leu Gly Leu Asp Asp Leu 115 120 125 Ser Leu Ser Arg Phe Ala Arg Arg Gly Ser Gly Ser Ala Cys Arg Ser 130 135 140 Ile Phe Gly Gly Phe Val Glu Trp Glu Lys Gly His Asp Asp Leu Ser 145 150 155 160 Ser Tyr Ala Lys Pro Val Pro Ser Asp Ser Phe Glu Asp Asp Leu Ala 165 170 175 Met Val Phe Val Leu Ile Asn Asp Gln Lys Lys Glu Val Ser Ser Arg 180 185 190 Asn Gly Met Arg Arg Thr Val Glu Thr Ser Asn Phe Tyr Gln Gly Trp 195 200 205 Leu Asp Ser Val Glu Gly Asp Leu Tyr Gln Leu Lys Gln Ala Ile Lys 210 215 220 Thr Lys Asp Phe Gln Leu Leu Gly Glu Thr Met Glu Arg Asn Gly Leu 225 230 235 240 Lys Met His Gly Thr Thr Leu Ala Ala Gln Pro Pro Phe Thr Tyr Trp 245 250 255 Ser Pro Asn Ser Leu Lys Ala Met Asp Ala Val Arg Gln Leu Arg Lys 260 265 270 Gln Gly Ile Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val Lys 275 280 285 Val Leu Val Glu Asn Ser His Leu Ser Glu Val Gln Glu Thr Phe Thr 290 295 300 Lys Leu Phe Ser Lys Glu Gln Val Ile Thr Ala His Ala Gly Pro Gly 305 310 315 320 Ile Ala Ile Ile Glu 325 <210> 89 <211> 327 <212> PRT <213> Staphylococcus haemolyticus <400> 89 Met Lys Lys Ser Gly Lys Ala Arg Ala His Thr Asn Ile Ala Leu Ile 1 5 10 15 Lys Tyr Trp Gly Lys Ala Asp Glu Ala Leu Ile Ile Pro Met Asn Asn 20 25 30 Ser Leu Ser Val Thr Leu Asp Arg Phe Tyr Thr Glu Thr Arg Val Thr 35 40 45 Phe Asp Glu Thr Leu Thr Glu Asp Gln Leu Ile Leu Asn Gly Glu Ala 50 55 60 Val Asn Ala Lys Glu Ser Ala Lys Ile Gln Arg Tyr Met Glu Met Ile 65 70 75 80 Arg Lys Glu Ala Gly Ile Ser His Glu Ala Leu Ile Glu Ser Glu Asn 85 90 95 Phe Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Ala Tyr Ala 100 105 110 Ala Leu Ala Gly Ala Cys Asn Glu Ala Leu Gln Leu Gly Leu Ser Asp 115 120 125 Lys Asp Leu Ser Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Ser Arg 130 135 140 Ser Ile Tyr Gly Gly Phe Ala Glu Trp Glu Lys Gly Asn Asp Asp Glu 145 150 155 160 Thr Ser Phe Ala His Arg Val Glu Ala Asp Gly Trp Glu Asn Glu Leu 165 170 175 Ala Met Val Phe Val Val Ile Asn Asn Lys Ser Lys Lys Val Ser Ser 180 185 190 Arg Ser Gly Met Ser Leu Thr Arg Asp Thr Ser Arg Phe Tyr Gln Tyr 195 200 205 Trp Leu Asp Asn Val Glu Pro Asp Leu Lys Glu Thr Lys Glu Ala Ile 210 215 220 Ala Gln Lys Asp Phe Lys Arg Met Gly Glu Val Ile Glu Ala Asn Gly 225 230 235 240 Leu Arg Met His Ala Thr Asn Leu Gly Ala Gln Pro Pro Phe Thr Tyr 245 250 255 Leu Val Pro Glu Ser Tyr Asp Ala Met Arg Ile Val His Glu Cys Arg 260 265 270 Glu Ala Gly Leu Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val 275 280 285 Lys Val Leu Ile Glu Lys Lys Asn Gln Gln Ala Ile Val Asp Lys Phe 290 295 300 Leu Gln Glu Phe Asp Gln Ser Gln Ile Ile Thr Ser Asp Ile Thr Gln 305 310 315 320 Ser Gly Val Glu Ile Ile Lys 325 <210> 90 <211> 327 <212> PRT <213> Staphylococcus epidermidis <400> 90 Met Val Lys Ser Gly Lys Ala Arg Ala His Thr Asn Ile Ala Leu Ile 1 5 10 15 Lys Tyr Trp Gly Lys Ala Asp Glu Thr Tyr Ile Ile Pro Met Asn Asn 20 25 30 Ser Leu Ser Val Thr Leu Asp Arg Phe Tyr Thr Glu Thr Lys Val Thr 35 40 45 Phe Asp Pro Asp Phe Thr Glu Asp Cys Leu Ile Leu Asn Gly Asn Glu 50 55 60 Val Asn Ala Lys Glu Lys Glu Lys Ile Gln Asn Tyr Met Asn Ile Val 65 70 75 80 Arg Asp Leu Ala Gly Asn Arg Leu His Ala Arg Ile Glu Ser Glu Asn 85 90 95 Tyr Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Ala Tyr Ala 100 105 110 Ala Leu Ala Ala Ala Cys Asn Glu Ala Leu Ser Leu Asn Leu Ser Asp 115 120 125 Thr Asp Leu Ser Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Ser Arg 130 135 140 Ser Ile Phe Gly Gly Phe Ala Glu Trp Glu Lys Gly His Asp Asp Leu 145 150 155 160 Thr Ser Tyr Ala His Gly Ile Asn Ser Asn Gly Trp Glu Lys Asp Leu 165 170 175 Ser Met Ile Phe Val Val Ile Asn Asn Gln Ser Lys Lys Val Ser Ser 180 185 190 Arg Ser Gly Met Ser Leu Thr Arg Asp Thr Ser Arg Phe Tyr Gln Tyr 195 200 205 Trp Leu Asp His Val Asp Glu Asp Leu Asn Glu Ala Lys Glu Ala Val 210 215 220 Lys Asn Gln Asp Phe Gln Arg Leu Gly Glu Val Ile Glu Ala Asn Gly 225 230 235 240 Leu Arg Met His Ala Thr Asn Leu Gly Ala Gln Pro Pro Phe Thr Tyr 245 250 255 Leu Val Gln Glu Ser Tyr Asp Ala Met Ala Ile Val Glu Gln Cys Arg 260 265 270 Lys Ala Asn Leu Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val 275 280 285 Lys Val Leu Val Glu Lys Lys Asn Lys Gln Ala Val Met Glu Gln Phe 290 295 300 Leu Lys Val Phe Asp Glu Ser Lys Ile Ile Ala Ser Asp Ile Ile Ser 305 310 315 320 Ser Gly Val Glu Ile Ile Lys 325 <210> 91 <211> 327 <212> PRT <213> Staphylococcus aureus <400> 91 Met Ile Lys Ser Gly Lys Ala Arg Ala His Thr Asn Ile Ala Leu Ile 1 5 10 15 Lys Tyr Trp Gly Lys Lys Asp Glu Ala Leu Ile Ile Pro Met Asn Asn 20 25 30 Ser Ile Ser Val Thr Leu Glu Lys Phe Tyr Thr Glu Thr Lys Val Thr 35 40 45 Phe Asn Asp Gln Leu Thr Gln Asp Gln Phe Trp Leu Asn Gly Glu Lys 50 55 60 Val Ser Gly Lys Glu Leu Glu Lys Ile Ser Lys Tyr Met Asp Ile Val 65 70 75 80 Arg Asn Arg Ala Gly Ile Asp Trp Tyr Ala Glu Ile Glu Ser Asp Asn 85 90 95 Phe Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Ala Tyr Ala 100 105 110 Ala Leu Ala Ala Ala Cys Asn Gln Ala Leu Asp Leu Gln Leu Ser Asp 115 120 125 Lys Asp Leu Ser Arg Leu Ala Arg Ile Gly Ser Gly Ser Ala Ser Arg 130 135 140 Ser Ile Tyr Gly Gly Phe Ala Glu Trp Glu Lys Gly Tyr Asn Asp Glu 145 150 155 160 Thr Ser Tyr Ala Val Pro Leu Glu Ser Asn His Phe Glu Asp Asp Leu 165 170 175 Ala Met Ile Phe Val Val Ile Asn Gln His Ser Lys Lys Val Pro Ser 180 185 190 Arg Tyr Gly Met Ser Leu Thr Arg Asn Thr Ser Arg Phe Tyr Gln Tyr 195 200 205 Trp Leu Asp His Ile Asp Glu Asp Leu Ala Glu Ala Lys Ala Ala Ile 210 215 220 Gln Asp Lys Asp Phe Lys Arg Leu Gly Glu Val Ile Glu Glu Asn Gly 225 230 235 240 Leu Arg Met His Ala Thr Asn Leu Gly Ser Thr Pro Pro Phe Thr Tyr 245 250 255 Leu Val Gln Glu Ser Tyr Asp Val Met Ala Leu Val His Glu Cys Arg 260 265 270 Glu Ala Gly Tyr Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val 275 280 285 Lys Ile Leu Val Glu Lys Lys Asn Lys Gln Gln Ile Ile Asp Lys Leu 290 295 300 Leu Thr Gln Phe Asp Asn Asn Gln Ile Ile Asp Ser Asp Ile Ile Ala 305 310 315 320 Thr Gly Ile Glu Ile Ile Glu 325 <210> 92 <211> 350 <212> PRT <213> Streptomyces sp. <400> 92 Met Arg Ser Glu His Pro Thr Thr Thr Val Leu Gln Ser Arg Glu Gln 1 5 10 15 Gly Ser Ala Ala Gly Ala Thr Ala Val Ala His Pro Asn Ile Ala Leu 20 25 30 Ile Lys Tyr Trp Gly Lys Arg Asp Glu Arg Leu Ile Leu Pro Cys Thr 35 40 45 Thr Ser Leu Ser Met Thr Leu Asp Val Phe Pro Thr Thr Thr Glu Val 50 55 60 Arg Leu Asp Pro Ala Ala Glu His Asp Thr Ala Ala Leu Asn Gly Glu 65 70 75 80 Val Ala Thr Gly Glu Thr Leu Arg Arg Ile Ser Ala Phe Leu Ser Leu 85 90 95 Val Arg Glu Val Ala Gly Ser Asp Gln Arg Ala Val Val Asp Thr Arg 100 105 110 Asn Thr Val Pro Thr Gly Ala Gly Leu Ala Ser Ser Ala Ser Gly Phe 115 120 125 Ala Ala Leu Ala Val Ala Ala Ala Ala Ala Tyr Gly Leu Glu Leu Asp 130 135 140 Asp Arg Gly Leu Ser Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Ser 145 150 155 160 Arg Ser Ile Phe Gly Gly Phe Ala Val Trp His Ala Gly Pro Asp Gly 165 170 175 Thr Ala Thr Glu Ala Asp Leu Gly Ser Tyr Ala Glu Pro Val Pro Ala 180 185 190 Ala Asp Leu Asp Pro Ala Leu Val Ile Ala Val Val Asn Ala Gly Pro 195 200 205 Lys Pro Val Ser Ser Arg Glu Ala Met Arg Arg Thr Val Asp Thr Ser 210 215 220 Pro Leu Tyr Arg Pro Trp Ala Asp Ser Ser Lys Asp Asp Leu Asp Glu 225 230 235 240 Met Arg Ser Ala Leu Leu Arg Gly Asp Leu Glu Ala Val Gly Glu Ile 245 250 255 Ala Glu Arg Asn Ala Leu Gly Met His Ala Thr Met Leu Ala Ala Arg 260 265 270 Pro Ala Val Arg Tyr Leu Ser Pro Ala Thr Val Thr Val Leu Asp Ser 275 280 285 Val Leu Gln Leu Arg Lys Asp Gly Val Leu Ala Tyr Ala Thr Met Asp 290 295 300 Ala Gly Pro Asn Val Lys Val Leu Cys Arg Arg Ala Asp Ala Glu Arg 305 310 315 320 Val Ala Asp Val Val Arg Ala Ala Ala Ser Gly Gly Gln Val Leu Val 325 330 335 Ala Gly Pro Gly Asp Gly Ala Arg Leu Leu Ser Glu Gly Ala 340 345 350 <210> 93 <211> 331 <212> PRT <213> Streptomyces griseosporeus <400> 93 Ala Thr Ala Val Ala Gln Pro Asn Ile Ala Leu Ile Lys Tyr Trp Gly 1 5 10 15 Lys Lys Asp Glu His Leu Val Leu Pro Arg Thr Asp Ser Leu Ser Met 20 25 30 Thr Leu Asp Ile Phe Pro Thr Thr Thr Arg Val Gln Leu Ala Pro Gly 35 40 45 Ala Gly Gln Asp Thr Val Ala Phe Asn Gly Glu Pro Ala Thr Gly Glu 50 55 60 Ala Glu Arg Arg Ile Thr Ala Phe Leu Arg Leu Val Arg Glu Arg Ser 65 70 75 80 Gly Arg Thr Glu Arg Ala Arg Val Glu Thr Glu Asn Thr Val Pro Thr 85 90 95 Gly Ala Gly Leu Ala Ser Ser Ala Ser Gly Phe Ala Ala Leu Ala Val 100 105 110 Ala Ala Ala Ala Ala Tyr Gly Leu Gly Leu Asp Ala Arg Gly Leu Ser 115 120 125 Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Ser Arg Ser Ile Phe Asp 130 135 140 Gly Phe Ala Val Trp His Ala Gly His Ala Gly Gly Thr Pro Glu Glu 145 150 155 160 Ala Asp Leu Gly Ser Tyr Ala Glu Pro Val Pro Ala Val Asp Leu Glu 165 170 175 Pro Ala Leu Val Val Ala Val Val Ser Ala Ala Pro Lys Ala Val Ser 180 185 190 Ser Arg Glu Ala Met Arg Arg Thr Val Asp Thr Ser Pro Leu Tyr Glu 195 200 205 Pro Trp Ala Val Ser Ser Arg Ala Asp Leu Ala Asp Ile Gly Ala Ala 210 215 220 Leu Ala Arg Gly Asn Leu Pro Ala Val Gly Glu Ile Ala Glu Arg Asn 225 230 235 240 Ala Leu Gly Met His Ala Thr Met Leu Ala Ala Arg Pro Ala Val Arg 245 250 255 Tyr Leu Ser Pro Ala Ser Leu Ala Val Leu Asp Gly Val Leu Gln Leu 260 265 270 Arg Arg Asp Gly Val Pro Ala Tyr Ala Thr Met Asp Ala Gly Pro Asn 275 280 285 Val Lys Val Leu Cys Pro Arg Ser Asp Ala Glu Arg Val Ala Glu Ala 290 295 300 Leu Arg Ala Ala Ala Pro Val Gly Ala Val His Ile Ala Gly Pro Gly 305 310 315 320 Arg Gly Ala Arg Leu Val Ala Glu Glu Cys Arg 325 330 <210> 94 <211> 312 <212> PRT <213> Borrelia burgdorferi <400> 94 Met Lys Ile Lys Cys Lys Val His Ala Ser Leu Ala Leu Ile Lys Tyr 1 5 10 15 Trp Gly Lys Lys Asp Val Phe Leu Asn Ile Pro Ala Thr Ser Ser Leu 20 25 30 Ala Val Ser Val Asp Lys Phe Tyr Ser Ile Ser Glu Leu Glu Leu Ser 35 40 45 Asn Arg Asp Glu Ile Ile Leu Asn Ser Lys Pro Val Ile Leu Lys Asn 50 55 60 Arg Glu Lys Val Phe Phe Asp Tyr Ala Arg Lys Ile Leu Asn Glu Pro 65 70 75 80 Asn Val Arg Phe Lys Ile Lys Ser Lys Asn Asn Phe Pro Thr Ala Ala 85 90 95 Gly Leu Ala Ser Ser Ser Ser Gly Phe Ala Ser Ile Ala Ala Cys Ile 100 105 110 Leu Lys Tyr Phe Asn Lys Tyr Ser Cys Asn Ser Ala Ser Asn Leu Ala 115 120 125 Arg Val Gly Ser Ala Ser Ala Ala Arg Ala Ile Tyr Gly Gly Phe Thr 130 135 140 Ile Leu Lys Glu Gly Ser Lys Glu Ser Phe Gln Leu Arg Asp Gln Ser 145 150 155 160 Tyr Phe Asn Asp Leu Arg Ile Ile Phe Ala Ile Ile Asp Ser Asn Glu 165 170 175 Lys Glu Leu Ser Ser Arg Ala Ala Met Asn Ile Cys Lys Arg His Lys 180 185 190 Phe Tyr Tyr Asp Ala Trp Ile Ala Ser Ser Lys Lys Ile Phe Lys Asp 195 200 205 Ala Leu Tyr Phe Phe Leu Lys Lys Asp Phe Ile His Phe Gly Ala Thr 210 215 220 Ile Val Lys Ser Tyr Gln Asn Met Phe Ala Leu Met Phe Ala Ser Ser 225 230 235 240 Ile Phe Tyr Phe Lys Asn Ser Thr Ile Asp Leu Ile Arg Tyr Ala Ala 245 250 255 Asp Leu Arg Asn Glu Gly Ile Phe Val Phe Glu Thr Met Asp Ala Gly 260 265 270 Pro Gln Val Lys Phe Leu Cys Leu Glu Glu Asn Leu Asn Thr Ile Leu 275 280 285 Lys Gly Leu Lys Gln Asn Phe Thr Gly Ile Asp Phe Ile Val Ser Lys 290 295 300 Val Gly Cys Asp Leu Glu Trp Ile 305 310 <210> 95 <211> 292 <212> PRT <213> Streptococcus pneumoniae <400> 95 Met Thr Lys Lys Val Gly Val Gly Gln Ala His Ser Lys Ile Ile Leu 1 5 10 15 Ile Gly Glu His Ala Val Val Tyr Gly Tyr Pro Ala Ile Ser Leu Pro 20 25 30 Leu Leu Glu Val Glu Val Thr Cys Lys Val Val Ser Ala Glu Ser Pro 35 40 45 Trp Arg Leu Tyr Glu Glu Asp Thr Leu Ser Met Ala Val Tyr Ala Ser 50 55 60 Leu Glu Tyr Leu Asp Ile Thr Glu Ala Cys Val Arg Cys Glu Ile Asp 65 70 75 80 Ser Ala Ile Pro Glu Lys Arg Gly Met Gly Ser Ser Ala Ala Ile Ser 85 90 95 Ile Ala Ala Ile Arg Ala Val Phe Asp Tyr Tyr Gln Ala Asp Leu Pro 100 105 110 His Asp Val Leu Glu Ile Leu Val Asn Arg Ala Glu Met Ile Ala His 115 120 125 Met Asn Pro Ser Gly Leu Asp Ala Lys Thr Cys Leu Ser Asp Gln Pro 130 135 140 Ile Arg Phe Ile Lys Asn Val Gly Phe Thr Glu Leu Glu Met Asp Leu 145 150 155 160 Ser Ala Tyr Leu Val Ile Ala Asp Thr Gly Val Tyr Gly His Thr Arg 165 170 175 Glu Ala Ile Gln Val Val Gln Asn Lys Gly Lys Asp Ala Leu Pro Phe 180 185 190 Leu His Ala Leu Gly Glu Leu Thr Gln Gln Ala Glu Val Ala Ile Ser 195 200 205 Gln Lys Tyr Ala Glu Gly Leu Gly Leu Ile Phe Ser Gln Ala His Leu 210 215 220 His Leu Lys Glu Ile Gly Val Ser Ser Pro Glu Ala Asp Phe Leu Val 225 230 235 240 Glu Thr Ala Leu Ser Tyr Gly Ala Leu Gly Ala Lys Met Ser Gly Gly 245 250 255 Gly Leu Gly Gly Cys Ile Ile Ala Leu Val Thr Asn Leu Thr His Ala 260 265 270 Gln Glu Leu Ala Glu Arg Leu Glu Glu Lys Gly Ala Val Gln Thr Trp 275 280 285 Ile Glu Ser Leu 290 <210> 96 <211> 292 <212> PRT <213> Streptococcus pyogenes <400> 96 Met Asn Glu Asn Ile Gly Tyr Gly Lys Ala His Ser Lys Ile Ile Leu 1 5 10 15 Ile Gly Glu His Ala Val Val Tyr Gly Tyr Pro Ala Ile Ala Leu Pro 20 25 30 Leu Thr Asp Ile Glu Val Val Cys His Ile Phe Pro Ala Asp Lys Pro 35 40 45 Leu Val Phe Asp Phe Tyr Asp Thr Leu Ser Thr Ala Ile Tyr Ala Ala 50 55 60 Leu Asp Tyr Leu Gln Arg Leu Gln Glu Pro Ile Ala Tyr Glu Ile Val 65 70 75 80 Ser Gln Val Pro Gln Lys Arg Gly Met Gly Ser Ser Ala Ala Val Ser 85 90 95 Ile Ala Ala Ile Arg Ala Val Phe Ser Tyr Cys Gln Glu Pro Leu Ser 100 105 110 Asp Asp Leu Leu Glu Ile Leu Val Asn Lys Ala Glu Ile Ile Ala His 115 120 125 Thr Asn Pro Ser Gly Leu Asp Ala Lys Thr Cys Leu Ser Asp His Ala 130 135 140 Ile Lys Phe Ile Arg Asn Ile Gly Phe Glu Thr Ile Glu Ile Ala Leu 145 150 155 160 Asn Gly Tyr Leu Ile Ile Ala Asp Thr Gly Ile His Gly His Thr Arg 165 170 175 Glu Ala Val Asn Lys Val Ala Gln Phe Glu Glu Thr Asn Leu Pro Tyr 180 185 190 Leu Ala Lys Leu Gly Ala Leu Thr Gln Ala Leu Glu Arg Ala Ile Asn 195 200 205 Gln Lys Asn Lys Val Ala Ile Gly Gln Leu Met Thr Gln Ala His Ser 210 215 220 Ala Leu Lys Ala Ile Gly Val Ser Ile Ser Lys Ala Asp Gln Leu Val 225 230 235 240 Glu Ala Ala Leu Arg Ala Gly Ala Leu Gly Ala Lys Met Thr Gly Gly 245 250 255 Gly Leu Gly Gly Cys Met Ile Ala Leu Ala Asp Thr Lys Asp Met Ala 260 265 270 Glu Lys Ile Ser His Lys Leu Lys Glu Glu Gly Ala Val Asn Thr Trp 275 280 285 Ile Gln Met Leu 290 <210> 97 <211> 314 <212> PRT <213> Enterococcus faecalis <400> 97 Met Asn Ile Lys Lys Gln Gly Leu Gly Gln Ala Thr Gly Lys Ile Ile 1 5 10 15 Leu Met Gly Glu His Ala Val Val Tyr Gly Glu Pro Ala Ile Ala Phe 20 25 30 Pro Phe Gln Ala Thr Glu Ile Thr Ala Val Phe Thr Pro Ala Lys Thr 35 40 45 Met Gln Ile Asp Cys Ala Tyr Phe Thr Gly Leu Leu Glu Asp Val Pro 50 55 60 Gln Glu Leu Ala Asn Ile Lys Glu Val Val Gln Gln Thr Leu His Phe 65 70 75 80 Leu Lys Glu Asp Thr Phe Lys Gly Thr Leu Thr Leu Thr Ser Thr Ile 85 90 95 Pro Ala Glu Arg Gly Met Gly Ser Ser Ala Ala Thr Ala Val Ala Ile 100 105 110 Val Arg Ser Leu Phe Asp Tyr Phe Asp Tyr Ala Tyr Thr Tyr Gln Glu 115 120 125 Leu Phe Glu Leu Val Ser Leu Ser Glu Lys Ile Ala His Gly Asn Pro 130 135 140 Ser Gly Ile Asp Ala Ala Ala Thr Ser Gly Ala Asp Pro Leu Phe Phe 145 150 155 160 Thr Arg Gly Phe Pro Pro Thr His Phe Ser Met Asn Leu Ser Asn Ala 165 170 175 Tyr Leu Val Val Ala Asp Thr Gly Ile Lys Gly Gln Thr Arg Glu Ala 180 185 190 Val Lys Asp Ile Ala Gln Leu Ala Gln Asn Asn Pro Thr Ala Ile Ala 195 200 205 Glu Thr Met Lys Gln Leu Gly Ser Phe Thr Lys Glu Ala Lys Gln Ala 210 215 220 Ile Leu Gln Asp Asp Lys Gln Lys Leu Gly Gln Leu Met Thr Leu Ala 225 230 235 240 Gln Glu Gln Leu Gln Gln Leu Thr Val Ser Asn Asp Met Leu Asp Arg 245 250 255 Leu Val Ala Leu Ser Leu Glu His Gly Ala Leu Gly Ala Lys Leu Thr 260 265 270 Gly Gly Gly Arg Gly Gly Cys Met Ile Ala Leu Thr Asp Asn Lys Lys 275 280 285 Thr Ala Gln Thr Ile Ala Gln Thr Leu Glu Glu Asn Gly Ala Val Ala 290 295 300 Thr Trp Ile Gln Ser Leu Glu Val Lys Lys 305 310 <210> 98 <211> 314 <212> PRT <213> Enterococcus faecium <400> 98 Met Ala Asn Tyr Gly Gln Gly Glu Ser Ser Gly Lys Ile Ile Leu Met 1 5 10 15 Gly Glu His Ala Val Val Tyr Gly Glu Pro Ala Ile Ala Phe Pro Phe 20 25 30 Tyr Ala Thr Lys Val Thr Ala Phe Leu Glu Glu Leu Asp Ala Met Asp 35 40 45 Asp Gln Leu Val Ser Ser Tyr Tyr Ser Gly Asn Leu Ala Glu Ala Pro 50 55 60 His Ala Leu Lys Asn Ile Lys Lys Leu Phe Ile His Leu Lys Lys Gln 65 70 75 80 His Asp Ile Gln Lys Asn Leu Gln Leu Thr Ile Glu Ser Thr Ile Pro 85 90 95 Ala Glu Arg Gly Met Gly Ser Ser Ala Ala Val Ala Thr Ala Val Thr 100 105 110 Arg Ala Phe Tyr Asp Tyr Leu Ala Phe Pro Leu Ser Arg Glu Ile Leu 115 120 125 Leu Glu Asn Val Gln Leu Ser Glu Lys Ile Ala His Gly Asn Pro Ser 130 135 140 Gly Ile Asp Ala Ala Ala Thr Ser Ser Leu Gln Pro Ile Tyr Phe Thr 145 150 155 160 Lys Gly His Pro Phe Asp Tyr Phe Ser Leu Asn Ile Asp Ala Phe Leu 165 170 175 Ile Val Ala Asp Thr Gly Ile Lys Gly Gln Thr Arg Glu Ala Val Lys 180 185 190 Asp Val Ala His Leu Phe Glu Thr Gln Pro His Glu Thr Gly Gln Met 195 200 205 Ile Gln Lys Leu Gly Tyr Leu Thr Lys Gln Ala Lys Gln Ala Ile Ile 210 215 220 Glu Asn Ser Pro Glu Thr Leu Ala Gln Thr Met Asp Glu Ser Gln Ser 225 230 235 240 Leu Leu Glu Lys Leu Thr Ile Ser Asn Asp Phe Leu Asn Leu Leu Ile 245 250 255 Gln Thr Ala Lys Asp Thr Gly Ala Leu Gly Ala Lys Leu Thr Gly Gly 260 265 270 Gly Arg Gly Gly Cys Met Ile Ala Leu Ala Gln Thr Lys Thr Lys Ala 275 280 285 Gln Glu Ile Ser Gln Ala Leu Glu Asp Ala Gly Ala Ala Glu Thr Trp 290 295 300 Ile Gln Gly Leu Gly Val His Thr Tyr Val 305 310 <210> 99 <211> 307 <212> PRT <213> Staphylococcus haemolyticus <400> 99 Met Val Gln Arg Gly Tyr Gly Glu Ser Asn Gly Lys Ile Ile Leu Ile 1 5 10 15 Gly Glu His Ala Val Thr Phe Gly Glu Pro Ala Ile Ala Ile Pro Phe 20 25 30 Thr Ser Gly Lys Val Lys Val Leu Ile Glu Ser Leu Glu Lys Gly Asn 35 40 45 Tyr Ser Ala Ile Gln Ser Asp Val Tyr Asp Gly Pro Leu Tyr Asp Ala 50 55 60 Pro Glu His Leu Lys Ser Leu Ile Gly His Phe Val Glu Asn Lys Lys 65 70 75 80 Val Glu Glu Pro Leu Leu Ile Lys Ile Gln Ala Asn Leu Pro Pro Ser 85 90 95 Arg Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Phe Ile Arg Ala 100 105 110 Ser Tyr Asp Tyr Leu Gly Leu Pro Leu Thr Asp Lys Glu Leu Leu Glu 115 120 125 Asn Ala Asp Trp Ala Glu Arg Ile Ala His Gly Lys Pro Ser Gly Ile 130 135 140 Asp Thr Lys Thr Ile Val Thr Asn Gln Pro Val Trp Tyr Gln Lys Gly 145 150 155 160 Glu Val Glu Ile Leu Lys Thr Leu Asp Leu Asp Gly Tyr Met Val Val 165 170 175 Ile Asp Thr Gly Val Lys Gly Ser Thr Lys Gln Ala Val Glu Asp Val 180 185 190 His Gln Leu Cys Asp Asn Asp Lys Asn Tyr Met Gln Val Val Lys His 195 200 205 Ile Gly Ser Leu Val Tyr Ser Ala Ser Glu Ala Ile Glu His His Ser 210 215 220 Phe Asp Gln Leu Ala Thr Ile Phe Asn Gln Cys Gln Asp Asp Leu Arg 225 230 235 240 Thr Leu Thr Val Ser His Asp Lys Ile Glu Met Phe Leu Arg Leu Gly 245 250 255 Glu Glu Asn Gly Ser Val Ala Gly Lys Leu Thr Gly Gly Gly Arg Gly 260 265 270 Gly Ser Met Leu Ile Leu Ala Lys Glu Leu Gln Thr Ala Lys Asn Ile 275 280 285 Val Ala Ala Val Glu Lys Ala Gly Ala Gln His Thr Trp Ile Glu Lys 290 295 300 Leu Gly Gly 305 <210> 100 <211> 306 <212> PRT <213> Staphylococcus epidermidis <400> 100 Met Thr Arg Gln Gly Tyr Gly Glu Ser Thr Gly Lys Ile Ile Leu Met 1 5 10 15 Gly Glu His Ala Val Thr Phe Gly Gln Pro Ala Ile Ala Ile Pro Phe 20 25 30 Asn Ala Gly Lys Ile Lys Val Leu Ile Glu Ser Leu Asp Glu Gly Asn 35 40 45 Tyr Ser Ser Ile Thr Ser Asp Val Tyr Asp Gly Met Leu Tyr Asp Ala 50 55 60 Pro Glu His Leu Lys Ser Ile Ile Asn Arg Phe Val Glu Lys Ser Gly 65 70 75 80 Val Lys Glu Pro Leu Ser Val Lys Ile Gln Thr Asn Leu Pro Pro Ser 85 90 95 Arg Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Phe Val Arg Ala 100 105 110 Ser Tyr Asp Phe Met Asp Gln Pro Leu Asp Asp Lys Thr Leu Ile Lys 115 120 125 Glu Ala Asn Trp Ala Glu Gln Ile Ala His Gly Lys Pro Ser Gly Ile 130 135 140 Asp Thr Gln Thr Ile Val Ser Asn Lys Pro Val Trp Phe Lys Gln Gly 145 150 155 160 Gln Ala Glu Thr Leu Lys Ser Leu Lys Leu Asn Gly Tyr Met Val Val 165 170 175 Ile Asp Thr Gly Val Lys Gly Ser Thr Lys Gln Ala Val Glu Asp Val 180 185 190 His Val Leu Cys Glu Ser Asp Glu Tyr Met Lys Tyr Ile Glu His Ile 195 200 205 Gly Thr Leu Val His Ser Ala Ser Glu Ser Ile Glu Gln His Asp Phe 210 215 220 His His Leu Ala Asp Ile Phe Asn Ala Cys Gln Glu Asp Leu Arg His 225 230 235 240 Leu Thr Val Ser His Asp Lys Ile Glu Lys Leu Leu Gln Ile Gly Lys 245 250 255 Glu His Gly Ala Ile Ala Gly Lys Leu Thr Gly Gly Gly Arg Gly Gly 260 265 270 Ser Met Leu Leu Leu Ala Glu Asn Leu Lys Thr Ala Lys Thr Ile Val 275 280 285 Ala Ala Val Glu Lys Ala Gly Ala Ala His Thr Trp Ile Glu His Leu 290 295 300 Gly Gly 305 <210> 101 <211> 306 <212> PRT <213> Staphylococcus aureus <400> 101 Met Thr Arg Lys Gly Tyr Gly Glu Ser Thr Gly Lys Ile Ile Leu Ile 1 5 10 15 Gly Glu His Ala Val Thr Phe Gly Glu Pro Ala Ile Ala Val Pro Phe 20 25 30 Asn Ala Gly Lys Ile Lys Val Leu Ile Glu Ala Leu Glu Ser Gly Asn 35 40 45 Tyr Ser Ser Ile Lys Ser Asp Val Tyr Asp Gly Met Leu Tyr Asp Ala 50 55 60 Pro Asp His Leu Lys Ser Leu Val Asn Arg Phe Val Glu Leu Asn Asn 65 70 75 80 Ile Thr Glu Pro Leu Ala Val Thr Ile Gln Thr Asn Leu Pro Pro Ser 85 90 95 Arg Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Phe Val Arg Ala 100 105 110 Ser Tyr Asp Phe Leu Gly Lys Ser Leu Thr Lys Glu Glu Leu Ile Glu 115 120 125 Lys Ala Asn Trp Ala Glu Gln Ile Ala His Gly Lys Pro Ser Gly Ile 130 135 140 Asp Thr Gln Thr Ile Val Ser Gly Lys Pro Val Trp Phe Gln Lys Gly 145 150 155 160 Gln Ala Glu Thr Leu Lys Thr Leu Ser Leu Asp Gly Tyr Met Val Val 165 170 175 Ile Asp Thr Gly Val Lys Gly Ser Thr Arg Gln Ala Val Glu Asp Val 180 185 190 His Lys Leu Cys Glu Asp Pro Gln Tyr Met Ser His Val Lys His Ile 195 200 205 Gly Lys Leu Val Leu Arg Ala Ser Asp Val Ile Glu His His Asn Phe 210 215 220 Glu Ala Leu Ala Asp Ile Phe Asn Glu Cys His Ala Asp Leu Lys Ala 225 230 235 240 Leu Thr Val Ser His Asp Lys Ile Glu Gln Leu Met Lys Ile Gly Lys 245 250 255 Glu Asn Gly Ala Ile Ala Gly Lys Leu Thr Gly Ala Gly Arg Gly Gly 260 265 270 Ser Met Leu Leu Leu Ala Lys Asp Leu Pro Thr Ala Lys Asn Ile Val 275 280 285 Lys Ala Val Glu Lys Ala Gly Ala Ala His Thr Trp Ile Glu Asn Leu 290 295 300 Gly Gly 305 <210> 102 <211> 345 <212> PRT <213> Streptomyces sp. <400> 102 Met Gln Lys Arg Gln Arg Glu Leu Ser Ala Leu Thr Leu Pro Thr Ser 1 5 10 15 Ala Glu Gly Val Ser Glu Ser His Arg Ala Arg Ser Val Gly Ile Gly 20 25 30 Arg Ala His Ala Lys Ala Ile Leu Leu Gly Glu His Ala Val Val Tyr 35 40 45 Gly Ala Pro Ala Leu Ala Leu Pro Ile Pro Gln Leu Thr Val Thr Ala 50 55 60 Ser Val Gly Trp Ser Ser Glu Ala Ser Asp Ser Ala Gly Gly Leu Ser 65 70 75 80 Tyr Thr Met Thr Gly Thr Pro Ser Arg Ala Leu Val Thr Gln Ala Ser 85 90 95 Asp Gly Leu His Arg Leu Thr Ala Glu Phe Met Ala Arg Met Gly Val 100 105 110 Thr Asn Ala Pro His Leu Asp Val Ile Leu Asp Gly Ala Ile Pro His 115 120 125 Gly Arg Gly Leu Gly Ser Ser Ala Ala Gly Ser Arg Ala Ile Ala Leu 130 135 140 Ala Leu Ala Asp Leu Phe Gly His Glu Leu Ala Glu His Thr Ala Tyr 145 150 155 160 Glu Leu Val Gln Thr Ala Glu Asn Met Ala His Gly Arg Ala Ser Gly 165 170 175 Val Asp Ala Met Thr Val Gly Ala Ser Arg Pro Leu Leu Phe Gln Gln 180 185 190 Gly Arg Thr Glu Arg Leu Ala Ile Gly Cys Asp Ser Leu Phe Ile Val 195 200 205 Ala Asp Ser Gly Val Pro Gly Ser Thr Lys Glu Ala Val Glu Met Leu 210 215 220 Arg Glu Gly Phe Thr Arg Ser Ala Gly Thr Gln Glu Arg Phe Val Gly 225 230 235 240 Arg Ala Thr Glu Leu Thr Glu Ala Ala Arg Gln Ala Leu Ala Asp Gly 245 250 255 Arg Pro Glu Glu Leu Gly Ser Gln Leu Thr Tyr Tyr His Glu Leu Leu 260 265 270 His Glu Ala Arg Leu Ser Thr Asp Gly Ile Asp Ala Leu Val Glu Ala 275 280 285 Ala Leu Lys Ala Gly Ser Leu Gly Ala Lys Ile Thr Gly Gly Gly Leu 290 295 300 Gly Gly Cys Met Ile Ala Gln Ala Arg Pro Glu Gln Ala Arg Glu Val 305 310 315 320 Thr Arg Gln Leu His Glu Ala Gly Ala Val Gln Thr Trp Val Val Pro 325 330 335 Leu Lys Gly Leu Asp Asn His Ala Gln 340 345 <210> 103 <211> 334 <212> PRT <213> Streptomyces griseosporeus <400> 103 Met Thr Leu Pro Thr Ser Val Glu Glu Gly Ser Lys Ala His Arg Ala 1 5 10 15 Arg Ala Val Gly Thr Gly Arg Ala His Ala Lys Ala Ile Leu Leu Gly 20 25 30 Glu His Ala Val Val Tyr Gly Thr Pro Ala Leu Ala Met Pro Ile Pro 35 40 45 Gln Leu Ala Val Thr Ala Ser Ala Gly Trp Ser Gly Arg Ser Ala Glu 50 55 60 Ser Arg Gly Gly Pro Thr Phe Thr Met Thr Gly Ser Ala Ser Arg Ala 65 70 75 80 Val Thr Ala Gln Ala Leu Asp Gly Leu Arg Arg Leu Thr Ala Ser Val 85 90 95 Lys Ala His Thr Gly Val Thr Asp Gly Gln His Leu Asp Val Ser Leu 100 105 110 Asp Gly Ala Ile Pro Pro Gly Arg Gly Leu Gly Ser Ser Ala Ala Asn 115 120 125 Ala Arg Ala Ile Ile Leu Ala Leu Ala Asp Leu Phe Gly Arg Glu Leu 130 135 140 Thr Glu Gly Glu Val Phe Asp Leu Val Gln Glu Ala Glu Asn Leu Thr 145 150 155 160 His Gly Arg Ala Ser Gly Val Asp Ala Val Thr Val Gly Ala Thr Ala 165 170 175 Pro Leu Leu Phe Arg Ala Gly Thr Ala Gln Ala Leu Asp Ile Gly Cys 180 185 190 Asp Ala Leu Phe Val Val Ala Asp Ser Gly Thr Ala Gly Ser Thr Lys 195 200 205 Glu Ala Ile Glu Leu Leu Arg Ala Gly Phe Arg Ala Gly Ala Gly Lys 210 215 220 Glu Glu Arg Phe Met His Arg Ala Ala His Leu Val Asp Asp Ala Arg 225 230 235 240 Ala Ser Leu Ala Glu Gly Glu Pro Glu Ala Phe Gly Ser Cys Leu Thr 245 250 255 Glu Tyr His Gly Leu Leu Arg Gly Ala Gly Leu Ser Thr Asp Arg Ile 260 265 270 Asp Ala Leu Val Asp Ala Ala Leu Gln Ala Asp Ser Leu Gly Ala Lys 275 280 285 Ile Thr Gly Gly Gly Leu Gly Gly Cys Val Leu Ala Met Ser Arg Pro 290 295 300 Glu Arg Ala Glu Glu Val Ala Arg Gln Leu His Ala Ala Gly Ala Val 305 310 315 320 Arg Thr Trp Ala Val Gln Leu Arg Arg Ser Thr His Glu Arg 325 330 <210> 104 <211> 296 <212> PRT <213> Borrelia burgdorferi <400> 104 Met Leu Arg Ile Arg Lys Pro Ala Lys Ile Leu Phe Leu Gly Glu His 1 5 10 15 Ser Ala Val Tyr Gly Phe Pro Val Ile Gly Ala Thr Val Pro Ile Tyr 20 25 30 Met Asp Leu Ile Tyr Ser Val Ser Lys Asn Trp Lys Tyr Leu Gly Lys 35 40 45 Pro Ser Thr Arg Leu Asn Ser Leu Ile Ser Phe Ile Val Ser Asn Tyr 50 55 60 Ser Lys Val Asn Pro Ile Glu Phe Asp Ile Ile Ser Glu Ile Pro Ile 65 70 75 80 Gly Val Gly Leu Gly Ser Ser Ala Ser Leu Ser Leu Cys Phe Ala Glu 85 90 95 Tyr Ile Thr Ser His Phe Glu Tyr Lys Asp Cys Asn Lys Ile Leu Leu 100 105 110 Ala Asn Gln Ile Glu Asn Ile Phe His Gly Lys Ser Ser Gly Met Asp 115 120 125 Ile Arg Leu Ile Asp Leu Asn Gly Thr Phe Tyr Leu Glu Lys Lys Glu 130 135 140 Asn Val Leu His Ser Lys Lys Ile Lys Asp Ser Gly Phe Tyr Phe Leu 145 150 155 160 Ile Gly Ala Ile Lys Arg Asp Leu Thr Thr Lys Glu Ile Val Val Asn 165 170 175 Leu Lys Lys Asp Leu Leu Ser Asn Ala Tyr Leu Phe Val Phe Ile Glu 180 185 190 Lys Leu Gly Leu Ala Val Ser Asn Ser Tyr Ala Ser Phe Gln Asn Lys 195 200 205 Asp Val Tyr Ser Leu Ala Asn Glu Met Asn Ile Ala Gln Cys Cys Leu 210 215 220 Lys Arg Leu Gly Leu Ser Asn Asp Thr Leu Asp Trp Leu Ile Ser Glu 225 230 235 240 Gly Ile Lys Leu Gly Ala Leu Ser Gly Lys Leu Ser Gly Ala Gly Lys 245 250 255 Gly Gly Ala Phe Ile Phe Leu Phe Glu Ser Leu Ile Lys Ala Asn Ile 260 265 270 Val Gln Lys Glu Leu Asn Asn Met Leu Asp Ser Lys Ile Asp Leu Leu 275 280 285 Leu Lys Leu Lys Val Ile Glu Thr 290 295 <210> 105 <211> 336 <212> PRT <213> Streptococcus pneumoniae <400> 105 Met Ile Ala Val Lys Thr Cys Gly Lys Leu Tyr Trp Ala Gly Glu Tyr 1 5 10 15 Ala Ile Leu Glu Pro Gly Gln Leu Ala Leu Ile Lys Asp Ile Pro Ile 20 25 30 Tyr Met Arg Ala Glu Ile Ala Phe Ser Asp Ser Tyr Arg Ile Tyr Ser 35 40 45 Asp Met Phe Asp Phe Ala Val Asp Leu Arg Pro Asn Pro Asp Tyr Ser 50 55 60 Leu Ile Gln Glu Thr Ile Ala Leu Met Gly Asp Phe Leu Ala Val Arg 65 70 75 80 Gly Gln Asn Leu Arg Pro Phe Ser Leu Lys Ile Cys Gly Lys Met Glu 85 90 95 Arg Glu Gly Lys Lys Phe Gly Leu Gly Ser Ser Gly Ser Val Val Val 100 105 110 Leu Val Val Lys Ala Leu Leu Ala Leu Tyr Asn Leu Ser Val Asp Gln 115 120 125 Asn Leu Leu Phe Lys Leu Thr Ser Ala Val Leu Leu Lys Arg Gly Asp 130 135 140 Asn Gly Ser Met Gly Asp Leu Ala Cys Ile Val Ala Glu Asp Leu Val 145 150 155 160 Leu Tyr Gln Ser Phe Asp Arg Gln Lys Ala Ala Ala Trp Leu Glu Glu 165 170 175 Glu Asn Leu Ala Thr Val Leu Glu Arg Asp Trp Gly Phe Phe Ile Ser 180 185 190 Gln Val Lys Pro Thr Leu Glu Cys Asp Phe Leu Val Gly Trp Thr Lys 195 200 205 Glu Val Ala Val Ser Ser His Met Val Gln Gln Ile Lys Gln Asn Ile 210 215 220 Asn Gln Asn Phe Leu Ser Ser Ser Lys Glu Thr Val Val Ser Leu Val 225 230 235 240 Glu Ala Leu Glu Gln Gly Lys Ala Glu Lys Val Ile Glu Gln Val Glu 245 250 255 Val Ala Ser Lys Leu Leu Glu Gly Leu Ser Thr Asp Ile Tyr Thr Pro 260 265 270 Leu Leu Arg Gln Leu Lys Glu Ala Ser Gln Asp Leu Gln Ala Val Ala 275 280 285 Lys Ser Ser Gly Ala Gly Gly Gly Asp Cys Gly Ile Ala Leu Ser Phe 290 295 300 Asp Ala Gln Ser Ser Arg Asn Thr Leu Lys Asn Arg Trp Ala Asp Leu 305 310 315 320 Gly Ile Glu Leu Leu Tyr Gln Glu Arg Ile Gly His Asp Asp Lys Ser 325 330 335 <210> 106 <211> 335 <212> PRT <213> Streptococcus pyogenes <400> 106 Met Ser Asn Tyr Cys Val Gln Thr Gly Gly Lys Leu Tyr Leu Thr Gly 1 5 10 15 Glu Tyr Ala Ile Leu Ile Pro Gly Gln Lys Ala Leu Ile His Phe Ile 20 25 30 Pro Leu Met Met Thr Ala Glu Ile Ser Pro Ala Ala His Ile Gln Leu 35 40 45 Ala Ser Asp Met Phe Ser His Lys Ala Gly Met Thr Pro Asp Ala Ser 50 55 60 Tyr Ala Leu Ile Gln Ala Thr Val Lys Thr Phe Ala Asp Tyr Leu Gly 65 70 75 80 Gln Ser Ile Asp Gln Leu Glu Pro Phe Ser Leu Ile Ile Thr Gly Lys 85 90 95 Met Glu Arg Asp Gly Lys Lys Phe Gly Ile Gly Ser Ser Gly Ser Val 100 105 110 Thr Leu Leu Thr Leu Lys Ala Leu Ser Ala Tyr Tyr Gln Ile Thr Leu 115 120 125 Thr Pro Glu Leu Leu Phe Lys Leu Ala Ala Tyr Thr Leu Leu Lys Gln 130 135 140 Gly Asp Asn Gly Ser Met Gly Asp Ile Ala Cys Ile Ala Tyr Gln Thr 145 150 155 160 Leu Val Ala Tyr Thr Ser Phe Asp Arg Glu Gln Val Ser Asn Trp Leu 165 170 175 Gln Thr Met Pro Leu Lys Lys Leu Leu Val Lys Asp Trp Gly Tyr His 180 185 190 Ile Gln Val Ile Gln Pro Ala Leu Pro Cys Asp Phe Leu Val Gly Trp 195 200 205 Thr Lys Ile Pro Ala Ile Ser Arg Gln Met Ile Gln Gln Val Thr Ala 210 215 220 Ser Ile Thr Pro Ala Phe Leu Arg Thr Ser Tyr Gln Leu Thr Gln Ser 225 230 235 240 Ala Met Val Ala Leu Gln Glu Gly His Lys Glu Glu Leu Lys Lys Ser 245 250 255 Leu Ala Gly Ala Ser His Leu Leu Lys Glu Leu His Pro Ala Ile Tyr 260 265 270 His Pro Lys Leu Val Thr Leu Val Ala Ala Cys Gln Lys Gln Asp Ala 275 280 285 Val Ala Lys Ser Ser Gly Ala Gly Gly Gly Asp Cys Gly Ile Ala Leu 290 295 300 Ala Phe Asn Gln Asp Ala Arg Asp Thr Leu Ile Ser Lys Trp Gln Glu 305 310 315 320 Ala Asp Ile Ala Leu Leu Tyr Gln Glu Arg Trp Gly Glu Asn Asp 325 330 335 <210> 107 <211> 368 <212> PRT <213> Enterococcus faecalis <400> 107 Met Ile Glu Val Thr Thr Pro Gly Lys Leu Phe Ile Ala Gly Glu Tyr 1 5 10 15 Ala Val Val Glu Pro Gly His Pro Ala Ile Ile Val Ala Val Asp Gln 20 25 30 Phe Val Thr Val Thr Val Glu Glu Thr Thr Asp Glu Gly Ser Ile Gln 35 40 45 Ser Ala Gln Tyr Ser Ser Leu Pro Ile Arg Trp Thr Arg Arg Asn Gly 50 55 60 Glu Leu Val Leu Asp Ile Arg Glu Asn Pro Phe His Tyr Val Leu Ala 65 70 75 80 Ala Ile His Leu Thr Glu Lys Tyr Ala Gln Glu Gln Asn Lys Glu Leu 85 90 95 Ser Phe Tyr His Leu Lys Val Thr Ser Glu Leu Asp Ser Ser Asn Gly 100 105 110 Arg Lys Tyr Gly Leu Gly Ser Ser Gly Ala Val Thr Val Gly Thr Val 115 120 125 Lys Ala Leu Asn Ile Phe Tyr Asp Leu Gly Leu Glu Asn Glu Glu Ile 130 135 140 Phe Lys Leu Ser Ala Leu Ala His Leu Ala Val Gln Gly Asn Gly Ser 145 150 155 160 Cys Gly Asp Ile Ala Ala Ser Cys Tyr Gly Gly Trp Ile Ala Phe Ser 165 170 175 Thr Phe Asp His Asp Trp Val Asn Gln Lys Val Thr Thr Glu Thr Leu 180 185 190 Thr Asp Leu Leu Ala Met Asp Trp Pro Glu Leu Met Ile Phe Pro Leu 195 200 205 Lys Val Pro Lys Gln Leu Arg Leu Leu Ile Gly Trp Thr Gly Ser Pro 210 215 220 Ala Ser Thr Ser Asp Leu Val Asp Arg Val His Gln Ser Lys Glu Glu 225 230 235 240 Lys Gln Ala Ala Tyr Glu Gln Phe Leu Met Lys Ser Arg Leu Cys Val 245 250 255 Glu Thr Met Ile Asn Gly Phe Asn Thr Gly Lys Ile Ser Val Ile Gln 260 265 270 Lys Gln Ile Thr Lys Asn Arg Gln Leu Leu Ala Glu Leu Ser Ser Leu 275 280 285 Thr Gly Val Val Ile Glu Thr Glu Ala Leu Lys Asn Leu Cys Asp Leu 290 295 300 Ala Glu Ser Tyr Thr Gly Ala Ala Lys Ser Ser Gly Ala Gly Gly Gly 305 310 315 320 Asp Cys Gly Ile Val Ile Phe Arg Gln Lys Ser Gly Ile Leu Pro Leu 325 330 335 Met Thr Ala Trp Glu Lys Asp Gly Ile Thr Pro Leu Pro Leu His Val 340 345 350 Tyr Thr Tyr Gly Gln Lys Glu Cys Lys Glu Lys His Glu Ser Lys Arg 355 360 365 <210> 108 <211> 361 <212> PRT <213> Enterococcus faecium <400> 108 Met Ile Glu Val Ser Ala Pro Gly Lys Leu Tyr Ile Ala Gly Glu Tyr 1 5 10 15 Ala Val Val Glu Thr Gly His Pro Ala Val Ile Ala Ala Val Asp Gln 20 25 30 Phe Val Thr Val Thr Val Glu Ser Ala Arg Lys Val Gly Ser Ile Gln 35 40 45 Ser Ala Gln Tyr Ser Gly Met Pro Val Arg Trp Thr Arg Arg Asn Gly 50 55 60 Glu Leu Val Leu Asp Ile Arg Glu Asn Pro Phe His Tyr Ile Leu Ala 65 70 75 80 Ala Ile Arg Leu Thr Glu Lys Tyr Ala Gln Glu Lys Asn Ile Leu Leu 85 90 95 Ser Phe Tyr Asp Leu Lys Val Thr Ser Glu Leu Asp Ser Ser Asn Gly 100 105 110 Arg Lys Tyr Gly Leu Gly Ser Ser Gly Ala Val Thr Val Ala Thr Val 115 120 125 Lys Ala Leu Asn Val Phe Tyr Ala Leu Asn Leu Ser Gln Leu Glu Ile 130 135 140 Phe Lys Ile Ala Ala Leu Ala Asn Leu Ala Val Gln Asp Asn Gly Ser 145 150 155 160 Cys Gly Asp Ile Ala Ala Ser Cys Tyr Gly Gly Trp Ile Ala Phe Ser 165 170 175 Thr Phe Asp His Pro Trp Leu Gln Glu Gln Glu Thr Gln His Ser Ile 180 185 190 Ser Glu Leu Leu Ala Leu Asp Trp Pro Gly Leu Ser Ile Glu Pro Leu 195 200 205 Ile Ala Pro Glu Asp Leu Arg Leu Leu Ile Gly Trp Thr Gly Ser Pro 210 215 220 Ala Ser Thr Ser Asp Leu Val Asp Gln Val His Arg Ser Arg Glu Asp 225 230 235 240 Lys Met Val Ala Tyr Gln Leu Phe Leu Lys Asn Ser Thr Glu Cys Val 245 250 255 Asn Glu Met Ile Lys Gly Phe Lys Glu Asn Asn Val Thr Leu Ile Gln 260 265 270 Gln Met Ile Arg Lys Asn Arg Gln Leu Leu His Asp Leu Ser Ala Ile 275 280 285 Thr Gly Val Val Ile Glu Thr Pro Ala Leu Asn Lys Leu Cys Asn Leu 290 295 300 Ala Glu Gln Tyr Glu Gly Ala Ala Lys Ser Ser Gly Ala Gly Gly Gly 305 310 315 320 Asp Cys Gly Ile Val Ile Val Asp Gln Lys Ser Gly Ile Leu Pro Leu 325 330 335 Met Ser Ala Trp Glu Lys Ala Glu Ile Thr Pro Leu Pro Leu His Val 340 345 350 Tyr Ser Asp Gln Arg Lys Glu Asn Arg 355 360 <210> 109 <211> 358 <212> PRT <213> Staphylococcus haemolyticus <400> 109 Met Ile Gln Val Lys Ala Pro Gly Lys Leu Tyr Val Ala Gly Glu Tyr 1 5 10 15 Ala Val Thr Glu Pro Gly Tyr Lys Ser Val Leu Ile Ala Val Asp Arg 20 25 30 Phe Val Thr Ala Ser Ile Glu Ala Ser Asn Ala Val Thr Ser Thr Ile 35 40 45 His Ser Lys Thr Leu His Tyr Glu Pro Val Thr Phe Asn Arg Asn Glu 50 55 60 Asp Lys Ile Asp Ile Ser Asp Ala Asn Ala Ala Ser Gln Leu Lys Tyr 65 70 75 80 Val Val Thr Ala Ile Glu Val Phe Glu Gln Tyr Ala Arg Ser Cys Asn 85 90 95 Val Lys Leu Lys His Phe His Leu Glu Ile Asp Ser Asn Leu Asp Asp 100 105 110 Ala Ser Gly Asn Lys Tyr Gly Leu Gly Ser Ser Ala Ala Val Leu Val 115 120 125 Ser Val Val Lys Ala Leu Asn Glu Phe Tyr Asp Met Gln Leu Ser Asn 130 135 140 Leu Tyr Ile Tyr Lys Leu Ala Val Ile Ser Asn Met Arg Leu Gln Ser 145 150 155 160 Leu Ser Ser Cys Gly Asp Ile Ala Val Ser Val Tyr Ser Gly Trp Leu 165 170 175 Ala Tyr Ser Thr Phe Asp His Asp Trp Val Lys Gln Gln Met Glu Glu 180 185 190 Thr Ser Val Asn Glu Val Leu Glu Lys Asn Trp Pro Gly Leu His Ile 195 200 205 Glu Pro Leu Gln Ala Pro Glu Asn Met Glu Val Leu Ile Gly Trp Thr 210 215 220 Gly Ser Pro Ala Ser Ser Pro His Leu Val Ser Glu Val Lys Arg Leu 225 230 235 240 Lys Ser Asp Pro Ser Phe Tyr Gly Arg Phe Leu Asp Gln Ser His Thr 245 250 255 Cys Val Glu Asn Leu Ile Tyr Ala Phe Lys Thr Asp Asn Ile Lys Gly 260 265 270 Val Gln Lys Met Ile Arg Gln Asn Arg Met Ile Ile Gln Gln Met Asp 275 280 285 Asn Glu Ala Thr Val Asp Ile Glu Thr Glu Asn Leu Lys Met Leu Cys 290 295 300 Asp Ile Gly Glu Arg Tyr Gly Ala Ala Ala Lys Thr Ser Gly Ala Gly 305 310 315 320 Gly Gly Asp Cys Gly Ile Ala Ile Ile Asp Asn Arg Ile Asp Lys Asn 325 330 335 Arg Ile Tyr Asn Glu Trp Ala Ser His Gly Ile Lys Pro Leu Lys Phe 340 345 350 Lys Ile Tyr His Gly Gln 355 <210> 110 <211> 358 <212> PRT <213> Staphylococcus epidermidis <400> 110 Met Ile Gln Val Lys Ala Pro Gly Lys Leu Tyr Ile Ala Gly Glu Tyr 1 5 10 15 Ala Val Thr Glu Pro Gly Tyr Lys Ser Ile Leu Ile Ala Val Asn Arg 20 25 30 Phe Val Thr Ala Thr Ile Glu Ala Ser Asn Lys Val Glu Gly Ser Ile 35 40 45 His Ser Lys Thr Leu His Tyr Glu Pro Val Lys Phe Asp Arg Asn Glu 50 55 60 Asp Arg Ile Glu Ile Ser Asp Val Gln Ala Ala Lys Gln Leu Lys Tyr 65 70 75 80 Val Val Thr Ala Ile Glu Val Phe Glu Gln Tyr Val Arg Ser Cys Asn 85 90 95 Met Asn Leu Lys His Phe His Leu Thr Ile Asp Ser Asn Leu Ala Asp 100 105 110 Asn Ser Gly Gln Lys Tyr Gly Leu Gly Ser Ser Ala Ala Val Leu Val 115 120 125 Ser Val Val Lys Ala Leu Asn Glu Phe Tyr Gly Leu Glu Leu Ser Asn 130 135 140 Leu Tyr Ile Tyr Lys Leu Ala Val Ile Ala Asn Met Lys Leu Gln Ser 145 150 155 160 Leu Ser Ser Cys Gly Asp Ile Ala Val Ser Val Tyr Ser Gly Trp Leu 165 170 175 Ala Tyr Ser Thr Phe Asp His Asp Trp Val Lys Gln Gln Met Glu Glu 180 185 190 Thr Ser Val Asn Asp Val Leu Glu Lys Asn Trp Pro Gly Leu His Ile 195 200 205 Glu Pro Leu Gln Ala Pro Glu Asn Met Glu Val Leu Ile Gly Trp Thr 210 215 220 Gly Ser Pro Ala Ser Ser Pro His Leu Val Ser Glu Val Lys Arg Leu 225 230 235 240 Lys Ser Asp Pro Ser Phe Tyr Gly Asp Phe Leu Asp Gln Ser His Ala 245 250 255 Cys Val Glu Ser Leu Ile Gln Ala Phe Lys Thr Asn Asn Ile Lys Gly 260 265 270 Val Gln Lys Met Ile Arg Ile Asn Arg Arg Ile Ile Gln Ser Met Asp 275 280 285 Asn Glu Ala Ser Val Glu Ile Glu Thr Asp Lys Leu Lys Lys Leu Cys 290 295 300 Asp Val Gly Glu Lys His Gly Gly Ala Ser Lys Thr Ser Gly Ala Gly 305 310 315 320 Gly Gly Asp Cys Gly Ile Thr Ile Ile Asn Lys Val Ile Asp Lys Asn 325 330 335 Ile Ile Tyr Asn Glu Trp Gln Met Asn Asp Ile Lys Pro Leu Lys Phe 340 345 350 Lys Ile Tyr His Gly Gln 355 <210> 111 <211> 358 <212> PRT <213> Staphylococcus aureus <400> 111 Met Ile Gln Val Lys Ala Pro Gly Lys Leu Tyr Ile Ala Gly Glu Tyr 1 5 10 15 Ala Val Thr Glu Pro Gly Tyr Lys Ser Val Leu Ile Ala Leu Asp Arg 20 25 30 Phe Val Thr Ala Thr Ile Glu Glu Ala Thr Gln Tyr Lys Gly Thr Ile 35 40 45 His Ser Lys Ala Leu His His Asn Pro Val Thr Phe Ser Arg Asp Glu 50 55 60 Asp Ser Ile Val Ile Ser Asp Pro His Ala Ala Lys Gln Leu Asn Tyr 65 70 75 80 Val Val Thr Ala Ile Glu Ile Phe Glu Gln Tyr Ala Lys Ser Cys Asp 85 90 95 Ile Ala Met Lys His Phe His Leu Thr Ile Asp Ser Asn Leu Asp Asp 100 105 110 Ser Asn Gly His Lys Tyr Gly Leu Gly Ser Ser Ala Ala Val Leu Val 115 120 125 Ser Val Ile Lys Val Leu Asn Glu Phe Tyr Asp Met Lys Leu Ser Asn 130 135 140 Leu Tyr Ile Tyr Lys Leu Ala Val Ile Ala Asn Met Lys Leu Gln Ser 145 150 155 160 Leu Ser Ser Cys Gly Asp Ile Ala Val Ser Val Tyr Ser Gly Trp Leu 165 170 175 Ala Tyr Ser Thr Phe Asp His Glu Trp Val Lys His Gln Ile Glu Asp 180 185 190 Thr Thr Val Glu Glu Val Leu Ile Lys Asn Trp Pro Gly Leu His Ile 195 200 205 Glu Pro Leu Gln Ala Pro Glu Asn Met Glu Val Leu Ile Gly Trp Thr 210 215 220 Gly Ser Pro Ala Ser Ser Pro His Phe Val Ser Glu Val Lys Arg Leu 225 230 235 240 Lys Ser Asp Pro Ser Phe Tyr Gly Asp Phe Leu Glu Asp Ser His Arg 245 250 255 Cys Val Glu Lys Leu Ile His Ala Phe Lys Thr Asn Asn Ile Lys Gly 260 265 270 Val Gln Lys Met Val Arg Gln Asn Arg Thr Ile Ile Gln Arg Met Asp 275 280 285 Lys Glu Ala Thr Val Asp Ile Glu Thr Glu Lys Leu Lys Tyr Leu Cys 290 295 300 Asp Ile Ala Glu Lys Tyr His Gly Ala Ser Lys Thr Ser Gly Ala Gly 305 310 315 320 Gly Gly Asp Cys Gly Ile Thr Ile Ile Asn Lys Asp Val Asp Lys Glu 325 330 335 Lys Ile Tyr Asp Glu Trp Thr Lys His Gly Ile Lys Pro Leu Lys Phe 340 345 350 Asn Ile Tyr His Gly Gln 355 <210> 112 <211> 374 <212> PRT <213> Streptomyces sp. <400> 112 Met Thr Thr Gly Gln Arg Thr Ile Val Arg His Ala Pro Gly Lys Leu 1 5 10 15 Phe Val Ala Gly Glu Tyr Ala Val Val Asp Pro Gly Asn Pro Ala Ile 20 25 30 Leu Val Ala Val Asp Arg His Ile Ser Val Thr Val Ser Asp Ala Asp 35 40 45 Ala Asp Thr Gly Ala Ala Asp Val Val Ile Ser Ser Asp Leu Gly Pro 50 55 60 Gln Ala Val Gly Trp Arg Trp His Asp Gly Arg Leu Val Val Arg Asp 65 70 75 80 Pro Asp Asp Gly Gln Gln Ala Arg Ser Ala Leu Ala His Val Val Ser 85 90 95 Ala Ile Glu Thr Val Gly Arg Leu Leu Gly Glu Arg Gly Gln Lys Val 100 105 110 Pro Ala Leu Thr Leu Ser Val Ser Ser Arg Leu His Glu Asp Gly Arg 115 120 125 Lys Phe Gly Leu Gly Ser Ser Gly Ala Val Thr Val Ala Thr Val Ala 130 135 140 Ala Val Ala Ala Phe Cys Gly Leu Glu Leu Ser Thr Asp Glu Arg Phe 145 150 155 160 Arg Leu Ala Met Leu Ala Thr Ala Glu Leu Asp Pro Lys Gly Ser Gly 165 170 175 Gly Asp Leu Ala Ala Ser Thr Trp Gly Gly Trp Ile Ala Tyr Gln Ala 180 185 190 Pro Asp Arg Ala Phe Val Leu Asp Leu Ala Arg Arg Val Gly Val Asp 195 200 205 Arg Thr Leu Lys Ala Pro Trp Pro Gly His Ser Val Arg Arg Leu Pro 210 215 220 Ala Pro Lys Gly Leu Thr Leu Glu Val Gly Trp Thr Gly Glu Pro Ala 225 230 235 240 Ser Thr Ala Ser Leu Val Ser Asp Leu His Arg Arg Thr Trp Arg Gly 245 250 255 Ser Ala Ser His Gln Arg Phe Val Glu Thr Thr Thr Asp Cys Val Arg 260 265 270 Ser Ala Val Thr Ala Leu Glu Ser Gly Asp Asp Thr Ser Leu Leu His 275 280 285 Glu Ile Arg Arg Ala Arg Gln Glu Leu Ala Arg Leu Asp Asp Glu Val 290 295 300 Gly Leu Gly Ile Phe Thr Pro Lys Leu Thr Ala Leu Cys Asp Ala Ala 305 310 315 320 Glu Ala Val Gly Gly Ala Ala Lys Pro Ser Gly Ala Gly Gly Gly Asp 325 330 335 Cys Gly Ile Ala Leu Leu Asp Ala Glu Ala Ser Arg Asp Ile Thr His 340 345 350 Val Arg Gln Arg Trp Glu Thr Ala Gly Val Leu Pro Leu Pro Leu Thr 355 360 365 Pro Ala Leu Glu Gly Ile 370 <210> 113 <211> 360 <212> PRT <213> Streptomyces griseosporeus <400> 113 Met Thr Gly Pro Arg Ala Val Thr Arg Arg Ala Pro Gly Lys Leu Phe 1 5 10 15 Val Ala Gly Glu Tyr Ala Val Val Glu Pro Gly Asn Arg Ala Ile Leu 20 25 30 Val Ala Val Asp Arg Tyr Val Thr Val Thr Val Ser Asp Gly Ala Ala 35 40 45 Pro Gly Val Val Val Ser Ser Asp Ile Gly Ala Gly Pro Val His His 50 55 60 Pro Trp Gln Asp Gly Arg Leu Thr Gly Gly Thr Gly Thr Pro His Val 65 70 75 80 Val Ala Ala Val Glu Thr Val Ala Arg Leu Leu Ala Glu Arg Gly Arg 85 90 95 Ser Val Pro Pro Leu Gly Trp Ser Ile Ser Ser Thr Leu His Glu Asp 100 105 110 Gly Arg Lys Phe Gly Leu Gly Ser Ser Gly Ala Val Thr Val Ala Thr 115 120 125 Val Ser Ala Val Ala Ala His Cys Gly Leu Glu Leu Thr Ala Glu Glu 130 135 140 Arg Phe Arg Thr Ala Leu Ile Ala Ser Ala Arg Ile Asp Pro Arg Gly 145 150 155 160 Ser Gly Gly Asp Ile Ala Thr Ser Thr Trp Gly Gly Trp Ile Ala Tyr 165 170 175 Arg Ala Pro Asp Arg Asp Ala Val Leu Asp Leu Thr Arg Arg Gln Gly 180 185 190 Val Asp Glu Ala Leu Arg Ala Pro Trp Pro Gly Phe Ser Val Arg Leu 195 200 205 Ser Pro Pro Arg Asn Leu Cys Leu Glu Val Gly Trp Thr Gly Asn Pro 210 215 220 Val Ser Thr Thr Ser Leu Leu Thr Asp Leu His Arg Arg Thr Trp Arg 225 230 235 240 Gly Ser Pro Ala Tyr Arg Arg Tyr Val Gly Ala Thr Gly Glu Leu Val 245 250 255 Asp Ala Ala Val Ile Ala Leu Glu Asp Gly Asp Thr Glu Gly Leu Leu 260 265 270 Arg Gln Val Arg Arg Ala Arg His Glu Met Val Arg Leu Asp Asp Glu 275 280 285 Val Gly Leu Gly Ile Phe Thr Pro Glu Leu Thr Ala Leu Cys Ala Ile 290 295 300 Ala Glu Arg Ala Gly Ala Ala Lys Pro Ser Gly Ala Gly Gly Gly Asp 305 310 315 320 Cys Gly Ile Ala Leu Leu Asp Ala Glu Ala Arg Tyr Asp Arg Ser Pro 325 330 335 Leu His Arg Gln Trp Ala Ala Ala Gly Val Leu Pro Leu Leu Val Ser 340 345 350 Pro Ala Thr Glu Gly Val Glu Glu 355 360 <210> 114 <211> 317 <212> PRT <213> Borrelia burgdorferi <400> 114 Met Asp Leu Ile Ser Phe Ser Val Pro Gly Asn Leu Leu Leu Met Gly 1 5 10 15 Glu Tyr Thr Ile Leu Glu Glu Lys Gly Leu Gly Leu Ala Ile Ala Ile 20 25 30 Asn Lys Arg Ala Phe Phe Ser Phe Lys Lys Ser Asp Ser Trp Arg Phe 35 40 45 Phe Ser Lys Lys Lys Lys Ile Asp Asp Phe Ser Leu Ile Glu Asn Arg 50 55 60 Ser Asp Phe Val Phe Lys Met Phe Ala Tyr Leu Ser Gln Asn Cys Phe 65 70 75 80 Phe Asn Leu Glu Asn Phe Ala Tyr Asp Val Tyr Ile Asp Thr Ser Asn 85 90 95 Phe Phe Phe Asn Asp Gly Thr Lys Lys Gly Phe Gly Ser Ser Ala Val 100 105 110 Val Ala Ile Gly Ile Val Cys Gly Leu Phe Leu Ile His Asn Ala Thr 115 120 125 Asn Val Val Glu Lys Gly Glu Ile Phe Lys Tyr Cys Leu Glu Ala Tyr 130 135 140 Arg Tyr Ser Gln Gly Gly Ile Gly Ser Gly Tyr Asp Ile Ala Thr Ser 145 150 155 160 Ile Phe Gly Gly Val Ile Glu Phe Glu Gly Gly Phe Asn Pro Lys Cys 165 170 175 Arg Gln Leu Gly Ala Val Glu Phe Asn Asp Phe Tyr Leu Met Gln Gly 180 185 190 Leu Gln Ala Ile Lys Thr Thr Thr Ser Ile Cys Glu Tyr Asn Lys His 195 200 205 Arg Asn Ser Ile Leu Asp Phe Ile Leu Lys Cys Asn Leu Glu Met Lys 210 215 220 Lys Leu Val Leu Asn Ala Ser Asn Ser Lys Ser Ala Leu Ile Ser Ser 225 230 235 240 Leu Arg Arg Ala Lys Glu Leu Gly Leu Ala Ile Gly Glu Ala Ile Gly 245 250 255 Val Ser Ala Ala Leu Pro Ser Ser Phe Asp His Leu Leu Gly Gln Cys 260 265 270 Asp Leu Ile Lys Ala Leu Gly Ala Gly Asn Glu Thr Phe Leu Val Tyr 275 280 285 Arg Pro Asn Ile Glu Ala Phe Asn Leu Ser Lys Ile Ile Ser Ile Val 290 295 300 Leu Glu Asn Glu Gly Ile Lys Phe Glu Ser Asp Lys Cys 305 310 315 <210> 115 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 115 gggcaagctt gtccacggca cgaccaagca 30 <210> 116 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 116 cgtaatccgc ggccgcgttt ccagcgcgtc 30 <210> 117 <211> 28 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(28) <223> primer <400> 117 aattaaagga gggtttcata tgaattcg 28 <210> 118 <211> 28 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(28) <223> primer <400> 118 gatccgaatt catatgaaac cctccttt 28 <210> 119 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 119 aaggcctcat atgatttccc ataccccggt 30 <210> 120 <211> 28 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(28) <223> primer <400> 120 cgggatcctc atcgctccat ctccatgt 28 <210> 121 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 121 aaggcctcat atgaccgaca gcaaggatca 30 <210> 122 <211> 28 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(28) <223> primer <400> 122 cgggatcctc attgacggat aagcgagg 28 <210> 123 <211> 29 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(29) <223> primer <400> 123 aaggcctcat atgaaagtgc ctaagatga 29 <210> 124 <211> 28 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(28) <223> primer <400> 124 cgggatcctc aggcctgccg gtcgacat 28 <210> 125 <211> 34 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(34) <223> primer <400> 125 aaggcctcat atgagcaccg gcaggcctga agca 34 <210> 126 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 126 cgggatcctc atccctgccc cggcagcggt t 31 <210> 127 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 127 aaggcctcat atggatcagg tcatccgcgc 30 <210> 128 <211> 28 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(28) <223> primer <400> 128 cgggatcctc agtcatcgaa aacaagtc 28 <210> 129 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 129 aaggcctcat atgactgatg ccgtccgcga 30 <210> 130 <211> 28 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(28) <223> primer <400> 130 cgggatcctc aacgcccctc gaacggcg 28 <210> 131 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 131 ccggcattcg ggcggcatcc aggtctcgct g 31 <210> 132 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 132 cagcgagacc tggatgccgc ccgaatgccg g 31 <210> 133 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 133 cgtgcagggc tggattctgt cggaataccc g 31 <210> 134 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 134 cgggtattcc gacagaatcc agccctgcac g 31 <210> 135 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 135 gggctgcgcg ccggcatccg gcatttcgac g 31 <210> 136 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 136 cgtcgaaatg ccggatgccg gcgcgcagcc c 31 <210> 137 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 137 gggtgcgacg ggcgagttct tcgatgcgcg g 31 <210> 138 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 138 ccgcgcatcg aagaactcgc ccgtcgcacc c 31 <210> 139 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 139 cacgcccgtc acatacgacg aatacgttgc c 31 <210> 140 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 140 ggcaacgtat tcgtcgtatg tgacgggcgt g 31 <210> 141 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 141 gaggctcggg cttggctcct cggcggcggt g 31 <210> 142 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 142 caccgccgcc gaggagccaa gcccgagcct c 31 <210> 143 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 143 cggcacgctg ctggacccgg gcgacgcctt c 31 <210> 144 <211> 31 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(31) <223> primer <400> 144 gaaggcgtcg cccgggtcca gcagcgtgcc g 31 <210> 145 <211> 36 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(36) <223> oligonucleotide <400> 145 tcagaattcg gtaccatatg aagcttggat ccgggg 36 <210> 146 <211> 29 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(29) <223> oligonucleotide <400> 146 ggatccaagc ttcatatggt accgaattc 29 <210> 147 <211> 26 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(26) <223> primer <400> 147 ggaattcgct gctgaacgcg atggcg 26 <210> 148 <211> 32 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(32) <223> primer <400> 148 ggggtaccat atgtgccttc gttgcgtcag tc 32 <210> 149 <211> 50 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(50) <223> oligonucleotide <400> 149 gatccggcgt gtgcgcaatt taattgcgca cacgccccct gcgtttaaac 50 <210> 150 <211> 50 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(50) <223> oligonucleotide <400> 150 gatcgtttaa acgcaggggg cgtgtgcgca attaaattgc gcacacgccg 50 <210> 151 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 151 aaggcctcat atgacgccca agcagcaatt 30 <210> 152 <211> 26 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(26) <223> primer <400> 152 cgggatccta ggcgctgcgg cggatg 26 <210> 153 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 153 ccggatcctc atgcctgccg gtcgacatag 30 <210> 154 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 154 gaaggcacat atgaatcagg tcatccgcgc 30 <210> 155 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 155 gccggatcct cattcatcga aaacaagtcc 30 <210> 156 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 156 acgccggatc ctcatcgccc ctcgaacggc 30 <210> 157 <211> 1612 <212> DNA <213> Paracoccus sp. <220> <221> gene <222> (1)..(1612) <400> 157 ccatggcatc cgggtcggat gccgtctatg ttggcccgaa caggcagcag gaggccccat 60 gagcgatatc cagaccctct cgttcgagga agccatgcgc gagctggagg cgaccgtcgg 120 caagctggaa accggcgagg cgacgctcga ggactccatc gcgctctatg aacgcggggc 180 ggcgctgcgc gcccattgcg aaacccgcct gcgcgaggcc gaggagcggg tcgagaagat 240 caccctggcc gcgaacgggc agccgtccgg aaccgagccc gccgagggcc tgtgatgcag 300 gcccgcctgg ccgagatccg gcccctggtc gaggccgagc tgaacgccgc catcgacgcg 360 ctgcccgcgg gcgatctgtc ggatgcgatg cgctatgccg tgcagggcgg caagcggctg 420 cgcgcgttcc tggtgatgga gtcggcgcgc ctgcacgggc tggacgacga cgcatcgctg 480 cccgtcgccg ccgcggtcga ggcgctgcac gcctacagct tggtccatga cgacctgccc 540 gcgatggatg acgacgacct gcggcgcggt cagcccaccg tccacgtcaa atggaccgag 600 gcgaccgcga tccttgcggg cgatgcgctg cagacgctgg ccttccagct gctggccgat 660 ccgcgcgtgg gcgacgatgc ggcgcggatg cggctggtcg gttcgctggc gcaggcatcg 720 ggggctgcgg gcatggtctg gggccaggcg ctggacatcg cggccgagac ctcgggcgtg 780 ccgctggatc tggacgcgat catccgcctg cagggtggca agaccggcgc gctgatccgc 840 tttgccgcga ccgccgggcc gctgatggcg ggggcggacc ctgccgcgct ggacgattat 900 gcgcaggccg tcgggctggc cttccagatc gcggacgaca tcctggacgt cgagggctgc 960 gaggccgcga ccggcaagcg cgtcggcaag gatgcggatg ccaacaaggc gaccttcgtc 1020 tcgctgctgg gcctcgaggg ggcgcggtcc gaggcgcgtc gcctggccga tgcggggcag 1080 gacgcgctgg cgggttacgg cgatgctgcg gggaaccttc gggacctggc gcgcttcgtg 1140 atcgaacgcg acagctgatc gccgccttcc cgccaagggg caagatgatg accgacggac 1200 ccgcaacccc gatcctggac cgcgtccagc agccatccga cctggcatcg ctggacgatg 1260 cgcagctgcg cctgctggcg gacgagctgc gggccgagac catcgacatc gtcagccgca 1320 cgggcggtca cctgggcgcg gggctgggcg tggtcgaact gacggtcgcc ctgcacgccg 1380 tctttcgggc gccgcgcgac aagatcgtct gggacgtggg gcatcaatgc tatccccaca 1440 agatcctgac gggcaggcgg gaccggatgc gcacgctgcg catgggcggc gggctgtcgg 1500 ggttcaccaa gcggcaggaa agcgcgttcg atccgttcgg tgcggggcac agctcgacct 1560 cgatctcggc ggcgctgggc ttcgcgatgg cgcgtgaact tggcggggat cc 1612 <210> 158 <211> 78 <212> PRT <213> Paracoccus sp. <400> 158 Met Ser Asp Ile Gln Thr Leu Ser Phe Glu Glu Ala Met Arg Glu Leu 1 5 10 15 Glu Ala Thr Val Gly Lys Leu Glu Thr Gly Glu Ala Thr Leu Glu Asp 20 25 30 Ser Ile Ala Leu Tyr Glu Arg Gly Ala Ala Leu Arg Ala His Cys Glu 35 40 45 Thr Arg Leu Arg Glu Ala Glu Glu Arg Val Glu Lys Ile Thr Leu Ala 50 55 60 Ala Asn Gly Gln Pro Ser Gly Thr Glu Pro Ala Glu Gly Leu 65 70 75 <210> 159 <211> 287 <212> PRT <213> Paracoccus sp. <400> 159 Met Gln Ala Arg Leu Ala Glu Ile Arg Pro Leu Val Glu Ala Glu Leu 1 5 10 15 Asn Ala Ala Ile Asp Ala Leu Pro Ala Gly Asp Leu Ser Asp Ala Met 20 25 30 Arg Tyr Ala Val Gln Gly Gly Lys Arg Leu Arg Ala Phe Leu Val Met 35 40 45 Glu Ser Ala Arg Leu His Gly Leu Asp Asp Asp Ala Ser Leu Pro Val 50 55 60 Ala Ala Ala Val Glu Ala Leu His Ala Tyr Ser Leu Val His Asp Asp 65 70 75 80 Leu Pro Ala Met Asp Asp Asp Asp Leu Arg Arg Gly Gln Pro Thr Val 85 90 95 His Val Lys Trp Thr Glu Ala Thr Ala Ile Leu Ala Gly Asp Ala Leu 100 105 110 Gln Thr Leu Ala Phe Gln Leu Leu Ala Asp Pro Arg Val Gly Asp Asp 115 120 125 Ala Ala Arg Met Arg Leu Val Gly Ser Leu Ala Gln Ala Ser Gly Ala 130 135 140 Ala Gly Met Val Trp Gly Gln Ala Leu Asp Ile Ala Ala Glu Thr Ser 145 150 155 160 Gly Val Pro Leu Asp Leu Asp Ala Ile Ile Arg Leu Gln Gly Gly Lys 165 170 175 Thr Gly Ala Leu Ile Arg Phe Ala Ala Thr Ala Gly Pro Leu Met Ala 180 185 190 Gly Ala Asp Pro Ala Ala Leu Asp Asp Tyr Ala Gln Ala Val Gly Leu 195 200 205 Ala Phe Gln Ile Ala Asp Asp Ile Leu Asp Val Glu Gly Cys Glu Ala 210 215 220 Ala Thr Gly Lys Arg Val Gly Lys Asp Ala Asp Ala Asn Lys Ala Thr 225 230 235 240 Phe Val Ser Leu Leu Gly Leu Glu Gly Ala Arg Ser Glu Ala Arg Arg 245 250 255 Leu Ala Asp Ala Gly Gln Asp Ala Leu Ala Gly Tyr Gly Asp Ala Ala 260 265 270 Gly Asn Leu Arg Asp Leu Ala Arg Phe Val Ile Glu Arg Asp Ser 275 280 285 <210> 160 <211> 142 <212> PRT <213> Paracoccus sp. <400> 160 Met Met Thr Asp Gly Pro Ala Thr Pro Ile Leu Asp Arg Val Gln Gln 1 5 10 15 Pro Ser Asp Leu Ala Ser Leu Asp Asp Ala Gln Leu Arg Leu Leu Ala 20 25 30 Asp Glu Leu Arg Ala Glu Thr Ile Asp Ile Val Ser Arg Thr Gly Gly 35 40 45 His Leu Gly Ala Gly Leu Gly Val Val Glu Leu Thr Val Ala Leu His 50 55 60 Ala Val Phe Arg Ala Pro Arg Asp Lys Ile Val Trp Asp Val Gly His 65 70 75 80 Gln Cys Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Arg Met Arg 85 90 95 Thr Leu Arg Met Gly Gly Gly Leu Ser Gly Phe Thr Lys Arg Gln Glu 100 105 110 Ser Ala Phe Asp Pro Phe Gly Ala Gly His Ser Ser Thr Ser Ile Ser 115 120 125 Ala Ala Leu Gly Phe Ala Met Ala Arg Glu Leu Gly Gly Asp 130 135 140 <210> 161 <211> 6 <212> PRT <213> Bradyrhizobium japonicum <400> 161 Val His Asp Asp Leu Pro 1 5 <210> 162 <211> 6 <212> PRT <213> Rhizobium sp. <400> 162 Val His Asp Asp Leu Pro 1 5 <210> 163 <211> 6 <212> PRT <213> Bacillus stearothermophilus <400> 163 Ile His Asp Asp Leu Pro 1 5 <210> 164 <211> 6 <212> PRT <213> Bacillus subtilis <400> 164 Ile His Asp Asp Leu Pro 1 5 <210> 165 <211> 6 <212> PRT <213> Escherichia coli <400> 165 Ile His Asp Asp Leu Pro 1 5 <210> 166 <211> 6 <212> PRT <213> Haemophilus influenzae <400> 166 Ile His Asp Asp Leu Pro 1 5 <210> 167 <211> 16 <212> DNA <213> Artificial <220> <221> misc_feature <222> (5) <223> n means C or T <220> <221> misc_feature <222> (8) <223> n means C or T <220> <221> misc_feature <222> (11) <223> n means C or T <220> <221> misc_feature <222> (1)..(16) <223> oligonucleotide <400> 167 tccanganga nctgcc 16 <210> 168 <211> 5 <212> PRT <213> Bradyrhizobium japonicum <400> 168 Asp Asp Ile Leu Asp 1 5 <210> 169 <211> 5 <212> PRT <213> Rhizobium sp. <400> 169 Asp Asp Ile Leu Asp 1 5 <210> 170 <211> 5 <212> PRT <213> Bacillus stearothermophilus <400> 170 Asp Asp Ile Leu Asp 1 5 <210> 171 <211> 5 <212> PRT <213> Bacillus subtilis <400> 171 Asp Asp Ile Leu Asp 1 5 <210> 172 <211> 5 <212> PRT <213> Escherichia coli <400> 172 Asp Asp Ile Leu Asp 1 5 <210> 173 <211> 5 <212> PRT <213> Haemophilus influenzae <400> 173 Asp Asp Ile Leu Asp 1 5 <210> 174 <211> 15 <212> DNA <213> Artificial <220> <221> misc_feature <222> (3) <223> n means C or T <220> <221> misc_feature <222> (6) <223> n means C or T <220> <221> misc_feature <222> (15) <223> n means C or T <220> <221> misc_feature <222> (1)..(15) <223> oligonucleotide <400> 174 ganganatcc tggan 15 <210> 175 <211> 1176 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (1)..(1173) <400> 175 atg gac ccc atc gtc atc acc ggc gcg atg cgc acc ccg atg ggg gca 48 Met Asp Pro Ile Val Ile Thr Gly Ala Met Arg Thr Pro Met Gly Ala 1 5 10 15 ttc cag ggc gat ctt gcc gcg atg gat gcc ccg acc ctt ggc gcg gcc 96 Phe Gln Gly Asp Leu Ala Ala Met Asp Ala Pro Thr Leu Gly Ala Ala 20 25 30 gcg atc cgc gcc gcg ctg aac ggc ctg tcg ccc gac atg gtg gac gag 144 Ala Ile Arg Ala Ala Leu Asn Gly Leu Ser Pro Asp Met Val Asp Glu 35 40 45 gtg ctg atg ggc tgc gtc ctg ccc gcg ggc cag ggt cag gca ccg gca 192 Val Leu Met Gly Cys Val Leu Pro Ala Gly Gln Gly Gln Ala Pro Ala 50 55 60 cgt cag gcg gcg ctt gac gcc gga ctg ccg ctg tcg gcg ggc gcg acc 240 Arg Gln Ala Ala Leu Asp Ala Gly Leu Pro Leu Ser Ala Gly Ala Thr 65 70 75 80 acc atc aac aag atg tgc gga tcg ggc atg aag gcc gcg atg ctg ggc 288 Thr Ile Asn Lys Met Cys Gly Ser Gly Met Lys Ala Ala Met Leu Gly 85 90 95 cat gac ctg atc gcc gcg gga tcg gcg ggc atc gtc gtc gcc ggc ggg 336 His Asp Leu Ile Ala Ala Gly Ser Ala Gly Ile Val Val Ala Gly Gly 100 105 110 atg gag agc atg tcg aac gcc ccc tac ctg ctg ccc aag gcg cgg tcg 384 Met Glu Ser Met Ser Asn Ala Pro Tyr Leu Leu Pro Lys Ala Arg Ser 115 120 125 ggg atg cgc atg ggc cat gac cgt gtg ctg gat cac atg ttc ctc gac 432 Gly Met Arg Met Gly His Asp Arg Val Leu Asp His Met Phe Leu Asp 130 135 140 ggg ttg gag gac gcc tat gac aag ggc cgc ctg atg ggc acc ttc gcc 480 Gly Leu Glu Asp Ala Tyr Asp Lys Gly Arg Leu Met Gly Thr Phe Ala 145 150 155 160 gag gat tgc gcc ggc gat cac ggt ttc acc cgc gag gcg cag gac gac 528 Glu Asp Cys Ala Gly Asp His Gly Phe Thr Arg Glu Ala Gln Asp Asp 165 170 175 tat gcg ctg acc agc ctg gcc cgc gcg cag gac gcc atc gcc agc ggt 576 Tyr Ala Leu Thr Ser Leu Ala Arg Ala Gln Asp Ala Ile Ala Ser Gly 180 185 190 gcc ttc gcc gcc gag atc gcg ccc gtg acc gtc acg gca cgc aag gtg 624 Ala Phe Ala Ala Glu Ile Ala Pro Val Thr Val Thr Ala Arg Lys Val 195 200 205 cag acc acc gtc gat acc gac gag atg ccc ggc aag gcc cgc ccc gag 672 Gln Thr Thr Val Asp Thr Asp Glu Met Pro Gly Lys Ala Arg Pro Glu 210 215 220 aag atc ccc cat ctg aag ccc gcc ttc cgt gac ggt ggc acg gtc acg 720 Lys Ile Pro His Leu Lys Pro Ala Phe Arg Asp Gly Gly Thr Val Thr 225 230 235 240 gcg gcg aac agc tcg tcg atc tcg gac ggg gcg gcg gcg ctg gtg atg 768 Ala Ala Asn Ser Ser Ser Ile Ser Asp Gly Ala Ala Ala Leu Val Met 245 250 255 atg cgc cag tcg cag gcc gag aag ctg ggc ctg acg ccg atc gcg cgg 816 Met Arg Gln Ser Gln Ala Glu Lys Leu Gly Leu Thr Pro Ile Ala Arg 260 265 270 atc atc ggt cat gcg acc cat gcc gac cgt ccc ggc ctg ttc ccg acg 864 Ile Ile Gly His Ala Thr His Ala Asp Arg Pro Gly Leu Phe Pro Thr 275 280 285 gcc ccc atc ggc gcg atg cgc aag ctg ctg gac cgc acg gac acc cgc 912 Ala Pro Ile Gly Ala Met Arg Lys Leu Leu Asp Arg Thr Asp Thr Arg 290 295 300 ctt ggc gat tac gac ctg ttc gag gtg aac gag gca ttc gcc gtc gtc 960 Leu Gly Asp Tyr Asp Leu Phe Glu Val Asn Glu Ala Phe Ala Val Val 305 310 315 320 gcc atg atc gcg atg aag gag ctt ggc ctg cca cac gat gcc acg aac 1008 Ala Met Ile Ala Met Lys Glu Leu Gly Leu Pro His Asp Ala Thr Asn 325 330 335 atc aac ggc ggg gcc tgc gcg ctt ggg cat ccc atc ggc gcg tcg ggg 1056 Ile Asn Gly Gly Ala Cys Ala Leu Gly His Pro Ile Gly Ala Ser Gly 340 345 350 gcg cgg atc atg gtc acg ctg ctg aac gcg atg gcg gcg cgg ggc gcg 1104 Ala Arg Ile Met Val Thr Leu Leu Asn Ala Met Ala Ala Arg Gly Ala 355 360 365 acg cgc ggg gcc gca tcc gtc tgc atc ggc ggg ggc gag gcg acg gcc 1152 Thr Arg Gly Ala Ala Ser Val Cys Ile Gly Gly Gly Glu Ala Thr Ala 370 375 380 atc gcg ctg gaa cgg ctg agc taa 1176 Ile Ala Leu Glu Arg Leu Ser 385 390 <210> 176 <211> 391 <212> PRT <213> Paracoccus sp. <400> 176 Met Asp Pro Ile Val Ile Thr Gly Ala Met Arg Thr Pro Met Gly Ala 1 5 10 15 Phe Gln Gly Asp Leu Ala Ala Met Asp Ala Pro Thr Leu Gly Ala Ala 20 25 30 Ala Ile Arg Ala Ala Leu Asn Gly Leu Ser Pro Asp Met Val Asp Glu 35 40 45 Val Leu Met Gly Cys Val Leu Pro Ala Gly Gln Gly Gln Ala Pro Ala 50 55 60 Arg Gln Ala Ala Leu Asp Ala Gly Leu Pro Leu Ser Ala Gly Ala Thr 65 70 75 80 Thr Ile Asn Lys Met Cys Gly Ser Gly Met Lys Ala Ala Met Leu Gly 85 90 95 His Asp Leu Ile Ala Ala Gly Ser Ala Gly Ile Val Val Ala Gly Gly 100 105 110 Met Glu Ser Met Ser Asn Ala Pro Tyr Leu Leu Pro Lys Ala Arg Ser 115 120 125 Gly Met Arg Met Gly His Asp Arg Val Leu Asp His Met Phe Leu Asp 130 135 140 Gly Leu Glu Asp Ala Tyr Asp Lys Gly Arg Leu Met Gly Thr Phe Ala 145 150 155 160 Glu Asp Cys Ala Gly Asp His Gly Phe Thr Arg Glu Ala Gln Asp Asp 165 170 175 Tyr Ala Leu Thr Ser Leu Ala Arg Ala Gln Asp Ala Ile Ala Ser Gly 180 185 190 Ala Phe Ala Ala Glu Ile Ala Pro Val Thr Val Thr Ala Arg Lys Val 195 200 205 Gln Thr Thr Val Asp Thr Asp Glu Met Pro Gly Lys Ala Arg Pro Glu 210 215 220 Lys Ile Pro His Leu Lys Pro Ala Phe Arg Asp Gly Gly Thr Val Thr 225 230 235 240 Ala Ala Asn Ser Ser Ser Ile Ser Asp Gly Ala Ala Ala Leu Val Met 245 250 255 Met Arg Gln Ser Gln Ala Glu Lys Leu Gly Leu Thr Pro Ile Ala Arg 260 265 270 Ile Ile Gly His Ala Thr His Ala Asp Arg Pro Gly Leu Phe Pro Thr 275 280 285 Ala Pro Ile Gly Ala Met Arg Lys Leu Leu Asp Arg Thr Asp Thr Arg 290 295 300 Leu Gly Asp Tyr Asp Leu Phe Glu Val Asn Glu Ala Phe Ala Val Val 305 310 315 320 Ala Met Ile Ala Met Lys Glu Leu Gly Leu Pro His Asp Ala Thr Asn 325 330 335 Ile Asn Gly Gly Ala Cys Ala Leu Gly His Pro Ile Gly Ala Ser Gly 340 345 350 Ala Arg Ile Met Val Thr Leu Leu Asn Ala Met Ala Ala Arg Gly Ala 355 360 365 Thr Arg Gly Ala Ala Ser Val Cys Ile Gly Gly Gly Glu Ala Thr Ala 370 375 380 Ile Ala Leu Glu Arg Leu Ser 385 390 <210> 177 <211> 1980 <212> DNA <213> Paracoccus sp. <220> <221> gene <222> (1)..(1980) <400> 177 atgaccaaag ccgtaatcgt atctgccgca cgtacccccg tcggcagctt catgggcgca 60 ttcgccaatg tccccgcaca tgatctgggc gccgccgtcc tgcgcgaggt cgtggcccgc 120 gccggtgtcg accccgccga ggtcagcgag acgatcctgg gccaggtgct gaccgccgcg 180 cagggccaga accccgcgcg ccaggcgcat atcaatgcgg gcctgcccaa ggaatcggcg 240 gcgtggctca tcaaccaggt ctgcggctcg gggctgcgcg ccgtcgcgct ggcggcgcag 300 caggtcatgc tgggcgatgc gcagatcgtt ctggcggggg gccaggagag catgtcgctg 360 tcgacccatg ccgcctatct gcgcgcgggc cagaagatgg gcgacatgaa gatgatcgac 420 accatgatcc gcgacgggct gtgggatgcc ttcaacggct atcacatggg tcagaccgcc 480 gagaacgtgg ccgaccagtg gtcgatcagc cgcgaccagc aggacgaatt cgccctggct 540 tcgcagaaca aggccgaggc cgcgcagaat gcgggccgct tcgatgacga aatcgtcgcc 600 tataccgtca agggccgcaa gggcgacacg gtcgtcgaca aggacgaata catccgccac 660 ggcgccacga tcgagggcat gcagaagctg cgccccgcct tcaccaagga aggctcggtc 720 acggcgggca acgcgtcggg cctgaacgac ggcgcggcgg ccgtcatggt catgtccgag 780 gacgaggccg cacgccgcgg gctgacgccg ctggcgcgca tcgcctccta tgcgacggcg 840 ggcctcgacc cggcgatcat gggcaccggg ccgatcccct ccagccgcaa ggcgctggaa 900 aaggcgggct ggtcggtcgg cgacctggac ctggtcgagg cgaacgaggc ctttgccgcg 960 caggcctgcg ccgtgaacaa ggacatgggc tgggatccgt ccatcgtgaa cgtcaacggc 1020 ggcgcgatcg ccatcggcca cccgatcggc gcctcggggg cgcggatcct gaacaccctg 1080 ctgttcgaga tgcagcgccg cgacgccaag aagggccttg cgacgctgtg catcggcggc 1140 ggcatgggcg tcgccatgtg cctcgaacgc tgaacgaccg gcgtgtgcgc aatttaattg 1200 cgcacacgcc ccctgcaaag tagcaatgtt ttacgataac gaatgaaggg gggaatcatg 1260 tccaaggtag cactggtcac cggcggatcg cgcggcatcg gcgccgagat ctgcaaggcg 1320 cttcaggccg caggctatac cgtcgccgcg aactatgccg gcaatgacga cgcggccaag 1380 gccttcaccg aggaaaccgg catcaagacc tacaagtggt cggtcgccga ttacgatgcc 1440 tgcaaggccg gcatcgccca ggtcgaagag gatctgggcc cgatcgccgt gctgatcaac 1500 aatgccggga tcacccgcga cgcgcccttc cacaagatga cgcccgagaa gtggaaggag 1560 gtcatcgaca ccaacctgac cggcaccttc aacatgaccc atccggtctg gccgggcatg 1620 cgcgaacgca agttcggacg cgtcatcaac atcagctcga tcaacgggca gaagggccag 1680 ttcgggcagg cgaactatgc cgcggccaag gcgggcgacc tgggcttcac caagtcgctg 1740 gcgcaggaag gcgcgcgcaa caacatcacc gtcaacgcga tctgccccgg ctatatcgcg 1800 acggacatgg tgatggccgt tcccgaacag gtccgcgagg ggatcatcgc gcagatcccc 1860 gtcggccgct tgggcgagcc gtccgagatc gcgcgctgcg tggtgttcct ggcctccgac 1920 gatgcgggct tcgtcacagg ctcgaccatc acggcgaatg gcggccagta ctacatctga 1980 1980 <210> 178 <211> 390 <212> PRT <213> Paracoccus sp. <400> 178 Met Thr Lys Ala Val Ile Val Ser Ala Ala Arg Thr Pro Val Gly Ser 1 5 10 15 Phe Met Gly Ala Phe Ala Asn Val Pro Ala His Asp Leu Gly Ala Ala 20 25 30 Val Leu Arg Glu Val Val Ala Arg Ala Gly Val Asp Pro Ala Glu Val 35 40 45 Ser Glu Thr Ile Leu Gly Gln Val Leu Thr Ala Ala Gln Gly Gln Asn 50 55 60 Pro Ala Arg Gln Ala His Ile Asn Ala Gly Leu Pro Lys Glu Ser Ala 65 70 75 80 Ala Trp Leu Ile Asn Gln Val Cys Gly Ser Gly Leu Arg Ala Val Ala 85 90 95 Leu Ala Ala Gln Gln Val Met Leu Gly Asp Ala Gln Ile Val Leu Ala 100 105 110 Gly Gly Gln Glu Ser Met Ser Leu Ser Thr His Ala Ala Tyr Leu Arg 115 120 125 Ala Gly Gln Lys Met Gly Asp Met Lys Met Ile Asp Thr Met Ile Arg 130 135 140 Asp Gly Leu Trp Asp Ala Phe Asn Gly Tyr His Met Gly Gln Thr Ala 145 150 155 160 Glu Asn Val Ala Asp Gln Trp Ser Ile Ser Arg Asp Gln Gln Asp Glu 165 170 175 Phe Ala Leu Ala Ser Gln Asn Lys Ala Glu Ala Ala Gln Asn Ala Gly 180 185 190 Arg Phe Asp Asp Glu Ile Val Ala Tyr Thr Val Lys Gly Arg Lys Gly 195 200 205 Asp Thr Val Val Asp Lys Asp Glu Tyr Ile Arg His Gly Ala Thr Ile 210 215 220 Glu Gly Met Gln Lys Leu Arg Pro Ala Phe Thr Lys Glu Gly Ser Val 225 230 235 240 Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Gly Ala Ala Ala Val Met 245 250 255 Val Met Ser Glu Asp Glu Ala Ala Arg Arg Gly Leu Thr Pro Leu Ala 260 265 270 Arg Ile Ala Ser Tyr Ala Thr Ala Gly Leu Asp Pro Ala Ile Met Gly 275 280 285 Thr Gly Pro Ile Pro Ser Ser Arg Lys Ala Leu Glu Lys Ala Gly Trp 290 295 300 Ser Val Gly Asp Leu Asp Leu Val Glu Ala Asn Glu Ala Phe Ala Ala 305 310 315 320 Gln Ala Cys Ala Val Asn Lys Asp Met Gly Trp Asp Pro Ser Ile Val 325 330 335 Asn Val Asn Gly Gly Ala Ile Ala Ile Gly His Pro Ile Gly Ala Ser 340 345 350 Gly Ala Arg Ile Leu Asn Thr Leu Leu Phe Glu Met Gln Arg Arg Asp 355 360 365 Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Met Gly Val 370 375 380 Ala Met Cys Leu Glu Arg 385 390 <210> 179 <211> 240 <212> PRT <213> Paracoccus sp. <400> 179 Met Ser Lys Val Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly Ala 1 5 10 15 Glu Ile Cys Lys Ala Leu Gln Ala Ala Gly Tyr Thr Val Ala Ala Asn 20 25 30 Tyr Ala Gly Asn Asp Asp Ala Ala Lys Ala Phe Thr Glu Glu Thr Gly 35 40 45 Ile Lys Thr Tyr Lys Trp Ser Val Ala Asp Tyr Asp Ala Cys Lys Ala 50 55 60 Gly Ile Ala Gln Val Glu Glu Asp Leu Gly Pro Ile Ala Val Leu Ile 65 70 75 80 Asn Asn Ala Gly Ile Thr Arg Asp Ala Pro Phe His Lys Met Thr Pro 85 90 95 Glu Lys Trp Lys Glu Val Ile Asp Thr Asn Leu Thr Gly Thr Phe Asn 100 105 110 Met Thr His Pro Val Trp Pro Gly Met Arg Glu Arg Lys Phe Gly Arg 115 120 125 Val Ile Asn Ile Ser Ser Ile Asn Gly Gln Lys Gly Gln Phe Gly Gln 130 135 140 Ala Asn Tyr Ala Ala Ala Lys Ala Gly Asp Leu Gly Phe Thr Lys Ser 145 150 155 160 Leu Ala Gln Glu Gly Ala Arg Asn Asn Ile Thr Val Asn Ala Ile Cys 165 170 175 Pro Gly Tyr Ile Ala Thr Asp Met Val Met Ala Val Pro Glu Gln Val 180 185 190 Arg Glu Gly Ile Ile Ala Gln Ile Pro Val Gly Arg Leu Gly Glu Pro 195 200 205 Ser Glu Ile Ala Arg Cys Val Val Phe Leu Ala Ser Asp Asp Ala Gly 210 215 220 Phe Val Thr Gly Ser Thr Ile Thr Ala Asn Gly Gly Gln Tyr Tyr Ile 225 230 235 240 <210> 180 <211> 729 <212> DNA <213> Paracoccus carotinifaciens E-396 <220> <221> CDS <222> (1)..(726) <400> 180 atg agc gca cat gcc ctg ccc aag gca gat ctg acc gcc acc agt ttg 48 Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 1 5 10 15 atc gtc tcg ggc ggc atc atc gcc gcg tgg ctg gcc ctg cat gtg cat 96 Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His 20 25 30 gcg ctg tgg ttt ctg gac gcg gcg gcg cat ccc atc ctg gcg gtc gcg 144 Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Val Ala 35 40 45 aat ttc ctg ggg ctg acc tgg ctg tcg gtc ggt ctg ttc atc atc gcg 192 Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala 50 55 60 cat gac gcg atg cat ggg tcg gtc gtg ccg ggg cgc ccg cgc gcc aat 240 His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 65 70 75 80 gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gcc gga ttt tcc tgg 288 Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 85 90 95 cgc aag atg atc gtc aag cac atg gcc cat cat cgc cat gcc gga acc 336 Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr 100 105 110 gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc 384 Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 115 120 125 cgc ttc atc ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432 Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 130 135 140 gtc atc gtg acg gtc tat gcg ctg atg ttg ggg gat cgc tgg atg tac 480 Val Ile Val Thr Val Tyr Ala Leu Met Leu Gly Asp Arg Trp Met Tyr 145 150 155 160 gtg gtc ttc tgg ccg ttg ccg tcg atc ctg gcg tcg atc cag ctg ttc 528 Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe 165 170 175 gtg ttc ggc atc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576 Val Phe Gly Ile Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 180 185 190 gac cgc cac aat gcg cgg tcg tcg cgg atc agc gac ccc gtg tcg ctg 624 Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu 195 200 205 ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 672 Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 210 215 220 ccg acg gtg cct tgg tgg cgc ctg ccc agc acc cgc acc aag ggg gac 720 Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 225 230 235 240 acc gca tga 729 Thr Ala <210> 181 <211> 242 <212> PRT <213> Paracoccus carotinifaciens E-396 <400> 181 Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu 1 5 10 15 Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His 20 25 30 Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Val Ala 35 40 45 Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala 50 55 60 His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn 65 70 75 80 Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp 85 90 95 Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr 100 105 110 Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala 115 120 125 Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro 130 135 140 Val Ile Val Thr Val Tyr Ala Leu Met Leu Gly Asp Arg Trp Met Tyr 145 150 155 160 Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe 165 170 175 Val Phe Gly Ile Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro 180 185 190 Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu 195 200 205 Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His 210 215 220 Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp 225 230 235 240 Thr Ala <210> 182 <211> 510 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (1)..(507) <400> 182 atg agc act tgg gcc gca atc ctg acc gtc atc ctg acc gtc gcc gcg 48 Met Ser Thr Trp Ala Ala Ile Leu Thr Val Ile Leu Thr Val Ala Ala 1 5 10 15 atg gag ctg acg gcc tac tcc gtc cat cgg tgg atc atg cat ggc ccc 96 Met Glu Leu Thr Ala Tyr Ser Val His Arg Trp Ile Met His Gly Pro 20 25 30 ctg ggc tgg ggc tgg cat aaa tcg cac cac gac gag gat cac gac cac 144 Leu Gly Trp Gly Trp His Lys Ser His His Asp Glu Asp His Asp His 35 40 45 gcg ctc gag aag aac gac ctc tat ggc gtc atc ttc gcg gta atc tcg 192 Ala Leu Glu Lys Asn Asp Leu Tyr Gly Val Ile Phe Ala Val Ile Ser 50 55 60 atc gtg ctg ttc gcg atc ggc gcg atg ggg tcg gat ctg gcc tgg tgg 240 Ile Val Leu Phe Ala Ile Gly Ala Met Gly Ser Asp Leu Ala Trp Trp 65 70 75 80 ctg gcg gtg ggg gtc acc tgc tac ggg ctg atc tac tat ttc ctg cat 288 Leu Ala Val Gly Val Thr Cys Tyr Gly Leu Ile Tyr Tyr Phe Leu His 85 90 95 gac ggc ttg gtg cat ggg cgc tgg ccg ttc cgc tat gtc ccc aag cgc 336 Asp Gly Leu Val His Gly Arg Trp Pro Phe Arg Tyr Val Pro Lys Arg 100 105 110 ggc tat ctt cgt cgc gtc tac cag gca cac agg atg cat cac gcg gtc 384 Gly Tyr Leu Arg Arg Val Tyr Gln Ala His Arg Met His His Ala Val 115 120 125 cat ggc cgc gag aac tgc gtc agc ttc ggt ttc atc tgg gcg ccc tcg 432 His Gly Arg Glu Asn Cys Val Ser Phe Gly Phe Ile Trp Ala Pro Ser 130 135 140 gtc gac agc ctc aag gca gag ctg aaa cgc tcg ggc gcg ctg ctg aag 480 Val Asp Ser Leu Lys Ala Glu Leu Lys Arg Ser Gly Ala Leu Leu Lys 145 150 155 160 gac cgc gaa ggg gcg gat cgc aat aca tga 510 Asp Arg Glu Gly Ala Asp Arg Asn Thr 165 <210> 183 <211> 169 <212> PRT <213> Paracoccus sp. <400> 183 Met Ser Thr Trp Ala Ala Ile Leu Thr Val Ile Leu Thr Val Ala Ala 1 5 10 15 Met Glu Leu Thr Ala Tyr Ser Val His Arg Trp Ile Met His Gly Pro 20 25 30 Leu Gly Trp Gly Trp His Lys Ser His His Asp Glu Asp His Asp His 35 40 45 Ala Leu Glu Lys Asn Asp Leu Tyr Gly Val Ile Phe Ala Val Ile Ser 50 55 60 Ile Val Leu Phe Ala Ile Gly Ala Met Gly Ser Asp Leu Ala Trp Trp 65 70 75 80 Leu Ala Val Gly Val Thr Cys Tyr Gly Leu Ile Tyr Tyr Phe Leu His 85 90 95 Asp Gly Leu Val His Gly Arg Trp Pro Phe Arg Tyr Val Pro Lys Arg 100 105 110 Gly Tyr Leu Arg Arg Val Tyr Gln Ala His Arg Met His His Ala Val 115 120 125 His Gly Arg Glu Asn Cys Val Ser Phe Gly Phe Ile Trp Ala Pro Ser 130 135 140 Val Asp Ser Leu Lys Ala Glu Leu Lys Arg Ser Gly Ala Leu Leu Lys 145 150 155 160 Asp Arg Glu Gly Ala Asp Arg Asn Thr 165 <210> 184 <211> 888 <212> DNA <213> Paracoccus sp. <220> <221> CDS <222> (1)..(885) <400> 184 atg acg ccc aag cag caa ttc ccc cta cgc gat ctg gtc gag atc agg 48 Met Thr Pro Lys Gln Gln Phe Pro Leu Arg Asp Leu Val Glu Ile Arg 1 5 10 15 ctg gcg cag atc tcg ggc cag ttc ggc gtg gtc tcg gcc ccg ctc ggc 96 Leu Ala Gln Ile Ser Gly Gln Phe Gly Val Val Ser Ala Pro Leu Gly 20 25 30 gcg gcc atg agc gat gcc gcc ctg tcc ccc ggc aaa cgc ttt cgc gcc 144 Ala Ala Met Ser Asp Ala Ala Leu Ser Pro Gly Lys Arg Phe Arg Ala 35 40 45 gtg ctg atg ctg atg gtc gcc gaa agc tcg ggc ggg gtc tgc gat gcg 192 Val Leu Met Leu Met Val Ala Glu Ser Ser Gly Gly Val Cys Asp Ala 50 55 60 atg gtc gat gcc gcc tgc gcg gtc gag atg gtc cat gcc gca tcg ctg 240 Met Val Asp Ala Ala Cys Ala Val Glu Met Val His Ala Ala Ser Leu 65 70 75 80 atc ttc gac gac atg ccc tgc atg gac gat gcc agg acc cgt cgc ggt 288 Ile Phe Asp Asp Met Pro Cys Met Asp Asp Ala Arg Thr Arg Arg Gly 85 90 95 cag ccc gcc acc cat gtc gcc cat ggc gag ggg cgc gcg gtg ctt gcg 336 Gln Pro Ala Thr His Val Ala His Gly Glu Gly Arg Ala Val Leu Ala 100 105 110 ggc atc gcc ctg atc acc gag gcc atg cgg att ttg ggc gag gcg cgc 384 Gly Ile Ala Leu Ile Thr Glu Ala Met Arg Ile Leu Gly Glu Ala Arg 115 120 125 ggc gcg acg ccg gat cag cgc gca agg ctg gtc gca tcc atg tcg cgc 432 Gly Ala Thr Pro Asp Gln Arg Ala Arg Leu Val Ala Ser Met Ser Arg 130 135 140 gcg atg gga ccg gtg ggg ctg tgc gca ggg cag gat ctg gac ctg cac 480 Ala Met Gly Pro Val Gly Leu Cys Ala Gly Gln Asp Leu Asp Leu His 145 150 155 160 gcc ccc aag gac gcc gcc ggg atc gaa cgt gaa cag gac ctc aag acc 528 Ala Pro Lys Asp Ala Ala Gly Ile Glu Arg Glu Gln Asp Leu Lys Thr 165 170 175 ggc gtg ctg ttc gtc gcg ggc ctc gag atg ctg tcc att att aag ggt 576 Gly Val Leu Phe Val Ala Gly Leu Glu Met Leu Ser Ile Ile Lys Gly 180 185 190 ctg gac aag gcc gag acc gag cag ctc atg gcc ttc ggg cgt cag ctt 624 Leu Asp Lys Ala Glu Thr Glu Gln Leu Met Ala Phe Gly Arg Gln Leu 195 200 205 ggt cgg gtc ttc cag tcc tat gac gac ctg ctg gac gtg atc ggc gac 672 Gly Arg Val Phe Gln Ser Tyr Asp Asp Leu Leu Asp Val Ile Gly Asp 210 215 220 aag gcc agc acc ggc aag gat acg ggg cgc gac acc gcc gcc ccc ggc 720 Lys Ala Ser Thr Gly Lys Asp Thr Gly Arg Asp Thr Ala Ala Pro Gly 225 230 235 240 cca aag cgc ggc ctg atg gcg gtc gga cag atg ggc gac gtg gcg cag 768 Pro Lys Arg Gly Leu Met Ala Val Gly Gln Met Gly Asp Val Ala Gln 245 250 255 cat tac cgc gcc agc cgc gcg caa ctg gac gag ctg atg cgc acc cgg 816 His Tyr Arg Ala Ser Arg Ala Gln Leu Asp Glu Leu Met Arg Thr Arg 260 265 270 ctg ttc cgc ggg ggg cag atc gcg gac ctg ctg gcc cgc gtg ctg ccg 864 Leu Phe Arg Gly Gly Gln Ile Ala Asp Leu Leu Ala Arg Val Leu Pro 275 280 285 cat gac atc cgc cgc agc gcc tag 888 His Asp Ile Arg Arg Ser Ala 290 295 <210> 185 <211> 295 <212> PRT <213> Paracoccus sp. <400> 185 Met Thr Pro Lys Gln Gln Phe Pro Leu Arg Asp Leu Val Glu Ile Arg 1 5 10 15 Leu Ala Gln Ile Ser Gly Gln Phe Gly Val Val Ser Ala Pro Leu Gly 20 25 30 Ala Ala Met Ser Asp Ala Ala Leu Ser Pro Gly Lys Arg Phe Arg Ala 35 40 45 Val Leu Met Leu Met Val Ala Glu Ser Ser Gly Gly Val Cys Asp Ala 50 55 60 Met Val Asp Ala Ala Cys Ala Val Glu Met Val His Ala Ala Ser Leu 65 70 75 80 Ile Phe Asp Asp Met Pro Cys Met Asp Asp Ala Arg Thr Arg Arg Gly 85 90 95 Gln Pro Ala Thr His Val Ala His Gly Glu Gly Arg Ala Val Leu Ala 100 105 110 Gly Ile Ala Leu Ile Thr Glu Ala Met Arg Ile Leu Gly Glu Ala Arg 115 120 125 Gly Ala Thr Pro Asp Gln Arg Ala Arg Leu Val Ala Ser Met Ser Arg 130 135 140 Ala Met Gly Pro Val Gly Leu Cys Ala Gly Gln Asp Leu Asp Leu His 145 150 155 160 Ala Pro Lys Asp Ala Ala Gly Ile Glu Arg Glu Gln Asp Leu Lys Thr 165 170 175 Gly Val Leu Phe Val Ala Gly Leu Glu Met Leu Ser Ile Ile Lys Gly 180 185 190 Leu Asp Lys Ala Glu Thr Glu Gln Leu Met Ala Phe Gly Arg Gln Leu 195 200 205 Gly Arg Val Phe Gln Ser Tyr Asp Asp Leu Leu Asp Val Ile Gly Asp 210 215 220 Lys Ala Ser Thr Gly Lys Asp Thr Gly Arg Asp Thr Ala Ala Pro Gly 225 230 235 240 Pro Lys Arg Gly Leu Met Ala Val Gly Gln Met Gly Asp Val Ala Gln 245 250 255 His Tyr Arg Ala Ser Arg Ala Gln Leu Asp Glu Leu Met Arg Thr Arg 260 265 270 Leu Phe Arg Gly Gly Gln Ile Ala Asp Leu Leu Ala Arg Val Leu Pro 275 280 285 His Asp Ile Arg Arg Ser Ala 290 295 <210> 186 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 186 aaggcctcat atgagcgcac atgccctgcc 30 <210> 187 <211> 28 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(28) <223> primer <400> 187 cgggatcctc atgcggtgtc ccccttgg 28 <210> 188 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 188 aaggcctcat atgagcactt gggccgcaat 30 <210> 189 <211> 30 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(30) <223> primer <400> 189 aggatcctca tgtattgcga tccgcccctt 30 <210> 190 <211> 52 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(52) <223> polylinker <400> 190 gtgcagcctc aggtcgacat atgcggccgc atccggatcc ctcctcctcc ag 52 <210> 191 <211> 52 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(52) <223> polylinker <400> 191 cacgtcggag tccagctgta tacgccggcg taggcctagg gaggaggagg tc 52 <210> 192 <211> 52 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(52) <223> polylinker <400> 192 gtgcaggagg aggtcgacat atgcggccgc atccggatcc ctgaggctcc ag 52 <210> 193 <211> 52 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(52) <223> polylinker <400> 193 cacgtcctcc tccagctgta tacgccggcg taggcctagg gactccgagg tc 52 <210> 194 <211> 52 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(52) <223> polylinker <400> 194 ctggagcctc aggtcgacat atgcggccgc atccggatcc ctcctcctgc ac 52 <210> 195 <211> 52 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(52) <223> polylinker <400> 195 gacctcggag tccagctgta tacgccggcg taggcctagg gaggaggacg tg 52 <210> 196 <211> 52 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(52) <223> polylinker <400> 196 ctggaggagg aggtcgacat atgcggccgc atccggatcc ctgaggctgc ac 52 <210> 197 <211> 52 <212> DNA <213> Artificial <220> <221> misc_feature <222> (1)..(52) <223> polylinker <400> 197 gacctcctcc tccagctgta tacgccggcg taggcctagg gactccgacg tg 52

Claims

다음으로 이루어진 그룹에서 선택된 아미노산 서열로 구성되는 단리된 폴리펩타이드:

(a) 서열번호: 43의 잔기 1 내지 340으로 나타낸 아미노산 서열;

(b) 서열번호: 45의 잔기 1 내지 349로 나타낸 아미노산 서열;

(c) 서열번호: 47의 잔기 1 내지 388로 나타낸 아미노산 서열;

(d) 서열번호: 49의 잔기 1 내지 378로 나타낸 아미노산 서열;

(e) 서열번호: 51의 잔기 1 내지 305로 나타낸 아미노산 서열;

(f) 서열번호: 53의 잔기 1 내지 332로 나타낸 아미노산 서열; 및

(g) 37 ℃에서 40% 포름아미드, 1M NaCl, 1% 나트륨 도데실 설페이트(SDS)의 완충액 중에서 하이브리드화시킨 후, 60 ℃의 온도에서 20 분간 0.2xSSC로 1회 이상 세척하는 조건 하에서, 폴리펩타이드가 HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드 서열에 의해 암호화되는 폴리펩타이드의 아미노산 서열.
삭제
삭제
삭제
삭제
서열번호: 42; 및 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기로 이루어진 그룹에서 선택된 뉴클레오타이드 서열로 구성되는 단리된 폴리뉴클레오타이드 서열로서,

HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열.
삭제
삭제
삭제
제 6 항에 따른 폴리뉴클레오타이드 서열을 포함하는 발현 벡터.
삭제
제 6 항에 따른 폴리뉴클레오타이드 서열 또는 제 10 항에 따른 발현 벡터를 포함하는, 상기 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드를 발현시키는 배양 세포 또는 세포의 자손.
폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드의 발현을 허용하는 조건하에서 제 12 항에 따른 세포를 배양하고, 세포 또는 세포 배지로부터 카로티노이드를 단리함을 포함하는, 카로티노이드의 제조 방법.
(a) 세포에서 발현되는 제 1 항에 따른 메발로네이트 경로의 효소를 암호화하는 폴리뉴클레오타이드 서열을 세포에 도입하고;

(b) 폴리뉴클레오타이드 서열 도입 전에 세포에 의해 생성된 카로티노이드 수준의 1.1 내지 1,000배 수준으로 카로티노이드를 생성하는, 단계 (a)의 폴리뉴클레오타이드 서열을 함유하는 세포를 선별함을 포함하는,

카로티노이드-생성 세포를 제조하는 방법.
(a) 이소프레노이드 화합물의 발현을 허용하는 조건하에 배지에서 모(母) 세균을 배양하고, 모 세균보다 1.1 내지 1,000배 더 많은 이소프레노이드 화합물을 생성하는 배지로부터 돌연변이 세균을 선별하고;

(b) 발현 조절 서열에 작용가능하게 연결된 서열번호: 42로 나타내는 폴리뉴클레오타이드 서열을 포함하는 발현 벡터를 돌연변이 세균에 도입하고;

(c) 발현 벡터를 함유하고 단계 (a)의 돌연변이체보다 1.1 내지 20배 더 많은 이소프레노이드 화합물을 생성하는 세균을 선별함을 포함하는,

이소프레노이드 화합물을 생성하도록 세균을 공학처리하는 방법.
ATCC(아메리칸 타입 컬쳐 컬렉션)에서 기탁 번호 PTA-3335를 지정받은 파라코커스 속 미생물.