KR100704072B1 - 개선된 이소프레노이드 제조 방법 - Google Patents
개선된 이소프레노이드 제조 방법 Download PDFInfo
- Publication number
- KR100704072B1 KR100704072B1 KR1020037015938A KR20037015938A KR100704072B1 KR 100704072 B1 KR100704072 B1 KR 100704072B1 KR 1020037015938 A KR1020037015938 A KR 1020037015938A KR 20037015938 A KR20037015938 A KR 20037015938A KR 100704072 B1 KR100704072 B1 KR 100704072B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- paracoccus
- pbbr
- amino acid
- sequence
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1022—Transferases (2.) transferring aldehyde or ketonic groups (2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1205—Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1229—Phosphotransferases with a phosphate group as acceptor (2.7.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P23/00—Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01034—Hydroxymethylglutaryl-CoA reductase (NADPH) (1.1.1.34)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01036—Acetoacetyl-CoA reductase (1.1.1.36)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/03—Acyl groups converted into alkyl on transfer (2.3.3)
- C12Y203/0301—Hydroxymethylglutaryl-CoA synthase (2.3.3.10)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/01—Phosphotransferases with an alcohol group as acceptor (2.7.1)
- C12Y207/01036—Mevalonate kinase (2.7.1.36)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/04—Phosphotransferases with a phosphate group as acceptor (2.7.4)
- C12Y207/04002—Phosphomevalonate kinase (2.7.4.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01033—Diphosphomevalonate decarboxylase (4.1.1.33), i.e. mevalonate-pyrophosphate decarboxylase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Compounds Of Unknown Constitution (AREA)
Abstract
카로티노이드, 예를 들면, 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논 및 아도니루빈과 같은 이소프레노이드 화합물을 재조합에 의해 생산하는데 유용한, 메발로네이트 경로에 관여하는 효소들, 예를 들면, 하이드록시메틸글루타릴-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, 하이드록시메틸글루타릴-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는 폴리펩타이드를 암호화하는 단리된 폴리뉴클레오타이드를 제공한다. 이소프레노이드 화합물을 제조하기 위한 발현 벡터, 배양 세포 및 방법도 또한 제공한다.
Description
본 발명은 이소프레노이드 생합성 경로에 유용한 신규 폴리뉴클레오타이드 및 폴리펩타이드 서열에 관한 것이다. 보다 특히, 본 발명은 개선된 제아잔틴 생성을 나타내는, 재조합에 의해 제조된 세포를 제공한다. 상기 세포계를 제조하고 이용하는 방법도 또한 제공한다.
카로티노이드는 인간을 위한 영양 보충제, 의약품 및 식용 착색제로 사용되며 동물 사료용 안료로 사용되는 상업적으로 중요한 C-40 이소프레노이드 화합물이다. 현재 산업적으로 중요한 카로티노이드는 주로 화학 합성(β-카로틴, 칸타잔틴 및 아스타잔틴)에 의해 또는 천연 공급원으로부터 추출(매리골드로부터 루테인 및 파프리카로부터 캡산틴)함으로써 생산된다. 그러나, 일부 경우에서는 미생물을 이용하여 카로티노이드를 생산하였다. 예를 들면, 진균인 블라케슬레아 트리스포라(Blakeslea trispora)를 이용한 발효(US 5,328,845), 또는 내염성(halotolerant) 조류인 듀날리엘라 살리나(Dunaliella salina)를 이용한 지중 배양(pond culture)[Borowitzka, J. Biotechnol., 70:313-321, 1999]에 의해 β-카로틴을 제조한다. 블라케슬레아 트리스포라에서 라이코펜을 제조하는 방법도 또한 보고되었다(WO 00/77234). 아스타잔틴은 효모[파피아 로도지마(Phaffia rhodozyma), 최근에 잔토필로마이세스 덴도로우스(Xanthophyllomyces dendorous)로 개명됨)]를 이용한 발효(US 6,015,684)에 의해, 또는 광생물반응기에서, 또는 조류인 헤마토코커스 플루비알리스(Haematococcus pluvialis)를 이용한 개방된 지중 배양[Lorenz and Cysewski, Trends Biotechnol., 18:160-167, 1999; Olaizola, J. Appl. Phycol., 12:499-506, 2000]에 의해 제조한다. 그러나, 상기 미생물 생산 시스템은 경제적인 산업 규모 생산에 충분한 양의 카로티노이드를 생산하지 못한다.
1960년대 중반에, 호프만-라 로슈(Hoffmann-La Roche)의 과학자들은, 가금류의 착색 및 인간에서 노화-관련 변성 반점의 예방에 용도를 갖는 황색 카로티노이드 제아잔틴을 생성하는 여러 해양 세균을 단리하였다. 유망한 제아잔틴 생성 수준을 나타낸 한 세균은 R-1512의 균주 호칭을 받았으며, 미국 종균 협회(American Type Culture Collection, ATCC, 미국 버지니아주 매너새스 소재)에 균주 ATCC 21588로 기탁되었다(US 3,891,504). 그 당시의 승인된 분류 기준(아이드게뇌시쉬 테크니쉬 호크슐레(Eidgenossische Technische Hochschule; 취리히 소재) 및 더 내셔날 콜렉션 오브 인더스트리얼 박테리아, 토리 리서치 스테이션(the National Collection of Industrial Bacteria, Torry Research Station; 스코틀랜드 에버딘 소재)에 의해 수행된 분류법)을 이용하여, 제아잔틴-생성 유기체는 플라보박테리움(Flavobacterium) 속의 일원으로 분류되었으나, 종의 명칭은 지정되 지 않았다.
광범위한 돌연변이유발 및 선별 프로그램을 연속하여 수행하여 더 높은 제아잔틴 생산성을 갖는 R-1512의 돌연변이체를 단리하였다. 현재 기술한 연구와 관련하여, 두 개의 상기 돌연변이체가 중요하다. 이들 돌연변이체는 제아잔틴 생산성 순서로 나열하자면 R1534 및 R114이다. 다양한 다른 돌연변이체들도 수년동안 카로티노이드 생합성의 생화학적 연구에 이용되었다[Goodwin, Biochem. Soc. Symp., 35:233-244, 1972; McDermott et al., Biochem. J., 134:1115-1117, 1973; Britton et al., Arch. Microbiol., 113:33-37, 1977; Mohanty et al., Helvetica Chimica Acta, 83:2036-2053, 2000].
균주 R-1512의 고전적으로 유도된 돌연변이체를 이용하여 제아잔틴을 생산하는 상업적으로 존속가능한 발효 방법을 개발하기 위한 초기 시도는 성공적이지 못했다. 그러나, 분자 생물학의 출현으로, 더 높은 제아잔틴-생산 균주를 개발할 수 있는 가능성이 생겼다. 상기 방법에서의 첫 단계는 균주 R1534(US 6,087,152 호; 본원에 전체로 인용되듯이 여기에 참고로 인용됨)로부터 카로티노이드 유전자 집단을 클로닝하고 서열분석함으로써 이루어졌다. US 6,087,152 호는 카로티노이드 유전자가 에스케리키아 콜라이(Escherichia coli) 및 바실러스 서브틸리스(Bacillus subtilis)에서 기능적으로 발현되어 상기 숙주들에서 제아잔틴 생산을 야기하였음을 개시하고 있다. US 6,087,152 호는 또한 카로티노이드 유전자 집단을 변형시키거나 또는 아스타잔틴 생성 세균으로부터 얻은 유전자를 부가함으로써 제아잔틴 이외의 다른 카로티노이드를 생산하는 것이 가능하였음을 개시하고 있다(EP 872,554). 게다가, EP 872,554 호는 다중-복제 플라스미드상에 클로닝된 카로티노이드 유전자 집단을 도입함으로써 균주 R1534에서 카로티노이드 생산이 증가되었음을 개시하고 있다.
이소프레노이드 화합물의 많은 구조적 다양성에도 불구하고, 상기 화합물은 모두 공통적인 C-5 전구체, 이소펜테닐 피로포스페이트(IPP)로부터 생합성된다. 1990년대 초기까지, 일부 실험 결과가 메발로이트 경로라고 하는 생물기원적 체계와 일치하지 않을지라도 IPP는 상기 메발로네이트 경로를 통해 모든 유기체에서 합성되는 것으로 일반적으로 용인되었다[Eisenreich et al., Chemistry and Biology, 5:R221-R233, 1998].
메발로네이트 경로:
상기 불일치는 그 이래로 IPP 생합성의 대체 경로인 데옥시자일룰로즈(DXP) 경로의 발견에 의해 조정되어 왔다(주: IPP 생합성의 대체 경로는 과학 문헌에서 다양한 명칭으로 지칭되어 왔다(DXP 경로, DOXP 경로, MEP 경로, GAP/피루베이트 경로 및 비-메발로네이트 경로). 본 발명자들은 본원에서 오직 간단히 하기 위해 DXP 경로란 명칭을 사용한다). DXP 경로의 처음 다섯가지 반응은 확인되었으나[Herz et al., Proc. Nat. Acad. Sci., 97:2486-2490, 2000], IPP의 생성을 유도하는 후속 단계들은 아직 밝혀지지 않았다.
DXP 경로:
맥더모트(McDermott) 등[Biochem. J., 134:1115-1117, 1973] 및 브리튼(Britton) 등[J. Chem. Soc. Chem. Comm., p.27, 1979]은 원래의 로슈 단리 균주로부터 유도된 제아잔틴 생성 돌연변이 균주의 조 추출물이 표지된 메발로네이트를 제아잔틴에 혼입시켰음을 밝혔다. 메발로네이트 경로를 통한 IPP 생합성에 대한 상기 증거를 문제삼을 이유는 없지만, 상기 연구는 DXP 경로를 발견하기 이전에 수행되었으며, 일부 세균(스트렙토마이세스(Streptomyces) 종)은 IPP 생합성에 두 경로를 모두 이용하며 상기 경로들의 발현은 일시적으로 조절되는 것으로 보고되었다[Seto et al., Tetrahedron Lett., 37:7979-7982, 1996; Dairi et al., Mol. Gen. Genet., 262:957-964, 2000]. 또한, 현재 단지 소수의 진성세균만이 IPP 합성을 위한 메발로네이트 경로를 갖는 것으로 밝혀졌다. 메발로네이트 경로의 효소들을 암호화하는 유전자는 일부 상기 세균들로부터 클로닝하고 서열분석하였다[Wilding et al., J. Bacteriol., 182:4319-4327, 2000; Takagi et al., J. Bacteriol., 182:4153-4157, 2000].
미생물에서의 카로티노이드 생산을 변화시키거나 개선시키는데 대사 공학을 적용하여 성공한 여러 예들이 존재한다[Lagarde et al., Appl. Env. Microbiol., 66:64-72, 2000; Wang et al., Biotechnol. Bioeng., 62:235-241, 1999; Wang et al., Biotechnol. Prog., 16:922-926, 2000(및 상기 문헌중의 참조문헌들); Sandmann et al., Trends Biotechnol., 17:233-237, 2000; Misawa and Shimada, J. Biotechnol., 59:169-181, 1998; Matthews and Wurtzel, Appl. Microbiol. Biotechnol., 53:396-400, 2000; Albrecht et al., Nature Biotechnol., 18:843-846, 2000; Schmidt-Dannert et al., Nature Biotechnol., 18:750-753, 2000]. 예를 들면, 비-카로티노겐(non-carotenogenic) 세균인 이. 콜라이(E. coli)를 공학처리하여 세균인 아그로박테리움 오란티아컴(Agrobacterium aurantiacum), 에르위니아 허비콜라(Erwinia herbicola) 또는 에르위니아 우레도보라(Erwinia uredovora)로부터 클로닝된 카로티노이드(crt) 유전자를 도입하여 카로티노이드를 생산할 수 있다[Misawa and Shimada, J. Biotechnol., 59:169-181, 1998]. 하커와 브램리(Harker and Bramley)[FEBS Lett., 448:115-119, 1999] 및 매튜와 우르첼(Matthews and Wurtzel)[J. Biotechnol., 59:169-181, 1998]은 상기 공학처리된 이. 콜라이 균주에서의 카로티노이드 생산이 DXP 경로(이. 콜라이는 이소프레노이드 생합성에 DXP 경로만을 이용하며 메발로네이트 경로는 이용하지 않는다[Lange et al., Proc. Nat. Acad. Sci., 97:13172-13177, 2000])의 첫 번째 효소인 1-데옥시-D-자일룰로즈 5-포스페이트 신타제(DXPS)를 암호화하는 유전자를 과발현시킴으로써 증가될 수 있음을 개시하였다. 하커 및 브램리[FEBS Lett., 448:115-119, 1999]는 또한 DXPS를 과생산하는 세포에서 이소프레노이드 화합물인 유비퀴논-8의 증가를 개시하였다. 이러한 결과들은 DXPS의 불충분한 생체내 활성으로부터 비롯된 IPP의 제한된 유용성이 공학처리된 균주에서의 카로티노이드 및 다른 이소프레노이드 화합물의 생산을 제한한다는 가설을 뒷받침하였다. 킴 및 키즐링(Kim and Keasling)[Biotechnol. Bioeng., 72:408-415, 2001]은, 유사한 이. 콜라이 시스템을 이용하여, DXPS 및 DXP 경로의 두 번째 효소인 DXP 리덕토이소머라제(1-데옥시-D-자일룰로즈-5-포스페이트 리덕토이소머라제)를 암호화하는 유전자들의 과발현이 합쳐져 DXPS를 암호화하는 유전자만의 과발현보다 더 많은 카로티노이드를 생산하였음을 개시하였다.
상기 연구들은 모두 카로티노이드를 생산하도록 공학처리된 이. 콜라이에서 수행하였다. 따라서, 상기 연구들의 한가지 단점은 상기 재조합 이. 콜라이 균주들에 의해 생산된 카로티노이드의 양이 카로티노이드의 산업적 생산에 사용된 비-재조합 미생물에 의해 생산된 양에 비해 매우 적다는 것이다. 또한, IPP 생합성 경로의 유전 공학처리에 의한 세균에서의 개선된 카로티노이드 생산은 IPP 생성에 DXP 경로를 이용하는 유기체에서만 나타났다. 메발로네이트 경로를 통해 IPP를 생성하는 세균에 대해서는 유사한 연구가 보고된 바가 없다.
효모에서 이소프레노이드 화합물의 생산을 개선하기 위해 메발로네이트 경로를 대사 공학처리한 것이 보고된 바 있다. 예를 들면, WO 00/01649 호는 3-하이드록시-3-메틸글루타릴 조효소 A 리덕타제(HMG-CoA 리덕타제)를 암호화하는 유전자가 과발현되는 경우 사카로마이세스 세레비지에(Saccharomyces cerevisiae)에서 이소프레노이드 화합물의 생산이 증가됨을 개시하였다. 그러나, 상기 방법이 세균에서의 이소프레노이드 생산을 개선하는지는 밝히지 않았으며, 특히, 메발로네이트 경로에 유전자들의 발현을 증폭시킴으로써 세균에서의 카로티노이드 생산이 향상될 수 있는지는 밝히지 않았다. 진핵생물로부터[Campos et al., Biochem. J., 353:59-67, 2001] 및 세균 스트렙토마이세스속 균주 CL190으로부터[Takagi et al., J. Bacteriol., 182:4153-4157, 2000] 몇몇 메발로네이트 경로 유전자들을 이. 콜라이에서 발현시킬 수 있음은 밝혔지만, 균주들에서 이소프레노이드 생산의 증가는 기록하지 않았다.
IPP를 생성하는 반응(DXP 또는 메발로네이트 경로를 통해) 및 파네실 피로포스페이트(FPP)를 다양한 다른 이소프레노이드(예를 들면, 카로티노이드, 퀴논)로 전환시키는 반응 이외에, 다른 두 반응이 이소프레노이드 생합성에 수반되는 것으로 알려져 있다. IPP 이소머라제는 IPP와 그의 이성체인 디메틸알릴 피로포스페이트(DMAPP)를 상호전환시킨다. 두 형태의 IPP 이소머라제가 존재하는데, 1형 효소 는 진핵생물 및 일부 세균에서 공지되어 있고 새로 동정된 2형 효소는 FMN- 및 NADP(H)-의존성이다[Kaneda et al., Proc. Nat. Acad. Sci., 98:932-937, 2001].
여러 보고서들이 카로티노이드를 생산하도록 공학처리된 이. 콜라이에서 천연 또는 이종 1형 IPP 이소머라제(idi) 유전자를 증폭시키면 카로티노이드 생산이 자극됨을 개시하고 있다[Kajiwara et al., Biochem. J., 324:421-426, 1997; Verdoes and van Ooyen, Acta Bot. Gallica, 146:43-53, 1999; Wang et al., Biotechnol. Bioeng., 62:235-241, 1999]. 한 보고서[Wang et al., Biotechnol. Bioeng., 62:235-241, 1999]에서는, FPP 신타제(파네실 디포스페이트 신타제)를 암호화하는 ispA 유전자의 과발현이 idi 및 crtE(GGPP 신타제/제라닐-제라닐 디포스페이트 신타제) 유전자의 과발현과 결합될 경우 이. 콜라이의 공학처리된 카로티노겐(crotenogenic) 균주에서 카로티노이드 생산을 증가시켰음을 또한 개시하였다. 그러나, IPP 생합성 경로의 경우와 같이, IPP 이소머라제 또는 PFF 신타제를 암호화하는 유전자의 과발현이 천연 카로티노겐 미생물에서 카로티노이드의 생산을 향상시키는 지는 나타내지 않았다. 또한, 전술한 이. 콜라이 균주에서 생산된 카로티노이드의 수준은 매우 낮고, 상기 방법이 카로티노이드 생산량이 이미 높은 산업적 미생물에서 잘 적용되는지는 나타내지 않았다.
요컨대, 메발로네이트 경로의 효소들을 암호화하는 유전자(들)의 증가된 발현이 천연 카로티노겐 세균 또는 카로티노겐성이 되도록 공학처리된 천연 비-카로티노겐 세균에서 카로티노이드의 생산을 개선시킬 수 있다는 증거가 이전에는 없었다.
본 발명의 한 태양은 다음 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드이다:
(a) 서열번호: 43의 잔기 1 내지 340으로 나타낸 아미노산 서열;
(b) 서열번호: 45의 잔기 1 내지 349로 나타낸 아미노산 서열;
(c) 서열번호: 47의 잔기 1 내지 388로 나타낸 아미노산 서열;
(d) 서열번호: 49의 잔기 1 내지 378로 나타낸 아미노산 서열;
(e) 서열번호: 51의 잔기 1 내지 305로 나타낸 아미노산 서열;
(f) 서열번호: 53의 잔기 1 내지 332로 나타낸 아미노산 서열;
(g) 30개 이상의 인접 아미노산 잔기를 갖는, 서열번호: 43, 45, 47, 49, 51 및 53으로 이루어진 그룹에서 선택된 아미노산 서열의 단편;
(h) HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, 하이드록시메틸글루타릴-CoA 신타제(HMG-CoA 신타제), 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제 활성을 갖는, 서열번호: 43, 45, 47, 49, 51 및 53으로 이루어진 그룹에서 선택된 폴리펩타이드 단편의 아미노산 서열;
(i) 엄격한 조건하에서 서열번호: 42 또는 서열번호: 42의 보체의 30개 이상의 연속 뉴클레오타이드를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화되는, HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는 폴리펩타이드의 아미노산 서열; 및
(j) 서열번호: 43, 45, 47, 49, 51 또는 53의 보존적으로 변형된 변이체.
상기에서 지적한 바와 같이, 본 발명은 메발로네이트 경로에 관여하는 하기 효소들 각각에 상응하는 폴리펩타이드 서열들인 서열번호: 43, 45, 47, 49, 51 및 53을 포함한다: 하이드록시메틸 글루타릴 CoA(HMG-CoA) 리덕타제, 이소펜테닐 디포스페이트(IPP) 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제. 본 발명은 또한 생물학적으로 활성인 분자를 정의하기 위한 각각의 동정된 서열의 30개 이상의 인접 아미노산 또는 충분한 수의 인접 아미노산을 포함한다.
본 발명은 또한 서열번호: 43, 45, 47, 49, 51 및 53으로부터 선택된 폴리펩타이드의 단편을 포함한다. 상기 단편은 길이가 약 30개 아미노산 이상이어야 하지만, 동정된 폴리펩타이드의 활성을 가져야 한다, 예를 들면, 서열번호: 43의 경우 본 발명의 범위에 속하는 그 단편은 HMG-CoA 리덕타제의 활성을 갖는다. 본원에서 사용된 바와 같이, 각각의 단편들의 활성 측정법을 실시예 1에 나타내었다. 실시예 1에 나타낸 분석에서 백그라운드보다 높은 활성을 갖는 단편을 생물학적으로 활성이며 본 발명의 범위에 속하는 것으로 간주한다.
본 발명은 또한 상기 정의한 바와 같이 엄격한 조건하에서 서열번호: 42(즉, 메발로네이트 오페론) 또는 서열번호: 42의 보체의 30개 이상의 인접 뉴클레오타이드를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화되는 폴리펩타이드의 아미노산 서열을 포함한다. 상기 폴리뉴클레오타이 드는 메발로네이트 경로에 관여하는 효소들 중 적어도 하나를 암호화해야 한다. 본 발명에 있어서, "하이브리드화 프로브"는 서열번호: 42의 약 10 내지 9066 뉴클레오타이드를 함유하는 폴리뉴클레오타이드 서열이다.
상기 태양에서, 단리된 폴리펩타이드는 서열번호: 43, 서열번호: 45, 서열번호: 47, 서열번호: 49, 서열번호: 51 또는 서열번호: 53의 아미노산 서열을 가질 수 있다. 또는, 단리된 폴리펩타이드는 다른 종으로부터 유래된 동일한 기능을 갖는 효소와 비교할 때 최소한의 동일성을 갖는 각각의 아미노산 서열들의 영역으로부터 선택된 약 30개의 인접 아미노산을 함유할 수 있다. 따라서, 예를 들면, 본 발명의 폴리펩타이드는 서열번호: 43의 68 내지 97번 아미노산, 서열번호: 45의 1 내지 30번 아미노산, 서열번호: 47의 269 내지 298번 아미노산, 서열번호: 49의 109 내지 138번 아미노산, 서열번호: 51의 198 내지 227번 아미노산 또는 서열번호: 53의 81 내지 110번 아미노산을 포함할 수 있다.
본 발명의 또 다른 태양은 다음에서 선택된 아미노산 서열을 갖는 단리된 폴리펩타이드이다: (a) 서열번호: 159의 잔기 1 내지 287로 나타낸 아미노산 서열; (b) 서열번호: 159의 30개 이상의 인접 아미노산 잔기; (c) 파네실-디포스페이트 신타제(FPP 신타제)의 활성을 갖는 서열번호: 159의 단편의 아미노산 서열; (d) 엄격한 조건하에서 ispA 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 157의 295 내지 1158 위치의 뉴클레오타이드) 또는 그의 보체를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된 폴리펩타이드의 아미노산 서열; 및 (e) 서열번호: 159의 보존적으로 변형된 변이체.
따라서, 상기 태양에서, 아미노산은 FPP 신타제를 암호화하는 전체 개방 해독틀, 즉, 서열번호: 159의 1 내지 287 잔기, 그의 30개 이상의 인접 잔기, 또는 실시예 1에 나타낸 분석법으로 측정할 때 FPP 신타제 활성을 갖는 서열번호: 159의 단편에 의해 암호화될 수 있다. 또한, 본 발명의 상기 태양은 상기 정의한 바와 같은 엄격한 조건하에서 ispA 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 157의 295 내지 1158 위치의 뉴클레오타이드) 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드(들)에 의해 암호화되는 아미노산 서열(들)을 또한 포함한다(이때, 상기 폴리펩타이드는 상기 정의한 바와 같은 FPP 신타제 활성을 갖는다).
바람직한 태양에서, 상기 폴리펩타이드는 서열번호: 159의 아미노산 서열을 갖는다.
본 발명의 또 다른 태양은 다음 그룹에서 선택된 아미노산 서열을 갖는 단리된 폴리펩타이드이다: (a) 서열번호: 160의 잔기 1 내지 142로 나타낸 아미노산 서열; (b) 서열번호: 160의 30개 이상의 인접 아미노산 잔기; (c) 1-데옥시자일룰로즈-5-포스페이트 신타제(DXPS)의 활성을 갖는 서열번호: 160의 단편의 아미노산 서열; (d) 엄격한 조건하에서 서열번호: 157의 1185 내지 1610 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, DXPS의 활성을 갖는 폴리펩타이드의 아미노산 서열; 및 (e) 서열번호: 160의 보존적으로 변형된 변이체.
따라서, 상기 태양에서, 아미노산은 DXPS를 암호화하는 전체 개방 해독틀, 즉, 서열번호: 160의 1 내지 142 잔기, 그의 30개 이상의 인접 잔기, 또는 실시예 1에 나타낸 분석법으로 측정할 때 DXPS 활성을 갖는 서열번호: 160의 단편에 의해 암호화될 수 있다. 또한, 본 발명의 상기 태양은 상기 정의한 바와 같은 엄격한 조건하에서 DXPS 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 157의 1185 내지 1610 위치의 뉴클레오타이드) 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드(들)에 의해 암호화되는 아미노산 서열(들)을 또한 포함한다(이때, 상기 폴리펩타이드는 상기 정의한 바와 같은 DXPS 활성을 갖는다).
바람직한 태양에서, 상기 폴리펩타이드는 서열번호: 160의 아미노산 서열을 갖는다.
본 발명의 또 다른 태양은 다음 그룹에서 선택된 아미노산 서열을 갖는 단리된 폴리펩타이드이다: (a) 서열번호: 178의 잔기 1 내지 390으로 나타낸 아미노산 서열; (b) 서열번호: 178의 30개 이상의 인접 아미노산 잔기; (c) 아세틸-CoA 아세틸트랜스퍼라제의 활성을 갖는 서열번호: 178의 단편의 아미노산 서열; (d) 엄격한 조건하에서 phaA 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 177의 1 내지 1179 위치의 뉴클레오타이드) 또는 그의 보체를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화되는, 아세틸-CoA 아세틸트랜스퍼라제의 활성을 갖는 폴리펩타이드의 아미노산 서열; 및 (e) 서열번호: 178의 보존적으로 변형된 변이체.
따라서, 상기 태양에서, 아미노산은 아세틸-CoA 아세틸트랜스퍼라제를 암호 화하는 전체 개방 해독틀, 즉, 서열번호: 178의 1 내지 143 잔기, 그의 30개 이상의 인접 잔기, 또는 실시예 1에 나타낸 분석법으로 측정할 때 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 서열번호: 178의 단편에 의해 암호화될 수 있다. 또한, 본 발명의 상기 태양은 상기 정의한 바와 같은 엄격한 조건하에서 phaA 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 177의 1 내지 1170 위치의 뉴클레오타이드) 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드(들)에 의해 암호화되는 아미노산 서열(들)을 또한 포함한다(이때, 상기 폴리펩타이드는 상기 정의한 바와 같은 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는다).
바람직한 태양에서, 상기 폴리펩타이드는 서열번호: 178의 아미노산 서열을 갖는다.
본 발명의 또 다른 태양은 다음에서 선택된 아미노산 서열을 갖는 단리된 폴리펩타이드이다: (a) 서열번호: 179의 잔기 1 내지 240으로 나타낸 아미노산 서열; (b) 서열번호: 179의 30개 이상의 인접 아미노산 잔기; (c) 아세토아세틸-CoA 리덕타제의 활성을 갖는 서열번호: 179의 폴리펩타이드 단편의 아미노산 서열; (d) 엄격한 조건하에서 phaB 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 177의 1258 내지 1980 위치의 뉴클레오타이드) 또는 그의 보체를 함유하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화되는, 아세토아세틸-CoA 리덕타제의 활성을 갖는 폴리펩타이드의 아미노산 서열; 및 (e) 서열번호: 179의 보존적으로 변형된 변이체.
따라서, 상기 태양에서, 아미노산은 아세토아세틸-CoA 리덕타제를 암호화하는 전체 개방 해독틀, 즉, 서열번호: 179의 1 내지 240 잔기, 그의 30개 이상의 인접 잔기, 또는 실시예 1에 나타낸 분석법으로 측정할 때 아세토아세틸-CoA 리덕타제 활성을 갖는 서열번호: 179의 단편에 의해 암호화될 수 있다. 또한, 본 발명의 상기 태양은 상기 정의한 바와 같은 엄격한 조건하에서 phaB 유전자의 30개 이상의 연속 뉴클레오타이드(즉, 서열번호: 177의 1258 내지 1980 위치의 뉴클레오타이드) 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드(들)에 의해 암호화되는 아미노산 서열(들)을 또한 포함한다(이때, 상기 폴리펩타이드는 상기 정의한 바와 같은 아세토아세틸-CoA 리덕타제 활성을 갖는다).
바람직한 태양에서, 상기 폴리펩타이드는 서열번호: 179의 아미노산 서열을 갖는다.
용어 "폴리펩타이드", "폴리펩타이드 서열", "아미노산" 및 "아미노산 서열"은 본원에서 상호교환가능하게 사용되며, 올리고펩타이드, 펩타이드, 폴리펩타이드 또는 단백질 서열, 또는 이들 중 어느 하나의 단편, 및 천연 또는 합성 분자들을 의미한다. 이와 관련하여, "단편", "면역원 단편" 또는 "항원 단편"은 길이가 약 30개 아미노산 이상이고 해당 폴리펩타이드의 일부 생물 활성 또는 면역 활성을 보유하는, 본원에 정의된 임의의 폴리펩타이드의 단편을 말한다. 본원에서 "아미노산 서열"이 천연 단백질 분자의 아미노산 서열을 지칭하기 위해 인용되는 경우, "아미노산 서열" 및 유사 용어들은 아미노산 서열을 인용된 단백질 분자와 관련된 완전 천연 아미노산 서열로 한정하지 않는다.
폴리펩타이드와 관련하여, "단리된"이란 용어는 그의 천연 상태에서 그에 수반되는 성분들로부터 분리된 단백질 또는 폴리펩타이드를 의미한다. 단량체 단백질은 샘플의 약 60 내지 75% 이상이 단일 폴리펩타이드 서열을 나타낼 때 단리된 것이다. 단리된 단백질은 전형적으로 단백질 샘플의 약 60 내지 90%(w/w), 보다 통상적으로는 약 95%를 차지할 것이며, 바람직하게는 약 99% 순도를 초과할 것이다. 단백질 순도 또는 동종성은 당해 분야에 공지된 많은 방법들에 의해, 예를 들면, 단백질 샘플을 폴리아크릴아미드 겔 전기영동한 후, 겔 염색시 단일 폴리펩타이드 띠를 가시화시킴으로써 나타낼 수 있다. 특정 목적으로, HPLC 또는 당해 분야에 공지된 다른 방법을 이용하면 정제에 더 높은 분리능을 제공할 수 있다.
본원에서 사용한 바와 같이, "생물학적으로 활성인"이란 용어는 천연 분자의 구조, 조절 또는 생화학 기능을 갖는 단백질을 말한다. 마찬가지로, "면역적으로 활성인"이란 적절한 동물 또는 세포에서 특이적 면역 반응을 유도하고 특정 항체와 결합하는, 천연, 재조합 또는 합성 폴리펩타이드 또는 그의 임의의 올리고펩타이드의 능력을 말한다.
본 발명의 또 다른 태양은 메발로네이트 오페론의 뉴클레오타이드 서열(서열번호: 42), 파라코커스속(Paracoccus sp.) 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 42의 변이체 또는 서열번호: 42의 단편을 갖는 단리된 폴리뉴클레오타이드 서열이다. 서열번호: 42의 변이체 및 단편은 HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제 활성, 하이드록시메틸글루타릴-CoA 신타제(HMG-CoA 신타제), 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로부터 선택된 활성을 갖는 폴리펩타이드를 암호화해야 한다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 42의 약 10 내지 약 9066 뉴클레오타이드, 바람직하게는 서열번호: 42의 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로부터 선택된 활성을 갖는 폴리펩타이드를 암호화한다.
상기 태양은 또한, 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기에 존재하는 단리된 폴리뉴클레오타이드 서열을 포함한다. 상기 서열들의 단편들은 또한 이들이 HMG-CoA 리덕타제 활성, 이소펜테닐 디포스페이트 이소머라제 활성, HMG-CoA 신타제 활성, 메발로네이트 키나제 활성, 포스포메발로네이트 키나제 활성 및 디포스포메발로네이트 데카복실라제 활성 각각을 갖는 폴리펩타이드를 암호화하는 한 본 발명의 범위에 속한다.
상기 태양은 또한 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기의 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 뉴클레오타이드 서열로부터 선택된 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되 는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 HMG-CoA 리덕타제 활성, 이소펜테닐 디포스페이트 이소머라제 활성, HMG-CoA 신타제 활성, 메발로네이트 키나제 활성, 포스포메발로네이트 키나제 활성 또는 디포스포메발로네이트 데카복실라제 활성을 각각 갖는 폴리펩타이드를 암호화한다.
바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 뉴클레오타이드로 이루어진다.
본 발명의 또 다른 태양은 서열번호: 157의 뉴클레오타이드 서열, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 변이체, 또는 FPP 신타제 활성, 1-데옥시-D-자일룰로즈-5-포스페이트 신타제 활성 또는 XseB 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 단편을 갖는 단리된 폴리뉴클레오타이드 서열이다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 157의 30개 이상의 인접 뉴클레오타이드 또는 서열번호: 157의 보체로 이루어진 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 FPP 신타제 활성, 1-데옥시-D-자일룰로즈-5-포스페이트 신타제 활성 또는 XseB의 활성을 갖는 폴리펩타이드를 암호화한다.
바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 157의 59 내지 292, 295 내지 1158 또는 1185 내지 1610 뉴클레오타이드로 이루어진다.
다음 그룹에서 선택된 뉴클레오타이드 서열을 갖는 단리된 폴리뉴클레오타이 드 서열도 또한 제공된다: 서열번호: 157의 59 내지 292 위치에 존재하는 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 위치들에 존재하는 뉴클레오타이드 서열의 변이체; XseB의 기능을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 59 내지 292 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서 뉴클레오타이드 서열이 서열번호: 157의 59 내지 292 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드 서열(상기 폴리뉴클레오타이드는 XseB의 기능을 갖는 폴리펩타이드를 암호화한다).
바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 157의 59 내지 292 뉴클레오타이드로 이루어진다.
다음 그룹에서 선택된 뉴클레오타이드 서열을 갖는 단리된 폴리뉴클레오타이드 서열도 또한 제공된다: 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열의 변이체; FPP 신타제 활성을 암호화하는 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서 뉴클레오타이드 서열이 서열번호: 157의 295 내지 1158 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드 서열(상기 폴리뉴클레오타이드는 FPP 신타제 활성을 갖는 폴리 펩타이드를 암호화한다).
바람직하게, 상기 단리된 뉴클레오타이드 서열은 서열번호: 157의 295 내지 1158 뉴클레오타이드로 이루어진다.
본 발명의 또 다른 태양은 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열의 변이체, 또는 1-데옥시자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열의 단편을 갖는 단리된 폴리뉴클레오타이드 서열이다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 157의 1185 내지 1610 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 1-데옥시자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드를 암호화한다.
바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 157의 1185 내지 1610 뉴클레오타이드로 이루어진다.
본 발명의 또 다른 태양은 서열번호: 177의 뉴클레오타이드 서열, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체, 또는 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제로부터 선택된 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편을 갖는 단리된 폴리뉴클레오타이드 서열이다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 177의 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 상기 정의한 바와 같이 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화한다.
상기 태양에서, 단리된 폴리뉴클레오타이드 서열은 서열번호: 177의 1 내지 1170 뉴클레오타이드, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체, 또는 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편을 포함할 수 있다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 177의 1 내지 1170 뉴클레오타이드의 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드를 암호화한다.
바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 177의 1 내지 1170 뉴클레오타이드로 이루어진다.
상기 태양에서, 단리된 폴리뉴클레오타이드 서열은 대안적으로 서열번호: 177의 1258 내지 1980 뉴클레오타이드, 파라코커스속 균주 1534 코돈 이용 표(표 14 참조)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체, 또는 아세 토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편일 수 있다. 상기 태양은 또한 뉴클레오타이드 서열이 서열번호: 177의 1258 내지 1980 뉴클레오타이드의 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 엄격한 조건하에서 하이브리드화되는 폴리뉴클레오타이드 서열을 포함하며, 이때 상기 폴리뉴클레오타이드는 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화한다.
바람직하게, 상기 단리된 폴리뉴클레오타이드는 서열번호: 177의 1258 내지 1980 뉴클레오타이드로 이루어진다.
본 발명의 또 다른 태양에서, 단리된 폴리뉴클레오타이드 서열은 서열번호: 42, 서열번호: 157, 서열번호: 177 및 그의 조합으로부터 선택된 뉴클레오타이드 서열을 갖는다. 본원에서 사용한 바와 같이, "및 그의 조합"이란 어구는 뉴클레오타이드 서열과 관련하여 사용될 때 인용된 서열들의 임의의 조합이 함께 단리된 폴리뉴클레오타이드 서열을 이룰 수 있음을 의미한다. 또한, 본 발명에서는, 동일한 서열의 다중 복제물, 즉, 콘카타머(concatamer)도 사용할 수 있다. 마찬가지로, 하기에 보다 상세히 나타낸 바와 같이, 동일한 폴리뉴클레오타이드 서열을 함유하는 플라스미드의 다중 복제물을 적합한 숙주 세포에 전달할 수 있다.
본원에서 사용한 바와 같이, "단리된" 폴리뉴클레오타이드(예를 들면, RNA, DNA 또는 혼합 중합체)는 실질적으로 천연 서열 또는 폴리펩타이드에 천연적으로 수반되는 다른 세포 성분, 예를 들면, 리보솜, 폴리머라제, 많은 다른 게놈 서열 및 단백질로부터 분리된 폴리뉴클레오타이드이다. 상기 용어는 그의 천연 환경에 서 제거된 폴리뉴클레오타이드를 포함하며, 재조합체 또는 클로닝된 DNA 단리물 및 화학 합성된 유사체 또는 이종 시스템에 의해 생물학적으로 합성된 유사체를 포함한다.
"핵산 서열"이란 어구는 5' 말단에서 3' 말단으로 해독된 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 염기의 단일 또는 이중-가닥 중합체를 말한다. 상기 어구는 염색체 DNA, 자가-복제 플라스미드, DNA 또는 RNA의 감염성 중합체 및 1차 구조적 역할을 수행하는 DNA 또는 RNA를 포함한다.
"발현 조절 서열"은 작용가능하게 연결된 핵산의 전사를 지배하는 핵산 조절 서열의 배열로 정의된다. 상기 발현 조절 서열의 한 예는 "프로모터"이다. 프로모터는 전사 개시 부위 부근에 필수 핵산 서열을 포함한다. 프로모터는 또한 임의로 전사 개시 부위로부터 수천개 염기쌍만큼 많이 위치할 수 있는 원위성 증강제 또는 억제제 요소를 포함한다. "구성성" 프로모터는 대부분의 환경 및 생육 조건하에서 활성인 프로모터이다. "유도성" 프로모터는 환경 또는 생육 조절하에서 활성인 프로모터이다. "작용가능하에 연결된"이란 용어는 핵산 발현 조절 서열(예를 들면, 프로모터, 또는 전사 인자 결합 부위의 배열) 및 제 2 핵산 서열간의 기능적 결합을 말하는 것으로, 이때 발현 조절 서열은 제 2 서열에 상응하는 핵산의 전사를 지배한다.
폴리뉴클레오타이드 서열은 상기 폴리뉴클레오타이드 서열이 외래 종으로부터 유래된 경우 유기체 또는 제 2 폴리뉴클레오타이드에 "이종"이거나, 또는 동일한 종으로부터 유래된 경우 상기 폴리뉴클레오타이드 서열은 그의 원래 형태로부터 변형된다. 예를 들면, 이종 암호화 서열에 작용가능하게 연결된 프로모터는 그로부터 프로모터가 유도되는 서열과 상이한 종으로부터 유래된 암호화 서열을 말하거나, 또는 동일한 종으로부터 유래한 경우, 임의의 천연 대립유전자 변이체와 상이한 암호화 서열을 말한다.
변형유전자(transgene)의 발현 및 내인성 유전자의 억제(예를 들면, 안티센스 또는 센스 억제에 의한) 두 가지 경우 모두에서, 숙련된 자라면 삽입된 폴리뉴클레오타이드 서열이 동일할 필요는 없지만, 단지 그로부터 서열이 유래되는 유전자의 서열에 "실질적으로 동일할" 수 있음을 인지할 것이다.
삽입된 폴리뉴클레오타이드 서열이 전사 및 번역되어 작용성 폴리펩타이드를 생산하는 경우, 숙련된 자라면 코돈 변성으로 인해 많은 폴리뉴클레오타이드 서열이 동일한 폴리펩타이드를 암호화할 것임을 인지할 것이다. 이러한 변이체들은 특히 본 발명의 범위 안에 든다. 또한, 본 발명은 특히 서로 실질적으로 동일하고(하기에 기술하는 바와 같이 측정), 야생형 폴리펩타이드의 돌연변이체이거나 폴리펩타이드의 기능을 보유(예를 들면, 폴리펩타이드 중 아미노산의 보존적 치환으로부터 비롯되는)하는 폴리펩타이드를 암호화하는 서열을 포함한다. 게다가, 변이체들은 하기에 기술하는 바와 같은 우세한 음성 돌연변이체를 암호화하는 것들일 수 있다.
두 핵산 서열 또는 폴리펩타이드는, 하기에 기술하는 바와 같이 최대 상응성에 대해 정렬될 때 두 서열들에서 뉴클레오타이드 또는 아미노산 잔기 각각의 서열이 동일한 경우 "동일"하다고 한다. 두 개 이상의 핵산 또는 폴리펩타이드 서열과 관련하여 "동일한" 또는 "동일성" 퍼센트란 용어는, 하기의 서열 비교 알고리듬중 하나를 이용하거나 또는 수동식 정렬 및 육안 검사에 의해 측정할 때, 비교창을 통해 최대 상응성에 대해 비교 및 정렬되는 경우, 동일하거나, 또는 특정 비율의 동일한 아미노산 잔기 또는 뉴클레오타이드를 갖는 둘 이상의 서열 또는 부분서열을 말한다. 서열 동일성 비율을 단백질 또는 펩타이드와 관련하여 사용하는 경우, 동일하지 않은 잔기 위치들은 종종 보존적 아미노산 치환에 의해 달라지는 것으로 인지되는데, 이때 상기 보존적 아미노산 치환에서는 아미노산 잔기들이 유사한 화학 성질(예를 들면, 전하 또는 소수성)을 갖는 다른 아미노산 잔기들로 치환되므로 분자의 작용성을 변화시키지 않는다. 서열들이 보존적 치환에서 상이한 경우, 서열 동일성 퍼센트는 치환의 보존성을 보정하기 위해 상향 조정될 수 있다. 상기 조정을 수행하는 방법은 당해 분야에 숙련된 자에게 공지되어 있다. 전형적으로, 상기 방법은 보존적 치환을 전체적으로 불일치시키기 보다는 부분적으로만 불일치하게 함으로써 서열 동일성 퍼센트를 증가시킴을 포함한다. 따라서, 예를 들면, 동일한 아미노산을 1의 스코어로 나타내고 비-보존성 치환을 제로(0)의 스코어로 나타내는 경우, 보존적 치환은 0 내지 1의 스코어로 나타낸다. 보존적 치환의 스코어는, 예를 들면, 문헌 [Meyers & Miller, Computer Applic. Biol. Sci., 4:11-17, 1988]의 알고리듬에 따라서, 예를 들면, 프로그램 PC/GENE(미국 캘리포니아주 마운틴 뷰 소재의 인텔리제네틱스(Intelligenetics))에서 실행된 바와 같이 계산한다.
두 개의 핵산 또는 폴리펩타이드와 관련하여, "실질적으로 동일한"이란 어구는 하기의 서열 비교 알고리듬중 하나를 이용하거나 또는 수동식 정렬 및 육안 검 사로 측정할 때 비교 창을 통해 최대 상응성에 대해 정렬되는 경우 60% 이상, 바람직하게는 80%, 가장 바람직하게는 90 내지 95%의 뉴클레오타이드 또는 아미노산 잔기 동일성을 갖는 서열 또는 부분서열을 말한다. 상기 정의는 또한 그 서열의 보체가 시험 서열에 하이브리드화되는 서열을 말한다.
서열 비교시, 전형적으로 하나의 서열은 그에 대해 시험 서열을 비교하는 기준 서열로 작용한다. 서열 비교 알고리듬을 이용하여 시험 및 기준 서열을 컴퓨터에 입력하는 경우, 필요하다면 부분서열 좌표를 표시하고 서열 알고리듬 프로그램 파라미터들을 지정한다. 디폴트(default) 프로그램 파라미터를 이용하거나 또는 대체 파라미터를 지정할 수 있다. 그 다음, 서열 비교 알고리듬은 프로그램 파라미터를 근거로 기준 서열에 대한 시험 서열의 서열 동일성 퍼센트를 계산한다.
본원에서 사용한 바와 같이, "비교창"은 20 내지 600, 통상적으로는 약 50 내지 약 200, 보다 통상적으로는 약 100 내지 약 150으로 이루어진 그룹에서 선택된 인접 위치들의 번호 중 어느 하나의 분절을 말하는 것으로, 여기서 서열은 두 서열들을 최적으로 정렬한 후 동일한 번호의 인접 위치들의 기준 서열에 비교할 수 있다. 비교를 위한 서열들의 정렬 방법은 당해 분야에 공지되어 있다. 비교를 위한 서열의 최적 정렬은, 예를 들면, 스미스 및 워터만(Smith and Waterman)의 국소적 상동성 알고리듬[Smith and Waterman, Adv. Appl. Math., 2:482, 1981]에 의해, 니들만 및 운쉬(Needleman and Wunsch)의 상동성 정렬 알고리듬[Needleman and Wunsch, J. Mol. Biol., 48:443, 1970]에 의해, 피어슨 및 립맨(Pearson and Lipman)의 유사성 방법에 대한 연구[Pearson and Lipman, Proc. Nat'l. Acad. Sci. USA, 85:2444, 1988]에 의해, 상기 알고리듬들의 컴퓨터 실행 프로그램(위스콘신주 매디슨 소재의 제네틱스 컴퓨터 그룹, 575 사이언스 닥터(Genetics Computer Group, 575 Science Dr.), 위스콘신 제네틱스 소프트웨어 패키지(Wisconsin Genetics Software Package)의 GAP, BESTFIT, FASTA 및 TFASTA)에 의해, 또는 수동식 정렬 및 육안 검사에 의해 수행할 수 있다.
유용한 알고리듬의 한 예는 파일업(PILEUP)이다. 파일업은 관계 및 서열 동일성 퍼센트를 보여주기 위해 점진적 쌍 정렬법을 이용하여 관련된 서열들의 그룹으로부터 다중 서열 정렬을 달성한다. 파일업은 또한 정렬을 달성하는데 이용된 집단화 관계를 보여주는 수형도 또는 수상도를 작성한다. 파일업은 펭 및 두리틀(Feng and Doolittle)의 점진적 정렬 방법의 단순화 방법을 이용한다[Feng and Doolittle, J. Mol. Evol., 35:351-360, 1987]. 사용된 방법은 히긴스와 샤프(Higgins and Sharp)가 기술한 방법과 유사하다[Higgins and Sharp, CABIOS
5:151-153, 1989]. 프로그램은 각각 5,000 뉴클레오타이드 또는 아미노산의 최대 길이를 갖는 300개 이하의 서열들을 정렬시킬 수 있다. 다중 정렬 방법은 두 개의 가장 유사한 서열의 쌍 정렬로 시작하여 정렬된 두 서열의 집단을 제공한다. 이어서, 상기 집단을 다음의 가장 연관된 서열 또는 정렬된 서열의 집단으로 정렬시킨다. 서열들의 두 집단은 두 개의 개별적 서열들의 쌍 정렬의 단순한 확장에 의해 정렬시킨다. 최종 정렬은 일련의 점진적인 쌍 정렬에 의해 달성된다. 프로그램은 서열 비교 영역들을 위한 특정 서열 및 그의 아미노산 또는 뉴클레오타이드 좌표를 표시하고 프로그램 파라미터를 지정함으로서 실행된다. 예를 들면, 다음의 파라미 터들을 이용하여 서열 동일성 퍼센트 관계를 측정할 다른 시험 서열과 기준 서열을 비교할 수 있다: 디폴트 간격 가중치(3.00), 디폴트 간격 길이 가중치(0.10) 및 가중된 말단 간격.
서열 동일성 퍼센트 및 서열 유사성을 측정하는데 적합한 알고리듬의 또 다른 예는 블라스트(BLAST) 알고리듬[Altschul et al., J. Mol. Biol., 215:403-410, 1990]이다. 블라스트 분석을 수행하기 위한 소프트웨어는 국립 바이오테크놀로지 정보 센터(National Center for Biotechnology Information; http://www.ncbi.nlm.nih. gov/)를 통해 공적으로 입수가능하다. 상기 알고리듬은 먼저, 데이터베이스 서열 중 동일 길이의 워드와 함께 정렬될 때 일치되거나 일부 양의 값의 임계치 스코어 T를 만족시키는 조회 서열 중 길이 W의 짧은 워드를 확인함으로써 높은 스코어 서열 쌍(HSP)을 확인함을 포함한다. T는 주위 워드 스코어 임계치로 지칭된다[Altschul et al., J. Mol. Biol., 215:403-410, 1990]. 상기 초기 주위 워드 히트는 이들을 포함하는 더 긴 HSP를 찾기 위한 탐색을 개시하기 위한 시드로 작용한다. 워드 히트는 누적 정렬 스코어가 증가될 수 있는 한 각각의 서열을 따라 양 방향으로 확장된다. 각 방향으로의 워드 히트의 확장은 다음과 같은 경우에 정지된다: 누적 정렬 스코어가 그 최대 달성값으로부터 X의 양만큼 떨어지는 경우; 누적 스코어가 하나 이상의 음의 스코어를 갖는 잔기 정렬의 누적으로 인해 0 이하가 되는 경우; 또는 어느 한 서열의 말단에 이르는 경우. 블라스트 알고리듬 파라미터 W, T 및 X는 정렬의 민감도 및 속도를 결정한다. 블라스트 프로그램은 디폴트로서 11의 워드길이(W), 50의 블로섬(BLOSUM)62 스코어 매트릭스( 문헌 [Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA, 89:10915, 1989] 참조) 정렬(B), 10의 기대값(E), M=5, N=-4 및 두 가닥의 비교를 이용한다.
블라스트 알고리듬은 또한 두 서열간의 유사성의 통계 분석을 수행한다(예를 들면, 문헌 [Karlin and Altschul, Proc. Nat'l. Acad. Sci. USA, 90:5873-5877, 1993] 참조). 블라스트 알고리듬에 의해 제공된 유사성의 한 측정법은 최소 합 확률(P(N))로서, 이것은 두 뉴클레오타이드 또는 아미노산 서열간의 일치가 우연히 일어날 확률의 지표를 제공한다. 예를 들면, 기준 핵산에 대한 시험 핵산의 비교시 최소 합 확률이 약 0.2 미만, 보다 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만인 경우, 핵산을 기준 서열과 유사한 것으로 간주한다.
"보존적으로 변형된 변이체"는 아미노산 및 핵산 서열 둘 다에 적용된다. 특정 핵산 서열과 관련하여, 보존적으로 변형된 변이체는 동일하거나 본질적으로 동일한 아미노산 서열을 암호화하는 핵산을 말하거나, 또는 핵산이 아미노산 서열을 암호화하지 않는 경우에는 필수적으로 동일한 서열을 말한다. 유전자 코드의 변성으로 인해, 많은 수의 기능상 동일한 핵산 코돈이 임의의 해당 단백질을 암호화한다. 예를 들면, 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산 알라닌을 암호화한다. 따라서, 코돈에 의해 알라닌이 규정되는 모든 위치에서, 코돈은 암호화된 폴리펩타이드를 변화시키지 않고 기술한 상응하는 코돈들 중 임의의 코돈으로 변형될 수 있다. 상기 핵산 변이는 보존적으로 변형된 변이의 한 종류인 "잠재성 변이"이다. 본원에서 폴리펩타이드를 암호화하는 모든 핵산 서열은 또한 핵산의 모든 가능한 잠재성 변이를 나타낸다. 숙련된 자라면 핵산의 각각의 코돈(AUG 제외, AUG 코돈은 통상적으로 메티오닌에 대한 유일한 코돈이다)이 변형되어 기능상 동일한 분자를 제공할 수 있음을 인지할 것이다. 따라서, 폴리펩타이드를 암호화하는 핵산의 각각의 잠재성 변이는 각각의 나타낸 서열에 내재한다.
아미노산 서열과 관련하여, 숙련된 자라면 핵산에 대한 개별적인 치환, 결실 또는 부가, 또는 암호화된 서열에서 단일 아미노산 또는 낮은 비율의 아미노산(즉, 20% 미만, 예를 들면, 15%, 10%, 5%, 4%, 3%, 2% 또는 1%)을 변형시키는 펩타이드, 폴리펩타이드 또는 단백질 서열에 대한 치환이, 변형에 의해 아미노산이 화학적으로 유사한 아미노산으로 치환되는 "보존적으로 변형된 변이"임을 인지할 것이다. 기능상 유사한 아미노산을 제공하는 보존적 치환 목록은 당해 분야에 공지되어 있다.
하기의 6개 그룹은 각각 서로 보존적 치환체인 아미노산들을 포함한다: 알라닌(A), 세린(S), 트레오닌(T); 아스파트산(D), 글루탐산(E); 아스파라진(N), 글루타민(Q); 아르기닌(R), 라이신(K); 이소류신(I), 류신(L), 메티오닌(M), 발린(V); 및 페닐알라닌(F), 티로신(Y), 트립토판(W)(예를 들면, 문헌 [Creighton, Proteins, 1984] 참조).
두 핵산 서열 또는 폴리펩타이드가 실질적으로 동일하다는 지적은 첫 번째 핵산에 의해 암호화된 폴리펩타이드가 제 2의 핵산에 의해 암호화된 폴리펩타이드에 대해 발생된 항체와 면역적으로 교차 반응성이라는 것이다. 따라서, 폴리펩타이드는 전형적으로, 예를 들면, 두 펩타이드가 보존적 치환에 의해서만 차이나는 경우, 실질적으로 제 2의 폴리펩타이드와 동일하다. 두 핵산 서열이 실질적으로 동일하다는 또 다른 지적은 두 분자 또는 그의 보체가 하기에 기술하는 바와 같은 엄격한 조건하에서 서로 하이브리드화된다는 것이다.
"특이적으로 하이브리드화된다"라는 어구는 서열이 복합 혼합물로 존재하는 경우(예를 들면, 전체 세포 또는 라이브러리 DNA 또는 RNA) 엄격한 하이브리드화 조건하에서 특정 뉴클레오타이드 서열에만 분자가 결합, 이중화 또는 하이브리드화되는 것을 말한다.
"엄격한 하이브리드화 조건"이란 어구는 프로브가 전형적으로 핵산 서열들의 복합 혼합물 중 그 표적 서열에는 하이브리드화되지만 다른 서열에는 하이브리화되지 않는 조건을 말한다. 엄격한 조건은 서열-의존성이며 다른 상황에서는 달라질 것이다. 더 긴 서열은 특이적으로 더 높은 온도에서 하이브리드화된다. 핵산의 하이브리드화에 대한 광범위한 지침을 문헌 [Tijssen, Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Probes, "Overview of Principles of Hybridization and the Strategy of Nucleic Acid Assays", 1993]에서 찾을 수 있다. 일반적으로, 매우 엄격한 조건은 한정된 이온 강도 및 pH에서 특정 서열에 대한 열용융 온도(Tm)보다 약 5 내지 10 ℃ 더 낮도록 선택된다. 엄격성이 낮은 조건은 일반적으로 Tm보다 약 15 내지 30 ℃ 낮도록 선택된다. Tm은 표적에 상보성인 프로브의 50%가 평형에서(표적 서열이 Tm에서 과량으로 존재하기 때문에 프로브의 50%가 평형에서 점유된다) 표적 서열에 하이브리드화되는 온도(한정된 이온 강도, pH 및 핵산 농도하에)이다. 엄격한 조건은 pH 7.0 내지 8.3에서 염 농도가 약 1.0M 미만의 나트륨 이온, 전형적으로 약 0.01 내지 1.0 M 나트륨 이온 농도(또는 다른 염)이고, 온도가 단프로브(약, 10 내지 50개 뉴클레오타이드)의 경우 약 30 ℃ 이상, 장프로브(예를 들면, 50개보다 많은 뉴클레오타이드)의 경우 약 60 ℃ 이상인 조건일 것이다. 엄격한 조건은 또한 포름아미드와 같은 탈안정화제의 첨가에 의해 달성될 수도 있다. 선택적 또는 특이적 하이브리드화의 경우, 양의 신호는 백그라운드의 적어도 2배, 바람직하게는 백그라운드 하이브리드화의 10배이다.
엄격한 조건하에서 서로에 하이브리드화되지 않는 핵산은 이들이 암호화하는 폴리펩타이드가 실질적으로 동일하다면 여전히 실질적으로 동일하다. 이러한 경우는, 예를 들면, 핵산의 복사가 유전자 코드에 의해 허용되는 최대 코돈 변성을 이용하여 이루어질 때 발생한다. 그러한 경우, 핵산은 전형적으로 중간 정도로 엄격한 하이브리드화 조건하에서 하이브리드화된다.
본 발명에 있어서, 본 발명의 핵산을 함유하는 게놈 DNA 또는 cDNA는 본원에 개시된 핵산 서열을 이용하여 엄격한 조건하에서 표준 서던 블롯법(Southern blots)으로 동정할 수 있다. 상기 개시내용에 있어서, 상기 하이브리드화에 적합한 엄격한 조건은 37 ℃에서 40% 포름아미드, 1M NaCl, 1% 나트륨 도데실 설페이트(SDS)의 완충액 중에서 하이브리드화시키고, 약 50 ℃ 이상, 통상적으로 약 55 내지 약 60 ℃의 온도에서 약 20 분간 0.2xSSC로 1회 이상 세척함을 포함하는 조건, 또는 등가의 조건이다. 양성 하이브리드화는 백그라운드의 적어도 2배이다. 통상적인 기술을 가진 자라면 대안적인 하이브리드화 및 세척 조건을 이용하 여 유사한 엄격한 조건을 제공할 수 있음을 쉽게 인지할 것이다.
두 폴리뉴클레오타이드가 실질적으로 동일하다는 또 다른 지적은, 한 쌍의 올리고뉴클레오타이드 프라이머에 의해 증폭된 기준 서열을 이어서 엄격한 하이브리드화 조건하에서 프로브로 사용하여 cDNA 또는 게놈 라이브러리로부터 시험 서열을 단리하거나, 또는 예를 들면, 노던 또는 서던 블롯법으로 시험 서열을 동정할 수 있다는 것이다.
본 발명은 또한 상기 정의한 바와 같은 발현 벡터를 포함한다. 발현 벡터는 상기에 나타낸 폴리뉴클레오타이드 서열들 각각의 하나 이상의 복사체를 포함한다. 본 발명의 발현 벡터는, 예를 들면, 서열번호: 42, 또는 서열번호: 42의 다음 잔기들: 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 뿐 아니라, 서열번호: 157의 59 내지 292, 295 내지 1158 또는 1185 내지 1610 잔기, 및 서열번호: 177의 1 내지 1170 또는 1258 내지 1980 잔기와 같은, 본원에 정의된 폴리뉴클레오타이드 서열들 중 어느 것이라도 함유할 수 있다. 발현 벡터는, 예를 들면, 서열번호: 42, 서열번호: 157 및 서열번호: 177과 같은, 본 발명에서 동정된 폴리뉴클레오타이드 서열의 조합을 함유할 수도 있다.
발현 벡터내의 폴리뉴클레오타이드 서열은 임의로 상기 정의되고 실시예에 예시된 바와 같은 발현 조절 서열에 작용가능하게 연결될 수 있다.
본 발명은 또한, 예를 들면, 하기 발현 벡터들을 포함한다: pBBR-K-mev-op16-1, pBBR-K-mev-op16-2, pDS-mvaA, pDS-idi, pDS-hcs, pDS-mvk, pDS-pmk
, pDS-mvd, pDS-His-mvaA, pDS-His-idi, pDS-His-hcs, pDS-His-mvk, pDS-His-
pmk, pDS- His-mvd, pBBR-K-Zea4, pBBR-K-Zea4-up, pBBR-K-Zea4-down, pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk
, pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd, pBBR-K-PcrtE-mvaA-crtE-3, pDS-His-phaA
, pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ, pBBR-K-PcrtE-crtZW, 및 그의 조합. 이들 발현 벡터들은 하기의 실시예에서 더 상세히 정의한다. 더욱이, 본 발명은 또한 본원에 정의된 서열들 중 하나를 함유하는 임의의 발현 벡터를 포함하는데, 상기 발현 벡터는 적합한 숙주 세포에서 카로티노이드, 바람직하게는 제아잔틴과 같은 이소프레노이드 화합물을 발현시키는데 이용된다.
본원에서 사용한 바와 같이, "발현 벡터"란 어구는 본원에 나타낸 폴리뉴클레오타이드 서열을 암호화하는 DNA 서열을 지니며, 상기 DNA 서열의 발현을 매개할 수 있는 복제가능한 비히클이다.
이와 관련하여, "복제가능한"이란 용어는 벡터가 도입된 해당 유형의 숙주 세포에서 벡터가 복제될 수 있음을 의미한다. 문제의 폴리뉴클레오타이드 서열(들)의 바로 위쪽에, 신호 펩타이드를 암호화하는 서열이 제공될 수 있는데, 상기 서열의 존재로 인해 벡터를 지닌 숙주 세포에 의해 발현된 암호화된 폴리펩타이드의 분비가 확실해진다. 신호 서열은 선별된 폴리뉴클레오타이드 서열과 천연적으로 결합된 것이거나 또는 또 다른 기원에서 유래된 것일 수 있다.
벡터는 편리하게 재조합 DNA 절차에 적용될 수 있는 임의의 벡터일 수 있으며, 벡터의 선택은 종종 벡터가 도입되는 숙주 세포에 따라 달라질 것이다. 따라서, 벡터는 자발적으로 복제되는 벡터, 즉, 그 복제가 염색체 복제와 무관한 염색 체외 구성요소로서 존재하는 벡터일 수 있으며; 상기 벡터의 예는 플라스미드, 파지, 코스미드 또는 소(小)염색체(minichromosome)이다. 또는, 벡터는, 숙주 세포에 도입될 때 숙주 세포 게놈에 통합되고 그것이 통합되는 염색체(들)과 함께 복제되는 것일 수 있다. 적합한 벡터의 예는 실시예에 나타내었다. 본 발명의 발현 벡터는 하기에서 정의하는 바와 같은 본 발명의 DNA 서열들 중 어느 것이라도 지닐 수 있으며, 하기에 정의하는 본 발명의 폴리펩타이드들 중 임의의 폴리펩타이드의 발현에 사용될 수 있다.
본 발명은 또한 본원에 개시된 하나 이상의 폴리뉴클레오타이드 서열 및/또는 하나 이상의 발현 벡터를 함유하는 배양 세포를 포함한다. 본원에서 사용한 바와 같이, "배양된 세포"는 한정된 조건하에서 성장하고 본 발명의 폴리뉴클레오타이드에 의해 암호화된 하나 이상의 폴리펩타이드를 발현시킬 수 있는 임의의 세포를 포함한다. 바람직하게는, 배양 세포는 효모, 진균, 세균 또는 조류이다. 보다 바람직하게는, 배양 세포는 파라코커스(Paracoccus), 플라보박테리움(Flavobacterium), 아그로박테리움(Agrobacterium), 알칼리제네스(Alcaligenes), 에르위니아(Erwinia), 이. 콜라이(E. coli) 또는 바실러스 서브틸리스(B. subtilis)이다. 훨씬 더 바람직하게는, 세포는, 예를 들면, R-1506, R-1512, R1534 또는 R114와 같은 파라코커스이다. 본 발명은 또한 본원에 개시된 폴리펩타이드를 발현시키는, 본 발명에서 동정된 세포들 중 임의 세포의 자손을 포함한다. 본 발명에서, 세포의 AFLP DNA 지문이 실시예 2에 나타낸 조건을 이용하여 추정상의 모세포의 지문과 구별할 수 없는 경우 상기 세포는 또 다른 세 포의 자손이다.
따라서, 본 발명에 따른 배양 세포는, 예를 들면, 서열번호: 42, 또는 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기, 및 서열번호: 157의 59 내지 292, 295 내지 1158 또는 1185 내지 1610 잔기 및 서열번호: 177의 1 내지 1170 또는 1258 내지 1980 잔기를 포함할 수 있다. 상기 서열들은 단독으로 또는 발현 벡터의 일부로서 세포에 전달될 수 있다. 상기 서열들은 또한 임의로 발현 조절 서열(들)에 작용가능하게 연결될 수 있다. 배양 세포는 또한, 예를 들면, 서열번호: 42, 서열번호: 157 및 서열번호: 177과 같은 본 발명에서 동정된 폴리뉴클레오타이드 서열들의 조합을 포함할 수도 있다.
본 발명에 따른 배양 세포는 카로티노이드 생합성 경로에 관여하는 하나 이상의 효소를 암호화하는 폴리뉴클레오타이드를 또한 함유할 수 있다. 예를 들면, 본 발명에 따른 배양 세포는 서열번호: 180, 182 및 184의 하나 이상의 복사체를 단독으로 또는 본원에서 동정된 폴리뉴클레오타이드 서열 중 임의의 서열과 함께 함유할 수 있다. 따라서, 본원에 개시된 폴리뉴클레오타이드 서열은 배양 세포 중에 단독으로 전달되거나 또는 목표 이소프레노이드 화합물, 예를 들면, 제아잔틴 또는 아스타잔틴과 같은 카로티노이드의 증대된 생산을 제공하는 또 다른 폴리뉴클레오타이드 서열과 함께 전달될 수 있다. 이와 관련하여, 본 발명은, 예를 들면, GGPP 신타제, β-카로틴-β4-옥시게나제(케톨라제) 및/또는 β-카로틴 하이드록실라제와 같은 카로티노이드 생합성에 수반되는 폴리펩타이드를 암호화하는 임의의 폴리뉴클레오타이드의 사용을 포함한다. 또한, 카로티노이드 생합성에 수반되는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드들의 조합은 같거나 다른 발현 벡터상에 본 발명에서 동정된 하나 이상의 폴리뉴클레오타이드와 함께 사용될 수 있다. 상기 구성물은 본 발명에 따라 배양 세포로 전달되어 문제의 이소프레노이드를 발현하는 세포를 제공할 수 있다.
예를 들면, 본 발명에 따른 배양 세포는 다음 발현 벡터들 중 하나 이상을 함유할 수 있다: pBBR-K-mev-op16-1, pBBR-K-mev-op16-2, pDS-mvaA, pDS-idi, pDS-hcs, pDS-mvk, pDS-pmk, pDS-mvd, pDS-His-mvaA, pDS-His-idi, pDS-His-hcs, pDS-His-mvk, pDS-His-pmk, pDS-His-mvd, pBBR-K-Zea4, pBBR-K-Zea4-up, pBBR-K-Zea4-down, pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk, pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd, pBBR-K-PcrtE-mvaA-crtE-3, pDS-His-phaA, pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ, pBBR-K-PcrtE-crtZW, 및 그의 조합.
본 발명의 또 다른 태양은 카로티노이드의 제조 방법이다. 본 방법에서는, 상기 정의한 바와 같은 배양 세포를 상기 정의한 바와 같은 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드의 발현을 허용하는 조건하에서 배양한다. 폴리펩타이드의 발현을 허용하는 배양 조건은 하기 실시예에 나타내었으며, 필요한 경우, 목적하는 특정 용도에 적합하게 수정될 수 있다. 그 다음, 카로티노이드를 세포로부터, 또는 분비된 경우 세포 배지로부터 단리한다.
본 발명에서, "카로티노이드"에는 다음 화합물들이 포함된다: 피토엔, 라이 코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 혼합물. 바람직하게는, 카로티노이드는 제아잔틴이다.
본 발명의 또 다른 태양은 카로티노이드-생산 세포를 제조하는 방법이다. 이 방법은 (a) 세포에서 발현되는, 메발로네이트 경로에 관여하는 효소를 암호화하는 폴리뉴클레오타이드 서열을 세포에 도입하고; (b) 폴리뉴클레오타이드 서열 도입 전에 세포에 의해 생산된 카로티노이드 수준보다 약 1.1 내지 1,000배의 수준으로 카로티노이드를 생산하는, 단계 (a)의 폴리뉴클레오타이드 서열을 함유하는 세포를 선별함을 포함한다.
본원에서 사용한 바와 같이, "메발로네이트 경로에 관여하는 효소"란 어구는 IPP 생합성을 위한 메발로네이트 경로에 수반되고 atoB 또는 phaA, hcs, mvaA, mvk, pmk 및 mvd 유전자에 의해 암호화되는 효소를 의미한다. 본 발명에 있어서, 효소는 실시예 1에 나타낸 활성 분석법 중 어느 하나를 이용하여 검출되는 경우 "세포에서 발현된" 것이다. 카로티노이드의 생성을 검출하는 분석법은 당해 분야에 공지되어 있다. 실시예 1, 11 및 12는 제아잔틴, 라이코펜 및 아스타잔틴 각각의 존재를 확인하기 위한 대표적인 분석 절차를 나타낸 것이다. 유사한 방법으로, 다른 카로티노이드에 대한 분석법을 이용하여, 예를 들면, 피토엔, 칸타잔틴, 아도니잔틴, 크립토잔틴, 에키네논 및 아도니루빈의 세포 또는 배지중의 존재를 검출할 수 있다.
따라서, 상기 방법을 이용하여 다음의 대표적인 카로티노이드를 제조할 수 있다: 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔 틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 혼합물. 상기 방법에 있어, 제아잔틴이 바람직한 카로티노이드이다.
상기 방법은 폴리뉴클레오타이드 서열 도입 전에 세포에 의해 생산된 카로티노이드 수준의 약 1.1 내지 1,000배, 바람직하게는 약 1.5 내지 500배, 예를 들면, 약 100배 또는 적어도 10배의 수준으로 카로티노이드를 생산할 수 있는 세포를 제조함을 포함한다.
상기 방법에 있어, 세포는 약 1 mg/L 내지 약 10 g/L의 카로티노이드를 생성한다. 세포는 약 100 mg/L 내지 약 9 g/L, 예를 들면, 약 500 mg/L 내지 약 8 g/L 또는 약 1 g/L 내지 약 5 g/L의 카로티노이드를 생성하는 것이 바람직하다.
상기 방법에서, 세포는 효모, 진균, 세균 및 조류에서 선택할 수 있다. 바람직하게는, 세포는 파라코커스, 플라보박테리움, 아그로박테리움, 알칼리제네스
, 에르위니아, 이. 콜라이 및 바실러스 서브틸리스로부터 선택된 세균이다. 가장 바람직하게는, 세균은 파라코커스이다.
상기 방법에서, 세포는 돌연변이 세포일 수 있다. 본원에서 사용한 바와 같이, "돌연변이 세포"는 비-천연 폴리뉴클레오타이드 서열, 또는 그 천연 형태로부터 변형된(예를 들면, 1 내지 100개, 바람직하게는 20 내지 50개, 보다 바람직하게는 10개 미만의 뉴클레오타이드의 재배열 또는 결실 또는 치환에 의해) 폴리뉴클레오타이드 서열을 포함하는 임의의 세포이다. 상기 비-천연 서열은 무작위 돌연변이유발, 화학적 돌연변이유발, UV-조사 등에 의해 수득할 수 있다. 바람직하게, 돌연변이는 메발로네이트 경로에 수반되는 하나 이상의 유전자들의 발현을 증가시 켜 제아잔틴과 같은 카로티노이드의 생산을 증가시킨다. 상기 돌연변이 세포를 제조하고, 선별하고, 동정하는 방법은 당해 분야에 공지되어 있으며, 하기 실시예에 예시되어 있다. 상기 돌연변이체의 예는 R114 또는 R1534이다. 바람직하게는 돌연변이 세포는 R114이다.
상기 방법에서, 폴리뉴클레오타이드 서열은 서열번호: 42, 또는 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기, 및 서열번호: 157의 59 내지 292, 295 내지 1158 또는 1185 내지 1610 잔기 및 서열번호: 177의 1 내지 1170 또는 1258 내지 1980 잔기이다. 상기 서열들은 상기 방법에 단독으로 또는 발현 벡터의 일부로 사용될 수 있다. 상기 서열들은 또한 임의로 발현 조절 서열(들)에 작용가능하게 연결될 수 있다. 상기 방법에서는, 예를 들면, 서열번호: 42, 서열번호: 157 및 서열번호: 177과 같은 본 발명에서 동정된 폴리뉴클레오타이드 서열들의 조합을 사용할 수도 있다.
상기 방법에 사용하기 위해 선택할 수 있는 발현 벡터의 예로는 pBBR-K-mev-op16-1, pBBR-K-mev-op16-2, pDS-mvaA, pDS-idi, pDS-hcs, pDS-mvk, pDS-pmk
, pDS-mvd, pDS-His-mvaA, pDS-His-idi, pDS-His-hcs, pDS-His-mvk, pDS-His-
pmk, pDS-His-mvd, pBBR-K-Zea4, pBBR-K-Zea4-up, pBBR-K-Zea4-down, pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk
, pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd, pBBR-K-PcrtE-mvaA-crtE-3, pDS-His-phaA
, pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ, pBBR-K-PcrtE-crtZW, 및 그의 조합.
상기 방법에서, 폴리뉴클레오타이드 서열은 임의의 통상적인 방법을 이용하여 세포내에 도입한다. 폴리뉴클레오타이드 서열을 세포에 도입하기 위한 적합한 방법의 예로는 형질전환, 형질도입, 형질감염, 리포펙션(lipofection), 전기천공(electroporation)(예를 들면, 문헌 [Shigekawa and Dower, Biotechniques, 6:742-751, 1988] 참조), 접합(예를 들면, 문헌 [Koehler and Thorne, Journal of Bacteriology, 169:5771-5278, 1987] 참조) 및 유전자총(biolistics)을 포함한다.
접합을 이용하여 폴리뉴클레오타이드 서열을, 예를 들어, 발현 벡터 형태로 수용체 세균에 전달하는 방법이 일반적으로 효과적이며 공지되어 있는 절차이다(예를 들면, US 5,985,623 호). 세균 균주에 따라서, 정제된 DNA로 수용 세포를 형질전환시키는 방법을 이용하는 것이 더 보편적일 수 있다.
알려져 있는 전기천공 기술(시험관내 및 생체내 둘 다)은 처리 영역 주위에 배치된 전극에 짧은 고전압 펄스를 적용함으로써 작용한다(예를 들면, US 6,208,893 호). 전극들 사이에 생성된 전기장은 세포막을 일시적으로 다공성이 되게 하는데, 이때 이식제 분자가 세포에 유입된다. 공지된 전기천공 방법에서, 상기 전기장은 약 100 μs 기간의 대략 1000 V/cm의 단일 네모파 펄스를 포함한다. 상기 펄스는, 예를 들면, 비티엑스 디비젼 오브 제네트로닉스, 인코포레이티드(BTX Division of Genetronics, Inc.)에서 제조한 일렉트로 스퀘어 포레이터(Electro Square Porator) T820의 공지된 적용에 의해 발생될 수 있다.
유전자총은 미세발사체 충격 기술을 이용하여 표적 세포에 폴리뉴클레오타이 드를 전달하는 시스템이다. 가속에 의해 표적 세포에 폴리뉴클레오타이드를 전달하는 방법의 예시적인 태양은 바이오리스틱스 파티클 딜리버리 시스템(Biolistics Particle Delivery System)으로, 이 시스템을 이용하여 배양된 표적 세포로 덮인 필터 표면 위로 스테인리스 스틸 또는 나이텍스(Nytex) 체와 같은 체를 통해 DNA 또는 세포로 피복된 입자를 추진시킬 수 있다. 체는 입자들을 분산시켜 입자들이 표적 세포에 거대 응집체로 전달되지 않는다. 발사 장치 및 충격받을 세포 사이에 놓인 체는 발사 응집체의 크기를 감소시키고, 너무 큰 발사체에 의한 수용체 세포 상에 가해진 손상을 감소시킴으로써 보다 많은 빈도의 형질전환에 기여할 수 있는 것으로 생각된다.
충격시, 현탁액 중의 세포는 필터 또는 고체 배지상에 농축되는 것이 바람직하다. 또는, 다른 표적 세포가 고체 배지상에 배열될 수도 있다. 충격받을 세포는 미세발사 정지판 아래의 적절한 거리에 배치된다. 경우에 따라, 가속 장치와 충격받을 세포 사이에 하나 이상의 체가 또한 배치된다. 상기 공지된 기술을 사용하여, 일시적으로 표지 유전자를 발현시키는 세포를 1000 포커스 이상까지 수득할 수 있다. 외인성 유전자를 발현시키는 세포 수(포커스)에 충격후 48 시간을 곱한 값은 흔히 1 내지 10의 범위이며 평균 1 내지 3이다.
충격 형질전환 방법에서, 충격전 배양 조건 및 충격 파라미터를 최적화하여 최대수의 안정한 형질전환체를 수득할 수 있다. 충격에 대한 물리적 및 생물학적 파라미터는 둘 다 상기 기술에 중요하다. 물리적 인자는 폴리뉴클레오타이드/미세발사체 침전물을 처리하는 것을 수반하는 인자 또는 거대- 또는 미세발사체의 비행 및 속도에 영향을 미치는 인자이다. 생물학적 인자로는 충격 전 및 직후의 세포 처리에 수반되는 모든 단계, 충격과 관련된 손상을 경감시키기 위한 표적 세포의 삼투압 조절, 및 또한 선형화 DNA 또는 비손상 고차코일 플라스미드와 같은 형질전환 DNA의 성질이 포함된다.
따라서, 소규모 연구에서 다양한 충격 파라미터를 조정하여 조건을 완전히 최적화하고자 할 수 있을 것으로 생각된다. 특히, 간격 거리, 비행 거리, 조직 거리 및 헬륨 압력과 같은 물리적 파라미터를 조정하고자 할 수 있다. 또한, 수용체 세포의 생리학적 상태에 영향을 미치며 따라서 형질전환 및 통합 효율에 영향을 미칠 수 있는 조건을 변화시킴으로써 손상 감소 인자(TRF)를 최소화할 수 있다. 예를 들면, 삼투 상태, 조직 수화도, 및 수용체 세포의 계대배양 단계 또는 세포 주기를 최적 형질전환을 위해 조정할 수 있다. 다른 통상적인 조정을 수행하는 방법은 본원 개시내용에 견주어 당해 분야의 기술을 가진 자라면 알 것이다.
입자-매개 형질전환 방법은 당해 분야에 숙련된 자에게 공지되어 있다. 예를 들면, US 5,015,580 호(본원에 구체적으로 참고로 인용됨)는 상기 기술을 이용한 대두의 형질전환을 기술하고 있다.
본 발명의 또 다른 태양은 이소프레노이드 화합물을 생산하도록 세균을 공학처리하는 방법이다. 상기 세균은, (a) 이소프레노이드의 발현을 허용하는 조건하에 배지에서 모(母) 세균을 배양하고, 모 세균보다 약 1.1 내지 1,000배 더 많은 이소프레노이드를 생산하는 배지로부터 돌연변이 세균을 선별하고; (b) 발현 조절 서열에 작용가능하게 연결된 서열번호: 42로 나타낸 폴리뉴클레오타이드 서열을 함 유하는 발현 벡터를 돌연변이 세균에 도입하고; (c) 발현 벡터를 함유하고 단계 (a)의 돌연변이보다 적어도 약 1.1배 더 많은 이소프레노이드를 생산하는 세균을 선별함으로써 제조된다.
상기 태양에서, 이소프레노이드 화합물은 구조적으로 하기 화학식의 이소펜테닐 디포스페이트(IPP)를 기본으로 하는 화합물을 의미한다:
상기 화합물로는 헤미테르펜, 모노테르펜, 세스퀴테르펜, 디테르펜, 트리테르펜(예를 들면, 피토스테롤, 피토에스트로겐, 피토에크디손, 에스트로겐), 테트라테르펜(카로티노이드) 및 폴리테르펜이 포함된다. 바람직하게는, 이소프레노이드는, 예를 들면, 상기에서 정의한 카로티노이드들 중 하나와 같은 카로티노이드이며, 특히 제아잔틴이다.
세균은 본원에 개시된 방법들을 이용하여 이소프레노이드 화합물을 생산할 수 있는 임의의 세균일 수 있다. 바람직하게는, 세균은 파라코커스, 플라보박테리움, 아그로박테리움, 알칼리제네스, 에르위니아, 이. 콜라이 또는 바실러스 서브틸리스이다. 세균은 파라코커스인 것이 훨씬 더 바람직하다. 바람직하게, 모 세균은 R-1506 또는 R1512이고, 돌연변이 세균은 R1534 또는 R114이고, 바람직하게는 R114이다.
세균은 이소프레노이드의 생산에 최적화된 배지 및 조건하에서 배양한다. 배지 및 배양 조건의 선택은 당해 분야의 기술에 속하는 것이다. 실시예 1, 11 및 12에 나타낸 분석법들은 배지 중 특정 카로티노이드의 존재를 측정하기 위한 대표적인 방법들을 제공한 것이다. 배양 조건을 최적화하고 목표 이소프레노이드의 생산을 측정함으로써, 본원에 인용된 특정 생산 파라미터를 충족시키는 돌연변이체의 배양 및 선별이 달성될 수 있다. 이러한 방식으로, 모 세균보다 약 1.1 내지 1,000배 더 많은 이소프레노이드를 생산하는 돌연변이 세균을 선별할 수 있다. 바람직하게는, 돌연변이 세균은 모 세균보다 약 1.5 내지 500배 더 많은 이소프레노이드, 예를 들면, 모 세균보다 적어도 약 100배 또는 적어도 약 10배 더 많은 이소프레노이드를 생산한다. 그 다음, 상기 세균을 배양하고 후속 단계에 이용한다.
목적하는 수준의 이소프레노이드를 생산하는 돌연변이 세균을 선별한 후에, 상기에 나타내거나 실시예에 기술된 방법들 중 임의의 방법을 이용하여 발현 벡터를 세균내에 도입한다. 본원에 정의된 발현 벡터들 중 어느 것이라도 돌연변이 세포에 도입할 수 있다. 바람직하게는, 발현 벡터는 서열번호: 42를 함유한다.
일단 발현 벡터를 돌연변이 세균에 도입하면, 형질전환되지 않은 돌연변이체보다 적어도 약 1.1배, 예를 들면, 약 5 내지 약 20배 더 많은 이소프레노이드를 생산하는 안정한 형질전환체를 선별한다. 이어서, 선별된 형질전환체를 이소프레노이드 생산에 적합한 조건하에서 배양한 다음, 세포 또는 배지로부터 이소프레노이드를 단리한다.
상기 방법에서의 추가 단계는 세균에 의한 이소프레노이드 화합물의 생산을 증가시키는 돌연변이 세균에 돌연변이를 도입하는 것이다. 돌연변이는 다음 중 하나 이상으로부터 선택할 수 있다: 폴리하이드록시알카노에이트(PHA) 경로의 불활성 화, 아세틸-CoA 아세틸트랜스퍼라제의 발현 증가, FPP 신타제의 발현 증가, 카로티노이드 생합성 경로에 수반되는 효소의 발현 증가, 및 이소펜테닐 디포스페이트(IPP)를 디메틸알릴 디포스페이트(DMAPP)로 전환시키는 효소의 발현 증가.
PHA 경로의 불활성화는, phaB(서열번호: 177의 뉴클레오타이드 위치 1258 내지 1980)에 의해 암호화되는 폴리펩타이드를 발현하지 않는 돌연변이 세균을 선별하거나, 또는 서열번호: 177 또는 그의 단편을 사용하여 동종 재조합에 의해 야생형 phaB 유전자의 발현을 중단시킴으로써 수행할 수 있다.
상기 방법에서, 아세틸-CoA 아세틸트랜스퍼라제의 발현을 증가시키는 것은 서열번호: 175 또는 발현 조절 서열에 작용가능하게 연결된 서열번호: 177의 뉴클레오타이드 위치 1 내지 1170으로 나타낸 폴리뉴클레오타이드 서열을 함유하는 벡터를 돌연변이 세균에 도입함으로써 달성될 수 있다. 상기 방법에서, FPP 신타제의 발현을 증가시키는 것은 발현 조절 서열에 작용가능하게 연결된 서열번호: 157의 뉴클레오타이드 295 내지 1158로 나타낸 폴리뉴클레오타이드 서열을 함유하는 벡터를 돌연변이 세균에 도입함으로써 이루어질 수 있다. 상기 방법에서, 카로티노이드 유전자의 발현은 카로티노이드 생합성 경로에 관여하는 하나 이상의 효소를 암호화하는 폴리뉴클레오타이드 서열, 예를 들면, 발현 조절 서열에 작용가능하게 연결된 서열번호: 180, 182 및 184로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 벡터를 돌연변이 세균에 도입시킴으로써 증가시킬 수 있다.
상기 방법에서, 이소프레노이드 화합물은 이소펜테닐 디포스페이트(IPP)인 것이 바람직하다. 이소프레노이드 화합물은, 예를 들면, 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 혼합물과 같은 카로티노이드인 것도 또한 바람직하다.
본 발명의 또 다른 태양은 하기 특성을 갖는 파라코커스 속 미생물이다: (a) 0%의 간격 페널티를 갖는 진콤파르(GeneCompar) v. 2.0 소프트웨어를 사용한 상동성 계산으로부터 수득된 유사성 매트릭스를 이용하여 97%보다 높은 서열번호: 12에 대한 서열 유사성; (b) 81.5 ℃에서 DNA:DNA 하이브리드화를 이용하여 70%보다 높은 R-1512, R1534, R114 또는 R-1506에 대한 상동성; (c) R114, R-1512, R1534 및 R-1506의 게놈 DNA의 G+C 함량으로부터 1% 미만으로 변하는 게놈 DNA의 G+C 함량; 및 (d) 실시예 2의 AFLP 절차를 이용하여 균주 R-1512, R1534, R114 및 R-1506에 대해 약 58% 유사성에 밀집되는 평균 DNA 지문, 단, 미생물은 파라코커스(MBIC3966)이 아니다.
각각의 상기 특성들을 측정하는 방법은 실시예 2에 상세히 나타내었으며, 이들 방법을 이용하는 경우 상기 기준을 충족시키는 미생물을 쉽게 동정할 수 있을 것으로 생각된다. 본 발명의 미생물은 상기에 나타낸 각각의 특성(즉, (a) 내지 (d))을 갖는 것이 바람직하다. 그러나, 파라코커스속 (MBIC3966)을 제외하고 R114, R-1512, R1534 및 R-1506과 동일한 종에 속하는 미생물을 분류학적으로 타당하게 기술하기에 충분한 정보를 제공하는, 특성 (a) 내지 (d)의 임의의 조합도 또한 본 발명의 범위에 속한다.
본 발명의 또 다른 태양은 하기 특성들을 갖는 파라코커스 속의 미생물이다: (a) 세포막의 전체 지방산의 약 75% 이상을 차지하는 18:1w7c; (b) 성장을 위한 탄소 공급원으로 아도니톨, i-에리트리톨, 젠티오바이오스, β-메틸글루코사이드, D-솔비톨, 자일리톨 및 퀸산을 사용할 수 없음; 및 (c) 성장을 위한 탄소 공급원으로 L-아스파라긴 및 L-아스파트산을 사용하는 능력, 단, 미생물은 파라코커스속 (MBIC3966)이 아니다.
각각의 상기 특성들을 측정하는 방법은 또한 실시예 2에 상세히 나와 있으며, 이들 방법을 이용하는 경우 상기 기준을 충족시키는 미생물을 용이하게 확인할 수 있을 것으로 생각된다. 본 발명의 미생물은 상기에 나타낸 각각의 특성(즉, (a) 내지 (c))을 갖는 것이 바람직하다. 그러나, 파라코커스속 (MBIC3966)을 제외하고 R114, R-1512, R1534 및 R-1506과 동일한 종에 속하는 미생물을 분류학적으로 타당하게 기술하기에 충분한 정보를 제공하는, 특성 (a) 내지 (c)의 임의의 조합도 또한 본 발명의 범위에 속한다.
본 발명의 또 다른 태양은 다음 특성들을 갖는 파라코커스 속의 미생물이다: (a) 40 ℃에서 성장하는 능력; (b) 8% NaCl을 포함하는 배지에서 성장하는 능력; (c) 9.1의 pH를 갖는 배지에서 성장하는 능력; 및 (d) 황색-오렌지색 콜로니 착색, 단, 미생물은 파라코커스속 (MBIC 3966)이 아니다.
각각의 상기 특성들을 측정하는 방법은 또한 실시예 2에 상세히 나타내었으며, 이들 방법을 이용하는 경우 상기 기준을 충족시키는 미생물을 쉽게 동정할 수 있을 것으로 생각된다. 본 발명의 미생물은 상기에 나타낸 각각의 특성(즉, (a) 내지 (d))을 갖는 것이 바람직하다. 그러나, 파라코커스속 (MBIC3966)을 제외하고 R114, R-1512, R1534 및 R-1506과 동일한 종에 속하는 미생물을 분류학적으로 타당하게 기술하기에 충분한 정보를 제공하는, 특성 (a) 내지 (d)의 임의의 조합도 또한 본 발명의 범위에 속한다.
본 발명의 미생물은 또한 파라코커스속 (MBIC3966)을 제외하고 R114, R-1512, R1534 및 R-1506과 동일한 종에 속하는 미생물을 분류학적으로 타당하게 기술하기에 충분한 정보를 제공하는, 상기에 나타낸 11개 특성들의 임의의 조합을 이용하여 동정할 수 있다.
상기 설명에 따르면, 본 발명은 다음을 제공한다:
(1) 하기 (a) 내지 (j)로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:
(a) 서열번호: 43의 잔기 1 내지 340으로 나타낸 아미노산 서열, 특히 서열번호: 43의 68 내지 97 위치에 상응하는 아미노산 서열;
(b) 서열번호: 45의 잔기 1 내지 349로 나타낸 아미노산 서열, 특히 서열번호: 45의 1 내지 30 위치에 상응하는 아미노산 서열;
(c) 서열번호: 47의 잔기 1 내지 388로 나타낸 아미노산 서열, 특히 서열번호: 47의 269 내지 298 위치에 상응하는 아미노산 서열;
(d) 서열번호: 49의 잔기 1 내지 378로 나타낸 아미노산 서열, 특히 서열번호: 49의 109 내지 138 위치에 상응하는 아미노산 서열;
(e) 서열번호: 51의 잔기 1 내지 305로 나타낸 아미노산 서열, 특히 서열번호: 51의 198 내지 227 위치에 상응하는 아미노산 서열;
(f) 서열번호: 53의 잔기 1 내지 332로 나타낸 아미노산 서열, 특히 서열번호: 53의 81 내지 110 위치에 상응하는 아미노산 서열;
(g) 30개 이상의 인접 아미노산 잔기를 갖는, 서열번호: 43, 45, 47, 49, 51 및 53으로 이루어진 그룹에서 선택된 아미노산 서열의 단편;
(h) 하이드록시메틸글루타릴-CoA 리덕타제(HMG-CoA 리덕타제), 이소펜테닐 디포스페이트 이소머라제, 하이드록시메틸글루타릴-CoA 신타제(HMG-CoA 신타제), 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는, 서열번호: 43, 45, 47, 49, 51 및 53으로 이루어진 그룹에서 선택된 폴리펩타이드 단편의 아미노산 서열;
(i) 엄격한 조건하에서 서열번호: 42 또는 서열번호: 42의 보체의 30개 이상의 연속 뉴클레오타이드를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는 폴리펩타이드의 아미노산 서열;
(j) 서열번호: 43, 45, 47, 49, 51 또는 53의 보존적으로 변형된 변이체.
(2) 다음으로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:
(a) 서열번호: 159의 잔기 1 내지 287로 나타낸 아미노산 서열;
(b) 서열번호: 159의 30개 이상의 인접 아미노산 잔기;
(c) 서열번호: 159의, 파네실 디포스페이트 신타제(FPP 신타제) 활성을 갖는 단편 의 아미노산 서열;
(d) 엄격한 조건하에서 서열번호: 157의 295 내지 1158 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, FPP 신타제 활성을 갖는 폴리펩타이드의 아미노산 서열;
(e) 서열번호: 159의 보존적으로 변형된 변이체.
(3) 다음으로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:
(a) 서열번호: 160의 잔기 1 내지 142로 나타낸 아미노산 서열;
(b) 서열번호: 160의 30개 이상의 인접 아미노산 잔기;
(c) 서열번호: 160의, 1-데옥시자일룰로즈-5-포스페이트 신타제(DXPS) 활성을 갖는 단편의 아미노산 서열;
(d) 엄격한 조건하에서 서열번호: 157의 1185 내지 1610 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, DXPS 활성을 갖는 폴리펩타이드의 아미노산 서열;
(e) 서열번호: 160의 보존적으로 변형된 변이체.
(4) 다음으로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:
(a) 서열번호: 178의 잔기 1 내지 390으로 나타낸 아미노산 서열;
(b) 서열번호: 178의 30개 이상의 인접 아미노산 잔기;
(c) 서열번호: 178의, 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드 단편의 아미노산 서열;
(d) 엄격한 조건하에서 서열번호: 177의 1 내지 1170 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드의 아미노산 서열;
(e) 서열번호: 178의 보존적으로 변형된 변이체.
(5) 다음으로 이루어진 그룹에서 선택된 아미노산 서열을 포함하는 단리된 폴리펩타이드:
(a) 서열번호: 179의 잔기 1 내지 240으로 나타낸 아미노산 서열;
(b) 서열번호: 179의 30개 이상의 인접 아미노산 잔기;
(c) 서열번호: 179의 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드 단편의 아미노산 서열;
(d) 엄격한 조건하에서 서열번호: 177의 1258 내지 1980 위치에 존재하는 30개 이상의 연속 뉴클레오타이드 또는 그의 보체를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드에 의해 암호화된, 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드의 아미노산 서열;
(e) 서열번호: 179의 보존적으로 변형된 변이체.
(6) 서열번호: 42; 파라코커스 속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 42의 변이체; 하이드록시메틸글루타릴-CoA 리덕타제(HMG-CoA 리덕타제), 이소펜테닐 디포스페이트 이소머라제, 하이드록시메틸글루타릴-CoA 신타제(HMG-CoA 신타제), 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서 뉴클레오타이드 서열이 서열번호: 42 또는 서열번호: 42의 보체의 30개 이상의 인접 뉴클레오타이드로 이루어진 하이브리드화 프로브에 하이브리드화되는, HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 특히
(a) 서열번호: 42의 2622 내지 3644 뉴클레오타이드; HMG-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 그의 단편; 및 뉴클레오타이드 서열이 서열 번호: 42의 2622 내지 3644 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 엄격한 조건하에서 하이브리드화되는, HMG-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 2622 내지 3644 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열;
(b) 서열번호: 42의 3641 내지 4690 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; 이소펜테닐 디포스페이트 이소머라제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 3641 내지 4690 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 이소펜테닐 디포스페이트 이소머라제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열;
(c) 서열번호: 42의 4687 내지 5853 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; HMG-CoA 신타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 4687 내지 5853 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, HMG-CoA 신타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열;
(d) 서열번호: 42의 5834 내지 6970 뉴클레오타이드; 파라코커스속 균주 R1534 코 돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; 메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 5834 내지 6970 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열;
(e) 서열번호: 42의 6970 내지 7887 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; 포스포메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 6970 내지 7887 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 포스포메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열; 또는
(f) 서열번호: 42의 7880 내지 8878 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; 디포스포메 발로네이트 데카복실라제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 42의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호:42의 7880 내지 8878 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 디포스포메발로네이트 키나제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 42의 7880 내지 8878 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드 서열, 보다 특히 서열번호: 42의 3641 내지 4690 뉴클레오타이드로 이루어진 폴리뉴클레오타이드 서열.
(7) 서열번호: 157의 뉴클레오타이드 서열; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 157의 변이체; 파네실 디포스페이트(FPP) 신타제 활성, 1-데옥시-D-자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드 또는 XseB 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 157 또는 서열번호: 157의 보체의 30개 이상의 인접 뉴클레오타이드로 이루어진 하이브리드화 프로브에 하이브리드화되는, FPP 신타제 활성, 1-데옥시-D-자일룰로즈-5-포스페이트 신타제 활성 및 XseB 활성으로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 특히
(a) 서열번호: 157의 59 내지 292 위치에 존재하는 뉴클레오타이드 서열; 파라코커 스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 그의 변이체; XseB의 기능을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 59 내지 292 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 157의 59 내지 292 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, XseB의 기능을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 157의 59 내지 292 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드;
(b) 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는, 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열의 변이체; FPP 신타제 활성을 암호화하는 서열번호: 157의 295 내지 1158 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 157의 295 내지 1158 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, FPP 신타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 157의 295 내지 1158 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드;
(c) 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는, 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열의 변이체; 1-데옥시자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 157의 1185 내지 1610 위치에 존재하는 뉴클레오타이드 서열의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 157의 1185 내지 1610 위치에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 상기 서열의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 1-데옥시자일룰로즈-5-포스페이트 신타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 157의 1185 내지 1610 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드.
(8) 서열번호: 177의 뉴클레오타이드 서열; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체; 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 177의 30개 이상의 인접 뉴클레오타이드 또는 서열번호: 177의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열 로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 특히
(a) 서열번호: 177의 1 내지 1170 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체; 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 177의 1 내지 1170 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 아세틸-CoA 아세틸트랜스퍼라제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 177의 1 내지 1170 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드 서열;
(b) 서열번호: 177의 1258 내지 1980 뉴클레오타이드; 파라코커스속 균주 R1534 코돈 이용 표(표 14)에 따른 하나 이상의 치환을 포함하는 서열번호: 177의 변이체; 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 서열번호: 177의 단편; 및 엄격한 조건하에서, 뉴클레오타이드 서열이 서열번호: 177의 1258 내지 1980 잔기에 존재하는 30개 이상의 인접 뉴클레오타이드 또는 그의 보체로 이루어진 하이브리드화 프로브에 하이브리드화되는, 아세토아세틸-CoA 리덕타제 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열, 보다 특히는 서열번호: 177의 1258 내지 1980 뉴클레오타이드로 이루어진 단리된 폴리뉴클레오타이드 서열;
(9) 서열번호: 42, 서열번호: 157, 서열번호: 177 및 그의 조합으로 이루어진 그룹에서 선택된 뉴클레오타이드 서열을 포함하는 단리된 폴리뉴클레오타이드 서열.
(10) (6)(a) 내지 (6)(f), (7)(a) 내지 (7)(c), (8)(a), (8)(b) 또는 (9) 중 어느 하나의 폴리뉴클레오타이드 서열을 포함하는 발현 벡터, 특히, 폴리뉴클레오타이드 서열이 발현 조절 서열에 작용가능하게 연결된 발현 벡터, 예를 들면, 카로티노이드 생합성 경로에 수반되는 효소를 암호화하는 폴리뉴클레오타이드 서열을 추가로 포함하는 발현 벡터, 보다 특히는, 폴리뉴클레오타이드 서열이 발현 조절 서열에 작용가능하게 연결된 서열번호: 180, 서열번호: 182, 서열번호: 184 및 그의 조합으로 이루어진 그룹에서 선택된 발현 벡터.
(11) pBBR-K-mev-op16-1, pBBR-K-mev-op16-2, pDS-mvaA, pDS-idi, pDS-hcs, pDS-mvk, pDS-pmk, pDS-mvd, pDS-His-mvaA, pDS-His-idi, pDS-His-hcs
, pDS-His-mvk, pDS-His-pmk, pDS-His-mvd, pBBR-K-Zea4, pBBR-K-Zea4-up, pBBR-K-Zea4-down, pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk, pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd, pBBR-K-PcrtE-mvaA-crtE-3, pDS-His-phaA, pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ, pBBR-K-PcrtE-crtZW, 및 그의 조합으로 이루어진 그룹에서 선택된 발현 벡터, 특히
(a) pBBR-K-mev-op16-1 및 pBBR-K-mev-op16-2로 이루어진 그룹에서 선택된 발현 벡 터;
(b) pBBR-K-Zea4, pBBR-K-Zea4-up 및 pBBR-K-Zea4-down으로 이루어진 그룹에서 선택된 발현 벡터;
(c) pBBR-K-PcrtE-crtE-3, pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk, pBBR-tK-PcrtE-pmk, pBBR-tK-PcrtE-mvd 및 그의 조합으로 이루어진 그룹에서 선택된 발현 벡터;
(d) 발현 벡터 pBBR-K-PcrtE-mvaA-crtE-3;
(e) 발현 벡터 pDS-His-phaA; 또는
(f) pBBR-K-PcrtE-crtW, pBBR-K-PcrtE-crtWZ 및 pBBR-K-PcrtE-crtZW로 이루어진 그룹에서 선택된 발현 벡터.
(12) (6)(a) 내지 (f), (7)(a) 내지 (c), (8)(a), (8)(b) 또는 (9) 중 어느 하나의 폴리뉴클레오타이드 서열, 또는 (10) 또는 (11)의 발현 벡터를 포함하는, 상기 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드를 발현시키는 배양 세포, 또는 세포 자손, 특히, 다음에서 선택된 특징에 의해 더욱 특성화되는 세포:
(a) 카로티노이드 생합성 경로의 효소를 암호화하는 폴리뉴클레오타이드 서열을 추가로 포함하는 세포, 보다 특히는 카로티노이드 생합성 경로의 효소를 암호화하는 폴리뉴클레오타이드 서열이 서열번호: 180, 182 및 184로 이루어진 그룹에서 선택되는, 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드를 발현시키는 배양 세포, 또는 세포 자손; 및
(b) 효모, 진균, 세균 및 조류로부터 선택된 그룹의 일원인 세포, 특히 파라코커 스, 플라보박테리움, 아그로박테리움, 알칼리제네스, 에르위니아, 이. 콜라이 및 바실러스 서브틸리스로 이루어진 그룹에서 선택된 세균, 보다 특히는 파라코커스, 보다 특히는 R-1506, R-1512, R1534 및 R114로 이루어진 그룹에서 선택된 파라코커스.
(13) 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드의 발현을 가능하게 하는 조건하에서 (12)의 세포를 배양하고 세포 또는 세포 배지로부터 카로티노이드를 단리함을 포함하는, 카로티노이드의 제조 방법.
(14) 다음을 포함하는, 카로티노이드-생산 세포의 제조 방법:
(a) 세포에서 발현되는 메발로네이트 경로의 효소를 암호화하는 폴리뉴클레오타이드 서열을 세포내에 도입하는 단계; 및
(b) 폴리뉴클레오타이드 서열 도입 전에 세포에 의해 생산된 카로티노이드의 수준보다 약 1.1 내지 1,000배 더 높은 수준으로 카로티노이드를 생산하는, 단계 (a)의 폴리뉴클레오타이드 서열을 함유하는 세포를 선별하는 단계,
특히, 다음에서 선택된 특징에 의해 특성화되는 방법으로부터 선택된 방법:
(i) 상기 선별 단계는 폴리뉴클레오타이드 서열의 도입 전에 세포에 의해 생산된 카로티노이드 수준보다 약 1.5 내지 500배, 특히 약 100배, 또는 적어도 약 10배 더 높은 수준으로 카로티노이드를 생산하는 단계 (a)의 폴리뉴클레오타이드 서열을 함유하는 세포를 선별함을 포함한다;
(ii) 상기 세포는 약 1 mg/L 내지 약 10 g/L의 카로티노이드를 생산한다;
(iii) 상기 세포는 효모, 진균, 세균 및 조류로부터 선택되고, 특히 파라코커스, 플라보박테리움, 아그로박테리움, 알칼리제네스, 에르위니아, 이. 콜라이 및 바실러스 서브틸리스로 이루어진 그룹에서 선택되며, 보다 특히는 파라코커스에서 선택된다;
(iv) 단계 (a)의 세포는 돌연변이 세포이며, 특히 R114 및 R1534로 이루어진 그룹에서 선택되고, 특히는 상기 돌연변이 세포는 비-돌연변이 세포에 비해 약 1.1 내지 1,000배, 특히 약 1.5 내지 500배, 보다 특히 적어도 약 100배 이상 또는 적어도 약 10배 이상의 수준의 카로티노이드를 생산한다;
(v) 폴리뉴클레오타이드 서열은 (6)(a) 내지 (f), (7)(a) 내지 (c), (8)(a), (8)(b) 및 (9)의 폴리뉴클레오타이드 서열로부터 선택되며, 특히 이때 폴리뉴클레오타이드 서열은 발현 조절 서열에 작용가능하게 연결된다;
(vi) 폴리뉴클레오타이드 서열은 (10) 또는 (11)의 발현 벡터이다;
(vii) 도입 단계는 형질전환, 형질도입, 형질감염, 리포펙션, 전기천공, 접합 및 유전자총으로 이루어진 그룹에서 선택된다;
(viii) 카로티노이드는 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 조합으로부터 선택되며, 특히 카로티노이드는 제아잔틴이다.
(15) 하기 단계를 포함하는, 이소프레노이드 화합물을 생산하도록 세균을 공학처리하는 방법:
(a) 이소프레노이드 화합물의 발현을 허용하는 조건하에 배지에서 모 세균을 배양하고, 모 세균보다 약 1.1 내지 1,000배 더 많은 이소프레노이드 화합물을 생산하 는 돌연변이 세균을 배지로부터 선별하는 단계;
(b) 발현 조절 서열에 작용가능하게 연결된 서열번호: 42로 나타낸 폴리뉴클레오타이드 서열을 포함하는 발현 벡터를 돌연변이 세균에 도입하는 단계; 및
(c) 발현 벡터를 함유하며 단계 (a)의 돌연변이체보다 적어도 약 1.1배 더 많은 이소프레노이드 화합물을 생산하는 세균을 선별하는 단계; 특히,
(i) 돌연변이 세균에 돌연변이를 도입함을 추가로 포함하는 방법, 보다 특히는,
돌연변이가 다음 중 하나 이상에서 선택된 결과를 야기하는 방법: 폴리하이드록시알카노에이트(PHA) 경로의 불활성화, 아세틸-CoA 아세틸트랜스퍼라제의 발현 증가, 파네실 디포스페이트(FPP) 신타제의 발현 증가, 카로티노이드 경로에 수반되는 효소의 발현 증가, 이소펜테닐 디포스페이트(IPP)를 디메틸알릴 디포스페이트(DMAPP)로 전환시키는 효소의 발현 증가, 보다 특히는,
PHA 경로의 불활성화가 phaB(서열번호: 177의 1258 내지 1980 위치의 뉴클레오타이드)에 의해 암호화되는 폴리펩타이드를 발현시키지 않는 돌연변이 세균을 선별하거나, 또는 서열번호: 177 또는 그의 단편을 이용하여 동종 재조합에 의해 야생형 phaB 유전자의 발현을 방해함을 포함하는 방법, 또는
아세틸-CoA 아세틸트랜스퍼라제의 발현을 증가시키는 것이 발현 조절 서열에 작용가능하게 연결된 서열번호: 175로 나타낸 폴리뉴클레오타이드 서열 또는 서열번호: 177의 1 내지 1170 위치의 뉴클레오타이드를 포함하는 벡터를 돌연변이 세균에 도입함을 포함하는 방법, 또는
FPP 신타제의 발현을 증가시키는 것이 발현 조절 서열에 작용가능하게 연결된 서열 번호: 157의 295 내지 1158 뉴클레오타이드로 나타낸 폴리뉴클레오타이드 서열을 포함하는 벡터를 돌연변이 세균에 도입함을 포함하는 방법, 또는
카로티노이드 경로에 수반되는 효소의 발현을 증가시키는 것이 발현 조절 서열에 작용가능하게 연결된 서열번호: 180, 182 및 184로 이루어진 그룹에서 선택된 폴리뉴클레오타이드 서열을 포함하는 벡터를 돌연변이 세균에 도입함을 포함하는 방법;
(b) 이소프레노이드가 이소펜테닐 디포스페이트(IPP)인 방법;
(c) 이소프레노이드가 카로티노이드인 방법, 특히 카로티노이드가 피토엔, 라이코펜, β-카로틴, 제아잔틴, 칸타잔틴, 아스타잔틴, 아도니잔틴, 크립토잔틴, 에키네논, 아도니루빈 및 그의 조합으로 이루어진 그룹에서 선택되는 방법;
(d) 모 세균이 파라코커스, 특히 R-1512 또는 R-1506 또는 R1534 또는 R114인 방법, 특히 돌연변이체가 R114인 방법.
(16) 하기 특성을 갖는, 파라코커스 속 미생물:
(i) 0%의 간격 페널티를 갖는 진콤파르 v. 2.0 소프트웨어를 사용한 상동성 계산으로부터 수득된 유사성 매트릭스를 이용하여 97%보다 높은 서열번호: 12에 대한 서열 유사성;
81.5 ℃에서 DNA:DNA 하이브리드화를 이용하여 70%보다 높은 균주 R-1512, R1534, R114 또는 R-1506에 대한 상동성;
R114, R-1512, R1534 및 R-1506의 게놈 DNA의 G+C 함량으로부터 1% 미만으로 변하는 게놈 DNA의 G+C 함량; 및
실시예 2의 AFLP 절차를 이용하여 균주 R-1512, R1534, R114 및 R-1506에 대해 약 58% 유사성에 밀집되는 평균 DNA 지문(단, 미생물은 파라코커스속 (MBIC3966)이 아님);
(ii) 세포막의 전체 지방산의 약 75% 이상을 차지하는 18:1w7c;
성장을 위한 탄소 공급원으로 아도니톨, i-에리트리톨, 젠티오바이오스, β-메틸글루코사이드, D-솔비톨, 자일리톨 및 퀸산을 사용할 수 없음; 및
성장을 위한 탄소 공급원으로 L-아스파라긴 및 L-아스파트산을 사용하는 능력(단, 미생물은 파라코커스속 (MBIC3966)이 아님); 또는
(iii) 40 ℃에서 성장하는 능력;
8% NaCl을 포함하는 배지에서 성장하는 능력;
9.1의 pH를 갖는 배지에서 성장하는 능력; 및
황색-오렌지색 콜로니 착색(단, 미생물은 파라코커스속 (MBIC 3966)이 아니다).
하기의 실시예는 본 발명의 특정 태양을 더 예시하기 위해 나타낸 것이다. 이들 실시예는 예시일 뿐이며 어떤 식으로든 본 발명의 범위를 제한하는 것이 아니다.
실시예 1: 분석 및 생화학적 방법
(a) 카로티노이드의 분석
샘플 제조. 먼저 1:1 디메틸설폭사이드(DMSO) 및 테트라하이드로푸란(THF)의 용매 혼합물을 제조하였다. 부틸화 하이드록시톨루엔(BHT, 5 g/l 용매 혼합물) 을 첨가하여 상기 용매 혼합물을 안정화시켰다. 4 ml의 안정화된 DMSO/THF 혼합물을 일회용 15-ml 폴리프로필렌 원심분리 튜브 중의 0.4 ml의 세균 배양액에 가하였다(1/11의 최종 희석률). 튜브에 뚜껑을 덮고 볼텍스(Vortex) 혼합기를 사용하여 각각 10 초간 혼합하였다. 이어서, 샘플을 20 분간 브링크만 비브라믹스(Brinkmann Vibramix) 진탕기 위에 두었다. 튜브를 실온에서 4000 rpm으로 4 분간 원심분리하고, 맑은 황색/오렌지색 상등액의 분취량들을 고성능 액체 크로마토그래피(High Performance Liquid Chromatography, HPLC)로 분석하기 위해 갈색 유리병으로 옮겼다.
HPLC. 아스타잔틴, 제아잔틴, 칸타잔틴, β-카로틴 및 라이코펜을 동시에 측정하기 위해 역상 HPLC 방법을 진행하였다. 상기 방법은 또한 제아잔틴의 주 시스-이성체를 분리할 수 있었다. 항온 자동시료채취장치 및 다이오드 배열 검출기가 장착된 에이질런트(Agilent) 1100 HPLC 시스템을 이용하여 수행하였다. 상기 방법의 파라미터들은 다음과 같았다:
컬럼: YMC 카로티노이드 C30 컬럼, 입자 크기 5 μ, 250x4.6 mm 내경, 스틸(YMC, 부품 번호 CT99S052546WT);
가드 컬럼: 펠리가드(Pelliguard) LC-18 카트리지, 20 mm(슈펠코(SUPELCO), 부품 번호 59654);
이동상: 메탄올(MeOH)/메틸 3급-부틸 에테르(TBME) 구배
실행 시간: 28 분; 전형적인 컬럼 압력: 개시때 90 바; 유량: 1.0 ml/분; 검출: 450 nm에서 UV; 주입 부피: 10 μl; 컬럼 온도: 15 ℃.
시약. 메탄올 및 TBME는 HPLC용 등급이며, 각각 이엠 사이언스(EM Science) 및 제이.티. 베이커(J.T. Baker)에서 입수하였다. DMSO(옴니솔브(Omnisolve))는 이엠 사이언스에서 구입하였다. THF(HPLC 용매)는 버딕(Burdick) 및 잭슨(Jackson)에서 입수하였다.
계산. 정량 분석은 외부 표준물(스위스 바셀 소재의 호프만-라 로슈(Hoffmann-La Roche)에서 제공)을 이용하여 2 단계 보정하에 행하였다. 계산은 피크 면적을 기준으로 하였다.
선택도. 방법의 선택도는 적절한 카로티노이드 기준 화합물의 표준 용액을 주입하여 입증하였다. 목표 화합물(완전-트랜스-카로티노이드)은 완전히 분리되었으며 간섭을 나타내지 않았다. 일부 소량의 시스 이성체가 함께 용출될 수 있지만, 이들 잠재적으로 간섭하는 이성체들은 드물며 통상적인 분석에서는 고려할 필요가 없다. 화합물의 체류 시간을 표 1에 열거하였다.
선형성. 25 mg의 완전-트랜스-제아잔틴을 50 ml의 DMSO/THF 혼합물에 용해시켰다(500 μg/ml의 최종 제아잔틴 농도 제공). 희석 시리즈를 제조하고(250, 100, 50, 10, 5, 1 및 0.1 μg/ml의 최종 제아잔틴 농도) 전술한 HPLC 방법으로 분석하였다. 선형 범위는 0.1 내지 250 μg/ml로 나타났다. 보정 계수는 0.9998이었다.
검출 한계. 상기 방법에 의한 제아잔틴에 대한 검출의 하한치는 60 μg/l인 것으로 측정되었다. 보다 큰 주입 부피 및 통합 파라미터의 최적화에 의해 검출 한계를 약 5 μg/l로 저하시키는 것이 가능하였다.
재현성. 완전-트랜스-제아잔틴에 대한 체류 시간은 매우 안정하였다(상대 표준 편차(RSD), 0.2%). 동일한 배양액 샘플의 10회 반복 분석을 기준으로, 피크 면적 재현성은 완전 트랜스-제아잔틴에 대해 0.17% RSD 및 크립토잔틴에 대해 1.0%인 것으로 측정되었다.
(b) 조 추출물의 제조 및 효소 분석 방법
조 추출물의 제조. 1 ml의 추출 완충액(사용된 완충액은 분석되는 효소에 따라 달라짐-조성은 하기에 기술하는 각각의 효소 분석 절차에 따라 규정된다)에 세척한 세포 펠릿을 재현탁하여 파라코커스 및 이. 콜라이의 조 추출물을 제조하였다. 세포 현탁액을 2 ml의 플라스틱 병에 넣고 미니 비드 비터 8(Mini Bead Beater 8; 미국 오클랜드주 바트레스빌 소재의 바이오스펙 프로덕츠(Biospec Products))을 사용하여 유리 비드로 교반시켜 파괴하였다. 파괴는 4 ℃에서 배지 교반 세팅을 이용하여 수행하였다. 파괴된 제제를 4 ℃에서 21,000xg로 20 분간 원심분리하여 세포 파편을 침강시키고, 상등액을 직접 효소 분석에 이용하였다.
단백질 측정. 조 추출물 중 단백질 농도는 바이오-래드(Bio-Rad) 단백질 분석용 시약(미국 캘리포니아주 헤르큘레스 소재의 바이오-래드)을 이용하여 브래드포드(Bradford)의 방법[Anal. Biochem., 72:248-254, 1976]에 의해 측정하였다. 표준 곡선 제작을 위한 기준 단백질로서 소 혈청 알부민을 사용하였다.
아세틸-CoA 아세틸트랜스퍼라제 분석. 150mM EPPS(N-[2-하이드록시에틸]피페리진-N'-[3-프로판설폰산]) 완충액(pH 8.0) 중에서 조 추출물을 제조하였다. 분석은 슬래터(Slater) 등이 기술한 방법[J. Bacteriol., 180:1979-1987, 1998]에 따라 가티올분해(thiolysis) 방법으로 수행하였다. 상기 분석은 304 nm에서 분광측정법에 의해 아세토아세틸-CoA의 소실을 측정한다. 반응 혼합물은 150mM EPPS 완충액(pH 8.0), 50mM MgCl2, 100μM CoA, 40μM 아세토아세틸-CoA 및 조 추출물을 함유하였다. 반응은 30 ℃에서 수행하였으며 조 추출물을 첨가하여 개시하였다. 304 nm에서 아세토아세틸-CoA의 소실은 스펙트라맥스 플러스(SpectraMAX Plus) 플레이트 판독기(미국 캘리포니아주 서니베일 소재의 몰레큘라 디바이스 코포레이션(Molecular Devices Corp.)) 및 석영 마이크로 플레이트(microtiter plate)를 이용하여 관찰하였다(임의의 표준 분광광도계도 또한 사용할 수 있다). 활성(U/mg 단백질로 표시)은 아세토아세틸-CoA를 사용하여 제작된 표준 곡선을 이용하여 계산하였다(1 유니트의 활성 = 1 μ몰의 소비된 아세토아세틸-CoA/분). 아세틸-CoA 아세틸트랜스퍼라제 활성의 검출 하한치는 0.006 U/mg이었다.
HMG-CoA 신타제 분석. HMG-CoA 신타제는 혼다(Honda) 등의 방법[Hepatology, 27:154-159, 1998]에 따라 분석하였다. 상기 분석에서, 아세틸-CoA 및 아세토아세틸-CoA로부터 HMG-CoA의 생성은 HPLC에 의해 반응 생성물 및 기질을 분리함으로써 직접 측정한다. 조 추출물은 50mM 트리스-HCl 완충액(pH 8.0) 중에서 제조하였다. 반응 혼합물(0.1 ml)은 50mM 트리스-HCl 완충액(pH 8.0), 0.1mM EDTA, 20mM MgCl2, 0.1mM 아세토아세틸-CoA, 0.8mM 아세틸-CoA 및 조 추출물을 함유하였다. 반응물을 30 ℃에서 2 분간 예비배양한 다음 조 추출물을 가하였다. 30 ℃에서 5 분간 반응시킨 후에, 0.2 ml의 200mM 테트라-부틸 암모늄 포스페이트(TBAP, 메탄올-물(3:2, 최종 pH는 5.5였음)에 용해시켰으며 내부 회수 기준으로 0.2mM 프로피오닐-CoA를 함유함)를 가하여 반응을 중지시켰다. 이어서, 혼합물을 4 ℃에서 21,000xg로 3 분간 원심분리하고 계속하여 역상 이온-쌍 HPLC로 분석할 때까지 얼음 위에 두었다. HMG-CoA 및 프로피오닐-CoA를 노바-팩(Nova-Pak) C18 컬럼(3.9 x 150 mm, 미국 매사추세츠주 밀리포드 소재의 워터스 코포레이션(Waters Corporation))을 사용하여 아세틸-CoA 및 아세토아세틸-CoA로부 터 분리하였다. 주입 부피는 20 μl이고, 이동상은 메탄올-물(1:1, 최종 pH: 5.5)에 용해시킨 50 mM TBAP였으며, 유량은 1.0 ml/분이었다. HMG-CoA 및 프로피오닐-CoA는 254 nm에서의 흡광도로 측정하였다. 반응에서 생성된 HMG-CoA는 인증된 HMG-CoA를 사용하여 제작된 표준 곡선과 비교하여 정량하였다. 활성은 U/mg 단백질로 정의하였다. 활성 1 유니트는 생성된 1 나노몰 HMG-CoA/분이다. HMG-CoA 신타제의 검출 하한치는 약 1 U/mg이었다.
HMG-CoA 리덕타제 분석. 50 mM KCl, 1 mM EDTA 및 프로테아제 억제제 칵테일(미국 미저리주 세인트 루이스 소재의 시그마 케미칼 캄파니(Sigma Chemical Co.), 카탈로그 #P-2714)을 함유하는 25mM 인산 칼륨 완충액(pH 7.2) 중에서 조 추출물을 제조하였다. 분석은 타카하시(Takahashi) 등의 방법[J. Bcateriol., 181:1256-1263, 1999]에 따라 수행하였다. 상기 분석은 340 nm에서 NADPH의 HMG-CoA 의존성 산화를 분광측정법에 의해 측정한다. 반응 혼합물은 25mM 인산 칼륨 완충액(pH 7.2), 50mM KCl, 1mM EDTA, 5mM 디티오트레이톨, 0.3mM NADPH, 0.3mM R,S-HMG-CoA 및 조 추출물을 함유하였다. 반응은 30 ℃에서 수행하였으며 HMG-CoA를 첨가하여 개시하였다. 340 nm에서 NADPH의 HMG-CoA 의존성 산화를 스펙트라맥스 플러스 플레이트 판독기(미국 캘리포니아주 서니베일 소재의 몰레큘라 디바이스 코포레이션) 및 석영 마이크로 플레이트를 이용하여 관찰하였다(임의의 표준 분광광도계도 또한 사용할 수 있다). 활성(U/mg 단백질로 표시)은 NADPH를 사용하여 제작된 표준 곡선을 이용하여 계산하였다(1 유니트의 활성 = 1 μ몰의 산화된 NADPH). HMG-CoA 리덕타제 활성의 검출 하한치는 0.03 U/mg이었다.
메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 디포스페이트 데카복실라제 분석. 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 디포스페이트 데카복실라제에 대한 기질 제조 및 분석 절차는 팝잭(Popjak)의 문헌 [Methods Enzymol., 15:393-425, 1969]에 상세히 기술되어 있다. 모든 분석에 있어, 1 유니트의 효소 활성은 생성된 생성물 1 μ몰/분으로 정의한다. 상기 분광측정 및 방사성크로마토그래피 분석 이외에, 예를 들면, 반응 기질과 생성물의 HPLC 분리를 이용하는 대체 방법도 이용할 수 있다. 메발로네이트 키나제, 포스포메발로네이트 키나제 및 메발로네이트 디포스페이트 데카복실라제의 검출 하한치는 전형적으로 약 0.001 U/mg 단백질이다.
IPP 이소머라제 분석. 50 mM 트리스-HCl 완충액(pH 7.5) 중에서 조 추출물을 제조하였다. 분석은 스퍼전(Spurgeon) 등의 방법[Arch. Biochem. Biophys., 230:445-454, 1984]에 따라 수행하였다. 상기 분석은 IPP와 DMAPP의 산-불안정성의 차이를 기초로 한다. 반응 혼합물(최종 부피 0.1 ml)은 50mM 트리스-HCl 완충액(pH 7.5), 2mM 디티오트레이톨, 5mM MgCl2, 20μM [1-14C]-IPP 및 조 추출물을 함유하였다. 반응은 30 ℃에서 15 분간 수행하였으며 0.3 ml의 진한 HCl:메탄올(4:1) 혼합물을 가하고 37 ℃에서 20 분간 더 배양함으로써 종료하였다. 헥산(0.9 ml)을 가하고 튜브를 혼합하였다(볼텍스 혼합기를 사용하여 10 초간 4회). 원심분리(21,000xg, 5 분) 후에, 0.6 ml의 헥산층을 섬광 병으로 옮기고, 섬광 유체를 가하고 방사능을 계수하였다. 활성은 U/mg 단백질로 나타낸다. 1 유 니트의 활성은 산 불안정 생성물에 혼입된 1 p몰 [1-14C]-IPP/분이다. IPP 이소머라제 활성의 검출 하한치는 1 U/mg이었다.
FPP 신타제 분석. 50mM 트리스-HCl 완충액(pH 8.0) 중에서 조 추출물을 제조하였다. FPP 신타제 분석 절차는 IPP와 FPP의 산 불안정성의 차이를 기초로 하여 전술한 IPP 이소머라제 분석법과 유사하다[Spurgeon et al., Arch. Biochem.Biophys., 230:445-454, 1984]. 반응 혼합물(최종 부피 0.1 ml)은 50mM 트리스-HCl 완충액(pH 8.0), 2mM 디티오트레이톨, 5mM MgCl2, 20μM [1-14C]-IPP, 25μM GPP(제라닐 피로포스페이트) 및 조 추출물을 함유하였다. 반응은 30 ℃에서 15 분간 수행하였으며 0.3 ml의 진한 HCl:메탄올(4:1) 혼합물을 가하고 37 ℃에서 20 분간 더 배양함으로써 종료하였다. 헥산(0.9 ml)을 가하고 튜브를 혼합하였다(볼텍스 혼합기를 사용하여 10 초간 4회). 원심분리(21,000xg, 5 분) 후에, 0.6 ml의 헥산층을 섬광 병으로 옮기고, 섬광 유체를 가하고 방사능을 계수하였다. 효소 활성 단위 및 검출 하한치는 IPP 이소머라제에 대해 상기에서 정의한 바와 동일하였다. 높은 IPP 이소머라제 활성으로 인해 FPP 신타제 활성 측정이 방해를 받는 경우, 조 추출물을 5mM 요오도아세트아미드의 존재하에 5 분간 예비배양하여 IPP 이소머라제 활성을 억제할 수 있다.
GGPP 신타제 분석. 2 mM 디티오트레이톨을 함유하는 50 mM 트리스-HCl 완충액(pH 8.0) 중에서 조 추출물을 제조하였다. GGPP 신타제는 쿠즈구치(Kuzuguchi) 등의 절차[J. Biol. Chem., 274:5888-5894, 1999]에 따라 분석하였다. 이 분석은 FPP 신타제에 대해 전술한 바와 동일한 원리를 기초로 한다. 반응 혼합물(최종 부피 0.1 ml)은 50mM 트리스-HCl 완충액(pH 8.0), 2mM 디티오트레이톨, 5mM MgCl2, 20μM [1-14C]-IPP, 25μM FPP 및 조 추출물을 함유하였다. 모든 반응 조건 및 섬광 계수용 샘플의 후속 처리는 FPP 신타제에 대해 전술한 바와 동일하였다. IPP 이소머라제 활성을 억제하기 위해 추출물을 요오도아세트아미드로 처리하는 방법도 또한 상기에서와 같이 이용할 수 있다. 효소 활성 단위 및 검출 하한치는 IPP 이소머라제에 대해 상기에서 정의한 바와 동일하였다.
아세토아세틸-CoA 리덕타제 분석. 50mM KCl 및 5mM 디티오트레이톨을 함유하는 50mM 트리스-HCl 완충액(pH 7.5) 중에서 조 추출물을 제조하였다. 아세토아세틸-CoA 리덕타제는 조한과 코펠런드(Chohan and Copeland)의 절차[Appl. Environ. Microbiol., 64:2859-2863, 1998]에 따라 분석하였다. 상기 분석은 340 nm에서 NADPH의 아세토아세틸-CoA-의존성 산화를 분광측정법에 의해 측정한다. 반응 혼합물(1 ml)은 50mM 트리스-HCl 완충액(pH 8.5), 15mM MgCl2, 250μM NADPH 및 100μM 아세토아세틸-CoA를 함유하였다. 반응은 30 ℃에서 석영 큐벳에서 수행하며 아세토아세틸-CoA의 첨가에 의해 개시된다. 활성(U/mg 단백질로 표시)은 NADPH를 사용하여 제작한 표준 곡선을 이용하여 계산하였다(1 유니트의 활성 = 1 μ몰의 산화된 NADPH/분). 아세토아세틸-CoA 리덕타제 활성의 검출 하한치는 약 0.01 U/mg이었다.
실시예 2:
파라코커스
로서
플라보박테리움
속의 분류학적 재분류
본 실시예는 제아잔틴-생산 세균으로 이전에 지정된 플라보박테리움속 균주 R-1512(ATCC 21588)를 파라코커스속 균주 R-1512(ATCC 21588)로 분류학적으로 재분류하는 과정을 기술한다. 포괄적인 게놈 및 생화학적/생리학적 분석은 세균 분류를 위한 과학적 기준으로 현재 용인되어 있는 최첨단 기술의 방법을 이용하여, 벨지안 코오디네이티드 콜렉션즈 오브 마이크로오거니즘스/래보러토리움 부어 마이크로바이올로지, 유니버시타이트 젠트(Belgian Coordinated Collections of Microorganisms/Laboratorium voor Microbiologie, Universiteit Gent; BCCM(등록상표)/LMG)에 의해 수행하였다. 파라코커스속 균주 R-1512 이외에, 파라코커스 속에 속하는 여러 다른 세균들도 연구에 포함되었다(표 2에 요약되어 있음).
균주 R1534 및 R114는 고전적 돌연변이유발 및 개선된 제아잔틴 생산에 대한 선별에 의해 균주 R-1512로부터 유도된 돌연변이체이다. 1차 선별은 최고 색도 생성 콜로니를 선별함으로써 달성하였다. 2차 선별은 실시예 1에 따른 HPLC 방법에 의해 액체 배지에서 수행하였다.
균주 R-1506은 균주 R-1512를 제공한 주변 미생물의 동일한 초기 선별로부터 수득된 독립적인 단리물이다. 균주 MBIC3024, MBIC3966, MBIC4017 및 MBIC4020은 그의 16S rDNA 유전자의 뉴클레오타이드 서열(DNA 서열은 공공 EMBL 데이터베이스에 기탁되었다, 표 5 참조)에 의해 파라코커스 속의 일원으로 확인되었다. 파라코커스 마르쿠시(Paracoccus marcusii) DSM 11574T 및 파라코커스 카로티니파시엔스(Paracoccus carotinifaciences) E-396T는 카로티노이드-생산 세균의 최근 기재된 기준 균주이다[Harker et al., Int. J. Syst. Bacteriol., 48:543-548, 1998; Tsubokura et al., Int. J. Syst. Bacteriol., 49:277-282, 1999]. 파라코커스 솔벤티보란스(Paracoccus solventivorans) DSM 6637T는 파라코커스 속의 일원이지만 사용된 다른 세균과는 관련이 적은 "대조" 균주로서 포함되었다.
예비 실험 결과 다음의 결론을 얻었다. 본원에 나타낸 각각의 방법은 유기체들 간의 분류학적 연관성 또는 상대적 유사도를 정의하는 공지된 능력을 갖는다. 세균 분류군을 서술하는 방법 및 그 용도가 문헌 [Van Damme et al., Microbiological Review, 60:407-438, 1996; and Janssen et al., Microbiology, 142:1881-1893, 1996]에 기술되어 있으며 상세히 비교되어 있다.
(1) 균주 R1534 및 R114의 세포막의 지방산 분석 결과 두 균주는 매우 유사한 것으 로 나타났으며 이들 균주들이 파라코커스 데니트리피칸스(P. denitrificans) 및 로도박터 캡슐라터스(Rhodobacter capsulatus)에 분류학적으로 관련되는 것으로 나타났다.
(2) 세포 단백질의 1차원 겔 전기영동 결과 R1534와 R114간에 높은 유사성(즉, 종내(intraspecific) 수준의 연관성)을 나타내었으나, 프로필은 이들 균주가 로도박터 캡슐라터스 또는 파라코커스 데니트리피칸스로 지정됨을 입증하지는 못했다.
(3) 균주 R1534 및 로도박터 캡슐라터스 LMG2962T 및 파라코커스 데니트리피칸스 LMG4218T 사이의 DNA:DNA 하이브리드화에 의해 균주 R1534가 로도박터 캡슐라터스도 아니며 파라코커스 데니트리피칸스도 아닌 것으로 확인되었다.
(4) 균주 R1534 및 R114로부터 16S rDNA 유전자의 서열분석 결과 이들 유기체가 파라코커스 속에 속하지만 새로운 종을 나타내는 것으로 밝혀졌다. 가장 높은 서열 유사도는 파라코커스속 균주 MBIC3966, MBIC4020 및 MBIC3024의 16S rDNA 유전자에서 관찰되었다.
(5) 증폭 단편 길이 다형현상(Amplified Fragment Length Polymorphism, AFLP(등록상표))을 이용한 균주 R1534 및 R-1512의 DNA 지문법은 두 균주들로부터의 게놈 DNA의 높은 전체 유사성을 보여 종내 연관성을 나타내었다(즉, AFLP(등록상표)는 동일 종의 두 구성원 사이에서 구별될 수 있다).
하단에, 파라코커스속 균주 R-1512(및 그의 돌연변이 유도체 R1534 및 R114)에 대한 본 발명의 포괄적 분류학 연구의 결과 및 결론을 나타내었다.
16S rDNA 서열분석 및 계통발생적 연구. 표 2에 나타낸 세균은 LMG 배지 185(필요한 경우 1.5% 딥코 박토 아가(Difco Bacto agar)를 보충한 (TSA) BBL 11768)에서 성장시켰다. 게놈 DNA는 니만(Niemann) 등의 프로토콜[J. Appl. Microbiol., 82:477-484, 1997]에 따라 제조하였다. 16S rDNA를 암호화하는 유전자는 표 3에 나타낸 프라이머를 사용하여 중합효소 연쇄반응(PCR)에 의해 균주 R-1512, R1534, R114 및 R-1506으로부터 얻은 게놈 DNA로부터 증폭시켰다.
PCR-증폭 DNA는 키아퀵 PCR 정제 키트(Qiaquick PCR Purification Kit; 독일 힐덴 소재의 키아겐 게엠베하(Qiagen GmbH))를 사용하여 정제하였다. 완전한 서열분석은 "아비 프리즘(ABI PRISM, 등록상표) 빅 다이(Big Dye, 등록상표) 터미네이터 주기 서열분석 예비 반응 키트(Terminator Cycle Sequencing Ready Reaction Kit; 앰플리태크(AmpliTaq, 등록상표) DNA 폴리머라제, Fs 사용)를 사용하여 어플라이드 바이오시스템즈, 인코포레이티드(Applied Biosystems, Inc.) 377 DNA 서열분석기 및 제조업자(미국 캘리포니아주 포스터 시티 소재의 퍼킨-엘머, 어플라이드 바이오시스템즈 디비젼(Perkin-Elmer, Applied Biosystems Division))의 프로토콜을 이용하여 수행하였다. DNA 서열분석에 사용된 프라이머는 표 4에 나타내었다.
5개의 전진 프라이머와 3개의 역방향 프라이머를 사용하여 매우 믿을 수 있는 구성된 서열 데이터를 보장하는 서열들의 부분 겹침을 수득하였다. 서열 구성은 프로그램 오토어셈블러(AutoAssembler)(미국 캘리포니아주 포스터 시티 소재의 퍼킨-엘머, 어플라이드 바이오시스템즈 디비젼)를 이용하여 수행하였다. 계통발생적 분석은 국제 뉴클레오타이드 서열 라이브러리 EMBL로부터 수집한 소 리보솜 소단위 서열의 정렬에 공통 서열(균주 R-1512, R1534, R114 및 R-1506으로부터)을 혼입시킨 후 소프트웨어 패키지 진콤파르(GeneCompar, 등록상표)(v. 2.0, 어플라이드 매쓰(Applied Maths) B.V.B.A., 벨기에 코트릿크 소재)를 이용하여 수행하였다. 상기 정렬은 100%의 개방 간격 페널티 및 0%의 단위 간격 페널티를 이용하여 쌍으로 계산하였다. 유사성 매트릭스는 0%의 간격 페널티를 사용하여 미지의 기본값은 폐기한 후 상동성 계산에 의해 작성하였다. 작성된 수형도는 옆자리-결합 방법을 이용하여 구성하였다.
파라코커스속 균주 R-1512로부터의 16S rDNA 유전자의 뉴클레오타이드 서열은 서열번호: 12로 나타내었다. 균주 R-1512와 그의 가장 근접한 관련 균주간의, 16S rDNA 서열 유사성 퍼센트로 나타낸 차이 매트릭스를 표 5에 나타내었다. 균주 R-1512와 그의 돌연변이 유도체 R1534 및 R114로부터의 서열들은 동일하였다. R-1506의 서열은 R1534 및 R114의 서열과 하나의 뉴클레오타이드만이 상이하였다. 이로써 균주 R-1512와 R-1506이 계통발생적으로 매우 연관되며 동일 종에 속할 가능성이 있음(DNA:DNA 하이브리드화에 의해 확인, 하기 참조)이 입증되었다. R-1512 및 R-1506 서열과 EMBL 라이브러리에서 공적으로 입수가능한 서열들의 비교 결과 R-1512 및 R-1506은 파라코커스 속에 속하였다. 그러나, 현재 분류학적으로 타당하게 기재된 모든 파라코커스 종에서 관찰된 서열 유사성은, 일반적으로 종 수준에서 가능한 연관성에 대한 한계로 인정되는 값인 97% 미만이었다[Stackebrandt and Goebel, Int. J. Syst. Bacteriol., 44:846-849, 1994]. 이것은 균주 R-1512(및 그의 돌연변이 유도체) 및 R-1506이 하나 또는 두 개의 새로운 파라코커스 종에 속함을 입증하였다. 97%(종 수준에서 가능한 관계에 대해 의미있는 값)보다 높은 서열 유사성은 4개의 지칭되지 않은 파라코커스 균주와 균주 R-1512, R1534, R114 및 R-1506 간에서 관찰되어, 하나 이상의 지칭되지 않은(MBIC) 균주들이 종 수준에 서 균주 R-1512 및 R-1506과 관련될 수 있음을 시사하였다. 집단 분석(파라코커스속 균주 R-1512, R1534, R114, R-1506, MBIC3966과, 파라코커스 속의 다른 구성원들 간의 계통발생적 연관성을 나타내는 계통발생 수형도)을 근거로, 균주 R-1512, R1534, R114, R-1506 및 4개의 지칭되지 않은 파라코커스 균주(MBIC3024, MBIC3966, MBIC4017 및 MBIC4020)를 종 연관성을 분석하기 위한 DNA:DNA 하이브리드화 실험을 위해 선택하였다.
DNA:DNA 하이브리드화 및 G+C 함량 측정. 표 5에 나타낸 세균을 LMG 배지 185에서 성장시켰다. 게놈 DNA는 윌슨(Wilson)의 프로토콜[In Ausabel et al.(eds.), Current Protocols in Molecular Biology, Greene Publishing and Wiley Interscience, New York, 2.4.1-2.4.5, 1987]에 따라 제조하였다. DNA의 G+C 함량은 로간(Logan) 등[Int. J. Syst. Evol. Microbiol., 50:1741-1753, 2000]에 의해 수정된 메스바흐(Mesbach) 등의 방법[Int. J. Syst. Bacteriol., 39:159-167, 1989]에 따라 HPLC로 측정하였다. 기록된 값은 동일한 DNA 샘플에 대한 상기 측정치들의 평균이다. DNA:DNA 하이브리드화는 드 레이(De Ley) 등이 기술한 바와 같은 초기 복원율 방법[Eur. J. Biochem., 12:133-142, 1970]을 이용하여 수행하였다. 하이브리드화 온도는 81.5 ℃이었다. 상기 방법에 대해, 보테린(Vauterin) 등에 의해 +/-5.8%의 평균 편차가 보고된 바 있다[Int. J. Syst. Bacteriol., 45:472-489, 1995]. 세균 DNA의 G+C 함량 및 DNA 하이브리드화 실험의 결과는 표 6에 요약하였다.
균주 R-1512, R1534, R114, R-1506 및 MBIC3966은 70%(종 서술에 일반적으로 허용되는 한계[Wayne et al., Int. J. Syst. Bacteriol., 37:463-464, 1987])보다 높은 DNA 상동성을 나타내었으므로, 파라코커스 속 내의 동일한 종에 속한다. 상 기 다섯 균주들의 G+C 함량은 66.9 내지 67.7%로 달라졌으므로, 명확히 정의된 종에 대한 특성인 1% 이내에 속한다. 다른 한편으로, 균주 MBIC3024, MBIC4017 및 MBIC4020과 균주 R-1512, R1534, R114, R-1506 및 MBIC3966 간의 낮은 DNA 상동성은 MBIC3024, MBIC4017 및 MBIC4020이 각각 파라코커스 속과 상이한 게놈 종에 속함을 나타내었다.
AFLP를 이용한 DNA 지문법. AFLP(등록상표)는 제한효소 단편의 선택적 증폭 및 선택적 가시화를 통한 전체 게놈 DNA 지문법에 대한 PCR을 기본으로 하는 기술이다[Vos et al., Nucleic Acids Research, 23:4407-4414, 1995; Janssen et al., Microbiology, 142:1881-1893, 1996]. 상기 분석에서는, 파라코커스속 균주 R-1512, R1534, R114, R-1506, MBIC3966 및 파라코커스 마르쿠시 DSM 11574T를 종내 연관성을 평가하기 위해 비교하였다. 이들 세균은 LMG 배지 185에서 성장시켰다. 이들 세균 각각으로부터 취한 게놈 DNA는 윌슨의 프로토콜에 따라 제조하였다(윌슨의 상기 문헌 참조). 정제된 DNA를 두 개의 제한 효소, 4-염기 절단효소 및 6-염기 절단효소로 절단하였다. 이렇게, 2개의 상이한 말단을 가지며 효과적인 PCR에 적합한 크기를 갖는 한정된 수의 단편들이 수득되었다. 하나의 양립가능한 말단을 함유하는 어댑터(15 내지 20 염기쌍의 소(小) 이중-가닥 DNA 분자)를 제한효소 단편의 적절한 "점착성" 말단에 접합시켰다. 두 어댑터 모두 제한효소 반자리(halfsite)-특이적이며 상이한 서열을 갖는다. 이들 어댑터는 PCR 프라이머에 대해 결합 부위로 작용한다. 이때, 사용된 제한 효소는 ApaI(6염기절단효소(hexacutter), 인지 서열 GGGCC/C) 및 TaqI(4염기절단효소(tetracutter), 인지 서열 T/GCA)이었다. 제한 효소에 의한 절단에 의해 생성된 점착성 말단에 접합된 어댑터의 서열은 표 7에 나타내었다(서열번호: 13 내지 22). 제한효소 단편의 선택적 증폭에 PCR을 사용하였다. PCR 프라이머는 제한효소 단편의 어댑터 말단과 특이적으로 어닐링된다. 프라이머는 제한효소 부위를 지나 단편으로 연장되는 소위 "선택성 염기" 하나를 그 3' 말단에 포함하기 때문에, 제한효소 부위에 인접한 적절한 상보성 서열을 갖는 제한효소 단편들만을 증폭시켰다. 사용된 6개의 PCR 프라이머 조합의 서열도 또한 표 7에 나타내었다.
증폭 후에, PCR 산물을 DNA 서열분석기(ABI 377)를 사용하여 고분해 폴리아크릴아미드 겔 상에서 그 길이에 따라 분리하였다. 6-염기쌍 절단효소에 의해 형 성된 제한효소 반자리에 특이적인 어댑터를 함유하는 단편들을, 상응하는 프라이머를 32P로 표지한 5'-말단에 기인한 자동방사선사진법으로 가시화하였다. 전기영동 패턴은 겔콤파르(GelCompar, 등록상표) 4.2 소프트웨어(벨기에 코트릿크 소재의 어플라이드 매쓰, B.V.B.A.)를 사용하여 스캐닝하고 수적으로 분석하고, 피어슨(Pearson) 곡선 정합 계수를 이용하여 집단화하였으며, 비가중된 쌍 그룹은 연결을 평균한 것이다(집단화 방법은 스니쓰(Sneath) 및 소칼(Sokal)이 문헌 [Numerical Txsonomy, Freeman & Son, San Francisco, 1973]에서 고찰하였다).
모든 6개의 프라이머 조합(PC A-H, 표 7)에서, 파라코커스속 균주 R-1512, R1534 및 R114의 DNA 지문은 동일하지 않은 경우 매우 유사하였다. 미세한 차이가 관찰된 경우, 재현성은 평가하지 않았다. 균주 R1534 및 R114가 균주 R-1512에서 유도되었기 때문에 세 균주들 간에 높은 유사성 또는 동일성이 예상되었다. 모든 프라이머 조합에 있어, 균주 R-1512, R1534 및 R114는 똑같이 새로운 파라코커스 종에 속하는 두 균주 R-1506 및 MBIC3966과 명백히 구별되었다. 그러나, 지문은 균주 R-1512, R1534 및 R114가 R-1506 또는 MBIC3966과 더 관련됨을 명백히 보여주지는 못한다. 사용된 조건하에서, 새로운 종의 5개 균주가 약 58% 유사성(이 값은 6회의 AFLP(등록상표) 실험(6개의 프라이머 조합)에서 새로운 종들의 분기점의 6개 값의 평균이다)의 평균 수준에 밀집되고, 상기 집단은 계통발생적으로 관련된 카로티노이드-생성 파라코커스 종의 기준 균주인 파라코커스 마르쿠시 DSM 11574T의 프로필과 명백히 차별될 수 있다. 파라코커스 마르쿠시 DSM 11574T의 6개 분기점들과 새로운 종들의 평균 유사성 값은 약 11%이었다.
지방산 분석. 파라코커스속 균주 R-1512, R1534, R114, R-1506, MBIC3966의 세포막의 지방산 조성을 기준 균주 파라코커스 마르쿠시 DSM 11574T, 파라코커스 카로티니파시엔스 E-396T 및 파라코커스 솔벤티보란스 DSM 6637T와 비교하였다. 세균은 28 ℃에서 LMG 배지 185중에서 24 시간동안 성장시켰다. 지방산 조성은 상업적 시스템 MIDI(미국 델라웨어주, 마이크로바이알 아이덴티피케이션 시스템, 인코포레이티드(Microbial Identification System, Inc.))를 이용하여 기체 크로마토그래피로 측정하였다. 지방산의 추출 및 분석은 MIDI 시스템의 지시에 따라 수행하였다. 표 8은 시험한 모든 균주에 대한 결과를 요약한 것이다. 새로운 파라코커스 종의 다섯 균주(R-1512, R1534, R114, R-1506, MBIC3966)에 대해, 평균 프로필을 산출하였다. 8개 유기체는 모두 주 화합물로서 18:1w7c를 가지면서, 세포막의 필적할만한 지방산 조성을 나타내었다. 새로운 파라코커스 종과 세가지 기준 균주 사이에 지방산 조성에 있어 미세한 차이만이 관찰되었다.
성장을 위한 탄소 공급원의 이용. 탄소 공급원의 호기성 이용을 시험하기 위해, 95개의 기질을 함유하는 바이오로그(BIOLOG)-SF-N 마이크로플레이트(Microplate) 마이크로 플레이트(미국 캘리포니아주 헤이워드 소재의 바이오로그 인코포레이티드(Biolog Inc.))를 사용하였으나, 단 웰 E6의 기질은 D,L-락트산의 통상적인 나트륨염 대신 D,L-락트산 메틸 에스테르였다. 표 9에 동정된 균주들 각각의 세포는 28 ℃에서 LMG 배지 12(마린 아가(Marine Agar), 딥 코 0979)에서 24 시간동안 성장시켰다. 0.5 맥파랜드(McFarland) 유니트에 해당하는 밀도를 갖는 세포 현탁액을 멸균 증류수에 제조하였다. 상기 현탁액으로부터 18 방울을 21 ml의 AUX 배지(API 20NE, 프랑스 소재의 바이오메리위(bioMerieux))로 옮기고 부드럽게 혼합하였다. 0.1 ml의 현탁액을 바이오로그 마이크로플레이트의 각 웰로 옮기고, 플레이트를 30 ℃에서 배양하였다. 48 시간후 및 6 일후에 성장을 육안으로 검사하였다. 또한, 6 일째에 바이오로그 플레이트 판독기를 사용하여 마이크로 플레이트를 판독함으로써 시각적 스코어를 확인하였다.
바이오로그 분석의 결과는 표 9에 나타내었다. 성장(양성 반응)은 기질이 없는 기준 웰에 비해 증가된 혼탁도로서 측정하였다. 양호한 성장(+), 약한 성장(±) 및 성장 없음(-) 간에 구분을 하였다. 괄호 안의 결과는 48 시간후에 수득한 결과와 상이한 경우 6 일 후에 얻은 결과이다. 물음표는 6 일째의 명확하지 않은 결과를 나타낸 것이다. 새로운 파라코커스 종(R-1512, R1534, R114, R-1506 및 MBIC3966)을 이루는 다섯 개 균주 모두에 의한 성장에, 시험한 95가지 탄소 공급원 중에서 12가지는 사용될 수 있고, 47가지는 사용될 수 없었다. 새로운 파라코커스 종은 7가지 탄소 공급원(아도니톨, i-에리트리톨, 젠티오바이어스, β-메틸글루코사이드, D-솔비톨, 자일리톨 및 퀸산)을 사용할 수 없는 그 특성에 의해, 2개의 다른 카로티노이드-생성 세균(파라코커스 마르쿠시 DSM 11574T 및 파라코커스 카로티니파시엔스 E-396T)과 구분될 수 있다. 새로운 파라코커스 종의 5가지 구성원 모두에 의해 이용된 2개의 탄소 공급원(L-아스파라긴 및 L-아스파트산)은 파라 코커스 마르쿠시 DSM 11574T에 의한 성장에는 사용되지 않았다.
생화학 시험. 선택된 생화학적 특징들을 API 20NE 스트립(프랑스, 바이오메리위)을 사용하여 시험하였다. 표 10에 동정되어 있는 세균 균주들 각각의 세포를 28 ℃에서 LMG 배지 12 상에서 24 시간동안 성장시켰다. 세포 현탁액을 제조하고 제조업자의 지시에 따라 스트립을 접종하였다. 스트립을 28 ℃에서 배양하고 결과는 24 시간 및 48 시간후에 측정하였다. 결과는 표 10에 요약되어 있다. 시험한 9가지 특징들 중에서, 한가지(우레아제 활성)만이 새로운 파라코커스 종의 5개 균주들간에 가변적 반응을 제공하였다. 상기 9가지 시험은 새로운 파라코커스 종들과 파라코커스 마르쿠시 DSM 11574T 및 파라코커스 카로티니파시엔스 E-396T
사이에서 차별되지 않았다.
생리학적 시험. 파라코커스 마르쿠시 DSM 11574T, 파라코커스 카로티니파시엔스 E-396T 및 파라코커스 솔벤티보란스 DSM 6637T와 함께, 새로운 파라코커스
종 의 다섯 균주들에 대해 여러 생리학적 및 형태학적 시험을 수행하였다. 각 시험에 이용된 방법들은 다음과 같았다.
성장을 위한 온도 범위. 세포는 28 ℃에서 LMG 배지 12에서 24 시간동안 성장시켰다. 1 내지 2 맥파랜드 유니트의 밀도를 갖는 세포 현탁액을 멸균 증류수로 제조하였다. 상기 현탁액으로부터, 3 방울을 LMG 배지 12의 아가 표면위로 옮겼다. 한 방울을 도말하여 희석하고, 나머지 두 방울은 휘젓지 않고 방치하였다. 플레이트를 10 ℃, 25 ℃, 30 ℃, 33 ℃, 37 ℃ 및 40 ℃에서 호기성 조건하에 배양하고, 24 시간, 48 시간 및 5 일 후에 성장을 조사하였다. 성장은 30 ℃에서의 성장(즉, "대조군")에 대해 시각적 성장(방울들에서의 융합성, 및 희석된 접종원의 도말선에서의 콜로니로서)으로 측정하였다. 스코어는 (대조 플레이트에 대해) 다음과 같이 매겼다; 우수한 성장(++), 양호한(대조군과 동등한) 성장(+), 약한 성장(±), 불량한 성장(+--), 및 성장 없음(-). 괄호안의 결과는 휘젓지 않은 방울들에서의 융합성 성장과 상이한 경우 도말선에서 관찰된 결과들이다.
내염성(salt tolerance). 세포를 28 ℃에서 LMG 배지 12에서 24 시간동안 성장시켰다. 1 내지 2 맥파랜드 유니트의 밀도를 갖는 세포 현탁액을 멸균 증류수로 제조하였다. 상기 현탁액으로부터, 3 방울을 3%, 6% 및 8%의 최종 농도에 이르도록 NaCl을 보충한 LMG 배지 12의 아가 표면위로 옮겼다. 한 방울은 도말하여 희석하고, 나머지 두 방울은 휘젓지 않고 방치하였다. 플레이트를 28 ℃에서 호기성 조건하에 배양하고, 24 시간, 48 시간 및 5 일 후에 성장을 조사하였다. 성장은 NaCl을 첨가하지 않은 성장(대조군)에 대해 시각적 성장(방울들에서의 융합성, 및 희석된 접종원의 도말선에서의 콜로니로서)으로 측정하였다. 스코어는 (대조 플레이트에 대해) 다음과 같이 매겼다; 우수한 성장(++), 양호한(대조군과 동등한) 성장(+), 약한 성장(±), 불량한 성장(+--), 및 성장 없음(-). 괄호안의 결과는 휘젓지 않은 방울들에서의 융합성 성장과 상이한 경우 도말선에서 관찰된 결과들이다.
성장을 위한 pH 범위. 세포를 28 ℃에서 LMG 배지 12에서 24 시간동안 성장시켰다. 1 내지 2 맥파랜드 유니트의 밀도를 갖는 세포 현탁액을 멸균 증류수로 제조하였다. 상기 현탁액으로부터, 3 방울을 가압멸균(autoclaving) 후 pH 6.1, pH 6.3, pH 7.0, pH 7.7, pH 8.1 및 pH 9.1의 최종 pH를 제공하도록 조절된 pH를 갖는 10 ml의 액체 LMG 배지 12를 함유하는 튜브로 옮겼다. 배양액을 28 ℃에서 호기적으로(진탕하에) 배양하였다. 24 시간, 48 시간, 3 일 및 6 일째에 성장을 조사하였다. 성장은 pH 7.0에서의 성장(대조군)에 대해 증가된 혼탁도(바이오로그 탁도계를 사용하여 투과율(%)로 측정)로 측정하였다. 스코어는 (대조군에 대해) 다음과 같이 매겼다; 우수한 성장(++), 양호한(대조군과 동등한) 성장(+), 약한 성장(±), 불량한 성장(+--), 및 성장 없음(-).
전분 가수분해. 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 한번의 도말로서 0.2% 가용성 전분을 보충한 LMG 배지 12의 아가 표면위로 옮겼다. 이어서, 플레이트를 28 ℃에서 호기성 조건하에 배양하였다. 균주들이 양호한 성장을 나타내면(48 시간후), 플레이트 를 루골(lugol) 용액(증류수 중 0.5% I2 및 1% KI)으로 넘쳐흐르게 했다. 가수분해는 성장에 따른 투명 대역(전분이 가수분해되지 않은 아가의 청색에 대비하여)으로 측정하였다.
탈질소반응. 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 1% KNO3를 보충한 반고체(0.1% 아가) LMG 배지 12를 함유하는 튜브내로 천자배양(stab)하였다. 플레이트를 28 ℃에서 5 일간 배양하였다. 탈질소반응(니트레이트로부터 N2)은 천자배양에 따른 기체 발생으로 측정하였다.
전자 수용체를 첨가하지 않고 혐기성조건에서의 성장. 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 LMG 배지 12의 아가 표면위에 도말하였다. 아가 플레이트를 30 ℃에서 혐기성 조건(약 10% CO2 + 약 90% N2)하에 배양하였다. 플레이트는 24 시간 및 5 일 후에 성장을 조사하였다. 성장은 호기성(대조군) 조건에 대해 육안으로 측정하였다. 스코어는 (대조군에 대해) 다음과 같이 매겼다; 우수한 성장(++), 양호한(대조군과 동등한) 성장(+), 약한 성장(±), 불량한 성장(+--), 및 성장 없음(-).
글루코스를 첨가하여 혐기성 조건하에서의 성장(발효). 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 휴와 레이프슨(Hugh and Leifson)[J. Bacteriol., 66:24-26, 1953]의 기본 아가 배지를 함유하는 튜브내에 천자배양하였다. 배지 상부에 파라핀 오일을 첨가하고, 튜브를 30 ℃에서 배양하였다. 튜브는 48 시간 및 5 일 후에 성장 및 산 생성에 대해 조사하였다. 성장은 육안으로 측정하였다. 스코어는 다음과 같이 매겼다; 양호한 성장(+), 불량한 성장(+--), 및 성장 없음(-).
전자 수용체로서 KNO3를 첨가한 혐기성 조건에서의 성장. 세포를 28 ℃에서 LMG 배지 12 플레이트 상에서 24 시간동안 성장시켰다. 플레이트에서 세포를 취하여 0.1% KNO3를 보충한 LMG 배지 12의 아가 표면위에 도말하였다. 플레이트를 30 ℃에서 혐기성 조건(약 10% CO2 + 약 90% N2)하에 배양하고, 3 일 후에 성장을 조사하였다. 성장은 호기성(대조군) 조건에 대해 시각적 성장으로 측정하였다. 스코어는 (대조군에 대해) 다음과 같이 매겼다; 우수한 성장(++), 양호한(대조군과 동등한) 성장(+), 약한 성장(±), 불량한 성장(+--), 및 성장 없음(-).
카탈라제 및 옥시다제 반응. 세포를 28 ℃에서 LMG 배지 12 플레이트상에서 24 시간동안 성장시켰다. 카탈라제 활성에 대한 양성 결과는 콜로니를 1 방울의 10% H2O2에 현탁시킨 후 기포의 생성이었다. 옥시다제 활성에 대한 양성 결과는 콜로니를 1% 테트라메틸파라페닐렌에 침지시킨 여과지 상에 문지른 후 자주-적색의 발색이었다.
콜로니 착색. 세포를 28 ℃에서 LMG 배지 12 상에서 24 시간동안 성장시켰다. 세포 현탁액은 멸균 식염수로 제조하였다. 세포 형태학 및 운동성은 위상차 광학렌즈(1000x 배율)가 장착된 올림퍼스(Olympus) 광학 현미경을 사용하여 현미경으로 관찰하였다.
생리학적 및 형태학적 시험들의 결과는 표 11에 요약되어 있다. 새로운 파라코커스 종의 다섯 균주는 수행된 모든 생리학적 및 형태학적 시험들에서 본질적으로 동일하게 반응하였다. 새로운 파라코커스 종의 다섯 균주 모두에 대해 동일한 반응을 야기하고, 파라코커스 마르쿠시 DSM 11574T 및/또는 파라코커스 카로티니파시엔스 E-396T과 상기 유기체들을 구별짓는 시험은 40 ℃에서의 성장, 8% NaCl하에서의 성장, pH 9.1에서의 성장 및 콜로니 착색이었다.
균주 R-1512, R1534, R114 및 R-1506에서의 제아잔틴 생성. 균주 R-1512, R1534, R114 및 R-1506을, (증류수 1 리터당) 5 g 글루코스, 10 g 효모 추출물, 10 g 트립톤, 30 g NaCl 및 5 g MgSO4·7H2O를 함유하는 ME 배지에서 성장시켰다. 배지의 pH는 가압멸균으로 살균하기 전에 5N NaOH를 사용하여 7.2로 조정하였다. 모든 배양액(플라스틱 뚜껑이 달린 250-ml 배플 엘렌메이어(Erlenmeyer) 플라스크 중에 25 ml의 부피)을 200 rpm으로 진탕시키면서 28 ℃에서 성장시켰다. 종균 배양액은 냉동 글리세롤화 원종으로부터 접종시키고 밤새 성장시켰다. 분취량을 실험용 플라스크로 옮겨 0.16의 660 nm에서의 초기 흡광도(OD660)를 달성하였다. 이어서, 배양액을 28 ℃에서 200 rpm으로 진탕하면서 성장시켰다. 배양 전체에 걸쳐 성장을 조사하고, 6, 10(또는 R114 균주의 경우 15) 및 24 시간째에 실시예 1에 기술한 방법으로 카로티노이드를 분석하기 위해 배양액 분취량을 취하였다.
상기 조건하에서 균주 R-1512, R1534 및 R-1506의 배가 시간은 각각 0.85 시 간, 1.15 시간 및 1.05 시간이었다. 균주 R114는 재현가능하게 2-상 성장 프로필을 나타내었으며; 초기 상에서 균주 R114의 배가 시간은 1.4 시간이었던 반면, 두 번째 상에서의 배가 시간은 3.2 시간이었다.
표 12는 ME 배지에서의 파라코커스속 균주들에 의한 제아잔틴 생성 및 비생성율(Specific Formation)(OD660으로 표준화된 제아잔틴 생산율)을 나타낸 것이다. 데이터는 4가지의 독립적 실험들의 평균이며, 각각의 실험내에서 각각의 균주는 한 쌍의 플라스크에서 시험하였다. 모 균주 R-1512에 비해 고전적으로 유도된 돌연변이 균주 R1534 및 R114에서 향상된 제아잔틴 생산을 명백히 볼 수 있다. 균주 R-1506에 의한 제아잔틴 생산은 대략 균주 R-1512와 동일하였다. 어떤 배양액에서도 다른 카로티노이드는 검출되지 않았다.
실시예 3: 제아잔틴-생산
파라코커스
속 균주 R114에서 메발로네이트 경로를 통한 IPP 생합성
파라코커스속 균주 R114에서의 이소프레노이드 전구체의 생합성 유래(즉, 메발로네이트 또는 DXP 경로)를 결정하기 위해, "역생합성(retrobiosynthesis)" 접근방법[Eisenreich and Bacher, In: Setlow(ed.), Genetic Engineering, Principles and Methods, Kluwer Academic/Plenum Publishers, New York, 22:121-153, 2000]을 택하였다. 데이터 분석을 위한 상기 예측 접근방법에 의해 단일 하위 천연 생성물의 분석으로부터 글루코스 분해대사의 명확한 평가가 가능하다. 본 연구에서, 상기 방법은 표지되지 않은 글루코스 및 특정 13C-표지된 글루코스의 다양한 이성분 혼합물을 함유하는 배지에서의 세균의 성장에 이어, 생산된 제아잔틴의 정제 및 NMR 분광법에 의해 표지 패턴의 분석을 포함한다. 사용된 방법의 세부 사항 및 실험 결과는 하기에 나타내었다.
13 C 표지 실험을 위한 파라코커스 속 균주 R114의 성장. 표지되지 않은 D-글루코스 모노하이드레이트는 플루카(Fluka, 미국 위스콘신주 밀워키 소재)에서 구입하였다. [U-13C6]-D-글루코스는 아이소텍(Isotec, 미국 오하이오주 마이애미스버그 소재)에서 구입한 반면, [1-13C1]-D-글루코스, [2-13C1]-D-글루코스 및 [6-13C1] D-글루코스는 캠브리지 아이소토프 래버러토리즈(Cambridge Isotope Laboratories, 미국 매사추세츠주 앤도버 소재)에서 구입하였다. 효모 추출물 및 펩톤(카제인으로부터, 췌액에 의해 소화된 상태)은 이엠 사이언스(EM Science, 미국 뉴저지주 깁스타운 소재)에서 구입하였다. 다른 염 및 용매들은 모두 분석용 등급이었으며 표준 화학물질 공급처로부터 구입하였다.
모든 배양은 냉동 세포 현탁액(12 OD660 단위의 세포 밀도, 25% 글리세롤, -70 ℃에서 저장)으로부터 개시하였다. 1 ml의 해동된 세포 현탁액을 사용하여 하기 조성을 갖는 362F/2 배지 100 ml를 함유하는 예비배양액(500-ml 배플 진탕 플라스크)을 접종하였다: 30 g/l D-글루코스, 10 g/l 효모 추출물, 10 g/l 펩톤, 5 g/l NaCl, 2.5 g/l MgSO4·7H2O, 0.75 g/l (NH4)2HPO4, 0.625 g/l K2HPO4, 187.5 mg/l CaCl2·2H2O, 0.2 g/l (NH4)2Fe(SO4)2·6H
2O, 15 mg/l ZnSO4·7H2O, 12.5 mg/l FeCl3·6H2O, 5 mg/l MnSO4·H2O, 0.5 mg/l NiSO4·6H
2O, 15 mg/l Na-EDTA 및 9.375 μl/l HCl(37% 원액). 배지의 초기 pH는 7.2이었다.
예비배양액을 28 ℃에서 200 rpm으로 진탕하면서 24 시간동안 배양한 후, OD660은 약 22 흡광도 단위였다. 주 배양액은 하기 조성을 갖는 362F/2 배지를 함유하는 바이오플로(Bioflo) 3000 생물반응기(뉴 브런스윅 사이언티픽(New Brunswick Scientific), 미국 뉴저지주 에디슨 소재)에서 성장시켰다: 30 g/l의 총 D-글루코스(13C-표지 글루코스:비표지 글루코스의 비에 대해서는 하기를 참조하시오), 20 g/l 효모 추출물, 10 g/l 펩톤, 10 g/l NaCl, 5 g/l MgSO4·7H2O, 1.5 g/l (NH4)2HPO4, 1.25 g/l K2HPO4, 0.4 g/l (NH4
)2Fe(SO4)2·6H2O, 375 mg/l CaCl2·2H2
O, 30 mg/l ZnSO4·7H2O, 25 mg/l FeCl3·6H2O, 10 mg/l MnSO4
·H2O, 1 mg/l NiSO4·6H2O, 30 mg/l Na-EDTA 및 18.75 μl/l HCl(37% 원액). 별도의 네가지 실험에서 사용된 각각의 13C-표지된 글루코스의 양(배지중 총 30 g/l 글루코스의 퍼센트로 나타냄)은 다음과 같았다: 조건 1, 4% [U-13C6] D-글루코스; 조건 2, 50% [1-13
C1] D-글루코스; 조건 3, 25% [2-13C1] D-글루코스 + 1% [U-13C6] D-글루코스; 조건 4, 25% [6-13C1] D-글루코스 + 1% [U-13C6] D-글루코스. 표지되지 않은 글루코스만을 포함하는 대조군도 또한 포함되었다. 조건 1 및 2 (및 표지되지 않은 대조군)의 경우, 배양 부피는 2 l인 반면, 조건 3 및 4에 대한 배양 부피는 1 l이었다. 생물배양기에 예비-배양액(20 ml/l 초기 부피)을 접종하고 22 내지 24 시간동안 배양을 진행했으며, 이동안 배지중에는 글루코스가 남지 않았다. 배양 조건은 다음과 같았다: 28 ℃, pH 7.2(25% H3PO4 및 28% NH4OH로 조절), 최소 40%로 조절된(교반하에 다단계로) 용존 산소, 각각 300 rpm(최소) 및 1 vvm의 교반속도 및 통기속도.
제아잔틴의 정제. 배양 말기에, 배양액을 15 ℃로 냉각하였다. 배양액 1 리터당 500 ml의 무수 에탄올을 가하고 100 rpm으로 20 분간 계속 교반하였다. 처리된 배양액을 5000xg에서 20 분간 원심분리하고 상등액을 폐기하였다. 이어서, 습윤 펠릿을 교반하면서 5 부피의 THF로 20 분간 추출하였다. 추출한 혼합물을 원심분리하고, 상등액을 저장하고, 생성된 펠릿을 동일한 조건하에서 1 부피의 THF로 두 번째 추출을 하고 다시 원심분리하였다. 상등액(추출물)을 합하고 회전 증발에 의해 50 ml로 농축하였다. 5 ml의 헥산을 농축된 THF 용액에 가하였다. 혼합한 후, 시스템은 유화액을 형성하였으며, 상기 유화액은 원심분리로 분리할 수 있었다. 수성상을 회수하고 동 부피의 포화 NaCl 용액으로 희석하고 디클로로메탄으로 재-추출하였다. 디클로로메탄 상을 회수하여 THF/헥산 상과 합하였다. 유기 추출물의 혼합물을 회전 증발기에서 다시 농축하여 디클로로메탄을 제거하였다. 이어서, 용액을 실리카겔 컬럼에 적용하고 n-헥산 및 에테르의 혼합물(1:1)로 용출시켰 다. 먼저 용출된 소량의 연황색 띠는 폐기하였다. 제아잔틴 주 생성물은 컬럼에서 서서히 이동하는 광범위한 띠로 용출되었다. 상기 주 생성물 띠를 완전히 용출시키기 위해 약 2 리터의 용매가 필요하였다. 용출액을 환저 플라스크에 수거하고 용매를 40 ℃에서 회전 증발로 제거하였다. 잔사를 40 ℃에서 소량의 디클로로메탄에 용해시킨 다음 용액을 서서히 냉각하였다. 혼탁도가 관찰될 때까지 헥산을 혼합물에 적가하였다. 결정화는 4 ℃에서 48 시간내에 완료되었다. 결정을 종이 필터 상에 회수하고 차가운 메탄올로 세척하고 진공하에 건조시켰다.
NMR 연구. 제아잔틴은 NMR 분광법으로 분석하였다. 참조로, 제아잔틴의 화학 구조는 하기 화학식으로 예시된다:
1H-NMR 및 13C-NMR 스펙트럼은 브루커(Bruker) DRX 500 분광계를 사용하여 각각 500.13 MHz 및 125.6 MHz에서 기록하였다. 1차원 실험 및 2차원 이네이드퀘이트(INADEQUATE) 실험을 위한 수집 및 공정 파라미터는 표준 브루커 소프트웨어(XWINNMR)에 따랐다. 용매는 중수소화 클로로포름이었다. 화학적 이동은 용매 신호를 참조로 하였다.
천연 13C 존재비에서 동위원소 표지된 제아잔틴 샘플 및 제아잔틴 샘플의 13C NMR 스펙트럼을 동일한 실험 조건하에서 기록하였다. 적분치는 모든 13C NMR 신호 에 대해 측정하였으며, 표지된 화합물에서 각각의 탄소 원자에 대한 신호 적분은 천연의 풍부한 물질의 상기 적분을 참조로 하여 표지된 분자 종에서 각 위치에 대한 상대적 13C 존재비를 수득하였다. 이어서, 상대 존재비를, 1.71 ppm에서 H-18의 1H NMR 신호 중 13C 커플링 부수신호로부터 절대 존재비로 전환시켰다. 다중-표지된 제아잔틴 샘플의 13C NMR 스펙트럼에서, 각각의 부수신호를 별도로 적분하였다. 그 다음, 각각의 부수신호 쌍의 적분은 주어진 탄소원자의 전체 신호 적분을 참조로 하였다. 제아잔틴은 총 8개의 이소프레노이드 잔기(2개의 DMAPP 단위 및 6개의 IPP 단위)를 포함하며; 화학적 이동 퇴행으로 인해 20개의 13C NMR 신호만이 관찰되었다.
[U-13C6] 글루코스와 비표지 글루코스의 혼합물(1:7.5, w/w)을 이용한 실험에서는, 제아잔틴의 모든 탄소원자를 표지하고 13C13C 커플링에 기인하는 부수신호를 나타내었다(표 13). 4개 탄소원자의 신호는 13C13C 커플링에 기인하는 강한 부수신호를 갖는다(주어진 원자의 포괄적인 NMR 신호 강도에서 61.2 ± 0.6%, 표 13). 메틸 원자 C-17/C-17'에 기인한 신호는 6%의 상대 강도에서 약한 13C-커플링된 부수신호 만을 나타내었다. 중심 신호는 비표지 글루코스로부터 유도된 물질을 나타낸다. 신호에서는 장거리 커플링에 대한 증거를 볼 수 없었다. 탄소 연결성은 13C13C 커플링 상수(표 13) 및 2차원 이네이드퀘이트 실험으로부터 용이하게 얻을 수 있었다.
3개의 탄소원자가 [6-13C1] 글루코스로부터 표지를 차지하였다. 나머지 두 개 탄소는 [2-13C1] 글루코스로부터 표지화되었다. [1-13C1] 글루코스에 의해서는 제아잔틴에 별로 많은 양의 표지가 이루어지지 않았다.
모든 비-등시성 탄소원자에 대한 13C 존재비는 비표지 제아잔틴의 스펙트럼과 비교하고 1H NMR 스펙트럼에서의 1H13C 커플링 부수신호를 평가하여 측정하였다(표 13). [U-13C6] 글루코스를 이용한 실험에서 공동으로 전달된 탄소원자 쌍의 분획은 커플링 부수신호를 적분하여 측정하였다.
IPP 구성 블록의 표지 패턴은 재구성된 IPP 전구체에 대해 밝혀진 표준 편차에 의해 나타낸 바와 같이 정확하게 재구성될 수 있다. DMAPP 및 IPP의 재구성된 표지 패턴은 실험 한계 내에서 동일하였다.
상기에서 측정한 실험상의 표지 패턴은 이소프레노이드 생합성에 대한 메발로네이트 경로 대 DXP 경로 뿐 아니라 글루코스 대사의 상이한 경로도 고려하여, 다양한 예상치들과 비교할 수 있다. 진성세균은 전형적으로 당분해 경로 또는 엔트너-다우도로프(Entner-Doudoroff) 경로를 통해 주로 글루코스를 사용한다. 당분 해는 글루코스로부터 두 개의 트리오스 포스페이트 분자를 생성한다. 글루코스 C-1 및 C-6은 둘 다 당분해중에 생성된 트리오스 포스페이트의 3-위치로 옮겨진다. 다른 한편으로, 엔트너-다우도로프 경로에서, 글루코스는 글리세르알데하이드 3-포스페이트와 피루베이트의 혼합물로 전환된다. 글루코스의 C-1은 오직 피루베이트의 C-1으로 전환되며, 글루코스의 C-6은 오직 글리세르알데하이드 3-포스페이트의 C-3으로 전환된다.
당분해 및 엔트너-다우도로프 경로의 중간체 및 생성물은 두 이소프레노이드 생합성 경로 모두에 출발 물질로 작용한다. 메발로네이트 경로와 관련하여, 피루베이트 및 트리오스 포스페이트는 전구체 아세틸-CoA로 전환될 수 있다. 당분해 경로를 통한 글루코스 분해대사는 글루코스의 C-1 뿐 아니라 C-6로부터의 표지를 아세틸-CoA의 메틸 그룹으로 옮긴다. 엔트너-다우도로프 경로를 통한 글루코스 분해대사는 피루베이트가 아세틸-CoA로 전환되는 동안 글루코스로부터 C-1을 손실시킨다.
파라코커스속 균주 R114에 의해 생산된 제아잔틴의 실험에 의해 관찰된 풍부함 및 13C13C 커플링 패턴은 엔트너-다우도로프 경로 및 메발로네이트 경로의 조합에 의해 제아잔틴 생합성에 필요한 표지 패턴과 완전히 일치되었다. 당분해 및 엔트너-다우도로프 경로가 사용된 실험 조건하에서 동시에 작용가능한 경우, [1-13C1] 글루코스로부터의 적어도 일부의 표지가 제아잔틴에 사용되어야 한다. 또한, 메발로네이트 경로는 많아야 두 탄소원자의 블록을 테르페노이드에 전달할 수 있는 반 면, DXP 경로에서는 3개의 탄소 단위가 트리오스 포스페이트 전구체를 통해 이소프레노이드로 전달될 수 있다. 상기 3개의 탄소 블록은 DXP 경로에 수반되는 재배열에 의해 분리되지만, 3개의 표지된 탄소원자의 블록은 여전히 장거리 커플링에 의해 인지될 수 있다. 상응하는 13C-13C 장거리 커플링은 배양된 식물 세포(칸타란터스 로제우스(Cantharantus roseus))에 의한 [2,3,4,5-13C4] 1-데옥시-D-자일룰로즈로부터 카로티노이드 루테인의 생합성에서 관찰되었다[Arigoni et al., Proc. Nat. Acad. Sci., 94:10600-10605, 1997]. 파라코커스속 균주 R114에 의해 생산된 제아잔틴을 사용한 본 발명의 실험에서는 상기 장거리 커플링은 관찰되지 않았다.
본원에 나타낸 결과들은 파라코커스속 균주 R114에서 메발로네이트 경로를 통한 이소프레노이드의 생산을 확인시키며, 사용된 성장 조건하에서 당분해를 통한 글루코스 대사가 거의 또는 전혀 없었음을 시사하지만, 엔트너-다우도르프 경로 이외에 펜토스 포스페이트 경로를 통한 글루코스의 일부 대사의 가능성도 배제하지 않음을 주목해야 한다. 상기 당분해 및 엔트너-다우도르프 두 경로를 통한 글루코스 대사의 정량적 측정은 (파라코커스 데니트리피칸스에 대해 수행한 바와 같이) 피루베이트-유래 아미노산 표지 패턴의 분석에 의해 달성할 수 있었다[Dunstan et al., Biomedical and Environ. Mass Spectrometry, 19:369-381, 1990].
실시예 4:
파라코커스
속 균주 R114로부터 IPP 이소머라제 및 메발로네이트 경로의 효소들을 암호화하는 유전자의 클로닝 및 서열분석
배양 조건. 파라코커스속 균주 R114를 28 ℃에서 F-배지(10 g/l 트립톤, 10 g/l 효모 추출물, 30 g/l NaCl, 10 g/l D-글루코스, 5 g/l MgSO4·7H2O, pH 7.0) 또는 상기 실시예 3에서 기술한 예비-배양 배지에서 성장시켰다. 배양액을 회전 진탕기에서 200 rpm으로 성장시켰다.
게놈 DNA의 단리. 600 ml의 파라코커스속 균주 R114 배양액을 4 ℃에서 10,000xg로 10 분간 원심분리하고, 펠릿을 200 ml의 용균 완충액(0.1M NaCl, 50mM EDTA, 10mM 트리스-HCl, pH 7.5)으로 1회 및 100 ml 용균 완충액으로 1회 세척하였다. 최종 펠릿을 50 mg의 라이소자임 및 1 mg의 RNase A(DNase 비함유)를 함유하는 20 ml의 용균 완충액에 재현탁시켰다. 37 ℃에서 15 분간 배양한 후, 1.5 ml의 20% 나트륨 N-라우로일-사르코시네이트 및 2.25 mg의 프로테이나제 K를 가하였다. 50 ℃에서 30 내지 60 분간 배양한 후, 용균액을 1 부피의 완충액-포화 페놀(pH 7.5 내지 7.8)(라이프테크놀로지(LifeTechnologies), 미국 메릴랜드주 로크빌 소재)로 부드럽게 완전히 혼합함으로써 추출하였다. 유화액을 30,000xg에서 20 분간 원심분리하고 수성상을 페놀로 재추출하였다. 상을 앞에서와 같이 분리하고, 수성상을 1 부피의 페놀:클로로포름(1:1)으로 2회 추출하였다. 이 단계에서, 날개 회전자에서 3,200xg로 20 분간 원심분리하면 만족스러운 상 분리를 이루기에 충분하였다. 1 부피의 클로로포름으로 최종 추출한 후, 0.1 부피의 3M 나트륨-아세테이트(pH 5.2)를 가하고 용액 위에 2 부피의 얼음 냉각 에탄올을 부었다. 침전된 DNA를 유리 막대로 스풀링(spooling)하고, 70% 에탄올에 5 분간 침지시키고, 클로로포름으로 헹군 다음 5 내지 10 분간 공기 건조시켰다. DNA를 5 ml TE(10mM 트리스- HCl, pH 7.5, 1mM EDTA)에 밤새 재현탁시켰다. 용액이 제아잔틴의 흔적으로 인해 황색이었으므로, 유기 추출 및 스풀링을 상기에서와 같이 반복하여 투명 제제를 수득하였다.
λ-DNA의 단리: 키아겐(등록상표) 람다 키트(키아겐, 독일 힐덴 소재)를 제조업자의 지시에 따라 사용하였다.
중합효소 연쇄 반응(PCR): 올리고뉴클레오타이드는 라이프테크놀로지(미국 메릴랜드주 로크빌 소재)로부터 구입하였다. PCR은 제조업자의 지시에 따라 GC가 풍부한 PCR 시스템(로슈 몰레큘라 바이오케미칼스(Roche Molecular Biochemicals), 독일 만하임 소재)을 이용하여 진앰프(GeneAmp, 등록상표) PCR 시스템 9700(피이 어플라이드 바이오시스템즈(PE Applied Biosystems), 미국 캘리포니아주 포스터 시티 소재)에서 수행하였다. 전형적으로, 사용된 MgCl2 농도는 1.5mM이었으며, 분리 용액은 1M의 최종 농도로 가하였다.
DNA 표지 및 검출: PCR 디그(DIG) 프로브 합성 키트 및 디그 발광 검출 키트를 DNA 표지 및 검출에 각각 사용하였다(둘 다 독일 만하임 소재의 로슈 몰레큘라 바이오케미칼스에서 입수).
DNA 서열분석: 서열분석 반응은 제조업자의 지시에 따라 빅다이(BigDye, 등록상표) DNA 서열분석 키트(피이 어플라이드 바이오시스템즈, 미국 캘리포니아주 포스터 시티 소재)를 사용하여 수행하였다. 서열분석 반응물은 다이엑스(DyeEx, 등록상표) 회전 컬럼(키아겐, 독일 힐덴 소재) 상에서 정제하였으며, 단편 분리 및 검출은 아비 프리즘(ABI Prism, 등록상표) 310 유전자 분석기(피이 어플라이드 바이오시스템즈, 미국 캘리포니아주 포스터 시티 소재)를 사용하여 수행하였다.
λ-라이브러리: 람다 픽스(FIX, 등록상표) II에서 Sau3AI로 부분 절단된 파라코커스속 균주 R114 DNA를 갖는 맞춤 라이브러리는 스트라타진(Stratagene, 미국 캘리포니아주 라 졸라 소재)에서 구입하였다.
파라코커스 속 균주 R114로부터 메발로네이트 경로 유전자 집단의 클로닝, 서열분석 및 특성화. 메발로네이트 경로의 효소들 중 하나인 메발로네이트 디포스페이트 데카복실라제는 여러 아미노산에 걸쳐 있는 매우 보존성인 영역을 함유한다. 3개의 상기 영역들은 모든 이용가능한 진성세균의 메발로네이트 디포스페이트 데카복실라제의 배열에서 선택하였으며, 올리고뉴클레오타이드는 파라코커스속 균주 R1534의 카로티노이드 유전자 집단에서 발견된 바람직한 코돈 사용법을 이용하여 설계하였다(표 14).
두 상동성 영역으로부터 설계된 올리고뉴클레오타이드는 표 15에 나타내었다. 변성도를 감소시키기 위해, 올리고뉴클레오타이드 조합들을 각각의 펩타이드로부터 설계하였다. 예를 들면, 올리고뉴클레오타이드 mvd-103a-d는 3' 말단으로부터 세 번째 뉴클레오타이드에서만 상이하며, 이 둘은 각각 글리신에 대한 하나의 가능한 코돈을 나타낸다(GGA는 거의 사용되지 않지만 3' 말단에 대한 밀접한 근접성으로 인해 포함시켰다). 두 잔기 모두에 대한 올리고뉴클레오타이드를 설계함으로써 대체 아미노산을 고려하였다, 예를 들면, 올리고뉴클레오타이드 mvd-101a 및 mvd-101b는 펩타이드 1의 두 번째 위치에서 각각 류신 또는 이소류신에 특이적이다(표 15). 주형으로 파라코커스속 균주 R114 DNA를 사용하여 올리고뉴클레오타이드 mvd-101 및 mvd-104 또는 mvd-106을 이용하여 PCR을 행한 결과 예상된 크기의 생성물이 수득되었다. PCR 산물은 벡터 pCR(등록상표) 2.1-토포(TOPO)(인비트로겐(Invitrogen), 미국 캘리포니아주 칼스배드 소재)에 클로닝하고 서열분석하였다. 클로닝된 단편을 파라코커스속 균주 R114 DNA의 서던 분석에 프로브로 사용하였으며 약 950 bp의 BamHI-SalI 단편에 하이브리드화된 것으로 나타났다. 파라코커스속 균주 R114 DNA는 BamHI 및 SalI으로 절단하였으며 단편들은 아가로스 겔 전기영동으로 분리하였다. 950 bp 부근의 영역을 단리하여 벡터 pUC19에 클로닝하였다. 그 다음, 상기 부분 라이브러리를 mvd-PCR 단편을 프로브로 사용하여 검색하고 양성 클론의 삽입물을 서열분석하였다.
동시에, 파라코커스속 균주 R114 DNA로부터 제조된 λ-라이브러리는 프로브로서 mvd-PCR 단편을 이용하여 검색하였다. DNA를 2개의 양성 λ-클론으로부터 단리하고 BamHI 및 SalI 또는 EcoRI 및 SalI으로 절단하였다. 다수의 제한효소 단편들을 단리하고 벡터 pUC19에 클로닝하였다. 단편들 중 여러개가 메발로네이트 경로의 단백질을 암호화하는 유전자에 상동성인 서열들을 포함하였다. 상기 개개의 서열들을 연결하는 클론은, 주형으로 λ-클론의 DNA를 사용하여 클로닝된 제한효소 단편들의 서열들로부터 유도된 프라이머를 사용하여 PCR에 의해 수득하였다. 모든 단편들로부터 구성된 서열(서열번호: 42, 44, 46, 48, 50 및 52) 및 암호화된 단백질들의 서열을 서열 목록표에 나타내었다(서열번호: 43, 45, 47, 49, 51 및 53). 페이턴트인 프로그램(PatentIn Program)의 제한으로 인해, 중복 유전자를 갖는 오 페론은 단일 서열로 나타낼 수 없다. 따라서, 메발로네이트 오페론 중의 각각의 유전자에 대해, 오페론의 전체 뉴클레오타이드 서열을 각 유전자에 대해 반복한다. 따라서, 서열번호: 42, 44, 46, 48, 50 및 52는 동일하다. 본 발명에 있어서는, 메발로네이트 오페론의 뉴클레오타이드 서열을 언급하는데 서열번호: 42를 사용한다.
파라코커스속 균주 R114에서 메발로네이트 경로 유전자들의 배열은 다른 세균의 공지된 메발로네이트 유전자 집단들에 비해 독특하다. 파라코커스속 균주 R114 이외에, 보렐리아 버그도르페리(Borrelia burgdorferi) 및 스트렙토마이세스속(Streptomyces sp.) 균주 CL190[Takagi et al., J. Bacteriol., 182:4153-4157, 2000]은 단일 오페론에 모든 메발로네이트 유전자를 갖는다[Wilding et al., J. Bacteriol., 182:4319-4327, 2000]. 스트렙토코커스 피로제네스(Streptococcus pyrogenes)에서는, 모든 메발로네이트 유전자는 단일 좌위에 무리를 이루지만 이들은 두개의 오페론에서 무리를 이룬다. 다른 종들은 모두 2개의 키나제 및 하나의 오페론에서 무리를 이루는 메발로네이트 디포스페이트 데카복실라제를 갖는 2개의 좌위, 및 오페론(스트렙토코커스 뉴모니에(Streptococcus pneumoniae)에서)을 형성하거나 또는 별도의 전사 단위로서 두 번째 좌위 상의 HMG-CoA 신타제 및 HMG-CoA 리덕타제를 갖는다. 스태필로코커스(Staphylococcus)의 구성원을 제외한 모든 종은, 최근에 IPP 이소머라제로 동정된, 메발로네이트 유전자집단과 연결된 추가의 유전자를 갖는다(스트렙토마이세스속 균주 CL190에서의 idi 유전자)[Kaneda et al., Proc. Nat. Acad. Sci., 98:932-937, 2001]. 두 엔테로코커스(Enterococcus) 종 및 스태필로코커스 헤모라이티커스(Staphylococcus haemolyticus)는 HMG-CoA 리덕타제 유전자와 연결된 아세틸-CoA 아세틸트랜스퍼라제 유전자를 갖는다. 엔테로코커스 종에서는, 후자의 두 유전자가 융합된다.
파라코커스속 균주 R114로부터 취한 메발로네이트 오페론의 유전자들은 일반적인 데이터베이스에서 단백질에 대한 유전자 산물의 상동성으로 동정하였다. 파라코커스속 균주 R114로부터의 HMG-CoA 리덕타제의 아미노산 정렬(서열번호: 43)은 스트렙토마이세스속 균주 CL190(서열번호: 54), 스트렙토마이세스 그리세올로스포레우스(S. griseolosporeus)(서열번호: 55) 및 스트렙토마이세스속 균주 KO-3899(서열번호: 56)의 세균 부류 I HMG-CoA 리덕타제를 사용하여 수행하였다. EMBL/진뱅크(GenBank)/DDBJ 데이터베이스 접수 번호는 스트렙토마이세스속 균주 CL190은 q9z9n4, 스트렙토마이세스 그리세올로스포레우스는 q9znh1, 및 스트렙토마이세스속 균주 KO-3899는 q9znh0이다. 두 부류의 HMG-CoA 리덕타제가 존재한다[Bochar et al., Mol. Genet. Metab., 66:122-127, 1999; Boucher et al., Mol. Microbiol., 37:703-716, 2000]. 진성세균 HMG-CoA 리덕타제는 일반적으로 부류 II에 속하는 반면 부류 I의 효소들은 진핵생물 및 원시세포에서 발견된다. 스트렙토마이세스 및 파라코커스 HMG-CoA 리덕타제는 비브리오 콜레라(Vibrio cholerae) 유래 효소들과 함께 지금까지 알려진 부류 I의 유일한 진성세균성 HMG-CoA 리덕타제이다.
파라코커스속 균주 R114로부터의 이소펜테닐 디포스페이트 이소머라제(IPP 이소머라제)(idi)의 아미노산 정렬(서열번호: 45)은 EMBL 데이터베이스에서 밝혀진 밀접한 동족체, 즉, 에르위니아 허비콜라(Q01335)(서열번호: 57), 보렐리아 버그도르페리(O51627)(서열번호: 58), 시네코사이스티스속(Synechocystis sp.) PCC 6803(P74287)(서열번호: 59), 스트렙토마이세스속 CL190(Q9KWG2)(서열번호: 60), 스트렙토마이세스 그리세올로스포레우스(Q9KWF6)(서열번호: 61), 설포로버스 솔파타리커스(Sulfolobus solfataricus)(P95997)(서열번호: 62), 리켓치아 프로바제키(Rickettsia prowazekii)(Q9ZD90)(서열번호: 63), 데이노코커스 라디오듀란스(Deinococcus radiodurans)(Q9RVE2)(서열번호: 64), 에어로피럼 페르닉스(Aeropyrum pernix)(Q9YB30)(서열번호: 65), 할로박테리움속(Halobacterium sp.) NRC-1(O54623)(서열번호: 66), 아르케오글로버스 풀기더스(Archaeoglobus fulgidus)(O27997)(서열번호: 67), 피로코커스 아비씨(Pyrococcus abyssi)(Q9UZS9)(서열번호: 68), 피로코커스 호리코시(Pyrococcus horikoshii)(O58893)(서열번호: 69), 메타노박테리움 터모오토트로피컴(Methanobacterium thermoautotrophicum) (O26154)(서열번호: 70), 메타노코커스 야나시(Methanococcus jannaschii)(Q58272)(서열번호: 71), 터모플라스마 아시도필럼(Thermoplasma acidophilum)(CAC11250)(서열번호: 72) 및 레이쉬마니아 메이저(Leishmania major)(Q9NDJ5)(서열번호: 73)를 사용하여 수행하였다. EMBL/진뱅크/DDBJ 데이터베이스 접수 번호는 유기체 명칭 뒤에 괄호안에 나타내었다. 앞의 9개 서열은 진성세균에서 유래된 것이고 다음 8개 서열들은 원시세포에서 유래한 것이다. 흥미롭게, 하나의 진핵생물 종인 원생동물 기생체인 레이쉬마니아 메이저(서열번호: 73)도 또한 매우 상동성인 단백질을 갖는다. 이것은 다른 진핵생물은 1형[Kaneda et al., Proc. Nat. Acad. Sci., 98:932-937, 2001]으로 지정된 상이한 idi를 갖기 때문에 예상치 못한 것이다. 바실러스 서브틸리스로부터 유래된 보존성 가상 단백질 YpgA도 또한 충분한 상동성을 갖지만 2형 idi보다 상당히 작다.
파라코커스속 균주 R114로부터 세균성 HMG-CoA 신타제의 아미노산 정렬(서열번호: 47)은 EMBL 데이터베이스에서 밝혀진 밀접한 동족체, 즉, 스트렙토코커스 뉴모니에(AAG02453)(서열번호: 74), 스트렙토코커스 피로제네스(AAG02448)(서열번호: 75), 엔테로코커스 페칼리스(Enterococcus faecalis)(AAG02438)(서열번호: 76), 엔테로코커스 페시움(Enterococcus faecium)(AAG02443)(서열번호: 77), 스태필로코커스 헤모라이티커스(AAG02427)(서열번호: 78), 스태필로코커스 에피더미스(Staphylococcus epidermis)(AAG02433)(서열번호: 79), 스태필로코커스 오레우스(Staphylococcus aureus)(AAG02422)(서열번호: 80), 스태필로코커스 카노서스(Staphylolcoccus carnosus)(Q9ZB67)(서열번호: 81), 스트렙토마이세스속 CL190 (Q9KWG1)(서열번호: 82), 스트렙토마이세스 그리세올로스포레우스(Q9WF5)(서열번호: 83) 및 보렐리아 버그도르페리(051626)(서열번호: 84)를 이용하여 수행하였다. EMBL/진뱅크/DDBJ 데이터베이스 접수 번호는 각 유기체의 명칭 뒤에 괄호안에 나타내었다. 스트렙토마이세스 그리세올로스포레우스 유래 서열의 처음 43개 아미노산은 데이터베이스 변이체에서는 빠져 있다.
파라코커스속 균주 R114로부터의 세균성 메발로네이트 디포스페이트 데카복실라제의 아미노산 정렬(서열번호: 53)은 다른 세균, 즉, 스트렙토코커스 뉴모니에(AAG02456)(서열번호: 85), 스트렙토코커스 피로제네스(AAG02451)(서열번호: 86), 엔테로코커스 페칼리스(AAG02441)(서열번호: 87), 엔테로코커스 페시움(AAG02446)(서열번호: 88), 스태필로코커스 헤모라이티커스(AAG02431)(서열번호: 89), 스태필로코커스 에피더미스(AAG02436)(서열번호: 90), 스태필로코커스 오레우스(AAG02425)(서열번호: 91), 스트렙토마이세스속 CL190(Q9KWG4)(서열번호: 92), 스트렙토마이세스 그리세올로스포레우스(Q9WF8)(서열번호: 93) 및 보렐리아 버그도르페리(051629)(서열번호: 94) 유래의 오르토로고스(orthologous) 단백질을 이용하여 수행하였다. EMBL/진뱅크/DDBJ 데이터베이스 접수 번호는 각 유기체 명칭 뒤에 괄호안에 나타내었다.
마이조코커스 잔터스(Myxococcus xanthus) 유래의 두 단백질, Tac 및 Taf(데이터베이스 접수 번호 각각 q9xb06 및 q9xb03) 및 추정상의 폴리케타이드(polyketide) 생합성 단백질인 바실러스 서브틸리스 유래 단백질 PksG(데이터베이스 접수 번호 p40830)는 파라코커스속 균주 R114 HMG-CoA 신타제에 대해 충분한 상동성을 갖는다. 파라코커스속 균주 R114 HMG-CoA 신타제와 마이조코커스 잔터스의 Tac 및 Taf 단백질간의 상동성은 파라코커스속 균주 R114 및 진핵생물로부터의 HMG-CoA 신타제들간의 상동성보다 크다. 세균성 HMG-CoA 신타제 및 세균성 메발로네이트 디포스페이트 데카복실라제는 그들의 진핵생물 오르토로그(ortholog)와 충분한 상동성을 공유한다. 원시세포의 HMG-CoA 신타제는 더 관련이 적은 그룹의 효소들을 생성하며[Wilding et al., J. Bacteriol., 182:4319-4327, 2000], 원시세포에서 메발로네이트 디포스페이트 데카복실라제 오르토로그는 발견되지 않는다[Smit and Mushegian, Genome Res., 10:1468-1484, 2000].
파라코커스속 균주 R114로부터의 메발로네이트 키나제(Mvk)(서열번호: 49) 및 포스포메발로네이트 키나제(Pmk)(서열번호: 51)의 정렬은 다른 세균, 즉, 스트렙토코커스 뉴모니에(AAG02455)(서열번호: 95), 스트렙토코커스 피로제네스(AAG02450)(서열번호: 96), 엔테로코커스 페칼리스(AAG02440)(서열번호: 97), 엔테로코커스 페시움(AAG02445)(서열번호: 98), 스태필로코커스 헤모라이티커 스(AAG02430)(서열번호: 99), 스태필로코커스 에피더미스(AAG02435)(서열번호: 100), 스태필로코커스 오레우스(AAG02424)(서열번호: 101), 스트렙토마이세스속 CL190(Q9KWG5)(서열번호: 102), 스트렙토마이세스 그리세올로스포레우스(Q9KWF9)(서열번호: 103) 및 보렐리아 버그도르페리(051631)(서열번호: 104)(Mvk); 및 스트렙토코커스 뉴모니에(AAG02457)(서열번호: 105), 스트렙토코커스 피로제네스(AAG02452)(서열번호: 106), 엔테로코커스 페칼리스(AAG02442)(서열번호: 107), 엔테로코커스 페시움(AAG02447)(서열번호: 108), 스태필로코커스 헤모라이티커스(AAG02432)(서열번호: 109), 스태필로코커스 에피더미스(AAG02437)(서열번호: 110), 스태필로코커스 오레우스(AAG02426)(서열번호: 111), 스트렙토마이세스속 CL190(Q9KWG3)(서열번호: 112), 스트렙토마이세스 그리세올로스포레우스(Q9KWF7)(서열번호: 113) 및 보렐리아 버그도르페리(051630)(서열번호: 114)(Pmk) 유래의 오르토로고스 단백질에 대해 수행하였다. EMBL/진뱅크/DDBJ 데이터베이스 접수 번호는 각 유기체 명칭 뒤에 괄호안에 나타내었다.
메발로네이트 경로의 다른 효소들의 세균성 오르토로그 중에서보다 세균성 키나제들 사이에서의 상동성이 훨씬 낮다. 파라코커스속 균주 R114(서열번호: 49)로부터의 메발로네이트 키나제는 다른 메발로네이트 키나제가 결여되어 있는 아미노-말단 영역에 37 아미노산 삽입물을 갖는다. 세균성 Mvk의 몇몇 원시세포 효소와 함께, 예를 들면, 아르케오글로버스 풀기더스, 메타노박테리움 터모오토트로피컴 및 피로코커스 아비시로부터의 효소들은 파라코커스속 균주 R114로부터의 Mvk에 대해 가장 우수한 상동성을 갖는다. 세균성 포스포메발로네이트 키나제 사이에서 의 상동성은 세균성 메발로네이트 키나제 사이에서의 상동성보다 훨씬 약하다. 파라코커스속 균주 R114 유래 Pmk(서열번호: 51)에 가장 우수한 상동성을 갖는 단백질은 원시세포, 예를 들면, 에어로피럼 페르닉스, 피로코커스 호리코시, 메타노박테리움 터모오토트로피컴, 피로코커스 아비시 및 아르케오글로버스 풀기더스로부터 유래된 Mvk이다. 원시세포에서는 Pmk가 발견되지 않으므로[Smit and Mushegian, Genome Res., 10:1468-1484, 2000], 이것은 동일한 키나제가 두 인산화반응을 모두 수행할 수도 있음을 시사한다.
실시예 5:
이. 콜라이
에서
파라코커스
속 균주 R114로부터의 메발로네이트 경로 유전자 및
idi
유전자의 과발현
이. 콜라이 에서 메발로네이트 오페론의 클로닝 및 발현. 클론 16으로 지정된, 파라코커스속 균주 R114 λ 라이브러리(실시예 4 참조)로부터의 λ 클론을 전체 메발로네이트 오페론의 PCR 증폭에 주형으로 사용하였다. 프라이머 Mevop-2020 및 Mevop-9027(표 16)을 PCR에 이용하였다.
생성된 PCR 산물은 TOPO-XL(미국 캘리포니아주 칼스배드 소재의 인비트로겐)에 클로닝시켜 플라스미드 TOPO-XL-mev-op16을 수득하였다. 메발로네이트 오페론을 갖는 삽입물을 HindIII 및 SacI으로 절단하고 HindIII-SacI 절단 벡터 pBBR1MCS2[Kovach et al., Gene, 166:175-176, 1995]에 클로닝하여 플라스미드 pBBR-K-mev-op16을 수득하였다. 플라스미드 pBBR-K-mev-op16을 사용하여 전기천공-수용성 이.콜라이 균주 TG1(캘리포니아주 라 졸라 소재의 스트라타진; 문헌 [Sambrook et al., In: Nolan, C.(ed.), Molecular Cloning: A Laboratory Manual(Second Edition), p.A.12, 1989] 참조)을 형질전환시켰다. 2개의 대표적인 양성 형질전환체(이. 콜라이 TG1/pBBR-K-mev-op16-1 및 이. 콜라이 TG1/ pBBR-K-mev-op16-2)를 50 mg/l의 카나마이신을 함유하는 루리아 브로쓰(Luria Broth, LB; 깁코비알엘(GibcoBRL), 라이프 테크놀로지)에서 성장시키고, 실시예 1에 기술된 방법을 이용하여 HMG-CoA 리덕타제 활성(파라코커스속 균주 R114 mvaA 유전자에 의해 암호화된)에 대해 시험하였다. 이. 콜라이는 효소 HMG-CoA 리덕타제를 암호화하는 유전자를 갖지 않으므로 검출가능한 활성이 없었다. 이. 콜라이 TG1/pBBR-K-mev-op16의 대표적인 형질전환체 둘 다의 조 추출물은 용이하게 측정할 수 있는 HMG-CoA 리덕타제 활성을 가져, 클로닝된 mvaA 유전자의 이종 발현을 입증하였다.
이. 콜라이 에서 파라코커스 속 균주 R114로부터 idi 유전자 및 개개의 메발로네이트 경로 유전자들의 클로닝 및 발현. 파라코커스속 균주 R114로부터 얻은 메 발로네이트 오페론 유전자의 암호와 영역들을 표 18에 나타낸 프라이머를 사용하여 PCR로 증폭시켰다. 프라이머는, NdeI 부위(절단 인식 부위 CATATG)의 두 번째 절반을 구성하는 ATG 개시 코돈, 및 BamHI 부위(GGATCC)들이 정지 코돈 바로 다음에 도입되도록 설계되었다. 모든 PCR 산물을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하였다. 생성된 벡터의 명칭은 표 19에 나열되어 있다. 메발로네이트 키나제 유전자를 제외하고, 모든 유전자는 BamHI, NdeI 또는 EcoRI에 대한 제한효소 부위를 포함하였는데, 상기 부위는 후속 클로닝 단계를 촉진하기 위해 제거되어야 한다. 상기 부위들은 퀵체인지(QuikChange, 등록상표) 부위-지향 돌연변이유발 키트(미국 캘리포니아주 라 졸라 소재의 스트라타진) 및 표 20에 나타낸 올리고뉴클레오타이드를 사용하여 잠재성 돌연변이를 도입함으로써 제거하였다. 돌연변이유발된 암호화 영역들은 BamHI 및 NdeI에 의해 TOPO-플라스미드로부터 절단하고 BamHI-NdeI 절단된 발현 벡터 pDS-His 및 pDS와 접합시켰다. 이들 발현 벡터는, EP 821,063 호의 실시예 2에 기술되어 있는 pDSNdeHis로부터 유도되었다. 플라스미드 pDS-His는 pDSNdeHis로부터 잠재성 클로람페니콜 아세틸트랜스퍼라제 유전자를 갖는 857 bp의 NheI 및 XbaI 단편을 결실시켜 구성하였다. 플라스미드 pDS는 pDS-His로부터 작은 EcoRI-BamHI 단편을 어닐링된 프라이머 S/D-1(5'-AATTAAAGGAGGGTTTCATATGAATTCG)(서열번호: 117) 및 S/D-2(5'-GATCCGAATTCATATGAAACCCTCCTTT)(서열번호: 118)로 치환시켜 구성하였다.
lacI(lac 억제제)-함유 플라스미드 pREP4(EMBL/진뱅크 접수 번호 A25856)를 갖는 이. 콜라이 균주 M15[Villarejo and Zabin, J. Bacteriol., 120:466-474, 1974]를 접합 혼합물을 사용하여 형질전환시키고, 재조합 세포를 100 mg/l 암피실린 및 25 mg/l 카나마이신을 보충한 LB-아가 플레이트상에서 성장시킴으로써 선별하였다. 정확한 메발로네이트 오페론 유전자 삽입물을 함유하는 양성 클론은 PCR로 확인하였다.
삽입된 유전자의 발현을 위해, 각각의 이. 콜라이 균주들을 37 ℃, 25 mg/l 카나마이신 및 100 mg/l 암피실린을 함유하는 LB 배지에서 밤새 성장시켰다. 다음날, 25 ml의 새로운 배지에 밤새 배양한 배양액 0.5 ml를 접종하고 새로운 배양액을 37 ℃에서 성장시켰다. 배양액의 OD600이 0.4에 도달하면, 이소프로필-β-D-티오갈락토피라노사이드(IPTG)를 1 mM의 최종 농도로 가하여 클로닝된 유전자의 발현을 유도하고, 배양액을 (진탕하면서) 4 시간동안 계속 배양한 후 원심분리에 의해 세포를 회수하였다.
조 추출물 제조, HMG-CoA 리덕타제 분석 및 IPP 이소머라제 분석은 실시예 1에 기술된 바와 같이 수행하였다. 표 21 및 22는 각각 재조합 이. 콜라이 균주에서의 HMG-CoA 리덕타제 및 IPP 이소머라제 활성을 나타낸 것이다. IPTG 유도시, 균주 M15/pDS-mvaA 및 M15/pDS- idi 는 각각 높은 수준의 HMG-CoA 리덕타제 및 IPP 이소머라제 활성을 가졌다. 이것은 이. 콜라이에서 파라코커스속 균주 R114로부터 메발로네이트 경로 유전자들을 과발현시키는(그리고 활성 형태의 그의 동원(同源) 유전자 산물을 과잉생산하는) 능력을 예시하는 것이다.
효소 분석에 사용된 조 추출물은 나트륨 도데실설페이트-폴리아크릴아미드 겔 전기영동(SDS-PAGE)으로 분석하였다. 균주 이. 콜라이 M15/pDS-mvaA 및 이. 콜라이 M15/pDS-His-mvaA에 대해, 예상된 분자 질량(36.3 kD)을 갖는 고도로 발현된 단백질의 존재 또는 부재가 추출물에서 측정된 HMG-CoA 리덕타제 활성과 상관되었다(표 21). His-부가된 단백질의 부재는 mRNA 또는 단백질의 불안정성에 의해 전사 또는 번역 단계에서 감소된 발현으로 설명될 수 있다. 이. 콜라이 M15/pDS-idi 및 이. 콜라이 M15/pDS-His-idi의 조 추출물들은 둘 다 각각 37.3 kD 및 39.0 kD의 예상 분자 질량을 갖는 고도로 발현된 단백질을 나타내었다. 그러나, 이. 콜라이 M15/pDS-idi의 추출물만이 증가된 IPP 이소머라제 활성을 가져(표 22), 효소의 히스티딘-부가 형태는 상기 조건하에서 작용할 수 없음을 나타내었다.
파라코커스속 균주 R114 메발로네이트 오페론(hcs, pmk, mvk 및 mvd, 표 19 참조)의 다른 4개 유전자를 과발현하는 이. 콜라이 균주의 조 추출물의 SDS-PAGE 분석에 의해, 약간의 발현을 배제할 수는 없지만 IPTG 유도시 천연형 효소의 고발현은 검출되지 않았다. 다른 한편으로, 고발현은 4개 단백질 모두의 His-부가 형 태에서 관찰되었다.
실시예 6:
crt
E 유전자의 과발현에 의한
파라코커스
속 균주 R114에서의 향상된 제아잔틴 생산
파라코커스 속 균주 R114에서 pBBR-K-Zea4, pBBR-K-Zea4-up 및 pBBR-K-Zea4-down의 구성 및 제아잔틴 생산에 대한 상기 플라스미드들의 영향. 파라코커스속 균주 R1534의 카로티노이드(crt) 유전자 집단을 플라스미드 pZea-4[Pasamontes et al., Gene, 185:35-41, 1997]로부터 8.3 kb의 BamHI-EcoRI 단편으로 절단하였다. crt 유전자 집단을 함유하는 상기 단편은 BamHI 및 EcoRI-절단 벡터 pBBR1MCS-2(진뱅크 접수 번호 #U23751)내에 접합시켜 pBBR-K-Zea4를 수득하였다. 개선된 제아잔틴 생산에 대해 시험하기 위해 플라스미드 pBBR-K-Zea4를 접합에 의해 파라코커스속 균주 R114에 도입하였다. 대조 균주 R114 및 균주 R114/pBBR-K-Zea4의 독립적인 두 단리물을 진탕 플라스크 배양액(배지 362F/2 사용, 실시예 11 참조) 중에서의 제아잔틴 생산에 대해 시험하였다. 표 23의 데이터는 플라스미드 pBBR-K-Zea4를 갖는 두 재조합 균주 모두 R114보다 상당히 높은 수준의 제아잔틴을 생산하며 더 높은 생산 비속도(mg 제아잔틴/OD660)를 나타냄을 보여준다. 이것은 pBBR-K-Zea4중의 클로닝된 삽입물 내의 하나 이상의 유전자들이 파라코커스속 균주 R114에서 제아잔틴 생산을 제한하는 효소(들)을 암호화함을 시사한다.
적극적인 효과의 위치를 정하기 위해, pBBR-K-Zea4에 존재하는 클로닝된 삽입물의 서브클로닝된 영역을 함유하는 두 플라스미드 유도체를 제조하였다. ORF 5 및 유전자 atoB 및 crtE를 포함하는, pBBR-K-Zea4 삽입물의 "상위" 영역[Pasamontes et al., Gene, 185:35-41, 1997]을 제한 효소 XbaI 및 AvrII에 대한 유일한 부위와 측면을 접하게 한다. 플라스미드 pBBR-K-Zea4-down은 상기 두 효소들로 pBBR-K-Zea4를 절단하고 "상위" 영역을 결실시켜 제작하였다. 유사하게, 플라스미드 pBBR-K-Zea4-up은 제한 효소 EcoRV 및 StuI를 이용하여, pBBR-K-Zea4에 클로닝된 삽입물 내의 "하위" 영역을 결실시켜 제작하였다. 새로운 두 플라스미드를 접합에 의해 파라코커스속 균주 R114에 전이시켰다. 균주 R114(숙주 대조군), R114/pBBR-K(빈 벡터 대조군), R114/pBBR-K-Zea4-down 및 R114/pBBR-K-Zea4-up에서 제아잔틴 생산을 비교하였다(진탕 플라스크 배양액, 전술한 바와 동일한 조건)(표 24). 데이터는 제아잔틴 생산에 대한 적극적인 효과가 ORF5, atoB 및 crtE를 함유하는 클로닝된 분절의 다중 복사체내의 존재, 즉, 플라스미드 pBBR-K-Zea4-up에 존재하는 삽입물내의 상기 분절의 존재의 결과였음을 명확히 보여주었다. pBBR-K-Zea4-up로부터 일련의 결실 플라스미드를 구축하였다. 이들 플라스미드를 각각 균 주 R114에 도입하고 제아잔틴 생산을 시험함으로써, 균주 R114/pBBR-K-Zea4 및 pBBR-K-Zea4-up에서의 향상된 제아잔틴 생산을 제공하는 것은 crtE 유전자의 과발현인 것으로 밝혀졌다. 이 결과는 파라코커스속 균주 R114에서 제아잔틴 생성을 제한하는 GGPP 신타제(crtE에 의해 암호화됨)의 활성과 일치한다. 실시예 1에 기술된 방법을 이용하여, 균주 R114/pBBR-K-Zea4-up의 조 추출물이 R114보다 2.6배 더 높은 GGPP 신타제 활성을 갖는 것으로 밝혀졌다. 이것을 직접 입증하기 위해, crtE 유전자만을 과발현시키는 새로운 플라스미드를 하기의 두 파트에서 기술하는 바와 같이 구축하였다.
발현 벡터 pBBR-K-P crtE 및 pBBR-tK-P crtE 의 제작. 벡터 pBBR1MCS-2를 BstXI 및 Bsu36I로 절단하고 더 큰 단편을 어닐링된 올리고뉴클레오타이드 MCS-2 up(5'-TCAGAATTCGGTACCATATGAAGCTTGGATCCGGGG-3')(서열번호: 145) 및 MCS-2 down(5'-GGATCCAAGCTTCATATGGTACCGAATTC-3')(서열번호: 146)과 접합시켜 벡터 pBBR-K-Nde를 수득하였다. 리보솜 결합 부위 및 crtE 개시 코돈[Pasamontes et al., Gene, 185:35-41, 1997]을 포함하는 추정상의 crtE 프로모터(PcrtE)를 함유하 는, 파라코커스속 균주 R114로부터의 카로티노이드 유전자 집단에서 crtE 유전자의 상위 270 bp 영역을, 프라이머 crtE-up(5'-GGAATTCGCTGCTGAACGCGATGGCG-3')(서열번호: 147) 및 crtE-down(5'-GGGGTACCATATGTGCCTTCGTTGCGTCAGTC-3')(서열번호:148)을 사용한 PCR에 의해 파라코커스속 균주 R114 DNA로부터 증폭시켰다. PCR 산물을 EcoRI 및 NdeI으로 절단하고 pBBR-K-Nde의 EcoRI-NdeI 절단 주쇄에 삽입하여 플라스미드 pBBR-K-PcrtE를 수득하였다. crtE의 ATG 개시 코돈을 포함하는 NdeI 부위는 프라이머 crtE-down에 포함되었다. 따라서, NdeI 부위에 포함된 개시 코돈과 함께 도입된 임의의 암호화 영역은 crtE의 리보솜 결합 부위를 사용하여 발현시켜야 한다. 플라스미드 pBBR-K-PcrtE를 BamHI로 절단하고, 어닐링된 올리고뉴클레오타이드 pha-t-up
(5'-GATCCGGCGTGTGCGCAATTTAATTGCGCACACGCCCCCTGCGTTTAAAC-3')(서열번호: 149) 및 pha-t-down
(5'-GATCGTTTAAACGCAGGGGGCGTGTGCGCAATTAAATTGCGCACACGCCG-3')(서열번호: 150)을 삽입시켰다. 삽입은 서열분석에 의해 확인하였으며, PcrtE 프로모터에 더 근접한 BamHI 부위를 재구성하는 배향으로 삽입된 올리고뉴클레오타이드를 갖는 플라스미드 변이체를 pBBR-tK-PcrtE로 칭하였다. 삽입된 서열은 파라코커스속 균주 R114 phaA 및 phaB 유전자(실시예 10 참조) 사이에서 발견된 추정상의 전사 터미네이터를 가지므로, PcrtE 프로모터로부터 개시된 전사의 적절한 종료를 확실히 해야 한다.
플라스미드 pBBR-K-P crtE-crtE -3의 구축. 파라코커스속 균주 R114 숙주에서 crtE 유전자의 발현 증가를 위한 다중복제 플라스미드를 구축하기 위해, 프라이머 crtE-Nde(5'-AAGGCCTCATATGACGCCCAAGCAGCAATT-3')(서열번호: 151) 및 crtE-Bam(5'-CGGGATCCTAGGCGCTGCGGCGGATG-3')(서열번호: 152)을 사용하여 PCR에 의해 플라스미드 p59-2[Pasamontes et al., Gene, 185:35-41, 1997]로부터 crtE 유전자를 증폭시켰다. 증폭된 단편을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하여 플라스미드 TOPO-crtE를 수득하였다. TOPO-crtE로부터 NdeI-BamHI 단편을 NdeI-
BamHI-절단된 플라스미드 pBBR-K-PcrtE에 서브클로닝하여 pBBR-K-PcrtE-crtE를 수득하였다. 최종적으로, pBBR-K-PcrtE-crtE로부터 더 작은 BglII 단편을 pBBR-K-Zea4-up로부터 더 작은 BglII 단편으로 치환시켜 pBBR-K-PcrtE-crtE-3을 구축하였다. 전기천공에 의해 플라스미드 pBBR-K-PcrtE-crtE-3을 파라코커스속 균주 R114로 전이시켰다. 실시예 1에 기술된 방법을 이용하여, 조 추출물 중의 GGPP 신타제 활성은 균주 R114에서보다 균주 R114/pBBR-K-PcrtE-crtE-3에서 2.9배 더 높은 것으로 나타났다. 상기 활성의 상승정도는 R114/pBBR-K-Zea4-up에서 관찰된 것과 유사하였다. 표 25는 균주 R114/pBBR-K-PcrtE-crtE-3에 의한 제아잔틴 생산이 균주 R114/pBBR-K-Zea4-up와 본질적으로 동일함을 보여준다.
실시예 7: 천연 숙주
파라코커스
속 균주 R114에서
파라코커스
속 균주 R114 메발로네이트 오페론의 개개 유전자들의 발현
파라코커스 속 균주 R114 숙주에서 파라코커스 속 균주 R114 메발로네이트 오페론의 클로닝된 개개 유전자들의 발현. TOPO-플라스미드(실시예 5 참조)에서 메발로네이트 오페론 유전자의 돌연변이유발된 암호화 영역을 BamHI 및 NdeI으로 절단하고 BamHI-NdeI 절단된 벡터 pBBR-tK-PcrtE(실시예 6 참조)와 접합시켰다. 생성된 플라스미드 pBBR-tK-PcrtE-mvaA, pBBR-tK-PcrtE-idi, pBBR-tK-PcrtE-hcs, pBBR-tK-PcrtE-mvk, pBBR-tK-PcrtE-pmk 및 pBBR-tK-PcrtE-mvd를 전기천공에 의해 파라코커스속 균주 R114에 도입하였다. 형질전환체는 50 mg/l 카나마이신을 함유하는 아가 배지상에서 선별하였으며 PCR로 확인하였다.
플라스미드에 함유된 메발로네이트 경로 유전자들이 천연 숙주 파라코커스속 균주 R114에서 발현될 수 있음을 예시하기 위해, HMG-CoA 리덕타제 활성을 균주 R114/pBBR-K(대조군) 및 R114/pBBR-tK-PcrtE-mvaA의 조 추출물에서 비교하였다(사 용된 방법은 실시예 1에 나타내었다). 균주 R114/pBBR-K 및 R114/pBBR-tK-PcrtE-mvaA에서의 HMG-CoA 리덕타제의 비활성은 각각 2.37 U/mg 및 6.0 U/mg이었다. 따라서, 다중복제 플라스미드 상의(그리고 PcrtE 프로모터로부터 발현된) mvaA 유전자의 존재는 빈 벡터 pBBR-K를 갖는 R114의 기본(즉, 염색체에 의해 암호화된) 활성에 비해 HMG-CoA 리덕타제 활성에 있어 2.5배 증가를 야기하였다.
실시예 8:
파라코커스
속 균주 R114
crtE
유전자로 클로닝된 메발로네이트 경로 유전자의 동시 과발현을 위한 "미니-오페론"의 제작
플라스미드 제작. 실시예 6에서 보았듯이, 파라코커스속 균주 R114에 플라스미드 pBBR-K-PcrtE-crtE-3을 도입한 결과 제아잔틴의 생산이 증가되어, GGPP 신타제 활성이 균주 R114에서의 제아잔틴 생합성에 대해 속도를 제한함을 알 수 있었다. 실시예 7은 또한 메발로네이트 경로의 효소를 암호화하는 유전자가 천연 숙주 파라코커스속 균주 R114에서 과발현될 수 있으며 암호화된 효소의 활성을 증가시킴을 보여주었다. 그러나, 메발로네이트 오페론의 각각의 개별 유전자를 함유하는 플라스미드를 갖는 파라코커스속 균주 R114의 재조합 균주는 어느 것도 균주 R114에 비해 증가된 제아잔틴 생산을 나타내지 못했다. 파라코커스속 균주 R114에서의 메발로네이트 오페론 유전자들의 과발현의 이점이 제아잔틴 경로(GGPP 신타제)에서 하위 "보틀넥 현상(bottleneck)"에 의해 가려질 수 있을 수도 있다. crtE와 함께 각각의 메발로네이트 경로 유전자(또는 아마도 이들 유전자의 조합)를 동시 과발현시키는 플라스미드를 제작하여 전체적인 제아잔틴 생합성 경로에서의 모든 속도 제한을 해결함으로써 제아잔틴 생산을 향상시킬 수 있었다. 다음 파트는 crtE 및 메 발로네이트 경로의 다섯 개 효소를 암호화하는 유전자 각각을 동시-과발현시키도록 설계된 "미니-오페론"의 제작을 설명한다.
crtE, mvaA, idi 및 mvk 유전자들을 BamHI 및 NdeI으로 각각의 TOPO-플라스미드(실시예 5 및 6에 기술됨)로부터 절단하여 BamHI-NdeI-절단 벡터 pOCV-1(실시예 12에 기술되어 있음)과 접합시켰다. crtE 유전자는 암호화 영역의 마지막 뉴클레오타이드로서 아데닌을 갖지 않으며, 또한 TGA 정지 코돈 이외의 다른 TAG 및 정지 코돈과 BamHI 부위 사이에 부적합한 거리를 갖는다. 그러므로, crtE의 말단은 오페론 제작 벡터(실시예 12 참조)의 필요조건을 충족시키며, crtE는 pOCV-1-crtE에 의해 제작된 임의 오페론에서 마지막 유전자이어야 한다. 두 번째 코돈의 첫 번째 뉴클레오타이드 및 마지막 코돈의 마지막 뉴클레오타이드로서 아데닌에 대한 필요조건을 충족시키기 위해, 돌연변이는 메발로네이트 오페론의 세 개 유전자에 도입되어야 한다. Asp를 암호화하는 pmk의 두 번째 코돈 GAT는 Asn을 암호화하는 AAT로 변화되었다. mvd의 마지막 코돈은 T로 끝나고, pmk 및 hcs의 마지막 코돈은 C로 끝난다. 이들 뉴클레오타이드를 A로 변화시키면 마지막 아미노산이 Asp에서 Glu로 변화된 pmk를 제외하고 잠재성 돌연변이가 야기된다. 올리고뉴클레오타이드는 PCR에 의해 필요한 변화를 도입하도록 설계되었다. 상기 PCR 반응에 사용된 올리고뉴클레오타이드 및 주형의 서열은 표 26에 나타내었다. 모든 PCR 산물을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하여 플라스미드 TOPO-mvd OCV, TOPO-pmk OCV
및 TOPO-hcs OCV를 수득하였다. 삽입물을 NdeI 및 BamHI으로 절단하고 pOCV-2(실시예 12 참조)의 NdeI-BamHI 절단 주쇄와 접합시켰다. 각각의 "미니-오페론"을 구성하기 위한 최종 클로닝 단계는 유사하였으며, pBBR-K-PcrtE-mvaA-crtE-3의 제작을 위한 대표적인 도식으로 예시된다.
실시예 9:
파라코커스
속 균주 R114로부터 FPP 신타제를 암호화하는
ispA
유전자의 클로닝 및 서열분석
FPP 신타제는 파라코커스속 균주 R114에서의 제아잔틴 생합성의 중심 경로에 수반되므로, ispA 유전자의 용량을 증가시켜 상기 효소의 활성을 증가시키는 것은 제아잔틴 생산을 향상시킬 가능성을 갖는다. 이러한 이유로, 파라코커스속 균주 R114로부터 ispA 유전자를 다음과 같이 클로닝하고 서열분석하였다. 6개의 세균성 FPP 신타제의 아미노산 서열은 공중 데이터베이스로부터 수득하였다. 이들 서열은 여러개의 매우 보존성인 영역들을 갖는다. 2개의 상기 영역, 및 PCR에 사용된 올리고뉴클레오타이드는 표 27에 나타내었다. 주형으로 파라코커스속 균주 R114 DNA 를 사용하여 올리고뉴클레오타이드 GTT-1 및 GTT-2를 이용한 PCR 결과 예상된 크기의 산물이 수득되었다. PCR 산물은 벡터 pCR(등록상표) 2.1-TOPO에 클로닝하고 서열분석하였다. 클로닝된 단편은 파라코커스속 균주 R114 DNA의 서던 분석에 프로브로서 사용하였으며 약 1.9 kb의 BamHI-NcoI 단편에 하이브리드화되는 것으로 밝혀졌다. 파라코커스속 균주 R114 DNA는 BamHI 및 NcoI으로 절단하고 단편들은 아가로스 겔 전기영동으로 분리하였다. 1.5 내지 2.1 kb 사이의 영역을 단리하고 클로닝 벡터의 BamHI 및 NcoI 부위에 클로닝하였다. 이어서, 프로브로서 ispA-PCR 단편을 사용하여 상기 부분 라이브러리를 검색하고, 두 개의 양성 클론을 단리하였다. 서열분석 결과 두 클론의 플라스미드 모두 ispA 유전자를 함유한 것으로 확인되었다. ispA의 상위(서열번호: 159)는 엑소뉴클레아제 VII, XseB(서열번호: 158)의 작은 소단위에 대한 유전자이고, 하위는 1-데옥시자일룰로즈-5-포스페이트 신타제를 암호화하는 dxs 유전자(서열번호: 160)이다. 이것은 이. 콜라이에서 발견된 것과 동일한 유전자 배열이다. NcoI-BamHI의 서열은 서열번호: 157로 예시되어 있으며, XseB, IspA 및 Dxs의 아미노산 서열은 각각 서열번호: 158, 서열번호: 159 및 서열번호: 160으로 나타내었다. ispA의 개시 코돈은 천연 IspA의 아미노-말단에서 각각 2 또는 1개의 메티오닌 잔기를 야기하는 GTG 또는 ATG일 수 있다.
실시예 5 내지 7에 기술된 동일한 일반 클로닝 방법을 이용하여, 천연 숙주 파라코커스속 균주 R114에서 ispA 유전자를 과발현시키도록 새로운 플라스미드 pBBR-tK-PcrtE-ispA-2를 구축하였다. 플라스미드는 전기천공에 의해 균주 R114에 도입하였으며, 형질전환체는 PCR로 확인하였다. 3개의 대표적인 형질전환체 및 대 조 균주(R114/pBBR-K)를 362F/2 배지(실시예 11)에서 성장시키고, 조 추출물을 제조하고 실시예 1에 기술된 방법에 따라 ispA 유전자 산물인 FPP 신타제의 활성을 분석하였다. R114/pBBR-K에서의 기본(염색체에 의해 암호화된) FPP 신타제 비활성은 62.6 U/mg이었다. 3개 형질전환체에서의 FPP 신타제 활성은 108.3 U/mg(73% 증가), 98.5 U/mg(57% 증가) 및 83.8 U/mg(34% 증가)로서, 파라코커스속 균주 R114에서 ispA 유전자의 과발현 및 활성 형태의 그의 산물인 FPP 신타제의 과발현을 입증하였다.
실시예 10:
파라코커스
속 균주 R114로부터 아세틸-CoA 아세틸트랜스퍼라제를 암호화하는 유전자의 클로닝 및 서열분석
IPP 생합성에서 첫 번째 수행 단계는 아세틸-CoA 및 아세토아세틸-CoA를 HMG-CoA 신타제에 의해 하이드록시메틸글루타릴-CoA(HMG-CoA)로 축합시키는 것이다. 기질 아세토아세틸-CoA는 효소 아세틸-CoA 아세틸트랜스퍼라제(아세토아세틸-CoA 티올라제 또는 β-케토티올라제로도 알려져 있음)에 의해 두 분자의 아세틸-CoA의 축합에 의해 생성된다. 상기 반응은 중심 대사(아세틸-CoA에서)를 메발로네이트 경로를 통한 이소프레노이드 생합성으로 연결시키기 때문에, 유전자 증폭에 의한 아세틸-CoA 아세틸트랜스퍼라제의 활성 증가는 생체내에서 카로티노이드 및 기타 이소프레노이드로의 탄소 흐름을 증가시킬 가능성을 갖는다. 파라코커스속 균주 R114에는, 아세틸-CoA 아세틸트랜스퍼라제를 암호화하는 2개 이상의 유전자, atoB 및 phaA가 존재한다. atoB 유전자의 말단은 파라코커스속 균주 R1534(US 6,087,152) 및 R114(본 발명)에서 crtE의 개시부의 165개 뉴클레오타이드 상위이다. atoB 유전자의 뉴클레오타이드 서열 및 파라코커스속 균주 R1534로부터 암호화된 아세틸-CoA 아세틸트랜스퍼라제의 상응하는 아미노산 서열은 각각 서열번호: 175 및 서열번호: 176으로 예시되었다.
실시예 5에 기술된 바와 동일한 일반적 방법을 이용하여, atoB 유전자를 플라스미드 pDS 및 pDS-His에 클로닝하였다. 새로운 플라스미드 pDS-atoB 및 pDS-His-atoB를 이. 콜라이 균주 M15에 도입하였다. 생성된 균주 M15/pDS-atoB 및 M15/pDS-His-atoB를 IPTG 유도하에 및 부재하에(실시예 5에 기술된 바와 같이) 성장시키고, 아세틸-CoA 아세틸트랜스퍼라제 분석(사용된 방법은 실시예 1에서 기술하였다) 및 SDS-PAGE 분석을 위해 조 추출물을 제조하였다. M15/pDS-atoB 및 M15/pDS-His-atoB(IPTG 유도하에)의 추출물중 아세틸-CoA 아세틸트랜스퍼라제 비활 성은 각각 0.2 U/mg 및 13.52 U/mg이었다. 플라스미드를 함유하지 않은 이. 콜라이에서 측정된 기본 활성은 0.006 U/mg이었다. IPTG 유도시, atoB 유전자 산물인 아세틸-CoA 아세틸트랜스퍼라제는 이. 콜라이 M15에서 과생산된다. 천연 (M15/pDS-atoB) 및 His-부가된 (M15/pDS/his-atoB) 형태 둘 다 과생산되었다. 과생산 정도는 M15/pDS-His-atoB에서 훨씬 더 높아, 두 균주의 (유도된) 추출물에서 측정된 아세틸-CoA 아세틸트랜스퍼라제 활성과 일치하였다.
아세토아세틸-CoA는 또한 폴리하이드록시알카노에이트(PHA) 생합성에서 첫 번째 수행 단계의 기질이다. 많은 세균에서, PHA 생합성에 수반되는 유전자들은 오페론에서 무리를 이룬다[Madison and Huisman, Microbiol. Mol. Biol. Rev., 63:21-53, 1999]. 파라코커스 데니트리피칸스에서, 각각 아세틸-CoA 아세틸트랜스퍼라제 및 아세토아세틸-CoA 리덕타제를 암호화하는 phaA 및 phaB 유전자는 오페론에서 집단화되는 반면[Yabutani et al., FEMS Microbiol. Lett., 133:85-90, 1995], 상기 경로의 마지막 효소 폴리(3-하이드록시알카노에이트) 신타제를 암호화하는 유전자 phaC는 상기 오페론의 일부가 아니다[Ueda et al., J. Bacteriol., 178:774-779, 1995]. 파라코커스속 균주 R1534로부터의 phaA 및 파라코커스속 균주 R114로부터의 phaC의 일부를 함유하는 PCR 단편들을 파라코커스 데니트리피칸스 phaA 및 phaC 유전자 서열을 기초로 하는 프라이머를 사용하여 수득하였다. 이어서, PCR 단편들을 파라코커스속 균주 R114 λ-라이브러리(실시예 4 참조)를 검색하기 위한 프로브로 사용하였다. phaA 및 phaC 프로브와 하이브리드화되는 여러개의 λ-클론을 단리하고, 삽입물 중 phaA 및 phaC 유전자의 존재를 서열 분석에 의해 확인하였다. 서브클로닝 및 서열분석에 의해 3개의 phaA λ-클론을 추가로 분석하였는데, 이때 phaB는 phaA의 하위에서 발견되었다. 그러므로, 파라코커스 데니트리피칸스의 경우에서와 같이, phaA 및 phaB 유전자는 무리를 이루는 반면, phaC 유전자는 게놈의 어느 곳에나 위치한다. 파라코커스속 균주 R114로부터의 phaAB 유전자집단의 뉴클레오타이드 서열 및 아세틸-CoA 아세틸트랜스퍼라제(PhaA)의 추정 아미노산 서열은 각각 서열번호: 177 및 서열번호: 178 및 179로 나타내었다. 오페론에서 PHA 생합성에 수반되는 유전자들의 집단화는, 세포가 폴리(3-하이드록시알카노에이트)를 생산하는 경우 적어도 phaA 및 phaB가 함께 발현됨을 시사한다. 다른 한편으로, 추정 전사 정지 신호는 파라코커스 데니트리피칸스 phaAB 오페론에서는 존재하지 않는, 파라코커스속 균주 R114로부터의 phaA 및 phaB 유전자 사이에서 발견된다[Yabutani et al., FEMS Microbiol. Lett., 133:85-90, 1995]. 따라서, 두 유전자의 발현은 파라코커스속 균주 R114에서는 연계되지 않을 수도 있다.
실시예 5에서 기술한 바와 동일한 일반적 방법을 이용하여, phaA 유전자를 플라스미드 pDS-His에 클로닝하였다. 새로운 플라스미드 pDS-His-phaA를 이. 콜라이 균주 M15에 도입하였다. 생성된 균주 M15/pDS-His-phaA를 IPTG 유도하에 및 부재하에 성장시키고(실시예 5에 기술된 바와 같이), SDS-PAGE 분석을 위해 조 추출물을 제조하였다. 클로닝된 His-부가된 파라코커스속 균주 R114 PhaA(아세틸-CoA 아세틸트랜스퍼라제)는 이. 콜라이 M15 숙주에서 IPTG 유도시 과생산된다.
제아잔틴 생산에 대한, 아세틸-CoA 아세틸트랜스퍼라제를 암호화하는 atoB 또는 phaA 유전자를 증폭시키는 잠재적인 이점을 상기에서 언급하였다. 또한, 생 체내에서 형성된 아세토아세틸-CoA의 일부가 PHA 경로로 전환되는 것을 배제하기 위해 아세토아세틸-CoA 리덕타제(phaB 유전자 산물)의 활성을 감소 또는 제거시키는 것이 제아잔틴 생산에 유리할 수 있다. phaB 활성이 결여된 파라코커스속 균주 R114의 돌연변이체는 유전자 치환 기술(구체적으로 염색체 중의 야생형 phaB 유전자를 상기 유전자의 불활성 형태로 치환시킴) 또는 고전적인 돌연변이유발 및 선별에 의해 수득할 수 있다.
실시예 11:
파라코커스
속 균주 R114로부터 유도된 돌연변이체를 이용한 라이코펜의 산업적 생산 방법
라이코펜은 균주 R-1512 및 그의 돌연변이 유도체 R1534 및 R114로 나타내는 새로운 파라코커스 종에서 제아잔틴 생합성의 중간체인 적색 카로티노이드이다. 라이코펜 자체로 상당한 상업적 잠재성을 가지기 때문에, 산업적 발효에 의해 라이코펜을 생산하는 새로운 파라코커스 종의 잠재력을 시험하는 것이 관건이었다. 라이코펜을 축적하는 제아잔틴 생합성이 차단된 돌연변이체를 수득하기 위해, 파라코커스속 균주 R114를 자외선(UV)으로 돌연변이유발한 후 적색 콜로니를 선별하였다. UV 돌연변이유발은 다음과 같이 수행하였다. 균주 R114를 밤새 배양한 배양액을 ME 배지(실시예 2 참조)에서 성장시켰다. 밤새 배양한 배양액을 새로운 ME 배지에 계대배양(초기 OD610=0.1)시키고 28 ℃에서 3 시간동안 배양하였다. 상기 배양액 분취량을 원심분리하고 펠릿을 20 mM 인산 칼륨 완충액(pH 7.2)으로 세척하였다. 두 번째 원심분리 후에, 펠릿을 0.1의 최종 OD610으로 재현탁시켰다. 세포 현탁액 의 10 ml 분취량을 멸균 100-ml 유리 비커에 넣었다. 세포 현탁액의 박층에 예정된 최적 시간동안 1450 μW/cm2의 플럭스로 UV 광선을 조사하였다. 조사하는 동안 비이커내에 종이 클립 및 자기 교반기를 사용하여 세포 현탁액을 혼합하였다. 돌연변이유발된 세포 현탁액(및 돌연변이유발되지 않은 대조군)을 362/F2 아가 배지(표 28) 위에 놓았다. 돌연변이유발 전후에 삼중의 생존 플레이트 계수(침침한 실내 불빛에서)를 행하였다. 플레이트를 28 ℃에서 4 내지 5 일간 배양하고 콜로니의 스코어를 매겼다. 여러 적색 콜로니(추정상의 라이코펜 생산체)를 확인하고 재-도말에 의해 정제하였다. UV7-1로 지정된 하나의 돌연변이체를 라이코펜 생산에 대해 더 평가하였다.
표 29는 대조 균주 R114 및 그의 돌연변이 유도체 UV7-1에 의한 제아잔틴 생산 및 라이코펜 생산을 나타낸 것이다. 균주 R114는 제아잔틴 만을 생산하였다. 돌연변이체 UV7-1은 주로 라이코펜을 생산하였지만, 잔류량의 제아잔틴도 또한 생산하여 UV7-1에서(추정상 crtY 유전자에서) 돌연변이가능한 블록이 완전하지 못함을 시사한다. 이러한 결과는 파라코커스속 균주 R114로부터 라이코펜 생성 균주를 유도할 수 있음을 보여준다.
실시예 12:
파라코커스
속 균주 R114로부터 유도된 균주를 이용한 발효에 의한 아스타잔틴의 산업적 생산 모델
아스타잔틴은 수중배양 산업에서 주로 이용되는 상업적으로 중요한 카로티노이드이다. EP 872,554 호는 파라코커스속 균주 R1534 및 파라코커스 카로티니파시엔스 E-396T로부터 클로닝된 카로티노이드(crt) 유전자들의 조합을 함유하는 플라스미드를 도입함으로써 이. 콜라이에서 아스타잔틴을 생산할 수 있었음을 밝혔다. 클로닝된 crt 유전자(crtEBIYZ) 및 crtW(β-카로틴 β-4 옥시게나제)는 함께 FPP로부터 제아잔틴을 통해 아스타잔틴으로의 전체 생합성 경로를 암호화하였다. 파라코커스 카로티니파시엔스 E-396 crtW, 파라코커스속 R1534 crtZ 및 파라코커스속 R1534 crtE 유전자의 서열 및 암호화된 폴리펩타이드를 서열번호: 180 및 181(crtW); 182 및 184(crtZ); 및 184 및 185(crtE)로 나타내었다. 그러나, 파라코커스속 균주 R114 숙주 부류에서 아스타잔틴을 생산할 수 있었는지는 밝히지 않았다. 아스타잔틴 생산에 대한 균주 R114로부터 유도된 재조합 균주의 유용성을 입증하기 위해, 클로닝된 crtW 유전자(서열번호: 180)를 다음과 같이 균주 R114에 도입하였다.
프라이머 crtW-Nde 및 crtW-Bam(표 30)을 이용하여 파라코커스 카로티니파시엔스 균주 E-396T(문헌 [Tsubokura et al., Int. J. Syst. Bacteriol., 49:277-282, 1999]; EP 872,554 호)의 클로닝된 crt 유전자집단으로부터 PCR에 의해 crtW 유전자를 증폭시켰다. 프라이머는, ATG 개시 코돈이 NdeI 부위(절단 인지 부위 CATATG)의 두 번째 절반을 구성하고 BamHI 부위(GGATCC)가 정지 코돈 바로 다음에 도입되도록 설계한다. PCR 산물을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하여 플라스미드 TOPO-crtW를 수득하였다. crtW 유전자를 NdeI 및 BamHI으로 절단하고 NdeI-BamHI 절단 벡터 pBBR-K-PcrtE(실시예 6에서 기술)에 서브클로닝하여 플라스미드 pBBR-K-PcrtE-crtW를 생성하였다.
플라스미드 pBBR-K-PcrtE-crtW를 표준 세균 접합 절차를 이용하여 파라코커스속 균주 R114로 전이시켰다(이. 콜라이 균주 S17[Priefer et al., J. Bacteriol., 163:324-330, 1985]이 공여 유기체였다). 50 mg/l 카나마이신을 함유하는 배지 362F/2 아가(표 28) 상에서 접합완료체를 선별하고 동일 배지상에 재도말하여 정제하였다. 균주내에 플라스미드 pBBR-K-PcrtE-crtW의 존재는 PCR로 확인하였다. 균주 R114(숙주 대조군), R114/pBBR-K(빈 벡터 대조군) 및 R114/pBBR-K-PcrtE-crtW에 의한 카로티노이드 생산은 ME 배지 대신 액체 362F/2 배지를 사용하는 것을 제외하고 실시예 1 및 2에 기술된 바와 같이 진탕 플라스크 배양액 중에서 측정하였다. 이 결과를 표 31에 나타내었다. 대조 균주 R114 및 R114/pBBR-K는 제아잔틴 만을 생산하였다. 균주 R114/pBBR-K-PcrtE-crtW에서, 제아잔틴은 플라스 미드-암호화된 β-카로틴 β-4 옥시게나제에 의해 완전히 소비되었다. 그러나, 아스타잔틴이 생산되었음에도 불구하고, 다른 두 케토카로티노이드, 아도니잔틴 및 칸타잔틴이 높은 수준으로 축적되었다. 이것은 β-카로틴 하이드록실라제(균주 R114에서 염색체 crtZ 유전자에 의해 암호화됨) 및 클로닝된 β 카로틴 β-4-옥시게나제(CrtW)의 생체내 불균형을 보여준다.
상기 가설을 시험하기 위해, crtZ 및 crtW 유전자를 미니-오페론에 함께 함유하는 두 개의 새로운 플라스미드를 제작하였다. crtZ 및 crtW 유전자의 발현 비를 상이하게 하기 위해 두 구성물(즉, crtZ-crtW 및 crtW-crtZ)에서 유전자의 순서를 상이하게 하였다. 새로운 플라스미드 제작에는 다음과 같이 특정 클로닝 벡터 조합의 구성이 필요하였다. 유전자들(이 경우에는, crtZ 및 crtW)을 오페론으로 구성하는 것을 촉진하기 위해 일련의 오페론 구성 벡터(벡터 pCR(등록상표) 2.1-TOPO를 기초로 함)를 설계하였다. 해당 유전자는 NdeI 부위(CATATG)에 포함된 ATG 개시 코돈, 및 TGA 정지 코돈 바로 다음에 BamHI 부위를 가져야 한다.
또한, 개시 코돈 다음의 첫 번째 뉴클레오타이드와 정지 코돈 이전의 마지막 뉴클레오타이드는 아데닌이어야 하며, 유전자는 효소 BsgI, BseMII, BseRI 및 Gsu
I 중 하나 이상에 대한 부위가 결여되어야 한다. 그들의 폴리링커 서열(서열번호: 190 내지 197)의 배열이 상이한 4개의 오페론 구성 벡터를 구축하였다. 첫 번째 두 효소의 절단 부위는 NdeI 부위 내에 존재한다. 마지막 두 효소의 절단 부위는 BamHI 부위 앞에 존재한다. pOCV-1 및 pOCV-4에서의 BseRI 부위는 유일하지 않으 며 오페론 구성에 사용할 수 없다.
오페론으로 구성될 유전자는 먼저 적절한 오페론 구성 벡터의 NdeI 및BamHI 부위 사이에 개별적으로 삽입한다. 이어서, 계획된 오페론의 상위 유전자를 갖는 생성된 플라스미드를 폴리링커의 말단에 있는 두 효소들 중 한 효소 및 벡터 주쇄내에 특정 부위를 갖는 효소로 절단한다. 계획된 오페론의 하위 유전자를 함유하는 플라스미드는 폴리링커의 처음 두 효소중 한 효소 및 첫 번째 플라스미드(목적하는 상위 유전자 함유)에 사용된 것과 동일한 효소(벡터 주쇄에 특정 부위를 가짐)로 절단한다. 유전자를 갖는 단편들을 단리하고 접합하여 NdeI과 BamHI 부위 사이에 두 유전자를 모두 갖는 pOCV 플라스미드를 수득한다. 더 많은 유전자를 유사한 방식으로 부가할 수 있다. 구성된 유전자는 상위 유전자의 TGA 정지 코돈의 처음 두 뉴클레오타이드 TG가 하위 유전자의 ATG 개시 코돈의 마지막 두 뉴클레오타이드와 일치하도록 중복된다. 동일한 중복은 파라코커스속 균주 R1534에서의 카로티노이드(crt) 오페론(crtZYIB) 내의 모든 유전자 사이에서 발견된다[Pasamontes et al., Gene, 185:35-41, 1997].
pOCV 주쇄는 pCR(등록상표) 2.1-TOPO로부터 유도된다. ColE1 기점의 상위의, 복제에 필수적인 영역에서의 BseMII 부위를, 상기 부위를 CTCAC를 CACAG로 변화시키는 부위 지향 돌연변이유발에 의해 제거하였다. 남은 3개의 BseMII 부위 및 하나의 GsuI 부위는 0.8 kb DdeI-Asp700 단편을 제거함으로써 배제시켰다. 남은 벡터는 DdeI 오목한 말단의 삽입 다음에 평활-말단 접합되었다. 폴리링커는 적절한 5' 돌출부를 갖는 어닐링된 올리고뉴클레오타이드를 사용하여 BamHI과 XbaI 부 위 사이에 삽입시켰다.
플라스미드 pBBR-K-PcrtE-crtZW는 다음과 같이 오페론 구성 벡터 pOCV-2를 이용하여 제작하였다. 프라이머 crtZ-Nde 및 crtZ-Bam(표 30)을 이용하여 파라코커스속 균주 R114로부터 PCR에 의해 crtZ 유전자를 증폭시켰다. 프라이머는, ATG 개시 코돈이 NdeI 부위(절단 인지 부위 CATATG)의 두 번째 절반을 구성하고 BamHI 부위(GGATCC)가 정지 코돈 바로 다음에 도입되도록 설계하였다. PCR 산물을 pCR(등록상표) 2.1-TOPO 벡터에 클로닝하여 플라스미드 TOPO-crtZ를 수득하였다. 미니-오페론에 두 유전자를 구성하기 위해, 두 유전자 crtZ 및 crtW를 모두 플라스미드 TOPO-crtZ 및 TOPO-crtW로부터 NdeI 및 BamHI로 절단하고, NdeI-
BamHI 절단 벡터 pOCV-2에 서브클로닝하여 플라스미드 pOCV-2-crtZ 및 pOCV-2-crtW를 제조하였다. 플라스미드 pOCV-2-crtZ를 BseMII 및 PstI(카나마이신 내성 유전자에는 특이적 PstI 부위가 존재한다)으로 절단하고, 2.4 kb 단편(crtZ 함유)을 pOCV-2-crtW로부터 crtW-함유 1876 bp BseRI-PstI 단편과 접합시켰다. 생성된 플라스미드 pOCV-2-crtZW를 NdeI 및 BamHI으로 절단하고, crtZW 단편을 pBBR-K-PcrtE의
NdeI-BamHI 주쇄와 접합하여 pBBR-K-PcrtE-crtZW를 수득하였다. 플라스미드 pBBR-K-PcrtE-crtWZ를 유사한 방식으로 제작하였다.
표 31의 데이터는 아도니잔틴, 칸타잔틴 및 아스타잔틴의 비가 균주 pBBR-K-PcrtE-crtW에 비해 균주 R114/pBBR-K-PcrtE-crtWZ에서 감지할 수 있을 정도로 변하지 않았음을 보여준다. 그러나, 균주 pBBR-K-PcrtE-crtWZ에서, 케토카로티노이드의 생산은 아스타잔틴에 유리하게 변화되었다. 이 결과는 발현 수준이 미니-오페 론 내의 유전자 위치에 따라 달라짐을 나타내며, β-카로틴 하이드록실라제 활성의 생체내 수준을 증가시키면 상기 효소와 제아잔티을 아스타잔틴으로 완전히 전환시키는데 보다 유리한 β-카로틴 β-4 옥시게나제의 활성간에 균형이 이루어짐을 시사한다.
본 실시예에 기술된 결과는 또한 적절한 유전 공학처리를 통해 아스타잔틴 뿐 아니라 파라코커스속 균주 R114 또는 그의 관련 균주에서 상업적으로 중요한 다른 케토카로티노이드를 생산하는 것이 가능함을 보여준다. 예를 들면, 균주 R114(β-카로틴 하이드록실라제 활성이 결여됨)의 crtZ 돌연변이체 중의 β-카로틴 β-4 옥시게나제를 암호화하는 유전자의 발현은 하이드록실화 카로티노이드를 동시-생산하지 않으면서 오직 케토카로티노이드, 예를 들어, 에키네논 또는 칸타잔틴의 생성을 제공한다. 본 실시예 및 실시예 11에 나타낸 결과들은 함께 산업적으로 중요한 카로티노이드를 생성하는 파라코커스속 균주 R114 및 그의 관련 균주의 광범위한 유용성을 보여준다.
실시예 13: 메발로네이트 경로의 유전자를 과발현하는
파라코커스
속 균주 R114의 배양액 중 메발로네이트의 축적
파라코커스속 균주 R114에서 메발로네이트 경로의 유전자들의 과발현은 메발로네이트 경로를 통한 증가된 탄소 흐름을 유도한다. 플라스미드 pBBR-K-mev-op16-2의 제작은 실시예 5에서 기술하였다. 플라스미드 pBBR-K-mev-op-up-4는 다음과 같이 제작하였다. 파라코커스속 균주 R114 메발로네이트 오페론을 함유하는 λ-클론(실시예 4 참조)의 부분 절단 후에 3.1 kb SmaI-SalI 단편 상에 mvaA 유전 자의 대부분 및 전체 idi 및 hcs 유전자를 함유하는 DNA 단편을 수득하였다. 상기 단편을 pUC19에 서브클로닝하여 플라스미드 pUC19mev-op-up'를 수득하였다. 서브클로닝을 촉진하기 위해, 메발로네이트 유전자를 함유하는 pUC19mev-op-up'의 KpnI-HindIII 단편을 벡터 pBluescriptKS+에 재클로닝하여 플라스미드 pBluKSp-mev-op-up'를 수득하였다. 이어서, pUC19mev-op-up'로부터 1.7 kb의 SalI 단편을, 파라코커스속 균주 R114로부터 클로닝된 SalI-EcoRI 단편을 함유하는 pUC19-유래 플라스미드(실시예 4 참조)인 플라스미드 2ES2-1의 SalI 부위에 클로닝하였다. 이로써 플라스미드 pUC19mev-op-up-2가 생성되었다. 이어서, 메발로네이트 오페론의 개시부를 갖는 pUC19mev-op-up-2로부터의 BbsI-BsaI 단편을 idi 및 hcs를 함유하는 pBluKSp-mev-op-up'로부터의 BbsI-BsaI 단편과 결합시켜 플라스미드 pUC-mev-op-up-3을 수득하였다. 별도로, MluI 제한효소 부위를 함유하는 어닐링된 프라이머를 삽입함으로써 벡터 pBBR1MCS-2(실시예 5 참조)의 NsiI 및 KpnI 부위 사이에 단일 MluI 부위를 도입하였다. 생성된 새로운 클로닝 벡터 pBBR-K-Mlu를 MluI 및 KpnI으로 절단하고, 메발로네이트 오페론의 처음 3개 유전자를 함유하는 pUCmev-op-up-3으로부터의 MluI-KpnI 단편을 삽입하여 플라스미드 pBBR-K-mev-op-up-3을 수득하였다. 그 다음, mvk 유전자의 대부분 및 pmk의 5' 말단을 함유하는 플라스미드 16SB3(플라스미드 16SB3은 파라코커스속 균주 R114 SalI-BamHI 단편 A를 함유하는 pUC19-유래 플라스미드이다; 실시예 4 참조)으로부터의 SmaI 단편을 삽입하여 플라스미드 pBBR-K-mev-op-up-4를 제작하였다. 플라스미드 pBBR-K-mev-op-up-4의 삽입 물은 추정 메발로네이트 오페론 프로모터 영역, 메발로네이트 오페론의 처음 4개 유전자 및 pmk의 5' 말단을 함유한다.
플라스미드 pBBR-K-mev-op16-2 및 pBBR-K-mev-op-up-4를 각각 전기천공에 의해 파라코커스속 균주 R114에 도입하였다. 새로운 균주에 의한 제아잔틴 및 메발로네이트의 생산을 대조 균주 R114와 비교하였다. 균주는 액체 배지 362F/2(실시예 11 참조)에서 배플 진탕 플라스크에서 72 시간동안 성장시켰다. 균주 R114/pBBR-K-mev-op16-2 및 R114/pBBR-K-mev-op-up-4의 경우, 카나마이신(50 mg/l)을 또한 배양액에 가하였다. 배양 온도는 28 ℃이었고, 진탕은 200 rpm으로 수행하였다. 제아잔틴은 실시예 1에 나타낸 방법으로 측정한 반면, 배양 상등액 중의 메발로네이트는 다음과 같이 측정하였다: 0.6 ml의 배양액 샘플을 13,000xg에서 4 분간 원심분리하였다. 400 μl의 상등액을 400 μl의 메탄올에 가하고 1 분간 볼텍싱하여 혼합하였다. 혼합물을 13,000xg에서 4 분간 원심분리하였다. 그 다음, 생성된 상등액을 린드만(Lindemann) 등의 방법[J. Pharm. Biomed. Anal., 9:311-316, 1991]을 이용하여 다음과 같은 약간의 변형하에 기체 크로마토그래피(GC)로 직접 분석하였다. GC는 쿨-온-컬럼 주입기 및 화염 이온화 검출기가 장착된 휴렛-팩커드(Hewlett-Packard) 6890플러스 기기(미국 펜실바니아주 에이븐데일 소재의 휴렛-팩커드)이었다. 전술한 바와 같이 제조된 1 μl의 샘플을 가교결합된 변형 폴리에틸렌 글리콜(HP-FFAP, 미국 에이질런트 테크놀로지(Agilent Technologies))의 0.52 μ 필름으로 코팅된 융합 실리카 모세관 컬럼(15 m 길이 x 0.32 mm 내경) 위에 주입하였다. 0.6 바의 유입 압력에서 운반 기체로 헬륨을 사용하였다. 프로 그램가능 주입기의 온도는 30 ℃/분의 속도로 82 ℃에서 250 ℃로 상승시켰다. 컬럼 온도 프로필은 0.5 분간 80 ℃에 이어, 15 ℃/분에서 선형 온도 구배로 250 ℃로 상승시키고 최종적으로 250 ℃에서 5 분간 유지하였다. 검출기 온도는 320 ℃로 유지하였다.
첫 번째 실험에서, 제아잔틴 및 메발로네이트 생성은 균주 R114 및 R114/pBBR-K-mev-op16-2(표 32)에서 측정하였다. 두 균주 모두 유사한 양의 제아잔틴을 생산하였지만, 균주 R114/pBBR-K-mev-op16-2는 4배 더 높은 수준의 메발로네이트를 생산하였다. 이러한 결과는 파라코커스속 균주 R114에서 메발로네이트 경로의 유전자들의 과발현이 메발로네이트 경로를 통한 증가된 탄소 흐름을 야기함을 보여준다. 균주 R114/pBBR-K-mev-op16-2는 과발현된 crtE 유전자를 갖지 않으므로 메발로네이트의 축적은 예상되었으며, crtE 유전자 산물(GGPP 신타제)은 파라코커스속 균주 R114에서의 제아잔틴 생산에 있어 제한 단계인 것으로 알려져 있다(실시예 6 및 8 참조). 제한된 양의 GGPP 신타제를 갖는 세포는, 메발로네이트 경로의 효소들의 과잉생산시, FPP를 축적할 것으로 예상되며, FPP는 메발로네이트 키나제의 유효한 억제제인 것으로 공지되어 있다[Dorsey and Porter, J. Biol. Chem., 243:4667-4670, 1968; Gray and Kekwick, BBA, 279:290-296, 1972; Hinson et al., J. Lipids Res., 38:2216-2223, 1997]. 그러므로, 메발로네이트 경로의 유전자들의 과발현에서 비롯되는 FPP의 축적은 메발로네이트 키나제의 저해를 야기하고, 이것은 차례로 배양액 중 메발로네이트 축적으로 나타난다.
두 번째 실험에서는, 제아잔틴 및 메발로네이트 생성을 균주 R114 및 R114/pBBR-K-mev-op-up-4의 두 개의 독립적인 단리물에서 측정하였다(표 33). 이 결과는 또한 메발로네이트 경로 유전자의 과발현이 메발로네이트 경로를 통한 탄소 흐름을 증가시킴을 보여준다.
하기의 생물 물질은 미국 버지니아주 매너새스 10801 유니버시티 블러바드 소재의 미국 종균 협회(American Type Culture Collection, ATCC)에 부다페스트 조약(Budapest Treaty)에 의거하여 기탁하였으며 하기의 기탁 번호를 지정받았다:
상기에서 인용된 모든 특허, 특허출원 및 출판물은 본원에 전체로 인용되듯이 그 전체가 본원에 참고로 인용된다.
본 발명을 상기와 같이 기술하였지만, 본 발명은 많은 방식으로 변형될 수 있음은 명백할 것이다. 상기 변형은 본 발명의 진의 및 범위를 벗어나는 것으로 간주하지 않으며 상기 모든 변형은 하기의 청구의 범위의 범주내에 포함되는 것이다.
<110> Roche Vitamins AG
<120> Improved Isoprenoid Production
<130> 20918
<140> 10-2004-7015938
<141> 2003-12-06
<160> 197
<170> KopatentIn version 1.71
<210> 1
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(20)
<223> primer
<400> 1
agagtttgat cctggctcag 20
<210> 2
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (12)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(20)
<223> primer
<400> 2
ctggctcagg angaacgctg 20
<210> 3
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(20)
<223> primer
<400> 3
aaggaggtga tccagccgca 20
<210> 4
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(20)
<223> primer
<400> 4
ctcctacggg aggcagcagt 20
<210> 5
<211> 18
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(18)
<223> primer
<400> 5
cagcagccgc ggtaatac 18
<210> 6
<211> 19
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(19)
<223> primer
<400> 6
aactcaaagg aattgacgg 19
<210> 7
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(20)
<223> primer
<400> 7
agtcccgcaa cgagcgcaac 20
<210> 8
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(20)
<223> primer
<400> 8
gctacacacg tgctacaatg 20
<210> 9
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(20)
<223> primer
<400> 9
actgctgcct cccgtaggag 20
<210> 10
<211> 18
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(18)
<223> primer
<400> 10
gtattaccgc ggctgctg 18
<210> 11
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(20)
<223> primer
<400> 11
gttgcgctcg ttgcgggact 20
<210> 12
<211> 1404
<212> DNA
<213> Paracoccus sp.
<400> 12
gcggcaggct taacacatgc aagtcgagcg aggtcttcgg acctagcggc ggacgggtga 60
gtaacgcgtg ggaacgtgcc ctttgctacg gaatagtccc gggaaactgg gtttaatacc 120
gtatgtgccc tacgggggaa agatttatcg gcaaaggatc ggcccgcgtt ggattaggta 180
gttggtgggg taatggccta ccaagccgac gatccatagc tggtttgaga ggatgatcag 240
ccacactggg actgagacac ggcccagact cctacgggag gcagcagtgg ggaatcttag 300
acaatggggg caaccctgat ctagccatgc cgcgtgagtg atgaaggccc tagggttgta 360
aagctctttc agctgggaag ataatgacgg taccagcaga agaagccccg gctaactccg 420
tgccagcagc cgcggtaata cggagggggc tagcgttgtt cggaattact gggcgtaaag 480
cgcacgtagg cggactggaa agttgggggt gaaatcccgg ggctcaacct cggaactgcc 540
tccaaaacta tcagtctgga gttcgagaga ggtgagtgga ataccgagtg tagaggtgaa 600
attcgtagat attcggtgga acaccagtgg cgaaggcggc tcactggctc gatactgacg 660
ctgaggtgcg aaagcgtggg gagcaaacag gattagatac cctggtagtc cacgccgtaa 720
acgatgaatg ccagtcgtcg ggttgcatgc aattcggtga cacacctaac ggattaagca 780
ttccgcctgg ggagtacggt cgcaagatta aaactcaaag gaattgacgg gggcccgcac 840
aagcggtgga gcatgtggtt taattcgaag caacgcgcag aaccttacca acccttgaca 900
tccctggaca tcccgagaga tcgggctttc acttcggtga ccaggagaca ggtgctgcat 960
ggctgtcgtc agctcgtgtc gtgagatgtt cggttaagtc cggcaacgag cgcaacccac 1020
gtccctagtt gccagcattc agttgggcac tctatggaaa ctgccgatga taagtcggag 1080
gaaggtgtgg atgacgtcaa gtcctcatgg cccttacggg ttgggctaca cacgtgctac 1140
aatggtggtg acagtgggtt aatccccaaa agccatctca gttcggattg tcctctgcaa 1200
ctcgagggca tgaagttgga atcgctagta atcgcggaac agcatgccgc ggtgaatacg 1260
ttcccgggcc ttgtacacac cgcccgtcac accatgggag ttggttctac ccgacgacgc 1320
tgcgctaacc cttcggggag gcaggcggcc acggtaggat cagcgactgg ggtgaagtcg 1380
taacaaggta gccgtagggg aacc 1404
<210> 13
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(20)
<223> adaptor
<400> 13
tcgtagactg cgtacaggcc 20
<210> 14
<211> 14
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(14)
<223> adaptor
<400> 14
catctgacgc atgt 14
<210> 15
<211> 16
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(16)
<223> adaptor
<400> 15
gacgatgagt cctgac 16
<210> 16
<211> 14
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(14)
<223> adaptor
<400> 16
tactcaggac tggc 14
<210> 17
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(17)
<223> primer
<400> 17
gactgcgtac aggccca 17
<210> 18
<211> 18
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(18)
<223> primer
<400> 18
cgatgagtcc tgaccgaa 18
<210> 19
<211> 18
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(18)
<223> primer
<400> 19
cgatgagtcc tgaccgac 18
<210> 20
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(17)
<223> primer
<400> 20
gactgcgtac aggcccc 17
<210> 21
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(17)
<223> primer
<400> 21
gactgcgtac aggcccg 17
<210> 22
<211> 18
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(18)
<223> primer
<400> 22
cgatgagtcc tgaccgag 18
<210> 23
<211> 8
<212> PRT
<213> Artificial
<220>
<221> PEPTIDE
<222> (2)
<223> Xaa means Leu or Ile
<220>
<221> PEPTIDE
<222> (1)..(8)
<223> peptide 1
<400> 23
Ala Xaa Ile Lys Tyr Trp Gly Lys
1 5
<210> 24
<211> 27
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (3)
<223> n means C or G
<220>
<221> misc_feature
<222> (12)
<223> n means A or G
<220>
<221> misc_feature
<222> (15)
<223> n means C or T
<220>
<221> misc_feature
<222> (21)
<223> n means C or G or T
<220>
<221> misc_feature
<222> (24)
<223> n means A or G
<220>
<221> misc_feature
<222> (1)..(27)
<223> oligonucleotide
<400> 24
ccnctgatca antantgggg naanatc 27
<210> 25
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (3)
<223> n means C or G
<220>
<221> misc_feature
<222> (12)
<223> n means A or G
<220>
<221> misc_feature
<222> (15)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(20)
<223> oligonucleotide
<400> 25
gcnctgatca antantgggg 20
<210> 26
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (3)
<223> n means C or G
<220>
<221> misc_feature
<222> (12)
<223> n means A or G
<220>
<221> misc_feature
<222> (15)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(20)
<223> oligonucleotide
<400> 26
gcnatcatca antantgggg 20
<210> 27
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (6)
<223> n means A or G
<220>
<221> misc_feature
<222> (9)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(17)
<223> oligonucleotide
<400> 27
atcaantant ggggtaa 17
<210> 28
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (6)
<223> n means A or G
<220>
<221> misc_feature
<222> (9)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(17)
<223> oligonucleotide
<400> 28
atcaantant ggggcaa 17
<210> 29
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (6)
<223> n means A or G
<220>
<221> misc_feature
<222> (9)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(17)
<223> oligonucleotide
<400> 29
atcaantant gggggaa 17
<210> 30
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (6)
<223> n means A or G
<220>
<221> misc_feature
<222> (9)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(17)
<223> oligonucleotide
<400> 30
atcaantant ggggaaa 17
<210> 31
<211> 8
<212> PRT
<213> Artificial
<220>
<221> (null)
<222> (7)
<223> Xaa means Asn or Gln
<220>
<221> (null)
<222> (1)..(8)
<223> peptide 2
<400> 31
Thr Met Asp Ala Gly Pro Xaa Val
1 5
<210> 32
<211> 24
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (3)
<223> n means C or G
<220>
<221> misc_feature
<222> (9)
<223> n means C or T
<220>
<221> misc_feature
<222> (12)
<223> n means C or G
<220>
<221> misc_feature
<222> (15)
<223> n means C or G or T
<220>
<221> misc_feature
<222> (18)
<223> n means C or G
<220>
<221> misc_feature
<222> (21)
<223> n means C or T
<220>
<221> misc_feature
<222> (24)
<223> n means C or G
<220>
<221> misc_feature
<222> (1)..(24)
<223> oligonucleotide
<400> 32
acnatggang cnggnccnaa ngtn 24
<210> 33
<211> 24
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (3)
<223> n means C or G
<220>
<221> misc_feature
<222> (9)
<223> n means A or G
<220>
<221> misc_feature
<222> (12)
<223> n means A or G
<220>
<221> misc_feature
<222> (12)
<223> n means C or G
<220>
<221> misc_feature
<222> (15)
<223> n means A or C or G
<220>
<221> misc_feature
<222> (18)
<223> n means C or G
<220>
<221> misc_feature
<222> (21)
<223> n means A or G
<220>
<221> misc_feature
<222> (24)
<223> n means C or G
<220>
<221> misc_feature
<222> (1)..(24)
<223> oligonucleotide
<400> 33
tgntacctnc gnccnggntt ncan 24
<210> 34
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (12)
<223> n means C or G
<220>
<221> misc_feature
<222> (15)
<223> n means A or C or G
<220>
<221> misc_feature
<222> (1)..(17)
<223> oligonucleotide
<400> 34
tggtacctac gnccngg 17
<210> 35
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (12)
<223> n means C or G
<220>
<221> misc_feature
<222> (15)
<223> n means A or C or G
<220>
<221> misc_feature
<222> (1)..(17)
<223> oligonucleotide
<400> 35
tggtacctgc gnccngg 17
<210> 36
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (12)
<223> n means C or G
<220>
<221> misc_feature
<222> (1)..(17)
<223> oligonucleotide
<220>
<221> misc_feature
<222> (15)
<223> n means A or C or G
<400> 36
tgctacctac gnccngg 17
<210> 37
<211> 17
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (12)
<223> n means C or G
<220>
<221> misc_feature
<222> (15)
<223> n means A or C or G
<220>
<221> misc_feature
<222> (1)..(17)
<223> oligonucleotide
<400> 37
tgctacctgc gnccngg 17
<210> 38
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (9)
<223> n means C or G
<220>
<221> misc_feature
<222> (12)
<223> n means A or C or G
<220>
<221> misc_feature
<222> (15)
<223> n means C or G
<220>
<221> misc_feature
<222> (18)
<223> n means A or G
<220>
<221> misc_feature
<222> (1)..(20)
<223> oligonucleotide
<400> 38
tacctacgnc cnggnttnca 20
<210> 39
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (9)
<223> n means C or G
<220>
<221> misc_feature
<222> (12)
<223> n means A or C or G
<220>
<221> misc_feature
<222> (15)
<223> n means C or G
<220>
<221> misc_feature
<222> (18)
<223> n means A or G
<220>
<221> misc_feature
<222> (1)..(20)
<223> oligonucleotide
<400> 39
tacctgcgnc cnggnttnca 20
<210> 40
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (9)
<223> n means C or G
<220>
<221> misc_feature
<222> (12)
<223> n means A or C or G
<220>
<221> misc_feature
<222> (15)
<223> n means C or G
<220>
<221> misc_feature
<222> (18)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(20)
<223> oligonucleotide
<400> 40
tacctacgnc cnggngtnca 20
<210> 41
<211> 20
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (9)
<223> n means C or G
<220>
<221> misc_feature
<222> (12)
<223> n means A or C or G
<220>
<221> misc_feature
<222> (15)
<223> n means C or G
<220>
<221> misc_feature
<222> (18)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(20)
<223> oligonucleotide
<400> 41
tacctgcgnc cnggngtnca 20
<210> 42
<211> 9066
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (2622)..(3641)
<400> 42
ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60
cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120
cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180
acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240
tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300
cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360
tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420
tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480
attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540
atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600
cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660
atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720
gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780
tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840
cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900
tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960
catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020
tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080
cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140
gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200
gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260
ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320
gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380
atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440
gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500
atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560
catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620
cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680
tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740
gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800
gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860
ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920
acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980
acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040
cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100
tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160
ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220
acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280
gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340
ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400
acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460
tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520
gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580
tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca g atg att tcc 2630
Met Ile Ser
1
cat acc ccg gtg ccc acg caa tgg gtc ggc ccg atc ctg ttc cgc ggc 2678
His Thr Pro Val Pro Thr Gln Trp Val Gly Pro Ile Leu Phe Arg Gly
5 10 15
ccc gtc gtc gag ggc ccg atc agc gcg ccg ctg gcc acc tac gag acg 2726
Pro Val Val Glu Gly Pro Ile Ser Ala Pro Leu Ala Thr Tyr Glu Thr
20 25 30 35
ccg ctc tgg ccc tcg acc gcg cgg ggg gca ggg gtt tcc cgg cat tcg 2774
Pro Leu Trp Pro Ser Thr Ala Arg Gly Ala Gly Val Ser Arg His Ser
40 45 50
ggc ggg atc cag gtc tcg ctg gtc gac gaa cgc atg agc cgc tcg atc 2822
Gly Gly Ile Gln Val Ser Leu Val Asp Glu Arg Met Ser Arg Ser Ile
55 60 65
gcg ctg cgg gcg cat gac ggg gcg gcg gcg acc gcc gcc tgg cag tcg 2870
Ala Leu Arg Ala His Asp Gly Ala Ala Ala Thr Ala Ala Trp Gln Ser
70 75 80
atc aag gcc cgc cag gaa gag gtc gcg gcc gtg gtc gcc acc acc agc 2918
Ile Lys Ala Arg Gln Glu Glu Val Ala Ala Val Val Ala Thr Thr Ser
85 90 95
cgc ttc gcc cgc ctt gtc gag ctg aat cgc cag atc gtg ggc aac ctg 2966
Arg Phe Ala Arg Leu Val Glu Leu Asn Arg Gln Ile Val Gly Asn Leu
100 105 110 115
ctt tac atc cgc atc gaa tgc gtg acg ggc gac gcc tcg ggt cac aac 3014
Leu Tyr Ile Arg Ile Glu Cys Val Thr Gly Asp Ala Ser Gly His Asn
120 125 130
atg gtc acc aag gcc gcc gag gcc gtg cag ggc tgg atc ctg tcg gaa 3062
Met Val Thr Lys Ala Ala Glu Ala Val Gln Gly Trp Ile Leu Ser Glu
135 140 145
tac ccg atg ctg gcc tat tcc acg atc tcg ggg aac ctg tgc acc gac 3110
Tyr Pro Met Leu Ala Tyr Ser Thr Ile Ser Gly Asn Leu Cys Thr Asp
150 155 160
aag aag gcg tcg gcg gtc aac ggc atc ctg ggc cgc ggc aaa tac gcc 3158
Lys Lys Ala Ser Ala Val Asn Gly Ile Leu Gly Arg Gly Lys Tyr Ala
165 170 175
gtc gcc gag gtc gag atc ccg cgc aag atc ctg acc cgc gtg ctg cgc 3206
Val Ala Glu Val Glu Ile Pro Arg Lys Ile Leu Thr Arg Val Leu Arg
180 185 190 195
acc agc gcc gag aag atg gtc cgc ctg aac tac gag aag aac tat gtc 3254
Thr Ser Ala Glu Lys Met Val Arg Leu Asn Tyr Glu Lys Asn Tyr Val
200 205 210
ggg ggt acg ctg gcg ggg tcg ctg cgc agt gcg aac gcg cat ttc gcc 3302
Gly Gly Thr Leu Ala Gly Ser Leu Arg Ser Ala Asn Ala His Phe Ala
215 220 225
aac atg ctg ctg ggc ttc tac ctg gcg acg ggg cag gac gcg gcc aac 3350
Asn Met Leu Leu Gly Phe Tyr Leu Ala Thr Gly Gln Asp Ala Ala Asn
230 235 240
atc atc gag gcc agc cag ggc ttc gtc cat tgc gag gcc cgc ggc gag 3398
Ile Ile Glu Ala Ser Gln Gly Phe Val His Cys Glu Ala Arg Gly Glu
245 250 255
gat ctg tat ttc tcg tgc acg ctg ccc aac ctc atc atg ggc tcg gtc 3446
Asp Leu Tyr Phe Ser Cys Thr Leu Pro Asn Leu Ile Met Gly Ser Val
260 265 270 275
ggt gcc ggc aag ggc atc ccc tcg atc gag gag aac ctg tcg cgg atg 3494
Gly Ala Gly Lys Gly Ile Pro Ser Ile Glu Glu Asn Leu Ser Arg Met
280 285 290
ggc tgc cgc cag ccg ggc gaa ccc ggc gac aac gcg cgc cgt ctt gcg 3542
Gly Cys Arg Gln Pro Gly Glu Pro Gly Asp Asn Ala Arg Arg Leu Ala
295 300 305
gcg atc tgc gcg ggc gtc gtg ctg tgt ggt gaa ttg tcg ctg ctt gcg 3590
Ala Ile Cys Ala Gly Val Val Leu Cys Gly Glu Leu Ser Leu Leu Ala
310 315 320
gcc cag acc aac ccc gga gag ttg gtc cgc acc cac atg gag atg gag 3638
Ala Gln Thr Asn Pro Gly Glu Leu Val Arg Thr His Met Glu Met Glu
325 330 335
cga tgaccgaca gcaaggatca ccatgtcgcg gggcgcaagc tggaccatct 3690
Arg
340
gcgtgcattg gacgacgatg cggatatcga ccggggcgac agcggcttcg accgcatcgc 3750
gctgacccat cgcgccctgc ccgaggtgga tttcgacgcc atcgacacgg cgaccagctt 3810
cctgggccgt gaactgtcct tcccgctgct gatctcgtcc atgaccggcg gcaccggcga 3870
ggagatcgag cgcatcaacc gcaacctggc cgctggtgcc gaggaggccc gcgtcgccat 3930
ggcggtgggc tcgcagcgcg tgatgttcac cgacccctcg gcgcgggcca gcttcgacct 3990
gcgcgcccat gcgcccaccg tgccgctgct ggccaatatc ggcgcggtgc agctgaacat 4050
ggggctgggg ctgaaggaat gcctggccgc gatcgaggtg ctgcaggcgg acggcctgta 4110
tctgcacctg aaccccctgc aagaggccgt ccagcccgag ggggatcgcg actttgccga 4170
tctgggcagc aagatcgcgg ccatcgcccg cgacgttccc gtgcccgtcc tgctgaagga 4230
ggtgggctgc ggcctgtcgg cggccgatat cgccatcggg ctgcgcgccg ggatccggca 4290
tttcgacgtg gccggtcgcg gcggcacatc ctggagccgg atcgagtatc gccgccgcca 4350
gcgggccgat gacgacctgg gcctggtctt ccaggactgg ggcctgcaga ccgtggacgc 4410
cctgcgcgag gcgcggcccg cgcttgcggc ccatgatgga accagcgtgc tgatcgccag 4470
cggcggcatc cgcaacggtg tcgacatggc gaaatgcgtc atcctggggg ccgacatgtg 4530
cggggtcgcc gcgcccctgc tgaaagcggc ccaaaactcg cgcgaggcgg ttgtatccgc 4590
catccggaaa ctgcatctgg agttccggac agccatgttc ctcctgggtt gcggcacgct 4650
tgccgacctg aaggacaatt cctcgcttat ccgtcaatga aagtgcctaa gatgaccgtg 4710
acaggaatcg aagcgatcag cttctacacc ccccagaact acgtgggact ggatatcctt 4770
gccgcgcatc acgggatcga ccccgagaag ttctcgaagg ggatcgggca ggagaaaatc 4830
gcactgcccg gccatgacga ggatatcgtg accatggccg ccgaggccgc gctgccgatc 4890
atcgaacgcg cgggcacgca gggcatcgac acggttctgt tcgccaccga gagcgggatc 4950
gaccagtcga aggccgccgc catctatctg cgccgcctgc tggacctgtc gcccaactgc 5010
cgttgcgtcg agctgaagca ggcctgctat tccgcgacgg cggcgctgca gatggcctgc 5070
gcgcatgtcg cccgcaagcc cgaccgcaag gtgctggtga tcgcgtccga tgtcgcgcgc 5130
tatgaccgcg aaagctcggg cgaggcgacg cagggtgcgg gcgccgtcgc catccttgtc 5190
agcgccgatc ccaaggtggc cgagatcggc accgtctcgg ggctgttcac cgaggatatc 5250
atggatttct ggcggccgaa ccaccgccgc acgcccctgt tcgacggcaa ggcatcgacg 5310
ctgcgctatc tgaacgcgct ggtcgaggcg tggaacgact atcgcgcgaa tggcggccac 5370
gagttcgccg atttcgcgca tttctgctat cacgtgccgt tctcgcggat gggcgagaag 5430
gcgaacagcc acctggccaa ggcgaacaag acgccggtgg acatggggca ggtgcagacg 5490
ggcctgatct acaaccggca ggtcgggaac tgctataccg ggtcgatcta cctggcattc 5550
gcctcgctgc tggagaacgc tcaggaggac ctgaccggcg cgctggtcgg tctgttcagc 5610
tatggctcgg gtgcgacggg cgaattcttc gatgcgcgga tcgcgcccgg ttaccgcgac 5670
cacctgttcg cggaacgcca tcgcgaattg ctgcaggatc gcacgcccgt cacatatgac 5730
gaatacgttg ccctgtggga cgagatcgac ctgacgcagg gcgcgcccga caaggcgcgc 5790
ggtcgtttca ggctggcagg tatcgaggac gagaagcgca tctatgtcga ccggcaggcc 5850
tgaagcaggc gcccatgccc cgggcaagct gatcctgtcc ggggaacatt ccgtgctcta 5910
tggtgcgccc gcgcttgcca tggccatcgc ccgctatacc gaggtgtggt tcacgccgct 5970
tggcattggc gaggggatac gcacgacatt cgccaatctc tcgggcgggg cgacctattc 6030
gctgaagctg ctgtcggggt tcaagtcgcg gctggaccgc cggttcgagc agttcctgaa 6090
cggcgaccta aaggtgcaca aggtcctgac ccatcccgac gatctggcgg tctatgcgct 6150
ggcgtcgctt ctgcacgaca agccgccggg gaccgccgcg atgccgggca tcggcgcgat 6210
gcaccacctg ccgcgaccgg gtgagctggg cagccggacg gagctgccca tcggcgcggg 6270
catggggtcg tctgcggcca tcgtcgcggc caccacggtc ctgttcgaga cgctgctgga 6330
ccggcccaag acgcccgaac agcgcttcga ccgcgtccgc ttctgcgagc ggttgaagca 6390
cggcaaggcc ggtcccatcg acgcggccag cgtcgtgcgc ggcgggcttg tccgcgtggg 6450
cgggaacggg ccgggttcga tcagcagctt cgatttgccc gaggatcacg accttgtcgc 6510
gggacgcggc tggtactggg tactgcacgg gcgccccgtc agcgggaccg gcgaatgcgt 6570
cagcgcggtc gcggcggcgc atggtcgcga tgcggcgctg tgggacgcct tcgcagtctg 6630
cacccgcgcg ttggaggccg cgctgctgtc tgggggcagc cccgacgccg ccatcaccga 6690
gaaccagcgc ctgctggaac gcatcggcgt cgtgccggca gcgacgcagg ccctcgtggc 6750
ccagatcgag gaggcgggtg gcgcggccaa gatctgcggc gcaggttccg tgcggggcga 6810
tcacggcggg gcggtcctcg tgcggattga cgacgcgcag gcgatggctt cggtcatggc 6870
gcgccatccc gacctcgact gggcgcccct gcgcatgtcg cgcacggggg cggcacccgg 6930
ccccgcgccg cgtgcgcaac cgctgccggg gcagggctga tggatcaggt catccgcgcc 6990
agcgcgccgg gttcggtcat gatcacgggc gaacatgccg tggtctatgg acaccgcgcc 7050
atcgtcgccg ggatcgagca gcgcgcccat gtgacgatcg tcccgcgtgc cgaccgcatg 7110
tttcgcatca cctcgcagat cggggcgccg cagcaggggt cgctggacga tctgcctgcg 7170
ggcgggacct atcgcttcgt gctggccgcc atcgcgcgac acgcgccgga cctgccttgc 7230
gggttcgaca tggacatcac ctcggggatc gatccgaggc tcgggcttgg atcctcggcg 7290
gcggtgacgg tcgcctgcct cggcgcgctg tcgcggctgg cggggcgggg gaccgagggg 7350
ctgcatgacg acgcgctgcg catcgtccgc gccatccagg gcaggggcag cggggccgat 7410
ctggcggcca gcctgcatgg cggcttcgtc gcctatcgcg cgcccgatgg cggtgccgcg 7470
cagatcgagg cgcttccggt gccgccgggg ccgttcggcc tgcgctatgc gggctacaag 7530
accccgacag ccgaggtgct gcgccttgtg gccgatcgga tggcgggcaa cgaggccgct 7590
ttcgacgcgc tctactcccg gatgggcgca agcgcagatg ccgcgatccg cgcggcgcaa 7650
gggctggact gggctgcatt ccacgacgcg ctgaacgaat accagcgcct gatggagcag 7710
ctgggcgtgt ccgacgacac gctggacgcg atcatccgcg aggcgcgcga cgcgggcgcc 7770
gcagtcgcca agatctccgg ctcggggctg ggggattgcg tgctggcact gggcgaccag 7830
cccaagggtt tcgtgcccgc aagcattgcc gagaagggac ttgttttcga tgactgatgc 7890
cgtccgcgac atgatcgccc gtgccatggc gggcgcgacc gacatccgag cagccgaggc 7950
ttatgcgccc agcaacatcg cgctgtcgaa atactggggc aagcgcgacg ccgcgcggaa 8010
ccttccgctg aacagctccg tctcgatctc gttggcgaac tggggctctc atacgcgggt 8070
cgaggggtcc ggcacgggcc acgacgaggt gcatcacaac ggcacgctgc tggatccggg 8130
cgacgccttc gcgcgccgcg cgttggcatt cgctgacctg ttccgggggg ggaggcacct 8190
gccgctgcgg atcacgacgc agaactcgat cccgacggcg gcggggcttg cctcgtcggc 8250
ctcggggttc gcggcgctga cccgtgcgct ggcgggggcg ttcgggctgg atctggacga 8310
cacggatctg agccgcatcg cccggatcgg cagtggcagc gccgcccgct cgatctggca 8370
cggcttcgtc cgctggaacc ggggcgaggc cgaggatggg catgacagcc acggcgtccc 8430
gctggacctg cgctggcccg gcttccgcat cgcgatcgtg gccgtggaca aggggcccaa 8490
gcctttcagt tcgcgcgacg gcatgaacca cacggtcgag accagcccgc tgttcccgcc 8550
ctggcctgcg caggcggaag cggattgccg cgtcatcgag gatgcgatcg ccgcccgcga 8610
catggccgcc ctgggtccgc gggtcgaggc gaacgccctt gcgatgcacg ccacgatgat 8670
ggccgcgcgc ccgccgctct gctacctgac gggcggcagc tggcaggtgc tggaacgcct 8730
gtggcaggcc cgcgcggacg ggcttgcggc ctttgcgacg atggatgccg gcccgaacgt 8790
caagctgatc ttcgaggaaa gcagcgccgc cgacgtgctg tacctgttcc ccgacgccag 8850
cctgatcgcg ccgttcgagg ggcgttgaac gcgtaagacg accactgggt aaggttctgc 8910
cgcgcgtggt ctcgactgcc tgcaaagagg tgcttgagtt gctgcgtgac tgcggcggcc 8970
gacttcgtgg gacttgcccg ccacgctgac gcgctggaaa cgcgcccgcg gattacgacc 9030
gcgtcattgc cctgaaccaa tttcccgtcg gtcgac 9066
<210> 43
<211> 340
<212> PRT
<213> Paracoccus sp.
<400> 43
Met Ile Ser His Thr Pro Val Pro Thr Gln Trp Val Gly Pro Ile Leu
1 5 10 15
Phe Arg Gly Pro Val Val Glu Gly Pro Ile Ser Ala Pro Leu Ala Thr
20 25 30
Tyr Glu Thr Pro Leu Trp Pro Ser Thr Ala Arg Gly Ala Gly Val Ser
35 40 45
Arg His Ser Gly Gly Ile Gln Val Ser Leu Val Asp Glu Arg Met Ser
50 55 60
Arg Ser Ile Ala Leu Arg Ala His Asp Gly Ala Ala Ala Thr Ala Ala
65 70 75 80
Trp Gln Ser Ile Lys Ala Arg Gln Glu Glu Val Ala Ala Val Val Ala
85 90 95
Thr Thr Ser Arg Phe Ala Arg Leu Val Glu Leu Asn Arg Gln Ile Val
100 105 110
Gly Asn Leu Leu Tyr Ile Arg Ile Glu Cys Val Thr Gly Asp Ala Ser
115 120 125
Gly His Asn Met Val Thr Lys Ala Ala Glu Ala Val Gln Gly Trp Ile
130 135 140
Leu Ser Glu Tyr Pro Met Leu Ala Tyr Ser Thr Ile Ser Gly Asn Leu
145 150 155 160
Cys Thr Asp Lys Lys Ala Ser Ala Val Asn Gly Ile Leu Gly Arg Gly
165 170 175
Lys Tyr Ala Val Ala Glu Val Glu Ile Pro Arg Lys Ile Leu Thr Arg
180 185 190
Val Leu Arg Thr Ser Ala Glu Lys Met Val Arg Leu Asn Tyr Glu Lys
195 200 205
Asn Tyr Val Gly Gly Thr Leu Ala Gly Ser Leu Arg Ser Ala Asn Ala
210 215 220
His Phe Ala Asn Met Leu Leu Gly Phe Tyr Leu Ala Thr Gly Gln Asp
225 230 235 240
Ala Ala Asn Ile Ile Glu Ala Ser Gln Gly Phe Val His Cys Glu Ala
245 250 255
Arg Gly Glu Asp Leu Tyr Phe Ser Cys Thr Leu Pro Asn Leu Ile Met
260 265 270
Gly Ser Val Gly Ala Gly Lys Gly Ile Pro Ser Ile Glu Glu Asn Leu
275 280 285
Ser Arg Met Gly Cys Arg Gln Pro Gly Glu Pro Gly Asp Asn Ala Arg
290 295 300
Arg Leu Ala Ala Ile Cys Ala Gly Val Val Leu Cys Gly Glu Leu Ser
305 310 315 320
Leu Leu Ala Ala Gln Thr Asn Pro Gly Glu Leu Val Arg Thr His Met
325 330 335
Glu Met Glu Arg
340
<210> 44
<211> 9066
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (3641)..(4687)
<400> 44
ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60
cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120
cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180
acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240
tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300
cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360
tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420
tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480
attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540
atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600
cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660
atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720
gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780
tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840
cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900
tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960
catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020
tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080
cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140
gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200
gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260
ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320
gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380
atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440
gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500
atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560
catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620
cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680
tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740
gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800
gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860
ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920
acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980
acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040
cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100
tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160
ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220
acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280
gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340
ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400
acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460
tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520
gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580
tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640
tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700
gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760
tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820
tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880
gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940
tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000
cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060
aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120
cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180
gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240
agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300
ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360
ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420
tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480
acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540
cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600
accccggaga gttggtccgc acccacatgg agatggagcg atg acc gac agc aag 3655
Met Thr Asp Ser Lys
1 5
gat cac cat gtc gcg ggg cgc aag ctg gac cat ctg cgt gca ttg gac 3703
Asp His His Val Ala Gly Arg Lys Leu Asp His Leu Arg Ala Leu Asp
10 15 20
gac gat gcg gat atc gac cgg ggc gac agc ggc ttc gac cgc atc gcg 3751
Asp Asp Ala Asp Ile Asp Arg Gly Asp Ser Gly Phe Asp Arg Ile Ala
25 30 35
ctg acc cat cgc gcc ctg ccc gag gtg gat ttc gac gcc atc gac acg 3799
Leu Thr His Arg Ala Leu Pro Glu Val Asp Phe Asp Ala Ile Asp Thr
40 45 50
gcg acc agc ttc ctg ggc cgt gaa ctg tcc ttc ccg ctg ctg atc tcg 3847
Ala Thr Ser Phe Leu Gly Arg Glu Leu Ser Phe Pro Leu Leu Ile Ser
55 60 65
tcc atg acc ggc ggc acc ggc gag gag atc gag cgc atc aac cgc aac 3895
Ser Met Thr Gly Gly Thr Gly Glu Glu Ile Glu Arg Ile Asn Arg Asn
70 75 80 85
ctg gcc gct ggt gcc gag gag gcc cgc gtc gcc atg gcg gtg ggc tcg 3943
Leu Ala Ala Gly Ala Glu Glu Ala Arg Val Ala Met Ala Val Gly Ser
90 95 100
cag cgc gtg atg ttc acc gac ccc tcg gcg cgg gcc agc ttc gac ctg 3991
Gln Arg Val Met Phe Thr Asp Pro Ser Ala Arg Ala Ser Phe Asp Leu
105 110 115
cgc gcc cat gcg ccc acc gtg ccg ctg ctg gcc aat atc ggc gcg gtg 4039
Arg Ala His Ala Pro Thr Val Pro Leu Leu Ala Asn Ile Gly Ala Val
120 125 130
cag ctg aac atg ggg ctg ggg ctg aag gaa tgc ctg gcc gcg atc gag 4087
Gln Leu Asn Met Gly Leu Gly Leu Lys Glu Cys Leu Ala Ala Ile Glu
135 140 145
gtg ctg cag gcg gac ggc ctg tat ctg cac ctg aac ccc ctg caa gag 4135
Val Leu Gln Ala Asp Gly Leu Tyr Leu His Leu Asn Pro Leu Gln Glu
150 155 160 165
gcc gtc cag ccc gag ggg gat cgc gac ttt gcc gat ctg ggc agc aag 4183
Ala Val Gln Pro Glu Gly Asp Arg Asp Phe Ala Asp Leu Gly Ser Lys
170 175 180
atc gcg gcc atc gcc cgc gac gtt ccc gtg ccc gtc ctg ctg aag gag 4231
Ile Ala Ala Ile Ala Arg Asp Val Pro Val Pro Val Leu Leu Lys Glu
185 190 195
gtg ggc tgc ggc ctg tcg gcg gcc gat atc gcc atc ggg ctg cgc gcc 4279
Val Gly Cys Gly Leu Ser Ala Ala Asp Ile Ala Ile Gly Leu Arg Ala
200 205 210
ggg atc cgg cat ttc gac gtg gcc ggt cgc ggc ggc aca tcc tgg agc 4327
Gly Ile Arg His Phe Asp Val Ala Gly Arg Gly Gly Thr Ser Trp Ser
215 220 225
cgg atc gag tat cgc cgc cgc cag cgg gcc gat gac gac ctg ggc ctg 4375
Arg Ile Glu Tyr Arg Arg Arg Gln Arg Ala Asp Asp Asp Leu Gly Leu
230 235 240 245
gtc ttc cag gac tgg ggc ctg cag acc gtg gac gcc ctg cgc gag gcg 4423
Val Phe Gln Asp Trp Gly Leu Gln Thr Val Asp Ala Leu Arg Glu Ala
250 255 260
cgg ccc gcg ctt gcg gcc cat gat gga acc agc gtg ctg atc gcc agc 4471
Arg Pro Ala Leu Ala Ala His Asp Gly Thr Ser Val Leu Ile Ala Ser
265 270 275
ggc ggc atc cgc aac ggt gtc gac atg gcg aaa tgc gtc atc ctg ggg 4519
Gly Gly Ile Arg Asn Gly Val Asp Met Ala Lys Cys Val Ile Leu Gly
280 285 290
gcc gac atg tgc ggg gtc gcc gcg ccc ctg ctg aaa gcg gcc caa aac 4567
Ala Asp Met Cys Gly Val Ala Ala Pro Leu Leu Lys Ala Ala Gln Asn
295 300 305
tcg cgc gag gcg gtt gta tcc gcc atc cgg aaa ctg cat ctg gag ttc 4615
Ser Arg Glu Ala Val Val Ser Ala Ile Arg Lys Leu His Leu Glu Phe
310 315 320 325
cgg aca gcc atg ttc ctc ctg ggt tgc ggc acg ctt gcc gac ctg aag 4663
Arg Thr Ala Met Phe Leu Leu Gly Cys Gly Thr Leu Ala Asp Leu Lys
330 335 340
gac aat tcc tcg ctt atc cgt caa tga aagtgcctaa gatgaccgtg 4710
Asp Asn Ser Ser Leu Ile Arg Gln
345
acaggaatcg aagcgatcag cttctacacc ccccagaact acgtgggact ggatatcctt 4770
gccgcgcatc acgggatcga ccccgagaag ttctcgaagg ggatcgggca ggagaaaatc 4830
gcactgcccg gccatgacga ggatatcgtg accatggccg ccgaggccgc gctgccgatc 4890
atcgaacgcg cgggcacgca gggcatcgac acggttctgt tcgccaccga gagcgggatc 4950
gaccagtcga aggccgccgc catctatctg cgccgcctgc tggacctgtc gcccaactgc 5010
cgttgcgtcg agctgaagca ggcctgctat tccgcgacgg cggcgctgca gatggcctgc 5070
gcgcatgtcg cccgcaagcc cgaccgcaag gtgctggtga tcgcgtccga tgtcgcgcgc 5130
tatgaccgcg aaagctcggg cgaggcgacg cagggtgcgg gcgccgtcgc catccttgtc 5190
agcgccgatc ccaaggtggc cgagatcggc accgtctcgg ggctgttcac cgaggatatc 5250
atggatttct ggcggccgaa ccaccgccgc acgcccctgt tcgacggcaa ggcatcgacg 5310
ctgcgctatc tgaacgcgct ggtcgaggcg tggaacgact atcgcgcgaa tggcggccac 5370
gagttcgccg atttcgcgca tttctgctat cacgtgccgt tctcgcggat gggcgagaag 5430
gcgaacagcc acctggccaa ggcgaacaag acgccggtgg acatggggca ggtgcagacg 5490
ggcctgatct acaaccggca ggtcgggaac tgctataccg ggtcgatcta cctggcattc 5550
gcctcgctgc tggagaacgc tcaggaggac ctgaccggcg cgctggtcgg tctgttcagc 5610
tatggctcgg gtgcgacggg cgaattcttc gatgcgcgga tcgcgcccgg ttaccgcgac 5670
cacctgttcg cggaacgcca tcgcgaattg ctgcaggatc gcacgcccgt cacatatgac 5730
gaatacgttg ccctgtggga cgagatcgac ctgacgcagg gcgcgcccga caaggcgcgc 5790
ggtcgtttca ggctggcagg tatcgaggac gagaagcgca tctatgtcga ccggcaggcc 5850
tgaagcaggc gcccatgccc cgggcaagct gatcctgtcc ggggaacatt ccgtgctcta 5910
tggtgcgccc gcgcttgcca tggccatcgc ccgctatacc gaggtgtggt tcacgccgct 5970
tggcattggc gaggggatac gcacgacatt cgccaatctc tcgggcgggg cgacctattc 6030
gctgaagctg ctgtcggggt tcaagtcgcg gctggaccgc cggttcgagc agttcctgaa 6090
cggcgaccta aaggtgcaca aggtcctgac ccatcccgac gatctggcgg tctatgcgct 6150
ggcgtcgctt ctgcacgaca agccgccggg gaccgccgcg atgccgggca tcggcgcgat 6210
gcaccacctg ccgcgaccgg gtgagctggg cagccggacg gagctgccca tcggcgcggg 6270
catggggtcg tctgcggcca tcgtcgcggc caccacggtc ctgttcgaga cgctgctgga 6330
ccggcccaag acgcccgaac agcgcttcga ccgcgtccgc ttctgcgagc ggttgaagca 6390
cggcaaggcc ggtcccatcg acgcggccag cgtcgtgcgc ggcgggcttg tccgcgtggg 6450
cgggaacggg ccgggttcga tcagcagctt cgatttgccc gaggatcacg accttgtcgc 6510
gggacgcggc tggtactggg tactgcacgg gcgccccgtc agcgggaccg gcgaatgcgt 6570
cagcgcggtc gcggcggcgc atggtcgcga tgcggcgctg tgggacgcct tcgcagtctg 6630
cacccgcgcg ttggaggccg cgctgctgtc tgggggcagc cccgacgccg ccatcaccga 6690
gaaccagcgc ctgctggaac gcatcggcgt cgtgccggca gcgacgcagg ccctcgtggc 6750
ccagatcgag gaggcgggtg gcgcggccaa gatctgcggc gcaggttccg tgcggggcga 6810
tcacggcggg gcggtcctcg tgcggattga cgacgcgcag gcgatggctt cggtcatggc 6870
gcgccatccc gacctcgact gggcgcccct gcgcatgtcg cgcacggggg cggcacccgg 6930
ccccgcgccg cgtgcgcaac cgctgccggg gcagggctga tggatcaggt catccgcgcc 6990
agcgcgccgg gttcggtcat gatcacgggc gaacatgccg tggtctatgg acaccgcgcc 7050
atcgtcgccg ggatcgagca gcgcgcccat gtgacgatcg tcccgcgtgc cgaccgcatg 7110
tttcgcatca cctcgcagat cggggcgccg cagcaggggt cgctggacga tctgcctgcg 7170
ggcgggacct atcgcttcgt gctggccgcc atcgcgcgac acgcgccgga cctgccttgc 7230
gggttcgaca tggacatcac ctcggggatc gatccgaggc tcgggcttgg atcctcggcg 7290
gcggtgacgg tcgcctgcct cggcgcgctg tcgcggctgg cggggcgggg gaccgagggg 7350
ctgcatgacg acgcgctgcg catcgtccgc gccatccagg gcaggggcag cggggccgat 7410
ctggcggcca gcctgcatgg cggcttcgtc gcctatcgcg cgcccgatgg cggtgccgcg 7470
cagatcgagg cgcttccggt gccgccgggg ccgttcggcc tgcgctatgc gggctacaag 7530
accccgacag ccgaggtgct gcgccttgtg gccgatcgga tggcgggcaa cgaggccgct 7590
ttcgacgcgc tctactcccg gatgggcgca agcgcagatg ccgcgatccg cgcggcgcaa 7650
gggctggact gggctgcatt ccacgacgcg ctgaacgaat accagcgcct gatggagcag 7710
ctgggcgtgt ccgacgacac gctggacgcg atcatccgcg aggcgcgcga cgcgggcgcc 7770
gcagtcgcca agatctccgg ctcggggctg ggggattgcg tgctggcact gggcgaccag 7830
cccaagggtt tcgtgcccgc aagcattgcc gagaagggac ttgttttcga tgactgatgc 7890
cgtccgcgac atgatcgccc gtgccatggc gggcgcgacc gacatccgag cagccgaggc 7950
ttatgcgccc agcaacatcg cgctgtcgaa atactggggc aagcgcgacg ccgcgcggaa 8010
ccttccgctg aacagctccg tctcgatctc gttggcgaac tggggctctc atacgcgggt 8070
cgaggggtcc ggcacgggcc acgacgaggt gcatcacaac ggcacgctgc tggatccggg 8130
cgacgccttc gcgcgccgcg cgttggcatt cgctgacctg ttccgggggg ggaggcacct 8190
gccgctgcgg atcacgacgc agaactcgat cccgacggcg gcggggcttg cctcgtcggc 8250
ctcggggttc gcggcgctga cccgtgcgct ggcgggggcg ttcgggctgg atctggacga 8310
cacggatctg agccgcatcg cccggatcgg cagtggcagc gccgcccgct cgatctggca 8370
cggcttcgtc cgctggaacc ggggcgaggc cgaggatggg catgacagcc acggcgtccc 8430
gctggacctg cgctggcccg gcttccgcat cgcgatcgtg gccgtggaca aggggcccaa 8490
gcctttcagt tcgcgcgacg gcatgaacca cacggtcgag accagcccgc tgttcccgcc 8550
ctggcctgcg caggcggaag cggattgccg cgtcatcgag gatgcgatcg ccgcccgcga 8610
catggccgcc ctgggtccgc gggtcgaggc gaacgccctt gcgatgcacg ccacgatgat 8670
ggccgcgcgc ccgccgctct gctacctgac gggcggcagc tggcaggtgc tggaacgcct 8730
gtggcaggcc cgcgcggacg ggcttgcggc ctttgcgacg atggatgccg gcccgaacgt 8790
caagctgatc ttcgaggaaa gcagcgccgc cgacgtgctg tacctgttcc ccgacgccag 8850
cctgatcgcg ccgttcgagg ggcgttgaac gcgtaagacg accactgggt aaggttctgc 8910
cgcgcgtggt ctcgactgcc tgcaaagagg tgcttgagtt gctgcgtgac tgcggcggcc 8970
gacttcgtgg gacttgcccg ccacgctgac gcgctggaaa cgcgcccgcg gattacgacc 9030
gcgtcattgc cctgaaccaa tttcccgtcg gtcgac 9066
<210> 45
<211> 349
<212> PRT
<213> Paracoccus sp.
<400> 45
Met Thr Asp Ser Lys Asp His His Val Ala Gly Arg Lys Leu Asp His
1 5 10 15
Leu Arg Ala Leu Asp Asp Asp Ala Asp Ile Asp Arg Gly Asp Ser Gly
20 25 30
Phe Asp Arg Ile Ala Leu Thr His Arg Ala Leu Pro Glu Val Asp Phe
35 40 45
Asp Ala Ile Asp Thr Ala Thr Ser Phe Leu Gly Arg Glu Leu Ser Phe
50 55 60
Pro Leu Leu Ile Ser Ser Met Thr Gly Gly Thr Gly Glu Glu Ile Glu
65 70 75 80
Arg Ile Asn Arg Asn Leu Ala Ala Gly Ala Glu Glu Ala Arg Val Ala
85 90 95
Met Ala Val Gly Ser Gln Arg Val Met Phe Thr Asp Pro Ser Ala Arg
100 105 110
Ala Ser Phe Asp Leu Arg Ala His Ala Pro Thr Val Pro Leu Leu Ala
115 120 125
Asn Ile Gly Ala Val Gln Leu Asn Met Gly Leu Gly Leu Lys Glu Cys
130 135 140
Leu Ala Ala Ile Glu Val Leu Gln Ala Asp Gly Leu Tyr Leu His Leu
145 150 155 160
Asn Pro Leu Gln Glu Ala Val Gln Pro Glu Gly Asp Arg Asp Phe Ala
165 170 175
Asp Leu Gly Ser Lys Ile Ala Ala Ile Ala Arg Asp Val Pro Val Pro
180 185 190
Val Leu Leu Lys Glu Val Gly Cys Gly Leu Ser Ala Ala Asp Ile Ala
195 200 205
Ile Gly Leu Arg Ala Gly Ile Arg His Phe Asp Val Ala Gly Arg Gly
210 215 220
Gly Thr Ser Trp Ser Arg Ile Glu Tyr Arg Arg Arg Gln Arg Ala Asp
225 230 235 240
Asp Asp Leu Gly Leu Val Phe Gln Asp Trp Gly Leu Gln Thr Val Asp
245 250 255
Ala Leu Arg Glu Ala Arg Pro Ala Leu Ala Ala His Asp Gly Thr Ser
260 265 270
Val Leu Ile Ala Ser Gly Gly Ile Arg Asn Gly Val Asp Met Ala Lys
275 280 285
Cys Val Ile Leu Gly Ala Asp Met Cys Gly Val Ala Ala Pro Leu Leu
290 295 300
Lys Ala Ala Gln Asn Ser Arg Glu Ala Val Val Ser Ala Ile Arg Lys
305 310 315 320
Leu His Leu Glu Phe Arg Thr Ala Met Phe Leu Leu Gly Cys Gly Thr
325 330 335
Leu Ala Asp Leu Lys Asp Asn Ser Ser Leu Ile Arg Gln
340 345
<210> 46
<211> 9066
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (4687)..(5850)
<400> 46
ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60
cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120
cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180
acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240
tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300
cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360
tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420
tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480
attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540
atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600
cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660
atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720
gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780
tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840
cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900
tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960
catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020
tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080
cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140
gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200
gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260
ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320
gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380
atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440
gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500
atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560
catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620
cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680
tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740
gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800
gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860
ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920
acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980
acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040
cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100
tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160
ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220
acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280
gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340
ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400
acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460
tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520
gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580
tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640
tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700
gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760
tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820
tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880
gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940
tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000
cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060
aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120
cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180
gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240
agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300
ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360
ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420
tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480
acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540
cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600
accccggaga gttggtccgc acccacatgg agatggagcg atgaccgaca gcaaggatca 3660
ccatgtcgcg gggcgcaagc tggaccatct gcgtgcattg gacgacgatg cggatatcga 3720
ccggggcgac agcggcttcg accgcatcgc gctgacccat cgcgccctgc ccgaggtgga 3780
tttcgacgcc atcgacacgg cgaccagctt cctgggccgt gaactgtcct tcccgctgct 3840
gatctcgtcc atgaccggcg gcaccggcga ggagatcgag cgcatcaacc gcaacctggc 3900
cgctggtgcc gaggaggccc gcgtcgccat ggcggtgggc tcgcagcgcg tgatgttcac 3960
cgacccctcg gcgcgggcca gcttcgacct gcgcgcccat gcgcccaccg tgccgctgct 4020
ggccaatatc ggcgcggtgc agctgaacat ggggctgggg ctgaaggaat gcctggccgc 4080
gatcgaggtg ctgcaggcgg acggcctgta tctgcacctg aaccccctgc aagaggccgt 4140
ccagcccgag ggggatcgcg actttgccga tctgggcagc aagatcgcgg ccatcgcccg 4200
cgacgttccc gtgcccgtcc tgctgaagga ggtgggctgc ggcctgtcgg cggccgatat 4260
cgccatcggg ctgcgcgccg ggatccggca tttcgacgtg gccggtcgcg gcggcacatc 4320
ctggagccgg atcgagtatc gccgccgcca gcgggccgat gacgacctgg gcctggtctt 4380
ccaggactgg ggcctgcaga ccgtggacgc cctgcgcgag gcgcggcccg cgcttgcggc 4440
ccatgatgga accagcgtgc tgatcgccag cggcggcatc cgcaacggtg tcgacatggc 4500
gaaatgcgtc atcctggggg ccgacatgtg cggggtcgcc gcgcccctgc tgaaagcggc 4560
ccaaaactcg cgcgaggcgg ttgtatccgc catccggaaa ctgcatctgg agttccggac 4620
agccatgttc ctcctgggtt gcggcacgct tgccgacctg aaggacaatt cctcgcttat 4680
ccgtca atg aaa gtg cct aag atg acc gtg aca gga atc gaa gcg atc 4728
Met Lys Val Pro Lys Met Thr Val Thr Gly Ile Glu Ala Ile
1 5 10
agc ttc tac acc ccc cag aac tac gtg gga ctg gat atc ctt gcc gcg 4776
Ser Phe Tyr Thr Pro Gln Asn Tyr Val Gly Leu Asp Ile Leu Ala Ala
15 20 25 30
cat cac ggg atc gac ccc gag aag ttc tcg aag ggg atc ggg cag gag 4824
His His Gly Ile Asp Pro Glu Lys Phe Ser Lys Gly Ile Gly Gln Glu
35 40 45
aaa atc gca ctg ccc ggc cat gac gag gat atc gtg acc atg gcc gcc 4872
Lys Ile Ala Leu Pro Gly His Asp Glu Asp Ile Val Thr Met Ala Ala
50 55 60
gag gcc gcg ctg ccg atc atc gaa cgc gcg ggc acg cag ggc atc gac 4920
Glu Ala Ala Leu Pro Ile Ile Glu Arg Ala Gly Thr Gln Gly Ile Asp
65 70 75
acg gtt ctg ttc gcc acc gag agc ggg atc gac cag tcg aag gcc gcc 4968
Thr Val Leu Phe Ala Thr Glu Ser Gly Ile Asp Gln Ser Lys Ala Ala
80 85 90
gcc atc tat ctg cgc cgc ctg ctg gac ctg tcg ccc aac tgc cgt tgc 5016
Ala Ile Tyr Leu Arg Arg Leu Leu Asp Leu Ser Pro Asn Cys Arg Cys
95 100 105 110
gtc gag ctg aag cag gcc tgc tat tcc gcg acg gcg gcg ctg cag atg 5064
Val Glu Leu Lys Gln Ala Cys Tyr Ser Ala Thr Ala Ala Leu Gln Met
115 120 125
gcc tgc gcg cat gtc gcc cgc aag ccc gac cgc aag gtg ctg gtg atc 5112
Ala Cys Ala His Val Ala Arg Lys Pro Asp Arg Lys Val Leu Val Ile
130 135 140
gcg tcc gat gtc gcg cgc tat gac cgc gaa agc tcg ggc gag gcg acg 5160
Ala Ser Asp Val Ala Arg Tyr Asp Arg Glu Ser Ser Gly Glu Ala Thr
145 150 155
cag ggt gcg ggc gcc gtc gcc atc ctt gtc agc gcc gat ccc aag gtg 5208
Gln Gly Ala Gly Ala Val Ala Ile Leu Val Ser Ala Asp Pro Lys Val
160 165 170
gcc gag atc ggc acc gtc tcg ggg ctg ttc acc gag gat atc atg gat 5256
Ala Glu Ile Gly Thr Val Ser Gly Leu Phe Thr Glu Asp Ile Met Asp
175 180 185 190
ttc tgg cgg ccg aac cac cgc cgc acg ccc ctg ttc gac ggc aag gca 5304
Phe Trp Arg Pro Asn His Arg Arg Thr Pro Leu Phe Asp Gly Lys Ala
195 200 205
tcg acg ctg cgc tat ctg aac gcg ctg gtc gag gcg tgg aac gac tat 5352
Ser Thr Leu Arg Tyr Leu Asn Ala Leu Val Glu Ala Trp Asn Asp Tyr
210 215 220
cgc gcg aat ggc ggc cac gag ttc gcc gat ttc gcg cat ttc tgc tat 5400
Arg Ala Asn Gly Gly His Glu Phe Ala Asp Phe Ala His Phe Cys Tyr
225 230 235
cac gtg ccg ttc tcg cgg atg ggc gag aag gcg aac agc cac ctg gcc 5448
His Val Pro Phe Ser Arg Met Gly Glu Lys Ala Asn Ser His Leu Ala
240 245 250
aag gcg aac aag acg ccg gtg gac atg ggg cag gtg cag acg ggc ctg 5496
Lys Ala Asn Lys Thr Pro Val Asp Met Gly Gln Val Gln Thr Gly Leu
255 260 265 270
atc tac aac cgg cag gtc ggg aac tgc tat acc ggg tcg atc tac ctg 5544
Ile Tyr Asn Arg Gln Val Gly Asn Cys Tyr Thr Gly Ser Ile Tyr Leu
275 280 285
gca ttc gcc tcg ctg ctg gag aac gct cag gag gac ctg acc ggc gcg 5592
Ala Phe Ala Ser Leu Leu Glu Asn Ala Gln Glu Asp Leu Thr Gly Ala
290 295 300
ctg gtc ggt ctg ttc agc tat ggc tcg ggt gcg acg ggc gaa ttc ttc 5640
Leu Val Gly Leu Phe Ser Tyr Gly Ser Gly Ala Thr Gly Glu Phe Phe
305 310 315
gat gcg cgg atc gcg ccc ggt tac cgc gac cac ctg ttc gcg gaa cgc 5688
Asp Ala Arg Ile Ala Pro Gly Tyr Arg Asp His Leu Phe Ala Glu Arg
320 325 330
cat cgc gaa ttg ctg cag gat cgc acg ccc gtc aca tat gac gaa tac 5736
His Arg Glu Leu Leu Gln Asp Arg Thr Pro Val Thr Tyr Asp Glu Tyr
335 340 345 350
gtt gcc ctg tgg gac gag atc gac ctg acg cag ggc gcg ccc gac aag 5784
Val Ala Leu Trp Asp Glu Ile Asp Leu Thr Gln Gly Ala Pro Asp Lys
355 360 365
gcg cgc ggt cgt ttc agg ctg gca ggt atc gag gac gag aag cgc atc 5832
Ala Arg Gly Arg Phe Arg Leu Ala Gly Ile Glu Asp Glu Lys Arg Ile
370 375 380
tat gtc gac cgg cag gcc tgaagcaggc gcccatgccc cgggcaagct 5880
Tyr Val Asp Arg Gln Ala
385
gatcctgtcc ggggaacatt ccgtgctcta tggtgcgccc gcgcttgcca tggccatcgc 5940
ccgctatacc gaggtgtggt tcacgccgct tggcattggc gaggggatac gcacgacatt 6000
cgccaatctc tcgggcgggg cgacctattc gctgaagctg ctgtcggggt tcaagtcgcg 6060
gctggaccgc cggttcgagc agttcctgaa cggcgaccta aaggtgcaca aggtcctgac 6120
ccatcccgac gatctggcgg tctatgcgct ggcgtcgctt ctgcacgaca agccgccggg 6180
gaccgccgcg atgccgggca tcggcgcgat gcaccacctg ccgcgaccgg gtgagctggg 6240
cagccggacg gagctgccca tcggcgcggg catggggtcg tctgcggcca tcgtcgcggc 6300
caccacggtc ctgttcgaga cgctgctgga ccggcccaag acgcccgaac agcgcttcga 6360
ccgcgtccgc ttctgcgagc ggttgaagca cggcaaggcc ggtcccatcg acgcggccag 6420
cgtcgtgcgc ggcgggcttg tccgcgtggg cgggaacggg ccgggttcga tcagcagctt 6480
cgatttgccc gaggatcacg accttgtcgc gggacgcggc tggtactggg tactgcacgg 6540
gcgccccgtc agcgggaccg gcgaatgcgt cagcgcggtc gcggcggcgc atggtcgcga 6600
tgcggcgctg tgggacgcct tcgcagtctg cacccgcgcg ttggaggccg cgctgctgtc 6660
tgggggcagc cccgacgccg ccatcaccga gaaccagcgc ctgctggaac gcatcggcgt 6720
cgtgccggca gcgacgcagg ccctcgtggc ccagatcgag gaggcgggtg gcgcggccaa 6780
gatctgcggc gcaggttccg tgcggggcga tcacggcggg gcggtcctcg tgcggattga 6840
cgacgcgcag gcgatggctt cggtcatggc gcgccatccc gacctcgact gggcgcccct 6900
gcgcatgtcg cgcacggggg cggcacccgg ccccgcgccg cgtgcgcaac cgctgccggg 6960
gcagggctga tggatcaggt catccgcgcc agcgcgccgg gttcggtcat gatcacgggc 7020
gaacatgccg tggtctatgg acaccgcgcc atcgtcgccg ggatcgagca gcgcgcccat 7080
gtgacgatcg tcccgcgtgc cgaccgcatg tttcgcatca cctcgcagat cggggcgccg 7140
cagcaggggt cgctggacga tctgcctgcg ggcgggacct atcgcttcgt gctggccgcc 7200
atcgcgcgac acgcgccgga cctgccttgc gggttcgaca tggacatcac ctcggggatc 7260
gatccgaggc tcgggcttgg atcctcggcg gcggtgacgg tcgcctgcct cggcgcgctg 7320
tcgcggctgg cggggcgggg gaccgagggg ctgcatgacg acgcgctgcg catcgtccgc 7380
gccatccagg gcaggggcag cggggccgat ctggcggcca gcctgcatgg cggcttcgtc 7440
gcctatcgcg cgcccgatgg cggtgccgcg cagatcgagg cgcttccggt gccgccgggg 7500
ccgttcggcc tgcgctatgc gggctacaag accccgacag ccgaggtgct gcgccttgtg 7560
gccgatcgga tggcgggcaa cgaggccgct ttcgacgcgc tctactcccg gatgggcgca 7620
agcgcagatg ccgcgatccg cgcggcgcaa gggctggact gggctgcatt ccacgacgcg 7680
ctgaacgaat accagcgcct gatggagcag ctgggcgtgt ccgacgacac gctggacgcg 7740
atcatccgcg aggcgcgcga cgcgggcgcc gcagtcgcca agatctccgg ctcggggctg 7800
ggggattgcg tgctggcact gggcgaccag cccaagggtt tcgtgcccgc aagcattgcc 7860
gagaagggac ttgttttcga tgactgatgc cgtccgcgac atgatcgccc gtgccatggc 7920
gggcgcgacc gacatccgag cagccgaggc ttatgcgccc agcaacatcg cgctgtcgaa 7980
atactggggc aagcgcgacg ccgcgcggaa ccttccgctg aacagctccg tctcgatctc 8040
gttggcgaac tggggctctc atacgcgggt cgaggggtcc ggcacgggcc acgacgaggt 8100
gcatcacaac ggcacgctgc tggatccggg cgacgccttc gcgcgccgcg cgttggcatt 8160
cgctgacctg ttccgggggg ggaggcacct gccgctgcgg atcacgacgc agaactcgat 8220
cccgacggcg gcggggcttg cctcgtcggc ctcggggttc gcggcgctga cccgtgcgct 8280
ggcgggggcg ttcgggctgg atctggacga cacggatctg agccgcatcg cccggatcgg 8340
cagtggcagc gccgcccgct cgatctggca cggcttcgtc cgctggaacc ggggcgaggc 8400
cgaggatggg catgacagcc acggcgtccc gctggacctg cgctggcccg gcttccgcat 8460
cgcgatcgtg gccgtggaca aggggcccaa gcctttcagt tcgcgcgacg gcatgaacca 8520
cacggtcgag accagcccgc tgttcccgcc ctggcctgcg caggcggaag cggattgccg 8580
cgtcatcgag gatgcgatcg ccgcccgcga catggccgcc ctgggtccgc gggtcgaggc 8640
gaacgccctt gcgatgcacg ccacgatgat ggccgcgcgc ccgccgctct gctacctgac 8700
gggcggcagc tggcaggtgc tggaacgcct gtggcaggcc cgcgcggacg ggcttgcggc 8760
ctttgcgacg atggatgccg gcccgaacgt caagctgatc ttcgaggaaa gcagcgccgc 8820
cgacgtgctg tacctgttcc ccgacgccag cctgatcgcg ccgttcgagg ggcgttgaac 8880
gcgtaagacg accactgggt aaggttctgc cgcgcgtggt ctcgactgcc tgcaaagagg 8940
tgcttgagtt gctgcgtgac tgcggcggcc gacttcgtgg gacttgcccg ccacgctgac 9000
gcgctggaaa cgcgcccgcg gattacgacc gcgtcattgc cctgaaccaa tttcccgtcg 9060
gtcgac 9066
<210> 47
<211> 388
<212> PRT
<213> Paracoccus sp.
<400> 47
Met Lys Val Pro Lys Met Thr Val Thr Gly Ile Glu Ala Ile Ser Phe
1 5 10 15
Tyr Thr Pro Gln Asn Tyr Val Gly Leu Asp Ile Leu Ala Ala His His
20 25 30
Gly Ile Asp Pro Glu Lys Phe Ser Lys Gly Ile Gly Gln Glu Lys Ile
35 40 45
Ala Leu Pro Gly His Asp Glu Asp Ile Val Thr Met Ala Ala Glu Ala
50 55 60
Ala Leu Pro Ile Ile Glu Arg Ala Gly Thr Gln Gly Ile Asp Thr Val
65 70 75 80
Leu Phe Ala Thr Glu Ser Gly Ile Asp Gln Ser Lys Ala Ala Ala Ile
85 90 95
Tyr Leu Arg Arg Leu Leu Asp Leu Ser Pro Asn Cys Arg Cys Val Glu
100 105 110
Leu Lys Gln Ala Cys Tyr Ser Ala Thr Ala Ala Leu Gln Met Ala Cys
115 120 125
Ala His Val Ala Arg Lys Pro Asp Arg Lys Val Leu Val Ile Ala Ser
130 135 140
Asp Val Ala Arg Tyr Asp Arg Glu Ser Ser Gly Glu Ala Thr Gln Gly
145 150 155 160
Ala Gly Ala Val Ala Ile Leu Val Ser Ala Asp Pro Lys Val Ala Glu
165 170 175
Ile Gly Thr Val Ser Gly Leu Phe Thr Glu Asp Ile Met Asp Phe Trp
180 185 190
Arg Pro Asn His Arg Arg Thr Pro Leu Phe Asp Gly Lys Ala Ser Thr
195 200 205
Leu Arg Tyr Leu Asn Ala Leu Val Glu Ala Trp Asn Asp Tyr Arg Ala
210 215 220
Asn Gly Gly His Glu Phe Ala Asp Phe Ala His Phe Cys Tyr His Val
225 230 235 240
Pro Phe Ser Arg Met Gly Glu Lys Ala Asn Ser His Leu Ala Lys Ala
245 250 255
Asn Lys Thr Pro Val Asp Met Gly Gln Val Gln Thr Gly Leu Ile Tyr
260 265 270
Asn Arg Gln Val Gly Asn Cys Tyr Thr Gly Ser Ile Tyr Leu Ala Phe
275 280 285
Ala Ser Leu Leu Glu Asn Ala Gln Glu Asp Leu Thr Gly Ala Leu Val
290 295 300
Gly Leu Phe Ser Tyr Gly Ser Gly Ala Thr Gly Glu Phe Phe Asp Ala
305 310 315 320
Arg Ile Ala Pro Gly Tyr Arg Asp His Leu Phe Ala Glu Arg His Arg
325 330 335
Glu Leu Leu Gln Asp Arg Thr Pro Val Thr Tyr Asp Glu Tyr Val Ala
340 345 350
Leu Trp Asp Glu Ile Asp Leu Thr Gln Gly Ala Pro Asp Lys Ala Arg
355 360 365
Gly Arg Phe Arg Leu Ala Gly Ile Glu Asp Glu Lys Arg Ile Tyr Val
370 375 380
Asp Arg Gln Ala
385
<210> 48
<211> 9066
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (5834)..(6967)
<400> 48
ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60
cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120
cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180
acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240
tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300
cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360
tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420
tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480
attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540
atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600
cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660
atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720
gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780
tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840
cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900
tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960
catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020
tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080
cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140
gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200
gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260
ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320
gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380
atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440
gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500
atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560
catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620
cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680
tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740
gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800
gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860
ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920
acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980
acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040
cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100
tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160
ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220
acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280
gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340
ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400
acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460
tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520
gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580
tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640
tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700
gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760
tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820
tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880
gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940
tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000
cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060
aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120
cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180
gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240
agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300
ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360
ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420
tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480
acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540
cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600
accccggaga gttggtccgc acccacatgg agatggagcg atgaccgaca gcaaggatca 3660
ccatgtcgcg gggcgcaagc tggaccatct gcgtgcattg gacgacgatg cggatatcga 3720
ccggggcgac agcggcttcg accgcatcgc gctgacccat cgcgccctgc ccgaggtgga 3780
tttcgacgcc atcgacacgg cgaccagctt cctgggccgt gaactgtcct tcccgctgct 3840
gatctcgtcc atgaccggcg gcaccggcga ggagatcgag cgcatcaacc gcaacctggc 3900
cgctggtgcc gaggaggccc gcgtcgccat ggcggtgggc tcgcagcgcg tgatgttcac 3960
cgacccctcg gcgcgggcca gcttcgacct gcgcgcccat gcgcccaccg tgccgctgct 4020
ggccaatatc ggcgcggtgc agctgaacat ggggctgggg ctgaaggaat gcctggccgc 4080
gatcgaggtg ctgcaggcgg acggcctgta tctgcacctg aaccccctgc aagaggccgt 4140
ccagcccgag ggggatcgcg actttgccga tctgggcagc aagatcgcgg ccatcgcccg 4200
cgacgttccc gtgcccgtcc tgctgaagga ggtgggctgc ggcctgtcgg cggccgatat 4260
cgccatcggg ctgcgcgccg ggatccggca tttcgacgtg gccggtcgcg gcggcacatc 4320
ctggagccgg atcgagtatc gccgccgcca gcgggccgat gacgacctgg gcctggtctt 4380
ccaggactgg ggcctgcaga ccgtggacgc cctgcgcgag gcgcggcccg cgcttgcggc 4440
ccatgatgga accagcgtgc tgatcgccag cggcggcatc cgcaacggtg tcgacatggc 4500
gaaatgcgtc atcctggggg ccgacatgtg cggggtcgcc gcgcccctgc tgaaagcggc 4560
ccaaaactcg cgcgaggcgg ttgtatccgc catccggaaa ctgcatctgg agttccggac 4620
agccatgttc ctcctgggtt gcggcacgct tgccgacctg aaggacaatt cctcgcttat 4680
ccgtcaatga aagtgcctaa gatgaccgtg acaggaatcg aagcgatcag cttctacacc 4740
ccccagaact acgtgggact ggatatcctt gccgcgcatc acgggatcga ccccgagaag 4800
ttctcgaagg ggatcgggca ggagaaaatc gcactgcccg gccatgacga ggatatcgtg 4860
accatggccg ccgaggccgc gctgccgatc atcgaacgcg cgggcacgca gggcatcgac 4920
acggttctgt tcgccaccga gagcgggatc gaccagtcga aggccgccgc catctatctg 4980
cgccgcctgc tggacctgtc gcccaactgc cgttgcgtcg agctgaagca ggcctgctat 5040
tccgcgacgg cggcgctgca gatggcctgc gcgcatgtcg cccgcaagcc cgaccgcaag 5100
gtgctggtga tcgcgtccga tgtcgcgcgc tatgaccgcg aaagctcggg cgaggcgacg 5160
cagggtgcgg gcgccgtcgc catccttgtc agcgccgatc ccaaggtggc cgagatcggc 5220
accgtctcgg ggctgttcac cgaggatatc atggatttct ggcggccgaa ccaccgccgc 5280
acgcccctgt tcgacggcaa ggcatcgacg ctgcgctatc tgaacgcgct ggtcgaggcg 5340
tggaacgact atcgcgcgaa tggcggccac gagttcgccg atttcgcgca tttctgctat 5400
cacgtgccgt tctcgcggat gggcgagaag gcgaacagcc acctggccaa ggcgaacaag 5460
acgccggtgg acatggggca ggtgcagacg ggcctgatct acaaccggca ggtcgggaac 5520
tgctataccg ggtcgatcta cctggcattc gcctcgctgc tggagaacgc tcaggaggac 5580
ctgaccggcg cgctggtcgg tctgttcagc tatggctcgg gtgcgacggg cgaattcttc 5640
gatgcgcgga tcgcgcccgg ttaccgcgac cacctgttcg cggaacgcca tcgcgaattg 5700
ctgcaggatc gcacgcccgt cacatatgac gaatacgttg ccctgtggga cgagatcgac 5760
ctgacgcagg gcgcgcccga caaggcgcgc ggtcgtttca ggctggcagg tatcgaggac 5820
gagaagcgca tct atg tcg acc ggc agg cct gaa gca ggc gcc cat 5866
Met Ser Thr Gly Arg Pro Glu Ala Gly Ala His
1 5 10
gcc ccg ggc aag ctg atc ctg tcc ggg gaa cat tcc gtg ctc tat ggt 5914
Ala Pro Gly Lys Leu Ile Leu Ser Gly Glu His Ser Val Leu Tyr Gly
15 20 25
gcg ccc gcg ctt gcc atg gcc atc gcc cgc tat acc gag gtg tgg ttc 5962
Ala Pro Ala Leu Ala Met Ala Ile Ala Arg Tyr Thr Glu Val Trp Phe
30 35 40
acg ccg ctt ggc att ggc gag ggg ata cgc acg aca ttc gcc aat ctc 6010
Thr Pro Leu Gly Ile Gly Glu Gly Ile Arg Thr Thr Phe Ala Asn Leu
45 50 55
tcg ggc ggg gcg acc tat tcg ctg aag ctg ctg tcg ggg ttc aag tcg 6058
Ser Gly Gly Ala Thr Tyr Ser Leu Lys Leu Leu Ser Gly Phe Lys Ser
60 65 70 75
cgg ctg gac cgc cgg ttc gag cag ttc ctg aac ggc gac cta aag gtg 6106
Arg Leu Asp Arg Arg Phe Glu Gln Phe Leu Asn Gly Asp Leu Lys Val
80 85 90
cac aag gtc ctg acc cat ccc gac gat ctg gcg gtc tat gcg ctg gcg 6154
His Lys Val Leu Thr His Pro Asp Asp Leu Ala Val Tyr Ala Leu Ala
95 100 105
tcg ctt ctg cac gac aag ccg ccg ggg acc gcc gcg atg ccg ggc atc 6202
Ser Leu Leu His Asp Lys Pro Pro Gly Thr Ala Ala Met Pro Gly Ile
110 115 120
ggc gcg atg cac cac ctg ccg cga ccg ggt gag ctg ggc agc cgg acg 6250
Gly Ala Met His His Leu Pro Arg Pro Gly Glu Leu Gly Ser Arg Thr
125 130 135
gag ctg ccc atc ggc gcg ggc atg ggg tcg tct gcg gcc atc gtc gcg 6298
Glu Leu Pro Ile Gly Ala Gly Met Gly Ser Ser Ala Ala Ile Val Ala
140 145 150 155
gcc acc acg gtc ctg ttc gag acg ctg ctg gac cgg ccc aag acg ccc 6346
Ala Thr Thr Val Leu Phe Glu Thr Leu Leu Asp Arg Pro Lys Thr Pro
160 165 170
gaa cag cgc ttc gac cgc gtc cgc ttc tgc gag cgg ttg aag cac ggc 6394
Glu Gln Arg Phe Asp Arg Val Arg Phe Cys Glu Arg Leu Lys His Gly
175 180 185
aag gcc ggt ccc atc gac gcg gcc agc gtc gtg cgc ggc ggg ctt gtc 6442
Lys Ala Gly Pro Ile Asp Ala Ala Ser Val Val Arg Gly Gly Leu Val
190 195 200
cgc gtg ggc ggg aac ggg ccg ggt tcg atc agc agc ttc gat ttg ccc 6490
Arg Val Gly Gly Asn Gly Pro Gly Ser Ile Ser Ser Phe Asp Leu Pro
205 210 215
gag gat cac gac ctt gtc gcg gga cgc ggc tgg tac tgg gta ctg cac 6538
Glu Asp His Asp Leu Val Ala Gly Arg Gly Trp Tyr Trp Val Leu His
220 225 230 235
ggg cgc ccc gtc agc ggg acc ggc gaa tgc gtc agc gcg gtc gcg gcg 6586
Gly Arg Pro Val Ser Gly Thr Gly Glu Cys Val Ser Ala Val Ala Ala
240 245 250
gcg cat ggt cgc gat gcg gcg ctg tgg gac gcc ttc gca gtc tgc acc 6634
Ala His Gly Arg Asp Ala Ala Leu Trp Asp Ala Phe Ala Val Cys Thr
255 260 265
cgc gcg ttg gag gcc gcg ctg ctg tct ggg ggc agc ccc gac gcc gcc 6682
Arg Ala Leu Glu Ala Ala Leu Leu Ser Gly Gly Ser Pro Asp Ala Ala
270 275 280
atc acc gag aac cag cgc ctg ctg gaa cgc atc ggc gtc gtg ccg gca 6730
Ile Thr Glu Asn Gln Arg Leu Leu Glu Arg Ile Gly Val Val Pro Ala
285 290 295
gcg acg cag gcc ctc gtg gcc cag atc gag gag gcg ggt ggc gcg gcc 6778
Ala Thr Gln Ala Leu Val Ala Gln Ile Glu Glu Ala Gly Gly Ala Ala
300 305 310 315
aag atc tgc ggc gca ggt tcc gtg cgg ggc gat cac ggc ggg gcg gtc 6826
Lys Ile Cys Gly Ala Gly Ser Val Arg Gly Asp His Gly Gly Ala Val
320 325 330
ctc gtg cgg att gac gac gcg cag gcg atg gct tcg gtc atg gcg cgc 6874
Leu Val Arg Ile Asp Asp Ala Gln Ala Met Ala Ser Val Met Ala Arg
335 340 345
cat ccc gac ctc gac tgg gcg ccc ctg cgc atg tcg cgc acg ggg gcg 6922
His Pro Asp Leu Asp Trp Ala Pro Leu Arg Met Ser Arg Thr Gly Ala
350 355 360
gca ccc ggc ccc gcg ccg cgt gcg caa ccg ctg ccg ggg cag ggc tga 6970
Ala Pro Gly Pro Ala Pro Arg Ala Gln Pro Leu Pro Gly Gln Gly
365 370 375
tggatcaggt catccgcgcc agcgcgccgg gttcggtcat gatcacgggc gaacatgccg 7030
tggtctatgg acaccgcgcc atcgtcgccg ggatcgagca gcgcgcccat gtgacgatcg 7090
tcccgcgtgc cgaccgcatg tttcgcatca cctcgcagat cggggcgccg cagcaggggt 7150
cgctggacga tctgcctgcg ggcgggacct atcgcttcgt gctggccgcc atcgcgcgac 7210
acgcgccgga cctgccttgc gggttcgaca tggacatcac ctcggggatc gatccgaggc 7270
tcgggcttgg atcctcggcg gcggtgacgg tcgcctgcct cggcgcgctg tcgcggctgg 7330
cggggcgggg gaccgagggg ctgcatgacg acgcgctgcg catcgtccgc gccatccagg 7390
gcaggggcag cggggccgat ctggcggcca gcctgcatgg cggcttcgtc gcctatcgcg 7450
cgcccgatgg cggtgccgcg cagatcgagg cgcttccggt gccgccgggg ccgttcggcc 7510
tgcgctatgc gggctacaag accccgacag ccgaggtgct gcgccttgtg gccgatcgga 7570
tggcgggcaa cgaggccgct ttcgacgcgc tctactcccg gatgggcgca agcgcagatg 7630
ccgcgatccg cgcggcgcaa gggctggact gggctgcatt ccacgacgcg ctgaacgaat 7690
accagcgcct gatggagcag ctgggcgtgt ccgacgacac gctggacgcg atcatccgcg 7750
aggcgcgcga cgcgggcgcc gcagtcgcca agatctccgg ctcggggctg ggggattgcg 7810
tgctggcact gggcgaccag cccaagggtt tcgtgcccgc aagcattgcc gagaagggac 7870
ttgttttcga tgactgatgc cgtccgcgac atgatcgccc gtgccatggc gggcgcgacc 7930
gacatccgag cagccgaggc ttatgcgccc agcaacatcg cgctgtcgaa atactggggc 7990
aagcgcgacg ccgcgcggaa ccttccgctg aacagctccg tctcgatctc gttggcgaac 8050
tggggctctc atacgcgggt cgaggggtcc ggcacgggcc acgacgaggt gcatcacaac 8110
ggcacgctgc tggatccggg cgacgccttc gcgcgccgcg cgttggcatt cgctgacctg 8170
ttccgggggg ggaggcacct gccgctgcgg atcacgacgc agaactcgat cccgacggcg 8230
gcggggcttg cctcgtcggc ctcggggttc gcggcgctga cccgtgcgct ggcgggggcg 8290
ttcgggctgg atctggacga cacggatctg agccgcatcg cccggatcgg cagtggcagc 8350
gccgcccgct cgatctggca cggcttcgtc cgctggaacc ggggcgaggc cgaggatggg 8410
catgacagcc acggcgtccc gctggacctg cgctggcccg gcttccgcat cgcgatcgtg 8470
gccgtggaca aggggcccaa gcctttcagt tcgcgcgacg gcatgaacca cacggtcgag 8530
accagcccgc tgttcccgcc ctggcctgcg caggcggaag cggattgccg cgtcatcgag 8590
gatgcgatcg ccgcccgcga catggccgcc ctgggtccgc gggtcgaggc gaacgccctt 8650
gcgatgcacg ccacgatgat ggccgcgcgc ccgccgctct gctacctgac gggcggcagc 8710
tggcaggtgc tggaacgcct gtggcaggcc cgcgcggacg ggcttgcggc ctttgcgacg 8770
atggatgccg gcccgaacgt caagctgatc ttcgaggaaa gcagcgccgc cgacgtgctg 8830
tacctgttcc ccgacgccag cctgatcgcg ccgttcgagg ggcgttgaac gcgtaagacg 8890
accactgggt aaggttctgc cgcgcgtggt ctcgactgcc tgcaaagagg tgcttgagtt 8950
gctgcgtgac tgcggcggcc gacttcgtgg gacttgcccg ccacgctgac gcgctggaaa 9010
cgcgcccgcg gattacgacc gcgtcattgc cctgaaccaa tttcccgtcg gtcgac 9066
<210> 49
<211> 378
<212> PRT
<213> Paracoccus sp.
<400> 49
Met Ser Thr Gly Arg Pro Glu Ala Gly Ala His Ala Pro Gly Lys Leu
1 5 10 15
Ile Leu Ser Gly Glu His Ser Val Leu Tyr Gly Ala Pro Ala Leu Ala
20 25 30
Met Ala Ile Ala Arg Tyr Thr Glu Val Trp Phe Thr Pro Leu Gly Ile
35 40 45
Gly Glu Gly Ile Arg Thr Thr Phe Ala Asn Leu Ser Gly Gly Ala Thr
50 55 60
Tyr Ser Leu Lys Leu Leu Ser Gly Phe Lys Ser Arg Leu Asp Arg Arg
65 70 75 80
Phe Glu Gln Phe Leu Asn Gly Asp Leu Lys Val His Lys Val Leu Thr
85 90 95
His Pro Asp Asp Leu Ala Val Tyr Ala Leu Ala Ser Leu Leu His Asp
100 105 110
Lys Pro Pro Gly Thr Ala Ala Met Pro Gly Ile Gly Ala Met His His
115 120 125
Leu Pro Arg Pro Gly Glu Leu Gly Ser Arg Thr Glu Leu Pro Ile Gly
130 135 140
Ala Gly Met Gly Ser Ser Ala Ala Ile Val Ala Ala Thr Thr Val Leu
145 150 155 160
Phe Glu Thr Leu Leu Asp Arg Pro Lys Thr Pro Glu Gln Arg Phe Asp
165 170 175
Arg Val Arg Phe Cys Glu Arg Leu Lys His Gly Lys Ala Gly Pro Ile
180 185 190
Asp Ala Ala Ser Val Val Arg Gly Gly Leu Val Arg Val Gly Gly Asn
195 200 205
Gly Pro Gly Ser Ile Ser Ser Phe Asp Leu Pro Glu Asp His Asp Leu
210 215 220
Val Ala Gly Arg Gly Trp Tyr Trp Val Leu His Gly Arg Pro Val Ser
225 230 235 240
Gly Thr Gly Glu Cys Val Ser Ala Val Ala Ala Ala His Gly Arg Asp
245 250 255
Ala Ala Leu Trp Asp Ala Phe Ala Val Cys Thr Arg Ala Leu Glu Ala
260 265 270
Ala Leu Leu Ser Gly Gly Ser Pro Asp Ala Ala Ile Thr Glu Asn Gln
275 280 285
Arg Leu Leu Glu Arg Ile Gly Val Val Pro Ala Ala Thr Gln Ala Leu
290 295 300
Val Ala Gln Ile Glu Glu Ala Gly Gly Ala Ala Lys Ile Cys Gly Ala
305 310 315 320
Gly Ser Val Arg Gly Asp His Gly Gly Ala Val Leu Val Arg Ile Asp
325 330 335
Asp Ala Gln Ala Met Ala Ser Val Met Ala Arg His Pro Asp Leu Asp
340 345 350
Trp Ala Pro Leu Arg Met Ser Arg Thr Gly Ala Ala Pro Gly Pro Ala
355 360 365
Pro Arg Ala Gln Pro Leu Pro Gly Gln Gly
370 375
<210> 50
<211> 9066
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (6970)..(7884)
<400> 50
ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60
cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120
cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180
acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240
tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300
cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360
tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420
tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480
attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540
atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600
cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660
atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720
gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780
tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840
cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900
tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960
catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020
tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080
cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140
gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200
gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260
ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320
gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380
atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440
gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500
atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560
catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620
cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680
tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740
gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800
gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860
ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920
acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980
acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040
cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100
tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160
ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220
acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280
gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340
ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400
acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460
tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520
gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580
tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640
tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700
gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760
tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820
tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880
gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940
tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000
cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060
aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120
cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180
gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240
agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300
ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360
ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420
tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480
acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540
cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600
accccggaga gttggtccgc acccacatgg agatggagcg atgaccgaca gcaaggatca 3660
ccatgtcgcg gggcgcaagc tggaccatct gcgtgcattg gacgacgatg cggatatcga 3720
ccggggcgac agcggcttcg accgcatcgc gctgacccat cgcgccctgc ccgaggtgga 3780
tttcgacgcc atcgacacgg cgaccagctt cctgggccgt gaactgtcct tcccgctgct 3840
gatctcgtcc atgaccggcg gcaccggcga ggagatcgag cgcatcaacc gcaacctggc 3900
cgctggtgcc gaggaggccc gcgtcgccat ggcggtgggc tcgcagcgcg tgatgttcac 3960
cgacccctcg gcgcgggcca gcttcgacct gcgcgcccat gcgcccaccg tgccgctgct 4020
ggccaatatc ggcgcggtgc agctgaacat ggggctgggg ctgaaggaat gcctggccgc 4080
gatcgaggtg ctgcaggcgg acggcctgta tctgcacctg aaccccctgc aagaggccgt 4140
ccagcccgag ggggatcgcg actttgccga tctgggcagc aagatcgcgg ccatcgcccg 4200
cgacgttccc gtgcccgtcc tgctgaagga ggtgggctgc ggcctgtcgg cggccgatat 4260
cgccatcggg ctgcgcgccg ggatccggca tttcgacgtg gccggtcgcg gcggcacatc 4320
ctggagccgg atcgagtatc gccgccgcca gcgggccgat gacgacctgg gcctggtctt 4380
ccaggactgg ggcctgcaga ccgtggacgc cctgcgcgag gcgcggcccg cgcttgcggc 4440
ccatgatgga accagcgtgc tgatcgccag cggcggcatc cgcaacggtg tcgacatggc 4500
gaaatgcgtc atcctggggg ccgacatgtg cggggtcgcc gcgcccctgc tgaaagcggc 4560
ccaaaactcg cgcgaggcgg ttgtatccgc catccggaaa ctgcatctgg agttccggac 4620
agccatgttc ctcctgggtt gcggcacgct tgccgacctg aaggacaatt cctcgcttat 4680
ccgtcaatga aagtgcctaa gatgaccgtg acaggaatcg aagcgatcag cttctacacc 4740
ccccagaact acgtgggact ggatatcctt gccgcgcatc acgggatcga ccccgagaag 4800
ttctcgaagg ggatcgggca ggagaaaatc gcactgcccg gccatgacga ggatatcgtg 4860
accatggccg ccgaggccgc gctgccgatc atcgaacgcg cgggcacgca gggcatcgac 4920
acggttctgt tcgccaccga gagcgggatc gaccagtcga aggccgccgc catctatctg 4980
cgccgcctgc tggacctgtc gcccaactgc cgttgcgtcg agctgaagca ggcctgctat 5040
tccgcgacgg cggcgctgca gatggcctgc gcgcatgtcg cccgcaagcc cgaccgcaag 5100
gtgctggtga tcgcgtccga tgtcgcgcgc tatgaccgcg aaagctcggg cgaggcgacg 5160
cagggtgcgg gcgccgtcgc catccttgtc agcgccgatc ccaaggtggc cgagatcggc 5220
accgtctcgg ggctgttcac cgaggatatc atggatttct ggcggccgaa ccaccgccgc 5280
acgcccctgt tcgacggcaa ggcatcgacg ctgcgctatc tgaacgcgct ggtcgaggcg 5340
tggaacgact atcgcgcgaa tggcggccac gagttcgccg atttcgcgca tttctgctat 5400
cacgtgccgt tctcgcggat gggcgagaag gcgaacagcc acctggccaa ggcgaacaag 5460
acgccggtgg acatggggca ggtgcagacg ggcctgatct acaaccggca ggtcgggaac 5520
tgctataccg ggtcgatcta cctggcattc gcctcgctgc tggagaacgc tcaggaggac 5580
ctgaccggcg cgctggtcgg tctgttcagc tatggctcgg gtgcgacggg cgaattcttc 5640
gatgcgcgga tcgcgcccgg ttaccgcgac cacctgttcg cggaacgcca tcgcgaattg 5700
ctgcaggatc gcacgcccgt cacatatgac gaatacgttg ccctgtggga cgagatcgac 5760
ctgacgcagg gcgcgcccga caaggcgcgc ggtcgtttca ggctggcagg tatcgaggac 5820
gagaagcgca tctatgtcga ccggcaggcc tgaagcaggc gcccatgccc cgggcaagct 5880
gatcctgtcc ggggaacatt ccgtgctcta tggtgcgccc gcgcttgcca tggccatcgc 5940
ccgctatacc gaggtgtggt tcacgccgct tggcattggc gaggggatac gcacgacatt 6000
cgccaatctc tcgggcgggg cgacctattc gctgaagctg ctgtcggggt tcaagtcgcg 6060
gctggaccgc cggttcgagc agttcctgaa cggcgaccta aaggtgcaca aggtcctgac 6120
ccatcccgac gatctggcgg tctatgcgct ggcgtcgctt ctgcacgaca agccgccggg 6180
gaccgccgcg atgccgggca tcggcgcgat gcaccacctg ccgcgaccgg gtgagctggg 6240
cagccggacg gagctgccca tcggcgcggg catggggtcg tctgcggcca tcgtcgcggc 6300
caccacggtc ctgttcgaga cgctgctgga ccggcccaag acgcccgaac agcgcttcga 6360
ccgcgtccgc ttctgcgagc ggttgaagca cggcaaggcc ggtcccatcg acgcggccag 6420
cgtcgtgcgc ggcgggcttg tccgcgtggg cgggaacggg ccgggttcga tcagcagctt 6480
cgatttgccc gaggatcacg accttgtcgc gggacgcggc tggtactggg tactgcacgg 6540
gcgccccgtc agcgggaccg gcgaatgcgt cagcgcggtc gcggcggcgc atggtcgcga 6600
tgcggcgctg tgggacgcct tcgcagtctg cacccgcgcg ttggaggccg cgctgctgtc 6660
tgggggcagc cccgacgccg ccatcaccga gaaccagcgc ctgctggaac gcatcggcgt 6720
cgtgccggca gcgacgcagg ccctcgtggc ccagatcgag gaggcgggtg gcgcggccaa 6780
gatctgcggc gcaggttccg tgcggggcga tcacggcggg gcggtcctcg tgcggattga 6840
cgacgcgcag gcgatggctt cggtcatggc gcgccatccc gacctcgact gggcgcccct 6900
gcgcatgtcg cgcacggggg cggcacccgg ccccgcgccg cgtgcgcaac cgctgccggg 6960
gcagggctg atg gat cag gtc atc cgc gcc agc gcg ccg ggt tcg gtc atg 7011
Met Asp Gln Val Ile Arg Ala Ser Ala Pro Gly Ser Val Met
1 5 10
atc acg ggc gaa cat gcc gtg gtc tat gga cac cgc gcc atc gtc gcc 7059
Ile Thr Gly Glu His Ala Val Val Tyr Gly His Arg Ala Ile Val Ala
15 20 25 30
ggg atc gag cag cgc gcc cat gtg acg atc gtc ccg cgt gcc gac cgc 7107
Gly Ile Glu Gln Arg Ala His Val Thr Ile Val Pro Arg Ala Asp Arg
35 40 45
atg ttt cgc atc acc tcg cag atc ggg gcg ccg cag cag ggg tcg ctg 7155
Met Phe Arg Ile Thr Ser Gln Ile Gly Ala Pro Gln Gln Gly Ser Leu
50 55 60
gac gat ctg cct gcg ggc ggg acc tat cgc ttc gtg ctg gcc gcc atc 7203
Asp Asp Leu Pro Ala Gly Gly Thr Tyr Arg Phe Val Leu Ala Ala Ile
65 70 75
gcg cga cac gcg ccg gac ctg cct tgc ggg ttc gac atg gac atc acc 7251
Ala Arg His Ala Pro Asp Leu Pro Cys Gly Phe Asp Met Asp Ile Thr
80 85 90
tcg ggg atc gat ccg agg ctc ggg ctt gga tcc tcg gcg gcg gtg acg 7299
Ser Gly Ile Asp Pro Arg Leu Gly Leu Gly Ser Ser Ala Ala Val Thr
95 100 105 110
gtc gcc tgc ctc ggc gcg ctg tcg cgg ctg gcg ggg cgg ggg acc gag 7347
Val Ala Cys Leu Gly Ala Leu Ser Arg Leu Ala Gly Arg Gly Thr Glu
115 120 125
ggg ctg cat gac gac gcg ctg cgc atc gtc cgc gcc atc cag ggc agg 7395
Gly Leu His Asp Asp Ala Leu Arg Ile Val Arg Ala Ile Gln Gly Arg
130 135 140
ggc agc ggg gcc gat ctg gcg gcc agc ctg cat ggc ggc ttc gtc gcc 7443
Gly Ser Gly Ala Asp Leu Ala Ala Ser Leu His Gly Gly Phe Val Ala
145 150 155
tat cgc gcg ccc gat ggc ggt gcc gcg cag atc gag gcg ctt ccg gtg 7491
Tyr Arg Ala Pro Asp Gly Gly Ala Ala Gln Ile Glu Ala Leu Pro Val
160 165 170
ccg ccg ggg ccg ttc ggc ctg cgc tat gcg ggc tac aag acc ccg aca 7539
Pro Pro Gly Pro Phe Gly Leu Arg Tyr Ala Gly Tyr Lys Thr Pro Thr
175 180 185 190
gcc gag gtg ctg cgc ctt gtg gcc gat cgg atg gcg ggc aac gag gcc 7587
Ala Glu Val Leu Arg Leu Val Ala Asp Arg Met Ala Gly Asn Glu Ala
195 200 205
gct ttc gac gcg ctc tac tcc cgg atg ggc gca agc gca gat gcc gcg 7635
Ala Phe Asp Ala Leu Tyr Ser Arg Met Gly Ala Ser Ala Asp Ala Ala
210 215 220
atc cgc gcg gcg caa ggg ctg gac tgg gct gca ttc cac gac gcg ctg 7683
Ile Arg Ala Ala Gln Gly Leu Asp Trp Ala Ala Phe His Asp Ala Leu
225 230 235
aac gaa tac cag cgc ctg atg gag cag ctg ggc gtg tcc gac gac acg 7731
Asn Glu Tyr Gln Arg Leu Met Glu Gln Leu Gly Val Ser Asp Asp Thr
240 245 250
ctg gac gcg atc atc cgc gag gcg cgc gac gcg ggc gcc gca gtc gcc 7779
Leu Asp Ala Ile Ile Arg Glu Ala Arg Asp Ala Gly Ala Ala Val Ala
255 260 265 270
aag atc tcc ggc tcg ggg ctg ggg gat tgc gtg ctg gca ctg ggc gac 7827
Lys Ile Ser Gly Ser Gly Leu Gly Asp Cys Val Leu Ala Leu Gly Asp
275 280 285
cag ccc aag ggt ttc gtg ccc gca agc att gcc gag aag gga ctt gtt 7875
Gln Pro Lys Gly Phe Val Pro Ala Ser Ile Ala Glu Lys Gly Leu Val
290 295 300
ttc gat gac tgatgc cgtccgcgac atgatcgccc gtgccatggc gggcgcgacc 7930
Phe Asp Asp
305
gacatccgag cagccgaggc ttatgcgccc agcaacatcg cgctgtcgaa atactggggc 7990
aagcgcgacg ccgcgcggaa ccttccgctg aacagctccg tctcgatctc gttggcgaac 8050
tggggctctc atacgcgggt cgaggggtcc ggcacgggcc acgacgaggt gcatcacaac 8110
ggcacgctgc tggatccggg cgacgccttc gcgcgccgcg cgttggcatt cgctgacctg 8170
ttccgggggg ggaggcacct gccgctgcgg atcacgacgc agaactcgat cccgacggcg 8230
gcggggcttg cctcgtcggc ctcggggttc gcggcgctga cccgtgcgct ggcgggggcg 8290
ttcgggctgg atctggacga cacggatctg agccgcatcg cccggatcgg cagtggcagc 8350
gccgcccgct cgatctggca cggcttcgtc cgctggaacc ggggcgaggc cgaggatggg 8410
catgacagcc acggcgtccc gctggacctg cgctggcccg gcttccgcat cgcgatcgtg 8470
gccgtggaca aggggcccaa gcctttcagt tcgcgcgacg gcatgaacca cacggtcgag 8530
accagcccgc tgttcccgcc ctggcctgcg caggcggaag cggattgccg cgtcatcgag 8590
gatgcgatcg ccgcccgcga catggccgcc ctgggtccgc gggtcgaggc gaacgccctt 8650
gcgatgcacg ccacgatgat ggccgcgcgc ccgccgctct gctacctgac gggcggcagc 8710
tggcaggtgc tggaacgcct gtggcaggcc cgcgcggacg ggcttgcggc ctttgcgacg 8770
atggatgccg gcccgaacgt caagctgatc ttcgaggaaa gcagcgccgc cgacgtgctg 8830
tacctgttcc ccgacgccag cctgatcgcg ccgttcgagg ggcgttgaac gcgtaagacg 8890
accactgggt aaggttctgc cgcgcgtggt ctcgactgcc tgcaaagagg tgcttgagtt 8950
gctgcgtgac tgcggcggcc gacttcgtgg gacttgcccg ccacgctgac gcgctggaaa 9010
cgcgcccgcg gattacgacc gcgtcattgc cctgaaccaa tttcccgtcg gtcgac 9066
<210> 51
<211> 305
<212> PRT
<213> Paracoccus sp.
<400> 51
Met Asp Gln Val Ile Arg Ala Ser Ala Pro Gly Ser Val Met Ile Thr
1 5 10 15
Gly Glu His Ala Val Val Tyr Gly His Arg Ala Ile Val Ala Gly Ile
20 25 30
Glu Gln Arg Ala His Val Thr Ile Val Pro Arg Ala Asp Arg Met Phe
35 40 45
Arg Ile Thr Ser Gln Ile Gly Ala Pro Gln Gln Gly Ser Leu Asp Asp
50 55 60
Leu Pro Ala Gly Gly Thr Tyr Arg Phe Val Leu Ala Ala Ile Ala Arg
65 70 75 80
His Ala Pro Asp Leu Pro Cys Gly Phe Asp Met Asp Ile Thr Ser Gly
85 90 95
Ile Asp Pro Arg Leu Gly Leu Gly Ser Ser Ala Ala Val Thr Val Ala
100 105 110
Cys Leu Gly Ala Leu Ser Arg Leu Ala Gly Arg Gly Thr Glu Gly Leu
115 120 125
His Asp Asp Ala Leu Arg Ile Val Arg Ala Ile Gln Gly Arg Gly Ser
130 135 140
Gly Ala Asp Leu Ala Ala Ser Leu His Gly Gly Phe Val Ala Tyr Arg
145 150 155 160
Ala Pro Asp Gly Gly Ala Ala Gln Ile Glu Ala Leu Pro Val Pro Pro
165 170 175
Gly Pro Phe Gly Leu Arg Tyr Ala Gly Tyr Lys Thr Pro Thr Ala Glu
180 185 190
Val Leu Arg Leu Val Ala Asp Arg Met Ala Gly Asn Glu Ala Ala Phe
195 200 205
Asp Ala Leu Tyr Ser Arg Met Gly Ala Ser Ala Asp Ala Ala Ile Arg
210 215 220
Ala Ala Gln Gly Leu Asp Trp Ala Ala Phe His Asp Ala Leu Asn Glu
225 230 235 240
Tyr Gln Arg Leu Met Glu Gln Leu Gly Val Ser Asp Asp Thr Leu Asp
245 250 255
Ala Ile Ile Arg Glu Ala Arg Asp Ala Gly Ala Ala Val Ala Lys Ile
260 265 270
Ser Gly Ser Gly Leu Gly Asp Cys Val Leu Ala Leu Gly Asp Gln Pro
275 280 285
Lys Gly Phe Val Pro Ala Ser Ile Ala Glu Lys Gly Leu Val Phe Asp
290 295 300
Asp
305
<210> 52
<211> 9066
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (7880)..(8875)
<400> 52
ggatccggca gctcgacacg ccgcagaacc tgtacgaacg tcccgccagc cgcttcgtcg 60
cggaattcgt cgggcgcggg acggtggtgc ccgtgcaggc ccatgacggc gcgggccgcg 120
cccgcatcct gggggccgag gtggcggtga acgccgcccc gcaatcgcgc tttgtcgatc 180
acgtctgcct gcgccccgag aaccttgcca tctccgagac gggcgacctg cgcgccaagg 240
tcgcgcgcgt cacctatctt ggcgggaaat acctgctgga aaccgtgctg gattgcggca 300
cccggctggt gaccgagacc cgcgcccgct tcgatacggg cgcgcagctt ggcctgacca 360
tcaacgcccc ctgggccttt gccgaggatt gaatggacag cgtgaagatc ctttcgggca 420
tgggcgtgaa gggccctgcc tgcatcaggc tggatgtcgg cgggatgcgc ctgatcctcg 480
attgcgggac cggcccggac gagggcgcgg agttcgaccc cgcctggctg gcggacgcgg 540
atgcggtgct gatcacccat gaccacgtgg accatatcgg cggcgcgcgt cacgcggtcg 600
cggcggggct gccgatccat gcgacgcggc agacggcggg gttgctgccc gcgggggcgg 660
atctgcgcct gctgcccgaa cgcggtgtca cgcggatcgc cggggtcgat ctgacgaccg 720
gtcgcaacgg gcatgccgcg ggcggcgtct ggatgcattt cgacatgggc gaggggctgt 780
tctattccgg cgactggtcc gaggaatccg actggttcgc cttcgatccg cccccgcctg 840
cggggacggc gattctcgac tgctcctatg gcggtttcga cgtggcgcaa tcggattgca 900
tcgcggacct ggacgacctg ctcgaggtgc tgccggggca ggtactgctg ccggtgccgc 960
catccggccg cgcggccgag ctggccctgc ggctgatccg ccgccacgga ccgggcagcg 1020
tgatggtcga cgacgcctgc ctgccggcca tcgcgcaact gcccgaggcg cgcggactgg 1080
cctacgccac cgaggcacgc tttcttgtct gcgacacgcc gaacgccgaa agccggcgcg 1140
gcatggcggc atctgcaagc atggcgcgat gcgggcaggc tggggcggga cgcgcatgtc 1200
gtcttcaccg ggcacatgaa cgtccatgcg cgcgcattct gcgaccgccc cggcgggcat 1260
ttccgccgct ggaacgtgca tccgccgctg cgcgaccagc gacggatgct ggaacggctg 1320
gccgcgcggc gctttgcccc ggccttctgc cccgaccccg agatctatct ggcgctggac 1380
atgggcgcgc aggtcttcat gcaccaggag gtgacgccat gatccccgcc cgcagcttct 1440
gcctgatccg ccacggcgaa acgaccgcca atgcaggggc gatcatcgcg ggcgcaaccg 1500
atgtgcccct gacgccaagg ggccgcgatc aggcccgcgc cctggcaggg cgcgaatggc 1560
catcgggcat cgcgctgttc gccagcccga tgtcgcgtgc ccgcgatacc gcgctgctgg 1620
cctttccggg gcgcgaccac cagcccgaac ccgatctgcg cgaacgcgac tggggcatct 1680
tcgagggacg ccccgtcgcc gatctgcccc cgcgcgaaat cacgccgcag gggggcgagg 1740
gctgggacga cgtgatggcc cgcgtggacc gcgcgatccg gcggatctgc gcgacctcgg 1800
gcgatgcgct gccggtgctg gtctgccatt cgggcgtgat ccgtgccgcg cgcgtgctgt 1860
ggaccaccgg cgatgcgggc gatcgtccgc ccaacgccac gccgatcctg ttcagcccgg 1920
acggcgaccg attaaaggaa ggaacgatat gaccgccacc accccctgcg tcgtcttcga 1980
acgtggacgg cacgcttgcc gaattcgacg ccgaccgcct gggccatctt gtccacggca 2040
cgaccaagca ctgggacgcc ttccaccacg cgatggccga cgccccgccc atccccgagg 2100
tcgcccgcct gatgcgcaag ctgaaggagg ggggcgagac ggtcgtcatc tgctcggggc 2160
ggccccgcgg ctggcaggat cagacgatcg catggctgcg caagcacgac ctgcccttcg 2220
acgggatcta tctgcgcccc gaggatcagg acggcgccag cgaccccgag gtcaagcgcc 2280
gcgccctagc cgagatgcgc gccgacgggc tggcgccctg gctggtcgtg gacgaccggc 2340
ggtccgtcgt ggatgcctgg cgggccgagg ggctggtctg cctgcaatgc gcgccggggg 2400
acttctaggg ccgcgcgacg ggggcgcgga caggctgggc gggaaaccgc cccgccacca 2460
tgtcctgcac gcgtcgaacc gcccgtccga cgccggtttc cgcacggaaa cgcgcggcaa 2520
gttgacataa cttgcacgcg acgtctcgat tctgcccgcg aagaatgcga tgcatccaga 2580
tgatgcagaa cgaagaagcg gaagcgcccg tgaaagacca gatgatttcc cataccccgg 2640
tgcccacgca atgggtcggc ccgatcctgt tccgcggccc cgtcgtcgag ggcccgatca 2700
gcgcgccgct ggccacctac gagacgccgc tctggccctc gaccgcgcgg ggggcagggg 2760
tttcccggca ttcgggcggg atccaggtct cgctggtcga cgaacgcatg agccgctcga 2820
tcgcgctgcg ggcgcatgac ggggcggcgg cgaccgccgc ctggcagtcg atcaaggccc 2880
gccaggaaga ggtcgcggcc gtggtcgcca ccaccagccg cttcgcccgc cttgtcgagc 2940
tgaatcgcca gatcgtgggc aacctgcttt acatccgcat cgaatgcgtg acgggcgacg 3000
cctcgggtca caacatggtc accaaggccg ccgaggccgt gcagggctgg atcctgtcgg 3060
aatacccgat gctggcctat tccacgatct cggggaacct gtgcaccgac aagaaggcgt 3120
cggcggtcaa cggcatcctg ggccgcggca aatacgccgt cgccgaggtc gagatcccgc 3180
gcaagatcct gacccgcgtg ctgcgcacca gcgccgagaa gatggtccgc ctgaactacg 3240
agaagaacta tgtcgggggt acgctggcgg ggtcgctgcg cagtgcgaac gcgcatttcg 3300
ccaacatgct gctgggcttc tacctggcga cggggcagga cgcggccaac atcatcgagg 3360
ccagccaggg cttcgtccat tgcgaggccc gcggcgagga tctgtatttc tcgtgcacgc 3420
tgcccaacct catcatgggc tcggtcggtg ccggcaaggg catcccctcg atcgaggaga 3480
acctgtcgcg gatgggctgc cgccagccgg gcgaacccgg cgacaacgcg cgccgtcttg 3540
cggcgatctg cgcgggcgtc gtgctgtgtg gtgaattgtc gctgcttgcg gcccagacca 3600
accccggaga gttggtccgc acccacatgg agatggagcg atgaccgaca gcaaggatca 3660
ccatgtcgcg gggcgcaagc tggaccatct gcgtgcattg gacgacgatg cggatatcga 3720
ccggggcgac agcggcttcg accgcatcgc gctgacccat cgcgccctgc ccgaggtgga 3780
tttcgacgcc atcgacacgg cgaccagctt cctgggccgt gaactgtcct tcccgctgct 3840
gatctcgtcc atgaccggcg gcaccggcga ggagatcgag cgcatcaacc gcaacctggc 3900
cgctggtgcc gaggaggccc gcgtcgccat ggcggtgggc tcgcagcgcg tgatgttcac 3960
cgacccctcg gcgcgggcca gcttcgacct gcgcgcccat gcgcccaccg tgccgctgct 4020
ggccaatatc ggcgcggtgc agctgaacat ggggctgggg ctgaaggaat gcctggccgc 4080
gatcgaggtg ctgcaggcgg acggcctgta tctgcacctg aaccccctgc aagaggccgt 4140
ccagcccgag ggggatcgcg actttgccga tctgggcagc aagatcgcgg ccatcgcccg 4200
cgacgttccc gtgcccgtcc tgctgaagga ggtgggctgc ggcctgtcgg cggccgatat 4260
cgccatcggg ctgcgcgccg ggatccggca tttcgacgtg gccggtcgcg gcggcacatc 4320
ctggagccgg atcgagtatc gccgccgcca gcgggccgat gacgacctgg gcctggtctt 4380
ccaggactgg ggcctgcaga ccgtggacgc cctgcgcgag gcgcggcccg cgcttgcggc 4440
ccatgatgga accagcgtgc tgatcgccag cggcggcatc cgcaacggtg tcgacatggc 4500
gaaatgcgtc atcctggggg ccgacatgtg cggggtcgcc gcgcccctgc tgaaagcggc 4560
ccaaaactcg cgcgaggcgg ttgtatccgc catccggaaa ctgcatctgg agttccggac 4620
agccatgttc ctcctgggtt gcggcacgct tgccgacctg aaggacaatt cctcgcttat 4680
ccgtcaatga aagtgcctaa gatgaccgtg acaggaatcg aagcgatcag cttctacacc 4740
ccccagaact acgtgggact ggatatcctt gccgcgcatc acgggatcga ccccgagaag 4800
ttctcgaagg ggatcgggca ggagaaaatc gcactgcccg gccatgacga ggatatcgtg 4860
accatggccg ccgaggccgc gctgccgatc atcgaacgcg cgggcacgca gggcatcgac 4920
acggttctgt tcgccaccga gagcgggatc gaccagtcga aggccgccgc catctatctg 4980
cgccgcctgc tggacctgtc gcccaactgc cgttgcgtcg agctgaagca ggcctgctat 5040
tccgcgacgg cggcgctgca gatggcctgc gcgcatgtcg cccgcaagcc cgaccgcaag 5100
gtgctggtga tcgcgtccga tgtcgcgcgc tatgaccgcg aaagctcggg cgaggcgacg 5160
cagggtgcgg gcgccgtcgc catccttgtc agcgccgatc ccaaggtggc cgagatcggc 5220
accgtctcgg ggctgttcac cgaggatatc atggatttct ggcggccgaa ccaccgccgc 5280
acgcccctgt tcgacggcaa ggcatcgacg ctgcgctatc tgaacgcgct ggtcgaggcg 5340
tggaacgact atcgcgcgaa tggcggccac gagttcgccg atttcgcgca tttctgctat 5400
cacgtgccgt tctcgcggat gggcgagaag gcgaacagcc acctggccaa ggcgaacaag 5460
acgccggtgg acatggggca ggtgcagacg ggcctgatct acaaccggca ggtcgggaac 5520
tgctataccg ggtcgatcta cctggcattc gcctcgctgc tggagaacgc tcaggaggac 5580
ctgaccggcg cgctggtcgg tctgttcagc tatggctcgg gtgcgacggg cgaattcttc 5640
gatgcgcgga tcgcgcccgg ttaccgcgac cacctgttcg cggaacgcca tcgcgaattg 5700
ctgcaggatc gcacgcccgt cacatatgac gaatacgttg ccctgtggga cgagatcgac 5760
ctgacgcagg gcgcgcccga caaggcgcgc ggtcgtttca ggctggcagg tatcgaggac 5820
gagaagcgca tctatgtcga ccggcaggcc tgaagcaggc gcccatgccc cgggcaagct 5880
gatcctgtcc ggggaacatt ccgtgctcta tggtgcgccc gcgcttgcca tggccatcgc 5940
ccgctatacc gaggtgtggt tcacgccgct tggcattggc gaggggatac gcacgacatt 6000
cgccaatctc tcgggcgggg cgacctattc gctgaagctg ctgtcggggt tcaagtcgcg 6060
gctggaccgc cggttcgagc agttcctgaa cggcgaccta aaggtgcaca aggtcctgac 6120
ccatcccgac gatctggcgg tctatgcgct ggcgtcgctt ctgcacgaca agccgccggg 6180
gaccgccgcg atgccgggca tcggcgcgat gcaccacctg ccgcgaccgg gtgagctggg 6240
cagccggacg gagctgccca tcggcgcggg catggggtcg tctgcggcca tcgtcgcggc 6300
caccacggtc ctgttcgaga cgctgctgga ccggcccaag acgcccgaac agcgcttcga 6360
ccgcgtccgc ttctgcgagc ggttgaagca cggcaaggcc ggtcccatcg acgcggccag 6420
cgtcgtgcgc ggcgggcttg tccgcgtggg cgggaacggg ccgggttcga tcagcagctt 6480
cgatttgccc gaggatcacg accttgtcgc gggacgcggc tggtactggg tactgcacgg 6540
gcgccccgtc agcgggaccg gcgaatgcgt cagcgcggtc gcggcggcgc atggtcgcga 6600
tgcggcgctg tgggacgcct tcgcagtctg cacccgcgcg ttggaggccg cgctgctgtc 6660
tgggggcagc cccgacgccg ccatcaccga gaaccagcgc ctgctggaac gcatcggcgt 6720
cgtgccggca gcgacgcagg ccctcgtggc ccagatcgag gaggcgggtg gcgcggccaa 6780
gatctgcggc gcaggttccg tgcggggcga tcacggcggg gcggtcctcg tgcggattga 6840
cgacgcgcag gcgatggctt cggtcatggc gcgccatccc gacctcgact gggcgcccct 6900
gcgcatgtcg cgcacggggg cggcacccgg ccccgcgccg cgtgcgcaac cgctgccggg 6960
gcagggctga tggatcaggt catccgcgcc agcgcgccgg gttcggtcat gatcacgggc 7020
gaacatgccg tggtctatgg acaccgcgcc atcgtcgccg ggatcgagca gcgcgcccat 7080
gtgacgatcg tcccgcgtgc cgaccgcatg tttcgcatca cctcgcagat cggggcgccg 7140
cagcaggggt cgctggacga tctgcctgcg ggcgggacct atcgcttcgt gctggccgcc 7200
atcgcgcgac acgcgccgga cctgccttgc gggttcgaca tggacatcac ctcggggatc 7260
gatccgaggc tcgggcttgg atcctcggcg gcggtgacgg tcgcctgcct cggcgcgctg 7320
tcgcggctgg cggggcgggg gaccgagggg ctgcatgacg acgcgctgcg catcgtccgc 7380
gccatccagg gcaggggcag cggggccgat ctggcggcca gcctgcatgg cggcttcgtc 7440
gcctatcgcg cgcccgatgg cggtgccgcg cagatcgagg cgcttccggt gccgccgggg 7500
ccgttcggcc tgcgctatgc gggctacaag accccgacag ccgaggtgct gcgccttgtg 7560
gccgatcgga tggcgggcaa cgaggccgct ttcgacgcgc tctactcccg gatgggcgca 7620
agcgcagatg ccgcgatccg cgcggcgcaa gggctggact gggctgcatt ccacgacgcg 7680
ctgaacgaat accagcgcct gatggagcag ctgggcgtgt ccgacgacac gctggacgcg 7740
atcatccgcg aggcgcgcga cgcgggcgcc gcagtcgcca agatctccgg ctcggggctg 7800
ggggattgcg tgctggcact gggcgaccag cccaagggtt tcgtgcccgc aagcattgcc 7860
gagaagggac ttgttttcg atg act gat gcc gtc cgc gac atg atc gcc cgt 7912
Met Thr Asp Ala Val Arg Asp Met Ile Ala Arg
1 5 10
gcc atg gcg ggc gcg acc gac atc cga gca gcc gag gct tat gcg ccc 7960
Ala Met Ala Gly Ala Thr Asp Ile Arg Ala Ala Glu Ala Tyr Ala Pro
15 20 25
agc aac atc gcg ctg tcg aaa tac tgg ggc aag cgc gac gcc gcg cgg 8008
Ser Asn Ile Ala Leu Ser Lys Tyr Trp Gly Lys Arg Asp Ala Ala Arg
30 35 40
aac ctt ccg ctg aac agc tcc gtc tcg atc tcg ttg gcg aac tgg ggc 8056
Asn Leu Pro Leu Asn Ser Ser Val Ser Ile Ser Leu Ala Asn Trp Gly
45 50 55
tct cat acg cgg gtc gag ggg tcc ggc acg ggc cac gac gag gtg cat 8104
Ser His Thr Arg Val Glu Gly Ser Gly Thr Gly His Asp Glu Val His
60 65 70 75
cac aac ggc acg ctg ctg gat ccg ggc gac gcc ttc gcg cgc cgc gcg 8152
His Asn Gly Thr Leu Leu Asp Pro Gly Asp Ala Phe Ala Arg Arg Ala
80 85 90
ttg gca ttc gct gac ctg ttc cgg ggg ggg agg cac ctg ccg ctg cgg 8200
Leu Ala Phe Ala Asp Leu Phe Arg Gly Gly Arg His Leu Pro Leu Arg
95 100 105
atc acg acg cag aac tcg atc ccg acg gcg gcg ggg ctt gcc tcg tcg 8248
Ile Thr Thr Gln Asn Ser Ile Pro Thr Ala Ala Gly Leu Ala Ser Ser
110 115 120
gcc tcg ggg ttc gcg gcg ctg acc cgt gcg ctg gcg ggg gcg ttc ggg 8296
Ala Ser Gly Phe Ala Ala Leu Thr Arg Ala Leu Ala Gly Ala Phe Gly
125 130 135
ctg gat ctg gac gac acg gat ctg agc cgc atc gcc cgg atc ggc agt 8344
Leu Asp Leu Asp Asp Thr Asp Leu Ser Arg Ile Ala Arg Ile Gly Ser
140 145 150 155
ggc agc gcc gcc cgc tcg atc tgg cac ggc ttc gtc cgc tgg aac cgg 8392
Gly Ser Ala Ala Arg Ser Ile Trp His Gly Phe Val Arg Trp Asn Arg
160 165 170
ggc gag gcc gag gat ggg cat gac agc cac ggc gtc ccg ctg gac ctg 8440
Gly Glu Ala Glu Asp Gly His Asp Ser His Gly Val Pro Leu Asp Leu
175 180 185
cgc tgg ccc ggc ttc cgc atc gcg atc gtg gcc gtg gac aag ggg ccc 8488
Arg Trp Pro Gly Phe Arg Ile Ala Ile Val Ala Val Asp Lys Gly Pro
190 195 200
aag cct ttc agt tcg cgc gac ggc atg aac cac acg gtc gag acc agc 8536
Lys Pro Phe Ser Ser Arg Asp Gly Met Asn His Thr Val Glu Thr Ser
205 210 215
ccg ctg ttc ccg ccc tgg cct gcg cag gcg gaa gcg gat tgc cgc gtc 8584
Pro Leu Phe Pro Pro Trp Pro Ala Gln Ala Glu Ala Asp Cys Arg Val
220 225 230 235
atc gag gat gcg atc gcc gcc cgc gac atg gcc gcc ctg ggt ccg cgg 8632
Ile Glu Asp Ala Ile Ala Ala Arg Asp Met Ala Ala Leu Gly Pro Arg
240 245 250
gtc gag gcg aac gcc ctt gcg atg cac gcc acg atg atg gcc gcg cgc 8680
Val Glu Ala Asn Ala Leu Ala Met His Ala Thr Met Met Ala Ala Arg
255 260 265
ccg ccg ctc tgc tac ctg acg ggc ggc agc tgg cag gtg ctg gaa cgc 8728
Pro Pro Leu Cys Tyr Leu Thr Gly Gly Ser Trp Gln Val Leu Glu Arg
270 275 280
ctg tgg cag gcc cgc gcg gac ggg ctt gcg gcc ttt gcg acg atg gat 8776
Leu Trp Gln Ala Arg Ala Asp Gly Leu Ala Ala Phe Ala Thr Met Asp
285 290 295
gcc ggc ccg aac gtc aag ctg atc ttc gag gaa agc agc gcc gcc gac 8824
Ala Gly Pro Asn Val Lys Leu Ile Phe Glu Glu Ser Ser Ala Ala Asp
300 305 310 315
gtg ctg tac ctg ttc ccc gac gcc agc ctg atc gcg ccg ttc gag ggg 8872
Val Leu Tyr Leu Phe Pro Asp Ala Ser Leu Ile Ala Pro Phe Glu Gly
320 325 330
cgt tgaac gcgtaagacg accactgggt aaggttctgc cgcgcgtggt ctcgactgcc 8930
Arg
tgcaaagagg tgcttgagtt gctgcgtgac tgcggcggcc gacttcgtgg gacttgcccg 8990
ccacgctgac gcgctggaaa cgcgcccgcg gattacgacc gcgtcattgc cctgaaccaa 9050
tttcccgtcg gtcgac 9066
<210> 53
<211> 332
<212> PRT
<213> Paracoccus sp.
<400> 53
Met Thr Asp Ala Val Arg Asp Met Ile Ala Arg Ala Met Ala Gly Ala
1 5 10 15
Thr Asp Ile Arg Ala Ala Glu Ala Tyr Ala Pro Ser Asn Ile Ala Leu
20 25 30
Ser Lys Tyr Trp Gly Lys Arg Asp Ala Ala Arg Asn Leu Pro Leu Asn
35 40 45
Ser Ser Val Ser Ile Ser Leu Ala Asn Trp Gly Ser His Thr Arg Val
50 55 60
Glu Gly Ser Gly Thr Gly His Asp Glu Val His His Asn Gly Thr Leu
65 70 75 80
Leu Asp Pro Gly Asp Ala Phe Ala Arg Arg Ala Leu Ala Phe Ala Asp
85 90 95
Leu Phe Arg Gly Gly Arg His Leu Pro Leu Arg Ile Thr Thr Gln Asn
100 105 110
Ser Ile Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Gly Phe Ala
115 120 125
Ala Leu Thr Arg Ala Leu Ala Gly Ala Phe Gly Leu Asp Leu Asp Asp
130 135 140
Thr Asp Leu Ser Arg Ile Ala Arg Ile Gly Ser Gly Ser Ala Ala Arg
145 150 155 160
Ser Ile Trp His Gly Phe Val Arg Trp Asn Arg Gly Glu Ala Glu Asp
165 170 175
Gly His Asp Ser His Gly Val Pro Leu Asp Leu Arg Trp Pro Gly Phe
180 185 190
Arg Ile Ala Ile Val Ala Val Asp Lys Gly Pro Lys Pro Phe Ser Ser
195 200 205
Arg Asp Gly Met Asn His Thr Val Glu Thr Ser Pro Leu Phe Pro Pro
210 215 220
Trp Pro Ala Gln Ala Glu Ala Asp Cys Arg Val Ile Glu Asp Ala Ile
225 230 235 240
Ala Ala Arg Asp Met Ala Ala Leu Gly Pro Arg Val Glu Ala Asn Ala
245 250 255
Leu Ala Met His Ala Thr Met Met Ala Ala Arg Pro Pro Leu Cys Tyr
260 265 270
Leu Thr Gly Gly Ser Trp Gln Val Leu Glu Arg Leu Trp Gln Ala Arg
275 280 285
Ala Asp Gly Leu Ala Ala Phe Ala Thr Met Asp Ala Gly Pro Asn Val
290 295 300
Lys Leu Ile Phe Glu Glu Ser Ser Ala Ala Asp Val Leu Tyr Leu Phe
305 310 315 320
Pro Asp Ala Ser Leu Ile Ala Pro Phe Glu Gly Arg
325 330
<210> 54
<211> 353
<212> PRT
<213> Streptomyces sp.
<400> 54
Met Thr Glu Thr His Ala Ile Ala Gly Val Pro Met Arg Trp Val Gly
1 5 10 15
Pro Leu Arg Ile Ser Gly Asn Val Ala Glu Thr Glu Thr Gln Val Pro
20 25 30
Leu Ala Thr Tyr Glu Ser Pro Leu Trp Pro Ser Val Gly Arg Gly Ala
35 40 45
Lys Val Ser Arg Leu Thr Glu Lys Gly Ile Val Ala Thr Leu Val Asp
50 55 60
Glu Arg Met Thr Arg Ser Val Ile Val Glu Ala Thr Asp Ala Gln Thr
65 70 75 80
Ala Tyr Met Ala Ala Gln Thr Ile His Ala Arg Ile Asp Glu Leu Arg
85 90 95
Glu Val Val Arg Gly Cys Ser Arg Phe Ala Gln Leu Ile Asn Ile Lys
100 105 110
His Glu Ile Asn Ala Asn Leu Leu Phe Ile Arg Phe Glu Phe Thr Thr
115 120 125
Gly Asp Ala Ser Gly His Asn Met Ala Thr Leu Ala Ser Asp Val Leu
130 135 140
Leu Gly His Leu Leu Glu Thr Ile Pro Gly Ile Ser Tyr Gly Ser Ile
145 150 155 160
Ser Gly Asn Tyr Cys Thr Asp Lys Lys Ala Thr Ala Ile Asn Gly Ile
165 170 175
Leu Gly Arg Gly Lys Asn Val Ile Thr Glu Leu Leu Val Pro Arg Asp
180 185 190
Val Val Glu Asn Asn Leu His Thr Thr Ala Ala Lys Ile Val Glu Leu
195 200 205
Asn Ile Arg Lys Asn Leu Leu Gly Thr Leu Leu Ala Gly Gly Ile Arg
210 215 220
Ser Ala Asn Ala His Phe Ala Asn Met Leu Leu Gly Phe Tyr Leu Ala
225 230 235 240
Thr Gly Gln Asp Ala Ala Asn Ile Val Glu Gly Ser Gln Gly Val Val
245 250 255
Met Ala Glu Asp Arg Asp Gly Asp Leu Tyr Phe Ala Cys Thr Leu Pro
260 265 270
Asn Leu Ile Val Gly Thr Val Gly Asn Gly Lys Gly Leu Gly Phe Val
275 280 285
Glu Thr Asn Leu Ala Arg Leu Gly Cys Arg Ala Asp Arg Glu Pro Gly
290 295 300
Glu Asn Ala Arg Arg Leu Ala Val Ile Ala Ala Ala Thr Val Leu Cys
305 310 315 320
Gly Glu Leu Ser Leu Leu Ala Ala Gln Thr Asn Pro Gly Glu Leu Met
325 330 335
Arg Ala His Val Gln Leu Glu Arg Asp Asn Lys Thr Ala Lys Val Gly
340 345 350
Ala
<210> 55
<211> 353
<212> PRT
<213> Streptomyces griseosporeus
<400> 55
Met Thr Glu Ala His Ala Thr Ala Gly Val Pro Met Arg Trp Val Gly
1 5 10 15
Pro Val Arg Ile Ser Gly Asn Val Ala Thr Ile Glu Thr Gln Val Pro
20 25 30
Leu Ala Thr Tyr Glu Ser Pro Leu Trp Pro Ser Val Gly Arg Gly Ala
35 40 45
Lys Val Ser Arg Leu Thr Glu Lys Gly Ile Val Ala Thr Leu Val Asp
50 55 60
Glu Arg Met Thr Arg Ser Val Leu Val Glu Ala Thr Asp Ala Leu Thr
65 70 75 80
Ala Leu Ser Ala Ala Arg Thr Ile Glu Ala Arg Ile Asp Glu Leu Arg
85 90 95
Glu Leu Val Arg Gly Cys Ser Arg Phe Ala Gln Leu Ile Gly Ile Arg
100 105 110
His Glu Ile Thr Gly Asn Leu Leu Phe Val Arg Phe Glu Phe Ser Thr
115 120 125
Gly Asp Ala Ser Gly His Asn Met Ala Thr Leu Ala Ser Asp Val Leu
130 135 140
Leu Gln His Leu Leu Glu Thr Val Pro Gly Ile Ser Tyr Gly Ser Ile
145 150 155 160
Ser Gly Asn Tyr Cys Thr Asp Lys Lys Ala Thr Ala Ile Asn Gly Ile
165 170 175
Leu Gly Arg Gly Lys Asn Val Val Thr Glu Leu Leu Val Pro Arg Asp
180 185 190
Val Val Ala Asp Val Leu Asn Thr Thr Ala Ala Lys Ile Ala Glu Leu
195 200 205
Asn Leu Arg Lys Asn Leu Leu Gly Thr Leu Leu Ala Gly Gly Ile Arg
210 215 220
Ser Ala Asn Ala His Tyr Ala Asn Met Leu Leu Ala Phe Tyr Leu Ala
225 230 235 240
Thr Gly Gln Asp Ala Ala Asn Ile Val Glu Gly Ser Gln Gly Val Val
245 250 255
Thr Ala Glu Asp Arg Asp Gly Asp Leu Tyr Leu Ala Cys Thr Leu Pro
260 265 270
Asn Leu Ile Val Gly Thr Val Gly Asn Gly Lys Gly Leu Gly Phe Val
275 280 285
Glu Thr Asn Leu Asn Arg Leu Gly Cys Arg Ala Asp Arg Glu Pro Gly
290 295 300
Glu Asn Ala Arg Arg Leu Ala Val Ile Ala Ala Ala Thr Val Leu Cys
305 310 315 320
Gly Glu Leu Ser Leu Leu Ala Ala Gln Thr Asn Pro Gly Glu Leu Met
325 330 335
Arg Ala His Val Gln Leu Glu Arg Gly His Thr Thr Ala Lys Ala Gly
340 345 350
Val
<210> 56
<211> 353
<212> PRT
<213> Streptomyces sp.
<400> 56
Met Thr Asp Thr His Ala Ile Ala Met Val Pro Met Lys Trp Val Gly
1 5 10 15
Pro Leu Arg Ile Ser Gly Asn Val Ala Thr Thr Glu Thr His Val Pro
20 25 30
Leu Ala Thr Tyr Glu Thr Pro Leu Trp Pro Ser Val Gly Arg Gly Ala
35 40 45
Lys Val Ser Met Leu Ser Glu Arg Gly Ile Ala Ala Thr Leu Val Asp
50 55 60
Glu Arg Met Thr Arg Ser Val Leu Val Glu Ala Thr Asp Ala Gln Thr
65 70 75 80
Ala Tyr Thr Ala Ala Arg Ala Ile Glu Ala Arg Ile Glu Glu Leu Arg
85 90 95
Ala Val Val Arg Thr Cys Ser Arg Phe Ala Glu Leu Leu Gln Val Arg
100 105 110
His Glu Ile Ala Gly Asn Leu Leu Phe Val Arg Phe Glu Phe Ser Thr
115 120 125
Arg Arg Pro Ser Gly His Asn Met Ala Thr Leu Ala Ser Asp Ala Leu
130 135 140
Leu Ala His Leu Leu Gln Thr Ile Pro Gly Ile Ser Tyr Gly Ser Ile
145 150 155 160
Ser Gly Asn Tyr Cys Thr Asp Lys Lys Ala Thr Ala Ile Asn Gly Ile
165 170 175
Leu Gly Arg Gly Lys Asn Val Val Thr Glu Leu Val Val Pro Arg Glu
180 185 190
Val Val Glu Arg Val Leu His Thr Thr Ala Ala Lys Ile Val Glu Leu
195 200 205
Asn Ile Arg Lys Asn Leu Leu Gly Thr Leu Leu Ala Gly Gly Ile Arg
210 215 220
Ser Ala Asn Ala His Tyr Ala Asn Met Leu Leu Gly Phe Tyr Leu Ala
225 230 235 240
Thr Gly Gln Asp Ala Ala Asn Ile Val Glu Gly Ser Gln Gly Val Thr
245 250 255
Leu Ala Glu Asp Arg Asp Gly Asp Leu Tyr Phe Ser Cys Asn Leu Pro
260 265 270
Asn Leu Ile Val Gly Thr Val Gly Asn Gly Lys Gly Leu Glu Phe Val
275 280 285
Glu Thr Asn Leu Asn Arg Leu Gly Cys Arg Glu Asp Arg Ala Pro Gly
290 295 300
Glu Asn Ala Arg Arg Leu Ala Val Ile Ala Ala Ala Thr Val Leu Cys
305 310 315 320
Gly Glu Leu Ser Leu Leu Ala Ala Gln Thr Asn Pro Gly Glu Leu Met
325 330 335
Arg Ala His Val Glu Leu Glu Arg Asp Asn Thr Thr Ala Glu Val Gly
340 345 350
Val
<210> 57
<211> 347
<212> PRT
<213> Erwinia herbicola
<400> 57
Met Lys Asp Glu Arg Leu Val Gln Arg Lys Asn Asp His Leu Asp Ile
1 5 10 15
Val Leu Asp Pro Arg Arg Ala Val Thr Gln Ala Ser Ala Gly Phe Glu
20 25 30
Arg Trp Arg Phe Thr His Cys Ala Leu Pro Glu Leu Asn Phe Ser Asp
35 40 45
Ile Thr Leu Glu Thr Thr Phe Leu Asn Arg Gln Leu Gln Ala Pro Leu
50 55 60
Leu Ile Ser Ser Met Thr Gly Gly Val Glu Arg Ser Arg His Ile Asn
65 70 75 80
Arg His Leu Ala Glu Ala Ala Gln Val Leu Lys Ile Ala Met Gly Val
85 90 95
Gly Ser Gln Arg Val Ala Ile Glu Ser Asp Ala Gly Leu Gly Leu Asp
100 105 110
Lys Thr Leu Arg Gln Leu Ala Pro Asp Val Pro Leu Leu Ala Asn Leu
115 120 125
Gly Ala Ala Gln Leu Thr Gly Arg Lys Gly Ile Asp Tyr Ala Arg Arg
130 135 140
Ala Val Glu Met Ile Glu Ala Asp Ala Leu Ile Val His Leu Asn Pro
145 150 155 160
Leu Gln Glu Ala Leu Gln Pro Gly Gly Asp Arg Asp Trp Arg Gly Arg
165 170 175
Leu Ala Ala Ile Glu Thr Leu Val Arg Glu Leu Pro Val Pro Leu Val
180 185 190
Val Lys Glu Val Gly Ala Gly Ile Ser Arg Thr Val Ala Gly Gln Leu
195 200 205
Ile Asp Ala Gly Val Thr Val Ile Asp Val Ala Gly Ala Gly Gly Thr
210 215 220
Ser Trp Ala Ala Val Glu Gly Glu Arg Ala Ala Thr Glu Gln Gln Arg
225 230 235 240
Ser Val Ala Asn Val Phe Ala Asp Trp Gly Ile Pro Thr Ala Glu Ala
245 250 255
Leu Val Asp Ile Ala Glu Ala Trp Pro Gln Met Pro Leu Ile Ala Ser
260 265 270
Gly Gly Ile Lys Asn Gly Val Asp Ala Ala Lys Ala Leu Arg Leu Gly
275 280 285
Ala Cys Met Val Gly Gln Ala Ala Ala Val Leu Gly Ser Ala Gly Val
290 295 300
Ser Thr Glu Lys Val Ile Asp His Phe Asn Val Ile Ile Glu Gln Leu
305 310 315 320
Arg Val Ala Cys Phe Cys Thr Gly Ser Arg Ser Leu Ser Asp Leu Lys
325 330 335
Gln Ala Asp Ile Arg Tyr Val Arg Asp Thr Pro
340 345
<210> 58
<211> 360
<212> PRT
<213> Borrelia burgdorferi
<400> 58
Met Met Asp Thr Glu Phe Met Gly Ile Glu Pro Asn Ile Leu Glu Asn
1 5 10 15
Lys Lys Arg His Ile Glu Ile Cys Leu Asn Lys Asn Asp Val Lys Gly
20 25 30
Gly Cys Asn Phe Leu Lys Phe Ile Lys Leu Lys His Asn Ala Leu Ser
35 40 45
Asp Phe Asn Phe Ser Glu Ile Asn Ile Lys Glu Glu Ile Phe Gly Tyr
50 55 60
Asn Ile Ser Met Pro Val Phe Ile Ser Ser Met Thr Gly Gly Ser Lys
65 70 75 80
Glu Gly Asn Asp Phe Asn Lys Ser Leu Val Arg Ile Ala Asn Tyr Leu
85 90 95
Lys Ile Pro Ile Gly Leu Gly Ser Phe Lys Leu Leu Phe Lys Tyr Pro
100 105 110
Glu Tyr Ile Arg Asp Phe Thr Leu Lys Arg Tyr Ala His Asn Ile Pro
115 120 125
Leu Phe Ala Asn Val Gly Ala Val Gln Ile Val Glu Phe Gly Ile Ser
130 135 140
Lys Ile Ala Glu Met Ile Lys Arg Leu Glu Val Asp Ala Ile Ile Val
145 150 155 160
His Leu Asn Ala Gly Gln Glu Leu Met Lys Val Asp Gly Asp Arg Asn
165 170 175
Phe Lys Gly Ile Arg Glu Ser Ile Ala Lys Leu Ser Asp Phe Leu Ser
180 185 190
Val Pro Leu Ile Val Lys Glu Thr Gly Phe Gly Ile Ser Pro Lys Asp
195 200 205
Val Lys Glu Leu Phe Ser Leu Gly Ala Ser Tyr Val Asp Leu Ala Gly
210 215 220
Ser Gly Gly Thr Asn Trp Ile Leu Val Glu Gly Met Lys Ser Asn Asn
225 230 235 240
Leu Asn Ile Ala Ser Cys Phe Ser Asp Trp Gly Ile Pro Ser Val Phe
245 250 255
Thr Leu Leu Ser Ile Asp Asp Ser Leu Lys Ala Asn Ile Phe Ala Ser
260 265 270
Gly Gly Tyr Glu Thr Gly Met Asp Ile Ala Lys Gly Ile Ala Leu Gly
275 280 285
Ala Arg Leu Ile Gly Val Ala Ala Val Val Leu Arg Ala Phe Tyr Asp
290 295 300
Ser Gly Glu Asp Ala Val Phe Gly Leu Phe Ser Asp Tyr Glu His Ile
305 310 315 320
Leu Lys Met Ser Met Phe Leu Ser Gly Ser Lys Ser Leu Leu Glu Phe
325 330 335
Arg Asn Asn Lys Tyr Phe Leu Ser Ser Tyr Leu Leu Asp Glu Leu Gly
340 345 350
Val Phe Lys Gln Phe Tyr Gly Thr
355 360
<210> 59
<211> 349
<212> PRT
<213> Synechocystis sp.
<400> 59
Met Asp Ser Thr Pro His Arg Lys Ser Asp His Ile Arg Ile Val Leu
1 5 10 15
Glu Glu Asp Val Val Gly Lys Gly Ile Ser Thr Gly Phe Glu Arg Leu
20 25 30
Met Leu Glu His Cys Ala Leu Pro Ala Val Asp Leu Asp Ala Val Asp
35 40 45
Leu Gly Leu Thr Leu Trp Gly Lys Ser Leu Thr Tyr Pro Trp Leu Ile
50 55 60
Ser Ser Met Thr Gly Gly Thr Pro Glu Ala Lys Gln Ile Asn Leu Phe
65 70 75 80
Leu Ala Glu Val Ala Gln Ala Leu Gly Ile Ala Met Gly Leu Gly Ser
85 90 95
Gln Arg Ala Ala Ile Glu Asn Pro Asp Leu Ala Phe Thr Tyr Gln Val
100 105 110
Arg Ser Val Ala Pro Asp Ile Leu Leu Phe Ala Asn Leu Gly Leu Val
115 120 125
Gln Leu Asn Tyr Gly Tyr Gly Leu Glu Gln Ala Gln Arg Ala Val Asp
130 135 140
Met Ile Glu Ala Asp Ala Leu Ile Leu His Leu Asn Pro Leu Gln Glu
145 150 155 160
Ala Val Gln Pro Asp Gly Asp Arg Leu Trp Ser Gly Leu Trp Ser Lys
165 170 175
Leu Glu Ala Leu Val Glu Ala Leu Glu Val Pro Val Ile Val Lys Glu
180 185 190
Val Gly Asn Gly Ile Ser Gly Pro Val Ala Lys Arg Leu Gln Glu Cys
195 200 205
Gly Val Gly Ala Ile Asp Val Ala Gly Ala Gly Gly Thr Ser Trp Ser
210 215 220
Glu Val Glu Ala His Arg Gln Thr Asp Arg Gln Ala Lys Glu Val Ala
225 230 235 240
His Asn Phe Ala Asp Trp Gly Leu Pro Thr Ala Trp Ser Leu Gln Gln
245 250 255
Val Val Gln Asn Thr Glu Gln Ile Leu Val Phe Ala Ser Gly Gly Ile
260 265 270
Arg Ser Gly Ile Asp Gly Ala Lys Ala Ile Ala Leu Gly Ala Thr Leu
275 280 285
Val Gly Ser Ala Ala Pro Val Leu Ala Glu Ala Lys Ile Asn Ala Gln
290 295 300
Arg Val Tyr Asp His Tyr Gln Ala Arg Leu Arg Glu Leu Gln Ile Ala
305 310 315 320
Ala Phe Cys Cys Asp Ala Ala Asn Leu Thr Gln Leu Ala Gln Val Pro
325 330 335
Leu Trp Asp Arg Gln Ser Gly Gln Arg Leu Thr Lys Pro
340 345
<210> 60
<211> 361
<212> PRT
<213> Streptomyces sp.
<400> 60
Met Thr Ser Ala Gln Arg Lys Asp Asp His Val Arg Leu Ala Ile Glu
1 5 10 15
Gln His Asn Ala His Ser Gly Arg Asn Gln Asp Asp Val Ser Phe Val
20 25 30
His His Ala Leu Ala Gly Ile Asp Arg Pro Asp Val Ser Leu Ala Thr
35 40 45
Ser Phe Ala Gly Ile Ser Trp Gln Val Pro Ile Tyr Ile Asn Ala Met
50 55 60
Thr Gly Gly Ser Glu Lys Thr Gly Leu Ile Asn Arg Asp Leu Ala Thr
65 70 75 80
Ala Ala Arg Glu Thr Gly Val Pro Ile Ala Ser Gly Ser Met Asn Ala
85 90 95
Tyr Ile Lys Asp Pro Cys Ala Asp Thr Phe Arg Val Leu Arg Asp Glu
100 105 110
Asn Pro Asn Gly Phe Val Ile Ala Asn Ile Asn Ala Thr Thr Thr Val
115 120 125
Asp Asn Ala Gln Arg Ala Ile Asp Leu Ile Glu Ala Asn Ala Leu Gln
130 135 140
Ile His Ile Asn Thr Ala Gln Glu Thr Pro Met Pro Glu Gly Asp Arg
145 150 155 160
Ser Phe Ala Ser Trp Val Pro Gln Ile Glu Lys Ile Ala Ala Ala Val
165 170 175
Asp Ile Pro Val Ile Val Lys Glu Val Gly Asn Gly Leu Ser Arg Gln
180 185 190
Thr Ile Leu Leu Leu Ala Asp Leu Gly Val Gln Ala Ala Asp Val Ser
195 200 205
Gly Arg Gly Gly Thr Asp Phe Ala Arg Ile Glu Asn Gly Arg Arg Glu
210 215 220
Leu Gly Asp Tyr Ala Phe Leu His Gly Trp Gly Gln Ser Thr Ala Ala
225 230 235 240
Cys Leu Leu Asp Ala Gln Asp Ile Ser Leu Pro Val Leu Ala Ser Gly
245 250 255
Gly Val Arg His Pro Leu Asp Val Val Arg Ala Leu Ala Leu Gly Ala
260 265 270
Arg Ala Val Gly Ser Ser Ala Gly Phe Leu Arg Thr Leu Met Asp Asp
275 280 285
Gly Val Asp Ala Leu Ile Thr Lys Leu Thr Thr Trp Leu Asp Gln Leu
290 295 300
Ala Ala Leu Gln Thr Met Leu Gly Ala Arg Thr Pro Ala Asp Leu Thr
305 310 315 320
Arg Cys Asp Val Leu Leu His Gly Glu Leu Arg Asp Phe Cys Ala Asp
325 330 335
Arg Gly Ile Asp Thr Arg Arg Leu Ala Gln Arg Ser Ser Ser Ile Glu
340 345 350
Ala Leu Gln Thr Thr Gly Ser Thr Arg
355 360
<210> 61
<211> 364
<212> PRT
<213> Streptomyces griseosporeus
<400> 61
Met Ser Ser Ala Gln Arg Lys Asp Asp His Val Arg Leu Ala Thr Glu
1 5 10 15
Gln Gln Arg Ala His Ser Gly Arg Asn Gln Phe Asp Asp Val Ser Phe
20 25 30
Val His His Ala Leu Ala Gly Ile Asp Arg Pro Asp Val Arg Leu Ala
35 40 45
Thr Thr Phe Ala Gly Ile Thr Trp Arg Leu Pro Leu Tyr Ile Asn Ala
50 55 60
Met Thr Gly Gly Ser Ala Lys Thr Gly Ala Ile Asn Arg Asp Leu Ala
65 70 75 80
Val Ala Ala Arg Glu Thr Gly Ala Ala Ile Ala Ser Gly Ser Met His
85 90 95
Ala Phe Phe Arg Asp Pro Ser Cys Ala Asp Thr Phe Arg Val Leu Arg
100 105 110
Thr Glu Asn Pro Asp Gly Phe Val Met Ala Asn Val Asn Ala Thr Ala
115 120 125
Ser Val Asp Asn Ala Arg Arg Ala Val Asp Leu Ile Glu Ala Asn Ala
130 135 140
Leu Gln Ile His Leu Asn Thr Ala Gln Glu Thr Pro Met Pro Glu Gly
145 150 155 160
Asp Arg Ser Phe Gly Ser Trp Pro Ala Gln Ile Ala Lys Ile Thr Ala
165 170 175
Ala Val Asp Val Pro Val Ile Val Lys Glu Val Gly Asn Gly Leu Ser
180 185 190
Arg Gln Thr Leu Leu Ala Leu Pro Asp Leu Gly Val Arg Val Ala Asp
195 200 205
Val Ser Gly Arg Gly Gly Thr Asp Phe Ala Arg Ile Glu Asn Ser Arg
210 215 220
Arg Pro Leu Gly Asp Tyr Ala Phe Leu His Gly Trp Gly Gln Ser Thr
225 230 235 240
Pro Ala Cys Leu Leu Asp Ala Gln Asp Val Gly Phe Pro Leu Leu Ala
245 250 255
Ser Gly Gly Ile Arg Asn Pro Leu Asp Val Ala Arg Ala Leu Ala Leu
260 265 270
Gly Ala Gly Ala Val Gly Ser Ser Gly Val Phe Leu Arg Thr Leu Ile
275 280 285
Asp Gly Gly Val Ser Ala Leu Val Ala Gln Ile Ser Thr Trp Leu Asp
290 295 300
Gln Leu Ala Ala Leu Gln Thr Met Leu Gly Ala Arg Thr Pro Ala Asp
305 310 315 320
Leu Thr Arg Cys Asp Val Leu Ile His Gly Pro Leu Arg Ser Phe Cys
325 330 335
Thr Asp Arg Gly Ile Asp Ile Gly Arg Phe Ala Arg Arg Ser Ser Ser
340 345 350
Ala Asp Ile Arg Ser Glu Met Thr Gly Ser Thr Arg
355 360
<210> 62
<211> 368
<212> PRT
<213> Sulfolobus solfataricus
<400> 62
Met Pro Asp Ile Val Asn Arg Lys Val Glu His Val Glu Ile Ala Ala
1 5 10 15
Phe Glu Asn Val Asp Gly Leu Ser Ser Ser Thr Phe Leu Asn Asp Val
20 25 30
Ile Leu Val His Gln Gly Phe Pro Gly Ile Ser Phe Ser Glu Ile Asn
35 40 45
Thr Lys Thr Lys Phe Phe Arg Lys Glu Ile Ser Ala Pro Ile Met Val
50 55 60
Thr Gly Met Thr Gly Gly Arg Asn Glu Leu Gly Arg Ile Asn Arg Ile
65 70 75 80
Ile Ala Glu Val Ala Glu Lys Phe Gly Ile Pro Met Gly Val Gly Ser
85 90 95
Gln Arg Val Ala Ile Glu Lys Ala Glu Ala Arg Glu Ser Phe Thr Ile
100 105 110
Val Arg Lys Val Ala Pro Thr Ile Pro Ile Ile Ala Asn Leu Gly Met
115 120 125
Pro Gln Leu Val Lys Gly Tyr Gly Leu Lys Glu Phe Gln Asp Ala Ile
130 135 140
Gln Met Ile Glu Ala Asp Ala Ile Ala Val His Leu Asn Pro Ala Gln
145 150 155 160
Glu Val Phe Gln Pro Glu Gly Glu Pro Glu Tyr Gln Ile Tyr Ala Leu
165 170 175
Glu Arg Leu Arg Asp Ile Ser Lys Glu Leu Ser Val Pro Ile Ile Val
180 185 190
Lys Glu Ser Gly Asn Gly Ile Ser Met Glu Thr Ala Lys Leu Leu Tyr
195 200 205
Ser Tyr Gly Ile Lys Asn Phe Asp Thr Ser Gly Gln Gly Gly Thr Asn
210 215 220
Trp Ile Ala Ile Glu Met Ile Arg Asp Ile Arg Arg Gly Asn Trp Lys
225 230 235 240
Ala Glu Ser Ala Lys Asn Phe Leu Asp Trp Gly Val Pro Thr Ala Ala
245 250 255
Ser Ile Ile Glu Val Arg Tyr Ser Ile Pro Asp Ala Phe Leu Val Gly
260 265 270
Ser Gly Gly Ile Arg Ser Gly Leu Asp Ala Ala Lys Ala Ile Ala Leu
275 280 285
Gly Ala Asp Ile Ala Gly Met Ala Leu Pro Val Leu Lys Ser Ala Ile
290 295 300
Glu Gly Lys Glu Ser Leu Glu Gln Phe Phe Arg Lys Ile Ile Phe Glu
305 310 315 320
Leu Lys Ala Thr Met Met Leu Thr Gly Ser Lys Asn Val Glu Ala Leu
325 330 335
Lys Arg Ser Ser Ile Val Ile Leu Gly Lys Leu Lys Glu Trp Ala Glu
340 345 350
Tyr Arg Gly Ile Asn Leu Ser Ile Tyr Glu Lys Val Arg Lys Arg Glu
355 360 365
<210> 63
<211> 342
<212> PRT
<213> Rickettsia prowazekii
<400> 63
Met Pro Lys Glu Gln Asn Leu Asp Ile Glu Arg Lys Gln Glu His Ile
1 5 10 15
Glu Ile Asn Leu Lys Gln Asn Val Asn Ser Thr Leu Lys Ser Gly Leu
20 25 30
Glu Ser Ile Lys Phe Ile His Asn Ala Leu Pro Glu Ile Asn Tyr Asp
35 40 45
Ser Ile Asp Thr Thr Thr Thr Phe Leu Gly Lys Asp Met Lys Ala Pro
50 55 60
Ile Leu Ile Ser Ser Met Thr Gly Gly Thr Ala Arg Ala Arg Asp Ile
65 70 75 80
Asn Tyr Arg Leu Ala Gln Ala Ala Gln Lys Ser Gly Ile Ala Met Gly
85 90 95
Leu Gly Ser Met Arg Ile Leu Leu Thr Lys Pro Asp Thr Ile Lys Thr
100 105 110
Phe Thr Val Arg His Val Ala Pro Asp Ile Pro Leu Leu Ala Asn Ile
115 120 125
Gly Ala Val Gln Leu Asn Tyr Gly Val Thr Pro Lys Glu Cys Gln Tyr
130 135 140
Leu Ile Asp Thr Ile Lys Ala Asp Ala Leu Ile Leu His Leu Asn Val
145 150 155 160
Leu His Glu Leu Thr Gln Pro Glu Gly Asn Lys Asn Trp Glu Asn Leu
165 170 175
Leu Pro Lys Ile Lys Glu Val Ile Asn Tyr Leu Ser Val Pro Val Ile
180 185 190
Val Lys Glu Val Gly Tyr Gly Leu Ser Lys Gln Val Ala Lys Lys Leu
195 200 205
Ile Lys Ala Gly Val Lys Val Leu Asp Ile Ala Gly Ser Gly Gly Thr
210 215 220
Ser Trp Ser Gln Val Glu Ala Tyr Arg Ala Lys Asn Ser Met Gln Asn
225 230 235 240
Arg Ile Ala Ser Ser Phe Ile Asn Trp Gly Ile Thr Thr Leu Asp Ser
245 250 255
Leu Lys Met Leu Gln Glu Ile Ser Lys Asp Ile Thr Ile Ile Ala Ser
260 265 270
Gly Gly Leu Gln Ser Gly Ile Asp Gly Ala Lys Ala Ile Arg Met Gly
275 280 285
Ala Asn Ile Phe Gly Leu Ala Gly Lys Leu Leu Lys Ala Ala Asp Ile
290 295 300
Ala Glu Ser Leu Val Leu Glu Glu Ile Gln Val Ile Ile Glu Gln Leu
305 310 315 320
Lys Ile Thr Met Leu Cys Thr Gly Ser Cys Thr Leu Lys Asp Leu Ala
325 330 335
Lys Ala Glu Ile Met Trp
340
<210> 64
<211> 286
<212> PRT
<213> Deinococcus radiodurans
<400> 64
Met Arg Leu Asp Thr Val Phe Leu Gly Arg Arg Leu Lys Ala Pro Val
1 5 10 15
Leu Ile Gly Ala Met Thr Gly Gly Ala Glu Lys Ala Gly Val Ile Asn
20 25 30
Arg Asn Leu Ala Thr Ala Ala Arg Asn Leu Gly Leu Gly Met Met Leu
35 40 45
Gly Ser Gln Arg Val Met Leu Glu His Pro Asp Ala Trp Glu Ser Phe
50 55 60
Asn Val Arg Glu Val Ala Pro Glu Ile Leu Leu Ile Gly Asn Leu Gly
65 70 75 80
Ala Ala Gln Phe Met Leu Gly Tyr Gly Ala Glu Gln Ala Arg Arg Ala
85 90 95
Val Asp Glu Val Met Ala Asp Ala Leu Ala Ile His Leu Asn Pro Leu
100 105 110
Gln Glu Ala Leu Gln Arg Gly Gly Asp Thr Arg Trp Gln Gly Val Thr
115 120 125
Tyr Arg Leu Lys Gln Val Ala Arg Glu Leu Asp Phe Pro Val Ile Ile
130 135 140
Lys Glu Val Gly His Gly Leu Asp Ala Ala Thr Leu Arg Ala Leu Ala
145 150 155 160
Asp Gly Pro Phe Ala Ala Tyr Asp Val Ala Gly Ala Gly Gly Thr Ser
165 170 175
Trp Ala Arg Val Glu Gln Leu Val Ala His Gly Gln Val His Ser Pro
180 185 190
Asp Leu Cys Glu Leu Gly Val Pro Thr Ala Gln Ala Leu Arg Gln Ala
195 200 205
Arg Lys Thr Leu Pro Gly Ala Gln Leu Ile Ala Ser Gly Gly Ile Arg
210 215 220
Ser Gly Leu Asp Ala Ala Arg Ala Leu Ser Leu Gly Ala Glu Val Val
225 230 235 240
Ala Val Ala Arg Pro Leu Leu Glu Pro Ala Leu Asp Ser Ser Glu Ala
245 250 255
Ala Glu Ala Trp Leu Arg Asn Phe Ile Gln Glu Leu Arg Val Ala Leu
260 265 270
Phe Val Gly Gly Tyr Arg Asp Val Arg Glu Val Arg Gly Gly
275 280 285
<210> 65
<211> 361
<212> PRT
<213> Aeropyrum pernix
<400> 65
Met Ile Val Ser Ser Lys Val Glu Ser Arg Glu Ser Thr Leu Leu Glu
1 5 10 15
Tyr Val Arg Ile Val His Asn Pro Thr Pro Glu Val Asn Leu Gly Asp
20 25 30
Val Ser Leu Glu Ile Asp Phe Cys Gly Gly Arg Leu Arg Ala Pro Leu
35 40 45
Val Ile Thr Gly Met Thr Gly Gly His Pro Asp Val Glu Trp Ile Asn
50 55 60
Arg Glu Leu Ala Ser Val Ala Glu Glu Leu Gly Ile Ala Ile Gly Val
65 70 75 80
Gly Ser Gln Arg Ala Ala Ile Glu Asp Pro Ser Leu Ala Arg Thr Phe
85 90 95
Arg Ala Ala Arg Glu Ala Ala Pro Asn Ala Phe Leu Ile Ala Asn Leu
100 105 110
Gly Ala Pro Gln Leu Ser Leu Gly Tyr Ser Val Arg Glu Val Arg Met
115 120 125
Ala Val Glu Met Ile Asp Ala Asp Ala Ile Ala Ile His Leu Asn Pro
130 135 140
Gly Gln Glu Ala Tyr Gln Pro Glu Gly Asp Pro Phe Tyr Arg Gly Val
145 150 155 160
Val Gly Lys Ile Ala Glu Ala Ala Glu Ala Ala Gly Val Pro Val Ile
165 170 175
Val Lys Glu Thr Gly Asn Gly Leu Ser Arg Glu Ala Val Ala Gln Leu
180 185 190
Arg Ala Leu Gly Val Arg Cys Phe Asp Val Ala Gly Leu Gly Gly Thr
195 200 205
Asn Trp Ile Lys Ile Glu Val Leu Arg Gly Arg Lys Ala Gly Ser Pro
210 215 220
Leu Glu Ala Gly Pro Leu Gln Asp Phe Trp Gly Asn Pro Thr Ala Ala
225 230 235 240
Ala Leu Met Glu Ala Arg Thr Ala Ala Pro Asp Ala Tyr Ile Ile Ala
245 250 255
Ser Gly Gly Val Arg Asn Gly Leu Asp Ala Ala Arg Ala Ile Ala Leu
260 265 270
Gly Ala Asp Ala Ala Gly Val Ala Leu Pro Ala Ile Arg Ser Leu Leu
275 280 285
Ser Gly Gly Arg Gln Ala Thr Leu Lys Leu Leu Lys Ala Ile Glu Tyr
290 295 300
Gln Leu Lys Thr Ala Val Tyr Met Val Gly Glu Thr Arg Val Arg Gly
305 310 315 320
Leu Trp Arg Ala Pro Ile Val Val Trp Gly Arg Leu Ala Glu Glu Ala
325 330 335
Glu Ala Arg Gly Ile Asp Pro Arg Trp Tyr Thr Asn Thr Leu Arg Leu
340 345 350
Glu Ala Leu Val Tyr Lys Asp Val Lys
355 360
<210> 66
<211> 379
<212> PRT
<213> Halobacterium sp.
<400> 66
Met Gly Glu Ser Arg Tyr Asn Ser Ile Val Phe Pro Ser Leu Val Gln
1 5 10 15
Thr Arg Leu Met Thr Ala Gln Asp Ser Thr Gln Thr Glu Asp Arg Lys
20 25 30
Asp Asp His Leu Gln Ile Val Gln Glu Arg Asp Val Glu Thr Thr Gly
35 40 45
Thr Gly Phe Asp Asp Val His Leu Val His Asn Ala Leu Pro Glu Leu
50 55 60
Asp Tyr Asp Ala Ile Asp Pro Ser Ile Asp Phe Leu Gly His Asp Leu
65 70 75 80
Ser Ala Pro Ile Phe Ile Glu Ser Met Thr Gly Gly His His Asn Thr
85 90 95
Thr Glu Ile Asn Arg Ala Leu Ala Arg Ala Ala Ser Glu Thr Gly Ile
100 105 110
Ala Met Gly Leu Gly Ser Gln Arg Ala Gly Leu Glu Leu Asp Asp Glu
115 120 125
Arg Val Leu Glu Ser Tyr Thr Val Val Arg Asp Ala Ala Pro Asp Ala
130 135 140
Phe Ile Tyr Gly Asn Leu Gly Ala Ala Gln Leu Arg Glu Tyr Asp Ile
145 150 155 160
Glu Met Val Glu Gln Ala Val Glu Met Ile Asp Ala Asp Ala Leu Ala
165 170 175
Val His Leu Asn Phe Leu Gln Glu Ala Thr Gln Pro Glu Gly Asp Val
180 185 190
Asp Gly Arg Asn Cys Val Ala Ala Ile Glu Arg Val Ser Glu Ala Leu
195 200 205
Ser Val Pro Ile Ile Val Lys Glu Thr Gly Asn Gly Ile Ser Gly Glu
210 215 220
Thr Ala Arg Glu Leu Thr Ala Ala Gly Val Asp Ala Leu Asp Val Ala
225 230 235 240
Gly Lys Gly Gly Thr Thr Trp Ser Gly Ile Glu Ala Tyr Arg Ala Ala
245 250 255
Ala Ala Asn Ala Pro Arg Gln Lys Gln Ile Gly Thr Leu Phe Arg Glu
260 265 270
Trp Gly Ile Pro Thr Ala Ala Ser Thr Ile Glu Cys Val Ala Glu His
275 280 285
Asp Cys Val Ile Ala Ser Gly Gly Val Arg Thr Gly Leu Asp Val Ala
290 295 300
Lys Ala Ile Ala Leu Gly Ala Arg Ala Gly Gly Leu Ala Lys Pro Phe
305 310 315 320
Leu Lys Pro Ala Thr Asp Gly Pro Asp Ala Val Ile Glu Arg Val Gly
325 330 335
Asp Leu Ile Ala Glu Leu Arg Thr Ala Met Phe Val Thr Gly Ser Gly
340 345 350
Ser Ile Asp Glu Leu Gln Gln Val Glu Tyr Val Leu His Gly Lys Thr
355 360 365
Arg Glu Tyr Val Glu Gln Arg Thr Ser Ser Glu
370 375
<210> 67
<211> 317
<212> PRT
<213> Archaeoglobus fulgidus
<400> 67
Met Met Leu Ile His Lys Ala Leu Pro Glu Val Asp Tyr Trp Lys Ile
1 5 10 15
Asp Thr Glu Ile Glu Phe Phe Gly Lys Lys Leu Ser Phe Pro Leu Leu
20 25 30
Ile Ala Ser Met Thr Gly Gly His Pro Glu Thr Lys Glu Ile Asn Ala
35 40 45
Arg Leu Gly Glu Ala Val Glu Glu Ala Gly Ile Gly Met Gly Val Gly
50 55 60
Ser Gln Arg Ala Ala Ile Glu Asp Glu Ser Leu Ala Asp Ser Phe Thr
65 70 75 80
Val Val Arg Glu Lys Ala Pro Asn Ala Phe Val Tyr Ala Asn Ile Gly
85 90 95
Met Pro Gln Val Ile Glu Arg Gly Val Glu Ile Val Asp Arg Ala Val
100 105 110
Glu Met Ile Asp Ala Asp Ala Val Ala Ile His Leu Asn Tyr Leu Gln
115 120 125
Glu Ala Ile Gln Pro Glu Gly Asp Leu Asn Ala Glu Lys Gly Leu Glu
130 135 140
Val Leu Glu Glu Val Cys Arg Ser Val Lys Val Pro Val Ile Ala Lys
145 150 155 160
Glu Thr Gly Ala Gly Ile Ser Arg Glu Val Ala Val Met Leu Lys Arg
165 170 175
Ala Gly Val Ser Ala Ile Asp Val Gly Gly Lys Gly Gly Thr Thr Phe
180 185 190
Ser Gly Val Glu Val Tyr Arg Val Asn Asp Glu Val Ser Lys Ser Val
195 200 205
Gly Ile Asp Phe Trp Asp Trp Gly Leu Pro Thr Ala Phe Ser Ile Val
210 215 220
Asp Cys Arg Gly Ile Leu Pro Val Ile Ala Thr Gly Gly Leu Arg Ser
225 230 235 240
Gly Leu Asp Val Ala Lys Ser Ile Ala Ile Gly Ala Glu Leu Gly Ser
245 250 255
Ala Ala Leu Pro Phe Leu Arg Ala Ala Val Glu Ser Ala Glu Lys Val
260 265 270
Arg Glu Glu Ile Glu Tyr Phe Arg Arg Gly Leu Lys Thr Ala Met Phe
275 280 285
Leu Thr Gly Cys Lys Asn Val Glu Glu Leu Lys Gly Leu Lys Val Phe
290 295 300
Val Ser Gly Arg Leu Lys Glu Trp Ile Asp Phe Arg Gly
305 310 315
<210> 68
<211> 370
<212> PRT
<213> Pyrococcus abyssi
<400> 68
Met Glu Glu Gln Thr Ile Leu Arg Lys Phe Glu His Ile Lys His Cys
1 5 10 15
Leu Thr Lys Asn Val Glu Ala His Val Thr Asn Gly Phe Glu Asp Val
20 25 30
His Leu Ile His Lys Ser Leu Pro Glu Ile Asp Lys Asp Glu Ile Asp
35 40 45
Leu Ser Val Lys Phe Leu Gly Arg Lys Phe Asp Tyr Pro Ile Met Ile
50 55 60
Thr Gly Met Thr Gly Gly Thr Arg Lys Gly Glu Ile Ala Trp Arg Ile
65 70 75 80
Asn Arg Thr Leu Ala Gln Ala Ala Gln Glu Leu Asn Ile Pro Leu Gly
85 90 95
Leu Gly Ser Gln Arg Ala Met Ile Glu Lys Pro Glu Thr Trp Glu Ser
100 105 110
Tyr Tyr Val Arg Asp Val Ala Pro Asp Val Phe Leu Val Gly Asn Leu
115 120 125
Gly Ala Pro Gln Phe Gly Arg Asn Ala Lys Lys Arg Tyr Ser Val Asp
130 135 140
Glu Val Leu Tyr Ala Ile Glu Lys Ile Glu Ala Asp Ala Ile Ala Ile
145 150 155 160
His Met Asn Pro Leu Gln Glu Ser Ile Gln Pro Glu Gly Asp Thr Thr
165 170 175
Phe Ser Gly Val Leu Glu Ala Leu Ala Glu Ile Thr Ser Thr Ile Asp
180 185 190
Tyr Pro Val Ile Ala Lys Glu Thr Gly Ala Gly Val Ser Lys Glu Val
195 200 205
Ala Val Glu Leu Glu Ala Val Gly Val Asp Ala Ile Asp Ile Ser Gly
210 215 220
Leu Gly Gly Thr Ser Trp Ser Ala Val Glu Tyr Tyr Arg Thr Lys Asp
225 230 235 240
Gly Glu Lys Arg Asn Leu Ala Leu Lys Phe Trp Asp Trp Gly Ile Lys
245 250 255
Thr Ala Ile Ser Leu Ala Glu Val Arg Trp Ala Thr Asn Leu Pro Ile
260 265 270
Ile Ala Ser Gly Gly Met Arg Asp Gly Ile Thr Met Ala Lys Ala Leu
275 280 285
Ala Met Gly Ala Ser Met Val Gly Ile Ala Leu Pro Val Leu Arg Pro
290 295 300
Ala Ala Lys Gly Asp Val Glu Gly Val Ile Arg Ile Ile Lys Gly Tyr
305 310 315 320
Ala Glu Glu Ile Arg Asn Val Met Phe Leu Val Gly Ala Arg Asn Ile
325 330 335
Lys Glu Leu Arg Lys Val Pro Leu Val Ile Thr Gly Phe Val Arg Glu
340 345 350
Trp Leu Leu Gln Arg Ile Asp Leu Asn Ser Tyr Leu Arg Ala Arg Phe
355 360 365
Lys Met
370
<210> 69
<211> 371
<212> PRT
<213> Pyrococcus horikoshii
<400> 69
Met Lys Glu Glu Leu Thr Ile Leu Arg Lys Phe Glu His Ile Glu His
1 5 10 15
Cys Leu Lys Arg Asn Val Glu Ala His Val Ser Asn Gly Phe Glu Asp
20 25 30
Val Tyr Phe Val His Lys Ser Leu Pro Glu Ile Asp Lys Asp Glu Ile
35 40 45
Asp Leu Thr Val Glu Phe Leu Gly Arg Lys Phe Asp Tyr Pro Ile Met
50 55 60
Ile Thr Gly Met Thr Gly Gly Thr Arg Arg Glu Glu Ile Ala Gly Lys
65 70 75 80
Ile Asn Arg Thr Leu Ala Met Ala Ala Glu Glu Leu Asn Ile Pro Phe
85 90 95
Gly Val Gly Ser Gln Arg Ala Met Ile Glu Lys Pro Glu Thr Trp Glu
100 105 110
Ser Tyr Tyr Val Arg Asp Val Ala Pro Asp Ile Phe Leu Ile Gly Asn
115 120 125
Leu Gly Ala Pro Gln Phe Gly Lys Asn Ala Lys Lys Arg Tyr Ser Val
130 135 140
Lys Glu Val Leu Tyr Ala Ile Glu Lys Ile Glu Ala Asp Ala Ile Ala
145 150 155 160
Ile His Met Asn Pro Leu Gln Glu Ser Val Gln Pro Glu Gly Asp Thr
165 170 175
Thr Tyr Ala Gly Val Leu Glu Ala Leu Ala Glu Ile Lys Ser Ser Ile
180 185 190
Asn Tyr Pro Val Ile Ala Lys Glu Thr Gly Ala Gly Val Ser Lys Glu
195 200 205
Val Ala Ile Glu Leu Glu Ser Val Gly Ile Asp Ala Ile Asp Ile Ser
210 215 220
Gly Leu Gly Gly Thr Ser Trp Ser Ala Val Glu Tyr Tyr Arg Ala Lys
225 230 235 240
Asp Ser Glu Lys Arg Lys Ile Ala Leu Lys Phe Trp Asp Trp Gly Ile
245 250 255
Lys Thr Ala Ile Ser Leu Ala Glu Val Arg Trp Ala Thr Asn Leu Pro
260 265 270
Ile Ile Ala Ser Gly Gly Met Arg Asp Gly Val Met Met Ala Lys Ala
275 280 285
Leu Ala Met Gly Ala Ser Leu Val Gly Ile Ala Leu Pro Val Leu Arg
290 295 300
Pro Ala Ala Arg Gly Asp Val Glu Gly Val Val Arg Ile Ile Arg Gly
305 310 315 320
Tyr Ala Glu Glu Ile Lys Asn Val Met Phe Leu Val Gly Ala Arg Asn
325 330 335
Ile Arg Glu Leu Arg Arg Val Pro Leu Val Ile Thr Gly Phe Val Arg
340 345 350
Glu Trp Leu Leu Gln Arg Ile Asp Leu Asn Ser Tyr Leu Arg Ser Arg
355 360 365
Phe Lys His
370
<210> 70
<211> 349
<212> PRT
<213> Methanobacterium thermoautotrophicum
<400> 70
Met Ile Ser Asp Arg Lys Leu Glu His Leu Ile Leu Cys Ala Ser Cys
1 5 10 15
Asp Val Glu Tyr Arg Lys Lys Thr Gly Phe Glu Asp Ile Glu Ile Val
20 25 30
His Arg Ala Ile Pro Glu Ile Asn Lys Glu Lys Ile Asp Ile Ser Leu
35 40 45
Asp Phe Leu Gly Arg Glu Leu Ser Ser Pro Val Met Ile Ser Ala Ile
50 55 60
Thr Gly Gly His Pro Ala Ser Met Lys Ile Asn Arg Glu Leu Ala Arg
65 70 75 80
Ala Ala Glu Lys Leu Gly Ile Ala Leu Gly Leu Gly Ser Gln Arg Ala
85 90 95
Gly Val Glu His Pro Glu Leu Glu Gly Thr Tyr Thr Ile Ala Arg Glu
100 105 110
Glu Ala Pro Ser Ala Met Leu Ile Gly Asn Ile Gly Ser Ser His Ile
115 120 125
Glu Tyr Ala Glu Arg Ala Val Glu Met Ile Asp Ala Asp Ala Leu Ala
130 135 140
Val His Leu Asn Pro Leu Gln Glu Ser Ile Gln Pro Gly Gly Asp Val
145 150 155 160
Asp Ser Ser Gly Ala Leu Glu Ser Ile Ser Ala Ile Val Glu Ser Val
165 170 175
Asp Val Pro Val Met Val Lys Glu Thr Gly Ala Gly Ile Cys Ser Glu
180 185 190
Asp Ala Ile Glu Leu Glu Ser Cys Gly Val Ser Ala Ile Asp Val Ala
195 200 205
Gly Ala Gly Gly Thr Ser Trp Ala Ala Val Glu Thr Tyr Arg Ala Asp
210 215 220
Asp Arg Tyr Leu Gly Glu Leu Phe Trp Asp Trp Gly Ile Pro Thr Ala
225 230 235 240
Ala Ser Thr Val Glu Val Val Glu Ser Val Ser Ile Pro Val Ile Ala
245 250 255
Ser Gly Gly Ile Arg Ser Gly Ile Asp Ala Ala Lys Ala Ile Ser Leu
260 265 270
Gly Ala Glu Met Val Gly Ile Ala Leu Pro Val Leu Glu Ala Ala Gly
275 280 285
His Gly Tyr Arg Glu Val Ile Lys Val Ile Glu Gly Phe Asn Glu Ala
290 295 300
Leu Arg Thr Ala Met Tyr Leu Ala Gly Ala Glu Thr Leu Asp Asp Leu
305 310 315 320
Lys Lys Ser Pro Val Ile Ile Thr Gly His Thr Gly Glu Trp Leu Asn
325 330 335
Gln Arg Gly Phe Glu Thr Lys Lys Tyr Ala Arg Arg Ser
340 345
<210> 71
<211> 359
<212> PRT
<213> Methanococcus jannaschii
<400> 71
Met Val Asn Asn Arg Asn Glu Ile Glu Val Arg Lys Leu Glu His Ile
1 5 10 15
Phe Leu Cys Ser Tyr Cys Asn Val Glu Tyr Glu Lys Thr Thr Leu Leu
20 25 30
Glu Asp Ile Glu Leu Ile His Lys Gly Thr Cys Gly Ile Asn Phe Asn
35 40 45
Asp Ile Glu Thr Glu Ile Glu Leu Phe Gly Lys Lys Leu Ser Ala Pro
50 55 60
Ile Ile Val Ser Gly Met Thr Gly Gly His Ser Lys Ala Lys Glu Ile
65 70 75 80
Asn Lys Asn Ile Ala Lys Ala Val Glu Glu Leu Gly Leu Gly Met Gly
85 90 95
Val Gly Ser Gln Arg Ala Ala Ile Val Asn Asp Glu Leu Ile Asp Thr
100 105 110
Tyr Ser Ile Val Arg Asp Tyr Thr Asn Asn Leu Val Ile Gly Asn Leu
115 120 125
Gly Ala Val Asn Phe Ile Val Asp Asp Trp Asp Glu Glu Ile Ile Asp
130 135 140
Lys Ala Ile Glu Met Ile Asp Ala Asp Ala Ile Ala Ile His Phe Asn
145 150 155 160
Pro Leu Gln Glu Ile Ile Gln Pro Glu Gly Asp Leu Asn Phe Lys Asn
165 170 175
Leu Tyr Lys Leu Lys Glu Ile Ile Ser Asn Tyr Lys Lys Ser Tyr Lys
180 185 190
Asn Ile Pro Phe Ile Ala Lys Gln Val Gly Glu Gly Phe Ser Lys Glu
195 200 205
Asp Ala Leu Ile Leu Lys Asp Ile Gly Phe Asp Ala Ile Asp Val Gln
210 215 220
Gly Ser Gly Gly Thr Ser Trp Ala Lys Val Glu Ile Tyr Arg Val Lys
225 230 235 240
Glu Glu Glu Ile Lys Arg Leu Ala Glu Lys Phe Ala Asn Trp Gly Ile
245 250 255
Pro Thr Ala Ala Ser Ile Phe Glu Val Lys Ser Val Tyr Asp Gly Ile
260 265 270
Val Ile Gly Ser Gly Gly Ile Arg Gly Gly Leu Asp Ile Ala Lys Cys
275 280 285
Ile Ala Ile Gly Cys Asp Cys Cys Ser Val Ala Leu Pro Ile Leu Lys
290 295 300
Ala Ser Leu Lys Gly Trp Glu Glu Val Val Lys Val Leu Glu Ser Tyr
305 310 315 320
Ile Lys Glu Leu Lys Ile Ala Met Phe Leu Val Gly Ala Glu Asn Ile
325 330 335
Glu Glu Leu Lys Lys Thr Ser Tyr Ile Val Lys Gly Thr Leu Lys Glu
340 345 350
Trp Ile Ser Gln Arg Leu Lys
355
<210> 72
<211> 348
<212> PRT
<213> Thermoplasma acidophilum
<400> 72
Met Ile Gly Lys Arg Lys Glu Glu His Ile Arg Ile Ala Glu Asn Glu
1 5 10 15
Asp Val Ser Ser Phe His Asn Phe Trp Asp Asp Ile Ser Leu Met His
20 25 30
Glu Ala Asp Pro Glu Val Asn Tyr Asp Glu Ile Asp Thr Ser Val Asp
35 40 45
Phe Leu Gly Lys Lys Leu Lys Phe Pro Met Ile Ile Ser Ser Met Thr
50 55 60
Gly Gly Ala Glu Ile Ala Lys Asn Ile Asn Arg Asn Leu Ala Val Ala
65 70 75 80
Ala Glu Arg Phe Gly Ile Gly Met Gly Val Gly Ser Met Arg Ala Ala
85 90 95
Ile Val Asp Arg Ser Ile Glu Asp Thr Tyr Ser Val Ile Asn Glu Ser
100 105 110
His Val Pro Leu Lys Ile Ala Asn Ile Gly Ala Pro Gln Leu Val Arg
115 120 125
Gln Asp Lys Asp Ala Val Ser Asn Arg Asp Ile Ala Tyr Ile Tyr Asp
130 135 140
Leu Ile Lys Ala Asp Phe Leu Ala Val His Phe Asn Phe Leu Gln Glu
145 150 155 160
Met Val Gln Pro Glu Gly Asp Arg Asn Ser Lys Gly Val Ile Asp Arg
165 170 175
Ile Lys Asp Leu Ser Gly Ser Phe Asn Ile Ile Ala Lys Glu Thr Gly
180 185 190
Ser Gly Phe Ser Arg Arg Thr Ala Glu Arg Leu Ile Asp Ala Gly Val
195 200 205
Lys Ala Ile Glu Val Ser Gly Val Ser Gly Thr Thr Phe Ala Ala Val
210 215 220
Glu Tyr Tyr Arg Ala Arg Lys Glu Asn Asn Leu Glu Lys Met Arg Ile
225 230 235 240
Gly Glu Thr Phe Trp Asn Trp Gly Ile Pro Ser Pro Ala Ser Val Tyr
245 250 255
Tyr Cys Ser Asp Leu Ala Pro Val Ile Gly Ser Gly Gly Leu Arg Asn
260 265 270
Gly Leu Asp Leu Ala Lys Ala Ile Ala Met Gly Ala Thr Ala Gly Gly
275 280 285
Phe Ala Arg Ser Leu Leu Lys Asp Ala Asp Thr Asp Pro Glu Met Leu
290 295 300
Met Lys Asn Ile Glu Leu Ile Gln Arg Glu Phe Arg Val Ala Leu Phe
305 310 315 320
Leu Thr Gly Asn Lys Asn Val Tyr Glu Leu Lys Phe Thr Lys Lys Val
325 330 335
Ile Val Asp Pro Leu Arg Ser Trp Leu Glu Ala Lys
340 345
<210> 73
<211> 357
<212> PRT
<213> Leishmania major
<400> 73
Met Ser Ser Arg Asp Cys Thr Val Asp Arg Glu Ala Ala Val Gln Lys
1 5 10 15
Arg Lys Lys Asp His Ile Asp Ile Cys Leu His Gln Asp Val Glu Pro
20 25 30
His Lys Arg Arg Thr Ser Ile Trp Asn Lys Tyr Thr Leu Pro Tyr Lys
35 40 45
Ala Leu Pro Glu Val Asp Leu Gln Lys Ile Asp Thr Ser Cys Glu Phe
50 55 60
Met Gly Lys Arg Ile Ser Phe Pro Phe Phe Ile Ser Ser Met Thr Gly
65 70 75 80
Gly Glu Ala His Gly Arg Val Ile Asn Glu Asn Leu Ala Lys Ala Cys
85 90 95
Glu Ala Glu Lys Ile Pro Phe Gly Leu Gly Ser Met Arg Ile Ile Asn
100 105 110
Arg Tyr Ala Ser Ala Val His Thr Phe Asn Val Lys Glu Phe Cys Pro
115 120 125
Ser Val Pro Met Leu Ala Asn Ile Gly Leu Val Gln Leu Asn Tyr Gly
130 135 140
Phe Gly Pro Lys Glu Val Asn Asn Leu Val Asn Ser Val Arg Ala Asp
145 150 155 160
Gly Leu Cys Ile His Leu Asn His Thr Gln Glu Val Cys Gln Pro Glu
165 170 175
Gly Asp Thr Asn Phe Glu Gly Leu Ile Glu Lys Leu Arg Gln Leu Leu
180 185 190
Pro His Ile Lys Val Pro Val Leu Val Lys Gly Val Gly His Gly Ile
195 200 205
Asp Tyr Glu Ser Met Val Ala Ile Lys Ala Ser Gly Val Lys Tyr Val
210 215 220
Asp Val Ser Gly Cys Gly Gly Thr Ser Trp Ala Trp Ile Glu Gly Arg
225 230 235 240
Arg Gln Pro Tyr Lys Ala Glu Glu Glu Asn Ile Gly Tyr Leu Leu Arg
245 250 255
Asp Ile Gly Val Pro Thr Asp Val Cys Leu Arg Glu Ser Ala Pro Leu
260 265 270
Thr Val Asn Gly Asp Leu His Leu Ile Ala Gly Gly Gly Ile Arg Asn
275 280 285
Gly Met Asp Val Ala Lys Ala Leu Met Met Gly Ala Glu Tyr Ala Thr
290 295 300
Ala Ala Met Pro Phe Leu Ala Ala Ala Leu Glu Ser Ser Glu Ala Val
305 310 315 320
Arg Ala Val Ile Gln Arg Met Arg Gln Glu Leu Arg Val Ser Met Phe
325 330 335
Thr Cys Gly Ala Arg Asn Ile Glu Glu Leu Arg Arg Met Lys Val Ile
340 345 350
Glu Leu Gly His Leu
355
<210> 74
<211> 398
<212> PRT
<213> Streptococcus pneumoniae
<400> 74
Met Asn Asp Lys Thr Glu Val Asn Met Thr Ile Gly Ile Asp Lys Ile
1 5 10 15
Gly Phe Ala Thr Ser Gln Tyr Val Leu Lys Leu Gln Asp Leu Ala Glu
20 25 30
Ala Arg Gly Ile Asp Pro Glu Lys Leu Ser Lys Gly Leu Leu Leu Lys
35 40 45
Glu Leu Ser Ile Ala Pro Leu Thr Glu Asp Ile Val Thr Leu Ala Ala
50 55 60
Ser Ala Ser Asp Ser Ile Leu Thr Glu Gln Glu Arg Gln Glu Val Asp
65 70 75 80
Met Val Ile Val Ala Thr Glu Ser Gly Ile Asp Gln Ser Lys Ala Ala
85 90 95
Ala Val Phe Val His Gly Leu Leu Gly Ile Gln Pro Phe Ala Arg Ser
100 105 110
Phe Glu Ile Lys Glu Ala Cys Tyr Gly Ala Thr Ala Ala Leu His Tyr
115 120 125
Ala Lys Leu His Val Glu Asn Ser Pro Glu Ser Lys Val Leu Val Ile
130 135 140
Ala Ser Asp Ile Ala Lys Tyr Gly Ile Glu Thr Pro Gly Glu Pro Thr
145 150 155 160
Gln Gly Ala Gly Ser Val Ala Met Leu Ile Thr Gln Asn Pro Arg Met
165 170 175
Met Ala Phe Asn Asn Asp Asn Val Ala Gln Thr Arg Asp Ile Met Asp
180 185 190
Phe Trp Arg Pro Asn Tyr Ser Thr Thr Pro Tyr Val Asn Gly Val Tyr
195 200 205
Ser Thr Gln Gln Tyr Leu Asp Ser Leu Lys Thr Thr Trp Leu Glu Tyr
210 215 220
Gln Lys Arg Tyr Gln Leu Thr Leu Asp Asp Phe Ala Ala Val Cys Phe
225 230 235 240
His Leu Pro Tyr Pro Lys Leu Ala Leu Lys Gly Leu Lys Lys Ile Met
245 250 255
Asp Lys Asn Leu Pro Gln Glu Lys Lys Asp Leu Leu Gln Lys His Phe
260 265 270
Asp Gln Ser Ile Leu Tyr Ser Gln Lys Val Gly Asn Ile Tyr Thr Gly
275 280 285
Ser Leu Phe Leu Gly Leu Leu Ser Leu Leu Glu Asn Thr Asp Ser Leu
290 295 300
Lys Ala Gly Asp Lys Ile Ala Leu Tyr Ser Tyr Gly Ser Gly Ala Val
305 310 315 320
Ala Glu Phe Phe Ser Gly Glu Leu Val Glu Gly Tyr Glu Ala Tyr Leu
325 330 335
Asp Lys Asp Arg Leu Asn Lys Leu Asn Gln Arg Thr Ala Leu Ser Val
340 345 350
Ala Asp Tyr Glu Lys Val Phe Phe Glu Glu Val Asn Leu Asp Glu Thr
355 360 365
Asn Ser Ala Gln Phe Ala Gly Tyr Glu Asn Gln Asp Phe Ala Leu Val
370 375 380
Glu Ile Leu Asp His Gln Arg Arg Tyr Ser Lys Val Glu Lys
385 390 395
<210> 75
<211> 391
<212> PRT
<213> Streptococcus pyogenes
<400> 75
Met Thr Ile Gly Ile Asp Lys Ile Gly Phe Ala Thr Ser Gln Tyr Val
1 5 10 15
Leu Lys Leu Glu Asp Leu Ala Leu Ala Arg Gln Val Asp Pro Ala Lys
20 25 30
Phe Ser Gln Gly Leu Leu Ile Glu Ser Phe Ser Val Ala Pro Ile Thr
35 40 45
Glu Asp Ile Ile Thr Leu Ala Ala Ser Ala Ala Asp Gln Ile Leu Thr
50 55 60
Asp Glu Asp Arg Ala Lys Ile Asp Met Val Ile Leu Ala Thr Glu Ser
65 70 75 80
Ser Thr Asp Gln Ser Lys Ala Ser Ala Ile Tyr Val His His Leu Val
85 90 95
Gly Ile Gln Pro Phe Ala Arg Ser Phe Glu Val Lys Gln Ala Cys Tyr
100 105 110
Ser Ala Thr Ala Ala Leu Asp Tyr Ala Lys Leu His Val Ala Ser Lys
115 120 125
Pro Asp Ser Arg Val Leu Val Ile Ala Ser Asp Ile Ala Arg Tyr Gly
130 135 140
Val Gly Ser Pro Gly Glu Ser Thr Gln Gly Ser Gly Ser Ile Ala Leu
145 150 155 160
Leu Val Thr Ala Asp Pro Arg Ile Leu Ala Leu Asn Glu Asp Asn Val
165 170 175
Ala Gln Thr Arg Asp Ile Met Asp Phe Trp Arg Pro Asn Tyr Ser Phe
180 185 190
Thr Pro Tyr Val Asp Gly Ile Tyr Ser Thr Lys Gln Tyr Leu Asn Cys
195 200 205
Leu Glu Thr Thr Trp Gln Ala Tyr Gln Lys Arg Glu Asn Leu Gln Leu
210 215 220
Ser Asp Phe Ala Ala Val Cys Phe His Ile Pro Phe Pro Lys Leu Ala
225 230 235 240
Leu Lys Gly Leu Asn Asn Ile Met Asp Asn Thr Val Pro Pro Glu His
245 250 255
Arg Glu Lys Leu Ile Glu Ala Phe Gln Ala Ser Ile Thr Tyr Ser Lys
260 265 270
Gln Ile Gly Asn Ile Tyr Thr Gly Ser Leu Tyr Leu Gly Leu Leu Ser
275 280 285
Leu Leu Glu Asn Ser Lys Val Leu Gln Ser Gly Asp Lys Ile Gly Phe
290 295 300
Phe Ser Tyr Gly Ser Gly Ala Val Ser Glu Phe Tyr Ser Gly Gln Leu
305 310 315 320
Val Ala Gly Tyr Asp Lys Met Leu Met Thr Asn Arg Gln Ala Leu Leu
325 330 335
Asp Gln Arg Thr Arg Leu Ser Val Ser Lys Tyr Glu Asp Leu Phe Tyr
340 345 350
Glu Gln Val Gln Leu Asp Asp Asn Gly Asn Ala Asn Phe Asp Ile Tyr
355 360 365
Leu Thr Gly Lys Phe Ala Leu Thr Ala Ile Lys Glu His Gln Arg Ile
370 375 380
Tyr His Thr Asn Asp Lys Asn
385 390
<210> 76
<211> 383
<212> PRT
<213> Enterococcus faecalis
<400> 76
Met Thr Ile Gly Ile Asp Lys Ile Ser Phe Phe Val Pro Pro Tyr Tyr
1 5 10 15
Ile Asp Met Thr Ala Leu Ala Glu Ala Arg Asn Val Asp Pro Gly Lys
20 25 30
Phe His Ile Gly Ile Gly Gln Asp Gln Met Ala Val Asn Pro Ile Ser
35 40 45
Gln Asp Ile Val Thr Phe Ala Ala Asn Ala Ala Glu Ala Ile Leu Thr
50 55 60
Lys Glu Asp Lys Glu Ala Ile Asp Met Val Ile Val Gly Thr Glu Ser
65 70 75 80
Ser Ile Asp Glu Ser Lys Ala Ala Ala Val Val Leu His Arg Leu Met
85 90 95
Gly Ile Gln Pro Phe Ala Arg Ser Phe Glu Ile Lys Glu Ala Cys Tyr
100 105 110
Gly Ala Thr Ala Gly Leu Gln Leu Ala Lys Asn His Val Ala Leu His
115 120 125
Pro Asp Lys Lys Val Leu Val Val Ala Ala Asp Ile Ala Lys Tyr Gly
130 135 140
Leu Asn Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met
145 150 155 160
Leu Val Ala Ser Glu Pro Arg Ile Leu Ala Leu Lys Glu Asp Asn Val
165 170 175
Met Leu Thr Gln Asp Ile Tyr Asp Phe Trp Arg Pro Thr Gly His Pro
180 185 190
Tyr Pro Met Val Asp Gly Pro Leu Ser Asn Glu Thr Tyr Ile Gln Ser
195 200 205
Phe Ala Gln Val Trp Asp Glu His Lys Lys Arg Thr Gly Leu Asp Phe
210 215 220
Ala Asp Tyr Asp Ala Leu Ala Phe His Ile Pro Tyr Thr Lys Met Gly
225 230 235 240
Lys Lys Ala Leu Leu Ala Lys Ile Ser Asp Gln Thr Glu Ala Glu Gln
245 250 255
Glu Arg Ile Leu Ala Arg Tyr Glu Glu Ser Ile Ile Tyr Ser Arg Arg
260 265 270
Val Gly Asn Leu Tyr Thr Gly Ser Leu Tyr Leu Gly Leu Ile Ser Leu
275 280 285
Leu Glu Asn Ala Thr Thr Leu Thr Ala Gly Asn Gln Ile Gly Leu Phe
290 295 300
Ser Tyr Gly Ser Gly Ala Val Ala Glu Phe Phe Thr Gly Glu Leu Val
305 310 315 320
Ala Gly Tyr Gln Asn His Leu Gln Lys Glu Thr His Leu Ala Leu Leu
325 330 335
Asp Asn Arg Thr Glu Leu Ser Ile Ala Glu Tyr Glu Ala Met Phe Ala
340 345 350
Glu Thr Leu Asp Thr Asp Ile Asp Gln Thr Leu Glu Asp Glu Leu Lys
355 360 365
Tyr Ser Ile Ser Ala Ile Asn Asn Thr Val Arg Ser Tyr Arg Asn
370 375 380
<210> 77
<211> 384
<212> PRT
<213> Enterococcus faecium
<400> 77
Met Lys Ile Gly Ile Asp Arg Leu Ser Phe Phe Ile Pro Asn Leu Tyr
1 5 10 15
Leu Asp Met Thr Glu Leu Ala Glu Ser Arg Gly Asp Asp Pro Ala Lys
20 25 30
Tyr His Ile Gly Ile Gly Gln Asp Gln Met Ala Val Asn Arg Ala Asn
35 40 45
Glu Asp Ile Ile Thr Leu Gly Ala Asn Ala Ala Ser Lys Ile Val Thr
50 55 60
Glu Lys Asp Arg Glu Leu Ile Asp Met Val Ile Val Gly Thr Glu Ser
65 70 75 80
Gly Ile Asp His Ser Lys Ala Ser Ala Val Ile Ile His His Leu Leu
85 90 95
Lys Ile Gln Ser Phe Ala Arg Ser Phe Glu Val Lys Glu Ala Cys Tyr
100 105 110
Gly Gly Thr Ala Ala Leu His Met Ala Lys Glu Tyr Val Lys Asn His
115 120 125
Pro Glu Arg Lys Val Leu Val Ile Ala Ser Asp Ile Ala Arg Tyr Gly
130 135 140
Leu Ala Ser Gly Gly Glu Val Thr Gln Gly Val Gly Ala Val Ala Met
145 150 155 160
Met Ile Thr Gln Asn Pro Arg Ile Leu Ser Ile Glu Asp Asp Ser Val
165 170 175
Phe Leu Thr Glu Asp Ile Tyr Asp Phe Trp Arg Pro Asp Tyr Ser Glu
180 185 190
Phe Pro Val Val Asp Gly Pro Leu Ser Asn Ser Thr Tyr Ile Glu Ser
195 200 205
Phe Gln Lys Val Trp Asn Arg His Lys Glu Leu Ser Gly Arg Gly Leu
210 215 220
Glu Asp Tyr Gln Ala Ile Ala Phe His Ile Pro Tyr Thr Lys Met Gly
225 230 235 240
Lys Lys Ala Leu Gln Ser Val Leu Asp Gln Thr Asp Glu Asp Asn Gln
245 250 255
Glu Arg Leu Met Ala Arg Tyr Glu Glu Ser Ile Arg Tyr Ser Arg Arg
260 265 270
Ile Gly Asn Leu Tyr Thr Gly Ser Leu Tyr Leu Gly Leu Thr Ser Leu
275 280 285
Leu Glu Asn Ser Lys Ser Leu Gln Pro Gly Asp Arg Ile Gly Leu Phe
290 295 300
Ser Tyr Gly Ser Gly Ala Val Ser Glu Phe Phe Thr Gly Tyr Leu Glu
305 310 315 320
Glu Asn Tyr Gln Glu Tyr Leu Phe Ala Gln Ser His Gln Glu Met Leu
325 330 335
Asp Ser Arg Thr Arg Ile Thr Val Asp Glu Tyr Glu Thr Ile Phe Ser
340 345 350
Glu Thr Leu Pro Glu His Gly Glu Cys Ala Glu Tyr Thr Ser Asp Val
355 360 365
Pro Phe Ser Ile Thr Lys Ile Glu Asn Asp Ile Arg Tyr Tyr Lys Ile
370 375 380
<210> 78
<211> 388
<212> PRT
<213> Staphylococcus haemolyticus
<400> 78
Met Ser Ile Gly Ile Asp Lys Ile Asn Phe Tyr Val Pro Lys Tyr Tyr
1 5 10 15
Val Asp Met Ala Lys Leu Ala Glu Ala Arg Gln Val Asp Pro Asn Lys
20 25 30
Phe Leu Ile Gly Ile Gly Gln Thr Gln Met Ala Val Ser Pro Val Ser
35 40 45
Gln Asp Ile Val Ser Met Gly Ala Asn Ala Ala Lys Asp Ile Ile Thr
50 55 60
Asp Asp Asp Lys Lys His Ile Gly Met Val Ile Val Ala Thr Glu Ser
65 70 75 80
Ala Ile Asp Asn Ala Lys Ala Ala Ala Val Gln Ile His Asn Leu Leu
85 90 95
Gly Val Gln Pro Phe Ala Arg Cys Phe Glu Met Lys Glu Ala Cys Tyr
100 105 110
Ala Ala Thr Pro Ala Ile Gln Leu Ala Lys Asp Tyr Ile Glu Lys Arg
115 120 125
Pro Asn Glu Lys Val Leu Val Ile Ala Ser Asp Thr Ala Arg Tyr Gly
130 135 140
Ile Gln Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met
145 150 155 160
Leu Ile Ser Asn Asn Pro Ser Ile Leu Glu Leu Asn Asp Asp Ala Val
165 170 175
Ala Tyr Thr Glu Asp Val Tyr Asp Phe Trp Arg Pro Thr Gly His Lys
180 185 190
Tyr Pro Leu Val Ala Gly Ala Leu Ser Lys Asp Ala Tyr Ile Lys Ser
195 200 205
Phe Gln Glu Ser Trp Asn Glu Tyr Ala Arg Arg Glu Asp Lys Thr Leu
210 215 220
Ser Asp Phe Glu Ser Leu Cys Phe His Val Pro Phe Thr Lys Met Gly
225 230 235 240
Lys Lys Ala Leu Asp Ser Ile Ile Asn Asp Ala Asp Glu Thr Thr Gln
245 250 255
Glu Arg Leu Thr Ser Gly Tyr Glu Asp Ala Val Tyr Tyr Asn Arg Tyr
260 265 270
Val Gly Asn Ile Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Ile Ser Leu
275 280 285
Leu Glu Asn Arg Ser Leu Lys Gly Gly Gln Thr Ile Gly Leu Phe Ser
290 295 300
Tyr Gly Ser Gly Ser Val Gly Glu Phe Phe Ser Ala Thr Leu Val Glu
305 310 315 320
Gly Tyr Glu Lys Gln Leu Asp Ile Glu Gly His Lys Ala Leu Leu Asn
325 330 335
Glu Arg Gln Glu Val Ser Val Glu Asp Tyr Glu Ser Phe Phe Lys Arg
340 345 350
Phe Asp Asp Leu Glu Phe Asp His Ala Thr Glu Gln Thr Asp Asp Asp
355 360 365
Lys Ser Ile Tyr Tyr Leu Glu Asn Ile Gln Asp Asp Ile Arg Gln Tyr
370 375 380
His Ile Pro Lys
385
<210> 79
<211> 388
<212> PRT
<213> Staphylococcus epidermidis
<400> 79
Met Asn Ile Gly Ile Asp Lys Ile Ser Phe Tyr Val Pro Lys Tyr Tyr
1 5 10 15
Val Asp Met Ala Lys Leu Ala Glu Ala Arg Gln Val Asp Pro Asn Lys
20 25 30
Phe Leu Ile Gly Ile Gly Gln Thr Glu Met Thr Val Ser Pro Val Asn
35 40 45
Gln Asp Ile Val Ser Met Gly Ala Asn Ala Ala Lys Asp Ile Ile Thr
50 55 60
Glu Glu Asp Lys Lys Asn Ile Gly Met Val Ile Val Ala Thr Glu Ser
65 70 75 80
Ala Ile Asp Asn Ala Lys Ala Ala Ala Val Gln Ile His His Leu Leu
85 90 95
Gly Ile Gln Pro Phe Ala Arg Cys Phe Glu Met Lys Glu Ala Cys Tyr
100 105 110
Ala Ala Thr Pro Ala Ile Gln Leu Ala Lys Asp Tyr Leu Ala Gln Arg
115 120 125
Pro Asn Glu Lys Val Leu Val Ile Ala Ser Asp Thr Ala Arg Tyr Gly
130 135 140
Ile His Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met
145 150 155 160
Met Ile Ser His Asp Pro Ser Ile Leu Lys Leu Asn Asp Asp Ala Val
165 170 175
Ala Tyr Thr Glu Asp Val Tyr Asp Phe Trp Arg Pro Thr Gly His Gln
180 185 190
Tyr Pro Leu Val Ala Gly Ala Leu Ser Lys Asp Ala Tyr Ile Lys Ser
195 200 205
Phe Gln Glu Ser Trp Asn Glu Tyr Ala Arg Arg His Asn Lys Thr Leu
210 215 220
Ala Asp Phe Ala Ser Leu Cys Phe His Val Pro Phe Thr Lys Met Gly
225 230 235 240
Gln Lys Ala Leu Asp Ser Ile Ile Asn His Ala Asp Glu Thr Thr Gln
245 250 255
Asp Arg Leu Asn Ser Ser Tyr Gln Asp Ala Val Asp Tyr Asn Arg Tyr
260 265 270
Val Gly Asn Ile Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Ile Ser Leu
275 280 285
Leu Glu Thr Arg Asp Leu Lys Gly Gly Gln Thr Ile Gly Leu Phe Ser
290 295 300
Tyr Gly Ser Gly Ser Val Gly Glu Phe Phe Ser Gly Thr Leu Val Asp
305 310 315 320
Gly Phe Lys Glu Gln Leu Asp Val Glu Arg His Lys Ser Leu Leu Asn
325 330 335
Asn Arg Ile Glu Val Ser Val Asp Glu Tyr Glu His Phe Phe Lys Arg
340 345 350
Phe Asp Gln Leu Glu Leu Asn His Glu Leu Glu Lys Ser Asn Ala Asp
355 360 365
Arg Asp Ile Phe Tyr Leu Lys Ser Ile Asp Asn Asn Ile Arg Glu Tyr
370 375 380
His Ile Ala Glu
385
<210> 80
<211> 388
<212> PRT
<213> Staphylococcus aureus
<400> 80
Met Thr Ile Gly Ile Asp Lys Ile Asn Phe Tyr Val Pro Lys Tyr Tyr
1 5 10 15
Val Asp Met Ala Lys Leu Ala Glu Ala Arg Gln Val Asp Pro Asn Lys
20 25 30
Phe Leu Ile Gly Ile Gly Gln Thr Glu Met Ala Val Ser Pro Val Asn
35 40 45
Gln Asp Ile Val Ser Met Gly Ala Asn Ala Ala Lys Asp Ile Ile Thr
50 55 60
Asp Glu Asp Lys Lys Lys Ile Gly Met Val Ile Val Ala Thr Glu Ser
65 70 75 80
Ala Val Asp Ala Ala Lys Ala Ala Ala Val Gln Ile His Asn Leu Leu
85 90 95
Gly Ile Gln Pro Phe Ala Arg Cys Phe Glu Met Lys Glu Ala Cys Tyr
100 105 110
Ala Ala Thr Pro Ala Ile Gln Leu Ala Lys Asp Tyr Leu Ala Thr Arg
115 120 125
Pro Asn Glu Lys Val Leu Val Ile Ala Thr Asp Thr Ala Arg Tyr Gly
130 135 140
Leu Asn Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met
145 150 155 160
Val Ile Ala His Asn Pro Ser Ile Leu Ala Leu Asn Glu Asp Ala Val
165 170 175
Ala Tyr Thr Glu Asp Val Tyr Asp Phe Trp Arg Pro Thr Gly His Lys
180 185 190
Tyr Pro Leu Val Asp Gly Ala Leu Ser Lys Asp Ala Tyr Ile Arg Ser
195 200 205
Phe Gln Gln Ser Trp Asn Glu Tyr Ala Lys Arg Gln Gly Lys Ser Leu
210 215 220
Ala Asp Phe Ala Ser Leu Cys Phe His Val Pro Phe Thr Lys Met Gly
225 230 235 240
Lys Lys Ala Leu Glu Ser Ile Ile Asp Asn Ala Asp Glu Thr Thr Gln
245 250 255
Glu Arg Leu Arg Ser Gly Tyr Glu Asp Ala Val Asp Tyr Asn Arg Tyr
260 265 270
Val Gly Asn Ile Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Ile Ser Leu
275 280 285
Leu Glu Asn Arg Asp Leu Gln Ala Gly Glu Thr Ile Gly Leu Phe Ser
290 295 300
Tyr Gly Ser Gly Ser Val Val Glu Phe Tyr Ser Ala Thr Leu Val Val
305 310 315 320
Gly Tyr Lys Asp His Leu Asp Gln Ala Ala His Lys Ala Leu Leu Asn
325 330 335
Asn Arg Thr Glu Val Ser Val Asp Ala Tyr Glu Thr Phe Phe Lys Arg
340 345 350
Phe Asp Asp Val Glu Phe Asp Glu Glu Gln Asp Ala Val His Glu Asp
355 360 365
Arg His Ile Phe Tyr Leu Ser Asn Ile Glu Asn Asn Val Arg Glu Tyr
370 375 380
His Arg Pro Glu
385
<210> 81
<211> 389
<212> PRT
<213> Staphylococcus carnosus
<400> 81
Met Thr Ile Gly Ile Asp Gln Leu Asn Phe Tyr Ile Pro Asn Phe Tyr
1 5 10 15
Val Asp Met Ala Glu Leu Ala Glu Ala Arg Gly Val Asp Pro Asn Lys
20 25 30
Phe Leu Ile Gly Ile Gly Gln Ser Gln Met Ala Val Ser Pro Val Ser
35 40 45
Gln Asp Ile Val Ser Met Gly Ala Asn Ala Ala Gln Pro Ile Leu Ser
50 55 60
Glu Gln Asp Lys Lys Asp Ile Thr Met Val Ile Val Ala Thr Glu Ser
65 70 75 80
Ala Ile Asp Ser Ala Lys Ala Ser Ala Val Gln Ile His His Leu Leu
85 90 95
Gly Ile Gln Pro Phe Ala Arg Cys Phe Glu Met Lys Glu Ala Cys Tyr
100 105 110
Ala Ala Thr Pro Ala Ile Gln Leu Ala Lys Asp Tyr Leu Val Pro Arg
115 120 125
Pro Lys Glu Lys Val Leu Val Ile Ala Ser Asp Thr Ala Arg Tyr Gly
130 135 140
Leu Asn Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met
145 150 155 160
Val Ile Ser His Asn Pro Ser Ile Leu Glu Leu His Asp Asp Ser Val
165 170 175
Ala Tyr Thr Glu Asp Val Tyr Asp Phe Trp Arg Pro Ser Gly Glu Ile
180 185 190
Tyr Pro Leu Val Ala Gly Lys Leu Ser Lys Asp Ala Tyr Ile Lys Ser
195 200 205
Phe Gln Glu Ser Trp Asn Glu Tyr Ala Lys Arg His His Lys Ser Leu
210 215 220
Ser Asp Phe Ala Ala Leu Cys Phe His Val Pro Phe Thr Lys Met Gly
225 230 235 240
Gln Lys Ala Leu Asp Ser Ile Leu Thr Asp Ser Ala Ser Glu Asp Thr
245 250 255
Gln Ala Arg Leu Asn Glu Gly Tyr Lys Ser Ala Thr Asp Tyr Asn Arg
260 265 270
Tyr Val Gly Asn Val Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Ile Ser
275 280 285
Leu Leu Glu Asn His Lys Leu Asn Gly Gly Asp Asn Ile Gly Leu Phe
290 295 300
Ser Tyr Gly Ser Gly Ser Val Gly Glu Phe Phe Ser Ala Thr Leu Val
305 310 315 320
Asp Asn Tyr Gln Asp His Leu Asp Val Lys Ala His Lys Ala Met Leu
325 330 335
Asp Asn Arg Lys Ala Leu Ser Val Glu Glu Tyr Glu Lys Phe Phe Asn
340 345 350
Arg Phe Asp Asn Leu Glu Phe Asp Thr Glu Thr Glu Leu Glu Val Glu
355 360 365
Pro Lys Gly Asn Phe Tyr Leu Lys Glu Ile Ser Asp Asn Ile Arg Tyr
370 375 380
Tyr Asp Thr Val Lys
385
<210> 82
<211> 389
<212> PRT
<213> Streptomyces sp.
<400> 82
Met Ser Ile Ser Ile Gly Ile His Asp Leu Ser Phe Ala Thr Thr Glu
1 5 10 15
Phe Val Leu Pro His Thr Ala Leu Ala Glu Tyr Asn Gly Thr Glu Ile
20 25 30
Gly Lys Tyr His Val Gly Ile Gly Gln Gln Ser Met Ser Val Pro Ala
35 40 45
Ala Asp Glu Asp Ile Val Thr Met Ala Ala Thr Ala Ala Arg Pro Ile
50 55 60
Ile Glu Arg Asn Gly Lys Ser Arg Ile Arg Thr Val Val Phe Ala Thr
65 70 75 80
Glu Ser Ser Ile Asp Gln Ala Lys Ala Gly Gly Val Tyr Val His Ser
85 90 95
Leu Leu Gly Leu Glu Ser Ala Cys Arg Val Val Glu Leu Lys Gln Ala
100 105 110
Cys Tyr Gly Ala Thr Ala Ala Leu Gln Phe Ala Ile Gly Leu Val Arg
115 120 125
Arg Asp Pro Ala Gln Gln Val Leu Val Ile Ala Ser Asp Val Ser Lys
130 135 140
Tyr Glu Leu Asp Ser Pro Gly Glu Ala Thr Gln Gly Ala Ala Ala Val
145 150 155 160
Ala Met Leu Val Gly Ala Asp Pro Ala Leu Leu Arg Ile Glu Glu Pro
165 170 175
Ser Gly Leu Phe Thr Ala Asp Val Met Asp Phe Trp Arg Pro Asn Tyr
180 185 190
Leu Thr Thr Ala Leu Val Asp Gly Gln Glu Ser Ile Asn Ala Tyr Leu
195 200 205
Gln Ala Val Glu Gly Ala Trp Lys Asp Tyr Ala Glu Gln Asp Gly Arg
210 215 220
Ser Leu Glu Glu Phe Ala Ala Phe Val Tyr His Gln Pro Phe Thr Lys
225 230 235 240
Met Ala Tyr Lys Ala His Arg His Leu Leu Asn Phe Asn Gly Tyr Asp
245 250 255
Thr Asp Lys Asp Ala Ile Glu Gly Ala Leu Gly Gln Thr Thr Ala Tyr
260 265 270
Asn Asn Val Ile Gly Asn Ser Tyr Thr Ala Ser Val Tyr Leu Gly Leu
275 280 285
Ala Ala Leu Leu Asp Gln Ala Asp Asp Leu Thr Gly Arg Ser Ile Gly
290 295 300
Phe Leu Ser Tyr Gly Ser Gly Ser Val Ala Glu Phe Phe Ser Gly Thr
305 310 315 320
Val Val Ala Gly Tyr Arg Glu Arg Leu Arg Thr Glu Ala Asn Gln Glu
325 330 335
Ala Ile Ala Arg Arg Lys Ser Val Asp Tyr Ala Thr Tyr Arg Glu Leu
340 345 350
His Glu Tyr Thr Leu Pro Ser Asp Gly Gly Asp His Ala Thr Pro Val
355 360 365
Gln Thr Thr Gly Pro Phe Arg Leu Ala Gly Ile Asn Asp His Lys Arg
370 375 380
Ile Tyr Glu Ala Arg
385
<210> 83
<211> 389
<212> PRT
<213> Streptomyces griseosporeus
<400> 83
Met Pro Leu Ala Ile Gly Ile His Asp Leu Ser Phe Ala Thr Gly Glu
1 5 10 15
Phe Val Leu Pro His Thr Ala Leu Ala Ala His Asn Gly Thr Glu Ile
20 25 30
Gly Lys Tyr His Ala Gly Ile Gly Gln Glu Ser Met Ser Val Pro Ala
35 40 45
Ala Asp Glu Asp Ile Val Thr Leu Ala Ala Thr Ala Ala Ala Pro Ile
50 55 60
Val Ala Arg His Gly Ser Asp Arg Ile Arg Thr Val Val Leu Ala Thr
65 70 75 80
Glu Ser Ser Ile Asp Gln Ala Lys Ser Ala Gly Val Tyr Val His Ser
85 90 95
Leu Leu Gly Leu Pro Ser Ala Thr Arg Val Val Glu Leu Lys Gln Ala
100 105 110
Cys Tyr Gly Ala Thr Ala Gly Leu Gln Phe Ala Ile Gly Leu Val Gln
115 120 125
Arg Asp Pro Ala Gln Gln Val Leu Val Ile Ala Ser Asp Val Ser Lys
130 135 140
Tyr Asp Leu Asp Ser Pro Gly Glu Ala Thr Gln Gly Ala Ala Ala Val
145 150 155 160
Ala Met Leu Val Gly Ala Asp Pro Gly Leu Val Arg Ile Glu Asp Pro
165 170 175
Ser Gly Leu Phe Thr Val Asp Val Met Asp Phe Trp Arg Pro Asn Tyr
180 185 190
Arg Thr Thr Ala Leu Val Asp Gly Gln Glu Ser Ile Gly Ala Tyr Leu
195 200 205
Gln Ala Val Glu Gly Ala Trp Lys Asp Tyr Ser Glu Arg Gly Gly His
210 215 220
Ser Leu Glu Gln Phe Ala Ala Phe Cys Tyr His Gln Pro Phe Thr Lys
225 230 235 240
Met Ala His Lys Ala His Arg His Leu Leu Asn Tyr Cys Ser His Asp
245 250 255
Ile His His Asp Asp Val Thr Arg Ala Val Gly Arg Thr Thr Ala Tyr
260 265 270
Asn Arg Val Ile Gly Asn Ser Tyr Thr Ala Ser Val Tyr Leu Gly Leu
275 280 285
Ala Ala Leu Leu Asp Gln Ala Asp Asp Leu Thr Gly Glu Arg Ile Gly
290 295 300
Phe Leu Ser Tyr Gly Ser Gly Ser Val Ala Glu Phe Phe Gly Gly Ile
305 310 315 320
Val Val Ala Gly Tyr Arg Asp Arg Leu Arg Thr Ala Ala Asn Ile Glu
325 330 335
Ala Val Ser Arg Arg Arg Pro Ile Asp Tyr Ala Gly Tyr Arg Glu Leu
340 345 350
His Glu Trp Ala Phe Pro Ala Arg Arg Gly Ala His Ser Thr Pro Gln
355 360 365
Gln Thr Thr Gly Pro Phe Arg Leu Ser Gly Ile Ser Gly His Lys Arg
370 375 380
Leu Tyr Arg Ala Cys
385
<210> 84
<211> 407
<212> PRT
<213> Borrelia burgdorferi
<400> 84
Met Arg Ile Gly Ile Ser Asp Ile Arg Ile Phe Leu Pro Leu Asn Tyr
1 5 10 15
Leu Asp Phe Ser Val Leu Leu Glu Asn Pro Leu Tyr Phe Ser Asn Glu
20 25 30
Val Phe Phe Lys Lys Ile Asn Arg Ala Ile Asp Ala Thr Leu Gln Lys
35 40 45
Gly Phe Arg Phe Thr Ser Pro Asn Glu Asp Ser Val Thr Met Ala Ser
50 55 60
Ser Ala Val Lys Leu Ile Phe Asp Asn Asn Asn Leu Asp Leu Ser Lys
65 70 75 80
Ile Arg Ile Leu Leu Gly Gly Thr Glu Thr Gly Val Asp His Ser Lys
85 90 95
Ala Ile Ser Ser Tyr Val Phe Gly Ala Leu Lys Gln Ser Gly Ile Cys
100 105 110
Leu Gly Asn Asn Phe Leu Thr Phe Gln Val Gln His Ala Cys Ala Gly
115 120 125
Ala Ala Met Ser Leu His Thr Val Ala Ser Val Leu Ser His Ser Asn
130 135 140
Asn Ser Glu Tyr Gly Ile Val Phe Ser Ser Asp Ile Ala His Tyr Ser
145 150 155 160
Asn Leu Thr Thr Ala Glu Ile Thr Gln Gly Ala Gly Ala Thr Ala Ile
165 170 175
Leu Ile Glu Lys Asn Pro Lys Ile Leu Ser Ile Asn Leu Ser Glu Phe
180 185 190
Gly Val Tyr Thr Asp Asp Val Asp Asp Phe Phe Arg Pro Phe Gly Ser
195 200 205
Val Glu Ala Lys Val Arg Gly Gln Tyr Ser Val Glu Cys Tyr Asn Asn
210 215 220
Ala Asn Glu Asn Ala Leu Arg Asp Phe Ala Phe Lys Lys Gln Leu Ser
225 230 235 240
Met Lys Asp Leu Phe Ser Asn Tyr Arg Phe Val Leu His Val Pro Phe
245 250 255
Ala Lys Met Pro Ile Asp Ser Met His Tyr Ile Leu Lys Lys Tyr Tyr
260 265 270
Ser Asp Asp Glu Ser Val Arg Asn Ala Tyr Leu Glu Ser Ile Asp Phe
275 280 285
Tyr Asp Gly Val Glu Ala Ala Met Glu Val Gly Asn Leu Tyr Thr Gly
290 295 300
Ser Ile Phe Leu Ser Leu Ala Phe Tyr Leu Lys Arg Val Phe Ser Lys
305 310 315 320
Lys Asp Ile Thr Gly Glu Lys Ile Leu Phe Cys Ser Tyr Gly Ser Gly
325 330 335
Asn Ile Met Ile Ile Tyr Glu Leu Thr Ile Glu Lys Ser Ala Phe Asp
340 345 350
Val Ile Lys Leu Trp Asp Leu Glu Gly Leu Ile Lys Asn Arg Asn Asn
355 360 365
Ala Asn Phe Glu Glu Tyr Lys Asp Phe Phe Gln Asn Lys Ile Ile Pro
370 375 380
Gly Glu Ser Arg Gly Phe Tyr Leu Lys Glu Leu Arg Asn Asp Gly Tyr
385 390 395 400
Arg Val Tyr Gly Tyr Arg Ala
405
<210> 85
<211> 317
<212> PRT
<213> Streptococcus pneumoniae
<400> 85
Met Asp Arg Glu Pro Val Thr Val Arg Ser Tyr Ala Asn Ile Ala Ile
1 5 10 15
Ile Lys Tyr Trp Gly Lys Lys Lys Glu Lys Glu Met Val Pro Ala Thr
20 25 30
Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Tyr Thr Glu Thr Thr Leu
35 40 45
Ser Pro Leu Pro Ala Asn Val Thr Ala Asp Glu Phe Tyr Ile Asn Gly
50 55 60
Gln Leu Gln Asn Glu Val Glu His Ala Lys Met Ser Lys Ile Ile Asp
65 70 75 80
Arg Tyr Arg Pro Ala Gly Glu Gly Phe Val Arg Ile Asp Thr Gln Asn
85 90 95
Asn Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser
100 105 110
Ala Leu Val Lys Ala Cys Asn Ala Tyr Phe Lys Leu Gly Leu Asp Arg
115 120 125
Ser Gln Leu Ala Gln Glu Ala Lys Phe Ala Ser Gly Ser Ser Ser Arg
130 135 140
Ser Phe Tyr Gly Pro Leu Gly Ala Trp Asp Lys Asp Ser Gly Glu Ile
145 150 155 160
Tyr Pro Val Glu Thr Asp Leu Lys Leu Ala Met Ile Met Leu Val Leu
165 170 175
Glu Asp Lys Lys Lys Pro Ile Ser Ser Arg Asp Gly Met Lys Leu Cys
180 185 190
Val Glu Thr Ser Thr Thr Phe Asp Asp Trp Val Arg Gln Ser Glu Lys
195 200 205
Asp Tyr Gln Asp Met Leu Ile Tyr Leu Lys Glu Asn Asp Phe Ala Lys
210 215 220
Ile Gly Glu Leu Thr Glu Lys Asn Ala Leu Ala Met His Ala Thr Thr
225 230 235 240
Lys Thr Ala Ser Pro Ala Phe Ser Tyr Leu Thr Asp Ala Ser Tyr Glu
245 250 255
Ala Met Ala Phe Val Arg Gln Leu Arg Glu Lys Gly Glu Ala Cys Tyr
260 265 270
Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Phe Cys Gln Glu Lys
275 280 285
Asp Leu Glu His Leu Ser Glu Ile Phe Gly Gln Arg Tyr Arg Leu Ile
290 295 300
Val Ser Lys Thr Lys Asp Leu Ser Gln Asp Asp Cys Cys
305 310 315
<210> 86
<211> 314
<212> PRT
<213> Streptococcus pyogenes
<400> 86
Met Asp Pro Asn Val Ile Thr Val Thr Ser Tyr Ala Asn Ile Ala Ile
1 5 10 15
Ile Lys Tyr Trp Gly Lys Glu Asn Gln Ala Lys Met Ile Pro Ser Thr
20 25 30
Ser Ser Ile Ser Leu Thr Leu Glu Asn Met Phe Thr Thr Thr Ser Val
35 40 45
Ser Phe Leu Pro Asp Thr Ala Thr Ser Asp Gln Phe Tyr Ile Asn Gly
50 55 60
Val Leu Gln Asn Asp Glu Glu His Thr Lys Ile Ser Thr Ile Ile Asp
65 70 75 80
Gln Phe Arg Gln Pro Gly Gln Ala Phe Val Lys Met Glu Thr Gln Asn
85 90 95
Asn Met Pro Thr Ala Ala Gly Leu Ser Ser Ser Ser Ser Gly Leu Ser
100 105 110
Ala Leu Val Lys Ala Cys Asp Gln Leu Phe Asp Thr Gln Leu Asp Gln
115 120 125
Lys Ala Leu Ala Gln Lys Ala Lys Phe Ala Ser Gly Ser Ser Ser Arg
130 135 140
Ser Phe Phe Gly Pro Val Ala Ala Trp Asp Lys Asp Ser Gly Ala Ile
145 150 155 160
Tyr Lys Val Glu Thr Asp Leu Lys Met Ala Met Ile Met Leu Val Leu
165 170 175
Asn Ala Ala Lys Lys Pro Ile Ser Ser Arg Glu Gly Met Lys Leu Cys
180 185 190
Arg Asp Thr Ser Thr Thr Phe Asp Glu Trp Val Glu Gln Ser Ala Ile
195 200 205
Asp Tyr Gln His Met Leu Thr Tyr Leu Lys Thr Asn Asn Phe Glu Lys
210 215 220
Val Gly Gln Leu Thr Glu Ala Asn Ala Leu Ala Met His Ala Thr Thr
225 230 235 240
Lys Thr Ala Asn Pro Pro Phe Ser Tyr Leu Thr Lys Glu Ser Tyr Gln
245 250 255
Ala Met Glu Ala Val Lys Glu Leu Arg Gln Glu Gly Phe Ala Cys Tyr
260 265 270
Phe Thr Met Asp Ala Gly Pro Asn Val Lys Val Leu Cys Leu Glu Lys
275 280 285
Asp Leu Ala Gln Leu Ala Glu Arg Leu Gly Lys Asn Tyr Arg Ile Ile
290 295 300
Val Ser Lys Thr Lys Asp Leu Pro Asp Val
305 310
<210> 87
<211> 331
<212> PRT
<213> Enterococcus faecalis
<400> 87
Met Leu Ser Gly Lys Ala Arg Ala His Thr Asn Ile Ala Leu Ile Lys
1 5 10 15
Tyr Trp Gly Lys Ala Asn Glu Glu Tyr Ile Leu Pro Met Asn Ser Ser
20 25 30
Leu Ser Leu Thr Leu Asp Ala Phe Tyr Thr Glu Thr Thr Val Thr Phe
35 40 45
Asp Ala His Tyr Ser Glu Asp Val Phe Ile Leu Asn Gly Ile Leu Gln
50 55 60
Asn Glu Lys Gln Thr Lys Lys Val Lys Glu Phe Leu Asn Leu Val Arg
65 70 75 80
Gln Gln Ala Asp Cys Thr Trp Phe Ala Lys Val Glu Ser Gln Asn Phe
85 90 95
Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Gly Leu Ala Ala
100 105 110
Leu Ala Gly Ala Cys Asn Val Ala Leu Gly Leu Asn Leu Ser Ala Lys
115 120 125
Asp Leu Ser Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Cys Arg Ser
130 135 140
Ile Phe Gly Gly Phe Ala Gln Trp Asn Lys Gly His Ser Asp Glu Thr
145 150 155 160
Ser Phe Ala Glu Asn Ile Pro Ala Asn Asn Trp Glu Asn Glu Leu Ala
165 170 175
Met Leu Phe Ile Leu Ile Asn Asp Gly Glu Lys Asp Val Ser Ser Arg
180 185 190
Asp Gly Met Lys Arg Thr Val Glu Thr Ser Ser Phe Tyr Gln Gly Trp
195 200 205
Leu Asp Asn Val Glu Lys Asp Leu Ser Gln Val His Glu Ala Ile Lys
210 215 220
Thr Lys Asp Phe Pro Arg Leu Gly Glu Ile Ile Glu Ala Asn Gly Leu
225 230 235 240
Arg Met His Gly Thr Thr Leu Gly Ala Val Pro Pro Phe Thr Tyr Trp
245 250 255
Ser Pro Gly Ser Leu Gln Ala Met Ala Leu Val Arg Gln Ala Arg Ala
260 265 270
Lys Gly Ile Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val Lys
275 280 285
Val Leu Val Glu Lys Lys Asn Leu Glu Ala Leu Lys Thr Phe Leu Ser
290 295 300
Glu His Phe Ser Lys Glu Gln Leu Val Pro Ala Phe Ala Gly Pro Gly
305 310 315 320
Ile Glu Leu Phe Glu Thr Lys Gly Met Asp Lys
325 330
<210> 88
<211> 325
<212> PRT
<213> Enterococcus faecium
<400> 88
Met Phe Lys Gly Lys Ala Arg Ala Tyr Thr Asn Ile Ala Leu Ile Lys
1 5 10 15
Tyr Trp Gly Lys Lys Asn Glu Glu Leu Ile Leu Pro Met Asn Asn Ser
20 25 30
Leu Ser Leu Thr Leu Asp Ala Phe Tyr Thr Glu Thr Glu Val Ile Phe
35 40 45
Ser Asp Ser Tyr Met Val Asp Glu Phe Tyr Leu Asp Gly Thr Leu Gln
50 55 60
Asp Glu Lys Ala Thr Lys Lys Val Ser Gln Phe Leu Asp Leu Phe Arg
65 70 75 80
Lys Glu Ala Gly Leu Ser Leu Lys Ala Ser Val Ile Ser Gln Asn Phe
85 90 95
Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Gly Leu Ala Ala
100 105 110
Leu Ala Gly Ala Cys Asn Thr Ala Leu Lys Leu Gly Leu Asp Asp Leu
115 120 125
Ser Leu Ser Arg Phe Ala Arg Arg Gly Ser Gly Ser Ala Cys Arg Ser
130 135 140
Ile Phe Gly Gly Phe Val Glu Trp Glu Lys Gly His Asp Asp Leu Ser
145 150 155 160
Ser Tyr Ala Lys Pro Val Pro Ser Asp Ser Phe Glu Asp Asp Leu Ala
165 170 175
Met Val Phe Val Leu Ile Asn Asp Gln Lys Lys Glu Val Ser Ser Arg
180 185 190
Asn Gly Met Arg Arg Thr Val Glu Thr Ser Asn Phe Tyr Gln Gly Trp
195 200 205
Leu Asp Ser Val Glu Gly Asp Leu Tyr Gln Leu Lys Gln Ala Ile Lys
210 215 220
Thr Lys Asp Phe Gln Leu Leu Gly Glu Thr Met Glu Arg Asn Gly Leu
225 230 235 240
Lys Met His Gly Thr Thr Leu Ala Ala Gln Pro Pro Phe Thr Tyr Trp
245 250 255
Ser Pro Asn Ser Leu Lys Ala Met Asp Ala Val Arg Gln Leu Arg Lys
260 265 270
Gln Gly Ile Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val Lys
275 280 285
Val Leu Val Glu Asn Ser His Leu Ser Glu Val Gln Glu Thr Phe Thr
290 295 300
Lys Leu Phe Ser Lys Glu Gln Val Ile Thr Ala His Ala Gly Pro Gly
305 310 315 320
Ile Ala Ile Ile Glu
325
<210> 89
<211> 327
<212> PRT
<213> Staphylococcus haemolyticus
<400> 89
Met Lys Lys Ser Gly Lys Ala Arg Ala His Thr Asn Ile Ala Leu Ile
1 5 10 15
Lys Tyr Trp Gly Lys Ala Asp Glu Ala Leu Ile Ile Pro Met Asn Asn
20 25 30
Ser Leu Ser Val Thr Leu Asp Arg Phe Tyr Thr Glu Thr Arg Val Thr
35 40 45
Phe Asp Glu Thr Leu Thr Glu Asp Gln Leu Ile Leu Asn Gly Glu Ala
50 55 60
Val Asn Ala Lys Glu Ser Ala Lys Ile Gln Arg Tyr Met Glu Met Ile
65 70 75 80
Arg Lys Glu Ala Gly Ile Ser His Glu Ala Leu Ile Glu Ser Glu Asn
85 90 95
Phe Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Ala Tyr Ala
100 105 110
Ala Leu Ala Gly Ala Cys Asn Glu Ala Leu Gln Leu Gly Leu Ser Asp
115 120 125
Lys Asp Leu Ser Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Ser Arg
130 135 140
Ser Ile Tyr Gly Gly Phe Ala Glu Trp Glu Lys Gly Asn Asp Asp Glu
145 150 155 160
Thr Ser Phe Ala His Arg Val Glu Ala Asp Gly Trp Glu Asn Glu Leu
165 170 175
Ala Met Val Phe Val Val Ile Asn Asn Lys Ser Lys Lys Val Ser Ser
180 185 190
Arg Ser Gly Met Ser Leu Thr Arg Asp Thr Ser Arg Phe Tyr Gln Tyr
195 200 205
Trp Leu Asp Asn Val Glu Pro Asp Leu Lys Glu Thr Lys Glu Ala Ile
210 215 220
Ala Gln Lys Asp Phe Lys Arg Met Gly Glu Val Ile Glu Ala Asn Gly
225 230 235 240
Leu Arg Met His Ala Thr Asn Leu Gly Ala Gln Pro Pro Phe Thr Tyr
245 250 255
Leu Val Pro Glu Ser Tyr Asp Ala Met Arg Ile Val His Glu Cys Arg
260 265 270
Glu Ala Gly Leu Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val
275 280 285
Lys Val Leu Ile Glu Lys Lys Asn Gln Gln Ala Ile Val Asp Lys Phe
290 295 300
Leu Gln Glu Phe Asp Gln Ser Gln Ile Ile Thr Ser Asp Ile Thr Gln
305 310 315 320
Ser Gly Val Glu Ile Ile Lys
325
<210> 90
<211> 327
<212> PRT
<213> Staphylococcus epidermidis
<400> 90
Met Val Lys Ser Gly Lys Ala Arg Ala His Thr Asn Ile Ala Leu Ile
1 5 10 15
Lys Tyr Trp Gly Lys Ala Asp Glu Thr Tyr Ile Ile Pro Met Asn Asn
20 25 30
Ser Leu Ser Val Thr Leu Asp Arg Phe Tyr Thr Glu Thr Lys Val Thr
35 40 45
Phe Asp Pro Asp Phe Thr Glu Asp Cys Leu Ile Leu Asn Gly Asn Glu
50 55 60
Val Asn Ala Lys Glu Lys Glu Lys Ile Gln Asn Tyr Met Asn Ile Val
65 70 75 80
Arg Asp Leu Ala Gly Asn Arg Leu His Ala Arg Ile Glu Ser Glu Asn
85 90 95
Tyr Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Ala Tyr Ala
100 105 110
Ala Leu Ala Ala Ala Cys Asn Glu Ala Leu Ser Leu Asn Leu Ser Asp
115 120 125
Thr Asp Leu Ser Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Ser Arg
130 135 140
Ser Ile Phe Gly Gly Phe Ala Glu Trp Glu Lys Gly His Asp Asp Leu
145 150 155 160
Thr Ser Tyr Ala His Gly Ile Asn Ser Asn Gly Trp Glu Lys Asp Leu
165 170 175
Ser Met Ile Phe Val Val Ile Asn Asn Gln Ser Lys Lys Val Ser Ser
180 185 190
Arg Ser Gly Met Ser Leu Thr Arg Asp Thr Ser Arg Phe Tyr Gln Tyr
195 200 205
Trp Leu Asp His Val Asp Glu Asp Leu Asn Glu Ala Lys Glu Ala Val
210 215 220
Lys Asn Gln Asp Phe Gln Arg Leu Gly Glu Val Ile Glu Ala Asn Gly
225 230 235 240
Leu Arg Met His Ala Thr Asn Leu Gly Ala Gln Pro Pro Phe Thr Tyr
245 250 255
Leu Val Gln Glu Ser Tyr Asp Ala Met Ala Ile Val Glu Gln Cys Arg
260 265 270
Lys Ala Asn Leu Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val
275 280 285
Lys Val Leu Val Glu Lys Lys Asn Lys Gln Ala Val Met Glu Gln Phe
290 295 300
Leu Lys Val Phe Asp Glu Ser Lys Ile Ile Ala Ser Asp Ile Ile Ser
305 310 315 320
Ser Gly Val Glu Ile Ile Lys
325
<210> 91
<211> 327
<212> PRT
<213> Staphylococcus aureus
<400> 91
Met Ile Lys Ser Gly Lys Ala Arg Ala His Thr Asn Ile Ala Leu Ile
1 5 10 15
Lys Tyr Trp Gly Lys Lys Asp Glu Ala Leu Ile Ile Pro Met Asn Asn
20 25 30
Ser Ile Ser Val Thr Leu Glu Lys Phe Tyr Thr Glu Thr Lys Val Thr
35 40 45
Phe Asn Asp Gln Leu Thr Gln Asp Gln Phe Trp Leu Asn Gly Glu Lys
50 55 60
Val Ser Gly Lys Glu Leu Glu Lys Ile Ser Lys Tyr Met Asp Ile Val
65 70 75 80
Arg Asn Arg Ala Gly Ile Asp Trp Tyr Ala Glu Ile Glu Ser Asp Asn
85 90 95
Phe Val Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ser Ala Tyr Ala
100 105 110
Ala Leu Ala Ala Ala Cys Asn Gln Ala Leu Asp Leu Gln Leu Ser Asp
115 120 125
Lys Asp Leu Ser Arg Leu Ala Arg Ile Gly Ser Gly Ser Ala Ser Arg
130 135 140
Ser Ile Tyr Gly Gly Phe Ala Glu Trp Glu Lys Gly Tyr Asn Asp Glu
145 150 155 160
Thr Ser Tyr Ala Val Pro Leu Glu Ser Asn His Phe Glu Asp Asp Leu
165 170 175
Ala Met Ile Phe Val Val Ile Asn Gln His Ser Lys Lys Val Pro Ser
180 185 190
Arg Tyr Gly Met Ser Leu Thr Arg Asn Thr Ser Arg Phe Tyr Gln Tyr
195 200 205
Trp Leu Asp His Ile Asp Glu Asp Leu Ala Glu Ala Lys Ala Ala Ile
210 215 220
Gln Asp Lys Asp Phe Lys Arg Leu Gly Glu Val Ile Glu Glu Asn Gly
225 230 235 240
Leu Arg Met His Ala Thr Asn Leu Gly Ser Thr Pro Pro Phe Thr Tyr
245 250 255
Leu Val Gln Glu Ser Tyr Asp Val Met Ala Leu Val His Glu Cys Arg
260 265 270
Glu Ala Gly Tyr Pro Cys Tyr Phe Thr Met Asp Ala Gly Pro Asn Val
275 280 285
Lys Ile Leu Val Glu Lys Lys Asn Lys Gln Gln Ile Ile Asp Lys Leu
290 295 300
Leu Thr Gln Phe Asp Asn Asn Gln Ile Ile Asp Ser Asp Ile Ile Ala
305 310 315 320
Thr Gly Ile Glu Ile Ile Glu
325
<210> 92
<211> 350
<212> PRT
<213> Streptomyces sp.
<400> 92
Met Arg Ser Glu His Pro Thr Thr Thr Val Leu Gln Ser Arg Glu Gln
1 5 10 15
Gly Ser Ala Ala Gly Ala Thr Ala Val Ala His Pro Asn Ile Ala Leu
20 25 30
Ile Lys Tyr Trp Gly Lys Arg Asp Glu Arg Leu Ile Leu Pro Cys Thr
35 40 45
Thr Ser Leu Ser Met Thr Leu Asp Val Phe Pro Thr Thr Thr Glu Val
50 55 60
Arg Leu Asp Pro Ala Ala Glu His Asp Thr Ala Ala Leu Asn Gly Glu
65 70 75 80
Val Ala Thr Gly Glu Thr Leu Arg Arg Ile Ser Ala Phe Leu Ser Leu
85 90 95
Val Arg Glu Val Ala Gly Ser Asp Gln Arg Ala Val Val Asp Thr Arg
100 105 110
Asn Thr Val Pro Thr Gly Ala Gly Leu Ala Ser Ser Ala Ser Gly Phe
115 120 125
Ala Ala Leu Ala Val Ala Ala Ala Ala Ala Tyr Gly Leu Glu Leu Asp
130 135 140
Asp Arg Gly Leu Ser Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Ser
145 150 155 160
Arg Ser Ile Phe Gly Gly Phe Ala Val Trp His Ala Gly Pro Asp Gly
165 170 175
Thr Ala Thr Glu Ala Asp Leu Gly Ser Tyr Ala Glu Pro Val Pro Ala
180 185 190
Ala Asp Leu Asp Pro Ala Leu Val Ile Ala Val Val Asn Ala Gly Pro
195 200 205
Lys Pro Val Ser Ser Arg Glu Ala Met Arg Arg Thr Val Asp Thr Ser
210 215 220
Pro Leu Tyr Arg Pro Trp Ala Asp Ser Ser Lys Asp Asp Leu Asp Glu
225 230 235 240
Met Arg Ser Ala Leu Leu Arg Gly Asp Leu Glu Ala Val Gly Glu Ile
245 250 255
Ala Glu Arg Asn Ala Leu Gly Met His Ala Thr Met Leu Ala Ala Arg
260 265 270
Pro Ala Val Arg Tyr Leu Ser Pro Ala Thr Val Thr Val Leu Asp Ser
275 280 285
Val Leu Gln Leu Arg Lys Asp Gly Val Leu Ala Tyr Ala Thr Met Asp
290 295 300
Ala Gly Pro Asn Val Lys Val Leu Cys Arg Arg Ala Asp Ala Glu Arg
305 310 315 320
Val Ala Asp Val Val Arg Ala Ala Ala Ser Gly Gly Gln Val Leu Val
325 330 335
Ala Gly Pro Gly Asp Gly Ala Arg Leu Leu Ser Glu Gly Ala
340 345 350
<210> 93
<211> 331
<212> PRT
<213> Streptomyces griseosporeus
<400> 93
Ala Thr Ala Val Ala Gln Pro Asn Ile Ala Leu Ile Lys Tyr Trp Gly
1 5 10 15
Lys Lys Asp Glu His Leu Val Leu Pro Arg Thr Asp Ser Leu Ser Met
20 25 30
Thr Leu Asp Ile Phe Pro Thr Thr Thr Arg Val Gln Leu Ala Pro Gly
35 40 45
Ala Gly Gln Asp Thr Val Ala Phe Asn Gly Glu Pro Ala Thr Gly Glu
50 55 60
Ala Glu Arg Arg Ile Thr Ala Phe Leu Arg Leu Val Arg Glu Arg Ser
65 70 75 80
Gly Arg Thr Glu Arg Ala Arg Val Glu Thr Glu Asn Thr Val Pro Thr
85 90 95
Gly Ala Gly Leu Ala Ser Ser Ala Ser Gly Phe Ala Ala Leu Ala Val
100 105 110
Ala Ala Ala Ala Ala Tyr Gly Leu Gly Leu Asp Ala Arg Gly Leu Ser
115 120 125
Arg Leu Ala Arg Arg Gly Ser Gly Ser Ala Ser Arg Ser Ile Phe Asp
130 135 140
Gly Phe Ala Val Trp His Ala Gly His Ala Gly Gly Thr Pro Glu Glu
145 150 155 160
Ala Asp Leu Gly Ser Tyr Ala Glu Pro Val Pro Ala Val Asp Leu Glu
165 170 175
Pro Ala Leu Val Val Ala Val Val Ser Ala Ala Pro Lys Ala Val Ser
180 185 190
Ser Arg Glu Ala Met Arg Arg Thr Val Asp Thr Ser Pro Leu Tyr Glu
195 200 205
Pro Trp Ala Val Ser Ser Arg Ala Asp Leu Ala Asp Ile Gly Ala Ala
210 215 220
Leu Ala Arg Gly Asn Leu Pro Ala Val Gly Glu Ile Ala Glu Arg Asn
225 230 235 240
Ala Leu Gly Met His Ala Thr Met Leu Ala Ala Arg Pro Ala Val Arg
245 250 255
Tyr Leu Ser Pro Ala Ser Leu Ala Val Leu Asp Gly Val Leu Gln Leu
260 265 270
Arg Arg Asp Gly Val Pro Ala Tyr Ala Thr Met Asp Ala Gly Pro Asn
275 280 285
Val Lys Val Leu Cys Pro Arg Ser Asp Ala Glu Arg Val Ala Glu Ala
290 295 300
Leu Arg Ala Ala Ala Pro Val Gly Ala Val His Ile Ala Gly Pro Gly
305 310 315 320
Arg Gly Ala Arg Leu Val Ala Glu Glu Cys Arg
325 330
<210> 94
<211> 312
<212> PRT
<213> Borrelia burgdorferi
<400> 94
Met Lys Ile Lys Cys Lys Val His Ala Ser Leu Ala Leu Ile Lys Tyr
1 5 10 15
Trp Gly Lys Lys Asp Val Phe Leu Asn Ile Pro Ala Thr Ser Ser Leu
20 25 30
Ala Val Ser Val Asp Lys Phe Tyr Ser Ile Ser Glu Leu Glu Leu Ser
35 40 45
Asn Arg Asp Glu Ile Ile Leu Asn Ser Lys Pro Val Ile Leu Lys Asn
50 55 60
Arg Glu Lys Val Phe Phe Asp Tyr Ala Arg Lys Ile Leu Asn Glu Pro
65 70 75 80
Asn Val Arg Phe Lys Ile Lys Ser Lys Asn Asn Phe Pro Thr Ala Ala
85 90 95
Gly Leu Ala Ser Ser Ser Ser Gly Phe Ala Ser Ile Ala Ala Cys Ile
100 105 110
Leu Lys Tyr Phe Asn Lys Tyr Ser Cys Asn Ser Ala Ser Asn Leu Ala
115 120 125
Arg Val Gly Ser Ala Ser Ala Ala Arg Ala Ile Tyr Gly Gly Phe Thr
130 135 140
Ile Leu Lys Glu Gly Ser Lys Glu Ser Phe Gln Leu Arg Asp Gln Ser
145 150 155 160
Tyr Phe Asn Asp Leu Arg Ile Ile Phe Ala Ile Ile Asp Ser Asn Glu
165 170 175
Lys Glu Leu Ser Ser Arg Ala Ala Met Asn Ile Cys Lys Arg His Lys
180 185 190
Phe Tyr Tyr Asp Ala Trp Ile Ala Ser Ser Lys Lys Ile Phe Lys Asp
195 200 205
Ala Leu Tyr Phe Phe Leu Lys Lys Asp Phe Ile His Phe Gly Ala Thr
210 215 220
Ile Val Lys Ser Tyr Gln Asn Met Phe Ala Leu Met Phe Ala Ser Ser
225 230 235 240
Ile Phe Tyr Phe Lys Asn Ser Thr Ile Asp Leu Ile Arg Tyr Ala Ala
245 250 255
Asp Leu Arg Asn Glu Gly Ile Phe Val Phe Glu Thr Met Asp Ala Gly
260 265 270
Pro Gln Val Lys Phe Leu Cys Leu Glu Glu Asn Leu Asn Thr Ile Leu
275 280 285
Lys Gly Leu Lys Gln Asn Phe Thr Gly Ile Asp Phe Ile Val Ser Lys
290 295 300
Val Gly Cys Asp Leu Glu Trp Ile
305 310
<210> 95
<211> 292
<212> PRT
<213> Streptococcus pneumoniae
<400> 95
Met Thr Lys Lys Val Gly Val Gly Gln Ala His Ser Lys Ile Ile Leu
1 5 10 15
Ile Gly Glu His Ala Val Val Tyr Gly Tyr Pro Ala Ile Ser Leu Pro
20 25 30
Leu Leu Glu Val Glu Val Thr Cys Lys Val Val Ser Ala Glu Ser Pro
35 40 45
Trp Arg Leu Tyr Glu Glu Asp Thr Leu Ser Met Ala Val Tyr Ala Ser
50 55 60
Leu Glu Tyr Leu Asp Ile Thr Glu Ala Cys Val Arg Cys Glu Ile Asp
65 70 75 80
Ser Ala Ile Pro Glu Lys Arg Gly Met Gly Ser Ser Ala Ala Ile Ser
85 90 95
Ile Ala Ala Ile Arg Ala Val Phe Asp Tyr Tyr Gln Ala Asp Leu Pro
100 105 110
His Asp Val Leu Glu Ile Leu Val Asn Arg Ala Glu Met Ile Ala His
115 120 125
Met Asn Pro Ser Gly Leu Asp Ala Lys Thr Cys Leu Ser Asp Gln Pro
130 135 140
Ile Arg Phe Ile Lys Asn Val Gly Phe Thr Glu Leu Glu Met Asp Leu
145 150 155 160
Ser Ala Tyr Leu Val Ile Ala Asp Thr Gly Val Tyr Gly His Thr Arg
165 170 175
Glu Ala Ile Gln Val Val Gln Asn Lys Gly Lys Asp Ala Leu Pro Phe
180 185 190
Leu His Ala Leu Gly Glu Leu Thr Gln Gln Ala Glu Val Ala Ile Ser
195 200 205
Gln Lys Tyr Ala Glu Gly Leu Gly Leu Ile Phe Ser Gln Ala His Leu
210 215 220
His Leu Lys Glu Ile Gly Val Ser Ser Pro Glu Ala Asp Phe Leu Val
225 230 235 240
Glu Thr Ala Leu Ser Tyr Gly Ala Leu Gly Ala Lys Met Ser Gly Gly
245 250 255
Gly Leu Gly Gly Cys Ile Ile Ala Leu Val Thr Asn Leu Thr His Ala
260 265 270
Gln Glu Leu Ala Glu Arg Leu Glu Glu Lys Gly Ala Val Gln Thr Trp
275 280 285
Ile Glu Ser Leu
290
<210> 96
<211> 292
<212> PRT
<213> Streptococcus pyogenes
<400> 96
Met Asn Glu Asn Ile Gly Tyr Gly Lys Ala His Ser Lys Ile Ile Leu
1 5 10 15
Ile Gly Glu His Ala Val Val Tyr Gly Tyr Pro Ala Ile Ala Leu Pro
20 25 30
Leu Thr Asp Ile Glu Val Val Cys His Ile Phe Pro Ala Asp Lys Pro
35 40 45
Leu Val Phe Asp Phe Tyr Asp Thr Leu Ser Thr Ala Ile Tyr Ala Ala
50 55 60
Leu Asp Tyr Leu Gln Arg Leu Gln Glu Pro Ile Ala Tyr Glu Ile Val
65 70 75 80
Ser Gln Val Pro Gln Lys Arg Gly Met Gly Ser Ser Ala Ala Val Ser
85 90 95
Ile Ala Ala Ile Arg Ala Val Phe Ser Tyr Cys Gln Glu Pro Leu Ser
100 105 110
Asp Asp Leu Leu Glu Ile Leu Val Asn Lys Ala Glu Ile Ile Ala His
115 120 125
Thr Asn Pro Ser Gly Leu Asp Ala Lys Thr Cys Leu Ser Asp His Ala
130 135 140
Ile Lys Phe Ile Arg Asn Ile Gly Phe Glu Thr Ile Glu Ile Ala Leu
145 150 155 160
Asn Gly Tyr Leu Ile Ile Ala Asp Thr Gly Ile His Gly His Thr Arg
165 170 175
Glu Ala Val Asn Lys Val Ala Gln Phe Glu Glu Thr Asn Leu Pro Tyr
180 185 190
Leu Ala Lys Leu Gly Ala Leu Thr Gln Ala Leu Glu Arg Ala Ile Asn
195 200 205
Gln Lys Asn Lys Val Ala Ile Gly Gln Leu Met Thr Gln Ala His Ser
210 215 220
Ala Leu Lys Ala Ile Gly Val Ser Ile Ser Lys Ala Asp Gln Leu Val
225 230 235 240
Glu Ala Ala Leu Arg Ala Gly Ala Leu Gly Ala Lys Met Thr Gly Gly
245 250 255
Gly Leu Gly Gly Cys Met Ile Ala Leu Ala Asp Thr Lys Asp Met Ala
260 265 270
Glu Lys Ile Ser His Lys Leu Lys Glu Glu Gly Ala Val Asn Thr Trp
275 280 285
Ile Gln Met Leu
290
<210> 97
<211> 314
<212> PRT
<213> Enterococcus faecalis
<400> 97
Met Asn Ile Lys Lys Gln Gly Leu Gly Gln Ala Thr Gly Lys Ile Ile
1 5 10 15
Leu Met Gly Glu His Ala Val Val Tyr Gly Glu Pro Ala Ile Ala Phe
20 25 30
Pro Phe Gln Ala Thr Glu Ile Thr Ala Val Phe Thr Pro Ala Lys Thr
35 40 45
Met Gln Ile Asp Cys Ala Tyr Phe Thr Gly Leu Leu Glu Asp Val Pro
50 55 60
Gln Glu Leu Ala Asn Ile Lys Glu Val Val Gln Gln Thr Leu His Phe
65 70 75 80
Leu Lys Glu Asp Thr Phe Lys Gly Thr Leu Thr Leu Thr Ser Thr Ile
85 90 95
Pro Ala Glu Arg Gly Met Gly Ser Ser Ala Ala Thr Ala Val Ala Ile
100 105 110
Val Arg Ser Leu Phe Asp Tyr Phe Asp Tyr Ala Tyr Thr Tyr Gln Glu
115 120 125
Leu Phe Glu Leu Val Ser Leu Ser Glu Lys Ile Ala His Gly Asn Pro
130 135 140
Ser Gly Ile Asp Ala Ala Ala Thr Ser Gly Ala Asp Pro Leu Phe Phe
145 150 155 160
Thr Arg Gly Phe Pro Pro Thr His Phe Ser Met Asn Leu Ser Asn Ala
165 170 175
Tyr Leu Val Val Ala Asp Thr Gly Ile Lys Gly Gln Thr Arg Glu Ala
180 185 190
Val Lys Asp Ile Ala Gln Leu Ala Gln Asn Asn Pro Thr Ala Ile Ala
195 200 205
Glu Thr Met Lys Gln Leu Gly Ser Phe Thr Lys Glu Ala Lys Gln Ala
210 215 220
Ile Leu Gln Asp Asp Lys Gln Lys Leu Gly Gln Leu Met Thr Leu Ala
225 230 235 240
Gln Glu Gln Leu Gln Gln Leu Thr Val Ser Asn Asp Met Leu Asp Arg
245 250 255
Leu Val Ala Leu Ser Leu Glu His Gly Ala Leu Gly Ala Lys Leu Thr
260 265 270
Gly Gly Gly Arg Gly Gly Cys Met Ile Ala Leu Thr Asp Asn Lys Lys
275 280 285
Thr Ala Gln Thr Ile Ala Gln Thr Leu Glu Glu Asn Gly Ala Val Ala
290 295 300
Thr Trp Ile Gln Ser Leu Glu Val Lys Lys
305 310
<210> 98
<211> 314
<212> PRT
<213> Enterococcus faecium
<400> 98
Met Ala Asn Tyr Gly Gln Gly Glu Ser Ser Gly Lys Ile Ile Leu Met
1 5 10 15
Gly Glu His Ala Val Val Tyr Gly Glu Pro Ala Ile Ala Phe Pro Phe
20 25 30
Tyr Ala Thr Lys Val Thr Ala Phe Leu Glu Glu Leu Asp Ala Met Asp
35 40 45
Asp Gln Leu Val Ser Ser Tyr Tyr Ser Gly Asn Leu Ala Glu Ala Pro
50 55 60
His Ala Leu Lys Asn Ile Lys Lys Leu Phe Ile His Leu Lys Lys Gln
65 70 75 80
His Asp Ile Gln Lys Asn Leu Gln Leu Thr Ile Glu Ser Thr Ile Pro
85 90 95
Ala Glu Arg Gly Met Gly Ser Ser Ala Ala Val Ala Thr Ala Val Thr
100 105 110
Arg Ala Phe Tyr Asp Tyr Leu Ala Phe Pro Leu Ser Arg Glu Ile Leu
115 120 125
Leu Glu Asn Val Gln Leu Ser Glu Lys Ile Ala His Gly Asn Pro Ser
130 135 140
Gly Ile Asp Ala Ala Ala Thr Ser Ser Leu Gln Pro Ile Tyr Phe Thr
145 150 155 160
Lys Gly His Pro Phe Asp Tyr Phe Ser Leu Asn Ile Asp Ala Phe Leu
165 170 175
Ile Val Ala Asp Thr Gly Ile Lys Gly Gln Thr Arg Glu Ala Val Lys
180 185 190
Asp Val Ala His Leu Phe Glu Thr Gln Pro His Glu Thr Gly Gln Met
195 200 205
Ile Gln Lys Leu Gly Tyr Leu Thr Lys Gln Ala Lys Gln Ala Ile Ile
210 215 220
Glu Asn Ser Pro Glu Thr Leu Ala Gln Thr Met Asp Glu Ser Gln Ser
225 230 235 240
Leu Leu Glu Lys Leu Thr Ile Ser Asn Asp Phe Leu Asn Leu Leu Ile
245 250 255
Gln Thr Ala Lys Asp Thr Gly Ala Leu Gly Ala Lys Leu Thr Gly Gly
260 265 270
Gly Arg Gly Gly Cys Met Ile Ala Leu Ala Gln Thr Lys Thr Lys Ala
275 280 285
Gln Glu Ile Ser Gln Ala Leu Glu Asp Ala Gly Ala Ala Glu Thr Trp
290 295 300
Ile Gln Gly Leu Gly Val His Thr Tyr Val
305 310
<210> 99
<211> 307
<212> PRT
<213> Staphylococcus haemolyticus
<400> 99
Met Val Gln Arg Gly Tyr Gly Glu Ser Asn Gly Lys Ile Ile Leu Ile
1 5 10 15
Gly Glu His Ala Val Thr Phe Gly Glu Pro Ala Ile Ala Ile Pro Phe
20 25 30
Thr Ser Gly Lys Val Lys Val Leu Ile Glu Ser Leu Glu Lys Gly Asn
35 40 45
Tyr Ser Ala Ile Gln Ser Asp Val Tyr Asp Gly Pro Leu Tyr Asp Ala
50 55 60
Pro Glu His Leu Lys Ser Leu Ile Gly His Phe Val Glu Asn Lys Lys
65 70 75 80
Val Glu Glu Pro Leu Leu Ile Lys Ile Gln Ala Asn Leu Pro Pro Ser
85 90 95
Arg Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Phe Ile Arg Ala
100 105 110
Ser Tyr Asp Tyr Leu Gly Leu Pro Leu Thr Asp Lys Glu Leu Leu Glu
115 120 125
Asn Ala Asp Trp Ala Glu Arg Ile Ala His Gly Lys Pro Ser Gly Ile
130 135 140
Asp Thr Lys Thr Ile Val Thr Asn Gln Pro Val Trp Tyr Gln Lys Gly
145 150 155 160
Glu Val Glu Ile Leu Lys Thr Leu Asp Leu Asp Gly Tyr Met Val Val
165 170 175
Ile Asp Thr Gly Val Lys Gly Ser Thr Lys Gln Ala Val Glu Asp Val
180 185 190
His Gln Leu Cys Asp Asn Asp Lys Asn Tyr Met Gln Val Val Lys His
195 200 205
Ile Gly Ser Leu Val Tyr Ser Ala Ser Glu Ala Ile Glu His His Ser
210 215 220
Phe Asp Gln Leu Ala Thr Ile Phe Asn Gln Cys Gln Asp Asp Leu Arg
225 230 235 240
Thr Leu Thr Val Ser His Asp Lys Ile Glu Met Phe Leu Arg Leu Gly
245 250 255
Glu Glu Asn Gly Ser Val Ala Gly Lys Leu Thr Gly Gly Gly Arg Gly
260 265 270
Gly Ser Met Leu Ile Leu Ala Lys Glu Leu Gln Thr Ala Lys Asn Ile
275 280 285
Val Ala Ala Val Glu Lys Ala Gly Ala Gln His Thr Trp Ile Glu Lys
290 295 300
Leu Gly Gly
305
<210> 100
<211> 306
<212> PRT
<213> Staphylococcus epidermidis
<400> 100
Met Thr Arg Gln Gly Tyr Gly Glu Ser Thr Gly Lys Ile Ile Leu Met
1 5 10 15
Gly Glu His Ala Val Thr Phe Gly Gln Pro Ala Ile Ala Ile Pro Phe
20 25 30
Asn Ala Gly Lys Ile Lys Val Leu Ile Glu Ser Leu Asp Glu Gly Asn
35 40 45
Tyr Ser Ser Ile Thr Ser Asp Val Tyr Asp Gly Met Leu Tyr Asp Ala
50 55 60
Pro Glu His Leu Lys Ser Ile Ile Asn Arg Phe Val Glu Lys Ser Gly
65 70 75 80
Val Lys Glu Pro Leu Ser Val Lys Ile Gln Thr Asn Leu Pro Pro Ser
85 90 95
Arg Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Phe Val Arg Ala
100 105 110
Ser Tyr Asp Phe Met Asp Gln Pro Leu Asp Asp Lys Thr Leu Ile Lys
115 120 125
Glu Ala Asn Trp Ala Glu Gln Ile Ala His Gly Lys Pro Ser Gly Ile
130 135 140
Asp Thr Gln Thr Ile Val Ser Asn Lys Pro Val Trp Phe Lys Gln Gly
145 150 155 160
Gln Ala Glu Thr Leu Lys Ser Leu Lys Leu Asn Gly Tyr Met Val Val
165 170 175
Ile Asp Thr Gly Val Lys Gly Ser Thr Lys Gln Ala Val Glu Asp Val
180 185 190
His Val Leu Cys Glu Ser Asp Glu Tyr Met Lys Tyr Ile Glu His Ile
195 200 205
Gly Thr Leu Val His Ser Ala Ser Glu Ser Ile Glu Gln His Asp Phe
210 215 220
His His Leu Ala Asp Ile Phe Asn Ala Cys Gln Glu Asp Leu Arg His
225 230 235 240
Leu Thr Val Ser His Asp Lys Ile Glu Lys Leu Leu Gln Ile Gly Lys
245 250 255
Glu His Gly Ala Ile Ala Gly Lys Leu Thr Gly Gly Gly Arg Gly Gly
260 265 270
Ser Met Leu Leu Leu Ala Glu Asn Leu Lys Thr Ala Lys Thr Ile Val
275 280 285
Ala Ala Val Glu Lys Ala Gly Ala Ala His Thr Trp Ile Glu His Leu
290 295 300
Gly Gly
305
<210> 101
<211> 306
<212> PRT
<213> Staphylococcus aureus
<400> 101
Met Thr Arg Lys Gly Tyr Gly Glu Ser Thr Gly Lys Ile Ile Leu Ile
1 5 10 15
Gly Glu His Ala Val Thr Phe Gly Glu Pro Ala Ile Ala Val Pro Phe
20 25 30
Asn Ala Gly Lys Ile Lys Val Leu Ile Glu Ala Leu Glu Ser Gly Asn
35 40 45
Tyr Ser Ser Ile Lys Ser Asp Val Tyr Asp Gly Met Leu Tyr Asp Ala
50 55 60
Pro Asp His Leu Lys Ser Leu Val Asn Arg Phe Val Glu Leu Asn Asn
65 70 75 80
Ile Thr Glu Pro Leu Ala Val Thr Ile Gln Thr Asn Leu Pro Pro Ser
85 90 95
Arg Gly Leu Gly Ser Ser Ala Ala Val Ala Val Ala Phe Val Arg Ala
100 105 110
Ser Tyr Asp Phe Leu Gly Lys Ser Leu Thr Lys Glu Glu Leu Ile Glu
115 120 125
Lys Ala Asn Trp Ala Glu Gln Ile Ala His Gly Lys Pro Ser Gly Ile
130 135 140
Asp Thr Gln Thr Ile Val Ser Gly Lys Pro Val Trp Phe Gln Lys Gly
145 150 155 160
Gln Ala Glu Thr Leu Lys Thr Leu Ser Leu Asp Gly Tyr Met Val Val
165 170 175
Ile Asp Thr Gly Val Lys Gly Ser Thr Arg Gln Ala Val Glu Asp Val
180 185 190
His Lys Leu Cys Glu Asp Pro Gln Tyr Met Ser His Val Lys His Ile
195 200 205
Gly Lys Leu Val Leu Arg Ala Ser Asp Val Ile Glu His His Asn Phe
210 215 220
Glu Ala Leu Ala Asp Ile Phe Asn Glu Cys His Ala Asp Leu Lys Ala
225 230 235 240
Leu Thr Val Ser His Asp Lys Ile Glu Gln Leu Met Lys Ile Gly Lys
245 250 255
Glu Asn Gly Ala Ile Ala Gly Lys Leu Thr Gly Ala Gly Arg Gly Gly
260 265 270
Ser Met Leu Leu Leu Ala Lys Asp Leu Pro Thr Ala Lys Asn Ile Val
275 280 285
Lys Ala Val Glu Lys Ala Gly Ala Ala His Thr Trp Ile Glu Asn Leu
290 295 300
Gly Gly
305
<210> 102
<211> 345
<212> PRT
<213> Streptomyces sp.
<400> 102
Met Gln Lys Arg Gln Arg Glu Leu Ser Ala Leu Thr Leu Pro Thr Ser
1 5 10 15
Ala Glu Gly Val Ser Glu Ser His Arg Ala Arg Ser Val Gly Ile Gly
20 25 30
Arg Ala His Ala Lys Ala Ile Leu Leu Gly Glu His Ala Val Val Tyr
35 40 45
Gly Ala Pro Ala Leu Ala Leu Pro Ile Pro Gln Leu Thr Val Thr Ala
50 55 60
Ser Val Gly Trp Ser Ser Glu Ala Ser Asp Ser Ala Gly Gly Leu Ser
65 70 75 80
Tyr Thr Met Thr Gly Thr Pro Ser Arg Ala Leu Val Thr Gln Ala Ser
85 90 95
Asp Gly Leu His Arg Leu Thr Ala Glu Phe Met Ala Arg Met Gly Val
100 105 110
Thr Asn Ala Pro His Leu Asp Val Ile Leu Asp Gly Ala Ile Pro His
115 120 125
Gly Arg Gly Leu Gly Ser Ser Ala Ala Gly Ser Arg Ala Ile Ala Leu
130 135 140
Ala Leu Ala Asp Leu Phe Gly His Glu Leu Ala Glu His Thr Ala Tyr
145 150 155 160
Glu Leu Val Gln Thr Ala Glu Asn Met Ala His Gly Arg Ala Ser Gly
165 170 175
Val Asp Ala Met Thr Val Gly Ala Ser Arg Pro Leu Leu Phe Gln Gln
180 185 190
Gly Arg Thr Glu Arg Leu Ala Ile Gly Cys Asp Ser Leu Phe Ile Val
195 200 205
Ala Asp Ser Gly Val Pro Gly Ser Thr Lys Glu Ala Val Glu Met Leu
210 215 220
Arg Glu Gly Phe Thr Arg Ser Ala Gly Thr Gln Glu Arg Phe Val Gly
225 230 235 240
Arg Ala Thr Glu Leu Thr Glu Ala Ala Arg Gln Ala Leu Ala Asp Gly
245 250 255
Arg Pro Glu Glu Leu Gly Ser Gln Leu Thr Tyr Tyr His Glu Leu Leu
260 265 270
His Glu Ala Arg Leu Ser Thr Asp Gly Ile Asp Ala Leu Val Glu Ala
275 280 285
Ala Leu Lys Ala Gly Ser Leu Gly Ala Lys Ile Thr Gly Gly Gly Leu
290 295 300
Gly Gly Cys Met Ile Ala Gln Ala Arg Pro Glu Gln Ala Arg Glu Val
305 310 315 320
Thr Arg Gln Leu His Glu Ala Gly Ala Val Gln Thr Trp Val Val Pro
325 330 335
Leu Lys Gly Leu Asp Asn His Ala Gln
340 345
<210> 103
<211> 334
<212> PRT
<213> Streptomyces griseosporeus
<400> 103
Met Thr Leu Pro Thr Ser Val Glu Glu Gly Ser Lys Ala His Arg Ala
1 5 10 15
Arg Ala Val Gly Thr Gly Arg Ala His Ala Lys Ala Ile Leu Leu Gly
20 25 30
Glu His Ala Val Val Tyr Gly Thr Pro Ala Leu Ala Met Pro Ile Pro
35 40 45
Gln Leu Ala Val Thr Ala Ser Ala Gly Trp Ser Gly Arg Ser Ala Glu
50 55 60
Ser Arg Gly Gly Pro Thr Phe Thr Met Thr Gly Ser Ala Ser Arg Ala
65 70 75 80
Val Thr Ala Gln Ala Leu Asp Gly Leu Arg Arg Leu Thr Ala Ser Val
85 90 95
Lys Ala His Thr Gly Val Thr Asp Gly Gln His Leu Asp Val Ser Leu
100 105 110
Asp Gly Ala Ile Pro Pro Gly Arg Gly Leu Gly Ser Ser Ala Ala Asn
115 120 125
Ala Arg Ala Ile Ile Leu Ala Leu Ala Asp Leu Phe Gly Arg Glu Leu
130 135 140
Thr Glu Gly Glu Val Phe Asp Leu Val Gln Glu Ala Glu Asn Leu Thr
145 150 155 160
His Gly Arg Ala Ser Gly Val Asp Ala Val Thr Val Gly Ala Thr Ala
165 170 175
Pro Leu Leu Phe Arg Ala Gly Thr Ala Gln Ala Leu Asp Ile Gly Cys
180 185 190
Asp Ala Leu Phe Val Val Ala Asp Ser Gly Thr Ala Gly Ser Thr Lys
195 200 205
Glu Ala Ile Glu Leu Leu Arg Ala Gly Phe Arg Ala Gly Ala Gly Lys
210 215 220
Glu Glu Arg Phe Met His Arg Ala Ala His Leu Val Asp Asp Ala Arg
225 230 235 240
Ala Ser Leu Ala Glu Gly Glu Pro Glu Ala Phe Gly Ser Cys Leu Thr
245 250 255
Glu Tyr His Gly Leu Leu Arg Gly Ala Gly Leu Ser Thr Asp Arg Ile
260 265 270
Asp Ala Leu Val Asp Ala Ala Leu Gln Ala Asp Ser Leu Gly Ala Lys
275 280 285
Ile Thr Gly Gly Gly Leu Gly Gly Cys Val Leu Ala Met Ser Arg Pro
290 295 300
Glu Arg Ala Glu Glu Val Ala Arg Gln Leu His Ala Ala Gly Ala Val
305 310 315 320
Arg Thr Trp Ala Val Gln Leu Arg Arg Ser Thr His Glu Arg
325 330
<210> 104
<211> 296
<212> PRT
<213> Borrelia burgdorferi
<400> 104
Met Leu Arg Ile Arg Lys Pro Ala Lys Ile Leu Phe Leu Gly Glu His
1 5 10 15
Ser Ala Val Tyr Gly Phe Pro Val Ile Gly Ala Thr Val Pro Ile Tyr
20 25 30
Met Asp Leu Ile Tyr Ser Val Ser Lys Asn Trp Lys Tyr Leu Gly Lys
35 40 45
Pro Ser Thr Arg Leu Asn Ser Leu Ile Ser Phe Ile Val Ser Asn Tyr
50 55 60
Ser Lys Val Asn Pro Ile Glu Phe Asp Ile Ile Ser Glu Ile Pro Ile
65 70 75 80
Gly Val Gly Leu Gly Ser Ser Ala Ser Leu Ser Leu Cys Phe Ala Glu
85 90 95
Tyr Ile Thr Ser His Phe Glu Tyr Lys Asp Cys Asn Lys Ile Leu Leu
100 105 110
Ala Asn Gln Ile Glu Asn Ile Phe His Gly Lys Ser Ser Gly Met Asp
115 120 125
Ile Arg Leu Ile Asp Leu Asn Gly Thr Phe Tyr Leu Glu Lys Lys Glu
130 135 140
Asn Val Leu His Ser Lys Lys Ile Lys Asp Ser Gly Phe Tyr Phe Leu
145 150 155 160
Ile Gly Ala Ile Lys Arg Asp Leu Thr Thr Lys Glu Ile Val Val Asn
165 170 175
Leu Lys Lys Asp Leu Leu Ser Asn Ala Tyr Leu Phe Val Phe Ile Glu
180 185 190
Lys Leu Gly Leu Ala Val Ser Asn Ser Tyr Ala Ser Phe Gln Asn Lys
195 200 205
Asp Val Tyr Ser Leu Ala Asn Glu Met Asn Ile Ala Gln Cys Cys Leu
210 215 220
Lys Arg Leu Gly Leu Ser Asn Asp Thr Leu Asp Trp Leu Ile Ser Glu
225 230 235 240
Gly Ile Lys Leu Gly Ala Leu Ser Gly Lys Leu Ser Gly Ala Gly Lys
245 250 255
Gly Gly Ala Phe Ile Phe Leu Phe Glu Ser Leu Ile Lys Ala Asn Ile
260 265 270
Val Gln Lys Glu Leu Asn Asn Met Leu Asp Ser Lys Ile Asp Leu Leu
275 280 285
Leu Lys Leu Lys Val Ile Glu Thr
290 295
<210> 105
<211> 336
<212> PRT
<213> Streptococcus pneumoniae
<400> 105
Met Ile Ala Val Lys Thr Cys Gly Lys Leu Tyr Trp Ala Gly Glu Tyr
1 5 10 15
Ala Ile Leu Glu Pro Gly Gln Leu Ala Leu Ile Lys Asp Ile Pro Ile
20 25 30
Tyr Met Arg Ala Glu Ile Ala Phe Ser Asp Ser Tyr Arg Ile Tyr Ser
35 40 45
Asp Met Phe Asp Phe Ala Val Asp Leu Arg Pro Asn Pro Asp Tyr Ser
50 55 60
Leu Ile Gln Glu Thr Ile Ala Leu Met Gly Asp Phe Leu Ala Val Arg
65 70 75 80
Gly Gln Asn Leu Arg Pro Phe Ser Leu Lys Ile Cys Gly Lys Met Glu
85 90 95
Arg Glu Gly Lys Lys Phe Gly Leu Gly Ser Ser Gly Ser Val Val Val
100 105 110
Leu Val Val Lys Ala Leu Leu Ala Leu Tyr Asn Leu Ser Val Asp Gln
115 120 125
Asn Leu Leu Phe Lys Leu Thr Ser Ala Val Leu Leu Lys Arg Gly Asp
130 135 140
Asn Gly Ser Met Gly Asp Leu Ala Cys Ile Val Ala Glu Asp Leu Val
145 150 155 160
Leu Tyr Gln Ser Phe Asp Arg Gln Lys Ala Ala Ala Trp Leu Glu Glu
165 170 175
Glu Asn Leu Ala Thr Val Leu Glu Arg Asp Trp Gly Phe Phe Ile Ser
180 185 190
Gln Val Lys Pro Thr Leu Glu Cys Asp Phe Leu Val Gly Trp Thr Lys
195 200 205
Glu Val Ala Val Ser Ser His Met Val Gln Gln Ile Lys Gln Asn Ile
210 215 220
Asn Gln Asn Phe Leu Ser Ser Ser Lys Glu Thr Val Val Ser Leu Val
225 230 235 240
Glu Ala Leu Glu Gln Gly Lys Ala Glu Lys Val Ile Glu Gln Val Glu
245 250 255
Val Ala Ser Lys Leu Leu Glu Gly Leu Ser Thr Asp Ile Tyr Thr Pro
260 265 270
Leu Leu Arg Gln Leu Lys Glu Ala Ser Gln Asp Leu Gln Ala Val Ala
275 280 285
Lys Ser Ser Gly Ala Gly Gly Gly Asp Cys Gly Ile Ala Leu Ser Phe
290 295 300
Asp Ala Gln Ser Ser Arg Asn Thr Leu Lys Asn Arg Trp Ala Asp Leu
305 310 315 320
Gly Ile Glu Leu Leu Tyr Gln Glu Arg Ile Gly His Asp Asp Lys Ser
325 330 335
<210> 106
<211> 335
<212> PRT
<213> Streptococcus pyogenes
<400> 106
Met Ser Asn Tyr Cys Val Gln Thr Gly Gly Lys Leu Tyr Leu Thr Gly
1 5 10 15
Glu Tyr Ala Ile Leu Ile Pro Gly Gln Lys Ala Leu Ile His Phe Ile
20 25 30
Pro Leu Met Met Thr Ala Glu Ile Ser Pro Ala Ala His Ile Gln Leu
35 40 45
Ala Ser Asp Met Phe Ser His Lys Ala Gly Met Thr Pro Asp Ala Ser
50 55 60
Tyr Ala Leu Ile Gln Ala Thr Val Lys Thr Phe Ala Asp Tyr Leu Gly
65 70 75 80
Gln Ser Ile Asp Gln Leu Glu Pro Phe Ser Leu Ile Ile Thr Gly Lys
85 90 95
Met Glu Arg Asp Gly Lys Lys Phe Gly Ile Gly Ser Ser Gly Ser Val
100 105 110
Thr Leu Leu Thr Leu Lys Ala Leu Ser Ala Tyr Tyr Gln Ile Thr Leu
115 120 125
Thr Pro Glu Leu Leu Phe Lys Leu Ala Ala Tyr Thr Leu Leu Lys Gln
130 135 140
Gly Asp Asn Gly Ser Met Gly Asp Ile Ala Cys Ile Ala Tyr Gln Thr
145 150 155 160
Leu Val Ala Tyr Thr Ser Phe Asp Arg Glu Gln Val Ser Asn Trp Leu
165 170 175
Gln Thr Met Pro Leu Lys Lys Leu Leu Val Lys Asp Trp Gly Tyr His
180 185 190
Ile Gln Val Ile Gln Pro Ala Leu Pro Cys Asp Phe Leu Val Gly Trp
195 200 205
Thr Lys Ile Pro Ala Ile Ser Arg Gln Met Ile Gln Gln Val Thr Ala
210 215 220
Ser Ile Thr Pro Ala Phe Leu Arg Thr Ser Tyr Gln Leu Thr Gln Ser
225 230 235 240
Ala Met Val Ala Leu Gln Glu Gly His Lys Glu Glu Leu Lys Lys Ser
245 250 255
Leu Ala Gly Ala Ser His Leu Leu Lys Glu Leu His Pro Ala Ile Tyr
260 265 270
His Pro Lys Leu Val Thr Leu Val Ala Ala Cys Gln Lys Gln Asp Ala
275 280 285
Val Ala Lys Ser Ser Gly Ala Gly Gly Gly Asp Cys Gly Ile Ala Leu
290 295 300
Ala Phe Asn Gln Asp Ala Arg Asp Thr Leu Ile Ser Lys Trp Gln Glu
305 310 315 320
Ala Asp Ile Ala Leu Leu Tyr Gln Glu Arg Trp Gly Glu Asn Asp
325 330 335
<210> 107
<211> 368
<212> PRT
<213> Enterococcus faecalis
<400> 107
Met Ile Glu Val Thr Thr Pro Gly Lys Leu Phe Ile Ala Gly Glu Tyr
1 5 10 15
Ala Val Val Glu Pro Gly His Pro Ala Ile Ile Val Ala Val Asp Gln
20 25 30
Phe Val Thr Val Thr Val Glu Glu Thr Thr Asp Glu Gly Ser Ile Gln
35 40 45
Ser Ala Gln Tyr Ser Ser Leu Pro Ile Arg Trp Thr Arg Arg Asn Gly
50 55 60
Glu Leu Val Leu Asp Ile Arg Glu Asn Pro Phe His Tyr Val Leu Ala
65 70 75 80
Ala Ile His Leu Thr Glu Lys Tyr Ala Gln Glu Gln Asn Lys Glu Leu
85 90 95
Ser Phe Tyr His Leu Lys Val Thr Ser Glu Leu Asp Ser Ser Asn Gly
100 105 110
Arg Lys Tyr Gly Leu Gly Ser Ser Gly Ala Val Thr Val Gly Thr Val
115 120 125
Lys Ala Leu Asn Ile Phe Tyr Asp Leu Gly Leu Glu Asn Glu Glu Ile
130 135 140
Phe Lys Leu Ser Ala Leu Ala His Leu Ala Val Gln Gly Asn Gly Ser
145 150 155 160
Cys Gly Asp Ile Ala Ala Ser Cys Tyr Gly Gly Trp Ile Ala Phe Ser
165 170 175
Thr Phe Asp His Asp Trp Val Asn Gln Lys Val Thr Thr Glu Thr Leu
180 185 190
Thr Asp Leu Leu Ala Met Asp Trp Pro Glu Leu Met Ile Phe Pro Leu
195 200 205
Lys Val Pro Lys Gln Leu Arg Leu Leu Ile Gly Trp Thr Gly Ser Pro
210 215 220
Ala Ser Thr Ser Asp Leu Val Asp Arg Val His Gln Ser Lys Glu Glu
225 230 235 240
Lys Gln Ala Ala Tyr Glu Gln Phe Leu Met Lys Ser Arg Leu Cys Val
245 250 255
Glu Thr Met Ile Asn Gly Phe Asn Thr Gly Lys Ile Ser Val Ile Gln
260 265 270
Lys Gln Ile Thr Lys Asn Arg Gln Leu Leu Ala Glu Leu Ser Ser Leu
275 280 285
Thr Gly Val Val Ile Glu Thr Glu Ala Leu Lys Asn Leu Cys Asp Leu
290 295 300
Ala Glu Ser Tyr Thr Gly Ala Ala Lys Ser Ser Gly Ala Gly Gly Gly
305 310 315 320
Asp Cys Gly Ile Val Ile Phe Arg Gln Lys Ser Gly Ile Leu Pro Leu
325 330 335
Met Thr Ala Trp Glu Lys Asp Gly Ile Thr Pro Leu Pro Leu His Val
340 345 350
Tyr Thr Tyr Gly Gln Lys Glu Cys Lys Glu Lys His Glu Ser Lys Arg
355 360 365
<210> 108
<211> 361
<212> PRT
<213> Enterococcus faecium
<400> 108
Met Ile Glu Val Ser Ala Pro Gly Lys Leu Tyr Ile Ala Gly Glu Tyr
1 5 10 15
Ala Val Val Glu Thr Gly His Pro Ala Val Ile Ala Ala Val Asp Gln
20 25 30
Phe Val Thr Val Thr Val Glu Ser Ala Arg Lys Val Gly Ser Ile Gln
35 40 45
Ser Ala Gln Tyr Ser Gly Met Pro Val Arg Trp Thr Arg Arg Asn Gly
50 55 60
Glu Leu Val Leu Asp Ile Arg Glu Asn Pro Phe His Tyr Ile Leu Ala
65 70 75 80
Ala Ile Arg Leu Thr Glu Lys Tyr Ala Gln Glu Lys Asn Ile Leu Leu
85 90 95
Ser Phe Tyr Asp Leu Lys Val Thr Ser Glu Leu Asp Ser Ser Asn Gly
100 105 110
Arg Lys Tyr Gly Leu Gly Ser Ser Gly Ala Val Thr Val Ala Thr Val
115 120 125
Lys Ala Leu Asn Val Phe Tyr Ala Leu Asn Leu Ser Gln Leu Glu Ile
130 135 140
Phe Lys Ile Ala Ala Leu Ala Asn Leu Ala Val Gln Asp Asn Gly Ser
145 150 155 160
Cys Gly Asp Ile Ala Ala Ser Cys Tyr Gly Gly Trp Ile Ala Phe Ser
165 170 175
Thr Phe Asp His Pro Trp Leu Gln Glu Gln Glu Thr Gln His Ser Ile
180 185 190
Ser Glu Leu Leu Ala Leu Asp Trp Pro Gly Leu Ser Ile Glu Pro Leu
195 200 205
Ile Ala Pro Glu Asp Leu Arg Leu Leu Ile Gly Trp Thr Gly Ser Pro
210 215 220
Ala Ser Thr Ser Asp Leu Val Asp Gln Val His Arg Ser Arg Glu Asp
225 230 235 240
Lys Met Val Ala Tyr Gln Leu Phe Leu Lys Asn Ser Thr Glu Cys Val
245 250 255
Asn Glu Met Ile Lys Gly Phe Lys Glu Asn Asn Val Thr Leu Ile Gln
260 265 270
Gln Met Ile Arg Lys Asn Arg Gln Leu Leu His Asp Leu Ser Ala Ile
275 280 285
Thr Gly Val Val Ile Glu Thr Pro Ala Leu Asn Lys Leu Cys Asn Leu
290 295 300
Ala Glu Gln Tyr Glu Gly Ala Ala Lys Ser Ser Gly Ala Gly Gly Gly
305 310 315 320
Asp Cys Gly Ile Val Ile Val Asp Gln Lys Ser Gly Ile Leu Pro Leu
325 330 335
Met Ser Ala Trp Glu Lys Ala Glu Ile Thr Pro Leu Pro Leu His Val
340 345 350
Tyr Ser Asp Gln Arg Lys Glu Asn Arg
355 360
<210> 109
<211> 358
<212> PRT
<213> Staphylococcus haemolyticus
<400> 109
Met Ile Gln Val Lys Ala Pro Gly Lys Leu Tyr Val Ala Gly Glu Tyr
1 5 10 15
Ala Val Thr Glu Pro Gly Tyr Lys Ser Val Leu Ile Ala Val Asp Arg
20 25 30
Phe Val Thr Ala Ser Ile Glu Ala Ser Asn Ala Val Thr Ser Thr Ile
35 40 45
His Ser Lys Thr Leu His Tyr Glu Pro Val Thr Phe Asn Arg Asn Glu
50 55 60
Asp Lys Ile Asp Ile Ser Asp Ala Asn Ala Ala Ser Gln Leu Lys Tyr
65 70 75 80
Val Val Thr Ala Ile Glu Val Phe Glu Gln Tyr Ala Arg Ser Cys Asn
85 90 95
Val Lys Leu Lys His Phe His Leu Glu Ile Asp Ser Asn Leu Asp Asp
100 105 110
Ala Ser Gly Asn Lys Tyr Gly Leu Gly Ser Ser Ala Ala Val Leu Val
115 120 125
Ser Val Val Lys Ala Leu Asn Glu Phe Tyr Asp Met Gln Leu Ser Asn
130 135 140
Leu Tyr Ile Tyr Lys Leu Ala Val Ile Ser Asn Met Arg Leu Gln Ser
145 150 155 160
Leu Ser Ser Cys Gly Asp Ile Ala Val Ser Val Tyr Ser Gly Trp Leu
165 170 175
Ala Tyr Ser Thr Phe Asp His Asp Trp Val Lys Gln Gln Met Glu Glu
180 185 190
Thr Ser Val Asn Glu Val Leu Glu Lys Asn Trp Pro Gly Leu His Ile
195 200 205
Glu Pro Leu Gln Ala Pro Glu Asn Met Glu Val Leu Ile Gly Trp Thr
210 215 220
Gly Ser Pro Ala Ser Ser Pro His Leu Val Ser Glu Val Lys Arg Leu
225 230 235 240
Lys Ser Asp Pro Ser Phe Tyr Gly Arg Phe Leu Asp Gln Ser His Thr
245 250 255
Cys Val Glu Asn Leu Ile Tyr Ala Phe Lys Thr Asp Asn Ile Lys Gly
260 265 270
Val Gln Lys Met Ile Arg Gln Asn Arg Met Ile Ile Gln Gln Met Asp
275 280 285
Asn Glu Ala Thr Val Asp Ile Glu Thr Glu Asn Leu Lys Met Leu Cys
290 295 300
Asp Ile Gly Glu Arg Tyr Gly Ala Ala Ala Lys Thr Ser Gly Ala Gly
305 310 315 320
Gly Gly Asp Cys Gly Ile Ala Ile Ile Asp Asn Arg Ile Asp Lys Asn
325 330 335
Arg Ile Tyr Asn Glu Trp Ala Ser His Gly Ile Lys Pro Leu Lys Phe
340 345 350
Lys Ile Tyr His Gly Gln
355
<210> 110
<211> 358
<212> PRT
<213> Staphylococcus epidermidis
<400> 110
Met Ile Gln Val Lys Ala Pro Gly Lys Leu Tyr Ile Ala Gly Glu Tyr
1 5 10 15
Ala Val Thr Glu Pro Gly Tyr Lys Ser Ile Leu Ile Ala Val Asn Arg
20 25 30
Phe Val Thr Ala Thr Ile Glu Ala Ser Asn Lys Val Glu Gly Ser Ile
35 40 45
His Ser Lys Thr Leu His Tyr Glu Pro Val Lys Phe Asp Arg Asn Glu
50 55 60
Asp Arg Ile Glu Ile Ser Asp Val Gln Ala Ala Lys Gln Leu Lys Tyr
65 70 75 80
Val Val Thr Ala Ile Glu Val Phe Glu Gln Tyr Val Arg Ser Cys Asn
85 90 95
Met Asn Leu Lys His Phe His Leu Thr Ile Asp Ser Asn Leu Ala Asp
100 105 110
Asn Ser Gly Gln Lys Tyr Gly Leu Gly Ser Ser Ala Ala Val Leu Val
115 120 125
Ser Val Val Lys Ala Leu Asn Glu Phe Tyr Gly Leu Glu Leu Ser Asn
130 135 140
Leu Tyr Ile Tyr Lys Leu Ala Val Ile Ala Asn Met Lys Leu Gln Ser
145 150 155 160
Leu Ser Ser Cys Gly Asp Ile Ala Val Ser Val Tyr Ser Gly Trp Leu
165 170 175
Ala Tyr Ser Thr Phe Asp His Asp Trp Val Lys Gln Gln Met Glu Glu
180 185 190
Thr Ser Val Asn Asp Val Leu Glu Lys Asn Trp Pro Gly Leu His Ile
195 200 205
Glu Pro Leu Gln Ala Pro Glu Asn Met Glu Val Leu Ile Gly Trp Thr
210 215 220
Gly Ser Pro Ala Ser Ser Pro His Leu Val Ser Glu Val Lys Arg Leu
225 230 235 240
Lys Ser Asp Pro Ser Phe Tyr Gly Asp Phe Leu Asp Gln Ser His Ala
245 250 255
Cys Val Glu Ser Leu Ile Gln Ala Phe Lys Thr Asn Asn Ile Lys Gly
260 265 270
Val Gln Lys Met Ile Arg Ile Asn Arg Arg Ile Ile Gln Ser Met Asp
275 280 285
Asn Glu Ala Ser Val Glu Ile Glu Thr Asp Lys Leu Lys Lys Leu Cys
290 295 300
Asp Val Gly Glu Lys His Gly Gly Ala Ser Lys Thr Ser Gly Ala Gly
305 310 315 320
Gly Gly Asp Cys Gly Ile Thr Ile Ile Asn Lys Val Ile Asp Lys Asn
325 330 335
Ile Ile Tyr Asn Glu Trp Gln Met Asn Asp Ile Lys Pro Leu Lys Phe
340 345 350
Lys Ile Tyr His Gly Gln
355
<210> 111
<211> 358
<212> PRT
<213> Staphylococcus aureus
<400> 111
Met Ile Gln Val Lys Ala Pro Gly Lys Leu Tyr Ile Ala Gly Glu Tyr
1 5 10 15
Ala Val Thr Glu Pro Gly Tyr Lys Ser Val Leu Ile Ala Leu Asp Arg
20 25 30
Phe Val Thr Ala Thr Ile Glu Glu Ala Thr Gln Tyr Lys Gly Thr Ile
35 40 45
His Ser Lys Ala Leu His His Asn Pro Val Thr Phe Ser Arg Asp Glu
50 55 60
Asp Ser Ile Val Ile Ser Asp Pro His Ala Ala Lys Gln Leu Asn Tyr
65 70 75 80
Val Val Thr Ala Ile Glu Ile Phe Glu Gln Tyr Ala Lys Ser Cys Asp
85 90 95
Ile Ala Met Lys His Phe His Leu Thr Ile Asp Ser Asn Leu Asp Asp
100 105 110
Ser Asn Gly His Lys Tyr Gly Leu Gly Ser Ser Ala Ala Val Leu Val
115 120 125
Ser Val Ile Lys Val Leu Asn Glu Phe Tyr Asp Met Lys Leu Ser Asn
130 135 140
Leu Tyr Ile Tyr Lys Leu Ala Val Ile Ala Asn Met Lys Leu Gln Ser
145 150 155 160
Leu Ser Ser Cys Gly Asp Ile Ala Val Ser Val Tyr Ser Gly Trp Leu
165 170 175
Ala Tyr Ser Thr Phe Asp His Glu Trp Val Lys His Gln Ile Glu Asp
180 185 190
Thr Thr Val Glu Glu Val Leu Ile Lys Asn Trp Pro Gly Leu His Ile
195 200 205
Glu Pro Leu Gln Ala Pro Glu Asn Met Glu Val Leu Ile Gly Trp Thr
210 215 220
Gly Ser Pro Ala Ser Ser Pro His Phe Val Ser Glu Val Lys Arg Leu
225 230 235 240
Lys Ser Asp Pro Ser Phe Tyr Gly Asp Phe Leu Glu Asp Ser His Arg
245 250 255
Cys Val Glu Lys Leu Ile His Ala Phe Lys Thr Asn Asn Ile Lys Gly
260 265 270
Val Gln Lys Met Val Arg Gln Asn Arg Thr Ile Ile Gln Arg Met Asp
275 280 285
Lys Glu Ala Thr Val Asp Ile Glu Thr Glu Lys Leu Lys Tyr Leu Cys
290 295 300
Asp Ile Ala Glu Lys Tyr His Gly Ala Ser Lys Thr Ser Gly Ala Gly
305 310 315 320
Gly Gly Asp Cys Gly Ile Thr Ile Ile Asn Lys Asp Val Asp Lys Glu
325 330 335
Lys Ile Tyr Asp Glu Trp Thr Lys His Gly Ile Lys Pro Leu Lys Phe
340 345 350
Asn Ile Tyr His Gly Gln
355
<210> 112
<211> 374
<212> PRT
<213> Streptomyces sp.
<400> 112
Met Thr Thr Gly Gln Arg Thr Ile Val Arg His Ala Pro Gly Lys Leu
1 5 10 15
Phe Val Ala Gly Glu Tyr Ala Val Val Asp Pro Gly Asn Pro Ala Ile
20 25 30
Leu Val Ala Val Asp Arg His Ile Ser Val Thr Val Ser Asp Ala Asp
35 40 45
Ala Asp Thr Gly Ala Ala Asp Val Val Ile Ser Ser Asp Leu Gly Pro
50 55 60
Gln Ala Val Gly Trp Arg Trp His Asp Gly Arg Leu Val Val Arg Asp
65 70 75 80
Pro Asp Asp Gly Gln Gln Ala Arg Ser Ala Leu Ala His Val Val Ser
85 90 95
Ala Ile Glu Thr Val Gly Arg Leu Leu Gly Glu Arg Gly Gln Lys Val
100 105 110
Pro Ala Leu Thr Leu Ser Val Ser Ser Arg Leu His Glu Asp Gly Arg
115 120 125
Lys Phe Gly Leu Gly Ser Ser Gly Ala Val Thr Val Ala Thr Val Ala
130 135 140
Ala Val Ala Ala Phe Cys Gly Leu Glu Leu Ser Thr Asp Glu Arg Phe
145 150 155 160
Arg Leu Ala Met Leu Ala Thr Ala Glu Leu Asp Pro Lys Gly Ser Gly
165 170 175
Gly Asp Leu Ala Ala Ser Thr Trp Gly Gly Trp Ile Ala Tyr Gln Ala
180 185 190
Pro Asp Arg Ala Phe Val Leu Asp Leu Ala Arg Arg Val Gly Val Asp
195 200 205
Arg Thr Leu Lys Ala Pro Trp Pro Gly His Ser Val Arg Arg Leu Pro
210 215 220
Ala Pro Lys Gly Leu Thr Leu Glu Val Gly Trp Thr Gly Glu Pro Ala
225 230 235 240
Ser Thr Ala Ser Leu Val Ser Asp Leu His Arg Arg Thr Trp Arg Gly
245 250 255
Ser Ala Ser His Gln Arg Phe Val Glu Thr Thr Thr Asp Cys Val Arg
260 265 270
Ser Ala Val Thr Ala Leu Glu Ser Gly Asp Asp Thr Ser Leu Leu His
275 280 285
Glu Ile Arg Arg Ala Arg Gln Glu Leu Ala Arg Leu Asp Asp Glu Val
290 295 300
Gly Leu Gly Ile Phe Thr Pro Lys Leu Thr Ala Leu Cys Asp Ala Ala
305 310 315 320
Glu Ala Val Gly Gly Ala Ala Lys Pro Ser Gly Ala Gly Gly Gly Asp
325 330 335
Cys Gly Ile Ala Leu Leu Asp Ala Glu Ala Ser Arg Asp Ile Thr His
340 345 350
Val Arg Gln Arg Trp Glu Thr Ala Gly Val Leu Pro Leu Pro Leu Thr
355 360 365
Pro Ala Leu Glu Gly Ile
370
<210> 113
<211> 360
<212> PRT
<213> Streptomyces griseosporeus
<400> 113
Met Thr Gly Pro Arg Ala Val Thr Arg Arg Ala Pro Gly Lys Leu Phe
1 5 10 15
Val Ala Gly Glu Tyr Ala Val Val Glu Pro Gly Asn Arg Ala Ile Leu
20 25 30
Val Ala Val Asp Arg Tyr Val Thr Val Thr Val Ser Asp Gly Ala Ala
35 40 45
Pro Gly Val Val Val Ser Ser Asp Ile Gly Ala Gly Pro Val His His
50 55 60
Pro Trp Gln Asp Gly Arg Leu Thr Gly Gly Thr Gly Thr Pro His Val
65 70 75 80
Val Ala Ala Val Glu Thr Val Ala Arg Leu Leu Ala Glu Arg Gly Arg
85 90 95
Ser Val Pro Pro Leu Gly Trp Ser Ile Ser Ser Thr Leu His Glu Asp
100 105 110
Gly Arg Lys Phe Gly Leu Gly Ser Ser Gly Ala Val Thr Val Ala Thr
115 120 125
Val Ser Ala Val Ala Ala His Cys Gly Leu Glu Leu Thr Ala Glu Glu
130 135 140
Arg Phe Arg Thr Ala Leu Ile Ala Ser Ala Arg Ile Asp Pro Arg Gly
145 150 155 160
Ser Gly Gly Asp Ile Ala Thr Ser Thr Trp Gly Gly Trp Ile Ala Tyr
165 170 175
Arg Ala Pro Asp Arg Asp Ala Val Leu Asp Leu Thr Arg Arg Gln Gly
180 185 190
Val Asp Glu Ala Leu Arg Ala Pro Trp Pro Gly Phe Ser Val Arg Leu
195 200 205
Ser Pro Pro Arg Asn Leu Cys Leu Glu Val Gly Trp Thr Gly Asn Pro
210 215 220
Val Ser Thr Thr Ser Leu Leu Thr Asp Leu His Arg Arg Thr Trp Arg
225 230 235 240
Gly Ser Pro Ala Tyr Arg Arg Tyr Val Gly Ala Thr Gly Glu Leu Val
245 250 255
Asp Ala Ala Val Ile Ala Leu Glu Asp Gly Asp Thr Glu Gly Leu Leu
260 265 270
Arg Gln Val Arg Arg Ala Arg His Glu Met Val Arg Leu Asp Asp Glu
275 280 285
Val Gly Leu Gly Ile Phe Thr Pro Glu Leu Thr Ala Leu Cys Ala Ile
290 295 300
Ala Glu Arg Ala Gly Ala Ala Lys Pro Ser Gly Ala Gly Gly Gly Asp
305 310 315 320
Cys Gly Ile Ala Leu Leu Asp Ala Glu Ala Arg Tyr Asp Arg Ser Pro
325 330 335
Leu His Arg Gln Trp Ala Ala Ala Gly Val Leu Pro Leu Leu Val Ser
340 345 350
Pro Ala Thr Glu Gly Val Glu Glu
355 360
<210> 114
<211> 317
<212> PRT
<213> Borrelia burgdorferi
<400> 114
Met Asp Leu Ile Ser Phe Ser Val Pro Gly Asn Leu Leu Leu Met Gly
1 5 10 15
Glu Tyr Thr Ile Leu Glu Glu Lys Gly Leu Gly Leu Ala Ile Ala Ile
20 25 30
Asn Lys Arg Ala Phe Phe Ser Phe Lys Lys Ser Asp Ser Trp Arg Phe
35 40 45
Phe Ser Lys Lys Lys Lys Ile Asp Asp Phe Ser Leu Ile Glu Asn Arg
50 55 60
Ser Asp Phe Val Phe Lys Met Phe Ala Tyr Leu Ser Gln Asn Cys Phe
65 70 75 80
Phe Asn Leu Glu Asn Phe Ala Tyr Asp Val Tyr Ile Asp Thr Ser Asn
85 90 95
Phe Phe Phe Asn Asp Gly Thr Lys Lys Gly Phe Gly Ser Ser Ala Val
100 105 110
Val Ala Ile Gly Ile Val Cys Gly Leu Phe Leu Ile His Asn Ala Thr
115 120 125
Asn Val Val Glu Lys Gly Glu Ile Phe Lys Tyr Cys Leu Glu Ala Tyr
130 135 140
Arg Tyr Ser Gln Gly Gly Ile Gly Ser Gly Tyr Asp Ile Ala Thr Ser
145 150 155 160
Ile Phe Gly Gly Val Ile Glu Phe Glu Gly Gly Phe Asn Pro Lys Cys
165 170 175
Arg Gln Leu Gly Ala Val Glu Phe Asn Asp Phe Tyr Leu Met Gln Gly
180 185 190
Leu Gln Ala Ile Lys Thr Thr Thr Ser Ile Cys Glu Tyr Asn Lys His
195 200 205
Arg Asn Ser Ile Leu Asp Phe Ile Leu Lys Cys Asn Leu Glu Met Lys
210 215 220
Lys Leu Val Leu Asn Ala Ser Asn Ser Lys Ser Ala Leu Ile Ser Ser
225 230 235 240
Leu Arg Arg Ala Lys Glu Leu Gly Leu Ala Ile Gly Glu Ala Ile Gly
245 250 255
Val Ser Ala Ala Leu Pro Ser Ser Phe Asp His Leu Leu Gly Gln Cys
260 265 270
Asp Leu Ile Lys Ala Leu Gly Ala Gly Asn Glu Thr Phe Leu Val Tyr
275 280 285
Arg Pro Asn Ile Glu Ala Phe Asn Leu Ser Lys Ile Ile Ser Ile Val
290 295 300
Leu Glu Asn Glu Gly Ile Lys Phe Glu Ser Asp Lys Cys
305 310 315
<210> 115
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 115
gggcaagctt gtccacggca cgaccaagca 30
<210> 116
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 116
cgtaatccgc ggccgcgttt ccagcgcgtc 30
<210> 117
<211> 28
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(28)
<223> primer
<400> 117
aattaaagga gggtttcata tgaattcg 28
<210> 118
<211> 28
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(28)
<223> primer
<400> 118
gatccgaatt catatgaaac cctccttt 28
<210> 119
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 119
aaggcctcat atgatttccc ataccccggt 30
<210> 120
<211> 28
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(28)
<223> primer
<400> 120
cgggatcctc atcgctccat ctccatgt 28
<210> 121
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 121
aaggcctcat atgaccgaca gcaaggatca 30
<210> 122
<211> 28
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(28)
<223> primer
<400> 122
cgggatcctc attgacggat aagcgagg 28
<210> 123
<211> 29
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(29)
<223> primer
<400> 123
aaggcctcat atgaaagtgc ctaagatga 29
<210> 124
<211> 28
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(28)
<223> primer
<400> 124
cgggatcctc aggcctgccg gtcgacat 28
<210> 125
<211> 34
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(34)
<223> primer
<400> 125
aaggcctcat atgagcaccg gcaggcctga agca 34
<210> 126
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 126
cgggatcctc atccctgccc cggcagcggt t 31
<210> 127
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 127
aaggcctcat atggatcagg tcatccgcgc 30
<210> 128
<211> 28
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(28)
<223> primer
<400> 128
cgggatcctc agtcatcgaa aacaagtc 28
<210> 129
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 129
aaggcctcat atgactgatg ccgtccgcga 30
<210> 130
<211> 28
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(28)
<223> primer
<400> 130
cgggatcctc aacgcccctc gaacggcg 28
<210> 131
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 131
ccggcattcg ggcggcatcc aggtctcgct g 31
<210> 132
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 132
cagcgagacc tggatgccgc ccgaatgccg g 31
<210> 133
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 133
cgtgcagggc tggattctgt cggaataccc g 31
<210> 134
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 134
cgggtattcc gacagaatcc agccctgcac g 31
<210> 135
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 135
gggctgcgcg ccggcatccg gcatttcgac g 31
<210> 136
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 136
cgtcgaaatg ccggatgccg gcgcgcagcc c 31
<210> 137
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 137
gggtgcgacg ggcgagttct tcgatgcgcg g 31
<210> 138
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 138
ccgcgcatcg aagaactcgc ccgtcgcacc c 31
<210> 139
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 139
cacgcccgtc acatacgacg aatacgttgc c 31
<210> 140
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 140
ggcaacgtat tcgtcgtatg tgacgggcgt g 31
<210> 141
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 141
gaggctcggg cttggctcct cggcggcggt g 31
<210> 142
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 142
caccgccgcc gaggagccaa gcccgagcct c 31
<210> 143
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 143
cggcacgctg ctggacccgg gcgacgcctt c 31
<210> 144
<211> 31
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(31)
<223> primer
<400> 144
gaaggcgtcg cccgggtcca gcagcgtgcc g 31
<210> 145
<211> 36
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(36)
<223> oligonucleotide
<400> 145
tcagaattcg gtaccatatg aagcttggat ccgggg 36
<210> 146
<211> 29
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(29)
<223> oligonucleotide
<400> 146
ggatccaagc ttcatatggt accgaattc 29
<210> 147
<211> 26
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(26)
<223> primer
<400> 147
ggaattcgct gctgaacgcg atggcg 26
<210> 148
<211> 32
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(32)
<223> primer
<400> 148
ggggtaccat atgtgccttc gttgcgtcag tc 32
<210> 149
<211> 50
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(50)
<223> oligonucleotide
<400> 149
gatccggcgt gtgcgcaatt taattgcgca cacgccccct gcgtttaaac 50
<210> 150
<211> 50
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(50)
<223> oligonucleotide
<400> 150
gatcgtttaa acgcaggggg cgtgtgcgca attaaattgc gcacacgccg 50
<210> 151
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 151
aaggcctcat atgacgccca agcagcaatt 30
<210> 152
<211> 26
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(26)
<223> primer
<400> 152
cgggatccta ggcgctgcgg cggatg 26
<210> 153
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 153
ccggatcctc atgcctgccg gtcgacatag 30
<210> 154
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 154
gaaggcacat atgaatcagg tcatccgcgc 30
<210> 155
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 155
gccggatcct cattcatcga aaacaagtcc 30
<210> 156
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 156
acgccggatc ctcatcgccc ctcgaacggc 30
<210> 157
<211> 1612
<212> DNA
<213> Paracoccus sp.
<220>
<221> gene
<222> (1)..(1612)
<400> 157
ccatggcatc cgggtcggat gccgtctatg ttggcccgaa caggcagcag gaggccccat 60
gagcgatatc cagaccctct cgttcgagga agccatgcgc gagctggagg cgaccgtcgg 120
caagctggaa accggcgagg cgacgctcga ggactccatc gcgctctatg aacgcggggc 180
ggcgctgcgc gcccattgcg aaacccgcct gcgcgaggcc gaggagcggg tcgagaagat 240
caccctggcc gcgaacgggc agccgtccgg aaccgagccc gccgagggcc tgtgatgcag 300
gcccgcctgg ccgagatccg gcccctggtc gaggccgagc tgaacgccgc catcgacgcg 360
ctgcccgcgg gcgatctgtc ggatgcgatg cgctatgccg tgcagggcgg caagcggctg 420
cgcgcgttcc tggtgatgga gtcggcgcgc ctgcacgggc tggacgacga cgcatcgctg 480
cccgtcgccg ccgcggtcga ggcgctgcac gcctacagct tggtccatga cgacctgccc 540
gcgatggatg acgacgacct gcggcgcggt cagcccaccg tccacgtcaa atggaccgag 600
gcgaccgcga tccttgcggg cgatgcgctg cagacgctgg ccttccagct gctggccgat 660
ccgcgcgtgg gcgacgatgc ggcgcggatg cggctggtcg gttcgctggc gcaggcatcg 720
ggggctgcgg gcatggtctg gggccaggcg ctggacatcg cggccgagac ctcgggcgtg 780
ccgctggatc tggacgcgat catccgcctg cagggtggca agaccggcgc gctgatccgc 840
tttgccgcga ccgccgggcc gctgatggcg ggggcggacc ctgccgcgct ggacgattat 900
gcgcaggccg tcgggctggc cttccagatc gcggacgaca tcctggacgt cgagggctgc 960
gaggccgcga ccggcaagcg cgtcggcaag gatgcggatg ccaacaaggc gaccttcgtc 1020
tcgctgctgg gcctcgaggg ggcgcggtcc gaggcgcgtc gcctggccga tgcggggcag 1080
gacgcgctgg cgggttacgg cgatgctgcg gggaaccttc gggacctggc gcgcttcgtg 1140
atcgaacgcg acagctgatc gccgccttcc cgccaagggg caagatgatg accgacggac 1200
ccgcaacccc gatcctggac cgcgtccagc agccatccga cctggcatcg ctggacgatg 1260
cgcagctgcg cctgctggcg gacgagctgc gggccgagac catcgacatc gtcagccgca 1320
cgggcggtca cctgggcgcg gggctgggcg tggtcgaact gacggtcgcc ctgcacgccg 1380
tctttcgggc gccgcgcgac aagatcgtct gggacgtggg gcatcaatgc tatccccaca 1440
agatcctgac gggcaggcgg gaccggatgc gcacgctgcg catgggcggc gggctgtcgg 1500
ggttcaccaa gcggcaggaa agcgcgttcg atccgttcgg tgcggggcac agctcgacct 1560
cgatctcggc ggcgctgggc ttcgcgatgg cgcgtgaact tggcggggat cc 1612
<210> 158
<211> 78
<212> PRT
<213> Paracoccus sp.
<400> 158
Met Ser Asp Ile Gln Thr Leu Ser Phe Glu Glu Ala Met Arg Glu Leu
1 5 10 15
Glu Ala Thr Val Gly Lys Leu Glu Thr Gly Glu Ala Thr Leu Glu Asp
20 25 30
Ser Ile Ala Leu Tyr Glu Arg Gly Ala Ala Leu Arg Ala His Cys Glu
35 40 45
Thr Arg Leu Arg Glu Ala Glu Glu Arg Val Glu Lys Ile Thr Leu Ala
50 55 60
Ala Asn Gly Gln Pro Ser Gly Thr Glu Pro Ala Glu Gly Leu
65 70 75
<210> 159
<211> 287
<212> PRT
<213> Paracoccus sp.
<400> 159
Met Gln Ala Arg Leu Ala Glu Ile Arg Pro Leu Val Glu Ala Glu Leu
1 5 10 15
Asn Ala Ala Ile Asp Ala Leu Pro Ala Gly Asp Leu Ser Asp Ala Met
20 25 30
Arg Tyr Ala Val Gln Gly Gly Lys Arg Leu Arg Ala Phe Leu Val Met
35 40 45
Glu Ser Ala Arg Leu His Gly Leu Asp Asp Asp Ala Ser Leu Pro Val
50 55 60
Ala Ala Ala Val Glu Ala Leu His Ala Tyr Ser Leu Val His Asp Asp
65 70 75 80
Leu Pro Ala Met Asp Asp Asp Asp Leu Arg Arg Gly Gln Pro Thr Val
85 90 95
His Val Lys Trp Thr Glu Ala Thr Ala Ile Leu Ala Gly Asp Ala Leu
100 105 110
Gln Thr Leu Ala Phe Gln Leu Leu Ala Asp Pro Arg Val Gly Asp Asp
115 120 125
Ala Ala Arg Met Arg Leu Val Gly Ser Leu Ala Gln Ala Ser Gly Ala
130 135 140
Ala Gly Met Val Trp Gly Gln Ala Leu Asp Ile Ala Ala Glu Thr Ser
145 150 155 160
Gly Val Pro Leu Asp Leu Asp Ala Ile Ile Arg Leu Gln Gly Gly Lys
165 170 175
Thr Gly Ala Leu Ile Arg Phe Ala Ala Thr Ala Gly Pro Leu Met Ala
180 185 190
Gly Ala Asp Pro Ala Ala Leu Asp Asp Tyr Ala Gln Ala Val Gly Leu
195 200 205
Ala Phe Gln Ile Ala Asp Asp Ile Leu Asp Val Glu Gly Cys Glu Ala
210 215 220
Ala Thr Gly Lys Arg Val Gly Lys Asp Ala Asp Ala Asn Lys Ala Thr
225 230 235 240
Phe Val Ser Leu Leu Gly Leu Glu Gly Ala Arg Ser Glu Ala Arg Arg
245 250 255
Leu Ala Asp Ala Gly Gln Asp Ala Leu Ala Gly Tyr Gly Asp Ala Ala
260 265 270
Gly Asn Leu Arg Asp Leu Ala Arg Phe Val Ile Glu Arg Asp Ser
275 280 285
<210> 160
<211> 142
<212> PRT
<213> Paracoccus sp.
<400> 160
Met Met Thr Asp Gly Pro Ala Thr Pro Ile Leu Asp Arg Val Gln Gln
1 5 10 15
Pro Ser Asp Leu Ala Ser Leu Asp Asp Ala Gln Leu Arg Leu Leu Ala
20 25 30
Asp Glu Leu Arg Ala Glu Thr Ile Asp Ile Val Ser Arg Thr Gly Gly
35 40 45
His Leu Gly Ala Gly Leu Gly Val Val Glu Leu Thr Val Ala Leu His
50 55 60
Ala Val Phe Arg Ala Pro Arg Asp Lys Ile Val Trp Asp Val Gly His
65 70 75 80
Gln Cys Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Arg Met Arg
85 90 95
Thr Leu Arg Met Gly Gly Gly Leu Ser Gly Phe Thr Lys Arg Gln Glu
100 105 110
Ser Ala Phe Asp Pro Phe Gly Ala Gly His Ser Ser Thr Ser Ile Ser
115 120 125
Ala Ala Leu Gly Phe Ala Met Ala Arg Glu Leu Gly Gly Asp
130 135 140
<210> 161
<211> 6
<212> PRT
<213> Bradyrhizobium japonicum
<400> 161
Val His Asp Asp Leu Pro
1 5
<210> 162
<211> 6
<212> PRT
<213> Rhizobium sp.
<400> 162
Val His Asp Asp Leu Pro
1 5
<210> 163
<211> 6
<212> PRT
<213> Bacillus stearothermophilus
<400> 163
Ile His Asp Asp Leu Pro
1 5
<210> 164
<211> 6
<212> PRT
<213> Bacillus subtilis
<400> 164
Ile His Asp Asp Leu Pro
1 5
<210> 165
<211> 6
<212> PRT
<213> Escherichia coli
<400> 165
Ile His Asp Asp Leu Pro
1 5
<210> 166
<211> 6
<212> PRT
<213> Haemophilus influenzae
<400> 166
Ile His Asp Asp Leu Pro
1 5
<210> 167
<211> 16
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (5)
<223> n means C or T
<220>
<221> misc_feature
<222> (8)
<223> n means C or T
<220>
<221> misc_feature
<222> (11)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(16)
<223> oligonucleotide
<400> 167
tccanganga nctgcc 16
<210> 168
<211> 5
<212> PRT
<213> Bradyrhizobium japonicum
<400> 168
Asp Asp Ile Leu Asp
1 5
<210> 169
<211> 5
<212> PRT
<213> Rhizobium sp.
<400> 169
Asp Asp Ile Leu Asp
1 5
<210> 170
<211> 5
<212> PRT
<213> Bacillus stearothermophilus
<400> 170
Asp Asp Ile Leu Asp
1 5
<210> 171
<211> 5
<212> PRT
<213> Bacillus subtilis
<400> 171
Asp Asp Ile Leu Asp
1 5
<210> 172
<211> 5
<212> PRT
<213> Escherichia coli
<400> 172
Asp Asp Ile Leu Asp
1 5
<210> 173
<211> 5
<212> PRT
<213> Haemophilus influenzae
<400> 173
Asp Asp Ile Leu Asp
1 5
<210> 174
<211> 15
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (3)
<223> n means C or T
<220>
<221> misc_feature
<222> (6)
<223> n means C or T
<220>
<221> misc_feature
<222> (15)
<223> n means C or T
<220>
<221> misc_feature
<222> (1)..(15)
<223> oligonucleotide
<400> 174
ganganatcc tggan 15
<210> 175
<211> 1176
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (1)..(1173)
<400> 175
atg gac ccc atc gtc atc acc ggc gcg atg cgc acc ccg atg ggg gca 48
Met Asp Pro Ile Val Ile Thr Gly Ala Met Arg Thr Pro Met Gly Ala
1 5 10 15
ttc cag ggc gat ctt gcc gcg atg gat gcc ccg acc ctt ggc gcg gcc 96
Phe Gln Gly Asp Leu Ala Ala Met Asp Ala Pro Thr Leu Gly Ala Ala
20 25 30
gcg atc cgc gcc gcg ctg aac ggc ctg tcg ccc gac atg gtg gac gag 144
Ala Ile Arg Ala Ala Leu Asn Gly Leu Ser Pro Asp Met Val Asp Glu
35 40 45
gtg ctg atg ggc tgc gtc ctg ccc gcg ggc cag ggt cag gca ccg gca 192
Val Leu Met Gly Cys Val Leu Pro Ala Gly Gln Gly Gln Ala Pro Ala
50 55 60
cgt cag gcg gcg ctt gac gcc gga ctg ccg ctg tcg gcg ggc gcg acc 240
Arg Gln Ala Ala Leu Asp Ala Gly Leu Pro Leu Ser Ala Gly Ala Thr
65 70 75 80
acc atc aac aag atg tgc gga tcg ggc atg aag gcc gcg atg ctg ggc 288
Thr Ile Asn Lys Met Cys Gly Ser Gly Met Lys Ala Ala Met Leu Gly
85 90 95
cat gac ctg atc gcc gcg gga tcg gcg ggc atc gtc gtc gcc ggc ggg 336
His Asp Leu Ile Ala Ala Gly Ser Ala Gly Ile Val Val Ala Gly Gly
100 105 110
atg gag agc atg tcg aac gcc ccc tac ctg ctg ccc aag gcg cgg tcg 384
Met Glu Ser Met Ser Asn Ala Pro Tyr Leu Leu Pro Lys Ala Arg Ser
115 120 125
ggg atg cgc atg ggc cat gac cgt gtg ctg gat cac atg ttc ctc gac 432
Gly Met Arg Met Gly His Asp Arg Val Leu Asp His Met Phe Leu Asp
130 135 140
ggg ttg gag gac gcc tat gac aag ggc cgc ctg atg ggc acc ttc gcc 480
Gly Leu Glu Asp Ala Tyr Asp Lys Gly Arg Leu Met Gly Thr Phe Ala
145 150 155 160
gag gat tgc gcc ggc gat cac ggt ttc acc cgc gag gcg cag gac gac 528
Glu Asp Cys Ala Gly Asp His Gly Phe Thr Arg Glu Ala Gln Asp Asp
165 170 175
tat gcg ctg acc agc ctg gcc cgc gcg cag gac gcc atc gcc agc ggt 576
Tyr Ala Leu Thr Ser Leu Ala Arg Ala Gln Asp Ala Ile Ala Ser Gly
180 185 190
gcc ttc gcc gcc gag atc gcg ccc gtg acc gtc acg gca cgc aag gtg 624
Ala Phe Ala Ala Glu Ile Ala Pro Val Thr Val Thr Ala Arg Lys Val
195 200 205
cag acc acc gtc gat acc gac gag atg ccc ggc aag gcc cgc ccc gag 672
Gln Thr Thr Val Asp Thr Asp Glu Met Pro Gly Lys Ala Arg Pro Glu
210 215 220
aag atc ccc cat ctg aag ccc gcc ttc cgt gac ggt ggc acg gtc acg 720
Lys Ile Pro His Leu Lys Pro Ala Phe Arg Asp Gly Gly Thr Val Thr
225 230 235 240
gcg gcg aac agc tcg tcg atc tcg gac ggg gcg gcg gcg ctg gtg atg 768
Ala Ala Asn Ser Ser Ser Ile Ser Asp Gly Ala Ala Ala Leu Val Met
245 250 255
atg cgc cag tcg cag gcc gag aag ctg ggc ctg acg ccg atc gcg cgg 816
Met Arg Gln Ser Gln Ala Glu Lys Leu Gly Leu Thr Pro Ile Ala Arg
260 265 270
atc atc ggt cat gcg acc cat gcc gac cgt ccc ggc ctg ttc ccg acg 864
Ile Ile Gly His Ala Thr His Ala Asp Arg Pro Gly Leu Phe Pro Thr
275 280 285
gcc ccc atc ggc gcg atg cgc aag ctg ctg gac cgc acg gac acc cgc 912
Ala Pro Ile Gly Ala Met Arg Lys Leu Leu Asp Arg Thr Asp Thr Arg
290 295 300
ctt ggc gat tac gac ctg ttc gag gtg aac gag gca ttc gcc gtc gtc 960
Leu Gly Asp Tyr Asp Leu Phe Glu Val Asn Glu Ala Phe Ala Val Val
305 310 315 320
gcc atg atc gcg atg aag gag ctt ggc ctg cca cac gat gcc acg aac 1008
Ala Met Ile Ala Met Lys Glu Leu Gly Leu Pro His Asp Ala Thr Asn
325 330 335
atc aac ggc ggg gcc tgc gcg ctt ggg cat ccc atc ggc gcg tcg ggg 1056
Ile Asn Gly Gly Ala Cys Ala Leu Gly His Pro Ile Gly Ala Ser Gly
340 345 350
gcg cgg atc atg gtc acg ctg ctg aac gcg atg gcg gcg cgg ggc gcg 1104
Ala Arg Ile Met Val Thr Leu Leu Asn Ala Met Ala Ala Arg Gly Ala
355 360 365
acg cgc ggg gcc gca tcc gtc tgc atc ggc ggg ggc gag gcg acg gcc 1152
Thr Arg Gly Ala Ala Ser Val Cys Ile Gly Gly Gly Glu Ala Thr Ala
370 375 380
atc gcg ctg gaa cgg ctg agc taa 1176
Ile Ala Leu Glu Arg Leu Ser
385 390
<210> 176
<211> 391
<212> PRT
<213> Paracoccus sp.
<400> 176
Met Asp Pro Ile Val Ile Thr Gly Ala Met Arg Thr Pro Met Gly Ala
1 5 10 15
Phe Gln Gly Asp Leu Ala Ala Met Asp Ala Pro Thr Leu Gly Ala Ala
20 25 30
Ala Ile Arg Ala Ala Leu Asn Gly Leu Ser Pro Asp Met Val Asp Glu
35 40 45
Val Leu Met Gly Cys Val Leu Pro Ala Gly Gln Gly Gln Ala Pro Ala
50 55 60
Arg Gln Ala Ala Leu Asp Ala Gly Leu Pro Leu Ser Ala Gly Ala Thr
65 70 75 80
Thr Ile Asn Lys Met Cys Gly Ser Gly Met Lys Ala Ala Met Leu Gly
85 90 95
His Asp Leu Ile Ala Ala Gly Ser Ala Gly Ile Val Val Ala Gly Gly
100 105 110
Met Glu Ser Met Ser Asn Ala Pro Tyr Leu Leu Pro Lys Ala Arg Ser
115 120 125
Gly Met Arg Met Gly His Asp Arg Val Leu Asp His Met Phe Leu Asp
130 135 140
Gly Leu Glu Asp Ala Tyr Asp Lys Gly Arg Leu Met Gly Thr Phe Ala
145 150 155 160
Glu Asp Cys Ala Gly Asp His Gly Phe Thr Arg Glu Ala Gln Asp Asp
165 170 175
Tyr Ala Leu Thr Ser Leu Ala Arg Ala Gln Asp Ala Ile Ala Ser Gly
180 185 190
Ala Phe Ala Ala Glu Ile Ala Pro Val Thr Val Thr Ala Arg Lys Val
195 200 205
Gln Thr Thr Val Asp Thr Asp Glu Met Pro Gly Lys Ala Arg Pro Glu
210 215 220
Lys Ile Pro His Leu Lys Pro Ala Phe Arg Asp Gly Gly Thr Val Thr
225 230 235 240
Ala Ala Asn Ser Ser Ser Ile Ser Asp Gly Ala Ala Ala Leu Val Met
245 250 255
Met Arg Gln Ser Gln Ala Glu Lys Leu Gly Leu Thr Pro Ile Ala Arg
260 265 270
Ile Ile Gly His Ala Thr His Ala Asp Arg Pro Gly Leu Phe Pro Thr
275 280 285
Ala Pro Ile Gly Ala Met Arg Lys Leu Leu Asp Arg Thr Asp Thr Arg
290 295 300
Leu Gly Asp Tyr Asp Leu Phe Glu Val Asn Glu Ala Phe Ala Val Val
305 310 315 320
Ala Met Ile Ala Met Lys Glu Leu Gly Leu Pro His Asp Ala Thr Asn
325 330 335
Ile Asn Gly Gly Ala Cys Ala Leu Gly His Pro Ile Gly Ala Ser Gly
340 345 350
Ala Arg Ile Met Val Thr Leu Leu Asn Ala Met Ala Ala Arg Gly Ala
355 360 365
Thr Arg Gly Ala Ala Ser Val Cys Ile Gly Gly Gly Glu Ala Thr Ala
370 375 380
Ile Ala Leu Glu Arg Leu Ser
385 390
<210> 177
<211> 1980
<212> DNA
<213> Paracoccus sp.
<220>
<221> gene
<222> (1)..(1980)
<400> 177
atgaccaaag ccgtaatcgt atctgccgca cgtacccccg tcggcagctt catgggcgca 60
ttcgccaatg tccccgcaca tgatctgggc gccgccgtcc tgcgcgaggt cgtggcccgc 120
gccggtgtcg accccgccga ggtcagcgag acgatcctgg gccaggtgct gaccgccgcg 180
cagggccaga accccgcgcg ccaggcgcat atcaatgcgg gcctgcccaa ggaatcggcg 240
gcgtggctca tcaaccaggt ctgcggctcg gggctgcgcg ccgtcgcgct ggcggcgcag 300
caggtcatgc tgggcgatgc gcagatcgtt ctggcggggg gccaggagag catgtcgctg 360
tcgacccatg ccgcctatct gcgcgcgggc cagaagatgg gcgacatgaa gatgatcgac 420
accatgatcc gcgacgggct gtgggatgcc ttcaacggct atcacatggg tcagaccgcc 480
gagaacgtgg ccgaccagtg gtcgatcagc cgcgaccagc aggacgaatt cgccctggct 540
tcgcagaaca aggccgaggc cgcgcagaat gcgggccgct tcgatgacga aatcgtcgcc 600
tataccgtca agggccgcaa gggcgacacg gtcgtcgaca aggacgaata catccgccac 660
ggcgccacga tcgagggcat gcagaagctg cgccccgcct tcaccaagga aggctcggtc 720
acggcgggca acgcgtcggg cctgaacgac ggcgcggcgg ccgtcatggt catgtccgag 780
gacgaggccg cacgccgcgg gctgacgccg ctggcgcgca tcgcctccta tgcgacggcg 840
ggcctcgacc cggcgatcat gggcaccggg ccgatcccct ccagccgcaa ggcgctggaa 900
aaggcgggct ggtcggtcgg cgacctggac ctggtcgagg cgaacgaggc ctttgccgcg 960
caggcctgcg ccgtgaacaa ggacatgggc tgggatccgt ccatcgtgaa cgtcaacggc 1020
ggcgcgatcg ccatcggcca cccgatcggc gcctcggggg cgcggatcct gaacaccctg 1080
ctgttcgaga tgcagcgccg cgacgccaag aagggccttg cgacgctgtg catcggcggc 1140
ggcatgggcg tcgccatgtg cctcgaacgc tgaacgaccg gcgtgtgcgc aatttaattg 1200
cgcacacgcc ccctgcaaag tagcaatgtt ttacgataac gaatgaaggg gggaatcatg 1260
tccaaggtag cactggtcac cggcggatcg cgcggcatcg gcgccgagat ctgcaaggcg 1320
cttcaggccg caggctatac cgtcgccgcg aactatgccg gcaatgacga cgcggccaag 1380
gccttcaccg aggaaaccgg catcaagacc tacaagtggt cggtcgccga ttacgatgcc 1440
tgcaaggccg gcatcgccca ggtcgaagag gatctgggcc cgatcgccgt gctgatcaac 1500
aatgccggga tcacccgcga cgcgcccttc cacaagatga cgcccgagaa gtggaaggag 1560
gtcatcgaca ccaacctgac cggcaccttc aacatgaccc atccggtctg gccgggcatg 1620
cgcgaacgca agttcggacg cgtcatcaac atcagctcga tcaacgggca gaagggccag 1680
ttcgggcagg cgaactatgc cgcggccaag gcgggcgacc tgggcttcac caagtcgctg 1740
gcgcaggaag gcgcgcgcaa caacatcacc gtcaacgcga tctgccccgg ctatatcgcg 1800
acggacatgg tgatggccgt tcccgaacag gtccgcgagg ggatcatcgc gcagatcccc 1860
gtcggccgct tgggcgagcc gtccgagatc gcgcgctgcg tggtgttcct ggcctccgac 1920
gatgcgggct tcgtcacagg ctcgaccatc acggcgaatg gcggccagta ctacatctga 1980
1980
<210> 178
<211> 390
<212> PRT
<213> Paracoccus sp.
<400> 178
Met Thr Lys Ala Val Ile Val Ser Ala Ala Arg Thr Pro Val Gly Ser
1 5 10 15
Phe Met Gly Ala Phe Ala Asn Val Pro Ala His Asp Leu Gly Ala Ala
20 25 30
Val Leu Arg Glu Val Val Ala Arg Ala Gly Val Asp Pro Ala Glu Val
35 40 45
Ser Glu Thr Ile Leu Gly Gln Val Leu Thr Ala Ala Gln Gly Gln Asn
50 55 60
Pro Ala Arg Gln Ala His Ile Asn Ala Gly Leu Pro Lys Glu Ser Ala
65 70 75 80
Ala Trp Leu Ile Asn Gln Val Cys Gly Ser Gly Leu Arg Ala Val Ala
85 90 95
Leu Ala Ala Gln Gln Val Met Leu Gly Asp Ala Gln Ile Val Leu Ala
100 105 110
Gly Gly Gln Glu Ser Met Ser Leu Ser Thr His Ala Ala Tyr Leu Arg
115 120 125
Ala Gly Gln Lys Met Gly Asp Met Lys Met Ile Asp Thr Met Ile Arg
130 135 140
Asp Gly Leu Trp Asp Ala Phe Asn Gly Tyr His Met Gly Gln Thr Ala
145 150 155 160
Glu Asn Val Ala Asp Gln Trp Ser Ile Ser Arg Asp Gln Gln Asp Glu
165 170 175
Phe Ala Leu Ala Ser Gln Asn Lys Ala Glu Ala Ala Gln Asn Ala Gly
180 185 190
Arg Phe Asp Asp Glu Ile Val Ala Tyr Thr Val Lys Gly Arg Lys Gly
195 200 205
Asp Thr Val Val Asp Lys Asp Glu Tyr Ile Arg His Gly Ala Thr Ile
210 215 220
Glu Gly Met Gln Lys Leu Arg Pro Ala Phe Thr Lys Glu Gly Ser Val
225 230 235 240
Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Gly Ala Ala Ala Val Met
245 250 255
Val Met Ser Glu Asp Glu Ala Ala Arg Arg Gly Leu Thr Pro Leu Ala
260 265 270
Arg Ile Ala Ser Tyr Ala Thr Ala Gly Leu Asp Pro Ala Ile Met Gly
275 280 285
Thr Gly Pro Ile Pro Ser Ser Arg Lys Ala Leu Glu Lys Ala Gly Trp
290 295 300
Ser Val Gly Asp Leu Asp Leu Val Glu Ala Asn Glu Ala Phe Ala Ala
305 310 315 320
Gln Ala Cys Ala Val Asn Lys Asp Met Gly Trp Asp Pro Ser Ile Val
325 330 335
Asn Val Asn Gly Gly Ala Ile Ala Ile Gly His Pro Ile Gly Ala Ser
340 345 350
Gly Ala Arg Ile Leu Asn Thr Leu Leu Phe Glu Met Gln Arg Arg Asp
355 360 365
Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Met Gly Val
370 375 380
Ala Met Cys Leu Glu Arg
385 390
<210> 179
<211> 240
<212> PRT
<213> Paracoccus sp.
<400> 179
Met Ser Lys Val Ala Leu Val Thr Gly Gly Ser Arg Gly Ile Gly Ala
1 5 10 15
Glu Ile Cys Lys Ala Leu Gln Ala Ala Gly Tyr Thr Val Ala Ala Asn
20 25 30
Tyr Ala Gly Asn Asp Asp Ala Ala Lys Ala Phe Thr Glu Glu Thr Gly
35 40 45
Ile Lys Thr Tyr Lys Trp Ser Val Ala Asp Tyr Asp Ala Cys Lys Ala
50 55 60
Gly Ile Ala Gln Val Glu Glu Asp Leu Gly Pro Ile Ala Val Leu Ile
65 70 75 80
Asn Asn Ala Gly Ile Thr Arg Asp Ala Pro Phe His Lys Met Thr Pro
85 90 95
Glu Lys Trp Lys Glu Val Ile Asp Thr Asn Leu Thr Gly Thr Phe Asn
100 105 110
Met Thr His Pro Val Trp Pro Gly Met Arg Glu Arg Lys Phe Gly Arg
115 120 125
Val Ile Asn Ile Ser Ser Ile Asn Gly Gln Lys Gly Gln Phe Gly Gln
130 135 140
Ala Asn Tyr Ala Ala Ala Lys Ala Gly Asp Leu Gly Phe Thr Lys Ser
145 150 155 160
Leu Ala Gln Glu Gly Ala Arg Asn Asn Ile Thr Val Asn Ala Ile Cys
165 170 175
Pro Gly Tyr Ile Ala Thr Asp Met Val Met Ala Val Pro Glu Gln Val
180 185 190
Arg Glu Gly Ile Ile Ala Gln Ile Pro Val Gly Arg Leu Gly Glu Pro
195 200 205
Ser Glu Ile Ala Arg Cys Val Val Phe Leu Ala Ser Asp Asp Ala Gly
210 215 220
Phe Val Thr Gly Ser Thr Ile Thr Ala Asn Gly Gly Gln Tyr Tyr Ile
225 230 235 240
<210> 180
<211> 729
<212> DNA
<213> Paracoccus carotinifaciens E-396
<220>
<221> CDS
<222> (1)..(726)
<400> 180
atg agc gca cat gcc ctg ccc aag gca gat ctg acc gcc acc agt ttg 48
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu
1 5 10 15
atc gtc tcg ggc ggc atc atc gcc gcg tgg ctg gcc ctg cat gtg cat 96
Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His
20 25 30
gcg ctg tgg ttt ctg gac gcg gcg gcg cat ccc atc ctg gcg gtc gcg 144
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Val Ala
35 40 45
aat ttc ctg ggg ctg acc tgg ctg tcg gtc ggt ctg ttc atc atc gcg 192
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
50 55 60
cat gac gcg atg cat ggg tcg gtc gtg ccg ggg cgc ccg cgc gcc aat 240
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65 70 75 80
gcg gcg atg ggc cag ctt gtc ctg tgg ctg tat gcc gga ttt tcc tgg 288
Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp
85 90 95
cgc aag atg atc gtc aag cac atg gcc cat cat cgc cat gcc gga acc 336
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr
100 105 110
gac gac gac cca gat ttc gac cat ggc ggc ccg gtc cgc tgg tac gcc 384
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala
115 120 125
cgc ttc atc ggc acc tat ttc ggc tgg cgc gag ggg ctg ctg ctg ccc 432
Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
130 135 140
gtc atc gtg acg gtc tat gcg ctg atg ttg ggg gat cgc tgg atg tac 480
Val Ile Val Thr Val Tyr Ala Leu Met Leu Gly Asp Arg Trp Met Tyr
145 150 155 160
gtg gtc ttc tgg ccg ttg ccg tcg atc ctg gcg tcg atc cag ctg ttc 528
Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe
165 170 175
gtg ttc ggc atc tgg ctg ccg cac cgc ccc ggc cac gac gcg ttc ccg 576
Val Phe Gly Ile Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro
180 185 190
gac cgc cac aat gcg cgg tcg tcg cgg atc agc gac ccc gtg tcg ctg 624
Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu
195 200 205
ctg acc tgc ttt cac ttt ggc ggt tat cat cac gaa cac cac ctg cac 672
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
210 215 220
ccg acg gtg cct tgg tgg cgc ctg ccc agc acc cgc acc aag ggg gac 720
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp
225 230 235 240
acc gca tga 729
Thr Ala
<210> 181
<211> 242
<212> PRT
<213> Paracoccus carotinifaciens E-396
<400> 181
Met Ser Ala His Ala Leu Pro Lys Ala Asp Leu Thr Ala Thr Ser Leu
1 5 10 15
Ile Val Ser Gly Gly Ile Ile Ala Ala Trp Leu Ala Leu His Val His
20 25 30
Ala Leu Trp Phe Leu Asp Ala Ala Ala His Pro Ile Leu Ala Val Ala
35 40 45
Asn Phe Leu Gly Leu Thr Trp Leu Ser Val Gly Leu Phe Ile Ile Ala
50 55 60
His Asp Ala Met His Gly Ser Val Val Pro Gly Arg Pro Arg Ala Asn
65 70 75 80
Ala Ala Met Gly Gln Leu Val Leu Trp Leu Tyr Ala Gly Phe Ser Trp
85 90 95
Arg Lys Met Ile Val Lys His Met Ala His His Arg His Ala Gly Thr
100 105 110
Asp Asp Asp Pro Asp Phe Asp His Gly Gly Pro Val Arg Trp Tyr Ala
115 120 125
Arg Phe Ile Gly Thr Tyr Phe Gly Trp Arg Glu Gly Leu Leu Leu Pro
130 135 140
Val Ile Val Thr Val Tyr Ala Leu Met Leu Gly Asp Arg Trp Met Tyr
145 150 155 160
Val Val Phe Trp Pro Leu Pro Ser Ile Leu Ala Ser Ile Gln Leu Phe
165 170 175
Val Phe Gly Ile Trp Leu Pro His Arg Pro Gly His Asp Ala Phe Pro
180 185 190
Asp Arg His Asn Ala Arg Ser Ser Arg Ile Ser Asp Pro Val Ser Leu
195 200 205
Leu Thr Cys Phe His Phe Gly Gly Tyr His His Glu His His Leu His
210 215 220
Pro Thr Val Pro Trp Trp Arg Leu Pro Ser Thr Arg Thr Lys Gly Asp
225 230 235 240
Thr Ala
<210> 182
<211> 510
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (1)..(507)
<400> 182
atg agc act tgg gcc gca atc ctg acc gtc atc ctg acc gtc gcc gcg 48
Met Ser Thr Trp Ala Ala Ile Leu Thr Val Ile Leu Thr Val Ala Ala
1 5 10 15
atg gag ctg acg gcc tac tcc gtc cat cgg tgg atc atg cat ggc ccc 96
Met Glu Leu Thr Ala Tyr Ser Val His Arg Trp Ile Met His Gly Pro
20 25 30
ctg ggc tgg ggc tgg cat aaa tcg cac cac gac gag gat cac gac cac 144
Leu Gly Trp Gly Trp His Lys Ser His His Asp Glu Asp His Asp His
35 40 45
gcg ctc gag aag aac gac ctc tat ggc gtc atc ttc gcg gta atc tcg 192
Ala Leu Glu Lys Asn Asp Leu Tyr Gly Val Ile Phe Ala Val Ile Ser
50 55 60
atc gtg ctg ttc gcg atc ggc gcg atg ggg tcg gat ctg gcc tgg tgg 240
Ile Val Leu Phe Ala Ile Gly Ala Met Gly Ser Asp Leu Ala Trp Trp
65 70 75 80
ctg gcg gtg ggg gtc acc tgc tac ggg ctg atc tac tat ttc ctg cat 288
Leu Ala Val Gly Val Thr Cys Tyr Gly Leu Ile Tyr Tyr Phe Leu His
85 90 95
gac ggc ttg gtg cat ggg cgc tgg ccg ttc cgc tat gtc ccc aag cgc 336
Asp Gly Leu Val His Gly Arg Trp Pro Phe Arg Tyr Val Pro Lys Arg
100 105 110
ggc tat ctt cgt cgc gtc tac cag gca cac agg atg cat cac gcg gtc 384
Gly Tyr Leu Arg Arg Val Tyr Gln Ala His Arg Met His His Ala Val
115 120 125
cat ggc cgc gag aac tgc gtc agc ttc ggt ttc atc tgg gcg ccc tcg 432
His Gly Arg Glu Asn Cys Val Ser Phe Gly Phe Ile Trp Ala Pro Ser
130 135 140
gtc gac agc ctc aag gca gag ctg aaa cgc tcg ggc gcg ctg ctg aag 480
Val Asp Ser Leu Lys Ala Glu Leu Lys Arg Ser Gly Ala Leu Leu Lys
145 150 155 160
gac cgc gaa ggg gcg gat cgc aat aca tga 510
Asp Arg Glu Gly Ala Asp Arg Asn Thr
165
<210> 183
<211> 169
<212> PRT
<213> Paracoccus sp.
<400> 183
Met Ser Thr Trp Ala Ala Ile Leu Thr Val Ile Leu Thr Val Ala Ala
1 5 10 15
Met Glu Leu Thr Ala Tyr Ser Val His Arg Trp Ile Met His Gly Pro
20 25 30
Leu Gly Trp Gly Trp His Lys Ser His His Asp Glu Asp His Asp His
35 40 45
Ala Leu Glu Lys Asn Asp Leu Tyr Gly Val Ile Phe Ala Val Ile Ser
50 55 60
Ile Val Leu Phe Ala Ile Gly Ala Met Gly Ser Asp Leu Ala Trp Trp
65 70 75 80
Leu Ala Val Gly Val Thr Cys Tyr Gly Leu Ile Tyr Tyr Phe Leu His
85 90 95
Asp Gly Leu Val His Gly Arg Trp Pro Phe Arg Tyr Val Pro Lys Arg
100 105 110
Gly Tyr Leu Arg Arg Val Tyr Gln Ala His Arg Met His His Ala Val
115 120 125
His Gly Arg Glu Asn Cys Val Ser Phe Gly Phe Ile Trp Ala Pro Ser
130 135 140
Val Asp Ser Leu Lys Ala Glu Leu Lys Arg Ser Gly Ala Leu Leu Lys
145 150 155 160
Asp Arg Glu Gly Ala Asp Arg Asn Thr
165
<210> 184
<211> 888
<212> DNA
<213> Paracoccus sp.
<220>
<221> CDS
<222> (1)..(885)
<400> 184
atg acg ccc aag cag caa ttc ccc cta cgc gat ctg gtc gag atc agg 48
Met Thr Pro Lys Gln Gln Phe Pro Leu Arg Asp Leu Val Glu Ile Arg
1 5 10 15
ctg gcg cag atc tcg ggc cag ttc ggc gtg gtc tcg gcc ccg ctc ggc 96
Leu Ala Gln Ile Ser Gly Gln Phe Gly Val Val Ser Ala Pro Leu Gly
20 25 30
gcg gcc atg agc gat gcc gcc ctg tcc ccc ggc aaa cgc ttt cgc gcc 144
Ala Ala Met Ser Asp Ala Ala Leu Ser Pro Gly Lys Arg Phe Arg Ala
35 40 45
gtg ctg atg ctg atg gtc gcc gaa agc tcg ggc ggg gtc tgc gat gcg 192
Val Leu Met Leu Met Val Ala Glu Ser Ser Gly Gly Val Cys Asp Ala
50 55 60
atg gtc gat gcc gcc tgc gcg gtc gag atg gtc cat gcc gca tcg ctg 240
Met Val Asp Ala Ala Cys Ala Val Glu Met Val His Ala Ala Ser Leu
65 70 75 80
atc ttc gac gac atg ccc tgc atg gac gat gcc agg acc cgt cgc ggt 288
Ile Phe Asp Asp Met Pro Cys Met Asp Asp Ala Arg Thr Arg Arg Gly
85 90 95
cag ccc gcc acc cat gtc gcc cat ggc gag ggg cgc gcg gtg ctt gcg 336
Gln Pro Ala Thr His Val Ala His Gly Glu Gly Arg Ala Val Leu Ala
100 105 110
ggc atc gcc ctg atc acc gag gcc atg cgg att ttg ggc gag gcg cgc 384
Gly Ile Ala Leu Ile Thr Glu Ala Met Arg Ile Leu Gly Glu Ala Arg
115 120 125
ggc gcg acg ccg gat cag cgc gca agg ctg gtc gca tcc atg tcg cgc 432
Gly Ala Thr Pro Asp Gln Arg Ala Arg Leu Val Ala Ser Met Ser Arg
130 135 140
gcg atg gga ccg gtg ggg ctg tgc gca ggg cag gat ctg gac ctg cac 480
Ala Met Gly Pro Val Gly Leu Cys Ala Gly Gln Asp Leu Asp Leu His
145 150 155 160
gcc ccc aag gac gcc gcc ggg atc gaa cgt gaa cag gac ctc aag acc 528
Ala Pro Lys Asp Ala Ala Gly Ile Glu Arg Glu Gln Asp Leu Lys Thr
165 170 175
ggc gtg ctg ttc gtc gcg ggc ctc gag atg ctg tcc att att aag ggt 576
Gly Val Leu Phe Val Ala Gly Leu Glu Met Leu Ser Ile Ile Lys Gly
180 185 190
ctg gac aag gcc gag acc gag cag ctc atg gcc ttc ggg cgt cag ctt 624
Leu Asp Lys Ala Glu Thr Glu Gln Leu Met Ala Phe Gly Arg Gln Leu
195 200 205
ggt cgg gtc ttc cag tcc tat gac gac ctg ctg gac gtg atc ggc gac 672
Gly Arg Val Phe Gln Ser Tyr Asp Asp Leu Leu Asp Val Ile Gly Asp
210 215 220
aag gcc agc acc ggc aag gat acg ggg cgc gac acc gcc gcc ccc ggc 720
Lys Ala Ser Thr Gly Lys Asp Thr Gly Arg Asp Thr Ala Ala Pro Gly
225 230 235 240
cca aag cgc ggc ctg atg gcg gtc gga cag atg ggc gac gtg gcg cag 768
Pro Lys Arg Gly Leu Met Ala Val Gly Gln Met Gly Asp Val Ala Gln
245 250 255
cat tac cgc gcc agc cgc gcg caa ctg gac gag ctg atg cgc acc cgg 816
His Tyr Arg Ala Ser Arg Ala Gln Leu Asp Glu Leu Met Arg Thr Arg
260 265 270
ctg ttc cgc ggg ggg cag atc gcg gac ctg ctg gcc cgc gtg ctg ccg 864
Leu Phe Arg Gly Gly Gln Ile Ala Asp Leu Leu Ala Arg Val Leu Pro
275 280 285
cat gac atc cgc cgc agc gcc tag 888
His Asp Ile Arg Arg Ser Ala
290 295
<210> 185
<211> 295
<212> PRT
<213> Paracoccus sp.
<400> 185
Met Thr Pro Lys Gln Gln Phe Pro Leu Arg Asp Leu Val Glu Ile Arg
1 5 10 15
Leu Ala Gln Ile Ser Gly Gln Phe Gly Val Val Ser Ala Pro Leu Gly
20 25 30
Ala Ala Met Ser Asp Ala Ala Leu Ser Pro Gly Lys Arg Phe Arg Ala
35 40 45
Val Leu Met Leu Met Val Ala Glu Ser Ser Gly Gly Val Cys Asp Ala
50 55 60
Met Val Asp Ala Ala Cys Ala Val Glu Met Val His Ala Ala Ser Leu
65 70 75 80
Ile Phe Asp Asp Met Pro Cys Met Asp Asp Ala Arg Thr Arg Arg Gly
85 90 95
Gln Pro Ala Thr His Val Ala His Gly Glu Gly Arg Ala Val Leu Ala
100 105 110
Gly Ile Ala Leu Ile Thr Glu Ala Met Arg Ile Leu Gly Glu Ala Arg
115 120 125
Gly Ala Thr Pro Asp Gln Arg Ala Arg Leu Val Ala Ser Met Ser Arg
130 135 140
Ala Met Gly Pro Val Gly Leu Cys Ala Gly Gln Asp Leu Asp Leu His
145 150 155 160
Ala Pro Lys Asp Ala Ala Gly Ile Glu Arg Glu Gln Asp Leu Lys Thr
165 170 175
Gly Val Leu Phe Val Ala Gly Leu Glu Met Leu Ser Ile Ile Lys Gly
180 185 190
Leu Asp Lys Ala Glu Thr Glu Gln Leu Met Ala Phe Gly Arg Gln Leu
195 200 205
Gly Arg Val Phe Gln Ser Tyr Asp Asp Leu Leu Asp Val Ile Gly Asp
210 215 220
Lys Ala Ser Thr Gly Lys Asp Thr Gly Arg Asp Thr Ala Ala Pro Gly
225 230 235 240
Pro Lys Arg Gly Leu Met Ala Val Gly Gln Met Gly Asp Val Ala Gln
245 250 255
His Tyr Arg Ala Ser Arg Ala Gln Leu Asp Glu Leu Met Arg Thr Arg
260 265 270
Leu Phe Arg Gly Gly Gln Ile Ala Asp Leu Leu Ala Arg Val Leu Pro
275 280 285
His Asp Ile Arg Arg Ser Ala
290 295
<210> 186
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 186
aaggcctcat atgagcgcac atgccctgcc 30
<210> 187
<211> 28
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(28)
<223> primer
<400> 187
cgggatcctc atgcggtgtc ccccttgg 28
<210> 188
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 188
aaggcctcat atgagcactt gggccgcaat 30
<210> 189
<211> 30
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(30)
<223> primer
<400> 189
aggatcctca tgtattgcga tccgcccctt 30
<210> 190
<211> 52
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(52)
<223> polylinker
<400> 190
gtgcagcctc aggtcgacat atgcggccgc atccggatcc ctcctcctcc ag 52
<210> 191
<211> 52
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(52)
<223> polylinker
<400> 191
cacgtcggag tccagctgta tacgccggcg taggcctagg gaggaggagg tc 52
<210> 192
<211> 52
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(52)
<223> polylinker
<400> 192
gtgcaggagg aggtcgacat atgcggccgc atccggatcc ctgaggctcc ag 52
<210> 193
<211> 52
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(52)
<223> polylinker
<400> 193
cacgtcctcc tccagctgta tacgccggcg taggcctagg gactccgagg tc 52
<210> 194
<211> 52
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(52)
<223> polylinker
<400> 194
ctggagcctc aggtcgacat atgcggccgc atccggatcc ctcctcctgc ac 52
<210> 195
<211> 52
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(52)
<223> polylinker
<400> 195
gacctcggag tccagctgta tacgccggcg taggcctagg gaggaggacg tg 52
<210> 196
<211> 52
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(52)
<223> polylinker
<400> 196
ctggaggagg aggtcgacat atgcggccgc atccggatcc ctgaggctgc ac 52
<210> 197
<211> 52
<212> DNA
<213> Artificial
<220>
<221> misc_feature
<222> (1)..(52)
<223> polylinker
<400> 197
gacctcctcc tccagctgta tacgccggcg taggcctagg gactccgacg tg 52
Claims (16)
- 다음으로 이루어진 그룹에서 선택된 아미노산 서열로 구성되는 단리된 폴리펩타이드:(a) 서열번호: 43의 잔기 1 내지 340으로 나타낸 아미노산 서열;(b) 서열번호: 45의 잔기 1 내지 349로 나타낸 아미노산 서열;(c) 서열번호: 47의 잔기 1 내지 388로 나타낸 아미노산 서열;(d) 서열번호: 49의 잔기 1 내지 378로 나타낸 아미노산 서열;(e) 서열번호: 51의 잔기 1 내지 305로 나타낸 아미노산 서열;(f) 서열번호: 53의 잔기 1 내지 332로 나타낸 아미노산 서열; 및(g) 37 ℃에서 40% 포름아미드, 1M NaCl, 1% 나트륨 도데실 설페이트(SDS)의 완충액 중에서 하이브리드화시킨 후, 60 ℃의 온도에서 20 분간 0.2xSSC로 1회 이상 세척하는 조건 하에서, 폴리펩타이드가 HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 또는 디포스포메발로네이트 데카복실라제의 활성을 갖는 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기를 포함하는 하이브리드화 프로브에 하이브리드화되는 폴리뉴클레오타이드 서열에 의해 암호화되는 폴리펩타이드의 아미노산 서열.
- 삭제
- 삭제
- 삭제
- 삭제
- 서열번호: 42; 및 서열번호: 42의 2622 내지 3644, 3641 내지 4690, 4687 내지 5853, 5834 내지 6970, 6970 내지 7887, 7880 내지 8878 잔기로 이루어진 그룹에서 선택된 뉴클레오타이드 서열로 구성되는 단리된 폴리뉴클레오타이드 서열로서,HMG-CoA 리덕타제, 이소펜테닐 디포스페이트 이소머라제, HMG-CoA 신타제, 메발로네이트 키나제, 포스포메발로네이트 키나제 및 디포스포메발로네이트 데카복실라제로 이루어진 그룹에서 선택된 활성을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 서열.
- 삭제
- 삭제
- 삭제
- 제 6 항에 따른 폴리뉴클레오타이드 서열을 포함하는 발현 벡터.
- 삭제
- 제 6 항에 따른 폴리뉴클레오타이드 서열 또는 제 10 항에 따른 발현 벡터를 포함하는, 상기 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드를 발현시키는 배양 세포 또는 세포의 자손.
- 폴리뉴클레오타이드 서열에 의해 암호화된 폴리펩타이드의 발현을 허용하는 조건하에서 제 12 항에 따른 세포를 배양하고, 세포 또는 세포 배지로부터 카로티노이드를 단리함을 포함하는, 카로티노이드의 제조 방법.
- (a) 세포에서 발현되는 제 1 항에 따른 메발로네이트 경로의 효소를 암호화하는 폴리뉴클레오타이드 서열을 세포에 도입하고;(b) 폴리뉴클레오타이드 서열 도입 전에 세포에 의해 생성된 카로티노이드 수준의 1.1 내지 1,000배 수준으로 카로티노이드를 생성하는, 단계 (a)의 폴리뉴클레오타이드 서열을 함유하는 세포를 선별함을 포함하는,카로티노이드-생성 세포를 제조하는 방법.
- (a) 이소프레노이드 화합물의 발현을 허용하는 조건하에 배지에서 모(母) 세균을 배양하고, 모 세균보다 1.1 내지 1,000배 더 많은 이소프레노이드 화합물을 생성하는 배지로부터 돌연변이 세균을 선별하고;(b) 발현 조절 서열에 작용가능하게 연결된 서열번호: 42로 나타내는 폴리뉴클레오타이드 서열을 포함하는 발현 벡터를 돌연변이 세균에 도입하고;(c) 발현 벡터를 함유하고 단계 (a)의 돌연변이체보다 1.1 내지 20배 더 많은 이소프레노이드 화합물을 생성하는 세균을 선별함을 포함하는,이소프레노이드 화합물을 생성하도록 세균을 공학처리하는 방법.
- ATCC(아메리칸 타입 컬쳐 컬렉션)에서 기탁 번호 PTA-3335를 지정받은 파라코커스 속 미생물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29629901P | 2001-06-06 | 2001-06-06 | |
US60/296,299 | 2001-06-06 | ||
PCT/EP2002/006171 WO2002099095A2 (en) | 2001-06-06 | 2002-06-05 | Improved isoprenoid production |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040010683A KR20040010683A (ko) | 2004-01-31 |
KR100704072B1 true KR100704072B1 (ko) | 2007-04-05 |
Family
ID=23141440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037015938A KR100704072B1 (ko) | 2001-06-06 | 2002-06-05 | 개선된 이소프레노이드 제조 방법 |
Country Status (11)
Country | Link |
---|---|
US (2) | US6989257B2 (ko) |
EP (1) | EP1392824B1 (ko) |
JP (1) | JP4280627B2 (ko) |
KR (1) | KR100704072B1 (ko) |
CN (1) | CN1630718A (ko) |
AT (1) | ATE405638T1 (ko) |
AU (1) | AU2002316966B2 (ko) |
CA (1) | CA2449885A1 (ko) |
DE (1) | DE60228439D1 (ko) |
ES (1) | ES2311613T3 (ko) |
WO (1) | WO2002099095A2 (ko) |
Families Citing this family (105)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2281890A1 (en) | 2000-07-31 | 2011-02-09 | Danisco US Inc. | Manipulation of genes of the mevalonate and isoprenoid pathways to create novel traits in transgenic organisms |
US7226739B2 (en) | 2001-03-02 | 2007-06-05 | Isis Pharmaceuticals, Inc | Methods for rapid detection and identification of bioagents in epidemiological and forensic investigations |
US20040121311A1 (en) | 2002-12-06 | 2004-06-24 | Ecker David J. | Methods for rapid detection and identification of bioagents in livestock |
US7666588B2 (en) | 2001-03-02 | 2010-02-23 | Ibis Biosciences, Inc. | Methods for rapid forensic analysis of mitochondrial DNA and characterization of mitochondrial DNA heteroplasmy |
US20030027135A1 (en) | 2001-03-02 | 2003-02-06 | Ecker David J. | Method for rapid detection and identification of bioagents |
US7217510B2 (en) | 2001-06-26 | 2007-05-15 | Isis Pharmaceuticals, Inc. | Methods for providing bacterial bioagent characterizing information |
US8073627B2 (en) | 2001-06-26 | 2011-12-06 | Ibis Biosciences, Inc. | System for indentification of pathogens |
US7192751B2 (en) | 2001-12-06 | 2007-03-20 | The Regents Of The University Of California | Biosynthesis of amorpha-4,11-diene |
US7172886B2 (en) * | 2001-12-06 | 2007-02-06 | The Regents Of The University Of California | Biosynthesis of isopentenyl pyrophosphate |
CA2508726A1 (en) | 2002-12-06 | 2004-07-22 | Isis Pharmaceuticals, Inc. | Methods for rapid identification of pathogens in humans and animals |
NZ561169A (en) * | 2003-01-21 | 2008-06-30 | Thallion Pharmaceuticals Inc | Farnesyl dibenzodiazepinones, processes for their production and their use as pharmaceuticals |
US8057993B2 (en) | 2003-04-26 | 2011-11-15 | Ibis Biosciences, Inc. | Methods for identification of coronaviruses |
US8158354B2 (en) | 2003-05-13 | 2012-04-17 | Ibis Biosciences, Inc. | Methods for rapid purification of nucleic acids for subsequent analysis by mass spectrometry by solution capture |
US7964343B2 (en) | 2003-05-13 | 2011-06-21 | Ibis Biosciences, Inc. | Method for rapid purification of nucleic acids for subsequent analysis by mass spectrometry by solution capture |
ATE426662T1 (de) | 2003-06-12 | 2009-04-15 | Dsm Ip Assets Bv | Feedback resistante mevalonate kinase |
EP1641931B1 (en) * | 2003-07-08 | 2008-11-19 | DSM IP Assets B.V. | Improved production of coenzyme q-10 |
US8546082B2 (en) | 2003-09-11 | 2013-10-01 | Ibis Biosciences, Inc. | Methods for identification of sepsis-causing bacteria |
US20120122102A1 (en) | 2003-09-11 | 2012-05-17 | Rangarajan Sampath | Compositions for use in identification of bacteria |
US8097416B2 (en) | 2003-09-11 | 2012-01-17 | Ibis Biosciences, Inc. | Methods for identification of sepsis-causing bacteria |
US7927794B2 (en) * | 2003-09-29 | 2011-04-19 | The Regents Of The University Of California | Methods for identifying a biosynthetic pathway gene product |
US7666592B2 (en) | 2004-02-18 | 2010-02-23 | Ibis Biosciences, Inc. | Methods for concurrent identification and quantification of an unknown bioagent |
MXPA06013502A (es) * | 2004-05-21 | 2007-03-01 | Univ California | Metodo para mejorar la produccion de compuestos isoprenoides. |
US7714275B2 (en) | 2004-05-24 | 2010-05-11 | Ibis Biosciences, Inc. | Mass spectrometry with selective ion filtration by digital thresholding |
US20050266411A1 (en) | 2004-05-25 | 2005-12-01 | Hofstadler Steven A | Methods for rapid forensic analysis of mitochondrial DNA |
US7811753B2 (en) | 2004-07-14 | 2010-10-12 | Ibis Biosciences, Inc. | Methods for repairing degraded DNA |
CN101044243B (zh) * | 2004-08-19 | 2011-12-28 | 帝斯曼知识产权资产管理有限公司 | 类异戊二烯的生产方法 |
WO2006135400A2 (en) | 2004-08-24 | 2006-12-21 | Isis Pharmaceuticals, Inc. | Methods for rapid identification of recombinant organisms |
JP4841562B2 (ja) * | 2004-12-14 | 2011-12-21 | ディーエスエム アイピー アセッツ ビー.ブイ. | 改良型メバロネートキナーゼ |
CA2597499A1 (en) | 2005-02-11 | 2006-08-17 | Dsm Ip Assets B.V. | Recombinant microorganisms in fermentative production of vitamin c and a process thereof |
EP1869180B1 (en) | 2005-03-03 | 2013-02-20 | Ibis Biosciences, Inc. | Compositions for use in identification of polyoma viruses |
US8084207B2 (en) | 2005-03-03 | 2011-12-27 | Ibis Bioscience, Inc. | Compositions for use in identification of papillomavirus |
EP2371967B1 (en) | 2005-03-18 | 2015-06-03 | DSM IP Assets B.V. | Production of carotenoids in oleaginous yeast and fungi |
JP2006280297A (ja) * | 2005-04-01 | 2006-10-19 | Tosoh Corp | ゲラニルゲラニル2リン酸合成酵素及びその遺伝子等 |
JP2009502137A (ja) | 2005-07-21 | 2009-01-29 | アイシス ファーマシューティカルズ インコーポレイティッド | 核酸変種の迅速な同定および定量のための方法 |
US20080274520A1 (en) | 2005-09-08 | 2008-11-06 | Bastien Chevreux | Novel Gene Sms 37 |
JP5023474B2 (ja) * | 2005-10-28 | 2012-09-12 | 東ソー株式会社 | カロテノイド合成微生物の作製方法およびカロテノイドの製造方法 |
CA2627134A1 (en) | 2005-10-28 | 2007-05-03 | Tosoh Corporation | Method of preparing carotenoid synthesizing microorganism and method of producing carotenoids |
JP2007151475A (ja) * | 2005-12-06 | 2007-06-21 | Tosoh Corp | 新規微生物およびそれを用いたゼアキサンチンの製造方法 |
JP4887764B2 (ja) * | 2005-12-06 | 2012-02-29 | 東ソー株式会社 | 新規微生物およびそれを用いたリコペンの製造法 |
DE102006001868B4 (de) * | 2006-01-13 | 2012-03-01 | Austriamicrosystems Ag | Schaltungsanordnung und Verfahren zur Ansteuerung einer elektrischen Last und eine Energieversorgungseinrichtung |
US8114645B2 (en) * | 2006-05-19 | 2012-02-14 | The Regents Of The University Of California | Methods for increasing isoprenoid and isoprenoid precursor production by modulating fatty acid levels |
CN101484584B (zh) * | 2006-05-26 | 2013-03-27 | 阿米瑞斯公司 | 类异戊二烯的生产 |
AU2012202630B2 (en) * | 2006-05-26 | 2014-01-16 | Amyris, Inc. | Production of isoprenoids |
DK2024504T4 (da) * | 2006-05-26 | 2023-02-27 | Amyris Inc | Fremstilling af isoprenoider |
KR101420889B1 (ko) * | 2006-05-26 | 2014-07-17 | 아미리스 인코퍼레이티드 | 생물 유기 화합물을 제조하기 위한 장치 |
WO2008008256A2 (en) * | 2006-07-07 | 2008-01-17 | The Regents Of The University Of California | Methods for enhancing production of isoprenoid compounds by host cells |
US9149473B2 (en) | 2006-09-14 | 2015-10-06 | Ibis Biosciences, Inc. | Targeted whole genome amplification method for identification of pathogens |
US8691555B2 (en) | 2006-09-28 | 2014-04-08 | Dsm Ip Assests B.V. | Production of carotenoids in oleaginous yeast and fungi |
WO2008104002A2 (en) | 2007-02-23 | 2008-08-28 | Ibis Biosciences, Inc. | Methods for rapid forensic dna analysis |
US7531980B2 (en) * | 2007-03-02 | 2009-05-12 | Honeywell International Inc. | Aircraft cabin pressure controls: duty cycle offset to compensate for asymmetric motor loading in an open-loop motor control system |
US9598724B2 (en) | 2007-06-01 | 2017-03-21 | Ibis Biosciences, Inc. | Methods and compositions for multiple displacement amplification of nucleic acids |
JP2009000046A (ja) * | 2007-06-21 | 2009-01-08 | Hitachi Zosen Corp | トチュウのメバロン酸経路の酵素をコードする遺伝子 |
WO2009005704A1 (en) * | 2007-07-03 | 2009-01-08 | The Regents Of The University Of California | Methods of increasing isoprenoid or isoprenoid precursor production |
CN102027124B (zh) | 2007-12-13 | 2015-11-25 | 丹尼斯科美国公司 | 用于生产异戊二烯的组合物和方法 |
ES2330602B1 (es) * | 2008-03-19 | 2010-09-30 | Vitatene, S.A | Metodo de produccion de fitoeno y/o fitoflueno, o mezclas de carotenoides con alto contenido en los mismos. |
EP2279251A2 (en) * | 2008-04-23 | 2011-02-02 | Danisco US Inc. | Isoprene synthase variants for improved microbial production of isoprene |
CN102083990B (zh) | 2008-07-04 | 2016-05-04 | 财富科学家股份有限公司 | 通过3-羟基烷酸的酶促脱羧制备烯 |
US9556456B2 (en) * | 2008-09-09 | 2017-01-31 | Battelle Memorial Institute | Production of bio-based materials using photobioreactors with binary cultures |
WO2010033625A1 (en) | 2008-09-16 | 2010-03-25 | Ibis Biosciences, Inc. | Microplate handling systems and related computer program products and methods |
US8550694B2 (en) | 2008-09-16 | 2013-10-08 | Ibis Biosciences, Inc. | Mixing cartridges, mixing stations, and related kits, systems, and methods |
WO2010033627A2 (en) | 2008-09-16 | 2010-03-25 | Ibis Biosciences, Inc. | Sample processing units, systems, and related methods |
EP2396803A4 (en) | 2009-02-12 | 2016-10-26 | Ibis Biosciences Inc | IONIZATION PROBE ASSEMBLIES |
US8518686B2 (en) | 2009-04-23 | 2013-08-27 | Danisco Us Inc. | Three-dimensional structure of isoprene synthase and its use thereof for generating variants |
US8950604B2 (en) | 2009-07-17 | 2015-02-10 | Ibis Biosciences, Inc. | Lift and mount apparatus |
WO2011008972A1 (en) | 2009-07-17 | 2011-01-20 | Ibis Biosciences, Inc. | Systems for bioagent identification |
US8034603B2 (en) * | 2009-09-15 | 2011-10-11 | Andrew Ball | Nucleic acid molecule |
ES2628739T3 (es) | 2009-10-15 | 2017-08-03 | Ibis Biosciences, Inc. | Amplificación por desplazamiento múltiple |
EP2336310A1 (en) | 2009-12-16 | 2011-06-22 | Isobionics B.V. | Valencene synthase |
DK2516656T3 (da) * | 2009-12-22 | 2014-07-21 | Global Bioenergies | Fremgangsmåde til fremstilling af isoprenol ud fra mevalonat under anvendelse af en diphosphomevalonatdecarboxylase |
BR112012030836B8 (pt) | 2010-06-02 | 2024-02-06 | Evolva Nutrition Inc | Hospedeiro recombinante que compreende genes recombinantes para produção de esteviol ou glicosídeo de esteviol, método para produzir esteviol, glicosídeo de esteviol ou composição de glicosídeo de esteviol e método para sintetizar esteviol ou glicosídeo de esteviol |
CA2813868A1 (en) | 2010-10-19 | 2012-04-26 | Global Bioenergies | Production of alkenes by combined enzymatic conversion of 3-hydroxyalkanoic acids |
CN103443271A (zh) | 2010-10-27 | 2013-12-11 | 丹尼斯科美国公司 | 用于增加异戊二烯产量的异戊二烯合酶变体 |
WO2013022989A2 (en) | 2011-08-08 | 2013-02-14 | Evolva Sa | Recombinant production of steviol glycosides |
US9163263B2 (en) | 2012-05-02 | 2015-10-20 | The Goodyear Tire & Rubber Company | Identification of isoprene synthase variants with improved properties for the production of isoprene |
US20130323820A1 (en) * | 2012-06-01 | 2013-12-05 | Lanzatech New Zealand Limited | Recombinant microorganisms and uses therefor |
WO2014052054A1 (en) * | 2012-09-25 | 2014-04-03 | Albert Einstein College Of Medicine Of Yeshiva University | Enzymatic platform for the synthesis of isoprenoid precursors and uses thereof |
US20150315599A1 (en) * | 2012-12-07 | 2015-11-05 | Ginkgo Bioworks, Inc | Methods and Systems for Methylotrophic Production of Organic Compounds |
EP2935571B1 (en) * | 2012-12-20 | 2018-03-07 | DSM IP Assets B.V. | Acetyl transferases and their use for producing carotenoids |
MY190346A (en) | 2013-02-06 | 2022-04-15 | Evolva Sa | Methods for improved production of rebaudioside d and rebaudioside m |
BR112015019160A2 (pt) | 2013-02-11 | 2017-08-22 | Dalgaard Mikkelsen Michael | Produção de glicosídeos de esteviol em hospedeiros recombinantes |
EP2984162B1 (en) * | 2013-03-15 | 2019-10-23 | DSM IP Assets B.V. | Use of thermophilic nucleases for degrading nucleic acids |
JP6282813B2 (ja) | 2013-07-16 | 2018-02-21 | 住友ゴム工業株式会社 | ヒドロキシメチルグルタリルCoAレダクターゼの発現をbZIP型転写因子により調整する方法、bZIP型転写因子をコードする遺伝子が導入されたイソプレノイド産生植物、及び該イソプレノイド産生植物を用いたポリイソプレノイドの製造方法 |
WO2016008885A1 (en) * | 2014-07-14 | 2016-01-21 | Photanol B.V. | Biosynthesis of sesquiterpenes in cyanobacteria |
SG10201901007PA (en) | 2014-08-11 | 2019-03-28 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
WO2016038095A2 (en) | 2014-09-09 | 2016-03-17 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
CN108337892B (zh) | 2015-01-30 | 2022-06-24 | 埃沃尔瓦公司 | 在重组宿主中生产甜菊醇糖苷 |
EP3862426A3 (en) | 2015-03-16 | 2021-11-17 | DSM IP Assets B.V. | Udp-glycosyltransferases |
US10837041B2 (en) | 2015-08-07 | 2020-11-17 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
US20170145441A1 (en) * | 2015-08-17 | 2017-05-25 | INVISTA North America S.à.r.l. | Methods, hosts, and reagents related thereto for production of unsaturated pentahydrocarbons, derivatives and intermediates thereof |
US11326173B2 (en) * | 2015-08-28 | 2022-05-10 | Phytowelt Greentechnologies Gmbh | Method of fermentative alpha-ionone production |
JP6357186B2 (ja) * | 2016-03-31 | 2018-07-11 | Jxtgエネルギー株式会社 | カロテノイドの製造方法 |
CN109195457A (zh) | 2016-04-13 | 2019-01-11 | 埃沃尔瓦公司 | 在重组宿主中产生甜菊醇糖苷 |
US10815514B2 (en) | 2016-05-16 | 2020-10-27 | Evolva Sa | Production of steviol glycosides in recombinant hosts |
CN110100006A (zh) | 2016-11-07 | 2019-08-06 | 埃沃尔瓦公司 | 重组宿主中甜菊糖苷的生产 |
WO2019006255A1 (en) | 2017-06-30 | 2019-01-03 | Invista North America S.A.R.L. | METHODS, MATERIALS, SYNTHETIC HOSTS AND REAGENTS FOR HYDROCARBON BIOSYNTHESIS AND DERIVATIVES |
US11162115B2 (en) | 2017-06-30 | 2021-11-02 | Inv Nylon Chemicals Americas, Llc | Methods, synthetic hosts and reagents for the biosynthesis of hydrocarbons |
US11505809B2 (en) | 2017-09-28 | 2022-11-22 | Inv Nylon Chemicals Americas Llc | Organisms and biosynthetic processes for hydrocarbon synthesis |
CN108285902A (zh) * | 2017-11-03 | 2018-07-17 | 杭州爱蔻思生物科技有限公司 | 生产高价值天然产物的工程菌的构造方法 |
EP3720944A1 (en) | 2017-12-07 | 2020-10-14 | Zymergen Inc. | Engineered biosynthetic pathways for production of (6e)-8-hydroxygeraniol by fermentation |
CN111868047A (zh) | 2017-12-21 | 2020-10-30 | 齐默尔根公司 | 荆芥内半缩醛氧化还原酶、荆芥内半缩醛合酶和能够产生荆芥内酯的微生物 |
JP6810096B2 (ja) * | 2018-05-09 | 2021-01-06 | Eneos株式会社 | カロテノイドの製造方法 |
CN109666683B (zh) * | 2019-02-27 | 2021-10-29 | 昆明理工大学 | 乙酰辅酶A乙酰转移酶基因RKAcaT2及其应用 |
CN109880745A (zh) * | 2019-03-15 | 2019-06-14 | 江苏大学 | 一种利用腌制废水、晒盐卤水分段培养盐藻的方法 |
CN109777815B (zh) * | 2019-03-28 | 2021-10-29 | 昆明理工大学 | HMG-CoA合成酶基因RKHMGCS及其应用 |
CN117965414A (zh) * | 2024-04-01 | 2024-05-03 | 北京微构工场生物技术有限公司 | 一种重组盐单胞菌及其在生产异戊二烯中的应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3891504A (en) | 1970-07-31 | 1975-06-24 | Hoffmann La Roche | Process for the manufacture of zeaxanthin |
EP0747483A2 (en) * | 1995-06-09 | 1996-12-11 | F. Hoffmann-La Roche Ag | Fermentative carotenoid production |
WO2000001650A1 (en) * | 1998-07-06 | 2000-01-13 | Dcv, Inc. Doing Business As Bio-Technical Resources | Method of vitamin production |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5015580A (en) * | 1987-07-29 | 1991-05-14 | Agracetus | Particle-mediated transformation of soybean plants and lines |
US5328845A (en) * | 1992-03-27 | 1994-07-12 | Universal Foods Corporation | Fungal negative microorganism capable of producing high levels of beta-carotene |
US5466599A (en) * | 1993-04-19 | 1995-11-14 | Universal Foods Corporation | Astaxanthin over-producing strains of phaffia rhodozyma |
US5985623A (en) * | 1995-01-24 | 1999-11-16 | Shin-Etsu Bio, Inc. | DNA segments and methods for increasing polysaccharide production |
ATE242812T1 (de) | 1996-12-02 | 2003-06-15 | Hoffmann La Roche | Verbesserte fermentative herstellung von carotenoide |
US5935808A (en) * | 1997-07-29 | 1999-08-10 | Yissum Research And Development Company Of The Hebrew University Of Jerusalem | Carotenoid-producing bacterial species and process for production of carotenoids using same |
US6208893B1 (en) * | 1998-01-27 | 2001-03-27 | Genetronics, Inc. | Electroporation apparatus with connective electrode template |
CA2736981A1 (en) * | 1998-04-14 | 1999-10-21 | Kyowa Hakko Bio Co., Ltd. | Process for producing isoprenoid compounds by microorganisms |
JP2002519417A (ja) | 1998-07-06 | 2002-07-02 | イーストマン ケミカル カンパニー | ビタミンeの製造方法 |
ES2156735B1 (es) | 1999-06-09 | 2002-02-16 | Antibioticos Sau | Procedimiento de produccion de licopeno. |
US6133785A (en) | 1999-06-30 | 2000-10-17 | Harris Corporation | False carrier lock receiver and associated methods for detection |
-
2002
- 2002-06-05 EP EP02745362A patent/EP1392824B1/en not_active Expired - Lifetime
- 2002-06-05 US US10/166,225 patent/US6989257B2/en not_active Expired - Lifetime
- 2002-06-05 CN CNA028113802A patent/CN1630718A/zh active Pending
- 2002-06-05 DE DE60228439T patent/DE60228439D1/de not_active Expired - Lifetime
- 2002-06-05 WO PCT/EP2002/006171 patent/WO2002099095A2/en active IP Right Grant
- 2002-06-05 AT AT02745362T patent/ATE405638T1/de not_active IP Right Cessation
- 2002-06-05 AU AU2002316966A patent/AU2002316966B2/en not_active Ceased
- 2002-06-05 JP JP2003502205A patent/JP4280627B2/ja not_active Expired - Fee Related
- 2002-06-05 ES ES02745362T patent/ES2311613T3/es not_active Expired - Lifetime
- 2002-06-05 CA CA002449885A patent/CA2449885A1/en not_active Abandoned
- 2002-06-05 KR KR1020037015938A patent/KR100704072B1/ko not_active IP Right Cessation
-
2005
- 2005-05-13 US US11/129,143 patent/US7232679B2/en not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3891504A (en) | 1970-07-31 | 1975-06-24 | Hoffmann La Roche | Process for the manufacture of zeaxanthin |
EP0747483A2 (en) * | 1995-06-09 | 1996-12-11 | F. Hoffmann-La Roche Ag | Fermentative carotenoid production |
WO2000001650A1 (en) * | 1998-07-06 | 2000-01-13 | Dcv, Inc. Doing Business As Bio-Technical Resources | Method of vitamin production |
Also Published As
Publication number | Publication date |
---|---|
EP1392824A2 (en) | 2004-03-03 |
CA2449885A1 (en) | 2002-12-12 |
KR20040010683A (ko) | 2004-01-31 |
WO2002099095A2 (en) | 2002-12-12 |
EP1392824B1 (en) | 2008-08-20 |
JP4280627B2 (ja) | 2009-06-17 |
JP2004527265A (ja) | 2004-09-09 |
US6989257B2 (en) | 2006-01-24 |
US7232679B2 (en) | 2007-06-19 |
US20030148416A1 (en) | 2003-08-07 |
CN1630718A (zh) | 2005-06-22 |
AU2002316966B2 (en) | 2007-05-17 |
ATE405638T1 (de) | 2008-09-15 |
ES2311613T3 (es) | 2009-02-16 |
WO2002099095A3 (en) | 2003-12-18 |
US20050266518A1 (en) | 2005-12-01 |
DE60228439D1 (de) | 2008-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100704072B1 (ko) | 개선된 이소프레노이드 제조 방법 | |
AU2002316966A1 (en) | Improved isoprenoid production | |
EP1383864B1 (en) | Isoprenoid production | |
US7572609B2 (en) | Production of isoprenoids | |
Okada et al. | Molecular cloning and mutational analysis of the ddsA gene encoding decaprenyl diphosphate synthase from Gluconobacter suboxydans | |
KR20150036502A (ko) | 바이오리파이너리 시스템, 이의 방법 및 조성물 | |
US20080131943A1 (en) | Polynucleotides for production of farnesyl dibenzodiazepinones | |
KR20150125653A (ko) | 아이소프렌의 생물학적 생성을 위한 조성물 및 방법 | |
CN107075464A (zh) | 从乙酰‑coa产生烯烃的重组微生物 | |
Wang et al. | Cloning and characterization of the gene encoding 1-cyclohexenylcarbonyl coenzyme A reductase from Streptomyces collinus | |
JP4528297B2 (ja) | コエンザイムq−10の向上した産生 | |
US9005939B2 (en) | Protoilludene synthase | |
JP2005511034A (ja) | 非対称なカロテノイド類の産生方法 | |
US7435571B2 (en) | Microbial production of COQ10 | |
Yang et al. | Cloning of four genes involved in limonene hydroxylation from Enterobacter cowanii 6L | |
US7297524B2 (en) | Polynucleotides for production of farnesyl dibenzodiazepinones | |
Takaichi et al. | Structural and functional analysis of a lycopene β-monocyclase gene isolated from a unique marine bacterium that produces... | |
JP2001245662A (ja) | 多環芳香族分解経路上流に関与する遺伝子群およびタンパク質群 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
E902 | Notification of reason for refusal | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |