KR20140091742A - 발효법에 의한 목적 물질의 제조법 - Google Patents
발효법에 의한 목적 물질의 제조법 Download PDFInfo
- Publication number
- KR20140091742A KR20140091742A KR1020147015776A KR20147015776A KR20140091742A KR 20140091742 A KR20140091742 A KR 20140091742A KR 1020147015776 A KR1020147015776 A KR 1020147015776A KR 20147015776 A KR20147015776 A KR 20147015776A KR 20140091742 A KR20140091742 A KR 20140091742A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- gly
- leu
- val
- arg
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/14—Glutamic acid; Glutamine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/001—Amines; Imines
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/10—Citrulline; Arginine; Ornithine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/24—Proline; Hydroxyproline; Histidine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
- C12P7/50—Polycarboxylic acids having keto groups, e.g. 2-ketoglutaric acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/58—Aldonic, ketoaldonic or saccharic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01113—L-Xylose 1-dehydrogenase (1.1.1.113)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01026—2,5-Dioxovalerate dehydrogenase (1.2.1.26)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/05—Oxidoreductases acting on the CH-CH group of donors (1.3) with a quinone or related compound as acceptor (1.3.5)
- C12Y103/05001—Succinate dehydrogenase (ubiquinone) (1.3.5.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01068—Xylono-1,4-lactonase (3.1.1.68)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/01082—Xylonate dehydratase (4.2.1.82)
Abstract
목적 물질인 2-케토글루타르산 또는 이의 유도체를 생산하는 능력을 갖고, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여 목적 물질을 당해 배지 중에 생성 축적시키고, 당해 배지로부터 목적 물질을 채취함으로써 목적 물질을 제조한다.
Description
본 발명은, 미생물을 사용한 발효법에 의한 L-아미노산 등의 목적 물질의 제조법에 관한 것으로서, 상세하게는 크실로스를 원료로 하여 발효법에 의해 목적 물질을 제조하는 방법에 관한 것이다.
세균을 사용한 발효법에 의해 L-아미노산 등의 목적 물질을 제조하기 위해서는, 야생형 세균(야생주)을 사용하는 방법, 야생주로부터 유도된 영양 요구주를 사용하는 방법, 야생주로부터 여러가지 약제 내성 변이주로서 유도된 대사 조절 변이주를 사용하는 방법, 영양 요구주와 대사 조절 변이주의 양쪽의 성질을 가진 주를 사용하는 방법 등이 있다.
예를 들면, L-글루탐산은 주로 브레비박테리움속, 코리네박테리움속, 마이크로박테리움속에 속하는 소위 코리네형 세균의 L-글루탐산 생산균 또는 이들 변이주를 사용한 발효법에 의해 제조되고 있다(예를 들면, 비특허문헌 1참조). 그 밖의 균주를 사용한 발효법에 의한 L-글루탐산의 제조법으로서는, 바실루스속, 스트렙토마이세스속, 페니실리움속 등의 미생물을 사용하는 방법(예를 들면, 특허문헌 1 참조), 슈도모나스속, 아스로박터속, 세라티아속, 칸디다속 등의 미생물을 사용하는 방법(예를 들면, 특허문헌 2 참조), 바실루스속, 아에로박터·아에로게네스(현 엔테로박터·아에로게네스) 등의 미생물을 사용하는 방법(예를 들면, 특허문헌 3 참조), 에스케리키아·콜라이의 변이주를 사용하는 방법(예를 들면, 특허문헌 4 참조) 등이 알려져 있다. 또한, 클렙시엘라속, 에르위니아속 또는 판토에아속, 엔테로박터속에 속하는 미생물을 사용한 L-글루탐산의 제조법도 개시되어 있다(예를 들면, 특허문헌 5 내지 7 참조).
최근, 목적 물질의 발효 생산에 재조합 DNA 기술을 이용하는 것이 실시되고 있다. 예를 들면, L-아미노산 생합성계 효소를 코드화하는 유전자의 발현을 증강하고(특허문헌 8, 특허문헌 9), 또는 L-아미노산 생합성계로의 탄소원의 유입을 증강함(특허문헌 10)으로써 세균의 L-아미노산 생산성을 향상시키는 것이 실시되고 있다.
종래, 발효법에 의한 물질의 공업 생산에 있어서는, 탄소원으로서 당류, 즉, 글루코스, 프룩토스, 슈크로스, 폐당밀(blackstrap molasses), 전분 가수분해물 등이 사용되었지만, 다소 고가라서 최근에는 식물 유래의 바이오매스 원료 등의 사용도 진행되고 있다.
이러한 바이오매스 원료로서 현재는 스타치(starch), 유지 등의 가식부(可食部) 원료의 사용이 주이지만, 장래적으로는 비가식부 원료, 구체적으로는 셀룰로스·헤미셀룰로스, 리그닌 등으로의 이행이 필요하다. 비가식부 바이오매스의 셀룰로스·헤미셀룰로스는 열이나 산 등을 사용하는 전(前)처리 행정, 셀룰라제 효소에 의한 당화 처리 행정 등을 거쳐 5탄당, 6탄당의 당으로 변환되어 발효의 원료로서 사용할 수 있다(특허문헌 11, 12). 이러한 5탄당, 6탄당의 혼합당을 아미노산 발효 등의 원료로 한 경우, 에스케리키아·콜라이는 글루코스를 우선적으로 자화(資化)하는 것이 알려져 있고, 결과적으로, 2단계 증식(디옥시)을 나타내거나 생육이 지연되는 현상이 확인되고 있다(비특허문헌 2, 3).
에스케리키아·콜라이에 있어서는, xylA 유전자가 코드화하는 크실로스이소머라제, xylB 유전자가 코드화하는 크실룰로키나제에 의한 크실로스 자화 경로가 알려져 있고, 에스케리키아·콜라이, 코리네박테리움·글루타미쿰에 도입하여, 크실로스로부터 L-아미노산을 생산할 수 있는 것이 알려져 있다(비특허문헌 5, 특허문헌 13, 비특허문헌 7).
한편, 이러한 종래 알려져 있는 경로를 경유하지 않고 크실로스로부터 크실론산을 경유하여, 2-케토글루타르산에 5단계로 이르는 경로가 카울로박터·크레센투스(Caulobacter crescentus)나 할로페락스·볼카니(Haloferax volcanii)에 존재하는 것이 보고되어 있다(비특허문헌 6). 또한, 당해 경로를 에스케리키아·콜라이로 발현시킨 예가 알려져 있다(비특허문헌 8, 특허문헌 14).
비특허문헌 1: 아카시 쿠니히코 등 저서, 아미노산 발효, 학회출판센터, 195-215페이지, 1986년
비특허문헌 2: Nichols N.N. et al., Appl. Microbiol. Biotechnol. 2001 Jul; 56(1-2): 120-125
비특허문헌 3: Gonzalez, R., Biotechnol. Prog. 2002 Jan-Feb; 18(1): 6-20
비특허문헌 4: Song S. et al., J. Bacteriol. 1997 Nov; 179(22): 7025-7032
비특허문헌 5: Tao H., et al., J. Bacteriol. 2001 May; 183(10): 2979-2988
비특허문헌 6: Stephens, C. et al., J. Bacteriol.2007 Mar; 189(5): 2181-2185
비특허문헌 7: Gopinath, V. et al., Appl. Microbiol. Biotechnol. 2011 Jul 28
비특허문헌 8: Huaiwei, L et al., Bioresour Technol. 2011 Aug 22
본 발명은, 크실로스를 함유하는 배지에서 효율적으로 L-글루탐산 등의 목적 물질을 생산할 수 있는 미생물, 및 이를 사용한 목적 물질의 제조법을 제공하는 것을 목적으로 한다.
본 발명자들은, 5탄당, 6탄당 자화능을 갖는 아미노산 생산균의 육종 개발을 목적으로 하고, 크실로스로부터 크실론산을 경유하여, 2-케토글루타르산에 이르는 경로를 이용하여, 미생물의 육종 개발에 대하여 검토하였다. 그 결과, 본 경로를 발현시킨 미생물이 효율적으로 크실로스를 자화할 수 있는 것을 찾아내어 본 발명을 완성하기에 이르렀다.
즉, 본 발명은 이하와 같다.
(1) 목적 물질을 생산하는 능력을 갖는 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여, 목적 물질을 당해 배지 중에 생성 축적시키고, 당해 배지로부터 목적 물질을 채취하는, 목적 물질의 제조 방법으로서,
상기 목적 물질은 2-케토글루타르산 또는 이의 유도체이고,
상기 세균은, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 것을 특징으로 하는, 방법.
(2) 상기 세균은, 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제를 각각 코드화하는 유전자가 발현 가능한 형태로 도입됨으로써, 이들 효소 활성이 부여 또는 증강된 것을 특징으로 하는, 상기 방법.
(3) 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제의 각각을 코드화하는 유전자가 카울로박터(Caulobacter)속, 에스케리키아(Escherichia)속, 아그로박테리움(Agrobacterium)속, 헤르바스피릴룸(Herbaspirillum)속, 악티노플라네스(Actinoplanes)속, 쿠프리아비두스(Cupriavidus)속, 슈도모나스(Pseudomonas)속, 조벨리아(Zobellia), 써모바실루스(Thermobacillus)속, 아스로박터(Arthrobacter)속, 아조스피릴리움(Azospirillum)속, 할로모나스(Halomonas)속, 바실루스(Bacillus)속, 또는 아스페르길루스(Aspergillus)속에 속하는 미생물 유래인, 상기 방법.
(4) 상기 세균은, 하기 중 어느 하나에 의해 크실로스로부터 크실론산을 생성할 수 있는 것을 특징으로 하는, 상기 방법:
(A) 크실로스데히드로게나제 활성, 또는 크실로스데히드로게나제 및 크실로노락토나제 활성을 부여 또는 증강시킴, 또는,
(B) 크실로스로부터 크실론산을 생성하는 반응을 촉매할 수 있는 글루코스데히드로게나제 활성을 가짐.
(5) 상기 글루코스데히드로게나제는 피롤로퀴놀린퀴논을 조효소로 하고, 또한, 상기 세균은, 피롤로퀴놀린퀴논 생산능을 갖거나, 또는 피롤로퀴놀린퀴논을 함유하는 배지에서 배양됨으로써 글루코스데히드로게나제 활성을 갖는, 상기 방법.
(6) 상기 세균은, 크실로스데히드로게나제, 또는 크실로스데히드로게나제 및 크실로노락토나제를 각각 코드화하는 유전자가 발현 가능한 형태로 도입됨으로써, 크실로스로부터 크실론산을 생성할 수 있는, 상기 방법.
(7) 상기 세균은, 2-케토글루타르산데히드로게나제의 활성이 저하되도록 추가로 개변(改變)된 것을 특징으로 하는, 상기 방법.
(8) 상기 세균은, 석신산데히드로게나제의 활성이 저하되도록 추가로 개변된 것을 특징으로 하는, 상기 방법.
(9) 상기 세균이 장내 세균 또는 코리네형(coryneform) 세균인 것을 특징으로 하는, 상기 방법.
(10) 상기 세균이 판토에아(Pantoea)속 세균인 것을 특징으로 하는, 상기 방법.
(11) 상기 세균이 판토에아·아나나티스(Pantoea ananatis)인 것을 특징으로 하는, 상기 방법.
(12) 상기 세균이 에스케리키아(Escherichia)속 세균인 것을 특징으로 하는, 상기 방법.
(13) 상기 세균이 에스케리키아·콜라이(Escherichia coli)인 것을 특징으로 하는, 상기 방법.
(14) 상기 세균이 코리네박테리움(Corynebacterium)속 세균인 것을 특징으로 하는, 상기 방법.
(15) 상기 세균이 코리네박테리움·글루타미쿰(Corynebacterium glutamicum)인 것을 특징으로 하는, 상기 방법.
(16) 상기 2-케토글루타르산 유도체가, L-글루탐산, L-글루타민, L-아르기닌, L-시트룰린, L-오르니틴, L-프롤린, 푸트레신, 및 γ-아미노부티르산으로 이루어지는 그룹으로부터 선택되는 물질인, 상기 방법.
도 1은, icd 유전자 결손주를 이용한 씨. 크레센투스(C. crescentus) 유래 NXA 오페론 발현주 생육 상보 시험의 결과를 도시한 도면이다. E1-αKG, M9-αKG, M9-Xyl, E1-Xyl은 각각 2-케토글루타르산 또는 크실로스를 단일 탄소원으로서 포함하는 M9 최소 배지 및 E1 합성 배지를 나타낸다.
도 2는, E.coli ccrNXA 오페론을 발현시키는 이. 콜라이(E. coli) L-글루탐산 생산균의 L-글루탐산 생산 배양 결과를 도시한 도면이다.
도 3은, 이. 콜라이(E. coli) 고유의 크실로스 자화 경로 결손주를 숙주로 한 ccrNXA 오페론 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다.
도 4는, 중카피(medium copy)형 벡터를 사용한 ccrNXA 오페론 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다.
도 5는, 각종 미생물 유래의 xylD 호모로그 유전자 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다. Atu, Hse, Amis, Aor은 각각 Agrobacterium tumefaciens, Herbaspirillum seropedicae, Actinoplanes missouriensis, Aspergillus oryzae를 나타낸다.
도 6은, 각종 미생물 유래의 xylX 호모로그 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다. Art, Atu, Cne, Zga, Tco, Selo는 각각 Arthrobacter globiformis, Agrobacterium tumefaciens, Cupriavidus necator, Zobellia galactanivorans, Thermobacillus composti, Pseudomonas elodea를 나타낸다.
도 7은, 각종 미생물 유래의 xylA 호모로그 발현주에 의한 L-글루탐산 생산 배양 결과를 도시한 도면이다. Hbo, Abr는 각각 Halomonas boliviensis, Azospirillum brasilense를 나타낸다.
도 2는, E.coli ccrNXA 오페론을 발현시키는 이. 콜라이(E. coli) L-글루탐산 생산균의 L-글루탐산 생산 배양 결과를 도시한 도면이다.
도 3은, 이. 콜라이(E. coli) 고유의 크실로스 자화 경로 결손주를 숙주로 한 ccrNXA 오페론 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다.
도 4는, 중카피(medium copy)형 벡터를 사용한 ccrNXA 오페론 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다.
도 5는, 각종 미생물 유래의 xylD 호모로그 유전자 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다. Atu, Hse, Amis, Aor은 각각 Agrobacterium tumefaciens, Herbaspirillum seropedicae, Actinoplanes missouriensis, Aspergillus oryzae를 나타낸다.
도 6은, 각종 미생물 유래의 xylX 호모로그 발현주에 의한 L-글루탐산 생산 배양의 결과를 도시한 도면이다. Art, Atu, Cne, Zga, Tco, Selo는 각각 Arthrobacter globiformis, Agrobacterium tumefaciens, Cupriavidus necator, Zobellia galactanivorans, Thermobacillus composti, Pseudomonas elodea를 나타낸다.
도 7은, 각종 미생물 유래의 xylA 호모로그 발현주에 의한 L-글루탐산 생산 배양 결과를 도시한 도면이다. Hbo, Abr는 각각 Halomonas boliviensis, Azospirillum brasilense를 나타낸다.
본 발명은, 목적 물질을 생산하는 능력을 갖는 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여 목적 물질을 당해 배지 중에 생성 축적시키고, 당해 배지로부터 목적 물질을 채취하는 목적 물질의 제조 방법으로서,
상기 목적 물질은 2-케토글루타르산 또는 이의 유도체이고,
상기 세균은, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트-2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 것을 특징으로 하는, 방법이다.
목적 물질은 2-케토글루타르산(α-케토글루타르산, αKG) 또는 이의 유도체이다. 2-케토글루타르산의 유도체로서는 L-글루탐산, L-글루타민, L-아르기닌, L-시트룰린, L-오르니틴, L-프롤린, 푸트레신, 및 γ-아미노부티르산이 열거된다.
「목적 물질 생산능」이란, 본 발명에 사용하는 세균을 배지에서 배양하였을 때에, 상기 목적 물질을 세포 또는 배지로부터 회수할 수 있는 정도로 생산하는 능력을 갖는 것을 말한다. 바람직하게는, 동일한 조건에서 배양된 야생주 또는 비개변주보다 다량의 목적 물질을 생산하는 능력을 갖는 것을 말한다. 세균은, 2종류 이상의 목적 물질의 생산능을 갖는 것이라도 좋다.
또한, 상기 목적 물질은, 프리체(free form) 및/또는 이의 염, 예를 들면 황산염, 염산염, 탄산염, 암모늄염, 나트륨염, 칼륨염을 포함한다.
<1> 본 발명의 세균
본 발명의 세균은, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 세균이다.
본 발명의 세균은, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성을 본래 갖지 않지만 이들 효소 활성이 부여된 세균이어도 좋고, 이들 효소 활성을 본래 갖고 있지만 이들 효소 활성이 증강된 세균이어도 좋다.
크실로스로부터 크실론산을 생성하는 능력은, 예를 들면,
1) 크실로스데히드로게나제 활성을 부여 또는 증강하는 것, 또는
2) 크실로스로부터 크실론산을 생성하는 반응을 촉매할 수 있는 글루코스데히드로게나제 활성을 갖는 것,
중 어느 하나 또는 양쪽에 의해 달성된다.
1)에 해당하는 미생물로서는 에스케리키아속 세균, 코리네형 세균이, 2)에 해당하는 미생물로서는 판토에아속 세균 등이 열거된다.
1)에 관해서는 크실로스데히드로게나제 활성에 추가하여 크실로노락토나제를 더욱 강화하여도 좋다.
각 속에 속하는 세균에 대해서는 후술한다.
크실로스로부터 생성되는 크실론산은 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제에 의해 2-케토글루타르산으로 변환된다. 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제에 의해, 2-케토글루타르산에 이르는 경로는 Weimberg pathway라고도 불리고 있다(J. Biol. Chem., 236: 629-636). 본 명세서에서는 Weimberg pathway, 및 Weimberg pathway에 추가하여, 크실로스데히드로게나제 및/또는 크실로노락토나제에 의해 크실로스로부터 크실론산에 이르는 경로를 포함하여, NXA(Novel Xylose Assimilation) 경로라고 기재하는 경우가 있다.
세균이 Weimberg pathway를 갖고 있는지, 또는 동일 경로가 도입되었는지의 여부는 세균 추출물의 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제의 효소 활성을 측정하거나, 또는 Weimberg pathway를 보지하지 않은 주에서는 축적되는 크실론산을 자화하고 있는 것을 확인함으로써 결정할 수 있다. 또한, 세균이 NXA 경로를 보지하는지, 또는 동일 경로가 도입되었는지의 여부는 상기 각 효소에 추가하여, 크실로스데히드로게나제, 및/또는 크실로노락토나제의 효소 활성을 측정함으로써 결정할 수 있다. 또한, 이러한 효소 활성은 크실로스로부터 생성되는 크실론산을 측정함으로써도 결정할 수 있다.
본 발명에 있어서, 크실로네이트데히드라타제(xylonate dehydratase)는 다음 반응을 가역적으로 촉매하는 효소이며(EC4.2.1.82), D-크실로-알도네이트 데히드라타제(D-xylo-aldonate dehydratase), D-크실로네이트 데히드라타제(D-xylonate dehydratase), 및 D-크실로네이트 히드로-리아제(D-xylonate hydro-lyase)라고도 불린다.
D-크실론산→2-데하이드로-3-데옥시-D-크실로네이트+H2O
크실로네이트데히드라타제 활성은, 예를 들면, D-크실론산 용액과 피검시료를 혼합하여 반응시킨 후, 1% 세미카르바지드 염산염(semicarbazide hydrochloride) 수용액과 1.5% 아세트산 나트륨 수용액으로 이루어지는 반응 정지 액을 가하여 반응을 정지시키고, 희석액 250nm에서의 흡수를 측정함으로써 측정할 수 있다(Dahms, A.S., et al., Methods Enzymol. 1982; 90 Pt E: 302-5).
본 발명에 있어서, 2-케토-3-데옥시크실로네이트데히드라타제(2-케토-3-데옥시-xylonate dehydratase)는 이하의 반응을 가역적으로 촉매하는 효소이다(EC4.2.1.-).
2-데하이드로-3-데옥시-D-크실로네이트 →
2-옥소글루타르산 세미알데히드 + H2O
2-케토-3-데옥시크실로네이트데히드라타제 활성은, 예를 들면, 기질인 2-케토-3-데옥시크실론산 용액과 피검시료를 혼합하여 반응시킨 후, 2-케토-3-데옥시크실론산의 감소를 측정함으로써 측정할 수 있다.
본 발명에 있어서, 2-케토글루타르산 세미알데히드데히드로게나제(2-케토glutaric semialdehyde dehydrogenase)는 이하의 반응을 가역적으로 촉매하는 산화환원 효소이다(EC1.2.1.26).
2-옥소글루타르산 세미알데히드+NAD(P)→2-옥소글루타르산+NAD(P)H
2-케토글루타르산 세미알데히드데히드로게나제 활성은, 예를 들면, NAD(P)의 환원을 측정함으로써 활성 측정이 가능하다. 예를 들면, 피로인산(pH8.5), NAD(P)와 피검시료의 혼합액에 2-케토글루타르산 세미알데히드를 가하여 340nm에서의 흡수를 측정함으로써 이 효소의 활성을 측정할 수 있다(Adams, E., et al,(1967) J. Biol. Chem. 242, 1802-1814).
크실로스데히드로게나제(D-크실로스-1-데히드로게나제, D-xylose 1-dehydrogenase)는 펜토스와 글루쿠론산의 상호 변환 효소의 하나이며, 다음 반응을 가역적으로 촉매하는 산화환원 효소이다(EC1.1.1.175).
D-크실로스+NAD(P)+→D-크실로노락톤+NAD(P)H+H+
D-크실로스-1-데히드로게나제 활성은, 예를 들면, 크실로스, 피검시료, 및 NAD(P)를 혼합하여 반응시켜 340nm에서의 흡수를 측정함으로써 측정할 수 있다(Stephens, C. et al., J. Bacteriol., 2007, 189(5): 181-2185).
또한, 카울로박터·크레센투스의 크실로스데히드로게나제는, D-크실로스→크실론산의 활성을 촉매하는 경우가 있다.
본 발명에 있어서, 크실로노락토나제(xylonolactonase)는 이하의 반응을 가역적으로 촉매하는 효소이다(EC3.1.1.68).
D-크실로노락톤→D-크실론산
크실로노락토나제 활성은, 예를 들면, 크실로노락톤과 피검시료를 혼합하여 반응시켜 잔존하는 크실로노락톤을 하이드록사메이트법에 의해 정량함으로써 측정할 수 있다(Appl. Microbiol. Biotechnol., 29: 375-379, 1988; Appl. Microbiol., Biotechnol., 27:333-336, 1988).
크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제의 각 효소를 코드화하는 유전자는 Weimberg pathway를 갖는 미생물이면 어느 것이어도 좋지만, 예를 들면, 카울로박터(Caulobacter)속, 에스케리키아(Escherichia)속, 아그로박테리움(Agrobacterium)속, 헤르바스피릴룸(Herbaspirillum)속, 악티노플라네스(Actinoplanes)속, 쿠프리아비두스(Cupriavidus)속, 슈도모나스(Pseudomonas)속, 조벨리아(Zobellia)속, 써모바실루스(Thermobacillus)속, 아스로박터(Arthrobacter)속, 아조스피릴리움(Azospirillum)속, 할로모나스(Halomonas)속, 바실루스(Bacillus)속 등에 속하는 세균, 또는 아스페르길루스(Aspergillus)속에 속하는 사상균 등의 미생물 유래의 유전자가 열거된다.
카울로박터속 세균으로서는 카울로박터·크레센투스가 열거된다.
카울로박터·크레센투스로서는 CB-15주, CB-13주가 알려져 있고, 각각 ATCC 19089, ATCC33532로서 아메리칸·타입·컬처·콜렉션(주소 P. O. Box 1549 Manassas, VA 20108, United States of America)에 보존되어 있다. 또한, NA-1000주(J. Bacteriol., 192: 3678-88(2010)), K31주도 사용하는 것이 가능하다.
카울로박터·크레센투스 CB15주, NA1000주, K31주의 게놈 서열은 각각 GenBank Accession Nos. AE005673, CP001340, CP000927로 등록되어 있다.
카울로박터·크레센투스 CB15주, NA1000주, 및 K31주 유래의 각 효소의 유전자는 GenBank에 하기의 Gene symbol로 등록되어 있다.
또한, 카울로박터·크레센투스 유래의 크실로스데히드로게나제 유전자, 및 2-케토글루타릭 세미알데히드데히드로게나제 유전자는 각각 ccrxylB, ccrxylA라고 기재하는 경우가 있다.
또한, NXA 경로(Novel Xylose Assimilation)의 효소로서는 카울로박터속 이외에, 예를 들면, 하이포크레아 제코리나(트리코더마 레쎄이)[Hypocrea jecorina(Trichoderma ressei)]의 크실로스 데히드로게나제(xylose dehydrogenase)(FEMS Microbiol Lett. 277, 249-254(2007)); 바실루스 서브틸리스(Bacillus subtilis)의 ycbD(2-케토글루타릭 세미알데히드 데히드로게나제(2-ketoglutaric Semialdehyde Dehydrogenase), III형); 슈도모나스 푸티다(Pseudomonas putida)의 2-케토글루타릭 세미알데히드 데히드로게나제(2-ketoglutaric Semialdehyde Dehydrogenase), II형), 아조스피릴룸 브라실렌세(Azospirillum brasilense)의 2-케토글루타릭 세미알데히드 데히드로게나제(2-ketoglutaric Semialdehyde Dehydrogenase), I형, II형, III형(이상, J. Bac. Chem., 282, 6685-6695, 2007), 및 이들 호모로그가 열거된다.
특히, 크실로네이트데히드라타제에 관해서는 에스케리키아속 세균, 예를 들면, 에스케리키아·콜라이의 yjhG 유전자, yagF 유전자를 사용하여도 좋다. 에스케리키아·콜라이의 yjhG 유전자는 서열번호 34에, yagF 유전자는 서열번호 36에 나타낸다. 또한, 크실로네이트데히드라타제에 관해서는 아그로박테리움속, 헤르바스피릴룸속, 악티노플라네스속, 아스페르길루스속에 속하는 미생물, 예를 들면, 아그로박테리움 투메파시엔스(Arobacterium tumefaciens), 헤르바스피릴룸 세로페디카에(Herbaspirillum seropedicae), 악티로플라네스 미쏘우리엔시스(Actinoplanes missouriensis), 아스페르길루스 오리자에(Aspergillus oryzae)의 xylD 유전자 호모로그를 사용하여도 좋다.
또한, 2-케토-3-데옥시크실로네이트데히드라타제에 관해서는 아그로박테리움속, 슈도모나스속, 조벨리아속, 써모바실루스속, 아스로박터속에 속하는 세균, 예를 들면, 아그로박테리움 투메파시엔스 A(Agrobacterium tumefaciensA), 쿠프리아비두스 네카토르(Cupriavidus necator), 슈도모나스 엘로데아(Pseudomonas elodea), 조벨리아 갈락타니보란스(Zobellia galactanivorans), 써모바실루스 콤포스티(Thermobacillus composti), 아스로박터 글로비포르미스(Arthrobacter globiformis)의 xylX 유전자 호모로그를 사용하여도 좋다.
또한, 2-케토글루타릭 세미알데히드데히드로게나제에 관해서는 아조스피릴리움속, 할로모나스속, 바실루스속에 속하는 세균의 유전자, 예를 들면, 아조스피릴룸 브라실렌세(Azospirillum brasilense), 할로모나스 볼리비엔시스(Halomonas boliviensis)의 xylA 유전자 호모로그, 또는 바실루스 서브틸리스(Bacillus subtilis)의 ycbD를 사용하여도 좋다.
상기의 각 유전자의 염기서열 및 이들이 코드화하는 아미노산 서열은 표 11에 기재한다.
후술하는 바와 같이, 카울로박터·크레센투스에서는 NXA 경로의 5개 효소의 유전자는 오페론 구조를 갖는다. 이 오페론의 염기서열은 GenBank에 AAK22808_Caulobacter_crescentus의 accession No.로 등록되어 있다. 서열번호 23에 이 오페론의 염기서열을 나타낸다. 이 오페론에 의해 코드화되는 2-케토-3-데옥시크실로네이트데히드라타제, 2-케토글루타릭 세미알데히드데히드로게나제, 크실로스데히드로게나제, 및 크실로노락토나제의 아미노산 서열을 각각 서열번호 24 내지 27에 나타낸다. 또한, 이 오페론 중의 xylD 유전자 염기서열 및 이에 의해 코드화되는 크실로네이트데히드라타제의 아미노산 서열을 각각 서열번호 28 및 29에 나타낸다. 서열번호 28의 염기서열은 서열번호 23의 5509 내지 7296 위치에 상당한다.
또한, xylX의 개시 코돈으로서 2개소(箇所)가 제안되어 있지만, 서열번호 23에서는 1175 내지 1177 위치를 개시 코돈으로서 기재하였다. xylD의 개시 코돈도 2개소가 제안되어 있고, 서열번호 28의 1 내지 3 위치, 또는 13 내지 15 위치를 개시 코돈으로서 사용하여도 좋다. 13 내지 15 위치가 개시 코돈인 경우에는 서열번호 29의 크실로네이트데히드라타제의 아미노산 서열은 5 위치의 Leu으로부터 시작된다.
글루코스데히드로게나제는 본래 이하의 반응을 가역적으로 촉매하는 효소이지만(EC1.1.1.119), 「크실로스로부터 크실론산을 생성하는 반응을 촉매할 수 있는 글루코스데히드로게나제」란, 피롤로퀴놀린퀴논을 조효소로 함으로써 D-크실로스를 D-크실로노락톤으로 변환할 수 있는 효소를 의미한다.
β-D-글루코스+NADP→D-글루코노-1,5-락톤+NADPH+H+
피롤로퀴놀린퀴논은 미생물이 원래 지닌 능력에 의해 생산되어도 좋고, 배지 중에 첨가되어도 좋다(Appl Environ Microbiol. 2009 May; 75(9) 2784-2791).
본 발명에서는, 2-케토글루타르산 또는 이의 유도체를 생산하는 세균으로서, 2-케토글루타르산의 분해 경로를 약화 또는 소실시키는 것이 바람직하다. 2-케토글루타르산의 분해 경로의 약화 또는 소실로서는, α-케토글루타르산데히드로게나제 및/또는 석신산데히드로게나제의 활성을 약화 또는 소실시키는 것이 바람직하다. 본 발명에 있어서, α-케토글루타르산데히드로게나제(이하, 「α-KGDH」라고 하는 경우가 있다) 활성이란, α-케토글루타르산(2-옥소글루타르산)을 산화적으로 탈탄산하고, 석시닐-CoA(succinyl-CoA)을 생성하는 반응을 촉매하는 활성을 의미한다. 상기 반응은 α-KGDH(E1o: α-케토글루타레이트 데히드로게나제(α-ketoglutarate dehydrogenase), EC:1.2.4.2), 디하이드로리포아미드 S-석시닐트랜스퍼라제(E2o: 디히드로리포아미드-S-석시닐트랜스퍼라제(dihydrolipoamide-S-succinyltransferase); EC:2.3.1.61), 디하이드로리포아미드 데히드로게나제(E3: 디히드로리포아미드 데히드로게나제(dihydrolipoamide dehydrogenase); EC:1.8.1.4)의 3종의 효소에 의해 촉매된다. 즉, 이들 3종류의 서브유니트는 각각 이하의 반응을 촉매하고, 이들 3개의 반응을 합한 반응을 촉매하는 활성을 α-KGDH 활성이라고 한다. α-KGDH 활성의 확인은, Shiio 등의 방법(Isamu Shiio and Kyoko Ujigawa-Takeda, Agric. Biol. Chem., 44(8), 1897-1904, 1980)에 따라 측정할 수 있다.
E1o: 2-옥소글루타레이트+[디히드로리포일리신-잔기 석시닐트랜스퍼라제]리포일리신=[디히드로리포일리신-잔기 석시닐트랜스퍼라제]S-석시닐디히드로리포일리신+CO2 {2-oxoglutarate+[dihydrolipoyllysine-residue succinyltransferase] lipoyllysine=[dihydrolipoyllysine-residue succinyltransferase]S-succinyldihydrolipoyllysine+CO2}
E2o: CoA+ 엔자임 N6-(S-석시닐디히드로리포일)리신=석시닐-CoA+엔자임 N6-(디히드로리포일)리신 {CoA+enzyme N6-(S-succinyldihydrolipoyl)lysine=succinyl-CoA+enzyme N6-(dihydrolipoyl)lysine}
E3: 단백질 N6-(디히드로리포일)리신+NAD+=단백질 N6-(리포일)리신+NADH+H+ {protein N6-(dihydrolipoyl)lysine+NAD+=protein N6-(lipoyl)lysine+NADH+H+}
또한, α-KGDH는 옥소글루타르산데히드로게나제(oxoglutarate dehydrogenase), 2-옥소글루타르산데히드로게나제(2-oxoglutarate dehydrogenase)이라고도 불린다.
장내 세균과(科), 예를 들면, 판토에아·아나나티스에서는 이의 3종 각각의 효소 활성을 갖는 서브유니트 단백질이 복합체를 형성하고 있다. 그리고, 각 서브유니트는 각각 sucA, sucB 및 lpd에 의해 코드화되고, sucA , sucB 유전자는, 석시네이트데히드로게나제 철-황단백질 유전자(sdhB)의 하류에 존재한다(미국 특허 제6,331,419호). 또한, 이 특허에는 이들 유전자는 엔테로박터·아글로메란스 AJ13355의 유전자로서 기재되어 있지만, 이 균주는 나중에 판토에아·아나나티스로 재분류된다.
장내 세균의 α-KGDH를 코드화하는 유전자로서, 판토에아·아나나티스의 sucA, sucB 및 하류에 존재하는 sucC 유전자의 염기서열 및 각 서브유니트의 아미노산 서열은 EP2100957A1에 개시되어 있다. 또한, 에스케리키아·콜라이의 α-KGDH를 코드화하는 sucA, sucB 및 sucC 유전자는 각각 Genbank NP_415254, NP_415255에 개시되어 있다.
또한, 코리네형 세균에서는, E1o 서브유니트는 odhA 유전자(sucA 유전자라고도 불리는 GenBank Accession No. NC_003450의 NCgl1084로서 등록되어 있다)에 의해 코드화되고, E3 서브유니트는 lpd 유전자(GenBank Accession No. Y16642)에 의해 코드화되어 있다. 한편, E2o 서브유니트는 E1o 서브유니트와 함께 2기능성 단백질로서 odhA 유전자에 코드화되거나(Usuda et al., Microbiology 1996 142, 3347-3354 참조), 또는 odhA 유전자와는 별도의 GenBank Accession No. NC_003450의 NCgl2126으로서 등록되어 있는 유전자에 의해 코드화된다고 추측되고 있다. 따라서, 본 발명에 있어서는 odhA 유전자는 E1o 서브유니트를 코드화하는 유전자이지만, 아울러 E2o를 코드화하여도 좋다.
브레비박테리움·락토페르멘툼의 odhA 유전자의 염기서열 및 E1o 서브유니트의 아미노산 서열(WO2006/028298), 상기 GenBank Accession No. NC_003450의 NCgl2126의 염기서열 및 이 서열에 의해 코드화되는 E2o 서브유니트의 아미노산 서열, 및 상기 GenBank Accession No. NC_003450의 NCgl1084의 염기서열 및 이 서열에 의해 코드화되는 E1o 서브유니트의 서열은 EP2100957A1에 개시되어 있다.
본 발명에서는, α-KGDH 서브유니트의 각각을 코드화하는 유전자 및 이들을 포함하는 유전자 클러스터를 총칭하여 「α-KGDH 코드화하는 유전자」라고 하는 경우가 있다.
석신산데히드로게나제(이하, 「SDH」라고 기재하는 경우가 있다)는 EC:1.3.99.1 이하의 반응을 가역적으로 촉매하는 효소이다. 본 발명에 있어서, SDH 활성이란 이 반응을 촉매하는 활성을 의미한다.
석신산+FAD→푸마르산+FADH2
SDH는 미생물종에 따라 3개 또는 4개의 서브유니트 구조로 구성되며, 이들 중 적어도 1종의 단백질을 정상적으로 기능하지 않도록 개변함으로써 활성을 저하 또는 결실시킬 수 있다. 구체적으로는, SDH는 이하의 서브유니트(괄호 안은 서브유니트를 코드화하는 유전자명)로 구성되어 있고, 종류에 따라서는 membrane anchor protein을 sdhC 단독으로, 또는 sdhC와 sdhD로 코드화되는 것이 있다.
SDHA: 플라보프로테인 서브유니트(flavoprotein subunit)(sdhA)
SDHB: Fe-S 프로테인 서브유니트(Fe-S protein subunit)(sdhB)
SDHC: 멤브레인 앵커 프로테인(membrane anchor protein)(sdhC)
SDHD: 멤브레인 앵커 프로테인(membrane anchor protein)(sdhD)
또한, SDH 서브유니트 복합체는 SDH와 푸마르산리덕타제의 양쪽 활성을 갖는 경우가 있다. 예를 들면, 코리네형 세균의 SDH 서브유니트 복합체는 SDH와 푸마르산리덕타제의 양쪽 활성을 갖는다(WO2005/021770).
SDH 활성의 확인은 2,6-디클로로인도페놀(2,6-dichloroindophenol)(DCIP)의 환원을 지표로서 측정함으로써 실시할 수 있다. 구체적인 방법은 Tatsuki Kurokawa and Junshi Sakamoto, Arch Microbiol (2005) 183:317-324에 기재되어 있다.
본 발명에 있어서는, SDH 서브유니트의 각각을 코드화하는 유전자, 및 이들을 포함하는 오페론을 총칭하여 「SDH를 코드화하는 유전자」라고 하는 경우가 있다.
장내 세균의 SDH를 코드화하는 유전자로서, 판토에아·아나나티스의 유전자의 염기서열 및 각 서브유니트는 WO2008/075483에 개시되어 있다.
코리네형 세균의 SDH를 코드화하는 유전자로서는, 예를 들면, 코리네박테리움·글루타미쿰의 sdh 오페론(GenBank accession No.NCgl0359(sdhC) NCgl0360(sdhA) NCgl0361(sdhB)), 및 브레비박테리움·플라붐의 sdh 오페론(일본 공개특허 특개2005-095169호, EP1672077A1, WO2008/075483)의 서열이 개시되어 있다.
α-KGDH, SDH의 활성을 저하 또는 결손시키기 위해서는, 후술하는 L-글루탐산의 생합성 경로로부터 분기하여 다른 화합물을 생성하는 반응을 촉매하는 효소의 활성 저하에 대하여 기재한 방법을 적용할 수 있다.
또한, 본 발명의 미생물로서는, 크실로스를 세포 내에 흡수하는 효소의 활성이 강화되어도 좋다.
크실로스를 세포 내에 흡수하는 효소로서는 D-크실로스퍼미아제가 열거되고, D-크실로스퍼미아제를 코드화하는 유전자로서는 xylE 유전자가 열거된다. D-크실로스퍼미아제를 코드화하는 에스케리키아·콜라이 유래의 xylE 유전자의 염기서열, 및 이 유전자가 코드화하는 아미노산 서열을 각각 서열번호 30, 31에 나타낸다.
또한, 본 발명의 미생물로서는, 크실로스 이소머라제(xylA) 및 또는 크실룰로스키나제(xylB)를 약화시키는 것이 바람직하다. 또한, 에스케리키아·콜라이의 크실로스 이소머라제(xylA), 크실룰로스키나제(xylB) 유전자는 NC000913.1 gi: 16131436, 16131435에 각각 개시되어 있다.
또한, 본 발명에 있어서는, 크실론산이 배지 중에 축적하는 경우가 있고, 특히 에스케리키아·콜라이에서는 크실로네이트데히드라타제의 활성을 더욱 강화하는 것이 바람직하다. 예를 들면, 활성으로서 10㎛ol/min/mg-protein 이상, 바람직하게는 15㎛ol/min/mg-protein 이상, 더욱 바람직하게는 17㎛ol/min/mg-protein 이상 강화되는 것이 바람직하다.
다음에, 미생물에 목적 효소의 활성을 부여하거나 미생물의 목적 효소의 활성을 증대시키는 방법을 설명한다.
미생물이 원래 목적 효소의 활성을 갖지 않는 경우에는, 이 효소를 코드화하는 유전자를 이 미생물에 도입함으로써 이 효소 활성을 부여할 수 있다. 또한, 미생물이 목적 효소의 활성을 갖는 경우에는 목적 효소를 코드화하는 외래 유전자를 도입하거나, 목적 효소를 코드화하는 내인성의 유전자의 카피수를 증대시키거나, 또는 목적 효소 유전자의 프로모터 등의 발현 제어 서열을 개변하는 등을 하여, 이 유전자의 발현량을 증대시킴으로써 목적 효소 활성을 증대시킬 수 있다. 본 발명에 있어서, 「목적 효소 유전자를 도입한다」란, 원래 목적 효소 활성을 갖지 않는 미생물에 목적 효소 유전자를 도입할 뿐만 아니라, 당해 효소 활성을 갖는 미생물에 외래 유전자를 도입하는 것, 및 목적 효소 활성을 갖는 미생물에 내인성 유전자를 도입하여, 내인성의 목적 효소 유전자의 발현량을 증대시키는 것도 포함한다.
목적 효소 유전자를 도입하기 위해서는, 예를 들면, 이 유전자를 적당한 벡터 상에 클로닝하고, 수득된 벡터를 사용하여 숙주 미생물을 형질 전환한다.
형질 전환에 사용하는 벡터로서는, 사용하는 미생물로 자율 복제 가능한 플라스미드가 열거된다. 예를 들면, 장내 세균군에 속하는 미생물 중에서 자율 복제 가능한 플라스미드로서 pUC19, pUC18, pBR322, RSF1010, pHSG299, pHSG298, pHSG399, pHSG398, pSTV28, pSTV29, pTWV228, pTWV229(pHSG, pSTV, pTWV는 다카라바이오사에서 입수 가능), pMW119, pMW118, pMW219, pMW218(pMW는 니혼진사에서 입수 가능) 등이 열거된다. 또한, 코리네형 세균용의 플라스미드로서는 pAM330(일본 공개특허 특개소58-67699호 공보), pHM1519(일본 공개특허 특개소58-77895호 공보), pSFK6(일본 공개특허 특개2000-262288호 공보 참조), pVK7(미국 특허출원공개 명세서 2003-0175912), pAJ655, pAJ611, pAJ1844(일본 공개특허 특개소58-192900호 공보), pCG1(일본 공개특허 특개소57-134500호 공보), pCG2(일본 공개특허 특개소58-35197호 공보), pCG4, pCG11(일본 공개특허 특개소57-183799호 공보), pHK4(일본 공개특허 특개평5-7491호 공보) 등이 열거된다.
형질 전환법으로서는, 예를 들면, 에스케리키아·콜라이 K-12에 대하여 보고되어 있는 수용균 세포를 염화 칼슘으로 처리하여 DNA의 투과성을 증대시키는 방법(Mandel, M. and Higa, A., J. Mol. Biol. 1970, 53, 159-162), 바실루스·서브틸리스에 대하여 보고되어 있는 증식 단계의 세포로부터 컴피턴트 셀을 조제하여 DNA를 도입하는 방법(Duncan, C. H., Wilson, G. A. and Young, F. E.., 1997. Gene 1: 153-167) 등이 열거된다. 또는, 바실루스·서브틸리스, 방선균류 및 효모에 대하여 알려져 있는 DNA 수용균의 세포를, 재조합 DNA를 용이하게 흡수하는 프로토플라스트 또는 스페로플라스트의 상태로 하여 재조합 DNA를 DNA 수용균에 도입하는 방법(Chang, S. and Choen, S.N., 1979. Mol. Gen. Genet. 168: 111-115; Bibb, M. J., Ward, J. M. and Hopwood, O. A. 1978. Nature 274: 398-400; Hinnen, A., Hicks, J. B. and Fink, G. R. 1978. Proc. Natl. Acad. Sci. USA 75: 1929-1933)도 응용할 수 있다. 또한, 전기 펄스법(일본 공개특허 특개평2-207791호 공보)에 의해서도 미생물의 형질 전환을 실시할 수도 있다.
또한, 목적 효소 유전자의 도입은 숙주 미생물의 염색체 상에의 도입에 의해서 달성할 수 있다. 미생물의 염색체 상에 목적 효소 유전자를 도입하기 위해서는, 트랜스포손이나 Mini-Mu를 사용하여 염색체 상에 랜덤으로 도입하는 방법(일본 공개특허 특개평2-109985호 공보, US5,882,888, EP805867B1)이나, 염색체 DNA 상에 다중 카피(multiple copy) 존재하는 서열을 표적으로 이용하여 상동 재조합에 의해 실시하는 것도 가능하다. 염색체 DNA 상에 다카피 존재하는 서열로서는 반복성 DNA, 전이 인자의 단부에 존재하는 역반복(inverted repeat)을 이용할 수 있다. 또는, Red 드리븐 인테그레이션법(WO2005/010175)을 사용함으로써 목적 유전자를 염색체 상에 도입하는 것도 가능하다. 또한, P1 파지 등의 파지를 사용한 트랜스덕션(transduction)이나, 접합 전달 벡터에 의한 염색체 상에의 목적 유전자의 도입도 가능하다. 또한, WO03/040373에 기재되어 있는 바와 같이, 목적 물질 생산에 불필요한 유전자를 표적으로 하여 목적 효소 유전자를 도입하는 것도 가능하다. 이러한 방법으로 표적서열에 목적 효소 유전자를 1카피 또는 다카피 도입할 수 있다.
염색체 상에 이들 유전자가 전이된 것의 확인은 목적 유전자 또는 이의 일부와 상보적인 서열을 갖는 프로브를 사용하여 서던 하이브리다이제이션을 실시함으로써 확인할 수 있다.
목적 유전자가 도입되는 카피수는 1카피 이상이면 어느 것이라도 좋지만, 2카피 이상, 보다 바람직하게는 3카피 이상, 더 바람직하게는 5카피 이상인 것이 바람직하다. 목적 유전자 중에서도 특히 크실로네이트데히드라타제 유전자는 2카피 이상 도입되는 것이 바람직하다.
또한, 목적 효소 유전자는 하기에 설명하는 바와 같이, 프로모터 등의 발현 조절 서열의 치환, 변이와 조합함으로써 활성을 최적화하는 것이 가능하다. 특히, 크실로네이트데히드라타제 유전자는 상기의 다카피화 대신에, 또는 다카피화와 더불어 발현 조절 서열의 치환, 변이에 의해 고발현시키는 것이 바람직하다.
목적 효소 유전자의 발현량을 증대시키는 방법으로서는 염색체 DNA 상 또는 플라스미드 상에서, 목적 효소 유전자의 프로모터 등의 발현 조절 서열을 적절한 강도로 치환함으로써 이 유전자의 발현을 증강시키는 방법이 열거된다. 예를 들면, thr 프로모터, lac 프로모터, trp 프로모터, trc 프로모터, pL 프로모터, tac 프로모터 등이 자주 사용되는 프로모터로서 알려져 있다. 또한, 후술하는 실시예에서 사용하고 있는 tac 프로모터의 베리언트(PtacA 프로모터, PtacB 프로모터)도 사용할 수 있다. 프로모터 강도의 평가법 및 강력한 프로모터의 예는 Goldstein과 Doi의 논문(Goldstein, M. A. and Doi R. H. 1995. Prokaryotic promoters in biotechnology. Biotechnol. Annu. Rev., 1, 105-128) 등에 기재되어 있다.
또한, 국제공개 WO00/18935에 개시되어 있는 바와 같이, 유전자의 프로모터영역에 수염기의 염기 치환을 도입하여 적절한 강도로 개변하는 것도 가능하다. 발현 조절 서열의 치환은, 예를 들면, 온도 감수성 플라스미드를 사용한 유전자 치환과 동일하게 하여 실시할 수 있다. 에스케리키아·콜라이나, 판토에아·아나나티스에 사용할 수 있는 온도 감수성 복제 기점을 갖는 벡터로서는, 예를 들면, WO 99/03988호 국제공개팜플렛에 기재된 온도 감수성 플라스미드 pMAN997이나 이의 유도체 등이 열거된다. 또한, λ파지의 레드 리콤비나제(Red recombinase)를 이용한 「Red 드리븐 인테그레이션법(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A. and Wanner, B. L., 2000. Proc. Natl. Acad. Sci. USA. 97: 6640-6645)이나, Red 드리븐 인테그레이션법과 λ파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203(2002))을 조합한 방법(WO2005/010175호 참조) 등의 직쇄상 DNA를 사용하는 방법에 의해서도 발현 조절 서열의 치환을 실시할 수 있다. 또한, 발현 조절 서열의 개변은 상술한 바와 같은 유전자의 카피수를 높이는 방법과 조합하여도 좋다.
또한, 리보솜 결합 부위(RBS)와 개시 코돈 사이의 스페이서, 특히, 개시 코돈의 바로 상류의 서열에서의 여러 개의 뉴클레오티드의 치환이 mRNA의 번역 효율에 상당히 영향을 미치는 것이 알려져 있고, 이들을 개변함으로써 번역량을 향상시키는 것이 가능하다.
상기 증폭 플라스미드 또는 염색체 상에 목적 유전자를 도입하는 경우, 이들 유전자를 발현시키기 위한 프로모터는 사용하는 미생물에서 기능하는 것이면 어느 프로모터이어도 좋고, 사용하는 유전자 자신의 프로모터이어도 좋고, 개변한 것이라도 좋다. 사용하는 미생물로 강력하게 기능하는 프로모터를 적절히 선택하거나, 프로모터의 -35, -10 영역을 콘센서스 서열에 가까이함으로써도 유전자 발현량의 조절이 가능하다.
목적 효소의 활성이 증강되었는지 여부의 확인은 개변주와 친주(親株) 또는 비개변주의 목적 효소의 활성을 비교함으로써 실시할 수 있다. 개변주의 효소 활성이 친주 또는 비개변주보다 상승하고 있으면 이 효소의 활성이 증강된다. 또한, 친주가 목적 효소의 활성을 갖지 않는 경우에는, 개변주로 목적 효소의 활성을 검출할 수 있으면 이 효소의 활성이 증강된다.
목적 효소 유전자는, 상기의 서열 정보, 또는 이의 미생물에 있어서 공지된 유전자 또는 단백질의 서열 정보에 기초하여 제작된 올리고뉴클레오티드를 프라이머로 하는 PCR법, 또는 상기 서열 정보에 기초하여 제작된 올리고뉴클레오티드를 프로브로 하는 하이브리디제이션법에 의해, 목적 효소를 유지하는 미생물의 염색체 DNA 또는 염색체 DNA 라이브러리로부터 취득할 수 있다.
또한, 목적 효소, 및 이를 코드화하는 유전자는, 효소 활성을 유지하고 있는 한, 이들 호모로그나 인위적 개변체 등, 또는 보존적 변이를 갖는 단백질 또는 이를 코드화하는 것이면 좋다.
상기와 같은 호모로그, 인위적 개변체 또는 보존적 변이를 갖는 단백질 또는 이들을 코드화하는 유전자를 보존적 베리언트라고 기재한다.
목적 효소의 보존적 베리언트로서는, 예를 들면, 상기 각 효소의 아미노산 서열에 있어서 1 또는 여러 개의 위치에서의 1 또는 여러 개의 아미노산의 치환, 결실, 삽입 또는 부가 등을 포함하는 서열을 갖는 단백질이어도 좋다.
「1 또는 여러 개」란, 아미노산 잔기의 단백질의 입체 구조에서의 위치나 아미노산 잔기의 종류에 따라서도 다르지만, 구체적으로 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더 바람직하게는 1 내지 5개를 의미한다. 또한, 보존적 변이의 대표적인 것은 보존적 치환이다. 보존적 치환이란, 치환 부위가 방향족 아미노산인 경우에는 Phe, Trp, Tyr 사이에서, 치환 부위가 소수성 아미노산인 경우에는 Leu, Ile, Val 사이에서, 극성 아미노산인 경우에는 Gln, Asn 사이에서, 염기성 아미노산인 경우에는 Lys, Arg, His 사이에서, 산성 아미노산인 경우에는 Asp, Glu 사이에서, 하이드록실기를 갖는 아미노산인 경우에는 Ser, Thr 사이에서 서로 치환하는 변이이다. 보존적 치환이라고 간주되는 치환으로서는, 구체적으로는 Ala로부터 Ser 또는 Thr으로의 치환, Arg로부터 Gln, His 또는 Lys로의 치환, Asn으로부터 Glu, Gln, Lys, His 또는 Asp로의 치환, Asp로부터 Asn, Glu 또는 Gln으로의 치환, Cys로부터 Ser 또는 Ala로의 치환, Gln으로부터 Asn, Glu, Lys, His, Asp 또는 Arg로의 치환, Glu로부터 Gly, Asn, Gln, Lys 또는 Asp로의 치환, Gly로부터 Pro로의 치환, His로부터 Asn, Lys, Gln, Arg 또는 Tyr로의 치환, Ile로부터 Leu, Met, Val 또는 Phe로의 치환, Leu로부터 Ile, Met, Val 또는 Phe로의 치환, Lys로부터 Asn, Glu, Gln, His 또는 Arg로의 치환, Met로부터 Ile, Leu, Val 또는 Phe로의 치환, Phe로부터 Trp, Tyr, Met, Ile 또는 Leu로의 치환, Ser로부터 Thr 또는 Ala로의 치환, Thr로부터 Ser 또는 Ala로의 치환, Trp로부터 Phe 또는 Tyr로의 치환, Tyr로부터 His, Phe 또는 Trp로의 치환, 및 Val로부터 Met, Ile 또는 Leu로의 치환이 열거된다. 또한, 상기한 바와 같은 아미노산의 치환, 결실, 삽입, 부가, 또는 역위 등에는 유전자가 유래하는 미생물의 개체 차이, 종류의 차이에 근거하는 경우 등 천연에서 발생하는 변이(mutant 또는 variant)에 의해 발생하는 것도 포함된다. 이러한 단백질은, 예를 들면, 부위 특이적 변이법에 의해 코드화되는 단백질의 특정한 부위의 아미노산 잔기가 치환, 결실, 삽입 또는 부가를 포함하도록 야생형 유전자의 염기서열을 개변함으로써 취득할 수 있다.
또한, 상기와 같은 보존적 변이를 갖는 단백질은 아미노산 서열 전체에 대하여, 예를 들면, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 보다 바람직하게는 97% 이상, 보다 바람직하게는 98% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖고, 또한, 야생형 단백질과 동등한 기능을 갖는 단백질이어도 좋다. 또한, 본 명세서에 있어서 「상동성」 (homology)」은 「동일성」 (identity)을 가리키는 경우가 있다.
야생형의 목적 효소 유전자는 상기와 같은 아미노산 서열을 코드화하는 것이면, 카울로박터·크레센투스나 할로페락스·볼카니 등의 유전자에 한정되지 않고, 임의의 코돈을 그것과 등가의 코돈으로 치환한 것이어도 좋다.
또한, 야생형 유전자는 상기의 각 효소 유전자의 상보 서열 또는 이 상보 서열로부터 조제될 수 있는 프로브와 엄격한 조건 하에서 하이브리다이즈하고, 야생형의 목적 효소와 동등한 기능을 갖는 단백질을 코드화하는 DNA라도 좋다. 여기에서, 「엄격한 조건」이란, 소위 특이적인 하이브리드가 형성되고, 비특이적인 하이브리드가 형성되지 않는 조건을 말한다. 일례를 나타내면, 상동성이 높은 DNA끼리, 예를 들면, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 보다 바람직하게는 97% 이상, 보다 바람직하게는 98% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖는 DNA끼리 하이브리다이즈하고, 이보다 상동성이 낮은 DNA끼리 하이브리다이즈하지 않는 조건, 또는 통상의 서던 하이브리다이제이션의 세정 조건인 60℃, 1×SSC, 0.1% SDS, 바람직하게는 0.1×SSC, 0.1% SDS, 더 바람직하게는 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도, 온도로 1회, 보다 바람직하게는 2 내지 3회 세정하는 조건을 들 수 있다.
프로브로서는 각 유전자의 상보 서열의 일부를 사용할 수도 있다. 이러한 프로브는 공지된 유전자 서열에 기초하여 제작된 올리고뉴클레오티드를 프라이머로 하고, 이들 염기서열을 포함하는 DNA 단편을 주형으로 하는 PCR에 의해 제작할 수 있다. 예를 들면, 프로브로서 300bp 정도 길이의 DNA 단편을 사용하는 경우에는, 하이브리다이제이션의 세정 조건은 50℃, 2×SSC, 0.1% SDS가 열거된다.
상기한 각 단백질의 보존적 베리언트 및 이를 코드화하는 유전자에 관한 기재는, 후술하는 목적 물질 생산균에 대하여 기재한 것 이외의 유전자에 대해서도 마찬가지로 적용된다.
본 발명에 사용하는 미생물은, 본래 목적 물질 생산능을 갖는 것이어도 좋고, 변이법이나 재조합 DNA 기술 등을 이용한 육종에 의해 목적 물질 생산능을 부여받은 것이어도 좋다.
본 발명에 사용되는 미생물로서는, 세균, 예를 들면, 에스케리키아속, 판토에아속, 엔테로박터속 등의 장내 세균과에 속하는 미생물이나, 코리네박테리움·글루타미쿰, 브레비박테리움·락토페르멘툼 등의 코리네형 세균, 바실루스·서브틸리스 등의 바실루스속 세균이 열거되지만 이들에 제한되지 않는다.
본 발명에 있어서, 「코리네형 세균」이란, 종래 브레비박테리움속으로 분류되었지만, 현재 코리네박테리움속으로 분류되는 세균도 포함하며(Int. J. Syst. Bacteriol., 41, 255(1991)), 또한, 코리네박테리움속과 매우 근연(近緣)한 브레비박테리움속 세균을 포함한다. 이러한 코리네형 세균의 예로서 이하의 것이 열거된다.
코리네박테리움·아세토아시도필룸
코리네박테리움·아세토글루타미쿰
코리네박테리움·알카노리티쿰
코리네박테리움·칼루나에
코리네박테리움·글루타미쿰
코리네박테리움·릴리움
코리네박테리움·멜라쎄콜라
코리네박테리움·써모아미노게네스(코리네박테리움·에피시엔스)
코리네박테리움·헤르큘리스
브레비박테리움·디바리카툼
브레비박테리움·플라붐
브레비박테리움·임마리오필룸
브레비박테리움·락토페르멘툼(코리네박테리움·글루타미쿰)
브레비박테리움·로세움
브레비박테리움·사카롤리티쿰
브레비박테리움·티오게니탈리스
코리네박테리움·암모니아게네스
브레비박테리움·알붐
브레비박테리움·세리눔
마이크로 박테리움·암모니아필룸
구체적으로는 하기와 같은 균주를 예시할 수 있다.
코리네박테리움·아세토아시도필룸 ATCC13870
코리네박테리움·아세토글루타미쿰 ATCC15806
코리네박테리움·알카노리티쿰 ATCC21511
코리네박테리움·칼루나에 ATCC15991
코리네박테리움·글루타미쿰 ATCC13020, ATCC13032, ATCC13060
코리네박테리움·릴리움 ATCC15990
코리네박테리움·멜라쎄콜라 ATCC17965
코리네박테리움·써모아미노게네스 AJ12340(FERM BP-1539)
코리네박테리움·헤르큘리스 ATCC13868
브레비박테리움·디바리카툼 ATCC14020
브레비박테리움·플라붐 ATCC13826, ATCC14067
브레비박테리움·임마리오필룸 ATCC14068
브레비박테리움·락토페르멘툼 ATCC13869(코리네박테리움·글루타미쿰 ATCC13869)
브레비박테리움·로세움 ATCC13825
브레비박테리움·사카롤리티쿰 ATCC14066
브레비박테리움·티오게니탈리스 ATCC19240
코리네박테리움·암모니아게네스 ATCC6871, ATCC6872
브레비박테리움·알붐 ATCC15111
브레비박테리움·세리눔 ATCC15112
미크로 박테리움·암모니아필룸 ATCC15354
이들을 입수하기 위해서는, 예를 들면, 아메리칸·타입·컬처·콜렉션(ATCC: 주소 P.O. Box 1549, Manassas, VA 20108, 1, United States of America)에서 분양을 받을 수 있다. 즉, 각 균주마다 대응하는 등록 번호가 부여되어 있고, 이 등록 번호를 이용하여 분양을 받을 수 있다(http://www.atcc.org/). 각 균주에 대응하는 등록 번호는 아메리칸·타입·컬처·콜렉션의 카탈로그에 기재되어 있다. 또한, AJ12340주는 1987년 10월 27일자로 통상성 공업 기술원 생명 공학 공업 기술 연구소(현 독립 행정 법인 제품 평가 기술 기반 기구 특허 생물 기탁 센터, 주소 우편 번호 305-5466 일본 이바라키현 쯔꾸바시 히가시 1쵸메 1반찌 1 쥬오 다이6)에 FERM BP-1539의 수탁 번호로 부다페스트 조약에 기초하여 기탁되어 있다.
장내 세균과에 속하는 미생물로서는, 에스케리키아속, 엔테로박터속, 판토에아속, 클렙시엘라속, 세라티아속, 에르위니아속, 살모네라균속, 모르가넬라속 등에 속하고, 목적 물질을 생산하는 능력을 갖는 것이면 특별히 한정되지 않는다. 구체적으로는 NCBI(National Center for Biotechnology Information) 데이터 베이스에 기재되어 있는 분류에 의해 장내 세균과에 속하는 것을 이용할 수 있다(http://www.ncbi.nlm.nih.gov/htbin-post/Taxonomy/wgetorg?mode=Tree&id=1236&lvl=3&keep=1&srchmode=1&unlock). 장내 세균과의 친주로서는, 그 중에서도 에스케리키아속 세균, 엔테로박터속 세균, 판토에아속 세균을 사용하는 것이 바람직하다.
에스케리키아속 세균의 친주로서는, 특별히 한정되지 않지만, 구체적으로는 나이트하르트 등의 저서(Neidhardt, F.C. et al., Escherichia coli and Salmonella Typhimurium, American Society for Microbiology, Washington D.C., 1029 table 1)에 열거된 것을 이용할 수 있다. 그 중에서는, 예를 들면, 에스케리키아·콜라이가 열거된다. 에스케리키아·콜라이로서는 구체적으로는, 프로토타입의 야생주 K12주 유래의 에스케리키아·콜라이 W3110(ATCC 27325), 에스케리키아·콜라이 MG1655(ATCC 47076) 등이 열거된다.
특히, 판토에아속 세균, 에르위니아속 세균, 엔테로박터속 세균은, γ-프로테오박테리아로 분류되는 세균이며, 분류학적으로 대단히 근연하다(J Gen Appl Microbiol 1997 Dec;43(6) 355-361, International Journal of Systematic Bacteriology, Oct. 1997, p1061-1067). 최근, DNA-DNA 하이브리다이제이션 실험 등에 의해, 엔테로박터속에 속하는 세균에는, 판토에아·아글로메란스(Pantoea agglomerans) 또는 판토에아·디스페르사(Pantoea dispersa) 등으로 재분류되어 있는 것이 있다(International Journal of Systematic Bacteriology, July 1989; 39(3). p. 337-345), 또한, 에르위니아속에 속하는 세균에는 판토에아·아나나스(Pantoea ananas), 판토에아·스테와르티로 재분류되어 있는 것이 있다(International Journal of Systematic Bacteriology, Jan 1993; 43(1). p.162-173 참조). 또한, 판토에아·아나나스는 후에 추가로 판토에아·아나나티스로 재분류된다.
엔테로박터속 세균으로서는, 엔테로박터·아글로메란스(Enterobacter agglomerans)(현재는 판토에아·아나나티스 등으로 재분류되어 있다), 엔테로박터·아에로게네스(Enterobacter aerogenes) 등이 열거된다. 구체적으로는 유럽 특허출원공개 952221호 명세서에 예시된 균주를 사용할 수 있다. 엔테로박터속의 대표적인 주로서 엔테로박터·아글로메란스 ATCC12287주(현재는 판토에아·아나나티스로 재분류되어 있다)가 열거된다.
판토에아속 세균의 대표적인 균주로서 판토에아·아나나티스(Pantoea ananatis), 판토에아 스테와르티(Pantoea stewartii), 판토에아·아글로메란스, 판토에아·시트레아(Pantoea citrea)가 열거된다. 구체적으로는 하기의 균주가 열거된다.
판토에아·아나나티스 AJ13355주(FERM BP-6614)(유럽 특허출원공개 0952221호 명세서)
판토에아·아나나티스 AJ13356주(FERM BP-6615)(유럽 특허출원공개 0952221호 명세서)
또한, 이들 균주는 유럽 특허출원공개 0952221호 명세서에는 엔테로박터·아글로메란스로서 기재되어 있지만, 현재는 상기한 바와 같이 16S rRNA의 염기서열 해석 등에 의해 판토에아·아나나티스로 재분류되어 있다.
판토에아·아나나티스 AJ13355주는 시즈오카현 이와타시의 토양에서, 저pH로서 L-글루탐산 및 탄소원을 포함하는 배지에서 증식할 수 있는 주로서 분리된 주이다. 또한, 이 주로부터 점성 물질 저생산 변이주로서 선택된 주가 SC17주이다(미국 특허 제6,596,517호). AJ13355주는 평성 10년 2월 19일에, 통산성 공업 기술원 생명 공학 공업 기술 연구소(현 명칭, 독립 행정 법인 제품 평가 기술 기반 기구 특허 생물 기탁 센터, 주소 우편번호 305-8566 일본 이바라키현 쯔꾸바시 히가시 1쵸메 1반찌 1 쥬오 다이6)에 수탁 번호 FERM P-16644로서 기탁되어, 평성 11년 1월 11일에 부다페스트 조약에 근거하는 국제 기탁에 이관되고, 수탁 번호 FERM BP-6614가 부여되어 있다. 또한, SC17주는 프라이빗 번호 AJ416이 부여되어, 평성 21년 2월 4일에 산업 기술 종합 연구소 특허 생물 기탁 센터(현 독립 행정 법인 제품 평가 기술 기반 기구 특허 생물 기탁 센터 주소 우편번호 305-8566 일본 이바라키현 쯔꾸바시 히가시 1쵸메 1반찌 1 쥬오 다이6)에 국제 기탁되어, 수탁 번호 FERM BP-11091이 부여되어 있다.
또한, 판토에아·아나나티스의 L-글루탐산 생산균으로서 SC17sucA/RSFCPG+pSTVCB주, AJ13601주, NP106주, 및 NA1주가 열거된다. SC17sucA/RSFCPG+pSTVCB주는 SC17주 유래의 sucA 유전자 결손주인 SC17sucA주(미국 특허 제6,596,517호)에, 에스케리키아·콜라이 유래의 시트르산 신타제 유전자(gltA), 포스포엔올피루브산 카복실라제 유전자(prpC), 및 글루타메이트 데히드로게나제 유전자(gdhA)를 포함하는 플라스미드 RSFCPG, 및 브레비박테리움·락토페르멘툼 유래의 시트르산 신타제 유전자(gltA)를 포함하는 플라스미드 pSTVCB를 도입하여 수득한 주이다. AJ13601주는 이 SC17sucA/RSFCPG+pSTVCB주로부터 저pH 하에서 고농도의 L-글루탐산에 내성을 나타내는 주로서 선택된 주이다. 또한, NP106주는 AJ13601주로부터 플라스미드 RSFCPG+pSTVCB를 탈락시킨 주이다(WO2010/027045). AJ13601주는 1999년 8월 18일에, 통산성 공업 기술원 생명 공학 공업 기술 연구소(현 명칭, 독립 행정 법인 제품 평가 기술 기반 기구 특허 생물 기탁 센터 주소 우편번호 305-8566 일본 이바라키현 쯔꾸바시 히가시 1쵸메 1반찌 1 쥬오 다이6)에 수탁 번호 FERM P-17516으로 기탁되어, 2000년 7월 6일에 부다페스트 조약에 근거하는 국제 기탁에 이관되고, 수탁 번호 FERM BP-7207이 부여되어 있다. 이 주는 분리된 당시에는 엔테로박터·아글로메란스로 동정되어, 엔테로박터·아글로메란스로서 기탁되었지만, 16S rRNA의 염기서열 해석 등에 의해 판토에아·아나나티스로 재분류되어 있다.
NA1주는 상기 RSFCPG의 gltA 유전자를 메틸시트르산 신타제 유전자(prpC)로 치환하는 구조를 갖는 RSFPPG(WO2008/020654)를 갖는 NP106주에 상당하는 주이다(WO2010/027045).
에르위니아속 세균으로서는, 에르위니아·아밀로보라, 에르위니아·카로토보라가 열거되고, 클렙시엘라속 세균으로서는 클렙시엘라·플란티콜라가 열거된다. 구체적으로는 하기의 균주가 열거된다.
에르위니아·아밀로보라 ATCC15580주
에르위니아·카로토보라 ATCC15713주
클렙시엘라·플란티콜라 AJ13399주(FERM BP-6600)(유럽 특허출원공개 955368호 명세서)
클렙시엘라·플란티콜라 AJ13410주(FERM BP-6617)(유럽 특허출원공개 955368호 명세서)
이하, 상기와 같은 미생물에 목적 물질 생산능을 부여하는 방법, 또는 상기와 같은 미생물의 목적 물질 생산능을 증강하는 방법에 대하여 설명한다.
목적 물질 생산능을 부여하기 위해서는, 영양 요구성 변이주, 목적 물질의 아날로그 내성주 또는 대사 제어 변이주의 취득이나, 목적 물질의 생합성계 효소의 발현이 증강된 재조합주의 창제 등, 종래, 코리네형 세균 또는 에스케리키아속 세균 등의 아미노산 생산균의 육종에 채용된 방법을 적용할 수 있다(아미노산 발효, (주) 학회 출판 센터, 1986년 5월 30일 초판 발행, 제 77 내지 100페이지 참조). 여기에서, 목적 물질 생산균의 육종에 있어서, 부여되는 영양 요구성, 아날로그 내성, 대사 제어 변이 등의 성질은 단독이어도 좋고, 2종 또는 3종 이상이어도 좋다. 또한, 발현이 증강되는 목적 물질 생합성계 효소도 단독이어도 좋고, 2종 또는 3종 이상이어도 좋다. 또한, 영양 요구성, 아날로그 내성, 대사 제어 변이 등의 성질의 부여와 생합성계 효소의 증강이 조합되어도 좋다.
목적 물질 생산능을 갖는 영양 요구성 변이주, 아날로그 내성주, 또는 대사 제어 변이주를 취득하기 위해서는, 친주 또는 야생주를 통상의 변이 처리, 즉, X선이나 자외선의 조사, 또는 N-메틸-N'-니트로-N-니트로소구아니딘 등의 변이제 처리 등에 의해 처리하고, 수득된 변이주 중에서 영양 요구성, 아날로그 내성, 또는 대사 제어 변이를 나타내고, 또한, 목적 물질 생산능을 갖는 것을 선택함으로써 수득할 수 있다. 또한, 목적 물질 생산균은 유전자 재조합에 의해 목적 물질의 생합성계 효소의 효소 활성을 증강함으로써도 실시할 수 있다.
이하, 목적 물질 생산능을 부여하는 방법, 및 목적 물질 생산능이 부여된 미생물에 대하여 예시한다.
육종에 의해 목적 물질 생산능을 부여 또는 증강하기 위한 방법으로서는, 예를 들면, 목적 물질 생합성에 관여하는 효소를 코드화하는 유전자의 발현이 증강되도록 개변하는 방법을 들 수 있다. 예를 들면, L-글루탐산 생합성에 관여하는 효소로서는, 예를 들면, 글루탐산데히드로게나제(gdhA), 글루타민신테타제(glnA), 글루탐산신타제(gltBD), 아코니티산히드라타제(acnA, acnB), 시트르산신타제(gltA), 포스포엔올피루브산카복실라제(ppc), 피루브산카복실라제, 피루브산데히드로게나제(aceEF, lpdA), 피루브산키나제(pykA, pykF), 포스포엔올피루브산신타제(ppsA), 엔올라제(eno), 포스포글리세로뮤타제(pgmA, pgmI), 포스포글리세린산키아나제(pgk), 글리세르알데히드-3-인산데히드로게나제(gapA), 트리오스인산 이소머라제(tpiA), 프룩토스비스인산알돌라제(fbp), 포스포프룩토키나제(pfkA, pfkB), 글루코스인산이소머라제(pgi), 메틸시트르산 신타제(prpC) 등이 열거된다. 또한, 효소명 뒤의 괄호안은 유전자명이다(이하의 기재에 있어서도 같음).
상기한 유전자 발현의 증강은 상술한 NXA 경로의 효소 활성 증강에 대하여 기재한 방법에 의해 실시할 수 있다.
상기 효소 유전자 중, 시트르산신타제 유전자, 피루브산데히드로게나제 유전자, 및/또는 글루탐산데히드로게나제 유전자의 발현이 증강하도록 개변된 미생물로서는 WO00/18935호 팜플렛, 유럽 특허출원공개 1010755호 명세서 등에 기재된 미생물을 예시할 수 있다.
L-글루탐산 생산능을 부여하기 위한 개변은, L-글루탐산의 생합성 경로로부터 분기되어 다른 화합물을 생성하는 반응을 촉매하는 효소의 활성을 저하 또는 결손시킴으로써 실시하여도 좋다. L-글루탐산의 생합성 경로로부터 분기되어 L-글루탐산 이외의 화합물을 생성하는 반응을 촉매하는 효소로서는 2-옥소케토글루타르산 데히드로게나제, 석신산 데히드로게나제, 이소시트르산 리아제, 아세토하이드록시산신타제, 아세토락트산 신타제, 포름산아세틸 트랜스퍼라제, 락트산 데히드로게나제, 글루탐산 데카복실라제, 1-피롤린 데히드로게나제, 아세틸-CoA 하이드라제(WO2006/057450) 등이 열거된다.
목적 효소의 활성을 저하 또는 결손시키는 방법으로서는, 통상의 변이 처리법 또는 유전자 재조합 기술에 의해, 게놈 상의 상기 효소의 유전자에 세포 중의 당해 효소의 활성이 저하 또는 결손되도록 하는 변이를 도입하면 좋다. 이러한 변이의 도입은, 예를 들면, 유전자 재조합에 의해, 게놈 상의 효소를 코드화하는 유전자를 결손시키거나, 프로모터나 샤인-달가르노(SD) 서열 등의 발현 조절 서열을 개변하거나 하는 등에 의해 달성된다. 또한, 게놈 상의 효소를 코드화하는 영역에 아미노산 치환(미스센스 변이)을 도입하는 것, 또한 시종 코돈을 도입하는 것(논센스 변이), 1 내지 2염기 부가·결실하는 프레임 시프트 변이를 도입하는 것, 유전자의 일부분, 또는 모든 영역을 결실시킴으로써도 달성할 수 있다(J. Biol. Chem. 272: 8611-8617 (1997)). 또한, 코드화 영역의 전체 또는 일부가 결실된 변이 효소를 코드화하는 유전자를 구축하여, 상동 재조합 등에 의해 당해 유전자로 게놈 상의 정상 유전자를 치환하는 것, 또는 트랜스포손, IS 인자를 당해 유전자에 도입함으로써도 효소 활성을 저하 또는 결손시킬 수 있다.
예를 들면, 상기한 효소의 활성을 저하 또는 결손시키는 변이를 유전자 재조합에 의해 도입하기 위해서는 이하와 같은 방법이 사용된다. 목적 유전자의 부분 서열을 개변하여 정상적으로 기능하는 효소를 생산하지 않도록 한 변이형 유전자를 제작하고, 당해 유전자를 포함하는 DNA로 장내 세균과에 속하는 세균으로 형질 전환하여, 변이형 유전자와 게놈 상의 유전자로 재조합을 일으키게 함으로써 게놈 상의 목적 유전자를 변이형으로 치환할 수 있다. 이러한 상동 재조합을 이용한 유전자 치환은, 「Red 드리븐 인테그레이션법(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97:6640-6645 (2000)), Red 드리븐 인테그레이션법과 λ파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203 (2002))을 조합한 방법(WO2005/010175호, 러시아 출원 2006134574호 참조) 등의 직쇄상 DNA를 사용하는 방법이나, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법 등이 있다(미국 특허 제6303383호; 일본 공개특허 특개평05-007491호 공보). 또한, 상술한 바와 같은 상동 재조합을 이용한 유전자 치환에 의한 부위 특이적 변이 도입은, 숙주 상에서 복제 능력을 갖지 않는 플라스미드를 사용하여도 실시할 수 있다.
또한, 코리네형 세균에 있어서 L-글루탐산 생산능을 부여하는 방법으로서 yggB 유전자(NCgl 1221; NP_600492. Reports small-conductance...[gi: 19552490])를 증폭하는 방법, 코드화 영역 내에 변이를 도입한 변이형 yggB 유전자를 도입하는 방법을 사용하는 것도 가능하다(WO2006/070944).
또한, L-글루탐산 생산능을 향상시키는 방법으로서, D-크실로스-5-인산포스포케톨라제(D-xylulose-5-phosphate phosphoketolase)및/또는 프룩토스-6-인산포스포케톨라제(fructose-6-phosphate phosphoketolase)를 코드화하는 유전자(이들을 합쳐서 포스포케톨라제라고 부른다)를 도입하는 방법이 열거된다. 예를 들면, 포스포케톨라제 활성이 상승된 미생물로서는 이하의 미생물이 열거된다(WO2006/016705).
브레비박테리움·락토페르멘툼 ATCC13869ΔsucA(pVK9-xfp),
브레비박테리움·락토페르멘툼 ATCC13869ΔsucA(pVK9-PS2_xpkA)
L-글루탐산 생산능은, 6-포스포글루콘산데히드라타제 활성 또는 2-케토-3-데옥시-6-포스포글루콘산알돌라제 활성, 또는 이들 양쪽의 활성을 증강시킴으로써도 부여할 수 있다. 6-포스포글루콘산데히드라타제 활성, 2-케토-3-데옥시-6-포스포글루콘산알돌라제 활성을 상승시킨 미생물로서는, 일본 공개특허 특개2003-274988에 개시된 미생물을 들 수 있다. 또한, L-글루탐산 생산능은, L-글루탐산 배출 유전자인 yhfK, ybjL 유전자를 증폭함으로써도 부여할 수 있다(WO2005/085419, WO2008/133161).
또한, 본 발명에 사용하는 L-글루탐산 생산 미생물로서는, 산성 조건 하에서 배양하였을 때에 액체 배지 중에 L-글루탐산의 포화 농도를 초과하는 양의 L-글루탐산을 축적하는 능력(이하, 산성 조건 하에서의 L-글루탐산 축적능이라고 하는 경우가 있다)을 갖는 미생물을 사용할 수 있다. 예를 들면, 유럽 공개공보 1078989호 기재의 방법에 의해, 저pH 환경 하에서 L-글루탐산에 대한 내성이 향상된 균주를 취득함으로써, 포화 농도를 초과하는 양의 L-글루탐산을 축적하는 능력을 부여할 수 있다.
L-글루탐산 생산능을 부여 또는 증강시키는 다른 방법으로서, 유기산 아날로그나 호흡 저해제 등에 대한 내성을 부여하는 방법이나, 세포벽 합성 저해제에 대한 감수성을 부여하는 방법도 열거된다. 예를 들면, 모노플루오로아세트산 내성을 부여하는 방법(일본 공개특허 특개소50-113209), 아데닌 내성 또는 티민 내성을 부여하는 방법(일본 공개특허 특개소57-065198), 우레아제를 약화시키는 방법(일본 공개특허 특개소52-038088), 말론산 내성을 부여하는 방법(일본 공개특허 특개소52-038088), 벤조피론 또는 나프토퀴논류에 대한 내성을 부여하는 방법(일본 공개특허 특개소56-1889), HOQNO 내성을 부여하는 방법(일본 공개특허 특개소56-140895), α-케토말론산 내성을 부여하는 방법(일본 공개특허 특개소57-2689), 구아니딘 내성을 부여하는 방법(일본 공개특허 특개소56-35981), 페니실린에 대한 감수성을 부여하는 방법(일본 공개특허 특개평4-88994) 등이 열거된다.
이러한 내성균의 구체예로서는 하기와 같은 균주가 열거된다.
브레비박테리움·플라붐 AJ3949(FERMBP-2632; 일본 공개특허 특개소50-113209호 참조)
코리네박테리움·글루타미쿰 AJ11628(FERM P-5736; 일본 공개특허 특개소57-065198호 참조)
브레비박테리움·플라붐 AJ11355(FERM P-5007; 일본 공개특허 특개소56-1889호 공보 참조)
코리네박테리움·글루타미쿰 AJ11368(FERM P-5020; 일본 공개특허 특개소56-1889호 공보 참조)
브레비박테리움·플라붐 AJ11217(FERM P-4318; 일본 공개특허 특개소57-2689호 공보 참조)
코리네박테리움·글루타미쿰 AJ11218(FERM P-4319; 일본 공개특허 특개소57-2689호 공보 참조)
브레비박테리움·플라붐 AJ11564(FERM P-5472; 일본 공개특허 특개소56-140895 공보 참조)
브레비박테리움·플라붐 AJ11439(FERM P-5136; 일본 공개특허 특개소56-35981호 공보 참조)
코리네박테리움·글루타미쿰 H7684(FERM BP-3004; 일본 공개특허 특개평04-88994호 공보 참조)
브레비박테리움·락토페르멘툼 AJ11426(FERM P-5123; 일본 공개특허 특개평56-048890호 공보 참조)
코리네박테리움·글루타미쿰 AJ11440(FERM P-5137; 일본 공개특허 특개평56-048890호 공보 참조)
브레비박테리움·락토페르멘툼 AJ11796(FERM P-6402; 일본 공개특허 특개평58-158192호 공보 참조)
L-글루타민 생산능을 갖는 미생물로서 바람직한 예는 글루탐산데히드로게나제 활성을 강화한 세균, 글루타민 신세타제(glnA) 활성을 강화한 세균, 글루타미나제 유전자를 파괴한 세균이다(유럽 특허출원공개 1229121호, 1424398호 명세서). 글루타민 신세타제의 활성 증강은 글루타민아데니닐 트랜스퍼라제(glnE)의 파괴, PII 제어 단백질(glnB)의 파괴에 의해서도 달성할 수 있다. 또한, 에스케리키아속에 속하고, 글루타민 신세타제의 397 위치의 티로신 잔기가 다른 아미노산 잔기로 치환된 변이형 글루타민 신세타제를 갖는 균주도 적합한 L-글루타민 생산균으로서 예시할 수 있다(미국 특허출원공개 제2003-0148474호 명세서).
L-글루타민 생산능을 부여 또는 증강하는 다른 방법으로서, 6-디아조-5-옥소-노르류신 내성을 부여하는 방법(일본 공개특허 특개평3-232497), 퓨린 아날로그 내성 및 메티오닌설폭시드 내성을 부여하는 방법(일본 공개특허 특개소61-202694), α-케토말레인산 내성을 부여하는 방법(일본 공개특허 특개소56-151495) 등이 열거된다. L-글루타민 생산능을 갖는 코리네형 세균의 구체예로서 이하의 미생물이 열거된다.
브레비박테리움·플라붐 AJ11573(FERM P-5492; 일본 공개특허 특개소56-161495)
브레비박테리움·플라붐 AJ11576(FERM BP-10381; 일본 공개특허 특개소56-161495)
브레비박테리움·플라붐 AJ12212(FERM P-8123; 일본 공개특허 특개소61-202694)
L-프롤린 생산능을 갖는 미생물로서는, 예를 들면, L-프롤린에 의한 피드백 저해가 해제된 γ-글루타밀 키나제를 유지하는 세균이나 L-프롤린 분해계가 약화된 세균이 열거된다. L-프롤린에 의한 피드백 저해가 해제된 γ-글루타밀키나제를 코드화하는 DNA를 사용하여 세균을 개변하는 방법은 Dandekar, A. M., Uratsu, S.L., J. Bacteriol., 170, 12, 5943-5 (1988)에 개시되어 있다. 또한, L-프롤린 분해계가 약화된 세균을 수득하는는 방법으로서는, 예를 들면, 프롤린 데히드로게나제 유전자에 효소 활성을 저하시키는 변이를 도입하는 방법이 열거된다. L-프롤린 생산능을 갖는 세균의 예로서는, 에스케리키아·콜라이 NRRL B-12403주 및 NRRL B-12404주(영국 특허 2075056), VKPM B-8012주(미국 특허공개 2002-0058315), 및 독일 특허 3127361호에 개시된 플라스미드 돌연 변이체나 Bloom F.R. 등의 문헌(The 15th Miami winter symposium, 1983, p. 34)에 개시된 플라스미드 변이체를 유지하는 균주 등이 열거된다.
또한, L-프롤린 생산능을 갖는 미생물로서 바람직한 것은 3,4-데하이드록시프롤린, 및 아자티딘-2-카르복실레이트에 내성인 주인 에스케리키아·콜라이 702주(VKPMB-8011)나, 702주의 ilvA 결손주인 702ilvA주(VKPMB-8012주)나, b2682 및 b2683, b1242 또는 b3434 유전자에 코드화되는 단백질의 활성을 증강한 에스케리키아·콜라이 등도 열거된다(일본 공개특허 특개2002-300874호 공보).
코리네형 세균의 L-프롤린 생산균으로서는 DL-3,4-데하이드로프롤린 내성주(FERM BP-1219. 미국 특허 4224409호 공보), 시트르산 합성 효소 활성이 이의 친주의 1.4배 이상으로 상승한 주(FERM P-5332, FERM P-5333, FERM P-5342, FERMP-5343 특허 1426823호), 아세트산 요구성이 부여된 주(FERM P-5931)가 열거된다.
L-아르기닌 생산능을 갖는 미생물로서는 α-메틸메티오닌, p-플루오로페닐알라닌, D-아르기닌, 아르기닌하이드록사믹산, AEC(S-(2-아미노에틸)-시스테인), α-메틸세린, β-2-티에닐알라닌, 또는 설파구아니딘에 내성을 갖는 에스케리키아·콜라이 변이주(일본 공개특허 특개소56-106598호 공보 참조) 등이 열거된다. 또한, L-아르기닌에 의한 피드백 저해에 내성 변이를 갖고, 또한, 높은 활성을 갖는 N-아세틸글루탐산 신타제를 유지하는 L-아르기닌 생산균인, 에스케리키아·콜라이 237주(러시아 특허출원 제2000117677호)도 적합한 L-아르기닌 생산주이다. 이 주는 2000년 4월 10일에 러시안·내셔널·콜렉션·오브·인더스트리얼·마이크로오거니즘(Russian National Collection of Industrial Microorganisms(VKPM), GNII Genetika)에 VKPM B-7925의 수탁 번호로 기탁되어, 2001년 5월 18일에 부다페스트 조약에 기초하는 국제 기탁에 이관되었다. 237주의 유도체로, 아세트산 자화능을 향상시킨 L-아르기닌 생산균인 에스케리키아·콜라이 382주(일본 공개특허 특개2002-017342호 공보)를 사용할 수도 있다. 에스케리키아·콜라이 382주는 2000년 4월 10일 Russian National Collection of Industrial Microorganisms(VKPM)에 VKPM B-7926의 수탁 번호로 기탁되어 있다.
또한, L-아르기닌 생산능을 갖는 미생물로서 L-아르기닌 생합성에 관여하는 효소를 코드화하는 유전자의 발현량을 향상시킨 미생물을 사용할 수 있다. 예를 들면, L-아르기닌 생합성계 효소로서는 N-아세틸글루탐산 신타제(argA), N-아세틸글루타밀인산 리덕타제(argC), 오르니틴아세틸 트랜스퍼라제(argJ), N-아세틸글루탐산키나제(argB), 아세틸오르니틴 트랜스아미나제(argD), 아세틸오르니틴디아세틸라제(argE), 오르니틴카르바모일 트랜스퍼라제(argF), 아르기니노석신산 신타제(argG), 아르기니노석신산 리아제(argH) 카르바모일인산 신타제(carAB)로부터 선택되는 1종 또는 2종 이상이 열거된다. N-아세틸글루탐산 신타제(argA)는, 야생형의 15위치 내지 19위치에 상당하는 아미노산 서열이 치환된 L-아르기닌에 의한 피드백 저해가 해제된 변이형의 유전자를 사용하면 보다 적합하다(유럽 출원공개 1170361호 명세서).
코리네형 세균의 L-아르기닌 생산균으로서는 L-아르기닌 생산능을 갖는 것이면 특별히 제한되지 않지만, 코리네형 세균 야생주; 설파제, 2-티아졸알라닌 또는α-아미노-β-하이드록시발레르산 등의 약제에 내성을 갖는 코리네형 세균; 2-티아졸알라닌 내성에 추가하여, L-히스티딘, L-프롤린, L-트레오닌, L-이소류신, L-메티오닌 또는 L-트립토판 요구성을 갖는 코리네형 세균(일본 공개특허 특개소54-44096호); 케토말론산, 플루오로말론산 또는 모노플루오로아세트산에 내성을 갖는 코리네형 세균(일본 공개특허 특개소57-18989호); 아르기니놀에 내성을 갖는 코리네형 세균(일본 공개특허 특개소 62-24075호); 또는 X-구아니딘(X는 지방산 또는 지방쇄의 유도체)에 내성을 갖는 코리네형 세균(일본 공개특허 특개평2-186995호) 등이 열거된다.
또한, L-아르기닌 생산능을 갖는 코리네형 세균은 5-아자우라실, 6-아자우라실, 2-티오우라실, 5-플루오로우라실, 5-브로모우라실, 5-아자시토신, 6-아자시토신 등에 내성인 변이주; 아르기닌하이드록사메이트, 2-티오우라실에 내성인 변이주, 아르기닌하이드록사메이트 및 6-아자우라실에 내성인 변이주(일본 공개특허 특개소49-126819호); 히스티딘아날로그 또는 트립토판아날로그에 내성인 변이주(일본 공개특허 특개소52-114092호); 메티오닌, 히스티딘, 트레오닌, 프롤린, 이소류신, 리신, 아데닌, 구아닌 또는 우라실(또는 우라실 전구체)의 적어도 하나에 요구성을 갖는 변이주(일본 공개특허 특개소52-99289호 참조); 아르기닌하이드록사메이트에 내성인 변이주(일본국 특허 특공소51-6754호); 석신산 요구성 또는 핵산 염기아날로그에 내성인 변이주(일본 공개특허 특개소58-9692호); 아르기닌 분해능이 결손ㄷ되, 아르기닌의 안타고니스트 및 카나바닌에 내성을 갖고, 리신을 요구하는 변이주(일본 공개특허 특개소52-8729호); 아르기닌, 아르기닌하이드록사메이트, 호모아르기닌, D-아르기닌, 카나바닌 내성, 아르기닌하이드록사메이트 및 6-아자우라실 내성의 변이주(일본 공개특허 특개소53-143288호); 및 카나바닌 내성의 변이주(일본 공개특허 특개소53-3586호) 등으로서 육종할 수 있다.
L-아르기닌 생산능을 갖는 코리네형 세균의 구체예로서는 하기와 같은 균주가 열거된다.
브레비박테리움·플라붐 AJ11169(FERM P-4161)
브레비박테리움·락토페르멘툼 AJ12092(FERM P-7273)
브레비박테리움·플라붐 AJ11336(FERM P-4939)
브레비박테리움·플라붐 AJ11345(FERM P-4948)
브레비박테리움·락토페르멘툼 AJ12430(FERM BP-2228)
또한, 아르기닌 리프레서인 ArgR을 결손된 주(미국 특허출원공개 2002-0045223호, 세포 내의 글루타민 신테타제 활성을 상승시킨 주(미국 특허출원공개 2005-0014236호 공보)를 사용할 수 있다.
L-시트룰린, L-오르니틴도 L-아르기닌과 생합성 경로가 공통되고, N-아세틸글루탐산 신타제(argA), N-아세틸글루타밀인산 리덕타제(argC), 오르니틴아세틸 트랜스퍼라제(argJ), N-아세틸글루탐산 키나제(argB), 아세틸오르니틴 트랜스아미나제(argD), 아세틸오르니틴 데아세틸라제(argE)의 효소 활성을 상승시킴으로써 이들의 생산능을 부여할 수 있다(국제공개 2006-35831호 팜플렛).
γ-아미노부티르산(GABA; gamma-aminobutiric acid) 생산균으로서는 글루탐산 데카복실라제의 활성을 증강시킨 주(Microb Cell Fact. 2010 Nov 12; 9:85. Amino Acids. 2010 Nov; 39(5): 1107-16 US20100324258호 공보)를 사용할 수 있다.
푸트레신 생산균으로서는 4-히드록시부티레이트 리덕타제(4-hydroxybutyrate reductase); 석시닐-CoA 리덕타제(알데히드 형성)(succinyl-CoA reductase(aldehyde forming)); 및 4-히드록시부티레이트 데히드로게나제(4-hydroxybutyrate dehydrogenase)를 강화한 주(WO2011047101호 공보), 감마-아미노부티르알데히드 데히드로게나제(gamma-aminobutyraldehyde dehydrogenase)를 강화한 주(FEBS Lett. 2005 Aug 1; 579(19): 4107-12.)를 사용할 수 있다.
<2> 목적 물질의 제조 방법
상기와 같은 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여, 목적 물질을 당해 배지 중에서 생성 축적시키고, 당해 배지로부터 목적 물질을 채취함으로써 목적 물질을 제조할 수 있다.
배양에 사용하는 배지는, 탄소원, 질소원, 무기염류, 그 이외에 필요에 따라 아미노산, 비타민 등의 유기 미량 영양소를 함유하는 통상의 배지를 사용할 수 있다. 합성 배지 또는 천연 배지 모두 사용할 수 있다.
탄소원으로서는 크실로스를 포함하는 한, 다른 탄소원, 예를 들면, 글루코스, 글리세롤, 프룩토스, 슈크로스, 말토스, 만노스, 갈락토스, 아라비노스, 전분 가수분해물, 당밀 등의 당류를 사용할 수 있고, 그 이외에 아세트산, 시트르산 등의 유기산, 에탄올 등의 알코올류도 단독 또는 다른 탄소원과 병용하여 사용할 수 있다.
크실로스와 다른 탄소원의 혼합 비율은 어느 것이어도 좋지만, 크실로스: 다른 탄소원(중량비)은 바람직하게는 1:0.1 내지 100, 보다 바람직하게는 1:0.1 내지 10, 보다 바람직하게는 1:0.1 내지 5, 보다 바람직하게는 1:1 내지 5, 더 바람직하게는 1:1 내지 3이다.
배지 중의 탄소원의 농도로서는, 목적 물질을 제조하는데 적합한 농도이면 어떤 농도로 사용하여도 좋다. 배지 중의 탄소원 농도로서는, 바람직하게는 0.1w/v% 내지 50w/v% 정도, 보다 바람직하게는 0.5w/v% 내지 40w/v% 정도, 특히 바람직하게는 1w/v% 내지 30w/v% 정도이다.
크실로스, 또는 크실로스와 글루코스와 같은 6탄당의 혼합물은 바이오매스가 충분히 이용되지 않은 공급원으로부터 수득할 수 있다. 이들 5탄당, 6탄당은 증기 및/또는 농산 가수분해, 희산 가수분해, 셀룰라제와 같은 효소를 사용하여 가수분해, 또는 알칼리 처리에 의해 식물 바이오매스로부터 유리될 수 있다. 기질이 셀룰로스계 재료인 경우, 셀룰로스는 동시에 또는 개별적으로 당에 가수분해되어 목적 물질의 생산에 사용할 수 있다. 헤미셀룰로스는 일반적으로 셀룰로스보다도 당에 가수분해되기 쉽기 때문에 셀룰로스계 재료를 미리 가수분해하여 5탄당을 분리하고, 계속해서 증기, 산, 알칼리, 셀룰라제 또는 이들 조합에 의한 처리에 의해 셀룰로스를 가수분해하여 6탄당을 생성시키는 것이 바람직하다.
또한, 본 발명에서의 배지 중에 포함되는 크실로스는, 미생물에 글루코스, 갈락토스, 아라비노스로부터의 변환 경로를 보유시켜 각 헥소스로부터 크실로스(D-크실로스)로 변환시킴으로써 공급하여도 좋다.
질소원으로서는 암모니아, 우레아, 황산암모늄, 탄산암모늄, 염화암모늄, 인산암모늄, 아세트산암모늄 등의 암모늄염 또는 질산염 등을 사용할 수 있다. 유기 미량 영양소로서는 아미노산, 비타민, 지방산, 핵산, 또는 이들을 함유하는 펩톤, 카자미노산, 효모 엑기스, 대두 단백 분해물 등을 사용할 수 있고, 생육에 아미노산 등을 요구하는 영양 요구성 변이주를 사용하는 경우에는 요구되는 영양소를 보충하는 것이 바람직하다. 무기염류로서는 인산염, 마그네슘염, 칼슘염, 철염, 망간염 등을 사용할 수 있다.
배양은, 바람직하게는, 발효 온도 20 내지 45℃, pH를 3 내지 9로 제어하고, 통풍 배양을 실시한다. 또한, pH 조정에는 무기 또는 유기의 산성 또는 알칼리성 물질, 또는 암모니아 가스 등을 사용할 수 있다. 이러한 조건 하에서, 바람직하게는 10시간 내지 120시간 정도 배양함으로써 배양액 중 또는 균체 내에 목적 물질이 축적된다.
또한, 목적 물질이 L-글루탐산인 경우, L-글루탐산이 석출되는 조건으로 조정된 액체 배지를 사용하여 배지 중에서 L-글루탐산을 석출시키면서 생성, 축적시키도록 배양을 실시할 수도 있다. L-글루탐산이 석출되는 조건으로서는, 예를 들면, pH 5.0 내지 4.0, 바람직하게는 pH 4.5 내지 4.0, 더 바람직하게는 pH 4.3 내지 4.0, 특히 바람직하게는 pH 4.0을 들 수 있다. 또한, 산성 조건 하에서의 생육의 향상, 및 효율적인 L-글루탐산의 석출을 양립하기 위해서는, pH는 바람직하게는 5.0 내지 4.0, 보다 바람직하게는 4.5 내지 4.0, 더 바람직하게는 4.3 내지 4.0인 것이 바람직하다. 또한, 상기 pH에서의 배양은 배양의 전체 기간이어도 좋고, 일부 기간이어도 좋다.
채취되는 목적 물질은 목적 물질 이외에 미생물 균체, 배지 성분, 수분 및 미생물의 대사 부산물을 포함하여도 좋다. 채취된 목적 물질의 순도는 50% 이상, 바람직하게는 85% 이상, 특히 바람직하게는 95% 이상이다(JP1214636B, USP 5,431,933, 4,956,471, 4,777,051, 4946654, 5,840,358, 6,238,714, US2005/0025878)).
배양 종료 후의 배양액으로부터 목적 물질을 채취하는 방법은 공지된 회수 방법에 따라서 실시하면 좋다. 예를 들면, 종래부터 주지되어 있는 이온 교환 수지법(Nagai, H. et al.: Separation Science and Technology, 39(16), 3691-3710), 막 분리법(일본 공개특허 특개평9-164323호, 일본 공개특허 특개평9-173792호), 정석법(WO2008/078448, WO2008/078646), 그 밖의 방법을 조합함으로써 목적 물질을 채취할 수 있다.
또한, 목적 물질이 배지 중에 석출되는 경우에는, 원심 분리 또는 여과 등에 의해 회수할 수 있다. 또한, 배지 중에 석출된 목적 물질은 배지 중에 용해되어 있는 목적 물질을 정석(晶析)한 후에 함께 단리하여도 좋다.
실시예
이하, 본 발명을 실시예에 의해 보다 더 구체적으로 설명한다.
이하의 실시예에서 사용한 배지 조성을 이하에 나타낸다.
〔LB 배지〕
박토트립톤 10g/L, 효모 엑기스 5g/L, NaCl 5g/L, pH 7.0
〔LBGM9〕
LB 배지에, 최소 배양 성분(글루코스 5g/L, 황산마그네슘 2mM, 인산칼륨 3g/L, 염화나트륨 0.5g/L, 염화암모늄 1g/L, 인산2나트륨 6g/L)을 첨가한 것
〔MSII-Glucose 배지〕
A구
글루코스 40g/L
MgSO4·7H2O 0.5g/L
B구
(NH4)2SO4 20g/L
KH2PO4 2g/L
NaCl 0.5g/L
효모 엑기스 2g/L
CaCl2·7H2O 0.25g/L
FeSO4·7H2O 20mg/L
MnSO4·nH2O 20mg/L
Trace element※ 4ml/l
L-Lys 200mg/L
DL-Met 200mg/L
DAP 200mg/L
A구, B구를 각각 120℃, 20분 오토클레이브한 후 혼합한다.
※Trace element
CaCl2·2H2O 0.66g/L
ZnSO4·7H2O 0.18g/L
CuSO4·5H2O 0.16g/L
MnSO4·4H2O 0.15g/L
CoCl2·6H2O 0.18g/L
H3BO3 0.10g/L
Na2MoO4 0.30g/L
〔MSII-Xylose 배지〕
MSII-Glucose 배지의 글루코스(40g/L)를 크실로스(40g/L)로 치환한 것.
〔MSII-GX 배지〕
MSII-Glucose 배지의 글루코스(40g/L)를 글루코스(20g/L)와 크실로스(20g/L)의 혼합물로 치환한 것.
〔MSII-SX 배지〕
MSII-Glucose 배지의 글루코스(40g/L)를 슈크로스(20g/L)와 크실로스(20g/L)의 혼합물로 치환한 것.
〔E1 합성 배지〕
A구
NH4Cl 20mM
MgSO4·7H2O 2mM
Na2HPO4 40mM
KH2PO4 30mM
CaCl2 0.01mM
FeSO4·7H2O 0.01mM
MnSO4·4-5H2O 0.01mM
Citrate 5mM
pH Free
필터 멸균
B-1구
탄소원 50(또는 100)mM
필터 멸균
B-2구
티아민-HCl 1mM
필터(0.22㎛) 멸균 후, B-1에 첨가
C구
MES-NaOH(pH6.8) 50mM
필터(0.22㎛) 멸균
A 내지 C구는 모두 5배 농도의 용액을 조제하고, 스톡 솔루션(Stock solution)으로 한다.
〔CM-Dex 배지〕
폴리펩톤 10g/L
효모 엑기스 10g/L
글루코스 5g/L
KH2PO4 1g/L
요소 3g/L
MgSO4·7H2O 0.4g/L
FeSO4·7H2O 0.01g/L
MnSO4·5H2O 0.01g/L
콩 여액(대두 가수분해물) 1.2g/L(T-N)
KOH를 사용하여 pH7.5로 조정.
〔Glc 배지〕
글루코스 80g/L
(NH4)2SO4 30g/L
KH2PO4 1g/L
MgSO4·7H2O 0.4g/L
FeSO4·7H2O 0.01g/L
MnSO4·5H2O 0.01g/L
비타민B1 200㎍/L
비오틴 60㎍/L
콩 여액(대두 가수분해물) 0.48g/L(T-N)
KOH를 사용하여 pH8.0으로 조정.
〔Xyl 배지(비오틴 제한)〕
Glc 배지의 글루코스(80g/L)를 크실로스(80g/L)로 치환하고, 또한 비오틴을 제외한 것.
〔MS 배지〕
A구
글루코스 또는 크실로스 40g/L
글루코스와 크실로스(1:1) 40g/L
MgSO4·7H2O 1g/L
B구
(NH4)2SO4 20g/L
KH2PO4 1g/L
효모 엑기스 2g/L
FeSO4·7H2O 10mg/L
MnSO4·nH2O 10mg/L
A구, B구를 각각 120℃, 20분 오토클레이브한 후 혼합하고, 약전 탄산칼슘 50g/L을 가한다.
〔실시예 1〕판토에아·아나나티스로의 NXA 경로의 도입
(1) NXA 경로 도입용 플라스미드 pTWV228Ptac_ccrNXA의 구축
NXA 경로가 보고되어 있는 공지의 세균으로서 씨. 크레센투스(C. crescentus)(Stephens, C. et al., J. Bacteriol. 2007, 189(5): 181-2185)가 알려져 있다. 씨. 크레센투스(C. crescentus)의 NXA 경로의 각 효소를 코드화하는 유전자의 취득에 있어서 이하의 방법을 채용하였다.
씨. 크레센투스(C. crescentus)의 게놈은 약 4Mb이며, 5개의 유전자가 오페론 구조를 이루고 있다(Journal of Bacteriology, 189: 2181-2185, 2007). 씨. 크레센투스(C. crescentus)에서, 게놈 공개 균주(CB-15(ATCC19089). ATCC로부터 입수 가능)로부터 게놈을 추출하고, 각 유전자의 클로닝과 발현 벡터 구축을 시험해 보았다.
클론테크 인-퓨전 클로닝 키트(Clontech In-Fusion Cloning Kit)를 이용하여 발현 벡터의 구축을 실시하였다.
이하 4개의 DNA 단편을 i), ii), iii)에 대해서는 씨. 크레센투스(C. crescentus) CB-15(ATCC19089)의 염색체 DNA를 주형으로서, iv)에 대해서는 pMW119를 주형으로서, PCR로 증폭시켰다. 괄호 안은 PCR에 사용한 프라이머를 나타낸다.
i) tac 프로모터 서열(이하, 「Ptac」라고 기재한다)(PtwvPtacf: 서열번호 1, 0823Ptacr: 서열번호 2)
ii) xylX, ccrxylA, ccrxylB, 및 xylC를 포함하는 단편(Ptac0823f: 서열번호 3, 0819r: 서열번호 4)
iii) xylD와 이의 하류 약 120bp 영역(0819f: 서열번호 5, 219cc0819r: 서열번호 6)
iv) pMW119/SmaI(219f: 서열번호 7, 219r: 서열번호 8)
계속해서, 정제한 i), ii)의 PCR 산물을 주형으로 하고, PtwvPtacf 및 0819r을 프라이머로 하여 이들 PCR 산물이 결합한 단편 Ptac_xylXccrAccrBC를 PCR로 증폭시켰다. 수득된 Ptac_xylXccrAccrBC와, 상기 iii) 및 iv)의 PCR 산물의 3가지를, 클론테크 인-퓨전 클로닝 키트(Clontech In-Fusion Cloning Kit)를 사용하여 인-퓨전(In-Fusion) 반응하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체로부터 목적의 플라스미드 pMW119Ptac_ccrNXA를 취득하였다.
다음에, pMW119Ptac_ccrNXA를 주형에, PtwvPtacf 및 219CC0819r를 프라이머로 하여 Ptac을 포함하는 ccrNXA 오페론을 증폭시켰다. 수득된 증폭 산물과, SmaI로 소화(消化)한 pTWV228을 인-퓨전(In-Fusion) 반응하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체로부터 목적의 플라스미드 pTWV228Ptac_ccrNXA를 취득하였다.
(2) pUT399에 카나마이신 내성 Mini-Mu를 탑재한 플라스미드 pUT-MuKm의 구축
pUT399는 R6K의 복제 기점을 갖고, 접합 전달에 필요한 mob 영역을 포함하고 있고, pir 유전자를 갖지 않는 균주에서는 복제할 수 없는 플라스미드이다(Biomedal사에서 입수 가능: R. Simon., et al., BIO/TECHNOLOGY NOVEMBER 1983, 784-791 참조, 미국 특허 제7090998호).
pCE1134(일본 공개특허 특개평2-109985호 공보)는 MudII1734를 포함하는 플라스미드이며, Mini-Mu 유닛 내에 Km 내성 유전자와 lacXYZ 유전자를 탑재하고 있다. 이하의 방법에 의해, pCE1134의 Mini-Mu 유닛 내에서 lacXYZ 영역을 결실한 DNA 단편을 조제하여, pUT399에 클로닝하였다.
pCE1134를 주형으로서, 프라이머 attL-F(서열번호 9)와 nptII-R(서열번호 10)을 사용하여, left end와 트랜스포사제를 코드화하는 MuAB 유전자의 리프레서인 MuCts, Km 내성 유전자를 포함하는 단편을 PCR에 의해 취득하였다. 또한, 마찬가지로 pCE1134를 주형으로서, 프라이머 attR-F(서열번호 11)와 attR-R(서열번호 12)을 사용하여 right end를 포함하는 단편을 취득하였다. 이들 2단편을 주형으로서, 프라이머 attL-F와 attR-R를 사용하여 크로스 오버 PCR(cross over PCR)을 실시하고, 수득된 약 2.3kb의 단편을 pUT399의 SmaI 사이트에 도입하였다. 이렇게 하여 플라스미드 pUT-MuKm을 수득하였다.
상기와 같이 하여 구축한 Mini-Mu 유닛은, 전이 유닛 내에 Km 내성 유전자와 클로닝 사이트로서 8염기 인식의 NotI 사이트를 갖기 때문에, 각종 유전자가 클로닝 가능하다.
(3) pTWV228Ptac_ccrNXA의 약제 내성 유전자의 치환
pTWV228Ptac_ccrNXA의 암피실린 내성 유전자를 λRed법에 의해 카나마이신 내성 유전자로 치환하였다.
pUT_MuKm을 주형으로서, 프라이머 Ap-Km-fw(서열번호 13)와 Ap-Km-rv(서열번호 14)를 사용하여, 카나마이신 내성 유전자를 포함하는 서열(ntpII 단편)을 증폭시켰다.
PCR 반응은 프라임스타 HS 폴리머라제(PrimeSTAR HS polymerase)(다카라바이오)를 사용하고, 이 효소에 부속의 프로토콜에 따라 실시하였다.
pTWV228Ptac_ccrNXA를 갖는 이. 콜라이(E. coli) JM109에, 헬퍼 플라스미드인 RSF_Red_TER(US20090286290A1, WO2008/075483)를 도입하고, 50ml LB(1mM IPTG, 100mg/L 암피실린, 25mg/L 클로람페니콜을 포함한다) 배지에서 37℃로 OD660값이 0.4가 될 때까지 배양하였다.
상기 RSF_Red_TER은 λ-의존적 인테그레이션(Red-driven integration)을 일으키기(λRed법) 위한 헬퍼 플라스미드이며, lacI 유전자에 의해 λ의 gam, bet 및 exo의 각 유전자의 발현을 유도할 수 있다. 또한, 이 플라스미드는 레반스크라제 유전자(sacB)를 포함하고 있고, 이 유전자에 의해, 슈크로스를 포함하는 배지에서 세포로부터 플라스미드를 탈락시킬 수 있다. 또한, 클로람페니콜 내성 유전자를 포함하고 있다.
상기한 바와 같이 하여 배양한 균체를 집균한 후, 10% 글리세롤 용액으로 2회 원심 세정하고, 1mL 10% 글리세롤 용액에 현탁하였다. 그 후에 상기에서 수득된 ntpII 단편으로 일렉트로포레이션법에 의해 형질 전환하고, 40mg/L의 카나마이신을 포함한 LB 한천 배지에서 형질 전환체를 선발하였다. 수득된 형질 전환체를 LB(1mM IPTG, 10% 슈크로스, 40mg/L 카나마이신을 포함한다) 한천 배지에 식종계대하고, 37℃에서 하룻밤 배양하여 단일 클론을 취득하였다. 수득된 형질 전환체가 100mg/L인 암피실린을 포함한 LB 한천 배지 상에서 생육 불가능한 것을 확인하고, pTWV228Ptac_ccrNXA의 암피실린 내성 유전자가 카나마이신 내성 유전자로 치환된 것을 확인하였다. 수득된 플라스미드를 pTWVPtac_ccrNXA_Km으로 하였다.
(4) xylD를 포함하는 플라스미드의 구축
클론테크 인-퓨전 클로닝 키트(Clontech In-Fusion Cloning Kit)를 이용하여 구축을 실시하였다.
우선, 각각의 유전자를 pUC18에 클로닝한 플라스미드를 주형으로 하고, xylD_IFS_5742-10-5(서열번호 15)와 xylD_IFS_5742-10-6(서열번호 16)을 프라이머로 하여 xylD를 포함하는 DNA 단편을 PCR로 증폭시켰다. 구체적으로는 이하의 방법으로 SfiI 사이트를 제거한 pUC18에 클로닝하였다.
씨. 크레센투스(C. crescentus) CB-15주의 게놈 DNA를 주형으로 하고, CC0819-01F_4691-88-7 (서열번호 17) 및 CC0819-01R_5659-9-1(서열번호 18), 및 CC0819-02F_5659-9-2(서열번호 19) 및 CC0819-02R_4691-88-10(서열번호 20)을 프라이머로 하는 PCR에 의해, 각각 1130 bp 및 653 bp의 단편을 증폭시켰다. 계속해서, 인비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345, 2009)으로, SmaI로 소화한 pUC18과, 상기 2개의 증폭 단편을 어셈블함으로써 SfiI 사이트가 제거되어, xylD 유전자가 삽입된 pUC18-xylD를 수득하였다.
한편, pSTV28-Ptac-Ttrp을 상법에 따라 SmaI로 소화하였다. xylD 유전자의 DNA 단편과 벡터 DNA 단편을 인-퓨전(In-Fusion) 반응하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체로부터 목적의 플라스미드, pSTVPtac_xylD_Ttrp을 취득하였다.
pSTV28-Ptac-Ttrp은 이하와 같이 하여 구축하였다.
서열번호 32의 서열을 갖는 tac 프로모터 및 trp 터미네이터의 서열을 갖는 DNA 단편(PtacTtrp)을 합성하고, pMW219 벡터의 KpnI-BamHI 사이에 연결함으로써 pMW219-Ptac-Ttrp을 수득하였다. KpnI 및 BamHI로 각각 소화한 pSTV28과 pMW219-Ptac-Ttrp을 등량 혼합하고, 라이게이션 반응 후 JM109를 형질 전환하여, Cm 내성이 나타난 콜로니로부터 플라스미드를 추출하였다. 수득된 플라스미드에 대하여, KpnI와 BamHI에 의한 더블 다이제스쳔(double digestion)에 의해 상정되는 단편 길이 약 400bp와 3 kb(정확하게는 389bp와 2994bp)에 1개씩 밴드가 있는 것을 확인하고, pSTV28-Ptac-Ttrp을 수득하였다.
(4) NXA 경로가 도입된 판토에아·아나나티스에 의한 L-글루탐산 생산
상기 pTWVPtac_ccrNXA_Km으로, 일렉트로포레이션법(미국 특허 6682912호 참조)에 의해 피. 아나나티스(P. ananatis) NA1주를 형질 전환하였다. pTWVPtac_ccrNXA_Km을 도입한 주는 LBGM9에 카나마이신을 최종 농도 40mg/L이 되도록 첨가한 플레이트 배지를 사용하였다.
약제를 첨가한 LBGM9 플레이트에, 34℃에서 하룻밤 배양한 피. 아나나티스(P. ananatis) NA1주, 및 각 형질 전환주의 균체를 1/6 플레이트만큼 긁어내어, MSII-Xylose, 또는 MSII-GX 배지 5ml를 포함한 큰 시험관에 식균하고, 34℃, 120rpm에서 48시간 배양하여, 잔당, L-글루탐산(Glu) 및 크실론산의 축적량을 측정하였다. 결과를 표 2, 표 3에 나타낸다.
피. 아나나티스(P. ananatis) NA1주를 글루코스와 크실로스의 혼합 탄소원(MSII-GX 배지)으로 배양하였을 때에는 글루탐산 수율은 25.7%이었다(표 2). 이 때, 크실론산의 축적이 관찰되고, 크실로스는 대부분 크실론산으로 변환되는 것이 시사되었다. 피. 아나나티스(P. ananatis) NA1주에서 크실론산의 축적이 관찰된 것은 피. 아나나티스(P. ananatis)의 글루코스데히드로게나제의 활성에 의한 것이라고 추측된다.
한편, 피. 아나나티스(P. ananatis) NA1주에 pTWVPtac_ccrNXA_Km을 도입한 주에서는, 글루코스와 크실로스의 혼합 탄소원(MSII-GX 배지)에서 배양하였을 때에, 친주와 비교하여 매우 높은 글루탐산 수율을 나타내었다(수율 69.9%). 친주에 있어서, 크실로스로부터 글루탐산이 거의 생성되지 않은 것을 고려하여, pTWVPtac_ccrNXA_Km 도입주의 글루코스로부터의 글루탐산 수율이 친주와 동등하다고 가정하면, 크실로스로부터 NXA 경로를 통한 글루탐산 수율은 86% 정도라고 어림잡을 수 있다. 실제로, 크실로스를 단일 탄소원으로서 배양하였을 때에는 (MSII-Xylose), pTWVPtac_ccrNXA_Km 도입주는 수율 80%로 Glu를 생성하였다(표 3).
〔실시예 2〕에스케리키아·콜라이로의 NXA 경로의 도입
(1) 이. 콜라이(E. coli)에서의 NXA 경로 발현
TCA 사이클 중의 효소이고, 이소시트르산으로부터 αKG를 생성하는 이소시트르산데히드로게나제의 결손주(Δicd)를 사용하여, 크실로스를 단일 탄소원으로 한 최소 배지에서의 생육 상보에 의한 NXA 경로의 발현을 시험하였다. icd 유전자 결손주는 αKG를 생성할 수 없기 때문에 크실로스를 단일 탄소원으로 한 최소 배지에서는 생육할 수 없지만, NXA 경로의 도입에 의해 크실로스로부터 αKG를 생성할 수 있으면, 이 배지에서 생육 가능하다.
구체적으로는 케이오 콜렉션(Keio Collection)주의 icd 유전자 결손주인 JW1122주(http://cgsc.biology.yale.edu/Person.php?ID=99553, E. coli Genetic Resource Center at Yale CGSC, The Coli Genetic Stock Center로부터 입수 가능)를 숙주 균주로 하고, 플라스미드에 의해 NXA 경로를 도입, 발현시킴으로써 NXA 경로가 이. 콜라이(E. coli)에서도 기능할 수 있는지 여부를 검토하였다.
표 4에 구축한 플라스미드와 icd 유전자 결손주에서의 생육 상보의 결과를 기재하였다. 씨. 크레센투스(C. crescentus) 유래의 NXA 경로 오페론(xylX, ccrxylA, ccrxylB, xylC, xylD)과 tac프로모터(tacpromoter)를 조합한 플라스미드 pMW119Ptac_ccrNXA(실시예 1에서 작제)를 도입한 균주가, 크실로스를 단일 탄소원으로 한 M9 최소 배지(플레이트)(Sambrook, J. et al., Molecular Cloning, Cold Spring Harbor Laboratory Press (1989))에서 생육하는 것을 확인하였다.
같은 검토를 액체 배양에서도 실시하였다. 36련(連) 배양 장치를 사용하고, 경시적으로 크실로스 또는 αKG를 단일 탄소원으로서 포함하는 M9 최소 배지 및 E1 합성 배지에서의 생육(O.D.)을 측정하였다. 결과를 도 1에 도시하였다. 플레이트에서의 배양과 마찬가지로, 벡터 컨트롤주가 크실로스 단일 탄소원의 M9나 E1 배지에서 생육되지 않는 것에 반해, NXA 경로 도입주에서는 양호하게 생육되었다. 이들 결과는 본 균주가 크실로스를 NXA 경로 유래로 자화함으로써 생육된 것, 즉, 씨. 크레센투스(C. crescentus) 유래 NXA 경로가 이. 콜라이(E. coli)에서도 기능한 것이라고 생각되었다.
(2) 이. 콜라이(E. coli) L-글루탐산 생산주에서의 NXA 경로 발현
이. 콜라이(E. coli) L-글루탐산 생산균주로서 αKGDH 결손주인 MG1655ΔsucA(미국 특허출원공개 제20050106688호)를 사용하였다. 이 균주에, pMW119Ptac_ccrNXA 또는 컨트롤로서 pMW119를 도입하여, MG1655ΔsucA/pMW119Ptac_ccrNXA 및 MG1655ΔsucA/pMW119를 수득하였다. 이들 균주를 탄소원으로서 글루코스(40g/L), 크실로스(40g/L), 또는 글루코스 및 크실로스(각 20g/L)를 첨가한 MS 배지에서 플라스크 배양하였다. 탄소원으로서 글루코스만을 포함하는 배지에서는 24시간, 다른 배지에서는 48시간 배양하였다. 결과를 도 2에 도시하였다. 도면에 기재된 균주명에 붙인 325, 425 및 513은 클론 번호를 나타낸다.
탄소원을 글루코스 및 크실로스의 혼합계로 하였을 경우, 컨트롤 균주(MG1655ΔsucA/pMW119)가 L-글루탐산을 15 내지 16g/L 축적하는 것에 반해, ccrNXA 오페론 발현주(MG1655ΔsucA/pMW119Ptac_ccrNXA)에서의 L-글루탐산 축적은 12g/L 전후가 되고, L-글루탐산의 축적, 수율은 저하되는 경향을 보였다. 탄소원으로서 크실로스 단독의 경우도 같았다. 부생물에 대하여, 유기산류 및 크실론산에 대하여 분석하였다. 그 결과, 주로 아세트산과 크실론산이 축적되는 것을 알 수 있었다.
(3) 이. 콜라이(E. coli)에서의 NXA 경로의 율속점(律速点) 해석
상기한 바와 같이, 이. 콜라이(E. coli) L-글루탐산 생산주에서는 ccrNXA 오페론 발현주의 배양 상청액 중에 NXA 경로의 중간체인 크실론산이 검출된 사실로부터, 흡수된 크실로스의 일부가 NXA 경로를 경유할 가능성이 높다고 생각되었다. 또한, 이하의 과제가 추측되었다.
i) 균체 내에 흡수된 크실로스는 이. 콜라이(E. coli) 고유의 크실로스 자화계와 NXA 경로 양쪽이 이용 가능하지만, 고유계 최초의 효소인 크실로스 이소머라제(XylA)와 NXA 경로 최초의 효소인 크실로스데히드로게나제(XDH)의 활성 또는 기질 특이성의 차이로, 일정량이 고유계에 이용되고, NXA 경로를 경유하는 대사 플럭스의 유량이 적다고 하는 가능성.
ii) NXA 경로 상에 율속점 또는 미분류의 바이패스 경로가 있고, αKG가 생성되지 않을 가능성.
i)에 대하여는, ccrNXA 오페론 발현 벡터를 저카피형(pMW119)에서 중카피형(pTWV228)으로 변경함으로써 NXA 경로의 각 효소량을 증가시키고, NXA 경로로의 기질의 인입량을 증가시킴으로써 개선할 수 있는 가능성이 생각되었다.
ii)에 대하여는, 율속점의 해석과 그 결과를 기초로 한 육종 개량을 실시함으로써 개선할 수 있는 가능성이 고려되었다.
이상의 사실로부터,
a) 이. 콜라이(E. coli) 고유 크실로스 자화 경로 결손주(ΔsucAΔxylA)를 숙주로 하고, 또한 ccrNXA 오페론을 발현시켜 강제적으로 탄소 플럭스가 NXA 경로를 경유하는 균주의 구축과 배양 평가, 및 b) 중카피형 벡터를 사용한 ccrNXA 오페론 발현 벡터의 구축과 그 발현 벡터를 사용한 균주의 구축 및 배양 평가, 및 c) 율속점의 해석을 실시하였다.
프라이머 xylA-H1P1-5742-5-1(서열번호 21) 및 xylA-H2P2-5742-5-2(서열번호 22)를 사용하여 MG1655ΔsucA로부터, λ-Red법에 의해 이. 콜라이(E. coli) 고유 크실로스 자화 유전자 xylA를 결손시켜 MG1655ΔsucAΔxylA주를 수득하였다. 이 균주에 pMW119Ptac_ccrNXA를 도입하여 xylA를 결손한 ccrNXA 오페론 발현주를 수득하였다.
도 3에, xylA를 결손한 ccrNXA 오페론 발현주를 (3)과 동일하게 하여 배양하였을 때의 L-글루탐산 배양 결과를 도시하였다. 도 3 중, 「ccrNXA」는 pMW119Ptac_ccrNXA를 나타내고, 거기에 계속되는 숫자는 클론 번호를 나타낸다.
ΔsucAΔxylA주의 벡터 컨트롤주가 크실로스를 자화할 수 없고, 글루코스로부터만 균체 형성과 L-글루탐산 생산을 할 수 있는 것에 반해, ccrNXA 오페론 발현주에서는, 크실로스의 소비와 크실로스 유래라고 생각되는 L-글루탐산 생산이 보였다. 한편, L-글루탐산 축적량은 모델 균주(ΔsucA주)에는 미치지 않는 것, 및 NXA 경로의 대사 중간체인 크실론산이 축적되는 것을 알 수 있었다. 이 결과로부터, NXA 경로 전체의 대사 플럭스량이 부족할 가능성이 시사되었다. 또한, αKG의 부생이 보이지 않은 사실로부터, GDH의 활성 발현에 필요한 NADPH의 공급은 이 단계에서는 문제가 되지 않고 있는 것을 생각할 수 있었다.
계속해서, 중카피형 벡터를 사용하여 ccrNXA 오페론 발현 벡터를 구축하였다. pMW119Ptac_ccrNXA를 주형으로 하고, PtwvPtacf(서열번호 1)와 0819r(서열번호 4)을 프라이머로 하여, tac 프로모터 영역을 포함하는 ccrNXA 오페론을 증폭시켰다. pTWV228을 SmaI로 소화하고, tac 프로모터 영역을 포함하는 ccrNXA 오페론의 PCR 단편과 함께 인-퓨전(In-Fusion) 반응을 실시하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체로부터 목적의 플라스미드 pTWVPtac_ccrNXA를 취득하였다. 이 플라스미드를 MG1655ΔsucA주에 도입하고, 수득된 주를 (3)과 같이 하여 배양을 실시하였다. 결과를 도 4에 도시하였다. 도면 중, 「ΔsucA」는 MG1655ΔsucA주를, 「/pTWV」 및 「/v」는 pTWV228을 유지하고 있는 것을 각각 나타낸다. 또한, pTWV110 내지 pTWV119는 pTWV228Ptac_ccrNXA의 클론 번호를 나타낸다.
글루코스만을 탄소원으로 하였을 경우에는, 중카피형 ccrNXA 오페론 발현주는 컨트롤주와 거의 동등한 L-글루탐산을 축적한 한편, 글루코스 및 크실로스의 혼합 배양계에서는 L-글루탐산 축적은 오히려 저하되는 경향을 보였다. 또한, 형제주 사이에서의 성적에도 편차가 보였다. 고려되는 이유의 하나로 중카피형 발현 벡터의 탈락을 생각할 수 있었다. 또한, 지금까지의 균주와 마찬가지로 크실론산의 축적이 관찰되었다.
ccrNXA 오페론의 카피수 증가에 의해, NXA 경로의 각 효소의 활성이 증가하는지를 확인하기 위해서, NXA 경로의 최초의 효소인 XDH 활성을 측정하였다. 결과를 표 5에 기재하였다. 표 5에 기재된 균주의 「7513」 및 「1110」은 각각 클론 번호를 나타낸다.
중카피 발현 벡터 도입주에서는 저카피 발현 벡터 도입주에 비해 XDH 활성이 약 7배로 상승하였다. 이. 콜라이(E. coli) 고유의 크실로스 이소머라제(XylA)와 XDH의 분기점에서 실제의 균체 내에서 어떻게 크실로스가 분배되는지에 대해서는 확인할 수 없고, 여전히 NXA 경로의 최초 효소인 XDH 활성이 부족할 가능성도 생각되었다. 그러나, XDH 활성이 상승하여도 L-글루탐산 축적 향상 등의 효과를 찾아낼 수 없는 점이나, 크실론산의 축적 등으로 NXA 경로 중 어느 하나 또는 복수의 효소가 율속이 될 가능성이 생각되었다.
그래서, NXA 경로의 율속점에 대한 해석을 실시하였다. 대사 중간체로서 크실론산이 축적된 점에서, 적어도 크실로스로부터 크실론산에 이르기까지의 대사 경로보다도, 크실론산으로부터 αKG에 이르는 경로에 율속점이 있다고 생각하였다. 또한, ccrNXA 오페론의 구조상, 크실로스로부터 크실론산에 이르는 경로는 오페론의 3번째와 4번째에 위치하는 유전자에 의해 코드화되어 있는 것에 반해, 크실론산으로부터 αKG에 이르는 경로는 오페론의 1번째, 2번째, 5번째에 위치하는 유전자에 의해 코드화되어 있다. XDH는 오페론의 3번째에 위치하고, 그 활성은 인 비트로(in vitro)에서 검출할 수 있지만, 오페론의 5번째에 위치하는 유전자에 의해 코드화되는 효소(XylD)의 활성을 검출할 수 있으면, NXA 오페론 전체가 전사, 번역되어 있는 것의 방증도 된다고 생각하였다. 그래서, 크실론산으로부터 αKG에 이르는 3개의 반응 중 어느 하나가 율속점이라고 추측하고, 이하와 같은 실험을 실시하였다.
xylD, xylX 및 ccrxylA 유전자를 각각 단독 발현하는 플라스미드 pSTVPtac_xylD_Ttrp, pSTVPtac_xylX_Ttrp, 및 pSTVPtac_ccrxylA_Ttrp을 이하와 같이 하여 작제하였다.
pSTV28-Ptac-xylX-Ttrp은 SfiI 사이트를 제외한 xylX를 pUC18에 클로닝한 플라스미드인 pUC18-xylX를 주형으로 하고, xylX-IFS-5742-10-1(서열번호 38) 및xylX-IFA-5742-10-2(서열번호 39)를 프라이머에 사용한 PCR에 의해 xylX 단편을 작제하고, SmaI로 소화한 pSTV28-Ptac-Ttrp에 인-퓨전 클로닝(in-fusion cloning)법으로 클로닝함으로써 작제하였다.
pSTV28-Ptac-ccrxylA-Ttrp은 SfiI 사이트를 제외한 ccrxylA를 pUC18에 클로닝한 플라스미드인 pUC18-ccrxylA를 주형으로 하고, xylA_IFS_5742-10-3(서열번호 40) 및 xylA_IFA_5742-10-4(서열번호 41)를 프라이머에 사용한 PCR에 의해 ccrxylA 단편을 작제하고, SmaI로 소화한 pSTV28-Ptac-Ttrp에 인-퓨전 클로닝(in-fusion cloning)법으로 클로닝함으로써 작제하였다.
STV28-Ptac-xylD-Ttrp은 SfiI 사이트를 제외한 xylD를 pUC18에 클로닝한 플라스미드인 pUC18-xylD를 주형으로 하고, xylD_IFS_5742-10-5(서열번호 42), xylD_IFA_5742-10-6(서열번호 43)을 프라이머에 사용한 PCR에 의해 xylD 단편을 작제하고, SmaI로 소화한 pSTV28-Ptac-Ttrp에 인-퓨전 클로닝(in-fusion cloning)법으로 클로닝함으로써 작제하였다.
상기 플라스미드 pUC18-xylX, pUC18-ccrxylA, pUC18-xylD는 각각 이하와 같이 하여 작제하였다.
씨. 크레센투스(C. crescentus) CB-15주의 게놈 DNA를 주형으로 하고, CC0823-01F_4691-87-1 (서열번호 44) 및 CC0823-01R_4691-87-2(서열번호 45), 및 CC0823-02F_4691-87-3(서열번호 46) 및 CC0823-02R_4691-87-4(서열번호 47)를 프라이머로 하는 PCR에 의해 각각 900bp 및 280bp의 단편을 증폭시켰다. 계속해서, 인 비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345, 2009)으로, SmaI로 소화한 pUC18과, 상기 2개의 증폭 단편을 어셈블함으로써 SfiI 사이트가 제거되어, xylX 유전자가 삽입된 pUC18-xylX를 수득하였다.
씨. 크레센투스(C. crescentus) CB-15주의 게놈 DNA를 주형으로 하고, CC0822-01F_4691-87-5 (서열번호 48) 및 CC 480822-01R_5659-8-7(서열번호 49), CC0822-02F_5659-8-8(서열번호 50) 및 CC0822-02R_5659-8-9(서열번호 51), CC0822-03F_5659-8-10(서열번호 52) 및 CC0822-03R_5659-8-11(서열번호 53), CC0822-04F_5659-8-12(서열번호 54) 및 CC0822-04R_5659-8-13(서열번호 55), 및 CC0822-05F_5659-8-14(서열번호 56) 및 CC0822-05R_4691-87-14(서열번호 57)를 프라이머로 하는 PCR에 의해, 각각 11v02(175 bp), 12v02(325 bp), 13v02(260 bp), 14v02(193 bp) 및 15v02(544 bp)의 5개의 단편을 증폭시켰다. 다음에, 11v02 및 12v02의 2단편을 주형으로 하고, CC0822-01F_4691-87-5 및 CC0822-02R_5659-8-9를 프라이머로 하는 크로스오버 PCR에 의해 이들 2단편을 연결하였다. 마찬가지로, 13v02 및 14v02의 2단편을 주형으로 하고, CC0822-03F_5659-8-12 및 CC0822-04R_5659-8-13을 프라이머로 하는 크로스오버 PCR에 의해 이들 2단편을 연결하였다. 이들 2단편과, 상기 15v02 단편을 인 비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345,2009)으로 연결하였다. 수득된 연결 단편을 주형으로 하고, CC0822-01F_4691-87-5 및 CC0822-05R_4691-87-14를 프라이머에 사용한 PCR에 의해 연결 단편을 증폭시켰다. 계속해서, 인 비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345, 2009)으로, SmaI로 소화한 pUC18과, 상기 연결 단편을 어셈블함으로써 SfiI 사이트가 제거되어, ccrxylA 유전자가 삽입된 pUC18-ccrxylA를 수득하였다.
씨. 크레센투스(C. crescentus) CB-15주의 게놈 DNA를 주형으로 하고, CC0819-01F_4691-88-7 (서열번호 17) 및 CC0819-01R_5659-9-1(서열번호 18), 및 CC0819-02F_5659-9-2(서열번호 19) 및 CC0819-02R_4691-88-10(서열번호 20)을 프라이머로 하는 PCR에 의해 각각 1130bp 및 653bp의 단편을 증폭시켰다. 계속해서, 인 비트로 어셈블(in vitro assemble)법(Nature Methods 6(5), 343-345, 2009)으로, SmaI로 소화한 pUC18과, 상기 2개의 증폭 단편을 어셈블함으로써 SfiI 사이트가 제거되어, xylD 유전자가 삽입된 pUC18-xylD를 수득하였다.
ccrNXA 오페론 발현주(MG1655ΔsucA/pTWV228Ptac_ccrNXA)와, 상기 xylD, xylX, ccrxylA 유전자를 각각 단독 발현하는 플라스미드를 유지하는 주(MG1655ΔsucA/pSTVPtac_xylD_Ttrp, MG1655ΔsucA/pSTVPtac_xylX_Ttrp 및 MG1655ΔsucA/pSTVPtac_ccrxylA_Ttrp)로부터 조효소(粗酵素) 추출액을 조제하고, ccrNXA 오페론 발현주 유래의 조효소 추출액에 벡터 유지주, 또는 xylD, xylX, ccrxylA의 각 유전자의 단독 발현주 유래의 조효소 추출액을 각각 첨가하여, 크실론산으로부터의 αKG 생성 활성을 측정하였다. 결과를 표 6에 기재하였다. 표 6 중, 균주명에 붙인 「1110」은 클론 번호를 나타낸다.
xylD 유전자 단독 발현주의 조효소 추출액을 첨가한 계에 있어서, αKG 생성 활성의 상승이 관찰되었다. 이 결과로, xyld 유전자가 코드화하는 크실로네이트데히드라타제(XylD)가 이. 콜라이(E. coli)로 이종 발현에 의해 구축한 NXA 경로 상의 율속점일 가능성이 시사되었다.
효소 활성의 측정으로부터, ccrNXA 오페론 발현주에서, xyld 유전자의 발현을 더욱 강화함으로써 경로 전체의 대사 플럭스가 개선될 가능성이 있는 사실로부터, xyld 유전자 발현 벡터를 ccrNXA 오페론 발현주에 도입함으로써 xyld 유전자 발현 강화주를 구축하고, 글루코스 및 크실로스를 탄소원으로 한 L-글루탐산 생산 배양 평가를 실시하였다. ccrNXA 오페론 발현주로서는 MG1655ΔsucA/pMW119Ptac_ccrNXA와 MG1655ΔsucA/pTWV228Ptac_ccrNXA를 사용하였다.
배양은 (3)과 동일하게 하여 실시하였다.
결과를 표 7에 나타낸다. xylD 유전자 발현 강화주에서 L-글루탐산 축적 및 수율이 대폭 향상되고, L-글루탐산 축적은 컨트롤주 15 내지 16g/L에 대하여 23 내지 25g/L, 대(對) 소비당(糖) 수율은 컨트롤주 37 내지 40%에 대하여 57 내지 60%에 달하였다. 또한, 대사 중간체인 크실론산은 xyld 유전자 발현 강화주에서는 보이지 않았다. 한편, xyld 유전자 발현 강화의 효과는 중카피형의 ccrNXA 오페론 발현 벡터를 탑재한 발현주에서만 보이고, 저카피형 벡터에 의한 발현주에서는 보이지 않았다. 이들 결과로부터, 벡터의 카피수 증가에 의한 NXA 경로 전체의 활성 증가와 xyld 유전자 발현 재강화에 의한 본 경로의 율속점의 해소가, L-글루탐산 생성량의 향상에 관련되었다고 생각되었다. 또한, xyld 유전자 발현 강화주의 크실론산으로부터의 αKG 생성 활성을 측정한 바, 강화 전에 비해 약 10배 상승하였다(표 8). 표 7, 표 8에 기재된 균주명에 붙여진 「1110」, 「17」, 「19」는 각각 클론 번호를 나타낸다.
〔실시예 3〕코리네박테리움·글루타미쿰에 대한 NXA 경로의 도입
(1) NXA 경로 도입용 플라스미드 pVK9Peftu_ccrNXA의 구축
신장 인자 Tu(EF-Tu) 유전자 tuf의 프로모터 서열(WO2008114721, 서열번호 33, 이하, 「Peftu」라고 기재한다)의 하류에 xylD를 연결한 서열을 갖는 플라스미드를, 클론테크 인-퓨전 클로닝 HD 키트(Clontech In-Fusion Cloning HD Kit)(Clontech사)를 이용하여 구축하였다. 우선, 씨. 글루타미쿰(C. glutamicum) ATCC13869주의 염색체 DNA를 주형으로, 프라이머Peftu(Pst)(서열번호 58)와 Peftu_Rv(서열번호 59)를 사용하여 PCR을 실시하여 Peftu 서열을 포함하는 단편을 수득하였다. PCR 반응은 프라임스타 HS 폴리머라제(PrimeSTAR HS polymerase)를 사용하고, 이 효소에 부속의 프로토콜에 따라 실시하였다.
또한, pTWV228Ptac_ccrNXA를 주형으로서, 프라이머 Peftu_xylXABCD_fw(서열번호 60)와 Peftu_xylXABCD_rv(서열번호 61)를 사용하여 PCR를 실시하여, 씨. 크레센투스(C. crescentus)의 xylXABCD 서열을 포함하는 단편을 수득하였다. PCR 반응에는 프라임스타 GXL 폴리머라제(PrimeSTAR GXL polymerase)를 사용하고, 이 효소에 부속의 프로토콜에 따라 PCR 반응을 실시하였다.
계속해서, 상기에서 수득된 Peftu 단편과 xylXABCD를 포함하는 단편을, PstI와 BamHI로 처리한 pVK9와 혼합하여, 클론테크 인-퓨전 HD 클로닝 키트(Clontech In-fusion HD Cloning Kit)의 프로토콜에 따라 인-퓨전(in-fusion) 반응을 실시하였다. pVK9는, pHSG299(다카라바이오)의 AvaII 부위를 평활 말단화하고, pHK4(일본 공개특허 특개평05-007491)에 포함되는 코리네형 세균 내에서 자율 복제 가능한 영역을 BamHI 및 KpnI로 잘라 평활 말단화된 단편을 삽입한 셔틀 벡터이다(일본 공개특허 특개2007-97573호, 미국 특허출원공개 20050196846호). 상기 인-퓨전(in-fusion) 반응액으로 이. 콜라이(E. coli) JM109를 형질 전환하였다. 형질 전환체는 LB 배지에 카나마이신을 최종 농도 50mg/L이 되도록 첨가한 한천 배지에서 선발하였다. 수득된 형질 전환체로부터 목적의 플라스미드 pVK9Peftu_ccrNXA를 취득하였다.
(2) NXA 경로가 도입된 코리네박테리움·글루타미쿰에 의한 L-글루탐산 생산
상기 pVK9Peftu_ccrNXA로, 전기 펄스법(일본 공개특허 특개평2-207791)에 의해 씨. 글루타미쿰(C. glutamicum) ATCC13869주를 형질 전환하였다. pVK9Peftu_ccrNXA를 도입한 주는, CM-Dex 배지에 카나마이신을 최종 농도 25mg/L이 되도록 첨가한 한천 배지를 사용하여 선발하였다. 또한, 대조주로서 pVK9로 씨. 글루타미쿰(C. glutamicum) ATCC13869주를 형질 전환한 주도 같은 방법에 의해 선발하였다.
수득된 형질 전환주의 크실로스 자화 능력 및 L-글루탐산 생산능을, 사카구치(坂口) 플라스크를 사용한 배양을 실시함으로써 검증하였다. 카나마이신을 최종 농도 25mg/L이 되도록 첨가한 CM-Dex 한천 배지에서, 31.5℃에서 하루 낮밤 배양한 형질 전환주의 균체를 1/6 플레이트 만큼 긁어내어, Glc 배지 20ml를 포함하는 사카구치 플라스크에 식균하고, 미리 건열 멸균해 둔 탄산칼슘 1g을 첨가한 후, 31.5℃, 120rpm에서 24시간 진탕 배양하였다. 수득된 배양액 1ml를, Xyl 배지(비오틴 제한) 20ml를 포함하는 사카구치 플라스크에 식균하고, 미리 건열 멸균해 둔 탄산칼슘 1g을 첨가한 후, 31.5℃, 120 rpm에서 73시간 진탕 배양을 실시하였다. 결과를 표 9에 나타냈다.
씨. 글루타미쿰(C. glutamicum) ATCC13869주에 pVK9를 도입한 주는 Xyl 배지에서 거의 증식하지 않고, L-글루탐산 생산도 관찰되지 않았다. 한편, 씨. 글루타미쿰(C. glutamicum) ATCC13869주에 pVK9Peftu_ccrNXA를 도입한 주는 Xyl 배지에서 증식하고, L-글루탐산을 축적하였다. 이 결과로부터, 코리네형 세균에 NXA 경로를 도입함으로써 크실로스 자화 능력이 향상되고, 또한 크실로스로부터 L-글루탐산이 생성되는 것을 발견하였다.
(3) xyld 유전자 발현 재강화주의 구축
pVK9Peftu_ccrNXA를 유지하는 씨. 글루타미쿰(C. glutamicum) ATCC13869주에서는 크실론산이 축적된 것으로부터, xyld 유전자 산물의 활성이 부족하다는 것이 추찰되었다. 그래서, pVK9Peftu_ccrNXA 플라스미드 상에 xyld 유전자를 1카피 추가로 도입함으로써, xyld 유전자가 재강화된 NXA 경로 발현용 플라스미드를 구축하기로 하였다.
(4) xyld 유전자 발현용 플라스미드 pVS7PmsrA_xylD의 구축
msrA(펩티드 메티오닌 설폭시드 리덕타제 A(peptide methionine sulfoxide reductase A)) 유전자의 프로모터 서열(이하, 「PmsrA」라고 기재한다)의 하류에 씨. 크레센투스(C. crescentus)의 xyld 유전자를 연결한 서열을 갖는 플라스미드를, 클론테크 인-퓨전 클로닝 HD 키트(Clontech In-Fusion Cloning HD Kit)를 이용하여 구축하였다.
우선, 씨. 글루타미쿰(C. glutamicum) ATCC13869주의 염색체 DNA를 주형에, 프라이머PmsrA(Pst)(서열번호 62)와 PmsrAR(서열번호 63)을 사용하여 PCR를 실시하여, PmsrA 서열을 포함하는 단편을 수득하였다. 또한, pTWV228Ptac_ccrNXA를 주형으로서, 프라이머 PmsrA_xylD_fw(서열번호 64)와 Peftu_xylXABCD_rv를 사용하여 PCR를 실시하여, 씨. 크레센투스(C. crescentus)의 xyld 유전자 서열을 포함하는 단편을 수득하였다. PCR 반응은 프라임스타 HS 폴리머라제(PrimeSTAR HS polymerase)를 사용하고, 이 효소에 부속의 프로토콜에 따라 실시하였다.
계속해서, 상기에서 수득된 PmsrA 단편과 xyld 유전자를 포함하는 단편을 PstI와 BamHI로 처리한 셔틀 벡터 pVS7(구축 방법은 이하에 나타낸다)과 혼합하여, 클론테크 인-퓨전 HD 클로닝 키트(Clontech In-fusion HD Cloning Kit)의 프로토콜에 따라 인-퓨전(in-fusion) 반응을 실시한 후, 이 반응액으로 이. 콜라이(E. coli) JM109를 형질 전환하였다. 형질 전환체는 LB 배지에 스펙티노마이신을 최종 농도 25mg/L이 되도록 첨가한 한천 배지에서 선발하였다. 수득된 형질 전환체로부터 목적의 플라스미드 pVS7PmsrA_xylD를 취득하였다.
pVS7은 pVC7(일본 공개특허 특개2000-201692, EP1004671)의 클로람페니콜 내성 유전자가 스펙티노마이신 내성 유전자로 치환된 플라스미드이다. 스펙티노마이신 내성 유전자는 바실러스 제네틱 스톡 센터(BGSC)에서 시판되고 있는 에스케리키아·콜라이 ECE101E주로부터, 플라스미드 pDG1726을 조제하고, 당해 플라스미드로부터 카세트로 취출함으로써 취득할 수 있다. pDG1726을 주형으로서, 프라이머SpcR-F(서열번호 65)와 SpcR-R(서열번호 66)을 사용하여 PCR에 의해 스펙티노마이신 내성 유전자를 증폭시켰다. 수득된 유전자 단편을, SmaI 처리한 pVC7과 혼합하여, 다카라바이오 주식회사의 라이게이션 믹스(Ligation Mix) <마이티 믹스(Mighty Mix)>의 프로토콜에 따라 라이게이션 반응을 실시하고, 이 반응액으로 이. 콜라이(E. coli) JM109를 형질 전환하였다. 형질 전환체는 LB 배지에 스펙티노마이신을 최종 농도 25mg/L가 되도록 첨가한 한천 배지에서 선발하였다. 수득된 형질 전환체로부터 pVC7에 스펙티노마이신 내성 유전자가 삽입된 pVC7-spc를 취득하였다. 또한, pVC7-spc를 주형으로서, 프라이머 spc(GTG start)-F(서열번호 67)와 spc(stop)-R(서열번호 68)을 사용하여 PCR를 실시하여, 스펙티노마이신 내성 유전자를 증폭시켰다.
한편, pVC7을 주형으로서, 프라이머 Spc-pVC7-Cm-F(서열번호 69)와 Spc-pVC7-Cm-R(서열번호 70)를 사용하여 PCR를 실시하여, pVC7로부터 클로람페니콜 내성 유전자가 제거된 DNA 단편을 수득하였다. 당해 DNA 단편과, 상기에서 pVC7-spc으로부터 조제된 스펙티노마이신 내성 유전자의 DNA 단편을 혼합하여, 클론테크 인-퓨전 HD 클로닝 키트(Clontech In-fusion HD Cloning Kit)의 프로토콜에 따라 인-퓨전(in-fusion) 반응을 실시한 후, 이 반응액으로 이. 콜라이(E. coli) JM109를 형질 전환하였다. 형질 전환체는 LB 배지에 스펙티노마이신을 최종 농도 25mg/L가 되도록 첨가한 한천 배지에서 선발하였다. 수득된 형질 전환체로부터 pVS7을 취득하였다.
(5) xyld 유전자 재강화 플라스미드 pVK9Peftu_ccrNXA+D의 구축
pVS7PmsrA_xylD를 주형으로서, 프라이머 ME_Spc_fw(서열번호 71)와 ME_Peftu_xylXABCD_rv(서열번호 72)를 사용하여, 스펙티노마이신 내성 유전자(Spc)와 PmsrA_xylD를 포함하는 DNA 단편을 증폭시켰다. 수득된 DNA 단편을, 에피센트레(Epicentre)사의 Ez-Tn5TM 커스텀 트랜스포솜 컨스트럭션 키트(Custom Transposome Construction Kit)의 프로토콜에 따라, 인 비트로(in vitro)에서 pVK9Peftu_ccrNXA에 삽입하여 이. 콜라이(E. coli) DH5α를 형질 전환하였다. 형질 전환체는 카나마이신과 스펙티노마이신을 최종 농도로 각각 50mg/L, 25mg/L이 되도록 첨가한 LB한천 배지에서 선발하였다. 수득된 형질 전환체로부터 플라스미드를 추출하고, 플라스미드 상의 Spc-PmsrA_xylD 서열 주변의 염기서열을 확인함으로써, Spc-PmsrA_xylD 서열의 삽입 개소가 Peftu_ccrNXA 서열 상에서는 없는 것이 확인된 플라스미드를 pVK9Peftu_ccrNXA+D로 하였다.
(6) xyld 유전자가 재강화된 NXA 경로 도입주의 L-글루탐산 생산
전기 펄스법으로 씨. 글루타미쿰(C. glutamicum) ATCC13869주에 pVK9Peftu_ccrNXA+D를 도입하고, 카나마이신 25mg/L를 포함하는 CMDex 한천 배지에 도포하였다. 31.5℃에서 배양 후 생육한 주에 대하여, (2)와 같은 방법으로 L-글루탐산 생산능을 검증하였다. 그 결과를 표 10에 나타냈다.
pVK9Peftu_ccrNXA+D를 유지하는 주에서는, pVK9Peftu_ccrNXA를 유지하는 주와 비교하여 D-크실론산의 축적량이 적고, 한편, 보다 많은 L-글루탐산이 축적되었다. 이로써, xyld 유전자를 재강화함으로써 보다 효율적으로 NXA 경로를 통하여 D-크실로스로부터 L-글루탐산을 생산시킬 수 있는 것이 나타났다.
〔실시예 4〕
(1) NXA 경로 유전자의 대체
이상의 실시예에서는, NXA 경로가 보고되어 있는 공지된 세균 씨. 크레센투스(C. crescentus)의 유전자 xylX, ccrxylA, ccrxylB, xylC, xylD를 이용하여, NXA 경로를 통하여 크실로스로부터 글루탐산을 생성할 수 있는 것을 나타내었다. 이하의 실시예에서는 씨. 크레센투스(C. crescentus) 이외의 생물종으로부터 xylD, xylX, ccrxylA의 호모로그 유전자를 취득하고, 씨. 크레센투스(C. crescentus)의 유전자와 대체 가능한지 여부를 검증하였다. 유전자원으로서 표 11에 나타낸 생물종을 선택하였다. 아울러 각 유전자의 Gene symbol(GenBank)을 나타냈다. 또한, 표 12에 각 유전자의 염기서열 및 이것에 코드화되는 아미노산 서열의 서열표에서의 서열번호를 나타냈다. 표 12 중 「오리지널」은 천연형 유전자의 염기서열을, 「최적화 후」는 이. 콜라이(E. coli)의 코돈 출현 빈도(codon usage)에 맞춰서 코돈을 최적화한 염기서열을 각각 나타낸다.
또한, 이하의 기재에 있어서, xylD, xylX 및 xylA의 각 유전자 호모로그가 코드화하는 효소를 각각 XylD, XylX, XylA라고 기재하는 경우가 있다.
(2) XylD, XylX, XylA 활성 검출용 플라스미드 pTWVPtac_ccrNXA_ΔxylD_Km, pTWVPtac_ccrNXA_ΔxylX_Km, pTWVPtac_ccrNXA_ΔccrxylA_Km의 구축
클론테크 인-퓨전 클로닝 키트(Clontech In-Fusion Cloning Kit)를 이용하여 구축을 실시하였다.
우선, pTWVPtac_ccrNXA_Km을 주형으로 하고, Ptac_xylXABC_F(서열번호 111)와 Ptac_xylXABC_R(서열번호 112)을 프라이머로 하여, xylD를 제외한 DNA 단편을 PCR로 증폭시켰다. PCR 산물을 클론테크 인-퓨전 HD 클로닝 키트(Clontech In-fusion HD Cloning Kit)의 프로토콜에 따라 인-퓨전(In-Fusion) 반응하고, 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환하여 형질 전환체으로부터 목적의 플라스미드 pTWVPtac_ccrNXA_ΔxylD_Km을 취득하였다.
pTWVPtac_ccrNXA_ΔxylX_Km은 Ptac_xylABCD_F(서열번호 113)와 Ptac_xylABCD_R(서열번호 114)을, pTWVPtac_ccrNXA_ΔccrxylA_Km은 Ptac_xylXBCD_F(서열번호 115)와 Ptac_xylXBCD_R(서열번호 116)을 프라이머로서, 상기와 같은 방법에 의해 구축하였다.
(3) XylD, XylX, XylA 활성 검출용 판토에아·아나나티스의 구축
상기 pTWVPtac_ccrNXA_ΔxylD_Km으로, 일렉트로포레이션법에 의해 피. 아나나티스(P. ananatis) NA1주를 형질 전환하였다. 구축한 주를 피. 아나나티스(P. ananatis) NA2 ΔxylD로 하였다. 피. 아나나티스(P. ananatis) NA2 ΔxylD의 배양에는 LBGM9에 카나마이신을 최종 농도 40mg/L, 테트라사이클린을 최종 농도 12.5 mg/L가 되도록 첨가한 플레이트 배지를 사용하였다.
마찬가지로 pTWVPtac_ccrNXA_ΔxylX_Km 또는 pTWVPtac_ccrNXA_ΔccrxylA_Km으로 피. 아나나티스(P. ananatis) NA1주를 형질 전환하여 피. 아나나티스(P. ananatis) NA2 ΔxylX주, 피. 아나나티스(P. ananatis) NA2 ΔccrxylA주를 구축하였다.
(4) xylD, xylX, xylA 호모로그 발현 플라스미드의 구축
yjhG, yagF 발현용 플라스미드 pSTV28-Ptac-yjhG-Ttrp, pSTV28-Ptac-yagF-Ttrp은 이하와 같이 하여 작제하였다.
pSTV28-Ptac-yjhG-Ttrp은 이. 콜라이(E. coli) MG1655주의 게놈 DNA를 주형으로 하고, yjhG_F(서열번호 117) 및 yjhG_R(서열번호 118)을 프라이머로 사용한 PCR에 의해 yjhG 단편을 증폭시키고, SmaI로 소화한 pSTV28-Ptac-Ttrp에 인-퓨전 클로닝(In-Fusion cloning)법으로 클로닝함으로써 작제하였다.
pSTV28-Ptac-yagF-Ttrp은 yagF_F(서열번호 119) 및 yagF_R(서열번호 120)를 프라이머고 사용하여 상기와 같은 방법에 의해 작제하였다.
xylD(Hse) 발현용 플라스미드 pSTV28-Ptac-xylD(Hse)-Ttrp은 이하와 같이 하여 작제하였다. tac 프로모터, xylD(Hse) 및 trp 터미네이터의 서열을 갖는 DNA 단편(Ptac-xylD(Hse)-Ttrp)을 합성하여, EcoRV로 소화한 pUC57 벡터(써모피셔사이언티픽사에서 구입)에 연결함으로써 pUC57-Ptac-xylD(Hse)-Ttrp을 수득하였다. DNA 단편을 합성할 때에 이. 콜라이(E. coli)에서의 발현에 적합하도록 코돈 최적화를 실시하였다. EcoRI와 KpnI로 각각 소화한 pSTV28과 pUC57-Ptac-xylD(Hse)-Ttrp을 등량 혼합하여 라이게이션 반응 후 JM109를 형질 전환하고, Cm 내성이 나타난 콜로니로부터 플라스미드를 추출하여 pSTV28-Ptac-xylD(Hse)-Ttrp을 수득하였다.
xylD (Amis), xylD(Aor), xylX(Cne), xylX(Zga), xylX(Tco), xylA(Abr), ycbD의 각각을 발현하는 플라스미드 pSTV28-Ptac-xylD(Amis)-Ttrp, pSTV28-Ptac-xylD(Aor)-Ttrp, pSTV28-Ptac-xylX(Cne)-Ttrp, pSTV28-Ptac-xylX(Zga)-Ttrp, pSTV28-Ptac-xylX(Tco)-Ttrp, pSTV28-Ptac-xylA(Abr)-Ttrp, pSTV28-Ptac-ycbD-Ttrp도 같은 방법으로 작제하였다. 단, YcbD에 대해서는 코돈 최적화를 실시하지 않았다.
xylD(Atu) 발현용 플라스미드 pSTV28-Ptac-xylD(Atu)-Ttrp은 이하와 같이 하여 작제하였다. tac 프로모터, xylD(Atu) 및 trp 터미네이터의 서열을 갖는 DNA 단편(Ptac-xylD(Atu)-Ttrp)을 합성하여, EcoRV로 소화한 pJET1.2 벡터(써모피셔사이언티픽사에서 구입)에 연결함으로써 pJET1.2-Ptac-xylD(Atu)-Ttrp을 수득하였다. DNA 단편을 합성할 때에 이. 콜라이(E. coli)에서의 발현에 적합하도록 코돈 최적화를 실시하였다. EcoRI와 KpnI로 각각 소화한 pSTV28과 pJET1.2-Ptac-xylD(Atu)-Ttrp을 등량 혼합하여, 라이게이션 반응 후 JM109를 형질 전환하고, Cm 내성이 나타난 콜로니로부터 플라스미드를 추출하여 pSTV28-Ptac-xylD(Atu)-Ttrp을 수득하였다.
xylX(Atu), xylA(Hbo)의 각각을 발현하는 플라스미드 pSTV28-Ptac-xylX(Atu)-Ttrp, pSTV28-Ptac-xylA(Hbo)-Ttrp도 같은 방법으로 작제하였다.
xylX(Art) 발현용 플라스미드 pSTV28-Ptac-xylX(Art)-Ttrp은 이하와 같이 하여 제작하였다. tac 프로모터, xylX(Art) 및 trp 터미네이터의 서열을 갖는 DNA 단편(Ptac-xylX(Art)-Ttrp)을 합성하여, EcoRV로 소화한 pCC1 벡터(에피센트레(Epicentre)사에서 구입)에 연결함으로써 pCC1-Ptac-xylX(Art)-Ttrp을 수득하였다. DNA 단편을 합성할 때에 이. 콜라이(E. coli)에서의 발현에 적합하도록 코돈 최적화를 실시하였다. EcoRI와 KpnI로 각각 소화한 pSTV28과 pCC1-Ptac-xylX(Art)-Ttrp을 등량 혼합하여, 라이게이션 반응 후 JM109를 형질 전환하고, Cm 내성이 나타난 콜로니로부터 플라스미드를 추출하여 pSTV28-Ptac-xylX(Art)-Ttrp을 수득하였다.
(5) xylD 호모로그의 활성 검출
pSTV28-Ptac-Ttrp, pSTV28-Ptac-xylD-Ttrp, pSTV28-Ptac-xylD(Atu)-Ttrp, pSTV28-Ptac-xylD(Hse)-Ttrp, pSTV28-Ptac-yjhG-Ttrp, pSTV28-Ptac-yagF-Ttrp, pSTV28-Ptac-xylD(Amis)-Ttrp 또는 pSTV28-Ptac-xylD(Aor)-Ttrp으로, 일렉트로포레이션법(미국 특허 6682912호 참조)에 의해 피. 아나나티스(P. ananatis) NA2 ΔxylD주를 형질 전환하였다. 각 형질 전환주의 배양에는 LBGM9에 카나마이신을 최종 농도 40mg/L, 테트라사이클린을 최종 농도 12.5 mg/L, 클로람페니콜을 최종 농도 25mg/L가 되도록 첨가한 플레이트 배지를 사용하였다.
약제를 첨가한 LBGM9 플레이트에, 34℃에서 하룻밤 배양한 각 형질 전환주의 균체를 1/6 플레이트만큼 긁어내어, MSII-SX 배지 5ml를 포함하는 큰 시험관에 식균하고, 34℃, 120rpm에서 48시간 배양하여 L-글루탐산(Glu)의 축적량을 측정하였다. 결과를 도 5에 나타낸다.
피. 아나나티스(P. ananatis) NA2 ΔxylD에 pSTV28-Ptac-Ttrp을 도입한 주에서는 L-글루탐산 축적량은 6.9 g/L이었는데 반해, 다른 형질 전환주에서는 11.1g/L 내지 23.1g/L의 L-글루탐산이 축적되었다. pSTV28-Ptac-Ttrp을 도입한 주에서는 크실로스로부터 L-글루탐산이 거의 생성되지 않고, 다른 형질 전환주에서는 NXA 경로를 통하여 크실로스로부터 L-글루탐산이 생성되었다고 생각된다. 즉, xylD는 씨. 크레센투스(C. crescentus) 이외의 어떤 생물종 유래의 xylD 호모로그로도 대체 가능한 것이 나타났다.
(6) xylX 호모로그의 활성 검출
pSTV28-Ptac-Ttrp, pSTV28-Ptac-xylX-Ttrp, pSTV28-Ptac-xylX(Art)-Ttrp, pSTV28-Ptac-xylX(Atu)-Ttrp, pSTV28-Ptac-xylX(Cne)-Ttrp, pSTV28-Ptac-xylX(Zga)-Ttrp, pSTV28-Ptac-xylX(Tco)-Ttrp 또는 pSTV28-Ptac-xylX(Selo)-Ttrp으로, 일렉트로포레이션법에 의해 피. 아나나티스(P. ananatis) NA2 ΔxylX주를 형질 전환하였다. 각 형질 전환주의 배양에는 LBGM9에 카나마이신을 최종 농도 40mg/L, 테트라사이클린을 최종 농도 12.5 mg/L, 클로람페니콜을 최종 농도 25mg/L가 되도록 첨가한 플레이트 배지를 사용하였다.
약제를 첨가한 LBGM9 플레이트에, 34℃에서 하룻밤 배양한 각 형질 전환주의 균체를 1/6 플레이트만큼 긁어내어, MSII-SX 배지 5ml를 포함하는 큰 시험관에 식균하고, 34℃, 120rpm에서 48시간 배양하여 L-글루탐산(Glu)의 축적량을 측정하였다. 결과를 도 6에 나타낸다.
피. 아나나티스(P. ananatis) NA2 ΔxylX에 pSTV28-Ptac-Ttrp을 도입한 주에서는 L-글루탐산 축적량은 8.7 g/L이었는데 반해, 다른 형질 전환주에서는 20.5g/L 내지 27.8g/L의 L-글루탐산이 축적되었다. pSTV28-Ptac-Ttrp을 도입한 주에서는 크실로스로부터 L-글루탐산이 거의 생성되지 않고, 다른 형질 전환주에서는 NXA 경로를 통하여 크실로스로부터 L-글루탐산이 생성되었다고 생각되었다. 즉, xylX는 씨. 크레센투스(C. crescentus) 이외의 어떤 생물종 유래의 xylX 호모로그로도 대체 가능한 것이 나타났다.
(7) xylA 호모로그의 활성 검출
pSTV28-Ptac-Ttrp, pSTV28-Ptac-ccrxylA-Ttrp, pSTV28-Ptac-ycbD-Ttrp, pSTV28-Ptac-xylA(Hbo)-Ttrp 또는 pSTV28-Ptac-xylA(Abr)-Ttrp으로, 일렉트로포레이션법에 의해 피. 아나나티스(P. ananatis) NA2ΔccrxylA주를 형질 전환하였다. 각 형질 전환주의 배양에는 LBGM9에 카나마이신을 최종 농도 40mg/L, 테트라사이클린을 최종 농도 12.5 mg/L, 클로람페니콜을 최종 농도 25mg/L이 되도록 첨가한 플레이트 배지를 사용하였다.
약제를 첨가한 LBGM9 플레이트에, 34℃에서 하룻밤 배양한 각 형질 전환주의 균체를 1/6 플레이트만큼 긁어내어, MSII-SX 배지 5ml를 포함한 큰 시험관에 식균하고, 34℃, 120rpm에서 48시간 배양하여 L-글루탐산(Glu)의 축적량을 측정하였다. 결과를 도 7에 도시하였다.
피. 아나나티스(P. ananatis) ΔccrxylA에 pSTV28-Ptac-Ttrp을 도입한 주에서는 L-글루탐산 축적량은 1.0g/L이었는데 반해, 다른 형질 전환주에서는 18.1g/L 내지 30.7 g/L의 L-글루탐산이 축적되었다. pSTV28-Ptac-Ttrp을 도입한 주에서는 크실로스로부터 L-글루탐산이 거의 생성되지 않고, 다른 형질 전환주에서는 NXA 경로를 통하여 크실로스로부터 L-글루탐산이 생성되었다고 생각되었다. 즉, xylA는 씨. 크레센투스(C. crescentus) 이외의 어떤 생물종 유래의 ccrxylA 호모로그로도 대체 가능한 것이 나타났다.
[산업상의 이용 가능성]
본 발명에 의해, 크실로스 원료를 사용하여, 발효법에 의해 목적 물질을 효율적으로 제조할 수 있다.
SEQUENCE LISTING
<110> AJINOMOTO CO., INC.
<120> METHOD FOR PRODUCING TARGET SUBSTANCE BY FERMENTATION
<130> D313-11346
<150> JP 2011-247031
<151> 2011-11-11
<150> US 61/558,685
<151> 2011-11-11
<160> 120
<170> KopatentIn 1.71
<210> 1
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer PtwvPtacf
<400> 1
gaattcgagc tcggtaccca gatctccctg ttgacaatta 40
<210> 2
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 0823Ptacr
<400> 2
aggaattcac tcacgcccac cctcctgtgt gaaattgtta 40
<210> 3
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ptac0823f
<400> 3
taacaatttc acacaggagg gtgggcgtga gtgaattcc 39
<210> 4
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 0819r
<400> 4
gcggggcgtg cggttagaca tggcggacct catgctgggg 40
<210> 5
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 0819f
<400> 5
ccccagcatg aggtccgcca tgtctaaccg cacgccccgc 40
<210> 6
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 219cc0819r
<400> 6
ctctagagga tccccttcag cgtttggcga cggaga 36
<210> 7
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 219f
<400> 7
ggggatcctc tagagtcgac c 21
<210> 8
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> primer 219r
<400> 8
gggtaccgag ctcgaattca c 21
<210> 9
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer attL-F
<400> 9
tatattgatt cacttgaagt acgaaaaaaa ccggg 35
<210> 10
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer ntpII-R
<400> 10
cctgcaggcg gccgctcata gaaggcggcg gtggaatcga aatct 45
<210> 11
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer attR-F
<400> 11
gcggccgcct gcaggcccat gtaatgaata aaaagcagta attaa 45
<210> 12
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer attR-R
<400> 12
tgaagcggcg cacgaaaaac gcgaaagcgt 30
<210> 13
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ap-Km-fw
<400> 13
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc aagcttcacg 60
ctgccgcaag cactcagggc 80
<210> 14
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ap-Km-rv
<400> 14
atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt cgctcataga 60
aggcggcggt ggaatcgaaa 80
<210> 15
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylD_IFS_5742-10-5
<400> 15
acacaaggag actcccatgt ctaaccgcac gccccgccgg 40
<210> 16
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylD_IFS_5742-10-6
<400> 16
ggaactggcg gctccctcag tggttgtggc ggggcagctt 40
<210> 17
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0819-01F_4691-88-7
<400> 17
gtcgactcta gaggatcccc atgtctaacc gcacgccccg ccggt 45
<210> 18
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0819-01R_5659-9-1
<400> 18
aaccaggaac ccggccttct ctgc 24
<210> 19
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0819-02F_5659-9-2
<400> 19
tcccgtacca cgagccgctg gcag 24
<210> 20
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0819-02R_4691-88-10
<400> 20
cgaattcgag ctcggtaccc tcagtggttg tggcggggca gctt 44
<210> 21
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylA-H1P1-5742-5-1
<400> 21
acgacatcat ccatcacccg cggcattacc tgattatgga gttcaatatg tgaagcctgc 60
ttttttat 68
<210> 22
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylA-H2P2-5742-5-2
<400> 22
atcgggccaa cggactgcac agttagccgt tatttgtcga acagataatg cgctcaagtt 60
agtataaa 68
<210> 23
<211> 8296
<212> DNA
<213> Caulobacter crescentus
<220>
<221> CDS
<222> (1175)..(2329)
<220>
<221> CDS
<222> (2346)..(3782)
<220>
<221> CDS
<222> (3788)..(4534)
<220>
<221> CDS
<222> (4659)..(5528)
<400> 23
caggacttca gacccgcgag gctgtagggg tcgtcaaagg ccttggccag gaccggcggc 60
acctcgcgct tggacaggcc gacgtcgcgc accggctggg tgccgatgtc gacggccttc 120
ttgcccgcct cgccccagcg gccggacggt tcctcgggct tggccggcgg cttgacctgg 180
gcgtgggcgc tggaggccag cagcacggcg gcggctccgg ccatgatcag cagcttgttc 240
ggcatcaaaa gcgccctccc gacaaaacac gccacgggaa cggcaagcct cgccgccggt 300
tcccgcccgc aagtccctcg gcacgaactc taaggcctgc gcacgatcca tcgccaccac 360
aaagcgtgtc atcccggccg aagcgcagcg gagagccggg acccagggcc acaagcacgg 420
cgcttcgtca ccccctgggt cccggatagc gctccgcgct tccgggatga cacgggttta 480
agcacttggg tgagaagccc tagttcggcg cgccgcccgc ttccaggtcg aacgcggcgt 540
cgaaggcgtc gtcgccagga accgtccctt ccagggcggc gtcgaacagg tcttcgagcg 600
atgaccagat gaaggccatc tgctccatga tcgtcgggac gctggccgga tcgaagccgg 660
ggtagaggtc ttccaccagc cacaggcccg tgccgggatc gaaggcgaag cggcagccga 720
tcaggcggaa ctgggcgcgg gccatggtct cgaacagggc cgtcaggtcg cgggcggcgt 780
ccaggtcgtc gtggtccagc accaggcagc ggatctgcag ccagccgtgg tcgggcagca 840
ggtagaaggc gccctcgtcc tgatcctcgc ccgaaacctc cagcccccgg tcgatggctt 900
cgacgacata gccggccgcg cggcaggtgt cggtgagcgc ggccagcagg gcggcttcct 960
ggtcaggggt caggtcggtc atgggcaaga ggtccaggtc gtggtttgtc ggcggcttct 1020
agcatggacc gcccgcgccc gtgaggccga ggatttcgcg ctggtcagac aacctacttg 1080
ccgtccccac atgttagcgc taccaagtgc cgacgaacgc gcgccgccga cggtgtcggc 1140
gcttcagacg ctcgagtttt ggggagacga cgcc gtg ggc gtg agt gaa ttc ctg 1195
Val Gly Val Ser Glu Phe Leu
1 5
ccg gaa gat tgg aaa gcc gcg acc ctg ctg ggg cgc atc gac ttt ggc 1243
Pro Glu Asp Trp Lys Ala Ala Thr Leu Leu Gly Arg Ile Asp Phe Gly
10 15 20
gaa ggc ccg acg ccg gtg ctg gtg cgc ggc ggc cgc gtc gag gac gtc 1291
Glu Gly Pro Thr Pro Val Leu Val Arg Gly Gly Arg Val Glu Asp Val
25 30 35
tcg aag atc gcc ccc acc gtc gct gac ctg atg aac gcc ttc cag ccc 1339
Ser Lys Ile Ala Pro Thr Val Ala Asp Leu Met Asn Ala Phe Gln Pro
40 45 50 55
ggc gcg gtg atc ccg cgc ggc gag gac aag ggt ccg ctg gaa gcc ctc 1387
Gly Ala Val Ile Pro Arg Gly Glu Asp Lys Gly Pro Leu Glu Ala Leu
60 65 70
gac atc cgc cca gtc tgg gaa gac ccg gac ggc gcc gcg ccg gtc aag 1435
Asp Ile Arg Pro Val Trp Glu Asp Pro Asp Gly Ala Ala Pro Val Lys
75 80 85
ctg ttg gcc ccc gtc gac ctg caa tgc ctg aag gcc gcc ggc gtg acc 1483
Leu Leu Ala Pro Val Asp Leu Gln Cys Leu Lys Ala Ala Gly Val Thr
90 95 100
ttc gcg gtc tcg acc ctt gag cgg gtc atc gag gag cgc gcg cgc ggc 1531
Phe Ala Val Ser Thr Leu Glu Arg Val Ile Glu Glu Arg Ala Arg Gly
105 110 115
gac gcc ggc gag gcg ctg aag atc cgc acc ctg ctg gcc gaa cgc atg 1579
Asp Ala Gly Glu Ala Leu Lys Ile Arg Thr Leu Leu Ala Glu Arg Met
120 125 130 135
ggc ggc gac ctc aag agc gtc gag ccg ggc tcg cag ggc gcc cag cgc 1627
Gly Gly Asp Leu Lys Ser Val Glu Pro Gly Ser Gln Gly Ala Gln Arg
140 145 150
ctg aag gac gcc ctg atc gcc gac ggc ctg tgg tcg cag tat ctg gaa 1675
Leu Lys Asp Ala Leu Ile Ala Asp Gly Leu Trp Ser Gln Tyr Leu Glu
155 160 165
gtg gcg atc ggc ccg gac gcc gag atc ttc acc aag ggc ccg acc ctg 1723
Val Ala Ile Gly Pro Asp Ala Glu Ile Phe Thr Lys Gly Pro Thr Leu
170 175 180
tcc tcg atg ggc tgg ggc gac cag gtc ggc gtc cgc tat gac agc cac 1771
Ser Ser Met Gly Trp Gly Asp Gln Val Gly Val Arg Tyr Asp Ser His
185 190 195
tgg aac aat ccc gag ccg gaa gtc gtg ctg ctg tgc gac ggt tcg ggc 1819
Trp Asn Asn Pro Glu Pro Glu Val Val Leu Leu Cys Asp Gly Ser Gly
200 205 210 215
ctg atc cgc ggc gcg gcg ctg ggc aac gac gtc aat ctg cgc gac ttc 1867
Leu Ile Arg Gly Ala Ala Leu Gly Asn Asp Val Asn Leu Arg Asp Phe
220 225 230
gaa ggt cgt tcg gcc ctg ctg ctc agc aag gcc aag gac aac aac gcc 1915
Glu Gly Arg Ser Ala Leu Leu Leu Ser Lys Ala Lys Asp Asn Asn Ala
235 240 245
agc tgc gcc atc ggt ccg ttc ttc cgc ctg ttc gac gag acc ttc ggc 1963
Ser Cys Ala Ile Gly Pro Phe Phe Arg Leu Phe Asp Glu Thr Phe Gly
250 255 260
ctg gac gac gtc cgt tcg gcc gag gtc gag ctg aag atc acc ggc cgc 2011
Leu Asp Asp Val Arg Ser Ala Glu Val Glu Leu Lys Ile Thr Gly Arg
265 270 275
gac aac ttc gtg ctc gac ggc aag tcg aac atg agc ctg atc agc cgc 2059
Asp Asn Phe Val Leu Asp Gly Lys Ser Asn Met Ser Leu Ile Ser Arg
280 285 290 295
gac ccg gcc gtg ctg gcc gga cag gcc tat ggc aag cag cac cag tat 2107
Asp Pro Ala Val Leu Ala Gly Gln Ala Tyr Gly Lys Gln His Gln Tyr
300 305 310
ccg gac ggc ttt gct ttg ttc ctg ggc acc atg ttc gcc ccg atc cag 2155
Pro Asp Gly Phe Ala Leu Phe Leu Gly Thr Met Phe Ala Pro Ile Gln
315 320 325
gac cgc gac acc ccc ggc cag ggt ttc acc cac aag gtc ggc gac cgc 2203
Asp Arg Asp Thr Pro Gly Gln Gly Phe Thr His Lys Val Gly Asp Arg
330 335 340
gtg cgt gtc tcg acg ccg aag ctg ggc gtg ctc gag aac gaa gtc acc 2251
Val Arg Val Ser Thr Pro Lys Leu Gly Val Leu Glu Asn Glu Val Thr
345 350 355
acc tgc gac aag gcc aag ccg tgg acg ttc ggc atc tcg gcc ctg atc 2299
Thr Cys Asp Lys Ala Lys Pro Trp Thr Phe Gly Ile Ser Ala Leu Ile
360 365 370 375
cgc aac ctg gcc ggc cgc ggc ctc ctc taa tcgaaagctt cccgcg atg acc 2351
Arg Asn Leu Ala Gly Arg Gly Leu Leu Met Thr
380 385
gac acc ctg cgc cat tac atc ggc ggc gaa cgc gtc gcg gcc gac gcc 2399
Asp Thr Leu Arg His Tyr Ile Gly Gly Glu Arg Val Ala Ala Asp Ala
390 395 400
ccg gcc gag agc ctg aac ccg tcc aac acc aac gac gtc gtc gcc aag 2447
Pro Ala Glu Ser Leu Asn Pro Ser Asn Thr Asn Asp Val Val Ala Lys
405 410 415
gtc ccg atg ggc ggc cag gcc gag gtc gac gcc gcc gtc gac gcc gcg 2495
Val Pro Met Gly Gly Gln Ala Glu Val Asp Ala Ala Val Asp Ala Ala
420 425 430
cgc aag gcc ttc ccg gcc tgg gcc gac gcc tcg ccg gag gtc cgc tcg 2543
Arg Lys Ala Phe Pro Ala Trp Ala Asp Ala Ser Pro Glu Val Arg Ser
435 440 445 450
gac ctc ttg gac aag gtc ggt tcg acc atc atc gcc cgc agc gcc gac 2591
Asp Leu Leu Asp Lys Val Gly Ser Thr Ile Ile Ala Arg Ser Ala Asp
455 460 465
atc ggc cgc ctg ctg gcc cgc gaa gag ggc aag acc ctg gcg gaa ggc 2639
Ile Gly Arg Leu Leu Ala Arg Glu Glu Gly Lys Thr Leu Ala Glu Gly
470 475 480
atc ggc gag acc gtc cgc gcc ggc cgc atc ttc aag tac ttc gcc ggt 2687
Ile Gly Glu Thr Val Arg Ala Gly Arg Ile Phe Lys Tyr Phe Ala Gly
485 490 495
gaa gcc ctg cgc cgt cac ggc cag aac ctg gaa agc acc cgt ccg ggc 2735
Glu Ala Leu Arg Arg His Gly Gln Asn Leu Glu Ser Thr Arg Pro Gly
500 505 510
gtc gag atc cag acc tat cgt cag gcc gtg ggc gtc tat ggc ctg atc 2783
Val Glu Ile Gln Thr Tyr Arg Gln Ala Val Gly Val Tyr Gly Leu Ile
515 520 525 530
acg ccc tgg aac ttc ccg atc gcc atc ccg gcc tgg aag gcc gcc ccg 2831
Thr Pro Trp Asn Phe Pro Ile Ala Ile Pro Ala Trp Lys Ala Ala Pro
535 540 545
gcg ctc gcc ttc ggc aac acc gtg gtg atc aag ccg gcc ggc ccg acg 2879
Ala Leu Ala Phe Gly Asn Thr Val Val Ile Lys Pro Ala Gly Pro Thr
550 555 560
ccc gcc acc gcc aac gtg ctg gcc gac atc atg gcc gag tgc ggc gcc 2927
Pro Ala Thr Ala Asn Val Leu Ala Asp Ile Met Ala Glu Cys Gly Ala
565 570 575
ccg gcc ggc gtg ttc aac atg ctg ttt ggt cgc ggc tcg atg ggc gat 2975
Pro Ala Gly Val Phe Asn Met Leu Phe Gly Arg Gly Ser Met Gly Asp
580 585 590
gcg ctg atc aag cac aag gac gtg gac ggc gtc tcg ttc acc ggc tcg 3023
Ala Leu Ile Lys His Lys Asp Val Asp Gly Val Ser Phe Thr Gly Ser
595 600 605 610
cag ggc gtg ggc gcg cag gtc gcc gcc gcc gcc gtg gcc cgt cag gcc 3071
Gln Gly Val Gly Ala Gln Val Ala Ala Ala Ala Val Ala Arg Gln Ala
615 620 625
cgc gtg cag ctg gag atg ggc ggc aag aac ccg ctg atc gtg ctg gac 3119
Arg Val Gln Leu Glu Met Gly Gly Lys Asn Pro Leu Ile Val Leu Asp
630 635 640
gac gcc gac ctg gag cgc gcg gtc gcc atc gcc ctg gac ggc tcg ttc 3167
Asp Ala Asp Leu Glu Arg Ala Val Ala Ile Ala Leu Asp Gly Ser Phe
645 650 655
ttc gcc acc ggc cag cgc tgc acc gcc agc tcg cgc ctg atc gtc cag 3215
Phe Ala Thr Gly Gln Arg Cys Thr Ala Ser Ser Arg Leu Ile Val Gln
660 665 670
gac ggg att cac gac aag ttc gtg gcc ctg ctg gcc gag aag gtc gcc 3263
Asp Gly Ile His Asp Lys Phe Val Ala Leu Leu Ala Glu Lys Val Ala
675 680 685 690
gcc ctg cgc gtg ggc gac gct ctg gac ccc aac acc cag atc ggc ccg 3311
Ala Leu Arg Val Gly Asp Ala Leu Asp Pro Asn Thr Gln Ile Gly Pro
695 700 705
gcc gtc tcc gaa gac cag atg gag act tcg tac cgc tat atc gac atc 3359
Ala Val Ser Glu Asp Gln Met Glu Thr Ser Tyr Arg Tyr Ile Asp Ile
710 715 720
gct gcc tcc gaa ggc ggc cgc gtg gtc acc ggc ggc gac cgc atc aag 3407
Ala Ala Ser Glu Gly Gly Arg Val Val Thr Gly Gly Asp Arg Ile Lys
725 730 735
ctc gac aat ccg ggc tgg tac gtg cgt ccg acc ctg atc gcc gac acg 3455
Leu Asp Asn Pro Gly Trp Tyr Val Arg Pro Thr Leu Ile Ala Asp Thr
740 745 750
caa gcc ggc atg cgg atc aac aac gag gag gtc ttc ggc ccc gtc gcc 3503
Gln Ala Gly Met Arg Ile Asn Asn Glu Glu Val Phe Gly Pro Val Ala
755 760 765 770
tcg acc atc cgc gtc aag agc tac gaa gag gcg ctg gag atc gcc aac 3551
Ser Thr Ile Arg Val Lys Ser Tyr Glu Glu Ala Leu Glu Ile Ala Asn
775 780 785
ggc gtc gag ttc ggc ctt tcg gcc ggc atc gcc acc acc tcg ctc aag 3599
Gly Val Glu Phe Gly Leu Ser Ala Gly Ile Ala Thr Thr Ser Leu Lys
790 795 800
cac gcc cgc cac ttc cag cgc tat gcc cgc gcg ggc atg acc atg gtc 3647
His Ala Arg His Phe Gln Arg Tyr Ala Arg Ala Gly Met Thr Met Val
805 810 815
aat ctg gcc acg gcc ggc gtc gac tat cac gtg ccg ttc ggc ggc acg 3695
Asn Leu Ala Thr Ala Gly Val Asp Tyr His Val Pro Phe Gly Gly Thr
820 825 830
aag agc agc tcg tac ggc gcc cgc gag cag ggc ttc gcg gcg gtc gag 3743
Lys Ser Ser Ser Tyr Gly Ala Arg Glu Gln Gly Phe Ala Ala Val Glu
835 840 845 850
ttc ttc acc cag acc aaa acc tcc tac tcg tgg tcg taa gcagc atg tcc 3793
Phe Phe Thr Gln Thr Lys Thr Ser Tyr Ser Trp Ser Met Ser
855 860
tca gcc atc tat ccc agc ctg aag ggc aag cgc gtc gtc atc acc ggc 3841
Ser Ala Ile Tyr Pro Ser Leu Lys Gly Lys Arg Val Val Ile Thr Gly
865 870 875 880
ggc ggc tcg ggc atc ggg gcc ggc ctc acc gcc ggc ttc gcc cgt cag 3889
Gly Gly Ser Gly Ile Gly Ala Gly Leu Thr Ala Gly Phe Ala Arg Gln
885 890 895
ggc gcg gag gtg atc ttc ctc gac atc gcc gac gag gac tcc agg gct 3937
Gly Ala Glu Val Ile Phe Leu Asp Ile Ala Asp Glu Asp Ser Arg Ala
900 905 910
ctt gag gcc gag ctg gcc ggc tcg ccg atc ccg ccg gtc tac aag cgc 3985
Leu Glu Ala Glu Leu Ala Gly Ser Pro Ile Pro Pro Val Tyr Lys Arg
915 920 925
tgc gac ctg atg aac ctc gag gcg atc aag gcg gtc ttc gcc gag atc 4033
Cys Asp Leu Met Asn Leu Glu Ala Ile Lys Ala Val Phe Ala Glu Ile
930 935 940
ggc gac gtc gac gtg ctg gtc aac aac gcc ggc aat gac gac cgc cac 4081
Gly Asp Val Asp Val Leu Val Asn Asn Ala Gly Asn Asp Asp Arg His
945 950 955 960
aag ctg gcc gac gtg acc ggc gcc tat tgg gac gag cgg atc aac gtc 4129
Lys Leu Ala Asp Val Thr Gly Ala Tyr Trp Asp Glu Arg Ile Asn Val
965 970 975
aac ctg cgc cac atg ctg ttc tgc acc cag gcc gtc gcg ccg ggc atg 4177
Asn Leu Arg His Met Leu Phe Cys Thr Gln Ala Val Ala Pro Gly Met
980 985 990
aag aag cgt ggc ggc ggg gcg gtg atc aac ttc ggt tcg atc agc tgg 4225
Lys Lys Arg Gly Gly Gly Ala Val Ile Asn Phe Gly Ser Ile Ser Trp
995 1000 1005
cac ctg ggg ctt gag gac ctc gtc ctc tac gaa acc gcc aag gcc 4270
His Leu Gly Leu Glu Asp Leu Val Leu Tyr Glu Thr Ala Lys Ala
1010 1015 1020
ggc atc gaa ggc atg acc cgc gcg ctg gcc cgg gag ctg ggt ccc 4315
Gly Ile Glu Gly Met Thr Arg Ala Leu Ala Arg Glu Leu Gly Pro
1025 1030 1035
gac gac atc cgc gtc acc tgc gtg gtg ccg ggc aac gtc aag acc 4360
Asp Asp Ile Arg Val Thr Cys Val Val Pro Gly Asn Val Lys Thr
1040 1045 1050
aag cgc cag gag aag tgg tac acg ccc gaa ggc gag gcc cag atc 4405
Lys Arg Gln Glu Lys Trp Tyr Thr Pro Glu Gly Glu Ala Gln Ile
1055 1060 1065
gtg gcg gcc caa tgc ctg aag ggc cgc atc gtc ccg gag aac gtc 4450
Val Ala Ala Gln Cys Leu Lys Gly Arg Ile Val Pro Glu Asn Val
1070 1075 1080
gcc gcg ctg gtg ctg ttc ctg gcc tcg gat gac gcg tcg ctc tgc 4495
Ala Ala Leu Val Leu Phe Leu Ala Ser Asp Asp Ala Ser Leu Cys
1085 1090 1095
acc ggc cac gaa tac tgg atc gac gcc ggc tgg cgt tga cctaagaaaa 4544
Thr Gly His Glu Tyr Trp Ile Asp Ala Gly Trp Arg
1100 1105 1110
ctgtcatccc ggcccagcgt gaagcgcgcc gagccgggac cacggcaagc gccacgcgtc 4604
cggaggtccc ggctctccgc tgtgctacgg ccgggatgac agaggaatga ttgt atg 4661
Met
acc gct caa gtc act tgc gta tgg gat ctg aag gcc acg ttg ggc 4706
Thr Ala Gln Val Thr Cys Val Trp Asp Leu Lys Ala Thr Leu Gly
1115 1120 1125
gaa ggc ccg atc tgg cat ggc gac acc ctg tgg ttc gtc gac atc 4751
Glu Gly Pro Ile Trp His Gly Asp Thr Leu Trp Phe Val Asp Ile
1130 1135 1140
aag cag cgt aaa atc cac aac tac cac ccc gcc acc ggc gag cgc 4796
Lys Gln Arg Lys Ile His Asn Tyr His Pro Ala Thr Gly Glu Arg
1145 1150 1155
ttc agc ttc gac gcg ccg gat cag gtg acc ttc ctc gcg ccg atc 4841
Phe Ser Phe Asp Ala Pro Asp Gln Val Thr Phe Leu Ala Pro Ile
1160 1165 1170
gtc ggc gcg acc ggc ttt gtc gtc ggt ctg aag acc ggg att cac 4886
Val Gly Ala Thr Gly Phe Val Val Gly Leu Lys Thr Gly Ile His
1175 1180 1185
cgc ttc cac ccg gcc acg ggc ttc agc ctg ctg ctc gag gtc gag 4931
Arg Phe His Pro Ala Thr Gly Phe Ser Leu Leu Leu Glu Val Glu
1190 1195 1200
gac gcg gcg ctg aac aac cgc ccc aac gac gcc acg gtc gac gcg 4976
Asp Ala Ala Leu Asn Asn Arg Pro Asn Asp Ala Thr Val Asp Ala
1205 1210 1215
caa ggc cgt ctg tgg ttc ggc acc atg cac gac ggg gaa gag aac 5021
Gln Gly Arg Leu Trp Phe Gly Thr Met His Asp Gly Glu Glu Asn
1220 1225 1230
aat agc ggc tcg ctc tat cgg atg gac ctc acc ggc gtc gcc cgg 5066
Asn Ser Gly Ser Leu Tyr Arg Met Asp Leu Thr Gly Val Ala Arg
1235 1240 1245
atg gac cgc gac atc tgc atc acc aac ggc ccg tgc gtc tcg ccc 5111
Met Asp Arg Asp Ile Cys Ile Thr Asn Gly Pro Cys Val Ser Pro
1250 1255 1260
gac ggc aag acc ttc tac cac acc gac acc ctg gaa aag acg atc 5156
Asp Gly Lys Thr Phe Tyr His Thr Asp Thr Leu Glu Lys Thr Ile
1265 1270 1275
tac gcc ttc gac ctg gcc gag gac ggc ctg ctg tcg aac aag cgc 5201
Tyr Ala Phe Asp Leu Ala Glu Asp Gly Leu Leu Ser Asn Lys Arg
1280 1285 1290
gtc ttc gtg cag ttc gcc ctg ggc gac gat gtc tat ccg gac ggt 5246
Val Phe Val Gln Phe Ala Leu Gly Asp Asp Val Tyr Pro Asp Gly
1295 1300 1305
tcg gtc gtc gat tcc gaa ggc tat ctg tgg acc gcc ctg tgg ggc 5291
Ser Val Val Asp Ser Glu Gly Tyr Leu Trp Thr Ala Leu Trp Gly
1310 1315 1320
ggt ttc ggc gcg gtc cgc ttc tcg ccg caa ggc gac gcc gtg acg 5336
Gly Phe Gly Ala Val Arg Phe Ser Pro Gln Gly Asp Ala Val Thr
1325 1330 1335
cgc atc gaa ctg ccc gcc ccc aac gtc acc aag ccc tgc ttc ggc 5381
Arg Ile Glu Leu Pro Ala Pro Asn Val Thr Lys Pro Cys Phe Gly
1340 1345 1350
ggg cct gac ctg aag acc ctc tat ttc acc acc gcc cgc aag ggc 5426
Gly Pro Asp Leu Lys Thr Leu Tyr Phe Thr Thr Ala Arg Lys Gly
1355 1360 1365
ctg agc gac gag acc ctg gcc cag tac ccg ctg gcc ggc ggt gtg 5471
Leu Ser Asp Glu Thr Leu Ala Gln Tyr Pro Leu Ala Gly Gly Val
1370 1375 1380
ttc gcc gtt ccg gtc gat gtg gcc ggc caa ccc cag cat gag gtc 5516
Phe Ala Val Pro Val Asp Val Ala Gly Gln Pro Gln His Glu Val
1385 1390 1395
cgc ctt gtc taa ccgcacgccc cgccggttcc ggtcccgcga ttggttcgat 5568
Arg Leu Val
aaccccgacc atatcgacat gaccgcgctc tatctggagc gcttcatgaa ctacgggatc 5628
acgccggagg agctgcgcag cggcaagccg atcatcggca tcgcccagac cggcagcgac 5688
atctcgccct gcaaccgcat ccacctggac ctggtccagc gggtgcggga cgggatccgc 5748
gacgccgggg gcatccccat ggagttcccg gtccatccga tcttcgagaa ctgccgtcgc 5808
ccgacggcgg cgctggaccg gaacctctcg tacctgggtc tcgtcgagac cctgcacggc 5868
tatccgatcg acgccgtggt tctgaccacc ggctgcgaca agaccacccc ggccgggatc 5928
atggccgcca ccacggtcaa tatcccggcc atcgtgctgt cgggcggccc gatgctggac 5988
ggctggcacg agaacgagct cgtgggctcg ggcaccgtga tctggcgctc gcgccgcaag 6048
ctggcggccg gcgagatcac cgaggaagag ttcatcgacc gcgccgccag ctcggcgccg 6108
tcggcgggcc actgcaacac catgggcacg gcctcgacca tgaacgccgt ggccgaggcg 6168
ctgggcctgt cgctgaccgg ctgcgcggcc atccccgccc cctaccgcga gcgcggccag 6228
atggcctaca agaccggcca gcgcatcgtc gatctggcct atgacgacgt caaaccgctc 6288
gacatcctga ccaagcaagc cttcgagaac gccatcgccc tggtggcggc ggccggcggc 6348
tcgaccaacg cccagccgca catcgtggcc atggcccgtc acgccggcgt cgagatcacc 6408
gccgacgact ggcgcgcggc ctatgacatc ccgctgatcg tcaacatgca gccggccggc 6468
aagtatctgg gcgagcgctt ccaccgagcc ggcggcgcgc cggcggtgct gtgggagctg 6528
ttgcagcaag gccgcctgca cggcgacgtg ctgaccgtca ccggcaagac gatgagcgag 6588
aacctgcaag gccgcgaaac cagcgaccgc gaggtgatct tcccgtacca cgagccgctg 6648
gccgagaagg ccgggttcct ggttctcaag ggcaacctct tcgacttcgc gatcatgaag 6708
tccagcgtga tcggcgagga gttccgcaag cgctacctgt cgcagcccgg ccaggaaggc 6768
gtgttcgaag cccgcgccat cgtgttcgac ggctcggacg actatcacaa gcggatcaac 6828
gatccggccc tggagatcga cgagcgctgc atcctggtga tccgcggcgc gggtccgatc 6888
ggctggcccg gctcggccga ggtcgtcaac atgcagccgc cggatcacct tctgaagaag 6948
gggatcatga gcctgcccac cctgggcgat ggccgtcagt cgggcaccgc cgacagcccc 7008
tcgatcctga acgcctcgcc cgaaagcgcg atcggcggcg gcctgtcgtg gctgcgcacc 7068
ggcgacacca tccgcatcga cctcaacacc ggccgctgcg acgccctggt cgacgaggcg 7128
acgatcgccg cgcgcaagca ggacggcatc ccggcggttc ccgccaccat gacgccctgg 7188
caggaaatct accgcgccca cgccagtcag ctcgacaccg gcggcgtgct ggagttcgcg 7248
gtcaagtacc aggacctggc ggccaagctg ccccgccaca accactgatg cgaagggcct 7308
tcggagcgat ccggaggccc ttttctttgc gccccccgga tcgcccgccc ccgcttcaca 7368
acacccagcc gaatcgcatt ttctccgtcg ccaaacgctg aaatgcgaag gggctggggg 7428
ggcgccatgg aactcaagga atactttctg ggcctgttgg ccatcatcac cggcctggcg 7488
atcaccgaca tgatcctgag cgtgcacggc ctgctacggc gcgtcagccg cgtacgatgg 7548
gattggctgc cgctcacggc cgccgccctg gttttcgtcg tcatcgtccg cagctggtgg 7608
atcgcctggg agcccgactg gatcaacacg ccgatgtggc agttcctgtt gatcctgatc 7668
cagctgacct gcctgttcct ggccgccaag tctgtgttgc cggacgacag cgacgccgaa 7728
gaggtcgacc tgatggctca ctactggtcg cagaaccggt tcgtctgggc gtccctgatc 7788
ggcatgatca cggcgttcgc cgccgcctcg gtcttcctgc gcatcaacga tccggcgagc 7848
ctgtcggcat ggttctggac gttcggttgg gagctgccgg tctactgctt gccgctggtg 7908
gtcctgatcc tcctgcagcg accgatcgtg catcgcgcgc tggttcccgc gctcctgctc 7968
gcctggctgg tcctgaacgg gacggacgtg atgcactaca gctagggctc ggcggctctg 8028
gtaaacaacc caaccccgat caacgaaggt ttagaaagct ttaagagaaa cgttgcgaat 8088
tgtaaaattc ttctctgggt tgaaacccat ttcgggtgta tcgatgaggt gtcgggccat 8148
ttattgagcg cggacaggat gttgtcagtg agccgagccc ttgatcaacg accggagtcg 8208
cccagcctgg tgatcgccac cacgatcctc cagcttggcc tcgttgttgt ggtttggctg 8268
gtggcgctga tccccgccgc gctggcgg 8296
<210> 24
<211> 384
<212> PRT
<213> Caulobacter crescentus
<400> 24
Val Gly Val Ser Glu Phe Leu Pro Glu Asp Trp Lys Ala Ala Thr Leu
1 5 10 15
Leu Gly Arg Ile Asp Phe Gly Glu Gly Pro Thr Pro Val Leu Val Arg
20 25 30
Gly Gly Arg Val Glu Asp Val Ser Lys Ile Ala Pro Thr Val Ala Asp
35 40 45
Leu Met Asn Ala Phe Gln Pro Gly Ala Val Ile Pro Arg Gly Glu Asp
50 55 60
Lys Gly Pro Leu Glu Ala Leu Asp Ile Arg Pro Val Trp Glu Asp Pro
65 70 75 80
Asp Gly Ala Ala Pro Val Lys Leu Leu Ala Pro Val Asp Leu Gln Cys
85 90 95
Leu Lys Ala Ala Gly Val Thr Phe Ala Val Ser Thr Leu Glu Arg Val
100 105 110
Ile Glu Glu Arg Ala Arg Gly Asp Ala Gly Glu Ala Leu Lys Ile Arg
115 120 125
Thr Leu Leu Ala Glu Arg Met Gly Gly Asp Leu Lys Ser Val Glu Pro
130 135 140
Gly Ser Gln Gly Ala Gln Arg Leu Lys Asp Ala Leu Ile Ala Asp Gly
145 150 155 160
Leu Trp Ser Gln Tyr Leu Glu Val Ala Ile Gly Pro Asp Ala Glu Ile
165 170 175
Phe Thr Lys Gly Pro Thr Leu Ser Ser Met Gly Trp Gly Asp Gln Val
180 185 190
Gly Val Arg Tyr Asp Ser His Trp Asn Asn Pro Glu Pro Glu Val Val
195 200 205
Leu Leu Cys Asp Gly Ser Gly Leu Ile Arg Gly Ala Ala Leu Gly Asn
210 215 220
Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Ser
225 230 235 240
Lys Ala Lys Asp Asn Asn Ala Ser Cys Ala Ile Gly Pro Phe Phe Arg
245 250 255
Leu Phe Asp Glu Thr Phe Gly Leu Asp Asp Val Arg Ser Ala Glu Val
260 265 270
Glu Leu Lys Ile Thr Gly Arg Asp Asn Phe Val Leu Asp Gly Lys Ser
275 280 285
Asn Met Ser Leu Ile Ser Arg Asp Pro Ala Val Leu Ala Gly Gln Ala
290 295 300
Tyr Gly Lys Gln His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Leu Gly
305 310 315 320
Thr Met Phe Ala Pro Ile Gln Asp Arg Asp Thr Pro Gly Gln Gly Phe
325 330 335
Thr His Lys Val Gly Asp Arg Val Arg Val Ser Thr Pro Lys Leu Gly
340 345 350
Val Leu Glu Asn Glu Val Thr Thr Cys Asp Lys Ala Lys Pro Trp Thr
355 360 365
Phe Gly Ile Ser Ala Leu Ile Arg Asn Leu Ala Gly Arg Gly Leu Leu
370 375 380
<210> 25
<211> 478
<212> PRT
<213> Caulobacter crescentus
<400> 25
Met Thr Asp Thr Leu Arg His Tyr Ile Gly Gly Glu Arg Val Ala Ala
1 5 10 15
Asp Ala Pro Ala Glu Ser Leu Asn Pro Ser Asn Thr Asn Asp Val Val
20 25 30
Ala Lys Val Pro Met Gly Gly Gln Ala Glu Val Asp Ala Ala Val Asp
35 40 45
Ala Ala Arg Lys Ala Phe Pro Ala Trp Ala Asp Ala Ser Pro Glu Val
50 55 60
Arg Ser Asp Leu Leu Asp Lys Val Gly Ser Thr Ile Ile Ala Arg Ser
65 70 75 80
Ala Asp Ile Gly Arg Leu Leu Ala Arg Glu Glu Gly Lys Thr Leu Ala
85 90 95
Glu Gly Ile Gly Glu Thr Val Arg Ala Gly Arg Ile Phe Lys Tyr Phe
100 105 110
Ala Gly Glu Ala Leu Arg Arg His Gly Gln Asn Leu Glu Ser Thr Arg
115 120 125
Pro Gly Val Glu Ile Gln Thr Tyr Arg Gln Ala Val Gly Val Tyr Gly
130 135 140
Leu Ile Thr Pro Trp Asn Phe Pro Ile Ala Ile Pro Ala Trp Lys Ala
145 150 155 160
Ala Pro Ala Leu Ala Phe Gly Asn Thr Val Val Ile Lys Pro Ala Gly
165 170 175
Pro Thr Pro Ala Thr Ala Asn Val Leu Ala Asp Ile Met Ala Glu Cys
180 185 190
Gly Ala Pro Ala Gly Val Phe Asn Met Leu Phe Gly Arg Gly Ser Met
195 200 205
Gly Asp Ala Leu Ile Lys His Lys Asp Val Asp Gly Val Ser Phe Thr
210 215 220
Gly Ser Gln Gly Val Gly Ala Gln Val Ala Ala Ala Ala Val Ala Arg
225 230 235 240
Gln Ala Arg Val Gln Leu Glu Met Gly Gly Lys Asn Pro Leu Ile Val
245 250 255
Leu Asp Asp Ala Asp Leu Glu Arg Ala Val Ala Ile Ala Leu Asp Gly
260 265 270
Ser Phe Phe Ala Thr Gly Gln Arg Cys Thr Ala Ser Ser Arg Leu Ile
275 280 285
Val Gln Asp Gly Ile His Asp Lys Phe Val Ala Leu Leu Ala Glu Lys
290 295 300
Val Ala Ala Leu Arg Val Gly Asp Ala Leu Asp Pro Asn Thr Gln Ile
305 310 315 320
Gly Pro Ala Val Ser Glu Asp Gln Met Glu Thr Ser Tyr Arg Tyr Ile
325 330 335
Asp Ile Ala Ala Ser Glu Gly Gly Arg Val Val Thr Gly Gly Asp Arg
340 345 350
Ile Lys Leu Asp Asn Pro Gly Trp Tyr Val Arg Pro Thr Leu Ile Ala
355 360 365
Asp Thr Gln Ala Gly Met Arg Ile Asn Asn Glu Glu Val Phe Gly Pro
370 375 380
Val Ala Ser Thr Ile Arg Val Lys Ser Tyr Glu Glu Ala Leu Glu Ile
385 390 395 400
Ala Asn Gly Val Glu Phe Gly Leu Ser Ala Gly Ile Ala Thr Thr Ser
405 410 415
Leu Lys His Ala Arg His Phe Gln Arg Tyr Ala Arg Ala Gly Met Thr
420 425 430
Met Val Asn Leu Ala Thr Ala Gly Val Asp Tyr His Val Pro Phe Gly
435 440 445
Gly Thr Lys Ser Ser Ser Tyr Gly Ala Arg Glu Gln Gly Phe Ala Ala
450 455 460
Val Glu Phe Phe Thr Gln Thr Lys Thr Ser Tyr Ser Trp Ser
465 470 475
<210> 26
<211> 248
<212> PRT
<213> Caulobacter crescentus
<400> 26
Met Ser Ser Ala Ile Tyr Pro Ser Leu Lys Gly Lys Arg Val Val Ile
1 5 10 15
Thr Gly Gly Gly Ser Gly Ile Gly Ala Gly Leu Thr Ala Gly Phe Ala
20 25 30
Arg Gln Gly Ala Glu Val Ile Phe Leu Asp Ile Ala Asp Glu Asp Ser
35 40 45
Arg Ala Leu Glu Ala Glu Leu Ala Gly Ser Pro Ile Pro Pro Val Tyr
50 55 60
Lys Arg Cys Asp Leu Met Asn Leu Glu Ala Ile Lys Ala Val Phe Ala
65 70 75 80
Glu Ile Gly Asp Val Asp Val Leu Val Asn Asn Ala Gly Asn Asp Asp
85 90 95
Arg His Lys Leu Ala Asp Val Thr Gly Ala Tyr Trp Asp Glu Arg Ile
100 105 110
Asn Val Asn Leu Arg His Met Leu Phe Cys Thr Gln Ala Val Ala Pro
115 120 125
Gly Met Lys Lys Arg Gly Gly Gly Ala Val Ile Asn Phe Gly Ser Ile
130 135 140
Ser Trp His Leu Gly Leu Glu Asp Leu Val Leu Tyr Glu Thr Ala Lys
145 150 155 160
Ala Gly Ile Glu Gly Met Thr Arg Ala Leu Ala Arg Glu Leu Gly Pro
165 170 175
Asp Asp Ile Arg Val Thr Cys Val Val Pro Gly Asn Val Lys Thr Lys
180 185 190
Arg Gln Glu Lys Trp Tyr Thr Pro Glu Gly Glu Ala Gln Ile Val Ala
195 200 205
Ala Gln Cys Leu Lys Gly Arg Ile Val Pro Glu Asn Val Ala Ala Leu
210 215 220
Val Leu Phe Leu Ala Ser Asp Asp Ala Ser Leu Cys Thr Gly His Glu
225 230 235 240
Tyr Trp Ile Asp Ala Gly Trp Arg
245
<210> 27
<211> 289
<212> PRT
<213> Caulobacter crescentus
<400> 27
Met Thr Ala Gln Val Thr Cys Val Trp Asp Leu Lys Ala Thr Leu Gly
1 5 10 15
Glu Gly Pro Ile Trp His Gly Asp Thr Leu Trp Phe Val Asp Ile Lys
20 25 30
Gln Arg Lys Ile His Asn Tyr His Pro Ala Thr Gly Glu Arg Phe Ser
35 40 45
Phe Asp Ala Pro Asp Gln Val Thr Phe Leu Ala Pro Ile Val Gly Ala
50 55 60
Thr Gly Phe Val Val Gly Leu Lys Thr Gly Ile His Arg Phe His Pro
65 70 75 80
Ala Thr Gly Phe Ser Leu Leu Leu Glu Val Glu Asp Ala Ala Leu Asn
85 90 95
Asn Arg Pro Asn Asp Ala Thr Val Asp Ala Gln Gly Arg Leu Trp Phe
100 105 110
Gly Thr Met His Asp Gly Glu Glu Asn Asn Ser Gly Ser Leu Tyr Arg
115 120 125
Met Asp Leu Thr Gly Val Ala Arg Met Asp Arg Asp Ile Cys Ile Thr
130 135 140
Asn Gly Pro Cys Val Ser Pro Asp Gly Lys Thr Phe Tyr His Thr Asp
145 150 155 160
Thr Leu Glu Lys Thr Ile Tyr Ala Phe Asp Leu Ala Glu Asp Gly Leu
165 170 175
Leu Ser Asn Lys Arg Val Phe Val Gln Phe Ala Leu Gly Asp Asp Val
180 185 190
Tyr Pro Asp Gly Ser Val Val Asp Ser Glu Gly Tyr Leu Trp Thr Ala
195 200 205
Leu Trp Gly Gly Phe Gly Ala Val Arg Phe Ser Pro Gln Gly Asp Ala
210 215 220
Val Thr Arg Ile Glu Leu Pro Ala Pro Asn Val Thr Lys Pro Cys Phe
225 230 235 240
Gly Gly Pro Asp Leu Lys Thr Leu Tyr Phe Thr Thr Ala Arg Lys Gly
245 250 255
Leu Ser Asp Glu Thr Leu Ala Gln Tyr Pro Leu Ala Gly Gly Val Phe
260 265 270
Ala Val Pro Val Asp Val Ala Gly Gln Pro Gln His Glu Val Arg Leu
275 280 285
Val
<210> 28
<211> 1788
<212> DNA
<213> Caulobacter crescentus
<220>
<221> CDS
<222> (1)..(1788)
<400> 28
atg agg tcc gcc ttg tct aac cgc acg ccc cgc cgg ttc cgg tcc cgc 48
Met Arg Ser Ala Leu Ser Asn Arg Thr Pro Arg Arg Phe Arg Ser Arg
1 5 10 15
gat tgg ttc gat aac ccc gac cat atc gac atg acc gcg ctc tat ctg 96
Asp Trp Phe Asp Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu
20 25 30
gag cgc ttc atg aac tac ggg atc acg ccg gag gag ctg cgc agc ggc 144
Glu Arg Phe Met Asn Tyr Gly Ile Thr Pro Glu Glu Leu Arg Ser Gly
35 40 45
aag ccg atc atc ggc atc gcc cag acc ggc agc gac atc tcg ccc tgc 192
Lys Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Ile Ser Pro Cys
50 55 60
aac cgc atc cac ctg gac ctg gtc cag cgg gtg cgg gac ggg atc cgc 240
Asn Arg Ile His Leu Asp Leu Val Gln Arg Val Arg Asp Gly Ile Arg
65 70 75 80
gac gcc ggg ggc atc ccc atg gag ttc ccg gtc cat ccg atc ttc gag 288
Asp Ala Gly Gly Ile Pro Met Glu Phe Pro Val His Pro Ile Phe Glu
85 90 95
aac tgc cgt cgc ccg acg gcg gcg ctg gac cgg aac ctc tcg tac ctg 336
Asn Cys Arg Arg Pro Thr Ala Ala Leu Asp Arg Asn Leu Ser Tyr Leu
100 105 110
ggt ctc gtc gag acc ctg cac ggc tat ccg atc gac gcc gtg gtt ctg 384
Gly Leu Val Glu Thr Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu
115 120 125
acc acc ggc tgc gac aag acc acc ccg gcc ggg atc atg gcc gcc acc 432
Thr Thr Gly Cys Asp Lys Thr Thr Pro Ala Gly Ile Met Ala Ala Thr
130 135 140
acg gtc aat atc ccg gcc atc gtg ctg tcg ggc ggc ccg atg ctg gac 480
Thr Val Asn Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp
145 150 155 160
ggc tgg cac gag aac gag ctc gtg ggc tcg ggc acc gtg atc tgg cgc 528
Gly Trp His Glu Asn Glu Leu Val Gly Ser Gly Thr Val Ile Trp Arg
165 170 175
tcg cgc cgc aag ctg gcg gcc ggc gag atc acc gag gaa gag ttc atc 576
Ser Arg Arg Lys Leu Ala Ala Gly Glu Ile Thr Glu Glu Glu Phe Ile
180 185 190
gac cgc gcc gcc agc tcg gcg ccg tcg gcg ggc cac tgc aac acc atg 624
Asp Arg Ala Ala Ser Ser Ala Pro Ser Ala Gly His Cys Asn Thr Met
195 200 205
ggc acg gcc tcg acc atg aac gcc gtg gcc gag gcg ctg ggc ctg tcg 672
Gly Thr Ala Ser Thr Met Asn Ala Val Ala Glu Ala Leu Gly Leu Ser
210 215 220
ctg acc ggc tgc gcg gcc atc ccc gcc ccc tac cgc gag cgc ggc cag 720
Leu Thr Gly Cys Ala Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln
225 230 235 240
atg gcc tac aag acc ggc cag cgc atc gtc gat ctg gcc tat gac gac 768
Met Ala Tyr Lys Thr Gly Gln Arg Ile Val Asp Leu Ala Tyr Asp Asp
245 250 255
gtc aaa ccg ctc gac atc ctg acc aag caa gcc ttc gag aac gcc atc 816
Val Lys Pro Leu Asp Ile Leu Thr Lys Gln Ala Phe Glu Asn Ala Ile
260 265 270
gcc ctg gtg gcg gcg gcc ggc ggc tcg acc aac gcc cag ccg cac atc 864
Ala Leu Val Ala Ala Ala Gly Gly Ser Thr Asn Ala Gln Pro His Ile
275 280 285
gtg gcc atg gcc cgt cac gcc ggc gtc gag atc acc gcc gac gac tgg 912
Val Ala Met Ala Arg His Ala Gly Val Glu Ile Thr Ala Asp Asp Trp
290 295 300
cgc gcg gcc tat gac atc ccg ctg atc gtc aac atg cag ccg gcc ggc 960
Arg Ala Ala Tyr Asp Ile Pro Leu Ile Val Asn Met Gln Pro Ala Gly
305 310 315 320
aag tat ctg ggc gag cgc ttc cac cga gcc ggc ggc gcg ccg gcg gtg 1008
Lys Tyr Leu Gly Glu Arg Phe His Arg Ala Gly Gly Ala Pro Ala Val
325 330 335
ctg tgg gag ctg ttg cag caa ggc cgc ctg cac ggc gac gtg ctg acc 1056
Leu Trp Glu Leu Leu Gln Gln Gly Arg Leu His Gly Asp Val Leu Thr
340 345 350
gtc acc ggc aag acg atg agc gag aac ctg caa ggc cgc gaa acc agc 1104
Val Thr Gly Lys Thr Met Ser Glu Asn Leu Gln Gly Arg Glu Thr Ser
355 360 365
gac cgc gag gtg atc ttc ccg tac cac gag ccg ctg gcc gag aag gcc 1152
Asp Arg Glu Val Ile Phe Pro Tyr His Glu Pro Leu Ala Glu Lys Ala
370 375 380
ggg ttc ctg gtt ctc aag ggc aac ctc ttc gac ttc gcg atc atg aag 1200
Gly Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys
385 390 395 400
tcc agc gtg atc ggc gag gag ttc cgc aag cgc tac ctg tcg cag ccc 1248
Ser Ser Val Ile Gly Glu Glu Phe Arg Lys Arg Tyr Leu Ser Gln Pro
405 410 415
ggc cag gaa ggc gtg ttc gaa gcc cgc gcc atc gtg ttc gac ggc tcg 1296
Gly Gln Glu Gly Val Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Ser
420 425 430
gac gac tat cac aag cgg atc aac gat ccg gcc ctg gag atc gac gag 1344
Asp Asp Tyr His Lys Arg Ile Asn Asp Pro Ala Leu Glu Ile Asp Glu
435 440 445
cgc tgc atc ctg gtg atc cgc ggc gcg ggt ccg atc ggc tgg ccc ggc 1392
Arg Cys Ile Leu Val Ile Arg Gly Ala Gly Pro Ile Gly Trp Pro Gly
450 455 460
tcg gcc gag gtc gtc aac atg cag ccg ccg gat cac ctt ctg aag aag 1440
Ser Ala Glu Val Val Asn Met Gln Pro Pro Asp His Leu Leu Lys Lys
465 470 475 480
ggg atc atg agc ctg ccc acc ctg ggc gat ggc cgt cag tcg ggc acc 1488
Gly Ile Met Ser Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr
485 490 495
gcc gac agc ccc tcg atc ctg aac gcc tcg ccc gaa agc gcg atc ggc 1536
Ala Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ile Gly
500 505 510
ggc ggc ctg tcg tgg ctg cgc acc ggc gac acc atc cgc atc gac ctc 1584
Gly Gly Leu Ser Trp Leu Arg Thr Gly Asp Thr Ile Arg Ile Asp Leu
515 520 525
aac acc ggc cgc tgc gac gcc ctg gtc gac gag gcg acg atc gcc gcg 1632
Asn Thr Gly Arg Cys Asp Ala Leu Val Asp Glu Ala Thr Ile Ala Ala
530 535 540
cgc aag cag gac ggc atc ccg gcg gtt ccc gcc acc atg acg ccc tgg 1680
Arg Lys Gln Asp Gly Ile Pro Ala Val Pro Ala Thr Met Thr Pro Trp
545 550 555 560
cag gaa atc tac cgc gcc cac gcc agt cag ctc gac acc ggc ggc gtg 1728
Gln Glu Ile Tyr Arg Ala His Ala Ser Gln Leu Asp Thr Gly Gly Val
565 570 575
ctg gag ttc gcg gtc aag tac cag gac ctg gcg gcc aag ctg ccc cgc 1776
Leu Glu Phe Ala Val Lys Tyr Gln Asp Leu Ala Ala Lys Leu Pro Arg
580 585 590
cac aac cac tga 1788
His Asn His
595
<210> 29
<211> 595
<212> PRT
<213> Caulobacter crescentus
<400> 29
Met Arg Ser Ala Leu Ser Asn Arg Thr Pro Arg Arg Phe Arg Ser Arg
1 5 10 15
Asp Trp Phe Asp Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu
20 25 30
Glu Arg Phe Met Asn Tyr Gly Ile Thr Pro Glu Glu Leu Arg Ser Gly
35 40 45
Lys Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Ile Ser Pro Cys
50 55 60
Asn Arg Ile His Leu Asp Leu Val Gln Arg Val Arg Asp Gly Ile Arg
65 70 75 80
Asp Ala Gly Gly Ile Pro Met Glu Phe Pro Val His Pro Ile Phe Glu
85 90 95
Asn Cys Arg Arg Pro Thr Ala Ala Leu Asp Arg Asn Leu Ser Tyr Leu
100 105 110
Gly Leu Val Glu Thr Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu
115 120 125
Thr Thr Gly Cys Asp Lys Thr Thr Pro Ala Gly Ile Met Ala Ala Thr
130 135 140
Thr Val Asn Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp
145 150 155 160
Gly Trp His Glu Asn Glu Leu Val Gly Ser Gly Thr Val Ile Trp Arg
165 170 175
Ser Arg Arg Lys Leu Ala Ala Gly Glu Ile Thr Glu Glu Glu Phe Ile
180 185 190
Asp Arg Ala Ala Ser Ser Ala Pro Ser Ala Gly His Cys Asn Thr Met
195 200 205
Gly Thr Ala Ser Thr Met Asn Ala Val Ala Glu Ala Leu Gly Leu Ser
210 215 220
Leu Thr Gly Cys Ala Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln
225 230 235 240
Met Ala Tyr Lys Thr Gly Gln Arg Ile Val Asp Leu Ala Tyr Asp Asp
245 250 255
Val Lys Pro Leu Asp Ile Leu Thr Lys Gln Ala Phe Glu Asn Ala Ile
260 265 270
Ala Leu Val Ala Ala Ala Gly Gly Ser Thr Asn Ala Gln Pro His Ile
275 280 285
Val Ala Met Ala Arg His Ala Gly Val Glu Ile Thr Ala Asp Asp Trp
290 295 300
Arg Ala Ala Tyr Asp Ile Pro Leu Ile Val Asn Met Gln Pro Ala Gly
305 310 315 320
Lys Tyr Leu Gly Glu Arg Phe His Arg Ala Gly Gly Ala Pro Ala Val
325 330 335
Leu Trp Glu Leu Leu Gln Gln Gly Arg Leu His Gly Asp Val Leu Thr
340 345 350
Val Thr Gly Lys Thr Met Ser Glu Asn Leu Gln Gly Arg Glu Thr Ser
355 360 365
Asp Arg Glu Val Ile Phe Pro Tyr His Glu Pro Leu Ala Glu Lys Ala
370 375 380
Gly Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys
385 390 395 400
Ser Ser Val Ile Gly Glu Glu Phe Arg Lys Arg Tyr Leu Ser Gln Pro
405 410 415
Gly Gln Glu Gly Val Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Ser
420 425 430
Asp Asp Tyr His Lys Arg Ile Asn Asp Pro Ala Leu Glu Ile Asp Glu
435 440 445
Arg Cys Ile Leu Val Ile Arg Gly Ala Gly Pro Ile Gly Trp Pro Gly
450 455 460
Ser Ala Glu Val Val Asn Met Gln Pro Pro Asp His Leu Leu Lys Lys
465 470 475 480
Gly Ile Met Ser Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr
485 490 495
Ala Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ile Gly
500 505 510
Gly Gly Leu Ser Trp Leu Arg Thr Gly Asp Thr Ile Arg Ile Asp Leu
515 520 525
Asn Thr Gly Arg Cys Asp Ala Leu Val Asp Glu Ala Thr Ile Ala Ala
530 535 540
Arg Lys Gln Asp Gly Ile Pro Ala Val Pro Ala Thr Met Thr Pro Trp
545 550 555 560
Gln Glu Ile Tyr Arg Ala His Ala Ser Gln Leu Asp Thr Gly Gly Val
565 570 575
Leu Glu Phe Ala Val Lys Tyr Gln Asp Leu Ala Ala Lys Leu Pro Arg
580 585 590
His Asn His
595
<210> 30
<211> 1476
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(1476)
<400> 30
atg aat acc cag tat aat tcc agt tat ata ttt tcg att acc tta gtc 48
Met Asn Thr Gln Tyr Asn Ser Ser Tyr Ile Phe Ser Ile Thr Leu Val
1 5 10 15
gct aca tta ggt ggt tta tta ttt ggc tac gac acc gcc gtt att tcc 96
Ala Thr Leu Gly Gly Leu Leu Phe Gly Tyr Asp Thr Ala Val Ile Ser
20 25 30
ggt act gtt gag tca ctc aat acc gtc ttt gtt gct cca caa aac tta 144
Gly Thr Val Glu Ser Leu Asn Thr Val Phe Val Ala Pro Gln Asn Leu
35 40 45
agt gaa tcc gct gcc aac tcc ctg tta ggg ttt tgc gtg gcc agc gct 192
Ser Glu Ser Ala Ala Asn Ser Leu Leu Gly Phe Cys Val Ala Ser Ala
50 55 60
ctg att ggt tgc atc atc ggc ggt gcc ctc ggt ggt tat tgc agt aac 240
Leu Ile Gly Cys Ile Ile Gly Gly Ala Leu Gly Gly Tyr Cys Ser Asn
65 70 75 80
cgc ttc ggt cgt cgt gat tca ctt aag att gct gct gtc ctg ttt ttt 288
Arg Phe Gly Arg Arg Asp Ser Leu Lys Ile Ala Ala Val Leu Phe Phe
85 90 95
att tct ggt gta ggt tct gcc tgg cca gaa ctt ggt ttt acc tct ata 336
Ile Ser Gly Val Gly Ser Ala Trp Pro Glu Leu Gly Phe Thr Ser Ile
100 105 110
aac ccg gac aac act gtg cct gtt tat ctg gca ggt tat gtc ccg gaa 384
Asn Pro Asp Asn Thr Val Pro Val Tyr Leu Ala Gly Tyr Val Pro Glu
115 120 125
ttt gtt att tat cgc att att ggc ggt att ggc gtt ggt tta gcc tca 432
Phe Val Ile Tyr Arg Ile Ile Gly Gly Ile Gly Val Gly Leu Ala Ser
130 135 140
atg ctc tcg cca atg tat att gcg gaa ctg gct cca gct cat att cgc 480
Met Leu Ser Pro Met Tyr Ile Ala Glu Leu Ala Pro Ala His Ile Arg
145 150 155 160
ggg aaa ctg gtc tct ttt aac cag ttt gcg att att ttc ggg caa ctt 528
Gly Lys Leu Val Ser Phe Asn Gln Phe Ala Ile Ile Phe Gly Gln Leu
165 170 175
tta gtt tac tgc gta aac tat ttt att gcc cgt tcc ggt gat gcc agc 576
Leu Val Tyr Cys Val Asn Tyr Phe Ile Ala Arg Ser Gly Asp Ala Ser
180 185 190
tgg ctg aat act gac ggc tgg cgt tat atg ttt gcc tcg gaa tgt atc 624
Trp Leu Asn Thr Asp Gly Trp Arg Tyr Met Phe Ala Ser Glu Cys Ile
195 200 205
cct gca ctg ctg ttc tta atg ctg ctg tat acc gtg cca gaa agt cct 672
Pro Ala Leu Leu Phe Leu Met Leu Leu Tyr Thr Val Pro Glu Ser Pro
210 215 220
cgc tgg ctg atg tcg cgc ggc aag caa gaa cag gcg gaa ggt atc ctg 720
Arg Trp Leu Met Ser Arg Gly Lys Gln Glu Gln Ala Glu Gly Ile Leu
225 230 235 240
cgc aaa att atg ggc aac acg ctt gca act cag gca gta cag gaa att 768
Arg Lys Ile Met Gly Asn Thr Leu Ala Thr Gln Ala Val Gln Glu Ile
245 250 255
aaa cac tcc ctg gat cat ggc cgc aaa acc ggt ggt cgt ctg ctg atg 816
Lys His Ser Leu Asp His Gly Arg Lys Thr Gly Gly Arg Leu Leu Met
260 265 270
ttt ggc gtg ggc gtg att gta atc ggc gta atg ctc tcc atc ttc cag 864
Phe Gly Val Gly Val Ile Val Ile Gly Val Met Leu Ser Ile Phe Gln
275 280 285
caa ttt gtc ggc atc aat gtg gtg ctg tac tac gcg ccg gaa gtg ttc 912
Gln Phe Val Gly Ile Asn Val Val Leu Tyr Tyr Ala Pro Glu Val Phe
290 295 300
aaa acg ctg ggg gcc agc acg gat atc gcg ctg ttg cag acc att att 960
Lys Thr Leu Gly Ala Ser Thr Asp Ile Ala Leu Leu Gln Thr Ile Ile
305 310 315 320
gtc gga gtt atc aac ctc acc ttc acc gtt ctg gca att atg acg gtg 1008
Val Gly Val Ile Asn Leu Thr Phe Thr Val Leu Ala Ile Met Thr Val
325 330 335
gat aaa ttt ggt cgt aag cca ctg caa att atc ggc gca ctc gga atg 1056
Asp Lys Phe Gly Arg Lys Pro Leu Gln Ile Ile Gly Ala Leu Gly Met
340 345 350
gca atc ggt atg ttt agc ctc ggt acc gcg ttt tac act cag gca ccg 1104
Ala Ile Gly Met Phe Ser Leu Gly Thr Ala Phe Tyr Thr Gln Ala Pro
355 360 365
ggt att gtg gcg cta ctg tcg atg ctg ttc tat gtt gcc gcc ttt gcc 1152
Gly Ile Val Ala Leu Leu Ser Met Leu Phe Tyr Val Ala Ala Phe Ala
370 375 380
atg tcc tgg ggt ccg gta tgc tgg gta ctg ctg tcg gaa atc ttc ccg 1200
Met Ser Trp Gly Pro Val Cys Trp Val Leu Leu Ser Glu Ile Phe Pro
385 390 395 400
aat gct att cgt ggt aaa gcg ctg gca atc gcg gtg gcg gcc cag tgg 1248
Asn Ala Ile Arg Gly Lys Ala Leu Ala Ile Ala Val Ala Ala Gln Trp
405 410 415
ctg gcg aac tac ttc gtc tcc tgg acc ttc ccg atg atg gac aaa aac 1296
Leu Ala Asn Tyr Phe Val Ser Trp Thr Phe Pro Met Met Asp Lys Asn
420 425 430
tcc tgg ctg gtg gcc cat ttc cac aac ggt ttc tcc tac tgg att tac 1344
Ser Trp Leu Val Ala His Phe His Asn Gly Phe Ser Tyr Trp Ile Tyr
435 440 445
ggt tgt atg ggc gtt ctg gca gca ctg ttt atg tgg aaa ttt gtc ccg 1392
Gly Cys Met Gly Val Leu Ala Ala Leu Phe Met Trp Lys Phe Val Pro
450 455 460
gaa acc aaa ggt aaa acc ctt gag gag ctg gaa gcg ctc tgg gaa ccg 1440
Glu Thr Lys Gly Lys Thr Leu Glu Glu Leu Glu Ala Leu Trp Glu Pro
465 470 475 480
gaa acg aag aaa aca caa caa act gct acg ctg taa 1476
Glu Thr Lys Lys Thr Gln Gln Thr Ala Thr Leu
485 490
<210> 31
<211> 491
<212> PRT
<213> Escherichia coli
<400> 31
Met Asn Thr Gln Tyr Asn Ser Ser Tyr Ile Phe Ser Ile Thr Leu Val
1 5 10 15
Ala Thr Leu Gly Gly Leu Leu Phe Gly Tyr Asp Thr Ala Val Ile Ser
20 25 30
Gly Thr Val Glu Ser Leu Asn Thr Val Phe Val Ala Pro Gln Asn Leu
35 40 45
Ser Glu Ser Ala Ala Asn Ser Leu Leu Gly Phe Cys Val Ala Ser Ala
50 55 60
Leu Ile Gly Cys Ile Ile Gly Gly Ala Leu Gly Gly Tyr Cys Ser Asn
65 70 75 80
Arg Phe Gly Arg Arg Asp Ser Leu Lys Ile Ala Ala Val Leu Phe Phe
85 90 95
Ile Ser Gly Val Gly Ser Ala Trp Pro Glu Leu Gly Phe Thr Ser Ile
100 105 110
Asn Pro Asp Asn Thr Val Pro Val Tyr Leu Ala Gly Tyr Val Pro Glu
115 120 125
Phe Val Ile Tyr Arg Ile Ile Gly Gly Ile Gly Val Gly Leu Ala Ser
130 135 140
Met Leu Ser Pro Met Tyr Ile Ala Glu Leu Ala Pro Ala His Ile Arg
145 150 155 160
Gly Lys Leu Val Ser Phe Asn Gln Phe Ala Ile Ile Phe Gly Gln Leu
165 170 175
Leu Val Tyr Cys Val Asn Tyr Phe Ile Ala Arg Ser Gly Asp Ala Ser
180 185 190
Trp Leu Asn Thr Asp Gly Trp Arg Tyr Met Phe Ala Ser Glu Cys Ile
195 200 205
Pro Ala Leu Leu Phe Leu Met Leu Leu Tyr Thr Val Pro Glu Ser Pro
210 215 220
Arg Trp Leu Met Ser Arg Gly Lys Gln Glu Gln Ala Glu Gly Ile Leu
225 230 235 240
Arg Lys Ile Met Gly Asn Thr Leu Ala Thr Gln Ala Val Gln Glu Ile
245 250 255
Lys His Ser Leu Asp His Gly Arg Lys Thr Gly Gly Arg Leu Leu Met
260 265 270
Phe Gly Val Gly Val Ile Val Ile Gly Val Met Leu Ser Ile Phe Gln
275 280 285
Gln Phe Val Gly Ile Asn Val Val Leu Tyr Tyr Ala Pro Glu Val Phe
290 295 300
Lys Thr Leu Gly Ala Ser Thr Asp Ile Ala Leu Leu Gln Thr Ile Ile
305 310 315 320
Val Gly Val Ile Asn Leu Thr Phe Thr Val Leu Ala Ile Met Thr Val
325 330 335
Asp Lys Phe Gly Arg Lys Pro Leu Gln Ile Ile Gly Ala Leu Gly Met
340 345 350
Ala Ile Gly Met Phe Ser Leu Gly Thr Ala Phe Tyr Thr Gln Ala Pro
355 360 365
Gly Ile Val Ala Leu Leu Ser Met Leu Phe Tyr Val Ala Ala Phe Ala
370 375 380
Met Ser Trp Gly Pro Val Cys Trp Val Leu Leu Ser Glu Ile Phe Pro
385 390 395 400
Asn Ala Ile Arg Gly Lys Ala Leu Ala Ile Ala Val Ala Ala Gln Trp
405 410 415
Leu Ala Asn Tyr Phe Val Ser Trp Thr Phe Pro Met Met Asp Lys Asn
420 425 430
Ser Trp Leu Val Ala His Phe His Asn Gly Phe Ser Tyr Trp Ile Tyr
435 440 445
Gly Cys Met Gly Val Leu Ala Ala Leu Phe Met Trp Lys Phe Val Pro
450 455 460
Glu Thr Lys Gly Lys Thr Leu Glu Glu Leu Glu Ala Leu Trp Glu Pro
465 470 475 480
Glu Thr Lys Lys Thr Gln Gln Thr Ala Thr Leu
485 490
<210> 32
<211> 399
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA PtacTtrp
<400> 32
ggtaccagat ctccctgttg acaattaatc atcggctcta taatgtgtgg aatcgtgagc 60
ggataacaat ttcacacaag gagactcccg ggagccgcca gttccgctgg cggcatttta 120
actttcttta atgaagccgg aaaaatccta aattcattta atatttatct ttttaccgtt 180
tcgcttaccc cggtcgaacg tcaacttacg tcatttttcc gcccaacagt aatataatca 240
aacaaattaa tcccgcaaca taacaccagt aaaatcaata attttctcta agtcacttat 300
tcctcaggta attgttaata tatccagaat gttcctcaaa atatattttc cctctatctt 360
ctcgttgcgc ttaatttgac taattctcat tagggatcc 399
<210> 33
<211> 362
<212> DNA
<213> Brevibacterium flavum
<400> 33
agatcgttta gatccgaagg aaaacgtcga aaagcaattt gcttttcgac gccccacccc 60
gcgcgtttta gcgtgtcagt aggcgcgtag ggtaagtggg gtagcggctt gttagatatc 120
ttgaaatcgg ctttcaacag cattgatttc gatgtattta gctggccgtt accctgcgaa 180
tgtccacagg gtagctggta gtttgaaaat caacgccgtt gcccttagga ttcagtaact 240
ggcacatttt gtaatgcgct agatctgtgt gctcagtctt ccaggctgct tatcacagtg 300
aaagcaaaac caattcgtgg ctgcgaaagt cgtagccacc acgaagtcca ggaggacata 360
ca 362
<210> 34
<211> 1968
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(1968)
<400> 34
atg tct gtt cgc aat att ttt gct gac gag agc cac gat att tac acc 48
Met Ser Val Arg Asn Ile Phe Ala Asp Glu Ser His Asp Ile Tyr Thr
1 5 10 15
gtc aga acg cac gcc gat ggc ccg gac ggc gaa ctc cca tta acc gca 96
Val Arg Thr His Ala Asp Gly Pro Asp Gly Glu Leu Pro Leu Thr Ala
20 25 30
gag atg ctt atc aac cgc ccg agc ggg gat ctg ttc ggt atg acc atg 144
Glu Met Leu Ile Asn Arg Pro Ser Gly Asp Leu Phe Gly Met Thr Met
35 40 45
aat gcc gga atg ggt tgg tct ccg gac gag ctg gat cgg gac ggt att 192
Asn Ala Gly Met Gly Trp Ser Pro Asp Glu Leu Asp Arg Asp Gly Ile
50 55 60
tta ctg ctc agt aca ctc ggt ggc tta cgc ggc gca gac ggt aaa ccc 240
Leu Leu Leu Ser Thr Leu Gly Gly Leu Arg Gly Ala Asp Gly Lys Pro
65 70 75 80
gtg gcg ctg gcg ttg cac cag ggg cat tac gaa ctg gac atc cag atg 288
Val Ala Leu Ala Leu His Gln Gly His Tyr Glu Leu Asp Ile Gln Met
85 90 95
aaa gcg gcg gcc gag gtt att aaa gcc aac cat gcc ctg ccc tat gcc 336
Lys Ala Ala Ala Glu Val Ile Lys Ala Asn His Ala Leu Pro Tyr Ala
100 105 110
gtg tac gtc tcc gat cct tgt gac ggg cgt act cag ggt aca acg ggg 384
Val Tyr Val Ser Asp Pro Cys Asp Gly Arg Thr Gln Gly Thr Thr Gly
115 120 125
atg ttt gat tcg cta cca tac cga aat gac gca tcg atg gta atg cgc 432
Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ser Met Val Met Arg
130 135 140
cgc ctt att cgc tct ctg ccc gac gcg aaa gca gtt att ggt gtg gcg 480
Arg Leu Ile Arg Ser Leu Pro Asp Ala Lys Ala Val Ile Gly Val Ala
145 150 155 160
agt tgc gat aag ggg ctt ccg gcc acc atg atg gca ctc gcc gcg cag 528
Ser Cys Asp Lys Gly Leu Pro Ala Thr Met Met Ala Leu Ala Ala Gln
165 170 175
cac aac atc gca acc gtg ctg gtc ccc ggc ggc gcg acg ctg ccc gca 576
His Asn Ile Ala Thr Val Leu Val Pro Gly Gly Ala Thr Leu Pro Ala
180 185 190
aag gat gga gaa gac aac ggc aag gtg caa acc att ggc gca cgc ttc 624
Lys Asp Gly Glu Asp Asn Gly Lys Val Gln Thr Ile Gly Ala Arg Phe
195 200 205
gcc aat ggc gaa tta tct cta cag gac gca cgc cgt gcg ggc tgt aaa 672
Ala Asn Gly Glu Leu Ser Leu Gln Asp Ala Arg Arg Ala Gly Cys Lys
210 215 220
gcc tgt gcc tct tcc ggc ggc ggc tgt caa ttt ttg ggc act gcc ggg 720
Ala Cys Ala Ser Ser Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly
225 230 235 240
aca tct cag gtg gtg gcc gaa gga ttg gga ctg gca atc cca cat tca 768
Thr Ser Gln Val Val Ala Glu Gly Leu Gly Leu Ala Ile Pro His Ser
245 250 255
gcc ctg gcc cct tcc ggt gag cct gtg tgg cgg gag atc gcc aga gct 816
Ala Leu Ala Pro Ser Gly Glu Pro Val Trp Arg Glu Ile Ala Arg Ala
260 265 270
tcc gcg cga gct gcg ctg aac ctg agt caa aaa ggc atc acc acc cgg 864
Ser Ala Arg Ala Ala Leu Asn Leu Ser Gln Lys Gly Ile Thr Thr Arg
275 280 285
gaa att ctc acc gat aaa gcg ata gag aat gcg atg acg gtc cat gcc 912
Glu Ile Leu Thr Asp Lys Ala Ile Glu Asn Ala Met Thr Val His Ala
290 295 300
gcg ttc ggt ggt tca aca aac ctg ctg tta cac atc ccg gca att gct 960
Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala
305 310 315 320
cac cag gca ggt tgc cat atc ccg acc gtt gat gac tgg atc cgc atc 1008
His Gln Ala Gly Cys His Ile Pro Thr Val Asp Asp Trp Ile Arg Ile
325 330 335
aac aag cgc gtg ccc cga ctg gtg agc gta ctg cct aat ggc ccg gtt 1056
Asn Lys Arg Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Val
340 345 350
tat cat cca acg gtc aat gcc ttt atg gca ggt ggt gtg ccg gaa gtc 1104
Tyr His Pro Thr Val Asn Ala Phe Met Ala Gly Gly Val Pro Glu Val
355 360 365
atg ttg cat ctg cgc agc ctc gga ttg ttg cat gaa gac gtt atg acg 1152
Met Leu His Leu Arg Ser Leu Gly Leu Leu His Glu Asp Val Met Thr
370 375 380
gtt acc ggc agc acg ctg aaa gaa aac ctc gac tgg tgg gag cac tcc 1200
Val Thr Gly Ser Thr Leu Lys Glu Asn Leu Asp Trp Trp Glu His Ser
385 390 395 400
gaa cgg cgt cag cgg ttc aag caa ctc ctg ctc gat cag gaa caa atc 1248
Glu Arg Arg Gln Arg Phe Lys Gln Leu Leu Leu Asp Gln Glu Gln Ile
405 410 415
aac gct gac gaa gtg atc atg tct ccg cag caa gca aaa gcg cgc gga 1296
Asn Ala Asp Glu Val Ile Met Ser Pro Gln Gln Ala Lys Ala Arg Gly
420 425 430
tta acc tca act atc acc ttc ccg gtg ggc aat att gcg cca gaa ggt 1344
Leu Thr Ser Thr Ile Thr Phe Pro Val Gly Asn Ile Ala Pro Glu Gly
435 440 445
tcg gtg atc aaa tcc acc gcc att gac ccc tcg atg att gat gag caa 1392
Ser Val Ile Lys Ser Thr Ala Ile Asp Pro Ser Met Ile Asp Glu Gln
450 455 460
ggt atc tat tac cat aaa ggt gtg gcg aag gtt tat ctg tcc gag aaa 1440
Gly Ile Tyr Tyr His Lys Gly Val Ala Lys Val Tyr Leu Ser Glu Lys
465 470 475 480
agt gcg att tac gat atc aaa cat gac aag atc aag gcg ggc gat att 1488
Ser Ala Ile Tyr Asp Ile Lys His Asp Lys Ile Lys Ala Gly Asp Ile
485 490 495
ctg gtc att att ggc gtt gga cct tca ggt aca ggg atg gaa gaa acc 1536
Leu Val Ile Ile Gly Val Gly Pro Ser Gly Thr Gly Met Glu Glu Thr
500 505 510
tac cag gtt acc agt gcc ctg aag cat ctg tca tac ggt aag cat gtt 1584
Tyr Gln Val Thr Ser Ala Leu Lys His Leu Ser Tyr Gly Lys His Val
515 520 525
tcg tta atc acc gat gca cgt ttc tcg ggc gtt tct act ggc gcg tgc 1632
Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys
530 535 540
atc ggc cat gtg ggg cca gaa gcg ctg gcc gga ggc ccc atc ggt aaa 1680
Ile Gly His Val Gly Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys
545 550 555 560
tta cgc acc ggg gat tta att gaa att aaa att gat tgt cgc gag ctt 1728
Leu Arg Thr Gly Asp Leu Ile Glu Ile Lys Ile Asp Cys Arg Glu Leu
565 570 575
cac ggc gaa gtc aat ttc ctc gga acc cgt agc gat gaa caa tta cct 1776
His Gly Glu Val Asn Phe Leu Gly Thr Arg Ser Asp Glu Gln Leu Pro
580 585 590
tca cag gag gag gca act gca ata tta aat gcc aga ccc agc cat cag 1824
Ser Gln Glu Glu Ala Thr Ala Ile Leu Asn Ala Arg Pro Ser His Gln
595 600 605
gat tta ctt ccc gat cct gaa ttg cca gat gat acc cgg cta tgg gca 1872
Asp Leu Leu Pro Asp Pro Glu Leu Pro Asp Asp Thr Arg Leu Trp Ala
610 615 620
atg ctt cag gcc gtg agt ggt ggg aca tgg acc ggt tgt att tat gat 1920
Met Leu Gln Ala Val Ser Gly Gly Thr Trp Thr Gly Cys Ile Tyr Asp
625 630 635 640
gta aac aaa att ggc gcg gct ttg cgc gat ttt atg aat aaa aac tga 1968
Val Asn Lys Ile Gly Ala Ala Leu Arg Asp Phe Met Asn Lys Asn
645 650 655
<210> 35
<211> 655
<212> PRT
<213> Escherichia coli
<400> 35
Met Ser Val Arg Asn Ile Phe Ala Asp Glu Ser His Asp Ile Tyr Thr
1 5 10 15
Val Arg Thr His Ala Asp Gly Pro Asp Gly Glu Leu Pro Leu Thr Ala
20 25 30
Glu Met Leu Ile Asn Arg Pro Ser Gly Asp Leu Phe Gly Met Thr Met
35 40 45
Asn Ala Gly Met Gly Trp Ser Pro Asp Glu Leu Asp Arg Asp Gly Ile
50 55 60
Leu Leu Leu Ser Thr Leu Gly Gly Leu Arg Gly Ala Asp Gly Lys Pro
65 70 75 80
Val Ala Leu Ala Leu His Gln Gly His Tyr Glu Leu Asp Ile Gln Met
85 90 95
Lys Ala Ala Ala Glu Val Ile Lys Ala Asn His Ala Leu Pro Tyr Ala
100 105 110
Val Tyr Val Ser Asp Pro Cys Asp Gly Arg Thr Gln Gly Thr Thr Gly
115 120 125
Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ser Met Val Met Arg
130 135 140
Arg Leu Ile Arg Ser Leu Pro Asp Ala Lys Ala Val Ile Gly Val Ala
145 150 155 160
Ser Cys Asp Lys Gly Leu Pro Ala Thr Met Met Ala Leu Ala Ala Gln
165 170 175
His Asn Ile Ala Thr Val Leu Val Pro Gly Gly Ala Thr Leu Pro Ala
180 185 190
Lys Asp Gly Glu Asp Asn Gly Lys Val Gln Thr Ile Gly Ala Arg Phe
195 200 205
Ala Asn Gly Glu Leu Ser Leu Gln Asp Ala Arg Arg Ala Gly Cys Lys
210 215 220
Ala Cys Ala Ser Ser Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly
225 230 235 240
Thr Ser Gln Val Val Ala Glu Gly Leu Gly Leu Ala Ile Pro His Ser
245 250 255
Ala Leu Ala Pro Ser Gly Glu Pro Val Trp Arg Glu Ile Ala Arg Ala
260 265 270
Ser Ala Arg Ala Ala Leu Asn Leu Ser Gln Lys Gly Ile Thr Thr Arg
275 280 285
Glu Ile Leu Thr Asp Lys Ala Ile Glu Asn Ala Met Thr Val His Ala
290 295 300
Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala
305 310 315 320
His Gln Ala Gly Cys His Ile Pro Thr Val Asp Asp Trp Ile Arg Ile
325 330 335
Asn Lys Arg Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Val
340 345 350
Tyr His Pro Thr Val Asn Ala Phe Met Ala Gly Gly Val Pro Glu Val
355 360 365
Met Leu His Leu Arg Ser Leu Gly Leu Leu His Glu Asp Val Met Thr
370 375 380
Val Thr Gly Ser Thr Leu Lys Glu Asn Leu Asp Trp Trp Glu His Ser
385 390 395 400
Glu Arg Arg Gln Arg Phe Lys Gln Leu Leu Leu Asp Gln Glu Gln Ile
405 410 415
Asn Ala Asp Glu Val Ile Met Ser Pro Gln Gln Ala Lys Ala Arg Gly
420 425 430
Leu Thr Ser Thr Ile Thr Phe Pro Val Gly Asn Ile Ala Pro Glu Gly
435 440 445
Ser Val Ile Lys Ser Thr Ala Ile Asp Pro Ser Met Ile Asp Glu Gln
450 455 460
Gly Ile Tyr Tyr His Lys Gly Val Ala Lys Val Tyr Leu Ser Glu Lys
465 470 475 480
Ser Ala Ile Tyr Asp Ile Lys His Asp Lys Ile Lys Ala Gly Asp Ile
485 490 495
Leu Val Ile Ile Gly Val Gly Pro Ser Gly Thr Gly Met Glu Glu Thr
500 505 510
Tyr Gln Val Thr Ser Ala Leu Lys His Leu Ser Tyr Gly Lys His Val
515 520 525
Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys
530 535 540
Ile Gly His Val Gly Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys
545 550 555 560
Leu Arg Thr Gly Asp Leu Ile Glu Ile Lys Ile Asp Cys Arg Glu Leu
565 570 575
His Gly Glu Val Asn Phe Leu Gly Thr Arg Ser Asp Glu Gln Leu Pro
580 585 590
Ser Gln Glu Glu Ala Thr Ala Ile Leu Asn Ala Arg Pro Ser His Gln
595 600 605
Asp Leu Leu Pro Asp Pro Glu Leu Pro Asp Asp Thr Arg Leu Trp Ala
610 615 620
Met Leu Gln Ala Val Ser Gly Gly Thr Trp Thr Gly Cys Ile Tyr Asp
625 630 635 640
Val Asn Lys Ile Gly Ala Ala Leu Arg Asp Phe Met Asn Lys Asn
645 650 655
<210> 36
<211> 1968
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(1968)
<400> 36
atg acc att gag aaa att ttc acc ccg cag gac gac gcg ttt tat gcg 48
Met Thr Ile Glu Lys Ile Phe Thr Pro Gln Asp Asp Ala Phe Tyr Ala
1 5 10 15
gtg atc acc cac gcg gcg ggg ccg cag ggc gct ctg ccg ctg acc ccg 96
Val Ile Thr His Ala Ala Gly Pro Gln Gly Ala Leu Pro Leu Thr Pro
20 25 30
cag atg ctg atg gaa tct ccc agc ggc aac ctg ttc ggc atg acg cag 144
Gln Met Leu Met Glu Ser Pro Ser Gly Asn Leu Phe Gly Met Thr Gln
35 40 45
aac gcc ggg atg ggc tgg gac gcc aac aag ctc acc ggc aaa gag gtg 192
Asn Ala Gly Met Gly Trp Asp Ala Asn Lys Leu Thr Gly Lys Glu Val
50 55 60
ctg att atc ggc act cag ggc ggc atc cgc gcc gga gac gga cgc cca 240
Leu Ile Ile Gly Thr Gln Gly Gly Ile Arg Ala Gly Asp Gly Arg Pro
65 70 75 80
atc gcg ctg ggc tac cac acc ggg cat tgg gag atc ggc atg cag atg 288
Ile Ala Leu Gly Tyr His Thr Gly His Trp Glu Ile Gly Met Gln Met
85 90 95
cag gcg gcg gcg aag gag atc acc cgc aat ggc ggg atc ccg ttc gcg 336
Gln Ala Ala Ala Lys Glu Ile Thr Arg Asn Gly Gly Ile Pro Phe Ala
100 105 110
gcc ttc gtc agc gat ccg tgc gac ggg cgc tcg cag ggc acg cac ggt 384
Ala Phe Val Ser Asp Pro Cys Asp Gly Arg Ser Gln Gly Thr His Gly
115 120 125
atg ttc gat tcc ctg ccg tac cgc aac gac gcg gcg atc gtg ttt cgc 432
Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ala Ile Val Phe Arg
130 135 140
cgc ctg atc cgc tcc ctg ccg acg cgg cgg gcg gtg atc ggc gta gcg 480
Arg Leu Ile Arg Ser Leu Pro Thr Arg Arg Ala Val Ile Gly Val Ala
145 150 155 160
acc tgc gat aaa ggg ctg ccc gcc acc atg att gcg ctg gcc gcg atg 528
Thr Cys Asp Lys Gly Leu Pro Ala Thr Met Ile Ala Leu Ala Ala Met
165 170 175
cac gac ctg ccg act att ctg gtg ccg ggc ggg gcg acg ctg ccg ccg 576
His Asp Leu Pro Thr Ile Leu Val Pro Gly Gly Ala Thr Leu Pro Pro
180 185 190
acc gtc ggg gaa gac gcg ggc aag gtg cag acc atc ggc gcg cgt ttc 624
Thr Val Gly Glu Asp Ala Gly Lys Val Gln Thr Ile Gly Ala Arg Phe
195 200 205
gcc aac cac gaa ctc tcc ctg cag gag gcc gcc gaa ctg ggc tgt cgc 672
Ala Asn His Glu Leu Ser Leu Gln Glu Ala Ala Glu Leu Gly Cys Arg
210 215 220
gcc tgc gcc tcg ccg ggc ggc ggg tgt cag ttc ctc ggc acg gcg ggc 720
Ala Cys Ala Ser Pro Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly
225 230 235 240
acc tcg cag gtg gtc gcg gag gcg ctg ggt ctg gcg ctg ccg cac tcc 768
Thr Ser Gln Val Val Ala Glu Ala Leu Gly Leu Ala Leu Pro His Ser
245 250 255
gcg ctg gcg ccg tcc ggg cag gcg gtg tgg ctg gag atc gcc cgc cag 816
Ala Leu Ala Pro Ser Gly Gln Ala Val Trp Leu Glu Ile Ala Arg Gln
260 265 270
tcg gcg cgc gcg gtc agc gag ctg gat agc cgc ggc atc acc acg cgg 864
Ser Ala Arg Ala Val Ser Glu Leu Asp Ser Arg Gly Ile Thr Thr Arg
275 280 285
gat atc ctc tcc gat aaa gcc atc gaa aac gcg atg gtg atc cac gcg 912
Asp Ile Leu Ser Asp Lys Ala Ile Glu Asn Ala Met Val Ile His Ala
290 295 300
gcg ttc ggc ggc tcc acc aat tta ctg ctg cac att ccg gcc atc gcc 960
Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala
305 310 315 320
cac gcg gcg ggc tgc acg atc ccg gac gtt gag cac tgg acg cgc atc 1008
His Ala Ala Gly Cys Thr Ile Pro Asp Val Glu His Trp Thr Arg Ile
325 330 335
aac cgt aaa gtg ccg cgt ctg gtg agc gtg ctg ccc aac ggc ccg gac 1056
Asn Arg Lys Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Asp
340 345 350
tat cac ccg acc gtg cgc gcc ttc ctc gcg ggc ggc gtg ccg gag gtg 1104
Tyr His Pro Thr Val Arg Ala Phe Leu Ala Gly Gly Val Pro Glu Val
355 360 365
atg ctc cac ctg cgc gac ctc ggc ctg ctg cat ctg gac gcc atg acc 1152
Met Leu His Leu Arg Asp Leu Gly Leu Leu His Leu Asp Ala Met Thr
370 375 380
gtg acc ggc cag acg gtg ggc gag aac ctt gaa tgg tgg cag gcg tcc 1200
Val Thr Gly Gln Thr Val Gly Glu Asn Leu Glu Trp Trp Gln Ala Ser
385 390 395 400
gag cgc cgg gcg cgc ttc cgc cag tgc ctg cgc gag cag gac ggc gta 1248
Glu Arg Arg Ala Arg Phe Arg Gln Cys Leu Arg Glu Gln Asp Gly Val
405 410 415
gag ccg gat gac gtg atc ctg ccg ccg gag aag gca aaa gcg aaa ggg 1296
Glu Pro Asp Asp Val Ile Leu Pro Pro Glu Lys Ala Lys Ala Lys Gly
420 425 430
ctg acc tcg acg gtc tgc ttc ccg acg ggc aac atc gct ccg gaa ggt 1344
Leu Thr Ser Thr Val Cys Phe Pro Thr Gly Asn Ile Ala Pro Glu Gly
435 440 445
tcg gtg atc aag gcc acg gcg atc gac ccg tcg gtg gtg ggc gaa gat 1392
Ser Val Ile Lys Ala Thr Ala Ile Asp Pro Ser Val Val Gly Glu Asp
450 455 460
ggc gta tac cac cac acc ggc cgg gtg cgg gtg ttt gtc tcg gaa gcg 1440
Gly Val Tyr His His Thr Gly Arg Val Arg Val Phe Val Ser Glu Ala
465 470 475 480
cag gcg atc aag gcg atc aag cgg gaa gag att gtg cag ggc gat atc 1488
Gln Ala Ile Lys Ala Ile Lys Arg Glu Glu Ile Val Gln Gly Asp Ile
485 490 495
atg gtg gtg atc ggc ggc ggg ccg tcc ggc acc ggc atg gaa gag acc 1536
Met Val Val Ile Gly Gly Gly Pro Ser Gly Thr Gly Met Glu Glu Thr
500 505 510
tac cag ctc acc tcc gcg cta aag cat atc tcg tgg ggc aag acg gtg 1584
Tyr Gln Leu Thr Ser Ala Leu Lys His Ile Ser Trp Gly Lys Thr Val
515 520 525
tcg ctc atc acc gat gcg cgc ttc tcg ggc gtg tcg acg ggc gcc tgc 1632
Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys
530 535 540
ttc ggc cac gtg tcg ccg gag gcg ctg gcg ggc ggg ccg att ggc aag 1680
Phe Gly His Val Ser Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys
545 550 555 560
ctg cgc gat aac gac atc atc gag att gcc gtg gat cgt ctg acg tta 1728
Leu Arg Asp Asn Asp Ile Ile Glu Ile Ala Val Asp Arg Leu Thr Leu
565 570 575
act ggc agc gtg aac ttc atc ggc acc gcg gac aac ccg ctg acg ccg 1776
Thr Gly Ser Val Asn Phe Ile Gly Thr Ala Asp Asn Pro Leu Thr Pro
580 585 590
gaa gag ggc gcg cgc gag ctg gcg cgg cgg cag acg cac ccg gac ctg 1824
Glu Glu Gly Ala Arg Glu Leu Ala Arg Arg Gln Thr His Pro Asp Leu
595 600 605
cac gcc cac gac ttt ttg ccg gac gac acc cgg ctg tgg gcg gca ctg 1872
His Ala His Asp Phe Leu Pro Asp Asp Thr Arg Leu Trp Ala Ala Leu
610 615 620
cag tcg gtg agc ggc ggc acc tgg aaa ggc tgt att tat gac acc gat 1920
Gln Ser Val Ser Gly Gly Thr Trp Lys Gly Cys Ile Tyr Asp Thr Asp
625 630 635 640
aaa att atc gag gta att aac gcc ggt aaa aaa gcg ctc gga att taa 1968
Lys Ile Ile Glu Val Ile Asn Ala Gly Lys Lys Ala Leu Gly Ile
645 650 655
<210> 37
<211> 655
<212> PRT
<213> Escherichia coli
<400> 37
Met Thr Ile Glu Lys Ile Phe Thr Pro Gln Asp Asp Ala Phe Tyr Ala
1 5 10 15
Val Ile Thr His Ala Ala Gly Pro Gln Gly Ala Leu Pro Leu Thr Pro
20 25 30
Gln Met Leu Met Glu Ser Pro Ser Gly Asn Leu Phe Gly Met Thr Gln
35 40 45
Asn Ala Gly Met Gly Trp Asp Ala Asn Lys Leu Thr Gly Lys Glu Val
50 55 60
Leu Ile Ile Gly Thr Gln Gly Gly Ile Arg Ala Gly Asp Gly Arg Pro
65 70 75 80
Ile Ala Leu Gly Tyr His Thr Gly His Trp Glu Ile Gly Met Gln Met
85 90 95
Gln Ala Ala Ala Lys Glu Ile Thr Arg Asn Gly Gly Ile Pro Phe Ala
100 105 110
Ala Phe Val Ser Asp Pro Cys Asp Gly Arg Ser Gln Gly Thr His Gly
115 120 125
Met Phe Asp Ser Leu Pro Tyr Arg Asn Asp Ala Ala Ile Val Phe Arg
130 135 140
Arg Leu Ile Arg Ser Leu Pro Thr Arg Arg Ala Val Ile Gly Val Ala
145 150 155 160
Thr Cys Asp Lys Gly Leu Pro Ala Thr Met Ile Ala Leu Ala Ala Met
165 170 175
His Asp Leu Pro Thr Ile Leu Val Pro Gly Gly Ala Thr Leu Pro Pro
180 185 190
Thr Val Gly Glu Asp Ala Gly Lys Val Gln Thr Ile Gly Ala Arg Phe
195 200 205
Ala Asn His Glu Leu Ser Leu Gln Glu Ala Ala Glu Leu Gly Cys Arg
210 215 220
Ala Cys Ala Ser Pro Gly Gly Gly Cys Gln Phe Leu Gly Thr Ala Gly
225 230 235 240
Thr Ser Gln Val Val Ala Glu Ala Leu Gly Leu Ala Leu Pro His Ser
245 250 255
Ala Leu Ala Pro Ser Gly Gln Ala Val Trp Leu Glu Ile Ala Arg Gln
260 265 270
Ser Ala Arg Ala Val Ser Glu Leu Asp Ser Arg Gly Ile Thr Thr Arg
275 280 285
Asp Ile Leu Ser Asp Lys Ala Ile Glu Asn Ala Met Val Ile His Ala
290 295 300
Ala Phe Gly Gly Ser Thr Asn Leu Leu Leu His Ile Pro Ala Ile Ala
305 310 315 320
His Ala Ala Gly Cys Thr Ile Pro Asp Val Glu His Trp Thr Arg Ile
325 330 335
Asn Arg Lys Val Pro Arg Leu Val Ser Val Leu Pro Asn Gly Pro Asp
340 345 350
Tyr His Pro Thr Val Arg Ala Phe Leu Ala Gly Gly Val Pro Glu Val
355 360 365
Met Leu His Leu Arg Asp Leu Gly Leu Leu His Leu Asp Ala Met Thr
370 375 380
Val Thr Gly Gln Thr Val Gly Glu Asn Leu Glu Trp Trp Gln Ala Ser
385 390 395 400
Glu Arg Arg Ala Arg Phe Arg Gln Cys Leu Arg Glu Gln Asp Gly Val
405 410 415
Glu Pro Asp Asp Val Ile Leu Pro Pro Glu Lys Ala Lys Ala Lys Gly
420 425 430
Leu Thr Ser Thr Val Cys Phe Pro Thr Gly Asn Ile Ala Pro Glu Gly
435 440 445
Ser Val Ile Lys Ala Thr Ala Ile Asp Pro Ser Val Val Gly Glu Asp
450 455 460
Gly Val Tyr His His Thr Gly Arg Val Arg Val Phe Val Ser Glu Ala
465 470 475 480
Gln Ala Ile Lys Ala Ile Lys Arg Glu Glu Ile Val Gln Gly Asp Ile
485 490 495
Met Val Val Ile Gly Gly Gly Pro Ser Gly Thr Gly Met Glu Glu Thr
500 505 510
Tyr Gln Leu Thr Ser Ala Leu Lys His Ile Ser Trp Gly Lys Thr Val
515 520 525
Ser Leu Ile Thr Asp Ala Arg Phe Ser Gly Val Ser Thr Gly Ala Cys
530 535 540
Phe Gly His Val Ser Pro Glu Ala Leu Ala Gly Gly Pro Ile Gly Lys
545 550 555 560
Leu Arg Asp Asn Asp Ile Ile Glu Ile Ala Val Asp Arg Leu Thr Leu
565 570 575
Thr Gly Ser Val Asn Phe Ile Gly Thr Ala Asp Asn Pro Leu Thr Pro
580 585 590
Glu Glu Gly Ala Arg Glu Leu Ala Arg Arg Gln Thr His Pro Asp Leu
595 600 605
His Ala His Asp Phe Leu Pro Asp Asp Thr Arg Leu Trp Ala Ala Leu
610 615 620
Gln Ser Val Ser Gly Gly Thr Trp Lys Gly Cys Ile Tyr Asp Thr Asp
625 630 635 640
Lys Ile Ile Glu Val Ile Asn Ala Gly Lys Lys Ala Leu Gly Ile
645 650 655
<210> 38
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylX_IFS_5742-10-1
<400> 38
acacaaggag actcccatgg gcgtgagtga attcctgccg 40
<210> 39
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylX_IFA_5742-10-2
<400> 39
ggaactggcg gctcccttag aggaggccgc ggccggccag 40
<210> 40
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylA_IFS_5742-10-3
<400> 40
acacaaggag actcccatga ccgacaccct gcgccattac 40
<210> 41
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylA_IFA_5742-10-4
<400> 41
ggaactggcg gctcccttac gaccacgagt aggaggtttt 40
<210> 42
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylD_IFS_5742-10-5
<400> 42
acacaaggag actcccatgt ctaaccgcac gccccgccgg 40
<210> 43
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer xylD-IFA_5742-10-6
<400> 43
ggaactggcg gctccctcag tggttgtggc ggggcagctt 40
<210> 44
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0823-01F_4691-87-1
<400> 44
gtcgactcta gaggatcccc gtgggcgtga gtgaattcct gccg 44
<210> 45
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0823-01R_4691-87-2
<400> 45
tatgcctgtc ctgccagcac tgcc 24
<210> 46
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0823-02F_4691-87-3
<400> 46
ggcagtgctg gcaggacagg cata 24
<210> 47
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0823-02R_4691-87-4
<400> 47
cgaattcgag ctcggtaccc ttagaggagg ccgcggccgg ccag 44
<210> 48
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-01F_4691-87-5
<400> 48
gtcgactcta gaggatcccc atgaccgaca ccctgcgcca ttac 44
<210> 49
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-01R_5659-8-7
<400> 49
gcgtcggccc aggccgggaa tgcc 24
<210> 50
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-02F_5659-8-8
<400> 50
gtcgacgccg cgcgcaaggc attc 24
<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-02R_5659-8-9
<400> 51
gagcgccggg gcggccttcc atgc 24
<210> 52
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-03F_5659-8-10
<400> 52
cttcccgatc gccatcccgg catg 24
<210> 53
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-03R_5659-8-11
<400> 53
cagctgcacg cgggcctgac gtgc 24
<210> 54
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-04F_5659-8-12
<400> 54
ggtcgccgcc gccgccgtgg cacg 24
<210> 55
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-04R_5659-8-13
<400> 55
ggcgaccttc tcggccagca gtgc 24
<210> 56
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-05F_5659-8-14
<400> 56
ggattcacga caagttcgtg gcac 24
<210> 57
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> primer CC0822-05R_4691-87-14
<400> 57
cgaattcgag ctcggtaccc ttacgaccac gagtaggagg tttt 44
<210> 58
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Peftu(Pst)
<400> 58
ccaagcttgc atgccagatc gtttagatcc gaagg 35
<210> 59
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Peftu_Rv
<400> 59
tgtatgtcct cctggacttc gt 22
<210> 60
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Peftu_xylXABCD_fw
<400> 60
ccaggaggac atacaatggg cgtgagtgaa ttcctgccgg aagattggaa ag 52
<210> 61
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> primer eftu_xylXABCD_rv
<400> 61
cggtacccgg ggatctcagt ggttgtggcg gggcagctt 39
<210> 62
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer PmsrA(Pst)
<400> 62
ccaagcttgc atgccatttg cgcctgcaac gtaggttg 38
<210> 63
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer PmsrAR
<400> 63
aacaggaatg ttcctttcga aaa 23
<210> 64
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> primer PmsrA_xylD_fw
<400> 64
aggaacattc ctgttatgtc taaccgcacg ccccgccggt t 41
<210> 65
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> primer SpcR-F
<400> 65
ctaataacgt aacgtgactg gcaag 25
<210> 66
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> primer SpcR-R
<400> 66
ataagtaaga ttaaccatta gtc 23
<210> 67
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer spc(GTG start)-F
<400> 67
gtgaggagga tatatttgaa tacatacgaa 30
<210> 68
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer spc(stop)-R
<400> 68
taattttttt aatctgttat ttaaatagtt tatag 35
<210> 69
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Spc-pVC7-Cm-F
<400> 69
atatatcctc ctcactttag cttccttagc tcctgaaaat ct 42
<210> 70
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Spc-pVC7-Cm-R
<400> 70
agattaaaaa aattataatt tttttaaggc agttattggt gccct 45
<210> 71
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> primer ME_Spc_fw
<400> 71
ctgtctctta tacacatctc caagcttgca tgccgcggcc tggttggttg ggtt 54
<210> 72
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> primer ME_Peftu_xylXABCD_rv
<400> 72
ctgtctctta tacacatctc ggtacccggg gatctcagtg gttgtggcgg ggcagctt 58
<210> 73
<211> 1785
<212> DNA
<213> Agrobacterium tumefaciens
<220>
<221> CDS
<222> (1)..(1785)
<400> 73
atg agc gac gac aag aca ccc gtg cgg cgg ctg cga tcc cag gac tgg 48
Met Ser Asp Asp Lys Thr Pro Val Arg Arg Leu Arg Ser Gln Asp Trp
1 5 10 15
ttc gac aac cct gac cat ctc gac atg acg gcg ctc tat ctg gag cgc 96
Phe Asp Asn Pro Asp His Leu Asp Met Thr Ala Leu Tyr Leu Glu Arg
20 25 30
ttc atg aat tat ggc gtg acg ccg gaa gag ctg cgt tcc ggc aag ccg 144
Phe Met Asn Tyr Gly Val Thr Pro Glu Glu Leu Arg Ser Gly Lys Pro
35 40 45
gtc atc ggc atc gcg cag agc ggc agc gac ctg acg ccc tgc aac cgc 192
Val Ile Gly Ile Ala Gln Ser Gly Ser Asp Leu Thr Pro Cys Asn Arg
50 55 60
gtc cat gtc gaa ctg gtc aag cgg gtg cgc gat ggt atc cgt gat gcg 240
Val His Val Glu Leu Val Lys Arg Val Arg Asp Gly Ile Arg Asp Ala
65 70 75 80
ggc ggc atc ccc atc gag ttt ccg acc cat ccg atg ttc gaa aac tgc 288
Gly Gly Ile Pro Ile Glu Phe Pro Thr His Pro Met Phe Glu Asn Cys
85 90 95
aag cga ccg aca gcg gcg ctt gac cgc aat ctt gcc tat ctc agc ctg 336
Lys Arg Pro Thr Ala Ala Leu Asp Arg Asn Leu Ala Tyr Leu Ser Leu
100 105 110
gtg gaa gtg ctt tac ggt tat cca ctc gat ggc gtc gtg ttg acc acg 384
Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val Leu Thr Thr
115 120 125
ggc tgc gac aag acc acg cct tcg gcg ctg atg gcg gca agc acg gtt 432
Gly Cys Asp Lys Thr Thr Pro Ser Ala Leu Met Ala Ala Ser Thr Val
130 135 140
gat att ccg gct atc gtc tta tcc ggc ggg ccg atg ctc gac gga tat 480
Asp Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Tyr
145 150 155 160
cat gac ggc gat ctg gtt ggt tcc ggc acg gtc atc tgg cgc atg cgc 528
His Asp Gly Asp Leu Val Gly Ser Gly Thr Val Ile Trp Arg Met Arg
165 170 175
cgc aaa tac ggc gcc ggc gaa atc acc cgc gag gaa ttc ctg cag gcg 576
Arg Lys Tyr Gly Ala Gly Glu Ile Thr Arg Glu Glu Phe Leu Gln Ala
180 185 190
gcg ctc gaa tcc gct cct tcg gtc ggt cac tgc aac acc atg ggc acg 624
Ala Leu Glu Ser Ala Pro Ser Val Gly His Cys Asn Thr Met Gly Thr
195 200 205
gcc tct acc atg aat gcc att gcc gaa gcg ctc ggc atg tcg ctg acc 672
Ala Ser Thr Met Asn Ala Ile Ala Glu Ala Leu Gly Met Ser Leu Thr
210 215 220
ggc tgc ggc gca atc ccg gcc gct tac cgc gaa cgc ggc cag atg gcc 720
Gly Cys Gly Ala Ile Pro Ala Ala Tyr Arg Glu Arg Gly Gln Met Ala
225 230 235 240
tat cgc acc ggc cgc cgc gcc gtc gaa ctg gtt gtc gag aat atc aag 768
Tyr Arg Thr Gly Arg Arg Ala Val Glu Leu Val Val Glu Asn Ile Lys
245 250 255
cct tcg gat atc atg acg cgc gag gcg ttt ttg aac gcg atc cgc gtc 816
Pro Ser Asp Ile Met Thr Arg Glu Ala Phe Leu Asn Ala Ile Arg Val
260 265 270
aat tcg gca atc ggc ggt tcg aca aat gcc cag ccg cat ctg gcg gcg 864
Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Gln Pro His Leu Ala Ala
275 280 285
atg gcg aaa cat gcg ggc gtc gaa ctt cgc gag gaa gac tgg cag gtt 912
Met Ala Lys His Ala Gly Val Glu Leu Arg Glu Glu Asp Trp Gln Val
290 295 300
cac ggt tat gac att ccg ctc atc gcc aat gtc cag ccc gcc gga aaa 960
His Gly Tyr Asp Ile Pro Leu Ile Ala Asn Val Gln Pro Ala Gly Lys
305 310 315 320
tgg ctg ggc gag aaa tat cac cgt gcc ggc ggt acg ccc gcc atc atg 1008
Trp Leu Gly Glu Lys Tyr His Arg Ala Gly Gly Thr Pro Ala Ile Met
325 330 335
tgg gag ctt ctg aag gca ggc aag ctt gat ggg agc tgt ccg acc gtg 1056
Trp Glu Leu Leu Lys Ala Gly Lys Leu Asp Gly Ser Cys Pro Thr Val
340 345 350
acc ggc aag acc gtg gcg gaa aat ctg gac ggg cgg gaa tcg acc gac 1104
Thr Gly Lys Thr Val Ala Glu Asn Leu Asp Gly Arg Glu Ser Thr Asp
355 360 365
cgc gac gtg atc ctt cct tac gat aag ccg ctc aag gaa cgg gcc ggt 1152
Arg Asp Val Ile Leu Pro Tyr Asp Lys Pro Leu Lys Glu Arg Ala Gly
370 375 380
ttc ctc gtc ctc aag ggc aat ctg ttc gat ttc gcc atc atg aag acg 1200
Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Thr
385 390 395 400
agt gtg atc tcg gcg gaa ttc cgg cag cgt tat ctg agt gag ccg ggt 1248
Ser Val Ile Ser Ala Glu Phe Arg Gln Arg Tyr Leu Ser Glu Pro Gly
405 410 415
cga gag ggg att ttc gag ggc aaa tgt gtg gtt ttc gat ggt tcg gaa 1296
Arg Glu Gly Ile Phe Glu Gly Lys Cys Val Val Phe Asp Gly Ser Glu
420 425 430
gac tat cac gcc cgt atc aac gat ccg tct ctc gat atc gat gag cgc 1344
Asp Tyr His Ala Arg Ile Asn Asp Pro Ser Leu Asp Ile Asp Glu Arg
435 440 445
acc att ctc gtc att cgc ggg gcc gga ccg ctc ggc tgg ccg ggt tcg 1392
Thr Ile Leu Val Ile Arg Gly Ala Gly Pro Leu Gly Trp Pro Gly Ser
450 455 460
gct gag gtc gtc aac atg cag ccg ccg gac gcg ctg ttg aaa aaa ggc 1440
Ala Glu Val Val Asn Met Gln Pro Pro Asp Ala Leu Leu Lys Lys Gly
465 470 475 480
ata acc agc ctg ccg aca atc ggc gac ggc cgg caa tcg gga acc gcg 1488
Ile Thr Ser Leu Pro Thr Ile Gly Asp Gly Arg Gln Ser Gly Thr Ala
485 490 495
gac agc ccg tcg atc ctc aat gcc tcg cca gaa agt gcc gcc ggt gga 1536
Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ala Gly Gly
500 505 510
gga ctg gca tgg ctt cgc acg ggt gat gta atc cgc atc gac ttc aat 1584
Gly Leu Ala Trp Leu Arg Thr Gly Asp Val Ile Arg Ile Asp Phe Asn
515 520 525
cag ggc aag tgc gac gcg ttg gta ccg gat gca gag ctt gct gcc cga 1632
Gln Gly Lys Cys Asp Ala Leu Val Pro Asp Ala Glu Leu Ala Ala Arg
530 535 540
aag gcc gat ggc att cct gcg gtg cct gcg gat gcc acg ccc tgg cag 1680
Lys Ala Asp Gly Ile Pro Ala Val Pro Ala Asp Ala Thr Pro Trp Gln
545 550 555 560
cgc atc tat cgt caa tcg gtg acc cag ctt tcg gac ggt gcg gtt ctg 1728
Arg Ile Tyr Arg Gln Ser Val Thr Gln Leu Ser Asp Gly Ala Val Leu
565 570 575
gaa ggg gcc gcg gat ttc cgc cgg att gcc gag aag atg ccc cgg cac 1776
Glu Gly Ala Ala Asp Phe Arg Arg Ile Ala Glu Lys Met Pro Arg His
580 585 590
aac cat tga 1785
Asn His
<210> 74
<211> 594
<212> PRT
<213> Agrobacterium tumefaciens
<400> 74
Met Ser Asp Asp Lys Thr Pro Val Arg Arg Leu Arg Ser Gln Asp Trp
1 5 10 15
Phe Asp Asn Pro Asp His Leu Asp Met Thr Ala Leu Tyr Leu Glu Arg
20 25 30
Phe Met Asn Tyr Gly Val Thr Pro Glu Glu Leu Arg Ser Gly Lys Pro
35 40 45
Val Ile Gly Ile Ala Gln Ser Gly Ser Asp Leu Thr Pro Cys Asn Arg
50 55 60
Val His Val Glu Leu Val Lys Arg Val Arg Asp Gly Ile Arg Asp Ala
65 70 75 80
Gly Gly Ile Pro Ile Glu Phe Pro Thr His Pro Met Phe Glu Asn Cys
85 90 95
Lys Arg Pro Thr Ala Ala Leu Asp Arg Asn Leu Ala Tyr Leu Ser Leu
100 105 110
Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val Leu Thr Thr
115 120 125
Gly Cys Asp Lys Thr Thr Pro Ser Ala Leu Met Ala Ala Ser Thr Val
130 135 140
Asp Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Tyr
145 150 155 160
His Asp Gly Asp Leu Val Gly Ser Gly Thr Val Ile Trp Arg Met Arg
165 170 175
Arg Lys Tyr Gly Ala Gly Glu Ile Thr Arg Glu Glu Phe Leu Gln Ala
180 185 190
Ala Leu Glu Ser Ala Pro Ser Val Gly His Cys Asn Thr Met Gly Thr
195 200 205
Ala Ser Thr Met Asn Ala Ile Ala Glu Ala Leu Gly Met Ser Leu Thr
210 215 220
Gly Cys Gly Ala Ile Pro Ala Ala Tyr Arg Glu Arg Gly Gln Met Ala
225 230 235 240
Tyr Arg Thr Gly Arg Arg Ala Val Glu Leu Val Val Glu Asn Ile Lys
245 250 255
Pro Ser Asp Ile Met Thr Arg Glu Ala Phe Leu Asn Ala Ile Arg Val
260 265 270
Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Gln Pro His Leu Ala Ala
275 280 285
Met Ala Lys His Ala Gly Val Glu Leu Arg Glu Glu Asp Trp Gln Val
290 295 300
His Gly Tyr Asp Ile Pro Leu Ile Ala Asn Val Gln Pro Ala Gly Lys
305 310 315 320
Trp Leu Gly Glu Lys Tyr His Arg Ala Gly Gly Thr Pro Ala Ile Met
325 330 335
Trp Glu Leu Leu Lys Ala Gly Lys Leu Asp Gly Ser Cys Pro Thr Val
340 345 350
Thr Gly Lys Thr Val Ala Glu Asn Leu Asp Gly Arg Glu Ser Thr Asp
355 360 365
Arg Asp Val Ile Leu Pro Tyr Asp Lys Pro Leu Lys Glu Arg Ala Gly
370 375 380
Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Thr
385 390 395 400
Ser Val Ile Ser Ala Glu Phe Arg Gln Arg Tyr Leu Ser Glu Pro Gly
405 410 415
Arg Glu Gly Ile Phe Glu Gly Lys Cys Val Val Phe Asp Gly Ser Glu
420 425 430
Asp Tyr His Ala Arg Ile Asn Asp Pro Ser Leu Asp Ile Asp Glu Arg
435 440 445
Thr Ile Leu Val Ile Arg Gly Ala Gly Pro Leu Gly Trp Pro Gly Ser
450 455 460
Ala Glu Val Val Asn Met Gln Pro Pro Asp Ala Leu Leu Lys Lys Gly
465 470 475 480
Ile Thr Ser Leu Pro Thr Ile Gly Asp Gly Arg Gln Ser Gly Thr Ala
485 490 495
Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ala Gly Gly
500 505 510
Gly Leu Ala Trp Leu Arg Thr Gly Asp Val Ile Arg Ile Asp Phe Asn
515 520 525
Gln Gly Lys Cys Asp Ala Leu Val Pro Asp Ala Glu Leu Ala Ala Arg
530 535 540
Lys Ala Asp Gly Ile Pro Ala Val Pro Ala Asp Ala Thr Pro Trp Gln
545 550 555 560
Arg Ile Tyr Arg Gln Ser Val Thr Gln Leu Ser Asp Gly Ala Val Leu
565 570 575
Glu Gly Ala Ala Asp Phe Arg Arg Ile Ala Glu Lys Met Pro Arg His
580 585 590
Asn His
<210> 75
<211> 1785
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 75
atgagcgatg ataaaacccc ggtgcgtcgc ctgcgttctc aggattggtt tgataacccg 60
gatcatctgg atatgacggc gctgtatctg gaacgcttta tgaattatgg tgtgaccccg 120
gaagaactgc gcagcggtaa accggttatt ggcatcgccc agagcggttc tgatctgacc 180
ccgtgcaacc gtgtgcatgt tgaactggtg aaacgtgttc gcgatggtat tcgcgatgca 240
ggcggtattc cgatcgaatt tccgacgcac ccgatgttcg aaaactgtaa acgtccgacc 300
gcggccctgg atcgtaatct ggcctatctg agcctggtgg aagttctgta tggctacccg 360
ctggatggtg tggttctgac cacgggctgc gataaaacca ccccgagtgc cctgatggca 420
gccagcaccg tggatattcc ggcaatcgtt ctgagcggcg gtccgatgct ggatggttat 480
catgatggcg atctggtggg ttctggcacg gttatttggc gtatgcgtcg caaatacggt 540
gccggcgaaa tcacccgcga agaatttctg caggccgcac tggaatctgc gccgagtgtg 600
ggccactgca acaccatggg tacggcctct accatgaatg ccattgcaga agccctgggt 660
atgagtctga ccggttgtgg tgccatcccg gccgcatatc gtgaacgtgg ccagatggcc 720
tatcgcaccg gtcgtcgcgc ggtggaactg gtggttgaaa acattaaacc gagcgatatc 780
atgacgcgtg aagcatttct gaacgcgatt cgcgttaatt ctgcaatcgg cggtagtacc 840
aatgcgcagc cgcatctggc agcgatggcg aaacacgccg gcgtggaact gcgtgaagaa 900
gattggcagg ttcatggtta tgatattccg ctgatcgcca atgtgcagcc ggccggtaaa 960
tggctgggcg aaaaatatca ccgtgcgggc ggcaccccgg caattatgtg ggaactgctg 1020
aaagccggta aactggatgg cagttgtccg accgtgacgg gcaaaacggt tgcagaaaac 1080
ctggatggtc gtgaaagcac cgatcgcgat gttatcctgc cgtatgataa accgctgaaa 1140
gaacgtgcgg gctttctggt gctgaaaggt aatctgtttg atttcgcgat tatgaaaacc 1200
agcgttatct ctgccgaatt tcgtcagcgt tatctgtctg aaccgggtcg tgaaggcatt 1260
tttgaaggca aatgcgtggt tttcgatggt agtgaagatt accacgcccg cattaacgat 1320
ccgagcctgg atatcgatga acgtaccatt ctggtgattc gcggtgcagg tccgctgggt 1380
tggccgggca gcgcggaagt ggttaatatg cagccgccag atgcgctgct gaaaaaaggc 1440
attacgtctc tgccgaccat cggtgatggc cgccagagtg gtacggccga tagtccgagc 1500
atcctgaatg caagtccgga aagcgccgca ggcggtggcc tggcctggct gcgtaccggt 1560
gatgtgattc gcatcgattt taatcagggt aaatgtgatg cactggttcc ggatgcggaa 1620
ctggcggccc gtaaagccga tggcattccg gcagttccgg cggatgcaac cccgtggcag 1680
cgtatctacc gccagagcgt gacccagctg tctgatggcg cagttctgga aggtgcagcg 1740
gatttccgtc gcattgcgga aaaaatgccg cgccataacc actga 1785
<210> 76
<211> 1785
<212> DNA
<213> Herbaspirillum seropedicae
<220>
<221> CDS
<222> (1)..(1785)
<400> 76
atg aac aag cca aac gcc acc ccc cgt cgc ttc cgc tcc cag gac tgg 48
Met Asn Lys Pro Asn Ala Thr Pro Arg Arg Phe Arg Ser Gln Asp Trp
1 5 10 15
ttc gac aac ccg gac cac atc gac atg acc gcg ctc tac ctg gag cgc 96
Phe Asp Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu Glu Arg
20 25 30
ttc atg aac tac ggc atc acg gcc gag gag ctg cgc tcg gga cgt ccc 144
Phe Met Asn Tyr Gly Ile Thr Ala Glu Glu Leu Arg Ser Gly Arg Pro
35 40 45
atc atc ggc atc gcc cag agc ggc agc gac atc agc ccc tgc aac cgc 192
Ile Ile Gly Ile Ala Gln Ser Gly Ser Asp Ile Ser Pro Cys Asn Arg
50 55 60
atc cac ctg gag ctg gcc aag cgg gtg cgc gat ggc atc cgc gat gcc 240
Ile His Leu Glu Leu Ala Lys Arg Val Arg Asp Gly Ile Arg Asp Ala
65 70 75 80
ggc ggc att ccc atg gaa ttc ccg ctg cat ccc atc ttc gag aac tgc 288
Gly Gly Ile Pro Met Glu Phe Pro Leu His Pro Ile Phe Glu Asn Cys
85 90 95
cgc cgc ccc acc gcc gcc atc gac cgc aac ctg gcc tac ctg ggc ctg 336
Arg Arg Pro Thr Ala Ala Ile Asp Arg Asn Leu Ala Tyr Leu Gly Leu
100 105 110
gtg gaa atc ctg cac ggc tat ccc atc gac gcc gtg gtg ctc acc acc 384
Val Glu Ile Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu Thr Thr
115 120 125
ggc tgc gac aag acc acg ccc tcg cag atc atg gcc gca gcc acc gtc 432
Gly Cys Asp Lys Thr Thr Pro Ser Gln Ile Met Ala Ala Ala Thr Val
130 135 140
gat atc ccc gcc atc gtg ctc tcc ggc ggc ccc atg ctg gac ggc tgg 480
Asp Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp
145 150 155 160
atg gat ggc gaa ctg gtc ggc tcc ggc tcg gcc atc tgg aag ggc cgc 528
Met Asp Gly Glu Leu Val Gly Ser Gly Ser Ala Ile Trp Lys Gly Arg
165 170 175
aag ctg ctc tcg gca ggc agc atc gac aac gag aaa ttc ctg gag atc 576
Lys Leu Leu Ser Ala Gly Ser Ile Asp Asn Glu Lys Phe Leu Glu Ile
180 185 190
gcg gcg gcc tcc gcg ccc tcg tcc ggc cac tgc aac acc atg ggc acc 624
Ala Ala Ala Ser Ala Pro Ser Ser Gly His Cys Asn Thr Met Gly Thr
195 200 205
gcc tcc acc atg aac gcc atg gcc gag gcc ctg ggc atg tcg ctg acc 672
Ala Ser Thr Met Asn Ala Met Ala Glu Ala Leu Gly Met Ser Leu Thr
210 215 220
ggc tgc tcg gcc att ccc gcg ccc tac cgc gaa cgc ggc cag atg gcc 720
Gly Cys Ser Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln Met Ala
225 230 235 240
tat gag acg ggc cgg cgc atc gtc ggc atg gcc tac gaa gac ctg cgt 768
Tyr Glu Thr Gly Arg Arg Ile Val Gly Met Ala Tyr Glu Asp Leu Arg
245 250 255
cct tcc gcc atc ctc acg cgc gac gcc ttc ctc gac gcc atc gtg gtc 816
Pro Ser Ala Ile Leu Thr Arg Asp Ala Phe Leu Asp Ala Ile Val Val
260 265 270
aat gcc gcc atc ggc ggc tcc acc aat gcc cag ccg cac atc atg gcc 864
Asn Ala Ala Ile Gly Gly Ser Thr Asn Ala Gln Pro His Ile Met Ala
275 280 285
atg gcg cgc cat gcg ggc gtg gaa ctg cag tcg gaa gac tgg atg aag 912
Met Ala Arg His Ala Gly Val Glu Leu Gln Ser Glu Asp Trp Met Lys
290 295 300
tac ggc tac gac gtg cca ctg ctg ctg aac atg cag ccg gcc ggc aag 960
Tyr Gly Tyr Asp Val Pro Leu Leu Leu Asn Met Gln Pro Ala Gly Lys
305 310 315 320
tac ctg ggc gaa cgc ttc cac cgc gcc ggc ggc gtg ccg gcc atc atg 1008
Tyr Leu Gly Glu Arg Phe His Arg Ala Gly Gly Val Pro Ala Ile Met
325 330 335
tgg gaa ctg cag cag gcc ggc aag ctg cgc gcc gag cgc atc acc gct 1056
Trp Glu Leu Gln Gln Ala Gly Lys Leu Arg Ala Glu Arg Ile Thr Ala
340 345 350
acc ggc aag acc atg gcc gag aac ctg cag ggc cgg gca tcg aac gac 1104
Thr Gly Lys Thr Met Ala Glu Asn Leu Gln Gly Arg Ala Ser Asn Asp
355 360 365
cgg gaa atg att tac cca ttt gcc gcc ccg ctg cgc gag cgc gcc ggc 1152
Arg Glu Met Ile Tyr Pro Phe Ala Ala Pro Leu Arg Glu Arg Ala Gly
370 375 380
ttc ctg gtg ttg aag ggc aac ctg ttc gac ttc gcc atc atg aag acc 1200
Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Thr
385 390 395 400
agc gtc atc tcg gaa acc ttc cgc gaa cgc tat ctc agc acg ccc ggc 1248
Ser Val Ile Ser Glu Thr Phe Arg Glu Arg Tyr Leu Ser Thr Pro Gly
405 410 415
cag gag aac atc ttc gaa tgc cgc gcc gtg gtc ttc gat ggt tcg gac 1296
Gln Glu Asn Ile Phe Glu Cys Arg Ala Val Val Phe Asp Gly Ser Asp
420 425 430
gac tat cac gcc cgc atc aac gac ccg gcg ctc aag atc gac gag aac 1344
Asp Tyr His Ala Arg Ile Asn Asp Pro Ala Leu Lys Ile Asp Glu Asn
435 440 445
acc ctg ctg gcc atc cgt ggc gcc ggc ccg gtg ggc tgg ccc ggt tcg 1392
Thr Leu Leu Ala Ile Arg Gly Ala Gly Pro Val Gly Trp Pro Gly Ser
450 455 460
gcc gag gta gtc aac atg caa ccg ccc gac gcc ctg atc aag cgc ggt 1440
Ala Glu Val Val Asn Met Gln Pro Pro Asp Ala Leu Ile Lys Arg Gly
465 470 475 480
gta tcg acc ctg ccg acg ctg ggc gat ggc cgc cag tcg ggc acc tcc 1488
Val Ser Thr Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ser
485 490 495
gac agc ccc tcc atc ctc aac gcc tcc ccc gag agc gcc gtc ggt ggc 1536
Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Val Gly Gly
500 505 510
ggc ctg gcc tac ctg cgc gat ggc gac cgc gtg cgc atc gac ctc aac 1584
Gly Leu Ala Tyr Leu Arg Asp Gly Asp Arg Val Arg Ile Asp Leu Asn
515 520 525
acc ggc gag tgc aac atg ctg gtc agc gag gaa gag ctg gcg cgc cgc 1632
Thr Gly Glu Cys Asn Met Leu Val Ser Glu Glu Glu Leu Ala Arg Arg
530 535 540
aag agc gag ggc atc ccg ccg gtg ccg ccc agc cag acg ccc tgg cag 1680
Lys Ser Glu Gly Ile Pro Pro Val Pro Pro Ser Gln Thr Pro Trp Gln
545 550 555 560
gaa atc tat cgc agc acg gtc ggc cag ctg gag acc ggc gcc tgc atg 1728
Glu Ile Tyr Arg Ser Thr Val Gly Gln Leu Glu Thr Gly Ala Cys Met
565 570 575
gaa ctg gcc ttg aag tac cag ggt gtg gcc cag acc ctg ccc cgg cac 1776
Glu Leu Ala Leu Lys Tyr Gln Gly Val Ala Gln Thr Leu Pro Arg His
580 585 590
aat cac tga 1785
Asn His
<210> 77
<211> 594
<212> PRT
<213> Herbaspirillum seropedicae
<400> 77
Met Asn Lys Pro Asn Ala Thr Pro Arg Arg Phe Arg Ser Gln Asp Trp
1 5 10 15
Phe Asp Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu Glu Arg
20 25 30
Phe Met Asn Tyr Gly Ile Thr Ala Glu Glu Leu Arg Ser Gly Arg Pro
35 40 45
Ile Ile Gly Ile Ala Gln Ser Gly Ser Asp Ile Ser Pro Cys Asn Arg
50 55 60
Ile His Leu Glu Leu Ala Lys Arg Val Arg Asp Gly Ile Arg Asp Ala
65 70 75 80
Gly Gly Ile Pro Met Glu Phe Pro Leu His Pro Ile Phe Glu Asn Cys
85 90 95
Arg Arg Pro Thr Ala Ala Ile Asp Arg Asn Leu Ala Tyr Leu Gly Leu
100 105 110
Val Glu Ile Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu Thr Thr
115 120 125
Gly Cys Asp Lys Thr Thr Pro Ser Gln Ile Met Ala Ala Ala Thr Val
130 135 140
Asp Ile Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp
145 150 155 160
Met Asp Gly Glu Leu Val Gly Ser Gly Ser Ala Ile Trp Lys Gly Arg
165 170 175
Lys Leu Leu Ser Ala Gly Ser Ile Asp Asn Glu Lys Phe Leu Glu Ile
180 185 190
Ala Ala Ala Ser Ala Pro Ser Ser Gly His Cys Asn Thr Met Gly Thr
195 200 205
Ala Ser Thr Met Asn Ala Met Ala Glu Ala Leu Gly Met Ser Leu Thr
210 215 220
Gly Cys Ser Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln Met Ala
225 230 235 240
Tyr Glu Thr Gly Arg Arg Ile Val Gly Met Ala Tyr Glu Asp Leu Arg
245 250 255
Pro Ser Ala Ile Leu Thr Arg Asp Ala Phe Leu Asp Ala Ile Val Val
260 265 270
Asn Ala Ala Ile Gly Gly Ser Thr Asn Ala Gln Pro His Ile Met Ala
275 280 285
Met Ala Arg His Ala Gly Val Glu Leu Gln Ser Glu Asp Trp Met Lys
290 295 300
Tyr Gly Tyr Asp Val Pro Leu Leu Leu Asn Met Gln Pro Ala Gly Lys
305 310 315 320
Tyr Leu Gly Glu Arg Phe His Arg Ala Gly Gly Val Pro Ala Ile Met
325 330 335
Trp Glu Leu Gln Gln Ala Gly Lys Leu Arg Ala Glu Arg Ile Thr Ala
340 345 350
Thr Gly Lys Thr Met Ala Glu Asn Leu Gln Gly Arg Ala Ser Asn Asp
355 360 365
Arg Glu Met Ile Tyr Pro Phe Ala Ala Pro Leu Arg Glu Arg Ala Gly
370 375 380
Phe Leu Val Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Thr
385 390 395 400
Ser Val Ile Ser Glu Thr Phe Arg Glu Arg Tyr Leu Ser Thr Pro Gly
405 410 415
Gln Glu Asn Ile Phe Glu Cys Arg Ala Val Val Phe Asp Gly Ser Asp
420 425 430
Asp Tyr His Ala Arg Ile Asn Asp Pro Ala Leu Lys Ile Asp Glu Asn
435 440 445
Thr Leu Leu Ala Ile Arg Gly Ala Gly Pro Val Gly Trp Pro Gly Ser
450 455 460
Ala Glu Val Val Asn Met Gln Pro Pro Asp Ala Leu Ile Lys Arg Gly
465 470 475 480
Val Ser Thr Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ser
485 490 495
Asp Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Val Gly Gly
500 505 510
Gly Leu Ala Tyr Leu Arg Asp Gly Asp Arg Val Arg Ile Asp Leu Asn
515 520 525
Thr Gly Glu Cys Asn Met Leu Val Ser Glu Glu Glu Leu Ala Arg Arg
530 535 540
Lys Ser Glu Gly Ile Pro Pro Val Pro Pro Ser Gln Thr Pro Trp Gln
545 550 555 560
Glu Ile Tyr Arg Ser Thr Val Gly Gln Leu Glu Thr Gly Ala Cys Met
565 570 575
Glu Leu Ala Leu Lys Tyr Gln Gly Val Ala Gln Thr Leu Pro Arg His
580 585 590
Asn His
<210> 78
<211> 1785
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 78
atgaacaaac cgaatgccac cccgcgtcgc tttcgtagcc aggattggtt cgataacccg 60
gatcatattg atatgacggc gctgtatctg gaacgcttta tgaattacgg cattaccgcc 120
gaagaactgc gtagcggtcg cccgattatc ggcatcgcac agagtggtag cgatatttct 180
ccgtgcaacc gtatccatct ggaactggca aaacgtgttc gcgatggtat tcgcgatgcg 240
ggcggtatcc cgatggaatt tccgctgcac ccgattttcg aaaattgccg tcgcccgacc 300
gccgcaattg atcgtaatct ggcatatctg ggcctggtgg aaattctgca tggttacccg 360
atcgatgcgg tggttctgac cacgggctgc gataaaacca cgccgagtca gattatggca 420
gcggccaccg tggatattcc ggcgatcgtt ctgagcggcg gtccgatgct ggatggttgg 480
atggatggcg aactggttgg ttctggcagt gccatctgga aaggccgcaa actgctgagc 540
gcaggttcta tcgataacga aaagttcctg gaaattgcag ccgcatctgc cccgagctct 600
ggtcactgca acaccatggg tacggcaagt accatgaatg cgatggccga agcactgggc 660
atgagcctga cgggttgttc tgcaattccg gcgccgtatc gtgaacgcgg ccagatggcc 720
tacgaaaccg gccgtcgcat tgtgggtatg gcgtatgaag atctgcgccc gagcgccatc 780
ctgacccgtg atgcctttct ggatgcaatt gtggttaacg cagcgatcgg cggtagcacc 840
aatgcacagc cgcatattat ggcgatggcc cgtcacgcgg gcgttgaact gcagtctgaa 900
gattggatga aatatggtta cgatgtgccg ctgctgctga acatgcagcc ggccggtaaa 960
tatctgggcg aacgctttca tcgcgcaggc ggtgttccgg cgattatgtg ggaactgcag 1020
caggccggta aactgcgtgc agaacgcatc accgcgacgg gcaaaaccat ggccgaaaac 1080
ctgcagggtc gtgcaagcaa tgatcgcgaa atgatttacc cgtttgccgc accgctgcgt 1140
gaacgtgccg gcttcctggt tctgaaaggt aacctgtttg atttcgccat tatgaaaacg 1200
agtgtgatca gcgaaacctt tcgtgaacgc tatctgtcta cgccgggcca ggaaaatatc 1260
tttgaatgtc gtgcggtggt tttcgatggt agtgatgatt accacgcacg cattaacgat 1320
ccggcgctga aaatcgatga aaataccctg ctggccattc gtggtgccgg tccggttggt 1380
tggccgggta gcgcggaagt ggttaacatg cagccgccag atgccctgat caaacgtggc 1440
gtgagtacgc tgccgaccct gggtgatggc cgccagagcg gcaccagcga ttctccgagt 1500
attctgaatg cctctccgga aagtgcagtg ggcggtggcc tggcatatct gcgtgatggc 1560
gatcgtgttc gcatcgatct gaacacgggt gaatgtaata tgctggtgag tgaagaagaa 1620
ctggcgcgtc gcaaaagcga aggcattccg ccggttccgc cgtctcagac cccgtggcag 1680
gaaatctatc gtagcacggt gggccagctg gaaaccggtg cgtgcatgga actggccctg 1740
aaatatcagg gtgtggccca gaccctgccg cgtcataatc actga 1785
<210> 79
<211> 1755
<212> DNA
<213> Actinoplanes missouriensis
<220>
<221> CDS
<222> (1)..(1755)
<400> 79
atg gac cta cac agg ccc cgg aag tta cga agg agg ctg gcg atg cag 48
Met Asp Leu His Arg Pro Arg Lys Leu Arg Arg Arg Leu Ala Met Gln
1 5 10 15
cga cgc agt gca cag tgg tac gcc ggt gac gac cgg aac agc tac atc 96
Arg Arg Ser Ala Gln Trp Tyr Ala Gly Asp Asp Arg Asn Ser Tyr Ile
20 25 30
cac cgc gcc tgg atg cgc cgg ggc ctg ccg gcc gac gcg ttc gac ggg 144
His Arg Ala Trp Met Arg Arg Gly Leu Pro Ala Asp Ala Phe Asp Gly
35 40 45
cgc ccg cac atc gcc atc gcc aac acc gcc tcg gac ctg acc ccg tgc 192
Arg Pro His Ile Ala Ile Ala Asn Thr Ala Ser Asp Leu Thr Pro Cys
50 55 60
aac gcc cac ttc gac gag gtc gcc cgc agc gtc gcc gac ggc atc cac 240
Asn Ala His Phe Asp Glu Val Ala Arg Ser Val Ala Asp Gly Ile His
65 70 75 80
cgg gcg ggc ggc gtc gcg ctg aac ctg ccc gtc gtg tcg atc ggc gag 288
Arg Ala Gly Gly Val Ala Leu Asn Leu Pro Val Val Ser Ile Gly Glu
85 90 95
acc cag gtc cgg ccc acc gcg atg ctg tgg cga aac atg gcc gcg atg 336
Thr Gln Val Arg Pro Thr Ala Met Leu Trp Arg Asn Met Ala Ala Met
100 105 110
gcg atc gag gag atg ctg cgc gcc aac ccg atc gac ggc gtc gtc ctg 384
Ala Ile Glu Glu Met Leu Arg Ala Asn Pro Ile Asp Gly Val Val Leu
115 120 125
ctc ggc ggc tgc gac aag acc atc ccc gcg ctg ctc atg ggc gcc gcc 432
Leu Gly Gly Cys Asp Lys Thr Ile Pro Ala Leu Leu Met Gly Ala Ala
130 135 140
tcg gtc gac ctg ccg gcc gtc gtg atg ccc ggc ggc ccg atg ctg acc 480
Ser Val Asp Leu Pro Ala Val Val Met Pro Gly Gly Pro Met Leu Thr
145 150 155 160
ggc acc ttc cgg ggc gtg ccg ctc ggc tgc ggc acc gac gtg tgg aag 528
Gly Thr Phe Arg Gly Val Pro Leu Gly Cys Gly Thr Asp Val Trp Lys
165 170 175
ctg agc gag gag gtc cgg gcc ggc acc ctg agc gcc gcc gag ttc acc 576
Leu Ser Glu Glu Val Arg Ala Gly Thr Leu Ser Ala Ala Glu Phe Thr
180 185 190
cgc tcc gag tca tcg atg atc agg agc aag ggc cac tgc aac acc atg 624
Arg Ser Glu Ser Ser Met Ile Arg Ser Lys Gly His Cys Asn Thr Met
195 200 205
ggt acg gcg tcg acc atg ggc ctg ctc gcc gaa gtg ctc ggc atg acc 672
Gly Thr Ala Ser Thr Met Gly Leu Leu Ala Glu Val Leu Gly Met Thr
210 215 220
ctg ccg ggg gtg gcc ggc acg ccc gcc ccg gac agc cgg ctg ctg gag 720
Leu Pro Gly Val Ala Gly Thr Pro Ala Pro Asp Ser Arg Leu Leu Glu
225 230 235 240
gcc gcc cac gcg acc ggg gtg ctc gcc gtc ggc ctg gtc gac gcg gac 768
Ala Ala His Ala Thr Gly Val Leu Ala Val Gly Leu Val Asp Ala Asp
245 250 255
cgc cgc ccg agc cag gtg atg acc cgc ggc tcg ttc ctc aac gcg atc 816
Arg Arg Pro Ser Gln Val Met Thr Arg Gly Ser Phe Leu Asn Ala Ile
260 265 270
gtc gcg ctc gcc gcc ctg ggc ggc tcc acc aac gcc gtc gtg cac ctg 864
Val Ala Leu Ala Ala Leu Gly Gly Ser Thr Asn Ala Val Val His Leu
275 280 285
ctg gcc atc gcc ggc cgg ctc ggc gtg ccg ctg tcc cag gac gac ttc 912
Leu Ala Ile Ala Gly Arg Leu Gly Val Pro Leu Ser Gln Asp Asp Phe
290 295 300
gac acc acc ggc gcc gac gtt ccg ctg ctg gtc gac ctg ctc ccg gcc 960
Asp Thr Thr Gly Ala Asp Val Pro Leu Leu Val Asp Leu Leu Pro Ala
305 310 315 320
ggc cgc ttc ctg atg gac gac ctc tac cgc gcc ggc ggt ctg cac gcc 1008
Gly Arg Phe Leu Met Asp Asp Leu Tyr Arg Ala Gly Gly Leu His Ala
325 330 335
gtc ctc gcc gag gtc cgt gac ctg ctc gac ccg tcc gcg atc acg gtc 1056
Val Leu Ala Glu Val Arg Asp Leu Leu Asp Pro Ser Ala Ile Thr Val
340 345 350
acc ggc cgg ccg ctg acc gag cac ctc ggc gac gcc cgc gtc cac gac 1104
Thr Gly Arg Pro Leu Thr Glu His Leu Gly Asp Ala Arg Val His Asp
355 360 365
cgc gag gtg atc cgg ccg cgg gcc gaa ccg ttg ctg ccg cac gcc ggg 1152
Arg Glu Val Ile Arg Pro Arg Ala Glu Pro Leu Leu Pro His Ala Gly
370 375 380
atc gcg gtc ctc tac ggc aac ctg gcg ccg gac ggc gcg gtc gtc aaa 1200
Ile Ala Val Leu Tyr Gly Asn Leu Ala Pro Asp Gly Ala Val Val Lys
385 390 395 400
ccg gcc gcc gcg tcc gag cac ttg ctg cgc cac cgg ggt ccg gcc gtg 1248
Pro Ala Ala Ala Ser Glu His Leu Leu Arg His Arg Gly Pro Ala Val
405 410 415
gtc ttc gac tcc gtc gag gac ctg cac gcc cgg ctc gac gac ccg gac 1296
Val Phe Asp Ser Val Glu Asp Leu His Ala Arg Leu Asp Asp Pro Asp
420 425 430
ctg gac gtc acc gcc gac tcg gtg ctg gtg ctg cgc ggc tgc ggt ccc 1344
Leu Asp Val Thr Ala Asp Ser Val Leu Val Leu Arg Gly Cys Gly Pro
435 440 445
aag ggc tat ccg ggc atg ccg gag gtg tcc aac atg ccg ctg ccg gcg 1392
Lys Gly Tyr Pro Gly Met Pro Glu Val Ser Asn Met Pro Leu Pro Ala
450 455 460
aaa ctc ctc gaa cag ggg gtc cgc gac atg gtc cgg gtc tgc gac ggg 1440
Lys Leu Leu Glu Gln Gly Val Arg Asp Met Val Arg Val Cys Asp Gly
465 470 475 480
cgg atg tcg ggt acg gcg tac ggc acg gtg gtc ctg cac gtc gcc ccg 1488
Arg Met Ser Gly Thr Ala Tyr Gly Thr Val Val Leu His Val Ala Pro
485 490 495
gaa gcc gcg gcg ggc ggg ccg ctc gcc cgg gtc cgc acc ggc gac atg 1536
Glu Ala Ala Ala Gly Gly Pro Leu Ala Arg Val Arg Thr Gly Asp Met
500 505 510
atc atc ctc gac gtc gcg aac cgg cgc ctc gac gcc gac gtc ccg gcc 1584
Ile Ile Leu Asp Val Ala Asn Arg Arg Leu Asp Ala Asp Val Pro Ala
515 520 525
gag gag tgg gcc gcc cgc gag ccg tca ccg gag gcg gcg aaa gcc tac 1632
Glu Glu Trp Ala Ala Arg Glu Pro Ser Pro Glu Ala Ala Lys Ala Tyr
530 535 540
gcg gcg ccg tcc cgc ggc tgg gag cgt ctc tac gtc gac acc gtc ggc 1680
Ala Ala Pro Ser Arg Gly Trp Glu Arg Leu Tyr Val Asp Thr Val Gly
545 550 555 560
cag gcc gac acc ggc gcc gac tgc gac ttc ctg cgc ggc gcg agc ggc 1728
Gln Ala Asp Thr Gly Ala Asp Cys Asp Phe Leu Arg Gly Ala Ser Gly
565 570 575
gac cgc gtc tcc cgc gag tcc cac tga 1755
Asp Arg Val Ser Arg Glu Ser His
580
<210> 80
<211> 584
<212> PRT
<213> Actinoplanes missouriensis
<400> 80
Met Asp Leu His Arg Pro Arg Lys Leu Arg Arg Arg Leu Ala Met Gln
1 5 10 15
Arg Arg Ser Ala Gln Trp Tyr Ala Gly Asp Asp Arg Asn Ser Tyr Ile
20 25 30
His Arg Ala Trp Met Arg Arg Gly Leu Pro Ala Asp Ala Phe Asp Gly
35 40 45
Arg Pro His Ile Ala Ile Ala Asn Thr Ala Ser Asp Leu Thr Pro Cys
50 55 60
Asn Ala His Phe Asp Glu Val Ala Arg Ser Val Ala Asp Gly Ile His
65 70 75 80
Arg Ala Gly Gly Val Ala Leu Asn Leu Pro Val Val Ser Ile Gly Glu
85 90 95
Thr Gln Val Arg Pro Thr Ala Met Leu Trp Arg Asn Met Ala Ala Met
100 105 110
Ala Ile Glu Glu Met Leu Arg Ala Asn Pro Ile Asp Gly Val Val Leu
115 120 125
Leu Gly Gly Cys Asp Lys Thr Ile Pro Ala Leu Leu Met Gly Ala Ala
130 135 140
Ser Val Asp Leu Pro Ala Val Val Met Pro Gly Gly Pro Met Leu Thr
145 150 155 160
Gly Thr Phe Arg Gly Val Pro Leu Gly Cys Gly Thr Asp Val Trp Lys
165 170 175
Leu Ser Glu Glu Val Arg Ala Gly Thr Leu Ser Ala Ala Glu Phe Thr
180 185 190
Arg Ser Glu Ser Ser Met Ile Arg Ser Lys Gly His Cys Asn Thr Met
195 200 205
Gly Thr Ala Ser Thr Met Gly Leu Leu Ala Glu Val Leu Gly Met Thr
210 215 220
Leu Pro Gly Val Ala Gly Thr Pro Ala Pro Asp Ser Arg Leu Leu Glu
225 230 235 240
Ala Ala His Ala Thr Gly Val Leu Ala Val Gly Leu Val Asp Ala Asp
245 250 255
Arg Arg Pro Ser Gln Val Met Thr Arg Gly Ser Phe Leu Asn Ala Ile
260 265 270
Val Ala Leu Ala Ala Leu Gly Gly Ser Thr Asn Ala Val Val His Leu
275 280 285
Leu Ala Ile Ala Gly Arg Leu Gly Val Pro Leu Ser Gln Asp Asp Phe
290 295 300
Asp Thr Thr Gly Ala Asp Val Pro Leu Leu Val Asp Leu Leu Pro Ala
305 310 315 320
Gly Arg Phe Leu Met Asp Asp Leu Tyr Arg Ala Gly Gly Leu His Ala
325 330 335
Val Leu Ala Glu Val Arg Asp Leu Leu Asp Pro Ser Ala Ile Thr Val
340 345 350
Thr Gly Arg Pro Leu Thr Glu His Leu Gly Asp Ala Arg Val His Asp
355 360 365
Arg Glu Val Ile Arg Pro Arg Ala Glu Pro Leu Leu Pro His Ala Gly
370 375 380
Ile Ala Val Leu Tyr Gly Asn Leu Ala Pro Asp Gly Ala Val Val Lys
385 390 395 400
Pro Ala Ala Ala Ser Glu His Leu Leu Arg His Arg Gly Pro Ala Val
405 410 415
Val Phe Asp Ser Val Glu Asp Leu His Ala Arg Leu Asp Asp Pro Asp
420 425 430
Leu Asp Val Thr Ala Asp Ser Val Leu Val Leu Arg Gly Cys Gly Pro
435 440 445
Lys Gly Tyr Pro Gly Met Pro Glu Val Ser Asn Met Pro Leu Pro Ala
450 455 460
Lys Leu Leu Glu Gln Gly Val Arg Asp Met Val Arg Val Cys Asp Gly
465 470 475 480
Arg Met Ser Gly Thr Ala Tyr Gly Thr Val Val Leu His Val Ala Pro
485 490 495
Glu Ala Ala Ala Gly Gly Pro Leu Ala Arg Val Arg Thr Gly Asp Met
500 505 510
Ile Ile Leu Asp Val Ala Asn Arg Arg Leu Asp Ala Asp Val Pro Ala
515 520 525
Glu Glu Trp Ala Ala Arg Glu Pro Ser Pro Glu Ala Ala Lys Ala Tyr
530 535 540
Ala Ala Pro Ser Arg Gly Trp Glu Arg Leu Tyr Val Asp Thr Val Gly
545 550 555 560
Gln Ala Asp Thr Gly Ala Asp Cys Asp Phe Leu Arg Gly Ala Ser Gly
565 570 575
Asp Arg Val Ser Arg Glu Ser His
580
<210> 81
<211> 1755
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 81
atggatctgc atcgtccgcg taaactgcgt cgccgtctgg ccatgcagcg ccgtagcgcc 60
cagtggtatg caggcgatga tcgcaactct tacattcatc gtgcatggat gcgccgtggt 120
ctgccggcag atgcatttga tggccgtccg cacattgcga tcgccaacac ggcgtctgat 180
ctgaccccgt gcaatgccca tttcgatgaa gttgcgcgca gtgtggccga tggtattcac 240
cgtgcaggcg gtgttgcgct gaatctgccg gtggttagca ttggtgaaac ccaagtgcgt 300
ccgaccgcca tgctgtggcg taacatggcg gccatggcaa ttgaagaaat gctgcgtgcg 360
aatccgatcg atggtgtggt tctgctgggc ggttgtgata aaacgattcc ggccctgctg 420
atgggcgcag cgagtgttga tctgccggca gtggttatgc cgggcggtcc gatgctgacc 480
ggcacgtttc gcggtgtgcc gctgggttgt ggcaccgatg tttggaaact gagcgaagaa 540
gtgcgtgcgg gtacgctgtc tgccgcagaa tttacccgca gtgaaagctc tatgatccgt 600
agcaaaggtc attgtaacac catgggcacg gcaagcacca tgggtctgct ggcagaagtt 660
ctgggcatga cgctgccggg tgtggcgggc accccggcac cggattctcg tctgctggaa 720
gccgcacatg ccaccggtgt gctggcggtt ggcctggtgg atgccgatcg ccgtccgtct 780
caggttatga cgcgtggcag ttttctgaat gcaattgtgg cactggcggc gctgggcggc 840
agtaccaatg cagtggttca tctgctggca attgccggcc gcctgggtgt gccgctgagc 900
caggatgatt ttgataccac gggtgccgat gttccgctgc tggttgatct gctgccggca 960
ggccgcttcc tgatggatga tctgtatcgt gcgggcggtc tgcatgcggt tctggcagaa 1020
gtgcgcgatc tgctggatcc gagcgcgatc accgtgaccg gtcgtccgct gaccgaacat 1080
ctgggcgatg cgcgcgttca cgatcgtgaa gtgattcgtc cgcgtgcgga accgctgctg 1140
ccgcatgcag gtattgcggt gctgtacggt aatctggccc cggatggtgc ggtggttaaa 1200
ccggcggcag ccagcgaaca tctgctgcgt caccgtggtc cggcggtggt tttcgattct 1260
gttgaagatc tgcacgcacg cctggatgat ccggatctgg atgtgaccgc ggattctgtg 1320
ctggttctgc gtggctgcgg tccgaaaggc tatccgggta tgccggaagt tagtaacatg 1380
ccgctgccgg cgaaactgct ggaacagggt gtgcgcgata tggtgcgtgt ttgtgatggc 1440
cgtatgtctg gtacggcata cggcaccgtg gttctgcatg ttgccccgga agcggcagcg 1500
ggcggtccgc tggcacgcgt gcgtaccggc gatatgatta tcctggatgt tgccaatcgc 1560
cgtctggatg cagatgtgcc ggccgaagaa tgggcggcac gtgaaccgag tccggaagcc 1620
gcaaaagcct atgcggcccc gagccgtggt tgggaacgtc tgtacgttga tacggtgggt 1680
caggccgata ccggcgcaga ttgcgatttt ctgcgtggcg cgagcggtga tcgcgtgagt 1740
cgtgaaagcc actga 1755
<210> 82
<211> 1962
<212> DNA
<213> Aspergillus oryzae
<220>
<221> CDS
<222> (1)..(1962)
<400> 82
atg tcg tgt cag tca cgc acc tcg tgt gaa ggc tgc tcc tgc agt gac 48
Met Ser Cys Gln Ser Arg Thr Ser Cys Glu Gly Cys Ser Cys Ser Asp
1 5 10 15
ggg ggc agc cgg cca cca gtg aac atc gag gac tgt gag agc gaa ctg 96
Gly Gly Ser Arg Pro Pro Val Asn Ile Glu Asp Cys Glu Ser Glu Leu
20 25 30
ctt gcc ctt cgg agg cgt aca gtg gag ctc gag aaa act cta gca tca 144
Leu Ala Leu Arg Arg Arg Thr Val Glu Leu Glu Lys Thr Leu Ala Ser
35 40 45
atg caa gat ggc cgg cca cat gct aat gca tca agg gcc cgg aag tta 192
Met Gln Asp Gly Arg Pro His Ala Asn Ala Ser Arg Ala Arg Lys Leu
50 55 60
cgg tcg gcc aac tgg ttc aac tgc gag agc gat ccg ggc atg atg gcc 240
Arg Ser Ala Asn Trp Phe Asn Cys Glu Ser Asp Pro Gly Met Met Ala
65 70 75 80
ctc tac att gag cgg tac ctc aac tat ggt atc acc cgg gaa gaa ctg 288
Leu Tyr Ile Glu Arg Tyr Leu Asn Tyr Gly Ile Thr Arg Glu Glu Leu
85 90 95
atg tct ggt aaa cca ata atc gga ata gca cag tcc ggg tcc gac ttg 336
Met Ser Gly Lys Pro Ile Ile Gly Ile Ala Gln Ser Gly Ser Asp Leu
100 105 110
tct cca tgc aac cgc cat cac ctc gag ttg gcg aaa cgg gtt cga gaa 384
Ser Pro Cys Asn Arg His His Leu Glu Leu Ala Lys Arg Val Arg Glu
115 120 125
ggt atc agg tcc gcc gga ggg atc gcc ttt gaa ttc ccc acg cat cct 432
Gly Ile Arg Ser Ala Gly Gly Ile Ala Phe Glu Phe Pro Thr His Pro
130 135 140
att cag gag act agc agg aga ccc act gct tgt att gac cga aat cta 480
Ile Gln Glu Thr Ser Arg Arg Pro Thr Ala Cys Ile Asp Arg Asn Leu
145 150 155 160
tcg tat ctg ggc ctg gta gaa att ctc ttc gga tat ccc ttg gac ggt 528
Ser Tyr Leu Gly Leu Val Glu Ile Leu Phe Gly Tyr Pro Leu Asp Gly
165 170 175
gta gtc ctc ctg acg ggc tgc gac aag act act ccc gcc gct ctg atg 576
Val Val Leu Leu Thr Gly Cys Asp Lys Thr Thr Pro Ala Ala Leu Met
180 185 190
gcc gcg gct aca gtg aat atc cca gca ata tgc ttg aat gtc ggc cca 624
Ala Ala Ala Thr Val Asn Ile Pro Ala Ile Cys Leu Asn Val Gly Pro
195 200 205
atg ctt aac ggt tac gtg aag aag gac ctg gcg ggg tcc gga atg gta 672
Met Leu Asn Gly Tyr Val Lys Lys Asp Leu Ala Gly Ser Gly Met Val
210 215 220
ttg tgg acg ggt aga gag atg tat gcg gca ggt gag atc aac aag gag 720
Leu Trp Thr Gly Arg Glu Met Tyr Ala Ala Gly Glu Ile Asn Lys Glu
225 230 235 240
gaa ttc att gac tat gtg tcc aaa ggt aca cca tca gtg gga cat tgt 768
Glu Phe Ile Asp Tyr Val Ser Lys Gly Thr Pro Ser Val Gly His Cys
245 250 255
aac acg atg gga aca gca tca act atg aat gct ttg gca gaa gcg ctt 816
Asn Thr Met Gly Thr Ala Ser Thr Met Asn Ala Leu Ala Glu Ala Leu
260 265 270
gga atg gcc cta cct ggg tcg gct gcc ata ccg gct ccg tat cgt gaa 864
Gly Met Ala Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Glu
275 280 285
cgt ggc caa tgt gct tac gaa aca ggt ttg cgt att gtc gaa atg gtt 912
Arg Gly Gln Cys Ala Tyr Glu Thr Gly Leu Arg Ile Val Glu Met Val
290 295 300
cat tcc gat cgg aag ccc agc gat att atg act cga gag gct ttc gag 960
His Ser Asp Arg Lys Pro Ser Asp Ile Met Thr Arg Glu Ala Phe Glu
305 310 315 320
aat gtt att gta gtt aat act gct atc ggc ggc agt acc aat gcc cct 1008
Asn Val Ile Val Val Asn Thr Ala Ile Gly Gly Ser Thr Asn Ala Pro
325 330 335
att cat atc aac gcc att gcc aaa cat att ggg gtt gag gtt tca ctg 1056
Ile His Ile Asn Ala Ile Ala Lys His Ile Gly Val Glu Val Ser Leu
340 345 350
gat gac tgg gac cga ctt gga ttt cat att cca cta ctg cta aac atg 1104
Asp Asp Trp Asp Arg Leu Gly Phe His Ile Pro Leu Leu Leu Asn Met
355 360 365
caa cca gcc ggt gaa ctg ctg gga gag gaa tac tat cgg gcg ggc ggg 1152
Gln Pro Ala Gly Glu Leu Leu Gly Glu Glu Tyr Tyr Arg Ala Gly Gly
370 375 380
cta ccc gcg att atg gcg gag ctg cta gat gct agg aag ctg aac ccg 1200
Leu Pro Ala Ile Met Ala Glu Leu Leu Asp Ala Arg Lys Leu Asn Pro
385 390 395 400
gat gct tta aca tgc aat ggt tac aca gta gcc gag aat gtc cgg gac 1248
Asp Ala Leu Thr Cys Asn Gly Tyr Thr Val Ala Glu Asn Val Arg Asp
405 410 415
aaa cat acc tgg gac cgt cga atg atc aag ccg tac aat gag cca ctt 1296
Lys His Thr Trp Asp Arg Arg Met Ile Lys Pro Tyr Asn Glu Pro Leu
420 425 430
ctg gaa gat gcc ggt ttt ctc cat ctt caa ggc agt ctg ttc cgg tct 1344
Leu Glu Asp Ala Gly Phe Leu His Leu Gln Gly Ser Leu Phe Arg Ser
435 440 445
gct atc atg aag aca tgt gtg ata tcg gag cct ttc cga caa aag ttc 1392
Ala Ile Met Lys Thr Cys Val Ile Ser Glu Pro Phe Arg Gln Lys Phe
450 455 460
ttg gag aat ccc aag gac ccg aat gca ttt gaa ggt acg gtt gta gta 1440
Leu Glu Asn Pro Lys Asp Pro Asn Ala Phe Glu Gly Thr Val Val Val
465 470 475 480
ttt gat gga ccg gag gat tat cat cac cga ctt gag gac cct tcc acc 1488
Phe Asp Gly Pro Glu Asp Tyr His His Arg Leu Glu Asp Pro Ser Thr
485 490 495
ccc atc gac gac aga agt atc ctg gtg atg cgc ggt gct ggc cca ttg 1536
Pro Ile Asp Asp Arg Ser Ile Leu Val Met Arg Gly Ala Gly Pro Leu
500 505 510
gga tat cca ggt gcc gcc gag gtc gtc aac atg cac cca cct gga cgg 1584
Gly Tyr Pro Gly Ala Ala Glu Val Val Asn Met His Pro Pro Gly Arg
515 520 525
ctt tta cga caa ggg gtc aaa tcg ctt ccg tgc att gga gac ggg cga 1632
Leu Leu Arg Gln Gly Val Lys Ser Leu Pro Cys Ile Gly Asp Gly Arg
530 535 540
caa tcg gga act tcc ggc tca cca tca atc ctc aat gct agt ccc gag 1680
Gln Ser Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu
545 550 555 560
gca gcg gcg ggt ggt aat cta gcc ctt ctt caa gat ggg gac aga ctc 1728
Ala Ala Ala Gly Gly Asn Leu Ala Leu Leu Gln Asp Gly Asp Arg Leu
565 570 575
cgt gtt gat cta aat aaa cgg cgc gtt gac atc ctt gtt tcc acg gag 1776
Arg Val Asp Leu Asn Lys Arg Arg Val Asp Ile Leu Val Ser Thr Glu
580 585 590
gaa ctg gaa aag cgg aga aag aca cta gaa gcc caa gga ggt tat gat 1824
Glu Leu Glu Lys Arg Arg Lys Thr Leu Glu Ala Gln Gly Gly Tyr Asp
595 600 605
gtg ccg gaa agt caa act cca tgg cag gaa ctg ttc agg agg gag acg 1872
Val Pro Glu Ser Gln Thr Pro Trp Gln Glu Leu Phe Arg Arg Glu Thr
610 615 620
aca cag ttg agt gat ggt atg gtc ctc cga gac gcg gta aaa tac caa 1920
Thr Gln Leu Ser Asp Gly Met Val Leu Arg Asp Ala Val Lys Tyr Gln
625 630 635 640
cga ctt gcc cag cga tat gag aac ccc cgg cac aat cat tga 1962
Arg Leu Ala Gln Arg Tyr Glu Asn Pro Arg His Asn His
645 650
<210> 83
<211> 653
<212> PRT
<213> Aspergillus oryzae
<400> 83
Met Ser Cys Gln Ser Arg Thr Ser Cys Glu Gly Cys Ser Cys Ser Asp
1 5 10 15
Gly Gly Ser Arg Pro Pro Val Asn Ile Glu Asp Cys Glu Ser Glu Leu
20 25 30
Leu Ala Leu Arg Arg Arg Thr Val Glu Leu Glu Lys Thr Leu Ala Ser
35 40 45
Met Gln Asp Gly Arg Pro His Ala Asn Ala Ser Arg Ala Arg Lys Leu
50 55 60
Arg Ser Ala Asn Trp Phe Asn Cys Glu Ser Asp Pro Gly Met Met Ala
65 70 75 80
Leu Tyr Ile Glu Arg Tyr Leu Asn Tyr Gly Ile Thr Arg Glu Glu Leu
85 90 95
Met Ser Gly Lys Pro Ile Ile Gly Ile Ala Gln Ser Gly Ser Asp Leu
100 105 110
Ser Pro Cys Asn Arg His His Leu Glu Leu Ala Lys Arg Val Arg Glu
115 120 125
Gly Ile Arg Ser Ala Gly Gly Ile Ala Phe Glu Phe Pro Thr His Pro
130 135 140
Ile Gln Glu Thr Ser Arg Arg Pro Thr Ala Cys Ile Asp Arg Asn Leu
145 150 155 160
Ser Tyr Leu Gly Leu Val Glu Ile Leu Phe Gly Tyr Pro Leu Asp Gly
165 170 175
Val Val Leu Leu Thr Gly Cys Asp Lys Thr Thr Pro Ala Ala Leu Met
180 185 190
Ala Ala Ala Thr Val Asn Ile Pro Ala Ile Cys Leu Asn Val Gly Pro
195 200 205
Met Leu Asn Gly Tyr Val Lys Lys Asp Leu Ala Gly Ser Gly Met Val
210 215 220
Leu Trp Thr Gly Arg Glu Met Tyr Ala Ala Gly Glu Ile Asn Lys Glu
225 230 235 240
Glu Phe Ile Asp Tyr Val Ser Lys Gly Thr Pro Ser Val Gly His Cys
245 250 255
Asn Thr Met Gly Thr Ala Ser Thr Met Asn Ala Leu Ala Glu Ala Leu
260 265 270
Gly Met Ala Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Glu
275 280 285
Arg Gly Gln Cys Ala Tyr Glu Thr Gly Leu Arg Ile Val Glu Met Val
290 295 300
His Ser Asp Arg Lys Pro Ser Asp Ile Met Thr Arg Glu Ala Phe Glu
305 310 315 320
Asn Val Ile Val Val Asn Thr Ala Ile Gly Gly Ser Thr Asn Ala Pro
325 330 335
Ile His Ile Asn Ala Ile Ala Lys His Ile Gly Val Glu Val Ser Leu
340 345 350
Asp Asp Trp Asp Arg Leu Gly Phe His Ile Pro Leu Leu Leu Asn Met
355 360 365
Gln Pro Ala Gly Glu Leu Leu Gly Glu Glu Tyr Tyr Arg Ala Gly Gly
370 375 380
Leu Pro Ala Ile Met Ala Glu Leu Leu Asp Ala Arg Lys Leu Asn Pro
385 390 395 400
Asp Ala Leu Thr Cys Asn Gly Tyr Thr Val Ala Glu Asn Val Arg Asp
405 410 415
Lys His Thr Trp Asp Arg Arg Met Ile Lys Pro Tyr Asn Glu Pro Leu
420 425 430
Leu Glu Asp Ala Gly Phe Leu His Leu Gln Gly Ser Leu Phe Arg Ser
435 440 445
Ala Ile Met Lys Thr Cys Val Ile Ser Glu Pro Phe Arg Gln Lys Phe
450 455 460
Leu Glu Asn Pro Lys Asp Pro Asn Ala Phe Glu Gly Thr Val Val Val
465 470 475 480
Phe Asp Gly Pro Glu Asp Tyr His His Arg Leu Glu Asp Pro Ser Thr
485 490 495
Pro Ile Asp Asp Arg Ser Ile Leu Val Met Arg Gly Ala Gly Pro Leu
500 505 510
Gly Tyr Pro Gly Ala Ala Glu Val Val Asn Met His Pro Pro Gly Arg
515 520 525
Leu Leu Arg Gln Gly Val Lys Ser Leu Pro Cys Ile Gly Asp Gly Arg
530 535 540
Gln Ser Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu
545 550 555 560
Ala Ala Ala Gly Gly Asn Leu Ala Leu Leu Gln Asp Gly Asp Arg Leu
565 570 575
Arg Val Asp Leu Asn Lys Arg Arg Val Asp Ile Leu Val Ser Thr Glu
580 585 590
Glu Leu Glu Lys Arg Arg Lys Thr Leu Glu Ala Gln Gly Gly Tyr Asp
595 600 605
Val Pro Glu Ser Gln Thr Pro Trp Gln Glu Leu Phe Arg Arg Glu Thr
610 615 620
Thr Gln Leu Ser Asp Gly Met Val Leu Arg Asp Ala Val Lys Tyr Gln
625 630 635 640
Arg Leu Ala Gln Arg Tyr Glu Asn Pro Arg His Asn His
645 650
<210> 84
<211> 1962
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 84
atgtcttgcc agagtcgcac cagctgtgaa ggttgcagct gttctgatgg cggttctcgt 60
ccgccggtta atattgaaga ttgcgaaagt gaactgctgg ccctgcgtcg ccgtacggtg 120
gaactggaaa aaaccctggc atctatgcag gatggccgtc cgcatgcaaa tgcctctcgt 180
gcacgtaaac tgcgtagtgc aaactggttt aattgtgaaa gtgatccggg tatgatggcg 240
ctgtatattg aacgctatct gaattacggc atcacccgtg aagaactgat gagtggcaaa 300
ccgattatcg gtattgcaca gagtggcagc gatctgagcc cgtgcaaccg ccatcacctg 360
gaactggcga aacgtgtgcg tgaaggtatt cgtagcgcag gcggtatcgc gtttgaattt 420
ccgacccacc cgattcagga aacgagccgc cgtccgaccg cgtgtatcga tcgtaatctg 480
tcttatctgg gtctggtgga aatcctgttt ggttacccgc tggatggcgt ggttctgctg 540
accggttgtg ataaaaccac cccggcggcc ctgatggcag ccgcaaccgt taacattccg 600
gccatctgtc tgaacgtggg tccgatgctg aatggctatg tgaaaaaaga tctggcaggc 660
agcggtatgg tgctgtggac gggtcgcgaa atgtatgcag cgggcgaaat caacaaagaa 720
gaatttatcg attacgttag caaaggcacc ccgtctgtgg gccattgcaa taccatgggc 780
acggcgtcta ccatgaacgc cctggcagaa gccctgggta tggccctgcc gggtagtgcc 840
gcaattccgg ccccgtatcg cgaacgtggc cagtgtgcat acgaaacggg cctgcgcatt 900
gttgaaatgg tgcacagtga tcgcaaaccg agcgatatca tgacccgtga agcctttgaa 960
aacgtgattg tggttaatac ggcgatcggc ggtagtacca acgccccgat tcatatcaat 1020
gccattgcaa aacacatcgg tgttgaagtg agcctggatg attgggatcg tctgggcttc 1080
catattccgc tgctgctgaa tatgcagccg gcgggcgaac tgctgggtga agaatattat 1140
cgtgccggcg gtctgccggc catcatggcc gaactgctgg atgcacgtaa actgaacccg 1200
gatgcgctga cgtgcaatgg ttataccgtt gcggaaaacg tgcgcgataa acatacgtgg 1260
gatcgccgta tgatcaaacc gtacaacgaa ccgctgctgg aagatgcggg ttttctgcac 1320
ctgcagggct ctctgttccg cagtgccatt atgaaaacct gcgtgatcag cgaaccgttt 1380
cgtcagaaat tcctggaaaa cccgaaagat ccgaatgcgt ttgaaggtac ggtggtggtg 1440
tttgatggcc cggaagatta tcatcaccgc ctggaagatc cgagcacccc gattgatgat 1500
cgctctattc tggttatgcg tggcgccggt ccgctgggct acccgggtgc ggccgaagtt 1560
gtgaatatgc atccgccggg tcgcctgctg cgtcagggtg tgaaaagtct gccgtgcatt 1620
ggcgatggtc gtcagagcgg cacctctggt agtccgagca tcctgaacgc gagcccggaa 1680
gcagccgccg gcggtaacct ggcgctgctg caggatggtg atcgcctgcg tgttgatctg 1740
aacaaacgcc gtgttgatat tctggtgtct acggaagaac tggaaaaacg ccgtaaaacc 1800
ctggaagcgc agggcggtta tgatgtgccg gaaagccaga ccccgtggca ggaactgttt 1860
cgccgtgaaa ccacgcagct gtctgatggc atggttctgc gcgatgccgt gaaatatcag 1920
cgcctggcac agcgttacga aaacccgcgt cataatcact ga 1962
<210> 85
<211> 1161
<212> DNA
<213> Agrobacterium tumefaciens
<220>
<221> CDS
<222> (1)..(1161)
<400> 85
atg acc ggc tca agg tcc atc gac gct acc gct att ttg cct gaa gac 48
Met Thr Gly Ser Arg Ser Ile Asp Ala Thr Ala Ile Leu Pro Glu Asp
1 5 10 15
ttt gaa aac gcc ctg ctc gtc ggc cgc gta tgg tcg aaa agc gaa ggc 96
Phe Glu Asn Ala Leu Leu Val Gly Arg Val Trp Ser Lys Ser Glu Gly
20 25 30
ggc ccc tgc ccc gtt ctg cta aaa ggc ggc gtg ctt tac gac ctc acc 144
Gly Pro Cys Pro Val Leu Leu Lys Gly Gly Val Leu Tyr Asp Leu Thr
35 40 45
tct att tcg ccg acc atg tct gaa ctt ctg gaa aag acg gat ctg gtg 192
Ser Ile Ser Pro Thr Met Ser Glu Leu Leu Glu Lys Thr Asp Leu Val
50 55 60
gag ctg ctt gca gac acc ggc aca ttc gtg gcg ctt ggc gcg ctc gag 240
Glu Leu Leu Ala Asp Thr Gly Thr Phe Val Ala Leu Gly Ala Leu Glu
65 70 75 80
gcc ttt ctg gat ggc tcc gct ggt gaa ctt ctc gcc ccc aac gat att 288
Ala Phe Leu Asp Gly Ser Ala Gly Glu Leu Leu Ala Pro Asn Asp Ile
85 90 95
cag gcc gtg aag gct gca ggc gtg acc ttc gcc gac agc atg ctg gaa 336
Gln Ala Val Lys Ala Ala Gly Val Thr Phe Ala Asp Ser Met Leu Glu
100 105 110
cgc gtg atc gag gag cag gcc aag ggc gat cca ctt cgc gcg cag gaa 384
Arg Val Ile Glu Glu Gln Ala Lys Gly Asp Pro Leu Arg Ala Gln Glu
115 120 125
ata cgc gga cgg ctg gcg ccg gtt ctc ggc gac aat ctc aag gga ctt 432
Ile Arg Gly Arg Leu Ala Pro Val Leu Gly Asp Asn Leu Lys Gly Leu
130 135 140
gag gcc ggt tcg gaa aaa gca gcc gaa gtg aag aaa ctg ctg cag gaa 480
Glu Ala Gly Ser Glu Lys Ala Ala Glu Val Lys Lys Leu Leu Gln Glu
145 150 155 160
atg ggc ctg tgg tcg caa tat ctg gaa gtt ggc atc ggt ccg gat gcg 528
Met Gly Leu Trp Ser Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Ala
165 170 175
gag ata ttc tcc aag gcg cag gcc atg gcc tcc gtc ggc tgc ggc gcg 576
Glu Ile Phe Ser Lys Ala Gln Ala Met Ala Ser Val Gly Cys Gly Ala
180 185 190
ctg atc ggc gtt cac ccg aaa tcg cag tgg aac aac ccg gag ccg gaa 624
Leu Ile Gly Val His Pro Lys Ser Gln Trp Asn Asn Pro Glu Pro Glu
195 200 205
gtg gtg ctg gcc att gcc tcc gac ggc cgt atc gtt ggc gcg acg ctt 672
Val Val Leu Ala Ile Ala Ser Asp Gly Arg Ile Val Gly Ala Thr Leu
210 215 220
ggc aac gac gtc aac ctg cgt gac ttc gag ggc cgc tcc gcc ctc ctg 720
Gly Asn Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu
225 230 235 240
ctc agc aag gca aaa gac aac aac gca tcc tgc gca atc ggt ccc ttc 768
Leu Ser Lys Ala Lys Asp Asn Asn Ala Ser Cys Ala Ile Gly Pro Phe
245 250 255
atc cgc ctg ttt gat gga cgc ttt acc atc gaa gac gtg aag aag gcg 816
Ile Arg Leu Phe Asp Gly Arg Phe Thr Ile Glu Asp Val Lys Lys Ala
260 265 270
cag ata tcg ctt ctg gtc gaa ggc gag gac ggc ttc acc atg acc ggt 864
Gln Ile Ser Leu Leu Val Glu Gly Glu Asp Gly Phe Thr Met Thr Gly
275 280 285
gca agc gca atg cag gcg atc agc cgc acg ccg gaa aac ctc gct tcc 912
Ala Ser Ala Met Gln Ala Ile Ser Arg Thr Pro Glu Asn Leu Ala Ser
290 295 300
cag ctc ttg aac cgc aac cat cag tat cct gac ggc gcc gtc ttt ttc 960
Gln Leu Leu Asn Arg Asn His Gln Tyr Pro Asp Gly Ala Val Phe Phe
305 310 315 320
ctt ggt acg atg ttc gcg ccg gta aag gac cgc cat ggc ccg ggt ctc 1008
Leu Gly Thr Met Phe Ala Pro Val Lys Asp Arg His Gly Pro Gly Leu
325 330 335
ggc ttc acc cac tcc aag ggc gac cgt gtc gaa atc tcc acg ccc aag 1056
Gly Phe Thr His Ser Lys Gly Asp Arg Val Glu Ile Ser Thr Pro Lys
340 345 350
ctc ggc aag ctg atc aac tgg gtc acg acg aca gac gaa tgc ccg gaa 1104
Leu Gly Lys Leu Ile Asn Trp Val Thr Thr Thr Asp Glu Cys Pro Glu
355 360 365
tgg aca ttc ggc acc gcg gcc ctc atg cgc aac ctg gcg aaa cgc ggg 1152
Trp Thr Phe Gly Thr Ala Ala Leu Met Arg Asn Leu Ala Lys Arg Gly
370 375 380
ctg ctc tag 1161
Leu Leu
385
<210> 86
<211> 386
<212> PRT
<213> Agrobacterium tumefaciens
<400> 86
Met Thr Gly Ser Arg Ser Ile Asp Ala Thr Ala Ile Leu Pro Glu Asp
1 5 10 15
Phe Glu Asn Ala Leu Leu Val Gly Arg Val Trp Ser Lys Ser Glu Gly
20 25 30
Gly Pro Cys Pro Val Leu Leu Lys Gly Gly Val Leu Tyr Asp Leu Thr
35 40 45
Ser Ile Ser Pro Thr Met Ser Glu Leu Leu Glu Lys Thr Asp Leu Val
50 55 60
Glu Leu Leu Ala Asp Thr Gly Thr Phe Val Ala Leu Gly Ala Leu Glu
65 70 75 80
Ala Phe Leu Asp Gly Ser Ala Gly Glu Leu Leu Ala Pro Asn Asp Ile
85 90 95
Gln Ala Val Lys Ala Ala Gly Val Thr Phe Ala Asp Ser Met Leu Glu
100 105 110
Arg Val Ile Glu Glu Gln Ala Lys Gly Asp Pro Leu Arg Ala Gln Glu
115 120 125
Ile Arg Gly Arg Leu Ala Pro Val Leu Gly Asp Asn Leu Lys Gly Leu
130 135 140
Glu Ala Gly Ser Glu Lys Ala Ala Glu Val Lys Lys Leu Leu Gln Glu
145 150 155 160
Met Gly Leu Trp Ser Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Ala
165 170 175
Glu Ile Phe Ser Lys Ala Gln Ala Met Ala Ser Val Gly Cys Gly Ala
180 185 190
Leu Ile Gly Val His Pro Lys Ser Gln Trp Asn Asn Pro Glu Pro Glu
195 200 205
Val Val Leu Ala Ile Ala Ser Asp Gly Arg Ile Val Gly Ala Thr Leu
210 215 220
Gly Asn Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu
225 230 235 240
Leu Ser Lys Ala Lys Asp Asn Asn Ala Ser Cys Ala Ile Gly Pro Phe
245 250 255
Ile Arg Leu Phe Asp Gly Arg Phe Thr Ile Glu Asp Val Lys Lys Ala
260 265 270
Gln Ile Ser Leu Leu Val Glu Gly Glu Asp Gly Phe Thr Met Thr Gly
275 280 285
Ala Ser Ala Met Gln Ala Ile Ser Arg Thr Pro Glu Asn Leu Ala Ser
290 295 300
Gln Leu Leu Asn Arg Asn His Gln Tyr Pro Asp Gly Ala Val Phe Phe
305 310 315 320
Leu Gly Thr Met Phe Ala Pro Val Lys Asp Arg His Gly Pro Gly Leu
325 330 335
Gly Phe Thr His Ser Lys Gly Asp Arg Val Glu Ile Ser Thr Pro Lys
340 345 350
Leu Gly Lys Leu Ile Asn Trp Val Thr Thr Thr Asp Glu Cys Pro Glu
355 360 365
Trp Thr Phe Gly Thr Ala Ala Leu Met Arg Asn Leu Ala Lys Arg Gly
370 375 380
Leu Leu
385
<210> 87
<211> 1161
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 87
atgacgggca gccgttctat tgatgcgacc gccatcctgc cggaagattt cgaaaacgcg 60
ctgctggttg gccgcgtttg gagtaaaagc gaaggcggtc cgtgcccggt gctgctgaaa 120
ggcggtgttc tgtatgatct gaccagcatt agtccgacca tgagcgaact gctggaaaaa 180
accgatctgg tggaactgct ggccgatacc ggcaccttcg ttgcgctggg tgccctggaa 240
gcatttctgg atggtagcgc aggcgaactg ctggcgccga acgatatcca ggcagtgaaa 300
gcggccggcg ttaccttcgc ggattctatg ctggaacgtg tgattgaaga acaggcgaaa 360
ggtgatccgc tgcgtgcaca ggaaattcgc ggccgcctgg caccggtgct gggtgataat 420
ctgaaaggtc tggaagcggg ctctgaaaaa gcagcggaag tgaaaaaact gctgcaggaa 480
atgggcctgt ggagtcagta cctggaagtt ggcattggtc cggatgccga aatcttttct 540
aaagcacagg cgatggccag tgtgggctgc ggtgcactga ttggtgttca tccgaaaagt 600
cagtggaaca atccggaacc ggaagtggtt ctggcaattg cgagcgatgg tcgtatcgtg 660
ggcgcgacgc tgggtaacga tgttaatctg cgtgatttcg aaggccgcag cgccctgctg 720
ctgtctaaag caaaagataa caatgcgagt tgtgccattg gcccgtttat ccgtctgttc 780
gatggtcgct ttaccattga agatgtgaaa aaagcccaga tctctctgct ggttgaaggt 840
gaagatggct ttacgatgac cggtgccagt gcaatgcagg ccattagccg tacgccggaa 900
aatctggcaa gccagctgct gaaccgcaat caccagtatc cggatggcgc ggtgtttttc 960
ctgggcacca tgttcgcccc ggttaaagat cgtcatggcc cgggtctggg ctttacgcac 1020
agcaaaggcg atcgcgtgga aatttctacc ccgaaactgg gtaaactgat caactgggtt 1080
accacgaccg atgaatgtcc ggaatggacc tttggcaccg ccgcactgat gcgtaatctg 1140
gcgaaacgcg gtctgctgta g 1161
<210> 88
<211> 1200
<212> DNA
<213> Cupriavidus necator
<220>
<221> CDS
<222> (1)..(1200)
<400> 88
atg gca ttg ccg ctc acg ctc agc gct acg caa acg ctt cct gcc gac 48
Met Ala Leu Pro Leu Thr Leu Ser Ala Thr Gln Thr Leu Pro Ala Asp
1 5 10 15
ggg ctg gcg ggg acg ctg gtc ggc cgc gca tgg atc ccg gcc ggt gac 96
Gly Leu Ala Gly Thr Leu Val Gly Arg Ala Trp Ile Pro Ala Gly Asp
20 25 30
ggc gtt ccg gcc ggc ccg gct gtc gtg gtc ttg cgg ccg gat ggt gta 144
Gly Val Pro Ala Gly Pro Ala Val Val Val Leu Arg Pro Asp Gly Val
35 40 45
ttc gac att tcc gat gtc gcc ccg acc atg agc acc ctg ctc gaa cag 192
Phe Asp Ile Ser Asp Val Ala Pro Thr Met Ser Thr Leu Leu Glu Gln
50 55 60
gac gac ccg ctc acg gtg gtg cac aat gcg ccc ggg cgc tgg atc ggc 240
Asp Asp Pro Leu Thr Val Val His Asn Ala Pro Gly Arg Trp Ile Gly
65 70 75 80
aag ctg gac gac ctg ctg gcc aac acg gcc gat ccg cac ggc agc aac 288
Lys Leu Asp Asp Leu Leu Ala Asn Thr Ala Asp Pro His Gly Ser Asn
85 90 95
ggc gtg gcc cgc ctg ctg gcg cca tgc gac ctg cag gtg atc aag gcg 336
Gly Val Ala Arg Leu Leu Ala Pro Cys Asp Leu Gln Val Ile Lys Ala
100 105 110
gca ggc gtg acc ttt gcc ggc agc ctg gtc gag cgt gtc atc gaa gag 384
Ala Gly Val Thr Phe Ala Gly Ser Leu Val Glu Arg Val Ile Glu Glu
115 120 125
cag acc aag ggc gac ccg caa ggc gcc gcc gag gtc cgc aac cgg atc 432
Gln Thr Lys Gly Asp Pro Gln Gly Ala Ala Glu Val Arg Asn Arg Ile
130 135 140
cag gcg ctg gtg ggc gag cgc ctg tcc cgg atc cgg ccg ggt tcc cgc 480
Gln Ala Leu Val Gly Glu Arg Leu Ser Arg Ile Arg Pro Gly Ser Arg
145 150 155 160
gag gcg ggc gaa ctc aag gcc ttg ctg atc gag cat ggc atg tgg tcg 528
Glu Ala Gly Glu Leu Lys Ala Leu Leu Ile Glu His Gly Met Trp Ser
165 170 175
caa tac ctt gag gtg ggc atc ggc ccg gac gcc gag atc ttc acc aag 576
Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Ala Glu Ile Phe Thr Lys
180 185 190
gca ccg ctg ctt tcc gcg ctt ggc acc ggt acg gaa atc gga ctg cat 624
Ala Pro Leu Leu Ser Ala Leu Gly Thr Gly Thr Glu Ile Gly Leu His
195 200 205
ccc ggc tcg gca tgg aac aat ccg gaa ccc gag atc gtg ctg gcc atc 672
Pro Gly Ser Ala Trp Asn Asn Pro Glu Pro Glu Ile Val Leu Ala Ile
210 215 220
aac agc cgc ggt gat gtg ctc ggc gcc acg ctg ggt aat gac gtc aac 720
Asn Ser Arg Gly Asp Val Leu Gly Ala Thr Leu Gly Asn Asp Val Asn
225 230 235 240
ctg cgc gac ttc gag ggc cgc agt gcg ttg ctg ctg ggc aag gcc aag 768
Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Gly Lys Ala Lys
245 250 255
gac aat aac ggc tcc tgc gcg atc ggt ccg ttc ctg cgc ctg ttc gac 816
Asp Asn Asn Gly Ser Cys Ala Ile Gly Pro Phe Leu Arg Leu Phe Asp
260 265 270
cag agt ttc tcg ctc gac gac gtg cgg cgg gcg acg gtg gat ctg cgt 864
Gln Ser Phe Ser Leu Asp Asp Val Arg Arg Ala Thr Val Asp Leu Arg
275 280 285
gtc gat ggc ctg gac ggc ttc gtg ttg tcc ggc acc agc tcg atg gac 912
Val Asp Gly Leu Asp Gly Phe Val Leu Ser Gly Thr Ser Ser Met Asp
290 295 300
cag atc acg cgc gac ccg ctg gag ctg gcc gag cag gca atg ggg gcg 960
Gln Ile Thr Arg Asp Pro Leu Glu Leu Ala Glu Gln Ala Met Gly Ala
305 310 315 320
acc cac cag tat ccc gat ggc gcc atg ctg ttc ctc ggc acg ctg ttc 1008
Thr His Gln Tyr Pro Asp Gly Ala Met Leu Phe Leu Gly Thr Leu Phe
325 330 335
gcg ccg gtg gaa gac cgc gac acc gcg ggc ggc ggc ttc acc cac aag 1056
Ala Pro Val Glu Asp Arg Asp Thr Ala Gly Gly Gly Phe Thr His Lys
340 345 350
ggt ggt gat ctt gtc acc atc tcc agc cgc cag ctc ggc agc ctg gtc 1104
Gly Gly Asp Leu Val Thr Ile Ser Ser Arg Gln Leu Gly Ser Leu Val
355 360 365
aac cgc gtg ggc cgc agc gac cgt atc gct ccg tgg acg ttc ggc gta 1152
Asn Arg Val Gly Arg Ser Asp Arg Ile Ala Pro Trp Thr Phe Gly Val
370 375 380
cgc gcc ctg atg gcc aac ctg gcc gca cgt ggc cac acc act ttc tga 1200
Arg Ala Leu Met Ala Asn Leu Ala Ala Arg Gly His Thr Thr Phe
385 390 395
<210> 89
<211> 399
<212> PRT
<213> Cupriavidus necator
<400> 89
Met Ala Leu Pro Leu Thr Leu Ser Ala Thr Gln Thr Leu Pro Ala Asp
1 5 10 15
Gly Leu Ala Gly Thr Leu Val Gly Arg Ala Trp Ile Pro Ala Gly Asp
20 25 30
Gly Val Pro Ala Gly Pro Ala Val Val Val Leu Arg Pro Asp Gly Val
35 40 45
Phe Asp Ile Ser Asp Val Ala Pro Thr Met Ser Thr Leu Leu Glu Gln
50 55 60
Asp Asp Pro Leu Thr Val Val His Asn Ala Pro Gly Arg Trp Ile Gly
65 70 75 80
Lys Leu Asp Asp Leu Leu Ala Asn Thr Ala Asp Pro His Gly Ser Asn
85 90 95
Gly Val Ala Arg Leu Leu Ala Pro Cys Asp Leu Gln Val Ile Lys Ala
100 105 110
Ala Gly Val Thr Phe Ala Gly Ser Leu Val Glu Arg Val Ile Glu Glu
115 120 125
Gln Thr Lys Gly Asp Pro Gln Gly Ala Ala Glu Val Arg Asn Arg Ile
130 135 140
Gln Ala Leu Val Gly Glu Arg Leu Ser Arg Ile Arg Pro Gly Ser Arg
145 150 155 160
Glu Ala Gly Glu Leu Lys Ala Leu Leu Ile Glu His Gly Met Trp Ser
165 170 175
Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Ala Glu Ile Phe Thr Lys
180 185 190
Ala Pro Leu Leu Ser Ala Leu Gly Thr Gly Thr Glu Ile Gly Leu His
195 200 205
Pro Gly Ser Ala Trp Asn Asn Pro Glu Pro Glu Ile Val Leu Ala Ile
210 215 220
Asn Ser Arg Gly Asp Val Leu Gly Ala Thr Leu Gly Asn Asp Val Asn
225 230 235 240
Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Gly Lys Ala Lys
245 250 255
Asp Asn Asn Gly Ser Cys Ala Ile Gly Pro Phe Leu Arg Leu Phe Asp
260 265 270
Gln Ser Phe Ser Leu Asp Asp Val Arg Arg Ala Thr Val Asp Leu Arg
275 280 285
Val Asp Gly Leu Asp Gly Phe Val Leu Ser Gly Thr Ser Ser Met Asp
290 295 300
Gln Ile Thr Arg Asp Pro Leu Glu Leu Ala Glu Gln Ala Met Gly Ala
305 310 315 320
Thr His Gln Tyr Pro Asp Gly Ala Met Leu Phe Leu Gly Thr Leu Phe
325 330 335
Ala Pro Val Glu Asp Arg Asp Thr Ala Gly Gly Gly Phe Thr His Lys
340 345 350
Gly Gly Asp Leu Val Thr Ile Ser Ser Arg Gln Leu Gly Ser Leu Val
355 360 365
Asn Arg Val Gly Arg Ser Asp Arg Ile Ala Pro Trp Thr Phe Gly Val
370 375 380
Arg Ala Leu Met Ala Asn Leu Ala Ala Arg Gly His Thr Thr Phe
385 390 395
<210> 90
<211> 1200
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 90
atggcgctgc cgctgaccct gagcgccacc cagacgctgc cggccgatgg tctggccggc 60
accctggtgg gccgtgcatg gattccggcc ggtgatggcg ttccggccgg tccggccgtg 120
gttgtgctgc gtccggatgg tgttttcgat atcagtgatg tggcgccgac catgagcacg 180
ctgctggaac aggatgatcc gctgaccgtt gtgcataacg ccccgggtcg ctggattggc 240
aaactggatg atctgctggc aaacacggcg gatccgcacg gttctaatgg tgtggcacgt 300
ctgctggcac cgtgcgatct gcaggttatt aaagcggccg gcgtgacctt tgccggtagt 360
ctggttgaac gcgtgatcga agaacagacg aaaggtgatc cgcagggcgc agcggaagtt 420
cgtaatcgta ttcaggcgct ggttggcgaa cgcctgagcc gtatccgccc gggttctcgt 480
gaagccggtg aactgaaagc cctgctgatt gaacatggca tgtggagcca gtatctggaa 540
gtgggtattg gcccggatgc cgaaatcttc accaaagcac cgctgctgag tgcgctgggc 600
accggcacgg aaatcggtct gcacccgggc agcgcatgga acaatccgga accggaaatt 660
gttctggcca tcaactctcg cggtgatgtg ctgggcgcaa ccctgggtaa cgatgttaat 720
ctgcgcgatt tcgaaggccg tagcgccctg ctgctgggta aagcaaaaga taacaatggc 780
tcttgtgcaa ttggtccgtt tctgcgcctg ttcgatcagt cttttagtct ggatgatgtg 840
cgtcgcgcga ccgttgatct gcgtgtggat ggtctggatg gctttgttct gagcggcacc 900
agctctatgg atcagatcac gcgtgatccg ctggaactgg ccgaacaggc aatgggtgcg 960
acccatcagt acccggatgg cgcgatgctg ttcctgggta cgctgtttgc accggtggaa 1020
gatcgcgata ccgcgggcgg tggctttacg cacaaaggtg gcgatctggt taccattagt 1080
agccgtcagc tgggctctct ggttaaccgt gtgggtcgca gtgatcgtat tgccccgtgg 1140
accttcggcg tgcgcgccct gatggcaaat ctggccgcac gtggtcatac cacgttttga 1200
<210> 91
<211> 1113
<212> DNA
<213> Pseudomonas elodea
<220>
<221> CDS
<222> (1)..(1113)
<400> 91
atg ctg cct gcc gat cat gcg cag gcg att ctg gtc ggc cgt gtg cag 48
Met Leu Pro Ala Asp His Ala Gln Ala Ile Leu Val Gly Arg Val Gln
1 5 10 15
acc ccg gcg ggc ccg agc ccc gtt ctc ctc cgc gat ggc cag gtg atc 96
Thr Pro Ala Gly Pro Ser Pro Val Leu Leu Arg Asp Gly Gln Val Ile
20 25 30
gac gtt tcg gcg atc gcg ccg acc gtc gcc gac ctg ctg gaa cgc gac 144
Asp Val Ser Ala Ile Ala Pro Thr Val Ala Asp Leu Leu Glu Arg Asp
35 40 45
gac atc gcg acg ctg agc ggc acg gtg ctg tgc agc gtc gac gcg ctc 192
Asp Ile Ala Thr Leu Ser Gly Thr Val Leu Cys Ser Val Asp Ala Leu
50 55 60
ggc acc gag tcg gcg ccg cag gtg ctg gct ccg gtc gac ctg cag tgc 240
Gly Thr Glu Ser Ala Pro Gln Val Leu Ala Pro Val Asp Leu Gln Cys
65 70 75 80
gtg aag gcc gcc ggc gtc acc ttc gcc gtc tcg gcg ctg gag cgc gtg 288
Val Lys Ala Ala Gly Val Thr Phe Ala Val Ser Ala Leu Glu Arg Val
85 90 95
atc gag gaa cgc gcc cgc ggc gat tcc gcc aag gcc gcc gag att cgc 336
Ile Glu Glu Arg Ala Arg Gly Asp Ser Ala Lys Ala Ala Glu Ile Arg
100 105 110
ggc gac ctc gaa gcc aag gtg ggt tcg ggc atc cgc tcg gtc gtc ccc 384
Gly Asp Leu Glu Ala Lys Val Gly Ser Gly Ile Arg Ser Val Val Pro
115 120 125
ggt acc gcc gag gcc gcg gcg ctc aag gcc gcg ctg atc gag gcg ggc 432
Gly Thr Ala Glu Ala Ala Ala Leu Lys Ala Ala Leu Ile Glu Ala Gly
130 135 140
atg tgg tcg caa tat ctc gaa gtg gcg atc ggg ccg gac gcg gag gtg 480
Met Trp Ser Gln Tyr Leu Glu Val Ala Ile Gly Pro Asp Ala Glu Val
145 150 155 160
ttc acc aag gcg ccg gtt ctg tcg gcg atg ggc tgg ggc gcc gag atc 528
Phe Thr Lys Ala Pro Val Leu Ser Ala Met Gly Trp Gly Ala Glu Ile
165 170 175
ggc atc cgc tcg gac agc gac tgg aac aat ccg gag ccg gaa gtg gtg 576
Gly Ile Arg Ser Asp Ser Asp Trp Asn Asn Pro Glu Pro Glu Val Val
180 185 190
ctg gtg gtc gac cgg aat ggt gcg atc aag ggc gcg acg ctc ggc aac 624
Leu Val Val Asp Arg Asn Gly Ala Ile Lys Gly Ala Thr Leu Gly Asn
195 200 205
gac gtc aac ctg cgc gac ttc gag ggc cgc agc gcg ctg ctg ctg ggc 672
Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Gly
210 215 220
aag gcg aag gac aac aat gcc tct acc gcg atc ggc ccg ttc atc cgc 720
Lys Ala Lys Asp Asn Asn Ala Ser Thr Ala Ile Gly Pro Phe Ile Arg
225 230 235 240
ctg ttc gat gac ggc ttc acg atg gac gac gtg cgt agc gcg gtg gtc 768
Leu Phe Asp Asp Gly Phe Thr Met Asp Asp Val Arg Ser Ala Val Val
245 250 255
gac ctc acc atc gac ggg ccg gag ggc tat cgc ctc tcg ggc acc aac 816
Asp Leu Thr Ile Asp Gly Pro Glu Gly Tyr Arg Leu Ser Gly Thr Asn
260 265 270
aag atg agc gag atc agc cga gat ccg acc gag ctc gtg cgc cag acg 864
Lys Met Ser Glu Ile Ser Arg Asp Pro Thr Glu Leu Val Arg Gln Thr
275 280 285
ctg agc gag cac cag tat ccg gac ggc ttc gcg ctg ttc ctc ggc acg 912
Leu Ser Glu His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Leu Gly Thr
290 295 300
ctg ttc gcg ccg gtg cag gat cgc gac cat ccc ggc cgc ggc ttc act 960
Leu Phe Ala Pro Val Gln Asp Arg Asp His Pro Gly Arg Gly Phe Thr
305 310 315 320
cac aag ccc ggc gat att gtc cgc att tcc acg ccg aag ctc ggc acg 1008
His Lys Pro Gly Asp Ile Val Arg Ile Ser Thr Pro Lys Leu Gly Thr
325 330 335
ctc gtc aac cgc gtc acc acg tcc aag gcc gcc gcg ccc tgg acg ttc 1056
Leu Val Asn Arg Val Thr Thr Ser Lys Ala Ala Ala Pro Trp Thr Phe
340 345 350
ggc atc cgc gat ctg atg cgc aat ctc gcc gcc cgc ggc ctt ctc tcg 1104
Gly Ile Arg Asp Leu Met Arg Asn Leu Ala Ala Arg Gly Leu Leu Ser
355 360 365
cat tcc taa 1113
His Ser
370
<210> 92
<211> 370
<212> PRT
<213> Pseudomonas elodea
<400> 92
Met Leu Pro Ala Asp His Ala Gln Ala Ile Leu Val Gly Arg Val Gln
1 5 10 15
Thr Pro Ala Gly Pro Ser Pro Val Leu Leu Arg Asp Gly Gln Val Ile
20 25 30
Asp Val Ser Ala Ile Ala Pro Thr Val Ala Asp Leu Leu Glu Arg Asp
35 40 45
Asp Ile Ala Thr Leu Ser Gly Thr Val Leu Cys Ser Val Asp Ala Leu
50 55 60
Gly Thr Glu Ser Ala Pro Gln Val Leu Ala Pro Val Asp Leu Gln Cys
65 70 75 80
Val Lys Ala Ala Gly Val Thr Phe Ala Val Ser Ala Leu Glu Arg Val
85 90 95
Ile Glu Glu Arg Ala Arg Gly Asp Ser Ala Lys Ala Ala Glu Ile Arg
100 105 110
Gly Asp Leu Glu Ala Lys Val Gly Ser Gly Ile Arg Ser Val Val Pro
115 120 125
Gly Thr Ala Glu Ala Ala Ala Leu Lys Ala Ala Leu Ile Glu Ala Gly
130 135 140
Met Trp Ser Gln Tyr Leu Glu Val Ala Ile Gly Pro Asp Ala Glu Val
145 150 155 160
Phe Thr Lys Ala Pro Val Leu Ser Ala Met Gly Trp Gly Ala Glu Ile
165 170 175
Gly Ile Arg Ser Asp Ser Asp Trp Asn Asn Pro Glu Pro Glu Val Val
180 185 190
Leu Val Val Asp Arg Asn Gly Ala Ile Lys Gly Ala Thr Leu Gly Asn
195 200 205
Asp Val Asn Leu Arg Asp Phe Glu Gly Arg Ser Ala Leu Leu Leu Gly
210 215 220
Lys Ala Lys Asp Asn Asn Ala Ser Thr Ala Ile Gly Pro Phe Ile Arg
225 230 235 240
Leu Phe Asp Asp Gly Phe Thr Met Asp Asp Val Arg Ser Ala Val Val
245 250 255
Asp Leu Thr Ile Asp Gly Pro Glu Gly Tyr Arg Leu Ser Gly Thr Asn
260 265 270
Lys Met Ser Glu Ile Ser Arg Asp Pro Thr Glu Leu Val Arg Gln Thr
275 280 285
Leu Ser Glu His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Leu Gly Thr
290 295 300
Leu Phe Ala Pro Val Gln Asp Arg Asp His Pro Gly Arg Gly Phe Thr
305 310 315 320
His Lys Pro Gly Asp Ile Val Arg Ile Ser Thr Pro Lys Leu Gly Thr
325 330 335
Leu Val Asn Arg Val Thr Thr Ser Lys Ala Ala Ala Pro Trp Thr Phe
340 345 350
Gly Ile Arg Asp Leu Met Arg Asn Leu Ala Ala Arg Gly Leu Leu Ser
355 360 365
His Ser
370
<210> 93
<211> 1113
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 93
atgctgccgg cggatcatgc ccaagcaatc ctggtcggtc gcgtccaaac cccggctggc 60
ccgtccccgg tcctgctgcg tgatggtcag gtcattgatg tgtccgcaat cgcaccgacc 120
gtggcagacc tgctggaacg tgatgacatt gccaccctga gcggtacggt gctgtgctct 180
gttgatgccc tgggcacgga aagcgcaccg caggtcctgg caccggtgga cctgcaatgt 240
gtcaaagcgg ccggtgttac cttcgcagtc tcagctctgg aacgcgtgat cgaagaacgt 300
gcacgcggtg attcggctaa agcagctgaa attcgtggcg acctggaagc gaaagtgggc 360
tcaggtatcc gctcggtggt tccgggcacg gcagaagcgg ccgcactgaa agctgcgctg 420
attgaagcgg gcatgtggtc acagtatctg gaagttgcga tcggcccgga tgccgaagtg 480
ttcaccaagg caccggttct gtcggctatg ggctggggtg cggaaattgg tatccgtagc 540
gattctgact ggaacaatcc ggaaccggaa gtcgtgctgg ttgtcgatcg caacggcgca 600
attaaaggtg ctacgctggg caacgatgtt aatctgcgtg actttgaagg tcgcagtgcc 660
ctgctgctgg gcaaagcaaa ggataacaat gcgtccaccg ccattggtcc gtttatccgt 720
ctgttcgatg acggctttac catggatgac gtgcgcagtg ccgtggttga tctgacgatt 780
gacggcccgg aaggttatcg tctgtccggc accaacaaga tgagtgaaat ctcccgtgat 840
ccgaccgaac tggttcgcca gacgctgagc gaacatcaat acccggatgg ttttgctctg 900
ttcctgggca cgctgttcgc accggttcaa gatcgtgacc atccgggccg cggttttacc 960
cacaaaccgg gtgatattgt ccgtatcagc accccgaagc tgggcacgct ggttaatcgc 1020
gtcaccacgt ctaaagccgc agctccgtgg accttcggta ttcgtgacct gatgcgtaat 1080
ctggcggctc gtggcctgct gtctcattcg tga 1113
<210> 94
<211> 1194
<212> DNA
<213> Zobellia galactanivorans
<220>
<221> CDS
<222> (1)..(1194)
<400> 94
atg aat tat atc gat tta aac cgc ctc ata ccg gaa tta gcg gaa aca 48
Met Asn Tyr Ile Asp Leu Asn Arg Leu Ile Pro Glu Leu Ala Glu Thr
1 5 10 15
ggc aca tgg ata ggc agg tgc atg gta ccg gca caa aaa gcg tac aat 96
Gly Thr Trp Ile Gly Arg Cys Met Val Pro Ala Gln Lys Ala Tyr Asn
20 25 30
ggt ata gct ggg ccc cac gtg gtg atg gcc cgc aaa gga aaa atc tac 144
Gly Ile Ala Gly Pro His Val Val Met Ala Arg Lys Gly Lys Ile Tyr
35 40 45
gac cta tcg gcc cac ttc aac tcc aca agt gag cta ttc aac tgt aag 192
Asp Leu Ser Ala His Phe Asn Ser Thr Ser Glu Leu Phe Asn Cys Lys
50 55 60
aac ccg gtt tcc cgc tta aaa gcc tta aac gat tta ccg gaa cta ggc 240
Asn Pro Val Ser Arg Leu Lys Ala Leu Asn Asp Leu Pro Glu Leu Gly
65 70 75 80
agc ctg aaa gat gcc ttg aaa aac gcc cta tac ttc aat cag aat cca 288
Ser Leu Lys Asp Ala Leu Lys Asn Ala Leu Tyr Phe Asn Gln Asn Pro
85 90 95
cta ctc ccc tac atc ata gcg cca aac gat ata caa gcc gta aaa gcc 336
Leu Leu Pro Tyr Ile Ile Ala Pro Asn Asp Ile Gln Ala Val Lys Ala
100 105 110
tgt ggt gta act ttt atc aaa agc ttg ctc gag agg gtc att gaa gaa 384
Cys Gly Val Thr Phe Ile Lys Ser Leu Leu Glu Arg Val Ile Glu Glu
115 120 125
aaa gca aaa ggc gat gcc cta gta gcg aac gac ata cgt caa acc att 432
Lys Ala Lys Gly Asp Ala Leu Val Ala Asn Asp Ile Arg Gln Thr Ile
130 135 140
tac gat acc tta ggc aac gac ttg agc aag gtt acc ccc ggt tca ccg 480
Tyr Asp Thr Leu Gly Asn Asp Leu Ser Lys Val Thr Pro Gly Ser Pro
145 150 155 160
gaa acc gaa aag ctc aag gag gaa tta cag aaa aaa ggc cta tgg tcg 528
Glu Thr Glu Lys Leu Lys Glu Glu Leu Gln Lys Lys Gly Leu Trp Ser
165 170 175
caa tac ctc gaa gtg ggc att ggc aag gat gcc gag gtt ttc acc aag 576
Gln Tyr Leu Glu Val Gly Ile Gly Lys Asp Ala Glu Val Phe Thr Lys
180 185 190
gcc caa ccc ttg tct gcc gtt ggt ttc gga gcg gag ata ggc gtt cta 624
Ala Gln Pro Leu Ser Ala Val Gly Phe Gly Ala Glu Ile Gly Val Leu
195 200 205
aag agt tcc aaa tgg aac aat ccg gaa cct gaa atc gtg ctc gcc gta 672
Lys Ser Ser Lys Trp Asn Asn Pro Glu Pro Glu Ile Val Leu Ala Val
210 215 220
tcc tcc tcg gga aaa atc gtc ggg gcc aca ctc ggc aac gac gta aac 720
Ser Ser Ser Gly Lys Ile Val Gly Ala Thr Leu Gly Asn Asp Val Asn
225 230 235 240
ctt cgc gat tac gaa ggt cgc agc gcc cta ttg ctc ggt gag gcg aaa 768
Leu Arg Asp Tyr Glu Gly Arg Ser Ala Leu Leu Leu Gly Glu Ala Lys
245 250 255
gac caa aac gga tct tgt gcc att ggc ccc ttg ttt cgc ttg ttc gat 816
Asp Gln Asn Gly Ser Cys Ala Ile Gly Pro Leu Phe Arg Leu Phe Asp
260 265 270
gag act ttt tcc cta gat gac gta aag gat tgc gat gta atg ttt tct 864
Glu Thr Phe Ser Leu Asp Asp Val Lys Asp Cys Asp Val Met Phe Ser
275 280 285
atg aag ggg aag gac aat ttc gcc act tcc gga agc aat aag atg aaa 912
Met Lys Gly Lys Asp Asn Phe Ala Thr Ser Gly Ser Asn Lys Met Lys
290 295 300
gag att agc cgt agt cct gaa aat tta gtg gcc cag gtc ata gga aaa 960
Glu Ile Ser Arg Ser Pro Glu Asn Leu Val Ala Gln Val Ile Gly Lys
305 310 315 320
aac cat caa tac cca gac ggg ctc gtg ctt ttc tta ggt act atg ttc 1008
Asn His Gln Tyr Pro Asp Gly Leu Val Leu Phe Leu Gly Thr Met Phe
325 330 335
gcc cct acg gaa gac cgc aat gga aaa ggt ttg ggt ttc acc cac aaa 1056
Ala Pro Thr Glu Asp Arg Asn Gly Lys Gly Leu Gly Phe Thr His Lys
340 345 350
aag gga gat caa gtc aac atc tct tct tcg cat ttg ggc aca ctc atc 1104
Lys Gly Asp Gln Val Asn Ile Ser Ser Ser His Leu Gly Thr Leu Ile
355 360 365
aat tgg gtg aac act tgt gac caa ata cca aag tgg gaa ttc ggc att 1152
Asn Trp Val Asn Thr Cys Asp Gln Ile Pro Lys Trp Glu Phe Gly Ile
370 375 380
ggt gct ttt acg aac tat att gta aaa cgg aat tta aaa tag 1194
Gly Ala Phe Thr Asn Tyr Ile Val Lys Arg Asn Leu Lys
385 390 395
<210> 95
<211> 397
<212> PRT
<213> Zobellia galactanivorans
<400> 95
Met Asn Tyr Ile Asp Leu Asn Arg Leu Ile Pro Glu Leu Ala Glu Thr
1 5 10 15
Gly Thr Trp Ile Gly Arg Cys Met Val Pro Ala Gln Lys Ala Tyr Asn
20 25 30
Gly Ile Ala Gly Pro His Val Val Met Ala Arg Lys Gly Lys Ile Tyr
35 40 45
Asp Leu Ser Ala His Phe Asn Ser Thr Ser Glu Leu Phe Asn Cys Lys
50 55 60
Asn Pro Val Ser Arg Leu Lys Ala Leu Asn Asp Leu Pro Glu Leu Gly
65 70 75 80
Ser Leu Lys Asp Ala Leu Lys Asn Ala Leu Tyr Phe Asn Gln Asn Pro
85 90 95
Leu Leu Pro Tyr Ile Ile Ala Pro Asn Asp Ile Gln Ala Val Lys Ala
100 105 110
Cys Gly Val Thr Phe Ile Lys Ser Leu Leu Glu Arg Val Ile Glu Glu
115 120 125
Lys Ala Lys Gly Asp Ala Leu Val Ala Asn Asp Ile Arg Gln Thr Ile
130 135 140
Tyr Asp Thr Leu Gly Asn Asp Leu Ser Lys Val Thr Pro Gly Ser Pro
145 150 155 160
Glu Thr Glu Lys Leu Lys Glu Glu Leu Gln Lys Lys Gly Leu Trp Ser
165 170 175
Gln Tyr Leu Glu Val Gly Ile Gly Lys Asp Ala Glu Val Phe Thr Lys
180 185 190
Ala Gln Pro Leu Ser Ala Val Gly Phe Gly Ala Glu Ile Gly Val Leu
195 200 205
Lys Ser Ser Lys Trp Asn Asn Pro Glu Pro Glu Ile Val Leu Ala Val
210 215 220
Ser Ser Ser Gly Lys Ile Val Gly Ala Thr Leu Gly Asn Asp Val Asn
225 230 235 240
Leu Arg Asp Tyr Glu Gly Arg Ser Ala Leu Leu Leu Gly Glu Ala Lys
245 250 255
Asp Gln Asn Gly Ser Cys Ala Ile Gly Pro Leu Phe Arg Leu Phe Asp
260 265 270
Glu Thr Phe Ser Leu Asp Asp Val Lys Asp Cys Asp Val Met Phe Ser
275 280 285
Met Lys Gly Lys Asp Asn Phe Ala Thr Ser Gly Ser Asn Lys Met Lys
290 295 300
Glu Ile Ser Arg Ser Pro Glu Asn Leu Val Ala Gln Val Ile Gly Lys
305 310 315 320
Asn His Gln Tyr Pro Asp Gly Leu Val Leu Phe Leu Gly Thr Met Phe
325 330 335
Ala Pro Thr Glu Asp Arg Asn Gly Lys Gly Leu Gly Phe Thr His Lys
340 345 350
Lys Gly Asp Gln Val Asn Ile Ser Ser Ser His Leu Gly Thr Leu Ile
355 360 365
Asn Trp Val Asn Thr Cys Asp Gln Ile Pro Lys Trp Glu Phe Gly Ile
370 375 380
Gly Ala Phe Thr Asn Tyr Ile Val Lys Arg Asn Leu Lys
385 390 395
<210> 96
<211> 1194
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 96
atgaactata ttgatctgaa tcgtctgatc ccggaactgg cggaaaccgg tacgtggatt 60
ggccgctgca tggtgccggc ccagaaagcc tataacggta tcgccggccc gcatgtggtt 120
atggcacgta aaggcaaaat ttacgatctg agcgcccact ttaatagtac cagcgaactg 180
ttcaactgta aaaatccggt tagccgcctg aaagcactga acgatctgcc ggaactgggt 240
tctctgaaag atgcgctgaa aaatgccctg tattttaacc agaatccgct gctgccgtac 300
attatcgcgc cgaacgatat tcaggcagtg aaagcgtgcg gcgttacctt catcaaaagc 360
ctgctggaac gtgtgattga agaaaaagcc aaaggtgatg ccctggttgc aaacgatatt 420
cgccagacca tctatgatac gctgggcaat gatctgagta aagtgacccc gggtagcccg 480
gaaacggaaa aactgaaaga agaactgcag aaaaaaggcc tgtggtctca gtacctggaa 540
gtgggcatcg gtaaagatgc cgaagttttt accaaagcac agccgctgag cgcggtgggt 600
tttggtgcag aaattggtgt tctgaaaagc tctaaatgga acaatccgga accggaaatc 660
gtgctggcgg ttagtagctc tggtaaaatt gtgggcgcca ccctgggtaa cgatgttaat 720
ctgcgtgatt acgaaggccg cagtgcactg ctgctgggtg aagcgaaaga tcagaatggc 780
agctgcgcga ttggtccgct gtttcgtctg ttcgatgaaa ccttttctct ggatgatgtg 840
aaggattgtg atgttatgtt cagtatgaag ggcaaggata acttcgcaac gtctggtagt 900
aacaagatga aggaaatcag ccgttctccg gaaaacctgg tggcgcaggt tattggcaaa 960
aatcatcagt atccggatgg cctggtgctg tttctgggca ccatgttcgc accgacggaa 1020
gatcgcaacg gcaaaggtct gggctttacc cataaaaaag gcgatcaagt gaatatcagt 1080
agctctcacc tgggcaccct gattaactgg gttaatacgt gtgatcagat tccgaaatgg 1140
gaatttggta tcggcgcgtt cacgaactac attgttaaac gcaatctgaa atag 1194
<210> 97
<211> 897
<212> DNA
<213> Thermobacillus composti
<220>
<221> CDS
<222> (1)..(897)
<400> 97
atg cgc att att cgt tac atc ggg gac gac gga gct gcg cgc ctc gcg 48
Met Arg Ile Ile Arg Tyr Ile Gly Asp Asp Gly Ala Ala Arg Leu Ala
1 5 10 15
gcg gtg acc gac gag gag cag gct ttc ccg ctc cgg tcg ccg gat ttc 96
Ala Val Thr Asp Glu Glu Gln Ala Phe Pro Leu Arg Ser Pro Asp Phe
20 25 30
atg gcg ctg gtg cgg gaa gcg gac gag gcg ggg atc acg ccg ctg gaa 144
Met Ala Leu Val Arg Glu Ala Asp Glu Ala Gly Ile Thr Pro Leu Glu
35 40 45
gcg gtg cgc cgt cag atc gcg ggc gca cag ccg ctg ccc ggc gac tgg 192
Ala Val Arg Arg Gln Ile Ala Gly Ala Gln Pro Leu Pro Gly Asp Trp
50 55 60
cgc gag ttg aac ctg ctg acg ccg gtg gat gcg ccc gag gtg tgg gcg 240
Arg Glu Leu Asn Leu Leu Thr Pro Val Asp Ala Pro Glu Val Trp Ala
65 70 75 80
gcc ggc gtc act tat gag cgc agc aaa gaa gcg cgc aac gag gag tcg 288
Ala Gly Val Thr Tyr Glu Arg Ser Lys Glu Ala Arg Asn Glu Glu Ser
85 90 95
aag ggc gcc gca acc ggc gac gaa acg ttc tac gac aag gtg tac cgg 336
Lys Gly Ala Ala Thr Gly Asp Glu Thr Phe Tyr Asp Lys Val Tyr Arg
100 105 110
gcc gag cgg ccg gag att ttc ttc aag tcg acg agc gcc cgc acg gcg 384
Ala Glu Arg Pro Glu Ile Phe Phe Lys Ser Thr Ser Ala Arg Thr Ala
115 120 125
cgg ccg ggc aca ccc gtc tgc atc cgc agc gac tcg gac tgg cag gtg 432
Arg Pro Gly Thr Pro Val Cys Ile Arg Ser Asp Ser Asp Trp Gln Val
130 135 140
ccc gag ccg gaa ctc ggc atc gtg ctg gac cgc ggc ggc cgc atc ctc 480
Pro Glu Pro Glu Leu Gly Ile Val Leu Asp Arg Gly Gly Arg Ile Leu
145 150 155 160
ggc tac acg gtc ggc aac gac atg agc tgc cgc gac atc gag ggc gag 528
Gly Tyr Thr Val Gly Asn Asp Met Ser Cys Arg Asp Ile Glu Gly Glu
165 170 175
aac ccg ctc tat ctg ccg cag gcg aaa atc tgg cgc cgc tcc tgt tcc 576
Asn Pro Leu Tyr Leu Pro Gln Ala Lys Ile Trp Arg Arg Ser Cys Ser
180 185 190
atc ggt ccg gcg atc cgg ctg gcc gaa acc gtg ccg aat ccg tat gac 624
Ile Gly Pro Ala Ile Arg Leu Ala Glu Thr Val Pro Asn Pro Tyr Asp
195 200 205
ctg acg atc acc tgc cgc atc tat cgg gac ggt caa ttg gcg gtg aac 672
Leu Thr Ile Thr Cys Arg Ile Tyr Arg Asp Gly Gln Leu Ala Val Asn
210 215 220
gag acg gcc aat acg ggg cag ctc cgg cgg aag ctg gac gaa ctg gcg 720
Glu Thr Ala Asn Thr Gly Gln Leu Arg Arg Lys Leu Asp Glu Leu Ala
225 230 235 240
tcc ttc ctc gtg cgg gac aac gtc gtg ttc gac ggc acc gtg ctg ctg 768
Ser Phe Leu Val Arg Asp Asn Val Val Phe Asp Gly Thr Val Leu Leu
245 250 255
acc ggc acc tgc atc gtg ccg ccc gac cgg ttc acg ctg cag ccc ggc 816
Thr Gly Thr Cys Ile Val Pro Pro Asp Arg Phe Thr Leu Gln Pro Gly
260 265 270
gac cgc atc gag atc gac att tcc ggc atc ggc acc ctg atc aac cct 864
Asp Arg Ile Glu Ile Asp Ile Ser Gly Ile Gly Thr Leu Ile Asn Pro
275 280 285
gtc gcg gcg gcg gac gcc gca atc cag gat taa 897
Val Ala Ala Ala Asp Ala Ala Ile Gln Asp
290 295
<210> 98
<211> 298
<212> PRT
<213> Thermobacillus composti
<400> 98
Met Arg Ile Ile Arg Tyr Ile Gly Asp Asp Gly Ala Ala Arg Leu Ala
1 5 10 15
Ala Val Thr Asp Glu Glu Gln Ala Phe Pro Leu Arg Ser Pro Asp Phe
20 25 30
Met Ala Leu Val Arg Glu Ala Asp Glu Ala Gly Ile Thr Pro Leu Glu
35 40 45
Ala Val Arg Arg Gln Ile Ala Gly Ala Gln Pro Leu Pro Gly Asp Trp
50 55 60
Arg Glu Leu Asn Leu Leu Thr Pro Val Asp Ala Pro Glu Val Trp Ala
65 70 75 80
Ala Gly Val Thr Tyr Glu Arg Ser Lys Glu Ala Arg Asn Glu Glu Ser
85 90 95
Lys Gly Ala Ala Thr Gly Asp Glu Thr Phe Tyr Asp Lys Val Tyr Arg
100 105 110
Ala Glu Arg Pro Glu Ile Phe Phe Lys Ser Thr Ser Ala Arg Thr Ala
115 120 125
Arg Pro Gly Thr Pro Val Cys Ile Arg Ser Asp Ser Asp Trp Gln Val
130 135 140
Pro Glu Pro Glu Leu Gly Ile Val Leu Asp Arg Gly Gly Arg Ile Leu
145 150 155 160
Gly Tyr Thr Val Gly Asn Asp Met Ser Cys Arg Asp Ile Glu Gly Glu
165 170 175
Asn Pro Leu Tyr Leu Pro Gln Ala Lys Ile Trp Arg Arg Ser Cys Ser
180 185 190
Ile Gly Pro Ala Ile Arg Leu Ala Glu Thr Val Pro Asn Pro Tyr Asp
195 200 205
Leu Thr Ile Thr Cys Arg Ile Tyr Arg Asp Gly Gln Leu Ala Val Asn
210 215 220
Glu Thr Ala Asn Thr Gly Gln Leu Arg Arg Lys Leu Asp Glu Leu Ala
225 230 235 240
Ser Phe Leu Val Arg Asp Asn Val Val Phe Asp Gly Thr Val Leu Leu
245 250 255
Thr Gly Thr Cys Ile Val Pro Pro Asp Arg Phe Thr Leu Gln Pro Gly
260 265 270
Asp Arg Ile Glu Ile Asp Ile Ser Gly Ile Gly Thr Leu Ile Asn Pro
275 280 285
Val Ala Ala Ala Asp Ala Ala Ile Gln Asp
290 295
<210> 99
<211> 897
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 99
atgcgtatta tccgctatat tggtgatgat ggtgccgcac gtctggcagc cgttaccgat 60
gaagaacagg catttccgct gcgttctccg gatttcatgg cgctggttcg cgaagcggat 120
gaagcgggta tcacgccgct ggaagcggtg cgtcgccaga ttgcgggtgc acagccgctg 180
ccgggtgatt ggcgcgaact gaacctgctg accccggtgg atgcaccgga agtttgggca 240
gcaggtgtga cgtacgaacg tagcaaagaa gcacgcaatg aagaatctaa aggcgcggcc 300
accggtgatg aaacctttta tgataaagtt taccgtgcgg aacgcccgga aatctttttc 360
aaaagcacct ctgcacgtac cgcccgtccg ggcaccccgg tgtgcattcg tagtgatagc 420
gattggcagg ttccggaacc ggaactgggt atcgtgctgg atcgtggcgg tcgcattctg 480
ggctataccg tgggtaacga tatgagctgc cgtgatatcg aaggcgaaaa tccgctgtac 540
ctgccgcagg ccaaaatttg gcgtcgctct tgtagtatcg gtccggccat tcgcctggca 600
gaaaccgttc cgaacccgta tgatctgacc atcacgtgcc gtatttaccg cgatggccag 660
ctggcggtga acgaaaccgc caatacgggt cagctgcgtc gcaaactgga tgaactggcg 720
agttttctgg ttcgcgataa cgtggttttc gatggcaccg ttctgctgac cggtacgtgc 780
atcgtgccgc cggatcgttt caccctgcag ccgggcgatc gcattgaaat cgatattagc 840
ggcatcggca ccctgattaa tccggtggca gcggccgatg cagcgattca ggattaa 897
<210> 100
<211> 1227
<212> DNA
<213> Arthrobacter globiformis
<220>
<221> CDS
<222> (1)..(1227)
<400> 100
gtg acc gcg ccg ccg att ccc ggg agt tcc gtt cct ccg gta acc tct 48
Val Thr Ala Pro Pro Ile Pro Gly Ser Ser Val Pro Pro Val Thr Ser
1 5 10 15
gtc ctt ccg gat gac gct ggc cag gcg ctg ctg gtt ggc cgg atc tgg 96
Val Leu Pro Asp Asp Ala Gly Gln Ala Leu Leu Val Gly Arg Ile Trp
20 25 30
gac ccc gcc acc ggc ggt ccc cgg gtg gtg gct ctc agc ggg gac tcc 144
Asp Pro Ala Thr Gly Gly Pro Arg Val Val Ala Leu Ser Gly Asp Ser
35 40 45
gcc gtc gac ctg acg cgc ctg gcc gga acc gtc tcg gaa ctg ctc gaa 192
Ala Val Asp Leu Thr Arg Leu Ala Gly Thr Val Ser Glu Leu Leu Glu
50 55 60
ctg cct gat cca gcc gcg gca gtc cgt gcg gcg ctc ctt gac ccg gca 240
Leu Pro Asp Pro Ala Ala Ala Val Arg Ala Ala Leu Leu Asp Pro Ala
65 70 75 80
ctg ggg gta cag cgg tgg gcg acg gcc gac gtc gtc gcc gcc tcg ctg 288
Leu Gly Val Gln Arg Trp Ala Thr Ala Asp Val Val Ala Ala Ser Leu
85 90 95
gcc ggt gac gca gca cgc ccg cac ctg ctc gca ccg gtt gac ctg cag 336
Ala Gly Asp Ala Ala Arg Pro His Leu Leu Ala Pro Val Asp Leu Gln
100 105 110
gtc atc aag gcc tgc ggc gtg acg ttt gtg gac agc atg atc gaa cgg 384
Val Ile Lys Ala Cys Gly Val Thr Phe Val Asp Ser Met Ile Glu Arg
115 120 125
gtg atc gag gaa agg tgc gcc ggc gac gcc gct cgg gcg gcc gag atg 432
Val Ile Glu Glu Arg Cys Ala Gly Asp Ala Ala Arg Ala Ala Glu Met
130 135 140
cgc gag ctt gtc ggg aag gcg ctc ggc gga agc atc gcc acg gtc cgg 480
Arg Glu Leu Val Gly Lys Ala Leu Gly Gly Ser Ile Ala Thr Val Arg
145 150 155 160
ccg ggg tcc ccg gag gcg gcc gag gcc aag cgc gtc ctg att gcc gag 528
Pro Gly Ser Pro Glu Ala Ala Glu Ala Lys Arg Val Leu Ile Ala Glu
165 170 175
ggg ctc tgg tcg cag tat ctc gag gtg ggc atc ggg ccg gac ccg gag 576
Gly Leu Trp Ser Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Pro Glu
180 185 190
gtg ttc acg aag gcg ccg gtg ctg tcc tcg gtg ggc ctg ggc gcg ggc 624
Val Phe Thr Lys Ala Pro Val Leu Ser Ser Val Gly Leu Gly Ala Gly
195 200 205
atc ggg att ccg cgg ttc tcc tcc tgg aac aac ccg gag ccg gaa ctg 672
Ile Gly Ile Pro Arg Phe Ser Ser Trp Asn Asn Pro Glu Pro Glu Leu
210 215 220
gtg ctg atc gtg acg tcc cgc ggc gag gtg gtg ggc gcc act ctg ggc 720
Val Leu Ile Val Thr Ser Arg Gly Glu Val Val Gly Ala Thr Leu Gly
225 230 235 240
aac gac gtc aac ctg cgc gac gtt gag ggc cgc agc gcc ctg ctg ctg 768
Asn Asp Val Asn Leu Arg Asp Val Glu Gly Arg Ser Ala Leu Leu Leu
245 250 255
ggc aag gcc aag gac aac aac gcg tcc agt gcc ctc gga cca ctg atc 816
Gly Lys Ala Lys Asp Asn Asn Ala Ser Ser Ala Leu Gly Pro Leu Ile
260 265 270
agg ctc ttc gac ggc agc ttc acg gtg gac acc ctc cgt gag gag gag 864
Arg Leu Phe Asp Gly Ser Phe Thr Val Asp Thr Leu Arg Glu Glu Glu
275 280 285
atc ctg ctg cgt gtc gaa ggc ctg gac ggc tac ctg ctg gag ggg cgg 912
Ile Leu Leu Arg Val Glu Gly Leu Asp Gly Tyr Leu Leu Glu Gly Arg
290 295 300
aac acg ctg gcg agg atc agc agg ccc ttc gag gag ctc gtg gcg gcc 960
Asn Thr Leu Ala Arg Ile Ser Arg Pro Phe Glu Glu Leu Val Ala Ala
305 310 315 320
acc cgc ggc agg cac cac cag tat ccg gac ggc ttc gca ctg ttc acc 1008
Thr Arg Gly Arg His His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Thr
325 330 335
ggc acg ctt ttc gca ccg acc cag gac cgc gac gag ccg ggg cag ggg 1056
Gly Thr Leu Phe Ala Pro Thr Gln Asp Arg Asp Glu Pro Gly Gln Gly
340 345 350
ttc acg cac aag cac ggg gat gtt gtg acc atc cgg agc cgc cac ctc 1104
Phe Thr His Lys His Gly Asp Val Val Thr Ile Arg Ser Arg His Leu
355 360 365
ggt gcc ctc atc aac cgg gtg ggc acg gca gag gag ctc ccg gag tgg 1152
Gly Ala Leu Ile Asn Arg Val Gly Thr Ala Glu Glu Leu Pro Glu Trp
370 375 380
acc ttc ggc ctg cgg cag ctg ttc ggc tac ctc gcg gag cag cgg cag 1200
Thr Phe Gly Leu Arg Gln Leu Phe Gly Tyr Leu Ala Glu Gln Arg Gln
385 390 395 400
gcg gag cta gct cag atg cag gag tag 1227
Ala Glu Leu Ala Gln Met Gln Glu
405
<210> 101
<211> 408
<212> PRT
<213> Arthrobacter globiformis
<400> 101
Val Thr Ala Pro Pro Ile Pro Gly Ser Ser Val Pro Pro Val Thr Ser
1 5 10 15
Val Leu Pro Asp Asp Ala Gly Gln Ala Leu Leu Val Gly Arg Ile Trp
20 25 30
Asp Pro Ala Thr Gly Gly Pro Arg Val Val Ala Leu Ser Gly Asp Ser
35 40 45
Ala Val Asp Leu Thr Arg Leu Ala Gly Thr Val Ser Glu Leu Leu Glu
50 55 60
Leu Pro Asp Pro Ala Ala Ala Val Arg Ala Ala Leu Leu Asp Pro Ala
65 70 75 80
Leu Gly Val Gln Arg Trp Ala Thr Ala Asp Val Val Ala Ala Ser Leu
85 90 95
Ala Gly Asp Ala Ala Arg Pro His Leu Leu Ala Pro Val Asp Leu Gln
100 105 110
Val Ile Lys Ala Cys Gly Val Thr Phe Val Asp Ser Met Ile Glu Arg
115 120 125
Val Ile Glu Glu Arg Cys Ala Gly Asp Ala Ala Arg Ala Ala Glu Met
130 135 140
Arg Glu Leu Val Gly Lys Ala Leu Gly Gly Ser Ile Ala Thr Val Arg
145 150 155 160
Pro Gly Ser Pro Glu Ala Ala Glu Ala Lys Arg Val Leu Ile Ala Glu
165 170 175
Gly Leu Trp Ser Gln Tyr Leu Glu Val Gly Ile Gly Pro Asp Pro Glu
180 185 190
Val Phe Thr Lys Ala Pro Val Leu Ser Ser Val Gly Leu Gly Ala Gly
195 200 205
Ile Gly Ile Pro Arg Phe Ser Ser Trp Asn Asn Pro Glu Pro Glu Leu
210 215 220
Val Leu Ile Val Thr Ser Arg Gly Glu Val Val Gly Ala Thr Leu Gly
225 230 235 240
Asn Asp Val Asn Leu Arg Asp Val Glu Gly Arg Ser Ala Leu Leu Leu
245 250 255
Gly Lys Ala Lys Asp Asn Asn Ala Ser Ser Ala Leu Gly Pro Leu Ile
260 265 270
Arg Leu Phe Asp Gly Ser Phe Thr Val Asp Thr Leu Arg Glu Glu Glu
275 280 285
Ile Leu Leu Arg Val Glu Gly Leu Asp Gly Tyr Leu Leu Glu Gly Arg
290 295 300
Asn Thr Leu Ala Arg Ile Ser Arg Pro Phe Glu Glu Leu Val Ala Ala
305 310 315 320
Thr Arg Gly Arg His His Gln Tyr Pro Asp Gly Phe Ala Leu Phe Thr
325 330 335
Gly Thr Leu Phe Ala Pro Thr Gln Asp Arg Asp Glu Pro Gly Gln Gly
340 345 350
Phe Thr His Lys His Gly Asp Val Val Thr Ile Arg Ser Arg His Leu
355 360 365
Gly Ala Leu Ile Asn Arg Val Gly Thr Ala Glu Glu Leu Pro Glu Trp
370 375 380
Thr Phe Gly Leu Arg Gln Leu Phe Gly Tyr Leu Ala Glu Gln Arg Gln
385 390 395 400
Ala Glu Leu Ala Gln Met Gln Glu
405
<210> 102
<211> 1227
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 102
atgaccgccc cgccgatccc gggttcgtcc gtgccgccgg tgacctctgt tctgccggat 60
gatgctggcc aagctctgct ggttggtcgt atttgggacc cggcaaccgg cggtccgcgt 120
gtggttgccc tgagcggtga tagcgcggtg gacctgaccc gtctggcagg cacggtgtct 180
gaactgctgg aactgccgga cccggcggcg gcggtgcgtg ctgcgctgct ggacccggcc 240
ctgggcgtcc agcgttgggc aaccgcagat gtcgtggcag caagcctggc aggtgacgct 300
gcacgtccgc atctgctggc accggtggat ctgcaagtta ttaaagcgtg cggcgtcacg 360
tttgtggact ctatgattga acgtgtgatc gaagaacgtt gtgcaggtga tgcagcacgt 420
gctgcggaaa tgcgcgaact ggtgggcaaa gctctgggcg gtagtatcgc aaccgttcgt 480
ccgggttccc cggaagccgc agaagcaaaa cgcgttctga ttgcagaagg tctgtggagc 540
cagtatctgg aagtgggcat cggtccggac ccggaagttt ttaccaaagc tccggtcctg 600
agctctgtgg gtctgggtgc aggtattggt atcccgcgtt tcagttcctg gaacaatccg 660
gaaccggaac tggttctgat tgtcacctca cgcggcgaag ttgtcggtgc aacgctgggc 720
aacgatgtta atctgcgtga cgtcgaaggt cgctcggctc tgctgctggg caaagcgaaa 780
gataacaatg cttcatcggc gctgggtccg ctgattcgtc tgtttgatgg cagtttcacc 840
gtggacacgc tgcgtgaaga agaaatcctg ctgcgcgttg aaggcctgga tggttatctg 900
ctggaaggtc gtaacaccct ggcacgtatc tcccgcccgt ttgaagaact ggtggctgcg 960
acgcgtggtc gccatcacca atacccggat ggttttgccc tgttcaccgg cacgctgttt 1020
gcaccgaccc aggatcgtga cgaaccgggc caaggtttca cccataaaca cggcgacgtg 1080
gttacgattc gtagtcgcca cctgggtgct ctgatcaatc gtgtgggcac cgcggaagaa 1140
ctgccggaat ggacgttcgg tctgcgccaa ctgtttggtt atctggcgga acaacgtcaa 1200
gcggaactgg ctcaaatgca ggaatga 1227
<210> 103
<211> 1446
<212> DNA
<213> Azospirillum brasilense
<220>
<221> CDS
<222> (1)..(1446)
<400> 103
atg gct aac gtg act tat acg gat acg caa ctg ctg atc gac ggc gag 48
Met Ala Asn Val Thr Tyr Thr Asp Thr Gln Leu Leu Ile Asp Gly Glu
1 5 10 15
tgg gtc gac gcc gcg agc ggc aag acg atc gac gtc gtg aac ccg gcg 96
Trp Val Asp Ala Ala Ser Gly Lys Thr Ile Asp Val Val Asn Pro Ala
20 25 30
acc ggc aag ccg atc ggc agg gtg gcc cat gcg ggc atc gcc gat ctc 144
Thr Gly Lys Pro Ile Gly Arg Val Ala His Ala Gly Ile Ala Asp Leu
35 40 45
gac cgt gcg ctc gcc gcc gcg caa agc ggc ttc gag gca tgg cgc aag 192
Asp Arg Ala Leu Ala Ala Ala Gln Ser Gly Phe Glu Ala Trp Arg Lys
50 55 60
gtg ccc gcg cac gag cgc gcg gcg acg atg cgc aag gcg gcc gcg ctg 240
Val Pro Ala His Glu Arg Ala Ala Thr Met Arg Lys Ala Ala Ala Leu
65 70 75 80
gtg cgt gaa cgc gcc gac gcg atc gcg cag ctg atg acg cag gag cag 288
Val Arg Glu Arg Ala Asp Ala Ile Ala Gln Leu Met Thr Gln Glu Gln
85 90 95
ggc aag ccg ctc acc gaa gcg cgc gtc gaa gtg ctg tcg gcg gcg gac 336
Gly Lys Pro Leu Thr Glu Ala Arg Val Glu Val Leu Ser Ala Ala Asp
100 105 110
atc atc gaa tgg ttc gcg gac gaa ggc cgc cgc gtg tac ggc cgg atc 384
Ile Ile Glu Trp Phe Ala Asp Glu Gly Arg Arg Val Tyr Gly Arg Ile
115 120 125
gtg ccg ccg cgc aac ctc ggc gca cag cag acg gtc gtg aag gag ccg 432
Val Pro Pro Arg Asn Leu Gly Ala Gln Gln Thr Val Val Lys Glu Pro
130 135 140
gtc ggc ccg gtc gcc gcg ttc acg ccg tgg aat ttc ccg gtc aac cag 480
Val Gly Pro Val Ala Ala Phe Thr Pro Trp Asn Phe Pro Val Asn Gln
145 150 155 160
gtc gtg cgc aag ctg agc gcc gcg ctg gca acc ggc tgt tcg ttc ctc 528
Val Val Arg Lys Leu Ser Ala Ala Leu Ala Thr Gly Cys Ser Phe Leu
165 170 175
gtg aaa gcg ccg gaa gaa acc ccc gcg tcg ccg gcc gcg ctg ctg cgc 576
Val Lys Ala Pro Glu Glu Thr Pro Ala Ser Pro Ala Ala Leu Leu Arg
180 185 190
gcc ttc gtc gac gca ggc gtg ccg gcc ggc gtg atc ggc ctc gtg tac 624
Ala Phe Val Asp Ala Gly Val Pro Ala Gly Val Ile Gly Leu Val Tyr
195 200 205
ggc gat ccg gcc gaa atc tcg tcg tac ctg atc ccg cac ccg gtg atc 672
Gly Asp Pro Ala Glu Ile Ser Ser Tyr Leu Ile Pro His Pro Val Ile
210 215 220
cgc aag gtc acg ttc acg ggt tcg acg ccg gtc ggc aag cag ctc gcc 720
Arg Lys Val Thr Phe Thr Gly Ser Thr Pro Val Gly Lys Gln Leu Ala
225 230 235 240
tcg ctg gcg ggc ctg cac atg aag cgc gcg acg atg gag ctg ggc ggg 768
Ser Leu Ala Gly Leu His Met Lys Arg Ala Thr Met Glu Leu Gly Gly
245 250 255
cac gca ccg gtg atc gtg gcc gaa gac gcc gac gtt gcg ctc gcg gtg 816
His Ala Pro Val Ile Val Ala Glu Asp Ala Asp Val Ala Leu Ala Val
260 265 270
aaa gcg gcc ggc ggc gcg aag ttc cgc aac gcg ggg cag gtc tgc atc 864
Lys Ala Ala Gly Gly Ala Lys Phe Arg Asn Ala Gly Gln Val Cys Ile
275 280 285
tcg ccg acg cgc ttc ctc gtg cac aac agc atc cgc gac gaa ttc acg 912
Ser Pro Thr Arg Phe Leu Val His Asn Ser Ile Arg Asp Glu Phe Thr
290 295 300
cgc gcg ctg gtc aag cat gcc gaa ggg ctg aag gtc ggc aac ggc ctc 960
Arg Ala Leu Val Lys His Ala Glu Gly Leu Lys Val Gly Asn Gly Leu
305 310 315 320
gag gaa ggc acg acg ctc ggc gcg ctc gcg aac ccg cgc cgg ctg acc 1008
Glu Glu Gly Thr Thr Leu Gly Ala Leu Ala Asn Pro Arg Arg Leu Thr
325 330 335
gcg atg gcg tcg gtc atc gac aac gcg cgc aag gtc ggt gcg agc atc 1056
Ala Met Ala Ser Val Ile Asp Asn Ala Arg Lys Val Gly Ala Ser Ile
340 345 350
gaa acc ggc ggc gag cgg atc ggc tcg gaa ggc aac ttc ttc gcg ccg 1104
Glu Thr Gly Gly Glu Arg Ile Gly Ser Glu Gly Asn Phe Phe Ala Pro
355 360 365
acc gtg atc gcg aac gtg ccg ctc gat gcg gac gtg ttc aac aac gag 1152
Thr Val Ile Ala Asn Val Pro Leu Asp Ala Asp Val Phe Asn Asn Glu
370 375 380
ccg ttc ggc ccg gtc gcg gcg att cgc ggt ttc gac aag ctc gaa gag 1200
Pro Phe Gly Pro Val Ala Ala Ile Arg Gly Phe Asp Lys Leu Glu Glu
385 390 395 400
gcg atc gcg gaa gcg aac cgt ttg ccg ttc ggt ctt gcc ggc tac gcg 1248
Ala Ile Ala Glu Ala Asn Arg Leu Pro Phe Gly Leu Ala Gly Tyr Ala
405 410 415
ttc acg cgt tcg ttc gcg aac gtg cac ctg ctc acg cag cgc ctc gaa 1296
Phe Thr Arg Ser Phe Ala Asn Val His Leu Leu Thr Gln Arg Leu Glu
420 425 430
gtc ggg atg ctg tgg atc aac cag ccg gcg acg ccg tgg ccg gaa atg 1344
Val Gly Met Leu Trp Ile Asn Gln Pro Ala Thr Pro Trp Pro Glu Met
435 440 445
ccg ttc ggc ggc gtg aag gac tcg ggc tac ggt tcg gaa ggc ggc ccg 1392
Pro Phe Gly Gly Val Lys Asp Ser Gly Tyr Gly Ser Glu Gly Gly Pro
450 455 460
gaa gcg ctc gag ccg tac ctg gtc acg aag tcg gtg acg gtg atg gcc 1440
Glu Ala Leu Glu Pro Tyr Leu Val Thr Lys Ser Val Thr Val Met Ala
465 470 475 480
gtc tga 1446
Val
<210> 104
<211> 481
<212> PRT
<213> Azospirillum brasilense
<400> 104
Met Ala Asn Val Thr Tyr Thr Asp Thr Gln Leu Leu Ile Asp Gly Glu
1 5 10 15
Trp Val Asp Ala Ala Ser Gly Lys Thr Ile Asp Val Val Asn Pro Ala
20 25 30
Thr Gly Lys Pro Ile Gly Arg Val Ala His Ala Gly Ile Ala Asp Leu
35 40 45
Asp Arg Ala Leu Ala Ala Ala Gln Ser Gly Phe Glu Ala Trp Arg Lys
50 55 60
Val Pro Ala His Glu Arg Ala Ala Thr Met Arg Lys Ala Ala Ala Leu
65 70 75 80
Val Arg Glu Arg Ala Asp Ala Ile Ala Gln Leu Met Thr Gln Glu Gln
85 90 95
Gly Lys Pro Leu Thr Glu Ala Arg Val Glu Val Leu Ser Ala Ala Asp
100 105 110
Ile Ile Glu Trp Phe Ala Asp Glu Gly Arg Arg Val Tyr Gly Arg Ile
115 120 125
Val Pro Pro Arg Asn Leu Gly Ala Gln Gln Thr Val Val Lys Glu Pro
130 135 140
Val Gly Pro Val Ala Ala Phe Thr Pro Trp Asn Phe Pro Val Asn Gln
145 150 155 160
Val Val Arg Lys Leu Ser Ala Ala Leu Ala Thr Gly Cys Ser Phe Leu
165 170 175
Val Lys Ala Pro Glu Glu Thr Pro Ala Ser Pro Ala Ala Leu Leu Arg
180 185 190
Ala Phe Val Asp Ala Gly Val Pro Ala Gly Val Ile Gly Leu Val Tyr
195 200 205
Gly Asp Pro Ala Glu Ile Ser Ser Tyr Leu Ile Pro His Pro Val Ile
210 215 220
Arg Lys Val Thr Phe Thr Gly Ser Thr Pro Val Gly Lys Gln Leu Ala
225 230 235 240
Ser Leu Ala Gly Leu His Met Lys Arg Ala Thr Met Glu Leu Gly Gly
245 250 255
His Ala Pro Val Ile Val Ala Glu Asp Ala Asp Val Ala Leu Ala Val
260 265 270
Lys Ala Ala Gly Gly Ala Lys Phe Arg Asn Ala Gly Gln Val Cys Ile
275 280 285
Ser Pro Thr Arg Phe Leu Val His Asn Ser Ile Arg Asp Glu Phe Thr
290 295 300
Arg Ala Leu Val Lys His Ala Glu Gly Leu Lys Val Gly Asn Gly Leu
305 310 315 320
Glu Glu Gly Thr Thr Leu Gly Ala Leu Ala Asn Pro Arg Arg Leu Thr
325 330 335
Ala Met Ala Ser Val Ile Asp Asn Ala Arg Lys Val Gly Ala Ser Ile
340 345 350
Glu Thr Gly Gly Glu Arg Ile Gly Ser Glu Gly Asn Phe Phe Ala Pro
355 360 365
Thr Val Ile Ala Asn Val Pro Leu Asp Ala Asp Val Phe Asn Asn Glu
370 375 380
Pro Phe Gly Pro Val Ala Ala Ile Arg Gly Phe Asp Lys Leu Glu Glu
385 390 395 400
Ala Ile Ala Glu Ala Asn Arg Leu Pro Phe Gly Leu Ala Gly Tyr Ala
405 410 415
Phe Thr Arg Ser Phe Ala Asn Val His Leu Leu Thr Gln Arg Leu Glu
420 425 430
Val Gly Met Leu Trp Ile Asn Gln Pro Ala Thr Pro Trp Pro Glu Met
435 440 445
Pro Phe Gly Gly Val Lys Asp Ser Gly Tyr Gly Ser Glu Gly Gly Pro
450 455 460
Glu Ala Leu Glu Pro Tyr Leu Val Thr Lys Ser Val Thr Val Met Ala
465 470 475 480
Val
<210> 105
<211> 1446
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 105
atggccaatg tgacctatac ggatacccag ctgctgatcg atggcgaatg ggttgatgcg 60
gccagcggta aaacgattga tgtggttaac ccggcgaccg gcaaaccgat cggtcgtgtg 120
gcccatgcag gcattgccga tctggatcgc gccctggcag ccgcacagtc tggttttgaa 180
gcctggcgta aagtgccggc acacgaacgt gcggccacca tgcgtaaagc ggcggcgctg 240
gtgcgtgaac gtgccgatgc catcgcacag ctgatgacgc aggaacaggg caaaccgctg 300
accgaagccc gcgtggaagt tctgtctgcc gcagatatta tcgaatggtt tgcggatgaa 360
ggccgtcgcg tgtacggtcg tattgttccg ccgcgcaatc tgggtgccca gcagaccgtg 420
gttaaagaac cggtgggtcc ggttgccgca tttaccccgt ggaacttccc ggtgaatcag 480
gtggttcgta aactgagcgc ggcgctggcc accggttgca gttttctggt taaagcgccg 540
gaagaaaccc cggcaagccc ggccgcactg ctgcgcgcgt ttgtggatgc gggcgttccg 600
gcaggtgtga ttggtctggt ttatggtgat ccggcggaaa ttagctctta cctgatcccg 660
catccggtga ttcgtaaagt tacgtttacc ggcagcaccc cggtgggtaa acagctggcg 720
tctctggccg gtctgcatat gaaacgcgca accatggaac tgggcggtca cgcgccggtg 780
attgttgcag aagatgcgga tgtggcgctg gcggttaaag ccgccggcgg tgcaaaattc 840
cgtaatgccg gtcaggtgtg catcagtccg acccgctttc tggttcataa cagcattcgt 900
gatgaattta cccgcgccct ggtgaaacac gcagaaggtc tgaaagttgg caacggtctg 960
gaagaaggca ccacgctggg tgcactggcc aatccgcgtc gcctgaccgc aatggcaagc 1020
gtgatcgata acgcgcgtaa agttggcgcc tctatcgaaa cgggcggtga acgcattggc 1080
agtgagggta actttttcgc accgaccgtg attgcgaatg ttccgctgga tgcggatgtt 1140
tttaacaatg aaccgtttgg cccggttgca gcgatccgtg gttttgataa actggaagaa 1200
gcgattgccg aagcaaaccg cctgccgttt ggcctggccg gttatgcatt tacgcgtagt 1260
ttcgccaatg tgcacctgct gacccagcgc ctggaagttg gtatgctgtg gatcaatcag 1320
ccggccaccc cgtggccgga aatgccgttt ggcggtgtga aagatagtgg ctatggtagc 1380
gaaggcggtc cggaagccct ggaaccgtac ctggtgacga aaagcgtgac cgttatggca 1440
gtttga 1446
<210> 106
<211> 1440
<212> DNA
<213> Halomonas boliviensis
<220>
<221> CDS
<222> (1)..(1440)
<400> 106
atg ggc gaa atg aac aac aat tta atc ggt ggc gta tgg cgc gag gcc 48
Met Gly Glu Met Asn Asn Asn Leu Ile Gly Gly Val Trp Arg Glu Ala
1 5 10 15
gat gat gtc tca gaa aac act aac ccc tcc gat gtg acg gat ctg atc 96
Asp Asp Val Ser Glu Asn Thr Asn Pro Ser Asp Val Thr Asp Leu Ile
20 25 30
ggg ctt tat gcc cgc ggc ggt gcc cag gat gtg acc gat gcc gcc gaa 144
Gly Leu Tyr Ala Arg Gly Gly Ala Gln Asp Val Thr Asp Ala Ala Glu
35 40 45
gcg gca gag gtc gca atg ccc gcc tgg gcc ggc gcg acc cct cag ctg 192
Ala Ala Glu Val Ala Met Pro Ala Trp Ala Gly Ala Thr Pro Gln Leu
50 55 60
cgc gct gat ctg ctg gac cgc gtg gcc gca gag atc acc cgc cgc gaa 240
Arg Ala Asp Leu Leu Asp Arg Val Ala Ala Glu Ile Thr Arg Arg Glu
65 70 75 80
gat gag att gcg acg atg ctg gcc tgc gaa gag ggt aag gtt ctg tta 288
Asp Glu Ile Ala Thr Met Leu Ala Cys Glu Glu Gly Lys Val Leu Leu
85 90 95
gaa gcg ctg gga gaa gtt cgc cgc gcc gcg cat gtg ttt cgt ttt ttc 336
Glu Ala Leu Gly Glu Val Arg Arg Ala Ala His Val Phe Arg Phe Phe
100 105 110
gcc gga gag gcg cta cgt ctg acg ggg gat gcc ctg gcc tcg gtg cga 384
Ala Gly Glu Ala Leu Arg Leu Thr Gly Asp Ala Leu Ala Ser Val Arg
115 120 125
ccc ggc gtg gat gtg gag gtg acc cgc gag ccg tta ggc att gtc ggt 432
Pro Gly Val Asp Val Glu Val Thr Arg Glu Pro Leu Gly Ile Val Gly
130 135 140
atc atc acc ccg tgg aac ttc ccc atc gcg att cct gcg tgg aaa att 480
Ile Ile Thr Pro Trp Asn Phe Pro Ile Ala Ile Pro Ala Trp Lys Ile
145 150 155 160
gcc cct gcc tta gct tat ggc aac tgc gtg atc ttt aag cca gcg gaa 528
Ala Pro Ala Leu Ala Tyr Gly Asn Cys Val Ile Phe Lys Pro Ala Glu
165 170 175
cag acg ccg ggc tca gcc cac ata ttg acc cag att att cat gag gcg 576
Gln Thr Pro Gly Ser Ala His Ile Leu Thr Gln Ile Ile His Glu Ala
180 185 190
ggc tgc ccg gcg ggt gtt ttc aat ctc gtt atg ggg cgt ggc tcc gtc 624
Gly Cys Pro Ala Gly Val Phe Asn Leu Val Met Gly Arg Gly Ser Val
195 200 205
gtc ggt gag gcg atg acc acg gat ccg cgc atc tcg gga att tcc ttt 672
Val Gly Glu Ala Met Thr Thr Asp Pro Arg Ile Ser Gly Ile Ser Phe
210 215 220
acc ggg tcg gtg cag gta ggg cgg cag ctg gct ggc gcc tgc gcg gcg 720
Thr Gly Ser Val Gln Val Gly Arg Gln Leu Ala Gly Ala Cys Ala Ala
225 230 235 240
aac atg aaa aaa ctt cag cta gag atg ggc ggt aag aac ccg gtg atc 768
Asn Met Lys Lys Leu Gln Leu Glu Met Gly Gly Lys Asn Pro Val Ile
245 250 255
gtg atg gac gac gcc gat ctg gaa acc gct gtt tct gtc tgt ctc aac 816
Val Met Asp Asp Ala Asp Leu Glu Thr Ala Val Ser Val Cys Leu Asn
260 265 270
ggt gcc ttt tac cag acg ggg cag cgc tgt acc gca tcg tcg cgt cta 864
Gly Ala Phe Tyr Gln Thr Gly Gln Arg Cys Thr Ala Ser Ser Arg Leu
275 280 285
atc gta cag tcg ggc atc cat gat gcc ttt atc gcg gaa ctc agt cgc 912
Ile Val Gln Ser Gly Ile His Asp Ala Phe Ile Ala Glu Leu Ser Arg
290 295 300
cag atg cag gcg ctc aag gtg ggg cat gcg ctc gcc gag ggg atg cag 960
Gln Met Gln Ala Leu Lys Val Gly His Ala Leu Ala Glu Gly Met Gln
305 310 315 320
att ggc ccc gtc gcc gcc cgg agt cag ctc gaa agc aat ctt tac tac 1008
Ile Gly Pro Val Ala Ala Arg Ser Gln Leu Glu Ser Asn Leu Tyr Tyr
325 330 335
gtg gcg ctc gcc gct gaa gag ggc tgc gat gta ttg ggt gga gag cag 1056
Val Ala Leu Ala Ala Glu Glu Gly Cys Asp Val Leu Gly Gly Glu Gln
340 345 350
ctc aca cgc gac act gaa ggg tat ttc cag gca ccc gca ctt ttc ctt 1104
Leu Thr Arg Asp Thr Glu Gly Tyr Phe Gln Ala Pro Ala Leu Phe Leu
355 360 365
ggg gcg agt aat gcc atg cgt agc gcc cgt gaa gag atc ttc ggc ccc 1152
Gly Ala Ser Asn Ala Met Arg Ser Ala Arg Glu Glu Ile Phe Gly Pro
370 375 380
tgt gcc agc gtg att cgt gtc gat gac ttt gaa gaa gca gta gcg ctg 1200
Cys Ala Ser Val Ile Arg Val Asp Asp Phe Glu Glu Ala Val Ala Leu
385 390 395 400
gcc aat gac acc cag ttc ggt ctg tcg tcg ggg att tgt acc acc aat 1248
Ala Asn Asp Thr Gln Phe Gly Leu Ser Ser Gly Ile Cys Thr Thr Asn
405 410 415
cta cgc tat gcg cgg gag ttc aag cgc cgt tct gcc gct ggc atg gtg 1296
Leu Arg Tyr Ala Arg Glu Phe Lys Arg Arg Ser Ala Ala Gly Met Val
420 425 430
atg ctc aac ttg ccg acc gcg ggc gtg gat tat cac gtg ccc ttt ggc 1344
Met Leu Asn Leu Pro Thr Ala Gly Val Asp Tyr His Val Pro Phe Gly
435 440 445
ggg cgt aaa gcg tcg agc ttc ggg tca cgt gag cag ggt agc tat gca 1392
Gly Arg Lys Ala Ser Ser Phe Gly Ser Arg Glu Gln Gly Ser Tyr Ala
450 455 460
gcc gaa ttc tat aca tcg gtg aaa acc gcc tat acg tat gcc ggt taa 1440
Ala Glu Phe Tyr Thr Ser Val Lys Thr Ala Tyr Thr Tyr Ala Gly
465 470 475
<210> 107
<211> 479
<212> PRT
<213> Halomonas boliviensis
<400> 107
Met Gly Glu Met Asn Asn Asn Leu Ile Gly Gly Val Trp Arg Glu Ala
1 5 10 15
Asp Asp Val Ser Glu Asn Thr Asn Pro Ser Asp Val Thr Asp Leu Ile
20 25 30
Gly Leu Tyr Ala Arg Gly Gly Ala Gln Asp Val Thr Asp Ala Ala Glu
35 40 45
Ala Ala Glu Val Ala Met Pro Ala Trp Ala Gly Ala Thr Pro Gln Leu
50 55 60
Arg Ala Asp Leu Leu Asp Arg Val Ala Ala Glu Ile Thr Arg Arg Glu
65 70 75 80
Asp Glu Ile Ala Thr Met Leu Ala Cys Glu Glu Gly Lys Val Leu Leu
85 90 95
Glu Ala Leu Gly Glu Val Arg Arg Ala Ala His Val Phe Arg Phe Phe
100 105 110
Ala Gly Glu Ala Leu Arg Leu Thr Gly Asp Ala Leu Ala Ser Val Arg
115 120 125
Pro Gly Val Asp Val Glu Val Thr Arg Glu Pro Leu Gly Ile Val Gly
130 135 140
Ile Ile Thr Pro Trp Asn Phe Pro Ile Ala Ile Pro Ala Trp Lys Ile
145 150 155 160
Ala Pro Ala Leu Ala Tyr Gly Asn Cys Val Ile Phe Lys Pro Ala Glu
165 170 175
Gln Thr Pro Gly Ser Ala His Ile Leu Thr Gln Ile Ile His Glu Ala
180 185 190
Gly Cys Pro Ala Gly Val Phe Asn Leu Val Met Gly Arg Gly Ser Val
195 200 205
Val Gly Glu Ala Met Thr Thr Asp Pro Arg Ile Ser Gly Ile Ser Phe
210 215 220
Thr Gly Ser Val Gln Val Gly Arg Gln Leu Ala Gly Ala Cys Ala Ala
225 230 235 240
Asn Met Lys Lys Leu Gln Leu Glu Met Gly Gly Lys Asn Pro Val Ile
245 250 255
Val Met Asp Asp Ala Asp Leu Glu Thr Ala Val Ser Val Cys Leu Asn
260 265 270
Gly Ala Phe Tyr Gln Thr Gly Gln Arg Cys Thr Ala Ser Ser Arg Leu
275 280 285
Ile Val Gln Ser Gly Ile His Asp Ala Phe Ile Ala Glu Leu Ser Arg
290 295 300
Gln Met Gln Ala Leu Lys Val Gly His Ala Leu Ala Glu Gly Met Gln
305 310 315 320
Ile Gly Pro Val Ala Ala Arg Ser Gln Leu Glu Ser Asn Leu Tyr Tyr
325 330 335
Val Ala Leu Ala Ala Glu Glu Gly Cys Asp Val Leu Gly Gly Glu Gln
340 345 350
Leu Thr Arg Asp Thr Glu Gly Tyr Phe Gln Ala Pro Ala Leu Phe Leu
355 360 365
Gly Ala Ser Asn Ala Met Arg Ser Ala Arg Glu Glu Ile Phe Gly Pro
370 375 380
Cys Ala Ser Val Ile Arg Val Asp Asp Phe Glu Glu Ala Val Ala Leu
385 390 395 400
Ala Asn Asp Thr Gln Phe Gly Leu Ser Ser Gly Ile Cys Thr Thr Asn
405 410 415
Leu Arg Tyr Ala Arg Glu Phe Lys Arg Arg Ser Ala Ala Gly Met Val
420 425 430
Met Leu Asn Leu Pro Thr Ala Gly Val Asp Tyr His Val Pro Phe Gly
435 440 445
Gly Arg Lys Ala Ser Ser Phe Gly Ser Arg Glu Gln Gly Ser Tyr Ala
450 455 460
Ala Glu Phe Tyr Thr Ser Val Lys Thr Ala Tyr Thr Tyr Ala Gly
465 470 475
<210> 108
<211> 1440
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic DNA
<400> 108
atgggcgaaa tgaacaataa cctgatcggc ggtgtttggc gtgaagccga tgatgtgagt 60
gaaaatacca acccgagcga tgtgacggat ctgattggcc tgtatgcccg cggcggtgca 120
caggatgtta ccgatgcggc cgaagcggcc gaagtggcaa tgccggcctg ggcaggtgca 180
acgccgcagc tgcgtgcgga tctgctggat cgcgttgccg cagaaatcac ccgtcgcgaa 240
gatgaaattg cgacgatgct ggcctgcgaa gaaggcaaag tgctgctgga agccctgggt 300
gaagttcgtc gcgcggccca tgtttttcgt ttctttgcag gtgaagccct gcgtctgacc 360
ggtgatgccc tggcatctgt tcgtccgggc gtggatgttg aagtgacccg cgaaccgctg 420
ggcatcgtgg gtattatcac gccgtggaat ttcccgattg ccatcccggc atggaaaatc 480
gcaccggcgc tggcctatgg caactgcgtt atttttaaac cggcagaaca gaccccgggt 540
agcgcgcata ttctgacgca gattatccac gaagcaggct gtccggcggg tgttttcaat 600
ctggtgatgg gccgtggtag cgtggttggt gaagcgatga ccacggatcc gcgcattagc 660
ggcatctctt ttaccggttc tgttcaagtg ggccgtcagc tggcaggtgc ctgcgcagcg 720
aatatgaaaa aactgcagct ggaaatgggc ggtaaaaacc cggttatcgt gatggatgat 780
gcggatctgg aaaccgccgt tagcgtgtgc ctgaacggcg cgttctatca gaccggtcag 840
cgttgtacgg ccagctctcg cctgattgtg cagtctggca tccatgatgc gtttattgcc 900
gaactgagtc gtcagatgca ggccctgaaa gttggtcacg ccctggcaga aggcatgcag 960
attggtccgg tggccgcacg cagtcagctg gaaagcaatc tgtattacgt tgcgctggcg 1020
gccgaagaag gctgtgatgt gctgggcggt gaacagctga cccgtgatac ggaaggctac 1080
tttcaggcgc cggccctgtt cctgggtgca tctaacgcga tgcgtagtgc ccgcgaagaa 1140
atctttggtc cgtgcgcaag tgttattcgc gtggatgatt tcgaagaagc agttgcgctg 1200
gccaatgata cccagtttgg cctgagtagc ggtatttgta ccacgaacct gcgttatgcg 1260
cgcgaattta aacgtcgcag cgcagcgggc atggtgatgc tgaatctgcc gaccgccggt 1320
gttgattacc acgtgccgtt tggcggtcgt aaagcgtcta gtttcggcag ccgcgaacag 1380
ggttcttatg ccgcagaatt ttacaccagc gtgaaaaccg cctatacgta cgcaggttaa 1440
<210> 109
<211> 1467
<212> DNA
<213> Bacillus subtilis
<220>
<221> CDS
<222> (1)..(1467)
<400> 109
atg tct gtg atc acg gaa caa aac acg tac ctc aac ttt att aac gga 48
Met Ser Val Ile Thr Glu Gln Asn Thr Tyr Leu Asn Phe Ile Asn Gly
1 5 10 15
gag tgg gtt aag tct caa tca ggc gat atg gtc aaa gtc gaa aac cct 96
Glu Trp Val Lys Ser Gln Ser Gly Asp Met Val Lys Val Glu Asn Pro
20 25 30
gcc gat gtg aat gat att gtc gga tat gta cag aat tca acg gct gaa 144
Ala Asp Val Asn Asp Ile Val Gly Tyr Val Gln Asn Ser Thr Ala Glu
35 40 45
gat gtg gaa cgt gcc gtc acc gcc gcc aat gaa gcc aaa acg gct tgg 192
Asp Val Glu Arg Ala Val Thr Ala Ala Asn Glu Ala Lys Thr Ala Trp
50 55 60
aga aag ctg acg ggt gcc gag cgc ggc caa tac tta tac aaa aca gcg 240
Arg Lys Leu Thr Gly Ala Glu Arg Gly Gln Tyr Leu Tyr Lys Thr Ala
65 70 75 80
gat atc atg gag cag cgc ttg gag gaa atc gcc gcc tgt gca acg cgt 288
Asp Ile Met Glu Gln Arg Leu Glu Glu Ile Ala Ala Cys Ala Thr Arg
85 90 95
gaa atg ggt aaa aca ttg ccg gaa gcg aag gga gaa aca gcc cgg ggg 336
Glu Met Gly Lys Thr Leu Pro Glu Ala Lys Gly Glu Thr Ala Arg Gly
100 105 110
att gcc att ctg cgc tat tac gcc gga gag ggc atg cga aaa acg ggt 384
Ile Ala Ile Leu Arg Tyr Tyr Ala Gly Glu Gly Met Arg Lys Thr Gly
115 120 125
gac gtc att ccg tct act gac aaa gac gcg ctc atg ttt acc acc cgt 432
Asp Val Ile Pro Ser Thr Asp Lys Asp Ala Leu Met Phe Thr Thr Arg
130 135 140
gtt ccg ctc ggt gtg gtc ggt gtg att tct ccg tgg aac ttc cca gtg 480
Val Pro Leu Gly Val Val Gly Val Ile Ser Pro Trp Asn Phe Pro Val
145 150 155 160
gcg att ccg att tgg aaa atg gcg ccg gca ttg gta tac ggc aat acc 528
Ala Ile Pro Ile Trp Lys Met Ala Pro Ala Leu Val Tyr Gly Asn Thr
165 170 175
gtt gtc atc aaa ccg gcg aca gaa aca gct gtg aca tgc gcg aag atc 576
Val Val Ile Lys Pro Ala Thr Glu Thr Ala Val Thr Cys Ala Lys Ile
180 185 190
att gcc tgc ttt gag gaa gcg ggg ctc ccg gca ggg gtc atc aat ttg 624
Ile Ala Cys Phe Glu Glu Ala Gly Leu Pro Ala Gly Val Ile Asn Leu
195 200 205
gtg aca ggc ccg ggt tct gtt gtc ggg cag ggg ctt gct gag cat gac 672
Val Thr Gly Pro Gly Ser Val Val Gly Gln Gly Leu Ala Glu His Asp
210 215 220
ggt gta aac gcc gtt acg ttt acc ggt tca aat caa gtc gga aaa atc 720
Gly Val Asn Ala Val Thr Phe Thr Gly Ser Asn Gln Val Gly Lys Ile
225 230 235 240
atc ggg caa gcc gct tta gcg agg gga gcc aaa tat cag ctt gag atg 768
Ile Gly Gln Ala Ala Leu Ala Arg Gly Ala Lys Tyr Gln Leu Glu Met
245 250 255
ggc ggc aaa aac cct gtc atc gta gct gat gac gct gac ctt gaa gct 816
Gly Gly Lys Asn Pro Val Ile Val Ala Asp Asp Ala Asp Leu Glu Ala
260 265 270
gcg gca gaa gct gtc ata acg ggg gcc ttc cgt tca acc ggc cag aaa 864
Ala Ala Glu Ala Val Ile Thr Gly Ala Phe Arg Ser Thr Gly Gln Lys
275 280 285
tgc acc gcg aca agc cgt gtc atc gta caa agc gga att tac gag cgc 912
Cys Thr Ala Thr Ser Arg Val Ile Val Gln Ser Gly Ile Tyr Glu Arg
290 295 300
ttt aaa gaa aaa ctg ctc cag cgc aca aaa gat att aca atc gga gac 960
Phe Lys Glu Lys Leu Leu Gln Arg Thr Lys Asp Ile Thr Ile Gly Asp
305 310 315 320
agc tta aaa gag gat gtc tgg atg gga ccg ata gcc agc aag aat cag 1008
Ser Leu Lys Glu Asp Val Trp Met Gly Pro Ile Ala Ser Lys Asn Gln
325 330 335
ctt gat aac tgc ctg tca tac att gag aaa ggc aaa cag gag ggc gct 1056
Leu Asp Asn Cys Leu Ser Tyr Ile Glu Lys Gly Lys Gln Glu Gly Ala
340 345 350
tcc ctt tta ata gga gga gaa aag ctg gag aac gga aag tat caa aac 1104
Ser Leu Leu Ile Gly Gly Glu Lys Leu Glu Asn Gly Lys Tyr Gln Asn
355 360 365
ggc tat tat gtt cag cct gcc atc ttt gac aat gtg aca tct gag atg 1152
Gly Tyr Tyr Val Gln Pro Ala Ile Phe Asp Asn Val Thr Ser Glu Met
370 375 380
aca att gcc cag gag gaa att ttc ggt ccg gtg atc gcc ttg atc aag 1200
Thr Ile Ala Gln Glu Glu Ile Phe Gly Pro Val Ile Ala Leu Ile Lys
385 390 395 400
gtg gac tcg ata gag gag gcg ctg aac atc gcc aat gat gtg aag ttc 1248
Val Asp Ser Ile Glu Glu Ala Leu Asn Ile Ala Asn Asp Val Lys Phe
405 410 415
ggt tta agt gca tcc atc ttc acg gaa aac atc ggc cga atg ctt tct 1296
Gly Leu Ser Ala Ser Ile Phe Thr Glu Asn Ile Gly Arg Met Leu Ser
420 425 430
ttc att gat gaa atc gat gcc ggg ctg gtt cgg atc aat gca gaa agc 1344
Phe Ile Asp Glu Ile Asp Ala Gly Leu Val Arg Ile Asn Ala Glu Ser
435 440 445
gca ggt gtt gag ctg cag gcg cct ttt ggc ggc atg aag cag tcg agc 1392
Ala Gly Val Glu Leu Gln Ala Pro Phe Gly Gly Met Lys Gln Ser Ser
450 455 460
tcc cac tcc cga gaa cag ggt gag gca gcg aag gac ttt ttc aca gcg 1440
Ser His Ser Arg Glu Gln Gly Glu Ala Ala Lys Asp Phe Phe Thr Ala
465 470 475 480
atc aaa act gtt ttt gtg aag ccg taa 1467
Ile Lys Thr Val Phe Val Lys Pro
485
<210> 110
<211> 488
<212> PRT
<213> Bacillus subtilis
<400> 110
Met Ser Val Ile Thr Glu Gln Asn Thr Tyr Leu Asn Phe Ile Asn Gly
1 5 10 15
Glu Trp Val Lys Ser Gln Ser Gly Asp Met Val Lys Val Glu Asn Pro
20 25 30
Ala Asp Val Asn Asp Ile Val Gly Tyr Val Gln Asn Ser Thr Ala Glu
35 40 45
Asp Val Glu Arg Ala Val Thr Ala Ala Asn Glu Ala Lys Thr Ala Trp
50 55 60
Arg Lys Leu Thr Gly Ala Glu Arg Gly Gln Tyr Leu Tyr Lys Thr Ala
65 70 75 80
Asp Ile Met Glu Gln Arg Leu Glu Glu Ile Ala Ala Cys Ala Thr Arg
85 90 95
Glu Met Gly Lys Thr Leu Pro Glu Ala Lys Gly Glu Thr Ala Arg Gly
100 105 110
Ile Ala Ile Leu Arg Tyr Tyr Ala Gly Glu Gly Met Arg Lys Thr Gly
115 120 125
Asp Val Ile Pro Ser Thr Asp Lys Asp Ala Leu Met Phe Thr Thr Arg
130 135 140
Val Pro Leu Gly Val Val Gly Val Ile Ser Pro Trp Asn Phe Pro Val
145 150 155 160
Ala Ile Pro Ile Trp Lys Met Ala Pro Ala Leu Val Tyr Gly Asn Thr
165 170 175
Val Val Ile Lys Pro Ala Thr Glu Thr Ala Val Thr Cys Ala Lys Ile
180 185 190
Ile Ala Cys Phe Glu Glu Ala Gly Leu Pro Ala Gly Val Ile Asn Leu
195 200 205
Val Thr Gly Pro Gly Ser Val Val Gly Gln Gly Leu Ala Glu His Asp
210 215 220
Gly Val Asn Ala Val Thr Phe Thr Gly Ser Asn Gln Val Gly Lys Ile
225 230 235 240
Ile Gly Gln Ala Ala Leu Ala Arg Gly Ala Lys Tyr Gln Leu Glu Met
245 250 255
Gly Gly Lys Asn Pro Val Ile Val Ala Asp Asp Ala Asp Leu Glu Ala
260 265 270
Ala Ala Glu Ala Val Ile Thr Gly Ala Phe Arg Ser Thr Gly Gln Lys
275 280 285
Cys Thr Ala Thr Ser Arg Val Ile Val Gln Ser Gly Ile Tyr Glu Arg
290 295 300
Phe Lys Glu Lys Leu Leu Gln Arg Thr Lys Asp Ile Thr Ile Gly Asp
305 310 315 320
Ser Leu Lys Glu Asp Val Trp Met Gly Pro Ile Ala Ser Lys Asn Gln
325 330 335
Leu Asp Asn Cys Leu Ser Tyr Ile Glu Lys Gly Lys Gln Glu Gly Ala
340 345 350
Ser Leu Leu Ile Gly Gly Glu Lys Leu Glu Asn Gly Lys Tyr Gln Asn
355 360 365
Gly Tyr Tyr Val Gln Pro Ala Ile Phe Asp Asn Val Thr Ser Glu Met
370 375 380
Thr Ile Ala Gln Glu Glu Ile Phe Gly Pro Val Ile Ala Leu Ile Lys
385 390 395 400
Val Asp Ser Ile Glu Glu Ala Leu Asn Ile Ala Asn Asp Val Lys Phe
405 410 415
Gly Leu Ser Ala Ser Ile Phe Thr Glu Asn Ile Gly Arg Met Leu Ser
420 425 430
Phe Ile Asp Glu Ile Asp Ala Gly Leu Val Arg Ile Asn Ala Glu Ser
435 440 445
Ala Gly Val Glu Leu Gln Ala Pro Phe Gly Gly Met Lys Gln Ser Ser
450 455 460
Ser His Ser Arg Glu Gln Gly Glu Ala Ala Lys Asp Phe Phe Thr Ala
465 470 475 480
Ile Lys Thr Val Phe Val Lys Pro
485
<210> 111
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ptac_xylXABC_F
<400> 111
tgcgaagggc cttcggagcg atccggaggc 30
<210> 112
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ptac_xylXABC_R
<400> 112
cgaaggccct tcgcattaga catggcggac ctcatg 36
<210> 113
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ptac_xylABCD_F
<400> 113
caatttcaca caggaggatg accgacaccc tgcgcc 36
<210> 114
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ptac_xylABCD_R
<400> 114
cctcctgtgt gaaattgtta tccgctcacg 30
<210> 115
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ptac_xylXBCD_F
<400> 115
cgaaagcttc ccgcgatgtc ctcagccatc tatcc 35
<210> 116
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> primer Ptac_xylXBCD_R
<400> 116
cgcgggaagc tttcgattag aggaggccgc 30
<210> 117
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> primer yjhG_F
<400> 117
cacaaggaga ctcccatgtc tgttcgcaat atttttg 37
<210> 118
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer yjhG_R
<400> 118
gaactggcgg ctccctcagt ttttattcat aaaatc 36
<210> 119
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer yagF_F
<400> 119
cacaaggaga ctcccatgac cattgagaaa attttc 36
<210> 120
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer yagF_R
<400> 120
gaactggcgg ctcccttaaa ttccgagcgc ttttttac 38
Claims (16)
- 목적 물질을 생산하는 능력을 갖는 세균을, 탄소원으로서 크실로스를 함유하는 배지에서 배양하여, 목적 물질을 당해 배지 중에 생성 축적시키고, 당해 배지로부터 목적 물질을 채취하는, 목적 물질의 제조 방법으로서,
상기 목적 물질은 2-케토글루타르산 또는 이의 유도체이고,
상기 세균은, 크실로스로부터 크실론산을 생성하는 능력을 갖고, 또한, 크실로네이트데히드라타제 활성, 2-케토-3-데옥시크실로네이트데히드라타제 활성, 및 2-케토글루타르산 세미알데히드데히드로게나제 활성이 부여 또는 증강된 것을 특징으로 하는 방법. - 제1항에 있어서, 상기 세균은, 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제를 각각 코드화하는 유전자가 발현 가능한 형태로 도입됨으로써, 이들 효소 활성이 부여 또는 증강된 것을 특징으로 하는, 방법.
- 제1항 또는 제2항에 있어서, 크실로네이트데히드라타제, 2-케토-3-데옥시크실로네이트데히드라타제, 및 2-케토글루타르산 세미알데히드데히드로게나제를 코드화하는 유전자가 카울로박터(Caulobacter)속, 에스케리키아(Escherichia)속, 아그로박테리움(Agrobacterium)속, 헤르바스피릴룸(Herbaspirillum)속, 악티노플라네스(Actinoplanes)속, 쿠프리아비두스(Cupriavidus)속, 슈도모나스(Pseudomonas)속, 조벨리아(Zobellia), 써모바실루스(Thermobacillus)속, 아스로박터(Arthrobacter)속, 아조스피릴리움(Azospirillum)속, 할로모나스(Halomonas)속, 바실루스(Bacillus)속, 또는 아스페르길루스(Aspergillus)속에 속하는 미생물 유래인, 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 세균은, 하기 중 어느 하나에 의해 크실로스로부터 크실론산을 생성할 수 있는 것을 특징으로 하는, 방법:
(A) 크실로스데히드로게나제 활성, 또는 크실로스데히드로게나제 및 크실로노락토나제 활성을 부여 또는 증강시킴, 또는,
(B) 크실로스로부터 크실론산을 생성하는 반응을 촉매할 수 있는 글루코스데히드로게나제 활성을 가짐. - 제4항에 있어서, 상기 글루코스데히드로게나제는 피롤로퀴놀린퀴논을 조효소로 하고, 또한, 상기 세균은, 피롤로퀴놀린퀴논 생산능을 갖거나, 또는 피롤로퀴놀린퀴논을 함유하는 배지에서 배양됨으로써 글루코스데히드로게나제 활성을 갖는, 방법.
- 제4항에 있어서, 상기 세균은, 크실로스데히드로게나제, 또는 크실로스데히드로게나제 및 크실로노락토나제를 각각 코드화하는 유전자가 발현 가능한 형태로 도입됨으로써, 크실로스로부터 크실론산을 생성할 수 있는, 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 세균은, 2-케토글루타르산데히드로게나제의 활성이 저하되도록 추가로 개변(改變)된 것을 특징으로 하는, 방법.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 세균은, 석신산데히드로게나제의 활성이 저하되도록 추가로 개변된 것을 특징으로 하는, 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 세균이 장내 세균 또는 코리네형(coryneform) 세균인 것을 특징으로 하는, 방법.
- 제9항에 있어서, 상기 세균이 판토에아(Pantoea)속 세균인 것을 특징으로 하는, 방법.
- 제10항에 있어서, 상기 세균이 판토에아·아나나티스(Pantoea ananatis)인 것을 특징으로 하는, 방법.
- 제9항에 있어서, 상기 세균이 에스케리키아(Escherichia)속 세균인 것을 특징으로 하는, 방법.
- 제12항에 있어서, 상기 세균이 에스케리키아·콜라이(Escherichia coli)인 것을 특징으로 하는, 방법.
- 제9항에 있어서, 상기 세균이 코리네박테리움(Corynebacterium)속 세균인 것을 특징으로 하는, 방법.
- 제14항에 있어서, 상기 세균이 코리네박테리움·글루타미쿰(Corynebacterium glutamicum)인 것을 특징으로 하는, 방법.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 2-케토글루타르산 유도체가, L-글루탐산, L-글루타민, L-아르기닌, L-시트룰린, L-오르니틴, L-프롤린, 푸트레신, 및 γ-아미노부티르산으로 이루어지는 그룹으로부터 선택되는 물질인, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161558685P | 2011-11-11 | 2011-11-11 | |
JPJP-P-2011-247031 | 2011-11-11 | ||
JP2011247031 | 2011-11-11 | ||
US61/558,685 | 2011-11-11 | ||
PCT/JP2012/078725 WO2013069634A1 (ja) | 2011-11-11 | 2012-11-06 | 発酵法による目的物質の製造法 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140091742A true KR20140091742A (ko) | 2014-07-22 |
Family
ID=48290008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147015776A KR20140091742A (ko) | 2011-11-11 | 2012-11-06 | 발효법에 의한 목적 물질의 제조법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US9045789B2 (ko) |
EP (1) | EP2778228B1 (ko) |
JP (1) | JPWO2013069634A1 (ko) |
KR (1) | KR20140091742A (ko) |
CN (1) | CN103930557A (ko) |
BR (1) | BR112013016373B1 (ko) |
MY (1) | MY173771A (ko) |
PE (1) | PE20141569A1 (ko) |
WO (1) | WO2013069634A1 (ko) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2014265243B2 (en) * | 2013-05-17 | 2018-04-26 | Xyleco, Inc. | Processing Biomass |
JP2016165225A (ja) | 2013-07-09 | 2016-09-15 | 味の素株式会社 | 有用物質の製造方法 |
EP3061828A4 (en) | 2013-10-23 | 2017-03-15 | Ajinomoto Co., Inc. | Method for producing target substance |
JPWO2015080273A1 (ja) | 2013-11-28 | 2017-03-16 | 味の素株式会社 | イソプレンモノマーの製造方法 |
SI3077501T1 (sl) | 2013-12-03 | 2022-02-28 | Genomatica, Inc. | Mikroorganizmi in metode za izboljšanje donosa izdelkov z uporabo sinteze acetil-coa |
RU2014112066A (ru) | 2014-03-28 | 2015-10-10 | Адзиномото Ко., Инк. | Способ получения мономерного изопрена |
JP2017216881A (ja) | 2014-12-26 | 2017-12-14 | 味の素株式会社 | ジカルボン酸の製造方法 |
JP6881448B2 (ja) | 2015-10-27 | 2021-06-02 | 味の素株式会社 | アルデヒドの製造方法 |
JP6623690B2 (ja) | 2015-10-30 | 2019-12-25 | 味の素株式会社 | グルタミン酸系l−アミノ酸の製造法 |
JP7107225B2 (ja) | 2016-01-12 | 2022-07-27 | 味の素株式会社 | ベンズアルデヒドの製造方法 |
KR101774431B1 (ko) | 2016-01-28 | 2017-09-05 | 한국과학기술원 | 자일로즈로부터 폴리(락테이트-co-글라이콜레이트) 또는 그 공중합체 생산능을 가지는 재조합 미생물 및 이를 이용한 폴리(락테이트-co-글라이콜레이트) 또는 그 공중합체의 제조방법 |
DE102016007810B4 (de) | 2016-06-25 | 2023-12-07 | Forschungszentrum Jülich GmbH | Verfahren zur Herstellung von D-Xylonat |
WO2018074579A1 (ja) | 2016-10-21 | 2018-04-26 | 味の素株式会社 | タンパク質の分泌生産法 |
JP7021639B2 (ja) | 2016-10-21 | 2022-02-17 | 味の素株式会社 | タンパク質の分泌生産法 |
CN109937257B (zh) | 2016-10-26 | 2023-06-30 | 味之素株式会社 | 生产目标物质的方法 |
CN109890972B (zh) | 2016-10-26 | 2022-11-08 | 味之素株式会社 | 生产目标物质的方法 |
JP7188385B2 (ja) | 2016-10-26 | 2022-12-13 | 味の素株式会社 | L-メチオニンまたは合成にs-アデノシルメチオニンを要求する代謝物の製造方法 |
WO2018079683A1 (en) | 2016-10-26 | 2018-05-03 | Ajinomoto Co., Inc. | Method for producing objective substance |
JP2019531759A (ja) | 2016-10-26 | 2019-11-07 | 味の素株式会社 | 目的物質の製造方法 |
EP3532610B1 (en) | 2016-10-27 | 2023-09-27 | Ajinomoto Co., Inc. | Method for producing aldehyde |
JP2020512007A (ja) | 2017-03-28 | 2020-04-23 | 味の素株式会社 | Rnaの製造方法 |
JP7066977B2 (ja) * | 2017-04-03 | 2022-05-16 | 味の素株式会社 | L-アミノ酸の製造法 |
US10858676B2 (en) | 2017-05-22 | 2020-12-08 | Ajinomoto Co., Inc. | Method for producing objective substance |
CN112292450A (zh) | 2017-09-25 | 2021-01-29 | 味之素株式会社 | 蛋白质的制造方法和二糖的制造方法 |
US11680279B2 (en) | 2017-11-29 | 2023-06-20 | Ajinomoto Co., Inc. | Method for producing objective substance |
CN109971778B (zh) * | 2017-12-27 | 2022-11-18 | 北京蓝晶微生物科技有限公司 | 一种在盐单胞菌中快速基因编辑的载体组合及其应用 |
JP7374475B2 (ja) * | 2018-02-08 | 2023-11-07 | GreenEarthInstitute株式会社 | アラビノース依存型遺伝子発現制御配列を含む核酸 |
CN111757673A (zh) | 2018-02-20 | 2020-10-09 | 味之素株式会社 | 诱导rna沉默的方法 |
JP7124338B2 (ja) | 2018-02-27 | 2022-08-24 | 味の素株式会社 | 変異型グルタチオン合成酵素、及び、γ-グルタミルバリルグリシンの製造法 |
WO2019203368A1 (ja) | 2018-04-20 | 2019-10-24 | 味の素株式会社 | タンパク質の分泌生産法 |
WO2020027251A1 (en) | 2018-08-03 | 2020-02-06 | Ajinomoto Co., Inc. | Method for producing objective substance |
KR20210082212A (ko) | 2018-10-25 | 2021-07-02 | 아지노모토 가부시키가이샤 | 단백질의 분비 생산법 |
BR112021019284A2 (pt) | 2019-03-29 | 2022-02-01 | Ajinomoto Kk | Métodos para produzir alolactose e para produzir um indutor de expressão gênica |
JPWO2020226087A1 (ko) | 2019-05-08 | 2020-11-12 | ||
JPWO2021085405A1 (ko) | 2019-10-28 | 2021-05-06 | ||
BR112022017430A2 (pt) | 2020-03-04 | 2022-10-18 | Ajinomoto Kk | Método e composição para produzir um alimento, transglutaminase mutante, gene, vetor, e, microrganismo |
EP4223129A1 (en) | 2020-09-29 | 2023-08-09 | Ajinomoto Co., Inc. | Mutant transglutaminase |
JPWO2022092018A1 (ko) | 2020-10-28 | 2022-05-05 | ||
KR20240032941A (ko) | 2021-07-07 | 2024-03-12 | 아지노모토 가부시키가이샤 | 비천연 아미노산 함유 단백질의 분비 생산법 |
CN114634890B (zh) * | 2022-03-22 | 2023-06-02 | 云南中烟工业有限责任公司 | 一种固氮螺菌、其分离方法和应用 |
CN114854661B (zh) * | 2022-06-01 | 2024-01-30 | 南京工业大学 | 一种双菌共培养体系利用混糖原料生产l-鸟氨酸的方法 |
Family Cites Families (127)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS329393B1 (ko) | 1954-12-25 | 1957-11-07 | ||
US3220929A (en) | 1964-02-10 | 1965-11-30 | Kyowa Hakko Kogyo Kk | Microbiological production of amino acid by reductive amination |
US3563857A (en) | 1967-03-20 | 1971-02-16 | Sanraku Ocean Co | Process for producing l-glutamic acid by fermentation |
US3919189A (en) | 1973-04-09 | 1975-11-11 | Kelco Co | Decreasing bacterial contamination of xanthan gum with propylene oxide |
JPS50113209A (ko) | 1974-02-13 | 1975-09-05 | ||
JPS516754A (en) | 1974-07-08 | 1976-01-20 | Oval Eng Co Ltd | Ryuryonaishiryusokukeino paajisochi |
JPS528729A (en) | 1975-07-11 | 1977-01-22 | Oki Electric Ind Co Ltd | Type-drum |
JPS5238088A (en) | 1975-09-19 | 1977-03-24 | Ajinomoto Co Inc | Preparation of l-glutamic acid |
JPS5299289A (en) | 1976-02-18 | 1977-08-19 | Kyowa Hakko Kogyo Co Ltd | Preparation of l-arginine by fermentation |
JPS52114092A (en) | 1976-03-19 | 1977-09-24 | Kyowa Hakko Kogyo Co Ltd | Preparation of l-arginine by fermentation process |
JPS533586A (en) | 1976-06-25 | 1978-01-13 | Kyowa Hakko Kogyo Co Ltd | Preparation of l-amino acid by fermentation |
JPS53143288A (en) | 1977-05-19 | 1978-12-13 | Koito Kogyo Kk | Photoelectric snow depth measuring device |
JPS5444096A (en) | 1977-09-13 | 1979-04-07 | Ajinomoto Co Inc | Preparation of l-arginine by fermentation |
JPS54105293A (en) | 1978-02-01 | 1979-08-18 | Ajinomoto Co Inc | Preparation of l-proline by fermentation |
JPS561889A (en) | 1979-06-20 | 1981-01-10 | Ajinomoto Co Inc | Preparation of l-glutamic acid by fermentation |
JPS5832596B2 (ja) | 1979-08-10 | 1983-07-14 | 味の素株式会社 | 発酵法によるl−グルタミン酸の製造方法 |
JPS5810075B2 (ja) | 1979-08-31 | 1983-02-24 | 味の素株式会社 | 新規変異株 |
JPS56106598A (en) | 1980-01-30 | 1981-08-24 | Ajinomoto Co Inc | Preparation of l-arginine by fermentation method |
JPS56140895A (en) | 1980-04-02 | 1981-11-04 | Ajinomoto Co Inc | Preparation of l-glutamic acid by fermentation |
JPS56144093A (en) | 1980-04-14 | 1981-11-10 | Ajinomoto Co Inc | Preparation of l-proline by fermentation |
US4372753A (en) | 1980-04-23 | 1983-02-08 | Source Technology, Inc. | Liquid fuel for use in internal combustion engines |
JPS56151495A (en) | 1980-04-25 | 1981-11-24 | Ajinomoto Co Inc | Production of l-glutamine through fermentation |
JPS572691A (en) | 1980-06-05 | 1982-01-08 | Ajinomoto Co Inc | Preparation of l-proline by fermentation method |
JPS572869A (en) | 1980-06-10 | 1982-01-08 | Tohoku Electric Power Co Inc | Austenite stainless steel for hot corrosive environment |
JPS5718989A (en) | 1980-07-09 | 1982-01-30 | Ajinomoto Co Inc | Production of l-arginine through fermentation |
JPS5765198A (en) | 1980-10-09 | 1982-04-20 | Ajinomoto Co Inc | Fermentative production of l-glutamic acid |
JPS57134500A (en) | 1981-02-12 | 1982-08-19 | Kyowa Hakko Kogyo Co Ltd | Plasmid pcg1 |
JPS572689A (en) | 1981-03-23 | 1982-01-08 | Ajinomoto Co Inc | Preparation of l-glutamic acid |
JPS57183799A (en) | 1981-04-17 | 1982-11-12 | Kyowa Hakko Kogyo Co Ltd | Novel plasmid |
JPS589692A (ja) | 1981-07-03 | 1983-01-20 | Tanabe Seiyaku Co Ltd | 発酵法によるl−アルギニンの製法 |
DE3127361A1 (de) | 1981-07-08 | 1983-02-03 | Schering Ag, 1000 Berlin Und 4619 Bergkamen | Herstellung und anwendung von plasmiden mit genen fuer die biosynthese von l-prolin |
JPS5835197A (ja) | 1981-08-26 | 1983-03-01 | Kyowa Hakko Kogyo Co Ltd | プラスミドpcg2 |
JPS5867699A (ja) | 1981-10-16 | 1983-04-22 | Ajinomoto Co Inc | プラスミド |
JPS5877895A (ja) | 1981-11-02 | 1983-05-11 | Ajinomoto Co Inc | プラスミドphm1519 |
JPS58158192A (ja) | 1982-03-15 | 1983-09-20 | Ajinomoto Co Inc | 発酵法によるl−グルタミン酸の製造方法 |
JPS58192900A (ja) | 1982-05-04 | 1983-11-10 | Ajinomoto Co Inc | 複合プラスミド |
EP0163836B1 (de) | 1984-04-07 | 1988-10-12 | Bayer Ag | Verfahren und Vorrichtung zur Herstellung von Granulaten |
JPS61202694A (ja) | 1985-03-07 | 1986-09-08 | Ajinomoto Co Inc | 発酵法によるl−グルタミンの製造法 |
JPS6224075A (ja) | 1985-07-25 | 1987-02-02 | Toyota Motor Corp | 車両用駆動装置 |
FR2603581B1 (fr) | 1986-04-28 | 1993-08-13 | Ajinomoto Kk | Procede pour isoler et purifier des aminoacides par chromatographie |
US4777051A (en) | 1986-06-20 | 1988-10-11 | Ajinomoto Co., Inc. | Process for the production of a composition for animal feed |
FR2627508B1 (fr) | 1988-02-22 | 1990-10-05 | Eurolysine | Procede pour l'integration d'un gene choisi sur le chromosome d'une bacterie et bacterie obtenue par ledit procede |
JP2537260B2 (ja) | 1988-02-23 | 1996-09-25 | 東陶機器株式会社 | 和風便器の施工方法 |
JP2817155B2 (ja) | 1989-01-12 | 1998-10-27 | 味の素株式会社 | 発酵法によるl‐アルギニンの製造法 |
JPH02207791A (ja) | 1989-02-07 | 1990-08-17 | Ajinomoto Co Inc | 微生物の形質転換法 |
JPH03232497A (ja) | 1990-02-08 | 1991-10-16 | Asahi Chem Ind Co Ltd | 発酵法によるl―グルタミンの製造方法 |
JPH0488994A (ja) | 1990-07-30 | 1992-03-23 | Kyowa Hakko Kogyo Co Ltd | 発酵法によるl―グルタミン酸の製造法 |
JPH07108228B2 (ja) | 1990-10-15 | 1995-11-22 | 味の素株式会社 | 温度感受性プラスミド |
US5168056A (en) | 1991-02-08 | 1992-12-01 | Purdue Research Foundation | Enhanced production of common aromatic pathway compounds |
BR9203053A (pt) | 1991-08-07 | 1993-03-30 | Ajinomoto Kk | Processo para produzir acido l-glutamico pro fermentacao |
DE4130868C2 (de) | 1991-09-17 | 1994-10-13 | Degussa | Tierfuttermittelsupplement auf der Basis einer Aminosäure und Verfahren zu dessen Herstellung |
US5776736A (en) | 1992-12-21 | 1998-07-07 | Purdue Research Foundation | Deblocking the common pathway of aromatic amino acid synthesis |
CA2179615A1 (en) | 1993-12-23 | 1995-06-29 | Rodger Chieffalo | Commercial ethanol production process |
US5571703A (en) | 1993-12-23 | 1996-11-05 | Controlled Environmental Systems Corporation | Municipal solid waste processing facility and commercial ethanol production process |
BR9508022A (pt) | 1994-06-14 | 2002-05-21 | Ajinomoto Kk | Bactéria corineforme produtora de ácido l-glutâmico, processo para produzir ácido l-glutâmico, gene codificando para uma enzima, dna recombinante, bactéria corineforme, e, processo para produzir l-lisina |
DK0782621T3 (da) | 1994-09-16 | 2006-07-03 | Texas A & M Univ Sys | Mikroorganismer samt fremgangsmåde til overproduktion af DAHP ved hjælp af klonet PPS-gen |
JPH10512450A (ja) | 1995-01-23 | 1998-12-02 | ノボ ノルディスク アクティーゼルスカブ | 転移によるdnaの組込み |
ATE290097T1 (de) | 1995-06-07 | 2005-03-15 | Arkenol Inc | Verfahren zur hydrolyse mit hilfe einer starken säure |
JP3861341B2 (ja) | 1995-10-13 | 2006-12-20 | 味の素株式会社 | 発酵液の膜除菌方法 |
JPH09173792A (ja) | 1995-10-23 | 1997-07-08 | Ajinomoto Co Inc | 発酵液の処理方法 |
DE19621930C1 (de) | 1996-05-31 | 1997-12-11 | Degussa | Verfahren zur Herstellung eines Tierfuttermittel-Zusatzes auf Fermentationsbrühe-Basis |
EP1584679B1 (en) | 1997-07-18 | 2008-12-10 | Ajinomoto Co., Inc. | Method for producing purine nucleosides by fermentation |
CN1179045C (zh) | 1997-08-12 | 2004-12-08 | 味之素株式会社 | 通过发酵生产l-谷氨酸的方法 |
JP4066543B2 (ja) | 1998-01-12 | 2008-03-26 | 味の素株式会社 | 発酵法によるl−セリンの製造法 |
JP3921866B2 (ja) | 1998-03-18 | 2007-05-30 | 味の素株式会社 | L−グルタミン酸生産菌及びl−グルタミン酸の製造法 |
AU756507B2 (en) | 1998-03-18 | 2003-01-16 | Ajinomoto Co., Inc. | L-glutamic acid-producing bacterium and method for producing L-glutamic acid |
JP4144098B2 (ja) | 1998-03-18 | 2008-09-03 | 味の素株式会社 | L−グルタミン酸生産菌及びl−グルタミン酸の製造法 |
AU746542B2 (en) | 1998-03-18 | 2002-05-02 | Ajinomoto Co., Inc. | L-glutamic acid-producing bacterium and method for producing L-glutamic acid |
ATE447039T1 (de) | 1998-09-25 | 2009-11-15 | Ajinomoto Kk | Coryneforme bakterien zur herstellung von l-glu |
JP4144131B2 (ja) | 1998-10-19 | 2008-09-03 | 味の素株式会社 | L−グルタミン酸生産菌及びl−グルタミン酸の製造法 |
BR9906279A (pt) | 1998-12-18 | 2001-04-24 | Ajinomoto Kk | Bactéria corineforme, processo para produzir ácido l-glutâmico, e, dna. |
JP2000201692A (ja) | 1999-01-13 | 2000-07-25 | Ajinomoto Co Inc | 発酵法によるl―グルタミン酸の製造法 |
JP2000262288A (ja) | 1999-03-16 | 2000-09-26 | Ajinomoto Co Inc | コリネ型細菌の温度感受性プラスミド |
US6238714B1 (en) | 1999-05-05 | 2001-05-29 | Degussa-Huls Ag | Feedstuff additive which contains D-pantothenic acid and/or its salts and a process for the preparation thereof |
JP4427878B2 (ja) | 1999-08-20 | 2010-03-10 | 味の素株式会社 | 析出を伴う発酵法によるl−グルタミン酸の製造法 |
US7160705B2 (en) | 2000-04-28 | 2007-01-09 | Ajinomoto Co., Inc. | Arginine repressor deficient strain of coryneform bacterium and method for producing L-arginine |
JP4682454B2 (ja) | 2000-06-28 | 2011-05-11 | 味の素株式会社 | 新規変異型n−アセチルグルタミン酸合成酵素及びl−アルギニンの製造法 |
RU2208640C2 (ru) | 2000-07-06 | 2003-07-20 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | СПОСОБ ПОЛУЧЕНИЯ L-АРГИНИНА, ШТАММ Escherichia coli - ПРОДУЦЕНТ L-АРГИНИНА |
RU2207371C2 (ru) | 2000-09-26 | 2003-06-27 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Способ получения l-аминокислот семейства l-глутаминовой кислоты, штамм бактерии escherichia coli - продуцент l-аминокислоты (варианты) |
JP4560998B2 (ja) | 2001-02-05 | 2010-10-13 | 味の素株式会社 | 発酵法によるl−グルタミンの製造法及びl−グルタミン生産菌 |
EP1239041B1 (en) | 2001-02-13 | 2006-04-19 | Ajinomoto Co., Inc. | Method for producing L-amino acid using bacteria belonging to the genus Escherichia |
JP2002238592A (ja) | 2001-02-20 | 2002-08-27 | Ajinomoto Co Inc | L−グルタミン酸の製造法 |
BR0211723A (pt) | 2001-08-06 | 2004-09-21 | Degussa | Bactérias corineformes que produzem compostos quìmicos i |
RU2230114C2 (ru) | 2001-11-30 | 2004-06-10 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Мутантная глутаминсинтетаза, фрагмент днк, штамм escherichia coli - продуцент l-глутамина и способ получения l-аминокислот |
JP2003250544A (ja) | 2002-03-04 | 2003-09-09 | National Institute Of Technology & Evaluation | タンパク質の性質を改変する方法 |
JP3932945B2 (ja) | 2002-03-27 | 2007-06-20 | 味の素株式会社 | L−アミノ酸の製造法 |
DE60319842T2 (de) * | 2002-06-13 | 2009-04-09 | Koji Sode | Glucosedehydrogenase |
AU2003205041A1 (en) | 2002-07-12 | 2004-01-29 | Ajinomoto Co., Inc. | Method for producing target substance by fermentation |
US20050014236A1 (en) | 2003-03-03 | 2005-01-20 | Yumi Matsuzaki | Method for producing L-arginine or L-lysine by fermentation |
US7468262B2 (en) | 2003-05-16 | 2008-12-23 | Ajinomoto Co., Inc. | Polynucleotides encoding useful polypeptides in corynebacterium glutamicum ssp. lactofermentum |
DE10331366A1 (de) | 2003-07-11 | 2005-01-27 | Degussa Ag | Verfahren zur Granulation eines Tierfuttermittel-Zusatzes |
DE602004014158D1 (de) | 2003-07-29 | 2008-07-10 | Ajinomoto Kk | Verfahren zur herstellung von l-lysin oder l-threonin unter verwendung von escherichia-bakterien mit abgeschwächter malatenzymaktivität |
EP1672077B1 (en) | 2003-08-28 | 2015-01-21 | Mitsubishi Chemical Corporation | Process for producing succinic acid |
JP4575086B2 (ja) | 2003-08-28 | 2010-11-04 | 三菱化学株式会社 | コハク酸の製造方法 |
WO2005068642A2 (en) | 2003-10-01 | 2005-07-28 | Board Of Trustees Operating Michigan State University | Bacterial synthesis of 1,2,4-butanetriol enantiomers |
US7344874B2 (en) | 2004-03-04 | 2008-03-18 | Ajinomoto Co., Inc. | L-glutamic acid-producing microorganism and a method for producing L-glutamic acid |
US20050214913A1 (en) | 2004-03-16 | 2005-09-29 | Marchenko Aleksey N | Method for producing L-amino acids by fermentation using bacteria having enhanced expression of xylose utilization genes |
US8003367B2 (en) | 2004-03-16 | 2011-08-23 | Ajinomoto Co., Inc. | Method for producing L-amino acids by fermentation using bacteria having enhanced expression of xylose utilization genes |
RU2004124226A (ru) | 2004-08-10 | 2006-01-27 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) (RU) | Использование фосфокетолазы для продукции полезных метаболитов |
AU2005272367B2 (en) | 2004-08-10 | 2009-02-12 | Ajinomoto Co., Inc. | The use of phosphoketolase for producing useful metabolites |
JP2006101875A (ja) | 2004-09-10 | 2006-04-20 | Ajinomoto Co Inc | L−グルタミン酸生産菌及びl−グルタミン酸の製造方法 |
US7205132B2 (en) | 2004-09-10 | 2007-04-17 | Ajinomoto Co., Inc. | L-glutamic acid-producing microorganism and a method for producing L-glutamic acid |
CN1749390B (zh) * | 2004-09-17 | 2011-10-19 | 味之素株式会社 | 使用木糖利用基因表达增强的细菌进行发酵以生产l—氨基酸的方法 |
ATE462000T1 (de) | 2004-09-28 | 2010-04-15 | Kyowa Hakko Bio Co Ltd | Verfahren zur herstellung von l-arginin, l- ornithin oder l-citrullin |
US7915018B2 (en) | 2004-10-22 | 2011-03-29 | Ajinomoto Co., Inc. | Method for producing L-amino acids using bacteria of the Enterobacteriaceae family |
JP4595506B2 (ja) | 2004-11-25 | 2010-12-08 | 味の素株式会社 | L−アミノ酸生産菌及びl−アミノ酸の製造方法 |
MY170930A (en) | 2004-12-28 | 2019-09-19 | Ajinomoto Kk | L-glutamic acid-producing microorganism and a method for producing l-glutamic acid |
JP5343303B2 (ja) | 2004-12-28 | 2013-11-13 | 味の素株式会社 | L−グルタミン酸生産菌及びl−グルタミン酸の製造方法 |
US7794989B2 (en) | 2004-12-28 | 2010-09-14 | Ajinomoto Co., Inc. | L-glutamic acid-producing microorganism and a method for producing L-glutamic acid |
US20070004014A1 (en) | 2005-06-29 | 2007-01-04 | Yuichiro Tsuji | Method for producing l-threonine |
EP1976995B1 (en) | 2006-01-27 | 2010-08-04 | Ajinomoto Co., Inc. | Method for producing l-amino acid |
US20110076730A1 (en) * | 2006-07-19 | 2011-03-31 | Board Of Trustees Of Michigan State University | Microbial synthesis of d-1,2,4-butanetriol |
EP2054500B1 (en) | 2006-08-18 | 2016-11-23 | Ajinomoto Co., Inc. | An l-glutamic acid producing bacterium and a method for producing l-glutamic acid |
RU2418069C2 (ru) | 2006-09-29 | 2011-05-10 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО АГРИ) | Способ конструирования рекомбинантных бактерий, принадлежащих к роду pantoea, и способ продукции l-аминокислот с использованием бактерий, принадлежащих к роду pantoea |
JP2010041920A (ja) | 2006-12-19 | 2010-02-25 | Ajinomoto Co Inc | L−アミノ酸の製造法 |
WO2008078646A1 (ja) | 2006-12-22 | 2008-07-03 | Ajinomoto Co., Inc. | アミノ酸又は核酸の結晶の分離方法 |
BRPI0703692B1 (pt) | 2006-12-25 | 2016-12-27 | Ajinomoto Kk | método para se obter os cristais de um hidrocloreto de aminoácido básico compreendendo gerar um aminoácido básico usando células microbianas por fermentação em um caldo de fermentação ou por um método enzimático em uma solução de reação de enzima usando as células como catalisadores |
JP2010130899A (ja) | 2007-03-14 | 2010-06-17 | Ajinomoto Co Inc | L−グルタミン酸系アミノ酸生産微生物及びアミノ酸の製造法 |
CN101688176B (zh) | 2007-04-17 | 2013-11-06 | 味之素株式会社 | 具有羧基的酸性物质的生产方法 |
JP2010226956A (ja) | 2007-07-23 | 2010-10-14 | Ajinomoto Co Inc | L−リジンの製造法 |
KR20110004368A (ko) | 2008-02-21 | 2011-01-13 | 바스프 에스이 | 감마-아미노부티르산의 제조 방법 |
JP5488467B2 (ja) | 2008-09-05 | 2014-05-14 | 味の素株式会社 | L−アミノ酸生産菌及びl−アミノ酸の製造法 |
EP2336347B1 (en) | 2008-09-08 | 2017-03-15 | Ajinomoto Co., Inc. | An l-amino acid-producing microorganism and a method for producing an l-amino acid |
WO2010137130A1 (ja) | 2009-05-27 | 2010-12-02 | 味の素株式会社 | 有機酸の製造方法 |
WO2011041397A1 (en) * | 2009-09-29 | 2011-04-07 | Novozymes, Inc. | Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same |
WO2011047101A1 (en) | 2009-10-13 | 2011-04-21 | Genomatica, Inc. | Microorganisms for the production of 1,4-butanediol, 4-hydroxybutanal, 4-hydroxybutyryl-coa, putrescine and related compounds, and methods related thereto |
US20130260423A1 (en) * | 2010-10-26 | 2013-10-03 | Novozymes North America, Inc. | Methods of Saccharifying Sugar Cane Trash |
-
2012
- 2012-11-06 PE PE2014000670A patent/PE20141569A1/es active IP Right Grant
- 2012-11-06 MY MYPI2014701186A patent/MY173771A/en unknown
- 2012-11-06 CN CN201280055558.9A patent/CN103930557A/zh active Pending
- 2012-11-06 KR KR1020147015776A patent/KR20140091742A/ko active Search and Examination
- 2012-11-06 JP JP2013542985A patent/JPWO2013069634A1/ja active Pending
- 2012-11-06 WO PCT/JP2012/078725 patent/WO2013069634A1/ja active Application Filing
- 2012-11-06 BR BR112013016373-9A patent/BR112013016373B1/pt active IP Right Grant
- 2012-11-06 EP EP12847654.6A patent/EP2778228B1/en active Active
-
2013
- 2013-06-11 US US13/914,872 patent/US9045789B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
BR112013016373A2 (pt) | 2016-10-04 |
WO2013069634A1 (ja) | 2013-05-16 |
EP2778228B1 (en) | 2017-05-17 |
US20130295621A1 (en) | 2013-11-07 |
PE20141569A1 (es) | 2014-11-08 |
BR112013016373B1 (pt) | 2021-05-18 |
EP2778228A1 (en) | 2014-09-17 |
JPWO2013069634A1 (ja) | 2015-04-02 |
MY173771A (en) | 2020-02-20 |
US9045789B2 (en) | 2015-06-02 |
EP2778228A4 (en) | 2015-07-29 |
CN103930557A (zh) | 2014-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20140091742A (ko) | 발효법에 의한 목적 물질의 제조법 | |
EP2657332B1 (en) | Methods for producing an amino acid of the l-glutamic acid family | |
KR100948246B1 (ko) | L-글루탐산 생산 미생물 및 l-글루탐산의 제조방법 | |
JP4595506B2 (ja) | L−アミノ酸生産菌及びl−アミノ酸の製造方法 | |
JP3932945B2 (ja) | L−アミノ酸の製造法 | |
JP6881448B2 (ja) | アルデヒドの製造方法 | |
KR100930842B1 (ko) | L-글루탐산 생산 미생물 및 l-글루탐산의 제조방법 | |
JP7380768B2 (ja) | アルデヒドの製造方法 | |
CN112888776B (zh) | 生产目标物质的方法 | |
JP2009254323A (ja) | L−グルタミン酸系アミノ酸の製造法 | |
JP2007097573A (ja) | L−グルタミン酸生産菌及びl−グルタミン酸の製造方法 | |
JP5157180B2 (ja) | L−アミノ酸の製造法 | |
JP2016163540A (ja) | 有用物質の製造方法 | |
JP2008283863A (ja) | L−アミノ酸生産菌及びl−アミノ酸の製造方法 | |
EP0974647A1 (en) | Process for producing target substances by fermentation | |
JP2008029202A (ja) | L−グルタミン酸の製造法 | |
WO2022092018A1 (ja) | L-アミノ酸の製造法 | |
JP2006129840A (ja) | L−グルタミン酸の製造法 | |
CA3171537A1 (en) | Novel promoter and use thereof | |
JP2000232890A (ja) | 発酵法によるl−グルタミン酸の製造法 | |
KR20240046412A (ko) | L-아미노산의 제조법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
J301 | Trial decision |
Free format text: TRIAL NUMBER: 2016101003931; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20160630 Effective date: 20170929 |