KR20140054232A - 수크로스 이용성이 향상된 재조합 박테리아 - Google Patents
수크로스 이용성이 향상된 재조합 박테리아 Download PDFInfo
- Publication number
- KR20140054232A KR20140054232A KR1020147006604A KR20147006604A KR20140054232A KR 20140054232 A KR20140054232 A KR 20140054232A KR 1020147006604 A KR1020147006604 A KR 1020147006604A KR 20147006604 A KR20147006604 A KR 20147006604A KR 20140054232 A KR20140054232 A KR 20140054232A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- gly
- val
- ile
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1205—Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2431—Beta-fructofuranosidase (3.2.1.26), i.e. invertase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
- C12P7/20—Glycerol
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
수크로스를 이용하는 능력이 향상된 재조합 박테리아가 제공된다. 이들 재조합 박테리아는 그 게놈 내에, yihP 유전자 또는 그 상동체와 yihO 유전자 또는 그 상동체 사이에 통합된, 수크로스 이용 폴리펩티드를 암호화하는 뉴클레오티드 서열을 갖는다. 부가적으로, 재조합 박테리아를 이용하여 글리세롤 및 글리세롤-유도된 생성물과 같은 생성물을 생성하는 방법이 제공된다.
Description
본 발명은 미생물학 및 분자생물학 분야에 관한 것이다. 더 구체적으로, 수크로스를 이용하는 능력이 향상된 재조합 박테리아가 제공된다.
많은 상업적으로 유용한 미생물이 그들의 탄수화물 주 공급원으로서 글루코스를 사용한다. 그러나, 글루코스의 높은 가격으로 상업적으로 바람직한 생성물의 생산을 위해 개발된 미생물에 의한 글루코스의 사용은 단점이 된다. 미생물 생산 시스템에 있어서 탄수화물 공급원으로서 수크로스 및 다른 당을 함유하는 혼합 공급원료 및 수크로스를 사용하는 것은, 이들 재료가 더 낮은 가격으로 용이하게 입수가능하기 때문에 상업적으로 더욱 바람직할 것이다.
생산 미생물은, 그것이 혼합 공급원료 내에 존재하는 임의의 수크로스를 이용할 수 있을 경우에 더욱 효율적으로 기능할 수 있다. 그러므로, 생산 미생물이 주요 탄소 공급원으로서 수크로스를 효율적으로 이용하는 능력을 갖지 않는 경우, 그것은 효율적으로 작동할 수 없다. 예를 들어, 전형적으로 박테리아 세포는 당을 우선적으로 사용하는 것으로 나타나며, 글루코스를 가장 선호한다. 당의 혼합물을 함유하는 인공 배지에서, 전형적으로 다른 당에 앞서 글루코스가 전부 대사된다. 더욱이, 다수의 박테리아는 수크로스를 이용하는 능력이 결여되어 있다. 예를 들어, 에스케리키아 콜라이(Escherichia coli) 주의 50% 미만이 수크로스를 이용하는 능력을 가지고 있다. 따라서, 생산 미생물이 탄수화물 공급원으로서 수크로스를 이용할 수 없는 경우, 미생물을 조작하여 그것이 수크로스를 이용할 수 있도록 하는 것이 바람직하다.
수크로스 이용 유전자를 통합함으로써 수크로스를 이용하도록 조작된 재조합 박테리아가 보고된 바 있다. 예로서, 리브시츠(Livshits) 등 (미국 특허 제6,960,455호)은 수크로스 이용을 위한 대사 경로를 암호화하는(encoding) 유전자를 포함하는 에스케리키아 콜라이 주를 이용한 아미노산 생산을 설명하고 있다. 부가적으로, 문헌[Olson et al., Appl. Microbiol. Biotechnol. 74:1031-1040, 2007]에는 수크로스 분해를 담당하는 유전자를 지닌 에스케리키아 콜라이 주가 기재되어 있으며, 이는 탄소 공급원으로서 수크로스를 사용하여 L-타이로신 또는 L-페닐알라닌을 생산한다. 부가적으로, 엘리엇(Eliot) 등 (미국 특허 공개 제2011/0136190호)은 수크로스로부터 글리세롤 및 글리세롤-유도된 생성물을 생성할 수 있는 재조합 박테리아를 기재하고 있다. 그러나, 수크로스를 이용하는 능력이 향상된 박테리아 주가 여전히 필요하다. 부가적으로, 수크로스를 탄소 공급원으로서 이용하여 글리세롤 및 글리세롤-유도된 생성물을 생성하는 능력이 향상된 박테리아 주가 필요하다.
일 실시 형태는 재조합 박테리아로서, 상기 박테리아는, 게놈 내에,
(a) 수크로스 수송체(sucrose transporter) 활성을 갖는 폴리펩티드 또는 폴리펩티드 복합체를 암호화하는 하나 이상의 뉴클레오티드 서열;
(b) 프룩토키나아제(fructokinase) 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열; 및
(c) 수크로스 하이드롤라아제(sucrose hydrolase) 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하며,
(i) (a), (b) 및 (c)는 각각 동일하거나 또는 다른 프로모터에 작동가능하게 연결되고;
(ii) (a), (b) 및 (c)는 yihP 유전자 또는 그 상동체와 yihO 유전자 또는 그 상동체 사이의 게놈 내로 통합되며;
(iii) 상기 박테리아는 게놈 내의 다른 위치에 통합된 (a), (b) 및 (c)를 포함하는 박테리아보다 더 큰 속도로 수크로스를 대사하는 재조합 박테리아를 제공한다.
다른 실시 형태는 수크로스로부터 글리세롤, 1,3-프로판다이올 및/또는 3-하이드록시프로피온산을 제조하는 방법을 제공하며, 본 방법은
a) 본 명세서에 개시된 재조합 박테리아를 수크로스의 존재 하에 배양하는 단계; 및
b) 생산된 글리세롤, 1,3-프로판다이올 및/또는 3-하이드록시프로피온산을 회수하는 단계를 포함한다.
[도면의 간단한 설명 및 서열 설명]
본 발명은 본 출원의 일부를 형성하는 하기의 상세한 설명, 도면 및 첨부된 서열 설명으로부터 더 완전히 이해될 수 있다.
<도 1>
도 1은 수크로스 유전자 클러스터(cluster)가 통합된 염색체 위치를 나타내는 다이어그램(diagram)이다. 염색체 유전자들은 줄무늬가 있는 화살표로 예시되어 있다. 수크로스 유전자들은 오픈(open) 화살표로 예시되어 있다. 화살표 방향은 유전자 발현 방향을 나타낸다.
하기 서열들은 37 C.F.R. 1.821 1.825 ("뉴클레오티드 서열 및/또는 아미노산 서열 개시를 포함하는 특허 출원에 대한 요구조건 - 서열 규칙"(Requirements for Patent Applicants Containing Nucleotide Sequences and/or Amino Acid Sequence Disclosures - the Sequence Rules))에 따르며, 세계 지적재산권 기구(WIPO) 표준 ST.25 (2009) 및 EPO와 PCT (규칙 5.2 및 49.5(a bis)), 및 행정 지침(Administrative Instructions)의 Section 208 및 Annex C)의 서열 열거 요구조건에 따른다. 뉴클레오티드 및 아미노산 서열 데이터에 사용된 기호 및 체제는 37 C.F.R. §1.822에 개시된 규정을 준수한다.
[표 a]
서열 번호 71은 클렙시엘라 뉴모니아 유래의 dhaX 유전자의 코딩 영역의 뉴클레오티드 서열이다.
서열 번호 72는 플라스미드 pSYCO101의 뉴클레오티드 서열이다.
서열 번호 73은 플라스미드 pSYCO103의 뉴클레오티드 서열이다.
서열 번호 74는 플라스미드 pSYCO106의 뉴클레오티드 서열이다.
서열 번호 75는 플라스미드 pSYCO109의 뉴클레오티드 서열이다.
서열 번호 76은 플라스미드 pSYCO400/AGRO의 뉴클레오티드 서열이다.
서열 번호 85는 시겔라 플렉스네리(Shigella flexneri)의 추정 퍼미아제(permease) YP_690957을 암호화하는 뉴클레오티드 서열이다.
서열 번호 86은 살모넬라 엔테리카(Salmonella enterica)의 GPH 패밀리 수송 단백질 NP_462898을 암호화하는 뉴클레오티드 서열이다.
서열 번호 87은 엔테로박터 칸세로게누스(Enterobacter cancerogenus) ATCC(등록상표) 35316의 가상 단백질 ENCANT_09547을 암호화하는 뉴클레오티드 서열이다.
서열 번호 88은 시트로박터 코세리(Citrobacter koseri) ATCC(등록상표) BAA-895의 가상 단백질 CKO_03136을 암호화하는 뉴클레오티드 서열이다.
서열 번호 89는 시겔라 플렉스네리의 추정 퍼미아제 YP_690958을 암호화하는 뉴클레오티드 서열이다.
서열 번호 90은 살모넬라 엔테리카의 GPH 패밀리 수송 단백질 NP_462897을 암호화하는 뉴클레오티드 서열이다.
서열 번호 91은 엔테로박터 칸세로게누스 ATCC(등록상표) 35316의 가상 단백질 ENCANT_09546을 암호화하는 뉴클레오티드 서열이다.
서열 번호 92는 시트로박터 코세리 ATCC(등록상표) BAA-895의 가상 단백질 CKO_03137을 암호화하는 뉴클레오티드 서열이다.
서열 번호 115-122는 본 명세서의 실시예에서 사용된 프라이머들의 뉴클레오티드 서열이다.
서열 번호 123은 에스케리키아 콜라이 ATCC(등록상표)13281의 cscAKB 유전자 클러스터의 뉴클레오티드 서열이다.
서열 번호 124는 플라스미드 pBHR-cscBKA의 뉴클레오티드 서열이다.
본 명세서에 개시된 각각의 참고 문헌의 개시는 그 전체 내용이 본 명세서에 참고로 포함된다.
본 명세서 및 첨부된 특허청구범위에 사용되는 바와 같이, 문맥이 명백하게 달리 지시하지 않는 한, 단수 형태("a", "an", 및 "the")는 복수 언급(plural reference)을 포함한다. 따라서, 예를 들어, "세포"에 대한 언급은 하나 이상의 세포 및 당업자에게 공지된 그의 균등물 등을 포함한다.
본 개시와 관련하여, 다수의 용어 및 약어가 사용된다. 하기의 정의가 제공된다.
"오픈 리딩 프레임(open reading frame)"은 "ORF"로 약칭된다.
"폴리머라아제 연쇄 반응"은 "PCR"로 약칭된다.
"아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection)"은 "ATCC"로 약칭된다.
용어 "재조합 글리세롤-생산 박테리아"는 1,3-프로판다이올 및 3-하이드록시프로피온산과 같은 글리세롤 및/또는 글리세롤-유도된 생성물을 생성할 수 있도록 유전적으로 조작된 박테리아를 지칭한다.
용어 "수크로스 수송체 활성을 갖는 폴리펩티드 또는 폴리펩티드 복합체"는 미생물 세포 내로의 수크로스 수송을 매개할 수 있는 폴리펩티드 또는 폴리펩티드 복합체를 지칭한다. 수크로스 수송체 활성을 갖는 폴리펩티드의 예는 수크로스:H+ 공수송체를 포함하지만, 이에 한정되지 않는다. 수크로스 수송체 활성을 갖는 폴리펩티드 복합체의 예는 ABC형 수송체를 포함하지만, 이에 한정되지 않는다. 수크로스:H+ 공수송체는, 예를 들어, 이. 콜라이 주, 예를 들어 EC3132 (문헌[ Jahreis et al., J. Bacteriol. 184:5307-5316, 2002) 또는 ATCC(등록상표)13281 (문헌[Olson et al., Appl. Microbiol. Biotechnol. 74:1031-1040, 2007]), 및 비피도박테리움 락티스 주 DSM 10140T (문헌[Ehrmann et al., Curr. Microbiol. 46(6):391-397, 2003])에서 발견되는 cscB 유전자에 의해 암호화된다. 수크로스에 대한 활성을 갖는 ABC형 수송체의 일례로는 스트렙토코커스 뉴모니아 주 TIGR4의 유전자 susT1, susT2 및 susX에 의해 암호화되는 복합체가 있다 (문헌[Iyer and Camilli, Molecular Microbiology 66:1-13, 2007]). 수크로스 수송체 활성을 갖는 폴리펩티드 또는 폴리펩티드 복합체는 또한 다른 당류에 대한 활성을 가질 수 있다. 일례로는 malEFGK에 의해 암호화되는 스트렙토코커스 뮤탄스의 말토스 수송체 복합체가 있다 (문헌[Kilic et al., FEMS Microbiol Lett. 266:218, 2007]).
용어 "변이형 수크로스 수송체 폴리펩티드"는 야생형 수크로스 수송체 폴리펩티드의 서열과는 다른 아미노산 서열을 갖는, 수크로스 수송체 활성을 갖는 폴리펩티드를 지칭한다. 변이형 수크로스 수송체 폴리펩티드의 서열의 차이는 하기 중 임의의 하나일 수 있다: (i) 야생형 서열의 하나 이상의 위치에서의 아미노산 치환, (ii) 변이형 수크로스 수송체 폴리펩티드의 서열은 야생형 서열의 것으로부터 단축될 수 있음, 또는 (iii) 변이형 수크로스 수송체 폴리펩티드의 서열은 야생형 서열의 것으로부터 단축될 수 있으며 야생형 서열의 하나 이상의 위치에서 아미노산 치환을 포함할 수 있음.
용어 "프룩토키나아제 활성을 갖는 폴리펩티드"는 D-프룩토스 + ATP를 프룩토스-포스페이트 + ADP로 전환하는 촉매 작용을 하는 능력을 갖는 폴리펩티드를 지칭한다. 전형적인 프룩토키나아제는 EC 2.7.1.4이다. 프룩토스를 인산화하는 일부 능력을 갖는 효소는, 이 활성이 그들의 주된 활성인지 여부를 불문하고, 프룩토키나아제로 지칭될 수 있다. 프룩토키나아제를 암호화하는 유전자 및 프룩토키나아제 활성을 갖는 단백질에 대해 사용된 약어는, 예로서 "Frk", "scrK", "cscK", "FK", 및 "KHK"를 포함한다. 프룩토키나아제는 아그로박테리움 투메파시엔스 및 스트렙토코커스 뮤탄스에서 scrK 유전자에 의하여 암호화되고; 특정 에스케리키아 콜라이 주에서의 cscK 유전자에 의하여 암호화된다.
용어 "수크로스 하이드롤라아제 활성을 갖는 폴리펩티드"는 수크로스를 가수분해하여 글루코스 및 프룩토스를 생산하는 촉매 작용을 하는 능력을 갖는 폴리펩티드를 지칭한다. 이러한 폴리펩티드는 흔히 "인버타아제(invertase)" 또는 "β-프룩토푸라노시다아제"로 지칭된다. 전형적인 이들 효소는 EC 3.2.1.26이다. 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 유전자의 예로는 이. 콜라이 주 EC3132 (자레이스(Jahreis) 등의 상기 문헌) 또는 ATCC(등록상표)13281 (올슨(Olson) 등의 상기 문헌)에서 발견되는 cscA 유전자, 비피도박테리움 락티스 주 DSM 10140 T 유래의 bfrA유전자, 및 사카로마이세스 세레비시애 유래의 SUC2 유전자(문헌[Carlson and Botstein, Cell 28:145, 1982])가 있다. 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드는 또한 수크로스 포스페이트 하이드롤라아제 활성을 가질 수 있다. 이러한 펩티드의 일례는 코리네박테리움 글루타미쿰의 scrB에 의해 암호화된다 (문헌[Engels et al., FEMS Microbiol Lett. 289:80-89, 2008]). 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드는 또한 수크로스 포스포릴라아제 활성을 가질 수 있다. 전형적인 이러한 효소는 EC 2.4.1.7이다. 수크로스 하이드롤라아제 활성을 갖는 수크로스 포스포릴라아제를 암호화하는 유전자의 예는 특히 류코노스톡 메센테로이데스 DSM 20193 (문헌[Goedl et al., Journal of Biotechnology 129:77-86, 2007]) 및 비피도박테리움 아돌레센티스 DSM 20083 (문헌[van den Broek et al., Appl. Microbiol . Biotechnol. 65:219-227, 2004])에서 발견된다.
용어 "글리세롤 유도체" 및 "글리세롤-유도된 생성물"은 본 명세서에서 호환적으로 사용되며, 글리세롤로부터, 또는 글리세롤을 포함하는 경로에서 합성되는 화합물을 지칭한다. 이러한 생성물의 예는 3-하이드록시프로피온산, 메틸글리옥살, 1,2-프로판다이올, 및 1,3-프로판다이올을 포함한다.
용어 "미생물 생성물"은 미생물에 의해 생산되는 생성물, 즉, 미생물이 물질을 대사시킨 결과를 지칭한다. 미생물에 의해 산물이 자연적으로 생산될 수 있거나, 산물을 생산하도록 미생물을 유전적으로 조작할 수 있다. 용어 "포스포에놀피루베이트-당 포스포트랜스퍼라아제 시스템", "PTS 시스템", 및 "PTS"는 본 명세서에서 호환적으로 사용되며, 포스포에놀피루베이트-의존성 당 흡수 시스템을 말한다.
용어 "포스포캐리어(phosphocarrier) 단백질 HPr" 및 "PtsH"는 이. 콜라이에서 ptsH에 의해 암호화되는 포스포캐리어 단백질을 지칭한다. 용어 "포스포에놀피루베이트-단백질 포스포트랜스퍼라아제" 및 "PtsI"은 이. 콜라이에서 ptsI에 의해 암호화되는 포스포트랜스퍼라아제, EC 2.7.3.9를 지칭한다. 용어 "글루코스-특이적 IIA 컴포넌트", 및 "Crr"은 이. 콜라이에서 crr에 의해 암호화되는, EC 2.7.1.69로 표기되는 효소를 지칭한다. PtsH, PtsI, 및 Crr은 PTS 시스템을 포함한다.
용어 "PTS 음성"은, 그의 천연 상태에서 PTS 시스템을 함유하지 않는 미생물, 또는 PTS 유전자의 불활성화를 통해 PTS 시스템이 불활성화된 미생물을 지칭한다.
용어 "글리세롤-3-포스페이트 데하이드로게나아제(glycerol-3-phosphate dehydrogenase)" 및 "G3PDH"는, 다이하이드록시아세톤 포스페이트(DHAP)를 글리세롤 3-포스페이트(G3P)로 전환하는 촉매 작용을 하는 효소 활성을 담당하는 폴리펩티드를 지칭한다. 생체내 G3PDH는 NAD- 또는 NADP-의존성일 수 있다. 보조인자 특이적 글리세롤-3-포스페이트 데하이드로게나아제를 특이적으로 지칭할 경우, 용어 "NAD-의존성 글리세롤-3-포스페이트 데하이드로게나아제" 및 "NADP-의존성 글리세롤-3-포스페이트 데하이드로게나아제"가 사용될 것이다. 일반적으로 NAD-의존성 및 NADP-의존성 글리세롤-3-포스페이트 데하이드로게나아제는 NAD 및 NADP를 호환적으로 사용할 수 있는 경우가 대부분이므로(예를 들어 gpsA에 의해 암호화되는 효소에 의해), 용어 NAD-의존성 및 NADP-의존성 글리세롤-3-포스페이트 데하이드로게나아제는 호환적으로 사용될 것이다. NAD-의존성 효소 (EC 1.1.1.8)는, 예로서 본 명세서에서 DAR1로도 지칭되는, GPD1 (서열 번호 1에 설명된 코딩 서열; 서열 번호 2에 설명된 암호화된 단백질 서열), 또는 GPD2 (서열 번호 3에 설명된 코딩 서열; 서열 번호 4에 설명된 암호화된 단백질 서열), 또는 GPD3을 포함하는 몇몇 유전자에 의하여 암호화된다. NADP-의존성 효소(EC 1.1.1.94)는, 예를 들어 gpsA에 의해 암호화된다.
용어 "글리세롤 3-포스파타아제(glycerol 3-phosphatase)", "sn-글리세롤 3-포스파타아제", "d,l-글리세롤 포스파타아제", 및 "G3P 포스파타아제"는 글리세롤 3-포스페이트 및 물을 글리세롤 및 무기 포스페이트로 전환하는 촉매 작용을 할 수 있는 효소 활성을 갖는 폴리펩티드를 지칭한다. G3P 포스파타아제는 예로서 GPP1 (서열 번호 5에 개시된 코딩 서열; 서열 번호 6에 개시된 암호화된 단백질 서열), 또는 GPP2 (서열 번호 7에 개시된 코딩 서열; 서열 번호 8에 개시된 암호화된 단백질 서열)에 의하여 암호화된다.
용어 "글리세롤 데하이드라타아제" 또는 "데하이드라타아제 효소"는 글리세롤 분자를 산물 3-하이드록시프로피온알데히드(3-HPA)로 전환하는 촉매 작용을 할 수 있는 효소 활성을 갖는 폴리펩티드를 지칭한다.
본 발명의 목적을 위한, 데하이드라타아제 효소는, 글리세롤 데하이드라타아제 (E.C. 4.2.1.30) 및 다이올 데하이드라타아제 (E.C. 4.2.1.28)를 포함하며, 이들은 각각 글리세롤 및 1,2-프로판다이올을 바람직한 기질로 갖는다. 데하이드라타아제 효소에 대한 유전자는, 특히 클렙시엘라 뉴모니아, 시트로박터 프룬디(Citrobacter freundii), 클로스트리디움 파스퇴리아눔(Clostridium pasteurianum), 살모넬라 티피뮤리움(Salmonella typhimurium), 클렙시엘라 옥시토카(Klebsiella oxytoca), 및 락토바실러스 루테리(Lactobacillus reuteri)에서 동정되었다. 각 경우에서, 데하이드라타아제는 3개의 서브유닛으로 구성된다: 큰 서브유닛 또는 "α" 서브유닛, 중간 서브유닛 또는 "β" 서브유닛, 및 작은 서브유닛 또는 "γ" 서브유닛. 이러한 유전자는 예로서, 문헌[Daniel et al., FEMS Microbiol. Rev . 22, 553 (1999)] 및 문헌[Toraya and Mori, J. Biol . Chem . 274, 3372 (1999)]에 또한 기재되어 있다. 글리세롤 데하이드라타아제의 큰 서브유닛 또는 "α" (알파) 서브유닛을 암호화하는 유전자는 dhaB1 (서열 번호 9에 개시된 코딩 서열, 서열 번호 10에 개시된 암호화된 단백질 서열), gldA 및dhaB를 포함하고; 중간 서브유닛 또는 "β" (베타) 서브유닛을 암호화하는 유전자는 dhaB2 (서열 번호 11에 개시된 코딩 서열, 서열 번호 12에 개시된 암호화된 단백질 서열), gldB 및 dhaC를 포함하고; 작은 서브유닛 또는 "γ" (감마) 서브유닛을 암호화하는 유전자는 dhaB3 (서열 번호 13에 개시된 코딩 서열, 서열 번호 14에 개시된 암호화된 단백질 서열), gldC, 및 dhaE를 포함한다. 다이올 데하이드라타아제의 큰 서브유닛 또는 "α" 서브유닛을 암호화하는 기타 유전자들은 pduC 및 pddA를 포함하고; 중간 서브유닛 또는 "β" 서브유닛을 암호화하는 기타 유전자는 pduD 및 pddB를 포함하고; 작은 서브유닛 또는"γ" 서브유닛을 암호화하는 기타 유전자는 pduE 및pddC를 포함한다.
글리세롤 및 다이올 데하이드라타아제는 글리세롤 및 일부 다른 기질에 의해 메커니즘-기초의 자멸적 불활성화(suicide inactivation)를 겪는다 (문헌[Daniel et al., FEMS Microbiol. Rev. 22, 553 (1999)]). 용어 "데하이드라타아제 재활성화 인자"는 데하이드라타아제 활성의 재활성화를 담당하는 단백질을 지칭한다. 용어 "데하이드라타아제 재활성화 활성", "데하이드라타아제 활성의 재활성화" 및 "데하이드라타아제 활성의 재생"은 호환적으로 사용되며, 반응의 촉매가 불가능한 데하이드라타아제를 반응의 촉매가 가능한 것으로 전환하는 현상 또는 데하이드라타아제의 불활성화를 저해하는 현상 또는 생체내 데하이드라타아제 효소의 가용 반감기를 연장하는 현상을 지칭한다. 2개의 단백질이 데하이드라타아제 재활성화 인자로서 관여되는 바에 따라 동정되어 왔다(예로서, 미국 특허 제6,013,494호 및 그 안의 참고 문헌들 참조; 다니엘(Daniel) 등의 상기 문헌; 문헌[Toraya and MoriJ. Biol. Chem. 274, 3372 (1999)]; 및 문헌[Tobimatsu et al., J Bacteriol. 181, 4110 (1999)]). 이들 단백질 중 하나를 암호화하는 유전자는, 예를 들어, orfZ, dhaB4, gdrA, pduG 및 ddrA를 포함한다. 2개의 단백질 중 두번째 것을 암호화하는 유전자는, 예를 들어, orfX, orf2b, gdrB, pduH 및 ddrB를 포함한다.
"1,3-프로판다이올 옥시도리덕타아제", "1,3-프로판다이올 데하이드로게나아제" 및 "DhaT"는 본 명세서에서 호환적으로 사용되며, 3-HPA 및 1,3-프로판다이올의 상호전환을 촉매할 수 있는 효소 활성을 갖는 폴리펩티드(들)를 지칭하며, 단 이러한 활성을 암호화하는 유전자(들)는 그의 천연 (즉, 야생형) 환경에서 데하이드라타아제 효소에 물리적으로 또는 전사적으로 연결된 것으로 보이며; 예로서, 유전자는 dha 레귤론 내에서 발견되며, 이는 클렙시엘라 뉴모니아 유래의 dhaT의 경우와 같다. 1,3-프로판다이올 옥시도리덕타아제를 암호화하는 유전자는 클렙시엘라 뉴모니아, 시트로박터 프룬디, 및 클로스트리디움 파스퇴리아눔 유래의 dhaT를 포함하지만, 이에 한정되지 않는다. 이들 유전자 각각은 제III형 알코올 데하이드로게나아제의 패밀리에 속하는 폴리펩티드를 암호화하며, 이는 보존된 철-결합 모티프를 나타내고, 3-HPA 및 1,3-프로판다이올의 NAD+/NADH 결합된 상호전환에 대한 선호를 갖는다 (문헌[Johnson and Lin, J. Bacteriol. 169, 2050 (1987)]; 문헌[Daniel et al., J. Bacteriol. 177, 2151 (1995)]; 및 문헌[Leurs et al., FEMS Microbiol. Lett. 154, 337 (1997)]). 유사한 물리적 특성을 가진 효소들이 락토바실러스 브레비스(Lactobacillus brevis) 및 락토바실러스 부크네리(Lactobacillus buchneri)로부터 단리된 바 있다 (문헌[Veiga da Dunha and Foster, Appl. Environ. Microbiol. 58, 2005 (1992)]).
용어 "dha 레귤론"은, 데하이드라타아제 활성, 재활성화 활성, 및 1,3-프로판다이올 옥시도리덕타아제를 포함하나 이에 한정되지 않는 다양한 생물학적 활성을 갖는 폴리펩티드를 암호화하는 연계된 폴리뉴클레오티드 또는 오픈 리딩 프레임의 세트를 지칭한다. 전형적으로 dha 레귤론은, 미국 특허 제7,371,558호에 기술된 바와 같이 오픈 리딩 프레임 dhaR, orfY, dhaT, orfX, orfW, dhaB1, dhaB2, dhaB3 및 orfZ를 포함한다.
용어 "알데히드 데하이드로게나아제" 및 "Ald"는 알데히드를 카르복실산으로 전환하는 촉매 작용을 하는 폴리펩티드를 지칭한다. 알데히드 데하이드로게나아제는 NAD, NADP, FAD, 또는 PQQ와 같은 산화환원 보조인자를 사용할 수 있다. 전형적인 알데히드 데하이드로게나아제로, EC 1.2.1.3 (NAD-의존성); EC 1.2.1.4 (NADP-의존성); EC 1.2.99.3 (PQQ-의존성); 또는 EC 1.2.99.7 (FAD-의존성)이 있다. NADP-의존성 알데히드 데하이드로게나아제의 일례는, 이. 콜라이 유전자 aldB (서열 번호 15에 개시된 코딩 서열)에 의해 암호화된 AldB (서열 번호 16)이다. NAD-의존성 알데하이드 데하이드로게나아제는의 예는 이. 콜라이 유전자 aldA (서열 번호 17에 개시된 코딩 서열)에 의해 암호화된 AldA (서열 번호 18); 및 이. 콜라이 유전자 aldH (서열 번호 19에 개시된 코딩 서열)에 의해 암호화된 AldH (서열 번호 20)를 포함한다.
용어 "글루코키나아제(glucokinase)" 및 "Glk"는 본 명세서에서 호환적으로 사용되며, D-글루코스 + ATP를 글루코스 6-포스페이트 + ADP로 전환하는 촉매 작용을 하는 단백질을 지칭한다. 전형적인 글루코키나아제는 EC 2.7.1.2이다. 글루코키나아제는 이. 콜라이에서 glk에 의해 암호화된다.
용어 "포스포에놀피루베이트 카르복실라아제(phosphoenolpyruvate carboxylase)" 및 "Ppc"는 본 명세서에서 호환적으로 사용되며, 포스포에놀피루베이트 + H2O + CO2를 포스페이트 + 옥살로아세트산으로 전환하는 촉매 작용을 하는 단백질을 지칭한다. 전형적인 포스포에놀피루베이트 카르복실라아제는 EC 4.1.1.31이다. 포스포에놀피루베이트 카르복실라아제는 이. 콜라이에서 ppc에 의해 암호화된다.
용어 "글리세르알데히드-3-포스페이트 데하이드로게나아제" 및 "GapA"는 본 명세서에서 호환적으로 사용되며, 글리세르알데히드 3-포스페이트 + 포스페이트 + NAD+를 3-포스포-D-글리세로일-포스페이트 + NADH + H+로 전환하는 촉매 작용을 할 수 있는 효소 활성을 갖는 단백질을 지칭한다. 전형적인 글리세르알데히드-3-포스페이트 데하이드로게나아제는 EC 1.2.1.12이다. 글리세르알데히드-3-포스페이트 데하이드로게나아제는 이. 콜라이에서 gapA에 의해 암호화된다.
용어 "유기 호흡 제어 단백질" 및 "ArcA"는 본 명세서에서 호환적으로 사용되며, 총체적 조절 단백질(global regulatory protein)을 지칭한다. 호기성 호흡 제어 단백질은 이. 콜라이에서 arcA에 의해 암호화된다.
용어 "메틸글리옥살 신타아제(methylglyoxal synthase)" 및 "MgsA"는 본 명세서에서 호환적으로 사용되며, 다이하이드록시아세톤 포스페이트를 메틸글리옥살 + 포스페이트로 전환하는 촉매 작용을 할 수 있는 효소 활성을 갖는 단백질을 지칭한다. 전형적인 메틸글리옥살 신타아제는 EC 4.2.3.3이다. 메틸글리옥살 신타아제는 이. 콜라이에서 mgsA에 의해 암호화된다.
"포스포글루코네이트 데하이드라타아제" 및 "Edd"라는 용어는 본 명세서에서 호환적으로 사용되며, 6-포스포-글루코네이트를 2-케토-3-데옥시-6-포스포-글루코네이트 + H2O로의 전환을 촉매할 수 있는 효소 활성을 갖는 단백질을 지칭한다. 전형적인 포스포글루코네이트 데하이드라타아제는 EC 4.2.1.12이다. 포스포글루코네이트 데하이드라타아제는 이. 콜라이에서 edd에 의해 암호화된다.
용어 "YciK"는 yciK에 의해 암호화되는 추정 효소를 지칭하며, 이는 이. 콜라이에서 Cob(I)알라민 아데노실트랜스퍼라아제를 암호화하는 유전자, btuR에 번역 단계에서 연결된다.
용어 "Cob(I)알라민 아데노실트랜스퍼라아제"는 데옥시아데노실 부분을 ATP로부터 환원된 코리노이드로 전달할 수 있는 효소를 지칭한다. 전형적인 Cob(I)알라민 아데노실트랜스퍼라아제는 EC 2.5.1.17이다. Cob(I)알라민 아데노실트랜스퍼라아제는 이. 콜라이의 "btuR", 살모넬라 티피뮤리움의 "cobA", 및 슈도모나스 데니트리피칸스(Pseudomonas denitrificans)의 "cobO" 유전자에 의해 암호화된다.
용어 "갈락토스-양성자 공수송체" 및 "GalP"는 본 명세서에서 호환적으로 사용되며, 당 및 양성자를 주변 세포질로부터 세포질로 수송할 수 있는 효소 활성을 갖는 단백질을 지칭한다. D-글루코스는 GalP에 있어서 선호되는 기질이다. 갈락토스-양성자 공수송체는 에스케리키아 콜라이에서 galP에 의해 암호화된다(서열 번호 21에 개시된 코딩 서열, 서열 번호 22에 개시된 암호화된 단백질 서열).
용어 "비-특이적 촉매 활성"은 3-HPA 및 1,3-프로판다이올의 상호 전환을 촉매 작용할 수 있는 효소 활성을 갖는 폴리펩티드(들)를 지칭하며, 특이적으로 1,3-프로판다이올 옥시도리덕타아제(들)를 배제한다. 전형적으로 이들 효소는 알코올 데하이드로게나아제이다. 이러한 효소는, FAD 또는 FMN과 같은 플라빈을 포함하지만, 이에 한정되지 않는, NAD+/NADH 이외의 보조인자를 이용할 수 있다. 비-특이적 알코올 데하이드로게나아제(yqhD)를 위한 유전자는, 예를 들어 이. 콜라이 K-12 주 내에서 내인적으로 암호화되고 기능적으로 발현되는 것으로 알려졌다.
용어 "1.6 장 GI 프로모터(long GI promoter)", "1.20 단/장 GI 프로모터(short/long GI Promoter)", 및 "1.5 장 GI 프로모터"는, 미국 특허 제7,132,527호에 기재된 바와 같이 스트렙토마이세스 리비단스(Streptomyces lividans) 글루코스 아이소머라아제(glucose isomerase) 유전자로부터의 프로모터를 함유하는 폴리뉴클레오티드 또는 단편을 지칭한다. 이들 프로모터 단편은 야생형 스트렙토마이세스 리비단스 글루코스 아이소머라아제 유전자 프로모터에 비하여 그들의 활성을 감소시키는 돌연변이를 포함한다.
용어 "기능" 및 "효소 기능"은 본 명세서에서 호환적으로 사용되며, 반응에 의해 그 자신은 소모되지 않으면서 특정 화학 반응이 일어나는 속도를 변경시키는 효소의 촉매 활성을 지칭한다. 적합한 조건 하에 산물 또는 기질의 생산이 이루어질 수 있는 평형 중의 반응에 이러한 활성이 적용될 수 있다는 것이 이해된다.
용어 "폴리펩티드" 및 "단백질"은 본 명세서에서 호환적으로 사용된다.
"탄소 기질" 및 "탄소 공급원"이라는 용어는 본 명세서에서 호환적으로 사용되며, 본 명세서에서 개시된 재조합 박테리아에 의하여 대사될 수 있는 탄소 공급원, 특히 수크로스를 포함하는 탄소 공급원을 지칭한다. 탄소 공급원은 단당류, 다른 이당류, 올리고당류, 또는 다당류를 더 포함할 수 있다.
용어 "숙주 세포" 및 "숙주 박테리아"는 본 명세서에서 호환적으로 사용되며, 외래 또는 이종 유전자를 수용할 수 있고 이들 유전자를 발현시켜 활성 유전자 산물을 생산할 수 있는 박테리아를 지칭한다.
본 명세서에 사용되는 바와 같이 용어 "생산 미생물"은, 재조합된 것들을 포함하지만 이에 한정되지 않으며, 1,3-프로판다이올, 글리세롤, 3-하이드록시프로피온산, 다중불포화 지방산 등과 같은 특정 산물을 제조하기 위해 사용되는 미생물을 지칭한다.
본 명세서에 사용되는 바와 같이, "핵산"은 폴리뉴클레오티드를 의미하며 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 또는 이중-가닥 중합체를 포함한다. 핵산은 또한 단편 및 변형된 뉴클레오티드를 포함할 수 있다. 따라서, 용어 "폴리뉴클레오티드", "핵산 서열", "뉴클레오티드 서열" 또는 "핵산 단편"은 본 명세서에서 호환적으로 사용되며, 합성된 비-자연적 뉴클레오티드 염기 또는 변경된 뉴클레오티드 염기를 선택적으로 함유하는 단일- 또는 이중- 가닥인 RNA 또는 DNA의 중합체를 지칭한다. 뉴클레오티드 (일반적으로 그의 5'-모노포스페이트 형태로 발견됨)는 다음과 같은, 그의 1문자 표시로 언급된다: 아데닐레이트 또는 데옥시아데닐레이트(각각 RNA 또는 DNA에 대한 것)는 "A", 시티딜레이트 또는 데옥시시티딜레이트는 "C", 구아닐레이트 또는 데옥시구아닐레이트는 "G", 유리딜레이트는 "U", 데옥시티미딜레이트는 "T", 퓨린(A 또는 G)은 "R", 피리미딘(C 또는 T)은 "Y", G 또는 T는 "K", A 또는 C 또는 T는 "H", 이노신은 "I", 및 임의의 뉴클레오티드는 "N".
폴리뉴클레오티드는 합성된, 비-자연적 뉴클레오티드 염기 또는 변경된 뉴클레오티드 염기를 선택적으로 함유하는 단일- 또는 이중-가닥인 RNA 또는 DNA의 중합체일 수 있다. DNA의 중합체 형태인 폴리뉴클레오티드는 cDNA, 게놈 DNA, 합성 DNA, 또는 그의 혼합물의 하나 이상의 세그먼트로 이루어질 수 있다.
"유전자"는 특정 단백질을 발현시키는 핵산 단편을 지칭하며, 이는 코딩 영역만을 지칭하거나 코딩 서열 앞에 있는 조절 서열(5' 비-코딩 서열) 및 코딩 서열 뒤에 있는 조절 서열(3' 비-코딩 서열)을 포함할 수 있다. "천연 유전자"는 그 자신의 조절 서열과 함께 자연에서 발견되는 유전자를 지칭한다. "키메라 유전자"는 자연에서 함께 발견되지 않는 조절 및 코딩 서열을 포함하는, 천연 유전자가 아닌 임의의 유전자를 지칭한다. 따라서, 키메라 유전자는 상이한 공급원으로부터 유래된 조절 서열과 코딩 서열, 또는 동일한 공급원으로부터 유래되었지만, 자연에서 발견되는 것과 상이한 방식으로 배열된 조절 서열과 코딩 서열을 포함할 수 있다. "내인성 유전자"는 유기체의 게놈에서 그의 자연적 위치에 있는 천연 유전자를 지칭한다. "외래" 유전자는 유전자 전달에 의해 숙주 유기체 내로 도입된 유전자를 지칭한다. 외래 유전자는 비-천연 유기체에 삽입된 유전자, 천연 숙주 내의 새로운 위치에 도입된 유전자, 또는 키메라 유전자를 포함할 수 있다.
용어 "천연 뉴클레오티드 서열"은 숙주 미생물에서 정상적으로 발견되는 뉴클레오티드 서열을 지칭한다.
용어 "비-천연 뉴클레오티드 서열"은 숙주 미생물에서 정상적으로 발견되지 않는 뉴클레오티드 서열을 지칭한다.
용어 "천연 폴리펩티드"는 숙주 미생물에서 정상적으로 발견되는 폴리펩티드를 지칭한다.
용어 "비-천연 폴리펩티드"는 숙주 미생물에서 정상적으로 발견되지 않는 폴리펩티드를 지칭한다.
용어 "암호화하는" 및 "코딩"은 본 명세서에서 호환적으로 사용되며, 유전자가 전사 및 번역의 메커니즘을 통해 아미노산 서열을 생산하는 과정을 지칭한다.
용어 "코딩 서열"은 특정 아미노산 서열을 암호화하는 뉴클레오티드 서열을 지칭한다.
"적합한 조절 서열"은 코딩 서열의 상류(5' 비-코딩 서열), 그의 내부 또는 그의 하류(3' 비-코딩 서열)에 위치하고, 전사, RNA 프로세싱 또는 안정성 또는 결부된 코딩 서열의 번역에 영향을 미치는 뉴클레오티드 서열을 지칭한다. 조절 서열은 프로모터, 인핸서(enhancer), 사일런서(silencer), 5' 비번역 리더(untranslated leader) 서열(예를 들어, 전사 시작 부위와 번역 개시 코돈의 사이), 인트론, 폴리아데닐화 인식 서열, RNA 프로세싱 부위, 이펙터(effector) 결합 부위 및 스템-루프 구조를 포함할 수 있다.
용어 "발현 카세트"는, 선택된 유전자의 코딩 서열 및 선택된 유전자 생성물의 발현을 위해 필요한 코딩 서열에 선행하는 조절 서열(5' 비-코딩 서열) 및 후행하는 조절 서열(3' 비-코딩 서열)을 포함하는 DNA의 단편을 지칭한다. 따라서, 발현 카세트는 전형적으로 1) 프로모터 서열; 2) 코딩 서열 (즉, ORF) 및, 3) 진핵생물에서 대개 폴리아데닐화 부위를 포함하는 3' 비번역된 영역 (예로서, 종결자)으로 구성된다. 발현 카세트(들)는 통상적으로 벡터 내에 포함되어, 클로닝 및 형질전환을 용이하게 한다. 각각의 숙주에 대해 정확한 조절 서열이 사용되는 한, 박테리아, 효모, 및 진균류를 포함하는 상이한 유기체를 상이한 발현 카세트로 형질전환시킬 수 있다.
"형질전환"은, 숙주 유기체 내로 핵산 분자를 전달하여 유전적으로 안정한 유전성을 유발하는 것을 지칭한다. 핵산 분자는, 예를 들어, 자체적으로 복제될 수 있는 플라스미드일 수도 있고, 그것이 숙주 유기체의 게놈 내로 통합될 수도 있다. 핵산 단편으로 형질전환된 숙주 유기체는 "재조합" 또는 "형질전환된" 유기체 또는 "형질전환체"라고 지칭된다. "안정한 형질전환"은 핵 및 소기관 게놈 양자 모두를 포함하는 숙주 유기체의 게놈 내로 핵산 단편을 전달하여, 유전적으로 안정한 유전성을 유발하는 것을 지칭한다. 반대로, "일시적 형질전환"은, 숙주 유기체의 핵, 또는 DNA-함유 소기관 내로 핵산 단편을 전달하여, 통합 또는 안정적인 유전성이 없는 유전자 발현을 유발하는 것을 지칭한다.
"코돈 축퇴성(Codon degeneracy)"은 암호화된 폴리펩티드의 아미노산 서열에 영향을 주지 않으면서 뉴클레오티드 서열의 변이를 허용하는 유전 암호의 성질을 지칭한다. 주어진 아미노산을 특정하기 위한 뉴클레오티드 코돈의 사용에 있어서 특정 숙주 세포에서 나타나는 "코돈-바이어스(codon-bias)"가 당업자에게 주지되어 있다. 그러므로, 숙주 세포 내의 발현을 개선하기 위한 유전자를 합성할 경우에는, 그의 코돈 사용 빈도가 숙주 세포가 선호하는 코돈의 사용 빈도에 근접하도록 유전자를 고안하는 것이 바람직하다.
용어 "기능적으로 균등한 하위단편(subfragment)" 및 "기능적 균등 하위단편"은 본 명세서에서 호환적으로 사용된다. 이들 용어는 단리된 핵산 단편의 일부 또는 하위서열을 지칭하며, 여기에는 단편 또는 하위단편이 활성 효소를 암호화하는지 여부에 무관하게 유전자 발현을 변경하거나 소정의 표현형을 생산하는 능력이 보유된다. 키메라 유전자는, 그것이 활성 효소를 암호화하는지 여부에 무관하게, 프로모터 서열에 대해 센스 또는 안티센스 배향으로, 그의 핵산 단편 또는 하위단편을 연결함으로써 억제에 사용하기 위해 고안될 수 있다.
용어 "보존된 도메인" 또는 "모티프"는 진화적으로 관련된 단백질의 정렬된 서열을 따라 특정 위치에서 보존된 아미노산의 세트를 의미한다. 다른 위치의 아미노산은 상동 단백질들 사이에 변동될 수 있는 반면에, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성, 또는 활성에 있어서 필수적인 아미노산을 나타낸다.
용어 "실질적으로 유사한" 및 "실질적으로 상응하는"은 본 명세서에서 호환적으로 사용된다. 그들은 유전자 발현을 매개하거나 소정의 표현형을 생산하는 핵산 단편의 능력에 하나 이상의 뉴클레오티드 염기의 변화가 영향을 미치지 않는 핵산 단편을 지칭한다. 이들 용어는 또한, 본 발명의 핵산 단편의 변형, 예를 들어 초기의 비변형된 단편에 대해 생성되는 핵산 단편의 기능적 특성을 실질적으로 변경하지 않는 하나 이상의 뉴클레오티드의 결실 또는 삽입을 지칭한다. 그러므로, 당업자가 인식할 바와 같이, 본 발명은 특정 예시적 서열을 초과하여 포괄한다는 것이 이해된다. 더욱이, 본 발명이 포괄하는 실질적으로 유사한 핵산 서열은 본 명세서에 예시된 서열, 또는 본 명세서에 개시되고 본 명세서에 개시된 핵산 서열 중 임의의 것과 기능적으로 균등한 뉴클레오티드 서열의 임의의 부분에 혼성화되는 그들의 능력(중간 정도의 엄격 조건 하에, 예를 들어, 0.5X SSC (표준 소듐 시트레이트), 0.1% SDS (소듐 도데실 설페이트), 60℃)에 의해 또한 정의된다는 것을, 당업자는 인식한다. 엄격성 조건을 조정하여, 관계가 먼 유기체로부터의 상동 서열과 같이 중간 정도로 유사한 단편 내지 밀접하게 관련된 유기체로부터의 기능성 효소를 중복시키는 유전자와 같이 고도로 유사한 단편을 스크리닝할 수 있다. 혼성화 후 세척은 엄격성 조건을 결정한다.
용어 "선택적으로 혼성화되다"는, 엄격 혼성화 조건 하에 핵산 서열이 비-표적 핵산 서열에 대한 그의 혼성화보다 검출가능하게 더 큰 정도로(예를 들어, 배경에 비해 2배 이상) 특정된 핵산 표적 서열에 혼성화됨에 대한 언급, 및 비-표적 핵산의 실질적인 배제에 대한 언급을 포함한다. 선택적으로 혼성화되는 서열은, 뉴클레오티드 서열 중 하나의 상보체가 다른 뉴클레오티드 서열에 대해 전형적으로 적어도 약 80%의 서열 동일성, 또는 90%의 서열 동일성, 100% 이하의 서열 동일성(즉, 완전히 상보적임)을 갖는 2개의 뉴클레오티드 서열이다.
용어 "엄격 조건" 또는 "엄격 혼성화 조건"은, 탐침자가 그의 표적 서열에 선택적으로 혼성화될 조건에 대한 언급을 포함한다. 전형적으로 탐침자는, 검출하고자 하는 핵산 서열에 상보적인 단일 가닥 핵산 서열이다. 탐침자는 검출하고자 하는 핵산 서열에 "혼성화가능"하다. 일반적으로, 탐침자는 약 1000 뉴클레오티드 미만의 길이이며, 임의로 500 뉴클레오티드 미만의 길이이다.
혼성화 방법은 잘 정립되어 있다. 전형적으로, 탐침자 및 샘플은 핵산 혼성화를 허용할 조건 하에서 혼합된다. 이는 적절한 농도 및 온도 조건하에 무기 또는 유기염의 존재 하에 탐침자 및 시료를 접촉시킴을 포함한다. 임의로, 카오트로픽제(chaotropic agent)가 첨가될 수 있다. 핵산 혼성화는 다양한 분석 형식에 적응시킬 수 있다. 가장 적합한 것 중의 하나는 샌드위치 분석법(sandwich assay) 형식이다. 샌드위치형 분석법의 주요 구성요소는 고체 지지체이다. 고체 지지체에는, 서열의 일부에 대해 상보적이고 표지되지 않은 고정화된 핵산 탐침자가 흡착되거나 공유적으로 결합된다.
엄격 조건은 서열-의존성이며, 상이한 상황에서 상이할 것이다. 혼성화 및/또는 세척 조건의 엄격성을 제어함으로써, 탐침자에 100% 상보적인 표적 서열을 동정할 수 있다(상동 탐침법(homologous probing)). 대안적으로, 더 낮은 정도의 유사성이 검출되도록 서열의 일부 불일치를 허용하기 위해 엄격성 조건을 조정할 수 있다(이종 탐침법(heterologous probing)).
전형적으로 엄격 조건은, 염 농도가 pH 7.0 내지 8.3에서 약 1.5 M 미만의 Na 이온, 전형적으로는 약 0.01 내지 1.0 M의 Na 이온 농도(또는 다른 염)이며, 온도가 짧은 탐침(예를 들어, 10 내지 50 뉴클레오티드)에 있어서는 적어도 약 30℃이고 긴 탐침(예를 들어, 50 뉴클레오티드 초과)에 있어서는 적어도 약 60℃인 것들일 것이다. 엄격 조건은 또한, 포름아미드와 같은 불안정화제의 첨가로 달성할 수 있다. 예시적인 낮은 엄격성 조건은, 37℃에서 30 내지 35% 포름아미드, 1 M NaCl, 1% SDS(소듐 도데실 설페이트)의 완충 용액을 이용하는 혼성화, 및 50 내지 55℃에서 1X 내지 2X SSC(20X SSC = 3.0 M NaCl/0.3 M 트라이소듐 시트레이트) 중의 세척을 포함한다. 예시적인 중간 정도의 엄격성 조건은, 37℃에서 40 내지 45% 포름아미드, 1 M NaCl, 1% SDS 중의 혼성화, 및 55 내지 60℃에서 0.5X 내지 1X SSC 중의 세척을 포함한다. 예시적인 높은 엄격성 조건은, 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS 중의 혼성화, 및 60 내지 65℃에서 0.1X SSC 중의 세척을 포함한다.
특이성은 전형적으로 혼성화후 세척의 함수이며, 결정적 인자는 최종 세척 용액의 이온 세기 및 온도이다. DNA-DNA 혼성의 경우, 열 용융점(Tm)은 문헌[Meinkoth et al., Anal. Biochem. 138:267-284 (1984)]에서의 등식: Tm = 81.5℃ + 16.6 (log M) + 0.41 (%GC) - 0.61 (% form) - 500/L (식 중, M은 1가 양이온의 몰농도, %GC는 DNA 중 구아노신 및 시토신 뉴클레오티드의 백분율, % form은 혼성화 용액 중 포름아미드의 백분율, 및 L은 혼성물의 염기쌍 길이)로부터 어림할 수 있다. Tm은 50%의 상보적인 표적 서열이 완전하게 일치하는 탐침에 혼성화되는 온도이다(정의된 이온 세기 및 pH 하에). Tm은 각 1%의 불일치에 대하여 약 1℃ 감소되고; 이에 따라, Tm, 혼성화 및/또는 세척 조건은 원하는 동일성의 서열에 혼성화하도록 조절될 수 있다. 예를 들어, ≥90% 동일성을 가진 서열을 탐색한다면, Tm을 10℃ 감소시킬 수 있다. 일반적으로, 엄격 조건은 정의된 이온 세기 및 pH에서 특정 서열 및 그의 상보체에 대한 Tm보다 약 5℃ 낮게 선택된다. 그러나, 매우 엄격 조건은 Tm보다 1, 2, 3 또는 4℃ 더 낮은 조건에서의 혼성화 및/또는 세척을 이용할 수 있고; 중간 정도로 엄격 조건은 Tm보다 6, 7, 8, 9 또는 10℃ 더 낮은 조건에서의 혼성화 및/또는 세척을 이용할 수 있고; 낮은 엄격성 조건은 Tm보다 11, 12, 13, 14, 15 또는 20℃ 더 낮은 조건에서의 혼성화 및/또는 세척을 이용할 수 있다. 상기 등식, 혼성화 및 세척 조성물, 및 목적하는 Tm을 사용하여, 혼성화 및/또는 세척 용액의 엄격성에서의 변화가 본질적으로 설명된다는 것을, 당업자는 이해할 것이다. 목적하는 불일치의 정도가 45℃(수용액) 또는 32℃(포름아미드 용액) 미만의 Tm을 초래한다면, 더 높은 온도를 사용할 수 있도록 SSC 농도를 증가시키는 것이 바람직하다. 핵산 혼성화에 대한 광범위한 지침은 문헌[Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, Part I, Chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays", Elsevier, New York (1993)]; 및 문헌[Current Protocols in Molecular Biology, Chapter 2, Ausubel et al., Eds., Greene Publishing and Wiley-Interscience, New York (1995)]에서 찾을 수 있다. 혼성화 및/또는 세척 조건은 적어도 10, 30, 60, 90, 120, 또는 240 분 동안 적용될 수 있다.
핵산 또는 폴리펩티드 서열과 관련하여 "서열 동일성" 또는 "동일성"은, 특정된 비교창 상에 최대 상응도로 정렬될 경우에 2개 서열 중의 동일한 핵산 염기 또는 아미노산 잔기를 지칭한다.
따라서, "서열 동일성의 백분율"은, 비교창 상에 최적으로 정렬된 2개의 서열을 비교함으로써 결정된 값을 지칭하며, 여기서 비교창 내의 폴리뉴클레오티드 또는 폴리펩티드 서열의 부분은 2개 서열의 최적 정렬을 위한 기준 서열(부가 또는 결실을 포함하지 않음)과 비교하여 부가 또는 결실(즉, 갭)을 포함할 수 있다. 양자 모두의 서열 내에서 동일한 핵산 염기 또는 아미노산 잔기가 나타나는 위치의 개수를 결정하여 일치하는 위치의 개수를 산출하고, 일치하는 위치의 개수를 비교창 내의 위치의 총 개수로 나누고, 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 백분율을 계산한다. 퍼센트 서열 동일성의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만, 이에 한정되지 않는다. 이들 동일성은 본 명세서에 기재된 임의의 프로그램을 사용하여 결정할 수 있다.
서열 정렬 및 동일성 또는 유사성 백분율 계산은, 레이저진 바이오인포매틱스 컴퓨팅 스위트(LASERGENE bioinformatics computing suite)(미국 위스콘신주 메디슨 소재의 디엔에이스타 인크.(DNASTAR Inc.))의 멕얼라인(MegAlign)(상표명) 프로그램을 포함하나 이에 한정되지 않는, 상동성 서열을 검출하도록 고안된 다양한 비교 방법을 사용하여 결정할 수 있다. 본 출원과 관련하여, 서열 분석 소프트웨어가 분석을 위해 사용된 경우에는, 그 분석 결과가 달리 명시되지 않는 한, 참조한 프로그램의 "디폴트 값"에 기초할 것임을 이해할 것이다. 본 명세서에 사용되는 바와 같이, "디폴트 값"은 최초 초기화할 때에 소프트웨어에 원래 로딩된 값 또는 파라미터의 임의의 세트를 의미할 것이다.
"클러스탈 V 정렬법"은 클러스탈 V (문헌[Higgins and Sharp, CABIOS. 5:151-153 (1989)]; 문헌[Higgins, D.G. et al., Comput. 특허 Biosci. 8:189-191 (1992)]에 기재됨)로 표지되고 LASERGENE 바이오인포매틱스 컴퓨팅 스위트 (미국 위스콘신주 매디슨 소재의 디엔에이스타 인크.(DNASTAR Inc.))의 멕얼라인™ 프로그램에서 발견되는 정렬법에 상응한다. 다중 정렬의 경우, 디폴트 값은 갭 페널티(GAP PENALTY)=10 및 갭 길이 페널티(GAP LENGTH PENALTY)=10에 상응한다. 클러스탈 V 방법을 사용하는 단백질 서열의 동일성 백분율의 계산 및 쌍정렬을 위한 디폴트 파라미터는 케이터플(KTUPLE)=1, 갭 페널티=3, 윈도(WINDOW)=5 및 다이아고날스 세이브드(DIAGONALS SAVED)=5이다. 핵산의 경우, 이들 파라미터는 케이터플=2, 갭 페널티=5, 윈도=4 및 다이아고날스 세이브드=4이다. 클러스탈 V 프로그램을 사용하여 서열들을 정렬한 후에, 동일한 프로그램 내의 "서열 거리" 표를 보면 "퍼센트 동일성"을 얻을 수 있다.
"클러스탈 W 정렬법"은 클러스탈 W (문헌[Higgins and Sharp, 상기 참조]; 문헌[Higgins, D.G. et al., 상기 참조]에 기재됨)로 표지되고 LASERGENE 바이오인포매틱스 컴퓨팅 스위트 (미국 위스콘신주 매디슨 소재의 디엔에이스타 인크.)의 멕얼라인™ v6.1 프로그램에서 발견되는 정렬법에 대응한다. 다중 정렬을 위한 내정 파라미터는 갭 페널티=10, 갭 길이 페널티=0.2, 지연 일탈 서열(Delay Divergen Seqs)(%)=30, DNA 전이 중량(DNA Transition Weight)=0.5, 단백질 중량 매트릭스(Protein Weight Matrix)=고넷 시리즈(Gonnet Series), DNA 중량 매트릭스(DNA Weight Matrix)=IUB에 상응한다. 클러스탈 W 프로그램을 사용하여 서열들을 정렬한 후에, 동일한 프로그램 내의 "서열 거리" 표를 보면 "퍼센트 동일성"을 얻을 수 있다.
"BLASTN 정렬법"은 미국 국립 생물공학 정보센터(NCBI: National Center for Biotechnology Information)에 의해 제공되는, 내정 파라미터를 사용하여 뉴클레오티드 서열을 비교하는 알고리즘이다.
동일하거나 유사한 기능 또는 활성을 가진 폴리펩티드를 다른 종으로부터 동정함에 있어서 여러 수준의 서열 동일성이 유용하다는 것이 당업자에게 주지되어 있다. 퍼센트 동일성의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만, 이에 한정되지 않는다. 실제로, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%와 같은 50% 내지 100%의 임의의 정수의 아미노산 동일성이 본 발명에서 유용할 수 있다. 또한, 이러한 분리된 뉴클레오티드 단편의 임의의 전장 또는 부분 상보체도 관심대상이다.
따라서, 본 발명은 본 명세서에 개시된 특정 예시적 뉴클레오티드 서열을 초과하여 포괄한다. 예를 들어, 유전 암호의 축퇴성을 반영하는 유전자 서열의 변경이 고려된다. 또한, 주어진 부위에 화학적으로 균등한 아미노산의 생산을 유발하면서 암호화된 단백질의 기능적 특성에 영향을 미치지 않는 유전자의 변경이 흔하다는 것은 당업계에 주지되어 있다. 본 명세서의 논의에 있어서 치환은 하기의 5개 그룹 중 하나 내에서의 교환으로 정의된다:
1. 비극성 또는 약간 극성인 작은 지방족 잔기: Ala, Ser, Thr (Pro, Gly);
2. 음으로 하전된 극성 잔기 및 그들의 아미드: Asp, Asn, Glu, Gln;
3. 양으로 하전된 극성 잔기: His, Arg, Lys;
4. 비극성인 큰 지방족 잔기: Met, Leu, Ile, Val (Cys);
5. 큰 방향족 잔기: Phe, Tyr, Trp.
따라서, 소수성 아미노산인 아미노산 알라닌에 대한 코돈은 소수성이 좀 더 낮은 다른 잔기(예를 들어, 글라이신) 또는 소수성이 좀 더 높은 잔기(예를 들어, 발린, 류신 또는 아이소류신)를 암호화하는 코돈으로 치환될 수 있다. 마찬가지로, 음성 하전된 하나의 잔기로 다른 하나를 치환하거나(예를 들어 글루탐산을 아스파르트산으로) 양성 하전된 하나의 잔기로 다른 하나를 치환하는(예를 들어, 아르기닌을 라이신으로) 변화도 기능적으로 균등한 생성물을 생산시킬 수 있을 것으로 예상된다. 많은 경우에, 단백질 분자의 N-말단 및 C-말단 부분의 변경을 유발하는 뉴클레오티드 변화도 단백질의 활성을 변경하지 않을 것으로 예상된다.
각각의 제안된 변형은 당업계의 통상적 기술로 충분히 가능하며, 암호화된 산물의 생물학적 활성의 보존을 결정하는 것도 그러하다. 또한, 본 발명에 의해 포괄되는 실질적으로 유사한 서열은 상기 정의된 바와 같은 엄격 조건 하에 혼성화되는 그들의 능력에 의해 또한 정의된다는 것을, 당업자는 인식한다.
본 발명의 실질적으로 유사한 바람직한 핵산 단편은, 뉴클레오티드 서열이 본 명세서에 보고된 핵산 단편의 뉴클레오티드 서열과 적어도 70% 동일한 핵산 단편들이다. 더욱 바람직한 핵산 단편은 본 명세서에 보고된 핵산 단편의 뉴클레오티드 서열과 적어도 90% 동일하다. 본 명세서에 보고된 핵산 단편의 뉴클레오티드 서열과 적어도 95% 동일한 핵산 단편이 가장 바람직하다.
아미노산 또는 뉴클레오티드 서열의 "상당한 부분"은, 당업자에 의한 서열의 수동 평가에 의해, 또는 BLAST(기본 국소 정렬 검색 도구(Basic Local Alignment Search Tool); 문헌[Altschul, S. F., et al., J. Mol. Biol., 215:403-410(1993)])와 같은 알고리즘을 사용하는 컴퓨터-자동화 서열 비교 및 동정에 의해, 폴리펩티드 또는 유전자를 추정적으로 동정하기에 충분한 폴리펩티드의 아미노산 서열 또는 유전자의 뉴클레오티드 서열을 포함하는 부분이다. 일반적으로, 폴리펩티드 또는 핵산 서열을 공지의 단백질 또는 유전자와 상동인 것으로 추정적으로 동정하기 위해서는 10개 이상 연속되는 아미노산 또는 30개 이상의 뉴클레오티드의 서열이 필요하다. 또한, 뉴클레오티드 서열에 있어서는, 20 내지 30개의 연속된 뉴클레오티드를 포함하는 유전자-특이적 올리고뉴클레오티드 탐침이 서열-의존적인 유전자 동정(예를 들어, 서던 혼성화(Southern hybridization)) 및 단리(예를 들어, 박테리아 콜로니 또는 박테리오파아지 플라크의 원위치 혼성화(in situ hybridization)) 방법에 사용될 수 있다. 또한, 12 내지 15 염기의 짧은 올리고뉴클레오티드를 PCR에서 증폭 프라이머로 사용하여, 프라이머를 포함하는 특정 핵산 단편을 얻을 수 있다. 따라서, 뉴클레오티드 서열의 "실질적인 부분"은, 서열을 포함하는 핵산 단편을 특이적으로 동정 및/또는 단리하기에 충분한 서열을 포함한다. 본 명세서는, 특정 단백질을 암호화하는 완전한 아미노산 및 뉴클레오티드 서열을 교시한다. 본 명세서에 보고된 서열의 유익성을 가지고, 당업자는 개시된 서열의 전체 또는 실질적인 부분을 당업계에 공지된 목적으로 사용할 수 있게 되었다.
용어 "상보적인"은, 역평행 배향으로 정렬될 때 왓슨-크릭(Watson-Crick) 염기-대합이 가능한 2개 서열의 뉴클레오티드 염기 사이의 관계를 기술한다. 예를 들어, DNA에 있어서, 아데노신은 티민과 염기-대합이 가능하고 시토신은 구아닌과 염기-대합이 가능하다. 따라서 본 발명은, 첨부된 서열 목록 및 명세서에 보고된 완전한 서열 뿐 아니라 실질적으로 유사한 핵산 서열에 상보적인 단리된 핵산 분자를 이용할 수 있다.
용어 "단리된"은, 폴리펩티드 또는 뉴클레오티드 서열과 자연적으로 연계된 적어도 하나의 컴포넌트로부터 분리된 폴리펩티드 또는 뉴클레오티드 서열을 지칭한다.
"프로모터"는 코딩 서열 또는 기능성 RNA의 발현을 제어할 수 있는 DNA 서열을 지칭한다. 프로모터 서열은 근위 상류 요소 및 더욱 원위의 상류 요소로 이루어지며, 후자의 요소는 흔히 인핸서로 지칭된다. 따라서, "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이며, 프로모터의 고유한 요소이거나 프로모터의 조직-특이성 또는 수준을 향상시키도록 삽입된 이종 요소일 수 있다. 프로모터는 천연 유전자로부터 그 전체가 유래될 수도 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래된 상이한 요소로 구성될 수도 있거나, 심지어 합성 DNA 세그먼트를 포함할 수도 있다. 상이한 프로모터는 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경적 조건에 반응하여, 유전자의 발현을 유도할 수 있음을 당업자는 이해할 것이다. 대부분의 경우에 조절 서열의 정확한 경계는 완벽하게 정의되지 않았으므로, 일부 변이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 추가로 인정된다. 대부분의 세포 유형에서 대부분의 시간에 유전자가 발현되도록 하는 프로모터는 통상적으로 "구성적 프로모터"라고 지칭된다.
"3' 비-코딩 서열", "전사 종결자" 및 "종결 서열"은 본 명세서에서 호환적으로 사용되며, 코딩 서열의 하류에 위치하는 DNA 서열, 예를 들어 폴리아데닐화 인식 서열 및 mRNA 가공 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 암호화하는 다른 서열을 지칭한다. 폴리아데닐화 신호는 통상적으로 mRNA 전구체의 3' 말단에 폴리아데닐산 트랙트를 부가하는 데에 영향을 미치는 것을 특징으로 한다.
용어 "작동가능하게 연결된"은 하나의 기능이 나머지에 의해 영향을 받도록 하는, 단일 핵산 단편 상에서의 핵산 서열의 연계를 지칭한다. 예를 들어, 프로모터가 코딩 서열의 발현에 영향을 미칠 수 있는 경우에, 프로모터는 그 코딩 서열에 작동가능하게 연결된다(즉, 코딩 서열은 프로모터의 전사 제어 하에 있다). 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동가능하게 연결될 수 있다. 다른 예에서, 본 발명의 상보적 RNA 영역은 직접 또는 간접적으로 표적 mRNA에 대해 5', 또는 표적 mRNA에 대해 3', 또는 표적 mRNA 내부에 작동가능하게 연결될 수 있거나, 제1 상보적 영역은 표적 mRNA에 대해 5'이고 그의 상보체는 3'이다.
본 명세서에 사용되는 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 주지되어 있으며, 문헌[Sambrook, J., Fritsch, E.F. and Maniatis, T. Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)]에 충분히 기재되어 있다. 형질전환 방법은 당업자에게 주지되어 있으며, 하기에 기재된다.
"PCR" 또는 "폴리머라아제 연쇄 반응"은 다량의 특정 DNA 세그먼트의 합성을 위한 기술이며 일련의 반복 사이클로 구성된다 (미국 코네티컷주 노르워크 소재의 퍼킨 엘머 세터스 인스트루먼츠(Perkin Elmer Cetus Instruments)). 전형적으로, 이중-가닥 DNA를 열변성시키고, 표적 세그먼트의 3' 경계에 상보적인 2개의 프라이머를 저온에서 어닐링시킨 후, 중간 온도에서 연장한다. 이들 3개의 연이은 단계의 1 세트를 "사이클"이라고 지칭한다.
"플라스미드" 또는 "벡터"는, 흔히 세포의 중심 대사작용의 일부가 아닌 유전자를 운반하는, 통상적으로 원형 이중-가닥 DNA 단편 형태의 염색체 외 요소이다. 이러한 요소는, 세포 내로 발현 카세트(들)를 도입할 수 있는 독특한 제작물 내로 많은 뉴클레오티드 서열이 결합되거나 재조합된, 임의의 공급원으로부터 유래된 단일- 또는 이중-가닥 DNA 또는 RNA의 선형 또는 원형의 자체적으로 복제되는 서열, 게놈 통합 서열, 파아지 또는 뉴클레오티드 서열일 수 있다.
용어 "유전적으로 변경된"은 유전공학, 형질전환 및/또는 돌연변이에 의해 유전 물질을 변화시키는 과정을 지칭한다.
용어 "재조합"은, 예를 들어 유전공학 기술에 의한 단리된 핵산 세그먼트의 조작에 의하거나 화학적 합성에 의해, 그렇지 않다면 분리되어 있는 2개의 서열 세그먼트의 인공 조합을 지칭한다. "재조합"은 또한, 이종 핵산의 도입에 의해 변형된 세포 또는 벡터, 또는 그렇게 변형된 세포로부터 유래하는 세포에 대한 언급을 포함하나, 의도적인 인위적 개입 없이 발생하는 것들과 같이 자연적으로 발생하는 사건(예를 들어, 자발적 돌연변이, 자연적 형질전환, 자연적 형질도입, 자연적 전위)에 의한 세포 또는 벡터의 변경은 포괄하지 않는다.
용어 "변이형 박테리아"는 자발적 돌연변이, 자연적 형질전환, 자연적 형질감염 또는 자연적 전위를 겪었거나; 또는 돌연변이 유발에 의해 변형된 야생형 박테리아를 말한다.
용어 "재조합 제작물", "발현 제작물", "키메라 제작물", "제작물", 및 "재조합 DNA 제작물"은 본 명세서에서 호환적으로 사용된다. 재조합 제작물은 핵산 단편, 예를 들어, 자연에서는 함께 발견되지 않는 조절 및 코딩 서열의 인공 조합을 포함한다. 예를 들어, 재조합 제작물은 상이한 공급원으로부터 유래된 조절 서열 및 코딩 서열, 또는 동일한 공급원으로부터 유래되지만, 자연에서 발견되는 것과는 상이한 방식으로 배열된 조절 서열 및 코딩 서열을 포함할 수 있다. 이러한 제작물은 단독으로 사용될 수도 있고, 벡터와 함께 사용될 수도 있다. 벡터를 사용한다면, 당업자에게 주지된 바와 같이 벡터의 선택은 숙주 세포를 형질전환시키기 위해 사용될 방법에 따라 달라진다. 예를 들어, 플라스미드 벡터를 사용할 수 있다. 본 발명의 임의의 단리된 핵산 단편을 포함하는 숙주 세포를 성공적으로 형질전환시키고 선택하고 증식시키기 위하여 벡터 상에 존재해야 하는 유전 요소는 당업자에게 주지되어 있다. 숙련자는 상이한 독립적인 형질전환 사건이 발현 수준 및 패턴을 상이하게 하는 결과를 일으킬 수 있음을 인지할 것이며(문헌[Jones et al., EMBO J. 4:2411-2418 (1985)]; 문헌[De Almeida et al., Mol. Gen. Genetics 218:78-86 (1989)]), 따라서 목적하는 발현 수준 및 양상을 나타내는 라인을 얻기 위해서는 그러한 다중의 사건을 스크리닝할 필요가 있다는 것을, 당업자는 또한 인식할 것이다. 이러한 스크리닝은 특히 DNA의 서던 분석, mRNA 발현의 노던 분석, 단백질 발현의 면역 블로팅 분석, 또는 표현형 분석에 의해 이루어질 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "발현"은 기능성 최종 산물(예를 들어, mRNA 또는 단백질[전구체 또는 성숙체])의 생산을 지칭한다.
용어 "도입된"은 핵산(예를 들어, 발현 제작물) 또는 단백질을 세포 내에 제공함을 의미한다. "도입된"은, 진핵 또는 원핵 세포 내로의 핵산의 혼입(여기서 핵산은 세포의 게놈 내로 혼입될 수 있음)에 대한 언급을 포함하며, 핵산 또는 단백질을 세포에 일시적으로 제공하는 것에 대한 언급을 포함한다. "도입된"은 유성 교배(sexually crossing)와 더불어 안정하거나 일시적인 형질전환 방법에 대한 언급을 포함한다. 따라서, 핵산 단편(예를 들어, 재조합 제작물/발현 제작물)을 세포 내로 삽입하는 단계와 관련하여, "도입된"은 "형질감염" 또는 "형질전환" 또는 "형질도입"을 의미하며, 진핵 또는 원핵 세포 내로의 핵산 단편의 혼입(여기서 핵산 단편은 세포의 게놈(예를 들어, 염색체, 플라스미드, 플라스티드 또는 미토콘드리아 DNA) 내로 혼입되거나, 자체적 레플리콘(autonomous replicon)으로 전환되거나, 일시적으로 발현될 수 있음(예를 들어, 형질감염된 mRNA))에 대한 언급을 포함한다.
용어 "상동"은, 유사한 촉매 기능을 가진, 공통의 진화적 기원의 단백질 또는 폴리펩티드를 지칭한다. 본 발명은 재조합 기술을 통해 상동 단백질을 생산하는 박테리아를 포함할 수 있다.
게놈 내에, 수크로스 수송체 활성을 갖는 폴리펩티드 또는 폴리펩티드 복합체를 암호화하는 하나 이상의 뉴클레오티드 서열; 프룩토키나아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열; 및 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하는 재조합 박테리아가 본 발명에서 개시된다. 이들 뉴클레오티드 서열은 동일하거나 상이한 프로모터에 각각 작동가능하게 연결된다. 부가적으로, 상기 뉴클레오티드 서열들은 yihP 유전자 또는 그 상동체와 yihO 유전자 또는 그 상동체 사이의 게놈 내로 통합되며, 이는 도 1에 도시된 바와 같다. 게놈 내의 이러한 특정 부위에서의 통합은 게놈 내의 다른 부위에서의, 예를 들어 aldH (서열 번호 19에 개시된 코딩 서열)에서의 통합과 비교하여 재조합 박테리아에 의한 수크로스 대사율이 더욱 커지게 하며, 이는 본 명세서의 실시예 5 및 실시예 7 내지 실시예 10에 나타낸 바와 같다.
에스케리키아 콜라이의 yihP 유전자 (서열 번호 77에 개시된 코딩 서열)는 추정 내막 수송 단백질 (서열 번호 78)을 암호화하는데, 이는 당 이용 유전자좌의 일부인 것으로 보인다. 상류 yihQ 유전자 (서열 번호 79에 개시된 코딩 서열)는 α-글리코시다아제 (서열 번호 80)를 암호화한다. 하류 yihO 유전자 (서열 번호 81에 개시된 코딩 서열) 및 ompL 유전자 (서열 번호 83에 개시된 코딩 서열)는 각각 추정 내막 수송 단백질 (서열 번호 82) 및 외막 포린 (서열 번호 84)을 암호화한다. aldH 유전자 (서열 번호 19에 개시된 코딩 서열, puuC의 동의어)는 γ-글루타밀-γ-아미노부티르알데히드 데하이드로게나아제 (서열 번호 20)를 암호화하는데, 이는 퓨트레신 이용 경로의 일부이다. 하류 puuB 및 puuE 유전자는 각각 γ-글루타밀퓨트레신 옥시다아제 및 4-아미노부티레이트 아미노트랜스퍼라아제를 암호화한다.
다른 숙주 박테리아에서의 에스케리키아 콜라이 yihP 및 yihO 유전자의 상동체는 당업계에 공지된 방법을 이용하여 동정될 수 있다. 예를 들어, BLASTN과 같은 서열 분석 소프트웨어를 사용하여 공공 이용이 가능한 핵산 서열 데이터베이스를 검색함으로써, yihP 및 yihO유전자의 상동체를 동정할 수 있다. 부가적으로, 서열-의존성 프로토콜을 사용하는 상동 유전자의 단리는 당업계에 공지되어 있다. 서열-의존성 프로토콜의 예들로는, 이에 제한되지는 않지만, 핵산 혼성화 방법, DNA 및 RNA 증폭 방법이 포함되며, 이는 핵산 증폭 기술(예로서, 폴리머라아제 연쇄반응 (PCR) (Mullis 등의 미국 특허 제4,683,202호); 리가아제 연쇄 반응 (LCR) (Tabor, S. 등의 문헌[Proc. Acad. Sci. USA 82, 1074, 1985]); 또는 가닥 대체 증폭(SDA: strand displacement amplification)(Walker 등, 문헌[ Proc. Natl. Acad. Sci. U.S.A., 89: 392, (1992)]). 예를 들어, 상기 폴리펩티드를 암호화하는 뉴클레오티드 서열을 상동체의 동정을 위한 혼성화 탐침자로 이용할 수 있다.
yihP의 상동체의 예에는 시겔라 플렉스네리의 추정 퍼미아제 YP_690957 (서열 번호 85에 개시된 코딩 서열), 살모넬라 엔테리카의 GPH 패밀리 수송 단백질 NP_462898 (서열 번호 86에 개시된 코딩 서열), 엔테로박터 칸세로게누스 ATCC(등록상표) 35316의 가상 단백질 ENTCAN_09547 (서열 번호 87에 개시된 코딩 서열), 및 시트로박터 코세리 ATCC(등록상표) BAA-895의 가상 단백질 CKO_03136 (서열 번호 88에 개시된 코딩 서열)이 포함되지만, 이에 한정되지 않는다. yihO의 상동체의 예에는 시겔라 플렉스네리의 추정 퍼미아제 YP_690958 (서열 번호 89에 개시된 코딩 서열), 살모넬라 엔테리카의 GPH 패밀리 수송 단백질 NP_462897 (서열 번호 90에 개시된 코딩 서열), 엔테로박터 칸세로게누스 ATCC(등록상표) 35316의 가상 단백질 ENTCAN_09546 (서열 번호 91에 개시된 코딩 서열), 및 시트로박터 코세리 ATCC(등록상표) BAA-895의 가상 단백질 CKO_03137 (서열 번호 92에 개시된 코딩 서열)이 포함되지만, 이에 한정되지 않는다. 이들 yihP 및 yihO 상동체는 이. 콜라이에서와 같이 숙주 염색체들 각각에 있어서 서로에 인접한다.
본 명세서에서 개시된 재조합 박테리아의 제작에서의 이용에 적합한 숙주 박테리아는 하기 속의 유기체를 포함하지만, 이에 한정되지 않는다: 에스케리키아, 스트렙토코커스, 아그로박테리움, 바실러스(Bacillus), 코리네박테리움(Corynebacterium), 락토바실러스, 클로스트리듐, 글루코노박터(Gluconobacter), 시트로박터, 엔테로박터(Enterobacter), 클렙시엘라, 에어로박터(Aerobacter), 메틸로박터(Methylobacter), 살모넬라, 스트렙토마이세스, 및 슈도모나스.
일 실시 형태에서 숙주 박테리아는 에스케리키아, 클렙시엘라, 시트로박터, 및 에어로박터 속으로부터 선택된다.
또 다른 실시 형태에서, 숙주 박테리아는 에스케리키아 콜라이이다. 일부 실시 형태에서, 숙주 박테리아는 PTS 음성이다. 이들 실시 형태에서, 숙주 박테리아는 그의 천연 상태에서 PTS 음성이거나, 하기와 같이 PTS 유전자의 불활성화를 통해 PTS 음성이 되게 할 수 있다.
생산 미생물에서는, 당의 수송과 수송되는 당의 인산화를 위한 포스포에놀피루베이트(PEP)의 사용을 연결하지 않는 것이 간혹 바람직하다.
"하향 조절된(down-regulated)"이라는 용어는 야생형 단백질(들)의 활성에 비하여, 활성 단백질(들)의 활성에서의 감소 또는 제거를 지칭한다. PTS는, 이러한 유형의 수송에서 요구되는 단백질을 암호화하는 하나 이상의 내인성 유전자의 하향 조절 발현에 의하여 비활성화될 수 있다("PTS 음성" 생물을 야기함). 하향 조절은 하나 이상의 이들 유전자가 "붕괴"하는 경우 전형적으로 일어나며, 이는 유전자의 일부 내에서 삽입, 결실 또는 표적된 돌연변이를 지칭하며, 이는 해당 유전자가 게놈에서 제거되고, 단백질이 번역되지 않는 완전한 유전자 넉아웃(knockout)을 초래하거나 또는 단백질이 삽입, 결실, 아미노산 치환 또는 다른 표적된 돌연변이를 갖도록 번역되도록 한다. 단백질 내의 파괴의 위치는, 예를 들어 단백질의 N-말단 부분 내에, 또는 단백질의 C-말단 부분 내에 존재할 수 있다. 파괴된 단백질은 파괴되지 않은 단백질에 비해 손상된 활성을 가질 것이며, 비-기능성일 수 있다. 단백질 발현이 낮거나 결여되게 하는 하향 조절은 또한, 조절 서열, 전사 및 번역 인자 및/또는 신호 전달(signal transduction) 경로의 조작을 통해, 또는 센스, 안티센스 또는 RNAi 기술 등의 사용에 의해 유발될 수 있다.
수크로스 수송체 폴리펩티드 또는 폴리펩티드 복합체는, 미생물 세포 내로의 수크로스의 수송을 매개할 수 있는 폴리펩티드 또는 폴리펩티드 복합체이다. 수크로스 수송 폴리펩티드 및 폴리펩티드 복합체는 상기와 같이 공지되어 있다. 수크로스 수송체 활성을 갖는 폴리펩티드의 예에는 cscB 유전자 (서열 번호 23에 개시된 코딩 서열)에 의해 암호화되는, 이. 콜라이 야생형 주 EC3132 유래의 CscB (서열 번호 24에 개시됨); cscB 유전자 (서열 번호 25에 개시된 코딩 서열)에 의해 암호화되는, 이. 콜라이 ATCC(등록상표)13281 유래의 CscB (서열 번호 26에 개시됨); 및 cscB 유전자 (서열 번호 27에 개시된 코딩 서열)에 의해 암호화되는, 비피도박테리움 락티스 유래의 CscB (서열 번호 28에 개시됨)가 포함되지만, 이에 한정되지 않는다. 수크로스 수송체 활성을 갖는 폴리펩티드 복합체의 예에는 susT1 유전자 (서열 번호 29에 개시된 코딩 서열), susT2 유전자 (서열 번호 31에 개시된 코딩 서열), 및 susX 유전자 (서열 번호 33에 개시된 코딩 서열)에 의해 암호화되는, 서열 번호 30, 32 및 34에 개시된 3개의 폴리펩티드 서브유닛을 포함하는, 스트렙토코커스 뉴모니아 주 TIGR4 유래의 수크로스 ABC형 수송체 복합체; 및 각각 malE 유전자 (서열 번호 35에 개시된 코딩 서열), malF 유전자 (서열 번호 37에 개시된 코딩 서열), malG 유전자 (서열 번호 39에 개시된 코딩 서열), 및 malK 유전자 (서열 번호 41에 개시된 코딩 서열)에 의해 암호화되는, 서열 번호 36, 38, 40 및 42에 개시된 4개의 폴리펩티드 서브유닛을 포함하는 스트렙토코커스 뮤탄스의 말토스 수송체 복합체가 포함되지만, 이에 한정되지 않는다.
일 실시 형태에서, 수크로스 수송체 활성을 갖는 폴리펩티드는, 서열 번호 24, 서열 번호 26, 또는 서열 번호 28에 개시된 아미노산 서열에 대해, 클러스탈 W 정렬법을 기준으로 적어도 95%의 서열 동일성을 갖는다.
다른 실시 형태에서, 수크로스 수송체 폴리펩티드는 박테리아에서 더욱 빠른 수크로스 이용을 가능하게 하는, 이. 콜라이 ATCC(등록상표)13281 유래의 야생형 수크로스 수송체 폴리펩티드 CscB (서열 번호 26에 개시됨, 서열 번호 25에 개시된 뉴클레오티드 코딩 서열)의 변이체이다. 이들 변이형 수크로스 수송체 폴리펩티드는 수크로스 상에서 더욱 빠른 성장을 나타내는 변이형 이. 콜라이 주로부터 단리되었거나, 또는 포화 돌연변이 유발에 의해 동정되었는데, 이는 본 출원과 공계류 중인 그리고 공히 소유된 미국 특허 출원 제13/210,488호에 기재되어 있는 바와 같았다. 변이형 수크로스 수송체 폴리펩티드는 클러스탈 W 정렬법을 기반으로 하면 서열 번호 26에 개시된 아미노산 서열에 대하여 동일성이 95% 이상이며 하기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 변화를 갖는 아미노산 서열을 갖는다:
(i) 위치 61에서 류신에서 프롤린으로의 변화;
(ii) 위치 159에서 페닐알라닌에서 류신으로의 변화;
(iii) 위치 162에서 글라이신에서 시스테인으로의 변화;
(iv) 위치 169에서 프롤린에서 히스티딘으로의 변화;
(v) 위치 61에서 류신에서 트립토판으로의 변화;
(vi) 위치 61에서 류신에서 히스티딘으로의 변화;
(vii) 위치 61에서 류신에서 페닐알라닌으로의 변화; 및
(viii) 위치 61에서 류신에서 타이로신으로의 변화.
다른 실시 형태에서, 변이형 수크로스 수송체 폴리펩티드는 클러스탈 W 정렬법을 기반으로 하면 서열 번호 94에 개시된 아미노산 서열 (서열 번호 93에 개시된 코딩 서열)에 대하여 동일성이 95% 이상이며, N-말단으로부터 402 내지 407개 아미노산의 길이를 갖는 아미노산 서열을 갖는다.
다른 실시 형태에서, 변이형 수크로스 수송체 폴리펩티드는 클러스탈 W 정렬법을 기반으로 하면 서열 번호 94에 개시된 아미노산 서열에 대하여 동일성이 95% 이상이며, N-말단으로부터 402 내지 407개 아미노산의 길이를 갖고, 상기에 열거된 아미노산 변화들 중 하나 이상을 갖는 아미노산 서열을 갖는다.
다른 실시 형태에서, 변이형 수크로스 수송체 폴리펩티드는 하기로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는다: 서열 번호 94, 서열 번호 96, 서열 번호 98, 서열 번호 100, 서열 번호 102, 서열 번호 104, 서열 번호 106, 서열 번호 108, 및 서열 번호 110.
다른 실시 형태에서, 수크로스 수송체 활성을 갖는 폴리펩티드 복합체는 하기를 포함한다: 서열 번호 30에 개시된 아미노산 서열과 비교할 때 클러스탈 W 정렬법을 기반으로 하면 서열 동일성이 95% 이상인 제1 서브유닛; 서열 번호 32에 개시된 아미노산 서열과 비교할 때 클러스탈 W 정렬법을 기반으로 하면 서열 동일성이 95% 이상인 제2 서브유닛; 및 서열 번호 34에 개시된 아미노산 서열과 비교할 때 클러스탈 W 정렬법을 기반으로 하면 서열 동일성이 95% 이상인 제3 서브유닛.
다른 실시 형태에서, 수크로스 수송체 활성을 갖는 폴리펩티드 복합체는 하기를 포함한다: 서열 번호 36에 개시된 아미노산 서열과 비교할 때 클러스탈 W 정렬법을 기반으로 하면 서열 동일성이 95% 이상인 제1 서브유닛; 서열 번호 38에 개시된 아미노산 서열과 비교할 때 클러스탈 W 정렬법을 기반으로 하면 서열 동일성이 95% 이상인 제2 서브유닛; 및 서열 번호 40에 개시된 아미노산 서열과 비교할 때 클러스탈 W 정렬법을 기반으로 하면 서열 동일성이 95% 이상인 제3 서브유닛; 및 서열 번호 42에 개시된 아미노산 서열과 비교할 때 클러스탈 W 정렬법을 기반으로 하면 서열 동일성이 95% 이상인 제4 서브유닛.
다른 실시 형태에서, 수크로스 수송체 활성을 갖는 폴리펩티드는 서열 번호 26 또는 서열 번호 96에 개시된 아미노산 서열에 사실상 상응한다.
프룩토키나아제 활성을 갖는 폴리펩티드는 프룩토키나아제 (EC 2.7.1.4로 명명됨) 및 프룩토스 포스포릴화 활성을 갖는 각종 헥소스 키나아제(EC 2.7.1.3 및 EC 2.7.1.1)를 포함한다. 프룩토스 포스포릴화 활성은 헥소키나아제 및 케토헥소키나아제에 의해 나타날 수 있다. 본 명세서에 개시된 재조합 박테리아를 제작하기 위해 사용될 수 있는, 다양한 미생물로부터의 폴리펩티드를 암호화하는 대표적인 유전자들은 표 1에 열거되어 있다. 프룩토스를 인산화할 수 있는 단백질과 실질적으로 유사한 단백질(예를 들어, 표 1에 열거된 유전자에 의해 암호화되는 것) 또한 사용할 수 있다는 것을, 당업자는 알 것이다.
일 실시 형태에서, 프룩토키나아제 활성을 갖는 폴리펩티드는, 서열 번호 44, 서열 번호 46, 서열 번호 48, 서열 번호 50, 서열 번호 52, 서열 번호 54, 서열 번호 112, 또는 서열 번호 114에 개시된 아미노산 서열에 대해, 클러스탈 W 정렬법을 기반으로 하면 95% 이상의 서열 동일성을 갖는다.
다른 실시 형태에서, 프룩토키나아제 활성을 갖는 폴리펩티드는, 서열 번호 48에 개시된 서열에 실질적으로 상응한다.
수크로스 하이드롤라아제 활성을 갖는 폴리펩티드는, 수크로스를 가수분해하여 프룩토스 및 글루코스를 생산하는 촉매 작용을 하는 능력을 갖는다. 상기에 기재된 바와 같이, 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드는 공지되어 있으며, cscA 유전자 (서열 번호 55에 개시된 코딩 서열)에 의해 암호화되는, 이. 콜라이 야생형 주 EC3132 유래의 CscA (서열 번호 56에 개시됨), cscA 유전자 (서열 번호 57에 개시된 코딩 서열)에 의해 암호화되는, 이. 콜라이 ATCC(등록상표)13821 유래의 CscA (서열 번호 58에 개시됨); bfrA 유전자 (서열 번호 59에 개시된 코딩 서열)에 의해 암호화되는, 비피도박테리움 락티스 주 DSM 10140T 유래의 BfrA (서열 번호 60에 개시됨); SUC2 유전자 (서열 번호 61에 개시된 코딩 서열)에 의해 암호화되는, 사카로마이세스 세레비지애 유래의 Suc2p (서열 번호 62에 개시됨); scrB 유전자 (서열 번호 63에 개시된 코딩 서열)에 의해 암호화되는, 코리네박테리움 글루타미쿰 유래의 ScrB (서열 번호 64에 개시됨); 서열 번호 65에 개시된 유전자를 암호화하는 코딩 서열, 류코노스톡 메센테로이데스 DSM 20193 유래의 수크로스 포스포릴라아제 (서열 번호 66에 개시됨); 및 sucP 유전자 (서열 번호 67에 개시된 코딩 서열)에 의해 암호화되는, 비피도박테리움 아돌레센티스 DSM 20083 유래의 수크로스 포스포릴라아제 (서열 번호 68에 개시됨)를 포함하지만, 이에 한정되지 않는다.
일 실시 형태에서, 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드는, 서열 번호 56, 서열 번호 58, 서열 번호 60, 서열 번호 62, 서열 번호 64, 서열 번호 66, 또는 서열 번호 68에 개시된 아미노산 서열에 대해, 클러스탈 W 정렬법을 기초로 하여 95% 이상의 서열 동일성을 갖는다.
다른 실시 형태에서, 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드는 서열 번호 58에 개시된 아미노산 서열에 실질적으로 상응한다.
수크로스 수송체 활성을 갖는 폴리펩티드 또는 폴리펩티드 복합체, 프룩토키나아제 활성을 갖는 폴리펩티드, 및 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 유전자의 코딩 서열을 사용하여, 동일하거나 다른 미생물 종으로부터 상동 폴리펩티드를 암호화하는 뉴클레오티드 서열을 단리할 수 있다. 예를 들어, 유전자들의 상동체는 상기에 기재된 바와 같이 당업계에 공지된 방법을 사용하여 동정될 수 있다.
다른 공급원으로부터 단리된 이들 폴리펩티드를 암호화하는 유전자 또한 본 명세서에 개시된 재조합 박테리아에 사용할 수 있다는 것을, 당업자는 인식할 것이다. 부가적으로, 코돈 축퇴성으로 인해 암호화된 폴리펩티드의 아미노산 서열에 영향을 미치지 않으면서 폴리펩티드를 암호화하는 뉴클레오티드 서열에 변이를 만들 수 있으며, 실질적으로 유사한 단백질을 생산하는 그 아미노산 치환, 결실 또는 부가는 암호화된 단백질에 포함될 수 있다.
PCR(예를 들어, 미국 특허 제4,683,202호 참조) 및 목적하는 서열에 결합하도록 고안된 프라이머(이 서열이 공지된 경우)를 사용하여, 수크로스 수송체 활성을 갖는 폴리펩티드 또는 폴리펩티드 복합체, 프룩토키나아제 활성을 갖는 폴리펩티드, 및 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 단리할 수 있다. 축퇴 프라이머(degenerate primer) 또는 이종 탐침 혼성화의 사용에 의한 것과 같은 유전자 단리의 다른 방법이 당업자에게 주지되어 있다. 뉴클레오티드 서열은 또한, 화학적으로 합성하거나 DNA2.0 인크.(DNA2.0 Inc.)(캘리포니아주 멘로 파크 소재)와 같은 판매원으로부터 구매할 수 있다. 부가적으로, 전체 야생형 csc 오페론은 이. 콜라이 주 ATCC(등록상표)13281의 게놈 DNA로부터 단리될 수 있거나 또는 변이형 csc 오페론은 변이형 박테리아로부터 단리되어 yihP 유전자 또는 그 상동체와 yihO 유전자 또는 그 상동체 사이의 숙주 박테리아 게놈 내에 통합될 수 있으며, 이는 본 명세서의 실시예 1 및 실시예 3에 상세하게 기재된 바와 같다.
상기에 기재된 폴리펩티드들을 암호화하는 뉴클레오티드 서열들은 예를 들어 본 명세서의 실시예 1 내지 실시예 4 및 실시예 7 내지 실시예 10에 기재된 바와 같은 당업계에 공지된 부위-특이적 재조합 시스템을 이용하여 코딩 서열들의 하나 이상의 카피를 yihP 유전자 또는 그 상동체와 yihO 유전자 또는 그 상동체 사이의 숙주 게놈 내에 통합시킴으로써 숙주 박테리아 내에 도입된다. 게놈 내에 도입된 코딩 영역은 적어도 하나의 고도로 활성인 프로모터로부터 발현될 수 있다. 통합된 코딩 영역은 그 자신의 프로모터를 갖는 키메라 유전자의 일부로서 도입될 수도 있고, 게놈에 내인성인 고도로 활성인 프로모터에 인접하여, 또는 고도로 발현되는 오페론 내에, 그것이 통합될 수도 있다. 적합한 프로모터는, CYC1, HIS3, GAL1, GAL10, ADH1, PGK, PHO5, GAPDH, ADC1, TRP1, URA3, LEU2, ENO, and lac, ara, tet, trp, lPL, lPR, T7, tac, 및 trc (에스케리키아 콜라이에서의 발현에 유용함)와, amy, apr, npr 프로모터 및 다양한 파아지 프로모터 (바실러스에서의 발현에 유용함)를 포함하지만, 이에 한정되지 않는다. 프로모터는, 페인(Payne) 등 (미국 특허 제7,132,527호)에 의해 설명된, 스트렙토마이세스 리비단스 글루코스 이성화 효소 프로모터 또는 그의 변이체일 수도 있다.
일 실시 형태에서, 본 명세서에 개시된 재조합 박테리아는 글리세롤을 생산할 수 있다. 탄수화물 또는 당을 사용하여 글리세롤을 제조하기 위한 생물학적 방법은 효모 및 일부 박테리아, 다른 진균류, 및 조류에서 공지되어 있다. 박테리아 및 효모 양자 모두는, 해당 작용의 프룩토스-1,6-비스포스페이트 경로를 통해 글루코스 또는 다른 탄수화물을 전환함으로써 글리세롤을 생산한다. 본 명세서에 개시된 글리세롤 생산 방법에서는, 자연적으로 글리세롤을 생산하는 숙주 박테리아를 사용할 수 있다. 또한, 글리세롤 및 글리세롤 유도체의 생산을 위해 박테리아를 조작할 수 있다. 미국 특허 제7,005,291호에 기술된 바와 같이, 다양한 기질로부터 글리세롤을 생산하는 능력은 효소 활성 글리세롤-3-포스페이트 데하이드로게나아제(G3PDH) 및/또는 글리세롤-3-포스파타아제의 발현을 통해 제공될 수 있다. 숙주 박테리아에서 효소 활성을 발현시키기 위해 사용될 수 있는 이들 단백질을 암호화하는 유전자는 미국 특허 제7,005,291호에 기술되어 있다. 글리세롤-3-포스페이트 데하이드로게나아제 활성을 갖는 폴리펩티드를 암호화하는 유전자의 적합한 예는 사카로마이세스 세레비시애로부터의 GPD1(서열 번호 1에 개시된 코딩 서열, 서열 번호 2에 개시된 암호화된 단백질 서열) 및 사카로마이세스 세레비시애로부터의 GPD2(서열 번호 3에 개시된 코딩 서열, 서열 번호 4에 개시된 암호화된 단백질 서열)를 포함하지만, 이에 한정되지 않는다. 글리세롤-3-포스파타아제 활성을 갖는 폴리펩티드를 암호화하는 유전자의 적합한 예는 사카로마이세스 세레비시애로부터의 GPP1(서열 번호 5에 개시된 코딩 서열, 서열 번호 6에 개시된 암호화된 단백질 서열) 및 사카로마이세스 세레비시애로부터의 GPP2(서열 번호 7에 개시된 코딩 서열, 서열 번호 8에 개시된 암호화된 단백질 서열)를 포함하지만, 이에 한정되지 않는다.
표적 내인성 유전자의 발현을 감소시킴으로써 글리세롤의 증가된 생산을 달성할 수 있다. 미국 특허 제7,005,291호에 기술된 바와 같이, 글리세롤 키나아제 및 글리세롤 데하이드로게나아제 활성을 암호화하는 내인성 유전자의 하향 조절은 글리세롤 생산을 더욱 증진시킨다. 탄소에서 글리세롤로의 증가된 채널링(channeling)은 미국 특허 제7,371,558호에 기재된 것과 같은, 글리세르알데히드 3-포스페이트 데하이드로게나아제를 암호화하는 내인성 유전자의 발현을 감소시킴으로써 달성될 수 있다. 하향 조절은 당 분야에서 알려진 임의의 방법, 예로서 PTS계의 유전자의 하향 조절에 대하여 상기 설명된 방법을 이용하여 달성될 수 있다.
글리세롤은 유용한 산물의 미생물 생산을 위한 기질을 제공한다. 이러한 산물, 즉, 글리세롤 유도체의 예는 3-하이드록시프로피온산, 메틸글리옥살, 1,2-프로판다이올, 및 1,3-프로판다이올을 포함하지만, 이에 한정되지 않는다.
다른 실시 형태에서, 본 명세서에 개시된 재조합 박테리아는 1,3-프로판다이올을 생산할 수 있다. 글리세롤 유도체 1,3-프로판다이올은 폴리에스테르 섬유의 생산 및 폴리우레탄 및 환형 화합물의 제조에 있어서 잠재적 이용성을 갖는 단량체이다. 미국 특허 제5,686,276호에 기재된 바와 같이, 1,3-프로판다이올은 글리세롤 또는 다이하이드록시아세톤 이외의 탄소 기질의 생물전환에 의해 단일 미생물에 의해 생성될 수 있다. 이 생물전환에서는, 상기와 같이 탄소 기질로부터 글리세롤이 생산된다. 숙주 박테리아에 의해 암호화될 수 있거나 재조합에 의해 숙주 내로 도입될 수 있는 데하이드라타아제 효소에 의해 글리세롤이 중간체 3-하이드록시프로피온알데히드로 전환된다. 데하이드라타아제는 글리세롤 데하이드라타아제 (E.C. 4.2.1.30), 다이올 데하이드라타아제 (E.C. 4.2.1.28) 또는 이러한 전환을 촉매할 수 있는 임의의 다른 효소일 수 있다. 글리세롤 데하이드라타아제의 "α"(알파), "β"(베타), 및 "γ"(감마) 서브유닛을 암호화하는 유전자의 적합한 예는, 각각 클렙시엘라 뉴모니아로부터의 dhaB1(서열 번호 9에 개시된 코딩 서열), dhaB2(서열 번호 11에 개시된 코딩 서열), 및 dhaB3(서열 번호 13에 개시된 코딩 서열)을 포함하지만, 이에 한정되지 않는다. 3-하이드록시프로피온알데히드의 1,3-프로판다이올로의 추가의 전환은 1,3-프로판다이올 데하이드로게나아제 (E.C. 1.1.1.202) 또는 다른 알코올 데하이드로게나아제에 의하여 촉매될 수 있다. 1,3-프로판다이올 데하이드로게나아제를 암호화하는 유전자의 적합한 예는 클렙시엘라 뉴모니아로부터의 dhaT (서열 번호 70에 개시된 암호화된 단백질 서열, 서열 번호 69에 개시된 코딩 서열)이다.
박테리아를 재조합 조작하여 글리세롤 및 글리세롤 유도체 1,3-프로판다이올의 더욱 효율적인 생산을 제공할 수 있다. 예를 들어, 미국 특허 제7,005,291호는 내인성 활성 글리세롤 키나아제 및 글리세롤 데하이드로게나아제 중 하나 또는 양자 모두를 파괴하는 한편, 글리세롤-3-포스페이트 데하이드로게나아제 및 글리세롤-3-포스페이트 포스파타아제 중 하나 또는 양자 모두의 외인성 활성을 발현시킴으로부터 유래하는 이점을 가진, 형질전환된 미생물 및 글리세롤 및 1,3-프로판다이올의 생성 방법을 개시한다.
미국 특허 제6,013,494호는, 외인성의 글리세롤-3-포스페이트 데하이드로게나아제, 글리세롤-3-포스페이트 포스파타아제, 데하이드라타아제 및 1,3-프로판다이올 옥시도리덕타아제 (예로서, dhaT)를 포함하는 단일한 미생물을 이용한 1,3-프로판다이올의 생산 방법을 기재한다. 미국 특허 제6,136,576호는, 데하이드라타아제 및 단백질 X (이후 데하이드라타아제 재활성화 인자 펩티드로서 동정됨)를 더 포함하는 재조합 미생물을 포함하는 1,3-프로판다이올의 생성 방법을 개시한다.
미국 특허 제6,514,733호는, 3-하이드록시프로피온알데히드를 1,3-프로판다이올로 전환시키는 비-특이적 촉매 활성에 의하여 (dhaT에 의하여 암호화된 1,3-프로판다이올 옥시도리덕타아제와 구분됨) 역가(titer)의 유의한 증가(리터당 생성물 g)가 수득되는 공정 개선을 기재한다. 부가적으로, 미국 특허 제7,132,527호는 1,3-프로판다이올의 생성에 유용한 벡터 및 플라스미드를 개시한다.
1,3-프로판다이올의 증가된 생산은 숙주 미생물에 대한 추가의 변형에 의하여 달성될 수 있으며, 이러한 변형은 일부 표적 유전자의 하향 조절 발현 및 다른 표적 유전자의 상향 조절 발현을 달성하는 것을 포함하며, 이는 미국 특허 제7,371,558호에 기재된 바와 같다. PTS 음성 숙주에서 탄소 공급원으로서 글루코스를 이용하는 경우, 글루코키나아제 활성의 발현이 증가될 수 있다.
유전자의 증가된 발현 또는 상향 조절된 발현이 1,3-프로판다이올 생산을 증가시키는 부가적인 유전자는 하기의 것들을 암호화하는 유전자를 포함한다:
● 전형적으로 EC 4.1.1.31로 특성화되는 포스포에놀피루베이트 카르복실라아제
● 전형적으로 EC 2.5.1.17로 특성화되는 Cob(I)알라민 아데노실트랜스퍼라아제
● 3-HPA 및 1,3-프로판다이올의 상호 전환을 촉매하기에 충분하며, 특이적으로 1,3-프로판다이올 옥시도리덕타제(들)를 배제하는 비-특이적 촉매 활성(전형적으로 이들 효소는 알코올 데하이드로게나아제임)
유전자의 감소된 발현 또는 하향 조절된 발현이 1,3-프로판다이올 생산을 증가시키는 유전자는 하기의 것들을 암호화하는 유전자를 포함한다:
● 호기성 호흡 제어 단백질
● 메틸글리옥살 신타아제
● 아세테이트 키나아제
● 포스포트랜스아세틸라아제
● 알데히드 데하이드로게나아제 A
● 알데히드 데하이드로게나아제 B
● 트라이오스포스페이트 아이소머라아제
● 포스포글루코네이트 데하이드라타아제
다른 실시 형태에서, 본 명세서에 개시된 재조합 박테리아는 3-하이드록시프로피온산을 생산할 수 있다. 3-하이드록시프로피온산은 특수 합성에 있어서 이용성을 가지며, 화학 산업의 공지 기술에 의해 상업적으로 중요한 중간체로 전환될 수 있다(예를 들어, 탈수에 의한 아크릴산, 산화에 의한 말론산, 알코올과의 에스테르화 반응에 의한 에스테르, 및 환원에 의한 1,3-프로판다이올). 본 출원과 공계류 중인 그리고 공히 소유된 미국 특허 출원 제61/187476호에 기술된 바와 같이, 3-하이드록시프로피온산은 단일 미생물에 의해 발효성 탄소 공급원으로부터 생물학적으로 생산될 수 있다. 1,3-프로판다이올의 생산에 관해 상기 기술된 바와 같이, 한 가지 대표적인 생합성 경로에서는 탄소 기질이 3-하이드록시프로피온알데히드로 전환된다. 3-하이드록시프로피온알데히드는 알데히드 데하이드로게나아제에 의해 3-하이드록시프로피온산으로 전환된다. 알데하이드 데하이드로게나아제의 적합한 예들로, 이에 제한되지는 않지만, 이. 콜라이 유전자 aldB에 의하여 암호화되는 AldB (서열 번호 16) (서열 번호 15에 설명된 코딩 서열); 이. 콜라이 유전자 aldA에 의하여 암호화되는 AldA (서열 번호 18) (서열 번호 17에 설명된 코딩 서열); 및 이. 콜라이유전자 aldH 에 의하여 암호화되는 AldH (서열 번호 20) (서열 번호 19에 설명된 코딩 서열)가 포함된다.
재조합 박테리아에 의해 1,3-프로판다이올 생산을 개선하기 위한 상기 변형 중 다수는 또한, 3-하이드록시프로피온산 생산을 개선하게 만들 수 있다. 예를 들어, 글리세롤 키나아제의 제거는 G3P 포스파타아제의 작용에 의해 G3P로부터 형성되는 글리세롤이 ATP를 소모하면서 G3P로 재전환되는 것을 방지한다. 또한, 글리세롤 데하이드로게나아제(예를 들어, gldA)의 제거는 NAD-의존성 글리세롤-3-포스페이트 데하이드로게나아제의 작용에 의해 DHAP로부터 형성되는 글리세롤이 다이하이드록시아세톤으로 전환되는 것을 방지한다. 돌연변이는, 효소 활성의 활성을 손상시키거나 개선하도록 구조 유전자를 지향할 수도 있고, 효소 활성의 발현 수준을 조정하도록 프로모터 영역 및 리보좀 결합 부위를 포함하는 조절 유전자를 지향할 수도 있다.
상향 조절 또는 하향 조절은 당업자에게 공지된 다양한 방법에 의해 달성될 수 있다. 유전자의 상향 조절 또는 하향 조절은, 그 유전자에 의해 암호화되는 단백질로부터 유래하는 세포 내에 존재하는 활성 수준이, 예를 들어 상응하는(또는 변경되지 않은) 야생형 유전자에 의해 암호화되는 단백질의 활성에 의한 대조군 활성 수준에 비교하여 변경됨을 지칭한다는 것이 주지되어 있다.
효소 경로에 관련되는 특정 유전자를 상향 조절하여 그들의 암호화된 기능(들)의 활성을 증가시킬 수 있다. 예를 들어, 선택된 유전자의 부가적인 카피를 pBR322와 같은 다중 카피 플라스미드 상에 숙주 세포 내로 도입할 수 있다. 이러한 유전자는 또한, 그들의 암호화된 기능의 증가된 활성을 유발하는 적절한 조절 서열과 함께 염색체 내로 통합될 수 있다. 비-천연 프로모터 또는 변경된 천연 프로모터의 제어 하에 있도록 표적 유전자를 변형시킬 수 있다. 돌연변이, 결실, 및/또는 치환에 의하여 내인성 프로모터를 생체 내 변경할 수 있다.
대안적으로, 소정의 유전자의 발현을 주어진 활성 수준에 대해 감소시키거나 제거하는 것이 유용할 수 있다. 유전자를 하향 조절(파괴)하는 방법은 당업자에게 공지되어 있다.
하향 조절은 코딩 영역 및/또는 조절(프로모터) 영역의 결실, 삽입, 또는 변경에 의해 발생할 수 있다. 무작위 돌연변이 후의 스크리닝 또는 선택에 의해, 또는 유전자 서열이 공지된 경우에는 당업자에게 공지된 분자생물학 방법에 의한 직접 개입에 의해, 특정 하향 조절을 얻을 수 있다. 하향 조절이 이루어지게 하는 특히 유용하나 배타적이지 않은 방법은 프로모터 강도를 변경하는 것이다.
또한, 유전자 발현의 하향 조절을 사용하여 관심의 대상인 단백질의 발현을 방지하거나 비-기능성인 단백질의 발현을 유발할 수 있다. 이는 예를 들어, 1) 코딩 영역 및/또는 조절(프로모터) 영역의 결실, 2) 코딩 영역 및/또는 조절(프로모터) 영역 내로의 외인성 핵산 서열의 삽입, 및 3) 코딩 영역 및/또는 조절(프로모터) 영역의 변경(예를 들어, DNA 염기쌍을 변화시킴으로써)에 의해 이루어질 수 있다. 무작위 돌연변이 후의 스크리닝 또는 선택에 의해 특정 파괴를 얻을 수도 있거나, 유전자 서열이 공지된 경우에는 당업자에게 공지된 분자생물학 방법을 사용하는 직접 개입에 의해 특정 파괴를 얻을 수도 있다. 특히 유용한 방법은 유의적인 양의 코딩 영역 및/또는 조절(프로모터) 영역의 결실이다.
재조합 단백질 발현을 변경하는 방법은 당업자에게 공지되어 있으며, 문헌[Baneyx, Curr. Opin. Biotechnol. (1999) 10:411]; 문헌[Ross, et al., J. Bacteriol. (1998) 180:5375]; 문헌[deHaseth, et al., J. Bacteriol. (1998) 180:3019]; 문헌[Smolke and Keasling, Biotechnol. Bioeng. (2002) 80:762]; 문헌[Swartz, Curr. Opin. Biotech. (2001) 12:195]; 및 문헌[Ma, et al., J. Bacteriol. (2002) 184:5733]에 부분적으로 논의되어 있다.
글리세롤 및 글리세롤 유도체를 포함하는 미생물 산물의 생산에 있어서 수크로스를 대사시키기 위한 유전자 발현에 필요한 변화를 포함하는 재조합 박테리아는, 상기와 같이, 당업계에 주지된 기술을 사용하여 제작할 수 있으며, 이들 중 일부는 본 명세서의 실시예에 예시되어 있다.
본 명세서에 개시된 재조합 박테리아의 제작은, 적합한 숙주 미생물 내에서의 글리세롤 및 그의 유도체의 생산에 수크로스를 이용하는 능력을 부여하는 코딩 영역의 클로닝, 형질전환 및 발현에 적합한 다양한 벡터 및 형질전환 및 발현 카세트를 사용하여 이루어질 수 있다. 적합한 벡터는 채용되는 박테리아와 상용성인 것들이다. 적합한 벡터는, 예를 들어 박테리아, 바이러스(예를 들어, 박테리오파아지 T7 또는 M-13 유래의 파아지), 코스미드, 효모 또는 식물로부터 유래될 수 있다. 이러한 벡터를 얻고 사용하기 위한 프로토콜은 당업자에게 공지되어 있다(샘브룩(Sambrook) 등의 상기 문헌).
목적하는 숙주 박테리아에서 본 발명을 위한 코딩 영역의 발현을 추진하기에 유용한 개시 제어 영역, 또는 프로모터는 다수이며 당업자에게 잘 알려져 있다. 발현을 추진할 수 있는 사실상 임의의 프로모터가 본 명세서에 사용하기에 적합하다. 예를 들어, 상기 열거된 프로모터 중 임의의 것을 사용할 수 있다.
종결 조절 영역은 또한 바람직한 숙주의 다양한 천연의 유전자로부터 유래될 수 있다. 선택적으로, 종결 부위는 불필요할 수도 있지만; 포함되는 경우가 가장 바람직하다.
본 폴리펩티드의 효과적인 발현을 위하여, 폴리펩티드를 암호화하는 뉴클레오티드 서열을 선택된 발현 제어 영역에 개시 코돈을 통해 작동가능하게 연결하여, 발현이 적절한 메신저 RNA의 형성을 유발하도록 한다.
벡터 pSYCO101, pSYCO103, pSYCO106, 및 pSYCO109(미국 특허 제7,371,558호에 기술됨), 및 pSYCO400/AGRO(미국 특허 제7,524,660호에 기술됨)가 본 발명에 특히 유용하다. 이들 벡터의 필수 요소는 클렙시엘라 뉴모니아 및 사카로마이세스 세레비시애로부터 단리된 dha 레귤론으로부터 유래된다. 각각의 벡터는 오픈 리딩 프레임들 dhaB1, dhaB2, dhaB3 , dhaX (서열 번호 71에 개시된 코딩 서열), orfX, DAR1, 및 GPP2 (3개의 별도 오페론으로 배열됨)를 함유한다. pSYCO101, pSYCO103, pSYCO106, pSYCO109, 및 pSYCO400/AGRO의 뉴클레오티드 서열은 각각 서열 번호 72, 서열 번호 73, 서열 번호 74, 서열 번호 75, 및 서열 번호 76에 제시되어 있다. 벡터들 간의 차이는 하기 차트에 상술하였다 [접두사 "p-"는 프로모터를 나타내며, 각각의 "()" 내에 포함된 오픈 리딩 프레임은 오페론 조성물을 나타낸다]:
pSYCO101(서열 번호 72):
다른 2개의 경로 오페론에 비교하여 반대 배향인 p-trc(Dar1_GPP2),
p-1.6 장 GI(dhaB1_dhaB2_dhaB3_dhaX), 및
p-1.6 장 GI(orfY_orfX_orfW).
pSYCO103(서열 번호 73):
다른 2개의 경로 오페론에 비교하여 동일 배향인 p-trc(Dar1_GPP2),
p-1.5 장 GI(dhaB1_dhaB2_dhaB3_dhaX), 및
p-1.5 장 GI(orfY_orfX_orfW).
pSYCO106(서열 번호 74):
다른 2개의 경로 오페론에 비교하여 동일 배향인 p-trc(Dar1_GPP2),
p-1.6 장 GI(dhaB1_dhaB2_dhaB3_dhaX), 및
p-1.6 장 GI(orfY_orfX_orfW).
pSYCO109(서열 번호 75):
다른 2개의 경로 오페론에 비교하여 동일 배향인 p-trc(Dar1_GPP2),
p-1.6 장 GI(dhaB1_dhaB2_dhaB3_dhaX), 및
p-1.6 장 GI(orfY_orfX).
pSYCO400/AGRO(서열 번호 76):
다른 2개의 경로 오페론에 비교하여 동일 배향인 p-trc(Dar1_GPP2),
p-1.6 장 GI(dhaB1_dhaB2_dhaB3_dhaX), 및
p-1.6 장 GI(orfY_orfX).
경로 오페론에 비교하여 반대 배향의 p-1.20 단/장 GI(scrK).
일단 적합한 발현 카세트가 제작되면, 그들을 사용하여 적절한 숙주 박테리아를 형질전환한다. 코딩 영역을 함유하는 카세트의 숙주 박테리아 내로의 도입은, 형질전환에 의한 것(예를 들어, 칼슘-투과화 세포, 또는 전기천공(electroporation)을 사용) 또는 재조합 파아지 바이러스를 사용하는 형질감염에 의한 것(Sambrook 등의 상기 참조)과 같은 공지의 절차에 의해 이루어질 수 있다. 발현 카세트는 숙주 세포 내에서 안정한 플라스미드 상에 유지될 수 있다. 또한, 당업자에게 주지된 벡터 및 방법을 사용하는 상동 또는 무작위 재조합을 통해 발현 카세트를 숙주 박테리아의 게놈 내에 통합할 수 있다. 부위-특이적 재조합 시스템 또한 발현 카세트의 게놈 통합에 사용할 수 있다.
예시된 세포에 부가하여, 글리세롤 및/또는 그의 유도체를 포함하는 미생물 산물의 생산을 증진하도록 특이적으로 고안된 단일 또는 다중 돌연변이를 갖는 세포 또한 사용할 수 있다. 정상적으로 탄소 공급원료를 비-생산적 경로에 전용하거나, 유의적인 이화산물 억제를 나타내는 세포는, 이들 표현형 결함을 회피하도록 돌연변이화할 수 있다.
돌연변이체를 생성시키는 방법은 통상적이며 당업계에 주지되어 있다. 일부 방법의 요약이 미국 특허 제7,371,558호에 제공되어 있다. 방사선 또는 화학 약제를 사용하여 돌연변이체를 생성시키는 특정 방법이 당업계에 잘 입증되어 있다. 예로서, 문헌[Thomas D. Brock in Biotechnology: A Textbook of Industrial Microbiology, Second Edition (1989) Sinauer Associates, Inc., Sunderland, MA] 또는 문헌[Deshpande, Mukund V., Appl. Biochem. Biotechnol. 36, 227 (1992)]을 참조하라.
돌연변이 유발이 발생한 후에, 목적하는 표현형을 갖는 돌연변이체를 다양한 방법으로 선택할 수 있다. 무작위 스크리닝이 가장 통상적이며, 여기서 돌연변이를 일으킨 세포는 목적하는 산물 또는 중간체를 생산하는 능력에 대하여 선택된다. 대안적으로, 돌연변이를 일으킨 개체군을 저항성 콜로니만 발생할 수 있는 선택적 배지 상에서 성장시킴으로써 돌연변이체의 선택적 단리를 수행할 수 있다. 돌연변이체 선택 방법은 고도로 개발되어 산업 미생물학 분야에 주지되어 있다. 예로서, 문헌[Brock, 상기 참조]; 문헌[DeMancilha et al., Food Chem. 14, 313 (1984)] 참조.
본 발명에서 발효 배지는 수크로스를 탄소 기질로 포함한다. 글루코스 및 프룩토스와 같은 다른 탄소 기질 또한 존재할 수 있다.
적합한 발효 배지는, 탄소 기질에 부가하여, 예를 들어, 글리세롤 및 그의 유도체, 예를 들어 1,3-프로판다이올의 생산을 위해 필요한 효소 경로의 촉진 및 배양물의 성장에 적합한, 당업자에게 공지된 적합한 미네랄, 염, 보조인자, 완충제 및 다른 컴포넌트를 함유한다. 1,3-프로판다이올의 생성에 있어서, Co(II) 염 및/또는 비타민 B12 또는 이의 전구체가 특히 주목 받는다.
아데노실-코발아민(조효소 B12)은 데하이드라타아제 활성에 있어서 중요한 보조인자이다. 원핵 세포에서는 조효소 B12의 합성이 발견되며, 이들 중 일부는 화합물의 드 노보(de novo) 합성이 가능하며, 예로서 에스케리키아 블라트타이(Escherichia blattae), 클렙시엘라 종, 시트로박터 종, 및 클로스트리디움 종이 있는 반면, 다른 것들은 부분 반응을 수행할 수 있다. 예를 들어, 이. 콜라이는 코린 고리 구조를 제작할 수 없지만, 코빈아미드를 코리노이드로 전환시키는 촉매 작용을 할 수 있으며 5'-데옥시아데노실 기를 도입할 수 있다. 따라서, 비타민 B12와 같은 조효소 B12 전구체를 이. 콜라이 발효에 공급할 필요가 있다는 것이 당업계에 공지되어 있다. 비타민 B12는 이. 콜라이 발효에 일정한 속도로 연속적으로 첨가하거나, 세포 매스의 생성과 일치하도록 단계화할 수 있거나, 또는 단일 또는 다중 볼루스 첨가로 첨가할 수도 있다.
본 명세서에 기재된 형질전환된 이. 콜라이에 비타민 B12가 첨가되지만, 드 노보 비타민 B12 생합성이 가능한 다른 박테리아 또한 적합한 생산 세포일 것이며 이들 박테리아에는 비타민 B12의 첨가가 불필요할 것으로 예상된다.
전형적으로 박테리아 세포는 25 내지 40℃에서 수크로스를 함유하는 적절한 배지 내에서 성장한다. 본 명세서에 사용하기에 적합한 성장 배지의 예는, 루리아 베르타니(LB: Luria Bertani) 브로스, 사보로드 덱스트로스(SD: Sabouraud Dextrose) 브로스 또는 효모 배지(YM: Yeast medium) 브로스와 같은 상업적으로 제조된 통상적인 배지이다. 그밖에 정의되거나 합성된 성장 배지도 사용할 수 있으며, 특정 박테리아의 성장에 적절한 배지는 미생물학 또는 발효과학 분야의 당업자에게 공지되어 있을 것이다. 직접적으로 또는 간접적으로 이화산물 억제를 조정하는 것으로 공지된 약제, 예를 들어 환형 아데노신 2',3'-모노포스페이트의 사용 또한 반응 배지 내에 도입될 수 있다. 마찬가지로, 1,3-프로판다이올 생산의 증진을 유발하는 효소 활성을 조정하는 것으로 공지된 약제(예를 들어, 메틸 비올로겐)의 사용을, 1,3-프로판다이올 생산 주를 이용하는 유전자 조작과 함께, 또는 그 대안으로 사용할 수 있다.
발효를 위해 적합한 pH 범위는 pH 5.0 내지 pH 9.0이며, 여기서 pH 6.0 내지 pH 8.0이 초기 조건으로서 전형적이다.
재조합 박테리아의 요구 조건에 따라, 호기성, 무산소, 또는 혐기성 조건 하에 반응을 수행할 수 있다. 유가식 발효는 한정되거나 과량인 탄소 공급, 예를 들어 탄소 기질을 사용하여 수행될 수 있다.
회분식 발효는 통상적으로 사용되는 방법이다. 고전적인 회분식 발효는, 배지의 조성이 발효 시작시에 설정되고 발효 중에 인공적으로 변경되지 않는 폐쇄 시스템이다. 따라서, 목적하는 박테리아가 발효의 시작시에 배지에 접종되며, 시스템에 아무것도 첨가하지 않고서 발효가 일어나게 한다. 그러나, 전형적으로 "회분식" 발효는 탄소 공급원의 첨가와 관련하여 회분식이며, pH 및 산소 농도와 같은 인자를 제어하려는 시도가 흔히 이루어진다. 회분식 시스템에서, 시스템의 대사산물 및 바이오매스 조성은 발효가 중단되는 시점까지 끊임없이 변화한다. 회분식 배양 내에서, 세포는 정적 유도기(static lag phase)를 통하여 고 성장 대수기(log phase)로, 그리고 최종적으로 성장 속도가 감소되거나 정지되는 정체기(stationary phase)로 완화된다. 미처리될 경우, 정체기의 세포는 결국 사멸할 것이다. 대수기의 세포는 일반적으로 최종 생산물 또는 중간체의 대량 생산에 책임이 있다.
표준 회분식 시스템의 한 변형은 유가식(Fed-Batch) 시스템이다. 유가식 발효 방법 또한 본 명세서에 사용하기에 적합하며, 이는 발효가 진행됨에 따라 기질을 증분식으로 첨가한다는 점을 제외하고는 전형적인 회분식 시스템을 포함한다. 유가식 시스템은 이화산물 억제가 세포의 대사작용을 저해하는 경향이 있을 때 그리고 배지 중에 한정된 양의 기질이 있는 것이 바람직한 경우 유용하다. 유가식 시스템 중 실제 기질 농도의 측정은 어려우며, 따라서 pH, 용존 산소 및 CO2와 같은 폐가스의 분압과 같은 측정가능한 인자의 변화를 기반으로 하여 계산된다. 회분식 및 유가식 발효는 통상적이며 당업계에 주지되어 있고, 그 예는 문헌[Brock, 상기 참조]에서 발견할 수 있다.
연속식 발효는 정의된 발효 배지가 연속적으로 생물 반응기에 첨가되고, 동일한 양의 적응용 배지가 프로세싱을 위하여 동시에 제거되는 개방 시스템이다. 연속 발효는 일반적으로, 세포가 주로 대수기 성장에 있는 경우 일정한 고밀도로 배양물을 유지시킨다.
연속식 발효는 세포 성장 또는 최종 생산물 농도에 영향을 주는 하나의 인자 또는 임의의 개수의 인자의 조정을 허용한다. 예를 들어, 한 가지 방법은 제한 영양소, 예를 들어 탄소 공급원 또는 질소의 수준을 고정된 비율로 유지하고 모든 다른 파라미터는 조정되게 할 것이다. 다른 시스템에서는, 배지의 탁도로 측정되는 세포 농도를 일정하게 유지하는 가운데, 성장에 영향을 주는 다수의 인자를 연속적으로 변경할 수 있다. 연속식 시스템은 안정 상태 성장 조건을 유지하도록 노력하므로, 배출되는 배지로 인한 세포 손실은 발효에서 세포 성장 속도에 대하여 균형이 맞추어져야 한다. 연속식 발효 방법에 있어서 영양소 및 성장 인자를 조정하는 방법뿐만 아니라, 생성물 형성 속도를 최대화하는 기술도 산업 미생물학 분야에서 주지되어 있으며, 다양한 방법이 브록(Brock)의 상기 문헌에 상술되어 있다.
본 발명은 회분식, 유가식 또는 연속식 방법을 사용하여 실시할 수 있으며 임의의 알려진 발효 모드가 적합할 것으로 예상된다. 부가적으로, 세포를 기재 상에 전체 세포 촉매로서 고정시키고 글리세롤 및 글리세롤 유도체, 예를 들어 1,3-프로판다이올의 생산을 위한 발효 조건을 적용할 수 있을 것으로 예상된다.
일 실시 형태에는, 수크로스로부터 글리세롤, 1,3-프로판다이올, 및/또는 3-하이드록시프로피온산을 제조하는 방법이 제공된다. 본 방법은, 상기와 같이 수크로스의 존재 하에 재조합 박테리아를 배양하는 단계, 및 임의로 생산된 글리세롤, 1,3-프로판다이올, 및/또는 3-하이드록시프로피온산을 회수하는 단계를 포함한다. 당업계에 공지된 방법을 사용하여 산물을 회수할 수 있다. 예를 들어, 원심분리, 여과, 경사분리(decantation) 등에 의해 발효 배지로부터 고체를 제거할 수 있다. 이어서, 증류, 액-액 추출 또는 막-기반의 분리와 같은 방법을 사용하여, 상기와 같이 고체를 제거하기 위해 처리된 발효 배지로부터 산물을 단리할 수 있다.
실시예
본 발명은 하기 실시예에서 추가로 정의된다. 이들 실시예는 본 발명의 바람직한 실시 형태를 나타내면서도 단지 예로써만 주어지는 것으로 이해해야 할 것이다. 상기 토의 및 이들 실시예로부터, 당업자는 본 발명의 필수적인 특징을 확인할 수 있고, 그의 취지 및 범주를 벗어나지 않으면서, 본 발명의 다양한 변화 및 개질을 하여서 본 발명이 다양한 용도와 조건에 적합하도록 할 수 있다.
일반 방법
본 명세서에 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 잘 알려져 있으며, 문헌[Sambrook, J. and Russell, D., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (2001)]; 및 문헌[Silhavy, T. J., Bennan, M. L. and Enquist, L. W., Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1984)]; 및 문헌[Ausubel, F. M. et. al., Short Protocols in Molecular Biology, 5th Ed. Current Protocols, John Wiley and Sons, Inc., N.Y., 2002]에 기재되어 있다.
미생물 배양의 유지 및 성장에 적절한 재료 및 방법은 당업계에 잘 알려져 있다. 하기 실시예에서 사용하기에 적합한 기술은 문헌[Manual of Methods for General Bacteriology (Phillipp Gerhardt, R. G. E. Murray, Ralph N. Costilow, Eugene W. Nester, Willis A. Wood, Noel R. Krieg and G. Briggs Phillips, Eds.), American Society for Microbiology: Washington, D.C. (1994)]; 또는 문헌[Manual of Industrial Microbiology and Biotechnology, 3rd Edition (Richard H. Baltz, Julian E. Davies, and Arnold L. Demain Eds.), ASM Press, Washington, DC, 2010]에 개시된 바와 같이 찾아볼 수 있다. 박테리아 세포의 유지 및 성장에 관해 기술된 모든 시약, 제한 효소 및 재료는 Aldrich Chemicals(Milwaukee, WI 소재), BD Diagnostic Systems (Sparks, MD 소재), Life Technologies(Rockville, MD 소재), New England Biolabs (Beverly, MA 소재), 또는 Sigma Chemical Company (St. Louis, MO 소재)로부터 입수할 수 있다.
약어의 의미는 다음과 같다: "sec"는 초(들)를 의미하며, "min"은 분(들)을 의미하며, "h"는 시간(들)을 의미하며, "㎚"는 나노미터(들)를 의미하며, "㎕"는 마이크로리터(들)를 의미하며, "㎖"은 밀리리터(들)를 의미하며, "L"은 리터(들)를 의미하며, "mM"은 밀리몰을 의미하며, "M"은 몰을 의미하며, "g"는 그램(들)을 의미하며, "㎍"는 마이크로그램(들)을 의미하며, "ng"는 나노그램(들)을 의미하며, "bp"는 염기쌍(들)을 의미하며, "kbp"는 킬로염기쌍(들)을 의미하며, "rpm"은 분당 회전수를 의미하며, "ATCC"는 미국 버지니아주 매너서스 소재의 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection)을 의미하며, "OD"는 광학 밀도를 의미하며, "g"는 인력 상수를 의미하며, "HPLC"는 고성능 액체 크로마토그래피를 의미한다.
실시예 1 내지 실시예 4
이.
콜라이
염색체 내의
수크로스
유전자 클러스터의 통합
이들 실시예는 이. 콜라이의 게놈 내의 두 위치, aldH 유전자에서 또는 yihP 유전자와 yihO 유전자 사이에서 수크로스 유전자 클러스터를 통합시켜 수크로스 이용을 가능하게 하는 것을 설명한다.
이. 콜라이 ATCC(등록상표)13281 유래의 야생형 또는 변이형 cscAKB 유전자 클러스터를 PDO 생성 주 TTab pSYCO400/AGRO 내로 도입하여 수크로스로부터의 PDO 생성을 가능하게 하였다. 이. 콜라이 주 TTab pSYCO400/AGRO, PTS 음성 주를 하기와 같이 만들었다. 미국 특허 제7,371,558호 (실시예 17)에 기재된 바와 같이, 주 TTab를, 주 TT aldA로부터의 aldB 유전자의 결실에 의하여 생성하였다. 간략하게는, 먼저 이. 콜라이 주 MG1655에서 aldB의 1.5 kbp의 코딩 영역을 pKD3 플라스미드의 FRT-CmR-FRT 카세트 (문헌[Datsenko and Wanner, Proc. Natl. Acad. Sci. USA 97:6640-6645, 2000])로 대체함으로써 aldB 결실을 일으켰다. pKD3을 주형으로 사용하여 프라이머 쌍 서열 번호 58 및 서열 번호 59로 대체 카세트를 증폭하였다. 프라이머 서열 번호 58은 aldB의 5'-단부에 대해 80 bp의 상동성, 및 pKD3에 대해 20 bp의 상동성을 포함하였다. 프라이머 서열 번호 59는 aldB의 3' 말단에 대해 80 bp의 상동성, 및 pKD3에 대해 20 bp 상동성을 포함한다. PCR 생성물을 겔-정제하고, MG1655/pKD46 수용성 세포(competent cell) 내로 (미국 특허 제7,371,558호) 전기천공하였다. 재조합 주를 12.5 mg/L의 크로람페니콜을 이용하여 LB 플레이트 상에서 선발하였다. 프라이머 쌍 서열 번호 60 및 서열 번호 61을 사용하여, PCR에 의해 aldB 유전자의 결실을 확인하였다. 야생형 주는 1.5 kbp PCR 산물을 제공한 반면에, 재조합 주는 특징적인 1.1 kbp PCR 산물을 제공하였다. 돌연변이를 TT aldA 주로 이동시켜 TT aldAΔaldB::Cm 주를 형성시키기 위하여 P1 용균물을 제조하고 사용하였다. 돌연변이가 존재함을 확인하기 위하여, 프라이머 쌍 서열 번호 60 및 서열 번호 61을 이용하는 게놈 PCR에 의해 클로람페니콜-내성 클론을 확인하였다. FLP 리콤비나아제를 이용하여 클로람페니콜 내성 마커를 제거하여 (문헌[Datsenko and Wanner, 상기 참조]) TTab를 생성하였다. 주 TTab를 그 후 미국 특허 제7,524,660호 (실시예 4)에 설명된, pSYCO400/AGRO (서열 번호 55에 설명됨)를 이용하여 형질전환 시키고, 주 TTab pSYCO400/AGRO를 생성하였다.
인용된 참고문헌에 기재된 바와 같이, 주 TTab는 하기 변형을 포함한 이. 콜라이 주 FM5 (ATCC(등록상표) No. 53911)의 유도체이다:
glpK, gldA, ptsHI, crr, edd, arcA, mgsA, qor, ackA, pta, aldA 및 aldB 유전자의 결실;
galP, glk, btuR, ppc, 및 yqhD 유전자의 상향조절;
gapA 유전자의 하향조절.
플라스미드 pSYCO400/AGRO는 글리세롤 생산 경로를 암호화하는 유전자(DAR1 및 GPP2) 및 글리세롤 데하이드라타아제 및 관련 재활성화 인자 (dhaB123, dhaX, orfX, orfY)를 암호화하는 유전자, 및 프룩토키나아제 (scrK)를 암호화하는 유전자를 포함한다.
이. 콜라이 ATCC(등록상표)13281 유래의 야생형 또는 변이형 수크로스 유전자 클러스터를 람다 레드법(Lambda Red method)에 의해 TTab pSYCO400/AGRO 내의 aldH 유전자 또는 yihP 유전자에서 통합시켰다. 도 1은 수크로스 유전자 클러스터가 통합된 염색체 영역을 나타낸다. 야생형 cscAKB 유전자 클러스터 (서열 번호 123)를 플라스미드 pBHR-cscBKA (서열 번호 124)로부터 증폭시켰는데, 상기 플라스미드는 미국 특허 공개 제2011/0136190 A1호의 실시예 1에 설명한 바와 같이 제작하였다. cscB 유전자 (서열 번호 95) 내의 코돈 61에서 류신의 프롤린으로의 치환 (L61P)을 함유하는 변이형 수크로스 유전자 클러스터를 aldH 유전자에서 이. 콜라이 ATCC(등록상표)13281 유래의 cscAKB 유전자 클러스터로 형질전환된 TTab pSYCO400/AGRO 주의 단리체로부터 증폭시켰는데, 이는 수크로스 상에서 향상된 성장을 나타냈다.
aldH 유전자에서의 통합은 염색체 내의 aldH 유전자의 바깥의 양쪽 영역에 대하여 측면 상동성을 포함하는 aldH cscA 프라이머 (서열 번호 115) 및 aldH cscB 프라이머 (서열 번호 116)를 사용하여 성취하였다. aldH 유전자에서의 수크로스 유전자 클러스터의 통합은 aldH 유전자를 수크로스 유전자 클러스터로 대체하였다. yihP 유전자와 yihO 유전자 사이의 통합은 yihP 유전자에 대하여 측면 상동성을 포함하는 yihP cscA 프라이머 (서열 번호 119) 및 yihP cscB 프라이머 (서열 번호 120)를 사용하여 성취하였다. 수크로스 유전자 클러스터는 염색체로부터의 yihP 서열의 제거 없이 yihP의 C-말단에 가까운 부위에 삽입시켰다. PstI 절단에 의해 선형화한 플라스미드 pBHR-cscBKA를 야생형 클러스터를 위한 PCR 주형으로 사용하였다. 수크로스 유전자 클러스터의 cscB에서의 L61P 치환을 포함하는 세포를 변이형 클러스터를 위한 PCR 주형으로 사용하였다. 고충실도 PfuUltra(등록상표) II 퓨전(Fusion) HS DNA 폴리머라아제 (스트라타진(Stratagene); 미국 캘리포니아주 라 졸라 소재)를 PCR 반응에서 사용하였다. PCR을 하기 사이클링 조건들을 이용하여 수행하였다: 95℃, 2 min; 95℃, 30 sec, 60℃, 30 sec, 및 72℃, 4 min의 35 사이클; 및 그 후 72℃, 7 min. 생성된 PCR 생성물을 4℃에서 보관하였다. PCR 생성물을 퀴아퀵(QIAquick) PCR 정제 키트 (미국 캘리포니아주 발렌시아 소재의 퀴아젠(Qiagen))를 사용하여 정제하였다. PCR 생성물을 람다 레드 재조합 절차에 따라 람다 리콤비나아제를 암호화하는 pKD46 플라스미드를 포함하는 TTab pSYCO400/AGRO 주 (레드 리콤비나아제 플라스미드, 젠뱅크 등록 번호: AY048746) 내로 전기천공시켰다 (문헌[Datsenko, K.A. and Wanner, B.L., 2000, Proc. Natl. Acad. Sci. USA 97: 6640-6645]). 형질전환 혼합물을 10 g/L의 수크로스 및 100 ㎍/㎖의 스펙티노마이신을 함유하는 MOPS 최소 플레이트 상에 도말하였다. MOPS 최소 플레이트는 1XMOPS 완충제 (미국 캘리포니아주 홀리스터 소재의 테크노바(Technova)), 1.32 mM의 KH2PO4 (테크노바), 50 ㎍/L의 우라실 및 1.5 g/L의 박토(Bacto) 한천을 함유하였다. 플레이트들을 37℃에서 2 내지 3일 동안 인큐베이션하였다. 최소 수크로스 플레이트 상에서 성장시킨 콜로니들을 골라내고, LB 스펙티노마이신 플레이트 상에서의 획선(streaking)에 의해 정제하였다. aldH 유전자에서의 수크로스 유전자 클러스터의 통합을 프라이머 aldH_check_up (서열 번호 117) 및 프라이머 aldH_check_dn (서열 번호 118)을 이용하여 PCR에 의해 확인하였다. yihP 유전자와 yihO 유전자 사이의 수크로스 유전자 클러스터의 통합을 프라이머 yihPA For (서열 번호 121) 및 프라이머yihPB Rev (서열 번호 122)를 사용하여 PCR에 의해 확인하였다. 통합된 수크로스 유전자 클러스터를 서열결정에 의해 확인하여, 단리된 주가 예기지 못한 돌연변이를 함유하지 않음을 보장하였다. 제작된 주들이 표 3에 요약되어 있다.
실시예 5
재조합 이. 콜라이 주의 성장 속도
이 실시예는 aldH 유전자에 통합된 수크로스 유전자 클러스터를 갖는 이. 콜라이 주와 비교하여, yihP 유전자와 yihO 유전자 사이에 통합된 수크로스 유전자 클러스터를 갖는 이. 콜라이 주의 수크로스 상에서의 향상된 성장을 입증한다.
수크로스 함유 최소 배지에서의 통합된 이. 콜라이 주의 최대 성장 속도를 바이오스크린(Bioscreen) C 기기 (핀란드 헬싱키 소재의 바이오스크린)를 이용하여 결정하였다. 각각의 통합된 주로부터의 2개의 단리체를 상기 분석용으로 골라냈다. 이. 콜라이 주들을 100 ㎍/㎖의 스펙티노마이신을 함유하는 3 ㎖의 LA 배지 (1% 트립톤, 0.5% 효모 추출물, 0.05% 염화나트륨)에서 37℃에서 16시간 동안 개별적으로 성장시켰다. 바이오스크린 분석법에 있어서, 신선한 하룻밤 배양물을 바이오스크린 허니콤(honeycomb) 플레이트에서 2.5 g/L, 5 g/L 또는 10 g/L의 수크로스 및 100 ㎍/㎖의 스펙티노마이신을 함유하는 MOPS 최소 배지에 1:100으로 희석시켰다. 비타민 B12를 0.1 mg/L의 농도로 상기 배지에 첨가하였다. 성장 배지를 함유하는 블랭크 웰들을 또한 포함시켰다. 허니콤 플레이트를 제조업자의 지시에 따라 바이오스크린 C 기기 내에 넣었다. 상기 플레이트를 일정하게 진탕시키면서 33℃에서 인큐베이션하고, OD를 15 min마다 기록하였다. 최대 성장 속도 (μmax)를 하기 절차를 이용하여 추정하였다. 먼저, 비-블랭크 웰의 OD 값들로부터 블랭크 웰에서의 평균 OC 값들을 차감함으로써 배경을 제거하였다. 그 후, 8개의 데이터점을 비선형 회귀를 이용하여 지수 곡선에 피팅(fitting)시킴으로써 8개의 데이터점 (2시간의 성장을 커버함)으로 이루어진 슬라이딩 윈도(sliding window)를 이용하여 추정하였다. 각각의 슬라이딩 윈도에서, 추정된 성장 속도를 단지 피팅이 우수할 경우에(즉, R2>0.95) 기록하였다. 모든 기록된 성장 속도로부터의 가장 큰 값이 μmax였다. 각각의 주의 둘 모두의 단리체의 μmax가 표 4에 주어져 있다. yihP 유전자와 yihO 유전자 사이의 수크로스 유전자 클러스터의 통합을 포함하는 주는 특히 저 수크로스 수준에서, aldH 유전자에서 상기 클러스터를 포함하는 주보다 수크로스 상에서 더욱 빠른 성장을 나타냈다.
실시예 6
수크로스 상에서 성장시킨 재조합 이. 콜라이 주에 의한 PDO 및 글리세롤의 생성
이 실시예는 수크로스 상에서 성장시킬 때 실시예 1 내지 실시예 4에 설명된 이. 콜라이 주에 의한 PDO 및 글리세롤의 생성을 설명한다.
PDO 및 글리세롤의 생성에 있어서의 몰 수율을 진탕 플라스크 연구에서 결정하였다. 이. 콜라이 단리체들의 신선한 하룻밤 배양물을 10 g/L의 수크로스 + 100 ng/㎖의 비타민 B12 및 100 ㎍/㎖의 스펙티노마이신을 함유하는 12.5 ㎖ MOPS 배지 내에 0.01의 초기 OD가 되도록 접종하였다. 세포를 250 rpm에서 진탕하면서 33℃에서 44시간 동안 성장시켰다. 배양물들을 원심분리하고, 상청액들을 0.22 ㎛ 스핀(Spin)-X 원심분리 튜브 필터 (미국 뉴욕주 코닝 소재의 코닝 인크.(Corning Inc.))에 첨가하고, 10,000 g에서 1 min 동안 원심분리하였다. 별도의 워터스(Waters) TCM 가열 챔버에서 85℃로 가열한, 아미넥스(Aminex) HPX-87C HPLC 탄수화물 분석 컬럼 (미국 캘리포니아주 허큘리스 소재의 바이오-라드 래보러토리즈(Bio-Rad Laboratories))을 갖춘 워터스 얼라이언스(Waters Alliance) 2690 HPLC 시스템 (미국 매사추세츠주 밀포드 소재의 워터스 코포레이션(Waters Corp.))을 이용하여 HPLC에 의해 분석하였다. 바이오-라드 카보(carbo)-C 마이크로-가드(micro-guard) 컬럼 (바이오-라드, 카탈로그 번호 125-0128)을 분석 컬럼 전에 사용하였다. 이동상은 0.05 mM CaO (시그마(Sigma), #208159), 0.5 mM MES (시그마, #M3671), 0.05 mM HNO3 (미국 뉴저지주 깁스타운 소재의 이엠디 케미칼즈(EMD Chemicals), 카탈로그 번호 NX0409), pH 5.3으로 구성되었다. 유량은 0.5 ㎖/min이었다. 전형적으로, PDO 및 글리세롤의 체류 시간은 각각 17.5 min 및 19.3 min이었다. 수크로스, 글루코스 및 프룩토스의 체류 시간은 각각 10.3 min, 12.5 min 및 15.9 min이었다.
yihP 유전자와 yihO 유전자 사이의 수크로스 유전자 클러스터 통합을 함유하는 이. 콜라이 주는 야생형 유전자 클러스터 및 변이형 유전자 클러스터 둘 모두에 있어서 aldH 유전자에서 통합된 수크로스 유전자 클러스터를 함유하는 주보다 PDO 및 글리세롤의 생성에 있어서의 약간 더 높은 몰 수율(즉, 수크로스 1 몰당 PDO 및 글리세롤의 몰)을 나타냈으며, 이는 표 4에 나타낸 바와 같았다.
실시예 7 내지 실시예 10
야생형 이. 콜라이 주에서의 수크로스 유전자 클러스터의 통합
이들 실시예는 PDO-비생성 야생형 이. 콜라이에서의 수크로스 유전자 클러스터의 통합을 설명한다. yihP 유전자와 yihO 유전자 사이의 통합은 또한 이러한 이. 콜라이 주에서 aldH 유전자에서의 통합보다 더욱 빠른 수크로스에서의 성장으로 이어졌다.
이. 콜라이 주 FM5를 통합용 숙주로서 사용한 것을 제외하고는 이. 콜라이 주 FM5 (ATCC(등록상표) 번호 53911)에서의 aldH 또는 yihP 유전자에서의 야생형 또는 변이형 수크로스 유전자 클러스터의 통합을 실시예 1 내지 실시예 4에 설명한 바와 같이 행하였다. 콜로니들을 또한 정제하고, pKD46을 구원하였다. 통합 부위를 PCR로 확인하고, 통합된 클러스터들을 서열결정하여 어떠한 예기치 못한 돌연변이도 일어나지 않았음을 보장하였다. 수크로스 상에서의 FM5 유래된 주들의 성장 속도를 실시예 5에 설명한 바와 같이 바이오스크린 분석법을 이용하여 결정하였다. 그 결과 (3회 결정의 평균 및 표준 편차)를 표 5에 나타낸다. yihP 유전자와 yihO 유전자 사이에 통합된, 야생형 및 변이형 유전자 클러스터 둘 모두의 수크로스 유전자 클러스터를 갖는 주들은 aldH 유전자에서 통합된 수크로스 유전자 클러스터를 갖는 주들보다 더 높은 성장 속도를 나타냈다.
SEQUENCE LISTING
<110> E.I. du Pont de Nemours and Co.
Cheng, Qiong
<120> Recombinant Bacteria Having Improved Sucrose Utilization
<130> CL5288USNA
<160> 124
<170> PatentIn version 3.5
<210> 1
<211> 1176
<212> DNA
<213> Saccharomyces cerevisiae
<400> 1
atgtctgctg ctgctgatag attaaactta acttccggcc acttgaatgc tggtagaaag 60
agaagttcct cttctgtttc tttgaaggct gccgaaaagc ctttcaaggt tactgtgatt 120
ggatctggta actggggtac tactattgcc aaggtggttg ccgaaaattg taagggatac 180
ccagaagttt tcgctccaat agtacaaatg tgggtgttcg aagaagagat caatggtgaa 240
aaattgactg aaatcataaa tactagacat caaaacgtga aatacttgcc tggcatcact 300
ctacccgaca atttggttgc taatccagac ttgattgatt cagtcaagga tgtcgacatc 360
atcgttttca acattccaca tcaatttttg ccccgtatct gtagccaatt gaaaggtcat 420
gttgattcac acgtcagagc tatctcctgt ctaaagggtt ttgaagttgg tgctaaaggt 480
gtccaattgc tatcctctta catcactgag gaactaggta ttcaatgtgg tgctctatct 540
ggtgctaaca ttgccaccga agtcgctcaa gaacactggt ctgaaacaac agttgcttac 600
cacattccaa aggatttcag aggcgagggc aaggacgtcg accataaggt tctaaaggcc 660
ttgttccaca gaccttactt ccacgttagt gtcatcgaag atgttgctgg tatctccatc 720
tgtggtgctt tgaagaacgt tgttgcctta ggttgtggtt tcgtcgaagg tctaggctgg 780
ggtaacaacg cttctgctgc catccaaaga gtcggtttgg gtgagatcat cagattcggt 840
caaatgtttt tcccagaatc tagagaagaa acatactacc aagagtctgc tggtgttgct 900
gatttgatca ccacctgcgc tggtggtaga aacgtcaagg ttgctaggct aatggctact 960
tctggtaagg acgcctggga atgtgaaaag gagttgttga atggccaatc cgctcaaggt 1020
ttaattacct gcaaagaagt tcacgaatgg ttggaaacat gtggctctgt cgaagacttc 1080
ccattatttg aagccgtata ccaaatcgtt tacaacaact acccaatgaa gaacctgccg 1140
gacatgattg aagaattaga tctacatgaa gattag 1176
<210> 2
<211> 391
<212> PRT
<213> Saccharomyces cerevisiae
<400> 2
Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn
1 5 10 15
Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu
20 25 30
Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr
35 40 45
Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe
50 55 60
Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu
65 70 75 80
Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu
85 90 95
Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile
100 105 110
Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln
115 120 125
Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His
130 135 140
Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly
145 150 155 160
Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys
165 170 175
Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His
180 185 190
Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly
195 200 205
Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg
210 215 220
Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile
225 230 235 240
Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu
245 250 255
Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly
260 265 270
Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg
275 280 285
Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr
290 295 300
Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr
305 310 315 320
Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln
325 330 335
Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu
340 345 350
Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln
355 360 365
Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu
370 375 380
Glu Leu Asp Leu His Glu Asp
385 390
<210> 3
<211> 1323
<212> DNA
<213> Saccharomyces cerevisiae
<400> 3
atgcttgctg tcagaagatt aacaagatac acattcctta agcgaacgca tccggtgtta 60
tatactcgtc gtgcatataa aattttgcct tcaagatcta ctttcctaag aagatcatta 120
ttacaaacac aactgcactc aaagatgact gctcatacta atatcaaaca gcacaaacac 180
tgtcatgagg accatcctat cagaagatcg gactctgccg tgtcaattgt acatttgaaa 240
cgtgcgccct tcaaggttac agtgattggt tctggtaact gggggaccac catcgccaaa 300
gtcattgcgg aaaacacaga attgcattcc catatcttcg agccagaggt gagaatgtgg 360
gtttttgatg aaaagatcgg cgacgaaaat ctgacggata tcataaatac aagacaccag 420
aacgttaaat atctacccaa tattgacctg ccccataatc tagtggccga tcctgatctt 480
ttacactcca tcaagggtgc tgacatcctt gttttcaaca tccctcatca atttttacca 540
aacatagtca aacaattgca aggccacgtg gcccctcatg taagggccat ctcgtgtcta 600
aaagggttcg agttgggctc caagggtgtg caattgctat cctcctatgt tactgatgag 660
ttaggaatcc aatgtggcgc actatctggt gcaaacttgg caccggaagt ggccaaggag 720
cattggtccg aaaccaccgt ggcttaccaa ctaccaaagg attatcaagg tgatggcaag 780
gatgtagatc ataagatttt gaaattgctg ttccacagac cttacttcca cgtcaatgtc 840
atcgatgatg ttgctggtat atccattgcc ggtgccttga agaacgtcgt ggcacttgca 900
tgtggtttcg tagaaggtat gggatggggt aacaatgcct ccgcagccat tcaaaggctg 960
ggtttaggtg aaattatcaa gttcggtaga atgtttttcc cagaatccaa agtcgagacc 1020
tactatcaag aatccgctgg tgttgcagat ctgatcacca cctgctcagg cggtagaaac 1080
gtcaaggttg ccacatacat ggccaagacc ggtaagtcag ccttggaagc agaaaaggaa 1140
ttgcttaacg gtcaatccgc ccaagggata atcacatgca gagaagttca cgagtggcta 1200
caaacatgtg agttgaccca agaattccca ttattcgagg cagtctacca gatagtctac 1260
aacaacgtcc gcatggaaga cctaccggag atgattgaag agctagacat cgatgacgaa 1320
tag 1323
<210> 4
<211> 440
<212> PRT
<213> Saccharomyces cerevisiae
<400> 4
Met Leu Ala Val Arg Arg Leu Thr Arg Tyr Thr Phe Leu Lys Arg Thr
1 5 10 15
His Pro Val Leu Tyr Thr Arg Arg Ala Tyr Lys Ile Leu Pro Ser Arg
20 25 30
Ser Thr Phe Leu Arg Arg Ser Leu Leu Gln Thr Gln Leu His Ser Lys
35 40 45
Met Thr Ala His Thr Asn Ile Lys Gln His Lys His Cys His Glu Asp
50 55 60
His Pro Ile Arg Arg Ser Asp Ser Ala Val Ser Ile Val His Leu Lys
65 70 75 80
Arg Ala Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr
85 90 95
Thr Ile Ala Lys Val Ile Ala Glu Asn Thr Glu Leu His Ser His Ile
100 105 110
Phe Glu Pro Glu Val Arg Met Trp Val Phe Asp Glu Lys Ile Gly Asp
115 120 125
Glu Asn Leu Thr Asp Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr
130 135 140
Leu Pro Asn Ile Asp Leu Pro His Asn Leu Val Ala Asp Pro Asp Leu
145 150 155 160
Leu His Ser Ile Lys Gly Ala Asp Ile Leu Val Phe Asn Ile Pro His
165 170 175
Gln Phe Leu Pro Asn Ile Val Lys Gln Leu Gln Gly His Val Ala Pro
180 185 190
His Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Leu Gly Ser Lys
195 200 205
Gly Val Gln Leu Leu Ser Ser Tyr Val Thr Asp Glu Leu Gly Ile Gln
210 215 220
Cys Gly Ala Leu Ser Gly Ala Asn Leu Ala Pro Glu Val Ala Lys Glu
225 230 235 240
His Trp Ser Glu Thr Thr Val Ala Tyr Gln Leu Pro Lys Asp Tyr Gln
245 250 255
Gly Asp Gly Lys Asp Val Asp His Lys Ile Leu Lys Leu Leu Phe His
260 265 270
Arg Pro Tyr Phe His Val Asn Val Ile Asp Asp Val Ala Gly Ile Ser
275 280 285
Ile Ala Gly Ala Leu Lys Asn Val Val Ala Leu Ala Cys Gly Phe Val
290 295 300
Glu Gly Met Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Leu
305 310 315 320
Gly Leu Gly Glu Ile Ile Lys Phe Gly Arg Met Phe Phe Pro Glu Ser
325 330 335
Lys Val Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile
340 345 350
Thr Thr Cys Ser Gly Gly Arg Asn Val Lys Val Ala Thr Tyr Met Ala
355 360 365
Lys Thr Gly Lys Ser Ala Leu Glu Ala Glu Lys Glu Leu Leu Asn Gly
370 375 380
Gln Ser Ala Gln Gly Ile Ile Thr Cys Arg Glu Val His Glu Trp Leu
385 390 395 400
Gln Thr Cys Glu Leu Thr Gln Glu Phe Pro Leu Phe Glu Ala Val Tyr
405 410 415
Gln Ile Val Tyr Asn Asn Val Arg Met Glu Asp Leu Pro Glu Met Ile
420 425 430
Glu Glu Leu Asp Ile Asp Asp Glu
435 440
<210> 5
<211> 816
<212> DNA
<213> Saccharomyces cerevisiae
<400> 5
atgaaacgtt tcaatgtttt aaaatatatc agaacaacaa aagcaaatat acaaaccatc 60
gcaatgcctt tgaccacaaa acctttatct ttgaaaatca acgccgctct attcgatgtt 120
gacggtacca tcatcatctc tcaaccagcc attgctgctt tctggagaga tttcggtaaa 180
gacaagcctt acttcgatgc cgaacacgtt attcacatct ctcacggttg gagaacttac 240
gatgccattg ccaagttcgc tccagacttt gctgatgaag aatacgttaa caagctagaa 300
ggtgaaatcc cagaaaagta cggtgaacac tccatcgaag ttccaggtgc tgtcaagttg 360
tgtaatgctt tgaacgcctt gccaaaggaa aaatgggctg tcgccacctc tggtacccgt 420
gacatggcca agaaatggtt cgacattttg aagatcaaga gaccagaata cttcatcacc 480
gccaatgatg tcaagcaagg taagcctcac ccagaaccat acttaaaggg tagaaacggt 540
ttgggtttcc caattaatga acaagaccca tccaaatcta aggttgttgt ctttgaagac 600
gcaccagctg gtattgctgc tggtaaggct gctggctgta aaatcgttgg tattgctacc 660
actttcgatt tggacttctt gaaggaaaag ggttgtgaca tcattgtcaa gaaccacgaa 720
tctatcagag tcggtgaata caacgctgaa accgatgaag tcgaattgat ctttgatgac 780
tacttatacg ctaaggatga cttgttgaaa tggtaa 816
<210> 6
<211> 271
<212> PRT
<213> Saccharomyces cerevisiae
<400> 6
Met Lys Arg Phe Asn Val Leu Lys Tyr Ile Arg Thr Thr Lys Ala Asn
1 5 10 15
Ile Gln Thr Ile Ala Met Pro Leu Thr Thr Lys Pro Leu Ser Leu Lys
20 25 30
Ile Asn Ala Ala Leu Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln
35 40 45
Pro Ala Ile Ala Ala Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr
50 55 60
Phe Asp Ala Glu His Val Ile His Ile Ser His Gly Trp Arg Thr Tyr
65 70 75 80
Asp Ala Ile Ala Lys Phe Ala Pro Asp Phe Ala Asp Glu Glu Tyr Val
85 90 95
Asn Lys Leu Glu Gly Glu Ile Pro Glu Lys Tyr Gly Glu His Ser Ile
100 105 110
Glu Val Pro Gly Ala Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro
115 120 125
Lys Glu Lys Trp Ala Val Ala Thr Ser Gly Thr Arg Asp Met Ala Lys
130 135 140
Lys Trp Phe Asp Ile Leu Lys Ile Lys Arg Pro Glu Tyr Phe Ile Thr
145 150 155 160
Ala Asn Asp Val Lys Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys
165 170 175
Gly Arg Asn Gly Leu Gly Phe Pro Ile Asn Glu Gln Asp Pro Ser Lys
180 185 190
Ser Lys Val Val Val Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly
195 200 205
Lys Ala Ala Gly Cys Lys Ile Val Gly Ile Ala Thr Thr Phe Asp Leu
210 215 220
Asp Phe Leu Lys Glu Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu
225 230 235 240
Ser Ile Arg Val Gly Glu Tyr Asn Ala Glu Thr Asp Glu Val Glu Leu
245 250 255
Ile Phe Asp Asp Tyr Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp
260 265 270
<210> 7
<211> 753
<212> DNA
<213> Saccharomyces cerevisiae
<400> 7
atgggattga ctactaaacc tctatctttg aaagttaacg ccgctttgtt cgacgtcgac 60
ggtaccatta tcatctctca accagccatt gctgcattct ggagggattt cggtaaggac 120
aaaccttatt tcgatgctga acacgttatc caagtctcgc atggttggag aacgtttgat 180
gccattgcta agttcgctcc agactttgcc aatgaagagt atgttaacaa attagaagct 240
gaaattccgg tcaagtacgg tgaaaaatcc attgaagtcc caggtgcagt taagctgtgc 300
aacgctttga acgctctacc aaaagagaaa tgggctgtgg caacttccgg tacccgtgat 360
atggcacaaa aatggttcga gcatctggga atcaggagac caaagtactt cattaccgct 420
aatgatgtca aacagggtaa gcctcatcca gaaccatatc tgaagggcag gaatggctta 480
ggatatccga tcaatgagca agacccttcc aaatctaagg tagtagtatt tgaagacgct 540
ccagcaggta ttgccgccgg aaaagccgcc ggttgtaaga tcattggtat tgccactact 600
ttcgacttgg acttcctaaa ggaaaaaggc tgtgacatca ttgtcaaaaa ccacgaatcc 660
atcagagttg gcggctacaa tgccgaaaca gacgaagttg aattcatttt tgacgactac 720
ttatatgcta aggacgatct gttgaaatgg taa 753
<210> 8
<211> 250
<212> PRT
<213> Saccharomyces cerevisiae
<400> 8
Met Gly Leu Thr Thr Lys Pro Leu Ser Leu Lys Val Asn Ala Ala Leu
1 5 10 15
Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln Pro Ala Ile Ala Ala
20 25 30
Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His
35 40 45
Val Ile Gln Val Ser His Gly Trp Arg Thr Phe Asp Ala Ile Ala Lys
50 55 60
Phe Ala Pro Asp Phe Ala Asn Glu Glu Tyr Val Asn Lys Leu Glu Ala
65 70 75 80
Glu Ile Pro Val Lys Tyr Gly Glu Lys Ser Ile Glu Val Pro Gly Ala
85 90 95
Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala
100 105 110
Val Ala Thr Ser Gly Thr Arg Asp Met Ala Gln Lys Trp Phe Glu His
115 120 125
Leu Gly Ile Arg Arg Pro Lys Tyr Phe Ile Thr Ala Asn Asp Val Lys
130 135 140
Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu
145 150 155 160
Gly Tyr Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val
165 170 175
Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys
180 185 190
Lys Ile Ile Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu
195 200 205
Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly
210 215 220
Gly Tyr Asn Ala Glu Thr Asp Glu Val Glu Phe Ile Phe Asp Asp Tyr
225 230 235 240
Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp
245 250
<210> 9
<211> 1668
<212> DNA
<213> Klebsiella pneumoniae
<220>
<221> CDS
<222> (1)..(1668)
<400> 9
atg aaa aga tca aaa cga ttt gca gta ctg gcc cag cgc ccc gtc aat 48
Met Lys Arg Ser Lys Arg Phe Ala Val Leu Ala Gln Arg Pro Val Asn
1 5 10 15
cag gac ggg ctg att ggc gag tgg cct gaa gag ggg ctg atc gcc atg 96
Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met
20 25 30
gac agc ccc ttt gac ccg gtc tct tca gta aaa gtg gac aac ggt ctg 144
Asp Ser Pro Phe Asp Pro Val Ser Ser Val Lys Val Asp Asn Gly Leu
35 40 45
atc gtc gaa ctg gac ggc aaa cgc cgg gac cag ttt gac atg atc gac 192
Ile Val Glu Leu Asp Gly Lys Arg Arg Asp Gln Phe Asp Met Ile Asp
50 55 60
cga ttt atc gcc gat tac gcg atc aac gtt gag cgc aca gag cag gca 240
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Glu Arg Thr Glu Gln Ala
65 70 75 80
atg cgc ctg gag gcg gtg gaa ata gcc cgt atg ctg gtg gat att cac 288
Met Arg Leu Glu Ala Val Glu Ile Ala Arg Met Leu Val Asp Ile His
85 90 95
gtc agc cgg gag gag atc att gcc atc act acc gcc atc acg ccg gcc 336
Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr Ala Ile Thr Pro Ala
100 105 110
aaa gcg gtc gag gtg atg gcg cag atg aac gtg gtg gag atg atg atg 384
Lys Ala Val Glu Val Met Ala Gln Met Asn Val Val Glu Met Met Met
115 120 125
gcg ctg cag aag atg cgt gcc cgc cgg acc ccc tcc aac cag tgc cac 432
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His
130 135 140
gtc acc aat ctc aaa gat aat ccg gtg cag att gcc gct gac gcc gcc 480
Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala
145 150 155 160
gag gcc ggg atc cgc ggc ttc tca gaa cag gag acc acg gtc ggt atc 528
Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile
165 170 175
gcg cgc tac gcg ccg ttt aac gcc ctg gcg ctg ttg gtc ggt tcg cag 576
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln
180 185 190
tgc ggc cgc ccc ggc gtg ttg acg cag tgc tcg gtg gaa gag gcc acc 624
Cys Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr
195 200 205
gag ctg gag ctg ggc atg cgt ggc tta acc agc tac gcc gag acg gtg 672
Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val
210 215 220
tcg gtc tac ggc acc gaa gcg gta ttt acc gac ggc gat gat acg ccg 720
Ser Val Tyr Gly Thr Glu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro
225 230 235 240
tgg tca aag gcg ttc ctc gcc tcg gcc tac gcc tcc cgc ggg ttg aaa 768
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys
245 250 255
atg cgc tac acc tcc ggc acc gga tcc gaa gcg ctg atg ggc tat tcg 816
Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser
260 265 270
gag agc aag tcg atg ctc tac ctc gaa tcg cgc tgc atc ttc att act 864
Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr
275 280 285
aaa ggc gcc ggg gtt cag gga ctg caa aac ggc gcg gtg agc tgt atc 912
Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile
290 295 300
ggc atg acc ggc gct gtg ccg tcg ggc att cgg gcg gtg ctg gcg gaa 960
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu
305 310 315 320
aac ctg atc gcc tct atg ctc gac ctc gaa gtg gcg tcc gcc aac gac 1008
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp
325 330 335
cag act ttc tcc cac tcg gat att cgc cgc acc gcg cgc acc ctg atg 1056
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met
340 345 350
cag atg ctg ccg ggc acc gac ttt att ttc tcc ggc tac agc gcg gtg 1104
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val
355 360 365
ccg aac tac gac aac atg ttc gcc ggc tcg aac ttc gat gcg gaa gat 1152
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp
370 375 380
ttt gat gat tac aac atc ctg cag cgt gac ctg atg gtt gac ggc ggc 1200
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly
385 390 395 400
ctg cgt ccg gtg acc gag gcg gaa acc att gcc att cgc cag aaa gcg 1248
Leu Arg Pro Val Thr Glu Ala Glu Thr Ile Ala Ile Arg Gln Lys Ala
405 410 415
gcg cgg gcg atc cag gcg gtt ttc cgc gag ctg ggg ctg ccg cca atc 1296
Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Pro Ile
420 425 430
gcc gac gag gag gtg gag gcc gcc acc tac gcg cac ggc agc aac gag 1344
Ala Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Asn Glu
435 440 445
atg ccg ccg cgt aac gtg gtg gag gat ctg agt gcg gtg gaa gag atg 1392
Met Pro Pro Arg Asn Val Val Glu Asp Leu Ser Ala Val Glu Glu Met
450 455 460
atg aag cgc aac atc acc ggc ctc gat att gtc ggc gcg ctg agc cgc 1440
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Ser Arg
465 470 475 480
agc ggc ttt gag gat atc gcc agc aat att ctc aat atg ctg cgc cag 1488
Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Arg Gln
485 490 495
cgg gtc acc ggc gat tac ctg cag acc tcg gcc att ctc gat cgg cag 1536
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Gln
500 505 510
ttc gag gtg gtg agt gcg gtc aac gac atc aat gac tat cag ggg ccg 1584
Phe Glu Val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro
515 520 525
ggc acc ggc tat cgc atc tct gcc gaa cgc tgg gcg gag atc aaa aat 1632
Gly Thr Gly Tyr Arg Ile Ser Ala Glu Arg Trp Ala Glu Ile Lys Asn
530 535 540
att ccg ggc gtg gtt cag ccc gac acc att gaa taa 1668
Ile Pro Gly Val Val Gln Pro Asp Thr Ile Glu
545 550 555
<210> 10
<211> 555
<212> PRT
<213> Klebsiella pneumoniae
<400> 10
Met Lys Arg Ser Lys Arg Phe Ala Val Leu Ala Gln Arg Pro Val Asn
1 5 10 15
Gln Asp Gly Leu Ile Gly Glu Trp Pro Glu Glu Gly Leu Ile Ala Met
20 25 30
Asp Ser Pro Phe Asp Pro Val Ser Ser Val Lys Val Asp Asn Gly Leu
35 40 45
Ile Val Glu Leu Asp Gly Lys Arg Arg Asp Gln Phe Asp Met Ile Asp
50 55 60
Arg Phe Ile Ala Asp Tyr Ala Ile Asn Val Glu Arg Thr Glu Gln Ala
65 70 75 80
Met Arg Leu Glu Ala Val Glu Ile Ala Arg Met Leu Val Asp Ile His
85 90 95
Val Ser Arg Glu Glu Ile Ile Ala Ile Thr Thr Ala Ile Thr Pro Ala
100 105 110
Lys Ala Val Glu Val Met Ala Gln Met Asn Val Val Glu Met Met Met
115 120 125
Ala Leu Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Asn Gln Cys His
130 135 140
Val Thr Asn Leu Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala
145 150 155 160
Glu Ala Gly Ile Arg Gly Phe Ser Glu Gln Glu Thr Thr Val Gly Ile
165 170 175
Ala Arg Tyr Ala Pro Phe Asn Ala Leu Ala Leu Leu Val Gly Ser Gln
180 185 190
Cys Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Val Glu Glu Ala Thr
195 200 205
Glu Leu Glu Leu Gly Met Arg Gly Leu Thr Ser Tyr Ala Glu Thr Val
210 215 220
Ser Val Tyr Gly Thr Glu Ala Val Phe Thr Asp Gly Asp Asp Thr Pro
225 230 235 240
Trp Ser Lys Ala Phe Leu Ala Ser Ala Tyr Ala Ser Arg Gly Leu Lys
245 250 255
Met Arg Tyr Thr Ser Gly Thr Gly Ser Glu Ala Leu Met Gly Tyr Ser
260 265 270
Glu Ser Lys Ser Met Leu Tyr Leu Glu Ser Arg Cys Ile Phe Ile Thr
275 280 285
Lys Gly Ala Gly Val Gln Gly Leu Gln Asn Gly Ala Val Ser Cys Ile
290 295 300
Gly Met Thr Gly Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu
305 310 315 320
Asn Leu Ile Ala Ser Met Leu Asp Leu Glu Val Ala Ser Ala Asn Asp
325 330 335
Gln Thr Phe Ser His Ser Asp Ile Arg Arg Thr Ala Arg Thr Leu Met
340 345 350
Gln Met Leu Pro Gly Thr Asp Phe Ile Phe Ser Gly Tyr Ser Ala Val
355 360 365
Pro Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Phe Asp Ala Glu Asp
370 375 380
Phe Asp Asp Tyr Asn Ile Leu Gln Arg Asp Leu Met Val Asp Gly Gly
385 390 395 400
Leu Arg Pro Val Thr Glu Ala Glu Thr Ile Ala Ile Arg Gln Lys Ala
405 410 415
Ala Arg Ala Ile Gln Ala Val Phe Arg Glu Leu Gly Leu Pro Pro Ile
420 425 430
Ala Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Asn Glu
435 440 445
Met Pro Pro Arg Asn Val Val Glu Asp Leu Ser Ala Val Glu Glu Met
450 455 460
Met Lys Arg Asn Ile Thr Gly Leu Asp Ile Val Gly Ala Leu Ser Arg
465 470 475 480
Ser Gly Phe Glu Asp Ile Ala Ser Asn Ile Leu Asn Met Leu Arg Gln
485 490 495
Arg Val Thr Gly Asp Tyr Leu Gln Thr Ser Ala Ile Leu Asp Arg Gln
500 505 510
Phe Glu Val Val Ser Ala Val Asn Asp Ile Asn Asp Tyr Gln Gly Pro
515 520 525
Gly Thr Gly Tyr Arg Ile Ser Ala Glu Arg Trp Ala Glu Ile Lys Asn
530 535 540
Ile Pro Gly Val Val Gln Pro Asp Thr Ile Glu
545 550 555
<210> 11
<211> 585
<212> DNA
<213> Klebsiella pneumoniae
<220>
<221> CDS
<222> (1)..(585)
<400> 11
gtg caa cag aca acc caa att cag ccc tct ttt acc ctg aaa acc cgc 48
Val Gln Gln Thr Thr Gln Ile Gln Pro Ser Phe Thr Leu Lys Thr Arg
1 5 10 15
gag ggc ggg gta gct tct gcc gat gaa cgc gcc gat gaa gtg gtg atc 96
Glu Gly Gly Val Ala Ser Ala Asp Glu Arg Ala Asp Glu Val Val Ile
20 25 30
ggc gtc ggc cct gcc ttc gat aaa cac cag cat cac act ctg atc gat 144
Gly Val Gly Pro Ala Phe Asp Lys His Gln His His Thr Leu Ile Asp
35 40 45
atg ccc cat ggc gcg atc ctc aaa gag ctg att gcc ggg gtg gaa gaa 192
Met Pro His Gly Ala Ile Leu Lys Glu Leu Ile Ala Gly Val Glu Glu
50 55 60
gag ggg ctt cac gcc cgg gtg gtg cgc att ctg cgc acg tcc gac gtc 240
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val
65 70 75 80
tcc ttt atg gcc tgg gat gcg gcc aac ctg agc ggc tcg ggg atc ggc 288
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly
85 90 95
atc ggt atc cag tcg aag ggg acc acg gtc atc cat cag cgc gat ctg 336
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu
100 105 110
ctg ccg ctc agc aac ctg gag ctg ttc tcc cag gcg ccg ctg ctg acg 384
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr
115 120 125
ctg gag acc tac cgg cag att ggc aaa aac gct gcg cgc tat gcg cgc 432
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg
130 135 140
aaa gag tca cct tcg ccg gtg ccg gtg gtg aac gat cag atg gtg cgg 480
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg
145 150 155 160
ccg aaa ttt atg gcc aaa gcc gcg cta ttt cat atc aaa gag acc aaa 528
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys
165 170 175
cat gtg gtg cag gac gcc gag ccc gtc acc ctg cac atc gac tta gta 576
His Val Val Gln Asp Ala Glu Pro Val Thr Leu His Ile Asp Leu Val
180 185 190
agg gag tga 585
Arg Glu
<210> 12
<211> 194
<212> PRT
<213> Klebsiella pneumoniae
<400> 12
Val Gln Gln Thr Thr Gln Ile Gln Pro Ser Phe Thr Leu Lys Thr Arg
1 5 10 15
Glu Gly Gly Val Ala Ser Ala Asp Glu Arg Ala Asp Glu Val Val Ile
20 25 30
Gly Val Gly Pro Ala Phe Asp Lys His Gln His His Thr Leu Ile Asp
35 40 45
Met Pro His Gly Ala Ile Leu Lys Glu Leu Ile Ala Gly Val Glu Glu
50 55 60
Glu Gly Leu His Ala Arg Val Val Arg Ile Leu Arg Thr Ser Asp Val
65 70 75 80
Ser Phe Met Ala Trp Asp Ala Ala Asn Leu Ser Gly Ser Gly Ile Gly
85 90 95
Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Arg Asp Leu
100 105 110
Leu Pro Leu Ser Asn Leu Glu Leu Phe Ser Gln Ala Pro Leu Leu Thr
115 120 125
Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala Arg
130 135 140
Lys Glu Ser Pro Ser Pro Val Pro Val Val Asn Asp Gln Met Val Arg
145 150 155 160
Pro Lys Phe Met Ala Lys Ala Ala Leu Phe His Ile Lys Glu Thr Lys
165 170 175
His Val Val Gln Asp Ala Glu Pro Val Thr Leu His Ile Asp Leu Val
180 185 190
Arg Glu
<210> 13
<211> 426
<212> DNA
<213> Klebsiella pneumoniae
<220>
<221> CDS
<222> (1)..(426)
<400> 13
atg agc gag aaa acc atg cgc gtg cag gat tat ccg tta gcc acc cgc 48
Met Ser Glu Lys Thr Met Arg Val Gln Asp Tyr Pro Leu Ala Thr Arg
1 5 10 15
tgc ccg gag cat atc ctg acg cct acc ggc aaa cca ttg acc gat att 96
Cys Pro Glu His Ile Leu Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile
20 25 30
acc ctc gag aag gtg ctc tct ggc gag gtg ggc ccg cag gat gtg cgg 144
Thr Leu Glu Lys Val Leu Ser Gly Glu Val Gly Pro Gln Asp Val Arg
35 40 45
atc tcc cgc cag acc ctt gag tac cag gcg cag att gcc gag cag atg 192
Ile Ser Arg Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met
50 55 60
cag cgc cat gcg gtg gcg cgc aat ttc cgc cgc gcg gcg gag ctt atc 240
Gln Arg His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile
65 70 75 80
gcc att cct gac gag cgc att ctg gct atc tat aac gcg ctg cgc ccg 288
Ala Ile Pro Asp Glu Arg Ile Leu Ala Ile Tyr Asn Ala Leu Arg Pro
85 90 95
ttc cgc tcc tcg cag gcg gag ctg ctg gcg atc gcc gac gag ctg gag 336
Phe Arg Ser Ser Gln Ala Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu
100 105 110
cac acc tgg cat gcg aca gtg aat gcc gcc ttt gtc cgg gag tcg gcg 384
His Thr Trp His Ala Thr Val Asn Ala Ala Phe Val Arg Glu Ser Ala
115 120 125
gaa gtg tat cag cag cgg cat aag ctg cgt aaa gga agc taa 426
Glu Val Tyr Gln Gln Arg His Lys Leu Arg Lys Gly Ser
130 135 140
<210> 14
<211> 141
<212> PRT
<213> Klebsiella pneumoniae
<400> 14
Met Ser Glu Lys Thr Met Arg Val Gln Asp Tyr Pro Leu Ala Thr Arg
1 5 10 15
Cys Pro Glu His Ile Leu Thr Pro Thr Gly Lys Pro Leu Thr Asp Ile
20 25 30
Thr Leu Glu Lys Val Leu Ser Gly Glu Val Gly Pro Gln Asp Val Arg
35 40 45
Ile Ser Arg Gln Thr Leu Glu Tyr Gln Ala Gln Ile Ala Glu Gln Met
50 55 60
Gln Arg His Ala Val Ala Arg Asn Phe Arg Arg Ala Ala Glu Leu Ile
65 70 75 80
Ala Ile Pro Asp Glu Arg Ile Leu Ala Ile Tyr Asn Ala Leu Arg Pro
85 90 95
Phe Arg Ser Ser Gln Ala Glu Leu Leu Ala Ile Ala Asp Glu Leu Glu
100 105 110
His Thr Trp His Ala Thr Val Asn Ala Ala Phe Val Arg Glu Ser Ala
115 120 125
Glu Val Tyr Gln Gln Arg His Lys Leu Arg Lys Gly Ser
130 135 140
<210> 15
<211> 1539
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(1539)
<400> 15
atg acc aat aat ccc cct tca gca cag att aag ccc ggc gag tat ggt 48
Met Thr Asn Asn Pro Pro Ser Ala Gln Ile Lys Pro Gly Glu Tyr Gly
1 5 10 15
ttc ccc ctc aag tta aaa gcc cgc tat gac aac ttt att ggc ggc gaa 96
Phe Pro Leu Lys Leu Lys Ala Arg Tyr Asp Asn Phe Ile Gly Gly Glu
20 25 30
tgg gta gcc cct gcc gac ggc gag tat tac cag aat ctg acg ccg gtg 144
Trp Val Ala Pro Ala Asp Gly Glu Tyr Tyr Gln Asn Leu Thr Pro Val
35 40 45
acc ggg cag ctg ctg tgc gaa gtg gcg tct tcg ggc aaa cga gac atc 192
Thr Gly Gln Leu Leu Cys Glu Val Ala Ser Ser Gly Lys Arg Asp Ile
50 55 60
gat ctg gcg ctg gat gct gcg cac aaa gtg aaa gat aaa tgg gcg cac 240
Asp Leu Ala Leu Asp Ala Ala His Lys Val Lys Asp Lys Trp Ala His
65 70 75 80
acc tcg gtg cag gat cgt gcg gcg att ctg ttt aag att gcc gat cga 288
Thr Ser Val Gln Asp Arg Ala Ala Ile Leu Phe Lys Ile Ala Asp Arg
85 90 95
atg gaa caa aac ctc gag ctg tta gcg aca gct gaa acc tgg gat aac 336
Met Glu Gln Asn Leu Glu Leu Leu Ala Thr Ala Glu Thr Trp Asp Asn
100 105 110
ggc aaa ccc att cgc gaa acc agt gct gcg gat gta ccg ctg gcg att 384
Gly Lys Pro Ile Arg Glu Thr Ser Ala Ala Asp Val Pro Leu Ala Ile
115 120 125
gac cat ttc cgc tat ttc gcc tcg tgt att cgg gcg cag gaa ggt ggg 432
Asp His Phe Arg Tyr Phe Ala Ser Cys Ile Arg Ala Gln Glu Gly Gly
130 135 140
atc agt gaa gtt gat agc gaa acc gtg gcc tat cat ttc cat gaa ccg 480
Ile Ser Glu Val Asp Ser Glu Thr Val Ala Tyr His Phe His Glu Pro
145 150 155 160
tta ggc gtg gtg ggg cag att atc ccg tgg aac ttc ccg ctg ctg atg 528
Leu Gly Val Val Gly Gln Ile Ile Pro Trp Asn Phe Pro Leu Leu Met
165 170 175
gcg agc tgg aaa atg gct ccc gcg ctg gcg gcg ggc aac tgt gtg gtg 576
Ala Ser Trp Lys Met Ala Pro Ala Leu Ala Ala Gly Asn Cys Val Val
180 185 190
ctg aaa ccc gca cgt ctt acc ccg ctt tct gta ctg ctg cta atg gaa 624
Leu Lys Pro Ala Arg Leu Thr Pro Leu Ser Val Leu Leu Leu Met Glu
195 200 205
att gtc ggt gat tta ctg ccg ccg ggc gtg gtg aac gtg gtc aat ggc 672
Ile Val Gly Asp Leu Leu Pro Pro Gly Val Val Asn Val Val Asn Gly
210 215 220
gca ggt ggg gta att ggc gaa tat ctg gcg acc tcg aaa cgc atc gcc 720
Ala Gly Gly Val Ile Gly Glu Tyr Leu Ala Thr Ser Lys Arg Ile Ala
225 230 235 240
aaa gtg gcg ttt acc ggc tca acg gaa gtg ggc caa caa att atg caa 768
Lys Val Ala Phe Thr Gly Ser Thr Glu Val Gly Gln Gln Ile Met Gln
245 250 255
tac gca acg caa aac att att ccg gtg acg ctg gag ttg ggc ggt aag 816
Tyr Ala Thr Gln Asn Ile Ile Pro Val Thr Leu Glu Leu Gly Gly Lys
260 265 270
tcg cca aat atc ttc ttt gct gat gtg atg gat gaa gaa gat gcc ttt 864
Ser Pro Asn Ile Phe Phe Ala Asp Val Met Asp Glu Glu Asp Ala Phe
275 280 285
ttc gat aaa gcg ctg gaa ggc ttt gca ctg ttt gcc ttt aac cag ggc 912
Phe Asp Lys Ala Leu Glu Gly Phe Ala Leu Phe Ala Phe Asn Gln Gly
290 295 300
gaa gtt tgc acc tgt ccg agt cgt gct tta gtg cag gaa tct atc tac 960
Glu Val Cys Thr Cys Pro Ser Arg Ala Leu Val Gln Glu Ser Ile Tyr
305 310 315 320
gaa cgc ttt atg gaa cgc gcc atc cgc cgt gtc gaa agc att cgt agc 1008
Glu Arg Phe Met Glu Arg Ala Ile Arg Arg Val Glu Ser Ile Arg Ser
325 330 335
ggt aac ccg ctc gac agc gtg acg caa atg ggc gcg cag gtt tct cac 1056
Gly Asn Pro Leu Asp Ser Val Thr Gln Met Gly Ala Gln Val Ser His
340 345 350
ggg caa ctg gaa acc atc ctc aac tac att gat atc ggt aaa aaa gag 1104
Gly Gln Leu Glu Thr Ile Leu Asn Tyr Ile Asp Ile Gly Lys Lys Glu
355 360 365
ggc gct gac gtg ctc aca ggc ggg cgg cgc aag ctg ctg gaa ggt gaa 1152
Gly Ala Asp Val Leu Thr Gly Gly Arg Arg Lys Leu Leu Glu Gly Glu
370 375 380
ctg aaa gac ggc tac tac ctc gaa ccg acg att ctg ttt ggt cag aac 1200
Leu Lys Asp Gly Tyr Tyr Leu Glu Pro Thr Ile Leu Phe Gly Gln Asn
385 390 395 400
aat atg cgg gtg ttc cag gag gag att ttt ggc ccg gtg ctg gcg gtg 1248
Asn Met Arg Val Phe Gln Glu Glu Ile Phe Gly Pro Val Leu Ala Val
405 410 415
acc acc ttc aaa acg atg gaa gaa gcg ctg gag ctg gcg aac gat acg 1296
Thr Thr Phe Lys Thr Met Glu Glu Ala Leu Glu Leu Ala Asn Asp Thr
420 425 430
caa tat ggc ctg ggc gcg ggc gtc tgg agc cgc aac ggt aat ctg gcc 1344
Gln Tyr Gly Leu Gly Ala Gly Val Trp Ser Arg Asn Gly Asn Leu Ala
435 440 445
tat aag atg ggg cgc ggc ata cag gct ggg cgc gtg tgg acc aac tgt 1392
Tyr Lys Met Gly Arg Gly Ile Gln Ala Gly Arg Val Trp Thr Asn Cys
450 455 460
tat cac gct tac ccg gca cat gcg gcg ttt ggt ggc tac aaa caa tca 1440
Tyr His Ala Tyr Pro Ala His Ala Ala Phe Gly Gly Tyr Lys Gln Ser
465 470 475 480
ggt atc ggt cgc gaa acc cac aag atg atg ctg gag cat tac cag caa 1488
Gly Ile Gly Arg Glu Thr His Lys Met Met Leu Glu His Tyr Gln Gln
485 490 495
acc aag tgc ctg ctg gtg agc tac tcg gat aaa ccg ttg ggg ctg ttc 1536
Thr Lys Cys Leu Leu Val Ser Tyr Ser Asp Lys Pro Leu Gly Leu Phe
500 505 510
tga 1539
<210> 16
<211> 512
<212> PRT
<213> Escherichia coli
<400> 16
Met Thr Asn Asn Pro Pro Ser Ala Gln Ile Lys Pro Gly Glu Tyr Gly
1 5 10 15
Phe Pro Leu Lys Leu Lys Ala Arg Tyr Asp Asn Phe Ile Gly Gly Glu
20 25 30
Trp Val Ala Pro Ala Asp Gly Glu Tyr Tyr Gln Asn Leu Thr Pro Val
35 40 45
Thr Gly Gln Leu Leu Cys Glu Val Ala Ser Ser Gly Lys Arg Asp Ile
50 55 60
Asp Leu Ala Leu Asp Ala Ala His Lys Val Lys Asp Lys Trp Ala His
65 70 75 80
Thr Ser Val Gln Asp Arg Ala Ala Ile Leu Phe Lys Ile Ala Asp Arg
85 90 95
Met Glu Gln Asn Leu Glu Leu Leu Ala Thr Ala Glu Thr Trp Asp Asn
100 105 110
Gly Lys Pro Ile Arg Glu Thr Ser Ala Ala Asp Val Pro Leu Ala Ile
115 120 125
Asp His Phe Arg Tyr Phe Ala Ser Cys Ile Arg Ala Gln Glu Gly Gly
130 135 140
Ile Ser Glu Val Asp Ser Glu Thr Val Ala Tyr His Phe His Glu Pro
145 150 155 160
Leu Gly Val Val Gly Gln Ile Ile Pro Trp Asn Phe Pro Leu Leu Met
165 170 175
Ala Ser Trp Lys Met Ala Pro Ala Leu Ala Ala Gly Asn Cys Val Val
180 185 190
Leu Lys Pro Ala Arg Leu Thr Pro Leu Ser Val Leu Leu Leu Met Glu
195 200 205
Ile Val Gly Asp Leu Leu Pro Pro Gly Val Val Asn Val Val Asn Gly
210 215 220
Ala Gly Gly Val Ile Gly Glu Tyr Leu Ala Thr Ser Lys Arg Ile Ala
225 230 235 240
Lys Val Ala Phe Thr Gly Ser Thr Glu Val Gly Gln Gln Ile Met Gln
245 250 255
Tyr Ala Thr Gln Asn Ile Ile Pro Val Thr Leu Glu Leu Gly Gly Lys
260 265 270
Ser Pro Asn Ile Phe Phe Ala Asp Val Met Asp Glu Glu Asp Ala Phe
275 280 285
Phe Asp Lys Ala Leu Glu Gly Phe Ala Leu Phe Ala Phe Asn Gln Gly
290 295 300
Glu Val Cys Thr Cys Pro Ser Arg Ala Leu Val Gln Glu Ser Ile Tyr
305 310 315 320
Glu Arg Phe Met Glu Arg Ala Ile Arg Arg Val Glu Ser Ile Arg Ser
325 330 335
Gly Asn Pro Leu Asp Ser Val Thr Gln Met Gly Ala Gln Val Ser His
340 345 350
Gly Gln Leu Glu Thr Ile Leu Asn Tyr Ile Asp Ile Gly Lys Lys Glu
355 360 365
Gly Ala Asp Val Leu Thr Gly Gly Arg Arg Lys Leu Leu Glu Gly Glu
370 375 380
Leu Lys Asp Gly Tyr Tyr Leu Glu Pro Thr Ile Leu Phe Gly Gln Asn
385 390 395 400
Asn Met Arg Val Phe Gln Glu Glu Ile Phe Gly Pro Val Leu Ala Val
405 410 415
Thr Thr Phe Lys Thr Met Glu Glu Ala Leu Glu Leu Ala Asn Asp Thr
420 425 430
Gln Tyr Gly Leu Gly Ala Gly Val Trp Ser Arg Asn Gly Asn Leu Ala
435 440 445
Tyr Lys Met Gly Arg Gly Ile Gln Ala Gly Arg Val Trp Thr Asn Cys
450 455 460
Tyr His Ala Tyr Pro Ala His Ala Ala Phe Gly Gly Tyr Lys Gln Ser
465 470 475 480
Gly Ile Gly Arg Glu Thr His Lys Met Met Leu Glu His Tyr Gln Gln
485 490 495
Thr Lys Cys Leu Leu Val Ser Tyr Ser Asp Lys Pro Leu Gly Leu Phe
500 505 510
<210> 17
<211> 1440
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(1440)
<400> 17
atg tca gta ccc gtt caa cat cct atg tat atc gat gga cag ttt gtt 48
Met Ser Val Pro Val Gln His Pro Met Tyr Ile Asp Gly Gln Phe Val
1 5 10 15
acc tgg cgt gga gac gca tgg att gat gtg gta aac cct gct aca gag 96
Thr Trp Arg Gly Asp Ala Trp Ile Asp Val Val Asn Pro Ala Thr Glu
20 25 30
gct gtc att tcc cgc ata ccc gat ggt cag gcc gag gat gcc cgt aag 144
Ala Val Ile Ser Arg Ile Pro Asp Gly Gln Ala Glu Asp Ala Arg Lys
35 40 45
gca atc gat gca gca gaa cgt gca caa cca gaa tgg gaa gcg ttg cct 192
Ala Ile Asp Ala Ala Glu Arg Ala Gln Pro Glu Trp Glu Ala Leu Pro
50 55 60
gct att gaa cgc gcc agt tgg ttg cgc aaa atc tcc gcc ggg atc cgc 240
Ala Ile Glu Arg Ala Ser Trp Leu Arg Lys Ile Ser Ala Gly Ile Arg
65 70 75 80
gaa cgc gcc agt gaa atc agt gcg ctg att gtt gaa gaa ggg ggc aag 288
Glu Arg Ala Ser Glu Ile Ser Ala Leu Ile Val Glu Glu Gly Gly Lys
85 90 95
atc cag cag ctg gct gaa gtc gaa gtg gct ttt act gcc gac tat atc 336
Ile Gln Gln Leu Ala Glu Val Glu Val Ala Phe Thr Ala Asp Tyr Ile
100 105 110
gat tac atg gcg gag tgg gca cgg cgt tac gag ggc gag att att caa 384
Asp Tyr Met Ala Glu Trp Ala Arg Arg Tyr Glu Gly Glu Ile Ile Gln
115 120 125
agc gat cgt cca gga gaa aat att ctt ttg ttt aaa cgt gcg ctt ggt 432
Ser Asp Arg Pro Gly Glu Asn Ile Leu Leu Phe Lys Arg Ala Leu Gly
130 135 140
gtg act acc ggc att ctg ccg tgg aac ttc ccg ttc ttc ctc att gcc 480
Val Thr Thr Gly Ile Leu Pro Trp Asn Phe Pro Phe Phe Leu Ile Ala
145 150 155 160
cgc aaa atg gct ccc gct ctt ttg acc ggt aat acc atc gtc att aaa 528
Arg Lys Met Ala Pro Ala Leu Leu Thr Gly Asn Thr Ile Val Ile Lys
165 170 175
cct agt gaa ttt acg cca aac aat gcg att gca ttc gcc aaa atc gtc 576
Pro Ser Glu Phe Thr Pro Asn Asn Ala Ile Ala Phe Ala Lys Ile Val
180 185 190
gat gaa ata ggc ctt ccg cgc ggc gtg ttt aac ctt gta ctg ggg cgt 624
Asp Glu Ile Gly Leu Pro Arg Gly Val Phe Asn Leu Val Leu Gly Arg
195 200 205
ggt gaa acc gtt ggg caa gaa ctg gcg ggt aac cca aag gtc gca atg 672
Gly Glu Thr Val Gly Gln Glu Leu Ala Gly Asn Pro Lys Val Ala Met
210 215 220
gtc agt atg aca ggc agc gtc tct gca ggt gag aag atc atg gcg act 720
Val Ser Met Thr Gly Ser Val Ser Ala Gly Glu Lys Ile Met Ala Thr
225 230 235 240
gcg gcg aaa aac atc acc aaa gtg tgt ctg gaa ttg ggg ggt aaa gca 768
Ala Ala Lys Asn Ile Thr Lys Val Cys Leu Glu Leu Gly Gly Lys Ala
245 250 255
cca gct atc gta atg gac gat gcc gat ctt gaa ctg gca gtc aaa gcc 816
Pro Ala Ile Val Met Asp Asp Ala Asp Leu Glu Leu Ala Val Lys Ala
260 265 270
atc gtt gat tca cgc gtc att aat agt ggg caa gtg tgt aac tgt gca 864
Ile Val Asp Ser Arg Val Ile Asn Ser Gly Gln Val Cys Asn Cys Ala
275 280 285
gaa cgt gtt tat gta cag aaa ggc att tat gat cag ttc gtc aat cgg 912
Glu Arg Val Tyr Val Gln Lys Gly Ile Tyr Asp Gln Phe Val Asn Arg
290 295 300
ctg ggt gaa gcg atg cag gcg gtt caa ttt ggt aac ccc gct gaa cgc 960
Leu Gly Glu Ala Met Gln Ala Val Gln Phe Gly Asn Pro Ala Glu Arg
305 310 315 320
aac gac att gcg atg ggg ccg ttg att aac gcc gcg gcg ctg gaa agg 1008
Asn Asp Ile Ala Met Gly Pro Leu Ile Asn Ala Ala Ala Leu Glu Arg
325 330 335
gtc gag caa aaa gtg gcg cgc gca gta gaa gaa ggg gcg aga gtg gcg 1056
Val Glu Gln Lys Val Ala Arg Ala Val Glu Glu Gly Ala Arg Val Ala
340 345 350
ttc ggt ggc aaa gcg gta gag ggg aaa gga tat tat tat ccg ccg aca 1104
Phe Gly Gly Lys Ala Val Glu Gly Lys Gly Tyr Tyr Tyr Pro Pro Thr
355 360 365
ttg ctg ctg gat gtt cgc cag gaa atg tcg att atg cat gag gaa acc 1152
Leu Leu Leu Asp Val Arg Gln Glu Met Ser Ile Met His Glu Glu Thr
370 375 380
ttt ggc ccg gtg ctg cca gtt gtc gca ttt gac acg ctg gaa gat gct 1200
Phe Gly Pro Val Leu Pro Val Val Ala Phe Asp Thr Leu Glu Asp Ala
385 390 395 400
atc tca atg gct aat gac agt gat tac ggc ctg acc tca tca atc tat 1248
Ile Ser Met Ala Asn Asp Ser Asp Tyr Gly Leu Thr Ser Ser Ile Tyr
405 410 415
acc caa aat ctg aac gtc gcg atg aaa gcc att aaa ggg ctg aag ttt 1296
Thr Gln Asn Leu Asn Val Ala Met Lys Ala Ile Lys Gly Leu Lys Phe
420 425 430
ggt gaa act tac atc aac cgt gaa aac ttc gaa gct atg caa ggc ttc 1344
Gly Glu Thr Tyr Ile Asn Arg Glu Asn Phe Glu Ala Met Gln Gly Phe
435 440 445
cac gcc gga tgg cgt aaa tcc ggt att ggc ggc gca gat ggt aaa cat 1392
His Ala Gly Trp Arg Lys Ser Gly Ile Gly Gly Ala Asp Gly Lys His
450 455 460
ggc ttg cat gaa tat ctg cag acc cag gtg gtt tat tta cag tct taa 1440
Gly Leu His Glu Tyr Leu Gln Thr Gln Val Val Tyr Leu Gln Ser
465 470 475
<210> 18
<211> 479
<212> PRT
<213> Escherichia coli
<400> 18
Met Ser Val Pro Val Gln His Pro Met Tyr Ile Asp Gly Gln Phe Val
1 5 10 15
Thr Trp Arg Gly Asp Ala Trp Ile Asp Val Val Asn Pro Ala Thr Glu
20 25 30
Ala Val Ile Ser Arg Ile Pro Asp Gly Gln Ala Glu Asp Ala Arg Lys
35 40 45
Ala Ile Asp Ala Ala Glu Arg Ala Gln Pro Glu Trp Glu Ala Leu Pro
50 55 60
Ala Ile Glu Arg Ala Ser Trp Leu Arg Lys Ile Ser Ala Gly Ile Arg
65 70 75 80
Glu Arg Ala Ser Glu Ile Ser Ala Leu Ile Val Glu Glu Gly Gly Lys
85 90 95
Ile Gln Gln Leu Ala Glu Val Glu Val Ala Phe Thr Ala Asp Tyr Ile
100 105 110
Asp Tyr Met Ala Glu Trp Ala Arg Arg Tyr Glu Gly Glu Ile Ile Gln
115 120 125
Ser Asp Arg Pro Gly Glu Asn Ile Leu Leu Phe Lys Arg Ala Leu Gly
130 135 140
Val Thr Thr Gly Ile Leu Pro Trp Asn Phe Pro Phe Phe Leu Ile Ala
145 150 155 160
Arg Lys Met Ala Pro Ala Leu Leu Thr Gly Asn Thr Ile Val Ile Lys
165 170 175
Pro Ser Glu Phe Thr Pro Asn Asn Ala Ile Ala Phe Ala Lys Ile Val
180 185 190
Asp Glu Ile Gly Leu Pro Arg Gly Val Phe Asn Leu Val Leu Gly Arg
195 200 205
Gly Glu Thr Val Gly Gln Glu Leu Ala Gly Asn Pro Lys Val Ala Met
210 215 220
Val Ser Met Thr Gly Ser Val Ser Ala Gly Glu Lys Ile Met Ala Thr
225 230 235 240
Ala Ala Lys Asn Ile Thr Lys Val Cys Leu Glu Leu Gly Gly Lys Ala
245 250 255
Pro Ala Ile Val Met Asp Asp Ala Asp Leu Glu Leu Ala Val Lys Ala
260 265 270
Ile Val Asp Ser Arg Val Ile Asn Ser Gly Gln Val Cys Asn Cys Ala
275 280 285
Glu Arg Val Tyr Val Gln Lys Gly Ile Tyr Asp Gln Phe Val Asn Arg
290 295 300
Leu Gly Glu Ala Met Gln Ala Val Gln Phe Gly Asn Pro Ala Glu Arg
305 310 315 320
Asn Asp Ile Ala Met Gly Pro Leu Ile Asn Ala Ala Ala Leu Glu Arg
325 330 335
Val Glu Gln Lys Val Ala Arg Ala Val Glu Glu Gly Ala Arg Val Ala
340 345 350
Phe Gly Gly Lys Ala Val Glu Gly Lys Gly Tyr Tyr Tyr Pro Pro Thr
355 360 365
Leu Leu Leu Asp Val Arg Gln Glu Met Ser Ile Met His Glu Glu Thr
370 375 380
Phe Gly Pro Val Leu Pro Val Val Ala Phe Asp Thr Leu Glu Asp Ala
385 390 395 400
Ile Ser Met Ala Asn Asp Ser Asp Tyr Gly Leu Thr Ser Ser Ile Tyr
405 410 415
Thr Gln Asn Leu Asn Val Ala Met Lys Ala Ile Lys Gly Leu Lys Phe
420 425 430
Gly Glu Thr Tyr Ile Asn Arg Glu Asn Phe Glu Ala Met Gln Gly Phe
435 440 445
His Ala Gly Trp Arg Lys Ser Gly Ile Gly Gly Ala Asp Gly Lys His
450 455 460
Gly Leu His Glu Tyr Leu Gln Thr Gln Val Val Tyr Leu Gln Ser
465 470 475
<210> 19
<211> 1488
<212> DNA
<213> Escherichia coli
<220>
<221> CDS
<222> (1)..(1488)
<400> 19
atg aat ttt cat cat ctg gct tac tgg cag gat aaa gcg tta agt ctc 48
Met Asn Phe His His Leu Ala Tyr Trp Gln Asp Lys Ala Leu Ser Leu
1 5 10 15
gcc att gaa aac cgc tta ttt att aac ggt gaa tat act gct gcg gcg 96
Ala Ile Glu Asn Arg Leu Phe Ile Asn Gly Glu Tyr Thr Ala Ala Ala
20 25 30
gaa aat gaa acc ttt gaa acc gtt gat ccg gtc acc cag gca ccg ctg 144
Glu Asn Glu Thr Phe Glu Thr Val Asp Pro Val Thr Gln Ala Pro Leu
35 40 45
gcg aaa att gcc cgc ggc aag agc gtc gat atc gac cgt gcg atg agc 192
Ala Lys Ile Ala Arg Gly Lys Ser Val Asp Ile Asp Arg Ala Met Ser
50 55 60
gca gca cgc ggc gta ttt gaa cgc ggc gac tgg tca ctc tct tct ccg 240
Ala Ala Arg Gly Val Phe Glu Arg Gly Asp Trp Ser Leu Ser Ser Pro
65 70 75 80
gct aaa cgt aaa gcg gta ctg aat aaa ctc gcc gat tta atg gaa gcc 288
Ala Lys Arg Lys Ala Val Leu Asn Lys Leu Ala Asp Leu Met Glu Ala
85 90 95
cac gcc gaa gag ctg gca ctg ctg gaa act ctc gac acc ggc aaa ccg 336
His Ala Glu Glu Leu Ala Leu Leu Glu Thr Leu Asp Thr Gly Lys Pro
100 105 110
att cgt cac agt ctg cgt gat gat att ccc ggc gcg gcg cgc gcc att 384
Ile Arg His Ser Leu Arg Asp Asp Ile Pro Gly Ala Ala Arg Ala Ile
115 120 125
cgc tgg tac gcc gaa gcg atc gac aaa gtg tat ggc gaa gtg gcg acc 432
Arg Trp Tyr Ala Glu Ala Ile Asp Lys Val Tyr Gly Glu Val Ala Thr
130 135 140
acc agt agc cat gag ctg gcg atg atc gtg cgt gaa ccg gtc ggc gtg 480
Thr Ser Ser His Glu Leu Ala Met Ile Val Arg Glu Pro Val Gly Val
145 150 155 160
att gcc gcc atc gtg ccg tgg aac ttc ccg ctg ttg ctg act tgc tgg 528
Ile Ala Ala Ile Val Pro Trp Asn Phe Pro Leu Leu Leu Thr Cys Trp
165 170 175
aaa ctc ggc ccg gcg ctg gcg gcg gga aac agc gtg att cta aaa ccg 576
Lys Leu Gly Pro Ala Leu Ala Ala Gly Asn Ser Val Ile Leu Lys Pro
180 185 190
tct gaa aaa tca ccg ctc agt gcg att cgt ctc gcg ggg ctg gcg aaa 624
Ser Glu Lys Ser Pro Leu Ser Ala Ile Arg Leu Ala Gly Leu Ala Lys
195 200 205
gaa gca ggc ttg ccg gat ggt gtg ttg aac gtg gtg acg ggt ttt ggt 672
Glu Ala Gly Leu Pro Asp Gly Val Leu Asn Val Val Thr Gly Phe Gly
210 215 220
cat gaa gcc ggg cag gcg ctg tcg cgt cat aac gat atc gac gcc att 720
His Glu Ala Gly Gln Ala Leu Ser Arg His Asn Asp Ile Asp Ala Ile
225 230 235 240
gcc ttt acc ggt tca acc cgt acc ggg aaa cag ctg ctg aaa gat gcg 768
Ala Phe Thr Gly Ser Thr Arg Thr Gly Lys Gln Leu Leu Lys Asp Ala
245 250 255
ggc gac agc aac atg aaa cgc gtc tgg ctg gaa gcg ggc ggc aaa agc 816
Gly Asp Ser Asn Met Lys Arg Val Trp Leu Glu Ala Gly Gly Lys Ser
260 265 270
gcc aac atc gtt ttc gct gac tgc ccg gat ttg caa cag gcg gca agc 864
Ala Asn Ile Val Phe Ala Asp Cys Pro Asp Leu Gln Gln Ala Ala Ser
275 280 285
gcc acc gca gca ggc att ttc tac aac cag gga cag gtg tgc atc gcc 912
Ala Thr Ala Ala Gly Ile Phe Tyr Asn Gln Gly Gln Val Cys Ile Ala
290 295 300
gga acg cgc ctg ttg ctg gaa gag agc atc gcc gat gaa ttc tta gcc 960
Gly Thr Arg Leu Leu Leu Glu Glu Ser Ile Ala Asp Glu Phe Leu Ala
305 310 315 320
ctg tta aaa cag cag gcg caa aac tgg cag ccg ggc cat cca ctt gat 1008
Leu Leu Lys Gln Gln Ala Gln Asn Trp Gln Pro Gly His Pro Leu Asp
325 330 335
ccc gca acc acc atg ggc acc tta atc gac tgc gcc cac gcc gac tcg 1056
Pro Ala Thr Thr Met Gly Thr Leu Ile Asp Cys Ala His Ala Asp Ser
340 345 350
gtc cat agc ttt att cgg gaa ggc gaa agc aaa ggg caa ctg ttg ttg 1104
Val His Ser Phe Ile Arg Glu Gly Glu Ser Lys Gly Gln Leu Leu Leu
355 360 365
gat ggc cgt aac gcc ggg ctg gct gcc gcc atc ggc ccg acc atc ttt 1152
Asp Gly Arg Asn Ala Gly Leu Ala Ala Ala Ile Gly Pro Thr Ile Phe
370 375 380
gtg gat gtg gac ccg aat gcg tcc tta agt cgc gaa gag att ttc ggt 1200
Val Asp Val Asp Pro Asn Ala Ser Leu Ser Arg Glu Glu Ile Phe Gly
385 390 395 400
ccg gtg ctg gtg gtc acg cgt ttc aca tca gaa gaa cag gcg cta cag 1248
Pro Val Leu Val Val Thr Arg Phe Thr Ser Glu Glu Gln Ala Leu Gln
405 410 415
ctt gcc aac gac agc cag tac ggc ctt ggc gcg gcg gta tgg acg cgc 1296
Leu Ala Asn Asp Ser Gln Tyr Gly Leu Gly Ala Ala Val Trp Thr Arg
420 425 430
gac ctc tcc cgc gcg cac cgc atg agc cga cgc ctg aaa gcc ggt tcc 1344
Asp Leu Ser Arg Ala His Arg Met Ser Arg Arg Leu Lys Ala Gly Ser
435 440 445
gtc ttc gtc aat aac tac aac gac ggc gat atg acc gtg ccg ttt ggc 1392
Val Phe Val Asn Asn Tyr Asn Asp Gly Asp Met Thr Val Pro Phe Gly
450 455 460
ggc tat aag cag agc ggc aac ggt cgc gac aaa tcc ctg cat gcc ctt 1440
Gly Tyr Lys Gln Ser Gly Asn Gly Arg Asp Lys Ser Leu His Ala Leu
465 470 475 480
gaa aaa ttc act gaa ctg aaa acc atc tgg ata agc ctg gag gcc tga 1488
Glu Lys Phe Thr Glu Leu Lys Thr Ile Trp Ile Ser Leu Glu Ala
485 490 495
<210> 20
<211> 495
<212> PRT
<213> Escherichia coli
<400> 20
Met Asn Phe His His Leu Ala Tyr Trp Gln Asp Lys Ala Leu Ser Leu
1 5 10 15
Ala Ile Glu Asn Arg Leu Phe Ile Asn Gly Glu Tyr Thr Ala Ala Ala
20 25 30
Glu Asn Glu Thr Phe Glu Thr Val Asp Pro Val Thr Gln Ala Pro Leu
35 40 45
Ala Lys Ile Ala Arg Gly Lys Ser Val Asp Ile Asp Arg Ala Met Ser
50 55 60
Ala Ala Arg Gly Val Phe Glu Arg Gly Asp Trp Ser Leu Ser Ser Pro
65 70 75 80
Ala Lys Arg Lys Ala Val Leu Asn Lys Leu Ala Asp Leu Met Glu Ala
85 90 95
His Ala Glu Glu Leu Ala Leu Leu Glu Thr Leu Asp Thr Gly Lys Pro
100 105 110
Ile Arg His Ser Leu Arg Asp Asp Ile Pro Gly Ala Ala Arg Ala Ile
115 120 125
Arg Trp Tyr Ala Glu Ala Ile Asp Lys Val Tyr Gly Glu Val Ala Thr
130 135 140
Thr Ser Ser His Glu Leu Ala Met Ile Val Arg Glu Pro Val Gly Val
145 150 155 160
Ile Ala Ala Ile Val Pro Trp Asn Phe Pro Leu Leu Leu Thr Cys Trp
165 170 175
Lys Leu Gly Pro Ala Leu Ala Ala Gly Asn Ser Val Ile Leu Lys Pro
180 185 190
Ser Glu Lys Ser Pro Leu Ser Ala Ile Arg Leu Ala Gly Leu Ala Lys
195 200 205
Glu Ala Gly Leu Pro Asp Gly Val Leu Asn Val Val Thr Gly Phe Gly
210 215 220
His Glu Ala Gly Gln Ala Leu Ser Arg His Asn Asp Ile Asp Ala Ile
225 230 235 240
Ala Phe Thr Gly Ser Thr Arg Thr Gly Lys Gln Leu Leu Lys Asp Ala
245 250 255
Gly Asp Ser Asn Met Lys Arg Val Trp Leu Glu Ala Gly Gly Lys Ser
260 265 270
Ala Asn Ile Val Phe Ala Asp Cys Pro Asp Leu Gln Gln Ala Ala Ser
275 280 285
Ala Thr Ala Ala Gly Ile Phe Tyr Asn Gln Gly Gln Val Cys Ile Ala
290 295 300
Gly Thr Arg Leu Leu Leu Glu Glu Ser Ile Ala Asp Glu Phe Leu Ala
305 310 315 320
Leu Leu Lys Gln Gln Ala Gln Asn Trp Gln Pro Gly His Pro Leu Asp
325 330 335
Pro Ala Thr Thr Met Gly Thr Leu Ile Asp Cys Ala His Ala Asp Ser
340 345 350
Val His Ser Phe Ile Arg Glu Gly Glu Ser Lys Gly Gln Leu Leu Leu
355 360 365
Asp Gly Arg Asn Ala Gly Leu Ala Ala Ala Ile Gly Pro Thr Ile Phe
370 375 380
Val Asp Val Asp Pro Asn Ala Ser Leu Ser Arg Glu Glu Ile Phe Gly
385 390 395 400
Pro Val Leu Val Val Thr Arg Phe Thr Ser Glu Glu Gln Ala Leu Gln
405 410 415
Leu Ala Asn Asp Ser Gln Tyr Gly Leu Gly Ala Ala Val Trp Thr Arg
420 425 430
Asp Leu Ser Arg Ala His Arg Met Ser Arg Arg Leu Lys Ala Gly Ser
435 440 445
Val Phe Val Asn Asn Tyr Asn Asp Gly Asp Met Thr Val Pro Phe Gly
450 455 460
Gly Tyr Lys Gln Ser Gly Asn Gly Arg Asp Lys Ser Leu His Ala Leu
465 470 475 480
Glu Lys Phe Thr Glu Leu Lys Thr Ile Trp Ile Ser Leu Glu Ala
485 490 495
<210> 21
<211> 1395
<212> DNA
<213> Escherichia coli
<400> 21
atgcctgacg ctaaaaaaca ggggcggtca aacaaggcaa tgacgttttt cgtctgcttc 60
cttgccgctc tggcgggatt actctttggc ctggatatcg gtgtaattgc tggcgcactg 120
ccgtttattg cagatgaatt ccagattact tcgcacacgc aagaatgggt cgtaagctcc 180
atgatgttcg gtgcggcagt cggtgcggtg ggcagcggct ggctctcctt taaactcggg 240
cgcaaaaaga gcctgatgat cggcgcaatt ttgtttgttg ccggttcgct gttctctgcg 300
gctgcgccaa acgttgaagt actgattctt tcccgcgttc tactggggct ggcggtgggt 360
gtggcctctt ataccgcacc gctgtacctc tctgaaattg cgccggaaaa aattcgtggc 420
agtatgatct cgatgtatca gttgatgatc actatcggga tcctcggtgc ttatctttct 480
gataccgcct tcagctacac cggtgcatgg cgctggatgc tgggtgtgat tatcatcccg 540
gcaattttgc tgctgattgg tgtcttcttc ctgccagaca gcccacgttg gtttgccgcc 600
aaacgccgtt ttgttgatgc cgaacgcgtg ctgctacgcc tgcgtgacac cagcgcggaa 660
gcgaaacgcg aactggatga aatccgtgaa agtttgcagg ttaaacagag tggctgggcg 720
ctgtttaaag agaacagcaa cttccgccgc gcggtgttcc ttggcgtact gttgcaggta 780
atgcagcaat tcaccgggat gaacgtcatc atgtattacg cgccgaaaat cttcgaactg 840
gcgggttata ccaacactac cgagcaaatg tgggggaccg tgattgtcgg cctgaccaac 900
gtacttgcca cctttatcgc aatcggcctt gttgaccgct ggggacgtaa accaacgcta 960
acgctgggct tcctggtgat ggctgctggc atgggcgtac tcggtacaat gatgcatatc 1020
ggtattcact ctccgtcggc gcagtatttc gccatcgcca tgctgctgat gtttattgtc 1080
ggttttgcca tgagtgccgg tccgctgatt tgggtactgt gctccgaaat tcagccgctg 1140
aaaggccgcg attttggcat cacctgctcc actgccacca actggattgc caacatgatc 1200
gttggcgcaa cgttcctgac catgctcaac acgctgggta acgccaacac cttctgggtg 1260
tatgcggctc tgaacgtact gtttatcctg ctgacattgt ggctggtacc ggaaaccaaa 1320
cacgtttcgc tggaacatat tgaacgtaat ctgatgaaag gtcgtaaact gcgcgaaata 1380
ggcgctcacg attaa 1395
<210> 22
<211> 464
<212> PRT
<213> Escherichia coli
<400> 22
Met Pro Asp Ala Lys Lys Gln Gly Arg Ser Asn Lys Ala Met Thr Phe
1 5 10 15
Phe Val Cys Phe Leu Ala Ala Leu Ala Gly Leu Leu Phe Gly Leu Asp
20 25 30
Ile Gly Val Ile Ala Gly Ala Leu Pro Phe Ile Ala Asp Glu Phe Gln
35 40 45
Ile Thr Ser His Thr Gln Glu Trp Val Val Ser Ser Met Met Phe Gly
50 55 60
Ala Ala Val Gly Ala Val Gly Ser Gly Trp Leu Ser Phe Lys Leu Gly
65 70 75 80
Arg Lys Lys Ser Leu Met Ile Gly Ala Ile Leu Phe Val Ala Gly Ser
85 90 95
Leu Phe Ser Ala Ala Ala Pro Asn Val Glu Val Leu Ile Leu Ser Arg
100 105 110
Val Leu Leu Gly Leu Ala Val Gly Val Ala Ser Tyr Thr Ala Pro Leu
115 120 125
Tyr Leu Ser Glu Ile Ala Pro Glu Lys Ile Arg Gly Ser Met Ile Ser
130 135 140
Met Tyr Gln Leu Met Ile Thr Ile Gly Ile Leu Gly Ala Tyr Leu Ser
145 150 155 160
Asp Thr Ala Phe Ser Tyr Thr Gly Ala Trp Arg Trp Met Leu Gly Val
165 170 175
Ile Ile Ile Pro Ala Ile Leu Leu Leu Ile Gly Val Phe Phe Leu Pro
180 185 190
Asp Ser Pro Arg Trp Phe Ala Ala Lys Arg Arg Phe Val Asp Ala Glu
195 200 205
Arg Val Leu Leu Arg Leu Arg Asp Thr Ser Ala Glu Ala Lys Arg Glu
210 215 220
Leu Asp Glu Ile Arg Glu Ser Leu Gln Val Lys Gln Ser Gly Trp Ala
225 230 235 240
Leu Phe Lys Glu Asn Ser Asn Phe Arg Arg Ala Val Phe Leu Gly Val
245 250 255
Leu Leu Gln Val Met Gln Gln Phe Thr Gly Met Asn Val Ile Met Tyr
260 265 270
Tyr Ala Pro Lys Ile Phe Glu Leu Ala Gly Tyr Thr Asn Thr Thr Glu
275 280 285
Gln Met Trp Gly Thr Val Ile Val Gly Leu Thr Asn Val Leu Ala Thr
290 295 300
Phe Ile Ala Ile Gly Leu Val Asp Arg Trp Gly Arg Lys Pro Thr Leu
305 310 315 320
Thr Leu Gly Phe Leu Val Met Ala Ala Gly Met Gly Val Leu Gly Thr
325 330 335
Met Met His Ile Gly Ile His Ser Pro Ser Ala Gln Tyr Phe Ala Ile
340 345 350
Ala Met Leu Leu Met Phe Ile Val Gly Phe Ala Met Ser Ala Gly Pro
355 360 365
Leu Ile Trp Val Leu Cys Ser Glu Ile Gln Pro Leu Lys Gly Arg Asp
370 375 380
Phe Gly Ile Thr Cys Ser Thr Ala Thr Asn Trp Ile Ala Asn Met Ile
385 390 395 400
Val Gly Ala Thr Phe Leu Thr Met Leu Asn Thr Leu Gly Asn Ala Asn
405 410 415
Thr Phe Trp Val Tyr Ala Ala Leu Asn Val Leu Phe Ile Leu Leu Thr
420 425 430
Leu Trp Leu Val Pro Glu Thr Lys His Val Ser Leu Glu His Ile Glu
435 440 445
Arg Asn Leu Met Lys Gly Arg Lys Leu Arg Glu Ile Gly Ala His Asp
450 455 460
<210> 23
<211> 1248
<212> DNA
<213> Escherichia coli
<400> 23
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctaggattaa cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcattct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctcttttt tggcctgggg 360
tatctggcgg gatgcggttt gcttgacagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggtatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg catagcggcg 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactc 720
tttcctgtct tttatgcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggtg ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgttgtt cgttaacccc tggattattt cattagtgaa gctgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cctgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 24
<211> 415
<212> PRT
<213> Escherichia coli
<400> 24
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Ile Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ala Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 25
<211> 1248
<212> DNA
<213> Escherichia coli
<400> 25
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 26
<211> 415
<212> PRT
<213> Escherichia coli
<400> 26
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 27
<211> 1326
<212> DNA
<213> Bifidobacterium lactis
<400> 27
atggcaacaa ccacgaaggt gtggaggaac ccctcctacc tgcaaagctc aaccggcatc 60
ttcctgttct tctgctcctg gggcatctgg tggtcgttct tccagcgctg gctcaactcg 120
atgggactca acggcgcgaa agtgggcacg atctattcga tcaactcgct ggccacgctc 180
atcctcatgt tcgggtacgg cctcatccag gacaatctcg gactcaagcg ccgtcttgtg 240
ctcgtcatct cggcgatcgc cgcactcgtc ggacccttcg tgcagttcgt gtacgcgccg 300
ctgatgagga cgaacatgat ggccgccgca ctcgtgggct ccgtcgttct ctccgcgggc 360
ttcatggcag gctgctcgct catagagccc gtgaccgaac ggtacagccg ccgtttcaac 420
ttagagtacg gccaatcccg cgcatggggt tccttcggat atgccattgt ggcgcttgtc 480
gccggcttcg tgttcaacat caacccgatg atcaacttct ggctcggctc cgcattcggc 540
gtgggcatgc tcatcgtgta cctcacctgg tatccggccg agcagcgcga agcgctcaag 600
gaagccgccg atccgaatgc cgcgccaact aacccgacca tcaaagacat gctcggcgtg 660
ctcaagatgc ccacgctgtg ggtgctcatc gtgttcatgc tgctcaccaa cacgttctac 720
accgtattcg accagcagat gttccccacc tactacgcct cgctcttccc gaatgaggcc 780
accggcaacg ccgtctacgg cacgctcaac tcggtgcagg tgttctgcga atccgcgatg 840
atgggcgtcg tgccgatcat catgcgcaag gtaggtgtgc gcaacgcgtt gctgctcgga 900
tccacggtga tgttccttcg catcgggctg tgcggcatct tccacgatcc ggtgtccatc 960
tcgatcgtca aaatgttcca cgccattgaa gttccgctgt tctgcctgcc ggcgttccgc 1020
tacttcacgc tccacttcaa tccgaagctc tccgcgacgc tctacatggt cggcttccag 1080
attgcctcac agatcggcca ggtcgtcttc tccaccccgc tcggcatgct gcatgaccgc 1140
atgggcgacc gcacgacgtt cctgacgatc tccgccatcg tgcttgctgc caccgtctac 1200
ggattcttcg tgatcaagcg cgacgacgag caggtggatg gcgatccgtt catccgcgat 1260
tcgaagaagc tgccgtcgct cgccaccgac gaggcgatcc tctccgcgga ttccgaggat 1320
atgtaa 1326
<210> 28
<211> 441
<212> PRT
<213> Bifidobacterium lactis
<400> 28
Met Ala Thr Thr Thr Lys Val Trp Arg Asn Pro Ser Tyr Leu Gln Ser
1 5 10 15
Ser Thr Gly Ile Phe Leu Phe Phe Cys Ser Trp Gly Ile Trp Trp Ser
20 25 30
Phe Phe Gln Arg Trp Leu Asn Ser Met Gly Leu Asn Gly Ala Lys Val
35 40 45
Gly Thr Ile Tyr Ser Ile Asn Ser Leu Ala Thr Leu Ile Leu Met Phe
50 55 60
Gly Tyr Gly Leu Ile Gln Asp Asn Leu Gly Leu Lys Arg Arg Leu Val
65 70 75 80
Leu Val Ile Ser Ala Ile Ala Ala Leu Val Gly Pro Phe Val Gln Phe
85 90 95
Val Tyr Ala Pro Leu Met Arg Thr Asn Met Met Ala Ala Ala Leu Val
100 105 110
Gly Ser Val Val Leu Ser Ala Gly Phe Met Ala Gly Cys Ser Leu Ile
115 120 125
Glu Pro Val Thr Glu Arg Tyr Ser Arg Arg Phe Asn Leu Glu Tyr Gly
130 135 140
Gln Ser Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Val Ala Leu Val
145 150 155 160
Ala Gly Phe Val Phe Asn Ile Asn Pro Met Ile Asn Phe Trp Leu Gly
165 170 175
Ser Ala Phe Gly Val Gly Met Leu Ile Val Tyr Leu Thr Trp Tyr Pro
180 185 190
Ala Glu Gln Arg Glu Ala Leu Lys Glu Ala Ala Asp Pro Asn Ala Ala
195 200 205
Pro Thr Asn Pro Thr Ile Lys Asp Met Leu Gly Val Leu Lys Met Pro
210 215 220
Thr Leu Trp Val Leu Ile Val Phe Met Leu Leu Thr Asn Thr Phe Tyr
225 230 235 240
Thr Val Phe Asp Gln Gln Met Phe Pro Thr Tyr Tyr Ala Ser Leu Phe
245 250 255
Pro Asn Glu Ala Thr Gly Asn Ala Val Tyr Gly Thr Leu Asn Ser Val
260 265 270
Gln Val Phe Cys Glu Ser Ala Met Met Gly Val Val Pro Ile Ile Met
275 280 285
Arg Lys Val Gly Val Arg Asn Ala Leu Leu Leu Gly Ser Thr Val Met
290 295 300
Phe Leu Arg Ile Gly Leu Cys Gly Ile Phe His Asp Pro Val Ser Ile
305 310 315 320
Ser Ile Val Lys Met Phe His Ala Ile Glu Val Pro Leu Phe Cys Leu
325 330 335
Pro Ala Phe Arg Tyr Phe Thr Leu His Phe Asn Pro Lys Leu Ser Ala
340 345 350
Thr Leu Tyr Met Val Gly Phe Gln Ile Ala Ser Gln Ile Gly Gln Val
355 360 365
Val Phe Ser Thr Pro Leu Gly Met Leu His Asp Arg Met Gly Asp Arg
370 375 380
Thr Thr Phe Leu Thr Ile Ser Ala Ile Val Leu Ala Ala Thr Val Tyr
385 390 395 400
Gly Phe Phe Val Ile Lys Arg Asp Asp Glu Gln Val Asp Gly Asp Pro
405 410 415
Phe Ile Arg Asp Ser Lys Lys Leu Pro Ser Leu Ala Thr Asp Glu Ala
420 425 430
Ile Leu Ser Ala Asp Ser Glu Asp Met
435 440
<210> 29
<211> 858
<212> DNA
<213> Streptococcus pneumoniae
<400> 29
ttattgatga ctgtccccgg tttagtttta acctttatct ttaaatacat ccctatgtat 60
ggggttttaa tcgcatttaa agattacaat cctttaaaag gaattttagg gagtgattgg 120
attggttttt ctgagtttac aaaattcata tcctctccca actttggtat cttgttagcc 180
aacacattaa aattaagtat ctatggttta ttgcttggct ttttaccacc aatcattctc 240
gcgattatgc tcaatcaact cttgagtgaa aaagtcaaaa aacgaattca gctcatttta 300
tacgcaccaa actttatctc agtcgttgtt attgtcggta tgattttcct cttcttttca 360
gtgggaggac caatcaacaa ttttctttct atgtttggaa tgaaggctga cttcttgaca 420
aatccagact tctttagacc tttatacatc tttagtggta tctggcaagg aatgggctgg 480
gcttcaacgc tctacacggc aacattggta aatgtagatc cagccttagt agaagcagcc 540
cgactggatg gagccaatat cttccaacga atctggcaca ttgatattcc agctcttaag 600
cctattatgg ttatccaatt tgttttagct gcaggtggaa ttatgaatgt cggatatgaa 660
aaagcattct tgatgcagac atcgttaaat ttgccaactt ctgaaattat ctcgacatat 720
gtctataaag ttggtcttgt atcaggagac tattcttact caacagcggt tggtttgttt 780
aatgcagtga ttaacgtagt attgcttgtt gcagttaacc aaatcgttaa acgcatgaat 840
aatggtgaag gaatttaa 858
<210> 30
<211> 305
<212> PRT
<213> Streptococcus pneumoniae
<400> 30
Met Asn Ser Lys Ala Lys Gln Val Ser Leu Trp Glu Arg Ile Lys Lys
1 5 10 15
Gln Lys Leu Leu Leu Leu Met Thr Val Pro Gly Leu Val Leu Thr Phe
20 25 30
Ile Phe Lys Tyr Ile Pro Met Tyr Gly Val Leu Ile Ala Phe Lys Asp
35 40 45
Tyr Asn Pro Leu Lys Gly Ile Leu Gly Ser Asp Trp Ile Gly Phe Ser
50 55 60
Glu Phe Thr Lys Phe Ile Ser Ser Pro Asn Phe Gly Ile Leu Leu Ala
65 70 75 80
Asn Thr Leu Lys Leu Ser Ile Tyr Gly Leu Leu Leu Gly Phe Leu Pro
85 90 95
Pro Ile Ile Leu Ala Ile Met Leu Asn Gln Leu Leu Ser Glu Lys Val
100 105 110
Lys Lys Arg Ile Gln Leu Ile Leu Tyr Ala Pro Asn Phe Ile Ser Val
115 120 125
Val Val Ile Val Gly Met Ile Phe Leu Phe Phe Ser Val Gly Gly Pro
130 135 140
Ile Asn Asn Phe Leu Ser Met Phe Gly Met Lys Ala Asp Phe Leu Thr
145 150 155 160
Asn Pro Asp Phe Phe Arg Pro Leu Tyr Ile Phe Ser Gly Ile Trp Gln
165 170 175
Gly Met Gly Trp Ala Ser Thr Leu Tyr Thr Ala Thr Leu Val Asn Val
180 185 190
Asp Pro Ala Leu Val Glu Ala Ala Arg Leu Asp Gly Ala Asn Ile Phe
195 200 205
Gln Arg Ile Trp His Ile Asp Ile Pro Ala Leu Lys Pro Ile Met Val
210 215 220
Ile Gln Phe Val Leu Ala Ala Gly Gly Ile Met Asn Val Gly Tyr Glu
225 230 235 240
Lys Ala Phe Leu Met Gln Thr Ser Leu Asn Leu Pro Thr Ser Glu Ile
245 250 255
Ile Ser Thr Tyr Val Tyr Lys Val Gly Leu Val Ser Gly Asp Tyr Ser
260 265 270
Tyr Ser Thr Ala Val Gly Leu Phe Asn Ala Val Ile Asn Val Val Leu
275 280 285
Leu Val Ala Val Asn Gln Ile Val Lys Arg Met Asn Asn Gly Glu Gly
290 295 300
Ile
305
<210> 31
<211> 918
<212> DNA
<213> Streptococcus pneumoniae
<400> 31
atggtgaagg aatttaagga ggaaagtatg aaaaattcga ttatggatac aaaatttgat 60
agacgtatct tactcttaaa taaaatcatt attgtcttta tcgttttgat gactttgctt 120
cctttacttt atatcgtcgt agcatccttt atggatccta aggttctggt tagtagaggg 180
attagcttta atccagccga ttggactgta gaaggttacc agcgtgtatt cagtgaccaa 240
tctattctaa gaggttttat caattctcta ctatactctt ttggatttgc agctttaaca 300
gtcttgctat ctgtgtttac agcttatcct ctttctaaga aagacttggt tggacgtcgt 360
tggattaact acttcttgat tgtaactatg ttctttggtg gtggtttagt cccaacttac 420
ttgctcgtaa aagaattggg aatgctcaat actccatggg ctatcattgt tccaggtgct 480
gttaacgttt ggaatattat tcttgctagg gcctatttcc aaggattgcc tgaagaatta 540
gttgaagctg ctgtcattga tggtgcaaat gatttacaga ttttcttcaa aatcatgctt 600
cctcttgcaa aaccaattat gtttgttctc ttcctttatg cttttgtagg acagtggaac 660
tcatactttg atgcaatgat ttatatcaag gatccaaact tggaaccatt gcaacttgta 720
cttcgtaaaa ttctcattca gagccaacca ggtcaagaca tgattggagc acaagcggct 780
atgaatgaaa tgaaacgttt agctgaattg attaaatacg caactattgt catttccagc 840
ttgccattga ttgttatgta tccattcttc caaaaatact ttgataaagg aattatggct 900
ggttcactta aaggataa 918
<210> 32
<211> 305
<212> PRT
<213> Streptococcus pneumoniae
<400> 32
Met Val Lys Glu Phe Lys Glu Glu Ser Met Lys Asn Ser Ile Met Asp
1 5 10 15
Thr Lys Phe Asp Arg Arg Ile Leu Leu Leu Asn Lys Ile Ile Ile Val
20 25 30
Phe Ile Val Leu Met Thr Leu Leu Pro Leu Leu Tyr Ile Val Val Ala
35 40 45
Ser Phe Met Asp Pro Lys Val Leu Val Ser Arg Gly Ile Ser Phe Asn
50 55 60
Pro Ala Asp Trp Thr Val Glu Gly Tyr Gln Arg Val Phe Ser Asp Gln
65 70 75 80
Ser Ile Leu Arg Gly Phe Ile Asn Ser Leu Leu Tyr Ser Phe Gly Phe
85 90 95
Ala Ala Leu Thr Val Leu Leu Ser Val Phe Thr Ala Tyr Pro Leu Ser
100 105 110
Lys Lys Asp Leu Val Gly Arg Arg Trp Ile Asn Tyr Phe Leu Ile Val
115 120 125
Thr Met Phe Phe Gly Gly Gly Leu Val Pro Thr Tyr Leu Leu Val Lys
130 135 140
Glu Leu Gly Met Leu Asn Thr Pro Trp Ala Ile Ile Val Pro Gly Ala
145 150 155 160
Val Asn Val Trp Asn Ile Ile Leu Ala Arg Ala Tyr Phe Gln Gly Leu
165 170 175
Pro Glu Glu Leu Val Glu Ala Ala Val Ile Asp Gly Ala Asn Asp Leu
180 185 190
Gln Ile Phe Phe Lys Ile Met Leu Pro Leu Ala Lys Pro Ile Met Phe
195 200 205
Val Leu Phe Leu Tyr Ala Phe Val Gly Gln Trp Asn Ser Tyr Phe Asp
210 215 220
Ala Met Ile Tyr Ile Lys Asp Pro Asn Leu Glu Pro Leu Gln Leu Val
225 230 235 240
Leu Arg Lys Ile Leu Ile Gln Ser Gln Pro Gly Gln Asp Met Ile Gly
245 250 255
Ala Gln Ala Ala Met Asn Glu Met Lys Arg Leu Ala Glu Leu Ile Lys
260 265 270
Tyr Ala Thr Ile Val Ile Ser Ser Leu Pro Leu Ile Val Met Tyr Pro
275 280 285
Phe Phe Gln Lys Tyr Phe Asp Lys Gly Ile Met Ala Gly Ser Leu Lys
290 295 300
Gly
305
<210> 33
<211> 1617
<212> DNA
<213> Streptococcus pneumoniae
<400> 33
atgaaattca aaacattctc aaaatcagca gttttgttga cagctagttt agcagtactt 60
gcagcctgtg gctcaaaaaa tacagcttca agtccagatt ataagttgga aggtgtaaca 120
ttcccgcttc aagaaaagaa aacattgaag tttatgacag ccagttcacc gttatctcct 180
aaagacccaa atgaaaagtt aattttgcaa cgtttggaga aggaaactgg cgttcatatt 240
gactggacca actaccaatc cgactttgca gaaaaacgta acttggatat ttctagtggt 300
gatttaccag atgctatcca caacgacgga gcttcagatg tggacttgat gaactgggct 360
aaaaaaggtg ttattattcc agttgaagat ttgattgata aatacatgcc aaatcttaag 420
aaaattttgg atgagaaacc agagtacaag gccttgatga cagcacctga tgggcacatt 480
tactcatttc catggattga agagcttgga gatggtaaag agtctattca cagtgtcaac 540
gatatggctt ggattaacaa agattggctt aagaaacttg gtcttgaaat gccaaaaact 600
actgatgatt tgattaaagt cctagaagct ttcaaaaacg gggatccaaa tggaaatgga 660
gaggctgatg aaattccatt ttcatttatt agtggtaacg gaaacgaaga ttttaaattc 720
ctatttgctg catttggtat aggggataac gatgatcatt tagtagtagg aaatgatggc 780
aaagttgact tcacagcaga taacgataac tataaagaag gtgtcaaatt tatccgtcaa 840
ttgcaagaaa aaggcctgat tgataaagaa gctttcgaac atgattggaa tagttacatt 900
gctaaaggtc atgatcagaa atttggtgtt tactttacat gggataagaa taatgttact 960
ggaagtaacg aaagttatga tgttttacca gtacttgctg gaccaagtgg tcaaaaacac 1020
gtagctcgta caaacggtat gggatttgca cgtgacaaga tggttattac cagtgtaaac 1080
aaaaacctag aattgacagc taaatggatt gatgcacaat acgctccact ccaatctgtg 1140
caaaataact ggggaactta cggagatgac aaacaacaaa acatctttga attggatcaa 1200
gcgtcaaata gtctaaaaca cttaccacta aacggaactg caccagcaga acttcgtcaa 1260
aagactgaag taggaggacc actagctatc ctagattcat actatggtaa agtaacaacc 1320
atgcctgatg atgccaaatg gcgtttggat cttatcaaag aatattatgt tccttacatg 1380
agcaatgtca ataactatcc aagagtcttt atgacacagg aagatttgga caagattgcc 1440
catatcgaag cagatatgaa tgactatatc taccgtaaac gtgctgaatg gattgtaaat 1500
ggcaatattg atactgagtg ggatgattac aagaaagaac ttgaaaaata cggactttct 1560
gattacctcg ctattaaaca aaaatactac gaccaatacc aagcaaacaa aaactag 1617
<210> 34
<211> 538
<212> PRT
<213> Streptococcus pneumoniae
<400> 34
Met Lys Phe Lys Thr Phe Ser Lys Ser Ala Val Leu Leu Thr Ala Ser
1 5 10 15
Leu Ala Val Leu Ala Ala Cys Gly Ser Lys Asn Thr Ala Ser Ser Pro
20 25 30
Asp Tyr Lys Leu Glu Gly Val Thr Phe Pro Leu Gln Glu Lys Lys Thr
35 40 45
Leu Lys Phe Met Thr Ala Ser Ser Pro Leu Ser Pro Lys Asp Pro Asn
50 55 60
Glu Lys Leu Ile Leu Gln Arg Leu Glu Lys Glu Thr Gly Val His Ile
65 70 75 80
Asp Trp Thr Asn Tyr Gln Ser Asp Phe Ala Glu Lys Arg Asn Leu Asp
85 90 95
Ile Ser Ser Gly Asp Leu Pro Asp Ala Ile His Asn Asp Gly Ala Ser
100 105 110
Asp Val Asp Leu Met Asn Trp Ala Lys Lys Gly Val Ile Ile Pro Val
115 120 125
Glu Asp Leu Ile Asp Lys Tyr Met Pro Asn Leu Lys Lys Ile Leu Asp
130 135 140
Glu Lys Pro Glu Tyr Lys Ala Leu Met Thr Ala Pro Asp Gly His Ile
145 150 155 160
Tyr Ser Phe Pro Trp Ile Glu Glu Leu Gly Asp Gly Lys Glu Ser Ile
165 170 175
His Ser Val Asn Asp Met Ala Trp Ile Asn Lys Asp Trp Leu Lys Lys
180 185 190
Leu Gly Leu Glu Met Pro Lys Thr Thr Asp Asp Leu Ile Lys Val Leu
195 200 205
Glu Ala Phe Lys Asn Gly Asp Pro Asn Gly Asn Gly Glu Ala Asp Glu
210 215 220
Ile Pro Phe Ser Phe Ile Ser Gly Asn Gly Asn Glu Asp Phe Lys Phe
225 230 235 240
Leu Phe Ala Ala Phe Gly Ile Gly Asp Asn Asp Asp His Leu Val Val
245 250 255
Gly Asn Asp Gly Lys Val Asp Phe Thr Ala Asp Asn Asp Asn Tyr Lys
260 265 270
Glu Gly Val Lys Phe Ile Arg Gln Leu Gln Glu Lys Gly Leu Ile Asp
275 280 285
Lys Glu Ala Phe Glu His Asp Trp Asn Ser Tyr Ile Ala Lys Gly His
290 295 300
Asp Gln Lys Phe Gly Val Tyr Phe Thr Trp Asp Lys Asn Asn Val Thr
305 310 315 320
Gly Ser Asn Glu Ser Tyr Asp Val Leu Pro Val Leu Ala Gly Pro Ser
325 330 335
Gly Gln Lys His Val Ala Arg Thr Asn Gly Met Gly Phe Ala Arg Asp
340 345 350
Lys Met Val Ile Thr Ser Val Asn Lys Asn Leu Glu Leu Thr Ala Lys
355 360 365
Trp Ile Asp Ala Gln Tyr Ala Pro Leu Gln Ser Val Gln Asn Asn Trp
370 375 380
Gly Thr Tyr Gly Asp Asp Lys Gln Gln Asn Ile Phe Glu Leu Asp Gln
385 390 395 400
Ala Ser Asn Ser Leu Lys His Leu Pro Leu Asn Gly Thr Ala Pro Ala
405 410 415
Glu Leu Arg Gln Lys Thr Glu Val Gly Gly Pro Leu Ala Ile Leu Asp
420 425 430
Ser Tyr Tyr Gly Lys Val Thr Thr Met Pro Asp Asp Ala Lys Trp Arg
435 440 445
Leu Asp Leu Ile Lys Glu Tyr Tyr Val Pro Tyr Met Ser Asn Val Asn
450 455 460
Asn Tyr Pro Arg Val Phe Met Thr Gln Glu Asp Leu Asp Lys Ile Ala
465 470 475 480
His Ile Glu Ala Asp Met Asn Asp Tyr Ile Tyr Arg Lys Arg Ala Glu
485 490 495
Trp Ile Val Asn Gly Asn Ile Asp Thr Glu Trp Asp Asp Tyr Lys Lys
500 505 510
Glu Leu Glu Lys Tyr Gly Leu Ser Asp Tyr Leu Ala Ile Lys Gln Lys
515 520 525
Tyr Tyr Asp Gln Tyr Gln Ala Asn Lys Asn
530 535
<210> 35
<211> 1248
<212> DNA
<213> Streptococcus mutans
<400> 35
atgaaaacat ggcaaaaaat cgtcgttggc ggtgcaggcc ttatgcttgc aagcagtatt 60
cttgttgcct gtggatcaaa ggattcaaaa tcaagttcat ctgatcccaa aaccattaaa 120
ctttgggttc caacaggagc caagaaatct tatcaaagta ttgttcacaa atttgaaaag 180
gattctaact ataaagtaaa gattattgaa tctgaagacc caaaagctca ggaaaagatc 240
aaaaaagatc ctagtactgc tgcagatgtt ttctcgctgc cgcatgatca gctgggccag 300
ttagttgact ctggtgttat ccaagagatt cctcaaaaat attcaaaaga aataaataaa 360
aatgaaacac agcaggctgc aacaggagct atgtacaaag gtaagactta tgcttttcct 420
tttggaatcg agtctcaagt actttactat aataaatcaa aactctcagc tgatgatgtc 480
acatcatatg agactattac cagcaaggca actttcggag caaaattcaa acaagttaat 540
gcctatgcga ctgcaccact tttctattca gtaggtgata cactctttgg taaaaatggc 600
gaagatgcca aaggaactaa ctggggaaat gatgctggtg tatctgtttt gaaatggatt 660
gccagtcaaa aaggtaacgc tggctttgtc aatcttgacg ataacaatgt catgtctaaa 720
tttggtgatg gttctgtagc ttcttttgaa tcaggtcctt gggattatga agccgcacaa 780
aaggcagttg gcaaaaacaa cctcggtgtt acggtttatc caacaataaa tattaatggt 840
caagaagttc aacagaaagc tttcttaggt gttaaactct acgctgttaa tcaagctcct 900
tctaaaggaa ataccaaacg tattgctgct agttataaat tagcttctta cttaacaagt 960
gctgaaagcc aagaaaatca atttaagaca aaaggacgca acatcatccc atctaataag 1020
accgttcaaa actctgatac agtcaaaaat catgaactcg cacaggctgt tatccaaatg 1080
ggatcttctt cagattatac tgttgttatg cctaaactca accaaatgtc aacattctgg 1140
acggaaagcg cagctattct tagtgatact tacaatggta aaattaaaga aagtgattac 1200
cttgctaaat taaaacaatt tgataaagat ttagcagctg ctaaataa 1248
<210> 36
<211> 415
<212> PRT
<213> Streptococcus mutans
<400> 36
Met Lys Thr Trp Gln Lys Ile Val Val Gly Gly Ala Gly Leu Met Leu
1 5 10 15
Ala Ser Ser Ile Leu Val Ala Cys Gly Ser Lys Asp Ser Lys Ser Ser
20 25 30
Ser Ser Asp Pro Lys Thr Ile Lys Leu Trp Val Pro Thr Gly Ala Lys
35 40 45
Lys Ser Tyr Gln Ser Ile Val His Lys Phe Glu Lys Asp Ser Asn Tyr
50 55 60
Lys Val Lys Ile Ile Glu Ser Glu Asp Pro Lys Ala Gln Glu Lys Ile
65 70 75 80
Lys Lys Asp Pro Ser Thr Ala Ala Asp Val Phe Ser Leu Pro His Asp
85 90 95
Gln Leu Gly Gln Leu Val Asp Ser Gly Val Ile Gln Glu Ile Pro Gln
100 105 110
Lys Tyr Ser Lys Glu Ile Asn Lys Asn Glu Thr Gln Gln Ala Ala Thr
115 120 125
Gly Ala Met Tyr Lys Gly Lys Thr Tyr Ala Phe Pro Phe Gly Ile Glu
130 135 140
Ser Gln Val Leu Tyr Tyr Asn Lys Ser Lys Leu Ser Ala Asp Asp Val
145 150 155 160
Thr Ser Tyr Glu Thr Ile Thr Ser Lys Ala Thr Phe Gly Ala Lys Phe
165 170 175
Lys Gln Val Asn Ala Tyr Ala Thr Ala Pro Leu Phe Tyr Ser Val Gly
180 185 190
Asp Thr Leu Phe Gly Lys Asn Gly Glu Asp Ala Lys Gly Thr Asn Trp
195 200 205
Gly Asn Asp Ala Gly Val Ser Val Leu Lys Trp Ile Ala Ser Gln Lys
210 215 220
Gly Asn Ala Gly Phe Val Asn Leu Asp Asp Asn Asn Val Met Ser Lys
225 230 235 240
Phe Gly Asp Gly Ser Val Ala Ser Phe Glu Ser Gly Pro Trp Asp Tyr
245 250 255
Glu Ala Ala Gln Lys Ala Val Gly Lys Asn Asn Leu Gly Val Thr Val
260 265 270
Tyr Pro Thr Ile Asn Ile Asn Gly Gln Glu Val Gln Gln Lys Ala Phe
275 280 285
Leu Gly Val Lys Leu Tyr Ala Val Asn Gln Ala Pro Ser Lys Gly Asn
290 295 300
Thr Lys Arg Ile Ala Ala Ser Tyr Lys Leu Ala Ser Tyr Leu Thr Ser
305 310 315 320
Ala Glu Ser Gln Glu Asn Gln Phe Lys Thr Lys Gly Arg Asn Ile Ile
325 330 335
Pro Ser Asn Lys Thr Val Gln Asn Ser Asp Thr Val Lys Asn His Glu
340 345 350
Leu Ala Gln Ala Val Ile Gln Met Gly Ser Ser Ser Asp Tyr Thr Val
355 360 365
Val Met Pro Lys Leu Asn Gln Met Ser Thr Phe Trp Thr Glu Ser Ala
370 375 380
Ala Ile Leu Ser Asp Thr Tyr Asn Gly Lys Ile Lys Glu Ser Asp Tyr
385 390 395 400
Leu Ala Lys Leu Lys Gln Phe Asp Lys Asp Leu Ala Ala Ala Lys
405 410 415
<210> 37
<211> 1362
<212> DNA
<213> Streptococcus mutans
<400> 37
atgattcagt catcttctca tgatcagtta tctgtacttg aaacttttaa aaagggcggg 60
atagatatca aattatcgtt tgtcatcatg ggatttgcca atttgatgaa taagcaattc 120
ataaaaggcc tcctctttct attaagtgag atagcttttc taattgcttt tgtcacacag 180
gttattccag ctttttcagg cttactcact ctcggtacta aaacacaagg gatgcaagaa 240
aaaattgtgg atggcgttaa attacaggtg gcagttgaag gcgataattc gatgctgatg 300
ctcatttttg gattagcctc actaatcttt tgtttggttt ttgcctacat ttattggtgt 360
aatcttaaaa gtgccagaaa tctctatatg ttaaaaaaag agggacgtca cattccatct 420
ttcaaagaag attttatgac tttggcaaac ggccgattcc atatgacttt gatgtttatt 480
cctttgattg gtgttcttct ttttaccatt ttgccactcg tttatatgat ttgcctggcc 540
tttaccaatt atgatcacaa tcatcttccg cctaaatccc tttttgattg ggtagggttg 600
gctaattttg gtaatgtttt gaatggccgc atggctggaa ccttcttccc tgtcctttct 660
tggacactta tctgggctgt tttcgcaact gtgacaaact ttctttttgg agtcatcttg 720
gcacttatta tcaatgctaa gggattaaaa ttgaaaaaaa tgtggcggac tatctttgtt 780
attaccattg ctgtgccgca gttcatttca cttttgctga tgagaaattt ccttaatgat 840
caaggtccgc tcaatgcttt cctagaaaaa attggcctga tttctcattc tctgccattt 900
ctatcagatc ctacttgggc aaaattttca attatcttcg ttaatatgtg ggttggtatt 960
ccttttacca tgttagtcgc aacaggaatt atcatgaatc ttccgagtga gcaaattgag 1020
gctgcagaaa ttgacggcgc tagtaagttc caaattttta aatccatcac tttcccgcag 1080
attcttttaa ttatgatgcc atctttaatc cagcaattta ttggaaatat caataatttt 1140
aatgtcatct accttttaac cggtggcgga ccaactaatt cacaattcta tcaagcaggc 1200
agcacagact tattggtcac ttggctttat aaactaacaa tgaatgctgc agactataat 1260
ttagcttctg ttattggtat ctttatcttt gccatttcag ctatcttcag tcttttagct 1320
tatacgcata cagcatcata caaggaagga gctgttaaat aa 1362
<210> 38
<211> 453
<212> PRT
<213> Streptococcus mutans
<400> 38
Met Ile Gln Ser Ser Ser His Asp Gln Leu Ser Val Leu Glu Thr Phe
1 5 10 15
Lys Lys Gly Gly Ile Asp Ile Lys Leu Ser Phe Val Ile Met Gly Phe
20 25 30
Ala Asn Leu Met Asn Lys Gln Phe Ile Lys Gly Leu Leu Phe Leu Leu
35 40 45
Ser Glu Ile Ala Phe Leu Ile Ala Phe Val Thr Gln Val Ile Pro Ala
50 55 60
Phe Ser Gly Leu Leu Thr Leu Gly Thr Lys Thr Gln Gly Met Gln Glu
65 70 75 80
Lys Ile Val Asp Gly Val Lys Leu Gln Val Ala Val Glu Gly Asp Asn
85 90 95
Ser Met Leu Met Leu Ile Phe Gly Leu Ala Ser Leu Ile Phe Cys Leu
100 105 110
Val Phe Ala Tyr Ile Tyr Trp Cys Asn Leu Lys Ser Ala Arg Asn Leu
115 120 125
Tyr Met Leu Lys Lys Glu Gly Arg His Ile Pro Ser Phe Lys Glu Asp
130 135 140
Phe Met Thr Leu Ala Asn Gly Arg Phe His Met Thr Leu Met Phe Ile
145 150 155 160
Pro Leu Ile Gly Val Leu Leu Phe Thr Ile Leu Pro Leu Val Tyr Met
165 170 175
Ile Cys Leu Ala Phe Thr Asn Tyr Asp His Asn His Leu Pro Pro Lys
180 185 190
Ser Leu Phe Asp Trp Val Gly Leu Ala Asn Phe Gly Asn Val Leu Asn
195 200 205
Gly Arg Met Ala Gly Thr Phe Phe Pro Val Leu Ser Trp Thr Leu Ile
210 215 220
Trp Ala Val Phe Ala Thr Val Thr Asn Phe Leu Phe Gly Val Ile Leu
225 230 235 240
Ala Leu Ile Ile Asn Ala Lys Gly Leu Lys Leu Lys Lys Met Trp Arg
245 250 255
Thr Ile Phe Val Ile Thr Ile Ala Val Pro Gln Phe Ile Ser Leu Leu
260 265 270
Leu Met Arg Asn Phe Leu Asn Asp Gln Gly Pro Leu Asn Ala Phe Leu
275 280 285
Glu Lys Ile Gly Leu Ile Ser His Ser Leu Pro Phe Leu Ser Asp Pro
290 295 300
Thr Trp Ala Lys Phe Ser Ile Ile Phe Val Asn Met Trp Val Gly Ile
305 310 315 320
Pro Phe Thr Met Leu Val Ala Thr Gly Ile Ile Met Asn Leu Pro Ser
325 330 335
Glu Gln Ile Glu Ala Ala Glu Ile Asp Gly Ala Ser Lys Phe Gln Ile
340 345 350
Phe Lys Ser Ile Thr Phe Pro Gln Ile Leu Leu Ile Met Met Pro Ser
355 360 365
Leu Ile Gln Gln Phe Ile Gly Asn Ile Asn Asn Phe Asn Val Ile Tyr
370 375 380
Leu Leu Thr Gly Gly Gly Pro Thr Asn Ser Gln Phe Tyr Gln Ala Gly
385 390 395 400
Ser Thr Asp Leu Leu Val Thr Trp Leu Tyr Lys Leu Thr Met Asn Ala
405 410 415
Ala Asp Tyr Asn Leu Ala Ser Val Ile Gly Ile Phe Ile Phe Ala Ile
420 425 430
Ser Ala Ile Phe Ser Leu Leu Ala Tyr Thr His Thr Ala Ser Tyr Lys
435 440 445
Glu Gly Ala Val Lys
450
<210> 39
<211> 837
<212> DNA
<213> Streptococcus mutans
<400> 39
atgaaaagaa aaaaacaact tcagatcggc tctatctatg ctttactgat tctcttatcc 60
ttcatttggc tatttccgat catttgggtt atactgacga gttttcgcgg tgaaggcaca 120
gcttatgttc cttatattat tccaaaaacg tggactttag ataattatat taaattattt 180
accaattctt ctttcccatt tggacgctgg tttttaaata ccttaatcgt ttcaacagcc 240
acttgtgttc tgtcaacttc tatcacagtg gcaatggctt attcgcttag ccgtattaaa 300
tttaaacacc gtaacggctt tttaaaatta gctcttgttc tgaatatgtt tccgggattt 360
atgagtatga ttgcagttta ctacattcta aaagcactca atctcaccca aacattaaca 420
tctcttgttt tggtctattc ttcaggagct gccttaactt tctatatcgc taaaggcttt 480
tttgatacga ttccttattc attggatgaa tcagctatga ttgatggggc tacgcgtaaa 540
gatattttct taaaaatcac tctgccgcta tctaagccca tcatcgttta tacggccctg 600
ttggcattta ttgccccttg gattgacttt atttttgctc aggttattct tggagatgcc 660
accagcaaat ataccgtagc gattggactc ttctctatgc ttcaagctga taccattaat 720
aattggttca tggcctttgc agcaggttct gtactgatcg ccattccaat cacgatactt 780
tttatcttca tgcaaaagta ttacgttgaa ggcattactg gcggatctgt taaataa 837
<210> 40
<211> 278
<212> PRT
<213> Streptococcus mutans
<400> 40
Met Lys Arg Lys Lys Gln Leu Gln Ile Gly Ser Ile Tyr Ala Leu Leu
1 5 10 15
Ile Leu Leu Ser Phe Ile Trp Leu Phe Pro Ile Ile Trp Val Ile Leu
20 25 30
Thr Ser Phe Arg Gly Glu Gly Thr Ala Tyr Val Pro Tyr Ile Ile Pro
35 40 45
Lys Thr Trp Thr Leu Asp Asn Tyr Ile Lys Leu Phe Thr Asn Ser Ser
50 55 60
Phe Pro Phe Gly Arg Trp Phe Leu Asn Thr Leu Ile Val Ser Thr Ala
65 70 75 80
Thr Cys Val Leu Ser Thr Ser Ile Thr Val Ala Met Ala Tyr Ser Leu
85 90 95
Ser Arg Ile Lys Phe Lys His Arg Asn Gly Phe Leu Lys Leu Ala Leu
100 105 110
Val Leu Asn Met Phe Pro Gly Phe Met Ser Met Ile Ala Val Tyr Tyr
115 120 125
Ile Leu Lys Ala Leu Asn Leu Thr Gln Thr Leu Thr Ser Leu Val Leu
130 135 140
Val Tyr Ser Ser Gly Ala Ala Leu Thr Phe Tyr Ile Ala Lys Gly Phe
145 150 155 160
Phe Asp Thr Ile Pro Tyr Ser Leu Asp Glu Ser Ala Met Ile Asp Gly
165 170 175
Ala Thr Arg Lys Asp Ile Phe Leu Lys Ile Thr Leu Pro Leu Ser Lys
180 185 190
Pro Ile Ile Val Tyr Thr Ala Leu Leu Ala Phe Ile Ala Pro Trp Ile
195 200 205
Asp Phe Ile Phe Ala Gln Val Ile Leu Gly Asp Ala Thr Ser Lys Tyr
210 215 220
Thr Val Ala Ile Gly Leu Phe Ser Met Leu Gln Ala Asp Thr Ile Asn
225 230 235 240
Asn Trp Phe Met Ala Phe Ala Ala Gly Ser Val Leu Ile Ala Ile Pro
245 250 255
Ile Thr Ile Leu Phe Ile Phe Met Gln Lys Tyr Tyr Val Glu Gly Ile
260 265 270
Thr Gly Gly Ser Val Lys
275
<210> 41
<211> 1134
<212> DNA
<213> Streptococcus mutans
<400> 41
atgacaactt taaaacttga taacatctac aaaagatatc ccaatgcaaa gcattattcc 60
gttgaaaatt ttaatcttga cattcatgat aaagaattta ttgtctttgt cggtccttca 120
ggatgcggaa agtcaaccac tcttcgcatg attgctgggc tggaagatat tacagaaggc 180
aacctttata ttgatgataa actcatgaat gatgcctctc ctaaagatcg cgatattgct 240
atggtttttc aaaattatgc tctttatcct catatgagcg tttatgaaaa tatggctttt 300
ggcctaaaac ttcgtaaata caaaaaagat gatattaata aacgtgtaca cgaagctgct 360
gaaattcttg gactgacaga atttcttgaa agaaagcctg cggacctctc tggcggacag 420
cggcagcggg ttgctatggg acgtgctatt gtccgagatg ctaaggtctt cttaatggac 480
gaacctttgt caaatttaga tgccaaactt cgagttgcca tgcgagccga aatcgctaaa 540
attcaccgcc gcattggggc aacgactatc tatgttaccc atgaccaaac agaagccatg 600
accttagcag atcgtattgt tatcatgagc gctactccaa acccagataa aaccggctct 660
atcggtcgta ttgagcagat tggaacacca caggaactct acaatgaacc tgctaataaa 720
tttgttgctg gcttcatcgg aagccccgct atgaatttct ttgaagtgac cgttgaaaaa 780
gagcgtttgg ttaaccaaga tggtctaagc cttgcgcttc ctcagggaca ggaaaaaatt 840
cttgaggaga aaggttatct tggtaaaaaa gtcactttag gtattcgacc agaagacatc 900
tcaagtgatc aaattgtcca cgagactttc ccaaatgcca gtgttacagc tgacatacta 960
gtatcagaac ttttaggcag cgaaagcatg ttatatgtca aatttggcag tactgaattt 1020
acagctcgcg tcaatgctcg tgactctcac agtcccggag aaaaagtaca attaaccttt 1080
aatattgcta agggacactt ctttgattta gagactgaaa aacgaatcaa ttaa 1134
<210> 42
<211> 377
<212> PRT
<213> Streptococcus mutans
<400> 42
Met Thr Thr Leu Lys Leu Asp Asn Ile Tyr Lys Arg Tyr Pro Asn Ala
1 5 10 15
Lys His Tyr Ser Val Glu Asn Phe Asn Leu Asp Ile His Asp Lys Glu
20 25 30
Phe Ile Val Phe Val Gly Pro Ser Gly Cys Gly Lys Ser Thr Thr Leu
35 40 45
Arg Met Ile Ala Gly Leu Glu Asp Ile Thr Glu Gly Asn Leu Tyr Ile
50 55 60
Asp Asp Lys Leu Met Asn Asp Ala Ser Pro Lys Asp Arg Asp Ile Ala
65 70 75 80
Met Val Phe Gln Asn Tyr Ala Leu Tyr Pro His Met Ser Val Tyr Glu
85 90 95
Asn Met Ala Phe Gly Leu Lys Leu Arg Lys Tyr Lys Lys Asp Asp Ile
100 105 110
Asn Lys Arg Val His Glu Ala Ala Glu Ile Leu Gly Leu Thr Glu Phe
115 120 125
Leu Glu Arg Lys Pro Ala Asp Leu Ser Gly Gly Gln Arg Gln Arg Val
130 135 140
Ala Met Gly Arg Ala Ile Val Arg Asp Ala Lys Val Phe Leu Met Asp
145 150 155 160
Glu Pro Leu Ser Asn Leu Asp Ala Lys Leu Arg Val Ala Met Arg Ala
165 170 175
Glu Ile Ala Lys Ile His Arg Arg Ile Gly Ala Thr Thr Ile Tyr Val
180 185 190
Thr His Asp Gln Thr Glu Ala Met Thr Leu Ala Asp Arg Ile Val Ile
195 200 205
Met Ser Ala Thr Pro Asn Pro Asp Lys Thr Gly Ser Ile Gly Arg Ile
210 215 220
Glu Gln Ile Gly Thr Pro Gln Glu Leu Tyr Asn Glu Pro Ala Asn Lys
225 230 235 240
Phe Val Ala Gly Phe Ile Gly Ser Pro Ala Met Asn Phe Phe Glu Val
245 250 255
Thr Val Glu Lys Glu Arg Leu Val Asn Gln Asp Gly Leu Ser Leu Ala
260 265 270
Leu Pro Gln Gly Gln Glu Lys Ile Leu Glu Glu Lys Gly Tyr Leu Gly
275 280 285
Lys Lys Val Thr Leu Gly Ile Arg Pro Glu Asp Ile Ser Ser Asp Gln
290 295 300
Ile Val His Glu Thr Phe Pro Asn Ala Ser Val Thr Ala Asp Ile Leu
305 310 315 320
Val Ser Glu Leu Leu Gly Ser Glu Ser Met Leu Tyr Val Lys Phe Gly
325 330 335
Ser Thr Glu Phe Thr Ala Arg Val Asn Ala Arg Asp Ser His Ser Pro
340 345 350
Gly Glu Lys Val Gln Leu Thr Phe Asn Ile Ala Lys Gly His Phe Phe
355 360 365
Asp Leu Glu Thr Glu Lys Arg Ile Asn
370 375
<210> 43
<211> 927
<212> DNA
<213> Agrobacterium tumefaciens
<400> 43
atgatcctgt gttgtggtga agccctgatc gacatgctgc cccggcagac gacgctgggt 60
gaggcgggct ttgcccctta cgcaggcgga gcggtcttca acacggcaat tgcgctgggg 120
cgtcttggcg tcccttcagc cttttttacc ggtctttccg acgacatgat gggcgatatc 180
ctgcgggaga ccctgcgggc cagcaaggtg gatttcagct attgcgccac cctgtcgcgc 240
cccaccacca ttgcgttcgt taagctggtt gatggccatg cgacctacgc tttttacgac 300
gagaacaccg ccggccggat gatcaccgag gccgaacttc cggccttggg agcggattgc 360
gaagcgctgc atttcggcgc catcagcctt attcccgaac cctgcggcag cacctatgag 420
gcgctgatga cgcgcgagca tgagacccgc gtcatctcgc tcgatccgaa cattcgtccc 480
ggcttcatcc agaacaagca gtcgcacatg gcccgcatcc gccgcatggc ggcgatgtct 540
gacatcgtca agttctcgga tgaggacctg gcgtggttcg gtctggaagg cgacgaggac 600
acgcttgccc gccactggct gcaccacggt gcaaaactcg tcgttgtcac ccgtggcgcc 660
aagggtgccg tgggttacag cgccaatctc aaggtggaag tggcctccga gcgcgtcgaa 720
gtggtcgata cggtcggcgc cggcgatacg ttcgatgccg gcattcttgc ttcgctgaaa 780
atgcagggcc tgctgaccaa agcgcaggtg gcttcgctga gcgaagagca gatcagaaaa 840
gctttggcgc ttggcgcgaa agccgctgcg gtcactgtct cgcgggctgg cgcaaatccg 900
cctttcgcgc atgaaatcgg tttgtga 927
<210> 44
<211> 308
<212> PRT
<213> Agrobacterium tumefaciens
<400> 44
Met Ile Leu Cys Cys Gly Glu Ala Leu Ile Asp Met Leu Pro Arg Gln
1 5 10 15
Thr Thr Leu Gly Glu Ala Gly Phe Ala Pro Tyr Ala Gly Gly Ala Val
20 25 30
Phe Asn Thr Ala Ile Ala Leu Gly Arg Leu Gly Val Pro Ser Ala Phe
35 40 45
Phe Thr Gly Leu Ser Asp Asp Met Met Gly Asp Ile Leu Arg Glu Thr
50 55 60
Leu Arg Ala Ser Lys Val Asp Phe Ser Tyr Cys Ala Thr Leu Ser Arg
65 70 75 80
Pro Thr Thr Ile Ala Phe Val Lys Leu Val Asp Gly His Ala Thr Tyr
85 90 95
Ala Phe Tyr Asp Glu Asn Thr Ala Gly Arg Met Ile Thr Glu Ala Glu
100 105 110
Leu Pro Ala Leu Gly Ala Asp Cys Glu Ala Leu His Phe Gly Ala Ile
115 120 125
Ser Leu Ile Pro Glu Pro Cys Gly Ser Thr Tyr Glu Ala Leu Met Thr
130 135 140
Arg Glu His Glu Thr Arg Val Ile Ser Leu Asp Pro Asn Ile Arg Pro
145 150 155 160
Gly Phe Ile Gln Asn Lys Gln Ser His Met Ala Arg Ile Arg Arg Met
165 170 175
Ala Ala Met Ser Asp Ile Val Lys Phe Ser Asp Glu Asp Leu Ala Trp
180 185 190
Phe Gly Leu Glu Gly Asp Glu Asp Thr Leu Ala Arg His Trp Leu His
195 200 205
His Gly Ala Lys Leu Val Val Val Thr Arg Gly Ala Lys Gly Ala Val
210 215 220
Gly Tyr Ser Ala Asn Leu Lys Val Glu Val Ala Ser Glu Arg Val Glu
225 230 235 240
Val Val Asp Thr Val Gly Ala Gly Asp Thr Phe Asp Ala Gly Ile Leu
245 250 255
Ala Ser Leu Lys Met Gln Gly Leu Leu Thr Lys Ala Gln Val Ala Ser
260 265 270
Leu Ser Glu Glu Gln Ile Arg Lys Ala Leu Ala Leu Gly Ala Lys Ala
275 280 285
Ala Ala Val Thr Val Ser Arg Ala Gly Ala Asn Pro Pro Phe Ala His
290 295 300
Glu Ile Gly Leu
305
<210> 45
<211> 1404
<212> DNA
<213> Streptococcus mutans
<400> 45
cagctgatta tgcgtcagtt gaaaccctcg cttcttcagg aactgttgct gtaggtgata 60
gcttacttga agttaaaaaa taagaaatat tatcagaaag accgtaaggt ctttttgact 120
gcttaaaaga ttcagtaaca atagtattaa agccttttgg ctaactaata cttgaaattt 180
agcaaattat gatataatgt taagtagtcc ttaagggtag attaagggta ttcaaatcca 240
aaaattgatt tggtaagtta agtaaaatat aagaggttta ttatgtctaa attatatggc 300
agcatcgaag ctggcggaac aaaatttgtc tgtgctgtag gtgatgaaaa ttttcaaatt 360
ttagaaaaag ttcagttccc aacaacaaca ccttatgaaa caatagaaaa aacagttgct 420
ttctttaaaa aatttgaagc tgatttagcc agtgttgcca ttggttcttt tggccctatt 480
gatattgatc aaaattcaga cacttatggt tacattactt caacaccaaa gccaaactgg 540
gctaacgttg attttgtcgg cttaatttct aaagatttta aaattccatt ttactttacg 600
acagatgtta attcttctgc ttatggggaa acaattgctc gttcaaatgt taaaagtctg 660
gtttattata ctattggaac aggcattgga gcaggggcta ttcaaaatgg cgaattcatt 720
ggcggtatgg gacatacgga agctggacac gtttacatgg ctccgcatcc caatgatgtt 780
catcatggtt ttgtaggcac ctgtcctttc cataaaggct gtttagaagg acttgcagcg 840
ggtcctagct tagaggctcg tactggtatt cgtggtgagt taattgagca aaactcagaa 900
gtttgggata ttcaggcata ctacattgct caggcggcta ttcaagcgac tgtcctttat 960
cgtccgcaag tcattgtatt tggcggaggc gttatggcac aagaacatat gctcaatcgg 1020
gttcgtgaaa aatttacttc acttttgaat gactatcttc cagttccaga tgttaaagat 1080
tatattgtga caccagctgt tgcagaaaat ggttcagcaa cattgggaaa tctcgcttta 1140
gctaaaaaga tagcagcgcg ttaattaaaa atgaattgga agattaaagc accttctaat 1200
attcaatatt aaactgttag aatttacgtg aacgaaattt tcattttatg aggataatga 1260
agtgaatata attactcttg atttcctctg aaactagata gtggtatatt gaaaaacaga 1320
aaggagaaca ctatggaagg acctttgttt ttacaatcac aaatgcataa aaaaatctgg 1380
ggcggcaatc ggctcagaaa agaa 1404
<210> 46
<211> 293
<212> PRT
<213> Streptococcus mutans
<400> 46
Met Ser Lys Leu Tyr Gly Ser Ile Glu Ala Gly Gly Thr Lys Phe Val
1 5 10 15
Cys Ala Val Gly Asp Glu Asn Phe Gln Ile Leu Glu Lys Val Gln Phe
20 25 30
Pro Thr Thr Thr Pro Tyr Glu Thr Ile Glu Lys Thr Val Ala Phe Phe
35 40 45
Lys Lys Phe Glu Ala Asp Leu Ala Ser Val Ala Ile Gly Ser Phe Gly
50 55 60
Pro Ile Asp Ile Asp Gln Asn Ser Asp Thr Tyr Gly Tyr Ile Thr Ser
65 70 75 80
Thr Pro Lys Pro Asn Trp Ala Asn Val Asp Phe Val Gly Leu Ile Ser
85 90 95
Lys Asp Phe Lys Ile Pro Phe Tyr Phe Thr Thr Asp Val Asn Ser Ser
100 105 110
Ala Tyr Gly Glu Thr Ile Ala Arg Ser Asn Val Lys Ser Leu Val Tyr
115 120 125
Tyr Thr Ile Gly Thr Gly Ile Gly Ala Gly Ala Ile Gln Asn Gly Glu
130 135 140
Phe Ile Gly Gly Met Gly His Thr Glu Ala Gly His Val Tyr Met Ala
145 150 155 160
Pro His Pro Asn Asp Val His His Gly Phe Val Gly Thr Cys Pro Phe
165 170 175
His Lys Gly Cys Leu Glu Gly Leu Ala Ala Gly Pro Ser Leu Glu Ala
180 185 190
Arg Thr Gly Ile Arg Gly Glu Leu Ile Glu Gln Asn Ser Glu Val Trp
195 200 205
Asp Ile Gln Ala Tyr Tyr Ile Ala Gln Ala Ala Ile Gln Ala Thr Val
210 215 220
Leu Tyr Arg Pro Gln Val Ile Val Phe Gly Gly Gly Val Met Ala Gln
225 230 235 240
Glu His Met Leu Asn Arg Val Arg Glu Lys Phe Thr Ser Leu Leu Asn
245 250 255
Asp Tyr Leu Pro Val Pro Asp Val Lys Asp Tyr Ile Val Thr Pro Ala
260 265 270
Val Ala Glu Asn Gly Ser Ala Thr Leu Gly Asn Leu Ala Leu Ala Lys
275 280 285
Lys Ile Ala Ala Arg
290
<210> 47
<211> 915
<212> DNA
<213> Escherichia coli
<400> 47
atgtcagcca aagtatgggt tttaggggat gcggtcgtag atctcttgcc agaatcagac 60
gggcgcctac tgccttgtcc tggcggcgcg ccagctaacg ttgcggtggg aatcgccaga 120
ttaggcggaa caagtgggtt tataggtcgg gtgggggatg atccttttgg tgcgttaatg 180
caaagaacgc tgctaactga gggagtcgat atcacgtatc tgaagcaaga tgaatggcac 240
cggacatcca cggtgcttgt cgatctgaac gatcaagggg aacgttcatt tacgtttatg 300
gtccgcccca gtgccgatct ttttttagag acgacagact tgccctgctg gcgacatggc 360
gaatggttac atctctgttc aattgcgttg tctgccgagc cttcgcgtac cagcgcattt 420
actgcgatga cggcgatccg gcatgccgga ggttttgtca gcttcgatcc taatattcgt 480
gaagatctat ggcaagacga gcatttgctc cgcttgtgtt tgcggcaggc gctacaactg 540
gcggatgtcg tcaagctctc ggaagaagaa tggcgactta tcagtggaaa aacacagaac 600
gatcaggata tatgcgccct ggcaaaagag tatgagatcg ccatgctgtt ggtgactaaa 660
ggtgcagaag gggtggtggt ctgttatcga ggacaagttc accattttgc tggaatgtct 720
gtgaattgtg tcgatagcac gggggcggga gatgcgttcg ttgccgggtt actcacaggt 780
ctgtcctcta cgggattatc tacagatgag agagaaatgc gacgaattat cgatctcgct 840
caacgttgcg gagcgcttgc agtaacggcg aaaggggcaa tgacagcgct gccatgtcga 900
caagaactgg aatag 915
<210> 48
<211> 304
<212> PRT
<213> Escherichia coli
<400> 48
Met Ser Ala Lys Val Trp Val Leu Gly Asp Ala Val Val Asp Leu Leu
1 5 10 15
Pro Glu Ser Asp Gly Arg Leu Leu Pro Cys Pro Gly Gly Ala Pro Ala
20 25 30
Asn Val Ala Val Gly Ile Ala Arg Leu Gly Gly Thr Ser Gly Phe Ile
35 40 45
Gly Arg Val Gly Asp Asp Pro Phe Gly Ala Leu Met Gln Arg Thr Leu
50 55 60
Leu Thr Glu Gly Val Asp Ile Thr Tyr Leu Lys Gln Asp Glu Trp His
65 70 75 80
Arg Thr Ser Thr Val Leu Val Asp Leu Asn Asp Gln Gly Glu Arg Ser
85 90 95
Phe Thr Phe Met Val Arg Pro Ser Ala Asp Leu Phe Leu Glu Thr Thr
100 105 110
Asp Leu Pro Cys Trp Arg His Gly Glu Trp Leu His Leu Cys Ser Ile
115 120 125
Ala Leu Ser Ala Glu Pro Ser Arg Thr Ser Ala Phe Thr Ala Met Thr
130 135 140
Ala Ile Arg His Ala Gly Gly Phe Val Ser Phe Asp Pro Asn Ile Arg
145 150 155 160
Glu Asp Leu Trp Gln Asp Glu His Leu Leu Arg Leu Cys Leu Arg Gln
165 170 175
Ala Leu Gln Leu Ala Asp Val Val Lys Leu Ser Glu Glu Glu Trp Arg
180 185 190
Leu Ile Ser Gly Lys Thr Gln Asn Asp Gln Asp Ile Cys Ala Leu Ala
195 200 205
Lys Glu Tyr Glu Ile Ala Met Leu Leu Val Thr Lys Gly Ala Glu Gly
210 215 220
Val Val Val Cys Tyr Arg Gly Gln Val His His Phe Ala Gly Met Ser
225 230 235 240
Val Asn Cys Val Asp Ser Thr Gly Ala Gly Asp Ala Phe Val Ala Gly
245 250 255
Leu Leu Thr Gly Leu Ser Ser Thr Gly Leu Ser Thr Asp Glu Arg Glu
260 265 270
Met Arg Arg Ile Ile Asp Leu Ala Gln Arg Cys Gly Ala Leu Ala Val
275 280 285
Thr Ala Lys Gly Ala Met Thr Ala Leu Pro Cys Arg Gln Glu Leu Glu
290 295 300
<210> 49
<211> 879
<212> DNA
<213> Enterococcus faecalis
<400> 49
atgacagaaa aacttttagg aagtatcgaa gccggtggca caaaatttgt atgtggcgtt 60
gggacagatg atttgaccat cgtagaacgt gtcagttttc ccacaacaac cccagaagaa 120
acaatgaaaa aagtaataga atttttccaa caatatcctt taaaagcgat tgggattggt 180
tcatttggtc cgattgatat tcacgttgat tctcctacgt atggttatat cacttctaca 240
ccaaaattag cttggcgtaa ctttgacttg ttaggaacta tgaaacaaca ttttgatgtg 300
ccaatggctt ggacaacgga tgtgaatgct gcggcatatg gtgagtatgt tgctggaaat 360
gggcaacata catctagttg tgtatattat acaattggaa ctggtgttgg cgctggagcg 420
attcaaaacg gtgagtttat tgaaggcttt agccacccag aaatggggca tgcgttagtt 480
cgtcgtcatc ctgaagatac gtatgcagga aattgtcctt atcatggaga ttgtttagaa 540
gggattgcag caggaccagc agttgaaggt cgttctggta aaaaaggaca tttattggaa 600
gaggatcata aaacttggga attagaagct tattatttag cgcaagcggc gtacaatacg 660
actttattat tagcgccaga agtgatcatt ttaggtggcg gcgtcatgaa acaacgtcat 720
ttgatgccga aagttcgtga aaaatttgct gaattagtca atggatatgt ggaaacaccg 780
cctttagaaa aatacttggt gacgcctctt ttagaagata atccaggaac aatcggttgc 840
tttgccttgg caaaaaaagc tttaatggct caaaaataa 879
<210> 50
<211> 292
<212> PRT
<213> Enterococcus faecalis
<400> 50
Met Thr Glu Lys Leu Leu Gly Ser Ile Glu Ala Gly Gly Thr Lys Phe
1 5 10 15
Val Cys Gly Val Gly Thr Asp Asp Leu Thr Ile Val Glu Arg Val Ser
20 25 30
Phe Pro Thr Thr Thr Pro Glu Glu Thr Met Lys Lys Val Ile Glu Phe
35 40 45
Phe Gln Gln Tyr Pro Leu Lys Ala Ile Gly Ile Gly Ser Phe Gly Pro
50 55 60
Ile Asp Ile His Val Asp Ser Pro Thr Tyr Gly Tyr Ile Thr Ser Thr
65 70 75 80
Pro Lys Leu Ala Trp Arg Asn Phe Asp Leu Leu Gly Thr Met Lys Gln
85 90 95
His Phe Asp Val Pro Met Ala Trp Thr Thr Asp Val Asn Ala Ala Ala
100 105 110
Tyr Gly Glu Tyr Val Ala Gly Asn Gly Gln His Thr Ser Ser Cys Val
115 120 125
Tyr Tyr Thr Ile Gly Thr Gly Val Gly Ala Gly Ala Ile Gln Asn Gly
130 135 140
Glu Phe Ile Glu Gly Phe Ser His Pro Glu Met Gly His Ala Leu Val
145 150 155 160
Arg Arg His Pro Glu Asp Thr Tyr Ala Gly Asn Cys Pro Tyr His Gly
165 170 175
Asp Cys Leu Glu Gly Ile Ala Ala Gly Pro Ala Val Glu Gly Arg Ser
180 185 190
Gly Lys Lys Gly His Leu Leu Glu Glu Asp His Lys Thr Trp Glu Leu
195 200 205
Glu Ala Tyr Tyr Leu Ala Gln Ala Ala Tyr Asn Thr Thr Leu Leu Leu
210 215 220
Ala Pro Glu Val Ile Ile Leu Gly Gly Gly Val Met Lys Gln Arg His
225 230 235 240
Leu Met Pro Lys Val Arg Glu Lys Phe Ala Glu Leu Val Asn Gly Tyr
245 250 255
Val Glu Thr Pro Pro Leu Glu Lys Tyr Leu Val Thr Pro Leu Leu Glu
260 265 270
Asp Asn Pro Gly Thr Ile Gly Cys Phe Ala Leu Ala Lys Lys Ala Leu
275 280 285
Met Ala Gln Lys
290
<210> 51
<211> 1458
<212> DNA
<213> Saccharomyces cerevisiae
<400> 51
atggttcatt taggtccaaa gaaaccacag gctagaaagg gttccatggc tgatgtgccc 60
aaggaattga tggatgaaat tcatcagttg gaagatatgt ttacagttga cagcgagacc 120
ttgagaaagg ttgttaagca ctttatcgac gaattgaata aaggtttgac aaagaaggga 180
ggtaacattc caatgattcc cggttgggtc atggaattcc caacaggtaa agaatctggt 240
aactatttgg ccattgattt gggtggtact aacttaagag tcgtgttggt caagttgagc 300
ggtaaccata cctttgacac cactcaatcc aagtataaac taccacatga catgagaacc 360
actaagcacc aagaggagtt atggtccttt attgccgact ctttgaagga ctttatggtc 420
gagcaagaat tgctaaacac caaggacacc ttaccattag gtttcacctt ctcgtaccca 480
gcttcccaaa acaagattaa cgaaggtatt ttgcaaagat ggaccaaggg tttcgatatt 540
ccaaatgtcg aaggccacga tgtcgtccca ttgctacaaa acgaaatttc caagagagag 600
ttgcctattg aaattgtagc attgattaat gatactgttg gtactttaat tgcctcatac 660
tacactgacc cagagactaa gatgggtgtg attttcggta ctggtgtcaa cggtgctttc 720
tatgatgttg tttccgatat cgaaaagttg gagggcaaat tagcagacga tattccaagt 780
aactctccaa tggctatcaa ttgtgaatat ggttccttcg ataatgaaca tttggtcttg 840
ccaagaacca agtacgatgt tgctgtcgac gaacaatctc caagacctgg tcaacaagct 900
tttgaaaaga tgacctccgg ttactacttg ggtgaattgt tgcgtctagt gttacttgaa 960
ttaaacgaga agggcttgat gttgaaggat caagatctaa gcaagttgaa acaaccatac 1020
atcatggata cctcctaccc agcaagaatc gaggatgatc catttgaaaa cttggaagat 1080
actgatgaca tcttccaaaa ggactttggt gtcaagacca ctctgccaga acgtaagttg 1140
attagaagac tttgtgaatt gatcggtacc agagctgcta gattagctgt ttgtggtatt 1200
gccgctattt gccaaaagag aggttacaag actggtcaca ttgccgctga cggttctgtc 1260
tataacaaat acccaggttt caaggaagcc gccgctaagg gtttgagaga tatctatgga 1320
tggactggtg acgcaagcaa agatccaatt acgattgttc cagctgagga tggttcaggt 1380
gcaggtgctg ctgttattgc tgcattgtcc gaaaaaagaa ttgccgaagg taagtctctt 1440
ggtatcattg gcgcttaa 1458
<210> 52
<211> 485
<212> PRT
<213> Saccharomyces cerevisiae
<400> 52
Met Val His Leu Gly Pro Lys Lys Pro Gln Ala Arg Lys Gly Ser Met
1 5 10 15
Ala Asp Val Pro Lys Glu Leu Met Asp Glu Ile His Gln Leu Glu Asp
20 25 30
Met Phe Thr Val Asp Ser Glu Thr Leu Arg Lys Val Val Lys His Phe
35 40 45
Ile Asp Glu Leu Asn Lys Gly Leu Thr Lys Lys Gly Gly Asn Ile Pro
50 55 60
Met Ile Pro Gly Trp Val Met Glu Phe Pro Thr Gly Lys Glu Ser Gly
65 70 75 80
Asn Tyr Leu Ala Ile Asp Leu Gly Gly Thr Asn Leu Arg Val Val Leu
85 90 95
Val Lys Leu Ser Gly Asn His Thr Phe Asp Thr Thr Gln Ser Lys Tyr
100 105 110
Lys Leu Pro His Asp Met Arg Thr Thr Lys His Gln Glu Glu Leu Trp
115 120 125
Ser Phe Ile Ala Asp Ser Leu Lys Asp Phe Met Val Glu Gln Glu Leu
130 135 140
Leu Asn Thr Lys Asp Thr Leu Pro Leu Gly Phe Thr Phe Ser Tyr Pro
145 150 155 160
Ala Ser Gln Asn Lys Ile Asn Glu Gly Ile Leu Gln Arg Trp Thr Lys
165 170 175
Gly Phe Asp Ile Pro Asn Val Glu Gly His Asp Val Val Pro Leu Leu
180 185 190
Gln Asn Glu Ile Ser Lys Arg Glu Leu Pro Ile Glu Ile Val Ala Leu
195 200 205
Ile Asn Asp Thr Val Gly Thr Leu Ile Ala Ser Tyr Tyr Thr Asp Pro
210 215 220
Glu Thr Lys Met Gly Val Ile Phe Gly Thr Gly Val Asn Gly Ala Phe
225 230 235 240
Tyr Asp Val Val Ser Asp Ile Glu Lys Leu Glu Gly Lys Leu Ala Asp
245 250 255
Asp Ile Pro Ser Asn Ser Pro Met Ala Ile Asn Cys Glu Tyr Gly Ser
260 265 270
Phe Asp Asn Glu His Leu Val Leu Pro Arg Thr Lys Tyr Asp Val Ala
275 280 285
Val Asp Glu Gln Ser Pro Arg Pro Gly Gln Gln Ala Phe Glu Lys Met
290 295 300
Thr Ser Gly Tyr Tyr Leu Gly Glu Leu Leu Arg Leu Val Leu Leu Glu
305 310 315 320
Leu Asn Glu Lys Gly Leu Met Leu Lys Asp Gln Asp Leu Ser Lys Leu
325 330 335
Lys Gln Pro Tyr Ile Met Asp Thr Ser Tyr Pro Ala Arg Ile Glu Asp
340 345 350
Asp Pro Phe Glu Asn Leu Glu Asp Thr Asp Asp Ile Phe Gln Lys Asp
355 360 365
Phe Gly Val Lys Thr Thr Leu Pro Glu Arg Lys Leu Ile Arg Arg Leu
370 375 380
Cys Glu Leu Ile Gly Thr Arg Ala Ala Arg Leu Ala Val Cys Gly Ile
385 390 395 400
Ala Ala Ile Cys Gln Lys Arg Gly Tyr Lys Thr Gly His Ile Ala Ala
405 410 415
Asp Gly Ser Val Tyr Asn Lys Tyr Pro Gly Phe Lys Glu Ala Ala Ala
420 425 430
Lys Gly Leu Arg Asp Ile Tyr Gly Trp Thr Gly Asp Ala Ser Lys Asp
435 440 445
Pro Ile Thr Ile Val Pro Ala Glu Asp Gly Ser Gly Ala Gly Ala Ala
450 455 460
Val Ile Ala Ala Leu Ser Glu Lys Arg Ile Ala Glu Gly Lys Ser Leu
465 470 475 480
Gly Ile Ile Gly Ala
485
<210> 53
<211> 1461
<212> DNA
<213> Saccharomyces cerevisiae
<400> 53
atggttcatt taggtccaaa aaaaccacaa gccagaaagg gttccatggc cgatgtgcca 60
aaggaattga tgcaacaaat tgagaatttt gaaaaaattt tcactgttcc aactgaaact 120
ttacaagccg ttaccaagca cttcatttcc gaattggaaa agggtttgtc caagaagggt 180
ggtaacattc caatgattcc aggttgggtt atggatttcc caactggtaa ggaatccggt 240
gatttcttgg ccattgattt gggtggtacc aacttgagag ttgtcttagt caagttgggc 300
ggtgaccgta cctttgacac cactcaatct aagtacagat taccagatgc tatgagaact 360
actcaaaatc cagacgaatt gtgggaattt attgccgact ctttgaaagc ttttattgat 420
gagcaattcc cacaaggtat ctctgagcca attccattgg gtttcacctt ttctttccca 480
gcttctcaaa acaaaatcaa tgaaggtatc ttgcaaagat ggactaaagg ttttgatatt 540
ccaaacattg aaaaccacga tgttgttcca atgttgcaaa agcaaatcac taagaggaat 600
atcccaattg aagttgttgc tttgataaac gacactaccg gtactttggt tgcttcttac 660
tacactgacc cagaaactaa gatgggtgtt atcttcggta ctggtgtcaa tggtgcttac 720
tacgatgttt gttccgatat cgaaaagcta caaggaaaac tatctgatga cattccacca 780
tctgctccaa tggccatcaa ctgtgaatac ggttccttcg ataatgaaca tgtcgttttg 840
ccaagaacta aatacgatat caccattgat gaagaatctc caagaccagg ccaacaaacc 900
tttgaaaaaa tgtcttctgg ttactactta ggtgaaattt tgcgtttggc cttgatggac 960
atgtacaaac aaggtttcat cttcaagaac caagacttgt ctaagttcga caagcctttc 1020
gtcatggaca cttcttaccc agccagaatc gaggaagatc cattcgagaa cctagaagat 1080
accgatgact tgttccaaaa tgagttcggt atcaacacta ctgttcaaga acgtaaattg 1140
atcagacgtt tatctgaatt gattggtgct agagctgcta gattgtccgt ttgtggtatt 1200
gctgctatct gtcaaaagag aggttacaag accggtcaca tcgctgcaga cggttccgtt 1260
tacaacagat acccaggttt caaagaaaag gctgccaatg ctttgaagga catttacggc 1320
tggactcaaa cctcactaga cgactaccca atcaagattg ttcctgctga agatggttcc 1380
ggtgctggtg ccgctgttat tgctgctttg gcccaaaaaa gaattgctga aggtaagtcc 1440
gttggtatca tcggtgctta a 1461
<210> 54
<211> 486
<212> PRT
<213> Saccharomyces cerevisiae
<400> 54
Met Val His Leu Gly Pro Lys Lys Pro Gln Ala Arg Lys Gly Ser Met
1 5 10 15
Ala Asp Val Pro Lys Glu Leu Met Gln Gln Ile Glu Asn Phe Glu Lys
20 25 30
Ile Phe Thr Val Pro Thr Glu Thr Leu Gln Ala Val Thr Lys His Phe
35 40 45
Ile Ser Glu Leu Glu Lys Gly Leu Ser Lys Lys Gly Gly Asn Ile Pro
50 55 60
Met Ile Pro Gly Trp Val Met Asp Phe Pro Thr Gly Lys Glu Ser Gly
65 70 75 80
Asp Phe Leu Ala Ile Asp Leu Gly Gly Thr Asn Leu Arg Val Val Leu
85 90 95
Val Lys Leu Gly Gly Asp Arg Thr Phe Asp Thr Thr Gln Ser Lys Tyr
100 105 110
Arg Leu Pro Asp Ala Met Arg Thr Thr Gln Asn Pro Asp Glu Leu Trp
115 120 125
Glu Phe Ile Ala Asp Ser Leu Lys Ala Phe Ile Asp Glu Gln Phe Pro
130 135 140
Gln Gly Ile Ser Glu Pro Ile Pro Leu Gly Phe Thr Phe Ser Phe Pro
145 150 155 160
Ala Ser Gln Asn Lys Ile Asn Glu Gly Ile Leu Gln Arg Trp Thr Lys
165 170 175
Gly Phe Asp Ile Pro Asn Ile Glu Asn His Asp Val Val Pro Met Leu
180 185 190
Gln Lys Gln Ile Thr Lys Arg Asn Ile Pro Ile Glu Val Val Ala Leu
195 200 205
Ile Asn Asp Thr Thr Gly Thr Leu Val Ala Ser Tyr Tyr Thr Asp Pro
210 215 220
Glu Thr Lys Met Gly Val Ile Phe Gly Thr Gly Val Asn Gly Ala Tyr
225 230 235 240
Tyr Asp Val Cys Ser Asp Ile Glu Lys Leu Gln Gly Lys Leu Ser Asp
245 250 255
Asp Ile Pro Pro Ser Ala Pro Met Ala Ile Asn Cys Glu Tyr Gly Ser
260 265 270
Phe Asp Asn Glu His Val Val Leu Pro Arg Thr Lys Tyr Asp Ile Thr
275 280 285
Ile Asp Glu Glu Ser Pro Arg Pro Gly Gln Gln Thr Phe Glu Lys Met
290 295 300
Ser Ser Gly Tyr Tyr Leu Gly Glu Ile Leu Arg Leu Ala Leu Met Asp
305 310 315 320
Met Tyr Lys Gln Gly Phe Ile Phe Lys Asn Gln Asp Leu Ser Lys Phe
325 330 335
Asp Lys Pro Phe Val Met Asp Thr Ser Tyr Pro Ala Arg Ile Glu Glu
340 345 350
Asp Pro Phe Glu Asn Leu Glu Asp Thr Asp Asp Leu Phe Gln Asn Glu
355 360 365
Phe Gly Ile Asn Thr Thr Val Gln Glu Arg Lys Leu Ile Arg Arg Leu
370 375 380
Ser Glu Leu Ile Gly Ala Arg Ala Ala Arg Leu Ser Val Cys Gly Ile
385 390 395 400
Ala Ala Ile Cys Gln Lys Arg Gly Tyr Lys Thr Gly His Ile Ala Ala
405 410 415
Asp Gly Ser Val Tyr Asn Arg Tyr Pro Gly Phe Lys Glu Lys Ala Ala
420 425 430
Asn Ala Leu Lys Asp Ile Tyr Gly Trp Thr Gln Thr Ser Leu Asp Asp
435 440 445
Tyr Pro Ile Lys Ile Val Pro Ala Glu Asp Gly Ser Gly Ala Gly Ala
450 455 460
Ala Val Ile Ala Ala Leu Ala Gln Lys Arg Ile Ala Glu Gly Lys Ser
465 470 475 480
Val Gly Ile Ile Gly Ala
485
<210> 55
<211> 1434
<212> DNA
<213> Escherichia coli
<400> 55
atgacgcaat ctcgattgca tgcggcgcaa aacgcactag caaaacttca cgagcgccga 60
ggtaacactt tctatcccca ttttcacctc gcgcctcctg ccgggtggat gaacgatcca 120
aacggcctga tctggtttaa cgatcgttat cacgcgtttt atcaacatca cccgatgagc 180
gaacactggg ggccaatgca ctggggacat gccaccagcg acgatatgat ccactggcag 240
catgagccta ttgcgctagc gccaggagac gagaatgaca aagacgggtg tttttcaggt 300
agtgctgtcg atgacaatgg tgtcctctca cttatctaca ccggacacgt ctggctcgat 360
ggtgcaggta atgacgatgc aattcgcgaa gtacaatgtc tggctaccag tcgggatggt 420
attcatttcg agaaacaggg tgtgatcctc actccaccag aaggcatcat gcacttccgc 480
gatcctaaag tgtggcgtga agccgacaca tggtggatgg tagtcggggc gaaagaccca 540
ggcaacacgg ggcagatcct gctttatcgc ggcagttcat tgcgtgaatg gactttcgat 600
cgcgtactgg cccacgctga tgcgggtgaa agctatatgt gggaatgtcc ggactttttc 660
agccttggcg atcagcatta tctgatgttt tccccgcagg gaatgaatgc cgagggatac 720
agttatcgaa atcgctttca aagtggcgta atacccggaa tgtggtcgcc aggacgactt 780
tttgcacaat ccgggcattt tactgaactt gataacgggc atgactttta tgcaccacaa 840
agctttgtag cgaaggatgg tcggcgtatt gttatcggct ggatggatat gtgggaatcg 900
ccaatgccct caaaacgtga aggctgggca ggctgcatga cgctggcgcg cgagctatca 960
gagagcaatg gcaaactcct acaacgcccg gtacacgaag ctgagtcgtt acgccagcag 1020
catcaatcta tctctccccg cacaatcagc aataaatatg ttttgcagga aaacgcgcaa 1080
gcagttgaga ttcagttgca gtgggcgctg aagaacagtg atgccgaaca ttacggatta 1140
cagctcggcg ctggaatgcg gctgtatatt gataaccaat ctgagcgact tgttttgtgg 1200
cggtattacc cacacgagaa tttagatggc taccgtagta ttcccctccc gcagggtgac 1260
atgctcgccc taaggatatt tatcgataca tcatccgtgg aagtatttat taacgacggg 1320
gaggcggtga tgagtagccg aatatatccg cagccagaag aacgggaact gtcgctctat 1380
gcctcccacg gagtggctgt gctgcaacat ggagcactct ggcaactggg ttaa 1434
<210> 56
<211> 477
<212> PRT
<213> Escherichia coli
<400> 56
Met Thr Gln Ser Arg Leu His Ala Ala Gln Asn Ala Leu Ala Lys Leu
1 5 10 15
His Glu Arg Arg Gly Asn Thr Phe Tyr Pro His Phe His Leu Ala Pro
20 25 30
Pro Ala Gly Trp Met Asn Asp Pro Asn Gly Leu Ile Trp Phe Asn Asp
35 40 45
Arg Tyr His Ala Phe Tyr Gln His His Pro Met Ser Glu His Trp Gly
50 55 60
Pro Met His Trp Gly His Ala Thr Ser Asp Asp Met Ile His Trp Gln
65 70 75 80
His Glu Pro Ile Ala Leu Ala Pro Gly Asp Glu Asn Asp Lys Asp Gly
85 90 95
Cys Phe Ser Gly Ser Ala Val Asp Asp Asn Gly Val Leu Ser Leu Ile
100 105 110
Tyr Thr Gly His Val Trp Leu Asp Gly Ala Gly Asn Asp Asp Ala Ile
115 120 125
Arg Glu Val Gln Cys Leu Ala Thr Ser Arg Asp Gly Ile His Phe Glu
130 135 140
Lys Gln Gly Val Ile Leu Thr Pro Pro Glu Gly Ile Met His Phe Arg
145 150 155 160
Asp Pro Lys Val Trp Arg Glu Ala Asp Thr Trp Trp Met Val Val Gly
165 170 175
Ala Lys Asp Pro Gly Asn Thr Gly Gln Ile Leu Leu Tyr Arg Gly Ser
180 185 190
Ser Leu Arg Glu Trp Thr Phe Asp Arg Val Leu Ala His Ala Asp Ala
195 200 205
Gly Glu Ser Tyr Met Trp Glu Cys Pro Asp Phe Phe Ser Leu Gly Asp
210 215 220
Gln His Tyr Leu Met Phe Ser Pro Gln Gly Met Asn Ala Glu Gly Tyr
225 230 235 240
Ser Tyr Arg Asn Arg Phe Gln Ser Gly Val Ile Pro Gly Met Trp Ser
245 250 255
Pro Gly Arg Leu Phe Ala Gln Ser Gly His Phe Thr Glu Leu Asp Asn
260 265 270
Gly His Asp Phe Tyr Ala Pro Gln Ser Phe Val Ala Lys Asp Gly Arg
275 280 285
Arg Ile Val Ile Gly Trp Met Asp Met Trp Glu Ser Pro Met Pro Ser
290 295 300
Lys Arg Glu Gly Trp Ala Gly Cys Met Thr Leu Ala Arg Glu Leu Ser
305 310 315 320
Glu Ser Asn Gly Lys Leu Leu Gln Arg Pro Val His Glu Ala Glu Ser
325 330 335
Leu Arg Gln Gln His Gln Ser Ile Ser Pro Arg Thr Ile Ser Asn Lys
340 345 350
Tyr Val Leu Gln Glu Asn Ala Gln Ala Val Glu Ile Gln Leu Gln Trp
355 360 365
Ala Leu Lys Asn Ser Asp Ala Glu His Tyr Gly Leu Gln Leu Gly Ala
370 375 380
Gly Met Arg Leu Tyr Ile Asp Asn Gln Ser Glu Arg Leu Val Leu Trp
385 390 395 400
Arg Tyr Tyr Pro His Glu Asn Leu Asp Gly Tyr Arg Ser Ile Pro Leu
405 410 415
Pro Gln Gly Asp Met Leu Ala Leu Arg Ile Phe Ile Asp Thr Ser Ser
420 425 430
Val Glu Val Phe Ile Asn Asp Gly Glu Ala Val Met Ser Ser Arg Ile
435 440 445
Tyr Pro Gln Pro Glu Glu Arg Glu Leu Ser Leu Tyr Ala Ser His Gly
450 455 460
Val Ala Val Leu Gln His Gly Ala Leu Trp Gln Leu Gly
465 470 475
<210> 57
<211> 1434
<212> DNA
<213> Escherichia coli
<400> 57
atgacgcaat ctcgattgca tgcggcgcaa aacgccctag caaaacttca tgagcaccgg 60
ggtaacactt tctatcccca ttttcacctc gcgcctcctg ccgggtggat gaacgatcca 120
aacggcctga tctggtttaa cgatcgttat cacgcgtttt atcaacatca tccgatgagc 180
gaacactggg ggccaatgca ctggggacat gccaccagcg acgatatgat ccactggcag 240
catgagccta ttgcgctagc gccaggagac gataatgaca aagacgggtg tttttcaggt 300
agtgctgtcg atgacaatgg tgtcctctca cttatctaca ccggacacgt ctggctcgat 360
ggtgcaggta atgacgatgc aattcgcgaa gtacaatgtc tggctaccag tcgggatggt 420
attcatttcg agaaacaggg tgtgatcctc actccaccag aaggaatcat gcacttccgc 480
gatcctaaag tgtggcgtga agccgacaca tggtggatgg tagtcggggc gaaagatcca 540
ggcaacacgg ggcagatcct gctttatcgc ggcagttcgt tgcgtgaatg gaccttcgat 600
cgcgtactgg cccacgctga tgcgggtgaa agctatatgt gggaatgtcc ggactttttc 660
agccttggcg atcagcatta tctgatgttt tccccgcagg gaatgaatgc cgagggatac 720
agttaccgaa atcgctttca aagtggcgta atacccggaa tgtggtcgcc aggacgactt 780
tttgcacaat ccgggcattt tactgaactt gataacgggc atgactttta tgcaccacaa 840
agctttttag cgaaggatgg tcggcgtatt gttatcggct ggatggatat gtgggaatcg 900
ccaatgccct caaaacgtga aggatgggca ggctgcatga cgctggcgcg cgagctatca 960
gagagcaatg gcaaacttct acaacgcccg gtacacgaag ctgagtcgtt acgccagcag 1020
catcaatctg tctctccccg cacaatcagc aataaatatg ttttgcagga aaacgcgcaa 1080
gcagttgaga ttcagttgca gtgggcgctg aagaacagtg atgccgaaca ttacggatta 1140
cagctcggca ctggaatgcg gctgtatatt gataaccaat ctgagcgact tgttttgtgg 1200
cggtattacc cacacgagaa tttagacggc taccgtagta ttcccctccc gcagcgtgac 1260
acgctcgccc taaggatatt tatcgataca tcatccgtgg aagtatttat taacgacggg 1320
gaagcggtga tgagtagtcg aatctatccg cagccagaag aacgggaact gtcgctttat 1380
gcctcccacg gagtggctgt gctgcaacat ggagcactct ggctactggg ttaa 1434
<210> 58
<211> 477
<212> PRT
<213> Escherichia coli
<400> 58
Met Thr Gln Ser Arg Leu His Ala Ala Gln Asn Ala Leu Ala Lys Leu
1 5 10 15
His Glu His Arg Gly Asn Thr Phe Tyr Pro His Phe His Leu Ala Pro
20 25 30
Pro Ala Gly Trp Met Asn Asp Pro Asn Gly Leu Ile Trp Phe Asn Asp
35 40 45
Arg Tyr His Ala Phe Tyr Gln His His Pro Met Ser Glu His Trp Gly
50 55 60
Pro Met His Trp Gly His Ala Thr Ser Asp Asp Met Ile His Trp Gln
65 70 75 80
His Glu Pro Ile Ala Leu Ala Pro Gly Asp Asp Asn Asp Lys Asp Gly
85 90 95
Cys Phe Ser Gly Ser Ala Val Asp Asp Asn Gly Val Leu Ser Leu Ile
100 105 110
Tyr Thr Gly His Val Trp Leu Asp Gly Ala Gly Asn Asp Asp Ala Ile
115 120 125
Arg Glu Val Gln Cys Leu Ala Thr Ser Arg Asp Gly Ile His Phe Glu
130 135 140
Lys Gln Gly Val Ile Leu Thr Pro Pro Glu Gly Ile Met His Phe Arg
145 150 155 160
Asp Pro Lys Val Trp Arg Glu Ala Asp Thr Trp Trp Met Val Val Gly
165 170 175
Ala Lys Asp Pro Gly Asn Thr Gly Gln Ile Leu Leu Tyr Arg Gly Ser
180 185 190
Ser Leu Arg Glu Trp Thr Phe Asp Arg Val Leu Ala His Ala Asp Ala
195 200 205
Gly Glu Ser Tyr Met Trp Glu Cys Pro Asp Phe Phe Ser Leu Gly Asp
210 215 220
Gln His Tyr Leu Met Phe Ser Pro Gln Gly Met Asn Ala Glu Gly Tyr
225 230 235 240
Ser Tyr Arg Asn Arg Phe Gln Ser Gly Val Ile Pro Gly Met Trp Ser
245 250 255
Pro Gly Arg Leu Phe Ala Gln Ser Gly His Phe Thr Glu Leu Asp Asn
260 265 270
Gly His Asp Phe Tyr Ala Pro Gln Ser Phe Leu Ala Lys Asp Gly Arg
275 280 285
Arg Ile Val Ile Gly Trp Met Asp Met Trp Glu Ser Pro Met Pro Ser
290 295 300
Lys Arg Glu Gly Trp Ala Gly Cys Met Thr Leu Ala Arg Glu Leu Ser
305 310 315 320
Glu Ser Asn Gly Lys Leu Leu Gln Arg Pro Val His Glu Ala Glu Ser
325 330 335
Leu Arg Gln Gln His Gln Ser Val Ser Pro Arg Thr Ile Ser Asn Lys
340 345 350
Tyr Val Leu Gln Glu Asn Ala Gln Ala Val Glu Ile Gln Leu Gln Trp
355 360 365
Ala Leu Lys Asn Ser Asp Ala Glu His Tyr Gly Leu Gln Leu Gly Thr
370 375 380
Gly Met Arg Leu Tyr Ile Asp Asn Gln Ser Glu Arg Leu Val Leu Trp
385 390 395 400
Arg Tyr Tyr Pro His Glu Asn Leu Asp Gly Tyr Arg Ser Ile Pro Leu
405 410 415
Pro Gln Arg Asp Thr Leu Ala Leu Arg Ile Phe Ile Asp Thr Ser Ser
420 425 430
Val Glu Val Phe Ile Asn Asp Gly Glu Ala Val Met Ser Ser Arg Ile
435 440 445
Tyr Pro Gln Pro Glu Glu Arg Glu Leu Ser Leu Tyr Ala Ser His Gly
450 455 460
Val Ala Val Leu Gln His Gly Ala Leu Trp Leu Leu Gly
465 470 475
<210> 59
<211> 1599
<212> DNA
<213> Bifidobacterium lactis
<400> 59
atggcaaccc ttcccaccaa tattcccgcc aacggcattc tgacccccga cccggcgctc 60
gaccctgtgc tcacgccgat ctcggaccat gccgagcagc tgtcactcgc cgaagcaggc 120
gtgtcggcac tggaaaccac ccgcaacgac cgctggtacc cgaagttcca cattgcctcc 180
aatggcgggt ggatcaacga cccgaacggc ctgtgccgct acaacggacg ctggcacgtg 240
ttctaccagc tgcatcccca cggcacacag tggggcccga tgcattgggg ccacgtctcc 300
tccgacaaca tggtcgactg gcaccgcgaa cccatcgcct tcgcgccaag cctcgaacag 360
gaacgccacg gtgtgttctc cggttccgcc gtgattggcg acgacggcaa gccgtggatt 420
ttctacaccg gccaccgctg ggccaacggc aaggacaaca ccggaggcga ctggcaggtg 480
cagatgctcg ccaagccgaa cgacgacgaa ctgaagacct tcacgaagga gggcatgatc 540
atcgactgcc ccaccgacga ggtggaccac cacttccgcg acccgaaggt gtggaagacc 600
ggtgacacct ggtatatgac cttcggtgtc tcgtcgaagg agcatcgtgg ccagatgtgg 660
ctgtacacgt cgagcgacat ggtgcactgg agcttcgatc gggtgctgtt cgagcatccg 720
gatccgaacg tgttcatgct tgaatgcccc gatttcttcc cgatccgcga tgcgcggggc 780
aacgagaaat gggtcatcgg cttctccgcg atgggtgcca agccaaatgg cttcatgaac 840
cgcaacgtga acaatgccgg ctacatggtg ggcacatgga agccaggcga gagcttcaag 900
ccggagaccg agttccgcct gtgggacgaa ggccataact tctatgcacc acagtcgttc 960
aacaccgaag ggcgccagat catgtacggc tggatgagcc cgttcgtcgc ccccatcccg 1020
atggaggagg acggctggtg cggcaacctc accctccccc gcgagatcac gctgggcgat 1080
gacggtgacc tggtcaccgc ccccaccatc gaaatggagg ggctgcgcga gaataccata 1140
ggcttcgact cgctcgacct tggtacgaac cagacctcca cgatcctcga cgatgacggc 1200
ggcgccctgg aaatcgagat gagactcgat ctgaacaaaa ccaccgccga acgcgccgga 1260
ctgcatgtgc atgccacaag cgacggccac tacacggcaa tcgtattcga cgcgcagatc 1320
ggcggcgtcg tcatcgaccg gcagaacgtg gcgaacggag acaaaggcta ccgggtggcc 1380
aagctcagcg acaccgagct cgcagccgat acgcttgact tgcgcgtgtt catcgaccgc 1440
ggatgcgtcg aggtctacgt cgacggcggc aagcatgcga tgagctcgta ctcgttccct 1500
ggcgatggcg cacgcgccgt cgaactcgtg agcgaatccg gcaccacgca catcgacacc 1560
ctcaccatgc actcgctcaa gtccatcgga ctcgagtga 1599
<210> 60
<211> 532
<212> PRT
<213> Bifidobacterium lactis
<400> 60
Met Ala Thr Leu Pro Thr Asn Ile Pro Ala Asn Gly Ile Leu Thr Pro
1 5 10 15
Asp Pro Ala Leu Asp Pro Val Leu Thr Pro Ile Ser Asp His Ala Glu
20 25 30
Gln Leu Ser Leu Ala Glu Ala Gly Val Ser Ala Leu Glu Thr Thr Arg
35 40 45
Asn Asp Arg Trp Tyr Pro Lys Phe His Ile Ala Ser Asn Gly Gly Trp
50 55 60
Ile Asn Asp Pro Asn Gly Leu Cys Arg Tyr Asn Gly Arg Trp His Val
65 70 75 80
Phe Tyr Gln Leu His Pro His Gly Thr Gln Trp Gly Pro Met His Trp
85 90 95
Gly His Val Ser Ser Asp Asn Met Val Asp Trp His Arg Glu Pro Ile
100 105 110
Ala Phe Ala Pro Ser Leu Glu Gln Glu Arg His Gly Val Phe Ser Gly
115 120 125
Ser Ala Val Ile Gly Asp Asp Gly Lys Pro Trp Ile Phe Tyr Thr Gly
130 135 140
His Arg Trp Ala Asn Gly Lys Asp Asn Thr Gly Gly Asp Trp Gln Val
145 150 155 160
Gln Met Leu Ala Lys Pro Asn Asp Asp Glu Leu Lys Thr Phe Thr Lys
165 170 175
Glu Gly Met Ile Ile Asp Cys Pro Thr Asp Glu Val Asp His His Phe
180 185 190
Arg Asp Pro Lys Val Trp Lys Thr Gly Asp Thr Trp Tyr Met Thr Phe
195 200 205
Gly Val Ser Ser Lys Glu His Arg Gly Gln Met Trp Leu Tyr Thr Ser
210 215 220
Ser Asp Met Val His Trp Ser Phe Asp Arg Val Leu Phe Glu His Pro
225 230 235 240
Asp Pro Asn Val Phe Met Leu Glu Cys Pro Asp Phe Phe Pro Ile Arg
245 250 255
Asp Ala Arg Gly Asn Glu Lys Trp Val Ile Gly Phe Ser Ala Met Gly
260 265 270
Ala Lys Pro Asn Gly Phe Met Asn Arg Asn Val Asn Asn Ala Gly Tyr
275 280 285
Met Val Gly Thr Trp Lys Pro Gly Glu Ser Phe Lys Pro Glu Thr Glu
290 295 300
Phe Arg Leu Trp Asp Glu Gly His Asn Phe Tyr Ala Pro Gln Ser Phe
305 310 315 320
Asn Thr Glu Gly Arg Gln Ile Met Tyr Gly Trp Met Ser Pro Phe Val
325 330 335
Ala Pro Ile Pro Met Glu Glu Asp Gly Trp Cys Gly Asn Leu Thr Leu
340 345 350
Pro Arg Glu Ile Thr Leu Gly Asp Asp Gly Asp Leu Val Thr Ala Pro
355 360 365
Thr Ile Glu Met Glu Gly Leu Arg Glu Asn Thr Ile Gly Phe Asp Ser
370 375 380
Leu Asp Leu Gly Thr Asn Gln Thr Ser Thr Ile Leu Asp Asp Asp Gly
385 390 395 400
Gly Ala Leu Glu Ile Glu Met Arg Leu Asp Leu Asn Lys Thr Thr Ala
405 410 415
Glu Arg Ala Gly Leu His Val His Ala Thr Ser Asp Gly His Tyr Thr
420 425 430
Ala Ile Val Phe Asp Ala Gln Ile Gly Gly Val Val Ile Asp Arg Gln
435 440 445
Asn Val Ala Asn Gly Asp Lys Gly Tyr Arg Val Ala Lys Leu Ser Asp
450 455 460
Thr Glu Leu Ala Ala Asp Thr Leu Asp Leu Arg Val Phe Ile Asp Arg
465 470 475 480
Gly Cys Val Glu Val Tyr Val Asp Gly Gly Lys His Ala Met Ser Ser
485 490 495
Tyr Ser Phe Pro Gly Asp Gly Ala Arg Ala Val Glu Leu Val Ser Glu
500 505 510
Ser Gly Thr Thr His Ile Asp Thr Leu Thr Met His Ser Leu Lys Ser
515 520 525
Ile Gly Leu Glu
530
<210> 61
<211> 1599
<212> DNA
<213> Saccharomyces cerevisiae
<400> 61
atgcttttgc aagctttcct tttccttttg gctggttttg cagccaaaat atctgcatca 60
atgacaaacg aaactagcga tagacctttg gtccacttca cacccaacaa gggctggatg 120
aatgacccaa atgggttgtg gtacgatgaa aaagatgcca aatggcatct gtactttcaa 180
tacaacccaa atgacaccgt atggggtacg ccattgtttt ggggccatgc tacttccgat 240
gatttgacta attgggaaga tcaacccatt gctatcgctc ccaagcgtaa cgattcaggt 300
gctttctctg gctccatggt ggttgattac aacaacacga gtgggttttt caatgatact 360
attgatccaa gacaaagatg cgttgcgatt tggacttata acactcctga aagtgaagag 420
caatacatta gctattctct tgatggtggt tacactttta ctgaatacca aaagaaccct 480
gttttagctg ccaactccac tcaattcaga gatccaaagg tgttctggta tgaaccttct 540
caaaaatgga ttatgacggc tgccaaatca caagactaca aaattgaaat ttactcctct 600
gatgacttga agtcctggaa gctagaatct gcatttgcca atgaaggttt cttaggctac 660
caatacgaat gtccaggttt gattgaagtc ccaactgagc aagatccttc caaatcttat 720
tgggtcatgt ttatttctat caacccaggt gcacctgctg gcggttcctt caaccaatat 780
tttgttggat ccttcaatgg tactcatttt gaagcgtttg acaatcaatc tagagtggta 840
gattttggta aggactacta tgccttgcaa actttcttca acactgaccc aacctacggt 900
tcagcattag gtattgcctg ggcttcaaac tgggagtaca gtgcctttgt cccaactaac 960
ccatggagat catccatgtc tttggtccgc aagttttctt tgaacactga atatcaagct 1020
aatccagaga ctgaattgat caatttgaaa gccgaaccaa tattgaacat tagtaatgct 1080
ggtccctggt ctcgttttgc tactaacaca actctaacta aggccaattc ttacaatgtc 1140
gatttgagca actcgactgg taccctagag tttgagttgg tttacgctgt taacaccaca 1200
caaaccatat ccaaatccgt ctttgccgac ttatcacttt ggttcaaggg tttagaagat 1260
cctgaagaat atttgagaat gggttttgaa gtcagtgctt cttccttctt tttggaccgt 1320
ggtaactcta aggtcaagtt tgtcaaggag aacccatatt tcacaaacag aatgtctgtc 1380
aacaaccaac cattcaagtc tgagaacgac ctaagttact ataaagtgta cggcctactg 1440
gatcaaaaca tcttggaatt gtacttcaac gatggagatg tggtttctac aaatacctac 1500
ttcatgacca ccggtaacgc tctaggatct gtgaacatga ccactggtgt cgataatttg 1560
ttctacattg acaagttcca agtaagggaa gtaaaatag 1599
<210> 62
<211> 532
<212> PRT
<213> Saccharomyces cerevisiae
<400> 62
Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys
1 5 10 15
Ile Ser Ala Ser Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His
20 25 30
Phe Thr Pro Asn Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr
35 40 45
Asp Glu Lys Asp Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn
50 55 60
Asp Thr Val Trp Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp
65 70 75 80
Asp Leu Thr Asn Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg
85 90 95
Asn Asp Ser Gly Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn
100 105 110
Thr Ser Gly Phe Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val
115 120 125
Ala Ile Trp Thr Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser
130 135 140
Tyr Ser Leu Asp Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro
145 150 155 160
Val Leu Ala Ala Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp
165 170 175
Tyr Glu Pro Ser Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp
180 185 190
Tyr Lys Ile Glu Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu
195 200 205
Glu Ser Ala Phe Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys
210 215 220
Pro Gly Leu Ile Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr
225 230 235 240
Trp Val Met Phe Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser
245 250 255
Phe Asn Gln Tyr Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala
260 265 270
Phe Asp Asn Gln Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala
275 280 285
Leu Gln Thr Phe Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly
290 295 300
Ile Ala Trp Ala Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn
305 310 315 320
Pro Trp Arg Ser Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr
325 330 335
Glu Tyr Gln Ala Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu
340 345 350
Pro Ile Leu Asn Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr
355 360 365
Asn Thr Thr Leu Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn
370 375 380
Ser Thr Gly Thr Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr
385 390 395 400
Gln Thr Ile Ser Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys
405 410 415
Gly Leu Glu Asp Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser
420 425 430
Ala Ser Ser Phe Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val
435 440 445
Lys Glu Asn Pro Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro
450 455 460
Phe Lys Ser Glu Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu
465 470 475 480
Asp Gln Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser
485 490 495
Thr Asn Thr Tyr Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn
500 505 510
Met Thr Thr Gly Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val
515 520 525
Arg Glu Val Lys
530
<210> 63
<211> 1302
<212> DNA
<213> Corynebacterium glutamicum
<400> 63
gtgtgtgggg ctatgcacac agaactttcc agtttgcgcc ctgcgtacca tgtgactcct 60
ccgcagggca ggctcaatga tcccaacgga atgtacgtcg atggcgatac cctccacgtc 120
tactaccagc acgatccagg tttccccttc gcaccaaagc gcaccggctg ggctcacacc 180
accacgccgt tgaccggacc gcagcgattg cagtggacgc acctgcccga cgctctttac 240
ccggatgcat cctatgacct ggatggatgc tattccggtg gagccgtatt tactgacggc 300
acacttaaac ttttctacac cggcaaccta aaaattgacg gcaagcgccg cgccacccaa 360
aacctcgtcg aagtcgagga cccaactggg ctgatgggcg gcattcatcg ccgttcgcct 420
aaaaatccgc ttatcgacgg acccgccagc ggtttcacac cccattaccg cgatcccatg 480
atcagccctg atggtgatgg ttggaaaatg gttcttgggg cccaacgcga aaacctcacc 540
ggtgcagcgg ttctataccg ctcgacagat cttgaaaact gggaattctc cggtgaaatc 600
acctttgacc tcagtgatgc acaacctggt tctgctcctg atctcgttcc cggtggctac 660
atgtgggaat gccccaacct ttttacgctt cgcgatgaag aaactggcga agatctcgac 720
gtgctgattt tctgtccaca aggattggac cgaatccacg atgaggttac tcactacgca 780
agctctgacc agtgcggata tgtcgtcggc aagcttgaag gaacgacctt ccgcgtcttg 840
cgaggattca gcgagctgga tttcggccat gaattctacg caccgcaggt tgcagtaaac 900
ggttctgatg cctggctcgt gggctggatg gggctgcccg cgcaggatga tcacccaaca 960
gttgcacggg aaggatgggt gcactgcctg actgtgcccc gcaagcttca tttgcgcaac 1020
cacgcgatct atcaagagct tcttctccca gagggggagt caggggtaat cagatctgta 1080
ttaggttctg aacctgtccg agtagacatc cgaggcaata tttccctcga gtgggatggt 1140
gtccgtttgt ctgtggatcg tggtggtgat cgtcgcgtag ctgaggtaaa acctggcgaa 1200
ttagtgatcg cggacgataa tacagccatt gagataactg caggtgatgg acaggtttca 1260
ttcgctttcc gggctttcaa aggtgacact attgagagat aa 1302
<210> 64
<211> 433
<212> PRT
<213> Corynebacterium glutamicum
<400> 64
Met Cys Gly Ala Met His Thr Glu Leu Ser Ser Leu Arg Pro Ala Tyr
1 5 10 15
His Val Thr Pro Pro Gln Gly Arg Leu Asn Asp Pro Asn Gly Met Tyr
20 25 30
Val Asp Gly Asp Thr Leu His Val Tyr Tyr Gln His Asp Pro Gly Phe
35 40 45
Pro Phe Ala Pro Lys Arg Thr Gly Trp Ala His Thr Thr Thr Pro Leu
50 55 60
Thr Gly Pro Gln Arg Leu Gln Trp Thr His Leu Pro Asp Ala Leu Tyr
65 70 75 80
Pro Asp Ala Ser Tyr Asp Leu Asp Gly Cys Tyr Ser Gly Gly Ala Val
85 90 95
Phe Thr Asp Gly Thr Leu Lys Leu Phe Tyr Thr Gly Asn Leu Lys Ile
100 105 110
Asp Gly Lys Arg Arg Ala Thr Gln Asn Leu Val Glu Val Glu Asp Pro
115 120 125
Thr Gly Leu Met Gly Gly Ile His Arg Arg Ser Pro Lys Asn Pro Leu
130 135 140
Ile Asp Gly Pro Ala Ser Gly Phe Thr Pro His Tyr Arg Asp Pro Met
145 150 155 160
Ile Ser Pro Asp Gly Asp Gly Trp Lys Met Val Leu Gly Ala Gln Arg
165 170 175
Glu Asn Leu Thr Gly Ala Ala Val Leu Tyr Arg Ser Thr Asp Leu Glu
180 185 190
Asn Trp Glu Phe Ser Gly Glu Ile Thr Phe Asp Leu Ser Asp Ala Gln
195 200 205
Pro Gly Ser Ala Pro Asp Leu Val Pro Gly Gly Tyr Met Trp Glu Cys
210 215 220
Pro Asn Leu Phe Thr Leu Arg Asp Glu Glu Thr Gly Glu Asp Leu Asp
225 230 235 240
Val Leu Ile Phe Cys Pro Gln Gly Leu Asp Arg Ile His Asp Glu Val
245 250 255
Thr His Tyr Ala Ser Ser Asp Gln Cys Gly Tyr Val Val Gly Lys Leu
260 265 270
Glu Gly Thr Thr Phe Arg Val Leu Arg Gly Phe Ser Glu Leu Asp Phe
275 280 285
Gly His Glu Phe Tyr Ala Pro Gln Val Ala Val Asn Gly Ser Asp Ala
290 295 300
Trp Leu Val Gly Trp Met Gly Leu Pro Ala Gln Asp Asp His Pro Thr
305 310 315 320
Val Ala Arg Glu Gly Trp Val His Cys Leu Thr Val Pro Arg Lys Leu
325 330 335
His Leu Arg Asn His Ala Ile Tyr Gln Glu Leu Leu Leu Pro Glu Gly
340 345 350
Glu Ser Gly Val Ile Arg Ser Val Leu Gly Ser Glu Pro Val Arg Val
355 360 365
Asp Ile Arg Gly Asn Ile Ser Leu Glu Trp Asp Gly Val Arg Leu Ser
370 375 380
Val Asp Arg Gly Gly Asp Arg Arg Val Ala Glu Val Lys Pro Gly Glu
385 390 395 400
Leu Val Ile Ala Asp Asp Asn Thr Ala Ile Glu Ile Thr Ala Gly Asp
405 410 415
Gly Gln Val Ser Phe Ala Phe Arg Ala Phe Lys Gly Asp Thr Ile Glu
420 425 430
Arg
<210> 65
<211> 1473
<212> DNA
<213> Leuconostoc mesenteroides
<400> 65
atggaaattc aaaacaaagc aatgttgatc acttatgctg attcgttggg caaaaactta 60
aaagatgttc atcaagtctt gaaagaagat attggagatg cgattggtgg ggttcatttg 120
ttgcctttct tcccttcaac aggtgatcgc ggttttgcgc cagccgatta tactcgtgtt 180
gatgccgcat ttggtgattg ggcagatgtc gaagcattgg gtgaagaata ctatttgatg 240
tttgacttca tgattaacca tatttctcgt gaatcagtga tgtatcaaga ttttaagaag 300
aatcatgacg attcaaagta taaagatttc tttattcgtt gggaaaagtt ctgggcaaag 360
gccggcgaaa accgtccaac acaagccgat gttgacttaa tttacaagcg taaagataag 420
gcaccaacgc aagaaatcac ttttgatgat ggcacaacag aaaacttgtg gaatactttt 480
ggtgaagaac aaattgacat tgatgttaat tcagccattg ccaaggaatt tattaagaca 540
acccttgaag acatggtaaa acatggtgct aacttgattc gtttggatgc ctttgcgtat 600
gcagttaaaa aagttgacac aaatgacttc ttcgttgagc cagaaatctg ggacactttg 660
aatgaagtac gtgaaatttt gacaccatta aaggctgaaa ttttaccaga aattcatgaa 720
cattactcaa tccctaaaaa gatcaatgat catggttact tcacctatga ctttgcatta 780
ccaatgacaa cgctttacac attgtattca ggtaagacaa atcaattggc aaagtggttg 840
aagatgtcac caatgaagca attcacaaca ttggacacgc atgatggtat tggtgtcgtt 900
gatgcccgtg atattctaac tgatgatgaa attgactacg cttctgaaca actttacaag 960
gttggcgcga atgtcaaaaa gacatattca tctgcttcat acaacaacct tgatatttac 1020
caaattaact caacttatta ttcagcattg ggaaatgatg atgcagcata cttgttgagt 1080
cgtgtcttcc aagtctttgc gcctggaatt ccacaaattt attacgttgg tttgttggca 1140
ggtgaaaacg atatcgcgct tttggagtca actaaagaag gtcgtaatat taaccgtcat 1200
tactatacgc gtgaagaagt taagtcagaa gttaagcgac cagttgttgc taacttattg 1260
aagctattgt catggcgtaa tgaaagccct gcatttgatt tggctggctc aatcacagtt 1320
gacacgccaa ctgatacaac aattgtggtg acacgtcaag atgaaaatgg tcaaaacaaa 1380
gctgtattaa cagccgatgc ggccaacaaa acttttgaaa tcgttgagaa tggtcaaact 1440
gttatgagca gtgataattt gactcagaac taa 1473
<210> 66
<211> 490
<212> PRT
<213> Leuconostoc mesenteroides
<400> 66
Met Glu Ile Gln Asn Lys Ala Met Leu Ile Thr Tyr Ala Asp Ser Leu
1 5 10 15
Gly Lys Asn Leu Lys Asp Val His Gln Val Leu Lys Glu Asp Ile Gly
20 25 30
Asp Ala Ile Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Ala Asp Tyr Thr Arg Val Asp Ala Ala Phe
50 55 60
Gly Asp Trp Ala Asp Val Glu Ala Leu Gly Glu Glu Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Val Met Tyr Gln
85 90 95
Asp Phe Lys Lys Asn His Asp Asp Ser Lys Tyr Lys Asp Phe Phe Ile
100 105 110
Arg Trp Glu Lys Phe Trp Ala Lys Ala Gly Glu Asn Arg Pro Thr Gln
115 120 125
Ala Asp Val Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Thr Gln
130 135 140
Glu Ile Thr Phe Asp Asp Gly Thr Thr Glu Asn Leu Trp Asn Thr Phe
145 150 155 160
Gly Glu Glu Gln Ile Asp Ile Asp Val Asn Ser Ala Ile Ala Lys Glu
165 170 175
Phe Ile Lys Thr Thr Leu Glu Asp Met Val Lys His Gly Ala Asn Leu
180 185 190
Ile Arg Leu Asp Ala Phe Ala Tyr Ala Val Lys Lys Val Asp Thr Asn
195 200 205
Asp Phe Phe Val Glu Pro Glu Ile Trp Asp Thr Leu Asn Glu Val Arg
210 215 220
Glu Ile Leu Thr Pro Leu Lys Ala Glu Ile Leu Pro Glu Ile His Glu
225 230 235 240
His Tyr Ser Ile Pro Lys Lys Ile Asn Asp His Gly Tyr Phe Thr Tyr
245 250 255
Asp Phe Ala Leu Pro Met Thr Thr Leu Tyr Thr Leu Tyr Ser Gly Lys
260 265 270
Thr Asn Gln Leu Ala Lys Trp Leu Lys Met Ser Pro Met Lys Gln Phe
275 280 285
Thr Thr Leu Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Arg Asp
290 295 300
Ile Leu Thr Asp Asp Glu Ile Asp Tyr Ala Ser Glu Gln Leu Tyr Lys
305 310 315 320
Val Gly Ala Asn Val Lys Lys Thr Tyr Ser Ser Ala Ser Tyr Asn Asn
325 330 335
Leu Asp Ile Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asn
340 345 350
Asp Asp Ala Ala Tyr Leu Leu Ser Arg Val Phe Gln Val Phe Ala Pro
355 360 365
Gly Ile Pro Gln Ile Tyr Tyr Val Gly Leu Leu Ala Gly Glu Asn Asp
370 375 380
Ile Ala Leu Leu Glu Ser Thr Lys Glu Gly Arg Asn Ile Asn Arg His
385 390 395 400
Tyr Tyr Thr Arg Glu Glu Val Lys Ser Glu Val Lys Arg Pro Val Val
405 410 415
Ala Asn Leu Leu Lys Leu Leu Ser Trp Arg Asn Glu Ser Pro Ala Phe
420 425 430
Asp Leu Ala Gly Ser Ile Thr Val Asp Thr Pro Thr Asp Thr Thr Ile
435 440 445
Val Val Thr Arg Gln Asp Glu Asn Gly Gln Asn Lys Ala Val Leu Thr
450 455 460
Ala Asp Ala Ala Asn Lys Thr Phe Glu Ile Val Glu Asn Gly Gln Thr
465 470 475 480
Val Met Ser Ser Asp Asn Leu Thr Gln Asn
485 490
<210> 67
<211> 1515
<212> DNA
<213> Bifidobacterium adolescentis
<400> 67
atgaaaaaca aggtgcagct catcacttac gccgaccgcc ttggcgacgg caccatcaag 60
tcgatgaccg acattctgcg cacccgcttc gacggcgtgt acgacggcgt tcacatcctg 120
ccgttcttca ccccgttcga cggcgccgac gcaggcttcg acccgatcga ccacaccaag 180
gtcgacgaac gtctcggcag ctgggacgac gtcgccgaac tctccaagac ccacaacatc 240
atggtcgacg ccatcgtcaa ccacatgagt tgggaatcca agcagttcca ggacgtgctg 300
gccaagggcg aggagtccga atactatccg atgttcctca ccatgagctc cgtgttcccg 360
aacggcgcca ccgaagagga cctggccggc atctaccgtc cgcgtccggg cctgccgttc 420
acccactaca agttcgccgg caagacccgc ctcgtgtggg tcagcttcac cccgcagcag 480
gtggacatcg acaccgattc cgacaagggt tgggaatacc tcatgtcgat tttcgaccag 540
atggccgcct ctcacgtcag ctacatccgc ctcgacgccg tcggctatgg cgccaaggaa 600
gccggcacca gctgcttcat gaccccgaag accttcaagc tgatctcccg tctgcgtgag 660
gaaggcgtca agcgcggtct ggaaatcctc atcgaagtgc actcctacta caagaagcag 720
gtcgaaatcg catccaaggt ggaccgcgtc tacgacttcg ccctgcctcc gctgctgctg 780
cacgcgctga gcaccggcca cgtcgagccc gtcgcccact ggaccgacat acgcccgaac 840
aacgccgtca ccgtgctcga tacgcacgac ggcatcggcg tgatcgacat cggctccgac 900
cagctcgacc gctcgctcaa gggtctcgtg ccggatgagg acgtggacaa cctcgtcaac 960
accatccacg ccaacaccca cggcgaatcc caggcagcca ctggcgccgc cgcatccaat 1020
ctcgacctct accaggtcaa cagcacctac tattcggcgc tcgggtgcaa cgaccagcac 1080
tacatcgccg cccgcgcggt gcagttcttc ctgccgggcg tgccgcaagt ctactacgtc 1140
ggcgcgctcg ccggcaagaa cgacatggag ctgctgcgta agacgaataa cggccgcgac 1200
atcaatcgcc attactactc caccgcggaa atcgacgaga acctcaagcg tccggtcgtc 1260
aaggccctga acgcgctcgc caagttccgc aacgagctcg acgcgttcga cggcacgttc 1320
tcgtacacca ccgatgacga cacgtccatc agcttcacct ggcgcggcga aaccagccag 1380
gccacgctga cgttcgagcc gaagcgcggt ctcggtgtgg acaacactac gccggtcgcc 1440
atgttggaat gggaggattc cgcgggagac caccgttcgg atgatctgat cgccaatccg 1500
cctgtcgtcg cctga 1515
<210> 68
<211> 504
<212> PRT
<213> Bifidobacterium adolescentis
<400> 68
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Ile Lys Ser Met Thr Asp Ile Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Asp Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Glu Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asn Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe
85 90 95
Gln Asp Val Leu Ala Lys Gly Glu Glu Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Val Phe Pro Asn Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Lys
130 135 140
Phe Ala Gly Lys Thr Arg Leu Val Trp Val Ser Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Asp Lys Gly Trp Glu Tyr Leu Met Ser
165 170 175
Ile Phe Asp Gln Met Ala Ala Ser His Val Ser Tyr Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Ala Gly Thr Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Ser Arg Leu Arg Glu Glu Gly Val Lys
210 215 220
Arg Gly Leu Glu Ile Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Leu Pro
245 250 255
Pro Leu Leu Leu His Ala Leu Ser Thr Gly His Val Glu Pro Val Ala
260 265 270
His Trp Thr Asp Ile Arg Pro Asn Asn Ala Val Thr Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Leu Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Glu Asp Val Asp Asn Leu Val Asn
305 310 315 320
Thr Ile His Ala Asn Thr His Gly Glu Ser Gln Ala Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Ser Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asn Asp Gln His Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Leu Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Lys Asn Asp Met Glu Leu Leu Arg Lys Thr Asn Asn Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Thr Ala Glu Ile Asp Glu Asn Leu Lys
405 410 415
Arg Pro Val Val Lys Ala Leu Asn Ala Leu Ala Lys Phe Arg Asn Glu
420 425 430
Leu Asp Ala Phe Asp Gly Thr Phe Ser Tyr Thr Thr Asp Asp Asp Thr
435 440 445
Ser Ile Ser Phe Thr Trp Arg Gly Glu Thr Ser Gln Ala Thr Leu Thr
450 455 460
Phe Glu Pro Lys Arg Gly Leu Gly Val Asp Asn Thr Thr Pro Val Ala
465 470 475 480
Met Leu Glu Trp Glu Asp Ser Ala Gly Asp His Arg Ser Asp Asp Leu
485 490 495
Ile Ala Asn Pro Pro Val Val Ala
500
<210> 69
<211> 1164
<212> DNA
<213> Klebsiella pneumoniae
<400> 69
atgagctatc gtatgtttga ttatctggtg ccaaacgtta acttttttgg ccccaacgcc 60
atttccgtag tcggcgaacg ctgccagctg ctggggggga aaaaagccct gctggtcacc 120
gacaaaggcc tgcgggcaat taaagatggc gcagtggaca aaaccctgca ttatctgcgg 180
gaggccggga tcgaggtggc gatctttgac ggcgtcgagc cgaacccgaa agacaccaac 240
gtgcgcgacg gcctcgccgt gtttcgccgc gaacagtgcg acatcatcgt caccgtgggc 300
ggcggcagcc cgcacgattg cggcaaaggc atcggcatcg ccgccaccca tgagggcgat 360
ctgtaccagt atgccggaat cgagaccctg accaacccgc tgccgcctat cgtcgcggtc 420
aataccaccg ccggcaccgc cagcgaggtc acccgccact gcgtcctgac caacaccgaa 480
accaaagtga agtttgtgat cgtcagctgg cgcaacctgc cgtcggtctc tatcaacgat 540
ccgctgctga tgatcggtaa accggccgcc ctgaccgcgg cgaccgggat ggatgccctg 600
acccacgccg tagaggccta tatctccaaa gacgctaacc cggtgacgga cgccgccgcc 660
atgcaggcga tccgcctcat cgcccgcaac ctgcgccagg ccgtggccct cggcagcaat 720
ctgcaggcgc gggaaaacat ggcctatgcc tctctgctgg ccgggatggc tttcaataac 780
gccaacctcg gctacgtgca cgccatggcg caccagctgg gcggcctgta cgacatgccg 840
cacggcgtgg ccaacgctgt cctgctgccg catgtggccc gctacaacct gatcgccaac 900
ccggagaaat tcgccgatat cgctgaactg atgggcgaaa atatcaccgg actgtccact 960
ctcgacgcgg cggaaaaagc catcgccgct atcacgcgtc tgtcgatgga tatcggtatt 1020
ccgcagcatc tgcgcgatct gggagtaaaa gaggccgact tcccctacat ggcggagatg 1080
gctctgaaag acggcaatgc gttctcgaac ccgcgtaaag gcaacgagca ggagattgcc 1140
gcgattttcc gccaggcatt ctga 1164
<210> 70
<211> 387
<212> PRT
<213> Klebsiella pneumoniae
<400> 70
Met Ser Tyr Arg Met Phe Asp Tyr Leu Val Pro Asn Val Asn Phe Phe
1 5 10 15
Gly Pro Asn Ala Ile Ser Val Val Gly Glu Arg Cys Gln Leu Leu Gly
20 25 30
Gly Lys Lys Ala Leu Leu Val Thr Asp Lys Gly Leu Arg Ala Ile Lys
35 40 45
Asp Gly Ala Val Asp Lys Thr Leu His Tyr Leu Arg Glu Ala Gly Ile
50 55 60
Glu Val Ala Ile Phe Asp Gly Val Glu Pro Asn Pro Lys Asp Thr Asn
65 70 75 80
Val Arg Asp Gly Leu Ala Val Phe Arg Arg Glu Gln Cys Asp Ile Ile
85 90 95
Val Thr Val Gly Gly Gly Ser Pro His Asp Cys Gly Lys Gly Ile Gly
100 105 110
Ile Ala Ala Thr His Glu Gly Asp Leu Tyr Gln Tyr Ala Gly Ile Glu
115 120 125
Thr Leu Thr Asn Pro Leu Pro Pro Ile Val Ala Val Asn Thr Thr Ala
130 135 140
Gly Thr Ala Ser Glu Val Thr Arg His Cys Val Leu Thr Asn Thr Glu
145 150 155 160
Thr Lys Val Lys Phe Val Ile Val Ser Trp Arg Asn Leu Pro Ser Val
165 170 175
Ser Ile Asn Asp Pro Leu Leu Met Ile Gly Lys Pro Ala Ala Leu Thr
180 185 190
Ala Ala Thr Gly Met Asp Ala Leu Thr His Ala Val Glu Ala Tyr Ile
195 200 205
Ser Lys Asp Ala Asn Pro Val Thr Asp Ala Ala Ala Met Gln Ala Ile
210 215 220
Arg Leu Ile Ala Arg Asn Leu Arg Gln Ala Val Ala Leu Gly Ser Asn
225 230 235 240
Leu Gln Ala Arg Glu Asn Met Ala Tyr Ala Ser Leu Leu Ala Gly Met
245 250 255
Ala Phe Asn Asn Ala Asn Leu Gly Tyr Val His Ala Met Ala His Gln
260 265 270
Leu Gly Gly Leu Tyr Asp Met Pro His Gly Val Ala Asn Ala Val Leu
275 280 285
Leu Pro His Val Ala Arg Tyr Asn Leu Ile Ala Asn Pro Glu Lys Phe
290 295 300
Ala Asp Ile Ala Glu Leu Met Gly Glu Asn Ile Thr Gly Leu Ser Thr
305 310 315 320
Leu Asp Ala Ala Glu Lys Ala Ile Ala Ala Ile Thr Arg Leu Ser Met
325 330 335
Asp Ile Gly Ile Pro Gln His Leu Arg Asp Leu Gly Val Lys Glu Ala
340 345 350
Asp Phe Pro Tyr Met Ala Glu Met Ala Leu Lys Asp Gly Asn Ala Phe
355 360 365
Ser Asn Pro Arg Lys Gly Asn Glu Gln Glu Ile Ala Ala Ile Phe Arg
370 375 380
Gln Ala Phe
385
<210> 71
<211> 1824
<212> DNA
<213> Klebsiella pneumoniae
<400> 71
atgccgttaa tagccgggat tgatatcggc aacgccacca ccgaggtggc gctggcgtcc 60
gactacccgc aggcgagggc gtttgttgcc agcgggatcg tcgcgacgac gggcatgaaa 120
gggacgcggg acaatatcgc cgggaccctc gccgcgctgg agcaggccct ggcgaaaaca 180
ccgtggtcga tgagcgatgt ctctcgcatc tatcttaacg aagccgcgcc ggtgattggc 240
gatgtggcga tggagaccat caccgagacc attatcaccg aatcgaccat gatcggtcat 300
aacccgcaga cgccgggcgg ggtgggcgtt ggcgtgggga cgactatcgc cctcgggcgg 360
ctggcgacgc tgccggcggc gcagtatgcc gaggggtgga tcgtactgat tgacgacgcc 420
gtcgatttcc ttgacgccgt gtggtggctc aatgaggcgc tcgaccgggg gatcaacgtg 480
gtggcggcga tcctcaaaaa ggacgacggc gtgctggtga acaaccgcct gcgtaaaacc 540
ctgccggtgg tggatgaagt gacgctgctg gagcaggtcc ccgagggggt aatggcggcg 600
gtggaagtgg ccgcgccggg ccaggtggtg cggatcctgt cgaatcccta cgggatcgcc 660
accttcttcg ggctaagccc ggaagagacc caggccatcg tccccatcgc ccgcgccctg 720
attggcaacc gttccgcggt ggtgctcaag accccgcagg gggatgtgca gtcgcgggtg 780
atcccggcgg gcaacctcta cattagcggc gaaaagcgcc gcggagaggc cgatgtcgcc 840
gagggcgcgg aagccatcat gcaggcgatg agcgcctgcg ctccggtacg cgacatccgc 900
ggcgaaccgg gcacccacgc cggcggcatg cttgagcggg tgcgcaaggt aatggcgtcc 960
ctgaccggcc atgagatgag cgcgatatac atccaggatc tgctggcggt ggatacgttt 1020
attccgcgca aggtgcaggg cgggatggcc ggcgagtgcg ccatggagaa tgccgtcggg 1080
atggcggcga tggtgaaagc ggatcgtctg caaatgcagg ttatcgcccg cgaactgagc 1140
gcccgactgc agaccgaggt ggtggtgggc ggcgtggagg ccaacatggc catcgccggg 1200
gcgttaacca ctcccggctg tgcggcgccg ctggcgatcc tcgacctcgg cgccggctcg 1260
acggatgcgg cgatcgtcaa cgcggagggg cagataacgg cggtccatct cgccggggcg 1320
gggaatatgg tcagcctgtt gattaaaacc gagctgggcc tcgaggatct ttcgctggcg 1380
gaagcgataa aaaaataccc gctggccaaa gtggaaagcc tgttcagtat tcgtcacgag 1440
aatggcgcgg tggagttctt tcgggaagcc ctcagcccgg cggtgttcgc caaagtggtg 1500
tacatcaagg agggcgaact ggtgccgatc gataacgcca gcccgctgga aaaaattcgt 1560
ctcgtgcgcc ggcaggcgaa agagaaagtg tttgtcacca actgcctgcg cgcgctgcgc 1620
caggtctcac ccggcggttc cattcgcgat atcgcctttg tggtgctggt gggcggctca 1680
tcgctggact ttgagatccc gcagcttatc acggaagcct tgtcgcacta tggcgtggtc 1740
gccgggcagg gcaatattcg gggaacagaa gggccgcgca atgcggtcgc caccgggctg 1800
ctactggccg gtcaggcgaa ttaa 1824
<210> 72
<211> 13669
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 72
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080
cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140
gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200
atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260
caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320
gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380
cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440
tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500
caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560
ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620
gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680
gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740
ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800
atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860
ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920
cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980
agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040
gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100
gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160
gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220
cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280
atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340
cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400
gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460
ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520
tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580
ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640
tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700
tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760
tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga caatgccaca 5820
tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880
ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940
gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000
acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060
acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120
acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180
tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240
aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300
tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360
tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420
cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480
gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540
gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600
ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660
gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720
agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780
ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840
gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900
ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960
agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 7020
acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080
gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140
gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200
ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260
acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320
atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380
tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440
tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500
gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560
ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620
tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680
gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740
cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800
gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860
cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920
tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980
ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040
tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100
aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160
gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220
cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280
gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340
ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400
ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460
ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520
gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580
gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640
cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700
cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760
cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820
tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880
tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940
cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000
ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060
tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120
gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180
gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240
gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300
ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360
cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420
aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480
cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540
tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600
ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660
cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720
aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780
cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840
ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900
gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960
gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020
ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080
cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140
taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200
tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 10260
cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320
ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380
gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440
tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500
tctagagtac tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 10560
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tcgagctcgg tacccggggc 10620
ggccgcgcta gcgcccgatc cagctggagt ttgtagaaac gcaaaaaggc catccgtcag 10680
gatggccttc tgcttaattt gatgcctggc agtttatggc gggcgtcctg cccgccaccc 10740
tccgggccgt tgcttcgcaa cgttcaaatc cgctcccggc ggatttgtcc tactcaggag 10800
agcgttcacc gacaaacaac agataaaacg aaaggcccag tctttcgact gagcctttcg 10860
ttttatttga tgcctggcag ttccctactc tcgcatgggg agaccccaca ctaccatcgg 10920
cgctacggcg tttcacttct gagttcggca tggggtcagg tgggaccacc gcgctactgc 10980
cgccaggcaa attctgtttt atcagaccgc ttctgcgttc tgatttaatc tgtatcaggc 11040
tgaaaatctt ctctcatccg ccaaaacagc caagcttgca tgcctgcagc ccgggttacc 11100
atttcaacag atcgtcctta gcatataagt agtcgtcaaa aatgaattca acttcgtctg 11160
tttcggcatt gtagccgcca actctgatgg attcgtggtt tttgacaatg atgtcacagc 11220
ctttttcctt taggaagtcc aagtcgaaag tagtggcaat accaatgatc ttacaaccgg 11280
cggcttttcc ggcggcaata cctgctggag cgtcttcaaa tactactacc ttagatttgg 11340
aagggtcttg ctcattgatc ggatatccta agccattcct gcccttcaga tatggttctg 11400
gatgaggctt accctgtttg acatcattag cggtaatgaa gtactttggt ctcctgattc 11460
ccagatgctc gaaccatttt tgtgccatat cacgggtacc ggaagttgcc acagcccatt 11520
tctcttttgg tagagcgttc aaagcgttgc acagcttaac tgcacctggg acttcaatgg 11580
atttttcacc gtacttgacc ggaatttcag cttctaattt gttaacatac tcttcattgg 11640
caaagtctgg agcgaactta gcaatggcat caaacgttct ccaaccatgc gagacttgga 11700
taacgtgttc agcatcgaaa taaggtttgt ccttaccgaa atccctccag aatgcagcaa 11760
tggctggttg agagatgata atggtaccgt cgacgtcgaa caaagcggcg ttaactttca 11820
aagatagagg tttagtagtc aatcccataa ttctagtctg tttcctggat ccaataaatc 11880
taatcttcat gtagatctaa ttcttcaatc atgtccggca ggttcttcat tgggtagttg 11940
ttgtaaacga tttggtatac ggcttcaaat aatgggaagt cttcgacaga gccacatgtt 12000
tccaaccatt cgtgaacttc tttgcaggta attaaacctt gagcggattg gccattcaac 12060
aactcctttt cacattccca ggcgtcctta ccagaagtag ccattagcct agcaaccttg 12120
acgtttctac caccagcgca ggtggtgatc aaatcagcaa caccagcaga ctcttggtag 12180
tatgtttctt ctctagattc tgggaaaaac atttgaccga atctgatgat ctcacccaaa 12240
ccgactcttt ggatggcagc agaagcgttg ttaccccagc ctagaccttc gacgaaacca 12300
caacctaagg caacaacgtt cttcaaagca ccacagatgg agataccagc aacatcttcg 12360
atgacactaa cgtggaagta aggtctgtgg aacaaggcct ttagaacctt atggtcgacg 12420
tccttgccct cgcctctgaa atcctttgga atgtggtaag caactgttgt ttcagaccag 12480
tgttcttgag cgacttcggt ggcaatgtta gcaccagata gagcaccaca ttgaatacct 12540
agttcctcag tgatgtaaga ggatagcaat tggacacctt tagcaccaac ttcaaaaccc 12600
tttagacagg agatagctct gacgtgtgaa tcaacatgac ctttcaattg gctacagata 12660
cggggcaaaa attgatgtgg aatgttgaaa acgatgatgt cgacatcctt gactgaatca 12720
atcaagtctg gattagcaac caaattgtcg ggtagagtga tgccaggcaa gtatttcacg 12780
ttttgatgtc tagtatttat gatttcagtc aatttttcac cattgatctc ttcttcgaac 12840
acccacattt gtactattgg agcgaaaact tctgggtatc ccttacaatt ttcggcaacc 12900
accttggcaa tagtagtacc ccagttacca gatccaatca cagtaacctt gaaaggcttt 12960
tcggcagcct tcaaagaaac agaagaggaa cttctctttc taccagcatt caagtggccg 13020
gaagttaagt ttaatctatc agcagcagca gccatggaat tgtcctcctt actagtcatg 13080
gtctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacattata cgagccggat 13140
gattaattgt caacagctca tttcagaata tttgccagaa ccgttatgat gtcggcgcaa 13200
aaaacattat ccagaacggg agtgcgcctt gagcgacacg aattatgcag tgatttacga 13260
cctgcacagc cataccacag cttccgatgg ctgcctgacg ccagaagcat tggtgcacgc 13320
tagccagtac atttaaatgg taccctctag tcaaggcctt aagtgagtcg tattacggac 13380
tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 13440
ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 13500
cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct gatgcggtat tttctcctta 13560
cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc tgctctgatg 13620
ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgagct 13669
<210> 73
<211> 13543
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 73
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080
cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140
gcgagccgtc acgcccttga ctatgccaca tcctgagcaa ataattcaac cactaaacaa 4200
atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260
caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320
gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380
cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440
tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500
caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560
ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620
gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680
gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740
ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800
atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860
ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920
cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980
agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040
gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100
gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160
gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220
cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280
atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340
cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400
gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460
ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520
tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580
ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640
tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700
tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760
tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga ctatgccaca 5820
tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880
ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940
gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000
acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060
acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120
acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180
tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240
aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300
tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360
tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420
cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480
gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540
gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600
ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660
gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720
agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780
ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840
gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900
ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960
agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 7020
acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080
gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140
gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200
ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260
acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320
atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380
tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440
tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500
gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560
ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620
tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680
gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740
cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800
gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860
cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920
tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980
ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040
tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100
aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160
gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220
cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280
gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340
ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400
ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460
ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520
gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580
gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640
cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700
cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760
cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820
tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880
tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940
cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000
ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060
tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120
gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180
gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240
gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300
ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360
cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420
aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480
cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540
tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600
ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660
cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720
aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780
cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840
ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900
gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960
gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020
ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080
cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140
taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200
tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 10260
cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320
ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380
gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440
tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500
tctagcgtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg 10560
caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg 10620
ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt 10680
aatcatccgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca cacaggaaac 10740
agaccatgac tagtaaggag gacaattcca tggctgctgc tgctgataga ttaaacttaa 10800
cttccggcca cttgaatgct ggtagaaaga gaagttcctc ttctgtttct ttgaaggctg 10860
ccgaaaagcc tttcaaggtt actgtgattg gatctggtaa ctggggtact actattgcca 10920
aggtggttgc cgaaaattgt aagggatacc cagaagtttt cgctccaata gtacaaatgt 10980
gggtgttcga agaagagatc aatggtgaaa aattgactga aatcataaat actagacatc 11040
aaaacgtgaa atacttgcct ggcatcactc tacccgacaa tttggttgct aatccagact 11100
tgattgattc agtcaaggat gtcgacatca tcgttttcaa cattccacat caatttttgc 11160
cccgtatctg tagccaattg aaaggtcatg ttgattcaca cgtcagagct atctcctgtc 11220
taaagggttt tgaagttggt gctaaaggtg tccaattgct atcctcttac atcactgagg 11280
aactaggtat tcaatgtggt gctctatctg gtgctaacat tgccaccgaa gtcgctcaag 11340
aacactggtc tgaaacaaca gttgcttacc acattccaaa ggatttcaga ggcgagggca 11400
aggacgtcga ccataaggtt ctaaaggcct tgttccacag accttacttc cacgttagtg 11460
tcatcgaaga tgttgctggt atctccatct gtggtgcttt gaagaacgtt gttgccttag 11520
gttgtggttt cgtcgaaggt ctaggctggg gtaacaacgc ttctgctgcc atccaaagag 11580
tcggtttggg tgagatcatc agattcggtc aaatgttttt cccagaatct agagaagaaa 11640
catactacca agagtctgct ggtgttgctg atttgatcac cacctgcgct ggtggtagaa 11700
acgtcaaggt tgctaggcta atggctactt ctggtaagga cgcctgggaa tgtgaaaagg 11760
agttgttgaa tggccaatcc gctcaaggtt taattacctg caaagaagtt cacgaatggt 11820
tggaaacatg tggctctgtc gaagacttcc cattatttga agccgtatac caaatcgttt 11880
acaacaacta cccaatgaag aacctgccgg acatgattga agaattagat ctacatgaag 11940
attagattta ttggatccag gaaacagact agaattatgg gattgactac taaacctcta 12000
tctttgaaag ttaacgccgc tttgttcgac gtcgacggta ccattatcat ctctcaacca 12060
gccattgctg cattctggag ggatttcggt aaggacaaac cttatttcga tgctgaacac 12120
gttatccaag tctcgcatgg ttggagaacg tttgatgcca ttgctaagtt cgctccagac 12180
tttgccaatg aagagtatgt taacaaatta gaagctgaaa ttccggtcaa gtacggtgaa 12240
aaatccattg aagtcccagg tgcagttaag ctgtgcaacg ctttgaacgc tctaccaaaa 12300
gagaaatggg ctgtggcaac ttccggtacc cgtgatatgg cacaaaaatg gttcgagcat 12360
ctgggaatca ggagaccaaa gtacttcatt accgctaatg atgtcaaaca gggtaagcct 12420
catccagaac catatctgaa gggcaggaat ggcttaggat atccgatcaa tgagcaagac 12480
ccttccaaat ctaaggtagt agtatttgaa gacgctccag caggtattgc cgccggaaaa 12540
gccgccggtt gtaagatcat tggtattgcc actactttcg acttggactt cctaaaggaa 12600
aaaggctgtg acatcattgt caaaaaccac gaatccatca gagttggcgg ctacaatgcc 12660
gaaacagacg aagttgaatt catttttgac gactacttat atgctaagga cgatctgttg 12720
aaatggtaac ccgggctgca ggcatgcaag cttggctgtt ttggcggatg agagaagatt 12780
ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca gaatttgcct 12840
ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt gaaacgccgt 12900
agcgccgatg gtagtgtggg gtctccccat gcgagagtag ggaactgcca ggcatcaaat 12960
aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa 13020
cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga agcaacggcc 13080
cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta agcagaaggc 13140
catcctgacg gatggccttt ttgcgtttct acaaactcca gctggatcgg gcgctagagt 13200
atacatttaa atggtaccct ctagtcaagg ccttaagtga gtcgtattac ggactggccg 13260
tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 13320
cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 13380
aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc 13440
tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 13500
agttaagcca gccccgacac ccgccaacac ccgctgacga gct 13543
<210> 74
<211> 13543
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 74
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080
cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140
gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200
atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260
caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320
gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380
cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440
tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500
caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560
ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620
gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680
gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740
ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800
atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860
ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920
cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980
agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040
gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100
gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160
gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220
cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280
atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340
cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400
gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460
ctgcccagct gcacgtggcg cgcacccagt cccgtcggct cgaacgcctg ctgacggcca 5520
tggaccgcgc gcatccgctg cgcgacgcgc tcaaacgcta cagcaatcgc ctgtcggatg 5580
ccctgttctc catggcgcga atcgaagaga ctaggcctga tgcttgcgct tgaactggcc 5640
tagcaaacac agaaaaaagc ccgcacctga cagtgcgggc tttttttttc ctaggcgatc 5700
tgtgctgttt gccacggtat gcagcaccag cgcgagatta tgggctcgca cgctcgactg 5760
tcggacgggg gcactggaac gagaagtcag gcgagccgtc acgcccttga caatgccaca 5820
tcctgagcaa ataattcaac cactaaacaa atcaaccgcg tttcccggag gtaaccaagc 5880
ttcacctttt gagccgatga acaatgaaaa gatcaaaacg atttgcagta ctggcccagc 5940
gccccgtcaa tcaggacggg ctgattggcg agtggcctga agaggggctg atcgccatgg 6000
acagcccctt tgacccggtc tcttcagtaa aagtggacaa cggtctgatc gtcgaactgg 6060
acggcaaacg ccgggaccag tttgacatga tcgaccgatt tatcgccgat tacgcgatca 6120
acgttgagcg cacagagcag gcaatgcgcc tggaggcggt ggaaatagcc cgtatgctgg 6180
tggatattca cgtcagccgg gaggagatca ttgccatcac taccgccatc acgccggcca 6240
aagcggtcga ggtgatggcg cagatgaacg tggtggagat gatgatggcg ctgcagaaga 6300
tgcgtgcccg ccggaccccc tccaaccagt gccacgtcac caatctcaaa gataatccgg 6360
tgcagattgc cgctgacgcc gccgaggccg ggatccgcgg cttctcagaa caggagacca 6420
cggtcggtat cgcgcgctac gcgccgttta acgccctggc gctgttggtc ggttcgcagt 6480
gcggccgccc cggcgtgttg acgcagtgct cggtggaaga ggccaccgag ctggagctgg 6540
gcatgcgtgg cttaaccagc tacgccgaga cggtgtcggt ctacggcacc gaagcggtat 6600
ttaccgacgg cgatgatacg ccgtggtcaa aggcgttcct cgcctcggcc tacgcctccc 6660
gcgggttgaa aatgcgctac acctccggca ccggatccga agcgctgatg ggctattcgg 6720
agagcaagtc gatgctctac ctcgaatcgc gctgcatctt cattactaaa ggcgccgggg 6780
ttcagggact gcaaaacggc gcggtgagct gtatcggcat gaccggcgct gtgccgtcgg 6840
gcattcgggc ggtgctggcg gaaaacctga tcgcctctat gctcgacctc gaagtggcgt 6900
ccgccaacga ccagactttc tcccactcgg atattcgccg caccgcgcgc accctgatgc 6960
agatgctgcc gggcaccgac tttattttct ccggctacag cgcggtgccg aactacgaca 7020
acatgttcgc cggctcgaac ttcgatgcgg aagattttga tgattacaac atcctgcagc 7080
gtgacctgat ggttgacggc ggcctgcgtc cggtgaccga ggcggaaacc attgccattc 7140
gccagaaagc ggcgcgggcg atccaggcgg ttttccgcga gctggggctg ccgccaatcg 7200
ccgacgagga ggtggaggcc gccacctacg cgcacggcag caacgagatg ccgccgcgta 7260
acgtggtgga ggatctgagt gcggtggaag agatgatgaa gcgcaacatc accggcctcg 7320
atattgtcgg cgcgctgagc cgcagcggct ttgaggatat cgccagcaat attctcaata 7380
tgctgcgcca gcgggtcacc ggcgattacc tgcagacctc ggccattctc gatcggcagt 7440
tcgaggtggt gagtgcggtc aacgacatca atgactatca ggggccgggc accggctatc 7500
gcatctctgc cgaacgctgg gcggagatca aaaatattcc gggcgtggtt cagcccgaca 7560
ccattgaata aggcggtatt cctgtgcaac agacaaccca aattcagccc tcttttaccc 7620
tgaaaacccg cgagggcggg gtagcttctg ccgatgaacg cgccgatgaa gtggtgatcg 7680
gcgtcggccc tgccttcgat aaacaccagc atcacactct gatcgatatg ccccatggcg 7740
cgatcctcaa agagctgatt gccggggtgg aagaagaggg gcttcacgcc cgggtggtgc 7800
gcattctgcg cacgtccgac gtctccttta tggcctggga tgcggccaac ctgagcggct 7860
cggggatcgg catcggtatc cagtcgaagg ggaccacggt catccatcag cgcgatctgc 7920
tgccgctcag caacctggag ctgttctccc aggcgccgct gctgacgctg gagacctacc 7980
ggcagattgg caaaaacgct gcgcgctatg cgcgcaaaga gtcaccttcg ccggtgccgg 8040
tggtgaacga tcagatggtg cggccgaaat ttatggccaa agccgcgcta tttcatatca 8100
aagagaccaa acatgtggtg caggacgccg agcccgtcac cctgcacatc gacttagtaa 8160
gggagtgacc atgagcgaga aaaccatgcg cgtgcaggat tatccgttag ccacccgctg 8220
cccggagcat atcctgacgc ctaccggcaa accattgacc gatattaccc tcgagaaggt 8280
gctctctggc gaggtgggcc cgcaggatgt gcggatctcc cgccagaccc ttgagtacca 8340
ggcgcagatt gccgagcaga tgcagcgcca tgcggtggcg cgcaatttcc gccgcgcggc 8400
ggagcttatc gccattcctg acgagcgcat tctggctatc tataacgcgc tgcgcccgtt 8460
ccgctcctcg caggcggagc tgctggcgat cgccgacgag ctggagcaca cctggcatgc 8520
gacagtgaat gccgcctttg tccgggagtc ggcggaagtg tatcagcagc ggcataagct 8580
gcgtaaagga agctaagcgg aggtcagcat gccgttaata gccgggattg atatcggcaa 8640
cgccaccacc gaggtggcgc tggcgtccga ctacccgcag gcgagggcgt ttgttgccag 8700
cgggatcgtc gcgacgacgg gcatgaaagg gacgcgggac aatatcgccg ggaccctcgc 8760
cgcgctggag caggccctgg cgaaaacacc gtggtcgatg agcgatgtct ctcgcatcta 8820
tcttaacgaa gccgcgccgg tgattggcga tgtggcgatg gagaccatca ccgagaccat 8880
tatcaccgaa tcgaccatga tcggtcataa cccgcagacg ccgggcgggg tgggcgttgg 8940
cgtggggacg actatcgccc tcgggcggct ggcgacgctg ccggcggcgc agtatgccga 9000
ggggtggatc gtactgattg acgacgccgt cgatttcctt gacgccgtgt ggtggctcaa 9060
tgaggcgctc gaccggggga tcaacgtggt ggcggcgatc ctcaaaaagg acgacggcgt 9120
gctggtgaac aaccgcctgc gtaaaaccct gccggtggtg gatgaagtga cgctgctgga 9180
gcaggtcccc gagggggtaa tggcggcggt ggaagtggcc gcgccgggcc aggtggtgcg 9240
gatcctgtcg aatccctacg ggatcgccac cttcttcggg ctaagcccgg aagagaccca 9300
ggccatcgtc cccatcgccc gcgccctgat tggcaaccgt tccgcggtgg tgctcaagac 9360
cccgcagggg gatgtgcagt cgcgggtgat cccggcgggc aacctctaca ttagcggcga 9420
aaagcgccgc ggagaggccg atgtcgccga gggcgcggaa gccatcatgc aggcgatgag 9480
cgcctgcgct ccggtacgcg acatccgcgg cgaaccgggc acccacgccg gcggcatgct 9540
tgagcgggtg cgcaaggtaa tggcgtccct gaccggccat gagatgagcg cgatatacat 9600
ccaggatctg ctggcggtgg atacgtttat tccgcgcaag gtgcagggcg ggatggccgg 9660
cgagtgcgcc atggagaatg ccgtcgggat ggcggcgatg gtgaaagcgg atcgtctgca 9720
aatgcaggtt atcgcccgcg aactgagcgc ccgactgcag accgaggtgg tggtgggcgg 9780
cgtggaggcc aacatggcca tcgccggggc gttaaccact cccggctgtg cggcgccgct 9840
ggcgatcctc gacctcggcg ccggctcgac ggatgcggcg atcgtcaacg cggaggggca 9900
gataacggcg gtccatctcg ccggggcggg gaatatggtc agcctgttga ttaaaaccga 9960
gctgggcctc gaggatcttt cgctggcgga agcgataaaa aaatacccgc tggccaaagt 10020
ggaaagcctg ttcagtattc gtcacgagaa tggcgcggtg gagttctttc gggaagccct 10080
cagcccggcg gtgttcgcca aagtggtgta catcaaggag ggcgaactgg tgccgatcga 10140
taacgccagc ccgctggaaa aaattcgtct cgtgcgccgg caggcgaaag agaaagtgtt 10200
tgtcaccaac tgcctgcgcg cgctgcgcca ggtctcaccc ggcggttcca ttcgcgatat 10260
cgcctttgtg gtgctggtgg gcggctcatc gctggacttt gagatcccgc agcttatcac 10320
ggaagccttg tcgcactatg gcgtggtcgc cgggcagggc aatattcggg gaacagaagg 10380
gccgcgcaat gcggtcgcca ccgggctgct actggccggt caggcgaatt aaacgggcgc 10440
tcgcgccagc ctctaggtac aaataaaaaa ggcacgtcag atgacgtgcc ttttttcttg 10500
tctagcgtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg 10560
caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg 10620
ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt 10680
aatcatccgg ctcgtataat gtgtggaatt gtgagcggat aacaatttca cacaggaaac 10740
agaccatgac tagtaaggag gacaattcca tggctgctgc tgctgataga ttaaacttaa 10800
cttccggcca cttgaatgct ggtagaaaga gaagttcctc ttctgtttct ttgaaggctg 10860
ccgaaaagcc tttcaaggtt actgtgattg gatctggtaa ctggggtact actattgcca 10920
aggtggttgc cgaaaattgt aagggatacc cagaagtttt cgctccaata gtacaaatgt 10980
gggtgttcga agaagagatc aatggtgaaa aattgactga aatcataaat actagacatc 11040
aaaacgtgaa atacttgcct ggcatcactc tacccgacaa tttggttgct aatccagact 11100
tgattgattc agtcaaggat gtcgacatca tcgttttcaa cattccacat caatttttgc 11160
cccgtatctg tagccaattg aaaggtcatg ttgattcaca cgtcagagct atctcctgtc 11220
taaagggttt tgaagttggt gctaaaggtg tccaattgct atcctcttac atcactgagg 11280
aactaggtat tcaatgtggt gctctatctg gtgctaacat tgccaccgaa gtcgctcaag 11340
aacactggtc tgaaacaaca gttgcttacc acattccaaa ggatttcaga ggcgagggca 11400
aggacgtcga ccataaggtt ctaaaggcct tgttccacag accttacttc cacgttagtg 11460
tcatcgaaga tgttgctggt atctccatct gtggtgcttt gaagaacgtt gttgccttag 11520
gttgtggttt cgtcgaaggt ctaggctggg gtaacaacgc ttctgctgcc atccaaagag 11580
tcggtttggg tgagatcatc agattcggtc aaatgttttt cccagaatct agagaagaaa 11640
catactacca agagtctgct ggtgttgctg atttgatcac cacctgcgct ggtggtagaa 11700
acgtcaaggt tgctaggcta atggctactt ctggtaagga cgcctgggaa tgtgaaaagg 11760
agttgttgaa tggccaatcc gctcaaggtt taattacctg caaagaagtt cacgaatggt 11820
tggaaacatg tggctctgtc gaagacttcc cattatttga agccgtatac caaatcgttt 11880
acaacaacta cccaatgaag aacctgccgg acatgattga agaattagat ctacatgaag 11940
attagattta ttggatccag gaaacagact agaattatgg gattgactac taaacctcta 12000
tctttgaaag ttaacgccgc tttgttcgac gtcgacggta ccattatcat ctctcaacca 12060
gccattgctg cattctggag ggatttcggt aaggacaaac cttatttcga tgctgaacac 12120
gttatccaag tctcgcatgg ttggagaacg tttgatgcca ttgctaagtt cgctccagac 12180
tttgccaatg aagagtatgt taacaaatta gaagctgaaa ttccggtcaa gtacggtgaa 12240
aaatccattg aagtcccagg tgcagttaag ctgtgcaacg ctttgaacgc tctaccaaaa 12300
gagaaatggg ctgtggcaac ttccggtacc cgtgatatgg cacaaaaatg gttcgagcat 12360
ctgggaatca ggagaccaaa gtacttcatt accgctaatg atgtcaaaca gggtaagcct 12420
catccagaac catatctgaa gggcaggaat ggcttaggat atccgatcaa tgagcaagac 12480
ccttccaaat ctaaggtagt agtatttgaa gacgctccag caggtattgc cgccggaaaa 12540
gccgccggtt gtaagatcat tggtattgcc actactttcg acttggactt cctaaaggaa 12600
aaaggctgtg acatcattgt caaaaaccac gaatccatca gagttggcgg ctacaatgcc 12660
gaaacagacg aagttgaatt catttttgac gactacttat atgctaagga cgatctgttg 12720
aaatggtaac ccgggctgca ggcatgcaag cttggctgtt ttggcggatg agagaagatt 12780
ttcagcctga tacagattaa atcagaacgc agaagcggtc tgataaaaca gaatttgcct 12840
ggcggcagta gcgcggtggt cccacctgac cccatgccga actcagaagt gaaacgccgt 12900
agcgccgatg gtagtgtggg gtctccccat gcgagagtag ggaactgcca ggcatcaaat 12960
aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa 13020
cgctctcctg agtaggacaa atccgccggg agcggatttg aacgttgcga agcaacggcc 13080
cggagggtgg cgggcaggac gcccgccata aactgccagg catcaaatta agcagaaggc 13140
catcctgacg gatggccttt ttgcgtttct acaaactcca gctggatcgg gcgctagagt 13200
atacatttaa atggtaccct ctagtcaagg ccttaagtga gtcgtattac ggactggccg 13260
tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 13320
cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 13380
aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc 13440
tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 13500
agttaagcca gccccgacac ccgccaacac ccgctgacga gct 13543
<210> 75
<211> 13402
<212> DNA
<213> Artificial Sequence
<220>
<223> Plamid
<400> 75
tagtaaagcc ctcgctagat tttaatgcgg atgttgcgat tacttcgcca actattgcga 60
taacaagaaa aagccagcct ttcatgatat atctcccaat ttgtgtaggg cttattatgc 120
acgcttaaaa ataataaaag cagacttgac ctgatagttt ggctgtgagc aattatgtgc 180
ttagtgcatc taacgcttga gttaagccgc gccgcgaagc ggcgtcggct tgaacgaatt 240
gttagacatt atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct 300
tccaactgat ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta 360
gcttcaagta tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg 420
acatccttcg gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc 480
actacatttc gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca 540
tttagcgcct caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga 600
cctaccaagg caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg 660
atcgtggctg gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc 720
agttcgcgct tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact 780
tctacagcgc ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg 840
atcaaagctc gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata 900
tcactgtgtg gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac 960
gtcggttcga gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg 1020
gcgatcaccg cttccctcat gatgtttaac tttgttttag ggcgactgcc ctgctgcgta 1080
acatcgttgc tgctccataa catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg 1140
gatgcccgag gcatagactg taccccaaaa aaacagtcat aacaagccat gaaaaccgcc 1200
actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg tgagcgcata 1260
cgctacttgc attacagctt acgaaccgaa caggcttatg tccactgggt tcgtgccttc 1320
atccgtttcc acggtgtgcg tcacccggca accttgggca gcagcgaagt cgaggcattt 1380
ctgtcctggc tggcgaacga gcgcaaggtt tcggtctcca cgcatcgtca ggcattggcg 1440
gccttgctgt tcttctacgg caaggtgctg tgcacggatc tgccctggct tcaggagatc 1500
ggaagacctc ggccgtcgcg gcgcttgccg gtggtgctga ccccggatga agtggttcgc 1560
atcctcggtt ttctggaagg cgagcatcgt ttgttcgccc agcttctgta tggaacgggc 1620
atgcggatca gtgagggttt gcaactgcgg gtcaaggatc tggatttcga tcacggcacg 1680
atcatcgtgc gggagggcaa gggctccaag gatcgggcct tgatgttacc cgagagcttg 1740
gcacccagcc tgcgcgagca ggggaattaa ttcccacggg ttttgctgcc cgcaaacggg 1800
ctgttctggt gttgctagtt tgttatcaga atcgcagatc cggcttcagc cggtttgccg 1860
gctgaaagcg ctatttcttc cagaattgcc atgatttttt ccccacggga ggcgtcactg 1920
gctcccgtgt tgtcggcagc tttgattcga taagcagcat cgcctgtttc aggctgtcta 1980
tgtgtgactg ttgagctgta acaagttgtc tcaggtgttc aatttcatgt tctagttgct 2040
ttgttttact ggtttcacct gttctattag gtgttacatg ctgttcatct gttacattgt 2100
cgatctgttc atggtgaaca gctttgaatg caccaaaaac tcgtaaaagc tctgatgtat 2160
ctatcttttt tacaccgttt tcatctgtgc atatggacag ttttcccttt gatatgtaac 2220
ggtgaacagt tgttctactt ttgtttgtta gtcttgatgc ttcactgata gatacaagag 2280
ccataagaac ctcagatcct tccgtattta gccagtatgt tctctagtgt ggttcgttgt 2340
ttttgcgtga gccatgagaa cgaaccattg agatcatact tactttgcat gtcactcaaa 2400
aattttgcct caaaactggt gagctgaatt tttgcagtta aagcatcgtg tagtgttttt 2460
cttagtccgt tatgtaggta ggaatctgat gtaatggttg ttggtatttt gtcaccattc 2520
atttttatct ggttgttctc aagttcggtt acgagatcca tttgtctatc tagttcaact 2580
tggaaaatca acgtatcagt cgggcggcct cgcttatcaa ccaccaattt catattgctg 2640
taagtgttta aatctttact tattggtttc aaaacccatt ggttaagcct tttaaactca 2700
tggtagttat tttcaagcat taacatgaac ttaaattcat caaggctaat ctctatattt 2760
gccttgtgag ttttcttttg tgttagttct tttaataacc actcataaat cctcatagag 2820
tatttgtttt caaaagactt aacatgttcc agattatatt ttatgaattt ttttaactgg 2880
aaaagataag gcaatatctc ttcactaaaa actaattcta atttttcgct tgagaacttg 2940
gcatagtttg tccactggaa aatctcaaag cctttaacca aaggattcct gatttccaca 3000
gttctcgtca tcagctctct ggttgcttta gctaatacac cataagcatt ttccctactg 3060
atgttcatca tctgagcgta ttggttataa gtgaacgata ccgtccgttc tttccttgta 3120
gggttttcaa tcgtggggtt gagtagtgcc acacagcata aaattagctt ggtttcatgc 3180
tccgttaagt catagcgact aatcgctagt tcatttgctt tgaaaacaac taattcagac 3240
atacatctca attggtctag gtgattttaa tcactatacc aattgagatg ggctagtcaa 3300
tgataattac tagtcctttt cctttgagtt gtgggtatct gtaaattctg ctagaccttt 3360
gctggaaaac ttgtaaattc tgctagaccc tctgtaaatt ccgctagacc tttgtgtgtt 3420
ttttttgttt atattcaagt ggttataatt tatagaataa agaaagaata aaaaaagata 3480
aaaagaatag atcccagccc tgtgtataac tcactacttt agtcagttcc gcagtattac 3540
aaaaggatgt cgcaaacgct gtttgctcct ctacaaaaca gaccttaaaa ccctaaaggc 3600
ttaagtagca ccctcgcaag ctcgggcaaa tcgctgaata ttccttttgt ctccgaccat 3660
caggcacctg agtcgctgtc tttttcgtga cattcagttc gctgcgctca cggctctggc 3720
agtgaatggg ggtaaatggc actacaggcg ccttttatgg attcatgcaa ggaaactacc 3780
cataatacaa gaaaagcccg tcacgggctt ctcagggcgt tttatggcgg gtctgctatg 3840
tggtgctatc tgactttttg ctgttcagca gttcctgccc tctgattttc cagtctgacc 3900
acttcggatt atcccgtgac aggtcattca gactggctaa tgcacccagt aaggcagcgg 3960
tatcatcaac aggcttaccc gtcttactgt cgggaattca tttaaatagt caaaagcctc 4020
cgaccggagg cttttgactg ctaggcgatc tgtgctgttt gccacggtat gcagcaccag 4080
cgcgagatta tgggctcgca cgctcgactg tcggacgggg gcactggaac gagaagtcag 4140
gcgagccgtc acgcccttga caatgccaca tcctgagcaa ataattcaac cactaaacaa 4200
atcaaccgcg tttcccggag gtaaccaagc ttgcgggaga gaatgatgaa caagagccaa 4260
caagttcaga caatcaccct ggccgccgcc cagcaaatgg cggcggcggt ggaaaaaaaa 4320
gccactgaga tcaacgtggc ggtggtgttt tccgtagttg accgcggagg caacacgctg 4380
cttatccagc ggatggacga ggccttcgtc tccagctgcg atatttccct gaataaagcc 4440
tggagcgcct gcagcctgaa gcaaggtacc catgaaatta cgtcagcggt ccagccagga 4500
caatctctgt acggtctgca gctaaccaac caacagcgaa ttattatttt tggcggcggc 4560
ctgccagtta tttttaatga gcaggtaatt ggcgccgtcg gcgttagcgg cggtacggtc 4620
gagcaggatc aattattagc ccagtgcgcc ctggattgtt tttccgcatt ataacctgaa 4680
gcgagaaggt atattatgag ctatcgtatg ttccgccagg cattctgagt gttaacgagg 4740
ggaccgtcat gtcgctttca ccgccaggcg tacgcctgtt ttacgatccg cgcgggcacc 4800
atgccggcgc catcaatgag ctgtgctggg ggctggagga gcagggggtc ccctgccaga 4860
ccataaccta tgacggaggc ggtgacgccg ctgcgctggg cgccctggcg gccagaagct 4920
cgcccctgcg ggtgggtatc gggctcagcg cgtccggcga gatagccctc actcatgccc 4980
agctgccggc ggacgcgccg ctggctaccg gacacgtcac cgatagcgac gatcaactgc 5040
gtacgctcgg cgccaacgcc gggcagctgg ttaaagtcct gccgttaagt gagagaaact 5100
gaatgtatcg tatctatacc cgcaccgggg ataaaggcac caccgccctg tacggcggca 5160
gccgcatcga gaaagaccat attcgcgtcg aggcctacgg caccgtcgat gaactgatat 5220
cccagctggg cgtctgctac gccacgaccc gcgacgccgg gctgcgggaa agcctgcacc 5280
atattcagca gacgctgttc gtgctggggg ctgaactggc cagcgatgcg cggggcctga 5340
cccgcctgag ccagacgatc ggcgaagagg agatcaccgc cctggagcgg cttatcgacc 5400
gcaatatggc cgagagcggc ccgttaaaac agttcgtgat cccggggagg aatctcgcct 5460
ctgcccagct gcaccctgat gcttgcgctt gaactggcct agcaaacaca gaaaaaagcc 5520
cgcacctgac agtgcgggct ttttttttcc taggcgatct gtgctgtttg ccacggtatg 5580
cagcaccagc gcgagattat gggctcgcac gctcgactgt cggacggggg cactggaacg 5640
agaagtcagg cgagccgtca cgcccttgac aatgccacat cctgagcaaa taattcaacc 5700
actaaacaaa tcaaccgcgt ttcccggagg taaccaagct tcaccttttg agccgatgaa 5760
caatgaaaag atcaaaacga tttgcagtac tggcccagcg ccccgtcaat caggacgggc 5820
tgattggcga gtggcctgaa gaggggctga tcgccatgga cagccccttt gacccggtct 5880
cttcagtaaa agtggacaac ggtctgatcg tcgaactgga cggcaaacgc cgggaccagt 5940
ttgacatgat cgaccgattt atcgccgatt acgcgatcaa cgttgagcgc acagagcagg 6000
caatgcgcct ggaggcggtg gaaatagccc gtatgctggt ggatattcac gtcagccggg 6060
aggagatcat tgccatcact accgccatca cgccggccaa agcggtcgag gtgatggcgc 6120
agatgaacgt ggtggagatg atgatggcgc tgcagaagat gcgtgcccgc cggaccccct 6180
ccaaccagtg ccacgtcacc aatctcaaag ataatccggt gcagattgcc gctgacgccg 6240
ccgaggccgg gatccgcggc ttctcagaac aggagaccac ggtcggtatc gcgcgctacg 6300
cgccgtttaa cgccctggcg ctgttggtcg gttcgcagtg cggccgcccc ggcgtgttga 6360
cgcagtgctc ggtggaagag gccaccgagc tggagctggg catgcgtggc ttaaccagct 6420
acgccgagac ggtgtcggtc tacggcaccg aagcggtatt taccgacggc gatgatacgc 6480
cgtggtcaaa ggcgttcctc gcctcggcct acgcctcccg cgggttgaaa atgcgctaca 6540
cctccggcac cggatccgaa gcgctgatgg gctattcgga gagcaagtcg atgctctacc 6600
tcgaatcgcg ctgcatcttc attactaaag gcgccggggt tcagggactg caaaacggcg 6660
cggtgagctg tatcggcatg accggcgctg tgccgtcggg cattcgggcg gtgctggcgg 6720
aaaacctgat cgcctctatg ctcgacctcg aagtggcgtc cgccaacgac cagactttct 6780
cccactcgga tattcgccgc accgcgcgca ccctgatgca gatgctgccg ggcaccgact 6840
ttattttctc cggctacagc gcggtgccga actacgacaa catgttcgcc ggctcgaact 6900
tcgatgcgga agattttgat gattacaaca tcctgcagcg tgacctgatg gttgacggcg 6960
gcctgcgtcc ggtgaccgag gcggaaacca ttgccattcg ccagaaagcg gcgcgggcga 7020
tccaggcggt tttccgcgag ctggggctgc cgccaatcgc cgacgaggag gtggaggccg 7080
ccacctacgc gcacggcagc aacgagatgc cgccgcgtaa cgtggtggag gatctgagtg 7140
cggtggaaga gatgatgaag cgcaacatca ccggcctcga tattgtcggc gcgctgagcc 7200
gcagcggctt tgaggatatc gccagcaata ttctcaatat gctgcgccag cgggtcaccg 7260
gcgattacct gcagacctcg gccattctcg atcggcagtt cgaggtggtg agtgcggtca 7320
acgacatcaa tgactatcag gggccgggca ccggctatcg catctctgcc gaacgctggg 7380
cggagatcaa aaatattccg ggcgtggttc agcccgacac cattgaataa ggcggtattc 7440
ctgtgcaaca gacaacccaa attcagccct cttttaccct gaaaacccgc gagggcgggg 7500
tagcttctgc cgatgaacgc gccgatgaag tggtgatcgg cgtcggccct gccttcgata 7560
aacaccagca tcacactctg atcgatatgc cccatggcgc gatcctcaaa gagctgattg 7620
ccggggtgga agaagagggg cttcacgccc gggtggtgcg cattctgcgc acgtccgacg 7680
tctcctttat ggcctgggat gcggccaacc tgagcggctc ggggatcggc atcggtatcc 7740
agtcgaaggg gaccacggtc atccatcagc gcgatctgct gccgctcagc aacctggagc 7800
tgttctccca ggcgccgctg ctgacgctgg agacctaccg gcagattggc aaaaacgctg 7860
cgcgctatgc gcgcaaagag tcaccttcgc cggtgccggt ggtgaacgat cagatggtgc 7920
ggccgaaatt tatggccaaa gccgcgctat ttcatatcaa agagaccaaa catgtggtgc 7980
aggacgccga gcccgtcacc ctgcacatcg acttagtaag ggagtgacca tgagcgagaa 8040
aaccatgcgc gtgcaggatt atccgttagc cacccgctgc ccggagcata tcctgacgcc 8100
taccggcaaa ccattgaccg atattaccct cgagaaggtg ctctctggcg aggtgggccc 8160
gcaggatgtg cggatctccc gccagaccct tgagtaccag gcgcagattg ccgagcagat 8220
gcagcgccat gcggtggcgc gcaatttccg ccgcgcggcg gagcttatcg ccattcctga 8280
cgagcgcatt ctggctatct ataacgcgct gcgcccgttc cgctcctcgc aggcggagct 8340
gctggcgatc gccgacgagc tggagcacac ctggcatgcg acagtgaatg ccgcctttgt 8400
ccgggagtcg gcggaagtgt atcagcagcg gcataagctg cgtaaaggaa gctaagcgga 8460
ggtcagcatg ccgttaatag ccgggattga tatcggcaac gccaccaccg aggtggcgct 8520
ggcgtccgac tacccgcagg cgagggcgtt tgttgccagc gggatcgtcg cgacgacggg 8580
catgaaaggg acgcgggaca atatcgccgg gaccctcgcc gcgctggagc aggccctggc 8640
gaaaacaccg tggtcgatga gcgatgtctc tcgcatctat cttaacgaag ccgcgccggt 8700
gattggcgat gtggcgatgg agaccatcac cgagaccatt atcaccgaat cgaccatgat 8760
cggtcataac ccgcagacgc cgggcggggt gggcgttggc gtggggacga ctatcgccct 8820
cgggcggctg gcgacgctgc cggcggcgca gtatgccgag gggtggatcg tactgattga 8880
cgacgccgtc gatttccttg acgccgtgtg gtggctcaat gaggcgctcg accgggggat 8940
caacgtggtg gcggcgatcc tcaaaaagga cgacggcgtg ctggtgaaca accgcctgcg 9000
taaaaccctg ccggtggtgg atgaagtgac gctgctggag caggtccccg agggggtaat 9060
ggcggcggtg gaagtggccg cgccgggcca ggtggtgcgg atcctgtcga atccctacgg 9120
gatcgccacc ttcttcgggc taagcccgga agagacccag gccatcgtcc ccatcgcccg 9180
cgccctgatt ggcaaccgtt ccgcggtggt gctcaagacc ccgcaggggg atgtgcagtc 9240
gcgggtgatc ccggcgggca acctctacat tagcggcgaa aagcgccgcg gagaggccga 9300
tgtcgccgag ggcgcggaag ccatcatgca ggcgatgagc gcctgcgctc cggtacgcga 9360
catccgcggc gaaccgggca cccacgccgg cggcatgctt gagcgggtgc gcaaggtaat 9420
ggcgtccctg accggccatg agatgagcgc gatatacatc caggatctgc tggcggtgga 9480
tacgtttatt ccgcgcaagg tgcagggcgg gatggccggc gagtgcgcca tggagaatgc 9540
cgtcgggatg gcggcgatgg tgaaagcgga tcgtctgcaa atgcaggtta tcgcccgcga 9600
actgagcgcc cgactgcaga ccgaggtggt ggtgggcggc gtggaggcca acatggccat 9660
cgccggggcg ttaaccactc ccggctgtgc ggcgccgctg gcgatcctcg acctcggcgc 9720
cggctcgacg gatgcggcga tcgtcaacgc ggaggggcag ataacggcgg tccatctcgc 9780
cggggcgggg aatatggtca gcctgttgat taaaaccgag ctgggcctcg aggatctttc 9840
gctggcggaa gcgataaaaa aatacccgct ggccaaagtg gaaagcctgt tcagtattcg 9900
tcacgagaat ggcgcggtgg agttctttcg ggaagccctc agcccggcgg tgttcgccaa 9960
agtggtgtac atcaaggagg gcgaactggt gccgatcgat aacgccagcc cgctggaaaa 10020
aattcgtctc gtgcgccggc aggcgaaaga gaaagtgttt gtcaccaact gcctgcgcgc 10080
gctgcgccag gtctcacccg gcggttccat tcgcgatatc gcctttgtgg tgctggtggg 10140
cggctcatcg ctggactttg agatcccgca gcttatcacg gaagccttgt cgcactatgg 10200
cgtggtcgcc gggcagggca atattcgggg aacagaaggg ccgcgcaatg cggtcgccac 10260
cgggctgcta ctggccggtc aggcgaatta aacgggcgct cgcgccagcc tctaggtaca 10320
aataaaaaag gcacgtcaga tgacgtgcct tttttcttgt ctagcgtgca ccaatgcttc 10380
tggcgtcagg cagccatcgg aagctgtggt atggctgtgc aggtcgtaaa tcactgcata 10440
attcgtgtcg ctcaaggcgc actcccgttc tggataatgt tttttgcgcc gacatcataa 10500
cggttctggc aaatattctg aaatgagctg ttgacaatta atcatccggc tcgtataatg 10560
tgtggaattg tgagcggata acaatttcac acaggaaaca gaccatgact agtaaggagg 10620
acaattccat ggctgctgct gctgatagat taaacttaac ttccggccac ttgaatgctg 10680
gtagaaagag aagttcctct tctgtttctt tgaaggctgc cgaaaagcct ttcaaggtta 10740
ctgtgattgg atctggtaac tggggtacta ctattgccaa ggtggttgcc gaaaattgta 10800
agggataccc agaagttttc gctccaatag tacaaatgtg ggtgttcgaa gaagagatca 10860
atggtgaaaa attgactgaa atcataaata ctagacatca aaacgtgaaa tacttgcctg 10920
gcatcactct acccgacaat ttggttgcta atccagactt gattgattca gtcaaggatg 10980
tcgacatcat cgttttcaac attccacatc aatttttgcc ccgtatctgt agccaattga 11040
aaggtcatgt tgattcacac gtcagagcta tctcctgtct aaagggtttt gaagttggtg 11100
ctaaaggtgt ccaattgcta tcctcttaca tcactgagga actaggtatt caatgtggtg 11160
ctctatctgg tgctaacatt gccaccgaag tcgctcaaga acactggtct gaaacaacag 11220
ttgcttacca cattccaaag gatttcagag gcgagggcaa ggacgtcgac cataaggttc 11280
taaaggcctt gttccacaga ccttacttcc acgttagtgt catcgaagat gttgctggta 11340
tctccatctg tggtgctttg aagaacgttg ttgccttagg ttgtggtttc gtcgaaggtc 11400
taggctgggg taacaacgct tctgctgcca tccaaagagt cggtttgggt gagatcatca 11460
gattcggtca aatgtttttc ccagaatcta gagaagaaac atactaccaa gagtctgctg 11520
gtgttgctga tttgatcacc acctgcgctg gtggtagaaa cgtcaaggtt gctaggctaa 11580
tggctacttc tggtaaggac gcctgggaat gtgaaaagga gttgttgaat ggccaatccg 11640
ctcaaggttt aattacctgc aaagaagttc acgaatggtt ggaaacatgt ggctctgtcg 11700
aagacttccc attatttgaa gccgtatacc aaatcgttta caacaactac ccaatgaaga 11760
acctgccgga catgattgaa gaattagatc tacatgaaga ttagatttat tggatccagg 11820
aaacagacta gaattatggg attgactact aaacctctat ctttgaaagt taacgccgct 11880
ttgttcgacg tcgacggtac cattatcatc tctcaaccag ccattgctgc attctggagg 11940
gatttcggta aggacaaacc ttatttcgat gctgaacacg ttatccaagt ctcgcatggt 12000
tggagaacgt ttgatgccat tgctaagttc gctccagact ttgccaatga agagtatgtt 12060
aacaaattag aagctgaaat tccggtcaag tacggtgaaa aatccattga agtcccaggt 12120
gcagttaagc tgtgcaacgc tttgaacgct ctaccaaaag agaaatgggc tgtggcaact 12180
tccggtaccc gtgatatggc acaaaaatgg ttcgagcatc tgggaatcag gagaccaaag 12240
tacttcatta ccgctaatga tgtcaaacag ggtaagcctc atccagaacc atatctgaag 12300
ggcaggaatg gcttaggata tccgatcaat gagcaagacc cttccaaatc taaggtagta 12360
gtatttgaag acgctccagc aggtattgcc gccggaaaag ccgccggttg taagatcatt 12420
ggtattgcca ctactttcga cttggacttc ctaaaggaaa aaggctgtga catcattgtc 12480
aaaaaccacg aatccatcag agttggcggc tacaatgccg aaacagacga agttgaattc 12540
atttttgacg actacttata tgctaaggac gatctgttga aatggtaacc cgggctgcag 12600
gcatgcaagc ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa 12660
tcagaacgca gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc 12720
ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg 12780
tctccccatg cgagagtagg gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa 12840
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga gtaggacaaa 12900
tccgccggga gcggatttga acgttgcgaa gcaacggccc ggagggtggc gggcaggacg 12960
cccgccataa actgccaggc atcaaattaa gcagaaggcc atcctgacgg atggcctttt 13020
tgcgtttcta caaactccag ctggatcggg cgctagagta tacatttaaa tggtaccctc 13080
tagtcaaggc cttaagtgag tcgtattacg gactggccgt cgttttacaa cgtcgtgact 13140
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 13200
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 13260
gcgaatggcg cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca 13320
tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc 13380
cgccaacacc cgctgacgag ct 13402
<210> 76
<211> 14443
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 76
ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgtggga 60
attaattccc ctgctcgcgc aggctgggtg ccaagctctc gggtaacatc aaggcccgat 120
ccttggagcc cttcttacag agatgaaaaa caaaccgcga cgccaggcgg catcgcggtc 180
tcagagatat gtttacgtag atcgaagagc accggtgttt aaacgccctt gacgatgcca 240
catcctgagc aaataattca accactaaac aaatcaaccg cgtttcccgg aggtaaccga 300
gctcatgatc ctgtgttgtg gtgaagccct gatcgacatg ctgccccggc agacgacgct 360
gggtgaggcg ggctttgccc cttacgcagg cggagcggtc ttcaacacgg caattgcgct 420
ggggcgtctt ggcgtccctt cagccttttt taccggtctt tccgacgaca tgatgggcga 480
tatcctgcgg gagaccctgc gggccagcaa ggtggatttc agctattgcg ccaccctgtc 540
gcgccccacc accattgcgt tcgttaagct ggttgatggc catgcgacct acgcttttta 600
cgacgagaac accgccggcc ggatgatcac cgaggccgaa cttccggcct tgggagcgga 660
ttgcgaagcg ctgcatttcg gcgccatcag ccttattccc gaaccctgcg gcagcaccta 720
tgaggcgctg atgacgcgcg agcatgagac ccgcgtcatc tcgctcgatc cgaacattcg 780
tcccggcttc atccagaaca agcagtcgca catggcccgc atccgccgca tggcggcgat 840
gtctgacatc gtcaagttct cggatgagga cctggcgtgg ttcggtctgg aaggcgacga 900
ggacacgctt gcccgccact ggctgcacca cggtgcaaaa ctcgtcgttg tcacccgtgg 960
cgccaagggt gccgtgggtt acagcgccaa tctcaaggtg gaagtggcct ccgagcgcgt 1020
cgaagtggtc gatacggtcg gcgccggcga tacgttcgat gccggcattc ttgcttcgct 1080
gaaaatgcag ggcctgctga ccaaagcgca ggtggcttcg ctgagcgaag agcagatcag 1140
aaaagctttg gcgcttggcg cgaaagccgc tgcggtcact gtctcgcggg ctggcgcaaa 1200
tccgcctttc gcgcatgaaa tcggtttgtg attaattaaa gcacgcagtc aaacaaaaaa 1260
cccgcgccat tgcgcgggtt tttttatgcc cgaaggcgcg ccagcacgca gtcaaacaaa 1320
aaacccgcgc cattgcgcgg gtttttttat gcccgaacgg ccgaggtctt ccgatctcct 1380
gaagccaggg cagatccgtg cacagcacct tgccgtagaa gaacagcaag gccgccaatg 1440
cctgacgatg cgtggagacc gaaaccttgc gctcgttcgc cagccaggac agaaatgcct 1500
cgacttcgct gctgcccaag gttgccgggt gacgcacacc gtggaaacgg atgaaggcac 1560
gaacccagtg gacataagcc tgttcggttc gtaagctgta atgcaagtag cgtatgcgct 1620
cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg taacggcgca gtggcggttt 1680
tcatggcttg ttatgactgt ttttttgggg tacagtctat gcctcgggca tccaagcagc 1740
aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat gttacgcagc 1800
agggcagtcg ccctaaaaca aagttaaaca tcatgaggga agcggtgatc gccgaagtat 1860
cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg acgttgctgg 1920
ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt gatattgatt 1980
tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg atcaacgacc 2040
ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta gaagtcacca 2100
ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa ctgcaatttg 2160
gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg atcgacattg 2220
atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta ggtccagcgg 2280
cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta aatgaaacct 2340
taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta gtgcttacgt 2400
tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat gtcgctgccg 2460
actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa gctagacagg 2520
cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc agatcagttg gaagaatttg 2580
tccactacgt gaaaggcgag atcaccaagg tagtcggcaa ataatgtcta acaattcgtt 2640
caagccgacg ccgcttcgcg gcgcggctta actcaagcgt tagatgcact aagcacataa 2700
ttgctcacag ccaaactatc aggtcaagtc tgcttttatt atttttaagc gtgcataata 2760
agccctacac aaattgggag atatatcatg aaaggctggc tttttcttgt tatcgcaata 2820
gttggcgaag taatcgcaac atccgcatta aaatctagcg agggctttac taagctcgtc 2880
agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 2940
gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 3000
caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 3060
ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 3120
gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtccgtaat acgactcact 3180
taaggccttg actagagggt accatttaaa tgtatactct agcgcccgat ccagctggag 3240
tttgtagaaa cgcaaaaagg ccatccgtca ggatggcctt ctgcttaatt tgatgcctgg 3300
cagtttatgg cgggcgtcct gcccgccacc ctccgggccg ttgcttcgca acgttcaaat 3360
ccgctcccgg cggatttgtc ctactcagga gagcgttcac cgacaaacaa cagataaaac 3420
gaaaggccca gtctttcgac tgagcctttc gttttatttg atgcctggca gttccctact 3480
ctcgcatggg gagaccccac actaccatcg gcgctacggc gtttcacttc tgagttcggc 3540
atggggtcag gtgggaccac cgcgctactg ccgccaggca aattctgttt tatcagaccg 3600
cttctgcgtt ctgatttaat ctgtatcagg ctgaaaatct tctctcatcc gccaaaacag 3660
ccaagcttgc atgcctgcag cccgggttac catttcaaca gatcgtcctt agcatataag 3720
tagtcgtcaa aaatgaattc aacttcgtct gtttcggcat tgtagccgcc aactctgatg 3780
gattcgtggt ttttgacaat gatgtcacag cctttttcct ttaggaagtc caagtcgaaa 3840
gtagtggcaa taccaatgat cttacaaccg gcggcttttc cggcggcaat acctgctgga 3900
gcgtcttcaa atactactac cttagatttg gaagggtctt gctcattgat cggatatcct 3960
aagccattcc tgcccttcag atatggttct ggatgaggct taccctgttt gacatcatta 4020
gcggtaatga agtactttgg tctcctgatt cccagatgct cgaaccattt ttgtgccata 4080
tcacgggtac cggaagttgc cacagcccat ttctcttttg gtagagcgtt caaagcgttg 4140
cacagcttaa ctgcacctgg gacttcaatg gatttttcac cgtacttgac cggaatttca 4200
gcttctaatt tgttaacata ctcttcattg gcaaagtctg gagcgaactt agcaatggca 4260
tcaaacgttc tccaaccatg cgagacttgg ataacgtgtt cagcatcgaa ataaggtttg 4320
tccttaccga aatccctcca gaatgcagca atggctggtt gagagatgat aatggtaccg 4380
tcgacgtcga acaaagcggc gttaactttc aaagatagag gtttagtagt caatcccata 4440
attctagtct gtttcctgga tccaataaat ctaatcttca tgtagatcta attcttcaat 4500
catgtccggc aggttcttca ttgggtagtt gttgtaaacg atttggtata cggcttcaaa 4560
taatgggaag tcttcgacag agccacatgt ttccaaccat tcgtgaactt ctttgcaggt 4620
aattaaacct tgagcggatt ggccattcaa caactccttt tcacattccc aggcgtcctt 4680
accagaagta gccattagcc tagcaacctt gacgtttcta ccaccagcgc aggtggtgat 4740
caaatcagca acaccagcag actcttggta gtatgtttct tctctagatt ctgggaaaaa 4800
catttgaccg aatctgatga tctcacccaa accgactctt tggatggcag cagaagcgtt 4860
gttaccccag cctagacctt cgacgaaacc acaacctaag gcaacaacgt tcttcaaagc 4920
accacagatg gagataccag caacatcttc gatgacacta acgtggaagt aaggtctgtg 4980
gaacaaggcc tttagaacct tatggtcgac gtccttgccc tcgcctctga aatcctttgg 5040
aatgtggtaa gcaactgttg tttcagacca gtgttcttga gcgacttcgg tggcaatgtt 5100
agcaccagat agagcaccac attgaatacc tagttcctca gtgatgtaag aggatagcaa 5160
ttggacacct ttagcaccaa cttcaaaacc ctttagacag gagatagctc tgacgtgtga 5220
atcaacatga cctttcaatt ggctacagat acggggcaaa aattgatgtg gaatgttgaa 5280
aacgatgatg tcgacatcct tgactgaatc aatcaagtct ggattagcaa ccaaattgtc 5340
gggtagagtg atgccaggca agtatttcac gttttgatgt ctagtattta tgatttcagt 5400
caatttttca ccattgatct cttcttcgaa cacccacatt tgtactattg gagcgaaaac 5460
ttctgggtat cccttacaat tttcggcaac caccttggca atagtagtac cccagttacc 5520
agatccaatc acagtaacct tgaaaggctt ttcggcagcc ttcaaagaaa cagaagagga 5580
acttctcttt ctaccagcat tcaagtggcc ggaagttaag tttaatctat cagcagcagc 5640
agccatggaa ttgtcctcct tactagtcat ggtctgtttc ctgtgtgaaa ttgttatccg 5700
ctcacaattc cacacattat acgagccgga tgattaattg tcaacagctc atttcagaat 5760
atttgccaga accgttatga tgtcggcgca aaaaacatta tccagaacgg gagtgcgcct 5820
tgagcgacac gaattatgca gtgatttacg acctgcacag ccataccaca gcttccgatg 5880
gctgcctgac gccagaagca ttggtgcacg ctagacaaga aaaaaggcac gtcatctgac 5940
gtgccttttt tatttgtacc tagaggctgg cgcgagcgcc cgtttaattc gcctgaccgg 6000
ccagtagcag cccggtggcg accgcattgc gcggcccttc tgttccccga atattgccct 6060
gcccggcgac cacgccatag tgcgacaagg cttccgtgat aagctgcggg atctcaaagt 6120
ccagcgatga gccgcccacc agcaccacaa aggcgatatc gcgaatggaa ccgccgggtg 6180
agacctggcg cagcgcgcgc aggcagttgg tgacaaacac tttctctttc gcctgccggc 6240
gcacgagacg aattttttcc agcgggctgg cgttatcgat cggcaccagt tcgccctcct 6300
tgatgtacac cactttggcg aacaccgccg ggctgagggc ttcccgaaag aactccaccg 6360
cgccattctc gtgacgaata ctgaacaggc tttccacttt ggccagcggg tattttttta 6420
tcgcttccgc cagcgaaaga tcctcgaggc ccagctcggt tttaatcaac aggctgacca 6480
tattccccgc cccggcgaga tggaccgccg ttatctgccc ctccgcgttg acgatcgccg 6540
catccgtcga gccggcgccg aggtcgagga tcgccagcgg cgccgcacag ccgggagtgg 6600
ttaacgcccc ggcgatggcc atgttggcct ccacgccgcc caccaccacc tcggtctgca 6660
gtcgggcgct cagttcgcgg gcgataacct gcatttgcag acgatccgct ttcaccatcg 6720
ccgccatccc gacggcattc tccatggcgc actcgccggc catcccgccc tgcaccttgc 6780
gcggaataaa cgtatccacc gccagcagat cctggatgta tatcgcgctc atctcatggc 6840
cggtcaggga cgccattacc ttgcgcaccc gctcaagcat gccgccggcg tgggtgcccg 6900
gttcgccgcg gatgtcgcgt accggagcgc aggcgctcat cgcctgcatg atggcttccg 6960
cgccctcggc gacatcggcc tctccgcggc gcttttcgcc gctaatgtag aggttgcccg 7020
ccgggatcac ccgcgactgc acatccccct gcggggtctt gagcaccacc gcggaacggt 7080
tgccaatcag ggcgcgggcg atggggacga tggcctgggt ctcttccggg cttagcccga 7140
agaaggtggc gatcccgtag ggattcgaca ggatccgcac cacctggccc ggcgcggcca 7200
cttccaccgc cgccattacc ccctcgggga cctgctccag cagcgtcact tcatccacca 7260
ccggcagggt tttacgcagg cggttgttca ccagcacgcc gtcgtccttt ttgaggatcg 7320
ccgccaccac gttgatcccc cggtcgagcg cctcattgag ccaccacacg gcgtcaagga 7380
aatcgacggc gtcgtcaatc agtacgatcc acccctcggc atactgcgcc gccggcagcg 7440
tcgccagccg cccgagggcg atagtcgtcc ccacgccaac gcccaccccg cccggcgtct 7500
gcgggttatg accgatcatg gtcgattcgg tgataatggt ctcggtgatg gtctccatcg 7560
ccacatcgcc aatcaccggc gcggcttcgt taagatagat gcgagagaca tcgctcatcg 7620
accacggtgt tttcgccagg gcctgctcca gcgcggcgag ggtcccggcg atattgtccc 7680
gcgtcccttt catgcccgtc gtcgcgacga tcccgctggc aacaaacgcc ctcgcctgcg 7740
ggtagtcgga cgccagcgcc acctcggtgg tggcgttgcc gatatcaatc ccggctatta 7800
acggcatgct gacctccgct tagcttcctt tacgcagctt atgccgctgc tgatacactt 7860
ccgccgactc ccggacaaag gcggcattca ctgtcgcatg ccaggtgtgc tccagctcgt 7920
cggcgatcgc cagcagctcc gcctgcgagg agcggaacgg gcgcagcgcg ttatagatag 7980
ccagaatgcg ctcgtcagga atggcgataa gctccgccgc gcggcggaaa ttgcgcgcca 8040
ccgcatggcg ctgcatctgc tcggcaatct gcgcctggta ctcaagggtc tggcgggaga 8100
tccgcacatc ctgcgggccc acctcgccag agagcacctt ctcgagggta atatcggtca 8160
atggtttgcc ggtaggcgtc aggatatgct ccgggcagcg ggtggctaac ggataatcct 8220
gcacgcgcat ggttttctcg ctcatggtca ctcccttact aagtcgatgt gcagggtgac 8280
gggctcggcg tcctgcacca catgtttggt ctctttgata tgaaatagcg cggctttggc 8340
cataaatttc ggccgcacca tctgatcgtt caccaccggc accggcgaag gtgactcttt 8400
gcgcgcatag cgcgcagcgt ttttgccaat ctgccggtag gtctccagcg tcagcagcgg 8460
cgcctgggag aacagctcca ggttgctgag cggcagcaga tcgcgctgat ggatgaccgt 8520
ggtccccttc gactggatac cgatgccgat ccccgagccg ctcaggttgg ccgcatccca 8580
ggccataaag gagacgtcgg acgtgcgcag aatgcgcacc acccgggcgt gaagcccctc 8640
ttcttccacc ccggcaatca gctctttgag gatcgcgcca tggggcatat cgatcagagt 8700
gtgatgctgg tgtttatcga aggcagggcc gacgccgatc accacttcat cggcgcgttc 8760
atcggcagaa gctaccccgc cctcgcgggt tttcagggta aaagagggct gaatttgggt 8820
tgtctgttgc acaggaatac cgccttgttc aatggtgtcg ggctgaacca cgcccggaat 8880
atttttgatc tccgcccagc gttcggcaga gatgcgatag ccggtgcccg gcccctgata 8940
gtcattgatg tcgttgaccg cactcaccac ctcgaactgc cgatcgaaaa tggccgaggt 9000
ctgcaggtaa tcgccggtga cccgctggcg cagcatattg agaatattgc tggcgatatc 9060
ctcaaagccg ctgcggctca gcgcgccgac aatatcgagg ccggtgatgt tgcgcttcat 9120
catctcttcc accgcactca gatcctccac cacgttacgc ggcggcatct cgttgctgcc 9180
gtgcgcgtag gtggcggcct ccacctcctc gtcggcgatt ggcggcagcc ccagctcgcg 9240
gaaaaccgcc tggatcgccc gcgccgcttt ctggcgaatg gcaatggttt ccgcctcggt 9300
caccggacgc aggccgccgt caaccatcag gtcacgctgc aggatgttgt aatcatcaaa 9360
atcttccgca tcgaagttcg agccggcgaa catgttgtcg tagttcggca ccgcgctgta 9420
gccggagaaa ataaagtcgg tgcccggcag catctgcatc agggtgcgcg cggtgcggcg 9480
aatatccgag tgggagaaag tctggtcgtt ggcggacgcc acttcgaggt cgagcataga 9540
ggcgatcagg ttttccgcca gcaccgcccg aatgcccgac ggcacagcgc cggtcatgcc 9600
gatacagctc accgcgccgt tttgcagtcc ctgaaccccg gcgcctttag taatgaagat 9660
gcagcgcgat tcgaggtaga gcatcgactt gctctccgaa tagcccatca gcgcttcgga 9720
tccggtgccg gaggtgtagc gcattttcaa cccgcgggag gcgtaggccg aggcgaggaa 9780
cgcctttgac cacggcgtat catcgccgtc ggtaaatacc gcttcggtgc cgtagaccga 9840
caccgtctcg gcgtagctgg ttaagccacg catgcccagc tccagctcgg tggcctcttc 9900
caccgagcac tgcgtcaaca cgccggggcg gccgcactgc gaaccgacca acagcgccag 9960
ggcgttaaac ggcgcgtagc gcgcgatacc gaccgtggtc tcctgttctg agaagccgcg 10020
gatcccggcc tcggcggcgt cagcggcaat ctgcaccgga ttatctttga gattggtgac 10080
gtggcactgg ttggaggggg tccggcgggc acgcatcttc tgcagcgcca tcatcatctc 10140
caccacgttc atctgcgcca tcacctcgac cgctttggcc ggcgtgatgg cggtagtgat 10200
ggcaatgatc tcctcccggc tgacgtgaat atccaccagc atacgggcta tttccaccgc 10260
ctccaggcgc attgcctgct ctgtgcgctc aacgttgatc gcgtaatcgg cgataaatcg 10320
gtcgatcatg tcaaactggt cccggcgttt gccgtccagt tcgacgatca gaccgttgtc 10380
cacttttact gaagagaccg ggtcaaaggg gctgtccatg gcgatcagcc cctcttcagg 10440
ccactcgcca atcagcccgt cctgattgac ggggcgctgg gccagtactg caaatcgttt 10500
tgatcttttc attgttcatc ggctcaaaag gtgaagcttg gttacctccg ggaaacgcgg 10560
ttgatttgtt tagtggttga attatttgct caggatgtgg cattgtcaag ggcgtgacgg 10620
ctcgcctgac ttctcgttcc agtgcccccg tccgacagtc gagcgtgcga gcccataatc 10680
tcgcgctggt gctgcatacc gtggcaaaca gcacagatcg cctaggaaaa aaaaagcccg 10740
cactgtcagg tgcgggcttt tttctgtgtt tgctaggcca gttcaagcgc aagcatcagg 10800
gtgcagctgg gcagaggcga gattcctccc cgggatcacg aactgtttta acgggccgct 10860
ctcggccata ttgcggtcga taagccgctc cagggcggtg atctcctctt cgccgatcgt 10920
ctggctcagg cgggtcaggc cccgcgcatc gctggccagt tcagccccca gcacgaacag 10980
cgtctgctga atatggtgca ggctttcccg cagcccggcg tcgcgggtcg tggcgtagca 11040
gacgcccagc tgggatatca gttcatcgac ggtgccgtag gcctcgacgc gaatatggtc 11100
tttctcgatg cggctgccgc cgtacagggc ggtggtgcct ttatccccgg tgcgggtata 11160
gatacgatac attcagtttc tctcacttaa cggcaggact ttaaccagct gcccggcgtt 11220
ggcgccgagc gtacgcagtt gatcgtcgct atcggtgacg tgtccggtag ccagcggcgc 11280
gtccgccggc agctgggcat gagtgagggc tatctcgccg gacgcgctga gcccgatacc 11340
cacccgcagg ggcgagcttc tggccgccag ggcgcccagc gcagcggcgt caccgcctcc 11400
gtcataggtt atggtctggc aggggacccc ctgctcctcc agcccccagc acagctcatt 11460
gatggcgccg gcatggtgcc cgcgcggatc gtaaaacagg cgtacgcctg gcggtgaaag 11520
cgacatgacg gtcccctcgt taacactcag aatgcctggc ggaacatacg atagctcata 11580
atataccttc tcgcttcagg ttataatgcg gaaaaacaat ccagggcgca ctgggctaat 11640
aattgatcct gctcgaccgt accgccgcta acgccgacgg cgccaattac ctgctcatta 11700
aaaataactg gcaggccgcc gccaaaaata ataattcgct gttggttggt tagctgcaga 11760
ccgtacagag attgtcctgg ctggaccgct gacgtaattt catgggtacc ttgcttcagg 11820
ctgcaggcgc tccaggcttt attcagggaa atatcgcagc tggagacgaa ggcctcgtcc 11880
atccgctgga taagcagcgt gttgcctccg cggtcaacta cggaaaacac caccgccacg 11940
ttgatctcag tggctttttt ttccaccgcc gccgccattt gctgggcggc ggccagggtg 12000
attgtctgaa cttgttggct cttgttcatc attctctccc gcaagcttgg ttacctccgg 12060
gaaacgcggt tgatttgttt agtggttgaa ttatttgctc aggatgtggc attgtcaagg 12120
gcgtgacggc tcgcctgact tctcgttcca gtgcccccgt ccgacagtcg agcgtgcgag 12180
cccataatct cgcgctggtg ctgcataccg tggcaaacag cacagatcgc ctagcagtca 12240
aaagcctccg gtcggaggct tttgactatt taaatgaatt cccgacagta agacgggtaa 12300
gcctgttgat gataccgctg ccttactggg tgcattagcc agtctgaatg acctgtcacg 12360
ggataatccg aagtggtcag actggaaaat cagagggcag gaactgctga acagcaaaaa 12420
gtcagatagc accacatagc agacccgcca taaaacgccc tgagaagccc gtgacgggct 12480
tttcttgtat tatgggtagt ttccttgcat gaatccataa aaggcgcctg tagtgccatt 12540
tacccccatt cactgccaga gccgtgagcg cagcgaactg aatgtcacga aaaagacagc 12600
gactcaggtg cctgatggtc ggagacaaaa ggaatattca gcgatttgcc cgagcttgcg 12660
agggtgctac ttaagccttt agggttttaa ggtctgtttt gtagaggagc aaacagcgtt 12720
tgcgacatcc ttttgtaata ctgcggaact gactaaagta gtgagttata cacagggctg 12780
ggatctattc tttttatctt tttttattct ttctttattc tataaattat aaccacttga 12840
atataaacaa aaaaaacaca caaaggtcta gcggaattta cagagggtct agcagaattt 12900
acaagttttc cagcaaaggt ctagcagaat ttacagatac ccacaactca aaggaaaagg 12960
actagtaatt atcattgact agcccatctc aattggtata gtgattaaaa tcacctagac 13020
caattgagat gtatgtctga attagttgtt ttcaaagcaa atgaactagc gattagtcgc 13080
tatgacttaa cggagcatga aaccaagcta attttatgct gtgtggcact actcaacccc 13140
acgattgaaa accctacaag gaaagaacgg acggtatcgt tcacttataa ccaatacgct 13200
cagatgatga acatcagtag ggaaaatgct tatggtgtat tagctaaagc aaccagagag 13260
ctgatgacga gaactgtgga aatcaggaat cctttggtta aaggctttga gattttccag 13320
tggacaaact atgccaagtt ctcaagcgaa aaattagaat tagtttttag tgaagagata 13380
ttgccttatc ttttccagtt aaaaaaattc ataaaatata atctggaaca tgttaagtct 13440
tttgaaaaca aatactctat gaggatttat gagtggttat taaaagaact aacacaaaag 13500
aaaactcaca aggcaaatat agagattagc cttgatgaat ttaagttcat gttaatgctt 13560
gaaaataact accatgagtt taaaaggctt aaccaatggg ttttgaaacc aataagtaaa 13620
gatttaaaca cttacagcaa tatgaaattg gtggttgata agcgaggccg cccgactgat 13680
acgttgattt tccaagttga actagataga caaatggatc tcgtaaccga acttgagaac 13740
aaccagataa aaatgaatgg tgacaaaata ccaacaacca ttacatcaga ttcctaccta 13800
cataacggac taagaaaaac actacacgat gctttaactg caaaaattca gctcaccagt 13860
tttgaggcaa aatttttgag tgacatgcaa agtaagtatg atctcaatgg ttcgttctca 13920
tggctcacgc aaaaacaacg aaccacacta gagaacatac tggctaaata cggaaggatc 13980
tgaggttctt atggctcttg tatctatcag tgaagcatca agactaacaa acaaaagtag 14040
aacaactgtt caccgttaca tatcaaaggg aaaactgtcc atatgcacag atgaaaacgg 14100
tgtaaaaaag atagatacat cagagctttt acgagttttt ggtgcattca aagctgttca 14160
ccatgaacag atcgacaatg taacagatga acagcatgta acacctaata gaacaggtga 14220
aaccagtaaa acaaagcaac tagaacatga aattgaacac ctgagacaac ttgttacagc 14280
tcaacagtca cacatagaca gcctgaaaca ggcgatgctg cttatcgaat caaagctgcc 14340
gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa tcatggcaat tctggaagaa 14400
atagcgcttt cagccggcaa accggctgaa gccggatctg cga 14443
<210> 77
<211> 1407
<212> DNA
<213> Escherichia coli
<400> 77
atgggcaaag ggagaacatc gatgagtcac atcacaacgg aagatccagc aactttacgc 60
ctgcccttta aagagaaact ctcttacggt attggcgacc tggcctctaa catcctgctg 120
gatatcggta cgctttatct tttgaagttt tataccgacg ttctggggct gccaggcacc 180
tatggcggca ttatcttttt gatttcaaaa ttctttactg cgtttaccga tatgggtacc 240
ggcattatgt tggattcccg acgcaagatc ggtccaaaag gtaagttccg tccttttatt 300
ctgtatgcgt cattcccggt caccttactg gcgatcgcca actttgtcgg cacaccgttt 360
gatgtcaccg gtaaaacggt gatggccact attctgttta tgctttacgg actgtttttc 420
agcatgatga actgctccta cggcgcaatg gttcccgcta tcaccaaaaa ccccaacgaa 480
cgcgcctcac tggcggcatg gcgtcagggc ggcgctacgc tgggcctgct gctgtgcacg 540
gtgggattcg tgccagttat gaatcttatc gaaggtaatc agcaacttgg ctatatcttc 600
gccgccacgc tgttttcact gtttggcctg ctgtttatgt ggatctgcta ctcgggcgtg 660
aaagagcgtt atgtcgaaac ccagcctgct aatccggcgc aaaagccggg cctgctgcaa 720
tctttccgcg caattgcggg taaccgcccg ctgttcattc tgtgcattgc caacctctgc 780
actttagggg cgtttaacgt caagctcgcc atccaggtct attacaccca gtacgtgctt 840
aacgatccca tcctgttgtc gtatatggga tttttcagca tgggctgtat tttcatcggc 900
gtattcctga tgcctgcctc agtcagacgt tttggcaaga agaaagttta tatcggcggc 960
ctgctgattt gggtgctggg cgatctgctc aactatttct tcggcggcgg ttcggtcagc 1020
ttcgtggcgt tctcctgcct ggcgttcttt ggctcagcgt ttgttaacag cctgaactgg 1080
gcgctggttt ccgacaccgt cgagtacggc gagtggcgca ccggcgtgcg ttcggaagga 1140
acggtctaca ccggttttac cttctttcgc aaagtgtctc aggcgctggc tggtttcttc 1200
cccggctgga tgctgacgca aattggctat gtgccgaacg tcgcacaggc tgaccacacc 1260
attgaagggt tacgccagtt gatcttcatc tacccaagcg cactggcggt agtcaccatt 1320
gtggcgatgg gttgcttcta cagcctgaac gagaagatgt atgtccgcat tgtggaagag 1380
atagaagccc gtaaacgcac ggcgtaa 1407
<210> 78
<211> 468
<212> PRT
<213> Escherichia coli
<400> 78
Met Gly Lys Gly Arg Thr Ser Met Ser His Ile Thr Thr Glu Asp Pro
1 5 10 15
Ala Thr Leu Arg Leu Pro Phe Lys Glu Lys Leu Ser Tyr Gly Ile Gly
20 25 30
Asp Leu Ala Ser Asn Ile Leu Leu Asp Ile Gly Thr Leu Tyr Leu Leu
35 40 45
Lys Phe Tyr Thr Asp Val Leu Gly Leu Pro Gly Thr Tyr Gly Gly Ile
50 55 60
Ile Phe Leu Ile Ser Lys Phe Phe Thr Ala Phe Thr Asp Met Gly Thr
65 70 75 80
Gly Ile Met Leu Asp Ser Arg Arg Lys Ile Gly Pro Lys Gly Lys Phe
85 90 95
Arg Pro Phe Ile Leu Tyr Ala Ser Phe Pro Val Thr Leu Leu Ala Ile
100 105 110
Ala Asn Phe Val Gly Thr Pro Phe Asp Val Thr Gly Lys Thr Val Met
115 120 125
Ala Thr Ile Leu Phe Met Leu Tyr Gly Leu Phe Phe Ser Met Met Asn
130 135 140
Cys Ser Tyr Gly Ala Met Val Pro Ala Ile Thr Lys Asn Pro Asn Glu
145 150 155 160
Arg Ala Ser Leu Ala Ala Trp Arg Gln Gly Gly Ala Thr Leu Gly Leu
165 170 175
Leu Leu Cys Thr Val Gly Phe Val Pro Val Met Asn Leu Ile Glu Gly
180 185 190
Asn Gln Gln Leu Gly Tyr Ile Phe Ala Ala Thr Leu Phe Ser Leu Phe
195 200 205
Gly Leu Leu Phe Met Trp Ile Cys Tyr Ser Gly Val Lys Glu Arg Tyr
210 215 220
Val Glu Thr Gln Pro Ala Asn Pro Ala Gln Lys Pro Gly Leu Leu Gln
225 230 235 240
Ser Phe Arg Ala Ile Ala Gly Asn Arg Pro Leu Phe Ile Leu Cys Ile
245 250 255
Ala Asn Leu Cys Thr Leu Gly Ala Phe Asn Val Lys Leu Ala Ile Gln
260 265 270
Val Tyr Tyr Thr Gln Tyr Val Leu Asn Asp Pro Ile Leu Leu Ser Tyr
275 280 285
Met Gly Phe Phe Ser Met Gly Cys Ile Phe Ile Gly Val Phe Leu Met
290 295 300
Pro Ala Ser Val Arg Arg Phe Gly Lys Lys Lys Val Tyr Ile Gly Gly
305 310 315 320
Leu Leu Ile Trp Val Leu Gly Asp Leu Leu Asn Tyr Phe Phe Gly Gly
325 330 335
Gly Ser Val Ser Phe Val Ala Phe Ser Cys Leu Ala Phe Phe Gly Ser
340 345 350
Ala Phe Val Asn Ser Leu Asn Trp Ala Leu Val Ser Asp Thr Val Glu
355 360 365
Tyr Gly Glu Trp Arg Thr Gly Val Arg Ser Glu Gly Thr Val Tyr Thr
370 375 380
Gly Phe Thr Phe Phe Arg Lys Val Ser Gln Ala Leu Ala Gly Phe Phe
385 390 395 400
Pro Gly Trp Met Leu Thr Gln Ile Gly Tyr Val Pro Asn Val Ala Gln
405 410 415
Ala Asp His Thr Ile Glu Gly Leu Arg Gln Leu Ile Phe Ile Tyr Pro
420 425 430
Ser Ala Leu Ala Val Val Thr Ile Val Ala Met Gly Cys Phe Tyr Ser
435 440 445
Leu Asn Glu Lys Met Tyr Val Arg Ile Val Glu Glu Ile Glu Ala Arg
450 455 460
Lys Arg Thr Ala
465
<210> 79
<211> 2037
<212> DNA
<213> Escherichia coli
<400> 79
atggatacgc cacgtccaca gttattagat tttcaatttc atcagaataa cgacagtttt 60
accctacatt ttcaacaacg tcttatttta acccatagca aagataatcc ttgtttatgg 120
attggctcag gtatagcgga tatcgatatg ttccgcggta atttcagcat taaagataaa 180
ctacaggaga aaattgcgct taccgacgcc atcgtcagcc agtcaccgga tggttggtta 240
attcatttca gccgtggttc tgacattagc gccacgctga atatctctgc cgacgatcag 300
gggcgtttat tgctggaact acaaaacgac aaccttaacc acaaccgtat ctggctgcgc 360
cttgccgctc aaccagagga ccatatctac ggctgcggcg aacagttttc ctacttcgat 420
ctgcgtggca aaccgttccc gctatggacc agtgaacaag gcgttggtcg caacaaacaa 480
acctatgtca cctggcaggc cgactgcaaa gaaaatgcgg gcggcgacta ttactggact 540
ttcttcccac agcctacgtt tgtcagcacg cagaagtatt actgccatgt tgataacagt 600
tgctatatga acttcgactt tagtgccccg gaataccatg aactggcgct gtgggaagac 660
aaagcaacgc tgcgttttga atgtgctgac acatacattt ccctgctgga aaaattaacc 720
gccctgctgg gacgccagcc agaactgccc gactggattt atgacggagt aacgctcggc 780
attcagggcg ggacggaagt gtgccagaag aaactggaca ccatgcgtaa cgcgggcgtg 840
aaggtcaacg gcatctgggc gcaggactgg tccggtattc gtatgacctc ttttggcaaa 900
cgcgtgatgt ggaactggaa gtggaacagc gaaaactacc cgcaactgga ttcacgcatt 960
aagcagtgga atcaggaggg cgtgcagttc ctggcctata tcaacccgta tgttgccagc 1020
gataaagatc tctgcgaaga agcggcacaa cacggctatc tggcaaaaga tgcctctggc 1080
ggtgactatc tggtggagtt tggcgagttt tacggcggcg ttgtcgatct cactaatcca 1140
gaagcctacg cctggttcaa ggaagtgatc aaaaagaaca tgattgaact cggctgcggc 1200
ggctggatgg ctgacttcgg cgagtatctg cccaccgaca cgtacttgca taacggcgtc 1260
agtgccgaaa ttatgcataa cgcctggcct gcgctgtggg cgaagtgtaa ctacgaagcc 1320
cttgaagaaa cgggcaagct cggcgagatc cttttcttta tgcgcgccgg ttctaccggt 1380
agccagaaat actccaccat gatgtgggcg ggcgaccaga acgtcgactg gagtctcgac 1440
gatggcctgg cgtcggttgt cccggcggcg ctgtcgctgg caatgaccgg acatggcctg 1500
caccacagcg acattggcgg ttacaccacc ctgtttgaga tgaagcgcag caaagagctg 1560
ctgctgcgct ggtgcgattt cagcgccttc acgccgatga tgcgcaccca cgaaggtaac 1620
cgtcctggcg acaactggca gtttgacggc gacgcagaaa ccatcgccca tttcgcccgt 1680
atgaccaccg tcttcaccac cctgaaacct tacctgaaag aggccgtcgc gctgaatgcg 1740
aagtccggcc tgccggttat gcgcccgctg ttcctgcatt acgaagacga tgcgcacact 1800
tacaccctga aatatcagta cctgttaggt cgcgacattc tggtcgctcc ggtgcatgaa 1860
gaaggccgta gcgactggac gctctatctg ccggaggata actgggtcca cgcctggacg 1920
ggtgaagcgt tccggggcgg ggaagttacc gttaatgcgc ccatcggcaa gccgccggtc 1980
ttttatcgcg ccgatagcga atgggcggca ctgttcgcgt cgttaaaaag catctaa 2037
<210> 80
<211> 678
<212> PRT
<213> Escherichia coli
<400> 80
Met Asp Thr Pro Arg Pro Gln Leu Leu Asp Phe Gln Phe His Gln Asn
1 5 10 15
Asn Asp Ser Phe Thr Leu His Phe Gln Gln Arg Leu Ile Leu Thr His
20 25 30
Ser Lys Asp Asn Pro Cys Leu Trp Ile Gly Ser Gly Ile Ala Asp Ile
35 40 45
Asp Met Phe Arg Gly Asn Phe Ser Ile Lys Asp Lys Leu Gln Glu Lys
50 55 60
Ile Ala Leu Thr Asp Ala Ile Val Ser Gln Ser Pro Asp Gly Trp Leu
65 70 75 80
Ile His Phe Ser Arg Gly Ser Asp Ile Ser Ala Thr Leu Asn Ile Ser
85 90 95
Ala Asp Asp Gln Gly Arg Leu Leu Leu Glu Leu Gln Asn Asp Asn Leu
100 105 110
Asn His Asn Arg Ile Trp Leu Arg Leu Ala Ala Gln Pro Glu Asp His
115 120 125
Ile Tyr Gly Cys Gly Glu Gln Phe Ser Tyr Phe Asp Leu Arg Gly Lys
130 135 140
Pro Phe Pro Leu Trp Thr Ser Glu Gln Gly Val Gly Arg Asn Lys Gln
145 150 155 160
Thr Tyr Val Thr Trp Gln Ala Asp Cys Lys Glu Asn Ala Gly Gly Asp
165 170 175
Tyr Tyr Trp Thr Phe Phe Pro Gln Pro Thr Phe Val Ser Thr Gln Lys
180 185 190
Tyr Tyr Cys His Val Asp Asn Ser Cys Tyr Met Asn Phe Asp Phe Ser
195 200 205
Ala Pro Glu Tyr His Glu Leu Ala Leu Trp Glu Asp Lys Ala Thr Leu
210 215 220
Arg Phe Glu Cys Ala Asp Thr Tyr Ile Ser Leu Leu Glu Lys Leu Thr
225 230 235 240
Ala Leu Leu Gly Arg Gln Pro Glu Leu Pro Asp Trp Ile Tyr Asp Gly
245 250 255
Val Thr Leu Gly Ile Gln Gly Gly Thr Glu Val Cys Gln Lys Lys Leu
260 265 270
Asp Thr Met Arg Asn Ala Gly Val Lys Val Asn Gly Ile Trp Ala Gln
275 280 285
Asp Trp Ser Gly Ile Arg Met Thr Ser Phe Gly Lys Arg Val Met Trp
290 295 300
Asn Trp Lys Trp Asn Ser Glu Asn Tyr Pro Gln Leu Asp Ser Arg Ile
305 310 315 320
Lys Gln Trp Asn Gln Glu Gly Val Gln Phe Leu Ala Tyr Ile Asn Pro
325 330 335
Tyr Val Ala Ser Asp Lys Asp Leu Cys Glu Glu Ala Ala Gln His Gly
340 345 350
Tyr Leu Ala Lys Asp Ala Ser Gly Gly Asp Tyr Leu Val Glu Phe Gly
355 360 365
Glu Phe Tyr Gly Gly Val Val Asp Leu Thr Asn Pro Glu Ala Tyr Ala
370 375 380
Trp Phe Lys Glu Val Ile Lys Lys Asn Met Ile Glu Leu Gly Cys Gly
385 390 395 400
Gly Trp Met Ala Asp Phe Gly Glu Tyr Leu Pro Thr Asp Thr Tyr Leu
405 410 415
His Asn Gly Val Ser Ala Glu Ile Met His Asn Ala Trp Pro Ala Leu
420 425 430
Trp Ala Lys Cys Asn Tyr Glu Ala Leu Glu Glu Thr Gly Lys Leu Gly
435 440 445
Glu Ile Leu Phe Phe Met Arg Ala Gly Ser Thr Gly Ser Gln Lys Tyr
450 455 460
Ser Thr Met Met Trp Ala Gly Asp Gln Asn Val Asp Trp Ser Leu Asp
465 470 475 480
Asp Gly Leu Ala Ser Val Val Pro Ala Ala Leu Ser Leu Ala Met Thr
485 490 495
Gly His Gly Leu His His Ser Asp Ile Gly Gly Tyr Thr Thr Leu Phe
500 505 510
Glu Met Lys Arg Ser Lys Glu Leu Leu Leu Arg Trp Cys Asp Phe Ser
515 520 525
Ala Phe Thr Pro Met Met Arg Thr His Glu Gly Asn Arg Pro Gly Asp
530 535 540
Asn Trp Gln Phe Asp Gly Asp Ala Glu Thr Ile Ala His Phe Ala Arg
545 550 555 560
Met Thr Thr Val Phe Thr Thr Leu Lys Pro Tyr Leu Lys Glu Ala Val
565 570 575
Ala Leu Asn Ala Lys Ser Gly Leu Pro Val Met Arg Pro Leu Phe Leu
580 585 590
His Tyr Glu Asp Asp Ala His Thr Tyr Thr Leu Lys Tyr Gln Tyr Leu
595 600 605
Leu Gly Arg Asp Ile Leu Val Ala Pro Val His Glu Glu Gly Arg Ser
610 615 620
Asp Trp Thr Leu Tyr Leu Pro Glu Asp Asn Trp Val His Ala Trp Thr
625 630 635 640
Gly Glu Ala Phe Arg Gly Gly Glu Val Thr Val Asn Ala Pro Ile Gly
645 650 655
Lys Pro Pro Val Phe Tyr Arg Ala Asp Ser Glu Trp Ala Ala Leu Phe
660 665 670
Ala Ser Leu Lys Ser Ile
675
<210> 81
<211> 1404
<212> DNA
<213> Escherichia coli
<400> 81
atgtctgacc ataatccact gacattaaaa ctgaatctgc gggaaaaaat cgcctatggt 60
atgggcgacg tcggttcgaa tttaatgctc tgcatcggta ctctgtatct cctcaaattt 120
tataccgatg aattagggat gcctgcttac tatggcggga ttatctttct ggtggcgaag 180
ttttttaccg cgtttaccga tatgctcacc ggatttttac tcgactcgcg gaaaaatatt 240
gggcctaaag gcaaatttcg tccctttatt ttatatgcag cggttccggc ggcgttaatt 300
gcaacgctcc agtttatcgc caccaccttt tgtttgccgg ttaaaacgac gattgccacc 360
gcgctgttta tgatgtttgg actttcatac agtctgatga actgctcgta tggtgcgatg 420
atcccggcaa ttaccaaaaa cccgaatgag cgcgcgcagc tcgcggctta ccgccagggt 480
ggtgcaacca tagggctatt gatttgtacc gtggcgttta ttccgttgca gtcgcttttt 540
tctgactcaa ccgtcggtta tgcctgtgcg gcacttatgt tctccattgg cggctttatt 600
tttatgatgc tgtgctacag aggcgtcaaa gagcattatg tggacacaac gccaaccgga 660
cataaagcca gtattctcaa atcattttgc gcgatatttc ggaatccgcc attgctggtt 720
ttatgcattg ctaacttgtg taccctggcg gcatttaata tcaaactggc gattcaggtc 780
tattacaccc agtatgtgct gaatgatatt aatttattgt cgtggatggg attcttcagt 840
atgggatgca tcctcatcgg cgtattactg gtgccattaa ctgtaaaatg ttttggtaaa 900
aaacaggttt atctggctgg catggtgctg tgggcggtgg gtgatatact gaattatttc 960
tggggaagta actctttcac tttcgtcatg ttctcttgtg tcgccttttt tggcacggcc 1020
tttgtaaaca gcctgaactg ggcactggta ccagataccg tagattacgg tgaatggaaa 1080
accggtattc gtgccgaagg ttctgtttat accggttata ccttctttcg taaaatttct 1140
gccgcacttg ctggcttctt gccaggcatt atgctgacgc aaattggtta tgttcccaac 1200
atcgcgcaaa gcgatgcgac attacagggt ttgcgtcagc tcatttttat ctggccttgt 1260
gcactggcaa ttattgctgc attgacgatg ggattctttt acacactcaa tgaaaaacgg 1320
tttgcattga ttattgagga aatcaaccaa cgcaaaaata aagagatggc gacagaagaa 1380
aaaacggctt ccgtaacgtt ataa 1404
<210> 82
<211> 467
<212> PRT
<213> Escherichia coli
<400> 82
Met Ser Asp His Asn Pro Leu Thr Leu Lys Leu Asn Leu Arg Glu Lys
1 5 10 15
Ile Ala Tyr Gly Met Gly Asp Val Gly Ser Asn Leu Met Leu Cys Ile
20 25 30
Gly Thr Leu Tyr Leu Leu Lys Phe Tyr Thr Asp Glu Leu Gly Met Pro
35 40 45
Ala Tyr Tyr Gly Gly Ile Ile Phe Leu Val Ala Lys Phe Phe Thr Ala
50 55 60
Phe Thr Asp Met Leu Thr Gly Phe Leu Leu Asp Ser Arg Lys Asn Ile
65 70 75 80
Gly Pro Lys Gly Lys Phe Arg Pro Phe Ile Leu Tyr Ala Ala Val Pro
85 90 95
Ala Ala Leu Ile Ala Thr Leu Gln Phe Ile Ala Thr Thr Phe Cys Leu
100 105 110
Pro Val Lys Thr Thr Ile Ala Thr Ala Leu Phe Met Met Phe Gly Leu
115 120 125
Ser Tyr Ser Leu Met Asn Cys Ser Tyr Gly Ala Met Ile Pro Ala Ile
130 135 140
Thr Lys Asn Pro Asn Glu Arg Ala Gln Leu Ala Ala Tyr Arg Gln Gly
145 150 155 160
Gly Ala Thr Ile Gly Leu Leu Ile Cys Thr Val Ala Phe Ile Pro Leu
165 170 175
Gln Ser Leu Phe Ser Asp Ser Thr Val Gly Tyr Ala Cys Ala Ala Leu
180 185 190
Met Phe Ser Ile Gly Gly Phe Ile Phe Met Met Leu Cys Tyr Arg Gly
195 200 205
Val Lys Glu His Tyr Val Asp Thr Thr Pro Thr Gly His Lys Ala Ser
210 215 220
Ile Leu Lys Ser Phe Cys Ala Ile Phe Arg Asn Pro Pro Leu Leu Val
225 230 235 240
Leu Cys Ile Ala Asn Leu Cys Thr Leu Ala Ala Phe Asn Ile Lys Leu
245 250 255
Ala Ile Gln Val Tyr Tyr Thr Gln Tyr Val Leu Asn Asp Ile Asn Leu
260 265 270
Leu Ser Trp Met Gly Phe Phe Ser Met Gly Cys Ile Leu Ile Gly Val
275 280 285
Leu Leu Val Pro Leu Thr Val Lys Cys Phe Gly Lys Lys Gln Val Tyr
290 295 300
Leu Ala Gly Met Val Leu Trp Ala Val Gly Asp Ile Leu Asn Tyr Phe
305 310 315 320
Trp Gly Ser Asn Ser Phe Thr Phe Val Met Phe Ser Cys Val Ala Phe
325 330 335
Phe Gly Thr Ala Phe Val Asn Ser Leu Asn Trp Ala Leu Val Pro Asp
340 345 350
Thr Val Asp Tyr Gly Glu Trp Lys Thr Gly Ile Arg Ala Glu Gly Ser
355 360 365
Val Tyr Thr Gly Tyr Thr Phe Phe Arg Lys Ile Ser Ala Ala Leu Ala
370 375 380
Gly Phe Leu Pro Gly Ile Met Leu Thr Gln Ile Gly Tyr Val Pro Asn
385 390 395 400
Ile Ala Gln Ser Asp Ala Thr Leu Gln Gly Leu Arg Gln Leu Ile Phe
405 410 415
Ile Trp Pro Cys Ala Leu Ala Ile Ile Ala Ala Leu Thr Met Gly Phe
420 425 430
Phe Tyr Thr Leu Asn Glu Lys Arg Phe Ala Leu Ile Ile Glu Glu Ile
435 440 445
Asn Gln Arg Lys Asn Lys Glu Met Ala Thr Glu Glu Lys Thr Ala Ser
450 455 460
Val Thr Leu
465
<210> 83
<211> 693
<212> DNA
<213> Escherichia coli
<400> 83
atgaaaaaga ttaatgcaat aattttatta tcttctctga cctctgcctc ggtatttgct 60
ggcgcatacg tcgaaaacag ggaggcatat aatcttgcct ccgatcaggg cgaggttatg 120
ctacgtgtgg gttataactt cgatatgggc gcgggtatta tgttaaccaa tacctacaac 180
tttcagcgag aagatgaact aaaacatgga tataacgaaa ttgaaggctg gtatccgtta 240
tttaaaccaa ccgataaatt aaccatccag cccggtggct taattaatga taagagtatc 300
ggttcgggtg gtgcagtgta tctggacgtc aactataaat ttgtaccatg gtttaatctg 360
acagtacgaa atcgctataa ccataataac tatagttcaa cagatttgag cggggaactg 420
gataataatg acacctatga aattggcacc tactggaatt ttaaaatcac cgataaattt 480
tcctatacat ttgagccaca ttacttcatg cgagtgaatg actttaatag tagcaacggg 540
aaagatcatc attgggaaat cactaacacc ttccgttacc gtattaatga acactggctc 600
ccttatttcg aattgcgctg gttagaccgc aacgtcgaac cgtaccaccg cgagcaaaac 660
cagatccgta tcgggacgaa gtatttcttc tga 693
<210> 84
<211> 230
<212> PRT
<213> Escherichia coli
<400> 84
Met Lys Lys Ile Asn Ala Ile Ile Leu Leu Ser Ser Leu Thr Ser Ala
1 5 10 15
Ser Val Phe Ala Gly Ala Tyr Val Glu Asn Arg Glu Ala Tyr Asn Leu
20 25 30
Ala Ser Asp Gln Gly Glu Val Met Leu Arg Val Gly Tyr Asn Phe Asp
35 40 45
Met Gly Ala Gly Ile Met Leu Thr Asn Thr Tyr Asn Phe Gln Arg Glu
50 55 60
Asp Glu Leu Lys His Gly Tyr Asn Glu Ile Glu Gly Trp Tyr Pro Leu
65 70 75 80
Phe Lys Pro Thr Asp Lys Leu Thr Ile Gln Pro Gly Gly Leu Ile Asn
85 90 95
Asp Lys Ser Ile Gly Ser Gly Gly Ala Val Tyr Leu Asp Val Asn Tyr
100 105 110
Lys Phe Val Pro Trp Phe Asn Leu Thr Val Arg Asn Arg Tyr Asn His
115 120 125
Asn Asn Tyr Ser Ser Thr Asp Leu Ser Gly Glu Leu Asp Asn Asn Asp
130 135 140
Thr Tyr Glu Ile Gly Thr Tyr Trp Asn Phe Lys Ile Thr Asp Lys Phe
145 150 155 160
Ser Tyr Thr Phe Glu Pro His Tyr Phe Met Arg Val Asn Asp Phe Asn
165 170 175
Ser Ser Asn Gly Lys Asp His His Trp Glu Ile Thr Asn Thr Phe Arg
180 185 190
Tyr Arg Ile Asn Glu His Trp Leu Pro Tyr Phe Glu Leu Arg Trp Leu
195 200 205
Asp Arg Asn Val Glu Pro Tyr His Arg Glu Gln Asn Gln Ile Arg Ile
210 215 220
Gly Thr Lys Tyr Phe Phe
225 230
<210> 85
<211> 1386
<212> DNA
<213> Shigella flexneri
<400> 85
atgagtcaca tcacaacgga agatccagca actttacgcc tgccctttaa agagaaactc 60
tcttacggta ttggcgacct ggcctctaac atcctgctgg atatcggtac gctttatctt 120
ttgaagtttt ataccgacgt tctggggctg ccaggcacct atggcggcat tatctttttg 180
atttcaaaat tctttactgc gtttaccgat atgggtaccg gcattatgtt ggattcccga 240
cgcaagatcg gtccaaaagg taagttccgt ccttttattc tgtatgcgtc attcccggtc 300
accttactgg cgatcgccaa ctttgtcggc acaccgtttg atgtcaccgg taaaacggtg 360
atggccacta ttctgtttat gctttacgga ctgtttttca gcatgatgaa ctgctcctac 420
ggcgcaatgg tcccggcaat caccaaaaac cccaacgaac gcgcctcact ggcggcatgg 480
cgtcagggcg gcgctacgct gggcctgctg ctgtgcacgg tgggattcgt gccagttatg 540
aatcttatcg aaggtaatca gaaacttggc tatatcttcg ccgccacgct gttttcactg 600
ttcggcctgc tgtttatgtg gatctgctac tcaggcgtga aagagcgtta tgtcgaaacc 660
caaccaacca atccggcgca aaagcctggc ctgttgcaat ctttccgcgc aattgccggt 720
aaccgcccac tgttcattct gtgtattgcc aacctctgca ccttaggggc gtttaacgtc 780
aagctcgcca ttcaggtcta ttacacccag tacgtactta acgatcccat cctgttgtcg 840
tatatgggat ttttcagcat gggctgtatt ttcatcggcg tgttcctgat gcctggcgca 900
gtcagacgtt ttggtaagaa gaaggtctat atcggcggcc tgctgatttg ggtgctgggc 960
gatctgctca actatttctt cggcggcggc tcggtcagct ttgtggcgtt ctcctgcctg 1020
gcgttcttcg gctcagcgtt tgttaacagc ctgaactggg cgctggtttc cgacaccgtc 1080
gagtacggag agtggcgcac cggcgtgcgt tcggaaggca cggtctacac cggcttcacc 1140
ttctttcgca aagtgtctca ggcgctggct ggtttcttcc ccggctggat gctgacgcaa 1200
attggctatg tgccgaacgt cgcacaggct gaccacacca ttgaagggtt acgccagttg 1260
atcttcatct acccaagcgc actggcggta gtcaccattg tggcgatggg ttgcttctac 1320
agcctgaacg agaagatgta tgtccgcatt gtggaagaga tagaagcccg taaacgcacg 1380
gcgtaa 1386
<210> 86
<211> 1383
<212> DNA
<213> Salmonella enterica
<400> 86
atgagtcaaa catcatcgaa tccggcaacc ctacgcttgc cgtttaaaga aaaacttgcc 60
tatggactgg gggatttagg ttctaatatc ctgttagata tcggaaccct ctatttactc 120
aaattttata ccgatgtgct gggtttacca gggacttacg gcgggatcat tttcctgatc 180
gccaaatttt ttaccgcatt taccgatatg ggtaccggca ttatgctcga ctcgcggcgt 240
aaaattggtc cgaagggcaa attccgcccg ttcgtgcttt acgcggcatt tccggtaacg 300
ctactggcga ttgctaactt tgtcggcaca ccgtttgagg tgacgggaaa aaccgtcgtc 360
gcaacgatgc tgtttatgct gtacgggctg gttttcagca tgatgaactg ctcgtatggc 420
gcgatggtac ccgcgattac caagaacccg gatgaacgcg cctcgcttgc cgcctggcgt 480
cagggcggcg ccactctcgg cctgctgctg tgtaccgttg gctttgtgcc ggtcatgaac 540
ctgatcgaag gcaatgccca actcagctat attttcgccg ccacgctatt ttcattgttt 600
ggcctgctat ttatgtggct gtgctacgcc ggcgttaaag agcgctacgt cgaagtgaaa 660
cctgtcgata gcgcgcaaaa gcctggatta ttgcagtcgt tccgcgccat cgccggtaac 720
cgtccgctgt ttattctgtg tatcgccaac ctttgtactc ttggcgcctt caacgtcaaa 780
ctggcgattc aggtttatta cacccagtac gttcttaacg acccgatcct cctctcctgg 840
atgggcttct ttagcatggg ctgtattttt atcggcgttt ttttgatgcc cggcgctgta 900
aggcgttttg gcaagaagaa agtctatatc ggcgggctgt taatatgggt ggcaggcgat 960
ctgctcaact acttctttgg cggcggctcg gtcagttttg tcgccttctc ctgcctggcg 1020
ttcttcggtt ccgccttcgt caacagcctg aactgggcgc tggtttccga cacggtggag 1080
tacggtgaat ggcgcaccgg cgtccgctcg gaagggacgg tttacaccgg cttcacgttc 1140
ttccgtaagg tctcccaggc gctggcaggg ttcttccccg gctggatgct aacgcaaatc 1200
ggttatatcc cgaatgtggt gcaatcggca ggcaccgtcg aaggcctacg ccagttgatc 1260
tttatttatc cttgcgtgct ggcggtcatc accattattg cgatgggctg tttctacaac 1320
ctcaacgaga agatgtacgt gcgaattgtg gaagagattg aggcccggaa acatacggtt 1380
taa 1383
<210> 87
<211> 1323
<212> DNA
<213> Enterobacter cancerogenus
<400> 87
tacgggatgg gcgatctcgg ctctaacatc ctgctggata tcggcacgct gtacctgctg 60
aaattttaca ccgacgtgct gggcctgccg ggcacctacg gcggcattat cttcctgatc 120
gccaagttct ttaccgcctt taccgatatg ggtaccggga tcatgcttga ttcccggcgc 180
aagattgggc cgaagggcaa attccgcccg ttcgtgctgt atgcggcgtt tccggtcacg 240
ctgctggcga ttgcaaactt cgtcggcaca ccgtttgaga tgaccggcaa aacggtgatg 300
gcgacggtgc tgttcatgct gtacggcctg ttcttcagca tgatgaactg ctcttacggc 360
gccatggtgc ccgccattac caaaaacccg gacgagcgcg ccgcgctggc ggcctggcgt 420
cagggtggcg cgacgctggg cctgctgctg tgtaccgtcg gctttgtccc ggtgatgaac 480
ctgattgaag gcaatgatca gctgggctat atctttgccg ccaccctgtt ctcgttgttc 540
gggctgttct ttatgtggtg gtgctataag ggcgtgaccg agcgctacgt cgaggcgcag 600
cccgctaacc ccgctcaaaa accgggcctg ctgcagtcgt ttcgcgccat cgccggcaac 660
cgcccgctgt ttattctctg tattgccaac ctctgcacgc tgggggcctt taacgtcaaa 720
ctcgccatcc aggtctacta cacgcagtac gttttgaacg acccgatcct gctgtcgtac 780
atgggcttct tcagcatggg ctgtattttt atcggcgtgt ttatgatgcc cggcgcggtg 840
cgtcgcttcg gtaagaaaaa ggtctacatc agcgggctga tgatttgggt ggccggcgat 900
ctgctcaact acttcttcgg cggcggctcg gtgagctttg tggcgttctc atgcctggcg 960
ttcttcggct ccgcgtttgt gaacagcctg aactgggcgc tggtgtccga taccgtggag 1020
tacggcgagt ggcgcaccgg cgtacgctcc gaagggacgg tctataccgg gtttaccttc 1080
ttccgtaagg tttcccaggc gctggcgggc tttttcccgg ggattatgct gacgcaaatc 1140
ggctatgtgc ccaacgtggt gcagtctgac ggaacggttg aagggctacg gcagctgata 1200
tttatctacc cgagcctgct ggcggtcatc accatcgtgg cgatgggctg cttctacaac 1260
ctcaacgaga agatgtatgt gcgcatcgtg gaagaaattg aactgcgcaa acgtacagcc 1320
tga 1323
<210> 88
<211> 1383
<212> DNA
<213> Citrobacter koseri
<400> 88
atgagtcaaa cgtcatcaaa tccggcgacc ctacgcttgc cgtttaaaga aaaacttgcc 60
tatgggatgg gtgatttagg ctccaatatc ctgctggata ttggtacgct ttatttactt 120
aagttttata ccgatgtgct gggtctaccg ggcacgtatg gcggtattat tttcctgatc 180
gccaaattct ttaccgcctt caccgatatg ggcaccggga ttatgctcga ctcgcggcgt 240
aaaatcggcc cgaaaggcaa gttccgtccg ttcgtgctct atgccgcgtt tccggtgacc 300
ctgctggcca tcgccaactt tgtcggcacg ccgtttgaaa tcaccggtaa gacggtgatg 360
gcgacggtgc tgtttatgct gtacggcctg ttcttcagca tgatgaactg ttcgtatggc 420
gcgatggtgc ccgccattac caaaaacccg gatgagcgcg cctcgcttgc cgcctggcgt 480
cagggcggcg ccacgctcgg cctgctgctg tgcaccgtcg gttttgttcc ggtgatgaat 540
ctgatcgaag ggaacgcaca gctaagctat attttcgccg ccacgctgtt ctcactgttt 600
ggcctgctgt ttatgtggct ctgctacgca ggcgtcaaag agcgttatgt ggaggtaaaa 660
ccggttgaag cgaccgaaaa accggggctg ctccagtcgt ttcgcgccat tgccgggaac 720
cgtccgctgt tcattttatg tatcgcgaat ctctgcaccc tgggcgcttt caacgttaag 780
ctggcgatcc aggtgtatta cacccagtac gtactgaatg acccgatcct cctctcctgg 840
atgggttttt tcagcatggg ctgcattttc atcggcgtct ttttaatgcc cggcgcggta 900
agacgcttcg gcaagaaaaa ggtctacatc ggcggcctgc tggtttgggt tatcggcgat 960
cttctcaact acttctttgg cggcggctcg gtcagttttg tcgcgttttc ctgcctggcg 1020
tttttcggtt cagcgtttgt gaacagcctg aactgggcgc tggtctccga cacggtggaa 1080
tacggtgaat ggcgcaccgg cgtgcgttca gaaggaacgg tatacaccgg ttttaccttc 1140
ttccgtaagg tgtctcaggc gctggcgggc ttcttccccg gttggatgct gacccaaatc 1200
ggctacgtgc ccaatgtggt gcaatcggca ggcactgtcg aaggtttgcg gcagctgatc 1260
tttatttatc cgtgcgcgct ggcggtgata accatcatcg caatgggatg tttctacaac 1320
ctcaacgaga agatgtatgt ccgcatcgtt gaagagatag aagcccgtaa acaaacggct 1380
taa 1383
<210> 89
<211> 1458
<212> DNA
<213> Shigella flexneri
<400> 89
atgtctgacc ataatccact gacattaaaa ctgaatctgc gggaaaaaat cgcctatggt 60
atgggcgacg tcggttcgaa tttaatgctc tgcatcggta ctctgtatct cctcaaactt 120
tataccgatg aattagggat gcctgcttac tatggcggga ttatctttct ggtcgcgaag 180
ttttttaccg cgtttaccga tatgctcacc ggatttttac tcgactcgcg gaaaaatatt 240
gggcctaaag gcaaatttcg tccctttatt ttatatgcag cagttccggc ggcgttaatt 300
gcaacgctcc agtttatcgc caccaccttt tgtttgccgg ttaaaacgac gattgccacc 360
acgctgttta tgatgtttgg actttcatac agtctgatga actgctcgta tggtgcgatg 420
atcccggcaa ttaccaaaaa cccgaatgag cgcgcgcagc tcgcggctta ccgccagggt 480
ggtgcaacca tagggctatt gatttgtacc gtggcgttta ttccgttgca gtcgcttttt 540
tctgactcaa ccgtcggtta tgcctgtgcg gcacttatgt tctccattgg cggctttatt 600
tttatgatgc tgtgctacag aggcgtcaaa gagcattatg tggacacagc gccaaccgga 660
cataaagcca gtattctcaa atctttttgc gcgatatttc gtaatccacc attgctggtt 720
ttatgcattg ctaacctgtg tactctggcg gcatttaata tcaaactggc gattcaggtc 780
tattacaccc agtatgtact gaatgatatt aatttattgt cgtggatggg attcttcagt 840
atgggatgca tcctcgtcgg cgtattactg gtgccagtaa ctgtaaaatg ttttggtaaa 900
aaacaggttt atttagctgg catagtgcta tgggcggtgg gtgatatact gaattctttc 960
tggggaagta actctttcac tttcgtcatg ttctcttgtg tcgccttttt tggcacggcc 1020
tttgtaaaca gcctgaactg ggcactggta ccagataccg tagattacgg tgaatggaaa 1080
accggtattc gtgccgaagg ttctgtttat accggttata ccttctttcg taaaatttct 1140
gccgcacttg ctggcttctt gccaggcatt atgctgacgc aaattggtta tgttcccaac 1200
atcgcgcaaa gcgatgcgac attacagggt ttgcgtcagc tcatttttat ctggccttgt 1260
gcactggcaa ttattgctgc attgacgatg ggattctttt acacactcaa tgaaaaacgg 1320
tttgcattga ttattgagga aatcaaccaa cgcaaaaata aagagatggc gacagaaaaa 1380
aaaaacggct tccgtaacgt tataaatgtc aatagccgct atttccatcc tggtgggtgg 1440
cggcctccct acgtttaa 1458
<210> 90
<211> 1422
<212> DNA
<213> Salmonella enterica
<400> 90
atgtctaatc atgatccgct aacgctaaag ttgagcctgc gggaaaaatg cgcctatggc 60
gtgggcgatt tcggctcaaa tctgatgctg tgtatcggta cgctgtatct actgaagttt 120
tataccgatg aactcgggat gcctgcatat tacggtggaa ttatctttct ggtggcgaaa 180
ttcttcaccg cttttaccga tatgctcacc ggcgtattgc tggactcacg ccgtaatatt 240
ggcgcaaaag gaaagtttcg gccttttatt ctgtatgcgt catttccagt cgctctggtt 300
gctactgcgc aattctttgc cactcacttt actttacccg ttaaaacagc cttcgcgacg 360
gtgctgttta tgttgttcgg tctgttctac agcctgatga actgctcata cggcgcgatg 420
gtacccgcta ttaccaaaaa tccgcatgag cgcgcccagc tcgccgcatg gcgacaaggc 480
ggcgctacca ttggccttct tctttgtacc gtaggtttta tgcccattca ggcgctgttt 540
acccgttccc cttcgctggg ttatctgatt gcagcagtca tcttttcggt ctgcgggctg 600
ttcagcatgt ggtggtgctt tagcggggta aaagaacggt atatcgaaac cgtacctgac 660
acgcataaac ccagcatatt gaagtccttc tgcgcgattt ttcgtaatcc gccgctgctg 720
gtgctctgcg ttgccaattt gtgcacgctg gccgccttta atatcaagct ggccattcag 780
gtttattaca ctcagtacgt gctgaacgat attcatttgt tgtcatggat gggttttttc 840
agcatgggct gtatcctgat tggtgtttta ttagtacctg ctgcggtaaa acgcttcggg 900
aaaaaacagg tttatcttgg tggtctgata ttgtgggccg ttggcgatat cctgaatttt 960
atctggggtg gaacgtcatt cctgtttgtt attttctctt gtatcgcctt cttcggtacc 1020
gctttcgtca acagcctgaa ctgggcgctg gttccggata cggttgacta cggtgaatgg 1080
aaaacgggta ttcgcgctga aggctcggtg tatacgggtt ataccttttc ccgcaaaatt 1140
tccgctgcgc ttgctggctt tttgccaggt attatgctga cgcaaatcgg ttatatcccc 1200
aacatagctc aaagtgacac cacgttgctt ggtttgcgtc agctcatttt tttatggcct 1260
tgcggtcttg ccattatcgc agcactaacg atgggctttt tttataagct caatgaacaa 1320
cgtttcgctt ttattatcga ggaaattgcc caacgaaaga aaacaggtaa tcaaattgtc 1380
gcgactaata ataaacaaag tatttctact gtaaataatt aa 1422
<210> 91
<211> 1425
<212> DNA
<213> Enterobacter cancerogenus
<400> 91
atgacacaca ctcctgatcc gttaaccctg aagctgagcc tgcgcgagaa gtgcgcctat 60
gggatgggcg attttggctc gaacctgatg ctctgtatcg gcacgctgta tctgctgaag 120
ttttataccg acgagctggg tatgcccgcc ttttacggcg gcattatttt tctggttgcg 180
aagtttttta ccgcctttac cgacatgctg accggggtgc tgctggactc ccggcgtcat 240
atcggcgcga ggggaaagtt ccggccattc attctgtatg cctccgtacc ggtggcgctg 300
gttgccacgg cgcagtttat ggccaacgat tttagcctga cggtgaaaac ggccctcgcc 360
accgtgctct ttatgatgtt cggcctgtgc tatagcctga tgaactgctc ttacggtgcg 420
atggtgccag ctatcaccaa aaacccgaac gaacgggcgc agcttgcggc ctggcgtcag 480
ggcggcgcga cggtggggct gttactctgt accgtcggct ttatgcccat tcaggcgctg 540
ttcgtcagcc agccctccct cggctatctg gtggccgcgc tggtgtttgt caccggcggc 600
ttattctgca tgtggtggtg ctacagcggc gtaaaagagc ggtatgtcga gatctcgccc 660
gatcaccata agcccggcat cctgaagtcc ttctgcgcta tcttccgcaa cccaccgcta 720
ctggtgctgt gcatcgcgaa cctctgcacc ctggcggcgt ttaacatcaa gctggcgatt 780
caggtctatt acacccagta cgtgctcaac gatctgcatt tgctgtcgtg gatgggtttt 840
ttcagcatgg gctgcattct gattggcgtg tttctggtgc ccggtgcggt gaagcgtttt 900
ggcaagaagc cggtctatct gggtgggctg gcgctgtggg cgataggcga tgtgctgaac 960
ttcttctggg ggaccagctc gctgctgttc gtgttctttt cctgtatggc ctttttcggc 1020
acggcgtttg tgaacagcct gaactgggcg ctggtgccgg atacggttga ttacggcgaa 1080
tggaaaacgg gcattcgcgc cgaagggtcg gtgtataccg gctatacctt ctcgcgcaaa 1140
atctccgccg ccctcgccgg attcctgccg ggcataatgc tgacgcagat tgggtatatt 1200
cctcatgccg tgcagagcgc cagtacgctg ctcggcttgc gccagctgat tttcctctgg 1260
ccgtgcggcc tggcgattat cgccgccgtg accatgggac tcttctataa actcaacgaa 1320
gcgcgcttcg cgtttattat cgaggagatc ggcaaacgca aaaaaacagc ggaagttatg 1380
gccgcgtacg gtccggaaaa gcgggtttcc gccaccagcg tttag 1425
<210> 92
<211> 1395
<212> DNA
<213> Citrobacter koseri
<400> 92
atgtctgacc atgatccgct gacgctaaaa ctgagcctac gggaaaaata tgcctatggc 60
atgggtgact tcggctcaaa tttgatgctg tgtatcggta cgctgtatct gcttaagttt 120
tataccgatg aactggggat gcccgcatat tacggtggga ttatctttct ggtggcgaag 180
ttctttaccg cgttcaccga tatgttgacg ggggtgctgc tggattcccg tcgtcatatt 240
ggcgctaaag gtaagtttcg ccctttcatt ctgtatgcat catttcctgt cgcgctggtt 300
gccagcgcgc agtttctcgc caccgatttt acactgacgg tcaaaacagc gctggcaacc 360
gtactgttca tgctgtttgg cctgttttac agcctgatga attgctcata cggggcgatg 420
gtgcccgcta tcaccagaaa cccgcatgag cgcgcccaac tcgcagcatg gcgtcagggc 480
ggcgcaacgc tcggtctgtt gctgtgtacc gttggcttta tgccgattca ggcgctcttc 540
acccagtcat cttctctggg ttatctggta gccgcgttga ttttctccgt ttgcggcctg 600
ttcagtatgt ggtggtgttt cagcggggtg aaagaacggt atatcgatat cgttccggcc 660
caccataagc ccagcattct taaatccttc tgtgcgattt tccgcaatcc gccgctgctg 720
gtgctctgcg tggccaactt atgtacgctg gccgcgttta acatcaaact ggcgattcag 780
gtctattaca cccagtacgt gctgaacgac atccatttgc tgtcatggat gggatttttc 840
agtatggggt gcattctggt cggcgtactg ctggtgcccg taaccgtaaa acggtttggg 900
aaaaagcagg tctacctcgg cggcctgacg ctgtgggcta tcggcgatgt gctgaacttt 960
ctctggggtg gaacctcttt cctgttcgtg atcttctcct gcatggcgtt tttcggcacc 1020
gcgttcgtta acagcctgaa ctgggcgctg gttcctgata cggtcgatta cggcgaatgg 1080
aaaacaggca ttcgtgcgga agggtcggtc tataccggtt ataccttctc acgaaaaatt 1140
tctgcggcgc tggcgggttt cttgcccggc attatgctga cgcaaattgg ctacgtgccg 1200
aacatagcgc aaagcgcgga gacgttactt ggcctacgtc agttgatatt tctctggcca 1260
tgcggcctgg cgattatcgc cgcactcaca atgggctttt tttataagct caatgaaaaa 1320
cgttttgctt ttattattga ggaaattagc caacgaaaga aacaatcgat acaaaccggc 1380
gttgtaagcc attaa 1395
<210> 93
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with 408STOP
<400> 93
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat gtaaacgcct gtaccttcag caatatag 1248
<210> 94
<211> 407
<212> PRT
<213> Artificial Sequence
<220>
<223> variant CscB sequence with 408STOP
<400> 94
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met
405
<210> 95
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with L61P substitution
<400> 95
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ccatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 96
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> variant CscB sequence with L61P substitution
<400> 96
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Pro Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 97
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with F159L substitution
<400> 97
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttattt 480
gccggcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 98
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> variant CscB sequence with F159L substitution
<400> 98
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Leu Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 99
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with G162C substitution
<400> 99
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gcctgcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 100
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> variant CscB sequence with G162C substitution
<400> 100
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Cys Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 101
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with P169H substitution
<400> 101
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggcatat tttttagtat cagtcaccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 102
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> variant CscB sequence with P169H substitution
<400> 102
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser His His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 103
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with L61W substitution
<400> 103
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
tggtttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 104
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> variant CscB sequence with L61W substitution
<400> 104
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Trp Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 105
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with L61H substitution
<400> 105
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
cattttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 106
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> variant CscB sequence with L61H substitution
<400> 106
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile His Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 107
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with L61F substitution
<400> 107
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ttttttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 108
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> variant CscB sequence with L61F substitution
<400> 108
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Phe Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile
405 410 415
<210> 109
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> variant cscB sequence with 403STOP
<400> 109
atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60
ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120
ctagggttga cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180
ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240
tggtgtatga gtttcatcct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300
ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctattttt tggcttgggg 360
tatctggcgg gatgcggttt gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat 420
ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480
gccggcatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540
gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg cgtagcggca 600
gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660
gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactt 720
tttcctgtct tttattcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780
tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840
gtgaatcggg tagggccaaa aaatgcatta cttatcggag ttgtgattat ggcgttgcgt 900
atcctttcct gcgcgctgtt cgttaacccc tggattattt cattagtgaa gttgttacat 960
gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020
aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080
gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140
ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cttgagtaaa 1200
aaacgctagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248
<210> 110
<211> 402
<212> PRT
<213> Artificial Seqquence
<220>
<223> variant CscB sequence with 403STOP
<400> 110
Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser
1 5 10 15
Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu
20 25 30
Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu
35 40 45
Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met
50 55 60
Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile
65 70 75 80
Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr
85 90 95
Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu
100 105 110
Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu
115 120 125
Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly
130 135 140
Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe
145 150 155 160
Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val
165 170 175
Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp
180 185 190
Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu
195 200 205
Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile
210 215 220
Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu
225 230 235 240
Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr
245 250 255
Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu
260 265 270
Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn
275 280 285
Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys
290 295 300
Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His
305 310 315 320
Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val
325 330 335
Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe
340 345 350
Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly
355 360 365
Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser
370 375 380
Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys
385 390 395 400
Lys Arg
<210> 111
<211> 921
<212> DNA
<213> Escherichia coli
<400> 111
atgagcgcaa gagtatgggt actcggtgat gcggttgttg atttattacc cgaaagccag 60
gggagactac tacagtgtcc tggcggggcg cctgctaatg ttgcagtcgg tatcgcaagg 120
ctggggggga aaagtgcctt tattggcaaa gttggcgatg atcctttcgg tcgctttatg 180
tatcagacac tgagtacaga aaatgttgat acacattata tgtctcttga tcctcaacaa 240
cgcacctcaa ttgtggctgt aggacttgat gagcaaggag aaagaaactt tacctttatg 300
gtacgcccaa gtgccgatct ttttttacaa cctggtgacc ttcctgcatt tgggccgggt 360
gaatggctcc atctttgttc cattgcgctc agtgcagaac cttcccgaag taccgcattt 420
ctggctatgg agaaaatacg tcaggctggc ggaaacatca gttttgatcc caatatccgc 480
agcgatctct ggcagagtga agcgctatta aggaaatacc ttgatcgcgc actttcgctg 540
gcgaatatcg ctaaattgtc cgaagaagag ttgctattca tcagtggcga aagccaggtt 600
cagcaaggcg catattcatt agtacaacgt tattcgttga ctttattgct tattacacaa 660
ggaaaaaatg gcgtacttgt gtattttcag gggcagttta tccactatcc cgccaaacct 720
gtttctgtcg tcgatacgac cggggcagga gatgcttttg tcgctggatt acttgcaggt 780
ctggctgatt ctggaatacc aacaaatacc agacagcttg aacgaatcat tgcacaagct 840
cagatttgtg gtgctctggc gaccacggct aaaggcgcga taaccgcctt accccgacaa 900
cacgatctcc cttcacaata g 921
<210> 112
<211> 306
<212> PRT
<213> Escherichia coli
<400> 112
Met Ser Ala Arg Val Trp Val Leu Gly Asp Ala Val Val Asp Leu Leu
1 5 10 15
Pro Glu Ser Gln Gly Arg Leu Leu Gln Cys Pro Gly Gly Ala Pro Ala
20 25 30
Asn Val Ala Val Gly Ile Ala Arg Leu Gly Gly Lys Ser Ala Phe Ile
35 40 45
Gly Lys Val Gly Asp Asp Pro Phe Gly Arg Phe Met Tyr Gln Thr Leu
50 55 60
Ser Thr Glu Asn Val Asp Thr His Tyr Met Ser Leu Asp Pro Gln Gln
65 70 75 80
Arg Thr Ser Ile Val Ala Val Gly Leu Asp Glu Gln Gly Glu Arg Asn
85 90 95
Phe Thr Phe Met Val Arg Pro Ser Ala Asp Leu Phe Leu Gln Pro Gly
100 105 110
Asp Leu Pro Ala Phe Gly Pro Gly Glu Trp Leu His Leu Cys Ser Ile
115 120 125
Ala Leu Ser Ala Glu Pro Ser Arg Ser Thr Ala Phe Leu Ala Met Glu
130 135 140
Lys Ile Arg Gln Ala Gly Gly Asn Ile Ser Phe Asp Pro Asn Ile Arg
145 150 155 160
Ser Asp Leu Trp Gln Ser Glu Ala Leu Leu Arg Lys Tyr Leu Asp Arg
165 170 175
Ala Leu Ser Leu Ala Asn Ile Ala Lys Leu Ser Glu Glu Glu Leu Leu
180 185 190
Phe Ile Ser Gly Glu Ser Gln Val Gln Gln Gly Ala Tyr Ser Leu Val
195 200 205
Gln Arg Tyr Ser Leu Thr Leu Leu Leu Ile Thr Gln Gly Lys Asn Gly
210 215 220
Val Leu Val Tyr Phe Gln Gly Gln Phe Ile His Tyr Pro Ala Lys Pro
225 230 235 240
Val Ser Val Val Asp Thr Thr Gly Ala Gly Asp Ala Phe Val Ala Gly
245 250 255
Leu Leu Ala Gly Leu Ala Asp Ser Gly Ile Pro Thr Asn Thr Arg Gln
260 265 270
Leu Glu Arg Ile Ile Ala Gln Ala Gln Ile Cys Gly Ala Leu Ala Thr
275 280 285
Thr Ala Lys Gly Ala Ile Thr Ala Leu Pro Arg Gln His Asp Leu Pro
290 295 300
Ser Gln
305
<210> 113
<211> 924
<212> DNA
<213> Klebsiella pneumoniae
<400> 113
atgaatggaa aaatctgggt actcggcgat gcggtcgtcg atctcctgcc cgatggagag 60
ggccgcctgc tgcaatgccc cggcggcgcg ccggccaacg tggcggtcgg cgtggcgcgg 120
ctcggcggtg acagcgggtt tatcggccgc gtcggcgacg atcccttcgg ccgttttatg 180
cgtcacaccc tggcgcagga gcaagtggat gtgaactata tgcgcctcga tgcggcgcag 240
cgcacctcca cggtggtggt cgatctcgat agccacgggg agcgcacctt tacctttatg 300
gtccgtccga gcgccgacct gttccttcag cccgaggatc tcccgccgtt tgccgccggt 360
cagtggctgc acgtctgctc catcgctctc agcgcggagc cgagccgcag cacgacattc 420
gcggcgatgg aggcgataaa gcgcgccggg ggctatgtca gcttcgaccc caatatccgc 480
agcgacctgt ggcaggatcc gcaggacctt cgcgactgtc tcgaccgggc gctggccctc 540
gccgacgcca taaaactttc ggaagaggag ctggcgttta tcagcggcag cgacgacatc 600
gtcagcggca ccgcccggct gaacgcccgc ttccagccga cgctactgct ggtgacccag 660
ggtaaagcgg gggtccaggc cgccctgcgc gggcaggtta gccacttccc tgcccgcccg 720
gtggtggccg tcgataccac cggcgccggc gatgcctttg tcgccgggct actcgccggc 780
ctcgccgccc acggtatccc ggacaacctc gcagccctgg ctcccgacct cgcgctggcg 840
caaacctgcg gcgccctggc caccaccgcc aaaggcgcca tgaccgccct gccctacagg 900
gacgatcttc agcgctcgct gtga 924
<210> 114
<211> 307
<212> PRT
<213> Klebsiella pneumoniae
<400> 114
Met Asn Gly Lys Ile Trp Val Leu Gly Asp Ala Val Val Asp Leu Leu
1 5 10 15
Pro Asp Gly Glu Gly Arg Leu Leu Gln Cys Pro Gly Gly Ala Pro Ala
20 25 30
Asn Val Ala Val Gly Val Ala Arg Leu Gly Gly Asp Ser Gly Phe Ile
35 40 45
Gly Arg Val Gly Asp Asp Pro Phe Gly Arg Phe Met Arg His Thr Leu
50 55 60
Ala Gln Glu Gln Val Asp Val Asn Tyr Met Arg Leu Asp Ala Ala Gln
65 70 75 80
Arg Thr Ser Thr Val Val Val Asp Leu Asp Ser His Gly Glu Arg Thr
85 90 95
Phe Thr Phe Met Val Arg Pro Ser Ala Asp Leu Phe Leu Gln Pro Glu
100 105 110
Asp Leu Pro Pro Phe Ala Ala Gly Gln Trp Leu His Val Cys Ser Ile
115 120 125
Ala Leu Ser Ala Glu Pro Ser Arg Ser Thr Thr Phe Ala Ala Met Glu
130 135 140
Ala Ile Lys Arg Ala Gly Gly Tyr Val Ser Phe Asp Pro Asn Ile Arg
145 150 155 160
Ser Asp Leu Trp Gln Asp Pro Gln Asp Leu Arg Asp Cys Leu Asp Arg
165 170 175
Ala Leu Ala Leu Ala Asp Ala Ile Lys Leu Ser Glu Glu Glu Leu Ala
180 185 190
Phe Ile Ser Gly Ser Asp Asp Ile Val Ser Gly Thr Ala Arg Leu Asn
195 200 205
Ala Arg Phe Gln Pro Thr Leu Leu Leu Val Thr Gln Gly Lys Ala Gly
210 215 220
Val Gln Ala Ala Leu Arg Gly Gln Val Ser His Phe Pro Ala Arg Pro
225 230 235 240
Val Val Ala Val Asp Thr Thr Gly Ala Gly Asp Ala Phe Val Ala Gly
245 250 255
Leu Leu Ala Gly Leu Ala Ala His Gly Ile Pro Asp Asn Leu Ala Ala
260 265 270
Leu Ala Pro Asp Leu Ala Leu Ala Gln Thr Cys Gly Ala Leu Ala Thr
275 280 285
Thr Ala Lys Gly Ala Met Thr Ala Leu Pro Tyr Arg Asp Asp Leu Gln
290 295 300
Arg Ser Leu
305
<210> 115
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 115
tagacgtgaa acaggagtca taatgaattt tcatcatctg ggatcccttg cccgctgttg 60
<210> 116
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 116
catttcaggc ctccaggctt atccagatgg ttttcagttc gaattcgcag gaccgtgata 60
<210> 117
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 117
tgagcgaatc ccgatgagct tact 24
<210> 118
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 118
atacgttcgc ggatgatctc acca 24
<210> 119
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 119
accattgtgg cgatgggttg cttctacagc ctgaacgaga ggatcccttg cccgctgttg 60
<210> 120
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 120
ttacgggctt ctatctcttc cacaatgcgg acatacatct gaattcgcag gaccgtgata 60
<210> 121
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 121
tgctgggcga tctgctcaac tatt 24
<210> 122
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 122
taatcccgcc atagtaagca ggca 24
<210> 123
<211> 4146
<212> DNA
<213> Escherichia coli
<400> 123
ggatcccttg cccgctgttg atccgttgtt ccacctgata ttatgttaac ccagtagcca 60
gagtgctcca tgttgcagca cagccactcc gtgggaggca taaagcgaca gttcccgttc 120
ttctggctgc ggatagattc gactactcat caccgcttcc ccgtcgttaa taaatacttc 180
cacggatgat gtatcgataa atatccttag ggcgagcgtg tcacgctgcg ggaggggaat 240
actacggtag ccgtctaaat tctcgtgtgg gtaataccgc cacaaaacaa gtcgctcaga 300
ttggttatca atatacagcc gcattccagt gccgagctgt aatccgtaat gttcggcatc 360
actgttcttc agcgcccact gcaactgaat ctcaactgct tgcgcgtttt cctgcaaaac 420
atatttattg ctgattgtgc ggggagagac agattgatgc tgctggcgta acgactcagc 480
ttcgtgtacc gggcgttgta gaagtttgcc attgctctct gatagctcgc gcgccagcgt 540
catgcagcct gcccatcctt cacgttttga gggcattggc gattcccaca tatccatcca 600
gccgataaca atacgccgac catccttcgc taaaaagctt tgtggtgcat aaaagtcatg 660
cccgttatca agttcagtaa aatgcccgga ttgtgcaaaa agtcgtcctg gcgaccacat 720
tccgggtatt acgccacttt gaaagcgatt tcggtaactg tatccctcgg cattcattcc 780
ctgcggggaa aacatcagat aatgctgatc gccaaggctg aaaaagtccg gacattccca 840
catatagctt tcacccgcat cagcgtgggc cagtacgcga tcgaaggtcc attcacgcaa 900
cgaactgccg cgataaagca ggatctgccc cgtgttgcct ggatctttcg ccccgactac 960
catccaccat gtgtcggctt cacgccacac tttaggatcg cggaagtgca tgattccttc 1020
tggtggagtg aggatcacac cctgtttctc gaaatgaata ccatcccgac tggtagccag 1080
acattgtact tcgcgaattg catcgtcatt acctgcacca tcgagccaga cgtgtccggt 1140
gtagataagt gagaggacac cattgtcatc gacagcacta cctgaaaaac acccgtcttt 1200
gtcattatcg tctcctggcg ctagcgcaat aggctcatgc tgccagtgga tcatatcgtc 1260
gctggtggca tgtccccagt gcattggccc ccagtgttcg ctcatcggat gatgttgata 1320
aaacgcgtga taacgatcgt taaaccagat caggccgttt ggatcgttca tccacccggc 1380
aggaggcgcg aggtgaaaat ggggatagaa agtgttaccc cggtgctcat gaagttttgc 1440
tagggcgttt tgcgccgcat gcaatcgaga ttgcgtcatt ttaatcatcc tggttaagca 1500
aatttggtga attgttaacg ttaactttta taaaaataaa gtcccttact ttcataaatg 1560
cgatgaatat cacaaatgtt aacgttaact atgacgtttt gtgatcgaat atgcatgttt 1620
tagtaaatcc atgacgattt tgcgaaaaag aggtttatca ctatgcgtaa ctcagatgaa 1680
tttaagggaa aaaaatgtca gccaaagtat gggttttagg ggatgcggtc gtagatctct 1740
tgccagaatc agacgggcgc ctactgcctt gtcctggcgg cgcgccagct aacgttgcgg 1800
tgggaatcgc cagattaggc ggaacaagtg ggtttatagg tcgggtgggg gatgatcctt 1860
ttggtgcgtt aatgcaaaga acgctgctaa ctgagggagt cgatatcacg tatctgaagc 1920
aagatgaatg gcaccggaca tccacggtgc ttgtcgatct gaacgatcaa ggggaacgtt 1980
catttacgtt tatggtccgc cccagtgccg atcttttttt agagacgaca gacttgccct 2040
gctggcgaca tggcgaatgg ttacatctct gttcaattgc gttgtctgcc gagccttcgc 2100
gtaccagcgc atttactgcg atgacggcga tccggcatgc cggaggtttt gtcagcttcg 2160
atcctaatat tcgtgaagat ctatggcaag acgagcattt gctccgcttg tgtttgcggc 2220
aggcgctaca actggcggat gtcgtcaagc tctcggaaga agaatggcga cttatcagtg 2280
gaaaaacaca gaacgatcag gatatatgcg ccctggcaaa agagtatgag atcgccatgc 2340
tgttggtgac taaaggtgca gaaggggtgg tggtctgtta tcgaggacaa gttcaccatt 2400
ttgctggaat gtctgtgaat tgtgtcgata gcacgggggc gggagatgcg ttcgttgccg 2460
ggttactcac aggtctgtcc tctacgggat tatctacaga tgagagagaa atgcgacgaa 2520
ttatcgatct cgctcaacgt tgcggagcgc ttgcagtaac ggcgaaaggg gcaatgacag 2580
cgctgccatg tcgacaagaa ctggaatagt gagaagtaaa cggcgaagtc gctcttatct 2640
ctaaatagga cgtgaatttt ttaacgacag gcaggtaatt atggcactga atattccatt 2700
cagaaatgcg tactatcgtt ttgcatccag ttactcattt ctctttttta tttcctggtc 2760
gctgtggtgg tcgttatacg ctatttggct gaaaggacat ctagggttga cagggacgga 2820
attaggtaca ctttattcgg tcaaccagtt taccagcatt ctatttatga tgttctacgg 2880
catcgttcag gataaactcg gtctgaagaa accgctcatc tggtgtatga gtttcatcct 2940
ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg ttactgcaaa gcaatttttc 3000
tgtaggtcta attctggggg cgctattttt tggcttgggg tatctggcgg gatgcggttt 3060
gcttgatagc ttcaccgaaa aaatggcgcg aaattttcat ttcgaatatg gaacagcgcg 3120
cgcctgggga tcttttggct atgctattgg cgcgttcttt gccggcatat tttttagtat 3180
cagtccccat atcaacttct ggttggtctc gctatttggc gctgtattta tgatgatcaa 3240
catgcgtttt aaagataagg atcaccagtg cgtagcggca gatgcgggag gggtaaaaaa 3300
agaggatttt atcgcagttt tcaaggatcg aaacttctgg gttttcgtca tatttattgt 3360
ggggacgtgg tctttctata acatttttga tcaacaactt tttcctgtct tttattcagg 3420
tttattcgaa tcacacgatg taggaacgcg cctgtatggt tatctcaact cattccaggt 3480
ggtactcgaa gcgctgtgca tggcgattat tcctttcttt gtgaatcggg tagggccaaa 3540
aaatgcatta cttatcggag ttgtgattat ggcgttgcgt atcctttcct gcgcgctgtt 3600
cgttaacccc tggattattt cattagtgaa gttgttacat gccattgagg ttccactttg 3660
tgtcatatcc gtcttcaaat acagcgtggc aaactttgat aagcgcctgt cgtcgacgat 3720
ctttctgatt ggttttcaaa ttgccagttc gcttgggatt gtgctgcttt caacgccgac 3780
tgggatactc tttgaccacg caggctacca gacagttttc ttcgcaattt cgggtattgt 3840
ctgcctgatg ttgctatttg gcattttctt cttgagtaaa aaacgcgagc aaatagttat 3900
ggaaacgcct gtaccttcag caatatagac gtaaactttt tccggttgtt gtcgatagct 3960
ctatatccct caaccggaaa ataataatag taaaatgctt agccctgcta ataatcgcct 4020
aatccaaacg cctcattcat gttctggtac agtcgctcaa atgtacttca gatgcgcggt 4080
tcgctgattt ccaggacatt gtcgtcattc agtgacctgt cccgtgtatc acggtcctgc 4140
gaattc 4146
<210> 124
<211> 9317
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid
<400> 124
tcgaggaatt cgcaggaccg tgatacacgg gacaggtcac tgaatgacga caatgtcctg 60
gaaatcagcg aaccgcgcat ctgaagtaca tttgagcgac tgtaccagaa catgaatgag 120
gcgtttggat taggcgatta ttagcagggc taagcatttt actattatta ttttccggtt 180
gagggatata gagctatcga caacaaccgg aaaaagttta cgtctatatt gctgaaggta 240
caggcgtttc cataactatt tgctcgcgtt ttttactcaa gaagaaaatg ccaaatagca 300
acatcaggca gacaataccc gaaattgcga agaaaactgt ctggtagcct gcgtggtcaa 360
agagtatccc agtcggcgtt gaaagcagca caatcccaag cgaactggca atttgaaaac 420
caatcagaaa gatcgtcgac gacaggcgct tatcaaagtt tgccacgctg tatttgaaga 480
cggatatgac acaaagtgga acctcaatgg catgtaacaa cttcactaat gaaataatcc 540
aggggttaac gaacagcgcg caggaaagga tacgcaacgc cataatcaca actccgataa 600
gtaatgcatt ttttggccct acccgattca caaagaaagg aataatcgcc atgcacagcg 660
cttcgagtac cacctggaat gagttgagat aaccatacag gcgcgttcct acatcgtgtg 720
attcgaataa acctgaataa aagacaggaa aaagttgttg atcaaaaatg ttatagaaag 780
accacgtccc cacaataaat atgacgaaaa cccagaagtt tcgatccttg aaaactgcga 840
taaaatcctc tttttttacc cctcccgcat ctgccgctac gcactggtga tccttatctt 900
taaaacgcat gttgatcatc ataaatacag cgccaaatag cgagaccaac cagaagttga 960
tatggggact gatactaaaa aatatgccgg caaagaacgc gccaatagca tagccaaaag 1020
atccccaggc gcgcgctgtt ccatattcga aatgaaaatt tcgcgccatt ttttcggtga 1080
agctatcaag caaaccgcat cccgccagat accccaagcc aaaaaatagc gcccccagaa 1140
ttagacctac agaaaaattg ctttgcagta acggttcata aacgtaaatc ataaacggtc 1200
cggtcaagac caggatgaaa ctcatacacc agatgagcgg tttcttcaga ccgagtttat 1260
cctgaacgat gccgtagaac atcataaata gaatgctggt aaactggttg accgaataaa 1320
gtgtacctaa ttccgtccct gtcaacccta gatgtccttt cagccaaata gcgtataacg 1380
accaccacag cgaccaggaa ataaaaaaga gaaatgagta actggatgca aaacgatagt 1440
acgcatttct gaatggaata ttcagtgcca taattacctg cctgtcgtta aaaaattcac 1500
gtcctattta gagataagag cgacttcgcc gtttacttct cactattcca gttcttgtcg 1560
acatggcagc gctgtcattg cccctttcgc cgttactgca agcgctccgc aacgttgagc 1620
gagatcgata attcgtcgca tttctctctc atctgtagat aatcccgtag aggacagacc 1680
tgtgagtaac ccggcaacga acgcatctcc cgcccccgtg ctatcgacac aattcacaga 1740
cattccagca aaatggtgaa cttgtcctcg ataacagacc accacccctt ctgcaccttt 1800
agtcaccaac agcatggcga tctcatactc ttttgccagg gcgcatatat cctgatcgtt 1860
ctgtgttttt ccactgataa gtcgccattc ttcttccgag agcttgacga catccgccag 1920
ttgtagcgcc tgccgcaaac acaagcggag caaatgctcg tcttgccata gatcttcacg 1980
aatattagga tcgaagctga caaaacctcc ggcatgccgg atcgccgtca tcgcagtaaa 2040
tgcgctggta cgcgaaggct cggcagacaa cgcaattgaa cagagatgta accattcgcc 2100
atgtcgccag cagggcaagt ctgtcgtctc taaaaaaaga tcggcactgg ggcggaccat 2160
aaacgtaaat gaacgttccc cttgatcgtt cagatcgaca agcaccgtgg atgtccggtg 2220
ccattcatct tgcttcagat acgtgatatc gactccctca gttagcagcg ttctttgcat 2280
taacgcacca aaaggatcat cccccacccg acctataaac ccacttgttc cgcctaatct 2340
ggcgattccc accgcaacgt tagctggcgc gccgccagga caaggcagta ggcgcccgtc 2400
tgattctggc aagagatcta cgaccgcatc ccctaaaacc catactttgg ctgacatttt 2460
tttcccttaa attcatctga gttacgcata gtgataaacc tctttttcgc aaaatcgtca 2520
tggatttact aaaacatgca tattcgatca caaaacgtca tagttaacgt taacatttgt 2580
gatattcatc gcatttatga aagtaaggga ctttattttt ataaaagtta acgttaacaa 2640
ttcaccaaat ttgcttaacc aggatgatta aaatgacgca atctcgattg catgcggcgc 2700
aaaacgccct agcaaaactt catgagcacc ggggtaacac tttctatccc cattttcacc 2760
tcgcgcctcc tgccgggtgg atgaacgatc caaacggcct gatctggttt aacgatcgtt 2820
atcacgcgtt ttatcaacat catccgatga gcgaacactg ggggccaatg cactggggac 2880
atgccaccag cgacgatatg atccactggc agcatgagcc tattgcgcta gcgccaggag 2940
acgataatga caaagacggg tgtttttcag gtagtgctgt cgatgacaat ggtgtcctct 3000
cacttatcta caccggacac gtctggctcg atggtgcagg taatgacgat gcaattcgcg 3060
aagtacaatg tctggctacc agtcgggatg gtattcattt cgagaaacag ggtgtgatcc 3120
tcactccacc agaaggaatc atgcacttcc gcgatcctaa agtgtggcgt gaagccgaca 3180
catggtggat ggtagtcggg gcgaaagatc caggcaacac ggggcagatc ctgctttatc 3240
gcggcagttc gttgcgtgaa tggaccttcg atcgcgtact ggcccacgct gatgcgggtg 3300
aaagctatat gtgggaatgt ccggactttt tcagccttgg cgatcagcat tatctgatgt 3360
tttccccgca gggaatgaat gccgagggat acagttaccg aaatcgcttt caaagtggcg 3420
taatacccgg aatgtggtcg ccaggacgac tttttgcaca atccgggcat tttactgaac 3480
ttgataacgg gcatgacttt tatgcaccac aaagcttttt agcgaaggat ggtcggcgta 3540
ttgttatcgg ctggatggat atgtgggaat cgccaatgcc ctcaaaacgt gaaggatggg 3600
caggctgcat gacgctggcg cgcgagctat cagagagcaa tggcaaactt ctacaacgcc 3660
cggtacacga agctgagtcg ttacgccagc agcatcaatc tgtctctccc cgcacaatca 3720
gcaataaata tgttttgcag gaaaacgcgc aagcagttga gattcagttg cagtgggcgc 3780
tgaagaacag tgatgccgaa cattacggat tacagctcgg cactggaatg cggctgtata 3840
ttgataacca atctgagcga cttgttttgt ggcggtatta cccacacgag aatttagacg 3900
gctaccgtag tattcccctc ccgcagcgtg acacgctcgc cctaaggata tttatcgata 3960
catcatccgt ggaagtattt attaacgacg gggaagcggt gatgagtagt cgaatctatc 4020
cgcagccaga agaacgggaa ctgtcgcttt atgcctccca cggagtggct gtgctgcaac 4080
atggagcact ctggctactg ggttaacata atatcaggtg gaacaacgga tcaacagcgg 4140
gcaagggatc cacgaagctt cccatggtga cgtcaccggt aaaccagcaa tagacataag 4200
cggctattta acgaccctgc cctgaaccga cgaccgggtc gaatttgctt tcgaatttct 4260
gccattcatc cgcttattat acttattcag gcgtagcacc aggcgtttaa gggcaccaat 4320
aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat 4380
taagcattct gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg 4440
gcatcagcac cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga 4500
agttgtccat attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg 4560
agacgaaaaa catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac 4620
acgccacatc ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc 4680
agagcgatga aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat 4740
cccatatcac cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca 4800
ggcgggcaag aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct 4860
ttaaaaaggc cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact 4920
gaaatgcctc aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag 4980
tgattttttt ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata 5040
cgcccggtag tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa 5100
cgtctcattt tcgccaaaag ttggcccagg gcttcccggt atcaacaggg acaccaggat 5160
ttatttattc tgcgaagtga tcttccgtca caggtattta ttcggcgcaa agggcctcgt 5220
gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg 5280
cacttttcgg ggaaatgtgc gcgcccgcgt tcctgctggc gctgggcctg tttctggcgc 5340
tggacttccc gctgttccgt cagcagcttt tcgcccacgg ccttgatgat cgcggcggcc 5400
ttggcctgca tatcccgatt caacggcccc agggcgtcca gaacgggctt caggcgctcc 5460
cgaaggtctc gggccgtctc ttgggcttga tcggccttct tgcgcatctc acgcgctcct 5520
gcggcggcct gtagggcagg ctcatacccc tgccgaaccg cttttgtcag ccggtcggcc 5580
acggcttccg gcgtctcaac gcgctttgag attcccagct tttcggccaa tccctgcggt 5640
gcataggcgc gtggctcgac cgcttgcggg ctgatggtga cgtggcccac tggtggccgc 5700
tccagggcct cgtagaacgc ctgaatgcgc gtgtgacgtg ccttgctgcc ctcgatgccc 5760
cgttgcagcc ctagatcggc cacagcggcc gcaaacgtgg tctggtcgcg ggtcatctgc 5820
gctttgttgc cgatgaactc cttggccgac agcctgccgt cctgcgtcag cggcaccacg 5880
aacgcggtca tgtgcgggct ggtttcgtca cggtggatgc tggccgtcac gatgcgatcc 5940
gccccgtact tgtccgccag ccacttgtgc gccttctcga agaacgccgc ctgctgttct 6000
tggctggccg acttccacca ttccgggctg gccgtcatga cgtactcgac cgccaacaca 6060
gcgtccttgc gccgcttctc tggcagcaac tcgcgcagtc ggcccatcgc ttcatcggtg 6120
ctgctggccg cccagtgctc gttctctggc gtcctgctgg cgtcagcgtt gggcgtctcg 6180
cgctcgcggt aggcgtgctt gagactggcc gccacgttgc ccattttcgc cagcttcttg 6240
catcgcatga tcgcgtatgc cgccatgcct gcccctccct tttggtgtcc aaccggctcg 6300
acgggggcag cgcaaggcgg tgcctccggc gggccactca atgcttgagt atactcacta 6360
gactttgctt cgcaaagtcg tgaccgccta cggcggctgc ggcgccctac gggcttgctc 6420
tccgggcttc gccctgcgcg gtcgctgcgc tcccttgcca gcccgtggat atgtggacga 6480
tggccgcgag cggccaccgg ctggctcgct tcgctcggcc cgtggacaac cctgctggac 6540
aagctgatgg acaggctgcg cctgcccacg agcttgacca cagggattgc ccaccggcta 6600
cccagccttc gaccacatac ccaccggctc caactgcgcg gcctgcggcc ttgccccatc 6660
aattttttta attttctctg gggaaaagcc tccggcctgc ggcctgcgcg cttcgcttgc 6720
cggttggaca ccaagtggaa ggcgggtcaa ggctcgcgca gcgaccgcgc agcggcttgg 6780
ccttgacgcg cctggaacga cccaagccta tgcgagtggg ggcagtcgaa ggcgaagccc 6840
gcccgcctgc cccccgagac ctgcaggggg gggggggcgc tgaggtctgc ctcgtgaaga 6900
aggtgttgct gactcatacc aggcctgaat cgccccatca tccagccaga aagtgaggga 6960
gccacggttg atgagagctt tgttgtaggt ggaccagttg gtgattttga acttttgctt 7020
tgccacggaa cggtctgcgt tgtcgggaag atgcgtgatc tgatccttca actcagcaaa 7080
agttcgattt attcaacaaa gccgccgtcc cgtcaagtca gcgtaatgct ctgccagtgt 7140
tacaaccaat taaccaattc tgattagaaa aactcatcga gcatcaaatg aaactgcaat 7200
ttattcatat caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga 7260
gaaaactcac cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg 7320
actcgtccaa catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt 7380
gagaaatcac catgagtgac gactgaatcc ggtgagaatg gcaaaagctt atgcatttct 7440
ttccagactt gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc 7500
aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa 7560
ggacaattac aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca 7620
atattttcac ctgaatcagg atattcttct aatacctgga atgctgtttt cccggggatc 7680
gcagtggtga gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga 7740
ggcataaatt ccgtcagcca gtttagtctg accatctcat ctgtaacatc attggcaacg 7800
ctacctttgc catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcgatag 7860
attgtcgcac ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca 7920
tccatgttgg aatttaatcg cggcctcgag caagacgttt cccgttgaat atggctcata 7980
acaccccttg tattactgtt tatgtaagca gacagtttta ttgttcatga tgatatattt 8040
ttatcttgtg caatgtaaca tcagagattt tgagacacaa cgtggctttc cccccccccc 8100
ctgcaggtcc cgagcctcac ggcggcgagt gcgggggttc caagggggca gcgccacctt 8160
gggcaaggcc gaaggccgcg cagtcgatca acaagccccg gaggggccac tttttgccgg 8220
agggggagcc gcgccgaagg cgtgggggaa ccccgcaggg gtgcccttct ttgggcacca 8280
aagaactaga tatagggcga aatgcgaaag acttaaaaat caacaactta aaaaaggggg 8340
gtacgcaaca gctcattgcg gcaccccccg caatagctca ttgcgtaggt taaagaaaat 8400
ctgtaattga ctgccacttt tacgcaacgc ataattgttg tcgcgctgcc gaaaagttgc 8460
agctgattgc gcatggtgcc gcaaccgtgc ggcaccctac cgcatggaga taagcatggc 8520
cacgcagtcc agagaaatcg gcattcaagc caagaacaag cccggtcact gggtgcaaac 8580
ggaacgcaaa gcgcatgagg cgtgggccgg gcttattgcg aggaaaccca cggcggcaat 8640
gctgctgcat cacctcgtgg cgcagatggg ccaccagaac gccgtggtgg tcagccagaa 8700
gacactttcc aagctcatcg gacgttcttt gcggacggtc caatacgcag tcaaggactt 8760
ggtggccgag cgctggatct ccgtcgtgaa gctcaacggc cccggcaccg tgtcggccta 8820
cgtggtcaat gaccgcgtgg cgtggggcca gccccgcgac cagttgcgcc tgtcggtgtt 8880
cagtgccgcc gtggtggttg atcacgacga ccaggacgaa tcgctgttgg ggcatggcga 8940
cctgcgccgc atcccgaccc tgtatccggg cgagcagcaa ctaccgaccg gccccggcga 9000
ggagccgccc agccagcccg gcattccggg catggaacca gacctgccag ccttgaccga 9060
aacggaggaa tgggaacggc gcgggcagca gcgcctgccg atgcccgatg agccgtgttt 9120
tctggacgat ggcgagccgt tggagccgcc gacacgggtc acgctgccgc gccggtagca 9180
cttgggttgc gcagcaaccc gtaagtgcgc tgttccagac tatcggctgt agccgcctcg 9240
ccgccctata ccttgtctgc ctccccgcgt tgcgtcgcgg tgcatggagc cgggccacct 9300
cgacctgaat ggaagcc 9317
Claims (7)
- 재조합 박테리아로서, 상기 박테리아는, 게놈 내에,
(a) 수크로스 수송체(sucrose transporter) 활성을 갖는 폴리펩티드 또는 폴리펩티드 복합체를 암호화하는 하나 이상의 뉴클레오티드 서열;
(b) 프룩토키나아제(fructokinase) 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열; 및
(c) 수크로스 하이드롤라아제(sucrose hydrolase) 활성을 갖는 폴리펩티드를 암호화하는 뉴클레오티드 서열을 포함하며,
(i) (a), (b) 및 (c)는 각각 동일하거나 또는 다른 프로모터에 작동가능하게 연결되고;
(ii) (a), (b) 및 (c)는 yihP 유전자 또는 그 상동체와 yihO 유전자 또는 그 상동체 사이의 게놈 내로 통합되며;
(iii) 상기 박테리아는 게놈 내의 다른 위치에 통합된 (a), (b) 및 (c)를 포함하는 박테리아보다 더 큰 속도로 수크로스를 대사하는 재조합 박테리아. - 제1항에 있어서, 수크로스 하이드롤라아제 활성을 갖는 폴리펩티드는 EC 3.2.1.26 또는 EC 2.4.1.7로서 분류되는 재조합 박테리아.
- 제1항에 있어서, 프룩토키나아제 활성을 갖는 폴리펩티드는 EC 2.7.1.4, EC 2.7.1.3 또는 EC 2.7.1.1로서 분류되는 재조합 박테리아.
- 제1항에 있어서, 에스케리키아(Escherichia)속, 클렙시엘라(Klebsiella)속, 시트로박터(Citrobacter)속, 및 에어로박터(Aerobacter)속으로 이루어진 군으로부터 선택되는 재조합 박테리아.
- 제4항에 있어서, 에스케리키아 콜라이(Escherichia coli)인 재조합 박테리아.
- 제1항에 있어서, 1,3-프로판다이올, 글리세롤 및/또는 3-하이드록시프로피온산을 생산하는 재조합 박테리아.
- 수크로스로부터 글리세롤, 1,3-프로판다이올 및/또는 3-하이드록시프로피온산을 제조하는 방법으로서,
a) 수크로스의 존재 하에서 제6항의 재조합 박테리아를 배양하는 단계; 및
b) 생산된 글리세롤, 1,3-프로판다이올 및/또는 3-하이드록시프로피온산을 회수하는 단계를 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/210,550 US8673602B2 (en) | 2011-08-16 | 2011-08-16 | Recombinant bacteria having improved sucrose utilization |
US13/210,550 | 2011-08-16 | ||
PCT/US2012/044088 WO2013025286A1 (en) | 2011-08-16 | 2012-06-25 | Recombinant bacteria having improved sucrose utilization |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140054232A true KR20140054232A (ko) | 2014-05-08 |
Family
ID=47712909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147006604A KR20140054232A (ko) | 2011-08-16 | 2012-06-25 | 수크로스 이용성이 향상된 재조합 박테리아 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8673602B2 (ko) |
JP (1) | JP2014524255A (ko) |
KR (1) | KR20140054232A (ko) |
CN (1) | CN103732735A (ko) |
AU (1) | AU2012295505A1 (ko) |
BR (1) | BR112014003486A2 (ko) |
WO (1) | WO2013025286A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9017961B2 (en) * | 2012-03-05 | 2015-04-28 | E.I. Du Pont De Nemours And Company | Recombinant bacteria comprising novel sucrose transporters |
US8686114B2 (en) * | 2012-03-05 | 2014-04-01 | E I Du Pont De Nemours And Company | Variant sucrose transporter polypeptides |
US20180371509A1 (en) * | 2015-12-16 | 2018-12-27 | Kaneka Corporation | Pha-producing microorganism having sucrose assimilability, and method for producing pha using said microorganism |
CN108384796B (zh) * | 2018-03-05 | 2021-11-26 | 北京化工大学 | 一种利用蔗糖生物合成d-葡萄糖二酸的方法 |
EP4263816A1 (en) * | 2020-12-18 | 2023-10-25 | Inbiose N.V. | Variant sucrose permease polypeptides |
CN117074699B (zh) * | 2023-10-17 | 2024-01-12 | 中国农业大学 | 一种筛选代谢蔗糖的干酪乳杆菌发酵剂的方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6432686B1 (en) * | 1998-05-12 | 2002-08-13 | E. I. Du Pont De Nemours And Company | Method for the production of 1,3-propanediol by recombinant organisms comprising genes for vitamin B12 transport |
FR2796081B1 (fr) * | 1999-07-09 | 2003-09-26 | Agronomique Inst Nat Rech | Procede de preparation du 1,3-propanediol par un micro-organisme recombinant en l'absence de coenzyme b12 ou de l'un de ses precurseurs |
RU2212447C2 (ru) | 2000-04-26 | 2003-09-20 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Штамм escherichia coli - продуцент аминокислоты (варианты) и способ получения аминокислот (варианты) |
KR101037354B1 (ko) * | 2007-09-07 | 2011-05-26 | 한국과학기술원 | 수크로스로부터 폴리락틱산 또는 폴리락틱산 공중합체를제조할 수 있는 재조합 미생물 및 이러한 미생물을이용하여 수크로스로부터 폴리락틱산 또는 락틱산공중합체를 제조하는 방법 |
AU2008339217A1 (en) | 2007-12-18 | 2009-06-25 | Korea Advanced Institute Of Science And Technology | Recombinant microorganism having an ability of using sucrose as a carbon source |
ES2429305T3 (es) | 2008-11-07 | 2013-11-14 | Metabolic Explorer | Utilización de la sacarosa como sustrato para la producción fermentativa de 1,2-propanodiol |
US20110136190A1 (en) * | 2009-12-04 | 2011-06-09 | E. I. Du Pont De Nemours And Company | Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose |
US8129170B1 (en) * | 2010-12-06 | 2012-03-06 | E.I. Du Pont De Nemours And Company | Recombinant bacteria having the ability to metabolize sucrose |
US8222000B2 (en) * | 2010-12-06 | 2012-07-17 | E I Du Pont De Nemours And Company | Recombinant bacteria having the ability to metabolize sucrose |
-
2011
- 2011-08-16 US US13/210,550 patent/US8673602B2/en not_active Expired - Fee Related
-
2012
- 2012-06-25 AU AU2012295505A patent/AU2012295505A1/en not_active Abandoned
- 2012-06-25 JP JP2014525999A patent/JP2014524255A/ja not_active Abandoned
- 2012-06-25 KR KR1020147006604A patent/KR20140054232A/ko not_active Application Discontinuation
- 2012-06-25 BR BR112014003486A patent/BR112014003486A2/pt not_active IP Right Cessation
- 2012-06-25 WO PCT/US2012/044088 patent/WO2013025286A1/en active Application Filing
- 2012-06-25 CN CN201280039101.9A patent/CN103732735A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20130045519A1 (en) | 2013-02-21 |
CN103732735A (zh) | 2014-04-16 |
AU2012295505A1 (en) | 2014-01-23 |
BR112014003486A2 (pt) | 2018-06-19 |
WO2013025286A1 (en) | 2013-02-21 |
US8673602B2 (en) | 2014-03-18 |
JP2014524255A (ja) | 2014-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20140054233A (ko) | 박테리아에서 더욱 빠른 수크로스 이용을 가능하게 하는 변이형 수크로스 수송체 폴리펩티드 | |
KR20130125785A (ko) | 수크로스 대사능을 갖는 재조합 박테리아 | |
KR20140132392A (ko) | 신규한 수크로스 수송체를 포함하는 재조합 박테리아 | |
KR20140054232A (ko) | 수크로스 이용성이 향상된 재조합 박테리아 | |
AU2010325895B2 (en) | Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose | |
US8222000B2 (en) | Recombinant bacteria having the ability to metabolize sucrose | |
KR20140135803A (ko) | 변이체 수크로스 수송체 폴리펩티드 | |
AU2014274643B2 (en) | Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |