KR20140109922A - 연관된 방선균의 유전적 형질전환을 위한 플라스미드인 액티노플라네스 sp. SE50/110으로부터 유래한 신규한 방선균류 통합 및 접합 인자 - Google Patents
연관된 방선균의 유전적 형질전환을 위한 플라스미드인 액티노플라네스 sp. SE50/110으로부터 유래한 신규한 방선균류 통합 및 접합 인자 Download PDFInfo
- Publication number
- KR20140109922A KR20140109922A KR1020147018467A KR20147018467A KR20140109922A KR 20140109922 A KR20140109922 A KR 20140109922A KR 1020147018467 A KR1020147018467 A KR 1020147018467A KR 20147018467 A KR20147018467 A KR 20147018467A KR 20140109922 A KR20140109922 A KR 20140109922A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- arg
- leu
- thr
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/365—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinoplanes (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/76—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 발명은 방선균류 통합 및 접합 인자(AICE)의 구조와 유사한 액티노플라네스 sp. SE50/110의 완전한 게놈 서열 내 자연적(innate) DNA 서열에 관한 것이다. 관련 AICE는 이전에 다른 박테리아의 유전자 조작 방법 구축에 사용되었다. 여기에서, 본 발명자들은 액티노플라네스 sp. SE50/110에서 발견된 특이적 AICE의 독특한 특징을 기술하였으며, 이것은 공지된 다른 AICE와는 전반적으로 명백하게 다르지만 다른 종의 기타 특성화된 AICE와 다양한 서열 유사성을 갖는 일부를 공유한다.
Description
원핵생물 액티노플라네스(Actinoplanes) sp. SE50/110은 알파-글루코시다제 저해제 아카보즈(acarbose)를 생산하며, 아카보즈는 세계적으로 제2형 진성 당뇨병 치료에 사용되고 있다. 제2형 당뇨병의 발병이 세계적으로 급속하게 늘어가고 있는 사실에 기초하여 장차 아카보즈의 수요가 증가할 것으로 예상된다. 이러한 예상에 부응하기 위해서, 아카보즈 수율 증대를 목표로 하여 이 균주와 그의 유도체에 대한 유전자 조작이 수행되어야 한다. 그러나, 현재로는 이 균주에 대한 어떠한 유전자 조작 기술도 존재하지 않아 균주를 개선하는 방법을 제한하고 있다.
본 발명은 방선균류 통합 및 접합 인자(AICE)의 구조와 유사한 액티노플라네스 sp. SE50/110의 완전한 게놈 서열 내 자연적(innate) DNA 서열에 관한 것이다. 관련 AICE는 이전에 다른 박테리아의 유전자 조작 방법 구축에 사용되었다. 여기에서, 본 발명자들은 액티노플라네스 sp. SE50/110에서 발견된 특이적 AICE의 독특한 특징을 기술하였으며, 이것은 공지된 다른 AICE와는 전반적으로 명백하게 다르지만 다른 종의 기타 특성화된 AICE와 다양한 서열 유사성을 갖는 일부를 공유한다.
액티노플라네스 sp. SE50/110은 약 9.25 MB 크기의 G+C 함량이 높은 게놈을 갖는 그람 양성, 호기성 박테리아다(Schwientek et al., 2012). 의학적으로 중요한 이 유기체는 인간의 알파-글루코시다제를 저해하는 것(Caspary and Graf, 1979)으로 밝혀진 다양한 화학적 연관 물질의 천연 제조체이며, 이들은 약학적 응용에 특별히 적합화되었다(Frommer et al., 1975, 1977 a, 1977 b, 1979). 구체적으로, 잘 특성화된 아카보즈 유전자 클러스터(Wehmeier and Piepersberg, 2004)에서 코딩된 효소에 의해 합성된 슈도테트라사카라이드(pseudotetrasaccharide) 아카보즈는 세계적으로 제2형 진성 당뇨병(비인슐린 의존성)의 치료에 사용되고 있다.
제2형 진성 당뇨병은 전세계에서 2억 5천만 명 이상이 앓고 있는 만성 질환이다. 부적절하게 관리되거나 치료하지 않으면 신부전, 실명, 상처치유 지연 및 동맥질환, 예를 들어 관상동맥 죽상동맥경화증의 중증을 유발할 수 있다(IDF, 2009). 제2형 당뇨병 발생은 세계적으로 빠르게 증가하고 있으므로 아카보즈 같은 당뇨병 치료제에 대한 수요 증가를 예상해야만 한다. 슈도테트라사카라이드 아카보즈는 현재 야생형 박테리아 액티노플라네스 sp. SE50/110(ATCC 31044; CBS 674.73)을 기반으로 한 수율 최적화 균주의 산업적 발효에 의해 생산된다. 통상적인 돌연변이를 통한 균주의 고전적 최적화는 과거에 아카보즈 생산을 증가시키는 매우 성공적인 방법이었지만, 이 방법은 이제 그 한계에 도달한 것으로 보인다. 생산 효율을 더욱 증가시키기 위해 표적화된 유전자 조작방법이 적용되어야만 하고, 이것은 액티노플라네스 sp. SE50/110에 대한 작용성 형질전환 시스템을 필요로 한다. 이전 실험에서는 액티노플라네스 sp. SE50/110과 Actinoplanes friuliensis(및 짐작컨대 대부분의 다른 Actinoplanes spp.)가 다양한 노력에도 불구하고 전기천공법 또는 PEG-매개 형질전환 같은 표준 형질전환 방법이 허용되지 않는 것으로 나타났다(Heinzelmann et al., 2003). 이와 관련하여, 방선균류 통합 및 접합 인자 (AICE)가 액티노플라네스 sp. SE50/110 게놈(GenBank:CP003170)에 대해 동정되었으며, 이는 관련 종에 대해 이전에 보여진 바(Hosted et al., 2005)와 같은 목적으로 사용될 수 있다.
원핵생물 액티노플라네스(Actinoplanes) sp. SE50/110은 알파-글루코시다제 저해제 아카보즈(acarbose)를 생산하며, 아카보즈는 세계적으로 제2형 진성 당뇨병 치료에 사용되고 있다. 제2형 당뇨병의 발병이 세계적으로 급속하게 늘어가고 있는 사실에 기초하여 장차 아카보즈의 수요가 증가할 것으로 예상된다. 이러한 예상에 부응하기 위해서, 아카보즈 수율 증대를 목표로 하여 이 균주와 그의 유도체에 대한 유전자 조작이 수행되어야 한다. 그러나, 현재로는 이 균주에 대한 어떠한 유전자 조작 기술도 존재하지 않아 균주를 개선하는 방법을 제한하고 있다.
AICE는 절제/통합, 복제, 접합 전달 및 조절을 위한 작용 모듈을 갖는 고도로 보존된 구조적 구성을 보유하는 일종의 이동성 유전성분이다(te Poele, Bolhuis, et al., 2008). 독자적으로 복제가능한 이들은 내성과 대사형질 같은 작용을 코딩하는 추가 모듈의 획득을 매개한다고 알려져 있으며, 이는 특정 환경 조건 하에서 숙주에게 선택적 이점을 제공한다(Burrus and Waldor, 2004). 신규한 AICE는 pACPL로 표시되며 액티노플라네스 sp. SE50/110의 완전한 게놈 서열에서 동정되었다(도 1). 그의 13.6 kb 크기와 구조적 유전자 구성은 Micromonospora rosario, Salinispora tropica 또는 Streptomyces coelicolor(te Poele, Bolhuis, et al., 2008) 같은 밀접하게 연관된 종의 공지된 다른 AICE와 잘 부합한다.
도 1: 액티노플라네스 sp. SE50/110으로부터 유래한 새로 동정된 방선균류 통합 및 접합 인자(AICE) pACPL의 구조적 구성. 다른 AICE에서도 발견되는 전형적 유전자는 색깔에 따라 표시하였다: 절제/통합(오렌지색), 복제(노란색), 주전달 (main transfer)(진한 파란색), 접합(파란색), NUDIX 하이드롤라제(진한 녹색), 조절(녹색), 기타 주석이 달린 작용(빨간색), 미지 작용(회색).
도 2: 짝지어진(paired) 말단과 전체 게놈 숏건(shotgun) 파이로시퀀싱 (pyrosequencing) 결과물의 자동 조합된 어셈블리로 얻어진 571 액티노플라네스 sp. SE50/110 콘틱(contig)의 산포도. 염기당 데이터(reads)의 평균수는 21.12이고 플롯 내에 '평균'이라고 기재된 중심대각선으로 표시하였다. 추가 선들은 염기 당 데이터의 과다- 및 과소표시의 인자가 각각 최대 10 및 1/10 배 팩터임을 나타내고 있다. 축은 로그 스케일을 나타낸다. 대량 및 고도로 과다표시된 콘틱을 특정 기호로 강조하였다. 각 콘틱은 다음 기호 중 하나로 표시되었다: 다이아몬드형, 정상 콘틱; 사각형, 방선균류 통합 및 접합 인자(AICE)와 연관된 콘틱; 삼각형, 리보솜 오페론(rrn)에 연관된 콘틱; 원형, 트랜스포손(transposons)과 연관.
도 2: 짝지어진(paired) 말단과 전체 게놈 숏건(shotgun) 파이로시퀀싱 (pyrosequencing) 결과물의 자동 조합된 어셈블리로 얻어진 571 액티노플라네스 sp. SE50/110 콘틱(contig)의 산포도. 염기당 데이터(reads)의 평균수는 21.12이고 플롯 내에 '평균'이라고 기재된 중심대각선으로 표시하였다. 추가 선들은 염기 당 데이터의 과다- 및 과소표시의 인자가 각각 최대 10 및 1/10 배 팩터임을 나타내고 있다. 축은 로그 스케일을 나타낸다. 대량 및 고도로 과다표시된 콘틱을 특정 기호로 강조하였다. 각 콘틱은 다음 기호 중 하나로 표시되었다: 다이아몬드형, 정상 콘틱; 사각형, 방선균류 통합 및 접합 인자(AICE)와 연관된 콘틱; 삼각형, 리보솜 오페론(rrn)에 연관된 콘틱; 원형, 트랜스포손(transposons)과 연관.
대부분의 공지된 AICE는 그의 숙주 게놈 내에 게놈 (attB) 및 AICE (attP) 각각에 위치한 결합 부위 내에서 두 개의 짧은 동일 서열(att 동일성 세그먼트) 사이에 부위 특이적 재조합에 의해 tRNA 유전자의 3' 말단에 통합하여 존재한다(te Poele, Bolhuis, et al., 2008). pACPL에서, att 동일성 세그먼트는 43 nt의 크기이고 attB는 프롤린 tRNA 유전자의 3' 말단과 오버랩한다. 또한, attP 내의 동일성 세그먼트는 2개 미스매칭을 함유하는 2개의 21 nt 반복물: GTCACCCAGTTAGT(T/ C)AC(C/T)CAG이 측면에 배치된다. 이들은 Strepomyces ambofaciens의 AICE pSAM2에서 동정된 암 타입(arm-type) 부위에 대해 높은 유사성을 나타낸다. pSAM2에 대하여는 인테그라제(integrase)가 이러한 반복물에 결합하며 이들은 효과적인 재조합에 필수적인 것으로 나타났다(Raynal et al., 2002).
프롤린 tRNA 게놈 통합 부위 이외에, pACPL은 평균 액티노플라네스 sp. SE50/110 세포의 염색체외 성분으로서 적어도 12 카피(도 2) 내에 존재하는 것으로 나타났다(Schwientek et al., 2012). pACPL은 22 단백질 코딩 서열을 호스팅(hosting)한다.
본 발명의 방선균류 통합 및 접합 인자는
a) 서열번호 1의 서열을 갖는 폴리뉴클레오티드,
b) 엄격한(stringent) 조건 하에 (a)에서 특정된 폴리뉴클레오티드에 혼성화하는 폴리뉴클레오티드, 및
c) 서열번호 1의 서열과 적어도 90%의 동일성을 갖는 폴리뉴클레오티드를 포함하는 군에서 선택된다.
서열번호 1의 서열과 적어도 95%의 동일성을 갖는 AICE가 바람직하다. 서열번호 1의 서열과 적어도 98%의 동일성을 갖는 AICE가 더욱 바람직하다. 본 발명은 또한 상기한 방선균류 통합 및 접합 인자로 형질전환된 숙주 세포에 관한 것이다. 가장 바람직한 숙주 세포는 액티노플라네스 sp.이다. 숙주 세포는,
a) 숙주 세포를 유용한 배지에서 배양하고,
b) 배양물로부터 생성물을 수확하여
c) 생성물을 단리하고 정제하는 단계를 포함하는 생물학적 생성물의 제조방법에 유용하다.
본 방법에서 가장 바람직한 생성물은 아카보즈(acarbose)이다.
pACPL
의 22 단백질 코딩 서열에 대한 상세한 설명
int 유전자(게놈 위치 태그: ACPL_6310)는 388 아미노산 길이를 갖는 AICE의 인테그라제(integrase)를 코딩한다. 그 서열은 Streptomyces griseoflavus Tu4000의 인테그라제(GenBank: EFL40120.1)에 대하여 최초 383 아미노산 내에서 74%의 유사성을 나타낸다. 단백질의 인테그라제 도메인은 아미노산 182 - 365부터 위치하며 Int/Topo IB 시그니처 모티프(보존 도메인: cd01182)에 대해 높은 유사성(e-값 2.90e-21)을 나타낸다. 인테그라제는 두 개의 유사 결합 부위, 염색체 상의 attB와 AICE 상의 attP 사이에 발생하는 부위 특이적 재조합에 의한 tRNA 유전자 내로의 통합을 담당한다(te Poele, Bolhuis, et al., 2008).
xis 유전자(게놈 위치 태그: ACPL_6309)는 68 아미노산 길이를 갖는 AICE의 제거효소(excisionase)를 코딩한다. 이것은 Streptosporangium roseum DSM 43021의 가상 단백질(hypothetical protein) Sros_7036 (GenBank: ACZ89735.1)에 대하여 고도의 유사성을 나타낸다. 이 단백질은 아미노산 9-55 사이에 적당히 보존된(e-값: 1.31e-07) 나선 대 나선(helix-turn-helix) 모티프(pfam12728)를 함유한다. Xis는 증폭 및 다른 숙주로의 전달을 위한 제조에서 염색체로부터 AICE의 절제를 매개하기 위한 Int와의 조합에 필요하다(te Poele, Bolhuis, et al., 2008).
repSA 유전자(게놈 위치 태그: ACPL_6308)는 598 아미노산 길이를 갖는 AICE의 복제 개시 단백질을 코딩한다. 이 유전자는 Micromonospora aurantiaca ATCC 27029의 추정 플라스미드 복제 개시 단백질(GenBank: ADL48867.1)에 대해 고도의 유사성을 갖는다. 이 단백질은 Streptomyces ambofaciens의 잘 특성화된 RepSA 단백질과 유사하며, 회전고리형 복제 메카니즘(Hagege et al., 1993)을 적용하는 것으로 확인되었다.
aicel 유전자(게놈 위치 태그: ACPL_6307)는 97 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이것은 Micromonospora aurantiaca ATCC 27029의 가상 단백질 Micau_5360(GenBank: ADL48866.1)에 대해 최초 80 아미노산에서 68%의 유사성을 나타낸다.
spdA 유전자(게놈 위치 태그: ACPL_6306)는 107 아미노산 길이를 갖는 AICE의 추정 스프레드(spread) 단백질을 코딩한다. SpdA는 Frankia sp. CcI3의 스프레드 단백질(GenBank: ABD10289.1)에 대해 54%의 유사성을 나타낸다. 스프레드 단백질은 포크(pock) 형성에 연관되어 있으며, 이것은 공여체 세포로부터 AICE를 획득하는 과정에 있는 수용체 세포의 일시적 성장 지연을 나타낸다. 따라서, 스프레드 단백질은 균사체내 확산(intramycelial spread)을 돕는다(Kataoka et al., 1994; Grohmann et al, 2003; te Poele, Bolhuis, et al., 2008).
spdB 유전자(게놈 위치 태그: ACPL_6305)는 169 아미노산 길이를 갖는 AICE의 추정 스프레드 단백질을 코딩한다. SpdB는 Micromonospora rosaria의 스프레드 단백질(GenBank: AAX38998.1)에 대해 아미노산 40 - 131 사이에서 84%의 유사성을 나타낸다. 스프레드 단백질은 포크 형성에 연관되어 있으며, 이것은 공여체 세포로부터 AICE를 획득하는 과정에 있는 수용체 세포의 일시적 성장 지연을 나타낸다. 따라서, 스프레드 단백질은 균사체내 확산을 돕는다(Kataoka et al., 1994; Grohmann et al, 2003; te Poele, Bolhuis, et al., 2008). 시그널 펩티드가 SpdB에서 발견되었으며, 그의 절단부위는 위치 18인 것으로 추정된다. 또한, 3개의 막관통 나선이 위치 i53-70o75-97il09-l3lo에서 확인되었다.
aice2 유전자(게놈 위치 태그: ACPL_6304)는 96 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 Micromonospora aurantiaca ATCC 27029의 가상 단백질 Micau_5358(GenBank: ADL48864.1)에 대해 아미노산 12 - 89 사이에서 57%의 유사성을 나타낸다.
aice3 유전자(게놈 위치 태그: ACPL_6303)는 61 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 공용 데이터베이스 중의 어떤 단백질에 대해서도 의미 있는 유사성을 나타내지 않는다.
aice4 유전자(게놈 위치 태그: ACPL_6302)는 138 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 Micromonospora aurantiaca ATCC 27029의 가상 단백질 Micau_5357(GenBank: ADL48863.1)에 대해 최종 113 아미노산에서 69% 유사성을 나타낸다.
aice5 유전자(게놈 위치 태그: ACPL_6301)는 108 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 Micromonospora aurantiaca ATCC 27029의 가상 단백질 Micau_5356(GenBank: ADL48862.1)의 완전한 아미노산 서열에 대해 79% 유사성을 나타낸다. 이 단백질은 세포질외 작용(ECF)을 갖는 시그마 인자에 대해 낮은 pfam 히트(e-값 0.0022)를 갖는다. 시그마 인자들은 특정 유전자의 전사를 자극하기 위해 RNA 폴리머라제에 결합할 수 있다. 이들은 환경으로부터 자극을 받을 때 활성화되는 것으로 보이며, 종종 하나 이상의 네거티브 조절인자와 공동 전사된다(Helmann, 2002).
aice6 유전자(게놈 위치 태그: ACPL_6300)는 149 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 Verrucosispora maris AB-18-032의 가상 단백질 VAB18032_01645(GenBank: AEB47413.1)의 완전한 아미노산 서열에 대해 50% 유사성을 나타낸다.
aice7 유전자(게놈 위치 태그: ACPL_6299)는 66 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 공용 데이터베이스 중의 어떤 단백질에 대해서도 유사성을 나타내지 않는다. Aice7은 아미노산 9 - 31 범위에 있는 단일 막관통 나선을 함유한다.
tra 유전자(게놈 위치 태그: ACPL_6298)는 293 아미노산 길이를 갖는 AICE의 주요 전달 단백질을 코딩한다. 이 유전자는 Micromonospora aurantiaca ATCC 27029의 세포분화단백질(GenBank: ADL48859.1)에 대한 주요부분 전체에 걸쳐서 74%의 유사성을 나타낸다. Tra는 모든 AICE 및 스트렙토마이세스(Streptomyces) 트랜스퍼라제 유전자에서 발견된, 아미노산 29 - 187 사이의 FtsK/SpoIIIE 도메인에 대해 상당한 유사성(e-값 3.1e-14)을 갖는 도메인을 함유한다(te Poele, Bolhuis, et al., 2008). 몇몇 실험에서는 Tra의 동족체가 수용체 균주로의 이중가닥 DNA의 전좌 (translocation)를 담당하는 증거가 제공되었다. 전좌는 교배(mating) 균사체의 균사 팁에서 일어난다(Possoz et al., 2001 ; Reuther et al., 2006).
aice8 유전자(게놈 위치 태그: ACPL_6297)는 124 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 Mycobacterium colombiense CECT 3035의 FadE6 단백질(GenBank: EGT86701.1) 서열에 대해 아미노산 44 - 116 사이에서 44%의 유사성을 나타낸다. 완전한 FadE6 단백질은 아실-CoA 데히드로게나제와 비슷한 733 아미노산을 갖지만, Aice8은 FadE6의 촉매성 도메인을 함유하지 않고 단지 124 아미노산 길이이기 때문에 유사한 작용을 갖지 않을 것으로 보인다.
aice9 유전자(게놈 위치 태그: ACPL_6296)는 320 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 Micromonospora aurantiaca ATCC 27029의 가상 단백질 Micau_5352(GenBank: ADL48858.1)에 대한 서열의 주요부분 전체에 걸쳐서 68%의 유사성을 나타낸다. 이 단백질은 위치 i32-51o57-79i88-110o-134i에 4개의 막관통 나선을 함유한다.
aice1O 유전자(게놈 위치 태그: ACPL_6295)는 69 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 공용 데이터베이스 중의 어떠한 단백질과도 의미 있는 유사성을 나타내지 않는다.
pra 유전자(게놈 위치 태그: ACPL_6294)는 repSA, xis 및 int 유전자의 활성인자를 코딩하는 것으로 보인다. 이 유전자는 105 아미노산 길이를 가지며 Micromonospora aurantiaca ATCC 27029의 가상 단백질 Micau_5352(GenBank: ADL48857.1)에 대한 완전한 서열 전체에 걸쳐서 90% 유사성을 나타낸다. AICE의 전달과 복제를 조절하는 Pra는 Streptomyces ambofaciens의 AICE pSAM2 내에서 전사 조절인자 KorSA에 의해 억제되는 것으로 생각된다(Sezonov et al., 2000). Pra를 억제하여 AICE는 염색체 상에서 그의 통합된 형태로 남는다.
reg 유전자(게놈 위치 태그: ACPL_6293)는 444 아미노산 길이를 갖는 AICE의 조절 단백질을 코딩한다. 이 유전자는 Streptomyces cattleya NRRL 8057의 추정 조절인자(GenBank: CCB75999.1)에 대한 완전한 서열 전체에 걸쳐서 50% 유사성을 나타낸다. Reg는 나선-대-나선(helix-turn-helix) 도메인을 함유하며, 아미노산 4 - 72 범위이다. pSAM2로부터의 KorSA와 Reg 간 서열 유사성은 매우 낮지만, pra와 nud 유전자 사이의 reg 위치는 KorSA에 대한 동족체와 유사한 Reg의 지표일 수 있으며, 이것은 주로 유전적 구조 내에서 발견된다(te Poele, Bolhuis, et al., 2008).
nud 유전자(게놈 위치 태그: ACPL_6292)는 아미노산 29 - 144 사이의 NUDIX-하이드롤라제 도메인을 함유하는 단백질을 코딩한다. 이 유전자는 172 아미노산 크기를 가지며, 스트렙토마이세스 sp. AA4 및 밀접하게 연관된 종의 다양한 NUDIX 하이드롤라제의 가상 단백질(GenBank: EFL09132.1)에 대한 서열 전체에 걸쳐서 72%의 유사성을 나타낸다. Nud는 pSAM2의 Pif 단백질에 대해 아미노산 21 - 108 사이에서 42%의 유사성을 나타낸다. Pif는 또한 NUDIX-하이드롤라제 도메인을 함유하며 세포내 시그널링에 연관된 것으로 나타났고, 이것은 pSAM2 담지 세포들 사이에서 불필요한 전달을 방지하기 위해 AICE의 복제 및 전달을 저해하는 것으로 보인다(Possoz et al., 2003; te Poele, Bolhuis, et al., 2008). 따라서, pACPL 내 Pra, Reg 및 Nud는 Pra와 같은 유사한 조절 메카니즘을 따르고, KorSA 및 Pif는 pSAM2에 대한 것일 가능성이 있다.
mdp 유전자(게놈 위치 태그: ACPL_6291)는 80 아미노산 길이를 갖는 금속 의존성 포스포하이드롤라제를 코딩한다. 이 유전자는 Frankia sp. CcI3의 금속 의존성 포스포하이드롤라제(GenBank: ABD10513.1)에 대해 그의 서열 전체에 걸쳐서 66%의 유사성을 나타낸다. Mdp 코딩 유전자는 주로 다른 AICE 상에서 pra, reg 및 nud 동족체와의 클러스터로 발견된다(te Poele, Bolhuis, et al., 2008). 금속 의존성 포스포하이드롤라제는 신호 전달 또는 핵산 대사에 연관될 수 있다(te Poele, Samborskyy, et al., 2008).
aice11 유전자(게놈 위치 태그: ACPL_6290)는 256 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 공용 데이터베이스 중의 어떠한 단백질에 대해서도 의미 있는 유사성을 나타내지 않는다.
aice12 유전자(게놈 위치 태그: ACPL_6289)는 93 아미노산 길이를 갖는 작용이 알려지지 않은 단백질을 코딩한다. 이 유전자는 공용 데이터베이스 중의 어떠한 단백질에 대해서도 의미 있는 유사성을 나타내지 않는다.
참고문헌
Burrus, V., Waldor, M.K., 2004. Shaping bacterial genomes with integrative and conjugative elements. Res. Microbiol 155, 376-386.
Caspary, W.F., Graf, S., 1979. Inhibition of human intestinal alpha-glucosidehydrolases by a new complex oligosaccharide. Res Exp Med (Berl) 175, 1-6.
Frommer, W., Junge, B., Keup, U., Mueller, L., Schmidt, D., 1977. Amino sugar derivatives. 독일 특허 제DE 2347782호 (미국 특허 제4,062,950호).
Frommer, W., Junge, B., Muelller, L., Schmidt, D., Truscheit, E., 1979. Neue Enzyminhibitoren aus Mikroorganismen. Planta Med 35, 195-217.
Frommer, W., Puls, W., Schaefer, D., Schmidt, D., 1975. Glycoside-hydrolase enzyme inhibitors. 독일 특허 제DE 2064092호 (미국 특허 제3,876,766호).
Frommer, W., Puls, W., Schmidt, D., 1977. Process for the production of a saccharase inhibitor. 독일 특허 제DE 2209834호 (미국 특허 제4,019,960호).
Grohmann, E., Muth, G., Espinosa, M., 2003. Conjugative Plasmid Transfer in Gram-Positive Bacteria. Microbiol. Mol. Biol. Rev. 67, 277-301.
Hagege, J., Pernodet, J.L., Friedmann, A., Guerineau, M., 1993. Mode and origin of replication of pSAM2, a conjugative integrating element of Streptomyces ambofaciens. Mol. Microbiol. 10, 799-812.
Heinzelmann, E., Berger, S., Puk, O., Reichenstein, B., Wohlleben, W., Schwartz, D., 2003. A Glutamate Mutase Is Involved in the Biosynthesis of the Lipopeptide Antibiotic Friulimicin in Actinoplanes friuliensis. Antimicrob Agents Chemother 47, 447-457.
Helmann, J.D., 2002. The extracytoplasmic function (ECF) sigma factors. Adv. Microb. Physiol. 46, 47-110.
Hosted, T.J., Jr, Wang, T., Horan, A.C., 2005. Characterization of the Micromonospora rosaria pMR2 plasmid and development of a high G+C codon optimized integrase for site-specific integration. Plasmid 54, 249-258.
IDF, 2009. IDF Diabetes Atlas, 4th edn. International Diabetes Federation, Brussels, Belgium: International Diabetes Federation.
Kataoka, M., Kiyose, Y.M., Michisuji, Y., Horiguchi, T., Seki, T., Yoshida, T., 1994. Complete Nucleotide Sequence of the Streptomyces nigrifaciens Plasmid, pSN22: Genetic Organization and Correlation with Genetic Properties. Plasmid 32, 55-69.
te Poele, E.M., Bolhuis, H., Dijkhuizen, L., 2008. Actinomycete integrative and conjugative elements. Antonie Van Leeuwenhoek 94, 127-143.
te Poele, E.M., Samborskyy, M., Oliynyk, M., Leadlay, P.F., Bolhuis, H., Dijkhuizen, L., 2008. Actinomycete integrative and conjugative pMEA-like elements of Amycolatopsis and Saccharopolyspora decoded. Plasmid 59, 202-216.
Possoz, C, Gagnat, J., Sezonov, G., Guerineau, M., Pernodet, J.-L., 2003. Conjugal immunity of Streptomyces strains carrying the integrative element pSAM2 is due to the pif gene (pSAM2 immunity factor). Mol. Microbiol. 47, 1385-1393.
Possoz, C, Ribard, C, Gagnat, J., Pernodet, J.L., Guerineau, M., 2001. The integrative element pSAM2 from Streptomyces: kinetics and mode of conjugal transfer. Mol. Microbiol. 42, 159-166.
Raynal, A., Friedmann, A., Tuphile, K., Guerineau, M., Pernodet, J.-L., 2002. Characterization of the attP site of the integrative element pSAM2 from Streptomyces ambofaciens. Microbiology (Reading, Engl.) 148, 61-67.
Reuther, J., Gekeler, C, Tiffert, Y., Wohlleben, W., Muth, G., 2006. Unique conjugation mechanism in mycelial streptomycetes: a DNA-binding ATPase translocates unprocessed plasmid DNA at the hyphal tip. Mol. Microbiol. 61, 436-446.
Schwientek, P., Szczepanowski, R., Rueckert, C, Kalinowski, J., Klein, A., Selber, K., Wehmeier, U.F., Stoye, J., Puehler, A., 2012. The complete genome sequence of the acarbose producer Actinoplanes sp. SE50/110. BMC Genomics 1-2.
Sezonov, G., Possoz, C., Friedmann, A., Pernodet, J.L., Guerineau, M., 2000. KorSA from the Streptomyces integrative element pSAM2 is a central transcriptional repressor: target genes and binding sites. J. Bacteriol. 182, 1243-1250.
Wehmeier, U.F., Piepersberg, W., 2004. Biotechnology and molecular biology of the alpha-glucosidase inhibitor acarbose. Appl. Microbiol. Biotechnol 63, 613-625.
SEQUENCE LISTING
<110> Bayer Pharma AG
<120> New actinomycete integrative and conjugative element from
Actinoplanes sp. SE50/110 as plasmid for genetic transformation
of related Actinobacteria
<130> N/A
<160> 45
<170> PatentIn version 3.5
<210> 1
<211> 13643
<212> DNA
<213> Actinoplanes sp. SE50/110
<220>
<221> gene
<222> (112)..(1278)
<223> gene name: int; coding strand: reverse
<220>
<221> gene
<222> (1275)..(1481)
<223> gene name: xis; coding strand: reverse
<220>
<221> gene
<222> (1510)..(3306)
<223> gene name: repSA; coding strand: reverse
<220>
<221> gene
<222> (3308)..(3601)
<223> gene name: aice1; coding strand: reverse
<220>
<221> gene
<222> (3598)..(3921)
<223> gene name: spdA; coding strand: reverse
<220>
<221> gene
<222> (3918)..(4427)
<223> gene name: spdB; coding strand: reverse
<220>
<221> gene
<222> (4424)..(4714)
<223> gene name: aice2; coding strand: reverse
<220>
<221> gene
<222> (4711)..(4896)
<223> gene name: aice3; coding strand: reverse
<220>
<221> gene
<222> (4893)..(5309)
<223> gene name: aice4; coding strand: reverse
<220>
<221> gene
<222> (5306)..(5632)
<223> gene name: aice5; coding strand: reverse
<220>
<221> gene
<222> (5629)..(6078)
<223> gene name: aice6; coding strand: reverse
<220>
<221> gene
<222> (6165)..(6365)
<223> gene name: aice7; coding strand: reverse
<220>
<221> gene
<222> (6362)..(7243)
<223> gene name: tra; coding strand: reverse
<220>
<221> gene
<222> (7310)..(7684)
<223> gene name: aice8; coding strand: reverse
<220>
<221> gene
<222> (7696)..(8616)
<223> gene name: aice9; coding strand: reverse
<220>
<221> gene
<222> (8731)..(8940)
<223> gene name: aice10; coding strand: reverse
<220>
<221> gene
<222> (9109)..(9426)
<223> gene name: pra; coding strand: reverse
<220>
<221> gene
<222> (9663)..(10997)
<223> gene name: reg; coding strand: forward
<220>
<221> gene
<222> (11012)..(11530)
<223> gene name: nud; coding strand: forward
<220>
<221> gene
<222> (11542)..(11784)
<223> gene name: mdp; coding strand: reverse
<220>
<221> gene
<222> (11881)..(12651)
<223> gene name: aice11; coding strand: forward
<220>
<221> gene
<222> (12626)..(12907)
<223> gene name: aice12; coding strand: reverse
<400> 1
ctgggggtca aggggtcgca ggttcaaatc ctgtcagccc gacgcaggtc agagggcata 60
tctcatcgaa ggatatgccc tctctgcatg tctgggtaac taactgggtg actaagcccc 120
aggagtgtca tccggaccga agatccggtc catggccacc gcgccgttca gcagaaccgg 180
gcgcagttgg tggcggtaaa cggtctcggt gatcgaggtg ccggaatgac cacacaggtc 240
ggcgatttcc tcgatgctca tcccattgtc ggacagcagc gaaacgaaac tgtgccgtaa 300
ttcgcggggc gtccattcag ccggattcat tccggggaca gccgcgacga tcgcgcggaa 360
ggctcgcagc acgttgtgcc ggtcgagctg ggtgccgacc ttgctggcgc agacgtagtc 420
atccggtcgt ggatctccgt gcgccgcgcg ttgcgcggtg aggacccgga cacagcgaac 480
cggcagggcg agtgaacgcc gtgacttctt ggtcttggtg tcaccgtggg cgcgcaccga 540
atgccatacg tggatggccg gcggaatcgg tggctcggcg tccggacgtc cgaccaggtc 600
gacgtgctgc caggtgagtt ctcgcagttc ctcggtacga gcaccggtca gcagcgacaa 660
aactacatac gcgtgcaggc tgctcgactc ggcagcgacg aggagcgctt tggcctgctc 720
gtaggtgagt gacttggagg gtcgtccggc ggtgccggtc ggtaccttgc agagtgcgac 780
gacgttgcgc atgaccttgt cgcgggccat cgctcggttg atggcgcgat tcgcgatcga 840
gtgcagcagt cgcagcgtgc gggtgctgag aatcttggct ttgtcggcca gccacctgtc 900
aatgtcggtg gcgctgagtt ccttctgttt gctggggtca cggagcttgc gtgcaccgat 960
cgccgggatg atgtgaccgt tggccagcag cgtgtagttg ttgaccgttt cctcgtcgac 1020
gtcgggaagt ccgtaggtga gccagtccgt gacggcgtcg gcgaccgtgt agccggtcgt 1080
ggggatcgac agcccgtcct ggtactcacg gatcttctga cggagtgcat tgttggcctc 1140
ggtcttggtc ttgccgcttg ccttacggac gatgcgttta ccggccgggg tgtatccgac 1200
ggtgaccgag gcgatccagc gctggcgctg ttcgtcccag tgcagcccgc cgtctccacg 1260
gctgcggcgt ttggtcatgc ggcgactcct ttcttgcttt cctgttcgag cagggtgacg 1320
taggcggtga tggcgctggc cgggaccagc cgggtgcgac cctccttgac ggtgcgcaac 1380
cgccccgagc ggatcagttc atagatgacg gaacggctca agctcagcat ccgcatggct 1440
tccgggatgc ggtagagcgc cttcggggtg atgccgtcca acgggtgact cctccttttg 1500
cggcttcgat caggcggcgt tcaaggcgac aggccgggac gtgctcgctt cgtgcgcgag 1560
ttcctctcgg ccgatggctt gtcgctcgcg ggcctgagcc gcagcggtgt tggcgaggag 1620
tgcgtcgccg gtggtgtgcc agccgactcc ggcgaaggtc agggtgccga cgataagcgt 1680
ggtttcgtcg aggtggtcga cggtgtgcac ggtggcgttg tcggccggat cgggctcagc 1740
ccggcggaag tcgatgcgag tctcgcggag caggcggaag gtgaccgagt accggcgggc 1800
tttggtgagg aagtggccgc cgaagccgag catgtgcgcc cagcggcgga gccgggcgta 1860
tggggtgggc tggcggtcgt tgggccgttg ggtgtcaagg ctggcttgac gttcggcgac 1920
gcatacaggg caggtccggt agcgggtgcg ggtaccgcag tccggacagt ggcggggcgc 1980
tccaaagggc tgccggattt tggcaccggc ggtgccggtg tagacgggga gtcggatcgc 2040
cgttttgcca gctggggcgt cggggtcgtt gccgagatgc cagcaggcgt ggatgagccg 2100
ggcgatgtgg tctccggcgg gatcggcgtg ctgcgtgatg gtgtcgccgg tgatgcgcgt 2160
cgaattgtgg ccggtgatct cggtgctttt ggtggcgtac ttggcgaggt atccggcgac 2220
catgctgtcg gtgacttcgc cggtgccggt gaggctgatc gggcggatgt cgatctgttc 2280
gccccaggcc atcggccagc cgtccggccg gtcagggtgg tctggggtgg tgaagtcgat 2340
gtcgctggcg gcggtgagtg cgtcgaccag gtcgttgagg ccgatgccgg gtggtggggc 2400
gacgacgcgg gtggggtcgg tggggtcgat gccgtcgagc cggatcaggg cgtggaagtg 2460
gaccgcgccg cggcgttgca tctcggcggc tttgccgtgg gcgaggcgga ccggtgggat 2520
ccggcgcagg tttttgccgt tgctgacctc gtggaacggg atgccgcggg ctttgcagag 2580
tttggcgagg cggcgttcgg cgtcctgttt ggtgcggtgc cagagttcgc cggagaacag 2640
gttccagacg acgtggtgct ggtggtcgta gcagtccagg cagaggggac ggccgagctg 2700
ggggtcgccg ggttcgtggc gtgcccagca gacggcgggt tggtagtgct ggcagaggcc 2760
ggggttgcgg cgggcgtggc agggttcggg gcggcagcta cagcgggcgc gattcgtgca 2820
ggtgtgtttg cggacgtggc gggtgtggac cgcgccgaag gagggggcgg tgagggtgac 2880
gaacacggcg gggtgccggg cgaccgtggt ggggacgcct ttgccgccga tgagcccggc 2940
gcgcaggatc tggaacgcgt cgcgctggta ggtgcgggcg caggcggggc acacggtgga 3000
gcgccggtta ccgcaggcct tgtagatagc ggcatcggga agttggtcgg tgtgccggga 3060
gtcgagcagg cgcccggtgg tggcttcgat ggtgtcgagg gtgccggtga gccggaccgg 3120
gcgggtgcac ccggcggcgg cgcggacgtg gtcgagccag tcgaagtagc cgggttgggt 3180
ggcgcgggtg agggcttggc cggctgcggt gtagtcggcg ggtgggggtg tccaggcgtc 3240
ggcgttcgag cccgcacccc gggcagagtt ctcccggggt gcgaggtcca gcgtcgacgt 3300
gctcatgtca ggcagcgatc ctggtggtgg cgagctgcgg gccgtggtgg ccgacgaagg 3360
tgctggtgat gtgccgttcg atgacggtga tgcggcaggc cgggcattgc cgatggtggg 3420
gttcgtgacg gccgcagtcg ataacggcgg tcttgtcgcc gcagcggatg gagatggggt 3480
tgcggcaggg gccgccgtcg acggtggcga cgatggtgcg gcgggtgtcg aacgggtgca 3540
gctcagggtt ggctgggcag gtgtgggtga tgtggtggat gtcgacgtgg acgaaggtca 3600
tcgggcgccg ccggtcaggg tcgggatgtg cccgttgatg cgtgccgggt tggtgtcccg 3660
gatggtggtg atcagggttt cggcgacggc cggggtgatg ttgagtcgca gggcgaggtc 3720
gtcggcggtg atgggctggc cggtggtctg ctcgtgctgg acgaccgaga accgggcggc 3780
gggcagcagg tgagccggga cgaccggcgc ggtctgtggg gtggccggct gttcgaccgg 3840
agcggtcggg ccggtggtgg tgtgctccgg ttccggagtg gtcgccgtac cgcgggcttt 3900
gatcttgttg acggcggtca tgagttcggt ggcttgtttg tcgatggcgg tgaagtcggg 3960
gcggatgcgt ccggcgacga gttcgacgcc gatgaccacg acgacgacca gggcgaagac 4020
gatgcgcatg ccgaggtcgc cggggcggcg aagttgacgg tggccgagag cagggctgcg 4080
ccgatgaaga cggccatggc ccagcgtttg gcgtctttga cgatgccggg ggtgcggacg 4140
acgatcagca tcgagaccat ggcggtgtcg aagatcgccg ggggtaggta ggcgaagtag 4200
cccgcgccgg tgctggccag gtagtgggcc tggtggaggt agctggtgat cagtgcgccg 4260
atgagggtgg ctcggttgta gcgtttgacg ctgtcgatgg ccttgagcat gttcgggacg 4320
gcgctcttgg cgtactcgat ggcgaactgt tcggtgaggt tgacgctcgc gggggcggcc 4380
gggccggtgg tcggctgttg ggccgccttc ctgcggagag ggttcatcgg atgcctccgt 4440
cgttggtgac ggggatgacc gcgacgacgc ccatgcaggc ttcgcaccag acggcggaca 4500
ggccgtcgtc gaacagttcg ttgatgcggt cgtcgagggt ttcgtattcg gcggggaaca 4560
gcgacgtgct gccgcattcg tcgcaccact gctcggtcgg gcagaggcac aggaccgggc 4620
cgaggtccgg gtggataccg gcggggctca tgccgccgat gcaccacagg cagttgtcgg 4680
tggccaggtg cttgcccagg tcgatgaggc tcatcgtgag acctccggtg accggagcgc 4740
ctggtcggtc cagccgcaga cgtcacagtc gcggtagccg cagtactggc agcactgcga 4800
acgatcctgg tctttcggca tgacttctgc gcagtagtgg tcgccgcact ggcaccgtgt 4860
cgtagcgggg ctgttgtttt cagggtccgt ggtcatcggc tgcctcctac ttcgcagctc 4920
aggcagatac cggtgcggcg cgggatgtag tagtcacggg tgacgccgca ggagtcgcag 4980
gtgcggcggg cgagcagcat cttggcgacg accgcgagct gcgccgcggt gggaacacgt 5040
ttcggcttgg cgaggtcgcg ccggtagagg taggcgacgc ggcgttgtcc gcggtgcatc 5100
cacaggatct gggcgacggg gtcgtagccg ttggggcaga ggccgtcggc gcgcagctgg 5160
cgtcgggtgg ccaggtgctc gggcgcctgc cggtagggga aggtggggaa gccgtagcgg 5220
ctgccggtgg ggtcgtagaa ctcgacgcgg atgccggtgc gggcgccgag ggcttcgagg 5280
tagtcgttgg tcagggcgga ggtggtcatt tatcgcctcc ccagcgttgc tgggcggctt 5340
ggcgggagat gccgagccgg tcgccgattt cggcccagga atagccgtag gcgcgcaggc 5400
cgatgacggc ctcgctgatg gcgtcgtcga gctgggcgga gagtccgacc atgtcgcgca 5460
gggcttcgac gtcgccggtg gcgacgcgtt tggcgaaggc gcggatgatg cgccggacga 5520
aggcggcgta ttcgtcgttc tcgacgacgt cgcggcggcg cggcttcgaa ggccggctgt 5580
caccggccgg ggcggtaggt gtcaaggcag ggttgacgta cgacaggctc accgggcacc 5640
cccggtgtgg tgcagacgat cccagtcgtc agcggcgtcg gtgagggtct cgatgacctc 5700
gtcgcgggtg cggccctcgt agtcgttcca gtcgccgacg acgtcgatgg cgctggtctc 5760
gtagaagccg gtcggggtgt attccaggtc gagccaggcg gcgaagacgc gcagggcgcg 5820
gatggcggcg atggtgtcgg ggtcgccgtc gagggtgcac acgccggagg ccaggcagcg 5880
gccggtggcg gcggtcatga tcgcgccgga ggcgcaggcg ggcggaaact gcccgtcggt 5940
gatggcgacc aggtcgtaaa actggtgctg ggtccagccg tgctgctgga ggtagagggc 6000
ggcggcgcgc agcagcgcgg ccggggtcat cgtcgggtcg gtaacgggtg tgttggccgg 6060
ttgatgggta ggcttcatgg cagccacgtc ctttcgaggc tgttggtgga ggtcggcaga 6120
acccgcttgc ttgcaggctg tgggggttct gtcgaccgct tccgttatgc ggttgtggtc 6180
cccggtgccg tccagcggcg aggatggtgc ttgcgcacat gggcggcggt gatcgccagg 6240
gcgaggacac cgaccggtgc ctggtgccgg gtgaggtggc cgacgagaag gccggcgagg 6300
taggcggtcg tggtggcggt tccagcgatt acgccggtga tggcctgagc gcgggtttcg 6360
gtcatgccgc catctcccat tgggtgcgcc cggtgtagga ggtcgtggtg gcgggattgg 6420
tagggcggcg tagccaggcg gcatagtcgg cgatggcgta gatgtcgtcg tcggacagcc 6480
aggccgcctt gatcgggtac gggagcttct tctcggcgcg cagcagggct tcgccggggt 6540
tgtcggggct gatggtggag gcgtcgaagc cgacctctgc gaggccggag ccgaggatga 6600
cgtcggagga gccgacggtg gtgcaccgga aggcgcagcg gtagccgaac aggtcccgca 6660
ggctggcggg gatgatgtcc caggaggggc gctgggtggc gccgacgacg ggcatggcgc 6720
aggcgcggcc cagagcgacc aggccccgga gcagggtcga gaactcttcc tgttgggcct 6780
tggtgcctag cacggtcgag aacatcgcga tctcgtcgat gatggtgatg atcgtggaga 6840
ggttgtcctc ccgtgtgatt ttgcggcggc ggttggcgag cagccagcgg tagcggttgc 6900
gggcgacggt gagcaggcga cgcacggtct tgatggccag gtcgatgtcg tcgccgatga 6960
aggcgtccat gatcggttcc caggggccga gttcgaccca tttgccgtcc atgccgatca 7020
ggcgggtgtt gtcgctgagt gcggcggtcg ccgcgacgag gttgagcagg ccggacttgc 7080
cgccgccggg ctcaccagcg gtaagcaggt tgtggtagac gatgtcgagc gtgacgtgct 7140
cgccaaactc gtcgatgccg atgaacaggg gatcgaacat cgacatgcca ggcccgacag 7200
gcacccggtc ggtgccgagc ggatcgcagg cgatggtgct cacgagcttc gcctcccttc 7260
cggaggtgaa agggcaggac gctcgcggtg gagcgccctg cggtaggggt cagatgggtt 7320
cggtggtgac gagcgggtcc cacccggatt cgcgtttcac ggccgacgcg cggcggcaga 7380
gttcggccac gagctggccg cagttgtgcg cgatggttcc caggcgggcg atcagctcgc 7440
cccgctgttg ttcggtgagc ccgtgatggc tcccgtcggt cacgtcccag ccgtcgtcga 7500
tgtagagctg ggcgagtccg ttgccgtcgc tgaacagccc ggcggtcatc caggccaggt 7560
cttccagggc ctgccgggag tcgatgtcgc tgacgatcag ttcgtcgttg acgaagtcgg 7620
tgacgccctg cggatcgagg cgttcgaggt gctgggtctg accgtagagg tcgaagatgc 7680
tcatacgggt gctcctcaga tccactggtt gatgtcgtcg ccgtcgtcgg cggcagtggc 7740
gggtttgcgg ccgttgctgc tggcagcggc ctgtttcggg atggccggct cggtggccgt 7800
cgggatgtcg tcgatgtcgg gcaggtcgag gcccgtgaca gtggccgact ctttatcgtc 7860
gagcggcacg atcggatcga tctcgtcgat caggggggtg ctcaccttgg cggtgaggac 7920
ttcgcggcgc ttgatgtcga agcgcacgaa cgcagaattg gtgctaccgg ccaggtcgac 7980
cctgaccgtt ttggcatggc aggccacggc gatcttgccg acctgctgcg tgaggtaatc 8040
gaccgacagg ccgggccgca gtaggaccca gactcgttcc cccaccgggg tgggccaggc 8100
tccgaggatc agcgggaggc taccggagcg gttggtgatg atgaactgcg agaagcagac 8160
gcgcaggcga tgccgcacgg cgacacacca gaagatggcg acggtccagc ggcgcaggac 8220
cggaacgcag gccgggccgc cgaccaggac ggcaaggatg accgcggtca agatttgtga 8280
ggtactggcg gccagggcgg tccagcccca ggccagcagg acggtggctc cgatttcggg 8340
agtccaccac cagagcattc gcaggaccgg ccagctacgg accagtgccc agacgagggc 8400
gccgcagaca gcggcgatcg gagccgcgac gaacgcggcc agcagcgggt gcatgtggcc 8460
cttggccacg accagagcga ccaggccgct cacgatgacg gtgaagatga acgcgaaacg 8520
cgcgttctcg gcagccgagc gatgtacccg ctgctcgatg acggtgacag ttccggagcc 8580
tcgcccagaa cggccgggac gggtagattt ggacacgaca cgtcctccct tgcgggttgg 8640
atgggttcag gcgtggggcc ggatggtgtg cgaccgttac cggccccgcg ctttcttact 8700
ggtgatcagc gcccacgcgg gacgcgattg tcagcgctga gcgcgctggg gcttcggctg 8760
caccgagccg taccgggaga aggccataac cgtgaggcca ggaagaatgc ggccagcggc 8820
ctggttgatg aggtctttgg tctcgaggag atcaccctgt tcggtgatcg gatttttcga 8880
gtggatgtcg atggagccgt agcccccttg gaacatgtag gacacgtagt aacggaacat 8940
gatgggttcc tttcaaaaaa atgatgatgg ccgcatattg cggccggagg ccggaacgaa 9000
atcgctccgg ccatccgatg aatgagcagg gattacggca gcaaaaggcc gcctgggatc 9060
agatgccacg gacactgtgg cggcagtacg gatggggttg cgaagggcct acttcgccga 9120
ggcaccggag agcggcttca gcgacaccgc acggaacgcg acgccgttac gcccgttggt 9180
cgcccacgga atggcctcga gctgctcgat ggcgacgagc tgtcccaccg tcacgttcgg 9240
cttttcgcca gccgtcgtga tggcgatgac ctcgccgccg gtctcgtcga gcacgatgac 9300
ctgggtggac cacatgggcc ggccagtgtt cttctcggaa cgctggttgc cgttctggtc 9360
gttcttcggc tcggtcggct tcgacaccgt cacctgcttg ccggtcgtgt ccacgtacag 9420
cttcacgaag atctccttcg ttccagggat ccaactggaa tcccgaacct ttttgttgag 9480
ccgatcggct ccgccctcca tgaaacgcgg aaaattggcc ccgcagcagg tctccagatt 9540
tgatccgcgg agggcatcac tggctggcag tgactaggac tgactcgggc cttgcgaatg 9600
acacgtcgat agggcagtgt gaatgcggcg cattatcgac tctcacaggg cggaggctag 9660
agatgacgcc gctgcggctg gaaaggcaga agctcggctg gtcgagaacc cgccttgctc 9720
acgaactgga gcgacgggcg cagggaagat tcagcctggc caccagagcg agtcttctgc 9780
ggatgatctc agcgtgggaa agcggcgcgc gagacacctc ggacccgtat cgcactctgc 9840
tgtgcgaggc gtatggccgg accgctgacg agttgggcct gggtggtggc accgaccgag 9900
cagaatcgag cgtcggcctg tcctacgctt catcgcttga cgcggcagcc gcaatacttt 9960
ctgaccttgc ccggttcgat gacatgaagc accctgcggt gagccagggc cgctaccagc 10020
ccgatgcgtt gaacgcggta tgtctggact ggctgttcgg cacagcctcg aatgacatgc 10080
cagcaggcgc tggaaaacgc gtcaccatga aggacgtcga ggagatccgc gccaccacgt 10140
cgatgttcga cagcctggat cgccgattcg gaggggagaa cgcccgcagt atggccgtgc 10200
gttttctgcg cgaggcggtg ctgccgagat tcggcaagac atccgaccag accgtaacta 10260
ctgagcttta cagagcagca gcgatcctct gcgagctgat cgggtggatg tcgttcgaca 10320
cctcacgcaa ctcgttggca cagcggtatt tcacccaagc gctgcgattg gccgaggcag 10380
ctggtgaccg cgcctatgcc tcgtacatct tggcgagcat ggcggaccaa gcgctcttcc 10440
tgaagaggcc tgaccaggcg ctacgacttg cacaggtcgc tcgcgatgcg ggggaaaagg 10500
ccggcgttgc ggtggccaca accgaggcga gcatgctgga ggctcgcgca ttcgcagccc 10560
agggtgacga gagcggctgc accagggcgt tgcttcgcgc ggaagccgcc ttcaacagca 10620
tcagcgcaga cgacaacccg agttgggcga accactgggg tgacatcttg tttgccagtc 10680
acgctggcac ctgttgggtc gatcttggtg cgccgaagga ggcagcgagc ttggttcgga 10740
cagtctggga cagcgcgaag gatcaggccc gtcgtcgggt ctacagcggc gttcagctcg 10800
ctcgcgtggc gctgcttacg aacgaggtgg aacaagcggt gtcgtatggg atcgccgccc 10860
ttgaggcgac gagcggcttg acttcgaatc gctcgttgca gcagcttcgc gacctgcgtg 10920
atcagcttgg aaaccatgcc aagcatcctg ctgttgtgga gttcgaggag cgcgctcgat 10980
tggtgctggc cgcttgagta ccgtaagcct cgtgacgttg gccgaggacc tggaccgcga 11040
aggtgaaccc gagcgggagt tcaaccccgg gatcgcgcag cgactaccta ggaagcgggt 11100
tgctggcgga gcgctgatcc gcgactcggc tgatcgaatc ctgttcgtcg tgccgaacta 11160
caagcccctg ctggacatcc ccggcggcat tgccgagggc aacgaatctc cgctcgcagc 11220
gtgccgacgt gagatcaagg aggagatcgg cctagacctg ccgatcggcc gacttctcgt 11280
ggtcgactgg atcccgcagc acggcgtgtg gccggacggc gtgatgttca tcttcgacgg 11340
cggccggcta accgacgacg agtcccgcga cctgaagcac accgatgatg agctggtagg 11400
actgaagttc cttgccctcg atgatgcacg ccatcagctt cggccctcaa tggttcgcag 11460
gctcgaagca gggatagagg ccttgtccga tggagagccg cggtatctgg agttcggtcg 11520
gactcagtaa agcggatggc cttaccggcg ttccatccgt tcggatgttc gggcgatggc 11580
tgcattgaga tcatcggcag cctcggtgat gaacgctgtc acgagatggc ccggcccgta 11640
acgttccttg atctcggcta cccgctcctc gaaggtcgtt cgttccccgt cgggtgtcgt 11700
ggtgagatcg cagaaccaga gggcgtcccg gaccggcgac gcctcgtcat ggaaagctgc 11760
aagttcctcc gcaaggcctc gcatcttggc ttcgcgtatc gcacacgaat ggtgcgctac 11820
aaggtgaaca agccgttccg gagcactgac ggaccgaagg aagtacgccc cgtctagcgg 11880
atggaaaccc gtctgcacga gatctggcgc atacccgatg tcgtggagta cagcagcagc 11940
ctcaagcaag cgggcatcgt cgccggcggc gttaccaaca gtacgagcct tcgccgcgac 12000
accttgaacg tgagaccagc gacgtggcag cacatccgcg aggacgcgtt cagacgtttg 12060
gtatgcccaa gcgaccatcg acatggaccc aacgatatcg gtgaactcgc agattcgtat 12120
gcgttgacgg agccggtcgg ctgccggatc ttgttcaaac tttctgtacg tcttcaaggc 12180
ggcccgaaac gggccgctca cgccgccgcc tgggcgcgtg ccggtcgctt agctggcgca 12240
cacgaccggc acgccggcag cccgtcggct ggcgtgcagg agcggatcgg gccgcggcga 12300
cgacagtcca acaggcgggt tgaggctggg gagtttggcc gctgccgacc ggtgcggcca 12360
gggcgacgcg gccgagctgc cgcgcgcggc cgcagcgcga gtcacggccg tcggccgccg 12420
ggcgcggcgg cgcgcagtgt gtccgggccg ctcctccgag gtcaagggcg cttcgcgtcg 12480
caagcgacgg ccgcaagcgg ccgccctgga cctcggagcc tctgcggccc tagcggccaa 12540
gtggtcaagc ggcaggccga tggcctgccc gcaggtggac gcgcgccacc gcacccggtc 12600
cacccgactc tgcaagaacc gttcgctact tcagcgtcaa tgaggaattg acaccttgga 12660
cgtctttggc ggccaattcg caaaggcgct tgtgggcctc tccgaaagcg tcgattctgt 12720
attgtcgatc atcgcgcagc ttgatgaatt gttcctcgtg ctttggatta tctggcccca 12780
cttgcggtgc agcgcaaaag gtttgatatt ccttatgcgc tatggccgcc tgctcgaacg 12840
cccatcgcca ttcactcatg cacttcctaa attcggcagt gctgaatatc gaggcaagtg 12900
cgtccatgcg agcctgctcc ttggcgtcgc tcaaatcgtt tttgtactct tcatctgcaa 12960
taatgcatcg gcgtaattgg tcgcgagtaa gtgcaaacca cgttaccaac tccaagtaag 13020
ctgactttcg atcggcgtgc gcggcgatct ctctctggta aacccgttcg ctctgcttgc 13080
taaaattccc cagaaagaat tgaaacccgg cccccgctat cgcaaaaaat ccggttatca 13140
cagcgggcca gaagggtgtc atccgcattc ctcatctctg gatcaggctg acacgggctt 13200
ccatggtctc cgtgtgcgtc aagccctacg gtccagtagg actgcgaaca ggtgagttct 13260
cgccgcacgg ggacgcctcg ccgcctgcgc cttaagaccc tactgtggtg gacatgacgc 13320
gcaacatcga tgcagtgctt cgggtctcgc ctgcagacgg acggtggtat gtggacatcc 13380
ctgagttcaa cctgagagtg gatcttccgg cgtcaaggca aagtagcgac ctgcgtaacc 13440
ggctaaacga cgccgtggca ccgcacgtgc ctgcggggac cgacttcgtg atcaagatgg 13500
cacctgagtg agtggcgcgc cttcctgagt gactaactgg gtgacaatcg ccaacgatca 13560
tggcggacaa gcgtggacgc tgatggacgt ggacccgcag gtgagcagtg tgttgaccaa 13620
gttcattcaa gatcatgagt tgc 13643
<210> 2
<211> 282
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 2
atggacgcac ttgcctcgat attcagcact gccgaattta ggaagtgcat gagtgaatgg 60
cgatgggcgt tcgagcaggc ggccatagcg cataaggaat atcaaacctt ttgcgctgca 120
ccgcaagtgg ggccagataa tccaaagcac gaggaacaat tcatcaagct gcgcgatgat 180
cgacaataca gaatcgacgc tttcggagag gcccacaagc gcctttgcga attggccgcc 240
aaagacgtcc aaggtgtcaa ttcctcattg acgctgaagt ag 282
<210> 3
<211> 771
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 3
atggaaaccc gtctgcacga gatctggcgc atacccgatg tcgtggagta cagcagcagc 60
ctcaagcaag cgggcatcgt cgccggcggc gttaccaaca gtacgagcct tcgccgcgac 120
accttgaacg tgagaccagc gacgtggcag cacatccgcg aggacgcgtt cagacgtttg 180
gtatgcccaa gcgaccatcg acatggaccc aacgatatcg gtgaactcgc agattcgtat 240
gcgttgacgg agccggtcgg ctgccggatc ttgttcaaac tttctgtacg tcttcaaggc 300
ggcccgaaac gggccgctca cgccgccgcc tgggcgcgtg ccggtcgctt agctggcgca 360
cacgaccggc acgccggcag cccgtcggct ggcgtgcagg agcggatcgg gccgcggcga 420
cgacagtcca acaggcgggt tgaggctggg gagtttggcc gctgccgacc ggtgcggcca 480
gggcgacgcg gccgagctgc cgcgcgcggc cgcagcgcga gtcacggccg tcggccgccg 540
ggcgcggcgg cgcgcagtgt gtccgggccg ctcctccgag gtcaagggcg cttcgcgtcg 600
caagcgacgg ccgcaagcgg ccgccctgga cctcggagcc tctgcggccc tagcggccaa 660
gtggtcaagc ggcaggccga tggcctgccc gcaggtggac gcgcgccacc gcacccggtc 720
cacccgactc tgcaagaacc gttcgctact tcagcgtcaa tgaggaattg a 771
<210> 4
<211> 243
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 4
atgcgaggcc ttgcggagga acttgcagct ttccatgacg aggcgtcgcc ggtccgggac 60
gccctctggt tctgcgatct caccacgaca cccgacgggg aacgaacgac cttcgaggag 120
cgggtagccg agatcaagga acgttacggg ccgggccatc tcgtgacagc gttcatcacc 180
gaggctgccg atgatctcaa tgcagccatc gcccgaacat ccgaacggat ggaacgccgg 240
taa 243
<210> 5
<211> 519
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 5
gtgacgttgg ccgaggacct ggaccgcgaa ggtgaacccg agcgggagtt caaccccggg 60
atcgcgcagc gactacctag gaagcgggtt gctggcggag cgctgatccg cgactcggct 120
gatcgaatcc tgttcgtcgt gccgaactac aagcccctgc tggacatccc cggcggcatt 180
gccgagggca acgaatctcc gctcgcagcg tgccgacgtg agatcaagga ggagatcggc 240
ctagacctgc cgatcggccg acttctcgtg gtcgactgga tcccgcagca cggcgtgtgg 300
ccggacggcg tgatgttcat cttcgacggc ggccggctaa ccgacgacga gtcccgcgac 360
ctgaagcaca ccgatgatga gctggtagga ctgaagttcc ttgccctcga tgatgcacgc 420
catcagcttc ggccctcaat ggttcgcagg ctcgaagcag ggatagaggc cttgtccgat 480
ggagagccgc ggtatctgga gttcggtcgg actcagtaa 519
<210> 6
<211> 1335
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 6
atgacgccgc tgcggctgga aaggcagaag ctcggctggt cgagaacccg ccttgctcac 60
gaactggagc gacgggcgca gggaagattc agcctggcca ccagagcgag tcttctgcgg 120
atgatctcag cgtgggaaag cggcgcgcga gacacctcgg acccgtatcg cactctgctg 180
tgcgaggcgt atggccggac cgctgacgag ttgggcctgg gtggtggcac cgaccgagca 240
gaatcgagcg tcggcctgtc ctacgcttca tcgcttgacg cggcagccgc aatactttct 300
gaccttgccc ggttcgatga catgaagcac cctgcggtga gccagggccg ctaccagccc 360
gatgcgttga acgcggtatg tctggactgg ctgttcggca cagcctcgaa tgacatgcca 420
gcaggcgctg gaaaacgcgt caccatgaag gacgtcgagg agatccgcgc caccacgtcg 480
atgttcgaca gcctggatcg ccgattcgga ggggagaacg cccgcagtat ggccgtgcgt 540
tttctgcgcg aggcggtgct gccgagattc ggcaagacat ccgaccagac cgtaactact 600
gagctttaca gagcagcagc gatcctctgc gagctgatcg ggtggatgtc gttcgacacc 660
tcacgcaact cgttggcaca gcggtatttc acccaagcgc tgcgattggc cgaggcagct 720
ggtgaccgcg cctatgcctc gtacatcttg gcgagcatgg cggaccaagc gctcttcctg 780
aagaggcctg accaggcgct acgacttgca caggtcgctc gcgatgcggg ggaaaaggcc 840
ggcgttgcgg tggccacaac cgaggcgagc atgctggagg ctcgcgcatt cgcagcccag 900
ggtgacgaga gcggctgcac cagggcgttg cttcgcgcgg aagccgcctt caacagcatc 960
agcgcagacg acaacccgag ttgggcgaac cactggggtg acatcttgtt tgccagtcac 1020
gctggcacct gttgggtcga tcttggtgcg ccgaaggagg cagcgagctt ggttcggaca 1080
gtctgggaca gcgcgaagga tcaggcccgt cgtcgggtct acagcggcgt tcagctcgct 1140
cgcgtggcgc tgcttacgaa cgaggtggaa caagcggtgt cgtatgggat cgccgccctt 1200
gaggcgacga gcggcttgac ttcgaatcgc tcgttgcagc agcttcgcga cctgcgtgat 1260
cagcttggaa accatgccaa gcatcctgct gttgtggagt tcgaggagcg cgctcgattg 1320
gtgctggccg cttga 1335
<210> 7
<211> 318
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 7
gtgaagctgt acgtggacac gaccggcaag caggtgacgg tgtcgaagcc gaccgagccg 60
aagaacgacc agaacggcaa ccagcgttcc gagaagaaca ctggccggcc catgtggtcc 120
acccaggtca tcgtgctcga cgagaccggc ggcgaggtca tcgccatcac gacggctggc 180
gaaaagccga acgtgacggt gggacagctc gtcgccatcg agcagctcga ggccattccg 240
tgggcgacca acgggcgtaa cggcgtcgcg ttccgtgcgg tgtcgctgaa gccgctctcc 300
ggtgcctcgg cgaagtag 318
<210> 8
<211> 210
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 8
atgttccgtt actacgtgtc ctacatgttc caagggggct acggctccat cgacatccac 60
tcgaaaaatc cgatcaccga acagggtgat ctcctcgaga ccaaagacct catcaaccag 120
gccgctggcc gcattcttcc tggcctcacg gttatggcct tctcccggta cggctcggtg 180
cagccgaagc cccagcgcgc tcagcgctga 210
<210> 9
<211> 921
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 9
gtgtccaaat ctacccgtcc cggccgttct gggcgaggct ccggaactgt caccgtcatc 60
gagcagcggg tacatcgctc ggctgccgag aacgcgcgtt tcgcgttcat cttcaccgtc 120
atcgtgagcg gcctggtcgc tctggtcgtg gccaagggcc acatgcaccc gctgctggcc 180
gcgttcgtcg cggctccgat cgccgctgtc tgcggcgccc tcgtctgggc actggtccgt 240
agctggccgg tcctgcgaat gctctggtgg tggactcccg aaatcggagc caccgtcctg 300
ctggcctggg gctggaccgc cctggccgcc agtacctcac aaatcttgac cgcggtcatc 360
cttgccgtcc tggtcggcgg cccggcctgc gttccggtcc tgcgccgctg gaccgtcgcc 420
atcttctggt gtgtcgccgt gcggcatcgc ctgcgcgtct gcttctcgca gttcatcatc 480
accaaccgct ccggtagcct cccgctgatc ctcggagcct ggcccacccc ggtgggggaa 540
cgagtctggg tcctactgcg gcccggcctg tcggtcgatt acctcacgca gcaggtcggc 600
aagatcgccg tggcctgcca tgccaaaacg gtcagggtcg acctggccgg tagcaccaat 660
tctgcgttcg tgcgcttcga catcaagcgc cgcgaagtcc tcaccgccaa ggtgagcacc 720
cccctgatcg acgagatcga tccgatcgtg ccgctcgacg ataaagagtc ggccactgtc 780
acgggcctcg acctgcccga catcgacgac atcccgacgg ccaccgagcc ggccatcccg 840
aaacaggccg ctgccagcag caacggccgc aaacccgcca ctgccgccga cgacggcgac 900
gacatcaacc agtggatctg a 921
<210> 10
<211> 375
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 10
atgagcatct tcgacctcta cggtcagacc cagcacctcg aacgcctcga tccgcagggc 60
gtcaccgact tcgtcaacga cgaactgatc gtcagcgaca tcgactcccg gcaggccctg 120
gaagacctgg cctggatgac cgccgggctg ttcagcgacg gcaacggact cgcccagctc 180
tacatcgacg acggctggga cgtgaccgac gggagccatc acgggctcac cgaacaacag 240
cggggcgagc tgatcgcccg cctgggaacc atcgcgcaca actgcggcca gctcgtggcc 300
gaactctgcc gccgcgcgtc ggccgtgaaa cgcgaatccg ggtgggaccc gctcgtcacc 360
accgaaccca tctga 375
<210> 11
<211> 882
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 11
gtgagcacca tcgcctgcga tccgctcggc accgaccggg tgcctgtcgg gcctggcatg 60
tcgatgttcg atcccctgtt catcggcatc gacgagtttg gcgagcacgt cacgctcgac 120
atcgtctacc acaacctgct taccgctggt gagcccggcg gcggcaagtc cggcctgctc 180
aacctcgtcg cggcgaccgc cgcactcagc gacaacaccc gcctgatcgg catggacggc 240
aaatgggtcg aactcggccc ctgggaaccg atcatggacg ccttcatcgg cgacgacatc 300
gacctggcca tcaagaccgt gcgtcgcctg ctcaccgtcg cccgcaaccg ctaccgctgg 360
ctgctcgcca accgccgccg caaaatcaca cgggaggaca acctctccac gatcatcacc 420
atcatcgacg agatcgcgat gttctcgacc gtgctaggca ccaaggccca acaggaagag 480
ttctcgaccc tgctccgggg cctggtcgct ctgggccgcg cctgcgccat gcccgtcgtc 540
ggcgccaccc agcgcccctc ctgggacatc atccccgcca gcctgcggga cctgttcggc 600
taccgctgcg ccttccggtg caccaccgtc ggctcctccg acgtcatcct cggctccggc 660
ctcgcagagg tcggcttcga cgcctccacc atcagccccg acaaccccgg cgaagccctg 720
ctgcgcgccg agaagaagct cccgtacccg atcaaggcgg cctggctgtc cgacgacgac 780
atctacgcca tcgccgacta tgccgcctgg ctacgccgcc ctaccaatcc cgccaccacg 840
acctcctaca ccgggcgcac ccaatgggag atggcggcat ga 882
<210> 12
<211> 201
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 12
atgaccgaaa cccgcgctca ggccatcacc ggcgtaatcg ctggaaccgc caccacgacc 60
gcctacctcg ccggccttct cgtcggccac ctcacccggc accaggcacc ggtcggtgtc 120
ctcgccctgg cgatcaccgc cgcccatgtg cgcaagcacc atcctcgccg ctggacggca 180
ccggggacca caaccgcata a 201
<210> 13
<211> 450
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 13
atgaagccta cccatcaacc ggccaacaca cccgttaccg acccgacgat gaccccggcc 60
gcgctgctgc gcgccgccgc cctctacctc cagcagcacg gctggaccca gcaccagttt 120
tacgacctgg tcgccatcac cgacgggcag tttccgcccg cctgcgcctc cggcgcgatc 180
atgaccgccg ccaccggccg ctgcctggcc tccggcgtgt gcaccctcga cggcgacccc 240
gacaccatcg ccgccatccg cgccctgcgc gtcttcgccg cctggctcga cctggaatac 300
accccgaccg gcttctacga gaccagcgcc atcgacgtcg tcggcgactg gaacgactac 360
gagggccgca cccgcgacga ggtcatcgag accctcaccg acgccgctga cgactgggat 420
cgtctgcacc acaccggggg tgcccggtga 450
<210> 14
<211> 327
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 14
gtgagcctgt cgtacgtcaa ccctgccttg acacctaccg ccccggccgg tgacagccgg 60
ccttcgaagc cgcgccgccg cgacgtcgtc gagaacgacg aatacgccgc cttcgtccgg 120
cgcatcatcc gcgccttcgc caaacgcgtc gccaccggcg acgtcgaagc cctgcgcgac 180
atggtcggac tctccgccca gctcgacgac gccatcagcg aggccgtcat cggcctgcgc 240
gcctacggct attcctgggc cgaaatcggc gaccggctcg gcatctcccg ccaagccgcc 300
cagcaacgct ggggaggcga taaatga 327
<210> 15
<211> 417
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 15
atgaccacct ccgccctgac caacgactac ctcgaagccc tcggcgcccg caccggcatc 60
cgcgtcgagt tctacgaccc caccggcagc cgctacggct tccccacctt cccctaccgg 120
caggcgcccg agcacctggc cacccgacgc cagctgcgcg ccgacggcct ctgccccaac 180
ggctacgacc ccgtcgccca gatcctgtgg atgcaccgcg gacaacgccg cgtcgcctac 240
ctctaccggc gcgacctcgc caagccgaaa cgtgttccca ccgcggcgca gctcgcggtc 300
gtcgccaaga tgctgctcgc ccgccgcacc tgcgactcct gcggcgtcac ccgtgactac 360
tacatcccgc gccgcaccgg tatctgcctg agctgcgaag taggaggcag ccgatga 417
<210> 16
<211> 186
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 16
atgaccacgg accctgaaaa caacagcccc gctacgacac ggtgccagtg cggcgaccac 60
tactgcgcag aagtcatgcc gaaagaccag gatcgttcgc agtgctgcca gtactgcggc 120
taccgcgact gtgacgtctg cggctggacc gaccaggcgc tccggtcacc ggaggtctca 180
cgatga 186
<210> 17
<211> 291
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 17
atgagcctca tcgacctggg caagcacctg gccaccgaca actgcctgtg gtgcatcggc 60
ggcatgagcc ccgccggtat ccacccggac ctcggcccgg tcctgtgcct ctgcccgacc 120
gagcagtggt gcgacgaatg cggcagcacg tcgctgttcc ccgccgaata cgaaaccctc 180
gacgaccgca tcaacgaact gttcgacgac ggcctgtccg ccgtctggtg cgaagcctgc 240
atgggcgtcg tcgcggtcat ccccgtcacc aacgacggag gcatccgatg a 291
<210> 18
<211> 510
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 18
atgaaccctc tccgcaggaa ggcggcccaa cagccgacca ccggcccggc cgcccccgcg 60
agcgtcaacc tcaccgaaca gttcgccatc gagtacgcca agagcgccgt cccgaacatg 120
ctcaaggcca tcgacagcgt caaacgctac aaccgagcca ccctcatcgg cgcactgatc 180
accagctacc tccaccaggc ccactacctg gccagcaccg gcgcgggcta cttcgcctac 240
ctacccccgg cgatcttcga caccgccatg gtctcgatgc tgatcgtcgt ccgcaccccc 300
ggcatcgtca aagacgccaa acgctgggcc atggccgtct tcatcggcgc agccctgctc 360
tcggccaccg tcaacttcgc cgccccggcg acctcggcat gcgcatcgtc ttcgccctgg 420
tcgtcgtcgt ggtcatcggc gtcgaactcg tcgccggacg catccgcccc gacttcaccg 480
ccatcgacaa acaagccacc gaactcatga 510
<210> 19
<211> 324
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 19
atgaccgccg tcaacaagat caaagcccgc ggtacggcga ccactccgga accggagcac 60
accaccaccg gcccgaccgc tccggtcgaa cagccggcca ccccacagac cgcgccggtc 120
gtcccggctc acctgctgcc cgccgcccgg ttctcggtcg tccagcacga gcagaccacc 180
ggccagccca tcaccgccga cgacctcgcc ctgcgactca acatcacccc ggccgtcgcc 240
gaaaccctga tcaccaccat ccgggacacc aacccggcac gcatcaacgg gcacatcccg 300
accctgaccg gcggcgcccg atga 324
<210> 20
<211> 294
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 20
atgaccttcg tccacgtcga catccaccac atcacccaca cctgcccagc caaccctgag 60
ctgcacccgt tcgacacccg ccgcaccatc gtcgccaccg tcgacggcgg cccctgccgc 120
aaccccatct ccatccgctg cggcgacaag accgccgtta tcgactgcgg ccgtcacgaa 180
ccccaccatc ggcaatgccc ggcctgccgc atcaccgtca tcgaacggca catcaccagc 240
accttcgtcg gccaccacgg cccgcagctc gccaccacca ggatcgctgc ctga 294
<210> 21
<211> 1797
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 21
atgagcacgt cgacgctgga cctcgcaccc cgggagaact ctgcccgggg tgcgggctcg 60
aacgccgacg cctggacacc cccacccgcc gactacaccg cagccggcca agccctcacc 120
cgcgccaccc aacccggcta cttcgactgg ctcgaccacg tccgcgccgc cgccgggtgc 180
acccgcccgg tccggctcac cggcaccctc gacaccatcg aagccaccac cgggcgcctg 240
ctcgactccc ggcacaccga ccaacttccc gatgccgcta tctacaaggc ctgcggtaac 300
cggcgctcca ccgtgtgccc cgcctgcgcc cgcacctacc agcgcgacgc gttccagatc 360
ctgcgcgccg ggctcatcgg cggcaaaggc gtccccacca cggtcgcccg gcaccccgcc 420
gtgttcgtca ccctcaccgc cccctccttc ggcgcggtcc acacccgcca cgtccgcaaa 480
cacacctgca cgaatcgcgc ccgctgtagc tgccgccccg aaccctgcca cgcccgccgc 540
aaccccggcc tctgccagca ctaccaaccc gccgtctgct gggcacgcca cgaacccggc 600
gacccccagc tcggccgtcc cctctgcctg gactgctacg accaccagca ccacgtcgtc 660
tggaacctgt tctccggcga actctggcac cgcaccaaac aggacgccga acgccgcctc 720
gccaaactct gcaaagcccg cggcatcccg ttccacgagg tcagcaacgg caaaaacctg 780
cgccggatcc caccggtccg cctcgcccac ggcaaagccg ccgagatgca acgccgcggc 840
gcggtccact tccacgccct gatccggctc gacggcatcg accccaccga ccccacccgc 900
gtcgtcgccc caccacccgg catcggcctc aacgacctgg tcgacgcact caccgccgcc 960
agcgacatcg acttcaccac cccagaccac cctgaccggc cggacggctg gccgatggcc 1020
tggggcgaac agatcgacat ccgcccgatc agcctcaccg gcaccggcga agtcaccgac 1080
agcatggtcg ccggatacct cgccaagtac gccaccaaaa gcaccgagat caccggccac 1140
aattcgacgc gcatcaccgg cgacaccatc acgcagcacg ccgatcccgc cggagaccac 1200
atcgcccggc tcatccacgc ctgctggcat ctcggcaacg accccgacgc cccagctggc 1260
aaaacggcga tccgactccc cgtctacacc ggcaccgccg gtgccaaaat ccggcagccc 1320
tttggagcgc cccgccactg tccggactgc ggtacccgca cccgctaccg gacctgccct 1380
gtatgcgtcg ccgaacgtca agccagcctt gacacccaac ggcccaacga ccgccagccc 1440
accccatacg cccggctccg ccgctgggcg cacatgctcg gcttcggcgg ccacttcctc 1500
accaaagccc gccggtactc ggtcaccttc cgcctgctcc gcgagactcg catcgacttc 1560
cgccgggctg agcccgatcc ggccgacaac gccaccgtgc acaccgtcga ccacctcgac 1620
gaaaccacgc ttatcgtcgg caccctgacc ttcgccggag tcggctggca caccaccggc 1680
gacgcactcc tcgccaacac cgctgcggct caggcccgcg agcgacaagc catcggccga 1740
gaggaactcg cgcacgaagc gagcacgtcc cggcctgtcg ccttgaacgc cgcctga 1797
<210> 22
<211> 207
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 22
ttggacggca tcaccccgaa ggcgctctac cgcatcccgg aagccatgcg gatgctgagc 60
ttgagccgtt ccgtcatcta tgaactgatc cgctcggggc ggttgcgcac cgtcaaggag 120
ggtcgcaccc ggctggtccc ggccagcgcc atcaccgcct acgtcaccct gctcgaacag 180
gaaagcaaga aaggagtcgc cgcatga 207
<210> 23
<211> 1167
<212> DNA
<213> Actinoplanes sp. SE50/110
<400> 23
atgaccaaac gccgcagccg tggagacggc gggctgcact gggacgaaca gcgccagcgc 60
tggatcgcct cggtcaccgt cggatacacc ccggccggta aacgcatcgt ccgtaaggca 120
agcggcaaga ccaagaccga ggccaacaat gcactccgtc agaagatccg tgagtaccag 180
gacgggctgt cgatccccac gaccggctac acggtcgccg acgccgtcac ggactggctc 240
acctacggac ttcccgacgt cgacgaggaa acggtcaaca actacacgct gctggccaac 300
ggtcacatca tcccggcgat cggtgcacgc aagctccgtg accccagcaa acagaaggaa 360
ctcagcgcca ccgacattga caggtggctg gccgacaaag ccaagattct cagcacccgc 420
acgctgcgac tgctgcactc gatcgcgaat cgcgccatca accgagcgat ggcccgcgac 480
aaggtcatgc gcaacgtcgt cgcactctgc aaggtaccga ccggcaccgc cggacgaccc 540
tccaagtcac tcacctacga gcaggccaaa gcgctcctcg tcgctgccga gtcgagcagc 600
ctgcacgcgt atgtagtttt gtcgctgctg accggtgctc gtaccgagga actgcgagaa 660
ctcacctggc agcacgtcga cctggtcgga cgtccggacg ccgagccacc gattccgccg 720
gccatccacg tatggcattc ggtgcgcgcc cacggtgaca ccaagaccaa gaagtcacgg 780
cgttcactcg ccctgccggt tcgctgtgtc cgggtcctca ccgcgcaacg cgcggcgcac 840
ggagatccac gaccggatga ctacgtctgc gccagcaagg tcggcaccca gctcgaccgg 900
cacaacgtgc tgcgagcctt ccgcgcgatc gtcgcggctg tccccggaat gaatccggct 960
gaatggacgc cccgcgaatt acggcacagt ttcgtttcgc tgctgtccga caatgggatg 1020
agcatcgagg aaatcgccga cctgtgtggt cattccggca cctcgatcac cgagaccgtt 1080
taccgccacc aactgcgccc ggttctgctg aacggcgcgg tggccatgga ccggatcttc 1140
ggtccggatg acactcctgg ggcttag 1167
<210> 24
<211> 93
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 24
Met Asp Ala Leu Ala Ser Ile Phe Ser Thr Ala Glu Phe Arg Lys Cys
1 5 10 15
Met Ser Glu Trp Arg Trp Ala Phe Glu Gln Ala Ala Ile Ala His Lys
20 25 30
Glu Tyr Gln Thr Phe Cys Ala Ala Pro Gln Val Gly Pro Asp Asn Pro
35 40 45
Lys His Glu Glu Gln Phe Ile Lys Leu Arg Asp Asp Arg Gln Tyr Arg
50 55 60
Ile Asp Ala Phe Gly Glu Ala His Lys Arg Leu Cys Glu Leu Ala Ala
65 70 75 80
Lys Asp Val Gln Gly Val Asn Ser Ser Leu Thr Leu Lys
85 90
<210> 25
<211> 256
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 25
Met Glu Thr Arg Leu His Glu Ile Trp Arg Ile Pro Asp Val Val Glu
1 5 10 15
Tyr Ser Ser Ser Leu Lys Gln Ala Gly Ile Val Ala Gly Gly Val Thr
20 25 30
Asn Ser Thr Ser Leu Arg Arg Asp Thr Leu Asn Val Arg Pro Ala Thr
35 40 45
Trp Gln His Ile Arg Glu Asp Ala Phe Arg Arg Leu Val Cys Pro Ser
50 55 60
Asp His Arg His Gly Pro Asn Asp Ile Gly Glu Leu Ala Asp Ser Tyr
65 70 75 80
Ala Leu Thr Glu Pro Val Gly Cys Arg Ile Leu Phe Lys Leu Ser Val
85 90 95
Arg Leu Gln Gly Gly Pro Lys Arg Ala Ala His Ala Ala Ala Trp Ala
100 105 110
Arg Ala Gly Arg Leu Ala Gly Ala His Asp Arg His Ala Gly Ser Pro
115 120 125
Ser Ala Gly Val Gln Glu Arg Ile Gly Pro Arg Arg Arg Gln Ser Asn
130 135 140
Arg Arg Val Glu Ala Gly Glu Phe Gly Arg Cys Arg Pro Val Arg Pro
145 150 155 160
Gly Arg Arg Gly Arg Ala Ala Ala Arg Gly Arg Ser Ala Ser His Gly
165 170 175
Arg Arg Pro Pro Gly Ala Ala Ala Arg Ser Val Ser Gly Pro Leu Leu
180 185 190
Arg Gly Gln Gly Arg Phe Ala Ser Gln Ala Thr Ala Ala Ser Gly Arg
195 200 205
Pro Gly Pro Arg Ser Leu Cys Gly Pro Ser Gly Gln Val Val Lys Arg
210 215 220
Gln Ala Asp Gly Leu Pro Ala Gly Gly Arg Ala Pro Pro His Pro Val
225 230 235 240
His Pro Thr Leu Gln Glu Pro Phe Ala Thr Ser Ala Ser Met Arg Asn
245 250 255
<210> 26
<211> 80
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 26
Met Arg Gly Leu Ala Glu Glu Leu Ala Ala Phe His Asp Glu Ala Ser
1 5 10 15
Pro Val Arg Asp Ala Leu Trp Phe Cys Asp Leu Thr Thr Thr Pro Asp
20 25 30
Gly Glu Arg Thr Thr Phe Glu Glu Arg Val Ala Glu Ile Lys Glu Arg
35 40 45
Tyr Gly Pro Gly His Leu Val Thr Ala Phe Ile Thr Glu Ala Ala Asp
50 55 60
Asp Leu Asn Ala Ala Ile Ala Arg Thr Ser Glu Arg Met Glu Arg Arg
65 70 75 80
<210> 27
<211> 172
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 27
Met Thr Leu Ala Glu Asp Leu Asp Arg Glu Gly Glu Pro Glu Arg Glu
1 5 10 15
Phe Asn Pro Gly Ile Ala Gln Arg Leu Pro Arg Lys Arg Val Ala Gly
20 25 30
Gly Ala Leu Ile Arg Asp Ser Ala Asp Arg Ile Leu Phe Val Val Pro
35 40 45
Asn Tyr Lys Pro Leu Leu Asp Ile Pro Gly Gly Ile Ala Glu Gly Asn
50 55 60
Glu Ser Pro Leu Ala Ala Cys Arg Arg Glu Ile Lys Glu Glu Ile Gly
65 70 75 80
Leu Asp Leu Pro Ile Gly Arg Leu Leu Val Val Asp Trp Ile Pro Gln
85 90 95
His Gly Val Trp Pro Asp Gly Val Met Phe Ile Phe Asp Gly Gly Arg
100 105 110
Leu Thr Asp Asp Glu Ser Arg Asp Leu Lys His Thr Asp Asp Glu Leu
115 120 125
Val Gly Leu Lys Phe Leu Ala Leu Asp Asp Ala Arg His Gln Leu Arg
130 135 140
Pro Ser Met Val Arg Arg Leu Glu Ala Gly Ile Glu Ala Leu Ser Asp
145 150 155 160
Gly Glu Pro Arg Tyr Leu Glu Phe Gly Arg Thr Gln
165 170
<210> 28
<211> 444
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 28
Met Thr Pro Leu Arg Leu Glu Arg Gln Lys Leu Gly Trp Ser Arg Thr
1 5 10 15
Arg Leu Ala His Glu Leu Glu Arg Arg Ala Gln Gly Arg Phe Ser Leu
20 25 30
Ala Thr Arg Ala Ser Leu Leu Arg Met Ile Ser Ala Trp Glu Ser Gly
35 40 45
Ala Arg Asp Thr Ser Asp Pro Tyr Arg Thr Leu Leu Cys Glu Ala Tyr
50 55 60
Gly Arg Thr Ala Asp Glu Leu Gly Leu Gly Gly Gly Thr Asp Arg Ala
65 70 75 80
Glu Ser Ser Val Gly Leu Ser Tyr Ala Ser Ser Leu Asp Ala Ala Ala
85 90 95
Ala Ile Leu Ser Asp Leu Ala Arg Phe Asp Asp Met Lys His Pro Ala
100 105 110
Val Ser Gln Gly Arg Tyr Gln Pro Asp Ala Leu Asn Ala Val Cys Leu
115 120 125
Asp Trp Leu Phe Gly Thr Ala Ser Asn Asp Met Pro Ala Gly Ala Gly
130 135 140
Lys Arg Val Thr Met Lys Asp Val Glu Glu Ile Arg Ala Thr Thr Ser
145 150 155 160
Met Phe Asp Ser Leu Asp Arg Arg Phe Gly Gly Glu Asn Ala Arg Ser
165 170 175
Met Ala Val Arg Phe Leu Arg Glu Ala Val Leu Pro Arg Phe Gly Lys
180 185 190
Thr Ser Asp Gln Thr Val Thr Thr Glu Leu Tyr Arg Ala Ala Ala Ile
195 200 205
Leu Cys Glu Leu Ile Gly Trp Met Ser Phe Asp Thr Ser Arg Asn Ser
210 215 220
Leu Ala Gln Arg Tyr Phe Thr Gln Ala Leu Arg Leu Ala Glu Ala Ala
225 230 235 240
Gly Asp Arg Ala Tyr Ala Ser Tyr Ile Leu Ala Ser Met Ala Asp Gln
245 250 255
Ala Leu Phe Leu Lys Arg Pro Asp Gln Ala Leu Arg Leu Ala Gln Val
260 265 270
Ala Arg Asp Ala Gly Glu Lys Ala Gly Val Ala Val Ala Thr Thr Glu
275 280 285
Ala Ser Met Leu Glu Ala Arg Ala Phe Ala Ala Gln Gly Asp Glu Ser
290 295 300
Gly Cys Thr Arg Ala Leu Leu Arg Ala Glu Ala Ala Phe Asn Ser Ile
305 310 315 320
Ser Ala Asp Asp Asn Pro Ser Trp Ala Asn His Trp Gly Asp Ile Leu
325 330 335
Phe Ala Ser His Ala Gly Thr Cys Trp Val Asp Leu Gly Ala Pro Lys
340 345 350
Glu Ala Ala Ser Leu Val Arg Thr Val Trp Asp Ser Ala Lys Asp Gln
355 360 365
Ala Arg Arg Arg Val Tyr Ser Gly Val Gln Leu Ala Arg Val Ala Leu
370 375 380
Leu Thr Asn Glu Val Glu Gln Ala Val Ser Tyr Gly Ile Ala Ala Leu
385 390 395 400
Glu Ala Thr Ser Gly Leu Thr Ser Asn Arg Ser Leu Gln Gln Leu Arg
405 410 415
Asp Leu Arg Asp Gln Leu Gly Asn His Ala Lys His Pro Ala Val Val
420 425 430
Glu Phe Glu Glu Arg Ala Arg Leu Val Leu Ala Ala
435 440
<210> 29
<211> 105
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 29
Met Lys Leu Tyr Val Asp Thr Thr Gly Lys Gln Val Thr Val Ser Lys
1 5 10 15
Pro Thr Glu Pro Lys Asn Asp Gln Asn Gly Asn Gln Arg Ser Glu Lys
20 25 30
Asn Thr Gly Arg Pro Met Trp Ser Thr Gln Val Ile Val Leu Asp Glu
35 40 45
Thr Gly Gly Glu Val Ile Ala Ile Thr Thr Ala Gly Glu Lys Pro Asn
50 55 60
Val Thr Val Gly Gln Leu Val Ala Ile Glu Gln Leu Glu Ala Ile Pro
65 70 75 80
Trp Ala Thr Asn Gly Arg Asn Gly Val Ala Phe Arg Ala Val Ser Leu
85 90 95
Lys Pro Leu Ser Gly Ala Ser Ala Lys
100 105
<210> 30
<211> 69
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 30
Met Phe Arg Tyr Tyr Val Ser Tyr Met Phe Gln Gly Gly Tyr Gly Ser
1 5 10 15
Ile Asp Ile His Ser Lys Asn Pro Ile Thr Glu Gln Gly Asp Leu Leu
20 25 30
Glu Thr Lys Asp Leu Ile Asn Gln Ala Ala Gly Arg Ile Leu Pro Gly
35 40 45
Leu Thr Val Met Ala Phe Ser Arg Tyr Gly Ser Val Gln Pro Lys Pro
50 55 60
Gln Arg Ala Gln Arg
65
<210> 31
<211> 306
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 31
Met Ser Lys Ser Thr Arg Pro Gly Arg Ser Gly Arg Gly Ser Gly Thr
1 5 10 15
Val Thr Val Ile Glu Gln Arg Val His Arg Ser Ala Ala Glu Asn Ala
20 25 30
Arg Phe Ala Phe Ile Phe Thr Val Ile Val Ser Gly Leu Val Ala Leu
35 40 45
Val Val Ala Lys Gly His Met His Pro Leu Leu Ala Ala Phe Val Ala
50 55 60
Ala Pro Ile Ala Ala Val Cys Gly Ala Leu Val Trp Ala Leu Val Arg
65 70 75 80
Ser Trp Pro Val Leu Arg Met Leu Trp Trp Trp Thr Pro Glu Ile Gly
85 90 95
Ala Thr Val Leu Leu Ala Trp Gly Trp Thr Ala Leu Ala Ala Ser Thr
100 105 110
Ser Gln Ile Leu Thr Ala Val Ile Leu Ala Val Leu Val Gly Gly Pro
115 120 125
Ala Cys Val Pro Val Leu Arg Arg Trp Thr Val Ala Ile Phe Trp Cys
130 135 140
Val Ala Val Arg His Arg Leu Arg Val Cys Phe Ser Gln Phe Ile Ile
145 150 155 160
Thr Asn Arg Ser Gly Ser Leu Pro Leu Ile Leu Gly Ala Trp Pro Thr
165 170 175
Pro Val Gly Glu Arg Val Trp Val Leu Leu Arg Pro Gly Leu Ser Val
180 185 190
Asp Tyr Leu Thr Gln Gln Val Gly Lys Ile Ala Val Ala Cys His Ala
195 200 205
Lys Thr Val Arg Val Asp Leu Ala Gly Ser Thr Asn Ser Ala Phe Val
210 215 220
Arg Phe Asp Ile Lys Arg Arg Glu Val Leu Thr Ala Lys Val Ser Thr
225 230 235 240
Pro Leu Ile Asp Glu Ile Asp Pro Ile Val Pro Leu Asp Asp Lys Glu
245 250 255
Ser Ala Thr Val Thr Gly Leu Asp Leu Pro Asp Ile Asp Asp Ile Pro
260 265 270
Thr Ala Thr Glu Pro Ala Ile Pro Lys Gln Ala Ala Ala Ser Ser Asn
275 280 285
Gly Arg Lys Pro Ala Thr Ala Ala Asp Asp Gly Asp Asp Ile Asn Gln
290 295 300
Trp Ile
305
<210> 32
<211> 124
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 32
Met Ser Ile Phe Asp Leu Tyr Gly Gln Thr Gln His Leu Glu Arg Leu
1 5 10 15
Asp Pro Gln Gly Val Thr Asp Phe Val Asn Asp Glu Leu Ile Val Ser
20 25 30
Asp Ile Asp Ser Arg Gln Ala Leu Glu Asp Leu Ala Trp Met Thr Ala
35 40 45
Gly Leu Phe Ser Asp Gly Asn Gly Leu Ala Gln Leu Tyr Ile Asp Asp
50 55 60
Gly Trp Asp Val Thr Asp Gly Ser His His Gly Leu Thr Glu Gln Gln
65 70 75 80
Arg Gly Glu Leu Ile Ala Arg Leu Gly Thr Ile Ala His Asn Cys Gly
85 90 95
Gln Leu Val Ala Glu Leu Cys Arg Arg Ala Ser Ala Val Lys Arg Glu
100 105 110
Ser Gly Trp Asp Pro Leu Val Thr Thr Glu Pro Ile
115 120
<210> 33
<211> 293
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 33
Met Ser Thr Ile Ala Cys Asp Pro Leu Gly Thr Asp Arg Val Pro Val
1 5 10 15
Gly Pro Gly Met Ser Met Phe Asp Pro Leu Phe Ile Gly Ile Asp Glu
20 25 30
Phe Gly Glu His Val Thr Leu Asp Ile Val Tyr His Asn Leu Leu Thr
35 40 45
Ala Gly Glu Pro Gly Gly Gly Lys Ser Gly Leu Leu Asn Leu Val Ala
50 55 60
Ala Thr Ala Ala Leu Ser Asp Asn Thr Arg Leu Ile Gly Met Asp Gly
65 70 75 80
Lys Trp Val Glu Leu Gly Pro Trp Glu Pro Ile Met Asp Ala Phe Ile
85 90 95
Gly Asp Asp Ile Asp Leu Ala Ile Lys Thr Val Arg Arg Leu Leu Thr
100 105 110
Val Ala Arg Asn Arg Tyr Arg Trp Leu Leu Ala Asn Arg Arg Arg Lys
115 120 125
Ile Thr Arg Glu Asp Asn Leu Ser Thr Ile Ile Thr Ile Ile Asp Glu
130 135 140
Ile Ala Met Phe Ser Thr Val Leu Gly Thr Lys Ala Gln Gln Glu Glu
145 150 155 160
Phe Ser Thr Leu Leu Arg Gly Leu Val Ala Leu Gly Arg Ala Cys Ala
165 170 175
Met Pro Val Val Gly Ala Thr Gln Arg Pro Ser Trp Asp Ile Ile Pro
180 185 190
Ala Ser Leu Arg Asp Leu Phe Gly Tyr Arg Cys Ala Phe Arg Cys Thr
195 200 205
Thr Val Gly Ser Ser Asp Val Ile Leu Gly Ser Gly Leu Ala Glu Val
210 215 220
Gly Phe Asp Ala Ser Thr Ile Ser Pro Asp Asn Pro Gly Glu Ala Leu
225 230 235 240
Leu Arg Ala Glu Lys Lys Leu Pro Tyr Pro Ile Lys Ala Ala Trp Leu
245 250 255
Ser Asp Asp Asp Ile Tyr Ala Ile Ala Asp Tyr Ala Ala Trp Leu Arg
260 265 270
Arg Pro Thr Asn Pro Ala Thr Thr Thr Ser Tyr Thr Gly Arg Thr Gln
275 280 285
Trp Glu Met Ala Ala
290
<210> 34
<211> 66
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 34
Met Thr Glu Thr Arg Ala Gln Ala Ile Thr Gly Val Ile Ala Gly Thr
1 5 10 15
Ala Thr Thr Thr Ala Tyr Leu Ala Gly Leu Leu Val Gly His Leu Thr
20 25 30
Arg His Gln Ala Pro Val Gly Val Leu Ala Leu Ala Ile Thr Ala Ala
35 40 45
His Val Arg Lys His His Pro Arg Arg Trp Thr Ala Pro Gly Thr Thr
50 55 60
Thr Ala
65
<210> 35
<211> 149
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 35
Met Lys Pro Thr His Gln Pro Ala Asn Thr Pro Val Thr Asp Pro Thr
1 5 10 15
Met Thr Pro Ala Ala Leu Leu Arg Ala Ala Ala Leu Tyr Leu Gln Gln
20 25 30
His Gly Trp Thr Gln His Gln Phe Tyr Asp Leu Val Ala Ile Thr Asp
35 40 45
Gly Gln Phe Pro Pro Ala Cys Ala Ser Gly Ala Ile Met Thr Ala Ala
50 55 60
Thr Gly Arg Cys Leu Ala Ser Gly Val Cys Thr Leu Asp Gly Asp Pro
65 70 75 80
Asp Thr Ile Ala Ala Ile Arg Ala Leu Arg Val Phe Ala Ala Trp Leu
85 90 95
Asp Leu Glu Tyr Thr Pro Thr Gly Phe Tyr Glu Thr Ser Ala Ile Asp
100 105 110
Val Val Gly Asp Trp Asn Asp Tyr Glu Gly Arg Thr Arg Asp Glu Val
115 120 125
Ile Glu Thr Leu Thr Asp Ala Ala Asp Asp Trp Asp Arg Leu His His
130 135 140
Thr Gly Gly Ala Arg
145
<210> 36
<211> 108
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 36
Met Ser Leu Ser Tyr Val Asn Pro Ala Leu Thr Pro Thr Ala Pro Ala
1 5 10 15
Gly Asp Ser Arg Pro Ser Lys Pro Arg Arg Arg Asp Val Val Glu Asn
20 25 30
Asp Glu Tyr Ala Ala Phe Val Arg Arg Ile Ile Arg Ala Phe Ala Lys
35 40 45
Arg Val Ala Thr Gly Asp Val Glu Ala Leu Arg Asp Met Val Gly Leu
50 55 60
Ser Ala Gln Leu Asp Asp Ala Ile Ser Glu Ala Val Ile Gly Leu Arg
65 70 75 80
Ala Tyr Gly Tyr Ser Trp Ala Glu Ile Gly Asp Arg Leu Gly Ile Ser
85 90 95
Arg Gln Ala Ala Gln Gln Arg Trp Gly Gly Asp Lys
100 105
<210> 37
<211> 138
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 37
Met Thr Thr Ser Ala Leu Thr Asn Asp Tyr Leu Glu Ala Leu Gly Ala
1 5 10 15
Arg Thr Gly Ile Arg Val Glu Phe Tyr Asp Pro Thr Gly Ser Arg Tyr
20 25 30
Gly Phe Pro Thr Phe Pro Tyr Arg Gln Ala Pro Glu His Leu Ala Thr
35 40 45
Arg Arg Gln Leu Arg Ala Asp Gly Leu Cys Pro Asn Gly Tyr Asp Pro
50 55 60
Val Ala Gln Ile Leu Trp Met His Arg Gly Gln Arg Arg Val Ala Tyr
65 70 75 80
Leu Tyr Arg Arg Asp Leu Ala Lys Pro Lys Arg Val Pro Thr Ala Ala
85 90 95
Gln Leu Ala Val Val Ala Lys Met Leu Leu Ala Arg Arg Thr Cys Asp
100 105 110
Ser Cys Gly Val Thr Arg Asp Tyr Tyr Ile Pro Arg Arg Thr Gly Ile
115 120 125
Cys Leu Ser Cys Glu Val Gly Gly Ser Arg
130 135
<210> 38
<211> 61
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 38
Met Thr Thr Asp Pro Glu Asn Asn Ser Pro Ala Thr Thr Arg Cys Gln
1 5 10 15
Cys Gly Asp His Tyr Cys Ala Glu Val Met Pro Lys Asp Gln Asp Arg
20 25 30
Ser Gln Cys Cys Gln Tyr Cys Gly Tyr Arg Asp Cys Asp Val Cys Gly
35 40 45
Trp Thr Asp Gln Ala Leu Arg Ser Pro Glu Val Ser Arg
50 55 60
<210> 39
<211> 96
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 39
Met Ser Leu Ile Asp Leu Gly Lys His Leu Ala Thr Asp Asn Cys Leu
1 5 10 15
Trp Cys Ile Gly Gly Met Ser Pro Ala Gly Ile His Pro Asp Leu Gly
20 25 30
Pro Val Leu Cys Leu Cys Pro Thr Glu Gln Trp Cys Asp Glu Cys Gly
35 40 45
Ser Thr Ser Leu Phe Pro Ala Glu Tyr Glu Thr Leu Asp Asp Arg Ile
50 55 60
Asn Glu Leu Phe Asp Asp Gly Leu Ser Ala Val Trp Cys Glu Ala Cys
65 70 75 80
Met Gly Val Val Ala Val Ile Pro Val Thr Asn Asp Gly Gly Ile Arg
85 90 95
<210> 40
<211> 169
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 40
Met Asn Pro Leu Arg Arg Lys Ala Ala Gln Gln Pro Thr Thr Gly Pro
1 5 10 15
Ala Ala Pro Ala Ser Val Asn Leu Thr Glu Gln Phe Ala Ile Glu Tyr
20 25 30
Ala Lys Ser Ala Val Pro Asn Met Leu Lys Ala Ile Asp Ser Val Lys
35 40 45
Arg Tyr Asn Arg Ala Thr Leu Ile Gly Ala Leu Ile Thr Ser Tyr Leu
50 55 60
His Gln Ala His Tyr Leu Ala Ser Thr Gly Ala Gly Tyr Phe Ala Tyr
65 70 75 80
Leu Pro Pro Ala Ile Phe Asp Thr Ala Met Val Ser Met Leu Ile Val
85 90 95
Val Arg Thr Pro Gly Ile Val Lys Asp Ala Lys Arg Trp Ala Met Ala
100 105 110
Val Phe Ile Gly Ala Ala Leu Leu Ser Ala Thr Val Asn Phe Ala Ala
115 120 125
Pro Ala Thr Ser Ala Cys Ala Ser Ser Ser Pro Trp Ser Ser Ser Trp
130 135 140
Ser Ser Ala Ser Asn Ser Ser Pro Asp Ala Ser Ala Pro Thr Ser Pro
145 150 155 160
Pro Ser Thr Asn Lys Pro Pro Asn Ser
165
<210> 41
<211> 107
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 41
Met Thr Ala Val Asn Lys Ile Lys Ala Arg Gly Thr Ala Thr Thr Pro
1 5 10 15
Glu Pro Glu His Thr Thr Thr Gly Pro Thr Ala Pro Val Glu Gln Pro
20 25 30
Ala Thr Pro Gln Thr Ala Pro Val Val Pro Ala His Leu Leu Pro Ala
35 40 45
Ala Arg Phe Ser Val Val Gln His Glu Gln Thr Thr Gly Gln Pro Ile
50 55 60
Thr Ala Asp Asp Leu Ala Leu Arg Leu Asn Ile Thr Pro Ala Val Ala
65 70 75 80
Glu Thr Leu Ile Thr Thr Ile Arg Asp Thr Asn Pro Ala Arg Ile Asn
85 90 95
Gly His Ile Pro Thr Leu Thr Gly Gly Ala Arg
100 105
<210> 42
<211> 97
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 42
Met Thr Phe Val His Val Asp Ile His His Ile Thr His Thr Cys Pro
1 5 10 15
Ala Asn Pro Glu Leu His Pro Phe Asp Thr Arg Arg Thr Ile Val Ala
20 25 30
Thr Val Asp Gly Gly Pro Cys Arg Asn Pro Ile Ser Ile Arg Cys Gly
35 40 45
Asp Lys Thr Ala Val Ile Asp Cys Gly Arg His Glu Pro His His Arg
50 55 60
Gln Cys Pro Ala Cys Arg Ile Thr Val Ile Glu Arg His Ile Thr Ser
65 70 75 80
Thr Phe Val Gly His His Gly Pro Gln Leu Ala Thr Thr Arg Ile Ala
85 90 95
Ala
<210> 43
<211> 598
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 43
Met Ser Thr Ser Thr Leu Asp Leu Ala Pro Arg Glu Asn Ser Ala Arg
1 5 10 15
Gly Ala Gly Ser Asn Ala Asp Ala Trp Thr Pro Pro Pro Ala Asp Tyr
20 25 30
Thr Ala Ala Gly Gln Ala Leu Thr Arg Ala Thr Gln Pro Gly Tyr Phe
35 40 45
Asp Trp Leu Asp His Val Arg Ala Ala Ala Gly Cys Thr Arg Pro Val
50 55 60
Arg Leu Thr Gly Thr Leu Asp Thr Ile Glu Ala Thr Thr Gly Arg Leu
65 70 75 80
Leu Asp Ser Arg His Thr Asp Gln Leu Pro Asp Ala Ala Ile Tyr Lys
85 90 95
Ala Cys Gly Asn Arg Arg Ser Thr Val Cys Pro Ala Cys Ala Arg Thr
100 105 110
Tyr Gln Arg Asp Ala Phe Gln Ile Leu Arg Ala Gly Leu Ile Gly Gly
115 120 125
Lys Gly Val Pro Thr Thr Val Ala Arg His Pro Ala Val Phe Val Thr
130 135 140
Leu Thr Ala Pro Ser Phe Gly Ala Val His Thr Arg His Val Arg Lys
145 150 155 160
His Thr Cys Thr Asn Arg Ala Arg Cys Ser Cys Arg Pro Glu Pro Cys
165 170 175
His Ala Arg Arg Asn Pro Gly Leu Cys Gln His Tyr Gln Pro Ala Val
180 185 190
Cys Trp Ala Arg His Glu Pro Gly Asp Pro Gln Leu Gly Arg Pro Leu
195 200 205
Cys Leu Asp Cys Tyr Asp His Gln His His Val Val Trp Asn Leu Phe
210 215 220
Ser Gly Glu Leu Trp His Arg Thr Lys Gln Asp Ala Glu Arg Arg Leu
225 230 235 240
Ala Lys Leu Cys Lys Ala Arg Gly Ile Pro Phe His Glu Val Ser Asn
245 250 255
Gly Lys Asn Leu Arg Arg Ile Pro Pro Val Arg Leu Ala His Gly Lys
260 265 270
Ala Ala Glu Met Gln Arg Arg Gly Ala Val His Phe His Ala Leu Ile
275 280 285
Arg Leu Asp Gly Ile Asp Pro Thr Asp Pro Thr Arg Val Val Ala Pro
290 295 300
Pro Pro Gly Ile Gly Leu Asn Asp Leu Val Asp Ala Leu Thr Ala Ala
305 310 315 320
Ser Asp Ile Asp Phe Thr Thr Pro Asp His Pro Asp Arg Pro Asp Gly
325 330 335
Trp Pro Met Ala Trp Gly Glu Gln Ile Asp Ile Arg Pro Ile Ser Leu
340 345 350
Thr Gly Thr Gly Glu Val Thr Asp Ser Met Val Ala Gly Tyr Leu Ala
355 360 365
Lys Tyr Ala Thr Lys Ser Thr Glu Ile Thr Gly His Asn Ser Thr Arg
370 375 380
Ile Thr Gly Asp Thr Ile Thr Gln His Ala Asp Pro Ala Gly Asp His
385 390 395 400
Ile Ala Arg Leu Ile His Ala Cys Trp His Leu Gly Asn Asp Pro Asp
405 410 415
Ala Pro Ala Gly Lys Thr Ala Ile Arg Leu Pro Val Tyr Thr Gly Thr
420 425 430
Ala Gly Ala Lys Ile Arg Gln Pro Phe Gly Ala Pro Arg His Cys Pro
435 440 445
Asp Cys Gly Thr Arg Thr Arg Tyr Arg Thr Cys Pro Val Cys Val Ala
450 455 460
Glu Arg Gln Ala Ser Leu Asp Thr Gln Arg Pro Asn Asp Arg Gln Pro
465 470 475 480
Thr Pro Tyr Ala Arg Leu Arg Arg Trp Ala His Met Leu Gly Phe Gly
485 490 495
Gly His Phe Leu Thr Lys Ala Arg Arg Tyr Ser Val Thr Phe Arg Leu
500 505 510
Leu Arg Glu Thr Arg Ile Asp Phe Arg Arg Ala Glu Pro Asp Pro Ala
515 520 525
Asp Asn Ala Thr Val His Thr Val Asp His Leu Asp Glu Thr Thr Leu
530 535 540
Ile Val Gly Thr Leu Thr Phe Ala Gly Val Gly Trp His Thr Thr Gly
545 550 555 560
Asp Ala Leu Leu Ala Asn Thr Ala Ala Ala Gln Ala Arg Glu Arg Gln
565 570 575
Ala Ile Gly Arg Glu Glu Leu Ala His Glu Ala Ser Thr Ser Arg Pro
580 585 590
Val Ala Leu Asn Ala Ala
595
<210> 44
<211> 68
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 44
Met Asp Gly Ile Thr Pro Lys Ala Leu Tyr Arg Ile Pro Glu Ala Met
1 5 10 15
Arg Met Leu Ser Leu Ser Arg Ser Val Ile Tyr Glu Leu Ile Arg Ser
20 25 30
Gly Arg Leu Arg Thr Val Lys Glu Gly Arg Thr Arg Leu Val Pro Ala
35 40 45
Ser Ala Ile Thr Ala Tyr Val Thr Leu Leu Glu Gln Glu Ser Lys Lys
50 55 60
Gly Val Ala Ala
65
<210> 45
<211> 388
<212> PRT
<213> Actinoplanes sp. SE50/110
<400> 45
Met Thr Lys Arg Arg Ser Arg Gly Asp Gly Gly Leu His Trp Asp Glu
1 5 10 15
Gln Arg Gln Arg Trp Ile Ala Ser Val Thr Val Gly Tyr Thr Pro Ala
20 25 30
Gly Lys Arg Ile Val Arg Lys Ala Ser Gly Lys Thr Lys Thr Glu Ala
35 40 45
Asn Asn Ala Leu Arg Gln Lys Ile Arg Glu Tyr Gln Asp Gly Leu Ser
50 55 60
Ile Pro Thr Thr Gly Tyr Thr Val Ala Asp Ala Val Thr Asp Trp Leu
65 70 75 80
Thr Tyr Gly Leu Pro Asp Val Asp Glu Glu Thr Val Asn Asn Tyr Thr
85 90 95
Leu Leu Ala Asn Gly His Ile Ile Pro Ala Ile Gly Ala Arg Lys Leu
100 105 110
Arg Asp Pro Ser Lys Gln Lys Glu Leu Ser Ala Thr Asp Ile Asp Arg
115 120 125
Trp Leu Ala Asp Lys Ala Lys Ile Leu Ser Thr Arg Thr Leu Arg Leu
130 135 140
Leu His Ser Ile Ala Asn Arg Ala Ile Asn Arg Ala Met Ala Arg Asp
145 150 155 160
Lys Val Met Arg Asn Val Val Ala Leu Cys Lys Val Pro Thr Gly Thr
165 170 175
Ala Gly Arg Pro Ser Lys Ser Leu Thr Tyr Glu Gln Ala Lys Ala Leu
180 185 190
Leu Val Ala Ala Glu Ser Ser Ser Leu His Ala Tyr Val Val Leu Ser
195 200 205
Leu Leu Thr Gly Ala Arg Thr Glu Glu Leu Arg Glu Leu Thr Trp Gln
210 215 220
His Val Asp Leu Val Gly Arg Pro Asp Ala Glu Pro Pro Ile Pro Pro
225 230 235 240
Ala Ile His Val Trp His Ser Val Arg Ala His Gly Asp Thr Lys Thr
245 250 255
Lys Lys Ser Arg Arg Ser Leu Ala Leu Pro Val Arg Cys Val Arg Val
260 265 270
Leu Thr Ala Gln Arg Ala Ala His Gly Asp Pro Arg Pro Asp Asp Tyr
275 280 285
Val Cys Ala Ser Lys Val Gly Thr Gln Leu Asp Arg His Asn Val Leu
290 295 300
Arg Ala Phe Arg Ala Ile Val Ala Ala Val Pro Gly Met Asn Pro Ala
305 310 315 320
Glu Trp Thr Pro Arg Glu Leu Arg His Ser Phe Val Ser Leu Leu Ser
325 330 335
Asp Asn Gly Met Ser Ile Glu Glu Ile Ala Asp Leu Cys Gly His Ser
340 345 350
Gly Thr Ser Ile Thr Glu Thr Val Tyr Arg His Gln Leu Arg Pro Val
355 360 365
Leu Leu Asn Gly Ala Val Ala Met Asp Arg Ile Phe Gly Pro Asp Asp
370 375 380
Thr Pro Gly Ala
385
Claims (6)
- a) 서열번호 1의 서열을 갖는 폴리뉴클레오티드,
b) 엄격한(stringent) 조건 하에 (a)에서 특정된 폴리뉴클레오티드에 혼성화하는 폴리뉴클레오티드, 및
c) 서열번호 1의 서열과 적어도 90%의 동일성을 갖는 폴리뉴클레오티드를 포함하는 군에서 선택된 방선균류 통합 및 접합 인자. - 제1항에 있어서, 서열번호 1의 서열과 적어도 95%의 동일성을 갖는 방선균류 통합 및 접합 인자.
- 제1항 또는 제2항의 방선균류 통합 및 접합 인자로 형질전환된 숙주 세포.
- 제3항에 있어서, 액티노플라네스(Actinoplanes) sp.인 숙주 세포.
- a) 제3항 또는 제4항의 숙주 세포를 유용한 배지에서 배양하고,
b) 배양물로부터 생성물을 수확하여
c) 생성물을 단리하고 정제하는 단계를 포함하는 생물학적 생성물의 제조방법. - 제5항에 있어서, 생성물이 아카보즈인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP11192618 | 2011-12-08 | ||
EP11192618.4 | 2011-12-08 | ||
PCT/EP2012/074366 WO2013083566A1 (en) | 2011-12-08 | 2012-12-04 | New actinomycete integrative and conjugative element from actinoplanes sp. se50/110 as plasmid for genetic transformation of related actinobacteria |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140109922A true KR20140109922A (ko) | 2014-09-16 |
Family
ID=47278320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147018467A KR20140109922A (ko) | 2011-12-08 | 2012-12-04 | 연관된 방선균의 유전적 형질전환을 위한 플라스미드인 액티노플라네스 sp. SE50/110으로부터 유래한 신규한 방선균류 통합 및 접합 인자 |
Country Status (12)
Country | Link |
---|---|
US (2) | US9217154B2 (ko) |
EP (1) | EP2788373B1 (ko) |
JP (1) | JP2015501641A (ko) |
KR (1) | KR20140109922A (ko) |
CN (1) | CN104144942A (ko) |
AR (1) | AR089117A1 (ko) |
CA (1) | CA2858259A1 (ko) |
ES (1) | ES2718331T3 (ko) |
HK (1) | HK1203970A1 (ko) |
IL (1) | IL232587A (ko) |
IN (1) | IN2014CN04155A (ko) |
WO (1) | WO2013083566A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140109922A (ko) | 2011-12-08 | 2014-09-16 | 바이엘 인텔렉쳐 프로퍼티 게엠베하 | 연관된 방선균의 유전적 형질전환을 위한 플라스미드인 액티노플라네스 sp. SE50/110으로부터 유래한 신규한 방선균류 통합 및 접합 인자 |
CN112522174B (zh) * | 2020-12-25 | 2022-08-09 | 上海交通大学 | 一种敲除负调控蛋白基因以提高阿卡波糖发酵水平的方法 |
CN112592878B (zh) * | 2020-12-25 | 2022-08-26 | 上海交通大学 | 增强正调控蛋白基因表达以提高阿卡波糖发酵水平的方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2064092C2 (de) | 1970-12-28 | 1983-06-01 | Bayer Ag, 5090 Leverkusen | Inhibitoren für Glykosidhydrolasen aus Actinomyceten |
DE2209834C3 (de) | 1972-03-01 | 1978-04-20 | Bayer Ag, 5090 Leverkusen | Herstellung von Saccharase-Inhibitoren |
DE2347782C3 (de) | 1973-09-22 | 1979-10-11 | Bayer Ag, 5090 Leverkusen | Aminozuckerderivate, Verfahren zu ihrer Herstellung sowie diese Verbindungen enthaltende Arzneimittel |
US4062950A (en) | 1973-09-22 | 1977-12-13 | Bayer Aktiengesellschaft | Amino sugar derivatives |
EP0796915A3 (de) * | 1996-03-22 | 1999-04-14 | Bayer Ag | Verfahren zur Herstellung sowie zur Verwendung von Acarviosyl-Transferase bei der Umwandlung von Acarbose-Homologen in Acarbose, zur Herstellung von Acarbose-Homologen |
AU2008282876A1 (en) * | 2007-07-27 | 2009-02-05 | Wyeth | Vectors and methods for cloning gene clusters or portions thereof |
TW201217533A (en) | 2010-08-04 | 2012-05-01 | Bayer Pharma AG | Genomics of actinoplanes utahensis |
KR20140109922A (ko) | 2011-12-08 | 2014-09-16 | 바이엘 인텔렉쳐 프로퍼티 게엠베하 | 연관된 방선균의 유전적 형질전환을 위한 플라스미드인 액티노플라네스 sp. SE50/110으로부터 유래한 신규한 방선균류 통합 및 접합 인자 |
-
2012
- 2012-12-04 KR KR1020147018467A patent/KR20140109922A/ko not_active Application Discontinuation
- 2012-12-04 ES ES12794734T patent/ES2718331T3/es active Active
- 2012-12-04 WO PCT/EP2012/074366 patent/WO2013083566A1/en active Application Filing
- 2012-12-04 CA CA2858259A patent/CA2858259A1/en not_active Abandoned
- 2012-12-04 JP JP2014545206A patent/JP2015501641A/ja active Pending
- 2012-12-04 CN CN201280060526.8A patent/CN104144942A/zh active Pending
- 2012-12-04 US US14/363,810 patent/US9217154B2/en not_active Expired - Fee Related
- 2012-12-04 IN IN4155CHN2014 patent/IN2014CN04155A/en unknown
- 2012-12-04 EP EP12794734.9A patent/EP2788373B1/en not_active Not-in-force
- 2012-12-07 AR ARP120104603A patent/AR089117A1/es active Pending
-
2014
- 2014-05-13 IL IL232587A patent/IL232587A/en not_active IP Right Cessation
-
2015
- 2015-05-07 HK HK15104333.1A patent/HK1203970A1/xx unknown
- 2015-11-12 US US14/939,495 patent/US9562249B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US9562249B2 (en) | 2017-02-07 |
US9217154B2 (en) | 2015-12-22 |
WO2013083566A1 (en) | 2013-06-13 |
EP2788373A1 (en) | 2014-10-15 |
HK1203970A1 (en) | 2015-11-06 |
CA2858259A1 (en) | 2013-06-13 |
IN2014CN04155A (ko) | 2015-07-17 |
CN104144942A (zh) | 2014-11-12 |
US20140349346A1 (en) | 2014-11-27 |
US20160130622A1 (en) | 2016-05-12 |
IL232587A0 (en) | 2014-06-30 |
EP2788373B1 (en) | 2019-01-23 |
AR089117A1 (es) | 2014-07-30 |
ES2718331T3 (es) | 2019-07-01 |
IL232587A (en) | 2017-08-31 |
JP2015501641A (ja) | 2015-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101659101B1 (ko) | 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도 | |
SA518391513B1 (ar) | طريقة لإنتاج حمض ساكسينيك وعوامل كيميائية أخرى باستخدام انتشار مسهل لنقل السكر | |
WO2020118435A1 (en) | Cis conjugative plasmid system | |
Sharma et al. | Global gene expression analysis of the Myxococcus xanthus developmental time course | |
US11858967B2 (en) | Compositions and methods for enhanced production of enduracidin in a genetically engineered strain of streptomyces fungicidicus | |
Song et al. | Identification of seven novel virulence genes from Xanthomonas citri subsp. citri by Tn5-based random mutagenesis | |
US9562249B2 (en) | Actinomycete integrative and conjugative element from Actinoplanes sp. SE50/110 as plasmid for genetic transformation of related actinobacteria | |
Tabatabai et al. | Molecular analysis of the two‐component genes, ompR and envZ, in the symbiotic bacterium Xenorhabdus nematophilus | |
CN113166741A (zh) | Dna文库的多重确定性组装 | |
CN110857447B (zh) | 提高米尔贝霉素a3/a4或其衍生物产量的方法 | |
KR20220021019A (ko) | 화합물의 제조를 위한 조성물 및 방법 | |
US20040247620A1 (en) | Transformation system based on the integrase gene and attachment site for Myxococcus xanthus bacteriophage Mx9 | |
KR20100034055A (ko) | 유전자 클러스터 또는 그의 일부를 클로닝하기 위한 벡터 및 방법 | |
US11549116B2 (en) | Nucleic acid molecules comprising a variant inc coding strand | |
US20030113874A1 (en) | Genes and proteins for the biosynthesis of rosaramicin | |
Knauber et al. | Mutation in the rel gene of Sorangium cellulosum affects morphological and physiological differentiation | |
TW201336992A (zh) | 源自游動放線菌se50/110並作為用於相關放線菌基因轉型之質體的新穎放線菌嵌合及接合單元 | |
CN101942476A (zh) | 一种筛选诱变生物的方法 | |
Leloup et al. | Identification of a chromosomal tra-like region in Agrobacterium tumefaciens | |
CN117384921A (zh) | 环庚三烯酚酮类化合物Isatropolones生物合成基因簇及其应用 | |
JPH1094395A (ja) | フレノリシン遺伝子クラスター | |
CN115896134A (zh) | 一种提高伊短菌素合成的短短芽孢杆菌工程菌株及其构建方法与应用 | |
KR20080032641A (ko) | 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 | |
US20030194784A1 (en) | DNA encoding methymycin and pikromycin | |
CN108265069A (zh) | 一种去甲基金霉素生物合成基因簇及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |