KR101573536B1 - 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 - Google Patents
악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 Download PDFInfo
- Publication number
- KR101573536B1 KR101573536B1 KR1020087018136A KR20087018136A KR101573536B1 KR 101573536 B1 KR101573536 B1 KR 101573536B1 KR 1020087018136 A KR1020087018136 A KR 1020087018136A KR 20087018136 A KR20087018136 A KR 20087018136A KR 101573536 B1 KR101573536 B1 KR 101573536B1
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- val
- gly
- arg
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/365—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinoplanes (G)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/045—Actinoplanes
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Engineering & Computer Science (AREA)
- Gastroenterology & Hepatology (AREA)
- Public Health (AREA)
- Biophysics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Veterinary Medicine (AREA)
- Virology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Animal Behavior & Ethology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 란티바이오틱 액타가르딘에 대한 생합성 유전자 클러스터의 특성 규명, 액타가르딘의 신규한 변이체 및 그의 생합성 클러스터의 동정과, 특성 규명된 생합성 유전자 클러스터로부터의 유전자를 이용하여, 액타가르딘, 본원에서 액타가르딘 B로도 지칭되는 신규한 액타가르딘 변이체, 및 본 발명에 따라 제조된 이들 둘 모두의 변이체를 제조하고 사용하는 방법에 관한 것이다.
Description
본 발명은 란티바이오틱 액타가르딘에 대한 생합성 유전자 클러스터의 특성 규명, 액타가르딘의 신규한 변이체 및 그의 생합성 클러스터의 동정과, 특성 규명된 생합성 유전자 클러스터로부터의 유전자를 이용하여, 액타가르딘, 악티노플레네스 리구리애(A. liguriae) 균주에서 제조된 신규한 액타가르딘 변이체, 및 본 발명에 따라 생산된 이들 둘 모두의 변이체를 제조하고 사용하는 방법에 관한 것이다.
란티바이오틱(lantibiotic)은 그램 양성 박테리아에 의해 생산되며, 항생제 활성 및 기타 활성을 갖는 펩티드이다. 다른 변형된 잔기들 중에서 티오에테르 아미노산 란티오닌 및 메틸란티오닌을 함유하는데, 이는 폴리사이클릭 구조로 펩티드 쇄를 가교-결합시킨다. 다음과 같이 분류하는 것이 전혀 문제가 없는 것은 아니지만, 란티바이오틱은 2 부류, A형 및 B형으로 분류된다. A형 란티바이오틱은 일반적으로 박테리아 및 다른 원형질막에 구멍을 형성할 수 있는 긴 양친매체이다. 대조적으로 B형 란티바이오틱은 효소 기능을 저해하며, 입체 형태적으로 한정된 구형의 펩티드이다. 예로는 신나마이신 및 듀라마이신이 있다.
예로서, 신나마이신과 같은 B형 란티바이오틱에 관한 활성으로는 항미생물 활성(항생제로서 효능이 있는 적용성을 제공한다), 안지오텐신 전환 효소 저해(혈압 조절에서 효능이 있는 적용성을 제공한다), 포스포리파제 A2의 저해를 통한 면역조절(소염제로서의 효능이 있는 적용성을 제공한다), 및 프로스타글란딘 및 류코트리엔 생합성 간섭을 포함한다.
B형 란티바이오틱은 각각의 기질을 차단함으로써 효소 활성을 간섭하여 그의 활성을 발휘하는 것으로 보인다. 예를 들면, B형 란티바이오틱, 예로서, 머사시딘 및 액타가르딘이 펩티도글리칸의 생합성을 저해하는 것으로 밝혀졌고; 글리코실 전이반응이 표적 반응으로서 동정되었다. 이들 반응에 대한 기질은 지질-결합 세포벽 전구체 지질 II이다. 이는 란티바이오틱 반코마이신에 대한 표적이 되는 반면, 작용 부위는 상이하고, 임의의 현 항균제에 의해 사용되지 않는 신규한 표적 결합 부위이다.
신나마이신 부류의 B형 란티바이오틱의 경우, 항균제 활성이 특히, 바실러스(Bacillus) 균주에서 관찰되었는데, 막 기능, ATP 의존성 양성자 전이 및 Ca2+-흡수, 및 ATP아제에 미치는 효과가 기재되었다. 또한, 포스파티딜에탄올아민-함유 평면막내 한정된 구멍 형성이 보고되었다. 이러한 효과는 이들 B형 란티바이오틱이 포스파티딜에탄올아민에 특이적으로 결합하기 때문일 수 있다.
란티바이오틱은 프로피오니박테리움 아크네스(Propionibacterium acnes) 및 문제가 되는 병원균, 예컨대, 보편적으로 사용되고 있는 다수의 항생제에 대하여 내성을 갖고 있거나, 내성을 발생시키고 있는, 메티실린 내성 스타필로코커스 아우레우스(MRSA: methicillin-resistant Staphylococcus aureus), 및 스트렙토코커스 뉴모니애(Streptococcus pneumoniae)에 대한 항균제 및 식품 첨가제로서의 효능과 유용성을 갖는 것으로 나타났다. 리뷰를 위해, 문헌 ([Sahl and Bierbaum (1998) Annual Rev. Microbiol. 52:41-79]; [Jack and Sahl (1995) TIBTECH 13:269 278]; [Gasson (1995) Chapter 10, Lantibiotics, in Vining and Stuttard (eds) Biotechnology Series: Genetics and Biochemistry of Antibiotic Production, Biotechnological I 30 Series 28, pages 283-306])을 참조할 수 있다.
항생제 분야에 있어서, 내성, 생체적합성, 독성 등과 같은 문제를 극복하기 위해 새로운 항생제 화합물 공급에 대해서 계속적으로 요구되고 있다. 따라서, 란티바이오틱을 생산하는 방법, 및 란티바이오틱의 변이체 형태(이는 천연 형태와 상이한 활성 프로파일을 가질 수 있다)의 생산이 바람직할 수 있다.
액타가르딘은 공지된 B형 란티바이오틱이며, 테트라사이클릭이고, 길이는 19개(1890 Da)의 아미노산이다. 이는 시험관내 모델 및 생체내 모델, 둘 모두에서 스타필로코커스 아우레우스 및 스트렙토코커스(Streptococcus) 발열원과 같이 중요한 그램 양성 병원체에 대하여 강력한 활성을 갖는다. 액타가르딘의 구조는 도 4에 제시되어 있다. 본 화합물은 프리-프로-펩티드로부터 생산되며, 그의 C-말단부는 SSGWVCTLTIECGTVICAC(서열 번호 4)의 폴리펩티드 서열을 갖는다. 서열 번호 4의 폴리펩티드는 하기 가교결합: 가교결합 1-6, 란티오닌(Ser-Cys); 가교결합 7-12, 베타-메틸란티오닌(Thr-Cys); 가교결합 9-17, 베타-메틸란티오닌(Thr-Cys); 가교결합 14-19, 베타-메틸란티오닌 설폭시드(Thr-Cys)에 의해 2차 및 3차 구조를 형성함으로써 변형된다.
액타가르딘은 2개의 악티노플레인스(Actinoplanes) 종; 악티노플레인스 가르바디넨시스(A. garbadinensis) 및 악티노플레인스 리구리애(A. liguriae)에 의해 생산된다고 보고되었다. 가교결합 14-19는 산화되어 있고, 즉, 메틸란티오닌 설폭시드가 아닌, 베타-메틸란티오닌인, 본원에서는 데옥시-액타가르딘으로 명명되는 유도체도 함께 생산된다.
US 6,022,851에는 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애의 단리된 균주로부터 액타가르딘을 단리하는 것이 기재되어 있다.
[발명의 개시]
본 발명은 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애로부터의 B형 란티바이오틱, 액타가르딘에 대한 생합성 유전자 클러스터와 관련하여 클로닝되고, 서열 분석되고, 해명된 구조 및 조절 상의 정보에 관한 것이다.
본 발명자는 또한 놀랍게도, 본원에서 악티노플레인스 리구리애 NCIMB 41362로 명시된 악티노플레인스 리구리애 단리물에서, 본 발명자가 액타가르딘 B로 명명하는, 신규한 형태의 액타가르딘, 또는 비산화된 형태로 데옥시-액타가르딘 B가 생산된다는 것을 발견하게 되었다. 이러한 형태는 액타가르딘과 유사한 항미생물 활성을 갖고, 서열 번호 1의 1차 폴리펩티드 서열로부터 생성되며, 이는 액타가르딘과 유사한 가교-결합을 이룬다. 변이체는 액타가르딘에 대하여 신규하고 유용한 대안을 제공한다. 추가로, 액타가르딘과 상이한 액타가르딘 B중의 잔기를 동정함으로써 이들 차이에 기초한 추가의 란티바이오틱을 제공하게 된다.
본 발명자는 또한 액타가르딘 및 액타가르딘 B 생산에 관한 유전자를 포함하는 액타가르딘 생산 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애 NCIMB 41362, 둘 모두로부터 유전자 클러스터를 단리하였다.
하나의 측면에서, 본 발명은 서열 번호 2 및 서열 번호 3의 1차 폴리펩티드 서열에 기초한 변이체 뿐만 아니라, 그의 변이체를 비롯한, 신규한 액타가르딘 B 및 그의 변이체를 제공한다.
추가의 측면에서, 본 발명은 액타가르딘 B 및 그의 변이체를 코딩하는 핵산, 핵산 및 상기-언급한 유전자 클러스터로부터 유래된 그의 변이체 세트, 액타가르딘 B 및 그의 변이체 제조 방법, 및 액타가르딘 B의 신규한 변이체를 생산하는 방법을 제공한다.
[도면의 간단한 설명]
도 1은 악티노플레인스 가르바디넨시스로부터 단리된 액타가르딘 코딩 및 조절 유전자 클러스터 지도를 제공한다.
도 2는 본원에서 액타가르딘 B로 언급되는, 액타가르딘 B의 신규한 변이체를 코딩하는, 악티노플레인스 리구리애로부터 단리된, 코딩 및 조절 유전자 클러스터 지도를 제공한다.
도 3은 악티노플레인스 가르바디넨시스 또는 악티노플레인스 리구리애로부터 단리된 핵산 서열을 사용하여 액타가르딘 변이체를 생성하기 위한, 본원에서 개시된 방법을 제시하는 개략도이다.
도 4는 성숙한 액타가르딘의 1차 구조에 대한 대표도이다(여기서, X1-X2는 Val-Ile를 나타내고, Y는 -S(O)-이고, Z는 NH2이다). "데옥시-액타가르딘 B"는 AbuS14와 AlaS19 사이에 비산화된 메틸란티오닌 브릿지를 갖는 Val15Leu Ile16Val 변이체이다.
서열 설명
독자의 편의를 위해, 본 출원의 서열에 하기와 같이 비연속적으로 번호를 매겼다:
서열 번호 1은 액타가르딘 B의 1차 폴리펩티드 서열이다: SSGWVCTLTIECGTLVCAC.
서열 번호 2는 액타가르딘 B 변이체 VV의 1차 폴리펩티드 서열이다: SSGWVCTLTIECGTVVCAC.
서열 번호 3은 액타가르딘 B 변이체 LI의 1차 폴리펩티드 서열이다: SSGWVCTLTIECGTLICAC.
서열 번호 4는 액타가르딘의 1차 폴리펩티드 서열이다: SSGWVCTLTIECGTVICAC;
서열 번호 11은 Ala-액타가르딘 B의 1차 폴리펩티드 서열이다: ASSGWVCTLTIECGTLVCAC.
서열 번호 12는 Ala-액타가르딘 B 변이체 VV의 1차 폴리펩티드 서열이다: ASSGWVCTLTIECGTVVCAC.
서열 번호 13은 Ala-액타가르딘 B 변이체 LI의 1차 폴리펩티드 서열이다: ASSGWVCTLTIECGTLICAC.
서열 번호 14는 Ala-액타가르딘의 1차 폴리펩티드 서열이다: ASSGWVCTLTIECGTVICAC.
서열 번호 212는 프리-프로-액타가르딘 B의 1차 폴리펩티드 서열이다: MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTLVCAC.
서열 번호 22는 프리-프로-액타가르딘 B 변이체 VV의 1차 폴리펩티드 서열이다: MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTVVCAC.
서열 번호 223은 프리-프로-액타가르딘 B 변이체 LI의 1차 폴리펩티드 서열이다: MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTLICAC.
서열 번호 119는 프리-프로-액타가르딘의 1차 폴리펩티드 서열이다: MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTVICAC.
서열 번호 100은 벡터가 아닌, 코스미드 CosAG14의 악티노플레인스 가르바디넨시스-유래 뉴클레오티드 서열이다.
서열 번호 101-132는 각각 서열 번호 100의 오픈 리딩 프레임 orf1 - orf32의 폴리펩티드 서열이다.
서열 번호 200은 벡터가 아닌, 코스미드 CosAL02의 악티노플레인스 리구리애-유래 뉴클레오티드 서열이다.
서열 번호 201-231은 각각 서열 번호 200의 오픈 리딩 프레임 orf1 - orf31의 폴리펩티드 서열이다.
서열 번호 300-312는 본원 하기에 기술하는 프라이머 서열이다.
[발명의 상세한 설명]
본 발명은 서열 번호 100 및 서열 번호 200의 유전자 클러스터, 및 이들 클러스터에 의해 코딩되는 폴리펩티드 및 그의 변이체에 관한 것이다. 서열 번호 119의 폴리펩티드는 프리-프로-액타가르딘이고, 서열 번호 212의 폴리펩티드는 프리-프로-액타가르딘 B이다. 나머지 폴리펩티드 및 그의 변이체(본원에서 정의되는 바와 같은 것)는 본원에서 총칭적으로 "클러스터 폴리펩티드"로 지칭된다. 서열 번호 100으로부터 유래된 클러스터 폴리펩티드는 "1xx 폴리펩티드"로서 지칭되며, 서열 번호 200으로부터 유래된 것은 "2xx 폴리펩티드"로서 지칭된다. 서열 및 길이, 둘 모두에서 클러스터 폴리펩티드와 100% 동일한 폴리펩티드를 "야생형" 폴리펩티드로 지칭한다. 서열 번호 100 또는 서열 번호 200으로부터 유래된 클러스터 폴리펩티드는 야생형 또는 변이체일 수 있다.
폴리펩티드는 실질적으로 단리된 형태일 수 있다. 본 발명의 단리된 폴리펩티드는, 천연적으로 그와 결합하는 있는 물질, 예로서, 세포 내에서 그와 함께 발견되는 다른 폴리펩티드가 존재하지 않거나 실질적으로 존재하지 않는, 상기 정의된 바와 같이 단리된 형태의 것일 것이다. 물론, 예를 들면, 폴리펩티드는 희석제 또는 애부번트와 함께 제제화될 수 있고, 여전히 실제 목적을 위해 단리될 수 있다.
본 발명의 폴리펩티드는 또한 실질적으로 정제된 형태일 수 있으며, 이 경우, 본 발명의 폴리펩티드는 일반적으로 시료내 90% 초과, 예컨대, 95%, 98% 또는 99% 초과의 폴리펩티드가 본 발명의 폴리펩티드인 것인, 시료내 폴리펩티드를 포함한다.
란티바이오틱 폴리펩티드 및 란티바이오틱A 유전자
본 발명에서, 란티바이오틱A 또는 LanA 폴리펩티드, 란티바이오틱A 또는 LanA 유전자에 대한 언급은 총칭적으로 B형 란티바이오틱 폴리펩티드 또는 상기 펩티드를 코딩하는 유전자를 지칭하는 것이다. 따라서, 그에 관한 언급은 신나마이신, 머사시딘, 액타가르딘 및 액타가르딘 B 및 이들 산물을 코딩하는 유전자에 관한 언급을 포함한다. 란티바이오틱를 생산하는 숙주 세포에 관한 것은 그의 천연 형태로 LanA 폴리펩티드를 생산하는 임의의 숙주 세포를 지칭하는 것이며, 이는 본원 하기에서 추가로 정의된다.
LanA 폴리펩티드는 항미생물 활성을 갖는 폴리펩티드이다. 항미생물 활성은 기준 유기체, 예컨대, 마이크로코커스 루테우스(Micrococcus luteus)에 대한 MIC 값을 측정함으로써 검사될 수 있다. LanA 폴리펩티드의 MIC가 동일한 기준 미생물 균주에 대하여 16배 초과로 액타가르딘의 것보다 더 작거나 그와 동일할 경우, LanA 폴리펩티드는 항미생물 활성을 나타내는 것으로 간주된다. 본 발명에서, 악티노플레인스 가르바디넨시스 LanA 유전자는 actA로 지칭되고, 악티노플레인스 리구리애 LanA 유전자는 LigA로 지칭된다.
기타 Lan 폴리펩티드
본원에서 사용되는 바, "LanM" 폴리펩티드에 관한 언급은, 전구체 폴리펩티드를 란티바이오틱 화합물로 전환시키는데 필요한 변형 인자로서, 란티바이오틱 유전자 클러스터로부터 유래된 폴리펩티드에 관한 것이다. LanM 폴리펩티드는 서열 번호 120의 것(ActM) 또는 그의 변이체, 서열 번호 213의 것(LigM) 또는 그의 변이체, WO02/088367에서 정의된 것과 같은 cinM 폴리펩티드, 문헌 [Altena et al, 2000]에 개시된 mrsM 폴리펩티드, 또는 B형 란티바이오틱을 생산하는 박테리아의 또다른 유전자 클러스터로부터의 상동성 폴리펩티드를 포함한다.
"LanR" 폴리펩티드에 관한 언급은, 전구체 폴리펩티드의 생산 조절에 필요한 조절 인자로서, 란티바이오틱 유전자 클러스터로부터 유래된 폴리펩티드에 관한 것이다. LanR 폴리펩티드는 서열 번호 122의 것(ActR) 또는 그의 변이체, 서열 번호 216의 것(LigR) 또는 그의 변이체, WO02/088367에서 정의된 것과 같은 cinR1 폴리펩티드, 문헌 [Altena et al, 2000]에 개시된 mrsR1 폴리펩티드, 또는 B형 란티바이오틱을 생산하는 박테리아의 또다른 유전자 클러스터로부터의 상동성 폴리펩티드를 포함한다.
"LanT" 폴리펩티드에 관한 언급은, 전구체 폴리펩티드를 란티바이오틱 화합물로 생산하는데 필요한 수송 인자로서, 란티바이오틱 유전자 클러스터로부터 유래된 폴리펩티드에 관한 것이다. LanT 폴리펩티드는 서열 번호 123의 것(ActT) 또는 그의 변이체, 서열 번호 214의 것(LigT) 또는 그의 변이체, WO02/088367에서 정의된 것과 같은 cinT 폴리펩티드, 문헌 [Altena et al, 2000]에 개시된 mrsT 폴리펩티드, 또는 B형 란티바이오틱을 생산하는 박테리아의 또다른 유전자 클러스터로부터의 상동성 폴리펩티드를 포함한다.
"LanO" 폴리펩티드에 관한 언급은, 본 발명의 데옥시 형태의 액타가르딘 및 화합물을 본 발명의 액타가르딘 또는 화합물(여기서, Y는 -S(O)-이다)로 산화시키는데 관여하는 것으로 여겨지는 인자로서, 란티바이오틱 유전자 클러스터로부터 유래된 폴리펩티드에 관한 것이다. LanO 폴리펩티드는 서열 번호 122의 것(ActO) 또는 그의 변이체, 서열 번호 215의 것(LigO) 또는 그의 변이체, 또는 B형 란티바이오틱을 생산하는 박테리아의 또다른 유전자 클러스터로부터의 상동성 폴리펩티드를 포함한다.
클러스터 폴리펩티드
하나의 측면에서, 본 발명은 서열 번호 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230 및 231중 어느 하나로부터 선택된 단리된 클러스터 폴리펩티드를 제공한다. 또다른 측면에서, 본 발명은 상기-언급된 서열 중 어느 것의 변이체인 클러스터 폴리펩티드를 제공한다.
특히 관심의 대상이 되는 클러스터 폴리펩티드는 LanM, LanR, LanT 또는 LanO 폴리펩티드인, 1xx 및 2xx 폴리펩티드이다.
클러스터 폴리펩티드와 관련하여 "변이체"는 기준 폴리펩티드(이러한 경우, 임의의 야생형 클러스터 폴리펩티드), 또는 폴리펩티드의 단편의 아미노산 서열과 상이하지만, 상기 아미노산 서열과 유의적인 아미노산 서열 동일성을 나타내는 아미노산을 갖는 임의의 폴리펩티드를 의미한다.
구체적으로 언급하지 않는 한, 유의적인 아미노산 서열 동일성은 바람직하게 80% 이상, 더욱 바람직하게 85%, 90% 또는 95% 이상, 더욱 더 바람직하게 98% 또는 99% 이상이다. 변이체의 길이는 바람직하게 야생형 클러스터 폴리펩티드 길이와 동일하거나, 그의 70% 이상이고, 바람직하게, 80% 이상, 더욱 바람직하게, 90% 이상, 및 가장 바람직하게는 95% 이상이다.
"아미노산 서열 동일성 퍼센트(%)"란 서열을 정렬시키고, 필요한 경우, 서열 동일성 퍼센트의 최대치를 얻기 위해 갭을 도입한 후 보존적 치환을 서열 동일의 일부로서 간주하지 않은 상태에서, 비교시 서열의 아미노산 잔기와 동일한, 후보 서열의 아미노산 잔기의 비율로서 정의된다. 본원에서 사용된 동일성(%) 값은 문헌 [Altschul et al. (1996)]; hppt://balst.wust/edu/blast/README.html의 WU-BLAST-2에 의해 얻었다. WU-BLAST-2는 여러 파라미터를 사용하는데, 이들 중 대부분은 디폴트 값으로 정해져 있다. 조정가능한 파라미터는 하기와 같다: 오버랩 스팬 = 1. 오버랩 분율 = 0.125, 단어 역치수(T) = 11. HSPS 및 HSP S2 파라미터는 역동적인 값으로서 검색되는 서열에 대한 특정 데이타 베이스의 서열 및 조성의 조합에 달려있다. 그러나, 이 값들은 민감도가 증가되도록 조정될 수 있다. 아미노산 서열 동일성 퍼세튼는 일치하는 잔기 수를 정렬된 영역에서 "보다 긴" 서열의 전체 잔기 수로 나눔으로써 결정된다. "보다 긴" 서열은 정렬된 영역(정렬을 최대화하기 위하여 WU-BLAST-2에 의해 도입된 갭은 무시됨)에서 대부분의 실제 잔기를 갖는 것을 말한다.
바람직하게, 변이체는 기준 폴리펩티드의 생물학적 기능을 보유할 것이다. 본 발명에서, 변이체가 그의 클러스터의 다른 구성원들과 함께 숙주 세포내 존재할 때, 변이체가 란티바이오틱을 생산할 수 있는 생물학적 기능은 유지된다. 이는 예를 들면, 1xx 클러스터 폴리펩티드 변이체인 경우에는 서열 번호 100, 및 2xx 클러스터 폴리펩티드 변이체인 경우에는 서열 번호 200을 함유하는 숙주 세포를 제공하는데, 여기서, 숙주 세포는 각각 액타가르딘 또는 액타가르딘 B를 생산하는 것이며, 서열을 변형시켜 변이체를 코딩하도록 하고, 란티바이오틱 폴리펩티드가 여전히 생산되는지 여부를 측정함으로써 측정될 수 있다.
전구체 폴리펩티드
또다른 측면에서, 본 발명은 폴리펩티드를, 바람직하게는, 단리된 형태의 폴리펩티드를 제공하는데, 이는 본 발명의 화합물 또는 액타가르딘의 전구체이다. 전구체 폴리펩티드는 서열 번호 1-4, 서열 번호 11-14, 서열 번호 212, 22, 23 및 119 중 어느 하나의 폴리펩티드 뿐만 아니라, 란티바이오틱 폴리펩티드로 전환될 수 있는 그의 변이체 또는 유도체를 포함한다.
서열 번호 1-4 중 어느 하나의 전구체 폴리펩티드의 변이체는 하나 이상, 예를 들면, 1 내지 5개, 예로서, 1, 2, 3 또는 4개의 아미노산이 또다른 아미노산으로 치환된 폴리펩티드이다. 바람직하게, 아미노산은 서열 번호 1-4 중 어느 하나의 2, 3, 4, 5, 8, 10, 11, 13 또는 18번 위치로부터 선택되는 위치에 존재한다.
서열 번호 11-14 중 어느 하나의 전구체 폴리펩티드의 변이체는 하나 이상, 예를 들면, 1 내지 5개, 예로서, 1, 2, 3 또는 4개의 아미노산이 또다른 아미노산으로 치환된 폴리펩티드이다. 바람직하게, 아미노산은 서열 번호 11-14 중 어느 하나의 3, 4, 5, 6, 9, 11, 12, 14 또는 19번 위치로부터 선택되는 위치에 존재한다.
서열 번호 212, 22, 23 및 119 중 어느 하나의 전구체 폴리펩티드의 변이체는, 각각 서열 번호 1-4에 상응하는 C-말단부(잔기 46-64)의 1 내지 5개, 예로서, 1, 2, 3 또는 4개의 아미노산이 또다른 아미노산으로 치환된 폴리펩티드이다. 바람직하게, 아미노산은 서열 번호 1-4 중 어느 하나의 2, 3, 4, 5, 8, 10, 11, 13 또는 18번 위치에 상응하는 위치로부터 선택된 위치에 존재한다. 그러한 변이체는 추가로 N-말단부(잔기 1-45)의 70% 이상, 예를 들면, 80% 이상, 바람직하게, 90% 이상, 예를 들면, 95% 이상을 보유하는 N-말단부에 변화를 포함한다. 예를 들면, 서열 번호 212 또는 서열 번호 119의 N-말단부의 변이체는, 본 발명의 데이타에서 서열 번호 212와 119 사이에 차이가 존재한다고 나타난, 4, 5, 6, 8, 9, 12, 13, 17, 18, 19, 21 및 32번 위치에 하나 이상의 치환, 예컨대, 1 내지 12개, 예로서, 1 내지 5개, 예컨대, 1, 2 또는 3개의 치환을 포함한다.
치환은 하나의 아미노산이 천연적으로 발생된 또다른 아미노산에 의해 이루어지는 것일 수 있고, 이는 보존적 또는 비-보존적 치환일 수 있다. 보존적 치환은 하기 표에 제시된 것을 포함하는데, 여기서, 두번째 칸의 같은 블록내 있는 아미노산, 바람직하게는, 세번째 칸의 같은 줄에 있는 아미노산은 서로서로 치환될 수 있다:
지방족 |
비극성 |
G A |
I L V | ||
극성 - 전하를 띠지 않음 |
C S T M | |
N Q | ||
극성 - 전하를 띰 |
D E | |
K R | ||
방향족 | H F W Y |
서열 번호 212의 경우, 치환은 서열 번호 119의 상응하는 위치에 위치하는 아미노산 잔기와 상이한 아미노산의 것일 수 있거나, 또는 그 반대일 수 있다. 어느 경우든, 치환은 서열 번호 119 아미노산을 서열 번호 212로, 또는 그 반대로 도입하고자 하는 것일 수 있다(예컨대, 서열 번호 212의 4번 위치의 Ile가 Leu로 치환될 수 있는 것 등).
전구체 폴리펩티드는 란티바이오틱을 생산하지 못하는 비생산자인 세포에서 폴리펩티드를 코딩하는 핵산을 발현시킴으로써 수득할 수 있다.
화합물
하나의 측면에서, 본 발명은 하기 화학식(I)의 화합물, 또는 이의 약제학적으로 허용 가능한 염을 제공한다:
상기 식에서,
-X1-X2-는 -Leu-Val-; -Val-Val- 또는 -Leu-Ile-을 나타내고;
Y는 -S- 또는 -S(O)-이고;
Z는 H2N- 또는 Ala-이다. 추가의 측면에서, 본 발명은 이들 화합물의 변이체 및 생물학적으로 활성인 유도체를 제공한다.
-X1-X2-가 -Leu-Val-을 나타내고, Y는 -S(O)-이고, Z는 NH2인, 본 발명의 화합물은 또한 액타가르딘 B로 지칭된다.
-X1-X2-가 -Leu-Val-을 나타내고, Y는 -S(O)-이고, Z는 Ala-인, 본 발명의 화합물은 또한 ala-액타가르딘 B로 지칭된다.
-X1-X2-가 -Leu-Val-을 나타내고, Y는 -S-이고, Z는 NH2인, 본 발명의 화합물은 또한 데옥시-액타가르딘 B로 지칭된다.
-X1-X2-가 -Leu-Val-을 나타내고, Y는 -S-이고, Z는 Ala-인, 본 발명의 화합물은 또한 ala-데옥시-액타가르딘 B로 지칭된다.
Z가 NH2인 것과 관련하여 이 부위는 상기 화합물의 1번 위치의 알라닌 잔기의 N-말단을 나타낸다는 것을 이해할 것이다. Z가 Ala-인 것과 관련하여 이 부위는 당업계에서 통상 Ala(0)으로 지칭되는 것으로서, 아미드 결합을 통해 1번 위치의 알라닌에 연결된 알라닌을 나타낸다는 것을 이해할 것이다.
변이체
화학식(I)의 화합물의 변이체는 여러 개의, 예를 들면, 1 내지 5개, 예로서, 1, 2, 3, 또는 4개의 아미노산중 하나가 또다른 아미노산에 의해 치환된 화합물이다. 바람직하게, 아미노산은 화학식(I)의 화합물의 2, 3, 4, 5, 8, 10, 11, 13 또는 18번 위치로부터 선택되는 위치에 존재한다.
변이체는 또한 15번 또는 16번 위치에 치환을 포함할 수 있는데, 단, 15번 및 16번 위치, 둘 모두가 치환되고, 그 외의 다른 어떤 위치에서는 변화가 없을 때, 15 및 16은 각각 Val 및 Ile이 아니다.
Z가 Ala-일 경우, 본 발명의 화합물의 변이체는 Ala-가 또다른 아미노산 (특히, 유전자 코드에 의해 코딩된 천연적으로 발생된 아미노산 또는 그의 D-이소폼), 더욱 특히, Ile-, Lys-, Phe-, Val-, Glu-, Asp-, His-, Leu, Arg-, Ser- 및 Trp-기로부터 선택되는 아미노산에 의해 대체된 것을 포함한다. 하나의 측면에서, 아미노산는 Ile-, Lys-, Phe-, Val-, Glu-, Asp-, His-, Leu-, Arg- 및 Ser-기로부터 선택될 수 있다. 그러한 변이체는 US 6,022,851에 기재되어 있는 바와 같이, Z = H2N인 화합물에 잔기를 화학적으로 가함으로써 생산될 수 있다. 아미노산을 화학적으로 가함으로써 아미노산이 L 또는 D 배열(configuration)로 존재하게 된다는 것을 이해할 것이다. 이는 예로서, 상기 언급한 것과 같은 D 형태의 기타 아미노산 이외에도 D-Ala를 포함한다.
유도체
본 발명의 화합물의 유도체(변이체 포함)는 본 발명의 화합물의 하나 이상의 아미노산 측쇄가 예를 들면, 에스테르화, 아미드화 또는 산화에 의해 변형된 것이 다.
본 발명의 화합물의 유도체는 액타가르딘의 카복시 작용기들 중 하나, 특히 C-말단에서의 모노아미드 유도체일 수 있다. 더욱 특히, 유도체는, 본 발명의 화합물의 C-말단이 식 -COR이고, 여기서, R은 -NR1R2 기를 나타내며, 여기서, R1 및 R2는 독립적으로
(i) 수소;
(ii) 식 -(CH2)n-NR3R4(여기서, n은 정수 2 내지 8을 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타내거나, R3 및 R4는 함께 -(CH2)3-, -(CH2)4-, (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- 또는 -(CH2)5- 기를 나타낸다)의 기를 나타내거나;
R1 및 R2는 인접한 질소 원자와 함께,
(a) (C1-C4)알킬;
(b) (C5-C7)-사이클로알킬;
(c) 피리딜;
(d) -(CH2)p-NR5R6(여기서, p는 정수 1 내지 8을 나타내고, R5 및 R6은 독립적으로 수소 또는 (C1-C4)알킬을 나타낸다);
(e) 피페리디닐;
(f) 치환된 피페리디닐(여기서, 치환된 피페리디닐은, (C1-4)알킬인 N-치환기를 보유한다);
(g) 벤질; 및
(h) 치환된 벤질(여기서, 페닐 부분은 클로로, 브로모, 니트로, (C1-C4)알킬 및 (C1-C4)알콕시로부터 선택되는 1개 또는 2개의 치환기를 보유한다)로부터 선택되는 치환기로 4번 위치에서 치환될 수 있는 피페라진 부분을 나타내는 화합물일 수 있다.
하나의 실시태양에서, 식 -COR에서의 R은 -NR1R2 기를 나타내고, 여기서, R1 및 R2는 독립적으로 수소, 식 -(CH2)n-NR3R4(여기서, n은 정수 2 내지 8을 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타내거나, R3 및 R4는 함께 -(CH2)3-, -(CH2)4-, (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- 또는 -(CH2)5- 기를 나타낸다)의 기를 나타내거나, R1 및 R2는 인접한 질소 원자와 함께, (C1-C4)알킬, (C5-C7)-사이클로알킬, 피리딜, 벤질, 및 치환된 벤질(여기서, 페닐 부분은 클로로, 브로모, 니트로, (C1-C4)알킬 및 (C1-C4)알콕시로부터 선택되는 1개 또는 2개의 치환기를 보유한다)로부터 선택되는 치환기로 4번 위치에서 치환될 수 있는 피페라진 부분을 나타낸다.
추가로, 유도체는 내부 잔기 측쇄의 카복시 작용기, 예컨대, 잔기 Glu11의 것이 -COOH로부터 -COOR5(여기서, R5는 수소, (C1-C4)알킬 또는 (C1-C4)알콕시 (C2-C4)알킬을 나타낸다)의 기로 변형된 화합물을 포함할 수 있다.
본 발명의 화합물의 N-말단 유도체는 N-말단 아미노 기 -NH2가 대신 -NHR6(여기서, R6은 C1-C4알킬을 나타낸다)의 기인 것일 수 있다.
용어 "(C1-C4)알킬"은 1 내지 4개 탄소 원자의 직쇄형 또는 분지쇄형의 알킬 쇄, 예로서, 메틸, 에틸, 프로필, 1-메틸에틸, 부틸, 1-메틸프로필 또는 1,1-디메틸에틸을 나타내는 반면, 용어 "(C2-C4)알킬"은 2 내지 4개 탄소 원자의 직쇄형 또는 분지쇄형의 알킬 쇄, 예로서, 에틸, 프로필, 1-메틸에틸, 부틸, 1-메틸프로필 또는 1,1-디메틸에틸을 나타낸다. 용어 "(C5-C7)사이클로알킬"은 사이클로펜틸, 사이클로헥실 및 사이클로헵틸로부터 선택되는 사이클로알킬 기를 나타낸다.
용어 "(C1-C4)알콕시"는 1 내지 4개 탄소 원자의 직쇄형 또는 분지쇄형의 알콕시 쇄, 예로서, 메톡시, 에톡시, 프로폭시, 1-메틸에톡시, 부톡시, 1-메틸프로폭시 및 1,1-디메틸에톡시를 나타낸다.
본 발명에 따른 유도체는 EP-0195359(그의 개시 내용이 본원에서 참고로 인 용된다)에서 액타가르딘의 유도체 제조를 위해 기재된 방법에 따라 제조될 수 있다.
추가의 실시태양
유도체가, C-말단이 식 -COR이고, 여기서, R은 -NR1R2 기를 나타내는 화합물일 경우, 몇몇 실시태양에서, R1은 수소이고, R2는 식 -(CH2)n-NR3R4(여기서, n은 정수 2 내지 8을 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타내거나, R3 및 R4는 함께 -(CH2)3-, -(CH2)4-, (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- 또는 -(CH2)5- 기를 나타낸다)의 기를 나타낸다. 이들 실시태양에서, R3 및 R4는 바람직하게 수소 또는 (C1-C4)알킬을 나타낸다. 더욱 바람직하게, R3 및 R4는 (C1-C2)알킬, 예컨대, 메틸을 나타낸다. 정수 n은 바람직하게 2 내지 5일 수 있고, 더욱 바람직하게 2 내지 4, 예컨대, 3일 수 있다.
다른 실시태양에서, R1 및 R2는 인접한 질소 원자와 함께 피페라진 부분을 나타낸다. 4번 위치의 N-치환기는 바람직하게
(a) (C1-C4)알킬;
(b) (C5-C7)-사이클로알킬,
(d) -(CH2)p-NR5R6(여기서, p는 정수 1 내지 8을 나타내고, R5 및 R6은 독립적으로 수소 또는 (C1-C4)알킬을 나타낸다);
(e) 피페리디닐; 및
(f) 치환된 피페리디닐(여기서, 치환된 피페리디닐은, (C1-4)알킬인 N-치환기를 보유한다)로부터 선택될 수 있다.
피페리디닐 및 치환된 피페리디닐 기는 바람직하게 4번 위치에 그의 질소 원자를 갖는다.
N-치환기는 더욱 바람직하게,
(d) -(CH2)p-NR5R6(여기서, p는 정수 1 내지 8을 나타내고, R5 및 R6은 독립적으로 수소 또는 (C1-C4)알킬을 나타낸다); 및
(f) 치환된 피페리디닐(여기서, 치환된 피페리디닐은, (C1-4)알킬인 N-치환기를 보유한다)로부터 선택될 수 있다.
N-치환기가 -(CH2)p-NR5R6일 경우, 이때 R5 및 R6은 바람직하게 (C1-C4)알킬일 수 있고, 더욱 바람직하게는 (C1-C2)알킬, 예컨대, 메틸일 수 있다. 정수 p는 바람직하게 1 내지 4, 예컨대, 3이다.
N-치환기가 치환된 피페리디닐일 경우, 이때, N-치환기는 바람직하게 (C1- C2)알킬, 예컨대, 메틸이다. 상기 언급한 바와 같이, N은 바람직하게 4번 위치에 존재한다.
핵산
본 발명의 핵산은 DNA인 것이 바람직할 수 있지만, DNA 또는 RNA일 수 있다. 본 발명의 핵산은 단일 또는 이중 가닥일 수 있다. 하나의 측면에서, 본 발명은 클러스터 폴리펩티드를 코딩하는 단리된 핵산을 제공한다. 또다른 측면에서, 본 발명은 전구체 폴리펩티드, 또는 그의 변이체 또는 단편을 코딩하는 단리된 핵산을 제공한다.
추가의 측면에서, 본 발명은, 본원에 개시된 유전자간 영역을 포함하는 단편을 비롯한, 서열 번호 100 또는 서열 번호 200 모두 또는 그의 단편을 포함할 수 있는 단리된 핵산을 제공한다. 그러한 영역은 본 발명의 클러스터 폴리펩티드 또는 전구체 폴리펩티드의 발현을 위한 프로모터 또는 기타 조절 요소를 포함할 수 있다.
당업자에 의해 25개의 뉴클레오티드가 본원에 개시된 바와 같이 특정 유전자 또는 유전자 클러스터, 또는 그의 부분 서열에 특이적인 충분한 갯수의 뉴클레오티드로서 인지된다. 따라서, 단편은 서열 번호 100 또는 서열 번호 200의 단편, 또는 유의적인 서열 동일성을 갖는 그의 변이체로서, 뉴클레오티드 길이가 25개 이상, 예컨대, 30개 이상, 예컨대, 50개 이상, 예컨대, 100개 이상, 예컨대, 250개 이상인 것을 포함한다.
상기 유전자간 서열의 변이체인 프로모터 또한 포함되며, 특이적인 유전자간 서열(또는 그의 일부분)은 바람직한 실시태양이다. orf, 유전자, 핵산, 폴리펩티드 또는 프로모터의 바람직한 실시태양이 특정 서열과 관련하여 정의되는 모든 경우에 있어서, 보다 넓은 의미로 본 발명은 상기 특정 서열의 변이체를 갖는 실시태양도 포함하도록 하고자 한다.
특정 핵산(기준 핵산)과 관련하여 본원에서 사용되는 용어 "변이체"는 기준 핵산의 서열과 상이한 서열을 갖지만, 그의 보체이거나, 기준 핵산 또는 그의 보체, 또는 기준 핵산 또는 그의 보체의 단편과 유의적인 핵산 서열 동일성을 나타내거나, 엄격한 조건하에 그와 혼성화를 나타내는 임의 핵산; 또는 기준 핵산, 또는 상기 핵산의 단편에 의해 코딩된 아미노산 서열과 유의적인 아미노산 서열 동일성을 갖는 아미노산 서열을 코딩하는 임의 핵산을 의미한다. 용어 "변이체"는 또한 오직 유전자 코드의 축퇴성에만 기인하여 서로 상이하고, 그러므로, 유추되는 아미노산 서열이 동일한 것인, 아미노산 서열을 코딩하는 핵산도 지칭한다. 본 발명의 변이체 핵산은 추가로 하기와 같이 정의된다. 본 발명의 변이체 핵산이 변이체인 그의 서열을 대신하여 본원에서 동정된 유전자 클러스터 내로 도입되고, 재조합 단편이 란티바이오틱 생산에 적합한 조건(예컨대, 실시예에 제시되는 것과 같은 조건)하에 적합한 숙주 세포 내로 도입될 경우, 이때, 하나 이상의 란티바이오틱 활성(특히, 항생제 활성)을 갖는 분자가 생산될 것이다. 바람직하게, 생산은 고도한세포 밀도로 존재하도록 조절될 것이다.
유의적인 핵산 서열 동일성은 바람직하게 50% 이상, 더욱 바람직하게 60% 이 상, 70% 이상, 80% 이상 또는 90% 이상이고, 더욱 더 바람직하게는 95% 이상, 98% 이상 또는 99% 이상이다. 유의적인 핵산 서열 동일성은 바람직하게 변이체 핵산(또는 그의 일부분)과, 기준 핵산의 30개 이상의 잔기인 단편, 더욱 바람직하게, 60개 이상, 90개 이상 또는 120개 이상의 잔기인 단편, 더욱 더 바람직하게는, 180개 이상, 240개 이상 또는 300개 이상의 잔기인 단편, 더욱 바람직하게, 전체 기준 핵산 사이에서 제시된다.
"핵산 서열 동일성 퍼센트(%)"는 비교시 서열의 뉴클레오티드 잔기와 동일한, 후보 서열의 뉴클레오티드 잔기의 비율로서 정의된다. 본원에서 사용되는 동일성 값은 오버랩 스팬 및 오버랩 분획이 각각 1 및 0.125로 설정되고, 디폴트 파라미터로 설정된 WU BLAST-2의 BLASTN 모듈에 의해 얻을 수 있다.
본 발명에서 사용되는 프로모터의 변이체와 관련하여, 핵산 서열 동일성은 바람직하게, 30개 이상의 잔기, 더욱 바람직하게, 40개 또는 50개 이상의 잔기, 더욱 더 바람직하게, 60개 이상의 잔기의 서열에 걸쳐 평가된다.
본원에서 정의되는 "엄격한 조건" 또는 "고도로 엄격한 조건"은 (1) 세척을 위해 낮은 이온 강도와 고온을 이용하는 것, 예를 들면, 50℃에서 0.015 M 염화나트륨/0.0015 M 시트르산나트륨/0.1% 황산도데실나트륨을 이용하는 조건; (2) 혼성화시 변성화제, 예로서, 포름아미드, 예를 들면, 42℃에서 750mM 염화나트륨, 75mM 시트르산나트륨이 포함된, 0.1% 우혈청 알부민/0.1% 피콜(Ficoll)/0.1% 폴리비닐피롤리돈/50mM 인산나트륨 완충액(pH 6.5)과 함께 50% (v/v) 포름아미드를 사용하는 조건; 또는 (3) 42℃에서 50% 포름아미드, 5 x SSC(0.75 M NaCl, 0.075 M 시트르산 나트륨), 50mM 인산나트륨(pH 6.8), 0.1% 피로인산나트륨, 덴하트(Denhardt's) 용액, 초음파처리된 연어 정자 DNA (50g/ml), 0.1% SDS, 및 10% 덱스트란 설페이트를 사용하고, 42℃에서 0.2 x SSC(염화나트륨/시트르산나트륨)에서, 그리고 55℃에서 50% 포름아미드로 세척한 후, 55℃에서 EDTA가 포함된 0.1 x SSC를 이용한 고엄격 세척을 수행하는 조건으로 간주될 수 있다.
관심의 대상이 되는 핵산이 프로모터 또는 조절 서열과 "작동 결합" 상태로 있다고 언급되는 경우, 이는 프로모터/조절 서열이 적절한 발현 시스템에서 관심의 대상이 되는 핵산의 전사를 지시할 수 있고, 관심의 대상이 되는 핵산은 번역을 위해 정확한 리딩 프레임에 존재한다는 것을 의미한다. 바람직하게, 관심의 대상이 되는 핵산이 프로모터/조절 서열과 작동 결합 상태로 있는 경우, 관심의 대상이 되는 핵산의 전사체는 적절한 발현 시스템에서 관심의 대상이 되는 핵산에 의해 코딩되는 폴리펩티드를 발현시키기 위한 것으로서, 적절하게 위치하는 리보좀 결합 부위를 포함한다. 예를 들면, 문헌 ([Sambrook et al. (1989)] 및 [Ausubel et al. 25 (1995)]를 참조할 수 있다.
핵산이 "단리된" 것으로 지칭되는 경우, 이는 보통 악티노플레인스 가르바디넨시스 및/또는 악티노플레인스 리구리애에 존재하는 다른 핵산 중 일부 또는 그 모두, 특히, 본원에서 동정된 유전자 클러스터 세그먼트 외의 핵산 중 일부 또는 그 모두로부터 실질적으로 또는 완전하게 단리된 것을 의미할 수 있다.
상기 개시 내용에 비추어 볼 때, 본 발명이 액타가르딘 또는 액타가르딘 B 생합성 유전자 클러스터를 코딩하는 뉴클레오티드 서열 또는 뉴클레오티드 서열을 제공한다는 것을 이해할 것이다. 따라서, 전체 유전자 클러스터 또는 25개 이상의인접 뉴클레오티드인 그의 일부분이 매우 다양한 용도로 사용될 수 있고, 상기 용도로는 액타가르딘 또는 액타가르딘 B의 발현; 관련 분자 등에 대하여 다른 유기체를 스크리닝하는 프로브로서의 용도; 유전자 침묵화를 유도하는 용도 등을 포함하나, 이에 한정되는 것은 아니다.
발현 작제물
본 발명의 추가의 측면에서, 프로모터에 작동 가능하게 연결된, 본 발명의 클러스터 폴리펩티드 또는 란티바이오틱 폴리펩티드를 코딩하는 핵산을 포함하는 발현 작제물을 제공한다.
추가의 측면에서, 발현 작제물 세트를 제공한다. 발현 작제물 세트는 본 발명의 2개 이상의 폴리펩티드 코딩 서열, 및 상기 서열의 발현에 적합한 1 이상의 프로모터를 포함한다. 프로모터(들)는, 폴리펩티드 유전자가 천연적으로 그와 함께 결합되어 있는 프로모터일 수 있거나(또는 변이체일 경우, 변이체가 유도되는 유전자의 프로모터), 숙주 세포에서 기능성인, 구성적 또는 유도성 프로모터일 수 있다. 따라서, 프로모터는 표 1 및 2에 열거된 오픈 리딩 프레임들 중 어느 것의 상류에 있는 서열 번호 100 또는 서열 번호 200의 유전자간 영역을 포함한다.
프로모터(들)는 발현 작제물 세트의 핵산에 작동 가능하게 연결될 것이다. "작동 가능하게 연결된다"라는 것은 프로모터가 적절한 발현 시스템에서 관심의 대상이 되는 핵산의 전사를 지시할 수 있고, 관심의 대상이 되는 핵산은 번역을 위해 정확한 리딩 프레임에 존재한다는 것으로 이해될 것이다. 바람직하게, 관심의 대상 이 되는 핵산이 프로모터/조절 서열과 작동 결합 상태로 있는 경우, 관심의 대상이 되는 핵산의 전사체는 적절한 발현 시스템에서 관심의 대상이 되는 핵산에 의해 코딩되는 폴리펩티드를 발현시키기 위한 것으로서, 적절하게 위치하는 리보좀 결합 부위를 포함한다. 예를 들면, 문헌 ([Sambrook et al. (1989)] 및 [Ausubel et al. 25 (1995)]를 참조할 수 있다.
본 발명에 따른 발현 작제물 세트는 상기 정의된 바와 같은 본 발명의 전구체 및 클러스터 폴리펩티드를 코딩하는 유전자의 다수의 치환을 포함한다. 본 발명의 다양한 측면에서, 세트는 적어도 LanA 유전자를 포함할 것이다. 그러한 세트의 일례로는 하기의 "세트 1" 내지 "세트 7"로서 기재되며, 단, 이들 세트는 단순히 예시적인 것이며, 제한적인 것으로 이해되어서는 안된다.
세트 1: 전구체 폴리펩티드, 바람직하게는, 본 발명의 화합물로 전환될 수 있는 전구체 폴리펩티드를 코딩하는 LanA 유전자와, LanM 폴리펩티드를 코딩하는 LanM 유전자. LanM 폴리펩티드는 바람직하게 서열 번호 120의 LanM, 또는 그의 변이체, 또는 서열 번호 213의 LanM, 또는 그의 변이체이다.
세트 2: 전구체 폴리펩티드, 바람직하게는, 본 발명의 화합물로 전환될 수 있는 전구체 폴리펩티드를 코딩하는 LanA 유전자와, LanR 폴리펩티드를 코딩하는 LanR 유전자. LanR 폴리펩티드는 바람직하게 서열 번호 122의 LanR, 또는 그의 변이체, 또는 서열 번호 216의 LanR, 또는 그의 변이체이다.
세트 3: 전구체 폴리펩티드, 바람직하게는, 본 발명의 화합물로 전환될 수 있는 전구체 폴리펩티드를 코딩하는 LanA 유전자와, LanM 폴리펩티드를 코딩하는 LanM 유전자와, LanR 폴리펩티드를 코딩하는 LanR 유전자. LanM 폴리펩티드는 바람직하게 서열 번호 120의 LanM, 또는 그의 변이체, 또는 서열 번호 213의 LanM, 또는 그의 변이체이다. LanR 폴리펩티드는 바람직하게 서열 번호 122의 LanR, 또는 그의 변이체, 또는 서열 번호 216의 LanR, 또는 그의 변이체이다.
세트 4: LanO 폴리펩티드를 코딩하는 LanO 유전자와 함께, 세트 3의 유전자. LanO 폴리펩티드는 바람직하게 서열 번호 122의 LanO, 또는 그의 변이체, 또는 서열 번호 215의 LanR, 또는 그의 변이체이다.
세트 5: LanT 폴리펩티드를 코딩하는 LanT 유전자와 함께, 세트 3 또는 세트 4의 유전자. LanT 폴리펩티드는 바람직하게 서열 번호 123의 LanT, 또는 그의 변이체, 또는 서열 번호 214의 LanT, 또는 그의 변이체이다.
세트 6: 서열 번호 116 내지 127의 유전자 또는 그의 변이체.
세트 7: 서열 번호 206 내지 220의 유전자 또는 그의 변이체.
하나의 측면에서, 세트는, 모두가 1xx 폴리펩티드를 코딩하거나, 모두가 2xx 폴리펩티드를 코딩하는 서열을 포함할 것이다. 그러나, 1xx 및 2xx 폴리펩티드, 둘 모두로 구성된 세트가 본 발명으로부터 제외되는 것은 아니다.
재조합 발현 벡터
또다른 측면에서, 본 발명의 하나 이상 발현 작제물을 포함하는 재조합 벡터를 제공한다. 대체 측면에서, 본 발명의 발현 작제물 세트를 포함하는 재조합 벡터 세트를 제공한다. 박테리아 내로의 도입을 위한 핵산을 포함하는 적합한 벡터를 선택하거나 작제할 수 있으며, 이는 필요하다면, 추가의 프로모터, 종결 인자 단편, 인핸서 요소, 마커 유전자 및 적절한 기타 요소를 비롯한, 적절한 추가 조절 요소를 함유한다. 벡터는 적절하게 플라스미드, 바이러스성, 예컨대, 파지, 또는 파지미드일 수 있다. 추가의 상세한 설명을 위해 예를 들면, 문헌 [Sambrook et al (1989) Molecular Cloning, A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor]를 참조할 수 있다. 예를 들면, 핵산 작제물 제조, 돌연변이 유발, 서열 분석, 세포 내로 DNA 도입, 및 유전자 발현, 및 단백질 분석에서 핵산을 조작하는 공지된 다수의 기법 및 프로토콜은 문헌 [Ausubel et al. (1995) Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995)]에 상세히 기재되어 있다. 스트렙토마이세스 종과 관련된 이들 기법 사용에 관한 다수 측면들은 문헌 ([Hopwood et al (1985) Genetic manipulation of Streptomyces a laboratory manual (Norwich: John Innes Foundation)] 및 [Practical Streptomyces Genetics (2000) Kieser T. et al., The John Innes Foundation p.386])에 기재되어 있다. (Sambrook et al, Ausubel et al, Hopwood et al 및 Kieser et al.)의 개시 내용은 모두 이러한 목적 및 모든 다른 목적을 위해 참고로 인용된다.
발현 카세트
또다른 측면에서, 본 발명자들은 액타가르딘 B의 란티바이오틱 유도체를 생산하고 스크리닝하는데 유용한 벡터 시스템을 개발하게 되었다. 이는 발현 카세트 시스템을 생산하기 위해 이는 서열 번호 1, 11 또는 212를 코딩하는 LanA 유전자 내로 하나 이상의 제한 엔도뉴클라제를 도입함으로써 달성된다. 따라서, 또다른 측 면에서, 본 발명은 액타가르딘 B 전구체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 재조합 DNA 카세트를 제공하는데, 여기서, 상기 서열은
코딩 서열의 N-말단 코딩 영역에 있거나 그에 인접한 제1 제한 부위;
경우에 따라, 제1 제한 부위 하류 및 코딩 서열 내의 제2 제한 부위; 및
코딩 서열의 C-말단 코딩 영역에 있거나 그에 인접한 제3 제한 부위
(여기서, 상기 제한 부위들 중 적어도 하나는 서열 번호 200으로 제시된 LanA 코딩 서열내 존재하지 않는다)를 포함한다.
추가의 측면에서, 액타가르딘 전구체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 재조합 DNA 카세트를 제공하는데, 여기서, 상기 서열은
코딩 서열의 N-말단 코딩 영역에 있거나 그에 인접한 제1 제한 부위;
경우에 따라, 제1 제한 부위 하류 및 코딩 서열 내의 제2 제한 부위; 및
코딩 서열의 C-말단 코딩 영역에 있거나 그에 인접한 제3 제한 부위;
(여기서, 상기 제한 부위들 중 적어도 하나는 서열 번호 100으로 제시된 LanA 코딩 서열내 존재하지 않는다)을 포함한다.
일반적으로, 2개 또는 3개의 모든 부위는 서로서로 상이할 것이다. 또한, 카세트가 벡터에 의해 운반될 때, 상기 부위는 당해 벡터에 대하여 독특한 것이 바람직할 수 있다.
바람직한 측면에서, 비자연발생적으로 생성된 제한 효소 부위는 제2 제한 부위이고, 서열 번호 1 또는 서열 번호 4의 코딩 서열의 5번 내지 16번 코돈 사이, 예로서, 6번 내지 15번 코돈 사이에 위치한다.
카세트는 또한 바람직하게 LanA 리더 서열 및 LanA 프로모터를 포함할 것이고, 특히, 클러스터 유전자가 등가의 숙주 세포 유전자 손실을 보완하기 위하여 필요한 경우에는 하나 이상 클러스터 유전자도 추가로 포함할 수 있다.
상기 기술된 본 발명의 카세트는 다양한 방식으로 조작될 수 있다. 예를 들면, 제1 제한 부위와 제2 제한 부위 사이, 제1 제한 부위와 제3 제한 부위 사이, 또는 제2 제한 부위와 제3 제한 부위 사이의 카세트를 절단함으로써 얻은 단편을, 란티바이오틱 A 변이체를 코딩하는 변이체 코딩 서열로 대체할 수 있다. 따라서, 본 발명은 코딩 서열의 코딩 영역 내 1 내지 15개의 뉴클레오티드 치환을 갖는, 본 발명의 카세트의 변이체를 제공한다.
상기 변이체 생산의 중간체로서 제1 제한 부위와 제2 제한 부위 사이, 제1 제한 부위와 제3 제한 부위 사이, 또는 제2 제한 부위와 제3 제한 부위 사이의 서열은 보다 큰 스터퍼(stuffer) 단편에 의해 대체될 수 있다.
또다른 측면에서, 예를 들면, 숙주 세포의 항균 성질을 평가하기 위해 란티바이오틱 유도체를 코딩하는 카세트를 사용하여 유도체를 발현시키도록 숙주 세포를 형질전환시킬 수 있다.
하나의 측면에서, 다수의 발현 카세트를 제조하여 상이한 유도체의 라이브러리를 제공하고, 이어서, 활성에 대하여 스크리닝할 수 있다.
본 발명의 발현 카세트는 당업계에서 사용되는 것으로서, 숙주 세포에서 유전자를 발현시키기 위해 사용되는 임의의 클로닝과 발현 벡터에 기초할 수 있다. 그러한 벡터는 하나 이상의 복제 기점을 포함할 것이며, 이는 감온성일 수 있다. 벡터는 선별가능한 마커, 예로서, 클로람페니콜 아세틸 트랜스퍼라제 유전자, 에리트로마이신 내성 유전자, 아프라마이신 내성 유전자 또는 테트라사이클린 내성 유전자를 포함할 수 있다. 벡터는 또한 LanA 유전자 클러스터 밖의, 숙주 세포내 존재하는 게놈 서열에 상동성인 표적 부위를 포함할 수 있다. 그러한 벡터를 사용하여 카세트를, 표적 부위에 상동성인 게놈 서열 내로 통합시킬 수 있다.
발현 카세트는 또한 LanA 유전자 또는 그의 유도체 이외에, 하나 이상 클러스터 유전자를 포함할 수 있다. 숙주 세포는, 그중의 LanA 유전자가 상기 클러스터 유전자를 불활성화시키기도 하는 방식으로 불활성화된 ΔLanA 숙주 세포일 경우(예컨대, 문헌 [Altena et al, 2000]에 개시된 균주의 경우), 이러한 유전자 또는 등가의 유전자가 발현 카세트에 제공하는 것이 바람직할 수 있다.
본원에서 사용되는 바, "N-말단 코딩 영역에 있거나 그에 인접한다"라는 것은 제한 부위의 제1 염기가 LanA 리더 서열의 ATG 코돈으로부터 잔기 6개 만큼의 상류로부터 프로펩티드의 제1 코돈으로부터 코돈 6개 이하 만큼의 하류까지의 위치에 위치한다는 것을 의미한다. 바람직하게, 제한 부위의 제1 염기는 잔기 12개, 바람직하게는, 6개 만큼의 상류로부터 프로펩티드를 코딩하는 서열의 제1 코돈으로부터 잔기 6개 만큼의 하류까지의 위치에 위치한다.
하나의 측면에서, 제1 제한 부위는 BglII 부위이다.
유사하게, "C-말단 코딩 영역에 있거나 그에 인접한다"라는 것은 제한 부위의 제1 염기가 프로펩티드의 종결 코돈의 뉴클레오티드를 1개 이상을 포함하거나, 제한 부위의 5' 또는 3' 뉴클레오티드가 각각 종결 코돈으로부터 잔기 12개, 바람 직하게는, 6개 만큼의 하류 또는 상류에 존재한다는 것을 의미한다.
하나의 측면에서, 제3 제한 부위는 AvrII 부위이다.
존재한다면 제2 제한 부위는 제1과 제3 제한 부위 사이에 존재하게 될 것이다. 바람직하게, 상기 제한 부위는 프로펩티드 코딩 서열의 5번 내지 16번 코돈, 바람직하게, 8번 내지 16번 코돈 사이에 존재하는 뉴클레오티드를 1개 이상 포함한다. 첨부된 실시예에서, BsrG1 부위는 ActA-코딩 서열의 6번 내지 7번 코돈을 변경시킴으로써 도입되었다. 그러나, 다른 변화 또한 본 발명에 의해 고려된다.
또한 1 초과의 변화도 도입함으로써 발현 카세트가 제1와 제3 제한 부위 사이에 2개 이상의 부위를 포함하도록 할 수 있다.
카세트는 2개 또는 3개의 비자연발생적으로 생성된 제한 부위를 포함할 수 있다. 첨부된 실시예에서, 보통은 3개 부위 모두가 서열 번호 100에 의해 코딩되는 ActA 서열내 존재하지 않는다.
발현 카세트는 본원 하기에서 추가로 논의되는 바와 같이, 란티바이오틱 유도체의 신속한 생산을 간소화시킨다.
하나의 측면에서, 제1 부위와 제2 부위 사이, 제1 부위와 제3 부위 사이, 또는 제2 부위와 제3 부위 사이의 영역은 스터퍼 단편으로 대체될 수 있다. 제1 부위와 제3 부위 사이에 2개 이상의 부위가 존재할 경우, 그러한 부위의 임의 쌍 사이에 있는 영역 또한 스터퍼 단편으로 대체될 수 있다. 스터퍼 단편은 그가 대체하는서열보다 더 큰 DNA 조각이다. 스터퍼 단편 50 내지 5000개의 뉴클레오티드 크기, 예를 들면, 약 500 내지 2000개의 뉴클레오티드 크기일 수 있다. 이들 스터퍼 DNA 단편을 도입하는 것이 갖는 가치는, 상기 영역을 란티바이오틱 코딩 올리고뉴클레오티드로 대체할 때 플라스미드 크기가 유의적으로 감소한다는데 있다. 따라서, 생성된 플라스미드는 임의의 최소 군집의 비제한적 플라스미드로부터 용이하게 정제될 수 있고, 이로써, 임의의 배경도 제거할 수 있다.
본 발명의 카세트를 사용하여 벡터내 ActA 서열에 특이적인 변화를 도입할 수 있는데, 이는 이후 란티바이오틱 발현을 위해 숙주 세포 내로 도입될 수 있다. 이를 달성하기 위하여, 서열을 바람직하게는 LanA(예컨대, ActA 또는 LigA) 리더 서열에 작동 가능하게 연결시키고, 이를 다시 LanA 프로모터(예컨대, ActA 또는 LigA)에 작동 가능하게 연결시킨다. 추가로 또는 별법으로서, 카세트를 포함하는 벡터는 또한 LanR 유전자를 포함할 수 있다. LanR 유전자는 란티바이오틱 A 코딩 서열의 하류에 위치하고, 란티바이오틱 A 코딩 서열과 직렬로 위치할 것이다.
발현 라이브러리
본 발명의 발현 카세트를 사용하여 란티바이오틱 코딩 유전자 라이브러리를 제공할 수 있다. 그러한 라이브러리는, 카세트 내의, 제1 제한 부위와 제2 제한 부위 사이, 제1 제한 부위와 제3 제한 부위 사이, 또는 제2 제한 부위와 제3 제한 부위 사이로 복수의 서열을 도입함으로써 제조될 수 있는데, 상기 복수의 서열들 각각은 프로펩티드는 서열 번호 100 또는 200의 프로펩티드 일부와 비교하여 1 내지 15개, 예를 들면, 1 내지 10개, 바람직하게는, 1 내지 6개, 예를 들면, 1 내지 3개의 뉴클레오티드 변화를 갖는 것 이외에는, 상응하는 ActA 또는 LigA 서열과 일치한다. 바람직하게, 그러한 변화가 서열에 의해 코딩되는 단백질을 변화시킨다. 그 러나, 비-코딩 변화를 제외시키는 것은 아니다.
라이브러리는 본 발명의 추가의 측면을 형성한다. 그러한 라이브러리는 발현 카세트의 란티바이오틱 A 코딩 서열의 변이체인, 10 내지 100,000개, 예로서, 10 내지 10,000개, 예를 들면, 10 내지 1,000개의 상이한 코딩 서열을 포함할 수 있다.
란티바이오틱 유도체를 코딩하는 발현 카세트는 란티바이오틱 발현을 위해 숙주 세포 내로 도입될 수 있다.
하나의 실시태양에서, 라이브러리는 숙주 세포 내로 도입될 수 있고, 콜로니는 단리되고/거나 항균 활성에 대하여 스크리닝될 수 있다. 그러한 활성을 나타내는 개개의 콜로니에 의해 발현된 란티바이오틱 A의 서열을 측정할 수 있다. 란티바이오틱 A가 활성을 나타내는 경우, 본 발명은 추가로 본 발명의 방법에 의해 수득된 란티바이오틱을 제공한다.
숙주 세포
2가지 주요 유형의 숙주 세포가 본 발명에 포함된다. 첫번째 유형의 숙주 세포는 란티바이오틱 생산 숙주 세포이다. 별법으로, 숙주 세포는 비생산자 세포일 수 있고, 즉, LanA 폴리펩티드 생산에 필요한 LanA 유전자 또는 이와 관련된 클러스터 유전자를 함유하지 않는다.
하나의 실시태양에서, 본 발명은 본 발명의 발현 작제물 세트로 형질전환된 숙주 세포를 제공한다. 작제물 세트는 상기 정의된 세트 1 내지 7중 어느 하나일 수 있거나, 전구체 및 클러스터 폴리펩티드-코딩 핵산의 임의의 다른 조합에 기초 한 세트일 수 있다. 또다른 실시태양에서, 숙주 세포는 본 발명의 발현 카세트로 형질전환될 수 있다.
추가의 실시태양에서, 각각 본 발명의 상이한 발현 카세트를 포함하는, 숙주 세포 라이브러리를 제공한다.
란티바이오틱 생산 숙주 세포
하나의 실시태양에서, 숙주 세포는 란티바이오틱 생산 숙주 세포일 수 있다. 란티바이오틱 생산 숙주 세포는, LanA 유전자를 포함하는 발현 작제물이 임의의 클러스터 유전자의 부재하에 세포 내로 도입되었다면, 그가 발현되고 LanA 폴리펩티드가 생산되는 것이다. 그러한 세포로는 임의의 B형 란티바이오틱 생산 세포, 예로서, 란티바이오틱을 생산하는 바실러스(bacillus), 악티노마이세트(actinomycete) 또는 스트렙토마이세트(streptomycete)(예컨대, 스트렙토마이세스 리비단스(S. lividans) 또는 스트렙토마이세스 코엘리컬러(S. coelicolor))의 임의의 균주를 포함한다. 그러한 세포의 일례로는 신나마이신 생산 숙주 세포(스트렙토마이세스 신나모뉴스 신나모뉴스(Streptomyces cinnamoneus cinnamoneus) DSM 40005), 또는 액타가르딘 생산 악티노플레인스 가르바디넨시스 또는 악티노플레인스 리구리애 NCIMB 41362를 포함한다.
본 발명이, -X1-X2-가 -Leu-Val-인 화학식(I)의 화합물 생산에 관한 것인 경우, 숙주 세포는 임의의 추가 변형이 없는 악티노플레인스 리구리애 NCIMB 41362일 수 있다.
하나의 측면에서, 이러한 부류의 숙주 세포는 유전자가 발현되지 않거나 유 전자 산물이 불활성화되도록, 그의 내인성 란티바이오틱 A 유전자 내에 돌연변이를 포함할 수 있다. 그러한 숙주 세포는 숙주 세포의 LanA 유전자를 결실시키거나 돌연변이화시키는 표적화된 상동성 재조합에 의해 수득될 수 있다. 이를 달성하는 방법은 그 자체로서 당업계에 공지되어 있으며, 문헌 [Altena et al, (2000)] 및 WO2005/093069(상기의 개시 내용은 본원에서 참고로 인용된다)에 설명되어 있다. 생성된 숙주 세포를 ΔLanA 숙주 세포로 지칭한다. 하나의 특정 실시태양에서, 숙주 세포는, ligA 유전자가 예를 들면, 돌연변이화 또는 결실, 예컨대, 상동성 재조합에 의해 일어나는 결실에 의해 불활성화된 ΔLanA 악티노플레인스 리구리애 NCIMB 41362 숙주 세포이다. 또다른 실시태양에서, 숙주 세포는 ActA 유전자가 예를 들면, 돌연변이화 또는 결실, 예컨대, 상동성 재조합에 의해 일어나는 결실에 의해 불활성화된 ΔActA 악티노플레인스 가르바디넨시스 숙주 세포이다.
숙주 세포가 lanA 생산에 필요한 클러스터 유전자를 제공하는 경우, 그러한 클러스터 유전자를 제공하는 것이 임의적이기는 하지만, 이러한 유형의 숙주 세포를 다른 클러스터 유전자로 형질전환시키는 것 또한 본 발명에 의해 고려된다.
비생산자 세포
비생산자 세포는 액타가르딘 또는 그의 변이체로, 또는 본 발명의 화합물로 전환될 수 있는 전구체 폴리펩티드를 코딩하는 LanA 유전자의 발현을 통해 상기 산물을 생산할 수 있지만, 단, LanA 유전자가, 전구체 폴리펩티드를 액타가르딘 또는 그의 변이체로, 또는 본 발명의 화합물로 전환시킬 수 있는 발현 작제물 세트의 일부로서 세포 내로 도입된 것인 임의의 숙주 세포일 수 있다.
비생산자 숙주 세포는 박테리아 숙주 세포일 수 있다. 박테리아 숙주 세포로는 악티노마이세트, 또는 스트렙토마이세트, 예컨대, 스트렙토마이세스 리비단스, 스트렙토마이세스 코엘리컬러 또는 스트렙토마이세스 신나모뉴스를 포함한다.
숙주 세포는, 숙주 세포 그 내에서 lanO 유전자가 돌연변이화 또는 결실에 의해 불활성화되어 있는 것(또는 비생산자 세포의 경우에는 존재하지 않는 것), 또는 그 내에서 lanO 유전자의 발현이 예컨대, 2 이상의 유전자 카피 공급에 의해, 또는 숙주 세포에서 발현을 증진시키는 프로모터에 유전자를 연결시킴으로써 증가하는 것일 수 있다. 숙주 세포에서 생산되는 본 발명의 산화된 형태(Y = -S(O))의 화합물 및 환원된 형태(Y = -S-)의 화합물의 상대적인 수준을 변경시키기 위해서는 이러한 방식으로 lanO 유전자를 조절하는 것인 바람직할 수 있다.
본 발명 화합물의 생산
본 발명의 화합물은 예를 들면, LanA 유전자와, 필요하다면, 전구체 폴리펩티드를 산물로 전환시키는데 필요한 관련 클러스터 유전자를 함께 수반하는 숙주 세포에서 재조합 발현 벡터내 수반되는 전구체 폴리펩티드를 코딩하는 발현 작제물의 형태로 핵산의 발현에 의해 생산될 수 있다. 상기 언급한 바와 같이, 본 발명이, -X1-X2-가 -Leu-Val-인 화학식(I)의 화합물 생산에 관한 것인 경우, 숙주 세포는 임의의 추가 변형이 없는 악티노플레인스 리구리애 NCIMB 41362일 수 있다.
발현 카세트, 또는 벡터(들)를 숙주 세포 내로 도입하는 것(특히, 시험관내 도입의 경우)은 일반적으로 제한없이 "형질전환"으로서 지칭될 수 있다. 이는 임의의 이용가능한 기법을 사용할 수 있다. 박테리아 세포의 경우, 적합한 기법으로는 염화칼륨 형질전환, 폴리에틸렌글리콜 보조 형질전환, 전기천공, 접합 및 박테리오파지를 사용하는 형질감염 또는 형질도입을 포함할 수 있다.
하나의 측면에서, 본 발명은 관심의 대상이 되는 핵산을 발현시키기 위하여 숙주 세포(또는 다른 발현시스템)를 제공하고, 상기 숙주 세포를 배양하는 것을 포함하는, 본 발명의 핵산을 발현시키는 방법을 제공한다. 관심의 대상이 되는 핵산은 발현 카세트 내에 존재하는 바, 숙주 세포 배양으로 본 발명의 산물이 생산된다.
바람직하게, 관심의 대상이 되는 핵산은 숙주 세포 배양물이 높은 세포 밀도에 도달하였을 때에만, 더욱 바람직하게, 숙주 세포 배양물이 고정상에 도달하였을 때 또는 그에 근접하게 도달하였을 때에만 실질적으로 발현된다. 고정상에 도달하였거나, 그에 근접하게 도달한 세포 배양물은 1-20 범위의 OD650 값을 가질 수 있다. 세포를 배양하는 공지 방법은 당업계에 잘 알려져 있으며, 예를 들면, 문헌 [(Sambrook et al (1989)], [Ausubel et al (2002)], 및 (특히, 스트렙토마이세스종의 경우) [Kieser et al (2000)])와 같이 잘 알려져 있다. 발현 시스템의 발현 산물을 수집하고, 정제할 수 있다. 단리 방법은 용매 추출 기법, 흡착 수지, 예로서, 소수성 수지 또는 침전 방법, 예로서, 황산암모늄 침전을 사용하여 발효 배지로부터 포획할 수 있다. 정제 방법은 크로마토그래피 기법, 예로서, 이온 교환, 소수성 상호작용, 역상, 순상, 고체상 추출 및 HPLC, 예컨대, 머사시딘 단리에 대하여 US 5,112,806에 기재되어 있는 것을 포함할 수 있다.
세포 배양 이후, 본 발명의 화합물은 숙주 세포 배양물로부터 회수될 수 있 다. 회수된 화합물은 약제학적 조성물 형태로, 임의로는 약제학적으로 허용 가능한 염 형태로 제제화될 수 있다.
숙주 세포가 본 발명의 화합물의 혼합물, 예컨대, Y가 -S- 또는 -S(O)-인 것, 또는 Z가 NH2 또는 Ala-인 것, 또는 4가지 유형 모두의 혼합물을 생산하는 경우, 산물은 예컨대, 액타가르딘 및 Ala-액타가르딘 생산에 대하여 US 6,022,851에 기재되어 있는 바와 같이, 예로서, hplc와 같은 표준 분리 기법을 사용하여 단리될 수 있다.
회수된 화합물은 약제학적 조성물 형태로, 임의로는 약제학적으로 허용 가능한 염 형태로 제제화될 수 있다.
약제학적으로 허용 가능한 염
"약제학적으로 허용 가능한 염"은 염기가 본 화합물의 생물학적 효능과 성질을 보유하고는 생리학적으로 허용 가능한 산 부가염일 수 있다. 그러한 염은 무기산, 예로서, 염산, 브롬화수소산, 황산, 질산, 인산 등으로 형성된 것, 및 유기산, 예로서, 아세트산, 프로피온산, 글리콜산, 피루브산, 옥살산, 말산, 말론산, 숙신산, 말레산, 푸마르산, 타르타르산, 시트르산, 벤조산, 신남산, 만델산, 메탈설폰산, 에탄설폰산, p-톨루엔설폰산, 살리실산 등과 함께 형성된 것을 포함한다.
염은 또한 염기성 염, 예로서, 알칼리 또는 알칼리토 금속 염, 예컨대, 나트륨, 칼륨, 칼슘, 또는 마그네슘 염을 포함한다.
약제학적 조성물
본 발명의 란티바이오틱은 약제학적으로 허용 가능한 담체, 애주번트, 부형제, 희석제, 충전제, 완충제, 방부제, 항산화제, 활택제, 안정화제, 가용화제, 계면활성제(예컨대, 습윤제), 차폐제, 착색제, 향미제, 및 감미제를 포함하나, 이에 한정되지 않는, 당업자에게 잘 알려져 있는, 하나 이상의 다른 약제학적으로 허용 가능한 성분과 함께 제제화될 수 있다. 제제는 추가로 다른 활성제, 예를 들면, 기타 치료제 또는 예방제를 포함할 수 있다. 따라서, 본 발명은 추가로 상기 정의된 바와 같은 약제학적 조성물과, 상기 정의된 바와 같은 1종 이상의 활성 화합물을 당업계에 잘 알려져 있는 하나 이상의 다른 약제학적으로 허용 가능한 성분들, 예컨대, 담체, 애주번트, 부형제와 함께 혼합하여 약제학적 조성물을 제조하는 방법을 제공한다. 개별 단위(예컨대, 정제 등)로 제제화되는 경우, 각각의 단위는 미리 결정된 양(용량)의 활성 화합물을 함유한다.
본원에서 사용되는 "약제학적으로 허용 가능한"이라는 용어는, 타당한 의학적 판단 범주 내에서 과도한 독성, 가려움증, 알레르기 반응, 또는 다른 문제 또는 합병증 없이 당해 피험체(예컨대, 인간)의 조직과 접촉하여 사용하기에 적합하고, 적당한 이익/위험 비를 갖는, 화합물, 성분들, 물질, 조성물, 제형 등에 관련하는 것이다. 각 담체, 애주번트, 부형제 등은 또한 제제의 다른 성분들과 상용성이라는 의미에서 "허용 가능"하여야 한다.
조성물은 임의의 적합한 투여 경로 및 수단용으로 제제화될 수 있다. 약제학적으로 허용 가능한 담체 또는 희석제는 경구, 직장, 비내, 국소(협측 및 설하 포함), 질내 또는 비경우(피하, 근육내, 정맥내, 진피내, 경막내 및 경막외 포함) 투 여에 적합한 제제에 사용되는 것을 포함한다. 제제는 편의상 단위 제형 형태로 제시될 수 있고, 약학 분야에 잘 알려져 있는 임의 방법에 의해 제조될 수 있다. 그러한 방법은 하나 이상의 부속 성분들을 구성하는 담체와 활성 성분들을 회합시키는 단계를 포함한다. 일반적으로 제제는 활성 성분을 액상 담체 또는 미분화된 고체 담체, 또는 둘 모두와 함께 균일하고 밀접하게 회합시킨 후, 필요하다면, 제품으로 성형화하여 제조될 수 있다.
고체 조성물의 경우, 통상의 비독성 고체 담체는 예를 들면, 약제학적 등급의 만니톨, 락토스, 셀룰로스, 셀룰로스 유도체, 전분, 스테아린산 마그네슘, 나트륨사카린, 활석, 글루코스, 수크로스, 탄산마그네슘 등이 포함되며, 이들이 사용될 수 있다. 상기 정의된 바와 같은 활성 화합물은 담체로서 예를 들면, 폴리알킬렌 글리콜, 아세틸레이트 트리글리세리드를 사용함으로써 좌제로 제제화될 수 있다. 액상의 약제학적으로 허용 가능한 조성물은 예를 들면, 상기 정의된 바와 같은 활성 화합물과 임의의 약제학적 애주번트를 담체, 예로서, 물, 염수, 수용성 덱스트로스, 글리세롤, 에탄올 등에 용해시키거나 분산시키는 등을 하여 액제 또는 현탁제로 제조함으로써 제조될 수 있다. 원하는 경우, 투여하고자 하는 약제학적 조성물은 또한 최소량의 비독성 보조제, 예로서, 습윤제 또는 유화제, pH 완충제 등, 예를 들면, 아세트산나트륨, 소르비탄 모노라울레이트, 트리에탄올아민 아세트산나트륨, 소르비탄 모노라울레이트, 트리에탄올아민 올레이트 등을 함유할 수 있다. 그러한 제형을 제조하는 실제 방법은 공지되어 있거나, 당업자에게는 자명할 것이다; 예를 들면, 문헌 ["Remington: The Science and Practice of Pharmacy", 20th Edition, 2000, pub. Lippincott, Williams & Wilkins]을 참조할 수 있다. 어떻든 투여하고자 하는 조성물 또는 제제는 치료하고자 하는 대상의 증상을 완화시키는데 유효한 양으로 다수의 활성 화합물(들)을 함유할 것이다.
0.25 내지 95% 범위의 활성 성분과, 그 잔여량으로는 비독성 담체를 함유하는 제형 또는 조성물이 제조될 수 있다.
경구 투여용의 약제학적으로 허용 가능한 비독성 조성물은 보통 사용되는 부형제, 예를 들면, 약제학적 등급의 만니톨, 락토스, 셀룰로스, 셀룰로스 유도체, 크로스카르멜로오스 나트륨, 전분, 스테아린산 마그네슘, 나트륨사카린, 활석, 글루코스, 수크로스, 탄산마그네슘 등의 혼입에 의해 제조된다. 그러한 조성물은 액제, 현탁제, 정제, 환제, 캡슐제, 분제, 지효성 방출 제제 등의 형태를 취한다. 그러한 조성물은 1%-95% 활성 성분, 더욱 바람직하게는 2-50%, 가장 바람직하게는 5-8%를 함유할 수 있다.
비경구 투여는 일반적으로, 피하, 근육내, 또는 정맥내 주사를 특징으로 한다. 주사제는 통상의 형태인 액상 용액제 또는 현탁제로서, 주사 이전에 액상의 액제 또는 현탁제로 제조되기에 적합한 고체 제형으로서, 또는 에멀젼으로서 제조될 수 있다. 적합한 부형제는 예를 들면, 물, 염수, 덱스트로스, 글리세롤, 에탄올 등이다. 추가로, 원하는 경우, 투여하고자 하는 약제학적 조성물은 또한 최소량의 비독성 보조제, 예로서, 습윤제 또는 유화제, pH 완충제 등, 예를 들면, 아세트산나트륨, 소르비탄 모노라울레이트, 트리에탄올아민 올레이트, 트리에탄올아민 아세트산나트륨 등을 함유할 수 있다.
국소 적용을 위한 약제학적으로 허용 가능한 조성물은 하나 이상의 담체에 현탁되거나 용해된 활성 성분을 함유하는 적합한 연고 또는 겔로 제제화될 수 있다. 본 발명의 화합물의 국소 투여를 위한 담체로는 광유, 액상 바셀린, 백색 바셀린, 프로필렌 글리콜, 폴리옥시에틸렌, 폴리옥시프로필렌 화합물, 유화 왁스 및 물을 포함하나, 이에 한정되는 것은 아니다. 별법으로, 약제학적으로 허용 가능한 조성물은 하나 이상 약제학적으로 허용 가능한 담체에 현탁되거나 용해된 활성 성분을 함유하는 적합한 로션제 또는 크림제로 제제화될 수 있다. 적합한 담체로는 광유, 소르비탄 모노스테아레이트, 폴리소르베이트 60, 세틸 에스테르 왁스, 세테아릴 알코올, 2-옥틸도데카놀, 벤질 알코올 및 물을 포함하나, 이에 한정되는 것은 아니다.
상기의 비경구용 또는 국소용 조성물에 함유되는 활성 화합물의 비율은 그의 특이적인 성질 뿐만 아니라, 화합물의 활성과 피험체의 필요에 고도로 의존적이다. 그러나, 활성 성분은 0.1% 내지 10% w/w의 비율로 사용될 수 있고, 조성물이 고체이고, 이후 상기 비율로 희석되는 것이라면, 상기 비율은 이보다 높을 것이다. 바람직하게, 조성물은 용액내 0.2-2% w/w의 활성 성분을 포함할 것이다.
적합한 담체, 애주번ㅌ, 부형제 등에 관한 추가의 교시는 표준 약제학적 텍스트, 예를 들면, 문헌 [Remington: The Science and Practice of Pharmacy", 20th Edition, 2000, pub. Lippincott, Williams & Wilkins; and Handbook of Pharmaceutical Excipient, 2nd edition, 1994]에서 찾아볼 수 있다.
화합물 투여
본 발명의 란티바이오틱 화합물 및 조성물은 의학적 치료법 또는 예방법으로 피험체에게 투여될 수 있다. 피험체는 인간 또는 동물 피험체일 수 있다. 동물 피험체는 포유동물, 또는 기타 척추동물일 수 있다.
따라서, 피험체를 치료 또는 예방하는 방법에 사용하기 위한 본 발명의 화합물을 제공한다. 또한, 피험체를 치료 또는 예방하는 방법에 사용하기 위한 약제를 제조하기 위한 본 발명의 화합물의 용도를 제공한다.
치료 방법은 피부, 점막, 장 또는 전신 감염을 비롯한 박테리아 감염을 위한 것일 수 있다.
상기 변이체 및 조성물은 균혈증(카테터 관련 균혈증 포함), 폐렴, 피부 및 피부 구조 감염(수술 부위 감염), 심장내막염 및 골수염의 전신 치료에 사용될 수 있다. 이와 그 밖의 치료법은 원인 물질, 예로서, 스타필로코커스, 스트렙토코커스, 엔테로코커스에 대한 것일 수 있다. 본 발명의 화합물, 또는 그의 조성물은 또한 여드름(즉, 프로피오니박테리움 아크네스)을 비롯한 피부 감염의 국소 치료에 사용될 수 있다. 상기 변이체 및 그의 조성물은 또한 눈 감염, 예로서, 결막염 치료에 사용될 수 있고, 장 중복 감염(gut super-infection), 예로서, 다중 내성 클로스트리듐 디피실리를 비롯한 클로스트리듐 디피실리에 의해 유발된 것(위막성 대장염), 또는 헬리코박터 파이로리(Helicobacter pylori)와 관련된 장 감염의 경구 치료를 위해 사용될 수 있다.
변이체는 또한 상처 또는 화상시 피부 감염을 치료하거나 예방하는데 사용될 수 있다. 추가로, 변이체 및 그의 조성물은 예로서, MRSA의 전파를 방지하기 위해 콧구멍을 청소하는 예방법에도 사용될 수 있다. 이는 감염 위험이 있는 피험체(예컨대, 병원에 입원하는 환자), 또는 의료 종사자 또는 그러한 감염 보균자가 될 위험이 있는 다른 간호인에 대해 실행될 수 있다. 복부 수술 이전에 창자 균무리를 예방학적으로 제거하는 것 또한 고려된다.
본 발명에 따른 화합물은 장내(경구적으로), 비경구적으로(근육내로 또는 정맥내로), 직장 또는 국부적으로(국소적으로). 이는 액제, 분제(정제, 마이크로캡슐제를 비롯한 캡슐제), 연고제(크림제 또는 겔제), 또는 좌제의 형태로 투여될 수 있다. 이러한 유형의 제제에 가능한 보조제는 약제학적으로 통상의 액상 또는 고체 충전제 또는 증량제, 용매, 유화제, 활택제, 향미제, 교정제, 착색제 및/또는 완충 물질이다. 적당량 용량으로서 0.1-1000, 바람직하게는 0.2-100mg/kg (체중)이 투여된다. 이는 1일 유효량, 예컨대, 30-3000, 바람직하게 50-1000mg으로 본 발명에 따른 화합물을 함유하는 1회 복용 단위로 적당히 투여된다.
이하에서는, 첨부하는 도면을 참조하여, 본 발명의 최적의 실시양태를 비롯하여 본 발명의 실험 원리를 추가로 상세히 설명할 것이나, 이는 단지 예로서 제시된 것이다.
실시예 1 - 유전자 클러스터 클로닝
악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애로부터의 액타가르딘 생합성 유전자 클러스터 동정 및 클로닝
O/SBDIG-1은 48개의 염기로 구성된, 디곡시제닌(DIG: digoxigenin)-표지된 축퇴성 올리고뉴클레오티드이다. 이는 액타가르딘의 공지된 아미노산 서열을 번역시키고, 악티노플레인스에 대한 코돈 사용 빈도를 고려하여 디자인되었다. 악티노플레인스 가르바디넨시스로부터 단리되고, 제한 효소 NcoI를 사용하여 분해된 게놈 DNA의 써던 혼성화 분석을 통해 O/SBDIG-1에 혼성화되는 ~3kb 단편을 동정하였다. 게놈 DNA의 NcoI 분해를 반복하고, ~3kb의 DNA 단편을 단리하고, NcoI으로 절단된 pLITMUS28 (NEB) 내로 클로닝하였다. 생성된 플라스미드를 E. 콜라이 DH10B 세포 내로 도입한 후, 프로브 O/SBDIG-1을 사용하여 써던 혼성화 분석을 실시하였다. 혼성화하는 클론을 동정하고, 서열을 분석하였다. 서열 분석을 통해 pLITAG01로 명명되는 상기 플라스미드는 액타가르딘 생합성에 대한 lanA 구조 유전자를 코딩하는 DNA(actA)와, ABC 당 수송체의 일부를 코딩하는 것으로 간주되는 상류 영역 및 lan M을 부분적을 코딩하는 하류에 있는 영역(actM)으로 구성된다는 것이 밝혀졌다.
프라이머 O/ACT08F 및 O/ACT09R은 pLITAG01로부터의 서열에 기초하여 디자인되었다. DIG-표지된 dNTPs(Roche) 및 주형으로서 pLITAG01과 함께 PCR 반응에서 상기 프라이머를 사용함으로써 2296bp DIG-표지된 DNA 단편을 생성하고, 이를 SBDIG-2로 명명하였다.
BamHI를 사용하여 앞서 분해된 코스미드 SuperCos1(Stratagene) 내로 악티노플레인스 가르바디넨시스 ATCC 31049 및 악티노플레인스 리구리애 NCIMB 41362로부터 얻은, Sau3AI로 분해된 게놈 DNA를 클로닝하여 2개의 코스미드 라이브러리를 생성하였다. 각 코스미드 라이브러리는 SBDIG-1를 사용하여 써던 혼성화로 분석하였다. SBDIG-1에 혼성화하는 것으로 간주되는 것으로, 각 라이브러리로부터 얻은 25 개의 코스미드를 선별하고, 프로브 O/SBDIG-1 및 SBDIG-2를 사용하여 써던 혼성화로 재분석하였다. 악티노플레인스 가르바디넨시스로부터 얻은 게놈 DNA로부터 유래된 9개의 코스미드, 및 악티노플레인스 리구리애로부터 얻은 게놈 DNA로부터 유래된 11개의 코스미드는 2개의 프로브 모두에 혼성화되었다. 각 코스미드로부터 DNA를 단리하고, 프라이머 T3 및 T7을 사용하여 서열 분석하였다. 이어서, 코스미드 CosAL02 및 CosAG14의 전체 선열을 분석하였다(Sequencing facility, Department of Biochemistry, University of Cambridge).
재료 및 방법
균주
본 발명에 사용한 박테리아 균주는 도 5에 요약되어 있다.
벡터
코스미드 SuperCos1은 스트라진(Stratagene)으로부터 입수하였다.
플라스미드 pLITMUS는 뉴 잉글랜드 바이오랩스(New England Biolabs)로부터 입수하였다.
프라이머
써던 혼성화
DNA 프로브 표지화
로슈(Roche)로부터 공급받은 디곡시제닌(DIG) PCR DNA 표지 및 검출용 키트를 그의 설명서에 따라 사용함으로써 DNA 혼성화 프로브를 제조하였다.
DNA를 나일론 막으로 옮김
먼저, 관심의 대상이 되는 DNA를 아가로스 겔 전기영동에 의해 분리하고, 진공 블로터(Q BIO gene)를 사용하여 나일론 막(Hybond-N, 영국에 소재하는 Amersham Int.)으로 옮겼다. 0.5 M HCl를 사용한 DNA의 탈퓨린 반응에 소요되는 시간은 브로모페놀 블루 마커 밴드가 완전하게 황색으로 변색될 때까지 걸린 시간(전형적으로, 0.7% 아가로스 겔의 경우 15-20분)에 의해 판단하였다. 이어서, 1.5 M NaCl, 1.5 M NaOH를 사용하여 DNA를 전체적으로 변성시키고, 각각 추가의 15-20분 동안 0.5 M Tris, 1.5 M NaCl(pH 8.0)을 사용하여 중화시켰다. 최소 60분 동안 20 x SSC를 충분히 제공하여(flooding) DNA의 완전한 블롯팅을 촉진시켰다. 블롯팅된 막을 진공 상태로부터 수거한 후, 이를 실온에 방치하여 대기 건조시켰다. UV 투과조명기(UVP) 상에 막(DNA 면이 아래로 향하게)을 놓고, 5분 동안 365 nm의 파장에서 UV에 노출시켜 DNA를 가교 결합시켰다.
콜로니 리프트 및 혼성화
혼성화에 의해 스크리닝하고자 하는 콜로니를 나일론 막(Roche diagnostics)으로 옮겼다. 양 전하를 띤 나일론 막을 콜로니 위에 놓고, 효과적으로 옮겨지도록 하기 위하여 1분간 단단히 눌렀다. 기준점을 막 위에 마킹하여 콜로니와 관련된 그의 배향을 표시하였다. 이후, 막을 수거하고, 로슈의 사용자 설명서(필터 혼성화용 DIG 사용 설명서)에서 지시하는 바에 따라 혼성화용으로 제조하였다.
혼성화 및 막 현상
68℃의 HB-1000 혼성화용 오븐(UVP)에서 밤새도록(~16hr) DNA를 제조된 프로브와 함께 혼성화시켰다. 혼성화 이후, 막을 2 x 염 시트르산나트륨(SSC: salt sodium citrate) + 0.1% 황산도데실나트륨(SDS: sodium dodecyl sulphate)을 사용하여 실온에서 5분간의 2주기 동안 막을 세척하였다. 상기와 같이 세척한 후, SBDIG-1 존재하에 혼성화된 막에 대해서 1 x SSC + 0.1% SDS를 사용하여, 그리고, SBDIG-2를 사용하여 스크리닝된 막에 대해서 0.1 x SSC + 0.1% SDS를 사용하여 68℃에서 2 x 15분으로 2차의 일련의 세척을 실시하였다. 이어서, 로슈의 사용자 설명서(필터 혼성화용 DIG 사용 설명서)에서 권고된 바에 따라 막을 현상시켰다.
소프트웨어
일치 서열은 프레임플로트(FramePlot) 버전 2.3.2, 바이오에디트(BioEdit) 서열 정렬 편집기, 클러스탈W(ClustalW)(EMBL-EBI) 및 베이직 로컬 얼라이먼트 서치 툴(Basic Local Alignment Search Tool)(BLAST, NCBI)을 사용하여 분석하였다.
결과 및 고찰
CosAG14
코스미드, CosAG14는 악티노플레인스 가르바디넨시스로부터 단리된 게놈 DNA의 38168bp 단편을 함유한다. 서열 분석을 통해 리더 및 액타가르딘 프리펩티드를 코딩하는 DNA를 동정하고, 이 유전자를 명칭 actA로 명명하였다. 2개의 알라닌 잔기는 액타가르딘 프리펩티드의 상류 바로 앞에 존재한다. 이들 잔기가 액타가르딘 으로부터 리더 펩티드의 프로테아제 절단에 대한 인식 부위를 나타내는 것으로 간주된다. 이 위치에서의 부분적인 절단으로 알라닌은 유지되는데, 이것이 악티노플레인스 가르바디넨시스의 발효 브로쓰에서 통상 관찰되는 ala-액타가르딘을 생산시킨다고 간주된다. actA 유전자 하류에는 3162bp의 DNA 영역이 존재하는데, 이는 예를 들면, 머사시딘 유전자 클러스터로부터의 mrsM(30% 동일성)과 같은 수개의 lanM 단백질과 강한 서열 유사성을 갖는다. 이러한 추정 유전자를 actM으로 명명하고, 이는 액타가르딘 프리펩티드의 변형, 촉매적인 탈수, 및 티오에테르 형성에 관여하는 것으로 간주된다. actO로 명명되는 것으로서, actM으로부터 11bp 만큼 하류에 위치하는 오픈 리딩 프레임은 수개의 루시퍼라제형 모노옥시게나제와 서열 유사성(~39% 동일성)을 갖는 341-아미노산 단백질을 코딩한다. ActO인 모노옥시게나제는 산소를 혼입시켜 데옥시-액타가르딘으로부터 액타가르딘을 생성하는 것으로 촉진시키는 역할을 하는 것으로 간주된다. actR로 명명되는 오픈 리딩 프레임은 actO에 대해 역 배향으로 존재하고, 62bp 하류에 위치한다. 이러한 orf의 단백질 산물은 수개의 2-성분 반응 조절 인자와 서열 유사성(~37% 동일성)을 보인다. ABC 수송체 퍼미아제에 대하여 서열 유사성(~25% 동일성)을 보이는 추정 812개의 아미노산 단백질은 789bp 하류에 위치하고, actR과 동일한 배향으로 존재한다. actT로 명명되는 이러한 추정 단백질이 잠재적으로 세포로부터 변형된 란티바이오틱을 유출시킨다. actT로부터 하류에 있는 2번째 및 4번째 아미노산 서열은 각각 반응 조절 인자 키나제 및 페니실린 결합 단백질과 유사성(~30% 동일성)을 나타낸다. 리스테리아 모노사이코겐(Listeria monocytogene)에서 니신 생합성 유전자 클러스터에 관한 최근 연구(문헌 [Gravesen et al., 2004])를 통해 페니실린-결합 단백질과, 기능이 알려져 있지 않은 단백질과 함께 히스티딘 키나제가 니신 내성을 부여하는데 관여한다고 입증되었다. actA에 매우 근접한 위치 내에 유사한 유전자가 존재한다는 것은 이들 유전자가 액타가르딘 내성 기전에 관여한다는 것을 지시할 수 있다.
CosAL02
코스미드 CosAL02는 악티노플레인스 리구리애로부터 단리된 게놈 DNA의 40402bp 단편을 함유한다. 서열 분석을 통해 코스미드 CosAG14에서 동정된 actA 유전자와 강력한 서열 상동성(50개의 잔기가 동일)을 갖는, 64-아미노산 단백질을 코딩하는 lanA 유전자를 동정하게 되었다. 본 발명자들은 이러한 lanA 유전자 종을 ligA로 명명하였다. 이러한 ligA의 프리펩티드 서열은 하기 나타낸 두 유전자(서열 번호 119 및 서열 번호 212)의 정렬에서 표시되어 있는 2개의 잔기가 액타가르딘의 것과 상이하다:
V15L 및 I16V 돌연변이는 액타가르딘과 동일한 질량을 갖는 단백질을 생성할 수 있는 바, 질량 분광법(lc-ms) 분석에 의해서는 식별되지 못할 것이다. CosAL02에서 동정된 lanA 유전자의 잠재적인 산물이 신규한 란티바이오틱을 나타낸다. ligA으로부터 321bp 만큼 상류에 존재하는 오픈 리딩 프레임은 스트렙토마이세스 글라우체센스(Streptomyces glaucescens)의 StrR 단백질과 서열 유사성(46% 동일 성)을 보이는 추정 286-아미노산 단백질을 코딩한다. StrR 단백질은 스트렙토마이신 유전자 발현 조절에 관여하는 경로-특이성 DNA 결합 활성 인자이다. ligA 하류에 존재하는 orf의 서열 유사성(31% 동일성)은, 잠재적으로 ligA 프리펩티드의 변형에 관여하는 1046-아미노산 lanM 폴리펩티드(하기에서 "ligM"으로 명명됨)를 코딩한다는 것을 제안한다. 다음의 하류에 있는 오픈 리딩 프레임의 개시 코돈인 lanT(ligT)는 ligM의 개시 코돈과 중복된다. LigT는 수개의 ABC-수송체와 서열 유사성을 갖는 575개의 아미노산 단백질이다. LanT 단백질은 최종의 성숙한 산물 또는 여전히 그의 리더 서열에 부착된, 번역후 변형된 산물을 분비시킨다. 코스미드, CosAG14에서 관찰되는 바와 같이, ligT로부터 하류에 있는 다음 orf는 루시퍼라제형 모노옥시게나제와 서열 유사성(~38% 동일성)을 갖는 347개의 아미노산 단백질을 코딩한다. 이러한 추정 모노옥시게나제(ligO)가 산소 혼입과 설폭시드 결합 형성에 관여하는 것으로 간주된다. 수개의 2-성분 반응 조절 인자와 서열 유사성(~37%)을 보이는 추정 217개의 아미노산 단백질은 ligO 하류에 위치하고 역 배향으로 존재한다. 이러한 추정 조절 인자를 ligR로 명명하였다.
표 1. CosAG14 주석(악티노플레인스 가르바디넨시스로부터 단리된 38168bp 단편. SuperCos1 벡터 골격 서열은 생략한다)
표 2. CosAL02 주석(악티노플레인스 리구리애로부터 단리된 40402bp 단편. SuperCos1 벡터 골격 서열은 생략한다)
실시예 2 - 발현 카세트
발현 카세트 생성
본 실시예는 본 발명에 따른 발현 카세트의 생산에 관하여 예시한다. 본 발명의 변이체 lanA 유전자를 효과적으로 생성하기 위하여 이러한 발현 카세트, 플라스미드 pAGvarX를 디자인하고, 이후, 예로서, 야생형 actA가 제거된 악티노플레인스 가르바디넨시스 균주(악티노플레인스 가르바디넨시스 ΔactA)와 같은 숙주 세포 내로 도입할 수 있다. 벡터 pSET152(문헌 [Bierman et al., 1992])의 유도체는 이러한 플라스미드를 attP 부착 부위를 통해 숙주의 염색체 내로 통합될 것이다. 숙주 유기체에 의해서 액타가르딘 생합성 유전자 클러스터의 남은 야생형 유전자와 함께 돌연변이화된 actA 유전자가 발현됨으로써 액타가르딘 변이체가 생성되어야 한다.
플라스미드
pAGvarX
작제
달리 언급하지 않는 한, 인용되는 모든 위치는 서열 번호 100에 관한 것이다. 플라스미드 pAGvarX 작제에 관한 도식은 도 3에 제시되어 있다. 21237번 위치에 있는 actA 상류에 위치하는 orf에 인접한 염기부터 21672번 위치에 있는 actA 코딩 영역 내의 루신 잔기까지를 프라이머 O/AGvar01bF 및 O/AGvar02bR(프라이머 표)와, 프라이머로서 pLITAG01을 사용하여 PCR에 의해 증폭시켰다. 5' 말단 측면에 위치하는 XbaI 부위 및 BglII 부위를 침묵 돌연변이화를 통해 actA를 코딩하는 3' 루신 부위에 도입하기 위하여 프라이머를 디자인하였다. SmaI를 사용하여 앞서 분해된, 탈인산화된 pUC19로 상기 단편을 도입하여 pAGvar1을 수득하였다.
actA의 C-말단으로부터 인접한 하류 orf(21758과 21836을 포함하여 (21758-21836)에 이르는 DNA 영역을, 프라이머 O/AGvar05F 및 O/AGvar06R과, 주형으로서 pLITAG01을 사용하여 PCR에 의해 증폭시켰다. 5' 위치의 측면에 위치하는 AvrII 부위 및 3' 말단의 EcoRI 부위를 도입하기 위하여 프라이머를 디자인하였다. SmaI를 사용하여 앞서 분해된, 탈인산화된 pUC19로 생성된 PCR 산물을 클로닝하여 pAGvar2를 수득하였다. 이어서, 플라스미드 pAGvar1 및 pAGvar2를 XbaI를 사용하여 분해하고, pAGvar1로부터 PCR 단편을 회수하고, 탈인산화되고, XbaI를 사용하여 분해된 pAGvar2로 클로닝하고, 이입된 단편의 정확한 배향은 제한 분석에 의해 측정하였다. 이어서, BglII 및 AvrII를 사용하여 생성된 플라스미드 pAGvar3을 분해하고, 어닐링된 올리고뉴클레오티드 O/AGvar03F 및 O/AGvar04R에 결찰시켜 pAGvar4를 생성하였다. 이어서, EcoRI 및 XbaI를 사용하여 플라스미드 pAGvar4를 분해하고, EcoRI 및 XbaI를 사용하여 앞서 분해된 pSET152 내로 어닐링된 올리고뉴클레오티드를 포함하는, 생성된 ~620bp 단편을 도입하여 벡터 pAGvarX를 수득하였다.
각각의 올리고뉴클레오티드를 어닐링하여 작제된 pAGvarX 영역은 액타가르딘 펩티드와 관련하여 아미노산 6과 7(각각 C 및 T)에 침묵 돌연변이화를 통해 BsrGI 부위를 도입한다. 이 부위는 상류의 BglII 부위 또는 하류의 AvrII 부위와 함께, 표적된 돌연변이를 코딩하는 DNA를 actA 펩티드내 코딩되는 임의의 아미노산으로 도입하는데 사용될 수 있다.
실시예 3 - 숙주 세포
본 실시예은 lanA 유전자가 불활성화되어 있는 란티바이오틱 생산 숙주 세포 생산에 관하여 예시한다. 본 실시예에서, 숙주 세포는 actA 유전자가 결실되어 있는 악티노플레인스 가르바디넨시스이다.
균주 악티노플레인스 가르바디넨시스 ΔactA
액타가르딘 구조 유전자 actA의 변이체를 발현시키는데 숙주로서 균주 악티노플레인스 가르바디넨시스 ΔactA가 사용된다. 이러한 균주는 (Gust et al., 2002)에 의해 개발된 리디렉트(Redirect) 기술을 사용하여 야생형 악티노플레인스 가르바디넨시스로부터 생성되었다. 먼저, actA를 코딩하는 코스미드 CosAG14로부터의 DNA 영역을 카세트 SBdel-1로 대체하였다. SBdel-1는 아프라마이신 내성 유전자(aac(3)IV) 및 FLP 인식 표적(FRT: FLP recognition target) 부위 측면에 위치하 는 oriT로 구성되고, 이는, 주형으로서 플라스미드 pIJ773과 함께, 각각 서열 번호 100의 21536 및 21802에 결합하는 프라이머 O/SB50F 및 O/SB51R를 사용하여 PCR에 의해 증폭시켰다. 리디렉트 프로토콜(문헌 [Gust et al., 2004])에 따라 CosAG14의 actA를 SBdel-1로 대체시켜 코스미드 CosAG14ΔA를 생성하였다. 이어서, 리디렉트 프로토콜 단계 7에 따라 FLP-매개 절단에 의해 SBdel-1 카세트의 중심부를 CosAG14ΔA로부터 제거하여 CosAG14ΔB를 생성하였다. 이러한 영역을 제거함으로써 비극성의 비마킹된 프레임내 결실을 생성할 수 있을 뿐만 아니라 동일한 내성 마커를 반복적으로 사용할 수 있다(문헌 [Gust et al., 2003]).
작제 제2 단계는 코스미드를 조작하여 접합에 의해 상기 코스미드를 악티노플레인스 가르바디넨시스 내로 도입할 수 있도록 하는 것이었다. 먼저 형질전환에 의해 CosAG14ΔB를 E. 콜라이 균주 BW25113/pIJ790 내로 삽입시킴으로써 이를 개시하였다. 이어서, 리디렉트 프로토콜(문헌[Gust et al., 2004])에 따라 CosAG14ΔB의 앰피실린 유전자를 SBdel-2로 대체하여 코스미드 CosAG14ΔC를 생성하였다. SBdel-1과 유사한, 카세트 SBdel-2는 아프라마이신 내성 유전자(aac(3)IV) 및 FRT 부위 측면에 위치하는 oriT를 수용하지만, 주형 pIJ773과 함께 프라이머 O/SB52F 및 O/SB53R을 사용하여 생성되었다.
리디렉트 프로토콜(문헌 [Gust et al., 2004]; 또한, 하기 문단을 참조할 수 있다)에 따라 악티노플레인스 가르바디넨시스와 접합시키기 이전에 CosAG14ΔC를 사용하여 E. 콜라이 ET12567/pUZ8002의 전기적격 세포를 형질전환시켰다. actA 유전자가 야생형 생산자의 염색체로부터 제거된, 생성된 균주는 악티노플레인스 가르 바디넨시스 ΔactA이다.
더욱 상세하게, 상기 악티노플레인스 가르바디넨시스 ΔactA 균주를 수득하기 위하여 악티노플레인스 가르바디넨시스와 접합시키기 이전에 CosAG14ΔC를 사용하여 E. 콜라이 ET12567/pUZ8002의 전기적격 세포를 형질전환시켰다. 아프라마이신 내성 외부 접합체를 수득하고, 아프라마이신을 포함하지 않는 TSB에서 6회에 걸쳐 반복적으로 성장시켜 계대배양하였다. 배양물 6으로부터의 세포를 배지 65 상에 플레이팅시키고 30℃에서 인큐베이션하였다. 5일 경과 후, 배지 65 상의 대략 1㎠ 면적에 걸쳐 콜로니를 옮기고 패치 아웃하였다. 30℃에서 3일간 인큐베이션한 후, 최종 농도 50㎍/ml로 아프라마이신을 함유하는 배지 65로 패치된 세포를 옮겼다. 30℃에서 72시간 동안 인큐베이션한 후, 아프라마이신에 감수성인 세포를 선별하고, 각 패치를 사용하여 10ml TSB를 함유하는 50ml 플라스크에 접종하고 30℃, 250rpm에서 4일 동안 배양하였다. 각 배양물로부터 게놈 DNA를 제조하고, 올리고뉴클레오티드 O/AGvar01bF 및 O/AGvar06r을 사용하여 PCR에 의해 분석하였다. actA 유전자가 결실된 것과 일치하는 크기를 갖는 PCR 산물이 생성되었다. 동시에 hplc에 의해 발효 브로쓰를 분석함으로써 이들 동일 샘플은 액타가르딘을 생산하지 않았음이 입증되었다.
실시예 4 - 이종성 발현
본 실시예는 비생산자 세포, 스트렙토마이세스 리비단스인 숙주 세포에서 서열 번호 100 유전자 클러스터로부터 액타가르딘 발현에 관하여 예시한다. 상기 숙주 세포는 이들 2개의 펩티드의 활성 변이체를 생산하는 대안적 수단을 제공한다.
액타가르딘 및 데옥시-액타가르딘 B의 생산을 코딩하는 생합성 유전자 클러스터를 함유하는 코스미드 CosAG14 및 CosAL02는, 이종성 숙주로의 접합 전달을 촉진시키는데 필요하는 전달 기점(oriT)을 갖고 있지 않다. 리디렉트 기술(문헌 [Gust et al., 2002])을 사용하여, 네오마이신 내성 유전자, neo를 대체함으로써 파지 부착 부위 attP 및 인테그라제(int)와 함께 oriT를 CosAG14 및 CosAL02의 SuperCos1 골격 내로 도입할 수 있다.
이종성 발현용 벡터 작제
코스미드 pMJCOS1(노리치에 소재하는 JIC)은, 네오마이신 내성을 코딩하는 유전자가 oriT, attP, 인테그라제(int) 및 아프라마이신 내성 유전자(aac(3)IV)를 코딩하는 DNA를 포함하는 카세트(HEapra)로 대체된 SuperCos1(Stratagene)의 유도체이다. pMJCOS1을 SspI로 분해하고, 아가로스 겔로부터 DNA를 회수하여 카세트 HEapra를 단리하였다. 문헌 [Gust et al., 2004]에 기재된 바와 같은 리디렉트 프로토콜에 따라 CosAG14 및 CosAL02와 함께 상기 카세트를 사용하여 각각 코스미드 CosAG14HEapra 및 CosAL02HEapra를 생성하였다.
이어서, 접합을 통해 코스미드 CosAG14HEapra를 스트렙토마이세스 리비단스 내로 도입하였다. 스트렙토마이세스 리비단스/CosAG14HEapra의 아프라마이신 내성 외부 접합체를 단리하였다. 3개의 외부 접합체를 사용하여 TSB 시드 배지에 접종하였다. 대조군을 제공하기 위하여 스트렙토마이세스 리비단스, 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애를 동시에 배양하였다. 48시간 동안 인큐베이션한 후, 시드 배양물을 사용하여 각종의 상이한 생산 배지 4개, 즉, AAS1, GM1, GM3 및 TSB에 접종하였다. 이들 배양물을 총 9일간 30℃에서 인큐베이션하였으며, 5, 7 및 9일간 인큐베이션한 후에는 각 플라스크로부터 1.5ml의 분취량을 수거하였다. 분취량을 10분 동안 14000rpm(IEC 마이크로맥스 벤치탑 원심분리기)에서 원심분리시킨 후, 상등액을 버리고, 생물검정법 및 HPLC-MS 분석에는 희석시키지 않고 사용하였다.
생물학적으로 활성인 화합물(들)의 존재를 표시하는 억제대(무리(haloes))는, 코스미드 CosAG14HEapra를 함유하는 스트렙토마이세스 리비단스(스트렙토마이세스 리비단스/CosAG14HEapra)의 상등액이 로딩된 모든 웰 주위에서 관찰되었는데, 단, 예외적으로, TSB중 발효물로부터의 상등액이 로딩된 웰에서는 어떤 무리도 생성되지 않았다. 4개의 배지중 임의의 것에서 배양된 스트렙토마이세스 리비단스의 발효물로부터의 상등액이 로딩된 웰 주위에서는 어떤 생물학적 활성도 관찰되지 않았다. 성장이 입증된 악티노플레인스 리구리애 및 악티노플레인스 가르바디넨시스의 배양물로부터의 상등액이 로딩된 모든 웰 주위에서 무리가 뚜렷이 나타났다. 일반적으로 무리의 직경은 감소한 것이 뚜렷이 나타났지만, 5일째의 샘플링 첫째날부터 9일째까지 무리는 모두 일관되게 생성되었다.
스트렙토마이세스 리비단스/CosAG14HEapra의 발효물로부터의 상등액의 HPLC-MS 분석을 통해 ala(O)액타가르딘에 상응하는 체류 시간과 질량을 갖는 피크가 존재함을 확인하였다. 스트렙토마이세스 리비단스만의 상등액에는 이와 동일한 피크는 존재하지 않았다. 표 3은 스트렙토마이세스 리비단스, 스트렙토마이세스 리비단스/CosAG14HEapra, 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애를 5일 동안 인큐베이션한 후, 그의 발효물로부터의 상등액을 HPLC-MS 분석한 결과를 요약한다.
표 3:
실시예 5 - 항균 활성
MIC 측정
본원 상기에 개시되어 있는 바와 같이 생산된 변이체 선별물을 각종 박테리아에 대한 활성에 대하여 추가로 시험하였다. 스트렙토코커스 뉴모니애를 제외한 모든 유기체의 최소 억제 농도(MIC: minimum inhibitory concentration)는 최종 칼슘 농도 400㎍/ml로 무수 염화칼륨으로 보충된 뮐러-힌톤 브로쓰(MHB: Mueller-Hinton broth)에서 2배로 희석된 일련의 항생제 희석액에 의해 측정하였다. S. 뉴 모니애에 대한 최소 억제 농도(MIC)는 400㎍/ml 염화칼륨 이수화물로 보충된 뇌-심장 침출배지(BHI: Brain Heart Infusion) 브로쓰에서 2배로 희석된 일련의 항생제 희석액에 의해 측정하였다. 항미생물제 저장액을 제조하고, NCCLS 표준 M7-A6에 따라 저장하였다.
McFarland 0.5 표준과 등가인 것으로서, 600nm에서의 흡광도가 0.2 - 0.3이 되도록 조정하여 활성 배양 브로쓰 배양물을 105 내지 106 CFU/ml 함유하도록 희석시켰다. 이어서, 브로쓰중 1:100으로 추가 희석시켰다. 본 검정법은 64㎍/ml 내지 0.06㎍/ml 범위의 농도 범위에서 총 용량 200㎕(160㎕ 브로쓰, 20㎕ 항생제, 20㎕ 접종물)로 멸균 96웰 미량적정 플레이트에서 이중으로 실시하였다. 미량적정 플레이트중 12번째 웰은 항미생물제를 함유하지 않았다. 정성 대조군에 대한 기준 항생제로서 반코마이신을 사용하였다. 플레이트를 18 - 20시간 동안 37℃에서 진탕시키면서 호기성 조건하에 인큐베이션하였으며, MIC는 가시적 성장을 일으키지 않는 약물의 최소 농도로서 정의된다.
실시예 6 -
NMR
분석
액타가르딘 및
데옥시
-
액타가르딘에
대한
NMR
연구
성공적으로 NMR 분광법(COSY, TOCSY, HSQC 및 NOESY)을 사용함으로써 액타가르딘(악티노플레인스 가르바디넨시스) 및 데옥시-액타가르딘 B(악티노플레인스 리구리애) 생산자로부터 수득한 서열 분석 결과를 확인하였다. 수득한 데이타를 통해 모든 잔기를 완벽하게 명백히 지정할 수는 없었지만, 이는 도 4에 나타낸 구조와 일치하였고, 악티노플레인스 리구리애로부터의 데옥시-액타가르딘 B가 15번 및 16번 위치에 각각 Leu 및 Val을 갖는다는 것을 확인하는데는 충분하였다.
실시예 7 - 유도체 합성
Z 기와 C-말단 아미드는 하기와 같은 데옥시-액타가르딘 B의 하기 유도체를 제조하였다:
화합물 I - XI의 합성법은 하기와 같았다:
일반적인 방법 1. 화합물 I - III의 제조
건식 디메틸포름아미드(0.8ml)중 데옥시-액타가르딘 B(20mg, 11nmol), 적절한 아민(11nmol) 및 디이소프로필에틸아민(7.2㎕, 70nmol) 용액에 건식 디메틸포름아미드(1.0ml)중 200㎕의 벤조트리아졸-1-일-옥시-트리스-피롤리디노-포스포늄 헥사프루오로포스페이트(PyBop)(70mg, 134nmol) 용액을 가하였다. 출발 물질 모두가 소비될 때까지 추가 분취량의 Pybop 용액을 가하면서 반응 진행 과정에 따라 HPLC에 의해 혼합물을 분석하였다. 이 단계에서 HPLC 분석은 또한 가변량(5-20%)의 디아미드를 나타내었다. 반응 종결 후, 혼합물을 20mM Kpi의 수성 인산염 완충액(pH 7)(10ml)중 30% 아세토니트릴로 희석시키고, 표 4에 기술된 조건을 사용하여 분취용 HPLC에 의해 모노아미드를 정제하였다. 적절한 분획을 그의 원 용량의 25%까지 농축시키고, 미리조절된 C18 본드 엘루트(C18 Bond Elut) 칼럼(500mg)에 로딩하여 탈염시킨 후, 이어서 2 칼럼 용량의 30, 40, 70 및 90% 수성 메탄올을 사용하여 순차적으로 용리시킴으로써 세척하였다. 적절한 분획을 증발시킴으로써 백색 고체로서 원하는 산물을 수득하였다.
화합물 I : 데옥시 - 액타가르딘 B N-[3-디메틸아미노프로필] 모노카복스아미 드 는 일반적인 방법 1에 따라 데옥시액타가르딘 B와 3-(디메틸아미노)프로필아민을 커플링함으로써 수득하였다.
수득량 18mg, 85% 수율. [M+2H 2+] 계산치 979.0, 관측치 980.2
화합물 II : 데옥시 - 액타가르딘 B N-[1-(1- 메틸 -4- 피페리디닐 )피페라진] 모 노카복스아미드 는 일반적인 방법 1에 따라 데옥시액타가르딘 B와 4-(피페리디노)피 페라진을 커플링함으로써 수득하였다.
수득량 8mg, 37% 수율. [M+2H 2+] 계산치 1019.5, 관측치 1020.0;
[M+3H 3+] 계산치 680.0, 관측치 680.0
화합물 III : 데옥시 - 액타가르딘 B [1-(3-디메틸아미노프로필)피페라진] 모노카복스아미드 는 일반적인 방법 1에 따라 데옥시-액타가르딘 B와 1-(3-디메틸아미노프로필)피페라진을 커플링함으로써 수득하였다.
수득량 10mg, 46% [M+2H 2+] 계산치 1013.5, 관측치 1014.0
일반적인 방법 2. 화합물
IV
-
IX
의 제조
건식 디메틸포름아미드(0.4ml)중 적절한 Fmoc 보호된 아미노산(34nmol) 용액을 건신 디메틸포름아미드(0.4ml)중 벤조트리아졸-1-일-옥시-트리스-피롤리디노-포스포늄 헥사프루오로포스페이트(PyBop)(11.4mg, 22nmol) 및 디이소프로필에틸아민(11㎕, 68nmol) 용액으로 처리하였다. 이어서 혼합물을 건식 디메틸포름아미드(0.5ml)중 데옥시-액타가르딘 B(2mg, 11nmol) 용액에 가하였다. 혼합물을 시간 동안 실온에 방치한 후, 분석 HPLC(20mM Kpi 수성 인산염 완충액(pH 7)중 30-65% 아세토니트릴)를 통해 출발 물질이 완전하게 전환되었음을 나타내었다. 반응 혼합물을 40% 수성 메탄올(20ml)로 희석시키고, 2 칼럼 용량의 100% 메탄올에 이어, 2 칼럼 용량의 물로 세척함으로써 미리조절된 C18 본드 엘루트 칼럼(500mg)에 혼합물을 통과시켰다. 순차적으로 2 칼럼 용량의 40, 50, 60, 70, 80, 90 및 100% 수성 메탄올을 사용하여 칼럼을 용리시켰다. HPLC에 의해 분획을 분석하고, Fmoc-보호된 커플링 산물을 함유하는 분획을 증발건조시켰다. 잔류물을 디메틸포름아미드(1ml)에 용해시키고, 피페리딘(50㎕)을 가하여 Fmoc 보호기를 제거하였다. 반응 진행 과정을 HPLC에 의해 모니터하고, 출발 물질이 완전히 소비된 후에 용액을 30% 수성 메탄올(20ml)로 희석시켰다. 이어서, 앞서 기술된 바와 같이 C18 본드 엘루트 카트리지(500mg)를 통해 혼합물을 용리시키고, 적절한 분획을 증발시킨 후에 수득한 산물은 표 4에 기술된 조건을 사용하여 분취용 HPLC에 의해 추가로 정제하였다. 적절한 분획을 그의 원 용량의 25%까지 농축시키고, 미리조절된 C18 본드 엘루트 칼럼(500mg)에 로딩하여 탈염시킨 후, 이어서 2 칼럼 용량의 30, 40, 70 및 90% 수성 메탄올을 사용하여 순차적으로 용리시킴으로써 세척하였다. 적절한 분획을 증발시킴으로써 백색 고체로서 원하는 산물을 수득하였다.
화합물 IV : D- Ala (0) 데옥시 - 액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-D-알리닌으로부터 74% 수율로 제조되었다.
[M+2H 2+] 계산치 972.5, 관측치 973.0
043/188
화합물 V : L- Ile (0)데옥시- 액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-L-이소루신으로부터 27% 수율로 제조되었다.
[M+2H 2+] 계산치 993.5, 관측치 993.8
화합물 VI : L- Val (0)데옥시액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-D-발린으로부터 55% 수율로 제조되었다.
[M+2H 2+] 계산치 986.5, 관측치 985.9.
화합물 VII : L- Phe (0)데옥시액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-D-페닐알리닌으로부터 22% 수율로 제조되었다.
[M+2H 2+] 계산치 1010.5, 관측치 1010.9.
화합물 VIII : L- Lys (0)데옥시액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 비스(Fmoc)-L-리신으로부터 45% 수율로 제조되었다.
[M+2H 2+] 계산치 1001.0, 관측치 1001.6
화합물 IX : L- Tryp (0)데옥시액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-L-트립토판으로부터 55% 수율로 제조되었다
[M+2H 2+] 계산치 1030.0, 관측치 1029.9.
실시예
8 - 추가의 항균
데이타
MIC
측정
스타필로코커스
,
스트렙토코커스
,
엔테로코커스
종
최소 억제 농도(MIC)를 측정하고, 호기성 박테리아용의 NCCLS 항미생물제 저장액을 제조하고, NCCLS 기준 미세희석 브로쓰 방법(M7-A6, 2003)에 따라 저장하였다. MIC는 뮐러-힌톤 브로쓰(MHB) 또는 뇌-심장 침출배지(BHI) 브로쓰(S. 뉴모니애)에서 2배로 희석된 일련의 항생제 희석액에 의해 측정하였다. 활성 배양 브로쓰 배양물은 멸균 브로쓰에서, 또는 직접형 콜로니 현탁액(S. 뉴모니애)에 의해 McFarland 0.5 표준(1 x 108 CFU/ml)과 등가인 혼탁도로 조정한 후, 대략 5 x 105 CFU/ml의 멸균 96웰 미량적정 플레이트에서 최종 접종물을 위해 멸균 브로쓰에서 추가로 희석시켰다. 기준 대조군 균주로서 포함된 엔테로코커스 패칼리스 ATCC 29212와, 정성 대조군에 대한 기준 항생제로서 반코마이신을 사용하여 본 검정법을 이중으로 실시하였다. 플레이트를 18 - 20시간 동안 37℃에서 진탕시키면서 호기성 조건하에 인큐베이션하였으며, MIC는 가시적 성장을 일으키지 않는 약물의 최소 농도로서 정의된다.
클로스트리듐
디피실리
C. 디피실리에 대한 최소 억제 농도(MIC)를 측정하고, 호기성 박테리아용의 NCCLS 항미생물제 저장액을 제조하고, NCCLS 기준 아가 희석 브로쓰 방법(M11-A5, 2001)에 따라 저장하였다. 윌켄스-찰그렌 아가(WCA: Wilkens-Chalgren agar)에서 2배 희석된 일련된 항생제 희석액을 제조하였다. 48시간 동안 브라지에르(Braziers)(C.C.E.Y.) 아가에서 배양된 성장물로부터 시험 유기체을 선별하고, McFarland 0.5 표준(1 x 108 CFU/ml)과 등가인 밀도로 쇠들러(Schaedler) 브로쓰에서 계대배양하고, WCA 플레이트 상의 최종 접종물은 대략 105 CFU/스폿이었다. 박테로이데스 프라질리스(Bacteroides fragilis) ATCC 25285는 기준 대조군 균주로서 포함되었고, 메트로니다졸은 정성 대조군에 대한 기준 항생제로서 사용되었다. 모든 조작은, 단지 산소에만 잠시 노출시킴으로써 미리 환원된 배지에서 주변 대기하에 이중으로 실시하였다. 플레이트를 48시간 동안 37℃에서 혐기성 조건하에 인큐 베이션하였으며, MIC는 혐기성 조건하의 대조군 플레이트 상에서의 성장과 비교하여 시험 플레이트 상에서의 성장이 외관상 현저히 감소된 약물의 농도로서 정의된다.
프로피오니박테리움
아크네스
푸라졸리돈(1-2㎍/ml)으로 보충된 웰켄스-찰그렌 아가(WCA)에서 3-7일간 배양된 성장물로부터 시험 유기체을 선별하였다. 직접형 콜로니 현탁액에 의해 P. 아크네스의 단일 콜로니를 새로운 웰켄스-찰그렌 브로쓰(WCB)에 접종하고, McFarland 0.5 표준(1 x 108 CFU/ml)에 등가인 밀도로 조정한 후, 대략 105 CFU/ml의 멸균 96웰 미량적정 플레이트에서 최종 접종물을 위해 멸균 브로쓰에서 추가로 희석시켰다. NCCLS 표준(M11-A5, 2001)에 따라 제조된 저장액을 포함하는 멸균수중에서 2배 희석되는 일련의 항생제 희석을 실시하고, 저장하였다. 정성 대조군에 대한 기준 항생제로서 반코마이신 및 클린다마이신을 사용하여 본 검정법을 이중으로 실시하였다. 플레이트를 48-72시간 동안 37℃에서 혐기성 조건하에 인큐베이션하였으며, MIC는 혐기성 조건하의 대조군 플레이트 상에서의 성장과 비교하여 시험 플레이트 상에서의 성장이 외관상 현저히 감소된 약물의 농도로서 정의된다. 모든 조작은, 단지 산소에만 잠시 노출시킴으로써 미리 환원된 배지에서 주변 대기하에 이중으로 실시하였다.
배양 배지를 50㎍/ml(여기서, 50㎍/ml 보다 높은 농도는 표시한다)의 칼슘 이온(염화칼슘과 같은 것)으로 보충하였다. 하기에 MIC 값(㎍/ml)을 나타낸다:
표 6. 엔테로코커스, 스트렙토코커스 및 스타필로코커스에 대한 MIC 값
표 7. 후시딘산 내성 스타필로코커스 아우레우스에 대한 MIC 값
표 8. 무피로신 내성 스타필로코커스 아우레우스에 대한 MIC 값
표 9. 프로피오니박테리움 아크네스에 대한 MIC 값
표 10. C.
디피실리에
대한
MIC
값
표 11. C.
디피실리에
대한
MIC
값
재료 및 방법
실시예 2-7에 사용된 재료 및 방법은 하기와 같다:
배지
모든 완충액, 용액, 및 배지는 역삼투압수((RO: reverse osmosis) water)를 사용하여 구성되었고, 이는 1ℓ당 하기 성분들을 함유하였다:
생물검정법
마이크로코커스 루테우스를 냉동 저장액으로부터 10ml의 뮐러-힌톤 브로쓰로 접종하고, 200rpm에서 진탕시키면서 30℃에서 밤새도록 배양하였다. 1ml의 상기 배양물을 사용하여 300ml의 뮐러-힌톤 아가에 접종하고, 이어서, 이를 페트리 디쉬에 부었다. 콜크 보어러(cork-borer)를 사용하여, 동일한 간격으로 거리를 두고 배치된 웰(직경 6mm)을 제작한 후, 50㎕의 각 샘플을 로딩하였다. 로딩된 샘플이 확산될 때까지 생물검정법 플레이트를 층상 공기류(laminar air flow)에 두었는데, 상기 로딩된 샘플이 확산되는 시점에 플레이트를 30℃의 인큐베이터로 옮기고 밤새도록 방치해 두었다.
엔도뉴클라제 제한 분해
공급받은 완충액에서, 제조사의 가이드라인에 따라 제한 효소로 DNA를 분해하였다. 전형적으로, 분취용 분해물를 위해 5㎍의 DNA를 권고된 온도하에 3시간 동안 12 단위의 효소를 사용하여 분해시켰다. 분석용 분해물을 위해 0.5㎍의 DNA를 권고된 온도하에 2-3시간 동안 다시 2 단위의 효소를 사용하여 분해시켰다. 분해된 DNA를 아가로스 겔 전기영동에 의해 분석하였다.
외부 접합체
계대배양
패치된 외부 접합체의 아가 플러그를 사용하여 8ml TSB 및 2개의 유리 비드를 함유하는 50ml 플라스크에 접종하였다. 배양물을 10일 동안 30℃, 250rpm에서 접종한 후, 100㎕를 수거하고, 2개의 유리 비드를 함유하는 50ml 플라스크중 10ml TSB에 가하였다. 플라스크를 2일 동안 인큐베이션한 후, 1ml를 수거하고, 이를 사용하여 10ml TSB를 함유하는 50ml 플라스크에 접종하였다. 1ml의 접종물을 사용하여 총 6회의 연속 배양을 수행하였는데, 각각은 2일 동안 30℃, 250rpm에서 인큐베이션되었다. 6회째의 계대배양으로부터 얻은 세포를 20분 동안 4000rpm에서 원심분리(Heraeus Sepatech Megafuge)하여 펠릿화시킨 후, TSB에서 30초간 초음파 처리하여(MSE Sanyo Soniprep 150, 진폭 10-15 마이크론) 균사체를 파쇄시켰다. 초음파 처리된 세포의 일련의 희석액(TSB중 10-1 내지 10-5)을 배지 65에 플레이팅하고, 30℃에서 인큐베이션하였다.
이종성 발현을 위한 발효
아가 플러그 또는 250㎕의 -80℃ 글리세롤 스톡을 사용하여 각각 2개의 유리 비드, 및 8ml TSB 또는 날리딕스산으로 보충된 AAS1 매질, 및 적절한 선택 항생제를 함유하는 50ml 삼각 플라스크에 접종하였다. 2-4일 동안 30℃, 200rpm에서 인큐베이션한 후, 시드 배양물당 1.2ml(3%)를 사용하여 2개의 유리 비드를 함유하는 50ml 삼각 플라스크중 40ml의 각 생산 매질에 접종하였다. 이들 배양물을 9일 동안 30℃, 200rpm에서 인큐베이션하였다. 생물검정법 및/또는 HPLC-MS 분석에 의한 분석을 위해 각 배양물로부터 주기적으로 1.5ml의 전체 브로쓰 분취량을 수거하였다.
데옥시-액타가르딘 B의 단리를 위한 악티노플레인스 리구리애 발효
각각 2개의 유리 비드 및 50ml SV2 매질을 함유하는 250ml 삼각 플라스크에 글리세롤 스톡으로부터의 500㎕(1%)의 악티노플레인스 리구리애 세포를 접종하였다. 4일 동안 30℃, 250rpm에서 인큐베이션한 후, 시드 배양물당 12ml(3%)를 사용하여 2L 삼각 플라스크중 400ml의 GM3에 접종하였다. 이들 배양물을 9일 동안 30℃, 200rpm에서 인큐베이션하였다. 30분 동안 4000rpm(Heraeus Sepatech Megafuge)에서 원심분리하여 배양 브로쓰를 수확한 후, 세포 펠릿으로부터 상등액을 버렸다.
액타가르딘 및
Ala
(O)-
액타가르딘의
단리를 위한 악티노플레인스 가르
바디넨시스
발효
각각 2개의 유리 비드 및 50ml AAS 매질을 함유하는 250ml 삼각 플라스크에 글리세롤 스톡으로부터의 500㎕(1%)의 악티노플레인스 가르바디넨시스 세포를 접종하였다. 9일 동안 30℃, 250rpm에서 인큐베이션한 후, 시드 배양물당 12ml(3%)를 사용하여 2L 삼각 플라스크중 400ml의 AAS에 접종하였다. 이들 배양물을 8일 동안 30℃, 200rpm에서 인큐베이션하였다. 30분 동안 4000rpm(Heraeus Sepatech Megafuge)에서 원심분리하여 배양 브로쓰를 수확한 후, 세포 펠릿으로부터 상등액을 버렸다.
MIC 연구를 위한
데옥시
-
액타가르딘
단리
디아이온(Diaion) HP-20 수지(50 g/L)을 가하고, 악티노플레인스 리구리애의 발효물로부터 단리된 상등액과 혼합하고, 밤새도록 4℃에 방치하였다. 현탁액을 본드 엘루트 칼럼(60ml)으로 분취하고, 수지를 4개의 상(bed) 용량의 물, 이어서, 3개의 상 용량의 25, 50, 75 및 100% 메탄올로 순차적으로 세척하였다. HPLC 분석을 통해 50, 75 및 100% 메탄올 분획내 데옥시-액타가르딘 B가 존재한다는 것을 확인하게 되었다. 이들 분획을 조합한 후, 출발 풀 용량의 대략 ¼로 농축시켰다. 2 칼럼 용량의 100% 메탄올로 세척한 후, 이어서 2 칼럼 용량의 물로 세척함으로써 미리 조절한 2개의 C18 본드 엘루트 칼럼(5g) 상에 1L의 브로쓰로부터의 농축액을 로딩하였다. 2 칼럼 용량의 50, 60, 70, 80, 90% 메탄올에 이어, 2 칼럼 용량의 100% 메탄올을 사용하여 순차적으로 칼럼을 용리시켰다. HPLC 분석을 통해 80, 90 및 100% 메탄올 분획내 데옥시-액타가르딘 B가 존재한다는 것을 확인하게 되었고, 이들 분획을 모아, 출발 용량의 ⅓로 농축시켰다. 50% 메탄올중 동량의 40mM 인산칼륨(pH 2.5)을 가한 후, 3개의 미리 조절된 SCX 본드 엘루트 칼럼(1g) 상에 고르게 로딩하였다. SCX 칼럼을 먼저 50% 메탄올중 40mM 인산칼륨(pH 2.5)으로 세척한 후, 1.5 칼럼 용량의, 50% 메탄올중 250mM 인산칼륨(pH 7.0)을 사용하여 용리시켰다. 2 칼럼 용량의 메탄올에 이어서, 2 칼럼 용량의 물로 미리 조절된 C18 본드 엘루트 칼럼(5 g) 상에 로딩하여 용리제를 탈염시켰다. 칼럼을 2 칼럼 용량의 50%에 이어 60% 메탄올로 세척하였다. 2 칼럼 용량의 각 70, 80, 90 및 100% 메탄올을 가한 후, 데옥시-액타가르딘 B를 용리시켰다. HPLC및 LC-MS 분석에 의해 확인한 바와 같은, 정제된 데옥시-액타가르딘 B를 함유하는 분획을 모아 증발건조시켰다.
악티노플레인스 리구리애의 발효물로부터 Ala(0)-데옥시액타가르딘 B의 단리
디아이온 HP-20 수지(50 g/L)를 4ℓ의 A.리구리애의 발효물로부터 얻은 상등액을 혼합하고, 밤새도록 4℃에 방치하였다. 상등액을 유리 소결 깔때기 내로 수집하고, 수지를 4개의 상 용량의 물, 이어서, 4개의 상 용량의 50% 메탄올로 순차적으로 세척하였다. 5개의 상 용량의 100% 메탄올로 세척하여 데옥시-액타가르딘 B 및 Ala(0)-데옥시액타가르딘 B를 수지로부터 용리시켰다. 100% 메탄올 분획을 원 용량의 ⅓로 농축시킨 후, 최종 농도가 60% 메탄올이 될 때까지 물을 가하여 희석시켰다. 2 칼럼 용량의 50% 메탄올로 세척하기 전에, 4개의 10g C18 본드 엘루트 칼럼 상에 생성된 용액을 로딩하였다. 2 칼럼 용량의 메탄올/0.5% 포름산을 사용한 칼럼으로부터 데옥시-액타가르딘 B-관련 성분이 용리되었다. 40ml까지 증발시켜 생성된 용리제를 농축시키고, 하기 표에 기술된 조건을 사용하여 분취용 HPLC에 의해 데옥시-액타가르딘 B로부터 Ala(0)-데옥시-액타가르딘 B를 분리하였다.
칼럼 | 캐피톨 HPLC 리미티드(Capitol HPLC Ltd) C18 - BDS - HL5 - 26052 15cm x 20mm |
용매 A | 20mM 인산칼륨(pH 5.0)중 30% ACN |
용매 B | 20mM 인산칼륨(pH 5.0)중 65% ACN |
검출 | 210nm |
유속 | 10ml/분 |
시간(T) = 0분 | 100% A |
T = 1분 | 100% A |
T = 29분 | 35% B |
T = 30분 | 100% B |
T = 33분 | 100% B |
T = 34분 | 100% A |
T = 35분 | 100% A |
수집 | 출발 10분; 종결 30분; 0.5 또는 0.25분 분획 |
Ala(0)-데옥시-액타가르딘 B를 함유하는 분획(HPLC 및 LC-MS 분석에 의해 확인)은 상기 기술된 바와 같은 C18 본드 엘루트 칼럼을 사용하여 탈염시킨 후, 증발건조시켰다.
Ala(0)-데옥시-액타가르딘 B는 체류 시간 = 5.04분으로 칼럼으로부터 용리되었다. MS 분석을 통해 972.2 m/z (M+2H)+2인 종을 확인하였다.
MIC 연구를 위한 액타가르딘 및
Ala
(O)-
액타가르딘의
단리
악티노플레인스 리구리애로부터의 데옥시-액타가르딘 B 정제에 대하여 기술된 방법을 사용하여 액타가르딘 및 Ala(0)-액타가르딘을 정제하였지만, 단, 예외적으로, SCX 본드 엘루트 단계 후에 Ala(0)액타가르딘 및 액타가르딘을 분할하기 위해서는 분취용 HPLC가 필요하였다. SCX 본드 엘루트 칼럼으로부터 얻은 용리제를 70 내지 18ml로부터 회전식 증발에 의해 농축시키고, 생성된 농축물은 표 4에 기술된 조건을 사용하여 분취용 HPLC에 의해 정제하였다. 액타가르딘 및 Ala(0)액타가르딘을 함유하는 각각의 분획(HPLC 및 LC-MS 분석에 의해 확인)은 상기 기술된 바 와 같은 C18 본드 엘루트 칼럼을 사용하여 탈염시킨 후, 증발건조시켰다.
표 4. 액타가르딘 및 Ala(0)액타가르딘을 분리하기 위한
분취용
HPLC
조건
칼럼 | 캐피톨 HPLC 리미티드 C18 - BDS - HL5 - 26052 15cm x 20mm |
용매 A | 20mM 인산칼륨(pH 7.0)중 30% 아세토니트릴 |
용매 B | 20mM 인산칼륨(pH 7.0)중 65% 아세토니트릴 |
검출 | 268nm |
유속 | 10ml/분 |
시간(T) = 0분 | 100% A |
T = 1분 | 100% A |
T = 19분 | 25% B |
T = 20분 | 100% B |
T = 25분 | 100% B |
T = 26분 | 100% A |
T = 30분 | 100% A |
수집 | 출발 8분; 종결 20분; 1분 분획 |
아가로스 겔 전기영동
문헌 [Sambrook et al., 1989]에 기재되어 있는 바와 같이 DNA의 전기영동을 수행하였다. UV 광에 의해 DNA를 시각화할 수 있도록 최종 농도로 0.1㎍/ml의 에티듐 브로마이드를 함유하는 TAE 완충액에서 아가로스 겔(0.7-1%)을 제조하였다. 0.1 용량의, 10 x 아가로스 겔 로딩 용액을 샘플과 혼합하였다. 샘플을 100bp, 1 kb, 또는 람다 DNA-HindIII 분해 래더(NEB)를 따라 겔 상에 로딩하고, 1-5V/cm로 전개시켰다. 겔을 λ = 300nm에서 시각화하고, UVP 비디오 카메라를 사용하여 사진촬영하였다.
아가로스 겔로부터의 DNA 회수
아가로스 겔로부터 DNA를 절단하고, 퀴아퀵(Qiaquick) 겔 추출용 키트(Qiagen)를 사용하여 회수하고, 멸균 역 삼투압 정제수, 트리스-HCl(10mM, pH 8.5) 또는 TE 완충액에서 용리시켰다.
말단 충전
제한 효소를 사용하여 DNA를 분해함으로써 형성된 3' 말단의 오목부를 충전시키는 것은 E. 콜라이 DNA 중합효소 클레노우 단편을 사용하여 수행되었다. 전형적인 반응에서, 250μM의 각 dNTP와 함께 1㎍ DNA당 1단위의 효소를 가하였다. 15-30분 동안 25℃에서 반응물을 인큐베이션하고, 최종 농도 10mM로 EDTA를 가하여 반응을 종결시켰다.
DNA 인산화
문헌 [Sambrook et al., 1989]에 기재된 방법에 따라 37℃에서 30분 동안 PCR 산물을 T4 폴리뉴클레오티드 키나제로 처리하였다. 20분 동안 65℃에서 인큐베이션하여 효소를 불활성화시켰다.
선형화된 벡터의 탈인산화
선형화된 벡터의 자가 결찰을 막기 위하여 제조사의 가이드라인에 따라 새우 알칼리성 포스파타제(SAP: shrimp alkaline phosphatase)를 사용하여 5'-인산염 기를 제거하였다. 전형적인 반응에서, DNA 제한 반응의 마지막 1시간 동안 제한 혼합물에 1단위의 SAP를 가하였다. 20분 동안 65℃에서 인큐베이션하여 효소를 불활성화시켰다.
결찰
문헌 [Sambrook et al., (1989)]에 기재되어 있는 바와 같이, 총 용량 15㎕중 1단위(U)의 T4 DNA 리가제를 사용하고, 16℃에서 12-16h 동안 인큐베이션하여 DNA 결찰을 실시하였다.
박테리아 배양물 유지
최종 농도 10%로 글리세롤과 함께 -80℃에서 0.5ml의 각 배양물을 냉동시켜 생육성 세포를 글리세롤 현탁액으로서 저장하였다. 배지 65 또는 ABB13 플레이트 상의 글리세롤 스톡 또는 발효 브로쓰로부터 50㎕를 스트리킹(streaking)하여 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애의 단일 콜로니를 수득하였다.
중합효소 연쇄 반응
스트라타진 로보사이클러 그라디언트96(Stratagene Robocycler Gradient96) 상에서 중합효소 연쇄 반응(PCR: polymerase chain reaction)을 실시하였다. 전형적인 반응으로, 100-200ng 주형 DNA를 20pmol의 각각의 올리고뉴클레오티드 프라이머와 각 250μM의 dNTP와 혼합하였다. 호열성 DNA 중합효소 완충액은 제조사로부터 공급받았고, DMSO는 각 10% (v/v)의, 최종 용량 50 또는 100㎕의 반응 혼합물로 구성되었다. 1분간 변성(94℃), 1분, Y℃(어닐링) 및 30초 - 3분 신장 (72℃)의 초기 싸이클로 전형적인 반응을 시작하였는데, 이 시점에서 5 단위의 호열성 DNA 중합효소를 가하였다. 이어서, 1분간 94℃, 1분간 Y℃(어닐링) 및 X분 동안 72℃에서 30 싸이클, 및 2X분 동안 72℃에서 최종 싸이클이 수행되었다. 신장 시간 X는, Taq 중합효소가 사용될 경우, 산물 1kb당 1분이었고, Pfu 중합효소가 사용될 경우, 산물 1kb당 2분이었다. 어닐링 온도 Y는 pAGvar1 및 pAGvar2 생성시 각각 55℃ 및 49℃였다. SBdel-1 및 SBdel-2 생성된 사용된 조건은 리디렉트 프로토콜(문헌 [Gust et al., 2004])에 기재되어 있는 바와 같았다.
프라이머
플라스미드
DNA
제조
적절한 항생제를 함유하는 5ml의 멸균 2TY 또는 LB에 2TY(또는 LA) 아가 플레이트로부터 채취된 단일 콜로니를 접종하여 플라스미드 DNA를 소규모로(20㎍ 미만의 시료) 제조하였다. 배양물을 37℃, 250rpm에서 밤새도록 (12-16 h) 인큐베이션하였다. 1분 동안 12,000 x g에서 원심분리하여 세포를 수집하고, 제조사의 가이드라인에 따라 위저드(Wizard)(Promega) 미니프렙(Miniprep) 키트를 사용하여 플라스미드 DNA를 수득하였다. 100㎍ 이하의, 보다 큰 플라스미드 DNA 시료의 경우, 30ml의 2TY 배양물을 배양하고, 제조사의 설명서에 따라 퀴아젠 미디-프렙 키트(Qiagen Midi-prep kit)를 사용하여 플라스미드 DNA를 추출하였다. 모든 플라스미드는 제한 분석 및/또는 서열 분석의 조합에 의해 체크하였다.
코스미드
DNA
제조
적절한 항생제를 함유하는 50ml의 멸균 2TY 또는 LB에 2TY(또는 LA) 아가 플 레이트로부터 채취된 단일 콜로니를 접종하여 코스미드 DNA를 제조하였다. 배양물을 37℃, 250rpm에서 밤새도록 (12-16h) 인큐베이션하였다. 20분 동안 4,000rpm (Heraeus sepatech Megafuge 2.0R)에서 원심분리하여 세포를 수집하고, 제조사의 가이드라인에 따라 퀴아젠 미디-프렙을 사용하여 코스미드 DNA를 단리하였다.
전기적격 E.
콜라이
세포의 제조 및 형질전환
문헌 [Dower et al.. (1988)]의 방법에 의해 전기적격 E. 콜라이 DH10B를 제조하였다. 분취량(60㎕)의 적격 세포를 얼음 상에서 해동시키고, 1.8㎕의 결찰 혼합물 또는 플라스미드 DNA를 가하였다. 혼합물을 전기천공 큐베트(Sigma 0.1cm)에 놓고, 전기천공 장치(Stratagene 천공 장치-1000)로 옮겨 놓았다. 1.8kV/mm (25 μF, 200 Ω)의 전위차를 가하고, 이어서, 0.5ml의 2TY 또는 LB 배지를 가하였다. 이어서, 세포를 45-60분 동안 37℃에서 인큐베이션하여 항생제 내성 유전자을 발현시키고, 이후, 적절한 선택성 배지 상에 플레이팅하였다.
게놈 DNA 제조
문헌 [Kieser et al., 2000]에 기재되어 있는 방법을 사용하여 게놈 DNA 주형을 제조하였다.
악티노플레인스 종을 위한 접합 방법
문헌 [Heinzelmann et al. (2003)]에 기재된 방법에 따라 E. 콜라이와 악티노플레인스 종 사이의 유전자간 접합을 실시하였는데, 단, 예외적으로, 균주 E. 콜라이 ET12567/pUB307(문헌 [Flett et al., 1997]) 대신 균주 E. 콜라이 ET12567/pUB8002(문헌 [Kieser et al., 2000])가 사용되었다. 50㎍/ml 날리딕스산 및 관련된 선택성 항생제를 함유하는 배지 65 또는 ABB13 상에서 대략 1㎠의 면적에 걸쳐 외부 접합체를 옮기고, 패치 아웃하였다. 이들 플레이트를 4-7일 동안 30℃에서 인큐베이션한 후, 브로쓰 배양용 접종물로서 사용하였다.
스트렙토마이세스 종을 위한 접합 방법
문헌 [Kieser et al., 2000]에 기재되어 있는 방법에 따라 E. 콜라이와 스트렙토마이세스 종 사이의 유전자간 접합을 실시하였다. 50㎍/ml 날리딕스산 및 관련된 선택성 항생제를 함유하는 SFM 상에서 대략 1㎠의 면적에 걸쳐 외부 접합체를 옮기고, 패치 아웃하였다. 이들 플레이트를 4-7일 동안 30℃에서 인큐베이션한 후, 브로쓰 배양용 접종물로서 사용하였다.
표 5. 박테리아 균주
명칭 | 설명/용도 |
악티노플레인스 가르바디넨시스 ATCC31049 |
액타가르딘 생산을 위한 생합성 유전자 클러스터의 단리 |
악티노플레인스 가르바디넨시스 Δ | actA 유전자가 제거된 악티노플레인스 가르바디넨시스 ATCC31049 |
actA | 변이체 actA 유전자의 발현 |
악티노플레인스 리구리애 NCIMB 41362 |
데옥시-액타가르딘 B. 생산을 위한 생합성 유전자 클러스터의 단리 변이체 ligA 유전자의 발현 |
에스케리키아 콜라이 XL1-Blue MR |
코스미드 라이브러리의 생성 |
에스케리키아 콜라이 DH10B |
통상적인 클로닝 |
에스케리키아 콜라이 ET12567 |
비메틸화된 DNA의 단리 |
에스케리키아 콜라이 ET12567/pUZ8002 |
접합을 통한 DNA의 유전자간 전달 |
에스케리키아 콜라이 BW25115/pIJ790 |
람다 레드 재조합 플라스미드 pIJ790을 함유하는 균주. FLP 인식 부위 측면에 위치하는 카세트의 표적화된 재조합을 촉진시킨다. |
에스케리키아 콜라이 DH5α/BT340 |
파쇄 카세트의 FLP-매개 절단을 촉진시키는 플라스미드 BT340을 함유하는 균주 |
마이크로코커스 루테우스 ATCC4698 |
생물검정법 시험 유기체 |
스트렙토마이세스 리비단스 1326 |
이종성 발현을 위한 숙주 유기체 |
스트렙토마이세스 코엘리컬러 B757 |
이종성 발현을 위한 숙주 유기체 |
스트렙토마이세스 신나모뉴스 DSM 40005 |
이종성 발현을 위한 숙주 유기체 |
항생제
항생제 저장액을 물에서 제조하고(달리 언급되지 않는 한), 0.22μm 밀리포어(Millipore) 필터를 통과시켜 필터를 멸균시켰다. 에탄올에 용해된 용액은 멸균시키지 않았다(문헌 [Sambrook et al., 1989]). 모든 항생제를 -20℃에서 저장하였다. 아프라마이신가 사용되는 배지에서는 MgCl2를 10mM(2.5M의 스톡으로부터)의 최종 농도로 가하였다.
저장액 실험 농도
앰피실린(amp: Ampicillin) 100mg/ml 100㎍/ml
아프라마이신(apra: apramycin) 100mg/ml 50㎍/ml
카르베니실린(car: Carbenicillin) 100mg/ml 100㎍/ml
클로람페니콜(cm: Chloramphenicol) 에탄올중 25mg/ml 25㎍/ml
카나마이신(kan: Kanamycin) 50mg/ml 50㎍/ml
날리딕스산(na: Nalidixic acid) 25mg/ml 25㎍/ml
카세트
명칭 |
크기
(bp) |
공급원 | 설명/용도 |
SBdel-1 | 1462 | 프라이머 O/SB50F 및 O/SB51R, 및 주형으로서 pIJ773을 사용한 PCR | 전달 기점(oriT) 및 FLP 인식 표적 부위 측면에 위치하는 아프라마이신 내성 유전자 함유. 5' 및 3' 부위는 악티노플레인스 가르바디넨시스로부터의 actA 유전자 측면에 위치하는 DAN와 상동성이다. |
SBdel-2 | 1462 | 프라이머 O/SB52F 및 O/SB53R, 및 주형으로서 pIJ773을 사용한 PCR | 전달 기점(oriT) 및 FLP 인식 표적 부위 측면에 위치하는 아프라마이신 내성 유전자 함유. 5' 및 3' 부위는 SuperCos1로부터의 앰피실린 내성 유전자 측면에 위치하는 DAN와 상동성이다. |
HEapra | 5247 | pMJCOS1 | pMJCOS1로부터 단리된 SspI 단편. 카세트는 아프라마이신 내성 유전자, 전달 기점(oriT), 부착 부위(attP) 및 φC31 인테그라제로 구성된다. |
벡터
명칭 |
크기
(kb) |
내성 마커 | 공급원 | 설명/용도 |
pAGvar1 | 3.1 | amp | 본 연구 | 프라이머 O/AGvar01bF 및 O/AGvar02bR, 및 SmaI를 사용하여 앞서 분해된 pUC19로 클로닝된 주형 pLITAG01을 사용하여 생성된 449bp PCR 단편 |
pAGvar2 | 2.8 | amp | 본 연구 | 프라이머 O/AGvar05F 및 O/AGvar06R, 및 SmaI를 사용하여 앞서 분해된 pUC19로 클로닝된 주형 pLITAG01을 사용하여 생성된 91bp PCR 단편. |
명칭 |
크기
( kb ) |
내성 마커 | 공급원 | 설명/용도 |
pAGvar3 | 3.2 | amp | 본 연구 | XbaI를 사용하여 앞서 분해된 pAGvar2로 클로닝된 XbaI 단편(~450bp) |
pAGvar4 | 3.3 | amp | 본 연구 | BglII 및 AvrII를 사용하여 앞서 분해된 pAGvar3에 결찰된, 어닐링된 올리고뉴클레오티드 O/AGvar03F, O/AGvar04R |
pAGvarX | 6.3 | apra | 본 연구 | EcoRI/XbaI를 사용하여 앞서 분해된 pSET152에 결찰된 pAGvar4로부터의 XbaI-EcoRI 단편(~650bp). 변이체 액타가르딘 유전자는 조립될 수 있고, 부착 부위 attP를 통해 숙주 염색체 내로 도입될 수 있다. |
CosAL02 | 47.2 | amp 및 neo. | 본 연구 | BamHI를 사용하여 앞서 분해된 SuperCos1로 클로닝된 악티노플레인스 리구리애로부터의 40402 bp Sau3AI DNA 단편 |
CosAL02HEapra | 49.1 | amp 및 apra. |
본 연구 | 네오마이신을 코딩하는 유전자가 HEapra 카세트로 대체된 CosAL02 |
CosAG14 | 45 | amp 및 neo |
본 연구 | BamHI를 사용하여 앞서 분해된 SuperCos1로 클로닝된 악티노플레인스 가르바디넨시스로부터의 38168 bp Sau3AI DNA 단편 |
CosAG14ΔA | 46.3 | amp, neo 및 ampra |
본 연구 | actA 유전자가 카세트 SBdel-1로 대체된 CosAG14 |
CosAG14ΔB | 44.9 | amp 및 neo |
본 연구 | 카세트 SBdel-1이 FLP-리컴비나제에 의해 제거되어 81bp의 스카(scar)가 남아있는 CosAG14ΔA |
CosAG14ΔC | 45.5 | neo 및 apra |
본 연구 | 앰피실린 내성 유전자가 카세트 SBdel-2로 대체된 CosAG14ΔB |
CosAG14HEapr | 46.9 | amp 및 apra |
본 연구 | 네오마이신을 코딩하는 유전자가 HEapra 카세트로 대체된 CosAG14 |
pIJ773 | 4.3 | amp 및 apra |
노리치에 소재하는 존인스센터(John Innes Centre) (JIC) |
카세트 SBdel-1 및 SBdel-2를 생성하는데 사용되는 리디렉트 주형(문헌 [Gust et al., 2003]) |
pLITAG01 | 6.1 | amp | 본 연구 | NcoI를 사용하여 앞서 분해된 pLITMUS28로 클로닝된, 악티노플레인스 가르바디넨시스로부터 단리된 3263bp NcoI 단편(19955-23217 CosAG14rc) |
pLITMUS28 | 2.8 | amp | 뉴잉글랜드 바이오랩스 (NEB: New England BioLabs) |
통상의 클로닝 |
pMJCOS1 | 9.8 | amp 및 apra | 노리치에 소재하는 JIC | 네오마이신을 코딩하는 유전자가 아프라마이신 내성 유전자, oriT, attP 및 øC31 인테그라제로 구성된 SspI 단편으로 대체된 SuperCos1. HEapra 카세트 공급원 |
pSET152 | 5.7 | apra | NRRL B14792 |
attP 부위를 통한 숙주 염색체 내로의 DNA 도입을 촉진시킬 수 있는 접합 플라스미드 |
SuperCos1 | 7.9 | amp 및 neo | 스트라진 | 독특한 클로닝 부위 측면에 위치하는 T3 및 T7 프로모터 영역 |
pUC19 |
2.7 | amp | NEB | 통상의 클로닝 |
고성능 액체 크로마토그래피
하기 기술하는 파라미터와 함께 휴렛 팩커드(Hewlett Packard) 1050 시리즈 HPLC 시스템을 사용하여 HPLC 분석을 실시하였다:
칼럼: 조박스(Zorbax) SB-C18, 4.6x150 mm, 5μ
이동상 A: 20mM 인산칼륨 완충액(pH 7)중 30% 아세토니트릴
이동상 B: 20mM 인산칼륨 완충액(pH 7)중 65% 아세토니트릴
유속: 1ml/분
구배: 시간 0분 100% A 0% B
시간 10분 0% A 100% B
시간 11분 0% A 100% B
시간 11.2분 100% A 0% B
주기 시간 15분
주입량: 10㎕
검출: 210nm
고성능 액체 크로마토그래피 - 질량 분광법(
HPLC
-
MS
)
하기 기술하는 파라미터와 함께, 마이크로매스 플랫폼 LC(Micromass Platform LC)(MassLynx 버전 3.5 소프트웨어로 작동)에 연결된 휴렛 팩커드(Hewlett Packard) 1050 시리즈 HPLC 시스템을 사용하여 HPLC 분석을 실시하였 다:
칼럼: 애질런트(Agilent) 조박스 SB-C18 150 x 4.6mm 5μ
유속: 1ml/분
이동상: A 10% 아세토니트릴, 0.1% 포름산, 90% 물.
B 90% 아세토니트릴, 0.1% 포름산, 90% 물.
10분간의 선형 구배 A 내지 B, 체류 시간 1분, B-A
파장: 200-400nm
주입량: 10㎕
포스트 칼럼 스플릿트: 1:10
질량 분광계: 마이크로매스 플랫폼(Micromass Platform) LC
모드: 전기분무 양성
질소 유속: 380l/hr
모세관 전압: 40V
스키머 렌즈 오프세트(Skimmer lens offset): 5V
기탁
노박타 바이오시스템스 리미티드(Novacta Biosystems Limited)는 부다페스트 조약 하에 2005년 12월 7일자로 영국 에이비21 9와이에이 스코틀랜드 애버딘에 소재하는 NCIMB 리미티드(NCIMB Ltd.)에 NCIMB 41362를 기탁하였다.
참고 문헌
SEQUENCE LISTING
<110> Novacta Biosystems Limited
Boakes, Steven
Cortes Bargallo, Jesus
Dawson, Michael J
<120> Lantibiotic Biosynthetic Gene Clusters from A. garbadinensis and
A. liguriae
<130> AHBCP6415491
<140> PCT/GB2007/000138
<141> 2007-01-17
<150> GB 0600928.6
<151> 2006-01-17
<160> 318
<170> PatentIn version 3.3
<210> 1
<211> 19
<212> PRT
<213> Actinoplanes liguriae
<400> 1
Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu Val
1 5 10 15
Cys Ala Cys
<210> 2
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primary polypeptide sequence of Actagardine B
variant V V
<400> 2
Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val Val
1 5 10 15
Cys Ala Cys
<210> 3
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primary polypeptide sequence of Actagardine B
variant L I
<400> 3
Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu Ile
1 5 10 15
Cys Ala Cys
<210> 4
<211> 19
<212> PRT
<213> Actinoplanes garbadinensis
<400> 4
Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val Ile
1 5 10 15
Cys Ala Cys
<210> 5
<400> 5
000
<210> 6
<400> 6
000
<210> 7
<400> 7
000
<210> 8
<400> 8
000
<210> 9
<400> 9
000
<210> 10
<400> 10
000
<210> 11
<211> 20
<212> PRT
<213> Actinoplanes liguriae
<400> 11
Ala Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu
1 5 10 15
Val Cys Ala Cys
20
<210> 12
<211> 20
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primary polypeptide sequence of
Ala-Actagardine B variant V V
<400> 12
Ala Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val
1 5 10 15
Val Cys Ala Cys
20
<210> 13
<211> 20
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primary polypeptide sequence of Actagardine B
variant L I
<400> 13
Ala Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu
1 5 10 15
Ile Cys Ala Cys
20
<210> 14
<211> 20
<212> PRT
<213> Actinoplanes garbadinensis
<400> 14
Ala Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val
1 5 10 15
Ile Cys Ala Cys
20
<210> 15
<400> 15
000
<210> 16
<400> 16
000
<210> 17
<400> 17
000
<210> 18
<400> 18
000
<210> 19
<400> 19
000
<210> 20
<400> 20
000
<210> 21
<400> 21
000
<210> 22
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primary polypeptide sequence of
pre-pro-Actagardine B variant V V
<400> 22
Met Ser Ala Ile Thr Val Glu Thr Thr Trp Lys Asn Thr Asp Leu Arg
1 5 10 15
Glu Asp Leu Thr Ala His Pro Ala Gly Leu Gly Phe Gly Glu Leu Ser
20 25 30
Phe Glu Asp Leu Arg Glu Asp Arg Thr Ile Tyr Ala Ala Ser Ser Gly
35 40 45
Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val Val Cys Ala Cys
50 55 60
<210> 23
<211> 64
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primary polypeptide sequence of
pre-pro-Actagardine B variant L I
<400> 23
Met Ser Ala Leu Ala Ile Glu Lys Ser Trp Lys Asp Val Asp Leu Arg
1 5 10 15
Asp Gly Ala Thr Ser His Pro Ala Gly Leu Gly Phe Gly Glu Leu Thr
20 25 30
Phe Glu Asp Leu Arg Glu Asp Arg Thr Ile Tyr Ala Ala Ser Ser Gly
35 40 45
Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu Ile Cys Ala Cys
50 55 60
<210> 24
<400> 24
000
<210> 25
<400> 25
000
<210> 26
<400> 26
000
<210> 27
<400> 27
000
<210> 28
<400> 28
000
<210> 29
<400> 29
000
<210> 30
<400> 30
000
<210> 31
<400> 31
000
<210> 32
<400> 32
000
<210> 33
<400> 33
000
<210> 34
<400> 34
000
<210> 35
<400> 35
000
<210> 36
<400> 36
000
<210> 37
<400> 37
000
<210> 38
<400> 38
000
<210> 39
<400> 39
000
<210> 40
<400> 40
000
<210> 41
<400> 41
000
<210> 42
<400> 42
000
<210> 43
<400> 43
000
<210> 44
<400> 44
000
<210> 45
<400> 45
000
<210> 46
<400> 46
000
<210> 47
<400> 47
000
<210> 48
<400> 48
000
<210> 49
<400> 49
000
<210> 50
<400> 50
000
<210> 51
<400> 51
000
<210> 52
<400> 52
000
<210> 53
<400> 53
000
<210> 54
<400> 54
000
<210> 55
<400> 55
000
<210> 56
<400> 56
000
<210> 57
<400> 57
000
<210> 58
<400> 58
000
<210> 59
<400> 59
000
<210> 60
<400> 60
000
<210> 61
<400> 61
000
<210> 62
<400> 62
000
<210> 63
<400> 63
000
<210> 64
<400> 64
000
<210> 65
<400> 65
000
<210> 66
<400> 66
000
<210> 67
<400> 67
000
<210> 68
<400> 68
000
<210> 69
<400> 69
000
<210> 70
<400> 70
000
<210> 71
<400> 71
000
<210> 72
<400> 72
000
<210> 73
<400> 73
000
<210> 74
<400> 74
000
<210> 75
<400> 75
000
<210> 76
<400> 76
000
<210> 77
<400> 77
000
<210> 78
<400> 78
000
<210> 79
<400> 79
000
<210> 80
<400> 80
000
<210> 81
<400> 81
000
<210> 82
<400> 82
000
<210> 83
<400> 83
000
<210> 84
<400> 84
000
<210> 85
<400> 85
000
<210> 86
<400> 86
000
<210> 87
<400> 87
000
<210> 88
<400> 88
000
<210> 89
<400> 89
000
<210> 90
<400> 90
000
<210> 91
<400> 91
000
<210> 92
<400> 92
000
<210> 93
<400> 93
000
<210> 94
<400> 94
000
<210> 95
<400> 95
000
<210> 96
<400> 96
000
<210> 97
<400> 97
000
<210> 98
<400> 98
000
<210> 99
<400> 99
000
<210> 100
<211> 38168
<212> DNA
<213> Actinoplanes garbadinensis
<400> 100
gatcggccgc cgtcagctgg agaagcgctg gctggcgcgg ctcacccgca acggccaccc 60
gcatccgacc cgggcgctgg cgctgcggat gggcgcggtg gagttcgcgg ggcagctggc 120
gctgcagctc gccgacatgc gcaagcccgg cacgccgtca gcgacctgac ccgctgctcg 180
acgcagctcg ctcgccggtc ccgcgccgcg ccgatcaact ccggcagcac ggcgcgagct 240
tcaatcagcc ggcccggcgc accccctacg ccggtgcgac gaggcatgcc cgagaccagc 300
gcggccgcag agggccggtc ggcgccggac cggtcagcgc gcccgcaatc aggccggcag 360
gcccgcccgg agccggaccg gtcggcgcgc ccgcaatcag gccgacaggc ccgcccgggg 420
tcaggctggt cggctgcgcc gggccggcag gccggcgagc agcgcgtcga gcgtctcggc 480
atccgcccag ccgttgactg acactgcgcc tgccgccgtg accgtgacct caaggcggtc 540
cggtgtcacc gccacgtcga tcggcgcgtc ctcgatgcgg tcgctcaagc ggatgaactg 600
ctggttcgtc gagccgaccc agggccgctc gtggtccagc aggtcctgcc ggaaggggcc 660
ggccaccagc aggtccgtgg cgtcgagcag tgcggcgacg tcggcccggc cgtccgcggc 720
gagagcgcgc agacgggcgt actcgtagcc ggtgaacgtc atgaccgagc gacccgcctg 780
ccgcaccccg gcggccaccg cggcgagacc ggccgcctgc tcgaacggct cgccgccgag 840
cagggtgaca cccgtggtgc ccgtggcgag cactcggtcc accaactcgg cgggtgcggc 900
cggcacccca ccgcgtacgc cgaacaaatg cggattgaag catccggcgc accggatggt 960
gcaaccctgc acccagatcg cggtccgctc gcccggtcct tcggcggtgg tccggtcgag 1020
gaaccgggcc acccgcacga gcggcggctc agacatcgac tatccgaccg aaaggcgtct 1080
ggttcgcttg cggcggcggc tcgcacgaca gccggtcccg gaccgcgacg aactcgtgtg 1140
gtgcgagccc ggccacggcc gcgaactcgc cgagactggc gaatccgccc cgcgcctgcc 1200
gcgccgccac gacgtccgcc acccgctgcg gggtgagacc gggcacggcg gccaactgtt 1260
gcgcgtccgc ggtgttgaca tcgagccgct cgggcgccgg ctccagcagc gagcccggca 1320
cacccccagc cggcgagccc agcgcgggct ccagcgggcc gggcgcgggc ccagcgggcc 1380
aggccgctgt gggctcagcc tgccggccgg ctgcgggctc agcctgccag cccgctgccg 1440
gctcagcctg ccagcccgct gccggctcag cctgccagcc cgctgccggc tcagcgggcc 1500
ggcccgccgc cggctcagcc agcgggcccc tcgcgggctc aggcccggga gtccctccgt 1560
agaactcttg cggcgaagga acgacaccct gtagttgcgg cggcagcgga gtcgccacgg 1620
gagcgggcgc gttcgcccac ggcgcctgct ggggctgcgc ataccacggc acgtgagcgg 1680
cacgccagcg cagccaggag gcgttgatga cgaacgcgtg cgcgacgctg atcggccaca 1740
ccatgaacat gatcgagaac gcgaggttct gctggagcga gtcctcggcg ccctcactgc 1800
cgagaaagaa gcagaagttg gccacgacgg tgtagaggat cccggcgatc caccacaccg 1860
gccgccgggc gcggatgccg acgtagagga acccgaccgc ggagaaacag ctgaagggca 1920
ccatcggcgc gatcacccag gcgctgtgcg cgaggcgcca cgacagccgc gccggcccgg 1980
tccgcttgcc cggctcgtga cctggatgcg gcggatagga cggatacggc tgctggtgag 2040
caggcgggaa cggcggcagc ggctgctgac cggaagcagg cgggaacggc ggcagcggct 2100
gcttgccgaa cgacggcggg tacgccggct gcgaggcggg atacgggtcc tggcccgggt 2160
taggcggtgt ccacgtcacg gttcacgatc cgttcccgcg cggtgtgcgc ctgacgcgtg 2220
taatccgcgg tgtacgcact gtgccgcacc tgcccgccga cgagatcctc cagaacggcc 2280
acgtagtcca ggcagcgctc gccgagaatg tccacggtct cggcactgac ctggccgtcg 2340
ggaccgaccg tgacgacgat ccgaggattc tccgtcatgc ccgctccctc tccacctcga 2400
agaccaggcg cacactggcg tcctggccga ccgactccga ctccagccgc agcccggcct 2460
cgggcgcctg cgcgcgcagc cgctccagga cggcctgctg gacccgccgc ccgtacgcgg 2520
tgtcgacggt cgtcatcaac tcgacagccc ctggctgatc gacgccggtg acgtgcgcgg 2580
cccagatgcc gtccgcgccg cgggtgaacg tcgcggcgct ctgcgtccag gtcgccgaga 2640
tcgtgtcgcc ggcggccgtc acggtggctc cggtgtcgcg cagcgccgca tcgagcaggg 2700
tgacatcgcg catgcgggtc tgcacctggc agatcagccg gccgtcgtcc atccggcccg 2760
cggcggcctg aaccgcggcc gcgccggcca tcgccaacgg caccagcagc agtgaaacgc 2820
tcaccatgcc ccccgttctc gctgtggcca caccctatcg gcagggtgcg acaaatcatc 2880
ggttggtgag gtcccagtcg tcggtgccgg tggccgacac ggcgcgattg cgggcccagc 2940
cgcgcagggc gtcgacccgc tcggcctgcg tcacgctgag cggcacgatg ctcatcaccg 3000
cgcgtacgag atcgtcgcgc cgcagtgggc ggcgttcgga gaacgcgtcg aacagtcccg 3060
caatgaccgc ctgctctatc tccgcgccgg agtagccctc ggtcagcccg gccagctcgg 3120
tgagcagctc ggcatcgacc cgcagctcgc cggcggcacg ccggtgccgc agcgcccgcc 3180
cgaggtgcac ccgccacacc gcgacccgct cggaccggct cggcagatcc acgaagaacg 3240
tctcgtcgaa gcgtcccttg cgcaacagct ccggcggcag cccgtcgaag tcgttggccg 3300
tcgcgatcac gaagaccgga gtccgcttct cctgcatcca ggtgaggaag gtgccgaaga 3360
cccgggcacc ggtgccggaa tcacccccgg tgccgccggc gaagcccttc tcgatctcgt 3420
cgacccacag gacgcacggg gcgaccgcct ccgccgtacg caatgcggtg cgcatgttgt 3480
gctcgctgga accgaccagg ccggagaaga cacggccgat gtcgaagcgc agcagaggca 3540
ggttccaggc ggtcgcgacc gccttggcgg tcagcgactt gccgcagccc ggcacgccgg 3600
tgatcagtac gccgcgcggc gcgggcaggc cgtacccggc cgcctcgtcc agccaggatc 3660
cgttgcgttt gaccagccag gccttgaggt tctccaggcc gccgacgtcg tcgagcacgg 3720
ttccggcggc catgaactcc agcacgcccg atttgcgtac ggtctggcgc ttctcctcgt 3780
gcacgatctc caggtcggcc agatcgagca cggcgtcgtt caccatggcc cgggcgtacg 3840
cgttctccgc ctcctgcatg gtcaggccgg ccgcggccgt gacgaaccgc tcccggctct 3900
gctcgtcgag ctccacccgc agccgcccgg acgcggtgtt cccgcgcacc atggcgtcga 3960
gcagagcgcg caactccagc tggccgggca gcgggaagtc gacgatcgtg acgtccttgc 4020
tcagctcgac cggcaggtcc agtaccggcg agagcagcac gagtgtccgc gggctgcggc 4080
cggcccggaa cgcctgggcg atgtcgcgca ccagccggac gacctccggg ctctgcgcga 4140
acagcgggtg caggtcgcgg aagacgaaga cagccggttc gtcgatgcgc tgcaccgccc 4200
tgagcgcgtc ggtggcccgc tgcgcgcccg agcgggcctc gccgttcggc tggaccagac 4260
cggcggtcag cgaccaggtc cagacggcac gtggcacgcg gacgaggtcg gcgtcgccgg 4320
cgatgccggc gaggtggtgc agcgcccgct gctcctcgta cgtctcgagg tggagcaccg 4380
ggaaccgggc cttcaacagc tgcgcgaacg tctccgcgaa cgacctctcc accggcgcat 4440
cctacggccg cgccggccgg cgtgtcagag cccggacggg gtgccggtgg cgtcgcgtgc 4500
cgtccggtcc ttcccgcgct cgacgggttc gttgggttga tcggtcatgg catcctcctg 4560
ctcagtccgg gcggtagacg gcggtgtccc cggacacggc gccggggtcg taccccgagc 4620
ggccggtttc ctccgtggtg tcctgctcgt cagcgccggc gcctgtcgac tcgccgggtt 4680
tgcgcagtga cgccgcgtat gccggggttc cgtccggctc gtccgtggga tgccgctgga 4740
gttgttctcg gtcatcggtc atgaacggcg gacttccctg caagagcgcg gacaaacgtg 4800
gtcgtttatc ccgcagccgg gcgggcagtc gtccaccatg gaacccatcg gtgaccctga 4860
cgagcagacc ggcgacttcg ccgaagagca cgaactgacc gaggtgacag ccgaggagga 4920
cgacgacggc gagccggaga gcccggatcg ctggaccggc ggcatggact ccgacggtcc 4980
cccgtgacct gcggctacga tccctcacag gtgcccgccc cgccgacgac ccgaggttcg 5040
tagccgttgt cctccatcac cgagctgacc gagtccgtgc gtgccttcgc gcgcgagcgc 5100
aactgggagc agttccacac gccgaagaac ctcgcgatgg ccctggccgg cgaggtcggt 5160
gagcttctgg ccgagttcca gtggctgacg ccggaacaat cagccgcggt catgcgcgat 5220
cccgatctcg gcccgcgggt ccgggccgag atcggagacg tcacgatcta tctcgtacgc 5280
ctggcggacg tgctcggcat cgacctggtc gaggcggcca ccgacaagtt ggcggaagcc 5340
ggccgccgct acaccgtcga agccgcccgc gactcggccg ccaagatcga tcagctgtag 5400
ttcagcgaga agttgttgac cgtgaagttg gactgaccgg cggtgccgct gatctcgaag 5460
ccgaactgcg cctcgccgac cgtcacgtca ccccaccagc cgttggtgcg cagccagttc 5520
aggatcgcca ggatgtcgac ggtgccggag ttcgtgttgg tacggatgaa cgagaagacc 5580
gcgttggcgc cgttcgaccc gcggtagacg ttccaggtgt gcccgccgac ggacaggttg 5640
cggacgttcg gcaccgcgcc gttggcgtcg tactgttcgg cgatcggccc gaccgcgccc 5700
tgctggttgg tccagatcat gacctcgtag gcgtggttgt tcgcccagat gtcgtaggtc 5760
gtcgagtagt cgccgctgga cggcaccgac acgttgaagg agctcgtcag agaattgagc 5820
gagctcagcg tacggttgag ggtctttccg gtgttggggt aggacttgac cccgctggtg 5880
cgcgggtgat tcgcgacgac gccccagttg gtgccgctgc gcgcccagat ggtctgggtg 5940
ccggcgcccg agccccagat gttgttgtga ggatgtatcc gttgttggtc cagttcgccc 6000
actgtcccga gtcgacccag acggcgtcgc tcggtacgcc gttggtgggc ggctgcgagc 6060
tcgggctggt ggggccagcc gatccggtgc aggcggtccc gttgagcgtg aacgtgcccg 6120
gtgccggggt ggcggcgccg gagccgttga atccgaacga cacggtcgcg ttggtgccga 6180
cggatccgtt gtagccggcg ttgcgggcgg tgacctgcga tccgctctgg gtcaggctgg 6240
tgttccaggc ctgggtgacg gtctgcccgc cggagtagga ccagaccaac gtccagttcg 6300
tgagcggatc acccaggttg gtgatggtga cgttggcgcc gaagccgccg ggccactggc 6360
tgctcacggt gtaggcgacg cggcagccgg ccgcggcgga cgccgggagc gcggtgacga 6420
cgccggcacc ggcgatgagg gccgccgagg cggccaggga gagcgcgaga gtacgtctgc 6480
gcatgccgtt ccaatctcgg agggggaaca cacgacgctc gtcgaagcgc ttcgataatg 6540
aaggctgggg atctacgagt gtcgatgcgg gatgaggccg atgttacgac ccgccgccgc 6600
ggcgaggcaa ccgctacctt gggcgcatga cgatcaccga gaccgatctc gcccacctgc 6660
gccgatgcgt cgacctggcc cgcgaggccc tcgacgacgg cgacgagccg ttcggttccg 6720
tcctggtctc cgccgacggc aaggtgctgt tcgaggaccg caaccgggtg aggcacggcg 6780
acgccaccca gcacccggag ttcgcgatct cccgctgggc ggccgagcac ctgaccccgc 6840
gggagcgcgc cagcgcgacg gtctacacct cgggcgagca ctgcccgatg tgctcagcga 6900
gccacggctg ggtccgcctg ggccgcatcg tgtacgcggc gtcgagcgcc cagctgaccg 6960
cctggtacaa ggagtgggga atcccggcgg gcccggtcgc cccgctaccg atcaccacag 7020
tggtccccgg cgccgtcgtg gagggcccgg tcccagcctt cgaggccgag ctgcgggagc 7080
tacatcgcgc ccgcttcacc ccagcgcagt agccgccgga cgaaacccga cccttctcgc 7140
caatgaaccg gacctgcgag cgtgtctgga ttgaccgcgg aggcccgcaa cgccacaggc 7200
tcgatctccg tcaccgtcgg acctcagggg caggtcgagg atctgcgcct tgacgaccga 7260
gtgcatgacc tcccatccca ggaactgagc cagcagatcc tgacagtgat gcgaaaggct 7320
cagtaccagc tcaccgagta cgtctcggcg cacatccgtg acaccgtggg catggattcg 7380
gagaccggtc gcaatgtgct cgacgcgttc gcacagcgct tcccgctgcc ggagatgacc 7440
gatgagcgtt gagcaggtac agctgccgat cgacgtaatc aaccggcaca ccactaccat 7500
cgccgcaacc gccgatgccg tacggcaggc ccgcgccgcg gcaggtcagg cagccatgga 7560
ctcgcaagcg tacggccagt tgtgtcagtt cctgccgacc gcgttcagcg tcgtgttcga 7620
gagtgcgatc gtcgccatga ccggcagcgc cgaagcgttg caggaaacca ccttcaacct 7680
gcaggatgcc gtcacgacgt tcagatacac cgacgagtcg gccgctcgca ccatcgcctc 7740
cgcaggttcg ccgccgtgac cacaccactt gtcgcccaag ccggggactc caccacggga 7800
ttgaccggtc tggggctcgt ggaggacgcc caccagatcg cagaagccat ccgcgggaac 7860
agttgggtcg acggcgtcct cggcggagtc ggggccagcc tcgacggtct ggcgctggcg 7920
atcgacccgc tcggcaccct tgccgcctgg ggcgtcgcct ggctcatcga gcacgtccaa 7980
ccgctacaag acgccctgga ctggctggcc ggcgacgtcg acgagatagc cgcccaagcc 8040
gccacctggc gcaacgtcgc cgccttcacc gacagcgccc agcaggatta cgccgatcgg 8100
ctccgcaccg aggtcgccgg ctggttcggc gcctccggcg acgcataccg ggcccatgcc 8160
agcgaacact tggccgcact gaaaggcatc agcaccgcag ccggcggcat ttcgtccgcc 8220
gtcgaaggcg ccggcctgct cgtcagcctg gtgcgcggaa ttgtccgcga cctgatcgcc 8280
cagttcgtcg ccactctggc cgttcggctg ccacaatggc tcgccgccga aggactcact 8340
ctgggcctcg ccacccccgt tgtcgcgagc caagttgccg ccctcgtcgc ccgcggggtc 8400
aacaagatcc agcacttcat acgggcgctg ctcaacagcc ttcgacggct gatgcccatg 8460
atcgaccggc tgggtgaagt cctggagcgg ctccgcatgc tcaccgaccg gctcgcaagg 8520
tccagcccct ccacccgccc ggagccgaca cccggccccg ctactcacgc cggaaccgag 8580
aacgcatcgg gaaacaagcc cgagggcgac ctcgaaccga acgaaccgcg cccggccgag 8640
gctgacgcca gagacagtac gcctcaggcg ttcgtggacg aggtcgtcag caacccccgg 8700
tcagtcgcgg gacactccgc gcagtccatc gcggaccagt tcaacgccgc cggatactct 8760
gcggtcgtcg agcagagcac caggagcggc acctcgggga acgccatcca ggtacgcatt 8820
cacggccacc cggatatcac caacatccag gtgcatccgg gaggaggacg gcacacgccg 8880
gaggggtccc cgtattggaa aatttcgacg aatacggtcg ggaagatctg gatcatcccc 8940
gaaaatttcc ggggcgccga tgaactgcgt gggaatgtgg tgcgctatga caaataagat 9000
catcaaagtg gatcgggtgg gatccgcggg ggaagctgcc acgctcgtcg ccctgggcgt 9060
cgacatcgtc ggggtcgatc ttcgtcctga tccgcgattc gttgatgatc gcacgctgga 9120
cgccgaacag gttcgccaca tccgcgaagc gctgccgcac acgacgctgg ccgtcaccat 9180
ggacaccggc accgagccgg accatgtcgt cgaactcgca aggcgaatcg gcgcggatct 9240
ggtccagtcg atcaacggtg tcatcccgcc gctcccagta cgcgtcgccc tgcgcaaggc 9300
cgacatcgcg attgtctatg cgggcacaga gatctcccac gacgacgatc ccggctgggt 9360
cttcagcgcg tacgacgaca ctccggacct gaacgccgcc ctgtttcaag tggaggtgct 9420
tccggagtac ctcgattcct gggagtttct gcgtgaccgc tccccggaat atgccgacga 9480
gttccagatc gaagatctcg acgacctcgg acgcgctcgc cccttggttg ccggcctgaa 9540
tctcacggct cagaacctcg acgagatcag ggcacggctt ccccacgtcc gcggtctggc 9600
gctcaccctc gcgcacgagg ccgcgaggag cgacgcgcgg ttcttcatgt ttccccacgt 9660
agtggacatc ctttcgggag actcgtccgg gtgaccggca tcgcgcggga gggggctggt 9720
gtcgcagagt caggctgacg gcattccggc gggcctgacg ggaggaacct catgaccggg 9780
ctgttcacca tgcgcaagca cgaggagggc gccggggagg ttcggatcgt cgtgagcggc 9840
gagatcgacg gcgatgtcag cgcggcgctc accctgttca tcgccaacgc cgccgagcag 9900
gacggtgtcc gatcggtgct ggtggatctg gagccggtgc tgctgctggc cgcagccggg 9960
atccggtgcc tgctgagcgg ccgtgaggcg gctctgctgc agggctgctc ctacgagctg 10020
gtcaacgtcc ggcacgaggt cgcggattca ctgcacgccg ccggcgtggc agatctgctg 10080
ctcaccctgc cggtccgctg agccggctca gctcgggtcg tcgaagccct cgtcggcgcg 10140
ttcgcggcgc aggtgtgcct cggcccggcg cgcctggtca cccttctccg ctgccagccc 10200
ggcgtacatg gcctgcacct tctcgtacgg ctggccgggc ggcagcagcg ggatcgccgg 10260
atcgaccacg gcctcgatca gcgtcgggcg gtccgcggac agcgccgcct cccacgcgcc 10320
ggtcaggtcg gacgggtcgg tgatccgcac tccgcgcagg ccgagcagct cggcgtagcg 10380
cgcgtacggg acgtcgggca gttcctgcga cgtgacgaag cgcggctcgc cctcggtctc 10440
gcgctgctcc cagctgacct cggccaggtc ccggttgttc agcacgcaca ccacgaagcg 10500
cgggtccgcc cagtcgcgcc agcgggcggc caccgtgatc agttccgcca tgcccgccat 10560
ctgcatcgcg ccgtcgccgg ccagcaccac gaccgggcgt tgcggcgccg ccagcttggc 10620
ggcgagaccg tacggcaacc cgcaccccat cgacgccagc gtgctggaca gatgcgccgg 10680
gacaccgcgg ggcagccgca ggtgccgggc gtaccagtag acgaccgagc cgacgtcgac 10740
cgcgacctgc gcgtccgcgg gcaggtggtc ggagagggag cgaatcacgt gctgcgggtt 10800
gaccggttcg gcgggcgccg cggcccgggc cgcgctgatc aggcgccagc gctgcaccca 10860
ttcctccacg cgggcgcccc aggcgccgct tgcccggctg ggcagcagtc cgagcagctc 10920
acgcaaggtt tccacggcgt cgcccaggag cgggacctca accggatacc gtacgcccag 10980
acggcgcccg tccacgtcga tctgtacggc ccgcgcctgc cccggccggg gatagaactc 11040
ggtccacggg tcgttcgtgc cgatcagcag cagcgtgtcg cagtgccgca tcagctcggc 11100
gctggccgtg gtgcccaggt gccccatgac gccggtgtgg aacggcaggt tctcgtcgag 11160
gaccggcttg ccgagcagcg aggtggtcac gccggcaccg agccgctgcg ccagctcgac 11220
gatctcgcgc tccgcgccgt acgctccctg ccccaccatg atcgccaccc gctcgccgga 11280
gcggagcacc tcggccgcct cgcgcaggtc ttccgggcgg ggcaccaccc gggcggggcg 11340
cagccccgcg ctcgtcgcca gcacaccgtg ctcatgcgcc tgcgggtcgg gcgccggggc 11400
cgtctgtacg tcgtgcggca ggaccacgca ggtcgggctg cgggtcgcga gcgcggtgcg 11460
gaacgcgcgg tcgaggagca tcggcacctg ctcgctcgtg tgcgcggcct gcacgaactg 11520
ggcgcacacg tcgccgaaga gccgcaccag gtcgatctcc tgctggtacg cgctgccgag 11580
caccgtcgag acctgctggc cgacgatcgc gacgaccggt ttggagtcga gtttcgcgtc 11640
gtagaggccg ttgagcaggt gcaccgcgcc gggaccctgg gtggcgaggc agactccggc 11700
accaccggtg tacttggcgt ggccgacggc catgaacgcc gcgccctcct cgtgccgggc 11760
ctgcacgaag gtgggccggc cggcccggcg cagcgctccg atcacgccgt cgatgccgtc 11820
cccggagtac ccgaagaccc gttccacgtc ccacgcggtc agacgctcca cgaccacgtc 11880
cgacacggtc cgctccgtca ccgctgcctc ctcacgtcac accgggggct acccgctcag 11940
ccgcgcggta ctcgccttgc gcgaaatgcg actcgcgtgc acctcacggg ccgggcggac 12000
gcggcacgga tctgagctgg ttcccgcccg gttctgatcc cctgtgatcg gggtacacac 12060
gtgcggtgag cagggacaag acgtaccggc cggtccgtcc cgacgggatc cggaccacct 12120
tccacgacgg tgtactcggg cgcatgcgga tccggtgcct gggcgagccg cgtccgggcg 12180
taccggagat cgtgatgatc cagggtatga ccgtgagtga ctatctgctg ccgggtctgg 12240
gcgcgctcag cgcctggacc cgggtgcacc tggtggagct gccgggaggc agcggcagcg 12300
gccggccgcc gcacgatctc acggtcgagg agtacgcgcg ggccgcggcc gactggctgt 12360
gcgcccagcg cctgggccgg atcgtgctgg ccggccattc gagcggcacg caggtggcgg 12420
cggagaccgc gctgttgtgc ccggacgagg tggccggagt ggtgctggcc ggcccggcga 12480
tcgacccggt ggcccgcggc ggcctgcggg tcttcgcgcg ctggtggatc gaccggcgcg 12540
gcgacccgaa gagcctggac gaggtgcaca aacccgaacg cgagcaggtc gggttccggc 12600
ggctgttcca ggtgctgcgc gcccacctgc gtcacgacct ggagaagccg gtggtcgggc 12660
tctgcgtgcc ggtgctggtc atccgcggca gcgaggaccg gctcggcacc gcgcggtggg 12720
cccggcggct cgccgatctg gctgccgtgg gcggccggta cgtcgaggtg ccgggcaccc 12780
actcgttctg ctggcgttac ccgcaggcct ggtccgcgcc gatccgtgaa ttcgccggat 12840
ggtcggtatc ggtctccggc acctgaacgg acgtttcggt ggcatcgccg ccaccgcggg 12900
ccggcgcatc cgcatccaca gtccggggtg agggtcagcg ccgttcggag gcggagtgtc 12960
gatgatcggt caattgacgt gcttccatga gccgccctac ggtccgacag agaaatcgtt 13020
atccggacca ccatcgacat ccgaatcggt ggccccggag ccgatcatcg accgaccccg 13080
ggccaccccc gctcttgcca gagggggcga ggcacatgac ggaagctgat catcgtccga 13140
ccgttctcag gagaatccta cggctgtgcg ccgtgcttct catggtgctc ggagtgggcc 13200
tggtcggcgc cccgacgtcg cacgccggcg gcaagccgac catctccaag gaggcgttcg 13260
gcagcgtcgg cggcaaggcc gtcgaccggt acaccctcac caacgggcgc ctgcaggtgc 13320
ggatcctcac ctacggaggc atcctgcaga ccatcacgtt ccccgaccac cgcggccgca 13380
gggccaacgt gacgctcgga ttcaggaccc tcgacgagta cgtgacgacg aagaacccgg 13440
cgtacttcgg cgccatcatc ggccgctacg gcaaccggat tgccgacggc cggttcaccc 13500
tggacggcac gacctaccag ctggcgacca acaacgaccc gaaccacctg cacggcgggg 13560
tcgtcggctt cgacaagcgg gtgtgggacg ccacgccgat ccgcgacggc gacagcgtcg 13620
ggctgcgcct gacctacacc agcccgcacg gcgaggagaa ctaccccgga accctgcgcg 13680
tgacgatgac ctacaccgtc acccggcaga tgggtatccg gatggactac cgggcgacga 13740
ccgacagacc gacgatcgtc aacctgacca accacgcgta ctggaacctc ggcggcgagg 13800
gcaccgggac catcgacgac cacctgctga agctcaacgc caaccgctac acgccggtcg 13860
acgccacgct gatcccgacg ggggcgatcg acgcggtcgc cggcacaccg atggacttcc 13920
gccggcccac gccgatcggc gcgcgcaacc gcgacccgtt ccagcaactg gtgtacgggc 13980
gcggctacga ccacaactgg gtgctgaacc gcgaggacgg ccagttccgg cgtctcgagt 14040
tcgcggcccg ggcggtcgac ccggacagcg ggcggcagct caccatctac accaccgagc 14100
cgggcatcca gttctacggc ggcaacttcc tcgacggcac cctgtacggc accagcggcc 14160
gggcctaccg tcagggagac ggtttcgccc tggagacaca gcacttcccg gattctccga 14220
accacgcgaa cttcccgtcg accgtccttc gaccgggaca gacctacaac tcgacgacca 14280
tctaccagtt cggtaccgcc gactgatcgc ctcaggccgg ccgccgcggg acggcgcgcc 14340
gcggccggcc gcacggcagt cagcggcggc gactggaggc acacatgcca cgcatccatc 14400
cgaaagtcga ggaggccgtc tctacgctcg acctgaaccg gacgacacga cgccggctgt 14460
tgtccggaac cgggttgttc agcgcctcgc tcgccgcggg cgcgctgctg agcgcatgca 14520
gcgaccagaa cgacggccag aaccagaccg agggcgccgg taacttcccg gacacccccg 14580
agtggcggtt cacattcgtc aaccacgtga ccaccaaccc gttcttcacc ccgacgcagt 14640
acgggatgga ggacgccgcg acgctgctcg gcatcgccaa gccgcagtgg accggctcgc 14700
agaactcgat cgtggccgaa atggtgaacg cgacgaacac cgcggtcagc gcaaaggtgg 14760
acggaatcgc catcgccgtg gtcgacaagg acgcgttccg ggggccggtc gaccaggctc 14820
tcaacgcggg gataccggtg gtgtcgtaca acgccgacgg agcccggggc gcgccgggca 14880
cgaaccggct ggcctatatc ggacagggcc tgtacgagtc cgggtacgcg ctgggccagc 14940
gggcgttgca ggtgctggac tccggcgagg tggccgcctt catcgccacc ccgggcgcgc 15000
tgaacatcca gccgcgcatc gacggcgcgc aacaggcgtt caaggactcc ggcaagccga 15060
tcacgttcac cgcggtcgcc acgaacgccg acgtgacacg cggtctgtcc atcatcgacg 15120
cgtacgccca ggggcacgcc aacctggccg gcatgctggc ggtggacgcc ggatcgacgt 15180
cgtcggtggg tcagaccgtc aagaagtaca acatgcgcgg caaggggctc aaggtggccg 15240
gcgggttcga cctgatcccg gagacgctga ccgggatcca ggagggcagc ctcgactaca 15300
ccatcgacca gcagccttat ctgcagggat tcctgcccgt gctggcgctg tacttctaca 15360
aggtgtccgg cgggctgatc gcgccgagtg agacgaacac cgggctgttg ttcgtcacca 15420
aggacaacgt cgccccgtac cagagcacga agagccggta cgagggctcc acgaccgaca 15480
aggttctcgt acctcgcagc gggccgatcg cccatggatg accggatctc gcctgcgccc 15540
gcgcaggcgc cttccctcga ggtcgagcaa cgccgtggcc ggtggcagcc ggtcacggcg 15600
gccggccgga aggtcctcga cgccttcctg cggcggcgtg aggccagcgt gctgctcgtc 15660
gcgatcggcc tgatgatcta ctttcgggcg tccagcccgg tcttcctgag ccgcgacaac 15720
ctggtcaaca tcgcccaggc gaccgcgccc gtcgcgatca tcgcggtcgg catcgtgctg 15780
ctgctggtca gcggcgagat cgacctgtcc gtcggtatcg tggccgcgct ggcgccgttc 15840
ctgttccact tcgggatcaa cttctactcg ctgccggtgg tgcccgcctt cgtggtggcg 15900
ctggcgatcg cggccggaat cggcctggtg aacgggctga tcgtcacgca gctgcacgtg 15960
ccctcgttcg tgacgacgct gggcacgttc ttcgccgtgc agggcatcct gctgatcacg 16020
tcgcacgcct atccggtgcc gatccccgac gcggccaagg gcacgttcca aacctggctc 16080
ggcgccgggc cgtgggccag catcacctgg gcgctgatca tcgtcgcgat cttccacacg 16140
gtgctgaccc tgacccggtg gggcctgcac accatctcgg tcggcggcaa cccggtcggc 16200
gccaccgagg ccggcatccg cgcctcccgc atcaagatcg gcaacttcgt gatcaccagc 16260
acgctgggtg ggctggtcgg catcatggag gcgttccgga tcaacaccat cgacccgaac 16320
atcggcggcg gcacgacgct gaccttctac gccatctcgg cggcggtcat cggcggcacc 16380
gcgctcgccg gcggctccgg caccatcgtc ggcgccttcc tgggcgccct cgtgctggcc 16440
gagctgcaga acgggttcaa cctcatcggc tacagcgcca acaccatctt cctcatcctg 16500
ggcctggcca tcctcgtctc gatgatcgcc aaccagtacc tctcccgact gcgccgggca 16560
ggccgatcat gaccgcggaa accgtgtccg acgcgctgcg cgtacagaac atcgccaaga 16620
gattcggcgc tctcaccgcg ctgcaggacg tgaccctgcg cgtcgccgaa ggcgaggtgc 16680
tgggcctgat cggcgacaac ggcgccggca agtcgaccct catcaaaatc atctgcgggt 16740
accaccggcc ggacgccggg cgcatcttcg tcggcggcga ggaggtcacg ctgcgcagcg 16800
tcgaccacgc ccgctcggtc ggcatcgacg ccgtctatca ggacctggcc ctggtcaacg 16860
agctgtccgt ctaccacaac atgttcctca accgggagct cgtacggtgg ccgctgctga 16920
acaaccgggc gatgcgccgc cgtgccgagg agcacctgcg cgacatggga gtgaacctgc 16980
cggacgtcgg cgtcgaggtg gccaagctct ccggcggcca gcgccaggcg atcgcggtgg 17040
cccgctgcgt ctactccgac gcccgcatcc tgctgctgga cgagccgcta gccgcgatgg 17100
gcgcgaagga gggcacgatg atcctcgacc tgatccgcga cctgaaggcg cgcggcaacg 17160
tgtcgatcat catcatcgcg cacaactacg cgcaggtgct cgacgtgtgc gaccgggtga 17220
acctgctgca gcacggccgg atcaccttcg acaagaggtc ggcggacacg tcgctggccg 17280
aactgaccga gctggtggtc gccgagtacc gcaccggccg cgggcggtga cgcctcagcg 17340
cttgcggccg actccgctgt actggctcgc gccggtcgtc tcgtcgccgg ggtcgggatg 17400
ccactgcggg ctcggcacga cgcccggcgg gaccaggtcc agtccctcga agaagccggc 17460
gatctcgtcg ggcgtatgca tcaggtaggg caccgcaccg gaggagttgt aggcgtcctg 17520
ggcctggttg agcgcctcct ccccggcgac gcgcacaccg tcgttgatcg acaggtagct 17580
gccgggcggc agcccggcca tcagctgccg gacgatgtcg cggacctccg cggtgctggg 17640
gatgtggccg agcacgccgt tgaggatcag cgccaccggc cggcccatgt cgagctcgcg 17700
ggcggcgacc gccaggatgt ccgccggttt ctgcaggtca ccctcgaggt agacgtcgga 17760
cgacccggcc agcagctcac ggccgtgctc caccgcgtac gggtccttgt cgacgtagag 17820
gacccgggcg tcaggggcga cccgctgcgc gatctggtgg gtgttgtcga cggtgggcag 17880
gcccgcgccg acgtcgagga actggcgcac gccggcctcg ccggcgaggt agcgcacggc 17940
acgcgacagg taccgccggg actcgcgggc gatctcgtcg atgccgggga acacggcacg 18000
gtactcgtcg ccggcagcgc ggtcgaccgg gaggttgtcg gtgccgccga gccagtagtt 18060
ccagatgcgg gccgactggg gcaccgaggc gccggactcc atagtcacgg atcgatagcc 18120
tagcccttgc gcgcctgggt ggcgacgccc tcgacgaagt agcgctggca caggaagaac 18180
gcgatgatca tcggcaccgt ggtgatcacc gcgccggcca ggacgatctc ccagcgggcc 18240
tcgcccgcct ggccgaactg gtcgaggatc gccttcatgc cgcgcggcat ggtgaacagc 18300
gccggatccc gcagatagat cagcggcttg agcaggtcgg accagctggc ccgcagctcg 18360
aacacgaacg ccacgatcag cgccggccgg cacagcggca ccgcgatgcg ccagaacagc 18420
cgccagtacc cggcgccgtc gacgcgggcc gcctcgaaca gctcacgggg cacgccgagg 18480
aagaactgcc ggatcaggaa gatgtagaag gcgctgccga acaggttgcc ggcccagagc 18540
ggcacctgcg tggcggccag gccgagctcg ttccagatca ggtacgtggg gatcatggtg 18600
accgcgccgg gcagcatcat cgtgccgacg accagggcga acaacacgtt gcgcccgggg 18660
aagcggaagt aggcgaagcc gaacgccacg accgcgctgg agatcgtgac cgcggccgcg 18720
gcggcgagtg ccaccacgac gctgttgaac atccaggtca gcacgggcgc ggcgtcccag 18780
atggcggtgt agttccccgg cgcccactcg gcggggagca gccggttgtc gaagacgtcg 18840
gggcggggct tgagggaggc gctgaccagc cagacgaacg ggtacacgaa gatcaccgcg 18900
gcggcggcca gggcggtcca gagcacccag ggatgcgggc cgcgcgaggt gcgcggtggc 18960
atggtcctgt cctcagccac agccacggcc tcactcgctc tcgtagtaga cgaatcgccg 19020
gctgagccgg acctgcacga ccgtgatgat cacgatgatc aggaacagca gccaggccag 19080
cgccgaggcg taccccatgt gcaggaactg gaaggcctgc tggaacaggt agaccacata 19140
gaacagggcg gcgtcgttgc cgtacgtctg ctggttggca ctgccgtaga aggcggtgta 19200
gacctcgtcg aaggtctgca gcgaggcgat cgtgttgatg atcagcgtga agaagagcgc 19260
gccgctgatc atcggcacgg tgaccgcgcg gaaccgcgcc cacgccgacg cgccgtccat 19320
ctcggcggcc tcgtagaggt cgcggggcac gttctgcagc gccgccaggt agatgatgac 19380
cgtgctgccg aggctccagg cgccgatcag caccaggccg ggcttgatcc acgggccgtc 19440
gacggtccag ttcggcccgt cgatgccgac cgtgcccagc gcctcgttca cgatgccgac 19500
ctggccgttg aacagcagca ggaacagcac gcccacggcc accttggggg tgatcgtcgg 19560
caggtagaag atcgtgcgga agaacccggc ggagcggcgc ccgacccggg ccagcagcat 19620
cgccagggcc agggacacga tcatggtgac cggcacgtgc agcgccgtgt agatcagcgt 19680
gttggcgatg ctcgtacgca cccgcgggtc ggcgagcatc tgccggtagt tctcgccgcc 19740
gacgaagtcg gtgctggtga gcacgtcgta gtcggtgaac gacaggacga ggctggccac 19800
catcggcccc gccatgaaga ccgtgaagcc gatgagccac ggcgacagga aaccgaaggc 19860
ggccagggtc tcccgccgcc gcacggcggc actcatcgtc agcgtccgct gttggccttg 19920
tccagcgcgg cctgagcctg ctgctgggcc tcggccatgg cctgggcggg tttctgcttg 19980
ccttccagga cccggttgac cgcgttctgc caggcggcct tgaattcctc accggcggcg 20040
agcgccggct ccgagaagcc ggactcctgg gtctgcagga cgatctgcac gttggcgtcg 20100
ggtttcacga cgtctctgaa gatcacttcg tcggccttct tgttgccggt gtagacgccg 20160
gcgaagggtt tgttctcctt cttgcgcagc tcggcacggg ccctcgcggc ggcgatccag 20220
gtctcgctcg cggtcatcgt cttgatccac ttacaggcct gcccagggtg cgcgctgttc 20280
gccgggatgg cccaggcgtt gcccgtgatc cagtcgatcg gctgcccgtc gacgccgcgg 20340
aacggcgcca cggtcacctt gaccttcggc gagttgtcgg cgagcacgtt gaggtagaag 20400
tcctccatcg ggaaggcgcc gagctggttg ctggcgaact ggttcttggc gccgaagaag 20460
tcccacgagt cgcggaacga cttgaagttc gaccagccgc cctgcgcgtt gatcaggccg 20520
acggcgtatt cgagggcctc gaccaccttc gggttgttca gctgggcggt gcgaccgtcg 20580
tcgctgacca gggcggcgcc gttcgcgcgc gcccagacgg gcaggaactc gggcagcttc 20640
gggtcgaacc cgatccgctg gagcttgccg ccgctcatcc tggtgagccg ggccgtggcc 20700
gtcgacagcg cctgccagtc ccccgtgtcg aacccggcgg gatccaagtt gacctcggcg 20760
aacgcggcgt cgttgagcat caggacgcgg ttgttgtaga agtccggcag gccgtacagc 20820
tgcccgttca gggtcgcctc ggtgaccgcg gcctcgcgga actggctcat gtcgatcttc 20880
tcccgttcga cgcagtcgcc gagcggagtg agcgccttct tggccgcgta ggtgccgagc 20940
agccgccgtt ccatgtacac caggtccggc ggggtcctgg aggccaccgc ggacaggaac 21000
gcctgggcgt cgaagctgcc ctcggacgcc ttcgccaggc tgggcgcgat cacggcgttg 21060
gccgcgtcga agcgggtctt ggcgatctcg tcgccggtgc cgaaacccat catggtcagc 21120
gtcaccgcgg cgttgctgtc ggagtccgaa tcggatccgc ccacgccacc gcagcccgcc 21180
gccaatgtca gaaccagggc accacccacc acaaaccgga tcgatcggat gaacatcgtt 21240
gttctcccat tttcacttgt tcccgtgggc gaagcataag ttcacttcga tgcccgcgca 21300
ctcggagcgg ctgctgtcaa ccgccgaccg gttggcggat caccacgatc gggtggtgcg 21360
gccgctgccg ggccgcgctc ctgctcccgc cgccacgcgg gtgggcagat accgatcggc 21420
gtcgctctaa tcgatggcag ggataccgac ggtgacaccg tttcctcccg ccgcttcatc 21480
ccgacgtaat cgcgggcatg gcgccgtggc cgcgtttcgt cgaaatcgcc gggctattcg 21540
cccgggaagt ccaccgaaag gaagacacac catgtctgct ctcgccatcg agaagtcctg 21600
gaaggacgtc gacctccgtg acggggcgac cagccacccg gccggcctcg gcttcggcga 21660
gctcaccttc gaggaccttc gcgaggaccg caccatctac gccgccagca gcggctgggt 21720
gtgcaccctg acgatcgagt gcggcaccgt gatctgcgcc tgctgatcga cgatcgtttc 21780
cggcccgggg cgggcatcgc ccgccccggg ccatccattt cgcgcgggga gcagccatgt 21840
caccggttcc ttcactcaat tccacctcgg tacgcgacag cgcgtatctg cacgaacgaa 21900
cggtgaccgg agaagaccag ccggcaccgg ccgcgcaggc gcggatagcg tcctggcgcg 21960
attcggcgtt cctcgacgac cgggttctcg acatccggct acgtcaatgg ggaatcgacc 22020
gtgccacctt cggccggctg ctcaccgacg acgacttcac cgttcccggc cggctgctcg 22080
cctgggcgga cgagctggcc acggtgctgg ccaccgacac gacaccggtc accggactcg 22140
agttgtccac caaactgtgg tcacagggat tcgaccggct gctcttcgcc ggcctgcttc 22200
acccgttcct cgcccactac gaacagcggc tgcacgagcg cgtgccccgg ccgatcgccg 22260
gcagcctgcg ccggccgctg ctggagtcgc tggccaaccg gctgctcgcc gtcgcggcac 22320
gcaccctgct gctggagctc aacgtggccc gtgtgcacgg gcggctgacc ggcgacaccc 22380
cgcagcagcg ctacgacgac tacgaccggc ggctgctcac cgaccccgcc tacctggccg 22440
ccctcttcga ggaatacccg gtgctcggcc gttgcctggt cgaatgcggc cggcgttggg 22500
tggaccacgc cgccgagctg ttcaaccggc tccacgacga cgagcccgaa ctgcgcgcgg 22560
ccggtctgct gccgccgtcg gcggaagcgc tgcgcagcgt acggctggac ctcggggacc 22620
cgcacaacgg cggccggtcg gtggtgcagc tgaccttcga cgacggcacc gacctggtct 22680
acaagccgcg gccggtcgga tccgaacgcg cctacgccga gacgatggcc gcgctggccc 22740
gccacgggct gccggtgccg gtgaccgccc cgcgcgtgct ggaccgtggc gggcacggct 22800
ggtgcgagtt cgtccggccc gcgccctgcg ccgacgccgc cgagctgtcc cgcttctacc 22860
ggcgcgccgg atcggtgctg gcggccatgc tgctgctcgg tggcgtcgac atgcacatgg 22920
agaacgtcat cgccgcgggg tcgtcgttca ccccgatcga cctggagacc gtgctgcagt 22980
ccggagagct cggcgacggc gccaccgacg cgtacgggcg ggccctcgac ctgctcaacc 23040
gcagcgtgct ggcgatcggc atcctgcccg cccgcgcgtt cggtggccgg cagcgaaaga 23100
gtgtcgacgt cagcgccctc ggcggcggcg aaccgcagac cgcgccccgg ccggtgccac 23160
gcatcgtcga cgcgtacacc gacacggcac ggctggaagc ggtcgaggcc accatggccg 23220
gcgcccagaa ccggccgagc ctgcccggcg ccgaggtccg cccgtgggag cacaccgctg 23280
acgtggtcgc cgggttcacc gacgcctacg acatcatgct ggcccaccgc gccgacttcg 23340
accggctgct gcgcggcttc cacgacgtgg aggtgcgcta cctgccccgg cccacccgtc 23400
gttacagcat cttcctgacc gagagctacc accccgacta cctgcgcgac gccagcgacc 23460
gggaccggct gctcgacaag ctgtggaccg ccgcggacgc ccgccccgag ctgattccga 23520
tcatcgagtc ggagaagcga caactgctcg ccggtgacat cccgtgcttc cgcagcgtcg 23580
cgggaagccg gcagatccgc accgcctccg gcccgctgca cccggagttc ttcaccgcgc 23640
cggccgtcac cgtactgacc cgccggctcg gcgagttcgg accggtgcac cgcgccgccc 23700
aggtacgcat catccgcgac tcgatggcca cgatgcccgg cccccggccc gccgcccagc 23760
cgtcccccga ccgggcggcg ggcccccggc cccgcgtcac cggcgccgac ccggccacgc 23820
tcgccgaccg catcgcccgc aggctcgccg acgaggcgat cctcggcgac cgcgacgtgt 23880
cctggatcgg cgtcagcatc gaaggcgtcg cccaggagac ctacagctac aagccgatgg 23940
cgaccggcct gtacgacggc gtggccggcc tggcgctcac cttcgcgtac gcggcccgca 24000
ccctcggcga cgaccgctac ctggacctgg cacaccgagc ggcccgcccc gtcgccggct 24060
acctgcgcta cctcgccgag caccgcatcg tcgagaccgt cggcgcctac agcggcaccg 24120
ccgggctgct ctacgccctg gaccacgtgg cccacgccac cggcgacgac tcctacctcg 24180
acgcggtctc ggaggcggtg ccgtggctgc gcgaatgcgc cacccgcgag gagtgccccg 24240
acctgatcgc cgggctggcc ggctgcgccc tgatcagcct ggacctgcac gggcgccacc 24300
ggatcgacgg gctgcgcgag gtggcggcca tctgcgccga acggctcgcc gccctcgccg 24360
tcgacgtcga cggcgccgcc ggatggccgg ccactccgga cggaccgctg ctcggcgggt 24420
tctcccacgg cgcggccggc atcgcctggc cgctgcaccg gctcgccacc gaactcggcg 24480
acccctcgct gcgcgagctc gcccgccgcg cggtccagtt cgaccgcgac ctgtacgtgc 24540
ccgccgcggg cgcctggcgt gacctgcgcc cggagatggc cggcaccgac tcctaccccg 24600
cgctgtggtg ccacggggcc gccggcatcg gcctgtcccg gctgctcatc gcgcagcacg 24660
accaggacac gcgactggcc gcggaggcca ccgccgccct cgacctggtc ggcgcgcacg 24720
gcttcggcca caaccacagc atctgccacg gcgacttcgg cgccctcgcc ctgttcgacc 24780
tggcggcacg aaccggcttc gaccccgggc gccacgacgc ggccgccgcg gccgtgaccg 24840
ccgacatcgc cgccaacgga gcccgttgtg gcctggtcgg cgacatccac atgccgggac 24900
tcatgctcgg cgccgccggc atctgcctga gcctgctgcg catcgcccac cccgcgcagg 24960
tgcccgcggt ggcctggctg cagccgccgc tgacctgagg aggagcccat gccggaagag 25020
atcgtgctca gcgtgctgga ccaggtgccg gtgttccgtg acggcagccc ggcggaggcg 25080
gtgcgcgacg cggtcgcgct ggcccgcagc gccgaacagt acggctacca ccgcttctgg 25140
atcgccgagc accacggcag cgcggccaac gcgtgcgccg cccccgaggt ggtgacggcc 25200
gcggtggccg ccgccacgag ccggatccgg gtgggcagcg gcggcgtgct gctgccgcac 25260
tacagcccgc tgaaggtggc cgagacgttc cgggtgctgg cggcgctgta tccgggccgc 25320
atcgacctcg gtttcggccg ggctcctggt gggccgccgg cgatggccga gctgctcaac 25380
ccgtacgcgg tccgcaccga cgaggcgttc ctggagcaga tcggccggct gctggggttc 25440
ctcggcgaca cccgtacggt cagccgcgtg tcggtgacgc cgcaggtgga agagcccccg 25500
gtgccgtgga tgctcggcgc cgggaccggc agcgcccgga tggccggcat gctggggttg 25560
ccgttctgtt tcgcccagtt catcgcgacc gaggagtgcc cggaggcgat cgaggcgtac 25620
cgggatgcgt tccggccgtc gccctggctg gagcgacccc agccgatgct cgccttgcgg 25680
gtgctgtgcg ccgactcgga cgcggaggcc gaggaactgg ccacgtgttt ctggatgtcg 25740
tgcacgaccg gctggcgtgc gcaggtgcag ctcaccgacg actaccgtgg gggcgcgccc 25800
aatctcgacg acgcacgccg gtaccggctg accgcggagg acctcgcgct gcgggagagc 25860
cggccgttcc tgcagatctc cgggacgccg gccgcggtgg gcaaggagat ccgcaggttg 25920
caggcggtgt acggggtatc cgaggtggtg ctcaccacga actgccccgg cctgccggcg 25980
cggcgccgct cctacgaact gctcgccggc gagttcgcat ccccggcggc ctgacggcct 26040
caggtccgcg gtagctccgc gtaggtcccg cgcaatgccg cggacctgac ggccgtcagg 26100
acaggcagac gtcgtcgctg gacagacccg acgcatacgc caggacggcg gcctgcacgc 26160
ggttggccac gccgagcttg ctcaggatca cgctgacgtg ctccttcacc gtggcggcgc 26220
tgaggaacag ctgccggctg atctccgcgt tcgtgaggcc ggcgccgagc aggcgcagaa 26280
tgctctgctc ccggtcggac agctgtttga cccgctcgca ggccggtgac ccggcccccg 26340
cggcagatcc ccgtgagccc gcacgcacga ccaccgacga cgcctcgggc gccagcacga 26400
tgctgccctc ggccagcgcc cgcacggcgg cgaccagctg ttcgggctgg ctgtcgcgca 26460
acaggaagcc gcaggcccca ccccgcagcg agtcgagcac cagctcgggt ggggcgagag 26520
tggtcagcat cgcgatcgcc ggcgggctgc tcagagcccg cagctgatcg agcacctcca 26580
gcccgtcgct ctgggcactg tggccgtcga gcagcaccac ggcaggccgg tgctgctcga 26640
cggccgatct caggttctcc cggtccgtcg tggcgaccgc gaagccgccg gtgctctcca 26700
ggatcatctt gatgccgatg ctgaccagtg cttcgccgtc cacgaccagt acgtccgtca 26760
cgatcggtcc cccgcgagcc gccgaacgca tgcaacttgc atccgcattc gtgacattac 26820
ttcacttata tggtcgaatc aatcgatttt tcgcgtatag tcattaacaa cacacagcgc 26880
gtcgtcagcg ggtcagaccc tcggccgggg cgacccgcgc cgcccgccgc gccggcgcca 26940
gactggccac caccccggtc agcaccgcca ccaccagcac ggcggccagc tggccccacg 27000
gcaggcggat caccggatcg gcggtacgcc ccacggccgc cgccaccgcg gccagcccca 27060
ccgggacacc gaccacgagg ccggccaccg tgccgagcag cgtgatcacg accgcctcga 27120
ccgcgagcat cgcccgcagc cgcgcccggc gtgtgcccag cgcccgcaac agcgccatct 27180
cgcgtacccg ctcgacgacc gacaggccca gcagattcgc gatgccgagc agtgcgatca 27240
ccaccgtgac cgccagcatc gccagcgaca gtcccaacag gatcgacagc acgttcgcga 27300
tgtcaccgcc ctcggtgacc ccgccaccga cctgcaccag cgcgtcgcgg gcggccaccg 27360
cgccgacggc ggccgacagc gcctcccggt cgaagccggg gtcagcgacg ccccacaccg 27420
ttgtcggcac cgcctcgatc cggttcgccg ccagggtccg cgcgctcacc acgcccagca 27480
gctgcccggt ggtgtccgcc agccgcgacg cccgggcgat caggttcacc cggcgctcgc 27540
cgacctcgac gacgatcggg gcgctgtccg gcaggcccag ctcggccaga taggtcgccg 27600
gcaccagcac caccggctcc ccggcgagct ccggtgccac ccgggccgcc agttcgtcgc 27660
cgggcgcggc cagcagccgc ggcgtcgcct tgccgccgtc cgggaaacgg gccgcgaccg 27720
tgccgaccgt gccactggcc gacagctgtg gcaccgcggc gaaggccccg gcggtggcac 27780
cgctgatcgg ctcgccgtcg gtgcgcaggc ccgccgccac cgggtagcgc gcctccaggt 27840
cggcgttcac cgtggcccgc ccgctggtcg ccgccaccgc caggcaggtg atcagcgccg 27900
cgccgaccac caccgccatc gccgccgaag ccgtccggcg cgcgttctgg ctcaggctgg 27960
tcccggccag gccggcggcc acgccgaaac gctccagcag ccgcgccgcc ggcgccaggg 28020
acaacgcgat cagccgcggc aacgccgcca gcaaccccgc cgccagcaga agcccgccca 28080
gcagcgccag gggcagcgac gcgccgatcg ccgccaccgc gagcgcggcg gcgcccacca 28140
cggtcaccac ggtgcccacg acgagccggc gaccgccgcg gaccgtgccg gccggcggct 28200
cgtcggccgc ctgcaacgcc cgcaccgggg cgatcctggt ggcacgccgg gccggcgccc 28260
aggcggccac cagcgtggcc agcaccccgg ccagcacaca gccggccagg gcgaacggat 28320
tgacccgcag cccgccgccg ctgatgtcga gcaggtcggc gccgagataa cccagcccca 28380
cacccgccgc cgcgccgacc aggccgccgg ctgttccggc gatcgccgcc tcggccagca 28440
cgacccggct cacctgggca cgatgaccgc cgaccagccg cagcagggcg atctgccgga 28500
tccgctggac gatcaccacg tggaaggtgt tcgcgatgac cagcaccgcc gcgagcaggg 28560
cgacagccgc gaacgccagc atgatcacga ccagctggcc gttgccgccg gcgaacctcg 28620
cggcggcctg atccgcagcc gccgaggcgt cggtcgccga gatgccgggg cccatgctgc 28680
gccgcaacgc gtcaacggtg ccggtcagcg aggcgtcgtc ggcgacagtc agcagcgcgg 28740
ccggcggcac gtcaccggcg aagaacgacg cgtcggcgta gaaccggaag tccgagccgg 28800
tcagcggccg gaaacccagg tcggcggcac cggtcacggt gaccggctgc ggcgccgcct 28860
caccgtggcg taccgtcagc gtggccccga cgtcgatgcc gaggtcgtcg agggtgcgct 28920
ggtcggcgac gagctgtccg ggcccggtgg gccacgcgcc ccggtccaag gtgaaccagc 28980
ggacctgcgg ggtggccgcg atgctctgca cgttggccga gccgcgccgc gatccgccga 29040
acacgctgac cgtgcgcgcg tactgcgcgt ccaccgagcg cacccccggc accgcggccg 29100
cggcctcgta ccaggccggg tcgcggaccg tgtcgtcggc gtcgagcacg atgtcggcgg 29160
tggtcaacgg cgcggcggcg gtacgccgca ggccctcacc cgaggtggcc gcgaaggtcg 29220
cggtcgcggc caggaaaccg gtcgccagca tcaccgccgc gacgatcgcg aacagccggg 29280
ccgggtaggc gcgcagctgg gaccaggcaa gcgcgaagat catcgtcaca ccgccaccga 29340
cgccatcgcc gcgaggatct gatcgcggcc gggactgcgc agttcctcac ggatccggcc 29400
gtcggccatc accaggaccc ggtcggcgta cgtcgcggcg cccggatcgt gggtgaccat 29460
gatgatcgtc tggccggagc ggcgtgccgc gtcgcgcagc ccgcccagca gcgcgcggcc 29520
ggtggcgatg tccagcgcgc cggtcggctc gtcggcgaag accaccgacg gcttggccag 29580
cagcgcccgc gccaccgcca cccgctgctg ctggccgccg gacagctcgg acggacgatg 29640
ccccagccgg tcggtgatct gcagtgaatc ggtgatcttc cgcagctcgc ccggatccac 29700
ccggcggccg gcgagccgta gcggcagcac gatgttctgc tccgccgtca gcgtcggcag 29760
caggttgaac gcctggaaga cgaagccgat ccggtcgcgg cgcaggtcgg tcagggcccg 29820
gtcgtccaga ccggccaatg accgcccggc caggctgacc gtgcccgccg tcggtgtgtc 29880
caatccggcc agcaggtgca tcagcgtcgt cttcccggaa ccggacgggc ccatgatcgc 29940
ggtgaactgg cccgcggaga agcccgcgga caccccgtcg acggctgtca cggcagccgg 30000
ccctgttccg tacgtcttgc tgacgtcccg gcaactgacc atctcggcgt gtgtcgtctg 30060
cgttgtcacc gcacccacgc tagaaatccg cgcggaccgg cacatcccac cacgggatcc 30120
cggtcgggcg gtggaccgat accttcgtat gacccgccgg tatcgacctc gggcgccgtg 30180
ttcccgcaat cgatgatgtc tgcttaggct gggaccgtgg tgcgagggaa ccgggtgctc 30240
aggatcgacg ccctcgtcgc cgccgcggtg gtcatcggct gtctgctcct cgggctcgcc 30300
gggctgtccg agtggtactg gtcggccgcg gtggccgtac cgttgcttct ccggcgcagc 30360
gctccgcgct gcttcctggc gctggtcgcc ggcgtctccg gcctgcacct gctggcctcg 30420
cacagcttca tgttccccgg cgatctggtc gctctggtcg cggtgcacgc cgccgcggcg 30480
cacgcgccgg gccgtgcccg ccacgccgga ctgctgctcg gcgccgccgg agctctcgtg 30540
gtggccgccc aggccctgca ggaccagcgc ctcggctcgg cgctgcccgc ggtgctgatc 30600
gtcgcgagca cgatggccgc ctggtcgatc gggctgatgc agcgccagca gcgcagcgcc 30660
gtgctcgacg ccgagcaccg ccgccggctg gccgaacagg acagcgccat gcgcgcgcag 30720
ctggccgtgc acgaggagcg cacccggatc agccaggaga tgcacgacat catcgcccac 30780
tcgctggcct cgatcatcgc ccaggccgaa ggcggccggg tcgccgcccg cgccgacgcg 30840
cggatcgccg ggccggtgtt cgaccggatc gcgggcctcg gccgtcaagc cctcaccgac 30900
gtgaaacggc tgctcaccgt cgtggaccac gacgacgaat ggcacgacga cggactggag 30960
cggctgccgg tgctgctcgc cggagtcacc gaggccgggc tggacgtgac cgtggacagc 31020
agcggggcgc cgcagccgct cgccgccggg atggacctcg ccgtgtaccg ggtgatccag 31080
gagtcgctga ccaacgtgct caagcacgcg ccggcgcgcc gggcctgcct gcggatgcgg 31140
tggacgcccg cgctgctcac ggtcacggtg agcagcccgc ttcccggtgg ccgcggcgcc 31200
ggcctggtcg aggggcgcgg cctgtccggg atccggcagc gctgctcact gttcaacggc 31260
gactgcaccg tcaccgcgac cacggaactc accgtcacca ccacctggcc cctcaccccg 31320
gaaggagcgc gcgcatgacg cggccaccga tcgccgtgct gatcgccgac gatcaggagc 31380
tggtacgcac cggtttcgcg atggtcgtcg acgcggcgcc ggacatgcgg gtcgtggcca 31440
tcgccgcgag cggcgcggag gcgatcgagc tggccgccga acaccggccg gacgtcatcc 31500
tgatggacat ccgcatgccg ggcaccgacg ggatcaccgc gaccagcgcg atcctggccg 31560
ccggcggcga gcggccaccg aagatcatcg cgctgacgac gtacgacagc agcgactacg 31620
cgacgcggat cctcaccgcc ggggccagcg gctatctgct gaaggacgcg accgccgagg 31680
gcctgacggc ggcgatccgc agcgcgtacc acggcgggtc ggtgatcgcc ccgacgacga 31740
cccggaacct ggtcgcggcc cgcgccgagc caccgccgcc ggctcgcgac ccggcgccgc 31800
tggacacgtt caccgcccgg gaacgcgacg tgttcgacct gatcgtggcg ggcgccaaca 31860
acgcggagat cgcggcccgg ctgcacctgg ccgaggtgac ggtgaagacg cacgtcggcc 31920
gggtgctggc caagctcggg gtacgcgacc ggctcaacgt agtcgtctgg gcgtaccgca 31980
acggcgctgt cggctgatcc gcaccctcag gcccttgaca cggtgccacg gtggcacggt 32040
gtgatagacc cgggtcgttt cgcctcacac tggtggtggt gcggtgagtt cctgggtacg 32100
ccggcgcgat cacaacgtct tcgtcaacgc gttcaacatg ctcatatgcg gcctcatcgc 32160
cggcgtcgtc gtggccgctg ccgcgttccc gttcgccgcg atgtccggcc tggccgccaa 32220
ggccggccag cagacgttcg cgagcctgcc cagcgagctg aaggcgttcc ggtcaccgca 32280
gatcagccgg atctacgccg ccgacaacag gacccaggtc gcccagttct acgacgagtt 32340
ccgcagtgac gtcccgctca aggagatgtc gccgttcatg cgcgacgcca tggtcgcggc 32400
cgaggaccgg cagttctacc agcaccacgg cgtggacctg aaaggcgcgg cgcgtgcgct 32460
ggtcaacaac cgcaacggcg ggcagaaaca gggcgcgtcg acgatcacca tgcagtgggt 32520
acggatctcg ctggcctact cggcgaccaa gccgcaggac gtcatcgacg ccaccgagga 32580
cgccccgaag cgcaaggtcg ccgagatgaa gtacgcgctc gaggtggaga agcagctcag 32640
caaggaccag atcctggagc ggtacctgaa catcgtgccg ttcggcaagc agacgtacgg 32700
catctacgcg gccagccggg tctacttcaa caagaagccc aaggacctca cgatcggcga 32760
ggccgcgctg ctggccgcca tcgtgaaggc gccgtccgcg tacgacccca ccgacccgga 32820
cggttacgag ctcatccggc agcggcgcaa cgcctatgtc atcccgggca tggtggagat 32880
gggcgccatc acccgggcgc aggccgacgc ggcgctcaag gaggccatcc cgcgcaaggt 32940
acgcccgatg agcaacggct gcgtgtcggt ggccaagaac aactggggct tcttctgcga 33000
ctacttctac cgctggtgga tggagcgcaa ggagttcggg cccacgccgt acgaccggga 33060
gcgccggctg aagagcggcg gctaccggat caccacgaca ctcgacgtca aggcgcagaa 33120
gcaggcccgg gatcggatcg gcgacctgat ctccgagaag aacaagaacg cgctgctgct 33180
ggcagccgtc gagcccggca ccggcaaggt acgcatgctc gccgccaacc gccggtacaa 33240
gctggacgat ccggatgatc cgcagaacgc gatctcctcc gacccgagaa aggcgcgcaa 33300
gggcatccgt ggctcgtacc cgaacacgac gaatcccctg ctgaccggcg gcggcgacat 33360
caccggctac caggccggct cggtgatgaa gatgttcacc atcgtcgccg cgctggagca 33420
gggctacccg ctcgcctaca cgatcaggac gcagagccgg taccgctccc gctacatcat 33480
cgagagcagc aacgacgcgg cctgccccgg aacgcacttc tggtgtccca gcaacgccgg 33540
tggcggcggc gagggtgtct tcaacatgtg gaccggcctg ggcaggtcga tcaacacgta 33600
cttcgtgccg ctggaggaac gcgtcggcgc ggagaaggtg gtcagcgccg cgaaacgctt 33660
cggcatccag ttccgggagc cggacgacgc actgctggcc gaaccgggca acgcacacca 33720
gtggggcgcc ttcaccctgg gcgtctcggc caccaccccg ctggacatgg ccaacgccta 33780
cgccaccctg gccgccgacg ggatgtactg cccgccgacc ccgatcgagc ggatcgccac 33840
ccgtgacggc gaccagctgg acgtcggccg gtccccgtgc gtacgggcga ccgccaagga 33900
cgtcgcccgc gccgccctcg acgcggcccg ctgcccggtg ggcgactccg cgcagctcgg 33960
ccggtgcggg ggaagcaccg ccggcatcac ccggtcggtg gtcgggcatc cggtgttcgg 34020
caagaccggc accaccgacc gcgaccggac cgcctcgctg atcgccggca ccaccgcgct 34080
ggtggtcgcc ggttacctgg tcaaccccga ctaccagaac caccgcgacc ggctcgacca 34140
cgaccaggtc aacccggccg tctaccgcac gctcgccgac tacatggagg gcaggccacg 34200
ggagtcgttc aagcggccgt cgagcgggcg gatcgcgttc ggtgaccagc gctcgatccc 34260
ggacgtcgag tgcgacccga tgccccgcgc ccgcgaccgt ctggaggatg ccggcttcga 34320
cgtctggcga ggccaggaag tggagtcgga ctgtcccgcg ggcaccgcgg ccggcaccga 34380
gccgagcggc cggaccgtca agaacggcgt ggtggtgatc caggtgagca agggccgccg 34440
gggcgcgtca ccgccgatct tcccgccgat cgggccaccc cgctgaccgg ctgacggcgt 34500
agacgtcgcc ggcgttcgcc tcgtgcggca gcccggccag gtgcgcgagc atctcgtcgc 34560
gggcggccca ccggccgaag gtgcgggcca tggtctcgcc cagggagacg tcgaagccgt 34620
cgaagcccag ctcgccggca cggtcgaggc agcgccgggc cacgtcccgg gcgatcgtcg 34680
tgaactcgaa cgacaacgcc cggacaccgc ggctcagacc ggcgagcacc gcgtcctcgt 34740
acccttcgac gtcgatcttg atgaaggccg gcaggccgaa tcgctggacg agcgtgtcca 34800
gggtgaccgc agggacggtg atctgctggt cccagacctc gttctcccag ccgcgcgagc 34860
cggtcgccgc ggtcaggaag cgcaccgagt tcgtggagac cgtcgggttc gccgagttga 34920
tgtagagcgg cacgctcccg ccggcgggcc cgcacgcggc ctcgacgagc gccacccggt 34980
cgtcgtgggc gtagagcgcg cgcagcgccc gcatgcacag cggctgcggt tcgacggcga 35040
ccacgcgggc gccgagccgc cggaagcagg cgacccggtc accgacgtgc gcgccgatgt 35100
cgaagacgac gtcacccggc cggacgaaac gccggtacat cgcgtccatc gcggcctccc 35160
ggccggcgtc accgtagtag taacgcagcg accgggtcag cggcgccatg gccgggtcga 35220
ctctcagttt gcgcaggtca tcggtcacgg cgggggcatt cccccgatca ggcgatccat 35280
gcatcgccgg cgcgtgcgca ggtaggcggc gatcgcccgg gcggaacgca cgcccgaggt 35340
ggtcatgacg ttgtgcgcgg cggccgggac ggtcaccgac acgccgccgg tcatcgccgc 35400
cacctcggca cgccagcgca gcggcgccac cggatcaagc gacccgccga gcaccagcgg 35460
gggtacgggc aaccggcgca gatcctcctc gatcgcgttg cgtaccgagt ggccgaccgt 35520
ggccagaacc cgccacggct tggcgtcggc gatgtcgcgg accagcaccg gcgcctgcca 35580
cggcgcctcg atccacaggt ccaccgccca ccggccgatc agcgcccgcc gggaccgggc 35640
cgccgggtcg gtggtcgggc tggccagcac gacggcggcg accaggtccg gccgcagcac 35700
cgcgagacgg gccgccacct cggcgccgaa cgagtgcccg gcgatgcagg cccggggcac 35760
gccgagcacg tccagccagg ccgcgaggtg ttcggcgtgc cggcccacgt cgtacgcgcg 35820
gcgcggcttg tcgctgaacc cgaacccggg aaggtccgga acgaggaccg gatggcggcc 35880
cgccagcgcg tgggcggtgg gcatcaggta gcggtgcgag acggcgagcc cgtgtaccag 35940
caccaccgga aggccgccgg cgtggcacgc gtgccggtcg tgcgtacgca ctccaccgac 36000
cgtcaccagg cggctgtcga atcggggcac cgcggagatg taccccgtcc ttccgcaatc 36060
tttcccgcgc ggttagtttc gagttgtgtc gccgcccttc cggctcgacg aggcggtcgc 36120
cgacgtctac ggcgacctgc gcctggcgcc cgtgctgcgg cggctgctgc ggcacagcgg 36180
ccgcctgacc ggctcggtgg ccggcagcgt gtcgctgatc gacgcggacc gcggctgcta 36240
cgtcaaggcc gccgagtacg gcgcgaactg ccagctcgga cgctctttcc cgctcgacga 36300
gggcgccacc ggccgcgcct tcggcagccg ccggcccgtg gtgatcccgg actacggtca 36360
gctgcgggcc ggtcatctcg cggcggcgca tccggcacgg aagggcccgg ccgtcgctgt 36420
gccgatctgg tggcgcggcg acgtgatcgc ggtgaacgtc gccttcgcgc cggccttctc 36480
cctgggtggt gtcgacgaac tggaggcgct gacccagtcc gcggccgccg cgatcgtccg 36540
cagccggggt gtgcgggtcc gcgccgaccc gccgtacgcg gctccggccg caccgttcac 36600
cccgcgcgag gccgaggtcc tcgatctgct ccggcagggt ctgaccgacc gcgagatggc 36660
ccgccggctc ggcctgtccg cgaagaccgt ggagaagcac gtcggcgcga tcaggcgcaa 36720
gaccgggacc tccaaccgta cggcggcggt cgtcacggcc ctggacaacg actgggtggg 36780
gaatcttccc cataccgcgg agcacaccac cgggtcttga ctggcggcat gcccgtcgtc 36840
tccatgaagg acatcctcga ccgtgcgctg gccgagcggt acggtgtggc cgccttcaac 36900
atcgtcaacg acctgaccgt cgaggccgtg ctcgccgccg cggcggagga acgcgccccg 36960
gtcatcctgc agacctcggt caagacggtc cggatgtacg gccgcccccg gctgtacgag 37020
atcgtccacg ccttcgccca cgacgcgccc gtcccggtga ccctgcacct ggaccactgc 37080
cccgagcggt cggtcatctc cgactgcctc gccggcggct ggaactccgt gctcttcgac 37140
gcgcacgagc tcgacgtggc cgacaacctg cgccagacca ccgaggtggt ggccgaggcc 37200
cgtcgcgccg gcgcccacgt cgagggcgag atcgagggca tccagggtgt cgaggacgac 37260
gtcggcaacg actacgcccc gatggtgcag agcctggagg tggcggtcga cttcatcaaa 37320
cgcaccggcg tcgactgttt cgcgccggcc atcggcaacg cgcacggcca gtacaagcag 37380
gcgcccgtgc tcaacacccg ccgggtcagc gacctcgttg cggccaccgg catcccgatg 37440
gccctgcacg gcggcaccgg cctctccgac gagcagttca ccgacctcat cgcccgtggc 37500
tgcgcgaagg tcaacatctc cacggcgctc aaggagtcgt tcatgaaatc cggcctggag 37560
ttcctgcgcg aggccgatga gcgcggcaaa tgggatccgc cgtcgctgtt ccggcatcag 37620
cgggcggcgg tcgtagagat ggcccggcag cacatccggc tcttcggcgg atcggggcgc 37680
gcgtggtgaa cgccctggtc ttcgactgcg acggcgtgct ggccgacacc gaacggcacg 37740
gccacctgcc cgcgttcaac gccacgttcg agcagttcgg gctgcccgtg cggtggagcg 37800
aggaggaata cggcgagaag ctgcgcatcg gcggcggcaa ggagcggatg gcgtcgctgt 37860
tcgccgatcc cgccttcgcc gcggcggccg gcgacaccga ccgtacggaa ctgctgcgaa 37920
cctggcaccg cgccaagacc gcggctttca cgaagctggt cgccgagggc cggattccgg 37980
cccgtccggg cacagcccgg atcatcagcg aggcactccg ggcaggatgg acggtcgcgg 38040
tcgcttccac gtcggccgag gattcggtac gcgcagtgct cgtcaacgcc gtgggagcga 38100
cgactgccga gcggatcccg gtgttcgccg gagacgtcgt gcccgcgaag aaacccgacc 38160
cggcgatc 38168
<210> 101
<211> 146
<212> PRT
<213> Actinoplanes garbadinensis
<400> 101
Met Pro Arg Arg Ser Thr Arg Cys Ser Pro Ala Cys Arg Pro Gly Ala
1 5 10 15
Ala Asp Gln Pro Asp Pro Gly Arg Ala Cys Arg Pro Asp Cys Gly Arg
20 25 30
Ala Asp Arg Ser Gly Ser Gly Arg Ala Cys Arg Pro Asp Cys Gly Arg
35 40 45
Ala Asp Arg Ser Gly Ala Asp Arg Pro Ser Ala Ala Ala Leu Val Ser
50 55 60
Gly Met Pro Arg Arg Thr Gly Val Gly Gly Ala Pro Gly Arg Leu Ile
65 70 75 80
Glu Ala Arg Ala Val Leu Pro Glu Leu Ile Gly Ala Ala Arg Asp Arg
85 90 95
Arg Ala Ser Cys Val Glu Gln Arg Val Arg Ser Leu Thr Ala Cys Arg
100 105 110
Ala Cys Ala Cys Arg Arg Ala Ala Ala Pro Ala Ala Pro Arg Thr Pro
115 120 125
Pro Arg Pro Ser Ala Ala Pro Ala Pro Gly Ser Asp Ala Gly Gly Arg
130 135 140
Cys Gly
145
<210> 102
<211> 149
<212> PRT
<213> Actinoplanes garbadinensis
<400> 102
Val Ser Val Ser Leu Leu Leu Val Pro Leu Ala Met Ala Gly Ala Ala
1 5 10 15
Ala Val Gln Ala Ala Ala Gly Arg Met Asp Asp Gly Arg Leu Ile Cys
20 25 30
Gln Val Gln Thr Arg Met Arg Asp Val Thr Leu Leu Asp Ala Ala Leu
35 40 45
Arg Asp Thr Gly Ala Thr Val Thr Ala Ala Gly Asp Thr Ile Ser Ala
50 55 60
Thr Trp Thr Gln Ser Ala Ala Thr Phe Thr Arg Gly Ala Asp Gly Ile
65 70 75 80
Trp Ala Ala His Val Thr Gly Val Asp Gln Pro Gly Ala Val Glu Leu
85 90 95
Met Thr Thr Val Asp Thr Ala Tyr Gly Arg Arg Val Gln Gln Ala Val
100 105 110
Leu Glu Arg Leu Arg Ala Gln Ala Pro Glu Ala Gly Leu Arg Leu Glu
115 120 125
Ser Glu Ser Val Gly Gln Asp Ala Ser Val Arg Leu Val Phe Glu Val
130 135 140
Glu Arg Glu Arg Ala
145
<210> 103
<211> 518
<212> PRT
<213> Actinoplanes garbadinensis
<400> 103
Val Glu Arg Ser Phe Ala Glu Thr Phe Ala Gln Leu Leu Lys Ala Arg
1 5 10 15
Phe Pro Val Leu His Leu Glu Thr Tyr Glu Glu Gln Arg Ala Leu His
20 25 30
His Leu Ala Gly Ile Ala Gly Asp Ala Asp Leu Val Arg Val Pro Arg
35 40 45
Ala Val Trp Thr Trp Ser Leu Thr Ala Gly Leu Val Gln Pro Asn Gly
50 55 60
Glu Ala Arg Ser Gly Ala Gln Arg Ala Thr Asp Ala Leu Arg Ala Val
65 70 75 80
Gln Arg Ile Asp Glu Pro Ala Val Phe Val Phe Arg Asp Leu His Pro
85 90 95
Leu Phe Ala Gln Ser Pro Glu Val Val Arg Leu Val Arg Asp Ile Ala
100 105 110
Gln Ala Phe Arg Ala Gly Arg Ser Pro Arg Thr Leu Val Leu Leu Ser
115 120 125
Pro Val Leu Asp Leu Pro Val Glu Leu Ser Lys Asp Val Thr Ile Val
130 135 140
Asp Phe Pro Leu Pro Gly Gln Leu Glu Leu Arg Ala Leu Leu Asp Ala
145 150 155 160
Met Val Arg Gly Asn Thr Ala Ser Gly Arg Leu Arg Val Glu Leu Asp
165 170 175
Glu Gln Ser Arg Glu Arg Phe Val Thr Ala Ala Ala Gly Leu Thr Met
180 185 190
Gln Glu Ala Glu Asn Ala Tyr Ala Arg Ala Met Val Asn Asp Ala Val
195 200 205
Leu Asp Leu Ala Asp Leu Glu Ile Val His Glu Glu Lys Arg Gln Thr
210 215 220
Val Arg Lys Ser Gly Val Leu Glu Phe Met Ala Ala Gly Thr Val Leu
225 230 235 240
Asp Asp Val Gly Gly Leu Glu Asn Leu Lys Ala Trp Leu Val Lys Arg
245 250 255
Asn Gly Ser Trp Leu Asp Glu Ala Ala Gly Tyr Gly Leu Pro Ala Pro
260 265 270
Arg Gly Val Leu Ile Thr Gly Val Pro Gly Cys Gly Lys Ser Leu Thr
275 280 285
Ala Lys Ala Val Ala Thr Ala Trp Asn Leu Pro Leu Leu Arg Phe Asp
290 295 300
Ile Gly Arg Val Phe Ser Gly Leu Val Gly Ser Ser Glu His Asn Met
305 310 315 320
Arg Thr Ala Leu Arg Thr Ala Glu Ala Val Ala Pro Cys Val Leu Trp
325 330 335
Val Asp Glu Ile Glu Lys Gly Phe Ala Gly Gly Thr Gly Gly Asp Ser
340 345 350
Gly Thr Gly Ala Arg Val Phe Gly Thr Phe Leu Thr Trp Met Gln Glu
355 360 365
Lys Arg Thr Pro Val Phe Val Ile Ala Thr Ala Asn Asp Phe Asp Gly
370 375 380
Leu Pro Pro Glu Leu Leu Arg Lys Gly Arg Phe Asp Glu Thr Phe Phe
385 390 395 400
Val Asp Leu Pro Ser Arg Ser Glu Arg Val Ala Val Trp Arg Val His
405 410 415
Leu Gly Arg Ala Leu Arg His Arg Arg Ala Ala Gly Glu Leu Arg Val
420 425 430
Asp Ala Glu Leu Leu Thr Glu Leu Ala Gly Leu Thr Glu Gly Tyr Ser
435 440 445
Gly Ala Glu Ile Glu Gln Ala Val Ile Ala Gly Leu Phe Asp Ala Phe
450 455 460
Ser Glu Arg Arg Pro Leu Arg Arg Asp Asp Leu Val Arg Ala Val Met
465 470 475 480
Ser Ile Val Pro Leu Ser Val Thr Gln Ala Glu Arg Val Asp Ala Leu
485 490 495
Arg Gly Trp Ala Arg Asn Arg Ala Val Ser Ala Thr Gly Thr Asp Asp
500 505 510
Trp Asp Leu Thr Asn Arg
515
<210> 104
<211> 203
<212> PRT
<213> Actinoplanes garbadinensis
<400> 104
Val Gly Glu Leu Asp Gln Gln Arg Ile His Pro His Asn Asn Ile Trp
1 5 10 15
Gly Ser Gly Ala Gly Thr Gln Thr Ile Trp Ala Arg Ser Gly Thr Asn
20 25 30
Trp Gly Val Val Ala Asn His Pro Arg Thr Ser Gly Val Lys Ser Tyr
35 40 45
Pro Asn Thr Gly Lys Thr Leu Asn Arg Thr Leu Ser Ser Leu Asn Ser
50 55 60
Leu Thr Ser Ser Phe Asn Val Ser Val Pro Ser Ser Gly Asp Tyr Ser
65 70 75 80
Thr Thr Tyr Asp Ile Trp Ala Asn Asn His Ala Tyr Glu Val Met Ile
85 90 95
Trp Thr Asn Gln Gln Gly Ala Val Gly Pro Ile Ala Glu Gln Tyr Asp
100 105 110
Ala Asn Gly Ala Val Pro Asn Val Arg Asn Leu Ser Val Gly Gly His
115 120 125
Thr Trp Asn Val Tyr Arg Gly Ser Asn Gly Ala Asn Ala Val Phe Ser
130 135 140
Phe Ile Arg Thr Asn Thr Asn Ser Gly Thr Val Asp Ile Leu Ala Ile
145 150 155 160
Leu Asn Trp Leu Arg Thr Asn Gly Trp Trp Gly Asp Val Thr Val Gly
165 170 175
Glu Ala Gln Phe Gly Phe Glu Ile Ser Gly Thr Ala Gly Gln Ser Asn
180 185 190
Phe Thr Val Asn Asn Phe Ser Leu Asn Tyr Ser
195 200
<210> 105
<211> 219
<212> PRT
<213> Actinoplanes garbadinensis
<400> 105
Met Arg Arg Arg Thr Leu Ala Leu Ser Leu Ala Ala Ser Ala Ala Leu
1 5 10 15
Ile Ala Gly Ala Gly Val Val Thr Ala Leu Pro Ala Ser Ala Ala Ala
20 25 30
Gly Cys Arg Val Ala Tyr Thr Val Ser Ser Gln Trp Pro Gly Gly Phe
35 40 45
Gly Ala Asn Val Thr Ile Thr Asn Leu Gly Asp Pro Leu Thr Asn Trp
50 55 60
Thr Leu Val Trp Ser Tyr Ser Gly Gly Gln Thr Val Thr Gln Ala Trp
65 70 75 80
Asn Thr Ser Leu Thr Gln Ser Gly Ser Gln Val Thr Ala Arg Asn Ala
85 90 95
Gly Tyr Asn Gly Ser Val Gly Thr Asn Ala Thr Val Ser Phe Gly Phe
100 105 110
Asn Gly Ser Gly Ala Ala Thr Pro Ala Pro Gly Thr Phe Thr Leu Asn
115 120 125
Gly Thr Ala Cys Thr Gly Ser Ala Gly Pro Thr Ser Pro Ser Ser Gln
130 135 140
Pro Pro Thr Asn Gly Val Pro Ser Asp Ala Val Trp Val Asp Ser Gly
145 150 155 160
Gln Trp Ala Asn Trp Thr Asn Asn Gly Tyr Ile Leu Thr Thr Thr Ser
165 170 175
Gly Ala Arg Ala Pro Ala Pro Arg Pro Ser Gly Arg Ala Ala Ala Pro
180 185 190
Thr Gly Ala Ser Ser Arg Ile Thr Arg Ala Pro Ala Gly Ser Ser Pro
195 200 205
Thr Pro Thr Pro Glu Arg Pro Ser Thr Val Arg
210 215
<210> 106
<211> 161
<212> PRT
<213> Actinoplanes garbadinensis
<400> 106
Met Thr Ile Thr Glu Thr Asp Leu Ala His Leu Arg Arg Cys Val Asp
1 5 10 15
Leu Ala Arg Glu Ala Leu Asp Asp Gly Asp Glu Pro Phe Gly Ser Val
20 25 30
Leu Val Ser Ala Asp Gly Lys Val Leu Phe Glu Asp Arg Asn Arg Val
35 40 45
Arg His Gly Asp Ala Thr Gln His Pro Glu Phe Ala Ile Ser Arg Trp
50 55 60
Ala Ala Glu His Leu Thr Pro Arg Glu Arg Ala Ser Ala Thr Val Tyr
65 70 75 80
Thr Ser Gly Glu His Cys Pro Met Cys Ser Ala Ser His Gly Trp Val
85 90 95
Arg Leu Gly Arg Ile Val Tyr Ala Ala Ser Ser Ala Gln Leu Thr Ala
100 105 110
Trp Tyr Lys Glu Trp Gly Ile Pro Ala Gly Pro Val Ala Pro Leu Pro
115 120 125
Ile Thr Thr Val Val Pro Gly Ala Val Val Glu Gly Pro Val Pro Ala
130 135 140
Phe Glu Ala Glu Leu Arg Glu Leu His Arg Ala Arg Phe Thr Pro Ala
145 150 155 160
Gln
<210> 107
<211> 413
<212> PRT
<213> Actinoplanes garbadinensis
<400> 107
Val Thr Thr Pro Leu Val Ala Gln Ala Gly Asp Ser Thr Thr Gly Leu
1 5 10 15
Thr Gly Leu Gly Leu Val Glu Asp Ala His Gln Ile Ala Glu Ala Ile
20 25 30
Arg Gly Asn Ser Trp Val Asp Gly Val Leu Gly Gly Val Gly Ala Ser
35 40 45
Leu Asp Gly Leu Ala Leu Ala Ile Asp Pro Leu Gly Thr Leu Ala Ala
50 55 60
Trp Gly Val Ala Trp Leu Ile Glu His Val Gln Pro Leu Gln Asp Ala
65 70 75 80
Leu Asp Trp Leu Ala Gly Asp Val Asp Glu Ile Ala Ala Gln Ala Ala
85 90 95
Thr Trp Arg Asn Val Ala Ala Phe Thr Asp Ser Ala Gln Gln Asp Tyr
100 105 110
Ala Asp Arg Leu Arg Thr Glu Val Ala Gly Trp Phe Gly Ala Ser Gly
115 120 125
Asp Ala Tyr Arg Ala His Ala Ser Glu His Leu Ala Ala Leu Lys Gly
130 135 140
Ile Ser Thr Ala Ala Gly Gly Ile Ser Ser Ala Val Glu Gly Ala Gly
145 150 155 160
Leu Leu Val Ser Leu Val Arg Gly Ile Val Arg Asp Leu Ile Ala Gln
165 170 175
Phe Val Ala Thr Leu Ala Val Arg Leu Pro Gln Trp Leu Ala Ala Glu
180 185 190
Gly Leu Thr Leu Gly Leu Ala Thr Pro Val Val Ala Ser Gln Val Ala
195 200 205
Ala Leu Val Ala Arg Gly Val Asn Lys Ile Gln His Phe Ile Arg Ala
210 215 220
Leu Leu Asn Ser Leu Arg Arg Leu Met Pro Met Ile Asp Arg Leu Gly
225 230 235 240
Glu Val Leu Glu Arg Leu Arg Met Leu Thr Asp Arg Leu Ala Arg Ser
245 250 255
Ser Pro Ser Thr Arg Pro Glu Pro Thr Pro Gly Pro Ala Thr His Ala
260 265 270
Gly Thr Glu Asn Ala Ser Gly Asn Lys Pro Glu Gly Asp Leu Glu Pro
275 280 285
Asn Glu Pro Arg Pro Ala Glu Ala Asp Ala Arg Asp Ser Thr Pro Gln
290 295 300
Ala Phe Val Asp Glu Val Val Ser Asn Pro Arg Ser Val Ala Gly His
305 310 315 320
Ser Ala Gln Ser Ile Ala Asp Gln Phe Asn Ala Ala Gly Tyr Ser Ala
325 330 335
Val Val Glu Gln Ser Thr Arg Ser Gly Thr Ser Gly Asn Ala Ile Gln
340 345 350
Val Arg Ile His Gly His Pro Asp Ile Thr Asn Ile Gln Val His Pro
355 360 365
Gly Gly Gly Arg His Thr Pro Glu Gly Ser Pro Tyr Trp Lys Ile Ser
370 375 380
Thr Asn Thr Val Gly Lys Ile Trp Ile Ile Pro Glu Asn Phe Arg Gly
385 390 395 400
Ala Asp Glu Leu Arg Gly Asn Val Val Arg Tyr Asp Lys
405 410
<210> 108
<211> 217
<212> PRT
<213> Actinoplanes garbadinensis
<400> 108
Val Gly Lys Pro Cys Pro Asp Leu Val Glu Val Leu Ser Arg Glu Ile
1 5 10 15
Gln Ala Gly Asn Gln Gly Ala Ser Ala Ser Glu Val Val Glu Ile Phe
20 25 30
Asp Leu Glu Leu Val Gly Ile Phe Arg Gly Ala Val Thr Gln Lys Leu
35 40 45
Pro Gly Ile Glu Val Leu Arg Lys His Leu His Leu Lys Gln Gly Gly
50 55 60
Val Gln Val Arg Ser Val Val Val Arg Ala Glu Asp Pro Ala Gly Ile
65 70 75 80
Val Val Val Gly Asp Leu Cys Ala Arg Ile Asp Asn Arg Asp Val Gly
85 90 95
Leu Ala Gln Gly Asp Ala Tyr Trp Glu Arg Arg Asp Asp Thr Val Asp
100 105 110
Arg Leu Asp Gln Ile Arg Ala Asp Ser Pro Cys Glu Phe Asp Asp Met
115 120 125
Val Arg Leu Gly Ala Gly Val His Gly Asp Gly Gln Arg Arg Val Arg
130 135 140
Gln Arg Phe Ala Asp Val Ala Asn Leu Phe Gly Val Gln Arg Ala Ile
145 150 155 160
Ile Asn Glu Ser Arg Ile Arg Thr Lys Ile Asp Pro Asp Asp Val Asp
165 170 175
Ala Gln Gly Asp Glu Arg Gly Ser Phe Pro Arg Gly Ser His Pro Ile
180 185 190
His Phe Asp Asp Leu Ile Cys His Ser Ala Pro His Ser His Ala Val
195 200 205
His Arg Arg Pro Gly Asn Phe Arg Gly
210 215
<210> 109
<211> 592
<212> PRT
<213> Actinoplanes garbadinensis
<400> 109
Val Ser Asp Val Val Val Glu Arg Leu Thr Ala Trp Asp Val Glu Arg
1 5 10 15
Val Phe Gly Tyr Ser Gly Asp Gly Ile Asp Gly Val Ile Gly Ala Leu
20 25 30
Arg Arg Ala Gly Arg Pro Thr Phe Val Gln Ala Arg His Glu Glu Gly
35 40 45
Ala Ala Phe Met Ala Val Gly His Ala Lys Tyr Thr Gly Gly Ala Gly
50 55 60
Val Cys Leu Ala Thr Gln Gly Pro Gly Ala Val His Leu Leu Asn Gly
65 70 75 80
Leu Tyr Asp Ala Lys Leu Asp Ser Lys Pro Val Val Ala Ile Val Gly
85 90 95
Gln Gln Val Ser Thr Val Leu Gly Ser Ala Tyr Gln Gln Glu Ile Asp
100 105 110
Leu Val Arg Leu Phe Gly Asp Val Cys Ala Gln Phe Val Gln Ala Ala
115 120 125
His Thr Ser Glu Gln Val Pro Met Leu Leu Asp Arg Ala Phe Arg Thr
130 135 140
Ala Leu Ala Thr Arg Ser Pro Thr Cys Val Val Leu Pro His Asp Val
145 150 155 160
Gln Thr Ala Pro Ala Pro Asp Pro Gln Ala His Glu His Gly Val Leu
165 170 175
Ala Thr Ser Ala Gly Leu Arg Pro Ala Arg Val Val Pro Arg Pro Glu
180 185 190
Asp Leu Arg Glu Ala Ala Glu Val Leu Arg Ser Gly Glu Arg Val Ala
195 200 205
Ile Met Val Gly Gln Gly Ala Tyr Gly Ala Glu Arg Glu Ile Val Glu
210 215 220
Leu Ala Gln Arg Leu Gly Ala Gly Val Thr Thr Ser Leu Leu Gly Lys
225 230 235 240
Pro Val Leu Asp Glu Asn Leu Pro Phe His Thr Gly Val Met Gly His
245 250 255
Leu Gly Thr Thr Ala Ser Ala Glu Leu Met Arg His Cys Asp Thr Leu
260 265 270
Leu Leu Ile Gly Thr Asn Asp Pro Trp Thr Glu Phe Tyr Pro Arg Pro
275 280 285
Gly Gln Ala Arg Ala Val Gln Ile Asp Val Asp Gly Arg Arg Leu Gly
290 295 300
Val Arg Tyr Pro Val Glu Val Pro Leu Leu Gly Asp Ala Val Glu Thr
305 310 315 320
Leu Arg Glu Leu Leu Gly Leu Leu Pro Ser Arg Ala Ser Gly Ala Trp
325 330 335
Gly Ala Arg Val Glu Glu Trp Val Gln Arg Trp Arg Leu Ile Ser Ala
340 345 350
Ala Arg Ala Ala Ala Pro Ala Glu Pro Val Asn Pro Gln His Val Ile
355 360 365
Arg Ser Leu Ser Asp His Leu Pro Ala Asp Ala Gln Val Ala Val Asp
370 375 380
Val Gly Ser Val Val Tyr Trp Tyr Ala Arg His Leu Arg Leu Pro Arg
385 390 395 400
Gly Val Pro Ala His Leu Ser Ser Thr Leu Ala Ser Met Gly Cys Gly
405 410 415
Leu Pro Tyr Gly Leu Ala Ala Lys Leu Ala Ala Pro Gln Arg Pro Val
420 425 430
Val Val Leu Ala Gly Asp Gly Ala Met Gln Met Ala Gly Met Ala Glu
435 440 445
Leu Ile Thr Val Ala Ala Arg Trp Arg Asp Trp Ala Asp Pro Arg Phe
450 455 460
Val Val Cys Val Leu Asn Asn Arg Asp Leu Ala Glu Val Ser Trp Glu
465 470 475 480
Gln Arg Glu Thr Glu Gly Glu Pro Arg Phe Val Thr Ser Gln Glu Leu
485 490 495
Pro Asp Val Pro Tyr Ala Arg Tyr Ala Glu Leu Leu Gly Leu Arg Gly
500 505 510
Val Arg Ile Thr Asp Pro Ser Asp Leu Thr Gly Ala Trp Glu Ala Ala
515 520 525
Leu Ser Ala Asp Arg Pro Thr Leu Ile Glu Ala Val Val Asp Pro Ala
530 535 540
Ile Pro Leu Leu Pro Pro Gly Gln Pro Tyr Glu Lys Val Gln Ala Met
545 550 555 560
Tyr Ala Gly Leu Ala Ala Glu Lys Gly Asp Gln Ala Arg Arg Ala Glu
565 570 575
Ala His Leu Arg Arg Glu Arg Ala Asp Glu Gly Phe Asp Asp Pro Ser
580 585 590
<210> 110
<211> 266
<212> PRT
<213> Actinoplanes garbadinensis
<400> 110
Val Ser Arg Asp Lys Thr Tyr Arg Pro Val Arg Pro Asp Gly Ile Arg
1 5 10 15
Thr Thr Phe His Asp Gly Val Leu Gly Arg Met Arg Ile Arg Cys Leu
20 25 30
Gly Glu Pro Arg Pro Gly Val Pro Glu Ile Val Met Ile Gln Gly Met
35 40 45
Thr Val Ser Asp Tyr Leu Leu Pro Gly Leu Gly Ala Leu Ser Ala Trp
50 55 60
Thr Arg Val His Leu Val Glu Leu Pro Gly Gly Ser Gly Ser Gly Arg
65 70 75 80
Pro Pro His Asp Leu Thr Val Glu Glu Tyr Ala Arg Ala Ala Ala Asp
85 90 95
Trp Leu Cys Ala Gln Arg Leu Gly Arg Ile Val Leu Ala Gly His Ser
100 105 110
Ser Gly Thr Gln Val Ala Ala Glu Thr Ala Leu Leu Cys Pro Asp Glu
115 120 125
Val Ala Gly Val Val Leu Ala Gly Pro Ala Ile Asp Pro Val Ala Arg
130 135 140
Gly Gly Leu Arg Val Phe Ala Arg Trp Trp Ile Asp Arg Arg Gly Asp
145 150 155 160
Pro Lys Ser Leu Asp Glu Val His Lys Pro Glu Arg Glu Gln Val Gly
165 170 175
Phe Arg Arg Leu Phe Gln Val Leu Arg Ala His Leu Arg His Asp Leu
180 185 190
Glu Lys Pro Val Val Gly Leu Cys Val Pro Val Leu Val Ile Arg Gly
195 200 205
Ser Glu Asp Arg Leu Gly Thr Ala Arg Trp Ala Arg Arg Leu Ala Asp
210 215 220
Leu Ala Ala Val Gly Gly Arg Tyr Val Glu Val Pro Gly Thr His Ser
225 230 235 240
Phe Cys Trp Arg Tyr Pro Gln Ala Trp Ser Ala Pro Ile Arg Glu Phe
245 250 255
Ala Gly Trp Ser Val Ser Val Ser Gly Thr
260 265
<210> 111
<211> 396
<212> PRT
<213> Actinoplanes garbadinensis
<400> 111
Met Thr Glu Ala Asp His Arg Pro Thr Val Leu Arg Arg Ile Leu Arg
1 5 10 15
Leu Cys Ala Val Leu Leu Met Val Leu Gly Val Gly Leu Val Gly Ala
20 25 30
Pro Thr Ser His Ala Gly Gly Lys Pro Thr Ile Ser Lys Glu Ala Phe
35 40 45
Gly Ser Val Gly Gly Lys Ala Val Asp Arg Tyr Thr Leu Thr Asn Gly
50 55 60
Arg Leu Gln Val Arg Ile Leu Thr Tyr Gly Gly Ile Leu Gln Thr Ile
65 70 75 80
Thr Phe Pro Asp His Arg Gly Arg Arg Ala Asn Val Thr Leu Gly Phe
85 90 95
Arg Thr Leu Asp Glu Tyr Val Thr Thr Lys Asn Pro Ala Tyr Phe Gly
100 105 110
Ala Ile Ile Gly Arg Tyr Gly Asn Arg Ile Ala Asp Gly Arg Phe Thr
115 120 125
Leu Asp Gly Thr Thr Tyr Gln Leu Ala Thr Asn Asn Asp Pro Asn His
130 135 140
Leu His Gly Gly Val Val Gly Phe Asp Lys Arg Val Trp Asp Ala Thr
145 150 155 160
Pro Ile Arg Asp Gly Asp Ser Val Gly Leu Arg Leu Thr Tyr Thr Ser
165 170 175
Pro His Gly Glu Glu Asn Tyr Pro Gly Thr Leu Arg Val Thr Met Thr
180 185 190
Tyr Thr Val Thr Arg Gln Met Gly Ile Arg Met Asp Tyr Arg Ala Thr
195 200 205
Thr Asp Arg Pro Thr Ile Val Asn Leu Thr Asn His Ala Tyr Trp Asn
210 215 220
Leu Gly Gly Glu Gly Thr Gly Thr Ile Asp Asp His Leu Leu Lys Leu
225 230 235 240
Asn Ala Asn Arg Tyr Thr Pro Val Asp Ala Thr Leu Ile Pro Thr Gly
245 250 255
Ala Ile Asp Ala Val Ala Gly Thr Pro Met Asp Phe Arg Arg Pro Thr
260 265 270
Pro Ile Gly Ala Arg Asn Arg Asp Pro Phe Gln Gln Leu Val Tyr Gly
275 280 285
Arg Gly Tyr Asp His Asn Trp Val Leu Asn Arg Glu Asp Gly Gln Phe
290 295 300
Arg Arg Leu Glu Phe Ala Ala Arg Ala Val Asp Pro Asp Ser Gly Arg
305 310 315 320
Gln Leu Thr Ile Tyr Thr Thr Glu Pro Gly Ile Gln Phe Tyr Gly Gly
325 330 335
Asn Phe Leu Asp Gly Thr Leu Tyr Gly Thr Ser Gly Arg Ala Tyr Arg
340 345 350
Gln Gly Asp Gly Phe Ala Leu Glu Thr Gln His Phe Pro Asp Ser Pro
355 360 365
Asn His Ala Asn Phe Pro Ser Thr Val Leu Arg Pro Gly Gln Thr Tyr
370 375 380
Asn Ser Thr Thr Ile Tyr Gln Phe Gly Thr Ala Asp
385 390 395
<210> 112
<211> 378
<212> PRT
<213> Actinoplanes garbadinensis
<400> 112
Met Pro Arg Ile His Pro Lys Val Glu Glu Ala Val Ser Thr Leu Asp
1 5 10 15
Leu Asn Arg Thr Thr Arg Arg Arg Leu Leu Ser Gly Thr Gly Leu Phe
20 25 30
Ser Ala Ser Leu Ala Ala Gly Ala Leu Leu Ser Ala Cys Ser Asp Gln
35 40 45
Asn Asp Gly Gln Asn Gln Thr Glu Gly Ala Gly Asn Phe Pro Asp Thr
50 55 60
Pro Glu Trp Arg Phe Thr Phe Val Asn His Val Thr Thr Asn Pro Phe
65 70 75 80
Phe Thr Pro Thr Gln Tyr Gly Met Glu Asp Ala Ala Thr Leu Leu Gly
85 90 95
Ile Ala Lys Pro Gln Trp Thr Gly Ser Gln Asn Ser Ile Val Ala Glu
100 105 110
Met Val Asn Ala Thr Asn Thr Ala Val Ser Ala Lys Val Asp Gly Ile
115 120 125
Ala Ile Ala Val Val Asp Lys Asp Ala Phe Arg Gly Pro Val Asp Gln
130 135 140
Ala Leu Asn Ala Gly Ile Pro Val Val Ser Tyr Asn Ala Asp Gly Ala
145 150 155 160
Arg Gly Ala Pro Gly Thr Asn Arg Leu Ala Tyr Ile Gly Gln Gly Leu
165 170 175
Tyr Glu Ser Gly Tyr Ala Leu Gly Gln Arg Ala Leu Gln Val Leu Asp
180 185 190
Ser Gly Glu Val Ala Ala Phe Ile Ala Thr Pro Gly Ala Leu Asn Ile
195 200 205
Gln Pro Arg Ile Asp Gly Ala Gln Gln Ala Phe Lys Asp Ser Gly Lys
210 215 220
Pro Ile Thr Phe Thr Ala Val Ala Thr Asn Ala Asp Val Thr Arg Gly
225 230 235 240
Leu Ser Ile Ile Asp Ala Tyr Ala Gln Gly His Ala Asn Leu Ala Gly
245 250 255
Met Leu Ala Val Asp Ala Gly Ser Thr Ser Ser Val Gly Gln Thr Val
260 265 270
Lys Lys Tyr Asn Met Arg Gly Lys Gly Leu Lys Val Ala Gly Gly Phe
275 280 285
Asp Leu Ile Pro Glu Thr Leu Thr Gly Ile Gln Glu Gly Ser Leu Asp
290 295 300
Tyr Thr Ile Asp Gln Gln Pro Tyr Leu Gln Gly Phe Leu Pro Val Leu
305 310 315 320
Ala Leu Tyr Phe Tyr Lys Val Ser Gly Gly Leu Ile Ala Pro Ser Glu
325 330 335
Thr Asn Thr Gly Leu Leu Phe Val Thr Lys Asp Asn Val Ala Pro Tyr
340 345 350
Gln Ser Thr Lys Ser Arg Tyr Glu Gly Ser Thr Thr Asp Lys Val Leu
355 360 365
Val Pro Arg Ser Gly Pro Ile Ala His Gly
370 375
<210> 113
<211> 352
<212> PRT
<213> Actinoplanes garbadinensis
<400> 113
Met Asp Asp Arg Ile Ser Pro Ala Pro Ala Gln Ala Pro Ser Leu Glu
1 5 10 15
Val Glu Gln Arg Arg Gly Arg Trp Gln Pro Val Thr Ala Ala Gly Arg
20 25 30
Lys Val Leu Asp Ala Phe Leu Arg Arg Arg Glu Ala Ser Val Leu Leu
35 40 45
Val Ala Ile Gly Leu Met Ile Tyr Phe Arg Ala Ser Ser Pro Val Phe
50 55 60
Leu Ser Arg Asp Asn Leu Val Asn Ile Ala Gln Ala Thr Ala Pro Val
65 70 75 80
Ala Ile Ile Ala Val Gly Ile Val Leu Leu Leu Val Ser Gly Glu Ile
85 90 95
Asp Leu Ser Val Gly Ile Val Ala Ala Leu Ala Pro Phe Leu Phe His
100 105 110
Phe Gly Ile Asn Phe Tyr Ser Leu Pro Val Val Pro Ala Phe Val Val
115 120 125
Ala Leu Ala Ile Ala Ala Gly Ile Gly Leu Val Asn Gly Leu Ile Val
130 135 140
Thr Gln Leu His Val Pro Ser Phe Val Thr Thr Leu Gly Thr Phe Phe
145 150 155 160
Ala Val Gln Gly Ile Leu Leu Ile Thr Ser His Ala Tyr Pro Val Pro
165 170 175
Ile Pro Asp Ala Ala Lys Gly Thr Phe Gln Thr Trp Leu Gly Ala Gly
180 185 190
Pro Trp Ala Ser Ile Thr Trp Ala Leu Ile Ile Val Ala Ile Phe His
195 200 205
Thr Val Leu Thr Leu Thr Arg Trp Gly Leu His Thr Ile Ser Val Gly
210 215 220
Gly Asn Pro Val Gly Ala Thr Glu Ala Gly Ile Arg Ala Ser Arg Ile
225 230 235 240
Lys Ile Gly Asn Phe Val Ile Thr Ser Thr Leu Gly Gly Leu Val Gly
245 250 255
Ile Met Glu Ala Phe Arg Ile Asn Thr Ile Asp Pro Asn Ile Gly Gly
260 265 270
Gly Thr Thr Leu Thr Phe Tyr Ala Ile Ser Ala Ala Val Ile Gly Gly
275 280 285
Thr Ala Leu Ala Gly Gly Ser Gly Thr Ile Val Gly Ala Phe Leu Gly
290 295 300
Ala Leu Val Leu Ala Glu Leu Gln Asn Gly Phe Asn Leu Ile Gly Tyr
305 310 315 320
Ser Ala Asn Thr Ile Phe Leu Ile Leu Gly Leu Ala Ile Leu Val Ser
325 330 335
Met Ile Ala Asn Gln Tyr Leu Ser Arg Leu Arg Arg Ala Gly Arg Ser
340 345 350
<210> 114
<211> 253
<212> PRT
<213> Actinoplanes garbadinensis
<400> 114
Met Thr Ala Glu Thr Val Ser Asp Ala Leu Arg Val Gln Asn Ile Ala
1 5 10 15
Lys Arg Phe Gly Ala Leu Thr Ala Leu Gln Asp Val Thr Leu Arg Val
20 25 30
Ala Glu Gly Glu Val Leu Gly Leu Ile Gly Asp Asn Gly Ala Gly Lys
35 40 45
Ser Thr Leu Ile Lys Ile Ile Cys Gly Tyr His Arg Pro Asp Ala Gly
50 55 60
Arg Ile Phe Val Gly Gly Glu Glu Val Thr Leu Arg Ser Val Asp His
65 70 75 80
Ala Arg Ser Val Gly Ile Asp Ala Val Tyr Gln Asp Leu Ala Leu Val
85 90 95
Asn Glu Leu Ser Val Tyr His Asn Met Phe Leu Asn Arg Glu Leu Val
100 105 110
Arg Trp Pro Leu Leu Asn Asn Arg Ala Met Arg Arg Arg Ala Glu Glu
115 120 125
His Leu Arg Asp Met Gly Val Asn Leu Pro Asp Val Gly Val Glu Val
130 135 140
Ala Lys Leu Ser Gly Gly Gln Arg Gln Ala Ile Ala Val Ala Arg Cys
145 150 155 160
Val Tyr Ser Asp Ala Arg Ile Leu Leu Leu Asp Glu Pro Leu Ala Ala
165 170 175
Met Gly Ala Lys Glu Gly Thr Met Ile Leu Asp Leu Ile Arg Asp Leu
180 185 190
Lys Ala Arg Gly Asn Val Ser Ile Ile Ile Ile Ala His Asn Tyr Ala
195 200 205
Gln Val Leu Asp Val Cys Asp Arg Val Asn Leu Leu Gln His Gly Arg
210 215 220
Ile Thr Phe Asp Lys Arg Ser Ala Asp Thr Ser Leu Ala Glu Leu Thr
225 230 235 240
Glu Leu Val Val Ala Glu Tyr Arg Thr Gly Arg Gly Arg
245 250
<210> 115
<211> 255
<212> PRT
<213> Actinoplanes garbadinensis
<400> 115
Met Glu Ser Gly Ala Ser Val Pro Gln Ser Ala Arg Ile Trp Asn Tyr
1 5 10 15
Trp Leu Gly Gly Thr Asp Asn Leu Pro Val Asp Arg Ala Ala Gly Asp
20 25 30
Glu Tyr Arg Ala Val Phe Pro Gly Ile Asp Glu Ile Ala Arg Glu Ser
35 40 45
Arg Arg Tyr Leu Ser Arg Ala Val Arg Tyr Leu Ala Gly Glu Ala Gly
50 55 60
Val Arg Gln Phe Leu Asp Val Gly Ala Gly Leu Pro Thr Val Asp Asn
65 70 75 80
Thr His Gln Ile Ala Gln Arg Val Ala Pro Asp Ala Arg Val Leu Tyr
85 90 95
Val Asp Lys Asp Pro Tyr Ala Val Glu His Gly Arg Glu Leu Leu Ala
100 105 110
Gly Ser Ser Asp Val Tyr Leu Glu Gly Asp Leu Gln Lys Pro Ala Asp
115 120 125
Ile Leu Ala Val Ala Ala Arg Glu Leu Asp Met Gly Arg Pro Val Ala
130 135 140
Leu Ile Leu Asn Gly Val Leu Gly His Ile Pro Ser Thr Ala Glu Val
145 150 155 160
Arg Asp Ile Val Arg Gln Leu Met Ala Gly Leu Pro Pro Gly Ser Tyr
165 170 175
Leu Ser Ile Asn Asp Gly Val Arg Val Ala Gly Glu Glu Ala Leu Asn
180 185 190
Gln Ala Gln Asp Ala Tyr Asn Ser Ser Gly Ala Val Pro Tyr Leu Met
195 200 205
His Thr Pro Asp Glu Ile Ala Gly Phe Phe Glu Gly Leu Asp Leu Val
210 215 220
Pro Pro Gly Val Val Pro Ser Pro Gln Trp His Pro Asp Pro Gly Asp
225 230 235 240
Glu Thr Thr Gly Ala Ser Gln Tyr Ser Gly Val Gly Arg Lys Arg
245 250 255
<210> 116
<211> 280
<212> PRT
<213> Actinoplanes garbadinensis
<400> 116
Met Pro Pro Arg Thr Ser Arg Gly Pro His Pro Trp Val Leu Trp Thr
1 5 10 15
Ala Leu Ala Ala Ala Ala Val Ile Phe Val Tyr Pro Phe Val Trp Leu
20 25 30
Val Ser Ala Ser Leu Lys Pro Arg Pro Asp Val Phe Asp Asn Arg Leu
35 40 45
Leu Pro Ala Glu Trp Ala Pro Gly Asn Tyr Thr Ala Ile Trp Asp Ala
50 55 60
Ala Pro Val Leu Thr Trp Met Phe Asn Ser Val Val Val Ala Leu Ala
65 70 75 80
Ala Ala Ala Ala Val Thr Ile Ser Ser Ala Val Val Ala Phe Gly Phe
85 90 95
Ala Tyr Phe Arg Phe Pro Gly Arg Asn Val Leu Phe Ala Leu Val Val
100 105 110
Gly Thr Met Met Leu Pro Gly Ala Val Thr Met Ile Pro Thr Tyr Leu
115 120 125
Ile Trp Asn Glu Leu Gly Leu Ala Ala Thr Gln Val Pro Leu Trp Ala
130 135 140
Gly Asn Leu Phe Gly Ser Ala Phe Tyr Ile Phe Leu Ile Arg Gln Phe
145 150 155 160
Phe Leu Gly Val Pro Arg Glu Leu Phe Glu Ala Ala Arg Val Asp Gly
165 170 175
Ala Gly Tyr Trp Arg Leu Phe Trp Arg Ile Ala Val Pro Leu Cys Arg
180 185 190
Pro Ala Leu Ile Val Ala Phe Val Phe Glu Leu Arg Ala Ser Trp Ser
195 200 205
Asp Leu Leu Lys Pro Leu Ile Tyr Leu Arg Asp Pro Ala Leu Phe Thr
210 215 220
Met Pro Arg Gly Met Lys Ala Ile Leu Asp Gln Phe Gly Gln Ala Gly
225 230 235 240
Glu Ala Arg Trp Glu Ile Val Leu Ala Gly Ala Val Ile Thr Thr Val
245 250 255
Pro Met Ile Ile Ala Phe Phe Leu Cys Gln Arg Tyr Phe Val Glu Gly
260 265 270
Val Ala Thr Gln Ala Arg Lys Gly
275 280
<210> 117
<211> 301
<212> PRT
<213> Actinoplanes garbadinensis
<400> 117
Met Ser Ala Ala Val Arg Arg Arg Glu Thr Leu Ala Ala Phe Gly Phe
1 5 10 15
Leu Ser Pro Trp Leu Ile Gly Phe Thr Val Phe Met Ala Gly Pro Met
20 25 30
Val Ala Ser Leu Val Leu Ser Phe Thr Asp Tyr Asp Val Leu Thr Ser
35 40 45
Thr Asp Phe Val Gly Gly Glu Asn Tyr Arg Gln Met Leu Ala Asp Pro
50 55 60
Arg Val Arg Thr Ser Ile Ala Asn Thr Leu Ile Tyr Thr Ala Leu His
65 70 75 80
Val Pro Val Thr Met Ile Val Ser Leu Ala Leu Ala Met Leu Leu Ala
85 90 95
Arg Val Gly Arg Arg Ser Ala Gly Phe Phe Arg Thr Ile Phe Tyr Leu
100 105 110
Pro Thr Ile Thr Pro Lys Val Ala Val Gly Val Leu Phe Leu Leu Leu
115 120 125
Phe Asn Gly Gln Val Gly Ile Val Asn Glu Ala Leu Gly Thr Val Gly
130 135 140
Ile Asp Gly Pro Asn Trp Thr Val Asp Gly Pro Trp Ile Lys Pro Gly
145 150 155 160
Leu Val Leu Ile Gly Ala Trp Ser Leu Gly Ser Thr Val Ile Ile Tyr
165 170 175
Leu Ala Ala Leu Gln Asn Val Pro Arg Asp Leu Tyr Glu Ala Ala Glu
180 185 190
Met Asp Gly Ala Ser Ala Trp Ala Arg Phe Arg Ala Val Thr Val Pro
195 200 205
Met Ile Ser Gly Ala Leu Phe Phe Thr Leu Ile Ile Asn Thr Ile Ala
210 215 220
Ser Leu Gln Thr Phe Asp Glu Val Tyr Thr Ala Phe Tyr Gly Ser Ala
225 230 235 240
Asn Gln Gln Thr Tyr Gly Asn Asp Ala Ala Leu Phe Tyr Val Val Tyr
245 250 255
Leu Phe Gln Gln Ala Phe Gln Phe Leu His Met Gly Tyr Ala Ser Ala
260 265 270
Leu Ala Trp Leu Leu Phe Leu Ile Ile Val Ile Ile Thr Val Val Gln
275 280 285
Val Arg Leu Ser Arg Arg Phe Val Tyr Tyr Glu Ser Glu
290 295 300
<210> 118
<211> 445
<212> PRT
<213> Actinoplanes garbadinensis
<400> 118
Met Phe Ile Arg Ser Ile Arg Phe Val Val Gly Gly Ala Leu Val Leu
1 5 10 15
Thr Leu Ala Ala Gly Cys Gly Gly Val Gly Gly Ser Asp Ser Asp Ser
20 25 30
Asp Ser Asn Ala Ala Val Thr Leu Thr Met Met Gly Phe Gly Thr Gly
35 40 45
Asp Glu Ile Ala Lys Thr Arg Phe Asp Ala Ala Asn Ala Val Ile Ala
50 55 60
Pro Ser Leu Ala Lys Ala Ser Glu Gly Ser Phe Asp Ala Gln Ala Phe
65 70 75 80
Leu Ser Ala Val Ala Ser Arg Thr Pro Pro Asp Leu Val Tyr Met Glu
85 90 95
Arg Arg Leu Leu Gly Thr Tyr Ala Ala Lys Lys Ala Leu Thr Pro Leu
100 105 110
Gly Asp Cys Val Glu Arg Glu Lys Ile Asp Met Ser Gln Phe Arg Glu
115 120 125
Ala Ala Val Thr Glu Ala Thr Leu Asn Gly Gln Leu Tyr Gly Leu Pro
130 135 140
Asp Phe Tyr Asn Asn Arg Val Leu Met Leu Asn Asp Ala Ala Phe Ala
145 150 155 160
Glu Val Asn Leu Asp Pro Ala Gly Phe Asp Thr Gly Asp Trp Gln Ala
165 170 175
Leu Ser Thr Ala Thr Ala Arg Leu Thr Arg Met Ser Gly Gly Lys Leu
180 185 190
Gln Arg Ile Gly Phe Asp Pro Lys Leu Pro Glu Phe Leu Pro Val Trp
195 200 205
Ala Arg Ala Asn Gly Ala Ala Leu Val Ser Asp Asp Gly Arg Thr Ala
210 215 220
Gln Leu Asn Asn Pro Lys Val Val Glu Ala Leu Glu Tyr Ala Val Gly
225 230 235 240
Leu Ile Asn Ala Gln Gly Gly Trp Ser Asn Phe Lys Ser Phe Arg Asp
245 250 255
Ser Trp Asp Phe Phe Gly Ala Lys Asn Gln Phe Ala Ser Asn Gln Leu
260 265 270
Gly Ala Phe Pro Met Glu Asp Phe Tyr Leu Asn Val Leu Ala Asp Asn
275 280 285
Ser Pro Lys Val Lys Val Thr Val Ala Pro Phe Arg Gly Val Asp Gly
290 295 300
Gln Pro Ile Asp Trp Ile Thr Gly Asn Ala Trp Ala Ile Pro Ala Asn
305 310 315 320
Ser Ala His Pro Gly Gln Ala Cys Lys Trp Ile Lys Thr Met Thr Ala
325 330 335
Ser Glu Thr Trp Ile Ala Ala Ala Arg Ala Arg Ala Glu Leu Arg Lys
340 345 350
Lys Glu Asn Lys Pro Phe Ala Gly Val Tyr Thr Gly Asn Lys Lys Ala
355 360 365
Asp Glu Val Ile Phe Arg Asp Val Val Lys Pro Asp Ala Asn Val Gln
370 375 380
Ile Val Leu Gln Thr Gln Glu Ser Gly Phe Ser Glu Pro Ala Leu Ala
385 390 395 400
Ala Gly Glu Glu Phe Lys Ala Ala Trp Gln Asn Ala Val Asn Arg Val
405 410 415
Leu Glu Gly Lys Gln Lys Pro Ala Gln Ala Met Ala Glu Ala Gln Gln
420 425 430
Gln Ala Gln Ala Ala Leu Asp Lys Ala Asn Ser Gly Arg
435 440 445
<210> 119
<211> 64
<212> PRT
<213> Actinoplanes garbadinensis
<400> 119
Met Ser Ala Leu Ala Ile Glu Lys Ser Trp Lys Asp Val Asp Leu Arg
1 5 10 15
Asp Gly Ala Thr Ser His Pro Ala Gly Leu Gly Phe Gly Glu Leu Thr
20 25 30
Phe Glu Asp Leu Arg Glu Asp Arg Thr Ile Tyr Ala Ala Ser Ser Gly
35 40 45
Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val Ile Cys Ala Cys
50 55 60
<210> 120
<211> 1053
<212> PRT
<213> Actinoplanes garbadinensis
<400> 120
Met Ser Pro Val Pro Ser Leu Asn Ser Thr Ser Val Arg Asp Ser Ala
1 5 10 15
Tyr Leu His Glu Arg Thr Val Thr Gly Glu Asp Gln Pro Ala Pro Ala
20 25 30
Ala Gln Ala Arg Ile Ala Ser Trp Arg Asp Ser Ala Phe Leu Asp Asp
35 40 45
Arg Val Leu Asp Ile Arg Leu Arg Gln Trp Gly Ile Asp Arg Ala Thr
50 55 60
Phe Gly Arg Leu Leu Thr Asp Asp Asp Phe Thr Val Pro Gly Arg Leu
65 70 75 80
Leu Ala Trp Ala Asp Glu Leu Ala Thr Val Leu Ala Thr Asp Thr Thr
85 90 95
Pro Val Thr Gly Leu Glu Leu Ser Thr Lys Leu Trp Ser Gln Gly Phe
100 105 110
Asp Arg Leu Leu Phe Ala Gly Leu Leu His Pro Phe Leu Ala His Tyr
115 120 125
Glu Gln Arg Leu His Glu Arg Val Pro Arg Pro Ile Ala Gly Ser Leu
130 135 140
Arg Arg Pro Leu Leu Glu Ser Leu Ala Asn Arg Leu Leu Ala Val Ala
145 150 155 160
Ala Arg Thr Leu Leu Leu Glu Leu Asn Val Ala Arg Val His Gly Arg
165 170 175
Leu Thr Gly Asp Thr Pro Gln Gln Arg Tyr Asp Asp Tyr Asp Arg Arg
180 185 190
Leu Leu Thr Asp Pro Ala Tyr Leu Ala Ala Leu Phe Glu Glu Tyr Pro
195 200 205
Val Leu Gly Arg Cys Leu Val Glu Cys Gly Arg Arg Trp Val Asp His
210 215 220
Ala Ala Glu Leu Phe Asn Arg Leu His Asp Asp Glu Pro Glu Leu Arg
225 230 235 240
Ala Ala Gly Leu Leu Pro Pro Ser Ala Glu Ala Leu Arg Ser Val Arg
245 250 255
Leu Asp Leu Gly Asp Pro His Asn Gly Gly Arg Ser Val Val Gln Leu
260 265 270
Thr Phe Asp Asp Gly Thr Asp Leu Val Tyr Lys Pro Arg Pro Val Gly
275 280 285
Ser Glu Arg Ala Tyr Ala Glu Thr Met Ala Ala Leu Ala Arg His Gly
290 295 300
Leu Pro Val Pro Val Thr Ala Pro Arg Val Leu Asp Arg Gly Gly His
305 310 315 320
Gly Trp Cys Glu Phe Val Arg Pro Ala Pro Cys Ala Asp Ala Ala Glu
325 330 335
Leu Ser Arg Phe Tyr Arg Arg Ala Gly Ser Val Leu Ala Ala Met Leu
340 345 350
Leu Leu Gly Gly Val Asp Met His Met Glu Asn Val Ile Ala Ala Gly
355 360 365
Ser Ser Phe Thr Pro Ile Asp Leu Glu Thr Val Leu Gln Ser Gly Glu
370 375 380
Leu Gly Asp Gly Ala Thr Asp Ala Tyr Gly Arg Ala Leu Asp Leu Leu
385 390 395 400
Asn Arg Ser Val Leu Ala Ile Gly Ile Leu Pro Ala Arg Ala Phe Gly
405 410 415
Gly Arg Gln Arg Lys Ser Val Asp Val Ser Ala Leu Gly Gly Gly Glu
420 425 430
Pro Gln Thr Ala Pro Arg Pro Val Pro Arg Ile Val Asp Ala Tyr Thr
435 440 445
Asp Thr Ala Arg Leu Glu Ala Val Glu Ala Thr Met Ala Gly Ala Gln
450 455 460
Asn Arg Pro Ser Leu Pro Gly Ala Glu Val Arg Pro Trp Glu His Thr
465 470 475 480
Ala Asp Val Val Ala Gly Phe Thr Asp Ala Tyr Asp Ile Met Leu Ala
485 490 495
His Arg Ala Asp Phe Asp Arg Leu Leu Arg Gly Phe His Asp Val Glu
500 505 510
Val Arg Tyr Leu Pro Arg Pro Thr Arg Arg Tyr Ser Ile Phe Leu Thr
515 520 525
Glu Ser Tyr His Pro Asp Tyr Leu Arg Asp Ala Ser Asp Arg Asp Arg
530 535 540
Leu Leu Asp Lys Leu Trp Thr Ala Ala Asp Ala Arg Pro Glu Leu Ile
545 550 555 560
Pro Ile Ile Glu Ser Glu Lys Arg Gln Leu Leu Ala Gly Asp Ile Pro
565 570 575
Cys Phe Arg Ser Val Ala Gly Ser Arg Gln Ile Arg Thr Ala Ser Gly
580 585 590
Pro Leu His Pro Glu Phe Phe Thr Ala Pro Ala Val Thr Val Leu Thr
595 600 605
Arg Arg Leu Gly Glu Phe Gly Pro Val His Arg Ala Ala Gln Val Arg
610 615 620
Ile Ile Arg Asp Ser Met Ala Thr Met Pro Gly Pro Arg Pro Ala Ala
625 630 635 640
Gln Pro Ser Pro Asp Arg Ala Ala Gly Pro Arg Pro Arg Val Thr Gly
645 650 655
Ala Asp Pro Ala Thr Leu Ala Asp Arg Ile Ala Arg Arg Leu Ala Asp
660 665 670
Glu Ala Ile Leu Gly Asp Arg Asp Val Ser Trp Ile Gly Val Ser Ile
675 680 685
Glu Gly Val Ala Gln Glu Thr Tyr Ser Tyr Lys Pro Met Ala Thr Gly
690 695 700
Leu Tyr Asp Gly Val Ala Gly Leu Ala Leu Thr Phe Ala Tyr Ala Ala
705 710 715 720
Arg Thr Leu Gly Asp Asp Arg Tyr Leu Asp Leu Ala His Arg Ala Ala
725 730 735
Arg Pro Val Ala Gly Tyr Leu Arg Tyr Leu Ala Glu His Arg Ile Val
740 745 750
Glu Thr Val Gly Ala Tyr Ser Gly Thr Ala Gly Leu Leu Tyr Ala Leu
755 760 765
Asp His Val Ala His Ala Thr Gly Asp Asp Ser Tyr Leu Asp Ala Val
770 775 780
Ser Glu Ala Val Pro Trp Leu Arg Glu Cys Ala Thr Arg Glu Glu Cys
785 790 795 800
Pro Asp Leu Ile Ala Gly Leu Ala Gly Cys Ala Leu Ile Ser Leu Asp
805 810 815
Leu His Gly Arg His Arg Ile Asp Gly Leu Arg Glu Val Ala Ala Ile
820 825 830
Cys Ala Glu Arg Leu Ala Ala Leu Ala Val Asp Val Asp Gly Ala Ala
835 840 845
Gly Trp Pro Ala Thr Pro Asp Gly Pro Leu Leu Gly Gly Phe Ser His
850 855 860
Gly Ala Ala Gly Ile Ala Trp Pro Leu His Arg Leu Ala Thr Glu Leu
865 870 875 880
Gly Asp Pro Ser Leu Arg Glu Leu Ala Arg Arg Ala Val Gln Phe Asp
885 890 895
Arg Asp Leu Tyr Val Pro Ala Ala Gly Ala Trp Arg Asp Leu Arg Pro
900 905 910
Glu Met Ala Gly Thr Asp Ser Tyr Pro Ala Leu Trp Cys His Gly Ala
915 920 925
Ala Gly Ile Gly Leu Ser Arg Leu Leu Ile Ala Gln His Asp Gln Asp
930 935 940
Thr Arg Leu Ala Ala Glu Ala Thr Ala Ala Leu Asp Leu Val Gly Ala
945 950 955 960
His Gly Phe Gly His Asn His Ser Ile Cys His Gly Asp Phe Gly Ala
965 970 975
Leu Ala Leu Phe Asp Leu Ala Ala Arg Thr Gly Phe Asp Pro Gly Arg
980 985 990
His Asp Ala Ala Ala Ala Ala Val Thr Ala Asp Ile Ala Ala Asn Gly
995 1000 1005
Ala Arg Cys Gly Leu Val Gly Asp Ile His Met Pro Gly Leu Met
1010 1015 1020
Leu Gly Ala Ala Gly Ile Cys Leu Ser Leu Leu Arg Ile Ala His
1025 1030 1035
Pro Ala Gln Val Pro Ala Val Ala Trp Leu Gln Pro Pro Leu Thr
1040 1045 1050
<210> 121
<211> 341
<212> PRT
<213> Actinoplanes garbadinensis
<400> 121
Met Pro Glu Glu Ile Val Leu Ser Val Leu Asp Gln Val Pro Val Phe
1 5 10 15
Arg Asp Gly Ser Pro Ala Glu Ala Val Arg Asp Ala Val Ala Leu Ala
20 25 30
Arg Ser Ala Glu Gln Tyr Gly Tyr His Arg Phe Trp Ile Ala Glu His
35 40 45
His Gly Ser Ala Ala Asn Ala Cys Ala Ala Pro Glu Val Val Thr Ala
50 55 60
Ala Val Ala Ala Ala Thr Ser Arg Ile Arg Val Gly Ser Gly Gly Val
65 70 75 80
Leu Leu Pro His Tyr Ser Pro Leu Lys Val Ala Glu Thr Phe Arg Val
85 90 95
Leu Ala Ala Leu Tyr Pro Gly Arg Ile Asp Leu Gly Phe Gly Arg Ala
100 105 110
Pro Gly Gly Pro Pro Ala Met Ala Glu Leu Leu Asn Pro Tyr Ala Val
115 120 125
Arg Thr Asp Glu Ala Phe Leu Glu Gln Ile Gly Arg Leu Leu Gly Phe
130 135 140
Leu Gly Asp Thr Arg Thr Val Ser Arg Val Ser Val Thr Pro Gln Val
145 150 155 160
Glu Glu Pro Pro Val Pro Trp Met Leu Gly Ala Gly Thr Gly Ser Ala
165 170 175
Arg Met Ala Gly Met Leu Gly Leu Pro Phe Cys Phe Ala Gln Phe Ile
180 185 190
Ala Thr Glu Glu Cys Pro Glu Ala Ile Glu Ala Tyr Arg Asp Ala Phe
195 200 205
Arg Pro Ser Pro Trp Leu Glu Arg Pro Gln Pro Met Leu Ala Leu Arg
210 215 220
Val Leu Cys Ala Asp Ser Asp Ala Glu Ala Glu Glu Leu Ala Thr Cys
225 230 235 240
Phe Trp Met Ser Cys Thr Thr Gly Trp Arg Ala Gln Val Gln Leu Thr
245 250 255
Asp Asp Tyr Arg Gly Gly Ala Pro Asn Leu Asp Asp Ala Arg Arg Tyr
260 265 270
Arg Leu Thr Ala Glu Asp Leu Ala Leu Arg Glu Ser Arg Pro Phe Leu
275 280 285
Gln Ile Ser Gly Thr Pro Ala Ala Val Gly Lys Glu Ile Arg Arg Leu
290 295 300
Gln Ala Val Tyr Gly Val Ser Glu Val Val Leu Thr Thr Asn Cys Pro
305 310 315 320
Gly Leu Pro Ala Arg Arg Arg Ser Tyr Glu Leu Leu Ala Gly Glu Phe
325 330 335
Ala Ser Pro Ala Ala
340
<210> 122
<211> 231
<212> PRT
<213> Actinoplanes garbadinensis
<400> 122
Met Arg Ser Ala Ala Arg Gly Gly Pro Ile Val Thr Asp Val Leu Val
1 5 10 15
Val Asp Gly Glu Ala Leu Val Ser Ile Gly Ile Lys Met Ile Leu Glu
20 25 30
Ser Thr Gly Gly Phe Ala Val Ala Thr Thr Asp Arg Glu Asn Leu Arg
35 40 45
Ser Ala Val Glu Gln His Arg Pro Ala Val Val Leu Leu Asp Gly His
50 55 60
Ser Ala Gln Ser Asp Gly Leu Glu Val Leu Asp Gln Leu Arg Ala Leu
65 70 75 80
Ser Ser Pro Pro Ala Ile Ala Met Leu Thr Thr Leu Ala Pro Pro Glu
85 90 95
Leu Val Leu Asp Ser Leu Arg Gly Gly Ala Cys Gly Phe Leu Leu Arg
100 105 110
Asp Ser Gln Pro Glu Gln Leu Val Ala Ala Val Arg Ala Leu Ala Glu
115 120 125
Gly Ser Ile Val Leu Ala Pro Glu Ala Ser Ser Val Val Val Arg Ala
130 135 140
Gly Ser Arg Gly Ser Ala Ala Gly Ala Gly Ser Pro Ala Cys Glu Arg
145 150 155 160
Val Lys Gln Leu Ser Asp Arg Glu Gln Ser Ile Leu Arg Leu Leu Gly
165 170 175
Ala Gly Leu Thr Asn Ala Glu Ile Ser Arg Gln Leu Phe Leu Ser Ala
180 185 190
Ala Thr Val Lys Glu His Val Ser Val Ile Leu Ser Lys Leu Gly Val
195 200 205
Ala Asn Arg Val Gln Ala Ala Val Leu Ala Tyr Ala Ser Gly Leu Ser
210 215 220
Ser Asp Asp Val Cys Leu Ser
225 230
<210> 123
<211> 812
<212> PRT
<213> Actinoplanes garbadinensis
<400> 123
Met Ile Phe Ala Leu Ala Trp Ser Gln Leu Arg Ala Tyr Pro Ala Arg
1 5 10 15
Leu Phe Ala Ile Val Ala Ala Val Met Leu Ala Thr Gly Phe Leu Ala
20 25 30
Ala Thr Ala Thr Phe Ala Ala Thr Ser Gly Glu Gly Leu Arg Arg Thr
35 40 45
Ala Ala Ala Pro Leu Thr Thr Ala Asp Ile Val Leu Asp Ala Asp Asp
50 55 60
Thr Val Arg Asp Pro Ala Trp Tyr Glu Ala Ala Ala Ala Val Pro Gly
65 70 75 80
Val Arg Ser Val Asp Ala Gln Tyr Ala Arg Thr Val Ser Val Phe Gly
85 90 95
Gly Ser Arg Arg Gly Ser Ala Asn Val Gln Ser Ile Ala Ala Thr Pro
100 105 110
Gln Val Arg Trp Phe Thr Leu Asp Arg Gly Ala Trp Pro Thr Gly Pro
115 120 125
Gly Gln Leu Val Ala Asp Gln Arg Thr Leu Asp Asp Leu Gly Ile Asp
130 135 140
Val Gly Ala Thr Leu Thr Val Arg His Gly Glu Ala Ala Pro Gln Pro
145 150 155 160
Val Thr Val Thr Gly Ala Ala Asp Leu Gly Phe Arg Pro Leu Thr Gly
165 170 175
Ser Asp Phe Arg Phe Tyr Ala Asp Ala Ser Phe Phe Ala Gly Asp Val
180 185 190
Pro Pro Ala Ala Leu Leu Thr Val Ala Asp Asp Ala Ser Leu Thr Gly
195 200 205
Thr Val Asp Ala Leu Arg Arg Ser Met Gly Pro Gly Ile Ser Ala Thr
210 215 220
Asp Ala Ser Ala Ala Ala Asp Gln Ala Ala Ala Arg Phe Ala Gly Gly
225 230 235 240
Asn Gly Gln Leu Val Val Ile Met Leu Ala Phe Ala Ala Val Ala Leu
245 250 255
Leu Ala Ala Val Leu Val Ile Ala Asn Thr Phe His Val Val Ile Val
260 265 270
Gln Arg Ile Arg Gln Ile Ala Leu Leu Arg Leu Val Gly Gly His Arg
275 280 285
Ala Gln Val Ser Arg Val Val Leu Ala Glu Ala Ala Ile Ala Gly Thr
290 295 300
Ala Gly Gly Leu Val Gly Ala Ala Ala Gly Val Gly Leu Gly Tyr Leu
305 310 315 320
Gly Ala Asp Leu Leu Asp Ile Ser Gly Gly Gly Leu Arg Val Asn Pro
325 330 335
Phe Ala Leu Ala Gly Cys Val Leu Ala Gly Val Leu Ala Thr Leu Val
340 345 350
Ala Ala Trp Ala Pro Ala Arg Arg Ala Thr Arg Ile Ala Pro Val Arg
355 360 365
Ala Leu Gln Ala Ala Asp Glu Pro Pro Ala Gly Thr Val Arg Gly Gly
370 375 380
Arg Arg Leu Val Val Gly Thr Val Val Thr Val Val Gly Ala Ala Ala
385 390 395 400
Leu Ala Val Ala Ala Ile Gly Ala Ser Leu Pro Leu Ala Leu Leu Gly
405 410 415
Gly Leu Leu Leu Ala Ala Gly Leu Leu Ala Ala Leu Pro Arg Leu Ile
420 425 430
Ala Leu Ser Leu Ala Pro Ala Ala Arg Leu Leu Glu Arg Phe Gly Val
435 440 445
Ala Ala Gly Leu Ala Gly Thr Ser Leu Ser Gln Asn Ala Arg Arg Thr
450 455 460
Ala Ser Ala Ala Met Ala Val Val Val Gly Ala Ala Leu Ile Thr Cys
465 470 475 480
Leu Ala Val Ala Ala Thr Ser Gly Arg Ala Thr Val Asn Ala Asp Leu
485 490 495
Glu Ala Arg Tyr Pro Val Ala Ala Gly Leu Arg Thr Asp Gly Glu Pro
500 505 510
Ile Ser Gly Ala Thr Ala Gly Ala Phe Ala Ala Val Pro Gln Leu Ser
515 520 525
Ala Ser Gly Thr Val Gly Thr Val Ala Ala Arg Phe Pro Asp Gly Gly
530 535 540
Lys Ala Thr Pro Arg Leu Leu Ala Ala Pro Gly Asp Glu Leu Ala Ala
545 550 555 560
Arg Val Ala Pro Glu Leu Ala Gly Glu Pro Val Val Leu Val Pro Ala
565 570 575
Thr Tyr Leu Ala Glu Leu Gly Leu Pro Asp Ser Ala Pro Ile Val Val
580 585 590
Glu Val Gly Glu Arg Arg Val Asn Leu Ile Ala Arg Ala Ser Arg Leu
595 600 605
Ala Asp Thr Thr Gly Gln Leu Leu Gly Val Val Ser Ala Arg Thr Leu
610 615 620
Ala Ala Asn Arg Ile Glu Ala Val Pro Thr Thr Val Trp Gly Val Ala
625 630 635 640
Asp Pro Gly Phe Asp Arg Glu Ala Leu Ser Ala Ala Val Gly Ala Val
645 650 655
Ala Ala Arg Asp Ala Leu Val Gln Val Gly Gly Gly Val Thr Glu Gly
660 665 670
Gly Asp Ile Ala Asn Val Leu Ser Ile Leu Leu Gly Leu Ser Leu Ala
675 680 685
Met Leu Ala Val Thr Val Val Ile Ala Leu Leu Gly Ile Ala Asn Leu
690 695 700
Leu Gly Leu Ser Val Val Glu Arg Val Arg Glu Met Ala Leu Leu Arg
705 710 715 720
Ala Leu Gly Thr Arg Arg Ala Arg Leu Arg Ala Met Leu Ala Val Glu
725 730 735
Ala Val Val Ile Thr Leu Leu Gly Thr Val Ala Gly Leu Val Val Gly
740 745 750
Val Pro Val Gly Leu Ala Ala Val Ala Ala Ala Val Gly Arg Thr Ala
755 760 765
Asp Pro Val Ile Arg Leu Pro Trp Gly Gln Leu Ala Ala Val Leu Val
770 775 780
Val Ala Val Leu Thr Gly Val Val Ala Ser Leu Ala Pro Ala Arg Arg
785 790 795 800
Ala Ala Arg Val Ala Pro Ala Glu Gly Leu Thr Arg
805 810
<210> 124
<211> 244
<212> PRT
<213> Actinoplanes garbadinensis
<400> 124
Met Ile Val Trp Pro Glu Arg Arg Ala Ala Ser Arg Ser Pro Pro Ser
1 5 10 15
Ser Ala Arg Pro Val Ala Met Ser Ser Ala Pro Val Gly Ser Ser Ala
20 25 30
Lys Thr Thr Asp Gly Leu Ala Ser Ser Ala Arg Ala Thr Ala Thr Arg
35 40 45
Cys Cys Trp Pro Pro Asp Ser Ser Asp Gly Arg Cys Pro Ser Arg Ser
50 55 60
Val Ile Cys Ser Glu Ser Val Ile Phe Arg Ser Ser Pro Gly Ser Thr
65 70 75 80
Arg Arg Pro Ala Ser Arg Ser Gly Ser Thr Met Phe Cys Ser Ala Val
85 90 95
Ser Val Gly Ser Arg Leu Asn Ala Trp Lys Thr Lys Pro Ile Arg Ser
100 105 110
Arg Arg Arg Ser Val Arg Ala Arg Ser Ser Arg Pro Ala Asn Asp Arg
115 120 125
Pro Ala Arg Leu Thr Val Pro Ala Val Gly Val Ser Asn Pro Ala Ser
130 135 140
Arg Cys Ile Ser Val Val Phe Pro Glu Pro Asp Gly Pro Met Ile Ala
145 150 155 160
Val Asn Trp Pro Ala Glu Lys Pro Ala Asp Thr Pro Ser Thr Ala Val
165 170 175
Thr Ala Ala Gly Pro Val Pro Tyr Val Leu Leu Thr Ser Arg Gln Leu
180 185 190
Thr Ile Ser Ala Cys Val Val Cys Val Val Thr Ala Pro Thr Leu Glu
195 200 205
Ile Arg Ala Asp Arg His Ile Pro Pro Arg Asp Pro Gly Arg Ala Val
210 215 220
Asp Arg Tyr Leu Arg Met Thr Arg Arg Tyr Arg Pro Arg Ala Pro Cys
225 230 235 240
Ser Arg Asn Arg
<210> 125
<211> 367
<212> PRT
<213> Actinoplanes garbadinensis
<400> 125
Val Leu Arg Ile Asp Ala Leu Val Ala Ala Ala Val Val Ile Gly Cys
1 5 10 15
Leu Leu Leu Gly Leu Ala Gly Leu Ser Glu Trp Tyr Trp Ser Ala Ala
20 25 30
Val Ala Val Pro Leu Leu Leu Arg Arg Ser Ala Pro Arg Cys Phe Leu
35 40 45
Ala Leu Val Ala Gly Val Ser Gly Leu His Leu Leu Ala Ser His Ser
50 55 60
Phe Met Phe Pro Gly Asp Leu Val Ala Leu Val Ala Val His Ala Ala
65 70 75 80
Ala Ala His Ala Pro Gly Arg Ala Arg His Ala Gly Leu Leu Leu Gly
85 90 95
Ala Ala Gly Ala Leu Val Val Ala Ala Gln Ala Leu Gln Asp Gln Arg
100 105 110
Leu Gly Ser Ala Leu Pro Ala Val Leu Ile Val Ala Ser Thr Met Ala
115 120 125
Ala Trp Ser Ile Gly Leu Met Gln Arg Gln Gln Arg Ser Ala Val Leu
130 135 140
Asp Ala Glu His Arg Arg Arg Leu Ala Glu Gln Asp Ser Ala Met Arg
145 150 155 160
Ala Gln Leu Ala Val His Glu Glu Arg Thr Arg Ile Ser Gln Glu Met
165 170 175
His Asp Ile Ile Ala His Ser Leu Ala Ser Ile Ile Ala Gln Ala Glu
180 185 190
Gly Gly Arg Val Ala Ala Arg Ala Asp Ala Arg Ile Ala Gly Pro Val
195 200 205
Phe Asp Arg Ile Ala Gly Leu Gly Arg Gln Ala Leu Thr Asp Val Lys
210 215 220
Arg Leu Leu Thr Val Val Asp His Asp Asp Glu Trp His Asp Asp Gly
225 230 235 240
Leu Glu Arg Leu Pro Val Leu Leu Ala Gly Val Thr Glu Ala Gly Leu
245 250 255
Asp Val Thr Val Asp Ser Ser Gly Ala Pro Gln Pro Leu Ala Ala Gly
260 265 270
Met Asp Leu Ala Val Tyr Arg Val Ile Gln Glu Ser Leu Thr Asn Val
275 280 285
Leu Lys His Ala Pro Ala Arg Arg Ala Cys Leu Arg Met Arg Trp Thr
290 295 300
Pro Ala Leu Leu Thr Val Thr Val Ser Ser Pro Leu Pro Gly Gly Arg
305 310 315 320
Gly Ala Gly Leu Val Glu Gly Arg Gly Leu Ser Gly Ile Arg Gln Arg
325 330 335
Cys Ser Leu Phe Asn Gly Asp Cys Thr Val Thr Ala Thr Thr Glu Leu
340 345 350
Thr Val Thr Thr Thr Trp Pro Leu Thr Pro Glu Gly Ala Arg Ala
355 360 365
<210> 126
<211> 220
<212> PRT
<213> Actinoplanes garbadinensis
<400> 126
Met Thr Arg Pro Pro Ile Ala Val Leu Ile Ala Asp Asp Gln Glu Leu
1 5 10 15
Val Arg Thr Gly Phe Ala Met Val Val Asp Ala Ala Pro Asp Met Arg
20 25 30
Val Val Ala Ile Ala Ala Ser Gly Ala Glu Ala Ile Glu Leu Ala Ala
35 40 45
Glu His Arg Pro Asp Val Ile Leu Met Asp Ile Arg Met Pro Gly Thr
50 55 60
Asp Gly Ile Thr Ala Thr Ser Ala Ile Leu Ala Ala Gly Gly Glu Arg
65 70 75 80
Pro Pro Lys Ile Ile Ala Leu Thr Thr Tyr Asp Ser Ser Asp Tyr Ala
85 90 95
Thr Arg Ile Leu Thr Ala Gly Ala Ser Gly Tyr Leu Leu Lys Asp Ala
100 105 110
Thr Ala Glu Gly Leu Thr Ala Ala Ile Arg Ser Ala Tyr His Gly Gly
115 120 125
Ser Val Ile Ala Pro Thr Thr Thr Arg Asn Leu Val Ala Ala Arg Ala
130 135 140
Glu Pro Pro Pro Pro Ala Arg Asp Pro Ala Pro Leu Asp Thr Phe Thr
145 150 155 160
Ala Arg Glu Arg Asp Val Phe Asp Leu Ile Val Ala Gly Ala Asn Asn
165 170 175
Ala Glu Ile Ala Ala Arg Leu His Leu Ala Glu Val Thr Val Lys Thr
180 185 190
His Val Gly Arg Val Leu Ala Lys Leu Gly Val Arg Asp Arg Leu Asn
195 200 205
Val Val Val Trp Ala Tyr Arg Asn Gly Ala Val Gly
210 215 220
<210> 127
<211> 782
<212> PRT
<213> Actinoplanes garbadinensis
<400> 127
Met Leu Ile Cys Gly Leu Ile Ala Gly Val Val Val Ala Ala Ala Ala
1 5 10 15
Phe Pro Phe Ala Ala Met Ser Gly Leu Ala Ala Lys Ala Gly Gln Gln
20 25 30
Thr Phe Ala Ser Leu Pro Ser Glu Leu Lys Ala Phe Arg Ser Pro Gln
35 40 45
Ile Ser Arg Ile Tyr Ala Ala Asp Asn Arg Thr Gln Val Ala Gln Phe
50 55 60
Tyr Asp Glu Phe Arg Ser Asp Val Pro Leu Lys Glu Met Ser Pro Phe
65 70 75 80
Met Arg Asp Ala Met Val Ala Ala Glu Asp Arg Gln Phe Tyr Gln His
85 90 95
His Gly Val Asp Leu Lys Gly Ala Ala Arg Ala Leu Val Asn Asn Arg
100 105 110
Asn Gly Gly Gln Lys Gln Gly Ala Ser Thr Ile Thr Met Gln Trp Val
115 120 125
Arg Ile Ser Leu Ala Tyr Ser Ala Thr Lys Pro Gln Asp Val Ile Asp
130 135 140
Ala Thr Glu Asp Ala Pro Lys Arg Lys Val Ala Glu Met Lys Tyr Ala
145 150 155 160
Leu Glu Val Glu Lys Gln Leu Ser Lys Asp Gln Ile Leu Glu Arg Tyr
165 170 175
Leu Asn Ile Val Pro Phe Gly Lys Gln Thr Tyr Gly Ile Tyr Ala Ala
180 185 190
Ser Arg Val Tyr Phe Asn Lys Lys Pro Lys Asp Leu Thr Ile Gly Glu
195 200 205
Ala Ala Leu Leu Ala Ala Ile Val Lys Ala Pro Ser Ala Tyr Asp Pro
210 215 220
Thr Asp Pro Asp Gly Tyr Glu Leu Ile Arg Gln Arg Arg Asn Ala Tyr
225 230 235 240
Val Ile Pro Gly Met Val Glu Met Gly Ala Ile Thr Arg Ala Gln Ala
245 250 255
Asp Ala Ala Leu Lys Glu Ala Ile Pro Arg Lys Val Arg Pro Met Ser
260 265 270
Asn Gly Cys Val Ser Val Ala Lys Asn Asn Trp Gly Phe Phe Cys Asp
275 280 285
Tyr Phe Tyr Arg Trp Trp Met Glu Arg Lys Glu Phe Gly Pro Thr Pro
290 295 300
Tyr Asp Arg Glu Arg Arg Leu Lys Ser Gly Gly Tyr Arg Ile Thr Thr
305 310 315 320
Thr Leu Asp Val Lys Ala Gln Lys Gln Ala Arg Asp Arg Ile Gly Asp
325 330 335
Leu Ile Ser Glu Lys Asn Lys Asn Ala Leu Leu Leu Ala Ala Val Glu
340 345 350
Pro Gly Thr Gly Lys Val Arg Met Leu Ala Ala Asn Arg Arg Tyr Lys
355 360 365
Leu Asp Asp Pro Asp Asp Pro Gln Asn Ala Ile Ser Ser Asp Pro Arg
370 375 380
Lys Ala Arg Lys Gly Ile Arg Gly Ser Tyr Pro Asn Thr Thr Asn Pro
385 390 395 400
Leu Leu Thr Gly Gly Gly Asp Ile Thr Gly Tyr Gln Ala Gly Ser Val
405 410 415
Met Lys Met Phe Thr Ile Val Ala Ala Leu Glu Gln Gly Tyr Pro Leu
420 425 430
Ala Tyr Thr Ile Arg Thr Gln Ser Arg Tyr Arg Ser Arg Tyr Ile Ile
435 440 445
Glu Ser Ser Asn Asp Ala Ala Cys Pro Gly Thr His Phe Trp Cys Pro
450 455 460
Ser Asn Ala Gly Gly Gly Gly Glu Gly Val Phe Asn Met Trp Thr Gly
465 470 475 480
Leu Gly Arg Ser Ile Asn Thr Tyr Phe Val Pro Leu Glu Glu Arg Val
485 490 495
Gly Ala Glu Lys Val Val Ser Ala Ala Lys Arg Phe Gly Ile Gln Phe
500 505 510
Arg Glu Pro Asp Asp Ala Leu Leu Ala Glu Pro Gly Asn Ala His Gln
515 520 525
Trp Gly Ala Phe Thr Leu Gly Val Ser Ala Thr Thr Pro Leu Asp Met
530 535 540
Ala Asn Ala Tyr Ala Thr Leu Ala Ala Asp Gly Met Tyr Cys Pro Pro
545 550 555 560
Thr Pro Ile Glu Arg Ile Ala Thr Arg Asp Gly Asp Gln Leu Asp Val
565 570 575
Gly Arg Ser Pro Cys Val Arg Ala Thr Ala Lys Asp Val Ala Arg Ala
580 585 590
Ala Leu Asp Ala Ala Arg Cys Pro Val Gly Asp Ser Ala Gln Leu Gly
595 600 605
Arg Cys Gly Gly Ser Thr Ala Gly Ile Thr Arg Ser Val Val Gly His
610 615 620
Pro Val Phe Gly Lys Thr Gly Thr Thr Asp Arg Asp Arg Thr Ala Ser
625 630 635 640
Leu Ile Ala Gly Thr Thr Ala Leu Val Val Ala Gly Tyr Leu Val Asn
645 650 655
Pro Asp Tyr Gln Asn His Arg Asp Arg Leu Asp His Asp Gln Val Asn
660 665 670
Pro Ala Val Tyr Arg Thr Leu Ala Asp Tyr Met Glu Gly Arg Pro Arg
675 680 685
Glu Ser Phe Lys Arg Pro Ser Ser Gly Arg Ile Ala Phe Gly Asp Gln
690 695 700
Arg Ser Ile Pro Asp Val Glu Cys Asp Pro Met Pro Arg Ala Arg Asp
705 710 715 720
Arg Leu Glu Asp Ala Gly Phe Asp Val Trp Arg Gly Gln Glu Val Glu
725 730 735
Ser Asp Cys Pro Ala Gly Thr Ala Ala Gly Thr Glu Pro Ser Gly Arg
740 745 750
Thr Val Lys Asn Gly Val Val Val Ile Gln Val Ser Lys Gly Arg Arg
755 760 765
Gly Ala Ser Pro Pro Ile Phe Pro Pro Ile Gly Pro Pro Arg
770 775 780
<210> 128
<211> 253
<212> PRT
<213> Actinoplanes garbadinensis
<400> 128
Met Ala Pro Leu Thr Arg Ser Leu Arg Tyr Tyr Tyr Gly Asp Ala Gly
1 5 10 15
Arg Glu Ala Ala Met Asp Ala Met Tyr Arg Arg Phe Val Arg Pro Gly
20 25 30
Asp Val Val Phe Asp Ile Gly Ala His Val Gly Asp Arg Val Ala Cys
35 40 45
Phe Arg Arg Leu Gly Ala Arg Val Val Ala Val Glu Pro Gln Pro Leu
50 55 60
Cys Met Arg Ala Leu Arg Ala Leu Tyr Ala His Asp Asp Arg Val Ala
65 70 75 80
Leu Val Glu Ala Ala Cys Gly Pro Ala Gly Gly Ser Val Pro Leu Tyr
85 90 95
Ile Asn Ser Ala Asn Pro Thr Val Ser Thr Asn Ser Val Arg Phe Leu
100 105 110
Thr Ala Ala Thr Gly Ser Arg Gly Trp Glu Asn Glu Val Trp Asp Gln
115 120 125
Gln Ile Thr Val Pro Ala Val Thr Leu Asp Thr Leu Val Gln Arg Phe
130 135 140
Gly Leu Pro Ala Phe Ile Lys Ile Asp Val Glu Gly Tyr Glu Asp Ala
145 150 155 160
Val Leu Ala Gly Leu Ser Arg Gly Val Arg Ala Leu Ser Phe Glu Phe
165 170 175
Thr Thr Ile Ala Arg Asp Val Ala Arg Arg Cys Leu Asp Arg Ala Gly
180 185 190
Glu Leu Gly Phe Asp Gly Phe Asp Val Ser Leu Gly Glu Thr Met Ala
195 200 205
Arg Thr Phe Gly Arg Trp Ala Ala Arg Asp Glu Met Leu Ala His Leu
210 215 220
Ala Gly Leu Pro His Glu Ala Asn Ala Gly Asp Val Tyr Ala Val Ser
225 230 235 240
Arg Ser Ala Gly Trp Pro Asp Arg Arg Glu Asp Arg Arg
245 250
<210> 129
<211> 261
<212> PRT
<213> Actinoplanes garbadinensis
<400> 129
Val Pro Arg Phe Asp Ser Arg Leu Val Thr Val Gly Gly Val Arg Thr
1 5 10 15
His Asp Arg His Ala Cys His Ala Gly Gly Leu Pro Val Val Leu Val
20 25 30
His Gly Leu Ala Val Ser His Arg Tyr Leu Met Pro Thr Ala His Ala
35 40 45
Leu Ala Gly Arg His Pro Val Leu Val Pro Asp Leu Pro Gly Phe Gly
50 55 60
Phe Ser Asp Lys Pro Arg Arg Ala Tyr Asp Val Gly Arg His Ala Glu
65 70 75 80
His Leu Ala Ala Trp Leu Asp Val Leu Gly Val Pro Arg Ala Cys Ile
85 90 95
Ala Gly His Ser Phe Gly Ala Glu Val Ala Ala Arg Leu Ala Val Leu
100 105 110
Arg Pro Asp Leu Val Ala Ala Val Val Leu Ala Ser Pro Thr Thr Asp
115 120 125
Pro Ala Ala Arg Ser Arg Arg Ala Leu Ile Gly Arg Trp Ala Val Asp
130 135 140
Leu Trp Ile Glu Ala Pro Trp Gln Ala Pro Val Leu Val Arg Asp Ile
145 150 155 160
Ala Asp Ala Lys Pro Trp Arg Val Leu Ala Thr Val Gly His Ser Val
165 170 175
Arg Asn Ala Ile Glu Glu Asp Leu Arg Arg Leu Pro Val Pro Pro Leu
180 185 190
Val Leu Gly Gly Ser Leu Asp Pro Val Ala Pro Leu Arg Trp Arg Ala
195 200 205
Glu Val Ala Ala Met Thr Gly Gly Val Ser Val Thr Val Pro Ala Ala
210 215 220
Ala His Asn Val Met Thr Thr Ser Gly Val Arg Ser Ala Arg Ala Ile
225 230 235 240
Ala Ala Tyr Leu Arg Thr Arg Arg Arg Cys Met Asp Arg Leu Ile Gly
245 250 255
Gly Met Pro Pro Pro
260
<210> 130
<211> 244
<212> PRT
<213> Actinoplanes garbadinensis
<400> 130
Val Ser Pro Pro Phe Arg Leu Asp Glu Ala Val Ala Asp Val Tyr Gly
1 5 10 15
Asp Leu Arg Leu Ala Pro Val Leu Arg Arg Leu Leu Arg His Ser Gly
20 25 30
Arg Leu Thr Gly Ser Val Ala Gly Ser Val Ser Leu Ile Asp Ala Asp
35 40 45
Arg Gly Cys Tyr Val Lys Ala Ala Glu Tyr Gly Ala Asn Cys Gln Leu
50 55 60
Gly Arg Ser Phe Pro Leu Asp Glu Gly Ala Thr Gly Arg Ala Phe Gly
65 70 75 80
Ser Arg Arg Pro Val Val Ile Pro Asp Tyr Gly Gln Leu Arg Ala Gly
85 90 95
His Leu Ala Ala Ala His Pro Ala Arg Lys Gly Pro Ala Val Ala Val
100 105 110
Pro Ile Trp Trp Arg Gly Asp Val Ile Ala Val Asn Val Ala Phe Ala
115 120 125
Pro Ala Phe Ser Leu Gly Gly Val Asp Glu Leu Glu Ala Leu Thr Gln
130 135 140
Ser Ala Ala Ala Ala Ile Val Arg Ser Arg Gly Val Arg Val Arg Ala
145 150 155 160
Asp Pro Pro Tyr Ala Ala Pro Ala Ala Pro Phe Thr Pro Arg Glu Ala
165 170 175
Glu Val Leu Asp Leu Leu Arg Gln Gly Leu Thr Asp Arg Glu Met Ala
180 185 190
Arg Arg Leu Gly Leu Ser Ala Lys Thr Val Glu Lys His Val Gly Ala
195 200 205
Ile Arg Arg Lys Thr Gly Thr Ser Asn Arg Thr Ala Ala Val Val Thr
210 215 220
Ala Leu Asp Asn Asp Trp Val Gly Asn Leu Pro His Thr Ala Glu His
225 230 235 240
Thr Thr Gly Ser
<210> 131
<211> 281
<212> PRT
<213> Actinoplanes garbadinensis
<400> 131
Met Lys Asp Ile Leu Asp Arg Ala Leu Ala Glu Arg Tyr Gly Val Ala
1 5 10 15
Ala Phe Asn Ile Val Asn Asp Leu Thr Val Glu Ala Val Leu Ala Ala
20 25 30
Ala Ala Glu Glu Arg Ala Pro Val Ile Leu Gln Thr Ser Val Lys Thr
35 40 45
Val Arg Met Tyr Gly Arg Pro Arg Leu Tyr Glu Ile Val His Ala Phe
50 55 60
Ala His Asp Ala Pro Val Pro Val Thr Leu His Leu Asp His Cys Pro
65 70 75 80
Glu Arg Ser Val Ile Ser Asp Cys Leu Ala Gly Gly Trp Asn Ser Val
85 90 95
Leu Phe Asp Ala His Glu Leu Asp Val Ala Asp Asn Leu Arg Gln Thr
100 105 110
Thr Glu Val Val Ala Glu Ala Arg Arg Ala Gly Ala His Val Glu Gly
115 120 125
Glu Ile Glu Gly Ile Gln Gly Val Glu Asp Asp Val Gly Asn Asp Tyr
130 135 140
Ala Pro Met Val Gln Ser Leu Glu Val Ala Val Asp Phe Ile Lys Arg
145 150 155 160
Thr Gly Val Asp Cys Phe Ala Pro Ala Ile Gly Asn Ala His Gly Gln
165 170 175
Tyr Lys Gln Ala Pro Val Leu Asn Thr Arg Arg Val Ser Asp Leu Val
180 185 190
Ala Ala Thr Gly Ile Pro Met Ala Leu His Gly Gly Thr Gly Leu Ser
195 200 205
Asp Glu Gln Phe Thr Asp Leu Ile Ala Arg Gly Cys Ala Lys Val Asn
210 215 220
Ile Ser Thr Ala Leu Lys Glu Ser Phe Met Lys Ser Gly Leu Glu Phe
225 230 235 240
Leu Arg Glu Ala Asp Glu Arg Gly Lys Trp Asp Pro Pro Ser Leu Phe
245 250 255
Arg His Gln Arg Ala Ala Val Val Glu Met Ala Arg Gln His Ile Arg
260 265 270
Leu Phe Gly Gly Ser Gly Arg Ala Trp
275 280
<210> 132
<211> 192
<212> PRT
<213> Actinoplanes garbadinensis
<400> 132
Met Gly Ser Ala Val Ala Val Pro Ala Ser Ala Gly Gly Gly Arg Arg
1 5 10 15
Asp Gly Pro Ala Ala His Pro Ala Leu Arg Arg Ile Gly Ala Arg Val
20 25 30
Val Asn Ala Leu Val Phe Asp Cys Asp Gly Val Leu Ala Asp Thr Glu
35 40 45
Arg His Gly His Leu Pro Ala Phe Asn Ala Thr Phe Glu Gln Phe Gly
50 55 60
Leu Pro Val Arg Trp Ser Glu Glu Glu Tyr Gly Glu Lys Leu Arg Ile
65 70 75 80
Gly Gly Gly Lys Glu Arg Met Ala Ser Leu Phe Ala Asp Pro Ala Phe
85 90 95
Ala Ala Ala Ala Gly Asp Thr Asp Arg Thr Glu Leu Leu Arg Thr Trp
100 105 110
His Arg Ala Lys Thr Ala Ala Phe Thr Lys Leu Val Ala Glu Gly Arg
115 120 125
Ile Pro Ala Arg Pro Gly Thr Ala Arg Ile Ile Ser Glu Ala Leu Arg
130 135 140
Ala Gly Trp Thr Val Ala Val Ala Ser Thr Ser Ala Glu Asp Ser Val
145 150 155 160
Arg Ala Val Leu Val Asn Ala Val Gly Ala Thr Thr Ala Glu Arg Ile
165 170 175
Pro Val Phe Ala Gly Asp Val Val Pro Ala Lys Lys Pro Asp Pro Ala
180 185 190
<210> 133
<400> 133
000
<210> 134
<400> 134
000
<210> 135
<400> 135
000
<210> 136
<400> 136
000
<210> 137
<400> 137
000
<210> 138
<400> 138
000
<210> 139
<400> 139
000
<210> 140
<400> 140
000
<210> 141
<400> 141
000
<210> 142
<400> 142
000
<210> 143
<400> 143
000
<210> 144
<400> 144
000
<210> 145
<400> 145
000
<210> 146
<400> 146
000
<210> 147
<400> 147
000
<210> 148
<400> 148
000
<210> 149
<400> 149
000
<210> 150
<400> 150
000
<210> 151
<400> 151
000
<210> 152
<400> 152
000
<210> 153
<400> 153
000
<210> 154
<400> 154
000
<210> 155
<400> 155
000
<210> 156
<400> 156
000
<210> 157
<400> 157
000
<210> 158
<400> 158
000
<210> 159
<400> 159
000
<210> 160
<400> 160
000
<210> 161
<400> 161
000
<210> 162
<400> 162
000
<210> 163
<400> 163
000
<210> 164
<400> 164
000
<210> 165
<400> 165
000
<210> 166
<400> 166
000
<210> 167
<400> 167
000
<210> 168
<400> 168
000
<210> 169
<400> 169
000
<210> 170
<400> 170
000
<210> 171
<400> 171
000
<210> 172
<400> 172
000
<210> 173
<400> 173
000
<210> 174
<400> 174
000
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<400> 185
000
<210> 186
<400> 186
000
<210> 187
<400> 187
000
<210> 188
<400> 188
000
<210> 189
<400> 189
000
<210> 190
<400> 190
000
<210> 191
<400> 191
000
<210> 192
<400> 192
000
<210> 193
<400> 193
000
<210> 194
<400> 194
000
<210> 195
<400> 195
000
<210> 196
<400> 196
000
<210> 197
<400> 197
000
<210> 198
<400> 198
000
<210> 199
<400> 199
000
<210> 200
<211> 40402
<212> DNA
<213> Actinoplanes liguriae
<400> 200
gatcaggtcg accgcggagc tgatctggtc acggatcgcg cggatcggca ggtccatgcc 60
ggccatcagc accatcgtct ccagccggga cagcgcgtcc cgcggcgtgt tcgcgtgcag 120
ggtggtcagc gagccgtcgt ggccggtgtt catcgcctgc agcatgtcga gcgcggcggc 180
gtcacggacc tcgccgacga cgatccggtc cgggcgcatc cgcagcgcgt tgcggaccag 240
gtcgcgggtg gtgatcgtgc cccggccctc ggagttcggc ggccgggact ccaggcgcac 300
cacgtggtcc tggaccagtt gcagctcggc ggcgtcctcg atggtcacga tgcgctcgtc 360
ggccgggacg aagctggaga ggacgttcag gatcgtggtc ttgccggagc cggtgccgcc 420
gctgaccagg atggtgcgcc ggccgcgcac gcacgcgtcc aggaactcgg cggcctgccg 480
ggtgagcgtg ccgtactgca gcaggtcacc gacggtgagc gggaccgcgg cgaacttgcg 540
gatggtcagc gtcgagccgt ccagcgcgat cggcgggacc acggcgttga cccggctccc 600
gtccggcagc cgggcgtcga cggtcgggct ggcctcgtcc acgcggcggc cgacccgcga 660
gcagatccgg tcgatgatcc ggcgcaggtg ctgctcgtcg tcgaactcgg cggcgacctt 720
ctcgaggcgg ccgaaccgct cgacgtagac cgagtacggc ccgttcacca tcacctcggt 780
caccgacggg tcgcgcagca gcgactcgat cggtccgtgg ccgagcacct cgtcggtcac 840
ctcgcgggtg atccgggccc ggtccgcgcc ggagagcggg gtctcctccc gggcgagcag 900
gtcgtggagc gcgtcccgga cccgggcgtc caggtcctcg ctctggccgg tggtgtagag 960
cgtcggcccg agctcgtcgg cgagccgccg ctggatccgc agccgcacct cgccgacctg 1020
gtcctgcggc gggcggccgg cggcccggta gcggtcgccg ccgcgtggct cggtgggcgg 1080
tggtgggggc gtgccggcgc cgctcaggcg gctggagagg ctcacgggaa caacctcccg 1140
aggaacccgc ggcgccgctg gggtgtggtg ccgacgccgg cgatccggtc accgagctcc 1200
cggatcgccc ggctgaccgg gtgcagcggg tcggtgacgg cgatcggctc gccgtggttg 1260
accgagaccg tcacgtcccg gctggccggc acctgcaccg cgaacggcat gccggccgcg 1320
acctccacct cggacgggct caggccgacc tgggcgccgg cccggttgaa gaccagcagc 1380
cgcttgtcct tggggtagtc gagcaggtcg aacatctccg cggtgagccg gaccgacttg 1440
agcgccggaa gatccggggt gacgatcggg atgaaccagt cggacatgtc cagcgcggcc 1500
agcacctggt cggtgaccac ggacggggtg tccaccacga tgaagtcgta gagcgggcgg 1560
gccacgtcca gcagctcgac gacgaactcc cggcggacct gctcgccctc ggccgggctg 1620
gccggcgcca ggagggcgtc gagactttgc cggtacgtcg tgacgatcga ccgcagcccg 1680
ggctcgtcca gccgaccggc catctgcagg cccccggcga tgttgcgttc cggggacagc 1740
ttcatcatga tcgccacgtc gccgaactgc aggtccaggt ccatcagcag cacccggcgt 1800
ccggcaccgg ccagcgcgac ggccaggttc accgccacca cgctgcgccc gcagccgccc 1860
ttgccggcga agaccgtgac cacactggcg tacggggcgt tgtcgccggt cccgcgcatg 1920
gtggtgctca gcgccttgga caggtcgacc gaccggaccg tcgcgctgcg gatgccctcc 1980
tcgtcctcct cggcgaccag gtcccggatg ccggactgca ggcagcgcag caccacgccg 2040
gcctcgatcg cgtggcggat cagcaccacc ccgatcaccg ggcgctgcaa ccgctggtac 2100
gccgtgaaca tcagcgcctc gtccaggtcc acgaccgcgc cgatcaccac gagcagcgtc 2160
tccgggtagc gggggagata cgactccagc tcgctcatgc tcttgagcat cgtgccgccg 2220
atcgcccgga agtcgttgcc ccagtgcgtg cggcgctcgt cgtcgggctc gacgtacaca 2280
tagaggctca tcgcacgacc cagctcgtgt cgatcgccgg gccggtgctc gcggtggcgt 2340
tcgggccgag cagcgccagg tagagcgatc cgctctgggc ggcgtgcacg agtcgcaggg 2400
cgtcggtgtc gccgacggcc agggtcacga cgtaccgctg gatctccttg accgcggcgg 2460
tgctgtcgcc ggccgaggcg gacggaccgg gggtgggcga gggcgacggc gtcacggggg 2520
cctgacccgg ttccgcctcc ccgatggtga tcacccgtgc cttcggcagc aggagctcgg 2580
tcatcgggat ggtctcgtgg tcctccgcca tcaggacctt cgcctggtac gtgtaataga 2640
ccgcgacctg gtcgccgggc gtgatgttgc cggctacctg cggggcgacg ttgagcgcca 2700
ccgagaccgc gagcgaccta cggggcaccg ggatccgccc ggtgtgcgac ggcgccggtg 2760
acgccgggac gaacagcgtc cgcatgagga gctgccgggg ctgcaggtcc ccgccgagcc 2820
ggagcgggtc gagcgcgctg tcccaggtgg tcagcgcccc ggcgggcacg gtgacggtgg 2880
ggaccaggag ccgctcggtc aggccccggg cgcggatctc ggcgccgctg gtcccggacg 2940
ggatgtgctg cccggcgacc aggatccagg tgccctcccg gccgctgagc gcgcgccggt 3000
cggccgaccg ggcgtaggac aggacggccg ccccgctgat cccggccagc accagcgcgg 3060
ccagcaggat caggatgcgg cggcgcatga cttcaccttc tcaggcaccg gtcatcccgt 3120
acggccgatc accatcgcgc cgtaataccg cgaggtggcg aaccgcgtcg gtacgtggtc 3180
cgtgaccagc gctctggtga agtagccgta gaggcaggac tgcgccgcgc acagcgctct 3240
ctgcgccccc ggcacgagcg aggggaccgc ggatccgggt gacaccgggc cgctgaccgg 3300
gctctcgtag ccggtgagga cgagcggcgc gaagccggcg atccggtagt acgacggcag 3360
cgtgccgatc accgccacct gcctgtcgaa gatcggcacc agcaccggct gccccgaggt 3420
gatcaggacg ttcagccggt cgaggcaggc cgtggcggcg gaggcgttgc cggggccgat 3480
ggtgaatccg ccgacccagc tgtccgccgg cccgtcggtc gccgggatgc cggtcagctc 3540
gcaggaggcg tccggtgcgc tgaccggcag caggcccggc agcgccggcg ggccgtccgg 3600
ctgcccgagc cacgtgtaac cggcgacggt ctcgccggcg tcggccgggc aggacgtggc 3660
gaggatgccg tcgctgatcg ggatgtagcc ggccgtcggg tcggagaggc cgagcagcgg 3720
gtggacgccg gtctgcgggt tcgggccggt gggcggcggc ggggcgaaga acctcgtgta 3780
gtcgccggtc agccgcagga agtcgcaccg ggagacgccg agcgcgagga cgtcggtgac 3840
cgccggagct ccccaggcga cccggccgca ggcgcccatc ttcgccccgt ggtacgccga 3900
cccggccaga ccgcgcccga acagcggcgg caccaccgag gtgttgtcgc tgttgcgggt 3960
ggacgtccgg acctcgacgt accggtacgg cccggaggcg ctcggcggcg cggggcacgt 4020
gaccggggtg ttccaggagc tcgggcagcc ggcgtcggcg gtggtgacgc cggcggcgga 4080
gacggtggtg atgcagaact ggacgtccga gacgaggtcc ttggcgttcc ggtcggcgta 4140
ccgctgcgcg ttgtcccgct gcgcggcgac ggtgcaggtg gcggacgtca ggtcccggcc 4200
ggccgtgccg gcgcaggcct gcgcgacctt ccacgacgcc gcgtcggccc cgctctgcaa 4260
ctgctcccgc tcggcgtaga gcgcgccgat gtcgatcacc agcgccgcca tcccgagcag 4320
gacgccggcg ccggccagga cggcgaccag cgcggtgatc acgccgtgct cgccgcgggg 4380
cgggaacagg gcgtggatca gccgacgcat gacatcacgc cggtcgcgct catcgtgatc 4440
gtgcccatgg tctgcccgcc gaccagcctg accagcgcca ccatcggcgt gatcggctgg 4500
taccggcggg tcagcacgac ctcggcgtcg gcgccggcga gcgaggtggc cgaacaggtc 4560
gtgacggtct gggtcaccga cggcgccccg gtggcgccga cgatgccgtt gaccttggcg 4620
tgcaccgccg cggccgtgcc gttcagggcg ccgagccggg cgccctcccg ggccgcctcg 4680
gtgagctgga tgtactgctg gagcagccgg cccatgtcga tgatcccgaa caggatcagc 4740
agcagcaccg gcatcacgat ggcggtctcc agcgccgcgg cgccccggtc ccggttatcg 4800
tgcggagctc tccgctccct gggcgagaac cgtacgcaac atcccggcca gccggtccgc 4860
cgtatacggc ttcgccacga atggcgaccc ggcacggatc agccctttct tgatggcgat 4920
ctcctccggg accccggaga cgtagacgat cttcatgccc ggccggacct cggaggccga 4980
gcgggccagc tccccgccgg agactcccgg caggcccagg tcggtgagca gcacgtcgat 5040
cgctccgctg tgcacccggc acgtcatgat ggcgctgacc gggtctttcg ccacgaggac 5100
gacgaacccg cgcatctcca gcatctgtgc ggcgagctca cgcaggtcct cgtcgtcctc 5160
caccaggaga acgaccggcc cctgccgctc ggttgctttc cacatcattc ctctcccggt 5220
gcacgaggaa tccggcgacg actcttcccg tcgctgcctc tgctcacgct atccaccggc 5280
ctgcctggcc cggtggcatt cgcggaaatg tcgatgccct caaatcagca tttgtccggc 5340
ggcactgtcc gtgttaacgc tcactacgtt gcgctgacgt cacgtttcgt cccggtaaca 5400
gttcggggtc ttgacagatc acgagcgtcg atgggtgaat gtgttcaatc ctgatcggac 5460
gagtgcagga taaacaacgt ttgcgtgtga agccgtttgg ctttgagggg gctccatgtt 5520
caattacgtc agtttcgtgc gccctaaaac ctttgccgcc accttcgcgg cagccgccct 5580
gctgctcggc tcgggcgcct gcgcgaagag cgaggactcc ggggacaccg tggcggcggg 5640
tcccgccccg tcggcggcgc aggtggtcca gtccgcctcg gccggctccg cgacctgtgc 5700
cttggatcag tacggcgcgt ccaagctcga cctgaagacc gcctccgtcg gcttctccca 5760
gtcggagaag gaggcgaacc cgttccggat cgccgagacg aagtccatca aggacgaggc 5820
cgcgaagctg ggcatcacca acctcaagac ctcgaacgcg aactcacaat tcaacaagca 5880
gatcgccgac gtcgagcaga tgatcgatgc gggcgtgcag ctgctggtga tcgcgccgct 5940
caactcggac ggctgggact cggtgttcgc caaggcgacg gcgaagcaca tcccgatcat 6000
cacgatcgac cggaagatca acgcgaccgc ctgcaaggac tacctgacct tcatcggctc 6060
cgacttcgcc gagcagggca agcgggccgc cgacgcgctg gccaagtcgc tgggcaacaa 6120
gggcgaggtg gcgatcctgc tgggcgctcc cggcaacaac gtcaccacgc tgcggaccag 6180
cggcttcaag gacgagatcg ccaaggtcgc gccggacatc aagatcacgt tcgagcagac 6240
cggcaacttc tcccgggagg acgggcagaa ggtcgccgag cagctgctgc agtccaagcc 6300
gaacatcaac ggcatctacg gcgagaacga cgagatggcg ctcggcgcga tcaccgcgct 6360
caagggcgcc ggcaagaagg ccggcgacgt caagatcgtc tcgatcgacg gcaccaaggg 6420
cgcggtgcag ggcatcgtgg acggctgggt ctccgcggtg atcgagtcca acccgcgctt 6480
cgggccgctg gccttcgaca ccgcgacgaa gttcttcggc ggcgagccgg tcggccagga 6540
catcgtcatc caggaccgtg cctacgacga gtcgaacgcc aagaccgaca tcggcagcgc 6600
gtactagaga gcgctcccaa tcgggtgtcc ggggatgaac cgggcacccg ccggcacgga 6660
ggagggcggc tcatgctgct ggaagtctcc ggcgtctcca agaccttccc cggcgtacgc 6720
gccctggacg gggtgtcctt caccctgaac ccgggcgagg tgcacgcgct ggtgggggag 6780
aacggcgccg gcaagtcgac gttgatcaaa gtgctcaccg gggtctacca gccggacagt 6840
ggcgagctgc gctaccgcgg cgagccggcc cggttcgcca ccccgctgga cgcccagcgg 6900
gccggtatct cgaccatcta tcaggaggtc aacctcgtcc cgctgatgag cgtggcgcac 6960
aacctgttcc tcggccggga gccgcgcaac cggttcgggc tgctggacga ggcccggatg 7020
gtcgccgagg ccaccgagat cctggccggt tacggcgtac gcaccgatgt ccgccgccgc 7080
ctcggcaccc tggccctggg cgcgcagcag atggtcgcgc tcgcccgggc cgtcatggtc 7140
gacgcccggg tcgtggtgat ggacgagccc acctcgtcgc tggagccgcg cgaggtggag 7200
accctgttcg gggtgatccg cgagctgcac accgcgggca tcggcatcgt ctacgtctcg 7260
caccggctgg acgagctcta ccgggtgtgc gacgcggtca cgatcctgcg cgacggcaag 7320
ctcgtgcaca ccggccggat ggccgatctc gaccggcgca cgctggtctc gctgatgctc 7380
ggccgcgagt tcggggcgga cttcaccagc ttctccgagt caccgcagag caccccggag 7440
ggcgagccgg tcctgcgggt gtccggcctg accagccgcc cccggctcga cgacatcagc 7500
ttcgacgtgc gccccggcga ggtggtcggc ctgggcggcc tgctcggcgc cggccgcagc 7560
gagacgatca aggcgatcgg cggggcgtac ccgatcgact ccggcgtgat cgaggtcggc 7620
ggcgtccggc tcggcaggcc cagcacggta cgggcggtcc gcgcgggcgt ggccacccag 7680
ccggaggacc gcaaggccga ggggatcgtc cccggcctgt cgatccggga caacatcgcg 7740
ctcgcgatcc tgccgcggat ggcccgtttc ggactggtca gcgacaagcg gatcgacagc 7800
atcgtcgcca cgtacatgag ccggctgcgg atcaaggcgt ccggtccgga ccaggcggtc 7860
ggcgatctct ccggtggcaa ccagcagaag gtgctgctcg cgcggctgct cgccaccggc 7920
ccgaaggtgc tgctgctcga cgagccgacc cggggcatcg atgtcggcgc caaggccgag 7980
gtgcaggcgc tgatcgacga gctggcgaag gaggggctcg gtgtcgtgct ggtctcctcg 8040
gacgccgagg aactggtcga gggcgcggac cgggtggtgg tgctgcgcga cggcgcggtc 8100
gtcggcaccc tcaccggcga ccgggtgacc accgaggccc tgatggccac gatcgcggag 8160
gccgcggatg agcactgaga ccctgacccg cccgcggatg acgttcaacc cggcgtgggc 8220
ggcacgctac ggcgtctacg cggcgatcgt tctgctgatc gtcgtcaaca tcgccttcac 8280
gccgtacttc ctgaccctga gcaatctgcg gatccagctg atccaggcgg cgccggtggt 8340
gatcgtcgcg ctcggcatgg ccctggtcat cggcaccgag gggatcgacc tctcggtggg 8400
ttcggtcatg gcgctcgccg cggccttcat acccctctat ctggggtacg gcgtgacagc 8460
cgcgatcctc gtctcgctcc tcgcgggtgt ggcggtcggg ctgatcaacg gtgtcctggt 8520
cgcgaaggcc ggcctgcagc cgatcgtggc gacgctggcc ctgttcgtcg gcggtcgcgg 8580
gctggccgtg gtgatctccg gtggacagct caaggacgtg cgcaacgccg acctgctcta 8640
cctgggctcc ggtgacctgc tcggcgtgcc ggtcctggtc tggatcgcgg cgctgctggt 8700
gctcgtggtg gcgttcgtgg tccggcgtac cgtcttcggc cggcgcctgc tggccgtcgg 8760
cggcaaccgg cccgccgccg agctcgccgg cctcccggtc aagcgggtgc tgatcggcgt 8820
ctacgtcttc tgcgcggtgc tcgcctcgat cgccggcctg ctctcggtcg cgcgcatcca 8880
gtccagcgac gcgtccgcgg tcggcctgct gatcgagctc tccgcgatca ccgcggtggt 8940
cgtcggcggc accccgctca ccggcggccg ggtccgggtg ctcggcaccg tggccggggc 9000
cctgctcatg caactggtgg tcgccaccat gatcaaacac gatctcccgc cgtccaccac 9060
cgagatggtg caggccgtga tcatcctggt cgcggtctac gtggcccggg agaggaggac 9120
ccggtgacca tgtcgatccc cgtgcccgct ttccggaacg gcggcttcgt gcagcgccag 9180
ggcgcgctcg cggtgctggt caccgtggtg gcgatcagcc tggccgcgtt ccccggcttc 9240
cgcagcgcgg acaacgccgg cacgatcctg gtcgccgcgg cgccaccgat gctgatcgcg 9300
ctcggcatga ccttcgtgat catcacgggc gggatcgacc tctcggtcgg ctcgctctac 9360
gtgctcggcg gggtggtcgc cgcctgggcg tcgcagtggg gagtcgtcgc ggcgctggcc 9420
gcgccgttgc tcctgtgcgg ggccatcggc gtactgaacg ggatcctgat ctcgagaacc 9480
gggatggcgc ccttcatcgt caccctcgcc gcgctgctcg gcgcccgtgg cctcatgcgc 9540
agcatcagcg atgagggctc gacgacgtac ctggtcagga gcgacgtctt ccacgagctg 9600
ggcacgggat ccctgctcgg cgtcggtctg ccggtctggc tggccgcggt tctggtcggc 9660
gccgggatcc tggtgctgaa ccggacccgg ttcgggcacg ccgtgcacgc catcggcggg 9720
agcgaggacg ccgccgcgct gatggggctg cccgtacggc gaataaaggt ctgggtctat 9780
ctcctctccg ggctgctcgc gggactcgcc ggtgcgatca acgcggccaa gctcggctcc 9840
ggggtcaccg tgctcggcag tggcatggag ctcgacgcca tcgccgccgt cgtgatcggt 9900
ggcacgctgc tcaccggcgg ctccgggtcg atcgccggca cggtcgcggg ggtgctgctg 9960
ctcggcgtga tccagaacct gatcaaccag gtcggcaacg tcaacagcaa ctggcagcag 10020
gtgatcagcg gtgggttcct cgccgctgtg gtcgtggcgc agacaactct cgtacgcgca 10080
agaagatctt gacgtggagg cccgcccggg gaccctgccg cgggcgggca ggcgtaggtt 10140
gcccgcatga cggagcatcg ggtctccccg gccgggcggg cgctcgcgtg gctgatgctg 10200
gtctccgggt tcgccgcggt cgtcgggtcg ttcctgccgt gggcctgggt cgacttcccg 10260
gagcagggca gcagccaggt gtccgggagc ctcgtgtccg acctgttcac cgcgttcttc 10320
ggggtcgtgc tcgccgggta cgcggtgccc gccgtgcgcg gcgagcgcct gcccggcctc 10380
gagacgttct tctcggtcgg cgccgggctg gtgctgttca cgctcggggc ctgggacagc 10440
cggcacctga cctcgatgac cgccgccctg gtcgcggccg acaccggcac gaccatcggg 10500
cccggtctct ggctgtgcat gatcggcggc ctgctgggcg cgctcgcggc ggcggccctc 10560
gccgtccggg gacgccggcc ggtcgtcagc tcccgggtgt gaccacccag tccgggtggt 10620
tcggcatcgg aggggtcgtg acgccgagga gccaggaggt caggaacggc cgcagatcct 10680
ggcgggcgac ccgcgaggcg agcgtgatga agtcaccggt cgaggcggag cggccgcggt 10740
acgtcgtcag ccaggcgcgt tcgacccgct ggaacgtcgc cgcgccgatc ttctgccgga 10800
gcgcgtagag gaccagcgcg ccgccggcgt agacgttcgg gttgaagacg tcccacgtgg 10860
tcgccgcgtc gagcggggcg gcgaccggac cgtacctggc gcggaagatg tcgccggcgg 10920
cgtagacggc cttgaagaac gcctcgcggt cggccaggcc ggtgtactgc gggaacccgc 10980
cggtctcctc cgaccagagc atctcgtacc aggtggcgtg gccctcgttg agccagacgt 11040
cgctccacga gaacggcgag acgctgtcgc cgaaccactg gtgggccagc tcgtgggtca 11100
tcgacgggcc gcgggtggtc tcggggccgg tgaacagggc ggcgccgtac agcgaaaggg 11160
tctgggtctc cagggcgtag cccaggtcgt cgtcgatcac cagggagccg tagtcctcga 11220
acggataggg cccggcctgc ttctccatcc aggcgagctg ctcgcgttcc ccggcgatcg 11280
cgggcagcag cgtgccggcg aggcgtcgcg gcaccacgtc gcggatcggg gtgccgccgg 11340
ccgccgggcg gcgctcgacc acgaagtcgc cgacggccgt ctgcaccagc tcggtggcca 11400
tcggggcgga ctcgcggtag accgagctga cgtggccgtc gtgctcggtc gtgctcacca 11460
gcgtgccgtt ggccgtcccg gtccagccgg ccggcacggt gagcgtgatc gtgaaggtcg 11520
ccttgtcccg tggatggtcg ttgccgggga acagcaggtg cgccgagccg ggctgggcag 11580
cgagcaccgt cccgtccggc gtcgccacga gagcggccgg ggcggcggtg aagttcgcga 11640
ccgtgacccg gaacagccgc ccccggggaa gggggcgccg cgggatgacg gtcagctcgt 11700
cgccgtcccg ggcggcccgc gcgggctgcc cgtcgaccga gacgcgcccg atcgaggcgc 11760
cgccgaagtc gaggtcgaag cgggacaggc tctgcccggc gacggcggtg atcgtcacat 11820
cgccggatac gacctgcttc gggtccttct ccgggtagcg caggcggagg tcgtagtcga 11880
gcacgtcgta gccgccgttg ccgagcagcg ggtagaggcg gtcgccgagg ccggcggacc 11940
cgggtgacgg cgagggcccg gcctgcgccg gtgcggcggc tgcggccagg gcgaggacga 12000
cggtggcgcc gacggtgagg acgcgggtgc ccgcggacgt tcgcatggct tccgacgcta 12060
ggcgacacca ccggaagcca tcgacccatg ggcatgtatg aaatcccaca atctccgatg 12120
tggacggacg gatggtgcgc agtatgcaac ttgcagattt cgggacattc cctagcccgg 12180
cggttgccgt gtgcacccgt tcgaccactg tccggaaccg cgtggtgagc agggtgaacg 12240
ttcatgcggc ccgggccgcc ggaggtcccg tgaccgttcg cattgccgtg cgccggtgaa 12300
tcactccgct ttacgacttc gcgacaagtg gttaatgtcg gcgaagcgat atatcgtcca 12360
gttattcggg ggactgcggt gcatgagcaa aaaatcactc cggcgattgc cagcggatca 12420
ccgcaaattg aattgctgcc cgtcaattcc ctgcgagtga tggattcgcc gcgactgaac 12480
ggtgaggacc cgcggcacac cgaggtgctc gccggcttcg gggcggagct cccgccgatc 12540
gtcgtgcacc gggcgaccat gcgggtcatc gacggcgcgc accggctgag cgcggcccgg 12600
ctgcgcggcg acgaccggat cagggcggtg ctgttcgacg gcaccgagca ggaggcctac 12660
gtgctgagcg tcaaggccaa cgtgacgcac gggctgccgc tgtccgccgc cgagcgcacc 12720
cgtgcggcgg agcgcatcat cacgatgcat cctgactggt cggaccggat gatcgcggcg 12780
tccagcgggc tgggcgcgcg gaccgtcggc ggcctccgcc ggcggcgcgc ggcctccggc 12840
gagagcccgg cgggcctccg ctcgcgcgcc ggccgggaca gccgcgtccg gccggccggc 12900
agcaccgcgg gccggctgaa agcggtcgac tacctccagg accggccgga cgcctcactg 12960
cgggagatcg cccggcacgc cggcgtctct ccgtcgaccg cccgtgacgt ccgggaccgg 13020
ctgcaccgcg gcgaggaccc gatccccgcc acgcaacgcg cggcggcacg ccccggaaac 13080
gattccccgc cgctgcggtc gctggtccag ggcttggcga gcgacccgtc gttgcgattc 13140
agcgagtccg ggcgcgatct gctgcgctgg ttgattgccc acgccgttca ggacggcgaa 13200
tggaaagggc tggtcgacac tattccggcg cattccgcgc aggcgctggc gaaaatcgcg 13260
cgccattgtt cgcgggaatg gcgtgagttc gcggacatcc tggagaagga cgccgcgtag 13320
gccaccggca tttcttccgg cacccggtcc gccctccgtc acgcacaggt cagagtactg 13380
atggcggctg tcaacccgcc gatctgcggg taggtgccga cgtccttccg ccgaccgtct 13440
gccgaacgca tccggtcggt gcccgatgtg cgggtaggca ttcaccgatc agggttgctc 13500
caatgtctct cgtcgatacc gcggctgata cctccgcggt actcggcaga acactccgtg 13560
gctatggcgc cgtggtcccg gagcctttcc tgaagtactt cggacgtacc tgtccggagt 13620
cccccacaga aggagacatc atgtcggcca tcaccgtgga aaccacctgg aagaacaccg 13680
acctccggga ggacctcacc gctcacccgg ccggcctcgg cttcggcgag ctgagcttcg 13740
aggacctgcg tgaggaccgc accatctacg cggccagcag cggctgggtc tgcaccctga 13800
ccatcgagtg cggcacgctc gtctgcgcct gctgaccaac ggtcatcgca ctgccgggac 13860
cggggctgac cccggtcccg gcaccctctc cccggcagga gcctgcatgt catcctttgc 13920
gatcgccgct tcgccggcca gcgcgtacct gcacgagcgc tccgccggcc ccggcggcga 13980
ccccgtggcg gagcacgagc gggtcgagtc gtggcgcgag tccgcgttcc tggacgaccc 14040
ggtcctggac atccgcctgc gcgagctcgg actcagccgg gccgagttcg gccggctgct 14100
gaccgacggc gcgtacgacg ccgggagcac ggccctcgac tgggccggcg agctggccgc 14160
cgtgctggcg accgggaccg gcgcggtcac cggactcgcc cggtcgacca agctgtgggc 14220
gcagggcttc gaccggctgc cgttcgccgg gctgatcgag aggttcctcg cgtactacga 14280
gccgcgggtg ccgcgcaccg ccgggaccgt ccgggtgtcc ctgctggaga gcctcgcgaa 14340
ccgcctgctc acggtcgcga cccggaccct gctgctggaa ctgaacgtgg cccgggtgca 14400
cggccgcctg accggcgcca cccccgggga acgctacgac cactacgacc gggtcctgct 14460
gaccgacccg gactacctgc gctcgctctt cggcgagtac ccggtgctcg gccgggccat 14520
ggtcgagtgc ggccgccgct gggcgtcggc gatggccgag ctgttccagc gcctggacgc 14580
cgaccgtccc gccctgcacg ccgccgggct gctgccggcc ggcgcgggcg aggtcaccgc 14640
gctccggccc gacctcggag acccgcacaa cagcggccgc gcggtcgcga tcctgacctt 14700
ccggtccggt gcccagctgg tgtacaagcc ccggccggtc gggccggagc gcgcgtacgc 14760
cgagaccgcc gcggccctga accggcacgg cctgagcctg ccgctgaccg ccgtggacgt 14820
gctcgaccgc ggcgcctacg gctggtgcga gctggtccgg cacgagccgt gcgccgaccg 14880
cgccgacctg gaccgcttct accggcgtac cggcgcggtc ctggccacca ctctgctgct 14940
cggcgccgtc gacgtgcaca tggagaacgt catcgcggcc ggctcgtcct gcatgcccat 15000
cgacctggag acgctgctgc agcccggggt cccgtccggt gacgcgacgg acgcctacac 15060
ccgggcgctc gacctgctca accagagcgt gctggcgatc gggatcctgc ccgcccgggc 15120
gttcggcggc cgggagcgca agagcgtcga cgtcagcgcg atcggcggcg gcgaggcaca 15180
gaccgcgccc cggccggtgc cgatggtcgt ggagccgttc accgacgtgg cccggatcga 15240
ggcggtggaa gcgaccatgc tgggcgcgca gaaccggccg gtgctggtcg gcgccgaggt 15300
gcggcccgag gagcacaccg aggcggtggt ggccggcttc accgaggcgt acgacctgat 15360
cgtccggcac cgcgaggact tcgccgacct gctggccggc ttcggtgacg tcgaggtgcg 15420
ctacctgccc cgcccgaccc gccggtacag catgttcctg accgagagct accacccgga 15480
ctacctgcgc gacgcgcgtg accgcgaccg gctgctcgac aagctgtgga ccgccgcggg 15540
cgcccgtccc gacctgatcc ccatcatcga gtcggagaag cgccagctgc tggccggcga 15600
catcccgtgc ttccgcgcgc tggccggcga ccgggcgatc cgcaccgcgt ccgccccggt 15660
ggcgccggac ttcttcgacg cccccggcat cgaggtgctg gccggccgcc tgcggcagtt 15720
cgggccggtg caccgggctg cccagctgcg gatcatccgc gagtcgatgg gaaccatgcc 15780
cgcgcccggc ccgatcgccg ggacacccgc gccatcctcc gagcggcgtg gcggcctcga 15840
cccccgtgag gccgccacgc tcggggaccg gctcgtgcgg gagctcgcgg acgaggcgat 15900
cctcggggcc gacgacgccg gctggatcgg agtcagcatc gagggcctcg accaggagac 15960
gttcagctac aagccgatgg cgaccgggct gtacgacggc atcgcgggaa tggcgctgac 16020
gtacgcgtac gccgcccgca cgctcggcga cgagcgctac ctcgacctga cccgccgtac 16080
cgtcaagctg gtctccggct atctgcggta cctcgccgag caccggatcg tggagacggt 16140
cggggcgtac agcgggatgg ccggcctgct ctacacgctg gatcacgtcg cccatgccac 16200
cggcgacgcg tcgctgctgg gcgagatcga ggccgcgctg ccctggctgc gggagtgcgc 16260
tacccgcgag gagtgcccgg acctgatcgc cggcctggcc ggttgcgccg tcgtcgcgct 16320
gtcgctgtac cggcggcacg gcatcgccgg ttaccgcgag gtcgcggaga tctgcggccg 16380
gcgactggcc ggcaccgcgg tcgacgtcga gggcgccgcg ggctgggccg cgacccggac 16440
cggcgtgatc ctcggcggtt tctcgcacgg ctcggccggg atcgcctggg ccctgcacga 16500
gctcgccgcc gagttcggtg accgggacct gcgcgagctg gccgaccggg cggtcgagtt 16560
cgaccggcgg ctgtacgttc cggccgccgg cgcctggcgc gacctgcggc ccgagatggc 16620
cggcaccgac ggttacccgg cgctctggtg tcacggcgcc gccggcatcg gcctgtcccg 16680
gctgctgatc caccggatcc ggccggacga gcggctcgcc gaggaggccc gcgccgcggt 16740
ggcgctggtc cggcggcacg gcttcggcca caatcacagc ctctgccacg gcgacttcgg 16800
cgcgctggcc ctgctcggcc tggccgaccg cgcgtggccc gggtcgggcg gccacgacga 16860
gcgtgccggc gcggtcgtgc gggacatcgg cgagaccggt ctgcgctgcg ggctgggcaa 16920
cggcatccgg atgccgggtc tgatgctcgg cgccgcgggc gccggactga gcctgctccg 16980
gctggccgcg cccgccgacg tgcccgcggt cacctggctg gaaccgccgc ggggcacgca 17040
tgtctgagac ggccgggctg ctgcggcgga gcctgctcga tcaccggggc aagctcgccg 17100
ccgtggccgg tctcgccgtc gccggggtcg gctgccagct gggccagccg ttcctcatcc 17160
ggcgcgtgct cacggcggtg cagtccgcac agccgtaccg ccaattggct ctcgccgttc 17220
tggcggtcat ggtcgtcggc gcggcgctgg gcgccgtcca gcagttcctg ctgcagcgca 17280
ccggggaggc gatggtcttc acggtgcgcc gcacgctcgt cgcgcacctg ctgcggctgc 17340
cggtcgcggc ctacgacgag cggcagtccg gcgatctggt gtcccgggtc ggcgccgaca 17400
ccgcccaggt gcgctcggtg atcacgtccg gggtggtcga cctggccggg ggcgtcctgc 17460
tcgtcggcgg ctcgatcgcc ggcatgatca tcattgatcc ggtcctgctc ggcgtcagcc 17520
tggcgccggt gctgtgcggc gccgccgggg tccggctggt cggccgtcgg ctgcgcccgc 17580
tcagctcggc ggtccaggag tcgatcggcg cgctcaccgc ctcgaccacc cgggccctcg 17640
gcgcgatccg cacgatccgg gtcgccggcg ccaccgagcg cgagaccgcc ctgatcgtcg 17700
ccgaggccga ccgcgcccgg gcggcgggcg tccggctcgc cctggtcgcg gcccaggccg 17760
gcccgatcgt ccggctcgcc ctgcagggcg cgttcgtcgc ggtgatcggc ttcggcggct 17820
accgggtcgc gaacggcgcg gtgtcggtcg gcgacctggt cgcgttcacg ctgctgctgt 17880
tcacgctggc gctgcccctg gcccagctcg ccgaggcggc cacccggatc cagaccgggc 17940
tgggcgcgct gacccggatc gaggagatcc tggccctgcc ggacgaggac agcgcgctcg 18000
gcgtccgtgc gaggacgccc gccacggtcc ggcacgatcc ggtgctgctg gagttcgatc 18060
acgtgtcgtt ccgctatccc accggcgggg agatcctgcg cgacgtcagc ttccgggtgc 18120
cggccggcag caccaccgcg ctcgtcgggc cgtccggggc cggcaagtcg acgatcctgg 18180
cactgatcgc ccggctctac gaggtccacg gtggccggat cctgctgcac ggccgcgaca 18240
tccgcgacta cccgctcgcc gagctgcggg ccgccctcgg ctacgtcgag caggaggccc 18300
cggtgctggc cggcaccgtc cgggacaacc tgacactggc cgcgccggac gtcgcggaac 18360
acgcgatccg ccacgtcacc gcatcggtca acctcgacga cctgctcgcc cgtgacccgg 18420
ccggcctgga cgcgccggtc ggggacggcg gcgtgctgtt ctccggcggt gaacggcaac 18480
ggctcgccgt cgcccggacc ctgctcgccc cgggcgaact gctgctcttc gacgagccga 18540
ccgcccacct ggacgcccgc aacgagcagg cgctgcagca cggcctgacc gcgcacgccg 18600
ccggccggac gctggtggtg gtcgcgcacc gcctggcgac cgtcgcgcac gccgaccaga 18660
tcctggtgat cgacgacggt cgttcggtcg ccgccgggcg gcacgaggag ctgctcgtcc 18720
gcgacccgac ctaccgcgag ttcgccaccc gtcaactgct gacctgaatc ccgaggtgta 18780
cgccatgctc agtgtcctgg accaggtgcc cgtgttccgt ggcgacgacc ccgccgaggc 18840
ggtccgcgag gccgtcgggc tcgcccgggc cgccgagtcg ctcggctatc accggttctg 18900
gatcgccgag catcacggca gcgccgccaa cgcgtgcgcg gcgccggaga tcgtggcggc 18960
ggccgtcgcc ggagccaccg aacggatccg ggtgggcacc gggggagtgc tgctgccgta 19020
ctacagcccg ctcaaggtgg cggaggcctt ccgggtgctg gcggcgctgt atccggggcg 19080
gatcgacctc gggttcgggc ggggcagggg cgggccggcg gtgatggccg agctgctcaa 19140
cccgtacgcg atcgcgaccg aggaggcgta cgccgagcag gtcggccggc ttctcgcgtt 19200
cctgggcgac gcgcggaccg tcagccgggt gtcggtcacg ccggcggtgc aggacccgcc 19260
gttgccgtgg ctgctcggct ccggcgtcgg cagcgcccgc ctcgccggga tgctcggcgt 19320
gccgttctgc ttcgcgcagt tcatcgcgac cgaggagtgc ccggaggcga tcgcggcgta 19380
ccaggagtcg ttccggagct cgccgtggct ggacgagccg caggcgatgc tggcgttgcg 19440
ggtgctcgcg gccggcaccg ccgaggacgc cgaggagctg gccaccggct tctggatgtc 19500
gtgcaccacc ggatggcggg cccaggtccg gccggacgac gactaccggg gtggcgtgcc 19560
gaacctggcg gacgcccagc ggtacacgct gaccgaggag gacctggcga tgcgcgcgag 19620
ccggccgtac ctgcagatct ccggcacggc ggagacggtc ggcgaggaga tccggcgact 19680
gcgcaaggtg tacgacgtgg ccgaggtcat gctcaccacg aactgtcccg gggcggccgc 19740
cccggcgccg gtcctacgag ctgctggccg ccgagctcgg gctgaccgcg ccggcgtgac 19800
ccgggtcagg ccagctcgtc ggtggtgagg ccggcggcgt acgccagcac ggcggcctgc 19860
acccggttgg ccacaccgag cttgcgcagg atgacgctga cgtactcctt gaccgtggag 19920
tcgctgatga acaggcgccc ggcgatctcc gcgttggtca gcccctgccc gatcaacccc 19980
agaacggcct gttcccggtc ggagagctgt ttgacctcgt cgaccgcgtt ctcggcggcc 20040
ggagtgcccc ggcaggccgc gcccagcatg atcgacgagg cctccggcgc cagcacggtc 20100
accccggacg ccagcgcgcg gaccgccgcg accagttgct ccggctgact gtccttgagc 20160
aggaagccgc aggcgccacc gcgcagcgac tccagcacgg tgctggacgc cgccagcgtg 20220
gccagcaccg ccagcgccgg cccggactcc aggtcgcgca gccgggtcag cagcggcacg 20280
ctctccggca gggtcgcgtg cgcgtccagc aggacgaccg cgggccggtg ctcgctgacc 20340
gcggcgagcg cgctgtcgcg gtcagcggcg acgacggaga agccacccat cgtctccagg 20400
atcatcttga tgccgatcga gaccagggcc tcctcggcca ccaccagtac gtccgccatg 20460
cctcccccgg gcaatgtagc cgtacgagat ttgatagtgc acaaaaacca tcgaattact 20520
gctctttcga atcatacatg tatttatgca aatttctggt caggaaacgg ggacgatccg 20580
agacgcccgg gccggcgtct cggatcgtcc ttcaccgcgc acggctatcg cacgagccct 20640
tccgcggggg cgatccgcgt ggctcgccga gccggcgcca ggctggccag cacaccggtg 20700
accgcggcgg ccaccagcac gagacccagc tgcggccacg ccagcatgat caccggttcg 20760
gcctgccggc ccacggccgc gatcacgccg accagcccga ccggcacccc gatgacgatg 20820
ccggccaccg tgccgaccag cgtgatcgtg accgcctcga cggcgaccat cgcgcgcagc 20880
cggctccggc gggtgccgag cgcccgcagc agggccatct cccgggttcg ttcgatcacc 20940
gagaggccga gcaggttggc gatgccgagc agcgcgatca ccacggtgac cgccagcatg 21000
cccagcgaca gtccgagcag gatggacagg acgttcatga tgtcgccgcc ctcggtgaca 21060
ccgccgccga cctccacacc ggcgtcgcgt gccgccaccg cgttgacgtc ggcggccagc 21120
gtctcccggt cgaagccgcc cggcgcggtg ccccagaccg tggtcggcac ggtccggacc 21180
ccggcggcgg tcaggacgtc accggtggtg acgccgagca gctgcccggt cgtgtcggcc 21240
agccgcgagc cccgggcggt gaaccgcagg tcccgcccgc cggccgtgac cgtgagcgga 21300
gcaccgtccg tcagcccgcg cgccgtcagg taggaggccg gcaccagcag caccgggtcc 21360
ccggtggacg cgctcagctc cggcgcgagg cgcccggcca cgtcggtggg gagcgccgcg 21420
atccgggccg gcgtgggttt gcccgcggcc gggaacgtcg ccgcgctcgt cgccacggtg 21480
gccgtggtca gcccggtgat cccggacagc gcccggaccg tgcggtcgtc gatcgccgcg 21540
ccgtcggtgt gcacgctgac cgccaccgga tagcgcgcct ccaggtcggc ctccaccgtg 21600
gcccgcccgc tcgccgaggc cacggccagg ccggtgatca gcgcggcccc gacgaccacg 21660
gccatcgtcg ccgacgccgt ccggcgcgcg ttctgccgga ggttgctgcc ggccaggctc 21720
gccgccaccc cgaaccgttc caggccgcgc gccgccggcg gcaacagcag ggcgatgccc 21780
agcggcagcg cggtcagcag cccggcggcg agcagcaccc cgccgaccag cgcgagcggc 21840
agggaggtgc cgatcgcggc gagacccagc acgcccacgg ccaggccgat caggatcagc 21900
ccggcgacca ggcggcgccc gccgcggacc tgtgcgggaa gagcgtccgg cacctcctgc 21960
agcgcgcgca ccgggggaac ccgggtcgca cggcgggccg gcgcccaggc cgcgacgacc 22020
gtggcgccca ccccggtgag cacacacagc gccagcacga tcgggttgac cgccaggccg 22080
ccgccgttga tgtcgagcag gccggccccg agatagccga gcccgacacc ggcgaccgcg 22140
ccgatcaccg cgccgatgct cccggcgatc gccgcctccg ccagcaccac ccggctcacc 22200
tggcggcggt gcccgccgac cagccgcagc aacgcgacct ggcggacccg ctgggagacg 22260
atcacctgga aggtgttcgc gatgaccagg atcgacgcga gcagcgccac cgcggcgaac 22320
gccagcatca gcacgaccag ctgggtgttg ccaccggcga accggccggc ggccgcgtcg 22380
gcggccgccg acgcgtcggt cgcggtcgcc cccggcggca gggcccggcc gaccgcgtcg 22440
acggtctcgg ccagccggtc ccggtccgtg acggtgagca gcgcggccgg cggcgtgtcc 22500
ccggcgaaga acgacgcggc ggcgtagaac cggtagtccg agccggtcag cgggcggaag 22560
ccgagatcgg ccgagccgac cacggtcacc ggcaccgggg cggccgtgcc ctgccggaag 22620
tcgaggtggg cgccgacccc gacgccgagg tcggtgaggg tccgccggtc ggcgacgacc 22680
tgcccggccg cgctcggcca ggtgccctcg tcgacggtga accagcgcac cgacgcggtc 22740
gccgggatgc tctgcacgtt ggccgagccg cgccggtcgc cgccgaagac gctgaccgtc 22800
cgtgcgtact gcgggtcgac gctccgcacg ccccgcaccc cggcggccgc ctggtaccac 22860
tgcgggtcgt gcaccgtgtc gtcggcgtcg agcacgatgt ccgccgtggt caacggggcc 22920
gcggcggtga gccgcagacc ctcgtccgag gtgctcgcga acgtggccgt ggcggccagg 22980
aagccggtgg ccagcacgac cgcggcgacg atcgcgagca gccggccggg gtgcgaccgg 23040
acctgcgacc aggccagcgt gaagatcatg acgtcaccgt caccgacgcc atgaccgaca 23100
tgatcgactc cagtgtgggc gctcggagct cgtcccagag ccgcccgtcg gccatgatca 23160
agacccgatc ggcgtacgtc gcggcggcag cgtcatgcgt caccatgatg atcgtctggc 23220
tggcctgccg ggcggcgttc tgcagcccgg cgagcagcgc ccggccggtg gcgatgtcca 23280
gcgcgccggt cggctcgtcg gcgaacacca ccgacggctc ggtgagcagc gcgcgtgcca 23340
ccgcgacccg ctgctgctgg ccaccggaca gctcggcggg ccgatggccg agccggtcgc 23400
cgatctgcag cgacgcggcg atgcgctgca gccggtcgcg gtccaccgga cggccggcca 23460
gccgcagcgg cagcacgatg ttctgctcgg cggtcagcgt gggcagcagg ttgaacgcct 23520
ggaagatgaa gccgacccgg tcccggcgca ggtcggtgag cgcgcggtcg tccagcccgg 23580
cgagcgcggt gccggccagg ctgacctcgc cctcggtcgg tgtgtccagc ccggcgagca 23640
ggtgcatcag cgtggtcttg ccggagccgg aggggcccat gatcgcggtg aactcgccgg 23700
ccgcgaagga ggtcgacacc ccgtcgacgg cgaccaccgc ggcgtccccg gttccgtacc 23760
gtttacgcag gttgcggcaa ctgaccatgg agctgctctt cgtctgcatc atcacggttg 23820
cgacgttagg gaagtggcgg gccgcccaca tccgtccggg gcatcgccgc gaccgatacc 23880
aaggtatcga cctggcgtgc ggatggtgcc gcgagcgctc gcggtcccta ctctgagagc 23940
gtgggaagct gggacaggag aacgctgacg gtcgatacgg tgatcgccgg cgccgcggtc 24000
atggtgtgcc tgctgctcgg gttggccggt ctggacgagt ggtactggtc ggccgcgctc 24060
tgcgtccccc tggtgatccg gcgctcggct ccggtggtct tcctcgcgct ggtcgcggtg 24120
ctctccggca tccacatgat ctactccggc agcttcgcgt tccccggtga cctggtcgat 24180
ctggtcgccg tgcacgccgt cgccggttac ggcccggccc gggtccggca cctgggcctg 24240
ctgctcggcg tggccggcag cctggtggtg accgcccggg cgctgcacga cgggctgccg 24300
tcgtccgcga cgctgcccgc cgcgctgatc gtcgccgcga ccctggccgc ctggtcgacc 24360
ggcctgatgc aacgccggca gcgggccgac gtgatcgagg ccgatcaccg ccgccggctc 24420
gccgagcagg acagcgcgat gcgtgcccgg ctcgcggcga tcgaggagcg cacccggatc 24480
agtcaggaga tgcacgacat catcgcccac tcgctggcct cggtgatcgc ccaggccgag 24540
ggcggccggg tcgccgcgcg cgccgacgcg gtcgtcgccg gcccgctgtt cgaccgcatc 24600
gcgcagatcg gccgggaggc cctcaacgac gtgaagcggc tgctgaactc gatcgacggc 24660
gacacgccgg acgacttcgc gcagggcctg cccgacctgc cgggcctgct ggccggggtc 24720
tccgccgccg gcctcgacgt gacgttcgag gtggccggcc cggagcagcc gctcgcgtcc 24780
ggcatggacc tggcggtgta ccgggtgatc caggagtcac tgaccaacgt gctcaaacac 24840
gccacgcagc ggcaggcccg gctcagcctg gtgtggacgc cggcgtggct cgaggtcagc 24900
gtgaccagcc cgctgacctt cgccggcgcg ctccgcgagg gtcgcgggct gtccggcatc 24960
cggcagcggt gctcgttgtt caacggcgac tgcgagatcg tggccgggca gaccttcagc 25020
gtgatcaccc gctggccgct cgcccgtccg gaggttgccg tcccatgacc gagccgcaga 25080
tcgacgtggt gatcgccgac gatcaggacc tcgtccggac gggcttcgcc ctggtcgtcg 25140
actcggcccc ggacatgcgg gtggtcgcga ccgcggcgga cggcgccgag gtggtgcggc 25200
tggccgcgga gttccgcccc gacgtggtgc tgatggacat ccggatgccc cgggtcgacg 25260
gcatcaccgc ggcccgggcg atcctggagg gcaacgctca gccgccgaag atcgtcgcgc 25320
tgaccaccta cgacaacgat gagtacgcca gccggatcct ggccgccggc gccagtgggt 25380
acctgttgaa ggacaccacc gccgagggcc tgaccgcggc gatccggacg gtgcaccgcg 25440
gcggctcggt gctggccccg tccaccaccc accgcctggt gaccgcgcac cgtcagcatc 25500
cggcacgccc gtccgcgctg ctggattcct tcaccacccg ggagcgcgag gtcttcgacc 25560
tgatcgtggc cggcgccagc aacgcggaga tcgccgaccg cctgaacctg gcggaggtca 25620
cgatcaagac ccacgtcggc cgggtgctgg ccaagatcgg cgtccgcgac cgggtgaacg 25680
tcgtgatctg ggcctaccgg aacggcgccg ggccgagctg agcaggggcc aggccgcgct 25740
cgcactcggc cgaatcccga aaagcggcta ggggaagcgg atctcggcgg ccagcggcag 25800
gtggtcactg ccggtccggg ggagggccgt cagccgcgtg accgtcatcg atcgcgccag 25860
cacctggtcg atccgggcga ccggcgtccg cgccggccag gtgaacgcga agtccgcggg 25920
cgaatcgatc atcacttgcc ggatcggccg cagcccgcgg tcgtccaccg acgtgttcag 25980
gtccccgatc acgaccagcc gcggaaccgg gtcggcggcg agcagcgcgc cgagcttccg 26040
ggcgctctcg tcccgccgtg ccgaggtgag tcccgccgcg gtgacccgca ccgacggcag 26100
atgcgcgacg tacaccgcgg tgtccccgcc cggcgtccgg gccaccgccc gcagcccccg 26160
gttccagtcc tcgcccaggt catgcggccg gatgtcgatc gcctccgcgc cggtcagcgg 26220
atagcgcgac cacagcgcca cggtcccctg cacggtgtgg aacggaagct ccgcgtcgag 26280
cacaccccgg taggcggcca ccgcctccgg cagcacctcc tccagcccga ccaggtccgg 26340
atgtgccgcg agcagcgccc gggcggtccc cgccgggtcc gggttctcgt cgctcacgtt 26400
gtgctgcacg acgatcagat ccggcgtgcc ggtgtcccgg tcgaccacgt agccgccgaa 26460
atggatcagc cacgcgccca gcggcagcag caccgcggcg aggccggtca gcgatcgccg 26520
catcagcgcc agcaggagca ggaccggcac ggccagcccg aaccacggca aaaacgcctc 26580
gatcaggctg cccgcgttgc cgaccgcgtt ggggaccaga cggtgaccga gaatgaccgc 26640
cccggccaga acagcggtcc acaagatcgg catcgggaga tgttatctta tttcgcatgc 26700
gaaataatga gacggtacgg atcccggtag cgaccggcgg cgccgtcacg gccacgctgt 26760
tcgcgcccga gtccgcgcgt gccgtgctgg tcgtgcaccc ggcgaccgcg actccgcagg 26820
gcttctacgc gtcgttcgcc acctacctgg cggagaacgg gatcgccacg gtcacctacg 26880
actaccgtgg caccggccgt tccggctccc cgcgcgacca ccgtgacctg ggcatgcgcg 26940
actggatcgg cgccgacgcc ccggccgtcg cggcgtgggc cgccgaccgc ttcccgggcc 27000
tgccccggct cgccgccggt cacagcctcg gcgggcacgt gatcgcgctc ggcgcggccg 27060
gcccggatct ggccgcctcg gtgatcgtcg cctcgcacat cgccgcgctg cgcaccatcc 27120
cgagccggct ggagcggttc cgcgtgcgaa tcatgcttca catcctgggt ccggccctcg 27180
ggcggctgct gggctacgtg ccggccagaa gtctgggcct cggcgaggac ctgccggccg 27240
ccgcgatgtt ggagtggggc ggctgggcgc gcagggacaa ctacttcttc gacgacccgt 27300
cgatgcgcgc cgccgagcgc gccgccaccc tgaccggccc ggtcctggcc gtcggcacca 27360
cggacgaccc gtggtccacg ccgcgccaga tggacgccct caccgtgcac ctgaccagcg 27420
catccgtgga gcggcgaacc tactcaccgg ccgccgccgg ggtcccggtg atcgggcacc 27480
acggcctgtt ccggcgcgcc gtgcgcgaca ccgtctggcc ggaactgctg gcctggttgc 27540
acgcccactc ggagaaggcg tcaagatgac cgcgtgcgcc tgcctcgcct gatcttcctg 27600
ctcttcaacg ccgaccgcgc ggtccggcgc tggatcgacg cccgttccgg tgacaccggg 27660
atcggcgcgt ccggcgccgg cgtgctgttc tacctcgccg gtcacgagaa cgccctcatc 27720
ggcgacgtga ccgcggccct gggtgcgtca ccatccggca tgagcggcct ggtgaaccgc 27780
ctggagcgtg gcggttgcct gacccgctcg caggacccgg ccgacgcccg cgcggtgcgg 27840
ctcgccctga ccccgcgcgg acaccaggtg gtgatccacg cccgcgggct ggtcgacgac 27900
ctgaacgagc agctcacggc cggtttcgac gacgccgaga tagcggtcgt ccaacgctgg 27960
ctggagcacg tgacccgggt gtccgtgcaa cgtgaggagc gactcggtta gcgtccggtg 28020
atcagctaaa cctccgggac gggccgccga agtgaggtgt cgcaaggcac caccgcttcc 28080
gatccgccct tgaggagacc catggctgac tccgtcgtct tcgaccagat ccccgtcgtc 28140
cgcgccatcg gccgaggcac cacctcgctg agcgccttcc acgacgcgct ggtgaccatg 28200
gagtgcggtt tctacaacct tgtccggctc tccagcgtca tcccgccggg caccgccgtc 28260
gaccccagcg gcaaggctcc ggtcccggtc ggggcgtggg gcgacaagct gtactgcgtc 28320
tacgccgagc agcacgccag ccagccgggc gaggaggcgt gggccggcat cggctgggtg 28380
cagcgccgcg acggccaggg cggcctgttc gtcgagcacg agggcaccag cgagtcgttc 28440
gtccgcgagg cgatcaaggc cagcctccgc gacctggtca agggccacga ggacgacttc 28500
gacggcccgg acttcgtcgt ccacggcgtg gtctccgacg gcgagccggt ctgcgcgatg 28560
gtgctcgccc cctacgagac cgccccgtgg cgcggcgtcc gtgccaccga cccgcccggc 28620
atgaactgac ctgtcaccac gagagcctcg cctcgcacgt cggggcgagg ctttcggcat 28680
tcgcttttca cttcgacaac cccctccgta ccgaagaaat cgaagatcaa attcttcatt 28740
gcctatctcc gctgtggtcc agatcgtcgc tcccgcgggg acccttccgg tctgagcagg 28800
gccgtaaccg gcccagaacg ctcagcccga aagggcgacc tccgtggcgg ggcacggtca 28860
gggcaaaatt ccgtcgccgg tcgccaggga ttcgccgccg gttgctgcgg gtggggtgcg 28920
gcggtccgcc ggaggtatgg gttgccgcta cgctcggcta gctttcgacc accggtaacg 28980
tgtaattccc cttcggtcca cctacgcccg ttgtgatctc cttatggtgg gctcgcttat 29040
cctcgtcctg tgcatctggg ccgcatcggc cgcgatgttc ttccggctgt cctctccggc 29100
ccggacgccg ggcacccgtg cctggcgttt cgccccgatc ctgaccgccg gtttcgcgat 29160
tccgctcgcc gccgcctacg gtcggcagga ctggtccacc ttcgggtcgc tgctggtcgc 29220
cggcctggcc gccttcgcgg tcctgctcta cctgctccgt cccgtccgcc tctgatccat 29280
actcggtcgt tgtgacgacc cggatgcccc gcctcgagat cgaatactgc acacagtgcc 29340
gctggctgct ccgcgccgcg tggctggcgc aggagctgct caccacattc ccccgcgatc 29400
tcggcgaggt tgccctggtc cccgggatcg gcggcgtctt cgaggtccgc ctcgacggcg 29460
agatcctctg gaaccgcaag ccggacggct tccccgacct cgcccagctc aagcgcctgg 29520
tccgcgaccg ggtcgccccg ggccgcgacc tcggccactc cgaccgcgcc gccaccgact 29580
cctagcccac acgtcctcct ccaccgctcc ggccgcggga cgcgtctacg cgtacaggat 29640
ccggtcgatc gtctcgcggg ggagcagcgt gcgggcccgc ccaccgcaga cggcgaccac 29700
cgccggccgc ccgacataga catcgcgccg ctggtggtac gccccggtac cggacagcgc 29760
caccagatca ccggccgcca tgtcacccgg cagctccgcc accgccaccg tcgcgtcccc 29820
gcagcgaacc gtgatcgacc ggcccggcgc cggcgacgcc cggccgatca gcgctgccgt 29880
gtgcaggccg gcgcagtccg ccccgggcag gcagtccggg acgtccccgt ccagctcgat 29940
cacgccgtcc ccggcggcca ccactcggtg caccgtgatc ccggcacgac ccagcagcgc 30000
acgcccgggc gacacgtgca cctcgggcgg ctcaatgccg tacccctcgg aagtgacctg 30060
cgcgaccgcc cgcaacctgg cagcgaaaat gcccaccggg agatcggcgg catggccgcc 30120
gccgaggttg agcacgggca ccgtcgtccg cagtcgcgcg acgaacccga tcgcctcacg 30180
caggcaactc tcgtaggtgc cgaagcggtt cagccggtgc ccgagcgagc agtccagccc 30240
ggccagcacc agcctccgcg accgggtcac cgtggcgacg gcggcgagcg cggccgagct 30300
gttcagccgc accccgtagc cgcgctgtgc gctgcccggc cggaccctca gcaggacgcg 30360
ctgccccggc cgggaccgcg ccgcgaccac ttccgcctcg gaggccgagc cgatcacgac 30420
ggcggcgccg caggacagtg ccgcctccag atccgccacg gacttcccgc tcccgaacag 30480
cgccagcgac tccgggcgga tccccgcgtc gagcgccgtc cgcagttcgg cggccgagcg 30540
gcagtagcag cccagcccgt cccgcgcgat ccaccgcgcg gcacccctga gcaggccgcc 30600
cttggcgctg cagcacaccg cgcccggccc gaacgccgcg acgtactccg cgcagcgact 30660
gtgcacatcg gtctcgtcga tcacgtgcac cggagtgccg tgggccgcgg cgatccgggt 30720
caccggcacc ccgccgacgg tgaggtcacc gggctcggtc cagcgtgcgg tgagcggcca 30780
gttcgcgggg tcgaggcgcg ggcggagcga cgcgcccagt gagggcagaa tctcggacaa 30840
cgtcataccg cgagcctgct cgccggcccg tgcccgagaa gatccggata cgccacgttg 30900
acgatcgacg tgccgttgtt gacgtgtcgc ctacaggtcg gggctgtcgg cgggagccat 30960
gatccgcagc gcgttcgggt cgatcgcgat ccgcatcggc gtcgtgcccc gaggctcgcc 31020
gtcgacctcg acggccaccg gccgatccgt ctccagccag agttcccgga ccgcgatgaa 31080
agggcgttca tgcagggtac ggcgatgccc ggtggccgcg ttccgggccg tctcgcgcag 31140
cagctcccgc cggctcgccc cgcccaccgg ataggcgacc agcagccggt cgtcggcgtg 31200
cgcgtccgcg gtgatcggcc ggccggcgtg gaaaccgccg ttcgcgacgt acacctgatg 31260
ggtgtggaac cgcagctccc gcccctcggc ccggatcacc gcgcggaccg gccggtgccg 31320
ggcgagcagc ccgagcgcgg tcatcggata cgccagccgc cccacggccc gtttcaaccg 31380
cggcggcgcg ctgatcatca cctcgccgga gagcccgatc ccgacgtggt tggtgaacgg 31440
cacgtccccg gcgacgccca ggtccacgtc gatgactttg ccgtccacca gggtcgcgat 31500
ggcggcttcg aggtccggct cgatccgcac ggtccgggcg aagttgttgg tggtgccgag 31560
cggcagcacc ccgagcgcca cgtcccggtg tgccagcatc cgccccgcgg tgctgatcgt 31620
cccgtccccg cccccggcga tcagcaggtc gggctctttc ctgagcgctt cggagatcag 31680
cccgtccagc ccgccggact gctccagcgc atacgtcccg agcagctcga acccggcctc 31740
gacaagccgc cgccgcgcct cttcgtagag gagccgcccc cgccgggacc gcgtgttgac 31800
aacaagaacc gcccgccgcc ctcgccggat gtcagcactg tgctcccgct tactacgcac 31860
ccgccgaccc tatccgcccc aacccaccca acgcccacgc ctcgttcccg cccgcccggt 31920
cccgagccgt gatcaccagc cgcaaggcct cagctggcgt tgacggctga tttcggcccg 31980
gttttgcgcc gtaggcgcca gccgcgaggt gtcggctggc gttcagggct ggattcggct 32040
cggttttgag ccgtgggtgc cagctggggg ctgcggccgg aagggggtgg atgtggggat 32100
gccccggggc cgtaggcctc ggggcaccga aaaagcgaac cagctcagct gttggcgatg 32160
aacgccggat gcgacagcag gaacgtgtcg atctggtcct tcttgatcga cttcagcagg 32220
tccatgctgt cgtcgctcag gagctcgacg ctgccggagc ccggcacgtt ctccgagttc 32280
agcttgccgg cgttggtctt gatggtgagg agcttgtccg gcttgaggct gcgcatcgcg 32340
agcgcccagt cggccaggtc gatgccaccg tcgtcgaccg tcatcgcctt gccgaacgcg 32400
ctgagcagct tcggcagctt ggtcggcgag tcgaggccgt ccttcagcgc ctggttgatg 32460
atcgccttga agaactgctg ctggtgccgc tggcgaccgt agtcgagcga gttgtcggcg 32520
agcaggtcac gctggcggac gaagtcgagc gcctggccgg gggtgaagca gtggtcgccc 32580
ttggtgtacg tgttcggcgt cacgcccgag atcttgctct tcagcgtgcc gtccgggttg 32640
atcacgaacg gcttggcggt cttgccgttc tggtccttgc ccaggtggat cgacttggtc 32700
gtggtgtcca cgtacatgca gaccttgccg agcacgttca ccacgtcgcg gaagccctgg 32760
aagtcgatga tcgccccggc gtccggcgtg atgccggtca gttccttgac ggtcatggtg 32820
agcaactcga agccgtgctg cagcgcctcg ttgcccttga gcccgcgggt gccgaacgcg 32880
aacgcggcgt tgatcttcgt cttgccgccg gcccacttct gcttcccgtt gtcgtacgcc 32940
gggatgtaga cgtagctgtc ccgggggagc gagatcatgt aaccgctgct gtggtccttg 33000
ttgatgtgca gcaggatgat cgagtccgac cggaggggct cgccgttggt ctgcgtgggc 33060
cgctggtcga tgccgacgag caggagattc ttcgccccgt cgaggttcgc gttcttcttc 33120
tcctcggcgg gtttcgccga gccgagcagc gactcctgcc cgaccgagga ggtggccgcg 33180
gccaccgtcg cgttcagccc gatcgcgcca ccgccaccgc cgaccagcag cagtgagccg 33240
aagaccacgg tccagaaagc ccagcggggt gtgcggcgtc ggcgcttgct ggtcctacgc 33300
aaggggtctc ctctaatcgg ggcggtcgtt ccgccccagg acaatctagg acggtcgttc 33360
cacccatgaa gacgggcgcc gcgagcgaaa agattgcctg cggaacattg aattttcctg 33420
agcgtcaggt agctacaagc tgaacgtcgc gctcgtgccc cgtggcgtcg cggaacgttg 33480
cttccctgtt actccccaac gcgacgtctg gtgttaacca tcgcaccacc aaggcgacct 33540
aggttctgca cggccccggg cccccgaggt tccgacaaag ttgcccaaag cgagtcgcca 33600
tgccctcaga gccggatgtc agtgtcgtca ttccgacgtg taaccggccg gagttggccg 33660
tccgcgcggt gcgcagcgcc ctcgggcaga cgcaccggaa cctcgaggtg atcgtcgtcg 33720
tcgacggtcc cgacgaggcg accgtgacgg cgctgggcga ggtcggtgac ccgcgactca 33780
gcgtgatcgt gctgccggag cgtggcaagg ccccgaacgc gcggaacact ggcgcccggg 33840
ccgcccgcgg ccgctggacg gcgatgctcg acgacgacga cgagtggctg cccaccaaga 33900
tcgaacggca gctggagacg gccgcggcgg cgaccgtgga gcgcccggtg gtggcctgcc 33960
ggatgatcag ccggacgccg cgggccgaca cgatcatgcc gcgccggctg cccgagccgg 34020
gtgagccgat cagtgaatac ctgctggtcc gccgcggtct gttctacggc gacggcttcg 34080
tgcagacgtc ctgcatcatg gcgccgaccg agctgtggcg gaaggtgccg ttcaccgtcg 34140
gcctgcgccg cgcgcaggag ctggactgga cgctgcgggc gatgcgcgag ccgggcaccg 34200
cgctgatcta cgccgaggag ccgctggtcc tctggcacca ggacgagaac cgtgaccgga 34260
tcagcctgca gaacccgtgg cgcgagcaac tggagtggct gcgcggcaac cgggagctgt 34320
tcacgccgcg tgcctacgcc gcgttcacgc tgagtgtgct gagctcgatg gccgcgccga 34380
cccgggacac cgggctcttc cgtgagctgc tcgccgaggc ccgcacgcac ggcgacccgg 34440
gcaccgtcga ctaccttacg cacatgcaga tctgggccct cccgccgagc gtccggcacc 34500
gcctgcgtga cgtcgtggtg ggccgcggca agacgagcag caatgccggc tgagcgccgg 34560
gtcgcgatct ggcgcagttc gatgctgccc ggctccgaga cgttcgtccg caatcaggcc 34620
gacgcgctga cccgctggac cccggcctat gtcggcgcgg tccggcacga gtcggtgctg 34680
tcccgccccg acgacgtgat cgccttcccg ggcggcaagg ggttcctgcg actgcggctg 34740
accggggcgt ctccccagct gcagaagacg atttccgccg tacggccgaa tctggttcat 34800
gcccatttcg gtggtgacgg atggctggtg agccactccg cccagcagct gggggtgccg 34860
ctggccgtca ccgtgcacgg gcacgacgtg acccgtcagc cgtccagccc gggcgcgaag 34920
ggcgtgcgct accgccgcaa cctgcagacc gttttcacgc gggcgtcgct ggtcatcgcg 34980
gtctcggagg tgatccgcgg ccaggcgatc aggtggggcg ccgacccggc gaaggtgaag 35040
gtgcactaca ccggcatcgc ggttcccccg gagcagccgg aggaggtgcc gaagcggtgg 35100
gacgtggtgt tcatcggccg tttcgtcgcc aagaagggcg tcgacgacct gctcaccgcg 35160
ctcgccgcgg tcgagtcgcg cccgcgcgcg ctgctcatcg gcgacggcga gctgatgacg 35220
gcgatgcgtg cccgtgccga gcagctgggc gtggacgtca cgttcgccgg cagccggacc 35280
cccgagcagg tgcggcgcca cctgctggag tcgcggctgc tggcctgccc gtcgaagacc 35340
gcgccggacg gggacaccga gggcctgccg accacgatcc tggaggcggc cgcgctcggc 35400
ctgccggtgg tcgcaacccg gcacagcggc atcccggagg ccgtgatcga cggtgagacc 35460
ggcctgctca gcccggaggc ggacccggcg gcgctggcgg tgtcgctgac ccggctgctc 35520
ggtgacgagg atctccagcg ccggctcggt gcgcgggcgc ggcggcacgt cacggcacac 35580
ttcgatctcg tggagcagac caggcggctg gaggacctgt atgacgaggt cgtggcgggc 35640
gctagggtct aggcctgcct gtccggcttc ctgggggaaa tcatgatctg cacgcactgc 35700
ggctcaccgg cggcgccgac cgtcggcccg tgcccgggct gcggccgtcc ggtctccgcc 35760
ccggccgggg tgttcccgga cccgctggcc gcgccggccg agcggtcgct ccccacgtcg 35820
gcgtacagcg tgccggtcga tccgtacacc ggcccgacca ccggtgaccc gttcgccggc 35880
gactcgttcc acaccccgcc gccggcgtcc ccgatgccgc cgccggtgac cgagccgatc 35940
acgccgacgc cgcccccgcc ggcctacgcc ccgcccccgc agtacagccc gccgccgtat 36000
gcgggggcgc ccggtcagcc ctatccgggt cagccttacc caggtcagcc ctacccggga 36060
cagccctacc ccgggcagca gccgtatccc ggccagcagc cctaccccgg atacggccag 36120
tcgaacagcc aggccctgac catcgtcgcc tacgtcctcg gcggcttcgg tctcctgacc 36180
atgaccccgc tcatcggcgt cgtcggcctg gtcctggcga acttcgcgaa gcgccgtcac 36240
gagcgcaatg cctcgatcgc ggtcaagatc gtcgccggcc tggtgatcgc cgctttggtg 36300
ctgagcatcg tggaccgcat cgtttaaggc ctgccctgcc gatcactcag ggcggcgact 36360
tctgggcggc gggggtgctc ccctcgccgg aaaggatgtc cggttcccgg gatggtcagt 36420
actgtcggct catgggcgaa catttcgatc ttgtcgtgct gggcgccggt ccgggtggat 36480
atgtcgcggc gatccgcggc gctcaactgg gcctgaccac cgcgatcgtc gaggacaagt 36540
actggggcgg cgtctgcctc aacgtcggct gcatcccgtc gaaagcgctg ctgcgcaacg 36600
cggagctggc gcacatcttc caccaccagg cgcagacctt cggcatcgag gggaaggtca 36660
ccttcgactt cgccgtcgcc caccagcgca gccgcagcgt cgccgacggc cgcgtcaagg 36720
gcgtgcactt cctgatgaag aagaacggga tcaccgagat ccaggggcgt ggcgagttca 36780
ccgacgcgca cacgctgcgg gtcggcgacc ggacggtcac gttcgacaac tgcatcctgg 36840
cgaccggcgc gagcacccgg atgattcccg gcacgagcgt ctcgaagcgg gtcgtgacgt 36900
acgaggagca gatcctcgac cccgacctgc cggacagcat cgtgatcgtc ggcgccggcg 36960
cgatcggcgt cgagttcgcg tatgtgctgc gcaactacgg cgtcgacgtg accatcgtgg 37020
agttcctcga ccggatgctg ccgctggagg acgaggaggt ctccaaggag ctgctccggc 37080
agtaccgcaa gctcggcgtc gacgtgcggg tcggcacccg ggtggagggc atcgaggagg 37140
gcgccgactc ggtccgcgtc accgtctcca agaacgggaa gaccgaggtc ctcgaggccg 37200
acaaggtgat gcaggcgatc ggcttcaagc ccaacgtgga gggctacggg ctggagacca 37260
ccggcgtcac ggtgtccgac cgcggcgcgg tcgagatcga cgacttctgc cgtacgaacg 37320
tgcccggcat ctacgccatc ggcgacgtca ccgcgaagct gatgctggcg cacgccgccg 37380
aggcgatggg catcgtggcg gccgagacga tcgccggcgc cgagacgatg gccctcgact 37440
accggatgat cccgcgcgcg actttctgcc agccgcaggt cgccagcttc gggtggaccg 37500
aggcgcaggc ccgcgagcag ggcttcgacg tcaaggtggc caagttcccg ttcaccgcga 37560
acggcaaggc gcacggcctc ggcgacgcga ccgggttcgt gaagatcctc agtgacgcga 37620
agtacgggga gctgctcggc gcgcacctga tcgggccgga cgtgaccgag ctgctacccg 37680
agctgaccct ggcccagcag tgggacctga ccgtccacga ggtcgggcgc aacgtgcacg 37740
cgcatccgac gctcgccgag gcggtcaagg aggcgatcca cggcctggcc ggccacatga 37800
tcaacttctg agtccgccgc tcggccgacg ggtccgccgc tcggccgacg ggtccgccgc 37860
tcggccgacg ggtccgctgt ccggccgacg agtccgccgc ccggctgacg cccgggggag 37920
tagccggagc cgcccgtacc gcgcctgcgg tagcccgaat acctacgcgg ggatgacgac 37980
tccgccccgc cggtcgggaa cgctgagcct tgtgaccctg accgtcgagc ctccgatcgc 38040
cccggcgccg cccgccgccc cggggcgatc ccggcggcgc aggctgggct atctggcgtt 38100
cgtgctggtc gcggtggtgg cggtggtgac gctgcgcgac cggctgccgg atccggggga 38160
gttcctcgac gcgctgcgag cggccgactg gcggtgggcg gcgctcgcgg tgggggccgg 38220
ggtgctgtcc cagatcgcgt acgccgagca gcagcgccgg cttctcgccg cgttcggagt 38280
gcgcgtgccg gcccggcggg cgatcgcgat gacgtacgtc cggtcggcgc tgagcatggc 38340
gctgccggcc gggtcggcgg cctccgcggc gtacgccttc caggtctatc gtcgccacgg 38400
cgccaccgcg gcgatctccg cgacggcgac cctgatctcg acggtcgtga ccgtgatgtc 38460
gctgggcctg ctctacgccg cgacctggtc gctgaccgcc accgtcgtgg ccggcctggc 38520
cgttctcctg ctgtggatct accggaccgt gcggggcccg gtccccgcgc gtgccggcgt 38580
gccgcgccgt ctgagggtcg ccccgatcgc ccgcctgctc cagcggcccg ccgtggccca 38640
ggcgctccgg ggtgcacggt ccgtcccggc ccggacgtgg ctcacggtga ccctggccgg 38700
cgtgatcaac tggctgctgg acatggcctg cctgctcctc gcggccgacg cgctgcacgc 38760
cgggctcggc tggagccggc tcgcgctgat ctacctggcc gtccaggtgg tccggcagat 38820
cccgctcacc cccggcggca tcggcctgat cgagaccagc atgctcgccg gcctgatcgc 38880
cgcgggcgcc ccgcaggtca ccgccgccgg gatcgtcctg atctaccggc tgatctcgtt 38940
ctggctgatc ctgcccagcg ggctggccgc ccacctgacc ctgcgccggg ggaccgtgcc 39000
gccggtgact ccgggctgac cgccggggct caggcgcggt cgaactgctg gaggacggcg 39060
ccgaggccga gcgtcagggc cgggccgggc agtcgtgagt ccagcccgta ccgccggccg 39120
gggttctccc gatcgaccag gtcctgccag agcccggtca ccggatcgcc cagccccggc 39180
aggtcgtgcc cggccgcccg gagcagctcg gccaggtcgt tctgctggcg cagccgctgc 39240
tcctcgaaga tctggctcca ctgcatcagc gagatcgacg cctccagtgt gtccggcacc 39300
gtctcgtcca gcatcggcag cggtcgcgcc gcggcccacg ccgcgagctg cgccccggtc 39360
accgtgccgg gatcgtcgtc gcggctgcgc gccagcgcgt acgacagcag cgccgtggtc 39420
tccaccagca ggtgctgcac cgggacgcgc gccggcgggt ccagccacca gtggtccgcc 39480
tcgagcaggg ccgcggcgtg ccgggtcgcc gcccgccacc agccgtcgtc gccgccggcc 39540
agggcgtcgg tgtaggacca caggaaggtc acccttccgt gcctaccagc ggcacttgac 39600
acgagtcaat cacgcgaacg cgtggcgacg accgcgatcg cttcgacgga gatcagcagc 39660
ccgtgcggga gaaccacgcc ggcgggcgcg gaccgggccg gcggcgggtc gggcatgtgc 39720
cgcgccagca cctggttgat caccgggaag tcctcgacgt gcgtgtagaa gacggtcagc 39780
ttcaccagcc cgtccagccc gtccagcccg gagccggccg ccgccagcac cgccccgagg 39840
ttgcacagcg cctgctcggt ctgcgcctcg atgccgtcca ccggcttccc ggtcgcgggg 39900
tcgatcccgg gcatcccgga gcagaacacg aacccgccgg cgacgatcgc ctggctgtag 39960
ggccccagcg ccgtgggggc ccgctcactc gtcaccgcga tgcgatccat cgggcgagtc 40020
tcccgcaccg ggcatcgatg gtctttcggc tttatgacac gggtgggagc ttgacagccg 40080
tacatcgttt atcgattatc aatatatcga aaaacgataa gggggtacgt cgtgaagacc 40140
gactggttga cggagttcca ccaggtgctg ctggtcgccg cgctgggcgc cggggccgcc 40200
gccgtcctcg ggaccgtcgg gctcgtggtg caggacgagg tcgtcgtccc gggcggcacg 40260
tcggctccgg cgagcgtggt cagcgacccg agcgtcaccc agctcctgct cgccgtggcg 40320
gccgccgtgc cgacgtacct gctggcgacc gccatgctgg tgctgctgta ccggttggtc 40380
ggcgccgcgc gtcgcgggga tc 40402
<210> 201
<211> 334
<212> PRT
<213> Actinoplanes liguriae
<400> 201
Val Arg Leu Arg Ile Gln Arg Arg Leu Ala Asp Glu Leu Gly Pro Thr
1 5 10 15
Leu Tyr Thr Thr Gly Gln Ser Glu Asp Leu Asp Ala Arg Val Arg Asp
20 25 30
Ala Leu His Asp Leu Leu Ala Arg Glu Glu Thr Pro Leu Ser Gly Ala
35 40 45
Asp Arg Ala Arg Ile Thr Arg Glu Val Thr Asp Glu Val Leu Gly His
50 55 60
Gly Pro Ile Glu Ser Leu Leu Arg Asp Pro Ser Val Thr Glu Val Met
65 70 75 80
Val Asn Gly Pro Tyr Ser Val Tyr Val Glu Arg Phe Gly Arg Leu Glu
85 90 95
Lys Val Ala Ala Glu Phe Asp Asp Glu Gln His Leu Arg Arg Ile Ile
100 105 110
Asp Arg Ile Cys Ser Arg Val Gly Arg Arg Val Asp Glu Ala Ser Pro
115 120 125
Thr Val Asp Ala Arg Leu Pro Asp Gly Ser Arg Val Asn Ala Val Val
130 135 140
Pro Pro Ile Ala Leu Asp Gly Ser Thr Leu Thr Ile Arg Lys Phe Ala
145 150 155 160
Ala Val Pro Leu Thr Val Gly Asp Leu Leu Gln Tyr Gly Thr Leu Thr
165 170 175
Arg Gln Ala Ala Glu Phe Leu Asp Ala Cys Val Arg Gly Arg Arg Thr
180 185 190
Ile Leu Val Ser Gly Gly Thr Gly Ser Gly Lys Thr Thr Ile Leu Asn
195 200 205
Val Leu Ser Ser Phe Val Pro Ala Asp Glu Arg Ile Val Thr Ile Glu
210 215 220
Asp Ala Ala Glu Leu Gln Leu Val Gln Asp His Val Val Arg Leu Glu
225 230 235 240
Ser Arg Pro Pro Asn Ser Glu Gly Arg Gly Thr Ile Thr Thr Arg Asp
245 250 255
Leu Val Arg Asn Ala Leu Arg Met Arg Pro Asp Arg Ile Val Val Gly
260 265 270
Glu Val Arg Asp Ala Ala Ala Leu Asp Met Leu Gln Ala Met Asn Thr
275 280 285
Gly His Asp Gly Ser Leu Thr Thr Leu His Ala Asn Thr Pro Arg Asp
290 295 300
Ala Leu Ser Arg Leu Glu Thr Met Val Leu Met Ala Gly Met Asp Leu
305 310 315 320
Pro Ile Arg Ala Ile Arg Asp Gln Ile Ser Ser Ala Val Asp
325 330
<210> 202
<211> 358
<212> PRT
<213> Actinoplanes liguriae
<400> 202
Met Ser Glu Leu Glu Ser Tyr Leu Pro Arg Tyr Pro Glu Thr Leu Leu
1 5 10 15
Val Val Ile Gly Ala Val Val Asp Leu Asp Glu Ala Leu Met Phe Thr
20 25 30
Ala Tyr Gln Arg Leu Gln Arg Pro Val Ile Gly Val Val Leu Ile Arg
35 40 45
His Ala Ile Glu Ala Gly Val Val Leu Arg Cys Leu Gln Ser Gly Ile
50 55 60
Arg Asp Leu Val Ala Glu Glu Asp Glu Glu Gly Ile Arg Ser Ala Thr
65 70 75 80
Val Arg Ser Val Asp Leu Ser Lys Ala Leu Ser Thr Thr Met Arg Gly
85 90 95
Thr Gly Asp Asn Ala Pro Tyr Ala Ser Val Val Thr Val Phe Ala Gly
100 105 110
Lys Gly Gly Cys Gly Arg Ser Val Val Ala Val Asn Leu Ala Val Ala
115 120 125
Leu Ala Gly Ala Gly Arg Arg Val Leu Leu Met Asp Leu Asp Leu Gln
130 135 140
Phe Gly Asp Val Ala Ile Met Met Lys Leu Ser Pro Glu Arg Asn Ile
145 150 155 160
Ala Gly Gly Leu Gln Met Ala Gly Arg Leu Asp Glu Pro Gly Leu Arg
165 170 175
Ser Ile Val Thr Thr Tyr Arg Gln Ser Leu Asp Ala Leu Leu Ala Pro
180 185 190
Ala Ser Pro Ala Glu Gly Glu Gln Val Arg Arg Glu Phe Val Val Glu
195 200 205
Leu Leu Asp Val Ala Arg Pro Leu Tyr Asp Phe Ile Val Val Asp Thr
210 215 220
Pro Ser Val Val Thr Asp Gln Val Leu Ala Ala Leu Asp Met Ser Asp
225 230 235 240
Trp Phe Ile Pro Ile Val Thr Pro Asp Leu Pro Ala Leu Lys Ser Val
245 250 255
Arg Leu Thr Ala Glu Met Phe Asp Leu Leu Asp Tyr Pro Lys Asp Lys
260 265 270
Arg Leu Leu Val Phe Asn Arg Ala Gly Ala Gln Val Gly Leu Ser Pro
275 280 285
Ser Glu Val Glu Val Ala Ala Gly Met Pro Phe Ala Val Gln Val Pro
290 295 300
Ala Ser Arg Asp Val Thr Val Ser Val Asn His Gly Glu Pro Ile Ala
305 310 315 320
Val Thr Asp Pro Leu His Pro Val Ser Arg Ala Ile Arg Glu Leu Gly
325 330 335
Asp Arg Ile Ala Gly Val Gly Thr Thr Pro Gln Arg Arg Arg Gly Phe
340 345 350
Leu Gly Arg Leu Phe Pro
355
<210> 203
<211> 266
<212> PRT
<213> Actinoplanes liguriae
<400> 203
Met Arg Arg Arg Ile Leu Ile Leu Leu Ala Ala Leu Val Leu Ala Gly
1 5 10 15
Ile Ser Gly Ala Ala Val Leu Ser Tyr Ala Arg Ser Ala Asp Arg Arg
20 25 30
Ala Leu Ser Gly Arg Glu Gly Thr Trp Ile Leu Val Ala Gly Gln His
35 40 45
Ile Pro Ser Gly Thr Ser Gly Ala Glu Ile Arg Ala Arg Gly Leu Thr
50 55 60
Glu Arg Leu Leu Val Pro Thr Val Thr Val Pro Ala Gly Ala Leu Thr
65 70 75 80
Thr Trp Asp Ser Ala Leu Asp Pro Leu Arg Leu Gly Gly Asp Leu Gln
85 90 95
Pro Arg Gln Leu Leu Met Arg Thr Leu Phe Val Pro Ala Ser Pro Ala
100 105 110
Pro Ser His Thr Gly Arg Ile Pro Val Pro Arg Arg Ser Leu Ala Val
115 120 125
Ser Val Ala Leu Asn Val Ala Pro Gln Val Ala Gly Asn Ile Thr Pro
130 135 140
Gly Asp Gln Val Ala Val Tyr Tyr Thr Tyr Gln Ala Lys Val Leu Met
145 150 155 160
Ala Glu Asp His Glu Thr Ile Pro Met Thr Glu Leu Leu Leu Pro Lys
165 170 175
Ala Arg Val Ile Thr Ile Gly Glu Ala Glu Pro Gly Gln Ala Pro Val
180 185 190
Thr Pro Ser Pro Ser Pro Thr Pro Gly Pro Ser Ala Ser Ala Gly Asp
195 200 205
Ser Thr Ala Ala Val Lys Glu Ile Gln Arg Tyr Val Val Thr Leu Ala
210 215 220
Val Gly Asp Thr Asp Ala Leu Arg Leu Val His Ala Ala Gln Ser Gly
225 230 235 240
Ser Leu Tyr Leu Ala Leu Leu Gly Pro Asn Ala Thr Ala Ser Thr Gly
245 250 255
Pro Ala Ile Asp Thr Ser Trp Val Val Arg
260 265
<210> 204
<211> 432
<212> PRT
<213> Actinoplanes liguriae
<400> 204
Met Arg Arg Leu Ile His Ala Leu Phe Pro Pro Arg Gly Glu His Gly
1 5 10 15
Val Ile Thr Ala Leu Val Ala Val Leu Ala Gly Ala Gly Val Leu Leu
20 25 30
Gly Met Ala Ala Leu Val Ile Asp Ile Gly Ala Leu Tyr Ala Glu Arg
35 40 45
Glu Gln Leu Gln Ser Gly Ala Asp Ala Ala Ser Trp Lys Val Ala Gln
50 55 60
Ala Cys Ala Gly Thr Ala Gly Arg Asp Leu Thr Ser Ala Thr Cys Thr
65 70 75 80
Val Ala Ala Gln Arg Asp Asn Ala Gln Arg Tyr Ala Asp Arg Asn Ala
85 90 95
Lys Asp Leu Val Ser Asp Val Gln Phe Cys Ile Thr Thr Val Ser Ala
100 105 110
Ala Gly Val Thr Thr Ala Asp Ala Gly Cys Pro Ser Ser Trp Asn Thr
115 120 125
Pro Val Thr Cys Pro Ala Pro Pro Ser Ala Ser Gly Pro Tyr Arg Tyr
130 135 140
Val Glu Val Arg Thr Ser Thr Arg Asn Ser Asp Asn Thr Ser Val Val
145 150 155 160
Pro Pro Leu Phe Gly Arg Gly Leu Ala Gly Ser Ala Tyr His Gly Ala
165 170 175
Lys Met Gly Ala Cys Gly Arg Val Ala Trp Gly Ala Pro Ala Val Thr
180 185 190
Asp Val Leu Ala Leu Gly Val Ser Arg Cys Asp Phe Leu Arg Leu Thr
195 200 205
Gly Asp Tyr Thr Arg Phe Phe Ala Pro Pro Pro Pro Thr Gly Pro Asn
210 215 220
Pro Gln Thr Gly Val His Pro Leu Leu Gly Leu Ser Asp Pro Thr Ala
225 230 235 240
Gly Tyr Ile Pro Ile Ser Asp Gly Ile Leu Ala Thr Ser Cys Pro Ala
245 250 255
Asp Ala Gly Glu Thr Val Ala Gly Tyr Thr Trp Leu Gly Gln Pro Asp
260 265 270
Gly Pro Pro Ala Leu Pro Gly Leu Leu Pro Val Ser Ala Pro Asp Ala
275 280 285
Ser Cys Glu Leu Thr Gly Ile Pro Ala Thr Asp Gly Pro Ala Asp Ser
290 295 300
Trp Val Gly Gly Phe Thr Ile Gly Pro Gly Asn Ala Ser Ala Ala Thr
305 310 315 320
Ala Cys Leu Asp Arg Leu Asn Val Leu Ile Thr Ser Gly Gln Pro Val
325 330 335
Leu Val Pro Ile Phe Asp Arg Gln Val Ala Val Ile Gly Thr Leu Pro
340 345 350
Ser Tyr Tyr Arg Ile Ala Gly Phe Ala Pro Leu Val Leu Thr Gly Tyr
355 360 365
Glu Ser Pro Val Ser Gly Pro Val Ser Pro Gly Ser Ala Val Pro Ser
370 375 380
Leu Val Pro Gly Ala Gln Arg Ala Leu Cys Ala Ala Gln Ser Cys Leu
385 390 395 400
Tyr Gly Tyr Phe Thr Arg Ala Leu Val Thr Asp His Val Pro Thr Arg
405 410 415
Phe Ala Thr Ser Arg Tyr Tyr Gly Ala Met Val Ile Gly Arg Thr Gly
420 425 430
<210> 205
<211> 136
<212> PRT
<213> Actinoplanes liguriae
<400> 205
Met Trp Lys Ala Thr Glu Arg Gln Gly Pro Val Val Leu Leu Val Glu
1 5 10 15
Asp Asp Glu Asp Leu Arg Glu Leu Ala Ala Gln Met Leu Glu Met Arg
20 25 30
Gly Phe Val Val Leu Val Ala Lys Asp Pro Val Ser Ala Ile Met Thr
35 40 45
Cys Arg Val His Ser Gly Ala Ile Asp Val Leu Leu Thr Asp Leu Gly
50 55 60
Leu Pro Gly Val Ser Gly Gly Glu Leu Ala Arg Ser Ala Ser Glu Val
65 70 75 80
Arg Pro Gly Met Lys Ile Val Tyr Val Ser Gly Val Pro Glu Glu Ile
85 90 95
Ala Ile Lys Lys Gly Leu Ile Arg Ala Gly Ser Pro Phe Val Ala Lys
100 105 110
Pro Tyr Thr Ala Asp Arg Leu Ala Gly Met Leu Arg Thr Val Leu Ala
115 120 125
Gln Gly Ala Glu Ser Ser Ala Arg
130 135
<210> 206
<211> 363
<212> PRT
<213> Actinoplanes liguriae
<400> 206
Met Phe Asn Tyr Val Ser Phe Val Arg Pro Lys Thr Phe Ala Ala Thr
1 5 10 15
Phe Ala Ala Ala Ala Leu Leu Leu Gly Ser Gly Ala Cys Ala Lys Ser
20 25 30
Glu Asp Ser Gly Asp Thr Val Ala Ala Gly Pro Ala Pro Ser Ala Ala
35 40 45
Gln Val Val Gln Ser Ala Ser Ala Gly Ser Ala Thr Cys Ala Leu Asp
50 55 60
Gln Tyr Gly Ala Ser Lys Leu Asp Leu Lys Thr Ala Ser Val Gly Phe
65 70 75 80
Ser Gln Ser Glu Lys Glu Ala Asn Pro Phe Arg Ile Ala Glu Thr Lys
85 90 95
Ser Ile Lys Asp Glu Ala Ala Lys Leu Gly Ile Thr Asn Leu Lys Thr
100 105 110
Ser Asn Ala Asn Ser Gln Phe Asn Lys Gln Ile Ala Asp Val Glu Gln
115 120 125
Met Ile Asp Ala Gly Val Gln Leu Leu Val Ile Ala Pro Leu Asn Ser
130 135 140
Asp Gly Trp Asp Ser Val Phe Ala Lys Ala Thr Ala Lys His Ile Pro
145 150 155 160
Ile Ile Thr Ile Asp Arg Lys Ile Asn Ala Thr Ala Cys Lys Asp Tyr
165 170 175
Leu Thr Phe Ile Gly Ser Asp Phe Ala Glu Gln Gly Lys Arg Ala Ala
180 185 190
Asp Ala Leu Ala Lys Ser Leu Gly Asn Lys Gly Glu Val Ala Ile Leu
195 200 205
Leu Gly Ala Pro Gly Asn Asn Val Thr Thr Leu Arg Thr Ser Gly Phe
210 215 220
Lys Asp Glu Ile Ala Lys Val Ala Pro Asp Ile Lys Ile Thr Phe Glu
225 230 235 240
Gln Thr Gly Asn Phe Ser Arg Glu Asp Gly Gln Lys Val Ala Glu Gln
245 250 255
Leu Leu Gln Ser Lys Pro Asn Ile Asn Gly Ile Tyr Gly Glu Asn Asp
260 265 270
Glu Met Ala Leu Gly Ala Ile Thr Ala Leu Lys Gly Ala Gly Lys Lys
275 280 285
Ala Gly Asp Val Lys Ile Val Ser Ile Asp Gly Thr Lys Gly Ala Val
290 295 300
Gln Gly Ile Val Asp Gly Trp Val Ser Ala Val Ile Glu Ser Asn Pro
305 310 315 320
Arg Phe Gly Pro Leu Ala Phe Asp Thr Ala Thr Lys Phe Phe Gly Gly
325 330 335
Glu Pro Val Gly Gln Asp Ile Val Ile Gln Asp Arg Ala Tyr Asp Glu
340 345 350
Ser Asn Ala Lys Thr Asp Ile Gly Ser Ala Tyr
355 360
<210> 207
<211> 501
<212> PRT
<213> Actinoplanes liguriae
<400> 207
Met Leu Leu Glu Val Ser Gly Val Ser Lys Thr Phe Pro Gly Val Arg
1 5 10 15
Ala Leu Asp Gly Val Ser Phe Thr Leu Asn Pro Gly Glu Val His Ala
20 25 30
Leu Val Gly Glu Asn Gly Ala Gly Lys Ser Thr Leu Ile Lys Val Leu
35 40 45
Thr Gly Val Tyr Gln Pro Asp Ser Gly Glu Leu Arg Tyr Arg Gly Glu
50 55 60
Pro Ala Arg Phe Ala Thr Pro Leu Asp Ala Gln Arg Ala Gly Ile Ser
65 70 75 80
Thr Ile Tyr Gln Glu Val Asn Leu Val Pro Leu Met Ser Val Ala His
85 90 95
Asn Leu Phe Leu Gly Arg Glu Pro Arg Asn Arg Phe Gly Leu Leu Asp
100 105 110
Glu Ala Arg Met Val Ala Glu Ala Thr Glu Ile Leu Ala Gly Tyr Gly
115 120 125
Val Arg Thr Asp Val Arg Arg Arg Leu Gly Thr Leu Ala Leu Gly Ala
130 135 140
Gln Gln Met Val Ala Leu Ala Arg Ala Val Met Val Asp Ala Arg Val
145 150 155 160
Val Val Met Asp Glu Pro Thr Ser Ser Leu Glu Pro Arg Glu Val Glu
165 170 175
Thr Leu Phe Gly Val Ile Arg Glu Leu His Thr Ala Gly Ile Gly Ile
180 185 190
Val Tyr Val Ser His Arg Leu Asp Glu Leu Tyr Arg Val Cys Asp Ala
195 200 205
Val Thr Ile Leu Arg Asp Gly Lys Leu Val His Thr Gly Arg Met Ala
210 215 220
Asp Leu Asp Arg Arg Thr Leu Val Ser Leu Met Leu Gly Arg Glu Phe
225 230 235 240
Gly Ala Asp Phe Thr Ser Phe Ser Glu Ser Pro Gln Ser Thr Pro Glu
245 250 255
Gly Glu Pro Val Leu Arg Val Ser Gly Leu Thr Ser Arg Pro Arg Leu
260 265 270
Asp Asp Ile Ser Phe Asp Val Arg Pro Gly Glu Val Val Gly Leu Gly
275 280 285
Gly Leu Leu Gly Ala Gly Arg Ser Glu Thr Ile Lys Ala Ile Gly Gly
290 295 300
Ala Tyr Pro Ile Asp Ser Gly Val Ile Glu Val Gly Gly Val Arg Leu
305 310 315 320
Gly Arg Pro Ser Thr Val Arg Ala Val Arg Ala Gly Val Ala Thr Gln
325 330 335
Pro Glu Asp Arg Lys Ala Glu Gly Ile Val Pro Gly Leu Ser Ile Arg
340 345 350
Asp Asn Ile Ala Leu Ala Ile Leu Pro Arg Met Ala Arg Phe Gly Leu
355 360 365
Val Ser Asp Lys Arg Ile Asp Ser Ile Val Ala Thr Tyr Met Ser Arg
370 375 380
Leu Arg Ile Lys Ala Ser Gly Pro Asp Gln Ala Val Gly Asp Leu Ser
385 390 395 400
Gly Gly Asn Gln Gln Lys Val Leu Leu Ala Arg Leu Leu Ala Thr Gly
405 410 415
Pro Lys Val Leu Leu Leu Asp Glu Pro Thr Arg Gly Ile Asp Val Gly
420 425 430
Ala Lys Ala Glu Val Gln Ala Leu Ile Asp Glu Leu Ala Lys Glu Gly
435 440 445
Leu Gly Val Val Leu Val Ser Ser Asp Ala Glu Glu Leu Val Glu Gly
450 455 460
Ala Asp Arg Val Val Val Leu Arg Asp Gly Ala Val Val Gly Thr Leu
465 470 475 480
Thr Gly Asp Arg Val Thr Thr Glu Ala Leu Met Ala Thr Ile Ala Glu
485 490 495
Ala Ala Asp Glu His
500
<210> 208
<211> 319
<212> PRT
<213> Actinoplanes liguriae
<400> 208
Met Ser Thr Glu Thr Leu Thr Arg Pro Arg Met Thr Phe Asn Pro Ala
1 5 10 15
Trp Ala Ala Arg Tyr Gly Val Tyr Ala Ala Ile Val Leu Leu Ile Val
20 25 30
Val Asn Ile Ala Phe Thr Pro Tyr Phe Leu Thr Leu Ser Asn Leu Arg
35 40 45
Ile Gln Leu Ile Gln Ala Ala Pro Val Val Ile Val Ala Leu Gly Met
50 55 60
Ala Leu Val Ile Gly Thr Glu Gly Ile Asp Leu Ser Val Gly Ser Val
65 70 75 80
Met Ala Leu Ala Ala Ala Phe Ile Pro Leu Tyr Leu Gly Tyr Gly Val
85 90 95
Thr Ala Ala Ile Leu Val Ser Leu Leu Ala Gly Val Ala Val Gly Leu
100 105 110
Ile Asn Gly Val Leu Val Ala Lys Ala Gly Leu Gln Pro Ile Val Ala
115 120 125
Thr Leu Ala Leu Phe Val Gly Gly Arg Gly Leu Ala Val Val Ile Ser
130 135 140
Gly Gly Gln Leu Lys Asp Val Arg Asn Ala Asp Leu Leu Tyr Leu Gly
145 150 155 160
Ser Gly Asp Leu Leu Gly Val Pro Val Leu Val Trp Ile Ala Ala Leu
165 170 175
Leu Val Leu Val Val Ala Phe Val Val Arg Arg Thr Val Phe Gly Arg
180 185 190
Arg Leu Leu Ala Val Gly Gly Asn Arg Pro Ala Ala Glu Leu Ala Gly
195 200 205
Leu Pro Val Lys Arg Val Leu Ile Gly Val Tyr Val Phe Cys Ala Val
210 215 220
Leu Ala Ser Ile Ala Gly Leu Leu Ser Val Ala Arg Ile Gln Ser Ser
225 230 235 240
Asp Ala Ser Ala Val Gly Leu Leu Ile Glu Leu Ser Ala Ile Thr Ala
245 250 255
Val Val Val Gly Gly Thr Pro Leu Thr Gly Gly Arg Val Arg Val Leu
260 265 270
Gly Thr Val Ala Gly Ala Leu Leu Met Gln Leu Val Val Ala Thr Met
275 280 285
Ile Lys His Asp Leu Pro Pro Ser Thr Thr Glu Met Val Gln Ala Val
290 295 300
Ile Ile Leu Val Ala Val Tyr Val Ala Arg Glu Arg Arg Thr Arg
305 310 315
<210> 209
<211> 320
<212> PRT
<213> Actinoplanes liguriae
<400> 209
Met Ser Ile Pro Val Pro Ala Phe Arg Asn Gly Gly Phe Val Gln Arg
1 5 10 15
Gln Gly Ala Leu Ala Val Leu Val Thr Val Val Ala Ile Ser Leu Ala
20 25 30
Ala Phe Pro Gly Phe Arg Ser Ala Asp Asn Ala Gly Thr Ile Leu Val
35 40 45
Ala Ala Ala Pro Pro Met Leu Ile Ala Leu Gly Met Thr Phe Val Ile
50 55 60
Ile Thr Gly Gly Ile Asp Leu Ser Val Gly Ser Leu Tyr Val Leu Gly
65 70 75 80
Gly Val Val Ala Ala Trp Ala Ser Gln Trp Gly Val Val Ala Ala Leu
85 90 95
Ala Ala Pro Leu Leu Leu Cys Gly Ala Ile Gly Val Leu Asn Gly Ile
100 105 110
Leu Ile Ser Arg Thr Gly Met Ala Pro Phe Ile Val Thr Leu Ala Ala
115 120 125
Leu Leu Gly Ala Arg Gly Leu Met Arg Ser Ile Ser Asp Glu Gly Ser
130 135 140
Thr Thr Tyr Leu Val Arg Ser Asp Val Phe His Glu Leu Gly Thr Gly
145 150 155 160
Ser Leu Leu Gly Val Gly Leu Pro Val Trp Leu Ala Ala Val Leu Val
165 170 175
Gly Ala Gly Ile Leu Val Leu Asn Arg Thr Arg Phe Gly His Ala Val
180 185 190
His Ala Ile Gly Gly Ser Glu Asp Ala Ala Ala Leu Met Gly Leu Pro
195 200 205
Val Arg Arg Ile Lys Val Trp Val Tyr Leu Leu Ser Gly Leu Leu Ala
210 215 220
Gly Leu Ala Gly Ala Ile Asn Ala Ala Lys Leu Gly Ser Gly Val Thr
225 230 235 240
Val Leu Gly Ser Gly Met Glu Leu Asp Ala Ile Ala Ala Val Val Ile
245 250 255
Gly Gly Thr Leu Leu Thr Gly Gly Ser Gly Ser Ile Ala Gly Thr Val
260 265 270
Ala Gly Val Leu Leu Leu Gly Val Ile Gln Asn Leu Ile Asn Gln Val
275 280 285
Gly Asn Val Asn Ser Asn Trp Gln Gln Val Ile Ser Gly Gly Phe Leu
290 295 300
Ala Ala Val Val Val Ala Gln Thr Thr Leu Val Arg Ala Arg Arg Ser
305 310 315 320
<210> 210
<211> 486
<212> PRT
<213> Actinoplanes liguriae
<400> 210
Met Arg Thr Ser Ala Gly Thr Arg Val Leu Thr Val Gly Ala Thr Val
1 5 10 15
Val Leu Ala Leu Ala Ala Ala Ala Ala Pro Ala Gln Ala Gly Pro Ser
20 25 30
Pro Ser Pro Gly Ser Ala Gly Leu Gly Asp Arg Leu Tyr Pro Leu Leu
35 40 45
Gly Asn Gly Gly Tyr Asp Val Leu Asp Tyr Asp Leu Arg Leu Arg Tyr
50 55 60
Pro Glu Lys Asp Pro Lys Gln Val Val Ser Gly Asp Val Thr Ile Thr
65 70 75 80
Ala Val Ala Gly Gln Ser Leu Ser Arg Phe Asp Leu Asp Phe Gly Gly
85 90 95
Ala Ser Ile Gly Arg Val Ser Val Asp Gly Gln Pro Ala Arg Ala Ala
100 105 110
Arg Asp Gly Asp Glu Leu Thr Val Ile Pro Arg Arg Pro Leu Pro Arg
115 120 125
Gly Arg Leu Phe Arg Val Thr Val Ala Asn Phe Thr Ala Ala Pro Ala
130 135 140
Ala Leu Val Ala Thr Pro Asp Gly Thr Val Leu Ala Ala Gln Pro Gly
145 150 155 160
Ser Ala His Leu Leu Phe Pro Gly Asn Asp His Pro Arg Asp Lys Ala
165 170 175
Thr Phe Thr Ile Thr Leu Thr Val Pro Ala Gly Trp Thr Gly Thr Ala
180 185 190
Asn Gly Thr Leu Val Ser Thr Thr Glu His Asp Gly His Val Ser Ser
195 200 205
Val Tyr Arg Glu Ser Ala Pro Met Ala Thr Glu Leu Val Gln Thr Ala
210 215 220
Val Gly Asp Phe Val Val Glu Arg Arg Pro Ala Ala Gly Gly Thr Pro
225 230 235 240
Ile Arg Asp Val Val Pro Arg Arg Leu Ala Gly Thr Leu Leu Pro Ala
245 250 255
Ile Ala Gly Glu Arg Glu Gln Leu Ala Trp Met Glu Lys Gln Ala Gly
260 265 270
Pro Tyr Pro Phe Glu Asp Tyr Gly Ser Leu Val Ile Asp Asp Asp Leu
275 280 285
Gly Tyr Ala Leu Glu Thr Gln Thr Leu Ser Leu Tyr Gly Ala Ala Leu
290 295 300
Phe Thr Gly Pro Glu Thr Thr Arg Gly Pro Ser Met Thr His Glu Leu
305 310 315 320
Ala His Gln Trp Phe Gly Asp Ser Val Ser Pro Phe Ser Trp Ser Asp
325 330 335
Val Trp Leu Asn Glu Gly His Ala Thr Trp Tyr Glu Met Leu Trp Ser
340 345 350
Glu Glu Thr Gly Gly Phe Pro Gln Tyr Thr Gly Leu Ala Asp Arg Glu
355 360 365
Ala Phe Phe Lys Ala Val Tyr Ala Ala Gly Asp Ile Phe Arg Ala Arg
370 375 380
Tyr Gly Pro Val Ala Ala Pro Leu Asp Ala Ala Thr Thr Trp Asp Val
385 390 395 400
Phe Asn Pro Asn Val Tyr Ala Gly Gly Ala Leu Val Leu Tyr Ala Leu
405 410 415
Arg Gln Lys Ile Gly Ala Ala Thr Phe Gln Arg Val Glu Arg Ala Trp
420 425 430
Leu Thr Thr Tyr Arg Gly Arg Ser Ala Ser Thr Gly Asp Phe Ile Thr
435 440 445
Leu Ala Ser Arg Val Ala Arg Gln Asp Leu Arg Pro Phe Leu Thr Ser
450 455 460
Trp Leu Leu Gly Val Thr Thr Pro Pro Met Pro Asn His Pro Asp Trp
465 470 475 480
Val Val Thr Pro Gly Ser
485
<210> 211
<211> 286
<212> PRT
<213> Actinoplanes liguriae
<400> 211
Met Asp Ser Pro Arg Leu Asn Gly Glu Asp Pro Arg His Thr Glu Val
1 5 10 15
Leu Ala Gly Phe Gly Ala Glu Leu Pro Pro Ile Val Val His Arg Ala
20 25 30
Thr Met Arg Val Ile Asp Gly Ala His Arg Leu Ser Ala Ala Arg Leu
35 40 45
Arg Gly Asp Asp Arg Ile Arg Ala Val Leu Phe Asp Gly Thr Glu Gln
50 55 60
Glu Ala Tyr Val Leu Ser Val Lys Ala Asn Val Thr His Gly Leu Pro
65 70 75 80
Leu Ser Ala Ala Glu Arg Thr Arg Ala Ala Glu Arg Ile Ile Thr Met
85 90 95
His Pro Asp Trp Ser Asp Arg Met Ile Ala Ala Ser Ser Gly Leu Gly
100 105 110
Ala Arg Thr Val Gly Gly Leu Arg Arg Arg Arg Ala Ala Ser Gly Glu
115 120 125
Ser Pro Ala Gly Leu Arg Ser Arg Ala Gly Arg Asp Ser Arg Val Arg
130 135 140
Pro Ala Gly Ser Thr Ala Gly Arg Leu Lys Ala Val Asp Tyr Leu Gln
145 150 155 160
Asp Arg Pro Asp Ala Ser Leu Arg Glu Ile Ala Arg His Ala Gly Val
165 170 175
Ser Pro Ser Thr Ala Arg Asp Val Arg Asp Arg Leu His Arg Gly Glu
180 185 190
Asp Pro Ile Pro Ala Thr Gln Arg Ala Ala Ala Arg Pro Gly Asn Asp
195 200 205
Ser Pro Pro Leu Arg Ser Leu Val Gln Gly Leu Ala Ser Asp Pro Ser
210 215 220
Leu Arg Phe Ser Glu Ser Gly Arg Asp Leu Leu Arg Trp Leu Ile Ala
225 230 235 240
His Ala Val Gln Asp Gly Glu Trp Lys Gly Leu Val Asp Thr Ile Pro
245 250 255
Ala His Ser Ala Gln Ala Leu Ala Lys Ile Ala Arg His Cys Ser Arg
260 265 270
Glu Trp Arg Glu Phe Ala Asp Ile Leu Glu Lys Asp Ala Ala
275 280 285
<210> 212
<211> 64
<212> PRT
<213> Actinoplanes liguriae
<400> 212
Met Ser Ala Ile Thr Val Glu Thr Thr Trp Lys Asn Thr Asp Leu Arg
1 5 10 15
Glu Asp Leu Thr Ala His Pro Ala Gly Leu Gly Phe Gly Glu Leu Ser
20 25 30
Phe Glu Asp Leu Arg Glu Asp Arg Thr Ile Tyr Ala Ala Ser Ser Gly
35 40 45
Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu Val Cys Ala Cys
50 55 60
<210> 213
<211> 1046
<212> PRT
<213> Actinoplanes liguriae
<400> 213
Met Ser Ser Phe Ala Ile Ala Ala Ser Pro Ala Ser Ala Tyr Leu His
1 5 10 15
Glu Arg Ser Ala Gly Pro Gly Gly Asp Pro Val Ala Glu His Glu Arg
20 25 30
Val Glu Ser Trp Arg Glu Ser Ala Phe Leu Asp Asp Pro Val Leu Asp
35 40 45
Ile Arg Leu Arg Glu Leu Gly Leu Ser Arg Ala Glu Phe Gly Arg Leu
50 55 60
Leu Thr Asp Gly Ala Tyr Asp Ala Gly Ser Thr Ala Leu Asp Trp Ala
65 70 75 80
Gly Glu Leu Ala Ala Val Leu Ala Thr Gly Thr Gly Ala Val Thr Gly
85 90 95
Leu Ala Arg Ser Thr Lys Leu Trp Ala Gln Gly Phe Asp Arg Leu Pro
100 105 110
Phe Ala Gly Leu Ile Glu Arg Phe Leu Ala Tyr Tyr Glu Pro Arg Val
115 120 125
Pro Arg Thr Ala Gly Thr Val Arg Val Ser Leu Leu Glu Ser Leu Ala
130 135 140
Asn Arg Leu Leu Thr Val Ala Thr Arg Thr Leu Leu Leu Glu Leu Asn
145 150 155 160
Val Ala Arg Val His Gly Arg Leu Thr Gly Ala Thr Pro Gly Glu Arg
165 170 175
Tyr Asp His Tyr Asp Arg Val Leu Leu Thr Asp Pro Asp Tyr Leu Arg
180 185 190
Ser Leu Phe Gly Glu Tyr Pro Val Leu Gly Arg Ala Met Val Glu Cys
195 200 205
Gly Arg Arg Trp Ala Ser Ala Met Ala Glu Leu Phe Gln Arg Leu Asp
210 215 220
Ala Asp Arg Pro Ala Leu His Ala Ala Gly Leu Leu Pro Ala Gly Ala
225 230 235 240
Gly Glu Val Thr Ala Leu Arg Pro Asp Leu Gly Asp Pro His Asn Ser
245 250 255
Gly Arg Ala Val Ala Ile Leu Thr Phe Arg Ser Gly Ala Gln Leu Val
260 265 270
Tyr Lys Pro Arg Pro Val Gly Pro Glu Arg Ala Tyr Ala Glu Thr Ala
275 280 285
Ala Ala Leu Asn Arg His Gly Leu Ser Leu Pro Leu Thr Ala Val Asp
290 295 300
Val Leu Asp Arg Gly Ala Tyr Gly Trp Cys Glu Leu Val Arg His Glu
305 310 315 320
Pro Cys Ala Asp Arg Ala Asp Leu Asp Arg Phe Tyr Arg Arg Thr Gly
325 330 335
Ala Val Leu Ala Thr Thr Leu Leu Leu Gly Ala Val Asp Val His Met
340 345 350
Glu Asn Val Ile Ala Ala Gly Ser Ser Cys Met Pro Ile Asp Leu Glu
355 360 365
Thr Leu Leu Gln Pro Gly Val Pro Ser Gly Asp Ala Thr Asp Ala Tyr
370 375 380
Thr Arg Ala Leu Asp Leu Leu Asn Gln Ser Val Leu Ala Ile Gly Ile
385 390 395 400
Leu Pro Ala Arg Ala Phe Gly Gly Arg Glu Arg Lys Ser Val Asp Val
405 410 415
Ser Ala Ile Gly Gly Gly Glu Ala Gln Thr Ala Pro Arg Pro Val Pro
420 425 430
Met Val Val Glu Pro Phe Thr Asp Val Ala Arg Ile Glu Ala Val Glu
435 440 445
Ala Thr Met Leu Gly Ala Gln Asn Arg Pro Val Leu Val Gly Ala Glu
450 455 460
Val Arg Pro Glu Glu His Thr Glu Ala Val Val Ala Gly Phe Thr Glu
465 470 475 480
Ala Tyr Asp Leu Ile Val Arg His Arg Glu Asp Phe Ala Asp Leu Leu
485 490 495
Ala Gly Phe Gly Asp Val Glu Val Arg Tyr Leu Pro Arg Pro Thr Arg
500 505 510
Arg Tyr Ser Met Phe Leu Thr Glu Ser Tyr His Pro Asp Tyr Leu Arg
515 520 525
Asp Ala Arg Asp Arg Asp Arg Leu Leu Asp Lys Leu Trp Thr Ala Ala
530 535 540
Gly Ala Arg Pro Asp Leu Ile Pro Ile Ile Glu Ser Glu Lys Arg Gln
545 550 555 560
Leu Leu Ala Gly Asp Ile Pro Cys Phe Arg Ala Leu Ala Gly Asp Arg
565 570 575
Ala Ile Arg Thr Ala Ser Ala Pro Val Ala Pro Asp Phe Phe Asp Ala
580 585 590
Pro Gly Ile Glu Val Leu Ala Gly Arg Leu Arg Gln Phe Gly Pro Val
595 600 605
His Arg Ala Ala Gln Leu Arg Ile Ile Arg Glu Ser Met Gly Thr Met
610 615 620
Pro Ala Pro Gly Pro Ile Ala Gly Thr Pro Ala Pro Ser Ser Glu Arg
625 630 635 640
Arg Gly Gly Leu Asp Pro Arg Glu Ala Ala Thr Leu Gly Asp Arg Leu
645 650 655
Val Arg Glu Leu Ala Asp Glu Ala Ile Leu Gly Ala Asp Asp Ala Gly
660 665 670
Trp Ile Gly Val Ser Ile Glu Gly Leu Asp Gln Glu Thr Phe Ser Tyr
675 680 685
Lys Pro Met Ala Thr Gly Leu Tyr Asp Gly Ile Ala Gly Met Ala Leu
690 695 700
Thr Tyr Ala Tyr Ala Ala Arg Thr Leu Gly Asp Glu Arg Tyr Leu Asp
705 710 715 720
Leu Thr Arg Arg Thr Val Lys Leu Val Ser Gly Tyr Leu Arg Tyr Leu
725 730 735
Ala Glu His Arg Ile Val Glu Thr Val Gly Ala Tyr Ser Gly Met Ala
740 745 750
Gly Leu Leu Tyr Thr Leu Asp His Val Ala His Ala Thr Gly Asp Ala
755 760 765
Ser Leu Leu Gly Glu Ile Glu Ala Ala Leu Pro Trp Leu Arg Glu Cys
770 775 780
Ala Thr Arg Glu Glu Cys Pro Asp Leu Ile Ala Gly Leu Ala Gly Cys
785 790 795 800
Ala Val Val Ala Leu Ser Leu Tyr Arg Arg His Gly Ile Ala Gly Tyr
805 810 815
Arg Glu Val Ala Glu Ile Cys Gly Arg Arg Leu Ala Gly Thr Ala Val
820 825 830
Asp Val Glu Gly Ala Ala Gly Trp Ala Ala Thr Arg Thr Gly Val Ile
835 840 845
Leu Gly Gly Phe Ser His Gly Ser Ala Gly Ile Ala Trp Ala Leu His
850 855 860
Glu Leu Ala Ala Glu Phe Gly Asp Arg Asp Leu Arg Glu Leu Ala Asp
865 870 875 880
Arg Ala Val Glu Phe Asp Arg Arg Leu Tyr Val Pro Ala Ala Gly Ala
885 890 895
Trp Arg Asp Leu Arg Pro Glu Met Ala Gly Thr Asp Gly Tyr Pro Ala
900 905 910
Leu Trp Cys His Gly Ala Ala Gly Ile Gly Leu Ser Arg Leu Leu Ile
915 920 925
His Arg Ile Arg Pro Asp Glu Arg Leu Ala Glu Glu Ala Arg Ala Ala
930 935 940
Val Ala Leu Val Arg Arg His Gly Phe Gly His Asn His Ser Leu Cys
945 950 955 960
His Gly Asp Phe Gly Ala Leu Ala Leu Leu Gly Leu Ala Asp Arg Ala
965 970 975
Trp Pro Gly Ser Gly Gly His Asp Glu Arg Ala Gly Ala Val Val Arg
980 985 990
Asp Ile Gly Glu Thr Gly Leu Arg Cys Gly Leu Gly Asn Gly Ile Arg
995 1000 1005
Met Pro Gly Leu Met Leu Gly Ala Ala Gly Ala Gly Leu Ser Leu
1010 1015 1020
Leu Arg Leu Ala Ala Pro Ala Asp Val Pro Ala Val Thr Trp Leu
1025 1030 1035
Glu Pro Pro Arg Gly Thr His Val
1040 1045
<210> 214
<211> 575
<212> PRT
<213> Actinoplanes liguriae
<400> 214
Met Ser Glu Thr Ala Gly Leu Leu Arg Arg Ser Leu Leu Asp His Arg
1 5 10 15
Gly Lys Leu Ala Ala Val Ala Gly Leu Ala Val Ala Gly Val Gly Cys
20 25 30
Gln Leu Gly Gln Pro Phe Leu Ile Arg Arg Val Leu Thr Ala Val Gln
35 40 45
Ser Ala Gln Pro Tyr Arg Gln Leu Ala Leu Ala Val Leu Ala Val Met
50 55 60
Val Val Gly Ala Ala Leu Gly Ala Val Gln Gln Phe Leu Leu Gln Arg
65 70 75 80
Thr Gly Glu Ala Met Val Phe Thr Val Arg Arg Thr Leu Val Ala His
85 90 95
Leu Leu Arg Leu Pro Val Ala Ala Tyr Asp Glu Arg Gln Ser Gly Asp
100 105 110
Leu Val Ser Arg Val Gly Ala Asp Thr Ala Gln Val Arg Ser Val Ile
115 120 125
Thr Ser Gly Val Val Asp Leu Ala Gly Gly Val Leu Leu Val Gly Gly
130 135 140
Ser Ile Ala Gly Met Ile Ile Ile Asp Pro Val Leu Leu Gly Val Ser
145 150 155 160
Leu Ala Pro Val Leu Cys Gly Ala Ala Gly Val Arg Leu Val Gly Arg
165 170 175
Arg Leu Arg Pro Leu Ser Ser Ala Val Gln Glu Ser Ile Gly Ala Leu
180 185 190
Thr Ala Ser Thr Thr Arg Ala Leu Gly Ala Ile Arg Thr Ile Arg Val
195 200 205
Ala Gly Ala Thr Glu Arg Glu Thr Ala Leu Ile Val Ala Glu Ala Asp
210 215 220
Arg Ala Arg Ala Ala Gly Val Arg Leu Ala Leu Val Ala Ala Gln Ala
225 230 235 240
Gly Pro Ile Val Arg Leu Ala Leu Gln Gly Ala Phe Val Ala Val Ile
245 250 255
Gly Phe Gly Gly Tyr Arg Val Ala Asn Gly Ala Val Ser Val Gly Asp
260 265 270
Leu Val Ala Phe Thr Leu Leu Leu Phe Thr Leu Ala Leu Pro Leu Ala
275 280 285
Gln Leu Ala Glu Ala Ala Thr Arg Ile Gln Thr Gly Leu Gly Ala Leu
290 295 300
Thr Arg Ile Glu Glu Ile Leu Ala Leu Pro Asp Glu Asp Ser Ala Leu
305 310 315 320
Gly Val Arg Ala Arg Thr Pro Ala Thr Val Arg His Asp Pro Val Leu
325 330 335
Leu Glu Phe Asp His Val Ser Phe Arg Tyr Pro Thr Gly Gly Glu Ile
340 345 350
Leu Arg Asp Val Ser Phe Arg Val Pro Ala Gly Ser Thr Thr Ala Leu
355 360 365
Val Gly Pro Ser Gly Ala Gly Lys Ser Thr Ile Leu Ala Leu Ile Ala
370 375 380
Arg Leu Tyr Glu Val His Gly Gly Arg Ile Leu Leu His Gly Arg Asp
385 390 395 400
Ile Arg Asp Tyr Pro Leu Ala Glu Leu Arg Ala Ala Leu Gly Tyr Val
405 410 415
Glu Gln Glu Ala Pro Val Leu Ala Gly Thr Val Arg Asp Asn Leu Thr
420 425 430
Leu Ala Ala Pro Asp Val Ala Glu His Ala Ile Arg His Val Thr Ala
435 440 445
Ser Val Asn Leu Asp Asp Leu Leu Ala Arg Asp Pro Ala Gly Leu Asp
450 455 460
Ala Pro Val Gly Asp Gly Gly Val Leu Phe Ser Gly Gly Glu Arg Gln
465 470 475 480
Arg Leu Ala Val Ala Arg Thr Leu Leu Ala Pro Gly Glu Leu Leu Leu
485 490 495
Phe Asp Glu Pro Thr Ala His Leu Asp Ala Arg Asn Glu Gln Ala Leu
500 505 510
Gln His Gly Leu Thr Ala His Ala Ala Gly Arg Thr Leu Val Val Val
515 520 525
Ala His Arg Leu Ala Thr Val Ala His Ala Asp Gln Ile Leu Val Ile
530 535 540
Asp Asp Gly Arg Ser Val Ala Ala Gly Arg His Glu Glu Leu Leu Val
545 550 555 560
Arg Asp Pro Thr Tyr Arg Glu Phe Ala Thr Arg Gln Leu Leu Thr
565 570 575
<210> 215
<211> 347
<212> PRT
<213> Actinoplanes liguriae
<400> 215
Met Leu Ser Val Leu Asp Gln Val Pro Val Phe Arg Gly Asp Asp Pro
1 5 10 15
Ala Glu Ala Val Arg Glu Ala Val Gly Leu Ala Arg Ala Ala Glu Ser
20 25 30
Leu Gly Tyr His Arg Phe Trp Ile Ala Glu His His Gly Ser Ala Ala
35 40 45
Asn Ala Cys Ala Ala Pro Glu Ile Val Ala Ala Ala Val Ala Gly Ala
50 55 60
Thr Glu Arg Ile Arg Val Gly Thr Gly Gly Val Leu Leu Pro Tyr Tyr
65 70 75 80
Ser Pro Leu Lys Val Ala Glu Ala Phe Arg Val Leu Ala Ala Leu Tyr
85 90 95
Pro Gly Arg Ile Asp Leu Gly Phe Gly Arg Gly Arg Gly Gly Pro Ala
100 105 110
Val Met Ala Glu Leu Leu Asn Pro Tyr Ala Ile Ala Thr Glu Glu Ala
115 120 125
Tyr Ala Glu Gln Val Gly Arg Leu Leu Ala Phe Leu Gly Asp Ala Arg
130 135 140
Thr Val Ser Arg Val Ser Val Thr Pro Ala Val Gln Asp Pro Pro Leu
145 150 155 160
Pro Trp Leu Leu Gly Ser Gly Val Gly Ser Ala Arg Leu Ala Gly Met
165 170 175
Leu Gly Val Pro Phe Cys Phe Ala Gln Phe Ile Ala Thr Glu Glu Cys
180 185 190
Pro Glu Ala Ile Ala Ala Tyr Gln Glu Ser Phe Arg Ser Ser Pro Trp
195 200 205
Leu Asp Glu Pro Gln Ala Met Leu Ala Leu Arg Val Leu Ala Ala Gly
210 215 220
Thr Ala Glu Asp Ala Glu Glu Leu Ala Thr Gly Phe Trp Met Ser Cys
225 230 235 240
Thr Thr Gly Trp Arg Ala Gln Val Arg Pro Asp Asp Asp Tyr Arg Gly
245 250 255
Gly Val Pro Asn Leu Ala Asp Ala Gln Arg Tyr Thr Leu Thr Glu Glu
260 265 270
Asp Leu Ala Met Arg Ala Ser Arg Pro Tyr Leu Gln Ile Ser Gly Thr
275 280 285
Ala Glu Thr Val Gly Glu Glu Ile Arg Arg Leu Arg Lys Val Tyr Asp
290 295 300
Val Ala Glu Val Met Leu Thr Thr Asn Cys Pro Gly Ala Ala Ala Pro
305 310 315 320
Ala Pro Val Leu Arg Ala Ala Gly Arg Arg Ala Arg Ala Asp Arg Ala
325 330 335
Gly Val Thr Arg Val Arg Pro Ala Arg Arg Trp
340 345
<210> 216
<211> 217
<212> PRT
<213> Actinoplanes liguriae
<400> 216
Met Ala Asp Val Leu Val Val Ala Glu Glu Ala Leu Val Ser Ile Gly
1 5 10 15
Ile Lys Met Ile Leu Glu Thr Met Gly Gly Phe Ser Val Val Ala Ala
20 25 30
Asp Arg Asp Ser Ala Leu Ala Ala Val Ser Glu His Arg Pro Ala Val
35 40 45
Val Leu Leu Asp Ala His Ala Thr Leu Pro Glu Ser Val Pro Leu Leu
50 55 60
Thr Arg Leu Arg Asp Leu Glu Ser Gly Pro Ala Leu Ala Val Leu Ala
65 70 75 80
Thr Leu Ala Ala Ser Ser Thr Val Leu Glu Ser Leu Arg Gly Gly Ala
85 90 95
Cys Gly Phe Leu Leu Lys Asp Ser Gln Pro Glu Gln Leu Val Ala Ala
100 105 110
Val Arg Ala Leu Ala Ser Gly Val Thr Val Leu Ala Pro Glu Ala Ser
115 120 125
Ser Ile Met Leu Gly Ala Ala Cys Arg Gly Thr Pro Ala Ala Glu Asn
130 135 140
Ala Val Asp Glu Val Lys Gln Leu Ser Asp Arg Glu Gln Ala Val Leu
145 150 155 160
Gly Leu Ile Gly Gln Gly Leu Thr Asn Ala Glu Ile Ala Gly Arg Leu
165 170 175
Phe Ile Ser Asp Ser Thr Val Lys Glu Tyr Val Ser Val Ile Leu Arg
180 185 190
Lys Leu Gly Val Ala Asn Arg Val Gln Ala Ala Val Leu Ala Tyr Ala
195 200 205
Ala Gly Leu Thr Thr Asp Glu Leu Ala
210 215
<210> 217
<211> 814
<212> PRT
<213> Actinoplanes liguriae
<400> 217
Met Ile Phe Thr Leu Ala Trp Ser Gln Val Arg Ser His Pro Gly Arg
1 5 10 15
Leu Leu Ala Ile Val Ala Ala Val Val Leu Ala Thr Gly Phe Leu Ala
20 25 30
Ala Thr Ala Thr Phe Ala Ser Thr Ser Asp Glu Gly Leu Arg Leu Thr
35 40 45
Ala Ala Ala Pro Leu Thr Thr Ala Asp Ile Val Leu Asp Ala Asp Asp
50 55 60
Thr Val His Asp Pro Gln Trp Tyr Gln Ala Ala Ala Gly Val Arg Gly
65 70 75 80
Val Arg Ser Val Asp Pro Gln Tyr Ala Arg Thr Val Ser Val Phe Gly
85 90 95
Gly Asp Arg Arg Gly Ser Ala Asn Val Gln Ser Ile Pro Ala Thr Ala
100 105 110
Ser Val Arg Trp Phe Thr Val Asp Glu Gly Thr Trp Pro Ser Ala Ala
115 120 125
Gly Gln Val Val Ala Asp Arg Arg Thr Leu Thr Asp Leu Gly Val Gly
130 135 140
Val Gly Ala His Leu Asp Phe Arg Gln Gly Thr Ala Ala Pro Val Pro
145 150 155 160
Val Thr Val Val Gly Ser Ala Asp Leu Gly Phe Arg Pro Leu Thr Gly
165 170 175
Ser Asp Tyr Arg Phe Tyr Ala Ala Ala Ser Phe Phe Ala Gly Asp Thr
180 185 190
Pro Pro Ala Ala Leu Leu Thr Val Thr Asp Arg Asp Arg Leu Ala Glu
195 200 205
Thr Val Asp Ala Val Gly Arg Ala Leu Pro Pro Gly Ala Thr Ala Thr
210 215 220
Asp Ala Ser Ala Ala Ala Asp Ala Ala Ala Gly Arg Phe Ala Gly Gly
225 230 235 240
Asn Thr Gln Leu Val Val Leu Met Leu Ala Phe Ala Ala Val Ala Leu
245 250 255
Leu Ala Ser Ile Leu Val Ile Ala Asn Thr Phe Gln Val Ile Val Ser
260 265 270
Gln Arg Val Arg Gln Val Ala Leu Leu Arg Leu Val Gly Gly His Arg
275 280 285
Arg Gln Val Ser Arg Val Val Leu Ala Glu Ala Ala Ile Ala Gly Ser
290 295 300
Ile Gly Ala Val Ile Gly Ala Val Ala Gly Val Gly Leu Gly Tyr Leu
305 310 315 320
Gly Ala Gly Leu Leu Asp Ile Asn Gly Gly Gly Leu Ala Val Asn Pro
325 330 335
Ile Val Leu Ala Leu Cys Val Leu Thr Gly Val Gly Ala Thr Val Val
340 345 350
Ala Ala Trp Ala Pro Ala Arg Arg Ala Thr Arg Val Pro Pro Val Arg
355 360 365
Ala Leu Gln Glu Val Pro Asp Ala Leu Pro Ala Gln Val Arg Gly Gly
370 375 380
Arg Arg Leu Val Ala Gly Leu Ile Leu Ile Gly Leu Ala Val Gly Val
385 390 395 400
Leu Gly Leu Ala Ala Ile Gly Thr Ser Leu Pro Leu Ala Leu Val Gly
405 410 415
Gly Val Leu Leu Ala Ala Gly Leu Leu Thr Ala Leu Pro Leu Gly Ile
420 425 430
Ala Leu Leu Leu Pro Pro Ala Ala Arg Gly Leu Glu Arg Phe Gly Val
435 440 445
Ala Ala Ser Leu Ala Gly Ser Asn Leu Arg Gln Asn Ala Arg Arg Thr
450 455 460
Ala Ser Ala Thr Met Ala Val Val Val Gly Ala Ala Leu Ile Thr Gly
465 470 475 480
Leu Ala Val Ala Ser Ala Ser Gly Arg Ala Thr Val Glu Ala Asp Leu
485 490 495
Glu Ala Arg Tyr Pro Val Ala Val Ser Val His Thr Asp Gly Ala Ala
500 505 510
Ile Asp Asp Arg Thr Val Arg Ala Leu Ser Gly Ile Thr Gly Leu Thr
515 520 525
Thr Ala Thr Val Ala Thr Ser Ala Ala Thr Phe Pro Ala Ala Gly Lys
530 535 540
Pro Thr Pro Ala Arg Ile Ala Ala Leu Pro Thr Asp Val Ala Gly Arg
545 550 555 560
Leu Ala Pro Glu Leu Ser Ala Ser Thr Gly Asp Pro Val Leu Leu Val
565 570 575
Pro Ala Ser Tyr Leu Thr Ala Arg Gly Leu Thr Asp Gly Ala Pro Leu
580 585 590
Thr Val Thr Ala Gly Gly Arg Asp Leu Arg Phe Thr Ala Arg Gly Ser
595 600 605
Arg Leu Ala Asp Thr Thr Gly Gln Leu Leu Gly Val Thr Thr Gly Asp
610 615 620
Val Leu Thr Ala Ala Gly Val Arg Thr Val Pro Thr Thr Val Trp Gly
625 630 635 640
Thr Ala Pro Gly Gly Phe Asp Arg Glu Thr Leu Ala Ala Asp Val Asn
645 650 655
Ala Val Ala Ala Arg Asp Ala Gly Val Glu Val Gly Gly Gly Val Thr
660 665 670
Glu Gly Gly Asp Ile Met Asn Val Leu Ser Ile Leu Leu Gly Leu Ser
675 680 685
Leu Gly Met Leu Ala Val Thr Val Val Ile Ala Leu Leu Gly Ile Ala
690 695 700
Asn Leu Leu Gly Leu Ser Val Ile Glu Arg Thr Arg Glu Met Ala Leu
705 710 715 720
Leu Arg Ala Leu Gly Thr Arg Arg Ser Arg Leu Arg Ala Met Val Ala
725 730 735
Val Glu Ala Val Thr Ile Thr Leu Val Gly Thr Val Ala Gly Ile Val
740 745 750
Ile Gly Val Pro Val Gly Leu Val Gly Val Ile Ala Ala Val Gly Arg
755 760 765
Gln Ala Glu Pro Val Ile Met Leu Ala Trp Pro Gln Leu Gly Leu Val
770 775 780
Leu Val Ala Ala Ala Val Thr Gly Val Leu Ala Ser Leu Ala Pro Ala
785 790 795 800
Arg Arg Ala Thr Arg Ile Ala Pro Ala Glu Gly Leu Val Arg
805 810
<210> 218
<211> 240
<212> PRT
<213> Actinoplanes liguriae
<400> 218
Met Val Ser Cys Arg Asn Leu Arg Lys Arg Tyr Gly Thr Gly Asp Ala
1 5 10 15
Ala Val Val Ala Val Asp Gly Val Ser Thr Ser Phe Ala Ala Gly Glu
20 25 30
Phe Thr Ala Ile Met Gly Pro Ser Gly Ser Gly Lys Thr Thr Leu Met
35 40 45
His Leu Leu Ala Gly Leu Asp Thr Pro Thr Glu Gly Glu Val Ser Leu
50 55 60
Ala Gly Thr Ala Leu Ala Gly Leu Asp Asp Arg Ala Leu Thr Asp Leu
65 70 75 80
Arg Arg Asp Arg Val Gly Phe Ile Phe Gln Ala Phe Asn Leu Leu Pro
85 90 95
Thr Leu Thr Ala Glu Gln Asn Ile Val Leu Pro Leu Arg Leu Ala Gly
100 105 110
Arg Pro Val Asp Arg Asp Arg Leu Gln Arg Ile Ala Ala Ser Leu Gln
115 120 125
Ile Gly Asp Arg Leu Gly His Arg Pro Ala Glu Leu Ser Gly Gly Gln
130 135 140
Gln Gln Arg Val Ala Val Ala Arg Ala Leu Leu Thr Glu Pro Ser Val
145 150 155 160
Val Phe Ala Asp Glu Pro Thr Gly Ala Leu Asp Ile Ala Thr Gly Arg
165 170 175
Ala Leu Leu Ala Gly Leu Gln Asn Ala Ala Arg Gln Ala Ser Gln Thr
180 185 190
Ile Ile Met Val Thr His Asp Ala Ala Ala Ala Thr Tyr Ala Asp Arg
195 200 205
Val Leu Ile Met Ala Asp Gly Arg Leu Trp Asp Glu Leu Arg Ala Pro
210 215 220
Thr Leu Glu Ser Ile Met Ser Val Met Ala Ser Val Thr Val Thr Ser
225 230 235 240
<210> 219
<211> 362
<212> PRT
<213> Actinoplanes liguriae
<400> 219
Val Ile Ala Gly Ala Ala Val Met Val Cys Leu Leu Leu Gly Leu Ala
1 5 10 15
Gly Leu Asp Glu Trp Tyr Trp Ser Ala Ala Leu Cys Val Pro Leu Val
20 25 30
Ile Arg Arg Ser Ala Pro Val Val Phe Leu Ala Leu Val Ala Val Leu
35 40 45
Ser Gly Ile His Met Ile Tyr Ser Gly Ser Phe Ala Phe Pro Gly Asp
50 55 60
Leu Val Asp Leu Val Ala Val His Ala Val Ala Gly Tyr Gly Pro Ala
65 70 75 80
Arg Val Arg His Leu Gly Leu Leu Leu Gly Val Ala Gly Ser Leu Val
85 90 95
Val Thr Ala Arg Ala Leu His Asp Gly Leu Pro Ser Ser Ala Thr Leu
100 105 110
Pro Ala Ala Leu Ile Val Ala Ala Thr Leu Ala Ala Trp Ser Thr Gly
115 120 125
Leu Met Gln Arg Arg Gln Arg Ala Asp Val Ile Glu Ala Asp His Arg
130 135 140
Arg Arg Leu Ala Glu Gln Asp Ser Ala Met Arg Ala Arg Leu Ala Ala
145 150 155 160
Ile Glu Glu Arg Thr Arg Ile Ser Gln Glu Met His Asp Ile Ile Ala
165 170 175
His Ser Leu Ala Ser Val Ile Ala Gln Ala Glu Gly Gly Arg Val Ala
180 185 190
Ala Arg Ala Asp Ala Val Val Ala Gly Pro Leu Phe Asp Arg Ile Ala
195 200 205
Gln Ile Gly Arg Glu Ala Leu Asn Asp Val Lys Arg Leu Leu Asn Ser
210 215 220
Ile Asp Gly Asp Thr Pro Asp Asp Phe Ala Gln Gly Leu Pro Asp Leu
225 230 235 240
Pro Gly Leu Leu Ala Gly Val Ser Ala Ala Gly Leu Asp Val Thr Phe
245 250 255
Glu Val Ala Gly Pro Glu Gln Pro Leu Ala Ser Gly Met Asp Leu Ala
260 265 270
Val Tyr Arg Val Ile Gln Glu Ser Leu Thr Asn Val Leu Lys His Ala
275 280 285
Thr Gln Arg Gln Ala Arg Leu Ser Leu Val Trp Thr Pro Ala Trp Leu
290 295 300
Glu Val Ser Val Thr Ser Pro Leu Thr Phe Ala Gly Ala Leu Arg Glu
305 310 315 320
Gly Arg Gly Leu Ser Gly Ile Arg Gln Arg Cys Ser Leu Phe Asn Gly
325 330 335
Asp Cys Glu Ile Val Ala Gly Gln Thr Phe Ser Val Ile Thr Arg Trp
340 345 350
Pro Leu Ala Arg Pro Glu Val Ala Val Pro
355 360
<210> 220
<211> 218
<212> PRT
<213> Actinoplanes liguriae
<400> 220
Met Thr Glu Pro Gln Ile Asp Val Val Ile Ala Asp Asp Gln Asp Leu
1 5 10 15
Val Arg Thr Gly Phe Ala Leu Val Val Asp Ser Ala Pro Asp Met Arg
20 25 30
Val Val Ala Thr Ala Ala Asp Gly Ala Glu Val Val Arg Leu Ala Ala
35 40 45
Glu Phe Arg Pro Asp Val Val Leu Met Asp Ile Arg Met Pro Arg Val
50 55 60
Asp Gly Ile Thr Ala Ala Arg Ala Ile Leu Glu Gly Asn Ala Gln Pro
65 70 75 80
Pro Lys Ile Val Ala Leu Thr Thr Tyr Asp Asn Asp Glu Tyr Ala Ser
85 90 95
Arg Ile Leu Ala Ala Gly Ala Ser Gly Tyr Leu Leu Lys Asp Thr Thr
100 105 110
Ala Glu Gly Leu Thr Ala Ala Ile Arg Thr Val His Arg Gly Gly Ser
115 120 125
Val Leu Ala Pro Ser Thr Thr His Arg Leu Val Thr Ala His Arg Gln
130 135 140
His Pro Ala Arg Pro Ser Ala Leu Leu Asp Ser Phe Thr Thr Arg Glu
145 150 155 160
Arg Glu Val Phe Asp Leu Ile Val Ala Gly Ala Ser Asn Ala Glu Ile
165 170 175
Ala Asp Arg Leu Asn Leu Ala Glu Val Thr Ile Lys Thr His Val Gly
180 185 190
Arg Val Leu Ala Lys Ile Gly Val Arg Asp Arg Val Asn Val Val Ile
195 200 205
Trp Ala Tyr Arg Asn Gly Ala Gly Pro Ser
210 215
<210> 221
<211> 301
<212> PRT
<213> Actinoplanes liguriae
<400> 221
Met Pro Ile Leu Trp Thr Ala Val Leu Ala Gly Ala Val Ile Leu Gly
1 5 10 15
His Arg Leu Val Pro Asn Ala Val Gly Asn Ala Gly Ser Leu Ile Glu
20 25 30
Ala Phe Leu Pro Trp Phe Gly Leu Ala Val Pro Val Leu Leu Leu Leu
35 40 45
Ala Leu Met Arg Arg Ser Leu Thr Gly Leu Ala Ala Val Leu Leu Pro
50 55 60
Leu Gly Ala Trp Leu Ile His Phe Gly Gly Tyr Val Val Asp Arg Asp
65 70 75 80
Thr Gly Thr Pro Asp Leu Ile Val Val Gln His Asn Val Ser Asp Glu
85 90 95
Asn Pro Asp Pro Ala Gly Thr Ala Arg Ala Leu Leu Ala Ala His Pro
100 105 110
Asp Leu Val Gly Leu Glu Glu Val Leu Pro Glu Ala Val Ala Ala Tyr
115 120 125
Arg Gly Val Leu Asp Ala Glu Leu Pro Phe His Thr Val Gln Gly Thr
130 135 140
Val Ala Leu Trp Ser Arg Tyr Pro Leu Thr Gly Ala Glu Ala Ile Asp
145 150 155 160
Ile Arg Pro His Asp Leu Gly Glu Asp Trp Asn Arg Gly Leu Arg Ala
165 170 175
Val Ala Arg Thr Pro Gly Gly Asp Thr Ala Val Tyr Val Ala His Leu
180 185 190
Pro Ser Val Arg Val Thr Ala Ala Gly Leu Thr Ser Ala Arg Arg Asp
195 200 205
Glu Ser Ala Arg Lys Leu Gly Ala Leu Leu Ala Ala Asp Pro Val Pro
210 215 220
Arg Leu Val Val Ile Gly Asp Leu Asn Thr Ser Val Asp Asp Arg Gly
225 230 235 240
Leu Arg Pro Ile Arg Gln Val Met Ile Asp Ser Pro Ala Asp Phe Ala
245 250 255
Phe Thr Trp Pro Ala Arg Thr Pro Val Ala Arg Ile Asp Gln Val Leu
260 265 270
Ala Arg Ser Met Thr Val Thr Arg Leu Thr Ala Leu Pro Arg Thr Gly
275 280 285
Ser Asp His Leu Pro Leu Ala Ala Glu Ile Arg Phe Pro
290 295 300
<210> 222
<211> 290
<212> PRT
<213> Actinoplanes liguriae
<400> 222
Met Arg Asn Asn Glu Thr Val Arg Ile Pro Val Ala Thr Gly Gly Ala
1 5 10 15
Val Thr Ala Thr Leu Phe Ala Pro Glu Ser Ala Arg Ala Val Leu Val
20 25 30
Val His Pro Ala Thr Ala Thr Pro Gln Gly Phe Tyr Ala Ser Phe Ala
35 40 45
Thr Tyr Leu Ala Glu Asn Gly Ile Ala Thr Val Thr Tyr Asp Tyr Arg
50 55 60
Gly Thr Gly Arg Ser Gly Ser Pro Arg Asp His Arg Asp Leu Gly Met
65 70 75 80
Arg Asp Trp Ile Gly Ala Asp Ala Pro Ala Val Ala Ala Trp Ala Ala
85 90 95
Asp Arg Phe Pro Gly Leu Pro Arg Leu Ala Ala Gly His Ser Leu Gly
100 105 110
Gly His Val Ile Ala Leu Gly Ala Ala Gly Pro Asp Leu Ala Ala Ser
115 120 125
Val Ile Val Ala Ser His Ile Ala Ala Leu Arg Thr Ile Pro Ser Arg
130 135 140
Leu Glu Arg Phe Arg Val Arg Ile Met Leu His Ile Leu Gly Pro Ala
145 150 155 160
Leu Gly Arg Leu Leu Gly Tyr Val Pro Ala Arg Ser Leu Gly Leu Gly
165 170 175
Glu Asp Leu Pro Ala Ala Ala Met Leu Glu Trp Gly Gly Trp Ala Arg
180 185 190
Arg Asp Asn Tyr Phe Phe Asp Asp Pro Ser Met Arg Ala Ala Glu Arg
195 200 205
Ala Ala Thr Leu Thr Gly Pro Val Leu Ala Val Gly Thr Thr Asp Asp
210 215 220
Pro Trp Ser Thr Pro Arg Gln Met Asp Ala Leu Thr Val His Leu Thr
225 230 235 240
Ser Ala Ser Val Glu Arg Arg Thr Tyr Ser Pro Ala Ala Ala Gly Val
245 250 255
Pro Val Ile Gly His His Gly Leu Phe Arg Arg Ala Val Arg Asp Thr
260 265 270
Val Trp Pro Glu Leu Leu Ala Trp Leu His Ala His Ser Glu Lys Ala
275 280 285
Ser Arg
290
<210> 223
<211> 145
<212> PRT
<213> Actinoplanes liguriae
<400> 223
Val Arg Leu Pro Arg Leu Ile Phe Leu Leu Phe Asn Ala Asp Arg Ala
1 5 10 15
Val Arg Arg Trp Ile Asp Ala Arg Ser Gly Asp Thr Gly Ile Gly Ala
20 25 30
Ser Gly Ala Gly Val Leu Phe Tyr Leu Ala Gly His Glu Asn Ala Leu
35 40 45
Ile Gly Asp Val Thr Ala Ala Leu Gly Ala Ser Pro Ser Gly Met Ser
50 55 60
Gly Leu Val Asn Arg Leu Glu Arg Gly Gly Cys Leu Thr Arg Ser Gln
65 70 75 80
Asp Pro Ala Asp Ala Arg Ala Val Arg Leu Ala Leu Thr Pro Arg Gly
85 90 95
His Gln Val Val Ile His Ala Arg Gly Leu Val Asp Asp Leu Asn Glu
100 105 110
Gln Leu Thr Ala Gly Phe Asp Asp Ala Glu Ile Ala Val Val Gln Arg
115 120 125
Trp Leu Glu His Val Thr Arg Val Ser Val Gln Arg Glu Glu Arg Leu
130 135 140
Gly
145
<210> 224
<211> 175
<212> PRT
<213> Actinoplanes liguriae
<400> 224
Met Ala Asp Ser Val Val Phe Asp Gln Ile Pro Val Val Arg Ala Ile
1 5 10 15
Gly Arg Gly Thr Thr Ser Leu Ser Ala Phe His Asp Ala Leu Val Thr
20 25 30
Met Glu Cys Gly Phe Tyr Asn Leu Val Arg Leu Ser Ser Val Ile Pro
35 40 45
Pro Gly Thr Ala Val Asp Pro Ser Gly Lys Ala Pro Val Pro Val Gly
50 55 60
Ala Trp Gly Asp Lys Leu Tyr Cys Val Tyr Ala Glu Gln His Ala Ser
65 70 75 80
Gln Pro Gly Glu Glu Ala Trp Ala Gly Ile Gly Trp Val Gln Arg Arg
85 90 95
Asp Gly Gln Gly Gly Leu Phe Val Glu His Glu Gly Thr Ser Glu Ser
100 105 110
Phe Val Arg Glu Ala Ile Lys Ala Ser Leu Arg Asp Leu Val Lys Gly
115 120 125
His Glu Asp Asp Phe Asp Gly Pro Asp Phe Val Val His Gly Val Val
130 135 140
Ser Asp Gly Glu Pro Val Cys Ala Met Val Leu Ala Pro Tyr Glu Thr
145 150 155 160
Ala Pro Trp Arg Gly Val Arg Ala Thr Asp Pro Pro Gly Met Asn
165 170 175
<210> 225
<211> 406
<212> PRT
<213> Actinoplanes liguriae
<400> 225
Met Thr Leu Ser Glu Ile Leu Pro Ser Leu Gly Ala Ser Leu Arg Pro
1 5 10 15
Arg Leu Asp Pro Ala Asn Trp Pro Leu Thr Ala Arg Trp Thr Glu Pro
20 25 30
Gly Asp Leu Thr Val Gly Gly Val Pro Val Thr Arg Ile Ala Ala Ala
35 40 45
His Gly Thr Pro Val His Val Ile Asp Glu Thr Asp Val His Ser Arg
50 55 60
Cys Ala Glu Tyr Val Ala Ala Phe Gly Pro Gly Ala Val Cys Cys Ser
65 70 75 80
Ala Lys Gly Gly Leu Leu Arg Gly Ala Ala Arg Trp Ile Ala Arg Asp
85 90 95
Gly Leu Gly Cys Tyr Cys Arg Ser Ala Ala Glu Leu Arg Thr Ala Leu
100 105 110
Asp Ala Gly Ile Arg Pro Glu Ser Leu Ala Leu Phe Gly Ser Gly Lys
115 120 125
Ser Val Ala Asp Leu Glu Ala Ala Leu Ser Cys Gly Ala Ala Val Val
130 135 140
Ile Gly Ser Ala Ser Glu Ala Glu Val Val Ala Ala Arg Ser Arg Pro
145 150 155 160
Gly Gln Arg Val Leu Leu Arg Val Arg Pro Gly Ser Ala Gln Arg Gly
165 170 175
Tyr Gly Val Arg Leu Asn Ser Ser Ala Ala Leu Ala Ala Val Ala Thr
180 185 190
Val Thr Arg Ser Arg Arg Leu Val Leu Ala Gly Leu Asp Cys Ser Leu
195 200 205
Gly His Arg Leu Asn Arg Phe Gly Thr Tyr Glu Ser Cys Leu Arg Glu
210 215 220
Ala Ile Gly Phe Val Ala Arg Leu Arg Thr Thr Val Pro Val Leu Asn
225 230 235 240
Leu Gly Gly Gly His Ala Ala Asp Leu Pro Val Gly Ile Phe Ala Ala
245 250 255
Arg Leu Arg Ala Val Ala Gln Val Thr Ser Glu Gly Tyr Gly Ile Glu
260 265 270
Pro Pro Glu Val His Val Ser Pro Gly Arg Ala Leu Leu Gly Arg Ala
275 280 285
Gly Ile Thr Val His Arg Val Val Ala Ala Gly Asp Gly Val Ile Glu
290 295 300
Leu Asp Gly Asp Val Pro Asp Cys Leu Pro Gly Ala Asp Cys Ala Gly
305 310 315 320
Leu His Thr Ala Ala Leu Ile Gly Arg Ala Ser Pro Ala Pro Gly Arg
325 330 335
Ser Ile Thr Val Arg Cys Gly Asp Ala Thr Val Ala Val Ala Glu Leu
340 345 350
Pro Gly Asp Met Ala Ala Gly Asp Leu Val Ala Leu Ser Gly Thr Gly
355 360 365
Ala Tyr His Gln Arg Arg Asp Val Tyr Val Gly Arg Pro Ala Val Val
370 375 380
Ala Val Cys Gly Gly Arg Ala Arg Thr Leu Leu Pro Arg Glu Thr Ile
385 390 395 400
Asp Arg Ile Leu Tyr Ala
405
<210> 226
<211> 309
<212> PRT
<213> Actinoplanes liguriae
<400> 226
Val Arg Ser Lys Arg Glu His Ser Ala Asp Ile Arg Arg Gly Arg Arg
1 5 10 15
Ala Val Leu Val Val Asn Thr Arg Ser Arg Arg Gly Arg Leu Leu Tyr
20 25 30
Glu Glu Ala Arg Arg Arg Leu Val Glu Ala Gly Phe Glu Leu Leu Gly
35 40 45
Thr Tyr Ala Leu Glu Gln Ser Gly Gly Leu Asp Gly Leu Ile Ser Glu
50 55 60
Ala Leu Arg Lys Glu Pro Asp Leu Leu Ile Ala Gly Gly Gly Asp Gly
65 70 75 80
Thr Ile Ser Thr Ala Gly Arg Met Leu Ala His Arg Asp Val Ala Leu
85 90 95
Gly Val Leu Pro Leu Gly Thr Thr Asn Asn Phe Ala Arg Thr Val Arg
100 105 110
Ile Glu Pro Asp Leu Glu Ala Ala Ile Ala Thr Leu Val Asp Gly Lys
115 120 125
Val Ile Asp Val Asp Leu Gly Val Ala Gly Asp Val Pro Phe Thr Asn
130 135 140
His Val Gly Ile Gly Leu Ser Gly Glu Val Met Ile Ser Ala Pro Pro
145 150 155 160
Arg Leu Lys Arg Ala Val Gly Arg Leu Ala Tyr Pro Met Thr Ala Leu
165 170 175
Gly Leu Leu Ala Arg His Arg Pro Val Arg Ala Val Ile Arg Ala Glu
180 185 190
Gly Arg Glu Leu Arg Phe His Thr His Gln Val Tyr Val Ala Asn Gly
195 200 205
Gly Phe His Ala Gly Arg Pro Ile Thr Ala Asp Ala His Ala Asp Asp
210 215 220
Arg Leu Leu Val Ala Tyr Pro Val Gly Gly Ala Ser Arg Arg Glu Leu
225 230 235 240
Leu Arg Glu Thr Ala Arg Asn Ala Ala Thr Gly His Arg Arg Thr Leu
245 250 255
His Glu Arg Pro Phe Ile Ala Val Arg Glu Leu Trp Leu Glu Thr Asp
260 265 270
Arg Pro Val Ala Val Glu Val Asp Gly Glu Pro Arg Gly Thr Thr Pro
275 280 285
Met Arg Ile Ala Ile Asp Pro Asn Ala Leu Arg Ile Met Ala Pro Ala
290 295 300
Asp Ser Pro Asp Leu
305
<210> 227
<211> 367
<212> PRT
<213> Actinoplanes liguriae
<400> 227
Val Val Phe Gly Ser Leu Leu Leu Val Gly Gly Gly Gly Gly Ala Ile
1 5 10 15
Gly Leu Asn Ala Thr Val Ala Ala Ala Thr Ser Ser Val Gly Gln Glu
20 25 30
Ser Leu Leu Gly Ser Ala Lys Pro Ala Glu Glu Lys Lys Asn Ala Asn
35 40 45
Leu Asp Gly Ala Lys Asn Leu Leu Leu Val Gly Ile Asp Gln Arg Pro
50 55 60
Thr Gln Thr Asn Gly Glu Pro Leu Arg Ser Asp Ser Ile Ile Leu Leu
65 70 75 80
His Ile Asn Lys Asp His Ser Ser Gly Tyr Met Ile Ser Leu Pro Arg
85 90 95
Asp Ser Tyr Val Tyr Ile Pro Ala Tyr Asp Asn Gly Lys Gln Lys Trp
100 105 110
Ala Gly Gly Lys Thr Lys Ile Asn Ala Ala Phe Ala Phe Gly Thr Arg
115 120 125
Gly Leu Lys Gly Asn Glu Ala Leu Gln His Gly Phe Glu Leu Leu Thr
130 135 140
Met Thr Val Lys Glu Leu Thr Gly Ile Thr Pro Asp Ala Gly Ala Ile
145 150 155 160
Ile Asp Phe Gln Gly Phe Arg Asp Val Val Asn Val Leu Gly Lys Val
165 170 175
Cys Met Tyr Val Asp Thr Thr Thr Lys Ser Ile His Leu Gly Lys Asp
180 185 190
Gln Asn Gly Lys Thr Ala Lys Pro Phe Val Ile Asn Pro Asp Gly Thr
195 200 205
Leu Lys Ser Lys Ile Ser Gly Val Thr Pro Asn Thr Tyr Thr Lys Gly
210 215 220
Asp His Cys Phe Thr Pro Gly Gln Ala Leu Asp Phe Val Arg Gln Arg
225 230 235 240
Asp Leu Leu Ala Asp Asn Ser Leu Asp Tyr Gly Arg Gln Arg His Gln
245 250 255
Gln Gln Phe Phe Lys Ala Ile Ile Asn Gln Ala Leu Lys Asp Gly Leu
260 265 270
Asp Ser Pro Thr Lys Leu Pro Lys Leu Leu Ser Ala Phe Gly Lys Ala
275 280 285
Met Thr Val Asp Asp Gly Gly Ile Asp Leu Ala Asp Trp Ala Leu Ala
290 295 300
Met Arg Ser Leu Lys Pro Asp Lys Leu Leu Thr Ile Lys Thr Asn Ala
305 310 315 320
Gly Lys Leu Asn Ser Glu Asn Val Pro Gly Ser Gly Ser Val Glu Leu
325 330 335
Leu Ser Asp Asp Ser Met Asp Leu Leu Lys Ser Ile Lys Lys Asp Gln
340 345 350
Ile Asp Thr Phe Leu Leu Ser His Pro Ala Phe Ile Ala Asn Ser
355 360 365
<210> 228
<211> 317
<212> PRT
<213> Actinoplanes liguriae
<400> 228
Met Pro Ser Glu Pro Asp Val Ser Val Val Ile Pro Thr Cys Asn Arg
1 5 10 15
Pro Glu Leu Ala Val Arg Ala Val Arg Ser Ala Leu Gly Gln Thr His
20 25 30
Arg Asn Leu Glu Val Ile Val Val Val Asp Gly Pro Asp Glu Ala Thr
35 40 45
Val Thr Ala Leu Gly Glu Val Gly Asp Pro Arg Leu Ser Val Ile Val
50 55 60
Leu Pro Glu Arg Gly Lys Ala Pro Asn Ala Arg Asn Thr Gly Ala Arg
65 70 75 80
Ala Ala Arg Gly Arg Trp Thr Ala Met Leu Asp Asp Asp Asp Glu Trp
85 90 95
Leu Pro Thr Lys Ile Glu Arg Gln Leu Glu Thr Ala Ala Ala Ala Thr
100 105 110
Val Glu Arg Pro Val Val Ala Cys Arg Met Ile Ser Arg Thr Pro Arg
115 120 125
Ala Asp Thr Ile Met Pro Arg Arg Leu Pro Glu Pro Gly Glu Pro Ile
130 135 140
Ser Glu Tyr Leu Leu Val Arg Arg Gly Leu Phe Tyr Gly Asp Gly Phe
145 150 155 160
Val Gln Thr Ser Cys Ile Met Ala Pro Thr Glu Leu Trp Arg Lys Val
165 170 175
Pro Phe Thr Val Gly Leu Arg Arg Ala Gln Glu Leu Asp Trp Thr Leu
180 185 190
Arg Ala Met Arg Glu Pro Gly Thr Ala Leu Ile Tyr Ala Glu Glu Pro
195 200 205
Leu Val Leu Trp His Gln Asp Glu Asn Arg Asp Arg Ile Ser Leu Gln
210 215 220
Asn Pro Trp Arg Glu Gln Leu Glu Trp Leu Arg Gly Asn Arg Glu Leu
225 230 235 240
Phe Thr Pro Arg Ala Tyr Ala Ala Phe Thr Leu Ser Val Leu Ser Ser
245 250 255
Met Ala Ala Pro Thr Arg Asp Thr Gly Leu Phe Arg Glu Leu Leu Ala
260 265 270
Glu Ala Arg Thr His Gly Asp Pro Gly Thr Val Asp Tyr Leu Thr His
275 280 285
Met Gln Ile Trp Ala Leu Pro Pro Ser Val Arg His Arg Leu Arg Asp
290 295 300
Val Val Val Gly Arg Gly Lys Thr Ser Ser Asn Ala Gly
305 310 315
<210> 229
<211> 369
<212> PRT
<213> Actinoplanes liguriae
<400> 229
Met Pro Ala Glu Arg Arg Val Ala Ile Trp Arg Ser Ser Met Leu Pro
1 5 10 15
Gly Ser Glu Thr Phe Val Arg Asn Gln Ala Asp Ala Leu Thr Arg Trp
20 25 30
Thr Pro Ala Tyr Val Gly Ala Val Arg His Glu Ser Val Leu Ser Arg
35 40 45
Pro Asp Asp Val Ile Ala Phe Pro Gly Gly Lys Gly Phe Leu Arg Leu
50 55 60
Arg Leu Thr Gly Ala Ser Pro Gln Leu Gln Lys Thr Ile Ser Ala Val
65 70 75 80
Arg Pro Asn Leu Val His Ala His Phe Gly Gly Asp Gly Trp Leu Val
85 90 95
Ser His Ser Ala Gln Gln Leu Gly Val Pro Leu Ala Val Thr Val His
100 105 110
Gly His Asp Val Thr Arg Gln Pro Ser Ser Pro Gly Ala Lys Gly Val
115 120 125
Arg Tyr Arg Arg Asn Leu Gln Thr Val Phe Thr Arg Ala Ser Leu Val
130 135 140
Ile Ala Val Ser Glu Val Ile Arg Gly Gln Ala Ile Arg Trp Gly Ala
145 150 155 160
Asp Pro Ala Lys Val Lys Val His Tyr Thr Gly Ile Ala Val Pro Pro
165 170 175
Glu Gln Pro Glu Glu Val Pro Lys Arg Trp Asp Val Val Phe Ile Gly
180 185 190
Arg Phe Val Ala Lys Lys Gly Val Asp Asp Leu Leu Thr Ala Leu Ala
195 200 205
Ala Val Glu Ser Arg Pro Arg Ala Leu Leu Ile Gly Asp Gly Glu Leu
210 215 220
Met Thr Ala Met Arg Ala Arg Ala Glu Gln Leu Gly Val Asp Val Thr
225 230 235 240
Phe Ala Gly Ser Arg Thr Pro Glu Gln Val Arg Arg His Leu Leu Glu
245 250 255
Ser Arg Leu Leu Ala Cys Pro Ser Lys Thr Ala Pro Asp Gly Asp Thr
260 265 270
Glu Gly Leu Pro Thr Thr Ile Leu Glu Ala Ala Ala Leu Gly Leu Pro
275 280 285
Val Val Ala Thr Arg His Ser Gly Ile Pro Glu Ala Val Ile Asp Gly
290 295 300
Glu Thr Gly Leu Leu Ser Pro Glu Ala Asp Pro Ala Ala Leu Ala Val
305 310 315 320
Ser Leu Thr Arg Leu Leu Gly Asp Glu Asp Leu Gln Arg Arg Leu Gly
325 330 335
Ala Arg Ala Arg Arg His Val Thr Ala His Phe Asp Leu Val Glu Gln
340 345 350
Thr Arg Arg Leu Glu Asp Leu Tyr Asp Glu Val Val Ala Gly Ala Arg
355 360 365
Val
<210> 230
<211> 459
<212> PRT
<213> Actinoplanes liguriae
<400> 230
Met Gly Glu His Phe Asp Leu Val Val Leu Gly Ala Gly Pro Gly Gly
1 5 10 15
Tyr Val Ala Ala Ile Arg Gly Ala Gln Leu Gly Leu Thr Thr Ala Ile
20 25 30
Val Glu Asp Lys Tyr Trp Gly Gly Val Cys Leu Asn Val Gly Cys Ile
35 40 45
Pro Ser Lys Ala Leu Leu Arg Asn Ala Glu Leu Ala His Ile Phe His
50 55 60
His Gln Ala Gln Thr Phe Gly Ile Glu Gly Lys Val Thr Phe Asp Phe
65 70 75 80
Ala Val Ala His Gln Arg Ser Arg Ser Val Ala Asp Gly Arg Val Lys
85 90 95
Gly Val His Phe Leu Met Lys Lys Asn Gly Ile Thr Glu Ile Gln Gly
100 105 110
Arg Gly Glu Phe Thr Asp Ala His Thr Leu Arg Val Gly Asp Arg Thr
115 120 125
Val Thr Phe Asp Asn Cys Ile Leu Ala Thr Gly Ala Ser Thr Arg Met
130 135 140
Ile Pro Gly Thr Ser Val Ser Lys Arg Val Val Thr Tyr Glu Glu Gln
145 150 155 160
Ile Leu Asp Pro Asp Leu Pro Asp Ser Ile Val Ile Val Gly Ala Gly
165 170 175
Ala Ile Gly Val Glu Phe Ala Tyr Val Leu Arg Asn Tyr Gly Val Asp
180 185 190
Val Thr Ile Val Glu Phe Leu Asp Arg Met Leu Pro Leu Glu Asp Glu
195 200 205
Glu Val Ser Lys Glu Leu Leu Arg Gln Tyr Arg Lys Leu Gly Val Asp
210 215 220
Val Arg Val Gly Thr Arg Val Glu Gly Ile Glu Glu Gly Ala Asp Ser
225 230 235 240
Val Arg Val Thr Val Ser Lys Asn Gly Lys Thr Glu Val Leu Glu Ala
245 250 255
Asp Lys Val Met Gln Ala Ile Gly Phe Lys Pro Asn Val Glu Gly Tyr
260 265 270
Gly Leu Glu Thr Thr Gly Val Thr Val Ser Asp Arg Gly Ala Val Glu
275 280 285
Ile Asp Asp Phe Cys Arg Thr Asn Val Pro Gly Ile Tyr Ala Ile Gly
290 295 300
Asp Val Thr Ala Lys Leu Met Leu Ala His Ala Ala Glu Ala Met Gly
305 310 315 320
Ile Val Ala Ala Glu Thr Ile Ala Gly Ala Glu Thr Met Ala Leu Asp
325 330 335
Tyr Arg Met Ile Pro Arg Ala Thr Phe Cys Gln Pro Gln Val Ala Ser
340 345 350
Phe Gly Trp Thr Glu Ala Gln Ala Arg Glu Gln Gly Phe Asp Val Lys
355 360 365
Val Ala Lys Phe Pro Phe Thr Ala Asn Gly Lys Ala His Gly Leu Gly
370 375 380
Asp Ala Thr Gly Phe Val Lys Ile Leu Ser Asp Ala Lys Tyr Gly Glu
385 390 395 400
Leu Leu Gly Ala His Leu Ile Gly Pro Asp Val Thr Glu Leu Leu Pro
405 410 415
Glu Leu Thr Leu Ala Gln Gln Trp Asp Leu Thr Val His Glu Val Gly
420 425 430
Arg Asn Val His Ala His Pro Thr Leu Ala Glu Ala Val Lys Glu Ala
435 440 445
Ile His Gly Leu Ala Gly His Met Ile Asn Phe
450 455
<210> 231
<211> 348
<212> PRT
<213> Actinoplanes liguriae
<400> 231
Met Thr Thr Pro Pro Arg Arg Ser Gly Thr Leu Ser Leu Val Thr Leu
1 5 10 15
Thr Val Glu Pro Pro Ile Ala Pro Ala Pro Pro Ala Ala Pro Gly Arg
20 25 30
Ser Arg Arg Arg Arg Leu Gly Tyr Leu Ala Phe Val Leu Val Ala Val
35 40 45
Val Ala Val Val Thr Leu Arg Asp Arg Leu Pro Asp Pro Gly Glu Phe
50 55 60
Leu Asp Ala Leu Arg Ala Ala Asp Trp Arg Trp Ala Ala Leu Ala Val
65 70 75 80
Gly Ala Gly Val Leu Ser Gln Ile Ala Tyr Ala Glu Gln Gln Arg Arg
85 90 95
Leu Leu Ala Ala Phe Gly Val Arg Val Pro Ala Arg Arg Ala Ile Ala
100 105 110
Met Thr Tyr Val Arg Ser Ala Leu Ser Met Ala Leu Pro Ala Gly Ser
115 120 125
Ala Ala Ser Ala Ala Tyr Ala Phe Gln Val Tyr Arg Arg His Gly Ala
130 135 140
Thr Ala Ala Ile Ser Ala Thr Ala Thr Leu Ile Ser Thr Val Val Thr
145 150 155 160
Val Met Ser Leu Gly Leu Leu Tyr Ala Ala Thr Trp Ser Leu Thr Ala
165 170 175
Thr Val Val Ala Gly Leu Ala Val Leu Leu Leu Trp Ile Tyr Arg Thr
180 185 190
Val Arg Gly Pro Val Pro Ala Arg Ala Gly Val Pro Arg Arg Leu Arg
195 200 205
Val Ala Pro Ile Ala Arg Leu Leu Gln Arg Pro Ala Val Ala Gln Ala
210 215 220
Leu Arg Gly Ala Arg Ser Val Pro Ala Arg Thr Trp Leu Thr Val Thr
225 230 235 240
Leu Ala Gly Val Ile Asn Trp Leu Leu Asp Met Ala Cys Leu Leu Leu
245 250 255
Ala Ala Asp Ala Leu His Ala Gly Leu Gly Trp Ser Arg Leu Ala Leu
260 265 270
Ile Tyr Leu Ala Val Gln Val Val Arg Gln Ile Pro Leu Thr Pro Gly
275 280 285
Gly Ile Gly Leu Ile Glu Thr Ser Met Leu Ala Gly Leu Ile Ala Ala
290 295 300
Gly Ala Pro Gln Val Thr Ala Ala Gly Ile Val Leu Ile Tyr Arg Leu
305 310 315 320
Ile Ser Phe Trp Leu Ile Leu Pro Ser Gly Leu Ala Ala His Leu Thr
325 330 335
Leu Arg Arg Gly Thr Val Pro Pro Val Thr Pro Gly
340 345
<210> 232
<400> 232
000
<210> 233
<400> 233
000
<210> 234
<400> 234
000
<210> 235
<400> 235
000
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<400> 251
000
<210> 252
<400> 252
000
<210> 253
<400> 253
000
<210> 254
<400> 254
000
<210> 255
<400> 255
000
<210> 256
<400> 256
000
<210> 257
<400> 257
000
<210> 258
<400> 258
000
<210> 259
<400> 259
000
<210> 260
<400> 260
000
<210> 261
<400> 261
000
<210> 262
<400> 262
000
<210> 263
<400> 263
000
<210> 264
<400> 264
000
<210> 265
<400> 265
000
<210> 266
<400> 266
000
<210> 267
<400> 267
000
<210> 268
<400> 268
000
<210> 269
<400> 269
000
<210> 270
<400> 270
000
<210> 271
<400> 271
000
<210> 272
<400> 272
000
<210> 273
<400> 273
000
<210> 274
<400> 274
000
<210> 275
<400> 275
000
<210> 276
<400> 276
000
<210> 277
<400> 277
000
<210> 278
<400> 278
000
<210> 279
<400> 279
000
<210> 280
<400> 280
000
<210> 281
<400> 281
000
<210> 282
<400> 282
000
<210> 283
<400> 283
000
<210> 284
<400> 284
000
<210> 285
<400> 285
000
<210> 286
<400> 286
000
<210> 287
<400> 287
000
<210> 288
<400> 288
000
<210> 289
<400> 289
000
<210> 290
<400> 290
000
<210> 291
<400> 291
000
<210> 292
<400> 292
000
<210> 293
<400> 293
000
<210> 294
<400> 294
000
<210> 295
<400> 295
000
<210> 296
<400> 296
000
<210> 297
<400> 297
000
<210> 298
<400> 298
000
<210> 299
<400> 299
000
<210> 300
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/SBDIG-1
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, or t
<400> 300
tgggtstgca csctsacsat cgartgcggn acsgtsatct gcgcstgc 48
<210> 301
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/ACT08F
<400> 301
tccagcacgc gcgggg 16
<210> 302
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/ACT09R
<400> 302
gttcgaccag ccgccc 16
<210> 303
<211> 27
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/AGvar01bF
<400> 303
ttctagacgt tgttctccca ttttcac 27
<210> 304
<211> 27
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/AGvar02bR
<400> 304
aagatcttcg aaggtgagct cgccgaa 27
<210> 305
<211> 94
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/AGvar03F
<400> 305
gatcttcgcg aggaccgcac catctacgcc gccagcagcg gctgggtgtg tacactgacg 60
atcgagtgcg gcaccgtgat ctgcgcctgc tgac 94
<210> 306
<211> 94
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/AGvar04R
<400> 306
ctaggtcagc aggcgcagat cacggtgccg cactcgatcg tcagtgtaca cacccagccg 60
ctgctggcgg cgtagatggt gcggtcctcg cgaa 94
<210> 307
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/AGvar05F
<400> 307
gcctgctgac ctaggtcgac gatcgt 26
<210> 308
<211> 27
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/AGvar06r
<400> 308
tgaattcggc tgctccccgc gcgaaat 27
<210> 309
<211> 59
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/SB50F
<400> 309
attcgcccgg gaagtccacc gaaaggaaga cacaccatga ttccggggat ccgtcgacc 59
<210> 310
<211> 58
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/SB51R
<400> 310
gggcgatgcc cgccccgggc cggaaacgat cgtcgatcat gtaggctgga gctgcttc 58
<210> 311
<211> 59
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/SB52F
<400> 311
aagtatatat gagtaaactt ggtctgacag ttaccaatga ttccggggat ccgtcgacc 59
<210> 312
<211> 58
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic sequence: Primer O/SB53R
<400> 312
gcttcaataa tattgaaaaa ggaagagtat gagtattcat gtaggctgga gctgcttc 58
<210> 313
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Compound of Formula I
<220>
<221> MOD_RES
<222> (7, 9, 14)
<223> Abu
<220>
<221> THIOETH
<222> (1)..(6)
<220>
<221> THIOETH
<222> (7)..(12)
<220>
<221> THIOETH
<222> (9)..(17)
<220>
<221> MISC_FEATURE
<222> (14)..(19)
<223> Linked by Y, where Y is -S- or -S(O)-
<400> 313
Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Leu Val
1 5 10 15
Ala Ala Ala
<210> 314
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Compound of Formula I
<220>
<221> MOD_RES
<222> (7, 9, 14)
<223> Abu
<220>
<221> THIOETH
<222> (1)..(6)
<220>
<221> THIOETH
<222> (7)..(12)
<220>
<221> THIOETH
<222> (9)..(17)
<220>
<221> MISC_FEATURE
<222> (14)..(19)
<223> Linked by Y, where Y is -S- or -S(O)-
<400> 314
Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Val Val
1 5 10 15
Ala Ala Ala
<210> 315
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Compound of Formula I
<220>
<221> MOD_RES
<222> (7, 9, 14)
<223> Abu
<220>
<221> THIOETH
<222> (1)..(6)
<220>
<221> THIOETH
<222> (7)..(12)
<220>
<221> THIOETH
<222> (9)..(17)
<220>
<221> MISC_FEATURE
<222> (14)..(19)
<223> Linked by Y, where Y is -S- or -S(O)-
<400> 315
Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Leu Ile
1 5 10 15
Ala Ala Ala
<210> 316
<211> 20
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Compound of Formula I
<220>
<221> MOD_RES
<222> (8, 10, 15)
<223> Abu
<220>
<221> THIOETH
<222> (2)..(7)
<220>
<221> THIOETH
<222> (8)..(13)
<220>
<221> THIOETH
<222> (10)..(18)
<220>
<221> MISC_FEATURE
<222> (15)..(20)
<223> Linked by Y, where Y is -S- or -S(O)-
<400> 316
Ala Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Leu
1 5 10 15
Val Ala Ala Ala
20
<210> 317
<211> 20
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Compound of Formula I
<220>
<221> MOD_RES
<222> (8, 10, 15)
<223> Abu
<220>
<221> THIOETH
<222> (2)..(7)
<220>
<221> THIOETH
<222> (8)..(13)
<220>
<221> THIOETH
<222> (10)..(18)
<220>
<221> MISC_FEATURE
<222> (15)..(20)
<223> Linked by Y, where Y is -S- or -S(O)-
<400> 317
Ala Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Val
1 5 10 15
Val Ala Ala Ala
20
<210> 318
<211> 20
<212> PRT
<213> Artificial sequence
<220>
<223> Synthetic sequence: Compound of Formula I
<220>
<221> MOD_RES
<222> (8, 10, 15)
<223> Abu
<220>
<221> THIOETH
<222> (2)..(7)
<220>
<221> THIOETH
<222> (8)..(13)
<220>
<221> THIOETH
<222> (10)..(18)
<220>
<221> MISC_FEATURE
<222> (15)..(20)
<223> Linked by Y, where Y is -S- or -S(O)-
<400> 318
Ala Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Leu
1 5 10 15
Ile Ala Ala Ala
20
Claims (43)
- 하기 화학식의 화합물 또는 이의 약제학적으로 허용 가능한 염:상기 식에서,-X1-X2-는 -Leu-Val-을 나타내고;Y는 -S- 또는 -S(O)-이며;Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타내며;R은 -OH 또는 -NR1R2 기를 나타내며, 여기서, R1 및 R2는 독립적으로(i) 수소; 또는(ii) 식 -(CH2)n-NR3R4(여기서, n은 2 내지 8의 정수를 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타내거나, R3 및 R4는 함께 -(CH2)3-, -(CH2)4-, -(CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- 또는 -(CH2)5- 기를 나타낸다)의 기를 나타낸다.
- 제1항에 있어서, Z가 -NH2인 화합물.
- 제1항에 있어서, Z가 아미노산인 화합물.
- 제3항에 있어서, 상기 아미노산은 Ala, Ile, Lys, Phe, Val, Glu, Asp, His, Leu, Arg, Ser 및 Trp 기로부터 선택되고, 상기 아미노산은 D 배열(configuration) 또는 L 배열로 존재하는 것인 화합물.
- 제3항에 있어서, Z가 Ile, Lys, Phe, Val, Glu, Asp, His, Leu, Arg 및 Ser 기로부터 선택되는 아미노산인 화합물.
- 제3항에 있어서, 상기 아미노산이 Ala인 화합물.
- 제1항 내지 제6항 중 어느 한 항에 있어서, R이 -NR1R2 기를 나타내는 것인 화합물.
- 삭제
- 제1항 내지 제6항 중 어느 한 항에 있어서, R이 -NR1R2 기를 나타내며, 여기서, R1 및 R2는 독립적으로 수소 또는 식 -(CH2)n-NR3R4(여기서, n은 2 내지 8의 정수를 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타낸다)의 기를 나타내는 것인 화합물.
- 제1항 내지 제6항 중 어느 한 항에 있어서, R이 -OH인 화합물.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 내부 잔기 측쇄의 카복시 작용기에 대해, 이 작용기가 -COOH로부터 -COOR5(여기서, R5는 수소, (C1-C4)알킬 또는 (C1-C4)알콕시 (C2-C4)알킬을 나타낸다)의 기로 변형되도록 하는 변형을 포함하는 것인 화합물.
- 제1항 내지 제6항 중 어느 한 항에 있어서, N-말단 아미노 기에 대해, 이 -NH2 기 대신에 -NHR6(여기서, R6은 C1-C4알킬을 나타낸다)의 기가 되도록 하는 변형을 포함하는 것인 화합물.
- 제1항에 기재된 화합물의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번, 또는 18번 위치로부터 선택되는 위치의 1개, 2개, 3개 또는 4개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 제1항에 기재된 화합물의 변이체로서, 항미생물 활성을 갖는 변이체.
- 제1항 내지 제6항 중 어느 한 항에 따른 화합물을 약제학적으로 허용 가능한 담체 또는 희석제와 함께 포함하는, 박테리아 감염 치료용 약제학적 조성물.
- 제14항에 있어서, 상기 감염이 클로스트리듐 디피실리(Clostridium difficile)에 의해 유발되는 장 중복 감염(gut super-infection)인 약제학적 조성물.
- 삭제
- 삭제
- 제18항에 있어서, 핵산이 악티노플레인스 리구리애(A. liguriae)에서 발현되는 것인 방법.
- 제19항에 있어서, 악티노플레인스 리구리애는 부다페스트 조약 기탁 번호 NCIMB 41362 하에 기탁되어 있는 것인 방법.
- B형 란티바이오틱 펩티드 데옥시액타가르딘, 액타가르딘 또는 이의 변이체를 발현시키는 데 적합한 숙주 세포를 제조하는 방법으로서,액타가르딘 B, ala(0)-액타가르딘 B, 또는 이들 중 어느 하나의 아미노산 변이체로서, 폴리펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 아미노산 변이체의 전구체 펩티드를 포함하는 LanA 폴리펩티드를 코딩하는 lanA 유전자를,경우에 따라, 전구체 펩티드를 상기 펩티드로 전환시키는 데 적합한 하나 이상의 관련된 클러스터 유전자와 함께 도입함으로써 세포를 형질전환시켜, 상기 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고 이것을 발현시키는 데 적합한 숙주 세포를 생성하는 단계를 포함하며, 상기 LanA 폴리펩티드는 하기 구조를 갖는 것인 제조 방법:상기 식에서,-X1-X2-는 -Leu-Val-을 나타내고;Y는 -S- 또는 -S(O)-이며;Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
- 제21항에 있어서, 상기 세포를 lanA 유전자 및 하나 이상의 클러스터 유전자로 형질전환시키는 것인 제조 방법.
- 제22항에 있어서, 관련된 유전자 클러스터가 LanR 폴리펩티드 또는 이것과 90% 이상 동일한 그의 변이체를 코딩하는 유전자를 포함하고, 상기 LanR 폴리펩티드는 LanA 폴리펩티드의 생성을 조절하는 인자인 것인 제조 방법.
- 제22항 또는 제23항에 있어서, 상기 유전자 클러스터가 LanM 폴리펩티드 또는 이것과 90% 이상 동일한 그의 변이체를 코딩하는 유전자를 추가로 포함하고, 상기 LanM 폴리펩티드는 란티바이오틱 유전자 클러스터로부터 유래된 것으로서, 전구체 폴리펩티드를 란티바이오틱 화합물로 전환하는 데 요구되는 변형 인자인 것인 제조 방법.
- 제24항에 있어서, LanM 폴리펩티드가 서열 번호 120 또는 213에 제시된 아미노산 서열을 갖는 것인 제조 방법.
- 제22항 또는 제23항에 있어서, 상기 유전자 클러스터가 LanO 폴리펩티드 또는 이것과 90% 이상 동일한 그의 변이체를 코딩하는 유전자를 추가로 포함하고, 상기 LanO 폴리펩티드는 란티바이오틱 유전자 클러스터로부터 유래된 것으로서, 데옥시 형태를 이의 -S(O)- 유사체로 산화시키는 데 관여하는 인자인 것인 제조 방법.
- 제26항에 있어서, 상기 LanO 폴리펩티드가 서열 번호 122 또는 215의 아미노산 서열을 갖는 것인 제조 방법.
- 제24항에 있어서, 관련된 유전자 클러스터가 LanT 폴리펩티드 또는 이것과 90% 이상 동일한 그의 변이체를 코딩하는 유전자를 추가로 포함하고, 상기 LanT 폴리펩티드는 란티바이오틱 유전자 클러스터로부터 유래된 것으로서, 수송 인자인 것인 제조 방법.
- 제28항에 있어서, 상기 LanT 폴리펩티드가 서열 번호 123 또는 214에 제시된 아미노산 서열을 갖는 것인 제조 방법.
- 제21항 또는 제22항에 있어서, 상기 숙주 세포가 란티바이오틱 생산 숙주 세포인 제조 방법.
- 제30항에 있어서, 상기 숙주 세포가 LanO 폴리펩티드를 코딩하는 유전자를 포함하고, 상기 유전자가 불활성화되는 것인 제조 방법.
- 제31항에 있어서, LanO 폴리펩티드를 코딩하는 유전자가 돌연변이 또는 결실에 의해 불활성화되는 것인 제조 방법.
- 제21항 또는 제22항에 있어서, 숙주 세포를 배양하여 그 안에 코딩된 란티바이오틱 펩티드를 발현시키는 단계를 추가로 포함하는 제조 방법.
- 제33항에 있어서, 란티바이오틱을 회수하는 단계를 추가로 포함하는 제조 방법.
- 제33항에 있어서, 모노아미드 유도체를 제공하도록 C-말단의 카복시 작용기를 유도체화하는 단계를 추가로 포함하는 제조 방법.
- 제21항 또는 제22항의 방법으로부터 얻을 수 있는 세포로서, 상기 세포는 돌연변이된 내인성 LanA 유전자를 갖는 란티바이오틱 생산 숙주 세포 및 LanA 유전자를 발현할 수 있는 비생산자 중에서 선택되는 것인 세포.
- 제21항 또는 제22항에 정의된 방법에서 숙주 세포를 형질전환시키는 데 적합한 벡터로서,액타가르딘 B, ala(0)-액타가르딘 B, 또는 이들 중 어느 하나의 변이체로서, 폴리펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 변이체의 전구체 펩티드를 포함하는 LanA 폴리펩티드를 코딩하는 유전자를,경우에 따라, 전구체 펩티드를 생성물 펩티드로 전환시키는 데 필요한 관련된 클러스터 유전자와 함께 포함하는 발현 작제물을 포함하며, 상기 LanA 폴리펩티드는 하기 구조를 갖는 것인 벡터:상기 식에서,-X1-X2-는 -Leu-Val-을 나타내고;Y는 -S- 또는 -S(O)-이며;Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
- 제37항에 있어서, 상기 발현 작제물이 lanA 프로모터 서열을 추가로 포함하는 것인 벡터.
- 내인성 LanA 유전자 내에 돌연변이를 포함하는 란티오바이오틱 생산 숙주 세포로서, 상기 유전자는 액타가르딘 B, ala(0)-액타가르딘 B, 또는 이들 중 어느 하나의 아미노산 변이체로서, 폴리펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 아미노산 변이체의 전구체 펩티드를 포함하는 LanA 폴리펩티드를 코딩하고, 내인성 유전자가 발현되지 않거나 내인성 유전자 생성물이 비활성화되도록 하며, 상기 LanA 폴리펩티드는 하기 구조를 갖는 것인 란티바이오틱 생산 숙주 세포:상기 식에서,-X1-X2-는 -Leu-Val-을 나타내고;Y는 -S- 또는 -S(O)-이며;Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
- LanA 펩티드, 또는 이의 아미노산 변이체로서, 펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 아미노산 변이체를 발현시키기 위해 숙주 세포를 사용하는 방법으로서,상기 세포는 LanO 폴리펩티드를 코딩하는 유전자를 갖는 란티바이오틱 생산 세포이고,상기 유전자는 불활성화되거나,상기 유전자의 발현이 증가되며,상기 LanA 펩티드는 하기 구조를 갖는 것인 방법:상기 식에서,-X1-X2-는 -Leu-Val-을 나타내고;Y는 -S- 또는 -S(O)-이며;Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
- 제40항에 있어서, LanO 폴리펩티드를 코딩하는 유전자가 돌연변이 또는 결실에 의해 불활성화되는 것인 방법.
- 액타가르딘 B, 또는 이의 아미노산 변이체로서, 폴리펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 아미노산 변이체를 제조하기 위해, LanA 펩티드를 코딩하는 유전자를 포함하는 숙주 세포를 사용하는 방법으로서, 단, 상기 숙주는 LanA 펩티드를 코딩하는 내인성 유전자를 포함하는 란티바이오틱 생산 세포이고, 상기 내인성 유전자는 내인성 유전자가 발현되지 않거나 내인성 유전자 생성물이 불활성이 되거나 내인성 유전자가 결실되도록 돌연변이되며, 액타가르딘 B는 하기 구조를 갖는 것인 방법:상기 식에서,-X1-X2-는 -Leu-Val-을 나타내고;Y는 -S- 또는 -S(O)-이며;Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
- 삭제
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB0600928.6A GB0600928D0 (en) | 2006-01-17 | 2006-01-17 | Improvements relating to lantibiotics |
GB0600928.6 | 2006-01-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080086517A KR20080086517A (ko) | 2008-09-25 |
KR101573536B1 true KR101573536B1 (ko) | 2015-12-11 |
Family
ID=35998187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087018136A KR101573536B1 (ko) | 2006-01-17 | 2007-01-17 | 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 |
Country Status (20)
Country | Link |
---|---|
US (3) | US7989416B2 (ko) |
EP (2) | EP1979375B9 (ko) |
JP (1) | JP5219837B2 (ko) |
KR (1) | KR101573536B1 (ko) |
CN (1) | CN101389641B (ko) |
AT (1) | ATE534659T1 (ko) |
AU (1) | AU2007206769B2 (ko) |
BR (1) | BRPI0706525A2 (ko) |
CA (1) | CA2637315A1 (ko) |
CY (1) | CY1112559T1 (ko) |
DK (1) | DK1979375T3 (ko) |
ES (1) | ES2378090T3 (ko) |
GB (1) | GB0600928D0 (ko) |
IL (1) | IL192446A0 (ko) |
MX (1) | MX2008009047A (ko) |
NZ (1) | NZ569486A (ko) |
PL (1) | PL1979375T3 (ko) |
PT (1) | PT1979375E (ko) |
SI (1) | SI1979375T1 (ko) |
WO (1) | WO2007083112A2 (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0600928D0 (en) | 2006-01-17 | 2006-02-22 | Novacta Biosystems Ltd | Improvements relating to lantibiotics |
GB0714029D0 (en) * | 2007-07-18 | 2007-08-29 | Novacta Biosystems Ltd | Lantibiotic-based compounds having antimicrobial activity |
GB0714030D0 (en) * | 2007-07-18 | 2007-08-29 | Novacta Biosystems Ltd | The use of type-B lantibiotic-based compounds having antimicrobial activity |
GB0900599D0 (en) | 2009-01-14 | 2009-02-18 | Novacta Biosystems Ltd | Treatment |
TWI453029B (zh) * | 2009-01-14 | 2014-09-21 | Novacta Biosystems Ltd | 去氧艾克特卡丁b(deoxyactagardine b), 包含其之醫藥組合物及其製造方法 |
BRPI1007884A2 (pt) * | 2009-02-04 | 2016-09-06 | Novacta Biosystems Ltd | derivados de actagardina |
GB201001688D0 (en) | 2010-02-02 | 2010-03-17 | Novacta Biosystems Ltd | Compounds |
WO2011095768A1 (en) | 2010-02-02 | 2011-08-11 | Novacta Biosystems Limited | Lantibiotic salts |
EA201291461A1 (ru) * | 2010-07-14 | 2013-08-30 | Новакта Биосистемс Лимитед | Состав, содержащий лантибиотик типа b |
GB201013507D0 (en) | 2010-08-11 | 2010-09-22 | Novacta Biosystems Ltd | Compounds |
GB201013509D0 (en) | 2010-08-11 | 2010-09-22 | Novacta Biosystems Ltd | Compounds |
GB201013508D0 (en) | 2010-08-11 | 2010-09-22 | Novacta Biosystems Ltd | Compounds |
GB201013513D0 (en) * | 2010-08-11 | 2010-09-22 | Novacta Biosystems Ltd | Formulations |
US9975930B2 (en) | 2012-11-30 | 2018-05-22 | Naicons S.R.L. | Lantibiotic derivatives and process for their preparation |
CN103483433B (zh) * | 2013-09-10 | 2015-05-27 | 中国科学院微生物研究所 | 一种新型高效的羊毛硫细菌素cerecidin及其应用 |
CN106188253B (zh) * | 2016-08-26 | 2020-08-18 | 上海交通大学 | 抗菌肽Lexapeptide及其制备方法和用途 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3710795A (en) | 1970-09-29 | 1973-01-16 | Alza Corp | Drug-delivery device with stretched, rate-controlling membrane |
GB8507528D0 (en) | 1985-03-22 | 1985-05-01 | Lepetit Spa | Basis monocarboxyamide derivatives |
US5304540A (en) | 1988-06-22 | 1994-04-19 | Applied Microbiology, Inc. | Pharmaceutical bacteriocin compositions and methods for using the same |
IN167138B (ko) | 1988-08-17 | 1990-09-01 | Hoechst India | |
GB8926639D0 (en) | 1989-11-24 | 1990-01-17 | Agricultural & Food Res | Delayed release formulations |
KR0166088B1 (ko) | 1990-01-23 | 1999-01-15 | . | 수용해도가 증가된 시클로덱스트린 유도체 및 이의 용도 |
US5376645A (en) | 1990-01-23 | 1994-12-27 | University Of Kansas | Derivatives of cyclodextrins exhibiting enhanced aqueous solubility and the use thereof |
IT1260505B (it) | 1992-06-01 | 1996-04-09 | Poli Ind Chimica Spa | Sistemi farmaceutici orali a cessione ritardata per il rilascio specifico nel colon |
IL107887A (en) | 1992-12-08 | 2003-07-06 | Ambi Inc | Stabilized lanthionine containing bacteriocin compositions |
US5512269A (en) | 1993-06-09 | 1996-04-30 | Burroughs Wellcome, Co. | Method of treating retained pulmonary secretions |
PT700998E (pt) | 1994-09-12 | 2004-03-31 | Aventis Pharma Gmbh | Mersacidina recombinante e metodo para a sua producao |
SK285563B6 (sk) | 1995-06-23 | 2007-03-01 | Ambi, Inc. | Použitie lanthocinu na výrobu liečiva na liečenieinfekcie |
GB9711643D0 (en) | 1997-06-05 | 1997-07-30 | Janssen Pharmaceutica Nv | Glass thermoplastic systems |
US5985823A (en) | 1997-06-09 | 1999-11-16 | Ambi Inc. | Method for the treatment of diarrheal disease and for eliminating particular bacterial populations from the colon |
US5958873A (en) | 1997-06-09 | 1999-09-28 | University Of Cincinnati | Oral formulation for treatment of bacteria-induced diseases of the colon |
DE19745583A1 (de) * | 1997-10-15 | 1999-04-22 | Hoechst Marion Roussel De Gmbh | Neues Lantibiotikum verwandt mit Actagardine, Verfahren zur Herstellung und Verwendung derselben |
US6569830B1 (en) | 1999-03-05 | 2003-05-27 | Ambi, Inc. | Compositions and methods for treatment of staphylococcal infection while suppressing formation of antibiotic-resistant strains |
CA2413330A1 (en) | 2000-06-28 | 2002-01-03 | Smithkline Beecham P.L.C. | Wet milling process |
GB0110432D0 (en) * | 2001-04-27 | 2001-06-20 | Plant Bioscience Ltd | Lantibiotic production |
WO2002103010A1 (en) | 2001-06-14 | 2002-12-27 | Plant Bioscience Limited | Methods and materials for targeted gene disruption in actinomycete bacteria |
US6861236B2 (en) | 2002-05-24 | 2005-03-01 | Applied Nanosystems B.V. | Export and modification of (poly)peptides in the lantibiotic way |
EP1558746A4 (en) | 2002-10-10 | 2006-11-22 | Molichem Medicines Inc | DURAMYCIN-CODING NUCLEIC ACIDS |
US7351687B2 (en) | 2003-07-18 | 2008-04-01 | Vicuron Pharmaceuticals, Inc. | Antibiotic 107891, its factors A1 and A2, pharmaceutically acceptable salts and compositions, and use thereof |
ATE356143T1 (de) | 2003-07-18 | 2007-03-15 | Vicuron Pharm Inc | Antibiotikum 107891, dessen faktoren a1 und a2, pharmazeutisch unbedenkliche salze und zusammensetzungen, und anwendung davon |
EP1720910A4 (en) * | 2004-02-17 | 2007-11-21 | Cancervax Corp | METHOD AND COMPOSITION FOR INHIBITING ANGIOGENESIS |
GB0406870D0 (en) | 2004-03-26 | 2004-04-28 | Novacta Biosystems Ltd | Improvements relating to the production of lantibiotics |
EP1928900A1 (en) | 2005-09-27 | 2008-06-11 | Novacta Biosystems Limited | Variants of the lantibiotic mersacidin and their use |
GB0600928D0 (en) | 2006-01-17 | 2006-02-22 | Novacta Biosystems Ltd | Improvements relating to lantibiotics |
KR20120038021A (ko) | 2006-10-27 | 2012-04-20 | 화이자 프로덕츠 인코포레이티드 | 하이드록시프로필 메틸 셀룰로스 경질 캡슐 및 이의 제조 방법 |
WO2008151434A1 (en) | 2007-06-12 | 2008-12-18 | The University Of British Columbia | Small cationic antimicrobial peptides |
GB0714029D0 (en) | 2007-07-18 | 2007-08-29 | Novacta Biosystems Ltd | Lantibiotic-based compounds having antimicrobial activity |
GB0714030D0 (en) | 2007-07-18 | 2007-08-29 | Novacta Biosystems Ltd | The use of type-B lantibiotic-based compounds having antimicrobial activity |
EP2367845A1 (en) | 2008-11-24 | 2011-09-28 | Sentinella Pharmaceuticals, Inc. ("Sentinella") | Lantibiotic carboxyamide derivatives with enhanced antibacterial activity |
GB0900599D0 (en) | 2009-01-14 | 2009-02-18 | Novacta Biosystems Ltd | Treatment |
TWI453029B (zh) | 2009-01-14 | 2014-09-21 | Novacta Biosystems Ltd | 去氧艾克特卡丁b(deoxyactagardine b), 包含其之醫藥組合物及其製造方法 |
BRPI1007884A2 (pt) | 2009-02-04 | 2016-09-06 | Novacta Biosystems Ltd | derivados de actagardina |
EP2216937A1 (en) | 2009-02-10 | 2010-08-11 | Alcatel Lucent | Alarm notification between customer premises equipment and a remote management server |
-
2006
- 2006-01-17 GB GBGB0600928.6A patent/GB0600928D0/en not_active Ceased
-
2007
- 2007-01-17 BR BRPI0706525-6A patent/BRPI0706525A2/pt active Search and Examination
- 2007-01-17 AU AU2007206769A patent/AU2007206769B2/en not_active Ceased
- 2007-01-17 ES ES07704921T patent/ES2378090T3/es active Active
- 2007-01-17 PT PT07704921T patent/PT1979375E/pt unknown
- 2007-01-17 US US12/161,221 patent/US7989416B2/en not_active Ceased
- 2007-01-17 NZ NZ569486A patent/NZ569486A/en not_active IP Right Cessation
- 2007-01-17 US US13/705,010 patent/USRE45003E1/en not_active Expired - Fee Related
- 2007-01-17 CA CA002637315A patent/CA2637315A1/en not_active Abandoned
- 2007-01-17 AT AT07704921T patent/ATE534659T1/de active
- 2007-01-17 WO PCT/GB2007/000138 patent/WO2007083112A2/en active Application Filing
- 2007-01-17 KR KR1020087018136A patent/KR101573536B1/ko not_active IP Right Cessation
- 2007-01-17 PL PL07704921T patent/PL1979375T3/pl unknown
- 2007-01-17 DK DK07704921.1T patent/DK1979375T3/da active
- 2007-01-17 MX MX2008009047A patent/MX2008009047A/es active IP Right Grant
- 2007-01-17 EP EP07704921A patent/EP1979375B9/en not_active Not-in-force
- 2007-01-17 EP EP20100000424 patent/EP2189472A1/en not_active Withdrawn
- 2007-01-17 CN CN2007800067480A patent/CN101389641B/zh not_active Expired - Fee Related
- 2007-01-17 SI SI200730846T patent/SI1979375T1/sl unknown
- 2007-01-17 JP JP2008550839A patent/JP5219837B2/ja not_active Expired - Fee Related
-
2008
- 2008-06-25 IL IL192446A patent/IL192446A0/en unknown
-
2011
- 2011-06-10 US US13/157,454 patent/US8465947B2/en not_active Expired - Fee Related
-
2012
- 2012-02-17 CY CY20121100166T patent/CY1112559T1/el unknown
Non-Patent Citations (3)
Title |
---|
Antimicrob. Agents Chemother. 11(3): 396-401(1977. 3.) |
Appl. Environ. Microbiol. 66(6): 2565-2571(2000. 6.) |
Eur. J. Biochem. 228(3): 786-797(1995. 3. 15.) |
Also Published As
Publication number | Publication date |
---|---|
EP1979375B9 (en) | 2012-05-09 |
US8465947B2 (en) | 2013-06-18 |
US7989416B2 (en) | 2011-08-02 |
DK1979375T3 (da) | 2012-03-19 |
USRE45003E1 (en) | 2014-07-08 |
CN101389641A (zh) | 2009-03-18 |
CY1112559T1 (el) | 2016-02-10 |
ATE534659T1 (de) | 2011-12-15 |
GB0600928D0 (en) | 2006-02-22 |
US20110306091A1 (en) | 2011-12-15 |
AU2007206769A1 (en) | 2007-07-26 |
NZ569486A (en) | 2011-07-29 |
WO2007083112A3 (en) | 2008-05-08 |
KR20080086517A (ko) | 2008-09-25 |
EP1979375A2 (en) | 2008-10-15 |
US20100048459A1 (en) | 2010-02-25 |
EP2189472A1 (en) | 2010-05-26 |
WO2007083112A2 (en) | 2007-07-26 |
AU2007206769B2 (en) | 2013-06-20 |
JP2009523777A (ja) | 2009-06-25 |
CA2637315A1 (en) | 2007-07-26 |
MX2008009047A (es) | 2008-12-18 |
CN101389641B (zh) | 2013-06-05 |
PT1979375E (pt) | 2012-03-06 |
BRPI0706525A2 (pt) | 2011-03-29 |
PL1979375T3 (pl) | 2012-04-30 |
SI1979375T1 (sl) | 2012-03-30 |
ES2378090T3 (es) | 2012-04-04 |
EP1979375B1 (en) | 2011-11-23 |
IL192446A0 (en) | 2008-12-29 |
JP5219837B2 (ja) | 2013-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101573536B1 (ko) | 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 | |
DK2271666T3 (da) | Nrps-pks-gengruppe og dens manipulation og anvendelighed | |
KR101261870B1 (ko) | 폴리믹신 b 또는 e 생합성 효소 및 이를 코딩하는 유전자 군 | |
KR20100049580A (ko) | 티오펩티드 전구체 단백질, 그를 코딩하는 유전자 및 그의 용도 | |
KR20100039443A (ko) | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 | |
WO1999005283A2 (fr) | Genes de biosynthese et de transfert des 6-desoxyhexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation | |
US20020164747A1 (en) | Gene cluster for ramoplanin biosynthesis | |
CN110857447B (zh) | 提高米尔贝霉素a3/a4或其衍生物产量的方法 | |
CA2501393A1 (en) | Genes and proteins for the biosynthesis of the glycopeptide antibiotic a40926 | |
KR101110175B1 (ko) | 스피라마이신의 생합성에 관여하는 폴리펩티드, 이들폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도 | |
CA2450691C (en) | Genes and proteins involved in the biosynthesis of lipopeptides | |
KR20080032641A (ko) | 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 | |
EP1442123A2 (en) | Polynucleotides and polypeptides involved in clavulinic acid biosynthesis and use thereof | |
Bell | Analysis and manipulation of “actagardine” gene clusters from Actinoplanes | |
FR2786200A1 (fr) | Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation | |
FR2786189A1 (fr) | Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation | |
CA2412627A1 (en) | Genes and proteins involved in the biosynthesis of lipopeptides | |
FR2786201A1 (fr) | Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation | |
KR20110118316A (ko) | 폴리믹신 b 또는 e 생합성 효소 및 이를 코딩하는 유전자 군 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |