KR101573536B1 - 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 - Google Patents

악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 Download PDF

Info

Publication number
KR101573536B1
KR101573536B1 KR1020087018136A KR20087018136A KR101573536B1 KR 101573536 B1 KR101573536 B1 KR 101573536B1 KR 1020087018136 A KR1020087018136 A KR 1020087018136A KR 20087018136 A KR20087018136 A KR 20087018136A KR 101573536 B1 KR101573536 B1 KR 101573536B1
Authority
KR
South Korea
Prior art keywords
ala
leu
val
gly
arg
Prior art date
Application number
KR1020087018136A
Other languages
English (en)
Other versions
KR20080086517A (ko
Inventor
스티븐 보크스
바갈로 지저스 코르테스
마이클 존 도손
Original Assignee
노박타 바이오시스템스 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노박타 바이오시스템스 리미티드 filed Critical 노박타 바이오시스템스 리미티드
Publication of KR20080086517A publication Critical patent/KR20080086517A/ko
Application granted granted Critical
Publication of KR101573536B1 publication Critical patent/KR101573536B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/365Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinoplanes (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/045Actinoplanes

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Virology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 란티바이오틱 액타가르딘에 대한 생합성 유전자 클러스터의 특성 규명, 액타가르딘의 신규한 변이체 및 그의 생합성 클러스터의 동정과, 특성 규명된 생합성 유전자 클러스터로부터의 유전자를 이용하여, 액타가르딘, 본원에서 액타가르딘 B로도 지칭되는 신규한 액타가르딘 변이체, 및 본 발명에 따라 제조된 이들 둘 모두의 변이체를 제조하고 사용하는 방법에 관한 것이다.

Description

악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애로부터의 란티바이오틱 생합성 유전자 클러스터{LANTIBIOTIC BIOSYNTHETIC GENE CLUSTERS FROM A. GARBADINENSIS AND A. LIGURIAE}
본 발명은 란티바이오틱 액타가르딘에 대한 생합성 유전자 클러스터의 특성 규명, 액타가르딘의 신규한 변이체 및 그의 생합성 클러스터의 동정과, 특성 규명된 생합성 유전자 클러스터로부터의 유전자를 이용하여, 액타가르딘, 악티노플레네스 리구리애(A. liguriae) 균주에서 제조된 신규한 액타가르딘 변이체, 및 본 발명에 따라 생산된 이들 둘 모두의 변이체를 제조하고 사용하는 방법에 관한 것이다.
란티바이오틱(lantibiotic)은 그램 양성 박테리아에 의해 생산되며, 항생제 활성 및 기타 활성을 갖는 펩티드이다. 다른 변형된 잔기들 중에서 티오에테르 아미노산 란티오닌 및 메틸란티오닌을 함유하는데, 이는 폴리사이클릭 구조로 펩티드 쇄를 가교-결합시킨다. 다음과 같이 분류하는 것이 전혀 문제가 없는 것은 아니지만, 란티바이오틱은 2 부류, A형 및 B형으로 분류된다. A형 란티바이오틱은 일반적으로 박테리아 및 다른 원형질막에 구멍을 형성할 수 있는 긴 양친매체이다. 대조적으로 B형 란티바이오틱은 효소 기능을 저해하며, 입체 형태적으로 한정된 구형의 펩티드이다. 예로는 신나마이신 및 듀라마이신이 있다.
예로서, 신나마이신과 같은 B형 란티바이오틱에 관한 활성으로는 항미생물 활성(항생제로서 효능이 있는 적용성을 제공한다), 안지오텐신 전환 효소 저해(혈압 조절에서 효능이 있는 적용성을 제공한다), 포스포리파제 A2의 저해를 통한 면역조절(소염제로서의 효능이 있는 적용성을 제공한다), 및 프로스타글란딘 및 류코트리엔 생합성 간섭을 포함한다.
B형 란티바이오틱은 각각의 기질을 차단함으로써 효소 활성을 간섭하여 그의 활성을 발휘하는 것으로 보인다. 예를 들면, B형 란티바이오틱, 예로서, 머사시딘 및 액타가르딘이 펩티도글리칸의 생합성을 저해하는 것으로 밝혀졌고; 글리코실 전이반응이 표적 반응으로서 동정되었다. 이들 반응에 대한 기질은 지질-결합 세포벽 전구체 지질 II이다. 이는 란티바이오틱 반코마이신에 대한 표적이 되는 반면, 작용 부위는 상이하고, 임의의 현 항균제에 의해 사용되지 않는 신규한 표적 결합 부위이다.
신나마이신 부류의 B형 란티바이오틱의 경우, 항균제 활성이 특히, 바실러스(Bacillus) 균주에서 관찰되었는데, 막 기능, ATP 의존성 양성자 전이 및 Ca2+-흡수, 및 ATP아제에 미치는 효과가 기재되었다. 또한, 포스파티딜에탄올아민-함유 평면막내 한정된 구멍 형성이 보고되었다. 이러한 효과는 이들 B형 란티바이오틱이 포스파티딜에탄올아민에 특이적으로 결합하기 때문일 수 있다.
란티바이오틱은 프로피오니박테리움 아크네스(Propionibacterium acnes) 및 문제가 되는 병원균, 예컨대, 보편적으로 사용되고 있는 다수의 항생제에 대하여 내성을 갖고 있거나, 내성을 발생시키고 있는, 메티실린 내성 스타필로코커스 아우레우스(MRSA: methicillin-resistant Staphylococcus aureus), 및 스트렙토코커스 뉴모니애(Streptococcus pneumoniae)에 대한 항균제 및 식품 첨가제로서의 효능과 유용성을 갖는 것으로 나타났다. 리뷰를 위해, 문헌 ([Sahl and Bierbaum (1998) Annual Rev. Microbiol. 52:41-79]; [Jack and Sahl (1995) TIBTECH 13:269 278]; [Gasson (1995) Chapter 10, Lantibiotics, in Vining and Stuttard (eds) Biotechnology Series: Genetics and Biochemistry of Antibiotic Production, Biotechnological I 30 Series 28, pages 283-306])을 참조할 수 있다.
항생제 분야에 있어서, 내성, 생체적합성, 독성 등과 같은 문제를 극복하기 위해 새로운 항생제 화합물 공급에 대해서 계속적으로 요구되고 있다. 따라서, 란티바이오틱을 생산하는 방법, 및 란티바이오틱의 변이체 형태(이는 천연 형태와 상이한 활성 프로파일을 가질 수 있다)의 생산이 바람직할 수 있다.
액타가르딘은 공지된 B형 란티바이오틱이며, 테트라사이클릭이고, 길이는 19개(1890 Da)의 아미노산이다. 이는 시험관내 모델 및 생체내 모델, 둘 모두에서 스타필로코커스 아우레우스 및 스트렙토코커스(Streptococcus) 발열원과 같이 중요한 그램 양성 병원체에 대하여 강력한 활성을 갖는다. 액타가르딘의 구조는 도 4에 제시되어 있다. 본 화합물은 프리-프로-펩티드로부터 생산되며, 그의 C-말단부는 SSGWVCTLTIECGTVICAC(서열 번호 4)의 폴리펩티드 서열을 갖는다. 서열 번호 4의 폴리펩티드는 하기 가교결합: 가교결합 1-6, 란티오닌(Ser-Cys); 가교결합 7-12, 베타-메틸란티오닌(Thr-Cys); 가교결합 9-17, 베타-메틸란티오닌(Thr-Cys); 가교결합 14-19, 베타-메틸란티오닌 설폭시드(Thr-Cys)에 의해 2차 및 3차 구조를 형성함으로써 변형된다.
액타가르딘은 2개의 악티노플레인스(Actinoplanes) 종; 악티노플레인스 가르바디넨시스(A. garbadinensis) 및 악티노플레인스 리구리애(A. liguriae)에 의해 생산된다고 보고되었다. 가교결합 14-19는 산화되어 있고, 즉, 메틸란티오닌 설폭시드가 아닌, 베타-메틸란티오닌인, 본원에서는 데옥시-액타가르딘으로 명명되는 유도체도 함께 생산된다.
US 6,022,851에는 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애의 단리된 균주로부터 액타가르딘을 단리하는 것이 기재되어 있다.
[발명의 개시]
본 발명은 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애로부터의 B형 란티바이오틱, 액타가르딘에 대한 생합성 유전자 클러스터와 관련하여 클로닝되고, 서열 분석되고, 해명된 구조 및 조절 상의 정보에 관한 것이다.
본 발명자는 또한 놀랍게도, 본원에서 악티노플레인스 리구리애 NCIMB 41362로 명시된 악티노플레인스 리구리애 단리물에서, 본 발명자가 액타가르딘 B로 명명하는, 신규한 형태의 액타가르딘, 또는 비산화된 형태로 데옥시-액타가르딘 B가 생산된다는 것을 발견하게 되었다. 이러한 형태는 액타가르딘과 유사한 항미생물 활성을 갖고, 서열 번호 1의 1차 폴리펩티드 서열로부터 생성되며, 이는 액타가르딘과 유사한 가교-결합을 이룬다. 변이체는 액타가르딘에 대하여 신규하고 유용한 대안을 제공한다. 추가로, 액타가르딘과 상이한 액타가르딘 B중의 잔기를 동정함으로써 이들 차이에 기초한 추가의 란티바이오틱을 제공하게 된다.
본 발명자는 또한 액타가르딘 및 액타가르딘 B 생산에 관한 유전자를 포함하는 액타가르딘 생산 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애 NCIMB 41362, 둘 모두로부터 유전자 클러스터를 단리하였다.
하나의 측면에서, 본 발명은 서열 번호 2 및 서열 번호 3의 1차 폴리펩티드 서열에 기초한 변이체 뿐만 아니라, 그의 변이체를 비롯한, 신규한 액타가르딘 B 및 그의 변이체를 제공한다.
추가의 측면에서, 본 발명은 액타가르딘 B 및 그의 변이체를 코딩하는 핵산, 핵산 및 상기-언급한 유전자 클러스터로부터 유래된 그의 변이체 세트, 액타가르딘 B 및 그의 변이체 제조 방법, 및 액타가르딘 B의 신규한 변이체를 생산하는 방법을 제공한다.
[도면의 간단한 설명]
도 1은 악티노플레인스 가르바디넨시스로부터 단리된 액타가르딘 코딩 및 조절 유전자 클러스터 지도를 제공한다.
도 2는 본원에서 액타가르딘 B로 언급되는, 액타가르딘 B의 신규한 변이체를 코딩하는, 악티노플레인스 리구리애로부터 단리된, 코딩 및 조절 유전자 클러스터 지도를 제공한다.
도 3은 악티노플레인스 가르바디넨시스 또는 악티노플레인스 리구리애로부터 단리된 핵산 서열을 사용하여 액타가르딘 변이체를 생성하기 위한, 본원에서 개시된 방법을 제시하는 개략도이다.
도 4는 성숙한 액타가르딘의 1차 구조에 대한 대표도이다(여기서, X1-X2는 Val-Ile를 나타내고, Y는 -S(O)-이고, Z는 NH2이다). "데옥시-액타가르딘 B"는 AbuS14와 AlaS19 사이에 비산화된 메틸란티오닌 브릿지를 갖는 Val15Leu Ile16Val 변이체이다.
서열 설명
독자의 편의를 위해, 본 출원의 서열에 하기와 같이 비연속적으로 번호를 매겼다:
서열 번호 1은 액타가르딘 B의 1차 폴리펩티드 서열이다: SSGWVCTLTIECGTLVCAC.
서열 번호 2는 액타가르딘 B 변이체 VV의 1차 폴리펩티드 서열이다: SSGWVCTLTIECGTVVCAC.
서열 번호 3은 액타가르딘 B 변이체 LI의 1차 폴리펩티드 서열이다: SSGWVCTLTIECGTLICAC.
서열 번호 4는 액타가르딘의 1차 폴리펩티드 서열이다: SSGWVCTLTIECGTVICAC;
서열 번호 11은 Ala-액타가르딘 B의 1차 폴리펩티드 서열이다: ASSGWVCTLTIECGTLVCAC.
서열 번호 12는 Ala-액타가르딘 B 변이체 VV의 1차 폴리펩티드 서열이다: ASSGWVCTLTIECGTVVCAC.
서열 번호 13은 Ala-액타가르딘 B 변이체 LI의 1차 폴리펩티드 서열이다: ASSGWVCTLTIECGTLICAC.
서열 번호 14는 Ala-액타가르딘의 1차 폴리펩티드 서열이다: ASSGWVCTLTIECGTVICAC.
서열 번호 212는 프리-프로-액타가르딘 B의 1차 폴리펩티드 서열이다: MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTLVCAC.
서열 번호 22는 프리-프로-액타가르딘 B 변이체 VV의 1차 폴리펩티드 서열이다: MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTVVCAC.
서열 번호 223은 프리-프로-액타가르딘 B 변이체 LI의 1차 폴리펩티드 서열이다: MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTLICAC.
서열 번호 119는 프리-프로-액타가르딘의 1차 폴리펩티드 서열이다: MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTVICAC.
서열 번호 100은 벡터가 아닌, 코스미드 CosAG14의 악티노플레인스 가르바디넨시스-유래 뉴클레오티드 서열이다.
서열 번호 101-132는 각각 서열 번호 100의 오픈 리딩 프레임 orf1 - orf32의 폴리펩티드 서열이다.
서열 번호 200은 벡터가 아닌, 코스미드 CosAL02의 악티노플레인스 리구리애-유래 뉴클레오티드 서열이다.
서열 번호 201-231은 각각 서열 번호 200의 오픈 리딩 프레임 orf1 - orf31의 폴리펩티드 서열이다.
서열 번호 300-312는 본원 하기에 기술하는 프라이머 서열이다.
[발명의 상세한 설명]
본 발명은 서열 번호 100 및 서열 번호 200의 유전자 클러스터, 및 이들 클러스터에 의해 코딩되는 폴리펩티드 및 그의 변이체에 관한 것이다. 서열 번호 119의 폴리펩티드는 프리-프로-액타가르딘이고, 서열 번호 212의 폴리펩티드는 프리-프로-액타가르딘 B이다. 나머지 폴리펩티드 및 그의 변이체(본원에서 정의되는 바와 같은 것)는 본원에서 총칭적으로 "클러스터 폴리펩티드"로 지칭된다. 서열 번호 100으로부터 유래된 클러스터 폴리펩티드는 "1xx 폴리펩티드"로서 지칭되며, 서열 번호 200으로부터 유래된 것은 "2xx 폴리펩티드"로서 지칭된다. 서열 및 길이, 둘 모두에서 클러스터 폴리펩티드와 100% 동일한 폴리펩티드를 "야생형" 폴리펩티드로 지칭한다. 서열 번호 100 또는 서열 번호 200으로부터 유래된 클러스터 폴리펩티드는 야생형 또는 변이체일 수 있다.
폴리펩티드는 실질적으로 단리된 형태일 수 있다. 본 발명의 단리된 폴리펩티드는, 천연적으로 그와 결합하는 있는 물질, 예로서, 세포 내에서 그와 함께 발견되는 다른 폴리펩티드가 존재하지 않거나 실질적으로 존재하지 않는, 상기 정의된 바와 같이 단리된 형태의 것일 것이다. 물론, 예를 들면, 폴리펩티드는 희석제 또는 애부번트와 함께 제제화될 수 있고, 여전히 실제 목적을 위해 단리될 수 있다.
본 발명의 폴리펩티드는 또한 실질적으로 정제된 형태일 수 있으며, 이 경우, 본 발명의 폴리펩티드는 일반적으로 시료내 90% 초과, 예컨대, 95%, 98% 또는 99% 초과의 폴리펩티드가 본 발명의 폴리펩티드인 것인, 시료내 폴리펩티드를 포함한다.
란티바이오틱 폴리펩티드 및 란티바이오틱A 유전자
본 발명에서, 란티바이오틱A 또는 LanA 폴리펩티드, 란티바이오틱A 또는 LanA 유전자에 대한 언급은 총칭적으로 B형 란티바이오틱 폴리펩티드 또는 상기 펩티드를 코딩하는 유전자를 지칭하는 것이다. 따라서, 그에 관한 언급은 신나마이신, 머사시딘, 액타가르딘 및 액타가르딘 B 및 이들 산물을 코딩하는 유전자에 관한 언급을 포함한다. 란티바이오틱를 생산하는 숙주 세포에 관한 것은 그의 천연 형태로 LanA 폴리펩티드를 생산하는 임의의 숙주 세포를 지칭하는 것이며, 이는 본원 하기에서 추가로 정의된다.
LanA 폴리펩티드는 항미생물 활성을 갖는 폴리펩티드이다. 항미생물 활성은 기준 유기체, 예컨대, 마이크로코커스 루테우스(Micrococcus luteus)에 대한 MIC 값을 측정함으로써 검사될 수 있다. LanA 폴리펩티드의 MIC가 동일한 기준 미생물 균주에 대하여 16배 초과로 액타가르딘의 것보다 더 작거나 그와 동일할 경우, LanA 폴리펩티드는 항미생물 활성을 나타내는 것으로 간주된다. 본 발명에서, 악티노플레인스 가르바디넨시스 LanA 유전자는 actA로 지칭되고, 악티노플레인스 리구리애 LanA 유전자는 LigA로 지칭된다.
기타 Lan 폴리펩티드
본원에서 사용되는 바, "LanM" 폴리펩티드에 관한 언급은, 전구체 폴리펩티드를 란티바이오틱 화합물로 전환시키는데 필요한 변형 인자로서, 란티바이오틱 유전자 클러스터로부터 유래된 폴리펩티드에 관한 것이다. LanM 폴리펩티드는 서열 번호 120의 것(ActM) 또는 그의 변이체, 서열 번호 213의 것(LigM) 또는 그의 변이체, WO02/088367에서 정의된 것과 같은 cinM 폴리펩티드, 문헌 [Altena et al, 2000]에 개시된 mrsM 폴리펩티드, 또는 B형 란티바이오틱을 생산하는 박테리아의 또다른 유전자 클러스터로부터의 상동성 폴리펩티드를 포함한다.
"LanR" 폴리펩티드에 관한 언급은, 전구체 폴리펩티드의 생산 조절에 필요한 조절 인자로서, 란티바이오틱 유전자 클러스터로부터 유래된 폴리펩티드에 관한 것이다. LanR 폴리펩티드는 서열 번호 122의 것(ActR) 또는 그의 변이체, 서열 번호 216의 것(LigR) 또는 그의 변이체, WO02/088367에서 정의된 것과 같은 cinR1 폴리펩티드, 문헌 [Altena et al, 2000]에 개시된 mrsR1 폴리펩티드, 또는 B형 란티바이오틱을 생산하는 박테리아의 또다른 유전자 클러스터로부터의 상동성 폴리펩티드를 포함한다.
"LanT" 폴리펩티드에 관한 언급은, 전구체 폴리펩티드를 란티바이오틱 화합물로 생산하는데 필요한 수송 인자로서, 란티바이오틱 유전자 클러스터로부터 유래된 폴리펩티드에 관한 것이다. LanT 폴리펩티드는 서열 번호 123의 것(ActT) 또는 그의 변이체, 서열 번호 214의 것(LigT) 또는 그의 변이체, WO02/088367에서 정의된 것과 같은 cinT 폴리펩티드, 문헌 [Altena et al, 2000]에 개시된 mrsT 폴리펩티드, 또는 B형 란티바이오틱을 생산하는 박테리아의 또다른 유전자 클러스터로부터의 상동성 폴리펩티드를 포함한다.
"LanO" 폴리펩티드에 관한 언급은, 본 발명의 데옥시 형태의 액타가르딘 및 화합물을 본 발명의 액타가르딘 또는 화합물(여기서, Y는 -S(O)-이다)로 산화시키는데 관여하는 것으로 여겨지는 인자로서, 란티바이오틱 유전자 클러스터로부터 유래된 폴리펩티드에 관한 것이다. LanO 폴리펩티드는 서열 번호 122의 것(ActO) 또는 그의 변이체, 서열 번호 215의 것(LigO) 또는 그의 변이체, 또는 B형 란티바이오틱을 생산하는 박테리아의 또다른 유전자 클러스터로부터의 상동성 폴리펩티드를 포함한다.
클러스터 폴리펩티드
하나의 측면에서, 본 발명은 서열 번호 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230 및 231중 어느 하나로부터 선택된 단리된 클러스터 폴리펩티드를 제공한다. 또다른 측면에서, 본 발명은 상기-언급된 서열 중 어느 것의 변이체인 클러스터 폴리펩티드를 제공한다.
특히 관심의 대상이 되는 클러스터 폴리펩티드는 LanM, LanR, LanT 또는 LanO 폴리펩티드인, 1xx 및 2xx 폴리펩티드이다.
클러스터 폴리펩티드와 관련하여 "변이체"는 기준 폴리펩티드(이러한 경우, 임의의 야생형 클러스터 폴리펩티드), 또는 폴리펩티드의 단편의 아미노산 서열과 상이하지만, 상기 아미노산 서열과 유의적인 아미노산 서열 동일성을 나타내는 아미노산을 갖는 임의의 폴리펩티드를 의미한다.
구체적으로 언급하지 않는 한, 유의적인 아미노산 서열 동일성은 바람직하게 80% 이상, 더욱 바람직하게 85%, 90% 또는 95% 이상, 더욱 더 바람직하게 98% 또는 99% 이상이다. 변이체의 길이는 바람직하게 야생형 클러스터 폴리펩티드 길이와 동일하거나, 그의 70% 이상이고, 바람직하게, 80% 이상, 더욱 바람직하게, 90% 이상, 및 가장 바람직하게는 95% 이상이다.
"아미노산 서열 동일성 퍼센트(%)"란 서열을 정렬시키고, 필요한 경우, 서열 동일성 퍼센트의 최대치를 얻기 위해 갭을 도입한 후 보존적 치환을 서열 동일의 일부로서 간주하지 않은 상태에서, 비교시 서열의 아미노산 잔기와 동일한, 후보 서열의 아미노산 잔기의 비율로서 정의된다. 본원에서 사용된 동일성(%) 값은 문헌 [Altschul et al. (1996)]; hppt://balst.wust/edu/blast/README.html의 WU-BLAST-2에 의해 얻었다. WU-BLAST-2는 여러 파라미터를 사용하는데, 이들 중 대부분은 디폴트 값으로 정해져 있다. 조정가능한 파라미터는 하기와 같다: 오버랩 스팬 = 1. 오버랩 분율 = 0.125, 단어 역치수(T) = 11. HSPS 및 HSP S2 파라미터는 역동적인 값으로서 검색되는 서열에 대한 특정 데이타 베이스의 서열 및 조성의 조합에 달려있다. 그러나, 이 값들은 민감도가 증가되도록 조정될 수 있다. 아미노산 서열 동일성 퍼세튼는 일치하는 잔기 수를 정렬된 영역에서 "보다 긴" 서열의 전체 잔기 수로 나눔으로써 결정된다. "보다 긴" 서열은 정렬된 영역(정렬을 최대화하기 위하여 WU-BLAST-2에 의해 도입된 갭은 무시됨)에서 대부분의 실제 잔기를 갖는 것을 말한다.
바람직하게, 변이체는 기준 폴리펩티드의 생물학적 기능을 보유할 것이다. 본 발명에서, 변이체가 그의 클러스터의 다른 구성원들과 함께 숙주 세포내 존재할 때, 변이체가 란티바이오틱을 생산할 수 있는 생물학적 기능은 유지된다. 이는 예를 들면, 1xx 클러스터 폴리펩티드 변이체인 경우에는 서열 번호 100, 및 2xx 클러스터 폴리펩티드 변이체인 경우에는 서열 번호 200을 함유하는 숙주 세포를 제공하는데, 여기서, 숙주 세포는 각각 액타가르딘 또는 액타가르딘 B를 생산하는 것이며, 서열을 변형시켜 변이체를 코딩하도록 하고, 란티바이오틱 폴리펩티드가 여전히 생산되는지 여부를 측정함으로써 측정될 수 있다.
전구체 폴리펩티드
또다른 측면에서, 본 발명은 폴리펩티드를, 바람직하게는, 단리된 형태의 폴리펩티드를 제공하는데, 이는 본 발명의 화합물 또는 액타가르딘의 전구체이다. 전구체 폴리펩티드는 서열 번호 1-4, 서열 번호 11-14, 서열 번호 212, 22, 23 및 119 중 어느 하나의 폴리펩티드 뿐만 아니라, 란티바이오틱 폴리펩티드로 전환될 수 있는 그의 변이체 또는 유도체를 포함한다.
서열 번호 1-4 중 어느 하나의 전구체 폴리펩티드의 변이체는 하나 이상, 예를 들면, 1 내지 5개, 예로서, 1, 2, 3 또는 4개의 아미노산이 또다른 아미노산으로 치환된 폴리펩티드이다. 바람직하게, 아미노산은 서열 번호 1-4 중 어느 하나의 2, 3, 4, 5, 8, 10, 11, 13 또는 18번 위치로부터 선택되는 위치에 존재한다.
서열 번호 11-14 중 어느 하나의 전구체 폴리펩티드의 변이체는 하나 이상, 예를 들면, 1 내지 5개, 예로서, 1, 2, 3 또는 4개의 아미노산이 또다른 아미노산으로 치환된 폴리펩티드이다. 바람직하게, 아미노산은 서열 번호 11-14 중 어느 하나의 3, 4, 5, 6, 9, 11, 12, 14 또는 19번 위치로부터 선택되는 위치에 존재한다.
서열 번호 212, 22, 23 및 119 중 어느 하나의 전구체 폴리펩티드의 변이체는, 각각 서열 번호 1-4에 상응하는 C-말단부(잔기 46-64)의 1 내지 5개, 예로서, 1, 2, 3 또는 4개의 아미노산이 또다른 아미노산으로 치환된 폴리펩티드이다. 바람직하게, 아미노산은 서열 번호 1-4 중 어느 하나의 2, 3, 4, 5, 8, 10, 11, 13 또는 18번 위치에 상응하는 위치로부터 선택된 위치에 존재한다. 그러한 변이체는 추가로 N-말단부(잔기 1-45)의 70% 이상, 예를 들면, 80% 이상, 바람직하게, 90% 이상, 예를 들면, 95% 이상을 보유하는 N-말단부에 변화를 포함한다. 예를 들면, 서열 번호 212 또는 서열 번호 119의 N-말단부의 변이체는, 본 발명의 데이타에서 서열 번호 212와 119 사이에 차이가 존재한다고 나타난, 4, 5, 6, 8, 9, 12, 13, 17, 18, 19, 21 및 32번 위치에 하나 이상의 치환, 예컨대, 1 내지 12개, 예로서, 1 내지 5개, 예컨대, 1, 2 또는 3개의 치환을 포함한다.
치환은 하나의 아미노산이 천연적으로 발생된 또다른 아미노산에 의해 이루어지는 것일 수 있고, 이는 보존적 또는 비-보존적 치환일 수 있다. 보존적 치환은 하기 표에 제시된 것을 포함하는데, 여기서, 두번째 칸의 같은 블록내 있는 아미노산, 바람직하게는, 세번째 칸의 같은 줄에 있는 아미노산은 서로서로 치환될 수 있다:
지방족




비극성
G A
I L V
극성 - 전하를 띠지 않음
C S T M
N Q
극성 - 전하를 띰
D E
K R
방향족 H F W Y
서열 번호 212의 경우, 치환은 서열 번호 119의 상응하는 위치에 위치하는 아미노산 잔기와 상이한 아미노산의 것일 수 있거나, 또는 그 반대일 수 있다. 어느 경우든, 치환은 서열 번호 119 아미노산을 서열 번호 212로, 또는 그 반대로 도입하고자 하는 것일 수 있다(예컨대, 서열 번호 212의 4번 위치의 Ile가 Leu로 치환될 수 있는 것 등).
전구체 폴리펩티드는 란티바이오틱을 생산하지 못하는 비생산자인 세포에서 폴리펩티드를 코딩하는 핵산을 발현시킴으로써 수득할 수 있다.
화합물
하나의 측면에서, 본 발명은 하기 화학식(I)의 화합물, 또는 이의 약제학적으로 허용 가능한 염을 제공한다:
Figure 112008052958573-pct00001
상기 식에서,
-X1-X2-는 -Leu-Val-; -Val-Val- 또는 -Leu-Ile-을 나타내고;
Y는 -S- 또는 -S(O)-이고;
Z는 H2N- 또는 Ala-이다. 추가의 측면에서, 본 발명은 이들 화합물의 변이체 및 생물학적으로 활성인 유도체를 제공한다.
-X1-X2-가 -Leu-Val-을 나타내고, Y는 -S(O)-이고, Z는 NH2인, 본 발명의 화합물은 또한 액타가르딘 B로 지칭된다.
-X1-X2-가 -Leu-Val-을 나타내고, Y는 -S(O)-이고, Z는 Ala-인, 본 발명의 화합물은 또한 ala-액타가르딘 B로 지칭된다.
-X1-X2-가 -Leu-Val-을 나타내고, Y는 -S-이고, Z는 NH2인, 본 발명의 화합물은 또한 데옥시-액타가르딘 B로 지칭된다.
-X1-X2-가 -Leu-Val-을 나타내고, Y는 -S-이고, Z는 Ala-인, 본 발명의 화합물은 또한 ala-데옥시-액타가르딘 B로 지칭된다.
Z가 NH2인 것과 관련하여 이 부위는 상기 화합물의 1번 위치의 알라닌 잔기의 N-말단을 나타낸다는 것을 이해할 것이다. Z가 Ala-인 것과 관련하여 이 부위는 당업계에서 통상 Ala(0)으로 지칭되는 것으로서, 아미드 결합을 통해 1번 위치의 알라닌에 연결된 알라닌을 나타낸다는 것을 이해할 것이다.
변이체
화학식(I)의 화합물의 변이체는 여러 개의, 예를 들면, 1 내지 5개, 예로서, 1, 2, 3, 또는 4개의 아미노산중 하나가 또다른 아미노산에 의해 치환된 화합물이다. 바람직하게, 아미노산은 화학식(I)의 화합물의 2, 3, 4, 5, 8, 10, 11, 13 또는 18번 위치로부터 선택되는 위치에 존재한다.
변이체는 또한 15번 또는 16번 위치에 치환을 포함할 수 있는데, 단, 15번 및 16번 위치, 둘 모두가 치환되고, 그 외의 다른 어떤 위치에서는 변화가 없을 때, 15 및 16은 각각 Val 및 Ile이 아니다.
Z가 Ala-일 경우, 본 발명의 화합물의 변이체는 Ala-가 또다른 아미노산 (특히, 유전자 코드에 의해 코딩된 천연적으로 발생된 아미노산 또는 그의 D-이소폼), 더욱 특히, Ile-, Lys-, Phe-, Val-, Glu-, Asp-, His-, Leu, Arg-, Ser- 및 Trp-기로부터 선택되는 아미노산에 의해 대체된 것을 포함한다. 하나의 측면에서, 아미노산는 Ile-, Lys-, Phe-, Val-, Glu-, Asp-, His-, Leu-, Arg- 및 Ser-기로부터 선택될 수 있다. 그러한 변이체는 US 6,022,851에 기재되어 있는 바와 같이, Z = H2N인 화합물에 잔기를 화학적으로 가함으로써 생산될 수 있다. 아미노산을 화학적으로 가함으로써 아미노산이 L 또는 D 배열(configuration)로 존재하게 된다는 것을 이해할 것이다. 이는 예로서, 상기 언급한 것과 같은 D 형태의 기타 아미노산 이외에도 D-Ala를 포함한다.
유도체
본 발명의 화합물의 유도체(변이체 포함)는 본 발명의 화합물의 하나 이상의 아미노산 측쇄가 예를 들면, 에스테르화, 아미드화 또는 산화에 의해 변형된 것이 다.
본 발명의 화합물의 유도체는 액타가르딘의 카복시 작용기들 중 하나, 특히 C-말단에서의 모노아미드 유도체일 수 있다. 더욱 특히, 유도체는, 본 발명의 화합물의 C-말단이 식 -COR이고, 여기서, R은 -NR1R2 기를 나타내며, 여기서, R1 R2는 독립적으로
(i) 수소;
(ii) 식 -(CH2)n-NR3R4(여기서, n은 정수 2 내지 8을 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타내거나, R3 및 R4는 함께 -(CH2)3-, -(CH2)4-, (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- 또는 -(CH2)5- 기를 나타낸다)의 기를 나타내거나;
R1 R2는 인접한 질소 원자와 함께,
(a) (C1-C4)알킬;
(b) (C5-C7)-사이클로알킬;
(c) 피리딜;
(d) -(CH2)p-NR5R6(여기서, p는 정수 1 내지 8을 나타내고, R5 R6은 독립적으로 수소 또는 (C1-C4)알킬을 나타낸다);
(e) 피페리디닐;
(f) 치환된 피페리디닐(여기서, 치환된 피페리디닐은, (C1-4)알킬인 N-치환기를 보유한다);
(g) 벤질; 및
(h) 치환된 벤질(여기서, 페닐 부분은 클로로, 브로모, 니트로, (C1-C4)알킬 및 (C1-C4)알콕시로부터 선택되는 1개 또는 2개의 치환기를 보유한다)로부터 선택되는 치환기로 4번 위치에서 치환될 수 있는 피페라진 부분을 나타내는 화합물일 수 있다.
하나의 실시태양에서, 식 -COR에서의 R은 -NR1R2 기를 나타내고, 여기서, R1 및 R2는 독립적으로 수소, 식 -(CH2)n-NR3R4(여기서, n은 정수 2 내지 8을 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타내거나, R3 및 R4는 함께 -(CH2)3-, -(CH2)4-, (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- 또는 -(CH2)5- 기를 나타낸다)의 기를 나타내거나, R1 R2는 인접한 질소 원자와 함께, (C1-C4)알킬, (C5-C7)-사이클로알킬, 피리딜, 벤질, 및 치환된 벤질(여기서, 페닐 부분은 클로로, 브로모, 니트로, (C1-C4)알킬 및 (C1-C4)알콕시로부터 선택되는 1개 또는 2개의 치환기를 보유한다)로부터 선택되는 치환기로 4번 위치에서 치환될 수 있는 피페라진 부분을 나타낸다.
추가로, 유도체는 내부 잔기 측쇄의 카복시 작용기, 예컨대, 잔기 Glu11의 것이 -COOH로부터 -COOR5(여기서, R5는 수소, (C1-C4)알킬 또는 (C1-C4)알콕시 (C2-C4)알킬을 나타낸다)의 기로 변형된 화합물을 포함할 수 있다.
본 발명의 화합물의 N-말단 유도체는 N-말단 아미노 기 -NH2가 대신 -NHR6(여기서, R6은 C1-C4알킬을 나타낸다)의 기인 것일 수 있다.
용어 "(C1-C4)알킬"은 1 내지 4개 탄소 원자의 직쇄형 또는 분지쇄형의 알킬 쇄, 예로서, 메틸, 에틸, 프로필, 1-메틸에틸, 부틸, 1-메틸프로필 또는 1,1-디메틸에틸을 나타내는 반면, 용어 "(C2-C4)알킬"은 2 내지 4개 탄소 원자의 직쇄형 또는 분지쇄형의 알킬 쇄, 예로서, 에틸, 프로필, 1-메틸에틸, 부틸, 1-메틸프로필 또는 1,1-디메틸에틸을 나타낸다. 용어 "(C5-C7)사이클로알킬"은 사이클로펜틸, 사이클로헥실 및 사이클로헵틸로부터 선택되는 사이클로알킬 기를 나타낸다.
용어 "(C1-C4)알콕시"는 1 내지 4개 탄소 원자의 직쇄형 또는 분지쇄형의 알콕시 쇄, 예로서, 메톡시, 에톡시, 프로폭시, 1-메틸에톡시, 부톡시, 1-메틸프로폭시 및 1,1-디메틸에톡시를 나타낸다.
본 발명에 따른 유도체는 EP-0195359(그의 개시 내용이 본원에서 참고로 인 용된다)에서 액타가르딘의 유도체 제조를 위해 기재된 방법에 따라 제조될 수 있다.
추가의 실시태양
유도체가, C-말단이 식 -COR이고, 여기서, R은 -NR1R2 기를 나타내는 화합물일 경우, 몇몇 실시태양에서, R1은 수소이고, R2는 식 -(CH2)n-NR3R4(여기서, n은 정수 2 내지 8을 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타내거나, R3 및 R4는 함께 -(CH2)3-, -(CH2)4-, (CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- 또는 -(CH2)5- 기를 나타낸다)의 기를 나타낸다. 이들 실시태양에서, R3 및 R4는 바람직하게 수소 또는 (C1-C4)알킬을 나타낸다. 더욱 바람직하게, R3 및 R4는 (C1-C2)알킬, 예컨대, 메틸을 나타낸다. 정수 n은 바람직하게 2 내지 5일 수 있고, 더욱 바람직하게 2 내지 4, 예컨대, 3일 수 있다.
다른 실시태양에서, R1 R2는 인접한 질소 원자와 함께 피페라진 부분을 나타낸다. 4번 위치의 N-치환기는 바람직하게
(a) (C1-C4)알킬;
(b) (C5-C7)-사이클로알킬,
(d) -(CH2)p-NR5R6(여기서, p는 정수 1 내지 8을 나타내고, R5 R6은 독립적으로 수소 또는 (C1-C4)알킬을 나타낸다);
(e) 피페리디닐; 및
(f) 치환된 피페리디닐(여기서, 치환된 피페리디닐은, (C1-4)알킬인 N-치환기를 보유한다)로부터 선택될 수 있다.
피페리디닐 및 치환된 피페리디닐 기는 바람직하게 4번 위치에 그의 질소 원자를 갖는다.
N-치환기는 더욱 바람직하게,
(d) -(CH2)p-NR5R6(여기서, p는 정수 1 내지 8을 나타내고, R5 R6은 독립적으로 수소 또는 (C1-C4)알킬을 나타낸다); 및
(f) 치환된 피페리디닐(여기서, 치환된 피페리디닐은, (C1-4)알킬인 N-치환기를 보유한다)로부터 선택될 수 있다.
N-치환기가 -(CH2)p-NR5R6일 경우, 이때 R5 R6은 바람직하게 (C1-C4)알킬일 수 있고, 더욱 바람직하게는 (C1-C2)알킬, 예컨대, 메틸일 수 있다. 정수 p는 바람직하게 1 내지 4, 예컨대, 3이다.
N-치환기가 치환된 피페리디닐일 경우, 이때, N-치환기는 바람직하게 (C1- C2)알킬, 예컨대, 메틸이다. 상기 언급한 바와 같이, N은 바람직하게 4번 위치에 존재한다.
핵산
본 발명의 핵산은 DNA인 것이 바람직할 수 있지만, DNA 또는 RNA일 수 있다. 본 발명의 핵산은 단일 또는 이중 가닥일 수 있다. 하나의 측면에서, 본 발명은 클러스터 폴리펩티드를 코딩하는 단리된 핵산을 제공한다. 또다른 측면에서, 본 발명은 전구체 폴리펩티드, 또는 그의 변이체 또는 단편을 코딩하는 단리된 핵산을 제공한다.
추가의 측면에서, 본 발명은, 본원에 개시된 유전자간 영역을 포함하는 단편을 비롯한, 서열 번호 100 또는 서열 번호 200 모두 또는 그의 단편을 포함할 수 있는 단리된 핵산을 제공한다. 그러한 영역은 본 발명의 클러스터 폴리펩티드 또는 전구체 폴리펩티드의 발현을 위한 프로모터 또는 기타 조절 요소를 포함할 수 있다.
당업자에 의해 25개의 뉴클레오티드가 본원에 개시된 바와 같이 특정 유전자 또는 유전자 클러스터, 또는 그의 부분 서열에 특이적인 충분한 갯수의 뉴클레오티드로서 인지된다. 따라서, 단편은 서열 번호 100 또는 서열 번호 200의 단편, 또는 유의적인 서열 동일성을 갖는 그의 변이체로서, 뉴클레오티드 길이가 25개 이상, 예컨대, 30개 이상, 예컨대, 50개 이상, 예컨대, 100개 이상, 예컨대, 250개 이상인 것을 포함한다.
상기 유전자간 서열의 변이체인 프로모터 또한 포함되며, 특이적인 유전자간 서열(또는 그의 일부분)은 바람직한 실시태양이다. orf, 유전자, 핵산, 폴리펩티드 또는 프로모터의 바람직한 실시태양이 특정 서열과 관련하여 정의되는 모든 경우에 있어서, 보다 넓은 의미로 본 발명은 상기 특정 서열의 변이체를 갖는 실시태양도 포함하도록 하고자 한다.
특정 핵산(기준 핵산)과 관련하여 본원에서 사용되는 용어 "변이체"는 기준 핵산의 서열과 상이한 서열을 갖지만, 그의 보체이거나, 기준 핵산 또는 그의 보체, 또는 기준 핵산 또는 그의 보체의 단편과 유의적인 핵산 서열 동일성을 나타내거나, 엄격한 조건하에 그와 혼성화를 나타내는 임의 핵산; 또는 기준 핵산, 또는 상기 핵산의 단편에 의해 코딩된 아미노산 서열과 유의적인 아미노산 서열 동일성을 갖는 아미노산 서열을 코딩하는 임의 핵산을 의미한다. 용어 "변이체"는 또한 오직 유전자 코드의 축퇴성에만 기인하여 서로 상이하고, 그러므로, 유추되는 아미노산 서열이 동일한 것인, 아미노산 서열을 코딩하는 핵산도 지칭한다. 본 발명의 변이체 핵산은 추가로 하기와 같이 정의된다. 본 발명의 변이체 핵산이 변이체인 그의 서열을 대신하여 본원에서 동정된 유전자 클러스터 내로 도입되고, 재조합 단편이 란티바이오틱 생산에 적합한 조건(예컨대, 실시예에 제시되는 것과 같은 조건)하에 적합한 숙주 세포 내로 도입될 경우, 이때, 하나 이상의 란티바이오틱 활성(특히, 항생제 활성)을 갖는 분자가 생산될 것이다. 바람직하게, 생산은 고도한세포 밀도로 존재하도록 조절될 것이다.
유의적인 핵산 서열 동일성은 바람직하게 50% 이상, 더욱 바람직하게 60% 이 상, 70% 이상, 80% 이상 또는 90% 이상이고, 더욱 더 바람직하게는 95% 이상, 98% 이상 또는 99% 이상이다. 유의적인 핵산 서열 동일성은 바람직하게 변이체 핵산(또는 그의 일부분)과, 기준 핵산의 30개 이상의 잔기인 단편, 더욱 바람직하게, 60개 이상, 90개 이상 또는 120개 이상의 잔기인 단편, 더욱 더 바람직하게는, 180개 이상, 240개 이상 또는 300개 이상의 잔기인 단편, 더욱 바람직하게, 전체 기준 핵산 사이에서 제시된다.
"핵산 서열 동일성 퍼센트(%)"는 비교시 서열의 뉴클레오티드 잔기와 동일한, 후보 서열의 뉴클레오티드 잔기의 비율로서 정의된다. 본원에서 사용되는 동일성 값은 오버랩 스팬 및 오버랩 분획이 각각 1 및 0.125로 설정되고, 디폴트 파라미터로 설정된 WU BLAST-2의 BLASTN 모듈에 의해 얻을 수 있다.
본 발명에서 사용되는 프로모터의 변이체와 관련하여, 핵산 서열 동일성은 바람직하게, 30개 이상의 잔기, 더욱 바람직하게, 40개 또는 50개 이상의 잔기, 더욱 더 바람직하게, 60개 이상의 잔기의 서열에 걸쳐 평가된다.
본원에서 정의되는 "엄격한 조건" 또는 "고도로 엄격한 조건"은 (1) 세척을 위해 낮은 이온 강도와 고온을 이용하는 것, 예를 들면, 50℃에서 0.015 M 염화나트륨/0.0015 M 시트르산나트륨/0.1% 황산도데실나트륨을 이용하는 조건; (2) 혼성화시 변성화제, 예로서, 포름아미드, 예를 들면, 42℃에서 750mM 염화나트륨, 75mM 시트르산나트륨이 포함된, 0.1% 우혈청 알부민/0.1% 피콜(Ficoll)/0.1% 폴리비닐피롤리돈/50mM 인산나트륨 완충액(pH 6.5)과 함께 50% (v/v) 포름아미드를 사용하는 조건; 또는 (3) 42℃에서 50% 포름아미드, 5 x SSC(0.75 M NaCl, 0.075 M 시트르산 나트륨), 50mM 인산나트륨(pH 6.8), 0.1% 피로인산나트륨, 덴하트(Denhardt's) 용액, 초음파처리된 연어 정자 DNA (50g/ml), 0.1% SDS, 및 10% 덱스트란 설페이트를 사용하고, 42℃에서 0.2 x SSC(염화나트륨/시트르산나트륨)에서, 그리고 55℃에서 50% 포름아미드로 세척한 후, 55℃에서 EDTA가 포함된 0.1 x SSC를 이용한 고엄격 세척을 수행하는 조건으로 간주될 수 있다.
관심의 대상이 되는 핵산이 프로모터 또는 조절 서열과 "작동 결합" 상태로 있다고 언급되는 경우, 이는 프로모터/조절 서열이 적절한 발현 시스템에서 관심의 대상이 되는 핵산의 전사를 지시할 수 있고, 관심의 대상이 되는 핵산은 번역을 위해 정확한 리딩 프레임에 존재한다는 것을 의미한다. 바람직하게, 관심의 대상이 되는 핵산이 프로모터/조절 서열과 작동 결합 상태로 있는 경우, 관심의 대상이 되는 핵산의 전사체는 적절한 발현 시스템에서 관심의 대상이 되는 핵산에 의해 코딩되는 폴리펩티드를 발현시키기 위한 것으로서, 적절하게 위치하는 리보좀 결합 부위를 포함한다. 예를 들면, 문헌 ([Sambrook et al. (1989)] 및 [Ausubel et al. 25 (1995)]를 참조할 수 있다.
핵산이 "단리된" 것으로 지칭되는 경우, 이는 보통 악티노플레인스 가르바디넨시스 및/또는 악티노플레인스 리구리애에 존재하는 다른 핵산 중 일부 또는 그 모두, 특히, 본원에서 동정된 유전자 클러스터 세그먼트 외의 핵산 중 일부 또는 그 모두로부터 실질적으로 또는 완전하게 단리된 것을 의미할 수 있다.
상기 개시 내용에 비추어 볼 때, 본 발명이 액타가르딘 또는 액타가르딘 B 생합성 유전자 클러스터를 코딩하는 뉴클레오티드 서열 또는 뉴클레오티드 서열을 제공한다는 것을 이해할 것이다. 따라서, 전체 유전자 클러스터 또는 25개 이상의인접 뉴클레오티드인 그의 일부분이 매우 다양한 용도로 사용될 수 있고, 상기 용도로는 액타가르딘 또는 액타가르딘 B의 발현; 관련 분자 등에 대하여 다른 유기체를 스크리닝하는 프로브로서의 용도; 유전자 침묵화를 유도하는 용도 등을 포함하나, 이에 한정되는 것은 아니다.
발현 작제물
본 발명의 추가의 측면에서, 프로모터에 작동 가능하게 연결된, 본 발명의 클러스터 폴리펩티드 또는 란티바이오틱 폴리펩티드를 코딩하는 핵산을 포함하는 발현 작제물을 제공한다.
추가의 측면에서, 발현 작제물 세트를 제공한다. 발현 작제물 세트는 본 발명의 2개 이상의 폴리펩티드 코딩 서열, 및 상기 서열의 발현에 적합한 1 이상의 프로모터를 포함한다. 프로모터(들)는, 폴리펩티드 유전자가 천연적으로 그와 함께 결합되어 있는 프로모터일 수 있거나(또는 변이체일 경우, 변이체가 유도되는 유전자의 프로모터), 숙주 세포에서 기능성인, 구성적 또는 유도성 프로모터일 수 있다. 따라서, 프로모터는 표 1 및 2에 열거된 오픈 리딩 프레임들 중 어느 것의 상류에 있는 서열 번호 100 또는 서열 번호 200의 유전자간 영역을 포함한다.
프로모터(들)는 발현 작제물 세트의 핵산에 작동 가능하게 연결될 것이다. "작동 가능하게 연결된다"라는 것은 프로모터가 적절한 발현 시스템에서 관심의 대상이 되는 핵산의 전사를 지시할 수 있고, 관심의 대상이 되는 핵산은 번역을 위해 정확한 리딩 프레임에 존재한다는 것으로 이해될 것이다. 바람직하게, 관심의 대상 이 되는 핵산이 프로모터/조절 서열과 작동 결합 상태로 있는 경우, 관심의 대상이 되는 핵산의 전사체는 적절한 발현 시스템에서 관심의 대상이 되는 핵산에 의해 코딩되는 폴리펩티드를 발현시키기 위한 것으로서, 적절하게 위치하는 리보좀 결합 부위를 포함한다. 예를 들면, 문헌 ([Sambrook et al. (1989)] 및 [Ausubel et al. 25 (1995)]를 참조할 수 있다.
본 발명에 따른 발현 작제물 세트는 상기 정의된 바와 같은 본 발명의 전구체 및 클러스터 폴리펩티드를 코딩하는 유전자의 다수의 치환을 포함한다. 본 발명의 다양한 측면에서, 세트는 적어도 LanA 유전자를 포함할 것이다. 그러한 세트의 일례로는 하기의 "세트 1" 내지 "세트 7"로서 기재되며, 단, 이들 세트는 단순히 예시적인 것이며, 제한적인 것으로 이해되어서는 안된다.
세트 1: 전구체 폴리펩티드, 바람직하게는, 본 발명의 화합물로 전환될 수 있는 전구체 폴리펩티드를 코딩하는 LanA 유전자와, LanM 폴리펩티드를 코딩하는 LanM 유전자. LanM 폴리펩티드는 바람직하게 서열 번호 120의 LanM, 또는 그의 변이체, 또는 서열 번호 213의 LanM, 또는 그의 변이체이다.
세트 2: 전구체 폴리펩티드, 바람직하게는, 본 발명의 화합물로 전환될 수 있는 전구체 폴리펩티드를 코딩하는 LanA 유전자와, LanR 폴리펩티드를 코딩하는 LanR 유전자. LanR 폴리펩티드는 바람직하게 서열 번호 122의 LanR, 또는 그의 변이체, 또는 서열 번호 216의 LanR, 또는 그의 변이체이다.
세트 3: 전구체 폴리펩티드, 바람직하게는, 본 발명의 화합물로 전환될 수 있는 전구체 폴리펩티드를 코딩하는 LanA 유전자와, LanM 폴리펩티드를 코딩하는 LanM 유전자와, LanR 폴리펩티드를 코딩하는 LanR 유전자. LanM 폴리펩티드는 바람직하게 서열 번호 120의 LanM, 또는 그의 변이체, 또는 서열 번호 213의 LanM, 또는 그의 변이체이다. LanR 폴리펩티드는 바람직하게 서열 번호 122의 LanR, 또는 그의 변이체, 또는 서열 번호 216의 LanR, 또는 그의 변이체이다.
세트 4: LanO 폴리펩티드를 코딩하는 LanO 유전자와 함께, 세트 3의 유전자. LanO 폴리펩티드는 바람직하게 서열 번호 122의 LanO, 또는 그의 변이체, 또는 서열 번호 215의 LanR, 또는 그의 변이체이다.
세트 5: LanT 폴리펩티드를 코딩하는 LanT 유전자와 함께, 세트 3 또는 세트 4의 유전자. LanT 폴리펩티드는 바람직하게 서열 번호 123의 LanT, 또는 그의 변이체, 또는 서열 번호 214의 LanT, 또는 그의 변이체이다.
세트 6: 서열 번호 116 내지 127의 유전자 또는 그의 변이체.
세트 7: 서열 번호 206 내지 220의 유전자 또는 그의 변이체.
하나의 측면에서, 세트는, 모두가 1xx 폴리펩티드를 코딩하거나, 모두가 2xx 폴리펩티드를 코딩하는 서열을 포함할 것이다. 그러나, 1xx 및 2xx 폴리펩티드, 둘 모두로 구성된 세트가 본 발명으로부터 제외되는 것은 아니다.
재조합 발현 벡터
또다른 측면에서, 본 발명의 하나 이상 발현 작제물을 포함하는 재조합 벡터를 제공한다. 대체 측면에서, 본 발명의 발현 작제물 세트를 포함하는 재조합 벡터 세트를 제공한다. 박테리아 내로의 도입을 위한 핵산을 포함하는 적합한 벡터를 선택하거나 작제할 수 있으며, 이는 필요하다면, 추가의 프로모터, 종결 인자 단편, 인핸서 요소, 마커 유전자 및 적절한 기타 요소를 비롯한, 적절한 추가 조절 요소를 함유한다. 벡터는 적절하게 플라스미드, 바이러스성, 예컨대, 파지, 또는 파지미드일 수 있다. 추가의 상세한 설명을 위해 예를 들면, 문헌 [Sambrook et al (1989) Molecular Cloning, A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor]를 참조할 수 있다. 예를 들면, 핵산 작제물 제조, 돌연변이 유발, 서열 분석, 세포 내로 DNA 도입, 및 유전자 발현, 및 단백질 분석에서 핵산을 조작하는 공지된 다수의 기법 및 프로토콜은 문헌 [Ausubel et al. (1995) Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995)]에 상세히 기재되어 있다. 스트렙토마이세스 종과 관련된 이들 기법 사용에 관한 다수 측면들은 문헌 ([Hopwood et al (1985) Genetic manipulation of Streptomyces a laboratory manual (Norwich: John Innes Foundation)] 및 [Practical Streptomyces Genetics (2000) Kieser T. et al., The John Innes Foundation p.386])에 기재되어 있다. (Sambrook et al, Ausubel et al, Hopwood et al 및 Kieser et al.)의 개시 내용은 모두 이러한 목적 및 모든 다른 목적을 위해 참고로 인용된다.
발현 카세트
또다른 측면에서, 본 발명자들은 액타가르딘 B의 란티바이오틱 유도체를 생산하고 스크리닝하는데 유용한 벡터 시스템을 개발하게 되었다. 이는 발현 카세트 시스템을 생산하기 위해 이는 서열 번호 1, 11 또는 212를 코딩하는 LanA 유전자 내로 하나 이상의 제한 엔도뉴클라제를 도입함으로써 달성된다. 따라서, 또다른 측 면에서, 본 발명은 액타가르딘 B 전구체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 재조합 DNA 카세트를 제공하는데, 여기서, 상기 서열은
코딩 서열의 N-말단 코딩 영역에 있거나 그에 인접한 제1 제한 부위;
경우에 따라, 제1 제한 부위 하류 및 코딩 서열 내의 제2 제한 부위; 및
코딩 서열의 C-말단 코딩 영역에 있거나 그에 인접한 제3 제한 부위
(여기서, 상기 제한 부위들 중 적어도 하나는 서열 번호 200으로 제시된 LanA 코딩 서열내 존재하지 않는다)를 포함한다.
추가의 측면에서, 액타가르딘 전구체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 재조합 DNA 카세트를 제공하는데, 여기서, 상기 서열은
코딩 서열의 N-말단 코딩 영역에 있거나 그에 인접한 제1 제한 부위;
경우에 따라, 제1 제한 부위 하류 및 코딩 서열 내의 제2 제한 부위; 및
코딩 서열의 C-말단 코딩 영역에 있거나 그에 인접한 제3 제한 부위;
(여기서, 상기 제한 부위들 중 적어도 하나는 서열 번호 100으로 제시된 LanA 코딩 서열내 존재하지 않는다)을 포함한다.
일반적으로, 2개 또는 3개의 모든 부위는 서로서로 상이할 것이다. 또한, 카세트가 벡터에 의해 운반될 때, 상기 부위는 당해 벡터에 대하여 독특한 것이 바람직할 수 있다.
바람직한 측면에서, 비자연발생적으로 생성된 제한 효소 부위는 제2 제한 부위이고, 서열 번호 1 또는 서열 번호 4의 코딩 서열의 5번 내지 16번 코돈 사이, 예로서, 6번 내지 15번 코돈 사이에 위치한다.
카세트는 또한 바람직하게 LanA 리더 서열 및 LanA 프로모터를 포함할 것이고, 특히, 클러스터 유전자가 등가의 숙주 세포 유전자 손실을 보완하기 위하여 필요한 경우에는 하나 이상 클러스터 유전자도 추가로 포함할 수 있다.
상기 기술된 본 발명의 카세트는 다양한 방식으로 조작될 수 있다. 예를 들면, 제1 제한 부위와 제2 제한 부위 사이, 제1 제한 부위와 제3 제한 부위 사이, 또는 제2 제한 부위와 제3 제한 부위 사이의 카세트를 절단함으로써 얻은 단편을, 란티바이오틱 A 변이체를 코딩하는 변이체 코딩 서열로 대체할 수 있다. 따라서, 본 발명은 코딩 서열의 코딩 영역 내 1 내지 15개의 뉴클레오티드 치환을 갖는, 본 발명의 카세트의 변이체를 제공한다.
상기 변이체 생산의 중간체로서 제1 제한 부위와 제2 제한 부위 사이, 제1 제한 부위와 제3 제한 부위 사이, 또는 제2 제한 부위와 제3 제한 부위 사이의 서열은 보다 큰 스터퍼(stuffer) 단편에 의해 대체될 수 있다.
또다른 측면에서, 예를 들면, 숙주 세포의 항균 성질을 평가하기 위해 란티바이오틱 유도체를 코딩하는 카세트를 사용하여 유도체를 발현시키도록 숙주 세포를 형질전환시킬 수 있다.
하나의 측면에서, 다수의 발현 카세트를 제조하여 상이한 유도체의 라이브러리를 제공하고, 이어서, 활성에 대하여 스크리닝할 수 있다.
본 발명의 발현 카세트는 당업계에서 사용되는 것으로서, 숙주 세포에서 유전자를 발현시키기 위해 사용되는 임의의 클로닝과 발현 벡터에 기초할 수 있다. 그러한 벡터는 하나 이상의 복제 기점을 포함할 것이며, 이는 감온성일 수 있다. 벡터는 선별가능한 마커, 예로서, 클로람페니콜 아세틸 트랜스퍼라제 유전자, 에리트로마이신 내성 유전자, 아프라마이신 내성 유전자 또는 테트라사이클린 내성 유전자를 포함할 수 있다. 벡터는 또한 LanA 유전자 클러스터 밖의, 숙주 세포내 존재하는 게놈 서열에 상동성인 표적 부위를 포함할 수 있다. 그러한 벡터를 사용하여 카세트를, 표적 부위에 상동성인 게놈 서열 내로 통합시킬 수 있다.
발현 카세트는 또한 LanA 유전자 또는 그의 유도체 이외에, 하나 이상 클러스터 유전자를 포함할 수 있다. 숙주 세포는, 그중의 LanA 유전자가 상기 클러스터 유전자를 불활성화시키기도 하는 방식으로 불활성화된 ΔLanA 숙주 세포일 경우(예컨대, 문헌 [Altena et al, 2000]에 개시된 균주의 경우), 이러한 유전자 또는 등가의 유전자가 발현 카세트에 제공하는 것이 바람직할 수 있다.
본원에서 사용되는 바, "N-말단 코딩 영역에 있거나 그에 인접한다"라는 것은 제한 부위의 제1 염기가 LanA 리더 서열의 ATG 코돈으로부터 잔기 6개 만큼의 상류로부터 프로펩티드의 제1 코돈으로부터 코돈 6개 이하 만큼의 하류까지의 위치에 위치한다는 것을 의미한다. 바람직하게, 제한 부위의 제1 염기는 잔기 12개, 바람직하게는, 6개 만큼의 상류로부터 프로펩티드를 코딩하는 서열의 제1 코돈으로부터 잔기 6개 만큼의 하류까지의 위치에 위치한다.
하나의 측면에서, 제1 제한 부위는 BglII 부위이다.
유사하게, "C-말단 코딩 영역에 있거나 그에 인접한다"라는 것은 제한 부위의 제1 염기가 프로펩티드의 종결 코돈의 뉴클레오티드를 1개 이상을 포함하거나, 제한 부위의 5' 또는 3' 뉴클레오티드가 각각 종결 코돈으로부터 잔기 12개, 바람 직하게는, 6개 만큼의 하류 또는 상류에 존재한다는 것을 의미한다.
하나의 측면에서, 제3 제한 부위는 AvrII 부위이다.
존재한다면 제2 제한 부위는 제1과 제3 제한 부위 사이에 존재하게 될 것이다. 바람직하게, 상기 제한 부위는 프로펩티드 코딩 서열의 5번 내지 16번 코돈, 바람직하게, 8번 내지 16번 코돈 사이에 존재하는 뉴클레오티드를 1개 이상 포함한다. 첨부된 실시예에서, BsrG1 부위는 ActA-코딩 서열의 6번 내지 7번 코돈을 변경시킴으로써 도입되었다. 그러나, 다른 변화 또한 본 발명에 의해 고려된다.
또한 1 초과의 변화도 도입함으로써 발현 카세트가 제1와 제3 제한 부위 사이에 2개 이상의 부위를 포함하도록 할 수 있다.
카세트는 2개 또는 3개의 비자연발생적으로 생성된 제한 부위를 포함할 수 있다. 첨부된 실시예에서, 보통은 3개 부위 모두가 서열 번호 100에 의해 코딩되는 ActA 서열내 존재하지 않는다.
발현 카세트는 본원 하기에서 추가로 논의되는 바와 같이, 란티바이오틱 유도체의 신속한 생산을 간소화시킨다.
하나의 측면에서, 제1 부위와 제2 부위 사이, 제1 부위와 제3 부위 사이, 또는 제2 부위와 제3 부위 사이의 영역은 스터퍼 단편으로 대체될 수 있다. 제1 부위와 제3 부위 사이에 2개 이상의 부위가 존재할 경우, 그러한 부위의 임의 쌍 사이에 있는 영역 또한 스터퍼 단편으로 대체될 수 있다. 스터퍼 단편은 그가 대체하는서열보다 더 큰 DNA 조각이다. 스터퍼 단편 50 내지 5000개의 뉴클레오티드 크기, 예를 들면, 약 500 내지 2000개의 뉴클레오티드 크기일 수 있다. 이들 스터퍼 DNA 단편을 도입하는 것이 갖는 가치는, 상기 영역을 란티바이오틱 코딩 올리고뉴클레오티드로 대체할 때 플라스미드 크기가 유의적으로 감소한다는데 있다. 따라서, 생성된 플라스미드는 임의의 최소 군집의 비제한적 플라스미드로부터 용이하게 정제될 수 있고, 이로써, 임의의 배경도 제거할 수 있다.
본 발명의 카세트를 사용하여 벡터내 ActA 서열에 특이적인 변화를 도입할 수 있는데, 이는 이후 란티바이오틱 발현을 위해 숙주 세포 내로 도입될 수 있다. 이를 달성하기 위하여, 서열을 바람직하게는 LanA(예컨대, ActA 또는 LigA) 리더 서열에 작동 가능하게 연결시키고, 이를 다시 LanA 프로모터(예컨대, ActA 또는 LigA)에 작동 가능하게 연결시킨다. 추가로 또는 별법으로서, 카세트를 포함하는 벡터는 또한 LanR 유전자를 포함할 수 있다. LanR 유전자는 란티바이오틱 A 코딩 서열의 하류에 위치하고, 란티바이오틱 A 코딩 서열과 직렬로 위치할 것이다.
발현 라이브러리
본 발명의 발현 카세트를 사용하여 란티바이오틱 코딩 유전자 라이브러리를 제공할 수 있다. 그러한 라이브러리는, 카세트 내의, 제1 제한 부위와 제2 제한 부위 사이, 제1 제한 부위와 제3 제한 부위 사이, 또는 제2 제한 부위와 제3 제한 부위 사이로 복수의 서열을 도입함으로써 제조될 수 있는데, 상기 복수의 서열들 각각은 프로펩티드는 서열 번호 100 또는 200의 프로펩티드 일부와 비교하여 1 내지 15개, 예를 들면, 1 내지 10개, 바람직하게는, 1 내지 6개, 예를 들면, 1 내지 3개의 뉴클레오티드 변화를 갖는 것 이외에는, 상응하는 ActA 또는 LigA 서열과 일치한다. 바람직하게, 그러한 변화가 서열에 의해 코딩되는 단백질을 변화시킨다. 그 러나, 비-코딩 변화를 제외시키는 것은 아니다.
라이브러리는 본 발명의 추가의 측면을 형성한다. 그러한 라이브러리는 발현 카세트의 란티바이오틱 A 코딩 서열의 변이체인, 10 내지 100,000개, 예로서, 10 내지 10,000개, 예를 들면, 10 내지 1,000개의 상이한 코딩 서열을 포함할 수 있다.
란티바이오틱 유도체를 코딩하는 발현 카세트는 란티바이오틱 발현을 위해 숙주 세포 내로 도입될 수 있다.
하나의 실시태양에서, 라이브러리는 숙주 세포 내로 도입될 수 있고, 콜로니는 단리되고/거나 항균 활성에 대하여 스크리닝될 수 있다. 그러한 활성을 나타내는 개개의 콜로니에 의해 발현된 란티바이오틱 A의 서열을 측정할 수 있다. 란티바이오틱 A가 활성을 나타내는 경우, 본 발명은 추가로 본 발명의 방법에 의해 수득된 란티바이오틱을 제공한다.
숙주 세포
2가지 주요 유형의 숙주 세포가 본 발명에 포함된다. 첫번째 유형의 숙주 세포는 란티바이오틱 생산 숙주 세포이다. 별법으로, 숙주 세포는 비생산자 세포일 수 있고, 즉, LanA 폴리펩티드 생산에 필요한 LanA 유전자 또는 이와 관련된 클러스터 유전자를 함유하지 않는다.
하나의 실시태양에서, 본 발명은 본 발명의 발현 작제물 세트로 형질전환된 숙주 세포를 제공한다. 작제물 세트는 상기 정의된 세트 1 내지 7중 어느 하나일 수 있거나, 전구체 및 클러스터 폴리펩티드-코딩 핵산의 임의의 다른 조합에 기초 한 세트일 수 있다. 또다른 실시태양에서, 숙주 세포는 본 발명의 발현 카세트로 형질전환될 수 있다.
추가의 실시태양에서, 각각 본 발명의 상이한 발현 카세트를 포함하는, 숙주 세포 라이브러리를 제공한다.
란티바이오틱 생산 숙주 세포
하나의 실시태양에서, 숙주 세포는 란티바이오틱 생산 숙주 세포일 수 있다. 란티바이오틱 생산 숙주 세포는, LanA 유전자를 포함하는 발현 작제물이 임의의 클러스터 유전자의 부재하에 세포 내로 도입되었다면, 그가 발현되고 LanA 폴리펩티드가 생산되는 것이다. 그러한 세포로는 임의의 B형 란티바이오틱 생산 세포, 예로서, 란티바이오틱을 생산하는 바실러스(bacillus), 악티노마이세트(actinomycete) 또는 스트렙토마이세트(streptomycete)(예컨대, 스트렙토마이세스 리비단스(S. lividans) 또는 스트렙토마이세스 코엘리컬러(S. coelicolor))의 임의의 균주를 포함한다. 그러한 세포의 일례로는 신나마이신 생산 숙주 세포(스트렙토마이세스 신나모뉴스 신나모뉴스(Streptomyces cinnamoneus cinnamoneus) DSM 40005), 또는 액타가르딘 생산 악티노플레인스 가르바디넨시스 또는 악티노플레인스 리구리애 NCIMB 41362를 포함한다.
본 발명이, -X1-X2-가 -Leu-Val-인 화학식(I)의 화합물 생산에 관한 것인 경우, 숙주 세포는 임의의 추가 변형이 없는 악티노플레인스 리구리애 NCIMB 41362일 수 있다.
하나의 측면에서, 이러한 부류의 숙주 세포는 유전자가 발현되지 않거나 유 전자 산물이 불활성화되도록, 그의 내인성 란티바이오틱 A 유전자 내에 돌연변이를 포함할 수 있다. 그러한 숙주 세포는 숙주 세포의 LanA 유전자를 결실시키거나 돌연변이화시키는 표적화된 상동성 재조합에 의해 수득될 수 있다. 이를 달성하는 방법은 그 자체로서 당업계에 공지되어 있으며, 문헌 [Altena et al, (2000)] 및 WO2005/093069(상기의 개시 내용은 본원에서 참고로 인용된다)에 설명되어 있다. 생성된 숙주 세포를 ΔLanA 숙주 세포로 지칭한다. 하나의 특정 실시태양에서, 숙주 세포는, ligA 유전자가 예를 들면, 돌연변이화 또는 결실, 예컨대, 상동성 재조합에 의해 일어나는 결실에 의해 불활성화된 ΔLanA 악티노플레인스 리구리애 NCIMB 41362 숙주 세포이다. 또다른 실시태양에서, 숙주 세포는 ActA 유전자가 예를 들면, 돌연변이화 또는 결실, 예컨대, 상동성 재조합에 의해 일어나는 결실에 의해 불활성화된 ΔActA 악티노플레인스 가르바디넨시스 숙주 세포이다.
숙주 세포가 lanA 생산에 필요한 클러스터 유전자를 제공하는 경우, 그러한 클러스터 유전자를 제공하는 것이 임의적이기는 하지만, 이러한 유형의 숙주 세포를 다른 클러스터 유전자로 형질전환시키는 것 또한 본 발명에 의해 고려된다.
비생산자 세포
비생산자 세포는 액타가르딘 또는 그의 변이체로, 또는 본 발명의 화합물로 전환될 수 있는 전구체 폴리펩티드를 코딩하는 LanA 유전자의 발현을 통해 상기 산물을 생산할 수 있지만, 단, LanA 유전자가, 전구체 폴리펩티드를 액타가르딘 또는 그의 변이체로, 또는 본 발명의 화합물로 전환시킬 수 있는 발현 작제물 세트의 일부로서 세포 내로 도입된 것인 임의의 숙주 세포일 수 있다.
비생산자 숙주 세포는 박테리아 숙주 세포일 수 있다. 박테리아 숙주 세포로는 악티노마이세트, 또는 스트렙토마이세트, 예컨대, 스트렙토마이세스 리비단스, 스트렙토마이세스 코엘리컬러 또는 스트렙토마이세스 신나모뉴스를 포함한다.
숙주 세포는, 숙주 세포 그 내에서 lanO 유전자가 돌연변이화 또는 결실에 의해 불활성화되어 있는 것(또는 비생산자 세포의 경우에는 존재하지 않는 것), 또는 그 내에서 lanO 유전자의 발현이 예컨대, 2 이상의 유전자 카피 공급에 의해, 또는 숙주 세포에서 발현을 증진시키는 프로모터에 유전자를 연결시킴으로써 증가하는 것일 수 있다. 숙주 세포에서 생산되는 본 발명의 산화된 형태(Y = -S(O))의 화합물 및 환원된 형태(Y = -S-)의 화합물의 상대적인 수준을 변경시키기 위해서는 이러한 방식으로 lanO 유전자를 조절하는 것인 바람직할 수 있다.
본 발명 화합물의 생산
본 발명의 화합물은 예를 들면, LanA 유전자와, 필요하다면, 전구체 폴리펩티드를 산물로 전환시키는데 필요한 관련 클러스터 유전자를 함께 수반하는 숙주 세포에서 재조합 발현 벡터내 수반되는 전구체 폴리펩티드를 코딩하는 발현 작제물의 형태로 핵산의 발현에 의해 생산될 수 있다. 상기 언급한 바와 같이, 본 발명이, -X1-X2-가 -Leu-Val-인 화학식(I)의 화합물 생산에 관한 것인 경우, 숙주 세포는 임의의 추가 변형이 없는 악티노플레인스 리구리애 NCIMB 41362일 수 있다.
발현 카세트, 또는 벡터(들)를 숙주 세포 내로 도입하는 것(특히, 시험관내 도입의 경우)은 일반적으로 제한없이 "형질전환"으로서 지칭될 수 있다. 이는 임의의 이용가능한 기법을 사용할 수 있다. 박테리아 세포의 경우, 적합한 기법으로는 염화칼륨 형질전환, 폴리에틸렌글리콜 보조 형질전환, 전기천공, 접합 및 박테리오파지를 사용하는 형질감염 또는 형질도입을 포함할 수 있다.
하나의 측면에서, 본 발명은 관심의 대상이 되는 핵산을 발현시키기 위하여 숙주 세포(또는 다른 발현시스템)를 제공하고, 상기 숙주 세포를 배양하는 것을 포함하는, 본 발명의 핵산을 발현시키는 방법을 제공한다. 관심의 대상이 되는 핵산은 발현 카세트 내에 존재하는 바, 숙주 세포 배양으로 본 발명의 산물이 생산된다.
바람직하게, 관심의 대상이 되는 핵산은 숙주 세포 배양물이 높은 세포 밀도에 도달하였을 때에만, 더욱 바람직하게, 숙주 세포 배양물이 고정상에 도달하였을 때 또는 그에 근접하게 도달하였을 때에만 실질적으로 발현된다. 고정상에 도달하였거나, 그에 근접하게 도달한 세포 배양물은 1-20 범위의 OD650 값을 가질 수 있다. 세포를 배양하는 공지 방법은 당업계에 잘 알려져 있으며, 예를 들면, 문헌 [(Sambrook et al (1989)], [Ausubel et al (2002)], 및 (특히, 스트렙토마이세스종의 경우) [Kieser et al (2000)])와 같이 잘 알려져 있다. 발현 시스템의 발현 산물을 수집하고, 정제할 수 있다. 단리 방법은 용매 추출 기법, 흡착 수지, 예로서, 소수성 수지 또는 침전 방법, 예로서, 황산암모늄 침전을 사용하여 발효 배지로부터 포획할 수 있다. 정제 방법은 크로마토그래피 기법, 예로서, 이온 교환, 소수성 상호작용, 역상, 순상, 고체상 추출 및 HPLC, 예컨대, 머사시딘 단리에 대하여 US 5,112,806에 기재되어 있는 것을 포함할 수 있다.
세포 배양 이후, 본 발명의 화합물은 숙주 세포 배양물로부터 회수될 수 있 다. 회수된 화합물은 약제학적 조성물 형태로, 임의로는 약제학적으로 허용 가능한 염 형태로 제제화될 수 있다.
숙주 세포가 본 발명의 화합물의 혼합물, 예컨대, Y가 -S- 또는 -S(O)-인 것, 또는 Z가 NH2 또는 Ala-인 것, 또는 4가지 유형 모두의 혼합물을 생산하는 경우, 산물은 예컨대, 액타가르딘 및 Ala-액타가르딘 생산에 대하여 US 6,022,851에 기재되어 있는 바와 같이, 예로서, hplc와 같은 표준 분리 기법을 사용하여 단리될 수 있다.
회수된 화합물은 약제학적 조성물 형태로, 임의로는 약제학적으로 허용 가능한 염 형태로 제제화될 수 있다.
약제학적으로 허용 가능한 염
"약제학적으로 허용 가능한 염"은 염기가 본 화합물의 생물학적 효능과 성질을 보유하고는 생리학적으로 허용 가능한 산 부가염일 수 있다. 그러한 염은 무기산, 예로서, 염산, 브롬화수소산, 황산, 질산, 인산 등으로 형성된 것, 및 유기산, 예로서, 아세트산, 프로피온산, 글리콜산, 피루브산, 옥살산, 말산, 말론산, 숙신산, 말레산, 푸마르산, 타르타르산, 시트르산, 벤조산, 신남산, 만델산, 메탈설폰산, 에탄설폰산, p-톨루엔설폰산, 살리실산 등과 함께 형성된 것을 포함한다.
염은 또한 염기성 염, 예로서, 알칼리 또는 알칼리토 금속 염, 예컨대, 나트륨, 칼륨, 칼슘, 또는 마그네슘 염을 포함한다.
약제학적 조성물
본 발명의 란티바이오틱은 약제학적으로 허용 가능한 담체, 애주번트, 부형제, 희석제, 충전제, 완충제, 방부제, 항산화제, 활택제, 안정화제, 가용화제, 계면활성제(예컨대, 습윤제), 차폐제, 착색제, 향미제, 및 감미제를 포함하나, 이에 한정되지 않는, 당업자에게 잘 알려져 있는, 하나 이상의 다른 약제학적으로 허용 가능한 성분과 함께 제제화될 수 있다. 제제는 추가로 다른 활성제, 예를 들면, 기타 치료제 또는 예방제를 포함할 수 있다. 따라서, 본 발명은 추가로 상기 정의된 바와 같은 약제학적 조성물과, 상기 정의된 바와 같은 1종 이상의 활성 화합물을 당업계에 잘 알려져 있는 하나 이상의 다른 약제학적으로 허용 가능한 성분들, 예컨대, 담체, 애주번트, 부형제와 함께 혼합하여 약제학적 조성물을 제조하는 방법을 제공한다. 개별 단위(예컨대, 정제 등)로 제제화되는 경우, 각각의 단위는 미리 결정된 양(용량)의 활성 화합물을 함유한다.
본원에서 사용되는 "약제학적으로 허용 가능한"이라는 용어는, 타당한 의학적 판단 범주 내에서 과도한 독성, 가려움증, 알레르기 반응, 또는 다른 문제 또는 합병증 없이 당해 피험체(예컨대, 인간)의 조직과 접촉하여 사용하기에 적합하고, 적당한 이익/위험 비를 갖는, 화합물, 성분들, 물질, 조성물, 제형 등에 관련하는 것이다. 각 담체, 애주번트, 부형제 등은 또한 제제의 다른 성분들과 상용성이라는 의미에서 "허용 가능"하여야 한다.
조성물은 임의의 적합한 투여 경로 및 수단용으로 제제화될 수 있다. 약제학적으로 허용 가능한 담체 또는 희석제는 경구, 직장, 비내, 국소(협측 및 설하 포함), 질내 또는 비경우(피하, 근육내, 정맥내, 진피내, 경막내 및 경막외 포함) 투 여에 적합한 제제에 사용되는 것을 포함한다. 제제는 편의상 단위 제형 형태로 제시될 수 있고, 약학 분야에 잘 알려져 있는 임의 방법에 의해 제조될 수 있다. 그러한 방법은 하나 이상의 부속 성분들을 구성하는 담체와 활성 성분들을 회합시키는 단계를 포함한다. 일반적으로 제제는 활성 성분을 액상 담체 또는 미분화된 고체 담체, 또는 둘 모두와 함께 균일하고 밀접하게 회합시킨 후, 필요하다면, 제품으로 성형화하여 제조될 수 있다.
고체 조성물의 경우, 통상의 비독성 고체 담체는 예를 들면, 약제학적 등급의 만니톨, 락토스, 셀룰로스, 셀룰로스 유도체, 전분, 스테아린산 마그네슘, 나트륨사카린, 활석, 글루코스, 수크로스, 탄산마그네슘 등이 포함되며, 이들이 사용될 수 있다. 상기 정의된 바와 같은 활성 화합물은 담체로서 예를 들면, 폴리알킬렌 글리콜, 아세틸레이트 트리글리세리드를 사용함으로써 좌제로 제제화될 수 있다. 액상의 약제학적으로 허용 가능한 조성물은 예를 들면, 상기 정의된 바와 같은 활성 화합물과 임의의 약제학적 애주번트를 담체, 예로서, 물, 염수, 수용성 덱스트로스, 글리세롤, 에탄올 등에 용해시키거나 분산시키는 등을 하여 액제 또는 현탁제로 제조함으로써 제조될 수 있다. 원하는 경우, 투여하고자 하는 약제학적 조성물은 또한 최소량의 비독성 보조제, 예로서, 습윤제 또는 유화제, pH 완충제 등, 예를 들면, 아세트산나트륨, 소르비탄 모노라울레이트, 트리에탄올아민 아세트산나트륨, 소르비탄 모노라울레이트, 트리에탄올아민 올레이트 등을 함유할 수 있다. 그러한 제형을 제조하는 실제 방법은 공지되어 있거나, 당업자에게는 자명할 것이다; 예를 들면, 문헌 ["Remington: The Science and Practice of Pharmacy", 20th Edition, 2000, pub. Lippincott, Williams & Wilkins]을 참조할 수 있다. 어떻든 투여하고자 하는 조성물 또는 제제는 치료하고자 하는 대상의 증상을 완화시키는데 유효한 양으로 다수의 활성 화합물(들)을 함유할 것이다.
0.25 내지 95% 범위의 활성 성분과, 그 잔여량으로는 비독성 담체를 함유하는 제형 또는 조성물이 제조될 수 있다.
경구 투여용의 약제학적으로 허용 가능한 비독성 조성물은 보통 사용되는 부형제, 예를 들면, 약제학적 등급의 만니톨, 락토스, 셀룰로스, 셀룰로스 유도체, 크로스카르멜로오스 나트륨, 전분, 스테아린산 마그네슘, 나트륨사카린, 활석, 글루코스, 수크로스, 탄산마그네슘 등의 혼입에 의해 제조된다. 그러한 조성물은 액제, 현탁제, 정제, 환제, 캡슐제, 분제, 지효성 방출 제제 등의 형태를 취한다. 그러한 조성물은 1%-95% 활성 성분, 더욱 바람직하게는 2-50%, 가장 바람직하게는 5-8%를 함유할 수 있다.
비경구 투여는 일반적으로, 피하, 근육내, 또는 정맥내 주사를 특징으로 한다. 주사제는 통상의 형태인 액상 용액제 또는 현탁제로서, 주사 이전에 액상의 액제 또는 현탁제로 제조되기에 적합한 고체 제형으로서, 또는 에멀젼으로서 제조될 수 있다. 적합한 부형제는 예를 들면, 물, 염수, 덱스트로스, 글리세롤, 에탄올 등이다. 추가로, 원하는 경우, 투여하고자 하는 약제학적 조성물은 또한 최소량의 비독성 보조제, 예로서, 습윤제 또는 유화제, pH 완충제 등, 예를 들면, 아세트산나트륨, 소르비탄 모노라울레이트, 트리에탄올아민 올레이트, 트리에탄올아민 아세트산나트륨 등을 함유할 수 있다.
국소 적용을 위한 약제학적으로 허용 가능한 조성물은 하나 이상의 담체에 현탁되거나 용해된 활성 성분을 함유하는 적합한 연고 또는 겔로 제제화될 수 있다. 본 발명의 화합물의 국소 투여를 위한 담체로는 광유, 액상 바셀린, 백색 바셀린, 프로필렌 글리콜, 폴리옥시에틸렌, 폴리옥시프로필렌 화합물, 유화 왁스 및 물을 포함하나, 이에 한정되는 것은 아니다. 별법으로, 약제학적으로 허용 가능한 조성물은 하나 이상 약제학적으로 허용 가능한 담체에 현탁되거나 용해된 활성 성분을 함유하는 적합한 로션제 또는 크림제로 제제화될 수 있다. 적합한 담체로는 광유, 소르비탄 모노스테아레이트, 폴리소르베이트 60, 세틸 에스테르 왁스, 세테아릴 알코올, 2-옥틸도데카놀, 벤질 알코올 및 물을 포함하나, 이에 한정되는 것은 아니다.
상기의 비경구용 또는 국소용 조성물에 함유되는 활성 화합물의 비율은 그의 특이적인 성질 뿐만 아니라, 화합물의 활성과 피험체의 필요에 고도로 의존적이다. 그러나, 활성 성분은 0.1% 내지 10% w/w의 비율로 사용될 수 있고, 조성물이 고체이고, 이후 상기 비율로 희석되는 것이라면, 상기 비율은 이보다 높을 것이다. 바람직하게, 조성물은 용액내 0.2-2% w/w의 활성 성분을 포함할 것이다.
적합한 담체, 애주번ㅌ, 부형제 등에 관한 추가의 교시는 표준 약제학적 텍스트, 예를 들면, 문헌 [Remington: The Science and Practice of Pharmacy", 20th Edition, 2000, pub. Lippincott, Williams & Wilkins; and Handbook of Pharmaceutical Excipient, 2nd edition, 1994]에서 찾아볼 수 있다.
화합물 투여
본 발명의 란티바이오틱 화합물 및 조성물은 의학적 치료법 또는 예방법으로 피험체에게 투여될 수 있다. 피험체는 인간 또는 동물 피험체일 수 있다. 동물 피험체는 포유동물, 또는 기타 척추동물일 수 있다.
따라서, 피험체를 치료 또는 예방하는 방법에 사용하기 위한 본 발명의 화합물을 제공한다. 또한, 피험체를 치료 또는 예방하는 방법에 사용하기 위한 약제를 제조하기 위한 본 발명의 화합물의 용도를 제공한다.
치료 방법은 피부, 점막, 장 또는 전신 감염을 비롯한 박테리아 감염을 위한 것일 수 있다.
상기 변이체 및 조성물은 균혈증(카테터 관련 균혈증 포함), 폐렴, 피부 및 피부 구조 감염(수술 부위 감염), 심장내막염 및 골수염의 전신 치료에 사용될 수 있다. 이와 그 밖의 치료법은 원인 물질, 예로서, 스타필로코커스, 스트렙토코커스, 엔테로코커스에 대한 것일 수 있다. 본 발명의 화합물, 또는 그의 조성물은 또한 여드름(즉, 프로피오니박테리움 아크네스)을 비롯한 피부 감염의 국소 치료에 사용될 수 있다. 상기 변이체 및 그의 조성물은 또한 눈 감염, 예로서, 결막염 치료에 사용될 수 있고, 장 중복 감염(gut super-infection), 예로서, 다중 내성 클로스트리듐 디피실리를 비롯한 클로스트리듐 디피실리에 의해 유발된 것(위막성 대장염), 또는 헬리코박터 파이로리(Helicobacter pylori)와 관련된 장 감염의 경구 치료를 위해 사용될 수 있다.
변이체는 또한 상처 또는 화상시 피부 감염을 치료하거나 예방하는데 사용될 수 있다. 추가로, 변이체 및 그의 조성물은 예로서, MRSA의 전파를 방지하기 위해 콧구멍을 청소하는 예방법에도 사용될 수 있다. 이는 감염 위험이 있는 피험체(예컨대, 병원에 입원하는 환자), 또는 의료 종사자 또는 그러한 감염 보균자가 될 위험이 있는 다른 간호인에 대해 실행될 수 있다. 복부 수술 이전에 창자 균무리를 예방학적으로 제거하는 것 또한 고려된다.
본 발명에 따른 화합물은 장내(경구적으로), 비경구적으로(근육내로 또는 정맥내로), 직장 또는 국부적으로(국소적으로). 이는 액제, 분제(정제, 마이크로캡슐제를 비롯한 캡슐제), 연고제(크림제 또는 겔제), 또는 좌제의 형태로 투여될 수 있다. 이러한 유형의 제제에 가능한 보조제는 약제학적으로 통상의 액상 또는 고체 충전제 또는 증량제, 용매, 유화제, 활택제, 향미제, 교정제, 착색제 및/또는 완충 물질이다. 적당량 용량으로서 0.1-1000, 바람직하게는 0.2-100mg/kg (체중)이 투여된다. 이는 1일 유효량, 예컨대, 30-3000, 바람직하게 50-1000mg으로 본 발명에 따른 화합물을 함유하는 1회 복용 단위로 적당히 투여된다.
이하에서는, 첨부하는 도면을 참조하여, 본 발명의 최적의 실시양태를 비롯하여 본 발명의 실험 원리를 추가로 상세히 설명할 것이나, 이는 단지 예로서 제시된 것이다.
실시예 1 - 유전자 클러스터 클로닝
악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애로부터의 액타가르딘 생합성 유전자 클러스터 동정 및 클로닝
O/SBDIG-1은 48개의 염기로 구성된, 디곡시제닌(DIG: digoxigenin)-표지된 축퇴성 올리고뉴클레오티드이다. 이는 액타가르딘의 공지된 아미노산 서열을 번역시키고, 악티노플레인스에 대한 코돈 사용 빈도를 고려하여 디자인되었다. 악티노플레인스 가르바디넨시스로부터 단리되고, 제한 효소 NcoI를 사용하여 분해된 게놈 DNA의 써던 혼성화 분석을 통해 O/SBDIG-1에 혼성화되는 ~3kb 단편을 동정하였다. 게놈 DNA의 NcoI 분해를 반복하고, ~3kb의 DNA 단편을 단리하고, NcoI으로 절단된 pLITMUS28 (NEB) 내로 클로닝하였다. 생성된 플라스미드를 E. 콜라이 DH10B 세포 내로 도입한 후, 프로브 O/SBDIG-1을 사용하여 써던 혼성화 분석을 실시하였다. 혼성화하는 클론을 동정하고, 서열을 분석하였다. 서열 분석을 통해 pLITAG01로 명명되는 상기 플라스미드는 액타가르딘 생합성에 대한 lanA 구조 유전자를 코딩하는 DNA(actA)와, ABC 당 수송체의 일부를 코딩하는 것으로 간주되는 상류 영역 및 lan M을 부분적을 코딩하는 하류에 있는 영역(actM)으로 구성된다는 것이 밝혀졌다.
프라이머 O/ACT08F 및 O/ACT09R은 pLITAG01로부터의 서열에 기초하여 디자인되었다. DIG-표지된 dNTPs(Roche) 및 주형으로서 pLITAG01과 함께 PCR 반응에서 상기 프라이머를 사용함으로써 2296bp DIG-표지된 DNA 단편을 생성하고, 이를 SBDIG-2로 명명하였다.
BamHI를 사용하여 앞서 분해된 코스미드 SuperCos1(Stratagene) 내로 악티노플레인스 가르바디넨시스 ATCC 31049 및 악티노플레인스 리구리애 NCIMB 41362로부터 얻은, Sau3AI로 분해된 게놈 DNA를 클로닝하여 2개의 코스미드 라이브러리를 생성하였다. 각 코스미드 라이브러리는 SBDIG-1를 사용하여 써던 혼성화로 분석하였다. SBDIG-1에 혼성화하는 것으로 간주되는 것으로, 각 라이브러리로부터 얻은 25 개의 코스미드를 선별하고, 프로브 O/SBDIG-1 및 SBDIG-2를 사용하여 써던 혼성화로 재분석하였다. 악티노플레인스 가르바디넨시스로부터 얻은 게놈 DNA로부터 유래된 9개의 코스미드, 및 악티노플레인스 리구리애로부터 얻은 게놈 DNA로부터 유래된 11개의 코스미드는 2개의 프로브 모두에 혼성화되었다. 각 코스미드로부터 DNA를 단리하고, 프라이머 T3 및 T7을 사용하여 서열 분석하였다. 이어서, 코스미드 CosAL02 및 CosAG14의 전체 선열을 분석하였다(Sequencing facility, Department of Biochemistry, University of Cambridge).
재료 및 방법
균주
본 발명에 사용한 박테리아 균주는 도 5에 요약되어 있다.
벡터
코스미드 SuperCos1은 스트라진(Stratagene)으로부터 입수하였다.
플라스미드 pLITMUS는 뉴 잉글랜드 바이오랩스(New England Biolabs)로부터 입수하였다.
프라이머
Figure 112008052958573-pct00002
써던 혼성화
DNA 프로브 표지화
로슈(Roche)로부터 공급받은 디곡시제닌(DIG) PCR DNA 표지 및 검출용 키트를 그의 설명서에 따라 사용함으로써 DNA 혼성화 프로브를 제조하였다.
DNA를 나일론 막으로 옮김
먼저, 관심의 대상이 되는 DNA를 아가로스 겔 전기영동에 의해 분리하고, 진공 블로터(Q BIO gene)를 사용하여 나일론 막(Hybond-N, 영국에 소재하는 Amersham Int.)으로 옮겼다. 0.5 M HCl를 사용한 DNA의 탈퓨린 반응에 소요되는 시간은 브로모페놀 블루 마커 밴드가 완전하게 황색으로 변색될 때까지 걸린 시간(전형적으로, 0.7% 아가로스 겔의 경우 15-20분)에 의해 판단하였다. 이어서, 1.5 M NaCl, 1.5 M NaOH를 사용하여 DNA를 전체적으로 변성시키고, 각각 추가의 15-20분 동안 0.5 M Tris, 1.5 M NaCl(pH 8.0)을 사용하여 중화시켰다. 최소 60분 동안 20 x SSC를 충분히 제공하여(flooding) DNA의 완전한 블롯팅을 촉진시켰다. 블롯팅된 막을 진공 상태로부터 수거한 후, 이를 실온에 방치하여 대기 건조시켰다. UV 투과조명기(UVP) 상에 막(DNA 면이 아래로 향하게)을 놓고, 5분 동안 365 nm의 파장에서 UV에 노출시켜 DNA를 가교 결합시켰다.
콜로니 리프트 및 혼성화
혼성화에 의해 스크리닝하고자 하는 콜로니를 나일론 막(Roche diagnostics)으로 옮겼다. 양 전하를 띤 나일론 막을 콜로니 위에 놓고, 효과적으로 옮겨지도록 하기 위하여 1분간 단단히 눌렀다. 기준점을 막 위에 마킹하여 콜로니와 관련된 그의 배향을 표시하였다. 이후, 막을 수거하고, 로슈의 사용자 설명서(필터 혼성화용 DIG 사용 설명서)에서 지시하는 바에 따라 혼성화용으로 제조하였다.
혼성화 및 막 현상
68℃의 HB-1000 혼성화용 오븐(UVP)에서 밤새도록(~16hr) DNA를 제조된 프로브와 함께 혼성화시켰다. 혼성화 이후, 막을 2 x 염 시트르산나트륨(SSC: salt sodium citrate) + 0.1% 황산도데실나트륨(SDS: sodium dodecyl sulphate)을 사용하여 실온에서 5분간의 2주기 동안 막을 세척하였다. 상기와 같이 세척한 후, SBDIG-1 존재하에 혼성화된 막에 대해서 1 x SSC + 0.1% SDS를 사용하여, 그리고, SBDIG-2를 사용하여 스크리닝된 막에 대해서 0.1 x SSC + 0.1% SDS를 사용하여 68℃에서 2 x 15분으로 2차의 일련의 세척을 실시하였다. 이어서, 로슈의 사용자 설명서(필터 혼성화용 DIG 사용 설명서)에서 권고된 바에 따라 막을 현상시켰다.
소프트웨어
일치 서열은 프레임플로트(FramePlot) 버전 2.3.2, 바이오에디트(BioEdit) 서열 정렬 편집기, 클러스탈W(ClustalW)(EMBL-EBI) 및 베이직 로컬 얼라이먼트 서치 툴(Basic Local Alignment Search Tool)(BLAST, NCBI)을 사용하여 분석하였다.
결과 및 고찰
CosAG14
코스미드, CosAG14는 악티노플레인스 가르바디넨시스로부터 단리된 게놈 DNA의 38168bp 단편을 함유한다. 서열 분석을 통해 리더 및 액타가르딘 프리펩티드를 코딩하는 DNA를 동정하고, 이 유전자를 명칭 actA로 명명하였다. 2개의 알라닌 잔기는 액타가르딘 프리펩티드의 상류 바로 앞에 존재한다. 이들 잔기가 액타가르딘 으로부터 리더 펩티드의 프로테아제 절단에 대한 인식 부위를 나타내는 것으로 간주된다. 이 위치에서의 부분적인 절단으로 알라닌은 유지되는데, 이것이 악티노플레인스 가르바디넨시스의 발효 브로쓰에서 통상 관찰되는 ala-액타가르딘을 생산시킨다고 간주된다. actA 유전자 하류에는 3162bp의 DNA 영역이 존재하는데, 이는 예를 들면, 머사시딘 유전자 클러스터로부터의 mrsM(30% 동일성)과 같은 수개의 lanM 단백질과 강한 서열 유사성을 갖는다. 이러한 추정 유전자를 actM으로 명명하고, 이는 액타가르딘 프리펩티드의 변형, 촉매적인 탈수, 및 티오에테르 형성에 관여하는 것으로 간주된다. actO로 명명되는 것으로서, actM으로부터 11bp 만큼 하류에 위치하는 오픈 리딩 프레임은 수개의 루시퍼라제형 모노옥시게나제와 서열 유사성(~39% 동일성)을 갖는 341-아미노산 단백질을 코딩한다. ActO인 모노옥시게나제는 산소를 혼입시켜 데옥시-액타가르딘으로부터 액타가르딘을 생성하는 것으로 촉진시키는 역할을 하는 것으로 간주된다. actR로 명명되는 오픈 리딩 프레임은 actO에 대해 역 배향으로 존재하고, 62bp 하류에 위치한다. 이러한 orf의 단백질 산물은 수개의 2-성분 반응 조절 인자와 서열 유사성(~37% 동일성)을 보인다. ABC 수송체 퍼미아제에 대하여 서열 유사성(~25% 동일성)을 보이는 추정 812개의 아미노산 단백질은 789bp 하류에 위치하고, actR과 동일한 배향으로 존재한다. actT로 명명되는 이러한 추정 단백질이 잠재적으로 세포로부터 변형된 란티바이오틱을 유출시킨다. actT로부터 하류에 있는 2번째 및 4번째 아미노산 서열은 각각 반응 조절 인자 키나제 및 페니실린 결합 단백질과 유사성(~30% 동일성)을 나타낸다. 리스테리아 모노사이코겐(Listeria monocytogene)에서 니신 생합성 유전자 클러스터에 관한 최근 연구(문헌 [Gravesen et al., 2004])를 통해 페니실린-결합 단백질과, 기능이 알려져 있지 않은 단백질과 함께 히스티딘 키나제가 니신 내성을 부여하는데 관여한다고 입증되었다. actA에 매우 근접한 위치 내에 유사한 유전자가 존재한다는 것은 이들 유전자가 액타가르딘 내성 기전에 관여한다는 것을 지시할 수 있다.
CosAL02
코스미드 CosAL02는 악티노플레인스 리구리애로부터 단리된 게놈 DNA의 40402bp 단편을 함유한다. 서열 분석을 통해 코스미드 CosAG14에서 동정된 actA 유전자와 강력한 서열 상동성(50개의 잔기가 동일)을 갖는, 64-아미노산 단백질을 코딩하는 lanA 유전자를 동정하게 되었다. 본 발명자들은 이러한 lanA 유전자 종을 ligA로 명명하였다. 이러한 ligA의 프리펩티드 서열은 하기 나타낸 두 유전자(서열 번호 119 및 서열 번호 212)의 정렬에서 표시되어 있는 2개의 잔기가 액타가르딘의 것과 상이하다:
Figure 112008052958573-pct00003
V15L 및 I16V 돌연변이는 액타가르딘과 동일한 질량을 갖는 단백질을 생성할 수 있는 바, 질량 분광법(lc-ms) 분석에 의해서는 식별되지 못할 것이다. CosAL02에서 동정된 lanA 유전자의 잠재적인 산물이 신규한 란티바이오틱을 나타낸다. ligA으로부터 321bp 만큼 상류에 존재하는 오픈 리딩 프레임은 스트렙토마이세스 글라우체센스(Streptomyces glaucescens)의 StrR 단백질과 서열 유사성(46% 동일 성)을 보이는 추정 286-아미노산 단백질을 코딩한다. StrR 단백질은 스트렙토마이신 유전자 발현 조절에 관여하는 경로-특이성 DNA 결합 활성 인자이다. ligA 하류에 존재하는 orf의 서열 유사성(31% 동일성)은, 잠재적으로 ligA 프리펩티드의 변형에 관여하는 1046-아미노산 lanM 폴리펩티드(하기에서 "ligM"으로 명명됨)를 코딩한다는 것을 제안한다. 다음의 하류에 있는 오픈 리딩 프레임의 개시 코돈인 lanT(ligT)는 ligM의 개시 코돈과 중복된다. LigT는 수개의 ABC-수송체와 서열 유사성을 갖는 575개의 아미노산 단백질이다. LanT 단백질은 최종의 성숙한 산물 또는 여전히 그의 리더 서열에 부착된, 번역후 변형된 산물을 분비시킨다. 코스미드, CosAG14에서 관찰되는 바와 같이, ligT로부터 하류에 있는 다음 orf는 루시퍼라제형 모노옥시게나제와 서열 유사성(~38% 동일성)을 갖는 347개의 아미노산 단백질을 코딩한다. 이러한 추정 모노옥시게나제(ligO)가 산소 혼입과 설폭시드 결합 형성에 관여하는 것으로 간주된다. 수개의 2-성분 반응 조절 인자와 서열 유사성(~37%)을 보이는 추정 217개의 아미노산 단백질은 ligO 하류에 위치하고 역 배향으로 존재한다. 이러한 추정 조절 인자를 ligR로 명명하였다.
표 1. CosAG14 주석(악티노플레인스 가르바디넨시스로부터 단리된 38168bp 단편. SuperCos1 벡터 골격 서열은 생략한다)
Figure 112008052958573-pct00004
Figure 112008052958573-pct00005
표 2. CosAL02 주석(악티노플레인스 리구리애로부터 단리된 40402bp 단편. SuperCos1 벡터 골격 서열은 생략한다)
Figure 112008052958573-pct00006
Figure 112008052958573-pct00007
실시예 2 - 발현 카세트
발현 카세트 생성
본 실시예는 본 발명에 따른 발현 카세트의 생산에 관하여 예시한다. 본 발명의 변이체 lanA 유전자를 효과적으로 생성하기 위하여 이러한 발현 카세트, 플라스미드 pAGvarX를 디자인하고, 이후, 예로서, 야생형 actA가 제거된 악티노플레인스 가르바디넨시스 균주(악티노플레인스 가르바디넨시스 ΔactA)와 같은 숙주 세포 내로 도입할 수 있다. 벡터 pSET152(문헌 [Bierman et al., 1992])의 유도체는 이러한 플라스미드를 attP 부착 부위를 통해 숙주의 염색체 내로 통합될 것이다. 숙주 유기체에 의해서 액타가르딘 생합성 유전자 클러스터의 남은 야생형 유전자와 함께 돌연변이화된 actA 유전자가 발현됨으로써 액타가르딘 변이체가 생성되어야 한다.
플라스미드 pAGvarX 작제
달리 언급하지 않는 한, 인용되는 모든 위치는 서열 번호 100에 관한 것이다. 플라스미드 pAGvarX 작제에 관한 도식은 도 3에 제시되어 있다. 21237번 위치에 있는 actA 상류에 위치하는 orf에 인접한 염기부터 21672번 위치에 있는 actA 코딩 영역 내의 루신 잔기까지를 프라이머 O/AGvar01bF 및 O/AGvar02bR(프라이머 표)와, 프라이머로서 pLITAG01을 사용하여 PCR에 의해 증폭시켰다. 5' 말단 측면에 위치하는 XbaI 부위 및 BglII 부위를 침묵 돌연변이화를 통해 actA를 코딩하는 3' 루신 부위에 도입하기 위하여 프라이머를 디자인하였다. SmaI를 사용하여 앞서 분해된, 탈인산화된 pUC19로 상기 단편을 도입하여 pAGvar1을 수득하였다.
actA의 C-말단으로부터 인접한 하류 orf(21758과 21836을 포함하여 (21758-21836)에 이르는 DNA 영역을, 프라이머 O/AGvar05F 및 O/AGvar06R과, 주형으로서 pLITAG01을 사용하여 PCR에 의해 증폭시켰다. 5' 위치의 측면에 위치하는 AvrII 부위 및 3' 말단의 EcoRI 부위를 도입하기 위하여 프라이머를 디자인하였다. SmaI를 사용하여 앞서 분해된, 탈인산화된 pUC19로 생성된 PCR 산물을 클로닝하여 pAGvar2를 수득하였다. 이어서, 플라스미드 pAGvar1 및 pAGvar2를 XbaI를 사용하여 분해하고, pAGvar1로부터 PCR 단편을 회수하고, 탈인산화되고, XbaI를 사용하여 분해된 pAGvar2로 클로닝하고, 이입된 단편의 정확한 배향은 제한 분석에 의해 측정하였다. 이어서, BglII 및 AvrII를 사용하여 생성된 플라스미드 pAGvar3을 분해하고, 어닐링된 올리고뉴클레오티드 O/AGvar03F 및 O/AGvar04R에 결찰시켜 pAGvar4를 생성하였다. 이어서, EcoRI 및 XbaI를 사용하여 플라스미드 pAGvar4를 분해하고, EcoRI 및 XbaI를 사용하여 앞서 분해된 pSET152 내로 어닐링된 올리고뉴클레오티드를 포함하는, 생성된 ~620bp 단편을 도입하여 벡터 pAGvarX를 수득하였다.
각각의 올리고뉴클레오티드를 어닐링하여 작제된 pAGvarX 영역은 액타가르딘 펩티드와 관련하여 아미노산 6과 7(각각 C 및 T)에 침묵 돌연변이화를 통해 BsrGI 부위를 도입한다. 이 부위는 상류의 BglII 부위 또는 하류의 AvrII 부위와 함께, 표적된 돌연변이를 코딩하는 DNA를 actA 펩티드내 코딩되는 임의의 아미노산으로 도입하는데 사용될 수 있다.
실시예 3 - 숙주 세포
본 실시예은 lanA 유전자가 불활성화되어 있는 란티바이오틱 생산 숙주 세포 생산에 관하여 예시한다. 본 실시예에서, 숙주 세포는 actA 유전자가 결실되어 있는 악티노플레인스 가르바디넨시스이다.
균주 악티노플레인스 가르바디넨시스 ΔactA
액타가르딘 구조 유전자 actA의 변이체를 발현시키는데 숙주로서 균주 악티노플레인스 가르바디넨시스 ΔactA가 사용된다. 이러한 균주는 (Gust et al., 2002)에 의해 개발된 리디렉트(Redirect) 기술을 사용하여 야생형 악티노플레인스 가르바디넨시스로부터 생성되었다. 먼저, actA를 코딩하는 코스미드 CosAG14로부터의 DNA 영역을 카세트 SBdel-1로 대체하였다. SBdel-1는 아프라마이신 내성 유전자(aac(3)IV) 및 FLP 인식 표적(FRT: FLP recognition target) 부위 측면에 위치하 는 oriT로 구성되고, 이는, 주형으로서 플라스미드 pIJ773과 함께, 각각 서열 번호 100의 21536 및 21802에 결합하는 프라이머 O/SB50F 및 O/SB51R를 사용하여 PCR에 의해 증폭시켰다. 리디렉트 프로토콜(문헌 [Gust et al., 2004])에 따라 CosAG14의 actA를 SBdel-1로 대체시켜 코스미드 CosAG14ΔA를 생성하였다. 이어서, 리디렉트 프로토콜 단계 7에 따라 FLP-매개 절단에 의해 SBdel-1 카세트의 중심부를 CosAG14ΔA로부터 제거하여 CosAG14ΔB를 생성하였다. 이러한 영역을 제거함으로써 비극성의 비마킹된 프레임내 결실을 생성할 수 있을 뿐만 아니라 동일한 내성 마커를 반복적으로 사용할 수 있다(문헌 [Gust et al., 2003]).
작제 제2 단계는 코스미드를 조작하여 접합에 의해 상기 코스미드를 악티노플레인스 가르바디넨시스 내로 도입할 수 있도록 하는 것이었다. 먼저 형질전환에 의해 CosAG14ΔB를 E. 콜라이 균주 BW25113/pIJ790 내로 삽입시킴으로써 이를 개시하였다. 이어서, 리디렉트 프로토콜(문헌[Gust et al., 2004])에 따라 CosAG14ΔB의 앰피실린 유전자를 SBdel-2로 대체하여 코스미드 CosAG14ΔC를 생성하였다. SBdel-1과 유사한, 카세트 SBdel-2는 아프라마이신 내성 유전자(aac(3)IV) 및 FRT 부위 측면에 위치하는 oriT를 수용하지만, 주형 pIJ773과 함께 프라이머 O/SB52F 및 O/SB53R을 사용하여 생성되었다.
리디렉트 프로토콜(문헌 [Gust et al., 2004]; 또한, 하기 문단을 참조할 수 있다)에 따라 악티노플레인스 가르바디넨시스와 접합시키기 이전에 CosAG14ΔC를 사용하여 E. 콜라이 ET12567/pUZ8002의 전기적격 세포를 형질전환시켰다. actA 유전자가 야생형 생산자의 염색체로부터 제거된, 생성된 균주는 악티노플레인스 가르 바디넨시스 ΔactA이다.
더욱 상세하게, 상기 악티노플레인스 가르바디넨시스 ΔactA 균주를 수득하기 위하여 악티노플레인스 가르바디넨시스와 접합시키기 이전에 CosAG14ΔC를 사용하여 E. 콜라이 ET12567/pUZ8002의 전기적격 세포를 형질전환시켰다. 아프라마이신 내성 외부 접합체를 수득하고, 아프라마이신을 포함하지 않는 TSB에서 6회에 걸쳐 반복적으로 성장시켜 계대배양하였다. 배양물 6으로부터의 세포를 배지 65 상에 플레이팅시키고 30℃에서 인큐베이션하였다. 5일 경과 후, 배지 65 상의 대략 1㎠ 면적에 걸쳐 콜로니를 옮기고 패치 아웃하였다. 30℃에서 3일간 인큐베이션한 후, 최종 농도 50㎍/ml로 아프라마이신을 함유하는 배지 65로 패치된 세포를 옮겼다. 30℃에서 72시간 동안 인큐베이션한 후, 아프라마이신에 감수성인 세포를 선별하고, 각 패치를 사용하여 10ml TSB를 함유하는 50ml 플라스크에 접종하고 30℃, 250rpm에서 4일 동안 배양하였다. 각 배양물로부터 게놈 DNA를 제조하고, 올리고뉴클레오티드 O/AGvar01bF 및 O/AGvar06r을 사용하여 PCR에 의해 분석하였다. actA 유전자가 결실된 것과 일치하는 크기를 갖는 PCR 산물이 생성되었다. 동시에 hplc에 의해 발효 브로쓰를 분석함으로써 이들 동일 샘플은 액타가르딘을 생산하지 않았음이 입증되었다.
실시예 4 - 이종성 발현
본 실시예는 비생산자 세포, 스트렙토마이세스 리비단스인 숙주 세포에서 서열 번호 100 유전자 클러스터로부터 액타가르딘 발현에 관하여 예시한다. 상기 숙주 세포는 이들 2개의 펩티드의 활성 변이체를 생산하는 대안적 수단을 제공한다.
액타가르딘 및 데옥시-액타가르딘 B의 생산을 코딩하는 생합성 유전자 클러스터를 함유하는 코스미드 CosAG14 및 CosAL02는, 이종성 숙주로의 접합 전달을 촉진시키는데 필요하는 전달 기점(oriT)을 갖고 있지 않다. 리디렉트 기술(문헌 [Gust et al., 2002])을 사용하여, 네오마이신 내성 유전자, neo를 대체함으로써 파지 부착 부위 attP 및 인테그라제(int)와 함께 oriT를 CosAG14 및 CosAL02의 SuperCos1 골격 내로 도입할 수 있다.
이종성 발현용 벡터 작제
코스미드 pMJCOS1(노리치에 소재하는 JIC)은, 네오마이신 내성을 코딩하는 유전자가 oriT, attP, 인테그라제(int) 및 아프라마이신 내성 유전자(aac(3)IV)를 코딩하는 DNA를 포함하는 카세트(HEapra)로 대체된 SuperCos1(Stratagene)의 유도체이다. pMJCOS1을 SspI로 분해하고, 아가로스 겔로부터 DNA를 회수하여 카세트 HEapra를 단리하였다. 문헌 [Gust et al., 2004]에 기재된 바와 같은 리디렉트 프로토콜에 따라 CosAG14 및 CosAL02와 함께 상기 카세트를 사용하여 각각 코스미드 CosAG14HEapra 및 CosAL02HEapra를 생성하였다.
이어서, 접합을 통해 코스미드 CosAG14HEapra를 스트렙토마이세스 리비단스 내로 도입하였다. 스트렙토마이세스 리비단스/CosAG14HEapra의 아프라마이신 내성 외부 접합체를 단리하였다. 3개의 외부 접합체를 사용하여 TSB 시드 배지에 접종하였다. 대조군을 제공하기 위하여 스트렙토마이세스 리비단스, 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애를 동시에 배양하였다. 48시간 동안 인큐베이션한 후, 시드 배양물을 사용하여 각종의 상이한 생산 배지 4개, 즉, AAS1, GM1, GM3 및 TSB에 접종하였다. 이들 배양물을 총 9일간 30℃에서 인큐베이션하였으며, 5, 7 및 9일간 인큐베이션한 후에는 각 플라스크로부터 1.5ml의 분취량을 수거하였다. 분취량을 10분 동안 14000rpm(IEC 마이크로맥스 벤치탑 원심분리기)에서 원심분리시킨 후, 상등액을 버리고, 생물검정법 및 HPLC-MS 분석에는 희석시키지 않고 사용하였다.
생물학적으로 활성인 화합물(들)의 존재를 표시하는 억제대(무리(haloes))는, 코스미드 CosAG14HEapra를 함유하는 스트렙토마이세스 리비단스(스트렙토마이세스 리비단스/CosAG14HEapra)의 상등액이 로딩된 모든 웰 주위에서 관찰되었는데, 단, 예외적으로, TSB중 발효물로부터의 상등액이 로딩된 웰에서는 어떤 무리도 생성되지 않았다. 4개의 배지중 임의의 것에서 배양된 스트렙토마이세스 리비단스의 발효물로부터의 상등액이 로딩된 웰 주위에서는 어떤 생물학적 활성도 관찰되지 않았다. 성장이 입증된 악티노플레인스 리구리애 및 악티노플레인스 가르바디넨시스의 배양물로부터의 상등액이 로딩된 모든 웰 주위에서 무리가 뚜렷이 나타났다. 일반적으로 무리의 직경은 감소한 것이 뚜렷이 나타났지만, 5일째의 샘플링 첫째날부터 9일째까지 무리는 모두 일관되게 생성되었다.
스트렙토마이세스 리비단스/CosAG14HEapra의 발효물로부터의 상등액의 HPLC-MS 분석을 통해 ala(O)액타가르딘에 상응하는 체류 시간과 질량을 갖는 피크가 존재함을 확인하였다. 스트렙토마이세스 리비단스만의 상등액에는 이와 동일한 피크는 존재하지 않았다. 표 3은 스트렙토마이세스 리비단스, 스트렙토마이세스 리비단스/CosAG14HEapra, 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애를 5일 동안 인큐베이션한 후, 그의 발효물로부터의 상등액을 HPLC-MS 분석한 결과를 요약한다.
표 3:
Figure 112008052958573-pct00008
실시예 5 - 항균 활성
MIC 측정
본원 상기에 개시되어 있는 바와 같이 생산된 변이체 선별물을 각종 박테리아에 대한 활성에 대하여 추가로 시험하였다. 스트렙토코커스 뉴모니애를 제외한 모든 유기체의 최소 억제 농도(MIC: minimum inhibitory concentration)는 최종 칼슘 농도 400㎍/ml로 무수 염화칼륨으로 보충된 뮐러-힌톤 브로쓰(MHB: Mueller-Hinton broth)에서 2배로 희석된 일련의 항생제 희석액에 의해 측정하였다. S. 뉴 모니애에 대한 최소 억제 농도(MIC)는 400㎍/ml 염화칼륨 이수화물로 보충된 뇌-심장 침출배지(BHI: Brain Heart Infusion) 브로쓰에서 2배로 희석된 일련의 항생제 희석액에 의해 측정하였다. 항미생물제 저장액을 제조하고, NCCLS 표준 M7-A6에 따라 저장하였다.
McFarland 0.5 표준과 등가인 것으로서, 600nm에서의 흡광도가 0.2 - 0.3이 되도록 조정하여 활성 배양 브로쓰 배양물을 105 내지 106 CFU/ml 함유하도록 희석시켰다. 이어서, 브로쓰중 1:100으로 추가 희석시켰다. 본 검정법은 64㎍/ml 내지 0.06㎍/ml 범위의 농도 범위에서 총 용량 200㎕(160㎕ 브로쓰, 20㎕ 항생제, 20㎕ 접종물)로 멸균 96웰 미량적정 플레이트에서 이중으로 실시하였다. 미량적정 플레이트중 12번째 웰은 항미생물제를 함유하지 않았다. 정성 대조군에 대한 기준 항생제로서 반코마이신을 사용하였다. 플레이트를 18 - 20시간 동안 37℃에서 진탕시키면서 호기성 조건하에 인큐베이션하였으며, MIC는 가시적 성장을 일으키지 않는 약물의 최소 농도로서 정의된다.
Figure 112008052958573-pct00009
실시예 6 - NMR 분석
액타가르딘 및 데옥시 - 액타가르딘에 대한 NMR 연구
성공적으로 NMR 분광법(COSY, TOCSY, HSQC 및 NOESY)을 사용함으로써 액타가르딘(악티노플레인스 가르바디넨시스) 및 데옥시-액타가르딘 B(악티노플레인스 리구리애) 생산자로부터 수득한 서열 분석 결과를 확인하였다. 수득한 데이타를 통해 모든 잔기를 완벽하게 명백히 지정할 수는 없었지만, 이는 도 4에 나타낸 구조와 일치하였고, 악티노플레인스 리구리애로부터의 데옥시-액타가르딘 B가 15번 및 16번 위치에 각각 Leu 및 Val을 갖는다는 것을 확인하는데는 충분하였다.
실시예 7 - 유도체 합성
Z 기와 C-말단 아미드는 하기와 같은 데옥시-액타가르딘 B의 하기 유도체를 제조하였다:
Figure 112008052958573-pct00010
화합물 I - XI의 합성법은 하기와 같았다:
일반적인 방법 1. 화합물 I - III의 제조
건식 디메틸포름아미드(0.8ml)중 데옥시-액타가르딘 B(20mg, 11nmol), 적절한 아민(11nmol) 및 디이소프로필에틸아민(7.2㎕, 70nmol) 용액에 건식 디메틸포름아미드(1.0ml)중 200㎕의 벤조트리아졸-1-일-옥시-트리스-피롤리디노-포스포늄 헥사프루오로포스페이트(PyBop)(70mg, 134nmol) 용액을 가하였다. 출발 물질 모두가 소비될 때까지 추가 분취량의 Pybop 용액을 가하면서 반응 진행 과정에 따라 HPLC에 의해 혼합물을 분석하였다. 이 단계에서 HPLC 분석은 또한 가변량(5-20%)의 디아미드를 나타내었다. 반응 종결 후, 혼합물을 20mM Kpi의 수성 인산염 완충액(pH 7)(10ml)중 30% 아세토니트릴로 희석시키고, 표 4에 기술된 조건을 사용하여 분취용 HPLC에 의해 모노아미드를 정제하였다. 적절한 분획을 그의 원 용량의 25%까지 농축시키고, 미리조절된 C18 본드 엘루트(C18 Bond Elut) 칼럼(500mg)에 로딩하여 탈염시킨 후, 이어서 2 칼럼 용량의 30, 40, 70 및 90% 수성 메탄올을 사용하여 순차적으로 용리시킴으로써 세척하였다. 적절한 분획을 증발시킴으로써 백색 고체로서 원하는 산물을 수득하였다.
화합물 I : 데옥시 - 액타가르딘 B N-[3-디메틸아미노프로필] 모노카복스아미 는 일반적인 방법 1에 따라 데옥시액타가르딘 B와 3-(디메틸아미노)프로필아민을 커플링함으로써 수득하였다.
수득량 18mg, 85% 수율. [M+2H 2+] 계산치 979.0, 관측치 980.2
화합물 II : 데옥시 - 액타가르딘 B N-[1-(1- 메틸 -4- 피페리디닐 )피페라진] 노카복스아미드 는 일반적인 방법 1에 따라 데옥시액타가르딘 B와 4-(피페리디노)피 페라진을 커플링함으로써 수득하였다.
수득량 8mg, 37% 수율. [M+2H 2+] 계산치 1019.5, 관측치 1020.0;
[M+3H 3+] 계산치 680.0, 관측치 680.0
화합물 III : 데옥시 - 액타가르딘 B [1-(3-디메틸아미노프로필)피페라진] 모노카복스아미드 는 일반적인 방법 1에 따라 데옥시-액타가르딘 B와 1-(3-디메틸아미노프로필)피페라진을 커플링함으로써 수득하였다.
수득량 10mg, 46% [M+2H 2+] 계산치 1013.5, 관측치 1014.0
일반적인 방법 2. 화합물 IV - IX 의 제조
건식 디메틸포름아미드(0.4ml)중 적절한 Fmoc 보호된 아미노산(34nmol) 용액을 건신 디메틸포름아미드(0.4ml)중 벤조트리아졸-1-일-옥시-트리스-피롤리디노-포스포늄 헥사프루오로포스페이트(PyBop)(11.4mg, 22nmol) 및 디이소프로필에틸아민(11㎕, 68nmol) 용액으로 처리하였다. 이어서 혼합물을 건식 디메틸포름아미드(0.5ml)중 데옥시-액타가르딘 B(2mg, 11nmol) 용액에 가하였다. 혼합물을 시간 동안 실온에 방치한 후, 분석 HPLC(20mM Kpi 수성 인산염 완충액(pH 7)중 30-65% 아세토니트릴)를 통해 출발 물질이 완전하게 전환되었음을 나타내었다. 반응 혼합물을 40% 수성 메탄올(20ml)로 희석시키고, 2 칼럼 용량의 100% 메탄올에 이어, 2 칼럼 용량의 물로 세척함으로써 미리조절된 C18 본드 엘루트 칼럼(500mg)에 혼합물을 통과시켰다. 순차적으로 2 칼럼 용량의 40, 50, 60, 70, 80, 90 및 100% 수성 메탄올을 사용하여 칼럼을 용리시켰다. HPLC에 의해 분획을 분석하고, Fmoc-보호된 커플링 산물을 함유하는 분획을 증발건조시켰다. 잔류물을 디메틸포름아미드(1ml)에 용해시키고, 피페리딘(50㎕)을 가하여 Fmoc 보호기를 제거하였다. 반응 진행 과정을 HPLC에 의해 모니터하고, 출발 물질이 완전히 소비된 후에 용액을 30% 수성 메탄올(20ml)로 희석시켰다. 이어서, 앞서 기술된 바와 같이 C18 본드 엘루트 카트리지(500mg)를 통해 혼합물을 용리시키고, 적절한 분획을 증발시킨 후에 수득한 산물은 표 4에 기술된 조건을 사용하여 분취용 HPLC에 의해 추가로 정제하였다. 적절한 분획을 그의 원 용량의 25%까지 농축시키고, 미리조절된 C18 본드 엘루트 칼럼(500mg)에 로딩하여 탈염시킨 후, 이어서 2 칼럼 용량의 30, 40, 70 및 90% 수성 메탄올을 사용하여 순차적으로 용리시킴으로써 세척하였다. 적절한 분획을 증발시킴으로써 백색 고체로서 원하는 산물을 수득하였다.
화합물 IV : D- Ala (0) 데옥시 - 액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-D-알리닌으로부터 74% 수율로 제조되었다.
[M+2H 2+] 계산치 972.5, 관측치 973.0
043/188
화합물 V : L- Ile (0)데옥시- 액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-L-이소루신으로부터 27% 수율로 제조되었다.
[M+2H 2+] 계산치 993.5, 관측치 993.8
화합물 VI : L- Val (0)데옥시액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-D-발린으로부터 55% 수율로 제조되었다.
[M+2H 2+] 계산치 986.5, 관측치 985.9.
화합물 VII : L- Phe (0)데옥시액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-D-페닐알리닌으로부터 22% 수율로 제조되었다.
[M+2H 2+] 계산치 1010.5, 관측치 1010.9.
화합물 VIII : L- Lys (0)데옥시액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 비스(Fmoc)-L-리신으로부터 45% 수율로 제조되었다.
[M+2H 2+] 계산치 1001.0, 관측치 1001.6
화합물 IX : L- Tryp (0)데옥시액타가르딘 B 는 일반적인 방법 2에 따라 데옥시-액타가르딘 B와 Fmoc-L-트립토판으로부터 55% 수율로 제조되었다
[M+2H 2+] 계산치 1030.0, 관측치 1029.9.
실시예 8 - 추가의 항균 데이타
MIC 측정
스타필로코커스 , 스트렙토코커스 , 엔테로코커스
최소 억제 농도(MIC)를 측정하고, 호기성 박테리아용의 NCCLS 항미생물제 저장액을 제조하고, NCCLS 기준 미세희석 브로쓰 방법(M7-A6, 2003)에 따라 저장하였다. MIC는 뮐러-힌톤 브로쓰(MHB) 또는 뇌-심장 침출배지(BHI) 브로쓰(S. 뉴모니애)에서 2배로 희석된 일련의 항생제 희석액에 의해 측정하였다. 활성 배양 브로쓰 배양물은 멸균 브로쓰에서, 또는 직접형 콜로니 현탁액(S. 뉴모니애)에 의해 McFarland 0.5 표준(1 x 108 CFU/ml)과 등가인 혼탁도로 조정한 후, 대략 5 x 105 CFU/ml의 멸균 96웰 미량적정 플레이트에서 최종 접종물을 위해 멸균 브로쓰에서 추가로 희석시켰다. 기준 대조군 균주로서 포함된 엔테로코커스 패칼리스 ATCC 29212와, 정성 대조군에 대한 기준 항생제로서 반코마이신을 사용하여 본 검정법을 이중으로 실시하였다. 플레이트를 18 - 20시간 동안 37℃에서 진탕시키면서 호기성 조건하에 인큐베이션하였으며, MIC는 가시적 성장을 일으키지 않는 약물의 최소 농도로서 정의된다.
클로스트리듐 디피실리
C. 디피실리에 대한 최소 억제 농도(MIC)를 측정하고, 호기성 박테리아용의 NCCLS 항미생물제 저장액을 제조하고, NCCLS 기준 아가 희석 브로쓰 방법(M11-A5, 2001)에 따라 저장하였다. 윌켄스-찰그렌 아가(WCA: Wilkens-Chalgren agar)에서 2배 희석된 일련된 항생제 희석액을 제조하였다. 48시간 동안 브라지에르(Braziers)(C.C.E.Y.) 아가에서 배양된 성장물로부터 시험 유기체을 선별하고, McFarland 0.5 표준(1 x 108 CFU/ml)과 등가인 밀도로 쇠들러(Schaedler) 브로쓰에서 계대배양하고, WCA 플레이트 상의 최종 접종물은 대략 105 CFU/스폿이었다. 박테로이데스 프라질리스(Bacteroides fragilis) ATCC 25285는 기준 대조군 균주로서 포함되었고, 메트로니다졸은 정성 대조군에 대한 기준 항생제로서 사용되었다. 모든 조작은, 단지 산소에만 잠시 노출시킴으로써 미리 환원된 배지에서 주변 대기하에 이중으로 실시하였다. 플레이트를 48시간 동안 37℃에서 혐기성 조건하에 인큐 베이션하였으며, MIC는 혐기성 조건하의 대조군 플레이트 상에서의 성장과 비교하여 시험 플레이트 상에서의 성장이 외관상 현저히 감소된 약물의 농도로서 정의된다.
프로피오니박테리움 아크네스
푸라졸리돈(1-2㎍/ml)으로 보충된 웰켄스-찰그렌 아가(WCA)에서 3-7일간 배양된 성장물로부터 시험 유기체을 선별하였다. 직접형 콜로니 현탁액에 의해 P. 아크네스의 단일 콜로니를 새로운 웰켄스-찰그렌 브로쓰(WCB)에 접종하고, McFarland 0.5 표준(1 x 108 CFU/ml)에 등가인 밀도로 조정한 후, 대략 105 CFU/ml의 멸균 96웰 미량적정 플레이트에서 최종 접종물을 위해 멸균 브로쓰에서 추가로 희석시켰다. NCCLS 표준(M11-A5, 2001)에 따라 제조된 저장액을 포함하는 멸균수중에서 2배 희석되는 일련의 항생제 희석을 실시하고, 저장하였다. 정성 대조군에 대한 기준 항생제로서 반코마이신 및 클린다마이신을 사용하여 본 검정법을 이중으로 실시하였다. 플레이트를 48-72시간 동안 37℃에서 혐기성 조건하에 인큐베이션하였으며, MIC는 혐기성 조건하의 대조군 플레이트 상에서의 성장과 비교하여 시험 플레이트 상에서의 성장이 외관상 현저히 감소된 약물의 농도로서 정의된다. 모든 조작은, 단지 산소에만 잠시 노출시킴으로써 미리 환원된 배지에서 주변 대기하에 이중으로 실시하였다.
배양 배지를 50㎍/ml(여기서, 50㎍/ml 보다 높은 농도는 표시한다)의 칼슘 이온(염화칼슘과 같은 것)으로 보충하였다. 하기에 MIC 값(㎍/ml)을 나타낸다:
표 6. 엔테로코커스, 스트렙토코커스 및 스타필로코커스에 대한 MIC 값
Figure 112008052958573-pct00011
표 7. 후시딘산 내성 스타필로코커스 아우레우스에 대한 MIC 값
Figure 112008052958573-pct00012
표 8. 무피로신 내성 스타필로코커스 아우레우스에 대한 MIC 값
Figure 112008052958573-pct00013
표 9. 프로피오니박테리움 아크네스에 대한 MIC 값
Figure 112008052958573-pct00014
표 10. C. 디피실리에 대한 MIC
Figure 112008052958573-pct00015
표 11. C. 디피실리에 대한 MIC
Figure 112008052958573-pct00016
재료 및 방법
실시예 2-7에 사용된 재료 및 방법은 하기와 같다:
배지
모든 완충액, 용액, 및 배지는 역삼투압수((RO: reverse osmosis) water)를 사용하여 구성되었고, 이는 1ℓ당 하기 성분들을 함유하였다:
Figure 112008052958573-pct00017
Figure 112008052958573-pct00018
생물검정법
마이크로코커스 루테우스를 냉동 저장액으로부터 10ml의 뮐러-힌톤 브로쓰로 접종하고, 200rpm에서 진탕시키면서 30℃에서 밤새도록 배양하였다. 1ml의 상기 배양물을 사용하여 300ml의 뮐러-힌톤 아가에 접종하고, 이어서, 이를 페트리 디쉬에 부었다. 콜크 보어러(cork-borer)를 사용하여, 동일한 간격으로 거리를 두고 배치된 웰(직경 6mm)을 제작한 후, 50㎕의 각 샘플을 로딩하였다. 로딩된 샘플이 확산될 때까지 생물검정법 플레이트를 층상 공기류(laminar air flow)에 두었는데, 상기 로딩된 샘플이 확산되는 시점에 플레이트를 30℃의 인큐베이터로 옮기고 밤새도록 방치해 두었다.
엔도뉴클라제 제한 분해
공급받은 완충액에서, 제조사의 가이드라인에 따라 제한 효소로 DNA를 분해하였다. 전형적으로, 분취용 분해물를 위해 5㎍의 DNA를 권고된 온도하에 3시간 동안 12 단위의 효소를 사용하여 분해시켰다. 분석용 분해물을 위해 0.5㎍의 DNA를 권고된 온도하에 2-3시간 동안 다시 2 단위의 효소를 사용하여 분해시켰다. 분해된 DNA를 아가로스 겔 전기영동에 의해 분석하였다.
외부 접합체 계대배양
패치된 외부 접합체의 아가 플러그를 사용하여 8ml TSB 및 2개의 유리 비드를 함유하는 50ml 플라스크에 접종하였다. 배양물을 10일 동안 30℃, 250rpm에서 접종한 후, 100㎕를 수거하고, 2개의 유리 비드를 함유하는 50ml 플라스크중 10ml TSB에 가하였다. 플라스크를 2일 동안 인큐베이션한 후, 1ml를 수거하고, 이를 사용하여 10ml TSB를 함유하는 50ml 플라스크에 접종하였다. 1ml의 접종물을 사용하여 총 6회의 연속 배양을 수행하였는데, 각각은 2일 동안 30℃, 250rpm에서 인큐베이션되었다. 6회째의 계대배양으로부터 얻은 세포를 20분 동안 4000rpm에서 원심분리(Heraeus Sepatech Megafuge)하여 펠릿화시킨 후, TSB에서 30초간 초음파 처리하여(MSE Sanyo Soniprep 150, 진폭 10-15 마이크론) 균사체를 파쇄시켰다. 초음파 처리된 세포의 일련의 희석액(TSB중 10-1 내지 10-5)을 배지 65에 플레이팅하고, 30℃에서 인큐베이션하였다.
이종성 발현을 위한 발효
아가 플러그 또는 250㎕의 -80℃ 글리세롤 스톡을 사용하여 각각 2개의 유리 비드, 및 8ml TSB 또는 날리딕스산으로 보충된 AAS1 매질, 및 적절한 선택 항생제를 함유하는 50ml 삼각 플라스크에 접종하였다. 2-4일 동안 30℃, 200rpm에서 인큐베이션한 후, 시드 배양물당 1.2ml(3%)를 사용하여 2개의 유리 비드를 함유하는 50ml 삼각 플라스크중 40ml의 각 생산 매질에 접종하였다. 이들 배양물을 9일 동안 30℃, 200rpm에서 인큐베이션하였다. 생물검정법 및/또는 HPLC-MS 분석에 의한 분석을 위해 각 배양물로부터 주기적으로 1.5ml의 전체 브로쓰 분취량을 수거하였다.
데옥시-액타가르딘 B의 단리를 위한 악티노플레인스 리구리애 발효
각각 2개의 유리 비드 및 50ml SV2 매질을 함유하는 250ml 삼각 플라스크에 글리세롤 스톡으로부터의 500㎕(1%)의 악티노플레인스 리구리애 세포를 접종하였다. 4일 동안 30℃, 250rpm에서 인큐베이션한 후, 시드 배양물당 12ml(3%)를 사용하여 2L 삼각 플라스크중 400ml의 GM3에 접종하였다. 이들 배양물을 9일 동안 30℃, 200rpm에서 인큐베이션하였다. 30분 동안 4000rpm(Heraeus Sepatech Megafuge)에서 원심분리하여 배양 브로쓰를 수확한 후, 세포 펠릿으로부터 상등액을 버렸다.
액타가르딘 및 Ala (O)- 액타가르딘의 단리를 위한 악티노플레인스 가르 바디넨시스 발효
각각 2개의 유리 비드 및 50ml AAS 매질을 함유하는 250ml 삼각 플라스크에 글리세롤 스톡으로부터의 500㎕(1%)의 악티노플레인스 가르바디넨시스 세포를 접종하였다. 9일 동안 30℃, 250rpm에서 인큐베이션한 후, 시드 배양물당 12ml(3%)를 사용하여 2L 삼각 플라스크중 400ml의 AAS에 접종하였다. 이들 배양물을 8일 동안 30℃, 200rpm에서 인큐베이션하였다. 30분 동안 4000rpm(Heraeus Sepatech Megafuge)에서 원심분리하여 배양 브로쓰를 수확한 후, 세포 펠릿으로부터 상등액을 버렸다.
MIC 연구를 위한 데옥시 - 액타가르딘 단리
디아이온(Diaion) HP-20 수지(50 g/L)을 가하고, 악티노플레인스 리구리애의 발효물로부터 단리된 상등액과 혼합하고, 밤새도록 4℃에 방치하였다. 현탁액을 본드 엘루트 칼럼(60ml)으로 분취하고, 수지를 4개의 상(bed) 용량의 물, 이어서, 3개의 상 용량의 25, 50, 75 및 100% 메탄올로 순차적으로 세척하였다. HPLC 분석을 통해 50, 75 및 100% 메탄올 분획내 데옥시-액타가르딘 B가 존재한다는 것을 확인하게 되었다. 이들 분획을 조합한 후, 출발 풀 용량의 대략 ¼로 농축시켰다. 2 칼럼 용량의 100% 메탄올로 세척한 후, 이어서 2 칼럼 용량의 물로 세척함으로써 미리 조절한 2개의 C18 본드 엘루트 칼럼(5g) 상에 1L의 브로쓰로부터의 농축액을 로딩하였다. 2 칼럼 용량의 50, 60, 70, 80, 90% 메탄올에 이어, 2 칼럼 용량의 100% 메탄올을 사용하여 순차적으로 칼럼을 용리시켰다. HPLC 분석을 통해 80, 90 및 100% 메탄올 분획내 데옥시-액타가르딘 B가 존재한다는 것을 확인하게 되었고, 이들 분획을 모아, 출발 용량의 ⅓로 농축시켰다. 50% 메탄올중 동량의 40mM 인산칼륨(pH 2.5)을 가한 후, 3개의 미리 조절된 SCX 본드 엘루트 칼럼(1g) 상에 고르게 로딩하였다. SCX 칼럼을 먼저 50% 메탄올중 40mM 인산칼륨(pH 2.5)으로 세척한 후, 1.5 칼럼 용량의, 50% 메탄올중 250mM 인산칼륨(pH 7.0)을 사용하여 용리시켰다. 2 칼럼 용량의 메탄올에 이어서, 2 칼럼 용량의 물로 미리 조절된 C18 본드 엘루트 칼럼(5 g) 상에 로딩하여 용리제를 탈염시켰다. 칼럼을 2 칼럼 용량의 50%에 이어 60% 메탄올로 세척하였다. 2 칼럼 용량의 각 70, 80, 90 및 100% 메탄올을 가한 후, 데옥시-액타가르딘 B를 용리시켰다. HPLC및 LC-MS 분석에 의해 확인한 바와 같은, 정제된 데옥시-액타가르딘 B를 함유하는 분획을 모아 증발건조시켰다.
악티노플레인스 리구리애의 발효물로부터 Ala(0)-데옥시액타가르딘 B의 단리
디아이온 HP-20 수지(50 g/L)를 4ℓ의 A.리구리애의 발효물로부터 얻은 상등액을 혼합하고, 밤새도록 4℃에 방치하였다. 상등액을 유리 소결 깔때기 내로 수집하고, 수지를 4개의 상 용량의 물, 이어서, 4개의 상 용량의 50% 메탄올로 순차적으로 세척하였다. 5개의 상 용량의 100% 메탄올로 세척하여 데옥시-액타가르딘 B 및 Ala(0)-데옥시액타가르딘 B를 수지로부터 용리시켰다. 100% 메탄올 분획을 원 용량의 ⅓로 농축시킨 후, 최종 농도가 60% 메탄올이 될 때까지 물을 가하여 희석시켰다. 2 칼럼 용량의 50% 메탄올로 세척하기 전에, 4개의 10g C18 본드 엘루트 칼럼 상에 생성된 용액을 로딩하였다. 2 칼럼 용량의 메탄올/0.5% 포름산을 사용한 칼럼으로부터 데옥시-액타가르딘 B-관련 성분이 용리되었다. 40ml까지 증발시켜 생성된 용리제를 농축시키고, 하기 표에 기술된 조건을 사용하여 분취용 HPLC에 의해 데옥시-액타가르딘 B로부터 Ala(0)-데옥시-액타가르딘 B를 분리하였다.
칼럼 캐피톨 HPLC 리미티드(Capitol HPLC Ltd) C18 - BDS - HL5 - 26052 15cm x 20mm
용매 A 20mM 인산칼륨(pH 5.0)중 30% ACN
용매 B 20mM 인산칼륨(pH 5.0)중 65% ACN
검출 210nm
유속 10ml/분
시간(T) = 0분 100% A
T = 1분 100% A
T = 29분 35% B
T = 30분 100% B
T = 33분 100% B
T = 34분 100% A
T = 35분 100% A
수집 출발 10분; 종결 30분; 0.5 또는 0.25분 분획
Ala(0)-데옥시-액타가르딘 B를 함유하는 분획(HPLC 및 LC-MS 분석에 의해 확인)은 상기 기술된 바와 같은 C18 본드 엘루트 칼럼을 사용하여 탈염시킨 후, 증발건조시켰다.
Ala(0)-데옥시-액타가르딘 B는 체류 시간 = 5.04분으로 칼럼으로부터 용리되었다. MS 분석을 통해 972.2 m/z (M+2H)+2인 종을 확인하였다.
MIC 연구를 위한 액타가르딘 및 Ala (O)- 액타가르딘의 단리
악티노플레인스 리구리애로부터의 데옥시-액타가르딘 B 정제에 대하여 기술된 방법을 사용하여 액타가르딘 및 Ala(0)-액타가르딘을 정제하였지만, 단, 예외적으로, SCX 본드 엘루트 단계 후에 Ala(0)액타가르딘 및 액타가르딘을 분할하기 위해서는 분취용 HPLC가 필요하였다. SCX 본드 엘루트 칼럼으로부터 얻은 용리제를 70 내지 18ml로부터 회전식 증발에 의해 농축시키고, 생성된 농축물은 표 4에 기술된 조건을 사용하여 분취용 HPLC에 의해 정제하였다. 액타가르딘 및 Ala(0)액타가르딘을 함유하는 각각의 분획(HPLC 및 LC-MS 분석에 의해 확인)은 상기 기술된 바 와 같은 C18 본드 엘루트 칼럼을 사용하여 탈염시킨 후, 증발건조시켰다.
표 4. 액타가르딘 및 Ala(0)액타가르딘을 분리하기 위한 분취용 HPLC 조건
칼럼 캐피톨 HPLC 리미티드 C18 - BDS - HL5 - 26052 15cm x 20mm
용매 A 20mM 인산칼륨(pH 7.0)중 30% 아세토니트릴
용매 B 20mM 인산칼륨(pH 7.0)중 65% 아세토니트릴
검출 268nm
유속 10ml/분
시간(T) = 0분 100% A
T = 1분 100% A
T = 19분 25% B
T = 20분 100% B
T = 25분 100% B
T = 26분 100% A
T = 30분 100% A
수집 출발 8분; 종결 20분; 1분 분획
아가로스 겔 전기영동
문헌 [Sambrook et al., 1989]에 기재되어 있는 바와 같이 DNA의 전기영동을 수행하였다. UV 광에 의해 DNA를 시각화할 수 있도록 최종 농도로 0.1㎍/ml의 에티듐 브로마이드를 함유하는 TAE 완충액에서 아가로스 겔(0.7-1%)을 제조하였다. 0.1 용량의, 10 x 아가로스 겔 로딩 용액을 샘플과 혼합하였다. 샘플을 100bp, 1 kb, 또는 람다 DNA-HindIII 분해 래더(NEB)를 따라 겔 상에 로딩하고, 1-5V/cm로 전개시켰다. 겔을 λ = 300nm에서 시각화하고, UVP 비디오 카메라를 사용하여 사진촬영하였다.
아가로스 겔로부터의 DNA 회수
아가로스 겔로부터 DNA를 절단하고, 퀴아퀵(Qiaquick) 겔 추출용 키트(Qiagen)를 사용하여 회수하고, 멸균 역 삼투압 정제수, 트리스-HCl(10mM, pH 8.5) 또는 TE 완충액에서 용리시켰다.
말단 충전
제한 효소를 사용하여 DNA를 분해함으로써 형성된 3' 말단의 오목부를 충전시키는 것은 E. 콜라이 DNA 중합효소 클레노우 단편을 사용하여 수행되었다. 전형적인 반응에서, 250μM의 각 dNTP와 함께 1㎍ DNA당 1단위의 효소를 가하였다. 15-30분 동안 25℃에서 반응물을 인큐베이션하고, 최종 농도 10mM로 EDTA를 가하여 반응을 종결시켰다.
DNA 인산화
문헌 [Sambrook et al., 1989]에 기재된 방법에 따라 37℃에서 30분 동안 PCR 산물을 T4 폴리뉴클레오티드 키나제로 처리하였다. 20분 동안 65℃에서 인큐베이션하여 효소를 불활성화시켰다.
선형화된 벡터의 탈인산화
선형화된 벡터의 자가 결찰을 막기 위하여 제조사의 가이드라인에 따라 새우 알칼리성 포스파타제(SAP: shrimp alkaline phosphatase)를 사용하여 5'-인산염 기를 제거하였다. 전형적인 반응에서, DNA 제한 반응의 마지막 1시간 동안 제한 혼합물에 1단위의 SAP를 가하였다. 20분 동안 65℃에서 인큐베이션하여 효소를 불활성화시켰다.
결찰
문헌 [Sambrook et al., (1989)]에 기재되어 있는 바와 같이, 총 용량 15㎕중 1단위(U)의 T4 DNA 리가제를 사용하고, 16℃에서 12-16h 동안 인큐베이션하여 DNA 결찰을 실시하였다.
박테리아 배양물 유지
최종 농도 10%로 글리세롤과 함께 -80℃에서 0.5ml의 각 배양물을 냉동시켜 생육성 세포를 글리세롤 현탁액으로서 저장하였다. 배지 65 또는 ABB13 플레이트 상의 글리세롤 스톡 또는 발효 브로쓰로부터 50㎕를 스트리킹(streaking)하여 악티노플레인스 가르바디넨시스 및 악티노플레인스 리구리애의 단일 콜로니를 수득하였다.
중합효소 연쇄 반응
스트라타진 로보사이클러 그라디언트96(Stratagene Robocycler Gradient96) 상에서 중합효소 연쇄 반응(PCR: polymerase chain reaction)을 실시하였다. 전형적인 반응으로, 100-200ng 주형 DNA를 20pmol의 각각의 올리고뉴클레오티드 프라이머와 각 250μM의 dNTP와 혼합하였다. 호열성 DNA 중합효소 완충액은 제조사로부터 공급받았고, DMSO는 각 10% (v/v)의, 최종 용량 50 또는 100㎕의 반응 혼합물로 구성되었다. 1분간 변성(94℃), 1분, Y℃(어닐링) 및 30초 - 3분 신장 (72℃)의 초기 싸이클로 전형적인 반응을 시작하였는데, 이 시점에서 5 단위의 호열성 DNA 중합효소를 가하였다. 이어서, 1분간 94℃, 1분간 Y℃(어닐링) 및 X분 동안 72℃에서 30 싸이클, 및 2X분 동안 72℃에서 최종 싸이클이 수행되었다. 신장 시간 X는, Taq 중합효소가 사용될 경우, 산물 1kb당 1분이었고, Pfu 중합효소가 사용될 경우, 산물 1kb당 2분이었다. 어닐링 온도 Y는 pAGvar1 및 pAGvar2 생성시 각각 55℃ 및 49℃였다. SBdel-1 및 SBdel-2 생성된 사용된 조건은 리디렉트 프로토콜(문헌 [Gust et al., 2004])에 기재되어 있는 바와 같았다.
프라이머
Figure 112008052958573-pct00019
플라스미드 DNA 제조
적절한 항생제를 함유하는 5ml의 멸균 2TY 또는 LB에 2TY(또는 LA) 아가 플레이트로부터 채취된 단일 콜로니를 접종하여 플라스미드 DNA를 소규모로(20㎍ 미만의 시료) 제조하였다. 배양물을 37℃, 250rpm에서 밤새도록 (12-16 h) 인큐베이션하였다. 1분 동안 12,000 x g에서 원심분리하여 세포를 수집하고, 제조사의 가이드라인에 따라 위저드(Wizard)(Promega) 미니프렙(Miniprep) 키트를 사용하여 플라스미드 DNA를 수득하였다. 100㎍ 이하의, 보다 큰 플라스미드 DNA 시료의 경우, 30ml의 2TY 배양물을 배양하고, 제조사의 설명서에 따라 퀴아젠 미디-프렙 키트(Qiagen Midi-prep kit)를 사용하여 플라스미드 DNA를 추출하였다. 모든 플라스미드는 제한 분석 및/또는 서열 분석의 조합에 의해 체크하였다.
코스미드 DNA 제조
적절한 항생제를 함유하는 50ml의 멸균 2TY 또는 LB에 2TY(또는 LA) 아가 플 레이트로부터 채취된 단일 콜로니를 접종하여 코스미드 DNA를 제조하였다. 배양물을 37℃, 250rpm에서 밤새도록 (12-16h) 인큐베이션하였다. 20분 동안 4,000rpm (Heraeus sepatech Megafuge 2.0R)에서 원심분리하여 세포를 수집하고, 제조사의 가이드라인에 따라 퀴아젠 미디-프렙을 사용하여 코스미드 DNA를 단리하였다.
전기적격 E. 콜라이 세포의 제조 및 형질전환
문헌 [Dower et al.. (1988)]의 방법에 의해 전기적격 E. 콜라이 DH10B를 제조하였다. 분취량(60㎕)의 적격 세포를 얼음 상에서 해동시키고, 1.8㎕의 결찰 혼합물 또는 플라스미드 DNA를 가하였다. 혼합물을 전기천공 큐베트(Sigma 0.1cm)에 놓고, 전기천공 장치(Stratagene 천공 장치-1000)로 옮겨 놓았다. 1.8kV/mm (25 μF, 200 Ω)의 전위차를 가하고, 이어서, 0.5ml의 2TY 또는 LB 배지를 가하였다. 이어서, 세포를 45-60분 동안 37℃에서 인큐베이션하여 항생제 내성 유전자을 발현시키고, 이후, 적절한 선택성 배지 상에 플레이팅하였다.
게놈 DNA 제조
문헌 [Kieser et al., 2000]에 기재되어 있는 방법을 사용하여 게놈 DNA 주형을 제조하였다.
악티노플레인스 종을 위한 접합 방법
문헌 [Heinzelmann et al. (2003)]에 기재된 방법에 따라 E. 콜라이와 악티노플레인스 종 사이의 유전자간 접합을 실시하였는데, 단, 예외적으로, 균주 E. 콜라이 ET12567/pUB307(문헌 [Flett et al., 1997]) 대신 균주 E. 콜라이 ET12567/pUB8002(문헌 [Kieser et al., 2000])가 사용되었다. 50㎍/ml 날리딕스산 및 관련된 선택성 항생제를 함유하는 배지 65 또는 ABB13 상에서 대략 1㎠의 면적에 걸쳐 외부 접합체를 옮기고, 패치 아웃하였다. 이들 플레이트를 4-7일 동안 30℃에서 인큐베이션한 후, 브로쓰 배양용 접종물로서 사용하였다.
스트렙토마이세스 종을 위한 접합 방법
문헌 [Kieser et al., 2000]에 기재되어 있는 방법에 따라 E. 콜라이와 스트렙토마이세스 종 사이의 유전자간 접합을 실시하였다. 50㎍/ml 날리딕스산 및 관련된 선택성 항생제를 함유하는 SFM 상에서 대략 1㎠의 면적에 걸쳐 외부 접합체를 옮기고, 패치 아웃하였다. 이들 플레이트를 4-7일 동안 30℃에서 인큐베이션한 후, 브로쓰 배양용 접종물로서 사용하였다.
표 5. 박테리아 균주
명칭 설명/용도
악티노플레인스 가르바디넨시스
ATCC31049
액타가르딘 생산을 위한
생합성 유전자 클러스터의 단리
악티노플레인스 가르바디넨시스 Δ actA 유전자가 제거된
악티노플레인스 가르바디넨시스 ATCC31049
actA 변이체 actA 유전자의 발현
악티노플레인스 리구리애 NCIMB
41362
데옥시-액타가르딘 B. 생산을 위한 생합성 유전자 클러스터의 단리
변이체 ligA 유전자의 발현
에스케리키아 콜라이
XL1-Blue MR
코스미드 라이브러리의 생성
에스케리키아 콜라이
DH10B
통상적인 클로닝
에스케리키아 콜라이
ET12567
비메틸화된 DNA의 단리
에스케리키아 콜라이
ET12567/pUZ8002
접합을 통한 DNA의 유전자간 전달
에스케리키아 콜라이
BW25115/pIJ790
람다 레드 재조합 플라스미드 pIJ790을 함유하는 균주. FLP 인식 부위 측면에 위치하는 카세트의 표적화된 재조합을 촉진시킨다.
에스케리키아 콜라이
DH5α/BT340
파쇄 카세트의 FLP-매개 절단을 촉진시키는 플라스미드 BT340을 함유하는 균주
마이크로코커스 루테우스
ATCC4698
생물검정법 시험 유기체
스트렙토마이세스
리비단스 1326
이종성 발현을 위한 숙주 유기체
스트렙토마이세스
코엘리컬러 B757
이종성 발현을 위한 숙주 유기체
스트렙토마이세스
신나모뉴스 DSM
40005
이종성 발현을 위한 숙주 유기체
항생제
항생제 저장액을 물에서 제조하고(달리 언급되지 않는 한), 0.22μm 밀리포어(Millipore) 필터를 통과시켜 필터를 멸균시켰다. 에탄올에 용해된 용액은 멸균시키지 않았다(문헌 [Sambrook et al., 1989]). 모든 항생제를 -20℃에서 저장하였다. 아프라마이신가 사용되는 배지에서는 MgCl2를 10mM(2.5M의 스톡으로부터)의 최종 농도로 가하였다.
저장액 실험 농도
앰피실린(amp: Ampicillin) 100mg/ml 100㎍/ml
아프라마이신(apra: apramycin) 100mg/ml 50㎍/ml
카르베니실린(car: Carbenicillin) 100mg/ml 100㎍/ml
클로람페니콜(cm: Chloramphenicol) 에탄올중 25mg/ml 25㎍/ml
카나마이신(kan: Kanamycin) 50mg/ml 50㎍/ml
날리딕스산(na: Nalidixic acid) 25mg/ml 25㎍/ml
카세트
명칭 크기
(bp)
공급원 설명/용도
SBdel-1 1462 프라이머 O/SB50F 및 O/SB51R, 및 주형으로서 pIJ773을 사용한 PCR 전달 기점(oriT) 및 FLP 인식 표적 부위 측면에 위치하는 아프라마이신 내성 유전자 함유. 5' 및 3' 부위는 악티노플레인스 가르바디넨시스로부터의 actA 유전자 측면에 위치하는 DAN와 상동성이다.
SBdel-2 1462 프라이머 O/SB52F 및 O/SB53R, 및 주형으로서 pIJ773을 사용한 PCR 전달 기점(oriT) 및 FLP 인식 표적 부위 측면에 위치하는 아프라마이신 내성 유전자 함유. 5' 및 3' 부위는 SuperCos1로부터의 앰피실린 내성 유전자 측면에 위치하는 DAN와 상동성이다.
HEapra 5247 pMJCOS1 pMJCOS1로부터 단리된 SspI 단편. 카세트는 아프라마이신 내성 유전자, 전달 기점(oriT), 부착 부위(attP) 및 φC31 인테그라제로 구성된다.
벡터
명칭 크기
(kb)
내성 마커 공급원 설명/용도
pAGvar1 3.1 amp 본 연구 프라이머 O/AGvar01bF 및 O/AGvar02bR, 및 SmaI를 사용하여 앞서 분해된 pUC19로 클로닝된 주형 pLITAG01을 사용하여 생성된 449bp PCR 단편
pAGvar2 2.8 amp 본 연구 프라이머 O/AGvar05F 및 O/AGvar06R, 및 SmaI를 사용하여 앞서 분해된 pUC19로 클로닝된 주형 pLITAG01을 사용하여 생성된 91bp PCR 단편.
명칭 크기
( kb )
내성 마커 공급원 설명/용도
pAGvar3 3.2 amp 본 연구 XbaI를 사용하여 앞서 분해된 pAGvar2로 클로닝된 XbaI 단편(~450bp)
pAGvar4 3.3 amp 본 연구 BglII 및 AvrII를 사용하여 앞서 분해된 pAGvar3에 결찰된, 어닐링된 올리고뉴클레오티드 O/AGvar03F, O/AGvar04R
pAGvarX 6.3 apra 본 연구 EcoRI/XbaI를 사용하여 앞서 분해된 pSET152에 결찰된 pAGvar4로부터의 XbaI-EcoRI 단편(~650bp). 변이체 액타가르딘 유전자는 조립될 수 있고, 부착 부위 attP를 통해 숙주 염색체 내로 도입될 수 있다.
CosAL02 47.2 amp 및 neo. 본 연구 BamHI를 사용하여 앞서 분해된 SuperCos1로 클로닝된 악티노플레인스 리구리애로부터의 40402 bp Sau3AI DNA 단편
CosAL02HEapra 49.1 amp 및
apra.
본 연구 네오마이신을 코딩하는 유전자가 HEapra 카세트로 대체된 CosAL02
CosAG14 45 amp 및
neo
본 연구 BamHI를 사용하여 앞서 분해된 SuperCos1로 클로닝된 악티노플레인스 가르바디넨시스로부터의 38168 bp Sau3AI DNA 단편
CosAG14ΔA 46.3 amp, neo
및 ampra
본 연구 actA 유전자가 카세트 SBdel-1로 대체된 CosAG14
CosAG14ΔB 44.9 amp 및
neo
본 연구 카세트 SBdel-1이 FLP-리컴비나제에 의해 제거되어 81bp의 스카(scar)가 남아있는 CosAG14ΔA
CosAG14ΔC 45.5 neo 및
apra
본 연구 앰피실린 내성 유전자가 카세트 SBdel-2로 대체된 CosAG14ΔB
CosAG14HEapr 46.9 amp 및
apra
본 연구 네오마이신을 코딩하는 유전자가 HEapra 카세트로 대체된 CosAG14
pIJ773 4.3 amp 및
apra
노리치에 소재하는 존인스센터(John Innes Centre)
(JIC)
카세트 SBdel-1 및 SBdel-2를 생성하는데 사용되는 리디렉트 주형(문헌 [Gust et al., 2003])
pLITAG01 6.1 amp 본 연구 NcoI를 사용하여 앞서 분해된 pLITMUS28로 클로닝된, 악티노플레인스 가르바디넨시스로부터 단리된 3263bp NcoI 단편(19955-23217 CosAG14rc)
pLITMUS28 2.8 amp 뉴잉글랜드 바이오랩스
(NEB: New England BioLabs)
통상의 클로닝
pMJCOS1 9.8 amp 및 apra 노리치에 소재하는 JIC 네오마이신을 코딩하는 유전자가 아프라마이신 내성 유전자, oriT, attP 및 øC31 인테그라제로 구성된 SspI 단편으로 대체된 SuperCos1. HEapra 카세트 공급원
pSET152 5.7 apra NRRL
B14792
attP 부위를 통한 숙주 염색체 내로의 DNA 도입을 촉진시킬 수 있는 접합 플라스미드
SuperCos1 7.9 amp 및 neo 스트라진 독특한 클로닝 부위 측면에 위치하는 T3 및 T7 프로모터 영역
pUC19
2.7 amp NEB 통상의 클로닝
고성능 액체 크로마토그래피
하기 기술하는 파라미터와 함께 휴렛 팩커드(Hewlett Packard) 1050 시리즈 HPLC 시스템을 사용하여 HPLC 분석을 실시하였다:
칼럼: 조박스(Zorbax) SB-C18, 4.6x150 mm, 5μ
이동상 A: 20mM 인산칼륨 완충액(pH 7)중 30% 아세토니트릴
이동상 B: 20mM 인산칼륨 완충액(pH 7)중 65% 아세토니트릴
유속: 1ml/분
구배: 시간 0분 100% A 0% B
시간 10분 0% A 100% B
시간 11분 0% A 100% B
시간 11.2분 100% A 0% B
주기 시간 15분
주입량: 10㎕
검출: 210nm
고성능 액체 크로마토그래피 - 질량 분광법( HPLC - MS )
하기 기술하는 파라미터와 함께, 마이크로매스 플랫폼 LC(Micromass Platform LC)(MassLynx 버전 3.5 소프트웨어로 작동)에 연결된 휴렛 팩커드(Hewlett Packard) 1050 시리즈 HPLC 시스템을 사용하여 HPLC 분석을 실시하였 다:
칼럼: 애질런트(Agilent) 조박스 SB-C18 150 x 4.6mm 5μ
유속: 1ml/분
이동상: A 10% 아세토니트릴, 0.1% 포름산, 90% 물.
B 90% 아세토니트릴, 0.1% 포름산, 90% 물.
10분간의 선형 구배 A 내지 B, 체류 시간 1분, B-A
파장: 200-400nm
주입량: 10㎕
포스트 칼럼 스플릿트: 1:10
질량 분광계: 마이크로매스 플랫폼(Micromass Platform) LC
모드: 전기분무 양성
질소 유속: 380l/hr
모세관 전압: 40V
스키머 렌즈 오프세트(Skimmer lens offset): 5V
기탁
노박타 바이오시스템스 리미티드(Novacta Biosystems Limited)는 부다페스트 조약 하에 2005년 12월 7일자로 영국 에이비21 9와이에이 스코틀랜드 애버딘에 소재하는 NCIMB 리미티드(NCIMB Ltd.)에 NCIMB 41362를 기탁하였다.
참고 문헌
Figure 112008052958573-pct00020
Figure 112008052958573-pct00021
Figure 112008052958573-pct00022
Figure 112008052958573-pct00023
Figure 112008052958573-pct00024
Figure 112008052958573-pct00025
Figure 112008052958573-pct00026
Figure 112008052958573-pct00027
Figure 112008052958573-pct00028
Figure 112008052958573-pct00029
Figure 112008052958573-pct00030
Figure 112008052958573-pct00031
Figure 112008052958573-pct00032
Figure 112008052958573-pct00033
Figure 112008052958573-pct00034
Figure 112008052958573-pct00035
Figure 112008052958573-pct00036
Figure 112008052958573-pct00037
Figure 112008052958573-pct00038
Figure 112008052958573-pct00039
Figure 112008052958573-pct00040
Figure 112008052958573-pct00041
Figure 112008052958573-pct00042
Figure 112008052958573-pct00043
Figure 112008052958573-pct00044
Figure 112008052958573-pct00045
Figure 112008052958573-pct00046
Figure 112008052958573-pct00047
Figure 112008052958573-pct00048
Figure 112008052958573-pct00049
Figure 112008052958573-pct00050
Figure 112008052958573-pct00051
Figure 112008052958573-pct00052
SEQUENCE LISTING <110> Novacta Biosystems Limited Boakes, Steven Cortes Bargallo, Jesus Dawson, Michael J <120> Lantibiotic Biosynthetic Gene Clusters from A. garbadinensis and A. liguriae <130> AHBCP6415491 <140> PCT/GB2007/000138 <141> 2007-01-17 <150> GB 0600928.6 <151> 2006-01-17 <160> 318 <170> PatentIn version 3.3 <210> 1 <211> 19 <212> PRT <213> Actinoplanes liguriae <400> 1 Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu Val 1 5 10 15 Cys Ala Cys <210> 2 <211> 19 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Primary polypeptide sequence of Actagardine B variant V V <400> 2 Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val Val 1 5 10 15 Cys Ala Cys <210> 3 <211> 19 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Primary polypeptide sequence of Actagardine B variant L I <400> 3 Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu Ile 1 5 10 15 Cys Ala Cys <210> 4 <211> 19 <212> PRT <213> Actinoplanes garbadinensis <400> 4 Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val Ile 1 5 10 15 Cys Ala Cys <210> 5 <400> 5 000 <210> 6 <400> 6 000 <210> 7 <400> 7 000 <210> 8 <400> 8 000 <210> 9 <400> 9 000 <210> 10 <400> 10 000 <210> 11 <211> 20 <212> PRT <213> Actinoplanes liguriae <400> 11 Ala Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu 1 5 10 15 Val Cys Ala Cys 20 <210> 12 <211> 20 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Primary polypeptide sequence of Ala-Actagardine B variant V V <400> 12 Ala Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val 1 5 10 15 Val Cys Ala Cys 20 <210> 13 <211> 20 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Primary polypeptide sequence of Actagardine B variant L I <400> 13 Ala Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu 1 5 10 15 Ile Cys Ala Cys 20 <210> 14 <211> 20 <212> PRT <213> Actinoplanes garbadinensis <400> 14 Ala Ser Ser Gly Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val 1 5 10 15 Ile Cys Ala Cys 20 <210> 15 <400> 15 000 <210> 16 <400> 16 000 <210> 17 <400> 17 000 <210> 18 <400> 18 000 <210> 19 <400> 19 000 <210> 20 <400> 20 000 <210> 21 <400> 21 000 <210> 22 <211> 64 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Primary polypeptide sequence of pre-pro-Actagardine B variant V V <400> 22 Met Ser Ala Ile Thr Val Glu Thr Thr Trp Lys Asn Thr Asp Leu Arg 1 5 10 15 Glu Asp Leu Thr Ala His Pro Ala Gly Leu Gly Phe Gly Glu Leu Ser 20 25 30 Phe Glu Asp Leu Arg Glu Asp Arg Thr Ile Tyr Ala Ala Ser Ser Gly 35 40 45 Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val Val Cys Ala Cys 50 55 60 <210> 23 <211> 64 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Primary polypeptide sequence of pre-pro-Actagardine B variant L I <400> 23 Met Ser Ala Leu Ala Ile Glu Lys Ser Trp Lys Asp Val Asp Leu Arg 1 5 10 15 Asp Gly Ala Thr Ser His Pro Ala Gly Leu Gly Phe Gly Glu Leu Thr 20 25 30 Phe Glu Asp Leu Arg Glu Asp Arg Thr Ile Tyr Ala Ala Ser Ser Gly 35 40 45 Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu Ile Cys Ala Cys 50 55 60 <210> 24 <400> 24 000 <210> 25 <400> 25 000 <210> 26 <400> 26 000 <210> 27 <400> 27 000 <210> 28 <400> 28 000 <210> 29 <400> 29 000 <210> 30 <400> 30 000 <210> 31 <400> 31 000 <210> 32 <400> 32 000 <210> 33 <400> 33 000 <210> 34 <400> 34 000 <210> 35 <400> 35 000 <210> 36 <400> 36 000 <210> 37 <400> 37 000 <210> 38 <400> 38 000 <210> 39 <400> 39 000 <210> 40 <400> 40 000 <210> 41 <400> 41 000 <210> 42 <400> 42 000 <210> 43 <400> 43 000 <210> 44 <400> 44 000 <210> 45 <400> 45 000 <210> 46 <400> 46 000 <210> 47 <400> 47 000 <210> 48 <400> 48 000 <210> 49 <400> 49 000 <210> 50 <400> 50 000 <210> 51 <400> 51 000 <210> 52 <400> 52 000 <210> 53 <400> 53 000 <210> 54 <400> 54 000 <210> 55 <400> 55 000 <210> 56 <400> 56 000 <210> 57 <400> 57 000 <210> 58 <400> 58 000 <210> 59 <400> 59 000 <210> 60 <400> 60 000 <210> 61 <400> 61 000 <210> 62 <400> 62 000 <210> 63 <400> 63 000 <210> 64 <400> 64 000 <210> 65 <400> 65 000 <210> 66 <400> 66 000 <210> 67 <400> 67 000 <210> 68 <400> 68 000 <210> 69 <400> 69 000 <210> 70 <400> 70 000 <210> 71 <400> 71 000 <210> 72 <400> 72 000 <210> 73 <400> 73 000 <210> 74 <400> 74 000 <210> 75 <400> 75 000 <210> 76 <400> 76 000 <210> 77 <400> 77 000 <210> 78 <400> 78 000 <210> 79 <400> 79 000 <210> 80 <400> 80 000 <210> 81 <400> 81 000 <210> 82 <400> 82 000 <210> 83 <400> 83 000 <210> 84 <400> 84 000 <210> 85 <400> 85 000 <210> 86 <400> 86 000 <210> 87 <400> 87 000 <210> 88 <400> 88 000 <210> 89 <400> 89 000 <210> 90 <400> 90 000 <210> 91 <400> 91 000 <210> 92 <400> 92 000 <210> 93 <400> 93 000 <210> 94 <400> 94 000 <210> 95 <400> 95 000 <210> 96 <400> 96 000 <210> 97 <400> 97 000 <210> 98 <400> 98 000 <210> 99 <400> 99 000 <210> 100 <211> 38168 <212> DNA <213> Actinoplanes garbadinensis <400> 100 gatcggccgc cgtcagctgg agaagcgctg gctggcgcgg ctcacccgca acggccaccc 60 gcatccgacc cgggcgctgg cgctgcggat gggcgcggtg gagttcgcgg ggcagctggc 120 gctgcagctc gccgacatgc gcaagcccgg cacgccgtca gcgacctgac ccgctgctcg 180 acgcagctcg ctcgccggtc ccgcgccgcg ccgatcaact ccggcagcac ggcgcgagct 240 tcaatcagcc ggcccggcgc accccctacg ccggtgcgac gaggcatgcc cgagaccagc 300 gcggccgcag agggccggtc ggcgccggac cggtcagcgc gcccgcaatc aggccggcag 360 gcccgcccgg agccggaccg gtcggcgcgc ccgcaatcag gccgacaggc ccgcccgggg 420 tcaggctggt cggctgcgcc gggccggcag gccggcgagc agcgcgtcga gcgtctcggc 480 atccgcccag ccgttgactg acactgcgcc tgccgccgtg accgtgacct caaggcggtc 540 cggtgtcacc gccacgtcga tcggcgcgtc ctcgatgcgg tcgctcaagc ggatgaactg 600 ctggttcgtc gagccgaccc agggccgctc gtggtccagc aggtcctgcc ggaaggggcc 660 ggccaccagc aggtccgtgg cgtcgagcag tgcggcgacg tcggcccggc cgtccgcggc 720 gagagcgcgc agacgggcgt actcgtagcc ggtgaacgtc atgaccgagc gacccgcctg 780 ccgcaccccg gcggccaccg cggcgagacc ggccgcctgc tcgaacggct cgccgccgag 840 cagggtgaca cccgtggtgc ccgtggcgag cactcggtcc accaactcgg cgggtgcggc 900 cggcacccca ccgcgtacgc cgaacaaatg cggattgaag catccggcgc accggatggt 960 gcaaccctgc acccagatcg cggtccgctc gcccggtcct tcggcggtgg tccggtcgag 1020 gaaccgggcc acccgcacga gcggcggctc agacatcgac tatccgaccg aaaggcgtct 1080 ggttcgcttg cggcggcggc tcgcacgaca gccggtcccg gaccgcgacg aactcgtgtg 1140 gtgcgagccc ggccacggcc gcgaactcgc cgagactggc gaatccgccc cgcgcctgcc 1200 gcgccgccac gacgtccgcc acccgctgcg gggtgagacc gggcacggcg gccaactgtt 1260 gcgcgtccgc ggtgttgaca tcgagccgct cgggcgccgg ctccagcagc gagcccggca 1320 cacccccagc cggcgagccc agcgcgggct ccagcgggcc gggcgcgggc ccagcgggcc 1380 aggccgctgt gggctcagcc tgccggccgg ctgcgggctc agcctgccag cccgctgccg 1440 gctcagcctg ccagcccgct gccggctcag cctgccagcc cgctgccggc tcagcgggcc 1500 ggcccgccgc cggctcagcc agcgggcccc tcgcgggctc aggcccggga gtccctccgt 1560 agaactcttg cggcgaagga acgacaccct gtagttgcgg cggcagcgga gtcgccacgg 1620 gagcgggcgc gttcgcccac ggcgcctgct ggggctgcgc ataccacggc acgtgagcgg 1680 cacgccagcg cagccaggag gcgttgatga cgaacgcgtg cgcgacgctg atcggccaca 1740 ccatgaacat gatcgagaac gcgaggttct gctggagcga gtcctcggcg ccctcactgc 1800 cgagaaagaa gcagaagttg gccacgacgg tgtagaggat cccggcgatc caccacaccg 1860 gccgccgggc gcggatgccg acgtagagga acccgaccgc ggagaaacag ctgaagggca 1920 ccatcggcgc gatcacccag gcgctgtgcg cgaggcgcca cgacagccgc gccggcccgg 1980 tccgcttgcc cggctcgtga cctggatgcg gcggatagga cggatacggc tgctggtgag 2040 caggcgggaa cggcggcagc ggctgctgac cggaagcagg cgggaacggc ggcagcggct 2100 gcttgccgaa cgacggcggg tacgccggct gcgaggcggg atacgggtcc tggcccgggt 2160 taggcggtgt ccacgtcacg gttcacgatc cgttcccgcg cggtgtgcgc ctgacgcgtg 2220 taatccgcgg tgtacgcact gtgccgcacc tgcccgccga cgagatcctc cagaacggcc 2280 acgtagtcca ggcagcgctc gccgagaatg tccacggtct cggcactgac ctggccgtcg 2340 ggaccgaccg tgacgacgat ccgaggattc tccgtcatgc ccgctccctc tccacctcga 2400 agaccaggcg cacactggcg tcctggccga ccgactccga ctccagccgc agcccggcct 2460 cgggcgcctg cgcgcgcagc cgctccagga cggcctgctg gacccgccgc ccgtacgcgg 2520 tgtcgacggt cgtcatcaac tcgacagccc ctggctgatc gacgccggtg acgtgcgcgg 2580 cccagatgcc gtccgcgccg cgggtgaacg tcgcggcgct ctgcgtccag gtcgccgaga 2640 tcgtgtcgcc ggcggccgtc acggtggctc cggtgtcgcg cagcgccgca tcgagcaggg 2700 tgacatcgcg catgcgggtc tgcacctggc agatcagccg gccgtcgtcc atccggcccg 2760 cggcggcctg aaccgcggcc gcgccggcca tcgccaacgg caccagcagc agtgaaacgc 2820 tcaccatgcc ccccgttctc gctgtggcca caccctatcg gcagggtgcg acaaatcatc 2880 ggttggtgag gtcccagtcg tcggtgccgg tggccgacac ggcgcgattg cgggcccagc 2940 cgcgcagggc gtcgacccgc tcggcctgcg tcacgctgag cggcacgatg ctcatcaccg 3000 cgcgtacgag atcgtcgcgc cgcagtgggc ggcgttcgga gaacgcgtcg aacagtcccg 3060 caatgaccgc ctgctctatc tccgcgccgg agtagccctc ggtcagcccg gccagctcgg 3120 tgagcagctc ggcatcgacc cgcagctcgc cggcggcacg ccggtgccgc agcgcccgcc 3180 cgaggtgcac ccgccacacc gcgacccgct cggaccggct cggcagatcc acgaagaacg 3240 tctcgtcgaa gcgtcccttg cgcaacagct ccggcggcag cccgtcgaag tcgttggccg 3300 tcgcgatcac gaagaccgga gtccgcttct cctgcatcca ggtgaggaag gtgccgaaga 3360 cccgggcacc ggtgccggaa tcacccccgg tgccgccggc gaagcccttc tcgatctcgt 3420 cgacccacag gacgcacggg gcgaccgcct ccgccgtacg caatgcggtg cgcatgttgt 3480 gctcgctgga accgaccagg ccggagaaga cacggccgat gtcgaagcgc agcagaggca 3540 ggttccaggc ggtcgcgacc gccttggcgg tcagcgactt gccgcagccc ggcacgccgg 3600 tgatcagtac gccgcgcggc gcgggcaggc cgtacccggc cgcctcgtcc agccaggatc 3660 cgttgcgttt gaccagccag gccttgaggt tctccaggcc gccgacgtcg tcgagcacgg 3720 ttccggcggc catgaactcc agcacgcccg atttgcgtac ggtctggcgc ttctcctcgt 3780 gcacgatctc caggtcggcc agatcgagca cggcgtcgtt caccatggcc cgggcgtacg 3840 cgttctccgc ctcctgcatg gtcaggccgg ccgcggccgt gacgaaccgc tcccggctct 3900 gctcgtcgag ctccacccgc agccgcccgg acgcggtgtt cccgcgcacc atggcgtcga 3960 gcagagcgcg caactccagc tggccgggca gcgggaagtc gacgatcgtg acgtccttgc 4020 tcagctcgac cggcaggtcc agtaccggcg agagcagcac gagtgtccgc gggctgcggc 4080 cggcccggaa cgcctgggcg atgtcgcgca ccagccggac gacctccggg ctctgcgcga 4140 acagcgggtg caggtcgcgg aagacgaaga cagccggttc gtcgatgcgc tgcaccgccc 4200 tgagcgcgtc ggtggcccgc tgcgcgcccg agcgggcctc gccgttcggc tggaccagac 4260 cggcggtcag cgaccaggtc cagacggcac gtggcacgcg gacgaggtcg gcgtcgccgg 4320 cgatgccggc gaggtggtgc agcgcccgct gctcctcgta cgtctcgagg tggagcaccg 4380 ggaaccgggc cttcaacagc tgcgcgaacg tctccgcgaa cgacctctcc accggcgcat 4440 cctacggccg cgccggccgg cgtgtcagag cccggacggg gtgccggtgg cgtcgcgtgc 4500 cgtccggtcc ttcccgcgct cgacgggttc gttgggttga tcggtcatgg catcctcctg 4560 ctcagtccgg gcggtagacg gcggtgtccc cggacacggc gccggggtcg taccccgagc 4620 ggccggtttc ctccgtggtg tcctgctcgt cagcgccggc gcctgtcgac tcgccgggtt 4680 tgcgcagtga cgccgcgtat gccggggttc cgtccggctc gtccgtggga tgccgctgga 4740 gttgttctcg gtcatcggtc atgaacggcg gacttccctg caagagcgcg gacaaacgtg 4800 gtcgtttatc ccgcagccgg gcgggcagtc gtccaccatg gaacccatcg gtgaccctga 4860 cgagcagacc ggcgacttcg ccgaagagca cgaactgacc gaggtgacag ccgaggagga 4920 cgacgacggc gagccggaga gcccggatcg ctggaccggc ggcatggact ccgacggtcc 4980 cccgtgacct gcggctacga tccctcacag gtgcccgccc cgccgacgac ccgaggttcg 5040 tagccgttgt cctccatcac cgagctgacc gagtccgtgc gtgccttcgc gcgcgagcgc 5100 aactgggagc agttccacac gccgaagaac ctcgcgatgg ccctggccgg cgaggtcggt 5160 gagcttctgg ccgagttcca gtggctgacg ccggaacaat cagccgcggt catgcgcgat 5220 cccgatctcg gcccgcgggt ccgggccgag atcggagacg tcacgatcta tctcgtacgc 5280 ctggcggacg tgctcggcat cgacctggtc gaggcggcca ccgacaagtt ggcggaagcc 5340 ggccgccgct acaccgtcga agccgcccgc gactcggccg ccaagatcga tcagctgtag 5400 ttcagcgaga agttgttgac cgtgaagttg gactgaccgg cggtgccgct gatctcgaag 5460 ccgaactgcg cctcgccgac cgtcacgtca ccccaccagc cgttggtgcg cagccagttc 5520 aggatcgcca ggatgtcgac ggtgccggag ttcgtgttgg tacggatgaa cgagaagacc 5580 gcgttggcgc cgttcgaccc gcggtagacg ttccaggtgt gcccgccgac ggacaggttg 5640 cggacgttcg gcaccgcgcc gttggcgtcg tactgttcgg cgatcggccc gaccgcgccc 5700 tgctggttgg tccagatcat gacctcgtag gcgtggttgt tcgcccagat gtcgtaggtc 5760 gtcgagtagt cgccgctgga cggcaccgac acgttgaagg agctcgtcag agaattgagc 5820 gagctcagcg tacggttgag ggtctttccg gtgttggggt aggacttgac cccgctggtg 5880 cgcgggtgat tcgcgacgac gccccagttg gtgccgctgc gcgcccagat ggtctgggtg 5940 ccggcgcccg agccccagat gttgttgtga ggatgtatcc gttgttggtc cagttcgccc 6000 actgtcccga gtcgacccag acggcgtcgc tcggtacgcc gttggtgggc ggctgcgagc 6060 tcgggctggt ggggccagcc gatccggtgc aggcggtccc gttgagcgtg aacgtgcccg 6120 gtgccggggt ggcggcgccg gagccgttga atccgaacga cacggtcgcg ttggtgccga 6180 cggatccgtt gtagccggcg ttgcgggcgg tgacctgcga tccgctctgg gtcaggctgg 6240 tgttccaggc ctgggtgacg gtctgcccgc cggagtagga ccagaccaac gtccagttcg 6300 tgagcggatc acccaggttg gtgatggtga cgttggcgcc gaagccgccg ggccactggc 6360 tgctcacggt gtaggcgacg cggcagccgg ccgcggcgga cgccgggagc gcggtgacga 6420 cgccggcacc ggcgatgagg gccgccgagg cggccaggga gagcgcgaga gtacgtctgc 6480 gcatgccgtt ccaatctcgg agggggaaca cacgacgctc gtcgaagcgc ttcgataatg 6540 aaggctgggg atctacgagt gtcgatgcgg gatgaggccg atgttacgac ccgccgccgc 6600 ggcgaggcaa ccgctacctt gggcgcatga cgatcaccga gaccgatctc gcccacctgc 6660 gccgatgcgt cgacctggcc cgcgaggccc tcgacgacgg cgacgagccg ttcggttccg 6720 tcctggtctc cgccgacggc aaggtgctgt tcgaggaccg caaccgggtg aggcacggcg 6780 acgccaccca gcacccggag ttcgcgatct cccgctgggc ggccgagcac ctgaccccgc 6840 gggagcgcgc cagcgcgacg gtctacacct cgggcgagca ctgcccgatg tgctcagcga 6900 gccacggctg ggtccgcctg ggccgcatcg tgtacgcggc gtcgagcgcc cagctgaccg 6960 cctggtacaa ggagtgggga atcccggcgg gcccggtcgc cccgctaccg atcaccacag 7020 tggtccccgg cgccgtcgtg gagggcccgg tcccagcctt cgaggccgag ctgcgggagc 7080 tacatcgcgc ccgcttcacc ccagcgcagt agccgccgga cgaaacccga cccttctcgc 7140 caatgaaccg gacctgcgag cgtgtctgga ttgaccgcgg aggcccgcaa cgccacaggc 7200 tcgatctccg tcaccgtcgg acctcagggg caggtcgagg atctgcgcct tgacgaccga 7260 gtgcatgacc tcccatccca ggaactgagc cagcagatcc tgacagtgat gcgaaaggct 7320 cagtaccagc tcaccgagta cgtctcggcg cacatccgtg acaccgtggg catggattcg 7380 gagaccggtc gcaatgtgct cgacgcgttc gcacagcgct tcccgctgcc ggagatgacc 7440 gatgagcgtt gagcaggtac agctgccgat cgacgtaatc aaccggcaca ccactaccat 7500 cgccgcaacc gccgatgccg tacggcaggc ccgcgccgcg gcaggtcagg cagccatgga 7560 ctcgcaagcg tacggccagt tgtgtcagtt cctgccgacc gcgttcagcg tcgtgttcga 7620 gagtgcgatc gtcgccatga ccggcagcgc cgaagcgttg caggaaacca ccttcaacct 7680 gcaggatgcc gtcacgacgt tcagatacac cgacgagtcg gccgctcgca ccatcgcctc 7740 cgcaggttcg ccgccgtgac cacaccactt gtcgcccaag ccggggactc caccacggga 7800 ttgaccggtc tggggctcgt ggaggacgcc caccagatcg cagaagccat ccgcgggaac 7860 agttgggtcg acggcgtcct cggcggagtc ggggccagcc tcgacggtct ggcgctggcg 7920 atcgacccgc tcggcaccct tgccgcctgg ggcgtcgcct ggctcatcga gcacgtccaa 7980 ccgctacaag acgccctgga ctggctggcc ggcgacgtcg acgagatagc cgcccaagcc 8040 gccacctggc gcaacgtcgc cgccttcacc gacagcgccc agcaggatta cgccgatcgg 8100 ctccgcaccg aggtcgccgg ctggttcggc gcctccggcg acgcataccg ggcccatgcc 8160 agcgaacact tggccgcact gaaaggcatc agcaccgcag ccggcggcat ttcgtccgcc 8220 gtcgaaggcg ccggcctgct cgtcagcctg gtgcgcggaa ttgtccgcga cctgatcgcc 8280 cagttcgtcg ccactctggc cgttcggctg ccacaatggc tcgccgccga aggactcact 8340 ctgggcctcg ccacccccgt tgtcgcgagc caagttgccg ccctcgtcgc ccgcggggtc 8400 aacaagatcc agcacttcat acgggcgctg ctcaacagcc ttcgacggct gatgcccatg 8460 atcgaccggc tgggtgaagt cctggagcgg ctccgcatgc tcaccgaccg gctcgcaagg 8520 tccagcccct ccacccgccc ggagccgaca cccggccccg ctactcacgc cggaaccgag 8580 aacgcatcgg gaaacaagcc cgagggcgac ctcgaaccga acgaaccgcg cccggccgag 8640 gctgacgcca gagacagtac gcctcaggcg ttcgtggacg aggtcgtcag caacccccgg 8700 tcagtcgcgg gacactccgc gcagtccatc gcggaccagt tcaacgccgc cggatactct 8760 gcggtcgtcg agcagagcac caggagcggc acctcgggga acgccatcca ggtacgcatt 8820 cacggccacc cggatatcac caacatccag gtgcatccgg gaggaggacg gcacacgccg 8880 gaggggtccc cgtattggaa aatttcgacg aatacggtcg ggaagatctg gatcatcccc 8940 gaaaatttcc ggggcgccga tgaactgcgt gggaatgtgg tgcgctatga caaataagat 9000 catcaaagtg gatcgggtgg gatccgcggg ggaagctgcc acgctcgtcg ccctgggcgt 9060 cgacatcgtc ggggtcgatc ttcgtcctga tccgcgattc gttgatgatc gcacgctgga 9120 cgccgaacag gttcgccaca tccgcgaagc gctgccgcac acgacgctgg ccgtcaccat 9180 ggacaccggc accgagccgg accatgtcgt cgaactcgca aggcgaatcg gcgcggatct 9240 ggtccagtcg atcaacggtg tcatcccgcc gctcccagta cgcgtcgccc tgcgcaaggc 9300 cgacatcgcg attgtctatg cgggcacaga gatctcccac gacgacgatc ccggctgggt 9360 cttcagcgcg tacgacgaca ctccggacct gaacgccgcc ctgtttcaag tggaggtgct 9420 tccggagtac ctcgattcct gggagtttct gcgtgaccgc tccccggaat atgccgacga 9480 gttccagatc gaagatctcg acgacctcgg acgcgctcgc cccttggttg ccggcctgaa 9540 tctcacggct cagaacctcg acgagatcag ggcacggctt ccccacgtcc gcggtctggc 9600 gctcaccctc gcgcacgagg ccgcgaggag cgacgcgcgg ttcttcatgt ttccccacgt 9660 agtggacatc ctttcgggag actcgtccgg gtgaccggca tcgcgcggga gggggctggt 9720 gtcgcagagt caggctgacg gcattccggc gggcctgacg ggaggaacct catgaccggg 9780 ctgttcacca tgcgcaagca cgaggagggc gccggggagg ttcggatcgt cgtgagcggc 9840 gagatcgacg gcgatgtcag cgcggcgctc accctgttca tcgccaacgc cgccgagcag 9900 gacggtgtcc gatcggtgct ggtggatctg gagccggtgc tgctgctggc cgcagccggg 9960 atccggtgcc tgctgagcgg ccgtgaggcg gctctgctgc agggctgctc ctacgagctg 10020 gtcaacgtcc ggcacgaggt cgcggattca ctgcacgccg ccggcgtggc agatctgctg 10080 ctcaccctgc cggtccgctg agccggctca gctcgggtcg tcgaagccct cgtcggcgcg 10140 ttcgcggcgc aggtgtgcct cggcccggcg cgcctggtca cccttctccg ctgccagccc 10200 ggcgtacatg gcctgcacct tctcgtacgg ctggccgggc ggcagcagcg ggatcgccgg 10260 atcgaccacg gcctcgatca gcgtcgggcg gtccgcggac agcgccgcct cccacgcgcc 10320 ggtcaggtcg gacgggtcgg tgatccgcac tccgcgcagg ccgagcagct cggcgtagcg 10380 cgcgtacggg acgtcgggca gttcctgcga cgtgacgaag cgcggctcgc cctcggtctc 10440 gcgctgctcc cagctgacct cggccaggtc ccggttgttc agcacgcaca ccacgaagcg 10500 cgggtccgcc cagtcgcgcc agcgggcggc caccgtgatc agttccgcca tgcccgccat 10560 ctgcatcgcg ccgtcgccgg ccagcaccac gaccgggcgt tgcggcgccg ccagcttggc 10620 ggcgagaccg tacggcaacc cgcaccccat cgacgccagc gtgctggaca gatgcgccgg 10680 gacaccgcgg ggcagccgca ggtgccgggc gtaccagtag acgaccgagc cgacgtcgac 10740 cgcgacctgc gcgtccgcgg gcaggtggtc ggagagggag cgaatcacgt gctgcgggtt 10800 gaccggttcg gcgggcgccg cggcccgggc cgcgctgatc aggcgccagc gctgcaccca 10860 ttcctccacg cgggcgcccc aggcgccgct tgcccggctg ggcagcagtc cgagcagctc 10920 acgcaaggtt tccacggcgt cgcccaggag cgggacctca accggatacc gtacgcccag 10980 acggcgcccg tccacgtcga tctgtacggc ccgcgcctgc cccggccggg gatagaactc 11040 ggtccacggg tcgttcgtgc cgatcagcag cagcgtgtcg cagtgccgca tcagctcggc 11100 gctggccgtg gtgcccaggt gccccatgac gccggtgtgg aacggcaggt tctcgtcgag 11160 gaccggcttg ccgagcagcg aggtggtcac gccggcaccg agccgctgcg ccagctcgac 11220 gatctcgcgc tccgcgccgt acgctccctg ccccaccatg atcgccaccc gctcgccgga 11280 gcggagcacc tcggccgcct cgcgcaggtc ttccgggcgg ggcaccaccc gggcggggcg 11340 cagccccgcg ctcgtcgcca gcacaccgtg ctcatgcgcc tgcgggtcgg gcgccggggc 11400 cgtctgtacg tcgtgcggca ggaccacgca ggtcgggctg cgggtcgcga gcgcggtgcg 11460 gaacgcgcgg tcgaggagca tcggcacctg ctcgctcgtg tgcgcggcct gcacgaactg 11520 ggcgcacacg tcgccgaaga gccgcaccag gtcgatctcc tgctggtacg cgctgccgag 11580 caccgtcgag acctgctggc cgacgatcgc gacgaccggt ttggagtcga gtttcgcgtc 11640 gtagaggccg ttgagcaggt gcaccgcgcc gggaccctgg gtggcgaggc agactccggc 11700 accaccggtg tacttggcgt ggccgacggc catgaacgcc gcgccctcct cgtgccgggc 11760 ctgcacgaag gtgggccggc cggcccggcg cagcgctccg atcacgccgt cgatgccgtc 11820 cccggagtac ccgaagaccc gttccacgtc ccacgcggtc agacgctcca cgaccacgtc 11880 cgacacggtc cgctccgtca ccgctgcctc ctcacgtcac accgggggct acccgctcag 11940 ccgcgcggta ctcgccttgc gcgaaatgcg actcgcgtgc acctcacggg ccgggcggac 12000 gcggcacgga tctgagctgg ttcccgcccg gttctgatcc cctgtgatcg gggtacacac 12060 gtgcggtgag cagggacaag acgtaccggc cggtccgtcc cgacgggatc cggaccacct 12120 tccacgacgg tgtactcggg cgcatgcgga tccggtgcct gggcgagccg cgtccgggcg 12180 taccggagat cgtgatgatc cagggtatga ccgtgagtga ctatctgctg ccgggtctgg 12240 gcgcgctcag cgcctggacc cgggtgcacc tggtggagct gccgggaggc agcggcagcg 12300 gccggccgcc gcacgatctc acggtcgagg agtacgcgcg ggccgcggcc gactggctgt 12360 gcgcccagcg cctgggccgg atcgtgctgg ccggccattc gagcggcacg caggtggcgg 12420 cggagaccgc gctgttgtgc ccggacgagg tggccggagt ggtgctggcc ggcccggcga 12480 tcgacccggt ggcccgcggc ggcctgcggg tcttcgcgcg ctggtggatc gaccggcgcg 12540 gcgacccgaa gagcctggac gaggtgcaca aacccgaacg cgagcaggtc gggttccggc 12600 ggctgttcca ggtgctgcgc gcccacctgc gtcacgacct ggagaagccg gtggtcgggc 12660 tctgcgtgcc ggtgctggtc atccgcggca gcgaggaccg gctcggcacc gcgcggtggg 12720 cccggcggct cgccgatctg gctgccgtgg gcggccggta cgtcgaggtg ccgggcaccc 12780 actcgttctg ctggcgttac ccgcaggcct ggtccgcgcc gatccgtgaa ttcgccggat 12840 ggtcggtatc ggtctccggc acctgaacgg acgtttcggt ggcatcgccg ccaccgcggg 12900 ccggcgcatc cgcatccaca gtccggggtg agggtcagcg ccgttcggag gcggagtgtc 12960 gatgatcggt caattgacgt gcttccatga gccgccctac ggtccgacag agaaatcgtt 13020 atccggacca ccatcgacat ccgaatcggt ggccccggag ccgatcatcg accgaccccg 13080 ggccaccccc gctcttgcca gagggggcga ggcacatgac ggaagctgat catcgtccga 13140 ccgttctcag gagaatccta cggctgtgcg ccgtgcttct catggtgctc ggagtgggcc 13200 tggtcggcgc cccgacgtcg cacgccggcg gcaagccgac catctccaag gaggcgttcg 13260 gcagcgtcgg cggcaaggcc gtcgaccggt acaccctcac caacgggcgc ctgcaggtgc 13320 ggatcctcac ctacggaggc atcctgcaga ccatcacgtt ccccgaccac cgcggccgca 13380 gggccaacgt gacgctcgga ttcaggaccc tcgacgagta cgtgacgacg aagaacccgg 13440 cgtacttcgg cgccatcatc ggccgctacg gcaaccggat tgccgacggc cggttcaccc 13500 tggacggcac gacctaccag ctggcgacca acaacgaccc gaaccacctg cacggcgggg 13560 tcgtcggctt cgacaagcgg gtgtgggacg ccacgccgat ccgcgacggc gacagcgtcg 13620 ggctgcgcct gacctacacc agcccgcacg gcgaggagaa ctaccccgga accctgcgcg 13680 tgacgatgac ctacaccgtc acccggcaga tgggtatccg gatggactac cgggcgacga 13740 ccgacagacc gacgatcgtc aacctgacca accacgcgta ctggaacctc ggcggcgagg 13800 gcaccgggac catcgacgac cacctgctga agctcaacgc caaccgctac acgccggtcg 13860 acgccacgct gatcccgacg ggggcgatcg acgcggtcgc cggcacaccg atggacttcc 13920 gccggcccac gccgatcggc gcgcgcaacc gcgacccgtt ccagcaactg gtgtacgggc 13980 gcggctacga ccacaactgg gtgctgaacc gcgaggacgg ccagttccgg cgtctcgagt 14040 tcgcggcccg ggcggtcgac ccggacagcg ggcggcagct caccatctac accaccgagc 14100 cgggcatcca gttctacggc ggcaacttcc tcgacggcac cctgtacggc accagcggcc 14160 gggcctaccg tcagggagac ggtttcgccc tggagacaca gcacttcccg gattctccga 14220 accacgcgaa cttcccgtcg accgtccttc gaccgggaca gacctacaac tcgacgacca 14280 tctaccagtt cggtaccgcc gactgatcgc ctcaggccgg ccgccgcggg acggcgcgcc 14340 gcggccggcc gcacggcagt cagcggcggc gactggaggc acacatgcca cgcatccatc 14400 cgaaagtcga ggaggccgtc tctacgctcg acctgaaccg gacgacacga cgccggctgt 14460 tgtccggaac cgggttgttc agcgcctcgc tcgccgcggg cgcgctgctg agcgcatgca 14520 gcgaccagaa cgacggccag aaccagaccg agggcgccgg taacttcccg gacacccccg 14580 agtggcggtt cacattcgtc aaccacgtga ccaccaaccc gttcttcacc ccgacgcagt 14640 acgggatgga ggacgccgcg acgctgctcg gcatcgccaa gccgcagtgg accggctcgc 14700 agaactcgat cgtggccgaa atggtgaacg cgacgaacac cgcggtcagc gcaaaggtgg 14760 acggaatcgc catcgccgtg gtcgacaagg acgcgttccg ggggccggtc gaccaggctc 14820 tcaacgcggg gataccggtg gtgtcgtaca acgccgacgg agcccggggc gcgccgggca 14880 cgaaccggct ggcctatatc ggacagggcc tgtacgagtc cgggtacgcg ctgggccagc 14940 gggcgttgca ggtgctggac tccggcgagg tggccgcctt catcgccacc ccgggcgcgc 15000 tgaacatcca gccgcgcatc gacggcgcgc aacaggcgtt caaggactcc ggcaagccga 15060 tcacgttcac cgcggtcgcc acgaacgccg acgtgacacg cggtctgtcc atcatcgacg 15120 cgtacgccca ggggcacgcc aacctggccg gcatgctggc ggtggacgcc ggatcgacgt 15180 cgtcggtggg tcagaccgtc aagaagtaca acatgcgcgg caaggggctc aaggtggccg 15240 gcgggttcga cctgatcccg gagacgctga ccgggatcca ggagggcagc ctcgactaca 15300 ccatcgacca gcagccttat ctgcagggat tcctgcccgt gctggcgctg tacttctaca 15360 aggtgtccgg cgggctgatc gcgccgagtg agacgaacac cgggctgttg ttcgtcacca 15420 aggacaacgt cgccccgtac cagagcacga agagccggta cgagggctcc acgaccgaca 15480 aggttctcgt acctcgcagc gggccgatcg cccatggatg accggatctc gcctgcgccc 15540 gcgcaggcgc cttccctcga ggtcgagcaa cgccgtggcc ggtggcagcc ggtcacggcg 15600 gccggccgga aggtcctcga cgccttcctg cggcggcgtg aggccagcgt gctgctcgtc 15660 gcgatcggcc tgatgatcta ctttcgggcg tccagcccgg tcttcctgag ccgcgacaac 15720 ctggtcaaca tcgcccaggc gaccgcgccc gtcgcgatca tcgcggtcgg catcgtgctg 15780 ctgctggtca gcggcgagat cgacctgtcc gtcggtatcg tggccgcgct ggcgccgttc 15840 ctgttccact tcgggatcaa cttctactcg ctgccggtgg tgcccgcctt cgtggtggcg 15900 ctggcgatcg cggccggaat cggcctggtg aacgggctga tcgtcacgca gctgcacgtg 15960 ccctcgttcg tgacgacgct gggcacgttc ttcgccgtgc agggcatcct gctgatcacg 16020 tcgcacgcct atccggtgcc gatccccgac gcggccaagg gcacgttcca aacctggctc 16080 ggcgccgggc cgtgggccag catcacctgg gcgctgatca tcgtcgcgat cttccacacg 16140 gtgctgaccc tgacccggtg gggcctgcac accatctcgg tcggcggcaa cccggtcggc 16200 gccaccgagg ccggcatccg cgcctcccgc atcaagatcg gcaacttcgt gatcaccagc 16260 acgctgggtg ggctggtcgg catcatggag gcgttccgga tcaacaccat cgacccgaac 16320 atcggcggcg gcacgacgct gaccttctac gccatctcgg cggcggtcat cggcggcacc 16380 gcgctcgccg gcggctccgg caccatcgtc ggcgccttcc tgggcgccct cgtgctggcc 16440 gagctgcaga acgggttcaa cctcatcggc tacagcgcca acaccatctt cctcatcctg 16500 ggcctggcca tcctcgtctc gatgatcgcc aaccagtacc tctcccgact gcgccgggca 16560 ggccgatcat gaccgcggaa accgtgtccg acgcgctgcg cgtacagaac atcgccaaga 16620 gattcggcgc tctcaccgcg ctgcaggacg tgaccctgcg cgtcgccgaa ggcgaggtgc 16680 tgggcctgat cggcgacaac ggcgccggca agtcgaccct catcaaaatc atctgcgggt 16740 accaccggcc ggacgccggg cgcatcttcg tcggcggcga ggaggtcacg ctgcgcagcg 16800 tcgaccacgc ccgctcggtc ggcatcgacg ccgtctatca ggacctggcc ctggtcaacg 16860 agctgtccgt ctaccacaac atgttcctca accgggagct cgtacggtgg ccgctgctga 16920 acaaccgggc gatgcgccgc cgtgccgagg agcacctgcg cgacatggga gtgaacctgc 16980 cggacgtcgg cgtcgaggtg gccaagctct ccggcggcca gcgccaggcg atcgcggtgg 17040 cccgctgcgt ctactccgac gcccgcatcc tgctgctgga cgagccgcta gccgcgatgg 17100 gcgcgaagga gggcacgatg atcctcgacc tgatccgcga cctgaaggcg cgcggcaacg 17160 tgtcgatcat catcatcgcg cacaactacg cgcaggtgct cgacgtgtgc gaccgggtga 17220 acctgctgca gcacggccgg atcaccttcg acaagaggtc ggcggacacg tcgctggccg 17280 aactgaccga gctggtggtc gccgagtacc gcaccggccg cgggcggtga cgcctcagcg 17340 cttgcggccg actccgctgt actggctcgc gccggtcgtc tcgtcgccgg ggtcgggatg 17400 ccactgcggg ctcggcacga cgcccggcgg gaccaggtcc agtccctcga agaagccggc 17460 gatctcgtcg ggcgtatgca tcaggtaggg caccgcaccg gaggagttgt aggcgtcctg 17520 ggcctggttg agcgcctcct ccccggcgac gcgcacaccg tcgttgatcg acaggtagct 17580 gccgggcggc agcccggcca tcagctgccg gacgatgtcg cggacctccg cggtgctggg 17640 gatgtggccg agcacgccgt tgaggatcag cgccaccggc cggcccatgt cgagctcgcg 17700 ggcggcgacc gccaggatgt ccgccggttt ctgcaggtca ccctcgaggt agacgtcgga 17760 cgacccggcc agcagctcac ggccgtgctc caccgcgtac gggtccttgt cgacgtagag 17820 gacccgggcg tcaggggcga cccgctgcgc gatctggtgg gtgttgtcga cggtgggcag 17880 gcccgcgccg acgtcgagga actggcgcac gccggcctcg ccggcgaggt agcgcacggc 17940 acgcgacagg taccgccggg actcgcgggc gatctcgtcg atgccgggga acacggcacg 18000 gtactcgtcg ccggcagcgc ggtcgaccgg gaggttgtcg gtgccgccga gccagtagtt 18060 ccagatgcgg gccgactggg gcaccgaggc gccggactcc atagtcacgg atcgatagcc 18120 tagcccttgc gcgcctgggt ggcgacgccc tcgacgaagt agcgctggca caggaagaac 18180 gcgatgatca tcggcaccgt ggtgatcacc gcgccggcca ggacgatctc ccagcgggcc 18240 tcgcccgcct ggccgaactg gtcgaggatc gccttcatgc cgcgcggcat ggtgaacagc 18300 gccggatccc gcagatagat cagcggcttg agcaggtcgg accagctggc ccgcagctcg 18360 aacacgaacg ccacgatcag cgccggccgg cacagcggca ccgcgatgcg ccagaacagc 18420 cgccagtacc cggcgccgtc gacgcgggcc gcctcgaaca gctcacgggg cacgccgagg 18480 aagaactgcc ggatcaggaa gatgtagaag gcgctgccga acaggttgcc ggcccagagc 18540 ggcacctgcg tggcggccag gccgagctcg ttccagatca ggtacgtggg gatcatggtg 18600 accgcgccgg gcagcatcat cgtgccgacg accagggcga acaacacgtt gcgcccgggg 18660 aagcggaagt aggcgaagcc gaacgccacg accgcgctgg agatcgtgac cgcggccgcg 18720 gcggcgagtg ccaccacgac gctgttgaac atccaggtca gcacgggcgc ggcgtcccag 18780 atggcggtgt agttccccgg cgcccactcg gcggggagca gccggttgtc gaagacgtcg 18840 gggcggggct tgagggaggc gctgaccagc cagacgaacg ggtacacgaa gatcaccgcg 18900 gcggcggcca gggcggtcca gagcacccag ggatgcgggc cgcgcgaggt gcgcggtggc 18960 atggtcctgt cctcagccac agccacggcc tcactcgctc tcgtagtaga cgaatcgccg 19020 gctgagccgg acctgcacga ccgtgatgat cacgatgatc aggaacagca gccaggccag 19080 cgccgaggcg taccccatgt gcaggaactg gaaggcctgc tggaacaggt agaccacata 19140 gaacagggcg gcgtcgttgc cgtacgtctg ctggttggca ctgccgtaga aggcggtgta 19200 gacctcgtcg aaggtctgca gcgaggcgat cgtgttgatg atcagcgtga agaagagcgc 19260 gccgctgatc atcggcacgg tgaccgcgcg gaaccgcgcc cacgccgacg cgccgtccat 19320 ctcggcggcc tcgtagaggt cgcggggcac gttctgcagc gccgccaggt agatgatgac 19380 cgtgctgccg aggctccagg cgccgatcag caccaggccg ggcttgatcc acgggccgtc 19440 gacggtccag ttcggcccgt cgatgccgac cgtgcccagc gcctcgttca cgatgccgac 19500 ctggccgttg aacagcagca ggaacagcac gcccacggcc accttggggg tgatcgtcgg 19560 caggtagaag atcgtgcgga agaacccggc ggagcggcgc ccgacccggg ccagcagcat 19620 cgccagggcc agggacacga tcatggtgac cggcacgtgc agcgccgtgt agatcagcgt 19680 gttggcgatg ctcgtacgca cccgcgggtc ggcgagcatc tgccggtagt tctcgccgcc 19740 gacgaagtcg gtgctggtga gcacgtcgta gtcggtgaac gacaggacga ggctggccac 19800 catcggcccc gccatgaaga ccgtgaagcc gatgagccac ggcgacagga aaccgaaggc 19860 ggccagggtc tcccgccgcc gcacggcggc actcatcgtc agcgtccgct gttggccttg 19920 tccagcgcgg cctgagcctg ctgctgggcc tcggccatgg cctgggcggg tttctgcttg 19980 ccttccagga cccggttgac cgcgttctgc caggcggcct tgaattcctc accggcggcg 20040 agcgccggct ccgagaagcc ggactcctgg gtctgcagga cgatctgcac gttggcgtcg 20100 ggtttcacga cgtctctgaa gatcacttcg tcggccttct tgttgccggt gtagacgccg 20160 gcgaagggtt tgttctcctt cttgcgcagc tcggcacggg ccctcgcggc ggcgatccag 20220 gtctcgctcg cggtcatcgt cttgatccac ttacaggcct gcccagggtg cgcgctgttc 20280 gccgggatgg cccaggcgtt gcccgtgatc cagtcgatcg gctgcccgtc gacgccgcgg 20340 aacggcgcca cggtcacctt gaccttcggc gagttgtcgg cgagcacgtt gaggtagaag 20400 tcctccatcg ggaaggcgcc gagctggttg ctggcgaact ggttcttggc gccgaagaag 20460 tcccacgagt cgcggaacga cttgaagttc gaccagccgc cctgcgcgtt gatcaggccg 20520 acggcgtatt cgagggcctc gaccaccttc gggttgttca gctgggcggt gcgaccgtcg 20580 tcgctgacca gggcggcgcc gttcgcgcgc gcccagacgg gcaggaactc gggcagcttc 20640 gggtcgaacc cgatccgctg gagcttgccg ccgctcatcc tggtgagccg ggccgtggcc 20700 gtcgacagcg cctgccagtc ccccgtgtcg aacccggcgg gatccaagtt gacctcggcg 20760 aacgcggcgt cgttgagcat caggacgcgg ttgttgtaga agtccggcag gccgtacagc 20820 tgcccgttca gggtcgcctc ggtgaccgcg gcctcgcgga actggctcat gtcgatcttc 20880 tcccgttcga cgcagtcgcc gagcggagtg agcgccttct tggccgcgta ggtgccgagc 20940 agccgccgtt ccatgtacac caggtccggc ggggtcctgg aggccaccgc ggacaggaac 21000 gcctgggcgt cgaagctgcc ctcggacgcc ttcgccaggc tgggcgcgat cacggcgttg 21060 gccgcgtcga agcgggtctt ggcgatctcg tcgccggtgc cgaaacccat catggtcagc 21120 gtcaccgcgg cgttgctgtc ggagtccgaa tcggatccgc ccacgccacc gcagcccgcc 21180 gccaatgtca gaaccagggc accacccacc acaaaccgga tcgatcggat gaacatcgtt 21240 gttctcccat tttcacttgt tcccgtgggc gaagcataag ttcacttcga tgcccgcgca 21300 ctcggagcgg ctgctgtcaa ccgccgaccg gttggcggat caccacgatc gggtggtgcg 21360 gccgctgccg ggccgcgctc ctgctcccgc cgccacgcgg gtgggcagat accgatcggc 21420 gtcgctctaa tcgatggcag ggataccgac ggtgacaccg tttcctcccg ccgcttcatc 21480 ccgacgtaat cgcgggcatg gcgccgtggc cgcgtttcgt cgaaatcgcc gggctattcg 21540 cccgggaagt ccaccgaaag gaagacacac catgtctgct ctcgccatcg agaagtcctg 21600 gaaggacgtc gacctccgtg acggggcgac cagccacccg gccggcctcg gcttcggcga 21660 gctcaccttc gaggaccttc gcgaggaccg caccatctac gccgccagca gcggctgggt 21720 gtgcaccctg acgatcgagt gcggcaccgt gatctgcgcc tgctgatcga cgatcgtttc 21780 cggcccgggg cgggcatcgc ccgccccggg ccatccattt cgcgcgggga gcagccatgt 21840 caccggttcc ttcactcaat tccacctcgg tacgcgacag cgcgtatctg cacgaacgaa 21900 cggtgaccgg agaagaccag ccggcaccgg ccgcgcaggc gcggatagcg tcctggcgcg 21960 attcggcgtt cctcgacgac cgggttctcg acatccggct acgtcaatgg ggaatcgacc 22020 gtgccacctt cggccggctg ctcaccgacg acgacttcac cgttcccggc cggctgctcg 22080 cctgggcgga cgagctggcc acggtgctgg ccaccgacac gacaccggtc accggactcg 22140 agttgtccac caaactgtgg tcacagggat tcgaccggct gctcttcgcc ggcctgcttc 22200 acccgttcct cgcccactac gaacagcggc tgcacgagcg cgtgccccgg ccgatcgccg 22260 gcagcctgcg ccggccgctg ctggagtcgc tggccaaccg gctgctcgcc gtcgcggcac 22320 gcaccctgct gctggagctc aacgtggccc gtgtgcacgg gcggctgacc ggcgacaccc 22380 cgcagcagcg ctacgacgac tacgaccggc ggctgctcac cgaccccgcc tacctggccg 22440 ccctcttcga ggaatacccg gtgctcggcc gttgcctggt cgaatgcggc cggcgttggg 22500 tggaccacgc cgccgagctg ttcaaccggc tccacgacga cgagcccgaa ctgcgcgcgg 22560 ccggtctgct gccgccgtcg gcggaagcgc tgcgcagcgt acggctggac ctcggggacc 22620 cgcacaacgg cggccggtcg gtggtgcagc tgaccttcga cgacggcacc gacctggtct 22680 acaagccgcg gccggtcgga tccgaacgcg cctacgccga gacgatggcc gcgctggccc 22740 gccacgggct gccggtgccg gtgaccgccc cgcgcgtgct ggaccgtggc gggcacggct 22800 ggtgcgagtt cgtccggccc gcgccctgcg ccgacgccgc cgagctgtcc cgcttctacc 22860 ggcgcgccgg atcggtgctg gcggccatgc tgctgctcgg tggcgtcgac atgcacatgg 22920 agaacgtcat cgccgcgggg tcgtcgttca ccccgatcga cctggagacc gtgctgcagt 22980 ccggagagct cggcgacggc gccaccgacg cgtacgggcg ggccctcgac ctgctcaacc 23040 gcagcgtgct ggcgatcggc atcctgcccg cccgcgcgtt cggtggccgg cagcgaaaga 23100 gtgtcgacgt cagcgccctc ggcggcggcg aaccgcagac cgcgccccgg ccggtgccac 23160 gcatcgtcga cgcgtacacc gacacggcac ggctggaagc ggtcgaggcc accatggccg 23220 gcgcccagaa ccggccgagc ctgcccggcg ccgaggtccg cccgtgggag cacaccgctg 23280 acgtggtcgc cgggttcacc gacgcctacg acatcatgct ggcccaccgc gccgacttcg 23340 accggctgct gcgcggcttc cacgacgtgg aggtgcgcta cctgccccgg cccacccgtc 23400 gttacagcat cttcctgacc gagagctacc accccgacta cctgcgcgac gccagcgacc 23460 gggaccggct gctcgacaag ctgtggaccg ccgcggacgc ccgccccgag ctgattccga 23520 tcatcgagtc ggagaagcga caactgctcg ccggtgacat cccgtgcttc cgcagcgtcg 23580 cgggaagccg gcagatccgc accgcctccg gcccgctgca cccggagttc ttcaccgcgc 23640 cggccgtcac cgtactgacc cgccggctcg gcgagttcgg accggtgcac cgcgccgccc 23700 aggtacgcat catccgcgac tcgatggcca cgatgcccgg cccccggccc gccgcccagc 23760 cgtcccccga ccgggcggcg ggcccccggc cccgcgtcac cggcgccgac ccggccacgc 23820 tcgccgaccg catcgcccgc aggctcgccg acgaggcgat cctcggcgac cgcgacgtgt 23880 cctggatcgg cgtcagcatc gaaggcgtcg cccaggagac ctacagctac aagccgatgg 23940 cgaccggcct gtacgacggc gtggccggcc tggcgctcac cttcgcgtac gcggcccgca 24000 ccctcggcga cgaccgctac ctggacctgg cacaccgagc ggcccgcccc gtcgccggct 24060 acctgcgcta cctcgccgag caccgcatcg tcgagaccgt cggcgcctac agcggcaccg 24120 ccgggctgct ctacgccctg gaccacgtgg cccacgccac cggcgacgac tcctacctcg 24180 acgcggtctc ggaggcggtg ccgtggctgc gcgaatgcgc cacccgcgag gagtgccccg 24240 acctgatcgc cgggctggcc ggctgcgccc tgatcagcct ggacctgcac gggcgccacc 24300 ggatcgacgg gctgcgcgag gtggcggcca tctgcgccga acggctcgcc gccctcgccg 24360 tcgacgtcga cggcgccgcc ggatggccgg ccactccgga cggaccgctg ctcggcgggt 24420 tctcccacgg cgcggccggc atcgcctggc cgctgcaccg gctcgccacc gaactcggcg 24480 acccctcgct gcgcgagctc gcccgccgcg cggtccagtt cgaccgcgac ctgtacgtgc 24540 ccgccgcggg cgcctggcgt gacctgcgcc cggagatggc cggcaccgac tcctaccccg 24600 cgctgtggtg ccacggggcc gccggcatcg gcctgtcccg gctgctcatc gcgcagcacg 24660 accaggacac gcgactggcc gcggaggcca ccgccgccct cgacctggtc ggcgcgcacg 24720 gcttcggcca caaccacagc atctgccacg gcgacttcgg cgccctcgcc ctgttcgacc 24780 tggcggcacg aaccggcttc gaccccgggc gccacgacgc ggccgccgcg gccgtgaccg 24840 ccgacatcgc cgccaacgga gcccgttgtg gcctggtcgg cgacatccac atgccgggac 24900 tcatgctcgg cgccgccggc atctgcctga gcctgctgcg catcgcccac cccgcgcagg 24960 tgcccgcggt ggcctggctg cagccgccgc tgacctgagg aggagcccat gccggaagag 25020 atcgtgctca gcgtgctgga ccaggtgccg gtgttccgtg acggcagccc ggcggaggcg 25080 gtgcgcgacg cggtcgcgct ggcccgcagc gccgaacagt acggctacca ccgcttctgg 25140 atcgccgagc accacggcag cgcggccaac gcgtgcgccg cccccgaggt ggtgacggcc 25200 gcggtggccg ccgccacgag ccggatccgg gtgggcagcg gcggcgtgct gctgccgcac 25260 tacagcccgc tgaaggtggc cgagacgttc cgggtgctgg cggcgctgta tccgggccgc 25320 atcgacctcg gtttcggccg ggctcctggt gggccgccgg cgatggccga gctgctcaac 25380 ccgtacgcgg tccgcaccga cgaggcgttc ctggagcaga tcggccggct gctggggttc 25440 ctcggcgaca cccgtacggt cagccgcgtg tcggtgacgc cgcaggtgga agagcccccg 25500 gtgccgtgga tgctcggcgc cgggaccggc agcgcccgga tggccggcat gctggggttg 25560 ccgttctgtt tcgcccagtt catcgcgacc gaggagtgcc cggaggcgat cgaggcgtac 25620 cgggatgcgt tccggccgtc gccctggctg gagcgacccc agccgatgct cgccttgcgg 25680 gtgctgtgcg ccgactcgga cgcggaggcc gaggaactgg ccacgtgttt ctggatgtcg 25740 tgcacgaccg gctggcgtgc gcaggtgcag ctcaccgacg actaccgtgg gggcgcgccc 25800 aatctcgacg acgcacgccg gtaccggctg accgcggagg acctcgcgct gcgggagagc 25860 cggccgttcc tgcagatctc cgggacgccg gccgcggtgg gcaaggagat ccgcaggttg 25920 caggcggtgt acggggtatc cgaggtggtg ctcaccacga actgccccgg cctgccggcg 25980 cggcgccgct cctacgaact gctcgccggc gagttcgcat ccccggcggc ctgacggcct 26040 caggtccgcg gtagctccgc gtaggtcccg cgcaatgccg cggacctgac ggccgtcagg 26100 acaggcagac gtcgtcgctg gacagacccg acgcatacgc caggacggcg gcctgcacgc 26160 ggttggccac gccgagcttg ctcaggatca cgctgacgtg ctccttcacc gtggcggcgc 26220 tgaggaacag ctgccggctg atctccgcgt tcgtgaggcc ggcgccgagc aggcgcagaa 26280 tgctctgctc ccggtcggac agctgtttga cccgctcgca ggccggtgac ccggcccccg 26340 cggcagatcc ccgtgagccc gcacgcacga ccaccgacga cgcctcgggc gccagcacga 26400 tgctgccctc ggccagcgcc cgcacggcgg cgaccagctg ttcgggctgg ctgtcgcgca 26460 acaggaagcc gcaggcccca ccccgcagcg agtcgagcac cagctcgggt ggggcgagag 26520 tggtcagcat cgcgatcgcc ggcgggctgc tcagagcccg cagctgatcg agcacctcca 26580 gcccgtcgct ctgggcactg tggccgtcga gcagcaccac ggcaggccgg tgctgctcga 26640 cggccgatct caggttctcc cggtccgtcg tggcgaccgc gaagccgccg gtgctctcca 26700 ggatcatctt gatgccgatg ctgaccagtg cttcgccgtc cacgaccagt acgtccgtca 26760 cgatcggtcc cccgcgagcc gccgaacgca tgcaacttgc atccgcattc gtgacattac 26820 ttcacttata tggtcgaatc aatcgatttt tcgcgtatag tcattaacaa cacacagcgc 26880 gtcgtcagcg ggtcagaccc tcggccgggg cgacccgcgc cgcccgccgc gccggcgcca 26940 gactggccac caccccggtc agcaccgcca ccaccagcac ggcggccagc tggccccacg 27000 gcaggcggat caccggatcg gcggtacgcc ccacggccgc cgccaccgcg gccagcccca 27060 ccgggacacc gaccacgagg ccggccaccg tgccgagcag cgtgatcacg accgcctcga 27120 ccgcgagcat cgcccgcagc cgcgcccggc gtgtgcccag cgcccgcaac agcgccatct 27180 cgcgtacccg ctcgacgacc gacaggccca gcagattcgc gatgccgagc agtgcgatca 27240 ccaccgtgac cgccagcatc gccagcgaca gtcccaacag gatcgacagc acgttcgcga 27300 tgtcaccgcc ctcggtgacc ccgccaccga cctgcaccag cgcgtcgcgg gcggccaccg 27360 cgccgacggc ggccgacagc gcctcccggt cgaagccggg gtcagcgacg ccccacaccg 27420 ttgtcggcac cgcctcgatc cggttcgccg ccagggtccg cgcgctcacc acgcccagca 27480 gctgcccggt ggtgtccgcc agccgcgacg cccgggcgat caggttcacc cggcgctcgc 27540 cgacctcgac gacgatcggg gcgctgtccg gcaggcccag ctcggccaga taggtcgccg 27600 gcaccagcac caccggctcc ccggcgagct ccggtgccac ccgggccgcc agttcgtcgc 27660 cgggcgcggc cagcagccgc ggcgtcgcct tgccgccgtc cgggaaacgg gccgcgaccg 27720 tgccgaccgt gccactggcc gacagctgtg gcaccgcggc gaaggccccg gcggtggcac 27780 cgctgatcgg ctcgccgtcg gtgcgcaggc ccgccgccac cgggtagcgc gcctccaggt 27840 cggcgttcac cgtggcccgc ccgctggtcg ccgccaccgc caggcaggtg atcagcgccg 27900 cgccgaccac caccgccatc gccgccgaag ccgtccggcg cgcgttctgg ctcaggctgg 27960 tcccggccag gccggcggcc acgccgaaac gctccagcag ccgcgccgcc ggcgccaggg 28020 acaacgcgat cagccgcggc aacgccgcca gcaaccccgc cgccagcaga agcccgccca 28080 gcagcgccag gggcagcgac gcgccgatcg ccgccaccgc gagcgcggcg gcgcccacca 28140 cggtcaccac ggtgcccacg acgagccggc gaccgccgcg gaccgtgccg gccggcggct 28200 cgtcggccgc ctgcaacgcc cgcaccgggg cgatcctggt ggcacgccgg gccggcgccc 28260 aggcggccac cagcgtggcc agcaccccgg ccagcacaca gccggccagg gcgaacggat 28320 tgacccgcag cccgccgccg ctgatgtcga gcaggtcggc gccgagataa cccagcccca 28380 cacccgccgc cgcgccgacc aggccgccgg ctgttccggc gatcgccgcc tcggccagca 28440 cgacccggct cacctgggca cgatgaccgc cgaccagccg cagcagggcg atctgccgga 28500 tccgctggac gatcaccacg tggaaggtgt tcgcgatgac cagcaccgcc gcgagcaggg 28560 cgacagccgc gaacgccagc atgatcacga ccagctggcc gttgccgccg gcgaacctcg 28620 cggcggcctg atccgcagcc gccgaggcgt cggtcgccga gatgccgggg cccatgctgc 28680 gccgcaacgc gtcaacggtg ccggtcagcg aggcgtcgtc ggcgacagtc agcagcgcgg 28740 ccggcggcac gtcaccggcg aagaacgacg cgtcggcgta gaaccggaag tccgagccgg 28800 tcagcggccg gaaacccagg tcggcggcac cggtcacggt gaccggctgc ggcgccgcct 28860 caccgtggcg taccgtcagc gtggccccga cgtcgatgcc gaggtcgtcg agggtgcgct 28920 ggtcggcgac gagctgtccg ggcccggtgg gccacgcgcc ccggtccaag gtgaaccagc 28980 ggacctgcgg ggtggccgcg atgctctgca cgttggccga gccgcgccgc gatccgccga 29040 acacgctgac cgtgcgcgcg tactgcgcgt ccaccgagcg cacccccggc accgcggccg 29100 cggcctcgta ccaggccggg tcgcggaccg tgtcgtcggc gtcgagcacg atgtcggcgg 29160 tggtcaacgg cgcggcggcg gtacgccgca ggccctcacc cgaggtggcc gcgaaggtcg 29220 cggtcgcggc caggaaaccg gtcgccagca tcaccgccgc gacgatcgcg aacagccggg 29280 ccgggtaggc gcgcagctgg gaccaggcaa gcgcgaagat catcgtcaca ccgccaccga 29340 cgccatcgcc gcgaggatct gatcgcggcc gggactgcgc agttcctcac ggatccggcc 29400 gtcggccatc accaggaccc ggtcggcgta cgtcgcggcg cccggatcgt gggtgaccat 29460 gatgatcgtc tggccggagc ggcgtgccgc gtcgcgcagc ccgcccagca gcgcgcggcc 29520 ggtggcgatg tccagcgcgc cggtcggctc gtcggcgaag accaccgacg gcttggccag 29580 cagcgcccgc gccaccgcca cccgctgctg ctggccgccg gacagctcgg acggacgatg 29640 ccccagccgg tcggtgatct gcagtgaatc ggtgatcttc cgcagctcgc ccggatccac 29700 ccggcggccg gcgagccgta gcggcagcac gatgttctgc tccgccgtca gcgtcggcag 29760 caggttgaac gcctggaaga cgaagccgat ccggtcgcgg cgcaggtcgg tcagggcccg 29820 gtcgtccaga ccggccaatg accgcccggc caggctgacc gtgcccgccg tcggtgtgtc 29880 caatccggcc agcaggtgca tcagcgtcgt cttcccggaa ccggacgggc ccatgatcgc 29940 ggtgaactgg cccgcggaga agcccgcgga caccccgtcg acggctgtca cggcagccgg 30000 ccctgttccg tacgtcttgc tgacgtcccg gcaactgacc atctcggcgt gtgtcgtctg 30060 cgttgtcacc gcacccacgc tagaaatccg cgcggaccgg cacatcccac cacgggatcc 30120 cggtcgggcg gtggaccgat accttcgtat gacccgccgg tatcgacctc gggcgccgtg 30180 ttcccgcaat cgatgatgtc tgcttaggct gggaccgtgg tgcgagggaa ccgggtgctc 30240 aggatcgacg ccctcgtcgc cgccgcggtg gtcatcggct gtctgctcct cgggctcgcc 30300 gggctgtccg agtggtactg gtcggccgcg gtggccgtac cgttgcttct ccggcgcagc 30360 gctccgcgct gcttcctggc gctggtcgcc ggcgtctccg gcctgcacct gctggcctcg 30420 cacagcttca tgttccccgg cgatctggtc gctctggtcg cggtgcacgc cgccgcggcg 30480 cacgcgccgg gccgtgcccg ccacgccgga ctgctgctcg gcgccgccgg agctctcgtg 30540 gtggccgccc aggccctgca ggaccagcgc ctcggctcgg cgctgcccgc ggtgctgatc 30600 gtcgcgagca cgatggccgc ctggtcgatc gggctgatgc agcgccagca gcgcagcgcc 30660 gtgctcgacg ccgagcaccg ccgccggctg gccgaacagg acagcgccat gcgcgcgcag 30720 ctggccgtgc acgaggagcg cacccggatc agccaggaga tgcacgacat catcgcccac 30780 tcgctggcct cgatcatcgc ccaggccgaa ggcggccggg tcgccgcccg cgccgacgcg 30840 cggatcgccg ggccggtgtt cgaccggatc gcgggcctcg gccgtcaagc cctcaccgac 30900 gtgaaacggc tgctcaccgt cgtggaccac gacgacgaat ggcacgacga cggactggag 30960 cggctgccgg tgctgctcgc cggagtcacc gaggccgggc tggacgtgac cgtggacagc 31020 agcggggcgc cgcagccgct cgccgccggg atggacctcg ccgtgtaccg ggtgatccag 31080 gagtcgctga ccaacgtgct caagcacgcg ccggcgcgcc gggcctgcct gcggatgcgg 31140 tggacgcccg cgctgctcac ggtcacggtg agcagcccgc ttcccggtgg ccgcggcgcc 31200 ggcctggtcg aggggcgcgg cctgtccggg atccggcagc gctgctcact gttcaacggc 31260 gactgcaccg tcaccgcgac cacggaactc accgtcacca ccacctggcc cctcaccccg 31320 gaaggagcgc gcgcatgacg cggccaccga tcgccgtgct gatcgccgac gatcaggagc 31380 tggtacgcac cggtttcgcg atggtcgtcg acgcggcgcc ggacatgcgg gtcgtggcca 31440 tcgccgcgag cggcgcggag gcgatcgagc tggccgccga acaccggccg gacgtcatcc 31500 tgatggacat ccgcatgccg ggcaccgacg ggatcaccgc gaccagcgcg atcctggccg 31560 ccggcggcga gcggccaccg aagatcatcg cgctgacgac gtacgacagc agcgactacg 31620 cgacgcggat cctcaccgcc ggggccagcg gctatctgct gaaggacgcg accgccgagg 31680 gcctgacggc ggcgatccgc agcgcgtacc acggcgggtc ggtgatcgcc ccgacgacga 31740 cccggaacct ggtcgcggcc cgcgccgagc caccgccgcc ggctcgcgac ccggcgccgc 31800 tggacacgtt caccgcccgg gaacgcgacg tgttcgacct gatcgtggcg ggcgccaaca 31860 acgcggagat cgcggcccgg ctgcacctgg ccgaggtgac ggtgaagacg cacgtcggcc 31920 gggtgctggc caagctcggg gtacgcgacc ggctcaacgt agtcgtctgg gcgtaccgca 31980 acggcgctgt cggctgatcc gcaccctcag gcccttgaca cggtgccacg gtggcacggt 32040 gtgatagacc cgggtcgttt cgcctcacac tggtggtggt gcggtgagtt cctgggtacg 32100 ccggcgcgat cacaacgtct tcgtcaacgc gttcaacatg ctcatatgcg gcctcatcgc 32160 cggcgtcgtc gtggccgctg ccgcgttccc gttcgccgcg atgtccggcc tggccgccaa 32220 ggccggccag cagacgttcg cgagcctgcc cagcgagctg aaggcgttcc ggtcaccgca 32280 gatcagccgg atctacgccg ccgacaacag gacccaggtc gcccagttct acgacgagtt 32340 ccgcagtgac gtcccgctca aggagatgtc gccgttcatg cgcgacgcca tggtcgcggc 32400 cgaggaccgg cagttctacc agcaccacgg cgtggacctg aaaggcgcgg cgcgtgcgct 32460 ggtcaacaac cgcaacggcg ggcagaaaca gggcgcgtcg acgatcacca tgcagtgggt 32520 acggatctcg ctggcctact cggcgaccaa gccgcaggac gtcatcgacg ccaccgagga 32580 cgccccgaag cgcaaggtcg ccgagatgaa gtacgcgctc gaggtggaga agcagctcag 32640 caaggaccag atcctggagc ggtacctgaa catcgtgccg ttcggcaagc agacgtacgg 32700 catctacgcg gccagccggg tctacttcaa caagaagccc aaggacctca cgatcggcga 32760 ggccgcgctg ctggccgcca tcgtgaaggc gccgtccgcg tacgacccca ccgacccgga 32820 cggttacgag ctcatccggc agcggcgcaa cgcctatgtc atcccgggca tggtggagat 32880 gggcgccatc acccgggcgc aggccgacgc ggcgctcaag gaggccatcc cgcgcaaggt 32940 acgcccgatg agcaacggct gcgtgtcggt ggccaagaac aactggggct tcttctgcga 33000 ctacttctac cgctggtgga tggagcgcaa ggagttcggg cccacgccgt acgaccggga 33060 gcgccggctg aagagcggcg gctaccggat caccacgaca ctcgacgtca aggcgcagaa 33120 gcaggcccgg gatcggatcg gcgacctgat ctccgagaag aacaagaacg cgctgctgct 33180 ggcagccgtc gagcccggca ccggcaaggt acgcatgctc gccgccaacc gccggtacaa 33240 gctggacgat ccggatgatc cgcagaacgc gatctcctcc gacccgagaa aggcgcgcaa 33300 gggcatccgt ggctcgtacc cgaacacgac gaatcccctg ctgaccggcg gcggcgacat 33360 caccggctac caggccggct cggtgatgaa gatgttcacc atcgtcgccg cgctggagca 33420 gggctacccg ctcgcctaca cgatcaggac gcagagccgg taccgctccc gctacatcat 33480 cgagagcagc aacgacgcgg cctgccccgg aacgcacttc tggtgtccca gcaacgccgg 33540 tggcggcggc gagggtgtct tcaacatgtg gaccggcctg ggcaggtcga tcaacacgta 33600 cttcgtgccg ctggaggaac gcgtcggcgc ggagaaggtg gtcagcgccg cgaaacgctt 33660 cggcatccag ttccgggagc cggacgacgc actgctggcc gaaccgggca acgcacacca 33720 gtggggcgcc ttcaccctgg gcgtctcggc caccaccccg ctggacatgg ccaacgccta 33780 cgccaccctg gccgccgacg ggatgtactg cccgccgacc ccgatcgagc ggatcgccac 33840 ccgtgacggc gaccagctgg acgtcggccg gtccccgtgc gtacgggcga ccgccaagga 33900 cgtcgcccgc gccgccctcg acgcggcccg ctgcccggtg ggcgactccg cgcagctcgg 33960 ccggtgcggg ggaagcaccg ccggcatcac ccggtcggtg gtcgggcatc cggtgttcgg 34020 caagaccggc accaccgacc gcgaccggac cgcctcgctg atcgccggca ccaccgcgct 34080 ggtggtcgcc ggttacctgg tcaaccccga ctaccagaac caccgcgacc ggctcgacca 34140 cgaccaggtc aacccggccg tctaccgcac gctcgccgac tacatggagg gcaggccacg 34200 ggagtcgttc aagcggccgt cgagcgggcg gatcgcgttc ggtgaccagc gctcgatccc 34260 ggacgtcgag tgcgacccga tgccccgcgc ccgcgaccgt ctggaggatg ccggcttcga 34320 cgtctggcga ggccaggaag tggagtcgga ctgtcccgcg ggcaccgcgg ccggcaccga 34380 gccgagcggc cggaccgtca agaacggcgt ggtggtgatc caggtgagca agggccgccg 34440 gggcgcgtca ccgccgatct tcccgccgat cgggccaccc cgctgaccgg ctgacggcgt 34500 agacgtcgcc ggcgttcgcc tcgtgcggca gcccggccag gtgcgcgagc atctcgtcgc 34560 gggcggccca ccggccgaag gtgcgggcca tggtctcgcc cagggagacg tcgaagccgt 34620 cgaagcccag ctcgccggca cggtcgaggc agcgccgggc cacgtcccgg gcgatcgtcg 34680 tgaactcgaa cgacaacgcc cggacaccgc ggctcagacc ggcgagcacc gcgtcctcgt 34740 acccttcgac gtcgatcttg atgaaggccg gcaggccgaa tcgctggacg agcgtgtcca 34800 gggtgaccgc agggacggtg atctgctggt cccagacctc gttctcccag ccgcgcgagc 34860 cggtcgccgc ggtcaggaag cgcaccgagt tcgtggagac cgtcgggttc gccgagttga 34920 tgtagagcgg cacgctcccg ccggcgggcc cgcacgcggc ctcgacgagc gccacccggt 34980 cgtcgtgggc gtagagcgcg cgcagcgccc gcatgcacag cggctgcggt tcgacggcga 35040 ccacgcgggc gccgagccgc cggaagcagg cgacccggtc accgacgtgc gcgccgatgt 35100 cgaagacgac gtcacccggc cggacgaaac gccggtacat cgcgtccatc gcggcctccc 35160 ggccggcgtc accgtagtag taacgcagcg accgggtcag cggcgccatg gccgggtcga 35220 ctctcagttt gcgcaggtca tcggtcacgg cgggggcatt cccccgatca ggcgatccat 35280 gcatcgccgg cgcgtgcgca ggtaggcggc gatcgcccgg gcggaacgca cgcccgaggt 35340 ggtcatgacg ttgtgcgcgg cggccgggac ggtcaccgac acgccgccgg tcatcgccgc 35400 cacctcggca cgccagcgca gcggcgccac cggatcaagc gacccgccga gcaccagcgg 35460 gggtacgggc aaccggcgca gatcctcctc gatcgcgttg cgtaccgagt ggccgaccgt 35520 ggccagaacc cgccacggct tggcgtcggc gatgtcgcgg accagcaccg gcgcctgcca 35580 cggcgcctcg atccacaggt ccaccgccca ccggccgatc agcgcccgcc gggaccgggc 35640 cgccgggtcg gtggtcgggc tggccagcac gacggcggcg accaggtccg gccgcagcac 35700 cgcgagacgg gccgccacct cggcgccgaa cgagtgcccg gcgatgcagg cccggggcac 35760 gccgagcacg tccagccagg ccgcgaggtg ttcggcgtgc cggcccacgt cgtacgcgcg 35820 gcgcggcttg tcgctgaacc cgaacccggg aaggtccgga acgaggaccg gatggcggcc 35880 cgccagcgcg tgggcggtgg gcatcaggta gcggtgcgag acggcgagcc cgtgtaccag 35940 caccaccgga aggccgccgg cgtggcacgc gtgccggtcg tgcgtacgca ctccaccgac 36000 cgtcaccagg cggctgtcga atcggggcac cgcggagatg taccccgtcc ttccgcaatc 36060 tttcccgcgc ggttagtttc gagttgtgtc gccgcccttc cggctcgacg aggcggtcgc 36120 cgacgtctac ggcgacctgc gcctggcgcc cgtgctgcgg cggctgctgc ggcacagcgg 36180 ccgcctgacc ggctcggtgg ccggcagcgt gtcgctgatc gacgcggacc gcggctgcta 36240 cgtcaaggcc gccgagtacg gcgcgaactg ccagctcgga cgctctttcc cgctcgacga 36300 gggcgccacc ggccgcgcct tcggcagccg ccggcccgtg gtgatcccgg actacggtca 36360 gctgcgggcc ggtcatctcg cggcggcgca tccggcacgg aagggcccgg ccgtcgctgt 36420 gccgatctgg tggcgcggcg acgtgatcgc ggtgaacgtc gccttcgcgc cggccttctc 36480 cctgggtggt gtcgacgaac tggaggcgct gacccagtcc gcggccgccg cgatcgtccg 36540 cagccggggt gtgcgggtcc gcgccgaccc gccgtacgcg gctccggccg caccgttcac 36600 cccgcgcgag gccgaggtcc tcgatctgct ccggcagggt ctgaccgacc gcgagatggc 36660 ccgccggctc ggcctgtccg cgaagaccgt ggagaagcac gtcggcgcga tcaggcgcaa 36720 gaccgggacc tccaaccgta cggcggcggt cgtcacggcc ctggacaacg actgggtggg 36780 gaatcttccc cataccgcgg agcacaccac cgggtcttga ctggcggcat gcccgtcgtc 36840 tccatgaagg acatcctcga ccgtgcgctg gccgagcggt acggtgtggc cgccttcaac 36900 atcgtcaacg acctgaccgt cgaggccgtg ctcgccgccg cggcggagga acgcgccccg 36960 gtcatcctgc agacctcggt caagacggtc cggatgtacg gccgcccccg gctgtacgag 37020 atcgtccacg ccttcgccca cgacgcgccc gtcccggtga ccctgcacct ggaccactgc 37080 cccgagcggt cggtcatctc cgactgcctc gccggcggct ggaactccgt gctcttcgac 37140 gcgcacgagc tcgacgtggc cgacaacctg cgccagacca ccgaggtggt ggccgaggcc 37200 cgtcgcgccg gcgcccacgt cgagggcgag atcgagggca tccagggtgt cgaggacgac 37260 gtcggcaacg actacgcccc gatggtgcag agcctggagg tggcggtcga cttcatcaaa 37320 cgcaccggcg tcgactgttt cgcgccggcc atcggcaacg cgcacggcca gtacaagcag 37380 gcgcccgtgc tcaacacccg ccgggtcagc gacctcgttg cggccaccgg catcccgatg 37440 gccctgcacg gcggcaccgg cctctccgac gagcagttca ccgacctcat cgcccgtggc 37500 tgcgcgaagg tcaacatctc cacggcgctc aaggagtcgt tcatgaaatc cggcctggag 37560 ttcctgcgcg aggccgatga gcgcggcaaa tgggatccgc cgtcgctgtt ccggcatcag 37620 cgggcggcgg tcgtagagat ggcccggcag cacatccggc tcttcggcgg atcggggcgc 37680 gcgtggtgaa cgccctggtc ttcgactgcg acggcgtgct ggccgacacc gaacggcacg 37740 gccacctgcc cgcgttcaac gccacgttcg agcagttcgg gctgcccgtg cggtggagcg 37800 aggaggaata cggcgagaag ctgcgcatcg gcggcggcaa ggagcggatg gcgtcgctgt 37860 tcgccgatcc cgccttcgcc gcggcggccg gcgacaccga ccgtacggaa ctgctgcgaa 37920 cctggcaccg cgccaagacc gcggctttca cgaagctggt cgccgagggc cggattccgg 37980 cccgtccggg cacagcccgg atcatcagcg aggcactccg ggcaggatgg acggtcgcgg 38040 tcgcttccac gtcggccgag gattcggtac gcgcagtgct cgtcaacgcc gtgggagcga 38100 cgactgccga gcggatcccg gtgttcgccg gagacgtcgt gcccgcgaag aaacccgacc 38160 cggcgatc 38168 <210> 101 <211> 146 <212> PRT <213> Actinoplanes garbadinensis <400> 101 Met Pro Arg Arg Ser Thr Arg Cys Ser Pro Ala Cys Arg Pro Gly Ala 1 5 10 15 Ala Asp Gln Pro Asp Pro Gly Arg Ala Cys Arg Pro Asp Cys Gly Arg 20 25 30 Ala Asp Arg Ser Gly Ser Gly Arg Ala Cys Arg Pro Asp Cys Gly Arg 35 40 45 Ala Asp Arg Ser Gly Ala Asp Arg Pro Ser Ala Ala Ala Leu Val Ser 50 55 60 Gly Met Pro Arg Arg Thr Gly Val Gly Gly Ala Pro Gly Arg Leu Ile 65 70 75 80 Glu Ala Arg Ala Val Leu Pro Glu Leu Ile Gly Ala Ala Arg Asp Arg 85 90 95 Arg Ala Ser Cys Val Glu Gln Arg Val Arg Ser Leu Thr Ala Cys Arg 100 105 110 Ala Cys Ala Cys Arg Arg Ala Ala Ala Pro Ala Ala Pro Arg Thr Pro 115 120 125 Pro Arg Pro Ser Ala Ala Pro Ala Pro Gly Ser Asp Ala Gly Gly Arg 130 135 140 Cys Gly 145 <210> 102 <211> 149 <212> PRT <213> Actinoplanes garbadinensis <400> 102 Val Ser Val Ser Leu Leu Leu Val Pro Leu Ala Met Ala Gly Ala Ala 1 5 10 15 Ala Val Gln Ala Ala Ala Gly Arg Met Asp Asp Gly Arg Leu Ile Cys 20 25 30 Gln Val Gln Thr Arg Met Arg Asp Val Thr Leu Leu Asp Ala Ala Leu 35 40 45 Arg Asp Thr Gly Ala Thr Val Thr Ala Ala Gly Asp Thr Ile Ser Ala 50 55 60 Thr Trp Thr Gln Ser Ala Ala Thr Phe Thr Arg Gly Ala Asp Gly Ile 65 70 75 80 Trp Ala Ala His Val Thr Gly Val Asp Gln Pro Gly Ala Val Glu Leu 85 90 95 Met Thr Thr Val Asp Thr Ala Tyr Gly Arg Arg Val Gln Gln Ala Val 100 105 110 Leu Glu Arg Leu Arg Ala Gln Ala Pro Glu Ala Gly Leu Arg Leu Glu 115 120 125 Ser Glu Ser Val Gly Gln Asp Ala Ser Val Arg Leu Val Phe Glu Val 130 135 140 Glu Arg Glu Arg Ala 145 <210> 103 <211> 518 <212> PRT <213> Actinoplanes garbadinensis <400> 103 Val Glu Arg Ser Phe Ala Glu Thr Phe Ala Gln Leu Leu Lys Ala Arg 1 5 10 15 Phe Pro Val Leu His Leu Glu Thr Tyr Glu Glu Gln Arg Ala Leu His 20 25 30 His Leu Ala Gly Ile Ala Gly Asp Ala Asp Leu Val Arg Val Pro Arg 35 40 45 Ala Val Trp Thr Trp Ser Leu Thr Ala Gly Leu Val Gln Pro Asn Gly 50 55 60 Glu Ala Arg Ser Gly Ala Gln Arg Ala Thr Asp Ala Leu Arg Ala Val 65 70 75 80 Gln Arg Ile Asp Glu Pro Ala Val Phe Val Phe Arg Asp Leu His Pro 85 90 95 Leu Phe Ala Gln Ser Pro Glu Val Val Arg Leu Val Arg Asp Ile Ala 100 105 110 Gln Ala Phe Arg Ala Gly Arg Ser Pro Arg Thr Leu Val Leu Leu Ser 115 120 125 Pro Val Leu Asp Leu Pro Val Glu Leu Ser Lys Asp Val Thr Ile Val 130 135 140 Asp Phe Pro Leu Pro Gly Gln Leu Glu Leu Arg Ala Leu Leu Asp Ala 145 150 155 160 Met Val Arg Gly Asn Thr Ala Ser Gly Arg Leu Arg Val Glu Leu Asp 165 170 175 Glu Gln Ser Arg Glu Arg Phe Val Thr Ala Ala Ala Gly Leu Thr Met 180 185 190 Gln Glu Ala Glu Asn Ala Tyr Ala Arg Ala Met Val Asn Asp Ala Val 195 200 205 Leu Asp Leu Ala Asp Leu Glu Ile Val His Glu Glu Lys Arg Gln Thr 210 215 220 Val Arg Lys Ser Gly Val Leu Glu Phe Met Ala Ala Gly Thr Val Leu 225 230 235 240 Asp Asp Val Gly Gly Leu Glu Asn Leu Lys Ala Trp Leu Val Lys Arg 245 250 255 Asn Gly Ser Trp Leu Asp Glu Ala Ala Gly Tyr Gly Leu Pro Ala Pro 260 265 270 Arg Gly Val Leu Ile Thr Gly Val Pro Gly Cys Gly Lys Ser Leu Thr 275 280 285 Ala Lys Ala Val Ala Thr Ala Trp Asn Leu Pro Leu Leu Arg Phe Asp 290 295 300 Ile Gly Arg Val Phe Ser Gly Leu Val Gly Ser Ser Glu His Asn Met 305 310 315 320 Arg Thr Ala Leu Arg Thr Ala Glu Ala Val Ala Pro Cys Val Leu Trp 325 330 335 Val Asp Glu Ile Glu Lys Gly Phe Ala Gly Gly Thr Gly Gly Asp Ser 340 345 350 Gly Thr Gly Ala Arg Val Phe Gly Thr Phe Leu Thr Trp Met Gln Glu 355 360 365 Lys Arg Thr Pro Val Phe Val Ile Ala Thr Ala Asn Asp Phe Asp Gly 370 375 380 Leu Pro Pro Glu Leu Leu Arg Lys Gly Arg Phe Asp Glu Thr Phe Phe 385 390 395 400 Val Asp Leu Pro Ser Arg Ser Glu Arg Val Ala Val Trp Arg Val His 405 410 415 Leu Gly Arg Ala Leu Arg His Arg Arg Ala Ala Gly Glu Leu Arg Val 420 425 430 Asp Ala Glu Leu Leu Thr Glu Leu Ala Gly Leu Thr Glu Gly Tyr Ser 435 440 445 Gly Ala Glu Ile Glu Gln Ala Val Ile Ala Gly Leu Phe Asp Ala Phe 450 455 460 Ser Glu Arg Arg Pro Leu Arg Arg Asp Asp Leu Val Arg Ala Val Met 465 470 475 480 Ser Ile Val Pro Leu Ser Val Thr Gln Ala Glu Arg Val Asp Ala Leu 485 490 495 Arg Gly Trp Ala Arg Asn Arg Ala Val Ser Ala Thr Gly Thr Asp Asp 500 505 510 Trp Asp Leu Thr Asn Arg 515 <210> 104 <211> 203 <212> PRT <213> Actinoplanes garbadinensis <400> 104 Val Gly Glu Leu Asp Gln Gln Arg Ile His Pro His Asn Asn Ile Trp 1 5 10 15 Gly Ser Gly Ala Gly Thr Gln Thr Ile Trp Ala Arg Ser Gly Thr Asn 20 25 30 Trp Gly Val Val Ala Asn His Pro Arg Thr Ser Gly Val Lys Ser Tyr 35 40 45 Pro Asn Thr Gly Lys Thr Leu Asn Arg Thr Leu Ser Ser Leu Asn Ser 50 55 60 Leu Thr Ser Ser Phe Asn Val Ser Val Pro Ser Ser Gly Asp Tyr Ser 65 70 75 80 Thr Thr Tyr Asp Ile Trp Ala Asn Asn His Ala Tyr Glu Val Met Ile 85 90 95 Trp Thr Asn Gln Gln Gly Ala Val Gly Pro Ile Ala Glu Gln Tyr Asp 100 105 110 Ala Asn Gly Ala Val Pro Asn Val Arg Asn Leu Ser Val Gly Gly His 115 120 125 Thr Trp Asn Val Tyr Arg Gly Ser Asn Gly Ala Asn Ala Val Phe Ser 130 135 140 Phe Ile Arg Thr Asn Thr Asn Ser Gly Thr Val Asp Ile Leu Ala Ile 145 150 155 160 Leu Asn Trp Leu Arg Thr Asn Gly Trp Trp Gly Asp Val Thr Val Gly 165 170 175 Glu Ala Gln Phe Gly Phe Glu Ile Ser Gly Thr Ala Gly Gln Ser Asn 180 185 190 Phe Thr Val Asn Asn Phe Ser Leu Asn Tyr Ser 195 200 <210> 105 <211> 219 <212> PRT <213> Actinoplanes garbadinensis <400> 105 Met Arg Arg Arg Thr Leu Ala Leu Ser Leu Ala Ala Ser Ala Ala Leu 1 5 10 15 Ile Ala Gly Ala Gly Val Val Thr Ala Leu Pro Ala Ser Ala Ala Ala 20 25 30 Gly Cys Arg Val Ala Tyr Thr Val Ser Ser Gln Trp Pro Gly Gly Phe 35 40 45 Gly Ala Asn Val Thr Ile Thr Asn Leu Gly Asp Pro Leu Thr Asn Trp 50 55 60 Thr Leu Val Trp Ser Tyr Ser Gly Gly Gln Thr Val Thr Gln Ala Trp 65 70 75 80 Asn Thr Ser Leu Thr Gln Ser Gly Ser Gln Val Thr Ala Arg Asn Ala 85 90 95 Gly Tyr Asn Gly Ser Val Gly Thr Asn Ala Thr Val Ser Phe Gly Phe 100 105 110 Asn Gly Ser Gly Ala Ala Thr Pro Ala Pro Gly Thr Phe Thr Leu Asn 115 120 125 Gly Thr Ala Cys Thr Gly Ser Ala Gly Pro Thr Ser Pro Ser Ser Gln 130 135 140 Pro Pro Thr Asn Gly Val Pro Ser Asp Ala Val Trp Val Asp Ser Gly 145 150 155 160 Gln Trp Ala Asn Trp Thr Asn Asn Gly Tyr Ile Leu Thr Thr Thr Ser 165 170 175 Gly Ala Arg Ala Pro Ala Pro Arg Pro Ser Gly Arg Ala Ala Ala Pro 180 185 190 Thr Gly Ala Ser Ser Arg Ile Thr Arg Ala Pro Ala Gly Ser Ser Pro 195 200 205 Thr Pro Thr Pro Glu Arg Pro Ser Thr Val Arg 210 215 <210> 106 <211> 161 <212> PRT <213> Actinoplanes garbadinensis <400> 106 Met Thr Ile Thr Glu Thr Asp Leu Ala His Leu Arg Arg Cys Val Asp 1 5 10 15 Leu Ala Arg Glu Ala Leu Asp Asp Gly Asp Glu Pro Phe Gly Ser Val 20 25 30 Leu Val Ser Ala Asp Gly Lys Val Leu Phe Glu Asp Arg Asn Arg Val 35 40 45 Arg His Gly Asp Ala Thr Gln His Pro Glu Phe Ala Ile Ser Arg Trp 50 55 60 Ala Ala Glu His Leu Thr Pro Arg Glu Arg Ala Ser Ala Thr Val Tyr 65 70 75 80 Thr Ser Gly Glu His Cys Pro Met Cys Ser Ala Ser His Gly Trp Val 85 90 95 Arg Leu Gly Arg Ile Val Tyr Ala Ala Ser Ser Ala Gln Leu Thr Ala 100 105 110 Trp Tyr Lys Glu Trp Gly Ile Pro Ala Gly Pro Val Ala Pro Leu Pro 115 120 125 Ile Thr Thr Val Val Pro Gly Ala Val Val Glu Gly Pro Val Pro Ala 130 135 140 Phe Glu Ala Glu Leu Arg Glu Leu His Arg Ala Arg Phe Thr Pro Ala 145 150 155 160 Gln <210> 107 <211> 413 <212> PRT <213> Actinoplanes garbadinensis <400> 107 Val Thr Thr Pro Leu Val Ala Gln Ala Gly Asp Ser Thr Thr Gly Leu 1 5 10 15 Thr Gly Leu Gly Leu Val Glu Asp Ala His Gln Ile Ala Glu Ala Ile 20 25 30 Arg Gly Asn Ser Trp Val Asp Gly Val Leu Gly Gly Val Gly Ala Ser 35 40 45 Leu Asp Gly Leu Ala Leu Ala Ile Asp Pro Leu Gly Thr Leu Ala Ala 50 55 60 Trp Gly Val Ala Trp Leu Ile Glu His Val Gln Pro Leu Gln Asp Ala 65 70 75 80 Leu Asp Trp Leu Ala Gly Asp Val Asp Glu Ile Ala Ala Gln Ala Ala 85 90 95 Thr Trp Arg Asn Val Ala Ala Phe Thr Asp Ser Ala Gln Gln Asp Tyr 100 105 110 Ala Asp Arg Leu Arg Thr Glu Val Ala Gly Trp Phe Gly Ala Ser Gly 115 120 125 Asp Ala Tyr Arg Ala His Ala Ser Glu His Leu Ala Ala Leu Lys Gly 130 135 140 Ile Ser Thr Ala Ala Gly Gly Ile Ser Ser Ala Val Glu Gly Ala Gly 145 150 155 160 Leu Leu Val Ser Leu Val Arg Gly Ile Val Arg Asp Leu Ile Ala Gln 165 170 175 Phe Val Ala Thr Leu Ala Val Arg Leu Pro Gln Trp Leu Ala Ala Glu 180 185 190 Gly Leu Thr Leu Gly Leu Ala Thr Pro Val Val Ala Ser Gln Val Ala 195 200 205 Ala Leu Val Ala Arg Gly Val Asn Lys Ile Gln His Phe Ile Arg Ala 210 215 220 Leu Leu Asn Ser Leu Arg Arg Leu Met Pro Met Ile Asp Arg Leu Gly 225 230 235 240 Glu Val Leu Glu Arg Leu Arg Met Leu Thr Asp Arg Leu Ala Arg Ser 245 250 255 Ser Pro Ser Thr Arg Pro Glu Pro Thr Pro Gly Pro Ala Thr His Ala 260 265 270 Gly Thr Glu Asn Ala Ser Gly Asn Lys Pro Glu Gly Asp Leu Glu Pro 275 280 285 Asn Glu Pro Arg Pro Ala Glu Ala Asp Ala Arg Asp Ser Thr Pro Gln 290 295 300 Ala Phe Val Asp Glu Val Val Ser Asn Pro Arg Ser Val Ala Gly His 305 310 315 320 Ser Ala Gln Ser Ile Ala Asp Gln Phe Asn Ala Ala Gly Tyr Ser Ala 325 330 335 Val Val Glu Gln Ser Thr Arg Ser Gly Thr Ser Gly Asn Ala Ile Gln 340 345 350 Val Arg Ile His Gly His Pro Asp Ile Thr Asn Ile Gln Val His Pro 355 360 365 Gly Gly Gly Arg His Thr Pro Glu Gly Ser Pro Tyr Trp Lys Ile Ser 370 375 380 Thr Asn Thr Val Gly Lys Ile Trp Ile Ile Pro Glu Asn Phe Arg Gly 385 390 395 400 Ala Asp Glu Leu Arg Gly Asn Val Val Arg Tyr Asp Lys 405 410 <210> 108 <211> 217 <212> PRT <213> Actinoplanes garbadinensis <400> 108 Val Gly Lys Pro Cys Pro Asp Leu Val Glu Val Leu Ser Arg Glu Ile 1 5 10 15 Gln Ala Gly Asn Gln Gly Ala Ser Ala Ser Glu Val Val Glu Ile Phe 20 25 30 Asp Leu Glu Leu Val Gly Ile Phe Arg Gly Ala Val Thr Gln Lys Leu 35 40 45 Pro Gly Ile Glu Val Leu Arg Lys His Leu His Leu Lys Gln Gly Gly 50 55 60 Val Gln Val Arg Ser Val Val Val Arg Ala Glu Asp Pro Ala Gly Ile 65 70 75 80 Val Val Val Gly Asp Leu Cys Ala Arg Ile Asp Asn Arg Asp Val Gly 85 90 95 Leu Ala Gln Gly Asp Ala Tyr Trp Glu Arg Arg Asp Asp Thr Val Asp 100 105 110 Arg Leu Asp Gln Ile Arg Ala Asp Ser Pro Cys Glu Phe Asp Asp Met 115 120 125 Val Arg Leu Gly Ala Gly Val His Gly Asp Gly Gln Arg Arg Val Arg 130 135 140 Gln Arg Phe Ala Asp Val Ala Asn Leu Phe Gly Val Gln Arg Ala Ile 145 150 155 160 Ile Asn Glu Ser Arg Ile Arg Thr Lys Ile Asp Pro Asp Asp Val Asp 165 170 175 Ala Gln Gly Asp Glu Arg Gly Ser Phe Pro Arg Gly Ser His Pro Ile 180 185 190 His Phe Asp Asp Leu Ile Cys His Ser Ala Pro His Ser His Ala Val 195 200 205 His Arg Arg Pro Gly Asn Phe Arg Gly 210 215 <210> 109 <211> 592 <212> PRT <213> Actinoplanes garbadinensis <400> 109 Val Ser Asp Val Val Val Glu Arg Leu Thr Ala Trp Asp Val Glu Arg 1 5 10 15 Val Phe Gly Tyr Ser Gly Asp Gly Ile Asp Gly Val Ile Gly Ala Leu 20 25 30 Arg Arg Ala Gly Arg Pro Thr Phe Val Gln Ala Arg His Glu Glu Gly 35 40 45 Ala Ala Phe Met Ala Val Gly His Ala Lys Tyr Thr Gly Gly Ala Gly 50 55 60 Val Cys Leu Ala Thr Gln Gly Pro Gly Ala Val His Leu Leu Asn Gly 65 70 75 80 Leu Tyr Asp Ala Lys Leu Asp Ser Lys Pro Val Val Ala Ile Val Gly 85 90 95 Gln Gln Val Ser Thr Val Leu Gly Ser Ala Tyr Gln Gln Glu Ile Asp 100 105 110 Leu Val Arg Leu Phe Gly Asp Val Cys Ala Gln Phe Val Gln Ala Ala 115 120 125 His Thr Ser Glu Gln Val Pro Met Leu Leu Asp Arg Ala Phe Arg Thr 130 135 140 Ala Leu Ala Thr Arg Ser Pro Thr Cys Val Val Leu Pro His Asp Val 145 150 155 160 Gln Thr Ala Pro Ala Pro Asp Pro Gln Ala His Glu His Gly Val Leu 165 170 175 Ala Thr Ser Ala Gly Leu Arg Pro Ala Arg Val Val Pro Arg Pro Glu 180 185 190 Asp Leu Arg Glu Ala Ala Glu Val Leu Arg Ser Gly Glu Arg Val Ala 195 200 205 Ile Met Val Gly Gln Gly Ala Tyr Gly Ala Glu Arg Glu Ile Val Glu 210 215 220 Leu Ala Gln Arg Leu Gly Ala Gly Val Thr Thr Ser Leu Leu Gly Lys 225 230 235 240 Pro Val Leu Asp Glu Asn Leu Pro Phe His Thr Gly Val Met Gly His 245 250 255 Leu Gly Thr Thr Ala Ser Ala Glu Leu Met Arg His Cys Asp Thr Leu 260 265 270 Leu Leu Ile Gly Thr Asn Asp Pro Trp Thr Glu Phe Tyr Pro Arg Pro 275 280 285 Gly Gln Ala Arg Ala Val Gln Ile Asp Val Asp Gly Arg Arg Leu Gly 290 295 300 Val Arg Tyr Pro Val Glu Val Pro Leu Leu Gly Asp Ala Val Glu Thr 305 310 315 320 Leu Arg Glu Leu Leu Gly Leu Leu Pro Ser Arg Ala Ser Gly Ala Trp 325 330 335 Gly Ala Arg Val Glu Glu Trp Val Gln Arg Trp Arg Leu Ile Ser Ala 340 345 350 Ala Arg Ala Ala Ala Pro Ala Glu Pro Val Asn Pro Gln His Val Ile 355 360 365 Arg Ser Leu Ser Asp His Leu Pro Ala Asp Ala Gln Val Ala Val Asp 370 375 380 Val Gly Ser Val Val Tyr Trp Tyr Ala Arg His Leu Arg Leu Pro Arg 385 390 395 400 Gly Val Pro Ala His Leu Ser Ser Thr Leu Ala Ser Met Gly Cys Gly 405 410 415 Leu Pro Tyr Gly Leu Ala Ala Lys Leu Ala Ala Pro Gln Arg Pro Val 420 425 430 Val Val Leu Ala Gly Asp Gly Ala Met Gln Met Ala Gly Met Ala Glu 435 440 445 Leu Ile Thr Val Ala Ala Arg Trp Arg Asp Trp Ala Asp Pro Arg Phe 450 455 460 Val Val Cys Val Leu Asn Asn Arg Asp Leu Ala Glu Val Ser Trp Glu 465 470 475 480 Gln Arg Glu Thr Glu Gly Glu Pro Arg Phe Val Thr Ser Gln Glu Leu 485 490 495 Pro Asp Val Pro Tyr Ala Arg Tyr Ala Glu Leu Leu Gly Leu Arg Gly 500 505 510 Val Arg Ile Thr Asp Pro Ser Asp Leu Thr Gly Ala Trp Glu Ala Ala 515 520 525 Leu Ser Ala Asp Arg Pro Thr Leu Ile Glu Ala Val Val Asp Pro Ala 530 535 540 Ile Pro Leu Leu Pro Pro Gly Gln Pro Tyr Glu Lys Val Gln Ala Met 545 550 555 560 Tyr Ala Gly Leu Ala Ala Glu Lys Gly Asp Gln Ala Arg Arg Ala Glu 565 570 575 Ala His Leu Arg Arg Glu Arg Ala Asp Glu Gly Phe Asp Asp Pro Ser 580 585 590 <210> 110 <211> 266 <212> PRT <213> Actinoplanes garbadinensis <400> 110 Val Ser Arg Asp Lys Thr Tyr Arg Pro Val Arg Pro Asp Gly Ile Arg 1 5 10 15 Thr Thr Phe His Asp Gly Val Leu Gly Arg Met Arg Ile Arg Cys Leu 20 25 30 Gly Glu Pro Arg Pro Gly Val Pro Glu Ile Val Met Ile Gln Gly Met 35 40 45 Thr Val Ser Asp Tyr Leu Leu Pro Gly Leu Gly Ala Leu Ser Ala Trp 50 55 60 Thr Arg Val His Leu Val Glu Leu Pro Gly Gly Ser Gly Ser Gly Arg 65 70 75 80 Pro Pro His Asp Leu Thr Val Glu Glu Tyr Ala Arg Ala Ala Ala Asp 85 90 95 Trp Leu Cys Ala Gln Arg Leu Gly Arg Ile Val Leu Ala Gly His Ser 100 105 110 Ser Gly Thr Gln Val Ala Ala Glu Thr Ala Leu Leu Cys Pro Asp Glu 115 120 125 Val Ala Gly Val Val Leu Ala Gly Pro Ala Ile Asp Pro Val Ala Arg 130 135 140 Gly Gly Leu Arg Val Phe Ala Arg Trp Trp Ile Asp Arg Arg Gly Asp 145 150 155 160 Pro Lys Ser Leu Asp Glu Val His Lys Pro Glu Arg Glu Gln Val Gly 165 170 175 Phe Arg Arg Leu Phe Gln Val Leu Arg Ala His Leu Arg His Asp Leu 180 185 190 Glu Lys Pro Val Val Gly Leu Cys Val Pro Val Leu Val Ile Arg Gly 195 200 205 Ser Glu Asp Arg Leu Gly Thr Ala Arg Trp Ala Arg Arg Leu Ala Asp 210 215 220 Leu Ala Ala Val Gly Gly Arg Tyr Val Glu Val Pro Gly Thr His Ser 225 230 235 240 Phe Cys Trp Arg Tyr Pro Gln Ala Trp Ser Ala Pro Ile Arg Glu Phe 245 250 255 Ala Gly Trp Ser Val Ser Val Ser Gly Thr 260 265 <210> 111 <211> 396 <212> PRT <213> Actinoplanes garbadinensis <400> 111 Met Thr Glu Ala Asp His Arg Pro Thr Val Leu Arg Arg Ile Leu Arg 1 5 10 15 Leu Cys Ala Val Leu Leu Met Val Leu Gly Val Gly Leu Val Gly Ala 20 25 30 Pro Thr Ser His Ala Gly Gly Lys Pro Thr Ile Ser Lys Glu Ala Phe 35 40 45 Gly Ser Val Gly Gly Lys Ala Val Asp Arg Tyr Thr Leu Thr Asn Gly 50 55 60 Arg Leu Gln Val Arg Ile Leu Thr Tyr Gly Gly Ile Leu Gln Thr Ile 65 70 75 80 Thr Phe Pro Asp His Arg Gly Arg Arg Ala Asn Val Thr Leu Gly Phe 85 90 95 Arg Thr Leu Asp Glu Tyr Val Thr Thr Lys Asn Pro Ala Tyr Phe Gly 100 105 110 Ala Ile Ile Gly Arg Tyr Gly Asn Arg Ile Ala Asp Gly Arg Phe Thr 115 120 125 Leu Asp Gly Thr Thr Tyr Gln Leu Ala Thr Asn Asn Asp Pro Asn His 130 135 140 Leu His Gly Gly Val Val Gly Phe Asp Lys Arg Val Trp Asp Ala Thr 145 150 155 160 Pro Ile Arg Asp Gly Asp Ser Val Gly Leu Arg Leu Thr Tyr Thr Ser 165 170 175 Pro His Gly Glu Glu Asn Tyr Pro Gly Thr Leu Arg Val Thr Met Thr 180 185 190 Tyr Thr Val Thr Arg Gln Met Gly Ile Arg Met Asp Tyr Arg Ala Thr 195 200 205 Thr Asp Arg Pro Thr Ile Val Asn Leu Thr Asn His Ala Tyr Trp Asn 210 215 220 Leu Gly Gly Glu Gly Thr Gly Thr Ile Asp Asp His Leu Leu Lys Leu 225 230 235 240 Asn Ala Asn Arg Tyr Thr Pro Val Asp Ala Thr Leu Ile Pro Thr Gly 245 250 255 Ala Ile Asp Ala Val Ala Gly Thr Pro Met Asp Phe Arg Arg Pro Thr 260 265 270 Pro Ile Gly Ala Arg Asn Arg Asp Pro Phe Gln Gln Leu Val Tyr Gly 275 280 285 Arg Gly Tyr Asp His Asn Trp Val Leu Asn Arg Glu Asp Gly Gln Phe 290 295 300 Arg Arg Leu Glu Phe Ala Ala Arg Ala Val Asp Pro Asp Ser Gly Arg 305 310 315 320 Gln Leu Thr Ile Tyr Thr Thr Glu Pro Gly Ile Gln Phe Tyr Gly Gly 325 330 335 Asn Phe Leu Asp Gly Thr Leu Tyr Gly Thr Ser Gly Arg Ala Tyr Arg 340 345 350 Gln Gly Asp Gly Phe Ala Leu Glu Thr Gln His Phe Pro Asp Ser Pro 355 360 365 Asn His Ala Asn Phe Pro Ser Thr Val Leu Arg Pro Gly Gln Thr Tyr 370 375 380 Asn Ser Thr Thr Ile Tyr Gln Phe Gly Thr Ala Asp 385 390 395 <210> 112 <211> 378 <212> PRT <213> Actinoplanes garbadinensis <400> 112 Met Pro Arg Ile His Pro Lys Val Glu Glu Ala Val Ser Thr Leu Asp 1 5 10 15 Leu Asn Arg Thr Thr Arg Arg Arg Leu Leu Ser Gly Thr Gly Leu Phe 20 25 30 Ser Ala Ser Leu Ala Ala Gly Ala Leu Leu Ser Ala Cys Ser Asp Gln 35 40 45 Asn Asp Gly Gln Asn Gln Thr Glu Gly Ala Gly Asn Phe Pro Asp Thr 50 55 60 Pro Glu Trp Arg Phe Thr Phe Val Asn His Val Thr Thr Asn Pro Phe 65 70 75 80 Phe Thr Pro Thr Gln Tyr Gly Met Glu Asp Ala Ala Thr Leu Leu Gly 85 90 95 Ile Ala Lys Pro Gln Trp Thr Gly Ser Gln Asn Ser Ile Val Ala Glu 100 105 110 Met Val Asn Ala Thr Asn Thr Ala Val Ser Ala Lys Val Asp Gly Ile 115 120 125 Ala Ile Ala Val Val Asp Lys Asp Ala Phe Arg Gly Pro Val Asp Gln 130 135 140 Ala Leu Asn Ala Gly Ile Pro Val Val Ser Tyr Asn Ala Asp Gly Ala 145 150 155 160 Arg Gly Ala Pro Gly Thr Asn Arg Leu Ala Tyr Ile Gly Gln Gly Leu 165 170 175 Tyr Glu Ser Gly Tyr Ala Leu Gly Gln Arg Ala Leu Gln Val Leu Asp 180 185 190 Ser Gly Glu Val Ala Ala Phe Ile Ala Thr Pro Gly Ala Leu Asn Ile 195 200 205 Gln Pro Arg Ile Asp Gly Ala Gln Gln Ala Phe Lys Asp Ser Gly Lys 210 215 220 Pro Ile Thr Phe Thr Ala Val Ala Thr Asn Ala Asp Val Thr Arg Gly 225 230 235 240 Leu Ser Ile Ile Asp Ala Tyr Ala Gln Gly His Ala Asn Leu Ala Gly 245 250 255 Met Leu Ala Val Asp Ala Gly Ser Thr Ser Ser Val Gly Gln Thr Val 260 265 270 Lys Lys Tyr Asn Met Arg Gly Lys Gly Leu Lys Val Ala Gly Gly Phe 275 280 285 Asp Leu Ile Pro Glu Thr Leu Thr Gly Ile Gln Glu Gly Ser Leu Asp 290 295 300 Tyr Thr Ile Asp Gln Gln Pro Tyr Leu Gln Gly Phe Leu Pro Val Leu 305 310 315 320 Ala Leu Tyr Phe Tyr Lys Val Ser Gly Gly Leu Ile Ala Pro Ser Glu 325 330 335 Thr Asn Thr Gly Leu Leu Phe Val Thr Lys Asp Asn Val Ala Pro Tyr 340 345 350 Gln Ser Thr Lys Ser Arg Tyr Glu Gly Ser Thr Thr Asp Lys Val Leu 355 360 365 Val Pro Arg Ser Gly Pro Ile Ala His Gly 370 375 <210> 113 <211> 352 <212> PRT <213> Actinoplanes garbadinensis <400> 113 Met Asp Asp Arg Ile Ser Pro Ala Pro Ala Gln Ala Pro Ser Leu Glu 1 5 10 15 Val Glu Gln Arg Arg Gly Arg Trp Gln Pro Val Thr Ala Ala Gly Arg 20 25 30 Lys Val Leu Asp Ala Phe Leu Arg Arg Arg Glu Ala Ser Val Leu Leu 35 40 45 Val Ala Ile Gly Leu Met Ile Tyr Phe Arg Ala Ser Ser Pro Val Phe 50 55 60 Leu Ser Arg Asp Asn Leu Val Asn Ile Ala Gln Ala Thr Ala Pro Val 65 70 75 80 Ala Ile Ile Ala Val Gly Ile Val Leu Leu Leu Val Ser Gly Glu Ile 85 90 95 Asp Leu Ser Val Gly Ile Val Ala Ala Leu Ala Pro Phe Leu Phe His 100 105 110 Phe Gly Ile Asn Phe Tyr Ser Leu Pro Val Val Pro Ala Phe Val Val 115 120 125 Ala Leu Ala Ile Ala Ala Gly Ile Gly Leu Val Asn Gly Leu Ile Val 130 135 140 Thr Gln Leu His Val Pro Ser Phe Val Thr Thr Leu Gly Thr Phe Phe 145 150 155 160 Ala Val Gln Gly Ile Leu Leu Ile Thr Ser His Ala Tyr Pro Val Pro 165 170 175 Ile Pro Asp Ala Ala Lys Gly Thr Phe Gln Thr Trp Leu Gly Ala Gly 180 185 190 Pro Trp Ala Ser Ile Thr Trp Ala Leu Ile Ile Val Ala Ile Phe His 195 200 205 Thr Val Leu Thr Leu Thr Arg Trp Gly Leu His Thr Ile Ser Val Gly 210 215 220 Gly Asn Pro Val Gly Ala Thr Glu Ala Gly Ile Arg Ala Ser Arg Ile 225 230 235 240 Lys Ile Gly Asn Phe Val Ile Thr Ser Thr Leu Gly Gly Leu Val Gly 245 250 255 Ile Met Glu Ala Phe Arg Ile Asn Thr Ile Asp Pro Asn Ile Gly Gly 260 265 270 Gly Thr Thr Leu Thr Phe Tyr Ala Ile Ser Ala Ala Val Ile Gly Gly 275 280 285 Thr Ala Leu Ala Gly Gly Ser Gly Thr Ile Val Gly Ala Phe Leu Gly 290 295 300 Ala Leu Val Leu Ala Glu Leu Gln Asn Gly Phe Asn Leu Ile Gly Tyr 305 310 315 320 Ser Ala Asn Thr Ile Phe Leu Ile Leu Gly Leu Ala Ile Leu Val Ser 325 330 335 Met Ile Ala Asn Gln Tyr Leu Ser Arg Leu Arg Arg Ala Gly Arg Ser 340 345 350 <210> 114 <211> 253 <212> PRT <213> Actinoplanes garbadinensis <400> 114 Met Thr Ala Glu Thr Val Ser Asp Ala Leu Arg Val Gln Asn Ile Ala 1 5 10 15 Lys Arg Phe Gly Ala Leu Thr Ala Leu Gln Asp Val Thr Leu Arg Val 20 25 30 Ala Glu Gly Glu Val Leu Gly Leu Ile Gly Asp Asn Gly Ala Gly Lys 35 40 45 Ser Thr Leu Ile Lys Ile Ile Cys Gly Tyr His Arg Pro Asp Ala Gly 50 55 60 Arg Ile Phe Val Gly Gly Glu Glu Val Thr Leu Arg Ser Val Asp His 65 70 75 80 Ala Arg Ser Val Gly Ile Asp Ala Val Tyr Gln Asp Leu Ala Leu Val 85 90 95 Asn Glu Leu Ser Val Tyr His Asn Met Phe Leu Asn Arg Glu Leu Val 100 105 110 Arg Trp Pro Leu Leu Asn Asn Arg Ala Met Arg Arg Arg Ala Glu Glu 115 120 125 His Leu Arg Asp Met Gly Val Asn Leu Pro Asp Val Gly Val Glu Val 130 135 140 Ala Lys Leu Ser Gly Gly Gln Arg Gln Ala Ile Ala Val Ala Arg Cys 145 150 155 160 Val Tyr Ser Asp Ala Arg Ile Leu Leu Leu Asp Glu Pro Leu Ala Ala 165 170 175 Met Gly Ala Lys Glu Gly Thr Met Ile Leu Asp Leu Ile Arg Asp Leu 180 185 190 Lys Ala Arg Gly Asn Val Ser Ile Ile Ile Ile Ala His Asn Tyr Ala 195 200 205 Gln Val Leu Asp Val Cys Asp Arg Val Asn Leu Leu Gln His Gly Arg 210 215 220 Ile Thr Phe Asp Lys Arg Ser Ala Asp Thr Ser Leu Ala Glu Leu Thr 225 230 235 240 Glu Leu Val Val Ala Glu Tyr Arg Thr Gly Arg Gly Arg 245 250 <210> 115 <211> 255 <212> PRT <213> Actinoplanes garbadinensis <400> 115 Met Glu Ser Gly Ala Ser Val Pro Gln Ser Ala Arg Ile Trp Asn Tyr 1 5 10 15 Trp Leu Gly Gly Thr Asp Asn Leu Pro Val Asp Arg Ala Ala Gly Asp 20 25 30 Glu Tyr Arg Ala Val Phe Pro Gly Ile Asp Glu Ile Ala Arg Glu Ser 35 40 45 Arg Arg Tyr Leu Ser Arg Ala Val Arg Tyr Leu Ala Gly Glu Ala Gly 50 55 60 Val Arg Gln Phe Leu Asp Val Gly Ala Gly Leu Pro Thr Val Asp Asn 65 70 75 80 Thr His Gln Ile Ala Gln Arg Val Ala Pro Asp Ala Arg Val Leu Tyr 85 90 95 Val Asp Lys Asp Pro Tyr Ala Val Glu His Gly Arg Glu Leu Leu Ala 100 105 110 Gly Ser Ser Asp Val Tyr Leu Glu Gly Asp Leu Gln Lys Pro Ala Asp 115 120 125 Ile Leu Ala Val Ala Ala Arg Glu Leu Asp Met Gly Arg Pro Val Ala 130 135 140 Leu Ile Leu Asn Gly Val Leu Gly His Ile Pro Ser Thr Ala Glu Val 145 150 155 160 Arg Asp Ile Val Arg Gln Leu Met Ala Gly Leu Pro Pro Gly Ser Tyr 165 170 175 Leu Ser Ile Asn Asp Gly Val Arg Val Ala Gly Glu Glu Ala Leu Asn 180 185 190 Gln Ala Gln Asp Ala Tyr Asn Ser Ser Gly Ala Val Pro Tyr Leu Met 195 200 205 His Thr Pro Asp Glu Ile Ala Gly Phe Phe Glu Gly Leu Asp Leu Val 210 215 220 Pro Pro Gly Val Val Pro Ser Pro Gln Trp His Pro Asp Pro Gly Asp 225 230 235 240 Glu Thr Thr Gly Ala Ser Gln Tyr Ser Gly Val Gly Arg Lys Arg 245 250 255 <210> 116 <211> 280 <212> PRT <213> Actinoplanes garbadinensis <400> 116 Met Pro Pro Arg Thr Ser Arg Gly Pro His Pro Trp Val Leu Trp Thr 1 5 10 15 Ala Leu Ala Ala Ala Ala Val Ile Phe Val Tyr Pro Phe Val Trp Leu 20 25 30 Val Ser Ala Ser Leu Lys Pro Arg Pro Asp Val Phe Asp Asn Arg Leu 35 40 45 Leu Pro Ala Glu Trp Ala Pro Gly Asn Tyr Thr Ala Ile Trp Asp Ala 50 55 60 Ala Pro Val Leu Thr Trp Met Phe Asn Ser Val Val Val Ala Leu Ala 65 70 75 80 Ala Ala Ala Ala Val Thr Ile Ser Ser Ala Val Val Ala Phe Gly Phe 85 90 95 Ala Tyr Phe Arg Phe Pro Gly Arg Asn Val Leu Phe Ala Leu Val Val 100 105 110 Gly Thr Met Met Leu Pro Gly Ala Val Thr Met Ile Pro Thr Tyr Leu 115 120 125 Ile Trp Asn Glu Leu Gly Leu Ala Ala Thr Gln Val Pro Leu Trp Ala 130 135 140 Gly Asn Leu Phe Gly Ser Ala Phe Tyr Ile Phe Leu Ile Arg Gln Phe 145 150 155 160 Phe Leu Gly Val Pro Arg Glu Leu Phe Glu Ala Ala Arg Val Asp Gly 165 170 175 Ala Gly Tyr Trp Arg Leu Phe Trp Arg Ile Ala Val Pro Leu Cys Arg 180 185 190 Pro Ala Leu Ile Val Ala Phe Val Phe Glu Leu Arg Ala Ser Trp Ser 195 200 205 Asp Leu Leu Lys Pro Leu Ile Tyr Leu Arg Asp Pro Ala Leu Phe Thr 210 215 220 Met Pro Arg Gly Met Lys Ala Ile Leu Asp Gln Phe Gly Gln Ala Gly 225 230 235 240 Glu Ala Arg Trp Glu Ile Val Leu Ala Gly Ala Val Ile Thr Thr Val 245 250 255 Pro Met Ile Ile Ala Phe Phe Leu Cys Gln Arg Tyr Phe Val Glu Gly 260 265 270 Val Ala Thr Gln Ala Arg Lys Gly 275 280 <210> 117 <211> 301 <212> PRT <213> Actinoplanes garbadinensis <400> 117 Met Ser Ala Ala Val Arg Arg Arg Glu Thr Leu Ala Ala Phe Gly Phe 1 5 10 15 Leu Ser Pro Trp Leu Ile Gly Phe Thr Val Phe Met Ala Gly Pro Met 20 25 30 Val Ala Ser Leu Val Leu Ser Phe Thr Asp Tyr Asp Val Leu Thr Ser 35 40 45 Thr Asp Phe Val Gly Gly Glu Asn Tyr Arg Gln Met Leu Ala Asp Pro 50 55 60 Arg Val Arg Thr Ser Ile Ala Asn Thr Leu Ile Tyr Thr Ala Leu His 65 70 75 80 Val Pro Val Thr Met Ile Val Ser Leu Ala Leu Ala Met Leu Leu Ala 85 90 95 Arg Val Gly Arg Arg Ser Ala Gly Phe Phe Arg Thr Ile Phe Tyr Leu 100 105 110 Pro Thr Ile Thr Pro Lys Val Ala Val Gly Val Leu Phe Leu Leu Leu 115 120 125 Phe Asn Gly Gln Val Gly Ile Val Asn Glu Ala Leu Gly Thr Val Gly 130 135 140 Ile Asp Gly Pro Asn Trp Thr Val Asp Gly Pro Trp Ile Lys Pro Gly 145 150 155 160 Leu Val Leu Ile Gly Ala Trp Ser Leu Gly Ser Thr Val Ile Ile Tyr 165 170 175 Leu Ala Ala Leu Gln Asn Val Pro Arg Asp Leu Tyr Glu Ala Ala Glu 180 185 190 Met Asp Gly Ala Ser Ala Trp Ala Arg Phe Arg Ala Val Thr Val Pro 195 200 205 Met Ile Ser Gly Ala Leu Phe Phe Thr Leu Ile Ile Asn Thr Ile Ala 210 215 220 Ser Leu Gln Thr Phe Asp Glu Val Tyr Thr Ala Phe Tyr Gly Ser Ala 225 230 235 240 Asn Gln Gln Thr Tyr Gly Asn Asp Ala Ala Leu Phe Tyr Val Val Tyr 245 250 255 Leu Phe Gln Gln Ala Phe Gln Phe Leu His Met Gly Tyr Ala Ser Ala 260 265 270 Leu Ala Trp Leu Leu Phe Leu Ile Ile Val Ile Ile Thr Val Val Gln 275 280 285 Val Arg Leu Ser Arg Arg Phe Val Tyr Tyr Glu Ser Glu 290 295 300 <210> 118 <211> 445 <212> PRT <213> Actinoplanes garbadinensis <400> 118 Met Phe Ile Arg Ser Ile Arg Phe Val Val Gly Gly Ala Leu Val Leu 1 5 10 15 Thr Leu Ala Ala Gly Cys Gly Gly Val Gly Gly Ser Asp Ser Asp Ser 20 25 30 Asp Ser Asn Ala Ala Val Thr Leu Thr Met Met Gly Phe Gly Thr Gly 35 40 45 Asp Glu Ile Ala Lys Thr Arg Phe Asp Ala Ala Asn Ala Val Ile Ala 50 55 60 Pro Ser Leu Ala Lys Ala Ser Glu Gly Ser Phe Asp Ala Gln Ala Phe 65 70 75 80 Leu Ser Ala Val Ala Ser Arg Thr Pro Pro Asp Leu Val Tyr Met Glu 85 90 95 Arg Arg Leu Leu Gly Thr Tyr Ala Ala Lys Lys Ala Leu Thr Pro Leu 100 105 110 Gly Asp Cys Val Glu Arg Glu Lys Ile Asp Met Ser Gln Phe Arg Glu 115 120 125 Ala Ala Val Thr Glu Ala Thr Leu Asn Gly Gln Leu Tyr Gly Leu Pro 130 135 140 Asp Phe Tyr Asn Asn Arg Val Leu Met Leu Asn Asp Ala Ala Phe Ala 145 150 155 160 Glu Val Asn Leu Asp Pro Ala Gly Phe Asp Thr Gly Asp Trp Gln Ala 165 170 175 Leu Ser Thr Ala Thr Ala Arg Leu Thr Arg Met Ser Gly Gly Lys Leu 180 185 190 Gln Arg Ile Gly Phe Asp Pro Lys Leu Pro Glu Phe Leu Pro Val Trp 195 200 205 Ala Arg Ala Asn Gly Ala Ala Leu Val Ser Asp Asp Gly Arg Thr Ala 210 215 220 Gln Leu Asn Asn Pro Lys Val Val Glu Ala Leu Glu Tyr Ala Val Gly 225 230 235 240 Leu Ile Asn Ala Gln Gly Gly Trp Ser Asn Phe Lys Ser Phe Arg Asp 245 250 255 Ser Trp Asp Phe Phe Gly Ala Lys Asn Gln Phe Ala Ser Asn Gln Leu 260 265 270 Gly Ala Phe Pro Met Glu Asp Phe Tyr Leu Asn Val Leu Ala Asp Asn 275 280 285 Ser Pro Lys Val Lys Val Thr Val Ala Pro Phe Arg Gly Val Asp Gly 290 295 300 Gln Pro Ile Asp Trp Ile Thr Gly Asn Ala Trp Ala Ile Pro Ala Asn 305 310 315 320 Ser Ala His Pro Gly Gln Ala Cys Lys Trp Ile Lys Thr Met Thr Ala 325 330 335 Ser Glu Thr Trp Ile Ala Ala Ala Arg Ala Arg Ala Glu Leu Arg Lys 340 345 350 Lys Glu Asn Lys Pro Phe Ala Gly Val Tyr Thr Gly Asn Lys Lys Ala 355 360 365 Asp Glu Val Ile Phe Arg Asp Val Val Lys Pro Asp Ala Asn Val Gln 370 375 380 Ile Val Leu Gln Thr Gln Glu Ser Gly Phe Ser Glu Pro Ala Leu Ala 385 390 395 400 Ala Gly Glu Glu Phe Lys Ala Ala Trp Gln Asn Ala Val Asn Arg Val 405 410 415 Leu Glu Gly Lys Gln Lys Pro Ala Gln Ala Met Ala Glu Ala Gln Gln 420 425 430 Gln Ala Gln Ala Ala Leu Asp Lys Ala Asn Ser Gly Arg 435 440 445 <210> 119 <211> 64 <212> PRT <213> Actinoplanes garbadinensis <400> 119 Met Ser Ala Leu Ala Ile Glu Lys Ser Trp Lys Asp Val Asp Leu Arg 1 5 10 15 Asp Gly Ala Thr Ser His Pro Ala Gly Leu Gly Phe Gly Glu Leu Thr 20 25 30 Phe Glu Asp Leu Arg Glu Asp Arg Thr Ile Tyr Ala Ala Ser Ser Gly 35 40 45 Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Val Ile Cys Ala Cys 50 55 60 <210> 120 <211> 1053 <212> PRT <213> Actinoplanes garbadinensis <400> 120 Met Ser Pro Val Pro Ser Leu Asn Ser Thr Ser Val Arg Asp Ser Ala 1 5 10 15 Tyr Leu His Glu Arg Thr Val Thr Gly Glu Asp Gln Pro Ala Pro Ala 20 25 30 Ala Gln Ala Arg Ile Ala Ser Trp Arg Asp Ser Ala Phe Leu Asp Asp 35 40 45 Arg Val Leu Asp Ile Arg Leu Arg Gln Trp Gly Ile Asp Arg Ala Thr 50 55 60 Phe Gly Arg Leu Leu Thr Asp Asp Asp Phe Thr Val Pro Gly Arg Leu 65 70 75 80 Leu Ala Trp Ala Asp Glu Leu Ala Thr Val Leu Ala Thr Asp Thr Thr 85 90 95 Pro Val Thr Gly Leu Glu Leu Ser Thr Lys Leu Trp Ser Gln Gly Phe 100 105 110 Asp Arg Leu Leu Phe Ala Gly Leu Leu His Pro Phe Leu Ala His Tyr 115 120 125 Glu Gln Arg Leu His Glu Arg Val Pro Arg Pro Ile Ala Gly Ser Leu 130 135 140 Arg Arg Pro Leu Leu Glu Ser Leu Ala Asn Arg Leu Leu Ala Val Ala 145 150 155 160 Ala Arg Thr Leu Leu Leu Glu Leu Asn Val Ala Arg Val His Gly Arg 165 170 175 Leu Thr Gly Asp Thr Pro Gln Gln Arg Tyr Asp Asp Tyr Asp Arg Arg 180 185 190 Leu Leu Thr Asp Pro Ala Tyr Leu Ala Ala Leu Phe Glu Glu Tyr Pro 195 200 205 Val Leu Gly Arg Cys Leu Val Glu Cys Gly Arg Arg Trp Val Asp His 210 215 220 Ala Ala Glu Leu Phe Asn Arg Leu His Asp Asp Glu Pro Glu Leu Arg 225 230 235 240 Ala Ala Gly Leu Leu Pro Pro Ser Ala Glu Ala Leu Arg Ser Val Arg 245 250 255 Leu Asp Leu Gly Asp Pro His Asn Gly Gly Arg Ser Val Val Gln Leu 260 265 270 Thr Phe Asp Asp Gly Thr Asp Leu Val Tyr Lys Pro Arg Pro Val Gly 275 280 285 Ser Glu Arg Ala Tyr Ala Glu Thr Met Ala Ala Leu Ala Arg His Gly 290 295 300 Leu Pro Val Pro Val Thr Ala Pro Arg Val Leu Asp Arg Gly Gly His 305 310 315 320 Gly Trp Cys Glu Phe Val Arg Pro Ala Pro Cys Ala Asp Ala Ala Glu 325 330 335 Leu Ser Arg Phe Tyr Arg Arg Ala Gly Ser Val Leu Ala Ala Met Leu 340 345 350 Leu Leu Gly Gly Val Asp Met His Met Glu Asn Val Ile Ala Ala Gly 355 360 365 Ser Ser Phe Thr Pro Ile Asp Leu Glu Thr Val Leu Gln Ser Gly Glu 370 375 380 Leu Gly Asp Gly Ala Thr Asp Ala Tyr Gly Arg Ala Leu Asp Leu Leu 385 390 395 400 Asn Arg Ser Val Leu Ala Ile Gly Ile Leu Pro Ala Arg Ala Phe Gly 405 410 415 Gly Arg Gln Arg Lys Ser Val Asp Val Ser Ala Leu Gly Gly Gly Glu 420 425 430 Pro Gln Thr Ala Pro Arg Pro Val Pro Arg Ile Val Asp Ala Tyr Thr 435 440 445 Asp Thr Ala Arg Leu Glu Ala Val Glu Ala Thr Met Ala Gly Ala Gln 450 455 460 Asn Arg Pro Ser Leu Pro Gly Ala Glu Val Arg Pro Trp Glu His Thr 465 470 475 480 Ala Asp Val Val Ala Gly Phe Thr Asp Ala Tyr Asp Ile Met Leu Ala 485 490 495 His Arg Ala Asp Phe Asp Arg Leu Leu Arg Gly Phe His Asp Val Glu 500 505 510 Val Arg Tyr Leu Pro Arg Pro Thr Arg Arg Tyr Ser Ile Phe Leu Thr 515 520 525 Glu Ser Tyr His Pro Asp Tyr Leu Arg Asp Ala Ser Asp Arg Asp Arg 530 535 540 Leu Leu Asp Lys Leu Trp Thr Ala Ala Asp Ala Arg Pro Glu Leu Ile 545 550 555 560 Pro Ile Ile Glu Ser Glu Lys Arg Gln Leu Leu Ala Gly Asp Ile Pro 565 570 575 Cys Phe Arg Ser Val Ala Gly Ser Arg Gln Ile Arg Thr Ala Ser Gly 580 585 590 Pro Leu His Pro Glu Phe Phe Thr Ala Pro Ala Val Thr Val Leu Thr 595 600 605 Arg Arg Leu Gly Glu Phe Gly Pro Val His Arg Ala Ala Gln Val Arg 610 615 620 Ile Ile Arg Asp Ser Met Ala Thr Met Pro Gly Pro Arg Pro Ala Ala 625 630 635 640 Gln Pro Ser Pro Asp Arg Ala Ala Gly Pro Arg Pro Arg Val Thr Gly 645 650 655 Ala Asp Pro Ala Thr Leu Ala Asp Arg Ile Ala Arg Arg Leu Ala Asp 660 665 670 Glu Ala Ile Leu Gly Asp Arg Asp Val Ser Trp Ile Gly Val Ser Ile 675 680 685 Glu Gly Val Ala Gln Glu Thr Tyr Ser Tyr Lys Pro Met Ala Thr Gly 690 695 700 Leu Tyr Asp Gly Val Ala Gly Leu Ala Leu Thr Phe Ala Tyr Ala Ala 705 710 715 720 Arg Thr Leu Gly Asp Asp Arg Tyr Leu Asp Leu Ala His Arg Ala Ala 725 730 735 Arg Pro Val Ala Gly Tyr Leu Arg Tyr Leu Ala Glu His Arg Ile Val 740 745 750 Glu Thr Val Gly Ala Tyr Ser Gly Thr Ala Gly Leu Leu Tyr Ala Leu 755 760 765 Asp His Val Ala His Ala Thr Gly Asp Asp Ser Tyr Leu Asp Ala Val 770 775 780 Ser Glu Ala Val Pro Trp Leu Arg Glu Cys Ala Thr Arg Glu Glu Cys 785 790 795 800 Pro Asp Leu Ile Ala Gly Leu Ala Gly Cys Ala Leu Ile Ser Leu Asp 805 810 815 Leu His Gly Arg His Arg Ile Asp Gly Leu Arg Glu Val Ala Ala Ile 820 825 830 Cys Ala Glu Arg Leu Ala Ala Leu Ala Val Asp Val Asp Gly Ala Ala 835 840 845 Gly Trp Pro Ala Thr Pro Asp Gly Pro Leu Leu Gly Gly Phe Ser His 850 855 860 Gly Ala Ala Gly Ile Ala Trp Pro Leu His Arg Leu Ala Thr Glu Leu 865 870 875 880 Gly Asp Pro Ser Leu Arg Glu Leu Ala Arg Arg Ala Val Gln Phe Asp 885 890 895 Arg Asp Leu Tyr Val Pro Ala Ala Gly Ala Trp Arg Asp Leu Arg Pro 900 905 910 Glu Met Ala Gly Thr Asp Ser Tyr Pro Ala Leu Trp Cys His Gly Ala 915 920 925 Ala Gly Ile Gly Leu Ser Arg Leu Leu Ile Ala Gln His Asp Gln Asp 930 935 940 Thr Arg Leu Ala Ala Glu Ala Thr Ala Ala Leu Asp Leu Val Gly Ala 945 950 955 960 His Gly Phe Gly His Asn His Ser Ile Cys His Gly Asp Phe Gly Ala 965 970 975 Leu Ala Leu Phe Asp Leu Ala Ala Arg Thr Gly Phe Asp Pro Gly Arg 980 985 990 His Asp Ala Ala Ala Ala Ala Val Thr Ala Asp Ile Ala Ala Asn Gly 995 1000 1005 Ala Arg Cys Gly Leu Val Gly Asp Ile His Met Pro Gly Leu Met 1010 1015 1020 Leu Gly Ala Ala Gly Ile Cys Leu Ser Leu Leu Arg Ile Ala His 1025 1030 1035 Pro Ala Gln Val Pro Ala Val Ala Trp Leu Gln Pro Pro Leu Thr 1040 1045 1050 <210> 121 <211> 341 <212> PRT <213> Actinoplanes garbadinensis <400> 121 Met Pro Glu Glu Ile Val Leu Ser Val Leu Asp Gln Val Pro Val Phe 1 5 10 15 Arg Asp Gly Ser Pro Ala Glu Ala Val Arg Asp Ala Val Ala Leu Ala 20 25 30 Arg Ser Ala Glu Gln Tyr Gly Tyr His Arg Phe Trp Ile Ala Glu His 35 40 45 His Gly Ser Ala Ala Asn Ala Cys Ala Ala Pro Glu Val Val Thr Ala 50 55 60 Ala Val Ala Ala Ala Thr Ser Arg Ile Arg Val Gly Ser Gly Gly Val 65 70 75 80 Leu Leu Pro His Tyr Ser Pro Leu Lys Val Ala Glu Thr Phe Arg Val 85 90 95 Leu Ala Ala Leu Tyr Pro Gly Arg Ile Asp Leu Gly Phe Gly Arg Ala 100 105 110 Pro Gly Gly Pro Pro Ala Met Ala Glu Leu Leu Asn Pro Tyr Ala Val 115 120 125 Arg Thr Asp Glu Ala Phe Leu Glu Gln Ile Gly Arg Leu Leu Gly Phe 130 135 140 Leu Gly Asp Thr Arg Thr Val Ser Arg Val Ser Val Thr Pro Gln Val 145 150 155 160 Glu Glu Pro Pro Val Pro Trp Met Leu Gly Ala Gly Thr Gly Ser Ala 165 170 175 Arg Met Ala Gly Met Leu Gly Leu Pro Phe Cys Phe Ala Gln Phe Ile 180 185 190 Ala Thr Glu Glu Cys Pro Glu Ala Ile Glu Ala Tyr Arg Asp Ala Phe 195 200 205 Arg Pro Ser Pro Trp Leu Glu Arg Pro Gln Pro Met Leu Ala Leu Arg 210 215 220 Val Leu Cys Ala Asp Ser Asp Ala Glu Ala Glu Glu Leu Ala Thr Cys 225 230 235 240 Phe Trp Met Ser Cys Thr Thr Gly Trp Arg Ala Gln Val Gln Leu Thr 245 250 255 Asp Asp Tyr Arg Gly Gly Ala Pro Asn Leu Asp Asp Ala Arg Arg Tyr 260 265 270 Arg Leu Thr Ala Glu Asp Leu Ala Leu Arg Glu Ser Arg Pro Phe Leu 275 280 285 Gln Ile Ser Gly Thr Pro Ala Ala Val Gly Lys Glu Ile Arg Arg Leu 290 295 300 Gln Ala Val Tyr Gly Val Ser Glu Val Val Leu Thr Thr Asn Cys Pro 305 310 315 320 Gly Leu Pro Ala Arg Arg Arg Ser Tyr Glu Leu Leu Ala Gly Glu Phe 325 330 335 Ala Ser Pro Ala Ala 340 <210> 122 <211> 231 <212> PRT <213> Actinoplanes garbadinensis <400> 122 Met Arg Ser Ala Ala Arg Gly Gly Pro Ile Val Thr Asp Val Leu Val 1 5 10 15 Val Asp Gly Glu Ala Leu Val Ser Ile Gly Ile Lys Met Ile Leu Glu 20 25 30 Ser Thr Gly Gly Phe Ala Val Ala Thr Thr Asp Arg Glu Asn Leu Arg 35 40 45 Ser Ala Val Glu Gln His Arg Pro Ala Val Val Leu Leu Asp Gly His 50 55 60 Ser Ala Gln Ser Asp Gly Leu Glu Val Leu Asp Gln Leu Arg Ala Leu 65 70 75 80 Ser Ser Pro Pro Ala Ile Ala Met Leu Thr Thr Leu Ala Pro Pro Glu 85 90 95 Leu Val Leu Asp Ser Leu Arg Gly Gly Ala Cys Gly Phe Leu Leu Arg 100 105 110 Asp Ser Gln Pro Glu Gln Leu Val Ala Ala Val Arg Ala Leu Ala Glu 115 120 125 Gly Ser Ile Val Leu Ala Pro Glu Ala Ser Ser Val Val Val Arg Ala 130 135 140 Gly Ser Arg Gly Ser Ala Ala Gly Ala Gly Ser Pro Ala Cys Glu Arg 145 150 155 160 Val Lys Gln Leu Ser Asp Arg Glu Gln Ser Ile Leu Arg Leu Leu Gly 165 170 175 Ala Gly Leu Thr Asn Ala Glu Ile Ser Arg Gln Leu Phe Leu Ser Ala 180 185 190 Ala Thr Val Lys Glu His Val Ser Val Ile Leu Ser Lys Leu Gly Val 195 200 205 Ala Asn Arg Val Gln Ala Ala Val Leu Ala Tyr Ala Ser Gly Leu Ser 210 215 220 Ser Asp Asp Val Cys Leu Ser 225 230 <210> 123 <211> 812 <212> PRT <213> Actinoplanes garbadinensis <400> 123 Met Ile Phe Ala Leu Ala Trp Ser Gln Leu Arg Ala Tyr Pro Ala Arg 1 5 10 15 Leu Phe Ala Ile Val Ala Ala Val Met Leu Ala Thr Gly Phe Leu Ala 20 25 30 Ala Thr Ala Thr Phe Ala Ala Thr Ser Gly Glu Gly Leu Arg Arg Thr 35 40 45 Ala Ala Ala Pro Leu Thr Thr Ala Asp Ile Val Leu Asp Ala Asp Asp 50 55 60 Thr Val Arg Asp Pro Ala Trp Tyr Glu Ala Ala Ala Ala Val Pro Gly 65 70 75 80 Val Arg Ser Val Asp Ala Gln Tyr Ala Arg Thr Val Ser Val Phe Gly 85 90 95 Gly Ser Arg Arg Gly Ser Ala Asn Val Gln Ser Ile Ala Ala Thr Pro 100 105 110 Gln Val Arg Trp Phe Thr Leu Asp Arg Gly Ala Trp Pro Thr Gly Pro 115 120 125 Gly Gln Leu Val Ala Asp Gln Arg Thr Leu Asp Asp Leu Gly Ile Asp 130 135 140 Val Gly Ala Thr Leu Thr Val Arg His Gly Glu Ala Ala Pro Gln Pro 145 150 155 160 Val Thr Val Thr Gly Ala Ala Asp Leu Gly Phe Arg Pro Leu Thr Gly 165 170 175 Ser Asp Phe Arg Phe Tyr Ala Asp Ala Ser Phe Phe Ala Gly Asp Val 180 185 190 Pro Pro Ala Ala Leu Leu Thr Val Ala Asp Asp Ala Ser Leu Thr Gly 195 200 205 Thr Val Asp Ala Leu Arg Arg Ser Met Gly Pro Gly Ile Ser Ala Thr 210 215 220 Asp Ala Ser Ala Ala Ala Asp Gln Ala Ala Ala Arg Phe Ala Gly Gly 225 230 235 240 Asn Gly Gln Leu Val Val Ile Met Leu Ala Phe Ala Ala Val Ala Leu 245 250 255 Leu Ala Ala Val Leu Val Ile Ala Asn Thr Phe His Val Val Ile Val 260 265 270 Gln Arg Ile Arg Gln Ile Ala Leu Leu Arg Leu Val Gly Gly His Arg 275 280 285 Ala Gln Val Ser Arg Val Val Leu Ala Glu Ala Ala Ile Ala Gly Thr 290 295 300 Ala Gly Gly Leu Val Gly Ala Ala Ala Gly Val Gly Leu Gly Tyr Leu 305 310 315 320 Gly Ala Asp Leu Leu Asp Ile Ser Gly Gly Gly Leu Arg Val Asn Pro 325 330 335 Phe Ala Leu Ala Gly Cys Val Leu Ala Gly Val Leu Ala Thr Leu Val 340 345 350 Ala Ala Trp Ala Pro Ala Arg Arg Ala Thr Arg Ile Ala Pro Val Arg 355 360 365 Ala Leu Gln Ala Ala Asp Glu Pro Pro Ala Gly Thr Val Arg Gly Gly 370 375 380 Arg Arg Leu Val Val Gly Thr Val Val Thr Val Val Gly Ala Ala Ala 385 390 395 400 Leu Ala Val Ala Ala Ile Gly Ala Ser Leu Pro Leu Ala Leu Leu Gly 405 410 415 Gly Leu Leu Leu Ala Ala Gly Leu Leu Ala Ala Leu Pro Arg Leu Ile 420 425 430 Ala Leu Ser Leu Ala Pro Ala Ala Arg Leu Leu Glu Arg Phe Gly Val 435 440 445 Ala Ala Gly Leu Ala Gly Thr Ser Leu Ser Gln Asn Ala Arg Arg Thr 450 455 460 Ala Ser Ala Ala Met Ala Val Val Val Gly Ala Ala Leu Ile Thr Cys 465 470 475 480 Leu Ala Val Ala Ala Thr Ser Gly Arg Ala Thr Val Asn Ala Asp Leu 485 490 495 Glu Ala Arg Tyr Pro Val Ala Ala Gly Leu Arg Thr Asp Gly Glu Pro 500 505 510 Ile Ser Gly Ala Thr Ala Gly Ala Phe Ala Ala Val Pro Gln Leu Ser 515 520 525 Ala Ser Gly Thr Val Gly Thr Val Ala Ala Arg Phe Pro Asp Gly Gly 530 535 540 Lys Ala Thr Pro Arg Leu Leu Ala Ala Pro Gly Asp Glu Leu Ala Ala 545 550 555 560 Arg Val Ala Pro Glu Leu Ala Gly Glu Pro Val Val Leu Val Pro Ala 565 570 575 Thr Tyr Leu Ala Glu Leu Gly Leu Pro Asp Ser Ala Pro Ile Val Val 580 585 590 Glu Val Gly Glu Arg Arg Val Asn Leu Ile Ala Arg Ala Ser Arg Leu 595 600 605 Ala Asp Thr Thr Gly Gln Leu Leu Gly Val Val Ser Ala Arg Thr Leu 610 615 620 Ala Ala Asn Arg Ile Glu Ala Val Pro Thr Thr Val Trp Gly Val Ala 625 630 635 640 Asp Pro Gly Phe Asp Arg Glu Ala Leu Ser Ala Ala Val Gly Ala Val 645 650 655 Ala Ala Arg Asp Ala Leu Val Gln Val Gly Gly Gly Val Thr Glu Gly 660 665 670 Gly Asp Ile Ala Asn Val Leu Ser Ile Leu Leu Gly Leu Ser Leu Ala 675 680 685 Met Leu Ala Val Thr Val Val Ile Ala Leu Leu Gly Ile Ala Asn Leu 690 695 700 Leu Gly Leu Ser Val Val Glu Arg Val Arg Glu Met Ala Leu Leu Arg 705 710 715 720 Ala Leu Gly Thr Arg Arg Ala Arg Leu Arg Ala Met Leu Ala Val Glu 725 730 735 Ala Val Val Ile Thr Leu Leu Gly Thr Val Ala Gly Leu Val Val Gly 740 745 750 Val Pro Val Gly Leu Ala Ala Val Ala Ala Ala Val Gly Arg Thr Ala 755 760 765 Asp Pro Val Ile Arg Leu Pro Trp Gly Gln Leu Ala Ala Val Leu Val 770 775 780 Val Ala Val Leu Thr Gly Val Val Ala Ser Leu Ala Pro Ala Arg Arg 785 790 795 800 Ala Ala Arg Val Ala Pro Ala Glu Gly Leu Thr Arg 805 810 <210> 124 <211> 244 <212> PRT <213> Actinoplanes garbadinensis <400> 124 Met Ile Val Trp Pro Glu Arg Arg Ala Ala Ser Arg Ser Pro Pro Ser 1 5 10 15 Ser Ala Arg Pro Val Ala Met Ser Ser Ala Pro Val Gly Ser Ser Ala 20 25 30 Lys Thr Thr Asp Gly Leu Ala Ser Ser Ala Arg Ala Thr Ala Thr Arg 35 40 45 Cys Cys Trp Pro Pro Asp Ser Ser Asp Gly Arg Cys Pro Ser Arg Ser 50 55 60 Val Ile Cys Ser Glu Ser Val Ile Phe Arg Ser Ser Pro Gly Ser Thr 65 70 75 80 Arg Arg Pro Ala Ser Arg Ser Gly Ser Thr Met Phe Cys Ser Ala Val 85 90 95 Ser Val Gly Ser Arg Leu Asn Ala Trp Lys Thr Lys Pro Ile Arg Ser 100 105 110 Arg Arg Arg Ser Val Arg Ala Arg Ser Ser Arg Pro Ala Asn Asp Arg 115 120 125 Pro Ala Arg Leu Thr Val Pro Ala Val Gly Val Ser Asn Pro Ala Ser 130 135 140 Arg Cys Ile Ser Val Val Phe Pro Glu Pro Asp Gly Pro Met Ile Ala 145 150 155 160 Val Asn Trp Pro Ala Glu Lys Pro Ala Asp Thr Pro Ser Thr Ala Val 165 170 175 Thr Ala Ala Gly Pro Val Pro Tyr Val Leu Leu Thr Ser Arg Gln Leu 180 185 190 Thr Ile Ser Ala Cys Val Val Cys Val Val Thr Ala Pro Thr Leu Glu 195 200 205 Ile Arg Ala Asp Arg His Ile Pro Pro Arg Asp Pro Gly Arg Ala Val 210 215 220 Asp Arg Tyr Leu Arg Met Thr Arg Arg Tyr Arg Pro Arg Ala Pro Cys 225 230 235 240 Ser Arg Asn Arg <210> 125 <211> 367 <212> PRT <213> Actinoplanes garbadinensis <400> 125 Val Leu Arg Ile Asp Ala Leu Val Ala Ala Ala Val Val Ile Gly Cys 1 5 10 15 Leu Leu Leu Gly Leu Ala Gly Leu Ser Glu Trp Tyr Trp Ser Ala Ala 20 25 30 Val Ala Val Pro Leu Leu Leu Arg Arg Ser Ala Pro Arg Cys Phe Leu 35 40 45 Ala Leu Val Ala Gly Val Ser Gly Leu His Leu Leu Ala Ser His Ser 50 55 60 Phe Met Phe Pro Gly Asp Leu Val Ala Leu Val Ala Val His Ala Ala 65 70 75 80 Ala Ala His Ala Pro Gly Arg Ala Arg His Ala Gly Leu Leu Leu Gly 85 90 95 Ala Ala Gly Ala Leu Val Val Ala Ala Gln Ala Leu Gln Asp Gln Arg 100 105 110 Leu Gly Ser Ala Leu Pro Ala Val Leu Ile Val Ala Ser Thr Met Ala 115 120 125 Ala Trp Ser Ile Gly Leu Met Gln Arg Gln Gln Arg Ser Ala Val Leu 130 135 140 Asp Ala Glu His Arg Arg Arg Leu Ala Glu Gln Asp Ser Ala Met Arg 145 150 155 160 Ala Gln Leu Ala Val His Glu Glu Arg Thr Arg Ile Ser Gln Glu Met 165 170 175 His Asp Ile Ile Ala His Ser Leu Ala Ser Ile Ile Ala Gln Ala Glu 180 185 190 Gly Gly Arg Val Ala Ala Arg Ala Asp Ala Arg Ile Ala Gly Pro Val 195 200 205 Phe Asp Arg Ile Ala Gly Leu Gly Arg Gln Ala Leu Thr Asp Val Lys 210 215 220 Arg Leu Leu Thr Val Val Asp His Asp Asp Glu Trp His Asp Asp Gly 225 230 235 240 Leu Glu Arg Leu Pro Val Leu Leu Ala Gly Val Thr Glu Ala Gly Leu 245 250 255 Asp Val Thr Val Asp Ser Ser Gly Ala Pro Gln Pro Leu Ala Ala Gly 260 265 270 Met Asp Leu Ala Val Tyr Arg Val Ile Gln Glu Ser Leu Thr Asn Val 275 280 285 Leu Lys His Ala Pro Ala Arg Arg Ala Cys Leu Arg Met Arg Trp Thr 290 295 300 Pro Ala Leu Leu Thr Val Thr Val Ser Ser Pro Leu Pro Gly Gly Arg 305 310 315 320 Gly Ala Gly Leu Val Glu Gly Arg Gly Leu Ser Gly Ile Arg Gln Arg 325 330 335 Cys Ser Leu Phe Asn Gly Asp Cys Thr Val Thr Ala Thr Thr Glu Leu 340 345 350 Thr Val Thr Thr Thr Trp Pro Leu Thr Pro Glu Gly Ala Arg Ala 355 360 365 <210> 126 <211> 220 <212> PRT <213> Actinoplanes garbadinensis <400> 126 Met Thr Arg Pro Pro Ile Ala Val Leu Ile Ala Asp Asp Gln Glu Leu 1 5 10 15 Val Arg Thr Gly Phe Ala Met Val Val Asp Ala Ala Pro Asp Met Arg 20 25 30 Val Val Ala Ile Ala Ala Ser Gly Ala Glu Ala Ile Glu Leu Ala Ala 35 40 45 Glu His Arg Pro Asp Val Ile Leu Met Asp Ile Arg Met Pro Gly Thr 50 55 60 Asp Gly Ile Thr Ala Thr Ser Ala Ile Leu Ala Ala Gly Gly Glu Arg 65 70 75 80 Pro Pro Lys Ile Ile Ala Leu Thr Thr Tyr Asp Ser Ser Asp Tyr Ala 85 90 95 Thr Arg Ile Leu Thr Ala Gly Ala Ser Gly Tyr Leu Leu Lys Asp Ala 100 105 110 Thr Ala Glu Gly Leu Thr Ala Ala Ile Arg Ser Ala Tyr His Gly Gly 115 120 125 Ser Val Ile Ala Pro Thr Thr Thr Arg Asn Leu Val Ala Ala Arg Ala 130 135 140 Glu Pro Pro Pro Pro Ala Arg Asp Pro Ala Pro Leu Asp Thr Phe Thr 145 150 155 160 Ala Arg Glu Arg Asp Val Phe Asp Leu Ile Val Ala Gly Ala Asn Asn 165 170 175 Ala Glu Ile Ala Ala Arg Leu His Leu Ala Glu Val Thr Val Lys Thr 180 185 190 His Val Gly Arg Val Leu Ala Lys Leu Gly Val Arg Asp Arg Leu Asn 195 200 205 Val Val Val Trp Ala Tyr Arg Asn Gly Ala Val Gly 210 215 220 <210> 127 <211> 782 <212> PRT <213> Actinoplanes garbadinensis <400> 127 Met Leu Ile Cys Gly Leu Ile Ala Gly Val Val Val Ala Ala Ala Ala 1 5 10 15 Phe Pro Phe Ala Ala Met Ser Gly Leu Ala Ala Lys Ala Gly Gln Gln 20 25 30 Thr Phe Ala Ser Leu Pro Ser Glu Leu Lys Ala Phe Arg Ser Pro Gln 35 40 45 Ile Ser Arg Ile Tyr Ala Ala Asp Asn Arg Thr Gln Val Ala Gln Phe 50 55 60 Tyr Asp Glu Phe Arg Ser Asp Val Pro Leu Lys Glu Met Ser Pro Phe 65 70 75 80 Met Arg Asp Ala Met Val Ala Ala Glu Asp Arg Gln Phe Tyr Gln His 85 90 95 His Gly Val Asp Leu Lys Gly Ala Ala Arg Ala Leu Val Asn Asn Arg 100 105 110 Asn Gly Gly Gln Lys Gln Gly Ala Ser Thr Ile Thr Met Gln Trp Val 115 120 125 Arg Ile Ser Leu Ala Tyr Ser Ala Thr Lys Pro Gln Asp Val Ile Asp 130 135 140 Ala Thr Glu Asp Ala Pro Lys Arg Lys Val Ala Glu Met Lys Tyr Ala 145 150 155 160 Leu Glu Val Glu Lys Gln Leu Ser Lys Asp Gln Ile Leu Glu Arg Tyr 165 170 175 Leu Asn Ile Val Pro Phe Gly Lys Gln Thr Tyr Gly Ile Tyr Ala Ala 180 185 190 Ser Arg Val Tyr Phe Asn Lys Lys Pro Lys Asp Leu Thr Ile Gly Glu 195 200 205 Ala Ala Leu Leu Ala Ala Ile Val Lys Ala Pro Ser Ala Tyr Asp Pro 210 215 220 Thr Asp Pro Asp Gly Tyr Glu Leu Ile Arg Gln Arg Arg Asn Ala Tyr 225 230 235 240 Val Ile Pro Gly Met Val Glu Met Gly Ala Ile Thr Arg Ala Gln Ala 245 250 255 Asp Ala Ala Leu Lys Glu Ala Ile Pro Arg Lys Val Arg Pro Met Ser 260 265 270 Asn Gly Cys Val Ser Val Ala Lys Asn Asn Trp Gly Phe Phe Cys Asp 275 280 285 Tyr Phe Tyr Arg Trp Trp Met Glu Arg Lys Glu Phe Gly Pro Thr Pro 290 295 300 Tyr Asp Arg Glu Arg Arg Leu Lys Ser Gly Gly Tyr Arg Ile Thr Thr 305 310 315 320 Thr Leu Asp Val Lys Ala Gln Lys Gln Ala Arg Asp Arg Ile Gly Asp 325 330 335 Leu Ile Ser Glu Lys Asn Lys Asn Ala Leu Leu Leu Ala Ala Val Glu 340 345 350 Pro Gly Thr Gly Lys Val Arg Met Leu Ala Ala Asn Arg Arg Tyr Lys 355 360 365 Leu Asp Asp Pro Asp Asp Pro Gln Asn Ala Ile Ser Ser Asp Pro Arg 370 375 380 Lys Ala Arg Lys Gly Ile Arg Gly Ser Tyr Pro Asn Thr Thr Asn Pro 385 390 395 400 Leu Leu Thr Gly Gly Gly Asp Ile Thr Gly Tyr Gln Ala Gly Ser Val 405 410 415 Met Lys Met Phe Thr Ile Val Ala Ala Leu Glu Gln Gly Tyr Pro Leu 420 425 430 Ala Tyr Thr Ile Arg Thr Gln Ser Arg Tyr Arg Ser Arg Tyr Ile Ile 435 440 445 Glu Ser Ser Asn Asp Ala Ala Cys Pro Gly Thr His Phe Trp Cys Pro 450 455 460 Ser Asn Ala Gly Gly Gly Gly Glu Gly Val Phe Asn Met Trp Thr Gly 465 470 475 480 Leu Gly Arg Ser Ile Asn Thr Tyr Phe Val Pro Leu Glu Glu Arg Val 485 490 495 Gly Ala Glu Lys Val Val Ser Ala Ala Lys Arg Phe Gly Ile Gln Phe 500 505 510 Arg Glu Pro Asp Asp Ala Leu Leu Ala Glu Pro Gly Asn Ala His Gln 515 520 525 Trp Gly Ala Phe Thr Leu Gly Val Ser Ala Thr Thr Pro Leu Asp Met 530 535 540 Ala Asn Ala Tyr Ala Thr Leu Ala Ala Asp Gly Met Tyr Cys Pro Pro 545 550 555 560 Thr Pro Ile Glu Arg Ile Ala Thr Arg Asp Gly Asp Gln Leu Asp Val 565 570 575 Gly Arg Ser Pro Cys Val Arg Ala Thr Ala Lys Asp Val Ala Arg Ala 580 585 590 Ala Leu Asp Ala Ala Arg Cys Pro Val Gly Asp Ser Ala Gln Leu Gly 595 600 605 Arg Cys Gly Gly Ser Thr Ala Gly Ile Thr Arg Ser Val Val Gly His 610 615 620 Pro Val Phe Gly Lys Thr Gly Thr Thr Asp Arg Asp Arg Thr Ala Ser 625 630 635 640 Leu Ile Ala Gly Thr Thr Ala Leu Val Val Ala Gly Tyr Leu Val Asn 645 650 655 Pro Asp Tyr Gln Asn His Arg Asp Arg Leu Asp His Asp Gln Val Asn 660 665 670 Pro Ala Val Tyr Arg Thr Leu Ala Asp Tyr Met Glu Gly Arg Pro Arg 675 680 685 Glu Ser Phe Lys Arg Pro Ser Ser Gly Arg Ile Ala Phe Gly Asp Gln 690 695 700 Arg Ser Ile Pro Asp Val Glu Cys Asp Pro Met Pro Arg Ala Arg Asp 705 710 715 720 Arg Leu Glu Asp Ala Gly Phe Asp Val Trp Arg Gly Gln Glu Val Glu 725 730 735 Ser Asp Cys Pro Ala Gly Thr Ala Ala Gly Thr Glu Pro Ser Gly Arg 740 745 750 Thr Val Lys Asn Gly Val Val Val Ile Gln Val Ser Lys Gly Arg Arg 755 760 765 Gly Ala Ser Pro Pro Ile Phe Pro Pro Ile Gly Pro Pro Arg 770 775 780 <210> 128 <211> 253 <212> PRT <213> Actinoplanes garbadinensis <400> 128 Met Ala Pro Leu Thr Arg Ser Leu Arg Tyr Tyr Tyr Gly Asp Ala Gly 1 5 10 15 Arg Glu Ala Ala Met Asp Ala Met Tyr Arg Arg Phe Val Arg Pro Gly 20 25 30 Asp Val Val Phe Asp Ile Gly Ala His Val Gly Asp Arg Val Ala Cys 35 40 45 Phe Arg Arg Leu Gly Ala Arg Val Val Ala Val Glu Pro Gln Pro Leu 50 55 60 Cys Met Arg Ala Leu Arg Ala Leu Tyr Ala His Asp Asp Arg Val Ala 65 70 75 80 Leu Val Glu Ala Ala Cys Gly Pro Ala Gly Gly Ser Val Pro Leu Tyr 85 90 95 Ile Asn Ser Ala Asn Pro Thr Val Ser Thr Asn Ser Val Arg Phe Leu 100 105 110 Thr Ala Ala Thr Gly Ser Arg Gly Trp Glu Asn Glu Val Trp Asp Gln 115 120 125 Gln Ile Thr Val Pro Ala Val Thr Leu Asp Thr Leu Val Gln Arg Phe 130 135 140 Gly Leu Pro Ala Phe Ile Lys Ile Asp Val Glu Gly Tyr Glu Asp Ala 145 150 155 160 Val Leu Ala Gly Leu Ser Arg Gly Val Arg Ala Leu Ser Phe Glu Phe 165 170 175 Thr Thr Ile Ala Arg Asp Val Ala Arg Arg Cys Leu Asp Arg Ala Gly 180 185 190 Glu Leu Gly Phe Asp Gly Phe Asp Val Ser Leu Gly Glu Thr Met Ala 195 200 205 Arg Thr Phe Gly Arg Trp Ala Ala Arg Asp Glu Met Leu Ala His Leu 210 215 220 Ala Gly Leu Pro His Glu Ala Asn Ala Gly Asp Val Tyr Ala Val Ser 225 230 235 240 Arg Ser Ala Gly Trp Pro Asp Arg Arg Glu Asp Arg Arg 245 250 <210> 129 <211> 261 <212> PRT <213> Actinoplanes garbadinensis <400> 129 Val Pro Arg Phe Asp Ser Arg Leu Val Thr Val Gly Gly Val Arg Thr 1 5 10 15 His Asp Arg His Ala Cys His Ala Gly Gly Leu Pro Val Val Leu Val 20 25 30 His Gly Leu Ala Val Ser His Arg Tyr Leu Met Pro Thr Ala His Ala 35 40 45 Leu Ala Gly Arg His Pro Val Leu Val Pro Asp Leu Pro Gly Phe Gly 50 55 60 Phe Ser Asp Lys Pro Arg Arg Ala Tyr Asp Val Gly Arg His Ala Glu 65 70 75 80 His Leu Ala Ala Trp Leu Asp Val Leu Gly Val Pro Arg Ala Cys Ile 85 90 95 Ala Gly His Ser Phe Gly Ala Glu Val Ala Ala Arg Leu Ala Val Leu 100 105 110 Arg Pro Asp Leu Val Ala Ala Val Val Leu Ala Ser Pro Thr Thr Asp 115 120 125 Pro Ala Ala Arg Ser Arg Arg Ala Leu Ile Gly Arg Trp Ala Val Asp 130 135 140 Leu Trp Ile Glu Ala Pro Trp Gln Ala Pro Val Leu Val Arg Asp Ile 145 150 155 160 Ala Asp Ala Lys Pro Trp Arg Val Leu Ala Thr Val Gly His Ser Val 165 170 175 Arg Asn Ala Ile Glu Glu Asp Leu Arg Arg Leu Pro Val Pro Pro Leu 180 185 190 Val Leu Gly Gly Ser Leu Asp Pro Val Ala Pro Leu Arg Trp Arg Ala 195 200 205 Glu Val Ala Ala Met Thr Gly Gly Val Ser Val Thr Val Pro Ala Ala 210 215 220 Ala His Asn Val Met Thr Thr Ser Gly Val Arg Ser Ala Arg Ala Ile 225 230 235 240 Ala Ala Tyr Leu Arg Thr Arg Arg Arg Cys Met Asp Arg Leu Ile Gly 245 250 255 Gly Met Pro Pro Pro 260 <210> 130 <211> 244 <212> PRT <213> Actinoplanes garbadinensis <400> 130 Val Ser Pro Pro Phe Arg Leu Asp Glu Ala Val Ala Asp Val Tyr Gly 1 5 10 15 Asp Leu Arg Leu Ala Pro Val Leu Arg Arg Leu Leu Arg His Ser Gly 20 25 30 Arg Leu Thr Gly Ser Val Ala Gly Ser Val Ser Leu Ile Asp Ala Asp 35 40 45 Arg Gly Cys Tyr Val Lys Ala Ala Glu Tyr Gly Ala Asn Cys Gln Leu 50 55 60 Gly Arg Ser Phe Pro Leu Asp Glu Gly Ala Thr Gly Arg Ala Phe Gly 65 70 75 80 Ser Arg Arg Pro Val Val Ile Pro Asp Tyr Gly Gln Leu Arg Ala Gly 85 90 95 His Leu Ala Ala Ala His Pro Ala Arg Lys Gly Pro Ala Val Ala Val 100 105 110 Pro Ile Trp Trp Arg Gly Asp Val Ile Ala Val Asn Val Ala Phe Ala 115 120 125 Pro Ala Phe Ser Leu Gly Gly Val Asp Glu Leu Glu Ala Leu Thr Gln 130 135 140 Ser Ala Ala Ala Ala Ile Val Arg Ser Arg Gly Val Arg Val Arg Ala 145 150 155 160 Asp Pro Pro Tyr Ala Ala Pro Ala Ala Pro Phe Thr Pro Arg Glu Ala 165 170 175 Glu Val Leu Asp Leu Leu Arg Gln Gly Leu Thr Asp Arg Glu Met Ala 180 185 190 Arg Arg Leu Gly Leu Ser Ala Lys Thr Val Glu Lys His Val Gly Ala 195 200 205 Ile Arg Arg Lys Thr Gly Thr Ser Asn Arg Thr Ala Ala Val Val Thr 210 215 220 Ala Leu Asp Asn Asp Trp Val Gly Asn Leu Pro His Thr Ala Glu His 225 230 235 240 Thr Thr Gly Ser <210> 131 <211> 281 <212> PRT <213> Actinoplanes garbadinensis <400> 131 Met Lys Asp Ile Leu Asp Arg Ala Leu Ala Glu Arg Tyr Gly Val Ala 1 5 10 15 Ala Phe Asn Ile Val Asn Asp Leu Thr Val Glu Ala Val Leu Ala Ala 20 25 30 Ala Ala Glu Glu Arg Ala Pro Val Ile Leu Gln Thr Ser Val Lys Thr 35 40 45 Val Arg Met Tyr Gly Arg Pro Arg Leu Tyr Glu Ile Val His Ala Phe 50 55 60 Ala His Asp Ala Pro Val Pro Val Thr Leu His Leu Asp His Cys Pro 65 70 75 80 Glu Arg Ser Val Ile Ser Asp Cys Leu Ala Gly Gly Trp Asn Ser Val 85 90 95 Leu Phe Asp Ala His Glu Leu Asp Val Ala Asp Asn Leu Arg Gln Thr 100 105 110 Thr Glu Val Val Ala Glu Ala Arg Arg Ala Gly Ala His Val Glu Gly 115 120 125 Glu Ile Glu Gly Ile Gln Gly Val Glu Asp Asp Val Gly Asn Asp Tyr 130 135 140 Ala Pro Met Val Gln Ser Leu Glu Val Ala Val Asp Phe Ile Lys Arg 145 150 155 160 Thr Gly Val Asp Cys Phe Ala Pro Ala Ile Gly Asn Ala His Gly Gln 165 170 175 Tyr Lys Gln Ala Pro Val Leu Asn Thr Arg Arg Val Ser Asp Leu Val 180 185 190 Ala Ala Thr Gly Ile Pro Met Ala Leu His Gly Gly Thr Gly Leu Ser 195 200 205 Asp Glu Gln Phe Thr Asp Leu Ile Ala Arg Gly Cys Ala Lys Val Asn 210 215 220 Ile Ser Thr Ala Leu Lys Glu Ser Phe Met Lys Ser Gly Leu Glu Phe 225 230 235 240 Leu Arg Glu Ala Asp Glu Arg Gly Lys Trp Asp Pro Pro Ser Leu Phe 245 250 255 Arg His Gln Arg Ala Ala Val Val Glu Met Ala Arg Gln His Ile Arg 260 265 270 Leu Phe Gly Gly Ser Gly Arg Ala Trp 275 280 <210> 132 <211> 192 <212> PRT <213> Actinoplanes garbadinensis <400> 132 Met Gly Ser Ala Val Ala Val Pro Ala Ser Ala Gly Gly Gly Arg Arg 1 5 10 15 Asp Gly Pro Ala Ala His Pro Ala Leu Arg Arg Ile Gly Ala Arg Val 20 25 30 Val Asn Ala Leu Val Phe Asp Cys Asp Gly Val Leu Ala Asp Thr Glu 35 40 45 Arg His Gly His Leu Pro Ala Phe Asn Ala Thr Phe Glu Gln Phe Gly 50 55 60 Leu Pro Val Arg Trp Ser Glu Glu Glu Tyr Gly Glu Lys Leu Arg Ile 65 70 75 80 Gly Gly Gly Lys Glu Arg Met Ala Ser Leu Phe Ala Asp Pro Ala Phe 85 90 95 Ala Ala Ala Ala Gly Asp Thr Asp Arg Thr Glu Leu Leu Arg Thr Trp 100 105 110 His Arg Ala Lys Thr Ala Ala Phe Thr Lys Leu Val Ala Glu Gly Arg 115 120 125 Ile Pro Ala Arg Pro Gly Thr Ala Arg Ile Ile Ser Glu Ala Leu Arg 130 135 140 Ala Gly Trp Thr Val Ala Val Ala Ser Thr Ser Ala Glu Asp Ser Val 145 150 155 160 Arg Ala Val Leu Val Asn Ala Val Gly Ala Thr Thr Ala Glu Arg Ile 165 170 175 Pro Val Phe Ala Gly Asp Val Val Pro Ala Lys Lys Pro Asp Pro Ala 180 185 190 <210> 133 <400> 133 000 <210> 134 <400> 134 000 <210> 135 <400> 135 000 <210> 136 <400> 136 000 <210> 137 <400> 137 000 <210> 138 <400> 138 000 <210> 139 <400> 139 000 <210> 140 <400> 140 000 <210> 141 <400> 141 000 <210> 142 <400> 142 000 <210> 143 <400> 143 000 <210> 144 <400> 144 000 <210> 145 <400> 145 000 <210> 146 <400> 146 000 <210> 147 <400> 147 000 <210> 148 <400> 148 000 <210> 149 <400> 149 000 <210> 150 <400> 150 000 <210> 151 <400> 151 000 <210> 152 <400> 152 000 <210> 153 <400> 153 000 <210> 154 <400> 154 000 <210> 155 <400> 155 000 <210> 156 <400> 156 000 <210> 157 <400> 157 000 <210> 158 <400> 158 000 <210> 159 <400> 159 000 <210> 160 <400> 160 000 <210> 161 <400> 161 000 <210> 162 <400> 162 000 <210> 163 <400> 163 000 <210> 164 <400> 164 000 <210> 165 <400> 165 000 <210> 166 <400> 166 000 <210> 167 <400> 167 000 <210> 168 <400> 168 000 <210> 169 <400> 169 000 <210> 170 <400> 170 000 <210> 171 <400> 171 000 <210> 172 <400> 172 000 <210> 173 <400> 173 000 <210> 174 <400> 174 000 <210> 175 <400> 175 000 <210> 176 <400> 176 000 <210> 177 <400> 177 000 <210> 178 <400> 178 000 <210> 179 <400> 179 000 <210> 180 <400> 180 000 <210> 181 <400> 181 000 <210> 182 <400> 182 000 <210> 183 <400> 183 000 <210> 184 <400> 184 000 <210> 185 <400> 185 000 <210> 186 <400> 186 000 <210> 187 <400> 187 000 <210> 188 <400> 188 000 <210> 189 <400> 189 000 <210> 190 <400> 190 000 <210> 191 <400> 191 000 <210> 192 <400> 192 000 <210> 193 <400> 193 000 <210> 194 <400> 194 000 <210> 195 <400> 195 000 <210> 196 <400> 196 000 <210> 197 <400> 197 000 <210> 198 <400> 198 000 <210> 199 <400> 199 000 <210> 200 <211> 40402 <212> DNA <213> Actinoplanes liguriae <400> 200 gatcaggtcg accgcggagc tgatctggtc acggatcgcg cggatcggca ggtccatgcc 60 ggccatcagc accatcgtct ccagccggga cagcgcgtcc cgcggcgtgt tcgcgtgcag 120 ggtggtcagc gagccgtcgt ggccggtgtt catcgcctgc agcatgtcga gcgcggcggc 180 gtcacggacc tcgccgacga cgatccggtc cgggcgcatc cgcagcgcgt tgcggaccag 240 gtcgcgggtg gtgatcgtgc cccggccctc ggagttcggc ggccgggact ccaggcgcac 300 cacgtggtcc tggaccagtt gcagctcggc ggcgtcctcg atggtcacga tgcgctcgtc 360 ggccgggacg aagctggaga ggacgttcag gatcgtggtc ttgccggagc cggtgccgcc 420 gctgaccagg atggtgcgcc ggccgcgcac gcacgcgtcc aggaactcgg cggcctgccg 480 ggtgagcgtg ccgtactgca gcaggtcacc gacggtgagc gggaccgcgg cgaacttgcg 540 gatggtcagc gtcgagccgt ccagcgcgat cggcgggacc acggcgttga cccggctccc 600 gtccggcagc cgggcgtcga cggtcgggct ggcctcgtcc acgcggcggc cgacccgcga 660 gcagatccgg tcgatgatcc ggcgcaggtg ctgctcgtcg tcgaactcgg cggcgacctt 720 ctcgaggcgg ccgaaccgct cgacgtagac cgagtacggc ccgttcacca tcacctcggt 780 caccgacggg tcgcgcagca gcgactcgat cggtccgtgg ccgagcacct cgtcggtcac 840 ctcgcgggtg atccgggccc ggtccgcgcc ggagagcggg gtctcctccc gggcgagcag 900 gtcgtggagc gcgtcccgga cccgggcgtc caggtcctcg ctctggccgg tggtgtagag 960 cgtcggcccg agctcgtcgg cgagccgccg ctggatccgc agccgcacct cgccgacctg 1020 gtcctgcggc gggcggccgg cggcccggta gcggtcgccg ccgcgtggct cggtgggcgg 1080 tggtgggggc gtgccggcgc cgctcaggcg gctggagagg ctcacgggaa caacctcccg 1140 aggaacccgc ggcgccgctg gggtgtggtg ccgacgccgg cgatccggtc accgagctcc 1200 cggatcgccc ggctgaccgg gtgcagcggg tcggtgacgg cgatcggctc gccgtggttg 1260 accgagaccg tcacgtcccg gctggccggc acctgcaccg cgaacggcat gccggccgcg 1320 acctccacct cggacgggct caggccgacc tgggcgccgg cccggttgaa gaccagcagc 1380 cgcttgtcct tggggtagtc gagcaggtcg aacatctccg cggtgagccg gaccgacttg 1440 agcgccggaa gatccggggt gacgatcggg atgaaccagt cggacatgtc cagcgcggcc 1500 agcacctggt cggtgaccac ggacggggtg tccaccacga tgaagtcgta gagcgggcgg 1560 gccacgtcca gcagctcgac gacgaactcc cggcggacct gctcgccctc ggccgggctg 1620 gccggcgcca ggagggcgtc gagactttgc cggtacgtcg tgacgatcga ccgcagcccg 1680 ggctcgtcca gccgaccggc catctgcagg cccccggcga tgttgcgttc cggggacagc 1740 ttcatcatga tcgccacgtc gccgaactgc aggtccaggt ccatcagcag cacccggcgt 1800 ccggcaccgg ccagcgcgac ggccaggttc accgccacca cgctgcgccc gcagccgccc 1860 ttgccggcga agaccgtgac cacactggcg tacggggcgt tgtcgccggt cccgcgcatg 1920 gtggtgctca gcgccttgga caggtcgacc gaccggaccg tcgcgctgcg gatgccctcc 1980 tcgtcctcct cggcgaccag gtcccggatg ccggactgca ggcagcgcag caccacgccg 2040 gcctcgatcg cgtggcggat cagcaccacc ccgatcaccg ggcgctgcaa ccgctggtac 2100 gccgtgaaca tcagcgcctc gtccaggtcc acgaccgcgc cgatcaccac gagcagcgtc 2160 tccgggtagc gggggagata cgactccagc tcgctcatgc tcttgagcat cgtgccgccg 2220 atcgcccgga agtcgttgcc ccagtgcgtg cggcgctcgt cgtcgggctc gacgtacaca 2280 tagaggctca tcgcacgacc cagctcgtgt cgatcgccgg gccggtgctc gcggtggcgt 2340 tcgggccgag cagcgccagg tagagcgatc cgctctgggc ggcgtgcacg agtcgcaggg 2400 cgtcggtgtc gccgacggcc agggtcacga cgtaccgctg gatctccttg accgcggcgg 2460 tgctgtcgcc ggccgaggcg gacggaccgg gggtgggcga gggcgacggc gtcacggggg 2520 cctgacccgg ttccgcctcc ccgatggtga tcacccgtgc cttcggcagc aggagctcgg 2580 tcatcgggat ggtctcgtgg tcctccgcca tcaggacctt cgcctggtac gtgtaataga 2640 ccgcgacctg gtcgccgggc gtgatgttgc cggctacctg cggggcgacg ttgagcgcca 2700 ccgagaccgc gagcgaccta cggggcaccg ggatccgccc ggtgtgcgac ggcgccggtg 2760 acgccgggac gaacagcgtc cgcatgagga gctgccgggg ctgcaggtcc ccgccgagcc 2820 ggagcgggtc gagcgcgctg tcccaggtgg tcagcgcccc ggcgggcacg gtgacggtgg 2880 ggaccaggag ccgctcggtc aggccccggg cgcggatctc ggcgccgctg gtcccggacg 2940 ggatgtgctg cccggcgacc aggatccagg tgccctcccg gccgctgagc gcgcgccggt 3000 cggccgaccg ggcgtaggac aggacggccg ccccgctgat cccggccagc accagcgcgg 3060 ccagcaggat caggatgcgg cggcgcatga cttcaccttc tcaggcaccg gtcatcccgt 3120 acggccgatc accatcgcgc cgtaataccg cgaggtggcg aaccgcgtcg gtacgtggtc 3180 cgtgaccagc gctctggtga agtagccgta gaggcaggac tgcgccgcgc acagcgctct 3240 ctgcgccccc ggcacgagcg aggggaccgc ggatccgggt gacaccgggc cgctgaccgg 3300 gctctcgtag ccggtgagga cgagcggcgc gaagccggcg atccggtagt acgacggcag 3360 cgtgccgatc accgccacct gcctgtcgaa gatcggcacc agcaccggct gccccgaggt 3420 gatcaggacg ttcagccggt cgaggcaggc cgtggcggcg gaggcgttgc cggggccgat 3480 ggtgaatccg ccgacccagc tgtccgccgg cccgtcggtc gccgggatgc cggtcagctc 3540 gcaggaggcg tccggtgcgc tgaccggcag caggcccggc agcgccggcg ggccgtccgg 3600 ctgcccgagc cacgtgtaac cggcgacggt ctcgccggcg tcggccgggc aggacgtggc 3660 gaggatgccg tcgctgatcg ggatgtagcc ggccgtcggg tcggagaggc cgagcagcgg 3720 gtggacgccg gtctgcgggt tcgggccggt gggcggcggc ggggcgaaga acctcgtgta 3780 gtcgccggtc agccgcagga agtcgcaccg ggagacgccg agcgcgagga cgtcggtgac 3840 cgccggagct ccccaggcga cccggccgca ggcgcccatc ttcgccccgt ggtacgccga 3900 cccggccaga ccgcgcccga acagcggcgg caccaccgag gtgttgtcgc tgttgcgggt 3960 ggacgtccgg acctcgacgt accggtacgg cccggaggcg ctcggcggcg cggggcacgt 4020 gaccggggtg ttccaggagc tcgggcagcc ggcgtcggcg gtggtgacgc cggcggcgga 4080 gacggtggtg atgcagaact ggacgtccga gacgaggtcc ttggcgttcc ggtcggcgta 4140 ccgctgcgcg ttgtcccgct gcgcggcgac ggtgcaggtg gcggacgtca ggtcccggcc 4200 ggccgtgccg gcgcaggcct gcgcgacctt ccacgacgcc gcgtcggccc cgctctgcaa 4260 ctgctcccgc tcggcgtaga gcgcgccgat gtcgatcacc agcgccgcca tcccgagcag 4320 gacgccggcg ccggccagga cggcgaccag cgcggtgatc acgccgtgct cgccgcgggg 4380 cgggaacagg gcgtggatca gccgacgcat gacatcacgc cggtcgcgct catcgtgatc 4440 gtgcccatgg tctgcccgcc gaccagcctg accagcgcca ccatcggcgt gatcggctgg 4500 taccggcggg tcagcacgac ctcggcgtcg gcgccggcga gcgaggtggc cgaacaggtc 4560 gtgacggtct gggtcaccga cggcgccccg gtggcgccga cgatgccgtt gaccttggcg 4620 tgcaccgccg cggccgtgcc gttcagggcg ccgagccggg cgccctcccg ggccgcctcg 4680 gtgagctgga tgtactgctg gagcagccgg cccatgtcga tgatcccgaa caggatcagc 4740 agcagcaccg gcatcacgat ggcggtctcc agcgccgcgg cgccccggtc ccggttatcg 4800 tgcggagctc tccgctccct gggcgagaac cgtacgcaac atcccggcca gccggtccgc 4860 cgtatacggc ttcgccacga atggcgaccc ggcacggatc agccctttct tgatggcgat 4920 ctcctccggg accccggaga cgtagacgat cttcatgccc ggccggacct cggaggccga 4980 gcgggccagc tccccgccgg agactcccgg caggcccagg tcggtgagca gcacgtcgat 5040 cgctccgctg tgcacccggc acgtcatgat ggcgctgacc gggtctttcg ccacgaggac 5100 gacgaacccg cgcatctcca gcatctgtgc ggcgagctca cgcaggtcct cgtcgtcctc 5160 caccaggaga acgaccggcc cctgccgctc ggttgctttc cacatcattc ctctcccggt 5220 gcacgaggaa tccggcgacg actcttcccg tcgctgcctc tgctcacgct atccaccggc 5280 ctgcctggcc cggtggcatt cgcggaaatg tcgatgccct caaatcagca tttgtccggc 5340 ggcactgtcc gtgttaacgc tcactacgtt gcgctgacgt cacgtttcgt cccggtaaca 5400 gttcggggtc ttgacagatc acgagcgtcg atgggtgaat gtgttcaatc ctgatcggac 5460 gagtgcagga taaacaacgt ttgcgtgtga agccgtttgg ctttgagggg gctccatgtt 5520 caattacgtc agtttcgtgc gccctaaaac ctttgccgcc accttcgcgg cagccgccct 5580 gctgctcggc tcgggcgcct gcgcgaagag cgaggactcc ggggacaccg tggcggcggg 5640 tcccgccccg tcggcggcgc aggtggtcca gtccgcctcg gccggctccg cgacctgtgc 5700 cttggatcag tacggcgcgt ccaagctcga cctgaagacc gcctccgtcg gcttctccca 5760 gtcggagaag gaggcgaacc cgttccggat cgccgagacg aagtccatca aggacgaggc 5820 cgcgaagctg ggcatcacca acctcaagac ctcgaacgcg aactcacaat tcaacaagca 5880 gatcgccgac gtcgagcaga tgatcgatgc gggcgtgcag ctgctggtga tcgcgccgct 5940 caactcggac ggctgggact cggtgttcgc caaggcgacg gcgaagcaca tcccgatcat 6000 cacgatcgac cggaagatca acgcgaccgc ctgcaaggac tacctgacct tcatcggctc 6060 cgacttcgcc gagcagggca agcgggccgc cgacgcgctg gccaagtcgc tgggcaacaa 6120 gggcgaggtg gcgatcctgc tgggcgctcc cggcaacaac gtcaccacgc tgcggaccag 6180 cggcttcaag gacgagatcg ccaaggtcgc gccggacatc aagatcacgt tcgagcagac 6240 cggcaacttc tcccgggagg acgggcagaa ggtcgccgag cagctgctgc agtccaagcc 6300 gaacatcaac ggcatctacg gcgagaacga cgagatggcg ctcggcgcga tcaccgcgct 6360 caagggcgcc ggcaagaagg ccggcgacgt caagatcgtc tcgatcgacg gcaccaaggg 6420 cgcggtgcag ggcatcgtgg acggctgggt ctccgcggtg atcgagtcca acccgcgctt 6480 cgggccgctg gccttcgaca ccgcgacgaa gttcttcggc ggcgagccgg tcggccagga 6540 catcgtcatc caggaccgtg cctacgacga gtcgaacgcc aagaccgaca tcggcagcgc 6600 gtactagaga gcgctcccaa tcgggtgtcc ggggatgaac cgggcacccg ccggcacgga 6660 ggagggcggc tcatgctgct ggaagtctcc ggcgtctcca agaccttccc cggcgtacgc 6720 gccctggacg gggtgtcctt caccctgaac ccgggcgagg tgcacgcgct ggtgggggag 6780 aacggcgccg gcaagtcgac gttgatcaaa gtgctcaccg gggtctacca gccggacagt 6840 ggcgagctgc gctaccgcgg cgagccggcc cggttcgcca ccccgctgga cgcccagcgg 6900 gccggtatct cgaccatcta tcaggaggtc aacctcgtcc cgctgatgag cgtggcgcac 6960 aacctgttcc tcggccggga gccgcgcaac cggttcgggc tgctggacga ggcccggatg 7020 gtcgccgagg ccaccgagat cctggccggt tacggcgtac gcaccgatgt ccgccgccgc 7080 ctcggcaccc tggccctggg cgcgcagcag atggtcgcgc tcgcccgggc cgtcatggtc 7140 gacgcccggg tcgtggtgat ggacgagccc acctcgtcgc tggagccgcg cgaggtggag 7200 accctgttcg gggtgatccg cgagctgcac accgcgggca tcggcatcgt ctacgtctcg 7260 caccggctgg acgagctcta ccgggtgtgc gacgcggtca cgatcctgcg cgacggcaag 7320 ctcgtgcaca ccggccggat ggccgatctc gaccggcgca cgctggtctc gctgatgctc 7380 ggccgcgagt tcggggcgga cttcaccagc ttctccgagt caccgcagag caccccggag 7440 ggcgagccgg tcctgcgggt gtccggcctg accagccgcc cccggctcga cgacatcagc 7500 ttcgacgtgc gccccggcga ggtggtcggc ctgggcggcc tgctcggcgc cggccgcagc 7560 gagacgatca aggcgatcgg cggggcgtac ccgatcgact ccggcgtgat cgaggtcggc 7620 ggcgtccggc tcggcaggcc cagcacggta cgggcggtcc gcgcgggcgt ggccacccag 7680 ccggaggacc gcaaggccga ggggatcgtc cccggcctgt cgatccggga caacatcgcg 7740 ctcgcgatcc tgccgcggat ggcccgtttc ggactggtca gcgacaagcg gatcgacagc 7800 atcgtcgcca cgtacatgag ccggctgcgg atcaaggcgt ccggtccgga ccaggcggtc 7860 ggcgatctct ccggtggcaa ccagcagaag gtgctgctcg cgcggctgct cgccaccggc 7920 ccgaaggtgc tgctgctcga cgagccgacc cggggcatcg atgtcggcgc caaggccgag 7980 gtgcaggcgc tgatcgacga gctggcgaag gaggggctcg gtgtcgtgct ggtctcctcg 8040 gacgccgagg aactggtcga gggcgcggac cgggtggtgg tgctgcgcga cggcgcggtc 8100 gtcggcaccc tcaccggcga ccgggtgacc accgaggccc tgatggccac gatcgcggag 8160 gccgcggatg agcactgaga ccctgacccg cccgcggatg acgttcaacc cggcgtgggc 8220 ggcacgctac ggcgtctacg cggcgatcgt tctgctgatc gtcgtcaaca tcgccttcac 8280 gccgtacttc ctgaccctga gcaatctgcg gatccagctg atccaggcgg cgccggtggt 8340 gatcgtcgcg ctcggcatgg ccctggtcat cggcaccgag gggatcgacc tctcggtggg 8400 ttcggtcatg gcgctcgccg cggccttcat acccctctat ctggggtacg gcgtgacagc 8460 cgcgatcctc gtctcgctcc tcgcgggtgt ggcggtcggg ctgatcaacg gtgtcctggt 8520 cgcgaaggcc ggcctgcagc cgatcgtggc gacgctggcc ctgttcgtcg gcggtcgcgg 8580 gctggccgtg gtgatctccg gtggacagct caaggacgtg cgcaacgccg acctgctcta 8640 cctgggctcc ggtgacctgc tcggcgtgcc ggtcctggtc tggatcgcgg cgctgctggt 8700 gctcgtggtg gcgttcgtgg tccggcgtac cgtcttcggc cggcgcctgc tggccgtcgg 8760 cggcaaccgg cccgccgccg agctcgccgg cctcccggtc aagcgggtgc tgatcggcgt 8820 ctacgtcttc tgcgcggtgc tcgcctcgat cgccggcctg ctctcggtcg cgcgcatcca 8880 gtccagcgac gcgtccgcgg tcggcctgct gatcgagctc tccgcgatca ccgcggtggt 8940 cgtcggcggc accccgctca ccggcggccg ggtccgggtg ctcggcaccg tggccggggc 9000 cctgctcatg caactggtgg tcgccaccat gatcaaacac gatctcccgc cgtccaccac 9060 cgagatggtg caggccgtga tcatcctggt cgcggtctac gtggcccggg agaggaggac 9120 ccggtgacca tgtcgatccc cgtgcccgct ttccggaacg gcggcttcgt gcagcgccag 9180 ggcgcgctcg cggtgctggt caccgtggtg gcgatcagcc tggccgcgtt ccccggcttc 9240 cgcagcgcgg acaacgccgg cacgatcctg gtcgccgcgg cgccaccgat gctgatcgcg 9300 ctcggcatga ccttcgtgat catcacgggc gggatcgacc tctcggtcgg ctcgctctac 9360 gtgctcggcg gggtggtcgc cgcctgggcg tcgcagtggg gagtcgtcgc ggcgctggcc 9420 gcgccgttgc tcctgtgcgg ggccatcggc gtactgaacg ggatcctgat ctcgagaacc 9480 gggatggcgc ccttcatcgt caccctcgcc gcgctgctcg gcgcccgtgg cctcatgcgc 9540 agcatcagcg atgagggctc gacgacgtac ctggtcagga gcgacgtctt ccacgagctg 9600 ggcacgggat ccctgctcgg cgtcggtctg ccggtctggc tggccgcggt tctggtcggc 9660 gccgggatcc tggtgctgaa ccggacccgg ttcgggcacg ccgtgcacgc catcggcggg 9720 agcgaggacg ccgccgcgct gatggggctg cccgtacggc gaataaaggt ctgggtctat 9780 ctcctctccg ggctgctcgc gggactcgcc ggtgcgatca acgcggccaa gctcggctcc 9840 ggggtcaccg tgctcggcag tggcatggag ctcgacgcca tcgccgccgt cgtgatcggt 9900 ggcacgctgc tcaccggcgg ctccgggtcg atcgccggca cggtcgcggg ggtgctgctg 9960 ctcggcgtga tccagaacct gatcaaccag gtcggcaacg tcaacagcaa ctggcagcag 10020 gtgatcagcg gtgggttcct cgccgctgtg gtcgtggcgc agacaactct cgtacgcgca 10080 agaagatctt gacgtggagg cccgcccggg gaccctgccg cgggcgggca ggcgtaggtt 10140 gcccgcatga cggagcatcg ggtctccccg gccgggcggg cgctcgcgtg gctgatgctg 10200 gtctccgggt tcgccgcggt cgtcgggtcg ttcctgccgt gggcctgggt cgacttcccg 10260 gagcagggca gcagccaggt gtccgggagc ctcgtgtccg acctgttcac cgcgttcttc 10320 ggggtcgtgc tcgccgggta cgcggtgccc gccgtgcgcg gcgagcgcct gcccggcctc 10380 gagacgttct tctcggtcgg cgccgggctg gtgctgttca cgctcggggc ctgggacagc 10440 cggcacctga cctcgatgac cgccgccctg gtcgcggccg acaccggcac gaccatcggg 10500 cccggtctct ggctgtgcat gatcggcggc ctgctgggcg cgctcgcggc ggcggccctc 10560 gccgtccggg gacgccggcc ggtcgtcagc tcccgggtgt gaccacccag tccgggtggt 10620 tcggcatcgg aggggtcgtg acgccgagga gccaggaggt caggaacggc cgcagatcct 10680 ggcgggcgac ccgcgaggcg agcgtgatga agtcaccggt cgaggcggag cggccgcggt 10740 acgtcgtcag ccaggcgcgt tcgacccgct ggaacgtcgc cgcgccgatc ttctgccgga 10800 gcgcgtagag gaccagcgcg ccgccggcgt agacgttcgg gttgaagacg tcccacgtgg 10860 tcgccgcgtc gagcggggcg gcgaccggac cgtacctggc gcggaagatg tcgccggcgg 10920 cgtagacggc cttgaagaac gcctcgcggt cggccaggcc ggtgtactgc gggaacccgc 10980 cggtctcctc cgaccagagc atctcgtacc aggtggcgtg gccctcgttg agccagacgt 11040 cgctccacga gaacggcgag acgctgtcgc cgaaccactg gtgggccagc tcgtgggtca 11100 tcgacgggcc gcgggtggtc tcggggccgg tgaacagggc ggcgccgtac agcgaaaggg 11160 tctgggtctc cagggcgtag cccaggtcgt cgtcgatcac cagggagccg tagtcctcga 11220 acggataggg cccggcctgc ttctccatcc aggcgagctg ctcgcgttcc ccggcgatcg 11280 cgggcagcag cgtgccggcg aggcgtcgcg gcaccacgtc gcggatcggg gtgccgccgg 11340 ccgccgggcg gcgctcgacc acgaagtcgc cgacggccgt ctgcaccagc tcggtggcca 11400 tcggggcgga ctcgcggtag accgagctga cgtggccgtc gtgctcggtc gtgctcacca 11460 gcgtgccgtt ggccgtcccg gtccagccgg ccggcacggt gagcgtgatc gtgaaggtcg 11520 ccttgtcccg tggatggtcg ttgccgggga acagcaggtg cgccgagccg ggctgggcag 11580 cgagcaccgt cccgtccggc gtcgccacga gagcggccgg ggcggcggtg aagttcgcga 11640 ccgtgacccg gaacagccgc ccccggggaa gggggcgccg cgggatgacg gtcagctcgt 11700 cgccgtcccg ggcggcccgc gcgggctgcc cgtcgaccga gacgcgcccg atcgaggcgc 11760 cgccgaagtc gaggtcgaag cgggacaggc tctgcccggc gacggcggtg atcgtcacat 11820 cgccggatac gacctgcttc gggtccttct ccgggtagcg caggcggagg tcgtagtcga 11880 gcacgtcgta gccgccgttg ccgagcagcg ggtagaggcg gtcgccgagg ccggcggacc 11940 cgggtgacgg cgagggcccg gcctgcgccg gtgcggcggc tgcggccagg gcgaggacga 12000 cggtggcgcc gacggtgagg acgcgggtgc ccgcggacgt tcgcatggct tccgacgcta 12060 ggcgacacca ccggaagcca tcgacccatg ggcatgtatg aaatcccaca atctccgatg 12120 tggacggacg gatggtgcgc agtatgcaac ttgcagattt cgggacattc cctagcccgg 12180 cggttgccgt gtgcacccgt tcgaccactg tccggaaccg cgtggtgagc agggtgaacg 12240 ttcatgcggc ccgggccgcc ggaggtcccg tgaccgttcg cattgccgtg cgccggtgaa 12300 tcactccgct ttacgacttc gcgacaagtg gttaatgtcg gcgaagcgat atatcgtcca 12360 gttattcggg ggactgcggt gcatgagcaa aaaatcactc cggcgattgc cagcggatca 12420 ccgcaaattg aattgctgcc cgtcaattcc ctgcgagtga tggattcgcc gcgactgaac 12480 ggtgaggacc cgcggcacac cgaggtgctc gccggcttcg gggcggagct cccgccgatc 12540 gtcgtgcacc gggcgaccat gcgggtcatc gacggcgcgc accggctgag cgcggcccgg 12600 ctgcgcggcg acgaccggat cagggcggtg ctgttcgacg gcaccgagca ggaggcctac 12660 gtgctgagcg tcaaggccaa cgtgacgcac gggctgccgc tgtccgccgc cgagcgcacc 12720 cgtgcggcgg agcgcatcat cacgatgcat cctgactggt cggaccggat gatcgcggcg 12780 tccagcgggc tgggcgcgcg gaccgtcggc ggcctccgcc ggcggcgcgc ggcctccggc 12840 gagagcccgg cgggcctccg ctcgcgcgcc ggccgggaca gccgcgtccg gccggccggc 12900 agcaccgcgg gccggctgaa agcggtcgac tacctccagg accggccgga cgcctcactg 12960 cgggagatcg cccggcacgc cggcgtctct ccgtcgaccg cccgtgacgt ccgggaccgg 13020 ctgcaccgcg gcgaggaccc gatccccgcc acgcaacgcg cggcggcacg ccccggaaac 13080 gattccccgc cgctgcggtc gctggtccag ggcttggcga gcgacccgtc gttgcgattc 13140 agcgagtccg ggcgcgatct gctgcgctgg ttgattgccc acgccgttca ggacggcgaa 13200 tggaaagggc tggtcgacac tattccggcg cattccgcgc aggcgctggc gaaaatcgcg 13260 cgccattgtt cgcgggaatg gcgtgagttc gcggacatcc tggagaagga cgccgcgtag 13320 gccaccggca tttcttccgg cacccggtcc gccctccgtc acgcacaggt cagagtactg 13380 atggcggctg tcaacccgcc gatctgcggg taggtgccga cgtccttccg ccgaccgtct 13440 gccgaacgca tccggtcggt gcccgatgtg cgggtaggca ttcaccgatc agggttgctc 13500 caatgtctct cgtcgatacc gcggctgata cctccgcggt actcggcaga acactccgtg 13560 gctatggcgc cgtggtcccg gagcctttcc tgaagtactt cggacgtacc tgtccggagt 13620 cccccacaga aggagacatc atgtcggcca tcaccgtgga aaccacctgg aagaacaccg 13680 acctccggga ggacctcacc gctcacccgg ccggcctcgg cttcggcgag ctgagcttcg 13740 aggacctgcg tgaggaccgc accatctacg cggccagcag cggctgggtc tgcaccctga 13800 ccatcgagtg cggcacgctc gtctgcgcct gctgaccaac ggtcatcgca ctgccgggac 13860 cggggctgac cccggtcccg gcaccctctc cccggcagga gcctgcatgt catcctttgc 13920 gatcgccgct tcgccggcca gcgcgtacct gcacgagcgc tccgccggcc ccggcggcga 13980 ccccgtggcg gagcacgagc gggtcgagtc gtggcgcgag tccgcgttcc tggacgaccc 14040 ggtcctggac atccgcctgc gcgagctcgg actcagccgg gccgagttcg gccggctgct 14100 gaccgacggc gcgtacgacg ccgggagcac ggccctcgac tgggccggcg agctggccgc 14160 cgtgctggcg accgggaccg gcgcggtcac cggactcgcc cggtcgacca agctgtgggc 14220 gcagggcttc gaccggctgc cgttcgccgg gctgatcgag aggttcctcg cgtactacga 14280 gccgcgggtg ccgcgcaccg ccgggaccgt ccgggtgtcc ctgctggaga gcctcgcgaa 14340 ccgcctgctc acggtcgcga cccggaccct gctgctggaa ctgaacgtgg cccgggtgca 14400 cggccgcctg accggcgcca cccccgggga acgctacgac cactacgacc gggtcctgct 14460 gaccgacccg gactacctgc gctcgctctt cggcgagtac ccggtgctcg gccgggccat 14520 ggtcgagtgc ggccgccgct gggcgtcggc gatggccgag ctgttccagc gcctggacgc 14580 cgaccgtccc gccctgcacg ccgccgggct gctgccggcc ggcgcgggcg aggtcaccgc 14640 gctccggccc gacctcggag acccgcacaa cagcggccgc gcggtcgcga tcctgacctt 14700 ccggtccggt gcccagctgg tgtacaagcc ccggccggtc gggccggagc gcgcgtacgc 14760 cgagaccgcc gcggccctga accggcacgg cctgagcctg ccgctgaccg ccgtggacgt 14820 gctcgaccgc ggcgcctacg gctggtgcga gctggtccgg cacgagccgt gcgccgaccg 14880 cgccgacctg gaccgcttct accggcgtac cggcgcggtc ctggccacca ctctgctgct 14940 cggcgccgtc gacgtgcaca tggagaacgt catcgcggcc ggctcgtcct gcatgcccat 15000 cgacctggag acgctgctgc agcccggggt cccgtccggt gacgcgacgg acgcctacac 15060 ccgggcgctc gacctgctca accagagcgt gctggcgatc gggatcctgc ccgcccgggc 15120 gttcggcggc cgggagcgca agagcgtcga cgtcagcgcg atcggcggcg gcgaggcaca 15180 gaccgcgccc cggccggtgc cgatggtcgt ggagccgttc accgacgtgg cccggatcga 15240 ggcggtggaa gcgaccatgc tgggcgcgca gaaccggccg gtgctggtcg gcgccgaggt 15300 gcggcccgag gagcacaccg aggcggtggt ggccggcttc accgaggcgt acgacctgat 15360 cgtccggcac cgcgaggact tcgccgacct gctggccggc ttcggtgacg tcgaggtgcg 15420 ctacctgccc cgcccgaccc gccggtacag catgttcctg accgagagct accacccgga 15480 ctacctgcgc gacgcgcgtg accgcgaccg gctgctcgac aagctgtgga ccgccgcggg 15540 cgcccgtccc gacctgatcc ccatcatcga gtcggagaag cgccagctgc tggccggcga 15600 catcccgtgc ttccgcgcgc tggccggcga ccgggcgatc cgcaccgcgt ccgccccggt 15660 ggcgccggac ttcttcgacg cccccggcat cgaggtgctg gccggccgcc tgcggcagtt 15720 cgggccggtg caccgggctg cccagctgcg gatcatccgc gagtcgatgg gaaccatgcc 15780 cgcgcccggc ccgatcgccg ggacacccgc gccatcctcc gagcggcgtg gcggcctcga 15840 cccccgtgag gccgccacgc tcggggaccg gctcgtgcgg gagctcgcgg acgaggcgat 15900 cctcggggcc gacgacgccg gctggatcgg agtcagcatc gagggcctcg accaggagac 15960 gttcagctac aagccgatgg cgaccgggct gtacgacggc atcgcgggaa tggcgctgac 16020 gtacgcgtac gccgcccgca cgctcggcga cgagcgctac ctcgacctga cccgccgtac 16080 cgtcaagctg gtctccggct atctgcggta cctcgccgag caccggatcg tggagacggt 16140 cggggcgtac agcgggatgg ccggcctgct ctacacgctg gatcacgtcg cccatgccac 16200 cggcgacgcg tcgctgctgg gcgagatcga ggccgcgctg ccctggctgc gggagtgcgc 16260 tacccgcgag gagtgcccgg acctgatcgc cggcctggcc ggttgcgccg tcgtcgcgct 16320 gtcgctgtac cggcggcacg gcatcgccgg ttaccgcgag gtcgcggaga tctgcggccg 16380 gcgactggcc ggcaccgcgg tcgacgtcga gggcgccgcg ggctgggccg cgacccggac 16440 cggcgtgatc ctcggcggtt tctcgcacgg ctcggccggg atcgcctggg ccctgcacga 16500 gctcgccgcc gagttcggtg accgggacct gcgcgagctg gccgaccggg cggtcgagtt 16560 cgaccggcgg ctgtacgttc cggccgccgg cgcctggcgc gacctgcggc ccgagatggc 16620 cggcaccgac ggttacccgg cgctctggtg tcacggcgcc gccggcatcg gcctgtcccg 16680 gctgctgatc caccggatcc ggccggacga gcggctcgcc gaggaggccc gcgccgcggt 16740 ggcgctggtc cggcggcacg gcttcggcca caatcacagc ctctgccacg gcgacttcgg 16800 cgcgctggcc ctgctcggcc tggccgaccg cgcgtggccc gggtcgggcg gccacgacga 16860 gcgtgccggc gcggtcgtgc gggacatcgg cgagaccggt ctgcgctgcg ggctgggcaa 16920 cggcatccgg atgccgggtc tgatgctcgg cgccgcgggc gccggactga gcctgctccg 16980 gctggccgcg cccgccgacg tgcccgcggt cacctggctg gaaccgccgc ggggcacgca 17040 tgtctgagac ggccgggctg ctgcggcgga gcctgctcga tcaccggggc aagctcgccg 17100 ccgtggccgg tctcgccgtc gccggggtcg gctgccagct gggccagccg ttcctcatcc 17160 ggcgcgtgct cacggcggtg cagtccgcac agccgtaccg ccaattggct ctcgccgttc 17220 tggcggtcat ggtcgtcggc gcggcgctgg gcgccgtcca gcagttcctg ctgcagcgca 17280 ccggggaggc gatggtcttc acggtgcgcc gcacgctcgt cgcgcacctg ctgcggctgc 17340 cggtcgcggc ctacgacgag cggcagtccg gcgatctggt gtcccgggtc ggcgccgaca 17400 ccgcccaggt gcgctcggtg atcacgtccg gggtggtcga cctggccggg ggcgtcctgc 17460 tcgtcggcgg ctcgatcgcc ggcatgatca tcattgatcc ggtcctgctc ggcgtcagcc 17520 tggcgccggt gctgtgcggc gccgccgggg tccggctggt cggccgtcgg ctgcgcccgc 17580 tcagctcggc ggtccaggag tcgatcggcg cgctcaccgc ctcgaccacc cgggccctcg 17640 gcgcgatccg cacgatccgg gtcgccggcg ccaccgagcg cgagaccgcc ctgatcgtcg 17700 ccgaggccga ccgcgcccgg gcggcgggcg tccggctcgc cctggtcgcg gcccaggccg 17760 gcccgatcgt ccggctcgcc ctgcagggcg cgttcgtcgc ggtgatcggc ttcggcggct 17820 accgggtcgc gaacggcgcg gtgtcggtcg gcgacctggt cgcgttcacg ctgctgctgt 17880 tcacgctggc gctgcccctg gcccagctcg ccgaggcggc cacccggatc cagaccgggc 17940 tgggcgcgct gacccggatc gaggagatcc tggccctgcc ggacgaggac agcgcgctcg 18000 gcgtccgtgc gaggacgccc gccacggtcc ggcacgatcc ggtgctgctg gagttcgatc 18060 acgtgtcgtt ccgctatccc accggcgggg agatcctgcg cgacgtcagc ttccgggtgc 18120 cggccggcag caccaccgcg ctcgtcgggc cgtccggggc cggcaagtcg acgatcctgg 18180 cactgatcgc ccggctctac gaggtccacg gtggccggat cctgctgcac ggccgcgaca 18240 tccgcgacta cccgctcgcc gagctgcggg ccgccctcgg ctacgtcgag caggaggccc 18300 cggtgctggc cggcaccgtc cgggacaacc tgacactggc cgcgccggac gtcgcggaac 18360 acgcgatccg ccacgtcacc gcatcggtca acctcgacga cctgctcgcc cgtgacccgg 18420 ccggcctgga cgcgccggtc ggggacggcg gcgtgctgtt ctccggcggt gaacggcaac 18480 ggctcgccgt cgcccggacc ctgctcgccc cgggcgaact gctgctcttc gacgagccga 18540 ccgcccacct ggacgcccgc aacgagcagg cgctgcagca cggcctgacc gcgcacgccg 18600 ccggccggac gctggtggtg gtcgcgcacc gcctggcgac cgtcgcgcac gccgaccaga 18660 tcctggtgat cgacgacggt cgttcggtcg ccgccgggcg gcacgaggag ctgctcgtcc 18720 gcgacccgac ctaccgcgag ttcgccaccc gtcaactgct gacctgaatc ccgaggtgta 18780 cgccatgctc agtgtcctgg accaggtgcc cgtgttccgt ggcgacgacc ccgccgaggc 18840 ggtccgcgag gccgtcgggc tcgcccgggc cgccgagtcg ctcggctatc accggttctg 18900 gatcgccgag catcacggca gcgccgccaa cgcgtgcgcg gcgccggaga tcgtggcggc 18960 ggccgtcgcc ggagccaccg aacggatccg ggtgggcacc gggggagtgc tgctgccgta 19020 ctacagcccg ctcaaggtgg cggaggcctt ccgggtgctg gcggcgctgt atccggggcg 19080 gatcgacctc gggttcgggc ggggcagggg cgggccggcg gtgatggccg agctgctcaa 19140 cccgtacgcg atcgcgaccg aggaggcgta cgccgagcag gtcggccggc ttctcgcgtt 19200 cctgggcgac gcgcggaccg tcagccgggt gtcggtcacg ccggcggtgc aggacccgcc 19260 gttgccgtgg ctgctcggct ccggcgtcgg cagcgcccgc ctcgccggga tgctcggcgt 19320 gccgttctgc ttcgcgcagt tcatcgcgac cgaggagtgc ccggaggcga tcgcggcgta 19380 ccaggagtcg ttccggagct cgccgtggct ggacgagccg caggcgatgc tggcgttgcg 19440 ggtgctcgcg gccggcaccg ccgaggacgc cgaggagctg gccaccggct tctggatgtc 19500 gtgcaccacc ggatggcggg cccaggtccg gccggacgac gactaccggg gtggcgtgcc 19560 gaacctggcg gacgcccagc ggtacacgct gaccgaggag gacctggcga tgcgcgcgag 19620 ccggccgtac ctgcagatct ccggcacggc ggagacggtc ggcgaggaga tccggcgact 19680 gcgcaaggtg tacgacgtgg ccgaggtcat gctcaccacg aactgtcccg gggcggccgc 19740 cccggcgccg gtcctacgag ctgctggccg ccgagctcgg gctgaccgcg ccggcgtgac 19800 ccgggtcagg ccagctcgtc ggtggtgagg ccggcggcgt acgccagcac ggcggcctgc 19860 acccggttgg ccacaccgag cttgcgcagg atgacgctga cgtactcctt gaccgtggag 19920 tcgctgatga acaggcgccc ggcgatctcc gcgttggtca gcccctgccc gatcaacccc 19980 agaacggcct gttcccggtc ggagagctgt ttgacctcgt cgaccgcgtt ctcggcggcc 20040 ggagtgcccc ggcaggccgc gcccagcatg atcgacgagg cctccggcgc cagcacggtc 20100 accccggacg ccagcgcgcg gaccgccgcg accagttgct ccggctgact gtccttgagc 20160 aggaagccgc aggcgccacc gcgcagcgac tccagcacgg tgctggacgc cgccagcgtg 20220 gccagcaccg ccagcgccgg cccggactcc aggtcgcgca gccgggtcag cagcggcacg 20280 ctctccggca gggtcgcgtg cgcgtccagc aggacgaccg cgggccggtg ctcgctgacc 20340 gcggcgagcg cgctgtcgcg gtcagcggcg acgacggaga agccacccat cgtctccagg 20400 atcatcttga tgccgatcga gaccagggcc tcctcggcca ccaccagtac gtccgccatg 20460 cctcccccgg gcaatgtagc cgtacgagat ttgatagtgc acaaaaacca tcgaattact 20520 gctctttcga atcatacatg tatttatgca aatttctggt caggaaacgg ggacgatccg 20580 agacgcccgg gccggcgtct cggatcgtcc ttcaccgcgc acggctatcg cacgagccct 20640 tccgcggggg cgatccgcgt ggctcgccga gccggcgcca ggctggccag cacaccggtg 20700 accgcggcgg ccaccagcac gagacccagc tgcggccacg ccagcatgat caccggttcg 20760 gcctgccggc ccacggccgc gatcacgccg accagcccga ccggcacccc gatgacgatg 20820 ccggccaccg tgccgaccag cgtgatcgtg accgcctcga cggcgaccat cgcgcgcagc 20880 cggctccggc gggtgccgag cgcccgcagc agggccatct cccgggttcg ttcgatcacc 20940 gagaggccga gcaggttggc gatgccgagc agcgcgatca ccacggtgac cgccagcatg 21000 cccagcgaca gtccgagcag gatggacagg acgttcatga tgtcgccgcc ctcggtgaca 21060 ccgccgccga cctccacacc ggcgtcgcgt gccgccaccg cgttgacgtc ggcggccagc 21120 gtctcccggt cgaagccgcc cggcgcggtg ccccagaccg tggtcggcac ggtccggacc 21180 ccggcggcgg tcaggacgtc accggtggtg acgccgagca gctgcccggt cgtgtcggcc 21240 agccgcgagc cccgggcggt gaaccgcagg tcccgcccgc cggccgtgac cgtgagcgga 21300 gcaccgtccg tcagcccgcg cgccgtcagg taggaggccg gcaccagcag caccgggtcc 21360 ccggtggacg cgctcagctc cggcgcgagg cgcccggcca cgtcggtggg gagcgccgcg 21420 atccgggccg gcgtgggttt gcccgcggcc gggaacgtcg ccgcgctcgt cgccacggtg 21480 gccgtggtca gcccggtgat cccggacagc gcccggaccg tgcggtcgtc gatcgccgcg 21540 ccgtcggtgt gcacgctgac cgccaccgga tagcgcgcct ccaggtcggc ctccaccgtg 21600 gcccgcccgc tcgccgaggc cacggccagg ccggtgatca gcgcggcccc gacgaccacg 21660 gccatcgtcg ccgacgccgt ccggcgcgcg ttctgccgga ggttgctgcc ggccaggctc 21720 gccgccaccc cgaaccgttc caggccgcgc gccgccggcg gcaacagcag ggcgatgccc 21780 agcggcagcg cggtcagcag cccggcggcg agcagcaccc cgccgaccag cgcgagcggc 21840 agggaggtgc cgatcgcggc gagacccagc acgcccacgg ccaggccgat caggatcagc 21900 ccggcgacca ggcggcgccc gccgcggacc tgtgcgggaa gagcgtccgg cacctcctgc 21960 agcgcgcgca ccgggggaac ccgggtcgca cggcgggccg gcgcccaggc cgcgacgacc 22020 gtggcgccca ccccggtgag cacacacagc gccagcacga tcgggttgac cgccaggccg 22080 ccgccgttga tgtcgagcag gccggccccg agatagccga gcccgacacc ggcgaccgcg 22140 ccgatcaccg cgccgatgct cccggcgatc gccgcctccg ccagcaccac ccggctcacc 22200 tggcggcggt gcccgccgac cagccgcagc aacgcgacct ggcggacccg ctgggagacg 22260 atcacctgga aggtgttcgc gatgaccagg atcgacgcga gcagcgccac cgcggcgaac 22320 gccagcatca gcacgaccag ctgggtgttg ccaccggcga accggccggc ggccgcgtcg 22380 gcggccgccg acgcgtcggt cgcggtcgcc cccggcggca gggcccggcc gaccgcgtcg 22440 acggtctcgg ccagccggtc ccggtccgtg acggtgagca gcgcggccgg cggcgtgtcc 22500 ccggcgaaga acgacgcggc ggcgtagaac cggtagtccg agccggtcag cgggcggaag 22560 ccgagatcgg ccgagccgac cacggtcacc ggcaccgggg cggccgtgcc ctgccggaag 22620 tcgaggtggg cgccgacccc gacgccgagg tcggtgaggg tccgccggtc ggcgacgacc 22680 tgcccggccg cgctcggcca ggtgccctcg tcgacggtga accagcgcac cgacgcggtc 22740 gccgggatgc tctgcacgtt ggccgagccg cgccggtcgc cgccgaagac gctgaccgtc 22800 cgtgcgtact gcgggtcgac gctccgcacg ccccgcaccc cggcggccgc ctggtaccac 22860 tgcgggtcgt gcaccgtgtc gtcggcgtcg agcacgatgt ccgccgtggt caacggggcc 22920 gcggcggtga gccgcagacc ctcgtccgag gtgctcgcga acgtggccgt ggcggccagg 22980 aagccggtgg ccagcacgac cgcggcgacg atcgcgagca gccggccggg gtgcgaccgg 23040 acctgcgacc aggccagcgt gaagatcatg acgtcaccgt caccgacgcc atgaccgaca 23100 tgatcgactc cagtgtgggc gctcggagct cgtcccagag ccgcccgtcg gccatgatca 23160 agacccgatc ggcgtacgtc gcggcggcag cgtcatgcgt caccatgatg atcgtctggc 23220 tggcctgccg ggcggcgttc tgcagcccgg cgagcagcgc ccggccggtg gcgatgtcca 23280 gcgcgccggt cggctcgtcg gcgaacacca ccgacggctc ggtgagcagc gcgcgtgcca 23340 ccgcgacccg ctgctgctgg ccaccggaca gctcggcggg ccgatggccg agccggtcgc 23400 cgatctgcag cgacgcggcg atgcgctgca gccggtcgcg gtccaccgga cggccggcca 23460 gccgcagcgg cagcacgatg ttctgctcgg cggtcagcgt gggcagcagg ttgaacgcct 23520 ggaagatgaa gccgacccgg tcccggcgca ggtcggtgag cgcgcggtcg tccagcccgg 23580 cgagcgcggt gccggccagg ctgacctcgc cctcggtcgg tgtgtccagc ccggcgagca 23640 ggtgcatcag cgtggtcttg ccggagccgg aggggcccat gatcgcggtg aactcgccgg 23700 ccgcgaagga ggtcgacacc ccgtcgacgg cgaccaccgc ggcgtccccg gttccgtacc 23760 gtttacgcag gttgcggcaa ctgaccatgg agctgctctt cgtctgcatc atcacggttg 23820 cgacgttagg gaagtggcgg gccgcccaca tccgtccggg gcatcgccgc gaccgatacc 23880 aaggtatcga cctggcgtgc ggatggtgcc gcgagcgctc gcggtcccta ctctgagagc 23940 gtgggaagct gggacaggag aacgctgacg gtcgatacgg tgatcgccgg cgccgcggtc 24000 atggtgtgcc tgctgctcgg gttggccggt ctggacgagt ggtactggtc ggccgcgctc 24060 tgcgtccccc tggtgatccg gcgctcggct ccggtggtct tcctcgcgct ggtcgcggtg 24120 ctctccggca tccacatgat ctactccggc agcttcgcgt tccccggtga cctggtcgat 24180 ctggtcgccg tgcacgccgt cgccggttac ggcccggccc gggtccggca cctgggcctg 24240 ctgctcggcg tggccggcag cctggtggtg accgcccggg cgctgcacga cgggctgccg 24300 tcgtccgcga cgctgcccgc cgcgctgatc gtcgccgcga ccctggccgc ctggtcgacc 24360 ggcctgatgc aacgccggca gcgggccgac gtgatcgagg ccgatcaccg ccgccggctc 24420 gccgagcagg acagcgcgat gcgtgcccgg ctcgcggcga tcgaggagcg cacccggatc 24480 agtcaggaga tgcacgacat catcgcccac tcgctggcct cggtgatcgc ccaggccgag 24540 ggcggccggg tcgccgcgcg cgccgacgcg gtcgtcgccg gcccgctgtt cgaccgcatc 24600 gcgcagatcg gccgggaggc cctcaacgac gtgaagcggc tgctgaactc gatcgacggc 24660 gacacgccgg acgacttcgc gcagggcctg cccgacctgc cgggcctgct ggccggggtc 24720 tccgccgccg gcctcgacgt gacgttcgag gtggccggcc cggagcagcc gctcgcgtcc 24780 ggcatggacc tggcggtgta ccgggtgatc caggagtcac tgaccaacgt gctcaaacac 24840 gccacgcagc ggcaggcccg gctcagcctg gtgtggacgc cggcgtggct cgaggtcagc 24900 gtgaccagcc cgctgacctt cgccggcgcg ctccgcgagg gtcgcgggct gtccggcatc 24960 cggcagcggt gctcgttgtt caacggcgac tgcgagatcg tggccgggca gaccttcagc 25020 gtgatcaccc gctggccgct cgcccgtccg gaggttgccg tcccatgacc gagccgcaga 25080 tcgacgtggt gatcgccgac gatcaggacc tcgtccggac gggcttcgcc ctggtcgtcg 25140 actcggcccc ggacatgcgg gtggtcgcga ccgcggcgga cggcgccgag gtggtgcggc 25200 tggccgcgga gttccgcccc gacgtggtgc tgatggacat ccggatgccc cgggtcgacg 25260 gcatcaccgc ggcccgggcg atcctggagg gcaacgctca gccgccgaag atcgtcgcgc 25320 tgaccaccta cgacaacgat gagtacgcca gccggatcct ggccgccggc gccagtgggt 25380 acctgttgaa ggacaccacc gccgagggcc tgaccgcggc gatccggacg gtgcaccgcg 25440 gcggctcggt gctggccccg tccaccaccc accgcctggt gaccgcgcac cgtcagcatc 25500 cggcacgccc gtccgcgctg ctggattcct tcaccacccg ggagcgcgag gtcttcgacc 25560 tgatcgtggc cggcgccagc aacgcggaga tcgccgaccg cctgaacctg gcggaggtca 25620 cgatcaagac ccacgtcggc cgggtgctgg ccaagatcgg cgtccgcgac cgggtgaacg 25680 tcgtgatctg ggcctaccgg aacggcgccg ggccgagctg agcaggggcc aggccgcgct 25740 cgcactcggc cgaatcccga aaagcggcta ggggaagcgg atctcggcgg ccagcggcag 25800 gtggtcactg ccggtccggg ggagggccgt cagccgcgtg accgtcatcg atcgcgccag 25860 cacctggtcg atccgggcga ccggcgtccg cgccggccag gtgaacgcga agtccgcggg 25920 cgaatcgatc atcacttgcc ggatcggccg cagcccgcgg tcgtccaccg acgtgttcag 25980 gtccccgatc acgaccagcc gcggaaccgg gtcggcggcg agcagcgcgc cgagcttccg 26040 ggcgctctcg tcccgccgtg ccgaggtgag tcccgccgcg gtgacccgca ccgacggcag 26100 atgcgcgacg tacaccgcgg tgtccccgcc cggcgtccgg gccaccgccc gcagcccccg 26160 gttccagtcc tcgcccaggt catgcggccg gatgtcgatc gcctccgcgc cggtcagcgg 26220 atagcgcgac cacagcgcca cggtcccctg cacggtgtgg aacggaagct ccgcgtcgag 26280 cacaccccgg taggcggcca ccgcctccgg cagcacctcc tccagcccga ccaggtccgg 26340 atgtgccgcg agcagcgccc gggcggtccc cgccgggtcc gggttctcgt cgctcacgtt 26400 gtgctgcacg acgatcagat ccggcgtgcc ggtgtcccgg tcgaccacgt agccgccgaa 26460 atggatcagc cacgcgccca gcggcagcag caccgcggcg aggccggtca gcgatcgccg 26520 catcagcgcc agcaggagca ggaccggcac ggccagcccg aaccacggca aaaacgcctc 26580 gatcaggctg cccgcgttgc cgaccgcgtt ggggaccaga cggtgaccga gaatgaccgc 26640 cccggccaga acagcggtcc acaagatcgg catcgggaga tgttatctta tttcgcatgc 26700 gaaataatga gacggtacgg atcccggtag cgaccggcgg cgccgtcacg gccacgctgt 26760 tcgcgcccga gtccgcgcgt gccgtgctgg tcgtgcaccc ggcgaccgcg actccgcagg 26820 gcttctacgc gtcgttcgcc acctacctgg cggagaacgg gatcgccacg gtcacctacg 26880 actaccgtgg caccggccgt tccggctccc cgcgcgacca ccgtgacctg ggcatgcgcg 26940 actggatcgg cgccgacgcc ccggccgtcg cggcgtgggc cgccgaccgc ttcccgggcc 27000 tgccccggct cgccgccggt cacagcctcg gcgggcacgt gatcgcgctc ggcgcggccg 27060 gcccggatct ggccgcctcg gtgatcgtcg cctcgcacat cgccgcgctg cgcaccatcc 27120 cgagccggct ggagcggttc cgcgtgcgaa tcatgcttca catcctgggt ccggccctcg 27180 ggcggctgct gggctacgtg ccggccagaa gtctgggcct cggcgaggac ctgccggccg 27240 ccgcgatgtt ggagtggggc ggctgggcgc gcagggacaa ctacttcttc gacgacccgt 27300 cgatgcgcgc cgccgagcgc gccgccaccc tgaccggccc ggtcctggcc gtcggcacca 27360 cggacgaccc gtggtccacg ccgcgccaga tggacgccct caccgtgcac ctgaccagcg 27420 catccgtgga gcggcgaacc tactcaccgg ccgccgccgg ggtcccggtg atcgggcacc 27480 acggcctgtt ccggcgcgcc gtgcgcgaca ccgtctggcc ggaactgctg gcctggttgc 27540 acgcccactc ggagaaggcg tcaagatgac cgcgtgcgcc tgcctcgcct gatcttcctg 27600 ctcttcaacg ccgaccgcgc ggtccggcgc tggatcgacg cccgttccgg tgacaccggg 27660 atcggcgcgt ccggcgccgg cgtgctgttc tacctcgccg gtcacgagaa cgccctcatc 27720 ggcgacgtga ccgcggccct gggtgcgtca ccatccggca tgagcggcct ggtgaaccgc 27780 ctggagcgtg gcggttgcct gacccgctcg caggacccgg ccgacgcccg cgcggtgcgg 27840 ctcgccctga ccccgcgcgg acaccaggtg gtgatccacg cccgcgggct ggtcgacgac 27900 ctgaacgagc agctcacggc cggtttcgac gacgccgaga tagcggtcgt ccaacgctgg 27960 ctggagcacg tgacccgggt gtccgtgcaa cgtgaggagc gactcggtta gcgtccggtg 28020 atcagctaaa cctccgggac gggccgccga agtgaggtgt cgcaaggcac caccgcttcc 28080 gatccgccct tgaggagacc catggctgac tccgtcgtct tcgaccagat ccccgtcgtc 28140 cgcgccatcg gccgaggcac cacctcgctg agcgccttcc acgacgcgct ggtgaccatg 28200 gagtgcggtt tctacaacct tgtccggctc tccagcgtca tcccgccggg caccgccgtc 28260 gaccccagcg gcaaggctcc ggtcccggtc ggggcgtggg gcgacaagct gtactgcgtc 28320 tacgccgagc agcacgccag ccagccgggc gaggaggcgt gggccggcat cggctgggtg 28380 cagcgccgcg acggccaggg cggcctgttc gtcgagcacg agggcaccag cgagtcgttc 28440 gtccgcgagg cgatcaaggc cagcctccgc gacctggtca agggccacga ggacgacttc 28500 gacggcccgg acttcgtcgt ccacggcgtg gtctccgacg gcgagccggt ctgcgcgatg 28560 gtgctcgccc cctacgagac cgccccgtgg cgcggcgtcc gtgccaccga cccgcccggc 28620 atgaactgac ctgtcaccac gagagcctcg cctcgcacgt cggggcgagg ctttcggcat 28680 tcgcttttca cttcgacaac cccctccgta ccgaagaaat cgaagatcaa attcttcatt 28740 gcctatctcc gctgtggtcc agatcgtcgc tcccgcgggg acccttccgg tctgagcagg 28800 gccgtaaccg gcccagaacg ctcagcccga aagggcgacc tccgtggcgg ggcacggtca 28860 gggcaaaatt ccgtcgccgg tcgccaggga ttcgccgccg gttgctgcgg gtggggtgcg 28920 gcggtccgcc ggaggtatgg gttgccgcta cgctcggcta gctttcgacc accggtaacg 28980 tgtaattccc cttcggtcca cctacgcccg ttgtgatctc cttatggtgg gctcgcttat 29040 cctcgtcctg tgcatctggg ccgcatcggc cgcgatgttc ttccggctgt cctctccggc 29100 ccggacgccg ggcacccgtg cctggcgttt cgccccgatc ctgaccgccg gtttcgcgat 29160 tccgctcgcc gccgcctacg gtcggcagga ctggtccacc ttcgggtcgc tgctggtcgc 29220 cggcctggcc gccttcgcgg tcctgctcta cctgctccgt cccgtccgcc tctgatccat 29280 actcggtcgt tgtgacgacc cggatgcccc gcctcgagat cgaatactgc acacagtgcc 29340 gctggctgct ccgcgccgcg tggctggcgc aggagctgct caccacattc ccccgcgatc 29400 tcggcgaggt tgccctggtc cccgggatcg gcggcgtctt cgaggtccgc ctcgacggcg 29460 agatcctctg gaaccgcaag ccggacggct tccccgacct cgcccagctc aagcgcctgg 29520 tccgcgaccg ggtcgccccg ggccgcgacc tcggccactc cgaccgcgcc gccaccgact 29580 cctagcccac acgtcctcct ccaccgctcc ggccgcggga cgcgtctacg cgtacaggat 29640 ccggtcgatc gtctcgcggg ggagcagcgt gcgggcccgc ccaccgcaga cggcgaccac 29700 cgccggccgc ccgacataga catcgcgccg ctggtggtac gccccggtac cggacagcgc 29760 caccagatca ccggccgcca tgtcacccgg cagctccgcc accgccaccg tcgcgtcccc 29820 gcagcgaacc gtgatcgacc ggcccggcgc cggcgacgcc cggccgatca gcgctgccgt 29880 gtgcaggccg gcgcagtccg ccccgggcag gcagtccggg acgtccccgt ccagctcgat 29940 cacgccgtcc ccggcggcca ccactcggtg caccgtgatc ccggcacgac ccagcagcgc 30000 acgcccgggc gacacgtgca cctcgggcgg ctcaatgccg tacccctcgg aagtgacctg 30060 cgcgaccgcc cgcaacctgg cagcgaaaat gcccaccggg agatcggcgg catggccgcc 30120 gccgaggttg agcacgggca ccgtcgtccg cagtcgcgcg acgaacccga tcgcctcacg 30180 caggcaactc tcgtaggtgc cgaagcggtt cagccggtgc ccgagcgagc agtccagccc 30240 ggccagcacc agcctccgcg accgggtcac cgtggcgacg gcggcgagcg cggccgagct 30300 gttcagccgc accccgtagc cgcgctgtgc gctgcccggc cggaccctca gcaggacgcg 30360 ctgccccggc cgggaccgcg ccgcgaccac ttccgcctcg gaggccgagc cgatcacgac 30420 ggcggcgccg caggacagtg ccgcctccag atccgccacg gacttcccgc tcccgaacag 30480 cgccagcgac tccgggcgga tccccgcgtc gagcgccgtc cgcagttcgg cggccgagcg 30540 gcagtagcag cccagcccgt cccgcgcgat ccaccgcgcg gcacccctga gcaggccgcc 30600 cttggcgctg cagcacaccg cgcccggccc gaacgccgcg acgtactccg cgcagcgact 30660 gtgcacatcg gtctcgtcga tcacgtgcac cggagtgccg tgggccgcgg cgatccgggt 30720 caccggcacc ccgccgacgg tgaggtcacc gggctcggtc cagcgtgcgg tgagcggcca 30780 gttcgcgggg tcgaggcgcg ggcggagcga cgcgcccagt gagggcagaa tctcggacaa 30840 cgtcataccg cgagcctgct cgccggcccg tgcccgagaa gatccggata cgccacgttg 30900 acgatcgacg tgccgttgtt gacgtgtcgc ctacaggtcg gggctgtcgg cgggagccat 30960 gatccgcagc gcgttcgggt cgatcgcgat ccgcatcggc gtcgtgcccc gaggctcgcc 31020 gtcgacctcg acggccaccg gccgatccgt ctccagccag agttcccgga ccgcgatgaa 31080 agggcgttca tgcagggtac ggcgatgccc ggtggccgcg ttccgggccg tctcgcgcag 31140 cagctcccgc cggctcgccc cgcccaccgg ataggcgacc agcagccggt cgtcggcgtg 31200 cgcgtccgcg gtgatcggcc ggccggcgtg gaaaccgccg ttcgcgacgt acacctgatg 31260 ggtgtggaac cgcagctccc gcccctcggc ccggatcacc gcgcggaccg gccggtgccg 31320 ggcgagcagc ccgagcgcgg tcatcggata cgccagccgc cccacggccc gtttcaaccg 31380 cggcggcgcg ctgatcatca cctcgccgga gagcccgatc ccgacgtggt tggtgaacgg 31440 cacgtccccg gcgacgccca ggtccacgtc gatgactttg ccgtccacca gggtcgcgat 31500 ggcggcttcg aggtccggct cgatccgcac ggtccgggcg aagttgttgg tggtgccgag 31560 cggcagcacc ccgagcgcca cgtcccggtg tgccagcatc cgccccgcgg tgctgatcgt 31620 cccgtccccg cccccggcga tcagcaggtc gggctctttc ctgagcgctt cggagatcag 31680 cccgtccagc ccgccggact gctccagcgc atacgtcccg agcagctcga acccggcctc 31740 gacaagccgc cgccgcgcct cttcgtagag gagccgcccc cgccgggacc gcgtgttgac 31800 aacaagaacc gcccgccgcc ctcgccggat gtcagcactg tgctcccgct tactacgcac 31860 ccgccgaccc tatccgcccc aacccaccca acgcccacgc ctcgttcccg cccgcccggt 31920 cccgagccgt gatcaccagc cgcaaggcct cagctggcgt tgacggctga tttcggcccg 31980 gttttgcgcc gtaggcgcca gccgcgaggt gtcggctggc gttcagggct ggattcggct 32040 cggttttgag ccgtgggtgc cagctggggg ctgcggccgg aagggggtgg atgtggggat 32100 gccccggggc cgtaggcctc ggggcaccga aaaagcgaac cagctcagct gttggcgatg 32160 aacgccggat gcgacagcag gaacgtgtcg atctggtcct tcttgatcga cttcagcagg 32220 tccatgctgt cgtcgctcag gagctcgacg ctgccggagc ccggcacgtt ctccgagttc 32280 agcttgccgg cgttggtctt gatggtgagg agcttgtccg gcttgaggct gcgcatcgcg 32340 agcgcccagt cggccaggtc gatgccaccg tcgtcgaccg tcatcgcctt gccgaacgcg 32400 ctgagcagct tcggcagctt ggtcggcgag tcgaggccgt ccttcagcgc ctggttgatg 32460 atcgccttga agaactgctg ctggtgccgc tggcgaccgt agtcgagcga gttgtcggcg 32520 agcaggtcac gctggcggac gaagtcgagc gcctggccgg gggtgaagca gtggtcgccc 32580 ttggtgtacg tgttcggcgt cacgcccgag atcttgctct tcagcgtgcc gtccgggttg 32640 atcacgaacg gcttggcggt cttgccgttc tggtccttgc ccaggtggat cgacttggtc 32700 gtggtgtcca cgtacatgca gaccttgccg agcacgttca ccacgtcgcg gaagccctgg 32760 aagtcgatga tcgccccggc gtccggcgtg atgccggtca gttccttgac ggtcatggtg 32820 agcaactcga agccgtgctg cagcgcctcg ttgcccttga gcccgcgggt gccgaacgcg 32880 aacgcggcgt tgatcttcgt cttgccgccg gcccacttct gcttcccgtt gtcgtacgcc 32940 gggatgtaga cgtagctgtc ccgggggagc gagatcatgt aaccgctgct gtggtccttg 33000 ttgatgtgca gcaggatgat cgagtccgac cggaggggct cgccgttggt ctgcgtgggc 33060 cgctggtcga tgccgacgag caggagattc ttcgccccgt cgaggttcgc gttcttcttc 33120 tcctcggcgg gtttcgccga gccgagcagc gactcctgcc cgaccgagga ggtggccgcg 33180 gccaccgtcg cgttcagccc gatcgcgcca ccgccaccgc cgaccagcag cagtgagccg 33240 aagaccacgg tccagaaagc ccagcggggt gtgcggcgtc ggcgcttgct ggtcctacgc 33300 aaggggtctc ctctaatcgg ggcggtcgtt ccgccccagg acaatctagg acggtcgttc 33360 cacccatgaa gacgggcgcc gcgagcgaaa agattgcctg cggaacattg aattttcctg 33420 agcgtcaggt agctacaagc tgaacgtcgc gctcgtgccc cgtggcgtcg cggaacgttg 33480 cttccctgtt actccccaac gcgacgtctg gtgttaacca tcgcaccacc aaggcgacct 33540 aggttctgca cggccccggg cccccgaggt tccgacaaag ttgcccaaag cgagtcgcca 33600 tgccctcaga gccggatgtc agtgtcgtca ttccgacgtg taaccggccg gagttggccg 33660 tccgcgcggt gcgcagcgcc ctcgggcaga cgcaccggaa cctcgaggtg atcgtcgtcg 33720 tcgacggtcc cgacgaggcg accgtgacgg cgctgggcga ggtcggtgac ccgcgactca 33780 gcgtgatcgt gctgccggag cgtggcaagg ccccgaacgc gcggaacact ggcgcccggg 33840 ccgcccgcgg ccgctggacg gcgatgctcg acgacgacga cgagtggctg cccaccaaga 33900 tcgaacggca gctggagacg gccgcggcgg cgaccgtgga gcgcccggtg gtggcctgcc 33960 ggatgatcag ccggacgccg cgggccgaca cgatcatgcc gcgccggctg cccgagccgg 34020 gtgagccgat cagtgaatac ctgctggtcc gccgcggtct gttctacggc gacggcttcg 34080 tgcagacgtc ctgcatcatg gcgccgaccg agctgtggcg gaaggtgccg ttcaccgtcg 34140 gcctgcgccg cgcgcaggag ctggactgga cgctgcgggc gatgcgcgag ccgggcaccg 34200 cgctgatcta cgccgaggag ccgctggtcc tctggcacca ggacgagaac cgtgaccgga 34260 tcagcctgca gaacccgtgg cgcgagcaac tggagtggct gcgcggcaac cgggagctgt 34320 tcacgccgcg tgcctacgcc gcgttcacgc tgagtgtgct gagctcgatg gccgcgccga 34380 cccgggacac cgggctcttc cgtgagctgc tcgccgaggc ccgcacgcac ggcgacccgg 34440 gcaccgtcga ctaccttacg cacatgcaga tctgggccct cccgccgagc gtccggcacc 34500 gcctgcgtga cgtcgtggtg ggccgcggca agacgagcag caatgccggc tgagcgccgg 34560 gtcgcgatct ggcgcagttc gatgctgccc ggctccgaga cgttcgtccg caatcaggcc 34620 gacgcgctga cccgctggac cccggcctat gtcggcgcgg tccggcacga gtcggtgctg 34680 tcccgccccg acgacgtgat cgccttcccg ggcggcaagg ggttcctgcg actgcggctg 34740 accggggcgt ctccccagct gcagaagacg atttccgccg tacggccgaa tctggttcat 34800 gcccatttcg gtggtgacgg atggctggtg agccactccg cccagcagct gggggtgccg 34860 ctggccgtca ccgtgcacgg gcacgacgtg acccgtcagc cgtccagccc gggcgcgaag 34920 ggcgtgcgct accgccgcaa cctgcagacc gttttcacgc gggcgtcgct ggtcatcgcg 34980 gtctcggagg tgatccgcgg ccaggcgatc aggtggggcg ccgacccggc gaaggtgaag 35040 gtgcactaca ccggcatcgc ggttcccccg gagcagccgg aggaggtgcc gaagcggtgg 35100 gacgtggtgt tcatcggccg tttcgtcgcc aagaagggcg tcgacgacct gctcaccgcg 35160 ctcgccgcgg tcgagtcgcg cccgcgcgcg ctgctcatcg gcgacggcga gctgatgacg 35220 gcgatgcgtg cccgtgccga gcagctgggc gtggacgtca cgttcgccgg cagccggacc 35280 cccgagcagg tgcggcgcca cctgctggag tcgcggctgc tggcctgccc gtcgaagacc 35340 gcgccggacg gggacaccga gggcctgccg accacgatcc tggaggcggc cgcgctcggc 35400 ctgccggtgg tcgcaacccg gcacagcggc atcccggagg ccgtgatcga cggtgagacc 35460 ggcctgctca gcccggaggc ggacccggcg gcgctggcgg tgtcgctgac ccggctgctc 35520 ggtgacgagg atctccagcg ccggctcggt gcgcgggcgc ggcggcacgt cacggcacac 35580 ttcgatctcg tggagcagac caggcggctg gaggacctgt atgacgaggt cgtggcgggc 35640 gctagggtct aggcctgcct gtccggcttc ctgggggaaa tcatgatctg cacgcactgc 35700 ggctcaccgg cggcgccgac cgtcggcccg tgcccgggct gcggccgtcc ggtctccgcc 35760 ccggccgggg tgttcccgga cccgctggcc gcgccggccg agcggtcgct ccccacgtcg 35820 gcgtacagcg tgccggtcga tccgtacacc ggcccgacca ccggtgaccc gttcgccggc 35880 gactcgttcc acaccccgcc gccggcgtcc ccgatgccgc cgccggtgac cgagccgatc 35940 acgccgacgc cgcccccgcc ggcctacgcc ccgcccccgc agtacagccc gccgccgtat 36000 gcgggggcgc ccggtcagcc ctatccgggt cagccttacc caggtcagcc ctacccggga 36060 cagccctacc ccgggcagca gccgtatccc ggccagcagc cctaccccgg atacggccag 36120 tcgaacagcc aggccctgac catcgtcgcc tacgtcctcg gcggcttcgg tctcctgacc 36180 atgaccccgc tcatcggcgt cgtcggcctg gtcctggcga acttcgcgaa gcgccgtcac 36240 gagcgcaatg cctcgatcgc ggtcaagatc gtcgccggcc tggtgatcgc cgctttggtg 36300 ctgagcatcg tggaccgcat cgtttaaggc ctgccctgcc gatcactcag ggcggcgact 36360 tctgggcggc gggggtgctc ccctcgccgg aaaggatgtc cggttcccgg gatggtcagt 36420 actgtcggct catgggcgaa catttcgatc ttgtcgtgct gggcgccggt ccgggtggat 36480 atgtcgcggc gatccgcggc gctcaactgg gcctgaccac cgcgatcgtc gaggacaagt 36540 actggggcgg cgtctgcctc aacgtcggct gcatcccgtc gaaagcgctg ctgcgcaacg 36600 cggagctggc gcacatcttc caccaccagg cgcagacctt cggcatcgag gggaaggtca 36660 ccttcgactt cgccgtcgcc caccagcgca gccgcagcgt cgccgacggc cgcgtcaagg 36720 gcgtgcactt cctgatgaag aagaacggga tcaccgagat ccaggggcgt ggcgagttca 36780 ccgacgcgca cacgctgcgg gtcggcgacc ggacggtcac gttcgacaac tgcatcctgg 36840 cgaccggcgc gagcacccgg atgattcccg gcacgagcgt ctcgaagcgg gtcgtgacgt 36900 acgaggagca gatcctcgac cccgacctgc cggacagcat cgtgatcgtc ggcgccggcg 36960 cgatcggcgt cgagttcgcg tatgtgctgc gcaactacgg cgtcgacgtg accatcgtgg 37020 agttcctcga ccggatgctg ccgctggagg acgaggaggt ctccaaggag ctgctccggc 37080 agtaccgcaa gctcggcgtc gacgtgcggg tcggcacccg ggtggagggc atcgaggagg 37140 gcgccgactc ggtccgcgtc accgtctcca agaacgggaa gaccgaggtc ctcgaggccg 37200 acaaggtgat gcaggcgatc ggcttcaagc ccaacgtgga gggctacggg ctggagacca 37260 ccggcgtcac ggtgtccgac cgcggcgcgg tcgagatcga cgacttctgc cgtacgaacg 37320 tgcccggcat ctacgccatc ggcgacgtca ccgcgaagct gatgctggcg cacgccgccg 37380 aggcgatggg catcgtggcg gccgagacga tcgccggcgc cgagacgatg gccctcgact 37440 accggatgat cccgcgcgcg actttctgcc agccgcaggt cgccagcttc gggtggaccg 37500 aggcgcaggc ccgcgagcag ggcttcgacg tcaaggtggc caagttcccg ttcaccgcga 37560 acggcaaggc gcacggcctc ggcgacgcga ccgggttcgt gaagatcctc agtgacgcga 37620 agtacgggga gctgctcggc gcgcacctga tcgggccgga cgtgaccgag ctgctacccg 37680 agctgaccct ggcccagcag tgggacctga ccgtccacga ggtcgggcgc aacgtgcacg 37740 cgcatccgac gctcgccgag gcggtcaagg aggcgatcca cggcctggcc ggccacatga 37800 tcaacttctg agtccgccgc tcggccgacg ggtccgccgc tcggccgacg ggtccgccgc 37860 tcggccgacg ggtccgctgt ccggccgacg agtccgccgc ccggctgacg cccgggggag 37920 tagccggagc cgcccgtacc gcgcctgcgg tagcccgaat acctacgcgg ggatgacgac 37980 tccgccccgc cggtcgggaa cgctgagcct tgtgaccctg accgtcgagc ctccgatcgc 38040 cccggcgccg cccgccgccc cggggcgatc ccggcggcgc aggctgggct atctggcgtt 38100 cgtgctggtc gcggtggtgg cggtggtgac gctgcgcgac cggctgccgg atccggggga 38160 gttcctcgac gcgctgcgag cggccgactg gcggtgggcg gcgctcgcgg tgggggccgg 38220 ggtgctgtcc cagatcgcgt acgccgagca gcagcgccgg cttctcgccg cgttcggagt 38280 gcgcgtgccg gcccggcggg cgatcgcgat gacgtacgtc cggtcggcgc tgagcatggc 38340 gctgccggcc gggtcggcgg cctccgcggc gtacgccttc caggtctatc gtcgccacgg 38400 cgccaccgcg gcgatctccg cgacggcgac cctgatctcg acggtcgtga ccgtgatgtc 38460 gctgggcctg ctctacgccg cgacctggtc gctgaccgcc accgtcgtgg ccggcctggc 38520 cgttctcctg ctgtggatct accggaccgt gcggggcccg gtccccgcgc gtgccggcgt 38580 gccgcgccgt ctgagggtcg ccccgatcgc ccgcctgctc cagcggcccg ccgtggccca 38640 ggcgctccgg ggtgcacggt ccgtcccggc ccggacgtgg ctcacggtga ccctggccgg 38700 cgtgatcaac tggctgctgg acatggcctg cctgctcctc gcggccgacg cgctgcacgc 38760 cgggctcggc tggagccggc tcgcgctgat ctacctggcc gtccaggtgg tccggcagat 38820 cccgctcacc cccggcggca tcggcctgat cgagaccagc atgctcgccg gcctgatcgc 38880 cgcgggcgcc ccgcaggtca ccgccgccgg gatcgtcctg atctaccggc tgatctcgtt 38940 ctggctgatc ctgcccagcg ggctggccgc ccacctgacc ctgcgccggg ggaccgtgcc 39000 gccggtgact ccgggctgac cgccggggct caggcgcggt cgaactgctg gaggacggcg 39060 ccgaggccga gcgtcagggc cgggccgggc agtcgtgagt ccagcccgta ccgccggccg 39120 gggttctccc gatcgaccag gtcctgccag agcccggtca ccggatcgcc cagccccggc 39180 aggtcgtgcc cggccgcccg gagcagctcg gccaggtcgt tctgctggcg cagccgctgc 39240 tcctcgaaga tctggctcca ctgcatcagc gagatcgacg cctccagtgt gtccggcacc 39300 gtctcgtcca gcatcggcag cggtcgcgcc gcggcccacg ccgcgagctg cgccccggtc 39360 accgtgccgg gatcgtcgtc gcggctgcgc gccagcgcgt acgacagcag cgccgtggtc 39420 tccaccagca ggtgctgcac cgggacgcgc gccggcgggt ccagccacca gtggtccgcc 39480 tcgagcaggg ccgcggcgtg ccgggtcgcc gcccgccacc agccgtcgtc gccgccggcc 39540 agggcgtcgg tgtaggacca caggaaggtc acccttccgt gcctaccagc ggcacttgac 39600 acgagtcaat cacgcgaacg cgtggcgacg accgcgatcg cttcgacgga gatcagcagc 39660 ccgtgcggga gaaccacgcc ggcgggcgcg gaccgggccg gcggcgggtc gggcatgtgc 39720 cgcgccagca cctggttgat caccgggaag tcctcgacgt gcgtgtagaa gacggtcagc 39780 ttcaccagcc cgtccagccc gtccagcccg gagccggccg ccgccagcac cgccccgagg 39840 ttgcacagcg cctgctcggt ctgcgcctcg atgccgtcca ccggcttccc ggtcgcgggg 39900 tcgatcccgg gcatcccgga gcagaacacg aacccgccgg cgacgatcgc ctggctgtag 39960 ggccccagcg ccgtgggggc ccgctcactc gtcaccgcga tgcgatccat cgggcgagtc 40020 tcccgcaccg ggcatcgatg gtctttcggc tttatgacac gggtgggagc ttgacagccg 40080 tacatcgttt atcgattatc aatatatcga aaaacgataa gggggtacgt cgtgaagacc 40140 gactggttga cggagttcca ccaggtgctg ctggtcgccg cgctgggcgc cggggccgcc 40200 gccgtcctcg ggaccgtcgg gctcgtggtg caggacgagg tcgtcgtccc gggcggcacg 40260 tcggctccgg cgagcgtggt cagcgacccg agcgtcaccc agctcctgct cgccgtggcg 40320 gccgccgtgc cgacgtacct gctggcgacc gccatgctgg tgctgctgta ccggttggtc 40380 ggcgccgcgc gtcgcgggga tc 40402 <210> 201 <211> 334 <212> PRT <213> Actinoplanes liguriae <400> 201 Val Arg Leu Arg Ile Gln Arg Arg Leu Ala Asp Glu Leu Gly Pro Thr 1 5 10 15 Leu Tyr Thr Thr Gly Gln Ser Glu Asp Leu Asp Ala Arg Val Arg Asp 20 25 30 Ala Leu His Asp Leu Leu Ala Arg Glu Glu Thr Pro Leu Ser Gly Ala 35 40 45 Asp Arg Ala Arg Ile Thr Arg Glu Val Thr Asp Glu Val Leu Gly His 50 55 60 Gly Pro Ile Glu Ser Leu Leu Arg Asp Pro Ser Val Thr Glu Val Met 65 70 75 80 Val Asn Gly Pro Tyr Ser Val Tyr Val Glu Arg Phe Gly Arg Leu Glu 85 90 95 Lys Val Ala Ala Glu Phe Asp Asp Glu Gln His Leu Arg Arg Ile Ile 100 105 110 Asp Arg Ile Cys Ser Arg Val Gly Arg Arg Val Asp Glu Ala Ser Pro 115 120 125 Thr Val Asp Ala Arg Leu Pro Asp Gly Ser Arg Val Asn Ala Val Val 130 135 140 Pro Pro Ile Ala Leu Asp Gly Ser Thr Leu Thr Ile Arg Lys Phe Ala 145 150 155 160 Ala Val Pro Leu Thr Val Gly Asp Leu Leu Gln Tyr Gly Thr Leu Thr 165 170 175 Arg Gln Ala Ala Glu Phe Leu Asp Ala Cys Val Arg Gly Arg Arg Thr 180 185 190 Ile Leu Val Ser Gly Gly Thr Gly Ser Gly Lys Thr Thr Ile Leu Asn 195 200 205 Val Leu Ser Ser Phe Val Pro Ala Asp Glu Arg Ile Val Thr Ile Glu 210 215 220 Asp Ala Ala Glu Leu Gln Leu Val Gln Asp His Val Val Arg Leu Glu 225 230 235 240 Ser Arg Pro Pro Asn Ser Glu Gly Arg Gly Thr Ile Thr Thr Arg Asp 245 250 255 Leu Val Arg Asn Ala Leu Arg Met Arg Pro Asp Arg Ile Val Val Gly 260 265 270 Glu Val Arg Asp Ala Ala Ala Leu Asp Met Leu Gln Ala Met Asn Thr 275 280 285 Gly His Asp Gly Ser Leu Thr Thr Leu His Ala Asn Thr Pro Arg Asp 290 295 300 Ala Leu Ser Arg Leu Glu Thr Met Val Leu Met Ala Gly Met Asp Leu 305 310 315 320 Pro Ile Arg Ala Ile Arg Asp Gln Ile Ser Ser Ala Val Asp 325 330 <210> 202 <211> 358 <212> PRT <213> Actinoplanes liguriae <400> 202 Met Ser Glu Leu Glu Ser Tyr Leu Pro Arg Tyr Pro Glu Thr Leu Leu 1 5 10 15 Val Val Ile Gly Ala Val Val Asp Leu Asp Glu Ala Leu Met Phe Thr 20 25 30 Ala Tyr Gln Arg Leu Gln Arg Pro Val Ile Gly Val Val Leu Ile Arg 35 40 45 His Ala Ile Glu Ala Gly Val Val Leu Arg Cys Leu Gln Ser Gly Ile 50 55 60 Arg Asp Leu Val Ala Glu Glu Asp Glu Glu Gly Ile Arg Ser Ala Thr 65 70 75 80 Val Arg Ser Val Asp Leu Ser Lys Ala Leu Ser Thr Thr Met Arg Gly 85 90 95 Thr Gly Asp Asn Ala Pro Tyr Ala Ser Val Val Thr Val Phe Ala Gly 100 105 110 Lys Gly Gly Cys Gly Arg Ser Val Val Ala Val Asn Leu Ala Val Ala 115 120 125 Leu Ala Gly Ala Gly Arg Arg Val Leu Leu Met Asp Leu Asp Leu Gln 130 135 140 Phe Gly Asp Val Ala Ile Met Met Lys Leu Ser Pro Glu Arg Asn Ile 145 150 155 160 Ala Gly Gly Leu Gln Met Ala Gly Arg Leu Asp Glu Pro Gly Leu Arg 165 170 175 Ser Ile Val Thr Thr Tyr Arg Gln Ser Leu Asp Ala Leu Leu Ala Pro 180 185 190 Ala Ser Pro Ala Glu Gly Glu Gln Val Arg Arg Glu Phe Val Val Glu 195 200 205 Leu Leu Asp Val Ala Arg Pro Leu Tyr Asp Phe Ile Val Val Asp Thr 210 215 220 Pro Ser Val Val Thr Asp Gln Val Leu Ala Ala Leu Asp Met Ser Asp 225 230 235 240 Trp Phe Ile Pro Ile Val Thr Pro Asp Leu Pro Ala Leu Lys Ser Val 245 250 255 Arg Leu Thr Ala Glu Met Phe Asp Leu Leu Asp Tyr Pro Lys Asp Lys 260 265 270 Arg Leu Leu Val Phe Asn Arg Ala Gly Ala Gln Val Gly Leu Ser Pro 275 280 285 Ser Glu Val Glu Val Ala Ala Gly Met Pro Phe Ala Val Gln Val Pro 290 295 300 Ala Ser Arg Asp Val Thr Val Ser Val Asn His Gly Glu Pro Ile Ala 305 310 315 320 Val Thr Asp Pro Leu His Pro Val Ser Arg Ala Ile Arg Glu Leu Gly 325 330 335 Asp Arg Ile Ala Gly Val Gly Thr Thr Pro Gln Arg Arg Arg Gly Phe 340 345 350 Leu Gly Arg Leu Phe Pro 355 <210> 203 <211> 266 <212> PRT <213> Actinoplanes liguriae <400> 203 Met Arg Arg Arg Ile Leu Ile Leu Leu Ala Ala Leu Val Leu Ala Gly 1 5 10 15 Ile Ser Gly Ala Ala Val Leu Ser Tyr Ala Arg Ser Ala Asp Arg Arg 20 25 30 Ala Leu Ser Gly Arg Glu Gly Thr Trp Ile Leu Val Ala Gly Gln His 35 40 45 Ile Pro Ser Gly Thr Ser Gly Ala Glu Ile Arg Ala Arg Gly Leu Thr 50 55 60 Glu Arg Leu Leu Val Pro Thr Val Thr Val Pro Ala Gly Ala Leu Thr 65 70 75 80 Thr Trp Asp Ser Ala Leu Asp Pro Leu Arg Leu Gly Gly Asp Leu Gln 85 90 95 Pro Arg Gln Leu Leu Met Arg Thr Leu Phe Val Pro Ala Ser Pro Ala 100 105 110 Pro Ser His Thr Gly Arg Ile Pro Val Pro Arg Arg Ser Leu Ala Val 115 120 125 Ser Val Ala Leu Asn Val Ala Pro Gln Val Ala Gly Asn Ile Thr Pro 130 135 140 Gly Asp Gln Val Ala Val Tyr Tyr Thr Tyr Gln Ala Lys Val Leu Met 145 150 155 160 Ala Glu Asp His Glu Thr Ile Pro Met Thr Glu Leu Leu Leu Pro Lys 165 170 175 Ala Arg Val Ile Thr Ile Gly Glu Ala Glu Pro Gly Gln Ala Pro Val 180 185 190 Thr Pro Ser Pro Ser Pro Thr Pro Gly Pro Ser Ala Ser Ala Gly Asp 195 200 205 Ser Thr Ala Ala Val Lys Glu Ile Gln Arg Tyr Val Val Thr Leu Ala 210 215 220 Val Gly Asp Thr Asp Ala Leu Arg Leu Val His Ala Ala Gln Ser Gly 225 230 235 240 Ser Leu Tyr Leu Ala Leu Leu Gly Pro Asn Ala Thr Ala Ser Thr Gly 245 250 255 Pro Ala Ile Asp Thr Ser Trp Val Val Arg 260 265 <210> 204 <211> 432 <212> PRT <213> Actinoplanes liguriae <400> 204 Met Arg Arg Leu Ile His Ala Leu Phe Pro Pro Arg Gly Glu His Gly 1 5 10 15 Val Ile Thr Ala Leu Val Ala Val Leu Ala Gly Ala Gly Val Leu Leu 20 25 30 Gly Met Ala Ala Leu Val Ile Asp Ile Gly Ala Leu Tyr Ala Glu Arg 35 40 45 Glu Gln Leu Gln Ser Gly Ala Asp Ala Ala Ser Trp Lys Val Ala Gln 50 55 60 Ala Cys Ala Gly Thr Ala Gly Arg Asp Leu Thr Ser Ala Thr Cys Thr 65 70 75 80 Val Ala Ala Gln Arg Asp Asn Ala Gln Arg Tyr Ala Asp Arg Asn Ala 85 90 95 Lys Asp Leu Val Ser Asp Val Gln Phe Cys Ile Thr Thr Val Ser Ala 100 105 110 Ala Gly Val Thr Thr Ala Asp Ala Gly Cys Pro Ser Ser Trp Asn Thr 115 120 125 Pro Val Thr Cys Pro Ala Pro Pro Ser Ala Ser Gly Pro Tyr Arg Tyr 130 135 140 Val Glu Val Arg Thr Ser Thr Arg Asn Ser Asp Asn Thr Ser Val Val 145 150 155 160 Pro Pro Leu Phe Gly Arg Gly Leu Ala Gly Ser Ala Tyr His Gly Ala 165 170 175 Lys Met Gly Ala Cys Gly Arg Val Ala Trp Gly Ala Pro Ala Val Thr 180 185 190 Asp Val Leu Ala Leu Gly Val Ser Arg Cys Asp Phe Leu Arg Leu Thr 195 200 205 Gly Asp Tyr Thr Arg Phe Phe Ala Pro Pro Pro Pro Thr Gly Pro Asn 210 215 220 Pro Gln Thr Gly Val His Pro Leu Leu Gly Leu Ser Asp Pro Thr Ala 225 230 235 240 Gly Tyr Ile Pro Ile Ser Asp Gly Ile Leu Ala Thr Ser Cys Pro Ala 245 250 255 Asp Ala Gly Glu Thr Val Ala Gly Tyr Thr Trp Leu Gly Gln Pro Asp 260 265 270 Gly Pro Pro Ala Leu Pro Gly Leu Leu Pro Val Ser Ala Pro Asp Ala 275 280 285 Ser Cys Glu Leu Thr Gly Ile Pro Ala Thr Asp Gly Pro Ala Asp Ser 290 295 300 Trp Val Gly Gly Phe Thr Ile Gly Pro Gly Asn Ala Ser Ala Ala Thr 305 310 315 320 Ala Cys Leu Asp Arg Leu Asn Val Leu Ile Thr Ser Gly Gln Pro Val 325 330 335 Leu Val Pro Ile Phe Asp Arg Gln Val Ala Val Ile Gly Thr Leu Pro 340 345 350 Ser Tyr Tyr Arg Ile Ala Gly Phe Ala Pro Leu Val Leu Thr Gly Tyr 355 360 365 Glu Ser Pro Val Ser Gly Pro Val Ser Pro Gly Ser Ala Val Pro Ser 370 375 380 Leu Val Pro Gly Ala Gln Arg Ala Leu Cys Ala Ala Gln Ser Cys Leu 385 390 395 400 Tyr Gly Tyr Phe Thr Arg Ala Leu Val Thr Asp His Val Pro Thr Arg 405 410 415 Phe Ala Thr Ser Arg Tyr Tyr Gly Ala Met Val Ile Gly Arg Thr Gly 420 425 430 <210> 205 <211> 136 <212> PRT <213> Actinoplanes liguriae <400> 205 Met Trp Lys Ala Thr Glu Arg Gln Gly Pro Val Val Leu Leu Val Glu 1 5 10 15 Asp Asp Glu Asp Leu Arg Glu Leu Ala Ala Gln Met Leu Glu Met Arg 20 25 30 Gly Phe Val Val Leu Val Ala Lys Asp Pro Val Ser Ala Ile Met Thr 35 40 45 Cys Arg Val His Ser Gly Ala Ile Asp Val Leu Leu Thr Asp Leu Gly 50 55 60 Leu Pro Gly Val Ser Gly Gly Glu Leu Ala Arg Ser Ala Ser Glu Val 65 70 75 80 Arg Pro Gly Met Lys Ile Val Tyr Val Ser Gly Val Pro Glu Glu Ile 85 90 95 Ala Ile Lys Lys Gly Leu Ile Arg Ala Gly Ser Pro Phe Val Ala Lys 100 105 110 Pro Tyr Thr Ala Asp Arg Leu Ala Gly Met Leu Arg Thr Val Leu Ala 115 120 125 Gln Gly Ala Glu Ser Ser Ala Arg 130 135 <210> 206 <211> 363 <212> PRT <213> Actinoplanes liguriae <400> 206 Met Phe Asn Tyr Val Ser Phe Val Arg Pro Lys Thr Phe Ala Ala Thr 1 5 10 15 Phe Ala Ala Ala Ala Leu Leu Leu Gly Ser Gly Ala Cys Ala Lys Ser 20 25 30 Glu Asp Ser Gly Asp Thr Val Ala Ala Gly Pro Ala Pro Ser Ala Ala 35 40 45 Gln Val Val Gln Ser Ala Ser Ala Gly Ser Ala Thr Cys Ala Leu Asp 50 55 60 Gln Tyr Gly Ala Ser Lys Leu Asp Leu Lys Thr Ala Ser Val Gly Phe 65 70 75 80 Ser Gln Ser Glu Lys Glu Ala Asn Pro Phe Arg Ile Ala Glu Thr Lys 85 90 95 Ser Ile Lys Asp Glu Ala Ala Lys Leu Gly Ile Thr Asn Leu Lys Thr 100 105 110 Ser Asn Ala Asn Ser Gln Phe Asn Lys Gln Ile Ala Asp Val Glu Gln 115 120 125 Met Ile Asp Ala Gly Val Gln Leu Leu Val Ile Ala Pro Leu Asn Ser 130 135 140 Asp Gly Trp Asp Ser Val Phe Ala Lys Ala Thr Ala Lys His Ile Pro 145 150 155 160 Ile Ile Thr Ile Asp Arg Lys Ile Asn Ala Thr Ala Cys Lys Asp Tyr 165 170 175 Leu Thr Phe Ile Gly Ser Asp Phe Ala Glu Gln Gly Lys Arg Ala Ala 180 185 190 Asp Ala Leu Ala Lys Ser Leu Gly Asn Lys Gly Glu Val Ala Ile Leu 195 200 205 Leu Gly Ala Pro Gly Asn Asn Val Thr Thr Leu Arg Thr Ser Gly Phe 210 215 220 Lys Asp Glu Ile Ala Lys Val Ala Pro Asp Ile Lys Ile Thr Phe Glu 225 230 235 240 Gln Thr Gly Asn Phe Ser Arg Glu Asp Gly Gln Lys Val Ala Glu Gln 245 250 255 Leu Leu Gln Ser Lys Pro Asn Ile Asn Gly Ile Tyr Gly Glu Asn Asp 260 265 270 Glu Met Ala Leu Gly Ala Ile Thr Ala Leu Lys Gly Ala Gly Lys Lys 275 280 285 Ala Gly Asp Val Lys Ile Val Ser Ile Asp Gly Thr Lys Gly Ala Val 290 295 300 Gln Gly Ile Val Asp Gly Trp Val Ser Ala Val Ile Glu Ser Asn Pro 305 310 315 320 Arg Phe Gly Pro Leu Ala Phe Asp Thr Ala Thr Lys Phe Phe Gly Gly 325 330 335 Glu Pro Val Gly Gln Asp Ile Val Ile Gln Asp Arg Ala Tyr Asp Glu 340 345 350 Ser Asn Ala Lys Thr Asp Ile Gly Ser Ala Tyr 355 360 <210> 207 <211> 501 <212> PRT <213> Actinoplanes liguriae <400> 207 Met Leu Leu Glu Val Ser Gly Val Ser Lys Thr Phe Pro Gly Val Arg 1 5 10 15 Ala Leu Asp Gly Val Ser Phe Thr Leu Asn Pro Gly Glu Val His Ala 20 25 30 Leu Val Gly Glu Asn Gly Ala Gly Lys Ser Thr Leu Ile Lys Val Leu 35 40 45 Thr Gly Val Tyr Gln Pro Asp Ser Gly Glu Leu Arg Tyr Arg Gly Glu 50 55 60 Pro Ala Arg Phe Ala Thr Pro Leu Asp Ala Gln Arg Ala Gly Ile Ser 65 70 75 80 Thr Ile Tyr Gln Glu Val Asn Leu Val Pro Leu Met Ser Val Ala His 85 90 95 Asn Leu Phe Leu Gly Arg Glu Pro Arg Asn Arg Phe Gly Leu Leu Asp 100 105 110 Glu Ala Arg Met Val Ala Glu Ala Thr Glu Ile Leu Ala Gly Tyr Gly 115 120 125 Val Arg Thr Asp Val Arg Arg Arg Leu Gly Thr Leu Ala Leu Gly Ala 130 135 140 Gln Gln Met Val Ala Leu Ala Arg Ala Val Met Val Asp Ala Arg Val 145 150 155 160 Val Val Met Asp Glu Pro Thr Ser Ser Leu Glu Pro Arg Glu Val Glu 165 170 175 Thr Leu Phe Gly Val Ile Arg Glu Leu His Thr Ala Gly Ile Gly Ile 180 185 190 Val Tyr Val Ser His Arg Leu Asp Glu Leu Tyr Arg Val Cys Asp Ala 195 200 205 Val Thr Ile Leu Arg Asp Gly Lys Leu Val His Thr Gly Arg Met Ala 210 215 220 Asp Leu Asp Arg Arg Thr Leu Val Ser Leu Met Leu Gly Arg Glu Phe 225 230 235 240 Gly Ala Asp Phe Thr Ser Phe Ser Glu Ser Pro Gln Ser Thr Pro Glu 245 250 255 Gly Glu Pro Val Leu Arg Val Ser Gly Leu Thr Ser Arg Pro Arg Leu 260 265 270 Asp Asp Ile Ser Phe Asp Val Arg Pro Gly Glu Val Val Gly Leu Gly 275 280 285 Gly Leu Leu Gly Ala Gly Arg Ser Glu Thr Ile Lys Ala Ile Gly Gly 290 295 300 Ala Tyr Pro Ile Asp Ser Gly Val Ile Glu Val Gly Gly Val Arg Leu 305 310 315 320 Gly Arg Pro Ser Thr Val Arg Ala Val Arg Ala Gly Val Ala Thr Gln 325 330 335 Pro Glu Asp Arg Lys Ala Glu Gly Ile Val Pro Gly Leu Ser Ile Arg 340 345 350 Asp Asn Ile Ala Leu Ala Ile Leu Pro Arg Met Ala Arg Phe Gly Leu 355 360 365 Val Ser Asp Lys Arg Ile Asp Ser Ile Val Ala Thr Tyr Met Ser Arg 370 375 380 Leu Arg Ile Lys Ala Ser Gly Pro Asp Gln Ala Val Gly Asp Leu Ser 385 390 395 400 Gly Gly Asn Gln Gln Lys Val Leu Leu Ala Arg Leu Leu Ala Thr Gly 405 410 415 Pro Lys Val Leu Leu Leu Asp Glu Pro Thr Arg Gly Ile Asp Val Gly 420 425 430 Ala Lys Ala Glu Val Gln Ala Leu Ile Asp Glu Leu Ala Lys Glu Gly 435 440 445 Leu Gly Val Val Leu Val Ser Ser Asp Ala Glu Glu Leu Val Glu Gly 450 455 460 Ala Asp Arg Val Val Val Leu Arg Asp Gly Ala Val Val Gly Thr Leu 465 470 475 480 Thr Gly Asp Arg Val Thr Thr Glu Ala Leu Met Ala Thr Ile Ala Glu 485 490 495 Ala Ala Asp Glu His 500 <210> 208 <211> 319 <212> PRT <213> Actinoplanes liguriae <400> 208 Met Ser Thr Glu Thr Leu Thr Arg Pro Arg Met Thr Phe Asn Pro Ala 1 5 10 15 Trp Ala Ala Arg Tyr Gly Val Tyr Ala Ala Ile Val Leu Leu Ile Val 20 25 30 Val Asn Ile Ala Phe Thr Pro Tyr Phe Leu Thr Leu Ser Asn Leu Arg 35 40 45 Ile Gln Leu Ile Gln Ala Ala Pro Val Val Ile Val Ala Leu Gly Met 50 55 60 Ala Leu Val Ile Gly Thr Glu Gly Ile Asp Leu Ser Val Gly Ser Val 65 70 75 80 Met Ala Leu Ala Ala Ala Phe Ile Pro Leu Tyr Leu Gly Tyr Gly Val 85 90 95 Thr Ala Ala Ile Leu Val Ser Leu Leu Ala Gly Val Ala Val Gly Leu 100 105 110 Ile Asn Gly Val Leu Val Ala Lys Ala Gly Leu Gln Pro Ile Val Ala 115 120 125 Thr Leu Ala Leu Phe Val Gly Gly Arg Gly Leu Ala Val Val Ile Ser 130 135 140 Gly Gly Gln Leu Lys Asp Val Arg Asn Ala Asp Leu Leu Tyr Leu Gly 145 150 155 160 Ser Gly Asp Leu Leu Gly Val Pro Val Leu Val Trp Ile Ala Ala Leu 165 170 175 Leu Val Leu Val Val Ala Phe Val Val Arg Arg Thr Val Phe Gly Arg 180 185 190 Arg Leu Leu Ala Val Gly Gly Asn Arg Pro Ala Ala Glu Leu Ala Gly 195 200 205 Leu Pro Val Lys Arg Val Leu Ile Gly Val Tyr Val Phe Cys Ala Val 210 215 220 Leu Ala Ser Ile Ala Gly Leu Leu Ser Val Ala Arg Ile Gln Ser Ser 225 230 235 240 Asp Ala Ser Ala Val Gly Leu Leu Ile Glu Leu Ser Ala Ile Thr Ala 245 250 255 Val Val Val Gly Gly Thr Pro Leu Thr Gly Gly Arg Val Arg Val Leu 260 265 270 Gly Thr Val Ala Gly Ala Leu Leu Met Gln Leu Val Val Ala Thr Met 275 280 285 Ile Lys His Asp Leu Pro Pro Ser Thr Thr Glu Met Val Gln Ala Val 290 295 300 Ile Ile Leu Val Ala Val Tyr Val Ala Arg Glu Arg Arg Thr Arg 305 310 315 <210> 209 <211> 320 <212> PRT <213> Actinoplanes liguriae <400> 209 Met Ser Ile Pro Val Pro Ala Phe Arg Asn Gly Gly Phe Val Gln Arg 1 5 10 15 Gln Gly Ala Leu Ala Val Leu Val Thr Val Val Ala Ile Ser Leu Ala 20 25 30 Ala Phe Pro Gly Phe Arg Ser Ala Asp Asn Ala Gly Thr Ile Leu Val 35 40 45 Ala Ala Ala Pro Pro Met Leu Ile Ala Leu Gly Met Thr Phe Val Ile 50 55 60 Ile Thr Gly Gly Ile Asp Leu Ser Val Gly Ser Leu Tyr Val Leu Gly 65 70 75 80 Gly Val Val Ala Ala Trp Ala Ser Gln Trp Gly Val Val Ala Ala Leu 85 90 95 Ala Ala Pro Leu Leu Leu Cys Gly Ala Ile Gly Val Leu Asn Gly Ile 100 105 110 Leu Ile Ser Arg Thr Gly Met Ala Pro Phe Ile Val Thr Leu Ala Ala 115 120 125 Leu Leu Gly Ala Arg Gly Leu Met Arg Ser Ile Ser Asp Glu Gly Ser 130 135 140 Thr Thr Tyr Leu Val Arg Ser Asp Val Phe His Glu Leu Gly Thr Gly 145 150 155 160 Ser Leu Leu Gly Val Gly Leu Pro Val Trp Leu Ala Ala Val Leu Val 165 170 175 Gly Ala Gly Ile Leu Val Leu Asn Arg Thr Arg Phe Gly His Ala Val 180 185 190 His Ala Ile Gly Gly Ser Glu Asp Ala Ala Ala Leu Met Gly Leu Pro 195 200 205 Val Arg Arg Ile Lys Val Trp Val Tyr Leu Leu Ser Gly Leu Leu Ala 210 215 220 Gly Leu Ala Gly Ala Ile Asn Ala Ala Lys Leu Gly Ser Gly Val Thr 225 230 235 240 Val Leu Gly Ser Gly Met Glu Leu Asp Ala Ile Ala Ala Val Val Ile 245 250 255 Gly Gly Thr Leu Leu Thr Gly Gly Ser Gly Ser Ile Ala Gly Thr Val 260 265 270 Ala Gly Val Leu Leu Leu Gly Val Ile Gln Asn Leu Ile Asn Gln Val 275 280 285 Gly Asn Val Asn Ser Asn Trp Gln Gln Val Ile Ser Gly Gly Phe Leu 290 295 300 Ala Ala Val Val Val Ala Gln Thr Thr Leu Val Arg Ala Arg Arg Ser 305 310 315 320 <210> 210 <211> 486 <212> PRT <213> Actinoplanes liguriae <400> 210 Met Arg Thr Ser Ala Gly Thr Arg Val Leu Thr Val Gly Ala Thr Val 1 5 10 15 Val Leu Ala Leu Ala Ala Ala Ala Ala Pro Ala Gln Ala Gly Pro Ser 20 25 30 Pro Ser Pro Gly Ser Ala Gly Leu Gly Asp Arg Leu Tyr Pro Leu Leu 35 40 45 Gly Asn Gly Gly Tyr Asp Val Leu Asp Tyr Asp Leu Arg Leu Arg Tyr 50 55 60 Pro Glu Lys Asp Pro Lys Gln Val Val Ser Gly Asp Val Thr Ile Thr 65 70 75 80 Ala Val Ala Gly Gln Ser Leu Ser Arg Phe Asp Leu Asp Phe Gly Gly 85 90 95 Ala Ser Ile Gly Arg Val Ser Val Asp Gly Gln Pro Ala Arg Ala Ala 100 105 110 Arg Asp Gly Asp Glu Leu Thr Val Ile Pro Arg Arg Pro Leu Pro Arg 115 120 125 Gly Arg Leu Phe Arg Val Thr Val Ala Asn Phe Thr Ala Ala Pro Ala 130 135 140 Ala Leu Val Ala Thr Pro Asp Gly Thr Val Leu Ala Ala Gln Pro Gly 145 150 155 160 Ser Ala His Leu Leu Phe Pro Gly Asn Asp His Pro Arg Asp Lys Ala 165 170 175 Thr Phe Thr Ile Thr Leu Thr Val Pro Ala Gly Trp Thr Gly Thr Ala 180 185 190 Asn Gly Thr Leu Val Ser Thr Thr Glu His Asp Gly His Val Ser Ser 195 200 205 Val Tyr Arg Glu Ser Ala Pro Met Ala Thr Glu Leu Val Gln Thr Ala 210 215 220 Val Gly Asp Phe Val Val Glu Arg Arg Pro Ala Ala Gly Gly Thr Pro 225 230 235 240 Ile Arg Asp Val Val Pro Arg Arg Leu Ala Gly Thr Leu Leu Pro Ala 245 250 255 Ile Ala Gly Glu Arg Glu Gln Leu Ala Trp Met Glu Lys Gln Ala Gly 260 265 270 Pro Tyr Pro Phe Glu Asp Tyr Gly Ser Leu Val Ile Asp Asp Asp Leu 275 280 285 Gly Tyr Ala Leu Glu Thr Gln Thr Leu Ser Leu Tyr Gly Ala Ala Leu 290 295 300 Phe Thr Gly Pro Glu Thr Thr Arg Gly Pro Ser Met Thr His Glu Leu 305 310 315 320 Ala His Gln Trp Phe Gly Asp Ser Val Ser Pro Phe Ser Trp Ser Asp 325 330 335 Val Trp Leu Asn Glu Gly His Ala Thr Trp Tyr Glu Met Leu Trp Ser 340 345 350 Glu Glu Thr Gly Gly Phe Pro Gln Tyr Thr Gly Leu Ala Asp Arg Glu 355 360 365 Ala Phe Phe Lys Ala Val Tyr Ala Ala Gly Asp Ile Phe Arg Ala Arg 370 375 380 Tyr Gly Pro Val Ala Ala Pro Leu Asp Ala Ala Thr Thr Trp Asp Val 385 390 395 400 Phe Asn Pro Asn Val Tyr Ala Gly Gly Ala Leu Val Leu Tyr Ala Leu 405 410 415 Arg Gln Lys Ile Gly Ala Ala Thr Phe Gln Arg Val Glu Arg Ala Trp 420 425 430 Leu Thr Thr Tyr Arg Gly Arg Ser Ala Ser Thr Gly Asp Phe Ile Thr 435 440 445 Leu Ala Ser Arg Val Ala Arg Gln Asp Leu Arg Pro Phe Leu Thr Ser 450 455 460 Trp Leu Leu Gly Val Thr Thr Pro Pro Met Pro Asn His Pro Asp Trp 465 470 475 480 Val Val Thr Pro Gly Ser 485 <210> 211 <211> 286 <212> PRT <213> Actinoplanes liguriae <400> 211 Met Asp Ser Pro Arg Leu Asn Gly Glu Asp Pro Arg His Thr Glu Val 1 5 10 15 Leu Ala Gly Phe Gly Ala Glu Leu Pro Pro Ile Val Val His Arg Ala 20 25 30 Thr Met Arg Val Ile Asp Gly Ala His Arg Leu Ser Ala Ala Arg Leu 35 40 45 Arg Gly Asp Asp Arg Ile Arg Ala Val Leu Phe Asp Gly Thr Glu Gln 50 55 60 Glu Ala Tyr Val Leu Ser Val Lys Ala Asn Val Thr His Gly Leu Pro 65 70 75 80 Leu Ser Ala Ala Glu Arg Thr Arg Ala Ala Glu Arg Ile Ile Thr Met 85 90 95 His Pro Asp Trp Ser Asp Arg Met Ile Ala Ala Ser Ser Gly Leu Gly 100 105 110 Ala Arg Thr Val Gly Gly Leu Arg Arg Arg Arg Ala Ala Ser Gly Glu 115 120 125 Ser Pro Ala Gly Leu Arg Ser Arg Ala Gly Arg Asp Ser Arg Val Arg 130 135 140 Pro Ala Gly Ser Thr Ala Gly Arg Leu Lys Ala Val Asp Tyr Leu Gln 145 150 155 160 Asp Arg Pro Asp Ala Ser Leu Arg Glu Ile Ala Arg His Ala Gly Val 165 170 175 Ser Pro Ser Thr Ala Arg Asp Val Arg Asp Arg Leu His Arg Gly Glu 180 185 190 Asp Pro Ile Pro Ala Thr Gln Arg Ala Ala Ala Arg Pro Gly Asn Asp 195 200 205 Ser Pro Pro Leu Arg Ser Leu Val Gln Gly Leu Ala Ser Asp Pro Ser 210 215 220 Leu Arg Phe Ser Glu Ser Gly Arg Asp Leu Leu Arg Trp Leu Ile Ala 225 230 235 240 His Ala Val Gln Asp Gly Glu Trp Lys Gly Leu Val Asp Thr Ile Pro 245 250 255 Ala His Ser Ala Gln Ala Leu Ala Lys Ile Ala Arg His Cys Ser Arg 260 265 270 Glu Trp Arg Glu Phe Ala Asp Ile Leu Glu Lys Asp Ala Ala 275 280 285 <210> 212 <211> 64 <212> PRT <213> Actinoplanes liguriae <400> 212 Met Ser Ala Ile Thr Val Glu Thr Thr Trp Lys Asn Thr Asp Leu Arg 1 5 10 15 Glu Asp Leu Thr Ala His Pro Ala Gly Leu Gly Phe Gly Glu Leu Ser 20 25 30 Phe Glu Asp Leu Arg Glu Asp Arg Thr Ile Tyr Ala Ala Ser Ser Gly 35 40 45 Trp Val Cys Thr Leu Thr Ile Glu Cys Gly Thr Leu Val Cys Ala Cys 50 55 60 <210> 213 <211> 1046 <212> PRT <213> Actinoplanes liguriae <400> 213 Met Ser Ser Phe Ala Ile Ala Ala Ser Pro Ala Ser Ala Tyr Leu His 1 5 10 15 Glu Arg Ser Ala Gly Pro Gly Gly Asp Pro Val Ala Glu His Glu Arg 20 25 30 Val Glu Ser Trp Arg Glu Ser Ala Phe Leu Asp Asp Pro Val Leu Asp 35 40 45 Ile Arg Leu Arg Glu Leu Gly Leu Ser Arg Ala Glu Phe Gly Arg Leu 50 55 60 Leu Thr Asp Gly Ala Tyr Asp Ala Gly Ser Thr Ala Leu Asp Trp Ala 65 70 75 80 Gly Glu Leu Ala Ala Val Leu Ala Thr Gly Thr Gly Ala Val Thr Gly 85 90 95 Leu Ala Arg Ser Thr Lys Leu Trp Ala Gln Gly Phe Asp Arg Leu Pro 100 105 110 Phe Ala Gly Leu Ile Glu Arg Phe Leu Ala Tyr Tyr Glu Pro Arg Val 115 120 125 Pro Arg Thr Ala Gly Thr Val Arg Val Ser Leu Leu Glu Ser Leu Ala 130 135 140 Asn Arg Leu Leu Thr Val Ala Thr Arg Thr Leu Leu Leu Glu Leu Asn 145 150 155 160 Val Ala Arg Val His Gly Arg Leu Thr Gly Ala Thr Pro Gly Glu Arg 165 170 175 Tyr Asp His Tyr Asp Arg Val Leu Leu Thr Asp Pro Asp Tyr Leu Arg 180 185 190 Ser Leu Phe Gly Glu Tyr Pro Val Leu Gly Arg Ala Met Val Glu Cys 195 200 205 Gly Arg Arg Trp Ala Ser Ala Met Ala Glu Leu Phe Gln Arg Leu Asp 210 215 220 Ala Asp Arg Pro Ala Leu His Ala Ala Gly Leu Leu Pro Ala Gly Ala 225 230 235 240 Gly Glu Val Thr Ala Leu Arg Pro Asp Leu Gly Asp Pro His Asn Ser 245 250 255 Gly Arg Ala Val Ala Ile Leu Thr Phe Arg Ser Gly Ala Gln Leu Val 260 265 270 Tyr Lys Pro Arg Pro Val Gly Pro Glu Arg Ala Tyr Ala Glu Thr Ala 275 280 285 Ala Ala Leu Asn Arg His Gly Leu Ser Leu Pro Leu Thr Ala Val Asp 290 295 300 Val Leu Asp Arg Gly Ala Tyr Gly Trp Cys Glu Leu Val Arg His Glu 305 310 315 320 Pro Cys Ala Asp Arg Ala Asp Leu Asp Arg Phe Tyr Arg Arg Thr Gly 325 330 335 Ala Val Leu Ala Thr Thr Leu Leu Leu Gly Ala Val Asp Val His Met 340 345 350 Glu Asn Val Ile Ala Ala Gly Ser Ser Cys Met Pro Ile Asp Leu Glu 355 360 365 Thr Leu Leu Gln Pro Gly Val Pro Ser Gly Asp Ala Thr Asp Ala Tyr 370 375 380 Thr Arg Ala Leu Asp Leu Leu Asn Gln Ser Val Leu Ala Ile Gly Ile 385 390 395 400 Leu Pro Ala Arg Ala Phe Gly Gly Arg Glu Arg Lys Ser Val Asp Val 405 410 415 Ser Ala Ile Gly Gly Gly Glu Ala Gln Thr Ala Pro Arg Pro Val Pro 420 425 430 Met Val Val Glu Pro Phe Thr Asp Val Ala Arg Ile Glu Ala Val Glu 435 440 445 Ala Thr Met Leu Gly Ala Gln Asn Arg Pro Val Leu Val Gly Ala Glu 450 455 460 Val Arg Pro Glu Glu His Thr Glu Ala Val Val Ala Gly Phe Thr Glu 465 470 475 480 Ala Tyr Asp Leu Ile Val Arg His Arg Glu Asp Phe Ala Asp Leu Leu 485 490 495 Ala Gly Phe Gly Asp Val Glu Val Arg Tyr Leu Pro Arg Pro Thr Arg 500 505 510 Arg Tyr Ser Met Phe Leu Thr Glu Ser Tyr His Pro Asp Tyr Leu Arg 515 520 525 Asp Ala Arg Asp Arg Asp Arg Leu Leu Asp Lys Leu Trp Thr Ala Ala 530 535 540 Gly Ala Arg Pro Asp Leu Ile Pro Ile Ile Glu Ser Glu Lys Arg Gln 545 550 555 560 Leu Leu Ala Gly Asp Ile Pro Cys Phe Arg Ala Leu Ala Gly Asp Arg 565 570 575 Ala Ile Arg Thr Ala Ser Ala Pro Val Ala Pro Asp Phe Phe Asp Ala 580 585 590 Pro Gly Ile Glu Val Leu Ala Gly Arg Leu Arg Gln Phe Gly Pro Val 595 600 605 His Arg Ala Ala Gln Leu Arg Ile Ile Arg Glu Ser Met Gly Thr Met 610 615 620 Pro Ala Pro Gly Pro Ile Ala Gly Thr Pro Ala Pro Ser Ser Glu Arg 625 630 635 640 Arg Gly Gly Leu Asp Pro Arg Glu Ala Ala Thr Leu Gly Asp Arg Leu 645 650 655 Val Arg Glu Leu Ala Asp Glu Ala Ile Leu Gly Ala Asp Asp Ala Gly 660 665 670 Trp Ile Gly Val Ser Ile Glu Gly Leu Asp Gln Glu Thr Phe Ser Tyr 675 680 685 Lys Pro Met Ala Thr Gly Leu Tyr Asp Gly Ile Ala Gly Met Ala Leu 690 695 700 Thr Tyr Ala Tyr Ala Ala Arg Thr Leu Gly Asp Glu Arg Tyr Leu Asp 705 710 715 720 Leu Thr Arg Arg Thr Val Lys Leu Val Ser Gly Tyr Leu Arg Tyr Leu 725 730 735 Ala Glu His Arg Ile Val Glu Thr Val Gly Ala Tyr Ser Gly Met Ala 740 745 750 Gly Leu Leu Tyr Thr Leu Asp His Val Ala His Ala Thr Gly Asp Ala 755 760 765 Ser Leu Leu Gly Glu Ile Glu Ala Ala Leu Pro Trp Leu Arg Glu Cys 770 775 780 Ala Thr Arg Glu Glu Cys Pro Asp Leu Ile Ala Gly Leu Ala Gly Cys 785 790 795 800 Ala Val Val Ala Leu Ser Leu Tyr Arg Arg His Gly Ile Ala Gly Tyr 805 810 815 Arg Glu Val Ala Glu Ile Cys Gly Arg Arg Leu Ala Gly Thr Ala Val 820 825 830 Asp Val Glu Gly Ala Ala Gly Trp Ala Ala Thr Arg Thr Gly Val Ile 835 840 845 Leu Gly Gly Phe Ser His Gly Ser Ala Gly Ile Ala Trp Ala Leu His 850 855 860 Glu Leu Ala Ala Glu Phe Gly Asp Arg Asp Leu Arg Glu Leu Ala Asp 865 870 875 880 Arg Ala Val Glu Phe Asp Arg Arg Leu Tyr Val Pro Ala Ala Gly Ala 885 890 895 Trp Arg Asp Leu Arg Pro Glu Met Ala Gly Thr Asp Gly Tyr Pro Ala 900 905 910 Leu Trp Cys His Gly Ala Ala Gly Ile Gly Leu Ser Arg Leu Leu Ile 915 920 925 His Arg Ile Arg Pro Asp Glu Arg Leu Ala Glu Glu Ala Arg Ala Ala 930 935 940 Val Ala Leu Val Arg Arg His Gly Phe Gly His Asn His Ser Leu Cys 945 950 955 960 His Gly Asp Phe Gly Ala Leu Ala Leu Leu Gly Leu Ala Asp Arg Ala 965 970 975 Trp Pro Gly Ser Gly Gly His Asp Glu Arg Ala Gly Ala Val Val Arg 980 985 990 Asp Ile Gly Glu Thr Gly Leu Arg Cys Gly Leu Gly Asn Gly Ile Arg 995 1000 1005 Met Pro Gly Leu Met Leu Gly Ala Ala Gly Ala Gly Leu Ser Leu 1010 1015 1020 Leu Arg Leu Ala Ala Pro Ala Asp Val Pro Ala Val Thr Trp Leu 1025 1030 1035 Glu Pro Pro Arg Gly Thr His Val 1040 1045 <210> 214 <211> 575 <212> PRT <213> Actinoplanes liguriae <400> 214 Met Ser Glu Thr Ala Gly Leu Leu Arg Arg Ser Leu Leu Asp His Arg 1 5 10 15 Gly Lys Leu Ala Ala Val Ala Gly Leu Ala Val Ala Gly Val Gly Cys 20 25 30 Gln Leu Gly Gln Pro Phe Leu Ile Arg Arg Val Leu Thr Ala Val Gln 35 40 45 Ser Ala Gln Pro Tyr Arg Gln Leu Ala Leu Ala Val Leu Ala Val Met 50 55 60 Val Val Gly Ala Ala Leu Gly Ala Val Gln Gln Phe Leu Leu Gln Arg 65 70 75 80 Thr Gly Glu Ala Met Val Phe Thr Val Arg Arg Thr Leu Val Ala His 85 90 95 Leu Leu Arg Leu Pro Val Ala Ala Tyr Asp Glu Arg Gln Ser Gly Asp 100 105 110 Leu Val Ser Arg Val Gly Ala Asp Thr Ala Gln Val Arg Ser Val Ile 115 120 125 Thr Ser Gly Val Val Asp Leu Ala Gly Gly Val Leu Leu Val Gly Gly 130 135 140 Ser Ile Ala Gly Met Ile Ile Ile Asp Pro Val Leu Leu Gly Val Ser 145 150 155 160 Leu Ala Pro Val Leu Cys Gly Ala Ala Gly Val Arg Leu Val Gly Arg 165 170 175 Arg Leu Arg Pro Leu Ser Ser Ala Val Gln Glu Ser Ile Gly Ala Leu 180 185 190 Thr Ala Ser Thr Thr Arg Ala Leu Gly Ala Ile Arg Thr Ile Arg Val 195 200 205 Ala Gly Ala Thr Glu Arg Glu Thr Ala Leu Ile Val Ala Glu Ala Asp 210 215 220 Arg Ala Arg Ala Ala Gly Val Arg Leu Ala Leu Val Ala Ala Gln Ala 225 230 235 240 Gly Pro Ile Val Arg Leu Ala Leu Gln Gly Ala Phe Val Ala Val Ile 245 250 255 Gly Phe Gly Gly Tyr Arg Val Ala Asn Gly Ala Val Ser Val Gly Asp 260 265 270 Leu Val Ala Phe Thr Leu Leu Leu Phe Thr Leu Ala Leu Pro Leu Ala 275 280 285 Gln Leu Ala Glu Ala Ala Thr Arg Ile Gln Thr Gly Leu Gly Ala Leu 290 295 300 Thr Arg Ile Glu Glu Ile Leu Ala Leu Pro Asp Glu Asp Ser Ala Leu 305 310 315 320 Gly Val Arg Ala Arg Thr Pro Ala Thr Val Arg His Asp Pro Val Leu 325 330 335 Leu Glu Phe Asp His Val Ser Phe Arg Tyr Pro Thr Gly Gly Glu Ile 340 345 350 Leu Arg Asp Val Ser Phe Arg Val Pro Ala Gly Ser Thr Thr Ala Leu 355 360 365 Val Gly Pro Ser Gly Ala Gly Lys Ser Thr Ile Leu Ala Leu Ile Ala 370 375 380 Arg Leu Tyr Glu Val His Gly Gly Arg Ile Leu Leu His Gly Arg Asp 385 390 395 400 Ile Arg Asp Tyr Pro Leu Ala Glu Leu Arg Ala Ala Leu Gly Tyr Val 405 410 415 Glu Gln Glu Ala Pro Val Leu Ala Gly Thr Val Arg Asp Asn Leu Thr 420 425 430 Leu Ala Ala Pro Asp Val Ala Glu His Ala Ile Arg His Val Thr Ala 435 440 445 Ser Val Asn Leu Asp Asp Leu Leu Ala Arg Asp Pro Ala Gly Leu Asp 450 455 460 Ala Pro Val Gly Asp Gly Gly Val Leu Phe Ser Gly Gly Glu Arg Gln 465 470 475 480 Arg Leu Ala Val Ala Arg Thr Leu Leu Ala Pro Gly Glu Leu Leu Leu 485 490 495 Phe Asp Glu Pro Thr Ala His Leu Asp Ala Arg Asn Glu Gln Ala Leu 500 505 510 Gln His Gly Leu Thr Ala His Ala Ala Gly Arg Thr Leu Val Val Val 515 520 525 Ala His Arg Leu Ala Thr Val Ala His Ala Asp Gln Ile Leu Val Ile 530 535 540 Asp Asp Gly Arg Ser Val Ala Ala Gly Arg His Glu Glu Leu Leu Val 545 550 555 560 Arg Asp Pro Thr Tyr Arg Glu Phe Ala Thr Arg Gln Leu Leu Thr 565 570 575 <210> 215 <211> 347 <212> PRT <213> Actinoplanes liguriae <400> 215 Met Leu Ser Val Leu Asp Gln Val Pro Val Phe Arg Gly Asp Asp Pro 1 5 10 15 Ala Glu Ala Val Arg Glu Ala Val Gly Leu Ala Arg Ala Ala Glu Ser 20 25 30 Leu Gly Tyr His Arg Phe Trp Ile Ala Glu His His Gly Ser Ala Ala 35 40 45 Asn Ala Cys Ala Ala Pro Glu Ile Val Ala Ala Ala Val Ala Gly Ala 50 55 60 Thr Glu Arg Ile Arg Val Gly Thr Gly Gly Val Leu Leu Pro Tyr Tyr 65 70 75 80 Ser Pro Leu Lys Val Ala Glu Ala Phe Arg Val Leu Ala Ala Leu Tyr 85 90 95 Pro Gly Arg Ile Asp Leu Gly Phe Gly Arg Gly Arg Gly Gly Pro Ala 100 105 110 Val Met Ala Glu Leu Leu Asn Pro Tyr Ala Ile Ala Thr Glu Glu Ala 115 120 125 Tyr Ala Glu Gln Val Gly Arg Leu Leu Ala Phe Leu Gly Asp Ala Arg 130 135 140 Thr Val Ser Arg Val Ser Val Thr Pro Ala Val Gln Asp Pro Pro Leu 145 150 155 160 Pro Trp Leu Leu Gly Ser Gly Val Gly Ser Ala Arg Leu Ala Gly Met 165 170 175 Leu Gly Val Pro Phe Cys Phe Ala Gln Phe Ile Ala Thr Glu Glu Cys 180 185 190 Pro Glu Ala Ile Ala Ala Tyr Gln Glu Ser Phe Arg Ser Ser Pro Trp 195 200 205 Leu Asp Glu Pro Gln Ala Met Leu Ala Leu Arg Val Leu Ala Ala Gly 210 215 220 Thr Ala Glu Asp Ala Glu Glu Leu Ala Thr Gly Phe Trp Met Ser Cys 225 230 235 240 Thr Thr Gly Trp Arg Ala Gln Val Arg Pro Asp Asp Asp Tyr Arg Gly 245 250 255 Gly Val Pro Asn Leu Ala Asp Ala Gln Arg Tyr Thr Leu Thr Glu Glu 260 265 270 Asp Leu Ala Met Arg Ala Ser Arg Pro Tyr Leu Gln Ile Ser Gly Thr 275 280 285 Ala Glu Thr Val Gly Glu Glu Ile Arg Arg Leu Arg Lys Val Tyr Asp 290 295 300 Val Ala Glu Val Met Leu Thr Thr Asn Cys Pro Gly Ala Ala Ala Pro 305 310 315 320 Ala Pro Val Leu Arg Ala Ala Gly Arg Arg Ala Arg Ala Asp Arg Ala 325 330 335 Gly Val Thr Arg Val Arg Pro Ala Arg Arg Trp 340 345 <210> 216 <211> 217 <212> PRT <213> Actinoplanes liguriae <400> 216 Met Ala Asp Val Leu Val Val Ala Glu Glu Ala Leu Val Ser Ile Gly 1 5 10 15 Ile Lys Met Ile Leu Glu Thr Met Gly Gly Phe Ser Val Val Ala Ala 20 25 30 Asp Arg Asp Ser Ala Leu Ala Ala Val Ser Glu His Arg Pro Ala Val 35 40 45 Val Leu Leu Asp Ala His Ala Thr Leu Pro Glu Ser Val Pro Leu Leu 50 55 60 Thr Arg Leu Arg Asp Leu Glu Ser Gly Pro Ala Leu Ala Val Leu Ala 65 70 75 80 Thr Leu Ala Ala Ser Ser Thr Val Leu Glu Ser Leu Arg Gly Gly Ala 85 90 95 Cys Gly Phe Leu Leu Lys Asp Ser Gln Pro Glu Gln Leu Val Ala Ala 100 105 110 Val Arg Ala Leu Ala Ser Gly Val Thr Val Leu Ala Pro Glu Ala Ser 115 120 125 Ser Ile Met Leu Gly Ala Ala Cys Arg Gly Thr Pro Ala Ala Glu Asn 130 135 140 Ala Val Asp Glu Val Lys Gln Leu Ser Asp Arg Glu Gln Ala Val Leu 145 150 155 160 Gly Leu Ile Gly Gln Gly Leu Thr Asn Ala Glu Ile Ala Gly Arg Leu 165 170 175 Phe Ile Ser Asp Ser Thr Val Lys Glu Tyr Val Ser Val Ile Leu Arg 180 185 190 Lys Leu Gly Val Ala Asn Arg Val Gln Ala Ala Val Leu Ala Tyr Ala 195 200 205 Ala Gly Leu Thr Thr Asp Glu Leu Ala 210 215 <210> 217 <211> 814 <212> PRT <213> Actinoplanes liguriae <400> 217 Met Ile Phe Thr Leu Ala Trp Ser Gln Val Arg Ser His Pro Gly Arg 1 5 10 15 Leu Leu Ala Ile Val Ala Ala Val Val Leu Ala Thr Gly Phe Leu Ala 20 25 30 Ala Thr Ala Thr Phe Ala Ser Thr Ser Asp Glu Gly Leu Arg Leu Thr 35 40 45 Ala Ala Ala Pro Leu Thr Thr Ala Asp Ile Val Leu Asp Ala Asp Asp 50 55 60 Thr Val His Asp Pro Gln Trp Tyr Gln Ala Ala Ala Gly Val Arg Gly 65 70 75 80 Val Arg Ser Val Asp Pro Gln Tyr Ala Arg Thr Val Ser Val Phe Gly 85 90 95 Gly Asp Arg Arg Gly Ser Ala Asn Val Gln Ser Ile Pro Ala Thr Ala 100 105 110 Ser Val Arg Trp Phe Thr Val Asp Glu Gly Thr Trp Pro Ser Ala Ala 115 120 125 Gly Gln Val Val Ala Asp Arg Arg Thr Leu Thr Asp Leu Gly Val Gly 130 135 140 Val Gly Ala His Leu Asp Phe Arg Gln Gly Thr Ala Ala Pro Val Pro 145 150 155 160 Val Thr Val Val Gly Ser Ala Asp Leu Gly Phe Arg Pro Leu Thr Gly 165 170 175 Ser Asp Tyr Arg Phe Tyr Ala Ala Ala Ser Phe Phe Ala Gly Asp Thr 180 185 190 Pro Pro Ala Ala Leu Leu Thr Val Thr Asp Arg Asp Arg Leu Ala Glu 195 200 205 Thr Val Asp Ala Val Gly Arg Ala Leu Pro Pro Gly Ala Thr Ala Thr 210 215 220 Asp Ala Ser Ala Ala Ala Asp Ala Ala Ala Gly Arg Phe Ala Gly Gly 225 230 235 240 Asn Thr Gln Leu Val Val Leu Met Leu Ala Phe Ala Ala Val Ala Leu 245 250 255 Leu Ala Ser Ile Leu Val Ile Ala Asn Thr Phe Gln Val Ile Val Ser 260 265 270 Gln Arg Val Arg Gln Val Ala Leu Leu Arg Leu Val Gly Gly His Arg 275 280 285 Arg Gln Val Ser Arg Val Val Leu Ala Glu Ala Ala Ile Ala Gly Ser 290 295 300 Ile Gly Ala Val Ile Gly Ala Val Ala Gly Val Gly Leu Gly Tyr Leu 305 310 315 320 Gly Ala Gly Leu Leu Asp Ile Asn Gly Gly Gly Leu Ala Val Asn Pro 325 330 335 Ile Val Leu Ala Leu Cys Val Leu Thr Gly Val Gly Ala Thr Val Val 340 345 350 Ala Ala Trp Ala Pro Ala Arg Arg Ala Thr Arg Val Pro Pro Val Arg 355 360 365 Ala Leu Gln Glu Val Pro Asp Ala Leu Pro Ala Gln Val Arg Gly Gly 370 375 380 Arg Arg Leu Val Ala Gly Leu Ile Leu Ile Gly Leu Ala Val Gly Val 385 390 395 400 Leu Gly Leu Ala Ala Ile Gly Thr Ser Leu Pro Leu Ala Leu Val Gly 405 410 415 Gly Val Leu Leu Ala Ala Gly Leu Leu Thr Ala Leu Pro Leu Gly Ile 420 425 430 Ala Leu Leu Leu Pro Pro Ala Ala Arg Gly Leu Glu Arg Phe Gly Val 435 440 445 Ala Ala Ser Leu Ala Gly Ser Asn Leu Arg Gln Asn Ala Arg Arg Thr 450 455 460 Ala Ser Ala Thr Met Ala Val Val Val Gly Ala Ala Leu Ile Thr Gly 465 470 475 480 Leu Ala Val Ala Ser Ala Ser Gly Arg Ala Thr Val Glu Ala Asp Leu 485 490 495 Glu Ala Arg Tyr Pro Val Ala Val Ser Val His Thr Asp Gly Ala Ala 500 505 510 Ile Asp Asp Arg Thr Val Arg Ala Leu Ser Gly Ile Thr Gly Leu Thr 515 520 525 Thr Ala Thr Val Ala Thr Ser Ala Ala Thr Phe Pro Ala Ala Gly Lys 530 535 540 Pro Thr Pro Ala Arg Ile Ala Ala Leu Pro Thr Asp Val Ala Gly Arg 545 550 555 560 Leu Ala Pro Glu Leu Ser Ala Ser Thr Gly Asp Pro Val Leu Leu Val 565 570 575 Pro Ala Ser Tyr Leu Thr Ala Arg Gly Leu Thr Asp Gly Ala Pro Leu 580 585 590 Thr Val Thr Ala Gly Gly Arg Asp Leu Arg Phe Thr Ala Arg Gly Ser 595 600 605 Arg Leu Ala Asp Thr Thr Gly Gln Leu Leu Gly Val Thr Thr Gly Asp 610 615 620 Val Leu Thr Ala Ala Gly Val Arg Thr Val Pro Thr Thr Val Trp Gly 625 630 635 640 Thr Ala Pro Gly Gly Phe Asp Arg Glu Thr Leu Ala Ala Asp Val Asn 645 650 655 Ala Val Ala Ala Arg Asp Ala Gly Val Glu Val Gly Gly Gly Val Thr 660 665 670 Glu Gly Gly Asp Ile Met Asn Val Leu Ser Ile Leu Leu Gly Leu Ser 675 680 685 Leu Gly Met Leu Ala Val Thr Val Val Ile Ala Leu Leu Gly Ile Ala 690 695 700 Asn Leu Leu Gly Leu Ser Val Ile Glu Arg Thr Arg Glu Met Ala Leu 705 710 715 720 Leu Arg Ala Leu Gly Thr Arg Arg Ser Arg Leu Arg Ala Met Val Ala 725 730 735 Val Glu Ala Val Thr Ile Thr Leu Val Gly Thr Val Ala Gly Ile Val 740 745 750 Ile Gly Val Pro Val Gly Leu Val Gly Val Ile Ala Ala Val Gly Arg 755 760 765 Gln Ala Glu Pro Val Ile Met Leu Ala Trp Pro Gln Leu Gly Leu Val 770 775 780 Leu Val Ala Ala Ala Val Thr Gly Val Leu Ala Ser Leu Ala Pro Ala 785 790 795 800 Arg Arg Ala Thr Arg Ile Ala Pro Ala Glu Gly Leu Val Arg 805 810 <210> 218 <211> 240 <212> PRT <213> Actinoplanes liguriae <400> 218 Met Val Ser Cys Arg Asn Leu Arg Lys Arg Tyr Gly Thr Gly Asp Ala 1 5 10 15 Ala Val Val Ala Val Asp Gly Val Ser Thr Ser Phe Ala Ala Gly Glu 20 25 30 Phe Thr Ala Ile Met Gly Pro Ser Gly Ser Gly Lys Thr Thr Leu Met 35 40 45 His Leu Leu Ala Gly Leu Asp Thr Pro Thr Glu Gly Glu Val Ser Leu 50 55 60 Ala Gly Thr Ala Leu Ala Gly Leu Asp Asp Arg Ala Leu Thr Asp Leu 65 70 75 80 Arg Arg Asp Arg Val Gly Phe Ile Phe Gln Ala Phe Asn Leu Leu Pro 85 90 95 Thr Leu Thr Ala Glu Gln Asn Ile Val Leu Pro Leu Arg Leu Ala Gly 100 105 110 Arg Pro Val Asp Arg Asp Arg Leu Gln Arg Ile Ala Ala Ser Leu Gln 115 120 125 Ile Gly Asp Arg Leu Gly His Arg Pro Ala Glu Leu Ser Gly Gly Gln 130 135 140 Gln Gln Arg Val Ala Val Ala Arg Ala Leu Leu Thr Glu Pro Ser Val 145 150 155 160 Val Phe Ala Asp Glu Pro Thr Gly Ala Leu Asp Ile Ala Thr Gly Arg 165 170 175 Ala Leu Leu Ala Gly Leu Gln Asn Ala Ala Arg Gln Ala Ser Gln Thr 180 185 190 Ile Ile Met Val Thr His Asp Ala Ala Ala Ala Thr Tyr Ala Asp Arg 195 200 205 Val Leu Ile Met Ala Asp Gly Arg Leu Trp Asp Glu Leu Arg Ala Pro 210 215 220 Thr Leu Glu Ser Ile Met Ser Val Met Ala Ser Val Thr Val Thr Ser 225 230 235 240 <210> 219 <211> 362 <212> PRT <213> Actinoplanes liguriae <400> 219 Val Ile Ala Gly Ala Ala Val Met Val Cys Leu Leu Leu Gly Leu Ala 1 5 10 15 Gly Leu Asp Glu Trp Tyr Trp Ser Ala Ala Leu Cys Val Pro Leu Val 20 25 30 Ile Arg Arg Ser Ala Pro Val Val Phe Leu Ala Leu Val Ala Val Leu 35 40 45 Ser Gly Ile His Met Ile Tyr Ser Gly Ser Phe Ala Phe Pro Gly Asp 50 55 60 Leu Val Asp Leu Val Ala Val His Ala Val Ala Gly Tyr Gly Pro Ala 65 70 75 80 Arg Val Arg His Leu Gly Leu Leu Leu Gly Val Ala Gly Ser Leu Val 85 90 95 Val Thr Ala Arg Ala Leu His Asp Gly Leu Pro Ser Ser Ala Thr Leu 100 105 110 Pro Ala Ala Leu Ile Val Ala Ala Thr Leu Ala Ala Trp Ser Thr Gly 115 120 125 Leu Met Gln Arg Arg Gln Arg Ala Asp Val Ile Glu Ala Asp His Arg 130 135 140 Arg Arg Leu Ala Glu Gln Asp Ser Ala Met Arg Ala Arg Leu Ala Ala 145 150 155 160 Ile Glu Glu Arg Thr Arg Ile Ser Gln Glu Met His Asp Ile Ile Ala 165 170 175 His Ser Leu Ala Ser Val Ile Ala Gln Ala Glu Gly Gly Arg Val Ala 180 185 190 Ala Arg Ala Asp Ala Val Val Ala Gly Pro Leu Phe Asp Arg Ile Ala 195 200 205 Gln Ile Gly Arg Glu Ala Leu Asn Asp Val Lys Arg Leu Leu Asn Ser 210 215 220 Ile Asp Gly Asp Thr Pro Asp Asp Phe Ala Gln Gly Leu Pro Asp Leu 225 230 235 240 Pro Gly Leu Leu Ala Gly Val Ser Ala Ala Gly Leu Asp Val Thr Phe 245 250 255 Glu Val Ala Gly Pro Glu Gln Pro Leu Ala Ser Gly Met Asp Leu Ala 260 265 270 Val Tyr Arg Val Ile Gln Glu Ser Leu Thr Asn Val Leu Lys His Ala 275 280 285 Thr Gln Arg Gln Ala Arg Leu Ser Leu Val Trp Thr Pro Ala Trp Leu 290 295 300 Glu Val Ser Val Thr Ser Pro Leu Thr Phe Ala Gly Ala Leu Arg Glu 305 310 315 320 Gly Arg Gly Leu Ser Gly Ile Arg Gln Arg Cys Ser Leu Phe Asn Gly 325 330 335 Asp Cys Glu Ile Val Ala Gly Gln Thr Phe Ser Val Ile Thr Arg Trp 340 345 350 Pro Leu Ala Arg Pro Glu Val Ala Val Pro 355 360 <210> 220 <211> 218 <212> PRT <213> Actinoplanes liguriae <400> 220 Met Thr Glu Pro Gln Ile Asp Val Val Ile Ala Asp Asp Gln Asp Leu 1 5 10 15 Val Arg Thr Gly Phe Ala Leu Val Val Asp Ser Ala Pro Asp Met Arg 20 25 30 Val Val Ala Thr Ala Ala Asp Gly Ala Glu Val Val Arg Leu Ala Ala 35 40 45 Glu Phe Arg Pro Asp Val Val Leu Met Asp Ile Arg Met Pro Arg Val 50 55 60 Asp Gly Ile Thr Ala Ala Arg Ala Ile Leu Glu Gly Asn Ala Gln Pro 65 70 75 80 Pro Lys Ile Val Ala Leu Thr Thr Tyr Asp Asn Asp Glu Tyr Ala Ser 85 90 95 Arg Ile Leu Ala Ala Gly Ala Ser Gly Tyr Leu Leu Lys Asp Thr Thr 100 105 110 Ala Glu Gly Leu Thr Ala Ala Ile Arg Thr Val His Arg Gly Gly Ser 115 120 125 Val Leu Ala Pro Ser Thr Thr His Arg Leu Val Thr Ala His Arg Gln 130 135 140 His Pro Ala Arg Pro Ser Ala Leu Leu Asp Ser Phe Thr Thr Arg Glu 145 150 155 160 Arg Glu Val Phe Asp Leu Ile Val Ala Gly Ala Ser Asn Ala Glu Ile 165 170 175 Ala Asp Arg Leu Asn Leu Ala Glu Val Thr Ile Lys Thr His Val Gly 180 185 190 Arg Val Leu Ala Lys Ile Gly Val Arg Asp Arg Val Asn Val Val Ile 195 200 205 Trp Ala Tyr Arg Asn Gly Ala Gly Pro Ser 210 215 <210> 221 <211> 301 <212> PRT <213> Actinoplanes liguriae <400> 221 Met Pro Ile Leu Trp Thr Ala Val Leu Ala Gly Ala Val Ile Leu Gly 1 5 10 15 His Arg Leu Val Pro Asn Ala Val Gly Asn Ala Gly Ser Leu Ile Glu 20 25 30 Ala Phe Leu Pro Trp Phe Gly Leu Ala Val Pro Val Leu Leu Leu Leu 35 40 45 Ala Leu Met Arg Arg Ser Leu Thr Gly Leu Ala Ala Val Leu Leu Pro 50 55 60 Leu Gly Ala Trp Leu Ile His Phe Gly Gly Tyr Val Val Asp Arg Asp 65 70 75 80 Thr Gly Thr Pro Asp Leu Ile Val Val Gln His Asn Val Ser Asp Glu 85 90 95 Asn Pro Asp Pro Ala Gly Thr Ala Arg Ala Leu Leu Ala Ala His Pro 100 105 110 Asp Leu Val Gly Leu Glu Glu Val Leu Pro Glu Ala Val Ala Ala Tyr 115 120 125 Arg Gly Val Leu Asp Ala Glu Leu Pro Phe His Thr Val Gln Gly Thr 130 135 140 Val Ala Leu Trp Ser Arg Tyr Pro Leu Thr Gly Ala Glu Ala Ile Asp 145 150 155 160 Ile Arg Pro His Asp Leu Gly Glu Asp Trp Asn Arg Gly Leu Arg Ala 165 170 175 Val Ala Arg Thr Pro Gly Gly Asp Thr Ala Val Tyr Val Ala His Leu 180 185 190 Pro Ser Val Arg Val Thr Ala Ala Gly Leu Thr Ser Ala Arg Arg Asp 195 200 205 Glu Ser Ala Arg Lys Leu Gly Ala Leu Leu Ala Ala Asp Pro Val Pro 210 215 220 Arg Leu Val Val Ile Gly Asp Leu Asn Thr Ser Val Asp Asp Arg Gly 225 230 235 240 Leu Arg Pro Ile Arg Gln Val Met Ile Asp Ser Pro Ala Asp Phe Ala 245 250 255 Phe Thr Trp Pro Ala Arg Thr Pro Val Ala Arg Ile Asp Gln Val Leu 260 265 270 Ala Arg Ser Met Thr Val Thr Arg Leu Thr Ala Leu Pro Arg Thr Gly 275 280 285 Ser Asp His Leu Pro Leu Ala Ala Glu Ile Arg Phe Pro 290 295 300 <210> 222 <211> 290 <212> PRT <213> Actinoplanes liguriae <400> 222 Met Arg Asn Asn Glu Thr Val Arg Ile Pro Val Ala Thr Gly Gly Ala 1 5 10 15 Val Thr Ala Thr Leu Phe Ala Pro Glu Ser Ala Arg Ala Val Leu Val 20 25 30 Val His Pro Ala Thr Ala Thr Pro Gln Gly Phe Tyr Ala Ser Phe Ala 35 40 45 Thr Tyr Leu Ala Glu Asn Gly Ile Ala Thr Val Thr Tyr Asp Tyr Arg 50 55 60 Gly Thr Gly Arg Ser Gly Ser Pro Arg Asp His Arg Asp Leu Gly Met 65 70 75 80 Arg Asp Trp Ile Gly Ala Asp Ala Pro Ala Val Ala Ala Trp Ala Ala 85 90 95 Asp Arg Phe Pro Gly Leu Pro Arg Leu Ala Ala Gly His Ser Leu Gly 100 105 110 Gly His Val Ile Ala Leu Gly Ala Ala Gly Pro Asp Leu Ala Ala Ser 115 120 125 Val Ile Val Ala Ser His Ile Ala Ala Leu Arg Thr Ile Pro Ser Arg 130 135 140 Leu Glu Arg Phe Arg Val Arg Ile Met Leu His Ile Leu Gly Pro Ala 145 150 155 160 Leu Gly Arg Leu Leu Gly Tyr Val Pro Ala Arg Ser Leu Gly Leu Gly 165 170 175 Glu Asp Leu Pro Ala Ala Ala Met Leu Glu Trp Gly Gly Trp Ala Arg 180 185 190 Arg Asp Asn Tyr Phe Phe Asp Asp Pro Ser Met Arg Ala Ala Glu Arg 195 200 205 Ala Ala Thr Leu Thr Gly Pro Val Leu Ala Val Gly Thr Thr Asp Asp 210 215 220 Pro Trp Ser Thr Pro Arg Gln Met Asp Ala Leu Thr Val His Leu Thr 225 230 235 240 Ser Ala Ser Val Glu Arg Arg Thr Tyr Ser Pro Ala Ala Ala Gly Val 245 250 255 Pro Val Ile Gly His His Gly Leu Phe Arg Arg Ala Val Arg Asp Thr 260 265 270 Val Trp Pro Glu Leu Leu Ala Trp Leu His Ala His Ser Glu Lys Ala 275 280 285 Ser Arg 290 <210> 223 <211> 145 <212> PRT <213> Actinoplanes liguriae <400> 223 Val Arg Leu Pro Arg Leu Ile Phe Leu Leu Phe Asn Ala Asp Arg Ala 1 5 10 15 Val Arg Arg Trp Ile Asp Ala Arg Ser Gly Asp Thr Gly Ile Gly Ala 20 25 30 Ser Gly Ala Gly Val Leu Phe Tyr Leu Ala Gly His Glu Asn Ala Leu 35 40 45 Ile Gly Asp Val Thr Ala Ala Leu Gly Ala Ser Pro Ser Gly Met Ser 50 55 60 Gly Leu Val Asn Arg Leu Glu Arg Gly Gly Cys Leu Thr Arg Ser Gln 65 70 75 80 Asp Pro Ala Asp Ala Arg Ala Val Arg Leu Ala Leu Thr Pro Arg Gly 85 90 95 His Gln Val Val Ile His Ala Arg Gly Leu Val Asp Asp Leu Asn Glu 100 105 110 Gln Leu Thr Ala Gly Phe Asp Asp Ala Glu Ile Ala Val Val Gln Arg 115 120 125 Trp Leu Glu His Val Thr Arg Val Ser Val Gln Arg Glu Glu Arg Leu 130 135 140 Gly 145 <210> 224 <211> 175 <212> PRT <213> Actinoplanes liguriae <400> 224 Met Ala Asp Ser Val Val Phe Asp Gln Ile Pro Val Val Arg Ala Ile 1 5 10 15 Gly Arg Gly Thr Thr Ser Leu Ser Ala Phe His Asp Ala Leu Val Thr 20 25 30 Met Glu Cys Gly Phe Tyr Asn Leu Val Arg Leu Ser Ser Val Ile Pro 35 40 45 Pro Gly Thr Ala Val Asp Pro Ser Gly Lys Ala Pro Val Pro Val Gly 50 55 60 Ala Trp Gly Asp Lys Leu Tyr Cys Val Tyr Ala Glu Gln His Ala Ser 65 70 75 80 Gln Pro Gly Glu Glu Ala Trp Ala Gly Ile Gly Trp Val Gln Arg Arg 85 90 95 Asp Gly Gln Gly Gly Leu Phe Val Glu His Glu Gly Thr Ser Glu Ser 100 105 110 Phe Val Arg Glu Ala Ile Lys Ala Ser Leu Arg Asp Leu Val Lys Gly 115 120 125 His Glu Asp Asp Phe Asp Gly Pro Asp Phe Val Val His Gly Val Val 130 135 140 Ser Asp Gly Glu Pro Val Cys Ala Met Val Leu Ala Pro Tyr Glu Thr 145 150 155 160 Ala Pro Trp Arg Gly Val Arg Ala Thr Asp Pro Pro Gly Met Asn 165 170 175 <210> 225 <211> 406 <212> PRT <213> Actinoplanes liguriae <400> 225 Met Thr Leu Ser Glu Ile Leu Pro Ser Leu Gly Ala Ser Leu Arg Pro 1 5 10 15 Arg Leu Asp Pro Ala Asn Trp Pro Leu Thr Ala Arg Trp Thr Glu Pro 20 25 30 Gly Asp Leu Thr Val Gly Gly Val Pro Val Thr Arg Ile Ala Ala Ala 35 40 45 His Gly Thr Pro Val His Val Ile Asp Glu Thr Asp Val His Ser Arg 50 55 60 Cys Ala Glu Tyr Val Ala Ala Phe Gly Pro Gly Ala Val Cys Cys Ser 65 70 75 80 Ala Lys Gly Gly Leu Leu Arg Gly Ala Ala Arg Trp Ile Ala Arg Asp 85 90 95 Gly Leu Gly Cys Tyr Cys Arg Ser Ala Ala Glu Leu Arg Thr Ala Leu 100 105 110 Asp Ala Gly Ile Arg Pro Glu Ser Leu Ala Leu Phe Gly Ser Gly Lys 115 120 125 Ser Val Ala Asp Leu Glu Ala Ala Leu Ser Cys Gly Ala Ala Val Val 130 135 140 Ile Gly Ser Ala Ser Glu Ala Glu Val Val Ala Ala Arg Ser Arg Pro 145 150 155 160 Gly Gln Arg Val Leu Leu Arg Val Arg Pro Gly Ser Ala Gln Arg Gly 165 170 175 Tyr Gly Val Arg Leu Asn Ser Ser Ala Ala Leu Ala Ala Val Ala Thr 180 185 190 Val Thr Arg Ser Arg Arg Leu Val Leu Ala Gly Leu Asp Cys Ser Leu 195 200 205 Gly His Arg Leu Asn Arg Phe Gly Thr Tyr Glu Ser Cys Leu Arg Glu 210 215 220 Ala Ile Gly Phe Val Ala Arg Leu Arg Thr Thr Val Pro Val Leu Asn 225 230 235 240 Leu Gly Gly Gly His Ala Ala Asp Leu Pro Val Gly Ile Phe Ala Ala 245 250 255 Arg Leu Arg Ala Val Ala Gln Val Thr Ser Glu Gly Tyr Gly Ile Glu 260 265 270 Pro Pro Glu Val His Val Ser Pro Gly Arg Ala Leu Leu Gly Arg Ala 275 280 285 Gly Ile Thr Val His Arg Val Val Ala Ala Gly Asp Gly Val Ile Glu 290 295 300 Leu Asp Gly Asp Val Pro Asp Cys Leu Pro Gly Ala Asp Cys Ala Gly 305 310 315 320 Leu His Thr Ala Ala Leu Ile Gly Arg Ala Ser Pro Ala Pro Gly Arg 325 330 335 Ser Ile Thr Val Arg Cys Gly Asp Ala Thr Val Ala Val Ala Glu Leu 340 345 350 Pro Gly Asp Met Ala Ala Gly Asp Leu Val Ala Leu Ser Gly Thr Gly 355 360 365 Ala Tyr His Gln Arg Arg Asp Val Tyr Val Gly Arg Pro Ala Val Val 370 375 380 Ala Val Cys Gly Gly Arg Ala Arg Thr Leu Leu Pro Arg Glu Thr Ile 385 390 395 400 Asp Arg Ile Leu Tyr Ala 405 <210> 226 <211> 309 <212> PRT <213> Actinoplanes liguriae <400> 226 Val Arg Ser Lys Arg Glu His Ser Ala Asp Ile Arg Arg Gly Arg Arg 1 5 10 15 Ala Val Leu Val Val Asn Thr Arg Ser Arg Arg Gly Arg Leu Leu Tyr 20 25 30 Glu Glu Ala Arg Arg Arg Leu Val Glu Ala Gly Phe Glu Leu Leu Gly 35 40 45 Thr Tyr Ala Leu Glu Gln Ser Gly Gly Leu Asp Gly Leu Ile Ser Glu 50 55 60 Ala Leu Arg Lys Glu Pro Asp Leu Leu Ile Ala Gly Gly Gly Asp Gly 65 70 75 80 Thr Ile Ser Thr Ala Gly Arg Met Leu Ala His Arg Asp Val Ala Leu 85 90 95 Gly Val Leu Pro Leu Gly Thr Thr Asn Asn Phe Ala Arg Thr Val Arg 100 105 110 Ile Glu Pro Asp Leu Glu Ala Ala Ile Ala Thr Leu Val Asp Gly Lys 115 120 125 Val Ile Asp Val Asp Leu Gly Val Ala Gly Asp Val Pro Phe Thr Asn 130 135 140 His Val Gly Ile Gly Leu Ser Gly Glu Val Met Ile Ser Ala Pro Pro 145 150 155 160 Arg Leu Lys Arg Ala Val Gly Arg Leu Ala Tyr Pro Met Thr Ala Leu 165 170 175 Gly Leu Leu Ala Arg His Arg Pro Val Arg Ala Val Ile Arg Ala Glu 180 185 190 Gly Arg Glu Leu Arg Phe His Thr His Gln Val Tyr Val Ala Asn Gly 195 200 205 Gly Phe His Ala Gly Arg Pro Ile Thr Ala Asp Ala His Ala Asp Asp 210 215 220 Arg Leu Leu Val Ala Tyr Pro Val Gly Gly Ala Ser Arg Arg Glu Leu 225 230 235 240 Leu Arg Glu Thr Ala Arg Asn Ala Ala Thr Gly His Arg Arg Thr Leu 245 250 255 His Glu Arg Pro Phe Ile Ala Val Arg Glu Leu Trp Leu Glu Thr Asp 260 265 270 Arg Pro Val Ala Val Glu Val Asp Gly Glu Pro Arg Gly Thr Thr Pro 275 280 285 Met Arg Ile Ala Ile Asp Pro Asn Ala Leu Arg Ile Met Ala Pro Ala 290 295 300 Asp Ser Pro Asp Leu 305 <210> 227 <211> 367 <212> PRT <213> Actinoplanes liguriae <400> 227 Val Val Phe Gly Ser Leu Leu Leu Val Gly Gly Gly Gly Gly Ala Ile 1 5 10 15 Gly Leu Asn Ala Thr Val Ala Ala Ala Thr Ser Ser Val Gly Gln Glu 20 25 30 Ser Leu Leu Gly Ser Ala Lys Pro Ala Glu Glu Lys Lys Asn Ala Asn 35 40 45 Leu Asp Gly Ala Lys Asn Leu Leu Leu Val Gly Ile Asp Gln Arg Pro 50 55 60 Thr Gln Thr Asn Gly Glu Pro Leu Arg Ser Asp Ser Ile Ile Leu Leu 65 70 75 80 His Ile Asn Lys Asp His Ser Ser Gly Tyr Met Ile Ser Leu Pro Arg 85 90 95 Asp Ser Tyr Val Tyr Ile Pro Ala Tyr Asp Asn Gly Lys Gln Lys Trp 100 105 110 Ala Gly Gly Lys Thr Lys Ile Asn Ala Ala Phe Ala Phe Gly Thr Arg 115 120 125 Gly Leu Lys Gly Asn Glu Ala Leu Gln His Gly Phe Glu Leu Leu Thr 130 135 140 Met Thr Val Lys Glu Leu Thr Gly Ile Thr Pro Asp Ala Gly Ala Ile 145 150 155 160 Ile Asp Phe Gln Gly Phe Arg Asp Val Val Asn Val Leu Gly Lys Val 165 170 175 Cys Met Tyr Val Asp Thr Thr Thr Lys Ser Ile His Leu Gly Lys Asp 180 185 190 Gln Asn Gly Lys Thr Ala Lys Pro Phe Val Ile Asn Pro Asp Gly Thr 195 200 205 Leu Lys Ser Lys Ile Ser Gly Val Thr Pro Asn Thr Tyr Thr Lys Gly 210 215 220 Asp His Cys Phe Thr Pro Gly Gln Ala Leu Asp Phe Val Arg Gln Arg 225 230 235 240 Asp Leu Leu Ala Asp Asn Ser Leu Asp Tyr Gly Arg Gln Arg His Gln 245 250 255 Gln Gln Phe Phe Lys Ala Ile Ile Asn Gln Ala Leu Lys Asp Gly Leu 260 265 270 Asp Ser Pro Thr Lys Leu Pro Lys Leu Leu Ser Ala Phe Gly Lys Ala 275 280 285 Met Thr Val Asp Asp Gly Gly Ile Asp Leu Ala Asp Trp Ala Leu Ala 290 295 300 Met Arg Ser Leu Lys Pro Asp Lys Leu Leu Thr Ile Lys Thr Asn Ala 305 310 315 320 Gly Lys Leu Asn Ser Glu Asn Val Pro Gly Ser Gly Ser Val Glu Leu 325 330 335 Leu Ser Asp Asp Ser Met Asp Leu Leu Lys Ser Ile Lys Lys Asp Gln 340 345 350 Ile Asp Thr Phe Leu Leu Ser His Pro Ala Phe Ile Ala Asn Ser 355 360 365 <210> 228 <211> 317 <212> PRT <213> Actinoplanes liguriae <400> 228 Met Pro Ser Glu Pro Asp Val Ser Val Val Ile Pro Thr Cys Asn Arg 1 5 10 15 Pro Glu Leu Ala Val Arg Ala Val Arg Ser Ala Leu Gly Gln Thr His 20 25 30 Arg Asn Leu Glu Val Ile Val Val Val Asp Gly Pro Asp Glu Ala Thr 35 40 45 Val Thr Ala Leu Gly Glu Val Gly Asp Pro Arg Leu Ser Val Ile Val 50 55 60 Leu Pro Glu Arg Gly Lys Ala Pro Asn Ala Arg Asn Thr Gly Ala Arg 65 70 75 80 Ala Ala Arg Gly Arg Trp Thr Ala Met Leu Asp Asp Asp Asp Glu Trp 85 90 95 Leu Pro Thr Lys Ile Glu Arg Gln Leu Glu Thr Ala Ala Ala Ala Thr 100 105 110 Val Glu Arg Pro Val Val Ala Cys Arg Met Ile Ser Arg Thr Pro Arg 115 120 125 Ala Asp Thr Ile Met Pro Arg Arg Leu Pro Glu Pro Gly Glu Pro Ile 130 135 140 Ser Glu Tyr Leu Leu Val Arg Arg Gly Leu Phe Tyr Gly Asp Gly Phe 145 150 155 160 Val Gln Thr Ser Cys Ile Met Ala Pro Thr Glu Leu Trp Arg Lys Val 165 170 175 Pro Phe Thr Val Gly Leu Arg Arg Ala Gln Glu Leu Asp Trp Thr Leu 180 185 190 Arg Ala Met Arg Glu Pro Gly Thr Ala Leu Ile Tyr Ala Glu Glu Pro 195 200 205 Leu Val Leu Trp His Gln Asp Glu Asn Arg Asp Arg Ile Ser Leu Gln 210 215 220 Asn Pro Trp Arg Glu Gln Leu Glu Trp Leu Arg Gly Asn Arg Glu Leu 225 230 235 240 Phe Thr Pro Arg Ala Tyr Ala Ala Phe Thr Leu Ser Val Leu Ser Ser 245 250 255 Met Ala Ala Pro Thr Arg Asp Thr Gly Leu Phe Arg Glu Leu Leu Ala 260 265 270 Glu Ala Arg Thr His Gly Asp Pro Gly Thr Val Asp Tyr Leu Thr His 275 280 285 Met Gln Ile Trp Ala Leu Pro Pro Ser Val Arg His Arg Leu Arg Asp 290 295 300 Val Val Val Gly Arg Gly Lys Thr Ser Ser Asn Ala Gly 305 310 315 <210> 229 <211> 369 <212> PRT <213> Actinoplanes liguriae <400> 229 Met Pro Ala Glu Arg Arg Val Ala Ile Trp Arg Ser Ser Met Leu Pro 1 5 10 15 Gly Ser Glu Thr Phe Val Arg Asn Gln Ala Asp Ala Leu Thr Arg Trp 20 25 30 Thr Pro Ala Tyr Val Gly Ala Val Arg His Glu Ser Val Leu Ser Arg 35 40 45 Pro Asp Asp Val Ile Ala Phe Pro Gly Gly Lys Gly Phe Leu Arg Leu 50 55 60 Arg Leu Thr Gly Ala Ser Pro Gln Leu Gln Lys Thr Ile Ser Ala Val 65 70 75 80 Arg Pro Asn Leu Val His Ala His Phe Gly Gly Asp Gly Trp Leu Val 85 90 95 Ser His Ser Ala Gln Gln Leu Gly Val Pro Leu Ala Val Thr Val His 100 105 110 Gly His Asp Val Thr Arg Gln Pro Ser Ser Pro Gly Ala Lys Gly Val 115 120 125 Arg Tyr Arg Arg Asn Leu Gln Thr Val Phe Thr Arg Ala Ser Leu Val 130 135 140 Ile Ala Val Ser Glu Val Ile Arg Gly Gln Ala Ile Arg Trp Gly Ala 145 150 155 160 Asp Pro Ala Lys Val Lys Val His Tyr Thr Gly Ile Ala Val Pro Pro 165 170 175 Glu Gln Pro Glu Glu Val Pro Lys Arg Trp Asp Val Val Phe Ile Gly 180 185 190 Arg Phe Val Ala Lys Lys Gly Val Asp Asp Leu Leu Thr Ala Leu Ala 195 200 205 Ala Val Glu Ser Arg Pro Arg Ala Leu Leu Ile Gly Asp Gly Glu Leu 210 215 220 Met Thr Ala Met Arg Ala Arg Ala Glu Gln Leu Gly Val Asp Val Thr 225 230 235 240 Phe Ala Gly Ser Arg Thr Pro Glu Gln Val Arg Arg His Leu Leu Glu 245 250 255 Ser Arg Leu Leu Ala Cys Pro Ser Lys Thr Ala Pro Asp Gly Asp Thr 260 265 270 Glu Gly Leu Pro Thr Thr Ile Leu Glu Ala Ala Ala Leu Gly Leu Pro 275 280 285 Val Val Ala Thr Arg His Ser Gly Ile Pro Glu Ala Val Ile Asp Gly 290 295 300 Glu Thr Gly Leu Leu Ser Pro Glu Ala Asp Pro Ala Ala Leu Ala Val 305 310 315 320 Ser Leu Thr Arg Leu Leu Gly Asp Glu Asp Leu Gln Arg Arg Leu Gly 325 330 335 Ala Arg Ala Arg Arg His Val Thr Ala His Phe Asp Leu Val Glu Gln 340 345 350 Thr Arg Arg Leu Glu Asp Leu Tyr Asp Glu Val Val Ala Gly Ala Arg 355 360 365 Val <210> 230 <211> 459 <212> PRT <213> Actinoplanes liguriae <400> 230 Met Gly Glu His Phe Asp Leu Val Val Leu Gly Ala Gly Pro Gly Gly 1 5 10 15 Tyr Val Ala Ala Ile Arg Gly Ala Gln Leu Gly Leu Thr Thr Ala Ile 20 25 30 Val Glu Asp Lys Tyr Trp Gly Gly Val Cys Leu Asn Val Gly Cys Ile 35 40 45 Pro Ser Lys Ala Leu Leu Arg Asn Ala Glu Leu Ala His Ile Phe His 50 55 60 His Gln Ala Gln Thr Phe Gly Ile Glu Gly Lys Val Thr Phe Asp Phe 65 70 75 80 Ala Val Ala His Gln Arg Ser Arg Ser Val Ala Asp Gly Arg Val Lys 85 90 95 Gly Val His Phe Leu Met Lys Lys Asn Gly Ile Thr Glu Ile Gln Gly 100 105 110 Arg Gly Glu Phe Thr Asp Ala His Thr Leu Arg Val Gly Asp Arg Thr 115 120 125 Val Thr Phe Asp Asn Cys Ile Leu Ala Thr Gly Ala Ser Thr Arg Met 130 135 140 Ile Pro Gly Thr Ser Val Ser Lys Arg Val Val Thr Tyr Glu Glu Gln 145 150 155 160 Ile Leu Asp Pro Asp Leu Pro Asp Ser Ile Val Ile Val Gly Ala Gly 165 170 175 Ala Ile Gly Val Glu Phe Ala Tyr Val Leu Arg Asn Tyr Gly Val Asp 180 185 190 Val Thr Ile Val Glu Phe Leu Asp Arg Met Leu Pro Leu Glu Asp Glu 195 200 205 Glu Val Ser Lys Glu Leu Leu Arg Gln Tyr Arg Lys Leu Gly Val Asp 210 215 220 Val Arg Val Gly Thr Arg Val Glu Gly Ile Glu Glu Gly Ala Asp Ser 225 230 235 240 Val Arg Val Thr Val Ser Lys Asn Gly Lys Thr Glu Val Leu Glu Ala 245 250 255 Asp Lys Val Met Gln Ala Ile Gly Phe Lys Pro Asn Val Glu Gly Tyr 260 265 270 Gly Leu Glu Thr Thr Gly Val Thr Val Ser Asp Arg Gly Ala Val Glu 275 280 285 Ile Asp Asp Phe Cys Arg Thr Asn Val Pro Gly Ile Tyr Ala Ile Gly 290 295 300 Asp Val Thr Ala Lys Leu Met Leu Ala His Ala Ala Glu Ala Met Gly 305 310 315 320 Ile Val Ala Ala Glu Thr Ile Ala Gly Ala Glu Thr Met Ala Leu Asp 325 330 335 Tyr Arg Met Ile Pro Arg Ala Thr Phe Cys Gln Pro Gln Val Ala Ser 340 345 350 Phe Gly Trp Thr Glu Ala Gln Ala Arg Glu Gln Gly Phe Asp Val Lys 355 360 365 Val Ala Lys Phe Pro Phe Thr Ala Asn Gly Lys Ala His Gly Leu Gly 370 375 380 Asp Ala Thr Gly Phe Val Lys Ile Leu Ser Asp Ala Lys Tyr Gly Glu 385 390 395 400 Leu Leu Gly Ala His Leu Ile Gly Pro Asp Val Thr Glu Leu Leu Pro 405 410 415 Glu Leu Thr Leu Ala Gln Gln Trp Asp Leu Thr Val His Glu Val Gly 420 425 430 Arg Asn Val His Ala His Pro Thr Leu Ala Glu Ala Val Lys Glu Ala 435 440 445 Ile His Gly Leu Ala Gly His Met Ile Asn Phe 450 455 <210> 231 <211> 348 <212> PRT <213> Actinoplanes liguriae <400> 231 Met Thr Thr Pro Pro Arg Arg Ser Gly Thr Leu Ser Leu Val Thr Leu 1 5 10 15 Thr Val Glu Pro Pro Ile Ala Pro Ala Pro Pro Ala Ala Pro Gly Arg 20 25 30 Ser Arg Arg Arg Arg Leu Gly Tyr Leu Ala Phe Val Leu Val Ala Val 35 40 45 Val Ala Val Val Thr Leu Arg Asp Arg Leu Pro Asp Pro Gly Glu Phe 50 55 60 Leu Asp Ala Leu Arg Ala Ala Asp Trp Arg Trp Ala Ala Leu Ala Val 65 70 75 80 Gly Ala Gly Val Leu Ser Gln Ile Ala Tyr Ala Glu Gln Gln Arg Arg 85 90 95 Leu Leu Ala Ala Phe Gly Val Arg Val Pro Ala Arg Arg Ala Ile Ala 100 105 110 Met Thr Tyr Val Arg Ser Ala Leu Ser Met Ala Leu Pro Ala Gly Ser 115 120 125 Ala Ala Ser Ala Ala Tyr Ala Phe Gln Val Tyr Arg Arg His Gly Ala 130 135 140 Thr Ala Ala Ile Ser Ala Thr Ala Thr Leu Ile Ser Thr Val Val Thr 145 150 155 160 Val Met Ser Leu Gly Leu Leu Tyr Ala Ala Thr Trp Ser Leu Thr Ala 165 170 175 Thr Val Val Ala Gly Leu Ala Val Leu Leu Leu Trp Ile Tyr Arg Thr 180 185 190 Val Arg Gly Pro Val Pro Ala Arg Ala Gly Val Pro Arg Arg Leu Arg 195 200 205 Val Ala Pro Ile Ala Arg Leu Leu Gln Arg Pro Ala Val Ala Gln Ala 210 215 220 Leu Arg Gly Ala Arg Ser Val Pro Ala Arg Thr Trp Leu Thr Val Thr 225 230 235 240 Leu Ala Gly Val Ile Asn Trp Leu Leu Asp Met Ala Cys Leu Leu Leu 245 250 255 Ala Ala Asp Ala Leu His Ala Gly Leu Gly Trp Ser Arg Leu Ala Leu 260 265 270 Ile Tyr Leu Ala Val Gln Val Val Arg Gln Ile Pro Leu Thr Pro Gly 275 280 285 Gly Ile Gly Leu Ile Glu Thr Ser Met Leu Ala Gly Leu Ile Ala Ala 290 295 300 Gly Ala Pro Gln Val Thr Ala Ala Gly Ile Val Leu Ile Tyr Arg Leu 305 310 315 320 Ile Ser Phe Trp Leu Ile Leu Pro Ser Gly Leu Ala Ala His Leu Thr 325 330 335 Leu Arg Arg Gly Thr Val Pro Pro Val Thr Pro Gly 340 345 <210> 232 <400> 232 000 <210> 233 <400> 233 000 <210> 234 <400> 234 000 <210> 235 <400> 235 000 <210> 236 <400> 236 000 <210> 237 <400> 237 000 <210> 238 <400> 238 000 <210> 239 <400> 239 000 <210> 240 <400> 240 000 <210> 241 <400> 241 000 <210> 242 <400> 242 000 <210> 243 <400> 243 000 <210> 244 <400> 244 000 <210> 245 <400> 245 000 <210> 246 <400> 246 000 <210> 247 <400> 247 000 <210> 248 <400> 248 000 <210> 249 <400> 249 000 <210> 250 <400> 250 000 <210> 251 <400> 251 000 <210> 252 <400> 252 000 <210> 253 <400> 253 000 <210> 254 <400> 254 000 <210> 255 <400> 255 000 <210> 256 <400> 256 000 <210> 257 <400> 257 000 <210> 258 <400> 258 000 <210> 259 <400> 259 000 <210> 260 <400> 260 000 <210> 261 <400> 261 000 <210> 262 <400> 262 000 <210> 263 <400> 263 000 <210> 264 <400> 264 000 <210> 265 <400> 265 000 <210> 266 <400> 266 000 <210> 267 <400> 267 000 <210> 268 <400> 268 000 <210> 269 <400> 269 000 <210> 270 <400> 270 000 <210> 271 <400> 271 000 <210> 272 <400> 272 000 <210> 273 <400> 273 000 <210> 274 <400> 274 000 <210> 275 <400> 275 000 <210> 276 <400> 276 000 <210> 277 <400> 277 000 <210> 278 <400> 278 000 <210> 279 <400> 279 000 <210> 280 <400> 280 000 <210> 281 <400> 281 000 <210> 282 <400> 282 000 <210> 283 <400> 283 000 <210> 284 <400> 284 000 <210> 285 <400> 285 000 <210> 286 <400> 286 000 <210> 287 <400> 287 000 <210> 288 <400> 288 000 <210> 289 <400> 289 000 <210> 290 <400> 290 000 <210> 291 <400> 291 000 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <211> 48 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/SBDIG-1 <220> <221> misc_feature <222> (30)..(30) <223> n is a, c, g, or t <400> 300 tgggtstgca csctsacsat cgartgcggn acsgtsatct gcgcstgc 48 <210> 301 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/ACT08F <400> 301 tccagcacgc gcgggg 16 <210> 302 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/ACT09R <400> 302 gttcgaccag ccgccc 16 <210> 303 <211> 27 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/AGvar01bF <400> 303 ttctagacgt tgttctccca ttttcac 27 <210> 304 <211> 27 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/AGvar02bR <400> 304 aagatcttcg aaggtgagct cgccgaa 27 <210> 305 <211> 94 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/AGvar03F <400> 305 gatcttcgcg aggaccgcac catctacgcc gccagcagcg gctgggtgtg tacactgacg 60 atcgagtgcg gcaccgtgat ctgcgcctgc tgac 94 <210> 306 <211> 94 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/AGvar04R <400> 306 ctaggtcagc aggcgcagat cacggtgccg cactcgatcg tcagtgtaca cacccagccg 60 ctgctggcgg cgtagatggt gcggtcctcg cgaa 94 <210> 307 <211> 26 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/AGvar05F <400> 307 gcctgctgac ctaggtcgac gatcgt 26 <210> 308 <211> 27 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/AGvar06r <400> 308 tgaattcggc tgctccccgc gcgaaat 27 <210> 309 <211> 59 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/SB50F <400> 309 attcgcccgg gaagtccacc gaaaggaaga cacaccatga ttccggggat ccgtcgacc 59 <210> 310 <211> 58 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/SB51R <400> 310 gggcgatgcc cgccccgggc cggaaacgat cgtcgatcat gtaggctgga gctgcttc 58 <210> 311 <211> 59 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/SB52F <400> 311 aagtatatat gagtaaactt ggtctgacag ttaccaatga ttccggggat ccgtcgacc 59 <210> 312 <211> 58 <212> DNA <213> Artificial sequence <220> <223> Synthetic sequence: Primer O/SB53R <400> 312 gcttcaataa tattgaaaaa ggaagagtat gagtattcat gtaggctgga gctgcttc 58 <210> 313 <211> 19 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Compound of Formula I <220> <221> MOD_RES <222> (7, 9, 14) <223> Abu <220> <221> THIOETH <222> (1)..(6) <220> <221> THIOETH <222> (7)..(12) <220> <221> THIOETH <222> (9)..(17) <220> <221> MISC_FEATURE <222> (14)..(19) <223> Linked by Y, where Y is -S- or -S(O)- <400> 313 Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Leu Val 1 5 10 15 Ala Ala Ala <210> 314 <211> 19 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Compound of Formula I <220> <221> MOD_RES <222> (7, 9, 14) <223> Abu <220> <221> THIOETH <222> (1)..(6) <220> <221> THIOETH <222> (7)..(12) <220> <221> THIOETH <222> (9)..(17) <220> <221> MISC_FEATURE <222> (14)..(19) <223> Linked by Y, where Y is -S- or -S(O)- <400> 314 Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Val Val 1 5 10 15 Ala Ala Ala <210> 315 <211> 19 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Compound of Formula I <220> <221> MOD_RES <222> (7, 9, 14) <223> Abu <220> <221> THIOETH <222> (1)..(6) <220> <221> THIOETH <222> (7)..(12) <220> <221> THIOETH <222> (9)..(17) <220> <221> MISC_FEATURE <222> (14)..(19) <223> Linked by Y, where Y is -S- or -S(O)- <400> 315 Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Leu Ile 1 5 10 15 Ala Ala Ala <210> 316 <211> 20 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Compound of Formula I <220> <221> MOD_RES <222> (8, 10, 15) <223> Abu <220> <221> THIOETH <222> (2)..(7) <220> <221> THIOETH <222> (8)..(13) <220> <221> THIOETH <222> (10)..(18) <220> <221> MISC_FEATURE <222> (15)..(20) <223> Linked by Y, where Y is -S- or -S(O)- <400> 316 Ala Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Leu 1 5 10 15 Val Ala Ala Ala 20 <210> 317 <211> 20 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Compound of Formula I <220> <221> MOD_RES <222> (8, 10, 15) <223> Abu <220> <221> THIOETH <222> (2)..(7) <220> <221> THIOETH <222> (8)..(13) <220> <221> THIOETH <222> (10)..(18) <220> <221> MISC_FEATURE <222> (15)..(20) <223> Linked by Y, where Y is -S- or -S(O)- <400> 317 Ala Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Val 1 5 10 15 Val Ala Ala Ala 20 <210> 318 <211> 20 <212> PRT <213> Artificial sequence <220> <223> Synthetic sequence: Compound of Formula I <220> <221> MOD_RES <222> (8, 10, 15) <223> Abu <220> <221> THIOETH <222> (2)..(7) <220> <221> THIOETH <222> (8)..(13) <220> <221> THIOETH <222> (10)..(18) <220> <221> MISC_FEATURE <222> (15)..(20) <223> Linked by Y, where Y is -S- or -S(O)- <400> 318 Ala Ala Ser Gly Trp Val Ala Xaa Leu Xaa Ile Glu Ala Gly Xaa Leu 1 5 10 15 Ile Ala Ala Ala 20

Claims (43)

  1. 하기 화학식의 화합물 또는 이의 약제학적으로 허용 가능한 염:
    Figure 712014002617405-pct00060
    상기 식에서,
    -X1-X2-는 -Leu-Val-을 나타내고;
    Y는 -S- 또는 -S(O)-이며;
    Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타내며;
    R은 -OH 또는 -NR1R2 기를 나타내며, 여기서, R1 및 R2는 독립적으로
    (i) 수소; 또는
    (ii) 식 -(CH2)n-NR3R4(여기서, n은 2 내지 8의 정수를 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타내거나, R3 및 R4는 함께 -(CH2)3-, -(CH2)4-, -(CH2)2-O-(CH2)2-, -(CH2)2-S-(CH2)2- 또는 -(CH2)5- 기를 나타낸다)의 기를 나타낸다.
  2. 제1항에 있어서, Z가 -NH2인 화합물.
  3. 제1항에 있어서, Z가 아미노산인 화합물.
  4. 제3항에 있어서, 상기 아미노산은 Ala, Ile, Lys, Phe, Val, Glu, Asp, His, Leu, Arg, Ser 및 Trp 기로부터 선택되고, 상기 아미노산은 D 배열(configuration) 또는 L 배열로 존재하는 것인 화합물.
  5. 제3항에 있어서, Z가 Ile, Lys, Phe, Val, Glu, Asp, His, Leu, Arg 및 Ser 기로부터 선택되는 아미노산인 화합물.
  6. 제3항에 있어서, 상기 아미노산이 Ala인 화합물.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, R이 -NR1R2 기를 나타내는 것인 화합물.
  8. 삭제
  9. 제1항 내지 제6항 중 어느 한 항에 있어서, R이 -NR1R2 기를 나타내며, 여기서, R1 및 R2는 독립적으로 수소 또는 식 -(CH2)n-NR3R4(여기서, n은 2 내지 8의 정수를 나타내고, R3 및 R4는 독립적으로 수소 또는 (C1-C4)알킬을 나타낸다)의 기를 나타내는 것인 화합물.
  10. 제1항 내지 제6항 중 어느 한 항에 있어서, R이 -OH인 화합물.
  11. 제1항 내지 제6항 중 어느 한 항에 있어서, 내부 잔기 측쇄의 카복시 작용기에 대해, 이 작용기가 -COOH로부터 -COOR5(여기서, R5는 수소, (C1-C4)알킬 또는 (C1-C4)알콕시 (C2-C4)알킬을 나타낸다)의 기로 변형되도록 하는 변형을 포함하는 것인 화합물.
  12. 제1항 내지 제6항 중 어느 한 항에 있어서, N-말단 아미노 기에 대해, 이 -NH2 기 대신에 -NHR6(여기서, R6은 C1-C4알킬을 나타낸다)의 기가 되도록 하는 변형을 포함하는 것인 화합물.
  13. 제1항에 기재된 화합물의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번, 또는 18번 위치로부터 선택되는 위치의 1개, 2개, 3개 또는 4개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 제1항에 기재된 화합물의 변이체로서, 항미생물 활성을 갖는 변이체.
  14. 제1항 내지 제6항 중 어느 한 항에 따른 화합물을 약제학적으로 허용 가능한 담체 또는 희석제와 함께 포함하는, 박테리아 감염 치료용 약제학적 조성물.
  15. 제14항에 있어서, 상기 감염이 클로스트리듐 디피실리(Clostridium difficile)에 의해 유발되는 장 중복 감염(gut super-infection)인 약제학적 조성물.
  16. 삭제
  17. 삭제
  18. 하기 화학식의 화합물의 제조 방법으로서,
    Figure 112013097041661-pct00062
    상기 식에서,
    -X1-X2-는 -Leu-Val-이고;
    Y는 -S-이며;
    Z는 Ala 또는 -NH2이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타내며;
    상기 방법은 서열 번호 1 또는 11을 포함하는 서열을 코딩하는 핵산, 및 경우에 따라 필요한 경우, 전구체 폴리펩티드를 생성물로 전환시키는데 요구되는 관련된 클러스터 유전자를 발현시키는 단계를 포함하는 것인 방법.
  19. 제18항에 있어서, 핵산이 악티노플레인스 리구리애(A. liguriae)에서 발현되는 것인 방법.
  20. 제19항에 있어서, 악티노플레인스 리구리애는 부다페스트 조약 기탁 번호 NCIMB 41362 하에 기탁되어 있는 것인 방법.
  21. B형 란티바이오틱 펩티드 데옥시액타가르딘, 액타가르딘 또는 이의 변이체를 발현시키는 데 적합한 숙주 세포를 제조하는 방법으로서,
    액타가르딘 B, ala(0)-액타가르딘 B, 또는 이들 중 어느 하나의 아미노산 변이체로서, 폴리펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 아미노산 변이체의 전구체 펩티드를 포함하는 LanA 폴리펩티드를 코딩하는 lanA 유전자를,
    경우에 따라, 전구체 펩티드를 상기 펩티드로 전환시키는 데 적합한 하나 이상의 관련된 클러스터 유전자와 함께 도입함으로써 세포를 형질전환시켜, 상기 펩티드를 코딩하는 폴리뉴클레오티드 서열을 포함하고 이것을 발현시키는 데 적합한 숙주 세포를 생성하는 단계를 포함하며, 상기 LanA 폴리펩티드는 하기 구조를 갖는 것인 제조 방법:
    Figure 112015037343707-pct00063
    상기 식에서,
    -X1-X2-는 -Leu-Val-을 나타내고;
    Y는 -S- 또는 -S(O)-이며;
    Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
  22. 제21항에 있어서, 상기 세포를 lanA 유전자 및 하나 이상의 클러스터 유전자로 형질전환시키는 것인 제조 방법.
  23. 제22항에 있어서, 관련된 유전자 클러스터가 LanR 폴리펩티드 또는 이것과 90% 이상 동일한 그의 변이체를 코딩하는 유전자를 포함하고, 상기 LanR 폴리펩티드는 LanA 폴리펩티드의 생성을 조절하는 인자인 것인 제조 방법.
  24. 제22항 또는 제23항에 있어서, 상기 유전자 클러스터가 LanM 폴리펩티드 또는 이것과 90% 이상 동일한 그의 변이체를 코딩하는 유전자를 추가로 포함하고, 상기 LanM 폴리펩티드는 란티바이오틱 유전자 클러스터로부터 유래된 것으로서, 전구체 폴리펩티드를 란티바이오틱 화합물로 전환하는 데 요구되는 변형 인자인 것인 제조 방법.
  25. 제24항에 있어서, LanM 폴리펩티드가 서열 번호 120 또는 213에 제시된 아미노산 서열을 갖는 것인 제조 방법.
  26. 제22항 또는 제23항에 있어서, 상기 유전자 클러스터가 LanO 폴리펩티드 또는 이것과 90% 이상 동일한 그의 변이체를 코딩하는 유전자를 추가로 포함하고, 상기 LanO 폴리펩티드는 란티바이오틱 유전자 클러스터로부터 유래된 것으로서, 데옥시 형태를 이의 -S(O)- 유사체로 산화시키는 데 관여하는 인자인 것인 제조 방법.
  27. 제26항에 있어서, 상기 LanO 폴리펩티드가 서열 번호 122 또는 215의 아미노산 서열을 갖는 것인 제조 방법.
  28. 제24항에 있어서, 관련된 유전자 클러스터가 LanT 폴리펩티드 또는 이것과 90% 이상 동일한 그의 변이체를 코딩하는 유전자를 추가로 포함하고, 상기 LanT 폴리펩티드는 란티바이오틱 유전자 클러스터로부터 유래된 것으로서, 수송 인자인 것인 제조 방법.
  29. 제28항에 있어서, 상기 LanT 폴리펩티드가 서열 번호 123 또는 214에 제시된 아미노산 서열을 갖는 것인 제조 방법.
  30. 제21항 또는 제22항에 있어서, 상기 숙주 세포가 란티바이오틱 생산 숙주 세포인 제조 방법.
  31. 제30항에 있어서, 상기 숙주 세포가 LanO 폴리펩티드를 코딩하는 유전자를 포함하고, 상기 유전자가 불활성화되는 것인 제조 방법.
  32. 제31항에 있어서, LanO 폴리펩티드를 코딩하는 유전자가 돌연변이 또는 결실에 의해 불활성화되는 것인 제조 방법.
  33. 제21항 또는 제22항에 있어서, 숙주 세포를 배양하여 그 안에 코딩된 란티바이오틱 펩티드를 발현시키는 단계를 추가로 포함하는 제조 방법.
  34. 제33항에 있어서, 란티바이오틱을 회수하는 단계를 추가로 포함하는 제조 방법.
  35. 제33항에 있어서, 모노아미드 유도체를 제공하도록 C-말단의 카복시 작용기를 유도체화하는 단계를 추가로 포함하는 제조 방법.
  36. 제21항 또는 제22항의 방법으로부터 얻을 수 있는 세포로서, 상기 세포는 돌연변이된 내인성 LanA 유전자를 갖는 란티바이오틱 생산 숙주 세포 및 LanA 유전자를 발현할 수 있는 비생산자 중에서 선택되는 것인 세포.
  37. 제21항 또는 제22항에 정의된 방법에서 숙주 세포를 형질전환시키는 데 적합한 벡터로서,
    액타가르딘 B, ala(0)-액타가르딘 B, 또는 이들 중 어느 하나의 변이체로서, 폴리펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 변이체의 전구체 펩티드를 포함하는 LanA 폴리펩티드를 코딩하는 유전자를,
    경우에 따라, 전구체 펩티드를 생성물 펩티드로 전환시키는 데 필요한 관련된 클러스터 유전자와 함께 포함하는 발현 작제물을 포함하며, 상기 LanA 폴리펩티드는 하기 구조를 갖는 것인 벡터:
    Figure 112015037343707-pct00064
    상기 식에서,
    -X1-X2-는 -Leu-Val-을 나타내고;
    Y는 -S- 또는 -S(O)-이며;
    Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
  38. 제37항에 있어서, 상기 발현 작제물이 lanA 프로모터 서열을 추가로 포함하는 것인 벡터.
  39. 내인성 LanA 유전자 내에 돌연변이를 포함하는 란티오바이오틱 생산 숙주 세포로서, 상기 유전자는 액타가르딘 B, ala(0)-액타가르딘 B, 또는 이들 중 어느 하나의 아미노산 변이체로서, 폴리펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 아미노산 변이체의 전구체 펩티드를 포함하는 LanA 폴리펩티드를 코딩하고, 내인성 유전자가 발현되지 않거나 내인성 유전자 생성물이 비활성화되도록 하며, 상기 LanA 폴리펩티드는 하기 구조를 갖는 것인 란티바이오틱 생산 숙주 세포:
    Figure 112015037343707-pct00065
    상기 식에서,
    -X1-X2-는 -Leu-Val-을 나타내고;
    Y는 -S- 또는 -S(O)-이며;
    Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
  40. LanA 펩티드, 또는 이의 아미노산 변이체로서, 펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 아미노산 변이체를 발현시키기 위해 숙주 세포를 사용하는 방법으로서,
    상기 세포는 LanO 폴리펩티드를 코딩하는 유전자를 갖는 란티바이오틱 생산 세포이고,
    상기 유전자는 불활성화되거나,
    상기 유전자의 발현이 증가되며,
    상기 LanA 펩티드는 하기 구조를 갖는 것인 방법:
    Figure 112015037343707-pct00066
    상기 식에서,
    -X1-X2-는 -Leu-Val-을 나타내고;
    Y는 -S- 또는 -S(O)-이며;
    Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
  41. 제40항에 있어서, LanO 폴리펩티드를 코딩하는 유전자가 돌연변이 또는 결실에 의해 불활성화되는 것인 방법.
  42. 액타가르딘 B, 또는 이의 아미노산 변이체로서, 폴리펩티드 서열 내의 2번, 3번, 4번, 5번, 8번, 10번, 11번, 13번 및 18번 위치에서의 1 내지 5개의 아미노산이 Gly, Ala, Ile, Leu, Val, Cys, Ser, Thr, Met, Asn, Gln, Asp, Glu, Lys, Arg, His, Phe, Trp 및 Tyr으로 이루어진 군으로부터 선택되는 다른 아미노산으로 치환되는 아미노산 변이체를 제조하기 위해, LanA 펩티드를 코딩하는 유전자를 포함하는 숙주 세포를 사용하는 방법으로서, 단, 상기 숙주는 LanA 펩티드를 코딩하는 내인성 유전자를 포함하는 란티바이오틱 생산 세포이고, 상기 내인성 유전자는 내인성 유전자가 발현되지 않거나 내인성 유전자 생성물이 불활성이 되거나 내인성 유전자가 결실되도록 돌연변이되며, 액타가르딘 B는 하기 구조를 갖는 것인 방법:
    Figure 112015037343707-pct00067
    상기 식에서,
    -X1-X2-는 -Leu-Val-을 나타내고;
    Y는 -S- 또는 -S(O)-이며;
    Z는 -NH2 또는 아미노산이고, 여기서 -NH2는 1번 위치의 Ala의 N-말단을 나타낸다.
  43. 삭제
KR1020087018136A 2006-01-17 2007-01-17 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 KR101573536B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0600928.6A GB0600928D0 (en) 2006-01-17 2006-01-17 Improvements relating to lantibiotics
GB0600928.6 2006-01-17

Publications (2)

Publication Number Publication Date
KR20080086517A KR20080086517A (ko) 2008-09-25
KR101573536B1 true KR101573536B1 (ko) 2015-12-11

Family

ID=35998187

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087018136A KR101573536B1 (ko) 2006-01-17 2007-01-17 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터

Country Status (20)

Country Link
US (3) US7989416B2 (ko)
EP (2) EP1979375B9 (ko)
JP (1) JP5219837B2 (ko)
KR (1) KR101573536B1 (ko)
CN (1) CN101389641B (ko)
AT (1) ATE534659T1 (ko)
AU (1) AU2007206769B2 (ko)
BR (1) BRPI0706525A2 (ko)
CA (1) CA2637315A1 (ko)
CY (1) CY1112559T1 (ko)
DK (1) DK1979375T3 (ko)
ES (1) ES2378090T3 (ko)
GB (1) GB0600928D0 (ko)
IL (1) IL192446A0 (ko)
MX (1) MX2008009047A (ko)
NZ (1) NZ569486A (ko)
PL (1) PL1979375T3 (ko)
PT (1) PT1979375E (ko)
SI (1) SI1979375T1 (ko)
WO (1) WO2007083112A2 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0600928D0 (en) 2006-01-17 2006-02-22 Novacta Biosystems Ltd Improvements relating to lantibiotics
GB0714029D0 (en) * 2007-07-18 2007-08-29 Novacta Biosystems Ltd Lantibiotic-based compounds having antimicrobial activity
GB0714030D0 (en) * 2007-07-18 2007-08-29 Novacta Biosystems Ltd The use of type-B lantibiotic-based compounds having antimicrobial activity
GB0900599D0 (en) 2009-01-14 2009-02-18 Novacta Biosystems Ltd Treatment
TWI453029B (zh) * 2009-01-14 2014-09-21 Novacta Biosystems Ltd 去氧艾克特卡丁b(deoxyactagardine b), 包含其之醫藥組合物及其製造方法
BRPI1007884A2 (pt) * 2009-02-04 2016-09-06 Novacta Biosystems Ltd derivados de actagardina
GB201001688D0 (en) 2010-02-02 2010-03-17 Novacta Biosystems Ltd Compounds
WO2011095768A1 (en) 2010-02-02 2011-08-11 Novacta Biosystems Limited Lantibiotic salts
EA201291461A1 (ru) * 2010-07-14 2013-08-30 Новакта Биосистемс Лимитед Состав, содержащий лантибиотик типа b
GB201013507D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
GB201013509D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
GB201013508D0 (en) 2010-08-11 2010-09-22 Novacta Biosystems Ltd Compounds
GB201013513D0 (en) * 2010-08-11 2010-09-22 Novacta Biosystems Ltd Formulations
US9975930B2 (en) 2012-11-30 2018-05-22 Naicons S.R.L. Lantibiotic derivatives and process for their preparation
CN103483433B (zh) * 2013-09-10 2015-05-27 中国科学院微生物研究所 一种新型高效的羊毛硫细菌素cerecidin及其应用
CN106188253B (zh) * 2016-08-26 2020-08-18 上海交通大学 抗菌肽Lexapeptide及其制备方法和用途

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3710795A (en) 1970-09-29 1973-01-16 Alza Corp Drug-delivery device with stretched, rate-controlling membrane
GB8507528D0 (en) 1985-03-22 1985-05-01 Lepetit Spa Basis monocarboxyamide derivatives
US5304540A (en) 1988-06-22 1994-04-19 Applied Microbiology, Inc. Pharmaceutical bacteriocin compositions and methods for using the same
IN167138B (ko) 1988-08-17 1990-09-01 Hoechst India
GB8926639D0 (en) 1989-11-24 1990-01-17 Agricultural & Food Res Delayed release formulations
KR0166088B1 (ko) 1990-01-23 1999-01-15 . 수용해도가 증가된 시클로덱스트린 유도체 및 이의 용도
US5376645A (en) 1990-01-23 1994-12-27 University Of Kansas Derivatives of cyclodextrins exhibiting enhanced aqueous solubility and the use thereof
IT1260505B (it) 1992-06-01 1996-04-09 Poli Ind Chimica Spa Sistemi farmaceutici orali a cessione ritardata per il rilascio specifico nel colon
IL107887A (en) 1992-12-08 2003-07-06 Ambi Inc Stabilized lanthionine containing bacteriocin compositions
US5512269A (en) 1993-06-09 1996-04-30 Burroughs Wellcome, Co. Method of treating retained pulmonary secretions
PT700998E (pt) 1994-09-12 2004-03-31 Aventis Pharma Gmbh Mersacidina recombinante e metodo para a sua producao
SK285563B6 (sk) 1995-06-23 2007-03-01 Ambi, Inc. Použitie lanthocinu na výrobu liečiva na liečenieinfekcie
GB9711643D0 (en) 1997-06-05 1997-07-30 Janssen Pharmaceutica Nv Glass thermoplastic systems
US5985823A (en) 1997-06-09 1999-11-16 Ambi Inc. Method for the treatment of diarrheal disease and for eliminating particular bacterial populations from the colon
US5958873A (en) 1997-06-09 1999-09-28 University Of Cincinnati Oral formulation for treatment of bacteria-induced diseases of the colon
DE19745583A1 (de) * 1997-10-15 1999-04-22 Hoechst Marion Roussel De Gmbh Neues Lantibiotikum verwandt mit Actagardine, Verfahren zur Herstellung und Verwendung derselben
US6569830B1 (en) 1999-03-05 2003-05-27 Ambi, Inc. Compositions and methods for treatment of staphylococcal infection while suppressing formation of antibiotic-resistant strains
CA2413330A1 (en) 2000-06-28 2002-01-03 Smithkline Beecham P.L.C. Wet milling process
GB0110432D0 (en) * 2001-04-27 2001-06-20 Plant Bioscience Ltd Lantibiotic production
WO2002103010A1 (en) 2001-06-14 2002-12-27 Plant Bioscience Limited Methods and materials for targeted gene disruption in actinomycete bacteria
US6861236B2 (en) 2002-05-24 2005-03-01 Applied Nanosystems B.V. Export and modification of (poly)peptides in the lantibiotic way
EP1558746A4 (en) 2002-10-10 2006-11-22 Molichem Medicines Inc DURAMYCIN-CODING NUCLEIC ACIDS
US7351687B2 (en) 2003-07-18 2008-04-01 Vicuron Pharmaceuticals, Inc. Antibiotic 107891, its factors A1 and A2, pharmaceutically acceptable salts and compositions, and use thereof
ATE356143T1 (de) 2003-07-18 2007-03-15 Vicuron Pharm Inc Antibiotikum 107891, dessen faktoren a1 und a2, pharmazeutisch unbedenkliche salze und zusammensetzungen, und anwendung davon
EP1720910A4 (en) * 2004-02-17 2007-11-21 Cancervax Corp METHOD AND COMPOSITION FOR INHIBITING ANGIOGENESIS
GB0406870D0 (en) 2004-03-26 2004-04-28 Novacta Biosystems Ltd Improvements relating to the production of lantibiotics
EP1928900A1 (en) 2005-09-27 2008-06-11 Novacta Biosystems Limited Variants of the lantibiotic mersacidin and their use
GB0600928D0 (en) 2006-01-17 2006-02-22 Novacta Biosystems Ltd Improvements relating to lantibiotics
KR20120038021A (ko) 2006-10-27 2012-04-20 화이자 프로덕츠 인코포레이티드 하이드록시프로필 메틸 셀룰로스 경질 캡슐 및 이의 제조 방법
WO2008151434A1 (en) 2007-06-12 2008-12-18 The University Of British Columbia Small cationic antimicrobial peptides
GB0714029D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd Lantibiotic-based compounds having antimicrobial activity
GB0714030D0 (en) 2007-07-18 2007-08-29 Novacta Biosystems Ltd The use of type-B lantibiotic-based compounds having antimicrobial activity
EP2367845A1 (en) 2008-11-24 2011-09-28 Sentinella Pharmaceuticals, Inc. ("Sentinella") Lantibiotic carboxyamide derivatives with enhanced antibacterial activity
GB0900599D0 (en) 2009-01-14 2009-02-18 Novacta Biosystems Ltd Treatment
TWI453029B (zh) 2009-01-14 2014-09-21 Novacta Biosystems Ltd 去氧艾克特卡丁b(deoxyactagardine b), 包含其之醫藥組合物及其製造方法
BRPI1007884A2 (pt) 2009-02-04 2016-09-06 Novacta Biosystems Ltd derivados de actagardina
EP2216937A1 (en) 2009-02-10 2010-08-11 Alcatel Lucent Alarm notification between customer premises equipment and a remote management server

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Antimicrob. Agents Chemother. 11(3): 396-401(1977. 3.)
Appl. Environ. Microbiol. 66(6): 2565-2571(2000. 6.)
Eur. J. Biochem. 228(3): 786-797(1995. 3. 15.)

Also Published As

Publication number Publication date
EP1979375B9 (en) 2012-05-09
US8465947B2 (en) 2013-06-18
US7989416B2 (en) 2011-08-02
DK1979375T3 (da) 2012-03-19
USRE45003E1 (en) 2014-07-08
CN101389641A (zh) 2009-03-18
CY1112559T1 (el) 2016-02-10
ATE534659T1 (de) 2011-12-15
GB0600928D0 (en) 2006-02-22
US20110306091A1 (en) 2011-12-15
AU2007206769A1 (en) 2007-07-26
NZ569486A (en) 2011-07-29
WO2007083112A3 (en) 2008-05-08
KR20080086517A (ko) 2008-09-25
EP1979375A2 (en) 2008-10-15
US20100048459A1 (en) 2010-02-25
EP2189472A1 (en) 2010-05-26
WO2007083112A2 (en) 2007-07-26
AU2007206769B2 (en) 2013-06-20
JP2009523777A (ja) 2009-06-25
CA2637315A1 (en) 2007-07-26
MX2008009047A (es) 2008-12-18
CN101389641B (zh) 2013-06-05
PT1979375E (pt) 2012-03-06
BRPI0706525A2 (pt) 2011-03-29
PL1979375T3 (pl) 2012-04-30
SI1979375T1 (sl) 2012-03-30
ES2378090T3 (es) 2012-04-04
EP1979375B1 (en) 2011-11-23
IL192446A0 (en) 2008-12-29
JP5219837B2 (ja) 2013-06-26

Similar Documents

Publication Publication Date Title
KR101573536B1 (ko) 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
KR101261870B1 (ko) 폴리믹신 b 또는 e 생합성 효소 및 이를 코딩하는 유전자 군
KR20100049580A (ko) 티오펩티드 전구체 단백질, 그를 코딩하는 유전자 및 그의 용도
KR20100039443A (ko) 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법
WO1999005283A2 (fr) Genes de biosynthese et de transfert des 6-desoxyhexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
US20020164747A1 (en) Gene cluster for ramoplanin biosynthesis
CN110857447B (zh) 提高米尔贝霉素a3/a4或其衍生物产量的方法
CA2501393A1 (en) Genes and proteins for the biosynthesis of the glycopeptide antibiotic a40926
KR101110175B1 (ko) 스피라마이신의 생합성에 관여하는 폴리펩티드, 이들폴리펩티드를 암호화하는 뉴클레오티드 서열 및 이의 용도
CA2450691C (en) Genes and proteins involved in the biosynthesis of lipopeptides
KR20080032641A (ko) 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산
EP1442123A2 (en) Polynucleotides and polypeptides involved in clavulinic acid biosynthesis and use thereof
Bell Analysis and manipulation of “actagardine” gene clusters from Actinoplanes
FR2786200A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
FR2786189A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
CA2412627A1 (en) Genes and proteins involved in the biosynthesis of lipopeptides
FR2786201A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
KR20110118316A (ko) 폴리믹신 b 또는 e 생합성 효소 및 이를 코딩하는 유전자 군

Legal Events

Date Code Title Description
AMND Amendment
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee