KR20080078853A - 항암제로서 유용한 21-데옥시막베신 유사체 - Google Patents

항암제로서 유용한 21-데옥시막베신 유사체 Download PDF

Info

Publication number
KR20080078853A
KR20080078853A KR1020087015388A KR20087015388A KR20080078853A KR 20080078853 A KR20080078853 A KR 20080078853A KR 1020087015388 A KR1020087015388 A KR 1020087015388A KR 20087015388 A KR20087015388 A KR 20087015388A KR 20080078853 A KR20080078853 A KR 20080078853A
Authority
KR
South Korea
Prior art keywords
deoxymacbecin
strain
mbcm
analogue
pharmaceutically acceptable
Prior art date
Application number
KR1020087015388A
Other languages
English (en)
Inventor
크리스틴 자넷 마틴
배리 윌킨슨
사빈 가이서
밍-치앙 장
로즈 매리 쉐리단
레스리사라 쉬한
레이첼 에디스 릴
모하메드 눌-에-아람
윌리암 알렉산더 보우스덴
Original Assignee
바이오티카 테크놀로지 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB0526473.4A external-priority patent/GB0526473D0/en
Priority claimed from GB0606549A external-priority patent/GB0606549D0/en
Priority claimed from GB0614374A external-priority patent/GB0614374D0/en
Application filed by 바이오티카 테크놀로지 리미티드 filed Critical 바이오티카 테크놀로지 리미티드
Publication of KR20080078853A publication Critical patent/KR20080078853A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/10Antimycotics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P33/00Antiparasitic agents
    • A61P33/02Antiprotozoals, e.g. for leishmaniasis, trichomoniasis, toxoplasmosis
    • A61P33/06Antimalarials
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/02Antineoplastic agents specific for leukemia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/04Antineoplastic agents specific for metastasis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D225/00Heterocyclic compounds containing rings of more than seven members having one nitrogen atom as the only ring hetero atom
    • C07D225/04Heterocyclic compounds containing rings of more than seven members having one nitrogen atom as the only ring hetero atom condensed with carbocyclic rings or ring systems
    • C07D225/06Heterocyclic compounds containing rings of more than seven members having one nitrogen atom as the only ring hetero atom condensed with carbocyclic rings or ring systems condensed with one six-membered ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Neurosurgery (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Neurology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Cardiology (AREA)
  • Plant Pathology (AREA)
  • Communicable Diseases (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Epidemiology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

본 발명은 21-데옥시막베신 유사체에 관한 것으로, 이는 암, B-세포 악성종양, 말라리아, 진균성 감염, 중추신경계 질환, 퇴행성 신경질환, 혈관신생 의존성 질환, 자가면역질환의 치료 및/또는 암의 예방적 전처리에 유용하다. 본 발명은 또한 이러한 화합물의 생산 방법 및 의약분야, 특별히 치료제 및/또는 암 또는 B-세포 악성종양의 전처리제에서의 용도를 제공한다.
Figure P1020087015388
데옥시막베신(deoxymacbecin), 항암제, 암

Description

항암제로서 유용한 21-데옥시막베신 유사체{21-DEOXYMACBECIN ANALOGUES USEFUL AS ANTITUMOR AGENTS}
본 발명은 신규한 안사마이신 유사체에 관한 것이다. 특히, 모생산균주의 유전공학적 처리에 의해 생성되며, 개선된 약제학적 성질을 가지는 21-데옥시막베신 유사체에 관한 것이다.
90 kDa 열충격단백질(Hsp90)은 단백질의 접힘 및 조립과 관련된 풍부한 분자 샤페론인데, 이들 다수가 신호 전달 경로와 관련되어 있다(Neckers, 2002; Sreedhar et al., 2004a; Wegele et al., 2004 및 이들의 참고문헌). 거의 50 여종 이상의 이러한 소위 클라이언트 단백질(client proteins)라 일컫는 단백질이 확인되었으며, 스테로이드 수용체, 비수용체성 티로신 키나아제, 예를 들어 src 류, 사이클린-의존성 키나아제, 예를 들어 cdk4 및 cdk6, 낭포성 막횡단 조절자(cystic transmembrane regulator), 산화질소 합성효소 및 이외의 것들을 포함한다(Donze and Picard, 1999; McLaughlin et al., 2002; Chiosis et al., 2004; Wegele et al., 2004; http://www.picard.ch/downloads/Hsp90interactors. pdf).
또한, Hsp90은 돌연변이 영향에 대한 세포의 스트레스 반응 및 보호에서 중요한 역할을 한다(Bagatell and Whitesell, 2004; Chiosis et al., 2004). Hsp90의 기능은 복잡하고 이는 동적인 다중-효소 복합체의 형성에 관여한다(Bohen, 1998; Liu et al., 1999; Young et al., 2001; Takahashi et al., 2003; Sreedhar et al., 2004; Wegele et al., 2004). Hsp90은 클라이언트 단백질의 분해, 세포 주기 조절장애/또는 정상화 및 아포토시스(apoptosis)를 야기하는 억제제의 표적이다(Fang et al., 1998; Liu et al., 1999; Blagosklonny, 2002; Neckers, 2003; Takahashi et al., 2003; Beliakoff and Whitesell, 2004; Wegele et al., 2004). 더욱 최근에, Hsp90은 종양의 전이를 위한 중요한 세포외 매개체임이 확인되었다(Eustace et al., 2004).
Hsp90은 이의 기능(Blagosklonny et al., 1996; Neckers, 2002; Workman and Kaye, 2002; Beliakoff and Whitesell, 2004; Harris et al., 2004; Jez et al., 2003; Lee et al., 2004)에 대한 심도 있고 상세한 연구 및 고속처리 스크리닝 분석의 개발(Carreras et al., 2003; Rowlands et al., 2004)을 반영하는 암 치료법을 위한 새로운 주요 치료 표적으로서 확인되었다. Hsp90 억제제는 안사마이신, 마크롤리드(macrolides), 퓨린, 피라졸, 쿠마린 항생제 및 그외의 것들을 포함한다(Bagatell and Whitesell, 2004; Chiosis et al., 2004 및 이들의 참고문헌).
벤제노이드 안사마이신은 방향족 고리 구조 양쪽에 결합된 다양한 길이의 지방족 고리에 의해 특징지어지는 광범위한 화학적 구조의 한 종류이다. 자연적으로 발생하는 안사마이신은 하기를 포함한다: 막베신(macbecin), 18,21-디히드로막베신(또한 막베신 I 및 막베신 II로 각각 알려져있음)(1 & 2; Tanida et al., 1980), 겔다나마이신(3; DeBoer et al., 1970; DeBoer and Dietz, 1976; WO 03/106653 및 이들의 참고문헌), 및 허비마이신 류(4; 5, 6, Omura et al., 1979, Iwai et al., 1980 and Shibata et al, 1986a, WO 03/106653 및 이들의 참고문헌).
Figure 112008045421569-PCT00001
안사마이신은 원래 이들의 항균 및 항바이러스 활성이 규명되었으나, 최근에 항암제로서의 이들의 잠재적 이용성이 더 큰 관심의 대상이 되고 있다(Beliakoff and Whitesell, 2004). 많은 Hsp90 억제제가 최근에 임상 실험에서 평가되기 시작하였다(Csermely and Soti, 2003; Workman, 2003). 특히, 겔다나마이신은 나노몰로도 효과를 나타내고 종양 세포 의존적으로 변형된 단백질 키나아제에 대해 명백한 특이성을 갖는다(Chiosis et al., 2003; Workman, 2003).
Hsp90 억제제를 이용한 치료는 방사선 조사에 의한 종양 세포 사멸의 유도를 증진시키는 것으로 나타났고, Hsp90 억제제와 세포독성 물질과의 결합에 의해 세포 사멸능(예를 들어, 유방암, 만성 골수성 백혈병 및 비소세포폐암)이 증가됨이 또한 설명되었다.(Neckers, 2002; Beliakoff and Whitesell, 2004) 항-신생혈관생성 활성에 대한 가능성 또한 관심의 대상이다: Hsp90 클라이언트 단백질 HIF-1α는 고형 종양의 진행에 중요한 역할을 한다(Hur et al., 2002; Workman and Kaye, 2002; Kaur et al., 2004).
Hsp90 억제제는 또한 면역억제제로서 작용하고 Hsp90 억제 후의 다양한 종류의 종양 세포의 보체-매개성 용해와 관련되어 있다(Sreedhar et al., 2004).
잠재적 항말라리아 약물로서의 Hsp90 억제제가 또한 논의되었다(Kumar et al., 2003). 또한, 겔다나마이신이 복합적으로 글리코실화된 포유류 프리온 단백질 PrPc의 형성을 방해하는 것으로 나타났다(Winklhofer et al., 2003).
상기에서 기술한 바와 같이, 안사마이신이 잠재적 항암 및 항B-세포 악성종양 화합물로서 관심을 받고 있으나, 최근 이용가능한 안사마이신이 양호하지 않은 약학적 또는 약제학적 성질, 예를 들면 양호하지 않은 용해도, 양호하지 않은 대사 안정성, 양호하지 않은 생체이용성 또는 양호하지 않은 제형능을 보인다(Goetz et al., 2003; Workman 2003; Chiosis 2004). 허비마이신 A 및 겔다나마이신 모두는 이들의 강한 간독성으로 인해 임상 실험에 대해 안좋은 후보 물질로 확인되었고(review Workman, 2003), 겔다나마이신은 간독성으로 인해 임상 1상에서 탈락되었다(Supko et al., 1995, WO 03/106653).
겔다나마이신은 스트렙토마이세스 하이그로스코피커스(Streptomyces hygroscopicus)의 배양 여과물로부터 분리되었고 시험관 내에서 원생생물에 대해 강한 활성을 갖고, 세균과 곰팡이에 대해 약한 활성을 갖는 것으로 나타났다. 1994년 겔다나마이신과 Hsp90과의 관계가 밝혀졌다(Whitesell et al., 1994). 겔다나마이신에 대한 생합성 유전자 클러스터가 클론화되고 서열분석되었다(Allen and Ritchie, 1994; Rascher et al., 2003; WO 03/106653).
DNA 서열은 NCBI 허가번호 AY179507 에서 이용가능하다. 스트렙토마이세스 하이그로스코피쿠스 아종 두아마이세티쿠스(duamyceticus) JCM4427로부터 유래된 유전공학적으로 제작된 겔다마이신 생산 균주의 분리, 및 4,5-디히드로-7-O-데스카르바모일-7-히드록시겔다나마이신 및 4,5-디히드로-7-O-데스카르바모일-7-히드록시-17-O-데메틸겔다나마이신의 분리가 최근에 기술되었다(Hong et al., 2004).
허비마이신 생산종 스트렙토마이세스 하이그로스코피쿠스(Streptomyces hygroscopicus) AM-3672에 겔다나마이신을 처리함으로써 화합물 15-히드록시겔다나마이신, 3중고리 겔다나마이신 유사체 KOSN-1633 및 메틸-겔다나마이신이 분리되었다(Hu et al., 2004).
두 화합물 17-포밀-17-데메톡시-18-O-21-O-디히드로겔나마이신 및 17-히드록시메틸-17-데메톡시겔다마이신이 S.하이그로스코피쿠스 K279-78로부터 분리되었다. S.하이그로스코피쿠스 K279-78은 허비마이신 생산 균주인 스트렙토마이세스 하이그로스코피쿠스 AM-3672 기원의 다양한 유전자를 포함하는 44kbp 크기의 삽입체를 갖는 코스미드 pKOS279-78을 포함하고 있는 S.하이그로스코피쿠스 NRRL 3602이다(Hu et al., 2004).
겔다나마이신 생합성 클러스터의 폴리케티드 합성효소의 네 가지 모듈 내에서 아실트랜스퍼라제(AT) 도메인을 치환시켰다(Patel et al., 2004). AT 치환은 완전하게 가공된 유사체 14-데스메틸-겔다마이신, 8-데스메틸-겔다마이신 및 6-데스메틸-겔다마이신과 완전하게 가공되지 않은 4,5-디히드로-6-데스메톡시-겔다마이신을 이끌어내는 모듈 1, 4 및 5 내에서 수행되었다.
모듈 7 AT의 치환은 세 종류의 2-데스메틸 화합물, KOSN1619, KOSN1558 및 KOSN1559을 생산해내는데, 이중 KOSN1559는 겔다마이신보다 4배 이상, 17-AGG보다 8배 이상의 결합력으로 Hsp90과 결합하는 2-데메틸-4,5-디히드로-17-데메톡시-21-데옥시 겔다마이신 유도체이다.
그러나 이는 SKBr3을 사용한 IC50 측정 결과를 반영하지 않은 것이다. 또 다른 유사체인 신규한 비벤조퀴노이드 겔다마이신 KOS-1806은 단일페놀기(monophenolic) 구조를 가진다(Rascher et al., 2005). KOS-1806에 대한 활성 데이터는 주어지지 않았다.
1979년에 안사마이신 항생제 허비마이신 A가 스트렙토마이세스 하이그로스코피쿠스 균주 No. AM-3672의 발효 배지로부터 분리되었고, 이의 잠재적 제초 활성에 따라 명명되었다. 항암활성은 세포의 변형된 형태를 되돌리는 약물을 스크리닝하기 위해 라우스 육종 바이러스(Rous sarcoma virus, RSV)의 온도감수성 변이체에 감염된 랫 신장 세포를 사용하여 평가되었다(for review see Uehara, 2003). 허비마이신 A는 Hsp90 샤페론 단백질에 결합하여 일차적으로 작용하는 것으로 주장되었지만, 보존된 시스테인 잔기에 직접 결합하고, 이어 키나아제를 불활성화시킨다는 것도 논의되었다(Uehara, 2003).
화학적 유도체가 분리되었고 벤조퀴논 핵의 C19의 치환체가 변형된 화합물 및 고리 사슬 내에서 할로겐화된 화합물이 허비마이신 A보다 독성이 더 적고 항암활성이 더 높은 것으로 나타났다(Omura et al., 1984; Shibata et al., 1986b). 허비마이신 생합성 유전자 클러스터의 서열은 WO 03/106653 및 최근 논문에서 확인되 었다(Rascher et al., 2005).
항진균 및 항원충 활성에 의해 확인된 안사마이신 화합물 막베신 (1) 및 18,21-디히드로막베신(2) (C-14919E-1 및 C-14919E-1)은 노카르디아(Nocardia) 종 No. C-14919 (Actinosynnema pretiosum subsp pretiosum ATCC 31280)의 배양물 상층액으로부터 분리되었다(Tanida et al., 1980; Muroi et al., 1980; Muroi et al., 1981; US 4,315,989 및 US 4,187,292). 18,21-디히드로막베신은 방향족 핵의 디히드로 퀴논 형태를 포함하는 특성을 가진다. 막베신 및 18,21-디히드로막베신 모두 쥣과 백혈병 P388 세포주와 같은 암세포주에 대해 유사한 항균 및 항암 활성을 가지는 것으로 나타났다(Ono et al., 1982).
역전사 효소 활성 및 말단 데옥시뉴클레오티딜 트랜스퍼라제 활성은 막베신에 의해 억제되지 않았다(Ono et al., 1982). 막베신의 Hsp90 억제기능은 문헌으로 보고된바 있다(Bohen, 1998; Liu et al., 1999). 막베신 및 18,21-디히드로막베신이 미생물 배양액에 첨가된 후, 화합물의 특정 위치 또는 위치들에서 메톡시기가 히드록시기로 변환되는 것은 US 4,421,687 및 US 4,512,975 특허에 기술되어 있다.
매우 다양한 토양 미생물을 선별하는 가운데, 스트렙토마이세스 속에 속하는 생산균주로부터 화합물 TAN-420A 내지 E가 확인되었다(7-11, EP 0 110 710).
Figure 112008045421569-PCT00002
2000년에 스트렙토마이세스 종. S6699의 세포 배양액으로부터 겔다나마이신과 관련이 있는 비-벤조퀴논 안사마이신 대사체인 레블라스틴의 분리 및 이의 류마티스 관절염 치료에 있어서 이의 잠재적 치료 가치가 기술되었다(Stead et al., 2000).
화학적으로 연관이 없는 벤조뷔논 안사마이신과 구별되는 또 다른 Hsp90 억제제인 라디시콜(모노르덴)은 곰팡이 모노스포리움 보노르덴(Monosporium bonorden)으로부터 항진균 활성이 처음 발견되었고(for review see Uehara, 2003), 그 구조는 넥트리아 라디시콜라로부터 분리된 14개 탄소의 마크롤리드와 동일한 것으로 밝혀졌다. 이의 항진균, 항균, 항원충 및 세포독성 활성에 부가적으로 연이어 Hsp90 샤페론 단백질의 억제제로서 확인되었다(for review see Uehara, 2003; Schulte et al., 1999). 라디시콜의 항-신생혈관생성 활성(Hur et al., 2002) 및 이의 반-합성 유도체(Kurebayashi et al., 2001)가 또한 기술된 바 있다.
최근의 관심은 안사마이신 항암 화합물의 새로운 세대로서 겔다나마이신의 17-아미노 유도체, 예를 들면 17-(알릴아미노)-17-데스메톡시 겔다나마이신(17-AGG, 12)(Hostein et al., 2001; Neckers, 2002; Nimmanapalli et al., 2003; Vasilevskaya et al., 2003; Smith-Jones et al., 2004) 및 17-데스메톡시-17-N,N-디메틸아미노에틸아미노-겔다나마이신(17-DMAG, 13)(Egorin et al., 2002; Jez et al., 2003)에 집중되어 있다(Bagatell and Whitesell, 2004).
더욱 최근에 겔다나마이신이 17-위치에서 유도되어 17-겔다나마이신 아미드, 카바메이트, 우레아 및 17-아릴겔다나마이신 유사체가 생성되었다(Le Brazidec et al., 2003). 60개 이상의 17-알킬아미노-17-데메톡시겔다나마이신 유사체의 라이브러리가 보고되었고 Hsp90에 대한 친화도 및 용해도가 시험되었다(Tian et al., 2004). 겔다나마이신의 독성을 감소시키기 위한 다른 연구는 종양-표적성 단일클론 항체와 결합시킴으로써 활성 겔다나마이신 화합물을 악성 종양 세포로 선택적 표적화 및 전달하는 것이다(Mandler et al., 2000).
Figure 112008045421569-PCT00003
이러한 유도체가 감소된 간독성을 나타내지만 제한된 용해도를 가진다. 예를 들면 17-AGG는 용해제(예를 들어 Cremophore, DMSO-egg lecithin)의 사용을 필요로 하고, 그 자체로 일부 환자에게 부작용을 일으킬 수 있다(Hu et al., 2004).
Hsp90 억제제의 안사마이신 계 대부분은 일반적인 구조적 모이어티를 갖는다: 단백질, 글루타티온 등과 같은 핵친화성 공유결합을 빠르게 형성할 수 있는 미켈(Michael) 수용체인 벤조퀴논.
벤조퀴논 모이어티는 또한 비특이적 독성을 야기하는 산소 라디칼이 형성되는 동안 디히드로퀴논과 산화환원 평형상태가 되도록 한다(Dikalov et al., 2002). 예를 들어 겔다나마이신 처리는 활성산소를 생성시킬 수 있다(Sreedhar et al., 2004a).
그러므로, 암 및/또는 B-세포 악성종양 치료에 이용할 수 있고, 바람직하게는 향상된 용해도, 투여시 개선된 약학적 성질 및 부작용이 감소된 안사마이신 같 은, 벤조퀴논 모이어티가 결여된 신규한 안사마이신 유도체를 규명할 필요가 남아 있다.
본 발명은 모생산균주의 유전적 조작에 의해 생성되는 신규한 안사마이신 유사체에 관한 것이다. 특히 본 발명은 현재 이용가능한 안사마이신과 비교하여 전체적으로 개선된 약제학적 성질을 가지는 21-데옥시막베신 유사체에 관한 것인데, 이들은 특히 독성, 글루타티온 같은 친핵체와의 결합력, 용해도, 대사안정성, 생체이용성 및 제형 가능성 중 하나 또는 그 이상의 성질에 있어서의 개선을 나타낸다. 바람직하게 21-데옥시막베신 유사체는 개선된 독성 및/또는 용해도를 나타낸다.
본 발명의 발명자들은 막베신 생합성과 관련된 유전자 클러스터를 클론화하고 규명하기 위해 많은 노력을 기울였다. 이러한 관점으로 벤조퀴논 모이어티 생성을 담당하는 유전자가 특별히 표적화되었다. 예를 들면, mbcM으로의 통합, 선택적인 유전자 삽입에 따른 mbcM 유전자의 전부 또는 일부를 포함하는 막베신 클러스터 부분의 표적화된 결실에 의하거나, MbcM을 비기능화시키는 다른 방법들, 예를 들면, 화학적인 억제, 위치특이돌연변이(site-directed mutagenesis), 또는 예를 들어 UV에 의한 세포의 돌연변이를 통해 벤조퀴논 모이어티가 제거된 신규한 유도체를 생산해냈다. 막베신의 post-PKS 변형에 관여하는 다른 유전자들의 선택적인 표적화에 의한 불활성화 또는 결실이 수행될 수 있다. 추가적으로 이러한 유전자들 중 일부는 mbcM과는 다르게 세포 내로 재도입될 수 있다.
post-PKS 유전자들의 선택적 표적화는 다양한 종류의 메커니즘에 의해 일어날 수 있다. 예를 들면, 통합, 선택적인 유전자 삽입에 따른 post-PKS 유전자 전부 또는 모두를 포함하는 막베신 클러스터 부위의 표적화된 결실에 의하거나, post-PKS 유전자 또는 이들이 코딩하는 효소를 비기능화시키는 다른 방법들, 예를 들면, 화학적인 억제, 위치특이돌연변이(site-directed mutagenesis) 또는 예를 들어 UV에 의한 세포의 돌연변이를 통해 일어날 수 있다.
그 결과, 본 발명은 21-데옥시막베신 유사체, 이러한 화합물의 제조방법, 및 이러한 화합물을 의학적으로 이용하거나 다른 화합물 생산에서 중간체로서 이용하는 방법을 제공한다.
따라서 첫 번째 양태로서, 본 발명은 통상적으로 C21 자리에 존재하는 산소원자가 결실된 막베신 유사체를 제공하는데, 막베신 내에서 산소 원자는 케토기로서 존재하며, 18,21-디히드로막베신 내에서 산소 원자는 히드록실기로서 존재한다.
더욱 구체적인 양태로서, 본 발명은 하기 화학식 1에 따른 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염을 제공한다.
Figure 112008045421569-PCT00004
R1 은 H, OH, 또는 OCH3 이다.
R2 는 H 또는 CH3이다.
R3 및 R4는 모두가 H이거나 함께 하나의 결합을 나타낸다(즉, C4와 C5는 이중결합임)
R5 는 H 또는 -C(O)-NH2 이다.
21-데옥시막베신 유사체는 또한 본원에서 “본 발명의 화합물”로 언급될 수 있으며, 상기 용어는 본원에서 혼용될 수 있다.
상기 구조는 대표적인 호변체(tautomer)를 나타내며, 본 발명은 화학식 (1) 화합물의 모든 호변체, 예를 들어 에놀 화합물이 예시된 경우에는 케토화합물 및 그 반대의 경우를 포함한다.
본 발명은 상기에서 보인 구조(1)로 정의된 화합물의 입체이성질체 모두를 포함한다.
또 다른 양태로서, 본 발명은 약제학적인 목적으로 화학식 1과 같은 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염을 제공한다.
정의
관사 "하나의(a)"와 "하나의(an)"는 관사의 문법적 객체들 중 하나 또는 하나 이상(즉, 적어도 하나)을 지칭하도록 본원 명세서에서 사용되었다. 예를 들면, "하나의 유사체"는 한 개의 유사체 또는 한 개 이상의 유사체를 의미한다.
본원에서 사용되는 용어 "유사체(들)"는 서로 구조적으로 유사하지만 구성상에서 조금 차이가 있는(한 원자가 또 다른 원자로 치환되거나 특정 기능기가 존재 또는 부재하는 경우) 화학적 화합물을 의미한다.
본원에서 사용되는 용어 “상동체(들)”은 다른 막베신 생산 균주로부터 유래한 대체가능한 막베신 생합성 클러스터로부터 유래하거나, 예를 들면, 겔다나마이신, 허비마이신 또는 레블라스타틴으로부터의 대체가능한 안사마이신 생합성 유전자 클러스터로부터 유래한 상동체로부터 유래하는 본원에 기술된 유전자 또는 유전자에 의해 코딩되는 단백질의 상동체를 의미한다. 이러한 상동체는 같은 기능을 수행하는 단백질을 코딩하거나, 막베신 또는 관련된 안사마이신 폴리케티드 생합성에서 이들 자체로 상기 유전자 또는 단백질과 같은 기능을 수행할 수 있다. 바람직하게는, 이러한 상동체는 본원에 기재된 구체적 유전자 서열(표 3, 서열번호 17은 클러스터 내의 모든 유전자 서열이며, 이로부터 구체적인 유전자가 추론될 수 있다)에 대해 적어도 40%의 서열 동일성, 바람직하게 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 또는 적어도 95%의 서열 상동성을 가진다. 퍼센트 상동성은 NCBI 웹사이트 상에서 이용이 가능한 BLASTn 또는 BLASTp 같은 당업계에 알려진 프로그램을 사용하여 계산할 수 있다.
본원에서 사용된 용어 “암”은 피부나 신체 기관, 예를 들어 유방, 전립선, 폐, 신장, 췌장, 뇌, 위 또는 장에서의 양성 또는 악성 신 생장을 의미한다. 암은 인접 조직으로 침윤되고 떨어져 있는 기관, 예를 들어 뼈, 간, 폐 또는 뇌로 퍼지는(전이) 경향이 있다. 본원에서 사용된 용어 암은 흑색종, 임파종, 백혈병, 섬유육종, 횡문근육종 및 비만세포종과 같지만 이에 한정되지 않는 전이성 종양 세포 형태, 및 직장암, 전립선암, 소세포폐암 및 비소세포폐암, 유방암, 췌장암, 방광암, 신장암, 위암, 교모세포암, 원발성 간암 및 난소암과 같지만 이에 한정되지 않는 조직암 형태를 포함한다.
본원에서 사용된 용어 "B-세포 악성 종양"은 만성 림프성 백혈병(CLL), 다발성 골수종 및 비호지킨 임파종(non-Hodgkin's lymphoma, NHL)을 포함하는 질병 그 룹을 포함한다. 이들은 혈액 및 혈액 형성 기관의 종양성 질환이다. 이들은 골수 및 면역계 기능 장애로 인해 발생하며, 환자를 감염 및 출혈에 매우 민감해지게 한다.
본원에서 사용된 용어 "생체이용도"는 투여 후 약물 또는 다른 물질이 흡수되거나 생물학적 활성 자리에서 이용가능하게 되는 정도 또는 속도를 의미한다. 이러한 성질은 화합물의 용해도, 위에서의 흡수율, 단백질 결합 정도 및 대사 등을 포함하는 수많은 요소에 의존한다. 당해 분야의 당업자에게 익숙한 생체 이용가능성을 위한 다양한 테스트가 본원에 기술되어 있다(Egorin et al. (2002)).
본원에서 사용된 용어 “수용해도”는 수성 매질, 예를 들어, pH 7.3 인산 완충 식염수(PBS)에서의 용해도를 의미한다. 용해도를 위한 테스트는 “수용해도 분석”으로서 하기 실험예에 주어져 있다.
본원에서 사용된 용어 “post-PKS 유전자(들)”은 폴리케티드의 post-폴리케티드 합성 효소의 변형에 요구되는 유전자를 의미한다. 예를 들어, 모노옥시게나제, O-메틸트랜스퍼라제 및 카르바모일트랜스퍼라제이 있지만 이에 한정되지 않는다. 구체적으로, 막베신 계 내의 이러한 변형 유전자는 mbcM , mbcN , mbcP , mbcMTI, mbcMT2mbcP450을 포함한다.
화학식 (I)의 화합물과 같은 본원 발명 화합물의 약제학적으로 허용가능한 염은 약제학적으로 허용가능한 무기산 또는 유기산 또는 염기로부터 형성되는 통상적인 염뿐만 아니라 4차 암모늄산 부가염을 포함한다. 적절한 산성염의 보다 구체적인 예로는 염산염, 브롬화수소산염, 황산염, 인산염, 질산염, 과염소산염, 푸마르산염, 아세트산염, 프로피온산염, 숙신산염, 글리콜산염, 포름산염, 젖산염, 말레산염, 타르타르산염, 시트르산염, 팔모익산(palmoic acid)염, 말론산염, 히드록시말레산염, 페닐아세트산염, 글루탐산염, 벤조산염, 살리실산염, 푸마르산염, 톨루엔술폰산염, 메탄술폰산염, 나프탈렌-2-술폰산염, 벤젠술폰산염, 히드록시나프토익산염, 요오드화수소산염, 말산염, 스테로익산(steroic acid)염, 타닌산염 및 그 등가물을 포함한다. 옥살산과 같은 기타 산들은 그 자체로는 약제학적으로 허용가능하지 않지만, 본원 발명의 화합물과 그들의 약제학적으로 허용가능한 염을 얻을 때 중간체로서 유용한 염의 제조에서 유용할 수 있다.
적절한 염기성염의 보다 구체적인 예로는 나트륨염, 리튬염, 칼륨염, 마그네슘염, 알루미늄염, 칼슘염, 아연염, N,N'-디벤질에틸렌디아민염, 클로로프로카인염, 콜린염, 디에탄올아민염, 에틸렌디아민염, N-메틸글루카민염 및 프로카인염을 포함한다. 본 발명에 따른 화합물에 대한 하기의 언급에는 화학식(I)의 화합물과 약제학적으로 허용가능한 이의 염 모두를 포함한다.
본원에서 사용된 용어 “18,21-디히드로막베신” 및 “막베신 II"(막베신의 디히드로퀴논 형태)는 혼용될 수 있다.
상세한 설명
본 발명은 상기에서 설명한 바와 같이 21-데옥시막베신 유사체, 이러한 화합물의 제조방법, 및 이러한 화합물을 의학적으로 이용하는 방법 및 중간체 또는 추가적인 반합성 유도체 또는 생체내변환 방법에 의한 유도체로서 이용하는 방법을 제공한다.
바람직하게는 R1은 H 또는 OH이다. 본 발명의 한 실시예에서 R1은 H이다. 본 발명의 또 다른 실시예에서 R1은 OH이다.
바람직하게는 R2는 H이다.
바람직하게는 R3 및 R4 는 모두 H이다.
바람직하게는 R5는 -C(O)-NH2이다.
본 발명의 바람직한 실시예에서 R1은 H, R2는 H, R3 및 R4는 모두 H, R5는 -C(O)-NH2이다.
본 발명의 또 다른 바람직한 실시예에서 R1은 OH, R2는 H, R3 및 R4는 모두 H, R5는 -C(O)-NH2이다.
안사 고리에 연결된 비-수소 곁사슬의 입체화학은 바람직하게 하기 구조(15)와 도 1 및 도 2에 나타낸 바와 같다.
본 발명은 또한 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염과 함께 하나 또는 그 이상의 허용가능한 담체를 포함하는 약제학적 조성물을 제공한다.
본 발명은 또한 21-데옥시막베신 유사체를 생체내변환이나 합성화학을 통한 다른 변형을 위한 기질로서 이용하는 방법을 제공한다.
임상적 시도를 해온 겔다나마이신 및 17-AGG 같은 기존의 안사마이신 Hsp90 억제제들 일부는 양호하지 않은 약제학적 성질, 양호하지 않은 수용해도 및 양호하지 않은 생체이용성을 가진다.
본 발명은 수용해도와 같이 개선된 성질을 가지는 신규한 21-데옥시막베신 유사체를 제공한다. 당업자는 전형적인 방법을 사용하여 본 발명에서 제시된 화합물의 수용해도를 쉽게 결정할 수 있다. 대표적 방법은 본원 실시예에 나타냈다.
하나의 양태로서, 본 발명은 의약 제조분야에서 21-데옥시막베신 유사체의 용도를 제공한다. 다른 일 실시예에서 본 발명은 암 및/또는 B-세포 악성종양 치료를 위한 의약 제조에서 21-데옥시막베신 유사체의 용도를 제공한다. 다른 일 실시 예에서 본 발명은 말라리아, 진균성 감염, 중추신경계 질환, 혈관신생 의존성 질환, 자가면역질환의 치료 및/또는 암의 예방적 전처리를 위한 의약 제조에서 21-데옥시막베신 유사체의 용도를 제공한다.
또 다른 양태로서, 본 발명은 의료분야에서 21-데옥시막베신 유사체의 용도를 제공한다. 다른 일 실시예에서 본 발명은 암 및/또는 B-세포 악성종양 치료에 있어 21-데옥시막베신 유사체의 용도를 제공한다. 다른 일 실시예에서 본 발명은 말라리아, 진균성 감염, 중추신경계 질환, 퇴행성 신경질환, 혈관신생 의존성 질환, 자가면역질환의 치료 및/또는 암의 예방적 전처리를 위한 의약 제조에서의 21-데옥시막베신 유사체의 용도를 제공한다.
다른 일 실시예에서 본 발명은 암 및/또는 B-세포 악성종양 치료방법을 제공하는데, 상기 방법은 치료학적으로 유효한 양의 21-데옥시막베신 유사체를 필요로 하는 환자에게 투여하는 단계를 포함한다. 다른 일 실시예에서 본 발명은 말라리아, 진균성 감염, 중추신경계 질환, 퇴행성 신경질환, 혈관신생 의존성 질환, 자가면역질환 및/또는 암의 예방적 전처리를 위한 치료 방법을 제공하는데, 상기 방법은 치료학적으로 유효한 양의 21-데옥시막베신 유사체를 필요로 하는 환자에게 투여하는 단계를 포함한다.
상기에서 기재한 바와 같이, 본 발명의 화합물은 암 및/또는 B-세포 악성종 양 치료에 유용할 것으로 기대된다. 본 발명의 화합물 및 특별히 Hsp90에 대해 양호한 선택성 및/또는 양호한 독성학적 성질 및/또는 양호한 양물동력학을 가질 수 있는 본 발명의 화합물은 예를 들면, 이에 제한되지는 않지만 말라리아, 진균성 감염, 중추신경계 질환, 퇴행성 신경질환, 혈관신생 의존성 질환, 류마티스성 관절염 같은 자가면역질환의 다른 징후들의 치료나 암의 예방적 전처리에 효과적일 수 있다.
중추신경계 질환 및 퇴행성 신경질환은 알츠하이머병, 파킨슨병, 헌팅턴병, 프리온병(광우병), 척수인경 근위축증(SBMA), 근위축성 측삭 경화증(ALS)을 포함하지만, 이에 제한되는 것은 아니다.
혈관신생 의존성 질병은 노인성 황반변성, 당뇨병성 망막증 및 다양한 다른 안과질환, 동맥경화증 및 류마티스성 관절염을 포함하지만, 이에 제한되는 것은 아니다.
자가면역질환은 류마티스성 관절염, 다발성 경화증, 제1형 당뇨병, 전신성 홍반성 루푸스, 건선을 포함하지만, 이에 제한되는 것은 아니다.
“환자”는 인간 및 다른 동물(특별히 포유류) 대상을 포함하며, 바람직하게는 인간 대상이다. 따라서, 본 발명의 21-데옥시막베신 유사체의 상기 방법 및 용 도는 인간 의학 및 수의학 분야에 이용될 수 있으며, 바람직하게는 인간 의학분야이다.
상기에서 언급된 본 발명의 화합물 또는 이의 제형은 이에 제한되지는 않지만 예를 들면, 비경구 투여(정맥내 투여 포함), 경구 투여, 국부 투여(구강, 설하, 경피를 포함), 의료용 장치(예를 들어, 스텐트), 흡입에 의해, 또는 주사(피하 또는 근육내)를 통한 소정의 통상적인 방법에 의해 투여될 수 있다. 치료는 단일 투여 또는 일정 시간에 걸친 복수회의 투여로 이루어질 수 있다.
본원 발명의 화합물은 단독으로 투여되는 것이 가능하지만, 하나 또는 그 이상의 허용 가능한 담체와 함께 약제학적 제형으로서 제공되는 것이 바람직하다.
이에 본 발명의 화합물과 함께 하나 또는 그 이상의 약제학적으로 허용가능한 희석제 또는 담체를 포함하는 약제학적 조성이 제공된다.
상기 희석제 또는 담체는 본 발명의 화합물과 양립할 수 있다는 의미에서 "허용가능"해야만 하고 복용자에게 해롭지 않아야 한다. 적합한 담체의 예는 하기에 보다 상세하게 기술한다.
본 발명의 화합물은 단독으로 또는 다른 치료제와 복합적으로 투여될 수 있다. 두 가지(또는 그 이상) 제제의 복합투여는 각각을 사용할 때보다 훨씬 작은 양을 투여해야 부작용을 줄일 수 있다. 또한, 이전의 치료에 의해 질병에 내성이 생 긴 경우에도 암과 같은 질병의 재감작(resensitisation)을 가능하게 한다.
또한, 본 발명의 화합물 및 다른 치료제를 하나 또는 그 이상의 약제학적으로 허용가능한 희석제 또는 담체와 함께 포함하는 약제학적 조성물을 제공한다.
또 다른 양태로서, 본 발명은 암 또는 B-세포 악성 종양 치료를 위한 세포독성제 또는 세포증식 억제제 같은 제2의 제제와 함께 복합 치료를 하는 데 있어서의 본 발명의 화합물의 용도를 제공한다.
일 실시예에서, 본 발명의 화합물은 암 또는 B-세포 악성 종양 치료를 위해 세포독성제 또는 세포증식억제제와 같은 다른 치료제와 함께 복합 투여된다. 또한 전형적인 제제는 알킬화제제 및 유사분열 억제제(토포이소머라제 II 억제제 및 튜불린 억제제 포함) 같은 세포독성제를 포함한다. 또 다른 전형적인 제제는 단백질 키나아제 억제제 및 타이로신 키나아제 수용체 차단제 같은 DNA 결합제, 항대사제 및 세포증식 억제제를 포함한다.
적합한 제제는 메토트렉사이트, 류코보린, 프레니손, 블레오마이신, 사이클로포스파미드, 5-플루오르우라실, 파클리탁셀, 도세탁셀, 빈크리스틴, 빈블라스틴, 비노렐빈, 독소루비신(아드리아마이신), 타목시펜, 토레미펜, 메게스트롤 아세테이트, 아나스트로졸, 고세렐린, 항-HER2 단일 클론 항체(예를 들어, Herceptin™ 로 시판되는 트라스투주맙), 카페시타빈, 라록시펜 염화수소, EGFR 억제제(예를 들어, Iressa로 시판되는 게피티닙, Tarceva™로 시판되는 엘로티닙, Erbitux™로 시판되는 세툭시맙), VEGF 억제제(예를 들어, Avastin™으로 시판되는 베바시주맙), 프로테아좀 억제제(예를 들어, Velcade™로 시판되는 보르테조밉) 또는 Glivec로 시판되는 이마티닙을 포함하나 이에 한정되지 않는다.
또한, 적합한 제제는 시스플라틴, 사이타라빈, 사이클로헥시클로로데틸니트로스우레아, 젬시타빈, 이포스프아미드, 류코보린, 미토마이신, 미토잔트론, 옥살리플라틴, 탁솔 및 빈데신을 포함하는 탁산 같은 통상적인 화학치료제; 호르몬 치료제; 단일클론항체 치료제; 다사티닙, 라파티닙 같은 단백질 키나아제 억제제; 보리노스타트 같은 히스톤 데아세틸라제(HDAC) 억제제; 수니티닙, 소파레닙, 레나리도미드 같은 혈관신생 억제제; 및 템시로리무스 같은 mTOR 억제제를 포함하나 이에 한정되지 않는다. 추가적으로, 본 발명의 화합물은 방사선 치료 또는 외과 수술을 포함하지만 이에 한정되지 않는 다른 치료와 병용하여 투여될 수 있다.
제형은 단위 투약 형태로 전형적으로 제공될 수 있고, 제약 업계에 잘 알려져 있는 방법 중 어느 하나를 이용하여 제조될 수 있다. 이러한 방법은 활성 성분(본 발명의 화합물)을 하나 또는 그 이상의 부속 성분으로 구성되는 담체와 연계시키는 단계를 포함한다. 일반적으로 상기 제형은 활성 성분을 액체 담체 또는 미세하게 분쇄된 고체 담체 또는 둘 모두와 연계시키고, 다음으로 필요에 따라 제품 모양을 만드는 과정에 의해 균일하고 친밀하게 제조된다.
본 발명의 화합물은 약제학적으로 허용 가능한 투여 형태의 활성 성분, 선택적으로 무독성 유기 또는 무기, 산 또는 염기, 부가 염을 포함하는 약제학적 제형의 형태로 경구 또는 임의의 비경구 경로 중 어느 하나에 의해 정상적으로 투여될 것이다. 투여 경로뿐만 아니라, 질병 및 치료될 환자에 따라 상기 조성물은 다양한 투여량으로 투여될 수 있다.
예를 들어, 본 발명의 화합물은 즉시-, 지연- 또는 조절-방출 적용을 위해 정제, 캡슐, 좌제, 엘릭서, 용액 또는 현탁액의 형태로 경구, 구강 또는 설하 투여될 수 있으며, 이들은 향료 또는 색소를 포함할 수 있다.
이러한 정제는 미세결정 셀룰로즈, 락토오즈, 시트르산 나트륨, 탄산 칼슘, 제2인산 칼슘 및 글리신과 같은 부형제, 전분(바람직하게 옥수수, 감자 또는 타피오카 전분), 전분 글리콜산 나트륨(sodium starch glycolate), 크로스카멜로스 나트륨 및 특정 복합 규산염과 같은 붕해제, 및 폴리비닐피롤리돈, 히드록시프로필메틸셀룰로스(HPMC), 히드록시-프로필셀룰로스(HPC), 수크로스, 젤라틴 및 아카시아와 같은 과립화 바인더를 포함할 수 있다. 추가적으로, 마그네슘 스테아르산, 스테아르산, 글리세릴 베헤네이트 및 탈크와 같은 윤활제를 포함할 수 있다.
유사한 형태의 고형 조성물은 또한 젤라틴 캡슐의 충진제로 사용될 수 있다. 이러한 측면에서 바람직한 부형제는 락토오스, 전분, 셀룰로스, 유당 또는 고분자 량의 폴리에틸렌 글리콜이 포함한다. 수성 현탁액 및/또는 엘릭서를 위해, 본 발명의 화합물은 다양한 가미제 또는 향료, 칼라재 또는 색소와 함께, 유화제 및/또는 현탁제와 함께, 물, 에탄올, 프로필렌 글리콜 및 글리세린과 함께, 및 이들의 혼합물과 함께 혼합될 수 있다.
정제는 선택적으로 하나 또는 그 이상의 부속 성분과 함께 압착 또는 주조되어 만들어질 수 있다.
압착된 정제는 바인더(예를 들어, 포비돈, 젤라틴, 히드록시프로필메틸 셀룰로스), 윤활제, 비활성 희석제, 보존제, 붕해제(예를 들어, 전분 글리콜산 나트륨, 교차-결합된 포비돈, 교차-결합된 카르복시메틸 셀룰로스 나트륨), 표면-활성제 또는 분산제와 선택적으로 혼합된 분말 또는 과립과 같은 자유 유동성 형태의 활성 성분을 적합한 기계 안에서 압착시켜 제조될 수 있다. 주조된 정제는 비활성 액체 희석제로 수화된 분말 화합물의 혼합물을 적합한 기계 안에서 주조하여 만들어질 수 있다. 상기 정제는 선택적으로 코팅되거나 자국을 낼 수 있고, 활성 성분을 느리게 또는 조절하여 방출되도록, 예를 들어 소정 방출 특성을 제공하는 다양한 함량의 히드록시프로필메틸 셀룰로스를 이용하여 제형화될 수 있다.
경구 투여에 적합한 본원 발명에 따른 제형은 각각이 미리 정해진 함량의 활성 성분을 포함하는, 캡슐, 교갑(cachet) 또는 정제와 같은 분리된 단위로서; 분말 또는 과립으로서; 수성 액체 또는 비-수성 액체 상태의 액제 또는 현탁제로서; 또 는 수중유(oil-in-water) 액체형 에멀젼 또는 유중수(water-in-oil) 액체형 에멀젼으로서 제공될 수 있다. 상기 활성 성분은 또한 환약(bolus), 연약(electuary), 또는 페이스트(paste)로서 제공될 수 있다.
입 안의 국소 투여에 적합한 제제는 성분, 일반적으로 수크로스 및 아카시아 또는 트래거캔스의 향기나는 기초 제형에 활성 성분을 포함하는 로젠지(lozenge); 젤라틴과 글리세린, 또는 수크로스와 아카시아와 같은 비활성 성분에 활성 성분을 포함하는 향정(pastille); 및 적절한 액체형 캐리어에 활성 성분을 포함하는 구강-세척액을 포함한다.
상기에서 특별히 언급된 성분들뿐만 아니라, 본 발명의 제형은 문제가 되는 제제의 형태를 고려하여 당해 분야에서 통상적인 기타 물질을 포함할 수 있는데, 예를 들면, 경구 투여를 위해 적절한 제제로는 착향료를 포함할 수 있다.
국부 투여에 적합한 약제학적 조성물은 연고, 크림, 현탁액, 로션, 분말, 용액, 페이스트, 겔, 약물이 함침된 드레싱(impregnated dressing), 스프레이, 에어졸 또는 오일, 경피 기구, 분진성 분말(dusting powder) 등으로 제형화될 수 있다. 이러한 조성물은 활성제를 포함하는 전형적인 방법을 통해 제조될 수 있다. 따라서, 이들은 또한 크림 또는 연고 내에 보존제, 약물 침투를 돕는 용매, 연화제 및 로션 내에 에탄올 또는 올레일 알코올과 같은 양립할 수 있는 전형적인 담체 및 첨 가제를 포함할 수 있다. 이러한 담체는 조성물의 약 1% 이상 내지 약 98%로 제공될 수 있다. 보다 일반적으로 조성물의 약 80% 이상을 형성할 것이다. 예시하여 설명하면, 크림 또는 연고는 소정의 균일성을 갖는 크림 또는 연고를 제조하기에 충분한 양의 화합물을 약 5-10중량%의 화합물을 포함하는, 충분한 양의 친수성 재료와 물을 혼합하여 제조한다.
경피 투여를 위한 약제학적 조성물은 오랜 시간 동안 환자의 표피와 밀접하게 접촉되어 있도록 분리 패치로 제공될 수 있다. 예를 들어 활성 성분은 전리 요법에 의해 패치로부터 전달될 수 있다.
외부 조직, 예를 들어, 입 및 피부에 적용하기 위해서, 조성물은 국부 연고 또는 크림으로 바람직하게 적용된다. 연고로 제형화된 경우, 활성 성분은 파라핀 또는 물과 섞일 수 있는(water-miscible) 연고 베이스를 사용할 수 있다.
대안적으로, 활성제는 수중유 크림 베이스 또는 유중수 베이스로 구성된 크림으로 제형화될 수 있다.
비경구 투여를 위해, 유입 단위 투약 형태는 활성 성분 및 살균된 부형제를 이용하여 제조할 수 있는데, 예를 들어, 물, 알코올, 폴리올, 글리세린 및 식물성 오일과 같지만 이에 한정되지 않으며, 바람직하게는 물이다. 상기 부형제 및 사용 된 농도에 따라, 상기 활성 성분은 부형제에 현탁되거나 용해될 수 있다. 용액을 제조하는 데 있어서, 상기 활성 성분은 주입을 위해 물에 용해할 수 있고 적합한 용기 또는 앰플에 충진되고 봉입되기 전에 여과 살균될 수 있다.
유리하게, 국소 마취제, 보존제 및 완충제와 같은 제제는 부형제에 용해될 수 있다. 안정성을 증진시키기 위해, 조성물은 용기에 충진하고 진공 상태에서 물을 제거한 후 냉동시킬 수 있다. 냉동 건조된 분말은 다음으로 용기에 봉입되고 주입하기 위해 동반된 물의 용기는 사용하기 전에 액상으로 되게 하도록 제공할 수 있다.
비경구 현탁액은, 활성 성분이 용해되는 대신에 부형제에 현탁되고 여과를 통해 살균될 수 없는 것을 제외하고, 실질적으로 용액과 동일한 방법으로 제조한다. 상기 활성 성분은 살균된 부형약에 현탁시키기 전 산화 에틸렌에 노출시켜 살균할 수 있다. 유리하게, 계면활성제 또는 침윤제가 조성물에 포함되어 상기 활성 성분의 균일한 분포를 촉진한다.
본 발명의 화합물은 또한 당업계에 알려진 의료 장치를 이용하여 투여될 수 있다. 예를 들어, 일 실시예에서, 본 발명의 약제학적 조성물은 미국특허 제5,399,163호, 미국특허 제5,383,851호, 미국특허 제5,312,335호, 미국특허 제5,064,413호, 미국특허 제4,941,880호, 미국특허 제4,790,824호 또는 미국특허 제 4,596,556호에서 공지한 장치와 같은 바늘없는 피하주사 주입 장치로 투여될 수 있다. 본 발명에서 유용한 잘 알려진 이식체 및 모듈의 예는, 조절된 속도로 약물을 투약하기 위한 이식 가능한 미세-주입 펌프를 공지한 미국특허 제4,487,603호; 피부를 통해 약물을 투여하기 위한 치료용 장치를 공지한 미국특허 제4,486,194호; 정확한 주입 속도로 약물을 전달하기 위한 약물 주입 펌프를 공지한 미국특허 제 4,447,233호; 연속적인 약물 전달을 위한 다양한 유입 속도의 이식 가능한 주입 기구를 공지한 미국특허 제4,447,224호; 멀티-챔버 구획(multi-chamber compartment)을 갖는 삼투 약물 전달 시스템을 공지한 미국특허 제4,439,196호; 및 삼투 약물 전달 시스템을 공지한 미국특허 제4,475,196호를 포함한다. 많은 다른 이러한 이식체, 전달 시스템 및 모듈은 당업계에 알려져 있다.
본 발명의 화합물이 투여될 투여량은 특정 화합물, 관련 질환, 환자 및 질환의 성질 및 심각도, 환자의 신체적 조건, 선택된 투여 경로에 따라 다양할 것이다. 적절한 투여량은 당업자에 의해 쉽게 결정될 수 있다.
상기 조성물은 투여 방법에 따라 본 발명의 화합물을 0.1중량% 이상, 바람직하게 5 내지 60중량%, 보다 바람직하게 10 내지 30중량%로 포함할 수 있다.
본 발명 화합물의 개별적인 투여 제형의 최적 함량 및 투여 간격은 치료 조 건의 성질 및 정도, 투여 제형, 경로 및 부위, 및 치료될 특정 환자의 나이와 상태에 의해 결정될 것이고, 의사는 궁극적으로 사용될 적절한 투여 제형을 결정할 것이라는 것은 당해 분야의 당업자에 의해 인식될 것이다. 이러한 투여 제형은 적절할 정도로 자주 반복될 수 있다. 부작용이 생긴다면, 보통의 임상 진료에 따라서 투여 제형의 함량 및/또는 빈도가 변경되거나 또는 감소될 수 있다.
또 다른 양태로서, 본 발명은 21-데옥시막베신 유사체의 제조방법을 제공하는 것이다.
막베신은 두 단계로 생합성되는 것이 고려될 수 있다. 첫 번째 단계에서는 코어-PKS 유전자가 2-탄소의 반복 어셈블리에 의해 마크롤리드 코어를 조립하는데, 이들은 이후 도1에서 보듯이, 첫 번째 효소-없는 중간체 “프리-막베신”을 형성하기 위해 환형화된다. 두 번째 단계에서는 일련의“post-PKS" 절단 효소들이(예를 들면, P450 모노옥시게나제, 메틸트랜스퍼라제, FAD-의존성 옥시게나제 및 카르바모일트랜스퍼라제) 프리(pre)-막베신 주형에 다양한 부가적 기들을 첨가하기 위해 작용하고, 도 2와 같은 최종적인 모체 화합물 구조를 생성한다. 21 데옥시막베신 유사체는 비슷한 방법으로 생합성될 수 있다.
이러한 생합성 생산물은 신규한 화합물을 생산할 수 있는 적합한 생산 균주의 제작을 통해 얻어질 수 있다. 구체적으로, 본 발명은 하기의 단계를 포함하는 21-데옥시막베신 유사체의 제조방법을 제공한다.
a) 적절한 조건에서 배양시 막베신 또는 이의 유사체를 생산하는 첫번째 숙주 균주를 제공하는 단계;
b) 하나 또는 그 이상의 post-PKS 유전자, 여기서 상기 post-PKS 유전자들 중 적어도 하나는 mbcM 또는 이의 상동체인 유전자를 결실시키거나 불활성화시키는 단계;
c) 상기 변형된 숙주 균주를 21-데옥시막베신 유사체 생산에 적합한 환경에서 배양하는 단계; 및
d) 상기 생산된 화합물을 선택적으로 분리하는 단계.
단계 (a)에서 “막베신 및 이의 유사체”는 막베신 또는 R1-R5 에 의한 변형을 포함하는 이들의 유사체를 의미한다.
단계 (b)에서 하나 또는 그 이상의 post-PKS 유전자, 여기서 post-PKS 유전자들 중 적어도 하나는 mbcM 또는 이의 상동체인 유전자를 결실시키거나 불활성화시키는 것은 선별적으로 적합하게 이루어질 수 있다.
다른 일 실시예에서, 단계 b)는 DNA를 mbcM 유전자 또는 이의 상동체 내로 통합시켜 기능적인 mbcM 단백질을 생산할 수 없도록 mbcM(또는 이의 상동체)을 불활성화시키는 것을 포함한다.
대체가능한 하나의 실시예에서, 단계 b)는 mbcM 유전자 또는 이의 상동체를 표적화하여 결실시키는 것을 포함한다.
다른 일 실시예에서 mbcM 또는 이의 상동체는 위치 특이 돌연변이(site-directed mutagenesis)에 의해 불활성화된다. 다른 일 실시예에서 상기 단계 a)의 숙주 균주는 돌연변이 대상이며, 하나 또는 그 이상의 post-PKS 효소들, 여기서 이들 중 적어도 하나는 MbcM인 효소가 기능하지 않는 변형된 균주가 선택되었다.
본 발명은 또한 mbcM 또는 이의 유사체의 발현을 억제할 수 있는 조절자를 돌연변이 시키는 것을 포함하는데, 당업자는 조절자의 결실 또는 불활성화가 유전자의 결실 또는 불활성화와 같은 효과를 낼 수 있다는 것을 이해할 수 있을 것이다.
본 발명의 구체적 실시예에서, post-PKS 유전자를 선택적으로 결실시키거나 불활성화시키는 방법은 하기의 단계를 포함한다;
(i) 관심 유전자(예를 들어, 겔다나마이신 PKS 생합성 클러스터 및/또는 라파마이신 생합성 클라스터)의 상동체에 기초한 축퇴성 올리고를 고안하고, PCR 반응에서 이러한 프라이머를 사용하여 적합한 막베신 생산 균주로부터 관심 유전자(예를 들어, mbcM)의 내부적 단편을 분리하는 단계;
(ii) 이러한 단편을 포함하는 플라스미드를 동일한 균주 또는 다른 막베신 생산 균주로 통합시켜, 상동재조합에 의해 표적화된 유전자(예를 들어, mbcM 또는 이의 상동체)를 파괴시키는 단계;
(iii) 이렇게 생산된 균주를 막베신 유사체, 예를 들어 21-데옥시막베신 유사체 생산에 적합한 환경에서 배양하는 단계.
구체적 일 실시예에서, 단계 (i)의 막베신-생산 균주는 악티노신네마 미럼(Actinosynnema mirum; A. mirum)이다. 또 다른 구체적 실시예에서 단계 (ii)의 막베신-생산 균주는 A. 프레티오섬(A. pretiosum)이다.
당업자는 상기에서 기술된 대체가능한 방법들을 사용하여 균등한 균주를 얻을 수 있음을 이해할 수 있을 것이다. 예를 들어:
· 축퇴성 올리고는 이에 제한되는 것은 아니나 예를 들면, A.pretiosum 또는 A.mirum 같은 막베신 생산 균주로부터 관심 유전자를 증폭하는 데 이용될 수 있다.
· 다른 축퇴성 올리고는 막베신 생산체의 mbcM 유전자 또는 그 상동체의 적절한 부분을 성공적으로 증폭시킬 수 있도록 고안될 수 있다.
· A.pretiosum 균주의 mbcM 유전자 서열은 A.pretiosum의 mbcM 유전자에 특이적인 올리고를 합성하는데 사용될 수 있으며, 이때 내부적 단편은 어느 막베신 생산 균주, 예를 들면 A.pretiosum 또는 Actionosynnema mirum(A.mirum)로부터 증폭될 수 있다.
· A.pretiosum 균주의 mbcM 유전자 서열은 A.pretiosum의 mbcM 유전자에 대한 축퇴성 올리고를 생성하기 위해 상동 유전자 서열과 함께 이용될 수 있으며, 이때 내부적 단편은 어느 막베신 생산 균주, 예를 들면 A.pretiosum 또는 Actionosynnema mirum(A.mirum)로부터 증폭될 수 있다.
본 발명의 또 다른 양태로서, mbcM에 더하여 추가적인 post-PKS 유전자가 결실되거나 불활성화될 수 있다. 도 2는 막베신 생합성 클러스터 내의 post-PKS 유전자의 활성을 나타낸 것이다. 따라서, 당업자는 관심 화합물을 생산할 수 있는 균주에 이르기 위해 추가적인 post-PKS 유전자의 결실 또는 불활성화가 필요할 수 있음을 확인할 수 있다.
본 발명의 또 다른 양태로서, 상기와 같이 mbcM을 포함하는 하나 또는 그 이상의 post-PKS 유전자가 결실되거나 불활성화되도록 제작된 균주 내로 예를 들면, 대체가능한 막베신 생산 균주 또는 동종의 균주로부터 유래된, mbcM 또는 이의 상동체를 포함하지 않는 하나 또는 그 이상의 동종의 post PKS 유전자가 재도입된다.
이에, 본 발명의 또 다른 양태에 따라, 21-데옥시막베신 유사체의 제조방법이 제공되며, 상기 방법은 하기의 단계를 포함한다:
a) 적합한 환경에서 배양 시 막베신을 생산하는 첫 번째 숙주 균주를 제공하는 단계;
b) 하나 또는 그 이상의 post-PKS 유전자, 여기서 상기 post-PKS 유전자들 중 적어도 하나는 mbcM 또는 이의 상동체인 유전자를 결실시키거나 불활성화시키는 단계;
c) mbcM을 포함하지 않는 post-PKS 유전자 일부 또는 전부를 재도입시키는 단계;
d) 21-데옥시막베신 유사체 생산을 위한 적합한 환경 하에서 상기 변형된 숙주 균주를 배양하는 단계; 및
e) 상기 생산된 화합물을 선택적으로 분리하는 단계.
또 다른 일 실시예에서 mbcM을 포함하는 하나 또는 그 이상의 post-PKS 유전자가 결실되거나 불활성화되도록 제작된 균주는 이에 제한되는 것은 아니나, 리파마이신, 안사미토신, 겔다나마이신, 허비마이신의 생합성에 관계된 클러스터를 포함하는 이종의 PKS 클러스터 유래의 하나 또는 그 이상의 post PKS에 의해 보완될 수 있다.
구체적으로, 상기 숙주 균주는 mbcM이 결실되거나 불활성화된 막베신 생산 균주를 기초로 제작된 균주일 수 있다. 대안적으로, 상기 숙주 균주는 mbcM1, mbcMT1, mbcMT2, mbcP 및 mbcP450이 결실되거나 불활성화된 막베신 생산균주를 기초로 제작된 균주일 수 있다.
이러한 시스템에서 결실 또는 불활성화를 포함하는 기술된 방법들 중 어느 하나의 방법에 의해 균주는 기능하지 않는 mbcM 또는 이의 유사체를 생성할 수 있으며, 이를 통해 하나 이상의 막베신 유사체가 생산될 수 있다. 이에 대한 많은 수의 가능한 이유들이 당업자들에게 설명될 수 있다. 예를 들면, post-PKS 단계에 바람직한 순서가 있을 수 있는데, 하나의 활성을 제거하는 것이 이후의 모든 단계를 관련된 효소들에 맞지 않는 기질 상에서 이루어지도록 할 수 있다. 이는 post-PKS 효소에 제공되는 새로운 기질에 대한 낮은 효율성 또는 단계의 순서가 바뀌었기 때문에 더이상 남아있는 효소에 대한 기질이 아닌 단계 생성물들로 인하여, 배양액 내에 중간체를 생성하도록 한다.
혼합물 내에서 관찰되는 화합물의 비율은 교반 배양기의 rpm(revolutions per minute) 조절 및 교반 배양기의 분출도 같은 배양 환경 내의 변화를 통해 조절될 수 있다.
실시예에서 기재된 바와 같이, 더 작은 작동반경(2.5cm)과 더 높은 rpm(300)의 배양기 내에서 BIOT-3806의 생산물 배양액의 배양은 유사체를 덜 생성시켰다. 반면에 더 넓은 작동반경(5cm) 및 더 낮은 rpm(200 또는 250)의 배양기 내에서의 동등한 실험은 중간체를 더 많이 생성시켰다.
당업자는 생합성 클러스터 내의 일부 유전자가 오페론 내에 구성되고 하나의 유전자 파괴는 종종 동일 오페론 내의 하위 유전자의 발현에 영향을 준다는 것을 이해할 수 있을 것이다.
화합물의 혼합물이 관찰될 때, 이들은 하기의 예에 일부 기재된 바와 같은 전형적인 방법을 사용하여 바로 분리할 수 있다.
21-데옥시막베신 유사체는 본원에서 기재된 바와 같이 많은 방법을 통해 선별될 수 있고, 하나의 화합물이 선호적인 특징을 보이는 환경 내에서 균주는 이러한 화합물을 우선적으로 만들도록 제작될 수 있다. 이것이 가능하지 않은 비정상적인 환경 내에서 중간체가 형성될 수 있는데, 이는 이후 원하는 화합물을 생산하기 위해 생체내변화될 수 있다.
본 발명은 막베신 PKS 유전자 클러스터 유래의 하나 또는 그 이상의 post-PKS 유전자의 선택적인 결실 또는 불활성화에 의해 생성된 신규한 막베신 유사체를 제공한다.
구체적으로, 본 발명은 막베신 생합성 유전자 클러스터 유래의 적어도 mbcM 또는 이의 상동체가 선택적으로 결실되거나 불활성화됨으로써 생산되는 신규한 21-데옥시막베신 유사체에 관한 것이다.
일 실시예에서, mbcM 또는 이의 유사체는 단독으로 결실되거나 불활성화된다.
대체가능한 실시예에서, mbcM 뿐만 아니라 다른 post-PKS 유전자도 추가적으로 결실되거나 불활성화되었다.
구체적 실시예에서, 숙주 균주 내에서 mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450로 구성된 군으로부터 선택되는 추가적인 유전자가 결실되거나 불활성화되었다. 다른 일 실시예에서, mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450으로 구성된 군으로부터 선택되는 추가적인 하나 또는 그 이상의 post-PKS 유전자가 결실되거나 불활성화되었다. 다른 일 실시예에서, mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450으로 구성된 군으로부터 선택되는 추가적인 둘 또는 그 이상의 post-PKS 유전자가 결실되거나 불활성화되었다. 다른 일 실시예에서, mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450으로 구성된 군으로부터 선택되는 추가적인 셋 또는 그 이상의 post-PKS 유전자가 결실되거나 불활성화되었다. 다른 일 실시예에서, mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450으로 구성된 군으로부터 선택되는 추가적인 넷 또는 그 이상의 post-PKS 유전자가 결실되거나 불활성화되었다.
당업자는 유전자가 기능하지 않도록 하기 위해 유전자를 완전하게 제거할 필요가 없다는 것을 이해할 수 있을 것이며, 결과적으로 본원에서 사용된 용어 “결실되거나 불활성화된다”는 유전자가 기능하지 않게 되는 어떤 방법이라도 포함하며, 이에 제한되지는 않지만, 유전자가 발현하지 않거나 불활성화 형태로 발현되도록 하는 유전자 전체적인 결실, 표적 유전자로의 삽입에 의한 불활성화, 위치특이적 돌연변이, 유전자가 발현되지 않거나 불활성화 형태로 발현되도록 하는 숙주 균주의 돌연변이(예를 들면, 방사선 또는 돌연변이 유발 화학제, 원형질체 융합 또는 트랜스포존 돌연변이)를 의미한다. 또한 이는 유전자의 내부적 단편의 결실을 포함한다. 대안적으로, 활성 유전자의 기능은 억제제에 의해 화학적으로 약화될 수 있는데, 예를 들면 메타파이론(양립가능한 명칭 2-메틸-1,2-디(3-파이리딜-1-프로파논), EP0627009) 및 안사이미돌은 산화제의 억제제이며, 이들 화합물은 생산 배지에 첨가되어 유사체를 생성시킬 수 있다. 또한, 시네펀진(sinefungin)은 메틸 트랜 스퍼라제 억제제이고, 이는 생체 내에서의 메틸 트랜스퍼라제 활성 억제를 위한 것을 제외하고 유사하게 사용될 수 있다(McCammon and Parks 1981).
양립가능한 구체예에서, 모든 post-PKS 유전자가 결실되거나 불활성화될 수 있고, 이때 mbcM 또는 이의 상동체를 포함하지 않는 하나 또는 그 이상의 유전자가 상보성(예를 들면, 자가-복제 플라스미드 상의 부착 부위(att site)에 또는 염색체의 상동부위 내로의 삽입에 의해)에 의해 재도입될 수 있다.
그러므로, 구체예에서 본 발명은 하기의 단계를 포함하는, 21-데옥시막베신 유사체의 생성방법에 관한 것이다.
a) 적합한 환경에서 배양 시 막베신을 생산하는 첫 번째 숙주 균주를 제공하는 단계;
b) 모든 post-PKS 유전자를 선택적으로 결실시키거나 불활성화시키는 단계;
c) 상기 변형된 숙주 균주를 21-데옥시막베신 유사체 생산에 적합한 환경에서 배양하는 단계; 및
d) 상기 생산된 화합물을 선택적으로 분리하는 단계.
양립가능한 구체예에서, 하나 또는 그 이상이 결실된 post-PKS 유전자가 재도입된되고, mbcM 유전자는 재도입되지 않는다.
다른 일 실시예에서, mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450으로 구성된 군으로부터 선택되는 하나 또는 그 이상의 post-PKS 유전자 재도입된다. 다른 일 실 시예에서, mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450으로 구성된 군으로부터 선택되는 둘 또는 그 이상의 post-PKS 유전자 재도입된다. 다른 일 실시예에서, mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450으로 구성된 군으로부터 선택되는 셋 또는 그 이상의 post-PKS 유전자 재도입된다. 다른 일 실시예에서, mbcN, mbcP, mbcMTI, mbcMT2 및 mbcP450으로 구성된 군으로부터 선택되는 넷 또는 그 이상의 post-PKS 유전자 재도입된다.
또한, 당업자에게 mbcM 또는 이의 상동체를 포함하는 post-PKS 유전자들의 서브셋이 결실되거나 불활성화될 수 있고, mbcM를 포함하지 않는 상기 post-PKS 유전자의 더 작은 서브셋은 21-데옥시막베신 유사체 생산 균주에 재도입될 수 있다는 사실은 명백할 것이다.
당업자는 적어도 mbcM 또는 이의 상동체가 결여된, 막베신에 대한 생합성 유전자 클러스터를 포함하는 균주를 생성하기 위한 다양한 방법이 있다는 것을 이해할 수 있을 것이다.
폴리케티드 유전자 클러스터는 이종 숙주 내에서 발현될 수 있다는 것이 당업자들에게 잘 알려져 있다(Preifer and Khosla, 2001). 따라서, 본 발명은 mbcM을 포함하지 않거나, 비기능성 mbcM 변이체를 포함하거나, 저항성 및 조절 유전자 포함하거나 포함하지 않는, 완전하거나 추가적인 결실을 포함하는, 막베신 생합성 유 전자 클러스터의 이종 숙주 내로의 전이를 포함한다.
대안적으로, 완전한 막베신 생합성 클러스터는 저항성 및 조절 유전자를 포함하거나 포함하지 않은 상태로 이종 숙주내로 전이될 수 있으며, 이는 본원에 기재된 mbcM을 결실시키거나 불활성화시키기 위한 방법들을 통해 조작될 수 있다.
상기에서 정의된 바와 같이 이러한 방대한 DNA 절편들의 전이를 위한 방법 및 벡터는 당업계에 잘 알려져 있거나(Rawlings, 2001; Staunton and Weissman, 2001), 본원에서 기술된 방법으로 제공된다.
이러한 배경에서, 바람직한 숙주세포 균주는 원핵생물이며, 더욱 바람직하게는 악티노마이세테 또는 대장균이고, 더욱더 바람직한 숙주 세포 균주는 악티노신네마 미럼(Actinosynnema mirum; A. mirum), 악티노신네마 프레티오섬 아속. 프레티오섬(Actinosynnema pretiosum subsp. pretiosum; A. pretiosum), S. 하이그로코피쿠스(hygroscopicus), S. 하이그로코피쿠스 속(hygroscopicus sp.), S. 하이그로코피쿠스 바(hygroscopicus var.), 아스코마이세티쿠스(ascomyceticus), 스트렙토마이세스 스트렙토마이세스 쭈쿠밴시스(Streptomyces tsukubaensis), 스트렙토마이세스 코엘리칼라(Streptomyces coelicolor), 스트렙토마이세스 리비단스(Streptomyces lividans), 사카로폴리스포라 에리쓰래아(Saccharopolyspora erythraea), 스트렙토마이세스 프라디애(Streptomyces fradiae), 스트렙토마이세스 아버미티리스(Streptomyces avermitilis), 스트렙토마이세스 신나모넨시스(Streptomyces cinnamonensis), 스트렙토마이세스 리모수스(Streptomyces rimosus), 스트렙토마이세스 알버스(Streptomyces albus), 스트렙토마이세스 그리세오퍼스쿠스(Streptomyces griseofuscus), 스트렙토마이세스 론지스포로플라버스(Streptomyces longisporoflavus), 스트렙토마이세스 베네주에래(Streptomyces venezuelae), 스트렙토마이세스 알버스(Streptomyces albus), 마이크로모노스포라 종(Micromonospora sp.), 마이크로모노스포라 그리세오루비다(Micromonospora griseorubida), 아미코라톱시스 메디터라네이(Amycolatopsis mediterranei) 또는 악티노플라네스 종 (Actinoplanes sp.) N902-109를 포함하지만, 이에 제한되는 것은 아니다. 추가적인 예로는 스트렙토마이세스 하이그로스코피쿠스 아종(Streptomyces hygroscopicus subsp.) 겔다너스(geldanus) 및 스트렙토마이세스 비오라테우스니거(Streptomyces violaceusniger)를 포함한다.
일 구체예에서 전체적인 생합성 클러스터가 전이되었다. 양립가능한 구체예에서 mbcM이 제거된 전체 PKS가 전이되었다. 양립가능한 구체예에서 mbcM을 포함하는 작용성 post-PKS 유전자 어떤 것도 없이 전체 PKS가 전이되었다.
다른 일 구체예에서 전체적인 막베신 생합성 클러스터가 전이되었고, 이때 본원에 기술된 바에 따라 조작되었다.
본 발명의 대안적 양태로서, 본 발명의 21-데옥시막베신 유사체는 적합한 균주를 통해 생체내전환되어 더 진행될 수 있다. 적합한 균주는 이에 제한되는 것은 아니나, 예를 들면 악티노신네마 미럼(Actinosynnema mirum; A. mirum), 악티노신네마 프레티오섬 아속. 프레티오섬(Actinosynnema pretiosum subsp. pretiosum; A. pretiosum), S. 하이그로코피쿠스(hygroscopicus), S. 하이그로코피쿠스 속(hygroscopicus sp.) 같은 이용가능한 야생형 균주 중 어느 하나일 수 있다.
대안적으로, 적합한 균주는 이에 제한되는 것은 아니나, 예를 들면, mbcN, mbcP, mbcMTI, mbcMT2 mbcP450(본원에서 정의된 바와 같이), gdmN, gdmM, gdmL, gdmP(Rascher et al., 2003), 겔다나마이신 17-O-메틸 트랜스퍼라제, asm7, asm10, asm11, asm12, asm19 및 asm21 (Cassady et al., 2004, Spiteller et al., 2003) 같은 각각의 post-PKS 유전자에 의해 생체내변환되도록 조작될 수 있다.
아직 규명되지 않은 유전자가 있거나, 공유 도메인 내의 서열이 존재하지 않더라도 당업자가 전형적인 방법을 통해 이러한 서열을 획득하는 것은 통상적이다.예를 들면 겔다나마이신 17-O-메틸 트랜스퍼라제를 코딩하는 유전자 서열은 공유 도메인 내에 존재하지 않지만, 당업자는 프로브를 만들 수 있는데, 비슷한 O-메틸 트랜스퍼라제를 이용하여 이종의 프로브를 만들거나 이용가능한 상동의 유전자로부터 축퇴성 프라이머를 고안함으로써 상동의 프로브를 만들어 겔다나마이신 생산 균주 상에서 서던블롯(Southern blots)을 수행할 수 있으며, 이를 통해 생체내변환 시스템을 생성할 수 있는 이러한 유전자를 획득할 수 있다.
구체적인 일 실시예에서, 상기 균주는 본래의 폴리케티드 클러스터에 의해 생산되는 폴리케티드 생산을 막을 수 있도록, 전체적 또는 부분적으로 결실되거나, 아니면 불활성화된 하나 또는 그 이상의 본래의 폴리케티드 클러스터를 가질 수 있다.
상기 조작된 균주는 예를 들면, 악티노신네마 미럼(Actinosynnema mirum; A. mirum), 악티노신네마 프레티오섬 아속. 프레티오섬(Actinosynnema pretiosum subsp. pretiosum; A. pretiosum), S. 하이그로코피쿠스(hygroscopicus), S. 하이그로코피쿠스 속(hygroscopicus sp.), S. 하이그로코피쿠스 바(hygroscopicus var.), 아스코마이세티쿠스(ascomyceticus), 스트렙토마이세스 쭈쿠밴시스(Streptomyces tsukubaensis), 스트렙토마이세스 코엘리칼라(Streptomyces coelicolor), 스트렙토마이세스 리비단스(Streptomyces lividans), 사카로폴리스포라 에리쓰래아(Saccharopolyspora erythraea), 스트렙토마이세스 프라디애(Streptomyces fradiae), 스트렙토마이세스 아버미티리스(Streptomyces avermitilis), 스트렙토마이세스 신나모넨시스(Streptomyces cinnamonensis), 스트렙토마이세스 리모수스(Streptomyces rimosus), 스트렙토마이세스 알버스(Streptomyces albus), 스트렙토마이세스 그리세오퍼스쿠스(Streptomyces griseofuscus), 스트렙토마이세스 론지스포로플라버스(Streptomyces longisporoflavus), 스트렙토마이세스 베네주에래(Streptomyces venezuelae), 마이크로모노스포라 종(Micromonospora sp.), 마이크로모노스포라 그리세오루비다(Micromonospora griseorubida), 아미코라톱시스 메디터라네이(Amycolatopsis mediterranei) 또는 악티노플라네스 종 (Actinoplanes sp.) N902-109를 포함하는 군으로부터 선택될 수 있으나, 이에 제한되는 것은 아니다. 추가적인 가능한 균주 는 스트렙토마이세스 하이그로스코피쿠스 아종(Streptomyces hygroscopicus subsp.) 겔다너스(geldanus) 및 스트렙토마이세스 비오라테우스니거(Streptomyces violaceusniger)를 포함한다.
또 다른 양태로서, 본 발명은 mbcM 유전자 또는 이의 상동체가 결실되거나 불활성화되어 21-데옥시막베신 또는 이의 유사체(예를 들어 화학식 1의 화합물로 정의되는 21-데옥시막베신 유사체)를 생산할 수 있는, 자연적으로 막베신 또는 이의 유사체를 생산하는 숙주 및 21-데옥시막베신 또는 이의 유사체 생산에 대한 이의 용도를 제공한다.
그러므로, 일 구체예에서 본 발명은 유전공학적으로 처리되어 변경되지 않은 상태의 막베신을 자연적으로 생산하는 균주를 제공한다. 이때 상기 균주는 결실된 막베신 PKS 유전자 클러스터 유래의 하나 또는 그 이상의 post-PKS 유전자를 가지며, 여기서 결실되거나 불활성화된 post-PKS 유전자의 하나는 mbcM 또는 이의 상동체이다.
본 발명은 본원에 기재된 본 발명의 과정에서 산출되는 모든 생산물을 포함한다.
상기에서 기재한 바와 같이 본 발명의 21-데옥시막베신 유사체의 제조 과정 이 실질적으로 또는 전적으로 생합성에 의한다고 하더라도, 전형적인 화학적 합성 방법을 포함하는 과정에 의한 본 발명의 21-데옥시막베신 유사체를 생산하거나 상호전환하는 것을 배제하는 것은 아니다.
막베신 생합성 유전자 클러스터의 유전적 조작을 위해, 먼저 유전자 클러스터가 악티노신네마 프레티오섬 아속. 프레티오섬(Actinosynnema pretiosum subsp. pretiosum)으로부터 서열분석되었지만, 당업자는 예를 들면, 이에 제한되는 것은 아니나 악티노신네마 미럼(Actinosynnema mirum) 같은 막베신을 생산하는 양립가능한 균주가 있다는 것을 이해할 수 있다.
이러한 균주 유래의 막베신 생합성 유전자 클러스터는 본원에서 악티노신네마 프레티오섬 아속. 프레티오섬(Actinosynnema pretiosum subsp. pretiosum)에 대해 기재한 바와 같이 서열분석될 수 있으며, 상기 정보는 동등한 균주를 생성하는데 사용될 수 있다.
또 다른 양태로서, 본 발명은 하기를 포함한다:
- mbcM 및 선택적으로 추가의 post-PKS 유전자가 결실되거나 불활성화된 막베신 생산 균주를 기초로 조작된 균주로서, 구체적으로 mbcM이 결실 또는 불활성화되거나, mbcM1, mbcMT1, mbcMT2, mbcP 및 mbcP450이 결실되거나 불활성화되도록 제작된 균주. 적합한 막베신 생산 균주는 A.프레티오섬 또는 A.미럼이다.
- 21-데옥시막베신 유사체의 제조에 있어서 이렇게 제작된 균주의 용도.
본 발명의 화합물은 하나 또는 그 이상의 다음의 성질을 가지는 것으로 기대될 수 있다는 점에서 유리하다: Hsp90에 대한 높은 결합력, Hsp90에 대한 빠른 결합속도, 높은 용해도, 양호한 안정성, 양호한 제형가능성, 양호한 경구적 생체이용성, 및 이에 제한되는 것은 아니나, 낮은 글루크로닌화, 양호한 세포 흡수성, 양호한 뇌의 양물동태성, 적혈구에 대한 낮은 결합력, 양호한 독성학적 성질, 양호한 간독성 성질, 양호한 신장독성, 낮은 부작용 및 낮은 심장성 부작용을 포함하는 양호한 약물동태적 성질.
도 1: 첫 번째 잠재 효소가 유리된, 프리(pre)-막베신 및 post-PKS 프로세싱을 보여주는 막베신 생합성을 나타낸 것이다.
도면 내의 PKS 과정 단계의 리스트는 사건의 순서를 대표하는 것은 아니다.
다음 약어는 클러스터 내의 구체적 유전자에 이용된다: ALO - AHBA loading domain; ACP - Acyl Carrier Protein; KS - β-ketoacylsynthase; AT - acyl transferase; DH - dehydratase; ER - enoyl reductase; KR - β-ketoreductase.
도 2: 막베신을 얻기 위한 프리-막베신의 post-PKS 프로세싱 부위를 묘사한 것이다.
도 3: 플라스미드 pLSS308이 상동 재조합에 의해 염색체 내로 통합되어 mbcM 유전자 파괴를 일으키도록 제작된 균주 BIOT-3806의 생성을 도시화한 것이다.
도 4: gdmM (서열번호 1) 및 riforf19 (서열번호 2)의 서열 정렬을 나타낸 것이다. 축퇴성 올리고의 결합 부분에 밑줄을 그었다.
도 5: gdmM (서열번호 1), mbcM 단편(서열번호 3, A. 미럼) 및 mbcM 유전자(서열번호 4, A. 프레티오섬)의 서열 정렬을 나타낸 것이다. 축퇴성 올리고의 결합 부분에 밑줄을 그었다.
도 6: A는 gdmM의 변역에 의해 생성되는 GdmM의 단백질 서열(서열번호 5)을 나타낸 것이고, B는 riforf19의 번역에 의해 생성되는 Riforf19의 단백질 서열(서열번호 6을 나타낸 것이다; 이는 단백질 서열 사이의 유사성을 보여준다.
도 7: 실시예 4에 기재된 mbcM의 프레임내 결실의 구축을 나타낸 것이다.
도 8: A는 PCR 생산물 PCRwv308의 서열을 보여준다. 서열번호 20
B는 PCR 생산물 PCRwv309의 서열을 보여준다. 서열번호 21
도 9: A는 실시예 4에 기재된 바와 같이 mbcM 내에 502 아미노산의 프레임내 결실된 DNA 서열을 나타낸 것이다(서열번호 26 및 27).
주요: 1-21 bp는 3-아미노-5-하이드록시벤조익산 생합성의 포스파타제의 3‘ 말단을 코딩하며, 136-68 bp는 mbcM 결실 단백질을 코딩하고, 161-141bp는 mbcF의 3’ 말단을 코딩한다.
B는 단백질의 아미노산 서열을 보여주는 것이다(서열번호 28). 단백질 서열은 도 9A 내에 보여진 완전한 가닥으로부터 생성된 것이다.
도 10: mbcP, mbcP450, mbcMTI 및 mbcMT2 유전자가 프레임 내에 결실되어 mbcM의 결실을 가져온 악티노신네마 프레티오섬 균주의 생성을 묘사한 것이다.
도 11: 증폭된 PCR 생산물 1+2a의 서열을 나타낸 것이다(서열번호 31)
도 12: 증폭된 PCR 생산물 3b+4의 서열을 나타낸 것이다(서열번호 34)
도 13: 0-80nM 화합물 14 및 0-3 μg/ml 미토마이신 C을 시험관 내(in vitro)에서 병용처리시 암세포주 DU145의 생장에 미치는 효과를 보여주는 그래프이다.
도 14: 0-160nM 화합물 14 및 0-100 μg/ml 사이클로헥실클로로에틸니트로수레아(CCNU)를 시험관 내(in vitro)에서 병용처리시 암세포주 DU145의 생장에 미치 는 효과를 보여주는 그래프이다.
도 15: 0-160nM 화합물 14 및 0-100 μg/ml 이포스파미드를 시험관 내(in vitro)에서 병용처리시 암세포주 DU145의 생장에 미치는 효과를 보여주는 그래프이다.
도 16: 0-160nM 화합물 14 및 0-10 μg/ml 미토잔트론을 시험관 내(in vitro)에서 병용처리시 암세포주 DU145의 생장에 미치는 효과를 보여주는 그래프이다.
도 17: 0-160nM 화합물 14 및 0-1 μg/ml 빈데신을 시험관 내(in vitro)에서 병용처리시 암세포주 DU145의 생장에 미치는 효과를 보여주는 그래프이다.
일반적인 방법
배양물 발효
세균 균주 악티노신네마 프레티오섬 아속. 프레티오섬(Actinosynnema pretiosum subsp. pretiosum) ATCC 31280(미국특허 제4,315,989호) 및 악티노신네마 미럼(Actinosynnema mirum) DSM 43827 (KCC A-0225)(Watanabe et al., 1982)의 생장을 위한 조건은 미국특허 제4,315,989호 및 미국특허 제4,187,292호에 기술되어 있다.
본원에서 사용되는 방법은 이러한 특허들로부터 개조될 수 있고, 교반 배양기 내의 튜브 또는 플라스크 내의 브로쓰의 배양을 위한 방법은 하기와 같을 수 있는데, 공개된 프로토콜에 대한 변형을 실시예에 나타냈다.
두 균주 모두는 ISP2 아가 배지(배지 3, Shirling, E.B. and Gottlieb, D., 1966) 상에서 28℃ 온도로 2-3일간 배양될 수 있고, 종자 배지(배지 1, 하기 참조 및 US 4,315,989와 US 4,187,292 참조)에 접종하는 데 사용될 수 있다.
접종된 종자 배지는 28℃에서 48시간 동안 5 또는 2.5 cm 작동반경으로 200 내지 300 rpm 사이로 교반하면서 배양되었다.
막베신, 18,21-디히드로막베신 및 21-데옥시막베신 같은 막베신 유사체 생산을 위해 발효배지(배지 2, 하기 참조 및 US 4,315,989와 US 4,187,292 참조)는 2.5% 내지 10%의 농도로 종자 배양물로 접종되었고, 초기에 28℃에서 24 시간 동안 5 또는 2.5 cm 작동반경으로 200 내지 300 rpm 사이로 교반하면서 배양한 후, 26℃에서 6일 동안 배양했다. 다음으로 상기 배양액은 추출을 위해 채취했다.
배지
배지 1 - 종자 배지
증류수 1L 내의 조성임
Glucose 20g
Soluble potato starch (Sigma) 30g
Spray dried corn steep liquor (Roquette Freres) 10g
'Nutrisoy' toasted soy flour (Archer Daniels Midland) 10g
Peptone from milk solids (Sigma) 5g
NaCI 3g
CaCO3 5g
NaOH로 pH 조정 7.0
121℃로 20분 동안 오토클래이브시켜 멸균하였다.
오토클래이브 후 아프라마이신을 최종농도가 50 mg/L가 되도록 첨가하였다.
배지 2 - 발효 배지
증류수 1L 내의 조성임
Glycerol 50g
Spray dried corn steep liquor (Roquette Freres) 10g
'Bacto' yeast extract(Difco) 20g
KH2PO4 20g
MgCl2.6H2O 5g
CaCO3 1g
NaOH로 pH 조정 6.5
121℃로 20분 동안 오토클래이브시켜 멸균하였다.
배지 3 - ISP2 배지
증류수 1L 내의 조성임
Malt extract 10g
Yeast extract 4g
Dextrose 4g
Agar 15g
NaOH로 pH 조정 7.3
121℃로 20분 동안 오토클래이브시켜 멸균하였다.
배지 4 - MAM
증류수 1L 내의 조성임
Wheat starch 10g
Corn steep solids 2.5g
Yeast extract 3g
CaCO3 3g
Iron sulphate 0.3g
Agar 20g
121℃로 20분 동안 오토클래이브시켜 멸균하였다.
LCMS 분석을 위한 배양 브로쓰의 추출
배양 브로쓰(1mL) 및 에틸 아세테이트 (1 mL)를 첨가하였고 15-30분 동안 혼합한 후 10분 동안 원심분리하였다. 유기층 0.5 mL를 수집하였고 증발시켜 건조한 다음 메탄올 0.25 mL에 다시 용해하였다.
발효 브로쓰 분석 및 생체 내 변환 연구를 위한 LCMS 분석 과정
LCMS는 양성 및/또는 음성 이온 모드에서 작동하는 Buker Daltonics Esquire 3000+ electrospray mass spectrometer가 결합된 통합적인 Agilent HP1100 HPLC system을 이용하여 수행되었다.
크로마토그래피는 Phenomenex Hyperclone column (C18 BDS, 3u, 150 × 4.6 mm) 상에서 아세토니트릴+0.1%포름산/물+0.1% 포름산(40/60)로부터 아세토니트릴+0.1% 포름산/물+0.1% 포름산(80/20)까지의 선형 농도 구배로 1 mL/min의 유속으로 11분 동안 용출하여 수행하였다.
UV 분광은 190 내지 400 nm 사이에서 기록하였고, 추출된 크로마토그램은 210, 254 및 276 nm에서 얻었다. 질량 분석은 100 내지 1500 amu 사이에서 기록하였다.
항암 활성을 위한 시험관 내 생물검정
화합물의 시험관 내 항암활성 평가는 단일층 증식 방법에 의해 증식된 38가지의 종양 세포주의 패널을 대상으로 온코테스트 시험 기관(Oncotest Testing Facility), Institute for Experimental Oncology, Oncotest GmbH, Freiburg을 통해 수행했다. 선택된 세포주들 중 9 가지의 특징을 표1에 요약했다.
Figure 112008045421569-PCT00005
온코테스트 세포주는 Roth et al., (1999)에 기술된 바와 같이 인간 종양 이종이식체로부터 수립되었다. 공여체 이종이식의 기원은 Fiebig et al., (1999)에 의해 기술되었다. 다른 세포주는 NCI(H460, SF-268, OVCAR-3, DU145, MDA-MB- 231, MDA-MB-468)로부터 얻거나, DSMZ, Braunschweig, Germany (LNCAP)에서 구입할 수 있다.
명시되지 않더라도, 모든 세포주는 RPMI 1640 배지, 10% 우태아 혈청(fetal calf serum) 및 0.1mg/mL 젠타마이신이 포함된 '조제 배지(ready-mix)' 배지 내에서 가습조건(95% air, 5% CO2), 37℃에서 생장시켰다(PAA, Clbe, Germany).
화합물이 인간 종양 세포주의 생장에 미치는 영향을 평가하기 위해 변형된 요오드화 프로피디엄 분석(propidium iodide assay)이 사용되었다(Dengler et al., (1995)).
간단하게, 세포를 트립신 처리하여 증식기 상태에서 채취하고, 수를 세고, 편평한 바닥 96 웰 마이크로타이터 플레이트에 세포주에 따른 세포 밀도(5-10.000 생존 세포/웰)로 접종하였다.
세포가 다시 증식기에 접어들도록 하기 위해 24시간 회복 후에, 배양 배지(플레이트 당 6개의 대조군 웰) 또는 막베신을 포함하는 배양 배지 0.010 mL를 웰에 첨가하였다.
각 농도는 3개씩 처리되었다. 화합물은 다섯 가지 농도로 적용하였다 (100; 10; 1; 0.1 및 0.01).
연속적 노출 4일 후, 시험 화합물이 있거나 또는 없는 세포 배양 배지를 0.2 mL의 수성 요오드화 프로피디엄 (PI) 용액(7 mg/L)으로 교체하였다.
생존 세포의 비율을 측정하기 위해서, 플레이트를 냉동시켜 세포를 투과화(permeabilization)시켰다. 상기 플레이트를 해동한 후, 형광도를 Cytofluor 4000 microplate reader(여기 530 nm, 방사 620 nm)를 이용하여 측정하였고 생존 세포의 총 수와의 직접적인 관계를 도출하였다.
생장 억제 정도는 처리군/대조군×100(% T/C)로 나타내었다. 활성 화합물에 대한 IC70 값은 세포 생존도에 대한 화합물 농도를 플롯팅하여 측정하였다.
항암 활성에 대한 복합적인 시험관 내 생물검정
화합물의 조합이 DU145 세포의 생장에 미치는 영향을 평가하기 위해 각각의 표준 제제 4 플레이트가 준비된다는 것을 제외하고는, 상기에 기재한 바와 같은 변형된 요오드화 프로피디엄 분석을 또한 사용하였다. 플레이트 하나는 표준 제제가 단독으로 있고, 세 개의 플레이트에는 각각 3개의 다른 고정농도의 화합물 14가 표준제제와 조합되어 있다. 표준 제제를 반-로그 증가에서 sextuplicates 내의 10 농도로 적용하였다. 처리되지 않은 세포 및 화합물 14를 단독으로 처리한 세포들 각각은 6 웰/플레이트에서 덮개를 덮어 배양했다. 생장 억제 정도는 처리군/대조군×100(% T/C)로 나타내었다. 각각의 조합에 대한 IC70 값은 세포 생존도에 대한 화합물 농도를 플롯팅하여 측정하였다.
실시예 1 - 막베신 생합성 유전자 클러스터의 서열분석
악티노신네마 프레티오섬(ATCC 31280) 및 악티노신네마 미럼(DSM 43827, ATCC 29888)에서 Kieser et al., (2000)에 기술된 표준 프로토콜을 이용하여 게놈 DNA를 분리했다. DNA 시퀀싱(서열분석)은 표준 과정을 사용하여 Sequencing facility of the Biochemistry Department, University of Cambridge, Tennis Court Road, Cambridge CB2 1QW에서 분석했다.
프라이머 BIOSG104 5'-GGTCTAGAGGTCAGTGCCCCCGCGTACCGTCGT-S' (서열번호 7) 및 BIOSG105 5'-GGCATATGCTTGTGCTCGGGCTCAAC-S' (서열번호 8)는 스트렙토마이세스 하이그로스코피쿠스 NRRL 3602(서열 허가번호: AY179507)의 겔다나마이신 생합성 유전자 클러스터 유래의 카르바모일트랜스퍼라제-코딩 유전자 gdmN를 표준 기술을 이용하여 증폭하기 위해 사용되었다.
서던 블럿 실험은 DIG 시약 및 비-방사성 핵산 표지 및 검출을 위한 키트를 사용하여 제조지침서(Roche)에 따라 수행했다.
DIG-표지된 gdmN DNA 절편은 이종 프로브로 사용되었다. gdmN에서 생성된 프로브 및 A.프레티오섬2112에서 분리된 게놈 DNA를 사용하여 약 8kb의 EcoRI 단편을 서던 블롯 분석으로 확인했다.
절편은 표준 절차에 따라 리트머스 28 내로 클로닝하고, 형질전환체들을 콜로니 부합법(hybridization)으로 확인했다. 클론 p3을 분리하고, 약 7.7kb 삽입체를 서열분석했다. 클론 p3에서 분리한 DNA를 EcoRI 및 EcoRI/SacI으로 절단하고, 약 7.7kb 및 약 1.2kb 크기의 밴드를 각각 분리했다. 표지화 반응은 제조 프로토콜에 따라 수행했다.
상기에 명명된 두 균주의 코스미드 라이브러리는 벡터 SuperCos 1 및 Gigapack III XL packaging kit (Stratagene)를 사용하여 제조 지침서에 따라 만들었다.
이러한 두 라이브러리는 표준 프로토콜을 사용하여 선별되었고, 프로브로서 클론 p3로부터 유래한 7.7kb EcoRI 절편의 DIG-표지화 절편이 사용되었다.
코스미드 52는 A.프레티오섬의 코스미드 라이브러리로부터 동정되었고, 서열분석을 위해 the sequencing facility of the Biochemistry Department of the University of Cambridge에 맡겨졌다.
유사하게 코스미드 43 및 코스미드 46은 A.미럼의 코스미드 라이브러리로부터 동정되었다. 세가지 코스미드는 모두 서던 블롯 분석에서 나타난 바와 같이 7.7kb EcoRI 절편을 포함한다.
코스미드 43의 PKS 부분의 약 0.7kbp 절편은 프라이머 BIOSG124 5'-CCCGCCCGCGCGAGCGGCGCGTGGCCGCCCGAGGGC-S' (서열번호 9) 및 BIOSG 125 5'-GCGTCCTCGCGCAGCCACGCCACCAGCAGCTCCAGC-S' (서열번호 10)을 사용하여 표준 프로토콜에 따라 증폭되고, 클로닝되었으며, 중복되는 클론에 대한 A.프레티오섬 코스미드를 선별하기 위한 프로브로서 사용되었다.
A. 프레티오섬의 코스미드 라이브러리 선별을 위해 사용되었던 프라이머 BIOSG130 5'- CCAACCCCGCCGCGTCCCCGGCCGCGCCGAACACG-S' (서열번호 11) 및 BIOSG131 5'-GTCGTCGGCTACGGGCCGGTGGGGCAGCTGCTGT-S' (서열번호 12)에 더해, BIOSG132 5'- GTCGGTGGACTGCCCTGCGCCTGATCGCCCTGCGC-S' (서열번호 13) 및 BIOSG133 5'- GGCCGGTGGTGCTGCCCGAGGACGGGGAGCTGCGG-3' (서열번호 14)로 증폭된 DNA 절편 유래의 프로브를 생성하기 위해 코스미드 52의 서열 정보가 사용되었다.
코스미드 311 및 352기 분리되었고, 코스미드 352는 서열분석을 위해 제공되어졌다. 코스미드 352는 코스미드 52와 약 2.7kb의 중복부분을 가진다. 다른 코스미드의 선별을 위해 프라이머 BIOSG136 5'- CACCGCTCGCGGGGGTGGCGCGGCGCACGACGTGG CTGC-3' (서열번호 15) 및 BIOSG 137 5'- CCTCCTCGGACAGCGCGATCAGCGCCGCGC ACAGCGAG-3' (서열번호 16)을 사용하고, 코스미드 311을 주형으로 사용하여 표준 프로토콜에 따라 약 0.6kb PCR 절편을 증폭했다. A.프레티오섬의 코스미드 라이브러리가 선별되었고, 코스미드 410이 분리되었다. 이는 코스미드 352와 약 17kb가 중복되며, 서열분석을 위해 제공되어졌다. 세 가지 중복성 코스미드(코스미드 52, 코스미드 352 및 코스미드 410)의 서열이 결집되었다.
서열분석된 부분은 약 100kbp의 크기였으며, 막베신 생합성 유전자 클러스터(서열번호 17)을 구성하는 23개의 오픈 리딩 프레임이 확인되었다. 서열번호 17 내의 각 오픈 리딩 프레임의 위치는 표 3에 나타냈다.
Figure 112008045421569-PCT00006
Figure 112008045421569-PCT00007
Figure 112008045421569-PCT00008
[주의 1 : c 는 완전한 DNA 가닥에 의해 코딩된 유전자를 말한다; 주의 2 : 어떤 경우에는 하나 이상의 잠재성 개시 코돈이 확인될 수 있다. 당업자는 이를 인식할 수 있고 양립가능한 개시코돈을 확인할 수 있다. 우리는 하나 이상의 가능한 개시코돈을 가지는 그러한 유전자들에 (*) 표시를 했다. 우리가 개시코돈일 될 것이라 믿는 것에 표시하였으나, 당업자는 양립가능한 개시코돈을 사용하여 활성 단백질을 생성할 수 있음을 이해할 것이다.]
실시예 2 - BIOT -3806 균주의 생성 : mbcM 상동인 gdmM 이 플라스미드 삽입에 의해 파괴된 악티노신네마 프레티오섬 ( Actinosynnema pretiosum ) 균주
pLSS308 구축의 요약은 도 3에 나타냈다.
2.1. 플라스미드 pLSS308 의 구축
스트렙토마이세스 하이그로스코피쿠스(Streptomyces hygroscopicus) 균주 NRRL 3602 (AY179507)의 겔다나마이신 생합성 유전자 클러스터 유래의 gdmM 유전자 및 아미코라톱시스 메디테라네이(Amycolatopsis mediterranei, AF040570 AF040571)의 리파마이신 생합성 유전자 클러스터 유래의 orf19 의 DNA 서열은 VectorNTI 서열 정렬 프로그램을 사용하여 정렬되었다(도 4).
축퇴성 올리고를 고안하기에 적합한 상동성 부분이 확인된 이러한 정렬은 악티노신네마 미럼(BIOT-3134; DSM43827; ATCC29888) 유래의 상동 유전자 절편을 증폭하는데 사용되었다.
축퇴성 올리고는 다음과 같다.
FPLS1 : 5': ccscgggcgnycngsttcgacngygag 3' ; (서열번호 18)
FPLS3: 5': cgtcncggannccggagcacatgccctg 3' ; (서열번호 19)
상기에서, n= G, A, T 또는 C; y = C 또는 T; s = G 또는 C
PCR 증폭을 위한 주형은 악티노신네마 미럼 코스미드 43이었다. 코스미드 43 생성은 상기 실시예 1에 기재했다.
올리고 FPLS1 및 FPLS3는 코스미드 43을 주형으로 사용하고, Taq DNA 중합효소를 사용한 표준 PCR 반응 내에서, 악티노신네마 미럼 유래의 gdmM 상동체의 내부적 단편을 증폭하기 위해 사용되었다. 결과적인 793bp의 PCR 생산물을 sma1으로 선형화된 pUC19 내로 클로닝하여, 플라스미드 pLSS301을 생성시켰다. 클로닝된 부분이 서열분석되었고, gdmM과 뚜렷한 상동성을 나타냈다(도 5). 코스미드 43(A.미럼)으로부터 증폭된 유전자 절편과 악티노신네마 프레티오섬 아속. 프레티오섬과의 정렬은 도 5에서 보듯이, 이들 서열 사이에서(축퇴성 올리고의 서열 부분은 제외) 단지 1bp만 다른 것으로 나타났다. 이는 A.미럼의 막베신 생합성 유전자 클러스터의 mbcM 유전자로부터 증폭된 것이 분명하다. 플라스미드 pLSS301은 EcoRI/HindIII로 절단하고, 그 절편을 EcoRI/HindIII로 절단된 pKC1132(Bierman et al., 1992) 내로 클로닝했다. 결과적인 플라스미드로 고안된 pLSS308은 아프라마이신 내성 및 A.미럼 mbcM 유전자의 내부적 단편을 포함한다.
2.2 악티노신네마 프레티오섬 아속 . 프레티오섬( Actinosynnema pretiosum subsp . pretiosum )의 형질전환
플라스미드 pUZ8002가 내재되어 있는 대장균 ET12567은 접합(conjugation)을 위한 대장균 공여균주를 생성시키기 위해 전기천공을 통해 pLSS308로 형질전환시켰다. 이 균주는 무성 접합에 의한 악티노신네마 프레티오섬 아속. 프레티오섬의 형질전환에 이용되었다(Matsushima et al., 1994). 세균접합체(exconjugants)를 배지 4 상에 도말하고, 28℃로 배양했다. 24시간 후, 50mg/L 아프라마이신 및 25mg/L 날리딕스산을 배양용기상에 발랐다.
pLSS308은 악티노신네마 프레티오섬 아속. 프레티오섬 내에서 증폭될 수 없지만, 어떠한 아프라마이신 저항성 콜로니는 플라스미드에 포함된 mbcM 내부적 단편을 통한 상동재조합에 의해 염색체의 mbcM 유전자 내로 통합된 플라스미드를 포함하는 형질전환체가 될 수 있을 것으로 기대된다(도 3). 이는 염색체 상의 mbcM 유전자가 잘린 두 복사체를 생성시킨다. 형질전환체들은 PCR 분석을 통해 확인했고, 증폭된 단편을 서열분석했다.
콜로니들은 배지 4(50mg/L 아프라마이신 및 25mg/L날리딕스 산 함유) 상에 부착되어 있다. 각각의 부착물로부터 6 mm의 원형 플러그를 종자배지 10mL(배지 1의 변형- 2% 글루코스, 3% 수성전분, 0.5% 콘스팁고형, 1% 콩가루, 0.5% 펩톤, 0.3% 염화나트륨, 0.5% 칼슘 카르보네이트 및 50mg/L 아프라마이신)를 포함한 각각의 50ml 팔콘 튜브에 접종하는 데 이용했다.
이러한 종자배지 배양액을 28℃, 200rpm조건에서 5cm 작동반경으로 2일 동안 배양했다. 이들을 이후 (5% v/v) 발효배지(배지 2)에 접종하고, 28℃에서 24시간동안 생장시키고, 이후 26℃에서 추가로 5일 동안 생장시켰다. 이들로부터 대사체를 상기에 기재된 표준 프로토콜에 따라 추출시켰다. 상기에 기재된 표준 프로토콜을 이용하여 HPLC를 통해 샘플의 막베신 유사체 생산성이 평가되었다. 생산력을 가지는 분리된 선택체는 BIOT-3806으로 지정했다.
2.3 BIOT -3806 유래의 화합물 확인
양성 및/또는 음성 이온 모드에서 작동하는 Bruker Daltonics Esquire 3000+ electrospray mass spectrometer가 결합된 Agilent HP1100 HPLC system을 사용하여 LCMS를 수행했다.
크로마토그래피를 Phenomenex Hyperclone 컬럼 (Ci8 BDS, 3u, 150 x 4.6 mm) 상에서 다음의 농도구배성 용출 과정을 이용하여 1mL/min의 유속으로 용출시켜 수행했다; T=O, 10%B; T=2, 10%B; T=20, 100%B; T=22, 100%B; T=22.05, 10%B; T=25, 10%B.
이동상 A = 물 + 0.1% 포름산; 이동상 B = 아세토니트릴 + 0.1% 포름산.
UV 스펙트라는 190 내지 400 nm 사이에서 기록되었다. 추출된 크로마토그램은 210, 254 및 276 nm에서 얻어졌다. 질량 분석은 100 내지 1500 amu 사이에서 기록되었다.
Figure 112008045421569-PCT00009
실시예 3 - 신규한 화합물의 생산 및 분리
3.1 발효 및 7-O- 카르바모일프리 - 막베신의 분리
BIOT-3806의 무성적 스탁은 50mg/L 아프라마이신이 함유된 배지 1 내에서 키워서 준비하고, 20% w/v 글리세롤:10% w/v 락토스가 함유된 증류수에 보존하고, -80℃에서 저장했다. 무성적 스탁은 50mg/L 아프라마이신이 보충된 ISP2 배지(배지 3)의 플레이트 상에서 48시간 동안 28℃에서 배양했다. 무성적 배양액은 ISP2 플레이트의 5mm 지름 크기의 두 개의 아가 플러그를 취해서 250mL 교반 플라스크 내의 50mg/L 아프라마이신을 함유하는 30mL 배지 1 내에 접종했다. 플라스크를 28℃, 200rpm조건에서(5cm 작동반경) 48시간 동안 배양했다.
5% v/v로 접종된 무성식 배양액은 2L 교반 플라스크 내의 200 mL 생산배지(배지 2) 내에 접종했다. 배양은 28℃에서 1일 동안 수행하고, 26℃, 300 rpm(2.5 cm 작동반경)으로 5일 동안 수행했다.
BIOT-3806의 발효 브로쓰(1L, 핑크색)는 동량의 에틸 아세테이트(EtOAc)로 세 번 추출했다. 결합된 EtOAc 추출물로부터 진공 내에서 용매를 제거하여 2.34g의 브라인 오일을 얻었다. 추출물은 이후 실리카겔 60 상에서 초기 CHCl3 및 MeOH 혼합물(95:5), 이후 MeOH 농도를 10%까지 증가시켜 용리되고 여러 분획으로 수집(대략. 분획별로 250 mL)되는 크로마토그래프를 했다. 분획은 HPLC를 사용하여 대사체의 존재에 대한 평가를 했다.
신규한 화합물(분획 5; 용매 제거 후 334mg 크루드 질량)을 포함하는 특정 분획은 농도구배된 워터:아세토니트릴(80:20) 내지 (50:50)로 25분에 걸쳐, 21mL/min의 유속으로 용리하는 Phenomenex Luna C18-BDS컬럼(21.2 x 250 mm; 5 ㎛ particle size) 상에서 크로마토크래피로 더 정제되었다. 분획은 분석용 HPLC로 평가하고, 신규한 화합물을 포함하는 이들이 결합되었고, 용매를 제거하여 회색이 도는 흰색의 고체(86 mg)를 얻었다. 아세톤-d 6 내에서 수행된 LCMS/MS 및 1D 및 2D NMR 실험에 의한 분석으로 화합물 7-O-카르바모일프리-막베신을 확인했다(14).
Figure 112008045421569-PCT00010
3.2 발효 및 7-O- 카르바모일 -15- 하이드록시프리 - 막베신의 분리
BIOT-3806의 무성적 스탁은 50 mg/L 아프라마이신이 함유된 배지 1 내에서 키워서 준비하고, 20% w/v 글리세롤:10% w/v 락토스가 함유된 증류수에 보존하고, -80℃에서 저장했다. 무성적 스탁은 50 mg/L 아프라마이신이 보충된 ISP2 배지(배지 3)의 플레이트 상에서 48시간 동안 28℃에서 배양했다. 무성적 배양액은 ISP2 플레이트의 5mm 지름 크기의 두 개의 아가 플러그를 취해서 250 mL 교반 플라스크 내의 50 mg/L 아프라마이신을 함유하는 30mL 배지 1 내에 접종했다. 플라스크를 28℃, 200 rpm조건에서(5cm 작동반경) 48시간 동안 배양했다.
5% v/v로 접종된 무성식 배양액은 2L 교반 플라스크 내의 200 mL 생산배지(배지 2) 내에 접종했다. 배양은 28℃에서 1일 동안 수행하고, 26℃, 200 rpm(5 cm 작동반경)으로 5일 동안 수행했다.
BIOT-3806의 발효 브로쓰(1.3L, 크림색)는 동량의 에틸 아세테이트(EtOAc)로 세 번 추출했다. 결합된 EtOAc 추출물로부터 진공 내에서 용매를 제거하여 2.87g의 브라운 오일을 얻었다.
추출물은 이후 실리카겔 60 상에서 초기 CHCl3 및 MeOH 혼합물(95:5), 이후 MeOH 농도를 10%까지 증가시켜 용리되고 여러 분획으로 수집(대략. 분획별로 250mL)되는 크로마토그래프를 했다. 분획은 HPLC를 사용하여 대사체의 존재에 대한 평가를 했다.
신규한 화합물(분획 7; 용매 제거 후 752mg 크루드 질량)을 포함하는 특정 분획은 농도구배된 워터:아세토니트릴(85:15) 내지 (55:40)로 25분에 걸쳐, 21mL/min의 유속으로 용리하는 Phenomenex Luna C18-BDS컬럼(21.2 x 250 mm; 5 ㎛ particle size) 상에서 크로마토크래피로 더 정제되었다.
분획은 분석용 HPLC로 평가하고, 신규한 화합물을 포함하는 이들이 결합되었고, 용매를 제거하여 회색이 도는 흰색의 고체(245.5mg)를 얻었다. 아세톤-d 6 내에서 수행된 MS 및 1D 및 2D NMR 실험에 의한 분석으로 화합물 7-O-카르바모일-15-하이드록시프리-막베신을 확인했다(15).
Figure 112008045421569-PCT00011
3.3 동정 및 특성화
MS 및 NMR 실험을 계속적으로 수행했다. 즉, LCMS, MSMS, 1 H, 13C, APT, COSY-45, HMQC, HMBC을 수행했다. 이러한 데이터의 철저하고 완전한 연구를 통해 프리-막베신의 두 유사체들의 양성자 및 탄소 대부분을 지정해낼 수 있었다. NMR 지정(assignment)은 표 5에 기술했다.
Figure 112008045421569-PCT00012
Figure 112008045421569-PCT00013
* 이들 탄소에 대한 접촉은 생성되지 않았고, 표시는
실시예 4. gdmM 상동체 mbcM 프레임내 결실( in - frame deletion )을 갖는 악티노신네마 프레티오섬 균주의 생성
4.1 mbcM 의 하위 플랭킹 부분에 상동적인 DNA 클로닝
올리고 BV145(서열번호 22) 및 BV146(서열번호 23)는 주형으로 코스미드 52(실시예 1로부터 생성된) 및 Pfu DNA 합성효소를 사용한 표준 PCR 반응 내에서 악티노신네마 프레티오섬(ATCC 31280)유래 DNA의 1421bp 부분을 증폭하는 데 사용하였다.
5' 연장부는 증폭된 단편을 클로닝하기 쉽게 하기 위한 제한효소 자리가 도입되도록 각각의 올리고 내에 고안했다(도 7).
증폭된 PCR 생산물(PCRwv308, 서열번호 20, 도 8A)은 mbcM의 3‘ 말단의 33bp 및 하위 상동부분의 1368bp를 코딩한다. 이 1461bp 단편을 SmaI으로 선형화된 pUC19 내로 클로닝하여 pWV308을 얻었다.
4.2 mbcM 의 상위 플랭킹 부분에 상동적인 DNA 클로닝
올리고 BV147(서열번호 24) 및 BV148(서열번호 25)는 주형으로 코스미드 52(실시예 1로부터 생성된) 및 Pfu DNA 합성효소를 사용한 표준 PCR 반응 내에서 악티노신네마 프레티오섬(ATCC 31280)유래 DNA의 1423bp 부분을 증폭하는 데 사용하였다.
5' 연장부는 증폭된 단편을 클로닝하기 쉽게 하기 위한 제한효소 자리가 도입되도록 각각의 올리고 내에 고안했다(도 7).
증폭된 PCR 생산물(PCRwv309, 서열번호 21, 도 8B)은 mbcM의 3‘ 말단의 30bp 및 상위 상동부분의 1373bp를 코딩한다. 이 1423bp 단편을 SmaI으로 선형화된 pUC19 내로 클로닝하여 pWV308을 얻었다.
BVl 45 ATATACTAGTCACGTCACCGGCGCGGTGTCCGCGGACTTCGTCAACG
SpeI
(서열번호 22)
BVl46 ATATCCTAGGCTGGTGGCGGACCTGCGCGCGCGGTTGGGGTG
AvrII
(서열번호 23)
BVl47 ATATCCTAGGCACCACGTCGTGCTCGACCTCGCCCGCCACGC
AvrII
(서열번호 24)
BVl 48 ATATTCTAGACGCTGTTCGACGCGGGCGCGGTCACCACGGGC
XbaI
(서열번호 25)
생산물 PCRwv308 및 PCRwv309는 같은 방향성으로 pUC19 내로 클로닝되어 다음 클로닝 과정을 위해 pUC19 폴리링커 내에 PstI 자리를 형성했다.
pWV309 유래의 1443bp AvrII/PstI 단편은 pWV308의 4073bp AvrII/PstI 단편 내로 클로닝되어 pWV310을 생성했다. pWV310은 그러므로 AvrII 자리에 결합된 mbcM의 플랭킹 부분과 상동적인 DNA를 코딩하는 SpeI/XbaI 단편을 포함했다.
4.3 악티노신네마 프레티오섬 아속 . 프레티오섬의 형질전환
플라스미드 pUZ8002가 내재되어 있는 대장균 ET12567은 접합(conjugation)을 위한 대장균 공여균주를 생성시키기 위해 전기천공을 통해 pWV320으로 형질전환시켰다. 이 균주는 무성 접합에 의한 악티노신네마 프레티오섬 아속. 프레티오섬의 형질전환에 이용되었다(Matsushima et al., 1994).
세균접합체(exconjugants)를 배지 4 상에 도말하고, 28℃로 배양했다. 24시간 후, 50 mg/L 아프라마이신 및 25 mg/L 날리딕스산을 배양용기 상에 발랐다.
pWV320은 악티노신네마 프레티오섬 아속. 프레티오섬 내에서 증폭될 수 없지만, 어떠한 아프라마이신 저항성 콜로니는 플라스미드에 포함된 상동체의 mbcM 플랭킹 부분을 통한 상동재조합에 의해 염색체 내로 통합된 플라스미드 pWV320를 포함하는 형질전환체가 될 수 있을 것으로 기대된다
6개 세균접합체로부터 게놈 DNA를 분리하고, 제한효소처리하고, 서던블롯으로 분석했다. 블롯은 6개 분리체 중 4개에서 상동체의 상위 부분에서 상동적 통합이 발생된 것으로 나타났고, 6개 분리체 중 두 개에서 하위 부분에서 상동적 통합이 발생된 것으로 나타났다.
상위 부분(BIOT-3831에서 고안된)에서 상동적 통합되어 얻은 균주를 2차 교차에 대한 스크리닝을 위해 선택했다. 하위 부분(BIOT-3832에서 고안된)에서 상동적 통합되어 얻은 균주를 2차 교차에 대한 스크리닝을 위해 또한 선택했다.
4.4 2차 교차에 대한 스크리닝
균주들은 배지 4(50 mg/L 아프라마이신으로 보충된) 상에 부착되고, 28℃에서 4일간 생장시켰다. 각각 부착물의 1 cm2 부분을 50ml 팔콘 튜브에 담긴 항생제가 함유되지 않은 7 mL의 변형된 ISP2(1L 증류수 내에 0.4% 효모 추출물, 1% 맥아 추출물, 0.4% 덱스트로스 함유)에 접종하는 데 이용했다. 배양물은 2-3일간 생장시켜 이후 50ml 팔콘 튜브에 담긴 다른 7 mL의 변형된 ISP2(상기 참고) 내로 계대배양(5% 접종)했다. 4-5회 계대배양 후 배지에 초음파를 처리하고, 연속적으로 희석한 후, 배지 4로 옮겨 28℃에서 4일동안 배양하였다. 이후 단일콜로니를 아프라마이신을 포함하는 배지 4 및 항생제를 포함하지 않는 배지 4 위에 부착한 후 플레이트를 28℃에서 4일 동안 배양하였다.
아프라마이신 플레이트에서 자라지 못하는 것을 제외하고 항생제가 없는 플레이트 상에서 자란 부착물은 이들이 항생제 마커를 잃었는지를 확인하기 위해 +/- 아프로마이신 플레이트 상에 재부착시켰다.
모든 아프로마이신 감수성 균주로부터 게놈 DNA를 분리하고, 서던 블롯으로 분석했다. 이러한 단계에서, 2차 교차 균주들의 반수는 야생형으로 되돌아가지만, 반수는 원하는 mbcM이 결실된 변이체로 생성된다. 상기 돌연변이 균주는 502 아미노산의 프레임내 결실을 가지는 mbcM 단백질을 코딩한다(도 9).
mbcM이 결실된 변이체는 배지 4 상에 부착되고, 28℃에서 4일간 생장시켰다. 각각의 부착물로부터 6 mm의 원형 플러그를 종자배지 10 mL(배지 1의 변형- 2% 글루코스, 3% 수성전분, 0.5% 콘스팁고형, 1% 콩가루, 0.5% 펩톤, 0.3% 염화나트륨, 0.5% 칼슘 카르보네이트)를 포함한 각각의 50ml 팔콘 튜브에 접종하는 데 이용했다.
이러한 종자배지 배양액을 28℃, 200 rpm조건에서 5 inch 작동반경으로 2일 동안 배양했다. 이들을 이후 생산배지(배지 2- 5% 글리세롤, 1% 콘스팁고형, 2% 효모추출물, 2% 인산이수소칼륨, 0.5% 염화마그네슘, 1% 칼슘 카르보네이트)에 접종하고, 28℃에서 24 시간 동안 생장시키고, 이후 26℃에서 추가로 5일 동안 생장시켰다.
이러한 배양물로부터 2차 대사체를 동량의 에틸 아세테이트를 첨가함으로써 추출했다. 세포 파편은 원심분리로 제거했다. 상등액을 깨끗한 튜브에 옮기고, 진공 하에서 용매를 제거했다. 샘플은 0.23mL 메탄올 내에 재구성시키고 0.02mL의 1%(w/v) FeCl3 용액을 첨가했다. 샘플의 막베신 유사체 생산성을 평가했다.
상기 실시예 2, 3에 기재한 방법을 사용한 LCMS를 통한 화학적 분석은 동일한 체류시간 및 질량 분석을 갖는 것들에 기초하여 화합물 14 및 15의 존재를 명백하게 확인시켰다.
4.5 BIOT -3872 원생생물 생성을 통한 각각의 콜로니 선별
하기의 배지 변형을 이용하는 Weber 및 Losick 1988 BIOT-3872로부터 개작된 방법으로 BIOT-3872로부터 원생생물을 생성시켰다; 악티노신네마 프레티오섬 배양물은 ISP2 플레이트(배지 3) 상에서 28℃에서 3일간 생장시키고, 5 mm2를 긁어내어 물 내에 멸균된 10%(w.v) 글리신 2 mL가 보충된 ISP2 브로쓰 40mL에 접종했다.
원생생물은 Weber 및 Losick 1988에 기재된 바와 같이 생성되었고, R2 플레이트(R2 제조법- 수크로스 103g, K2SO4 0.25g, MgCl2·6H2O 10.12 g, 글루코스 10 g, 디프코 카사미노산 0.1g, 디프코 박토 아가 22g, 증류수를 최종 800mL가 되도록 첨가하고, 혼합물을 121℃에서 20분간 오토클레이브시켜 멸균했다. 오토클레이브한 후, 하기의 오토클레이브된 용액을 첨가했다; 0.5% KH2PO4 10mL, 3.68% CaCl2·2H2O 80mL, 20% L-프롤린 15mL, 5.73% TES 버퍼(pH7.2) 100mL, Trace element solution(ZnCI2 40mg, FeCl3·6H2O 200mg, CuCl2·2H2O 10mg, MnCl2·4H2O 10mg, Na2B4O7·10H2O 10mg, (NH4)6Mo7O24·4H2O 10mg, 증류수를 최종 1L가 되도록 첨가) 2mL, NaOH(1N) (비멸균된) 5 mL) 상에서 재생되었다.
80개의 각각의 콜로니들을 MAM 플레이트(배지 4) 상에 부착시키고, 상기 실시예 2, 3에 기재된 바와 같이 막베신 유사체의 생산성을 분석했다. 원생생물 대부분은 모균주와 비슷한 수준으로 생산시키는 부착물을 생성시켰다. 80개 샘플 중 15개는 모균주보다 확실히 더 많이 14 및 15를 생산했다. 가장 최고의 생산균주, WV4a-33(BIOT-3870)은 모균주보다 훨씬 높은 수준으로 14 및 15을 생산시키는 것으로 나타났다.
실시예 5. 생물학적 데이터 - 막베신 유사체의 시험관내 항암 활성 평가
시험 화합물의 시험관 내 항암활성 평가는 단일층 증식 방법에 의해 증식된 인간 종양 세포주의 패널을 대상으로 변형된 요오드화 프로피디엄 분석(propidium iodide assay)을 사용하는 일반적인 방법에 기재된 바와 같이 수행되었다.
9개 세포주에 대한 결과를 하기의 표 6에 나타냈다; 각각의 결과는 중복실험의 평균을 나타낸 것이다. 표 7은 평가기준으로서 막베신을 이용하여, 38개 세포주 패널 시험을 통한 화합물에 대한 평균 IC70를 보여준다.
Figure 112008045421569-PCT00014
Figure 112008045421569-PCT00015
실시예 6. 용해도 평가
시험 화합물의 용액(25mM)을 적절한 양의 DMSO 내에 용해시켜 3-5 mg 분취액(aliquots)으로 준비했다.
분취액(0.01 mL)은 유리 바이얼 내의 0.490 mL pH 7.3 PBS에 첨가되었다. 각각의 시간 포인트에 대한 3 PBS 바이얼이 황색 바이얼 내에 준비되었다. 6시간 포인트를 위한 DMSO 내의 세 개 분취액이 또한 준비되었다.
결과물인 0.5 mM 용액을 6시간까지 교반하였는데, 1, 3 및 6시간째에 분석을 위해 바이얼을 제거했다. 샘플은 HPLC(0.025mL 주입)에 의해 분석되었다.
화합물은 274 nm에서 측정된 피크 부분에 의해 정량화되었다.
각각의 시간 포인트별 PBS 내 2% DMSO에서의 용해도는 각각의 크로마토그램에 대한 전체 피크 부분과 6시간째에 해당되는 DMSO 용액에서 생성된 크로마토그램에 대한 평균 전체 피크 부분을 기뵤함으로써 결정했다. (DMSO 용액 내의 평균 전체 피크는 0.5mM로 가정되었다,)
상기 결과를 하기 표 8에 나타냈다.
Figure 112008045421569-PCT00016
* -이러한 화합물의 용해도는 이 평가의 최대 측정 한계이거나 이를 넘는 것이다.
실시예 7. Hsp90 결합
등온적정열량계 및 Kd 값 결정
효모 Hsp90은 1 mM EDTA 및 5 mM NaCl을 함유하는 20 mM Tris pH7.5에 투석되고, 동일한 버퍼이지만 2% DMSO를 함유하지 않은 버퍼로 0.008 mM로 희석되었다.
시험 화합물은 50 mM 농도로 100% DMSO 내에 용해시키고, 2% DMSO를 포함하는 Hsp90를 위해 동일 버퍼 내에서 0.1 mM로 희석했다. 작용열은 MSC 시스템(Microcal) 상에서 1.485mL의 세포 부피로 30℃에서 측정했다.
각각의 0.100 mM 시험화합물 0.027 mL의 10개 분획물들을 0.008 mM 효모 Hsp90 내로 주입했다. 희석열은 시험화합물을 2% DMSO가 함유된 버퍼 내로 주입시켜 각각의 실험 내에서 결정하였고, 세 플로팅 변수; 화학양론, 결합상수 및 작용 엔탈피 내의 변화에 따른 비선형 최소 스퀘어 커브-피팅 알고리즘(Microcal Origin)을 사용하여 올바를 데이터를 일치시켰다. 상기 결과는 하기 표 9에 나타냈다.
Figure 112008045421569-PCT00017
실시예 8. mbcM 프레임내 결실( in - frame deletion )되고, mbcMT1 , mbcMT2 , mbcP mbcP450 추가적으로 결실된 악티노신네마 프레티오섬 균주의 생성
8.1 mbcMT2 의 하위 플랭킹 부분에 상동적인 DNA 클로닝
올리고 Is4del1(서열번호 29) 및 Is4del2a(서열번호 30)는 주형으로 코스미드 52(실시예 1로부터 생성된) 및 Pfu DNA 합성효소를 사용한 표준 PCR 반응 내에서 악티노신네마 프레티오섬(ATCC 31280)유래 DNA의 1595bp 부분을 증폭하는 데 사용하였다. 5' 연장부는 증폭된 단편을 클로닝하기 쉽게 하기 위한 AvrII 자리가 도입되도록 올리고 Is4del2a 내에 고안했다(도 10). 증폭된 PCR 생산물(1+2a, 도 11, 서열번호 31)은 mbcMT2의 3‘ 말단의 196bp 및 하위 상동부분의 1393bp를 코딩한다. 이 1595bp 단편을 SmaI으로 선형화된 pUC19 내로 클로닝하여 pLSS1+2a를 얻었다.
Is4del1 (서열번호 29)
5' - GGTCACTGGCCGAAGCGCACGGTGTCATGG - 3'
Is4del2a (서열번호 30)
5' - CCTAGGCGACTACCCCGCACTACTACACCGAGCAGG - 3'
8.2 mbcM 의 상위 플랭킹 부분에 상동적인 DNA 클로닝
올리고 Is4del3b(서열번호 32) 및 Is4del4(서열번호 33)는 주형으로 코스미드 52(실시예 1로부터 생성된) 및 Pfu DNA 합성효소를 사용한 표준 PCR 반응 내에서 악티노신네마 프레티오섬(ATCC 31280)유래 DNA의 1541bp 부분을 증폭하는 데 사용하였다. 5' 연장부는 증폭된 단편을 클로닝하기 쉽게 하기 위한 AvrII 자리가 도입되도록 올리고 Is4del3b 내에 고안했다(도 10). 증폭된 PCR 생산물(3b+4, 도 12, 서열번호 34)은 mbcP의 5‘ 말단의 100bp 및 상위 상동부분의 ~1450bp를 코딩한다. 이 ~1550bp 단편을 SmaI으로 선형화된 pUC19 내로 클로닝하여 pLSS3b+4를 얻었다.
Is4del3b (서열번호 32)
5' - CCTAGGAACGGGTAGGCGGGCAGGTCGGTG - 3'
Is4del4 (서열번호 33)
5' - GTGTGCGGGCCAGCTCGCCCAGCACGCCCAC - 3'
생산물 1+2a 및 3b+4는 pUC19 내로 클로닝되어 다음 클로닝 과정을 위해 pUC19 폴리링커 내에 HindIII 및 BamHI 자리를 형성했다.
pLSS1+2a 유래의 1621bp AvrII/HindIII 단편 및 pLSS3b+4 유래의 1543bp AvrII/BamHI 단편은 pKC1132의 3556bp HindIII/BamHI 단편 내로 클로닝되어 pLSS315를 생성했다. pLSS315는 그러므로 AvrII 자리에 결합된 고안된 4개 ORF 결실 부분의 플랭킹 부분과 상동적인 DNA를 코딩하는 HindIII/BamHI 단편을 포함했다(도 7).
8.3 BIOT -3870의 pLSS315 에 의한 형질전환
플라스미드 pUZ8002가 내재되어 있는 대장균 ET12567은 접합(conjugation)을 위한 대장균 공여균주를 생성시키기 위해 전기천공을 통해 pLSS315로 형질전환시켰다. 이 균주는 무성 접합에 의한 BIOT-3870의 형질전환에 이용되었다(Matsushima et al., 1994).
세균접합체(exconjugants)를 MAM 배지(1% 수성전분, 0.25% 콘스팁고형, 0.3% 효모추출물, 0.3% 칼슘 카르보네이트, 0.03% 황산철, 2% 아가) 상에 도말하고, 28℃로 배양했다. 24시간 후, 50mg/L 아프라마이신 및 25mg/L 날리딕스산을 배양용기 상에 발랐다.
pLSS315는 BIOT-3870 내에서 증폭될 수 없지만, 어떠한 아프라마이신 저항성 콜로니는 플라스미드에 원래 포함된 상동 부분을 통한 상동재조합에 의해 염색체 내로 통합된 플라스미드를 포함하는 형질전환체가 될 수 있을 것으로 기대된다.
8.4 2차 교차에 대한 스크리닝
3개의 BIOT-3870의 주요한 형질전환체:pLSS315가 2차 교차에 대한 스크리닝을 위한 계대배양을 위해 선택되었다.
균주들은 MAM 배지(50mg/L 아프라마이신으로 보충된) 상에 부착시켜, 28℃에서 4일간 생장시켰다. 각각 부착물의 6mm 원형 플러그를 250ml 코니칼 플라스크에 담긴 ISP2(0.4% 효모 추출물, 1% 맥아 추출물, 0.4% 덱스트로스 함유, 항생제는 함유하지 않음)에 접종하는 데 이용했다.
배양물은 2-3일간 생장시켜 이후 250ml 코니칼 플라스크에 담긴 30ml의 ISP2(상기 참고) 내로 계대 배양(5% 접종)했다. 배양물을 실시예 3.6<?>에 기재된 바와 같이 4-5번 계대배양하여 원생생물화한 후, 상기 원생생물을 연속적으로 희석하고, 재생 배지 상에 도말하고(실시예 3.6), 28℃에서 4일간 배양시켰다. 하나의 클로니를 아프라마이신을 함유하는 MAM 배지 및 항생제를 포함하지 않는 NAM 배지 모두에 부착시키고, 28℃에서 4일간 배양시켰다.
아프라마이신 플레이트에서 자라지 못하는 것을 제외하고 항생제가 없는 플레이트 상에서 자란 클론 no 1(no 32-37) 유래의 7개 부착물 및 클론 no 3(no 38-41)유래의 4개 부착물은 이들이 항생제 마커를 잃었는지를 확인하기 위해 +/- 아프로마이신 플레이트 상에 재부착시켰다.
막베신 유사체 생산은 일반적 방법에 기술된 바와 같이 수행했다. 분석은 일반적 방법 및 실시예 2에 기술된 바와 같이 수행했다.
화합물 14는 모균주 BIOT-3870과 비슷한 정도의 산출량을 생산했고, 부착물 33, 34, 35, 37, 39 및 41에서는 화합물 15의 생산이 전혀 관찰되지 않았다. 이러한 결과는 원하는 돌연변이 균주가 원래의 mbcM 결실에 더하여 mbcP, mbcP450, mbcMT1 및 mbcMT2 유전자를 포함하는 막베신 클러스터의 3892bp 결실을 가짐을 보여주는 것이다.
실시예 9. 생물학적 데이터 - 화합물 14와 표준 세포독성제 미토마이신C, 이포스파미드 , 사이클로헥실클로로에틸니트로수레아 ( CCNU ), 미토잔트론 빈데신과의 병용 시 시험관 내 항암활성 평가
표준 세포독성제와 병용될 때, 단일층 증식 방법으로 증식된 종양 세포 DU145에 대한 14의 시험관 내 항암 활성 평가는 변형된 요오드화 프로피디엄 분석을 이용하는 일반적 방법에 기재된 바와 같이 수행했다.
14의 4가지 구별되는 농도로 미토마이신 C에 대해 0-80nM, 이포스파미드, CCNU, 미토잔트론 및 빈데신에 대해 0-160 nM을 표준 제제 10농도에 따라 사용했다.
상대적인 세포 성장률 처리군/대조군(%T/C) 수준이 플롯되었고, 도 13- 17에 나타낸 그래프를 그리는 데 이용되었다. 이러한 그래프는 이후 표 10-11에 보인 IC70 값을 계산하는 데 이용되었다.
Figure 112008045421569-PCT00018
Figure 112008045421569-PCT00019
상기 데이터는 알킬화제 미토마이신 C, 이포스파미드 및 CCNU, 토포이소머라제 II 억제제 미토잔트론 및 유사분열 억제제 빈데신 같은 표준 세포독성제의 영향이 화합물 14의 첨가에 의해 개선되는 것을 보여준다.
미토마이신 C, 이포스파미드 및 CCNU, 미토잔트론 및 빈데신 같은 세포 독성제의 유용성은 이들의 독성 때문에 제한되는 것으로 알려져 있으며, 치료과정에서 이들의 최대 내성 용량 정도의 고농도로 편리하게 이용되었다. 그러므로 본 발명의 화합물 14 및 다른 화합물이 치료에 이용되는 세포 독성제(미토마이신 C, 이포스파미드 및 CCNU, 미토잔트론 및 빈데신 같은)의 양을 절약시킬 수 있는 유용한 효과를 낸다는 것이 추론될 수 있다. 따라서, 세포독성제 단독 또는 한 세포독성제와 다른 세포독성제의 병용 시보다 더 좋은 치료학적 효능 및 감소된 부작용을 가지는 유효량으로 수행할 수 있다.
참고문헌
Allen, I. W. and Ritchie, D.A. (1994) Cloning and analysis of DNA sequences from Streptomyces hygroscopicus encoding geldanamycin biosynthesis. MoI. Gen. Genet. 243: 593- 599.
Bagatell, R. and Whitesell, L. (2004) Altered Hsp90 function in cancer: A unique therapeutic opportunity. Molecular Cancer Therapeutics 3: 1021-1030.
Beliakoff, J. and Whitesell, L. (2004) Hsp90: an emerging target for breast cancer therapy. Anti- Cancer Drugs 15:651-662. Bierman, M., Logan, R., O'Brien, K., Seno, ET., Nagaraja Rao, R. and Schoner, BE. (1992)
"Plasmid cloning vectors for the conjugal transfer of DNA from Escherichia coli to Streptomyces spp." Gene 116: 43-49.
Blagosklonny, M.V. (2002) Hsp-90-associated oncoproteins: multiple targets of geldanamycin and its analogues. Leukemia 16:455-462. Blagosklonny, M.V., Toretsky, J., Bohen, S. and Neckers, L. (1996) Mutant conformation of p53 translated in vitro or in vivo requires functional HSP90. Proc. Natl. Acad. Sci. USA 93:8379-8383.
Bohen, S. P. (1998) Genetic and biochemical analysis of p23 and ansamycin antibiotics in the function of Hsp90-dependent signaling proteins. MoI Cell Biol 18:3330-3339. Carreras, C.W., Schirmer, A., Zhong, Z. and Santi D.V. (2003) Filter binding assay for the geldanamycin-heat shock protein 90 interaction. Analytical Biochemistry 317:40-46.
Cassady, J. M., Chan, K.K., Floss, H. G. and Leistner E. (2004) Recent developments in the maytansinoid antitumour agents. Chem. Pharm. Bull. 52(1) 1-26.
Chiosis, G., Huezo, H., Rosen, N., Mimnaugh, E., Whitesell, J. and Neckers, L. (2003) 17AAG: Low target binding affinity and potent cell activity - finding an explanation. Molecular Cancer
Therapeutics 2:123-129.
Chiosis, G., Vilenchik, M., Kim, J. and SoNt, D. (2004) Hsp90: the vulnerable chaperone. Drug
Discovery Today 9:881-888.
Csermely, P. and Soti, C. (2003) Inhibition of Hsp90 as a special way to inhibit protein kinases. Cell.Mol.Biol.Lett. 8:514-515.
DeBoer, C and Dietz, A. (1976) The description and antibiotic production of Streptomyces hygroscopicus var. geldanus. J. Antibiot. 29:1182-1188.
DeBoer, C, Meulman, P.A., Wnuk, R. J., and Peterson, D. H. (1970) Geldanamycin, a new antibiotic. J. Antibiot. 23:442-447. Dengler W.A., Schulte J., Berger D. P., Mertelsmann R. and Fiebig HH. (1995) Development of a propidium iodide fluorescence assay for proliferation and cytotoxicity assay. Anti-Cancer Drugs, 6:522-532.
Dikalov, s., Landmesser, U., Harrison, DG., 2002, Geldanamycin Leads to Superoxide Formation by Enzymatic and Non-enzymatic Redox Cycling, The Journal of Biological Chemistry, 277(28), pp25480-25485
Donze O. and Picard, D. (1999) Hsp90 binds and regulates the ligand-inducible α subunit of eukaryotic translation initiation factor kinase Gcn2. MoI Cell Biol 19:8422-8432.
Egorin MJ, Lagattuta TF, Hamburger DR, Covey JM, White KD, Musser SM, Eiseman JL. (2002) "Pharmacokinetics, tissue distribution, and metabolism of 17-(dimethylaminoethylamino)-17-demethoxygeldanamycin (NSC 707545) in CD2F1 mice and Fischer 344 rats. " Cancer Chemother Pharmacol, 49(1), pp7-19. Eustace, B. K., Sakurai, T., Stewart, J. K., et al. (2004) Functional proteomic screens reveal an essential extracellular role for hsp90α in cancer cell invasiveness. Nature Cell Biology 6:507-514.
Fang, Y., Fliss, A.E., Rao, J. and Caplan A.J. (1998) SBA1 encodes a yeast Hsp90 cochaperone that is homologous to vertebrate p23 proteins. MoI Cell Biol 18:3727-3734. Fiebig H. H., Dengler W.A. and Roth T. Human tumor xenografts: Predictivity, characterization, and discovery of new anticancer agents. In: Fiebig HH, Burger AM (eds). Relevance of Tumor
Models for Anticancer Drug Development. Contrib. Oncol. 1999, 54: 29 - 50.
Goetz, M. P., Toft, D.O., Ames, M. M. and Ehrlich, C. (2003) The Hsp90 chaperone complex as a novel target for cancer therapy. Annals of Oncology 14:1169-1176. Harris, S.F., Shiau A.K. and Agard D.A. (2004) The crystal structure of the carboxy-terminal dimerization domain of htpG, the Escherichia coli Hsp90, reveals a potential substrate binging site.
Structure 12: 1087-1097.
Hong, Y.-S., Lee, D., Kim, W., Jeong, J.-K. et al. (2004) Inactivation of the carbamoyltransferase gene refines post-polyketide synthase modification steps in the biosynthesis of the antitumor agent geldanamycin. J. Am. Chem. Soc. 126:11142-11143.
Hostein, I., Robertson, D., DiStefano, F., Workman, P. and Clarke, P.A. (2001) Inhibition of signal transduction by the Hsp90 inhibitor 17-allylamino-17-demethoxygeldanamycin results in cytostasis and apoptosis. Cancer Research 61 :4003-4009.
Hu, Z., Liu, Y., Tian, Z.-Q., Ma, W., Starks, CM. et al. (2004) Isolation and characterization of novel geldanamycin analogues. J. Antibiot. 57:421-428.
Hur, E., Kim, H.-H., Choi, S. M., et al. (2002) Reduction of hypoxia-induced transcription through the repression of hypoxia-inducible factor- 1α/aryl hydrocarbon receptor nuclear translocator DNA binding by the 90-kDa heat-shock protein inhibitor radicicol. Molecular Pharmacology 62:975-982.
Iwai Y, Nakagawa, A., Sadakane, N., Omura, S., Oiwa, H., Matsumoto, S., Takahashi, M., Ikai, T., Ochiai, Y. (1980) Herbimycin B, a new benzoquinoid ansamycin with anti-TMV and herbicidal activities. The Journal of Antibiotics, 33(10), pp1114-1119.
Jez, J. M., Chen, J. C-H., Rastelli, G., Stroud, R.M. and Santi, D.V. (2003) Crystal structure and molecular modeling of 17-DMAG in complex with human Hsp90. Chemistry and Biology 10:361-
368. Kaur, G., Belotti, D, Burger, A.M., Fisher-Nielson, K., Borsotti, P. et al. (2004) Antiangiogenic properties of 17-(Dimethylaminoethylamino)-17-Demethoxygeldanamycin: an orally bioavailable heat shock protein 90 modulator. Clinical Cancer Research 10:4813-4821.
Kieser, T., Bibb, M.J., Buttner, M.J., Chater, K.F., and Hopwood, D.A. (2000) Practical
Streptomyces Genetics, John lnnes Foundation, Norwich
Kumar, R., Musiyenko, A. and Barik S. (2003) The heat shock protein 90 of Plasmodium falciparum and antimalarial activity of its inhibitor, geldanamycin. J Malar 2:30. Kurebayashi, J., Otsuke, T., Kurosumi, M., Soga, S., Akinaga, S. and Sonoo, H. (2001) A radicicol derivative, KF58333, inhibits expression of hypoxia-inducible factor-1α and vascular endothelial growth factor, angiogenesis and growth of human breast cancer xenografts. Jpn. J. Cancer Res. 92:1342-1351.
Le Brazidec, J.-Y., Kamal, A., Busch, D., Thao, L., Zhang, L. et al. (2003) Synthesis and biological evaluation of a new class of geldanamycin derivatives as potent inhibitors of Hsp90. J. Med. Chem. 47: 3865-3873.
Lee, Y.-S., Marcu, M. G. and Neckers, L. (2004) Quantum chemical calculations and mutational analysis suggest heat shock protein 90 catalyzes trans-cis isomeration of geldanamycin. Chem.
Biol. 11 :991-998. Liu, X.-D., Morano, K.A. and Thiele D.J. (1999); The yeast Hsp110 family member, Sse1 , is an Hsp90 cochaperone. J Biol Chem 274:26654-26660.
Mandler, R., Wu, C, Sausville, E.A., Roettinger, A.J., Newman, D.J., Ho, D. K., King, R., Yang, D.,
Lippman, M. E., Landolfi, N. F., Dadachova, E., Brechbiel, M.W. and Waldman, T.A. (2000)
Immunoconjugates of geldanamycin and anti-HER2 monoclonal antibodies: antiproliferative activity on human breast carcinoma cell lines. Journal of the National Cancer Institute 92:1573-1581.
Matsushima, P., M. C. Broughton, et al. (1994). Conjugal transfer of cosmid DNA from
Escherichia coli to Saccharopolyspora spinosa: effects of chromosomal insertions on macrolide
A83543 production. Gene 146(1): 39-45.
McLaughlin S. H., Smith, H.W. and Jackson S.E. (2002) Stimulation of the weak ATPase activity of human Hsp90 by a client protein. J. MoI. Biol. 315: 787-798.
McCammon, M. T. and L. W. Parks (1981). Inhibition of sterol transmethylation by S- adenosylhomocysteine analogs. J Bacteriol 145(1): 106-12.
Muroi M, Izawa M, Kosai Y, Asai M. (1981) "The structures of macbecin I and M" Tetrahedron,
37, pp1123-1130. Muroi, M., Izawa M., Kosai, Y., and Asai, M. (1980) Macbecins I and II, New Antitumor antibiotics.
II. Isolation and characterization. J Antibiotics 33:205-212.
Neckers, L (2003) Development of small molecule Hsp90 inhibitors: utilizing both forward and reverse chemical genomics for drug identification. Current Medicinal Chemistry 9:733-739.
Neckers, L. (2002) Hsp90 inhibitors as novel cancer chemotherapeutic agents. Trends in Molecular Medicine 8:S55-S61.
Nimnnanapalli, R., O'Bryan, E., Kuhn, D., Yamaguchi, H., Wang, H.-G. and Bhalla, K.N. (2003) Regulation of 17-AAG-induced apoptosis: role of Bcl-2, Bcl-xL, and Bax downstream of 17-AAG- mediated down-regulation of Akt, Raf-1, and Src kinases. Neoplasia 102:269-275. Omura, S., Iwai, Y., Takahashi, Y., Sadakane, N., Nakagawa, A., Oiwa, H., Hasegawa, Y., Ikai, T., (1979), Herbimycin, a new antibiotic produced by a strain of Streptomyces. The Journal of Antibiotics, 32(4), pp255-261.
Omura, S., Miyano, K., Nakagawa, A., Sano, H., Komiyama, K., Umezawa, I., Shibata, K, Satsumabayashi, S., (1984), "Chemical modification and antitumor activity of Herbimycin A. 8,9- epoxide, 7,9-carbamate, and 17 or 19-amino derivatives". The Journal of Antibiotics, 37(10), pp1264-1267.
Ono, Y., Kozai, Y. and Ootsu, K. (1982) Antitumor and cytocidal activities of a newly isolated benzenoid ansamycin, Macbecin I. Gann. 73:938-44.
Patel, K., M. Piagentini, Rascher, A., Tian, Z. Q., Buchanan, G. O., Regentin, R., Hu, Z., Hutchinson, C. R. And McDaniel, R. (2004). "Engineered biosynthesis of geldanamycin analogs for hsp90 inhibition." Chem Biol 11(12): 1625-33.
Pfeifer, B. A. and C. Khosla (2001). "Biosynthesis of polyketides in heterologous hosts." Microbiology and Molecular Biology Reviews 65(1): 106-118.
Rascher, A., Hu, Z., Viswanathan, N., Schirmer, A. et al. (2003) Cloning and characterization of a gene cluster for geldanamycin production in Streptomyces hygroscopicus NRRL 3602. FEMS Microbiology Letters 218:223-230.
Rascher, A., Z. Hu, Buchanan, G. O., Reid, R. and Hutchinson, C. R. (2005). Insights into the biosynthesis of the benzoquinone ansamycins geldanamycin and herbimycin, obtained by gene sequencing and disruption. Appl Environ Microbiol 71(8): 4862-71. Rawlings, B. J. (2001). "Type I polyketide biosynthesis in bacteria (Part B)." Natural Product Reports 18(3): 231-281.
Roth T., Burger A.M., Dengler W., Willmann H. and Fiebig H. H. Human tumor cell lines demonstrating the characteristics of patient tumors as useful models for anticancer drug screening. In: Fiebig HH, Burger AM (eds). Relevance of Tumor Models for Anticancer Drug Development. Contrib. Oncol. 1999, 54: 145 - 156. Rowlands, M. G., Newbatt, Y.M., Prodromou, C, Pearl, L. H., Workman, P. and Aherne, W. (2004) High-throughput screening assay for inhibitors of heat-shock protein 90 ATPase activity. Analytical Biochemistry 327:176-183
Schulte, T.W., Akinaga, S., Murakata, T., Agatsuma, T. et al. (1999) Interaction of radicicol with members of the heat shock protein 90 family of molecular chaperones. Molecular Endocrinology 13:1435-1488.
Shibata, K., Satsumabayashi, S., Nakagawa, A., Omura, S. (1986a) The structure and cytocidal activity of herbimycin C. The Journal of Antibiotics, 39(11), pp1630-1633.
Shibata, K., Satsumabayashi, S., Sano, H., Komiyama, K., Nakagawa, A., Omura, S. (1986b)
Chemical modification of Herbimycin A: synthesis and in vivo antitumor activities of halogenated and other related derivatives of herbimycin A. The Journal of Antibiotics, 39(3), pp415-423.
Shirling, E. B. and Gottlieb, D. (1966) International Journal of Systematic Bacteriology 16:313- 340
Smith-Jones, P.M., SoNt, D. B., Akhurst, T., Afroze, F., Rosen, N. and Larson, S.M. (2004)
Imaging the pharmacodynamics of HER2 degradation in response to Hsp90 inhibitors. Nature Biotechnology 22:701-706.
Spiteller, P., Bai, L., Shang, G., Carroll, B.J., Yu, T.-W. and Floss, H. G. (2003). The post- polyketide synthase modification steps in the biosynthesis of the antitumor agent ansamitocin by Actinosynnema pretiosum. J Am Chem Soc 125(47): 14236-7
Sreedhar A.S., Nardai, G. and Csermely, P. (2004) Enhancement of complement-induced cell lysis: a novel mechanism for the anticancer effects of Hsp90 inhibitors. Immunology letters
92:157-161. Sreedhar, A.S., Sti, C. and Csermely, P. (2004a) Inhibition of Hsp90: a new strategy for inhibiting protein kinases. Biochimica Biophysica Acta 1697:233-242.
Staunton, J. and K. J. Weissman (2001). "Polyketide biosynthesis: a millennium review." Natural
Product Reports 18(4): 380-416.
Stead, P., Latif, S., Blackaby, A.P. et al. (2000) Discovery of novel ansamycins possessing potent inhibitory activity in a cell-based oncostatin M signalling assay. J Antibiotics 53:657-663.
Supko, J. G., Hickman, R.L., Grever, M. R. and Malspeis, L (1995) Preclinical pharmacologic evaluation of geldanamycin as an antitumor agent. Cancer Chemother. Pharmacol. 36:305-315.
Takahashi, A., Casais, C, lchimura K. and Shirasu, K. (2003) HSP90 interacts with RAR1 and
SGT1 and is essential for RPS2-mediated disease resistance in Arabidopsis. Proc. Natl. Acad. Sci. USA 20:11777-11782.
Tanida, S., Hasegawa, T. and Higashide E. (1980) Macbecins I and II, New Antitumor antibiotics. I. Producing organism, fermentation and antimicrobial activities. J Antibiotics 33:199-204.
Tian, Z. -Q., Liu, Y., Zhang, D., Wang, Z. et al. (2004) Synthesis and biological activities of novel 17-aminogeldanamycin derivatives. Bioorganic and Medicinal Chemistry 12:5317-5329.
Uehara, Y. (2003) Natural product origins of Hsp90 inhibitors. Current Cancer Drug Targets 3:325-330.
Vasilevskaya, I.A., Rakitina, T.V. and O'Dwyer, P.J. (2003) Geldanamycin and its 17-Allylamino- 17-Demethoxy analogue antagonize the action of cisplatin in human colon adenocarcinoma cells: differential caspase activation as a basis of interaction. Cancer Research 63: 3241-3246. Watanabe, K., Okuda, T., Yokose, K., Furumai, T. and Maruyama, H. H. (1982) Actinosynnema mirum, a new producer of nocardicin antibiotics. J. Antibiot. 3:321-324.
Weber, J. M., Losick, R. (1988) The use of a chromosome integration vector to a map erythromycin resistance and production genes in Sacharopolyspora erythraea (Streptomyces erythraeus) Gene 68(2), 173-180
Wegele, H., Mller, L. and Buchner, J. (2004) Hsp70 and Hsp90-a relay team for protein folding. Rev Physiol Biochem Pharmacol 151 :1-44.
Wenzel, S. C, Gross, F, Zhang, Y., Fu, J., Stewart, A.F. and Mller, R (2005) Heterologous expression of a myxobacterial natural products assembly line in Pseudomonads via Red/ET recombineering. Chemistry & Biology 12: 249-356.
Whitesell, L., Mimnaugh, E.G., De Costa, B., Myers, CE. and Neckers, L. M. (1994) Inhibition of heat shock protein HSPθO-ppθO^0 heteroprotein complex formation by benzoquinone ansamycins: Essential role for stress proteins in oncogenic transformation. Proc. Natl. Acad.
Sci. USA 91 : 8324-8328.
Winklhofer, K.F., Heller, U., Reintjes, A. and Tatzelt J. (2003) Inhibition of complex glycosylation increases the formation of PrPsc. Traffic 4:313-322. Workman P. (2003) Auditing the pharmacological accounts for Hsp90 molecular chaperone inhibitors: unfolding the relationship between pharmacokinetics and pharmacodynamics.
Molecular Cancer Therapeutics 2:131-138.
Workman, P. and Kaye, S. B. (2002) Translating basic cancer research into new cancer therapeutics. Trends in Molecular Medicine 8:S1-S9.
Young, J. C; Moarefi, I. and Hartl, U. (2001) Hsp90: a specialized but essential protein folding tool. J. Cell. Biol. 154:267-273.
본 출원 내에서 언급된 특허 및 특허 출원을 포함하는 모든 참고문헌들은 최대한으로 가능할 수 있는 참고문헌에 의해 본원에서 통합되었다.
상세한 설명 및 청구항에 걸쳐 사용하는 "포함하다(comprise)"라는 용어는 문맥상 다른 뜻을 요구하지 않는 한, 언급한 완전체(integer), 단계(step), 완전체의 군을 포함하는 것을 의미하며 다른 완전체 또는 단계 또는 완전체의 군 또는 단계들을 배제하는 것이 아님을 이해할 것이다.
본 발명에 따른 21-데옥시막베신 유사체는 독성, 글루타티온 같은 친핵체와의 결합력, 용해도, 대사안정성, 생체이용성 및 제형 가능성 등의 약제학적 성질이 개선되어 암 및/또는 B-세포 악성종양 치료에 효율적으로 이용될 수 있다.
SEQUENCE LISTING <110> Biotica Technology Limited <120> 21-DEOXYMACBECIN ANALOGUES USEFUL AS ANTITUMOR AGENTS <130> IPA080207 <150> GB0526473.4 <151> 2005-12-24 <150> GB0606549.4 <151> 2006-03-31 <150> GB0614374.7 <151> 2006-07-20 <160> 34 <170> PatentIn version 3.2 <210> 1 <211> 1638 <212> DNA <213> Streptomyces hygroscopicus NRRL 3602 <400> 1 atgaccggga aggaggcggc agtggacacc gcgcgggaaa cggacagcct cgaggccgag 60 gtgctgatcg tcggctacgg accggtgggc cagctactgt cggtgctact ggcccagcgc 120 gggcggcgcg tgacggtcgt ggagcgctgg ccggagccgt accggcaccc ccgggcggtc 180 gggttcgaca gtgaggccgc gcgccttctg gcctcggccg ggatcggcga ctcgctcgac 240 aagttcaccg aacccgcgcg ggaccacgcc tggcagaaca cgaagggcga gacgctgatc 300 gaccacgagg tggccgaccg ggggcactgc acctggccgg aggctttgtc ggcgtatcag 360 cccgccctgg agtccgcgct gatcgagcac ggggagacgc tgccgccgct gcggatcctg 420 cgcggatacg aggcggtggg actcgcggac gacggcgacc atgtgacctt gaccgtggtc 480 ggcccggacg gggagaagac ggacctcacc gcgctgtggg tggtcggctg cgacggcgcg 540 aacagcctgg taaggacggg cgtcggcacc accatgacgg acctcgactt ctcgtacgac 600 tggctgatct gcgatgtgcg gttgcacgag caccgcgagt tccggccgaa caacctggag 660 atctgcgatc cggcgcgccc ccggacggcg gtgtccgcgg gtcctggcca ccggcggtac 720 gagttcatgc gggtgcccgc ggacgacccc gaacacttcg gcaccgtgga gagcgcctgg 780 gagctgctgc ggctgttcga tgtgacgccc gagaacggcg ttctggaccg gcacgcggtc 840 tacaccttcc aggcccgctg ggcggagcgc tggcggaccg gacggatggt gctggccggg 900 gactcggcac acctcatgcc gccgttcgcg gggcagggca tgtgctccgg attccgtgac 960 gcggccaatc tggcctggaa actggacctg gtcctgggcg gacacgcggc gccgacgctg 1020 ctggacacct acaccaccga gcggcgggca cacgtgcggc acgcggtgga gatgtcggtg 1080 ggcctgggcc gggtggtgtg catggcggac ccggccgcgg cggcggaccg tgacgcggcg 1140 atgctggccg cgcgcaaacg caacatcggc ccgagtgccg cccgccgttc cgtggtgagg 1200 ccgctcgtgg acgggctgct acggcaggac ggtcagggcc gcccggcacc gtacgccggc 1260 caggcgggcc cccagtggcg agtgtgccgc gcgggaacca ccggcctgtt cgacgacgtg 1320 gtgggcaccg gtttcgtcct cctctacgcc gaggacgtgt tccccgcgct ggacgcgcgg 1380 cggctgacat tcctcgacag catcggcacc cgactggtgc gcatggtccc cgcggacacg 1440 cccccggccg ccctggggcc acgggacgcg ctggacgtgg aggaccggta cctgtcctat 1500 ctgtcggaga tggacgcgct ggcggtactg gtacgcccgg acttctacct gttcggcatc 1560 gcggaggacg agggcgaact cctctctctc gtagacgact tggccaccca gctgagcccg 1620 tcacccactc cttcgtaa 1638 <210> 2 <211> 2455 <212> DNA <213> Amycolatopsis mediterranei <400> 2 atgaccggga aggaggcggc agtggacacc gcgcgggaaa cggacagcct cgaggccgag 60 gtgctgatcg tcggctacgg accggtgggc cagctactgt cggtgctact ggcccagcgc 120 gggcggcgcg tgacggtcgt ggagcgctgg ccggagccgt accggcaccc ccgggcggtc 180 gggttcgaca gtgaggccgc gcgccttctg gcctcggccg ggatcggcga ctcgctcgac 240 aagttcaccg aacccgcgcg ggaccacgcc tggcagaaca cgaagggcga gacgctgatc 300 gaccacgagg tggccgaccg ggggcactgc acctggccgg aggctttgtc ggcgtatcag 360 cccgccctgg agtccgcgct gatcgagcac ggggagacgc tgccgccgct gcggatcctg 420 cgcggatacg aggcggtggg actcgcggac gacggcgacc atgtgacctt gaccgtggtc 480 ggcccggacg gggagaagac ggacctcacc gcgctgtggg tggtcggctg cgacggcgcg 540 aacagcctgg taaggacggg cgtcggcacc accatgacgg acctcgactt ctcgtacgac 600 tggctgatct gcgatgtgcg gttgcacgag caccgcgagt tccggccgaa caacctggag 660 atctgcgatc cggcgcgccc ccggacggcg gtgtccgcgg gtcctggcca ccggcggtac 720 gagttcatgc gggtgcccgc ggacgacccc gaacacttcg gcaccgtgga gagcgcctgg 780 gagctgctgc ggctgttcga tgtgacgccc gagaacggcg ttctggaccg gcacgcggtc 840 tacaccttcc aggcccgctg ggcggagcgc tggcggaccg gacggatggt gctggccggg 900 gactcggcac acctcatgcc gccgttcgcg gggcagggca tgtgctccgt tgacggacac 960 ggacgtcgtc atcgtcggaa acggcccgat cggcgccacg ctgtcggtgc tgctcgcgca 1020 acgcggttgg cgggtgacgg tgctcgaacg ccggccccgg ccgtacaagc tgccgcgggc 1080 gaccagcttc gacggcgaga cggcccggct gctggccgcc accggcatcg gcccggacct 1140 cggccggatc accgcgccgg ccaacggcta ccagtggcag accgccgacg ggcagacgct 1200 gctcgacatc gccttcacca cagacggccc gtacggctgg ccggacgcca acaccatgca 1260 ccagcccgcg ctcgaggagc tcctcgcggc ccgggcggcg gacctgcccg ggatcaccgt 1320 gctgcgcggg cacgaagtcg tggccatcac cgacggcgac tcgttcgtcc aggtgaccgc 1380 caccggcgaa gacgacgttc cgcggacgat ctcgggccgg tgggtggtcg gctgcgacgg 1440 tgccaacagc ttcgtgcgcg agcacctcga cgtgccggtg accgacctcg gcttctccta 1500 cgagtggcta ctctgcgacg tccggctgaa cgagccgcgc gagttcgtgc cgacgaacgt 1560 gcagatctgc gacccggccc ggcccaccac gctggtgggc agcgggcccg gccgccgtcg 1620 ctgggagttc atgcgcctgc cgggcgaaaa cgcggcggag ctcaacaagg acgagacggc 1680 gtggcggctg atggccccct tcggcgtcac ccccgaaacc gccaccctgc tgcgcagcac 1740 cacctacatc ttccaggccc gctgggccga ccggtggcgg gtggggcacg tcctgctcgc 1800 cggcgacgcg gcgcacctga tgccgccgtt cgccgggcag ggcatgtgct ccggcatccg 1860 cgacgtcacc aacctggcgt ggaagctcga cctcacgctc cgcggcttgg ctccggagtc 1920 ccttttggac agctacgggg acgagcggcg cgagcaggcg cgcgaggcca tcctcgcgtc 1980 ggtccagctg ggccgggtga tctgcgtgac ggacccggcg gccgccgccg agcgggactc 2040 gaccgtgctg gccaaccgcc gcggcaagcc cgcgggccgg ccggaaccgg cgaagccgct 2100 caccggcggg ctgcgccacg aaagcccggg cgcgggcgtg gtggtgccgc agggccgggt 2160 gcaggtcggc gacgccaccg ggctcttcga cgacgtcatc ggccggggtt tcgtcctgct 2220 gaccaccgag gagacccact cggacttcct caccgaactc ggagcccacg tcgtccggct 2280 cgacgagggg gtggacgtcg acgacgtcta ccggccgttc ctggcccggt tcggggcggc 2340 ttcggtgctc gtgcggccgg actaccacgt cttcggcacg gccgggccgg gcgggctcga 2400 agccctggtc ggcgccctgc gcgaccggct gcgcgccgcg gtgcccaccg gctag 2455 <210> 3 <211> 793 <212> DNA <213> Actinosynnema mirum <400> 3 ccgcgggcgg tcgggttcga cggtgaggcg acccgcgtgc tggcctcggc cgggctcggg 60 cccgcgctgg ccgagttcgg ggagcccgcg ggcgactacg agtggcgcac cgcgtccggg 120 gagacgctga tcgcgttcac cgtgcgggag gaggggcact gcggctggcc cgaggcgacc 180 tcggcctacc agcccgcgct ggaggacgcg ctgatcgcgc gcggcgaggc gctgccgggg 240 gttcaggtgc ggcgcggctg ggaggtgacc gggctgaccg accggggcga ccacgtgcgg 300 gtggtggcca ccgaccccgg cggggcgcgc gtgaggctga cggcgcggtt cgcggtcggc 360 tgcgacgggg cgaacagcgt ggtgcgggcc cgcaccggca ccgacgtgac cgacctggac 420 ttctcgcacg actggctggt gtgcgacgtg cggctgcacg accggcgccc ggtgacgccg 480 aacaacctcc aggtgtgcga cccggccagg ccgcgcaccg cggtgtcggc ggggccaggg 540 caccggcggt acgagttcat gcgggtgccc ggcgacgacc cggagcggtt cggcacgccg 600 gagagggcgt gggagctgct ggcgctgttc ggcgtcgggc gcggcgacgg ggtgctggac 660 cggctggccg tgtacacgtt ccaggcgcgg tgggcgcggc ggtggcgggc gggccggatg 720 ctgctggccg gggacgccgc gcacctgatg ccgccgttcg ccgggcaggg catgtgctcc 780 ggcatccgcg acg 793 <210> 4 <211> 1572 <212> DNA <213> Actinosynnema pretiosum <400> 4 gtggcgggcg aggtcgagca cgacgtggtg gtcgtcggct acgggccggt ggggcagctg 60 ctgtcggtgc tgctggcgca gcgcggctgg cgggtgctgg tgctggagcg ctggccgacg 120 ccgttccggc tgccgcgcgc ggtcgggttc gacagcgagg cgacccgcgt gctggcctcg 180 gccgggctcg ggcccgcgct ggccgagttc ggggagcccg cgggcgacta cgagtggcgc 240 accgcgtccg gggagacgct gatcgcgttc accgtgcggg aggaggggca ctgcggctgg 300 cccgaggcga cctcggccta ccagcccgcg ctggaggacg cgctgatcgc gcgcggcgag 360 gcgctgccgg gggttcaggt gcggcgcggc tgggaggtga ccgggctgac cgaccggggc 420 gaccacgtgc gggtggtggc caccgacccc ggcggggcgc gcgtgaggct gacggcgcgg 480 ttcgcggtcg gctgcgacgg ggcgaacagc gtggtgcggg cccgcaccgg caccgacgtg 540 accgacctgg acttctcgca cgactggctg gtgtgcgacg tgcggctgca cgaccggcgc 600 ccggtgacgc cgaacaacct ccaggtgtgc gacccggcca ggccacgcac cgcggtgtcg 660 gcggggccag ggcaccggcg gtacgagttc atgcgggtgc ccggcgacga cccggagcgg 720 ttcggcacgc cggagagggc gtgggagctg ctggcgctgt tcggcgtcgg gcgcggcgac 780 ggggtgctgg accggctggc cgtgtacacg ttccaggcgc ggtgggcgcg gcggtggcgg 840 gcgggccgga tgctgctggc cggggacgcc gcgcacctga tgccgccgtt cgccgggcag 900 ggcatgacct ccgggttccg ggacgcggcg aacctggcgt ggaagctgga cctggtgctg 960 cgcggcgagg ccgggtcggc gctgctggac agctacacgc tggagcgcgc cgagcacgtg 1020 cggcacgccg tgacgatctc ggtgggcctg gggcgggtgg tgtgcgtggc cgacccggcg 1080 gtggctgcgg accgggacgc ggcgatgctg gcggcgcgcg agcgcgagct gacaccgggc 1140 gcgtcggccc ggtcggtgct caagcccctg gaggacgggg tgctgcaccg ggacggcgac 1200 ggcgccctcg cgccgcacgc gggggccgtg ggcccgcagt ggcgggtggg gcgcggcggg 1260 cgggtcgggc tgttcgacga cgtggtgggg accgggttcg cgctgctcac caggggcggg 1320 ctggtggcgg ggccggaggt gcgggcgcgg ctggacgggc tgggcgcgcg ctacgcgcac 1380 ctggtgcccg ccggggcggc ggcggacggg ccggacgacg tggtcgacgt gagcgggaac 1440 tacctgacgt ggctggagga gctggacgcg gcggcggtgc tgctgcgacc ggacttctac 1500 gtgttcggcg cggccgggga cgcggcgggg ttggccgggc tggtggcgga cctgcgcgcg 1560 cggttggggt ga 1572 <210> 5 <211> 545 <212> PRT <213> Streptomyces hygroscopicus NRRL 3602 <400> 5 Met Thr Gly Lys Glu Ala Ala Val Asp Thr Ala Arg Glu Thr Asp Ser 1 5 10 15 Leu Glu Ala Glu Val Leu Ile Val Gly Tyr Gly Pro Val Gly Gln Leu 20 25 30 Leu Ser Val Leu Leu Ala Gln Arg Gly Arg Arg Val Thr Val Val Glu 35 40 45 Arg Trp Pro Glu Pro Tyr Arg His Pro Arg Ala Val Gly Phe Asp Ser 50 55 60 Glu Ala Ala Arg Leu Leu Ala Ser Ala Gly Ile Gly Asp Ser Leu Asp 65 70 75 80 Lys Phe Thr Glu Pro Ala Arg Asp His Ala Trp Gln Asn Thr Lys Gly 85 90 95 Glu Thr Leu Ile Asp His Glu Val Ala Asp Arg Gly His Cys Thr Trp 100 105 110 Pro Glu Ala Leu Ser Ala Tyr Gln Pro Ala Leu Glu Ser Ala Leu Ile 115 120 125 Glu His Gly Glu Thr Leu Pro Pro Leu Arg Ile Leu Arg Gly Tyr Glu 130 135 140 Ala Val Gly Leu Ala Asp Asp Gly Asp His Val Thr Leu Thr Val Val 145 150 155 160 Gly Pro Asp Gly Glu Lys Thr Asp Leu Thr Ala Leu Trp Val Val Gly 165 170 175 Cys Asp Gly Ala Asn Ser Leu Val Arg Thr Gly Val Gly Thr Thr Met 180 185 190 Thr Asp Leu Asp Phe Ser Tyr Asp Trp Leu Ile Cys Asp Val Arg Leu 195 200 205 His Glu His Arg Glu Phe Arg Pro Asn Asn Leu Glu Ile Cys Asp Pro 210 215 220 Ala Arg Pro Arg Thr Ala Val Ser Ala Gly Pro Gly His Arg Arg Tyr 225 230 235 240 Glu Phe Met Arg Val Pro Ala Asp Asp Pro Glu His Phe Gly Thr Val 245 250 255 Glu Ser Ala Trp Glu Leu Leu Arg Leu Phe Asp Val Thr Pro Glu Asn 260 265 270 Gly Val Leu Asp Arg His Ala Val Tyr Thr Phe Gln Ala Arg Trp Ala 275 280 285 Glu Arg Trp Arg Thr Gly Arg Met Val Leu Ala Gly Asp Ser Ala His 290 295 300 Leu Met Pro Pro Phe Ala Gly Gln Gly Met Cys Ser Gly Phe Arg Asp 305 310 315 320 Ala Ala Asn Leu Ala Trp Lys Leu Asp Leu Val Leu Gly Gly His Ala 325 330 335 Ala Pro Thr Leu Leu Asp Thr Tyr Thr Thr Glu Arg Arg Ala His Val 340 345 350 Arg His Ala Val Glu Met Ser Val Gly Leu Gly Arg Val Val Cys Met 355 360 365 Ala Asp Pro Ala Ala Ala Ala Asp Arg Asp Ala Ala Met Leu Ala Ala 370 375 380 Arg Lys Arg Asn Ile Gly Pro Ser Ala Ala Arg Arg Ser Val Val Arg 385 390 395 400 Pro Leu Val Asp Gly Leu Leu Arg Gln Asp Gly Gln Gly Arg Pro Ala 405 410 415 Pro Tyr Ala Gly Gln Ala Gly Pro Gln Trp Arg Val Cys Arg Ala Gly 420 425 430 Thr Thr Gly Leu Phe Asp Asp Val Val Gly Thr Gly Phe Val Leu Leu 435 440 445 Tyr Ala Glu Asp Val Phe Pro Ala Leu Asp Ala Arg Arg Leu Thr Phe 450 455 460 Leu Asp Ser Ile Gly Thr Arg Leu Val Arg Met Val Pro Ala Asp Thr 465 470 475 480 Pro Pro Ala Ala Leu Gly Pro Arg Asp Ala Leu Asp Val Glu Asp Arg 485 490 495 Tyr Leu Ser Tyr Leu Ser Glu Met Asp Ala Leu Ala Val Leu Val Arg 500 505 510 Pro Asp Phe Tyr Leu Phe Gly Ile Ala Glu Asp Glu Gly Glu Leu Leu 515 520 525 Ser Leu Val Asp Asp Leu Ala Thr Gln Leu Ser Pro Ser Pro Thr Pro 530 535 540 Ser 545 <210> 6 <211> 501 <212> PRT <213> Amycolatopsis mediterranei <400> 6 Met Thr Asp Thr Asp Val Val Ile Val Gly Asn Gly Pro Ile Gly Ala 1 5 10 15 Thr Leu Ser Val Leu Leu Ala Gln Arg Gly Trp Arg Val Thr Val Leu 20 25 30 Glu Arg Arg Pro Arg Pro Tyr Lys Leu Pro Arg Ala Thr Ser Phe Asp 35 40 45 Gly Glu Thr Ala Arg Leu Leu Ala Ala Thr Gly Ile Gly Pro Asp Leu 50 55 60 Gly Arg Ile Thr Ala Pro Ala Asn Gly Tyr Gln Trp Gln Thr Ala Asp 65 70 75 80 Gly Gln Thr Leu Leu Asp Ile Ala Phe Thr Thr Asp Gly Pro Tyr Gly 85 90 95 Trp Pro Asp Ala Asn Thr Met His Gln Pro Ala Leu Glu Glu Leu Leu 100 105 110 Ala Ala Arg Ala Ala Asp Leu Pro Gly Ile Thr Val Leu Arg Gly His 115 120 125 Glu Val Val Ala Ile Thr Asp Gly Asp Ser Phe Val Gln Val Thr Ala 130 135 140 Thr Gly Glu Asp Asp Val Pro Arg Thr Ile Ser Gly Arg Trp Val Val 145 150 155 160 Gly Cys Asp Gly Ala Asn Ser Phe Val Arg Glu His Leu Asp Val Pro 165 170 175 Val Thr Asp Leu Gly Phe Ser Tyr Glu Trp Leu Leu Cys Asp Val Arg 180 185 190 Leu Asn Glu Pro Arg Glu Phe Val Pro Thr Asn Val Gln Ile Cys Asp 195 200 205 Pro Ala Arg Pro Thr Thr Leu Val Gly Ser Gly Pro Gly Arg Arg Arg 210 215 220 Trp Glu Phe Met Arg Leu Pro Gly Glu Asn Ala Ala Glu Leu Asn Lys 225 230 235 240 Asp Glu Thr Ala Trp Arg Leu Met Ala Pro Phe Gly Val Thr Pro Glu 245 250 255 Thr Ala Thr Leu Leu Arg Ser Thr Thr Tyr Ile Phe Gln Ala Arg Trp 260 265 270 Ala Asp Arg Trp Arg Val Gly His Val Leu Leu Ala Gly Asp Ala Ala 275 280 285 His Leu Met Pro Pro Phe Ala Gly Gln Gly Met Cys Ser Gly Ile Arg 290 295 300 Asp Val Thr Asn Leu Ala Trp Lys Leu Asp Leu Thr Leu Arg Gly Leu 305 310 315 320 Ala Pro Glu Ser Leu Leu Asp Ser Tyr Gly Asp Glu Arg Arg Glu Gln 325 330 335 Ala Arg Glu Ala Ile Leu Ala Ser Val Gln Leu Gly Arg Val Ile Cys 340 345 350 Val Thr Asp Pro Ala Ala Ala Ala Glu Arg Asp Ser Thr Val Leu Ala 355 360 365 Asn Arg Arg Gly Lys Pro Ala Gly Arg Pro Glu Pro Ala Lys Pro Leu 370 375 380 Thr Gly Gly Leu Arg His Glu Ser Pro Gly Ala Gly Val Val Val Pro 385 390 395 400 Gln Gly Arg Val Gln Val Gly Asp Ala Thr Gly Leu Phe Asp Asp Val 405 410 415 Ile Gly Arg Gly Phe Val Leu Leu Thr Thr Glu Glu Thr His Ser Asp 420 425 430 Phe Leu Thr Glu Leu Gly Ala His Val Val Arg Leu Asp Glu Gly Val 435 440 445 Asp Val Asp Asp Val Tyr Arg Pro Phe Leu Ala Arg Phe Gly Ala Ala 450 455 460 Ser Val Leu Val Arg Pro Asp Tyr His Val Phe Gly Thr Ala Gly Pro 465 470 475 480 Gly Gly Leu Glu Ala Leu Val Gly Ala Leu Arg Asp Arg Leu Arg Ala 485 490 495 Ala Val Pro Thr Gly 500 <210> 7 <211> 33 <212> DNA <213> Artificial <220> <223> Primer <400> 7 ggtctagagg tcagtgcccc cgcgtaccgt cgt 33 <210> 8 <211> 26 <212> DNA <213> Artificial <220> <223> Primer <400> 8 ggcatatgct tgtgctcggg ctcaac 26 <210> 9 <211> 36 <212> DNA <213> Artificial <220> <223> primer <400> 9 cccgcccgcg cgagcggcgc gtggccgccc gagggc 36 <210> 10 <211> 36 <212> DNA <213> Artificial <220> <223> Primer <400> 10 gcgtcctcgc gcagccacgc caccagcagc tccagc 36 <210> 11 <211> 35 <212> DNA <213> Artificial <220> <223> Primer <400> 11 ccaaccccgc cgcgtccccg gccgcgccga acacg 35 <210> 12 <211> 34 <212> DNA <213> Artificial <220> <223> Primer <400> 12 gtcgtcggct acgggccggt ggggcagctg ctgt 34 <210> 13 <211> 35 <212> DNA <213> Artificial <220> <223> Primer <400> 13 gtcggtggac tgccctgcgc ctgatcgccc tgcgc 35 <210> 14 <211> 35 <212> DNA <213> Artificial <220> <223> Primer <400> 14 ggccggtggt gctgcccgag gacggggagc tgcgg 35 <210> 15 <211> 39 <212> DNA <213> Artificial <220> <223> Primer <400> 15 caccgctcgc gggggtggcg cggcgcacga cgtggctgc 39 <210> 16 <211> 38 <212> DNA <213> Artificial <220> <223> Primer <400> 16 cctcctcgga cagcgcgatc agcgccgcgc acagcgag 38 <210> 17 <211> 100588 <212> DNA <213> Actinosynnema pretiosum <400> 17 gatctggggc gacgagccgc ccgccgggcc ggggccggcg ttgcaggcgc tcgtctcccg 60 gctgcggcgg gcgctcggcg cgccgggcgc ggtcgcgctg ggggtgggcg ggtaccggct 120 cgtggcggac gtggacgcgg cgcggttcga ggagctggcc gcgcggggcg gggaggacgc 180 gctgcgggag gccgccgcgc tgtggggcgg gcgggtcggg ggcgagccgc cggtggtcgc 240 ggccgtcgcg ccgcgggtgg cgacccggct ggcgcggctg tcggtggagg tggtgctgga 300 cctggcggag gtcgagctgg cgctcgggcg caccggggcg gccatcggtg gggcgagcgg 360 ggtgctggcc gagcacccgg cgcacgagcg ggccgccggg gtgctggtgg acgcgctcgc 420 gggcgcggga cggcaggccg aggcgctggc ggcctacgag cgggtccgcg cggcgctggc 480 cgacgagctg ggcgccgacc ccggcacggc cctgcgcgag cgccacctgc ggctgctgcg 540 cgccaccccg ccaccgctcc cccggccgaa cgcgctgccc gcgccggtga cgggcttcct 600 cggccgggac gccgacctcg cccgcgtcgc cgacctgctg gccgccgggc ggctggtcac 660 cgtcgtcggg cccggcgggg tgggcaagac ccggctggcc gtggaggcgc tgcgccggga 720 ccgggacgcg ctgctggtgg acctcgcgcc ggtcgccgag ccctcggagg tcgtcgccgc 780 cgtgctcgcc gggatcgggc tgcgcggcga ccgcgaccgg ccgggcgggg acgcgacggc 840 gctgctggcc gccgagctgg cggcgcgcag gtcggtgctg ctgctggaca actgcgagca 900 cctggtcgac gccgtggccc acctggtcgc gctcctgctc ccccgctgcc ccgagctgcg 960 cgtgctcgcc accagccggg aacccctggc ggtcgacggg gaggcgctgg tcccgctggg 1020 gccgctcgcg ctgcccggaa tcggggacgg gcttgacgcc gcggtcggca cggcctcggt 1080 gcggttgttc gcccaacggg cgtcggcggt gcgccccggt ttcgccgtcg acgccacgac 1140 gctgccggac gtggtgcgcc tggtgcgggc gctggacggg ctgccgctgg cgctggagct 1200 ggccgccgcc cggttgcgcg ccctgccgct gcccgacctg gtggccgggt tgtcggcgcg 1260 gttccgcctg ctggcgggcg ggaaccgggc cgcgccgccc cggcaccgca cgctgcgcgc 1320 ggtgatcgcg tggagctggg acctgctgga cgggcccgag cgggccgtgg ccgagcggat 1380 ctccgtgctg cccggcgggg tcaccccgga gtcggccgcc gccgtctgcg cgggcgccgt 1440 gcccgccgac gaggtgcccg aactgctggc cgcgctggtc gaccggtcgc tgctgagcct 1500 ggtcgggggt cggcggcgga tgctggagac ggtgcgcgcg tacggggtcg agcgcctggc 1560 cgccgccggg gacttgagcg cggtccgcga cctggccgcc gcgcacgtgg cgggggtgct 1620 ggcggggcag gacgcggtgc tgcgcgggcc ggggcagcgc gcggcggtgg cggcgatcgg 1680 cgcggagcac gacaacgcgg tggccgcgct gcaccaccgg tgcgccaccg gggacgcgga 1740 cggggcgctc gcgctggcgc tgtcgctggt ctggtactgg caggtgttcg gccgccagtc 1800 cgagggcgcg cactggctcg ggcgggcgct ggcggtgccc ggcgggccgt ccccggagcg 1860 ggactgcgcg cgggccgccc acctgctcgg cctggccgac ggcgggcacg gggtgggtga 1920 tcgcggggag gtgggggcgc tcgcggaccg ggtgctggcg caccgggggc tccccggtca 1980 cctgcgggtg ctcggggcgg tcctgctgtt cctgctgggg cgcggcgagg gggtgttccg 2040 ggagctgggc gcgggcggcg ggtggttgtc cgggctggcg cacctgttcc tggccgagct 2100 ggcggagaac gcgggcgagc tggaccgggc gcgcgggcac gcggaggtgt ccctggaccg 2160 gttccgggcg gccggggacg ggtggggcgt ggcgggggtg ctgccggtgc gggcgcgggc 2220 gcggcggtac gacgacctgg acgggacgtg ggcggacctt cgggaggcgc gggcgctgga 2280 gggggagttc ggggcgctga gccccggtga ccgggtgcgg gcggacctgc ggtgggtcga 2340 cctgcacgag cggcgcggtg acagcggggc ggcgctggag gtgctggccg cggcccgtgc 2400 tcggggggag caggtcgcgg tggtggacgc gcgggaggcc gcgctgcggg tgcggctcgg 2460 ggacctgggg cgggcgggtg agctgctggc cggggtgggt ggggcggtgg gcgacctggc 2520 gcgggccgcg tatcgggtgg cctcggggga cctggcgggt gcggagcggg cgttgcggcg 2580 ggcgcgggtg gtggcggctg cgagcgggga gctgcccgcg ctggccccgg tggcggtggg 2640 ggcggcggcg ctggagcagg cgcgggggcg gtgggcgggg tcgggggtgc tgctcgggac 2700 ggccgcgcgg gtgcggggcg cgcacgaccg caccgacccc ctggtgcgcg agctggtcga 2760 ccgggggcgg gcggcggtgg gcgggagcgc gttcgcggcg gcgtacgcgc gggggtggga 2820 ggcggagcgg gacgtggcgg cggcgttcgt gctctgagcg ccgggatcgg gcgggcgggg 2880 tcaggcgggc ggggtcatgt gggcggggtc aggcgggcca ggtcacacgt ccagggaccc 2940 cgcccagtcc gcgatcgtcc ggacttcggc ctgcgtcggg aagaccttct cggtgagcac 3000 gcggtgcacc tcggggtcgc cgtccaggca gccgtcggcc aggacggtga gctggaagtc 3060 caggtcggcg gcctggcgga gggtggacag gaccacgccg ctggtcgcga tgccggtgag 3120 caccaggtgg tcgacgccct gggcgcgcag gacgaggtcc aggtcgctgc ccgcgaacgc 3180 gctgacgcgg cgcttggtca ccaccacctc gtcgtcgagc ggcgcggtct cggggtggaa 3240 gtcggtggcg ccggagcccc tgggggccgc ggccaggcgg ccgaacatct tgttgcgcgg 3300 gtggatctcc gcgtagtcgg ggcggaagcc gacgccgacg tggatcaccg gcacggacgc 3360 ggcgcgggcc gcctcgagcg cggtggcgag cctggggagg taggccgggt cggggtagcg 3420 ggcgaccacg gcgggctgga cgtccatcac cagcagggcg ggggtgggga tctcgggcct 3480 cgtttcggtg gtggcggcgc gggggccgcc ggtgggggtc aggggtgcgg gggtgccggg 3540 gtgagcaggc tggtgacggt gagcaggcgg tcggcgagtt cctcggggcg cagcgggtcc 3600 tcggcgcgca cgacccagtc gtggacgatc gcgccggtgc cgtgggagat cagcacggcc 3660 aggtcgcggg cggcccgctc gtccacctcg cccaggccgg cgcgcagggc ctcggtggtg 3720 atgagggtgc ggaagagctc ggccagggcc tccgccagcc gccacgcgca cgggccggtg 3780 agcacggcgc ggtagaaggg gcggtggtcg gcgaagtggc gggccacggc caggaggcgg 3840 gcgtggcgcg gggcccgcgg gtcggccagg tgcggcagga gctcgcgccg caccaggtcc 3900 gccgcagcgg cgacgaggag cgtgtcgcgg tcgccgaagt gctggtagag cagctgcctg 3960 ctgacgtcgg cggcctcggc caggtcggtc accgggaccg ccgccccgcg ctcggcgacc 4020 aggtcgacgg cggcggccat gagggcggcc ctggagcggg cgacccggcg gtcggggcgg 4080 gtggtcacgg gggtgaaact agacagttgt caataaatga gcaagtgtcg tcgaacgcgc 4140 gcgcgggaat ctccggtgcg cggggcccgt ccctggcagc atgatcacgc gatgaccgag 4200 gtgaggacgc gcccgtacgc cgggcccgcg gacctgcgcg cgatgcaggg gttggcgcgg 4260 cggatctgga cgccgtcgag ccggtggcac gtcggcgacc tggcctggca gcgcaaccag 4320 cacaccgggc gcgaggccga gtggccgacc gcgctgtggg aggcgggcgg cgaggtggtg 4380 gcgtgggggt gggccgagct gccgggtgag ctggcgctgc tggtcgaccc cgcccggccg 4440 gagcttgcgg gggcggtgct cgactggttc gcgggcgtgg ccaccgcgcc ccggcggtcg 4500 gtcaccgtgc tggacgccga accgcacctg gtcgccgcgc tggaggctcg cgggtacgag 4560 cggctgggcg ggccgcactt ccggcactcg gtgcgcgcgc tggacgacct gccgacgccc 4620 gaactgcccg ccgggtaccg ggtccgcgcc gtgcggggcg aggaggacgt ggcggcgcgg 4680 gtcgcggcgc accgggcggc ctggtggccg tcgcgggtca ccgaggagag ctaccgggcg 4740 gtgatggggg cgtggccgta ccggccgggg ctggactggg tggtggaggg gccggacggg 4800 cggttcgcgg ccacctgcct gatctggttc gacgagcgca acggcgtggg cgagctggaa 4860 ccggtcgggg tcgaccccgg tctgcggcgg cgcgggctgg ggcgggcggt gtgcctggcg 4920 gcgctgggcg cgctgcgcga ggcgggcggg cgggcggcgg tggtgtaccc gctgcacggg 4980 caccccgacc accccgcgcc cgcgccgctg taccgggggc tggggttccg cgagcacgcc 5040 cgcacgatca ccttcaccgc gctggaggcg cgcgggtagc agcggccggg cggggcgagc 5100 ggacccggtc gacgagcggc tccgctgtcg gagcggtcgt cccagcgcgt ggacaccagt 5160 gccacgacca gaccgcgccc cgcttcgcgt ggtcggctcg ggggtcgacc gcggtgaggc 5220 tctcgccggg gtgggtgaac cacgtcctgg cgatggcctg caccgcgagc accgggtgcc 5280 gcccgtggcg ctggacgtca ccgacgcagc cgccgtcgac cgggccgggc cggccgcgtt 5340 cggccgttgc gccgcgccgg ccgagtccga cgccaggtgg cggccggtcc ccgggtccgc 5400 ctggaactga ccccgccggc ctccccgccc gcccgtccgg ccgggcgccg aacccgcctc 5460 aggcgtgctc gaccgcgcgc accgatcccc ccaccaccac cggcatcggg acgtggtgca 5520 cggtcgtcgg gctgcggtcg cggcgggggc gggacaggag gagttccacg gccatcgcgc 5580 ccaggcggtg gtgcggcagg gcgacggtgg tcaggcgcgg gcgcatccag gcggccacgg 5640 ggtggtcgtc gaagccgacc acggagacgt cgtccggcac ggacaggccc gcctccgcga 5700 gcgcctggca cgcgccgaac gccaggcggt cgttgaagca cagcagcgcg cgagggcggt 5760 ggtgggacag gaggtccagg gtggcgcggt agccgttctc cggcatccac tccacgcacg 5820 ggcgcacgct ctccacctcc acccccgccg ccgcgaaggt ctccagcgcg ccggagaggc 5880 gggccacggc ggcgatgtgg cgcgggtcga tcgcctcggc cgtgggcccg gtgccgatca 5940 ggtgcacgcc ctcgcggtgc ccggcgtcga gcagcacgcg cgccgccgaa cggccgccgc 6000 cgcggtcgtc ggggagcacg gcgtgcgcgg ggaagtcgtt ggcgggcagc acgttcagca 6060 gcacggacgg cccgtcgcgc agcccgtccg ggacctccag cagccggggg aacctggccg 6120 cgaagaccac gccctccacc tggcgggcgc gcagcgaggc caccagcgcc gcctccacct 6180 cgcggtcgcc gccgctctca ccggcgaaca gggtgaaccc gtgccggtgg gcggcgccga 6240 ccgcgccctc gatcagctca ccggacagct tggccgaggc cacggcgtcc gagacgaaac 6300 cgagggtctt ggtgcgggag gcggacagca gcgtgtcgcg gcggtagccg agctgctcgg 6360 ccgtcgcccg caccttgcgc tccaccgccg ccgagatgcg cagctcccga gcgcggccgg 6420 agagcaccag ggaggcggtg ggcaccgaca cggcgcaggc ggacgcgacg tcggccagcg 6480 tgacgcgcgt ccgcccgctc tcgcggacac ctgctcgcgg gggtgtgccc gtcacccgtg 6540 cctcccgtca ccggtcgcgc gacagccccg cgcgaggtcc taccccatcg tgcaggccgc 6600 gccgttcaag gagaaccccg aaggtggggc cgcgtccccg ccgtgggtga cctggtagcc 6660 gatgctgact ttgccaccgg gtgggatcgc cgcgttgtag cccgcgtcgc gggcggtcac 6720 ccggcccgag ctgggcgcgt acgaggcgtt ccagccggag gtgatcacct ggcccgcggg 6780 cagcgcgaac tccagcgacc agccctgcac ctgcgtggtc ccggtgttgg tgatggcgag 6840 ctccgccgtc aggccgttgc cccaggcgtt gacggtggcc gacacccggc aggcccccgg 6900 ctgcggttcg ccgggcgtgg tggtggtggt ggtggtggtg gtcgtggtcg tggtggtgct 6960 ggtcgggtcg gggccggttc cggcgaactg ggtgaagaac cgccaggtct cctcgggcgc 7020 ccacgtcctg gtgccgctgt cgccgggcgc gttgtcctgc ggtgcggcga tgtggccctc 7080 gtcgaacgcg acccagcgca ccgggtagcc gtcgcggcag ccggtgtagg tggtgccccg 7140 gtgggtcagg ctgccctggg acggttccgg cgggttctgc gcggcgcagc cgttgttgcg 7200 cacgaaccgg tcgcgcatcg agcgcccgcc ggagatgttc aggacgctgt cgcgcaggcc 7260 gtggatgccg aggtaggcga tgggctgcgt gccgccggcg cagccgctga gcacgccgcc 7320 cgcgatgacc gcgaccgcgc ggaacaccgt cggccgcgag caggccaccg agtaggacat 7380 cgcgccgccg tagctgaagc cggtggcgaa ccgctgggtg gtgtccacgc acagcccggc 7440 gtcgagctgg cggacgatgt cgtcgacgag ggtgatgtcc tcgccgccgt tgttggccca 7500 gccgttgttg aagccctgcg gcgccacgaa gatcgtgctg ctgcccgcca ggcgcttgag 7560 gccgtagtag gaccagacgt cccgctgcac ggtctggccg gtggcgacgt cgttcgcggt 7620 gccgctgagc cagtggaagc cgaagacgac gcggtggggg cggttccggt cgtagccgtc 7680 cgggatcgac aggatgtagg tgcgggactt gccgctgctg gtgatcgtgc gcgtgccgct 7740 ggtgagcgcg ggcgccttgc cgcagccctc cgtcgtggcg gacgcgccgg gggcgccgga 7800 cgcgccgggc gctccggtcg cgctggtggt gatcagcccc gcggcgaggg tgagcagcgc 7860 gatgcccgct gccgcgagga ccctgttgcg cgccaaggga ttcgcccttc ctgtggtggt 7920 tccggtgggt gtggtcacgg ggtggtgagg tcgaagcggc gggcggtgac ggagccgccg 7980 agcgcggcgg tggcgtggtt gaagacggcg aagcggtagc ccatgaagaa ccgccagtcg 8040 ttcttgagcg tgaacgccgg gccgaaggcg gtgaagttga cgccgtcggt gctgtaggag 8100 aaccgggcct gcctgccgtt gccggggcgg atgtcggcgt tggcgcgcaa ccagatccgg 8160 gagccgccca ggtcggcgct cgcgacctcg tagccggttc cggtggtgcg ccaggagccg 8220 tccatggtca ggccggtgac ggagacgatc cggttgcggc cgttgtcgcg cttgacgccg 8280 atccacgccg aggagtcgcg cagcacggcc agcccggtgc ggtcgccgtc gcgcatcccc 8340 gacaggtcca gttccacggt gccggtggag gtggggccct ggatgcggtg ggtgagggtg 8400 ttgcgggcgg agtacaggtc gttggtgacg gtcgcggtgg acaggcgaag gccgttgttc 8460 acgctgtact tggcggtgtc cgggttgtgg ttccactccc actgcgggcc gagcgcggcg 8520 ccggagaagg tgtcggcgcc gatcatgggt ttgacctggc gcgggggcgc gggcaggttc 8580 ggcttcgggt aggtcgcgcc ccagccgccg ttgacggtgg tgacgcgcgg ccagccgtcc 8640 gaggtccagg tgatcggggc gagcaccggc acgcgcccgc cggggtaggc gtcgacgaac 8700 gccaggtagt gccagtcgcc gttctgggtc tgcaccaggc cgccctggtg cggcactccc 8760 ccgccctgga tcggcgaggg caggtcgagc agcacctgct ggatcgagta cgggccgaac 8820 gggctggacg acttgagcac gtactggccg ttcgcgggcc tggtgagcca gatgtagtag 8880 ttgccgccgc gcttgtagaa gcgcgcccct tcgagggtgc cgatgttcga gggggtctgg 8940 aacacctgct gggagcggac ctccgacttc ccgtcggcgg agagctgggc gacgctgatg 9000 ctggtgttgc cgtaggcgac gtacagggtg tcgtcgtcgt ccacgagcat cccggcgtcg 9060 tagtagcact tgttgatggt ggtgtgcttg gaccactggc cgtcgacggc ggtcgcggtg 9120 tacaggtgcg tctgggcgaa gtcgacgcag ccgccccagt agaaggtgcg gttgctcttg 9180 cggtgcgcca ggaacgacgc ccagatgccg ttgacgtacg cgcgggagcc gttgcccatg 9240 tcgtacttgg ccccgaagtc caggcgtggc acggagtgcc cggcgaactc ccagttgacc 9300 aggtcgtagg agcgcagcac gggcgcgccg ggcgagtagt gcatggtgga ggccgagtag 9360 tagtaggtgt cgtccacgcg caggacgtcg atgtcggcga agtcctgcca cagcacgggg 9420 ttggtgtagg tcccggccgc gcgggccggg tgggtggtgg tggcggtcag gctcgccgcc 9480 acgaggccga gcacggccag ggcgatgggc gcccatcggc gttgacgggg catcggtgtg 9540 cctctcctgg tgtccgggag ttggctctgg gcgcggcggc ggtggacttg tcgggcgcgg 9600 cggtggtcgt gggggtcagc agggggagtt ggtctgggtc agcaggccca gccgccaggg 9660 caggcggttg tagtcgccgg acgcgttggg gtccaggccc tggtacaggt agctcagctt 9720 gcaggggttg atctccatgg tctggtcggt cccgctgcgc accagctcgc cgtggctgat 9780 gtcgcgcgtc cactggccac cggggaacgt ggtgttgttg gccctggcga acgggttcga 9840 ctcgctgtcg gccagcgcgg tccacggtcc ggcgatcgcc ggggcggtcc aggagcggaa 9900 ccagcggcgg ccgtccgagc cgatcgcctc gtggagcatc agccactggt tcttgccggc 9960 gaccttgtag atgttggacg cctcgaacaa ccggttgcgg ttgctgtcct gcatggcgat 10020 cacggtgttg gtgaagccgt tggggaactg ggcgaggctg gtctccgagc ggtacaggtg 10080 gccgttgtcg tccgaggaga acaggtggca cttggccgtg tcgcagacgg tccagaagtc 10140 gacccagtag ccgttgccga tgttgtcccg gatgatctgc ggcatcccgt tggcgtagaa 10200 gttcctcggc gcggaccagg acgcggggtt ctcgatgtcg gcggtcgtcg agtacgaggc 10260 gttggacccg gtctggtaca ccaggtacca caggcgttgc ggggcgaagt agaacacctg 10320 cggcgcggcc cggtagcccg tgccgatccc ggagcggtcc aggtagtggt gcggggcgga 10380 cgcggcctgg gaccagtcgg tgaagctggt gtgcacgagg ttgtagccgt tggtgtagac 10440 cgaggcgaac acgtggtagc ggccgttgtg gcgcaccacg ctggggtcct tgacggagac 10500 cgtggcgtgc gaggagtcgg gcttgggtcc gatcagcgcg ccgctggagg accaccggaa 10560 gctgctcggc agcgagccgc ccggttgctg cggggtcgtg gtggtgggcg gcgtggtcgg 10620 gggcgtggtg gtcgtgggcc cgactcctcc cgtgcacgtg gtcccgttga ggctgaacga 10680 ggtcgggtcg gggttggacc cggtggaggt cgcggtgaac ccgaactcga cgcggccccc 10740 ggtggggatg gcggcgttgt aggaggcgtt gcgggcgctc acctggccgc cggactggga 10800 cacctcggcg ttccaggcct gcgcgacctg ctggcccgag ccgtaggtcc aggtgagcgt 10860 ccagccgtcg acggcgtcac cgaggttggt gatggcgacg ctcgcggtga aaccgccctg 10920 ccactgggag gtcgccgcgt aggcgatcga gcaccccggc gccgcggcgg cctggggtgg 10980 gagggcggcg agcgcggcca ccatggcgag cgaggtggtg gccatggcgc cgatccgggc 11040 ccggcgcggg gtgaacagcc ttgcgaggag catggtcgcc cttcgtcgtc gtcgacgggt 11100 ggtcggcgcg gccgaccggg agcggcggga gcgggctggt actcccccac ttcctgcaat 11160 ctagccaggt ggcacagggt ggtcaaagct aaaaagggcg gacgcggttt agcttccagc 11220 gcaaaggttt cgcgcgttct ttcggccggg gggcaggtgg atcggggcgg gctcggggcg 11280 aggacggggc tgggaatggg gcgggggatg gggcgggctc ggggcggggg tcgcccggag 11340 cccgccacgg gtcagaggcg cacgcggacg acggtgaacg ggaggttcgg ctcggcgatc 11400 tggtactgga agttgaccac cagcaggtcg tcgccgtcga aggtcgcggt ggacgggacg 11460 tccatgcccc tgccgttgac ccgccgcagc accgtggcgc gggagtggtc ctcgctcagc 11520 cgcaggacgc tgatctcgcc ctccgggtgg aacaggctgg tgacgctgta gaggtcgttg 11580 ccgcgcagga gcagcccgtc cgagccgatg tcgcccacgc cgcccaggtc gatcggggtg 11640 acggcgccgg tgcgggtgct gatgcggtgg aacgcctggg agttggtgtc ggcgagcagc 11700 acgtggcggc cgtccggggt gaccacgagg ccgttgccgt tgatgccctc ctcgtagcgc 11760 accggggagt cggcgaggtc cacgaacgtc ctcagtggct ggtcgacctc ggggctcgcc 11820 agctgggcgg cggtgatccg gtagaggacg gggcggaacg agtcgctgac gtaggcgtcg 11880 ccgttcgggg cgatggcgac gtcgttgacc aggccgtcgc gggcgccgga gtcgaacacg 11940 tgcaggagcg cgccggtgcg ggtgctgtgg acgaagacct tgccggtggc gccgcccgcg 12000 atgaccagcc tgcctcgggt gatcttcatg ccgacggcgg tggtgcggcc gtgctgaccg 12060 gcgggcagga acggctccag ggcggggcgg tcgacgtggc cgcgccagat cgtgccgtcg 12120 gtcgtgccgc cgacgtagaa gtgcggcgtg cccggctcgc ggacgatgcc ctccgggtag 12180 gcgcggtcgc cggggaccac gtagcgggtg acggggtggt gcgcggcggc ggcgggtggc 12240 acggcggcgg cgggtggcgc ggcggcggcg ggtggcgcgg cggcggggag ggctggggcg 12300 agcgcggtga ggagcagggt cgcggtgagg agggctcggg tggtggtcac ggaagggctc 12360 cgggggtcga aggggtgtct ggcgccagac aagcgcttcg tggcgcgggg tggcagtggg 12420 cgcttgtcgg gggtagttct tcacccccct tccgggcggg gcggccgact agggtgagcg 12480 gtgtgggcga tcttgggcgg cacccggtgg cgaaccgctc cgacgtgcgg gacttcctgg 12540 tcagcaggcg cgcgagggtg agtccggggc gggccgggct gcccgtgctc gggcggcggc 12600 gggtgccggg gttgcggcgg gaggaggtcg cgctgctcgc cggggtcagc gtggactggt 12660 acacccgctt ggagaagggg cacatcggcg gtgtctcgcg ggaggtgctc gacgccgtgg 12720 ccggggtgct gcggctcgac gccgaggagc gggtctacct gttcgacctg gcgcgcgcgg 12780 cccggcgtcc ccgcgccgcc gaggtggcgg cggaggccgc gctgcccgcg acggcgcagt 12840 ggctgctgga cagcatgacg ctgtcgtcgg cgatggtgac cgggcggcgg caggacgtgc 12900 tggcggtcaa cccgctggcc cgcgcgctct acgcgccgct gttcgccagc gccaccacgc 12960 gggacggcgg ccgggcgaac ctcgcccgct accacttcct cgacgcgggc gcccgcgagt 13020 tctacgggga ctgggcgggc accgccgacg tgctcgtcgc cgcgctgcgc gccgaggccg 13080 ggcgcgaccc gcgcgacggg gccacccgcg agctggtggg cgagctgacg gccgcgagca 13140 ccgagttccg ggcgcggtgg agcgcgcacg acgtgctgct gcacccgcgc ggcgccaaga 13200 ccttccggca ccccgaggcg ggtgagctga gcctgagcta ccactcggtg gacctgccga 13260 tctccgccac cgagacccgg cacgtgtgcg cgtgcaccgc cgaacccggc tcgaccgacg 13320 aggcgaggct gcgcgcgctc gtcgggtgag ccgggggtgg ccggccaccg ccgtcgcgct 13380 cgcggcggcg gggcggggcc gccggtcaga gcgtgagcgc catcccgatc gagccgggcg 13440 cggtctcggt gaagccgtgc ttgaggtaca gcgggcggcc gggcgcgtcg gccaggaggg 13500 tcacgaacgc gccgggcggg gcggcctcgc ggatgcgccg gagcagcgcg tccatgatcg 13560 cgccgccgac gccccttccc tggtggtcgg gcagcacggc catgtcgacg acgtggaagt 13620 accagccgcc gtcgccgagg acccggccca tgccgacggt cccgccgtcc gcgtgcgtga 13680 cgtggaagga ggcccaggcg ccgggcaggg cggcggcggc ctgctcggcg gtcttgggcg 13740 acaggccgga ctcggcgcgc aggcggaggt agtcggcgac ggacggcggg gtcgggtgga 13800 gctcgtagtc ccggtgcacg cggtcaggct cccacgggcg cgggcgggcc cccgcccgac 13860 ctgacgattt ccccgtcggc ggggatgcgg gcgggcgctc gcggattttc gacatccccc 13920 ggcccggcga gacgcggcgg cgccgctgaa aagagcgccg tcgcggccct tcgcgccgcc 13980 cccgacatcc cccgcgcggc gaccggtcaa tgcggtccac gcctgggggt ttccctccca 14040 cgtcgaacac cgccaccacg cgcccacgcg ccgcgtcgac caccccgacg ccgaggaaca 14100 cctgttcacg ggcacgggaa gccgcagcgg agggggaacc gggaatggcc gcaggcgatc 14160 gcggcacgac gtccgcacat caccgcgagc agaatcgcga ggcgttcacc ggggcggcgg 14220 aggaagattc cagcgcccct ctcgaagaac ctgcgggaag ccctggaaga aaacccggac 14280 ccgaaacgcg acaaaattgc ggacacccac ccgtgaaaca ccgggcgccc ccaccaggtc 14340 acccgctgac atcacgctca gtcagtatcg gcacgctccc ccgccgaggc ggagcgcgac 14400 accccgccca accgggcacc gagcgggcac ctccactcgg cccagcaccg ccccaagatc 14460 gcacgtagca cgggttgaaa ccgctcaagc gcatctcaac ccgttcggag cagagtggcg 14520 cccgtcacgt cccgaccggt cacggttggc aacgggtcca gtccacgcga ggtggcatca 14580 agcgcacttg ccccgatcac acccgcccgt gcaaccgaat gcagcaggga tatctttccc 14640 gagaactcgg ccgttaaccg ggagtggagc caggcccacc cctaagacgc ttgcccacat 14700 gcccaacaat ggtgaagatg gaacggcgga ccgcaccgcg aacgcgaacc gaactccgcg 14760 agagggcacg gtgaacgatc ctggaacagc tactgccgcg tagctcaagg gtggaacgcc 14820 cggctcgcgc gcggcggagg gaataacggc ttttacgccc tcgacaacag cttgtcaacg 14880 aaacccgtgc acccgagcgg tccccgcgcg caccgctcgc gggggtggcg cggcgcacga 14940 cgtggctgcc cggcgtcgac gacgacgcga gttccccgac cgcccgcgaa ggcggtcgcg 15000 gatcgccacg acggggcacc cggaccacgc ctcccccgga acagcgcgcc cacgcgcggt 15060 tccggcgcgc gccgggaccg ccgcacccgc cggagcgccg ccaccggccg gggccggtcc 15120 ccgcggaccg ggtcgccttc cggaccacca ctccacggac cacggaaagg accactcccc 15180 cagtggagct tctgcgcgca cccgagatcc agtcggccgt cgagcacctc gcggtggacc 15240 tgccggaccg ggcgggacgg gcgttcctgg tggacggacc gcccgcctgc ggcaagacga 15300 cggccctgcg gcggctcgtc gaccggatcg cccacgagga ccacctcgtg ctcaccgcca 15360 cctgcacccc gccggagacg gagctgccgt tcggggtgct caagcagctc ctcgcctccc 15420 ccggcatggc cagggtcgac ccgcgcctgg tcgccgacct cggcgagctg ctcgccccgg 15480 ccccgccgcc cgccgacgac tcggcgctcc tgcagctgta ccactcgctg tgcgcggcgc 15540 tgatcgcgct gtccgaggag gtgccgctgg tcatcgcggt ggacgacgtc cgccacggcg 15600 acaccgcctc gctgcacgtg ctgctgcagc tggtgcaccg gctggacacg gcgcgggtgc 15660 ggctgctgct caccgacgac ctgctgctgc cggtgagctt cccgccgctg cgctacgagc 15720 tgctgcgcct gcgcgggctc ggcctggtcc gggtcgcgcc gctgcctgcg gccagggtgc 15780 gggaggaggc ggtgcgggcg gtcggcgcgg acgtcgcgaa gcgggtcgac ttcgccgcgc 15840 tgaccggcgg caacccgctg ctgctgcacg cgctggcggt ggacgtgctg gaggcgggcg 15900 agccgcgcga gatcggctac ggcaactcgt tcctgtcctg cctgcaccgc aacgaacccc 15960 tgttcctgga caccgtgcgg gcgctggccg tgctgggcgg cggctcggcg tcggacctgg 16020 gcaggctgtc cgggcacgag ccggagcagg tcgcccaggt gctgaacgcc ctgcgggagt 16080 cggggctgct ggccgaggac gggttccggc acgacgcggc gcgccgcgcg gtcgtcgcgg 16140 acaccccggt cgccgagcac gaggtgctgc accgccgcgc cgcgcggctg ctgcgcgacc 16200 agggcggcgc ggtcaccgac atcgccgacc acctgctgcg ggcgggccgc atcaccgacc 16260 cgtgggcggc ggacctgctg gtggacgcgg cggagctggt ggtgcagcgc ggcgagccga 16320 cggcggcggt ggcgctgctc cagcgcgcgc tcgactgcag cccggaccgg gagcgcagga 16380 cggccgtgca ggcgcggctg gccacggccg agtggctggt gaacccgtcg acctcggcaa 16440 ggcaccacac cgcgctgctg gcggcgttcc acgcgggcag gttgtcggtg cgcgacagcg 16500 cgacgctgat gaagcacctg cgctgggccg ggaacaccgc cgactcggac gcggtgctcg 16560 cccggctgcg gaccgacccg cgcgccgccg aggacgtgcc ggtgctggag cactggctga 16620 ccagcaccta ccccggcgcg gcccggccca ggaccgtgct ggggcgggac gtggactcgg 16680 cgcgcagcag ggcggacctg gtgccgaggg cgaacgcggt gctgctggac gtgctggtgg 16740 ccggggacag cgacgacgtg gccgaccggg cggaggcggt gctgcgggag ctgcggctgg 16800 cgcgggagtc cgggtgctac ggcggtgcgg ccgtgctggc gctgtccgcg ctgctctact 16860 cggaccgcgc ggacgtggcc gcctcgtggt gcgagcagct gctgtcggcg cgggccgtgc 16920 cgctgctgcc gatgccgcgc gcgcaggtgc tggcgctggc ggccgagtcg gcgctgcgcc 16980 ggggcgacca cccgagcgcg gacgagctgg cgcgggaggc gctgaccgtg gtgtccccga 17040 ccgcgtgggg ggtgtcggtg gggctgccgc tgagcaccag ggtgctggcg ctgaccagga 17100 tgggccgcta cgacgaggcg gcggccgtgg tggcgcagcc ggtgccgaac gggatgttcg 17160 ggcaccgcaa cagcgtggac tacctgtacg cgcgcgggca cttcttcctg gcgcgggaac 17220 ggccgcgcgc ggcgctgggc gacttcctgc tgtgcgggga gcagctgacc cggtggggcc 17280 tgggcagcgg gtgcgcgccg gtgccgtggc ggaccgcggc ggcggaggcg tggctggcgc 17340 agggcaaccg ggaccaggcg cgggtgctga tccacgagca gctcggcagg ccgggcacgg 17400 acagccgccg ggcgcgcggg caggcgctgc ggctgctcgc ggcgaccagc tcggtgaagc 17460 ggcacccgca gctgctgcgg gaggcggtgg cggtgttcga ggccgtcgac gacaagtacg 17520 agctggcgcg gaccctgcgc gacctgggga gggcgcagcg ggcgctgggc gagaacaagc 17580 tggcgcgccg ggtgatccgg cgggggtggc acgtcgcccg gatgtgcgag gcggcgccgc 17640 tgtgcgagga gctgatgccc accgccgacg ggctggtgcc cgcgcagccc gcgtcggcgg 17700 cccgcaggtc ggacctggac cggttgacca gctcggagca ccgggtggcc gcgctcgcgg 17760 cgtcggggct gacgaaccgg gagatcgcgg tgaagctgta cgtcacgcac agcacggtgg 17820 agcagcacct gacgcgggtg ttccgcaagc tcgggatcaa gcagcgggag cagctgccgc 17880 cggagctgag cgtcgaccgg tcgaagtgac gcggacgggg cggtcccgtg gatctggggc 17940 cgccccgtcc ggtcccggtc cgtccggtcc cgccctgtcc ggtcccgccc tgtccggtcc 18000 cgccccgtcc ggtcccggtc cgcctcaggc tcggggcatc gcggccaggg tggtggcgac 18060 gacgtgctcg tcgacgtcgc gcaccagctc ggcgccgcgc gggccgtcga gcacgaacgc 18120 caggccgccg gtggacttct tgtcgcggcg catgaaccgc agcagctcgt cgtccggcac 18180 gcccggcggc agcgcgacgg gcagcccgta gcccgcgacc acggagtggt gctcggccac 18240 ccggtccggg ccgatccggc cgagcgcgcc cgcgaggcgg ccggcgaaga ccgtgccgat 18300 cgcgacgccc tcgccgtgcc gcaccgcgaa accggtggcg agctccaggg cgtggccgag 18360 ggtgtggccg tagttgaggg tgtgccgcag gccggagtcg cgctcgtcgg cggccacgac 18420 gcgggccttg agggcgacgc tcgccgccac ctggtccagc agcggcagcc ggtccaggcc 18480 cggcgcgccg atgaagtggc agcgggcgat ctcgccgagg ccgttgcgca gctcgcgctc 18540 gggcagggtg gcgagcaggt cgaggtcgca cagcacggcg gcgggctgcc agtaggcgcc 18600 gacgaggttc ttgccctcgg ggaggttgac cgccgtcttg ccgccgacgc tcgcgtcgac 18660 ctgggccagc agcgaggtcg gcacgtgcac caccggggtg ccccggtggt agagcgaggc 18720 ggcgaggccg accgcgtcgg tggtggtgcc gccgccgcag gagacgacga cgtcggcgcg 18780 ggtcaggccg aactcggcga accggctgca caggtgggcg acggtggcga gggtcttgtc 18840 gtgctcgccg tcgcgggccg ggaggacgag ggaggggacg ccggggtcgg gcgtctggtc 18900 cgccgggcgg gcggtgacca cgacggcgcg gcgcgcgccg agggcccgca cgacgtccgg 18960 gagggcggcg cgcacgccgt gtccgatgtg gacggtgtag gcgcgctcgc ccagctcgac 19020 ccggacctcg cgggtggtgg cggcggtggg ggcggggtgg gtggagctgg gcactgcttc 19080 ctcctcgggt gggcgggacg gggggcgatc gggggacgcg gaggggtgac gggaaagcaa 19140 tcgggcagga atgggaacgg gtccgggggc gaacgggcag gaattcgaat gggggcaagc 19200 gaccgggagc gatcccagtg gtggggcgga agtgcgggcg gcggaaaggc ggtcgtgctg 19260 cctcagccgc cgcccgcggc gcccgtcacg agcgtggtgc gcagggtgag cgccgcccgc 19320 gccgccacgg ccgcgccgac gccgaggcgg ttgtgggtca gggtcgcctg ctcgaacagc 19380 accggcaggg ccgggcggcg gcggtccgcg gcggcgcgca gctgctccag gtagcgccgc 19440 cacgcgcccg ccgagccgac cacgcgcccg ccgggcggcg ccccctgcgc ggcgacggcg 19500 gcctcggtgc gctcgaccgg gcggagcggc ctgctccagc tctgccagca gtggaacagg 19560 aacgcgggcc tggccggttc cggggccagc gcgaccagtt cggccaggtg gtgcagcacc 19620 gtggcctgcg cgcccgactc gccagggtcc tcgccccaca ccgggctcac caccgacgcg 19680 acgtccaggg ccagttcgct ggacgcggtc gcgaccagcg gctcgaccgg cccgcccggc 19740 aggcccccac ccggcaggcc ctcgcccgcc gggtcgacgc gcaggtcgcg ggccgccgcc 19800 tcggcgcaca gcacggcgag caccgggccc cgcgcggcct cggtcgtgcc cagccacagc 19860 gccaccaccc ccgccccgcg caggaacgac cagtgcgcgc cccggtcccg cgcgcgcagc 19920 tcccgcacga cggggggcag cacctcggcc accgagcggg ctccaccgcc tgccagcgac 19980 cagcccgacc aggacggggc gcccgccgcc gggggtccgc cgaggggcgc tctcgcggaa 20040 ccggtccgcg tcatgtccac caccacttcc gccttggcga gaacgggtcc tgcgggatca 20100 ccgcgctgtt ccgacgccgc cgacaatagc gacgcgcaat acgccgaatt caccgccaaa 20160 tcaggtcagg ggggttgagg gggatgcctt agggggcgag tgcccgcaaa gcggaagaag 20220 aatcggaagc acatgcagga gcgacttcca agctcaggcc gcaggaccgg gtccgcgtcg 20280 tcgcggacac cccggtcctg cgcgtgcgcg caccgaagga cgtggtgaca tgcttcggac 20340 cgacctgatc cgcccggttc ccgaactgct cggggccaac gcggatcgct tcggcgacag 20400 gaccgcctac tcggacggtc gccgttcggt cgggcacgcc gggctggaac ggcgcacgcg 20460 ccgcctcgcc ggtcacctcg ggcagttgcg gctgcacccc ggcgaccgcg cgatgatctg 20520 cctgggaaat cgcgtcgaaa tgatcgagag ctatttcggc gtgctccgcg cggacgccgt 20580 ggcggtcccg gtgaacccgc gttccaccga cgcggagctg acccacctgc tcgccgacag 20640 cggggcccgg ctggtgatca ccgacgcggc gcgcgccgag cggttcgacc ggttgcgcgc 20700 cgagcggttc ggcgacctga ccgtgatcgc cacccaggac ggcccgctgc ccgacggcgt 20760 catcgcgttc gagccgctgg ccgccgagga gccggagctg cccgcgcgcg acgggctcgg 20820 gctcgacgac gtggcctgga tgctctacac ctccggcacg accgggcgcc ccaagggcgt 20880 gctgtccacg cagcgcagct gcctgtggtc ggtggccgcc tgctacgtgc cggtgccgga 20940 cctgcgcgcc gaggaccgcg tgctgtggcc gctgccgctg ttccacagcc tgtcgcacat 21000 cacctgcctg ctggccgcca cggccgtggg cgcgaccacg cgcatcgtgg acggcacgtc 21060 cgcgcaggac gtgctcgcgg cgctggagca ggagcggtcg acgttcctgg cgggcgtgcc 21120 gacgctgtac cggtacctgg tcgacgccgc ccgcgagcgc gggttcaccg ccccggacct 21180 gcgggtgggc ctggtcggcg gggcggtgac gacggcggag ctgctgcgcg cgttcgagga 21240 cacgttcggc gtgccgctga tcgacgccta cggcagcacc gagacgtgcg gggcgatcgc 21300 ggtgaactgg ccgaccgggg cgcgcgtggc gggctcgtgc gggctgccgg tgccggggct 21360 gacggtgcgg ctggtggacc cggagacgct gctggacgtg cccgccgggc gggagggcga 21420 gttctgggtg tcggggccga gcgtgatgct gggctaccac aaccagcccg aggcgacggc 21480 cgaggtgctg cgggacggct ggtaccgcac gggcgacctg gggcggcgcg acgaggccgg 21540 gttctgcacg gtcaccgggc ggatcaagga gatgatcatc cggggtgggg agaacgtgca 21600 ccccggcgag gtcgaggccg tggtgcgggc ggtgccgggg gtggcggacg tcgccgtcgt 21660 gggcaagccg cacgacgtgc tgggcgaggt gccggtggtg ttcgtggtgc cgggcgcggg 21720 cgggttcgac ccggcggcgg tgctggcggc gtgccgggag gagctgtcgt acttcaaggt 21780 gcccgaggag gtctacgaga tcgagcgggt gccgcgcacg gcgtcgggca agaccacccg 21840 gcacgtgctg ctggacctgc ccgcccggtt gcgggcggcg tcgagcgggc agttccagtc 21900 gctgctgcgg ctggactggg tgccgaggac ggcgctgccg ggtgaggagg tcccggcgag 21960 ctgggtgctg gtggacggcg acccgctggg gctcgcggac gggttgcggg ccacgggcgc 22020 gcgggtgcgg gtgggcgagc cgggcgcgga tgcgctgggc gacggcggat cggacgccga 22080 cgagccgggc gcgagcagcg cgggcgaacc gggctcgggt ggctcgggtg agccgggctc 22140 gggtggctcg ggcgaaccgg gctcgggtga accgggcgcg agcagcgcgg gtgagccggg 22200 tgcgggtgag ccgggcgcgg ccgaaccccc gcaggtcgtg ctggtcgccg cggtccccgg 22260 tgagcgtggt gaggtcgcgc gggacgtgga ggcgctcgcg gacgggctcg cgcggcggct 22320 cgtcgggtgg ctggccgacg agcggttcgc gggggcgcgg ttcgtcgtgg ccacctcggg 22380 cgcggtgtcg acctcccccg gcgaggacct gcgggagctg cgggcggccc cgctgtgggg 22440 tgtggtgcgg tcggtgcagg ccgcgttccc cggtcgggtg gtggcggccg acctggacgc 22500 gtccggcgac gggcgggcgg cggcgctggc tcgcgtcgtc gcgggcgggc acgaccaggt 22560 ggccgtgcgc ggcgacgtgc cgctggcgcc ccggctggcc agggtgtccg tgccgtccga 22620 cccggccccc gccccggcgc tggacccgga cgggctggtc gtggtcaccg gtggcgactc 22680 ggcgcgcggc gcggccctcg cgcggcacct ggtggccgcg cacggcgcgc ggcgcctgct 22740 gctggtctcc cccgacgggc tgcccgacca ggccgccgcc gacctggagg ccgggttcgc 22800 ggcggcgggc gcgcgggcgg agtcggtggt gtgcgacccg gccgacccgg tcgcgctgcg 22860 cgccctgctc gacgcgcagg accgcccggt cacggccgtg gtgcacgtgc agggcgggcg 22920 ggcgctgctg gactcggcgc gcgccctcgt cgccctgcac gagctgaccc gccaggcgcg 22980 accggcgctg ttcgtcgtgg tcacctcggt ggccgggctg ctgggctcgg cgggcgaccc 23040 ggcgcgcgcg gcggccgacc agttcgccga ggcgctggtg cgcaggcgcg ccgaccgggg 23100 cctgccgggg ctggccgtgg cctggggtcc gctgccgggc gagcccgcgc aggcgggcgc 23160 gggcgcgctg ccgatggccg aggcgctgac cctggtcgac gccgcgctcg ccgccgacca 23220 gggcccgctg gtggtgctcg ggctcgacgc ggtcgggtcg cggcgcgcgg tgggcgcggt 23280 gccgccggtg ctgcacgacc tggtcgacgg cggtcgcgcc gcgcgggtcg cgccgggcgc 23340 ggtggccgag ttcacgcgca ggctcgcgga ggcgggtggg cagcgggccc gacgcgtcgc 23400 gctggacctg gtgcgcgagc acgtcgcggc ggcgctcggc ctgcccgagg acaccccggt 23460 gcgcgccgac caggcgttcc gcgacttcgg cgtcacctcg ctgaccgccg tggcgctgcg 23520 cgaccggatc aacgccgcga ccggcgcgtc cctgcccgcg acggcggtgt tcgaccaccc 23580 gaccccggcc gcgctcgccg accacctggt gcgcgaggtc accggcgacc ggccgcacgt 23640 cgagcgggcg cgggacgagc gggcgcgcgg gacctcgcgc gcggacgagc cggtggcgat 23700 cgtcgccatg gggtgcaggc tgcccggcgg cgtggcctcg ccggaggacc tgtggcggct 23760 ggtggacgag ggcgtcgacg cgatcggccc gttcccgacc gaccggggct gggacctggc 23820 caccctgctc gacggctcgg actcgccggg gaggtcctcc gtggaccgcg gtggtttcct 23880 gccgggcgcg ggcgacttcg acgccgggtt cttcggcatc tccccgcgcg aggccctggc 23940 catggacccg cagcagcggt tgctgctgga ggtggtgtgg gagaccgtgg aacgcgccgg 24000 gatcgacccg cgctcgctgc acggcgaaga cgtcggcgtg ttcagcggcc tgatgtacca 24060 cgactacggg accgaacccg gttccgcgcc ggagggcctg gaggggttcg tcagcaccgg 24120 cagcgcgggc agcgtggtct ccggccgcgt cgcctacgcg ctcggcctga ccggcccggc 24180 gctgaccgtg gacacggcgt gctcgtcgtc gctggtggcg atccacctgg cggcgcaggc 24240 gctgcgctcg ggcgagtgct cgatggcgct cgcgggcggg gtcgcggtga tggggcagcc 24300 gacgtcgttc gtggagttct cccggcagcg cgggctcgcc gccgacgggc gctgcaagtc 24360 gttctccgac gacgccgacg gcacgaactg ggccgagggc gtgggcgtgc tgctgctgga 24420 gcggctctcg gacgcgcgcc gcgacgggca cccggtgctg gcggtgctgc gcggcagcgc 24480 ggtgaaccag gacggggcca gcaacgggct gaccgcgccc agcggcccgg cgcagcagcg 24540 ggtcatcagg caggcgctgg cgaacgccgg gctgcgaccg tccgaagtgg acgccgtgga 24600 ggcgcacggc accggcacca ccctgggcga cccgatcgag gcgcaggcgc tgctcgccac 24660 ctacgggcag gaccgcgagc agccgctgtg gctgggctcg ctcaagtcca acctcgggca 24720 cgcgcaggcg gcggcgggcg tcgcgggcgt gatcaagatg gtgatggcgc tgcggcacgg 24780 cgtcctgccc cgcaccctgc acgtcggcac gccctcgtcc aaggtcgact ggtcggcggg 24840 cgcggtcgag ctgctgaccg aggccaggcc gtggcgcgcg aacgggcggc cacgccgggc 24900 gggcgtgtcc tcgttcgggg tcagcggcac caacgcgcac gtcgtggtgg aggagcaccg 24960 ggaaccggcc gccgcgccgg tcgacccggt ctcccccggc ctggcggtca gcggcggcgt 25020 cgcgccgctg gtgctgtccg ggcgcacccg ctccgcgctc gccgcgcagg ccgcggccct 25080 gctggggcac ctggccgacg ggaccgaccc ggcggcgctg ggccgcgcgc tcgccaccac 25140 ccgcaccgcg ttcgagcacc gggccgcggt cctcgcgccg gacgtcgacg ccgcgcgcgc 25200 cggggtgcgc gcgctcgccg aggaccggcc cgcgccgaac ctggtcaccg ggcaggccga 25260 cgtggacggc ccggtcgtgt tcgtcttccc cggccagggc gcgcagtgga ccggcatggg 25320 ccgggagctg ctggagacct cgccggtgtt cgccgcgcgg ctgcgcgagt gctcggaggc 25380 gctggagcgg tggaccggct ggtccctgct cgacctgctc gccgacgggg cggagctgga 25440 ccgggtcgac gtgctccagc ccgcctcgtg ggcggtgatg gtggcgctgg ccgcgctgtg 25500 ggagtcgtgc ggggtgcgcc cggacgccgt ggtcgggcac tcgcagggcg aggtggccgc 25560 cgcgtgcgcc gccgggtggc tgtcgctgga cgacgcggcc agggtggtgg cgctgcgcag 25620 ccgcgcgatc gccgagcacc tggccgggcg cggcggcatg atgtccgtcg ccgccggggc 25680 ggagcgggtg gccgggctga tcgccgaccg gcagggccgg gtgtcggtgg ccgccgtgaa 25740 cgggccgtcc gcgaccgtgg tggccggggc cgccgacgcg ctgcccgagc tggccgcgcg 25800 ctgcgagcgg gagggcgtgc gggcccggat catcccggtg gactacgcca gccacaccga 25860 gcacgtggac gcgctcgacg gggtgctgca ggaggtgctg gcgggcgtca ccgcgcaggc 25920 cgggcacgtg ccgtggctgt ccaccgtgga cggcgagtgg gtcgacggct cggggctgga 25980 cgcggactac tggttccgga acctgcgcgg gaccgtgcgg ttcgccgacg cggtggcggc 26040 gctggcgggc tccgggcacc gggtgttcgt ggaggtgtcc agccacccgg tgctcaccgc 26100 cgcgaccggc gaggtgctgg aggccgccgg ggtgcgcgac gcgctggtgg tcggctcgct 26160 gcggcgcgac gacggtggcc ccgagcggtt cctcaccggg ctcgccgagc tgcacgcgcg 26220 cggcgtcccg gtggggctgg aggcggtgtt cgcgggcgcg gacgggcggg tggagctgcc 26280 gacgtacgcg ttccagcacg agcggtactg gctggcgcgc ggcccggtgg ccggggacgt 26340 gtccgggtcg gggctggtgg acgcggcgca cccgctgctc ggggcggtcg tgccgctgcc 26400 gggcacgggc ggggtgctgc tgtccgggcg gctctcgcac cggcggcagc cgtggctggc 26460 cgagcacgcg gtggccggga cggtgctgct gccgggcgcg gcgatcgtgg agctggccgt 26520 gcgcgcgggc gacgagaccg ggtgcggggt gctgcgggag ctggtgatcg ggcagccgct 26580 ggtggtgccg ccggacgccg aggtggacct gcaggtgctc gtcggcggcc cggacgacgg 26640 gggcgtgcgg gacctgcggc tgtactcgcg gaccggggcg gcggcggagt gggtcgagca 26700 cgcggcaggc gcgctcgccc ccggcggcgc ggtcggcggg gcgcgaccgg ccggggcgcg 26760 gacggccggg gcgcgactgg acggggcgcg actggacgga cagtggccac ccgcgggcgc 26820 ggaacccgtt gcgctggaag gcttctacga gaacctggcg gagctgggct acgagtacgg 26880 gccgctgttc cgggggctcg cggcggcgtg gacgcgcgac ggcgaggtgt tcgccgaggc 26940 cgtgctgccc gaggaggcgt tgtccgggca ggcgttgtcc gggcaggcgg ggtccgggca 27000 ggcggggtcc gggaacgggt ccgggaacgg gttcggcatc cacccggccc tgctggacgg 27060 ggcgctgcac gcgggcaacc tgtgcgtgcc gcccgcgccg ggccggacgc tgctgccgtt 27120 cgcgtggaac gaggtgcggc tgcacgccac cggggcgacg gcggtgcggg tgcgcgtgcg 27180 ggcgaccggc gaggactccc tggagctgga gctgttcgac gccgacggcg cgcccgtggc 27240 gagcgtcggc gggctgaccc tgcgaccggc ggtcacgggc gcgcgcccgg ccgagtcgct 27300 gcacgaggtg gagtggaccg aggtcgcggc gggcggttcg tggccggagg tcgccgacac 27360 ccgcgactgg gaggccgccg ccgacctgcc gacccggtcg cgcgagctgg ccgcccgcgc 27420 gctggaactg gtgcaggacc ggctggcggg cgtggacggc gcaccgctgc tggtgatcac 27480 cacgggcgcg gtggcggtgg ccgacgacgc cgaggtcacc gacccggccg ccgccgccgt 27540 ctgggggctg ctgcgctcgg cgcagtccga gcaccccggc cggttcgcgc tggtcgacgt 27600 cgacggcggc gcggcggccg aggtcgccgc gctcgtgccc ggcgacgagc cgcagaccgc 27660 gctgcgcggc gggctcgtgc gggctccgcg cctgcgccgc ctgccccccg gtctcgtgcc 27720 gcccgccggg gcgcactggc acctggacgc agtcaccacc ggcacgctcg acgggctcgc 27780 gctcgtggcc tcggaaccgg tcccgctgcg ggccggggag gtgcggatcg aggtcagggc 27840 ggccgggcag aacttccggg acgtgctggt ggcgctggac ggcgtcgcgg gccaggaggg 27900 catcggcggc gagggctccg ggatcgtgac cgaggtcggc cccgaggtga ccggattcgc 27960 cgcgggcgac cgggtgatgg ggctgttccc gcgctcgttc gggccgctgg ccgtggccga 28020 cgcccgcacg gtggtgcggg tgccgcgcgg ctggtcgttc accgacgcgg cggccgtgcc 28080 ggtcgcgttc ctgaccgcgc tgcacggact ccaggacgtc gccgggctgc gggccgggga 28140 gacggtgctg gtgcacgcgg cggcgggcgg cgtcgggcag gccgccgtgc agctcgccca 28200 ccacttcggc gcgcgcgtgc tggccaccgc gcacccggcc aagcacagcg tgctgaccgc 28260 gctgggcgtg cccgccgagc ggctcgcctc cagccgcgac ctcggctacg cgcggcggtt 28320 cggcgacgtc gacgtggtgc tgaactccct ggtcggcgag cacgtcgacg cctcgctgcg 28380 gctgctgcgc gcgggcggcc ggttcgtgga gatcggcaag aacgacgtcc gggacgccga 28440 ctcggtcggg gacgtccgct accgggtgtt cgacctgggc gcggacgccg ggccggaccg 28500 gatcggcgag ctgctggagc agctggtggg cctgttcgag tcgggcgcgc tgcggccact 28560 gccggtgcgc acgtgggacg tcacccgcgc ggcctcggcg ttccgcgaga tgagccgggg 28620 cgggcacacc ggcaagatcg tcctgacgat cccgcgccgc ctcgaccccg agggcacggt 28680 gctgatcacc ggcggcgccg gcacgctcgg ggccaccgcc gcccgccacc tggtcaccgc 28740 gcacggcgcg cggaacctgc tgctggtcgg caggcggggc cccgacgcgc ccggcgcgag 28800 cgagctggcg gaggagctgc gcgggctggg cgcggacgtg cgggtggcgg cgtgcgacgt 28860 cgccgaccgg gccgcgctcg acgccctgct cgcctcggtc ccggccgggc gcccgctgac 28920 ggcggtcgtg cacgcggcgg gcgcgctcga cgacggcacg gtcaccgcgc tcaccccgga 28980 gcggttcgac gcggtgttcc gccccaaggt ggacgcgatc gcgcacctgg acgaggcgac 29040 ccgcgacgcc gacctggccg cgttcgtcgt ctactcctcg gcggcgggcg tgctcggcaa 29100 cgcggggcag ggcaactacg cggcggcgaa cgccgtgctg gacgcggtgg cccgcacccg 29160 gcacgcccgc gccctcccgg cgacctcgct ggcctggggg ttgtggagcg acacgagcgc 29220 gctgaccgcg acgatggacg ggcgcgcggt ggaccgcacg cggcgcgcgg gcgtgctggg 29280 catgggcaac gacgaggcgc tggcggcgct ggacgcgggc ctggcgtccg ggctgcccgc 29340 gctggtggcc gcccggatcg acccggccgc gctgcgcgac cccgcgtcgg ggtcgccgct 29400 gctgcgcggg ctggtgcgcg ccacccgccg cacggccgcc acccgcgacc gggacgccgt 29460 gggcgggctg gccggacggt tggccgggtt gtcggccgcg gagcaggacg agctgctgct 29520 gggcctggtg cgcagcgagg ccgccgccgt gctcgggcac gcgagcgccg agcgggtcga 29580 gccgcaggtg gcgttccggg acatggggtt cgactcgctc accgccgtgg agctgcgcaa 29640 ccggctcgcg gcggcgaccg ggctgcggct gcccgcgacg gcgacgttcg accacccgac 29700 gccggtgcgg ttcgccgcgc tgctgcgggg cgagctgctg ggcgccgtcg tggctcccgg 29760 agccgtgacc gccgccgcgg ctcccgtgac cgccgccgcg cccgccgacg agccgatcgc 29820 gatcgtgtcg atggcgtgcc ggctgcccgg cggggtggtc gacccggccg ggctgtggga 29880 gctgctcacc ggggagcggg acgggatcgt ggacttcccc gacgaccggg gctgggacct 29940 ggagtcgctc taccacccgg acgccgactc ccccggcacc tcctacgtgc tgcgcggcgg 30000 gttcctggac gacgcgggcg ggttcgacgc cgggttcttc ggcatctccc cgcgcgaggc 30060 cctggcgatg gacccgcagc agcgggtgtt cctggagacc tgctgggagg cgttcgagcg 30120 cgccgggatc gacccggtct cggtgcgcgg cagcgacacc ggggtgttcg ccgggatcat 30180 cgaccaggac tacggggtgc gcgcgggcac ggcccccgag gagctggagg gctacctgct 30240 caccggcacc gccacgtcgg tggcgtccgg gcgggtggcc tacctgttcg ggctggaggg 30300 cccggcggtc accgtggaca cggcgtgctc gtcgtcgctg gtggccacgc actgggcggt 30360 gcaggcgctg cgccggggcg agtgctcgat ggcgctggcg ggcggcgcga ccgtgatggg 30420 gcggccgtcg gcgttcgtgg agttctcccg gcagcgcggg ctggcgcggg acgggaactg 30480 caaggcgttc ggcgcggacg cggacggcac cgcgttcagc gagggcgcgg gcgtgctgct 30540 gctggagcgg ctctcggacg cgcggcggcg cgggcacccg gtgctcgcgg tgatccgggg 30600 gtcggcgctg aaccaggacg gggcgtcgaa cgggctgacc gcgcccagcg gaccggcgca 30660 gcagcgggtg atccgggcgg cgctggccga cgcgggcctg cggccgtcgg acgtggacgc 30720 ggtggaggcg cacggcaccg gcaccgcgct cggcgacccg atcgaggcgg gcgcgctgct 30780 ggcgacctac ggcgcggacc gggagggcgc ggaaccggtg tggctggggt cgctcaagtc 30840 caacaccggg cacacgctgg cggcggcggg cgtgtcgagc gtgatcaaga tggtgctggc 30900 gctgaaccac ggcctgctgc cccggtcgct gcacgtgcgg gagccgagcg cggcggtgga 30960 ctgggagtcg ggcggcgtgc gcctgctgac gagcgcccgg ccgtggccgg agagcggcag 31020 gccccggcgg gcgggggtgt cgtcgttcgg gatcagcggc acgaacgccc acctggtgct 31080 ggaagccgcg cctgcggagg agggcgcggg ggcgcggagt ggggcggcgg cgccgggacc 31140 ggacacccgg tcggcgccca ccccggacgc cccagcgggc cccgtccaga cctccggcgt 31200 gatcccctgg ccgttgtcgg cccgctccgc cgacgcactg cccgcgcagg ccgcgaagct 31260 ggccgcccac gtgcgggcgc acgacgacct ctcgccgctc gacgtcggct ggtccctcgc 31320 gaccacccgc accgcgcacc cgcaccgcgc cgtgctcgtc ggcggcaccc gcgaggcgct 31380 gctgtcggcc gccgacgcgc tcgcgggcgg cgaggccagc caggccgtgc tcaccggctc 31440 cgccgtcggg tcgggttcgg cgaagaccgt gttcgtgttc cccggccagg gcgcgcagtg 31500 ggcgggcatg ggccgtgagc tgctggggtc ctcgccggtg ttcgccgcgc ggctgcgcga 31560 gtgcgccgac gcgctggccc cgcacaccga ctgggacctc ctggacgtgg tgcgcggcgc 31620 ggagggcgcg ccggggttcg agcgggtcga cgtgctccag cccacctcgt gggcggtgat 31680 ggtggcgctg gccgcgctgt ggcgctcgtg cggggtggag ccgtccgccg tcgtcgggca 31740 ctcgcagggc gaggtggccg ccgccgtggt cggcgggtac ctggcgctgg gcgacgcggc 31800 gcggctgatc gcgcggcgca gcagggccat cgcgcaggag ctgaccgggc gcggcgggat 31860 gctgtccgtg ctcacctcgc ccgagcgggt cgccgaactg ctggagccgt gggccgggaa 31920 gctgtggatc gcggcggtca acagccccgc gtccgtctcg gtgtccggtg acgccgaggc 31980 gctgggcgag ttcgtgcggg tgctggccaa ggcccggatc aaccggtggc ggctgcccgg 32040 cgtggacttc gccgggcact ccgggcacgt cgacggcatc gaggcgcggc tgcgcgagga 32100 gctggccgac gtcaccgccg cggcgggcga agtgccctgg ctgtccaccg tggacgggcg 32160 gtgggtggag cgcaccaggc tggacgccga ctactggtac cgcaacctgc gcgacgtggt 32220 ccgcttcgac gaggccgtcc gcgcgctggt ggacgccggg caccgggcgt tcgtggaggt 32280 ctccacgcac ccggtgctga ccaccgcgat cggcgaggtc gccgacgagc ggcaggacgt 32340 gcgggtcgcc gtggcgggca cgctgcgccg cgacgacggc ggcgcggacc gggtcgtggg 32400 cgcgctcggc gaggtggccg cctcgggcgt ggcggtggac tgggcggcgg tgttcggcgg 32460 gaccggggcc gcggtggtgg agctgccgac gtacgcgttc cggcacgagc ggttctggct 32520 caccccgtcc ggcggcgacg tgcgcgcggt ggggctgcgg caggccgggc acccgctgct 32580 gggcgcggtg gtcagcgtcc cggacaccgg cggcgtgctg ctgaccgggc ggctgtcgct 32640 gtccgcgcag ccgtggctgg ccgaccacgc gctgtccggc gtgccgctgc tgccggggac 32700 ggcgctggtg gagctggcgg tgcgcgcggg tgacgagacc ggcacgccgg tggtggcgga 32760 gctggtgctg ggcaggccgc tcgtgctgcc gcgcaccggg tcggcgcagg tgcaggtgct 32820 ggtgggcgag gaggcgcggg acgggcggcg gccggtcgcg gtgtactcgc gggcgggcga 32880 cgaccggccg tggaccgagc acgcctcggg ctcgctcgcg ccggacgagg acgccgcgcc 32940 gggagcggag ggcgacgagt ggccgcccgc cggggccgag ccggtggacc tcggcggctt 33000 ctacgacggc ctcgccgaac ggggctacga ctacggcccg gccttccggg gcctggtgcg 33060 cggctgggtc aggggcgacg aggcgttcgc cgaggtcggg ctgcccgacg accagcacgg 33120 cgcggcggcc cggttcgggc tgcacccggc gctgctggac gcggccctgc acgcggcctc 33180 gctgtgcgcg ggccacggcc ggggcacggc gctgccgttc acctggaccg gcgtgcggct 33240 gcacgcggcc ggggcgacgg cgctgcgcgt gcggctggag gcggacgggc cggagcggtt 33300 gtcgctgcgg gcgagcgatc cggcgggcac gcccgtggtg accgtcgggt cgctgctgct 33360 gcgcgccgcc gacgcggacc ggctgcgggc gacagcggcg gcgacggcgg cagcggcggc 33420 ggacgacggg ctgcacgcgc tggagtggac cccgcacccg ctgcccgagg agacgaccgg 33480 ttcccccgcc gtcctggaca ccagggcgtg ggagctgccc gagggcgtcg ggcgggccga 33540 ggcgatcacc acgcgggtgc tcgccgagct ccaggccgag ctcgacggga cggcgaccct 33600 ggtcgtggtg acgcggggcg cggtggccgt gcatgacgac gccgaggtca ccgacccggc 33660 cgccgccgcg gtgtgggggc tggtgcgcgc cgcgcaggcc gaggaacccg gacgcgtcgc 33720 cgtggtcgac gtcgacgacg cctccgaggc cgcgctggac gccgccgcgc acgccgcggg 33780 cgcagaaccg cagctcgccc tgcgcggcgg ggcggcgttc gcgccgaggc tggtcgaggc 33840 gtccggggcg ctggccgtgc cggacgggcc gtggcggctc gacagcaccg gccggggcac 33900 cctggagaac ctggcgctcg tgcccaaccc cgccgccggg gcgccgctcg cgcccggtca 33960 ggtgcggatc gtggtgcggg cgggcggcct gaacttccgg gacgtgctga tcgcgctcga 34020 cgcctacgag tcggagatcg gcaccgaggg cgcgggcgtg gtcgtggagg tcgcgccgga 34080 cgtcacccgc gtggccgtgg gcgaccgcgt gatgggcatg atccccggct cgttcgggcc 34140 gctggccgtg gccgacgccc gcacggtggt gcggatgccg cgcggctggt cgttcaccga 34200 cgcggcgggc gtgccggtcg cgttcctgac cgccctgtac gggctgcgcg acctcggcgg 34260 cctggcggag ggcgagaccg tgctggtgca cgcggcggcg ggcggcgtcg gcatggccgc 34320 cgtgcagctc gcccggcact tcggcgcgcg cgtgctgggc accgcgcacc cggccaagca 34380 cgccgcgctg gacctgcccg ccgaccacct ggcctccagc cgggacctcg cctacgcgca 34440 gcggttcggc gacgtcgacg tggtgctgaa ctccctggtc ggcgagcacg tcgacgcctc 34500 gctgcggctg ctgcgcgcgg gcggccggtt cgtggagatg ggccgggcgg acctgcgcga 34560 cgccgacgag gtggcgcgcg agcaccccgg ccgcgcctac ctcccgttcg acctcggcgg 34620 cgacgccggg ccggaccgga tcgccgagct gctggtggag ctggtggccc tgttcgagtc 34680 gggcgcgctc cgcccgctgc cgacccggcg caccgacctg gtgcgcgccc ccgaggcgtt 34740 ccgggccatg agccagggcc gccacgtcgg caagctcgtg ctcaccccgc cccgcgcgct 34800 cgaccgcgac ggcacggtcc tgatcaccgg cggcacggga accctcggcg cggctctggc 34860 ccgccacctg gtggacgcgc acggcgtccg gaacctgctg ctggtcagcc gcagcggccc 34920 caacgcgccg ggtgcggccg acctggtcgc ggagctggcc gagcggggcg cgagggtccg 34980 ggtggccgcg tgcgacgtgg ccgagaagga cgcgctcacc gcgctgctcg cctcgatccc 35040 caccgggcgc ccgctcaccg gcgtcgtgca cgcggcgggc gcgctggacg acggggtgct 35100 caccgccctg gacgccgacc gggtcgcggc ggtgctgcgc cccaaggccg acgccgccct 35160 gctgctgcac gaggccaccg aggacgccga cctcgcgctg ttcgccctgt gctcgtcggt 35220 ggcgggcgtg ctgggcaacg cgggccaggc gaactacgcc gccgccaaca cctacctgga 35280 cgcgctggcc cagcaccggt cggccgccgg tctggccgcg ctgtcgctgg cctggggccg 35340 gtgggcgcag accagcgccc tcaccgcaga cctgcccgcg cccggcggtc gccgcgacct 35400 ggtgcgcccc atggacaccg cgtccgcgct gcgcctgctc gacgccgcgc tccgcaccgg 35460 acgctcgacg gtcgtcgccg ccgagctgga cgtcacggcg gccaccgccg cgaacccggt 35520 gctgcgcggc ctggtccggc ccgcccggcg cgcgctggcc acgtccgcgc gggacgagcg 35580 cggcgtggcg gcggcgctgg ccgggctggg cgaggccgac cggcgccggt tcgtgctgga 35640 cctggtgcgc tcgcacgccg ccgtcgtgct gggcctggcg ggcaaggagg ccgtggacgc 35700 cgagcgcgcg ttcaccgaga ccggcttcga ctcgctcacc gccgtggagc tgcgcaaccg 35760 gctcgccgcc gcgaccgggc ttcggctgcc ctccacgctg gtgttcgacc acgccacccc 35820 gaccgcgctg gccgcgcacc tgcgcgccga gctgaccggc gacgacctgc cgcaggcgcg 35880 ggccgtcgcc gccacggcgg gggcgcggga cgacgacccg gtggtgatcg tgtcggcgag 35940 ctgccgcctc cccggcggcg cggactcgcc ggaggcgctg tgggagctgc tggagcgggg 36000 cagggacgcc atcaccccgt tcccgcgcga ccggggctgg gacctggagg cgctctacga 36060 cgccgacccg gaccggccgg gcaagagcta cgtgcgcgac ggcgggttcc tcgccgacgc 36120 ggccgggttc gacgccgagt tcttcggcat ctccccgcgc gaggcgctgg ccaccgaccc 36180 gcagcagcgg ctgctcgccg agacctcctg ggagctgttc gaacgcgcgg gcatcgcccc 36240 gacctcggtg cgcggcagcg acgtcggcgt gttcgcgggc gtgatcaacc aggagtacgg 36300 cgtgcacagc ggcacgaccc ccgccgagct ggaggggtac gtgatgaccg gctcgaccac 36360 cagcatcgcc tccggccggg tggcgtacct gctcgggctg accgggcccg ccgtcaccgt 36420 ggacaccgcg tgctcctcgt cgctggtggc gatccacctg gcggcgcagg cgctgcgctc 36480 gggcgagtgc tcgatggcga tcgcgggcgg cgcgacggtg atcgcgaggc cgggcgggtt 36540 cgtctcgttc tcccggcagc gcggcgcggc ccccgacggg cgctgcaagg cgttcggcga 36600 cggcgcggac ggcatggcgt tcgccgaggg cgtcggcctg gtgctgctgg agcggctctc 36660 ggacgcgcgc cgcaacgggc acccggtgct ggcggtcgtg cgcggcacgg ccctgaacca 36720 ggacggcgcg tccaacggcc tgaccgcgcc gaacgggccc gcgcagcagc gggtgatccg 36780 gcaggcgctg gccaacgccg ggctgtcccc cgacgaggtg gacgcggtcg acgcgcacgg 36840 caccggcacc gcactcggcg acccgatcga ggcgcaggcg ctgctcgcca cctacgggcg 36900 ggaccgggac ccgcggcggc cgctgtggct ggggtcggtg aagtcgaaca tcgggcacac 36960 ccaggcggcg gcgggcatcg cgagcgtgct caagatggtg ctggcgatgc agcggggcgt 37020 gctgcccgcg accctgcacg ccgacacccc gacgacgaag gtcgactggt cctcgggcgc 37080 ggtggcgctg ctgtcgcggg cgcggccgtg gccggagacc gggaggccgc gccgggcggg 37140 cgtgtcctcg ttcgggatct ccggcaccaa cgcgcacgtg ctgctggagc aggccccgca 37200 ggacgcgccc gccacgccgg tcgccccgcg gggcgccggg ctggtcgggg cggtggcctg 37260 gccggtgtcc gggcgcacgc ccgccgcgct gcgcgcccag gccgccaggc tcgggacgca 37320 cctggcgggc gcgcaggccg gacccgccga cgtgggctgg tcgttggcgg gcacgcggac 37380 ggcgttcgcg cagcgggcgg tcgtggtggc cgggacggcg gagcaggccc gtgacgggct 37440 ggcggcgctg gccgaaggcc gctcgtccgc gctcgtgacg accggtgagg ccggggtcga 37500 cgggcgcgtg gtgttcgtgt tccccggcca aggggcgcag tggatcggca tgggcgcgga 37560 gctgatcgac gcgtcgccgg tattcgccga gcggttgcgc gagtgcgcgg aggcgctgga 37620 accgttcgtg gacttcgacc tgatcgaggt gctgcgcgga cgcgggtcgc tggagcgggt 37680 cgacgtggtg cagcccgcgt cgtgggcggt gatggtgtcg ctggcagcgc tctggcggtc 37740 gctgggcgtg gaaccggacg ccgttgtcgg gcactcgcag ggcgagatcg cggcggcggc 37800 ggtcagcggg gcgctcagcc tgcccgacgc cgcagccgtg gtcgcgttgc gcagcaaggc 37860 gatcgcccag gacctggccg ggctcggcgg catgatgtcc gtcgccctgc ccgccgacga 37920 cgtcgacctg agcgggtatc ccggacgcct gtgggtcgcc gcgcacaacg gccccacctc 37980 gaccgtggtg gccggtgacg tggacgcgct gcgcgagctc cacgcccact acgagggcgc 38040 cgaggtccgg gcccggatca tccccgtcga ctacgccagc cacaccgggc acgtcgacac 38100 catccgcgag cggctcgccg aggcactggc gcacgtgcgg ccgagggcgg gcacgatccc 38160 gtggctgtcg accgcgaccg gcgagtggac caccggtgag gacgccgacg ccgactactg 38220 gttccgcaac ctgcgcggcg cggtgggctt ccacaccgcc atcaccaccc tcgccgagca 38280 gggccaccgg gtgttcgtgg aagtctccag ccaccccgtg ctcaccaccg ccatcgaggc 38340 cacgctcgaa ggaaccggac ccaccgccgt caccggaacc ctccgccgcg acgacggcgg 38400 ccccgaccgc ctcctcacca gcctcgccac cctgcacgtg cgcggcgtcc acgtcgactg 38460 ggacgcggtc tacgcgggca gcggcgcgca ccgcacgacg ctccccacct acgcgttcca 38520 gcacgagcgc tactggctca ccgagccgga cgcgccgcag gccgtcgcgg acgccccgtt 38580 ctgggacgcc gtggacagcg gcgacgtggc cgcgctcgcc gggtccctgg gcgtcgagcc 38640 cgccgccctg gagccggtgc tgccggggct gacgagctgg cgggcccgca accgggacgg 38700 cgcggccgtg gacgactggt cctaccggat cggctgggag cgggtggacg tgcccgccgc 38760 cccgctgtcc gggacgtggc tggtcgtggt gcccgaggca ctcgccgacg acacctcggt 38820 cgccgaggtc gcggcggcgc tggccgcgcg cggcgcgacg ccgaggatcg tggcggcggg 38880 cccggacctg ggcccggacc tgggtgacga gccggacggg gtgctgtcgc tgctggcgtg 38940 ggacgaccgc ccggccgggg gcggcacgct ctcgcgcggc gtcgtggacg cggtcgggct 39000 ggtgcgggag gcggtgcggc gcggctggtc ggccccgctg tggtgcgcca cgctcggcgc 39060 ggtcgccgtc gccgaccccg gcgaggtgac ggccgagttc gggccgcagc tgtggggcac 39120 gggcgtcgtg ctgggcctgg acctgccgga cacctggggt ggcctggtcg acctgcccgc 39180 gcggccggac ggggtcgcgc tggacctgct gtgcgcggtg gtcgcgggcg cgggcgacga 39240 ggaccagctg gcggtgcgcc cggccggggt gttcgcgcgg cgcatgaccc gacgcccggt 39300 cgcgtcggcg cccgcgtggc gaccgcgcgg gacggtgctg gtcaccggcg gcaccggcgg 39360 cctcggcggc tacgtcgccc ggtgggcggc ggagcggggc gcgcgggacg tggtgctgct 39420 ctcgcgcggc ggcccggacg cgccgggcgc ggacgccctg gtcgccgaca tcacggcggc 39480 gggcgcccgc tgcgcggtgc tggcctgcga cgtcaccgac cgggacgcgc tggccgaggt 39540 ggtcgcgaac ctgccggacg ggccgctgtc ggtggtgcac gccgcgggcg tggcgcgacc 39600 gggacggccg ctggtggaga ccacgccgga ggagttcgcg gccatcggcc ggggcaaggt 39660 cgcgggcgcc cgcctgctgg acgagctgct gggcgaccgg gagctggacg cgttcgtgct 39720 gttctcctcc ggcgcggcgg cctggggcag cggcgggcag gccgggtacg cggcgggcaa 39780 cgccttcctg gacgggctcg cgcagcgcag gcgcgcccga gggctcgcgg ccacctcggt 39840 ggcctggggc gcgtggggcg gcgtcggcac ggtcgacgag gtgctgggcg agcagtggcg 39900 gcgcgccggg ctgctcacca tggacccgcg cctggccacc ctcgccctcg cgcacgccgt 39960 gggctcgggc gaggcgcacc tgctcgtcgc ggacgtcgac tgggcccgct tcgcccccgc 40020 ctacgcgctg gccaggccgc gcccgctgct ggcggcgctg cccgaggtcg ccgacgcgct 40080 ggcggtcgtg gacgcgcccg ccgacgccgg ggggatcggg gcgcggctgg ccgggctgcc 40140 gcccgccgag caggagcggc tgctcaccga gctggtgcag gcggaggcgg cggccgtgct 40200 gggcctgggc ggcatcaccg gcgaccgggc gttccgggag gtcgggttcg actcgctcac 40260 ggccgtggag ctgcgcaacc ggctcggcgc ggccacgggt ctcaccctgc ccgcgacgct 40320 ggtgttcgac cacccgcgcc cgagcgccct ggccgcgcac ctgcggtccg cgctgggccc 40380 ggccgccgcg ccggtggact cggtggcggg cgtgctggcc gagctggacc ggctggaggc 40440 ggccatcccg gcgctgccgt cggccgagat cggccggtcc cggctggagc tgcggctgcg 40500 gcggttgagc gcccgcgtcg gcgagctggt cgccgcgaac ggcgagcggg cgaacggcgg 40560 gcgcgcgaac ggcgggcgcg cggcggccga cgagctggac gacgcggggg ccgaggacgt 40620 gctcgcgttc atcgaccggg agttcgggga cgcgtgagcg gccacacgag ccccgacccc 40680 ggcccccacc gcggccccca caacgacgac cctggcgagg aacagatggc gaacgacgag 40740 aggctcctca gctacctcaa gcgggtcacc gccgacctgc accgcacgcg ggagcggctg 40800 cgcgaggcgg agtccggggc ggacgagccg atcgcgatcg tcggcatggc ctgccgcttc 40860 cccggcggcg tgcgcacccc ggacgagctg tgggagctgg tggcgtccgg ccgcgacggc 40920 atcggcccgt tcccggacga ccggggctgg gacctgggcg cgctgttcga cccggacccc 40980 gacgccaccg gccgctccta cgtcaccgag ggcgggttcc tggacgacgc ggccctgttc 41040 gacgcgggct tcttcgggat ctccccgcgc gaggcgctgg ccaccgaccc gcagcagcgg 41100 gtgctgctgg agaccgcgtg ggagaccttc gagcaggcgg gcatcgaccc gacctcgctg 41160 tccgggcagg acgtgggcgt gttcaccggg gtcgccaacg gggactacgc gctgaccgtg 41220 gaccgggtgc cggagggctt cgagggctac ctgggcatcg gcggggcggg cagcatcgcc 41280 tccgggcgca tctcgtactc cctgggtctg gagggtccgg ccgtcacgct ggacaccggc 41340 tgctcgtcgt cgctggtcgc gatgcactgg gccgggcacg cgctgcgggc gcgggagtgc 41400 tcgctggcgc tcgcgggcgg cgtgatggtg atggcgacgc cgggtgggtt cgtcgggttc 41460 tcccggcagc gcgggctggc ccgcgacggg cggtgcaagt cgttcggcga cggcgcggac 41520 ggcacgtcgt ggtcggaggg cgtgggtctg ctgctgctgg agcggctgtc ggacgcgcgg 41580 gccaacgggc acgaggtgct tgcggtggtg cgcgggtcgg cgatcaacca ggacggggcg 41640 tccaacgggc tcaccgcgcc caacgggccg tcgcagcagc gggtgatccg cgcggcgctc 41700 gacgcggcgg ggctcgggca cgcggacgtc gacgcggtgg aggcgcacgg caccgccacg 41760 gtgctcggcg acccgatcga ggcgcaggcg ctgctgaaca cctacgggcg gcaccgggac 41820 ggggcgcagc cgctctacct ggggtcggtc aagtccaacc tcgggcacac ccaggcggcg 41880 gcgggcgtgg ccggggtgat caaggcggtg caggcgatgc gccacggcgt gctgccgccc 41940 accctcaacg tcggcacgcc caccaccaag gtcgactggt cctcgggcgc ggtggaggtg 42000 ctggcggagg cccggccgtg gccggagacc gggcgtccgc gccgggtggg cgtgtcgtcg 42060 ttcggcgtga gcggcaccaa cgcgcacgtg atcctggagc aggcacccga gcacgagcca 42120 gcgccggagg agccgggtgg gcgcgggccg gtggcggcgg gcggcgcgac gccgtggacg 42180 ctgtccgggc gcacgcccgc cgcgctcgcc gaccaggcgc ggcggctggc cgggcacgtg 42240 acggccgacc tgcgggcgga ggacgtcggg ttctcgctgg ccaccaccag ggcgcacctg 42300 gagcaccggg cggtggtggt cggctcggac gggctggcgg cgctggccga aggccgctcg 42360 tccgcgctcg tgacgaccgg tgaggccggg gtcgacgggc gcgtggtgtt cgtgttcccc 42420 ggccaagggg cgcagtggat cggcatgggc gcggagctga tcgacgcgtc gccggtattc 42480 gccgagcggt tgcgcgagtg cgcggaggcg ctggaaccgt tcgtggactt cgacctgatc 42540 gaggtgctgc gcggacgcgg gtcgctggag cgggtcgacg tggtgcagcc cgcgtcgtgg 42600 gcggtgatgg tgtcgctggc agcgctctgg cggtcgctgg gcgtggaacc ggacgccgtt 42660 gtcgggcact cgcagggcga gatcgcggcg gcggcggtca gcggggcgct cagcctgccc 42720 gacgccgcag ccgtggtcgc gttgcgcagc aaggcgatcg cccaggacct ggccgggctc 42780 ggcggcatga tgtccgtcgc cctgcccgcc gacgacgtcg acctgagcgg gtatcccgga 42840 cgcctgtggg tcgccgcgca caacggcccc acctcgaccg tggtggccgg tgacgtggac 42900 gcgctgcgcg agctccacgc ccactacgag ggcgccgagg tccgggcccg gatcatcccc 42960 gtcgactacg ccagccacac cgggcacgtc gacaccatcc gcgagcggct cgccgaggca 43020 ctggcgcacg tgcggccgag ggcgggcacg atcccgtggc tgtcgaccgc gaccggcgag 43080 tggaccaccg gtgaggacgc cgacgccgac tactggttcc gcaacctgcg cggcgcggtg 43140 ggcttccaca ccgccatcac caccctcgcc gagcagggcc accgggtgtt cgtggaagtc 43200 tccagccacc ccgtgctcac caccgccatc gaggccacgc tcgaaggaac cggacccacc 43260 gccgtcaccg gaaccctccg ccgcgacgac ggcggccccg accgcctcct caccagcctc 43320 gccaccctgc acgtgcgcgg cgtccacgtc gactggaagg ccgtgttcgc cggcacgggc 43380 gcgcgccgcg tcccgctgcc gacctacgcg ttccagcacg agcgctactg gctggaccgg 43440 ggcgcggcgg ccggtgacgt cacgggcgcg ggcctggccg acgcggcgca cccgctgctg 43500 gccgccgtcg cccagctgcc cggcaccggc ggggtgctgc tgagcgggcg gttgtcgcgg 43560 gcgacgcacc cgtggctggc cgagcacgtg gtgaacggga ccgcgctggt gcccggcacg 43620 gccctggtgg agctggcgct gcgcgcgggc gacgaggtgg acgcgcccgt gctgcgcgag 43680 ctggtgatca cccggccgat gccggtgccg gagcggggtt tcctgcacgt gcaggtggac 43740 gtcgcgggtg cggcggacga cgggtcgcgg gcggtgcgga tctggtcgcg cgccgaggac 43800 gcggcgagcg agacggcccg ctggaccgag cacgccaccg gctccctcgc ccccgacgac 43860 gcggccccgc ccgcccgcgc gagcggcgcg tggccgcccg agggcgcggc ggccgtggac 43920 gtggacgact tctacgaccg cctcgcgggc gcgggctacg agtacgggcc gctgttccag 43980 ggcctcaccg ccgcgtgggc cggggacggg caggcgtggg ccgaggtggt gctgcccggt 44040 gaggcgggcg ggttcggcgc gcacccggcg ctgctggacg cggcgctgca cgtgggcacg 44100 ttctgcctgc ccggcgggcc ggggtcgcgc acgctgctgc cgttcgcgtg gacgggcgtg 44160 cggctgcacg ccaccggcgc gacggcggtg cgggtgcacg cccgcgccac cggcgacgac 44220 ggcctcgtcg tggagctgcg cgacgcggac ggggaaccgg tcgtgacggt cgacgcgctc 44280 gtgctgcgcg acgccgaccc cgccgacgcg caggccccgg acgtcacggc ggacgcgttg 44340 tggcgggtgc ggtgggtcga gcagccgccc gcgcccgcgg cgcccggctg ggtgctgctg 44400 ggcgggccgt ccgggcacgc cgggttcgcc gccctgccgg tgttcgccga ccctgcggcc 44460 gtggcggcgc tgcccgaggg cgaccggccc gcggtggtcg tcgtggacac caccgcgtgt 44520 cgggagccgg ggcgggacgt gccgggggcg gcgcgggcgt tcgtggtgcg ggcgctggag 44580 ctgctggtgg cgtggctgcg cgaggacgcg ctggccggga cccgactggt gctagtcacc 44640 agcggcgcgg tgccggtgcg cgcggacgcc gaggtcaccg accccgctgc cgcggcggtg 44700 tggggtctgc cgcgctcggc gcagtcggag cacccggacc gggtgtggct gctggacgtc 44760 gacgagccgg gcgcggcgcc gggcgcgctg gcctcgccgg agccgcagct ggccgtccgg 44820 gcgggcgcgg ggttcgcgcc ccggctcgcc agggccgagg ccgcgcccgg cgcgctgccg 44880 gtcgacgggc cggtgctggt caccggcggc accggcacgc tcggcgcgct cgtggcccgg 44940 cacctggtca ccgcgcacgg cgcgcggaac ctgcacctgg tgagcaggcg cggcccggac 45000 gcgtccggcg ctcgagaact cctggacgag ctgcgcgggc tgggtgccga ggtcgagctg 45060 tcggcgtgcg acgtggccga ccgggtggcg ctcgccgccc tgctggggcg cgtgcgcccc 45120 gccgccgtgg tgcacgcggc gggcgcggtg gacgacggcc tgctcaccga cctgaccgcc 45180 gaccggttcg acgccgtgct gcggcccaag gtcgacgcgg tcgcccacct ggacgaccta 45240 ctcggggacg tgccgctggt ggtgttctcc tccgcgaccg gcaccctcgg cacccccggc 45300 caggcgaact acgccgcggc caacgcggtc gccgacgcgc tcgtgcagcg ccgccgcgcg 45360 cggggcctgc cgggcgtgtc gctggcgtgg ggcctgtggt cggacaccag cgagctgacc 45420 gcgaccatgg acgccgccga cgtggcccgc acccgccggg gcggggtgct cggcctggac 45480 gcggcgcgcg gcctggcgct gctcgacgcc gcgctcggcg cggacgacgc gctgctcgtg 45540 ccgatccacc tggacaccgc cgcgctgcgc cggggggccg acccggctcc gccgctgctg 45600 cgcggcctgg tccgccgcgc ccggcgcgcg gcgggcgcgg cccggcaggc cgcgctgccg 45660 ctggtggcgc gactggccgg ggtggacgcg gcggagcggc ggcgggcgct ggtggagctg 45720 gtgcgcgccg aggccgccgc cgtcctcggg cacggcggcc cggacggcat cgggcaggac 45780 cagccgttcc gggaggtcgg gttcgactcg ctcacggccg tggagctgcg caaccggctc 45840 ggcgcggcca cgggtctcgc gctgcccgcg acggtggtgt tcgaccaccc gacgtccgcg 45900 cgggtcgccg agcacctgcg ggagctgctg ttcggcgcgg agacggctca ggcccccgcg 45960 cggcgggagg tggtggccga cgacgacccg atcgccgtgg tgggcatggc ctgccggttc 46020 cccggcgggg tcgccgacgc ggacgggctg tggcggctgg tcgccgagga gcgcgacggc 46080 atcggcccgt tcccggacga ccggggctgg gacctggcgg cgctgttcga cccggacccc 46140 gaccacgcgg gcacctcgta cgtgcgggaa ggcgggttcc tcgacggggc gaccgggttc 46200 gacgcgccgt tcttcggcat ctccccgcgc gaggcgctgg ccatggaccc gcagcagcgg 46260 ctgctgctgg aggtggcgtg ggagacgttc gagcaggcgg gcatcaaccc gcgctcggcg 46320 cacggcaccg acaccggggt gttcgcgggc gtgatctacc acgactacgg cgaggcggcg 46380 ggcgagctgc ccgagggcgc ggagacctac cgcagcaccg gcacgtcggg cagcgtggtg 46440 tccggccgcg tcgcctacgc gctgggcctg accggcccgg cgctgaccat cgacacggcc 46500 tgctcgtcgt cgctggtggc gatccacctg ggcgcgcggg cgctgcgggc gggcgagtgc 46560 tcgatggcgc tggtcggcgg ggtgacggtg atgtcgacgc cgggcgggtt cgtgagcttc 46620 tcgcggcagc gcgggctggc cccggacggg cggtgcaagt cgttctcgga gggcgcggac 46680 ggcaccgggt tcagcgaggg cgtcgggctg gtgctgctgg agcggctgtc ggacgcgcgg 46740 gccaacgggc acgaggtgct tgcggtggtg cgcgggtcgg cggtgaacca ggacggggcg 46800 tccaacgggc tcaccgcgcc caacgggccg tcgcagcagc gggtgatccg cgcggcgctc 46860 gacgcggcgg ggttggggca cgcggacgtg gacgcggtgg aggcgcacgg cacgggcacc 46920 accctcggtg acccgatcga ggcgcaggcc gtgctcgcca cctacgggca ggaccgcgag 46980 cagccgctgt ggctgggcac gctcaagtcc aacctcgggc acacccaggc ggcggcgggc 47040 atcggcagcg tgatcaagat gatccaggcg atgcggcacg gcgtgctgcc gcgcaccctg 47100 cacgtcaccg agccgaccac ggccgtggac tggggcgcgg gcgcggtgga gctgctgacg 47160 cgggcgcggg agtggccgga gaccgggcgt ccgcgccggg cgggggtgtc gtcgttcggg 47220 gtgagcggca cgaacgcgca cgtgatcctg gagcaggccc ccgaaccggt ggcggtggag 47280 gcggcgccgg aggcgggggt gctgccgtgg gtgctgtcgg cccgcacgcc cgaggcgctg 47340 cgggagcagg ccgaccggct cgtggcgcac ctgggcggtg agtcgtcctc ggcggccgtg 47400 gcccggtcgc tggtgctggg tcgggcggcc ctggaggagc gggccgtggt cgtgggcgac 47460 cgggcgcgcg ccggggaggc gttgcgggcg ctggccgagg ggcggccctc ccccgcgctc 47520 gtcaccgggc ggaccggggt cgaggggcgc gtggtgttcg tgttccccgg tcagggcgcg 47580 cagtgggtcg gcatggggcg tgcgctgctg gacgcctcgc cggtgttcgc cgaacgcctg 47640 cgcgagtgcg cggcggccct gcgcccgtac accgactggg acctggtcga ggtgatcacc 47700 tcgggtggcg cgctggacga cgtggacgtc gtgcagcccg cgtcgtgggc ggtgatggtg 47760 tccctcgcgg cgctgtggcg ctcgctcggc gtcgaaccgg acgcggtgat cgggcactcg 47820 cagggcgaga tcgccgccgc gaccgtcgcg ggctggctca gcctccagga cggcgcgaag 47880 atcgtcgcgc tgcgcagcca gctgatcgac gaggagctga ccgggctggg cggcatgatg 47940 tccgtcgccc tgcccgccga ggacatcgac ctgagcggtt acgagggccg gttgtgggtc 48000 gcgacggtca acgggccgag cgcgaccgtg gtcgccgggg acaccggggc actggaggag 48060 ctgcggcgcg gctgcggcga ggcggtccgc acgcgggtga tccccgtgga ctacgccagc 48120 cacaccgggc acgtcgacgc catccgcgac cagctcgccc ggatgctcgc cgacgtcacc 48180 ccgcggcccg gcgagatccc gtggctgtcc acggtgaccg gcgagtggat cacccccggc 48240 gacgacgacg ccgactactg gttccacaac ctccgccgca ccgtccactt cgccgacggg 48300 atcaccaccc tgctcgacgc cgggcaccgg gtgttcgtgg aggtctcctc gcaccccgtg 48360 ctggcggcgg cggtgcagga gagcgccgag gcggccgggg acgcgcgggt cgccgtgacc 48420 ggcacgctgc gccgcgacga cggcggctgg gaccgggtcc tgaccggcct ggccgagctg 48480 cacgtgcgcg gcgtggacgt ggactggacg cgggtgctgc ccgaggcggg gcgggcgccg 48540 ctgccgacgt acgcgttcca gcacgagcgc tactggccgg aacccgcgcg cccggccgcc 48600 gcgccgggcg gtggtgacga cgcgctgtgg gcggtgatcg agggtggtga cgcggcggac 48660 ctggccgggg agctggccgt ggacgaggac gagctggcgc gggtgctgcc cgccctgacc 48720 tcctggcggc ggcgcagccg ggcaaggagc gcgctcgacg gctggcgcta ccgggtcgac 48780 tgggtcccgg tccccacgag cgggtctggg ctgcccggcg ggcaagcgct gtccggcggg 48840 caggcgctgt ccggcgggcc gaggtcgtcc ggcggggcag ggctctccgg cggtcagggg 48900 acgccaggcg ggtccgggtc gcccggcgga gcggcactgc caggcgggcc agggtcgccc 48960 ggcggagcgg cgctgcccgg ccgggtggcc gtggtggtgc ccgcgaacga cgagcgggcg 49020 cgggcggtcg cgggcgggct ggtcgcgcgg ggtgtggacg tgaccgtcgt ggcggcggtc 49080 gacgccaccc gcgacgggct ggcgaaggcg ctgcccgacc gccccgacgc cgtggtgtcg 49140 ctgctgtcct gggacgcggg ggccgacgag ccgggcgcgc ccggttcggc cacggccgcg 49200 ctggtgcagg ccctggccga ccggggtgcc accgggccgc tgtggtgcgc gaccgggggc 49260 gcggtgagcg tcgcgggcga ggacgccgac cccgaccagg ccgccgtgtg ggggttgggc 49320 ggggtgctgg ccctggacct gccggaggcg ttcggcggac tggtcgacct gccgcggcag 49380 cccaccgacg ccgacctcga cgcgttcgcc gccgcgctga ccgcccccgg cggcgaggac 49440 cagctcgcgg tgcgcgacgg ccgcctgctg gcccgccgcc tggtccgcga cggggccgac 49500 gcgccggagt ggacgccgcg cggcgcggtg ctggtcaccg gcggcaccgg cggcctcggc 49560 acgcacgtgg cccgctggct cgcccgctcc ggggccgggc acgtcgtgct cgccagccgc 49620 tccggccccg ccgcccccgg cgcggccggg ctggccgccg aggtggaggc gctgggcgcg 49680 cggtgcagcg tggtggccct ggacgtggcc gaccgggacg cggtggccgc cgtgctcgcc 49740 gacgtcgagc gggacgggcc gctgaccgcc gtggtgcacg cggcgggcgc gggactggcc 49800 ccgacgccgg tggtggagct gaccgccggg cggtacgcgg acgtcgcggc cggcaaggtc 49860 gagggcgcgc gggtgctgga cgaggtgctc gccgaccggg cgctggacgc gttcgtgctg 49920 ttctcctccg gcgcggccgt gtggggcagc ggcgggcagg ccccgtacgc ggcggccaac 49980 gcgttcctgg acgggctggc cgcccgcagg cgggcgcgcg ggctcgtggc cacctcggtg 50040 gcgtggggcg gctggggcgg cggcctcggc atgatcggcg acggggacgc ggagcggtgg 50100 gcccggctgg gcatccgcac gatggacccg gaggcggcgc tgcgcggcat ggcgctggcg 50160 gtcggctccg ggcgggccgc gagcgtggtg gccgacgtcg actgggcccg gttcgccccc 50220 ggctacgccc tggcgcggga gcgcccgctg ctgcgcgggc tgccggaggt ggtggcgctg 50280 ctggccgaac cggacgagcc cgccgcggcg gtggacgcgc ggggcgcgct ggcggcccgg 50340 ctgaccgggc tggacgcggc cgggcaggac gagctgctcg cggacctggt gcgggcgcag 50400 gcggcggcgg tgctggggtt cgccgaccct ggcgcggtcg cggcggaccg ggcgttcaag 50460 gacgccgggt tcgactcggt gaccgccgtg gagctgcgga accggctggg cgcggccacc 50520 gggctgcggc tgccgccgac cgtggtgttc gaccacccga aacccctggc tctggcgcgc 50580 gtgctgcgcg ccgagctggt cccccagcgg ggggacgggg tgacggcggc gcaggtggcg 50640 caccgggagg acgcgatccg gcgggtgctg gcgtcggtgc cgctggcccg gttcgaggag 50700 ctgggcgtgc tcggcgcgct cgtggacctc gtgcccgccg cgccaccggc gggcggcgcg 50760 gcgacagcgg agcgggacga cctggcggac ctggcggagc tggacctgga cggtctggtc 50820 cgcagggcga tgcgcggcac caccgccggg aacgactgag gctttgatgc ggagcggaga 50880 gagcatgagc gcgggcacct cgccggagag cgtcgtccag gccctgcgga ccacgctggt 50940 ggacaacgag cggctgcggc gggagaacga gcggctggtc gccgaggccg gtgagccggt 51000 ggcgatcgtg tcgatggcgt gccggctgcc cggcggcgtc accgacccgg agtcgctgtg 51060 ggagctggtg cgcgagggcc gggacgccat cgggccgttc ccgaccgacc ggggctggga 51120 cctggggtcg ctgttcgacg acgacccgga cgcggcgggc tcctcgtacg tgcgggaggg 51180 cgggttcctg gcgcgggcgg gcgggttcga cgcgccgttc ttcggcatct ccccgcgcga 51240 ggccctggcc atggacccgc agcagcggct gctgctggag gtggcgtggg aggccgtgga 51300 gcgggccggg ctcgacccgc gctcgctgga gggccgggac gtcgcggtgt tcgcgggcgg 51360 caacccgcag ggctacggcg gcggaccggg tgacgccccg gagggcctgg aggggttcct 51420 gggcgtcaac gcctcgtcgt cggtgatctc cgggcgggtc tcctacaccc tgggcctgac 51480 cggcccggcc gtcaccgtgg acacggcgtg ctcgtcgtcg ctggtggcga tccacctggc 51540 ggtgcggtcg ctgcgctcgc gggagtgctc gatggcgctc gcgggcgggg tgaccgtgat 51600 ggggcagccg accgcgttcg tggagttctc gcggcagcgc gggctcgccc cggacgggcg 51660 gtgcaagtcg ttcggcgacg gcgcggacgg cacgtcgtgg gccgagggcg tcggcgtgct 51720 gctgctggag cggctctcgg acgcgcggcg cgacgggcac gaggtgctgg cggtgatccc 51780 cggctcggcg gtgaaccagg acggggcgtc caatggcctg accgcgccga acggcccgtc 51840 ccaggagcgg gtgatcgcgg cggccctggc cgacgccggt ctcggcctgg ccgacgtgga 51900 cctgctggag gcgcacggca ccggcaccag gctgggcgac ccgatcgagg cgcgggcgct 51960 gctcaacacc tacggccggg gcaggccgca ggaccggccg ctgtggctgg ggtcggtgaa 52020 gtcgaacctc gggcacgccc agtcggcgtc gggggtggcg ggcgtgatca aggtggtgca 52080 ggcgatccgg cacggcctga tgccgcgcac gctgcacgcc gacgagccga gctcgaacgt 52140 ggactgggcg gcgggggcgg tggagctgct ggcgcgcgag cgggagtggc cggagaccgg 52200 gcgggcgcgg cggggcgcgg tgtcgtcgtt cggggtgagc ggcacgaacg cgcacgtgat 52260 cgtggagcag gcgcccgagg aggccgccgc cggggtcgcg gcggcggggc ggcccgcgcc 52320 caggtcggcg ggcgggcagg acgccgggat cgcggcggtg accgggcagg ccgcccccgc 52380 cgctggcccc gccaccgccg aacccgccgc gtcggccgtc gaggacggga ccggcgtcgc 52440 ccccggcccg gtcgcgaccg gcggggtcgt gccgtgggcg ctgtccgggc ggaccgccgc 52500 cgcgctggcc gcccaggcgg cccggttgcg cgcgcacctc gccgcgcacc cggcggcccg 52560 cccggtggac gtggcctggt cgctggccac gacccgctcg gtgctggagc accgggccgt 52620 cgtgcccgcc gcctcgctcg acgaggccct ggcggggttg gacgcgctcg cctcgggccg 52680 cgcggaccgg tcggtggtcg tcggcgaggc ggcgcccggc cgggtggcgg tgctgttcac 52740 cgggcagggc agtcagcggg ccggtgcggg gcgcgagctg cgggagcggt tcccggtgtt 52800 cgcgcgggcg ttcgacgccg cgtgcgccgc cgtgggcgag ctgcccaccg gcgacggcgg 52860 cgcgatcggg ctcgccgagg tggcgctggc cgaccccggc acgcccgccg ccgcgctgct 52920 cgaccggacc gcgttcaccc agcccgccct gttcgcgctg gaggtcgcgc tgttccggct 52980 ggtccagtcg tggggcgtgc gcccggcggc gctggccggg cactcggtcg gcgagatcgc 53040 cgccgcgcac gtggccgggg tgctctccct cgccgacgcc gccgcgctgg tgcgcgccag 53100 gggcgggctg atgcaggagc tgcccgaggg cggcgcgatg gtggcggtgg aggcggccga 53160 ggacgaggtc gtgccgctgc tcggggacgg ggtgtcgctg gccgccgtca acggcccgac 53220 ctcggtggtg ctctccggcg acgaggaggc cgtcaccgcc gtcgccgcga ggctggcgca 53280 gcggggcagg cgcaccaaga ggctcgccgt ctcgcacgcc ttccactcgc accgcgtgga 53340 cccggcgctg gccgccttcc gcgccgtggc cgaggagctc gcctacgccg cccccacgat 53400 cccgatcgtc tccaccctca ccggccgccc cgtcaccccc gacgagctgc gctcccccga 53460 ctactgggtg cggcacgcgc gcggcgccgt ccggttcctg gacgccgtgc gggcgctggg 53520 ggacgcgggc gcgcgcacgt tcctggagct gggcccggag ggcgtgctca cggcggcggg 53580 cgcggactgc ctgccggacg cggtgttcgc ggcgacgctg cgcgccgacg tgcccgaggc 53640 gcgggccgtg ctcgccgggg tcgcgggcct gcacgtgcgc ggcgcgacag tcgactgggg 53700 ttcgctgttc acgggcgcgg acgcgcggcg cgtcccgctg cccacctacg cgttccagca 53760 cgaggaccac tggctggtgc gccgctccac cgccgccgac gtgggcgcgg tcggcctgcg 53820 cgaggccggg cacccgctgc tgggcgcggt cgtcgcgctg ccggagagcg gcggggtgca 53880 gctgagcggt cggttgtcgg tggcggcgca gccgtggctg gccgagcacg tcgtctccgg 53940 cacggcgctg gtgccgggcg cggcgctggt ggagctggcg gtgcgggcgg gcgacgagac 54000 cggcacgccc gtgctggagg agctggtgat cggccgcccg atgccgctgc cggacggcgg 54060 cgcgctgagc gtgcaggtcg tcgtcggccc ggacgagggc gggcgccggt cggtgcgcgt 54120 gtactcccgc gcggacgggg cggtggactg ggtcgagcac gcggcggggg cgctgaccgc 54180 gccggaggcc gcgccgaccg ccgacgcggg cccgtggccg ccggagaacg ccgaacccgt 54240 ggacacgcgg ggcttctacg acaccctcgc ggagggcggc tacgcctacg gcccgctgtt 54300 ccggggcctg acctcggcgt ggcgcggcga gggcgaggcg tgggcggagg tggcgctgcc 54360 cggtgacgcg accgggttcg gcatccaccc ggccctgctc gacgccgcgc tgcacaccgc 54420 gcacttctgc ctgcccaccg ggaccgagcg gcgggccggg ctgctgccgt tcgcctggac 54480 cggcgtgcgg ctgcacgcgg gcggcgcgac gaccgcgcgg gtgcacgccc gcgccaccgg 54540 cgacgacggc gtgaccgtgc gcctgctcga cggtgccggt cagccggtcg cggacgtggc 54600 cgccctgacc ttccgcgccg cagccgacac cccgtccgcc gaggtcccgg acgcgctgtg 54660 ggcggtggag tggaccgagc acccgctgcc cgcggacggg accacccccg cgggcgggac 54720 caccacggcc gtggtggtcg tggacacccg gagcgtcgac gcccccgacg acggccccgc 54780 ccgcgcccgc gcgctgaccg cccacgtcct cgccgagctg cagcggcacg ccgacgacga 54840 ccggccggtc gtcgtggtca cctcaggcgc ggtcgccgtg cgcgtcgacg gcgaggtcac 54900 cgaccccgcg tccaccgccg tgtgggggct ggtgcgggcc gcgcaggtcg agcagcccga 54960 ccgggtccgg ctggtcgacg tcgagccggg ggccgacccg gtgctcacct cgcccgagcc 55020 gcaggtggcg ctgcgcggcg ggaccgcgca cgtgcccagg ctggtccgcg cccgccgcgc 55080 cctcccggcg ccgaccgcga cgtcgtggcg gctgggctcc gaccgccccg gcacgctgga 55140 ctccctcgcc ctgctcccgg acgactccgg cacggccccg ctcgcccccg gcgaggtgcg 55200 gatcgcggtc cgcgcggcgg gcctgaactt ccgcgacgtg ctggtcgcgc tggggatgta 55260 ccccggtcgc gcggtgatcg gcgcggaggg cgcgggtgtg gtcgtggagg tcggccccgg 55320 ccccgacgac accgacgccg gcgacaccgg ccccggcgac accggctcgg gcggcctggc 55380 cgtgggcgac cgggtgatgg gcctgttccc cggcgcgttc ggcccgctgg ccgtggccga 55440 ccaccgaatg gtgacccgga tgccggacgg ctggtcgttc accaccggcg ccggcgtgcc 55500 catcgcgttc ctgaccgccc tctacgggct gcgcgacctc ggcgggctca ccgcgggcga 55560 gaccgtgctg gtgcacgcgg cggcgggcgg ggtcggcatg gccgccgtgc agctcgcgcg 55620 ggcgttcggc gctcgggtgc tgggcaccgc gcacccggcc aagcacgcgg ccgtgacccg 55680 cctgggcgtc cccgagtccc acctgtcctc cagccgcgac accgcctacg ccgacctgtt 55740 cggcccggtg gacgtggtgc tgaactcgct caccggcgag cacgtggacg cctcgctggg 55800 gctgctgcgc gcgggcggcc ggttcctgga gatgggcaag accgacctgc gcgacgccga 55860 cgaggtcgcg aaggcgcacc ccggcgtcgc ctaccgcccg ttcgacctgg gcggcgaggc 55920 gcccgccgag cgcgtcgcgg agctgctggc cgagctggtc gcgctgttcg aggcgggccg 55980 catccacccg ctgcccaccg cggcctggga gatcacccgc gcgccggagg cgttcggctg 56040 gatgagccgg gccgggcacg tgggcaagat cgtgctgacc ctcccccgcc gccccgaccc 56100 ggacggcacg gtgctggtca ccggcggcac cggctcgctc ggcgcggtcg cggcccggca 56160 cctggtcacc gcgcacggag cccgccacct gctgctcgcc tcccgacgcg gcgagcaggc 56220 ccccggcgcg gcggagctga ccgacgggct gcgcgggctg ggcgcggacg tgcgggtcgc 56280 ggcgtgcgac gtcgccgacc gggacgcgct cgccgcgctg ctcgccacga tccccgccgc 56340 gcacccgctc accgccgtcg tgcacacggc gggcgtgctc gacgacggcg tgctcgccgc 56400 gcagaccccc gagcgcctgg acgcggtgtt ccgccccaag gtcgacgccg tcgcgaacct 56460 gcacgagctg accggcgacc cggccctgtt cgcggtgtac tcctcggcct ccggcgtgct 56520 cggcggcgcg ggccagacca actacgccgc cgcgaacgcc tggctcgacg gcctcgccca 56580 cgtccggcgc gcggcgggcc tgcccgcgac ctcgctggcc tggggcctgt gggcgcagga 56640 cggcggcatg acgggcggcc tggcgggcgg accggccggg ccgggcgggc gggcccgccg 56700 gggagccgtc gcgccgctgt ccaccaccga gggcatggcg ctgttcgacg cggccgtcgc 56760 gtcgggccgc ccgctcctgg ccccgatcag gctcgacccc gccgcgctca ccgccgacgg 56820 cgcgcagccg cccgcgctgc tgcgcggcct ggcccgcccc acccgccgca ccgccgtcgc 56880 ggccaccacc gacgacggcc tcgcgggcag gctcgccgcg ctcgacggcc ccggcaggca 56940 gcggctgctc gtggagctgg tgcgggagca ggccgccgcc gtgctgggct tcgcgacccc 57000 ggacgccgtg tcgccgggcc gggcgttccg ggacctgggc ttcgactcgc tgacggccgt 57060 ggagctgcgc aaccgcctct ccgccgccac cggcctgcca ctgcccgcca ccaccgtgtt 57120 cgaccacccg accccgctgg acgcggcggc ccacctgctc gacgcgctgg gcgtcgcccc 57180 cgcgcccgcc ccggccaccc cggtcgtgac ggccgcgcgg gacgacgacc cgatcgcggt 57240 cgtcgccatg ggctgccgcc tgcccggcgg cgtgtcctcc ccggaggacc tgtggcggct 57300 gctcgacggc ggcgtcgacg ccatcggccc gttcccggac gaccggggct gggacctggg 57360 gtcgctgttc gacgacgacc ccgacgcggt cggcaagtcc tacgtgcgcg agggcgggtt 57420 cctggcgggc gcgggcgggt tcgacgccgc gttcttcggc atctcccccc gcgaggcgct 57480 cgccatggac ccgcagcagc ggctgctgct ggaggtggcc tgggagaccg tcgagcgggc 57540 cgggatcgac ccgacctcgt tgcgcggcgc ggacgtcggc gtgttcgccg gggcgggcgc 57600 gcagaactac ggcagcggcc ccggcccggt gcccgagggc ctggagggct acctgggcgt 57660 gggcggcgcg acgagcgtgg tgtccggccg cgtctcctac acgctcggcc tcaccgggcc 57720 cgcgctgacg atcgacaccg cgtgctcctc gtcgctggtg gcgatccacc tggcggtgcg 57780 gtcgctgcgc tcgggcgagt gctcgatggc cctggcgggt ggggtcgcgg tgatgggcga 57840 gcccgcggcg ttcgtggagt tctcccggca gcgcgggctc gccccggacg ggcggtgcaa 57900 gtcgttcggc gcggaggcgg acggcacgac gtgggccgag ggcgcgggac tggtgctgct 57960 ggagcggttg tcggtggcgc gggcgcgcgg gcacgaggtg ctggcggtgc tgcgcgggtc 58020 ggcggtcaac caggacgggg cgtccaacgg cctgaccgcg ccgaacggcc cgtcgcagga 58080 gcgggtgatc cgggcggccc tggccgacgc ggggatcacc ccggacgcgg tggacgcggt 58140 ggaggcgcac ggcaccggca ccaccctcgg tgacccgatc gaggcgcagg ccgtgctggc 58200 gacctacggg caggaccgcg agcagccgct gtggctgggg tcgctgaagt cgaacatcgg 58260 gcacgcgcag gcggcggcgg gcgtcgcgag cgtgatcaag tccgtgctgg cgctgggccg 58320 gggcgtgctg ccccgctccc tgcacgccag caccccgacc ccgcaggtcg actggtcctc 58380 gggggcggtg gagctgctgg cgcgggcgcg ggagtggccg gagaccgggc gtccgcgccg 58440 gatcggggtg tcctcgttcg gggtgagcgg caccaacgcg cacgtggtcc tggagcaggc 58500 ccccgagccg gaacccgcgc gggaggcgga acccgcgcgg gagtccgcgc cagggccgga 58560 gtccgttccg ccgctgaccg gggccacgcc gtggctgctg tccgcccgct cccccgaggc 58620 gctggcggac caggccgccc ggctggtgga cgccgtgccc gccgagtggc gggcctccga 58680 cgtgggctgg tcgctggcca ccacgcgggc cccgctggag cagcgggccg tggtcgtggc 58740 gcgggacacc gcgcgcgggc tcgccgccgc gtccgcgctg gccgccggac gccccgaccc 58800 gcacgtggtc accgggaccg ccgacgtgga cggcaggacc gccttcgtct tccccggcca 58860 gggcgcgcag tgggcgggca tggggcggga actcctggac gcctcgccgg tgttcgccga 58920 acgcctgcgc gagtgcgcgg cggccctgcg cccgtacacc gactgggacc tggtcgaggt 58980 gatcacctcg ggtggcgcgc tggaggacgt ggacgtcgtg cagcccacca gctgggcgat 59040 catggtgtcg ctggccgcgc tgtggcgctc gctcggcgtc cacccggacg cggtgatcgg 59100 gcactcgcag ggcgagatcg ccgccgccac cgtcgcgggc tggctcagcc tccaggacgg 59160 cgcgaagatc gtcgcgctgc gcagccagct gatcgacgag cacctgaccg ggctcggcgg 59220 catgatgtcc gtcgccctgc ccgccgagga catcgacctg accggctacc agggccggtt 59280 gtgggtggcc gcccacaacg gccccaccgc gaccgtggtc gccggggacg ccgacgccct 59340 ggcggagctg cgggacgcgc tggagggcga ggcccgcacc cgcgtgatcc ccgtcgacta 59400 cgccagccac accggccacg tcgacgccat ccgcgaccag ctcgcccgga tgctcgccga 59460 cgtcaccccg cggcccggcg agatcccgtg gctgtccacg gtgaccggcg agtggatcac 59520 ccccggcgac gacgacgccg actactggtt ccacaacctc cgccgcaccg tccacttcgc 59580 cgacgggatc accaccctgc tcgacgccgg gcaccgggcc ttcgtcgagg tctccacgca 59640 ccccgtgctc accccggccg tgcaggaggc cgccgaggcg aacccggcgc tgcgcaccgt 59700 cgccgtgggc accctgcgcc gcgcggacgg cggcgcggag cgggtggtgg cgggcctggc 59760 cgagctgctg gcgcgcgggg tggccgtgga cccggcggcg gtgttccccg gtgcgaggcg 59820 ggtcgcgctg ccgacgttcg cgttccggca cgagacgttc tggctctcgc gggcgctgcc 59880 cgacgcgcgg ccggtgccgc agggcgggca cccgctggcc ccggtggtgg tgagcgatcc 59940 gggcacgggc ggggtgatcc tgtccggccg gatctccgcg gccacccacc cgtggctgct 60000 cgaccacgcc gtcgcgggcg cggtgctgct gcccggcgcg gcgctggccg agctggcggt 60060 gcgggccggc gacgagaccg ggacgcccac cctggaggag ctggtgatcg gcaggccggt 60120 ggtgctgccc gaggacgggg agctgcggct ccaggtggtc gtgggcgccg aggacggggc 60180 gcgccgcgag gtgcgcgcct actcccgcgc cgacgacgcc gcgccgtgga ccgagcacgc 60240 gagcggcacg ctgtcggcga agtcctcgct gcccgccgac gtcccggccg ccccgtggcc 60300 gcccgcgggc gcggagccga tcgcgctgga cgggttctac gaggccatgg caggggccgg 60360 ttacgggtac gggcccgcgt tccgggggct gcgcgcggcc tggcgcgacg gggacgacgt 60420 ggtcgccgag gtggccgtgc cgcgggcgca ggagcaggtg gcgggccggt tcggcatcca 60480 cccggcgctg ctggacgccg ccctgcacgc cgggaacttc tgcttccccg cgcaggacgg 60540 cgagcgggcc acgatgctgc cgttcagctg ggacgacgtg cggttgcacg ccaccggcgc 60600 gacgtcggtg cgggtgcggg cccgcgcggt gggcggccct ggcgcgcccg cgctgaccgt 60660 ggcgatcacc gacccgagcg gggtgccggt ggccggggtg ggcgcgctcg ggatgcgcgc 60720 ggtcagcccc gagcagctgg gcgcgccggg cgtcggcggt gacgcgctgc gggtgctgga 60780 gtgggccgag gtggcggtcg aggcggcgga ccggtgggcc gtgctgggct ccgagcggca 60840 cccggacgtg gacgcctacg cggccgaccc ggaccggccg ggggcgctgc tggtggacgt 60900 gggcgcctgg ctgggcggcg acgacgccgt ggcccgcgcg cacgcgctga ccagcgcggc 60960 gctggagctg gtgcgggact gggcgacccg cggggacctg ggcggtgagc ggctggtgct 61020 ggtcacgacc ggggccgagg acgtgcgcga caccgcgccc cgcgacccgg cgcaggccgc 61080 cgtgtggggc ctggcgcgct cggcccgctc ggagcacccg gaccggttcg cgctggtcga 61140 cgcggacgac cggtccccgg cgacgctcgc cctggcggcc gggtcggcgt tcccggaggt 61200 ggtcctgcgc ggcgagcggg cgcacgcgcc gaggctggcg cgggccgtcc ccggcaggcc 61260 ggtggcgctg gacccggacg gcacggccct gatcaccggc ggcaccggcg ccctgggcgc 61320 gctcgccgcc cggcacctgg tgaccgcgca cggcgtgcgg cgcctgctgc tcaccggccg 61380 ccgggggccg gacgcccccg gcgcggcgga gctggccgag gagctgcgcg ggctgggcgc 61440 ggacgtgcgg gtggaggcgt gcgacgtcgc cgaccgggac gcgctcgccg cgctgctcgc 61500 gtcgatcccc gccgggcgcc cgctcaccgc cgtcgtgcac gcggcgggcg cgctcgacga 61560 cgccccggtg accgacctga ccccggagcg gctgtccgcc gtgctggccc cgaaggtcga 61620 cgcgctggcc aacctggacg agctggtcgg ggacgggccc gcggtgttcg cggtctactc 61680 ctcggcgtcc ggggtgctcg gcacggccgg gcaggcggcg tacgcggcgg ccaacacctt 61740 cgcggacgcg ctggtgcgcc gacgccgggc cgagggccgg gcgggcgtgt cgctggcgtg 61800 gggcctgtgg gcaggcgcca gcgagctgac cggcgacctg gccggtgacc ggctcgcccg 61860 cacccgccgg ggcgggctgg tgccgctgac cgccgccgag ggcatggcgc tgttcgacgc 61920 gggcgcggtc accacgggcg gcccggcgct ggtcgtgccg ctgccgctgg acctggcggc 61980 gctgcgcgcc tccgcgcgcg acgaggcggt gcccgcgctg ctgcgcgcgc tcgtccccgc 62040 cgcgcggcgc tcgctctccc ccgccaccgg gcaggccgcg cccccggccg ggttgcgggc 62100 gcgcctggcc gggctgtcgg gcgacgagca ggaggccgtg ctcaccgagc tggtccgcga 62160 cctggccgcc gccgtgctcg ggcacggcga gaagggcgcg gtgggcccgg acgacgcgtt 62220 cttcgagatc ggcttcgact ccatgacggc cgtgcagctg cggaaccggc tgaacaccgc 62280 caccgggctg cgcctgcccg ccgcgctgct gttcgaccag ccgacgcccg cgatcgccgc 62340 cgaggcgctg cgcgagcgac tggccgccga gcaatcgggc tcagggcaat cgggcgcagg 62400 gcagccgggc gcagggcatt caggcgcagg gcagtcgagc gcagggcgat caggcgcagg 62460 gcagtccacc gacccgaccg acgagaggtg agcaccagca tgatcgacgt ggccgagtac 62520 ctgcggcgca tcggcgtgga gggcggcgtg ccgagcccga cgctggagtc gttgcgggcg 62580 ctgcacaagc ggcacctgat gtccgtgccc tacgacaacg gcggcgcggc cgaccggttg 62640 ccgccgaacc gggggctcgc ggagatcccg ctgccccgtg tgttcgcgca cgtggtgacc 62700 ggccgcaacg gcggggtctg ctacgagctc aaccggctct tccacgccct gctcaccgcg 62760 ctgggctacg aggtgctgat ggtcgcggcg gcgatccggc tggccgacga ccggttcggg 62820 ccggacgagg agcactcgtt caacctggtg cgcctggacg ggcggacctg gctggtggac 62880 gtggggttcg tcggcccgtc ctacctggag ccgctggagc tgtcggcggt cgagcaggag 62940 cagtacggct gcgcctaccg ggtcgtggag cgcggggacg cgcacgtggt ggagcgcagg 63000 cccagggacg gggcgtggca ggcggtgtac cggttccggc cggggcgggc ggaccgggac 63060 ggctgggagg cggtgcggtt ggacgggctg gacgactacg cgcgggactc ggtgctggcg 63120 ggcaccacgt tccggggtcg ggcggcggag aacgggcagc acgtgctgat cggccgccgc 63180 tacttcaccg tgctggacgg ggtggagacg acgcgggtgc tcgtgaagaa ggacgagttc 63240 gcccgcgtca ccgagtcgat catgatcggg gggtgagcgc gtggcgggcg aggtcgagca 63300 cgacgtggtg gtcgtcggct acgggccggt ggggcagctg ctgtcggtgc tgctggcgca 63360 gcgcggctgg cgggtgctgg tgctggagcg ctggccgacg ccgttccggc tgccgcgcgc 63420 ggtcgggttc gacagcgagg cgacccgcgt gctggcctcg gccgggctcg ggcccgcgct 63480 ggccgagttc ggggagcccg cgggcgacta cgagtggcgc accgcgtccg gggagacgct 63540 gatcgcgttc accgtgcggg aggaggggca ctgcggctgg cccgaggcga cctcggccta 63600 ccagcccgcg ctggaggacg cgctgatcgc gcgcggcgag gcgctgccgg gggttcaggt 63660 gcggcgcggc tgggaggtga ccgggctgac cgaccggggc gaccacgtgc gggtggtggc 63720 caccgacccc ggcggggcgc gcgtgaggct gacggcgcgg ttcgcggtcg gctgcgacgg 63780 ggcgaacagc gtggtgcggg cccgcaccgg caccgacgtg accgacctgg acttctcgca 63840 cgactggctg gtgtgcgacg tgcggctgca cgaccggcgc ccggtgacgc cgaacaacct 63900 ccaggtgtgc gacccggcca ggccacgcac cgcggtgtcg gcggggccag ggcaccggcg 63960 gtacgagttc atgcgggtgc ccggcgacga cccggagcgg ttcggcacgc cggagagggc 64020 gtgggagctg ctggcgctgt tcggcgtcgg gcgcggcgac ggggtgctgg accggctggc 64080 cgtgtacacg ttccaggcgc ggtgggcgcg gcggtggcgg gcgggccgga tgctgctggc 64140 cggggacgcc gcgcacctga tgccgccgtt cgccgggcag ggcatgacct ccgggttccg 64200 ggacgcggcg aacctggcgt ggaagctgga cctggtgctg cgcggcgagg ccgggtcggc 64260 gctgctggac agctacacgc tggagcgcgc cgagcacgtg cggcacgccg tgacgatctc 64320 ggtgggcctg gggcgggtgg tgtgcgtggc cgacccggcg gtggctgcgg accgggacgc 64380 ggcgatgctg gcggcgcgcg agcgcgagct gacaccgggc gcgtcggccc ggtcggtgct 64440 caagcccctg gaggacgggg tgctgcaccg ggacggcgac ggcgccctcg cgccgcacgc 64500 gggggccgtg ggcccgcagt ggcgggtggg gcgcggcggg cgggtcgggc tgttcgacga 64560 cgtggtgggg accgggttcg cgctgctcac caggggcggg ctggtggcgg ggccggaggt 64620 gcgggcgcgg ctggacgggc tgggcgcgcg ctacgcgcac ctggtgcccg ccggggcggc 64680 ggcggacggg ccggacgacg tggtcgacgt gagcgggaac tacctgacgt ggctggagga 64740 gctggacgcg gcggcggtgc tgctgcgacc ggacttctac gtgttcggcg cggccgggga 64800 cgcggcgggg ttggccgggc tggtggcgga cctgcgcgcg cggttggggt gacgccccgc 64860 aggccccggc acgtgccgcg ccggggcctg ctcgcgcgtc acgtccggtc gtcggcgagg 64920 tgggccaggc accagtcgag cacctgcgag ggcttgcgga ccaccgcgtc cgggttcgcc 64980 gccagcagct ccgcctcgtc cgtctcgccc cacagcgcgg ccagcgccgg gtagcccgcg 65040 gcgcgggcgc tggccaggtc cgtcagggcg tcgcccacca tcaccacccg gtcggccggg 65100 acgtcgagca ggccggtggc cagcaggagc atgtccggcg cgggcttggg gttcgcgacc 65160 tcgtcggagc cgatgatatg gtcgaacagc cccgccatgc cgagggtggt cagcagcgac 65220 cgggcgcgcg gcccgctctt gccggtgacc acggcggtgc cgaagccgtg ctgccgcagg 65280 tccgccagca gctccggcgc gccctcgaac acctccacct cacccgccag ccggtagctc 65340 tcgcggacga acggaccctc catctccagc ggcaggtcca tgatccgcat gatgtccggg 65400 aagtaccgcc ccaggtgccg gttgtactcc tcgaacggcg cgggcccgtc gccgacgacc 65460 tcggcgtagg cgatctcgaa cgcctgccgc atgacggcga agctgttgac cagcaccccg 65520 tcgaggtcga acagcacggc ccggtcgtag gtcgcgccgg ggacgtgccg gtggggcgcg 65580 ggggtcggcg gggcgagggg gcgcggggcc gcgggcgccg gaaccgcggt cgcggcccgc 65640 tcgtccccgg ctcgggcccg cacgactcgg gggttggtct gtccggtggt catcacgggg 65700 ctcccgtcgg gacgaggtcg accggcgcgt gtcgtcgttc ggcgcaccgc acggtgtcgg 65760 cggcgcggta gacccgttcg atcgcgcccg cgatccagcg cgccccggac gccgcctcgc 65820 cgcgcgtggc ggggtcggcc aggcgggtgg gcaggctcgc gagctgggcg tcgtactcgg 65880 cgcccaccgg ctcggcgggc agctcgaccg gggtggtgcg gccgtcggtg gtgagcagga 65940 gccgcgacgg gccctcgcgg ttcgggctga agccgaaggt gcagcgcagc tccgccgtgc 66000 cgccgctgcc ctccacgcgc acgaccgtgg tgtccagcgc ctggtgcgag gcccaggccg 66060 cgcgcacccc gatcgagatc cccgaccggg tgacgaggaa ccccctggcg gtgtcctcca 66120 cgtcgccgac caccgggtcc accggcgccc cgtcgccgcg ccaggcggcc cggaacgcgt 66180 ggtcgttgac gaagtccgcg gacaccgcgc cggtgacgtg ctccagctcc gcgccctccg 66240 ggtcgccggt ggcgccgcgc agcagcacgc gggcggtgtc gagcaggtgc cagccgaggt 66300 cgaccagcgc gccgccgccg gagcgggtgc ggttggtgaa ccagccgccc cggtccggga 66360 tgcccttgga ccgcacccag gacacgtcga cgtgccgcag cgcgcccagc gacgcggcca 66420 cctggcgcag cgcccgcacg tcggcccggt gccgggcggc gctcccgccc agcagcaccg 66480 cgccaccggc ctgctcggcg gcggtgagcg cggcggcctc ggcggacccc aggcacagcg 66540 gcttctccag gaacaccggg acgccccgcc gcagcagacc ggacgcgacc ggcgcgtgca 66600 ggtggttcgg cacggcgacc acggccaggt cgacctcgtc gcggcgcagg tcctccaccc 66660 gctccagcgc ggtgatcccg cgggagccgg gcacggcggc gcgggcctgc gcggacggct 66720 cgaccacggc gacgacccgg aaggcggggc tgcccagcaa ccggggcagc cacacctccc 66780 gcgccaccca cccgagcccg accaccgcga cccgcaccgg accaccgctc ccggccctcg 66840 gcccgtcgct cacaccacca cccccgctcc ccgcgcccgc caccccgcgc tcacgcgccc 66900 gcgaccacgt cggccacgac ggcggcaagc cggtgcagct gctcctcggt gcccagcagc 66960 acccggtggt gcagccacac gcagtcgcgg gtgatctcct ccgacaccgg gcaccgggcg 67020 gccagctcct cggtggtcag gtcgggcgcg ccggtctccc agaacgcctg ggtgcggtag 67080 accgcccgga acgccatgaa cgccgggatc ccgcgccgca ccagctcgtc caccaccgcg 67140 ttgcgccgct cctcggtgac gccgggcatc cggaacatcg ccatgtagct cgggttgcgg 67200 tcgctgcgcg ggtcgacggt ctgcggcacg acgccgtcga tccccgccag cagcgcggac 67260 agcaccggcc agcgggcctg cctggtcgcg atctgcgagt ccagcctgcc gagctgggcg 67320 cgcagcacgg cggcggagaa ctcgttcatc cggaagttcg agcccgaggt gaggtggaag 67380 tagccgcggt cgcccttggg cctgccgcag ctgtgcagga cgaacgcctt ctcccactgg 67440 gcctcgtcct cgaacagcac ggccccgccc tcgcccgccg tcatcagctt gccgttctgg 67500 aagctgaacg tggcgatcga cccgagctcg ccgacccgct tgccgcgcca gtgggcgccg 67560 tgggcgtggg cggcgtcctg caggaccggc acgccggtgc tcgtggacag cttgtccagc 67620 cggtccatgt cggcgaactg gcccgccatg tgcacgggca tgatcgccga ggtgcgggag 67680 gtgacggcgg cctcggcggc ggcgacgtcc aggcagtagg tgtcggggtc gacgtccacg 67740 ggcacggcga ccgcgccgag gcgctgcacg gcctgcgagg acgagatgaa ggtgaaggcg 67800 ggcacgatca cctcggcgcc ggggcccacg tcgagcacct ggagcgccag ctccagcgcg 67860 tgcgtcccgt tggtgacggc gagcgcgtgg cccgcgccgt ggtactcggc gaactcgcgc 67920 tcgaactcgt cgacctcgct gccgccgacc cgccaccact ggccctggtc cagcgcgcgc 67980 agcagggccg tgcgctcggc gtcgtcgtgc tgcggccagg ccgggaactc gatgcctgcg 68040 tccggagaat tgctcatgag cccctgtccc gtcgttcgcg gaaatggcgc gggggaattc 68100 gccgcggcct gctttcggaa ttcgacgcta ccgattccgc agatcccgac caaccccctt 68160 gacctccccc taatcccccc tgttcccagg ccatcaccgc agcacgcggg cacagcggca 68220 cagccgtgcg cacaatgggg gcgaacggga accggggcgt ccgcgcgccc cggcggcgct 68280 ttcggggaaa ggtgtcaggc gtgggcgagc tgctgctggt gaacgggccg aacctcggca 68340 tcctggggcg ccgcgaggtg tcggtgtacg ggaccgacac gctcgcggac gtcgagaagg 68400 cggtcggcga ggaggtcgcc gggcgcggct ggtcggtccg ctcggtgcag cgcaacggcg 68460 agggccagct cgtggacgag atcgaggcgt cctacgacac ggtgggcgcg atcgtgaacc 68520 ccggcgcgct gatgatggcg ggctggagcc tgcgggacgc gctggcgaac tacccgcgcc 68580 cgtggatcga ggtgcacctg tcgaacgtgt gggcgcgcga gagcttccgg cacgagtcgg 68640 tgctggcgcc gctggcgagc ggtctcatcg cgggcctggg cgcgcgcggc taccggttgg 68700 ccgcccgcgc gctgctggac ctggtggact gaccgccgtc gcgcgcgagc ccggccgcgt 68760 gcacggcccc gcgcagcgag gacaggccgc cgagcagcgc gggccgcacg ggcgcggtcg 68820 ggtggccggg ccgggcgagt gcggcgcagc ggtcggcgac cgcgtcgacg tatccgggca 68880 cggcggcggc gaacccgccc ccgaccacgc acagcgaggg ccgcgccagc tcgccgacgc 68940 cgacgagcgc ggcggccagc gcccgggccc cccgctcgac cgcggcccgc gcccacccgc 69000 gcccgtcgcc gagcgcccgc accaggtcct ccccggtgac cggcgcgccg ccgagcctgg 69060 cggcctcggc gagcacggcc ggtccggacg cgaacgcctg cacgcacccg gcccgcccgc 69120 acgggcaggg cggcccgtcg agcgccacca cgacgtgccc cagctcgcag gacccgcgct 69180 cgggtccggg gaacggcagg ccaccggaca cgacgccccc gccgacgccg gtccccacgc 69240 ccgcgtagac caggtcggcg cacccgtggg cacgggcctc ggcgagcgcg gcgaggtcgc 69300 cgtcgtccgc gacgagcacc ggggcggcca gcccgccgag gaaccccgcg aggtcgacgc 69360 cgacccaccc cggacggctg ggccaggccg tgacgacccc gccgtcgacg gtgccgggga 69420 acgcgatccc gaccccgtcg agcggcgccc cggcccgccc ggcgaggtcg gcgacggcgc 69480 ggccgagcag gtcgaggtcg gcgcgcggat caccgtcccc aggccaccgg aagccctccc 69540 gcagcaccag cggcccgcgt tcgagccgca gcgccacctt ggtcccgccg acgtccaccc 69600 cgagcagcgc cccgctcaca ccccgacctc ccgccgtccg cacccctcgc cgcaccacca 69660 cccgcgcggg ccgccgccca cgacgccgcc cgccacaccg atacccgcgc ggtcctcgct 69720 cacgacgccg ccacaccacc accgcacggg cctgcggtca cgacgccgcc acacctccac 69780 ccagcgcacc accacccgcg cgggccgccg ctcacgaggc caccgctcac gacgccgccg 69840 cccgccaggc cgccaccgcc tcggcccgcc gggcgtcgcc gctctccacc agcgcgaacc 69900 ggatcgcccg cgtggccgcg ttcgccgcct gcagcgcctc gtgcgcgccg ggctcggggt 69960 cgctgcgccc ggtcgccacc tcggtgatgc tgcgcgccgc ctccaggcac gccaggcagg 70020 ccgcgacgta cgcgtccgcc ccgcctcccg cgccgcccag cttctccagc agccgcgtca 70080 cgtcggcgtg cacctcgcgc acggcgtcct ccacccggcc cgcgccgggt ggtgtgccgg 70140 ggatgggggt caccgctgcc tcccggtgcc tgacgcggac ccggtcagcc gagggccggg 70200 atgagttcga cgaaccgacc ctgccacaac cggcgcagct cgcgcgtcaa ctcctcggac 70260 ggcgcgccgc cgaccagctc cgccagggtc gtcacgccgt ccacccggct gagcagcgcg 70320 tgcgcctgcg cggtggtggc ggtgacgggc ccgtggtcgt actccagcga cacctcgtgc 70380 accggctcgc ccgccgccgc gctgcccggc gcgggcgcgg tgcgcacggc caggcgggtc 70440 accgggcgca gcctgggcac cagcgcgccc aggtcctgct cggggcgggc ccgcaccagg 70500 aagccctcca cgaccaggcc gtccaggtcg gtggtcagga agctggtgag cacgtcgtcc 70560 aggctctgcg cgatcggctc ggcgttgttg ttgaacgagg tgttgagcag caccggggtg 70620 ccggtcagct cgccgaaccg cgccaccagc cggtggaagc gctctcccga ctcgggcgtg 70680 acgacctgca cgcgcgcgct gccgtccacg tgcgtgaccg cgcccagctc ggcccgcctg 70740 gcgggcagca ccggcaccac gaacgacatg aactcgtggt gccccagcgc cccggacagg 70800 tcgaaccagt cccgcgcggc ctcggcggtg accacgggcg cgaacggccg gaagctctcc 70860 cgcttcttca ccatggcgtt gatccgcgtc tggttctccg cgggccgggc gtcggcgatg 70920 atgctgcggt gcccgagcgc gcgcggcccg aactcggagc ggccgtgcgc ccagcccagc 70980 acctcgccgt cggcgagcag cttcgccgcg gtctccaccg ggtccaccag cggcgtcacc 71040 tccaccaccg gcgaccagtc cgcgagccgc gcggcgacct gctcgtccgt gccgaggtcc 71100 ggcccgagcg ccgccgacac cagccgcgcc gacggccgct ccagcacgcc cagcgcggcg 71160 gctgcggcgt acgcggcgcc ctcgccggcg cccgcgtcgt gcgaggcggg gtggatgaac 71220 acctcgtcga acagcccggc cttgaggatg cggccgttga gcgtggagtt gtgggcgacg 71280 ccgccgccga acgcgagcgt gcgcagcccg gtgacctcgg cccagtgccc gagcacgtgc 71340 agcgcgatct tctcggtcgc ctcctgcagc gcggcggcga agtcccggtg cgcctggctg 71400 aacggctcgt ccttgcggcg cggccggaac ccggcggcga ccagcgcggg ggtgaccagg 71460 ttcggcacct tggtgttgcc gatcaggtcg tactcgccct tgtcgcgcag cgcgtgcagc 71520 ccggagaaga cctcgcggta ggtcgacggg tcgccggacg gggcgagccc catgaccttg 71580 tactcgtcgc cgaagccgta gccgagcagg aacgtggcgt tcaggtacag cccgccgagg 71640 gacttctcca ccgggtagtc gtgcagcttc tccaggtgcg cgccacgcgc gtggtagacc 71700 gtgccggagt tgtcctcgcc ccggccgtcg aagatcacca ccagcgcctc gtccgcgccc 71760 gagtgcaggt aggacgagta ggcgtgcgcc tcgtggtgcg gaacgtagac gagcttgtcg 71820 tcgggcagct cccagccgag gtcctcgcgc agccgctgct tgatcagctc gcgggagaac 71880 cgcagcggca ccctcgggtg ctcggtgtag acgtggttga gcaccaggtc gaggtggtcc 71940 tcggggaagt agtagccgac cgcgtcgacg tcgtccacgg tcgcgcccgc gagcgccagg 72000 cactcgcgga tggcggtgga cgggaacttg gtcgtcttct tgacgcggtt gagccgttcc 72060 tcctccacgg cggccacgag ctcgccgtcg cgcaccaggg acgctgccgc gtcgtggaag 72120 aacagctccg acatcgacgg gacgaggtcg gtctcggcgg gcgagaagtt cccgttgatc 72180 ccgagcacga gcatgtggca tcaccttgat ccgggaggcg agggctgggg cgcggagggg 72240 gtcgccgtca ggcgcggggc gcgacggcgg cgaggtcggg cgaggtcagc cgcagcgcgg 72300 tgggcgcggg cttcgcggtc ggcacgaggt ggaagcgctc cacgccctcc tcggtgggcg 72360 cgggcagctc ggcggcgcag gcgcagtcgg cgggggcgaa cccggcgaac cggtaggcga 72420 tctccatcat ccggttgcgg tcggtgcgcc ggaagtcggc gaccaggtgc gcgcccgcgc 72480 gcgccgcctg gtcggtgagc caggtcagca gcgtcgaccc ggcgccgagc gagacgacgc 72540 ggcacgaggt ggccagcagc ttgaggtgcc acacccgccg gcgccgctcc agcagcacga 72600 tgccgaccgc gccgtgcggc ccgaaccggt cggacatggc cacgaccagc acctcgtgcg 72660 cggggtcggc gagcaggccg cgcagcgccc ggtcgtcgta atgcacgccg gtggcgttca 72720 tctggcttgt gcgcagggtc agctcctcga cgcgggtcag gtccgcctcg cccgcgcgcg 72780 cgacgaccac ctccaggtcc agggtgcgca ggaactcctc gtcgggcccg gtgaagccct 72840 cgcggctggc gtcgcgctcg aagcctgcgc ggtacatcag ccgccgctgc cgcgagtcgg 72900 cggtgaccac ggcggggctg aactcggggc gctcgggcag ggaggcgacg tcggcctcgg 72960 tgtacaggcg cacctcgggc agggcgcggg ccacctcggc gcgctcgacg gggctgtcgt 73020 cgacgaacgc gatcgtgcgg tgggcgaagc cgagccggtc ggcgatggcg cgcaccgacg 73080 ccgacttggc gccccagccg atctgcggca gcacgaagta gtcggcaagg cccaggcgtt 73140 cgagcacggg ccaggcgtgg tcgtggtcgt tgcggctggc cacggactgc aggacgccgc 73200 gcccgtcgag cgcggtgatc acctcgcgga cccgctcgaa cgggacgacg tcggcgtcct 73260 ccaggagggt gccgcgccac agggtgttgt ccaggtccca gaccaggcac ttgaccgtcg 73320 gtgcgggggt ctcggtcacg gctgctgctc cctgagcgga gttcggctgc gctggtcaag 73380 tccgcgcggg gcccggctgc gcacgtgctg ggcgagcacg agctggcaga tctcggaggt 73440 gccctcgatg atctccatga gcttcgcgtc ccggtgcgcc cgcgccacca cgtgcccgtc 73500 gctggcgccc gcggagccga gcagctgcac cgcgcgcccg gacccggcgg cggcctcgcg 73560 cgaggccagg tacttggcct gcaccgccgc caccgccagg tccggcgagt tcgcgtccca 73620 cagcgcgctg gcgtgctcgc tcgcgcgggc ggcgacctgc tcgccgacgt gcaactcggc 73680 caggtgccgg gcgacgagct ggtggtcggc cagcacgccg ccgccctgct cgcgggtcgt 73740 ggtgtgctcg acggcggcgg ccaggcaggc gcgcaggatg ccgacgcagc cccacgccac 73800 cgacacccgc ccgtaggtca gcgcggcggt gaccaccagc ggcagcggca gcccggtgcc 73860 gcccaggacg tcggcggcgg gcacccgcac cccgtccagg gtgatcccgg agtgcccggc 73920 ggcccggcac ccgctggggt tcggcaccct ctccacccgc acgccgggcg cgtcggcggg 73980 cacgacgacc gcgctcgccc cgccccggta gtgcccgaag accaccagca ggtccgcgta 74040 gtgggcggcg gtgatccacg acttgcggcc ggtcaccacc acctcgccgt cgccggtgtc 74100 ggtgatggtc gtggtcatcg cggacaggtc gctgcccgcg cccggctcgc tgaacccgac 74160 cgccgccagc ccgcccgagg tgagcctgcg caggaaccgc tcgcgctgct cggcggtccc 74220 gagcctgcgc gcggtccacg ccgccatgcc ctgggaggtc atgacgctgc gcagcgagcc 74280 gcacagctcc cccaccgacg cggtcagctc gccgttctcc cggctgccca gcccgaggcc 74340 gccgtgcggg gcgccgacct gggcgcacag cacccccagc ccgcccagct ccaccagcag 74400 ctcgcgcggc agctcgcccg ccaggtccca cccggcggcg cggtcgccga cgcgctcggc 74460 gaccagcccg gccagtgcga cggcgtcgct caccgccccg cctcccgcag ccgcagcacc 74520 agcgtggtca tggtgttgac ggtgcggaag ctgtccaggc ccaggtccgg cccgtcgatc 74580 acgacgtcga aggtcgactc caggtgcacc acgagctcca tcgcgaacat cgaggtgacg 74640 gtgccggacg cgaacaggtc ggtgtccggc tcccaggtct gcttggtgcg ctcggcgagg 74700 aacgcctgca cccgctcggc caccgcgtcg gcggtgagcg cgccgggctg ggaggaggtc 74760 gtcacagctg tgccttcccg tagtcgtaga agccccgccc ggacttgcgc ccgaggtgcc 74820 cgtcgcggac cttgcgcagc agcagctcgc agggcgcgga gcgggggtcg ccggtgcgct 74880 cggccagcac gcgcagcgag tcggccaggt tgtccaggcc gatcaggtcg gccgtgagca 74940 gcggtcccgt gcggtggccg aggcagtcct gcatgagggc gtccacggcc tcgacggagg 75000 ccgtgccctc ctggacgacg cggatcgcgt cgttgatcat cgggtggacg atccggctgg 75060 tcacgaagcc ggggccgtcg ccgacgacga ccggtgtgcg ggccagctcg cccagcacgc 75120 ccacgagggt ctccagcgcg tccgcgccgg tgcgcgcgcc ccggacgacc tcgaccgtgg 75180 ggatcaggta cggcgggttc atgaagtgcg tgccgatcag ccgcgccggg tcggggacgt 75240 gcccggccag ctcgtcgatc gggatcgagg aggtgttgga caccagcggc acgcgcggcc 75300 cggtgagcgc ggcggccccg gccagcacct cggccttgac cggcagctcc tcggtgaccg 75360 cctccaccac cagcgagacg tccgcgacgt cggcgagcga ggtggtggtg agcagctcgc 75420 cccgctcgcg gtcctcgggc agcgcccgca tcagcctggc catgcgcagc tgggcggcca 75480 ccgcctcccg cgcccgcccg accttggccc ggtcggtctc gaccagcacc accggcacgc 75540 cgtgcccgac ggccagggag gtgatcccca ggcccatcgt gcccgcgccg agaacggcga 75600 gcaccgtcct gccgtcctgc tctcccatcg cgctcccccg ccgcggccac cgcggccgcc 75660 gtccggtccg cgcgccgtcc cggcacgcgc attccaccct cgatcgtgtg ccgggaaagg 75720 cgcgcccgac cccctgacct gcccccctga acccccctca acggaaccgg aaatcgaatg 75780 tcccgaacgc gccgtcaaat cgtcgattga cagccgcaga actgttcata gactgtggcg 75840 gcagtaccga tctccgaatt ccacggaaga gtcctccccc atggctcagc agatcagcgc 75900 cacctcggaa atcctcgact acgtccgcgc gacctcgttg cgcgacgacg acgtgctcgc 75960 cggtctgcgg gagcggaccg cggttctccc ggccgcgtcc gcgctgcagg tggccccgga 76020 ggaggggcag ctgctcggcc tgctggtgcg cctggtcggc gcgcgctcgg tgctggaggt 76080 cggcacctac accgggtaca gcacgctgtg catggcccgc gccctcccgc ccggcggacg 76140 tgtcgtgacc tgcgacgtcg tcgcgaagtg gccggacatg ggcaggccgt tctgggagcg 76200 ggcgggcgtc gcggaccgca tcgacgtccg cgtcggcgac gcccgcgcca ccctggccgg 76260 cctgcacgcc gagcacgccg tgttcgacct ggtgttcatc gacgcgaaca agtcggatta 76320 cgtccactac tacgagcgcg cgctgacgct gctgcgcacc ggcggcctgg tcgtcgtgga 76380 caacacgctc tttttcgggc gggtcgccga tccgtccgcg accgatccgg acaccaccgc 76440 cgtgcgcgag ctgaacgcgc tgctgcacgc cgacgagcgg gtcgacatgt gcctgctgcc 76500 gatcgcggac ggaatcacgc tcgccgtgaa gcggtgaacc cgcccgaatc gcgccgaatt 76560 cccccggaga gaaaggccgc cgcagtgttc accgaggacg tggccaccga cctgcccgcc 76620 tacccgttcc tgcgggaccg gggcgactgc ccgttcgcgc cacccccgcg ctacggccaa 76680 ttacgggagg agcagcccgt caccagggtc cgcctgtggg acggcagcac cccgttcctg 76740 ctcaccggtc acgaggtgtg ccgcaccgcc ctgaccgacc cgcgcttcag ctccgacggc 76800 gccaaccgcg cccagccgcg cttcgtgaag ttcgacatcc cggacgacgt gttcaacttc 76860 ggcaagatgg acgacccgga gcacgcgagg ctgcgccgca tggtcgccgg gcacttcgcg 76920 agccgccccg tggaggcgat gcgccccgcg atcaccacga tctgccacgc ccagctgcgc 76980 cagctcgtgc aggcgggctc ccccgccgac ctggtggccc actacgcgtt cccgatcccg 77040 tccctggtga tcggcggcgt gctcggcgtg gcgggccccg gcctggacga gttcgcgcgc 77100 gactcgacgc gcgccctgga cccgtccctg tccgccgagg agatgggcgc cgccatcaac 77160 tcgatggtcg ggttcgtgga cgacctgtgc gcggccaagc gggccgcccc cggcgacgac 77220 ctgatcagcc gcctggtgct ggacttcgag cgcaccggcg agctgacccg gaagcagctc 77280 gtcgccaccg tgatggtcgt gctgctggcg ggctacgaga ccaccgcgaa catgatcgcg 77340 ctgggcacga ccgcgctcct gcgcgacccc gagcagctgg ccttcctgcg cgccgagccc 77400 gccggtttcg ccaacgccgt cgaggagctg ctgcgctggc acaccatcgt ccaggacggc 77460 accggccgcg tggccctgga cgacgtcgag ctggacggcg tgctcgttcc cgcgggctcc 77520 ggcgtgatcg tcaacctgcc cgcggccaac cgcgaccccg acgtcttccc cgatcccgac 77580 cgcctcgacg tgaccaggca caacgcccgg cggcacttcg cgttcggcta cggcgtccac 77640 cagtgcgtgg gcatgacgct ggcgcgcgtc gagctgcaga tcgcgctgga gaccctgctg 77700 tgcggcctgc cgggcctggc gcctgccacg ccgttcgagg acctggactt cgccctggag 77760 tccatgaacc tcggcctgcg ctcgctgccg gtcacgtggt gagcaccgac cgtccaccag 77820 gggagagccg atgacccgca ccacccccac ccccgacctg gccccggagt tcccgatgcc 77880 caggtcgccc gagcacccgt tcgacccgcc ccctcgactc cgcgaggcgc aggaggcggg 77940 cggcctgtcg cgggtgcgcc tgtgggacgg cagcaccccg tggctgatca ccaagcacgc 78000 ccaccagcgc gagctgctgc gcgacccccg cctcagcgcg gacttcctgc gccctggcta 78060 ccccagcccg attcgcatcg aggacaagtc gacgttcatc agcagcttcc cgctcatgga 78120 cgaccccgag cacaaccggc agcgccggat ggtcctgggc ccgttcaccg tccgcaaggt 78180 ggaacgcctg cgcccgttcg tgcagcggat cgtcgacgag aagatcgacg aactcctcgc 78240 gggccccaac ccggtcgacc tggtcaccgc gttcgcgctg cccatcccgt ccctcgcgat 78300 cagcgccgtc ctgggcctgc cctactccga ccacgaggtc ttcgagcgca acagcgccgt 78360 gctgatccgc caggacgtgc ccccgcagga acgggccgag gccagcgagg agctccagca 78420 ccacctcgac cgcgtcctgg gcgacaagat gaccgacccc gccgacgacc tcctctccga 78480 cctgggcgca cgggtgctgg caggcgagat cagcaggccg gaggcggtcg acatgaccgt 78540 cctggtgctg gcgggcgggc acgagaccac cgcgaacatg atcgcgctcg gcaccctcgc 78600 gctgctccgg caccccgacc agctggcgct gctccaggcg ggcgacgacc ccgccctcgc 78660 cgagaccgcc gtcgaggagc tgatgcgcta cctgacgatc tcgcacaccg ggatgcgccg 78720 cgtggcgacc gaggacgtgg agatcgacgg ccaggtgatc cgcgcgggcg agggcgtggt 78780 gctggcgacc tcgatcggca accgcgaccc cgacgtctac gacggcgacc cgcacgtgct 78840 ggacctgcgc aggccggtga agcagcactt cgcgttcagc ttcggcaccc accagtgcct 78900 gggccagtcg ctggcccgca tggagctgca ggtcgtcgtg aacaccctct accgccgcgt 78960 cccgaccttg cgactggcga ccgcgctgga gcgcatcccg ttcaagcacg acgggatcgt 79020 ctacggcgtc tacgagctgc ccgtcacctg gtgaccccgt cccaccagac ctcctgccac 79080 gcagacctcc cgcaagccga ccccgaaagg ccgttcccat gagcgacacc acgctgtccg 79140 tgcccgtccc cgaggaggtc ggcaagctct acgaccagat cctgaaggac gagcacacct 79200 acgagcagtt cgagaagttc aaccaccagc tgcacatcgg ctactgggac gacccgacct 79260 cggacgtgcc catgcgcgag gccgtggtgc gcctgaccga gctgatggtc gagcgcctgc 79320 gggtggacgc cgaggaccgc gtgctggacc tgggctgcgg catcggcggc ccggcgaccc 79380 agatcgtgcg caccaccggc gcacgcgtcg tcggcgtgag catcagcgag gagcaggtca 79440 agctcgccac caggctggcc accgaggcgg gcgtgggcga ccgcgccacc ttccagcgcg 79500 ccgacgccat gcggctgccg ttcgaggacg agtccttcga cgcggtgatg gccctggagt 79560 cgatcctgca catgccgtcc agggagcagg tcctgtccga ggcgcgccgg gtcctgcgcc 79620 ccggaggccg cctggtcctc accgacttct tcgaacgcgc accccgcacg ccggggatgc 79680 accccgcgat cgagggcttc tgccgaaccg cgatgacgac gatggccgac gtggacgact 79740 acgtgccgat gctgcaccgg gtgggcctgc gcgtgcggga gctgctggac atcaccgagc 79800 agaccatgga acgcacttgg cgggagaccc tggagatcgt cagccagaac gaccgcccgg 79860 tcgacttcga cctggcggag ctgttcggcg tggacgagtt cggctgcctg ctggtcgccg 79920 cagaccgccc gtgaggcccg tccccgaggc cgtgggccgc ctgtacgacg acctgctgga 79980 ggccgagctg gaggggggcg cagccgaccc gaacctgcac atcggctact gggacgcgcc 80040 ggactcgcca acgccacgcg cggaggcggt agtgcgcttc accgacgaac acgtccgccg 80100 cctgcacgtg accacgggcg accgagtgct ggacgtgggc tgcggcgtag gcggcccagc 80160 cctgcgcgcg gtggacctga ccggcgccca cgtgaccgga atcagcatca gcgccgccca 80220 gatcacccac gcgacccacc tggccaagtc cgcgggccac gcggacaaca ccaagttcct 80280 ccacgcagac gcgatggccc tcccgttccc ggactcctcg ttcgacgcgg tcatggcgat 80340 cgagtccctg atccacatgc ccgaccgcga gcgggtcctg aacgaggcaa gacgcgtact 80400 gcgcccaggc gggcgactgg tcctcaccga actgttcgaa cgcgccccaa gacccacccg 80460 cagacaccca gcgataaccg agttctgccg agcatcgatg gtgtccctgc ccaacgcaga 80520 cgactacccc gcactactac accgagcagg cctacgccta cgggaactcc tggacatcac 80580 cgaccacacc gtccaacgca acttccgcga actggccgat ctggtaggcg acgcgaaggg 80640 cctgctgttc cacccacgcg acctggtggg cgtcccagaa ttcggctgct tcctagcagt 80700 agccgaacac ccgtaaccac gcggtggcgt cccccacgga cgccaccgcc tcgcgggctg 80760 cggggcgagc gcagcgagcc cgcgcagccc cactcccgcg tccctcttct ccgtgtggcc 80820 tggcgcatgt caaattccca ctgactgcca acagatcatg tgccgtttga gcaggtcagc 80880 gacttgtcgc gcttcggtgc cttaaggccg agctgggatg ggggcactgt ttccggactg 80940 agcggggcag cttggaaggt ggagttcggt gagcagaggc agcacgtccc gtcgcacgta 81000 gaggtggttg tacacgcggt ggcgggacct gcgcagtagg ccgctatccg caagctgctc 81060 caagatcagg agtgcggcgc ggtgcgtata gccgagttcg gcggtcagca tggtgctgtt 81120 gagcagtggg gcgacgagca gcggggcggg aagcgctttg accttcctcc gcccggtgcg 81180 catcgcccag gtgggcgatc gcgcgagcct cacggatcgc ggtcacctca tgcaggctgg 81240 cgctcaacct ggaacgcgcg actgtttcgt ccagacgtgc cagggcggtg taggcgtgca 81300 acaaggtctt gctggtttcg gagcgcagtc tgagccggga ccaggacgac aactccgcga 81360 tcctcgcgga cgggggcggc ctcgtgtctt caccggtggt agttgacctg cgcggggcgg 81420 aggtgcccta ttgctgccgg gacgaggtca tcccccggag cagtttctca gcacgccgtg 81480 aatcgagatc cggggcgctg agcgcggtga acgcctcgtc cagcgagtcg cacgcgcacg 81540 tcgtcctgac atcgggccgc gcatggcccg aggtggtcag cggtgagcgg gaaggcgcgg 81600 cagggtgtgt gcgagacact ccgggactcc gtgcagaagg tcgatcaggc gaaagggttg 81660 aactgcgaat cgcaaagcgg cccggccgca aaggggtcgg gccgcctgcg acgattggtc 81720 acgctgctgc ggcgcggtcc cgccggaact gcttgccgag caggtcgatc cgccccttgt 81780 gatcttctgc cagcgcctcc agaaccgaga gcagtcgtcg ggcgtgcagt gcatggccaa 81840 taccatcgtc gcgtacccca gagggtgtcg ctcccgttca ggggcgacca tttcccacgc 81900 ccgcttggcc tccttggcgg cccggccaag atcgccgagc atcaggtagg tgcccgacaa 81960 cccgacaacc ctgcctgcca acgcggcttc cggcaccccg cgcgcctcgt cggcttccaa 82020 cgcccgaaca ccgtgccaca gcacggcccg cgcgttgccc tcgctcgtct ccagccatcc 82080 catgacaccg tgcgcttcgg ccagtgacca cgatcggctg tcgggatcgg tgttgcacaa 82140 cgccagctcc agcgctcgtt cagcagcgtt accgaccaca gcgcggcgcc gatgtccagc 82200 acttcttgcc ggtacccgcc cacgagtgcg gcggtgcgct gcacggccac gacttcccgc 82260 cgatgcacga tcagccactt gtacgccgcc aaggcgttgt cgaacagcgg cttcgccccg 82320 acctcgaagc cgtcgacgaa cacctcgcgc aaatcaccga gcagtttccc tgcggccaag 82380 gtgcgccgat gcaggtacct gcccaagcgc tccaactctt gcgggaactc ctgctgcaca 82440 gcccatcgca gcagtgcctg ggcttggtct gtctcctgcg cgcgatggcg accggccagc 82500 cggtaacgcg aggaggtgaa ctcggggtgc gtgatgttcg ggtgaagttc agtccacgaa 82560 ggctgcgtca gcaccagcac gccctggttc acccagtccc gcgcgtgttg ggcggtctcc 82620 tcgacggtga ttcccagcat cgcggccaac gacgaggtcg agaccacggg gtccggcagc 82680 aggtccagca atctcagctc ttgcggaatg ggcacaagag tgttgatcat cgatgcccct 82740 cccggaggac ggcgatgatt ggagtggcga acagaagggg aaacgccagt tcgccgggtt 82800 ccggcggtcc acgcgccttc ggccggccac ttggactccg acgggcagaa gttcaccggc 82860 aaggactctg gtgacggtgg agcggtgcac gcccatcgct tcggccaagg cgtagtcgct 82920 gtggtaacca gcgaactgag ctagctttcg catcttgtcg ccgcgcaccc cgacgacctt 82980 cttgatcttt tcggtctcgc tgtcgttgtc gtcgacatgt ccgccgtccg gcgctgacac 83040 cgttctcctt gagatcgccg agctgaatgg gggatgcttc gacgtaaggc gttgcgtatg 83100 cgcaacaggt caggcggcgt cgagtctccc cattaccgag gtttcgcttg atcgccgacg 83160 gggcccgcct cgaagaagtc caatcgagct ggcatcccct tcgattgatc aatagcgcga 83220 cgggtgtcgc tcgacatcgc cccaccgcct gctcctgacg tgccacgagc agggaggagc 83280 gacctccctc gggactgcac cgaccgttcc tccctgtccg ccgattcagt tgcattccgc 83340 cacgctaggt gccggatgcg ggccgaaggg acaacgaagg gacaagtcga acagcccagg 83400 tgcgaggtat cttgaaatag cccgaatcct ccgtcgcgaa gcaggtcgcc atgcccactg 83460 acgaacagtc cgagggtgtc ggagagcgca tagccgtcca acgcaaactg gctggcttga 83520 ctcagcaagc tctggcgaag cgcgcacacg tcagcctcag cctcatcaaa ggggtggaac 83580 agggaaggat tcccgcctct cccgcgctcg tgtcccaggt ctcgcgggcg ctcaaggtcg 83640 aggcgacgat cttgctgggg cagccgtacc gccccgagga tcggagcagt cttcgcgttc 83700 actccgtcat ccccggtctg cgccgagcct tggcggccta ccggttgccc gctgatgagg 83760 gcatcagccc tcgcgggtac gacgagctgg ccgccggtgt agccgccgcg tcgaagatgc 83820 gccacgccgc gacgttggac gtcctggggg ctgaactccc cggcctgctc gacgagatcc 83880 gctcggccat cgacgaggct cggggagttg agcggcagcg cctgttcagc ttgctggcag 83940 aggcatacgc agccgctggt caagtcgcgt ggaagctggg ttacgcggac ctgtcctccc 84000 tggcgacgga gcgcgtggag tgggcggcca aagagtccgg cgatccgctc gcgatgggcg 84060 cagcggactt ctacatcgcc ggtgagctga tcgcagcagc ggagtggcgc ggcgccctct 84120 cctacctcga cggctcccgt cgccgcctgg agcacgtggt gcgcaaggac gacgaggccg 84180 ccttgtcgat ctacggagtc ctgcacctga agtcggggct cgcggcggca cgggccggga 84240 aagccgacga atccgacgcg cacctcgctg aagcccgtgg catcgcggaa agggtgccgc 84300 tgggcagtga ccactaccgg ctcgcgttcg accgggactc ggtcaacatc tggaccgtgg 84360 ggctggcagt ggagcgcatg gacggcacgg aagccgtcaa acgagcccac gggatgcgct 84420 tcagcaagac caccccgcgt gaacgcgtgg gccaccacta catcgatctg gcgcgcggct 84480 accagctgca cggagaccgt gaccgcgccc tgcacaccct tcagatcgcc aggcgaacct 84540 caccgcagca ggtgcgctac cacccgcagg tcagggaaac ccttctcacg ctcgcggaac 84600 aggaccgcag gcgctcggat tccctggcag ggctcgcgcg ctggatcggt atgccggtgt 84660 gacaggacgg cgagctgacg tcgctgttga ggggcagccc cccatcggcc gcccctcaac 84720 agcaggtgcc ggtacgtccc tcacagcgcg acgctgacga tcaggctggc gaacatggcc 84780 acggccagcg cgatcatctg cttgggcgcg ccgccgaaga agagggaccc cacccaccgc 84840 agtggtaaac cggcaccgag caccaacggc caccggccgg cagagcccgt ccccctcttt 84900 tttggaggtc tgccccgccg gcgaggcgtg cccttcagct ctcaagctct ccactctcga 84960 tcttgtggtc cgaacacccc ccgcaccccc actacgatcc ccccatgggg gctctgatca 85020 tcgcggtagt gctgctgctc gtcttcctcg tgcaactcaa gcgggaaccc agacgactgg 85080 gcaacggcgt ctacctgctg atgagcctgg cgttcttcgc cctctggctg ctcaccctcg 85140 ccacccccca gaccaggacg ctggtggtag gcgcggtagt cctgatcgcc ccggtattcg 85200 tcaccgtgat cgccctgttc ctcatcgcca acggcgtcac cctgctgcgc cgcgagggcg 85260 tcaaaccagg caacgccctc tccttcggcg caggcaccgc catcctgtgc gtcgtaggcg 85320 gcctgctcct ggtcctgctc tccgccctgc gcgaaggctc ccccgacccc tgggtgctgg 85380 cagcagccgg ttccctggtc ctcctggccg gctacctggg cttcgccttc accctcttcc 85440 tgctctactc cgtgctctac ggccgagtcc gcaagcgcac cggccacacc gcgatcatcg 85500 tcctgggcgc gggcgtcccc ggcggccgag tgaccccgct cctggcaggc cgcctggacc 85560 gcgccctgaa gctctaccgc cgcgccgcag ccaagggcgc ttcccccgtg gtagtcgcct 85620 ctggcggcca aggcccagac gaaccagcct ccgaagccga ggtcatggcc aactacctcc 85680 gcgaacgcgg catcccggac gaggccctcc tggaagagcg cgagtccacc tcgacctggg 85740 agaacctccg cctctcctcc gccctgctcg ccgaacgcgg cgtgaccggc agactcctgg 85800 tcgtcaccag cagctaccac gtcccccgag ccgcgatcct ctcccgccgc gcaggcctga 85860 aggcagacgt ccgcggcggc cgaaccgcct ggtacttcgt gccgaacgcc ttcctccgcg 85920 agttcgccgc cctcctggtc cagtaccgca ccctcaacgc cctggcagcc tgcaccgcac 85980 tctccgtctt cccgctcctg gcctacggcg tctgaaaagc acgacccggc cgaccggaca 86040 ccgcgtcaca gatccagcgg cgccgacccg aaggccacgt tgaaccggtc gcaccacacc 86100 acgacgctgc gcagccccga caggtccacg tcctccggaa tcaggtagtt ctggttgccg 86160 tcggtggcct tcatgggacc gagcggcagg tagcgcccat cgtcgtactt gccccactcc 86220 ccacccgcgg tcgcgtcgga gagccagatg tgcaggtcgg gcccgtccga ggtggagaac 86280 ccatccagcc gcagcacgcg cgcggccccg ctgcgcagca cggtggcggt gccccgcgtc 86340 tcgtgctcct gggtgacgaa cccacccgtt gccagcaccg tcggctggtc ggcggtcgcc 86400 gacgacgtcc caccgggcgt cgtggcaccg ctgcccgccg ccgccccggt gctcgacgcc 86460 ccagccccgg tgctcacccc cgcaccggtc gagacgctga actcggcggg cagcgcctcg 86520 tccgcctcgc tgcgcgtcca caaccgccac ggctggaaca cccacagccc gacgaccgca 86580 gccaccacca caacccccga caccgcccaa accgctctcc tgcgcaccga accgcgcacc 86640 acgtcccctc ccgttctccg cagacgacct gccaccatgc cacgggtcgc gcccgatgac 86700 cacgaccacc gcgccacacc cgccccacgc agcgactagg ctgcccaccg gggtcgccag 86760 ccgatcccga gcgggttgag caggcagccc accgcagttc gcgctagtgg gatggaggga 86820 gcgggccggt gtccgagctg gatgcagccg cggtggtcac ggtgggttcc gacgtggtgc 86880 gcggggtgcc cgtgctgcgc gtcgccgggg agatcgacac caacgtcgcc gacgaggtcc 86940 gccgggcgct gctgccctgg ctggacgggt tgcgcgggcc aggggtgctc gacctgaccg 87000 gggtgaggtt catggcctcc accgggttgt cgctgctgat cgaggccgcc cggcgcaggc 87060 cggcgaagct ggtgctggcc accgcccagc gcggcgtgct ccggccgctg cagctgaccg 87120 ggatgagcgc gctgctcccg acgcacccca ccgtggacct ggccgtggac gcccagctcg 87180 gggccgccct ggccgggatg cccagcacgg cctgaccacc ctcggtccac gggcggcctg 87240 cccgcggacc acccgcacgg cgccctgggg ggacgagatc acagctggtg gaagacgcga 87300 tcctggtccg cgcgccgcga cgccggtggg cgcgggcgct cccgccacgg cggcggaccc 87360 gcccccggtc cccaccacgg ctccggcacc ggccccgaca ccgacaccga ccccagcccc 87420 gcccctgggc acgaccacac caccaacccc ggtcctgggc gcaggtgtcg ccaccgccac 87480 cgccctgacg ctggcactcg ccggggccgc agccccagcc gacaacagcg cgggaaaggc 87540 ggccatcatg gacgaggtgg acgccccaac caccccaccc accccggccg cgctggacct 87600 cacgccccgc ccacccctgg ccgaggtgcg ccgctggacc ggcgcgctgc tgatcgacgc 87660 cgacgaggaa gcagcggacg acgtgctgct cgtggtcaac gagctggtcg ccaacgccta 87720 cgaccacacc acctccccac tcgccctgcg cctcaccacc acccccgagc acgtgcgcgt 87780 ggaggtcgag gacggctccc ccgacccacc acgcccggac ctcaccgcgg gcctgcgcca 87840 gatcggcacg cgcggacgcg gcctgctgct gatccgccag ctgaccgatc gctggggcag 87900 cacgccccac cccggcggca agaccgtgtg ggcggagctg ccgaacgtcc cggcgacctg 87960 agcccgacgc cccaccaacg aggccacggc ggatctcacg ggaagagcgc ggcggggcac 88020 tccgggcgcg ttggacgccg gcgcactccc cggtgagggg tcgggcggcg gagtggatga 88080 gcgtggcggc gagcagggcc ggtccggcgg acgagacggc catcagcagc ccgccgaccg 88140 gggccgcgag gcgtcgggcg cgggcgccga gcctgcccgg caccgggccg accacggagc 88200 tgacgccgag gacggcggtg caggcgccga gcgcgcgcct gcgggccgcg ccctcgaagc 88260 gcacctggac ggcggtcagc gccccggaga ccatgagcgc cgcgcccgcg ccctggacca 88320 cccgcgcggc caccagcgcc gggccggtgg gggtgaggcc gcaggccggg gaggcggcgg 88380 tgaaggtggc gggcccgacg aggtgggccc agcggcggcc ccggatctcg ccgaggtggg 88440 ccccggtgat cagcaggacg gcgagctgcg gcaggacacc gacacgggca cgaccgcgtc 88500 gatgtgcgtc gcggcggcgc agggcgcgga gacgggcgcg ggcgagcgct gagggcccgc 88560 ccggcgccac tcccccgtca cacctcccgc cgcagcacat cctcctccgt ctcccgccgc 88620 accagcaccc gcgccactcc gtcgcgcacg cccaccacag gcggcctgcc cacggcgttg 88680 tagttcgacg ccagcgcgtg gtggtaggcg cccgtcaccg gcaccgccag caggtccccc 88740 gcgcgcacgt ccgcgggcag cggcacgtcc tcggcgagca cgtcacccgc ctcgcagtgc 88800 ctgcccacca ccgtcaccgg cgcgcgccgc ccgccccggc cgaccaggcg caccgcgtac 88860 cggctcccgt acagcgcggg cctggggttg tcgctcatgc ccccgtccac ggccacgaac 88920 acccgcctca ccccgcgctt gacggcagcc acccggtaca gcgtcacacc agcgcccgcg 88980 acgaccgacc gccccggctc gatcagcagc ctcggcaccg gcacgcgccg cagcgcgcac 89040 tcgtggctca gcgccacccg cacccggtgc gcgaacccgc caaggtcgaa ctccccctcc 89100 cccggcaggt agggcaccgc gaacccgccg ccgaggtcca gctgctcgat ccgcaccccg 89160 cacgaggcga tcagcccgac catccgccgc gccgcctcct cgtacaccgc gacgtgtcgc 89220 acctgcgacc cgacgtggca gtgcagcccc accagcctca gcgacggctg ctcgaccacc 89280 cgcagcaccg cctccagcgc gtccccaccc gccagggaga agccgaactt ctggtcctcc 89340 accccggtcg ccaccgcccg gtgggtgcgc gggtcgacgc cgggggtgac ccggaccagc 89400 acgtcctgcg gccccctggc cagcgcgccc agctgctcga tctcgtcgaa cgagtccacc 89460 accacccgcc cgaccccgta cccgagggcg gccttgaggt cctcgggcgt cttgacgttg 89520 ccgtgcagca gaatccgctc cgccgggaac ccgaccgacc gcgcgatcgc cagctccccc 89580 gccgagcaca cgtccagcga cagcccctcg tccgccaccc accggtacac ctcgcggcac 89640 ggcagcgcct tgcccgcgaa caccacctca gcctccggca gcacctcccg gaacccgcgc 89700 gcccgcgccc ggaccgtgcc ctcgtcgagc acctggcagg gcgtgccgaa ccgggcggcg 89760 agctcggtcg cgggcacccc gccgagcagc agctcccccc gctccagccg ggtccccagg 89820 ggccacagcc ccgcctccag ggccggttcg ccggtcatgc cgacgctggg cagcaactcc 89880 gcgagtgtca tgcccgccag cacacgcccg aaccggccgg ggcgacagcg gcgcgaacgc 89940 gtccctgacg gcgtgccggg cgggattgac gccgccctga cccgaccgcc ccagcccgct 90000 ctcgaacccg gcggaagcac ccccgaaacg cgccggaaac ccgcccgcgc attcccccga 90060 acgcctacct cacggcgatt ttgatgcttt ttttacgccg ggacgccgcg atattcactc 90120 ctccgagccg cgcggggacg ttgacttctc atgcccgacg acgtgatcga ggagagaccc 90180 cgaatgtccg aaacaccggt tttcgccgtt ccacccaggg tggaaagccc ggtacgcccg 90240 gccgcgcccg ccaaccgggt ggggcgctgg ctgctggagc accgggtgca accggcggga 90300 cccgcgggca ccgaccagca cagcacgccc caggcgtggt ggaaggtcat gtgcctgacc 90360 ggcgtcgact acttctcgac cctgtcctac ctgccgggca tcgcggcgct ggcggccggg 90420 gcggtctcgc cgctggcgac gctgctgatc gtcgcgctga ccctgttcgg gatgctgccg 90480 atgtaccgcc gggtggcgca cgagtcgccg cacgggcagg gctcggtggc gatgctggag 90540 gacctgctgc cgttctggcg cggcaagctg ttcgtgctgg tgctgctggg tttcgtggcc 90600 acctcgtgga tcatcacgat caccctgtcg gcggccgacg cgtcggtgca cgcgctggag 90660 aacccgcacg cgcccgcgtt cctgcacggg cacgaggtgc tggtcaccgt ggtgctgctg 90720 ctcgtgctgg gcggggtgtt cctgctgggc ttcaccgagg cggtcagcgt ggccatcccg 90780 ctggtcgcgg tgttcctgct gctcaacgcg gtggtcgtgg tcgccggcgt gctggaggtg 90840 atcgcgaacc cggacgtgct ggacggctgg ttcgcggcgc tgacctccac cggcggcggc 90900 ggggtgctgg gcgtggtcgg cccggccctg ctggcgttcc cgctgctcgt gctcggcctg 90960 tccgggttcg agaccggggt gagcatgatg ccgctggtcg aggcgaaggg cgccgacgac 91020 gccgaacgcc tggcgaaccg cgtccgcaac acccgcaagc tgctcaccac cgccgcgctg 91080 atcatgtcgg tgtacctggt ggccaccagc ttcgtgacca ccctgctcgt gccggtcgag 91140 cagttccgcc ccggcggcga ggccaacggg cgggcgctgg cctacctggc gcacgagctg 91200 ctcggcgagt gggtcggcac ggcctacgac atcagcagcg tgctgatcct gtggttcgcc 91260 ggcgcgtccg cgatggccgg gctgatcaac atcgtgccgc gctacctgcc cgcgtacggc 91320 atggccccgg actggacgcg cgccgtccga ccggtcgtgc tggtctacac ggtgatctgc 91380 gtcggcatca cggtgatctt ccaggccgac gtggacgccc aggccggcgc gtacgcgacc 91440 ggcatcctgg cgatgatggt gtcggcgtcg gtggcggtga ccctgtcggt ggcgcgcgcc 91500 gggcggcggg gcgcggcctc ggcgttcgcg gtgctgaccc tgatcctggt gtacgcgctg 91560 gtggagaacg tgatcgagaa gccggacggc atcacgatct cgttcgtgtt catcgtcggc 91620 atcatcgccg tctcgctggt ctcgcggatc tcgcgcacca ccgagctgcg cgtggagcac 91680 atcgagttcg acgagaccgc gcgcaggctc atcaccgact cgatcgccca cgacggcgcg 91740 ctgaccgtga tcgcgaaccg caggcaggcc ggtgacgtgg ccgagtacgc ggacaaggag 91800 gccgagcagc gcggggtgaa cccggtgccg gggcaggcgg acgtgctgtt cctggagatc 91860 gacgtggtgg acccgtcgga cttcagcgac gtgctggagg tgcgcggcgt ggaggtgggc 91920 ggccaccggg tgctgcgcgc ggacagcccg gcggcgccga acgcgatcgc cgcgatactg 91980 ctggcgctgc gcgactgcac cggggtgcgc ccgcactgcc acttcgcgtg gagcgagggc 92040 agcccgctgg ggcacctgtt ccgctacctg ctggtggggc gcggcgacac ggcgccggtg 92100 gtgcgggaga tcatccgggc gcacgagtcc gacccggagc gcaggccggg catccacgtg 92160 ggggcctgag cgggcacgac ggcggggtgg tccaggcagg cagcgtggtc caggccagtg 92220 gggtgctccc ggccagcaac gtgctcccgg ccggtggggg ctccagggcg ctgcggcggc 92280 cgatcgcgcg ggcgtggtcg gcgaaccgct cgcagtgctc gctgagcagg gccgcgtcga 92340 cggcggcgtc ctcaacgccg cgcagcacgg ccagcacgga ccggggcact caccaaacgc 92400 gaagagccac accaactggg cttcggcgtg ggaggcgcgg tgcagcggtt tgtggtctcg 92460 cgctgccgcg cggcgcgggg gactgggtcg cgagcagcac ctggccgccg tgccgcgcgg 92520 cgccccgcgc caggtcgcac acggcggcca ggtccggcac cggcgcgtcc cgccggtcgt 92580 ggaacacgtc gcgcatcgcg ctctccctcg gaggatcgga tcggaaggcc ctgatcccaa 92640 ccgggcgcgc accccggcga caagccctca cccgccgaac ttgcgctttc cttccgcccc 92700 gacccccgcc cgtcacaaac ccccgtcacc ccgccgtcac tttttgtgat gacgatcagg 92760 aaacagtagt agcccattcg tgacctgcac tgacgcgcag atcaccccac ccgtcaacga 92820 aacgtaaaac cgcctggtca ccccgtcaaa gacccgtcag caccccgctc acggcgtttt 92880 ccccgttgca cccttttggc gtcgcggtcc ccacgaacgg gggccgctcg gagtcgggaa 92940 gggagcacgc tcatggccga cctggcctac gcgtcgctgc tcatcgctgt gttcggactg 93000 ctcgtcctcg gcattcgcgg actggggcgg ctctgatggg cggcacggga gtcgtggcca 93060 acgccgtcgg tggcgtgctg gccctgctgc tcatcgggta cctgttcgtc gcgctgatca 93120 ggccggagaa gttctgatgt cctcgaccac ggcgggcctg ctccaggtcg ccctgctcat 93180 cgccgcgctg gccgccgcct accggccgtt cggcgactac atggcccgcg tctacaccga 93240 cgccaagcac accaaggtcg agcgcctgct ctaccgcgca gcccgcgtcg accccgactc 93300 gcagcagcgc tggggcacct acgcgcaggg cgtgctcggc ttctccctcg tcggcgtggc 93360 cctgctgtac ctgatgcagc gagtgcagcc ctggctgccg ttcgaccacg accggggcgc 93420 ggtctcgccc ggcatggcgt tcaacaccgc cgcctcgttc gtggccaaca cgaactggca 93480 gtcctacgtc ccggagaccg tcctcggcca caccgtgcag atggccgggc tgaccgtgca 93540 gaacttcgtc tccggcgcgg tcggcatggc cgtcgccgtg gcgctggtgc gcggcttcac 93600 ccgcgagggc tccgaccggc tcggcaactt ctgggtcgac ctcaccaggg gcaccctgcg 93660 cgtcctgctg cccgtgtcgt tcgtgttcgc catcgtgctg gtcgcgaccg gcgtcgtgat 93720 gagtctgaag gcgggcgtgg acgtggacgg ccagcaggtc gccatcgccc cggccgcctc 93780 gcaggaggcc atcaaggagc tcggcaccaa cggcggcggc atcttcaacg ccaactccgc 93840 ccacccgttc gagaacccca acggctggtc gaacctggtc gagatcttcc tgatcctgct 93900 gatcccggtc tcgctcaccc gcaccttcgg caccctggtc ggcaaccgca agcagggcta 93960 cgtgctgctc agcgtcatgg gcgtgctgtg gaccgcgatg ctcgcggtca tctgggcggc 94020 cgaggcgcac ggcctgcgcc ccctggaggg caaggagctg cggttcggcg tccccggcag 94080 cgccctgttc gccaacacca ccaccgccac ctccaccggc gcggtcaacg ccatgcacga 94140 cagcctcacc ggcctgggcg gcggcgcgac gctgctgaac atgctgttcg gcgagatgac 94200 gccgggcggc gtcggcaccg gcctgtacag catcctggtg atggcgatca tcgcgatgtt 94260 cctggccggt ctgatggtcg ggcgcacccc ggagtacctg ggcaagaagc tgggccgccg 94320 cgaggtgacc tgcgccgcgc tgtccatcct ggcgatgccc gcgctggtgc tggtcggcgc 94380 cgggatctcg gcggtgctgc cgtcgacggc cgggtacctg aacaaccccg gcgagcacgg 94440 cctgtccgag atcctctacg cctacgcgtc ggcctcgaac aacaacggca gcgcgttcgc 94500 gggcatcacc gtgaccagcg actggttcca gtcctcgctc ggcgtctgca tgttgctcgg 94560 ccggttcgtc ccgatcatcg cggtgctgtg cctggccggt tcgctcgccc ggcagaagcg 94620 cgccccgcgg accgcgggca cgctgcccac ggacagcccg ctgttcgcct cgctgctggt 94680 cggcgcgatc gtgctcgtcg ccgccctcac cttcgtcccc gccctcgccc tcggccccat 94740 cgcggaggca ctgctgtgac caccaccgac acccgccagc ccgcccccga ggacacgggc 94800 gcgcggcccc cggccaagcc cgtcccgtcg ggcgtgttcg ccccgcgcca gctgctcacg 94860 tccctgccgg acgcgctgcg caagctccac ccccgccacc agctgcgcaa ccccgtgatg 94920 ttcgtggtgt gggcgggctc ggtcctggtc acggtcttcg ccgtcaccga cccgaacccg 94980 ttcacgatcg cggtcgcgct gtggctgtgg ttcaccgccc tgttcgccaa cctcgccgag 95040 gccgtcgccg aggggcgcgg caaggcgcag gccgagtcgc tgcgcaggac taagaccgac 95100 gcgctggccc gcctgaccga cggccgcacc gtgcccggca ccgagctgaa ggtcggcgac 95160 ctggtcgtgg tcgaggccgg tgaggtgatc cccggcgacg gcgacgtggt cgagggcatc 95220 gccaccgtcg acgagtcggc gatcaccggc gagtccgcgc ccgtggtgcg cgagtccggc 95280 ggcgaccggt gcgcggtcac cggcggcacc accgtgctgt cggaccggat cgtcgtgcgc 95340 gtcaccagca agccgggcga gacgttcgtg gaccggatga tcgcgctggt cgagggcgcg 95400 cagcggcaga agacgccgaa cgagatcgcg ctgacgatcc tgctgtccac gctcacgatc 95460 atcttcctgc tcgcggtgct cgcgctccag ccgttcgcgg tgtactccgg cggcgagcag 95520 tcggtgatcg tgctgaccgc gctgctggtg tgcctgatcc ccaccacgat cggcgcgctg 95580 ctgtccgcga tcggcatcgc gggcatggac cgcctggtgc agcgcaacgt gctggccacc 95640 tcgggccgcg ccgtcgaggc ggccggtgac gtggacacgc tgctgctgga caagaccggc 95700 accatcacct ggggcaaccg ccgcgccacc gagctgatcc ccgcgcccgg cgtcacgctg 95760 gacgagctgg tggacgccgc ccggttgtcg tcgctggccg acggcacccc cgagggccgc 95820 agcgtggtcg agctgtgcgc gaccgggcac ggccgctccc ccgagcccac cgacgcggag 95880 aagaccggcg agttcgtgcc gttcaccgcc cagacccgga tgagcggcat cgacctggac 95940 ggccgcagcg tccgcaaggg cgccgcgacc gcgttcaccc tcaccgactc ggtcaagtcc 96000 acggtggacg agatcagcgg cgacggcggc accccgctgg tggtcgccga cggcgagcgg 96060 gtgctcggcg tgatccggct gtccgacgtg gtcaagcccg gcatgaagga gcggttcgcc 96120 gagctgcgcg ccatgggcat ccgcacggtc atggtcaccg gcgacaaccc gctgaccgcc 96180 agggcgatcg cggccgaggc gggggtcgac gactacctcg ccgaggccaa gcccgaggac 96240 aagatggccc tgatccgcaa ggagcaggag ggcggcaagc tggtcgcgat gaccggcgac 96300 ggcaccaacg acgcgccggc gctggcccag tccgacgtgg gcgtggccat gaacaccggc 96360 acctcggccg ccaaggaggc cgggaacatg gtggacctgg actccgaccc caccaagctc 96420 atcgagatcg tggagatcgg caagcagctg ctgatcacgc ggggcgcgct gacgacgttc 96480 tcggtcgcca acgacctggc gaagtacttc gcgatcctgc ccgccatgtt cgccgcgatc 96540 cacccgcagc tggacaagct caacgtcatg ggcctggcca cgccgcagtc ggcgatcctg 96600 tcggcggtca tcttcaacgc gctgatcatc gtggtgctga tcccgctggc gctgcgcggc 96660 gtgcgctaca agccctccag cgcgagctcg ctgctgcggc gcaacctgct ggtgtacggc 96720 gtcggcggca tcatcacgcc gttcgtcggc atctggctca tcgacctgct cgtccgcctc 96780 atccccggaa tcgggtgaac tccgtgaacg cgttcgtgaa gcaggccctg gccggtctgc 96840 gcgtcctgct ggtgctgacc gtcatcaccg gcgtgctcta ccccgccgcc gtctggctcg 96900 tctcgcgggt gcccggcctg cacgccaacg ccgaggccac cggcaccgag ctggtcgtgg 96960 cgccgcgcga gggcgacggc tggttccagc cgcgcccgtc gatggcgacg ctgcccgcgt 97020 cgggcgggtc caacaagggc gagcgcaacg ccgactacga cgcggtgatc gccgagcgcc 97080 gcaccgagat cgcccggcgc gagggcgttg cggaggacgc cgtgccgcag gacgcggtga 97140 ccgcctcggc ctccgggctg gacccgctga tcagcgccga gtacgcggcg atccaggtgc 97200 cgcgcgtggc gcgggagcgc ggggtgtcgg aggacgccgt gcgggcgctg gtcgccgagg 97260 cgtcggtggg ccgctcgctc gggttcgtgg gcgagccggg cgtcaacgtc accgccctca 97320 accgggccgt cgacgcggcg gagtgagacc gaccgggggc cgtcctcgcg gcggcccccg 97380 gtcttcccca tttctctgat ctcgggagcg ggcgggaccg tggacaagcg caagcgcggc 97440 gaactgcgca tctacctggg cgcggcgccg ggcgtcggca agaccttcgc gatgctcggc 97500 gaggcgcacc gccgccgggg gcgcggcgcg gacgtcgtcg tcgccctggt cgagacgcac 97560 ggccgcgagc gcaccgccac catggtcgac ggcctggagg tgctgccccg caaggaggtc 97620 cagcaccggg ggaccacgat caccgagatg gacgtggacg cggtgctggc ccgcgcgccc 97680 gagatcgccg tggtggacga gctggcgcac accaacgccc ccggctcccg caacgccaag 97740 cgctggcagg acgtcgagga gctgctggac gccggcatcg acgtgctgtc cacgctcaac 97800 atccagcacc tggagtcgct caacgacgtg gtgcgccgca tcacccgcgt cgagcagcgc 97860 gagaccatcc ccgacgaggt ggtgcgccgc gccgagcagg tggagctggt cgacctgacc 97920 ccggaggcgc tgcgccgccg cctggcgcac ggcaacgtct acgccgcgca caagatcgac 97980 gccgcgctgg gcaactactt ccgggtcggg aacctgaccg cgctgcgcga gctggcgctg 98040 ctgtgggtgg ccgaccaggt ggacgtggcg ctccagcggt accgcaccga gcagcgcatc 98100 accgacacct gggaggcccg cgagcgggtc gtggtcgcgg tgaccggcgg cgcggagagc 98160 gagaccctga tccgcagggc ccgccgcatc gccgcgcgcg ccggggcgga gctgctggtg 98220 gtgcacacca tgcgcggcga cggcctcgcg ggttccgcgc cggagtcgat ccggacccgc 98280 gtcgggctca ggtgctcgac ggtgctcttc aacgtggtct cctcgtaacg ggacgtgcgg 98340 aacaccccgc agcgcccagg gtcgggcggc tgacgggatt cgcctgagtc taggcgaggc 98400 cgcccccggc cggggtggca ccccgcgacc gggtggttca cgtgcgggtg cgcgcgcccg 98460 gcgcggcgcg cgcggtgcga gaggtgggcc gtccggcggc gcgcggtttt ccgacatggc 98520 gcgcgcacga aatagttttc ggcgggtcgg gcgccgtcga atcgactcgg ggtcgggttt 98580 tccgcgccac cccggaagcg gacgaaccgg gcgggcgaac cgggcgggcg gtgcgcggac 98640 aacgggcgcg accgccgcgg tgcgccggtt tgggcagcct ttaccgccct ccaggtcacc 98700 cattccgccg ttgcggggaa catccgcgta ccagtggccc ccggcggaca cgcggcccag 98760 cacccgctag gccgttcgca ggacgtcgtg gtgcaccggg agcgtgaaac cgaacgtaac 98820 cggacagcgg cgggctcaag tggggtaaca ctggcgccgc agcgcactct tacccacagc 98880 gacgaacgcg gcggaacgct accctttaca ggtgaagtga ggccattcgg agcaccggtg 98940 cgcagaaaac tttcacgccc ggagatgact ccactcgccg tagtccatta gtgtgggatt 99000 ccggtaccgt tgcgccgcag gccgcaagaa ggcggccagg aaagacgatt aactcatccg 99060 ggcgccccgc cgtcgtgcac gtgaacgcga cgggcgaccg ggaacggaac gagcgagaca 99120 tgtcatcgcg ctctttacca cctaccagaa aaggtgccga tgaccccgat gaagaccatt 99180 ccgccgattc ccccgaacac gcgggcgtcc gcccgtccgc cgctcgggca accgcacgac 99240 gggcttgcgc gccacccgga accccagggc ccggccgcga ggcgatgttg acccgacccc 99300 cggccaccag ccgggacagg ccgaccaccg ccacgcgcgg aacccacggc gaaccgcctc 99360 tcgccgtgat ccaccacgga ccgttgggga gttccatgga gacccgtcaa cttctggcgt 99420 tcaccacagt ggtgcagacc ggcagcttca cgaaggccgc cgccacgctg aactgctctc 99480 agcccacgat caccaccagg atcaaggcgc tggaggagac cctcggcgtc gccctgttcc 99540 gcaggttgcc gcgcggcatc cagatgacct ccgccggggt cgagctgctg ccgttcgcgc 99600 gcaacatcat cacgctcacc gacaaggccc gcaaggcgat caccatgaac ggggagccgc 99660 acgggcacct cgtgataggc agcgcccaga gcctcaccga ctaccggctc ttacccctga 99720 tcgagtacat gtgctggcgc tacccgagcg tccagatctc gctgcactcg cgaacaaccc 99780 ggtcgaacct ggccgccgtg cgcgagggca ggttggactg cgcgttcttc atcggcccgg 99840 tcgagcagcg ggacggtctg gagacgacgg tgctgtgccc cgaaccgctg gtgatggtcg 99900 cgggccccgg ccacgcgctg gcgcggtcgg gcgcggtcac cgaggcggac ctgcggggca 99960 gcacgctggt cagggccgag aacggggcga gctaccacga gcagttcgag cgggcgctcg 100020 ggctgcacga ggccgagtcg cgatcgccgg tgctggccct ggactcggtc gacgcggcca 100080 agcgggcggt cgcctcgggg ctgggcatct cgctggtgcc ggaggtcacg gtcgccgcgg 100140 agctggcgga cggcaggctc agccgcatcg gctggacccc gccgttccgg gtgttcaccc 100200 agttcgcgtg gcgccaggac aactcggcga acccgtcggt gaccgcgctg gtctcggcgg 100260 cggcgcaggt ggtgagcgag caggtggccg cgacacccgc gtagggcgtc gacgtgcagg 100320 gtcgtggatg cggagcggcc ccctcgtgct gcgcagaggg ggccgagacc gtcggggcga 100380 caggatttga acctgcgacc ccccgctccc aaagcgggtg cgctaccaaa ctgcgccacg 100440 ccccggtcac caggagctta gcgcgacgcg ctaagctgtt ttcagcaccc acccggtggg 100500 cgctgcgcgg gtgtagctca atggtagagc cccagccttc caagctggtc atgcgggttc 100560 gattcccgtc acccgctcca ccagatcc 100588 <210> 18 <211> 27 <212> DNA <213> Artificial <220> <223> Primer <220> <221> misc_feature <222> (3)..(3) <223> s is g or c <220> <221> misc_feature <222> (10)..(10) <223> n is g, a, t or c <220> <221> misc_feature <222> (11)..(11) <223> y is c or t <220> <221> misc_feature <222> (13)..(13) <223> n is g, a, t or c <220> <221> misc_feature <222> (15)..(15) <223> s is g or c <220> <221> misc_feature <222> (22)..(22) <223> n is g, a, t or c <220> <221> misc_feature <222> (24)..(24) <223> y is c or t <400> 18 ccscgggcgn ycngsttcga cngygag 27 <210> 19 <211> 28 <212> DNA <213> Artificial <220> <223> Primer <220> <221> misc_feature <222> (5)..(5) <223> n is a, c, g or t <220> <221> misc_feature <222> (10)..(11) <223> n is a, c, g or t <400> 19 cgtcncggan nccggagcac atgccctg 28 <210> 20 <211> 1421 <212> DNA <213> Actinosynnema pretiosum <400> 20 atatactagt cacgtcaccg gcgcggtgtc cgcggacttc gtcaacgacc acgcgttccg 60 ggccgcctgg cgcggcgacg gggcgccggt ggacccggtg gtcggcgacg tggaggacac 120 cgccaggggg ttcctcgtca cccggtcggg gatctcgatc ggggtgcgcg cggcctgggc 180 ctcgcaccag gcgctggaca ccacggtcgt gcgcgtggag ggcagcggcg gcacggcgga 240 gctgcgctgc accttcggct tcagcccgaa ccgcgagggc ccgtcgcggc tcctgctcac 300 caccgacggc cgcaccaccc cggtcgagct gcccgccgag ccggtgggcg ccgagtacga 360 cgcccagctc gcgagcctgc ccacccgcct ggccgacccc gccacgcgcg gcgaggcggc 420 gtccggggcg cgctggatcg cgggcgcgat cgaacgggtc taccgcgccg ccgacaccgt 480 gcggtgcgcc gaacgacgac acgcgccggt cgacctcgtc ccgacgggag ccccgtgatg 540 accaccggac agaccaaccc ccgagtcgtg cgggcccgag ccggggacga gcgggccgcg 600 accgcggttc cggcgcccgc ggccccgcgc cccctcgccc cgccgacccc cgcgccccac 660 cggcacgtcc ccggcgcgac ctacgaccgg gccgtgctgt tcgacctcga cggggtgctg 720 gtcaacagct tcgccgtcat gcggcaggcg ttcgagatcg cctacgccga ggtcgtcggc 780 gacgggcccg cgccgttcga ggagtacaac cggcacctgg ggcggtactt cccggacatc 840 atgcggatca tggacctgcc gctggagatg gagggtccgt tcgtccgcga gagctaccgg 900 ctggcgggtg aggtggaggt gttcgagggc gcgccggagc tgctggcgga cctgcggcag 960 cacggcttcg gcaccgccgt ggtcaccggc aagagcgggc cgcgcgcccg gtcgctgctg 1020 accaccctcg gcatggcggg gctgttcgac catatcatcg gctccgacga ggtcgcgaac 1080 cccaagcccg cgccggacat gctcctgctg gccaccggcc tgctcgacgt cccggccgac 1140 cgggtggtga tggtgggcga cgccctgacg gacctggcca gcgcccgcgc cgcgggctac 1200 ccggcgctgg ccgcgctgtg gggcgagacg gacgaggcgg agctgctggc ggcgaacccg 1260 gacgcggtgg tccgcaagcc ctcgcaggtg ctcgactggt gcctggccca cctcgccgac 1320 gaccggacgt gacgcgcgag caggccccgg cgcggcacgt gccggggcct gcggggcgtc 1380 accccaaccg cgcgcgcagg tccgccacca gcctaggata t 1421 <210> 21 <211> 1423 <212> DNA <213> Actinosynnema pretiosum <400> 21 atatcctagg caccacgtcg tgctcgacct cgcccgccac gcgctcaccc cccgatcatg 60 atcgactcgg tgacgcgggc gaactcgtcc ttcttcacga gcacccgcgt cgtctccacc 120 ccgtccagca cggtgaagta gcggcggccg atcagcacgt gctgcccgtt ctccgccgcc 180 cgaccccgga acgtggtgcc cgccagcacc gagtcccgcg cgtagtcgtc cagcccgtcc 240 aaccgcaccg cctcccagcc gtcccggtcc gcccgccccg gccggaaccg gtacaccgcc 300 tgccacgccc cgtccctggg cctgcgctcc accacgtgcg cgtccccgcg ctccacgacc 360 cggtaggcgc agccgtactg ctcctgctcg accgccgaca gctccagcgg ctccaggtag 420 gacgggccga cgaaccccac gtccaccagc caggtccgcc cgtccaggcg caccaggttg 480 aacgagtgct cctcgtccgg cccgaaccgg tcgtcggcca gccggatcgc cgccgcgacc 540 atcagcacct cgtagcccag cgcggtgagc agggcgtgga agagccggtt gagctcgtag 600 cagaccccgc cgttgcggcc ggtcaccacg tgcgcgaaca cacggggcag cgggatctcc 660 gcgagccccc ggttcggcgg caaccggtcg gccgcgccgc cgttgtcgta gggcacggac 720 atcaggtgcc gcttgtgcag cgcccgcaac gactccagcg tcgggctcgg cacgccgccc 780 tccacgccga tgcgccgcag gtactcggcc acgtcgatca tgctggtgct cacctctcgt 840 cggtcgggtc ggtggactgc cctgcgcctg atcgccctgc gctcgactgc cctgcgcctg 900 aatgccctgc gcccggctgc cctgcgcccg attgccctga gcccgattgc tcggcggcca 960 gtcgctcgcg cagcgcctcg gcggcgatcg cgggcgtcgg ctggtcgaac agcagcgcgg 1020 cgggcaggcg cagcccggtg gcggtgttca gccggttccg cagctgcacg gccgtcatgg 1080 agtcgaagcc gatctcgaag aacgcgtcgt ccgggcccac cgcgcccttc tcgccgtgcc 1140 cgagcacggc ggcggccagg tcgcggacca gctcggtgag cacggcctcc tgctcgtcgc 1200 ccgacagccc ggccaggcgc gcccgcaacc cggccggggg cgcggcctgc ccggtggcgg 1260 gggagagcga gcgccgcgcg gcggggacga gcgcgcgcag cagcgcgggc accgcctcgt 1320 cgcgcgcgga ggcgcgcagc gccgccaggt ccagcggcag cggcacgacc agcgccgggc 1380 cgcccgtggt gaccgcgccc gcgtcgaaca gcgtctagaa tat 1423 <210> 22 <211> 47 <212> DNA <213> Artificial <220> <223> Primer <400> 22 atatactagt cacgtcaccg gcgcggtgtc cgcggacttc gtcaacg 47 <210> 23 <211> 42 <212> DNA <213> Artificial <220> <223> Primer <400> 23 atatcctagg ctggtggcgg acctgcgcgc gcggttgggg tg 42 <210> 24 <211> 42 <212> DNA <213> Artificial <220> <223> Primer <400> 24 atatcctagg caccacgtcg tgctcgacct cgcccgccac gc 42 <210> 25 <211> 42 <212> DNA <213> Artificial <220> <223> Primer <400> 25 atattctaga cgctgttcga cgcgggcgcg gtcaccacgg gc 42 <210> 26 <211> 161 <212> DNA <213> Actinosynnema pretiosum <400> 26 ctcgccgacg accggacgtg acgcgcgagc aggccccggc gcggcacgtg ccggggcctg 60 cggggcgtca ccccaaccgc gcgcgcaggt ccgccaccag cctaggcacc acgtcgtgct 120 cgacctcgcc cgccacgcgc tcaccccccg atcatgatcg a 161 <210> 21 <211> 161 <212> DNA <213> Actinosynnema pretiosum <400> 21 tcgatcatga tcggggggtg agcgcgtggc gggcgaggtc gagcacgacg tggtgcctag 60 gctggtggcg gacctgcgcg cgcggttggg gtgacgcccc gcaggccccg gcacgtgccg 120 cgccggggcc tgctcgcgcg tcacgtccgg tcgtcggcga g 161 <210> 28 <211> 22 <212> PRT <213> Actinosynnema pretiosum <400> 28 Val Ala Gly Glu Val Glu His Asp Val Val Pro Arg Leu Val Ala Asp 1 5 10 15 Leu Arg Ala Arg Leu Gly 20 <210> 29 <211> 30 <212> DNA <213> Artificial <220> <223> primer <400> 29 ggtcactggc cgaagcgcac ggtgtcatgg 30 <210> 30 <211> 36 <212> DNA <213> Artificial <220> <223> primer <400> 30 cctaggcgac taccccgcac tactacaccg agcagg 36 <210> 31 <211> 1595 <212> DNA <213> Actinosynnema pretiosum <400> 31 cctaggcgac taccccgcac tactacaccg agcaggccta cgcctacggg aactcctgga 60 catcaccgac cacaccgtcc aacgcaactt ccgcgaactg gccgatctgg taggcgacgc 120 gaagggcctg ctgttccacc cacgcgacct ggtgggcgtc ccagaattcg gctgcttcct 180 agcagtagcc gaacacccgt aaccacgcgg tggcgtcccc cacggacgcc accgcctcgc 240 gggctgcggg gcgagcgcag cgagcccgcg cagccccact cccgcgtccc tcttctccgt 300 gtggcctggc gcatgtcaaa ttcccactga ctgccaacag atcatgtgcc gtttgagcag 360 gtcagcgact tgtcgcgctt cggtgcctta aggccgagct gggatggggg cactgtttcc 420 ggactgagcg gggcagcttg gaaggtggag ttcggtgagc agaggcagca cgtcccgtcg 480 cacgtagagg tggttgtaca cgcggtggcg ggacctgcgc agtaggccgc tatccgcaag 540 ctgctccaag atcaggagtg cggcgcggtg cgtatagccg agttcggcgg tcagcatggt 600 gctgttgagc agtggggcga cgagcagcgg ggcgggaagc gctttgacct tcctccgccc 660 ggtgcgcatc gcccaggtgg gcgatcgcgc gagcctcacg gatcgcggtc acctcatgca 720 ggctggcgct caacctggaa cgcgcgactg tttcgtccag acgtgccagg gcggtgtagg 780 cgtgcaacaa ggtcttgctg gtttcggagc gcagtctgag ccgggaccag gacgacaact 840 ccgcgatcct cgcggacggg ggcggcctcg tgtcttcacc ggtggtagtt gacctgcgcg 900 gggcggaggt gccctattgc tgccgggacg aggtcatccc ccggagcagt ttctcagcac 960 gccgtgaatc gagatccggg gcgctgagcg cggtgaacgc ctcgtccagc gagtcgcacg 1020 cgcacgtcgt cctgacatcg ggccgcgcat ggcccgaggt ggtcagcggt gagcgggaag 1080 gcgcggcagg gtgtgtgcga gacactccgg gactccgtgc agaaggtcga tcaggcgaaa 1140 gggttgaact gcgaatcgca aagcggcccg gccgcaaagg ggtcgggccg cctgcgacga 1200 ttggtcacgc tgctgcggcg cggtcccgcc ggaactgctt gccgagcagg tcgatccgcc 1260 ccttgtgatc ttctgccagc gcctccagaa ccgagagcag tcgtcgggcg tgcagtgcat 1320 ggccaatacc atcgtcgcgt accccagagg gtgtcgctcc cgttcagggg cgaccatttc 1380 ccacgcccgc ttggcctcct tggcggcccg gccaagatcg ccgagcatca ggtaggtgcc 1440 cgacaacccg acaaccctgc ctgccaacgc ggcttccggc accccgcgcg cctcgtcggc 1500 ttccaacgcc cgaacaccgt gccacagcac ggcccgcgcg ttgccctcgc tcgtctccag 1560 ccatcccatg acaccgtgcg cttcggccag tgacc 1595 <210> 32 <211> 30 <212> DNA <213> Artificial <220> <223> primer <400> 32 cctaggaacg ggtaggcggg caggtcggtg 30 <210> 33 <211> 31 <212> DNA <213> Artificial <220> <223> primer <400> 33 gtgtgcgggc cagctcgccc agcacgccca c 31 <210> 34 <211> 1541 <212> DNA <213> Actinosynnema pretiosum <400> 34 gtgtgcgggc cagctcgccc agcacgccca cgagggtctc cagcgcgtcc gcgccggtgc 60 gcgcgccccg gacgacctcg accgtgggga tcaggtacgg cgggttcatg aagtgcgtgc 120 cgatcagccg cgccgggtcg gggacgtgcc cggccagctc gtcgatcggg atcgaggagg 180 tgttggacac cagcggcacg cgcggcccgg tgagcgcggc ggccccggcc agcacctcgg 240 ccttgaccgg cagctcctcg gtgaccgcct ccaccaccag cgagacgtcc gcgacgtcgg 300 cgagcgaggt ggtggtgagc agctcgcccc gctcgcggtc ctcgggcagc gcccgcatca 360 gcctggccat gcgcagctgg gcggccaccg cctcccgcgc ccgcccgacc ttggcccggt 420 cggtctcgac cagcaccacc ggcacgccgt gcccgacggc cagggaggtg atccccaggc 480 ccatcgtgcc cgcgccgaga acggcgagca ccgtcctgcc gtcctgctct cccatcgcgc 540 tcccccgccg cggccaccgc ggccgccgtc cggtccgcgc gccgtcccgg cacgcgcatt 600 ccaccctcga tcgtgtgccg ggaaaggcgc gcccgacccc ctgacctgcc cccctgaacc 660 cccctcaacg gaaccggaaa tcgaatgtcc cgaacgcgcc gtcaaatcgt cgattgacag 720 ccgcagaact gttcatagac tgtggcggca gtaccgatct ccgaattcca cggaagagtc 780 ctcccccatg gctcagcaga tcagcgccac ctcggaaatc ctcgactacg tccgcgcgac 840 ctcgttgcgc gacgacgacg tgctcgccgg tctgcgggag cggaccgcgg ttctcccggc 900 cgcgtccgcg ctgcaggtgg ccccggagga ggggcagctg ctcggcctgc tggtgcgcct 960 ggtcggcgcg cgctcggtgc tggaggtcgg cacctacacc gggtacagca cgctgtgcat 1020 ggcccgcgcc ctcccgcccg gcggacgtgt cgtgacctgc gacgtcgtcg cgaagtggcc 1080 ggacatgggc aggccgttct gggagcgggc gggcgtcgcg gaccgcatcg acgtccgcgt 1140 cggcgacgcc cgcgccaccc tggccggcct gcacgccgag cacgccgtgt tcgacctggt 1200 gttcatcgac gcgaacaagt cggattacgt ccactactac gagcgcgcgc tgacgctgct 1260 gcgcaccggc ggcctggtcg tcgtggacaa cacgctcttt ttcgggcggg tcgccgatcc 1320 gtccgcgacc gatccggaca ccaccgccgt gcgcgagctg aacgcgctgc tgcacgccga 1380 cgagcgggtc gacatgtgcc tgctgccgat cgcggacgga atcacgctcg ccgtgaagcg 1440 gtgaacccgc ccgaatcgcg ccgaattccc ccggagagaa aggccgccgc agtgttcacc 1500 gaggacgtgg ccaccgacct gcccgcctac ccgttcctag g 1541

Claims (40)

  1. 하기 화학식 1에 따른 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염:
    [화학식 1]
    Figure 112008045421569-PCT00020
    상기에서,
    R1 은 H, OH, 또는 OCH3 이고,
    R2 는 H 또는 CH3이고,
    R3 및 R4는 모두가 H이거나 함께 하나의 결합을 나타내고(즉, C4와 C5는 이중결합임),
    R5 는 H 또는 -C(O)-NH2 이다.
  2. 제1항에 있어서, 상기 R1 은 H 또는 OH인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  3. 제1항에 있어서, 상기 R1 은 H인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  4. 제1항에 있어서, 상기 R1 은 OH인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 R2 는 H인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 R3 및 R4는 모두 H인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 R5 는 -C(O)-NH2인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  8. 제1항에 있어서, 상기 R1 은 H, R2 는 H, R3 및 R4는 모두 H, 및 R5 는 -C(O)-NH2인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  9. 제1항에 있어서, 상기 R1 은 H, R2 는 H, R3 및 R4는 모두 H, 및 R5 는 -C(O)-NH2인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  10. 제1항에 있어서,
    Figure 112008045421569-PCT00021
    인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  11. 제1항에 있어서,
    Figure 112008045421569-PCT00022
    인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염.
  12. 제1항 내지 제11항 중 어느 한 항에 따른 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염과 함께 하나 또는 그 이상의 허용가능한 희석제 또는 담체를 포함하는 약제학적 조성물.
  13. 의학으로 사용하기 위한, 제1항 내지 제11항 중 어느 한 항에 따른 21-데옥시막베신 유사체.
  14. 암, B-세포 악성종양, 말라리아, 진균성 감염, 중추신경계 질환, 퇴행성 신경질환, 혈관신생 의존성 질환, 자가면역질환의 치료제 제조 및/또는 암의 예방적 전처리에 있어서의 제1항 내지 제11항 중 어느 한 항에 따른 21-데옥시막베신 유사체의 용도.
  15. 암, B-세포 악성종양, 말라리아, 진균성 감염, 중추신경계 질환, 퇴행성 신경질환, 혈관신생 의존성 질환, 자가면역질환의 치료제 및/또는 암의 예방적 전처리로서의 사용을 위한, 제1항 내지 제11항 중 어느 한 항에 따른 21-데옥시막베신 유사체.
  16. 제1항 내지 제11항 중 어느 한 항에 따른 21-데옥시막베신 유사체의 유효량을 이들을 필요로 하는 환자에게 투여하는 단계를 포함하는, 암, B-세포 악성종양, 말라리아, 진균성 감염, 중추신경계 질환, 퇴행성 신경질환, 혈관신생 의존성 질환, 자가면역질환 및/또는 암의 예방적 전처리를 위한 치료 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염이 다른 치료제와 복합적으로 투여되는, 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염, 조성물, 용도 또는 방법.
  18. 제17항에 있어서, 다른 치료제가 메토트렉사이트, 류코보린, 프레니손, 블레오마이신, 사이클로포스파미드, 5-플루오르우라실, 파클리탁셀, 도세탁셀, 빈크리스틴, 빈블라스틴, 비노렐빈, 독소루비신, 타목시펜, 토레미펜, 메게스트롤 아세테이트, 아나스트로졸, 고세렐린, 항-HER2 단일 클론 항체, 카페시타빈, 라록시펜 염화수소, EGFR 억제제, VEGF 억제제, 프로테아좀 억제제, 방사선 치료 및 외과 수술로 구성되는 군으로부터 선택되는, 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염, 조성물, 용도 또는 방법.
  19. 제17항에 있어서, 다른 치료제가 시스플라틴, 사이타라빈, 사이클로헥시클로로데틸니트로수리아, 사이클로포스파미드, 젬시타빈, 이포스프아미드, 류코보린, 미토마이신, 미토잔톤, 옥살리플라틴, 탁솔 및 빈데신을 포함하는 탁산 같은 통상적인 화학치료제; 아나스트로졸, 고세렐린, 메게스트롤 아세테이트 및 프레니손 같은 호르몬 치료제; 세툭시맙(항-EGFR) 같은 단일클론항체 치료제; 다사티닙, 라파티닙 같은 단백질 키나아제 억제제; 보리노스타트 같은 히스톤 데아세틸라제(HDAC) 억제제; 수니티닙, 소파레닙, 레나리도미드 같은 혈관신생 억제제; 및 템시로리무스 같은 mTOR 억제제로 구성되는 군으로부터 선택되는, 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염, 조성물, 용도 또는 방법.
  20. 제17항에 있어서, 다른 치료제가 세포독성제인 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염, 조성물, 용도 또는 방법.
  21. 제20항에 있어서, 다른 치료제가 미토마이신 C, 이포스프아미드, CCNU, 미토잔트론 및 빈데신으로부터 선택되는, 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염, 조성물, 용도 또는 방법.
  22. 제1항 내지 제11항 중 어느 한 항에 따른 21-데옥시막베신 유사체의 생산 방법:
    상기 방법은 하기 단계를 포함한다.
    a) 적절한 조건에서 배양시 막베신 또는 이의 유사체를 생산하는 첫 번째 숙주 균주를 제공하는 단계;
    b) 하나 또는 그 이상의 post-PKS 유전자, 여기서 상기 post-PKS 유전자들 중 적어도 하나는 mbcM 또는 이의 상동체인 유전자를 결실시키거나 불활성화시키는 단계;
    c) 상기 변형된 숙주 균주를 21-데옥시막베신 유사체 생산에 적합한 환경에서 배양하는 단계; 및
    d) 상기 생산된 화합물을 선택적으로 분리하는 단계.
  23. 제1항 내지 제11항 중 어느 한 항에 따른 21-데옥시막베신 유사체의 생산 방법:
    상기 방법은 하기 단계를 포함한다.
    a) 적합한 환경에서 배양 시 막베신을 생산하는 첫 번째 숙주 균주를 제공하는 단계;
    b) 하나 또는 그 이상의 post-PKS 유전자, 여기서 상기 post-PKS 유전자들 중 적어도 하나는 mbcM 또는 이의 상동체인 유전자를 결실시키거나 불활성화시키는 단계;
    c) mbcM을 포함하지 않는 post-PKS 유전자 일부 또는 전부를 재도입시키는 단계;
    d) 21-데옥시막베신 유사체 생산을 위한 적합한 환경 하에서 상기 변형된 숙주 균주를 배양하는 단계; 및
    e) 상기 생산된 화합물을 선택적으로 분리하는 단계.
  24. 제23항 또는 제24항에 있어서, 상기 단계 a)의 균주는 막베신 생산 균주인 방법.
  25. 제22항 내지 제24항 중 어느 한 항에 있어서, 21-데옥시막베신 유사체 생산을 위해 배양된 상기 제작된 균주는 mbcM을 포함하는 하나 또는 그 이상의 post-PKS 유전자가 결실되거나 불활성화된 막베신 생산 균주에 기초하는 방법.
  26. 제25항에 있어서, 21-데옥시막베신 유사체 생산을 위해 배양된 상기 제작된 균주는 mbcM이 결실되거나 불활성화된 막베신 생산 균주에 기초하는 방법.
  27. 제25항에 있어서, 21-데옥시막베신 유사체 생산을 위해 배양된 상기 제작된 균주는 mbcM1, mbcMT1, mbcMT2, mbcP 및 mbcP450이 결실되거나 불활성화된 막베신 생산 균주에 기초하는 방법.
  28. mbcM 유전자 또는 이의 상동체가 결실되거나 불활성화되어 결국 21-데옥시막베신 또는 이의 유사체를 생산하는, 자연적으로 막베신 또는 이의 유사체를 생산하는 숙주 균주.
  29. mbcM 및 선택적으로 추가의 post-PKS 유전자가 결실되거나 불활성화된 막베신 생산 균주를 기초로 제작된 균주.
  30. 제29항에 있어서, mbcM이 결실 또는 불활성화되도록 제작된 균주.
  31. 제29항에 있어서, mbcM1, mbcMT1, mbcMT2, mbcP 및 mbcP450로부터 선택된 하나 또는 그 이상의 유전자 및 mbcM이 결실되거나 불활성화되도록 제작된 균주.
  32. 제29항에 있어서, mbcM1, mbcMT1, mbcMT2, mbcP 및 mbcP450로부터 선택된 둘 또는 그 이상의 유전자 및 mbcM이 결실되거나 불활성화되도록 제작된 균주.
  33. 제29항에 있어서, mbcM1, mbcMT1, mbcMT2, mbcP 및 mbcP450로부터 선택된 셋 또는 그 이상의 유전자 및 mbcM이 결실되거나 불활성화되도록 제작된 균주.
  34. 제29항에 있어서, mbcM1, mbcMT1, mbcMT2, mbcP 및 mbcP450로부터 선택된 넷 또는 그 이상의 유전자 및 mbcM이 결실되거나 불활성화되도록 제작된 균주.
  35. 제29항 내지 제34항 중 어느 한 항에 있어서, 상기 개시성 막베신 생산 균주는 A.프레티오섬(A.pretiosum) 또는 A.미럼(A.mirum)인 균주.
  36. 제29항 내지 제34항 중 어느 한 항에 따른 제작된 균주의 21-데옥시막베신 유사체 또는 약제학적으로 허용가능한 이의 염의 제조에 있어서의 용도.
  37. 제36항에 있어서, 상기 21-데옥시막베신 유사체는 제1항 내지 제11항 중 어느 한 항에 의해 특정되는 것을 특징으로 하는 용도.
  38. 제28항에 따른 숙주 균주의 21-데옥시막베신 또는 이의 유사체 생산을 위한 용도.
  39. 암 및/또는 B-세포 악성종양 치료를 위한 제14항 내지 제16항 중 어느 한 항의 21-데옥시막베신 유사체, 용도 또는 방법.
  40. 제22항 내지 제27항 중 어느 한 항에 따른 방법에 의해 생산 가능한 21-데옥시막베신 유사체.
KR1020087015388A 2005-12-24 2006-12-22 항암제로서 유용한 21-데옥시막베신 유사체 KR20080078853A (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
GBGB0526473.4A GB0526473D0 (en) 2005-12-24 2005-12-24 Novel compounds
GB0526473.4 2005-12-24
GB0606549A GB0606549D0 (en) 2006-03-31 2006-03-31 Novel compounds
GB0606549.4 2006-03-31
GB0614374.7 2006-07-20
GB0614374A GB0614374D0 (en) 2006-07-20 2006-07-20 Novel Compounds

Publications (1)

Publication Number Publication Date
KR20080078853A true KR20080078853A (ko) 2008-08-28

Family

ID=37945446

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087015388A KR20080078853A (ko) 2005-12-24 2006-12-22 항암제로서 유용한 21-데옥시막베신 유사체

Country Status (8)

Country Link
US (1) US20090209494A1 (ko)
EP (1) EP1971578A1 (ko)
JP (1) JP2009521423A (ko)
KR (1) KR20080078853A (ko)
AU (1) AU2006329681A1 (ko)
BR (1) BRPI0620624A2 (ko)
CA (1) CA2628728A1 (ko)
WO (1) WO2007074347A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2651558A1 (en) * 2006-05-09 2007-11-15 Biotica Technology Limited Novel compounds
KR20090078822A (ko) * 2006-11-09 2009-07-20 바이오티카 테크놀로지 리미티드 암 치료를 위한 18, 21-디데스옥시막베신 유도체
ES2389740T3 (es) 2006-11-09 2012-10-31 Bristol-Myers Squibb Company Nuevos compuestos y procedimientos para su producción
US20100210597A1 (en) * 2007-03-01 2010-08-19 Steven Moss C21-Deoxy Ansamycin Derivatives as Antitumor Agents
EP2200431B1 (en) 2007-09-10 2016-07-20 Boston Biomedical, Inc. Novel compositions and methods for cancer treatment
AR077405A1 (es) 2009-07-10 2011-08-24 Sanofi Aventis Derivados del indol inhibidores de hsp90, composiciones que los contienen y utilizacion de los mismos para el tratamiento del cancer
FR2949467B1 (fr) 2009-09-03 2011-11-25 Sanofi Aventis Nouveaux derives de 5,6,7,8-tetrahydroindolizine inhibiteurs d'hsp90, compositions les contenant et utilisation
WO2013074695A1 (en) * 2011-11-14 2013-05-23 The Regents Of The University Of Colorado, A Body Corporate Hsp90 inhibitors with modified toxicity
US20160030384A1 (en) 2013-04-09 2016-02-04 Boston Biomedical, Inc. 2-acetylnaphtho[2,3-b]furan -4,9-dione for use on treating cancer
US9270102B2 (en) * 2013-07-30 2016-02-23 Ford Global Technologies, Inc. Multilayered bus bar
CA3045306A1 (en) 2016-11-29 2018-06-07 Boston Biomedical, Inc. Naphthofuran derivatives, preparation, and methods of use thereof
US10646464B2 (en) 2017-05-17 2020-05-12 Boston Biomedical, Inc. Methods for treating cancer
CN115947774A (zh) * 2022-09-15 2023-04-11 山东大学 化合物Spiruchostatin E及其制备方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5874651A (ja) * 1981-09-17 1983-05-06 Takeda Chem Ind Ltd マクベシン誘導体およびその製造法
US7189549B2 (en) * 2002-06-14 2007-03-13 Kosan Biosciences, Inc. Recombinant polynucleotides encoding pro-geldanamycin producing polyketide synthase and accessory proteins, and uses thereof
US7241754B2 (en) * 2003-06-13 2007-07-10 Kosan Biosciences, Inc. 2-Desmethyl ansamycin compounds

Also Published As

Publication number Publication date
CA2628728A1 (en) 2007-07-05
BRPI0620624A2 (pt) 2011-11-16
AU2006329681A1 (en) 2007-07-05
US20090209494A1 (en) 2009-08-20
JP2009521423A (ja) 2009-06-04
WO2007074347A1 (en) 2007-07-05
EP1971578A1 (en) 2008-09-24

Similar Documents

Publication Publication Date Title
KR20080078853A (ko) 항암제로서 유용한 21-데옥시막베신 유사체
US7671190B2 (en) Recombinant polynucleotides encoding pro-geldanamycin producing polyketide synthases and accessory proteins, and uses thereof
KR20090005376A (ko) 암 치료를 위한 18,21-디데스옥시막베신 유도체
KR20090005377A (ko) 17-옥시막베신 유도체 및 이의 암 및/또는 b-세포 악성종양 치료 용도
CN101578268A (zh) 新的化合物及其生产方法
KR20090078822A (ko) 암 치료를 위한 18, 21-디데스옥시막베신 유도체
US20030124689A1 (en) Mitomycin biosynthetic gene cluster
CA2399689A1 (en) Gene cluster encoding a nystatin polyketide synthase and its manipulation and utility
CN107540682B (zh) 曲张链丝菌素衍生物及其制备方法和应用
KR20090075856A (ko) 신규한 화합물 및 이의 제조방법
EP0929681A1 (en) Rifamycin biosynthesis gene cluster
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
US20030175888A1 (en) Discrete acyltransferases associated with type I polyketide synthases and methods of use
CN101346354A (zh) 用作抗肿瘤剂的21-脱氧麦克菌素类似物
CN101595095A (zh) 用于癌症治疗的18,21-双脱氧麦克菌素衍生物
CN101652348A (zh) C21-脱氧安莎霉素衍生物作为抗肿瘤剂
CN101027395A (zh) 用于制备复合聚酮化合物的生物合成基因簇
CN112442507B (zh) 马度米星化合物的生物合成基因簇及其应用
CN107541523B (zh) 曲张链丝菌素生物合成基因簇及其应用
KR100549690B1 (ko) 에프알-008 폴리케타이드 합성에 관여하는 유전자
KR20100089370A (ko) 슈도노카디아 오토트로피카의 신규한 폴리엔 생합성 유전자
US20030134398A1 (en) Mitomycin biosynthetic gene cluster
CN101736016A (zh) 萘霉素生物合成基因簇、包含其的载体及宿主
EP2079700A1 (en) 18, 21-didesoxymacbecin derivatives for the treatment of cancer

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid