KR100511233B1 - 에포틸론 생합성 유전자 - Google Patents

에포틸론 생합성 유전자 Download PDF

Info

Publication number
KR100511233B1
KR100511233B1 KR10-2000-7014348A KR20007014348A KR100511233B1 KR 100511233 B1 KR100511233 B1 KR 100511233B1 KR 20007014348 A KR20007014348 A KR 20007014348A KR 100511233 B1 KR100511233 B1 KR 100511233B1
Authority
KR
South Korea
Prior art keywords
seq
amino acids
delete delete
ala
leu
Prior art date
Application number
KR10-2000-7014348A
Other languages
English (en)
Other versions
KR20010052962A (ko
Inventor
토마스 셥
제임스 매디슨 라이곤
이스트반 몰나
로스 지클
외른 괴를라흐
데븐 싸이르
Original Assignee
노파르티스 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노파르티스 아게 filed Critical 노파르티스 아게
Publication of KR20010052962A publication Critical patent/KR20010052962A/ko
Application granted granted Critical
Publication of KR100511233B1 publication Critical patent/KR100511233B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • A61P35/04Antineoplastic agents specific for metastasis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Oncology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

에포틸론의 생합성에 필수적인 폴리펩티드를 코딩하는 핵산 분자가 소란지움 셀룰로숨 (Sorangium Cellulosum)으로부터 단리되었다. 본 발명에서는 본 발명의 유전자가 형질전환된 재조합 숙주로부터 에포틸론을 제조하는 방법에 관한 것이다. 이 방법에 의해, 에포틸론은 정제 뿐만 아니라 암의 치료제와 같은 제약 제형으로 사용하기에 충분한 양으로 제조될 수 있다.

Description

에포틸론 생합성 유전자 {Genes for the Biosynthesis of Epothilones}
본 발명은 폴리케티드 및 그의 합성 유전자에 관한 것이다. 특히, 본 발명은 에포틸론 A 및 B의 생합성에 필수적인 신규 폴리케티드 합성효소 및 비-리보솜 펩티드 합성효소 유전자를 소란지움 셀룰로숨 (Sorangium cellulosum)으로부터 단리하는 방법 및 특성화 방법에 관한 것이다.
폴리케티드는 2개의 탄소 원자를 기본 단위로 합성되는 화합물이며, 그중 β-탄소에 항상 케토기가 있기 때문에 이름이 폴리케티드이다. 이런 화합물에는 많은 중요한 항생제, 면역억제제, 암 치료제 및 생물학적 특성 범위가 넓은 기타 화합물이 포함된다. 폴리케티드 사슬 길이의 상이함, 도입된 (두 탄소 원자 기본 단위의 일부로서 도입되거나 폴리케티드 골격이 형성된 후 도입된) 측쇄의 상이함, 및 이러한 기들의 화학양론으로부터 엄청난 구조적 다양성이 생겨났다. 또한, 케토기는 히드록실기 및 에놀기로 환원되거나 모두 제거될 수 있다. 두 탄소 원자가 첨가되는 각 단계는 폴리케티드 합성효소 (polyketide synthase, PKS)라 불리우는 복잡한 효소에 의해 지방산 생합성과 유사한 방식으로 수행된다.
폴리케티드의 수를 증가시키는 생합성 유전자는 이미 단리되어 서열분석되어 있다. 예를 들면, 본원에 참고문헌으로 포함되는 미국 특허 제5,639,919호, 동 제5,693,774호 및 동 제5,716,849호를 참조할 수 있으며, 이들 문헌은 소라펜 (soraphen)의 생합성 유전자에 대해 기재되어 있다. 또한, 리팜피신의 생합성 유전자에 대해 기재된 [Schupp et al., FEMS Microbiology Letters 159:201-207 (1998)] 및 WO 98/07868호, 및 틸락톤 (tylactone)의 생합성 유전자에 대해 기재된 미국 특허 제5,876,991호를 참조할 수 있으며, 이들 모든 문헌은 본원에 참고문헌으로 포함된다. 통상, 코딩 단백질은 두 가지 유형 (Ⅰ형 및 Ⅱ형)으로 나누어진다. Ⅰ형 단백질은 상이한 효소적 단계를 수행하는 여러 가지 촉매 도메인이 함께 공유결합에 의해 결합된 다관능성 단백질 (예를 들면, 에리쓰로마이신 (erythromycin), 소라펜, 리파마이신 및 아버멕틴 (avermectin)의 PKS, MacNeil et al., Industrial Microorganisms: Basic and Applied Mo-lecular Genetics, (ed.: Baltz et al.), American Society for Microbiology, Washington D. C. pp. 245-256 (1993))인 반면, Ⅱ형 단백질은 일관능성 (Hutchinson et al., in Industrial Microorganisms: Basic and Applied Molecular Genetics, (ed.: Baltz et al.), American Society for Microbiology, Washington D. C. pp. 203-216 (1993) 참조)이다.
악티노르호딘 (actinorhodin, 스트렙토마이세스 코엘리칼라 (Streptomyces coelicolor)에 의해 생성됨)과 같은 더 단순한 폴리케티드의 경우, 한 세트의 PKS 유전자에 의해 코딩되는 PKS 효소에 의한 두 탄소 첨가 단계가 여러번 반복적으로 수행된다. 반면, 에리쓰로마이신 및 소라펜과 같은 더 복잡한 화합물의 합성은 모듈로 조직화된 PKS 효소에 관련되어 있는데, 이 때 각 모듈이 두 탄소 첨가 단계를 1회 수행한다 (Hopwood et al., in Industrial Microorganisms: Basic and Applied Molecular Genetics, (ed.: Baltz et al.), American Society for Microbiology, Washington D. C., pp. 267-275 (1993) 참조).
통상, 복잡한 폴리케티드 및 이차대사 물질은 단순 카르복실산 대신 아미노산으로부터 유래한 하부 구조를 가질 수 있다. 이러한 기본 단위는 비-리보솜 폴리펩티드 합성효소 (non-ribosomal polypeptide synthetase, NRPS)에 의해 도입된다. NRPS는 모듈로 조직화되는 다중 효소이다. 각각의 모듈은 1개의 아미노산 기본 단위를 첨가 (필요한 경우, 부가 과정 수행)하는 기능을 한다. NRPS는 아미노아실-아데닐레이트를 형성하여 아미노산을 활성화시키고, 펩티딜 캐리어 단백질 내 포스포판테테이닐 보결 분자단의 티올기에 활성화된 아미노산을 결합시킨다. 추가로, NRPS는 에피머화, N-메틸화, 또는 필요한 경우 고리화에 의해 아미노산을 변형시키고, 효소에 결합된 아미노산 사이에 펩티드 결합의 형성을 촉매한다. NRPS는 시클로스포린 (cyclosporin)과 같은 펩티드 이차대사 물질의 생합성에 관련되어 있고, 라파마이신에 나타나는 바와 같은 폴리케티드 사슬 종결 단위를 제공할 수 있거나, 또는 예르시니아박틴 (yersiniabactin) 생합성에 나타나는 바와 같이 PKS와 혼합 시스템을 형성한다.
에포틸론 A 및 B는 소란지움 셀룰로숨이라는 박테리아의 So ce90 균주에 의해 생성되는, 아실시스테인에서 유래한 출발 단위가 있는 16-원 거대고리화 폴리케티드이다 (본원에 참고문헌으로 포함되는 [Gerth et al., J. Antibiotics 49:560-563 (1996)] 참조). 에포틸론 A 및 B의 구조는 하기 화학식 Ⅰ과 같다.
상기 식에서, R은 수소 (에포틸론 A) 또는 메틸 (에포틸론 B)을 의미한다.
에포틸론은 항진균성의 범위가 좁으며, 특히 동물 세포 배양에서 높은 세포 독성을 나타낸다 (본원에 참고문헌으로 포함되는 독일 특허 4138042호 (Hoefle 등, 1993) 참조). 특히 중요한 것은, 생체내 및 배양된 세포에서 에포틸론이 탁솔 (taxol)의 생물학적 효과를 모방한다는 것이다 (본원에 참고문헌으로 포함되는 [Bollag et al., Cancer Research 55:2325-2333 (1995)] 참조). 세포내 미세관을 안정화시키는 탁솔 및 탁소테르 (taxotere)는 다양한 인간 충실성 종양에 대해 높은 활성이 있는 암의 화학치료제이다 (Rowinsky et al., J. Natl. Cancer Inst. 83:1778-1781 (1991)). 경쟁 연구로 에포틸론이 미세관에 대한 탁솔 결합의 경쟁적 억제제로 작용함을 알아냈고, 이는 에포틸론이 동일한 미세관 결합 부위를 공유하며 미세관에 대한 친화도가 탁솔과 유사하다는 해석과 일치한다. 그러나, 에포틸론은 탁솔에 비해 훨씬 적은 양으로 다중 약물-내성 세포주에 대한 효능을 나타낸다는 점에서 탁솔보다 우월하다 (Bollag et al. (1995)). 게다가, 에포틸론은 탁솔에 비해 P-당단백질에 의해 세포로부터 유출되는 효율이 매우 낮다 (Gerth et al. (1996)). 또한, 에포틸론 A 또는 에포틸론 B에 비해 세포독성이 월등한 몇몇 에포틸론 유사체가 합성되었으며, 이들은 미세관의 중합 및 안정화를 유도하는 능력이 증가되어 있다 (본원에 참고문헌으로 포함되는 WO 98/25929호 참조).
항암제로서 에포틸론의 장래성에도 불구하고, 현재 이러한 화합물의 제조에 관련된 문제가 그 상업적 잠재성을 제한하고 있다. 이 화합물은 산업적 규모로 화학 합성하기에는 너무 복잡하기 때문에, 발효에 의해 제조되어야 한다. 소란지움 셀룰로숨과 같은 믹소박테리아의 유전자 조작에 관한 기술은 본원에 참고문헌으로 포함되는 미국 특허 제5,686,295호에 기재되어 있다. 그러나, 소란지움 셀룰로숨은 발효시키기가 매우 어렵기 때문에 에포틸론의 제조량은 매우 적다. 발효에 적합한 이종 숙주에서 에포틸론의 재조합 제조는 현행 제조 방법상의 문제점을 해결할 수 있다. 그러나, 에포틸론을 생합성하는 폴리펩티드를 코딩하는 유전자는 지금까지 단리되지 않았다. 게다가, 에포틸론을 생성하는 균주 (즉, So ce 90)는 1종 이상의 부가의 폴리케티드인 스피란기엔 (spirangien)도 생성하기 때문에, 에포틸론 생합성 유전자를 단리하기가 매우 복잡할 것이라고 생각하였다.
따라서, 앞서 말한 것을 고려하여 본 발명의 한 목적은 소란지움 및 폴리안지움 군의 믹소박테리아 (즉, 소란지움 셀룰로숨 균주 So ce90)에서 에포틸론의 합성에 관여하는 유전자, 특히 에포틸론 A 및 B의 합성에 관여하는 유전자를 단리하는 것이다. 본 발명 추가의 목적은 항암제 제형에 사용할 수 있는 에포틸론의 재조합 제조 방법을 제공하는 것이다.
<발명의 요약>
상기 및 기타 목적을 추진함에 있어서, 본 발명은 예상외로 상기 기재된 난점을 극복하여 에포틸론 생합성에 관여하는 1종 이상의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자를 최초로 제공하게 되었다. 바람직한 실시양태에서, 이 뉴클레오티드 서열은 믹소박테리아에 속한 종 (가장 바람직하게는 소란지움 셀룰로숨)으로부터 단리된다.
다른 바람직한 실시양태에서, 본 발명은 서열 2, 서열 2의 아미노산 11-437, 서열 2의 아미노산 543-864, 서열 2의 아미노산 974-1273, 서열 2의 아미노산 1314-1385, 서열 3, 서열 3의 아미노산 72-81, 서열 3의 아미노산 118-125, 서열 3의 아미노산 199-212, 서열 3의 아미노산 353-363, 서열 3의 아미노산 549-565, 서열 3의 아미노산 588-603, 서열 3의 아미노산 669-684, 서열 3의 아미노산 815-821, 서열 3의 아미노산 868-892, 서열 3의 아미노산 903-912, 서열 3의 아미노산 918-940, 서열 3의 아미노산 1268-1274, 서열 3의 아미노산 1285-1297, 서열 3의 아미노산 973-1256, 서열 3의 아미노산 1344-1351, 서열 4, 서열 4의 아미노산 7-432, 서열 4의 아미노산 539-859, 서열 4의 아미노산 869-1037, 서열 4의 아미노산 1439-1684, 서열 4의 아미노산 1722-1792, 서열 5, 서열 5의 아미노산 39-457, 서열 5의 아미노산 563-884, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 1434-1506, 서열 5의 아미노산 1524-1950, 서열 5의 아미노산 2056-2377, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 2932-3005, 서열 5의 아미노산 3024-3449, 서열 5의 아미노산 3555-3876, 서열 5의 아미노산 3886-4048, 서열 5의 아미노산 4433-4719, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 5010-5082, 서열 5의 아미노산 5103-5525, 서열 5의 아미노산 5631-5951, 서열 5의 아미노산 5964-6132, 서열 5의 아미노산 6542-6837, 서열 5의 아미노산 6857-7101, 서열 5의 아미노산 7140-7211, 서열 6, 서열 6의 아미노산 35-454, 서열 6의 아미노산 561-881, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 1430-1503, 서열 6의 아미노산 1522-1946, 서열 6의 아미노산 2053-2373, 서열 6의 아미노산 2383-2551, 서열 6의 아미노산 2671-3045, 서열 6의 아미노산 3392-3636, 서열 6의 아미노산 3673-3745, 서열 7, 서열 7의 아미노산 32-450, 서열 7의 아미노산 556-877, 서열 7의 아미노산 887-1051, 서열 7의 아미노산 1478-1790, 서열 7의 아미노산 1810-2055, 서열 7의 아미노산 2093-2164, 서열 7의 아미노산 2165-2439, 서열 8, 서열 10, 서열 11 및 서열 22로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는, 에포틸론의 생합성에 관여하는 1종 이상의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자를 제공한다.
더욱 바람직한 실시양태에서, 본 발명은 서열 2, 서열 2의 아미노산 11-437, 서열 2의 아미노산 543-864, 서열 2의 아미노산 974-1273, 서열 2의 아미노산 1314-1385, 서열 3, 서열 3의 아미노산 72-81, 서열 3의 아미노산 118-125, 서열 3의 아미노산 199-212, 서열 3의 아미노산 353-363, 서열 3의 아미노산 549-565, 서열 3의 아미노산 588-603, 서열 3의 아미노산 669-684, 서열 3의 아미노산 815-821, 서열 3의 아미노산 868-892, 서열 3의 아미노산 903-912, 서열 3의 아미노산 918-940, 서열 3의 아미노산 1268-1274, 서열 3의 아미노산 1285-1297, 서열 3의 아미노산 973-1256, 서열 3의 아미노산 1344-1351, 서열 4, 서열 4의 아미노산 7-432, 서열 4의 아미노산 539-859, 서열 4의 아미노산 869-1037, 서열 4의 아미노산 1439-1684, 서열 4의 아미노산 1722-1792, 서열 5, 서열 5의 아미노산 39-457, 서열 5의 아미노산 563-884, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 1434-1506, 서열 5의 아미노산 1524-1950, 서열 5의 아미노산 2056-2377, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 2932-3005, 서열 5의 아미노산 3024-3449, 서열 5의 아미노산 3555-3876, 서열 5의 아미노산 3886-4048, 서열 5의 아미노산 4433-4719, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 5010-5082, 서열 5의 아미노산 5103-5525, 서열 5의 아미노산 5631-5951, 서열 5의 아미노산 5964-6132, 서열 5의 아미노산 6542-6837, 서열 5의 아미노산 6857-7101, 서열 5의 아미노산 7140-7211, 서열 6, 서열 6의 아미노산 35-454, 서열 6의 아미노산 561-881, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 1430-1503, 서열 6의 아미노산 1522-1946, 서열 6의 아미노산 2053-2373, 서열 6의 아미노산 2383-2551, 서열 6의 아미노산 2671-3045, 서열 6의 아미노산 3392-3636, 서열 6의 아미노산 3673-3745, 서열 7, 서열 7의 아미노산 32-450, 서열 7의 아미노산 556-877, 서열 7의 아미노산 887-1051, 서열 7의 아미노산 1478-1790, 서열 7의 아미노산 1810-2055, 서열 7의 아미노산 2093-2164, 서열 7의 아미노산 2165-2439, 서열 8, 서열 10, 서열 11 및 서열 22로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는, 에포틸론의 생합성에 관여하는 1종 이상의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자를 제공한다.
또다른 바람직한 실시양태에서, 본 발명은 서열 1의 뉴클레오티드 1900-3171, 서열 1의 뉴클레오티드 3415-5556, 서열 1의 뉴클레오티드 7610-11875, 서열 1의 뉴클레오티드 7643-8920, 서열 1의 뉴클레오티드 9236-10201, 서열 1의 뉴클레오티드 10529-11428, 서열 1의 뉴클레오티드 11549-11764, 서열 1의 뉴클레오티드 11872-16104, 서열 1의 뉴클레오티드 12085-12114, 서열 1의 뉴클레오티드 12223-12246, 서열 1의 뉴클레오티드 12466-12507, 서열 1의 뉴클레오티드 12928-12960, 서열 1의 뉴클레오티드 13516-13566, 서열 1의 뉴클레오티드 13633-13680, 서열 1의 뉴클레오티드 13876-13923, 서열 1의 뉴클레오티드 14313-14334, 서열 1의 뉴클레오티드 14473-14547, 서열 1의 뉴클레오티드 14578-14607, 서열 1의 뉴클레오티드 14623-14692, 서열 1의 뉴클레오티드 15673-15693, 서열 1의 뉴클레오티드 15724-15762, 서열 1의 뉴클레오티드 14788-15639, 서열 1의 뉴클레오티드 15901-15924, 서열 1의 뉴클레오티드 16251-21749, 서열 1의 뉴클레오티드 16269-17546, 서열 1의 뉴클레오티드 17865-18827, 서열 1의 뉴클레오티드 18855-19361, 서열 1의 뉴클레오티드 20565-21302, 서열 1의 뉴클레오티드 21414-21626, 서열 1의 뉴클레오티드 21746-43519, 서열 1의 뉴클레오티드 21860-23116, 서열 1의 뉴클레오티드 23431-24397, 서열 1의 뉴클레오티드 25184-25942, 서열 1의 뉴클레오티드 26045-26263, 서열 1의 뉴클레오티드 26318-27595, 서열 1의 뉴클레오티드 27911-28876, 서열 1의 뉴클레오티드 29678-30429, 서열 1의 뉴클레오티드 30539-30759, 서열 1의 뉴클레오티드 30815-32092, 서열 1의 뉴클레오티드 32408-33373, 서열 1의 뉴클레오티드 33401-33889, 서열 1의 뉴클레오티드 35042-35902, 서열 1의 뉴클레오티드 35930-36667, 서열 1의 뉴클레오티드 36773-36991, 서열 1의 뉴클레오티드 37052-38320, 서열 1의 뉴클레오티드 38636-39598, 서열 1의 뉴클레오티드 39635-40141, 서열 1의 뉴클레오티드 41369-42256, 서열 1의 뉴클레오티드 42314-43048, 서열 1의 뉴클레오티드 43163-43378, 서열 1의 뉴클레오티드 43524-54920, 서열 1의 뉴클레오티드 43626-44885, 서열 1의 뉴클레오티드 45204-46166, 서열 1의 뉴클레오티드 46950-47702, 서열 1의 뉴클레오티드 47811-48032, 서열 1의 뉴클레오티드 48087-49361, 서열 1의 뉴클레오티드 49680-50642, 서열 1의 뉴클레오티드 50670-51176, 서열 1의 뉴클레오티드 51534-52657, 서열 1의 뉴클레오티드 53697-54431, 서열 1의 뉴클레오티드 54540-54758, 서열 1의 뉴클레오티드 54935-62254, 서열 1의 뉴클레오티드 55028-56284, 서열 1의 뉴클레오티드 56600-57565, 서열 1의 뉴클레오티드 57593-58087, 서열 1의 뉴클레오티드 59366-60304, 서열 1의 뉴클레오티드 60362-61099, 서열 1의 뉴클레오티드 61211-61426, 서열 1의 뉴클레오티드 61427-62254, 서열 1의 뉴클레오티드 62369-63628, 서열 1의 뉴클레오티드 67334-68251 및 서열 1의 뉴클레오티드 1-68750의 상보 서열로 이루어진 군으로부터 선택되는 뉴클레오티드 서열과 실질적으로 유사한, 에포틸론의 생합성에 관여하는 1종 이상의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자를 제공한다.
특히 바람직한 실시양태에서, 본 발명은 서열 1의 뉴클레오티드 1900-3171, 서열 1의 뉴클레오티드 3415-5556, 서열 1의 뉴클레오티드 7610-11875, 서열 1의 뉴클레오티드 7643-8920, 서열 1의 뉴클레오티드 9236-10201, 서열 1의 뉴클레오티드 10529-11428, 서열 1의 뉴클레오티드 11549-11764, 서열 1의 뉴클레오티드 11872-16104, 서열 1의 뉴클레오티드 12085-12114, 서열 1의 뉴클레오티드 12223-12246, 서열 1의 뉴클레오티드 12466-12507, 서열 1의 뉴클레오티드 12928-12960, 서열 1의 뉴클레오티드 13516-13566, 서열 1의 뉴클레오티드 13633-13680, 서열 1의 뉴클레오티드 13876-13923, 서열 1의 뉴클레오티드 14313-14334, 서열 1의 뉴클레오티드 14473-14547, 서열 1의 뉴클레오티드 14578-14607, 서열 1의 뉴클레오티드 14623-14692, 서열 1의 뉴클레오티드 15673-15693, 서열 1의 뉴클레오티드 15724-15762, 서열 1의 뉴클레오티드 14788-15639, 서열 1의 뉴클레오티드 15901-15924, 서열 1의 뉴클레오티드 16251-21749, 서열 1의 뉴클레오티드 16269-17546, 서열 1의 뉴클레오티드 17865-18827, 서열 1의 뉴클레오티드 18855-19361, 서열 1의 뉴클레오티드 20565-21302, 서열 1의 뉴클레오티드 21414-21626, 서열 1의 뉴클레오티드 21746-43519, 서열 1의 뉴클레오티드 21860-23116, 서열 1의 뉴클레오티드 23431-24397, 서열 1의 뉴클레오티드 25184-25942, 서열 1의 뉴클레오티드 26045-26263, 서열 1의 뉴클레오티드 26318-27595, 서열 1의 뉴클레오티드 27911-28876, 서열 1의 뉴클레오티드 29678-30429, 서열 1의 뉴클레오티드 30539-30759, 서열 1의 뉴클레오티드 30815-32092, 서열 1의 뉴클레오티드 32408-33373, 서열 1의 뉴클레오티드 33401-33889, 서열 1의 뉴클레오티드 35042-35902, 서열 1의 뉴클레오티드 35930-36667, 서열 1의 뉴클레오티드 36773-36991, 서열 1의 뉴클레오티드 37052-38320, 서열 1의 뉴클레오티드 38636-39598, 서열 1의 뉴클레오티드 39635-40141, 서열 1의 뉴클레오티드 41369-42256, 서열 1의 뉴클레오티드 42314-43048, 서열 1의 뉴클레오티드 43163-43378, 서열 1의 뉴클레오티드 43524-54920, 서열 1의 뉴클레오티드 43626-44885, 서열 1의 뉴클레오티드 45204-46166, 서열 1의 뉴클레오티드 46950-47702, 서열 1의 뉴클레오티드 47811-48032, 서열 1의 뉴클레오티드 48087-49361, 서열 1의 뉴클레오티드 49680-50642, 서열 1의 뉴클레오티드 50670-51176, 서열 1의 뉴클레오티드 51534-52657, 서열 1의 뉴클레오티드 53697-54431, 서열 1의 뉴클레오티드 54540-54758, 서열 1의 뉴클레오티드 54935-62254, 서열 1의 뉴클레오티드 55028-56284, 서열 1의 뉴클레오티드 56600-57565, 서열 1의 뉴클레오티드 57593-58087, 서열 1의 뉴클레오티드 59366-60304, 서열 1의 뉴클레오티드 60362-61099, 서열 1의 뉴클레오티드 61211-61426, 서열 1의 뉴클레오티드 61427-62254, 서열 1의 뉴클레오티드 62369-63628, 서열 1의 뉴클레오티드 67334-68251 및 서열 1의 뉴클레오티드 1-68750의 상보 서열로 이루어진 군으로부터 선택되는, 에포틸론의 생합성에 관여하는 1종 이상의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자를 제공한다.
또다른 바람직한 실시양태에서, 본 발명은 서열 1의 뉴클레오티드 1900-3171, 서열 1의 뉴클레오티드 3415-5556, 서열 1의 뉴클레오티드 7610-11875, 서열 1의 뉴클레오티드 7643-8920, 서열 1의 뉴클레오티드 9236-10201, 서열 1의 뉴클레오티드 10529-11428, 서열 1의 뉴클레오티드 11549-11764, 서열 1의 뉴클레오티드 11872-16104, 서열 1의 뉴클레오티드 12085-12114, 서열 1의 뉴클레오티드 12223-12246, 서열 1의 뉴클레오티드 12466-12507, 서열 1의 뉴클레오티드 12928-12960, 서열 1의 뉴클레오티드 13516-13566, 서열 1의 뉴클레오티드 13633-13680, 서열 1의 뉴클레오티드 13876-13923, 서열 1의 뉴클레오티드 14313-14334, 서열 1의 뉴클레오티드 14473-14547, 서열 1의 뉴클레오티드 14578-14607, 서열 1의 뉴클레오티드 14623-14692, 서열 1의 뉴클레오티드 15673-15693, 서열 1의 뉴클레오티드 15724-15762, 서열 1의 뉴클레오티드 14788-15639, 서열 1의 뉴클레오티드 15901-15924, 서열 1의 뉴클레오티드 16251-21749, 서열 1의 뉴클레오티드 16269-17546, 서열 1의 뉴클레오티드 17865-18827, 서열 1의 뉴클레오티드 18855-19361, 서열 1의 뉴클레오티드 20565-21302, 서열 1의 뉴클레오티드 21414-21626, 서열 1의 뉴클레오티드 21746-43519, 서열 1의 뉴클레오티드 21860-23116, 서열 1의 뉴클레오티드 23431-24397, 서열 1의 뉴클레오티드 25184-25942, 서열 1의 뉴클레오티드 26045-26263, 서열 1의 뉴클레오티드 26318-27595, 서열 1의 뉴클레오티드 27911-28876, 서열 1의 뉴클레오티드 29678-30429, 서열 1의 뉴클레오티드 30539-30759, 서열 1의 뉴클레오티드 30815-32092, 서열 1의 뉴클레오티드 32408-33373, 서열 1의 뉴클레오티드 33401-33889, 서열 1의 뉴클레오티드 35042-35902, 서열 1의 뉴클레오티드 35930-36667, 서열 1의 뉴클레오티드 36773-36991, 서열 1의 뉴클레오티드 37052-38320, 서열 1의 뉴클레오티드 38636-39598, 서열 1의 뉴클레오티드 39635-40141, 서열 1의 뉴클레오티드 41369-42256, 서열 1의 뉴클레오티드 42314-43048, 서열 1의 뉴클레오티드 43163-43378, 서열 1의 뉴클레오티드 43524-54920, 서열 1의 뉴클레오티드 43626-44885, 서열 1의 뉴클레오티드 45204-46166, 서열 1의 뉴클레오티드 46950-47702, 서열 1의 뉴클레오티드 47811-48032, 서열 1의 뉴클레오티드 48087-49361, 서열 1의 뉴클레오티드 49680-50642, 서열 1의 뉴클레오티드 50670-51176, 서열 1의 뉴클레오티드 51534-52657, 서열 1의 뉴클레오티드 53697-54431, 서열 1의 뉴클레오티드 54540-54758, 서열 1의 뉴클레오티드 54935-62254, 서열 1의 뉴클레오티드 55028-56284, 서열 1의 뉴클레오티드 56600-57565, 서열 1의 뉴클레오티드 57593-58087, 서열 1의 뉴클레오티드 59366-60304, 서열 1의 뉴클레오티드 60362-61099, 서열 1의 뉴클레오티드 61211-61426, 서열 1의 뉴클레오티드 61427-62254, 서열 1의 뉴클레오티드 62369-63628, 서열 1의 뉴클레오티드 67334-68251 및 서열 1의 뉴클레오티드 1-68750의 상보 서열로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는, 에포틸론의 생합성에 관여하는 1종 이상의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자를 제공한다.
또한, 본 발명은 본 발명의 핵산 분자에 작동 가능하게 연결된 이종 프로모터 서열을 포함하는 키메라 유전자를 제공한다. 추가로, 본 발명은 이러한 키메라 유전자를 포함하는, 숙주 세포에 안정하게 형질전환될 수 있는 재조합 벡터를 제공한다. 또한, 본 발명은 이러한 키메라 유전자를 포함하며, 에포틸론을 생합성시키는 1종 이상의 폴리펩티드를 코딩하는 핵산 서열을 발현할 수 있는 재조합 숙주 세포를 제공한다. 바람직한 실시양태에서, 이 재조합 숙주 세포는 악티노마이세탈레스 (Actinomycetales) 목에 속하는 박테리아이며, 더욱 바람직한 실시양태에서는 숙주 세포가 스트렙토마이세스 균주이다. 다른 실시양태에서, 재조합 숙주 세포는 슈도모나드 (pseudomonad) 또는 대장균 (E. coli)과 같이 발효 가능한 임의의 다른 박테리아이다. 추가로, 본 발명은 본 발명의 핵산 분자를 포함하는 Bac 클론, 바람직하게는 Bac 클론 pEPO15를 제공한다.
다른 측면에서, 본 발명은 에포틸론 합성효소 도메인을 코딩하는 핵산 서열을 포함하는 단리된 핵산 분자를 제공한다.
한 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 2의 아미노산 11-437, 서열 4의 아미노산 7-432, 서열 5의 아미노산 39-457, 서열 5의 아미노산 1524-1950, 서열 5의 아미노산 3024-3449, 서열 5의 아미노산 5103-5525, 서열 6의 아미노산 35-454, 서열 6의 아미노산 1522-1946 및 서열 7의 아미노산 32-450으로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 β-케토아실-합성효소 (KS) 도메인이다. 이 실시양태에 따라, 상기 KS 도메인은 서열 2의 아미노산 11-437, 서열 4의 아미노산 7-432, 서열 5의 아미노산 39-457, 서열 5의 아미노산 1524-1950, 서열 5의 아미노산 3024-3449, 서열 5의 아미노산 5103-5525, 서열 6의 아미노산 35-454, 서열 6의 아미노산 1522-1946 및 서열 7의 아미노산 32-450으로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 7643-8920, 서열 1의 뉴클레오티드 16269-17546, 서열 1의 뉴클레오티드 21860-23116, 서열 1의 뉴클레오티드 26318-27595, 서열 1의 뉴클레오티드 30815-32092, 서열 1의 뉴클레오티드 37052-38320, 서열 1의 뉴클레오티드 43626-44885, 서열 1의 뉴클레오티드 48087-49361 및 서열 1의 뉴클레오티드 55028-56284로 이루어진 군으로부터 선택되는 뉴클레오티드 서열과 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 7643-8920, 서열 1의 뉴클레오티드 16269-17546, 서열 1의 뉴클레오티드 21860-23116, 서열 1의 뉴클레오티드 26318-27595, 서열 1의 뉴클레오티드 30815-32092, 서열 1의 뉴클레오티드 37052-38320, 서열 1의 뉴클레오티드 43626-44885, 서열 1의 뉴클레오티드 48087-49361 및 서열 1의 뉴클레오티드 55028-56284로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 7643-8920, 서열 1의 뉴클레오티드 16269-17546, 서열 1의 뉴클레오티드 21860-23116, 서열 1의 뉴클레오티드 26318-27595, 서열 1의 뉴클레오티드 30815-32092, 서열 1의 뉴클레오티드 37052-38320, 서열 1의 뉴클레오티드 43626-44885, 서열 1의 뉴클레오티드 48087-49361 및 서열 1의 뉴클레오티드 55028-56284로 이루어진 군으로부터 선택되는 것이 가장 바람직하다.
다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 2의 아미노산 543-864, 서열 4의 아미노산 539-859, 서열 5의 아미노산 563-884, 서열 5의 아미노산 2056-2377, 서열 5의 아미노산 3555-3876, 서열 5의 아미노산 5631-5951, 서열 6의 아미노산 561-881, 서열 6의 아미노산 2053-2373 및 서열 7의 아미노산 556-877로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 아실전이효소 (AT) 도메인이다. 이 실시양태에 따라, 상기 AT 도메인은 서열 2의 아미노산 543-864, 서열 4의 아미노산 539-859, 서열 5의 아미노산 563-884, 서열 5의 아미노산 2056-2377, 서열 5의 아미노산 3555-3876, 서열 5의 아미노산 5631-5951, 서열 6의 아미노산 561-881, 서열 6의 아미노산 2053-2373 및 서열 7의 아미노산 556-877로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 9236-10201, 서열 1의 뉴클레오티드 17865-18827, 서열 1의 뉴클레오티드 23431-24397, 서열 1의 뉴클레오티드 27911-28876, 서열 1의 뉴클레오티드 32408-33373, 서열 1의 뉴클레오티드 38636-39598, 서열 1의 뉴클레오티드 45204-46166, 서열 1의 뉴클레오티드 49680-50642 및 서열 1의 뉴클레오티드 56600-57565로 이루어진 군으로부터 선택되는 뉴클레오티드 서열과 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 9236-10201, 서열 1의 뉴클레오티드 17865-18827, 서열 1의 뉴클레오티드 23431-24397, 서열 1의 뉴클레오티드 27911-28876, 서열 1의 뉴클레오티드 32408-33373, 서열 1의 뉴클레오티드 38636-39598, 서열 1의 뉴클레오티드 45204-46166, 서열 1의 뉴클레오티드 49680-50642 및 서열 1의 뉴클레오티드 56600-57565로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 9236-10201, 서열 1의 뉴클레오티드 17865-18827, 서열 1의 뉴클레오티드 23431-24397, 서열 1의 뉴클레오티드 27911-28876, 서열 1의 뉴클레오티드 32408-33373, 서열 1의 뉴클레오티드 38636-39598, 서열 1의 뉴클레오티드 45204-46166, 서열 1의 뉴클레오티드 49680-50642 및 서열 1의 뉴클레오티드 56600-57565로 이루어진 군으로부터 선택되는 것이 가장 바람직하다.
또다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 2의 아미노산 974-1273, 서열 5의 아미노산 4433-4719, 서열 5의 아미노산 6542-6837 및 서열 7의 아미노산 1478-1790으로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 에노일 환원효소 (ER) 도메인이다. 이 실시양태에 따라, 상기 ER 도메인은 서열 2의 아미노산 974-1273, 서열 5의 아미노산 4433-4719, 서열 5의 아미노산 6542-6837 및 서열 7의 아미노산 1478-1790으로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다. 또한, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 10529-11428, 서열 1의 뉴클레오티드 35042-35902, 서열 1의 뉴클레오티드 41369-42256 및 서열 1의 뉴클레오티드 59366-60304로 이루어진 군으로부터 선택되는 뉴클레오티드 서열과 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 10529-11428, 서열 1의 뉴클레오티드 35042-35902, 서열 1의 뉴클레오티드 41369-42256 및 서열 1의 뉴클레오티드 59366-60304로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 10529-11428, 서열 1의 뉴클레오티드 35042-35902, 서열 1의 뉴클레오티드 41369-42256 및 서열 1의 뉴클레오티드 59366-60304로 이루어진 군으로부터 선택되는 것이 가장 바람직하다.
다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 2의 아미노산 1314-1385, 서열 4의 아미노산 1722-1792, 서열 5의 아미노산 1434-1506, 서열 5의 아미노산 2932-3005, 서열 5의 아미노산 5010-5082, 서열 5의 아미노산 7140-7211, 서열 6의 아미노산 1430-1503, 서열 6의 아미노산 3673-3745 및 서열 7의 아미노산 2093-2164로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 아실 캐리어 단백질 (ACP) 도메인이다. 이 실시양태에 따라, 상기 ACP 도메인은 서열 2의 아미노산 1314-1385, 서열 4의 아미노산 1722-1792, 서열 5의 아미노산 1434-1506, 서열 5의 아미노산 2932-3005, 서열 5의 아미노산 5010-5082, 서열 5의 아미노산 7140-7211, 서열 6의 아미노산 1430-1503, 서열 6의 아미노산 3673-3745 및 서열 7의 아미노산 2093-2164로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 11549-11764, 서열 1의 뉴클레오티드 21414-21626, 서열 1의 뉴클레오티드 26045-26263, 서열 1의 뉴클레오티드 30539-30759, 서열 1의 뉴클레오티드 36773-36991, 서열 1의 뉴클레오티드 43163-43378, 서열 1의 뉴클레오티드 47811-48032, 서열 1의 뉴클레오티드 54540-54758 및 서열 1의 뉴클레오티드 61211-61426으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열과 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 11549-11764, 서열 1의 뉴클레오티드 21414-21626, 서열 1의 뉴클레오티드 26045-26263, 서열 1의 뉴클레오티드 30539-30759, 서열 1의 뉴클레오티드 36773-36991, 서열 1의 뉴클레오티드 43163-43378, 서열 1의 뉴클레오티드 47811-48032, 서열 1의 뉴클레오티드 54540-54758 및 서열 1의 뉴클레오티드 61211-61426으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 11549-11764, 서열 1의 뉴클레오티드 21414-21626, 서열 1의 뉴클레오티드 26045-26263, 서열 1의 뉴클레오티드 30539-30759, 서열 1의 뉴클레오티드 36773-36991, 서열 1의 뉴클레오티드 43163-43378, 서열 1의 뉴클레오티드 47811-48032, 서열 1의 뉴클레오티드 54540-54758 및 서열 1의 뉴클레오티드 61211-61426으로 이루어진 군으로부터 선택되는 것이 가장 바람직하다.
다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 4의 아미노산 869-1037, 서열 5의 아미노산 3886-4048, 서열 5의 아미노산 5964-6132, 서열 6의 아미노산 2383-2551 및 서열 7의 아미노산 887-1051로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 탈수효소 (DH) 도메인이다. 이 실시양태에 따라, 상기 DH 도메인은 서열 4의 아미노산 869-1037, 서열 5의 아미노산 3886-4048, 서열 5의 아미노산 5964-6132, 서열 6의 아미노산 2383-2551 및 서열 7의 아미노산 887-1051로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 18855-19361, 서열 1의 뉴클레오티드 33401-33889, 서열 1의 뉴클레오티드 39635-40141, 서열 1의 뉴클레오티드 50670-51176 및 서열 1의 뉴클레오티드 57593-58087로 이루어진 군으로부터 선택되는 뉴클레오티드 서열과 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 18855-19361, 서열 1의 뉴클레오티드 33401-33889, 서열 1의 뉴클레오티드 39635-40141, 서열 1의 뉴클레오티드 50670-51176 및 서열 1의 뉴클레오티드 57593-58087로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 18855-19361, 서열 1의 뉴클레오티드 33401-33889, 서열 1의 뉴클레오티드 39635-40141, 서열 1의 뉴클레오티드 50670-51176 및 서열 1의 뉴클레오티드 57593-58087로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 4의 아미노산 1439-1684, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 6857-7101, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 3392-3636 및 서열 7의 아미노산 1810-2055로 이루어진 군으로부터 선택되는 것이 가장 바람직하다.
또다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 4의 아미노산 1439-1684, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 6857-7101, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 3392-3636 및 서열 7의 아미노산 1810-2055로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 β-케토-환원효소 (KR) 도메인이다. 이 실시양태에 따라, 상기 KR 도메인은 서열 4의 아미노산 1439-1684, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 6857-7101, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 3392-3636 및 서열 7의 아미노산 1810-2055로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 20565-21302, 서열 1의 뉴클레오티드 25184-25942, 서열 1의 뉴클레오티드 29678-30429, 서열 1의 뉴클레오티드 35930-36667, 서열 1의 뉴클레오티드 42314-43048, 서열 1의 뉴클레오티드 46950-47702, 서열 1의 뉴클레오티드 53697-54431 및 서열 1의 뉴클레오티드 60362-61099로 이루어진 군으로부터 선택되는 뉴클레오티드 서열과 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 20565-21302, 서열 1의 뉴클레오티드 25184-25942, 서열 1의 뉴클레오티드 29678-30429, 서열 1의 뉴클레오티드 35930-36667, 서열 1의 뉴클레오티드 42314-43048, 서열 1의 뉴클레오티드 46950-47702, 서열 1의 뉴클레오티드 53697-54431 및 서열 1의 뉴클레오티드 60362-61099로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 20565-21302, 서열 1의 뉴클레오티드 25184-25942, 서열 1의 뉴클레오티드 29678-30429, 서열 1의 뉴클레오티드 35930-36667, 서열 1의 뉴클레오티드 42314-43048, 서열 1의 뉴클레오티드 46950-47702, 서열 1의 뉴클레오티드 53697-54431 및 서열 1의 뉴클레오티드 60362-61099로 이루어진 군으로부터 선택되는 것이 가장 바람직하다.
부가의 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 6의 아미노산 2671-3045와 실질적으로 유사한 아미노산 서열을 포함하는 메틸전이효소 (MT) 도메인이다. 이 실시양태에 따라, 상기 MT 도메인은 서열 6의 아미노산 2671-3045를 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 51534-52657과 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 51534-52657의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 51534-52657인 것이 가장 바람직하다.
다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 7의 아미노산 2165-2439와 실질적으로 유사한 아미노산 서열을 포함하는 티오에스테라제 (TE) 도메인이다. 이 실시양태에 따라, 상기 MT 도메인은 서열 7의 아미노산 2165-2439를 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 61427-62254와 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 61427-62254의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 61427-62254인 것이 가장 바람직하다.
또다른 측면에서, 본 발명은 서열 3, 서열 3의 아미노산 72-81, 서열 3의 아미노산 118-125, 서열 3의 아미노산 199-212, 서열 3의 아미노산 353-363, 서열 3의 아미노산 549-565, 서열 3의 아미노산 588-603, 서열 3의 아미노산 669-684, 서열 3의 아미노산 815-821, 서열 3의 아미노산 868-892, 서열 3의 아미노산 903-912, 서열 3의 아미노산 918-940, 서열 3의 아미노산 1268-1274, 서열 3의 아미노산 1285-1297, 서열 3의 아미노산 973-1256 및 서열 3의 아미노산 1344-1351로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 비-리보솜 펩티드 합성효소를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자를 제공한다. 이 실시양태에 따라, 상기 비-리보솜 펩티드 합성효소는 서열 3, 서열 3의 아미노산 72-81, 서열 3의 아미노산 118-125, 서열 3의 아미노산 199-212, 서열 3의 아미노산 353-363, 서열 3의 아미노산 549-565, 서열 3의 아미노산 588-603, 서열 3의 아미노산 669-684, 서열 3의 아미노산 815-821, 서열 3의 아미노산 868-892, 서열 3의 아미노산 903-912, 서열 3의 아미노산 918-940, 서열 3의 아미노산 1268-1274, 서열 3의 아미노산 1285-1297, 서열 3의 아미노산 973-1256 및 서열 3의 아미노산 1344-1351로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다. 또한 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 11872-16104, 서열 1의 뉴클레오티드 12085-12114, 서열 1의 뉴클레오티드 12223-12246, 서열 1의 뉴클레오티드 12466-12507, 서열 1의 뉴클레오티드 12928-12960, 서열 1의 뉴클레오티드 13516-13566, 서열 1의 뉴클레오티드 13633-13680, 서열 1의 뉴클레오티드 13876-13923, 서열 1의 뉴클레오티드 14313-14334, 서열 1의 뉴클레오티드 14473-14547, 서열 1의 뉴클레오티드 14578-14607, 서열 1의 뉴클레오티드 14623-14692, 서열 1의 뉴클레오티드 15673-15693, 서열 1의 뉴클레오티드 15724-15762, 서열 1의 뉴클레오티드 14788-15639 및 서열 1의 뉴클레오티드 15901-15924로 이루어진 군으로부터 선택되는 뉴클레오티드 서열과 실질적으로 유사한 것이 바람직하다. 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 11872-16104, 서열 1의 뉴클레오티드 12085-12114, 서열 1의 뉴클레오티드 12223-12246, 서열 1의 뉴클레오티드 12466-12507, 서열 1의 뉴클레오티드 12928-12960, 서열 1의 뉴클레오티드 13516-13566, 서열 1의 뉴클레오티드 13633-13680, 서열 1의 뉴클레오티드 13876-13923, 서열 1의 뉴클레오티드 14313-14334, 서열 1의 뉴클레오티드 14473-14547, 서열 1의 뉴클레오티드 14578-14607, 서열 1의 뉴클레오티드 14623-14692, 서열 1의 뉴클레오티드 15673-15693, 서열 1의 뉴클레오티드 15724-15762, 서열 1의 뉴클레오티드 14788-15639 및 서열 1의 뉴클레오티드 15901-15924로 이루어진 군으로부터 선택되는 뉴클레오티드 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분 각각과 동일한 서열의 연속적인 20, 25, 30, 35, 40, 45 또는 50 (바람직하게는 20) 염기쌍 부분을 포함하는 것이 더욱 바람직하다. 게다가, 이 실시양태에 따라, 상기 뉴클레오티드 서열은 서열 1의 뉴클레오티드 11872-16104, 서열 1의 뉴클레오티드 12085-12114, 서열 1의 뉴클레오티드 12223-12246, 서열 1의 뉴클레오티드 12466-12507, 서열 1의 뉴클레오티드 12928-12960, 서열 1의 뉴클레오티드 13516-13566, 서열 1의 뉴클레오티드 13633-13680, 서열 1의 뉴클레오티드 13876-13923, 서열 1의 뉴클레오티드 14313-14334, 서열 1의 뉴클레오티드 14473-14547, 서열 1의 뉴클레오티드 14578-14607, 서열 1의 뉴클레오티드 14623-14692, 서열 1의 뉴클레오티드 15673-15693, 서열 1의 뉴클레오티드 15724-15762, 서열 1의 뉴클레오티드 14788-15639 및 서열 1의 뉴클레오티드 15901-15924로 이루어진 군으로부터 선택되는 것이 가장 바람직하다.
추가로, 본 발명은 서열 2 내지 23으로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산 분자를 제공한다.
다른 측면에 따라, 본 발명은 또한 정제 가능하고 암 치료제와 같은 제약 제형에 사용하기에 충분한 양으로 에포틸론과 같은 폴리케티드를 재조합 제조하는 방법을 제공한다. 이러한 제조 방법의 특이한 이점은 제조된 분자에 키랄성이 있고, 유전자 이식 유기체에서의 제조로 인해 몇몇 거울 이성질체가 낮은 활성을 나타낼 수 있는 라세미 혼합물 군집의 생성을 피할 수 있다는 것이다. 특히, 본 발명은 (a) 에포틸론의 생합성에 관여하는 1종 이상의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 본 발명의 핵산 분자에 작동 가능하게 연결된 이종 프로모터 서열을 포함하는 키메라 유전자를 숙주에 도입하는 단계, 및 (b) 숙주에서 에포틸론이 생합성되는 조건으로 숙주를 배양하는 단계를 포함하는, 재조합 숙주에서 에포틸론의 이종 발현 방법을 제공한다. 또한, 본 발명은 (a) 상기 방법에 의해 재조합 숙주에서 에포틸론을 발현시키는 단계, 및 (b) 재조합 숙주에서 에포틸론을 추출하는 단계를 포함하는 에포틸론의 제조 방법을 제공한다.
또다른 측면에 따라, 본 발명은 에포틸론 합성효소 도메인으로 이루어진 아미노산 서열을 포함하는 단리된 폴리펩티드를 제공한다.
한 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 2의 아미노산 11-437, 서열 4의 아미노산 7-432, 서열 5의 아미노산 39-457, 서열 5의 아미노산 1524-1950, 서열 5의 아미노산 3024-3449, 서열 5의 아미노산 5103-5525, 서열 6의 아미노산 35-454, 서열 6의 아미노산 1522-1946 및 서열 7의 아미노산 32-450으로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 β-케토아실-합성효소 (KS) 도메인이다. 이 실시양태에 따라, 상기 KS 도메인은 서열 2의 아미노산 11-437, 서열 4의 아미노산 7-432, 서열 5의 아미노산 39-457, 서열 5의 아미노산 1524-1950, 서열 5의 아미노산 3024-3449, 서열 5의 아미노산 5103-5525, 서열 6의 아미노산 35-454, 서열 6의 아미노산 1522-1946 및 서열 7의 아미노산 32-450으로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다.
다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 2의 아미노산 543-864, 서열 4의 아미노산 539-859, 서열 5의 아미노산 563-884, 서열 5의 아미노산 2056-2377, 서열 5의 아미노산 3555-3876, 서열 5의 아미노산 5631-5951, 서열 6의 아미노산 561-881, 서열 6의 아미노산 2053-2373 및 서열 7의 아미노산 556-877로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 아실전이효소 (AT) 도메인이다. 이 실시양태에 따라, 상기 AT 도메인은 서열 2의 아미노산 543-864, 서열 4의 아미노산 539-859, 서열 5의 아미노산 563-884, 서열 5의 아미노산 2056-2377, 서열 5의 아미노산 3555-3876, 서열 5의 아미노산 5631-5951, 서열 6의 아미노산 561-881, 서열 6의 아미노산 2053-2373 및 서열 7의 아미노산 556-877로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다.
또다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 2의 아미노산 974-1273, 서열 5의 아미노산 4433-4719, 서열 5의 아미노산 6542-6837 및 서열 7의 아미노산 1478-1790으로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 에노일 환원효소 (ER) 도메인이다. 이 실시양태에 따라, 상기 ER 도메인은 서열 2의 아미노산 974-1273, 서열 5의 아미노산 4433-4719, 서열 5의 아미노산 6542-6837 및 서열 7의 아미노산 1478-1790으로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다.
다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 2의 아미노산 1314-1385, 서열 4의 아미노산 1722-1792, 서열 5의 아미노산 1434-1506, 서열 5의 아미노산 2932-3005, 서열 5의 아미노산 5010-5082, 서열 5의 아미노산 7140-7211, 서열 6의 아미노산 1430-1503, 서열 6의 아미노산 3673-3745 및 서열 7의 아미노산 2093-2164로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 아실 캐리어 단백질 (ACP) 도메인이다. 이 실시양태에 따라, 상기 ACP 도메인은 서열 2의 아미노산 1314-1385, 서열 4의 아미노산 1722-1792, 서열 5의 아미노산 1434-1506, 서열 5의 아미노산 2932-3005, 서열 5의 아미노산 5010-5082, 서열 5의 아미노산 7140-7211, 서열 6의 아미노산 1430-1503, 서열 6의 아미노산 3673-3745 및 서열 7의 아미노산 2093-2164로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다.
다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 4의 아미노산 869-1037, 서열 5의 아미노산 3886-4048, 서열 5의 아미노산 5964-6132, 서열 6의 아미노산 2383-2551 및 서열 7의 아미노산 887-1051로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 탈수효소 (DH) 도메인이다. 이 실시양태에 따라, 상기 DH 도메인은 서열 4의 아미노산 869-1037, 서열 5의 아미노산 3886-4048, 서열 5의 아미노산 5964-6132, 서열 6의 아미노산 2383-2551 및 서열 7의 아미노산 887-1051로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다.
또다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 4의 아미노산 1439-1684, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 6857-7101, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 3392-3636 및 서열 7의 아미노산 1810-2055로 이루어진 군으로부터 선택되는 아미노산 서열과 실질적으로 유사한 아미노산 서열을 포함하는 β-케토-환원효소 (KR) 도메인이다. 이 실시양태에 따라, 상기 KR 도메인은 서열 4의 아미노산 1439-1684, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 6857-7101, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 3392-3636 및 서열 7의 아미노산 1810-2055로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 것이 바람직하다.
부가의 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 6의 아미노산 2671-3045와 실질적으로 유사한 아미노산 서열을 포함하는 메틸전이효소 (MT) 도메인이다. 이 실시양태에 따라, 상기 MT 도메인은 서열 6의 아미노산 2671-3045를 포함하는 것이 바람직하다.
다른 실시양태에 따라, 에포틸론 합성효소 도메인은 서열 7의 아미노산 2165-2439와 실질적으로 유사한 아미노산 서열을 포함하는 티오에스테라제 (TE) 도메인이다. 이 실시양태에 따라, 상기 MT 도메인은 서열 7의 아미노산 2165-2439를 포함하는 것이 바람직하다.
본 발명의 다른 측면 및 이점은 하기 본 발명의 기술에 대한 연구 및 무제한적 실시예에 의해 명백해질 것이다.
<정의>
본 발명을 기술함에 있어서 하기의 용어가 사용될 것이며, 이 용어들은 하기 기재된 바와 같이 정의될 것이다.
결합된 및 작동 가능하게 연결된: 2개의 DNA 서열이 물리적 및 기능적으로 관련되어 있음. 예를 들면, 프로모터 또는 조절 DNA 서열이 RNA 또는 단백질을 코딩하는 DNA 서열과 작동적으로 연결되어 있는 상태, 즉 조절 DNA 서열이 코딩 DNA 또는 구조 DNA 서열의 발현 수준에 영향을 미치는 상황에 처해 있는 경우 프로모터 또는 조절 DNA 서열이 코딩 DNA에 "결합된" 상태라고 한다.
키메라 유전자: 프로모터 또는 조절 DNA 서열이 mRNA를 코딩하여 단백질로서 발현되는 DNA 서열과 작동적으로 연결되거나 결합되어, 상기 조절 DNA 서열이 결합된 DNA 서열의 전사 또는 발현을 조절할 수 있는 재조합 DNA 서열. 원래는 키메라 유전자의 조절 DNA 서열이 자연상태에 나타나는 바와 같이 결합된 DNA 서열에 작동적으로 연결되어 있지는 않다.
코딩 DNA 서열: 유기체에서 번역되어 단백질을 생성하는 DNA 서열.
도메인: 정해진 독특한 활성에 필수적인 폴리케티드 합성효소의 일부분. 예를 들면, 아실 캐리어 단백질 (ACP), β-케토합성효소 (KS), 아실전이효소 (AT), β-케토환원효소 (KR), 탈수효소 (DH), 에노일환원효소 (ER) 및 티오에스테라제 (TE) 도메인이 포함된다.
에포틸론: 원래 소란지움 셀룰로숨이라는 박테리아의 So ce90 균주에 의해 생성되는 16-원 거대고리화 폴리케티드를 의미하며, 이는 탁솔의 생물학적 효과를 모방한다. 본원에서, "에포틸론"이란 에포틸론 A 및 에포틸론 B 뿐만 아니라 WO 98-25929호에 기재된 바와 같은 이들의 유사체를 포함하는 폴리케티드 부류이다.
에포틸론 합성효소: 에포틸론을 생합성시키는 폴리케티드 합성효소.
유전자: 게놈 내에 위치하며, 상기 코딩 DNA 서열 이외에 코딩 서열 중 발현 (즉, 전사 및 번역)을 조절하는 기타 일차적인 DNA 서열을 포함하는 한정된 영역.
이종 DNA 서열: 자연 발생적인 DNA 서열이 다수의 카피로 존재하는 비-자연 발생적인 DNA 서열을 포함하는, 원래는 자신이 도입되는 숙주와 연관되어 있지 않은 DNA 서열.
동종 DNA 서열: 원래 자신이 도입되는 숙주와 연관되어 있는 DNA 서열.
동형 재조합: 동종 DNA 분자 사이에 DNA 단편의 상호 교체.
단리된: 본 발명에서, 단리된 핵산 분자 또는 단리된 효소는 사람의 손에 의해 자연적인 환경에서 분리되어 존재하는, 따라서 자연 상태의 생성물이 아닌 핵산 분자 또는 효소이다. 단리된 핵산 분자 또는 효소는 정제된 형태로 존재하거나, 재조합 숙주 세포와 같이 비-자연적인 환경에 존재할 수 있다.
모듈: 폴리케티드 생합성을 1회 수행, 즉 축합 1 단계 및 이와 연관된 모든 β-카르보닐 가공 단계를 수행하는데 필요한 개개의 활성체를 모두 코딩하는 유전자 요소. 각각의 모듈은 생합성의 축합 부분을 수행하기 위한 ACP, KS 및 AT 활성체, 및 β-카르보닐 가공에 영향을 미치는 선별된 축합-후 활성체를 코딩한다.
NRPS: 아미노산 아데닐화, 에피머화, N-메틸화, 고리화, 펩티딜 캐리어 단백질 및 축합 도메인을 포함하는, 아미노산을 이차대사 물질로 도입시키는 효소 활성의 복합체인, 리보솜 이외의 공간에서 폴리펩티드를 합성하는 효소. 관능성 NRPS는 아미노산의 이차대사 물질로의 도입을 촉매한다.
NRPS 유전자: 양립할 수 있는 1종 이상의 조절 요소의 조절하에 에포틸론 A 및 B와 같은 관능성 이차대사 물질의 생성을 위한 NRPS를 코딩하는 1종 이상의 유전자.
핵산 분자: 임의의 원천으로부터 단리될 수 있는 단일- 또는 이중-가닥 DNA 또는 RNA의 선형 단편. 본 발명에서는 핵산 분자가 DNA 단편인 것이 바람직하다.
ORF: 오픈 리딩 프레임 (Open Reading Frame).
PKS: 케토환원효소, 탈수효소, 아실 캐리어 단백질, 에놀환원효소, 케토아실 ACP 합성효소 및 아실전이효소와 같이 폴리케티드의 생합성에 관여하는 효소 활성체 (도메인)의 복합체인 폴리케티드 합성효소. 관능성 PKS는 폴리케티드의 합성을 촉매한다.
PKS 유전자: 양립할 수 있는 1종 이상의 조절 요소의 조절하에 에포틸론 A 및 B와 같은 관능성 폴리케티드의 생성에 필요한 다양한 폴리케티드를 코딩하는 1종 이상의 유전자.
실질적으로 유사한: 핵산의 경우, 비교 핵산 분자와의 서열 동일성이 60% 이상인 핵산 분자. 바람직한 실시양태에서, 실질적으로 유사한 DNA 서열은 비교 DNA 서열에 80% 이상의 서열 동일성이 있고, 더욱 바람직한 실시양태에서는 90% 이상의 서열 동일성이 있으며, 가장 바람직한 실시양태에서는 95% 이상의 서열 동일성이 있다. 실질적으로 유사한 DNA 서열은 비교 DNA 서열에 의해 코딩되는 단백질 또는 펩티드와 실질적으로 동일한 활성을 갖는 단백질 또는 펩티드를 코딩하는 것이 바람직하다. 통상, 실질적으로 유사한 뉴클레오티드 서열은, 7% 황산 도데실 나트륨 (SDS), 0.5M NaPO4(pH 7.0) 및 1 mM EDTA 용액에서 50℃의 혼성화 조건, 및 2X SSC 및 1% SDS 용액에서 50℃의 세척 조건하에서 비교 핵산 분자 또는 그의 단편에 혼성화된다. 단백질 또는 펩티드의 경우, 실질적으로 유사한 아미노산 서열은 비교 단백질 또는 펩티드의 아미노산 서열에 90% 이상의 서열 동일성이 있는 아미노산 서열이다.
형질전환: 이종 핵산 분자를 숙주 세포 또는 유기체에 도입하는 과정.
형질전환된 / 유전자 이식된 / 재조합: 이종 핵산 분자가 도입된, 박테리아와 같은 숙주 유기체를 칭함. 핵산 분자는 숙주의 게놈에 안정하게 도입되거나 염색체외 분자로서 존재할 수도 있다. 이와 같은 염색체외 분자는 스스로 복제할 수 있다. 형질전환된 세포, 조직 또는 식물은 형질전환 과정의 최종 산물 뿐만 아니라 그의 유전자 이식 자손을 포함하는 것으로 이해된다. "비-형질전환된", "비-유전자 이식된" 또는 "비-재조합" 숙주는 이종 핵산 분자를 함유하지 않는, 야생형 유기체 (즉, 박테리아)를 의미한다.
뉴클레오티드는 아데닌 (A), 시토신 (C), 티민 (T) 및 구아닌 (G)의 표준 약자에 의해 기본 염기를 표시한다. 이와 유사하게, 아미노산은 알라닌 (Ala, A), 아르기닌 (Arg, R), 아스파라긴 (Asn, N), 아스파르트산 (Asp, D), 시스테인 (Cys, C), 글루타민 (Gln, Q), 글루탐산 (Glu, E), 글리신 (Gly, G), 히스티딘 (His, H), 이소류신 (Ile, I), 류신 (Leu, L), 리신 (lys, K), 메티오닌 (Met, M), 페닐알라닌 (Phe, F), 프롤린 (Pro, P), 세린 (Ser, S), 트레오닌 (Thr, T), 트립토판 (Trp, W), 티로신 (Tyr, Y) 및 발린 (Val, V)을 의미한다. 추가로 (Xaa, X)는 임의의 아미노산을 의미한다.
<서열목록의 서열에 대한 설명>
서열 1은 에포틸론 생합성 유전자를 포함하는, 22개의 오픈 리딩 프레임이 있는 68750 bp 콘티그 (contig)의 뉴클레오티드 서열이다.
서열 2 는 epoA (서열 1의 뉴클레오티드 7610-11875)에 의해 코딩되는 Ⅰ형 폴리케티드 합성효소 (EPOS A)의 단백질 서열이다.
서열 3은 epoP (서열 1의 뉴클레오티드 11872-16104)에 의해 코딩되는 비-리보솜 펩티드 합성효소 (EPOS P)의 단백질 서열이다.
서열 4는 epoB (서열 1의 뉴클레오티드 16251-21749)에 의해 코딩되는 Ⅰ형 폴리케티드 합성효소 (EPOS B)의 단백질 서열이다.
서열 5는 epoC (서열 1의 뉴클레오티드 21746-43519)에 의해 코딩되는 Ⅰ형 폴리케티드 합성효소 (EPOS C)의 단백질 서열이다.
서열 6은 epoD (서열 1의 뉴클레오티드 43524-54920)에 의해 코딩되는 Ⅰ형 폴리케티드 합성효소 (EPOS D)의 단백질 서열이다.
서열 7은 epoE (서열 1의 뉴클레오티드 54935-62254)에 의해 코딩되는 Ⅰ형 폴리케티드 합성효소 (EPOS E)의 단백질 서열이다.
서열 8은 epoF (서열 1의 뉴클레오티드 62369-63628)에 의해 코딩되는 Ⅰ형 폴리케티드 합성효소 (EPOS F)의 단백질 서열이다..
서열 9는 orf1 (서열 1의 뉴클레오티드 1-1826)에 의해 코딩되는 부분적인 단백질 서열 (부분 Orf 1)이다.
서열 10은 orf2 (서열 1의 역방향 상보 가닥 뉴클레오티드 3171-1900)에 의해 코딩되는 단백질 서열 (Orf 2)이다.
서열 11은 orf3 (서열 1의 뉴클레오티드 3415-5556)에 의해 코딩되는 단백질 서열 (Orf 3)이다.
서열 12는 orf4 (서열 1의 역방향 상보 가닥 뉴클레오티드 5992-5612)에 의해 코딩되는 단백질 서열 (Orf 4)이다.
서열 13은 orf5 (서열 1의 뉴클레오티드 6226-6675)에 의해 코딩되는 단백질 서열 (Orf 5)이다.
서열 14는 orf6 (서열 1의 뉴클레오티드 63779-64333)에 의해 코딩되는 단백질 서열 (Orf 6)이다.
서열 15는 orf7 (서열 1의 역방향 상보 가닥 뉴클레오티드 64290-63853)에 의해 코딩되는 단백질 서열 (Orf 7)이다.
서열 16은 orf8 (서열 1의 뉴클레오티드 64363-64920)에 의해 코딩되는 단백질 서열 (Orf 8)이다.
서열 17은 orf9 (서열 1의 역방향 상보 가닥 뉴클레오티드 64727-64287)에 의해 코딩되는 단백질 서열 (Orf 9)이다.
서열 18은 orf10 (서열 1의 뉴클레오티드 65063-65767)에 의해 코딩되는 단백질 서열 (Orf 10)이다.
서열 19는 orf11 (서열 1의 역방향 상보 가닥 뉴클레오티드 65874-65008)에 의해 코딩되는 단백질 서열 (Orf 11)이다.
서열 20은 orf12 (서열 1의 역방향 상보 가닥 뉴클레오티드 66338-65871)에 의해 코딩되는 단백질 서열 (Orf 12)이다.
서열 21은 orf13 (서열 1의 뉴클레오티드 66667-67137)에 의해 코딩되는 단백질 서열 (Orf 13)이다.
서열 22는 orf14 (서열 1의 뉴클레오티드 67334-68251)에 의해 코딩되는 단백질 서열 (Orf 14)이다.
서열 23은 orf15 (서열 1의 뉴클레오티드 68346-68750)에 의해 코딩되는 부분적인 단백질 서열 (부분 Orf 15)이다.
서열 24는 유니버설 (universal) 역방향 PCR 프라이머 서열이다.
서열 25는 유니버설 순방향 PCR 프라이머 서열이다.
서열 26은 NH24 말단 "B" PCR 프라이머 서열이다.
서열 27은 NH2 말단 "A" PCR 프라이머 서열이다.
서열 28은 NH2 말단 "B" PCR 프라이머 서열이다.
서열 29는 pEPO15-NH6 말단 "B" PCR 프라이머 서열이다.
서열 30은 pEPO15-H2.7 말단 "A" PCR 프라이머 서열이다.
하기의 재료가 특허 절차를 위한 미생물 기탁의 국제적 승인에 관한 부다페스트 조약하에 미국 61604 일리노이주 페오리아 노쓰 유니버시티 스트리트 1815에 위치한 애그리컬처럴 리서치 서비스 패턴트 컬쳐 콜렉션 (NRRL)에 기탁되었다. 특허 허여시 기탁된 재료의 이용에 대한 모든 제한은 제거될 것이다.
기탁된 재료 허가 번호 기탁일
pEPO15pEPO32 NRRL B-30033NRRL B-30119 1998년 6월 11일1999년 4월 16일
<발명의 상세한 설명>
에포틸론의 생합성에 관여하는 유전자는 본 발명에 따른 기술을 사용하여 단리할 수 있다. 에포틸론 생합성 유전자의 바람직한 단리 방법은 에포틸론 A 및 B를 생성하는 것으로 확인된 유기체로부터 게놈 DNA를 단리하는 단계, 적합한 플라스미드 또는 벡터상의 상기 단리된 DNA를 정상적으로는 폴리케티드를 생성하지 않는 숙주 유기체에 전달하는 단계, 및 에포틸론 생성 능력이 부여된 형질전환 숙주 콜로니를 확인하는 단계를 필요로 한다. λ::Tn5 트랜스포손 (transposon) 돌연변이화 (de Bruijn & Lupski, Gene 27:131-149 (1984))와 같은 기술을 이용하여, 형질전환시킬 에포틸론-제공 DNA의 정확한 영역을 명확하게 결정할 수 있다. 다른 방법으로 또는 추가로, 형질전환시킬 에포틸론-제공 DNA는 더 작은 단편 및 추가로 특성화될 에포틸론-제공 능력을 유지하는 가장 작은 단편으로 분해될 수 있다. 에포틸론 생성 능력이 없는 숙주 유기체는 폴리케티드가 유래되는 유기체와 상이한 종일 수 있는 반면, 이 기술의 변형은 돌연변이화에 의해 에포틸론 생성 능력이 방해된 숙주에 동일한 숙주의 DNA를 형질전환하는 방법에 관한 것이다. 이 방법에서, 에포틸론 생성 유기체를 돌연변이화하고 에포틸론을 생성하지 않는 돌연변이체를 단리한다. 이 돌연변이체는 에포틸론을 생성하는 부모세대 균주로부터 단리된 게놈 DNA에 의해 보상된다.
에포틸론 생합성에 필요한 유전자를 단리하는데 사용될 수 있는 기술에 대한 추가의 실시예는 트랜스포손 돌연변이화를 이용하여, 돌연변이화 후에 폴리케티드를 생성하지 못하는 에포틸론 생성 유기체의 돌연변이체를 만드는 것이다. 따라서, 숙주 게놈에서 에포틸론을 생성하는 영역은 트랜스포손에 의해 표지되고, 이를 회수하여 부모세대 균주로부터 천연 유전자를 단리하는데 프로브로 사용할 수 있다. 폴리케티드 합성에 필요하고 공지된 PKS 유전자와 유사한 PKS 유전자는 리파마이신 또는 소라펜의 생합성 유전자와 같이 서열이 알려진 생합성 유전자와의 서열 상동성에 의해 단리될 수 있다. 상동성에 의한 단리에 적합한 기술에는 DNA 혼성화에 의한 표준 라이브러리 스크리닝이 포함된다.
유전자로부터 수득가능한 DNA 단편 또는 공지된 폴리케티드의 합성에 기능하는 기타 DNA 서열이 프로브 분자로 사용하기에 바람직하다. 바람직한 프로브 분자는 소라펜 PKS (미국 특허 제5,716,849호) 네 번째 모듈의 케토 합성효소 도메인을 코딩하는 1.2 kb의 SmaⅠ 단편을 포함하며, 더욱 바람직한 프로브 분자는 리파마이신 PKS (Schupp et al., FEMS Microbiology Letters 159:201-207 (1998))의 첫 번째 및 두 번째 모듈의 β-케토아실 합성효소 도메인을 포함한다. 이들은 에포틸론 생합성에 관여하는 유전자를 단리하기 위해 에포틸론 생성 유기체의 유전자 라이브러리를 스크린하는 프로브로 사용될 수 있다.
PKS 유전자를 단리하는데 통상적으로 잘 알려진 난점 및, 특히 에포틸론 생합성 유전자의 단리시 직면할 것으로 예상되는 난점에도 불구하고, 본 명세서에 기재된 방법을 이용하여, 놀랍게도 에포틸론 A 및 B가 폴리케티드를 생성하는 유기체로부터 클로닝하였다. 본 명세서에 기재된 유전자 조작 및 재조합 생성 방법을 이용하여 클로닝된 PKS 유전자는 유전자 이식 숙주 유기체에서 변형 및 발현될 수 있다.
단리된 에포틸론 생합성 유전자는 이종 숙주에서 발현되어 천연 숙주에서 생성되는 것보다 훨씬 더 효율적으로 폴리케티드를 생성할 수 있었다. 이러한 유전자 조작 기술은 입수가능한 상이한 숙주에 특이적이며, 이는 당업계에 공지되어 있다. 예를 들면, 이종 유전자는 본원에 참고문헌으로 포함되는 문헌 [McDaniel et al., Science 262:1546-1550 (1993)] 및 [Kao et al., Science 265:509-512 (1994)]에 기재된 바와 같은 기술을 이용하여 스트렙토마이세스 및 기타 악티노마이세테스 (Actinomycetes)에서 발현될 수 있다. 또한, 본원에 참고문헌으로 포함되는 문헌 [Rowe et al., Gene 216:215-223 (1998)], [Holmes et al., EMBO Jorunal 12(8):3183-3191 (1993)] 및 [Bibb et al., Gene 38:215-226 (1985)]을 참조할 수 있다.
다른 방법으로, 폴리케티드 생합성에 관여하는 유전자 (즉, 에포틸론 생합성 유전자)는 또한 슈도모나드 및 대장균과 같은 다른 숙주 유기체에서 발현될 수 있다. 이러한 유전자 조작 기술은 입수가능한 상이한 숙주에 특이적이며, 이는 당업계에 공지되어 있다. 예를 들면, PKS 유전자는 T7 프로모터를 이용하는 pT7-7 벡터를 사용하여 대장균에서 성공적으로 발현되었다. 이는 본원에 참고문헌으로 포함되는 문헌 [Tabor et al., Proc. Natl. Acad. Sci. USA 82:1074-1078 (1985)]을 참조할 수 있다. 또한, 발현 벡터인 pKK223-3 및 pKK223-2은 tac 또는 trc 프로모터의 조절하에 전사 또는 번역 융합으로 대장균에서 이종 유전자의 발현에 사용될 수 있다. 다중 ORF를 코딩하는 오페론을 발현시킴에 있어서, 가장 간단한 방법은 이 오페론을 전사 융합으로 pKK223-3과 같은 벡터에 삽입하여 사용될 이종 유전자의 리보솜 결합 부위를 인지하게하는 것이다. 바실러스와 같은 그람 양성 종에서의 과다 발현 기술은 당업계에 공지되어 있으며, 본 발명에서 사용될 수 있다 (Quax et al., Industrial Microorganisms: Basic and Applied Molecular Genetics, Eds. Baltz et al., American Society for Microbiology, Washington (1993)).
본 발명의 에포틸론 생합성 유전자의 발현에 사용될 수 있는 기타 발현 시스템에는 효모 및 베큘로바이러스 발현 시스템이 포함된다. 예를 들면, 문헌 ["The Expression of Recombinant Proteins in Yeasts," Sudbery, P.E., Curr. Opin. Biotechnol. 7(5):517-524 (1996)], ["Methods for Expressing Recombinant Proteins in Yeast," Mackay, et al., Editor(s): Carey, Paul R., Protein Eng. Des. 105-153, Publisher: Academic, San Diego, Calif (1996)], ["Expression of heterologous gene products in yeast," Pichuantes, et al., Editor(s): Cleland, J. L., Craik, C. S., Protein Eng. 129-161, Publisher: Wiley-Liss, New York, N. Y (1996)], WO 98/27203, [Kealey et al., Proc. Natl. Acad. Sci. USA 95: 505-509 (1998)], ["Insect Cell Culture: Recent Advances, Bioengineering Challenges And Implications In Protein Production," Palomares, et al., Editor(s): Galindo, Enrique; Ramirez, Octavio T., Adv. Bioprocess Eng. Vol. II, Invited Pap. Int. Symp., 2nd (1998) 25-52, Publisher: Kluwer, Dordrecht, Neth], ["Baculovirus Expression Vectors," Jarvis, Donald L., Editor(s): Miller, Lois K., Baculoviruses 389-431, Publisher: Plenum, New York, N. Y. (1997)], ["Production Of Heterologous Proteins Using The Baculovirus/Insect Expression System," Grittiths, et al., Me-thods Mol. Biol. (Totowa, N. J.) 75 (Basic Cell Culture Protocols (2nd Edition)) 427-440 (1997)] 및 ["Insect Cell Expression Technology," Luckow, Verne A., Protein Eng. 183-218, Publisher: Wiley-Liss, New York, N. Y. (1996)]을 참조할 수 있으며, 상기 문헌들은 모두 본원에 참고문헌으로 포함된다.
이종 숙주에서 PKS 유전자를 발현시 고려해야 할 다른 점은, PKS 효소가 폴리케티드를 합성하기 전에 포스포판테닐화에 의해 번역-후 변형된다는 것이다. 그러나, Ⅰ형 PKS 효소를 이와 같이 변형시키는 효소인 포스포판테닐 (P-판트) 전이효소가 정상 상태에서는 대장균과 같은 대부분의 숙주에 존재하지 않는다. 이 문제점은 본원에 참고문헌으로 포함되는 [Kealey et al.,Proc. Natl. Acad. Sci. USA 95: 505-509 (1998)]에 기재된 바와 같이, 이종 숙주에서 PKS 유전자와 함께 P-판트 전이효소를 동시에 발현시켜 해결할 수 있다.
따라서, 폴리케티드의 생성을 위한 숙주 유기체는 조작의 용이성, 생장 (즉, 발효)의 신속성, 번역후 과정 및 이를 수행할 수 있는 분자적 장치의 존재, 및 과다 생성된 폴리케티드에 대한 감수성 결여 등을 기준으로 선택한다. 가장 바람직한 숙주 유기체는 스트렙토마이세스의 균주와 같은 악티노마아세테스이다. 다른 바람직한 숙주 유기체는 슈도모나드 및 대장균이다. 상기 기재된 폴리케티드 생성 방법은 이러한 화합물의 제조에 있어서 현행 사용되는 기술보다 월등한 이점을 갖는다. 이러한 이점에는 제조 비용의 저렴함, 보다 많은 양의 화합물 제조 능력 및 바람직한 생물학적 거울 이성질체 화합물의 제조 능력이 포함되며, 이는 유기 합성에 의해 필연적으로 생성되는 라세미 혼합물과는 상반된다. 이종 숙주에 의해 생성되는 화합물은 농학 뿐만 아니라 의약 (예를 들면, 에포틸론의 경우 암 치료)에도 사용할 수 있다.
본 발명은 하기의 상세한 실시예를 참조로 추가로 설명될 것이다. 이들 실시예는 단지 예시하기 위한 목적으로 제공되며, 구체화된 범위로 제한하려는 의도는 아니다. 본원에 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 잘 알려져 있고, 문헌 [Ausubel (ed.), Current Protocols in Molecular Biology, John Wiley and Sons, Inc. (1994)], [T. Maniatis, E. F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor laboratory, Cold Spring Harbor, NY (1989)] 및 [T.J. Silhavy, M.L. Berman, and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984)]에 기재되어 있다.
<실시예 1> 에포틸론을 생성하는 소란지움 셀룰로숨 균주의 배양
소란지움 셀룰로숨 균주 90 (DSM 6773, Deutsche Sammlung von Mikroorganismen und Zellkulturen, Braunschweig)을 스트릭 (streak)으로 접종하고, pH가 약 7.4인 SolE 배지 (0.35% 포도당, 0.05% 트립톤, 0.15% MgSO4x7H2O, 0.05% 암모늄 술페이트, 0.1% CaCl2, 0.006% K2HPO4, 0.01% 나트륨 디티오나이트, 0.0008% Fe-EDTA, 1.2% HEPES, 멸균된 에스. 셀룰로숨 배양물 3.5% [vol/vol])의 아가 플레이트 상에서 배양 (30℃)하였다. 약 1 cm2의 세포를 취하여 5 ㎖의 G51t 배지 (0.2% 포도당, 0.5% 전분, 0.2% 트립톤, 0.1% 프로비온 S, 0.05% CaCl2x2H20, 0.05% MgSO4x7H20, 1.2% HEPES, pH 약 7.4)에 접종한 후, 30℃에서 225 rpm으로 진탕 배양하였다. 4일 후에 배양물을 50 ㎖의 G51t 배지에 옮기고, 상기와 같이 5일 동안 배양하였다. 이 배양물을 500 ㎖의 G51t 배지에 접종하는데 사용하고, 상기와 같이 6일 동안 배양하였다. 배양물을 4000 rpm에서 10분 동안 원심분리하고, 세포 펠릿을 50 ㎖의 G51t에 재현탁하였다.
<실시예 2> 박테리아 인공 염색체 (Bac) 라이브러리의 생성
Bac 라이브러리를 생성하기 위해, 상기 실시예 1에 기재된 바와 같이 배양된 에스. 셀룰로숨 세포를 아가로오스 블록에 심어 용해하고, 유리된 게놈 DNA를 제한효소 HindⅢ로 부분적으로 절단하였다. 펄스-필드 (pulsed-field) 전기영동에 의해 절단된 DNA를 아가로오스 겔 상에서 분리하였다. 큰 (약 90-150 kb) DNA 단편을 아가로오스 겔로부터 단리하여 pBelobacⅡ 벡터에 라이게이션하였다. pBelobacⅡ 벡터는 클로람페니콜 (Chlroamphenicol)에 대한 내성 단백질을 코딩하는 유전자, 적합한 배지에서 색깔 (푸른색/흰색) 선별 기능을 제공하는 lacZ 유전자 내의 다중 클로닝 부위 뿐만 아니라, 복제 및 세포당 1 또는 2 카피의 플라스미드를 유지하기 위해 필요한 유전자를 함유하고 있다. 표준 일렉트로포레이션 (electroporation) 기술을 이용하여, 이 라이게이션 혼합물을 대장균 DH10B에 형질전환하였다. 클로람페니콜에 내성이 있는 재조합 (흰색, lacZ 돌연변이체) 콜로니를 양성 하전된 나일론 막 필터에 384 3×3 그리드 형태로 옮겼다. 이 클론들을 용해하고, DNA를 필터에 가교시켰다. 또한, 동일한 클론들을 -80℃에 액체 배양물로서 보관하였다.
<실시예 3> Ⅰ형 폴리케티드 합성-관련 서열의 존재에 대한 소란지움 셀룰로숨 90의 Bac 라이브러리 스크리닝
표준 써던 (Southern) 혼성화 방법에 의해 Bac 라이브러리 필터를 탐침하였다. 사용된 DNA 프로브는 리파마이신 폴리케티드 합성효소의 첫 번째 및 두 번째 모듈에 있는 β-케토아실 합성효소 도메인을 코딩한다 (Schupp et al., FEMS Microbiology Letters 159: 201-207 (1998)). 프로브 DNA는 pNE95 (pNE95Schupp et al. (1998)에 기재된 코스미드 (cosmid) 2와 동일)를 주형으로 사용하고, 각 케토합성효소 도메인을 플랭킹 (flanking)하는 프라이머를 사용한 PCR에 의해 생성되었다. PCR에 의해 증폭된 DNA 25 ng을 단리하고, 제조자의 지시에 따라 무작위 프라이머 표지 키트 (random primer labeling kit, Gibco-BRL, Bethesda MD, USA)를 사용하여 32P-dCTP로 표지하였다. 혼성화는 65℃에서 36시간 동안 수행하고, 고도의 엄격 조건 (65℃에서 0.1x SSC 및 0.5% SDS로 20분씩 3회)에서 세척하였다. 표지된 블롯 (blot)을 인광 스크린에 노출시키고, 포스포이미저 (PhosphoImager) 445SI (Molecular Dynamics 사의 스크린 및 445SI) 상에서 신호를 검출하였다. 그 결과 특정 Bac 클론에 프로브가 강하게 혼성화되었다. 이 클론을 선별하여 37℃의 루리아 브로쓰 (LB) 5 ㎖에서 밤새 배양하였다. 관심있는 Bac 클론의 Bac DNA를 통상의 미니프렙 (miniprep) 절차에 의해 단리하였다. 세포를 200 ㎕의 용해효소액 (50 mM 포도당, 10 mM EDTA, 25 mM Tris-HCl, 5 mg/ml 용해효소)에 재현탁하고, 400 ㎕의 용해액 (0.2 N NaOH 및 2% SDS)에 용해시킨 후, 단백질을 침전 (3.0 M 칼륨 아세테이트, 아세트산으로 pH 5.2로 조절)시키고, 이소프로판올로 Bac DNA를 침전시켰다. DNA를 핵산분해효소가 없는 증류수 20 ㎕에 재현탁하고, BamHⅠ (New England Biolabs, Inc.)으로 절단한 후, 0.7% 아가로오스 겔에서 분리하였다. 이 겔을 상기 기재된 바와 같이 써던 혼성화에 의해 블롯팅하고, 상기 기재된 조건하에서 소라펜 폴리케티드 합성효소의 네 번째 모듈에 있는 케토합성효소를 코딩하는 1.2 kb의 SmaⅠ DNA 단편을 프로브로 사용하여 탐침하였다 (미국 특허 제5,716,849호 참조). 다섯 가지 상이한 혼성화 패턴이 관찰되었다. 이 다섯 가지 패턴을 대표하는 각각의 클론을 pEPO15, pEPO20, pEPO30, pEPO31 및 pEPO33이라 명명하였다.
<실시예 4> pEPO15, pEPO20, pEPO30, pEPO31 및 pEPO33의 BamHⅠ 단편의 서브클로닝 (subcloning)
선별된 다섯 가지 클론의 DNA를 BamHⅠ으로 절단하고, 무작위의 단편을 pBluescriptⅡ SK+ (Stratagene)의 BamHⅠ 부위에 서브클로닝하였다. 2 내지 10 kb의 삽입체를 포함하는 서브클론을 선별하여 삽입체의 플랭킹 말단을 서열분석하고, 1.2 kb의 SmaⅠ 프로브로 상기 기재된 바와 같이 탐침하였다. 공지된 폴리케티드 합성효소에 서열 상동성이 높고(거나) 소라펜 케토합성효소 도메인에 강하게 혼성화되는 서브클론을 유전자 교체 (gene disruption) 실험에 사용하였다.
<실시예 5> 소란지움 셀룰로숨 균주 So ce90의 스트렙토마이신 (streptomycin)-내성 자발 돌연변이체 제조
G52-H 액체 배지 (0.2% 효모 추출물, 0.2% 탈지 소야 밀 (soya meal), 0.8% 감자 전분, 0.2% 포도당, 0.1% MgSO4x7H2O, 0.1% CaCl2x2H2O, 0.008% Fe-EDTA, KOH로 pH를 약 7.4로 조절)에서 3일 동안 배양된 소란지움 셀룰로숨 균주 So ce90 0.1 ㎖을 스트렙토마이신 100 ㎍/ml이 함유된 SolE 아가 플레이트 배지에 평판배양하였다. 이 플레이트를 30℃에서 2주 동안 배양하였다. 이 배지에서 생장하는 콜로니가 스트렙토마이신-내성 돌연변이체이며, 이 콜로니를 분리하기 위해 스트렙토마이신이 포함된 동일한 아가 배지에 스트릭하여 다시 한번 배양하였다. 이 스트렙토마이신-내성 돌연변이체 중 하나를 선별하여 BCE28/2라 명명하였다.
<실시예 6> 서브클로닝된 BamHⅠ 단편을 이용한 소란지움 셀룰로숨 BCE28/2에서의 유전자 교체
상기 기재된 다섯 가지 선별된 Bac 클론으로부터 생성된 서브클론의 BamHⅠ 삽입체를 단리하여 pCIB132 (미국 특허 제5,716,849호 참조) 플라스미드의 단일 BamHⅠ 부위에 라이게이션하였다. 삽입체를 포함하는 pCIB132 유도체를, 헬퍼 (helper) 플라스미드인 pUZ8이 포함된 대장균 ED8767에 형질전환하였다. 형질전환체를 공여자로 사용하고 소란지움 셀룰로숨 BCE28/2를 수용자로하여 접합 실험을 수행하였다. 접합을 위해, 액체 G51b 배지 (트립톤이 펩톤으로 대체된 것 외에는 G51t와 동일)에서 30℃로 배양된 정지기 초기 (약 5×108 세포/ml)의 소란지움 셀룰로숨 BCE28/2 세포 5×108 내지 10×108을, 서브클로닝된 BamHⅠ 단편이 있는 pCIB132 유도체 및 헬퍼 플라스미드 pUZ8이 포함된 후기-로그기의 대장균 ED8767 배양물 (LB 액체 배지)과 1:1로 혼합하였다. 이어서, 혼합된 세포를 4000 rpm에서 10분 동안 원심분리하고, 0.5 ㎖의 G51b 배지에 재현탁하였다. 이 세포 현탁액을 50 mg/ℓ의 카나마이신 (kanamycin)이 함유된 SolE 아가 플레이트의 중앙에 한 방울 떨어뜨려 접종하였다. 30℃에서 24시간 동안 배양된 후 수득된 세포를 수획하여 0.8 ㎖의 G51b 배지에 재현탁하고, 이 현탁액 0.1 내지 0.3 ㎖을 플레오마이신 (phleomycin, 30 mg/ℓ), 스트렙토마이신 (300 ㎖/ℓ) 및 카나마이신 (50 mg/ℓ)이 함유된 SolE 고체 선별 배지에 평판배양하였다. 스트렙토마이신으로 인해 공여자인 대장균 균주에 상응하는 선별도 일어났다. 30℃에서 8 내지 12일 동안 배양된 후에 이 선별 배지에서 생장하는 콜로니를 플라스틱 루프로 단리하여 스트릭한 후, 2차 선별 및 콜로니 분리를 위해 동일한 아가 배지에서 배양하였다. 30℃에서 7일 후에 이 선별 배지에서 생장한 콜로니로부터 배양된 배양물은, 서브클로닝된 BamHⅠ 단편이 포함된 pCIB132 유도체가 접합에 의해 전달되어 플레오마이신 내성이 획득된 소란지움 셀룰로숨 BCE28/2의 트랜스 접합체 (transconjugant)이다.
동형 재조합에 의해 소란지움 셀룰로숨의 염색체로 pCIB132 유래의 플라스미드가 도입되는 현상은 써던 혼성화에 의해 확인하였다. 이 실험에서, 문헌 [Pospiech and Neumann, Trends Genet. 11: 217 (1995)]에 기재된 방법을 사용하여, 전달된 BamHⅠ 단편 당 5 내지 10의 트랜스 접합체로부터 완전한 DNA를 단리 (G52-H 배지에서 3일 동안 배양된 배양물 10 ㎖로부터)하였다. 써던 블롯을 위해, 상기 기재된 바와 같이 단리된 DNA를 제한효소 BglⅡ, ClaI 또는 NotI으로 절단하고, 각각의 BamHI 삽입체 또는 pCIB132를 32P 표지 프로브로 사용하였다.
<실시예 7> 유전자 교체 후 소란지움 셀룰로숨에 의한 에포틸론 생성에 대한 도입된 BamHⅠ 단편의 효과 분석
2차 선별용 So1E 플레이트 (실시예 6 참조)에서 표면이 약 1 cm2로 생장한 트랜스 접합체 세포를 멸균된 플라스틱 루프를 사용하여 50 ㎖의 엘렌마이어 (Erlenmeyer) 플라스크 중 G52-H 배지 10 ㎖에 옮겼다. 30℃에서 180 rpm으로 3일 동안 배양한 후에, 배양물을 200 ㎖의 엘렌마이어 플라스크 중 G52-H 배지 50 ㎖에 옮겼다. 30℃에서 180 rpm으로 4 내지 5일 동안 배양한 후에, 이 배양물 10 ㎖을 200 ㎖의 엘렌마이어 플라스크 중 23B3 배지 (0.2% 포도당, 2% 감자 전분, 1.6% 탈지 소야 밀, 0.0008% Fe-EDTA 나트륨염, 0.5% HEPES (4-(2-히드록시에틸)-피페라진 -1-에탄-술폰산), 2% vol/vol 폴리스테롤 수지 XAD16 (Rohm & Haas), NaOH로 pH를 7.8로 조절) 50 ㎖에 옮겼다.
배양물을 30℃에서 180 rpm으로 7일 동안 인큐베이션한 후 생성된 에포틸론을 정량하였다. 완전 배양 브로쓰 (broth)는 150 ㎛의 나일론 필터를 통한 흡입에 의해 여과하였다. 이어서, 필터에 남아있는 수지를 이소프로판올 10 ㎖에 재현탁하고, 이 현탁액을 180 rpm으로 1시간 동안 진탕하여 추출하였다. 이 현탁액으로부터 1 ㎖을 분리하여 에펜도르프 마이크로퓨즈 (Eppendorff Micorfuge)에서 12,000 rpm으로 원심분리하였다. HPLC 및 UV_DAD 검출기 상의 250 nm에서의 검출에 의해 에포틸론 A 및 B의 양을 측정하였다 (워터스 시메트리 (Waters-Symetry) C18 컬럼에서 0.02% 인산 60%-0% 및 아세토니트릴 40%-100%의 구배를 이용한 HPLC).
pEPO15로부터 서브클로닝된 세 가지 상이한 BamHⅠ 단편이 도입된 트랜스 접합체, 즉 pEPO15-21 플라스미드의 BamHⅠ 단편과의 트랜스 접합체, pEPO15-4-5 플라스미드의 BamHⅠ 단편과의 트랜스 접합체 및 pEPO15-4-1 플라스미드의 BamHⅠ 단편과의 트랜스 접합체를 상기 기재된 방식으로 시험하였다. HPLC 분석 결과, 모든 트랜스 접합체가 에포틸론 A 및 B를 더 이상 생성하지 않음을 알아냈다. 반면, pEPO20, pEPO30, pEPO31 및 pEPO33에서 유래한 BamHⅠ 단편과의 트랜스 접합체 및 모 균주 BCE28/2에서는 2 내지 4 mg/ℓ의 농도로 에포틸론 A 및 B가 검출되었다.
<실시예 8> 클로닝된 단편의 뉴클레오티드 서열 결정 및 콘티그 구성
A. 플라스미드 pEPO15-21의 BamHⅠ 삽입체
대장균 균주 DH10B[pEPO15-21]로부터 플라스미드 DNA를 단리하여, pEPO15-21에 삽입된 2.3 kb의 BamHⅠ 단편의 뉴클레오티드 서열을 결정하였다. 어플라이드 바이오시스템스 (Applied Biosystems) 모델 377 서열분석기를 이용하여, 디데옥시뉴클레오티드 사슬 종결 방법에 의해 이중 가닥 DNA 주형 상에서 자동화 DNA 서열분석을 수행하였다. 사용된 프라이머는 유니버설 역방향 프라이머 (5' GGA AAC AGC TAT GAC CAT G 3'(서열 24)) 및 유니버설 순방향 프라이머 (5' GTA AAA CGA CGG CCA GT 3'(서열 25))였다. 이후의 서열분석 반응에서, 상기 결정된 서열의 3' 말단을 위해 고안된, 주문-합성된 올리고뉴클레오티드를 사용하여 콘티그를 확장 및 결합시켰다. 양쪽 가닥 전장의 서열을 분석하고, 모든 뉴클레오티드 서열을 2회 이상 분석하였다. 시퀀서 (Sequencher) 3.0 버전 (Gene Codes Corporation)의 프로그램을 이용하여 뉴클레오티드 서열을 번역하고, 위스콘신대 유전학 컴퓨터 그룹 (University of Wisconsin Genetics Computer Group) 프로그램을 이용하여 분석하였다. 2213 bp 삽입체의 뉴클레오티드 서열은 서열 1의 뉴클레오티드 20779-22991에 상응한다.
B. 플라스미드 pEPO15-4-1의 BamHⅠ 삽입체
대장균 균주 DH10B[pEPO15-4-1]로부터 플라스미드 DNA를 단리하여, 상기 (A)에 기재된 바와 같이 pEPO15-4-1에 삽입된 3.9 kb의 BamHⅠ 단편의 뉴클레오티드 서열을 결정하였다. 3909 bp 삽입체의 뉴클레오티드 서열은 서열 1의 뉴클레오티드 16876-20784에 상응한다.
C. 플라스미드 pEPO15-4-5의 BamHⅠ 삽입체
대장균 균주 DH10B[pEPO15-4-5]로부터 플라스미드 DNA를 단리하여, 상기 (A)에 기재된 바와 같이 pEPO15-4-5에 삽입된 2.3 kb의 BamHⅠ 단편의 뉴클레오티드 서열을 결정하였다. 2233 bp 삽입체의 뉴클레오티드 서열은 서열 1의 뉴클레오티드 42528-44760에 상응한다.
<실시예 9> 에포틸론 생합성 유전자를 포함하는 pEPO15에서 유래한 DNA 단편의 서브클로닝 및 순서 결정
pEPO15를 제한효소 HindⅢ로 완전히 절단하여 생성된 단편을, HindⅢ로 절단된 후 송아지 장 알칼리 포스파타아제로 탈인산화된 pBluescriptⅡ SK- 또는 pNEB193 (New England Biolabs)에 서브클로닝하였다. 여섯 가지 상이한 클론이 생성되었고, 이들을 각각 pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24 (모두 pNEB193 기재), 및 pEPO15-H2.7 및 pEPO15-H3.0 (pBluescriptⅡ SK- 기재)이라 명명하였다.
pEPO15-21의 BamHⅠ 삽입체를 단리하고, DIG (비-방사성 DNA 표지 및 검출 시스템, Boehringer Mannheim)로 표지한 후, 고도의 엄격 조건에서 pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, pEPO15-H2.7 및 pEPO15-H3.0에 대한 DNA 혼성화 실험에서 프로브로 사용하였다. pEPO15-NH24에서 강력한 혼성화 신호가 검출되었고, 이는 pEPO15-21이 pEPO15-NH24에 포함되어 있음을 의미한다.
pEPO15-4-1의 BamHⅠ 삽입체를 단리하고, 상기와 같이 DIG로 표지한 후, 고도의 엄격조건에서 pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, pEPO15-H2.7 및 pEPO15-H3.0에 대한 DNA 혼성화 실험에서 프로브로 사용하였다. pEPO15-NH24 및 pEPO15-H2.7에서 강력한 혼성화 신호가 검출되었다. 또한, pEPO15-NH24 및 pEPO15-H2.7의 한쪽 말단으로부터 생성된 뉴클레오티드 서열분석 데이타도 이전에 결정된 pEPO15-4-1의 BamHⅠ 삽입체와 일치하였다. 이러한 실험들은 pEPO15-4-1 (내부에 HindⅢ 부위를 1개 포함)이 pEPO15-NH24 및 pEPO15-H2.7와 중복되고, pEPO15-H2.7 및 pEPO15-H24의 순서로 인접함을 입증하였다.
pEPO15-4-5의 BamHⅠ 삽입체를 단리하고, 상기와 같이 DIG로 표지한 후, 고도의 엄격 조건에서 pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, pEPO15-H2.7 및 pEPO15-H3.0에 대한 DNA 혼성화 실험에서 프로브로 사용하였다. pEPO15-NH2에서 강력한 혼성화 신호가 검출되었고, 이는 pEPO15-4-5가 pEPO15-NH2에 포함되어 있음을 의미한다.
pEPO15-NH2의 양쪽 말단으로부터 생성된 뉴클레오티드 서열 데이타 및 pEPO15-NH24의 말단으로부터 생성된 뉴클레오티드 서열 데이타는 pEPO15-4-1과 중복되지 않았다. HindⅢ 부위 방향을 지향하는 PCR 프라이머 NH24 말단 "B": GTGAC TGGCGCCTGGAATCTGCATGAGC (서열 26), NH2 말단 "A": AGCGGGAGCTTGCTAGACATTCTGTTTC (서열 27) 및 NH2 말단 "B": GACGCGCCTCGGGCAGCGCCCCAA (서열 28)은 이러한 서열들을 기초로 제작되었고, pEPO15와의 증폭 반응 및 소란지움 셀룰로숨 So ce90의 게놈 DNA를 주형으로하는 독립된 실험에 사용되었다. NH24 말단 "B" 및 NH2 말단 "A"의 프라이머 쌍을 사용하는 경우에 두 가지 주형 모두에서 특이적으로 증폭되었다. 증폭된 DNA를 pBluescriptⅡ SK-에 클로닝하고, 완전하게 서열분석하였다. 증폭된 두 DNA의 서열은 동일하였고, 또한 HindⅢ 부위에서 융합된 pEPO15-NH24 및 pEPO15-NH2의 말단 서열과 완전히 일치하였으며, 이는 pEPO15-NH2 및 pEPO15-NH24가 이 순서로 인접함을 의미한다.
pEPO15-H2.7의 HindⅢ 삽입체를 단리하고, 상기와 같이 DIG로 표지한 후, 고도의 엄격 조건에서 NotⅠ으로 절단된 pEPO15에 대한 DNA 혼성화 실험에서 프로브로 사용하였다. 약 9 kb의 NotⅠ 단편은 강력하게 혼성화되었고, 이를 NotⅠ으로 절단된 후 송아지 장 알칼리 포스파타아제로 탈인산화된 pBluescriptⅡ SK-에 서브클로닝하여 pEPO15-N9-16을 수득하였다. pEPO15-N9-16의 NotⅠ 단편을 단리하고, 상기와 같이 DIG로 표지한 후, 고도의 엄격 조건에서 pEPO15-NH1, pEPO15-NH2, pEPO15-NH6, pEPO15-NH24, pEPO15-H2.7 및 pEPO15-H3.0에 대한 DNA 혼성화 실험에서 프로브로 사용하였다. pEPO15-NH6에서 강력한 혼성화 신호가 검출되었으며, 예상된 클론인 pEPO15-H27 및 pEPO15-NH24에서도 강력한 신호가 검출되었다. 뉴클레오티드 서열 데이타를 pEPO15-NH6의 양쪽 말단, 및 pEPO15-4-1과 중복되지 않은 pEPO15-H2.7의 말단으로부터 생성하였다. PCR 프라이머는 HindⅢ 부위 방향을 지향하도록 고안되었고, pEPO15와의 증폭 반응 및 소란지움 셀룰로숨 So ce90의 게놈 DNA를 주형으로하는 독립된 실험에 사용되었다. 두 주형 모두에서 pEPO15-NH6 말단 "B": CACCGAAGCGTCGATCTGGTCCATC (서열 29) 및 pEPO15-H2.7 말단 "A": CGGTCAGATCGACGACGGGCTTTCC (서열 30)의 프라이머 쌍을 사용하는 경우 특이적으로 증폭되었다. 증폭된 DNA를 pBluescriptⅡ SK-에 클로닝하고, 완전하게 서열분석하였다. 증폭된 두 DNA의 서열은 동일하였고, 또한 HindⅢ 부위에서 융합된 pEPO15-NH6 및 pEPO15-H2.7의 말단 서열과 완전히 일치하였으며, 이는 pEPO15-NH6 및 pEPO15-H2.7이 이 순서로 인접함을 의미한다.
이 실험들을 종합하면, 약 55 kb의 영역에 해당하며 pEPO15-NH6, pEPO15-H2.7, pEPO15-NH24 및 pEPO15-NH2가 이 순서로 이루어지는 HindⅢ 단편의 콘티그가 만들어진다. 남아있는 두 HindⅢ 단편, 즉 pEPO15-NH1 및 pEPO15-H3.0은 콘티그의 일부로 발견되지 않았다.
<실시예 10> 에포틸론 생합성 유전자에 해당하는 서브클론 콘티그의 추가의 확장
pEPO15-NH2 삽입체의 하류 말단으로부터 유래되어 실시예 9에 기재된 서브클론 콘티그의 하류 말단에 해당하는 약 2.2 kb의 BamHⅠ-HindⅢ 단편을 단리하고, DIG로 표지한 후, 여러 가지 효소로 절단된 pEPO15 및 pEPO15-NH2에 대한 써던 혼성화 실험에 사용하였다. 강력하게 혼성화되는 밴드는 항상 두 표적 사이의 동일한 크기에서 발견되었으며, 이는 소란지움 셀룰로숨 So ce90 게놈 DNA 단편이 pEPO15-NH2의 하류 말단에서 HindⅢ 부위로 pEPO15 말단에 클로닝되었음을 의미한다.
기존의 방법을 사용하여, pScosTriplex-Ⅱ (Ji, et al., Genomics 31: 185-192 (1996))에 소란지움 셀룰로숨 So ce90의 코스미드 DNA 라이브러리가 생성되었다. 간략히 설명하면, 소란지움 셀룰로숨 So ce90의 고분자량 게놈 DNA를 제한효소 Sau3AⅠ을 이용하여 부분적으로 절단하여 평균 약 40 kb의 단편을 만든 후, BamHⅠ 및 XbaⅠ으로 절단된 pScosTriplex-Ⅱ에 라이게이션하였다. 라이게이션 혼합물을 기가팩 (Gigapack) Ⅲ XL (Stratagene)으로 패키징하여 대장균 XL1 블루 (Blue) MR 세포의 형질전환에 사용하였다.
콜로니 혼성화에 프로브로 사용된 pEPO15-NH2 삽입체의 하류 말단에서 유래한 약 2.2 kb의 BamHⅠ-HindⅢ 단편으로 코스미드 라이브러리를 스크린하였다. 강력하게 혼성화되는, pEPO4E7이라 명명된 클론을 선별하였다.
pEPO4E7 DNA를 단리하고, 여러 가지 제한효소로 절단한 후, 2.2 kb의 BamHⅠ-HindⅢ 단편를 프로브로 써던 혼성화 실험을 수행하였다. 약 9 kb의 강하게 혼성화되는 NotⅠ 단편을 선별하고 pBluescriptⅡ SK-에 서브클로닝하여 pEPO4E7-N9-8을 수득하였다. 추가의 써던 혼성화 실험 결과, 약 9 kb의 pEPO4E7-N9-8의 NotⅠ 삽입체가 pEPO15-NH2의 NotⅠ-HindⅢ 단편과 6 kb에 걸쳐 중복되었기 때문에, 나머지 약 3 kb의 HindⅢ-NotⅠ 단편은 실시예 9에 기재된 서브클론 콘티그를 확장 시킬 것이라 생각했다. 그러나, 말단 서열분석 결과 pEPO4E7-N9-8 삽입체의 하류 말단은 pScosTriplex-Ⅱ의 BamHⅠ-NotⅠ 폴리링커 (polylinker)를 포함함을 알아냈고, 따라서 pEPO4E7의 게놈 DNA 삽입체는 확장되는 HindⅢ-NotⅠ 단편 내의 Sau3AⅠ 위치에서 끝나며 NotⅠ 부위는 pScosTriplex-Ⅱ에서 유래한 것이다.
벡터 없이 소란지움 셀룰로숨 So ce90 유래의 서열만을 포함하는, pEPO4E7-N9-8의 약 3 kb HindⅢ-NotⅠ 단편으로부터 유래한 약 1.6 kb의 PstⅠ-SalⅠ 단편을 실시예 2에 기재된 박테리아 인공 염색체 라이브러리에 대한 프로브로 사용하였다. 이전에 단리된 EPO15 이외에, EPO32라 불리우는 Bac 클론이 프로브에 강하게 혼성화됨을 발견하였다. pEPO32를 단리하고, 여러 가지 제한효소로 절단한 후, 약 1.6 kb의 PstⅠ-SalⅠ 프로브로 혼성화하였다. 약 13 kb의 HindⅢ-EcoRⅤ 단편이 프로브에 강하게 혼성화됨을 발견하였고, 이를 HindⅢ 및 HincⅡ로 절단된 pBluescriptⅡ SK-에 서브클론하여 pEPO32-HEV15를 수득하였다.
pEPO15-NH2의 하류 말단 서열 및 pEPO32-HEV15로부터 유래한 상류 (HindⅢ) 말단 서열을 기초로 올리고뉴클레오티드 프라이머를 제작하여, pEPO4E7-N9-8을 주형으로하는 서열분석 반응에 사용하였다. 그 결과, 이 서열에 작은 HindⅢ 단편이 존재함을 알아냈는데, 이 단편은 pEPO15-NH2의 하류 말단 HindⅢ 부위를 pEPO32-HEV15의 상류 말단 HindⅢ 부위로부터 분리시키기 때문에 표준 제한효소 분석으로는 검출할 수 없었다.
따라서, 실시예 9에 기재된 서브클론 콘티그는 HindⅢ 단편 EPO4E7-H0.02 및 pEPO32-HEV15의 삽입체를 포함하도록 확장되었고, pEPO15-NH6, pEPO15-H2.7, pEPO15-NH24, pEPO15-NH2, EPO4E7-H0.02 및 pEPO32-HEV15의 삽입체가 이 순서로 구성된 것이다.
<실시예 11> 에포틸론 생합성 유전자에 해당하는 서브클론 콘티그의 뉴클레오티드 서열 결정
실시예 10에 기재된 서브클론 콘티그의 뉴클레오티드 서열을 하기와 같이 결정하였다.
pEPO15-H2.7: 대장균 균주 DH10B[pEPO15-H2.7]로부터 플라스미드 DNA를 단리하여, pEPO15-H2.7에 삽입된 2.7 kb의 BamHⅠ 단편의 뉴클레오티드 서열을 결정하였다. 어플라이드 바이오시스템스 모델 377 서열분석기를 이용하여, 디데옥시뉴클레오티드 사슬 종결 방법에 의해 이중 가닥 DNA 주형 상에서 자동화 DNA 서열분석을 수행하였다. 사용된 프라이머는 유니버설 역방향 프라이머 (5' GGA AAC AGC TAT GAC CAT G 3'(서열 24)) 및 유니버설 순방향 프라이머 (5' GTA AAA CGA CGG CCA GT 3'(서열 25))이었다. 이후의 서열분석 반응에서, 상기 결정된 서열의 3' 말단을 위해 고안된, 주문-합성된 올리고뉴클레오티드를 사용하여 콘티그를 확장 및 결합시켰다.
pEPO15-NH6, pEPO15-NH24 및 pEPO15-NH2: 이 플라스미드들의 HindⅢ 삽입체를 단리하고, 이를 하이드로쉬어 (Hydroshear) 장치 (Genomic Instrumentation Services, Inc.)을 이용하여 무작위 단편으로 절단하여, 평균 1 내지 2 kb의 단편을 수득하였다. 데옥시리보뉴클레오티드 트리포스페이트의 존재하에 T4 DNA 중합효소 및 클레나우 (Klenow) DNA 중합효소를 이용하여 이 단편들의 말단을 복구 (repair)시키고, 리보-ATP의 존재하에 T4 DNA 키나아제를 이용하여 인산화시켰다. 약 1.5 내지 2.2 kb의 단편들을 아가로오스 겔로부터 단리하여, EcoRⅤ로 절단 후 탈인산화된 pBluescriptⅡ SK-에 라이게이션하였다. 유니버설 역방향 프라이머 및 유니버설 순방향 프라이머를 사용하여 무작위 서브클론을 서열분석하였다.
pEPO32-HEV15: pEPO32-HEV15를 HindⅢ 및 SspⅠ으로 절단하여, 에스. 셀룰로숨 So ce90에서 유래한 약 13 kb의 HindⅢ-EcoRⅤ 삽입체 및 pBluescriptⅡ SK-에서 유래한 0.3 kb의 HincⅡ-SspⅠ 단편을 포함하는 약 13.3 kb의 단편을 단리한 후, HaeⅡ로 부분적으로 절단하여 평균 크기가 1 내지 2 kb인 단편을 수득하였다. 크기가 1.5 내지 2.2 kb인 단편을 아가로오스 겔에서 단리하여, EcoRⅤ로 절단된 후 탈인산화된 pBluescriptⅡ SK-에 라이게이션하였다. 유니버설 역방향 프라이머 및 유니버설 순방향 프라이머를 사용하여 무작위 서브클론을 서열분석하였다.
크로마토그램 (chromatogram)을 분석하고, 프레드 (Phred), 프랩 (Phrap) 및 콘스드 (Consed) 프로그램 (Ewing, et al., Genome Res. 8(3): 175-185 (1998); Ewing, et al., Genome Res. 8(3): 186-194 (1998); Gordon, et al., Genome Res. 8(3): 195-202 (1998))를 이용하여 콘티그로 조립하였다. 콘티그의 갭 (gap)을 채워넣고, 서열의 모순을 해결하였으며, 상태가 불량한 서열 영역은 원래의 서브클론 또는 무작위 서브클론 라이브러리로부터 선별된 클론에서 주문 제작된 서열분석용 프라이머를 사용하여 다시 서열분석하였다. 양쪽 가닥을 모두 완전하게 서열분석하고, 모든 염기쌍이 집합된 최소 프레드 스코어 (score)가 40 이상 (99.99%의 신뢰도)이 되도록 하였다.
68750 bp 콘티그의 뉴클레오티드 서열을 서열 1에 기재하였다.
<실시예 12> 에포틸론 생합성 유전자의 뉴클레오티드 서열 분석
서열 1에는 하기 표 1에 상세히 기재된 22개의 ORF가 포함됨을 알아냈다.
ORF 개시 코돈 종결 코돈 추정 단백질의 상동성 추정 단백질의 예상된 기능
orf1 orf2* orf3orf4*orf5epoA epoP epoB epoC epoD epoE epoForf6orf7*orf8orf9*orf10orf11*orf12*orf13orf14 orf15 서열분석 영역 외곽3171 3415599262267610 11872 16251 21746 43524 54935 62369637796429064363647276506365874663386666767334 68346 1826 1900 55565612667511875 16104 21749 43519 54920 62254 63628643336385364920642876576765008658716713768251 서열분석 영역 외곽 가상 단백질 SP:Q11037;DD-펩티다아제 SP:P15555Na/H 역수송체 PED:D1017724 Ⅰ형 폴리케티드 합성효소 비-리보솜 펩티드 합성효소 Ⅰ형 폴리케티드 합성효소 Ⅰ형 폴리케티드 합성효소 Ⅰ형 폴리케티드 합성효소 Ⅰ형 폴리케티드 합성효소 시트크롬 P450 가상 단백질 GI:3293544;양이온 유출 시스템 단백질 GI:2623026 수송 에포틸론 합성효소: 티아졸 고리 형성에포틸론 합성효소: 티아졸 고리 형성에포틸론 합성효소: 폴리케티드 골격 형성에포틸론 합성효소: 폴리케티드 골격 형성에포틸론 합성효소: 폴리케티드 골격 형성에포틸론 합성효소: 폴리케티드 골격 형성에포틸론 마크로락톤 산화효소 수송
*: 역방향 상보 가닥. 번호는 서열 1에 따름.
epoA (서열 1의 뉴클레오티드 7610-11875)는, 1개의 모듈로 이루어지고 β-케토아실 합성효소 (KS) (서열 1의 뉴클레오티드 7643-8920, 서열 2의 아미노산 11-437); 아실전이효소 (AT) (서열 1의 뉴클레오티드 9236-10201, 서열 2의 아미노산 543-864); 에놀 환원효소 (ER) (서열 1의 뉴클레오티드 10529-11428, 서열 2의 아미노산 974-1273) 및 아실 캐리어 단백질 상동성 도메인 (ACP) (서열 1의 뉴클레오티드 11549-11764, 서열 2의 아미노산 1314-1385)을 포함하는 Ⅰ형 폴리케티드 합성효소인 EPOS A (서열 2)를 코딩한다. 서열 비교 및 모티프 (motif) 분석 (Haydock, et al. FEBS Lett. 374: 246-248 (1995) 및 Tang, et al., Gene 216: 255-265 (1998)) 결과, EPOS A에 의해 코딩되는 AT는 말로닐-CoA에 특이적임을 알아냈다. EPOS A는 2-메틸티아졸 고리 (C26 및 C20)를 형성하는 다중 효소 복합체에 아세테이트 단위를 로딩하여 에포틸론 생합성을 개시하는 기능과 관련되어 있다.
epoP (서열 1의 뉴클레오티드 11872-16104)는 1개의 모듈을 포함하는 비-리보솜 펩티드 합성효소인 EPOS P (서열 3)를 코딩한다. EPOS P는 하기의 도메인을 포함한다.
· 모티프 K (서열 1의 뉴클레오티드 12085-12114에 상응하는 서열 3의 아미노산 72-81 [FPLTDIQESY]), 모티프 L (서열 1의 뉴클레오티드 12223-12246에 상응하는 서열 3의 아미노산 118-125 [VVARHDML]), 모티프 M (서열 1의 뉴클레오티드 12466-12507에 상응하는 서열 3의 아미노산 199-212 [SIDLINVDLGSLSI]) 및 모티프 O (서열 1의 뉴클레오티드 12928-12960에 상응하는 서열 3의 아미노산 353-363 [GDFTSMVLLDI])에 의해 서술되는 펩티드 결합 형성 도메인,
·모티프 A (서열 1의 뉴클레오티드 13516-13566에 상응하는 서열 3의 아미노산 549-565 [LTYEELSRRSRRLGARL]), 모티프 B (서열 1의 뉴클레오티드 13633-13680에 상응하는 서열 3의 아미노산 588-603 [VAVLAVLESGAAYVPI]), 모티프 C (서열 1의 뉴클레오티드 13876-13923에 상응하는 서열 3의 아미노산 669-684 [AYVIYTSGSTGLPKGV]), 모티프 D (서열 1의 뉴클레오티드 14313-14334에 상응하는 서열 3의 아미노산 815-821 [SLGGATE]), 모티프 E (서열 1의 뉴클레오티드 14473-14547에 상응하는 서열 3의 아미노산 868-892 [GQLYIGGVGLALGYWRDEEKTRKSF]), 모티프 F (서열 1의 뉴클레오티드 14578-14607에 상응하는 서열 3의 아미노산 903-912 [YKTGDLGRYL]), 모티프 G (서열 1의 뉴클레오티드 14623-14692에 상응하는 서열 3의 아미노산 918-940 [EFMGREDNQIKLRGYRVELGEIE]), 모티프 H (서열 1의 뉴클레오티드 15673-15693에 상응하는 서열 3의 아미노산 1268-1274 [LPEYMVP]) 및 모티프 I (서열 1의 뉴클레오티드 15724-15762에 상응하는 서열 3의 아미노산 1285-1297 [LTSNGKVDRKALR])에 의해 서술되는 아미노아실 아데닐레이트 형성 도메인,
· 아미노아실 아데닐레이트 형성 도메인의 모티프 G 및 H 사이에 삽입된 알려지지 않은 도메인 (서열 1의 뉴클레오티드 14788-15639에 상응하는 서열 3의 아미노산 973-1256), 및
· 모티프 J (서열 1의 뉴클레오티드 15901-15924에 상응하는 서열 3의 아미노산 1344-1351 [GATSIHIV]) 펩티딜 캐리어 단백질 상동성 도메인 (PCP).
EPOS P가 아데닐화에 의한 시스테인의 활성화, 활성화된 시스테인의 아미노아실-S-PCP로서의 결합, 효소-결합 시스테인 및 EPOS A에 의해 제공되는 아세틸-S-ACP 사이에 펩티드 결합의 형성, 및 분자내 헤테로고리화에 의한 초기 티아졸린 고리의 형성에 관련되어 있다고 제안되었다. EPOS P의 알려지지 않은 도메인은 바실러스 종의 NAD(P)H 산화효소 및 환원효소와 매우 약한 상동성을 나타낸다. 따라서, EPOS A의 알려지지 않은 도메인 및(또는) ER 도메인은 초기 2-메틸티아졸린 고리의 2-메틸티아졸로의 산화에 연관되어 있을 수 있다.
epoB (서열 1의 뉴클레오티드 16251-21749)는, 1개의 모듈로 이루어지고 KS (서열 1의 뉴클레오티드 16269-17546, 서열 4의 아미노산 7-432), AT (서열 1의 뉴클레오티드 17865-18827, 서열 4의 아미노산 539-859), 탈수효소 (DH) (서열 1의 뉴클레오티드 18855-19361, 서열 4의 아미노산 869-1037), β-케토환원효소 (KR) (서열 1의 뉴클레오티드 20565-21302, 서열 4의 아미노산 1439-1684) 및 ACP (서열 1의 뉴클레오티드 21414-21626, 서열 4의 아미노산 1722-1792)를 포함하는 Ⅰ형 폴리케티드 합성효소인 EPOS B (서열 4)를 코딩한다. 서열 비교 및 모티프 (모티프) 분석 결과, EPOS A에 의해 코딩되는 AT는 말로닐-CoA에 특이적임을 알아냈다. EPOS B는 2-메틸-4-티아졸카르복실-S-PCP 출발 기의 메틸말로닐S-ACP와의 클라이젠 (Claisen)-유사 축합을 촉매하여 첫 번째 폴리케티드 사슬을 확장시키는 기능 및 C17의 β-케토기의 에노일로의 환원에 연관되어 있을 수 있다.
epoC (서열 1의 뉴클레오티드 21746-43519)는 4개의 모듈로 구성되는 Ⅰ형 폴리케티드 합성효소인 EPOS C (서열 5)를 코딩한다. 첫 번째 모듈은 KS (서열 1의 뉴클레오티드 21860-23116, 서열 5의 아미노산 39-457), 말로닐 CoA-특이적 AT (서열 1의 뉴클레오티드 23431-24397, 서열 5의 아미노산 563-884), KR (서열 1의 뉴클레오티드 25184-25942, 서열 5의 아미노산 1147-1399) 및 ACP (서열 1의 뉴클레오티드 26045-26263, 서열 5의 아미노산 1434-1506)를 포함한다. 이 모듈은 아세테이트 확장제 단위 (C14-C13)를 도입시키고, C15에서 β-케토기를 히드록실기로 환원시키며, 이는 에포틸론 마크로락톤 고리의 최종 락톤화에 기여한다. EPOS C의 두 번째 모듈은 KS (서열 1의 뉴클레오티드 26318-27595, 서열 5의 아미노산 1524-1950), 말로닐 CoA-특이적 AT (서열 1의 뉴클레오티드 27911-28876, 서열 5의 아미노산 2056-2377), KR (서열 1의 뉴클레오티드 29678-30429, 서열 5의 아미노산 2645-2895) 및 ACP (서열 1의 뉴클레오티드 30539-30759, 서열 5의 아미노산 2932-3005)을 포함한다. 이 모듈은 아세테이트 확장제 단위 (C12-C11)를 도입시키고, C13에서 β-케토기를 히드록실기로 환원시킨다. 따라서, 발생중인 에포틸론의 폴리케티드 사슬은 에포틸론 A에 상응하고, 에포틸론 B의 C12에서 메틸 측쇄의 도입은 PKS C-메틸전이효소의 후기 활성을 필요로 한다. 또한, C13-C12에서의 에폭시 고리 형성에는 PKS 산화 후의 단계를 필요로 한다. EPOS C의 세 번째 모듈은 KS (서열 1의 뉴클레오티드 30815-32092, 서열 5의 아미노산 3024-3449), 말로닐 CoA-특이적 AT (서열 1의 뉴클레오티드 32408-33373, 서열 5의 아미노산 3555-3876), DH (서열 1의 뉴클레오티드 33401-33889, 서열 5의 아미노산 3886-4048), ER (서열 1의 뉴클레오티드 35042-35902, 서열 5의 아미노산 4433-4719), KR (서열 1의 뉴클레오티드 35930-36667, 서열 5의 아미노산 4729-4974) 및 ACP (서열 1의 뉴클레오티드 36773-36991, 서열 5의 아미노산 5010-5082)를 포함한다. 이 모듈은 아세테이트 확장제 단위 (C10-C9)를 도입시키고, C11에서 β-케토기를 완전히 환원시킨다. EPOS C의 네 번째 모듈은 KS (서열 1의 뉴클레오티드 37052-38320, 서열 5의 아미노산 5103-5525), 메틸말로닐 CoA-특이적 AT (서열 1의 뉴클레오티드 38636-39598, 서열 5의 아미노산 5631-5951), DH (서열 1의 뉴클레오티드 39635-40141, 서열 5의 아미노산 5964-6132), ER (서열 1의 뉴클레오티드 41369-42256, 서열 5의 아미노산 6542-6837), KR (서열 1의 뉴클레오티드 42314-43048, 서열 5의 아미노산 6857-7101) 및 ACP (서열 1의 뉴클레오티드 43163-43378, 서열 5의 아미노산 7140-7211)를 포함한다. 이 모듈은 아세테이트 확장제 단위 (C24 및 C8-C7)를 도입시키고, C9에서 β-케토기를 완전히 환원시킨다.
epoD (서열 1의 뉴클레오티드 43524-54920)는 2개의 모듈로 이루어지는 Ⅰ형 폴리케티드 합성효소인 EPOS D (서열 6)를 코딩한다. 첫 번째 모듈은 KS (서열 1의 뉴클레오티드 43626-44885, 서열 6의 아미노산 35-454), 메틸말로닐 CoA-특이적 AT (서열 1의 뉴클레오티드 45204-46166, 서열 6의 아미노산 561-881), KR (서열 1의 뉴클레오티드 46950-47702, 서열 6의 아미노산 1143-1393) 및 ACP (서열 1의 뉴클레오티드 47811-48032, 서열 6의 아미노산 1430-1503)를 포함한다. 이 모듈은 프로피오네이트 확장제 단위 (C23 및 C6-C5)를 도입시키고, C7에서 β-케토기를 히드록실기로 환원시킨다. 두 번째 모듈은 KS (서열 1의 뉴클레오티드 48087-49361, 서열 6의 아미노산 1522-1946), 메틸말로닐 CoA-특이적 AT (서열 1의 뉴클레오티드 49680-50642, 서열 6의 아미노산 2053-2373), DH (서열 1의 뉴클레오티드 50670-51176, 서열 6의 아미노산 2383-2551), 메틸전이효소 (MT, 서열 1의 뉴클레오티드 51534-52657, 서열 6의 아미노산 2671-3045), KR (서열 1의 뉴클레오티드 53697-54431, 서열 6의 아미노산 3392-3636) 및 ACP (서열 1의 뉴클레오티드 54540-54758, 서열 6의 아미노산 3673-3745)를 포함한다. 이 모듈은 프로피오네이트 확장제 단위 (C21 또는 C4-C3)를 도입시키고, C5에서 β-케토기를 히드록실기로 환원시킨다. 이 환원은 에포틸론이 C5에 케토기를 함유하고 있기 때문에, 다소 예상하지 못한 것이었다. 그러나, 추정된 PKS 모듈의 환원 능력 및 최종 폴리케티드 생성물에서 이에 상응하는 위치에서의 산화환원 상태 사이의 모순은 문헌 [Schwecke, et al., Proc. Natl. Acad. Sci. USA 92: 7839-7843 (1995)] 및 [Schupp, et al., FEMS Microbiology Letters 159: 201-207 (1998)] 등에 보고되어 있다. 에포틸론의 중요한 특성은 C4 (C21 및 C22)에 겜-메틸 측기 (gem-methyl side group)이 존재한다는 것이다. EPOS D의 두 번째 모듈은 프로피오네이트 단위를 연장되는 폴리케티드 사슬에 도입시켜 C4에 하나의 메틸 측기를 제공할 것으로 예상하였다. 또한, 이 모듈은 PKS의 DH 및 KR 도메인 사이에 HMWP1 예르시니아박틴 합성효소 와 유사한 배열 (Gehring, A.M., DeMoll, E., Fetherston, J.D., Mori, I., Mayhew, G.F., Blattner, F.R., Walsh, C.T. 및 Perry, R.D.: Iron acquisition in plague: modular logic in enzymatic biogenesis of yersiniabactin by Yersinia pestis. Chem. Biol. 5, 573-586, 1998)로 도입된 메틸전이효소 도메인을 포함하였다. EPOS D에서 이 도메인은 C4에 두 번째 메틸 측기 (C21 또는 C22)를 도입시킬 것이라 예상되었다.
epoE (서열 1이 뉴클레오티드 54935-62254)는 KS (서열 1의 뉴클레오티드 55028-56284, 서열 7의 아미노산 32-450), 말로닐 CoA-특이적 AT (서열 1의 뉴클레오티드 56600-57565, 서열 7의 아미노산 556-877), DH (서열 1의 뉴클레오티드 57593-58087, 서열 7의 아미노산 887-1051), 아마도 기능이 없는 ER (서열 1의 뉴클레오티드 59366-60304, 서열 7의 아미노산 1478-1790), KR (서열 1의 뉴클레오티드 60362-61099, 서열 7의 아미노산 1810-2055), ACP (서열 1의 뉴클레오티드 61211-61426, 서열 7의 아미노산 2093-2164) 및 티오에스테라제 (TE) (서열 1의 뉴클레오티드 61427-62254, 서열 7의 아미노산 2165-2439)을 포함하는 1개의 모듈로 이루어지는 Ⅰ형 폴리케티드 합성효소인 EPOS E (서열 7)를 코딩한다. 이 모듈의 ER 도메인은 이 도메인을 불활성화시킬 수 있는 보기드문 아미노산 치환이 있는 활성화 부위 모티프를 포함하고 있다. 이 모듈은 아세테이트 확장제 단위 (C2-C1)를 도입시키고, C3에서 β-케토를 에노일기로 환원시킨다. 에포틸론은 C3에 히드록실기를 함유하기 때문에, 이 환원은 EPOS D의 두 번째 모듈에 논의된 바와 같이 지나친 것으로 보인다. EPOS D의 TE 도메인은 C1의 카르복실기 및 C15의 히드록실기 사이에서 락톤화를 통해 신장되는 폴리케티드 사슬의 방출 및 고리화에 기여한다.
서열분석된 영역 중 epoA의 상류에 5개의 ORF가 발견되었다. 부분적으로 서열분석된 orf1의 서열은 서열 데이타뱅크 (databack)에 상동성인 서열이 존재하지 않았다. orf2 (서열 1의 역방향 상보 가닥 뉴클레오티드 3171-1900)의 추정 단백질 생성물 (Orf 2, 서열 10)은 미코박테리움 (Mycobacterium) 및 스트렙토마이세스로부터의 가상 ORF에 강한 유사성을 나타내었고, 다른 박테리아의 카르복시펩티다아제 및 DD-펩티다아제와는 더 먼 유사성을 나타내었다. orf3 (서열 1의 뉴클레오티드 3415-5556)의 추정 단백질 생성물인 Orf3 (서열 11)은 다른 박테리아의 Na/H 역수송체에 상동성을 나타내었다. Orf3은 제조 균주로부터 에포틸론의 방출에 기여할 것이다. orf4 및 orf5의 서열은 서열 데이타뱅크에 상동성인 서열이 존재하지 않았다.
서열분석된 영역 중 epoE의 하류에 11개의 ORF가 발견되었다. epoF (서열 1의 뉴클레오티드 62369-63628)의 추정 단백질인 EPOS F (서열 8)는 시트크롬 P450 산소첨가효소와 강력한 서열 유사성이 있는 단백질을 코딩한다. EPOS F는 탄소 C12, C5 및(또는) C3의 산화환원 상태를 조절하는데 기여할 것이다. orf14 (서열 1의 뉴클레오티드 67334-68251)의 추정 단백질 생성물인 Orf14 (서열 22)는 스트렙토마이세스 코엘리칼라로부터의 제안된 기능이 없는 가상 단백질 GI:3293544 및 인간 배아의 폐 단백질인 GI:2654559에 강한 유사성을 나타내었다. 또한, 더 멀게는 메타노박테리움 써모오토트로피쿰 (Methanobacterium thermoautotrophicum)으로부터의 GI:2623026과 같은 양이온 방출 시스템 단백질과 연관되어 있으며, 이는 에포틸론을 생성하는 세포로부터 에포틸론의 방출에 기여할 것이다. 남아있는 ORF (orf6-orf15)의 서열은 서열 데이타뱅크에 상동성인 서열이 존재하지 않았다.
<실시예 13> 에포틸론 생합성 유전자의 재조합 발현
소란지움 셀룰로숨의 발효에 의해 수득되는 에포틸론의 제조량보다 더 많은 양을 얻기 위해, 본 발명에 따른 에포틸론 생합성 유전자를 이종 유기체에서 발현하였다. 이종 발현에 바람직한 숙주는 스트렙토마이세스, 즉 원래 폴리케티드 악티노르호딘을 생성하는 스트렙토마이세스 코엘리칼라이다. 이 숙주에서 재조합 PKS 유전자의 발현 기술은 문헌 [McDaniel et al., Science 262: 1546-1550 (1993)] 및 [Kao et al., Science 265: 509-512 (1994)]에 기재되어 있다. 또한, 본원에 참고문헌으로 포함되는 문헌 [Holmes et al., EMBO Journal 12(8): 3183-3191 (1993)] 및 [Bibb et al., Gene 38: 215-226 (1985)] 뿐만 아니라 미국 특허 제5,521,077호, 동 제5,672,491호 및 동 제5,712,146호를 참조할 수 있다.
한 방법에 따라, 이종 숙주 균주를 조작하여 악티노르호딘 (act) 유전자 단편이 염색체에서 결실되게 하였다. 온도 감응성 공여 플라스미드를 대장균의 수용 셔틀 벡터에 전달 (McDaniel et al. (1993) 및 Kao et al. (1994))하여 벡터 내에서 동형 재조합에 의해 합성효소 유전자를 삽입함으로써, 본 발명의 에포틸론 합성효소 유전자를 포함하는 발현 플라스미드를 제작하였다. 별법으로, 에포틸론 합성효소 유전자 단편을 제한 단편 라이게이션에 의해 벡터에 도입하였다. 예를 들면, 문헌 [Kao et al. (1994)]에 기재된 바와 같이 선별한 후에, 본원에 참고문헌으로 포함되는 문헌 [Hopwood et al., Genetic Manipulation of Streptomyces. A Laboratory Manual (John Innes Foundation, Norwich, United Kingdom, 1985]에 기재된 방법에 따라 벡터로부터의 DNA를 act-음성 스트렙토마이세스 코엘리칼라 균주에 도입하였다. 재조합 스트렙토마이세스 균주를 R2YE 배지 (Hopwood et al. (1985))에서 배양하여 에포틸론을 생성하였다. 별법으로, 본 발명에 따른 에포틸론 합성효소 유전자를 슈도모나드, 바실러스, 효모, 곤충 세포 및(또는) 대장균과 같은 다른 숙주 유기체에서 발현하였다. PKS 및 NRPS 유전자는 T7 프로모터를 이용하는 pT7-7 벡터를 사용하여 대장균에서 발현하는 것이 바람직하다 (Tabor et al., Proc. Natl. Acad. Sci. USA 82: 1074-1078 (1985)). 다른 실시양태에서, pKK223-3 및 pKK223-2 발현 벡터를 이용하여, tac 또는 trc 프로모터 뒤에서 전사 또는 번역 융합으로 대장균에서 PKS 및 NRPS 유전자를 발현하였다. 원래 PKS 효소의 번역 후 변형에 필요한 포스포판테테이닐 (P-판트) 전이효소를 갖고 있지 않은 이종 숙주에서의 PKS 및 NRPS 유전자의 발현은 P-판트 전이효소의 동시 발현을 필요로 한다 (Kealey et al., Proc. Natl. Acad. Sci. USA 95: 505-509 (1998)).
<실시예 14> 생성 균주로부터의 에포틸론 단리
본 발명의 천연 및 재조합 숙주로부터 에포틸론을 추출하는데 유용한 배양, 발효 및 폴리케티드 단리에 대한 추출 방법에 관한 실시예는, 본원에 참고문헌으로 포함되는 WO 93/10121호, 미국 특허 제5,639,949호의 실시예 57, 문헌 [Gerth et al., J. Antibiotics 49: 560-563 (1996)], 및 본원에 참고문헌으로 포함되는 1998년 2월 19일자 스위스 특허 출원 제396/98호 및 미국 특허 출원 제09/248,910호 (소란지움 셀룰로숨의 바람직한 돌연변이 균주에 대해 개시됨)에 기재되어 있다. 배양된 소란지움 셀룰로숨 균주로부터 에포틸론을 단리하는데 유용하며, 재조합 숙주로부터 에포틸론의 단리에도 유용할 수 있는 절차를 하기에 기재하였다.
A: 에포틸론 생성 균주의 배양:
균주: 소란지움 셀룰로숨 Soce-90 또는 본 발명에 따른 재조합 숙주
균주의 보관: 액체 N2
배지: 전배양 및 중간 배양: G52
주요 배양: 1B12
G52 배지:
저농도 염의 효모 추출물 (BioSpringer, Maison Alfort, France) 2 g/ℓ
MgSO4(7 H2O) 1 g/ℓ
CaCl2(2 H2O) 1 g/ℓ
탈지 소야 밀 소야민(Soyamine) 50T (Lucas Meyer, Hamburg,
Germany) 2 g/ℓ
감자 전분 노레덕스 (Noredux) A-150 (Blattmann, Waedenswil,
Switzerland) 8 g/ℓ
무수 포도당 2 g/ℓ
EDTA-Fe(Ⅲ)-Na 염 (8 g/ℓ), KOH로 pH 7.4로 조절 1 ㎖/ℓ
멸균: 20분, 120℃
1B12 배지:
감자 전분 노레덕스 A-150 (Blattmann, Waedenswil,
Switzerland) 20 g/ℓ
탈지 소야 밀 소야민 50T (Lucas Meyer, Hamburg, Germany) 11 g/ℓ
EDTA-Fe(Ⅲ)-Na 염, , KOH로 pH 7.4로 조절 8 mg/ℓ
멸균: 20분, 120℃
시클로덱스트린 및 시클로덱스티린 유도체의 첨가:
상이한 농도의 시클로덱스트린 (Fluka, Buchs, Switzerland, or Wacker Chemie, Munich, Germany)을 각각 멸균하여 시딩하기 전에 1B12 배지에 가하였다.
배양:
액체 N2 앰플에서 1 ㎖의 소란지움 셀룰로숨 Soce-90 현탁액을 취하여 G52 배지 (50 ㎖의 엘렌마이어 플라스크 중) 10 ㎖에 옮기고, 30℃에서 25 mm 이동하는 교반기에서 180 rpm으로 3일 동안 배양하였다. 이 배양액 5 ㎖을 G52 배지 (200 ㎖의 엘렌마이어 플라스크 중) 45 ㎖에 가하고, 30℃에서 25 mm 이동하는 교반기에서 180 rpm으로 3일 동안 배양하였다. 이 배양액 50 ㎖을 G52 배지 (2 ℓ의 엘렌마이어 플라스크 중) 450 ㎖에 가하고, 30℃에서 50 mm 이동하는 교반기에서 180 rpm으로 3일 동안 배양하였다.
배양물의 유지:
3 내지 4일 마다 배양물 50 ㎖을 G52 배지 (2 ℓ의 엘렌마이어 플라스크 중) 450 ㎖에 가하여 과도하게 시딩하였다. 모든 실험 및 발효는 이 유지 배양물로부터 출발하여 수행하였다.
플라스크 중의 시험:
(1) 교반 플라스크 중의 전배양:
500 ㎖의 유지 배양물에서 출발하여, 450 ㎖의 G52 배지 1개를 50 ㎖의 유지 배양물로 시딩하고, 이를 30℃에서 50 mm 이동하는 교반기에서 180 rpm으로 4일 동안 배양하였다.
(2) 교반 플라스크 중의 주요 배양:
5 g/ℓ의 4-모르폴린-프로판-술폰산 (=MOPS)이 가해진 40 ㎖의 1B12 배지 (200 ㎖의 엘렌마이어 플라스크 중)를 5 ㎖의 10x 농축 시클로덱스트린 용액과 혼합한 후, 10 ㎖의 전배양물로 시딩하여 30℃에서 50 mm 이동하는 교반기에서 180 rpm으로 5일 동안 배양하였다.
발효:
발효는 10 ℓ, 100 ℓ 및 500 ℓ의 규모로 수행하였다. 20 ℓ 및 100 ℓ의 발효는 중간 배양 단계로서 수행하였다. 전배양 및 중간 배양은 유지 배양물 10% (v/v)로서 시딩되는 반면, 주요 배양은 중간 배양물 20% (v/v)로서 시딩되었다. 특히, 교반 배양과는 대조적으로 발효 배지의 성분은 접종물을 포함하는 최종 배양 부피로 계산되었다. 예를 들면, 18 ℓ의 배지에 2 ℓ의 접종물이 혼합되는 경우, 20 ℓ에 해당하는 물질의 중량을 측정하여 18 ℓ의 배지에 혼합하였다.
교반 플라스크 중의 전배양:
500 ㎖의 유지 배양물로 출발하여, 450 ㎖의 G52 배지 (200 ㎖의 엘렌마이어 플라스크 중) 4개를 유지 배양물 50 ㎖로 시딩하고, 30℃에서 50 mm 이동하는 교반기에서 180 rpm으로 4일 동안 배양하였다.
중간 배양, 20 ℓ 또는 100 ℓ:
20 ℓ: 총 부피가 30 ℓ인 발효기 중의 G52 배지 18 ℓ를 2 ℓ의 전배양물로 시딩하였다. 이 배양을 3 내지 4일 동안 지속하였고, 그 배양 조건은 30℃, 250 rpm, 액체 배지에 분당 0.5 ℓ의 공기 공급 및 0.5 bar의 과도한 압력이었으며 pH를 조절하지 않았다.
100 ℓ: 총 부피가 150 ℓ인 발효기 중의 G52 배지 90 ℓ를 20 ℓ의 중간 배양물 중 10 ℓ로 시딩하였다. 이 배양을 3 내지 4일 동안 지속하였고, 그 배양 조건은 30℃, 150 rpm, 액체 배지에 분당 0.5 ℓ의 공기 공급 및 0.5 bar의 과도한 압력이었으며 pH를 조절하지 않았다.
주요 배양, 10 ℓ, 100 ℓ 또는 500 ℓ:
10 ℓ: 1B12 배지 10 ℓ에 대한 배지 물질을 7 ℓ의 물 중에서 멸균하고 나서, 1 ℓ의 멸균된 10% 2-(히드록시프로필)-β-시클로덱스트린 용액을 가한 후, 20 ℓ의 중간 배양물 중 2 ℓ로 시딩하였다. 주요 배양 시간은 6 내지 7일이었고, 그 배양 조건은 30℃, 250 rpm, 액체 배지에 분당 0.5 ℓ의 공기 공급 및 0.5 bar의 과도한 압력이었으며, H2SO4 또는 KOH로 pH를 7.6±0.5로 조절 (즉, pH 7.1 및 8.1 사이에서는 조절하지 않음)하였다.
100 ℓ: 1B12 배지 100 ℓ에 대한 배지 물질을 70 ℓ의 물 중에서 멸균하고 나서, 10 ℓ의 멸균된 10% 2-(히드록시프로필)-β-시클로덱스트린 용액을 가한 후, 20 ℓ의 중간 배양물로 시딩하였다. 주요 배양 시간은 6 내지 7일이었고, 그 배양 조건은 30℃, 200 rpm, 액체 배지에 분당 0.5 ℓ의 공기 공급 및 0.5 bar의 과도한 압력이었으며, H2SO4 또는 KOH로 pH를 7.6±0.5로 조절하였다. 100 ℓ 발효에 대한 일련의 시딩 모식도를 하기에 도시하였다.
500 ℓ: 1B12 배지 500 ℓ에 대한 배지 물질을 350 ℓ의 물 중에서 멸균하고 나서, 50 ℓ의 멸균된 10% 2-(히드록시프로필)-β-시클로덱스트린 용액을 가한 후, 100 ℓ의 중간 배양물로 시딩하였다. 주요 배양 시간은 6 내지 7일이었고, 그 배양 조건은 30℃, 120 rpm, 액체 배지에 분당 0.5 ℓ의 공기 공급 및 0.5 bar의 과도한 압력이었으며, H2SO4 또는 KOH로 pH를 7.6±0.5로 조절하였다.
생성물 분석:
시료 준비:
50 ㎖의 시료를 2 ㎖의 폴리스티렌 수지 앰벌라이트 (Amberlite) XAD 16 (Rohm & Haas, Frankfurt, Germany)에 혼합하고 30℃에서 180 rpm으로 1시간 동안 교반하였다. 이후에 150 ㎛의 나일론 체를 사용하여 수지를 여과하고, 약간의 물로 세척한 후, 여과지와 함께 15 ㎖의 넝크 (Nunc) 튜브에 넣었다.
수지로부터 생성물의 용출:
여과지 및 수지에 10 ㎖의 이소프로판올 (>99%)을 가하였다. 그 후에, 밀봉된 튜브를 로타-믹서 (Rota-Mixer, Labinco BV, Netherlands) 중 상온에서 30분 동안 교반하였다. 이어서, 2 ㎖의 액체를 원심분리하고, 피펫을 이용하여 상층액을 HPLC 튜브에 넣었다.
HPLC 분석:
컬럼: 워터스-시메트리 C18, 100×4 mm, 3.5 ㎛
WAT066220 + 예비 컬럼 3.9×20 mm
WAT054225
용매: A: 0.02% 인산
B: 아세토니트릴 (HPLC 등급)
구배: 41% B, 0 내지 7분
100% B, 7.2 내지 7.8분
41% B, 8 내지 12분
오븐 온도: 30℃
검출: 250 nm, UV-DAD 검출법
주입 부피: 10 ㎕
보유 시간: EpoA: 4.30분, EpoB: 5.38분
B: 수득된 에포틸론 농도에 대한 시클로덱스트린 및 시클로덱스트린 유도체 첨가의 효과:
시클로덱스트린은 상대적으로 중심 공극은 소수성이며 외부 표면은 친수성인 α-D-글루코피라노오스의 시클릭(α-1,4)-결합 올리고사카라이드이다.
예를 들면, α-시클로덱스트린(6), β-시클로덱스트린(7), γ-시클로덱스트린(8), δ-시클로덱스트린(9), ε-시클로덱스트린(10), ζ-시클로덱스트린(11), η-시클로덱스트린(12) 및 θ-시클로덱스트린(13) (괄호 안의 숫자는 분자당 포도당 단위의 수임)이 있다. 특히 δ-시클로덱스트린이 바람직하며, α-시클로덱스트린, β-시클로덱스트린, γ-시클로덱스트린 또는 이들의 혼합물도 바람직하다.
시클로덱스트린 유도체는 상기 시클로덱스트린, 특히 α-시클로덱스트린, β-시클로덱스트린 또는 γ-시클로덱스트린의 1차 유도체로서, 이는 1개 이상의 또는 모든 히드록시기 (포도당 라디칼당 3)가 에테르화 또는 에스테르화 된다. 에테르는 1차 알킬 에테르로, 특히 저급 알킬 (예를 들면, 메틸 또는 에틸 에테르 및 프로필 또는 부틸 에테르); 아릴-히드록시알킬 에테르 (예를 들면, 페닐-히드록시-저급-알킬, 특히 페닐-히드록시에틸 에테르); 히드록시알킬 에테르, 특히 히드록시-저급-알킬 에테르 (특히, 2-히드록시에틸, 2-히드록시프로필과 같은 히드록시프로필 또는 2-히드록시부틸 에테르와 같은 히드록시-부틸); 카르복시알킬 에테르, 특히 카르복시-저급-알킬 에테르 (특히, 카르복시메틸 또는 카르복시에틸 에테르); 유도된 카르복시알킬 에테르, 특히 유도된 카르복시가 에테르화 또는 아미드화 카르복시 (1차 아미노카르보닐, 모노- 또는 디-저급-알킬-아미노카르보닐, 모르폴리노-, 피페리디노-, 피롤리디노- 또는 피페라지노-카르보닐, 또는 알킬옥시카르보닐), 특히 저급 알크옥시카르보닐-저급-알킬 에테르 (예를 들면, 메틸옥시-카르보닐-프로필 에테르 또는 에틸옥시-카르보닐-프로필 에테르)인 유도된 카르복시-저급-알킬 에테르; 술포알킬 에테르, 특히 술포부틸 에테르와 같은 술포-저급-알킬 에테르; 1개 이상의 OH기가 하기 화학식 Ⅱ의 라디칼로 에테르화된 시클로덱스트린; 1개 이상의 OH기가 하기 화학식 Ⅲ의 라디칼로 에테르화된 시클로덱스트린; 또는 글루코실-, 디글루코실-(G2-β-시클로덱스트린), 말토실- 또는 디-말토실-시클로덱스트린, 또는 N-아세틸글루코스아밀-, 글루코스아밀-, N-아세틸갈락토스아밀- 또는 갈락토스아밀-시클로덱스트린과 같이 에테르화 또는 다른 당 분자가 존재하는 아세탈인 분지형 시클로덱스트린이다.
-O-[알크-O-]n-H
상기 식에서, 알크는 알킬 (특히, 저급 알킬)이고, n은 2 내지 12 (바람직하게는 2 내지 5, 더욱 바람직하게는 2 또는 3임)로부터의 전체 수이다.
상기 식에서, R'은 수소, 히드록시, -O-(알크(-R)-O-)p-H 또는 -O-(알크(-R)-O-)q-CO-Y이고; 모든 경우에 알크는 알킬, 특히 저급 알킬이고; m, n, p, q 및 z는 1 내지 12 (바람직하게는 1 내지 5, 특히 1 내지 3임)로부터의 전체 수이며; Y는 OR1 또는 NR2R3 (여기서, R1, R2 및 R3 는 서로 독립적으로 수소 또는 저급 알킬이거나, R2 및 R3가 연결 질소와 함께 혼합되어 모르폴리노, 피페리디노, 피롤리디노 또는 피페라지노가 됨)이다.
에스테르는 일차 알카노일 에스테르로, 특히 시클로덱스트린의 아세틸 에스테르와 같은 저급 알카노일 에스테르이다.
또한, 2종 이상의 상이한 상기 에테르기 및 에스테르기가 동시에 존재하는 시클로덱스트린을 갖을 수 있다.
또한, 2종 이상의 상기 시클로덱스트린 및(또는) 시클로덱스트린 유도체도 존재할 수 있다.
특히, 메틸-β-시클로덱스트린 또는 특히 2,6-디-O-메틸-β-시클로덱스트린, 또는 그의 히드록시 저급 알킬 에테르 (예를 들면, 2-히드록시프로필-α-, 2-히드록시프로필-β- 또는 2-히드록시프로필-γ-시클로덱스트린)와 같은 α-, β- 또는 γ-시클로덱스트린 또는 이들의 저급 알킬 에테르가 바람직하다.
시클로덱스트린 또는 시클로덱스트린 유도체는, 바람직하게는 0.02 내지 10 중량%(w/v)의 농도, 더욱 바람직하게는 0.05 내지 5 중량%(w/v)의 농도, 특히 0.1 내지 4 (예를 들면, 0.1 내지 2) 중량%(w/v)의 농도로 배양 배지에 가해진다.
시클로덱스트린 또는 시클로덱스트린 유도체는 공지되어 있고, 알려진 방법 (US 3,459,731호, US 4,383,992호, US 4,535,152호, US 4,659,696호, EP 0 094 157호, EP 0 149 197호, EP 0 197 571호, EP 0 300 526호, EP 0 320 032호, EP 0 499 322호, EP 0 503 710호, EP 0 818 469호, WO 90/12035호, WO 91/11200호, WO 93/19061호, WO 95/08993호, WO 96/14090호, GB 2,189,245호, DE 3,118,218호, DE 3,317,064호, 및 시클로덱스트린 또는 시클로덱스트린 유도체의 합성에 관하여 이들에 언급된 참고문헌 뿐만 아니라, [T. Loftsson 및 M.E. Brewster (1996): Pharmaceutical Applications of Cyclodex-trins: Drug Solubilization and Stabilisation: Journal of Pharmaceutical Science 85 (10):1017-1025호] 및 [R.A. Rajewski 및 V.J. Stella(1996): Pharmaceutical Applications of Cyclodex-trins: In Vivo Drug Delivery: Journal of Pharmaceutical Science 85 (11): 1142-1169)] 참조)에 의해 제조될 수도 있다.
본원에서 시험된 모든 시클로덱스트린 유도체는 플루카 (Fluka, Buchs, CH)사로부터 수득할 수 있다. 시험은 200 ㎖의 교반 플라스크 중에서 50 ㎖의 배양 부피로 수행하였다. 대조군으로서, 흡수 수지 앰벌라이트 XAD-16 (Rohm & Haas, Frankfurt, Germany)에 어떤 흡수체도 가하지 않은 것을 사용하였다. 5일 동안 배양한 후에, HPLC에 의해 하기와 같은 에포틸론 타이터 (titer)를 측정할 수 있었다.
가해진시클로덱스트린 주문번호 농도[% w/v]1 EpoA[mg/ℓ] EpoB[mg/ℓ]
앰벌라이트 XAD-16 (v/v)2-히드록시프로필-β-시클로덱스트린2-히드록시프로필-β-시클로덱스트린2-히드록시프로필-β-시클로덱스트린2-히드록시프로필-β-시클로덱스트린2-히드록시프로필-β-시클로덱스트린2-히드록시프로필-α-시클로덱스트린2-히드록시프로필-α-시클로덱스트린2-히드록시프로필-α-시클로덱스트린β-시클로덱스트린β-시클로덱스트린β-시클로덱스트린β-시클로덱스트린β-시클로덱스트린메틸-β-시클로덱스트린메틸-β-시클로덱스트린메틸-β-시클로덱스트린2,6-디-O-메틸-β-시클로덱스트린2-히드록시프로필-γ-시클로덱스트린2-히드록시프로필-γ-시클로덱스트린2-히드록시프로필-γ-시클로덱스트린2-히드록시프로필-γ-시클로덱스트린2-히드록시프로필-γ-시클로덱스트린가하지 않음 56332""""56330""28707""""66292""3991556334"""" 2.0 (% v/v)0.10.51.02.05.00.51.05.00.10.51.02.05.00.51.02.01.00.10.51.02.05.0 9.22.44.74.74.71.71.21.22.51.63.64.84.81.10.8<0.3<0.3<0.30.30.91.12.65.00.5 3.81.73.33.44.10.51.21.22.31.32.53.72.90.4<0.3<0.3<0.3<0.3<0.30.80.70.71.10.5
1) 앰벌라이트 (% v/v)를 제외한 모든 %가 중량% (% w/v)이다.
사용된 농도에서 시험된 시클로덱스트린 중 극소수 (2,6-디-O-메틸-β-시클로덱스트린, 메틸-β-시클로덱스트린)만이 에포틸론 생성에 대해 효과가 없거나 음성 효과가 나타났다.
실시예에서, 1 내지 2%의 2,6-디-O-메틸-β-시클로덱스트린 및 메틸-β-시클로덱스트린은 시클로덱스트린을 사용하지 않은 경우에 비해 6 내지 8배만큼 에포틸론 생성이 증가하였다.
C: 1% 2-(히드록시프로필)-β-시클로덱스트린을 사용한 10 ℓ 발효:
15 ℓ의 유리 발효기에서 발효를 수행하였다. 배지는 바커 케미(Wacker Chemie, Munich, Germany)사로부터 입수한 10 g/ℓ의 2-(히드록시프로필)-β-시클로덱스트린을 함유하고 있었다. 발효의 진행을 표 3에 도시하였다. 6일 후에 발효를 종결하고, 연구를 수행하였다.
10 ℓ 발효의 진행
배양 시간 [일] 에포틸론 A [mg/ℓ] 에포틸론 B [mg/ℓ]
0 0 0
1 0 0
2 0.5 0.3
3 1.8 2.5
4 3.0 5.1
5 3.7 5.9
6 3.6 5.7
D: 1% 2-(히드록시프로필)-β-시클로덱스트린을 사용한 100 ℓ 발효:
150 ℓ의 발효기에서 발효를 수행하였다. 배지는 10 g/ℓ의 2-(히드록시프로필)-β-시클로덱스트린을 함유하고 있었다. 발효의 진행을 표 4에 도시하였다. 7일 후에 발효물을 수획하여 연구를 수행하였다.
100 ℓ 발효의 진행
배양 시간 [일] 에포틸론 A [mg/ℓ] 에포틸론 B [mg/ℓ]
0 0 0
1 0 0
2 0.3 0
3 0.9 1.1
4 1.5 2.3
5 1.6 3.3
6 1.8 3.7
7 1.8 3.5
E: 1% 2-(히드록시프로필)-β-시클로덱스트린을 사용한 500 ℓ 발효:
750 ℓ의 발효기에서 발효를 수행하였다. 배지는 10 g/ℓ의 2-(히드록시프로필)-β-시클로덱스트린을 함유하고 있었다. 발효의 진행을 표 5에 도시하였다. 7일 후에 발효물을 수획하여 연구를 수행하였다.
100 ℓ 발효의 진행
배양 시간 [일] 에포틸론 A [mg/ℓ] 에포틸론 B [mg/ℓ]
0 0 0
1 0 0
2 0 0
3 0.6 0.6
4 1.7 2.2
5 3.1 4.5
6 3.1 5.1
F: 비교 실시예 - 흡수체를 사용하지 않은 10 ℓ 발효:
15 ℓ의 유리 발효기에서 발효를 수행하였다. 배지는 어떤 덱스트린 또는 기타 흡수체도 함유하지 않았다. 발효의 진행을 표 6에 도시하였다. 배양물을 회수하지 않고 연구를 수행하였다.
흡수체가 없는 10 ℓ 발효의 진행
배양 시간 [일] 에포틸론 A [mg/ℓ] 에포틸론 B [mg/ℓ]
0 0 0
1 0 0
2 0 0
3 0 0
4 0.7 0.7
5 0.7 1.0
6 0.8 1.3
G: 에포틸론의 연구 - 500 ℓ 주요 배양물로부터의 단리:
실시예 2D의 500 ℓ 주요 배양물로부터 수획된 부피는 450 ℓ였으며, 이를 웨스트팔리아 투명화 분리기 (Westfalia clarifying separator) 타입 SA-20-6 (rpm=6500)를 이용하여 액상 (원심분리 + 세정수=650 ℓ) 및 고상 (세포=약 15 kg)으로 분리하였다. 에포틸론은 주로 원심분리된 부분에서 발견되었다. 원심분리된 세포 펄프는 15% 미만의 에포틸론 부분을 함유하는 것으로 측정되었지만, 이를 추가로 가공하지는 않았다. 이어서, 650 ℓ의 원심분리물을 4000 ℓ의 교반 용기에 넣고, 10 ℓ의 앰벌라이트 XAD-16 (원심분리물:수지 부피=65:1)를 넣으면서 교반하였다. 약 2시간 동안 접촉시킨 후에, 수지를 헤인 오버플로우 (Heine overflow) 원심분리기 (40 ℓ의 용기 용량, rpm=2800)에서 원심분리하였다. 수지를 원심분리기에서 꺼낸 후 10 내지 15 ℓ의 탈이온수로 세척하였다. 30 ℓ의 유리 교반 용기에서 30 ℓ의 이소프로판올로 30분 동안 교반하는 과정을 2회 수행하여 흡수체에서 흡수물을 떨어뜨렸다. 흡입 필터를 사용하여 수지로부터 이소프로판올상을 분리하였다. 이어서, 진공-조작 순환 증발기 (vacuum-operated circulating evaporator, Schmid-Verdampfer)에서 혼합된 이소프로판올상에 물을 가하고, 결과의 수상 약 10 ℓ를 10 ℓ의 에틸 아세테이트로 3회 추출하여 이소프로판올을 제거하였다. 추출은 30 ℓ의 유리 교반기에서 수행하였다. 진공-조작 순환 증발기 (Schmid-Verdampfer)에서 에틸 아세테이트 추출물을 3 내지 5 ℓ로 농축시키고, 이후에 진공하의 회전 증발기 (rotary evaporator, Buechi형)에서 건조시켰다. 에틸 아세테이트 추출물을 500 ㎖의 메탄올에 용해시키고, 중첩 (folded) 필터로 여과하여 용해되지 않은 부분을 제거한 후, 이 용액을 10 kg의 세파덱스 (Sephadex) LH 20 컬럼 (Pharmacia, uppsala, Sweden)(컬럼 직경은 20 cm이며, 충전 수준은 약 1.2 m임)에 가하였다. 용출액으로 메탄올을 사용하여 용출하였다. 에포틸론 A 및 B는 주로 분획 21 내지 23 (분획의 크기는 1 ℓ임)에 존재하였다. 진공하의 회전 증발기 (총 중량은 9.0 g임)에서 이 분획들을 농축하여 건조시켰다. 이 세파덱스 피크 분획 (9.0 g)을 아세토니트릴, 물 및 염화에틸렌이 50 대 40 대 2의 혼합물 92 ㎖에 용해시키고, 중첩 필터를 통해 이 용액을 여과시킨 후 RP 컬럼 (장치 Prepbar 200, Merck; 2.0 kg LiChrospher RP-18 Merck, 과립 크기 12 ㎛, 컬럼 직경 10 cm, 충전 수준 42 cm; Merck, Darmstadt, Germany)에 가하였다. 아세토니트릴 및 물이 3 대 7인 혼합물로 용출 (유속=500 ㎖/분; 에포틸론 A의 보유 시간=약 51-59분; 에포틸론 B의 보유 시간=약 60-69분)하였다. UV 검출기로 250 nm에서 분획을 모니터하였다. 이 분획들을 진공하의 뷔치-로타베이포 (Buechi-Rotavapor) 회전 증발기 상에서 농축하여 건조시켰다. 에포틸론 A 피크 분획의 중량은 700 mg이었고, HPLC (외부 표준)에 따르면 그 함량은 75.1%이었다. 에포틸론 B 피크 분획의 중량은 1980 mg이었고, HPLC (외부 표준)에 따르면 그 함량은 86.6%이었다. 결국, 에포틸론 A 분획 (700 mg)이 5 ml의 에틸 아세테이트:톨루엔=2:3인 용매로부터 결정화되어, 170 mg의 순수한 에포틸론 A 결정을 산출하였다 [HPLC에 따른 함량 (면적의 %)=94.3%]. 에포틸론 B 분획 (1980 mg)은 18 ml의 메탄올로부터 결졍화되어, 1440 mg의 순수한 에포틸론 B 결정을 산출하였다 [HPLC에 따른 함량 (면적의 %)=99.2%]. 융점 (에포틸론 B)은 예를 들면, 124-125℃이고, 에포틸론 B에 대한 1H NMR 데이타 (500 MHz-NMR, 용매: DMSO-d6, TMS에 대한 상대적인 화학적 이동 δ(ppm), s=단일 피크, d=이중 피크 분열, m=다중 피크 분열)는 하기와 같다.
δ (피크 분열 정도) 정수 (H의 수)
7.34 (s) 1
6.50 (s) 1
5.28 (d) 1
5.08 (d) 1
4.46 (d) 1
4.08 (m) 1
3.47 (m) 1
3.11 (m) 1
2.83 (dd) 1
2.64 (s) 3
2.36 (m) 2
2.09 (s) 3
2.04 (m) 1
1.83 (m) 1
1.16 (m) 1
1.47 - 1.24 (m) 4
1.18 (s) 6
1.13 (m) 2
1.06 (d) 3
0.89 (d+s, 중복) 6
합계 = 41
<실시예 15> 재조합 생성된 에포틸론의 의학적 용도
에포틸론을 포함하는 제약 제제 또는 조성물은 예를 들면, 다양한 인간 충실성 종양과 같은 암 질환의 치료에 사용된다. 이러한 항암 제형은 제약상 적합한 1종 이상의 유기 또는 무기, 액체 또는 고체 담체 물질과 함께 활성량의 에포틸론을 포함한다. 이러한 제형은 예를 들면, 장내 투여, 비강 투여, 직장 투여, 구강 투여 또는 비구강 투여, 특히 근육내 투여 또는 정맥내 투여로 전달될 수 있다. 활성 성분의 투여량은 환자의 체중, 연령, 및 물리학적 약물동력학적 조건에 따라 좌우되며, 추가로 전달 방법에 따라 좌우된다. 에포틸론은 탁솔의 생물학적 효과를 모방하기 때문에, 에포틸론은 암의 치료를 위한 조성물 및 방법에 있어서 탁솔을 대체할 수 있다. 이는 본원에 참고문헌으로 포함되는 미국 특허 제5,496,804호, 동 제5,565,478호 및 동 제5,641,803호를 참조할 수 있다.
예를 들면, 치료용 에포틸론 B는 무색 투명한 정맥내 투여용인 1 mg/㎖의 농축액으로서 제형화된 2 ㎖의 유리 바이알에 제공될 수 있다. 이 물질은 폴리에틸렌 글리콜 300 (PEG 300) 중에 제형화하고 0.9% 염화나트륨 주입액 (USP) 50 또는 100 ㎖에 희석하여, 관주용 약물의 바람직한 최종 농도를 수득한다. 이 약물은 21일에 1회 30분 정맥내 관주 (3주에 1회 치료)로서 6회 반복 투여하거나, 7일에 1회 30분 정맥내 관주 (주 1회 치료)로서 투여한다.
주 1회 치료시 투여량은 통상 약 0.1 내지 약 6 mg/m2이며, 바람직하게는 약 0.1 내지 약 5 mg/m2, 더욱 바람직하게는 약 0.1 내지 약 3 mg/m2, 더더욱 바람직하게는 약 0.1 내지 약 1.7 mg/m2, 가장 바람직하게는 약 0.3 내지 약 1 mg/m2이다. 3주에 1회 치료시 (3주마다 치료 또는 매 세째 주에 치료) 투여량은 약 0.3 내지 약 18 mg/m2이며, 바람직하게는 약 0.3 내지 약 15 mg/m2, 더욱 바람직하게는 약 0.3 내지 약 12 mg/m2, 더더욱 바람직하게는 약 0.3 내지 약 7.5 mg/m2, 이보다 더 바람직하게는 약 0.3 내지 약 5 mg/m2, 가장 바람직하게는 약 1.0 내지 약 3.0 mg/m2이다. 이 투여량은 2 내지 180분 동안, 바람직하게는 2 내지 120분 동안, 더욱 바람직하게는 약 5 내지 약 30분 동안, 가장 바람직하게는 약 10 내지 약 30분 (예를 들면, 약 30분) 동안에 인간에게 정맥내 (i.v.) 투여되는 것이 바람직하다.
본 발명이 그의 구체적인 실시양태를 참조로 설명되었지만, 다양한 변형, 변화 및 실시양태가 가능하며, 따라서 그러한 모든 변형, 변화 및 실시양태는 본 발명의 정신 및 범위 내에 포함되는 것으로 이해되어야 한다.
<110> Novartis AG <120> GENES FOR THE BIOSYNTHESIS OF EPOTHILONES <130> 4-30582A <140> <141> <160> 30 <170> PatentIn Ver. 2.0 <210> 1 <211> 68750 <212> DNA <213> Sorangium cellulosum <400> 1 aagcttcgct cgacgccctc ttcgcccgcg ccacctctgc ccgtgtgctc gatgatggcc 60 acggccgggc cacggagcgg catgtgctcg ccgaggcgcg cgggatcgag gacctccgcg 120 ccctccgaga gcacctccgc atccaggaag gggggccgtc ctttcactgc atgtgcctcg 180 gcgacctgac ggtggagctc ctcgcgcacg accagcccct cgcgtccatc agcttccacc 240 atgcccgcag cctgaggcac cccgactgga cctcggacgc gatgctcgtc gacggccccg 300 cgctcgtccg gtggctcgcc gcgcgcggcg cgccgggtcc cctccgcgag tacgaagagg 360 agcgcgagcg agcccgaacc gcgcaggagg cgaggcgcct gtggctcgcg gccgcgccgc 420 cctgcttcgc gcccgatctg ccccgcttcg aggacgacgc caacgggctg ccgctcggcc 480 cgatgtcgcc tgaagtcgcc gaggccgagc ggcgcctccg cgcctcgtac gcgactcctg 540 agctcgcctg tgccgcgctg ctcgcctggc tcgggacggg cgcgggtccc tggtccggat 600 atcccgccta cgagatgctg ccagagaatc tgctcctcgg gtttggcctc ccgaccgcga 660 tcgccgcggc ctccgcgccc ggcacatcgg aggccgctct ccgcggcgca gcgcggctgt 720 tcgcctcctg ggaggtcgta tcgagcaaga agagccagct cggcaacatc cccgaagccc 780 tgtgggagcg gctccggacg atcgtccgcg cgatgggcaa tgccgacaac ctctctcgct 840 tcgagcgcgc cgaggcgatc gcggcggagg tgcgccgcct gcgcgcacag ccggcgccct 900 tcgcggcggg cgccggcctg gcggtcgctg gggtctcctc gagcggccgg ctctcgggcc 960 tcgtgaccga cggagacgca ttgtactccg gcgacggcaa cgacatcgtc atgttccaac 1020 ccggccggat ctcgccggtc gtgctgctcg ccggaaccga tcccttcttc gagctcgcac 1080 cgcccctcag ccagatgctc ttcgtcgcgc acgccaacgc gggcaccatc tccaaggtcc 1140 tgacggaagg cagccccctc atcgtgatgg caagaaacca ggcgcgaccg atgagcctcg 1200 tccacgctcg cgggttcatg gcgtgggtca accaggccat ggtgcccgac cccgagcggg 1260 gcgcgccctt cgtcgtccag cgctcgacca tcatggaatt cgagcacccc acgcctcgtt 1320 gtctccacga gcccgccggc agcgctttct ccctcgcctg cgacgaggag cacctctact 1380 ggtgcgagct ttcggctggc cggctcgagc tatggcgcca cccgcaccac cgccccggcg 1440 ccccgagccg cttcgcgtac ctcggcgagc accccattgc ggcgacctgg tacccctcgc 1500 tcaccctcaa tgcgacccac gtgctgtggg ccgaccctga tcgcagggcc atcctcgggg 1560 tcgacaagcg caccggcgta gagcccatcg tcctcgcgga gacgcgccat cccccggcgc 1620 acgtcgtgtc cgaggaccgg gacatcttcg cgcttaccgg acagcccgac tcccgcgact 1680 ggcacgtcga gcacatccgc tccggcgcct ccaccgtcgt ggccgactac cagcgccagc 1740 tatgggaccg ccctgacatg gtgctcaatc ggcgcggcct cttcttcacg acgaacgacc 1800 gcatcctgac gctcgcccgc agctgacatc gctcgacgcc gggccgctca tcgagggcgc 1860 ccggaccgag ctggcgaccc gccgctggcg ggccgcagct catgccgatt cggtggcgac 1920 gtagacgctg cgccagaaac gctcgagagc ccccgagaac aggaagccgg cggattgtgt 1980 catcacgatc ccgatcagct cgcggcccgg atcattgatc caggacgtcc cgaacccgcc 2040 gtcccaccca tagcgcccgg gcacctccga gaccgcgtcc ggcgccgtga ccacggccat 2100 cccataaccc cagccgtgcg tctcgaagaa gcccgggaaa aacgaggacg ccgccttctg 2160 ggccggcgtg aggtgatcgg ccgtcatctc gcgcaccgag gcggcgctca agagccgccg 2220 gccctcgtgc acaccgccgt tcatgagcat gcgcgcgaac aggaggtagt cgtccaccgt 2280 cgacacgagc ccggcggcgc ccgaagggaa cgccggcggg ctggcatagg cgctctcggc 2340 cccgtcgcga tccatgcgcg tcttctcccc cgtctgctcg tcggtgaagt aaccgcagcc 2400 cgcgaaccga gcgagcttgt ccgccgggac gtgaaagtcg gtgtcccgca tcccgagcgg 2460 cgcgaggatg cgctcgcgca cgaacgcatc gaagccctgg tcggccgcgc gccccacgag 2520 caccccctgc accaggctcc ccgtgttgta catccactgc gcccccggct gatgcatgag 2580 cggcagcgtc ccgagccgcc ggatccactc gtctggcccg tgcggcgtca tcggcaccgg 2640 ctgcgcgttg acgagcccga gctcgtcgat ggcccgctgg atcggcgacg atgcgtcgaa 2700 cgagattccg aagcccatcg tgaacgtcat caggtcgcgc accgtgatcg gccgctccgc 2760 gggcaccgtc tcgtcgatcg gaccatcgat gcgcgccagc accttccggt tcgcgagctc 2820 cggcaaccat cggtcgacgg gggagtcgag gtcgagcttg ccttcctcga cgagcatcat 2880 caccgccgtc gcggtgaccg ccttcgtcat cgaggcgatc cggaagatcg tgtcccgccg 2940 catgggcgcg ctgccgccga gctcggtcac gcccaccgcg tccacgtgca cgtcgtcgcc 3000 gcgcgcgacc agccagaccg ctcccggcat ctgccccgcc gccacctccg ccgccatcac 3060 ctcgcgcgcg ggcgccagcg cgccggcccc cgcgtcctgc cctggctgcc cctcctcctc 3120 ggccccaccc aacgcgcacc ccggcgccgc cacgctgatc aaagctccca taaactcccg 3180 ccttctcatg accgtcgatg cctctccgag cgggggcgcc tgcccctgcc gagagcactg 3240 actgcccgcg cccgaaaaaa tcatcggtgc cccgtcacga tcgccgccgg gcgtggctcc 3300 gcccggccgc ccgctcgggc gcccgcccct ggacgagcaa agctcgcccg cccgcgctca 3360 gcacgccgct tgccatgtcc ggcctgcacc cacaccgagg agccacccac cctgatgcac 3420 ggcctcaccg agcggcaggt cctgctctcg ctcgtcaccc tcgcgctcat cctcgtgacc 3480 gcgcgcgcct ccggcgagct cgcgcggcgg ctgcgccagc ccgaggtgct cggggagctc 3540 ttcggcggcg tcgtgctggg cccctccgtc gtcggcgcgc tcgcgcccgg gttccatcga 3600 gccctcttcc aggagccggc ggtcggggtc gtgctctcgg gcatctcctg gataggcgcg 3660 ctcctcctgc tgctgatggc gggcatcgag gtcgacgtgg gcatcctgcg caaggaggcg 3720 cgccccgggg cgctctcggc gctcggcgcg atcgcgcccc cgctcgcggc gggcgccgcc 3780 ttctcggcgc tcgtgctcga tcggcccctt ccgagcggcc tcttcctcgg gatcgtgctc 3840 tcggtgacgg cggtcagcgt gatcgcgaag gtgctgatcg agcgcgagtc gatgcgccgc 3900 agctatgcgc aggtgacgct cgcggcgggg gtggtcagcg aggtcgctgc ctgggtgctc 3960 gtcgcgatga cgtcgtcgag ctacggcgcg tcgcccgcgc tggcggtcgc ccggagcgcg 4020 ctcctggcga gcggattctt gctgttcatg gtgctcgtcg ggcggcggct cacccacctc 4080 gcgatgcgct gggtggccga cgcgacgcgc gtctccaagg gacaggtgtc gctcgtcctc 4140 gtcctcacgt tcctggccgc ggcgctgacg cagcggctcg gcctgcaccc gctgctcggc 4200 gcgttcgcgc tcggcgtgct gctcaacagc gctcctcgca ccaaccgccc tctcctcgac 4260 ggcgtgcaga cgctcgtggc gggcctcttc gcgcctgtgt tcttcgtcct cgcgggcatg 4320 cgcgtcgacg tgtcgcagct gcgcacgccg gcggcgtggg ggacggtcgc gttgctgctg 4380 gcgaccgcga cggcggcgaa ggtcgtcccc gccgcgctcg gcgcgcggct cggcgggctc 4440 aggggcagcg aggcggcgct cgtggcggtg ggcctgaaca tgaagggcgg cacggacctc 4500 atcgtcgcga tcgtcggcgt cgagctcggg ctcctctcca acgaggctta tacgatgtac 4560 gccgtcgtcg cgctggtcac ggtgaccgcc tcacccgcgc tcctcatctg gctcgagaaa 4620 agggcgcctc cgacgcagga ggagtcggct cgcctcgagc gcgaggaggc cgcgaggcgc 4680 gcgtacatcc ccggggtcga gcggatcctc gtcccgatcg tggcgcacgc cctgcccggg 4740 ttcgccacgg acatcgtgga gagcatcgtc gcctccaagc gaaagctcgg cgagacggtc 4800 gacatcacgg agctctccgt ggagcagcag gcgcccggcc catcgcgcgc cgcgggggag 4860 gcgagccggg ggctcgcgag gctcggcgcg cgcctccgcg tcggcatctg gcggcaaagg 4920 cgcgagctgc gcggctcgat ccaggcgatc ctgcgcgcct cgcgggatca cgatctgctc 4980 gtgatcggcg cgcgatcgcc ggcgcgcgcg cgcggaatgt cgttcggtcg cctgcaggac 5040 gcgatcgtcc agcgggccga gtccaacgtg ctcgtcgtgg tgggcgaccc tccggcggcg 5100 gagcgcgcct ccgcgcggcg gatcctcgtc ccgatcatcg gcctcgagta ctccttcgcc 5160 gccgccgatc tcgcggccca cgtggcgctg gcgtgggacg ccgagctcgt gctgctcagc 5220 agcgcgcaga ccgatccggg cgcggtcgtc tggcgcgatc gcgagccatc ccgggtgcgc 5280 gcggtggcgc ggagcgtcgt cgacgaggcg gtcttccggg ggcgccggct cggcgtgcgc 5340 gtctcgtcgc gcgtgcacgt gggcgcgcac ccgagcgacg agataacgcg ggagctcgcg 5400 cgcgccccgt acgatctgct cgtgctcgga tgctacgacc atgggccgct cggccggctc 5460 tacctcggca gcacggtcga gtcggtggtg gtccggagcc gggtgccggt cgcgttgctc 5520 gtcgcgcatg gagggactcg agagcaggtg aggtgaggct tccaccgcgc tcgcccgtga 5580 ggaagcgagc gcccggctct gccgacgatc gtcactcccg gtccgtgtag gcgatcgtgc 5640 tgagcagcgc gttctccgcc tgacgcgagt cgagccgggt atgctgcacg acgatggggg 5700 cgtccgattc gatcacgctg gcatagtccg tatcgcgcgg gatcggctcg ggttcggtca 5760 gatcgttgaa ccggacgtgc cgggtgcgcc tcgctggaac ggtcacccgg taaggcccgg 5820 cggggtcgcg gtcgctgaag taaacggtga tggcgacctg cgcgtcccgg tccgacgcat 5880 tcaacaggca ggccgtctca tggctcgtca tctgcggctc aggtccgttg ctcccgcctg 5940 ggatgtagcc ctctgcgatt gcacagcgcg tccgcccgat cggcttgtcc atgtgtcctc 6000 cctcctggct cctctttggc agcctccctc tgctgtccag gagcgatggc ctcttcgctc 6060 gacgcgctcg gggatccatg gctgaggatc ctcgccgagc gctccctgcc gaccggcgcg 6120 ccgagcgccg acgggctttg aaagcgcgcg accggccagc ccggacgcgg gcccgagagg 6180 gacagtgggt ccgccgtgaa gcagagaggc gatcgaggtg gtgagatgaa acacgtcgac 6240 acgggccgac gattcggccg ccggataggg cacacgctcg gtcttctcgc gagcatggcg 6300 ctcgccggct gcggcggtcc gagcgagaaa accgtgcagg gcacgcggct cgcgcccggc 6360 gccgatgcgc gcgtcaccgc cgacgtcgac cccgacgccg cgaccacgcg gctggcggtg 6420 gacgtcgttc acctctcgcc gcccgagcgg ctcgaggccg gcagcgagcg gttcgtcgtc 6480 tggcagcgtc cgagccccga gtccccgtgg cgacgggtcg gagtgctcga ctacaatgct 6540 gacagccgaa gaggcaagct ggccgagacg accgtgccgt atgccaactt cgagctgctc 6600 atcaccgccg agaagcagag cagccctcag tcgccatcgt ctgccgccgt catcgggccg 6660 acgtctgtcg ggtgacatcg cgctatcagc agcgctgagc ccgccagcag gccccagggc 6720 cctgcctcga tggccttccc catcacccct gcgcactcct ccagcgacgg ccgcgcagcg 6780 acggccgcgt ccaagcaacc gccgtgccgg cgcggctcca cgcgcgcgac aggcgagcgt 6840 cctggcgcgg cctgcgcatc gctggaagga tcggcggagc atggatagag aatcgaggat 6900 cgcgatcttt gttgccatcg cagccaacgt ggcgatcgcg gcggtcaagt tcatcgccgc 6960 cgccgtgacc ggcagctcgg cgaggcgttt gccgacttcg gcggcgtccc gcgcgtgctg 7020 ctctacgaca acctcaagag cgccgtcgtc gagcgccacg gcgacgcgat ccggttccac 7080 cccacgctgc tggctctgtc ggcgcattac cgcttcgagc cgcgccccgt cgccgtcgcc 7140 cgcggcaacg agaagggccg cgtccagcgc gccatcacgg cgtggacgac atggcgcgga 7200 aacgtcgtcg taaccgccca gcaatgtcat gggaatggcc ccttgaaatg gccccttgag 7260 ggggctggcc ggggtcgacg atatcgcgcg atctccccgt caattcccga tggtaaaaga 7320 aaaatttgtc atagatcgta agctgtgata gtggtctgtc ttacgttgcg tcttccgcac 7380 ctcgagcgag ttctctcgga taactttcaa tttttccgag gggggcttgg tctctggttc 7440 ctcaggaagc ctgatcggga cgagctaatt cccatccatt tttttgaggc tctgctcaaa 7500 gggattagat cgagtgagac agttcttttg cagtgcgcga agaacctggg cctcgaccgg 7560 aggacgatcg acgtccgcga gcgggtcagc cgctgaggat gtgcccgtcg tggcggatcg 7620 tcccatcgag cgcgcagccg aagatccgat tgcgatcgtc ggagcgagtt gccgtctgcc 7680 cggtggcgtg atcgatctga gcgggttctg gacgctcctc gagggctcgc gcgacaccgt 7740 cgggcgagtc cccgccgaac gctgggatgc agcagcgtgg tttgatcccg accccgatgc 7800 cccggggaag acgcccgtta cgcgcgcatc tttcctgagc gacgtagcct gcttcgacgc 7860 ctccttcttc ggcatctcgc ctcgcgaagc gctgcggatg gaccctgcac atcgactctt 7920 gctggaggtg tgctgggagg cgctggagaa cgccgcgatc gctccatcgg cgctcgtcgg 7980 tacggaaacg ggagtgttca tcgggatcgg cccgtccgaa tatgaggccg cgctgccgca 8040 agcgacggcg tccgcagaga tcgacgctca tggcgggctg gggacgatgc ccagcgtcgg 8100 agcgggccga atctcgtatg ccctcgggct gcgagggccg tgtgtcgcgg tggatacggc 8160 ctattcgtcc tcgctggtgg ccgttcatct ggcctgtcag agcttgcgct ccggggaatg 8220 ctccacggcc ctggctggtg gggtatcgct gatgttgtcg ccgagcaccc tcgtgtggct 8280 ctcgaagacc cgggcgctgg ccagggacgg tcgctgcaag gcattttcgg cggaggccga 8340 tgggttcgga cgaggcgaag ggtgcgccgt cgtggtcctc aagcggctca gtggagcccg 8400 cgcggacggc gatcggatat tggcggtgat tcgaggatcc gcgatcaatc acgacggtgc 8460 gagcagcggt ctgaccgtgc cgaacgggag ctcccaagaa atcgtgctga aacgggccct 8520 ggcggacgca ggctgcgccg cgtcttcggt gggttatgtc gaggcacacg gcacgggcac 8580 gacgcttggt gaccccatcg aaatccaagc tctgaatgcg gtatacggcc tcgggcgaga 8640 tgtcgccacg ccgctgctga tcgggtcggt gaagaccaac cttggccatc ctgagtatgc 8700 gtcggggatc actgggctgc tgaaggtcgt cttgtccctt cagcacgggc agattcctgc 8760 gcacctccac gcgcaggcgc tgaacccccg gatctcatgg ggtgatcttc ggctgaccgt 8820 cacgcgcgcc cggacaccgt ggccggactg gaatacgccg cgacgggcgg gggtgagctc 8880 gttcggcatg agcgggacca acgcgcacgt ggtgctggaa gaggcgccgg cggcgacgtg 8940 cacaccgccg gcgccggagc gaccggcaga gctgctggtg ctgtcggcaa ggaccgcgtc 9000 agccctggat gcacaggcgg cgcggctgcg cgaccatctg gagacctacc cttcgcagtg 9060 tctgggcgat gtggcgttca gtctggcgac gacgcgcagc gcgatggagc accggctcgc 9120 ggtggcggcg acgtcgaggg aggggctgcg ggcagccctg gacgctgcgg cgcagggaca 9180 gacgtcgccc ggtgcggtgc gcagtatcgc cgattcctca cgcggcaagc tcgcctttct 9240 cttcaccgga cagggggcgc agacgctggg catgggccgt gggctgtacg atgtatggtc 9300 cgcgttccgc gaggcgttcg acctgtgcgt gaggctgttc aaccaggagc tcgaccggcc 9360 gctccgcgag gtgatgtggg ccgaaccggc cagcgtcgac gccgcgctgc tcgaccagac 9420 agccttcacc cagccggcgc tgttcacctt cgaatatgcg ctcgccgcgc tgtggcggtc 9480 gtggggtgta gagccggagt tggtcgccgg ccatagcatc ggtgagctgg tggctgcctg 9540 cgtggcgggc gtgttctcgc ttgaggacgc ggtgttcctg gtggctgcgc gcgggcgcct 9600 gatgcaggcg ctgccggccg gcggggcgat ggtgtcgatc gaggcgccgg aggccgatgt 9660 ggctgctgcg gtggcgccgc acgcagcgtc ggtgtcgatc gccgcggtca acgctccgga 9720 ccaggtggtc atcgcgggcg ccgggcaacc cgtgcatgcg atcgcggcgg cgatggccgc 9780 gcgcggggcg cgaaccaagg cgctccacgt ctcgcatgcg ttccactcac cgctcatggc 9840 cccgatgctg gaggcgttcg ggcgtgtggc cgagtcggtg agctaccggc ggccgtcgat 9900 cgtcctggtc agcaatctga gcgggaaggc ttgcacagac gaggtgagct cgccgggcta 9960 ttgggtgcgc cacgcgcgag aggtggtgcg cttcgcggat ggagtgaagg cgctgcacgc 10020 ggccggtgcg ggcaccttcg tcgaggtcgg tccgaaatcg acgctgctcg gcctggtgcc 10080 tgcctgcatg ccggacgccc ggccggcgct gctcgcatcg tcgcgcgctg ggcgtgacga 10140 gccggcgacc gtgctcgagg cgctcggcgg gctctgggcc gtcggtggcc tggtctcctg 10200 ggccggcctc ttcccctcag gggggcggcg ggtgccgctg cccacgtacc cttggcagcg 10260 cgagcgctac tggatcgaca cgaaagccga cgacgcggcg cgtggcgacc gccgtgctcc 10320 gggagcgggt cacgacgagg tcgaggaggg gggcgcggtg cgcggcggcg accggcgcag 10380 cgctcggctc gaccatccgc cgcccgagag cggacgccgg gagaaggtcg aggccgccgg 10440 cgaccgtccg ttccggctcg agatcgatga gccaggcgtg cttgatcacc tcgtgcttcg 10500 ggtcacggag cggcgcgccc ctggtctggg cgaggtcgag atcgccgtcg acgcggcggg 10560 gctcagcttc aatgatgtcc agctcgcgct gggcatggtg cccgacgacc tgccgggaaa 10620 gcccaaccct ccgctgctgc tcggaggcga gtgcgccggg cgcatcgtcg ccgtgggcga 10680 gggcgtgaac ggcctcgtgg tgggccaacc ggtcatcgcc ctttcggcgg gagcgtttgc 10740 tacccacgtc accacgtcgg ctgcgctggt gctgcctcgg cctcaggcgc tctcggcgat 10800 cgaggcggcc gccatgcccg tcgcgtacct gacggcatgg tacgcgctcg acagaatagc 10860 ccgccttcag ccgggggagc gggtgctgat ccatgcggcg accggcgggg tcggtctcgc 10920 cgcggtgcag tgggcgcagc acgtgggagc cgaggtccat gcgacggccg gcacgcccga 10980 gaaacgcgcc tacctggagt cgctgggcgt gcggtatgtg agcgattccc gctcggaccg 11040 gttcgtcgcc gacgtgcgcg cgtggacggg cggcgaggga gtagacgtcg tgctcaactc 11100 gctctcgggc gagctgatcg acaagagttt caatctcctg cgatcgcacg gccggtttgt 11160 ggagctcggc aagcgcgact gttacgcgga taaccagctc gggctgcggc cgttcctgcg 11220 caatctctcc ttctcgctgg tggatctccg ggggatgatg ctcgagcggc cggcgcgggt 11280 ccgtgcgctc ttggaggagc tcctcggcct gatcgcggca ggcgtgttca cccctccccc 11340 catcgcgacg ctcccgatcg cccgtgtcgc cgatgcgttc cggagcatgg cgcaggcgca 11400 gcatcttggg aagctcgtac tcacgctggg tgacccggag gtccagatcc gtattccaac 11460 ccacgcaggc gccggcccgt ccaccgggga tcgggacctg ctcgacaggc tcgcgtcagc 11520 tgcgccggcc gcgcgcgcgg cggcgctgga ggcgttcctc cgtacgcagg tctcgcaggt 11580 gctgcgcacg cccgaaatca aggtcggcgc ggaggcgctg ttcacccgcc tcggcatgga 11640 ctcgctcatg gccgtggagc tgcgcaatcg tatcgaggcg agcctcaagc tgaagctgtc 11700 gacgacgttc ctgtccacgt cccccaatat cgccttgttg gcccaaaacc tgttggatgc 11760 tctcgccaca gctctctcct tggagcgggt ggcggcggag aacctacggg caggcgtgca 11820 aaacgacttc gtctcatcgg gcgcagatca agactgggaa atcattgccc tatgacgatc 11880 aatcagcttc tgaacgagct cgagcaccag ggtatcaagc tggcggccga tggggagcgc 11940 ctccagatac aggcccccaa gaacgccctg aacccgaacc tgctcgctcg aatctccgag 12000 cacaaaagca cgatcctgac gatgctccgt cagagactcc ccgcagaatc catcgtgccc 12060 gccccagccg agcggcacgc tccgtttcct ctcacagaca tccaagaatc ctactggctg 12120 ggccggacag gagcgtttac ggtccccagc gggatccacg cctatcgcga atacgactgt 12180 acggatctcg acgtgccgag gctgagccgc gcctttcgga aagtcgtcgc gcggcacgac 12240 atgcttcggg cccacacgct gcccgacatg atgcaggtga tcgagcctaa agtcgacgcc 12300 gacatcgaga tcatcgatct gcgcgggctc gaccggagca cacgggaagc gaggctcgtg 12360 tcgttgcgag atgcgatgtc gcaccgcatc tatgacaccg agcgccctcc gctctatcac 12420 gtcgtcgccg ttcggctgga cgagcggcaa acccgtctcg tgctcagtat cgatctcatt 12480 aacgttgacc taggcagcct gtccatcatc ttcaaggact ggctcagctt ctacgaagat 12540 cccgagacct ctctccctgt cctggagctc tcgtaccgcg attatgtact cgcgctggag 12600 tctcgcaaga agtctgaggc gcatcaacga tcgatggatt actggaagcg gcgcatcgcc 12660 gagctcccac ctccgccgac gcttccgatg aaggccgatc catctaccct gaaggagatc 12720 cgcttccggc acacggagca atggctgccg tcggactcct ggggtcgatt gaagcggcgt 12780 gtcggggagc gcgggctgac cccgacgggc gtcatcctgg ctgcattttc cgaggtgatc 12840 gggcgctgga gcgcgagccc ccggtttacg ctcaacataa cgctcttcaa ccggctcccc 12900 gtccatccgc gcgtgaacga tatcaccggg gacttcacgt cgatggtcct cctggacatc 12960 gacaccactc gcgacaagag cttcgaacag cgcgctaagc gtattcaaga gcagctgtgg 13020 gaagcgatgg atcactgcga cgtaagcggt atcgaggtcc agcgagaggc cgcccgggtc 13080 ctggggatcc aacgaggcgc attgttcccc gtggtgctca cgagcgcgct taaccagcaa 13140 gtcgttggtg tcacctcgtt gcagaggctc ggaactccgg tgtacaccag cacgcagact 13200 cctcagctgc tgctggatca tcagctctac gagcacgatg gggacctcgt cctcgcgtgg 13260 gacatcgtcg acggagtgtt cccgcccgac cttctggacg acatgctcga agcgtacgtc 13320 gtttttctcc ggcggctcac tgaggaacca tggggtgaac aggtgcgctg ttcgcttccg 13380 cctgcccagc tagaagcgcg ggcgagcgca aacgcgacca acgcgctgct gagcgagcat 13440 acgctgcacg gcctgttcgc ggcgcgggtc gagcagctgc ccatgcagct cgccgtggtg 13500 tcggcgcgca agacgctcac gtacgaagag ctttcgcgcc gttcgcggcg acttggcgcg 13560 cggctgcgcg agcagggggc acgcccgaac acattggtcg cggtggtgat ggagaaaggc 13620 tgggagcagg ttgtcgcggt tctcgcggtg ctcgagtcag gcgcggccta cgtgccgatc 13680 gatgccgacc taccggcgga gcgtatccac tacctcctcg atcatggtga ggtaaagctc 13740 gtgctgacgc agccatggct ggatggcaaa ctgtcatggc cgccggggat ccagcggctg 13800 ctcgtgagcg aggccggcgt cgaaggcgac ggcgaccagc ctccgatgat gcccattcag 13860 acaccttcgg atctcgcgta tgtcatctac acctcgggat ccacagggtt gcccaagggg 13920 gtgatgatcg atcatcgggg tgccgtcaac accatcctgg acatcaacga gcgcttcgaa 13980 atagggcccg gagacagggt gctggcgctc tcctcgctga gcttcgatct ctcggtctat 14040 gatgtgttcg ggatcctggc ggcgggcggt acgatcgtgg tgccggacgc gtccaagctg 14100 cgcgatccgg cgcattgggc agagttgatc gaacgagaga aggtgacggt gtggaactcg 14160 gtgccggcgc tgatgcggat gctcgtcgag cattttgagg gtcgccccga ttcgctcgct 14220 aggtctctgc ggctttcgct gctgagcggc gactggatcc cggtgggcct gcctggcgag 14280 ctccaggcca tcaggcccgg cgtgtcggtg atcagcctgg gcggggccac cgaagcgtcg 14340 atctggtcca tcgggtaccc cgtgaggaac gtcgacctat cgtgggcgag catcccctac 14400 ggccgtccgc tgcgcaacca gacgttccac gtgctcgatg aggcgctcga accgcgcccg 14460 gtctgggttc cggggcaact ctacattggc ggggtcgggc tggcactggg ctactggcgc 14520 gatgaagaga agacgcgcaa gagcttcctc gtgcaccccg agaccgggga gcgcctctac 14580 aagaccggcg atctgggccg ctacctgccc gatggaaaca tcgagttcat ggggcgtgag 14640 gacaaccaaa tcaagcttcg cggataccgc gttgagctcg gggaaatcga ggaaacgctc 14700 aagtcgcatc cgaacgtacg cgacgcggtg attgtgcccg tcgggaacga cgcggcgaac 14760 aagctccttc tagcctatgt ggtcccggag ggcacacgga gacgcgctgc cgagcaggac 14820 gcgagcctca agaccgagcg gatcgacgcg agagcacacg ccgccgaagc ggacggcttg 14880 agcgacggcg agagggtgca gttcaagctc gctcgacacg gactccggag ggacctggac 14940 ggaaagcccg tcgtcgatct gaccgggcag gatccgcggg aggcggggct ggacgtctac 15000 gcgcgtcgcc gtagcgtccg aacgttcctt gaggccccga ttccgtttgt tgagtttggt 15060 cgattcctga gctgcttgag cagcgtggag cccgacggcg cgacccttcc caaattccgt 15120 tatccatcgg cgggcagcac gtacccggtg caaacctacg cgtatgtcaa atccggccgc 15180 atcgagggcg tggacgaggg cttctattat taccacccgt tcgagcaccg tttgctgaag 15240 ctctccgatc acgggatcga gcgcggagcg cacgttcggc aaaacttcga cgtgttcgat 15300 gaagcggcgt tcaacctcct gttcgtgggc aggatcgacg ccatcgagtc gctgtatgga 15360 tcgtcgtcgc gagaattttg cctgctggag gccggatata tggcgcagct cctgatggag 15420 caggcgcctt cctgcaacat cggcgtctgt ccggtggggc aattcaattt tgaacaggtt 15480 cggccggttc tcgacctgcg acattcggac gtttacgtgc acggcatgct gggcgggcgg 15540 gtagacccgc ggcagttcca ggtctgtacg ctcggtcagg attcctcacc gaggcgcgcc 15600 acgacgcgcg gcgcccctcc cggccgcgag cagcacttcg ccgatatgct tcgcgacttc 15660 ttgaggacca aactacccga gtacatggtg cctacagtct tcgtggagct cgatgcgttg 15720 ccgctgacgt ccaacggcaa ggtcgatcgt aaggccctgc gcgagcggaa ggatacctcg 15780 tcgccgcggc attcggggca cacggcgcca cgggacgcct tggaggagat cctcgtcgcg 15840 gtcgtacggg aggtgctcgg gctggaggtg gtcgggctcc agcagagctt cgtcgatctt 15900 ggtgcgacat cgattcacat cgttcgcatg aggagcctgt tgcagaagag gctggatagg 15960 gagatcgcca tcaccgagtt gttccagtac ccgaacctcg gctcgctggc gtccggtttg 16020 cgccgagact cgagagatct agatcagcgg ccgaacatgc aggaccgagt ggaggttcgg 16080 cgcaagggca ggagacgtag ctaagagcgc cgaacaaaac caggccgagc gggccgatga 16140 gccgcaagcc cgcctgcgtc accctgggac tcatctgatc tgatcgcggg tacgcgtcgc 16200 gggtgtgcgc gttgagccgt gttgttcgaa cgctgaggaa cggtgagctc atggaagaac 16260 aagagtcctc cgctatcgca gtcatcggca tgtcgggccg ttttccgggg gcgcgggatc 16320 tggacgaatt ctggaggaac cttcgagacg gcacggaggc cgtgcagcgc ttctccgagc 16380 aggagctcgc ggcgtccgga gtcgaccccg cgctggtgct ggacccgagc tacgtccggg 16440 cgggcagcgt gctggaagac gtcgaccggt tcgacgctgc tttcttcggc atcagcccgc 16500 gcgaggcaga gctcatggat ccgcagcacc ggatcttcat ggaatgcgcc tgggaggcgc 16560 tggagaacgc cggatacgac ccgacggctt acgagggctc tatcggcgtg tacgccggcg 16620 ccaacatgag ctcgtacttg acgtcgaacc tccacgagca cccagcgatg atgcggtggc 16680 ccggctggtt tcagacgttg atcggcaacg acaaggatta cctcgcgacc cacgtctcct 16740 acaggctgaa tctgagaggg ccgagcatct ccgttcaaac tgcctgctcc acctcgctcg 16800 tggcggttca cttggcgtgc atgagcctcc tggaccgcga gtgcgacatg gcgctggccg 16860 gcgggattac cgtccggatc ccccatcgag ccggctatgt atatgctgag gggggcatct 16920 tctctcccga cggccattgc cgggccttcg acgccaaggc gaacggcacg atcatgggca 16980 acggctgcgg cgttgtcctc ctgaagccgc tggaccgggc gctctccgat ggtgatcccg 17040 tccgcgcggt tatccttggg tctgccacaa acaacgacgg agcgaggaag atcgggttca 17100 ctgcgcccag tgaggtgggc caggcgcaag cgatcatgga ggcgctggcg ctggcagggg 17160 tcgaggcccg gtccatccaa tacatcgaga cccacgggac cggcacgctg ctcggagacg 17220 ccatcgagac ggcggcgctg cggcgggtgt tcggtcgcga cgcttcggcc cggaggtctt 17280 gcgcgatcgg ctccgtgaag accggcatcg gacacctcga atcggcggct ggcatcgccg 17340 gtttgatcaa gacggtcttg gcgctggagc accggcagct gccgcccagc ctgaacttcg 17400 agtctcctaa cccatcgatc gatttcgcga gcagcccgtt ctacgtcaat acctctctta 17460 aggattggaa taccggctcg actccgcggc gggccggcgt cagctcgttc gggatcggcg 17520 gcaccaacgc ccatgtcgtg ctggaggaag cgcccgcggc gaagcttcca gccgcggcgc 17580 cggcgcgctc tgccgagctc ttcgtcgtct cggccaagag cgcagcggcg ctggatgccg 17640 cggcggcacg gctacgagat catctgcagg cgcaccaggg gatttcgttg ggcgacgtcg 17700 ccttcagcct ggcgacgacg cgcagcccca tggagcaccg gctcgcgatg gcggcgccgt 17760 cgcgcgaggc gttgcgagag gggctcgacg cagcggcgcg aggccagacc ccgccgggcg 17820 ccgtgcgtgg ccgctgctcc ccaggcaacg tgccgaaggt ggtcttcgtc tttcccggcc 17880 agggctctca gtgggtcggc atgggccggc agctcctggc tgaggaaccc gtcttccacg 17940 cggcgctttc ggcgtgcgac cgggccatcc aggccgaagc tggttggtcg ctgctcgcgg 18000 agctcgccgc cgacgaaggg tcctcccagc tcgagcgcat cgacgtggtg cagccggtgc 18060 tgttcgccct cgcggtggca tttgcggcgc tgtggcggtc gtggggtgtc gcgcccgacg 18120 tcgtgatcgg ccacagcatg ggcgaggtag ccgccgcgca tgtggccggg gcgctgtcgc 18180 tcgaggatgc ggtggcgatc atctgccggc gcagccggct gctccggcgc atcagcggtc 18240 agggcgagat ggcggtgacc gagctgtcgc tggccgaggc cgaggcggcg ctccgaggct 18300 acgaggatcg ggtgagcgtg gccgtgagca acagcccgcg ctcgacggtg ctctcgggcg 18360 agccggcagc gatcggcgag gtgctgtcgt ccctgaacgc gaagggggtg ttctgccgtc 18420 gggtgaaggt ggatgtcgcc agccacagcc cgcaggtcga cccgctgcgc gaggacctct 18480 tggcagccct gggcgggctc cggccgggtg cggctgcggt gccgatgcgc tcgacggtga 18540 cgggcgccat ggtagcgggc ccggagctcg gagcgaatta ctggatgaac aacctcaggc 18600 agccagtgcg cttcgccgag gtagtccagg cgcagctcca aggcggccac ggtctgttcg 18660 tggagatgag cccgcatccg atcctaacga cttcggtcga ggagatgcgg cgcgcggccc 18720 agcgggcggg cgcagcggtg ggctcgctgc ggcgggggca ggacgagcgc ccggcgatgc 18780 tggaggcgct gggcacgctg tgggcgcagg gctaccctgt accctggggg cggctgtttc 18840 ccgcgggggg gcggcgggta ccgctgccga cctatccctg gcagcgcgag cggtactgga 18900 tcgaagcgcc ggccaagagc gccgcgggcg atcgccgcgg cgtgcgtgcg ggcggtcacc 18960 cgctcctcgg tgaaatgcag accctgtcaa cccagacgag cacgcggctg tgggagacga 19020 cgctggatct caagcggctg ccgtggctcg gcgaccaccg ggtgcaggga gcggtcgtgt 19080 ttccgggcgc ggcgtacctg gagatggcga tttcgtcggg ggccgaggct ttgggcgatg 19140 gccctttgca gataactgac gtggtgctcg ccgaggcgct ggccttcgcg ggcgacgcgg 19200 cggtgttggt ccaggtggtg acgacggagc agccgtcggg gcggctgcag ttccagatcg 19260 cgagccgggc gccgggcgct ggccacgcgt ccttccgggt ccacgctcgc ggcgcgttgc 19320 tccgagtgga gcgcaccgag gtcccggctg ggcttacgct ttccgctgtg cgcgcgcggc 19380 tccaggccag catacccgcc gcggccacct acgcggagct gaccgagatg gggctgcagt 19440 acggccctgc cttccagggg attgctgagc tatggcgggg tgaaggcgag gcgctgggac 19500 gggtacgcct gcccgacgcg gccggctcgg cagcggagta tcggttgcat cctgcgctgc 19560 tggacgcgtg cttccagatc gtcggcagcc tcttcgcccg cagtggcgag gcgacgccgt 19620 gggtgcccgt ggagttgggc tcgctgcggc tcttgcagcg gccttcgggg gagctgtggt 19680 gccatgcgcg cgtcgtgaac catgggcacc aaacccccga tcggcagggc gccgactttt 19740 gggtggtcga cagctcgggt gcagtggtcg ccgaagtttg cgggctcgtg gcgcagcggc 19800 ttccgggagg ggtgcgccgg cgcgaagaag acgattggtt cctggagctc gagtgggaac 19860 ccgcagcggt cggcacagcc aaggtcaacg cgggccggtg gctgctcctc ggcggcggcg 19920 gtgggctcgg cgccgcgttg cgcgcgatgc tggaggccgg cggccatgcc gtcgtgcatg 19980 cggcagagaa caacacgagc gctgccggcg tacgcgcgct cctggcaaag gcctttgacg 20040 gccaggctcc gacggcggtg gtgcacctcg gcagcctcga tgggggtggc gagctcgacc 20100 cagggctcgg ggcgcaaggc gcattggacg cgccccggag cgccgacgtc agtcccgatg 20160 ccctcgatcc ggcgctggta cgtggctgcg acagcgtgct ctggaccgtg caggccctgg 20220 ccggcatggg ctttcgagac gccccgcgat tgtggctttt gacccgcggc gcacaggccg 20280 tcggcgccgg cgacgtctcc gtgacacagg caccgctgct ggggctgggc cgcgtcatcg 20340 ccatggagca cgcggatctg cgctgcgctc gggtcgacct cgatccagcc cggcccgagg 20400 gggagctcgc tgccctgctg gccgagctgc tggccgacga cgccgaagcg gaagtcgcgt 20460 tgcgcggtgg cgagcgatgc gtcgctcgga tcgtccgccg gcagcccgag acccggcccc 20520 gggggaggat cgagagctgc gttccgaccg acgtcaccat ccgcgcggac agcacctacc 20580 ttgtgaccgg cggtctgggt gggctcggtc tgagcgtggc cggatggctg gccgagcgcg 20640 gcgctggtca cctggtgctg gtgggccgct ccggcgcggc gagcgtggag caacgggcag 20700 ccgtcgcggc gctcgaggcc cgcggcgcgc gcgtcaccgt ggcgaaggcg gatgtcgccg 20760 atcgggcgca gctcgagcgg atcctccgcg aggttaccac gtcggggatg ccgctgcggg 20820 gcgtcgtcca tgcggccggc atcttggacg acgggctgct gatgcagcag actcccgcgc 20880 ggtttcgtaa ggtgatggcg cccaaggtcc agggggcctt gcacctgcac gcgttgacgc 20940 gcgaagcgcc gctttccttc ttcgtgctgt acgcttcggg agtagggctc ttgggctcgc 21000 cgggccaggg caactacgcc gcggccaaca cgttcctcga cgctctggcg caccaccgga 21060 gggcgcaggg gctgccagcg ttgagcgtcg actggggcct gttcgcggag gtgggcatgg 21120 cggccgcgca ggaagatcgc ggcgcgcggc tggtctcccg cggaatgcgg agcctcaccc 21180 ccgacgaggg gctgtccgct ctggcacggc tgctcgaaag cggccgcgct caggtggggg 21240 tgatgccggt gaacccgcgg ctgtgggtgg agctctaccc cgcggcggcg tcttcgcgaa 21300 tgttgtcgcg cctggtgacg gcgcatcgcg cgagcgccgg cgggccagcc ggggacgggg 21360 acctgctccg ccgcctcgcc gctgccgagc cgagcgcgcg gagcgcgctc ctggagccgc 21420 tcctccgcgc gcagatctcg caggtgctgc gcctccccga gggcaagatc gaggtggacg 21480 ccccgctcac gagcctgggc atgaactcgc tgatggggct cgagctgcgc aaccgcatcg 21540 aggccatgct gggcatcacc gtaccggcaa cgctgttgtg gacctatccc acggtggcgg 21600 cgctgagcgg gcatctggcg cgggaggcat gcgaagccgc tcctgtggag tcaccgcaca 21660 ccaccgccga ctctgccgtc gagatcgagg agatgtcgca ggacgatctg acgcagttga 21720 tcgcagcaaa attcaaggcg cttacatgac tactcgcggt cctacggcac agcagaatcc 21780 gctgaaacaa gcggccatca tcattcagcg gctggaggag cggctcgctg ggctcgcaca 21840 ggcggagctg gaacggaccg agccgatcgc catcgtcggt atcggctgcc gcttccctgg 21900 cggtgcggac gctccggaag cgttttggga gctgctcgac gcggagcgcg acgcggtcca 21960 gccgctcgac atgcgctggg cgctggtggg tgtcgctccc gtcgaggccg tgccgcactg 22020 ggcggggctg ctcaccgagc cgatagattg cttcgatgct gcgttcttcg gcatctcgcc 22080 tcgggaggcg cgatcgctcg acccgcagca tcgtctgttg ctggaggtcg cttgggaggg 22140 gctcgaggac gccggtatcc cgccccggtc catcgacggg agccgcaccg gtgtgttcgt 22200 cggcgctttc acggcggact acgcgcgcac ggtcgctcgg ctgccgcgcg aggagcgaga 22260 cgcgtacagc gccaccggca acatgctcag catcgccgcc ggacggctgt cgtacacgct 22320 ggggttgcag ggaccttgcc tgaccgtcga cacggcgtgc tcgtcatcgc tggtggcgat 22380 tcacctcgcc tgccgcagcc tgcgcgcagg agagagcgat ctcgcgttgg cgggaggggt 22440 cagcgcgctc ctctcccccg acatgatgga agccgcggcg cgcacgcaag cgctgtcgcc 22500 cgatggtcgt tgccggacct tcgatgcttc ggccaacggg ttcgtccgtg gcgagggctg 22560 tggcctggtc gtcctcaaac ggctctccga cgcgcaacgg gatggcgacc gcatctgggc 22620 gctgatccgg ggctcggcca tcaaccatga tggccggtcg accgggttga ccgcgcccaa 22680 cgtgctggct caggagacgg tcttgcgcga ggcgctgcgg agcgcccacg tcgaagctgg 22740 ggccgtcgat tacgtcgaga cccacggaac agggacctcg ctgggcgatc ccatcgaggt 22800 cgaggcgctg cgggcgacgg tggggccggc gcgctccgac ggcacacgct gcgtgctggg 22860 cgcggtgaag accaacatcg gccatctcga ggccgcggca ggcgtagcgg gcctgatcaa 22920 ggcagcgctt tcgctgacgc acgagcgcat cccgagaaac ctcaacttcc gcacgctcaa 22980 tccgcggatc cggctcgagg gcagcgcgct cgcgttggcg accgagccgg tgccgtggcc 23040 gcgcacggac cgcccgcgct tcgcgggggt gagctcgttc gggatgagcg gaacgaacgc 23100 gcatgtggtg ctggaagagg cgccggcggt ggagctgtgg cctgccgcgc cggagcgctc 23160 ggcggagctt ttggtgctgt cgggcaagag cgagggggcg ctcgatgcgc aggcggcgcg 23220 gctgcgcgag cacctggaca tgcacccgga gctcgggctc ggggacgtgg cgttcagcct 23280 ggcgacgacg cgcagcgcga tgagccaccg gctcgcggtg gcggtgacgt cgcgcgaggg 23340 gctgctggcg gcgctctcgg ccgtggcgca ggggcagacg ccggcggggg cggcgcgctg 23400 catcgcgagc tcctcgcgcg gcaagctggc gttcctgttc accggacagg gcgcgcagac 23460 gccgggcatg ggccgggggc tttgcgcggc gtggccagcg ttccgggagg cgttcgaccg 23520 gtgcgtggcg ctgttcgacc gggagctgga ccgcccgctg cgcgaggtga tgtgggcgga 23580 ggcggggagc gccgagtcgt tgttgctcga ccagacggcg ttcacccagc ccgcgctctt 23640 cgcggtggag tacgcgctga cggcgctgtg gcggtcgtgg ggcgtagagc cggagctcct 23700 ggttgggcat agcatcgggg agctggtggc ggcgtgcgtg gcgggggtgt tctcgctgga 23760 agatggggtg aggctcgtgg cggcgcgcgg gcggctgatg caggggctct cggcgggcgg 23820 cgcgatggtg tcgctcggag cgccggaggc ggaggtggcg gcggcggtgg cgccgcacgc 23880 ggcgtcggtg tcgatcgcgg cggtcaatgg gccggagcag gtggtgatcg cgggcgtgga 23940 gcaagcggtg caggcgatcg cggcggggtt cgcggcgcgc ggcgcgcgca ccaagcggct 24000 gcatgtctcg cacgcgttcc actcgccgct gatggaaccg atgctggagg agttcgggcg 24060 ggtggcggcg tcggtgacgt accggcggcc aagcgtttcg ctggtgagca acctgagcgg 24120 gaaggtggtc acggacgagc tgagcgcgcc ggggtactgg gtgcggcacg tgcgggaggc 24180 ggtgcgcttc gcggacgggg tgaaggcgct gcacgaagcc ggcgcgggga cgttcgtcga 24240 agtgggcccg aagccgacgc tgctcgggct gttgccagcc tgcctgccgg aggcggagcc 24300 gacgctgctg gcgtcgttgc gcgccgggcg cgaggaggct gcgggggtgc tcgaggcgct 24360 gggcaggctg tgggccgccg gcggctcggt cagctggccg ggcgtcttcc ccacggctgg 24420 gcggcgggtg ccgctgccga cctatccgtg gcagcggcag cggtactgga tcgaggcgcc 24480 ggccgaaggg ctcggagcca cggccgccga tgcgctggcg cagtggttct accgggtgga 24540 ctggcccgag atgcctcgct catccgtgga ttcgcggcga gcccggtccg gcgggtggct 24600 ggtgctggcc gaccggggtg gagtcgggga ggcggccgcg gcggcgcttt cgtcgcaggg 24660 atgttcgtgc gccgtgctcc atgcgcccgc cgaggcctcc gcggttgccg agcaggtgac 24720 ccaggccctc ggtggccgca acgactggca gggggtgctg tacctgtggg gtctggacgc 24780 cgtcgtggag gcgggggcat cggccgaaga ggtcgccaaa gtcacccatc ttgccgcggc 24840 gccggtgctc gcgctgattc aggcgctcgg cacggggccg cgctcacccc ggctctggat 24900 cgtgacccga ggggcctgca cggtgggcgg cgagcctgac gctgccccct gtcaggcggc 24960 gctgtggggt atgggccggg tcgcggcgct agagcatccc ggctcctggg gcgggctcgt 25020 ggacctggat ccggaggaga gcccgacgga ggtcgaggcc ctggtggccg agctgctttc 25080 gccggacgcc gaggatcagc tggcattccg ccaggggcgc cggcgcgcag cgcggcttgt 25140 ggccgcccca ccggagggaa acgcagcgcc ggtgtcgctg tctgcggagg ggagttactt 25200 ggtgacgggt gggctgggcg cccttggcct cctcgttgcg cggtggttgg tggagcgcgg 25260 ggcggggcac cttgtgctga tcagccggca cggattgccc gaccgcgagg aatggggccg 25320 agatcagccg ccagaggtgc gcgcgcgcat tgcggcgatc gaggcgctgg aggcgcaggg 25380 cgcgcgggtc accgtggcgg cggtcgacgt ggccgatgcc gaaggcatgg cggcgctctt 25440 ggcggccgtc gagccgccgc tgcggggggt agtgcacgcc gcgggtctgc tcgacgacgg 25500 gctgctggcc caccaggacg ctggtcggct cgcccgggtg ttgcgcccca aggtggaggg 25560 ggcatgggtg ctgcacaccc ttacccgcga gcagccgctg gacctcttcg tactgttttc 25620 ctcggcgtcg ggcgtcttcg gctcgatcgg ccagggcagc tacgcggcag gcaatgcctt 25680 tttggacgcg ctggcggacc tccgccgaac gcaggggctc gccgccctga gcatcgcctg 25740 gggcctgtgg gcggaggggg ggatgggctc gcaggcgcag cgccgggaac acgaggcatc 25800 gggaatctgg gcgatgccga cgagtcgggc cctggcggcg atggaatggc tgctcggtac 25860 gcgcgcgacg cagcgcgtgg tcatccagat ggattgggcc catgcgggag cggcgccgcg 25920 cgacgcgagc cgaggccgct tctgggatcg gctggtaact gccacgaaag aggcctcctc 25980 ctcggccgtg ccagctgtgg agcgctggcg caacgcgtct gttgtggaga cccgctcggc 26040 gctctacgag cttgtgcgcg gcgtggtcgc cggggtgatg ggctttaccg accagggcac 26100 gctcgacgtg cgacgaggct tcgccgagca gggcctcgac tccctgatgg ccgtggagat 26160 ccgcaaacgg cttcagggtg agctgggtat gccgctgtcg gcgacgctag cgttcgacca 26220 tccgaccgtg gagcggctgg tggaatactt gctgagccag gcgctggagc tgcaggaccg 26280 caccgacgtg cggagcgttc ggttgccggc gacagaggac ccgatcgcca tcgtgggtgc 26340 cgcctgccgc ttcccgggcg gggtcgagga cctggagtcc tactggcagc tgttgaccga 26400 gggcgtggtg gtcagcaccg aggtgccggc cgaccggtgg aatggggcag acgggcgcgt 26460 ccccggctcg ggagaggcac agagacagac ctacgtgccc aggggtggct ttctgcgcga 26520 ggtggagacg ttcgatgcgg cgttcttcca catctcgcct cgggaggcga tgagcctgga 26580 cccgcaacag cggctgctgc tggaagtgag ctgggaggcg atcgagcgcg cgggccagga 26640 cccgtcggcg ctgcgcgaga gccccacggg cgtgttcgtg ggcgcgggcc ccaacgaata 26700 tgccgagcgg gtgcaggaac tcgccgatga ggcggcgggg ctctacagcg gcaccggcaa 26760 catgctcagc gttgcggcgg gacggctatc atttttcctg ggcctgcacg ggccgaccct 26820 ggctgtggat acggcgtgct cctcgtcgct ggtggcgctg cacctcggct gccagagctt 26880 gcgacggggc gagtgcgacc aagccctggt tggcggggtc aacatgctgc tctcgccgaa 26940 gaccttcgcg ctgctctcac ggatgcacgc actttcgccc ggcgggcggt gcaagacgtt 27000 ctcggccgac gcggacggct acgcgcgggc cgagggctgc gccgtggtgg tgctcaagcg 27060 gctctccgac gcgcagcgcg accgcgaccc catcctggcg gtgatccggg gtacggcgat 27120 caatcatgat ggcccgagca gcgggctgac agtgcccagc ggccctgccc aggaggcgct 27180 gttacgccag gcgctggcgc acgcaggggt ggttccggcc gacgtcgatt tcgtggaatg 27240 ccacgggacc gggacggcgc tgggcgaccc gatcgaggtg cgtgcgctga gcgacgtgta 27300 cgggcaagcc cgccctgcgg accgaccgct gatcctggga gccgccaagg ccaaccttgg 27360 gcacatggag cccgcggcgg gcctggccgg cttgctcaag gcggtgctcg cgctggggca 27420 agagcaaata ccagcccagc cggagctggg cgagctcaac ccgctcttgc cgtgggaggc 27480 gctgccggtg gcggtggccc gcgcagcggt gccgtggccg cgcacggacc gcccgcgctt 27540 cgcgggggtg agctcgttcg ggatgagcgg aacgaacgcg catgtggtgc tggaagaggc 27600 gccggcggtg gagctgtggc ctgccgcgcc ggagcgctcg gcggagcttt tggtgctgtc 27660 gggcaagagc gagggggcgc tcgatgcgca ggcggcgcgg ctgcgcgagc acctggacat 27720 gcacccggag ctcgggctcg gggacgtggc gttcagcctg gcgacgacgc gcagcgcgat 27780 gaaccaccgg ctcgcggtgg cggtgacgtc gcgcgagggg ctgctggcgg cgctttcggc 27840 cgtggcgcag gggcagacgc cgccgggggc ggcgcgctgc atcgcgagct cgtcgcgcgg 27900 caagctggcg ttcctgttca ccggacaggg cgcgcagacg ccgggcatgg gccgggggct 27960 ttgcgcggcg tggccagcgt tccgggaggc gttcgaccgg tgcgtggcgc tgttcgaccg 28020 ggagctggac cgcccgctgc gcgaggtgat gtgggcggag ccggggagcg ccgagtcgtt 28080 gttgctcgac cagacggcgt tcacccagcc cgcgctcttc acggtggagt acgcgctgac 28140 ggcgctgtgg cggtcgtggg gcgtagagcc ggagctggtg gctgggcata gcgccgggga 28200 gctggtggcg gcgtgcgtgg cgggggtgtt ctcgctggaa gatggggtga ggctcgtggc 28260 ggcgcgcggg cggctgatgc aggggctctc ggcgggcggc gcgatggtgt cgctcggagc 28320 gccggaggcg gaggtggcgg cggcggtggc gccgcacgcg gcgtcggtgt cgatcgcggc 28380 ggtcaatggg ccggagcagg tggtgatcgc gggcgtggag caagcggtgc aggcgatcgc 28440 ggcggggttc gcggcgcgcg gcgcgcgcac caagcggctg catgtctcgc acgcgtccca 28500 ctcgccgctg atggaaccga tgctggagga gttcgggcgg gtggcggcgt cggtgacgta 28560 ccggcggcca agcgtttcgc tggtgagcaa cctgagcggg aaggtggtcg cggacgagct 28620 gagcgcgccg gggtactggg tgcggcacgt gcgggaggcg gtgcgcttcg cggacggggt 28680 gaaggcgctg cacgaagccg gtgcgggcac gttcgtcgaa gtgggcccga agccgacgct 28740 gctcgggctg ttgccagcct gcctgccgga ggcggagccg acgctgctgg cgtcgttgcg 28800 cgccgggcgc gaggaggctg cgggggtgct cgaggcgctg ggcaggctgt gggccgccgg 28860 cggctcggtc agctggccgg gcgtcttccc cacggctggg cggcgggtgc cgctgccgac 28920 ctatccgtgg cagcggcagc ggtactggcc cgacatcgag cctgacagcc gtcgccacgc 28980 agccgcggat ccgacccaag gctggttcta tcgcgtggac tggccggaga tacctcgcag 29040 cctccagaaa tcagaggagg cgagccgcgg gagctggctg gtattggcgg ataagggtgg 29100 agtcggcgag gcggtcgctg cagcgctgtc gacacgtgga cttccatgcg tcgtgctcca 29160 tgcgccggca gagacatccg cgaccgccga gctggtgacc gaggctgccg gcggtcgaag 29220 cgattggcag gtagtgctct acctgtgggg tctggacgcc gtcgtcggtg cggaggcgtc 29280 gatcgatgag atcggcgacg cgacccgtcg tgctaccgcg ccggtgctcg gcttggctcg 29340 gtttctgagc accgtgtctt gttcgccccg actctgggtc gtgacccggg gggcatgcat 29400 cgttggcgac gagcctgcga tcgccccttg tcaggcggcg ttatggggca tgggccgggt 29460 ggcggcgctc gagcatcccg gggcctgggg cgggctcgtg gacctggatc cccgagcgag 29520 cccgccccaa gccagcccga tcgacggcga gatgctcgtc accgagctat tgtcgcagga 29580 gaccgaggat cagctcgcct tccgccatgg gcgccggcac gcggcacggc tggtggccgc 29640 cccgccacag gggcaagcgg caccggtgtc gctgtctgcg gaggcgagct acctggtgac 29700 gggaggcctc ggtgggctgg gcctgatcgt ggcccagtgg ctggtggagc tgggagcgcg 29760 gcacttggtg ctgaccagcc ggcgcgggtt gcccgaccgg caggcgtggt gcgagcagca 29820 gccgcctgag atccgcgcgc ggatcgcagc ggtcgaggcg ctggaggcgc ggggtgcacg 29880 ggtgaccgtg gcagcggtgg acgtggccga cgtcgaaccg atgacagcgc tggtttcgtc 29940 ggtcgagccc ccgctgcgag gggtggtgca cgccgctggc gtcagcgtca tgcgtccact 30000 ggcggagacg gacgagaccc tgctcgagtc ggtgctccgt cccaaggtgg ccgggagctg 30060 gctgctgcac cggctgctgc acggccggcc tctcgacctg ttcgtgctgt tctcgtcggg 30120 cgcagcggtg tggggtagcc atagccaggg tgcgtacgcg gcggccaacg ctttcctcga 30180 cgggctcgcg catcttcggc gttcgcaatc gctgcctgcg ttgagcgtcg cgtggggtct 30240 gtgggccgag ggaggcatgg cggacgcgga ggctcatgca cgtctgagcg acatcggggt 30300 tctgcccatg tcgacgtcgg cagcgttgtc ggcgctccag cgcctggtgg agaccggcgc 30360 ggctcagcgc acggtgaccc ggatggactg ggcgcgcttc gcgccggtgt acaccgctcg 30420 agggcgtcgc aacctgcttt cggcgctggt cgcagggcgc gacatcatcg cgccttcccc 30480 tccggcggca gcaacccgga actggcgtgg cctgtccgtt gcggaagccc gcgtggctct 30540 gcacgagatc gtccatgggg ccgtcgctcg ggtgctgggc ttcctcgacc cgagcgcgct 30600 cgatcctggg atggggttca atgagcaggg cctcgactcg ttgatggcgg tggagatccg 30660 caacctcctt caggctgagc tggacgtgcg gctttcgacg acgctggcct ttgatcatcc 30720 gacggtacag cggctggtgg agcatctgct cgtcgatgta ctgaagctgg aggatcgcag 30780 cgacacccag catgttcggt cgttggcgtc agacgagccc atcgccatcg tgggagccgc 30840 ctgccgcttc ccgggcgggg tggaggacct ggagtcctac tggcagctat tggccgaggg 30900 cgtggtggtc agcgccgagg tgccggccga ccggtgggat gcggcggact ggtacgaccc 30960 tgatccggag atcccaggcc ggacttacgt gaccaaaggc gccttcctgc gcgatttgca 31020 gagattggat gcgaccttct tccgcatctc gcctcgcgag gcgatgagcc tcgacccgca 31080 gcagcggttg ctcctggagg taagctggga agcgctcgag agcgcgggta tcgctccgga 31140 tacgctgcga gatagcccca ccggggtgtt cgtgggtgcg gggcccaatg agtactacac 31200 gcagcggctg cgaggcttca ccgacggagc ggcagggttg tacggcggca ccgggaacat 31260 gctcagcgtt acggctggac ggctgtcgtt tttcctgggt ctgcacggcc cgacgctggc 31320 catggatacg gcgtgctcgt catccctggt cgcgctgcac ctcgcctgcc agagcctgcg 31380 actgggcgag tgcgatcaag cgctggttgg cggggtcaac gtgctgctcg cgccggagac 31440 cttcgtgctg ctctcacgga tgcgcgcgct ttcgcccgac gggcggtgca agacgttctc 31500 ggccgacgcg gacggctacg cgcggggcga ggggtgcgcc gtggtggtgc tcaagcggct 31560 gcgcgatgcg cagcgcgccg gcgactccat cctggcgctg atccggggaa gcgcggtgaa 31620 ccacgacggc ccgagcagcg ggctgaccgt acccaacgga cccgcccagc aagcattgct 31680 gcgccaggcg ctttcgcaag caggcgtgtc tccggtcgac gttgattttg tggagtgtca 31740 cgggacaggg acggcgctgg gcgacccgat cgaggtgcag gcgctgagcg aggtgtatgg 31800 tccagggcgc tccggggacc gaccgctggt gctgggggcc gccaaggcca acgtcgcgca 31860 tctggaggcg gcatctggct tggccagcct gctcaaggcc gtgcttgcgc tgcggcacga 31920 gcagatcccg gcccagccgg agctggggga gctcaacccg cacttgccgt ggaacacgct 31980 gccggtggcg gtgccacgta aggcggtgcc gtgggggcgc ggcgcacgcc cgcgtcgggc 32040 cggcgtgagc gcgttcgggt tgagcggaac caacgtgcat gtcgtgctgg aggaggcacc 32100 ggaggtggag ccggcgcccg cggcgccggc gcgaccggtg gagctggtcg tgctatcggc 32160 caagagcgcg gcggcgctgg acgccgcggc ggcacggctc tcggcgcacc tgtccgcgca 32220 cccggagctg agcctcggcg acgtggcgtt cagcctggcg acgacgcgca gcccgatgga 32280 gcaccggctc gccatcgcga cgacctcgcg cgaggccctg cgaggcgcgc tggacgccgc 32340 ggcgcagcaa aagacgccgc agggcgcggt gcgcggcaag gccgtgtcct cacgcggtaa 32400 gctggctttc ctgttcaccg gacagggcgc gcaaatgccg ggcatgggcc gtgggctgta 32460 cgaaacgtgg cctgcgttcc gggaggcgtt cgaccggtgc gtggcgctct tcgatcggga 32520 gatcgaccag cctctgcgcg aggtgatgtg ggctgcgccg ggcctcgctc aggcggcgcg 32580 gctcgatcag accgcgtacg cgcagccggc tctctttgcg ctggagtacg cgctggctgc 32640 cctgtggcgt tcgtggggcg tggagccgca cgtactgctc ggtcatagca tcggcgagct 32700 ggtcgccgcc tgcgtggcgg gcgtgttctc gctcgaagat gcggtgaggt tggtggccgc 32760 gcgcgggcgg ctgatgcagg cgctacccgc cggcggtgcc atggtagcca tcgcagcgtc 32820 cgaggccgag gtggccgcct ccgtggcgcc ccacgccgcc acggtgtcga tcgccgcggt 32880 caacggtcct gacgccgtcg tgatcgccgg cgccgaggta caggtgctcg ccctcggcgc 32940 gacgttcgcg gcgcgtggga tacgcacgaa gaggctcgcc gtctcccatg cgttccactc 33000 gccgctcatg gatccgatgc tggaagactt ccagcgggtc gctgcgacga tcgcgtaccg 33060 cgcgccagac cgcccggtgg tgtcgaatgt caccggccac gtcgcaggcc ccgagatcgc 33120 cacgcccgag tattgggtcc ggcatgtgcg aagcgccgtg cgcttcggcg acggggcaaa 33180 ggcgttgcat gccgcgggtg ccgccacgtt cgtcgaggtt ggcccgaagc cggtcctgct 33240 cgggctgttg ccagcgtgcc tcggggaagc ggacgcggtc ctcgtgccgt cgctacgcgc 33300 ggaccgctcg gaatgcgagg tggtcctcgc ggcgctcggg gcttggtatg cctggggggg 33360 tgcgctcgac tggaagggcg tgttccccga tggcgcgcgc cgcgtggctc tgcccatgta 33420 tccatggcag cgtgagcgcc attggatgga cctcaccccg cgaagcgccg cgcctgcagg 33480 gatcgcaggt cgctggccgc tggctggtgt cgggctctgc atgcccggcg ctgtgttgca 33540 ccacgtgctc tcgatcggac cacgccatca gcccttcctc ggtgatcacc tcgtgtttgg 33600 caaggtggtg gtgcccggcg cctttcatgt cgcggtgatc ctcagcatcg ccgccgagcg 33660 ctggcccgag cgggcgatcg agctgacagg cgtggagttc ctgaaggcca tcgcgatgga 33720 gcccgaccag gaggtcgagc tccacgccgt gctcaccccc gaagccgccg gggatggcta 33780 cctgttcgag ctggcgaccc tggcggcgcc ggagaccgaa cgccgatgga cgacccacgc 33840 ccgcggtcgg gtgcagccga cagacggcgc gcccggcgcg ttgccgcgcc tcgaggtgct 33900 ggaggaccgc gcgatccagc ccctcgactt cgccggattc ctcgacaggt tatcggcggt 33960 gcggatcggc tggggtccgc tttggcgatg gctgcaggac gggcgcgtcg gcgacgaggc 34020 ctcgcttgcc accctcgtgc cgacctatcc gaacgcccac gacgtggcgc ccttgcaccc 34080 gatcctgctg gacaacggct ttgcggtgag cctgctgtca acccggagcg agccggagga 34140 cgacgggacg cccccgctgc cgttcgccgt ggaacgggtg cggtggtggc gggcgccggt 34200 tggaagggtg cggtgtggcg gcgtgccgcg gtcgcaggca ttcggtgtct cgagcttcgt 34260 gctggtcgac gaaactggcg aggtggtcgc cgaggtggag ggatttgttt gccgccgggc 34320 gccgcgagag gtgttcctgc ggcaggagtc gggcgcgtcg actgcagcct tgtaccgcct 34380 cgactggccc gaagcgccct tgcccgatgc gcctgcggaa cggatcgagg agagctgggt 34440 cgtggtggca gcacctggct cggagatggc cgcggcgctc gcaacacggc tcaaccgctg 34500 cgtcctcgcc gaacccaaag gcctcgaggc ggccctcgcg ggggtgtctc ccgcaggtgt 34560 gatctgcctc tgggaggctg gagcccacga ggaagctccg gcggcggcgc agcgtgtggc 34620 gaccgagggc ctctcggtgg tgcaggcgct cagggaccgc gcggtgcgcc tgtggtgggt 34680 gaccatgggc gcagtggccg tcgaggccgg tgagcgggtg caggtcgcca cagcgccggt 34740 atggggcctc ggccggacag tgatgcagga gcgcccggag ctcagctgca ctctggtgga 34800 tttggagccg gaggccgatg cagcgcgctc agctgacgtt ctgttgcggg agctcggtcg 34860 cgctgacgac gagacacagg tggctttccg ttccggaaag cgccgcgtag cgcggctggt 34920 caaagcgacg acccccgaag ggctcctggt ccctgacgca gagtcctatc gactggaggc 34980 tgggcagaag ggcacattgg accagctccg cctcgcgccg gcacagcgcc gggcacctgg 35040 cccgggcgag gtcgagatca aggtaaccgc ctcggggctc aacttccgga ccgtcctcgc 35100 tgtgctggga atgtatccgg gcgacgccgg gccgatgggc ggagattgtg ccggtgtcgc 35160 cacggcggtg ggccaggggg tgcgccacgt cgcggtcggc gatgctgtca tgacgctggg 35220 gacgttgcat cgattcgtca cggtcgacgc gcggctggtg gtccggcagc ctgcagggct 35280 gactcccgcg caggcagcta cggtgccggt cgcgttcctg acggcctggc tcgctctgca 35340 cgacctgggg aatctgcggc gcggcgagcg ggtgctgatc catgctgcgg ccggcggtgt 35400 gggcatggcc gcggtgcaaa tcgcccgatg gataggggcc gaggtgttcg ccacggcgag 35460 cccgtccaag tgggcagcgg ttcaggccat gggcgtgccg cgcacgcaca tcgccagctc 35520 gcggacgctg gagtttgctg agacgttccg gcaggtcacc ggcggccggg gcgtggacgt 35580 ggtgctcaac gcgctggccg gcgagttcgt ggacgcgagc ctgtccctgc tgtcgacggg 35640 cgggcggttc ctcgagatgg gcaagaccga catacgggat cgagccgcgg tcgcggcggc 35700 gcatcccggt gttcgctatc gggtattcga catcctggag ctcgctccgg atcgaactcg 35760 agagatcctc gagcgcgtgg tcgagggctt tgctgcggga catctgcgcg cattgccggt 35820 gcatgcgttc gcgatcacca aggccgaggc agcgtttcgg ttcatggcgc aagcgcggca 35880 tcagggcaag gtcgtgctgc tgccggcgcc ctccgcagcg cccttggcgc cgacgggcac 35940 cgtactgctg accggtgggc tgggagcgtt ggggctccac gtggcccgct ggctcgccca 36000 gcagggcgtg ccgcacatgg tgctcacagg tcggcggggc ctggatacgc cgggcgctgc 36060 caaagccgtc gcggagatcg aagcgctcgg cgctcgggtg acgatcgcgg cgtcggatgt 36120 cgccgatcgg aatgcgctgg aggctgtgct ccaggccatt ccggcggagt ggccgttaca 36180 gggcgtgatc catgcagccg gagcgctcga tgatggtgtg cttgatgagc agaccaccga 36240 ccgcttctcg cgggtgctgg caccgaaggt gactggcgcc tggaatctgc atgagctcac 36300 ggcgggcaac gatctcgctt tcttcgtgct gttctcctcc atgtcggggc tcttgggctc 36360 ggccgggcag tccaactatg cggcggccaa caccttcctc gacgcgctgg ccgcgcatcg 36420 gcgggccgaa ggcctggcgg cgcagagcct cgcgtggggc ccatggtcgg acggaggcat 36480 ggcagcgggg ctcagcgcgg cgctgcaggc gcggctcgct cggcatggga tgggagctct 36540 gtcgccggct cagggcaccg cgctgctcgg gcaggcgctg gctcggccgg aaacgcagct 36600 cggggcgatg tcgctcgacg tgcgtgcggc aagccaagct tcgggagcgg cagtgccgcc 36660 tgtgtggcgc gcgttggtgc gcgcggaggc gcgccatacg gcggctgggg cgcagggggc 36720 attggccgcg cgtcttgggg cgctgcccga ggcgcgtcgc gccgacgagg tgcgcaaggt 36780 cgtgcaggcc gagatcgcgc gcgtgctttc atggagcgcc gcgagcgccg tgcccgtcga 36840 tcggccgctg tcggacttgg gcctcgactc gctcacggcg gtggagctgc gcaacgtgct 36900 cggccagcgg gtgggtgcga cgctgccggc gacgctggca ttcgatcacc cgacggtcga 36960 cgcgctcacg cgctggctgc tcgataaggt cctggccgtg gccgagccga gcgtatcgtc 37020 cgcaaagtcg tcgccgcagg tcgccctcga cgagcccatt gccatcatcg gcatcggctg 37080 ccgtttccca ggcggcgtgg ccgatccgga gtcgttttgg cggctgctcg aagagggcag 37140 cgatgccgtc gtcgaggtgc cgcatgagcg atgggacatc gacgcgttct atgatccgga 37200 tccggatgtg cgcggcaaga tgacgacacg ctttggcggc ttcctgtccg atatcgaccg 37260 gttcgatccg gccttcttcg gcatctcgcc gcgcgaagcg acgaccatgg atccgcagca 37320 gcggctgctc ctggagacga gctgggaggc gttcgagcgc gccgggattt tgcccgagcg 37380 gctgatgggc agcgataccg gcgtgttcgt ggggctcttc taccaggagt acgctgcgct 37440 cgccggcggc atcgaggcgt tcgatggcta tctaggcacc ggcaccacgg ccagcgtcgc 37500 ctcgggcagg atctcttatg tgctcgggct aaaggggccg agcctgacgg tggacaccgc 37560 gtgctcctcg tcgctggtcg cggtgcacct ggcctgccag gcgctgcggc ggggcgagtg 37620 ttcggtggcg ctggccggcg gcgtggcgct gatgctcacg ccggcgacgt tcgtggagtt 37680 cagccggctg cgaggcctgg ctcccgacgg acggtgcaag agcttctcgg ccgcagccga 37740 cggcgtgggg tggagcgaag gctgcgccat gctcctgctc aaaccgcttc gcgatgcgca 37800 gcgcgatggg gatccgatcc tggcggtgat ccgcggcacc gcggtgaacc aggatgggcg 37860 cagcaacggg ctgacggcgc ccaacgggtc gtcgcagcaa gaggtgatcc gtcgggccct 37920 ggagcaggcg gggctggctc cggcggacgt cagctacgtc gagtgccacg gcaccggcac 37980 gacgttgggc gaccccatcg aagtgcaggc cctgggcgcc gtgctggcac aggggcgacc 38040 ctcggaccgg ccgctcgtga tcgggtcggt gaagtccaat atcggacata cgcaggctgc 38100 ggcgggcgtg gccggtgtca tcaaggtggc gctggcgctc gagcgcgggc ttatcccgag 38160 gagcctgcat ttcgacgcgc ccaatccgca cattccgtgg tcggagctcg ccgtgcaggt 38220 ggccgccaaa cccgtcgaat ggacgagaaa cggcgtgccg cgacgagccg gggtgagctc 38280 gtttggcgtc agcgggacca acgcgcacgt ggtgctggag gaggcgccag cggcggcgtt 38340 cgcgcccgcg gcggcgcgtt cagcggagct tttcgtgctg tcggcgaaga gcgccgcggc 38400 gctggacgcg caggcggcgc ggctttcggc gcacgtcgtt gcgcacccgg agctcggcct 38460 cggcgacctg gcgttcagcc tggcgacgac ccgcagcccg atgacgtacc ggctcgcggt 38520 ggcggcgacc tcgcgcgagg cgctgtctgc cgcgctcgac acagcggcgc aggggcaggc 38580 gccgcccgca gcggctcgcg gccacgcttc cacaggcagc gccccaaagg tggttttcgt 38640 ctttcctggc cagggctccc agtggctggg catgggccaa aagctcctct cggaggagcc 38700 cgtcttccgc gacgcgctct cggcgtgtga ccgagcgatt caggccgaag ccggctggtc 38760 gctgctcgcc gagctcgcgg ccgatgagac cacctcgcag ctcggccgca tcgacgtggt 38820 gcagccggcg ctgttcgcga tcgaggtcgc gctgtcggcg ctgtggcggt cgtggggcgt 38880 cgagccggat gcagtggtag gccacagcat gggcgaagtg gcggccgcgc acgtcgccgg 38940 cgccctgtcg ctcgaggatg ctgtagcgat catctgccgg cgcagcctgc tgctgcggcg 39000 gatcagcggc caaggcgaga tggcggtcgt cgagctttcc ctggccgagg ccgaggcagc 39060 gctcctgggc tacgaagacc ggctcagcgt ggcggtgagc aacagcccgc gctcgacggt 39120 gctggcgggc gagccggcag cgctcgcaga ggtgctggcg atccttgcgg caaagggggt 39180 gttctgccgt cgagtcaagg tggacgtcgc cagccacagc ccacagatcg acccgctgcg 39240 cgacgagcta ttggcagcat tgggcgagct cgagccgcga caagcgaccg tgtcgatgcg 39300 ctcgacggtg acgagcacga tcatggcggg cccggagctc gtggcgagct actgggcgga 39360 caacgttcga cagccggtgc gcttcgccga agcggtgcaa tcgttgatgg aagacggtca 39420 tgggctgttc gtggagatga gcccgcatcc gatcctgacg acatcggtcg aggagatccg 39480 acgggcgacg aagcgggagg gagtcgcggt gggctcgttg cggcgtggac aggacgagcg 39540 cctgtccatg ttggaggcgc tgggagcgct ctgggtacac ggccaggcgg tgggctggga 39600 gcggctgttc tccgcgggcg gcgcgggcct ccgtcgcgtg ccgctgccga cctatccctg 39660 gcagcgcgag cggtactggg tcgatgcgcc gaccggcggc gcggcgggcg gcagccgctt 39720 tgctcatgcg ggcagtcacc cgctcctggg tgaaatgcag accctgtcga cccagaggag 39780 cacgcgcgtg tgggagacga cgctggatct caaacggctg ccgtggctcg gcgatcaccg 39840 ggtgcagggg gcggtcgtgt tcccgggcgc ggcgtacctg gagatggcgc tttcgtccgg 39900 ggccgaggcc ttgggtgacg gtccgctcca ggtcagcgat gtggtgctcg ccgaggcgct 39960 ggccttcgcg gatgatacgc cggcggcggt gcaggtcatg gcgaccgagg agcgaccagg 40020 ccgcctgcaa ttccacgttg cgagccgggt gccgggccac ggcggtgctg cctttcgaag 40080 ccatgcccgc ggggtgctgc gccagatcga gcgcgccgag gtcccggcga ggctggatct 40140 ggccgcgctt cgtgcccggc ttcaggccag cgcacccgct gcggctacct atgcggcgct 40200 ggccgagatg gggctcgagt acggcccagc gttccagggg cttgtcgagc tgtggcgggg 40260 ggagggcgag gcgctgggac gtgtgcggct ccccgaggcc gccggctccc cagccgcgtg 40320 ccggctccac cccgcgctct tggatgcgtg cttccacgtg agcagcgcct tcgctgaccg 40380 cggcgaggcg acgccatggg tacccgtgga aatcggctcg ctgcggtggt tccagcggcc 40440 gtcgggggag ctgtggtgtc atgcgcggag tgtgagccac ggaaagccaa cacccgaccg 40500 gcggagtacc gacttctggg tggtcgacag cacgggcgcg atcgtcgccg agatctccgg 40560 gctcgtggcg cagcggctcg cgggaggtgt acgccggcgc gaagaagacg actggttcat 40620 ggagccggct tgggaaccga ccgcggtccc cggatccgag gtcatggcgg gccggtggct 40680 gctcatcggc tcgggcggcg ggctcggcgc tgcgctccac tcggcgctga cggaagctgg 40740 ccattccgtc gtccacgcga cagggcgcgg cacgagcgcc gccgggttgc aggcactctt 40800 gacggcgtcc ttcgacggcc aggccccgac gtcggtggtg cacctcggca gcctcgatga 40860 gcgtggcgtg ctcgacgcgg atgccccctt cgacgccgat gcgcttgagg agtcgctggt 40920 gcgcggctgc gacagcgtgc tctggaccgt gcaggccgtg gccggggcgg gcttccgaga 40980 tcctccgcgg ttgtggctcg tgacacgcgg cgctcaggcc atcggcgccg gcgacgtctc 41040 tgtggcgcaa gcgccgctcc tggggctggg ccgcgttatc gccttggagc acgccgagct 41100 gcgctgcgct cggatcgacc tcgatccagc gcggcgcgac ggagaagtcg atgagctgct 41160 tgccgagctg ttggccgacg acgccgagga ggaagtcgcg tttcgcggcg gtgagcggcg 41220 cgtggcccgg ctcgtccgaa ggctgcccga gaccgactgc cgagagaaaa tcgagcccgc 41280 ggaaggccgg ccgttccggc tggagatcga tgggtccggc gtgctcgacg acctggtgct 41340 ccgagccacg gagcggcgcc ctcctggccc gggcgaggtc gagatcgccg tcgaggcggc 41400 ggggctcaac tttctcgacg tgatgagggc catggggatc taccctgggc ccggggacgg 41460 tccggttgcg ctgggcgccg agtgctccgg ccgaattgtc gcgatgggcg aaggtgtcga 41520 gagccttcgt atcggccagg acgtcgtggc cgtcgcgccc ttcagtttcg gcacccacgt 41580 caccatcgac gcccggatgc tcgcacctcg ccccgcggcg ctgacggccg cgcaggcagc 41640 cgcgctgccc gtcgcattca tgacggcctg gtacggtctc gtccatctgg ggaggctccg 41700 ggccggcgag cgcgtgctca tccactcggc gacggggggc accgggctcg ctgctgtgca 41760 gatcgcccgc cacctcggcg cggagatatt tgcgaccgct ggtacaccgg agaagcgggc 41820 gtggctgcgc gagcagggga tcgcgcacgt gatggactcg cggtcgctgg acttcgccga 41880 gcaagtgctg gccgcgacga agggcgaggg ggtcgacgtc gtgttgaact cgctgtctgg 41940 cgccgcgatc gacgcgagcc tttcgaccct cgtgccggac ggccgcttca tcgagctcgg 42000 caagacggac atctatgcag atcgctcgct ggggctcgct cacttcagga agagcctgtc 42060 ctacagcgcc gtcgatcttg cgggcttggc cgtgcgtcgg cccgagcgcg tcgcagcgct 42120 gctggcggag gtggtggacc tgctcgcacg gggagcgctg cagccgcttc cggtagagat 42180 cttccccctc tcgcgggccg cggacgcgtt ccggaaaatg gcgcaagcgc agcatctcgg 42240 gaagctcgtg ctcgcgctgg aggacccgga cgtgcggatc cgcgttccgg gcgaatccgg 42300 cgtcgccatc cgcgcggacg gcgcctacct cgtgaccggc ggtctggggg ggctcggtct 42360 gagcgtggct ggatggctgg ccgagcaggg ggctgggcat ctggtgctgg tgggccgctc 42420 cggcgcggtg agcgcggagc agcagacggc tgtcgccgcg ctcgaggcgc acggcgcgcg 42480 tgtcacggta gcgagggcag acgtcgccga tcgggcgcag atggagcgga tcctccgcga 42540 ggttaccgcg tcggggatgc cgctccgcgg cgtcgttcat gcggccggaa tcctggacga 42600 cgggctgctg atgcagcaaa cccccgcgcg gttccgcgcg gtcatggcgc ccaaggtccg 42660 aggggccttg cacctgcatg cgttgacacg cgaagcgccg ctctccttct tcgtgctgta 42720 cgcttcggga gcagggctct tgggctcgcc gggccagggc aactacgccg cggccaacac 42780 gttcctcgac gcactggcac accaccggag ggcgcagggg ctgccagcat tgagcatcga 42840 ctggggcctg ttcgcggacg tgggtttggc cgccgggcag caaaatcgcg gcgcacggct 42900 ggtcacccgc gggacgcgga gcctcacccc cgacgaaggg ctgtgggcgc tcgagcgcct 42960 gctcgacggc gatcgcaccc aggccggggt catgccgttc gacgtgcggc agtgggtgga 43020 gttctacccg gcggcggcat cttcgcggag gttgtcgcgg ctcatgacgg cacggcgcgt 43080 ggcttccggt cggctcgccg gggatcggga cctgctcgaa cggctcgcca ccgccgaggc 43140 gggcgcgcgg gcagggatgc tgcaggaggt cgtgcgcgcg caggtctcgc aggtgctgcg 43200 cctctccgaa ggcaagctcg acgtggatgc gccgctcacg agcctgggaa tggactcgct 43260 gatggggcta gagctgcgca accgcatcga ggccgtgctc ggcatcacca tgccggcgac 43320 cctgctgtgg acctacccca cggtggcagc gctgagtgcg catctggctt ctcatgtcgt 43380 ctctacgggg gatggggaat ccgcgcgccc gccggataca gggagcgtgg ctccaacgac 43440 ccacgaagtc gcttcgctcg acgaagacgg gttgttcgcg ttgattgatg agtcactcgc 43500 gcgcgcggga aagaggtgat tgcgtgacag accgagaagg ccagctcctg gagcgcttgc 43560 gtgaggttac tctggccctt cgcaagacgc tgaacgagcg cgataccctg gagctcgaga 43620 agaccgagcc gatcgccatc gtggggatcg gctgccgctt ccccggcgga gcgggcactc 43680 cggaggcgtt ctgggagctg ctcgacgacg ggcgcgacgc gatccggccg ctcgaggagc 43740 gctgggcgct cgtaggtgtc gacccaggcg acgacgtacc gcgctgggcg gggctgctca 43800 ccgaggccat cgacggcttc gacgccgcgt tcttcggtat cgccccccgg gaggcacggt 43860 cgctcgaccc gcagcatcgc ctgctgctgg aggtcgcctg ggaggggttc gaagacgccg 43920 gcatcccgcc caggtccctc gtcgggagcc gcaccggcgt gttcgtcggc gtctgcgcca 43980 cggagtacct ccacgccgcc gtcgcgcacc agccgcgcga agagcgggac gcgtacagca 44040 ccaccggcaa catgctcagc atcgccgccg gacggctatc gtacacgctg gggctgcagg 44100 gaccttgcct gaccgtcgat acggcgtgct cgtcatcgct ggtggccatt cacctcgcct 44160 gccgcagcct gcgcgctcga gagagcgatc tcgcgctggc gggaggggtc aacatgcttc 44220 tctcccccga cacgatgcga gctctggcgc gcacccaggc gctgtcgccc aatggccgtt 44280 gccagacctt cgacgcgtcg gccaacgggt tcgtccgtgg ggagggctgc ggtctgatcg 44340 tgctcaagcg attgagcgac gcgcggcggg atggggaccg gatctgggcg ctgatccgag 44400 gatcggccat caatcaggac ggccggtcga cggggttgac ggcgcccaac gtgctcgccc 44460 agggggcgct cttgcgcgag gcgctgcgga acgccggcgt cgaggccgag gccatcggtt 44520 acatcgagac ccacggggcg gcaacctcgc tgggcgaccc catcgagatc gaagcgctgc 44580 gcgctgtggt ggggccggcg cgagccgacg gagcgcgctg cgtgctgggc gcggtgaaga 44640 ccaacctcgg ccacctggag ggcgctgccg gcgtggcggg cctgatcaag gcgacgcttt 44700 cgctacatca cgagcgcatc ccgaggaacc tcaactttcg tacgctcaat ccgcggatcc 44760 ggatcgaggg gaccgcgctc gcgttggcga ccgaaccggt gccctggccg cggacgggcc 44820 ggacgcgctt cgcgggagtg agctcgttcg ggatgagcgg gaccaacgcg catgtggtgt 44880 tggaggaggc gccggcggtg gagcctgagg ccgcggcccc cgagcgcgca gcggagctgt 44940 tcgtcctgtc ggcgaagagc gcggcggcgc tggatgcgca ggcagcccgg ctgcgggacc 45000 acctggagaa gcacgtcgag cttggcctcg gcgatgtggc gttcagcctg gcgacgacgc 45060 gcagcgcgat ggagcaccgg ctggcggtgg ccgcgagctc gcgcgaggcg ctgcgagggg 45120 cgctttcggc cgcagcgcag gggcacacgc cgccgggagc cgtgcgtggg cgggcctcgg 45180 gcggcagcgc gccgaaggtg gtcttcgtgt ttcccggtca gggctcgcag tgggtgggca 45240 tgggccgaaa gctcatggcc gaagagccgg tcttccgggc ggcgctggag ggttgcgacc 45300 gggccatcga ggcggaagcg ggctggtcgc tgctcgggga gctctccgcc gacgaggccg 45360 cctcgcagct cgggcgcatc gacgtggttc agccggtgct cttcgccatg gaagtagcgc 45420 tttctgcgct gtggcggtcg tggggagtgg agccggaagc ggtggtgggc cacagcatgg 45480 gcgaggttgc ggcggcgcac gtggccggcg cgctgtcgct cgaggacgcg gtggcgatca 45540 tctgccggcg cagccggctg ctgcggcgga tcagcggtca gggggagatg gcgctggtcg 45600 agctgtcgct ggaggaggcc gaggcggcgc tgcgtggcca tgagggtcgg ctgagcgtgg 45660 cggtgagcaa cagcccgcgc tcgaccgtgc tcgccggcga gccggcggcg ctctcggagg 45720 tgctggcggc gctgacggcc aagggggtgt tctggcggca ggtgaaggtg gacgtcgcca 45780 gccatagccc gcaggtcgac ccgctgcgcg aagagctgat cgcggcgctg ggagcgatcc 45840 ggccgcgagc ggctgcggtg ccgatgcgct cgacggtgac gggcggggtg atcgcgggtc 45900 cggagctcgg tgcgagctac tgggcggaca accttcggca gccggtgcgc ttcgctgcgg 45960 cggcgcaagc gctgctggag ggtggccccg cgctgttcat cgagatgagc ccgcacccga 46020 tcctggtgcc gcccctggac gagatccaga cggcggccga gcaagggggc gctgcggtgg 46080 gctcgctgcg gcgagggcag gacgagcgcg cgacgctgct ggaggcgctg gggacgctgt 46140 gggcgtccgg ctatccggtg agctgggctc ggctgttccc cgcgggcggc aggcgggttc 46200 cgctgccgac ctatccctgg cagcacgagc ggtgctggat cgaggtcgag cctgacgccc 46260 gccgcctcgc cgcagccgac cccaccaagg actggttcta ccgaacggac tggcccgagg 46320 tgccccgcgc cgccccgaaa tcggagacag ctcatgggag ctggctgctg ttggccgaca 46380 ggggtggggt cggtgaggcg gtcgctgcag cgctgtcgac gcgcggactt tcctgcaccg 46440 tgcttcatgc gtcggctgac gcctccaccg tcgccgagca ggtatccgaa gctgccagtc 46500 gccgaaacga ctggcaggga gtcctctacc tgtggggcct cgacgccgtc gtcgatgctg 46560 gggcatcggc cgacgaagtc agcgaggcta cccgccgtgc caccgcaccc gtccttgggc 46620 tggttcgatt cctgagcgct gcgccccatc ctcctcgctt ctgggtggtg acccgcgggg 46680 catgcacggt gggcggcgag ccagaggcct ctctttgcca agcggcgttg tggggcctcg 46740 cgcgcgtcgc ggcgctggag caccccgctg cctggggtgg cctcgtggac ctggatcctc 46800 agaagagccc gacggagatc gagcccctgg tggccgagct gctttcgccg gacgccgagg 46860 atcaactggc gttccgcagc ggtcgcaggc acgcagcacg ccttgtagcc gccccgccgg 46920 agggcgacgt cgcaccgata tcgctgtccg cggaggggag ctacctggtg acgggcgggc 46980 tgggtggcct tggtctgctc gtggctcggt ggctggtgga gcggggagct cgacatctgg 47040 tgctcaccag ccggcacggg ctgccagagc gacaggcgtc gggcggagag cagccgccgg 47100 aggcccgcgc gcgcatcgca gcggtcgagg ggctggaagc gcagggcgcg cgggtgaccg 47160 tggcagcggt ggatgtcgcc gaggccgatc ccatgacggc gctgctggcc gccatcgagc 47220 ccccgttgcg cggggtggtg cacgccgccg gcgtcttccc cgtgcgtcac ctggcggaga 47280 cggacgaggc cctgctggag tcggtgctcc gtcccaaggt ggccgggagc tggctgctgc 47340 accggctgct gcgcgaccgg cctctcgacc tgttcgtgct gttctcgtcg ggcgcggcgg 47400 tgtggggtgg caaaggccaa ggcgcatacg ccgcggccaa tgcgttcctc gacgggctcg 47460 cgcaccatcg ccgcgcgcac tcgctgccgg cgttgagcct cgcctggggc ttatgggccg 47520 agggaggcat ggttgatgca aaggctcatg cacgtctgag cgacatcggg gtcctgccca 47580 tggccacggg gccggccttg tcggcgctgg agcgcctggt gaacaccagc gctgtccagc 47640 gttcggtcac acggatggac tgggcgcgct tcgcgccggt ctatgccgcg cgagggcggc 47700 gcaacttgct ttcggctctg gtcgcggagg acgagcgcgc tgcgtctccc ccggtgccga 47760 cggcaaaccg gatctggcgc ggcctgtccg ttgcggagag ccgctcagcc ctctacgagc 47820 tcgttcgcgg catcgtcgcc cgggtgctgg gcttctccga cccgggcgcg ctcgacgtcg 47880 gccgaggctt cgccgagcag gggctcgact ccctgatggc tctggagatc cgtaaccgcc 47940 ttcagcgcga gctgggcgaa cggctgtcgg cgactctggc cttcgaccac ccgacggtgg 48000 agcggctggt ggcgcatctc ctcaccgacg tgctgaagct ggaggaccgg agcgacaccc 48060 ggcacatccg gtcggtggcg gcggatgacg acatcgccat cgtcggtgcc gcctgccggt 48120 tcccaggtgg ggatgagggc ctggagacat actggcggca tctggccgag ggcatggtgg 48180 tcagcaccga ggtgccagcc gaccggtggc gcgcggcgga ctggtacgac cccgatccgg 48240 aggttccggg ccggacctat gtggccaagg gtgccttcct ccgcgatgtg cgcagcttgg 48300 atgcggcgtt cttcgccatt tcccctcgtg aggcgatgag cctggacccg caacagcggc 48360 tgttgctgga ggtgagctgg gaggcgatcg agcgcgctgg ccaggacccg atggcgctgc 48420 gcgagagcgc cacgggcgtg ttcgtgggca tgatcgggag cgagcacgcc gagcgggtgc 48480 agggcctcga cgacgacgcg gcgttgctgt acggcaccac cggcaacctg ctcagcgtcg 48540 ccgctggacg gctgtcgttc ttcctgggtc tgcacggccc gacgatgacg gtggacaccg 48600 cctgctcgtc gtcgctggtg gcgttgcacc tcgcctgcca gagcctgcga ttgggcgagt 48660 gcgaccaggc cctggccggc gggtccagcg tgcttttgtc gccgcggtca ttcgtcgcgg 48720 cgtcgcgcat gcgtttgctt tcgccagatg ggcggtgcaa gacgttctcg gccgctgcag 48780 acggctttgc gcgggccgag ggctgcgccg tggtggtgct caagcggctc cgtgacgcgc 48840 agcgcgaccg cgaccccatc ctggcggtgg tcaggagcac ggcgatcaac cacgatggcc 48900 cgagcagcgg gctcacggtg cccagcggtc ctgcccagca ggcgttgcta cgccaggcgc 48960 tggcgcaagc gggcgtggcg ccggccgagg tcgatttcgt ggagtgccac gggacgggga 49020 cagcgctggg tgacccgatc gaggtgcagg cgctgggcgc ggtgtacggg cggggccgcc 49080 ccgcggagcg gccgctctgg ctgggcgctg tcaaggccaa cctcggccac ctggaggccg 49140 cggcgggctt ggccggcgtg ctcaaggtgc tcttggcgct ggagcacgag cagattccgg 49200 ctcaaccgga gctcgacgag ctcaacccgc acatcccgtg ggcagagctg ccagtggccg 49260 ttgtccgcag ggcggtcccc tggccgcgcg gcgcgcgccc gcgtcgtgca ggcgtgagcg 49320 ctttcggcct gagcgggacc aacgcgcatg tggtgttgga ggaggcgccg gcggtggagc 49380 ctgtggccgc ggcccccgag cgcgcagcgg agctgttcgt cctgtcggcg aagagcgcgg 49440 cggcgctgga tgcgcaggca gcccggctgc gggaccacct ggagaagcat gtcgagcttg 49500 gcctcggcga tgtggcgttc agcctggcga cgacgcgcag cgcgatggag caccggctgg 49560 cggtggccgc gagctcgcgc gaggcgctgc gaggggcgct ttcggccgca gcgcaggggc 49620 acacgccgcc gggagccgtg cgtgggcggg cctcgggcgg cagcgcgccg aaggtggtct 49680 tcgtgtttcc cggccagggc tcgcagtggg tgggcatggg ccgaaagctc atggccgaag 49740 agccggtctt ccgggcggcg ctggagggtt gcgaccgggc catcgaggcg gaagcgggct 49800 ggtcgctgct cggggagctc tccgccgacg aggccgcctc gcagctcggg cgcatcgacg 49860 tggttcagcc ggtgctgttc gccatggaag tagcgctttc tgcgctgtgg cggtcgtggg 49920 gagtggagcc ggaagcggtg gtgggccaca gcatgggcga ggttgcggcg gcgcacgtgg 49980 ccggcgcgct gtcgctcgag gacgcggtgg cgatcatctg ccggcgcagc cggctgctgc 50040 ggcggatcag cggtcagggg gagatggcgc tggtcgagct gtcgctggag gaggccgagg 50100 cggcgctgcg tggccatgag ggtcggctga gcgtggcggt gagcaacagc ccgcgctcga 50160 ccgtgctcgc cggcgagccg gcggcgctct cggaggtgct ggcggcgctg acggccaagg 50220 gggtgttctg gcggcaggtg aaggtggacg tcgccagcca tagcccgcag gtcgacccgc 50280 tgcgcgaaga gctgatcgcg gcgctgggag cgatccggcc gcgagcggct gcggtgccga 50340 tgcgctcgac ggtgacgggc ggggtgatcg cgggtccgga gctcggtgcg agctactggg 50400 cggacaacct tcggcagccg gtgcgcttcg ctgcggcggc gcaagcgctg ctggagggtg 50460 gccccgcgct gttcatcgag atgagcccgc acccgatcct ggtgccgccc ctggacgaga 50520 tccagacggc ggccgagcaa gggggcgctg cggtgggctc gctgcggcga gggcaggacg 50580 agcgcgcgac gctgctggag gcgctgggga cgctgtgggc gtccggctat ccggtgagct 50640 gggctcggct gttccccgcg ggcggcaggc gggttccgct gccgacctat ccctggcagc 50700 acgagcggta ctggatcgag gacagcgtgc atgggtcgaa gccctcgctg cggcttcggc 50760 agcttcgcaa cggcgccacg gaccatccgc tgctcggggc tccattgctc gtctcggcgc 50820 gacccggagc tcacttgtgg gagcaagcgc tgagcgacga gaggctatcc tacctttcgg 50880 aacatagggt ccatggcgaa gccgtgttgc ccagcgcggc gtatgtagag atggcgctcg 50940 ccgccggcgt agatctctat ggcacggcga cgctggtgct ggagcagctg gcgctcgagc 51000 gagccctcgc cgtgccctcc gaaggcggac gcatcgtgca agtggccctc agcgaagaag 51060 gtcccggtcg ggcctcattc caggtatcga gtcgtgagga ggcaggtagg agctgggtgc 51120 ggcacgccac ggggcacgtg tgtagcggcc agagctcagc ggtgggagcg ttgaaggaag 51180 ctccgtggga gattcaacgg cgatgtccga gcgtcctgtc gtcggaggcg ctctatccgc 51240 tgctcaacga gcacgccctc gactatggtc cctgcttcca gggcgtggag caggtgtggc 51300 tcggcacggg ggaggtgctc ggccgggtac gcttgccagg agacatggca tcctcaagtg 51360 gcgcctaccg gattcatccc gccttgttgg atgcatgttt tcaggtgctg acagcgctgc 51420 tcaccacgcc ggaatccatc gagattcgga ggcggctgac ggatctccac gaaccggatc 51480 tcccgcggtc cagggctccg gtgaatcaag cggtgagtga cacctggctg tgggacgccg 51540 cgctggacgg tggacggcgc cagagcgcga gcgtgcccgt cgacctggtg ctcggcagct 51600 tccatgcgaa gtgggaggtc atggagcgcc tcgcgcaggc gtacatcatc ggcactctcc 51660 gcatatggaa cgtcttctgc gctgctggag agcgtcacac gatagacgag ttgctcgtca 51720 ggcttcaaat ctctgtcgtc tacaggaagg tcatcaagcg atggatggaa caccttgtcg 51780 cgatcggcat ccttgtaggg gacggagagc attttgtgag ctctcagccg ctgccggagc 51840 ctgatttggc ggcggtgctc gaggaggccg ggagggtgtt cgccgacctc ccagtcctat 51900 ttgagtggtg caagtttgcc ggggaacggc tcgcggacgt attgaccggt aagacgctcg 51960 cgctcgagat cctcttccct ggtggctcgt tcgatatggc ggagcgaatc tatcgagatt 52020 cgcccatcgc ccgttactcg aacggcatcg tgcgcggtgt cgtcgagtcg gcggcgcggg 52080 tggtagcacc gtcgggaatg ttcagcatct tggagatcgg agcagggacg ggcgcgacca 52140 ccgccgccgt cctcccggtg ttgctgcctg accggacgga gtaccatttc accgatgttt 52200 ctccgctctt ccttgctcgc gcggagcaaa gatttcgaga ttatccattc ctgaagtatg 52260 gcattctgga tgtcgaccag gagccagctg gccagggata cgcacatcag aggtttgacg 52320 tcatcgtcgc ggccaatgtc atccatgcga cccgcgatat aagagccacg gcgaagcgtc 52380 tcctgtcgtt gctcgcgccc ggaggccttc tggtgctggt cgagggcaca gggcatccga 52440 tctggttcga tatcaccacg ggattgattg aggggtggca gaagtacgaa gatgatcttc 52500 gtatcgacca tccgctcctg cctgctcgga cctggtgtga cgtcctgcgc cgggtaggct 52560 ttgcggacgc cgtgagtctg ccaggcgacg gatctccggc ggggatcctc ggacagcacg 52620 tgatcctctc gcgcgcgccg ggcatagcag gagccgcttg tgacagctcc ggtgagtcgg 52680 cgaccgaatc gccggccgcg cgtgcagtac ggcaggaatg ggccgatggc tccgctgacg 52740 tcgtccatcg gatggcgttg gagaggatgt acttccaccg ccggccgggc cggcaggttt 52800 gggtccacgg tcgattgcgt accggtggag gcgcgttcac gaaggcgctc gctggagatc 52860 tgctcctgtt cgaagacacc gggcaggtcg tggcagaggt tcaggggctc cgcctgccgc 52920 agctcgaggc ttctgctttc gcgccgcggg acccgcggga agagtggttg tacgctttgg 52980 aatggcagcg caaagaccct ataccagagg ctccggcagc cgcgtcttct tcctccgcgg 53040 gggcttggct cgtgctgatg gaccagggcg ggacaggcgc tgcgctcgta tcgctgctgg 53100 aagggcgagg cgaggcgtgc gtgcgcgtca tcgcgggtac ggcatacgcc tgcctcgcgc 53160 cggggctgta tcaagtcgat ccggcgcagc cagatggctt tcataccctg ctccgcgatg 53220 cattcggcga ggaccggatt tgtcgcgcgg tagtgcatat gtggagcctt gatgcgacgg 53280 cagcagggga gagggcgaca gcggagtcgc ttcaggccga tcaactcctg gggagcctga 53340 gcgcgctttc tctggtgcag gcgctggtgc gccggaggtg gcgcaacatg ccgcggcttt 53400 ggctcttgac ccgcgccgtg catgcggtgg gcgcggagga cgcagcggcc tcggtggcgc 53460 aggcgccggt gtggggcctc ggtcggacgc tcgcgctcga gcatccagag ctgcggtgca 53520 cgctcgtgga cgtgaacccg gcgccgtctc cagaggacgc agccgcactg gcggtggagc 53580 tcggggcgag cgacagagag gaccaggtcg cattgcgctc ggatggccgc tacgtggcgc 53640 gcctcgtgcg gagctccttt tccggcaagc ctgctacgga ttgcggcatc cgggcggacg 53700 gcagctatgt gatcaccgat ggcatgggga gagtggggct ctcggtcgcg caatggatgg 53760 tgatgcaggg ggcccgccat gtggtgctcg tggatcgcgg cggcgcttcc gaggcatccc 53820 gggatgccct ccggtccatg gccgaggctg gcgcggaggt gcagatcgtg gaggccgacg 53880 tggctcggcg cgacgatgtc gctcggctcc tctcgaagat cgaaccgtcg atgccgccgc 53940 ttcgggggat cgtgtacgtg gacgggacct tccagggcga ctcctcgatg ctggagctgg 54000 atgcccgtcg cttcaaggag tggatgtatc ccaaggtgct cggagcgtgg aacctgcacg 54060 cgctgaccag ggatagatcg ctggacttct tcgtcctgta ttcctcgggc acctcgcttc 54120 tgggcttgcc aggacagggg agccgcgccg ccggtgacgc cttcttggac gccatcgcgc 54180 atcaccggtg caaggtgggc cttacagcga tgagcatcaa ctggggattg ctctccgaag 54240 catcatcgcc ggcgaccccg aacgacggcg gagcacggct cgaataccgg gggatggaag 54300 gcctcacgct ggagcaggga gcggcggcgc tcgggcgctt gctcgcacga cccagggcgc 54360 aggtaggggt gatgcggctg aatctgcgcc agtggttgga gttctatccc aacgcggccc 54420 gattggcgct gtgggcggag ctgctgaagg agcgtgaccg cgccgaccga ggcgcgtcga 54480 acgcgtcgaa cctgcgcgag gcgctgcaga gcgccaggcc cgaagatcgt cagttgattc 54540 tggagaagca cttgagcgag ctgttggggc gggggctgcg ccttccgccg gagaggatcg 54600 agcggcacgt gccgttcagc aatctcggca tggactcgct gataggcctg gagctccgca 54660 accgcatcga ggccgcgctc ggcatcaccg tgccggcgac cctgctatgg acctacccta 54720 acgtagcagc tctgagcggg agcttgctag acattctgtt tccgaatgcc ggcgcgaccc 54780 acgctccggc caccgagcgg gagaagagct tcgagaacga tgccgcagat ctcgaggctc 54840 tgcggggcat gacggacgag cagaaggacg cgttgctcgc cgaaaagctg gcgcagctcg 54900 cgcagatcgt tggtgagtaa gggaccgagg gagtatggcg accacgaatg ccgggaagct 54960 tgagcatgcc cttctgctca tggacaagct tgcgaaaaag aacgcgtctt tggagcaaga 55020 gcggaccgag ccgatcgcca tcgtaggcat tggctgccgc ttccccggcg gagcggacac 55080 tccggaggca ttctgggagc tgctcgactc aggccgagac gcggtccagc cgctcgaccg 55140 gcgctgggcg ctggtcggcg tccatcccag cgaggaggtg ccgcgctggg ccggactgct 55200 caccgaggcg gtggacggct tcgacgccgc gttctttggc acctcgcctc gggaggcgcg 55260 gtcgctcgat cctcagcaac gcctgctgct ggaggtcacc tgggaagggc tcgaggacgc 55320 cggcatcgca ccccagtccc tcgacggcag ccgcaccggg gtgttcctgg gcgcatgcag 55380 cagcgactac tcgcataccg ttgcgcaaca gcggcgcgag gagcaggacg catacgacat 55440 caccggcaat acgctcagcg tcgccgccgg acggttgtct tatacgctag ggctgcaggg 55500 accctgcctg accgtcgaca cggcctgctc gtcgtcgctc gtggccatcc accttgcctg 55560 ccgcagcctg cgcgctcgcg agagcgatct cgcgctggcg ggaggcgtca acatgctcct 55620 ttcgtccaag acgatgataa tgctggggcg catccaggcg ctgtcgcccg atggccactg 55680 ccggacattc gacgcctcgg ccaacgggtt cgtccgtggg gagggctgcg gtatggtcgt 55740 gctcaaacgg ctctccgacg cccagcgaca cggcgatcgg atctgggctc tgatccgggg 55800 ttcggccatg aatcaggatg gccggtcgac agggttgatg gcacccaatg tgctcgctca 55860 ggaggcgctc ttgcgcgagg cgctgcagag cgctcgcgtc gacgccgggg ccatcggtta 55920 tgtcgagacc cacggaacgg ggacctcgct cggcgacccg atcgaggtcg aggcgctgcg 55980 tgccgtgttg gggccggcgc gggccgatgg gagccgctgc gtgctgggcg cagtgaagac 56040 aaacctcggc cacctggagg gcgctgcagg cgtggcgggt ttgatcaagg cggcgctggc 56100 tctgcaccac gaactgatcc cgcgaaacct ccatttccac acgctcaatc cgcggatccg 56160 gatcgagggg accgcgctcg cgctggcgac ggagccggtg ccgtggccgc gggcgggccg 56220 accgcgcttc gcgggggtga gcgcgttcgg cctcagcggc accaacgtcc atgtcgtgct 56280 ggaggaggcg ccggccacgg tgctcgcacc ggcgacgccg gggcgctcag cggagctttt 56340 ggtgctgtcg gcgaagagcg ccgccgcgct ggacgcacag gcggcgcggc tctcagcgca 56400 catcgccgcg tacccggagc agggtctcgg agacgtcgcg ttcagcctgg tatcgacgcg 56460 tagcccgatg gagcaccggc tcgcggtggc ggcgacctcg cgcgaggcgc tgcgaagcgc 56520 gctggaggtt gcggcgcagg ggcagacccc ggcaggcgcg gcgcgcggca gggccgcttc 56580 ctcgcccggc aagctcgcct tcctgttcgc cgggcagggc gcgcaggtgc cgggcatggg 56640 ccgtgggttg tgggaggcgt ggccggcgtt ccgcgagacc ttcgaccggt gcgtcacgct 56700 cttcgaccgg gagctccatc agccgctctg cgaggtgatg tgggccgagc cgggcagcag 56760 caggtcgtcg ttgctggacc agacggcgtt cacccagccg gcgctctttg cgctggagta 56820 cgcgctggcc gcgctcttcc ggtcgtgggg cgtggagccg gagctcgtcg ctggccatag 56880 cctcggcgag ctggtggccg cctgcgtggc gggtgtgttc tccctcgagg acgccgtgcg 56940 cttggtggtc gcgcgcggcc ggttgatgca ggcgctgccg gccggcggcg cgatggtatc 57000 gatcgccgcg ccggaggccg acgtggctgc cgcggtggcg ccgcacgcag cgttggtgtc 57060 gatcgcggca gtcaatgggc cggagcaggt ggtgatcgcg ggcgccgaga aattcgtgca 57120 gcagatcgcg gcggcgttcg cggcgcgggg ggcgcgaacc aaaccgctgc atgtctcgca 57180 cgcgttccac tcgccgctca tggatccgat gctggaggcg ttccggcggg tgactgagtc 57240 ggtgacgtac cggcggcctt cgatcgcgct ggtgagcaac ctgagcggga agccctgcac 57300 cgatgaggtg agcgcgccgg gttactgggt gcgtcacgcg cgagaggcgg tgcgcttcgc 57360 ggacggagtg aaggcgctgc acgcggccgg tgcgggcctc ttcgtcgagg tggggccgaa 57420 gccgacgctg ctcggccttg tgccggcctg cctgccggat gccaggccgg tgctgctccc 57480 agcgtcgcgc gccgggcgtg acgaggctgc gagcgcgcta gaggcgctgg gtgggttctg 57540 ggtcgtcggt ggatcggtca cctggtcggg tgtcttccct tcgggcggac ggcgggtacc 57600 gctgccaacc tatccctggc agcgcgagcg ttactggatc gaagcgccgg tcgatcgtga 57660 ggcggacggc accggccgtg ctcgggcggg gggccacccc cttctgggtg aagtcttttc 57720 cgtgtcgacc catgccggtc tgcgcctgtg ggagacgacg ctggaccgaa agcggctgcc 57780 gtggctcggc gagcaccggg cgcaggggga ggtcgtgttt cctggcgccg ggtacctgga 57840 gatggcgctg tcgtcggggg ccgagatctt gggcgatgga ccgatccagg tcacggatgt 57900 ggtgctcatc gagacgctga ccttcgcggg cgatacggcg gtaccggtcc aggtggtgac 57960 gaccgaggag cgaccgggac ggctgcggtt ccaggtagcg agtcgggagc cgggggaacg 58020 tcgcgcgccc ttccggatcc acgcccgcgg cgtgctgcgc cggatcgggc gcgtcgagac 58080 cccggcgagg tcgaacctcg ccgccctgcg cgcccggctt catgccgccg tgcccgctgc 58140 ggctatctat ggtgcgctcg ccgagatggg gcttcaatac ggcccggcgt tgcgggggct 58200 cgccgagctg tggcggggtg agggcgaggc gctgggcagg gtgagactgc ctgaggccgc 58260 cggctccgcg acagcctacc agctgcatcc ggtgctgctg gacgcgtgcg tccaaatgat 58320 tgttggcgcg ttcgccgatc gcgatgaggc gacgccgtgg gcgccggtgg aggtgggctc 58380 ggtgcggctg ttccagcggt ctcctgggga gctatggtgc catgcgcgcg tcgtgagcga 58440 tggtcaacag gcctccagcc ggtggagcgc cgactttgag ttgatggacg gtacgggcgc 58500 ggtggtcgcc gagatctccc ggctggtggt ggagcggctt gcgagcggtg tacgccggcg 58560 cgacgcagac gactggttcc tggagctgga ttgggagccc gcggcgctcg gtgggcccaa 58620 gatcacagcc ggccggtggc tgctgctcgg cgagggtggt gggctcgggc gctcgttgtg 58680 ctcggcgctg aaggccgccg gccatgtcgt cgtccacgcc gcgggggacg acacgagcac 58740 tgcaggaatg cgcgcgctcc tggccaacgc gttcgacggc caggccccga cggccgtggt 58800 gcacctcagc agcctcgacg ggggcggcca gctcggcccg gggctcgggg cgcagggcgc 58860 gctcgacgcg ccccggagcc cagatgtcga tgccgatgcc ctcgaatcgg cgctgatgcg 58920 tggttgcgac agcgtgctct ccctggtgca agcgctggtc ggcatggacc tccgaaacgc 58980 gccgcggctg tggctcttga cccgcggggc tcaggcggcc gccgccggcg atgtctccgt 59040 ggtgcaagcg ccgctgttgg ggctgggccg caccatcgcc ttggagcacg ccgagctgcg 59100 ctgtatcagc gtcgacctcg atccagccga gcctgaaggg gaagccgatg ctttgctggc 59160 cgagctactt gcagatgatg ccgaggagga ggtcgcgctg cgcggtggcg accggctcgt 59220 tgcgcggctc gtccaccggc tgcccgacgc tcagcgccgg gagaaggtcg agcccgccgg 59280 tgacaggccg ttccggctag agatcgatga acccggcgcg ctggaccaac tggtgctccg 59340 agccacgggg cggcgcgctc ctggtccggg cgaggtcgag atctccgtcg aagcggcggg 59400 gctcgactcc atcgacatcc agctggcgtt gggcgttgct cccaatgatc tgcctggaga 59460 agaaatcgag ccgttggtgc tcggaagcga gtgcgccggg cgcatcgtcg ctgtgggcga 59520 gggcgtgaac ggccttgtgg tgggccagcc ggtgatcgcc cttgcggcgg gagtatttgc 59580 tacccatgtc accacgtcgg ccacgctggt gttgcctcgg cctctggggc tctcggcgac 59640 cgaggcggcc gcgatgcccc tcgcgtattt gacggcctgg tacgccctcg acaaggtcgc 59700 ccacctgcag gcgggggagc gggtgctgat ccatgcggag gccggtggtg tcggtctttg 59760 cgcggtgcga tgggcgcagc gcgtgggcgc cgaggtgtat gcgaccgccg acacgcccga 59820 gaaccgtgcc tacctggagt cgctgggcgt gcggtacgtg agcgattccc gctcgggccg 59880 gttcgtcaca gacgtgcatg catggacgga cggcgagggt gtggacgtcg tgctcgactc 59940 gctttcgggc gagcgcatcg acaagagcct catggtcctg cgcgcctgtg gtcgccttgt 60000 gaagctgggc aggcgcgacg actgcgccga cacgcagcct gggctgccgc cgctcctacg 60060 gaatttttcc ttctcgcagg tggacttgcg gggaatgatg ctcgatcaac cggcgaggat 60120 ccgtgcgctc ctcgacgagc tgttcgggtt ggtcgcagcc ggtgccatca gcccactggg 60180 gtcggggttg cgcgttggcg gatccctcac gccaccgccg gtcgagacct tcccgatctc 60240 tcgcgcagcc gaggcattcc ggaggatggc gcaaggacag catctcggga agctcgtgct 60300 cacgctggac gacccggagg tgcggatccg cgctccggcc gaatccagcg tcgccgtccg 60360 cgcggacggc acctaccttg tgaccggcgg tctgggtggc ctcggtctgc gcgtggccgg 60420 atggctggcc gagcggggcg cggggcaact ggtgctggtg ggccgctccg gtgcggcgag 60480 cgcagagcag cgagccgccg tggcggcgct ggaggcccac ggcgcgcgcg tcacggtggc 60540 gaaagcggac gtcgccgatc ggtcacagat cgagcgggtc ctccgcgagg ttaccgcgtc 60600 ggggatgccg ctgcggggtg tcgtgcatgc ggcaggtctc gtggatgacg ggctgctgat 60660 gcagcagact ccggcgcggt tccgcacggt gatgggacct aaggtccagg gggccttgca 60720 cttgcacacg ctgacacgcg aagcgcctct ttccttcttc gtgctgtacg cttctgcagc 60780 tgggcttttc ggctcgccag gccagggcaa ctatgccgca gccaacgcgt tcctcgacgc 60840 cctttcgcat caccgaaggg cgcagggcct gccggcgctg agcatcgact ggggcatgtt 60900 cacggaggtg gggatggccg ttgcgcaaga aaaccgtggc gcgcggcaga tctctcgcgg 60960 gatgcggggc atcacccccg atgagggtct gtcagctctg gcgcgcttgc tcgagggtga 61020 tcgcgtgcag acgggggtga taccgatcac tccgcggcag tgggtggagt tctacccggc 61080 aacagcggcc tcacggaggt tgtcgcggct ggtgaccacg cagcgcgcgg tcgctgatcg 61140 gaccgccggg gatcgggacc tgctcgaaca gcttgcgtcg gctgagccga gcgcgcgggc 61200 ggggctgctg caggacgtcg tgcgcgtgca ggtctcgcat gtgctgcgtc tccctgaaga 61260 caagatcgag gtggatgccc cgctctcgag catgggcatg gactcgctga tgagcctgga 61320 gctgcgcaac cgcatcgagg ctgcgctggg cgtcgccgcg cctgcagcct tggggtggac 61380 gtacccaacg gtagcagcga taacgcgctg gctgctcgac gacgccctcg tcgtccggct 61440 tggcggcggg tcggacacgg acgaatcgac ggcgagcgcc ggttcgttcg tccacgtcct 61500 ccgctttcgt cctgtcgtca agccgcgggc tcgtctcttc tgttttcacg gttctggcgg 61560 ctcgcccgag ggcttccgtt cctggtcgga gaagtctgag tggagcgatc tggaaatcgt 61620 ggccatgtgg cacgatcgca gcctcgcctc cgaggacgcg cctggtaaga agtacgtcca 61680 agaggcggcc tcgctgattc agcactatgc agacgcaccg tttgcgttag tagggttcag 61740 cctgggtgtc cggttcgtca tggggacagc cgtggagctc gccagtcgtt ccggcgcacc 61800 ggctccgctg gccgtcttca cgttgggcgg cagcttgatc tcttcttcag agatcacccc 61860 ggagatggag accgatataa tagccaagct cttcttccga aatgccgcgg gtttcgtgcg 61920 atccacccaa caagtccagg ccgatgctcg cgcagacaag gtcatcacag acaccatggt 61980 ggctccggcc cccggggact cgaaggagcc gcccgtgaag atcgcggtcc ctatcgtcgc 62040 catcgccggc tcggacgatg tgatcgtgcc tccgagcgac gttcaggatc tacaatctcg 62100 caccacggag cgcttctata tgcatctcct tcccggagat cacgaatttc tcgtcgatcg 62160 agggcgcgag atcatgcaca tcgtcgactc gcatctcaat ccgctgctcg ccgcgaggac 62220 gacgtcgtca ggccccgcgt tcgaggcaaa atgatggcag cctccctcgg gcgcgcgaga 62280 tggttgggag cagcgtgggc gctggcggcc ggcggcaggc cgcggaggcg catgagcctt 62340 cctggacgtt tgcagtatag gagattttat gacacaggag caagcgaatc agagtgagac 62400 gaagcctgct ttcgacttca agccgttcgc gcctgggtac gcggaggacc cgttccccgc 62460 gatcgagcgc ctgagagagg caacccccat cttctactgg gatgaaggcc gctcctgggt 62520 cctcacccga taccacgacg tgtcggcggt gttccgcgac gaacgcttcg cggtcagtcg 62580 agaagagtgg gaatcgagcg cggagtactc gtcggccatt cccgagctca gcgatatgaa 62640 gaagtacgga ttgttcgggc tgccgccgga ggatcacgct cgggtccgca agctcgtcaa 62700 cccgtcgttt acgtcacgcg ccatcgacct gctgcgcgcc gaaatacagc gcaccgtcga 62760 ccagctgctc gatgctcgct ccggacaaga ggagttcgac gttgtgcggg attacgcgga 62820 gggaatcccg atgcgcgcga tcagcgctct gttgaaggtt ccggccgagt gtgacgagaa 62880 gttccgtcgc ttcggctcgg cgactgcgcg cgcgctcggc gtgggtttgg tgccccaggt 62940 cgatgaggag accaagaccc tggtcgcgtc cgtcaccgag gggctcgcgc tgctccatga 63000 cgtcctcgat gagcggcgca ggaacccgct cgaaaatgac gtcttgacga tgctgcttca 63060 ggccgaggcc gacggcagca ggctgagcac gaaggagctg gtcgcgctcg tgggtgcgat 63120 tatcgctgct ggcaccgata ccacgatcta ccttatcgcg ttcgctgtgc tcaacctgct 63180 gcggtcgccc gaggcgctcg agctggtgaa ggccgagccc gggctcatga ggaacgcgct 63240 cgatgaggtg ctccgcttcg acaatatcct cagaatagga actgtgcgtt tcgccaggca 63300 ggacctggag tactgcgggg catcgatcaa gaaaggggag atggtctttc tcctgatccc 63360 gagcgccctg agagatggga ctgtattctc caggccagac gtgtttgatg tgcgacggga 63420 cacgggcgcg agcctcgcgt acggtagagg cccccatgtc tgccccgggg tgtcccttgc 63480 tcgcctcgag gcggagatcg ccgtgggcac catcttccgt aggttccccg agatgaagct 63540 gaaagaaact cccgtgtttg gataccaccc cgcgttccgg aacatcgaat cactcaacgt 63600 catcttgaag ccctccaaag ctggatagct cgcgggggta tcgcttcccg aacctcattc 63660 cctcatgata cagctcgcgc gcgggtgctg tctgccgcgg gtgcgattcg atccagcgga 63720 caagcccatt gtcagcgcgc gaagatcgaa tccacggccc ggagaagagc ccgtccgggt 63780 gacgtcggaa gaagtgccgg gcgccgccct gggagcgcaa agctcgctcg ttcgcgctca 63840 gcacgccgct cgtcatgtcc ggccctgcac ccgcgccgag gagccgcccg ccctgatgca 63900 cggcctcacc gagcggcagg ttctgctctc gctcgtcgcc ctcgcgctcg tcctcctgac 63960 cgcgcgcgcc ttcggcgagc tcgcgcggcg gctgcgccag cccgaggtgc tcggcgagct 64020 cttcggcggc gtggtgctgg gcccgtccgt cgtcggcgcg ctcgctcctg ggttccatcg 64080 agtcctcttc caggatccgg cggtcggggt cgtgctctcc ggcatctcct ggataggcgc 64140 gctcgtcctg ctgctcatgg cgggtatcga ggtcgatgtg agcatcctgc gcaaggaggc 64200 gcgccccggg gcgctctcgg cgctcggcgc gatcgcgccc ccgctgcgca cgccggggcc 64260 gctggtgcag cgcatgcagg gcgcgttcac gtgggatctc gacgtctcgc cgcgacgctc 64320 tgcgcaagcc tgagcctcgg cgcctgctcg tacacctcgc cggtgctcgc tccgcccgcg 64380 gacatccggc cgcccgccgc ggcccagctc gagccggact cgccggatga cgaggccgac 64440 gaggccgacg aggcgctccg cccgttccgc gacgcgatcg ccgcgtactc ggaggccgtt 64500 cggtgggcgg aggcggcgca gcggccgcgg ctggagagcc tcgtgcggct cgcgatcgtg 64560 cggctgggca aggcgctcga caaggtccct ttcgcgcaca cgacggccgg cgtctcccag 64620 atcgccggca gactccagaa cgatgcggtc tggttcgatg tcgccgcccg gtacgcgagc 64680 ttccgcgcgg cgacggagca cgcgctccgc gacgcggcgt cggccatgga ggcgctcgcg 64740 gccggcccgt accgcggatc gagccgcgtg tccgctgccg taggggagtt tcggggggag 64800 gcggcgcgcc ttcaccccgc ggaccgtgta cccgcgtccg accagcagat cctgaccgcg 64860 ctgcgcgcag ccgagcgggc gctcatcgcg ctctacactg cgttcgcccg tgaggagtga 64920 gcctctctcg ggcgcagccg agcggcggcg tgccggtggt tccctcttcg caaccatgac 64980 cggagccgcg ctcggtccgc gcagcggcta gcgcgcgtcg cggcagagat cgctggagcg 65040 acaggcgacg acccgcccga gggtgtcgaa cggattgccg cagccctcat tgcggatccc 65100 ctccagacac tcgttcagct gcttggcgtc gatgccgcct gggcactcgc cgaaggtcag 65160 ctcgtcgcgc cactcggatc ggatcttgtt cgagcacgcg tccttgctcg aatactcccg 65220 gtcttgtccg atgttgttgc accgcgcctc gcggtcgcac cgcgccgcca cgatgctatc 65280 gacggcgctg ccgactggca ccggcgcctc gccctgcgcg ccacccgggg tttgcgcctc 65340 cccgcctgac cgcttttcgc cgccgcacgc cgcgagcagg ctcattcccg acaccgagat 65400 caggcccacg accagcttcc cagcaatctt ttgcatggct tcccctccct cacgacacgt 65460 cacatcagag actctccgct cggctcgtcg gttcgacagc cggcgacggc cacgagcaga 65520 accgtccccg accagaacag ccgcatgcgg gtttctcgca acatgccccg acatccttgc 65580 gactagcgtg cctccgctcg tgccgagatc ggctgtcctg tgcgacggca atatcctgcg 65640 atcggccggg caggaggtac cgacacgggc gccgggcggg aggtgccgcc acgggctcga 65700 aatgtgctgc ggcaggcgcc tccatgcccg cagccgggaa cgcggcgccc ggccagcctc 65760 ggggtgacgc cgcaaacggg agatgctccc ggagaggcgc cgggcacagc cgagcgccgt 65820 caccaccgtg cgcactcgtg agctccagct cctcggcata gaagagaccg tcactcccgg 65880 tccgtgtagg cgatcgtgct gatcagcgcg ttctccgcct gacgcgagtc gagccgggta 65940 tgctgcacga caatgggaac gtccgattcg atcacgctgg catagtccgt atcgcgcggg 66000 atcggctcgg gttcggtcag atcgttgaac cggacgtgcc gggtgcgcct cgctgggacg 66060 gtcacccggt acggcccggc ggggtcgcgg tcgctgaagt agacggtgat ggcgacctgc 66120 gcgtcccggt ccgacgcatt caacaggcag gccgtctcat ggctcgtcat ctgcggctcg 66180 ggtccgttgc tccggcctgg gatgtagccc tctgcgattg cccagcgcgt ccgcccgatc 66240 ggcttctcca tatgtcctcc ctgctggctc ctctttggct gcctccctct gctgtccagg 66300 agcgacggcc tcttctcccg acgcgctcgg ggatccatgg ctgaggatcc tcgccgagcg 66360 ctccttgccg accggcgcgc cgagcgccga cgggctttga aagcacgcga ccggacacgt 66420 gatgccggcg cgacgaggcc gccccgcgtc tgatcccgat cgtgacatcg cgacgtccgc 66480 cggcgcctct gcaggccggc ctgagcgttg cgcggtcatg gtcgtcctcg cgtcaccgcc 66540 acccgccgat tcacatccca ccgcggcacg acgcttgctc aaaccgcggc gagacggccg 66600 ggcggctgtg gtaccggcca gcccggacgc gaggcccgag agggacagtg ggtccgccgt 66660 gaagcagtga ggcgatcgag gtggcagatg aaacacgttg acacgggccg acgagtcggc 66720 cgccggatag ggctcacgct cggtctcctc gcgagcatgg cgctcgccgg ctgtggcggc 66780 ccgagcgaga aaatcgtgca gggcacgcgg ctcgcgcccg gcgccgatgc gcacgtcgcc 66840 gccgacgtcg accccgacgc cgcgaccacg cggctggcgg tggacgtcgt tcacctctcg 66900 ccgcccgagc gcatcgaggc cggcagcgag cggttcgtcg tctggcagcg tccgagctcc 66960 gagtccccgt ggcaacgggt cggagtgctc gactacaacg ctgccagccg aagaggcaag 67020 ctggccgaga cgaccgtgcc gcatgccaac ttcgagctgc tcatcaccgt cgagaagcag 67080 agcagccctc agtctccatc ttctgccgcc gtcatcgggc cgacgtccgt cgggtaacat 67140 cgcgctatca gcagcgctga gcccgccagc aggccccaga gccctgcctc gatcgccttc 67200 tccatcatat catccctgcg tactcctcca gcgacggccg cgtcgaagca accgccgtgc 67260 cggcgcggct ctacgtgcgc gacaggagag cgtcctggcg cggcctgcgc atcgctggaa 67320 ggatcggcgg agcatggaga aagaatcgag gatcgcgatc tacggcgcca tcgcagccaa 67380 cgtggcgatc gcggcggtca agttcatcgc cgccgccgtg accggcagct cggcgatgct 67440 ctccgagggc gtgcactccc tcgtcgatac tgcagacggg ctcctcctcc tgctcggcaa 67500 gcaccggagc gcacgcccgc ccgacgccga gcatccgttc ggccacggca aggagctcta 67560 tttctggacg ctgatcgtcg ccatcatgat cttcgccgcg ggcggcggcg tctcgatcta 67620 cgaagggatc ttgcacctct tgcacccgcg ccagatcgag gatccgacgt ggaactacgt 67680 cgtcctcggc gcagcggccg tcttcgaggg gacgtcgctc atcatctcga tccacgagtt 67740 caagaagaag gacggacagg gctacctcgc ggcgatgcgg tccagcaagg acccgacgac 67800 gttcacgatc gtcctggagg actccgcggc gctcgccggg ctcaccatcg ccttcctcgg 67860 cgtctggctc gggcaccgcc tgggaaaccc ctacctcgac ggcgcggcgt cgatcggcat 67920 cggcctcgtg ctcgccgcgg tcgcggtctt cctcgccagc cagagccgtg ggctcctcgt 67980 gggggagagc gcggacaggg agctcctcgc cgcgatccgc gcgctcgcca gcgcagatcc 68040 tggcgtgtcg gcggtggggc ggcccctgac gatgcacttc ggtccgcacg aagtcctggt 68100 cgtgctgcgc atcgagttcg acgccgcgct cacggcgtcc ggggtcgcgg aggcgatcga 68160 gcgcatcgag acccggatac ggagcgagcg acccgacgtg aagcacatct acgtcgaggc 68220 caggtcgctc caccagcgcg cgagggcgtg acgcgccgtg gagagaccgc gcgcggcctc 68280 cgccatcctc cgcggcgccc gggctcaggt ggccctcgca gcagggcgcg cctggcgggc 68340 aaaccgtgca gacgtcgtcc ttcgacgcga ggtacgctgg ttgcaagtcg tcacgccgta 68400 tcgcgaggtc cggcagcgcc ggagcccggg cgggccgggc gcacgaaggc gcggcgagcg 68460 caggcttcga ggggggcgac gtcatgagga aggccagggc gcatggggcg atgctcggcg 68520 ggcgagatga cggctggcgt cgcggcctcc ccggcgccgg cgcgcttcgc gccgcgctcc 68580 agcgcggtcg ctcgcgcgat ctcgcccggc gccggctcat cgcctccgtg tccctcgccg 68640 gcggcgccag catggcggtc gtctcgctgt tccagctcgg gatcatcgag cgcctgcccg 68700 atcctccgct tccagggttc gattcggcca aggtgacgag ctccgatatc 68750 <210> 2 <211> 1421 <212> PRT <213> Sorangium cellulosum <400> 2 Val Ala Asp Arg Pro Ile Glu Arg Ala Ala Glu Asp Pro Ile Ala Ile 1 5 10 15 Val Gly Ala Ser Cys Arg Leu Pro Gly Gly Val Ile Asp Leu Ser Gly 20 25 30 Phe Trp Thr Leu Leu Glu Gly Ser Arg Asp Thr Val Gly Arg Val Pro 35 40 45 Ala Glu Arg Trp Asp Ala Ala Ala Trp Phe Asp Pro Asp Pro Asp Ala 50 55 60 Pro Gly Lys Thr Pro Val Thr Arg Ala Ser Phe Leu Ser Asp Val Ala 65 70 75 80 Cys Phe Asp Ala Ser Phe Phe Gly Ile Ser Pro Arg Glu Ala Leu Arg 85 90 95 Met Asp Pro Ala His Arg Leu Leu Leu Glu Val Cys Trp Glu Ala Leu 100 105 110 Glu Asn Ala Ala Ile Ala Pro Ser Ala Leu Val Gly Thr Glu Thr Gly 115 120 125 Val Phe Ile Gly Ile Gly Pro Ser Glu Tyr Glu Ala Ala Leu Pro Gln 130 135 140 Ala Thr Ala Ser Ala Glu Ile Asp Ala His Gly Gly Leu Gly Thr Met 145 150 155 160 Pro Ser Val Gly Ala Gly Arg Ile Ser Tyr Ala Leu Gly Leu Arg Gly 165 170 175 Pro Cys Val Ala Val Asp Thr Ala Tyr Ser Ser Ser Leu Val Ala Val 180 185 190 His Leu Ala Cys Gln Ser Leu Arg Ser Gly Glu Cys Ser Thr Ala Leu 195 200 205 Ala Gly Gly Val Ser Leu Met Leu Ser Pro Ser Thr Leu Val Trp Leu 210 215 220 Ser Lys Thr Arg Ala Leu Ala Arg Asp Gly Arg Cys Lys Ala Phe Ser 225 230 235 240 Ala Glu Ala Asp Gly Phe Gly Arg Gly Glu Gly Cys Ala Val Val Val 245 250 255 Leu Lys Arg Leu Ser Gly Ala Arg Ala Asp Gly Asp Arg Ile Leu Ala 260 265 270 Val Ile Arg Gly Ser Ala Ile Asn His Asp Gly Ala Ser Ser Gly Leu 275 280 285 Thr Val Pro Asn Gly Ser Ser Gln Glu Ile Val Leu Lys Arg Ala Leu 290 295 300 Ala Asp Ala Gly Cys Ala Ala Ser Ser Val Gly Tyr Val Glu Ala His 305 310 315 320 Gly Thr Gly Thr Thr Leu Gly Asp Pro Ile Glu Ile Gln Ala Leu Asn 325 330 335 Ala Val Tyr Gly Leu Gly Arg Asp Val Ala Thr Pro Leu Leu Ile Gly 340 345 350 Ser Val Lys Thr Asn Leu Gly His Pro Glu Tyr Ala Ser Gly Ile Thr 355 360 365 Gly Leu Leu Lys Val Val Leu Ser Leu Gln His Gly Gln Ile Pro Ala 370 375 380 His Leu His Ala Gln Ala Leu Asn Pro Arg Ile Ser Trp Gly Asp Leu 385 390 395 400 Arg Leu Thr Val Thr Arg Ala Arg Thr Pro Trp Pro Asp Trp Asn Thr 405 410 415 Pro Arg Arg Ala Gly Val Ser Ser Phe Gly Met Ser Gly Thr Asn Ala 420 425 430 His Val Val Leu Glu Glu Ala Pro Ala Ala Thr Cys Thr Pro Pro Ala 435 440 445 Pro Glu Arg Pro Ala Glu Leu Leu Val Leu Ser Ala Arg Thr Ala Ser 450 455 460 Ala Leu Asp Ala Gln Ala Ala Arg Leu Arg Asp His Leu Glu Thr Tyr 465 470 475 480 Pro Ser Gln Cys Leu Gly Asp Val Ala Phe Ser Leu Ala Thr Thr Arg 485 490 495 Ser Ala Met Glu His Arg Leu Ala Val Ala Ala Thr Ser Arg Glu Gly 500 505 510 Leu Arg Ala Ala Leu Asp Ala Ala Ala Gln Gly Gln Thr Ser Pro Gly 515 520 525 Ala Val Arg Ser Ile Ala Asp Ser Ser Arg Gly Lys Leu Ala Phe Leu 530 535 540 Phe Thr Gly Gln Gly Ala Gln Thr Leu Gly Met Gly Arg Gly Leu Tyr 545 550 555 560 Asp Val Trp Ser Ala Phe Arg Glu Ala Phe Asp Leu Cys Val Arg Leu 565 570 575 Phe Asn Gln Glu Leu Asp Arg Pro Leu Arg Glu Val Met Trp Ala Glu 580 585 590 Pro Ala Ser Val Asp Ala Ala Leu Leu Asp Gln Thr Ala Phe Thr Gln 595 600 605 Pro Ala Leu Phe Thr Phe Glu Tyr Ala Leu Ala Ala Leu Trp Arg Ser 610 615 620 Trp Gly Val Glu Pro Glu Leu Val Ala Gly His Ser Ile Gly Glu Leu 625 630 635 640 Val Ala Ala Cys Val Ala Gly Val Phe Ser Leu Glu Asp Ala Val Phe 645 650 655 Leu Val Ala Ala Arg Gly Arg Leu Met Gln Ala Leu Pro Ala Gly Gly 660 665 670 Ala Met Val Ser Ile Glu Ala Pro Glu Ala Asp Val Ala Ala Ala Val 675 680 685 Ala Pro His Ala Ala Ser Val Ser Ile Ala Ala Val Asn Ala Pro Asp 690 695 700 Gln Val Val Ile Ala Gly Ala Gly Gln Pro Val His Ala Ile Ala Ala 705 710 715 720 Ala Met Ala Ala Arg Gly Ala Arg Thr Lys Ala Leu His Val Ser His 725 730 735 Ala Phe His Ser Pro Leu Met Ala Pro Met Leu Glu Ala Phe Gly Arg 740 745 750 Val Ala Glu Ser Val Ser Tyr Arg Arg Pro Ser Ile Val Leu Val Ser 755 760 765 Asn Leu Ser Gly Lys Ala Cys Thr Asp Glu Val Ser Ser Pro Gly Tyr 770 775 780 Trp Val Arg His Ala Arg Glu Val Val Arg Phe Ala Asp Gly Val Lys 785 790 795 800 Ala Leu His Ala Ala Gly Ala Gly Thr Phe Val Glu Val Gly Pro Lys 805 810 815 Ser Thr Leu Leu Gly Leu Val Pro Ala Cys Met Pro Asp Ala Arg Pro 820 825 830 Ala Leu Leu Ala Ser Ser Arg Ala Gly Arg Asp Glu Pro Ala Thr Val 835 840 845 Leu Glu Ala Leu Gly Gly Leu Trp Ala Val Gly Gly Leu Val Ser Trp 850 855 860 Ala Gly Leu Phe Pro Ser Gly Gly Arg Arg Val Pro Leu Pro Thr Tyr 865 870 875 880 Pro Trp Gln Arg Glu Arg Tyr Trp Ile Asp Thr Lys Ala Asp Asp Ala 885 890 895 Ala Arg Gly Asp Arg Arg Ala Pro Gly Ala Gly His Asp Glu Val Glu 900 905 910 Glu Gly Gly Ala Val Arg Gly Gly Asp Arg Arg Ser Ala Arg Leu Asp 915 920 925 His Pro Pro Pro Glu Ser Gly Arg Arg Glu Lys Val Glu Ala Ala Gly 930 935 940 Asp Arg Pro Phe Arg Leu Glu Ile Asp Glu Pro Gly Val Leu Asp His 945 950 955 960 Leu Val Leu Arg Val Thr Glu Arg Arg Ala Pro Gly Leu Gly Glu Val 965 970 975 Glu Ile Ala Val Asp Ala Ala Gly Leu Ser Phe Asn Asp Val Gln Leu 980 985 990 Ala Leu Gly Met Val Pro Asp Asp Leu Pro Gly Lys Pro Asn Pro Pro 995 1000 1005 Leu Leu Leu Gly Gly Glu Cys Ala Gly Arg Ile Val Ala Val Gly Glu 1010 1015 1020 Gly Val Asn Gly Leu Val Val Gly Gln Pro Val Ile Ala Leu Ser Ala 1025 1030 1035 1040 Gly Ala Phe Ala Thr His Val Thr Thr Ser Ala Ala Leu Val Leu Pro 1045 1050 1055 Arg Pro Gln Ala Leu Ser Ala Ile Glu Ala Ala Ala Met Pro Val Ala 1060 1065 1070 Tyr Leu Thr Ala Trp Tyr Ala Leu Asp Arg Ile Ala Arg Leu Gln Pro 1075 1080 1085 Gly Glu Arg Val Leu Ile His Ala Ala Thr Gly Gly Val Gly Leu Ala 1090 1095 1100 Ala Val Gln Trp Ala Gln His Val Gly Ala Glu Val His Ala Thr Ala 1105 1110 1115 1120 Gly Thr Pro Glu Lys Arg Ala Tyr Leu Glu Ser Leu Gly Val Arg Tyr 1125 1130 1135 Val Ser Asp Ser Arg Ser Asp Arg Phe Val Ala Asp Val Arg Ala Trp 1140 1145 1150 Thr Gly Gly Glu Gly Val Asp Val Val Leu Asn Ser Leu Ser Gly Glu 1155 1160 1165 Leu Ile Asp Lys Ser Phe Asn Leu Leu Arg Ser His Gly Arg Phe Val 1170 1175 1180 Glu Leu Gly Lys Arg Asp Cys Tyr Ala Asp Asn Gln Leu Gly Leu Arg 1185 1190 1195 1200 Pro Phe Leu Arg Asn Leu Ser Phe Ser Leu Val Asp Leu Arg Gly Met 1205 1210 1215 Met Leu Glu Arg Pro Ala Arg Val Arg Ala Leu Leu Glu Glu Leu Leu 1220 1225 1230 Gly Leu Ile Ala Ala Gly Val Phe Thr Pro Pro Pro Ile Ala Thr Leu 1235 1240 1245 Pro Ile Ala Arg Val Ala Asp Ala Phe Arg Ser Met Ala Gln Ala Gln 1250 1255 1260 His Leu Gly Lys Leu Val Leu Thr Leu Gly Asp Pro Glu Val Gln Ile 1265 1270 1275 1280 Arg Ile Pro Thr His Ala Gly Ala Gly Pro Ser Thr Gly Asp Arg Asp 1285 1290 1295 Leu Leu Asp Arg Leu Ala Ser Ala Ala Pro Ala Ala Arg Ala Ala Ala 1300 1305 1310 Leu Glu Ala Phe Leu Arg Thr Gln Val Ser Gln Val Leu Arg Thr Pro 1315 1320 1325 Glu Ile Lys Val Gly Ala Glu Ala Leu Phe Thr Arg Leu Gly Met Asp 1330 1335 1340 Ser Leu Met Ala Val Glu Leu Arg Asn Arg Ile Glu Ala Ser Leu Lys 1345 1350 1355 1360 Leu Lys Leu Ser Thr Thr Phe Leu Ser Thr Ser Pro Asn Ile Ala Leu 1365 1370 1375 Leu Ala Gln Asn Leu Leu Asp Ala Leu Ala Thr Ala Leu Ser Leu Glu 1380 1385 1390 Arg Val Ala Ala Glu Asn Leu Arg Ala Gly Val Gln Asn Asp Phe Val 1395 1400 1405 Ser Ser Gly Ala Asp Gln Asp Trp Glu Ile Ile Ala Leu 1410 1415 1420 <210> 3 <211> 1410 <212> PRT <213> Sorangium cellulosum <400> 3 Met Thr Ile Asn Gln Leu Leu Asn Glu Leu Glu His Gln Gly Ile Lys 1 5 10 15 Leu Ala Ala Asp Gly Glu Arg Leu Gln Ile Gln Ala Pro Lys Asn Ala 20 25 30 Leu Asn Pro Asn Leu Leu Ala Arg Ile Ser Glu His Lys Ser Thr Ile 35 40 45 Leu Thr Met Leu Arg Gln Arg Leu Pro Ala Glu Ser Ile Val Pro Ala 50 55 60 Pro Ala Glu Arg His Ala Pro Phe Pro Leu Thr Asp Ile Gln Glu Ser 65 70 75 80 Tyr Trp Leu Gly Arg Thr Gly Ala Phe Thr Val Pro Ser Gly Ile His 85 90 95 Ala Tyr Arg Glu Tyr Asp Cys Thr Asp Leu Asp Val Pro Arg Leu Ser 100 105 110 Arg Ala Phe Arg Lys Val Val Ala Arg His Asp Met Leu Arg Ala His 115 120 125 Thr Leu Pro Asp Met Met Gln Val Ile Glu Pro Lys Val Asp Ala Asp 130 135 140 Ile Glu Ile Ile Asp Leu Arg Gly Leu Asp Arg Ser Thr Arg Glu Ala 145 150 155 160 Arg Leu Val Ser Leu Arg Asp Ala Met Ser His Arg Ile Tyr Asp Thr 165 170 175 Glu Arg Pro Pro Leu Tyr His Val Val Ala Val Arg Leu Asp Glu Arg 180 185 190 Gln Thr Arg Leu Val Leu Ser Ile Asp Leu Ile Asn Val Asp Leu Gly 195 200 205 Ser Leu Ser Ile Ile Phe Lys Asp Trp Leu Ser Phe Tyr Glu Asp Pro 210 215 220 Glu Thr Ser Leu Pro Val Leu Glu Leu Ser Tyr Arg Asp Tyr Val Leu 225 230 235 240 Ala Leu Glu Ser Arg Lys Lys Ser Glu Ala His Gln Arg Ser Met Asp 245 250 255 Tyr Trp Lys Arg Arg Ile Ala Glu Leu Pro Pro Pro Pro Thr Leu Pro 260 265 270 Met Lys Ala Asp Pro Ser Thr Leu Lys Glu Ile Arg Phe Arg His Thr 275 280 285 Glu Gln Trp Leu Pro Ser Asp Ser Trp Gly Arg Leu Lys Arg Arg Val 290 295 300 Gly Glu Arg Gly Leu Thr Pro Thr Gly Val Ile Leu Ala Ala Phe Ser 305 310 315 320 Glu Val Ile Gly Arg Trp Ser Ala Ser Pro Arg Phe Thr Leu Asn Ile 325 330 335 Thr Leu Phe Asn Arg Leu Pro Val His Pro Arg Val Asn Asp Ile Thr 340 345 350 Gly Asp Phe Thr Ser Met Val Leu Leu Asp Ile Asp Thr Thr Arg Asp 355 360 365 Lys Ser Phe Glu Gln Arg Ala Lys Arg Ile Gln Glu Gln Leu Trp Glu 370 375 380 Ala Met Asp His Cys Asp Val Ser Gly Ile Glu Val Gln Arg Glu Ala 385 390 395 400 Ala Arg Val Leu Gly Ile Gln Arg Gly Ala Leu Phe Pro Val Val Leu 405 410 415 Thr Ser Ala Leu Asn Gln Gln Val Val Gly Val Thr Ser Leu Gln Arg 420 425 430 Leu Gly Thr Pro Val Tyr Thr Ser Thr Gln Thr Pro Gln Leu Leu Leu 435 440 445 Asp His Gln Leu Tyr Glu His Asp Gly Asp Leu Val Leu Ala Trp Asp 450 455 460 Ile Val Asp Gly Val Phe Pro Pro Asp Leu Leu Asp Asp Met Leu Glu 465 470 475 480 Ala Tyr Val Val Phe Leu Arg Arg Leu Thr Glu Glu Pro Trp Gly Glu 485 490 495 Gln Val Arg Cys Ser Leu Pro Pro Ala Gln Leu Glu Ala Arg Ala Ser 500 505 510 Ala Asn Ala Thr Asn Ala Leu Leu Ser Glu His Thr Leu His Gly Leu 515 520 525 Phe Ala Ala Arg Val Glu Gln Leu Pro Met Gln Leu Ala Val Val Ser 530 535 540 Ala Arg Lys Thr Leu Thr Tyr Glu Glu Leu Ser Arg Arg Ser Arg Arg 545 550 555 560 Leu Gly Ala Arg Leu Arg Glu Gln Gly Ala Arg Pro Asn Thr Leu Val 565 570 575 Ala Val Val Met Glu Lys Gly Trp Glu Gln Val Val Ala Val Leu Ala 580 585 590 Val Leu Glu Ser Gly Ala Ala Tyr Val Pro Ile Asp Ala Asp Leu Pro 595 600 605 Ala Glu Arg Ile His Tyr Leu Leu Asp His Gly Glu Val Lys Leu Val 610 615 620 Leu Thr Gln Pro Trp Leu Asp Gly Lys Leu Ser Trp Pro Pro Gly Ile 625 630 635 640 Gln Arg Leu Leu Val Ser Glu Ala Gly Val Glu Gly Asp Gly Asp Gln 645 650 655 Pro Pro Met Met Pro Ile Gln Thr Pro Ser Asp Leu Ala Tyr Val Ile 660 665 670 Tyr Thr Ser Gly Ser Thr Gly Leu Pro Lys Gly Val Met Ile Asp His 675 680 685 Arg Gly Ala Val Asn Thr Ile Leu Asp Ile Asn Glu Arg Phe Glu Ile 690 695 700 Gly Pro Gly Asp Arg Val Leu Ala Leu Ser Ser Leu Ser Phe Asp Leu 705 710 715 720 Ser Val Tyr Asp Val Phe Gly Ile Leu Ala Ala Gly Gly Thr Ile Val 725 730 735 Val Pro Asp Ala Ser Lys Leu Arg Asp Pro Ala His Trp Ala Glu Leu 740 745 750 Ile Glu Arg Glu Lys Val Thr Val Trp Asn Ser Val Pro Ala Leu Met 755 760 765 Arg Met Leu Val Glu His Phe Glu Gly Arg Pro Asp Ser Leu Ala Arg 770 775 780 Ser Leu Arg Leu Ser Leu Leu Ser Gly Asp Trp Ile Pro Val Gly Leu 785 790 795 800 Pro Gly Glu Leu Gln Ala Ile Arg Pro Gly Val Ser Val Ile Ser Leu 805 810 815 Gly Gly Ala Thr Glu Ala Ser Ile Trp Ser Ile Gly Tyr Pro Val Arg 820 825 830 Asn Val Asp Leu Ser Trp Ala Ser Ile Pro Tyr Gly Arg Pro Leu Arg 835 840 845 Asn Gln Thr Phe His Val Leu Asp Glu Ala Leu Glu Pro Arg Pro Val 850 855 860 Trp Val Pro Gly Gln Leu Tyr Ile Gly Gly Val Gly Leu Ala Leu Gly 865 870 875 880 Tyr Trp Arg Asp Glu Glu Lys Thr Arg Lys Ser Phe Leu Val His Pro 885 890 895 Glu Thr Gly Glu Arg Leu Tyr Lys Thr Gly Asp Leu Gly Arg Tyr Leu 900 905 910 Pro Asp Gly Asn Ile Glu Phe Met Gly Arg Glu Asp Asn Gln Ile Lys 915 920 925 Leu Arg Gly Tyr Arg Val Glu Leu Gly Glu Ile Glu Glu Thr Leu Lys 930 935 940 Ser His Pro Asn Val Arg Asp Ala Val Ile Val Pro Val Gly Asn Asp 945 950 955 960 Ala Ala Asn Lys Leu Leu Leu Ala Tyr Val Val Pro Glu Gly Thr Arg 965 970 975 Arg Arg Ala Ala Glu Gln Asp Ala Ser Leu Lys Thr Glu Arg Ile Asp 980 985 990 Ala Arg Ala His Ala Ala Glu Ala Asp Gly Leu Ser Asp Gly Glu Arg 995 1000 1005 Val Gln Phe Lys Leu Ala Arg His Gly Leu Arg Arg Asp Leu Asp Gly 1010 1015 1020 Lys Pro Val Val Asp Leu Thr Gly Gln Asp Pro Arg Glu Ala Gly Leu 1025 1030 1035 1040 Asp Val Tyr Ala Arg Arg Arg Ser Val Arg Thr Phe Leu Glu Ala Pro 1045 1050 1055 Ile Pro Phe Val Glu Phe Gly Arg Phe Leu Ser Cys Leu Ser Ser Val 1060 1065 1070 Glu Pro Asp Gly Ala Thr Leu Pro Lys Phe Arg Tyr Pro Ser Ala Gly 1075 1080 1085 Ser Thr Tyr Pro Val Gln Thr Tyr Ala Tyr Val Lys Ser Gly Arg Ile 1090 1095 1100 Glu Gly Val Asp Glu Gly Phe Tyr Tyr Tyr His Pro Phe Glu His Arg 1105 1110 1115 1120 Leu Leu Lys Leu Ser Asp His Gly Ile Glu Arg Gly Ala His Val Arg 1125 1130 1135 Gln Asn Phe Asp Val Phe Asp Glu Ala Ala Phe Asn Leu Leu Phe Val 1140 1145 1150 Gly Arg Ile Asp Ala Ile Glu Ser Leu Tyr Gly Ser Ser Ser Arg Glu 1155 1160 1165 Phe Cys Leu Leu Glu Ala Gly Tyr Met Ala Gln Leu Leu Met Glu Gln 1170 1175 1180 Ala Pro Ser Cys Asn Ile Gly Val Cys Pro Val Gly Gln Phe Asn Phe 1185 1190 1195 1200 Glu Gln Val Arg Pro Val Leu Asp Leu Arg His Ser Asp Val Tyr Val 1205 1210 1215 His Gly Met Leu Gly Gly Arg Val Asp Pro Arg Gln Phe Gln Val Cys 1220 1225 1230 Thr Leu Gly Gln Asp Ser Ser Pro Arg Arg Ala Thr Thr Arg Gly Ala 1235 1240 1245 Pro Pro Gly Arg Glu Gln His Phe Ala Asp Met Leu Arg Asp Phe Leu 1250 1255 1260 Arg Thr Lys Leu Pro Glu Tyr Met Val Pro Thr Val Phe Val Glu Leu 1265 1270 1275 1280 Asp Ala Leu Pro Leu Thr Ser Asn Gly Lys Val Asp Arg Lys Ala Leu 1285 1290 1295 Arg Glu Arg Lys Asp Thr Ser Ser Pro Arg His Ser Gly His Thr Ala 1300 1305 1310 Pro Arg Asp Ala Leu Glu Glu Ile Leu Val Ala Val Val Arg Glu Val 1315 1320 1325 Leu Gly Leu Glu Val Val Gly Leu Gln Gln Ser Phe Val Asp Leu Gly 1330 1335 1340 Ala Thr Ser Ile His Ile Val Arg Met Arg Ser Leu Leu Gln Lys Arg 1345 1350 1355 1360 Leu Asp Arg Glu Ile Ala Ile Thr Glu Leu Phe Gln Tyr Pro Asn Leu 1365 1370 1375 Gly Ser Leu Ala Ser Gly Leu Arg Arg Asp Ser Arg Asp Leu Asp Gln 1380 1385 1390 Arg Pro Asn Met Gln Asp Arg Val Glu Val Arg Arg Lys Gly Arg Arg 1395 1400 1405 Arg Ser 1410 <210> 4 <211> 1832 <212> PRT <213> Sorangium cellulosum <400> 4 Met Glu Glu Gln Glu Ser Ser Ala Ile Ala Val Ile Gly Met Ser Gly 1 5 10 15 Arg Phe Pro Gly Ala Arg Asp Leu Asp Glu Phe Trp Arg Asn Leu Arg 20 25 30 Asp Gly Thr Glu Ala Val Gln Arg Phe Ser Glu Gln Glu Leu Ala Ala 35 40 45 Ser Gly Val Asp Pro Ala Leu Val Leu Asp Pro Ser Tyr Val Arg Ala 50 55 60 Gly Ser Val Leu Glu Asp Val Asp Arg Phe Asp Ala Ala Phe Phe Gly 65 70 75 80 Ile Ser Pro Arg Glu Ala Glu Leu Met Asp Pro Gln His Arg Ile Phe 85 90 95 Met Glu Cys Ala Trp Glu Ala Leu Glu Asn Ala Gly Tyr Asp Pro Thr 100 105 110 Ala Tyr Glu Gly Ser Ile Gly Val Tyr Ala Gly Ala Asn Met Ser Ser 115 120 125 Tyr Leu Thr Ser Asn Leu His Glu His Pro Ala Met Met Arg Trp Pro 130 135 140 Gly Trp Phe Gln Thr Leu Ile Gly Asn Asp Lys Asp Tyr Leu Ala Thr 145 150 155 160 His Val Ser Tyr Arg Leu Asn Leu Arg Gly Pro Ser Ile Ser Val Gln 165 170 175 Thr Ala Cys Ser Thr Ser Leu Val Ala Val His Leu Ala Cys Met Ser 180 185 190 Leu Leu Asp Arg Glu Cys Asp Met Ala Leu Ala Gly Gly Ile Thr Val 195 200 205 Arg Ile Pro His Arg Ala Gly Tyr Val Tyr Ala Glu Gly Gly Ile Phe 210 215 220 Ser Pro Asp Gly His Cys Arg Ala Phe Asp Ala Lys Ala Asn Gly Thr 225 230 235 240 Ile Met Gly Asn Gly Cys Gly Val Val Leu Leu Lys Pro Leu Asp Arg 245 250 255 Ala Leu Ser Asp Gly Asp Pro Val Arg Ala Val Ile Leu Gly Ser Ala 260 265 270 Thr Asn Asn Asp Gly Ala Arg Lys Ile Gly Phe Thr Ala Pro Ser Glu 275 280 285 Val Gly Gln Ala Gln Ala Ile Met Glu Ala Leu Ala Leu Ala Gly Val 290 295 300 Glu Ala Arg Ser Ile Gln Tyr Ile Glu Thr His Gly Thr Gly Thr Leu 305 310 315 320 Leu Gly Asp Ala Ile Glu Thr Ala Ala Leu Arg Arg Val Phe Gly Arg 325 330 335 Asp Ala Ser Ala Arg Arg Ser Cys Ala Ile Gly Ser Val Lys Thr Gly 340 345 350 Ile Gly His Leu Glu Ser Ala Ala Gly Ile Ala Gly Leu Ile Lys Thr 355 360 365 Val Leu Ala Leu Glu His Arg Gln Leu Pro Pro Ser Leu Asn Phe Glu 370 375 380 Ser Pro Asn Pro Ser Ile Asp Phe Ala Ser Ser Pro Phe Tyr Val Asn 385 390 395 400 Thr Ser Leu Lys Asp Trp Asn Thr Gly Ser Thr Pro Arg Arg Ala Gly 405 410 415 Val Ser Ser Phe Gly Ile Gly Gly Thr Asn Ala His Val Val Leu Glu 420 425 430 Glu Ala Pro Ala Ala Lys Leu Pro Ala Ala Ala Pro Ala Arg Ser Ala 435 440 445 Glu Leu Phe Val Val Ser Ala Lys Ser Ala Ala Ala Leu Asp Ala Ala 450 455 460 Ala Ala Arg Leu Arg Asp His Leu Gln Ala His Gln Gly Ile Ser Leu 465 470 475 480 Gly Asp Val Ala Phe Ser Leu Ala Thr Thr Arg Ser Pro Met Glu His 485 490 495 Arg Leu Ala Met Ala Ala Pro Ser Arg Glu Ala Leu Arg Glu Gly Leu 500 505 510 Asp Ala Ala Ala Arg Gly Gln Thr Pro Pro Gly Ala Val Arg Gly Arg 515 520 525 Cys Ser Pro Gly Asn Val Pro Lys Val Val Phe Val Phe Pro Gly Gln 530 535 540 Gly Ser Gln Trp Val Gly Met Gly Arg Gln Leu Leu Ala Glu Glu Pro 545 550 555 560 Val Phe His Ala Ala Leu Ser Ala Cys Asp Arg Ala Ile Gln Ala Glu 565 570 575 Ala Gly Trp Ser Leu Leu Ala Glu Leu Ala Ala Asp Glu Gly Ser Ser 580 585 590 Gln Leu Glu Arg Ile Asp Val Val Gln Pro Val Leu Phe Ala Leu Ala 595 600 605 Val Ala Phe Ala Ala Leu Trp Arg Ser Trp Gly Val Ala Pro Asp Val 610 615 620 Val Ile Gly His Ser Met Gly Glu Val Ala Ala Ala His Val Ala Gly 625 630 635 640 Ala Leu Ser Leu Glu Asp Ala Val Ala Ile Ile Cys Arg Arg Ser Arg 645 650 655 Leu Leu Arg Arg Ile Ser Gly Gln Gly Glu Met Ala Val Thr Glu Leu 660 665 670 Ser Leu Ala Glu Ala Glu Ala Ala Leu Arg Gly Tyr Glu Asp Arg Val 675 680 685 Ser Val Ala Val Ser Asn Ser Pro Arg Ser Thr Val Leu Ser Gly Glu 690 695 700 Pro Ala Ala Ile Gly Glu Val Leu Ser Ser Leu Asn Ala Lys Gly Val 705 710 715 720 Phe Cys Arg Arg Val Lys Val Asp Val Ala Ser His Ser Pro Gln Val 725 730 735 Asp Pro Leu Arg Glu Asp Leu Leu Ala Ala Leu Gly Gly Leu Arg Pro 740 745 750 Gly Ala Ala Ala Val Pro Met Arg Ser Thr Val Thr Gly Ala Met Val 755 760 765 Ala Gly Pro Glu Leu Gly Ala Asn Tyr Trp Met Asn Asn Leu Arg Gln 770 775 780 Pro Val Arg Phe Ala Glu Val Val Gln Ala Gln Leu Gln Gly Gly His 785 790 795 800 Gly Leu Phe Val Glu Met Ser Pro His Pro Ile Leu Thr Thr Ser Val 805 810 815 Glu Glu Met Arg Arg Ala Ala Gln Arg Ala Gly Ala Ala Val Gly Ser 820 825 830 Leu Arg Arg Gly Gln Asp Glu Arg Pro Ala Met Leu Glu Ala Leu Gly 835 840 845 Thr Leu Trp Ala Gln Gly Tyr Pro Val Pro Trp Gly Arg Leu Phe Pro 850 855 860 Ala Gly Gly Arg Arg Val Pro Leu Pro Thr Tyr Pro Trp Gln Arg Glu 865 870 875 880 Arg Tyr Trp Ile Glu Ala Pro Ala Lys Ser Ala Ala Gly Asp Arg Arg 885 890 895 Gly Val Arg Ala Gly Gly His Pro Leu Leu Gly Glu Met Gln Thr Leu 900 905 910 Ser Thr Gln Thr Ser Thr Arg Leu Trp Glu Thr Thr Leu Asp Leu Lys 915 920 925 Arg Leu Pro Trp Leu Gly Asp His Arg Val Gln Gly Ala Val Val Phe 930 935 940 Pro Gly Ala Ala Tyr Leu Glu Met Ala Ile Ser Ser Gly Ala Glu Ala 945 950 955 960 Leu Gly Asp Gly Pro Leu Gln Ile Thr Asp Val Val Leu Ala Glu Ala 965 970 975 Leu Ala Phe Ala Gly Asp Ala Ala Val Leu Val Gln Val Val Thr Thr 980 985 990 Glu Gln Pro Ser Gly Arg Leu Gln Phe Gln Ile Ala Ser Arg Ala Pro 995 1000 1005 Gly Ala Gly His Ala Ser Phe Arg Val His Ala Arg Gly Ala Leu Leu 1010 1015 1020 Arg Val Glu Arg Thr Glu Val Pro Ala Gly Leu Thr Leu Ser Ala Val 1025 1030 1035 1040 Arg Ala Arg Leu Gln Ala Ser Ile Pro Ala Ala Ala Thr Tyr Ala Glu 1045 1050 1055 Leu Thr Glu Met Gly Leu Gln Tyr Gly Pro Ala Phe Gln Gly Ile Ala 1060 1065 1070 Glu Leu Trp Arg Gly Glu Gly Glu Ala Leu Gly Arg Val Arg Leu Pro 1075 1080 1085 Asp Ala Ala Gly Ser Ala Ala Glu Tyr Arg Leu His Pro Ala Leu Leu 1090 1095 1100 Asp Ala Cys Phe Gln Ile Val Gly Ser Leu Phe Ala Arg Ser Gly Glu 1105 1110 1115 1120 Ala Thr Pro Trp Val Pro Val Glu Leu Gly Ser Leu Arg Leu Leu Gln 1125 1130 1135 Arg Pro Ser Gly Glu Leu Trp Cys His Ala Arg Val Val Asn His Gly 1140 1145 1150 His Gln Thr Pro Asp Arg Gln Gly Ala Asp Phe Trp Val Val Asp Ser 1155 1160 1165 Ser Gly Ala Val Val Ala Glu Val Cys Gly Leu Val Ala Gln Arg Leu 1170 1175 1180 Pro Gly Gly Val Arg Arg Arg Glu Glu Asp Asp Trp Phe Leu Glu Leu 1185 1190 1195 1200 Glu Trp Glu Pro Ala Ala Val Gly Thr Ala Lys Val Asn Ala Gly Arg 1205 1210 1215 Trp Leu Leu Leu Gly Gly Gly Gly Gly Leu Gly Ala Ala Leu Arg Ala 1220 1225 1230 Met Leu Glu Ala Gly Gly His Ala Val Val His Ala Ala Glu Asn Asn 1235 1240 1245 Thr Ser Ala Ala Gly Val Arg Ala Leu Leu Ala Lys Ala Phe Asp Gly 1250 1255 1260 Gln Ala Pro Thr Ala Val Val His Leu Gly Ser Leu Asp Gly Gly Gly 1265 1270 1275 1280 Glu Leu Asp Pro Gly Leu Gly Ala Gln Gly Ala Leu Asp Ala Pro Arg 1285 1290 1295 Ser Ala Asp Val Ser Pro Asp Ala Leu Asp Pro Ala Leu Val Arg Gly 1300 1305 1310 Cys Asp Ser Val Leu Trp Thr Val Gln Ala Leu Ala Gly Met Gly Phe 1315 1320 1325 Arg Asp Ala Pro Arg Leu Trp Leu Leu Thr Arg Gly Ala Gln Ala Val 1330 1335 1340 Gly Ala Gly Asp Val Ser Val Thr Gln Ala Pro Leu Leu Gly Leu Gly 1345 1350 1355 1360 Arg Val Ile Ala Met Glu His Ala Asp Leu Arg Cys Ala Arg Val Asp 1365 1370 1375 Leu Asp Pro Ala Arg Pro Glu Gly Glu Leu Ala Ala Leu Leu Ala Glu 1380 1385 1390 Leu Leu Ala Asp Asp Ala Glu Ala Glu Val Ala Leu Arg Gly Gly Glu 1395 1400 1405 Arg Cys Val Ala Arg Ile Val Arg Arg Gln Pro Glu Thr Arg Pro Arg 1410 1415 1420 Gly Arg Ile Glu Ser Cys Val Pro Thr Asp Val Thr Ile Arg Ala Asp 1425 1430 1435 1440 Ser Thr Tyr Leu Val Thr Gly Gly Leu Gly Gly Leu Gly Leu Ser Val 1445 1450 1455 Ala Gly Trp Leu Ala Glu Arg Gly Ala Gly His Leu Val Leu Val Gly 1460 1465 1470 Arg Ser Gly Ala Ala Ser Val Glu Gln Arg Ala Ala Val Ala Ala Leu 1475 1480 1485 Glu Ala Arg Gly Ala Arg Val Thr Val Ala Lys Ala Asp Val Ala Asp 1490 1495 1500 Arg Ala Gln Leu Glu Arg Ile Leu Arg Glu Val Thr Thr Ser Gly Met 1505 1510 1515 1520 Pro Leu Arg Gly Val Val His Ala Ala Gly Ile Leu Asp Asp Gly Leu 1525 1530 1535 Leu Met Gln Gln Thr Pro Ala Arg Phe Arg Lys Val Met Ala Pro Lys 1540 1545 1550 Val Gln Gly Ala Leu His Leu His Ala Leu Thr Arg Glu Ala Pro Leu 1555 1560 1565 Ser Phe Phe Val Leu Tyr Ala Ser Gly Val Gly Leu Leu Gly Ser Pro 1570 1575 1580 Gly Gln Gly Asn Tyr Ala Ala Ala Asn Thr Phe Leu Asp Ala Leu Ala 1585 1590 1595 1600 His His Arg Arg Ala Gln Gly Leu Pro Ala Leu Ser Val Asp Trp Gly 1605 1610 1615 Leu Phe Ala Glu Val Gly Met Ala Ala Ala Gln Glu Asp Arg Gly Ala 1620 1625 1630 Arg Leu Val Ser Arg Gly Met Arg Ser Leu Thr Pro Asp Glu Gly Leu 1635 1640 1645 Ser Ala Leu Ala Arg Leu Leu Glu Ser Gly Arg Ala Gln Val Gly Val 1650 1655 1660 Met Pro Val Asn Pro Arg Leu Trp Val Glu Leu Tyr Pro Ala Ala Ala 1665 1670 1675 1680 Ser Ser Arg Met Leu Ser Arg Leu Val Thr Ala His Arg Ala Ser Ala 1685 1690 1695 Gly Gly Pro Ala Gly Asp Gly Asp Leu Leu Arg Arg Leu Ala Ala Ala 1700 1705 1710 Glu Pro Ser Ala Arg Ser Ala Leu Leu Glu Pro Leu Leu Arg Ala Gln 1715 1720 1725 Ile Ser Gln Val Leu Arg Leu Pro Glu Gly Lys Ile Glu Val Asp Ala 1730 1735 1740 Pro Leu Thr Ser Leu Gly Met Asn Ser Leu Met Gly Leu Glu Leu Arg 1745 1750 1755 1760 Asn Arg Ile Glu Ala Met Leu Gly Ile Thr Val Pro Ala Thr Leu Leu 1765 1770 1775 Trp Thr Tyr Pro Thr Val Ala Ala Leu Ser Gly His Leu Ala Arg Glu 1780 1785 1790 Ala Cys Glu Ala Ala Pro Val Glu Ser Pro His Thr Thr Ala Asp Ser 1795 1800 1805 Ala Val Glu Ile Glu Glu Met Ser Gln Asp Asp Leu Thr Gln Leu Ile 1810 1815 1820 Ala Ala Lys Phe Lys Ala Leu Thr 1825 1830 <210> 5 <211> 7257 <212> PRT <213> Sorangium cellulosum <400> 5 Met Thr Thr Arg Gly Pro Thr Ala Gln Gln Asn Pro Leu Lys Gln Ala 1 5 10 15 Ala Ile Ile Ile Gln Arg Leu Glu Glu Arg Leu Ala Gly Leu Ala Gln 20 25 30 Ala Glu Leu Glu Arg Thr Glu Pro Ile Ala Ile Val Gly Ile Gly Cys 35 40 45 Arg Phe Pro Gly Gly Ala Asp Ala Pro Glu Ala Phe Trp Glu Leu Leu 50 55 60 Asp Ala Glu Arg Asp Ala Val Gln Pro Leu Asp Met Arg Trp Ala Leu 65 70 75 80 Val Gly Val Ala Pro Val Glu Ala Val Pro His Trp Ala Gly Leu Leu 85 90 95 Thr Glu Pro Ile Asp Cys Phe Asp Ala Ala Phe Phe Gly Ile Ser Pro 100 105 110 Arg Glu Ala Arg Ser Leu Asp Pro Gln His Arg Leu Leu Leu Glu Val 115 120 125 Ala Trp Glu Gly Leu Glu Asp Ala Gly Ile Pro Pro Arg Ser Ile Asp 130 135 140 Gly Ser Arg Thr Gly Val Phe Val Gly Ala Phe Thr Ala Asp Tyr Ala 145 150 155 160 Arg Thr Val Ala Arg Leu Pro Arg Glu Glu Arg Asp Ala Tyr Ser Ala 165 170 175 Thr Gly Asn Met Leu Ser Ile Ala Ala Gly Arg Leu Ser Tyr Thr Leu 180 185 190 Gly Leu Gln Gly Pro Cys Leu Thr Val Asp Thr Ala Cys Ser Ser Ser 195 200 205 Leu Val Ala Ile His Leu Ala Cys Arg Ser Leu Arg Ala Gly Glu Ser 210 215 220 Asp Leu Ala Leu Ala Gly Gly Val Ser Ala Leu Leu Ser Pro Asp Met 225 230 235 240 Met Glu Ala Ala Ala Arg Thr Gln Ala Leu Ser Pro Asp Gly Arg Cys 245 250 255 Arg Thr Phe Asp Ala Ser Ala Asn Gly Phe Val Arg Gly Glu Gly Cys 260 265 270 Gly Leu Val Val Leu Lys Arg Leu Ser Asp Ala Gln Arg Asp Gly Asp 275 280 285 Arg Ile Trp Ala Leu Ile Arg Gly Ser Ala Ile Asn His Asp Gly Arg 290 295 300 Ser Thr Gly Leu Thr Ala Pro Asn Val Leu Ala Gln Glu Thr Val Leu 305 310 315 320 Arg Glu Ala Leu Arg Ser Ala His Val Glu Ala Gly Ala Val Asp Tyr 325 330 335 Val Glu Thr His Gly Thr Gly Thr Ser Leu Gly Asp Pro Ile Glu Val 340 345 350 Glu Ala Leu Arg Ala Thr Val Gly Pro Ala Arg Ser Asp Gly Thr Arg 355 360 365 Cys Val Leu Gly Ala Val Lys Thr Asn Ile Gly His Leu Glu Ala Ala 370 375 380 Ala Gly Val Ala Gly Leu Ile Lys Ala Ala Leu Ser Leu Thr His Glu 385 390 395 400 Arg Ile Pro Arg Asn Leu Asn Phe Arg Thr Leu Asn Pro Arg Ile Arg 405 410 415 Leu Glu Gly Ser Ala Leu Ala Leu Ala Thr Glu Pro Val Pro Trp Pro 420 425 430 Arg Thr Asp Arg Pro Arg Phe Ala Gly Val Ser Ser Phe Gly Met Ser 435 440 445 Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro Ala Val Glu Leu 450 455 460 Trp Pro Ala Ala Pro Glu Arg Ser Ala Glu Leu Leu Val Leu Ser Gly 465 470 475 480 Lys Ser Glu Gly Ala Leu Asp Ala Gln Ala Ala Arg Leu Arg Glu His 485 490 495 Leu Asp Met His Pro Glu Leu Gly Leu Gly Asp Val Ala Phe Ser Leu 500 505 510 Ala Thr Thr Arg Ser Ala Met Ser His Arg Leu Ala Val Ala Val Thr 515 520 525 Ser Arg Glu Gly Leu Leu Ala Ala Leu Ser Ala Val Ala Gln Gly Gln 530 535 540 Thr Pro Ala Gly Ala Ala Arg Cys Ile Ala Ser Ser Ser Arg Gly Lys 545 550 555 560 Leu Ala Phe Leu Phe Thr Gly Gln Gly Ala Gln Thr Pro Gly Met Gly 565 570 575 Arg Gly Leu Cys Ala Ala Trp Pro Ala Phe Arg Glu Ala Phe Asp Arg 580 585 590 Cys Val Ala Leu Phe Asp Arg Glu Leu Asp Arg Pro Leu Arg Glu Val 595 600 605 Met Trp Ala Glu Ala Gly Ser Ala Glu Ser Leu Leu Leu Asp Gln Thr 610 615 620 Ala Phe Thr Gln Pro Ala Leu Phe Ala Val Glu Tyr Ala Leu Thr Ala 625 630 635 640 Leu Trp Arg Ser Trp Gly Val Glu Pro Glu Leu Leu Val Gly His Ser 645 650 655 Ile Gly Glu Leu Val Ala Ala Cys Val Ala Gly Val Phe Ser Leu Glu 660 665 670 Asp Gly Val Arg Leu Val Ala Ala Arg Gly Arg Leu Met Gln Gly Leu 675 680 685 Ser Ala Gly Gly Ala Met Val Ser Leu Gly Ala Pro Glu Ala Glu Val 690 695 700 Ala Ala Ala Val Ala Pro His Ala Ala Ser Val Ser Ile Ala Ala Val 705 710 715 720 Asn Gly Pro Glu Gln Val Val Ile Ala Gly Val Glu Gln Ala Val Gln 725 730 735 Ala Ile Ala Ala Gly Phe Ala Ala Arg Gly Ala Arg Thr Lys Arg Leu 740 745 750 His Val Ser His Ala Phe His Ser Pro Leu Met Glu Pro Met Leu Glu 755 760 765 Glu Phe Gly Arg Val Ala Ala Ser Val Thr Tyr Arg Arg Pro Ser Val 770 775 780 Ser Leu Val Ser Asn Leu Ser Gly Lys Val Val Thr Asp Glu Leu Ser 785 790 795 800 Ala Pro Gly Tyr Trp Val Arg His Val Arg Glu Ala Val Arg Phe Ala 805 810 815 Asp Gly Val Lys Ala Leu His Glu Ala Gly Ala Gly Thr Phe Val Glu 820 825 830 Val Gly Pro Lys Pro Thr Leu Leu Gly Leu Leu Pro Ala Cys Leu Pro 835 840 845 Glu Ala Glu Pro Thr Leu Leu Ala Ser Leu Arg Ala Gly Arg Glu Glu 850 855 860 Ala Ala Gly Val Leu Glu Ala Leu Gly Arg Leu Trp Ala Ala Gly Gly 865 870 875 880 Ser Val Ser Trp Pro Gly Val Phe Pro Thr Ala Gly Arg Arg Val Pro 885 890 895 Leu Pro Thr Tyr Pro Trp Gln Arg Gln Arg Tyr Trp Ile Glu Ala Pro 900 905 910 Ala Glu Gly Leu Gly Ala Thr Ala Ala Asp Ala Leu Ala Gln Trp Phe 915 920 925 Tyr Arg Val Asp Trp Pro Glu Met Pro Arg Ser Ser Val Asp Ser Arg 930 935 940 Arg Ala Arg Ser Gly Gly Trp Leu Val Leu Ala Asp Arg Gly Gly Val 945 950 955 960 Gly Glu Ala Ala Ala Ala Ala Leu Ser Ser Gln Gly Cys Ser Cys Ala 965 970 975 Val Leu His Ala Pro Ala Glu Ala Ser Ala Val Ala Glu Gln Val Thr 980 985 990 Gln Ala Leu Gly Gly Arg Asn Asp Trp Gln Gly Val Leu Tyr Leu Trp 995 1000 1005 Gly Leu Asp Ala Val Val Glu Ala Gly Ala Ser Ala Glu Glu Val Ala 1010 1015 1020 Lys Val Thr His Leu Ala Ala Ala Pro Val Leu Ala Leu Ile Gln Ala 1025 1030 1035 1040 Leu Gly Thr Gly Pro Arg Ser Pro Arg Leu Trp Ile Val Thr Arg Gly 1045 1050 1055 Ala Cys Thr Val Gly Gly Glu Pro Asp Ala Ala Pro Cys Gln Ala Ala 1060 1065 1070 Leu Trp Gly Met Gly Arg Val Ala Ala Leu Glu His Pro Gly Ser Trp 1075 1080 1085 Gly Gly Leu Val Asp Leu Asp Pro Glu Glu Ser Pro Thr Glu Val Glu 1090 1095 1100 Ala Leu Val Ala Glu Leu Leu Ser Pro Asp Ala Glu Asp Gln Leu Ala 1105 1110 1115 1120 Phe Arg Gln Gly Arg Arg Arg Ala Ala Arg Leu Val Ala Ala Pro Pro 1125 1130 1135 Glu Gly Asn Ala Ala Pro Val Ser Leu Ser Ala Glu Gly Ser Tyr Leu 1140 1145 1150 Val Thr Gly Gly Leu Gly Ala Leu Gly Leu Leu Val Ala Arg Trp Leu 1155 1160 1165 Val Glu Arg Gly Ala Gly His Leu Val Leu Ile Ser Arg His Gly Leu 1170 1175 1180 Pro Asp Arg Glu Glu Trp Gly Arg Asp Gln Pro Pro Glu Val Arg Ala 1185 1190 1195 1200 Arg Ile Ala Ala Ile Glu Ala Leu Glu Ala Gln Gly Ala Arg Val Thr 1205 1210 1215 Val Ala Ala Val Asp Val Ala Asp Ala Glu Gly Met Ala Ala Leu Leu 1220 1225 1230 Ala Ala Val Glu Pro Pro Leu Arg Gly Val Val His Ala Ala Gly Leu 1235 1240 1245 Leu Asp Asp Gly Leu Leu Ala His Gln Asp Ala Gly Arg Leu Ala Arg 1250 1255 1260 Val Leu Arg Pro Lys Val Glu Gly Ala Trp Val Leu His Thr Leu Thr 1265 1270 1275 1280 Arg Glu Gln Pro Leu Asp Leu Phe Val Leu Phe Ser Ser Ala Ser Gly 1285 1290 1295 Val Phe Gly Ser Ile Gly Gln Gly Ser Tyr Ala Ala Gly Asn Ala Phe 1300 1305 1310 Leu Asp Ala Leu Ala Asp Leu Arg Arg Thr Gln Gly Leu Ala Ala Leu 1315 1320 1325 Ser Ile Ala Trp Gly Leu Trp Ala Glu Gly Gly Met Gly Ser Gln Ala 1330 1335 1340 Gln Arg Arg Glu His Glu Ala Ser Gly Ile Trp Ala Met Pro Thr Ser 1345 1350 1355 1360 Arg Ala Leu Ala Ala Met Glu Trp Leu Leu Gly Thr Arg Ala Thr Gln 1365 1370 1375 Arg Val Val Ile Gln Met Asp Trp Ala His Ala Gly Ala Ala Pro Arg 1380 1385 1390 Asp Ala Ser Arg Gly Arg Phe Trp Asp Arg Leu Val Thr Ala Thr Lys 1395 1400 1405 Glu Ala Ser Ser Ser Ala Val Pro Ala Val Glu Arg Trp Arg Asn Ala 1410 1415 1420 Ser Val Val Glu Thr Arg Ser Ala Leu Tyr Glu Leu Val Arg Gly Val 1425 1430 1435 1440 Val Ala Gly Val Met Gly Phe Thr Asp Gln Gly Thr Leu Asp Val Arg 1445 1450 1455 Arg Gly Phe Ala Glu Gln Gly Leu Asp Ser Leu Met Ala Val Glu Ile 1460 1465 1470 Arg Lys Arg Leu Gln Gly Glu Leu Gly Met Pro Leu Ser Ala Thr Leu 1475 1480 1485 Ala Phe Asp His Pro Thr Val Glu Arg Leu Val Glu Tyr Leu Leu Ser 1490 1495 1500 Gln Ala Leu Glu Leu Gln Asp Arg Thr Asp Val Arg Ser Val Arg Leu 1505 1510 1515 1520 Pro Ala Thr Glu Asp Pro Ile Ala Ile Val Gly Ala Ala Cys Arg Phe 1525 1530 1535 Pro Gly Gly Val Glu Asp Leu Glu Ser Tyr Trp Gln Leu Leu Thr Glu 1540 1545 1550 Gly Val Val Val Ser Thr Glu Val Pro Ala Asp Arg Trp Asn Gly Ala 1555 1560 1565 Asp Gly Arg Val Pro Gly Ser Gly Glu Ala Gln Arg Gln Thr Tyr Val 1570 1575 1580 Pro Arg Gly Gly Phe Leu Arg Glu Val Glu Thr Phe Asp Ala Ala Phe 1585 1590 1595 1600 Phe His Ile Ser Pro Arg Glu Ala Met Ser Leu Asp Pro Gln Gln Arg 1605 1610 1615 Leu Leu Leu Glu Val Ser Trp Glu Ala Ile Glu Arg Ala Gly Gln Asp 1620 1625 1630 Pro Ser Ala Leu Arg Glu Ser Pro Thr Gly Val Phe Val Gly Ala Gly 1635 1640 1645 Pro Asn Glu Tyr Ala Glu Arg Val Gln Glu Leu Ala Asp Glu Ala Ala 1650 1655 1660 Gly Leu Tyr Ser Gly Thr Gly Asn Met Leu Ser Val Ala Ala Gly Arg 1665 1670 1675 1680 Leu Ser Phe Phe Leu Gly Leu His Gly Pro Thr Leu Ala Val Asp Thr 1685 1690 1695 Ala Cys Ser Ser Ser Leu Val Ala Leu His Leu Gly Cys Gln Ser Leu 1700 1705 1710 Arg Arg Gly Glu Cys Asp Gln Ala Leu Val Gly Gly Val Asn Met Leu 1715 1720 1725 Leu Ser Pro Lys Thr Phe Ala Leu Leu Ser Arg Met His Ala Leu Ser 1730 1735 1740 Pro Gly Gly Arg Cys Lys Thr Phe Ser Ala Asp Ala Asp Gly Tyr Ala 1745 1750 1755 1760 Arg Ala Glu Gly Cys Ala Val Val Val Leu Lys Arg Leu Ser Asp Ala 1765 1770 1775 Gln Arg Asp Arg Asp Pro Ile Leu Ala Val Ile Arg Gly Thr Ala Ile 1780 1785 1790 Asn His Asp Gly Pro Ser Ser Gly Leu Thr Val Pro Ser Gly Pro Ala 1795 1800 1805 Gln Glu Ala Leu Leu Arg Gln Ala Leu Ala His Ala Gly Val Val Pro 1810 1815 1820 Ala Asp Val Asp Phe Val Glu Cys His Gly Thr Gly Thr Ala Leu Gly 1825 1830 1835 1840 Asp Pro Ile Glu Val Arg Ala Leu Ser Asp Val Tyr Gly Gln Ala Arg 1845 1850 1855 Pro Ala Asp Arg Pro Leu Ile Leu Gly Ala Ala Lys Ala Asn Leu Gly 1860 1865 1870 His Met Glu Pro Ala Ala Gly Leu Ala Gly Leu Leu Lys Ala Val Leu 1875 1880 1885 Ala Leu Gly Gln Glu Gln Ile Pro Ala Gln Pro Glu Leu Gly Glu Leu 1890 1895 1900 Asn Pro Leu Leu Pro Trp Glu Ala Leu Pro Val Ala Val Ala Arg Ala 1905 1910 1915 1920 Ala Val Pro Trp Pro Arg Thr Asp Arg Pro Arg Phe Ala Gly Val Ser 1925 1930 1935 Ser Phe Gly Met Ser Gly Thr Asn Ala His Val Val Leu Glu Glu Ala 1940 1945 1950 Pro Ala Val Glu Leu Trp Pro Ala Ala Pro Glu Arg Ser Ala Glu Leu 1955 1960 1965 Leu Val Leu Ser Gly Lys Ser Glu Gly Ala Leu Asp Ala Gln Ala Ala 1970 1975 1980 Arg Leu Arg Glu His Leu Asp Met His Pro Glu Leu Gly Leu Gly Asp 1985 1990 1995 2000 Val Ala Phe Ser Leu Ala Thr Thr Arg Ser Ala Met Asn His Arg Leu 2005 2010 2015 Ala Val Ala Val Thr Ser Arg Glu Gly Leu Leu Ala Ala Leu Ser Ala 2020 2025 2030 Val Ala Gln Gly Gln Thr Pro Pro Gly Ala Ala Arg Cys Ile Ala Ser 2035 2040 2045 Ser Ser Arg Gly Lys Leu Ala Phe Leu Phe Thr Gly Gln Gly Ala Gln 2050 2055 2060 Thr Pro Gly Met Gly Arg Gly Leu Cys Ala Ala Trp Pro Ala Phe Arg 2065 2070 2075 2080 Glu Ala Phe Asp Arg Cys Val Ala Leu Phe Asp Arg Glu Leu Asp Arg 2085 2090 2095 Pro Leu Arg Glu Val Met Trp Ala Glu Pro Gly Ser Ala Glu Ser Leu 2100 2105 2110 Leu Leu Asp Gln Thr Ala Phe Thr Gln Pro Ala Leu Phe Thr Val Glu 2115 2120 2125 Tyr Ala Leu Thr Ala Leu Trp Arg Ser Trp Gly Val Glu Pro Glu Leu 2130 2135 2140 Val Ala Gly His Ser Ala Gly Glu Leu Val Ala Ala Cys Val Ala Gly 2145 2150 2155 2160 Val Phe Ser Leu Glu Asp Gly Val Arg Leu Val Ala Ala Arg Gly Arg 2165 2170 2175 Leu Met Gln Gly Leu Ser Ala Gly Gly Ala Met Val Ser Leu Gly Ala 2180 2185 2190 Pro Glu Ala Glu Val Ala Ala Ala Val Ala Pro His Ala Ala Ser Val 2195 2200 2205 Ser Ile Ala Ala Val Asn Gly Pro Glu Gln Val Val Ile Ala Gly Val 2210 2215 2220 Glu Gln Ala Val Gln Ala Ile Ala Ala Gly Phe Ala Ala Arg Gly Ala 2225 2230 2235 2240 Arg Thr Lys Arg Leu His Val Ser His Ala Ser His Ser Pro Leu Met 2245 2250 2255 Glu Pro Met Leu Glu Glu Phe Gly Arg Val Ala Ala Ser Val Thr Tyr 2260 2265 2270 Arg Arg Pro Ser Val Ser Leu Val Ser Asn Leu Ser Gly Lys Val Val 2275 2280 2285 Ala Asp Glu Leu Ser Ala Pro Gly Tyr Trp Val Arg His Val Arg Glu 2290 2295 2300 Ala Val Arg Phe Ala Asp Gly Val Lys Ala Leu His Glu Ala Gly Ala 2305 2310 2315 2320 Gly Thr Phe Val Glu Val Gly Pro Lys Pro Thr Leu Leu Gly Leu Leu 2325 2330 2335 Pro Ala Cys Leu Pro Glu Ala Glu Pro Thr Leu Leu Ala Ser Leu Arg 2340 2345 2350 Ala Gly Arg Glu Glu Ala Ala Gly Val Leu Glu Ala Leu Gly Arg Leu 2355 2360 2365 Trp Ala Ala Gly Gly Ser Val Ser Trp Pro Gly Val Phe Pro Thr Ala 2370 2375 2380 Gly Arg Arg Val Pro Leu Pro Thr Tyr Pro Trp Gln Arg Gln Arg Tyr 2385 2390 2395 2400 Trp Pro Asp Ile Glu Pro Asp Ser Arg Arg His Ala Ala Ala Asp Pro 2405 2410 2415 Thr Gln Gly Trp Phe Tyr Arg Val Asp Trp Pro Glu Ile Pro Arg Ser 2420 2425 2430 Leu Gln Lys Ser Glu Glu Ala Ser Arg Gly Ser Trp Leu Val Leu Ala 2435 2440 2445 Asp Lys Gly Gly Val Gly Glu Ala Val Ala Ala Ala Leu Ser Thr Arg 2450 2455 2460 Gly Leu Pro Cys Val Val Leu His Ala Pro Ala Glu Thr Ser Ala Thr 2465 2470 2475 2480 Ala Glu Leu Val Thr Glu Ala Ala Gly Gly Arg Ser Asp Trp Gln Val 2485 2490 2495 Val Leu Tyr Leu Trp Gly Leu Asp Ala Val Val Gly Ala Glu Ala Ser 2500 2505 2510 Ile Asp Glu Ile Gly Asp Ala Thr Arg Arg Ala Thr Ala Pro Val Leu 2515 2520 2525 Gly Leu Ala Arg Phe Leu Ser Thr Val Ser Cys Ser Pro Arg Leu Trp 2530 2535 2540 Val Val Thr Arg Gly Ala Cys Ile Val Gly Asp Glu Pro Ala Ile Ala 2545 2550 2555 2560 Pro Cys Gln Ala Ala Leu Trp Gly Met Gly Arg Val Ala Ala Leu Glu 2565 2570 2575 His Pro Gly Ala Trp Gly Gly Leu Val Asp Leu Asp Pro Arg Ala Ser 2580 2585 2590 Pro Pro Gln Ala Ser Pro Ile Asp Gly Glu Met Leu Val Thr Glu Leu 2595 2600 2605 Leu Ser Gln Glu Thr Glu Asp Gln Leu Ala Phe Arg His Gly Arg Arg 2610 2615 2620 His Ala Ala Arg Leu Val Ala Ala Pro Pro Gln Gly Gln Ala Ala Pro 2625 2630 2635 2640 Val Ser Leu Ser Ala Glu Ala Ser Tyr Leu Val Thr Gly Gly Leu Gly 2645 2650 2655 Gly Leu Gly Leu Ile Val Ala Gln Trp Leu Val Glu Leu Gly Ala Arg 2660 2665 2670 His Leu Val Leu Thr Ser Arg Arg Gly Leu Pro Asp Arg Gln Ala Trp 2675 2680 2685 Cys Glu Gln Gln Pro Pro Glu Ile Arg Ala Arg Ile Ala Ala Val Glu 2690 2695 2700 Ala Leu Glu Ala Arg Gly Ala Arg Val Thr Val Ala Ala Val Asp Val 2705 2710 2715 2720 Ala Asp Val Glu Pro Met Thr Ala Leu Val Ser Ser Val Glu Pro Pro 2725 2730 2735 Leu Arg Gly Val Val His Ala Ala Gly Val Ser Val Met Arg Pro Leu 2740 2745 2750 Ala Glu Thr Asp Glu Thr Leu Leu Glu Ser Val Leu Arg Pro Lys Val 2755 2760 2765 Ala Gly Ser Trp Leu Leu His Arg Leu Leu His Gly Arg Pro Leu Asp 2770 2775 2780 Leu Phe Val Leu Phe Ser Ser Gly Ala Ala Val Trp Gly Ser His Ser 2785 2790 2795 2800 Gln Gly Ala Tyr Ala Ala Ala Asn Ala Phe Leu Asp Gly Leu Ala His 2805 2810 2815 Leu Arg Arg Ser Gln Ser Leu Pro Ala Leu Ser Val Ala Trp Gly Leu 2820 2825 2830 Trp Ala Glu Gly Gly Met Ala Asp Ala Glu Ala His Ala Arg Leu Ser 2835 2840 2845 Asp Ile Gly Val Leu Pro Met Ser Thr Ser Ala Ala Leu Ser Ala Leu 2850 2855 2860 Gln Arg Leu Val Glu Thr Gly Ala Ala Gln Arg Thr Val Thr Arg Met 2865 2870 2875 2880 Asp Trp Ala Arg Phe Ala Pro Val Tyr Thr Ala Arg Gly Arg Arg Asn 2885 2890 2895 Leu Leu Ser Ala Leu Val Ala Gly Arg Asp Ile Ile Ala Pro Ser Pro 2900 2905 2910 Pro Ala Ala Ala Thr Arg Asn Trp Arg Gly Leu Ser Val Ala Glu Ala 2915 2920 2925 Arg Val Ala Leu His Glu Ile Val His Gly Ala Val Ala Arg Val Leu 2930 2935 2940 Gly Phe Leu Asp Pro Ser Ala Leu Asp Pro Gly Met Gly Phe Asn Glu 2945 2950 2955 2960 Gln Gly Leu Asp Ser Leu Met Ala Val Glu Ile Arg Asn Leu Leu Gln 2965 2970 2975 Ala Glu Leu Asp Val Arg Leu Ser Thr Thr Leu Ala Phe Asp His Pro 2980 2985 2990 Thr Val Gln Arg Leu Val Glu His Leu Leu Val Asp Val Leu Lys Leu 2995 3000 3005 Glu Asp Arg Ser Asp Thr Gln His Val Arg Ser Leu Ala Ser Asp Glu 3010 3015 3020 Pro Ile Ala Ile Val Gly Ala Ala Cys Arg Phe Pro Gly Gly Val Glu 3025 3030 3035 3040 Asp Leu Glu Ser Tyr Trp Gln Leu Leu Ala Glu Gly Val Val Val Ser 3045 3050 3055 Ala Glu Val Pro Ala Asp Arg Trp Asp Ala Ala Asp Trp Tyr Asp Pro 3060 3065 3070 Asp Pro Glu Ile Pro Gly Arg Thr Tyr Val Thr Lys Gly Ala Phe Leu 3075 3080 3085 Arg Asp Leu Gln Arg Leu Asp Ala Thr Phe Phe Arg Ile Ser Pro Arg 3090 3095 3100 Glu Ala Met Ser Leu Asp Pro Gln Gln Arg Leu Leu Leu Glu Val Ser 3105 3110 3115 3120 Trp Glu Ala Leu Glu Ser Ala Gly Ile Ala Pro Asp Thr Leu Arg Asp 3125 3130 3135 Ser Pro Thr Gly Val Phe Val Gly Ala Gly Pro Asn Glu Tyr Tyr Thr 3140 3145 3150 Gln Arg Leu Arg Gly Phe Thr Asp Gly Ala Ala Gly Leu Tyr Gly Gly 3155 3160 3165 Thr Gly Asn Met Leu Ser Val Thr Ala Gly Arg Leu Ser Phe Phe Leu 3170 3175 3180 Gly Leu His Gly Pro Thr Leu Ala Met Asp Thr Ala Cys Ser Ser Ser 3185 3190 3195 3200 Leu Val Ala Leu His Leu Ala Cys Gln Ser Leu Arg Leu Gly Glu Cys 3205 3210 3215 Asp Gln Ala Leu Val Gly Gly Val Asn Val Leu Leu Ala Pro Glu Thr 3220 3225 3230 Phe Val Leu Leu Ser Arg Met Arg Ala Leu Ser Pro Asp Gly Arg Cys 3235 3240 3245 Lys Thr Phe Ser Ala Asp Ala Asp Gly Tyr Ala Arg Gly Glu Gly Cys 3250 3255 3260 Ala Val Val Val Leu Lys Arg Leu Arg Asp Ala Gln Arg Ala Gly Asp 3265 3270 3275 3280 Ser Ile Leu Ala Leu Ile Arg Gly Ser Ala Val Asn His Asp Gly Pro 3285 3290 3295 Ser Ser Gly Leu Thr Val Pro Asn Gly Pro Ala Gln Gln Ala Leu Leu 3300 3305 3310 Arg Gln Ala Leu Ser Gln Ala Gly Val Ser Pro Val Asp Val Asp Phe 3315 3320 3325 Val Glu Cys His Gly Thr Gly Thr Ala Leu Gly Asp Pro Ile Glu Val 3330 3335 3340 Gln Ala Leu Ser Glu Val Tyr Gly Pro Gly Arg Ser Gly Asp Arg Pro 3345 3350 3355 3360 Leu Val Leu Gly Ala Ala Lys Ala Asn Val Ala His Leu Glu Ala Ala 3365 3370 3375 Ser Gly Leu Ala Ser Leu Leu Lys Ala Val Leu Ala Leu Arg His Glu 3380 3385 3390 Gln Ile Pro Ala Gln Pro Glu Leu Gly Glu Leu Asn Pro His Leu Pro 3395 3400 3405 Trp Asn Thr Leu Pro Val Ala Val Pro Arg Lys Ala Val Pro Trp Gly 3410 3415 3420 Arg Gly Ala Arg Pro Arg Arg Ala Gly Val Ser Ala Phe Gly Leu Ser 3425 3430 3435 3440 Gly Thr Asn Val His Val Val Leu Glu Glu Ala Pro Glu Val Glu Pro 3445 3450 3455 Ala Pro Ala Ala Pro Ala Arg Pro Val Glu Leu Val Val Leu Ser Ala 3460 3465 3470 Lys Ser Ala Ala Ala Leu Asp Ala Ala Ala Ala Arg Leu Ser Ala His 3475 3480 3485 Leu Ser Ala His Pro Glu Leu Ser Leu Gly Asp Val Ala Phe Ser Leu 3490 3495 3500 Ala Thr Thr Arg Ser Pro Met Glu His Arg Leu Ala Ile Ala Thr Thr 3505 3510 3515 3520 Ser Arg Glu Ala Leu Arg Gly Ala Leu Asp Ala Ala Ala Gln Gln Lys 3525 3530 3535 Thr Pro Gln Gly Ala Val Arg Gly Lys Ala Val Ser Ser Arg Gly Lys 3540 3545 3550 Leu Ala Phe Leu Phe Thr Gly Gln Gly Ala Gln Met Pro Gly Met Gly 3555 3560 3565 Arg Gly Leu Tyr Glu Thr Trp Pro Ala Phe Arg Glu Ala Phe Asp Arg 3570 3575 3580 Cys Val Ala Leu Phe Asp Arg Glu Ile Asp Gln Pro Leu Arg Glu Val 3585 3590 3595 3600 Met Trp Ala Ala Pro Gly Leu Ala Gln Ala Ala Arg Leu Asp Gln Thr 3605 3610 3615 Ala Tyr Ala Gln Pro Ala Leu Phe Ala Leu Glu Tyr Ala Leu Ala Ala 3620 3625 3630 Leu Trp Arg Ser Trp Gly Val Glu Pro His Val Leu Leu Gly His Ser 3635 3640 3645 Ile Gly Glu Leu Val Ala Ala Cys Val Ala Gly Val Phe Ser Leu Glu 3650 3655 3660 Asp Ala Val Arg Leu Val Ala Ala Arg Gly Arg Leu Met Gln Ala Leu 3665 3670 3675 3680 Pro Ala Gly Gly Ala Met Val Ala Ile Ala Ala Ser Glu Ala Glu Val 3685 3690 3695 Ala Ala Ser Val Ala Pro His Ala Ala Thr Val Ser Ile Ala Ala Val 3700 3705 3710 Asn Gly Pro Asp Ala Val Val Ile Ala Gly Ala Glu Val Gln Val Leu 3715 3720 3725 Ala Leu Gly Ala Thr Phe Ala Ala Arg Gly Ile Arg Thr Lys Arg Leu 3730 3735 3740 Ala Val Ser His Ala Phe His Ser Pro Leu Met Asp Pro Met Leu Glu 3745 3750 3755 3760 Asp Phe Gln Arg Val Ala Ala Thr Ile Ala Tyr Arg Ala Pro Asp Arg 3765 3770 3775 Pro Val Val Ser Asn Val Thr Gly His Val Ala Gly Pro Glu Ile Ala 3780 3785 3790 Thr Pro Glu Tyr Trp Val Arg His Val Arg Ser Ala Val Arg Phe Gly 3795 3800 3805 Asp Gly Ala Lys Ala Leu His Ala Ala Gly Ala Ala Thr Phe Val Glu 3810 3815 3820 Val Gly Pro Lys Pro Val Leu Leu Gly Leu Leu Pro Ala Cys Leu Gly 3825 3830 3835 3840 Glu Ala Asp Ala Val Leu Val Pro Ser Leu Arg Ala Asp Arg Ser Glu 3845 3850 3855 Cys Glu Val Val Leu Ala Ala Leu Gly Ala Trp Tyr Ala Trp Gly Gly 3860 3865 3870 Ala Leu Asp Trp Lys Gly Val Phe Pro Asp Gly Ala Arg Arg Val Ala 3875 3880 3885 Leu Pro Met Tyr Pro Trp Gln Arg Glu Arg His Trp Met Asp Leu Thr 3890 3895 3900 Pro Arg Ser Ala Ala Pro Ala Gly Ile Ala Gly Arg Trp Pro Leu Ala 3905 3910 3915 3920 Gly Val Gly Leu Cys Met Pro Gly Ala Val Leu His His Val Leu Ser 3925 3930 3935 Ile Gly Pro Arg His Gln Pro Phe Leu Gly Asp His Leu Val Phe Gly 3940 3945 3950 Lys Val Val Val Pro Gly Ala Phe His Val Ala Val Ile Leu Ser Ile 3955 3960 3965 Ala Ala Glu Arg Trp Pro Glu Arg Ala Ile Glu Leu Thr Gly Val Glu 3970 3975 3980 Phe Leu Lys Ala Ile Ala Met Glu Pro Asp Gln Glu Val Glu Leu His 3985 3990 3995 4000 Ala Val Leu Thr Pro Glu Ala Ala Gly Asp Gly Tyr Leu Phe Glu Leu 4005 4010 4015 Ala Thr Leu Ala Ala Pro Glu Thr Glu Arg Arg Trp Thr Thr His Ala 4020 4025 4030 Arg Gly Arg Val Gln Pro Thr Asp Gly Ala Pro Gly Ala Leu Pro Arg 4035 4040 4045 Leu Glu Val Leu Glu Asp Arg Ala Ile Gln Pro Leu Asp Phe Ala Gly 4050 4055 4060 Phe Leu Asp Arg Leu Ser Ala Val Arg Ile Gly Trp Gly Pro Leu Trp 4065 4070 4075 4080 Arg Trp Leu Gln Asp Gly Arg Val Gly Asp Glu Ala Ser Leu Ala Thr 4085 4090 4095 Leu Val Pro Thr Tyr Pro Asn Ala His Asp Val Ala Pro Leu His Pro 4100 4105 4110 Ile Leu Leu Asp Asn Gly Phe Ala Val Ser Leu Leu Ser Thr Arg Ser 4115 4120 4125 Glu Pro Glu Asp Asp Gly Thr Pro Pro Leu Pro Phe Ala Val Glu Arg 4130 4135 4140 Val Arg Trp Trp Arg Ala Pro Val Gly Arg Val Arg Cys Gly Gly Val 4145 4150 4155 4160 Pro Arg Ser Gln Ala Phe Gly Val Ser Ser Phe Val Leu Val Asp Glu 4165 4170 4175 Thr Gly Glu Val Val Ala Glu Val Glu Gly Phe Val Cys Arg Arg Ala 4180 4185 4190 Pro Arg Glu Val Phe Leu Arg Gln Glu Ser Gly Ala Ser Thr Ala Ala 4195 4200 4205 Leu Tyr Arg Leu Asp Trp Pro Glu Ala Pro Leu Pro Asp Ala Pro Ala 4210 4215 4220 Glu Arg Ile Glu Glu Ser Trp Val Val Val Ala Ala Pro Gly Ser Glu 4225 4230 4235 4240 Met Ala Ala Ala Leu Ala Thr Arg Leu Asn Arg Cys Val Leu Ala Glu 4245 4250 4255 Pro Lys Gly Leu Glu Ala Ala Leu Ala Gly Val Ser Pro Ala Gly Val 4260 4265 4270 Ile Cys Leu Trp Glu Ala Gly Ala His Glu Glu Ala Pro Ala Ala Ala 4275 4280 4285 Gln Arg Val Ala Thr Glu Gly Leu Ser Val Val Gln Ala Leu Arg Asp 4290 4295 4300 Arg Ala Val Arg Leu Trp Trp Val Thr Met Gly Ala Val Ala Val Glu 4305 4310 4315 4320 Ala Gly Glu Arg Val Gln Val Ala Thr Ala Pro Val Trp Gly Leu Gly 4325 4330 4335 Arg Thr Val Met Gln Glu Arg Pro Glu Leu Ser Cys Thr Leu Val Asp 4340 4345 4350 Leu Glu Pro Glu Ala Asp Ala Ala Arg Ser Ala Asp Val Leu Leu Arg 4355 4360 4365 Glu Leu Gly Arg Ala Asp Asp Glu Thr Gln Val Ala Phe Arg Ser Gly 4370 4375 4380 Lys Arg Arg Val Ala Arg Leu Val Lys Ala Thr Thr Pro Glu Gly Leu 4385 4390 4395 4400 Leu Val Pro Asp Ala Glu Ser Tyr Arg Leu Glu Ala Gly Gln Lys Gly 4405 4410 4415 Thr Leu Asp Gln Leu Arg Leu Ala Pro Ala Gln Arg Arg Ala Pro Gly 4420 4425 4430 Pro Gly Glu Val Glu Ile Lys Val Thr Ala Ser Gly Leu Asn Phe Arg 4435 4440 4445 Thr Val Leu Ala Val Leu Gly Met Tyr Pro Gly Asp Ala Gly Pro Met 4450 4455 4460 Gly Gly Asp Cys Ala Gly Val Ala Thr Ala Val Gly Gln Gly Val Arg 4465 4470 4475 4480 His Val Ala Val Gly Asp Ala Val Met Thr Leu Gly Thr Leu His Arg 4485 4490 4495 Phe Val Thr Val Asp Ala Arg Leu Val Val Arg Gln Pro Ala Gly Leu 4500 4505 4510 Thr Pro Ala Gln Ala Ala Thr Val Pro Val Ala Phe Leu Thr Ala Trp 4515 4520 4525 Leu Ala Leu His Asp Leu Gly Asn Leu Arg Arg Gly Glu Arg Val Leu 4530 4535 4540 Ile His Ala Ala Ala Gly Gly Val Gly Met Ala Ala Val Gln Ile Ala 4545 4550 4555 4560 Arg Trp Ile Gly Ala Glu Val Phe Ala Thr Ala Ser Pro Ser Lys Trp 4565 4570 4575 Ala Ala Val Gln Ala Met Gly Val Pro Arg Thr His Ile Ala Ser Ser 4580 4585 4590 Arg Thr Leu Glu Phe Ala Glu Thr Phe Arg Gln Val Thr Gly Gly Arg 4595 4600 4605 Gly Val Asp Val Val Leu Asn Ala Leu Ala Gly Glu Phe Val Asp Ala 4610 4615 4620 Ser Leu Ser Leu Leu Ser Thr Gly Gly Arg Phe Leu Glu Met Gly Lys 4625 4630 4635 4640 Thr Asp Ile Arg Asp Arg Ala Ala Val Ala Ala Ala His Pro Gly Val 4645 4650 4655 Arg Tyr Arg Val Phe Asp Ile Leu Glu Leu Ala Pro Asp Arg Thr Arg 4660 4665 4670 Glu Ile Leu Glu Arg Val Val Glu Gly Phe Ala Ala Gly His Leu Arg 4675 4680 4685 Ala Leu Pro Val His Ala Phe Ala Ile Thr Lys Ala Glu Ala Ala Phe 4690 4695 4700 Arg Phe Met Ala Gln Ala Arg His Gln Gly Lys Val Val Leu Leu Pro 4705 4710 4715 4720 Ala Pro Ser Ala Ala Pro Leu Ala Pro Thr Gly Thr Val Leu Leu Thr 4725 4730 4735 Gly Gly Leu Gly Ala Leu Gly Leu His Val Ala Arg Trp Leu Ala Gln 4740 4745 4750 Gln Gly Val Pro His Met Val Leu Thr Gly Arg Arg Gly Leu Asp Thr 4755 4760 4765 Pro Gly Ala Ala Lys Ala Val Ala Glu Ile Glu Ala Leu Gly Ala Arg 4770 4775 4780 Val Thr Ile Ala Ala Ser Asp Val Ala Asp Arg Asn Ala Leu Glu Ala 4785 4790 4795 4800 Val Leu Gln Ala Ile Pro Ala Glu Trp Pro Leu Gln Gly Val Ile His 4805 4810 4815 Ala Ala Gly Ala Leu Asp Asp Gly Val Leu Asp Glu Gln Thr Thr Asp 4820 4825 4830 Arg Phe Ser Arg Val Leu Ala Pro Lys Val Thr Gly Ala Trp Asn Leu 4835 4840 4845 His Glu Leu Thr Ala Gly Asn Asp Leu Ala Phe Phe Val Leu Phe Ser 4850 4855 4860 Ser Met Ser Gly Leu Leu Gly Ser Ala Gly Gln Ser Asn Tyr Ala Ala 4865 4870 4875 4880 Ala Asn Thr Phe Leu Asp Ala Leu Ala Ala His Arg Arg Ala Glu Gly 4885 4890 4895 Leu Ala Ala Gln Ser Leu Ala Trp Gly Pro Trp Ser Asp Gly Gly Met 4900 4905 4910 Ala Ala Gly Leu Ser Ala Ala Leu Gln Ala Arg Leu Ala Arg His Gly 4915 4920 4925 Met Gly Ala Leu Ser Pro Ala Gln Gly Thr Ala Leu Leu Gly Gln Ala 4930 4935 4940 Leu Ala Arg Pro Glu Thr Gln Leu Gly Ala Met Ser Leu Asp Val Arg 4945 4950 4955 4960 Ala Ala Ser Gln Ala Ser Gly Ala Ala Val Pro Pro Val Trp Arg Ala 4965 4970 4975 Leu Val Arg Ala Glu Ala Arg His Thr Ala Ala Gly Ala Gln Gly Ala 4980 4985 4990 Leu Ala Ala Arg Leu Gly Ala Leu Pro Glu Ala Arg Arg Ala Asp Glu 4995 5000 5005 Val Arg Lys Val Val Gln Ala Glu Ile Ala Arg Val Leu Ser Trp Ser 5010 5015 5020 Ala Ala Ser Ala Val Pro Val Asp Arg Pro Leu Ser Asp Leu Gly Leu 5025 5030 5035 5040 Asp Ser Leu Thr Ala Val Glu Leu Arg Asn Val Leu Gly Gln Arg Val 5045 5050 5055 Gly Ala Thr Leu Pro Ala Thr Leu Ala Phe Asp His Pro Thr Val Asp 5060 5065 5070 Ala Leu Thr Arg Trp Leu Leu Asp Lys Val Leu Ala Val Ala Glu Pro 5075 5080 5085 Ser Val Ser Ser Ala Lys Ser Ser Pro Gln Val Ala Leu Asp Glu Pro 5090 5095 5100 Ile Ala Ile Ile Gly Ile Gly Cys Arg Phe Pro Gly Gly Val Ala Asp 5105 5110 5115 5120 Pro Glu Ser Phe Trp Arg Leu Leu Glu Glu Gly Ser Asp Ala Val Val 5125 5130 5135 Glu Val Pro His Glu Arg Trp Asp Ile Asp Ala Phe Tyr Asp Pro Asp 5140 5145 5150 Pro Asp Val Arg Gly Lys Met Thr Thr Arg Phe Gly Gly Phe Leu Ser 5155 5160 5165 Asp Ile Asp Arg Phe Asp Pro Ala Phe Phe Gly Ile Ser Pro Arg Glu 5170 5175 5180 Ala Thr Thr Met Asp Pro Gln Gln Arg Leu Leu Leu Glu Thr Ser Trp 5185 5190 5195 5200 Glu Ala Phe Glu Arg Ala Gly Ile Leu Pro Glu Arg Leu Met Gly Ser 5205 5210 5215 Asp Thr Gly Val Phe Val Gly Leu Phe Tyr Gln Glu Tyr Ala Ala Leu 5220 5225 5230 Ala Gly Gly Ile Glu Ala Phe Asp Gly Tyr Leu Gly Thr Gly Thr Thr 5235 5240 5245 Ala Ser Val Ala Ser Gly Arg Ile Ser Tyr Val Leu Gly Leu Lys Gly 5250 5255 5260 Pro Ser Leu Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Val 5265 5270 5275 5280 His Leu Ala Cys Gln Ala Leu Arg Arg Gly Glu Cys Ser Val Ala Leu 5285 5290 5295 Ala Gly Gly Val Ala Leu Met Leu Thr Pro Ala Thr Phe Val Glu Phe 5300 5305 5310 Ser Arg Leu Arg Gly Leu Ala Pro Asp Gly Arg Cys Lys Ser Phe Ser 5315 5320 5325 Ala Ala Ala Asp Gly Val Gly Trp Ser Glu Gly Cys Ala Met Leu Leu 5330 5335 5340 Leu Lys Pro Leu Arg Asp Ala Gln Arg Asp Gly Asp Pro Ile Leu Ala 5345 5350 5355 5360 Val Ile Arg Gly Thr Ala Val Asn Gln Asp Gly Arg Ser Asn Gly Leu 5365 5370 5375 Thr Ala Pro Asn Gly Ser Ser Gln Gln Glu Val Ile Arg Arg Ala Leu 5380 5385 5390 Glu Gln Ala Gly Leu Ala Pro Ala Asp Val Ser Tyr Val Glu Cys His 5395 5400 5405 Gly Thr Gly Thr Thr Leu Gly Asp Pro Ile Glu Val Gln Ala Leu Gly 5410 5415 5420 Ala Val Leu Ala Gln Gly Arg Pro Ser Asp Arg Pro Leu Val Ile Gly 5425 5430 5435 5440 Ser Val Lys Ser Asn Ile Gly His Thr Gln Ala Ala Ala Gly Val Ala 5445 5450 5455 Gly Val Ile Lys Val Ala Leu Ala Leu Glu Arg Gly Leu Ile Pro Arg 5460 5465 5470 Ser Leu His Phe Asp Ala Pro Asn Pro His Ile Pro Trp Ser Glu Leu 5475 5480 5485 Ala Val Gln Val Ala Ala Lys Pro Val Glu Trp Thr Arg Asn Gly Val 5490 5495 5500 Pro Arg Arg Ala Gly Val Ser Ser Phe Gly Val Ser Gly Thr Asn Ala 5505 5510 5515 5520 His Val Val Leu Glu Glu Ala Pro Ala Ala Ala Phe Ala Pro Ala Ala 5525 5530 5535 Ala Arg Ser Ala Glu Leu Phe Val Leu Ser Ala Lys Ser Ala Ala Ala 5540 5545 5550 Leu Asp Ala Gln Ala Ala Arg Leu Ser Ala His Val Val Ala His Pro 5555 5560 5565 Glu Leu Gly Leu Gly Asp Leu Ala Phe Ser Leu Ala Thr Thr Arg Ser 5570 5575 5580 Pro Met Thr Tyr Arg Leu Ala Val Ala Ala Thr Ser Arg Glu Ala Leu 5585 5590 5595 5600 Ser Ala Ala Leu Asp Thr Ala Ala Gln Gly Gln Ala Pro Pro Ala Ala 5605 5610 5615 Ala Arg Gly His Ala Ser Thr Gly Ser Ala Pro Lys Val Val Phe Val 5620 5625 5630 Phe Pro Gly Gln Gly Ser Gln Trp Leu Gly Met Gly Gln Lys Leu Leu 5635 5640 5645 Ser Glu Glu Pro Val Phe Arg Asp Ala Leu Ser Ala Cys Asp Arg Ala 5650 5655 5660 Ile Gln Ala Glu Ala Gly Trp Ser Leu Leu Ala Glu Leu Ala Ala Asp 5665 5670 5675 5680 Glu Thr Thr Ser Gln Leu Gly Arg Ile Asp Val Val Gln Pro Ala Leu 5685 5690 5695 Phe Ala Ile Glu Val Ala Leu Ser Ala Leu Trp Arg Ser Trp Gly Val 5700 5705 5710 Glu Pro Asp Ala Val Val Gly His Ser Met Gly Glu Val Ala Ala Ala 5715 5720 5725 His Val Ala Gly Ala Leu Ser Leu Glu Asp Ala Val Ala Ile Ile Cys 5730 5735 5740 Arg Arg Ser Leu Leu Leu Arg Arg Ile Ser Gly Gln Gly Glu Met Ala 5745 5750 5755 5760 Val Val Glu Leu Ser Leu Ala Glu Ala Glu Ala Ala Leu Leu Gly Tyr 5765 5770 5775 Glu Asp Arg Leu Ser Val Ala Val Ser Asn Ser Pro Arg Ser Thr Val 5780 5785 5790 Leu Ala Gly Glu Pro Ala Ala Leu Ala Glu Val Leu Ala Ile Leu Ala 5795 5800 5805 Ala Lys Gly Val Phe Cys Arg Arg Val Lys Val Asp Val Ala Ser His 5810 5815 5820 Ser Pro Gln Ile Asp Pro Leu Arg Asp Glu Leu Leu Ala Ala Leu Gly 5825 5830 5835 5840 Glu Leu Glu Pro Arg Gln Ala Thr Val Ser Met Arg Ser Thr Val Thr 5845 5850 5855 Ser Thr Ile Met Ala Gly Pro Glu Leu Val Ala Ser Tyr Trp Ala Asp 5860 5865 5870 Asn Val Arg Gln Pro Val Arg Phe Ala Glu Ala Val Gln Ser Leu Met 5875 5880 5885 Glu Asp Gly His Gly Leu Phe Val Glu Met Ser Pro His Pro Ile Leu 5890 5895 5900 Thr Thr Ser Val Glu Glu Ile Arg Arg Ala Thr Lys Arg Glu Gly Val 5905 5910 5915 5920 Ala Val Gly Ser Leu Arg Arg Gly Gln Asp Glu Arg Leu Ser Met Leu 5925 5930 5935 Glu Ala Leu Gly Ala Leu Trp Val His Gly Gln Ala Val Gly Trp Glu 5940 5945 5950 Arg Leu Phe Ser Ala Gly Gly Ala Gly Leu Arg Arg Val Pro Leu Pro 5955 5960 5965 Thr Tyr Pro Trp Gln Arg Glu Arg Tyr Trp Val Asp Ala Pro Thr Gly 5970 5975 5980 Gly Ala Ala Gly Gly Ser Arg Phe Ala His Ala Gly Ser His Pro Leu 5985 5990 5995 6000 Leu Gly Glu Met Gln Thr Leu Ser Thr Gln Arg Ser Thr Arg Val Trp 6005 6010 6015 Glu Thr Thr Leu Asp Leu Lys Arg Leu Pro Trp Leu Gly Asp His Arg 6020 6025 6030 Val Gln Gly Ala Val Val Phe Pro Gly Ala Ala Tyr Leu Glu Met Ala 6035 6040 6045 Leu Ser Ser Gly Ala Glu Ala Leu Gly Asp Gly Pro Leu Gln Val Ser 6050 6055 6060 Asp Val Val Leu Ala Glu Ala Leu Ala Phe Ala Asp Asp Thr Pro Ala 6065 6070 6075 6080 Ala Val Gln Val Met Ala Thr Glu Glu Arg Pro Gly Arg Leu Gln Phe 6085 6090 6095 His Val Ala Ser Arg Val Pro Gly His Gly Gly Ala Ala Phe Arg Ser 6100 6105 6110 His Ala Arg Gly Val Leu Arg Gln Ile Glu Arg Ala Glu Val Pro Ala 6115 6120 6125 Arg Leu Asp Leu Ala Ala Leu Arg Ala Arg Leu Gln Ala Ser Ala Pro 6130 6135 6140 Ala Ala Ala Thr Tyr Ala Ala Leu Ala Glu Met Gly Leu Glu Tyr Gly 6145 6150 6155 6160 Pro Ala Phe Gln Gly Leu Val Glu Leu Trp Arg Gly Glu Gly Glu Ala 6165 6170 6175 Leu Gly Arg Val Arg Leu Pro Glu Ala Ala Gly Ser Pro Ala Ala Cys 6180 6185 6190 Arg Leu His Pro Ala Leu Leu Asp Ala Cys Phe His Val Ser Ser Ala 6195 6200 6205 Phe Ala Asp Arg Gly Glu Ala Thr Pro Trp Val Pro Val Glu Ile Gly 6210 6215 6220 Ser Leu Arg Trp Phe Gln Arg Pro Ser Gly Glu Leu Trp Cys His Ala 6225 6230 6235 6240 Arg Ser Val Ser His Gly Lys Pro Thr Pro Asp Arg Arg Ser Thr Asp 6245 6250 6255 Phe Trp Val Val Asp Ser Thr Gly Ala Ile Val Ala Glu Ile Ser Gly 6260 6265 6270 Leu Val Ala Gln Arg Leu Ala Gly Gly Val Arg Arg Arg Glu Glu Asp 6275 6280 6285 Asp Trp Phe Met Glu Pro Ala Trp Glu Pro Thr Ala Val Pro Gly Ser 6290 6295 6300 Glu Val Met Ala Gly Arg Trp Leu Leu Ile Gly Ser Gly Gly Gly Leu 6305 6310 6315 6320 Gly Ala Ala Leu His Ser Ala Leu Thr Glu Ala Gly His Ser Val Val 6325 6330 6335 His Ala Thr Gly Arg Gly Thr Ser Ala Ala Gly Leu Gln Ala Leu Leu 6340 6345 6350 Thr Ala Ser Phe Asp Gly Gln Ala Pro Thr Ser Val Val His Leu Gly 6355 6360 6365 Ser Leu Asp Glu Arg Gly Val Leu Asp Ala Asp Ala Pro Phe Asp Ala 6370 6375 6380 Asp Ala Leu Glu Glu Ser Leu Val Arg Gly Cys Asp Ser Val Leu Trp 6385 6390 6395 6400 Thr Val Gln Ala Val Ala Gly Ala Gly Phe Arg Asp Pro Pro Arg Leu 6405 6410 6415 Trp Leu Val Thr Arg Gly Ala Gln Ala Ile Gly Ala Gly Asp Val Ser 6420 6425 6430 Val Ala Gln Ala Pro Leu Leu Gly Leu Gly Arg Val Ile Ala Leu Glu 6435 6440 6445 His Ala Glu Leu Arg Cys Ala Arg Ile Asp Leu Asp Pro Ala Arg Arg 6450 6455 6460 Asp Gly Glu Val Asp Glu Leu Leu Ala Glu Leu Leu Ala Asp Asp Ala 6465 6470 6475 6480 Glu Glu Glu Val Ala Phe Arg Gly Gly Glu Arg Arg Val Ala Arg Leu 6485 6490 6495 Val Arg Arg Leu Pro Glu Thr Asp Cys Arg Glu Lys Ile Glu Pro Ala 6500 6505 6510 Glu Gly Arg Pro Phe Arg Leu Glu Ile Asp Gly Ser Gly Val Leu Asp 6515 6520 6525 Asp Leu Val Leu Arg Ala Thr Glu Arg Arg Pro Pro Gly Pro Gly Glu 6530 6535 6540 Val Glu Ile Ala Val Glu Ala Ala Gly Leu Asn Phe Leu Asp Val Met 6545 6550 6555 6560 Arg Ala Met Gly Ile Tyr Pro Gly Pro Gly Asp Gly Pro Val Ala Leu 6565 6570 6575 Gly Ala Glu Cys Ser Gly Arg Ile Val Ala Met Gly Glu Gly Val Glu 6580 6585 6590 Ser Leu Arg Ile Gly Gln Asp Val Val Ala Val Ala Pro Phe Ser Phe 6595 6600 6605 Gly Thr His Val Thr Ile Asp Ala Arg Met Leu Ala Pro Arg Pro Ala 6610 6615 6620 Ala Leu Thr Ala Ala Gln Ala Ala Ala Leu Pro Val Ala Phe Met Thr 6625 6630 6635 6640 Ala Trp Tyr Gly Leu Val His Leu Gly Arg Leu Arg Ala Gly Glu Arg 6645 6650 6655 Val Leu Ile His Ser Ala Thr Gly Gly Thr Gly Leu Ala Ala Val Gln 6660 6665 6670 Ile Ala Arg His Leu Gly Ala Glu Ile Phe Ala Thr Ala Gly Thr Pro 6675 6680 6685 Glu Lys Arg Ala Trp Leu Arg Glu Gln Gly Ile Ala His Val Met Asp 6690 6695 6700 Ser Arg Ser Leu Asp Phe Ala Glu Gln Val Leu Ala Ala Thr Lys Gly 6705 6710 6715 6720 Glu Gly Val Asp Val Val Leu Asn Ser Leu Ser Gly Ala Ala Ile Asp 6725 6730 6735 Ala Ser Leu Ser Thr Leu Val Pro Asp Gly Arg Phe Ile Glu Leu Gly 6740 6745 6750 Lys Thr Asp Ile Tyr Ala Asp Arg Ser Leu Gly Leu Ala His Phe Arg 6755 6760 6765 Lys Ser Leu Ser Tyr Ser Ala Val Asp Leu Ala Gly Leu Ala Val Arg 6770 6775 6780 Arg Pro Glu Arg Val Ala Ala Leu Leu Ala Glu Val Val Asp Leu Leu 6785 6790 6795 6800 Ala Arg Gly Ala Leu Gln Pro Leu Pro Val Glu Ile Phe Pro Leu Ser 6805 6810 6815 Arg Ala Ala Asp Ala Phe Arg Lys Met Ala Gln Ala Gln His Leu Gly 6820 6825 6830 Lys Leu Val Leu Ala Leu Glu Asp Pro Asp Val Arg Ile Arg Val Pro 6835 6840 6845 Gly Glu Ser Gly Val Ala Ile Arg Ala Asp Gly Ala Tyr Leu Val Thr 6850 6855 6860 Gly Gly Leu Gly Gly Leu Gly Leu Ser Val Ala Gly Trp Leu Ala Glu 6865 6870 6875 6880 Gln Gly Ala Gly His Leu Val Leu Val Gly Arg Ser Gly Ala Val Ser 6885 6890 6895 Ala Glu Gln Gln Thr Ala Val Ala Ala Leu Glu Ala His Gly Ala Arg 6900 6905 6910 Val Thr Val Ala Arg Ala Asp Val Ala Asp Arg Ala Gln Met Glu Arg 6915 6920 6925 Ile Leu Arg Glu Val Thr Ala Ser Gly Met Pro Leu Arg Gly Val Val 6930 6935 6940 His Ala Ala Gly Ile Leu Asp Asp Gly Leu Leu Met Gln Gln Thr Pro 6945 6950 6955 6960 Ala Arg Phe Arg Ala Val Met Ala Pro Lys Val Arg Gly Ala Leu His 6965 6970 6975 Leu His Ala Leu Thr Arg Glu Ala Pro Leu Ser Phe Phe Val Leu Tyr 6980 6985 6990 Ala Ser Gly Ala Gly Leu Leu Gly Ser Pro Gly Gln Gly Asn Tyr Ala 6995 7000 7005 Ala Ala Asn Thr Phe Leu Asp Ala Leu Ala His His Arg Arg Ala Gln 7010 7015 7020 Gly Leu Pro Ala Leu Ser Ile Asp Trp Gly Leu Phe Ala Asp Val Gly 7025 7030 7035 7040 Leu Ala Ala Gly Gln Gln Asn Arg Gly Ala Arg Leu Val Thr Arg Gly 7045 7050 7055 Thr Arg Ser Leu Thr Pro Asp Glu Gly Leu Trp Ala Leu Glu Arg Leu 7060 7065 7070 Leu Asp Gly Asp Arg Thr Gln Ala Gly Val Met Pro Phe Asp Val Arg 7075 7080 7085 Gln Trp Val Glu Phe Tyr Pro Ala Ala Ala Ser Ser Arg Arg Leu Ser 7090 7095 7100 Arg Leu Met Thr Ala Arg Arg Val Ala Ser Gly Arg Leu Ala Gly Asp 7105 7110 7115 7120 Arg Asp Leu Leu Glu Arg Leu Ala Thr Ala Glu Ala Gly Ala Arg Ala 7125 7130 7135 Gly Met Leu Gln Glu Val Val Arg Ala Gln Val Ser Gln Val Leu Arg 7140 7145 7150 Leu Ser Glu Gly Lys Leu Asp Val Asp Ala Pro Leu Thr Ser Leu Gly 7155 7160 7165 Met Asp Ser Leu Met Gly Leu Glu Leu Arg Asn Arg Ile Glu Ala Val 7170 7175 7180 Leu Gly Ile Thr Met Pro Ala Thr Leu Leu Trp Thr Tyr Pro Thr Val 7185 7190 7195 7200 Ala Ala Leu Ser Ala His Leu Ala Ser His Val Val Ser Thr Gly Asp 7205 7210 7215 Gly Glu Ser Ala Arg Pro Pro Asp Thr Gly Ser Val Ala Pro Thr Thr 7220 7225 7230 His Glu Val Ala Ser Leu Asp Glu Asp Gly Leu Phe Ala Leu Ile Asp 7235 7240 7245 Glu Ser Leu Ala Arg Ala Gly Lys Arg 7250 7255 <210> 6 <211> 3798 <212> PRT <213> Sorangium cellulosum <400> 6 Val Thr Asp Arg Glu Gly Gln Leu Leu Glu Arg Leu Arg Glu Val Thr 1 5 10 15 Leu Ala Leu Arg Lys Thr Leu Asn Glu Arg Asp Thr Leu Glu Leu Glu 20 25 30 Lys Thr Glu Pro Ile Ala Ile Val Gly Ile Gly Cys Arg Phe Pro Gly 35 40 45 Gly Ala Gly Thr Pro Glu Ala Phe Trp Glu Leu Leu Asp Asp Gly Arg 50 55 60 Asp Ala Ile Arg Pro Leu Glu Glu Arg Trp Ala Leu Val Gly Val Asp 65 70 75 80 Pro Gly Asp Asp Val Pro Arg Trp Ala Gly Leu Leu Thr Glu Ala Ile 85 90 95 Asp Gly Phe Asp Ala Ala Phe Phe Gly Ile Ala Pro Arg Glu Ala Arg 100 105 110 Ser Leu Asp Pro Gln His Arg Leu Leu Leu Glu Val Ala Trp Glu Gly 115 120 125 Phe Glu Asp Ala Gly Ile Pro Pro Arg Ser Leu Val Gly Ser Arg Thr 130 135 140 Gly Val Phe Val Gly Val Cys Ala Thr Glu Tyr Leu His Ala Ala Val 145 150 155 160 Ala His Gln Pro Arg Glu Glu Arg Asp Ala Tyr Ser Thr Thr Gly Asn 165 170 175 Met Leu Ser Ile Ala Ala Gly Arg Leu Ser Tyr Thr Leu Gly Leu Gln 180 185 190 Gly Pro Cys Leu Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala 195 200 205 Ile His Leu Ala Cys Arg Ser Leu Arg Ala Arg Glu Ser Asp Leu Ala 210 215 220 Leu Ala Gly Gly Val Asn Met Leu Leu Ser Pro Asp Thr Met Arg Ala 225 230 235 240 Leu Ala Arg Thr Gln Ala Leu Ser Pro Asn Gly Arg Cys Gln Thr Phe 245 250 255 Asp Ala Ser Ala Asn Gly Phe Val Arg Gly Glu Gly Cys Gly Leu Ile 260 265 270 Val Leu Lys Arg Leu Ser Asp Ala Arg Arg Asp Gly Asp Arg Ile Trp 275 280 285 Ala Leu Ile Arg Gly Ser Ala Ile Asn Gln Asp Gly Arg Ser Thr Gly 290 295 300 Leu Thr Ala Pro Asn Val Leu Ala Gln Gly Ala Leu Leu Arg Glu Ala 305 310 315 320 Leu Arg Asn Ala Gly Val Glu Ala Glu Ala Ile Gly Tyr Ile Glu Thr 325 330 335 His Gly Ala Ala Thr Ser Leu Gly Asp Pro Ile Glu Ile Glu Ala Leu 340 345 350 Arg Ala Val Val Gly Pro Ala Arg Ala Asp Gly Ala Arg Cys Val Leu 355 360 365 Gly Ala Val Lys Thr Asn Leu Gly His Leu Glu Gly Ala Ala Gly Val 370 375 380 Ala Gly Leu Ile Lys Ala Thr Leu Ser Leu His His Glu Arg Ile Pro 385 390 395 400 Arg Asn Leu Asn Phe Arg Thr Leu Asn Pro Arg Ile Arg Ile Glu Gly 405 410 415 Thr Ala Leu Ala Leu Ala Thr Glu Pro Val Pro Trp Pro Arg Thr Gly 420 425 430 Arg Thr Arg Phe Ala Gly Val Ser Ser Phe Gly Met Ser Gly Thr Asn 435 440 445 Ala His Val Val Leu Glu Glu Ala Pro Ala Val Glu Pro Glu Ala Ala 450 455 460 Ala Pro Glu Arg Ala Ala Glu Leu Phe Val Leu Ser Ala Lys Ser Ala 465 470 475 480 Ala Ala Leu Asp Ala Gln Ala Ala Arg Leu Arg Asp His Leu Glu Lys 485 490 495 His Val Glu Leu Gly Leu Gly Asp Val Ala Phe Ser Leu Ala Thr Thr 500 505 510 Arg Ser Ala Met Glu His Arg Leu Ala Val Ala Ala Ser Ser Arg Glu 515 520 525 Ala Leu Arg Gly Ala Leu Ser Ala Ala Ala Gln Gly His Thr Pro Pro 530 535 540 Gly Ala Val Arg Gly Arg Ala Ser Gly Gly Ser Ala Pro Lys Val Val 545 550 555 560 Phe Val Phe Pro Gly Gln Gly Ser Gln Trp Val Gly Met Gly Arg Lys 565 570 575 Leu Met Ala Glu Glu Pro Val Phe Arg Ala Ala Leu Glu Gly Cys Asp 580 585 590 Arg Ala Ile Glu Ala Glu Ala Gly Trp Ser Leu Leu Gly Glu Leu Ser 595 600 605 Ala Asp Glu Ala Ala Ser Gln Leu Gly Arg Ile Asp Val Val Gln Pro 610 615 620 Val Leu Phe Ala Met Glu Val Ala Leu Ser Ala Leu Trp Arg Ser Trp 625 630 635 640 Gly Val Glu Pro Glu Ala Val Val Gly His Ser Met Gly Glu Val Ala 645 650 655 Ala Ala His Val Ala Gly Ala Leu Ser Leu Glu Asp Ala Val Ala Ile 660 665 670 Ile Cys Arg Arg Ser Arg Leu Leu Arg Arg Ile Ser Gly Gln Gly Glu 675 680 685 Met Ala Leu Val Glu Leu Ser Leu Glu Glu Ala Glu Ala Ala Leu Arg 690 695 700 Gly His Glu Gly Arg Leu Ser Val Ala Val Ser Asn Ser Pro Arg Ser 705 710 715 720 Thr Val Leu Ala Gly Glu Pro Ala Ala Leu Ser Glu Val Leu Ala Ala 725 730 735 Leu Thr Ala Lys Gly Val Phe Trp Arg Gln Val Lys Val Asp Val Ala 740 745 750 Ser His Ser Pro Gln Val Asp Pro Leu Arg Glu Glu Leu Ile Ala Ala 755 760 765 Leu Gly Ala Ile Arg Pro Arg Ala Ala Ala Val Pro Met Arg Ser Thr 770 775 780 Val Thr Gly Gly Val Ile Ala Gly Pro Glu Leu Gly Ala Ser Tyr Trp 785 790 795 800 Ala Asp Asn Leu Arg Gln Pro Val Arg Phe Ala Ala Ala Ala Gln Ala 805 810 815 Leu Leu Glu Gly Gly Pro Ala Leu Phe Ile Glu Met Ser Pro His Pro 820 825 830 Ile Leu Val Pro Pro Leu Asp Glu Ile Gln Thr Ala Ala Glu Gln Gly 835 840 845 Gly Ala Ala Val Gly Ser Leu Arg Arg Gly Gln Asp Glu Arg Ala Thr 850 855 860 Leu Leu Glu Ala Leu Gly Thr Leu Trp Ala Ser Gly Tyr Pro Val Ser 865 870 875 880 Trp Ala Arg Leu Phe Pro Ala Gly Gly Arg Arg Val Pro Leu Pro Thr 885 890 895 Tyr Pro Trp Gln His Glu Arg Cys Trp Ile Glu Val Glu Pro Asp Ala 900 905 910 Arg Arg Leu Ala Ala Ala Asp Pro Thr Lys Asp Trp Phe Tyr Arg Thr 915 920 925 Asp Trp Pro Glu Val Pro Arg Ala Ala Pro Lys Ser Glu Thr Ala His 930 935 940 Gly Ser Trp Leu Leu Leu Ala Asp Arg Gly Gly Val Gly Glu Ala Val 945 950 955 960 Ala Ala Ala Leu Ser Thr Arg Gly Leu Ser Cys Thr Val Leu His Ala 965 970 975 Ser Ala Asp Ala Ser Thr Val Ala Glu Gln Val Ser Glu Ala Ala Ser 980 985 990 Arg Arg Asn Asp Trp Gln Gly Val Leu Tyr Leu Trp Gly Leu Asp Ala 995 1000 1005 Val Val Asp Ala Gly Ala Ser Ala Asp Glu Val Ser Glu Ala Thr Arg 1010 1015 1020 Arg Ala Thr Ala Pro Val Leu Gly Leu Val Arg Phe Leu Ser Ala Ala 1025 1030 1035 1040 Pro His Pro Pro Arg Phe Trp Val Val Thr Arg Gly Ala Cys Thr Val 1045 1050 1055 Gly Gly Glu Pro Glu Ala Ser Leu Cys Gln Ala Ala Leu Trp Gly Leu 1060 1065 1070 Ala Arg Val Ala Ala Leu Glu His Pro Ala Ala Trp Gly Gly Leu Val 1075 1080 1085 Asp Leu Asp Pro Gln Lys Ser Pro Thr Glu Ile Glu Pro Leu Val Ala 1090 1095 1100 Glu Leu Leu Ser Pro Asp Ala Glu Asp Gln Leu Ala Phe Arg Ser Gly 1105 1110 1115 1120 Arg Arg His Ala Ala Arg Leu Val Ala Ala Pro Pro Glu Gly Asp Val 1125 1130 1135 Ala Pro Ile Ser Leu Ser Ala Glu Gly Ser Tyr Leu Val Thr Gly Gly 1140 1145 1150 Leu Gly Gly Leu Gly Leu Leu Val Ala Arg Trp Leu Val Glu Arg Gly 1155 1160 1165 Ala Arg His Leu Val Leu Thr Ser Arg His Gly Leu Pro Glu Arg Gln 1170 1175 1180 Ala Ser Gly Gly Glu Gln Pro Pro Glu Ala Arg Ala Arg Ile Ala Ala 1185 1190 1195 1200 Val Glu Gly Leu Glu Ala Gln Gly Ala Arg Val Thr Val Ala Ala Val 1205 1210 1215 Asp Val Ala Glu Ala Asp Pro Met Thr Ala Leu Leu Ala Ala Ile Glu 1220 1225 1230 Pro Pro Leu Arg Gly Val Val His Ala Ala Gly Val Phe Pro Val Arg 1235 1240 1245 His Leu Ala Glu Thr Asp Glu Ala Leu Leu Glu Ser Val Leu Arg Pro 1250 1255 1260 Lys Val Ala Gly Ser Trp Leu Leu His Arg Leu Leu Arg Asp Arg Pro 1265 1270 1275 1280 Leu Asp Leu Phe Val Leu Phe Ser Ser Gly Ala Ala Val Trp Gly Gly 1285 1290 1295 Lys Gly Gln Gly Ala Tyr Ala Ala Ala Asn Ala Phe Leu Asp Gly Leu 1300 1305 1310 Ala His His Arg Arg Ala His Ser Leu Pro Ala Leu Ser Leu Ala Trp 1315 1320 1325 Gly Leu Trp Ala Glu Gly Gly Met Val Asp Ala Lys Ala His Ala Arg 1330 1335 1340 Leu Ser Asp Ile Gly Val Leu Pro Met Ala Thr Gly Pro Ala Leu Ser 1345 1350 1355 1360 Ala Leu Glu Arg Leu Val Asn Thr Ser Ala Val Gln Arg Ser Val Thr 1365 1370 1375 Arg Met Asp Trp Ala Arg Phe Ala Pro Val Tyr Ala Ala Arg Gly Arg 1380 1385 1390 Arg Asn Leu Leu Ser Ala Leu Val Ala Glu Asp Glu Arg Ala Ala Ser 1395 1400 1405 Pro Pro Val Pro Thr Ala Asn Arg Ile Trp Arg Gly Leu Ser Val Ala 1410 1415 1420 Glu Ser Arg Ser Ala Leu Tyr Glu Leu Val Arg Gly Ile Val Ala Arg 1425 1430 1435 1440 Val Leu Gly Phe Ser Asp Pro Gly Ala Leu Asp Val Gly Arg Gly Phe 1445 1450 1455 Ala Glu Gln Gly Leu Asp Ser Leu Met Ala Leu Glu Ile Arg Asn Arg 1460 1465 1470 Leu Gln Arg Glu Leu Gly Glu Arg Leu Ser Ala Thr Leu Ala Phe Asp 1475 1480 1485 His Pro Thr Val Glu Arg Leu Val Ala His Leu Leu Thr Asp Val Leu 1490 1495 1500 Lys Leu Glu Asp Arg Ser Asp Thr Arg His Ile Arg Ser Val Ala Ala 1505 1510 1515 1520 Asp Asp Asp Ile Ala Ile Val Gly Ala Ala Cys Arg Phe Pro Gly Gly 1525 1530 1535 Asp Glu Gly Leu Glu Thr Tyr Trp Arg His Leu Ala Glu Gly Met Val 1540 1545 1550 Val Ser Thr Glu Val Pro Ala Asp Arg Trp Arg Ala Ala Asp Trp Tyr 1555 1560 1565 Asp Pro Asp Pro Glu Val Pro Gly Arg Thr Tyr Val Ala Lys Gly Ala 1570 1575 1580 Phe Leu Arg Asp Val Arg Ser Leu Asp Ala Ala Phe Phe Ala Ile Ser 1585 1590 1595 1600 Pro Arg Glu Ala Met Ser Leu Asp Pro Gln Gln Arg Leu Leu Leu Glu 1605 1610 1615 Val Ser Trp Glu Ala Ile Glu Arg Ala Gly Gln Asp Pro Met Ala Leu 1620 1625 1630 Arg Glu Ser Ala Thr Gly Val Phe Val Gly Met Ile Gly Ser Glu His 1635 1640 1645 Ala Glu Arg Val Gln Gly Leu Asp Asp Asp Ala Ala Leu Leu Tyr Gly 1650 1655 1660 Thr Thr Gly Asn Leu Leu Ser Val Ala Ala Gly Arg Leu Ser Phe Phe 1665 1670 1675 1680 Leu Gly Leu His Gly Pro Thr Met Thr Val Asp Thr Ala Cys Ser Ser 1685 1690 1695 Ser Leu Val Ala Leu His Leu Ala Cys Gln Ser Leu Arg Leu Gly Glu 1700 1705 1710 Cys Asp Gln Ala Leu Ala Gly Gly Ser Ser Val Leu Leu Ser Pro Arg 1715 1720 1725 Ser Phe Val Ala Ala Ser Arg Met Arg Leu Leu Ser Pro Asp Gly Arg 1730 1735 1740 Cys Lys Thr Phe Ser Ala Ala Ala Asp Gly Phe Ala Arg Ala Glu Gly 1745 1750 1755 1760 Cys Ala Val Val Val Leu Lys Arg Leu Arg Asp Ala Gln Arg Asp Arg 1765 1770 1775 Asp Pro Ile Leu Ala Val Val Arg Ser Thr Ala Ile Asn His Asp Gly 1780 1785 1790 Pro Ser Ser Gly Leu Thr Val Pro Ser Gly Pro Ala Gln Gln Ala Leu 1795 1800 1805 Leu Arg Gln Ala Leu Ala Gln Ala Gly Val Ala Pro Ala Glu Val Asp 1810 1815 1820 Phe Val Glu Cys His Gly Thr Gly Thr Ala Leu Gly Asp Pro Ile Glu 1825 1830 1835 1840 Val Gln Ala Leu Gly Ala Val Tyr Gly Arg Gly Arg Pro Ala Glu Arg 1845 1850 1855 Pro Leu Trp Leu Gly Ala Val Lys Ala Asn Leu Gly His Leu Glu Ala 1860 1865 1870 Ala Ala Gly Leu Ala Gly Val Leu Lys Val Leu Leu Ala Leu Glu His 1875 1880 1885 Glu Gln Ile Pro Ala Gln Pro Glu Leu Asp Glu Leu Asn Pro His Ile 1890 1895 1900 Pro Trp Ala Glu Leu Pro Val Ala Val Val Arg Arg Ala Val Pro Trp 1905 1910 1915 1920 Pro Arg Gly Ala Arg Pro Arg Arg Ala Gly Val Ser Ala Phe Gly Leu 1925 1930 1935 Ser Gly Thr Asn Ala His Val Val Leu Glu Glu Ala Pro Ala Val Glu 1940 1945 1950 Pro Val Ala Ala Ala Pro Glu Arg Ala Ala Glu Leu Phe Val Leu Ser 1955 1960 1965 Ala Lys Ser Ala Ala Ala Leu Asp Ala Gln Ala Ala Arg Leu Arg Asp 1970 1975 1980 His Leu Glu Lys His Val Glu Leu Gly Leu Gly Asp Val Ala Phe Ser 1985 1990 1995 2000 Leu Ala Thr Thr Arg Ser Ala Met Glu His Arg Leu Ala Val Ala Ala 2005 2010 2015 Ser Ser Arg Glu Ala Leu Arg Gly Ala Leu Ser Ala Ala Ala Gln Gly 2020 2025 2030 His Thr Pro Pro Gly Ala Val Arg Gly Arg Ala Ser Gly Gly Ser Ala 2035 2040 2045 Pro Lys Val Val Phe Val Phe Pro Gly Gln Gly Ser Gln Trp Val Gly 2050 2055 2060 Met Gly Arg Lys Leu Met Ala Glu Glu Pro Val Phe Arg Ala Ala Leu 2065 2070 2075 2080 Glu Gly Cys Asp Arg Ala Ile Glu Ala Glu Ala Gly Trp Ser Leu Leu 2085 2090 2095 Gly Glu Leu Ser Ala Asp Glu Ala Ala Ser Gln Leu Gly Arg Ile Asp 2100 2105 2110 Val Val Gln Pro Val Leu Phe Ala Met Glu Val Ala Leu Ser Ala Leu 2115 2120 2125 Trp Arg Ser Trp Gly Val Glu Pro Glu Ala Val Val Gly His Ser Met 2130 2135 2140 Gly Glu Val Ala Ala Ala His Val Ala Gly Ala Leu Ser Leu Glu Asp 2145 2150 2155 2160 Ala Val Ala Ile Ile Cys Arg Arg Ser Arg Leu Leu Arg Arg Ile Ser 2165 2170 2175 Gly Gln Gly Glu Met Ala Leu Val Glu Leu Ser Leu Glu Glu Ala Glu 2180 2185 2190 Ala Ala Leu Arg Gly His Glu Gly Arg Leu Ser Val Ala Val Ser Asn 2195 2200 2205 Ser Pro Arg Ser Thr Val Leu Ala Gly Glu Pro Ala Ala Leu Ser Glu 2210 2215 2220 Val Leu Ala Ala Leu Thr Ala Lys Gly Val Phe Trp Arg Gln Val Lys 2225 2230 2235 2240 Val Asp Val Ala Ser His Ser Pro Gln Val Asp Pro Leu Arg Glu Glu 2245 2250 2255 Leu Ile Ala Ala Leu Gly Ala Ile Arg Pro Arg Ala Ala Ala Val Pro 2260 2265 2270 Met Arg Ser Thr Val Thr Gly Gly Val Ile Ala Gly Pro Glu Leu Gly 2275 2280 2285 Ala Ser Tyr Trp Ala Asp Asn Leu Arg Gln Pro Val Arg Phe Ala Ala 2290 2295 2300 Ala Ala Gln Ala Leu Leu Glu Gly Gly Pro Ala Leu Phe Ile Glu Met 2305 2310 2315 2320 Ser Pro His Pro Ile Leu Val Pro Pro Leu Asp Glu Ile Gln Thr Ala 2325 2330 2335 Ala Glu Gln Gly Gly Ala Ala Val Gly Ser Leu Arg Arg Gly Gln Asp 2340 2345 2350 Glu Arg Ala Thr Leu Leu Glu Ala Leu Gly Thr Leu Trp Ala Ser Gly 2355 2360 2365 Tyr Pro Val Ser Trp Ala Arg Leu Phe Pro Ala Gly Gly Arg Arg Val 2370 2375 2380 Pro Leu Pro Thr Tyr Pro Trp Gln His Glu Arg Tyr Trp Ile Glu Asp 2385 2390 2395 2400 Ser Val His Gly Ser Lys Pro Ser Leu Arg Leu Arg Gln Leu Arg Asn 2405 2410 2415 Gly Ala Thr Asp His Pro Leu Leu Gly Ala Pro Leu Leu Val Ser Ala 2420 2425 2430 Arg Pro Gly Ala His Leu Trp Glu Gln Ala Leu Ser Asp Glu Arg Leu 2435 2440 2445 Ser Tyr Leu Ser Glu His Arg Val His Gly Glu Ala Val Leu Pro Ser 2450 2455 2460 Ala Ala Tyr Val Glu Met Ala Leu Ala Ala Gly Val Asp Leu Tyr Gly 2465 2470 2475 2480 Thr Ala Thr Leu Val Leu Glu Gln Leu Ala Leu Glu Arg Ala Leu Ala 2485 2490 2495 Val Pro Ser Glu Gly Gly Arg Ile Val Gln Val Ala Leu Ser Glu Glu 2500 2505 2510 Gly Pro Gly Arg Ala Ser Phe Gln Val Ser Ser Arg Glu Glu Ala Gly 2515 2520 2525 Arg Ser Trp Val Arg His Ala Thr Gly His Val Cys Ser Gly Gln Ser 2530 2535 2540 Ser Ala Val Gly Ala Leu Lys Glu Ala Pro Trp Glu Ile Gln Arg Arg 2545 2550 2555 2560 Cys Pro Ser Val Leu Ser Ser Glu Ala Leu Tyr Pro Leu Leu Asn Glu 2565 2570 2575 His Ala Leu Asp Tyr Gly Pro Cys Phe Gln Gly Val Glu Gln Val Trp 2580 2585 2590 Leu Gly Thr Gly Glu Val Leu Gly Arg Val Arg Leu Pro Gly Asp Met 2595 2600 2605 Ala Ser Ser Ser Gly Ala Tyr Arg Ile His Pro Ala Leu Leu Asp Ala 2610 2615 2620 Cys Phe Gln Val Leu Thr Ala Leu Leu Thr Thr Pro Glu Ser Ile Glu 2625 2630 2635 2640 Ile Arg Arg Arg Leu Thr Asp Leu His Glu Pro Asp Leu Pro Arg Ser 2645 2650 2655 Arg Ala Pro Val Asn Gln Ala Val Ser Asp Thr Trp Leu Trp Asp Ala 2660 2665 2670 Ala Leu Asp Gly Gly Arg Arg Gln Ser Ala Ser Val Pro Val Asp Leu 2675 2680 2685 Val Leu Gly Ser Phe His Ala Lys Trp Glu Val Met Glu Arg Leu Ala 2690 2695 2700 Gln Ala Tyr Ile Ile Gly Thr Leu Arg Ile Trp Asn Val Phe Cys Ala 2705 2710 2715 2720 Ala Gly Glu Arg His Thr Ile Asp Glu Leu Leu Val Arg Leu Gln Ile 2725 2730 2735 Ser Val Val Tyr Arg Lys Val Ile Lys Arg Trp Met Glu His Leu Val 2740 2745 2750 Ala Ile Gly Ile Leu Val Gly Asp Gly Glu His Phe Val Ser Ser Gln 2755 2760 2765 Pro Leu Pro Glu Pro Asp Leu Ala Ala Val Leu Glu Glu Ala Gly Arg 2770 2775 2780 Val Phe Ala Asp Leu Pro Val Leu Phe Glu Trp Cys Lys Phe Ala Gly 2785 2790 2795 2800 Glu Arg Leu Ala Asp Val Leu Thr Gly Lys Thr Leu Ala Leu Glu Ile 2805 2810 2815 Leu Phe Pro Gly Gly Ser Phe Asp Met Ala Glu Arg Ile Tyr Arg Asp 2820 2825 2830 Ser Pro Ile Ala Arg Tyr Ser Asn Gly Ile Val Arg Gly Val Val Glu 2835 2840 2845 Ser Ala Ala Arg Val Val Ala Pro Ser Gly Met Phe Ser Ile Leu Glu 2850 2855 2860 Ile Gly Ala Gly Thr Gly Ala Thr Thr Ala Ala Val Leu Pro Val Leu 2865 2870 2875 2880 Leu Pro Asp Arg Thr Glu Tyr His Phe Thr Asp Val Ser Pro Leu Phe 2885 2890 2895 Leu Ala Arg Ala Glu Gln Arg Phe Arg Asp Tyr Pro Phe Leu Lys Tyr 2900 2905 2910 Gly Ile Leu Asp Val Asp Gln Glu Pro Ala Gly Gln Gly Tyr Ala His 2915 2920 2925 Gln Arg Phe Asp Val Ile Val Ala Ala Asn Val Ile His Ala Thr Arg 2930 2935 2940 Asp Ile Arg Ala Thr Ala Lys Arg Leu Leu Ser Leu Leu Ala Pro Gly 2945 2950 2955 2960 Gly Leu Leu Val Leu Val Glu Gly Thr Gly His Pro Ile Trp Phe Asp 2965 2970 2975 Ile Thr Thr Gly Leu Ile Glu Gly Trp Gln Lys Tyr Glu Asp Asp Leu 2980 2985 2990 Arg Ile Asp His Pro Leu Leu Pro Ala Arg Thr Trp Cys Asp Val Leu 2995 3000 3005 Arg Arg Val Gly Phe Ala Asp Ala Val Ser Leu Pro Gly Asp Gly Ser 3010 3015 3020 Pro Ala Gly Ile Leu Gly Gln His Val Ile Leu Ser Arg Ala Pro Gly 3025 3030 3035 3040 Ile Ala Gly Ala Ala Cys Asp Ser Ser Gly Glu Ser Ala Thr Glu Ser 3045 3050 3055 Pro Ala Ala Arg Ala Val Arg Gln Glu Trp Ala Asp Gly Ser Ala Asp 3060 3065 3070 Val Val His Arg Met Ala Leu Glu Arg Met Tyr Phe His Arg Arg Pro 3075 3080 3085 Gly Arg Gln Val Trp Val His Gly Arg Leu Arg Thr Gly Gly Gly Ala 3090 3095 3100 Phe Thr Lys Ala Leu Ala Gly Asp Leu Leu Leu Phe Glu Asp Thr Gly 3105 3110 3115 3120 Gln Val Val Ala Glu Val Gln Gly Leu Arg Leu Pro Gln Leu Glu Ala 3125 3130 3135 Ser Ala Phe Ala Pro Arg Asp Pro Arg Glu Glu Trp Leu Tyr Ala Leu 3140 3145 3150 Glu Trp Gln Arg Lys Asp Pro Ile Pro Glu Ala Pro Ala Ala Ala Ser 3155 3160 3165 Ser Ser Ser Ala Gly Ala Trp Leu Val Leu Met Asp Gln Gly Gly Thr 3170 3175 3180 Gly Ala Ala Leu Val Ser Leu Leu Glu Gly Arg Gly Glu Ala Cys Val 3185 3190 3195 3200 Arg Val Ile Ala Gly Thr Ala Tyr Ala Cys Leu Ala Pro Gly Leu Tyr 3205 3210 3215 Gln Val Asp Pro Ala Gln Pro Asp Gly Phe His Thr Leu Leu Arg Asp 3220 3225 3230 Ala Phe Gly Glu Asp Arg Ile Cys Arg Ala Val Val His Met Trp Ser 3235 3240 3245 Leu Asp Ala Thr Ala Ala Gly Glu Arg Ala Thr Ala Glu Ser Leu Gln 3250 3255 3260 Ala Asp Gln Leu Leu Gly Ser Leu Ser Ala Leu Ser Leu Val Gln Ala 3265 3270 3275 3280 Leu Val Arg Arg Arg Trp Arg Asn Met Pro Arg Leu Trp Leu Leu Thr 3285 3290 3295 Arg Ala Val His Ala Val Gly Ala Glu Asp Ala Ala Ala Ser Val Ala 3300 3305 3310 Gln Ala Pro Val Trp Gly Leu Gly Arg Thr Leu Ala Leu Glu His Pro 3315 3320 3325 Glu Leu Arg Cys Thr Leu Val Asp Val Asn Pro Ala Pro Ser Pro Glu 3330 3335 3340 Asp Ala Ala Ala Leu Ala Val Glu Leu Gly Ala Ser Asp Arg Glu Asp 3345 3350 3355 3360 Gln Val Ala Leu Arg Ser Asp Gly Arg Tyr Val Ala Arg Leu Val Arg 3365 3370 3375 Ser Ser Phe Ser Gly Lys Pro Ala Thr Asp Cys Gly Ile Arg Ala Asp 3380 3385 3390 Gly Ser Tyr Val Ile Thr Asp Gly Met Gly Arg Val Gly Leu Ser Val 3395 3400 3405 Ala Gln Trp Met Val Met Gln Gly Ala Arg His Val Val Leu Val Asp 3410 3415 3420 Arg Gly Gly Ala Ser Glu Ala Ser Arg Asp Ala Leu Arg Ser Met Ala 3425 3430 3435 3440 Glu Ala Gly Ala Glu Val Gln Ile Val Glu Ala Asp Val Ala Arg Arg 3445 3450 3455 Asp Asp Val Ala Arg Leu Leu Ser Lys Ile Glu Pro Ser Met Pro Pro 3460 3465 3470 Leu Arg Gly Ile Val Tyr Val Asp Gly Thr Phe Gln Gly Asp Ser Ser 3475 3480 3485 Met Leu Glu Leu Asp Ala Arg Arg Phe Lys Glu Trp Met Tyr Pro Lys 3490 3495 3500 Val Leu Gly Ala Trp Asn Leu His Ala Leu Thr Arg Asp Arg Ser Leu 3505 3510 3515 3520 Asp Phe Phe Val Leu Tyr Ser Ser Gly Thr Ser Leu Leu Gly Leu Pro 3525 3530 3535 Gly Gln Gly Ser Arg Ala Ala Gly Asp Ala Phe Leu Asp Ala Ile Ala 3540 3545 3550 His His Arg Cys Lys Val Gly Leu Thr Ala Met Ser Ile Asn Trp Gly 3555 3560 3565 Leu Leu Ser Glu Ala Ser Ser Pro Ala Thr Pro Asn Asp Gly Gly Ala 3570 3575 3580 Arg Leu Glu Tyr Arg Gly Met Glu Gly Leu Thr Leu Glu Gln Gly Ala 3585 3590 3595 3600 Ala Ala Leu Gly Arg Leu Leu Ala Arg Pro Arg Ala Gln Val Gly Val 3605 3610 3615 Met Arg Leu Asn Leu Arg Gln Trp Leu Glu Phe Tyr Pro Asn Ala Ala 3620 3625 3630 Arg Leu Ala Leu Trp Ala Glu Leu Leu Lys Glu Arg Asp Arg Ala Asp 3635 3640 3645 Arg Gly Ala Ser Asn Ala Ser Asn Leu Arg Glu Ala Leu Gln Ser Ala 3650 3655 3660 Arg Pro Glu Asp Arg Gln Leu Ile Leu Glu Lys His Leu Ser Glu Leu 3665 3670 3675 3680 Leu Gly Arg Gly Leu Arg Leu Pro Pro Glu Arg Ile Glu Arg His Val 3685 3690 3695 Pro Phe Ser Asn Leu Gly Met Asp Ser Leu Ile Gly Leu Glu Leu Arg 3700 3705 3710 Asn Arg Ile Glu Ala Ala Leu Gly Ile Thr Val Pro Ala Thr Leu Leu 3715 3720 3725 Trp Thr Tyr Pro Asn Val Ala Ala Leu Ser Gly Ser Leu Leu Asp Ile 3730 3735 3740 Leu Phe Pro Asn Ala Gly Ala Thr His Ala Pro Ala Thr Glu Arg Glu 3745 3750 3755 3760 Lys Ser Phe Glu Asn Asp Ala Ala Asp Leu Glu Ala Leu Arg Gly Met 3765 3770 3775 Thr Asp Glu Gln Lys Asp Ala Leu Leu Ala Glu Lys Leu Ala Gln Leu 3780 3785 3790 Ala Gln Ile Val Gly Glu 3795 <210> 7 <211> 2439 <212> PRT <213> Sorangium cellulosum <400> 7 Met Ala Thr Thr Asn Ala Gly Lys Leu Glu His Ala Leu Leu Leu Met 1 5 10 15 Asp Lys Leu Ala Lys Lys Asn Ala Ser Leu Glu Gln Glu Arg Thr Glu 20 25 30 Pro Ile Ala Ile Val Gly Ile Gly Cys Arg Phe Pro Gly Gly Ala Asp 35 40 45 Thr Pro Glu Ala Phe Trp Glu Leu Leu Asp Ser Gly Arg Asp Ala Val 50 55 60 Gln Pro Leu Asp Arg Arg Trp Ala Leu Val Gly Val His Pro Ser Glu 65 70 75 80 Glu Val Pro Arg Trp Ala Gly Leu Leu Thr Glu Ala Val Asp Gly Phe 85 90 95 Asp Ala Ala Phe Phe Gly Thr Ser Pro Arg Glu Ala Arg Ser Leu Asp 100 105 110 Pro Gln Gln Arg Leu Leu Leu Glu Val Thr Trp Glu Gly Leu Glu Asp 115 120 125 Ala Gly Ile Ala Pro Gln Ser Leu Asp Gly Ser Arg Thr Gly Val Phe 130 135 140 Leu Gly Ala Cys Ser Ser Asp Tyr Ser His Thr Val Ala Gln Gln Arg 145 150 155 160 Arg Glu Glu Gln Asp Ala Tyr Asp Ile Thr Gly Asn Thr Leu Ser Val 165 170 175 Ala Ala Gly Arg Leu Ser Tyr Thr Leu Gly Leu Gln Gly Pro Cys Leu 180 185 190 Thr Val Asp Thr Ala Cys Ser Ser Ser Leu Val Ala Ile His Leu Ala 195 200 205 Cys Arg Ser Leu Arg Ala Arg Glu Ser Asp Leu Ala Leu Ala Gly Gly 210 215 220 Val Asn Met Leu Leu Ser Ser Lys Thr Met Ile Met Leu Gly Arg Ile 225 230 235 240 Gln Ala Leu Ser Pro Asp Gly His Cys Arg Thr Phe Asp Ala Ser Ala 245 250 255 Asn Gly Phe Val Arg Gly Glu Gly Cys Gly Met Val Val Leu Lys Arg 260 265 270 Leu Ser Asp Ala Gln Arg His Gly Asp Arg Ile Trp Ala Leu Ile Arg 275 280 285 Gly Ser Ala Met Asn Gln Asp Gly Arg Ser Thr Gly Leu Met Ala Pro 290 295 300 Asn Val Leu Ala Gln Glu Ala Leu Leu Arg Glu Ala Leu Gln Ser Ala 305 310 315 320 Arg Val Asp Ala Gly Ala Ile Gly Tyr Val Glu Thr His Gly Thr Gly 325 330 335 Thr Ser Leu Gly Asp Pro Ile Glu Val Glu Ala Leu Arg Ala Val Leu 340 345 350 Gly Pro Ala Arg Ala Asp Gly Ser Arg Cys Val Leu Gly Ala Val Lys 355 360 365 Thr Asn Leu Gly His Leu Glu Gly Ala Ala Gly Val Ala Gly Leu Ile 370 375 380 Lys Ala Ala Leu Ala Leu His His Glu Leu Ile Pro Arg Asn Leu His 385 390 395 400 Phe His Thr Leu Asn Pro Arg Ile Arg Ile Glu Gly Thr Ala Leu Ala 405 410 415 Leu Ala Thr Glu Pro Val Pro Trp Pro Arg Ala Gly Arg Pro Arg Phe 420 425 430 Ala Gly Val Ser Ala Phe Gly Leu Ser Gly Thr Asn Val His Val Val 435 440 445 Leu Glu Glu Ala Pro Ala Thr Val Leu Ala Pro Ala Thr Pro Gly Arg 450 455 460 Ser Ala Glu Leu Leu Val Leu Ser Ala Lys Ser Ala Ala Ala Leu Asp 465 470 475 480 Ala Gln Ala Ala Arg Leu Ser Ala His Ile Ala Ala Tyr Pro Glu Gln 485 490 495 Gly Leu Gly Asp Val Ala Phe Ser Leu Val Ser Thr Arg Ser Pro Met 500 505 510 Glu His Arg Leu Ala Val Ala Ala Thr Ser Arg Glu Ala Leu Arg Ser 515 520 525 Ala Leu Glu Val Ala Ala Gln Gly Gln Thr Pro Ala Gly Ala Ala Arg 530 535 540 Gly Arg Ala Ala Ser Ser Pro Gly Lys Leu Ala Phe Leu Phe Ala Gly 545 550 555 560 Gln Gly Ala Gln Val Pro Gly Met Gly Arg Gly Leu Trp Glu Ala Trp 565 570 575 Pro Ala Phe Arg Glu Thr Phe Asp Arg Cys Val Thr Leu Phe Asp Arg 580 585 590 Glu Leu His Gln Pro Leu Cys Glu Val Met Trp Ala Glu Pro Gly Ser 595 600 605 Ser Arg Ser Ser Leu Leu Asp Gln Thr Ala Phe Thr Gln Pro Ala Leu 610 615 620 Phe Ala Leu Glu Tyr Ala Leu Ala Ala Leu Phe Arg Ser Trp Gly Val 625 630 635 640 Glu Pro Glu Leu Val Ala Gly His Ser Leu Gly Glu Leu Val Ala Ala 645 650 655 Cys Val Ala Gly Val Phe Ser Leu Glu Asp Ala Val Arg Leu Val Val 660 665 670 Ala Arg Gly Arg Leu Met Gln Ala Leu Pro Ala Gly Gly Ala Met Val 675 680 685 Ser Ile Ala Ala Pro Glu Ala Asp Val Ala Ala Ala Val Ala Pro His 690 695 700 Ala Ala Leu Val Ser Ile Ala Ala Val Asn Gly Pro Glu Gln Val Val 705 710 715 720 Ile Ala Gly Ala Glu Lys Phe Val Gln Gln Ile Ala Ala Ala Phe Ala 725 730 735 Ala Arg Gly Ala Arg Thr Lys Pro Leu His Val Ser His Ala Phe His 740 745 750 Ser Pro Leu Met Asp Pro Met Leu Glu Ala Phe Arg Arg Val Thr Glu 755 760 765 Ser Val Thr Tyr Arg Arg Pro Ser Ile Ala Leu Val Ser Asn Leu Ser 770 775 780 Gly Lys Pro Cys Thr Asp Glu Val Ser Ala Pro Gly Tyr Trp Val Arg 785 790 795 800 His Ala Arg Glu Ala Val Arg Phe Ala Asp Gly Val Lys Ala Leu His 805 810 815 Ala Ala Gly Ala Gly Leu Phe Val Glu Val Gly Pro Lys Pro Thr Leu 820 825 830 Leu Gly Leu Val Pro Ala Cys Leu Pro Asp Ala Arg Pro Val Leu Leu 835 840 845 Pro Ala Ser Arg Ala Gly Arg Asp Glu Ala Ala Ser Ala Leu Glu Ala 850 855 860 Leu Gly Gly Phe Trp Val Val Gly Gly Ser Val Thr Trp Ser Gly Val 865 870 875 880 Phe Pro Ser Gly Gly Arg Arg Val Pro Leu Pro Thr Tyr Pro Trp Gln 885 890 895 Arg Glu Arg Tyr Trp Ile Glu Ala Pro Val Asp Arg Glu Ala Asp Gly 900 905 910 Thr Gly Arg Ala Arg Ala Gly Gly His Pro Leu Leu Gly Glu Val Phe 915 920 925 Ser Val Ser Thr His Ala Gly Leu Arg Leu Trp Glu Thr Thr Leu Asp 930 935 940 Arg Lys Arg Leu Pro Trp Leu Gly Glu His Arg Ala Gln Gly Glu Val 945 950 955 960 Val Phe Pro Gly Ala Gly Tyr Leu Glu Met Ala Leu Ser Ser Gly Ala 965 970 975 Glu Ile Leu Gly Asp Gly Pro Ile Gln Val Thr Asp Val Val Leu Ile 980 985 990 Glu Thr Leu Thr Phe Ala Gly Asp Thr Ala Val Pro Val Gln Val Val 995 1000 1005 Thr Thr Glu Glu Arg Pro Gly Arg Leu Arg Phe Gln Val Ala Ser Arg 1010 1015 1020 Glu Pro Gly Glu Arg Arg Ala Pro Phe Arg Ile His Ala Arg Gly Val 1025 1030 1035 1040 Leu Arg Arg Ile Gly Arg Val Glu Thr Pro Ala Arg Ser Asn Leu Ala 1045 1050 1055 Ala Leu Arg Ala Arg Leu His Ala Ala Val Pro Ala Ala Ala Ile Tyr 1060 1065 1070 Gly Ala Leu Ala Glu Met Gly Leu Gln Tyr Gly Pro Ala Leu Arg Gly 1075 1080 1085 Leu Ala Glu Leu Trp Arg Gly Glu Gly Glu Ala Leu Gly Arg Val Arg 1090 1095 1100 Leu Pro Glu Ala Ala Gly Ser Ala Thr Ala Tyr Gln Leu His Pro Val 1105 1110 1115 1120 Leu Leu Asp Ala Cys Val Gln Met Ile Val Gly Ala Phe Ala Asp Arg 1125 1130 1135 Asp Glu Ala Thr Pro Trp Ala Pro Val Glu Val Gly Ser Val Arg Leu 1140 1145 1150 Phe Gln Arg Ser Pro Gly Glu Leu Trp Cys His Ala Arg Val Val Ser 1155 1160 1165 Asp Gly Gln Gln Ala Ser Ser Arg Trp Ser Ala Asp Phe Glu Leu Met 1170 1175 1180 Asp Gly Thr Gly Ala Val Val Ala Glu Ile Ser Arg Leu Val Val Glu 1185 1190 1195 1200 Arg Leu Ala Ser Gly Val Arg Arg Arg Asp Ala Asp Asp Trp Phe Leu 1205 1210 1215 Glu Leu Asp Trp Glu Pro Ala Ala Leu Gly Gly Pro Lys Ile Thr Ala 1220 1225 1230 Gly Arg Trp Leu Leu Leu Gly Glu Gly Gly Gly Leu Gly Arg Ser Leu 1235 1240 1245 Cys Ser Ala Leu Lys Ala Ala Gly His Val Val Val His Ala Ala Gly 1250 1255 1260 Asp Asp Thr Ser Thr Ala Gly Met Arg Ala Leu Leu Ala Asn Ala Phe 1265 1270 1275 1280 Asp Gly Gln Ala Pro Thr Ala Val Val His Leu Ser Ser Leu Asp Gly 1285 1290 1295 Gly Gly Gln Leu Gly Pro Gly Leu Gly Ala Gln Gly Ala Leu Asp Ala 1300 1305 1310 Pro Arg Ser Pro Asp Val Asp Ala Asp Ala Leu Glu Ser Ala Leu Met 1315 1320 1325 Arg Gly Cys Asp Ser Val Leu Ser Leu Val Gln Ala Leu Val Gly Met 1330 1335 1340 Asp Leu Arg Asn Ala Pro Arg Leu Trp Leu Leu Thr Arg Gly Ala Gln 1345 1350 1355 1360 Ala Ala Ala Ala Gly Asp Val Ser Val Val Gln Ala Pro Leu Leu Gly 1365 1370 1375 Leu Gly Arg Thr Ile Ala Leu Glu His Ala Glu Leu Arg Cys Ile Ser 1380 1385 1390 Val Asp Leu Asp Pro Ala Glu Pro Glu Gly Glu Ala Asp Ala Leu Leu 1395 1400 1405 Ala Glu Leu Leu Ala Asp Asp Ala Glu Glu Glu Val Ala Leu Arg Gly 1410 1415 1420 Gly Asp Arg Leu Val Ala Arg Leu Val His Arg Leu Pro Asp Ala Gln 1425 1430 1435 1440 Arg Arg Glu Lys Val Glu Pro Ala Gly Asp Arg Pro Phe Arg Leu Glu 1445 1450 1455 Ile Asp Glu Pro Gly Ala Leu Asp Gln Leu Val Leu Arg Ala Thr Gly 1460 1465 1470 Arg Arg Ala Pro Gly Pro Gly Glu Val Glu Ile Ser Val Glu Ala Ala 1475 1480 1485 Gly Leu Asp Ser Ile Asp Ile Gln Leu Ala Leu Gly Val Ala Pro Asn 1490 1495 1500 Asp Leu Pro Gly Glu Glu Ile Glu Pro Leu Val Leu Gly Ser Glu Cys 1505 1510 1515 1520 Ala Gly Arg Ile Val Ala Val Gly Glu Gly Val Asn Gly Leu Val Val 1525 1530 1535 Gly Gln Pro Val Ile Ala Leu Ala Ala Gly Val Phe Ala Thr His Val 1540 1545 1550 Thr Thr Ser Ala Thr Leu Val Leu Pro Arg Pro Leu Gly Leu Ser Ala 1555 1560 1565 Thr Glu Ala Ala Ala Met Pro Leu Ala Tyr Leu Thr Ala Trp Tyr Ala 1570 1575 1580 Leu Asp Lys Val Ala His Leu Gln Ala Gly Glu Arg Val Leu Ile His 1585 1590 1595 1600 Ala Glu Ala Gly Gly Val Gly Leu Cys Ala Val Arg Trp Ala Gln Arg 1605 1610 1615 Val Gly Ala Glu Val Tyr Ala Thr Ala Asp Thr Pro Glu Asn Arg Ala 1620 1625 1630 Tyr Leu Glu Ser Leu Gly Val Arg Tyr Val Ser Asp Ser Arg Ser Gly 1635 1640 1645 Arg Phe Val Thr Asp Val His Ala Trp Thr Asp Gly Glu Gly Val Asp 1650 1655 1660 Val Val Leu Asp Ser Leu Ser Gly Glu Arg Ile Asp Lys Ser Leu Met 1665 1670 1675 1680 Val Leu Arg Ala Cys Gly Arg Leu Val Lys Leu Gly Arg Arg Asp Asp 1685 1690 1695 Cys Ala Asp Thr Gln Pro Gly Leu Pro Pro Leu Leu Arg Asn Phe Ser 1700 1705 1710 Phe Ser Gln Val Asp Leu Arg Gly Met Met Leu Asp Gln Pro Ala Arg 1715 1720 1725 Ile Arg Ala Leu Leu Asp Glu Leu Phe Gly Leu Val Ala Ala Gly Ala 1730 1735 1740 Ile Ser Pro Leu Gly Ser Gly Leu Arg Val Gly Gly Ser Leu Thr Pro 1745 1750 1755 1760 Pro Pro Val Glu Thr Phe Pro Ile Ser Arg Ala Ala Glu Ala Phe Arg 1765 1770 1775 Arg Met Ala Gln Gly Gln His Leu Gly Lys Leu Val Leu Thr Leu Asp 1780 1785 1790 Asp Pro Glu Val Arg Ile Arg Ala Pro Ala Glu Ser Ser Val Ala Val 1795 1800 1805 Arg Ala Asp Gly Thr Tyr Leu Val Thr Gly Gly Leu Gly Gly Leu Gly 1810 1815 1820 Leu Arg Val Ala Gly Trp Leu Ala Glu Arg Gly Ala Gly Gln Leu Val 1825 1830 1835 1840 Leu Val Gly Arg Ser Gly Ala Ala Ser Ala Glu Gln Arg Ala Ala Val 1845 1850 1855 Ala Ala Leu Glu Ala His Gly Ala Arg Val Thr Val Ala Lys Ala Asp 1860 1865 1870 Val Ala Asp Arg Ser Gln Ile Glu Arg Val Leu Arg Glu Val Thr Ala 1875 1880 1885 Ser Gly Met Pro Leu Arg Gly Val Val His Ala Ala Gly Leu Val Asp 1890 1895 1900 Asp Gly Leu Leu Met Gln Gln Thr Pro Ala Arg Phe Arg Thr Val Met 1905 1910 1915 1920 Gly Pro Lys Val Gln Gly Ala Leu His Leu His Thr Leu Thr Arg Glu 1925 1930 1935 Ala Pro Leu Ser Phe Phe Val Leu Tyr Ala Ser Ala Ala Gly Leu Phe 1940 1945 1950 Gly Ser Pro Gly Gln Gly Asn Tyr Ala Ala Ala Asn Ala Phe Leu Asp 1955 1960 1965 Ala Leu Ser His His Arg Arg Ala Gln Gly Leu Pro Ala Leu Ser Ile 1970 1975 1980 Asp Trp Gly Met Phe Thr Glu Val Gly Met Ala Val Ala Gln Glu Asn 1985 1990 1995 2000 Arg Gly Ala Arg Gln Ile Ser Arg Gly Met Arg Gly Ile Thr Pro Asp 2005 2010 2015 Glu Gly Leu Ser Ala Leu Ala Arg Leu Leu Glu Gly Asp Arg Val Gln 2020 2025 2030 Thr Gly Val Ile Pro Ile Thr Pro Arg Gln Trp Val Glu Phe Tyr Pro 2035 2040 2045 Ala Thr Ala Ala Ser Arg Arg Leu Ser Arg Leu Val Thr Thr Gln Arg 2050 2055 2060 Ala Val Ala Asp Arg Thr Ala Gly Asp Arg Asp Leu Leu Glu Gln Leu 2065 2070 2075 2080 Ala Ser Ala Glu Pro Ser Ala Arg Ala Gly Leu Leu Gln Asp Val Val 2085 2090 2095 Arg Val Gln Val Ser His Val Leu Arg Leu Pro Glu Asp Lys Ile Glu 2100 2105 2110 Val Asp Ala Pro Leu Ser Ser Met Gly Met Asp Ser Leu Met Ser Leu 2115 2120 2125 Glu Leu Arg Asn Arg Ile Glu Ala Ala Leu Gly Val Ala Ala Pro Ala 2130 2135 2140 Ala Leu Gly Trp Thr Tyr Pro Thr Val Ala Ala Ile Thr Arg Trp Leu 2145 2150 2155 2160 Leu Asp Asp Ala Leu Val Val Arg Leu Gly Gly Gly Ser Asp Thr Asp 2165 2170 2175 Glu Ser Thr Ala Ser Ala Gly Ser Phe Val His Val Leu Arg Phe Arg 2180 2185 2190 Pro Val Val Lys Pro Arg Ala Arg Leu Phe Cys Phe His Gly Ser Gly 2195 2200 2205 Gly Ser Pro Glu Gly Phe Arg Ser Trp Ser Glu Lys Ser Glu Trp Ser 2210 2215 2220 Asp Leu Glu Ile Val Ala Met Trp His Asp Arg Ser Leu Ala Ser Glu 2225 2230 2235 2240 Asp Ala Pro Gly Lys Lys Tyr Val Gln Glu Ala Ala Ser Leu Ile Gln 2245 2250 2255 His Tyr Ala Asp Ala Pro Phe Ala Leu Val Gly Phe Ser Leu Gly Val 2260 2265 2270 Arg Phe Val Met Gly Thr Ala Val Glu Leu Ala Ser Arg Ser Gly Ala 2275 2280 2285 Pro Ala Pro Leu Ala Val Phe Thr Leu Gly Gly Ser Leu Ile Ser Ser 2290 2295 2300 Ser Glu Ile Thr Pro Glu Met Glu Thr Asp Ile Ile Ala Lys Leu Phe 2305 2310 2315 2320 Phe Arg Asn Ala Ala Gly Phe Val Arg Ser Thr Gln Gln Val Gln Ala 2325 2330 2335 Asp Ala Arg Ala Asp Lys Val Ile Thr Asp Thr Met Val Ala Pro Ala 2340 2345 2350 Pro Gly Asp Ser Lys Glu Pro Pro Val Lys Ile Ala Val Pro Ile Val 2355 2360 2365 Ala Ile Ala Gly Ser Asp Asp Val Ile Val Pro Pro Ser Asp Val Gln 2370 2375 2380 Asp Leu Gln Ser Arg Thr Thr Glu Arg Phe Tyr Met His Leu Leu Pro 2385 2390 2395 2400 Gly Asp His Glu Phe Leu Val Asp Arg Gly Arg Glu Ile Met His Ile 2405 2410 2415 Val Asp Ser His Leu Asn Pro Leu Leu Ala Ala Arg Thr Thr Ser Ser 2420 2425 2430 Gly Pro Ala Phe Glu Ala Lys 2435 <210> 8 <211> 419 <212> PRT <213> Sorangium cellulosum <400> 8 Met Thr Gln Glu Gln Ala Asn Gln Ser Glu Thr Lys Pro Ala Phe Asp 1 5 10 15 Phe Lys Pro Phe Ala Pro Gly Tyr Ala Glu Asp Pro Phe Pro Ala Ile 20 25 30 Glu Arg Leu Arg Glu Ala Thr Pro Ile Phe Tyr Trp Asp Glu Gly Arg 35 40 45 Ser Trp Val Leu Thr Arg Tyr His Asp Val Ser Ala Val Phe Arg Asp 50 55 60 Glu Arg Phe Ala Val Ser Arg Glu Glu Trp Glu Ser Ser Ala Glu Tyr 65 70 75 80 Ser Ser Ala Ile Pro Glu Leu Ser Asp Met Lys Lys Tyr Gly Leu Phe 85 90 95 Gly Leu Pro Pro Glu Asp His Ala Arg Val Arg Lys Leu Val Asn Pro 100 105 110 Ser Phe Thr Ser Arg Ala Ile Asp Leu Leu Arg Ala Glu Ile Gln Arg 115 120 125 Thr Val Asp Gln Leu Leu Asp Ala Arg Ser Gly Gln Glu Glu Phe Asp 130 135 140 Val Val Arg Asp Tyr Ala Glu Gly Ile Pro Met Arg Ala Ile Ser Ala 145 150 155 160 Leu Leu Lys Val Pro Ala Glu Cys Asp Glu Lys Phe Arg Arg Phe Gly 165 170 175 Ser Ala Thr Ala Arg Ala Leu Gly Val Gly Leu Val Pro Gln Val Asp 180 185 190 Glu Glu Thr Lys Thr Leu Val Ala Ser Val Thr Glu Gly Leu Ala Leu 195 200 205 Leu His Asp Val Leu Asp Glu Arg Arg Arg Asn Pro Leu Glu Asn Asp 210 215 220 Val Leu Thr Met Leu Leu Gln Ala Glu Ala Asp Gly Ser Arg Leu Ser 225 230 235 240 Thr Lys Glu Leu Val Ala Leu Val Gly Ala Ile Ile Ala Ala Gly Thr 245 250 255 Asp Thr Thr Ile Tyr Leu Ile Ala Phe Ala Val Leu Asn Leu Leu Arg 260 265 270 Ser Pro Glu Ala Leu Glu Leu Val Lys Ala Glu Pro Gly Leu Met Arg 275 280 285 Asn Ala Leu Asp Glu Val Leu Arg Phe Asp Asn Ile Leu Arg Ile Gly 290 295 300 Thr Val Arg Phe Ala Arg Gln Asp Leu Glu Tyr Cys Gly Ala Ser Ile 305 310 315 320 Lys Lys Gly Glu Met Val Phe Leu Leu Ile Pro Ser Ala Leu Arg Asp 325 330 335 Gly Thr Val Phe Ser Arg Pro Asp Val Phe Asp Val Arg Arg Asp Thr 340 345 350 Gly Ala Ser Leu Ala Tyr Gly Arg Gly Pro His Val Cys Pro Gly Val 355 360 365 Ser Leu Ala Arg Leu Glu Ala Glu Ile Ala Val Gly Thr Ile Phe Arg 370 375 380 Arg Phe Pro Glu Met Lys Leu Lys Glu Thr Pro Val Phe Gly Tyr His 385 390 395 400 Pro Ala Phe Arg Asn Ile Glu Ser Leu Asn Val Ile Leu Lys Pro Ser 405 410 415 Lys Ala Gly <210> 9 <211> 607 <212> PRT <213> Sorangium cellulosum <400> 9 Ala Ser Leu Asp Ala Leu Phe Ala Arg Ala Thr Ser Ala Arg Val Leu 1 5 10 15 Asp Asp Gly His Gly Arg Ala Thr Glu Arg His Val Leu Ala Glu Ala 20 25 30 Arg Gly Ile Glu Asp Leu Arg Ala Leu Arg Glu His Leu Arg Ile Gln 35 40 45 Glu Gly Gly Pro Ser Phe His Cys Met Cys Leu Gly Asp Leu Thr Val 50 55 60 Glu Leu Leu Ala His Asp Gln Pro Leu Ala Ser Ile Ser Phe His His 65 70 75 80 Ala Arg Ser Leu Arg His Pro Asp Trp Thr Ser Asp Ala Met Leu Val 85 90 95 Asp Gly Pro Ala Leu Val Arg Trp Leu Ala Ala Arg Gly Ala Pro Gly 100 105 110 Pro Leu Arg Glu Tyr Glu Glu Glu Arg Glu Arg Ala Arg Thr Ala Gln 115 120 125 Glu Ala Arg Arg Leu Trp Leu Ala Ala Ala Pro Pro Cys Phe Ala Pro 130 135 140 Asp Leu Pro Arg Phe Glu Asp Asp Ala Asn Gly Leu Pro Leu Gly Pro 145 150 155 160 Met Ser Pro Glu Val Ala Glu Ala Glu Arg Arg Leu Arg Ala Ser Tyr 165 170 175 Ala Thr Pro Glu Leu Ala Cys Ala Ala Leu Leu Ala Trp Leu Gly Thr 180 185 190 Gly Ala Gly Pro Trp Ser Gly Tyr Pro Ala Tyr Glu Met Leu Pro Glu 195 200 205 Asn Leu Leu Leu Gly Phe Gly Leu Pro Thr Ala Ile Ala Ala Ala Ser 210 215 220 Ala Pro Gly Thr Ser Glu Ala Ala Leu Arg Gly Ala Ala Arg Leu Phe 225 230 235 240 Ala Ser Trp Glu Val Val Ser Ser Lys Lys Ser Gln Leu Gly Asn Ile 245 250 255 Pro Glu Ala Leu Trp Glu Arg Leu Arg Thr Ile Val Arg Ala Met Gly 260 265 270 Asn Ala Asp Asn Leu Ser Arg Phe Glu Arg Ala Glu Ala Ile Ala Ala 275 280 285 Glu Val Arg Arg Leu Arg Ala Gln Pro Ala Pro Phe Ala Ala Gly Ala 290 295 300 Gly Leu Ala Val Ala Gly Val Ser Ser Ser Gly Arg Leu Ser Gly Leu 305 310 315 320 Val Thr Asp Gly Asp Ala Leu Tyr Ser Gly Asp Gly Asn Asp Ile Val 325 330 335 Met Phe Gln Pro Gly Arg Ile Ser Pro Val Val Leu Leu Ala Gly Thr 340 345 350 Asp Pro Phe Phe Glu Leu Ala Pro Pro Leu Ser Gln Met Leu Phe Val 355 360 365 Ala His Ala Asn Ala Gly Thr Ile Ser Lys Val Leu Thr Glu Gly Ser 370 375 380 Pro Leu Ile Val Met Ala Arg Asn Gln Ala Arg Pro Met Ser Leu Val 385 390 395 400 His Ala Arg Gly Phe Met Ala Trp Val Asn Gln Ala Met Val Pro Asp 405 410 415 Pro Glu Arg Gly Ala Pro Phe Val Val Gln Arg Ser Thr Ile Met Glu 420 425 430 Phe Glu His Pro Thr Pro Arg Cys Leu His Glu Pro Ala Gly Ser Ala 435 440 445 Phe Ser Leu Ala Cys Asp Glu Glu His Leu Tyr Trp Cys Glu Leu Ser 450 455 460 Ala Gly Arg Leu Glu Leu Trp Arg His Pro His His Arg Pro Gly Ala 465 470 475 480 Pro Ser Arg Phe Ala Tyr Leu Gly Glu His Pro Ile Ala Ala Thr Trp 485 490 495 Tyr Pro Ser Leu Thr Leu Asn Ala Thr His Val Leu Trp Ala Asp Pro 500 505 510 Asp Arg Arg Ala Ile Leu Gly Val Asp Lys Arg Thr Gly Val Glu Pro 515 520 525 Ile Val Leu Ala Glu Thr Arg His Pro Pro Ala His Val Val Ser Glu 530 535 540 Asp Arg Asp Ile Phe Ala Leu Thr Gly Gln Pro Asp Ser Arg Asp Trp 545 550 555 560 His Val Glu His Ile Arg Ser Gly Ala Ser Thr Val Val Ala Asp Tyr 565 570 575 Gln Arg Gln Leu Trp Asp Arg Pro Asp Met Val Leu Asn Arg Arg Gly 580 585 590 Leu Phe Phe Thr Thr Asn Asp Arg Ile Leu Thr Leu Ala Arg Ser 595 600 605 <210> 10 <211> 423 <212> PRT <213> Sorangium cellulosum <400> 10 Met Gly Ala Leu Ile Ser Val Ala Ala Pro Gly Cys Ala Leu Gly Gly 1 5 10 15 Ala Glu Glu Glu Gly Gln Pro Gly Gln Asp Ala Gly Ala Gly Ala Leu 20 25 30 Ala Pro Ala Arg Glu Val Met Ala Ala Glu Val Ala Ala Gly Gln Met 35 40 45 Pro Gly Ala Val Trp Leu Val Ala Arg Gly Asp Asp Val His Val Asp 50 55 60 Ala Val Gly Val Thr Glu Leu Gly Gly Ser Ala Pro Met Arg Arg Asp 65 70 75 80 Thr Ile Phe Arg Ile Ala Ser Met Thr Lys Ala Val Thr Ala Thr Ala 85 90 95 Val Met Met Leu Val Glu Glu Gly Lys Leu Asp Leu Asp Ser Pro Val 100 105 110 Asp Arg Trp Leu Pro Glu Leu Ala Asn Arg Lys Val Leu Ala Arg Ile 115 120 125 Asp Gly Pro Ile Asp Glu Thr Val Pro Ala Glu Arg Pro Ile Thr Val 130 135 140 Arg Asp Leu Met Thr Phe Thr Met Gly Phe Gly Ile Ser Phe Asp Ala 145 150 155 160 Ser Ser Pro Ile Gln Arg Ala Ile Asp Glu Leu Gly Leu Val Asn Ala 165 170 175 Gln Pro Val Pro Met Thr Pro His Gly Pro Asp Glu Trp Ile Arg Arg 180 185 190 Leu Gly Thr Leu Pro Leu Met His Gln Pro Gly Ala Gln Trp Met Tyr 195 200 205 Asn Thr Gly Ser Leu Val Gln Gly Val Leu Val Gly Arg Ala Ala Asp 210 215 220 Gln Gly Phe Asp Ala Phe Val Arg Glu Arg Ile Leu Ala Pro Leu Gly 225 230 235 240 Met Arg Asp Thr Asp Phe His Val Pro Ala Asp Lys Leu Ala Arg Phe 245 250 255 Ala Gly Cys Gly Tyr Phe Thr Asp Glu Gln Thr Gly Glu Lys Thr Arg 260 265 270 Met Asp Arg Asp Gly Ala Glu Ser Ala Tyr Ala Ser Pro Pro Ala Phe 275 280 285 Pro Ser Gly Ala Ala Gly Leu Val Ser Thr Val Asp Asp Tyr Leu Leu 290 295 300 Phe Ala Arg Met Leu Met Asn Gly Gly Val His Glu Gly Arg Arg Leu 305 310 315 320 Leu Ser Ala Ala Ser Val Arg Glu Met Thr Ala Asp His Leu Thr Pro 325 330 335 Ala Gln Lys Ala Ala Ser Ser Phe Phe Pro Gly Phe Phe Glu Thr His 340 345 350 Gly Trp Gly Tyr Gly Met Ala Val Val Thr Ala Pro Asp Ala Val Ser 355 360 365 Glu Val Pro Gly Arg Tyr Gly Trp Asp Gly Gly Phe Gly Thr Ser Trp 370 375 380 Ile Asn Asp Pro Gly Arg Glu Leu Ile Gly Ile Val Met Thr Gln Ser 385 390 395 400 Ala Gly Phe Leu Phe Ser Gly Ala Leu Glu Arg Phe Trp Arg Ser Val 405 410 415 Tyr Val Ala Thr Glu Ser Ala 420 <210> 11 <211> 713 <212> PRT <213> Sorangium cellulosum <400> 11 Met His Gly Leu Thr Glu Arg Gln Val Leu Leu Ser Leu Val Thr Leu 1 5 10 15 Ala Leu Ile Leu Val Thr Ala Arg Ala Ser Gly Glu Leu Ala Arg Arg 20 25 30 Leu Arg Gln Pro Glu Val Leu Gly Glu Leu Phe Gly Gly Val Val Leu 35 40 45 Gly Pro Ser Val Val Gly Ala Leu Ala Pro Gly Phe His Arg Ala Leu 50 55 60 Phe Gln Glu Pro Ala Val Gly Val Val Leu Ser Gly Ile Ser Trp Ile 65 70 75 80 Gly Ala Leu Leu Leu Leu Leu Met Ala Gly Ile Glu Val Asp Val Gly 85 90 95 Ile Leu Arg Lys Glu Ala Arg Pro Gly Ala Leu Ser Ala Leu Gly Ala 100 105 110 Ile Ala Pro Pro Leu Ala Ala Gly Ala Ala Phe Ser Ala Leu Val Leu 115 120 125 Asp Arg Pro Leu Pro Ser Gly Leu Phe Leu Gly Ile Val Leu Ser Val 130 135 140 Thr Ala Val Ser Val Ile Ala Lys Val Leu Ile Glu Arg Glu Ser Met 145 150 155 160 Arg Arg Ser Tyr Ala Gln Val Thr Leu Ala Ala Gly Val Val Ser Glu 165 170 175 Val Ala Ala Trp Val Leu Val Ala Met Thr Ser Ser Ser Tyr Gly Ala 180 185 190 Ser Pro Ala Leu Ala Val Ala Arg Ser Ala Leu Leu Ala Ser Gly Phe 195 200 205 Leu Leu Phe Met Val Leu Val Gly Arg Arg Leu Thr His Leu Ala Met 210 215 220 Arg Trp Val Ala Asp Ala Thr Arg Val Ser Lys Gly Gln Val Ser Leu 225 230 235 240 Val Leu Val Leu Thr Phe Leu Ala Ala Ala Leu Thr Gln Arg Leu Gly 245 250 255 Leu His Pro Leu Leu Gly Ala Phe Ala Leu Gly Val Leu Leu Asn Ser 260 265 270 Ala Pro Arg Thr Asn Arg Pro Leu Leu Asp Gly Val Gln Thr Leu Val 275 280 285 Ala Gly Leu Phe Ala Pro Val Phe Phe Val Leu Ala Gly Met Arg Val 290 295 300 Asp Val Ser Gln Leu Arg Thr Pro Ala Ala Trp Gly Thr Val Ala Leu 305 310 315 320 Leu Leu Ala Thr Ala Thr Ala Ala Lys Val Val Pro Ala Ala Leu Gly 325 330 335 Ala Arg Leu Gly Gly Leu Arg Gly Ser Glu Ala Ala Leu Val Ala Val 340 345 350 Gly Leu Asn Met Lys Gly Gly Thr Asp Leu Ile Val Ala Ile Val Gly 355 360 365 Val Glu Leu Gly Leu Leu Ser Asn Glu Ala Tyr Thr Met Tyr Ala Val 370 375 380 Val Ala Leu Val Thr Val Thr Ala Ser Pro Ala Leu Leu Ile Trp Leu 385 390 395 400 Glu Lys Arg Ala Pro Pro Thr Gln Glu Glu Ser Ala Arg Leu Glu Arg 405 410 415 Glu Glu Ala Ala Arg Arg Ala Tyr Ile Pro Gly Val Glu Arg Ile Leu 420 425 430 Val Pro Ile Val Ala His Ala Leu Pro Gly Phe Ala Thr Asp Ile Val 435 440 445 Glu Ser Ile Val Ala Ser Lys Arg Lys Leu Gly Glu Thr Val Asp Ile 450 455 460 Thr Glu Leu Ser Val Glu Gln Gln Ala Pro Gly Pro Ser Arg Ala Ala 465 470 475 480 Gly Glu Ala Ser Arg Gly Leu Ala Arg Leu Gly Ala Arg Leu Arg Val 485 490 495 Gly Ile Trp Arg Gln Arg Arg Glu Leu Arg Gly Ser Ile Gln Ala Ile 500 505 510 Leu Arg Ala Ser Arg Asp His Asp Leu Leu Val Ile Gly Ala Arg Ser 515 520 525 Pro Ala Arg Ala Arg Gly Met Ser Phe Gly Arg Leu Gln Asp Ala Ile 530 535 540 Val Gln Arg Ala Glu Ser Asn Val Leu Val Val Val Gly Asp Pro Pro 545 550 555 560 Ala Ala Glu Arg Ala Ser Ala Arg Arg Ile Leu Val Pro Ile Ile Gly 565 570 575 Leu Glu Tyr Ser Phe Ala Ala Ala Asp Leu Ala Ala His Val Ala Leu 580 585 590 Ala Trp Asp Ala Glu Leu Val Leu Leu Ser Ser Ala Gln Thr Asp Pro 595 600 605 Gly Ala Val Val Trp Arg Asp Arg Glu Pro Ser Arg Val Arg Ala Val 610 615 620 Ala Arg Ser Val Val Asp Glu Ala Val Phe Arg Gly Arg Arg Leu Gly 625 630 635 640 Val Arg Val Ser Ser Arg Val His Val Gly Ala His Pro Ser Asp Glu 645 650 655 Ile Thr Arg Glu Leu Ala Arg Ala Pro Tyr Asp Leu Leu Val Leu Gly 660 665 670 Cys Tyr Asp His Gly Pro Leu Gly Arg Leu Tyr Leu Gly Ser Thr Val 675 680 685 Glu Ser Val Val Val Arg Ser Arg Val Pro Val Ala Leu Leu Val Ala 690 695 700 His Gly Gly Thr Arg Glu Gln Val Arg 705 710 <210> 12 <211> 126 <212> PRT <213> Sorangium cellulosum <400> 12 Met Asp Lys Pro Ile Gly Arg Thr Arg Cys Ala Ile Ala Glu Gly Tyr 1 5 10 15 Ile Pro Gly Gly Ser Asn Gly Pro Glu Pro Gln Met Thr Ser His Glu 20 25 30 Thr Ala Cys Leu Leu Asn Ala Ser Asp Arg Asp Ala Gln Val Ala Ile 35 40 45 Thr Val Tyr Phe Ser Asp Arg Asp Pro Ala Gly Pro Tyr Arg Val Thr 50 55 60 Val Pro Ala Arg Arg Thr Arg His Val Arg Phe Asn Asp Leu Thr Glu 65 70 75 80 Pro Glu Pro Ile Pro Arg Asp Thr Asp Tyr Ala Ser Val Ile Glu Ser 85 90 95 Asp Ala Pro Ile Val Val Gln His Thr Arg Leu Asp Ser Arg Gln Ala 100 105 110 Glu Asn Ala Leu Leu Ser Thr Ile Ala Tyr Thr Asp Arg Glu 115 120 125 <210> 13 <211> 149 <212> PRT <213> Sorangium cellulosum <400> 13 Met Lys His Val Asp Thr Gly Arg Arg Phe Gly Arg Arg Ile Gly His 1 5 10 15 Thr Leu Gly Leu Leu Ala Ser Met Ala Leu Ala Gly Cys Gly Gly Pro 20 25 30 Ser Glu Lys Thr Val Gln Gly Thr Arg Leu Ala Pro Gly Ala Asp Ala 35 40 45 Arg Val Thr Ala Asp Val Asp Pro Asp Ala Ala Thr Thr Arg Leu Ala 50 55 60 Val Asp Val Val His Leu Ser Pro Pro Glu Arg Leu Glu Ala Gly Ser 65 70 75 80 Glu Arg Phe Val Val Trp Gln Arg Pro Ser Pro Glu Ser Pro Trp Arg 85 90 95 Arg Val Gly Val Leu Asp Tyr Asn Ala Asp Ser Arg Arg Gly Lys Leu 100 105 110 Ala Glu Thr Thr Val Pro Tyr Ala Asn Phe Glu Leu Leu Ile Thr Ala 115 120 125 Glu Lys Gln Ser Ser Pro Gln Ser Pro Ser Ser Ala Ala Val Ile Gly 130 135 140 Pro Thr Ser Val Gly 145 <210> 14 <211> 184 <212> PRT <213> Sorangium cellulosum <400> 14 Val Thr Ser Glu Glu Val Pro Gly Ala Ala Leu Gly Ala Gln Ser Ser 1 5 10 15 Leu Val Arg Ala Gln His Ala Ala Arg His Val Arg Pro Cys Thr Arg 20 25 30 Ala Glu Glu Pro Pro Ala Leu Met His Gly Leu Thr Glu Arg Gln Val 35 40 45 Leu Leu Ser Leu Val Ala Leu Ala Leu Val Leu Leu Thr Ala Arg Ala 50 55 60 Phe Gly Glu Leu Ala Arg Arg Leu Arg Gln Pro Glu Val Leu Gly Glu 65 70 75 80 Leu Phe Gly Gly Val Val Leu Gly Pro Ser Val Val Gly Ala Leu Ala 85 90 95 Pro Gly Phe His Arg Val Leu Phe Gln Asp Pro Ala Val Gly Val Val 100 105 110 Leu Ser Gly Ile Ser Trp Ile Gly Ala Leu Val Leu Leu Leu Met Ala 115 120 125 Gly Ile Glu Val Asp Val Ser Ile Leu Arg Lys Glu Ala Arg Pro Gly 130 135 140 Ala Leu Ser Ala Leu Gly Ala Ile Ala Pro Pro Leu Arg Thr Pro Gly 145 150 155 160 Pro Leu Val Gln Arg Met Gln Gly Ala Phe Thr Trp Asp Leu Asp Val 165 170 175 Ser Pro Arg Arg Ser Ala Gln Ala 180 <210> 15 <211> 145 <212> PRT <213> Sorangium cellulosum <400> 15 Val Asn Ala Pro Cys Met Arg Cys Thr Ser Gly Pro Gly Val Arg Ser 1 5 10 15 Gly Gly Ala Ile Ala Pro Ser Ala Glu Ser Ala Pro Gly Arg Ala Ser 20 25 30 Leu Arg Arg Met Leu Thr Ser Thr Ser Ile Pro Ala Met Ser Ser Arg 35 40 45 Thr Ser Ala Pro Ile Gln Glu Met Pro Glu Ser Thr Thr Pro Thr Ala 50 55 60 Gly Ser Trp Lys Arg Thr Arg Trp Asn Pro Gly Ala Ser Ala Pro Thr 65 70 75 80 Thr Asp Gly Pro Ser Thr Thr Pro Pro Lys Ser Ser Pro Ser Thr Ser 85 90 95 Gly Trp Arg Ser Arg Arg Ala Ser Ser Pro Lys Ala Arg Ala Val Arg 100 105 110 Arg Thr Ser Ala Arg Ala Thr Ser Glu Ser Arg Thr Cys Arg Ser Val 115 120 125 Arg Pro Cys Ile Arg Ala Gly Gly Ser Ser Ala Arg Val Gln Gly Arg 130 135 140 Thr 145 <210> 16 <211> 185 <212> PRT <213> Sorangium cellulosum <400> 16 Val Leu Ala Pro Pro Ala Asp Ile Arg Pro Pro Ala Ala Ala Gln Leu 1 5 10 15 Glu Pro Asp Ser Pro Asp Asp Glu Ala Asp Glu Ala Asp Glu Ala Leu 20 25 30 Arg Pro Phe Arg Asp Ala Ile Ala Ala Tyr Ser Glu Ala Val Arg Trp 35 40 45 Ala Glu Ala Ala Gln Arg Pro Arg Leu Glu Ser Leu Val Arg Leu Ala 50 55 60 Ile Val Arg Leu Gly Lys Ala Leu Asp Lys Val Pro Phe Ala His Thr 65 70 75 80 Thr Ala Gly Val Ser Gln Ile Ala Gly Arg Leu Gln Asn Asp Ala Val 85 90 95 Trp Phe Asp Val Ala Ala Arg Tyr Ala Ser Phe Arg Ala Ala Thr Glu 100 105 110 His Ala Leu Arg Asp Ala Ala Ser Ala Met Glu Ala Leu Ala Ala Gly 115 120 125 Pro Tyr Arg Gly Ser Ser Arg Val Ser Ala Ala Val Gly Glu Phe Arg 130 135 140 Gly Glu Ala Ala Arg Leu His Pro Ala Asp Arg Val Pro Ala Ser Asp 145 150 155 160 Gln Gln Ile Leu Thr Ala Leu Arg Ala Ala Glu Arg Ala Leu Ile Ala 165 170 175 Leu Tyr Thr Ala Phe Ala Arg Glu Glu 180 185 <210> 17 <211> 146 <212> PRT <213> Sorangium cellulosum <400> 17 Met Ala Asp Ala Ala Ser Arg Ser Ala Cys Ser Val Ala Ala Arg Lys 1 5 10 15 Leu Ala Tyr Arg Ala Ala Thr Ser Asn Gln Thr Ala Ser Phe Trp Ser 20 25 30 Leu Pro Ala Ile Trp Glu Thr Pro Ala Val Val Cys Ala Lys Gly Thr 35 40 45 Leu Ser Ser Ala Leu Pro Ser Arg Thr Ile Ala Ser Arg Thr Arg Leu 50 55 60 Ser Ser Arg Gly Arg Cys Ala Ala Ser Ala His Arg Thr Ala Ser Glu 65 70 75 80 Tyr Ala Ala Ile Ala Ser Arg Asn Gly Arg Ser Ala Ser Ser Ala Ser 85 90 95 Ser Ala Ser Ser Ser Gly Glu Ser Gly Ser Ser Trp Ala Ala Ala Gly 100 105 110 Gly Arg Met Ser Ala Gly Gly Ala Ser Thr Gly Glu Val Tyr Glu Gln 115 120 125 Ala Pro Arg Leu Arg Leu Ala Gln Ser Val Ala Ala Arg Arg Arg Asp 130 135 140 Pro Thr 145 <210> 18 <211> 288 <212> PRT <213> Sorangium cellulosum <400> 18 Val Thr Val Ser Ser Met Pro Arg Ser Trp Ser Ser Arg Val Arg Thr 1 5 10 15 Val Val Thr Ala Leu Gly Cys Ala Arg Arg Leu Ser Gly Ser Ile Ser 20 25 30 Arg Leu Arg Arg His Pro Glu Ala Gly Arg Ala Pro Arg Ser Arg Leu 35 40 45 Arg Ala Trp Arg Arg Leu Pro Gln His Ile Ser Ser Pro Trp Arg His 50 55 60 Leu Pro Pro Gly Ala Arg Val Gly Thr Ser Cys Pro Ala Asp Arg Arg 65 70 75 80 Ile Leu Pro Ser His Arg Thr Ala Asp Leu Gly Thr Ser Gly Gly Thr 85 90 95 Leu Val Ala Arg Met Ser Gly His Val Ala Arg Asn Pro His Ala Ala 100 105 110 Val Leu Val Gly Asp Gly Ser Ala Arg Gly Arg Arg Arg Leu Ser Asn 115 120 125 Arg Arg Ala Glu Arg Arg Val Ser Asp Val Thr Cys Arg Glu Gly Gly 130 135 140 Glu Ala Met Gln Lys Ile Ala Gly Lys Leu Val Val Gly Leu Ile Ser 145 150 155 160 Val Ser Gly Met Ser Leu Leu Ala Ala Cys Gly Gly Glu Lys Arg Ser 165 170 175 Gly Gly Glu Ala Gln Thr Pro Gly Gly Ala Gln Gly Glu Ala Pro Val 180 185 190 Pro Val Gly Ser Ala Val Asp Ser Ile Val Ala Ala Arg Cys Asp Arg 195 200 205 Glu Ala Arg Cys Asn Asn Ile Gly Gln Asp Arg Glu Tyr Ser Ser Lys 210 215 220 Asp Ala Cys Ser Asn Lys Ile Arg Ser Glu Trp Arg Asp Glu Leu Thr 225 230 235 240 Phe Gly Glu Cys Pro Gly Gly Ile Asp Ala Lys Gln Leu Asn Glu Cys 245 250 255 Leu Glu Gly Ile Arg Asn Glu Gly Cys Gly Asn Pro Phe Asp Thr Leu 260 265 270 Gly Arg Val Val Ala Cys Arg Ser Ser Asp Leu Cys Arg Asp Ala Arg 275 280 285 <210> 19 <211> 288 <212> PRT <213> Sorangium cellulosum <400> 19 Val Thr Val Ser Ser Met Pro Arg Ser Trp Ser Ser Arg Val Arg Thr 1 5 10 15 Val Val Thr Ala Leu Gly Cys Ala Arg Arg Leu Ser Gly Ser Ile Ser 20 25 30 Arg Leu Arg Arg His Pro Glu Ala Gly Arg Ala Pro Arg Ser Arg Leu 35 40 45 Arg Ala Trp Arg Arg Leu Pro Gln His Ile Ser Ser Pro Trp Arg His 50 55 60 Leu Pro Pro Gly Ala Arg Val Gly Thr Ser Cys Pro Ala Asp Arg Arg 65 70 75 80 Ile Leu Pro Ser His Arg Thr Ala Asp Leu Gly Thr Ser Gly Gly Thr 85 90 95 Leu Val Ala Arg Met Ser Gly His Val Ala Arg Asn Pro His Ala Ala 100 105 110 Val Leu Val Gly Asp Gly Ser Ala Arg Gly Arg Arg Arg Leu Ser Asn 115 120 125 Arg Arg Ala Glu Arg Arg Val Ser Asp Val Thr Cys Arg Glu Gly Gly 130 135 140 Glu Ala Met Gln Lys Ile Ala Gly Lys Leu Val Val Gly Leu Ile Ser 145 150 155 160 Val Ser Gly Met Ser Leu Leu Ala Ala Cys Gly Gly Glu Lys Arg Ser 165 170 175 Gly Gly Glu Ala Gln Thr Pro Gly Gly Ala Gln Gly Glu Ala Pro Val 180 185 190 Pro Val Gly Ser Ala Val Asp Ser Ile Val Ala Ala Arg Cys Asp Arg 195 200 205 Glu Ala Arg Cys Asn Asn Ile Gly Gln Asp Arg Glu Tyr Ser Ser Lys 210 215 220 Asp Ala Cys Ser Asn Lys Ile Arg Ser Glu Trp Arg Asp Glu Leu Thr 225 230 235 240 Phe Gly Glu Cys Pro Gly Gly Ile Asp Ala Lys Gln Leu Asn Glu Cys 245 250 255 Leu Glu Gly Ile Arg Asn Glu Gly Cys Gly Asn Pro Phe Asp Thr Leu 260 265 270 Gly Arg Val Val Ala Cys Arg Ser Ser Asp Leu Cys Arg Asp Ala Arg 275 280 285 <210> 20 <211> 155 <212> PRT <213> Sorangium cellulosum <400> 20 Met Asp Pro Arg Ala Arg Arg Glu Lys Arg Pro Ser Leu Leu Asp Ser 1 5 10 15 Arg Gly Arg Gln Pro Lys Arg Ser Gln Gln Gly Gly His Met Glu Lys 20 25 30 Pro Ile Gly Arg Thr Arg Trp Ala Ile Ala Glu Gly Tyr Ile Pro Gly 35 40 45 Arg Ser Asn Gly Pro Glu Pro Gln Met Thr Ser His Glu Thr Ala Cys 50 55 60 Leu Leu Asn Ala Ser Asp Arg Asp Ala Gln Val Ala Ile Thr Val Tyr 65 70 75 80 Phe Ser Asp Arg Asp Pro Ala Gly Pro Tyr Arg Val Thr Val Pro Ala 85 90 95 Arg Arg Thr Arg His Val Arg Phe Asn Asp Leu Thr Glu Pro Glu Pro 100 105 110 Ile Pro Arg Asp Thr Asp Tyr Ala Ser Val Ile Glu Ser Asp Val Pro 115 120 125 Ile Val Val Gln His Thr Arg Leu Asp Ser Arg Gln Ala Glu Asn Ala 130 135 140 Leu Ile Ser Thr Ile Ala Tyr Thr Asp Arg Glu 145 150 155 <210> 21 <211> 156 <212> PRT <213> Sorangium cellulosum <400> 21 Val Arg Arg Ser Arg Trp Gln Met Lys His Val Asp Thr Gly Arg Arg 1 5 10 15 Val Gly Arg Arg Ile Gly Leu Thr Leu Gly Leu Leu Ala Ser Met Ala 20 25 30 Leu Ala Gly Cys Gly Gly Pro Ser Glu Lys Ile Val Gln Gly Thr Arg 35 40 45 Leu Ala Pro Gly Ala Asp Ala His Val Ala Ala Asp Val Asp Pro Asp 50 55 60 Ala Ala Thr Thr Arg Leu Ala Val Asp Val Val His Leu Ser Pro Pro 65 70 75 80 Glu Arg Ile Glu Ala Gly Ser Glu Arg Phe Val Val Trp Gln Arg Pro 85 90 95 Ser Ser Glu Ser Pro Trp Gln Arg Val Gly Val Leu Asp Tyr Asn Ala 100 105 110 Ala Ser Arg Arg Gly Lys Leu Ala Glu Thr Thr Val Pro His Ala Asn 115 120 125 Phe Glu Leu Leu Ile Thr Val Glu Lys Gln Ser Ser Pro Gln Ser Pro 130 135 140 Ser Ser Ala Ala Val Ile Gly Pro Thr Ser Val Gly 145 150 155 <210> 22 <211> 305 <212> PRT <213> Sorangium cellulosum <400> 22 Met Glu Lys Glu Ser Arg Ile Ala Ile Tyr Gly Ala Ile Ala Ala Asn 1 5 10 15 Val Ala Ile Ala Ala Val Lys Phe Ile Ala Ala Ala Val Thr Gly Ser 20 25 30 Ser Ala Met Leu Ser Glu Gly Val His Ser Leu Val Asp Thr Ala Asp 35 40 45 Gly Leu Leu Leu Leu Leu Gly Lys His Arg Ser Ala Arg Pro Pro Asp 50 55 60 Ala Glu His Pro Phe Gly His Gly Lys Glu Leu Tyr Phe Trp Thr Leu 65 70 75 80 Ile Val Ala Ile Met Ile Phe Ala Ala Gly Gly Gly Val Ser Ile Tyr 85 90 95 Glu Gly Ile Leu His Leu Leu His Pro Arg Gln Ile Glu Asp Pro Thr 100 105 110 Trp Asn Tyr Val Val Leu Gly Ala Ala Ala Val Phe Glu Gly Thr Ser 115 120 125 Leu Ile Ile Ser Ile His Glu Phe Lys Lys Lys Asp Gly Gln Gly Tyr 130 135 140 Leu Ala Ala Met Arg Ser Ser Lys Asp Pro Thr Thr Phe Thr Ile Val 145 150 155 160 Leu Glu Asp Ser Ala Ala Leu Ala Gly Leu Thr Ile Ala Phe Leu Gly 165 170 175 Val Trp Leu Gly His Arg Leu Gly Asn Pro Tyr Leu Asp Gly Ala Ala 180 185 190 Ser Ile Gly Ile Gly Leu Val Leu Ala Ala Val Ala Val Phe Leu Ala 195 200 205 Ser Gln Ser Arg Gly Leu Leu Val Gly Glu Ser Ala Asp Arg Glu Leu 210 215 220 Leu Ala Ala Ile Arg Ala Leu Ala Ser Ala Asp Pro Gly Val Ser Ala 225 230 235 240 Val Gly Arg Pro Leu Thr Met His Phe Gly Pro His Glu Val Leu Val 245 250 255 Val Leu Arg Ile Glu Phe Asp Ala Ala Leu Thr Ala Ser Gly Val Ala 260 265 270 Glu Ala Ile Glu Arg Ile Glu Thr Arg Ile Arg Ser Glu Arg Pro Asp 275 280 285 Val Lys His Ile Tyr Val Glu Ala Arg Ser Leu His Gln Arg Ala Arg 290 295 300 Ala 305 <210> 23 <211> 135 <212> PRT <213> Sorangium cellulosum <400> 23 Val Gln Thr Ser Ser Phe Asp Ala Arg Tyr Ala Gly Cys Lys Ser Ser 1 5 10 15 Arg Arg Ile Ala Arg Ser Gly Ser Ala Gly Ala Arg Ala Gly Arg Ala 20 25 30 His Glu Gly Ala Ala Ser Ala Gly Phe Glu Gly Gly Asp Val Met Arg 35 40 45 Lys Ala Arg Ala His Gly Ala Met Leu Gly Gly Arg Asp Asp Gly Trp 50 55 60 Arg Arg Gly Leu Pro Gly Ala Gly Ala Leu Arg Ala Ala Leu Gln Arg 65 70 75 80 Gly Arg Ser Arg Asp Leu Ala Arg Arg Arg Leu Ile Ala Ser Val Ser 85 90 95 Leu Ala Gly Gly Ala Ser Met Ala Val Val Ser Leu Phe Gln Leu Gly 100 105 110 Ile Ile Glu Arg Leu Pro Asp Pro Pro Leu Pro Gly Phe Asp Ser Ala 115 120 125 Lys Val Thr Ser Ser Asp Ile 130 135 <210> 24 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: universal reverse primer <400> 24 ggaaacagct atgaccatg 19 <210> 25 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: universal forward primer <400> 25 gtaaaacgac ggccagt 17 <210> 26 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: PCR primer NH24 end "B" <400> 26 gtgactggcg cctggaatct gcatgagc 28 <210> 27 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: PCR primer NH2 end "A" <400> 27 agcgggagct tgctagacat tctgtttc 28 <210> 28 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: PCR primer NH2 end "B" <400> 28 gacgcgcctc gggcagcgcc ccaa 24 <210> 29 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: PCR primer pEPO15-NH6 end "B" <400> 29 caccgaagcg tcgatctggt ccatc 25 <210> 30 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: PCR primer pEPO15H2.7 end "A" <400> 30 cggtcagatc gacgacgggc tttcc 25

Claims (104)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
  79. 삭제
  80. 삭제
  81. 삭제
  82. 삭제
  83. 삭제
  84. 삭제
  85. 삭제
  86. 삭제
  87. 삭제
  88. 삭제
  89. 삭제
  90. 삭제
  91. 삭제
  92. 삭제
  93. 삭제
  94. (i) 서열 2의 아미노산 11-437, 서열 4의 아미노산 7-432, 서열 5의 아미노산 39-457, 서열 5의 아미노산 1524-1950, 서열 5의 아미노산 3024-3449, 서열 5의 아미노산 5103-5525, 서열 6의 아미노산 35-454, 서열 6의 아미노산 1522-1946 및 서열 7의 아미노산 32-450으로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 β-케토아실-합성효소 도메인;
    (ii) 서열 2의 아미노산 543-864, 서열 4의 아미노산 539-859, 서열 5의 아미노산 563-884, 서열 5의 아미노산 2056-2377, 서열 5의 아미노산 3555-3876, 서열 5의 아미노산 5631-5951, 서열 6의 아미노산 561-881, 서열 6의 아미노산 2053-2373 및 서열 7의 아미노산 556-877로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 아실전이효소 도메인;
    (iii) 서열 2의 아미노산 974-1273, 서열 5의 아미노산 4433-4719, 서열 5의 아미노산 6542-6837 및 서열 7의 아미노산 1478-1790으로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 에노일 환원효소 도메인;
    (iv) 서열 2의 아미노산 1314-1385, 서열 4의 아미노산 1722-1792, 서열 5의 아미노산 1434-1506, 서열 5의 아미노산 2932-3005, 서열 5의 아미노산 5010-5082, 서열 5의 아미노산 7140-7211, 서열 6의 아미노산 1430-1503, 서열 6의 아미노산 3673-3745 및 서열 7의 아미노산 2093-2164로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 아실 캐리어 단백질 도메인;
    (v) 서열 4의 아미노산 869-1037, 서열 5의 아미노산 3886-4048, 서열 5의 아미노산 5964-6132, 서열 6의 아미노산 2383-2551 및 서열 7의 아미노산 887-1051로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 탈수효소 도메인;
    (vi) 서열 4의 아미노산 1439-1684, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 6857-7101, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 3392-3636 및 서열 7의 아미노산 1810-2055로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 β-케토환원효소 도메인;
    (vii) 서열 6의 아미노산 2671-3045의 아미노산 서열을 갖는 메틸전이효소 도메인;
    (viii) 서열 7의 아미노산 2165-2439의 아미노산 서열을 갖는 티오에스테라제 도메인; 및
    (ix) 서열 3의 아미노산 서열을 갖는 비-리보솜 펩티드 합성효소
    로 이루어진 군에서 선택되는, 에포틸론 생합성에 관여하는 폴리펩티드 하나 이상을 코딩하는 단리된 핵산.
  95. 삭제
  96. 제94항에 있어서, 상기 뉴클레오티드 서열이 믹소박테리움 (myxobacterium)으로부터 단리된 것인 단리된 핵산 분자.
  97. 제96항에 있어서, 상기 믹소박테리움이 소란지움 셀룰로숨 (Sorangium cellulosum)인 단리된 핵산 분자.
  98. 제94항에 따른 핵산 분자에 작동 가능하게 연결된 이종 프로모터 서열을 포함하는 키메라 유전자.
  99. 제98항에 따른 키메라 유전자를 포함하는 재조합 벡터.
  100. 제98항에 따른 키메라 유전자를 포함하는 재조합 숙주 세포.
  101. 제94항에 따른 핵산 분자를 포함하는 Bac 클론.
  102. (i) 서열 2의 아미노산 11-437, 서열 4의 아미노산 7-432, 서열 5의 아미노산 39-457, 서열 5의 아미노산 1524-1950, 서열 5의 아미노산 3024-3449, 서열 5의 아미노산 5103-5525, 서열 6의 아미노산 35-454, 서열 6의 아미노산 1522-1946 및 서열 7의 아미노산 32-450으로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 β-케토아실-합성효소 도메인;
    (ii) 서열 2의 아미노산 543-864, 서열 4의 아미노산 539-859, 서열 5의 아미노산 563-884, 서열 5의 아미노산 2056-2377, 서열 5의 아미노산 3555-3876, 서열 5의 아미노산 5631-5951, 서열 6의 아미노산 561-881, 서열 6의 아미노산 2053-2373 및 서열 7의 아미노산 556-877로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 아실전이효소 도메인;
    (iii) 서열 2의 아미노산 974-1273, 서열 5의 아미노산 4433-4719, 서열 5의 아미노산 6542-6837 및 서열 7의 아미노산 1478-1790으로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 에노일 환원효소 도메인;
    (iv) 서열 2의 아미노산 1314-1385, 서열 4의 아미노산 1722-1792, 서열 5의 아미노산 1434-1506, 서열 5의 아미노산 2932-3005, 서열 5의 아미노산 5010-5082, 서열 5의 아미노산 7140-7211, 서열 6의 아미노산 1430-1503, 서열 6의 아미노산 3673-3745 및 서열 7의 아미노산 2093-2164로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 아실 캐리어 단백질 도메인;
    (v) 서열 4의 아미노산 869-1037, 서열 5의 아미노산 3886-4048, 서열 5의 아미노산 5964-6132, 서열 6의 아미노산 2383-2551 및 서열 7의 아미노산 887-1051로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 탈수효소 도메인;
    (vi) 서열 4의 아미노산 1439-1684, 서열 5의 아미노산 1147-1399, 서열 5의 아미노산 2645-2895, 서열 5의 아미노산 4729-4974, 서열 5의 아미노산 6857-7101, 서열 6의 아미노산 1143-1393, 서열 6의 아미노산 3392-3636 및 서열 7의 아미노산 1810-2055로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 β-케토환원효소 도메인;
    (vii) 서열 6의 아미노산 2671-3045의 아미노산 서열을 갖는 메틸전이효소 도메인;
    (viii) 서열 7의 아미노산 2165-2439의 아미노산 서열을 갖는 티오에스테라제 도메인; 또는
    (ix) 서열 3의 아미노산 서열을 갖는 비-리보솜 펩티드 합성효소
    를 갖는, 에포틸론 생합성에 관여하는 단리된 폴리펩티드.
  103. (a) 제98항에 따른 키메라 유전자를 숙주에 도입하는 단계, 및
    (b) 숙주에서의 에포틸론 생합성을 위하여 상기 숙주를 배양하는 단계
    를 포함하는, 재조합 숙주에서 에포틸론의 발현 방법.
  104. (a) 제103항의 방법에 의해 재조합 숙주에서 에포틸론을 발현하는 단계, 및
    (b) 상기 재조합 숙주로부터 에포틸론을 추출하는 단계
    를 포함하는 에포틸론의 제조 방법.
KR10-2000-7014348A 1998-06-18 1999-06-16 에포틸론 생합성 유전자 KR100511233B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US9950498A 1998-06-18 1998-06-18
US09/099,504 1998-06-18
US10163198P 1998-09-24 1998-09-24
US60/101,631 1998-09-24
US11890699P 1999-02-05 1999-02-05
US60/118,906 1999-02-05

Publications (2)

Publication Number Publication Date
KR20010052962A KR20010052962A (ko) 2001-06-25
KR100511233B1 true KR100511233B1 (ko) 2005-08-31

Family

ID=27378840

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-7014348A KR100511233B1 (ko) 1998-06-18 1999-06-16 에포틸론 생합성 유전자

Country Status (16)

Country Link
EP (1) EP1088078A2 (ko)
JP (3) JP2002518004A (ko)
KR (1) KR100511233B1 (ko)
CN (1) CN100374565C (ko)
AU (1) AU753567B2 (ko)
BR (1) BR9911349A (ko)
CA (1) CA2329774A1 (ko)
HU (1) HUP0102186A3 (ko)
ID (1) ID29128A (ko)
IL (3) IL139735A0 (ko)
NO (2) NO20006195L (ko)
NZ (1) NZ508326A (ko)
PL (1) PL200157B1 (ko)
SK (1) SK19242000A3 (ko)
TR (1) TR200003759T2 (ko)
WO (1) WO1999066028A2 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999001124A1 (en) 1996-12-03 1999-01-14 Sloan-Kettering Institute For Cancer Research Synthesis of epothilones, intermediates thereto, analogues and uses thereof
FR2775187B1 (fr) 1998-02-25 2003-02-21 Novartis Ag Utilisation de l'epothilone b pour la fabrication d'une preparation pharmaceutique antiproliferative et d'une composition comprenant l'epothilone b comme agent antiproliferatif in vivo
DE19846493A1 (de) * 1998-10-09 2000-04-13 Biotechnolog Forschung Gmbh DNA-Sequenzen für die enzymatische Synthese von Polyketid- oder Heteropolyketidverbindungen
JP4662635B2 (ja) 1998-11-20 2011-03-30 コーサン バイオサイエンシーズ, インコーポレイテッド エポチロンおよびエポチロン誘導体を生成するための組換え方法および材料
US6410301B1 (en) 1998-11-20 2002-06-25 Kosan Biosciences, Inc. Myxococcus host cells for the production of epothilones
WO2001053533A2 (en) * 2000-01-21 2001-07-26 Kosan Biosciences, Inc. Method for cloning polyketide synthase genes
US6998256B2 (en) 2000-04-28 2006-02-14 Kosan Biosciences, Inc. Methods of obtaining epothilone D using crystallization and /or by the culture of cells in the presence of methyl oleate
ATE309369T1 (de) * 2000-04-28 2005-11-15 Kosan Biosciences Inc Heterologe herstellung von polyketiden
IL155306A0 (en) 2000-10-13 2003-11-23 Univ Mississippi Methods for producing epothilone derivatives and analogs and epothilone derivatives and analogs produced thereby
US7257562B2 (en) 2000-10-13 2007-08-14 Thallion Pharmaceuticals Inc. High throughput method for discovery of gene clusters
SI1483251T1 (sl) 2002-03-12 2010-03-31 Bristol Myers Squibb Co C cian epotilonski derivati
US7767399B2 (en) * 2005-01-31 2010-08-03 Merck & Co., Inc. Purification process for plasmid DNA
DK2668284T3 (en) 2011-01-28 2014-12-15 Amyris Inc Screening of colony micro encapsulated in gel
MX2013013065A (es) 2011-05-13 2013-12-02 Amyris Inc Metodos y composiciones para detectar la produccion microbiana de compuestos inmiscibles em agua.
BR112015002724B1 (pt) 2012-08-07 2022-02-01 Total Marketing Services Método para produzir um composto não catabólico heterólogo, e, composição de fermentação
BR112015023089A2 (pt) 2013-03-15 2017-11-21 Amyris Inc célula hospedeira, método para produzir um isoprenoide, e método para aumentar a produção de acetil-coa ou um composto derivado de acetil-coa
CN105934517A (zh) 2013-08-07 2016-09-07 阿迈瑞斯公司 用于稳定生产乙酰辅酶a衍生化合物的方法
AU2016284689B9 (en) 2015-06-25 2022-01-20 Amyris, Inc. Maltose dependent degrons, maltose-responsive promoters, stabilization constructs, and their use in production of non-catabolic compounds
CN106916834B (zh) * 2015-12-24 2022-08-05 武汉合生科技有限公司 化合物的生物合成基因簇及其应用
CN111138444B (zh) * 2020-01-08 2022-05-03 山东大学 一组埃博霉素b葡萄糖苷类化合物及其酶法制备与应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU753546B2 (en) * 1996-11-18 2002-10-24 Helmholtz-Zentrum Fuer Infektionsforschung Gmbh Epothilone C, D, E and F, production process, and their use as cytostatic as well as phytosanitary agents

Also Published As

Publication number Publication date
IL139735A0 (en) 2002-02-10
HUP0102186A2 (hu) 2001-10-28
NZ508326A (en) 2003-10-31
NO20006195L (no) 2001-02-16
IL190391A0 (en) 2008-11-03
WO1999066028A3 (en) 2000-06-29
AU4611699A (en) 2000-01-05
CN100374565C (zh) 2008-03-12
WO1999066028A2 (en) 1999-12-23
CN1305530A (zh) 2001-07-25
TR200003759T2 (tr) 2001-06-21
PL345579A1 (en) 2001-12-17
NO20091055L (no) 2001-02-16
BR9911349A (pt) 2001-03-13
HUP0102186A3 (en) 2005-10-28
JP2008092958A (ja) 2008-04-24
JP2002518004A (ja) 2002-06-25
ID29128A (id) 2001-08-02
IL139735A (en) 2009-06-15
KR20010052962A (ko) 2001-06-25
CA2329774A1 (en) 1999-12-23
AU753567B2 (en) 2002-10-24
PL200157B1 (pl) 2008-12-31
JP2006061166A (ja) 2006-03-09
SK19242000A3 (sk) 2001-07-10
NO20006195D0 (no) 2000-12-06
EP1088078A2 (en) 2001-04-04

Similar Documents

Publication Publication Date Title
US6355458B1 (en) Genes for the biosynthesis of epothilones
KR100511233B1 (ko) 에포틸론 생합성 유전자
AU753546B2 (en) Epothilone C, D, E and F, production process, and their use as cytostatic as well as phytosanitary agents
US7172884B2 (en) Methods for the preparation, isolation and purification of epothilone B, and x-ray crystal structures of epothilone B
CN100374566C (zh) 用于epothilone生物合成的基因
MXPA00012342A (en) Genes for the biosynthesis of epothilones
CZ20004693A3 (cs) Izolovaná nukleová kyselina kódující polypeptid účastnící se biosyntézy epothilonu, chimérický gen, vektor a hostitelské buňky obsahující tuto nukleovou kyselinu
TWI770070B (zh) 經修飾之抗真菌鏈黴菌(streptomyces fungicidicus)分離株及其用途
KR20050050146A (ko) 글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질
RU2265054C2 (ru) Рекомбинантная клетка-хозяин (варианты) и клон вас
CN100359014C (zh) 一类新型埃坡霉素化合物及其制备方法和用途
RU2234532C2 (ru) Нуклеиновая кислота (варианты), ее использование для экспрессии эпотилонов, полипептид (варианты), клон бактерий е.coli
RU2773311C2 (ru) Модифицированные изоляты streptomyces fungicidicus и их применение

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110718

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20120802

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee